DeepSeek улучшил ИИ-модель V3

Поделиться

deepseek

Китайский ИИ-стартап DeepSeek выпустил крупное обновление для своей языковой модели V3. DeepSeek-V3-0324 доступна на платформе Hugging Face.

Новая версия нейросети улучшена в областях рассуждений, программирования и письма. Она обходит предшественника и решения от конкурирующих компаний в ряде бенчмарков.

Сравнение DeepSeek-V3-0324 с другими ИИ-моделями в разных тестах. Данные: Hugging Face.

DeepSeek стала заметным игроком на рынке искусственного интеллекта в январе. Тогда компания выпустила ориентированную на рассуждения модель с открытым исходным кодом DeepSeek-R1, которая разработана на существенно меньший бюджет.

V3 с 671 млрд параметров появилась в декабре 2024 года.

https://forklog.com/exclusive/ai/deepseek-obrushil-rynok-pochemu-kitajskij-ii-okazalsya-v-30-raz-effektivnee-gpt-4

CEO китайского стартапа 01.AI Ли Кай-фу считает, что Китай сократил разрыв с США в развитии искусственного интеллекта до трех месяцев, поскольку компании вроде DeepSeek научились использовать чипы и применять алгоритмы более эффективно.

Страна уже стала лидером в области разработки ПО для инфраструктуры, добавил он.

«Раньше, я думаю, разрыв составлял от шести до девяти месяцев, и мы отставали во всем. А сейчас я думаю, что, возможно, на три месяца отстаем в некоторых основных технологиях, а в других специфических областях опережаем», — сказало Кай-фу.

Санкции США создавали краткосрочные проблемы, но также заставляли китайские компании внедрять инновации, подчеркнул эксперт.

Напомним, после резкого взлета популярности ИИ-моделей DeepSeek на компанию обратили внимание власти Китая. Сотрудники работают в новых, более жестких условиях.

Ранее OpenAI рекомендовала правительству США запретить решения китайского конкурента, поскольку проект «субсидируется государством» и «контролируется им».

Это интересно

Похожие новости