DeepSeek выпустила экспериментальную модель V3.2-Exp для работы с большими текстами

Опубликовано в 29.09.2025 автор: dmitriy.vasyura

DeepSeek выпустила экспериментальную модель V3.2-Exp для работы с большими текстами — Иллюстративное фото: Depositphotos

Китайская компания DeepSeek объявила о выпуске экспериментальной модели V3.2-Exp. Она стала промежуточным этапом в разработке следующей архитектуры компании и основана на предыдущей версии V3.1-Terminus. Об этом компания сообщила на сайте.

Главным обновлением в модели стал механизм Sparse Attention (DSA). Он позволяет повысить эффективность обучения и вычислений при работе с длинными текстовыми последовательностями, сохраняя при этом качество результатов на уровне предыдущей версии V3.1-Terminus.

Чтобы оценить новый подход, модель протестировали на ряде открытых задач для проверки качества ИИ-систем – так называемых бенчмарках. По результатам этих проверок V3.2-Exp работает наравне с V3.1-Terminus, но более эффективно обрабатывает тексты с длинным контекстом.

Напоминаем, что чат-боты могут помочь интернет-мошенникам обманывать пожилых людей. А недавно хакеры нашли способ обмануть Gemini и украсть данные пользователей.

Связанные записи

Технологии

Экстремальный электросамокат Bo Turbo готовится установить мировой рекорд скорости

dmitriy.vasyura
07.08.2025
0

Британская компания Bo, основанная бывшим инженером команды Williams Formula 1, последние два года успешно продает свой флагманский продукт — ультрастильный алюминиевый электросамокат Model-M. Это транспортное […]

Технологии

Таинственный меценат строит подводный город-утопию

dmitriy.vasyura
07.02.2025
0

В заброшенном известняковом карьере в британском Чепстоу, в устье реки Северн, завершается строительство учебного центра под названием Deep для будущих обитателей подводного жилого комплекса. Затраты […]

Технологии

Английские инженеры обучат роботов редкому шестому чувству

dmitriy.vasyura
19.11.2025
0

Исследователи из Лондонского университета королевы Марии и Университетского колледжа Лондона разрабатывают междисциплинарную базу для оснащения роботов аналогом чувств людей. Эта работа на стыке физиологии, психологии, […]