DeepSeek V4: что изменилось на самом деле
DeepSeek V4 был представлен в конце апреля 2026 года и на данный момент находится в формате публичного превью. Это не финальный релиз: часть заявленных функций ещё в разработке, а текущая версия в веб-интерфейсе работает с ограничениями.
Выход оказался негромким: компания не проводила масштабных презентаций, а просто открыла доступ к новым моделям через прежний интерфейс, сохранив узнаваемый минималистичный стиль и оставив без изменений существующие кнопки режимов.

Архитектура и две модели
В линейке V4 две модификации — DeepSeek-V4-Pro и DeepSeek-V4-Flash. Обе построены по архитектуре Mixture of Experts (MoE), что позволяет держать триллионы параметров в памяти, но активировать лишь малую их часть для каждого запроса, экономя вычислительные ресурсы и снижая задержки.
Pro-версия содержит около 1.6 триллиона параметров, из которых на один токен активируется примерно 49 миллиардов. Flash-версия компактнее — 284 миллиарда параметров, около 13 миллиардов активных за раз. На практике это означает, что Pro — инструмент для тяжелых многошаговых задач, тогда как Flash даёт быстрый отклик в повседневной работе.
Контекстное окно у обеих моделей — до 1 миллиона токенов, что эквивалентно примерно 750 тысячам слов или объёму трёхтомного романа. Максимальная длина одного ответа заявлена до 384 тысяч токенов, однако в веб-интерфейсе на практике ответы короче.

Интерфейс: кнопки старые, модели новые
Разработчики приняли решение не менять интерфейс. В чате пользователь видит те же три кнопки-режима, что и раньше: «Быстрый», «Эксперт» и переключатель Deep Think. Однако смысл этих кнопок полностью обновился:
- «Быстрый» — это DeepSeek-V4-Flash. Предназначен для быстрых ответов, простых запросов, диалогов, черновиков, повседневного использования.
- «Эксперт» — DeepSeek-V4-Pro. Максимальная производительность для сложного кода, математики, логического анализа, агентных сценариев. Может думать дольше, но выдаёт более проработанный результат.
- Deep Think — не отдельная модель, а режим углублённого рассуждения, который применяется поверх активной модели. В этом режиме модель тратит больше токенов на обдумывание, имитируя цепочку внутренних рассуждений.
Переключение между режимами бесшовное, без необходимости вручную выбирать модель из выпадающего списка. Цена использования для конечного пользователя — ноль: веб-чат остаётся бесплатным и безлимитным. API для разработчиков платный, но тарифы значительно ниже, чем у сопоставимых западных аналогов.

На чём сделан упор и в чём реальный прирост
Главные направления, по которым V4 дала ощутимый прирост:
- Кодинг и программная инженерия. Модель решает задачи уровня соревновательного программирования, справляется с многофайловым рефакторингом, генерацией кода по спецификации и отладкой. Особо компания выделяет «агентность» — способность модели работать с внешними инструментами, вызывать API, использовать функции и выполнять последовательности действий по инструкции. Из-за высокой температуры, всегда предлагает интересные дизайны сайтов с хорошей проработкой.
- Математика и формальная логика. В тестах V4-Pro показывает результаты, сопоставимые с лучшими закрытыми моделями — GPT-5 и Claude 4. Модель справляется с олимпиадной математикой, доказательствами теорем, анализом сложных числовых данных, не полагаясь на внешние инструменты вроде калькулятора или интерпретатора кода.
- Работа с длинными документами. Благодаря контекстному окну на миллион токенов V4 способна удерживать в памяти целые книги, базы знаний, техническую документацию или стенограммы многочасовых совещаний. В тестах «игла в стоге сена», где нужно найти и процитировать фрагмент текста из огромного объёма, модель практически не допускает ошибок.
- Креативное письмо и стилизация. По сравнению с V3 и R1 заметно улучшено качество литературного текста, стилизации под авторов и жанры, меньше штампов и канцелярита. При этом модель по-прежнему остаётся «думающей» — её не затачивали под бездумную болтовню, что заметно по более сдержанному и структурированному тону. Как и предыдущие модели обладает излишним красноречием. В промте обязательно нужно прописывать, иначе завалит глупыми эпитетами.
Мультимодальность: где она и когда ждать
Это самый болезненный вопрос и источник путаницы с момента анонса.
В обучающих данных модели действительно присутствовали мультимодальные корпуса. В отдельной версии репозитория был обнаружен бэкенд ViT (Vision Transformer) с тремя размерами кодеков, а также конвейер для обучения видео-модели. Это означает, что компания располагает обученной мультимодальной архитектурой.
Однако в публичном веб-чате, доступном конечному пользователю прямо сейчас, мультимодальный ввод не работает. Ни одна из моделей — ни Pro, ни Flash — не принимает изображения, аудио или видео. Загрузка файлов доступна, но модель прочитает из них только текст.
В своих публикациях команда DeepSeek признаёт: «Модели V4 пока не имеют возможности мультимодального ввода, мы активно работаем над этим». Ориентировочный срок — вторая половина 2026 года. По другим источникам, речь идёт о ближайших месяцах, но точных дат нет.
Почему так произошло? Вероятно, компания решила сначала тщательно отладить текстовые возможности, агентное поведение и масштабирование архитектуры MoE, а мультимодальность оставить на доработку. Не исключено также, что повлияли регуляторные или вычислительные ограничения — мультимодальный вывод значительно дороже и требовательнее к инфраструктуре.

Что в итоге
DeepSeek V4 — это серьёзный шаг вперёд для компании и для открытых моделей в целом. Текстовые возможности вышли на уровень лучших мировых систем, контекстное окно в миллион токенов работает стабильно, кодинг и логика показывают результаты, ранее доступные только в платных продуктах конкурентов.
Но мультимодальность на данный момент отсутствует полностью. И это ключевая оговорка, которую стоит держать в уме, особенно если вы подбираете инструмент для задач, связанных с анализом изображений или видео.
DeepSeek V4 — мощный, быстрый, бесплатный текстовый интеллект. А мультимодальный — в дорожной карте, но не сегодня.