В линейке V4 две модификации — DeepSeek-V4-Pro и DeepSeek-V4-Flash. Обе построены по архитектуре Mixture of Experts (MoE), что позволяет держать триллионы параметров в памяти, но активировать лишь малую их часть для каждого запроса, экономя вычислительные ресурсы и снижая задержки.