DeepSeek发布V4系列模型参数突破1.6万亿逼近前沿大模型

2026/04/24 (周五)•51 阅读•3分钟•前沿

生成式AIDeepSeekOpen SourceDeepSeek V4

Ram Iyer•2026/04/24 (周五)•51 阅读•3分钟•前沿

DeepSeek发布V4系列模型参数突破1.6万亿逼近前沿大模型

模型概览

DeepSeek在2026年4月24日公开了两款预览模型：V4 Flash 与 V4 Pro。两者均基于Mixture‑of‑Experts（MoE）技术，拥有

1 000 000 token 超长上下文窗口，适用于大规模代码库或长文档的一次性提示；
V4 Flash：284 B 参数（激活13 B），定位轻量级高效推理；
V4 Pro：1.6 T 参数（激活49 B），成为当前公开权重中规模最大的模型。

关键技术亮点

MoE 架构：仅激活任务相关子网络，显著降低推理算力与成本；
参数规模：V4 Pro 的总参数量超越Moonshot AI的Kimi K 2.6（1.1 T）和MiniMax的M1（456 B），实现近两倍的规模优势；
纯文本输出：与多数闭源竞争对手不同，V4 系列仅支持文本生成，避免多模态安全风险。

性能与基准

DeepSeek称两款模型在推理基准上已“几乎关闭与领先模型的差距”。具体表现包括：

推理基准：V4‑Pro‑Max 在多数公开推理测试中优于开源同类模型，且在部分任务上超越OpenAI的GPT‑5.2 与 Google Gemini 3.0 Pro；
编码基准：在代码竞赛基准上，两款模型的表现“可比拟GPT‑5.4”，展示了强大的程序理解与生成能力；
知识测试：仍落后于OpenAI GPT‑5.4 与 Gemini 3.1 Pro，大约相当于3‑6个月的研发滞后。

价格与竞争

DeepSeek 将 V4 系列定位为高性价比选项：

V4 Flash：输入每百万 token $0.14，输出 $0.28；
V4 Pro：输入 $0.145，输出 $3.48（每百万 token）。

相较于GPT‑5.4 Nano、Gemini 3.1 Flash、Claude Haiku 4.5 等前沿模型，DeepSeek 的定价低约30%‑50%，有望在企业级部署和大规模推理场景中抢占市场。

行业影响

开源生态加速：V4 Pro 以开放权重发布，为国内外研究者提供了规模级别最高的中文/多语言大模型实验平台。
中美技术竞争：模型发布恰逢美国指控中国大规模窃取AI实验室知识产权的舆论高涨，DeepSeek 仍被Anthropic 与 OpenAI 指责存在“蒸馏”行为，行业监管与合规风险随之上升。
商业落地前景：凭借超长上下文和低成本优势，V4 系列在法律文档审阅、软件代码审计、长篇内容创作等 B2B 场景具备直接竞争力。

“我们希望通过更大的参数规模和更高的推理效率，让开源模型在性能上不再是‘小弟’，而是能够与商业闭源模型并驾齐驱。”——DeepSeek 官方声明

总体来看，DeepSeek 的 V4 系列在参数规模、推理效率和定价上形成了鲜明的竞争优势，标志着中国开源大模型正向国际前沿逼近，并可能在随后一年内引发新一轮的模型竞争与生态布局。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方，仅供参考使用。点击此处查看消息源。