DeepSeek发布V4系列模型 参数突破1.6万亿 逼近前沿大模型
•51 阅读•3分钟•前沿
生成式AIDeepSeekOpen SourceDeepSeek V4
Ram Iyer••51 阅读•3分钟•前沿

模型概览
DeepSeek在2026年4月24日公开了两款预览模型:V4 Flash 与 V4 Pro。两者均基于Mixture‑of‑Experts(MoE)技术,拥有
- 1 000 000 token 超长上下文窗口,适用于大规模代码库或长文档的一次性提示;
- V4 Flash:284 B 参数(激活13 B),定位轻量级高效推理;
- V4 Pro:1.6 T 参数(激活49 B),成为当前公开权重中规模最大的模型。
关键技术亮点
- MoE 架构:仅激活任务相关子网络,显著降低推理算力与成本;
- 参数规模:V4 Pro 的总参数量超越Moonshot AI的Kimi K 2.6(1.1 T)和MiniMax的M1(456 B),实现近两倍的规模优势;
- 纯文本输出:与多数闭源竞争对手不同,V4 系列仅支持文本生成,避免多模态安全风险。
性能与基准
DeepSeek称两款模型在推理基准上已“几乎关闭与领先模型的差距”。具体表现包括:
- 推理基准:V4‑Pro‑Max 在多数公开推理测试中优于开源同类模型,且在部分任务上超越OpenAI的GPT‑5.2 与 Google Gemini 3.0 Pro;
- 编码基准:在代码竞赛基准上,两款模型的表现“可比拟GPT‑5.4”,展示了强大的程序理解与生成能力;
- 知识测试:仍落后于OpenAI GPT‑5.4 与 Gemini 3.1 Pro,大约相当于3‑6个月的研发滞后。
价格与竞争
DeepSeek 将 V4 系列定位为高性价比选项:
- V4 Flash:输入每百万 token $0.14,输出 $0.28;
- V4 Pro:输入 $0.145,输出 $3.48(每百万 token)。
相较于GPT‑5.4 Nano、Gemini 3.1 Flash、Claude Haiku 4.5 等前沿模型,DeepSeek 的定价低约30%‑50%,有望在企业级部署和大规模推理场景中抢占市场。
行业影响
- 开源生态加速:V4 Pro 以开放权重发布,为国内外研究者提供了规模级别最高的中文/多语言大模型实验平台。
- 中美技术竞争:模型发布恰逢美国指控中国大规模窃取AI实验室知识产权的舆论高涨,DeepSeek 仍被Anthropic 与 OpenAI 指责存在“蒸馏”行为,行业监管与合规风险随之上升。
- 商业落地前景:凭借超长上下文和低成本优势,V4 系列在法律文档审阅、软件代码审计、长篇内容创作等 B2B 场景具备直接竞争力。
“我们希望通过更大的参数规模和更高的推理效率,让开源模型在性能上不再是‘小弟’,而是能够与商业闭源模型并驾齐驱。”——DeepSeek 官方声明
总体来看,DeepSeek 的 V4 系列在参数规模、推理效率和定价上形成了鲜明的竞争优势,标志着中国开源大模型正向国际前沿逼近,并可能在随后一年内引发新一轮的模型竞争与生态布局。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。