V4 不再延续此前"对话模型 + 推理模型"的分离设计,而是统一为两大版本,通过 Thinking Mode 按需切换推理能力。
| 维度 | V4-Pro | V4-Flash |
|---|---|---|
| 定位 | 旗舰,比肩顶级闭源模型 | 快速高效,经济型 |
| 上下文窗口 | 100 万 token | 100 万 token |
| 最大输出长度 | 384K token | 384K token |
| 思考模式 | 按需启用 | 按需启用 |
| 开源协议 | MIT | MIT |
两款模型均支持 JSON 输出、Tool Calls、对话前缀续写等 Agent 相关能力。
DeepSeek V4 创新性地引入了 DeepSeek Sparse Attention(DSA) 稀疏注意力机制,在 token 维度进行压缩,实现了两个关键突破:
V4-Pro 在 Agentic Coding 评测中达到开源最佳水平。根据官方信息:
| 测试项 | V4-Pro | 对比 |
|---|---|---|
| SWE-bench Verified | 83.7% | > Claude Opus 4.5 (80.9%), GPT-5.2 (80%) |
| Agentic Coding | 开源最佳 | 优于 Claude Sonnet 4.5 |
| 世界知识 | 接近 Gemini-Pro-3.1 | 远超其他开源模型 |
| 数学 / STEM | 比肩顶级闭源 | 超越所有开源模型 |
| Codeforces | 2767 | 显著领先 |
V4-Flash 在世界知识储备方面稍逊于 Pro 版,但展现出了接近的推理能力。对于日常开发和一般场景,Flash 版本在性能与成本之间取得了很好的平衡。
DeepSeek V4 沿袭了 DeepSeek 一贯的低价策略,采用按量计费:
| 版本 | 输入价格 | 输出价格 |
|---|---|---|
| V4-Flash | 极低(市场最低梯队) | 极低 |
| V4-Pro | $0.30 / 百万 token | $0.50 / 百万 token |
| 模型 | 输入 / 百万 token | 输出 / 百万 token |
|---|---|---|
| DeepSeek V4-Pro | $0.30 | $0.50 |
| GPT-5.4 | $2.50 | $12.50 |
| Claude Opus 4.6 | $5.00 | $25.00 |
| Claude Sonnet 4.5 | $3.00 | $15.00 |
| Gemini 2.5 Pro | $1.25 | $10.00 |
V4-Pro 的价格约为 GPT-5.4 的 1/8,为 Claude Opus 的 1/50。
DeepSeek V4 API 同时兼容两类主流协议(OpenAI 格式 + DeepSeek 原生格式),开发者可在现有工具链基础上较低成本迁移。
deepseek-v4-pro — 旗舰版deepseek-v4-flash — 快速版旧模型名称(deepseek-chat、deepseek-reasoner)将逐步弃用。
发布首日即完成了对国产 AI 算力芯片的适配:
这意味着 DeepSeek V4 不仅适配英伟达 GPU,更在华为昇腾、寒武纪等国产芯片上完成了工程化验证,"模型—芯片—云"闭环正在逐步跑通。
| 场景 | 推荐版本 | 说明 |
|---|---|---|
| 日常开发助手 | V4-Flash | 成本极低,推理能力接近 Pro |
| Agentic Coding | V4-Pro | 开源最强,适配主流框架 |
| 长文档处理 | V4-Pro | 100 万上下文,适合知识库、代码库分析 |
| 企业级部署 | 任意 | MIT 协议可自由商用 |
| 预算敏感项目 | V4-Flash | 市场最低价格梯队 |