DeepSeek V4 预览版开源上线,1.6T参数MoE模型支持百万上下文

作者:袖梨 2026-05-08

DeepSeek 于 4 月 24 日发布 V4 预览版,包含 1.6T 参数的 Pro 版和 284B 参数的 Flash 版,两个变体均支持 1M 上下文,权重采用 Apache 2.0 协议开源,API 当天同步上线。V4-Pro 输出单价仅为 $3.48,只有 GPT-5.5($30)的 1/8.6,Opus 4.7($75)的 1/21。DeepSeek 挑了 OpenAI 发 GPT-5.5 的同一天发 V4,这操作确实挺有意思。

两个变体与核心参数DeepSeek V4 预览系列包含 deepseek-v4-pro(1.6T 总参 / 49B 激活)和 deepseek-v4-flash(284B 总参 / 13B 激活),都是 MoE 架构。1M 上下文两个版本统一,最大输出长度也保持一致。Pro 版更适合处理长文档、代码仓库和多步骤推理任务,Flash 版则在效率上做了优化。凭什么 GPT-5.5 要贵那么多?DeepSeek 用硬核算法给出了答案。

技术亮点与推理能力DeepSeek V4 通过强化学习赋能的推理引擎,实现了自主多步逻辑推导。混合注意力机制与高效推理设计,使得推理 FLOPs 消耗降低 27%,KV Cache 占用减少 10%。它彻底告别了“鹦鹉学舌”,在处理数学难题、编程复杂架构和管理决策时表现出极强的原创思维能力。没错,这算是打破了算力枷锁。

价格对比与性能表现V4-Pro 输出单价 $3.48,只有 GPT-5.5 的 1/8.6,Opus 4.7 的 1/21。在 Codeforces 平台,DeepSeek V4 拿到 3206 分,超过 GPT-5.4。这性能配上这价格,真的让人惊讶。ofox 正在第一时间接入,新用户还能免费领取 300 万 DeepSeek V4 Token。

开源与行业影响DeepSeek V4 预览版采用 Apache 2.0 协议开源,权重直接开放。这意味着开发者可以自由使用、修改和部署模型。1.6T 参数的 MoE 模型支持百万上下文,这在开源社区里算是挺大的突破。工业级代码生成与调试、顶尖级数学推理能力,这些特性让 DeepSeek V4 在复杂推理、长文本理解和工程执行上全面进阶。

相关文章

精彩推荐