DeepSeek V4 预览版开源上线，1.6T参数MoE模型支持百万上下文

作者：袖梨 2026-05-08

DeepSeek 于 4 月 24 日发布 V4 预览版，包含 1.6T 参数的 Pro 版和 284B 参数的 Flash 版，两个变体均支持 1M 上下文，权重采用 Apache 2.0 协议开源，API 当天同步上线。V4-Pro 输出单价仅为 $3.48，只有 GPT-5.5（$30）的 1/8.6，Opus 4.7（$75）的 1/21。DeepSeek 挑了 OpenAI 发 GPT-5.5 的同一天发 V4，这操作确实挺有意思。

两个变体与核心参数DeepSeek V4 预览系列包含 deepseek-v4-pro（1.6T 总参 / 49B 激活）和 deepseek-v4-flash（284B 总参 / 13B 激活），都是 MoE 架构。1M 上下文两个版本统一，最大输出长度也保持一致。Pro 版更适合处理长文档、代码仓库和多步骤推理任务，Flash 版则在效率上做了优化。凭什么 GPT-5.5 要贵那么多？DeepSeek 用硬核算法给出了答案。

技术亮点与推理能力DeepSeek V4 通过强化学习赋能的推理引擎，实现了自主多步逻辑推导。混合注意力机制与高效推理设计，使得推理 FLOPs 消耗降低 27%，KV Cache 占用减少 10%。它彻底告别了“鹦鹉学舌”，在处理数学难题、编程复杂架构和管理决策时表现出极强的原创思维能力。没错，这算是打破了算力枷锁。

价格对比与性能表现V4-Pro 输出单价 $3.48，只有 GPT-5.5 的 1/8.6，Opus 4.7 的 1/21。在 Codeforces 平台，DeepSeek V4 拿到 3206 分，超过 GPT-5.4。这性能配上这价格，真的让人惊讶。ofox 正在第一时间接入，新用户还能免费领取 300 万 DeepSeek V4 Token。

开源与行业影响DeepSeek V4 预览版采用 Apache 2.0 协议开源，权重直接开放。这意味着开发者可以自由使用、修改和部署模型。1.6T 参数的 MoE 模型支持百万上下文，这在开源社区里算是挺大的突破。工业级代码生成与调试、顶尖级数学推理能力，这些特性让 DeepSeek V4 在复杂推理、长文本理解和工程执行上全面进阶。

DeepSeek V4 预览版开源上线，1.6T参数MoE模型支持百万上下文

相关文章

精彩推荐