DeepSeek V4技术报告发布:484天换代之路全公开

作者:袖梨 2026-05-10

DeepSeek V4技术报告发布:484天换代之路全公开。4月25日,量子位披露了这份详尽的技术报告,V4系列模型在迟到半年后终于亮相,却迅速引爆中外热搜,连OpenAI都成了陪衬。

百万token上下文全面开源,KV cache大幅缩减

报告显示,V4-Pro和V4-Flash分别拥有1.6万亿参数和2840亿参数,上下文长度均达到1M。在1M场景下,V4-Pro的单token FLOPs仅为V3.2的27%,KV cache更是压缩到10%。亚马逊硬件师GPD直言,这或许能解决当前的HBM短缺问题——这确实是个挺实在的突破。

国产芯片适配,华为算力已支持

DeepSeek在开源路线上走得相当坚定。报告明确提到,V4已经支持华为算力,预计下半年适配昇腾。在2026年还能坚持开源,这魄力确实让人佩服。凭什么说开源没前途?V4用行动给出了答案。

可以说,这次技术报告的信息量有点超载,但主线就两条:一是性能大幅提升,二是国产芯片适配。V4的创造力在有限条件下展现得淋漓尽致,好评如潮不是没道理的。

DeepSeek V4的换代之路走了484天,从V3.2到V4,每一步都公开透明。这种开源精神,在当下AI行业里算是难得一见了。咱们不妨看看,下半年昇腾适配后,国产算力生态会迎来怎样的变化。

相关文章

精彩推荐