DeepSeek V4内测泄露，Lite版性能已碾压现有模型

作者：袖梨 2026-05-09

2月26日，X爆料账号@legit_api放出消息：DeepSeek V4正在做发布前的测试准备，其Lite版已经在推理服务商那里跑起来了。内部代号“sealion-lite”，签了严格的保密协议。这款Lite版拥有百万token上下文窗口，原生多模态，性能比现在DeepSeek网页和App上能用的模型好很多。

好很多是多少？评论区有人贴了V4 Lite版生成的SVG图。看完的人说了句大实话：“DeepSeek V4 full is going to cook very hard。”这可才是个Lite版啊！完整版得猛成什么样？而且注意，这里说的是“原生多模态”。之前所有关于V4的传闻都说它是个代码模型，多模态这个信息是第一次出现。如果是真的，V4的野心比大家想的要大得多。

V4完整版画像

根据目前各路信息拼出来的画像，V4大概长这样：代码优先的旗舰，稀疏MoE架构，总参数大约一万亿。听着吓人，但每个token实际只激活320亿左右的参数，所以推理成本可以压到极低。小参数模型搭配长上下文窗口，处理超长文本的推理成本确实可以压到极低。

这次泄露的Lite版代号“海狮”，具有100万Token的上下文窗口，支持多模态，比起APP端和网页端有显著优势。可以说，Lite版已经碾压现有模型，这让人对完整版充满期待。不过，咱们得注意，这只是内测泄露，正式发布可能还有一段时间。

其实，DeepSeek V4的这次泄露挺让人惊讶的。一个Lite版就能有如此表现，完整版岂不是要颠覆行业？但无论如何，这都证明了DeepSeek在AI模型上的实力。未来，咱们可以期待更多惊喜。

这次泄露也引发了网友的热议。有人猜测V4完整版可能会在近期发布，也有人担心保密协议是否被违反。但不管怎样，DeepSeek V4的Lite版已经展示了强大的性能，这无疑给AI行业带来了新的竞争压力。

DeepSeek V4内测泄露，Lite版性能已碾压现有模型

相关文章

精彩推荐