2月26日,X爆料账号@legit_api放出消息:DeepSeek V4正在做发布前的测试准备,其Lite版已经在推理服务商那里跑起来了。内部代号“sealion-lite”,签了严格的保密协议。这款Lite版拥有百万token上下文窗口,原生多模态,性能比现在DeepSeek网页和App上能用的模型好很多。
好很多是多少?评论区有人贴了V4 Lite版生成的SVG图。看完的人说了句大实话:“DeepSeek V4 full is going to cook very hard。”这可才是个Lite版啊!完整版得猛成什么样?而且注意,这里说的是“原生多模态”。之前所有关于V4的传闻都说它是个代码模型,多模态这个信息是第一次出现。如果是真的,V4的野心比大家想的要大得多。
V4完整版画像
根据目前各路信息拼出来的画像,V4大概长这样:代码优先的旗舰,稀疏MoE架构,总参数大约一万亿。听着吓人,但每个token实际只激活320亿左右的参数,所以推理成本可以压到极低。小参数模型搭配长上下文窗口,处理超长文本的推理成本确实可以压到极低。
这次泄露的Lite版代号“海狮”,具有100万Token的上下文窗口,支持多模态,比起APP端和网页端有显著优势。可以说,Lite版已经碾压现有模型,这让人对完整版充满期待。不过,咱们得注意,这只是内测泄露,正式发布可能还有一段时间。
其实,DeepSeek V4的这次泄露挺让人惊讶的。一个Lite版就能有如此表现,完整版岂不是要颠覆行业?但无论如何,这都证明了DeepSeek在AI模型上的实力。未来,咱们可以期待更多惊喜。
这次泄露也引发了网友的热议。有人猜测V4完整版可能会在近期发布,也有人担心保密协议是否被违反。但不管怎样,DeepSeek V4的Lite版已经展示了强大的性能,这无疑给AI行业带来了新的竞争压力。