3月3日,DeepSeek V4 Lite版悄然更新,这款拥有2000亿参数的模型在性能上逼近美国顶级模型,引发行业关注。
这款Lite版内部代号“sealion-lite”,虽然参数规模仅为2000亿,但据测试者反馈,其表现比当前DeepSeek网页和App上能用的模型好很多。可以说,它在代码生成和多模态任务上展现了强劲实力。
更让人惊喜的是,Lite版首次支持原生多模态,并拥有百万token上下文窗口。这确实是个突破,因为此前所有关于V4的传闻都聚焦在代码模型上,多模态信息的出现意味着V4的野心比想象中更大。
有测试者贴出了Lite版生成的SVG图,质量之高令人感叹。评论区有人直言:“DeepSeek V4 full is going to cook very hard。”这还只是Lite版,完整版得猛成什么样!
从参数上看,完整版DeepSeek V4采用稀疏MoE架构,总参数约一万亿,但每个token只激活320亿参数,推理效率很高。Lite版作为先行者,已经让业界看到了V4系列的潜力。
可以说,DeepSeek V4 Lite版的更新,确实为中国AI模型在国际竞争中增添了重要砝码。性能逼近美国顶级模型,这可不是随便说说的。