商汤日日新场景适配范围:从对话交互到多模态生成

作者:袖梨 2026-06-17

场景适配范围:从对话交互到多模态生成

商汤日日新大模型平台的场景适配范围覆盖从对话交互到多模态生成的完整链路。基于原生多模态架构,平台同时支持实时对话、文档解析、图片理解、表格识别以及PPT生成、文生图、拟人对话等任务。核心能力来自SenseNova U1系列,该系列采用NEO-unify架构,将理解与生成统一于单一模型,为多场景落地提供了统一底座。

核心模型体系与能力

日日新围绕多模态融合构建了模型矩阵。SenseNova U1作为原生理解生成统一模型,具备语言与视觉协同能力,可处理复杂推理与空间智能任务。同时,V6.5系列提供了实时交互融合模型、文生图模型和拟人对话模型,覆盖实时语音、图像生成与角色扮演场景。轻量级模型SenseNova 6.5 Flash-Lite则针对日常任务与智能体应用,兼顾性能与成本。

对话交互与智能体场景

在对话交互方面,平台提供“商量”网页版和移动端应用,支持自然语言完成信息查询与任务规划。办公场景下,“小浣熊”依托日日新大模型与Cowork-Skill,高效完成数据分析、PPT生成、信息图制作等任务,提供个性化的AI原生办公体验。这些应用基于同一模型底座,交互保持一致与连贯。

多模态生成与创作场景

多模态生成是日日新平台的重要延展方向。通过“秒画”等工具,用户可基于文本描述生成图片。SenseNova V6.5 Miaohua文生图模型进一步提升了生成质量。SekoSeko多模态短片创作Agent支持视频内容的自动生成与编排,为创意内容生产提供了高效工具。这些能力共同拓展了从文本到视觉的生成边界。

开源生态与零成本接入

日日新通过开源与免费Token计划降低了开发者使用门槛。SenseNova U1 Lite系列已全面开源,包含8B-MoT等规格,供社区研究。平台同时推出公测期完全免费的Token计划,覆盖文档解析、图片理解、表格识别,并支持PPT生成、深度研究等Skills生态原生调用。个人开发者和初创团队可以零成本接入多模态能力。

行业场景与未来延伸

从智慧办公到AI教育辅助,从社交娱乐到金融智控,日日新的多模态能力正在被应用于多种实际场景。其原生架构使得同一模型可以同时完成感知、理解、推理与生成,减少了传统拼接式模型带来的效率损失。随着平台持续迭代,场景适配范围有望进一步向机器人具身智能等领域延伸,实现从环境感知到任务执行的闭环。

相关文章

精彩推荐