软通动力牵手头部大模型厂商:智算服务开启产业落地新篇

作者:袖梨 2026-07-01

近日,软通动力信息技术(集团)股份有限公司正式宣布,与国内头部大模型厂商在北京签署智算服务协议,双方将依托北京壹号词元工厂的核心能力,围绕大模型推理加速、高性能算力集群优化、行业AI应用落地等方向展开深度协同,共同推动智能体时代从模型研发到词元服务的完整产业闭环,为千行百业的AI规模化落地搭建起低门槛、高可靠的算力底座。

随着大模型产业从技术研发阶段全面转向商业化落地深水区,行业的核心痛点已经从“训练出高性能大模型”转向“让大模型以低成本、高稳定的方式服务海量企业用户”。对于头部大模型厂商而言,大规模商业化部署需要稳定、高效、可SLA保障的词元服务作为核心支撑,若自行搭建覆盖全场景的大规模推理集群,不仅要投入巨额的硬件采购成本,还要承担长期的集群运维、性能调优压力,很难集中全部资源聚焦在模型迭代与应用创新上。而软通动力此前点亮的北京壹号词元工厂,正是瞄准这一行业痛点打造的标杆性算力基础设施,也是国内首个面向智能体长时运行特征设计的专业词元生产基地。

根据本次签署的合作协议,软通动力将为合作的头部大模型厂商提供基于北京壹号词元工厂的全链路词元推理服务,覆盖大模型推理加速、高性能算力集群适配及行业AI应用落地等多个核心场景。在模型推理加速层面,大模型厂商可将其推理服务直接部署于北京壹号词元工厂,依托软通动力全栈观测体系和智能调度能力,获得标准化、可SLA保障的词元推理服务,工厂提供的弹性可扩展词元产能,能够轻松支撑其面向企业及开发者的规模化高并发推理需求,无需厂商自行投入资源扩容集群。在高性能算力集群优化层面,双方将从算子适配、分布式通信到调度策略进行端到端深度调优,协同提升芯片在真实推理负载下的运行效率,让硬件算力的潜力得到充分释放。

为了给大规模商业化部署保驾护航,软通动力还将根据大模型厂商的业务特性,提供差异化的SLA服务保障,通过全链路实时观测与持续动态优化,确保长链路推理、多轮交互等高复杂度场景下的服务稳定性。更关键的是,双方将围绕制造、金融、零售等重点行业客户的AI应用需求,联合输出定制化行业解决方案,把大模型的能力直接转化为可落地的产业价值。

值得关注的是,本次合作也是北京壹号词元工厂自6月正式点亮以来,首次承接头部大模型厂商的全量真实业务负载。此前软通动力已同步向全球开源了“词元工厂性能基准”评测框架LoadGen2.0,这是行业首次针对智能体长时运行特征建立统一的性能度量标准。头部大模型厂商带来的长链路推理、高并发调用等复杂真实场景,将成为对词元工厂调度能力、缓存管理能力和服务质量保障能力的实战检验,帮助工厂在高价值场景中进一步验证并完善词元服务体系。

此次软通动力与头部大模型厂商的强强联手,标志着国内智算服务产业正在从零散的算力租赁模式,升级为面向大模型全生命周期的专业化配套服务体系。双方的深度协同,将大幅降低大模型商业化落地的算力门槛,让更多行业客户能够以更低成本、更高效率获取和应用AI能力,为智能体时代的产业数字化转型注入源源不断的算力动力。

相关文章

精彩推荐