华为云Token大战中另辟蹊径:重健康度轻总量
6月5日,2026华为云INSPIRE创想者大会在上海开幕,华为云CEO周跃峰给出了不同于其他云厂商的答案:华为云并不在意Token总量的多少,也不看重收入规模,而是关注国产算力系统生成Token的“健康度”——这些Token是否真正提升了企业生产力,而非仅仅提供情绪价值。这一表态意味着华为云选择跳出持续两年的价格战,转而从应用质量角度切入AI算力竞争。

过去两年,中国云厂商围绕Token打了一场旷日持久的价格战:2024年5月,DeepSeek V2打响降价第一枪,火山引擎豆包以0.0008元/千Token的定价点燃战火,此后阿里、百度、腾讯、讯飞相继入场。这套打法以低价模型引流,再带动背后的公有云销售,代价是推理算力的毛利率一度被压到为负值。直到DeepSeek R1打开推理时代新范式后,Coding(编程)和视频模型才再次激起真正的Token需求增长。
周跃峰在发布会上举了一个例子:一个人闲来无事在手机上问AI一个问题,也会生成Token,但这种Token的价值很难衡量。在他看来,衡量一朵云做得好不好,不该强调它跑出了多少万亿Token,而应看这些Token替企业提升了多少效率。这一理念直接绕开了以总量论英雄的竞争逻辑,转而关注Token的实际生产力转化。
在这次大会上,华为云没有推出降价牌,而是发布了一个名为“Agentic Infra”的新范式,这套基础设施明确瞄准国产算力场景。所谓Agentic Infra,可以理解为一套面向AI Agent(智能体)运行的底层架构,它不比拼谁生成的Token更多,而是确保每一个Token在算力受限的国产芯片上都能高效完成具体任务——比如辅助工程师写代码、帮助设计师生成可编辑的工程文件。
在国内算力芯片仍在追赶国际水平的阶段,这种“重健康度轻总量”的策略有其实用考量。与其用低价Token大量消耗不算富裕的算力资源,不如聚焦于Token对业务的实际贡献。华为云希望通过这一路径,让企业对AI的投入从一开始就绑定真实的生产环节,而非仅仅为聊天式的Token付费。
从整个行业看,华为云的转向也反映了AI云服务的竞争正从流量思维转入效果思维。当模型能力逐渐趋同,Token的单价已经压到几乎零利润,能够区分云厂商的就不再是谁家更便宜,而是谁家的Token能真正帮客户省下更多人力、缩短研发周期、减少试错成本。这或许是价格战之外的一条更可持续的路。