沙利文：Token不只是算力，AI定价逻辑正在升级

2月，中国AI的模型调用量爆发式增长，首次超过美国。中国模型厂商，正凭借快速迭代和成本优势占领全球市场，国产算力需求正经历指数级增长。中国大模型的Token调用成本普遍比国外低，背后的原因是什么？电力成本的下降或技术成本更低是否使得中国大模型能有更强的市场竞争力？AI Token未来的赚钱模式会是什么样的？AI Token收费模式和传统SaaS收费模式的最大不同在哪里？随着技术的进步，AI服务的定价是否会逐步走向高度定制化和灵活化？

弗若斯特沙利文（Frost & Sullivan, 以下简称“沙利文”）中国总监李庆接受每日经济新闻采访，共同探讨中国大模型Token成本优势的技术根源与商业化演进路径。

Q：中国大模型的Token调用成本普遍比国外低，背后的原因是什么？

中国头部模型DeepSeek、通义千问3.5-Plus广泛采用了“稀疏混合专家（MoE）”架构。这种设计虽然总参数量巨大但在实际推理时仅激活少量参数。这直接让显存占用降低60%，推理吞吐量提升19倍，从源头上减少了算力浪费。同时以阿里“通义-云-芯”体系为例，算法、基础设施和芯片深度协同。这种垂直整合解决了模型与硬件适配的痛点，通过极致的算力调度最大化资源利用率，大幅降低了底层算力成本。

Q：电力成本的下降或技术成本更低是否使得中国大模型能有更强的市场竞争力？

成本优势正在转化为绝对的市场竞争力，但这不仅仅是电力成本的问题。Token的成本核心确实是算力（GPU折旧）和电力（数据中心运营）。虽然中国在电力成本上具有一定优势，但更大的优势来自于技术效率和国产算力适配。

Q：AI Token未来的赚钱模式会是什么样的？

SaaS卖的是“工具的使用权”，而AI Token卖的是“解决问题的燃料”。核心差别就是直接卖的是可应用的结果或者服务，还是卖底层的算力资源。

Q：随着技术的进步，AI服务的定价是否会逐步走向高度定制化和灵活化？

这是必然趋势。Agent时代的到来，单一的定价模式将无法覆盖复杂的商业需求，定价将向多维动态定价演进，计算消耗、调用频次、任务复杂度例如是否涉及多步推理、规划、反思等高成本操作都会影响定价模式。

*本采访已刊登于每日经济新闻，记者为宋欣悦，原标题为：2月井喷！中国AI调用量首超美国，四款大模型霸榜全球前五，国产算力需求正经历指数级增长

沙利文：Token不只是算力，AI定价逻辑正在升级

联系我们