便宜又大碗,一只“龙虾”给中国大模型带来泼天富贵?

搜狐焦点华北区 2026-03-06 15:08:31
用手机看
扫描到手机,新闻随时看

扫一扫,用手机看文章
更加方便分享给朋友

中国大模型Token调用量反超美国,开源模型持续霸榜,加速出海。

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

中国大模型在全球杀疯了!

近日,全球最大的第三方大模型聚合平台OpenRouter显示,中国大模型在2月的Token调用量首次反超美国,MiniMax、Kimi、DeepSeek等开源模型更是持续霸榜。

在输入和输出之间,模型智能持续涌现,谁能以更低成本、更高效率创造更多的Token吞吐,谁就有可能把握AI时代的生产力话语权。

当Token爆发增长,意味着模型有更多人在具体场景中实际使用。

中国大模型调用量的狂飙,一定程度受到名为OpenClaw的智能体引发的“赛博养虾”热推动,这也意味着国产模型正在凭借快速迭代和成本优势占领全球市场。

在AI应用范式向智能体迭代的趋势下,Token成为类似石油和电力的新型燃料,而中国大模型正在开启加速出海的新征程。

中国大模型调用量狂飙反超美国

进入今年2月尤其是春节以来,中国大模型Token调用量出现爆发式增长。

据OpenRouter,2月首周全球大模型调用量首次跨过10万亿Tokens门槛,第二周达到14万亿Tokens,其中中国模型调用量为4.12万亿Tokens,首次超过美国同期的2.94万亿Tokens。

到了第三周,该平台模型调用量略回落至13.6万亿Tokens,中国大模型调用量进一步冲到5.16万亿Tokens,三周内实现翻倍,占比冲高至近38%,而美国模型跌至2.7万亿Tokens。

更值得关注的是,中国大模型持续霸榜头部位置,且开源模型成为主力。

在2月前两周全球调用量Top5中,中国大模型均占据四席,包括MiniMax M2.5、Kimi K2.5、DeepSeek V3.2和智谱GLM 5,且M2.5、K2.5分列前两名,合计占比最高接近86%。

在2月第三周后,全球Top5依然还有三家国产模型,M2.5继续位居第一,DeepSeek V3.2和K2.5热度不减,另外两个模型则来自谷歌和Anthropic。

从截止3月5日所统计的2月整体数据来看,OpenRouter内的模型累计调用量已超45万亿Tokens,而中国大模型占比约30%。

其中M2.5以6.42万亿Tokens的调用量登顶第一,K2.5环比暴增十倍,DeepSeek V3.2实现近90%的增长,GLM5位于第八,阶跃星辰新开源模型Step3.5 Flash快速冲到第12名。

MiniMax创始人闫俊杰早前介绍,M2.5发布后,许多国际新客户主动接入,包括谷歌、微软、亚马逊等云厂商,以及多家AI公司。

月之暗面K2.5发布后也颇受欢迎,包括阿里、腾讯、字节的AI编程工具,以及Cursor等多家海外编程智能体公司均上线。

这使得这些模型得以加速面向广泛的用户群体,带来调用量的爆发。

闫俊杰透露,M2系列模型2月平均单日Token消耗量已增长至去年12月的6倍多,开放平台新注册用户则增长超4倍,公司2月ARR(年度经常性收入)已超1.5亿美元。

有报道称,自K2.5发布后,月之暗面在20多天的累计收入超过去年,付费用户实现4倍增长,月之暗面方面未对搜狐科技否认前述数据的真实性。

这使得早前侧重C端的月之暗面开始重视起API业务。搜狐科技注意到,近期该公司正在招聘API大模型销售等职位,并推出企业版会员计划,增强B端商业化。

这很大程度上成为月之暗面持续完成两轮12亿美元融资、估值快速突破百亿美元的底气,而MiniMax股价此前也持续暴涨。

需要指出的是,需要客观看待OpenRouter上的数据。一位AI从业者表示,OpenRouter平台的调用量在很多模型中的占比并不是很高,但比例确实在提升,仅能起到一定参考的作用。

“赛博养虾”热点燃国产模型需求

为何国产大模型会在2月迎来调用量的暴增?业内多数将原因指向了OpenClaw带来的智能体应用“养虾”热潮。

OpenClaw是去年11月由一名海外退休程序员发布的业余项目,是一个能让大模型获得本地操作系统权限的开源智能体框架,旨在让AI实现动手干活。

这款产品最初名为Clawdbot,因Anthropic投诉商标问题多次更名。但这并未影响这款产品的走红,并迅速成长为现象级的开源智能体平台。

目前 OpenClaw以超25万的GitHub星标数,超越开源操作系统Linux等成为这个全球最大代码托管平台上增长最快和最受欢迎的开源项目,显示出市场对智能体的高度关注。

由于 OpenClaw的Logo是只龙虾,“养虾”热因此席卷开来,并蔓延到国内。BAT等云厂商纷纷上线OpenClaw的一键部署服务,Kimi、MiniMax等也推出本土云端服务,并吸引不少开发者部署应用。

这点燃了大模型需求。相比对话式AI产品,OpenClaw等7x24h持续运行的智能体在任务分解编码时,会产生更多交互和思考,尤其复杂任务所需的Token消耗会提升10倍甚至更多。

在OpenRouter上,OpenClaw已成为平台内Token消耗最大的应用,而K2.5和M2.5先后在2月中上旬和下旬成为该应用调用量最高的模型。

但从该平台整个2月看,K2.5依然是OpenClaw调用量最多的模型,规模超1.2万亿Tokens,占比近30%,OpenClaw亦是M2.5和DeepSeek V3.2的第二大Token消耗应用。

一位开发者对搜狐科技表示,最近就在持续“养虾”,国产大模型好用且便宜,为此也充了不少钱。他感觉OpenClaw这样的应用已经摆脱了工具属性,有希望成为个人助理。

可以说,全网爆火的OpenClaw,再次验证了市场对能动手干活的智能体的热情,而这也给中国大模型带来了爆发的机会。

不过,前述从业者提到,有模型最初采取了免费或优惠策略,相当于自掏腰包补贴,短期推动了量的爆发。“但如果用起来真的不错,很多人还是愿意在优惠取消后掏钱去用。”

对于这波增长的可持续性,闫俊杰认为,这将是长期趋势的开端,而不是一次性红利,并认为随着编程、办公和多模态的进一步爆发,公司Token需求今年将有1-2个数量级的提升。

市场不少观点认为,去年是智能体元年,今年将迎来加速落地期。黄仁勋此前就表示,智能体已经迎来拐点,投资算力产生的大规模Token将带来收入增长。

全球AI话语权的新一轮争夺

OpenRouter的数据一定程度还表明,中国大模型正在日益受到全球开发者的主动拥抱。

该平台覆盖300多个模型,拥有超500万用户,且主要由海外开发者构成,美国用户占比高达47%,而中国开发者仅占6%。

中国大模型调用量的狂飙,表明其正在通过海外用户的认可加速出海,进一步印证了国内开源模型的影响力,也意味着全球AI话语权在技术层面之后的新一轮争夺。

从企业层面看,该平台一年前呈现出美国主导的双寡头格局,谷歌和Anthropic合计占据超过70%的市场份额,国内仅有DeepSeek和千问单列,合计占比约11%。

如今单列的中国大模型企业又多出MiniMax、月之暗面和智谱等,合计占比提升到三分之一左右,并打破美国的寡头垄断格局,谷歌和Anthropic的份额受到挤压已腰斩。

前述开发者认为,国内新推出的这些模型性能不差,但成本显著更低,对需要消耗更多Token的智能体应用来说,用起来比国外模型更划算。

无论是去年推出的DeepSeek V3.2,还是今年的新模型K2.5、M2.5,多数都是以满足智能体的需求而进行迭代,发布后也站上全球基准测试头部开源模型的位置。

如今这些模型在OpenClaw中成为调用量靠前的模型,进一步在实际场景得到了有力验证。

更重要的是,国内这些模型的API价格普遍比海外模型低,性价比优势突出。

据第三方大模型评测机构Artificial Analysis,在模型智能和价格综合评估的最具吸引力象限中,MiniMax、Kimi、DeepSeek、智谱、千问模型等纷纷上榜。

对Token消耗更大的智能体来说,成本显然是不容忽视的因素。有不少用海外模型的开发者就直言,“养虾”已经养不起了。

有部署OpenClaw的海外企业表示,K2.5可以完成多数的日常推理,少数复杂任务将会用Claude,每日成本仅有5到10美元,比全部用Claude至少低一半。

美国软件公司Notion联合创始人则表示,对于简单任务,M2.5的使用成本远低于其他闭源模型。早前该公司引入M2.5作为其首个内置开源模型,和GPT、Claude等闭源模型并列。

闫俊杰此前透露,MiniMax的算力效率和工程优化能力还在进一步提升,今年2月M2系列文本模型的推理算力成本较去年12月已经下降超过50%。

除了技术优化带来的模型成本优势,中国另一大优势则在于电力基础设施层面。

在实际应用中,Token推理主要可变成本就是电价,而中国拥有全球最大规模的电网和更便宜的电价。中国平均电价在0.5元左右,约为美国的一半,是欧洲国家的三分之一甚至更低。

这将为中国大模型实现低成本推理和Token出海打下基础。而马斯克则多次提到美国将会缺电,需要进行扩容。不少观点认为,电力将在未来的AI竞争中扮演越来越重要的因素。

现在不少中国大模型公司都将目光瞄向海外,并开始收获红利。

月之暗面在今年的海外收入占比超过国内,MiniMax去年海外收入占比提升到73%,最近陷入人事风波的千问则已成为全球开源模型领导者。

但这仅仅只是开始,而且挑战依然不小,多变的地缘形势,以及基础设施层面的算力不足和尚不完善AI生态仍亟待应对。智谱之前就出现了GLM-5发布后出现了用户算力消耗过快、扩容节奏滞后的运营困境,公司为此致歉并补偿退款。

随着全球AI进入到追求生产力爆发的阶段,中国大模型正迎来前所未有的机遇。在服装、家电、新能源车之后,Token或将成为AI时代的出海新贵。

声明:本文由入驻焦点开放平台的作者撰写,除焦点官方账号外,观点仅代表作者本人,不代表焦点立场。