来源|多知
近日,Anthropic宣布,Claude Pro和Max订阅用户不得再将订阅额度用于OpenClaw等第三方Agent框架,如要继续使用需切换到按用量付费的API。这一举措在开发者社区引发巨大反响。
就在几天前,雷军宣布Xiaomi MiMo大模型调用量突破1万亿Token。与此同时,小米正式发布MiMo Token计划,推出统一的Credit点数计费体系。该体系依据模型实际调用的Token数量,按固定比例直接折算为Credit消耗量,显著简化开发者在模型使用过程中的费用核算与管理流程。
小米MiMo大模型负责人罗福莉(Fuli Luo)近日发文,结合MiMo刚刚推出的Token计划,对这一事件作出深度解读。
罗福莉开门见山:“Anthropic切断了第三方harness使用Claude订阅的通道——并不意外。”在她看来,这是对计算资源分配和Agent Harness开发的一次严肃尝试。
她指出,Claude Code的订阅制是一套“设计精良的算力均衡分配系统”,但大概率不赚钱,甚至可能在亏钱。问题的根源在于第三方框架的调用方式——以OpenClaw为例,其上下文管理存在明显缺陷:单个用户请求会触发多轮低价值工具调用,每次都作为独立API请求发出,每次携带的上下文窗口往往超过10万token。
罗福莉估算,这类框架每个查询实际产生的请求数,是Claude Code原生框架的数倍。换算成API定价,真实成本可能是订阅价格的几十倍。她将这一差距称为“不是缺口,而是天坑”。
01 告别算力浪费,转化为“工程素养”
罗福莉提到, 诸如OpenClaw 这样的工具的上下文管理很糟糕,导致算力浪费。
她说:“我近距离看过 OpenClaw 的上下文管理——确实糟糕。在单次用户请求中,它会以独立 API 请求的形式发出多轮低价值工具调用,每个请求都携带很长的上下文窗口(通常超过 10 万 token)——即使有缓存命中也很浪费,极端情况下还会拉高其他请求的缓存未命中率。实际每个查询的请求数比 Claude Code 自身框架高出数倍。”
她还进一步说:“许多第三方工具在接近上下文限制时,每 3 步就会压缩一次工具响应,导致缓存命中率非常低。”
这解释了Anthropic为何要“切掉”第三方Harness用订阅模式。如果用户花20美元订阅,却通过OpenClaw产生了200美元的API成本,Anthropic就在贴钱。这不是“漏洞”,而是套利。Anthropic堵上它,是必然的商业止损行为。
对于订阅用户被切断后可能面临的成本骤升,罗福莉认为这是必要的阵痛:“OpenClaw、OpenCode这类第三方框架仍然可以通过API调用Claude,只是不能再搭订阅的便车了。短期内,这些Agent用户会很痛——成本轻松跳涨几十倍。但这种压力,恰恰是推动这些框架认真改进context管理、最大化prompt缓存命中率以复用已处理的上下文、削减无效token消耗的动力。痛苦终将转化为工程素养。"
有网友同意该观点,认为:“我们正走向一个人工智能单位经济效益不再由模型本身决定,而是由模型、应用和上下文管理三者共同决定的世界。Anthropic 的举措无意中对智能体应用施加了自然选择压力。”
02 警告:别盲目打价格战
罗福莉在发文中向大模型厂商发出明确警告:
“我想劝大模型厂商们,在没想清楚如何给coding订阅定价、不至于大出血之前,不要盲目卷到价格底部。 把token卖得极便宜、同时对第三方框架敞开大门,表面上对用户友好,实则是个陷阱——Anthropic刚刚从这个陷阱里爬出来。”
她进一步指出,若用户在低质量框架、不稳定推理服务和降级模型上消耗大量精力后仍无所获,对用户体验和留存都将造成实质损害。
可以说,Claude Code的订阅制是一个精心设计的“平衡计算分配系统”。它可能不赚钱,但堵住了第三方Harness造成的巨大亏损。因此,罗福莉认为,大模型公司不应盲目价格战,不能一边卖便宜Token,一边敞开大门让低效Harness来烧钱。
言外之意是,如陷入价格战,长此以往,整个行业就无法建立可持续的商业模式。
03 MiMo Token计划:追求长期稳定
在解读Anthropic举措的同时,罗福莉也阐明了小米 MiMo Token计划的设计逻辑。
她提到,该计划支持第三方调用框架,采用按token配额计费的方式,逻辑上与Claude新近推出的超额用量包一致。
据了解,小米提供的四档套餐从39元/月到659元/月不等,支持MiMo-V2-Pro、MiMo-V2-Omni等模型,兼容OpenClaude、OpenCode、Claude Code等主流开发工具链。
罗福莉强调:“因为我们追求的是长期稳定地交付高质量的模型和服务——不是让你冲动付款,然后弃船而去。”
这一表述折射出一种与订阅制度不同的算力分配哲学:通过真实的用量成本约束用户和框架的行为。
04 MiMo大模型调用量突破1万亿Token
罗福莉的发文还有一个重要的背景。
就在几天前,雷军宣布MiMo大模型调用量突破1万亿Token。在全球最大API聚合平台OpenRouter上,MiMo-V2-Pro的API调用量一度登顶,超越Claude、阿里千问、谷歌Gemini等一众主流模型。
这一数据印证了罗福莉的判断:全球算力供给已无法跟上Agent产生的Token需求增速。在她看来,出路不在于进一步压低Token价格,而在于“更高Token效率的Agent框架”与“更强大、更高效的模型”之间的协同进化。
罗福莉在文章结尾预判:“Agent时代不属于烧算力最多的人,而属于用得最聪明的人。 Anthropic的这次举措,无论是否出于主动设计,都在将整个生态系统——无论开源还是闭源——推向这一方向。”
从批评OpenClaw的低效调用,到警告行业价格战陷阱,再到推出MiMo Token计划,罗福莉和小米MiMo团队正在试图为Agent时代的算力使用建立一种更可持续的模式。
相关阅读:
END