小米罗福莉谈Claude限制“龙虾”：不意外，算力效率革命来了

2026-04-07 18:43:23发布来源：多知作者：Penny

　　来源|多知

　　近日，Anthropic宣布，Claude Pro和Max订阅用户不得再将订阅额度用于OpenClaw等第三方Agent框架，如要继续使用需切换到按用量付费的API。这一举措在开发者社区引发巨大反响。

　　就在几天前，雷军宣布Xiaomi MiMo大模型调用量突破1万亿Token。与此同时，小米正式发布MiMo Token计划，推出统一的Credit点数计费体系。该体系依据模型实际调用的Token数量，按固定比例直接折算为Credit消耗量，显著简化开发者在模型使用过程中的费用核算与管理流程。

　　小米MiMo大模型负责人罗福莉(Fuli Luo)近日发文，结合MiMo刚刚推出的Token计划，对这一事件作出深度解读。

　　罗福莉开门见山：“Anthropic切断了第三方harness使用Claude订阅的通道——并不意外。”在她看来，这是对计算资源分配和Agent Harness开发的一次严肃尝试。

　　她指出，Claude Code的订阅制是一套“设计精良的算力均衡分配系统”，但大概率不赚钱，甚至可能在亏钱。问题的根源在于第三方框架的调用方式——以OpenClaw为例，其上下文管理存在明显缺陷：单个用户请求会触发多轮低价值工具调用，每次都作为独立API请求发出，每次携带的上下文窗口往往超过10万token。

　　罗福莉估算，这类框架每个查询实际产生的请求数，是Claude Code原生框架的数倍。换算成API定价，真实成本可能是订阅价格的几十倍。她将这一差距称为“不是缺口，而是天坑”。

　　01 告别算力浪费，转化为“工程素养”

　　罗福莉提到，诸如OpenClaw 这样的工具的上下文管理很糟糕，导致算力浪费。

　　她说：“我近距离看过 OpenClaw 的上下文管理——确实糟糕。在单次用户请求中，它会以独立 API 请求的形式发出多轮低价值工具调用，每个请求都携带很长的上下文窗口(通常超过 10 万 token)——即使有缓存命中也很浪费，极端情况下还会拉高其他请求的缓存未命中率。实际每个查询的请求数比 Claude Code 自身框架高出数倍。”

　　她还进一步说：“许多第三方工具在接近上下文限制时，每 3 步就会压缩一次工具响应，导致缓存命中率非常低。”

　　这解释了Anthropic为何要“切掉”第三方Harness用订阅模式。如果用户花20美元订阅，却通过OpenClaw产生了200美元的API成本，Anthropic就在贴钱。这不是“漏洞”，而是套利。Anthropic堵上它，是必然的商业止损行为。

　　对于订阅用户被切断后可能面临的成本骤升，罗福莉认为这是必要的阵痛：“OpenClaw、OpenCode这类第三方框架仍然可以通过API调用Claude，只是不能再搭订阅的便车了。短期内，这些Agent用户会很痛——成本轻松跳涨几十倍。但这种压力，恰恰是推动这些框架认真改进context管理、最大化prompt缓存命中率以复用已处理的上下文、削减无效token消耗的动力。痛苦终将转化为工程素养。"

　　有网友同意该观点，认为：“我们正走向一个人工智能单位经济效益不再由模型本身决定，而是由模型、应用和上下文管理三者共同决定的世界。Anthropic 的举措无意中对智能体应用施加了自然选择压力。”

　　02 警告：别盲目打价格战

　　罗福莉在发文中向大模型厂商发出明确警告：

　　“我想劝大模型厂商们，在没想清楚如何给coding订阅定价、不至于大出血之前，不要盲目卷到价格底部。把token卖得极便宜、同时对第三方框架敞开大门，表面上对用户友好，实则是个陷阱——Anthropic刚刚从这个陷阱里爬出来。”

　　她进一步指出，若用户在低质量框架、不稳定推理服务和降级模型上消耗大量精力后仍无所获，对用户体验和留存都将造成实质损害。

　　可以说，Claude Code的订阅制是一个精心设计的“平衡计算分配系统”。它可能不赚钱，但堵住了第三方Harness造成的巨大亏损。因此，罗福莉认为，大模型公司不应盲目价格战，不能一边卖便宜Token，一边敞开大门让低效Harness来烧钱。

　　言外之意是，如陷入价格战，长此以往，整个行业就无法建立可持续的商业模式。

　　03 MiMo Token计划：追求长期稳定

　　在解读Anthropic举措的同时，罗福莉也阐明了小米 MiMo Token计划的设计逻辑。

　　她提到，该计划支持第三方调用框架，采用按token配额计费的方式，逻辑上与Claude新近推出的超额用量包一致。

　　据了解，小米提供的四档套餐从39元/月到659元/月不等，支持MiMo-V2-Pro、MiMo-V2-Omni等模型，兼容OpenClaude、OpenCode、Claude Code等主流开发工具链。

　　罗福莉强调：“因为我们追求的是长期稳定地交付高质量的模型和服务——不是让你冲动付款，然后弃船而去。”

　　这一表述折射出一种与订阅制度不同的算力分配哲学：通过真实的用量成本约束用户和框架的行为。

　　04 MiMo大模型调用量突破1万亿Token

　　罗福莉的发文还有一个重要的背景。

　　就在几天前，雷军宣布MiMo大模型调用量突破1万亿Token。在全球最大API聚合平台OpenRouter上，MiMo-V2-Pro的API调用量一度登顶，超越Claude、阿里千问、谷歌Gemini等一众主流模型。

　　这一数据印证了罗福莉的判断：全球算力供给已无法跟上Agent产生的Token需求增速。在她看来，出路不在于进一步压低Token价格，而在于“更高Token效率的Agent框架”与“更强大、更高效的模型”之间的协同进化。

　　罗福莉在文章结尾预判：“Agent时代不属于烧算力最多的人，而属于用得最聪明的人。 Anthropic的这次举措，无论是否出于主动设计，都在将整个生态系统——无论开源还是闭源——推向这一方向。”

　　从批评OpenClaw的低效调用，到警告行业价格战陷阱，再到推出MiMo Token计划，罗福莉和小米MiMo团队正在试图为Agent时代的算力使用建立一种更可持续的模式。

商学院

Open Talk

小米罗福莉谈Claude限制“龙虾”：不意外，算力效率革命来了

相关阅读