罗福莉:龙虾成本黑洞显现,需要更高token效率的Agent框架

2026-04-06 20:44:53

Anthropic封堵第三方工具滥用订阅权限的举动,正在揭开AI Agent时代一场被长期忽视的成本危机。

两天前,Anthropic宣布切断第三方调用框架通过Claude订阅接入的通道。Xiaomi MiMo大模型负责人罗福莉(Fuli Luo)随即发文,结合三天前MiMo刚刚推出的Token计划,对这一事件作出深度解读。

她认为,Anthropic此举并非单纯的商业防御,而是在全球算力供给无法追上Agent需求增速的背景下,整个生态系统走向成熟的一个必要节点。

此次受直接冲击的,是OpenClaw、OpenCode等依赖Claude订阅权限运行的第三方调用框架用户。这些用户面临的成本骤升,短期内可能达到此前的数十倍。

但罗福莉认为,这种压力恰恰是倒逼工程质量改善的催化剂——只有让效率低下的成本真实可见,才能推动开发者认真对待上下文管理与缓存优化。

订阅制度背后的成本黑洞

罗福莉指出,Claude Code的订阅体系在算力分配设计上颇为精巧,但她坦言,这套系统大概率无法盈利,甚至可能处于亏损状态。

问题的根源在于第三方框架的调用方式。以OpenClaw为例,其上下文管理存在明显缺陷:在处理单个用户请求时,系统会拆分出多轮低价值工具调用,以独立API请求的形式逐一发出,每次请求携带的上下文窗口往往超过10万个token。

即便存在缓存命中,这种模式也极为浪费;在极端情况下,还会拉高其他请求的缓存未命中率。

罗福莉估算,这类框架每个查询实际产生的请求数,往往是Claude Code原生框架的数倍。换算成API计费,实际成本可能是订阅价格的数十倍。她将这一差距称为"不是缺口,而是天坑"。

AI工作坊组织者@newlinedotco评论称:订阅的“all you can eat”套餐从一开始就是定时炸弹——第三方harness(如OpenClaw)24/7循环调用,API成本可能高达5000美元,而订阅仅200美元。官方工具(如Claude Code)因优化prompt cache才可持续。

封堵之后:短痛与长期规律

Anthropic此次调整并未完全关闭第三方接入的大门。OpenClaw、OpenCode等工具仍可通过API调用Claude,只是失去了搭乘订阅计划的通道。

这一区别至关重要。对于习惯以订阅价格使用这些工具的用户而言,成本冲击是即时且显著的。

但罗福莉认为,这种痛感具有修正意义——它会迫使框架开发者认真提升上下文管理能力,最大化提示缓存命中率以复用已处理的上下文,并削减无效token消耗。她将这一过程描述为"痛苦最终转化为工程规律"。

她同时提醒各大语言模型公司,在尚未厘清编程计划成本结构之前,不应盲目卷入定价竞底。廉价出售token同时对第三方框架敞开大门,表面上对用户友好,实则是一个陷阱——而Anthropic刚刚走出了这个陷阱。

她进一步指出,若用户在低质量框架、不稳定推理服务和降级模型上消耗大量精力后仍无所获,对用户体验和留存都将造成实质损害。

对此,AI 工程师 @karpathy指出:

“伟大的软件往往诞生于限制之中。如果 Token 是免费的,没人会去写精简的 Prompt 或研究 Context 压缩;当成本变成瓶颈,开发者才会真正思考如何构建‘有脑子’的 Agent。”MiMo Token计划的不同路径

在解读Anthropic举措的同时,罗福莉也阐明了MiMo Token计划的设计逻辑。

该计划支持第三方调用框架,采用按token配额计费的方式,逻辑上与Claude新近推出的超额用量包一致。

罗福莉强调,MiMo的目标是"长期稳定地交付高质量模型和服务,而非让用户冲动付费后流失"。

这一表述折射出一种与订阅制度不同的算力分配哲学:通过真实的用量成本约束用户和框架的行为,而非以封闭方式管理滥用风险。

效率竞争,而非算力消耗

罗福莉在文章结尾给出了一个更宏观的判断:全球算力供给已无法跟上Agent产生的token需求增速。

在她看来,出路不在于进一步压低token价格,而在于"更高token效率的Agent框架"与"更强大、更高效的模型"之间的协同演进。

Anthropic的这次举措,无论是否出于主动设计,都在将整个生态系统——无论开源还是闭源——推向这一方向。

"Agent时代不属于烧算力最多的人,而属于用得最聪明的人。"罗福莉写道。