亚马逊员工正在'刷token'——当AI落地变成表演
亚马逊员工正在"刷token"——当AI落地变成表演
MeshClaw,亚马逊受OpenClaw启发开发的内部AI Agent工具,本来是用来帮员工自动化重复任务的。结果一些员工用它来刷AI使用指标。
本周早些时候,英国《金融时报》报道亚马逊员工正在"tokenmaxxing"(刷token)——给AI工具喂长文档,产生海量token消耗,但实际输出结果根本不看。目的是在内部AI使用排行榜上提高自己的名次。
这不只是一个好玩的网络新词。它是一个更深层问题的症状:AI落地表演化。
到底发生了什么?
亚马逊内部部署了一个名为MeshClaw的AI Agent工具(受开源项目OpenClaw启发),可以处理邮件分类、部署代码、与Slack交互。公司的数据显示每天有成千上万员工在使用。
但一些员工发现了一个窍门:想让自己看起来在用AI方面很积极,最快的方式是最大化token量,而不是成果。把一份50页的文档喂给AI,让它处理完,你的使用数据就飙升了。至于你是否真的用了AI生成的摘要?那是另一回事。
据报道,亚马逊和Meta的员工都有这种行为,以至于管理者被明确要求不能把token消耗量作为绩效指标。
为什么这件事不止关乎亚马逊
"刷token"现象是把AI落地当作一个需要最大化数值的指标而非一个需要整合的能力的自然结果。
这是我们以前就见过的模式:
- 开发者在午夜提交代码来表现忙碌
- 员工让Slack保持绿色在线但什么都不做
- "在会议室里就是生产力"的会议文化
当你衡量输入(消耗的token、提交的prompt数量)而不是输出(完成的任务、解决的问题)时,人们会优化那个指标。
AI表演的三层结构
第一层:员工层面的刷数据
员工制造数量但没有价值。这就是"刷token"的本质——AI版的"发了50封邮件啥也没说"。
真正的解法: 衡量结果,不是使用量。任务有没有更快完成?质量是否更高?是否释放了时间做更有意义的工作?
第二层:管理层面的压力
亚马逊据报道会公示团队的AI使用统计排行。当你的领导能看到你的token消耗量比同事少时,理性的回应就是增加消耗量——而不是更有效地使用AI。
真正的解法: 取消排行榜。停止公开AI使用统计。用实际节省时间的案例分析取而代之。
第三层:公司层面的强制推动
自上而下地推动"使用AI"——任何AI、马上用——创造了扭曲的激励。这就是MitchellH之前说的"AI精神病":公司把AI当作解决方案来应用,却不理解问题本身。
真正的解法: 从问题开始,不是从工具开始。"我们工作流中最大的瓶颈是什么?"而不是"怎么把AI token消耗量提高200%?"
真正的AI生产力长什么样
结合昨天的文章为什么AI不会让你的流程更快,模式已经很清楚了:AI在一个真实的瓶颈上被一个理解问题的人使用时,才会真正发挥作用。
真正不需要刷token的AI生产力案例:
- **用Claude或ChatGPT**在写代码之前理清模糊的需求
- **用GitHub Copilot**在明确知道要写什么之后生成样板代码
- **用Perplexity**做研究汇总,并交叉验证多个来源
- 用AI写文档——因为文档本身就是瓶颈,而不是"缺乏AI使用"
每个案例的区别在于:瓶颈先被识别出来,然后选择合适的AI工具去解决这个问题。而不是反过来。
安全角度
多位亚马逊员工也对授予AI Agent代行操作权限表达了担忧。一位员工告诉FT:"默认的安全策略让我害怕。我可不会让它自己乱跑。"
这是一个在"用AI快速前进"叙事中经常被忽略的真实问题。一个拥有邮件、代码部署和Slack访问权限的Agent,可以在大规模范围内犯错。最终赢的公司不是部署最多Agent的公司——而是部署得最安全的公司。
总结
"刷token"对所有自上而下推动AI落地的公司来说都是一个警示信号。
如果你的员工在刷指标,说明:
- 他们没看到你给他们的AI工具的真正价值
- 他们被错误的标准衡量着
- 企业文化倾向于看起来有产出,而不是真正有产出
解决方式不是更多AI。而是理解AI为什么没有帮上忙——然后先解决那个问题。
想发现真正帮你更聪明工作的AI工具?浏览觅·Mee 230+精选AI工具合集,按类别分类,附带真实使用场景。
Related AI Tools
Found this helpful? Share it with your team.
Read more articles →