标题和作者

本文由量子位发布,作者为梦晨,发布时间为2026年3月23日。文章聚焦于硅谷兴起的“Token刷量大赛”现象,揭示了AI技术如何推动企业内部Token消耗激增,以及NVIDIA CEO黄仁勋提出的将Token作为第四种薪酬的新薪酬框架,深入分析了Coding Agent对生产力变革的影响及由此引发的行业焦虑。

摘要

本文记录了硅谷兴起的“Token刷量大赛”现象。此前,虽然AI模型使用量在增长,但尚未形成如此激进的内部竞赛和Token货币化趋势。为了解决Coding Agent带来的无限Token消耗问题,以及提升企业竞争力,AI公司通过提供高额补贴(如OpenAI和Anthropic将价值约1000美元的Token以200美元出售)和绩效考核激励机制来推动员工使用。结果显示,Anthropic和OpenAI的收入大幅增长,Claude Code和Codex用户激增,且Token已成为NVIDIA CEO黄仁勋提出的第四种薪酬。然而,这种过度追求Token消耗的模式也引发了关于产出质量和财务可持续性的质疑。

本节涉及的关键术语解释如下:Tokenmaxxing,即“Token刷量大赛”,指的是员工之间竞争谁消耗的AI Token最多的现象;Coding Agent,指能够自动执行编程任务的AI工具,如Claude Code和Codex,它们可以无人监督地连续工作;Token预算,指公司分配给员工用于AI推理计算的算力额度。

主要主题和概念

主题一:Tokenmaxxing与AI消费狂热
What:这是指硅谷员工之间的一种竞赛,目的是看谁消耗的AI Token最多。这不仅仅是日常使用,而是演变成一种内部考核和排名。
Why:主要原因是Coding Agent(如Claude Code、Codex)的出现。这些工具可以无人监督地连续工作数小时,自动审查代码库并生成成千上万个Token。同时,AI公司为了抢占市场,推出了类似优惠券的补贴策略,鼓励用户多消耗Token。
How:公司通过设置内部排行榜来追踪消耗量,并将AI使用量纳入绩效考核。Meta和Shopify甚至奖励重度使用者,批评不用的人。这导致一个人在短时间内就能消耗掉相当于33个维基百科的Token。

主题二:Token成为第四种薪酬
What:即把公司分配的Token预算视为一种新的薪酬福利。它不再仅仅是技术术语,而是变成了像工资、奖金、期权一样,可以直接提升工程师生产力的资源。
Why:随着AI算力变得稀缺且昂贵,Token变成了稀缺资源。工程师为了提升效率,需要大量的专属算力。因此,拥有更多Token预算成为了衡量工程师价值的新标准。
How:NVIDIA CEO黄仁勋率先提出这一概念,建议在基础薪资之外,额外提供相当于半年薪的Token预算,使总包中的Token占比达到21%。这导致面试时“你能有多少专属推理算力”成为了工程师最关心的问题之一。

本节涉及的关键术语解释如下:Agent,指能自主执行任务的AI软件;推理算力,指AI模型进行思考和生成回答所需的计算能力;Token预算,指公司分配给员工用于调用AI模型的额度。

重要引文

论点一:Coding Agent是Token消耗爆炸的核心驱动力
论据:文中提到“Coding Agent改变了一切。Claude Code、Codex这类工具可以在无人监督的状态下连续工作数小时,审查和编辑大型代码库,从一条指令生成完整程序。”
论证:正是这种自动化工具的广泛应用,使得员工不再需要手动操作,而是通过指令让Agent自动处理任务,每一步都在生成成千上万个Token,最终导致单员工消耗量达到惊人的2100亿Tokens,相当于33个维基百科的内容。

论点二:Token正成为继工资、奖金、期权之后的第四种薪酬
论据:文中引用了NVIDIA CEO黄仁勋的发言:“我会在基础薪资之上再给他们相当于一半年薪的token,让他们能力放大10倍。”以及Levels.fyi的数据:“75分位软件工程师的年薪是37.5万美元……总包就是47.5万美元,其中21%是token。”
论证:黄仁勋将Token明确纳入薪酬框架,使得公司愿意支付相当于半年的Token预算作为额外福利。这种做法直接导致了Token在总薪酬中的占比达到21%,从而确立了Token作为第四种薪酬形式的地位。

论点三:当前的Token竞赛存在不可持续性和质量隐忧
论据:文中引用了一位匿名OpenAI员工的评价:“这看起来不可持续。排行榜不衡量产出质量。”以及“那些刷到数十亿token的人,到底在产出有用的东西,还是只是在空转、看起来很忙?”
论证:文章指出,当公司为员工支付的Token费用接近甚至超过其工资时,管理层开始质疑算力是否真的在创造价值,还是仅仅在“空转”。这种对产出质量和财务效率的担忧,揭示了Tokenmaxxing现象背后的隐患。

本节涉及的关键术语解释如下:推理算力,指AI模型进行思考所需的计算资源;空转,指系统或程序在没有实际产生有效成果的情况下运行。

总结

本文最引人注目的现象是硅谷工程师之间疯狂且昂贵的“Token刷量大赛”,一人单周消耗的Token足以填满33个维基百科,而Anthropic的Claude Code单月账单更是高达15万美元。这种由Coding Agent驱动的自动化狂热,不仅让AI公司收入翻倍,更催生了NVIDIA CEO黄仁勋提出的“Token薪酬”新概念,即把Token作为第四种薪酬形式。然而,这种看似繁荣的增长背后暗藏危机,过度追求Token消耗量可能导致产出质量下降和财务不可持续,未来行业可能需要从“数量竞赛”转向“质量评估”。