黄仁勋发Token当工资！硅谷兴起刷量大赛，一人烧掉33个维基百科

标题和作者

本文由量子位发布，作者为梦晨，发布时间为2026年3月23日。文章聚焦于硅谷兴起的“Token刷量大赛”现象，揭示了AI技术如何推动企业内部Token消耗激增，以及NVIDIA CEO黄仁勋提出的将Token作为第四种薪酬的新薪酬框架，深入分析了Coding Agent对生产力变革的影响及由此引发的行业焦虑。

摘要

本文记录了硅谷兴起的“Token刷量大赛”现象。此前，虽然AI模型使用量在增长，但尚未形成如此激进的内部竞赛和Token货币化趋势。为了解决Coding Agent带来的无限Token消耗问题，以及提升企业竞争力，AI公司通过提供高额补贴（如OpenAI和Anthropic将价值约1000美元的Token以200美元出售）和绩效考核激励机制来推动员工使用。结果显示，Anthropic和OpenAI的收入大幅增长，Claude Code和Codex用户激增，且Token已成为NVIDIA CEO黄仁勋提出的第四种薪酬。然而，这种过度追求Token消耗的模式也引发了关于产出质量和财务可持续性的质疑。

本节涉及的关键术语解释如下：Tokenmaxxing，即“Token刷量大赛”，指的是员工之间竞争谁消耗的AI Token最多的现象；Coding Agent，指能够自动执行编程任务的AI工具，如Claude Code和Codex，它们可以无人监督地连续工作；Token预算，指公司分配给员工用于AI推理计算的算力额度。

主要主题和概念

主题一：Tokenmaxxing与AI消费狂热
What：这是指硅谷员工之间的一种竞赛，目的是看谁消耗的AI Token最多。这不仅仅是日常使用，而是演变成一种内部考核和排名。
Why：主要原因是Coding Agent（如Claude Code、Codex）的出现。这些工具可以无人监督地连续工作数小时，自动审查代码库并生成成千上万个Token。同时，AI公司为了抢占市场，推出了类似优惠券的补贴策略，鼓励用户多消耗Token。
How：公司通过设置内部排行榜来追踪消耗量，并将AI使用量纳入绩效考核。Meta和Shopify甚至奖励重度使用者，批评不用的人。这导致一个人在短时间内就能消耗掉相当于33个维基百科的Token。

主题二：Token成为第四种薪酬
What：即把公司分配的Token预算视为一种新的薪酬福利。它不再仅仅是技术术语，而是变成了像工资、奖金、期权一样，可以直接提升工程师生产力的资源。
Why：随着AI算力变得稀缺且昂贵，Token变成了稀缺资源。工程师为了提升效率，需要大量的专属算力。因此，拥有更多Token预算成为了衡量工程师价值的新标准。
How：NVIDIA CEO黄仁勋率先提出这一概念，建议在基础薪资之外，额外提供相当于半年薪的Token预算，使总包中的Token占比达到21%。这导致面试时“你能有多少专属推理算力”成为了工程师最关心的问题之一。

本节涉及的关键术语解释如下：Agent，指能自主执行任务的AI软件；推理算力，指AI模型进行思考和生成回答所需的计算能力；Token预算，指公司分配给员工用于调用AI模型的额度。

重要引文

论点一：Coding Agent是Token消耗爆炸的核心驱动力
论据：文中提到“Coding Agent改变了一切。Claude Code、Codex这类工具可以在无人监督的状态下连续工作数小时，审查和编辑大型代码库，从一条指令生成完整程序。”
论证：正是这种自动化工具的广泛应用，使得员工不再需要手动操作，而是通过指令让Agent自动处理任务，每一步都在生成成千上万个Token，最终导致单员工消耗量达到惊人的2100亿Tokens，相当于33个维基百科的内容。

论点二：Token正成为继工资、奖金、期权之后的第四种薪酬
论据：文中引用了NVIDIA CEO黄仁勋的发言：“我会在基础薪资之上再给他们相当于一半年薪的token，让他们能力放大10倍。”以及Levels.fyi的数据：“75分位软件工程师的年薪是37.5万美元……总包就是47.5万美元，其中21%是token。”
论证：黄仁勋将Token明确纳入薪酬框架，使得公司愿意支付相当于半年的Token预算作为额外福利。这种做法直接导致了Token在总薪酬中的占比达到21%，从而确立了Token作为第四种薪酬形式的地位。

论点三：当前的Token竞赛存在不可持续性和质量隐忧
论据：文中引用了一位匿名OpenAI员工的评价：“这看起来不可持续。排行榜不衡量产出质量。”以及“那些刷到数十亿token的人，到底在产出有用的东西，还是只是在空转、看起来很忙？”
论证：文章指出，当公司为员工支付的Token费用接近甚至超过其工资时，管理层开始质疑算力是否真的在创造价值，还是仅仅在“空转”。这种对产出质量和财务效率的担忧，揭示了Tokenmaxxing现象背后的隐患。

本节涉及的关键术语解释如下：推理算力，指AI模型进行思考所需的计算资源；空转，指系统或程序在没有实际产生有效成果的情况下运行。

总结

本文最引人注目的现象是硅谷工程师之间疯狂且昂贵的“Token刷量大赛”，一人单周消耗的Token足以填满33个维基百科，而Anthropic的Claude Code单月账单更是高达15万美元。这种由Coding Agent驱动的自动化狂热，不仅让AI公司收入翻倍，更催生了NVIDIA CEO黄仁勋提出的“Token薪酬”新概念，即把Token作为第四种薪酬形式。然而，这种看似繁荣的增长背后暗藏危机，过度追求Token消耗量可能导致产出质量下降和财务不可持续，未来行业可能需要从“数量竞赛”转向“质量评估”。