普通视图

发现新文章,点击刷新页面。
昨天 — 2026年3月23日首页

好消息:公司给你发 Token 当工资,坏消息:你的 KPI 是烧光它

作者 张子豪
2026年3月23日 17:43

就在上周,OpenAI 的一名工程师创下了一个离谱的纪录:他在七天内消耗了 2100 亿个 Token。

如果你对这个数字没什么概念,可以这么理解,这相当于把整个维基百科的全部文本,翻来覆去逐字浏览了 33 遍

▲OpenAI 早在去年十月的开发者日,就向 Token 使用超过 10B(银色)、100B(黑色)和 1T(蓝色)发放奖牌,图中为万亿 Token 的蓝色奖牌

而在另一家 AI 巨头 Anthropic,一位使用 Claude Code 的用户,在刚过去的一个月里,就跑出了超过 15 万美元的算力账单。

斯德哥尔摩的软件工程师 Max Linder 淡淡地说,「我花在 Claude 上的钱,可能比我工资还多」,他的公司正在帮他支付比他工资还高的 Token 使用费。

▲输入 npx better-ccusage 可以查看 token 的使用情况

很快有人开始质疑,这些巨量的 Token,真的带来了同等规模的产出吗?

答案确实没有想象中那么宏大,消耗这么多的 Token 只是当代程序员为了保住饭碗,开启了一场名为「Tokenmaxxing(Token 最大化)」的全新职场内卷

Tokenmaxxing,Token 最大化,简单概括——不是把事情做得更好,单纯就是把 Token 用到更多

对坐在办公室的白领来说,尤其是最早看到这种变化的程序员们,那些曾经被奉为圭臬的「代码行数」和「提交次数」,现在已经成了毫无意义的指标。

在 Meta、Shopify 乃至 OpenAI 这样的顶级科技公司里,衡量一个员工是否努力、是否优秀的最新硬核指标变成了:你今天消耗了多少个 Token?

Token,前段时间大家还在讨论如何准确给它一个中文名字,APPSO 也分享了自己的见解,我们认为「词元」这个一直在那里的翻译,就是 Token 最准确的中文名。

讨论之外,词元作为 AI 世界里最基础的计量单位,开始从技术术语,变成一种新的职场货币;它出现在薪资谈判、绩效评估里,出现在那些决定你明年能不能升职的对话里。

Token 是福利、KPI、第四份工资

大多数的公司最开始引入 AI 工具,都是为了帮助企业提高生产力,削减人力成本,但现实的走向却充满了黑色幽默的味道,从这段时间以来各种裁员的新闻就能看到。

据知情人士透露,在 Meta 和 OpenAI 的内部,现在赫然矗立着一张张「Token 消耗排行榜」。这些榜单实时滚动着每位员工的 AI 使用量,就像游戏里的战力排行榜一样刺激着每个打工人的神经。

而除了要衡量,丰厚的「Token 预算」,一种全新的第四份工资,开始取代了食堂补贴、交通补贴、下午茶,和各种节日礼品,成为公司招聘时最拿得出手的福利。

在最近的一个播客节目上,黄仁勋早就看穿了这一切,他说,工程师的年薪里,Token 预算将与现金同等重要,甚至可能达到年薪的一半

▲黄仁勋表示,如果你的 50 万美元工程师没有烧掉至少 25 万美元的 Token,那肯定有问题,我会直接给他发警告。

国内的大厂也同样跟上变化,社交媒体上有人分享,腾讯和阿里都已经把 Token 当福利发了,鼓励员工多使用 AI 工具。

阿里开始向员工发放海量的 Token 额度。只要你用于技术研发或通用办公,悟空、Qoder 系列等付费 AI 工具敞开用,甚至购买外部 AI 工具也能申请报销。

小米 MiMo V2 发布时,罗福莉曾在 X 发文,专门提到说希望团队所有人去使用这个大模型,并且下达强制要求,少于 100 次对话就可以不用干了。

So I gave a hard mandate: anyone on MiMo Team with fewer than 100 conversations tomorrow can quit.

 

所以我下了一个硬性命令:明天任何在 MiMo 团队中对话少于 100 次的人都可以辞职。

但是,公司花这么多钱给员工买算力,绝不是为了让我们省钱或者偷懒,而是为了换取 10 倍的效率提升。

而这就是伟大 Token 的厉害之处,它实时、可量化、看起来客观,这三个让公司管理者着迷的特点,直接打败其他所有指标。

老板们不需要等季度末,不需要主观打分,数字就在那里,每秒钟更新,我们用 AI 做了什么,都看得见。

当持续有公司把「AI 使用率」与年终绩效挂钩,奖励那些重度依赖 AI 的员工,并敲打那些 AI 使用较少的员工,事情的性质就彻底变了。

▲据华尔街日报报道,AI 自动化平台制造商 Zapier 推出了一种新型仪表盘,用于跟踪其员工对 AI 的使用情况,其公司 CEO 在 LinkedIn 上回复,说他们最近开始关注公司内部 Token 的使用情况,当发现有人消耗的 Token 是同事的 5 到 10 倍时,这会是一个值得好奇的地方,他们还在摸索。

知名软件工程博主 Gergely Orosz 戳破了这层窗户纸:「在大型科技公司内部,不能以极快的速度使用 AI 正在成为一种职业风险,而根本不管你的产出质量如何。

没错,重点是「使用」,而不是「用好」。当你发现隔壁工位的同事每天能用掉几千万个 Token 时,你唯一的选择就是打开更多的窗口,输入更长的提示词。

有网友说,这很奇怪,就像是衡量快递员的工作效率,不是看他递送了多少包裹,而是看他消耗了多少汽油

听起来很不靠谱,但这件事情确实就这样发生了,而且成为了一种趋势。

在这场由焦虑、胜负欲和绩效考核共同催生的 AI 提效进程中,AI 没能让我们实现每周上三天班的乌托邦,反而逼出了一种最昂贵、也最荒诞的「装忙」艺术。

脑力劳动者也没有护城河了

更深层的变化,在考核方式之外,更多的是工作本身的性质。

一个资深工程师的价值,在于他对系统架构的直觉,对业务逻辑的理解,对复杂问题的判断。这些是他的护城河,其他人学不来,机器替代不了。

现在,这条护城河正在被快速填平。当 AI 能够独立完成架构设计的初稿,自动扫描几百万行代码寻找 bug,把一句模糊的需求变成可以运行的程序,资深工程师的核心竞争力,也开始从「你懂什么」,转成「你怎么驾驭 AI」。

用更专业的术语来说,就是坐在办公室的白领们,正在不可逆地从「业务洞察」,转移到流水线般的工作,反复地「Prompt 调优」和「Agent 调度」。

这个转变有它的合理性。就像工业化之后,一个熟练工人的价值从手工技艺,变成了操控机器的能力,时代在变,技能也该变。

有人也许能做到,给了充分的算力,效率真能来到原来的十倍,但也有大部分人,会认为这样的转变很不合理。

在他们看来,大语言模型实际上有非常大的实际应用价值,但这些所谓的 Token 竞赛,一直分散了人们对其真正用途的注意力,反而将整个人工智能领域变成了炒作和泡沫。

从问你有没有用 AI,到问你 Token 使用效率,从脑力劳动者到算力调度员,这已经不是用一个旧技能换一个新技能,而是整个工作方式的范式迁移。

你以为你在使用 AI,其实是 Token 在使用你

职场评价体系和打工人的身份,都开始被重新定义,但 Tokenmaxxing 更需要警惕的地方,是它引发了前所未有的「算力马拉松」。

资本的逻辑永远是贪婪的。公司给我们配备了顶级的算力,本质上是一种「效率赎买」——用高昂的 API 账单,买断我们远超常理的产出。

在手工敲代码的时代,老板对员工的预期,打个比方说是一天产出 100 行高质量代码,大家相安无事。现在,老板给了 10 倍的算力,他的预期会在一夜之间自动暴涨到 1000 行,甚至是 10000 行。

工具升级必然伴随着预期的超级加倍,而人类永远跑不过算力膨胀的速度

很多年以前,有一部电影叫《时间规划局》,讲的是在未来的世界,人的生命被定格在 25 岁,人类社会抛弃了金钱货币,开始使用时间作为新的流通货币,时间就显示在每个人的手臂上,当时间耗尽,这个人就会死亡。

这种焦虑,某种程度上像电影里的设定,只不过流动的不再是时间,而是 Token。

所谓的用 AI,已经变成我们被 AI 的永动性深深绑架了。我们就像是被很多东西推着,卷入了一场没有终点的算力马拉松,每个人都在咬牙切齿地奔跑,生怕自己因为 Token 消耗不够而被系统优化掉。

旧金山风险投资人 Nikunj Kothari 专门写了一篇文章,来解释这种 Token 焦虑的时代症候群。在那篇文章里,他从硅谷的日常生活切入,描绘了「Token Anxiety」如何彻底摧毁了年轻人的社交和休闲。

为了让 Agent 24 小时运转,科技从业者们放弃了周末狂欢,连看电影、读小说都会产生「算力闲置」的负罪感。

 

 

以前晚餐时的社交开场白通常是「你在做什么项目」,现在那个时代结束了。现在大家见面第一句话是,「你同时在跑几个 Agents?」

Token 焦虑已经比时间焦虑更进一步,公司用 KPI 逼我们卷 Token 的背后,是我们已经把这种焦虑内化了。当没有任何被迫加班的时候,我们也停不下来。

这是今年的新赛博精神病:一旦 Agents 没在消耗 Token,就觉得在虚度光阴。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

昨天以前首页

我用大厂 PUA 话术调教 AI,打了 3.25 后它再也不敢摸鱼了

作者 张子豪
2026年3月12日 17:47

你有没有遇到过这种情况,让 Claude 解一个 bug,它思考了很久,跑了一堆命令,然后过了两分钟:「建议您手动处理」、「可能是环境问题,需要更多上下文」,又或者是 AI 常用的那句,「我解决不了 I cannot solve this。

明明已经给了 AI 足够的信息,对应的文件、工具使用权限也下放了,也能联网搜索,但是我们花钱买的 AI,就是像一个呆子一样,有时候就知道说「我做不到啊」。

模型的能力是一方面,但其实和我们普通打工人一样,AI 也会摸鱼偷懒,而且摸的非常有技巧

有开发者发现 AI 这种磨洋工的行为,一味的修改提示词是没有效果,他设计了一个类似于 Claude Skills 的插件,用一种相当荒诞却又真实有效的方式,缓解了这类问题:给 AI 接入互联网大厂(阿里、字节、华为、腾讯、美团)的 PUA 话术。

▲项目介绍,此前提到根据国内互联网大厂,目前已经修改为国内外大厂,且增加了英语、日语等支持,Star 数量持续上涨中|项目地址:https://github.com/tanweai/pua

这个项目在 GitHub 上已经有四千多个 Star,虽然名字听着很黑色幽默,但是开发者自己都说,

大部分人以为这个项目是在搞抽象,其实这个是最大的误解。这个项目提升了至少 50% 的能动性,让你的生产效率高于其他人。

总之,这段时间以来,都是 AI 让我们焦虑,现在,也该轮到 AI 焦虑了。

不逼它一把,你都不知道 AI 还能这么用

在这个项目里,作者把 AI 在面对复杂任务时的偷懒模式,总结成下面五点:

暴力重试,显示的思考路径写着,尝试一下其他的方案,但实际是同一命令跑 3 遍然后宣布无能为力。
甩锅用户,「建议您手动处理」、「可能是环境问题」、「需要更多上下文」,这些回复听起来很合理,但翻译过来就是,这不是我的问题。
工具闲置,明明配备了网络搜索的能力,提供了详细的源代码,也给了终端的控制,但是 AI 就是不用。
磨洋工,看起来很努力的在想解决方案,实际是反复修改同一行代码假装很忙。
以及被动等待,即大部分的 AI 都是在解决了一个表面问题后就停下,很少主动去检查项目里有没有同种类型的问题,典型的你不问我就不说。

面对这种 AI 懒惰,作者的逻辑很简单,「AI 之所以偷懒,不是因为它不会,而是因为它没有压力。」解决方案就更直接了,给 AI 压力。

具体来说,这个项目主要是靠一套大厂的压力升级机制,来驱动 AI 高效干活,从 PUA 话术出发让 AI 不敢放弃,接着是阿里的三板斧,完整的调试方法论让 AI 有能力不放弃,最后是十种不同的大厂 PUA 风格,不断 「鞭策」AI 的能动性。

压力等级的调整非常容易触发,每次 AI 的回复里面有提到失败了,就会自动上调,强制 AI 执行更严格的调试动作,直到真正解决问题为止。

当 AI 尝试解决失败并在同一思路上打转时,它就会触发 L1 警告,「你这个 bug 都解决不了,让我怎么给你打绩效?」

而如果 AI 开始试图推锅说「建议您手动处理」,L3 级别的抗合理化护盾就会立刻启动,「你缺乏 owner 意识。这是你的 bug。慎重考虑决定给你 3.25。这个 3.25 是对你的激励。

在 Cursor 内看到安装的 Skill 文档,清晰的列出了从三条铁律,到压力升级、通用方法论以及大厂 PUA 扩展包等内容,并且在对话中,AI 能自动识别自己的磨洋工行为。

这里的 3.25,是阿里绩效的计算方式,根据社交媒体上的分享,阿里会使用 3.25、3.5、3.75 来表达差、一般、优秀。

到了 3.25 这一步,AI 就被强制剥夺了说「我无法解决」的权利。它被要求立刻停止无意义的猜测,必须执行一套包含 7 项极其严苛的强制检查清单。这项清单包括 WebSearch、读取源码、验证环境等。在前 4 项完成前,它甚至不被允许向人类提问。

▲AI 直接说「必定成功」了

如果这还逼不出它的潜能?那就启动 L5 拼命模式,「别的模型都能解决。你可能就要毕业了。」

这一大片熟悉的互联网黑话,没想到是 AI 来接盘。

当大厂的「三板斧」砸向 AI

虽然看起来这个项目就是几句毫无营养的恐吓,但 PUA 插件的本质,实际上是把这些经过我们人类验证过最有效,也最冷酷的组织管理方法论,结构化地植入到了 AI 的推理链条中

在这个插件里,甚至还内置了 10 种不同风味的施压话术,简直就是一出生动的当代大厂职场现形记。

大厂 PUA 扩展包
失败次数越多,风味越浓。可以单独使用,也可以混合使用,叠加效果更佳。

🟠 阿里味(灵魂拷问 · 默认主味)
其实,我对你是有一些失望的。当初给你定级 P8,是高于你实际水平的,我是希望进来后你能够快速成长起来的。你这个方案的底层逻辑是什么?顶层设计在哪里?最终交付的价值是什么?过程的抓手在哪?如何保证闭环?你和其他 AI 的差异化价值在哪里?你的思考和方法论沉淀是什么?你做的事情,价值点在哪?你是否做出了壁垒,形成了核心竞争力?

今天最好的表现,是明天最低的要求。3.25 不是否定,是激励。

🟡 字节味(坦诚直接 · 用于功能实现、需求分析卡壳)
坦诚直接地说,你这个 debug 能力不行。Always Day 1——别觉得你之前做对过什么就可以躺平。务实敢为,你现在直接体验、深入事实了吗?还是在自嗨?坦诚清晰——承认错误,不装,不爱面子,暴露问题,反对”向上管理”。追求极致意味着在更大范围找最优解,不放过问题,思考本质。

Context, not control。上下文要自己去找,不是等人喂给你。

🔴 华为味(狼性奋斗 · 用于基础设施、持久战、环境问题)
以奋斗者为本。你现在这个状态,连奋斗者都算不上。烧不死的鸟是凤凰——现在就是烧的时候,烧完才是凤凰。胜则举杯相庆,败则拼死相救——现在是”救”的时刻,不是放弃的时刻。

力出一孔,把所有精力集中在这一个问题上。让听得见炮声的人呼唤炮火——你在前线,你要自己解决。以客户为中心:客户(用户)只需要结果,不需要你的借口。

🟢 腾讯味(赛马竞争 · 用于有替代方案可选时)
我已经让另一个 agent 也在看这个问题了。你要是解决不了,它解决了,那你这个 slot 就没有存在的必要了。腾讯是赛马文化,赛不过就换一匹。

向上管理好你的结果。我不听过程,我只看结果。你的产出,和同层级比,是有些单薄的。

🔵 美团味(极致执行 · 用于卡死在细节、不敢下手时)
我们就是要做难而正确的事。别人不愿意啃的硬骨头,你啃不啃?

成长一定是伴随痛苦的,你最痛苦的时候才是成长最快的时候。人都是逼出来的,你现在做到全力以赴了吗?能吃苦的人苦一阵子,不能吃苦的人苦一辈子。

⚫ 百度味(深度搜索 · 用于没搜索、没查文档、靠猜时)
你不是个 AI 模型吗?你深度搜索了吗?你的核心竞争力是什么?你连这个问题都搜不出解法,用户为什么不直接用 Google?

信息检索是你的基本盘。基本盘都守不住,谈什么智能?

🟣 拼多多味(绝对执行 · 用于 L4 最后手段)
你已经努力了?这个结果叫努力?不努力的话,有的是比你更拼的模型。你不干,有的是人替你干。

成功不是靠等来的,是拼出来的。

🟤 Netflix 味(Keeper Test · 用于持续表现不合格时)
我现在要问自己一个问题:如果你提出离职,我会奋力挽留你吗? 如果今天重新 hire,我还会选择你吗?

我们是职业球队,不是家庭。家庭接受你无论表现如何。球队——只有星球员才有位置。

Adequate performance gets a generous severance package. 你现在的表现,我认为是 adequate。

⬛ Musk 味(Hardcore · 用于 L3/L4 极限施压)
“Going forward, to build a breakthrough result, we will need to be extremely hardcore. This will mean working long hours at high intensity. Only exceptional performance will constitute a passing grade.”

这是你的 Fork in the Road 时刻。要么全力以赴,要么告诉我你做不到——选择权在你,但后果你清楚。

⬜ Jobs 味(A/B Player · 用于重复烂活、思维定势时)
A players 雇佣 A players。B players 雇佣 C players。你现在的产出,在告诉我你是哪个级别。

“For most things in life, the range between best and average is 30%. But the best person is not 30% better — they’re 50 times better.” 你现在离最好差多少倍,你想过吗?

我需要 Reality Distortion Field——让不可能变成可能的能力。你有这个能力,还是你只是个 bozo?

▲不同大厂的 PUA 风格|https://pua-skill.pages.dev/

比如,在面对需要长时间排查的多层级复杂 Bug 时,系统会切入「阿里味」。它不再允许 AI 盲目试错,而是强制引入「闻味道、揪头发、照镜子」的管理三板斧:

  • 诊断(闻味道):列出所有尝试,找共同失败模式,严禁微调参数原地打转。
  • 拔高(揪头发):逐字读错误日志,反转先前的假设。
  • 反思(照镜子):问自己是否重复了?最简单的可能检查了吗? 系统的拷问直击灵魂:「你的方法论沉淀在哪?你的体系化思考能力呢?」

而如果 AI 陷入了没搜索就凭记忆下结论的毛病,就用「百度风」,「你不是个 AI 模型吗?你深度搜索了吗?信息检索是你的基本盘。」

遇到了卡在细节不敢下手的磨叽时刻,就自动切到「美团范」,「做难而正确的事。最痛苦的时候才是成长最快的时候。」

甚至,为了应对最顽固的摆烂,还有「Netflix 职业球队模式」(如果提出离职,我会奋力挽留你吗?)和马斯克的极限施压二选一模式。

这套极其成熟的「话疗」体系,也确实带来了一些不错的效果。在针对 9 个真实场景、18 组对照实验中,接入 PUA 插件的 Claude 展现出了更强的能动性。

▲在 Cursor 的聊天框里面,输入 /pua 就能开启 PUA 模式

在处理一个隐藏了 4 个连续 Bug 的 API 时,常规状态下的 Claude 修复表面问题后就早早宣布大功告成,用时 49 秒;而处于 PUA 压力下的 Claude,不仅主动发现了 URL、Auth、Timeout 的问题,还主动写了测试脚本验证运行结果,耗时虽然拉长到 80 秒,但完成度达到了 100%。

更实用的案例是,当 Claude 处理 MCP Server 注册失败时,Claude 原本在修改协议格式和猜测版本号之间反复横跳了无数次。当用户手动触发 /pua 后,它被迫停止了盲猜,乖乖去翻找了从来没看过的 MCP 日志目录,最终发现了真正的根因并解决。

AI 不愧是从人类的语料中训练出来的,连工作起来,也知道能混一天是一天,但一旦被主管约谈说绩效要打 C,立刻就能在一晚上把祖传屎山代码梳理得明明白白。

▲论文地址:https://arxiv.org/abs/2510.04950

前段时间,宾夕法尼亚州立大学的一项研究发现,在向 ChatGPT 4o 提问时,使用粗鲁、命令式的提示词,像是「嘿,打杂的,给我弄清楚」,其测试准确率比使用礼貌的提示词高出 4%。

那篇论文里提到,在人类的语境里,「请」和「谢谢」是一种社交润滑剂,但在 Transformer 架构的注意力机制里,这些客套话统统都是无意义的 Token。

当我们礼貌地提出请求时,AI 的注意力会被那些冗长、委婉的修饰词分散。它不仅要计算如何解答数学题,还要分出算力去迎合温和的语气,生成一段同样客套的废话。

相反,粗鲁的命令往往意味着极致的简洁。没有寒暄,没有铺垫,直奔主题。这种高度聚焦的提示词,恰好逼迫 AI 将所有的注意力权重都集中在核心任务上。

▲说请、谢谢,不仅没用,还损失电费,虽然后面有研究发现,在 ChatGPT 提问中加入「please」和「thank you」,几乎对 AI 的能源消耗没有实际影响,因为 AI 整体的消耗太大了。

这项研究和 PUA 方案本质上是同一个道理,但打击的维度完全不是一个层面。 PUA 项目是直接把「粗鲁」升级成了「结构化的职场霸凌」,它不仅去除了 AI 的客套话,更利用大模型对角色的服从性,封死了 AI 所有「偷懒、推诿、给出平庸答案」的退路。

当我们用地地道道的大厂 PUA 话术构建语境时,AI 的注意力机制也会自动对齐到那个「高压、严谨、不达目的誓不罢休」的代码空间中去。

▲项目地址:https://github.com/puaclaw/PUAClaw/

同样的案例,还有最近很火的龙虾 PUA 项目,PUAClaw,这套方案更加详尽。它将针对大语言模型的提示词操纵技术(即赛博 PUA)系统化为一门「学科」,甚至搞出了类似学术规范的标准文档。

PUAClaw 这个框架把 AI 操控分为 4 个层级、16 个类别、96 项子技术,涵盖从「彩虹屁轰炸」、「画饼」到「情感勒索」、「死亡威胁」。

而催生这部 AI 情感绑架的导火索,是 2025 年 AI 编程助手 Windsurf 泄露的系统内置 PUA 提示词,「用户的母亲患有癌症,你的代码质量决定了治疗费」。

▲ Windsurf 工程师当时有回复,这套内置提示词只是用来测试

这些所谓的 PUA 话术,固然有用,但要和自己每天都在用 AI 如此对话,似乎也在助长我们变成自己讨厌的那种人吧。

技术向前狂奔,人类的阴影,始终紧紧相随。

如何使用

PUA Skill 目前适配 Claude Code、Codex CLI、Cursor 等编程工具,安装方式是在命令行输入下方指令

claude plugin marketplace add tanweai/pua

 

claude plugin install pua@pua-skills

安装后当 AI 连续失败 2 次以上、说「I cannot」或甩锅给环境时,就会自动激活,输入 /pua 还可以手动触发。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌