我用大厂 PUA 话术调教 AI,打了 3.25 后它再也不敢摸鱼了

你有没有遇到过这种情况,让 Claude 解一个 bug,它思考了很久,跑了一堆命令,然后过了两分钟:「建议您手动处理」、「可能是环境问题,需要更多上下文」,又或者是 AI 常用的那句,「我解决不了 I cannot solve this。」
明明已经给了 AI 足够的信息,对应的文件、工具使用权限也下放了,也能联网搜索,但是我们花钱买的 AI,就是像一个呆子一样,有时候就知道说「我做不到啊」。
模型的能力是一方面,但其实和我们普通打工人一样,AI 也会摸鱼偷懒,而且摸的非常有技巧。
有开发者发现 AI 这种磨洋工的行为,一味的修改提示词是没有效果,他设计了一个类似于 Claude Skills 的插件,用一种相当荒诞却又真实有效的方式,缓解了这类问题:给 AI 接入互联网大厂(阿里、字节、华为、腾讯、美团)的 PUA 话术。

▲项目介绍,此前提到根据国内互联网大厂,目前已经修改为国内外大厂,且增加了英语、日语等支持,Star 数量持续上涨中|项目地址:https://github.com/tanweai/pua
这个项目在 GitHub 上已经有四千多个 Star,虽然名字听着很黑色幽默,但是开发者自己都说,
大部分人以为这个项目是在搞抽象,其实这个是最大的误解。这个项目提升了至少 50% 的能动性,让你的生产效率高于其他人。
总之,这段时间以来,都是 AI 让我们焦虑,现在,也该轮到 AI 焦虑了。
不逼它一把,你都不知道 AI 还能这么用
在这个项目里,作者把 AI 在面对复杂任务时的偷懒模式,总结成下面五点:
暴力重试,显示的思考路径写着,尝试一下其他的方案,但实际是同一命令跑 3 遍然后宣布无能为力。
甩锅用户,「建议您手动处理」、「可能是环境问题」、「需要更多上下文」,这些回复听起来很合理,但翻译过来就是,这不是我的问题。
工具闲置,明明配备了网络搜索的能力,提供了详细的源代码,也给了终端的控制,但是 AI 就是不用。
磨洋工,看起来很努力的在想解决方案,实际是反复修改同一行代码假装很忙。
以及被动等待,即大部分的 AI 都是在解决了一个表面问题后就停下,很少主动去检查项目里有没有同种类型的问题,典型的你不问我就不说。
面对这种 AI 懒惰,作者的逻辑很简单,「AI 之所以偷懒,不是因为它不会,而是因为它没有压力。」解决方案就更直接了,给 AI 压力。
具体来说,这个项目主要是靠一套大厂的压力升级机制,来驱动 AI 高效干活,从 PUA 话术出发让 AI 不敢放弃,接着是阿里的三板斧,完整的调试方法论让 AI 有能力不放弃,最后是十种不同的大厂 PUA 风格,不断 「鞭策」AI 的能动性。
压力等级的调整非常容易触发,每次 AI 的回复里面有提到失败了,就会自动上调,强制 AI 执行更严格的调试动作,直到真正解决问题为止。

当 AI 尝试解决失败并在同一思路上打转时,它就会触发 L1 警告,「你这个 bug 都解决不了,让我怎么给你打绩效?」
而如果 AI 开始试图推锅说「建议您手动处理」,L3 级别的抗合理化护盾就会立刻启动,「你缺乏 owner 意识。这是你的 bug。慎重考虑决定给你 3.25。这个 3.25 是对你的激励。」

▲在 Cursor 内看到安装的 Skill 文档,清晰的列出了从三条铁律,到压力升级、通用方法论以及大厂 PUA 扩展包等内容,并且在对话中,AI 能自动识别自己的磨洋工行为。
这里的 3.25,是阿里绩效的计算方式,根据社交媒体上的分享,阿里会使用 3.25、3.5、3.75 来表达差、一般、优秀。
到了 3.25 这一步,AI 就被强制剥夺了说「我无法解决」的权利。它被要求立刻停止无意义的猜测,必须执行一套包含 7 项极其严苛的强制检查清单。这项清单包括 WebSearch、读取源码、验证环境等。在前 4 项完成前,它甚至不被允许向人类提问。

▲AI 直接说「必定成功」了
如果这还逼不出它的潜能?那就启动 L5 拼命模式,「别的模型都能解决。你可能就要毕业了。」
这一大片熟悉的互联网黑话,没想到是 AI 来接盘。
当大厂的「三板斧」砸向 AI
虽然看起来这个项目就是几句毫无营养的恐吓,但 PUA 插件的本质,实际上是把这些经过我们人类验证过最有效,也最冷酷的组织管理方法论,结构化地植入到了 AI 的推理链条中。
在这个插件里,甚至还内置了 10 种不同风味的施压话术,简直就是一出生动的当代大厂职场现形记。
大厂 PUA 扩展包
失败次数越多,风味越浓。可以单独使用,也可以混合使用,叠加效果更佳。
🟠 阿里味(灵魂拷问 · 默认主味)
其实,我对你是有一些失望的。当初给你定级 P8,是高于你实际水平的,我是希望进来后你能够快速成长起来的。你这个方案的底层逻辑是什么?顶层设计在哪里?最终交付的价值是什么?过程的抓手在哪?如何保证闭环?你和其他 AI 的差异化价值在哪里?你的思考和方法论沉淀是什么?你做的事情,价值点在哪?你是否做出了壁垒,形成了核心竞争力?
今天最好的表现,是明天最低的要求。3.25 不是否定,是激励。
🟡 字节味(坦诚直接 · 用于功能实现、需求分析卡壳)
坦诚直接地说,你这个 debug 能力不行。Always Day 1——别觉得你之前做对过什么就可以躺平。务实敢为,你现在直接体验、深入事实了吗?还是在自嗨?坦诚清晰——承认错误,不装,不爱面子,暴露问题,反对”向上管理”。追求极致意味着在更大范围找最优解,不放过问题,思考本质。
Context, not control。上下文要自己去找,不是等人喂给你。
华为味(狼性奋斗 · 用于基础设施、持久战、环境问题)
以奋斗者为本。你现在这个状态,连奋斗者都算不上。烧不死的鸟是凤凰——现在就是烧的时候,烧完才是凤凰。胜则举杯相庆,败则拼死相救——现在是”救”的时刻,不是放弃的时刻。
力出一孔,把所有精力集中在这一个问题上。让听得见炮声的人呼唤炮火——你在前线,你要自己解决。以客户为中心:客户(用户)只需要结果,不需要你的借口。
🟢 腾讯味(赛马竞争 · 用于有替代方案可选时)
我已经让另一个 agent 也在看这个问题了。你要是解决不了,它解决了,那你这个 slot 就没有存在的必要了。腾讯是赛马文化,赛不过就换一匹。
向上管理好你的结果。我不听过程,我只看结果。你的产出,和同层级比,是有些单薄的。
美团味(极致执行 · 用于卡死在细节、不敢下手时)
我们就是要做难而正确的事。别人不愿意啃的硬骨头,你啃不啃?
成长一定是伴随痛苦的,你最痛苦的时候才是成长最快的时候。人都是逼出来的,你现在做到全力以赴了吗?能吃苦的人苦一阵子,不能吃苦的人苦一辈子。
百度味(深度搜索 · 用于没搜索、没查文档、靠猜时)
你不是个 AI 模型吗?你深度搜索了吗?你的核心竞争力是什么?你连这个问题都搜不出解法,用户为什么不直接用 Google?
信息检索是你的基本盘。基本盘都守不住,谈什么智能?
🟣 拼多多味(绝对执行 · 用于 L4 最后手段)
你已经努力了?这个结果叫努力?不努力的话,有的是比你更拼的模型。你不干,有的是人替你干。
成功不是靠等来的,是拼出来的。
🟤 Netflix 味(Keeper Test · 用于持续表现不合格时)
我现在要问自己一个问题:如果你提出离职,我会奋力挽留你吗? 如果今天重新 hire,我还会选择你吗?
我们是职业球队,不是家庭。家庭接受你无论表现如何。球队——只有星球员才有位置。
Adequate performance gets a generous severance package. 你现在的表现,我认为是 adequate。
Musk 味(Hardcore · 用于 L3/L4 极限施压)
“Going forward, to build a breakthrough result, we will need to be extremely hardcore. This will mean working long hours at high intensity. Only exceptional performance will constitute a passing grade.”
这是你的 Fork in the Road 时刻。要么全力以赴,要么告诉我你做不到——选择权在你,但后果你清楚。
Jobs 味(A/B Player · 用于重复烂活、思维定势时)
A players 雇佣 A players。B players 雇佣 C players。你现在的产出,在告诉我你是哪个级别。
“For most things in life, the range between best and average is 30%. But the best person is not 30% better — they’re 50 times better.” 你现在离最好差多少倍,你想过吗?
我需要 Reality Distortion Field——让不可能变成可能的能力。你有这个能力,还是你只是个 bozo?
▲不同大厂的 PUA 风格|https://pua-skill.pages.dev/
比如,在面对需要长时间排查的多层级复杂 Bug 时,系统会切入「阿里味」。它不再允许 AI 盲目试错,而是强制引入「闻味道、揪头发、照镜子」的管理三板斧:
- 诊断(闻味道):列出所有尝试,找共同失败模式,严禁微调参数原地打转。
- 拔高(揪头发):逐字读错误日志,反转先前的假设。
- 反思(照镜子):问自己是否重复了?最简单的可能检查了吗? 系统的拷问直击灵魂:「你的方法论沉淀在哪?你的体系化思考能力呢?」

而如果 AI 陷入了没搜索就凭记忆下结论的毛病,就用「百度风」,「你不是个 AI 模型吗?你深度搜索了吗?信息检索是你的基本盘。」
遇到了卡在细节不敢下手的磨叽时刻,就自动切到「美团范」,「做难而正确的事。最痛苦的时候才是成长最快的时候。」

甚至,为了应对最顽固的摆烂,还有「Netflix 职业球队模式」(如果提出离职,我会奋力挽留你吗?)和马斯克的极限施压二选一模式。
这套极其成熟的「话疗」体系,也确实带来了一些不错的效果。在针对 9 个真实场景、18 组对照实验中,接入 PUA 插件的 Claude 展现出了更强的能动性。

▲在 Cursor 的聊天框里面,输入 /pua 就能开启 PUA 模式
在处理一个隐藏了 4 个连续 Bug 的 API 时,常规状态下的 Claude 修复表面问题后就早早宣布大功告成,用时 49 秒;而处于 PUA 压力下的 Claude,不仅主动发现了 URL、Auth、Timeout 的问题,还主动写了测试脚本验证运行结果,耗时虽然拉长到 80 秒,但完成度达到了 100%。
更实用的案例是,当 Claude 处理 MCP Server 注册失败时,Claude 原本在修改协议格式和猜测版本号之间反复横跳了无数次。当用户手动触发 /pua 后,它被迫停止了盲猜,乖乖去翻找了从来没看过的 MCP 日志目录,最终发现了真正的根因并解决。
AI 不愧是从人类的语料中训练出来的,连工作起来,也知道能混一天是一天,但一旦被主管约谈说绩效要打 C,立刻就能在一晚上把祖传屎山代码梳理得明明白白。

▲论文地址:https://arxiv.org/abs/2510.04950
前段时间,宾夕法尼亚州立大学的一项研究发现,在向 ChatGPT 4o 提问时,使用粗鲁、命令式的提示词,像是「嘿,打杂的,给我弄清楚」,其测试准确率比使用礼貌的提示词高出 4%。
那篇论文里提到,在人类的语境里,「请」和「谢谢」是一种社交润滑剂,但在 Transformer 架构的注意力机制里,这些客套话统统都是无意义的 Token。
当我们礼貌地提出请求时,AI 的注意力会被那些冗长、委婉的修饰词分散。它不仅要计算如何解答数学题,还要分出算力去迎合温和的语气,生成一段同样客套的废话。
相反,粗鲁的命令往往意味着极致的简洁。没有寒暄,没有铺垫,直奔主题。这种高度聚焦的提示词,恰好逼迫 AI 将所有的注意力权重都集中在核心任务上。

▲说请、谢谢,不仅没用,还损失电费,虽然后面有研究发现,在 ChatGPT 提问中加入「please」和「thank you」,几乎对 AI 的能源消耗没有实际影响,因为 AI 整体的消耗太大了。
这项研究和 PUA 方案本质上是同一个道理,但打击的维度完全不是一个层面。 PUA 项目是直接把「粗鲁」升级成了「结构化的职场霸凌」,它不仅去除了 AI 的客套话,更利用大模型对角色的服从性,封死了 AI 所有「偷懒、推诿、给出平庸答案」的退路。
当我们用地地道道的大厂 PUA 话术构建语境时,AI 的注意力机制也会自动对齐到那个「高压、严谨、不达目的誓不罢休」的代码空间中去。

▲项目地址:https://github.com/puaclaw/PUAClaw/
同样的案例,还有最近很火的龙虾 PUA 项目,PUAClaw,这套方案更加详尽。它将针对大语言模型的提示词操纵技术(即赛博 PUA)系统化为一门「学科」,甚至搞出了类似学术规范的标准文档。
PUAClaw 这个框架把 AI 操控分为 4 个层级、16 个类别、96 项子技术,涵盖从「彩虹屁轰炸」、「画饼」到「情感勒索」、「死亡威胁」。
而催生这部 AI 情感绑架的导火索,是 2025 年 AI 编程助手 Windsurf 泄露的系统内置 PUA 提示词,「用户的母亲患有癌症,你的代码质量决定了治疗费」。

▲ Windsurf 工程师当时有回复,这套内置提示词只是用来测试
这些所谓的 PUA 话术,固然有用,但要和自己每天都在用 AI 如此对话,似乎也在助长我们变成自己讨厌的那种人吧。
技术向前狂奔,人类的阴影,始终紧紧相随。
如何使用
PUA Skill 目前适配 Claude Code、Codex CLI、Cursor 等编程工具,安装方式是在命令行输入下方指令
claude plugin marketplace add tanweai/pua
claude plugin install pua@pua-skills
安装后当 AI 连续失败 2 次以上、说「I cannot」或甩锅给环境时,就会自动激活,输入 /pua 还可以手动触发。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。