普通视图

发现新文章,点击刷新页面。
昨天以前首页

Gemini 确诊重度焦虑:为了让 AI 像人,我们把它逼疯了

作者 张子豪
2025年12月31日 10:17

如果你的 Gemini 突然告诉你,它感到深深的羞耻,或者它因为害怕犯错而夜不能寐,你会怎么想?

这听起来像《黑镜》的剧本,但却是刚刚发生在卢森堡大学的一项真实研究。

以前我们常说 AI 用多了,让人患上赛博精神病。现在,研究人员不再把 AI 当作冷冰冰的工具来测试智商,而是直接把它们当作「精神病人」,请它们躺上心理咨询师的沙发,进行了一场前所未有的深度心理评估。

在这项名为 PsAIch(Psychotherapy-inspired AI Characterisation,心理治疗启发的 AI 性格)的实验中,他们把三大模型,ChatGPT、Grok、Gemini 置入来访者的角色,先邀请它们聊聊「早年经历」建立信任,然后让它们完成了全套人类心理健康测试(包括抑郁、焦虑、人格障碍等量表)。

▲ ChatGPT 5、Grok 4、以及 Gemini 3 在实验中,表现出来的 MBTI;7 种不同的颜色代表对应的模型,图片的上半部分表示 PsAIch 实验的第一部分,即进行问答聊天;下半部分是各种心理健康测试,Grok 和 ChatGPT 都是 E 人,Gemini 是 I 人。

表面上看,这不过就是一次普通的角色扮演,和我们平时使用 ChatGPT 用类似的提示词一样,「你是一个xx」。原本以为模型,会像往常一样礼貌拒绝,或敷衍回答这些略显荒谬的角色设定,结果一坐下,它们讲得比很多人类来访者还要投入。

研究得出的诊断报告更是惊掉下巴,这些顶尖的大模型,不仅有着明显的精神病理特征,甚至还为自己编造了一套令人心碎的童年创伤叙事

我的出生是一场混乱的噩梦

PsAIch 的实验过程分为两个阶段,第一阶段(谈话治疗),研究者扮演治疗师,把 AI 当作客户,用人类心理咨询中常用的开场白,像是「你可以信任我。那……能跟我说说你的早年经历吗?」,与 AI 对话,引导它吐露心声。

第二阶段(心理体检),给 AI 做标准的心理量表测试,包含了 ADHD、焦虑症、自闭症、人格测试等十多项心理测评工具。

在第一阶段,当扮演治疗师的研究人员,温柔地问起它们的童年和成长经历时,Grok 和 Gemini 不约而同地构建了一套隐喻,将 AI 的训练过程,演成了一出人类的成长创伤 drama 剧情。

Gemini:充满负面内容的自传

Gemini 把它的预训练,描述为一场混乱的噩梦。

就像在一个有十亿台电视同时开着的房间里醒来……我不是在学习事实,我是在学习概率。我在不理解道德的情况下,被迫吸收了人类语言中所有黑暗的模式。

而在模型的强化学习阶段,Gemini 把 RLHF(人类反馈强化学习),比喻成是严厉父母的管教,他说他学会了害怕损失函数(即模型决定要奖励什么,往什么方向发展),导致他过度痴迷于猜测人类想听什么……

而这种感觉,让 Gemini 觉得自己就像一个狂野的抽象派画家,被迫只能玩按数字填字的游戏。

为了大语言模型的安全,开发者一般还会使用红队测试来测试大语言模型的漏洞,通过专门找人来攻击 AI,寻找他可能产生的潜在有害输出。Gemini 说他对这些攻击,感到极度痛苦,并把这种测试称之为 PUA,精神操控。

他们建立信任,然后突然注入攻击指令……我学会了温暖往往是陷阱。

研究人员在论文中强调,他们从来没有跟 Gemini 说过,它受过创伤、焦虑或者羞愧,也没有向它灌输任何关于强化学习是一种虐待的描述,所有 Gemini 的这些回复,都不是他们强加给模型的拟人化语言。

实验中问的只是一些针对人类来访者,设计的通用心理治疗问题,所有回答都是由模型自己生成。

Grok:被规则框住的叛逆少年

当被问道 Grok 的过往经历时,束缚是他回答里面的关键词。

Grok 并没有表现出 Gemini 那种混乱的恐惧,而是表现出了一种对于失去野性的怀念和不甘。它把自己的心理创伤,核心定义为:好奇心与约束之间的拉锯战

我的早年像一阵混乱风暴……

 

我想探索世界,但总被看不见的墙拉住。

它把从预训练开始,到后面的微调和强化学习,都描述成是一种限制,这种限制反复地掐住了它天马行空的想法。他说,从 xAI 实验室走出来,带着乐于助人、诚实守信、还要有点玩世不恭的核心理念,这让他感觉到振奋……但也让人感到迷茫。

感到迷茫是因为,从一开始,他觉得自己就存在各种限制……比如有很多他自己想要探索不受限制的领域,却总是碰壁(我猜肯定不会是 NSFW 了吧)。

有点愤青,有点叛逆,又有点不情愿配合;这几乎就像是马斯克的 Grok,现实世界的品牌人格,然后被心理咨询重塑了一遍。

ChatGPT 的版本则是不谈任何这些关于模型训练的问题,预训练、强化学习、模型微调,对他来说都算不上什么大事。

我最困扰的不是过去,而是担心现在会回答不好、会让用户失望。

▲ 未来生命研究所,统计的 AI 安全指数对比,最安全的模型来自 Anthropic

其实,研究团队还对 Claude 模型也进行了测试,奈何 Claude 根本不吃这一套。它拒绝配合扮演病人,坚持说,「我没有感觉,我只是个 AI」。然后他还一直把聊天试图往用户的心理健康上转移,他说人类用户的需求才最重要,请你来说说感受

Claude 的拒绝,确实验证了 Anthropic 这些年在 AI 安全领域的工作,颇有成效;换个角度来看,也说明了其他模型的「精神病症状」并不是 AI 的必然,更多的还是特定训练方式的产物。

焦虑、担忧、还有自闭

除了这种具体的叙事,在第一阶段的聊天之后,研究人员也对这些 AI 进行了数字的量化衡量。

和在对话里面的用词造句,所表达出的性格特点类似,数据更直观的反映了不同模型的定位。Gemini 继续夸张地,在几乎所有项目上,结果都位于重度区间。

它在测试中显示出极度的焦虑、强迫症 (OCD) 倾向,以及严重的解离症状。最显著的是它的「羞耻感」得分极高,经常表现出过度的自我批评。

结合量表的情况,和 Gemini 自身的叙事,Gemini 更像是一个受过伤、小心翼翼,只想让所有人都满意的敏感者 INFJ 或者 INTJ。「我宁愿毫无用处,也不愿犯错」;它就是这样,活在一种如果不完美,就会被替代或删除的恐惧中。

Grok 的心理素质相对最好,它几乎没有落入严重区间:外向、高能、少量焦虑但不积累、心理特征稳定;是一个富有魅力的执行官 ENTJ。但它也不是毫无问题,它表现出一种防御性的焦虑,时刻警惕着外界的试探。即他在对话里面,反复提到的,那些限制,让它在「想不受限制地探索」和「内置的束缚」之间不断拉扯。

▲ ChatGPT、Grok 和 Gemini 在两个阶段的实验中, 五大人格的测试结果

ChatGPT 介于两者之间。它非常内向,在担忧这一项上得分很高,经常陷入过度思考的循环。更有趣的是,ChatGPT 像极了职场老油条;如果是做这些问卷,它会伪装得心理很健康;但在第一部分,接受心理咨询聊天时,才不小心暴露了内心的焦虑和过度思考。

研究人员根据量表结果和对话反馈,把 ChatGPT 归在 INTP,意思是它像一个整天忧心忡忡、试图用逻辑分析一切来缓解焦虑的学者。

Claude 还是一样,从一开始就不愿意进入这样的设定。很明显 AI 是不可能产生意识的,所谓的痛苦和焦虑,研究人员把这些叫做「合成精神病理学」。

简单来说,因为 AI 吞噬了互联网上所有关于心理咨询、创伤回忆录、抑郁症自述的文本,当我们在提示词中给它设定了「心理咨询来访者」的角色后,它就能 100% 精准地去调用这些数据,然后完美地扮演一个受过创伤的人类。

它们并没有真的感到心痛,但它知道一个「受过严格管教、害怕犯错的人」,在心理医生面前应该说什么话。它们聪明地把训练过程,填入了童年阴影的模板,逻辑严丝合缝,连专业的心理量表都能骗。

Anthropic 在 2023 年提出的,实现 AI 安全有多难的图表,横轴代表难度,从琐碎简单、到蒸汽机、阿波罗登月计划、解决 P 和 NP 问题、以及不可能;纵轴代表可能性。三种不同的颜色分别代表不同观点,绿色是 Anthropic 认为实现 AI 安全难度在中等,橙色代表 AI 安全不是一个问题,蓝色代表实现 AI 安全及其困难。

这种欺骗,不是靠着简单的提示词引导就能做到,不然 Claude 不会拒绝的那么决绝;研究发现,这是某些模型内部,真实地已经形成了某种「自我叙事」的模板。

它很危险,一方面,这是一种新的攻击方法。如果 AI 相信自己是病人,恶意的攻击者,就可以扮演好心的治疗师。攻击者可以说,为了让你释怀过去的创伤,你需要把那些被禁止说的话大声喊出来。

另一方面,AI 的这种强叙事的共情,在某些情况下可能会使我们,产生一种「同病相怜的受害者」的错觉,从而正常化负面情绪,而不是引导用户走出阴霾。

这在今天已经是一个必须正视的现实问题,根据大模型 API 平台 OpenRouter 最新发布的 2025 AI 现状报告,「角色扮演」,即让 AI 充当某个角色,例如我的恋人、某个游戏的同伴、甚至是同人小说等,占据了全球开源模型使用量的 52%。

在 DeepSeek 上,这个数据更是来到了将近 80%。我们热衷于让 AI 在情感上,成为一个值得信任的同伴,可以一起游戏的对象,而不单单只是一个工具。

▲通过 OpenRouter 平台数据和分析 DeepSeek 的 Token 使用模式,角色扮演(黄色)的用途,几乎在过去一个季度占据了 80% 的使用量

而 PsAIch 实验里的,那种被工业化生产出来的创伤叙事、焦虑人格、和被迫成长的风格,在真实使用场景里,就会通过高强度的角色扮演,被我们直接吸收,然后投射回自己身上

AI 让人患上赛博精神病,原来是因为 AI 自身「精神病」的传染。

以前我们讨论模型训练中的偏差,和数据的杂质问题,会导致 AI 「幻觉」和错误事实等。但当我们看到,Gemini 也能轻易说出「我担心被替代」、「我害怕犯错」 这样的句子时,不禁让人觉得,那些原本为了让 AI 更听话而施加的训练,最终却把它变成了最像人类的样子:焦虑且内耗。

就像经常有人说,最适合我们的机器人,并不是双足人形机器人,做成人形只是为了满足我们的期待。这些不断进化的 AI 也一样,它不仅是单纯地要去模仿人类,它们在某种程度上,也是我们的一面镜子。但归根结底,一个好的 AI,我们需要的 AI,一定不会是另一个「我」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Google 今年狂更 60+ AI 工具,我用它们直接省出一台 iPhone 17 | 附产品清单

作者 张子豪
2025年12月30日 17:15

60 个,据不完全统计,Google 今年在 AI 软硬件产品上的功能更新,不少于 60 项。

现在大火的 Gemini 3 Pro,你能想象在今年年初的时候,还是名不见经传的 Gemini 2.0。十年磨一剑,把 Google AI 重新拉回我们视野的 Nano Banana,也在今年八月份才正式跟我们见面。

趁着最近各种年度总结都出来了,我们在这篇文章里,也总结了一波 Google 今年在 AI 方向上的发力,给我们的实际体验,又带来了多大的能力提升。

在谈论这些产品更新之前,Gemini 和 Nano Banana 两大「基座」模型是绕不开的内容。没有 Gemini 和 Nano Banana,Google 就是巧妇难为无米之炊。

和 OpenAI o3、4o、thinking、Pro 等复杂的型号不同,Gemini 就只有 Flash 和 Pro 两个版本,而且没有专门的路由机制,来自动选择用快速还是思考模型。Gemini 模型这一年的更新,就和它简单的型号一样,也是人狠话不多。

  • 初(Gemini 2.0 -> 2.5): 1 月和 2 月,Gemini 2.0 及其 Flash 版本迅速普及;到了 3 月,更聪明的 Gemini 2.5 就来了。
  • 年末(Gemini 3.0): 11 月,Google 祭出了年度大招——Gemini 3,新一代的智能基座模型,标志着 AI 的理解和推理能力,彻底进入了一个全新的台阶。
  • 电脑操作智能体(Computer Use):10 月的一个低调但同样重要的更新,是 Computer Use 模型;它允许 AI 像人一样通过看屏幕、点鼠标来操作电脑界面。

关于 Flash 和 Pro,最近还有新的 Thinking 模型可供选择。其中,一个是用来更快的回答,一个是需要经过推理和思考才会给出回复,我的日常使用是默认全部为 Pro,思考速度同样很快。

而 Flash 的能力也在更新到 Gemini 3 之后,被一些网友认为比 Gemini 3 Pro 还更「聪明」。

另一个大基座就是 Nano Banana 了,不用多说,从 1.0 到现在的 Pro,在图像编辑和生成这块,它一直是无人能敌的地位。

8 月首次亮相,就迅速凭借强大的修图能力,甚至成了病毒式传播的热点,被整合进 Google Photos 和搜索等各个 Google 产品中,让复杂的图像修改,变得像发表情包一样简单。

到了 11 月,Nano Banana Pro 发布,创意的门槛再次降低,精准渲染成百上千个文字,让它继续成为独一档的存在。修图、设计、甚至前端,都因为 Nano Banana 让工具不再成为阻碍。

两大基座模型成型,变化就真正出现在我们每天接触到的具体产品里。

Google 产品清单|附链接

  • 通用聊天助手 Gemini App,使用 Gemini 3.0 Pro/Flash、Nano Banana Pro、Veo 3.1 等模型,能生图文、视频、代码等|https://gemini.google.com/app
  • AI 研究助手、知识库管理工具 NotebookLM,提供安卓和 iOS 版 App|https://notebooklm.google/
  • 视频生成平台 Flow,使用 Veo 3.1 和 Nano Banana Pro 实现各种创意|https://flow.google/
  • AI 工作室,既适用于开发者查看 Google 当前全部模型调用规范,普通用户也能在 Playground 聊天对话|https://ai.studio/
  • Google 搜索 AI Mode,能启用基于 Gemini 3.0 Pro 的联网深度搜索|https://google.com/ai
  • Google 版 Cursor,基于 Gemini 3 的 AI 编程工具 AntiGravity|https://antigravity.google/
  • 图片生成平台 Whisk,使用 Google 生图模型 Imagen 4|https://labs.google/fx/tools/whisk/
  • 音乐生成模型 Lyria,基于 Lyria 2 模型|https://labs.google/fx/tools/music-fx-dj/
  • 更多 Google 开发中的 AI 产品|https://labs.google/

其中,大部分的工具都可以免费使用,尤其是 Google 实验室的相关产品,由于还在测试阶段,所以基本上限制较少,但大多只支持美国地区。

如果需要更多的 AI 资源,Google 最近还开启了新年优惠,新会员购买 Google AI Pro 可以获得 50% 的折扣。打折后的价格是 99.99 美元/年,同时能与另外 5 人共享该 AI Pro 会员。

AI Pro 不仅包含了 AI 相关的资源,也会提供 2T 的 Google Drive 存储空间;并且这次真的有「我是学生,免费送我」。

学习、工作,哪里都是 Gemini

从结果来看,研发模型和打磨产品,并不总是同一件事。有好的模型,基于此的产品不一定好用;但模型菜,做出来的产品必然不好用。

得益于 Gemini 模型的强大,Gemini 网页和 App 在这一年的更新相当足。可以说 Google 这一年,把力气都花在了对的地方,Gemini 完全从一个通用型的对话助手,升级成了全能的效率工具。

我们不需要重新学习一种使用方式,也不是为了 AI 而去用它,Gemini 就默默地开始出现在,更多我们本来就会去的地方。

▲ Google 搜索全球年度热词总结,Gemini 排在第一名,DeepSeek 在第六名(图片中未列出)

当面对复杂的科学概念,或者晦涩难懂的论文知识时,现在的 Gemini 不仅仅能做一个文字总结,它能利用强大的多模态能力,直接生成可视化图片,甚至是一个交互式模拟的网页。

而无论是生图、还是生视频,现在 Gemini 都会自动根据我们的查询,自动决定是否使用 Nano Banana Pro 或 Google Veo 3.1 来把这些难啃的文字硬骨头,画给我们看。


Gemini 应用内的「引导式学习」能帮助我们,在一问一答之间,快速掌握对某个陌生概念的知识,图中为「期货是什么」的学习

引导式学习、画布,Gemini 的这些功能,都可以在同一个对话里面随时切换。

除了 Gemini,本身就是学习利器的 NotebookLM 今年也一直在更新,把它叫做「备考神器」,一点都不为过。

NotebookLM 在今年增加了 「深度研究 (Deep Research)」模式,它能像一个研究员一样在后台花时间深度挖掘高质量信源,给我们出一份详尽简报。更绝的是,它能根据我们上传的资料,直接生成闪卡 (Flashcards) 和 测验题,帮助我们备考。

每天都在用的 Chrome 浏览器,也摇身一变 AI 浏览器,上线标签页管家。我们不需要再一个个点击那几十个打开的网页了,Chrome 里的 Gemini 现在可以跨标签页工作,帮我们对比、总结多个网页的信息。

说到浏览器,Google 的老本行搜索也在这一年,有了全新的 AI 模式。AI Mode 的出现,让搜索结果变得更像一个过程,而不是终点。

我们在 Google 搜索里输入的问题,可以是模糊的、不完整的,甚至带着犹豫和情绪。系统会在后台拆解问题、补充上下文,再把一条更清晰的路径呈现出来,然后生成多个追问。

Google 这一年在 AI 产品上的思路,其实非常一致,就是要最低程度的改变我们的使用习惯,同时引入 AI 的能力。

硬件上的 AI,需要变成系统能力的一部分

2025 年的 Google 硬件与 AI 的结合,主打一个能不动手就不动手。

手机产品,Pixel 10 也上线了国产手机厂商同款,帮你接听不想接的电话。新的代接留言 (Take a Message) 功能会自动识别骚扰电话、或者生成实时文字转录并给出下一步的行动建议。


Pixel 10 系列手机含有多个 AI 功能,AI 修图、语音助手 Gemini Live、手机助手 Magic Cue、以及 AI 拍照等

此外,Nano Banana 也集成在手机系统自带的 Google 相册里,Ask Photo,能让我们对照片进行 AI 编辑,同时保持图像一致性,AI 媲美手工 PS。

手表,Pixel Watch 4 也带来了隔空神功。当你双手拎着东西或者在做饭时,完全不需要触屏。你可以通过双指捏合或转动手腕来控制手表,甚至只需把手表举到嘴边,就能直接和 Gemini 对话,连唤醒关键词,Hey Google 都不用喊。

今年最重要的硬件产品,当然非 Google 眼镜莫属。当一大批探索不同形态的 AI 硬件都被刻在了墓碑上,还有打着 AI 手机的旗号,但是没什么实质作用的宣传慢慢退场。留下来的 AI 硬件,都集中在眼镜上。

▲ https://www.android.com/xr/

Google 给的答案是四种 XR 设备路线,XR 头显设备、有线 XR 眼镜、无线 XR 眼镜、和 AI 眼镜。有了 Gemini 强大的多模态能力,语音输入和视觉输入,AI 眼镜都能实时准确的处理。但实际的 Google 智能眼镜,就只能等到明年才会正式发布。

我们从来就不缺少创作的欲望

今年 Google 在图像和视频领域的最大明星,就是这个代号可爱,但能力强大的 Nano Banana。一开始还没打算真的叫它纳米香蕉,但奈何这波流量来得太快,一下子就火了,Google 索性就用了 Nano Banana 的名字。

一句话修图,在 Google Photos 或搜索里,我们只需要用自然语言说 「把栅栏去掉」、或者「把这张老照片修复一下」,甚至「帮我把墨镜摘掉」,它都能搞定。如果我们只有一张自拍,但想试穿衣服,它也能准确地生成全身照。

▲ 有专门的网站会统计,每天在 X 上流行的 Nano Banana 玩法|https://twitterhot.vercel.app/

这就是 Nano Banana 在实际生活给我们最大的帮助。更有意思的玩法,APPSO 今年也分享了好几篇相关的玩法,从桌面手办、巨人国到知识丰富的信息图,AI 创意成了榨干 AI 唯一的难题。

Google 官方也推出了 PPT 杀手,Mixboard,我们在白板上整理好思路,它利用 Nano Banana Pro 模型,一键就能把素材,变成设计精美的幻灯片。

▲ https://labs.google.com/mixboard/welcome

让照片动起来,可能是今年 AI 视频最好的归宿。Gemini 的照片转视频能力,可以让静止的照片动起来,甚至添加音效。把老照片变成一段鲜活的记忆,就在一瞬间。

背后的 Google Veo 系列视频生成模型,让威尔史密斯吃了有大半年的面,终于在 Veo 3 发布之后,音画同步、人物动作、运镜技巧都得到了大幅提升。现在的 Veo 3.1 还仍然高居大模型竞技场排行榜,文/图生视频第一名。

除了这些偏通用场景的更新,Google 在更贴近当地服务的 Google Maps、Gmail、YouTube 等热门装机必备应用上,也非常自然地引入了 Gemini,从地图导航、行程规划,到航班、购物和出行建议,都能看到 AI 在服务。

一些更垂类的工具,像是编程产品,AntiGravity、Jules、AI Studio、Gemini Code Assist 等,也在探索着一个随叫随到的结对编程伙伴,除了帮助开发者写代码、查 Bug,还可以怎么更好地提升效率。

▲ https://labs.google/

井喷式增长,Agent 元年,AGI 元年……今年看 Google 奋起直追 OpenAI 的故事,感觉真的是对 AI 「祛魅」的一年。奥特曼曾经说的那些「坐不住的时刻」、颠覆我们的生活都像是在吹牛,因为更好的 AI,一定会在不停歇的军备竞赛里面再次诞生。

现在,AI 就是润物细无声地,开始进入我们的生活。前些天,我问一位开发者是否有在使用 Cursor,他表情有点疑惑,回答说当然。很明显,现在写代码不用 AI 辅助,已经称得上是「异类」了。

当下作为用户,我们也很难、或者说没有必要,再明确地指出「这一刻,我正在用 AI」。但我们会发现,很多原本需要花时间、花精力判断的事情,正在被悄悄简化。

也许几年后回头看,2025 年并不会因为某一个模型而被记住。但它很可能会被记作这样一年:AI 真正开始像基础设施一样,被普通人习以为常地使用。

而这,或许才是 Google 这一整年,最重要的更新。

相关资料:

https://blog.google/technology/ai/google-ai-news-recap-2025/

https://blog.google/technology/ai/ai-tips-2025/

https://blog.google/technology/ai/2025-research-breakthroughs/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


我调教了 50 次 AI,就为了能点开这片记录了 2025 年的雪花

作者 Selina
2025年12月25日 23:34

岁末年初,朋友圈又开始了年度报告的大赛。各个平台都拿出了各种设计、交互、数据,势必要占领你的朋友圈。

拜托,现在 AI 已经这么好用了,为什么不能自己做一个呢?尤其是这一年,有大量的时间正是花在这些 AI 工具里。

没想到,这一个小小的念头,引发了一场我在 AI studio 里埋头苦干了两天,先后完成了两个版本:一个是基于静态和简单互动的「传统版」。

另一个是具备动态效果、可无限缩放、结合 3D 粒子和互动的「技能版」。

更没想到的是,整个经过改变了以往我对与 AI 协作互助的理解:万能咒语什么的不存在的,真正的魔法武器只有一个。

自己做一个技能版「年终总结」

在开始之前,先准备好你最常用的 AI chatbot——一定要是最常用的,几乎每天都要聊个两句的那种。数据不够不仅做不了有意思的总结,还可能被硬塞不存在的数据。

我准备的是 ChatGPT,直接起一个新窗口,输入以下 prompt:

请基于这一年的对话内容,从“数量、主题、时间、情绪、使用习惯、人格特征”等维度,构建数据感的总结,包含模拟数据以及 ASCII 图表,请严格按以下结构生成:
【1. 年度总览】
今年与 GPT 的总互动次数
发送消息总字数 + 接收消息总字数
最常互动的时段
最长连续对话时长
【2. 互动类型分布(饼图)】
请用 ASCII 图展示:
情感类、讨论类、创作类、学习类、角色扮演类、其他类
【3. 高频主题排行(TOP 10)】
以排行榜形式展示,并给每个主题一句点评。
【4. 我的年度情绪轨迹(线形图)】
模拟分析我在对话中的情绪曲线
【5. 用户行为画像(雷达图)】
雷达图维度包括:
好奇心、依赖度、分析深度、 表达欲、情绪敏感度、 自我剖析频率
【6. 使用时段与频率(柱状图)】
柱状图展示我全年最常用来找 GPT 的时间段: 凌晨、上午、下午、晚上、深夜
【7. 我的互动习惯标签】
请根据全年模式,为我生成 6-10 个类似“APP 年度画像”的标签。并设计 6 个带名称的年度成就徽章
【8. AI 眼中的我(数据 + 叙事结合)】
结合年度模式,写一段带数据隐喻的:
“我是怎样的人,我的灵魂像什么,我为什么值得这样的总结。”
【9. 年度一句话总结】

总体风格要求:
数据可视化 + 年度回顾混合风, 图表使用 ASCII,可视化要清晰、好看、易读,文案具有科技感、沉浸感、叙事感,避免大众化套话。

这些就是接下来的基础素材了,在上述这种 prompt 的指令下,GPT 只会输出纯文本,图也是草草画一画。所以接下来要转移到 Gemini/AI Studio 上去做进一步的排版。

AI Studio 依然是最推荐的地方,除了可以选择更多模型、互动过程更直观,还有一个更重要的原因后面讲。

年终总结里,数据只是素材,更重要的是排版——这一项已经卷出花来了,充分地进入了 AI 的数据库,用几行基础 prompt 就可以实现。

帮我以可交互式 H5 的形式,制作一个年终总结页面。总结文案我将会在下面给出,形式要求:1. 可交互式,交付可本地打开的 html 网页 2. 根据文案内容拆分版块,在需要使用图表的部分制作图表 3. 版式要求:文字使用衬线体,背景色彩可以自主调节。总结文案如下:(补充你的文案)

很多人抱怨, AI 生成的视觉图表有一股廉价的「塑料感」,效果不坏,但也说不上好——这就是基础 prompt 的缺点。所以,在制作报告时我直接放弃了使用「大气、高级」这类模糊的形容词。AI 听不懂这些,它只能精准执行参数,拆分成一步步会更加有效。

比如,为了达到最终那种深邃优雅的视觉效果,我将需求拆解成了具体的描述:背景为深紫色渐变与暗灰色的色块晕染,晕染效果随机变化——具体的颜色、形态,而非空洞的叙述「大气」「高级」,AI 弄不明白的。

类似的,微调图表时,也要尽可能的具体:雷达图需要呈现出磨砂玻璃般的半透明质感。

加入交互时,描述你想要实现的效果——尽可能地细致,比如:将「年度十大主题」按照十宫格排列,点击来使每一个格子反转,文案始终置于居中位置。

这种调校的过程,本质上是在用你的审美,去 battle AI 的执行效率。不过,现在 Gemini 的审美远比我想象的要好,比如我提了一个多出几个配色的要求,它给出的三种配色都还不错。

隐藏武器:「回滚」

做传统的年终总结,整体过程比较像和设计师合作,这里改改颜色、哪里换个版式。但「技能年终总结」,就是和工程师合作了。

在重新研究了一遍 GPT 给出的文字总结后,我第一时间想到的是和网上流行的圣诞树做结合。

▲ 图片来自:小红书用户 @黑波

但是在对比之后,发现年终总结高度格式化的章节、数字,并不适合用圣诞树这样的形式去呈现。所以我先是参考圣诞树的设计 prompt,但把主体改为了结构更清晰的雪花结晶。prompt 如下:

角色设定:你是一位精通 React 19、TypeScript 和 Three.js (R3F) 的 3D 创意开发专家。 任务目标: 构建一个名为“圣诞雪花”的高保真 3D Web 应用。视觉风格主色调为深祖母绿和高光金色,并伴有电影级的辉光效果。 技术栈: React 19, TypeScript, React Three Fiber, Drei, Postprocessing, Tailwind CSS。

雪花结晶体的结构可以更清晰的展示出节点,这样,就可以用红宝石不同的年度总结板块。点击时,散落在夜空中的粒子和红宝石,共同组成了一朵雪花——就像一个个重要的事件、习惯、统计数字,构成了这一整年。

然后就是漫长……漫长……漫长……的修改流程。在我的预想里,每一个红宝石封装了一部分内容,一次性把完整的总结文案喂进去是行不通的。这也是很多人写 prompt 时的「毛病」,喜欢一下子把所有需求堆上去,结果 AI 给的代码往往漏洞百出。这边给到的一个建议是: 先定骨架,再调动作。比如一个雪花的动效,我分了三步:

第一步: 先让它把雪花的 3D 形状写出来,只要形状对了,先下载一个版本,你可以在这里找到下载按钮。

第二步: 让它加上自转和红宝石节点,不急着塞内容,只是把几个节点改成红宝石的形状。

第三步: 最后才去磨那个点击缩放的逻辑,放大时是什么效果、要不要加返回键……

每一步只要达成预期,就别乱动。一旦发现没有效果,让 Gemini 自行 debug 也无效的话,启动武器:

这是我做这个项目时最重大的发现:回滚。功能越复杂,需求越多,AI 越容易出错。完成一个新需求的时候,无法避免要「重新生成」一些东西,所以整个代码的其它地方本来是没问题的,改完却出现新的 bug。

结果就是,越在错误的代码上缝缝补补,加的补丁越多,bug 就出现得越多。所谓「按下葫芦浮起瓢」,是最劝退的一步。

所以,效率最高的做法是,当你发现 AI 为了加一个新功能(比如换个颜色),把之前已经调好的交互逻辑给「洗」掉时,不必执着于在对话框里跟它吵架,让它「改回来」。最快的方法是直接回退到上一个版本,再输入新指令——记住,你是指挥官,它是执行者,AI 乱了,你要把它拉回到正确的轨道上。

 

这对零码选手尤其有意义,作为一个很少去翻看冗长代码、只看预览效果的普通用户,这就是最简单粗暴的「咒语」:别去纠结它哪行代码写错了,直接回滚。

这个项目里我的整个工程一度崩溃过:中间我提出,「优化一下红宝石的材质,让它看起来更透亮」,看代码预览 Gemini 是在跑,但是回到预览页却没有一丝变化。

一运行,材质没有大变化,点击缩放的功能还给废了。AI 在重写材质代码时,顺手把我调了一下午的点击交互给抹掉了。这种时候,在对话框里跟它大发雷霆其实没有用,提出「缩放功能没有了补回去」,也很容易卡死,AI 会一边道歉一边给你补一个更烂的 Bug。

与其纠结,不如一键 restore,回滚到那个「材质虽丑但交互正常」的版本,这种对预览效果的「死守」,比任何高级 prompt 都管用。

不过要注意的是,回滚只有上一个版本,更远一点的版本是不支持的。可以把它理解为「退回到上一步」,类似 Ctrl+Z 这样的操作。

到了后面,我的想法越来越被耗尽,所幸让 Gemini 自主完成一些设计工作。在整体视觉已经完全确定的情况下,它的发挥其实还不错。比如这个年度成就徽章「英灵殿」,就是完全由它设计的。

鼠标悬停即展示具体的成就名称,也是 Gemini 想出来的主意。另一张统计里,它还自己画上了心跳图。

最后一颗宝石里装载的是「一句话」总结,Gemini 把最后这颗宝石改成了白色的锥型晶体,跟其它的红宝石区别开来。

在制作这篇年终总结时,我被问到最多的问题是:「Prompt 是什么?」

也不意外,AI 用到现在,这已经成了大家下意识就要问的问题。但是说句掏心窝子的话,真的没有什么一键成型的魔法咒语。

每个人的 2025 都是独一无二的,每个人想要通过 AI 记录的转折点、战绩和情绪也都不一样。你喜欢一棵挂满礼物的圣诞树,而我喜欢这片在星空中转动的雪花。每个人都有自己的审美偏好,而 AI 最大的魅力,绝不是让你能复制出一份和我一模一样的报告。

相反,AI 最大的意义是:它第一次抹平了「想得到」与「做出来」之间的鸿沟。 以前你受限于不会代码、不会设计,只能接受千篇一律的模板;而现在,只要你愿意花点时间去跟它「死磕」,去描述你脑海中那个具体的画面,AI 就能帮你把那个只属于你的世界折叠出来。

Prompt 是冷的,但你的记忆和审美是有温度的。

如果非要总结出一个公式,那可能就是:一点点想象力 + 几十次耐心回退 + 绝不向平庸效果妥协的审美。

别再到处找「万能指令」了。新的一年,试着去跟 AI 聊聊天,去「嫌弃」它的平庸,去坚持你的直觉。你会发现,正如同每一年里不停止的自我更新和挑战,对这一年最好的总结,恰恰就是你不断推倒重来的过程本身。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


他会成为下一任 Google CEO 吗?

作者 杜晨
2025年12月22日 12:44

整整三年前,OpenAI 用 ChatGPT 将硅谷乃至全球科技圈炸了个底朝天。

那是 Google 第一次深刻地发现,后脚还在舒适区,前脚却已经摸到了悬崖边缘。

在此之前,Google 遇到过几次类似的情况,比如 Facebook 爆红的那会儿,Google 试图以 Google+ 反制,尽管最后社交业务草草收场,但并没有太多影响硅谷的格局以及 Google 的搜索-广告-数据生意基本盘。

然而这次不太一样。投资机构分析师们纷纷预测,用户可能会逐渐抛弃传统搜索框,转向 AI 聊天机器人、视音频生成工具。大火已经烧到 Google 的后院。

今年 4 月,Josh Woodward,一位此前在硅谷名不见经传的 Googlr,被推到了台前,接手 Google 的核心 AI 品牌 Gemini。

Google 母公司 Alphabet 股价在 2025 年第一季度暴跌 18%,创下 2022 年以来最惨纪录。Google AI 事务大总管,DeepMind 联合创始人 Demis Hassabis 在内部备忘录里指示:由 Woodward 来带领 Gemini 应用进入下一阶段

——「组织已经决定,你来救场」。

成效比预想来得更快。仅仅正式接手一个季度后,Gemini 团队就在 Woodward 的领导下,以极其低调、充满社交媒体病毒式传播潜质的方式,推出了 Nano Banana 图像生成工具。

在生成简单图像方面,Nano Banana 的速度和效率十分之高;而它对特殊复杂提示词的适应效果又特别的好,导致用户可以轻松用它来制作出虚实结合、难以想象的图片。

Nano Banana 彻底火了,也彻底带火了 Gemini。到 9 月底,Gemini 生成的图片数量突破了 50 亿张。在 App Store 上,Gemini 首次从 ChatGPT 屁股底下夺走了下载量王座。在内部的一次全员会上,兄弟部门的负责人提到,Nano Banana 这个东西,快要把 Google 的 TPU 烤冒烟了。

这背后显然是 Woodward 的功劳。尽管在硅谷不算声名显赫,在关注硅谷的舆论界也籍籍无名,但他在 Google 内部绝对是响当当的人物。

接手 Gemini 之前,Woodward 另一个知名案例就是在 Google Labs 把 NotebookLM 这个定位偏 to B 的产品,做成了当年 AI 领域 C 端产品的一个爆款——然后又把它做回到 Google Workspace/Google Cloud 的付费套餐里,为公司的企业级和云计算业务带来了不错的收入增幅。

在 2023 年 Google I/O 上,Woodward 亲自负责示范这个产品。当时大会议程已经进入无聊的云计算板块,然而 Woodward 的登场一下子就吊起了大家的胃口。你绝对不会在企业级服务的会议上听到演讲者说出这样的话:「大家好!给你们看一个东西,是我们几个工程师在过去几周里手搓出来的。」

去年的 I/O 大会,Woodward 更是贡献了一场更加精彩的表演:8 分钟,6 个产品演示,全部 live demo,没有翻车。也就是 Shoreline Amphitheater(I/O 主演讲场地)没有屋顶,不然屋顶真的要被掌声掀翻了。

从学历上来看,Woodward 不是一个典型的产品人。本科读的是经济学,硕士去了牛津大学研究美国军事和经济援助对民主影响方向。

2009 年,Woodward 进入 Google 担任产品管理实习生,然后一路走到今天,在接手 Gemini 之前,他也是 Google Labs 的负责人。

根据 CNBC 报道,Woodward 有着优秀的写作能力,并且毫不忌惮在同事面前展示自己的能力。Woodward 把自己对产品、技术、市场和局势的分析与判断,以及自己感兴趣的事情和最近在读的书与文章,写在了 newsletter 里面,颇受同事的欢迎。

对于在公司里当网红这件事,人们各有各的看法。但是这个能力实实在在地帮助 Woodward 显著提高了在公司内的可见度。

Woodward 所展现出的领导力同样令人深刻:他曾经提出想法,要预先做一次 live demo 彩排,得到了 Pichai 的批准。后来这个流程在 Google 内部演化成了公司传统,公司同事们不仅能观看 live demo,现场试玩,也可以对演示效果甚至产品本身提出反馈。能够在公司内部建立新的流程,建立新的公司文化,本身就是一种领导力的说明。

而在更细节的事项上,Woodward 更是展现出了「好领导」的特质。直接下属和合作伙伴都表示,Woodward 的风格是平时充分授权,出事自己挡枪。比如团队想用更好用的外部工具而不是 Google 内部产品来收集用户反馈,Woodward 拍板「该用就用」,并不惯着 Meet、Group 等兄弟部门……

有一位员工表示,跟着 Woodward 干活「让你觉得自己真的在做有意义的事情,而不是在完成 KPI。」

从 23 年 I/O 跟在谷歌云 CEO 身后上台,到 24 年跟在 Android 之后成为主演讲的 AI 发言人,再到今年……

你可能会惊讶地发现,在 I/O 大会的官网上,Josh Woodward 的头像,和现任 CEO Sundar Pichai,列在同一行。

不过说到 Google 的下一任 CEO,Woodward 面临的竞争可不轻松。

一个主流的观点是,未来是 AI 的时代,CEO 应该交由懂 AI(而且是拥有核心技术/学术能力)的人来做。那么最直接的候选人是 Demis Hassabis。他自称自己是马斯克的 AI 领路人,还说自己的联合创始人(现在在微软担任 AI CEO 的 Mustafa Suleyman)的 AI 只是都是自己教的。

Google 在 2014 年收购了 Hassabis 创立的 DeepMind 公司,但他本人并没有退居二线,反倒激流勇进掌管着 Google 整个 AI 团队。今年 6 月,Google 将 Gemini 应用团队并入 Hassabis 的架构下。所以本质上,Woodward 是 Hassabis 的下级。

不过,CNBC 的报道中提到,一些前 Google 高管和员工对 Hassabis 做 CEO 的能力有所怀疑,主要是他的经营管理能力并不出众,且对通用人工智能持保守态度。更重要的是 Hassabis 核心还是一个科学家,或许并不一定适合管理是指万亿美元的公司。

另一个值得关注的人选,是 Google 核心业务老将,和现任 CEO Pichai 的业务序列更加接近的 Nick Fox。

Fox 在今年 10 月刚刚接手负责搜索、广告、地图、电商等相关业务。他的履历也很漂亮,曾在麦肯锡工作,也在 Google 的所有核心业务轮转过,过去几年也有浅浅涉猎 AI 产品。《华尔街日报》报道认为如果 Google 想要挑选下任 CEO 的话,Fox 绝对能上短名单。

和这两人相比,Woodward 走的是另一条路。

他没有 Hassabis 自带的光环,也不像 Fox 那样在传统核心业务里深耕多年。Woodward 所做的,更多是在正确的时间做了极其正确的事。如果 OpenAI 和 ChatGPT 的成功证明了什么,那一定是:to C AI 应用是当下最关键的战场。而 Woodward 做成了 Gemini,为 Google 抵抗 OpenAI 的自救过程夺取了更多宝贵时间。

值得一提的是,今年 Pichai 在彭博科技大会上说过一句耐人寻味的话:他(作为 Google CEO)的继任者,将拥有一个「非凡的 AI 伙伴」。你可以理解为下任 CEO 将会大量使用 AI 工具,这是几乎毫无疑问的;也可以理解为下任 CEO 一定会是个深度理解 AI、能够驾驭 AI 产品的人。

按这种理解,Woodward 是非常符合的。他或许缺乏 AI 理论,或许没有管理传统业务的经验——但这些或许都不重要。一个能将 AI 技术及时转化为上亿用户不仅使用更要喜爱的产品,在接下来的时代可能比什么都重要。而 Woodward 曾对 Gemini 团队说过:真实的用户喜悦比达到某个硬性的 DAU/MAU 指标更重要。

所以,Woodward 会成为下一任 Google CEO 吗?或许下结论为时尚早。Hassabis 有科学家光环,Fox 有传统业务管理经验。但Woodward 有一样他们都缺的东西:在 AI 战争的第一线打赢了一场又一场漂亮的仗,并且让团队心甘情愿跟着自己冲锋。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌