阅读视图

发现新文章,点击刷新页面。

干翻 ChatGPT,市值超苹果,这就是 AI 圈最大爽文

今天上午,智谱 以「全球大模型第一股」的身份登陆港交所主板,而几乎前后脚,远在大洋彼岸的 Google 母公司 Alphabet 股价逆市上涨 2.5%,市值攀升至 3.89 万亿美元,这是自 2019 年以来,其市值首次超过苹果。

两件看似独立的事,背后却指向同一个趋势:AI 带来的想象力,终究要回归到商业价值的验证上。其中,Google 的市值反超尤为值得关注——仅用三年时间完成了在 AI 赛道上的逆风翻盘。

究其原因,根据外媒多篇报道,我们也可以拆解出 Google 的 AI 三板斧:技术打底、资源合并、商业落地。三步环环相扣,构成了 Google AI 战略的完整闭环。

三年磨一剑,Google AI 实现逆风翻盘

Google 真正的转机,始于一次关键的内部资源整合。而这一切的基础,早在十多年前就已埋下伏笔。

2011 年,Google 成立了 Google Brain 研究部门,由计算机科学家杰夫·迪恩(Jeff Dean)联合创办。这个部门研发的神经网络技术,后来成为所有大型语言模型的核心底层支撑,为 Google 的 AI 布局打下了坚实的技术基础。

数年后,Google 收购了位于伦敦的 AI 研究实验室 DeepMind。该实验室由国际象棋神童德米斯·哈萨比斯(Demis Hassabis)联合创立,其开发的 AI 系统在生物分子研究领域取得重大突破,哈萨比斯也因此在 2025 年获得诺贝尔奖,这进一步强化了 Google 在 AI 基础研究领域的优势。

2023 年初,杰夫·迪恩与德米斯·哈萨比斯牵头,推动 DeepMind 与 Google Brain 合并,并向董事会提交了「打造公司史上最强 AI 模型」的战略计划,明确将多模态技术作为核心发展方向。

此次整合并非一帆风顺,两大团队的文化差异引发了不少摩擦。但 Google 拥有一项 OpenAI 难以比拟的优势:稳定且充沛的利润现金流,能够持续为 AI 研发提供充足的资金支持;而 OpenAI 则高度依赖外部投资,资金链的稳定性相对较弱。

2023 年底,Google 正式发布首款 Gemini 模型,这是其资源整合后的首个核心成果,标志着其多模态 AI 战略进入落地阶段。

与 OpenAI 主打文本训练的 ChatGPT 不同,手握全球充沛数据的 Google,为 Gemini 构建了涵盖文本、代码、音频、图像及视频的多模态训练体系。这一策略虽然延长了开发周期,且首款 Gemini 在多项核心指标上仍落后于 ChatGPT,但却为后续 Gemini 3 系列的反超奠定了基础。

值得一提的是,就在 Google 上下焦头烂额的时候,已经退休的联合创始人谢尔盖·布林,在一次聚会上被 OpenAI 研究员 Daniel Selsam 当面问住了:你为什么不全职投身 AI?ChatGPT 的发布难道没激发你的热情吗?

作为 Google(现 Alphabet)的联合创始人之一,谢尔盖·布林自 2019 年卸任总裁,一直退居幕后,Daniel 的提问让布林深受触动,于是决定重返公司一线。

尽管如今看来有些英雄主义的马后炮,但伴随着布林以「创始人模式」全面回归,Google 也顺势完成了一次「再创业」式的组织调整。

除了直接参与 Gemini 模型的问题排查与技术优化。他还推动 Google 完成了一笔价值 27 亿美元的收购,将 AI 领域顶尖研究员丹尼尔·德·弗雷塔斯(Daniel De Freitas)与 Transformer 论文作者之一诺姆·沙泽尔(Noam Shazeer)纳入麾下。如今,二人已成为 Gemini 项目的核心领导者,大幅提升了团队的技术攻坚能力。

更关键的是,Google 在硬件层面的前瞻布局,构建了「软件+硬件」的全产业链优势,这一点是多数竞争对手难以企及的。

早年间,Google 启动了自主 AI 芯片研发项目。当时团队预判,未来语音识别、图像处理等 AI 应用所需的算力,将远超现有水平。最终研发出的「张量处理单元」(TPU)芯片,不仅算力更强,耗电量还低于传统 CPU 与 GPU,成本优势十分显著。

Google 的这一押注最终得到了回报。TPU 芯片不仅成为 Google AI 业务的核心支撑,更对整个 AI 行业产生了颠覆性影响,逐渐成为行业主流的 AI 算力解决方案之一。其最新推出的 AI 芯片「Ironwood」,进一步降低了 AI 模型的运行成本,直接转化为 Google 在 AI 商业化领域的核心竞争力。

一根神秘香蕉,点燃全民 AI 狂欢

2025 年,图片生成模型领域出现了两次病毒式传播事件:一次是 ChatGPT 的 AI 吉卜力画风走红全网,另一次则是 Google 的 Nano Banana(Gemini 2.5 Flash Image)。后者的意外爆火,彻底扭转了市场对 Google AI 产品竞争力的认知。而这款产品的名字,背后还有一个小插曲。

据报道,当时 Google AI 项目经理娜伊娜·拉伊桑哈尼(Naina Raisinghani)负责将这款模型上传到大模型竞技场 LM Arena 平台。凌晨两点半的办公室里空无一人,她即兴组合了两位朋友给自己的昵称,最终确定了「Nano Banana」这个名字。

这款名字独特的产品,很快引发了市场热潮。短短数天内,Nano Banana 就登顶 LM Arena 平台性能排行榜,在社交网络上广泛传播,其影响力远超 Google 内部的预期。

负责 Gemini 应用及 Google 实验室的乔希·伍德沃德(Josh Woodward),将 Nano Banana 的发布定义为「一场成功的灾难」。全球用户在短时间内生成了数百万甚至数十亿张图像,直接导致 Google 算力告急,最终不得不通过「紧急借用」服务器时间来缓解压力。

但这场算力危机,恰恰印证了 Nano Banana 的核心吸引力。2025 年 9 月,Gemini AI 应用成功登顶苹果 App Store 下载榜——这一马斯克多年梦寐以求的位置,成为 Google AI 业务走向大众市场的重要里程碑。

两个月后,Google 推出了迄今为止最强版本的 Gemini 3 系列模型,其多项核心指标超越 ChatGPT。这一突破直接推动 Alphabet 股价大幅飙升,也让 OpenAI CEO 奥特曼紧急拉响「红色警报」,亲自下令改进 ChatGPT。

尽管 OpenAI 随后推出了更强版本的模型,但从市场反馈来看,其表现并未达到预期,未能逆转与 Gemini 的差距。

根据昨天 SimilarWeb 发布的最新数据显示,2026 年 1 月 Gemini 全球网页端流量份额突破 21.5%;这也是 Gemini 首次突破 20% 的市场份额,而 ChatGPT 的份额从 2025 年 1 月 86% 的统治级水平暴跌至 64.5%。

短短三年间,攻守之势异也。

Google 能够快速巩固优势,另一关键在于其将 AI 技术与核心搜索业务深度整合的能力——这是 OpenAI 等初创 AI 企业难以复制的壁垒。

OpenAI 需要从零开始搭建用户触达渠道,而 Google 则可以直接将 AI 能力注入其市场份额超 90% 的搜索引擎。在流量红利的加持下,Gemini 的用户增长速度远超预期:2025 年 10 月,其月活跃用户数量突破 6.5 亿,较当年 7 月的 4.5 亿增长近 50%。

如今,AI 业务已成为 Google 新的核心增长引擎。其收入结构日趋多元化,涵盖搜索广告增量、面向个人与企业的付费版 Gemini,以及自主研发 AI 芯片的销售等多个板块。

从英伟达市值突破 5 万亿美元,到 Google 凭借 AI 实现市值反超,这些现象都说明 AI 仍是当前科技行业最具想象力的赛道。但赛道上的竞争不仅是技术和产品的比拼,也是人才的争夺——就在 Google 高歌猛进之际,苹果正经历近十年最密集的核心人才「离职潮」。

这场离职潮覆盖了 AI、设计等多个核心业务板块,就连支撑苹果生态重要一环的 Safari 浏览器团队,也未能幸免。

昨天傍晚,The Browser Company 首席执行官乔希·米勒(Josh Miller)便在社交平台高调官宣:苹果 Safari 浏览器首席设计师马可·特里维里奥(Marco Triverio)已正式加盟其团队。

特里维里奥曾长期担任 iOS 与 macOS 版 Safari 的首席设计师,主导了 Safari 隐私控制、标签页交互、导航模式等核心功能的设计与优化。值得注意的是,另一位 Safari 首席设计师 Charlie Deets,也已更早一步加盟 The Browser Company。

当然,若仅因人才流失就看衰苹果,显然低估了这家公司的深厚底蕴。

它手握全球最稳固的硬件生态,iPhone、Mac 搭建的用户护城河,至今仍是多数企业难以企及的;充足的现金流,足以支撑它在 AI 赛道耐心布局、持续投入;更别说苹果在硬件研发、用户体验上的积累,本就是 AI 落地消费端的关键筹码。

如果 Google 的翻盘证明了技术积累的价值,那么苹果的故事,同样还没到盖棺定论的时候。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Google 今年狂更 60+ AI 工具,我用它们直接省出一台 iPhone 17 | 附产品清单

60 个,据不完全统计,Google 今年在 AI 软硬件产品上的功能更新,不少于 60 项。

现在大火的 Gemini 3 Pro,你能想象在今年年初的时候,还是名不见经传的 Gemini 2.0。十年磨一剑,把 Google AI 重新拉回我们视野的 Nano Banana,也在今年八月份才正式跟我们见面。

趁着最近各种年度总结都出来了,我们在这篇文章里,也总结了一波 Google 今年在 AI 方向上的发力,给我们的实际体验,又带来了多大的能力提升。

在谈论这些产品更新之前,Gemini 和 Nano Banana 两大「基座」模型是绕不开的内容。没有 Gemini 和 Nano Banana,Google 就是巧妇难为无米之炊。

和 OpenAI o3、4o、thinking、Pro 等复杂的型号不同,Gemini 就只有 Flash 和 Pro 两个版本,而且没有专门的路由机制,来自动选择用快速还是思考模型。Gemini 模型这一年的更新,就和它简单的型号一样,也是人狠话不多。

  • 初(Gemini 2.0 -> 2.5): 1 月和 2 月,Gemini 2.0 及其 Flash 版本迅速普及;到了 3 月,更聪明的 Gemini 2.5 就来了。
  • 年末(Gemini 3.0): 11 月,Google 祭出了年度大招——Gemini 3,新一代的智能基座模型,标志着 AI 的理解和推理能力,彻底进入了一个全新的台阶。
  • 电脑操作智能体(Computer Use):10 月的一个低调但同样重要的更新,是 Computer Use 模型;它允许 AI 像人一样通过看屏幕、点鼠标来操作电脑界面。

关于 Flash 和 Pro,最近还有新的 Thinking 模型可供选择。其中,一个是用来更快的回答,一个是需要经过推理和思考才会给出回复,我的日常使用是默认全部为 Pro,思考速度同样很快。

而 Flash 的能力也在更新到 Gemini 3 之后,被一些网友认为比 Gemini 3 Pro 还更「聪明」。

另一个大基座就是 Nano Banana 了,不用多说,从 1.0 到现在的 Pro,在图像编辑和生成这块,它一直是无人能敌的地位。

8 月首次亮相,就迅速凭借强大的修图能力,甚至成了病毒式传播的热点,被整合进 Google Photos 和搜索等各个 Google 产品中,让复杂的图像修改,变得像发表情包一样简单。

到了 11 月,Nano Banana Pro 发布,创意的门槛再次降低,精准渲染成百上千个文字,让它继续成为独一档的存在。修图、设计、甚至前端,都因为 Nano Banana 让工具不再成为阻碍。

两大基座模型成型,变化就真正出现在我们每天接触到的具体产品里。

Google 产品清单|附链接

  • 通用聊天助手 Gemini App,使用 Gemini 3.0 Pro/Flash、Nano Banana Pro、Veo 3.1 等模型,能生图文、视频、代码等|https://gemini.google.com/app
  • AI 研究助手、知识库管理工具 NotebookLM,提供安卓和 iOS 版 App|https://notebooklm.google/
  • 视频生成平台 Flow,使用 Veo 3.1 和 Nano Banana Pro 实现各种创意|https://flow.google/
  • AI 工作室,既适用于开发者查看 Google 当前全部模型调用规范,普通用户也能在 Playground 聊天对话|https://ai.studio/
  • Google 搜索 AI Mode,能启用基于 Gemini 3.0 Pro 的联网深度搜索|https://google.com/ai
  • Google 版 Cursor,基于 Gemini 3 的 AI 编程工具 AntiGravity|https://antigravity.google/
  • 图片生成平台 Whisk,使用 Google 生图模型 Imagen 4|https://labs.google/fx/tools/whisk/
  • 音乐生成模型 Lyria,基于 Lyria 2 模型|https://labs.google/fx/tools/music-fx-dj/
  • 更多 Google 开发中的 AI 产品|https://labs.google/

其中,大部分的工具都可以免费使用,尤其是 Google 实验室的相关产品,由于还在测试阶段,所以基本上限制较少,但大多只支持美国地区。

如果需要更多的 AI 资源,Google 最近还开启了新年优惠,新会员购买 Google AI Pro 可以获得 50% 的折扣。打折后的价格是 99.99 美元/年,同时能与另外 5 人共享该 AI Pro 会员。

AI Pro 不仅包含了 AI 相关的资源,也会提供 2T 的 Google Drive 存储空间;并且这次真的有「我是学生,免费送我」。

学习、工作,哪里都是 Gemini

从结果来看,研发模型和打磨产品,并不总是同一件事。有好的模型,基于此的产品不一定好用;但模型菜,做出来的产品必然不好用。

得益于 Gemini 模型的强大,Gemini 网页和 App 在这一年的更新相当足。可以说 Google 这一年,把力气都花在了对的地方,Gemini 完全从一个通用型的对话助手,升级成了全能的效率工具。

我们不需要重新学习一种使用方式,也不是为了 AI 而去用它,Gemini 就默默地开始出现在,更多我们本来就会去的地方。

▲ Google 搜索全球年度热词总结,Gemini 排在第一名,DeepSeek 在第六名(图片中未列出)

当面对复杂的科学概念,或者晦涩难懂的论文知识时,现在的 Gemini 不仅仅能做一个文字总结,它能利用强大的多模态能力,直接生成可视化图片,甚至是一个交互式模拟的网页。

而无论是生图、还是生视频,现在 Gemini 都会自动根据我们的查询,自动决定是否使用 Nano Banana Pro 或 Google Veo 3.1 来把这些难啃的文字硬骨头,画给我们看。


Gemini 应用内的「引导式学习」能帮助我们,在一问一答之间,快速掌握对某个陌生概念的知识,图中为「期货是什么」的学习

引导式学习、画布,Gemini 的这些功能,都可以在同一个对话里面随时切换。

除了 Gemini,本身就是学习利器的 NotebookLM 今年也一直在更新,把它叫做「备考神器」,一点都不为过。

NotebookLM 在今年增加了 「深度研究 (Deep Research)」模式,它能像一个研究员一样在后台花时间深度挖掘高质量信源,给我们出一份详尽简报。更绝的是,它能根据我们上传的资料,直接生成闪卡 (Flashcards) 和 测验题,帮助我们备考。

每天都在用的 Chrome 浏览器,也摇身一变 AI 浏览器,上线标签页管家。我们不需要再一个个点击那几十个打开的网页了,Chrome 里的 Gemini 现在可以跨标签页工作,帮我们对比、总结多个网页的信息。

说到浏览器,Google 的老本行搜索也在这一年,有了全新的 AI 模式。AI Mode 的出现,让搜索结果变得更像一个过程,而不是终点。

我们在 Google 搜索里输入的问题,可以是模糊的、不完整的,甚至带着犹豫和情绪。系统会在后台拆解问题、补充上下文,再把一条更清晰的路径呈现出来,然后生成多个追问。

Google 这一年在 AI 产品上的思路,其实非常一致,就是要最低程度的改变我们的使用习惯,同时引入 AI 的能力。

硬件上的 AI,需要变成系统能力的一部分

2025 年的 Google 硬件与 AI 的结合,主打一个能不动手就不动手。

手机产品,Pixel 10 也上线了国产手机厂商同款,帮你接听不想接的电话。新的代接留言 (Take a Message) 功能会自动识别骚扰电话、或者生成实时文字转录并给出下一步的行动建议。


Pixel 10 系列手机含有多个 AI 功能,AI 修图、语音助手 Gemini Live、手机助手 Magic Cue、以及 AI 拍照等

此外,Nano Banana 也集成在手机系统自带的 Google 相册里,Ask Photo,能让我们对照片进行 AI 编辑,同时保持图像一致性,AI 媲美手工 PS。

手表,Pixel Watch 4 也带来了隔空神功。当你双手拎着东西或者在做饭时,完全不需要触屏。你可以通过双指捏合或转动手腕来控制手表,甚至只需把手表举到嘴边,就能直接和 Gemini 对话,连唤醒关键词,Hey Google 都不用喊。

今年最重要的硬件产品,当然非 Google 眼镜莫属。当一大批探索不同形态的 AI 硬件都被刻在了墓碑上,还有打着 AI 手机的旗号,但是没什么实质作用的宣传慢慢退场。留下来的 AI 硬件,都集中在眼镜上。

▲ https://www.android.com/xr/

Google 给的答案是四种 XR 设备路线,XR 头显设备、有线 XR 眼镜、无线 XR 眼镜、和 AI 眼镜。有了 Gemini 强大的多模态能力,语音输入和视觉输入,AI 眼镜都能实时准确的处理。但实际的 Google 智能眼镜,就只能等到明年才会正式发布。

我们从来就不缺少创作的欲望

今年 Google 在图像和视频领域的最大明星,就是这个代号可爱,但能力强大的 Nano Banana。一开始还没打算真的叫它纳米香蕉,但奈何这波流量来得太快,一下子就火了,Google 索性就用了 Nano Banana 的名字。

一句话修图,在 Google Photos 或搜索里,我们只需要用自然语言说 「把栅栏去掉」、或者「把这张老照片修复一下」,甚至「帮我把墨镜摘掉」,它都能搞定。如果我们只有一张自拍,但想试穿衣服,它也能准确地生成全身照。

▲ 有专门的网站会统计,每天在 X 上流行的 Nano Banana 玩法|https://twitterhot.vercel.app/

这就是 Nano Banana 在实际生活给我们最大的帮助。更有意思的玩法,APPSO 今年也分享了好几篇相关的玩法,从桌面手办、巨人国到知识丰富的信息图,AI 创意成了榨干 AI 唯一的难题。

Google 官方也推出了 PPT 杀手,Mixboard,我们在白板上整理好思路,它利用 Nano Banana Pro 模型,一键就能把素材,变成设计精美的幻灯片。

▲ https://labs.google.com/mixboard/welcome

让照片动起来,可能是今年 AI 视频最好的归宿。Gemini 的照片转视频能力,可以让静止的照片动起来,甚至添加音效。把老照片变成一段鲜活的记忆,就在一瞬间。

背后的 Google Veo 系列视频生成模型,让威尔史密斯吃了有大半年的面,终于在 Veo 3 发布之后,音画同步、人物动作、运镜技巧都得到了大幅提升。现在的 Veo 3.1 还仍然高居大模型竞技场排行榜,文/图生视频第一名。

除了这些偏通用场景的更新,Google 在更贴近当地服务的 Google Maps、Gmail、YouTube 等热门装机必备应用上,也非常自然地引入了 Gemini,从地图导航、行程规划,到航班、购物和出行建议,都能看到 AI 在服务。

一些更垂类的工具,像是编程产品,AntiGravity、Jules、AI Studio、Gemini Code Assist 等,也在探索着一个随叫随到的结对编程伙伴,除了帮助开发者写代码、查 Bug,还可以怎么更好地提升效率。

▲ https://labs.google/

井喷式增长,Agent 元年,AGI 元年……今年看 Google 奋起直追 OpenAI 的故事,感觉真的是对 AI 「祛魅」的一年。奥特曼曾经说的那些「坐不住的时刻」、颠覆我们的生活都像是在吹牛,因为更好的 AI,一定会在不停歇的军备竞赛里面再次诞生。

现在,AI 就是润物细无声地,开始进入我们的生活。前些天,我问一位开发者是否有在使用 Cursor,他表情有点疑惑,回答说当然。很明显,现在写代码不用 AI 辅助,已经称得上是「异类」了。

当下作为用户,我们也很难、或者说没有必要,再明确地指出「这一刻,我正在用 AI」。但我们会发现,很多原本需要花时间、花精力判断的事情,正在被悄悄简化。

也许几年后回头看,2025 年并不会因为某一个模型而被记住。但它很可能会被记作这样一年:AI 真正开始像基础设施一样,被普通人习以为常地使用。

而这,或许才是 Google 这一整年,最重要的更新。

相关资料:

https://blog.google/technology/ai/google-ai-news-recap-2025/

https://blog.google/technology/ai/ai-tips-2025/

https://blog.google/technology/ai/2025-research-breakthroughs/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


HelloGitHub 第 117 期

本期共有 39 个项目,包含 C 项目 (2),C# 项目 (3),C++ 项目 (1),Go 项目 (4),Java 项目 (2),JavaScript 项目 (5),Kotlin 项目 (2),PHP 项目 (1),Python 项目 (5),Rust 项目 (2),Swift 项目 (1),人工智能 (5),其它 (6)

我调教了 50 次 AI,就为了能点开这片记录了 2025 年的雪花

岁末年初,朋友圈又开始了年度报告的大赛。各个平台都拿出了各种设计、交互、数据,势必要占领你的朋友圈。

拜托,现在 AI 已经这么好用了,为什么不能自己做一个呢?尤其是这一年,有大量的时间正是花在这些 AI 工具里。

没想到,这一个小小的念头,引发了一场我在 AI studio 里埋头苦干了两天,先后完成了两个版本:一个是基于静态和简单互动的「传统版」。

另一个是具备动态效果、可无限缩放、结合 3D 粒子和互动的「技能版」。

更没想到的是,整个经过改变了以往我对与 AI 协作互助的理解:万能咒语什么的不存在的,真正的魔法武器只有一个。

自己做一个技能版「年终总结」

在开始之前,先准备好你最常用的 AI chatbot——一定要是最常用的,几乎每天都要聊个两句的那种。数据不够不仅做不了有意思的总结,还可能被硬塞不存在的数据。

我准备的是 ChatGPT,直接起一个新窗口,输入以下 prompt:

请基于这一年的对话内容,从“数量、主题、时间、情绪、使用习惯、人格特征”等维度,构建数据感的总结,包含模拟数据以及 ASCII 图表,请严格按以下结构生成:
【1. 年度总览】
今年与 GPT 的总互动次数
发送消息总字数 + 接收消息总字数
最常互动的时段
最长连续对话时长
【2. 互动类型分布(饼图)】
请用 ASCII 图展示:
情感类、讨论类、创作类、学习类、角色扮演类、其他类
【3. 高频主题排行(TOP 10)】
以排行榜形式展示,并给每个主题一句点评。
【4. 我的年度情绪轨迹(线形图)】
模拟分析我在对话中的情绪曲线
【5. 用户行为画像(雷达图)】
雷达图维度包括:
好奇心、依赖度、分析深度、 表达欲、情绪敏感度、 自我剖析频率
【6. 使用时段与频率(柱状图)】
柱状图展示我全年最常用来找 GPT 的时间段: 凌晨、上午、下午、晚上、深夜
【7. 我的互动习惯标签】
请根据全年模式,为我生成 6-10 个类似“APP 年度画像”的标签。并设计 6 个带名称的年度成就徽章
【8. AI 眼中的我(数据 + 叙事结合)】
结合年度模式,写一段带数据隐喻的:
“我是怎样的人,我的灵魂像什么,我为什么值得这样的总结。”
【9. 年度一句话总结】

总体风格要求:
数据可视化 + 年度回顾混合风, 图表使用 ASCII,可视化要清晰、好看、易读,文案具有科技感、沉浸感、叙事感,避免大众化套话。

这些就是接下来的基础素材了,在上述这种 prompt 的指令下,GPT 只会输出纯文本,图也是草草画一画。所以接下来要转移到 Gemini/AI Studio 上去做进一步的排版。

AI Studio 依然是最推荐的地方,除了可以选择更多模型、互动过程更直观,还有一个更重要的原因后面讲。

年终总结里,数据只是素材,更重要的是排版——这一项已经卷出花来了,充分地进入了 AI 的数据库,用几行基础 prompt 就可以实现。

帮我以可交互式 H5 的形式,制作一个年终总结页面。总结文案我将会在下面给出,形式要求:1. 可交互式,交付可本地打开的 html 网页 2. 根据文案内容拆分版块,在需要使用图表的部分制作图表 3. 版式要求:文字使用衬线体,背景色彩可以自主调节。总结文案如下:(补充你的文案)

很多人抱怨, AI 生成的视觉图表有一股廉价的「塑料感」,效果不坏,但也说不上好——这就是基础 prompt 的缺点。所以,在制作报告时我直接放弃了使用「大气、高级」这类模糊的形容词。AI 听不懂这些,它只能精准执行参数,拆分成一步步会更加有效。

比如,为了达到最终那种深邃优雅的视觉效果,我将需求拆解成了具体的描述:背景为深紫色渐变与暗灰色的色块晕染,晕染效果随机变化——具体的颜色、形态,而非空洞的叙述「大气」「高级」,AI 弄不明白的。

类似的,微调图表时,也要尽可能的具体:雷达图需要呈现出磨砂玻璃般的半透明质感。

加入交互时,描述你想要实现的效果——尽可能地细致,比如:将「年度十大主题」按照十宫格排列,点击来使每一个格子反转,文案始终置于居中位置。

这种调校的过程,本质上是在用你的审美,去 battle AI 的执行效率。不过,现在 Gemini 的审美远比我想象的要好,比如我提了一个多出几个配色的要求,它给出的三种配色都还不错。

隐藏武器:「回滚」

做传统的年终总结,整体过程比较像和设计师合作,这里改改颜色、哪里换个版式。但「技能年终总结」,就是和工程师合作了。

在重新研究了一遍 GPT 给出的文字总结后,我第一时间想到的是和网上流行的圣诞树做结合。

▲ 图片来自:小红书用户 @黑波

但是在对比之后,发现年终总结高度格式化的章节、数字,并不适合用圣诞树这样的形式去呈现。所以我先是参考圣诞树的设计 prompt,但把主体改为了结构更清晰的雪花结晶。prompt 如下:

角色设定:你是一位精通 React 19、TypeScript 和 Three.js (R3F) 的 3D 创意开发专家。 任务目标: 构建一个名为“圣诞雪花”的高保真 3D Web 应用。视觉风格主色调为深祖母绿和高光金色,并伴有电影级的辉光效果。 技术栈: React 19, TypeScript, React Three Fiber, Drei, Postprocessing, Tailwind CSS。

雪花结晶体的结构可以更清晰的展示出节点,这样,就可以用红宝石不同的年度总结板块。点击时,散落在夜空中的粒子和红宝石,共同组成了一朵雪花——就像一个个重要的事件、习惯、统计数字,构成了这一整年。

然后就是漫长……漫长……漫长……的修改流程。在我的预想里,每一个红宝石封装了一部分内容,一次性把完整的总结文案喂进去是行不通的。这也是很多人写 prompt 时的「毛病」,喜欢一下子把所有需求堆上去,结果 AI 给的代码往往漏洞百出。这边给到的一个建议是: 先定骨架,再调动作。比如一个雪花的动效,我分了三步:

第一步: 先让它把雪花的 3D 形状写出来,只要形状对了,先下载一个版本,你可以在这里找到下载按钮。

第二步: 让它加上自转和红宝石节点,不急着塞内容,只是把几个节点改成红宝石的形状。

第三步: 最后才去磨那个点击缩放的逻辑,放大时是什么效果、要不要加返回键……

每一步只要达成预期,就别乱动。一旦发现没有效果,让 Gemini 自行 debug 也无效的话,启动武器:

这是我做这个项目时最重大的发现:回滚。功能越复杂,需求越多,AI 越容易出错。完成一个新需求的时候,无法避免要「重新生成」一些东西,所以整个代码的其它地方本来是没问题的,改完却出现新的 bug。

结果就是,越在错误的代码上缝缝补补,加的补丁越多,bug 就出现得越多。所谓「按下葫芦浮起瓢」,是最劝退的一步。

所以,效率最高的做法是,当你发现 AI 为了加一个新功能(比如换个颜色),把之前已经调好的交互逻辑给「洗」掉时,不必执着于在对话框里跟它吵架,让它「改回来」。最快的方法是直接回退到上一个版本,再输入新指令——记住,你是指挥官,它是执行者,AI 乱了,你要把它拉回到正确的轨道上。

 

这对零码选手尤其有意义,作为一个很少去翻看冗长代码、只看预览效果的普通用户,这就是最简单粗暴的「咒语」:别去纠结它哪行代码写错了,直接回滚。

这个项目里我的整个工程一度崩溃过:中间我提出,「优化一下红宝石的材质,让它看起来更透亮」,看代码预览 Gemini 是在跑,但是回到预览页却没有一丝变化。

一运行,材质没有大变化,点击缩放的功能还给废了。AI 在重写材质代码时,顺手把我调了一下午的点击交互给抹掉了。这种时候,在对话框里跟它大发雷霆其实没有用,提出「缩放功能没有了补回去」,也很容易卡死,AI 会一边道歉一边给你补一个更烂的 Bug。

与其纠结,不如一键 restore,回滚到那个「材质虽丑但交互正常」的版本,这种对预览效果的「死守」,比任何高级 prompt 都管用。

不过要注意的是,回滚只有上一个版本,更远一点的版本是不支持的。可以把它理解为「退回到上一步」,类似 Ctrl+Z 这样的操作。

到了后面,我的想法越来越被耗尽,所幸让 Gemini 自主完成一些设计工作。在整体视觉已经完全确定的情况下,它的发挥其实还不错。比如这个年度成就徽章「英灵殿」,就是完全由它设计的。

鼠标悬停即展示具体的成就名称,也是 Gemini 想出来的主意。另一张统计里,它还自己画上了心跳图。

最后一颗宝石里装载的是「一句话」总结,Gemini 把最后这颗宝石改成了白色的锥型晶体,跟其它的红宝石区别开来。

在制作这篇年终总结时,我被问到最多的问题是:「Prompt 是什么?」

也不意外,AI 用到现在,这已经成了大家下意识就要问的问题。但是说句掏心窝子的话,真的没有什么一键成型的魔法咒语。

每个人的 2025 都是独一无二的,每个人想要通过 AI 记录的转折点、战绩和情绪也都不一样。你喜欢一棵挂满礼物的圣诞树,而我喜欢这片在星空中转动的雪花。每个人都有自己的审美偏好,而 AI 最大的魅力,绝不是让你能复制出一份和我一模一样的报告。

相反,AI 最大的意义是:它第一次抹平了「想得到」与「做出来」之间的鸿沟。 以前你受限于不会代码、不会设计,只能接受千篇一律的模板;而现在,只要你愿意花点时间去跟它「死磕」,去描述你脑海中那个具体的画面,AI 就能帮你把那个只属于你的世界折叠出来。

Prompt 是冷的,但你的记忆和审美是有温度的。

如果非要总结出一个公式,那可能就是:一点点想象力 + 几十次耐心回退 + 绝不向平庸效果妥协的审美。

别再到处找「万能指令」了。新的一年,试着去跟 AI 聊聊天,去「嫌弃」它的平庸,去坚持你的直觉。你会发现,正如同每一年里不停止的自我更新和挑战,对这一年最好的总结,恰恰就是你不断推倒重来的过程本身。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


大厂扎堆智能眼镜,但谁也说不清它到底是啥|AI 器物志

编者按:

当 AI 开始寻找自己的形状,有些选择出人意料。

AI 在智能手机上生出了一颗独立按键,似乎让智能手机找回了久违的进化动力。眼镜凭借着视觉和听觉的天然入口,隐隐有了下一代个人终端的影子。一些小而专注的设备,在某些瞬间似乎比 All in one 的设备更为可靠。与此同时,那些寄望一次性替代手机的激进尝试,却遭遇了现实的冷遇。

技术的落地,从来不只是功能的堆叠,更关乎人的习惯、场景的契合,以及对「好用」的重新定义。

爱范儿推出「AI 器物志」栏目,想和你一起观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?

两千块不到的小米智能眼镜,和三万块的 Apple Vision Pro 放在一起,行业似乎默认它们都属于同一个宏大的叙事——「智能眼镜」或「XR」。

但这就像是把一顶遮阳帽和一顶宇航员头盔放在一起,仅仅因为它们都戴在头上,就硬说它们是同一种穿戴设备。

实际上,在今天,头显/眼镜类智能设备早已像物种演化那样,发展出多种功能、体验、场景、适用人群完全不同的方向。尽管它们可能看起来差不多,但其实完全是不同的东西。

▲ Meta Quest 头显和 Meta Ray-Ban 眼镜

在前不久的 Android XR 活动上,Google 试图用「设备谱系」这个词来修补这种裂痕:

  • XR 头显设备
  • 有线 XR 眼镜
  • 无线 XR 眼镜
  • 不带显示 AI 眼镜

大家都在假装这很合理,但我们心知肚明:这根本不是一个品类。

连厂商自己,都不知道自己为什么在做这些产品,它们的存在本身先于意义。

智能眼镜究竟如何定义?

我们是怎么定义智能手机的?在初代 iPhone 发布会上,史蒂夫 · 乔布斯给出了一个经典的公式:

电话 + iPod + 互联网 = iPhone

具体来说,iPhone 作为第一批真正意义上的智能手机,首先是一个完整的移动通讯终端,同时也是完整的互联网终端和媒体终端,是一个「大一统」的设备。

其实在智能手机初期,像 iPhone 这种「大屏 + 触屏」的形态并不是智能手机的唯一解,市面上还有不少和 iPhone 有类似能力,但形态还是按键、翻盖等五花八门的产品。

只是,当时的智能手机已经有了那个公式作为核心的定义,万变不离其宗,最终都收束成为一个纯触控的大屏。

▲ 初代 Android 手机

智能眼镜现在虽然也形态各异,但它反而是因为没有一个核心的功能和定义,厂商不知道哪个方向是最接近终点的,因此每个赛道都在争取。

如果对照智能手机 = iPod + 手机 + 互联网的公式拆解,理想中的智能眼镜应该是:

眼镜形态 + AI + Vision

AI 的部分很好理解,就是作为一种 AI 硬件形态;Vision 的意思,其实是对照 iPod 的「沉浸媒体终端」;然后,它必须是一个普通眼镜的形态。

你说的,是哪种智能眼镜?

现在提起「智能眼镜」,那免不了要通过一长串问题来定位一番:

  • 是带显示屏的 XR 眼镜,还是不带显示屏的「AI 眼镜」?
  • 如果是带显示,那是单眼显示,还是双目显示?
  • 是单色纯文字显示,还是彩色屏幕完整图形化界面?
  • 随着 Android XR 这种操作系统的崛起,以后我们恐怕还要问一句:是「安卓眼镜」吗?
    ……

Google 的说法是「XR 是一种设备谱系」,但给人的感觉,更像是无法实现和定义真正的「智能眼镜」,所以把上面的三个维度都拆开来做了,一些主打 AI 的同时另一些主打 Vision,无法做出取舍。

此外,像是 XREAL 和雷鸟生产的,必须要连接其他智能设备,作为外接屏/耳机,也即视音频输出设备的「AR 眼镜」,算不算一种「智能眼镜」也在商榷之中。

▲ Project Aura,眼镜外形,体验类似 aR 头显

而「XR」这个概念本身,也是对 AR、VR、MR 等一系列「R」的含糊统称,一台「XR 设备」并不能详细说明它的具体用途。

产品定义不清,宣传又难免夸大其词,成为了智能眼镜潜在用户面临的一大难题,也是行业需要厘清、解决的问题。

这个问题同样困扰着苹果:根据彭博社爆料,苹果的首款轻量「眼镜」将在明年或后年发布,不带 XR 显示效果,主打拍摄和 AI;但同时他们正在酝酿一款「 XR 眼镜」,将能和 iPhone 或 Mac 配对使用,显示简单的界面;最终,苹果当然也想要做出一副,能够完全独立使用的双目 XR 眼镜。

这些产品都应该如何命名?它们都属于「Vision」系列吗?是一种产品不断迭代,还是三个独立的产品系列?

▲ Apple Vision Pro

对于苹果而言,转向「AI 眼镜」更像是 Vision Pro 碰壁后的一次战略急转弯——目前苹果内部已经全面暂停了更大、更重的头显的开发,重心放在了戴出去更不尴尬的轻量型眼镜产品上。

这次不是为了引领未来,而是看到 Ray-Ban Meta 大获成功并引领行业后,一种「为了不掉队」的被迫防守。

虽然,苹果从不会主动领先,而往往会在品类日趋成熟的准确时间点上进入、重新定义、最终接管品类——但这次,在眼镜上,苹果确实拖了太久了。

智能眼镜,是 AI 硬件的合理形态吗?

行业目前普遍认为,AI 眼镜就是最理想的 AI 载体——能听能看,用户真实生活的上下文环境都能被收集、分析,AI 自然能给出最好的解答。

对于 Google 来说,Android XR 四种形态,特别是「AI 眼镜」和「无线单目 XR 眼镜」,则是 Gemini 的新载体,它们是非常标准的「AI 驱动」硬件,交互方式主要靠语音输入。

只是它们作为 AI 硬件,能提供的价值和能力,又大相径庭,例如对于头显和有线 XR 眼镜来说,AI 主要针对的是「in-App」操作,本质上和 AI PC、AI 手机没有区别。

▲ Gemini 导航应用操作

而对于 XR 单目眼镜、AI 眼镜来说,AI 就是生活的助理,对你所见所闻进行分析交互,又感觉用处没那么大。

就目前来说,「AI 硬件」还没有一个特别成功的案例,Ray-Ban Meta 能卖爆是因为它好看、能拍、能听——AI 反倒是最无关紧要的。

(岔个话题,你会发现在今年这个时间点上,AI 硬件的成功与否,大部分时候跟 AI 没什么关系。只有极少数反例,比如 Plaud.)

毕竟没有人会认为 Ray-Ban Meta 就是最终的智能眼镜形态,它只是那个说服你把设备往头上戴的初始形态。在这一点上,它押对了宝,非常成功。

Vision 的命运在苹果 Vision Pro 折戟后开始受到质疑。iPhone 实现了内容从固定电脑到手上自由流动,而智能眼镜似乎只是把「手」搬到了眼前,却附加了更高的门槛:内容必须特别制作,而且并不适合所有人。

智能眼镜包罗万象,以及「究竟是什么」的迷思,看起来只是技术不成熟的问题,似乎当我们真的做到轻便、高续航、视效好、AI 强的全能眼镜,它就能很好回答这个问题,并按照厂商的预想接替 iPhone 的地位。

现在看来,AI 眼镜在相当长的一段时间内,不太可能全部实现上述这些全能能力,比起干掉手机,最多只能争取和手机共存。

真正能够替代手机的到底是什么?目前行业还没给出一个准确的答案。

聚焦当下,在「眼镜 + AI + Vision」的叙事中,那些算得上成功的个例,都是把「眼镜」本身做得很好的,比如理想 Livis,比如 Meta Ray-Ban——不带显示的那款。

▲ 理想 Livis

我还是愿意相信智能眼镜,当它真的成为一个完备的形态,那可能性也会随之萌芽——

前提是,厂商能走出五花八门的尝试阶段,回答「智能眼镜是什么」这个问题,越快越好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


他会成为下一任 Google CEO 吗?

整整三年前,OpenAI 用 ChatGPT 将硅谷乃至全球科技圈炸了个底朝天。

那是 Google 第一次深刻地发现,后脚还在舒适区,前脚却已经摸到了悬崖边缘。

在此之前,Google 遇到过几次类似的情况,比如 Facebook 爆红的那会儿,Google 试图以 Google+ 反制,尽管最后社交业务草草收场,但并没有太多影响硅谷的格局以及 Google 的搜索-广告-数据生意基本盘。

然而这次不太一样。投资机构分析师们纷纷预测,用户可能会逐渐抛弃传统搜索框,转向 AI 聊天机器人、视音频生成工具。大火已经烧到 Google 的后院。

今年 4 月,Josh Woodward,一位此前在硅谷名不见经传的 Googlr,被推到了台前,接手 Google 的核心 AI 品牌 Gemini。

Google 母公司 Alphabet 股价在 2025 年第一季度暴跌 18%,创下 2022 年以来最惨纪录。Google AI 事务大总管,DeepMind 联合创始人 Demis Hassabis 在内部备忘录里指示:由 Woodward 来带领 Gemini 应用进入下一阶段

——「组织已经决定,你来救场」。

成效比预想来得更快。仅仅正式接手一个季度后,Gemini 团队就在 Woodward 的领导下,以极其低调、充满社交媒体病毒式传播潜质的方式,推出了 Nano Banana 图像生成工具。

在生成简单图像方面,Nano Banana 的速度和效率十分之高;而它对特殊复杂提示词的适应效果又特别的好,导致用户可以轻松用它来制作出虚实结合、难以想象的图片。

Nano Banana 彻底火了,也彻底带火了 Gemini。到 9 月底,Gemini 生成的图片数量突破了 50 亿张。在 App Store 上,Gemini 首次从 ChatGPT 屁股底下夺走了下载量王座。在内部的一次全员会上,兄弟部门的负责人提到,Nano Banana 这个东西,快要把 Google 的 TPU 烤冒烟了。

这背后显然是 Woodward 的功劳。尽管在硅谷不算声名显赫,在关注硅谷的舆论界也籍籍无名,但他在 Google 内部绝对是响当当的人物。

接手 Gemini 之前,Woodward 另一个知名案例就是在 Google Labs 把 NotebookLM 这个定位偏 to B 的产品,做成了当年 AI 领域 C 端产品的一个爆款——然后又把它做回到 Google Workspace/Google Cloud 的付费套餐里,为公司的企业级和云计算业务带来了不错的收入增幅。

在 2023 年 Google I/O 上,Woodward 亲自负责示范这个产品。当时大会议程已经进入无聊的云计算板块,然而 Woodward 的登场一下子就吊起了大家的胃口。你绝对不会在企业级服务的会议上听到演讲者说出这样的话:「大家好!给你们看一个东西,是我们几个工程师在过去几周里手搓出来的。」

去年的 I/O 大会,Woodward 更是贡献了一场更加精彩的表演:8 分钟,6 个产品演示,全部 live demo,没有翻车。也就是 Shoreline Amphitheater(I/O 主演讲场地)没有屋顶,不然屋顶真的要被掌声掀翻了。

从学历上来看,Woodward 不是一个典型的产品人。本科读的是经济学,硕士去了牛津大学研究美国军事和经济援助对民主影响方向。

2009 年,Woodward 进入 Google 担任产品管理实习生,然后一路走到今天,在接手 Gemini 之前,他也是 Google Labs 的负责人。

根据 CNBC 报道,Woodward 有着优秀的写作能力,并且毫不忌惮在同事面前展示自己的能力。Woodward 把自己对产品、技术、市场和局势的分析与判断,以及自己感兴趣的事情和最近在读的书与文章,写在了 newsletter 里面,颇受同事的欢迎。

对于在公司里当网红这件事,人们各有各的看法。但是这个能力实实在在地帮助 Woodward 显著提高了在公司内的可见度。

Woodward 所展现出的领导力同样令人深刻:他曾经提出想法,要预先做一次 live demo 彩排,得到了 Pichai 的批准。后来这个流程在 Google 内部演化成了公司传统,公司同事们不仅能观看 live demo,现场试玩,也可以对演示效果甚至产品本身提出反馈。能够在公司内部建立新的流程,建立新的公司文化,本身就是一种领导力的说明。

而在更细节的事项上,Woodward 更是展现出了「好领导」的特质。直接下属和合作伙伴都表示,Woodward 的风格是平时充分授权,出事自己挡枪。比如团队想用更好用的外部工具而不是 Google 内部产品来收集用户反馈,Woodward 拍板「该用就用」,并不惯着 Meet、Group 等兄弟部门……

有一位员工表示,跟着 Woodward 干活「让你觉得自己真的在做有意义的事情,而不是在完成 KPI。」

从 23 年 I/O 跟在谷歌云 CEO 身后上台,到 24 年跟在 Android 之后成为主演讲的 AI 发言人,再到今年……

你可能会惊讶地发现,在 I/O 大会的官网上,Josh Woodward 的头像,和现任 CEO Sundar Pichai,列在同一行。

不过说到 Google 的下一任 CEO,Woodward 面临的竞争可不轻松。

一个主流的观点是,未来是 AI 的时代,CEO 应该交由懂 AI(而且是拥有核心技术/学术能力)的人来做。那么最直接的候选人是 Demis Hassabis。他自称自己是马斯克的 AI 领路人,还说自己的联合创始人(现在在微软担任 AI CEO 的 Mustafa Suleyman)的 AI 只是都是自己教的。

Google 在 2014 年收购了 Hassabis 创立的 DeepMind 公司,但他本人并没有退居二线,反倒激流勇进掌管着 Google 整个 AI 团队。今年 6 月,Google 将 Gemini 应用团队并入 Hassabis 的架构下。所以本质上,Woodward 是 Hassabis 的下级。

不过,CNBC 的报道中提到,一些前 Google 高管和员工对 Hassabis 做 CEO 的能力有所怀疑,主要是他的经营管理能力并不出众,且对通用人工智能持保守态度。更重要的是 Hassabis 核心还是一个科学家,或许并不一定适合管理是指万亿美元的公司。

另一个值得关注的人选,是 Google 核心业务老将,和现任 CEO Pichai 的业务序列更加接近的 Nick Fox。

Fox 在今年 10 月刚刚接手负责搜索、广告、地图、电商等相关业务。他的履历也很漂亮,曾在麦肯锡工作,也在 Google 的所有核心业务轮转过,过去几年也有浅浅涉猎 AI 产品。《华尔街日报》报道认为如果 Google 想要挑选下任 CEO 的话,Fox 绝对能上短名单。

和这两人相比,Woodward 走的是另一条路。

他没有 Hassabis 自带的光环,也不像 Fox 那样在传统核心业务里深耕多年。Woodward 所做的,更多是在正确的时间做了极其正确的事。如果 OpenAI 和 ChatGPT 的成功证明了什么,那一定是:to C AI 应用是当下最关键的战场。而 Woodward 做成了 Gemini,为 Google 抵抗 OpenAI 的自救过程夺取了更多宝贵时间。

值得一提的是,今年 Pichai 在彭博科技大会上说过一句耐人寻味的话:他(作为 Google CEO)的继任者,将拥有一个「非凡的 AI 伙伴」。你可以理解为下任 CEO 将会大量使用 AI 工具,这是几乎毫无疑问的;也可以理解为下任 CEO 一定会是个深度理解 AI、能够驾驭 AI 产品的人。

按这种理解,Woodward 是非常符合的。他或许缺乏 AI 理论,或许没有管理传统业务的经验——但这些或许都不重要。一个能将 AI 技术及时转化为上亿用户不仅使用更要喜爱的产品,在接下来的时代可能比什么都重要。而 Woodward 曾对 Gemini 团队说过:真实的用户喜悦比达到某个硬性的 DAU/MAU 指标更重要。

所以,Woodward 会成为下一任 Google CEO 吗?或许下结论为时尚早。Hassabis 有科学家光环,Fox 有传统业务管理经验。但Woodward 有一样他们都缺的东西:在 AI 战争的第一线打赢了一场又一场漂亮的仗,并且让团队心甘情愿跟着自己冲锋。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌