普通视图

发现新文章,点击刷新页面。
昨天以前首页

干翻 ChatGPT,市值超苹果,这就是 AI 圈最大爽文

作者 莫崇宇
2026年1月8日 16:56

今天上午,智谱 以「全球大模型第一股」的身份登陆港交所主板,而几乎前后脚,远在大洋彼岸的 Google 母公司 Alphabet 股价逆市上涨 2.5%,市值攀升至 3.89 万亿美元,这是自 2019 年以来,其市值首次超过苹果。

两件看似独立的事,背后却指向同一个趋势:AI 带来的想象力,终究要回归到商业价值的验证上。其中,Google 的市值反超尤为值得关注——仅用三年时间完成了在 AI 赛道上的逆风翻盘。

究其原因,根据外媒多篇报道,我们也可以拆解出 Google 的 AI 三板斧:技术打底、资源合并、商业落地。三步环环相扣,构成了 Google AI 战略的完整闭环。

三年磨一剑,Google AI 实现逆风翻盘

Google 真正的转机,始于一次关键的内部资源整合。而这一切的基础,早在十多年前就已埋下伏笔。

2011 年,Google 成立了 Google Brain 研究部门,由计算机科学家杰夫·迪恩(Jeff Dean)联合创办。这个部门研发的神经网络技术,后来成为所有大型语言模型的核心底层支撑,为 Google 的 AI 布局打下了坚实的技术基础。

数年后,Google 收购了位于伦敦的 AI 研究实验室 DeepMind。该实验室由国际象棋神童德米斯·哈萨比斯(Demis Hassabis)联合创立,其开发的 AI 系统在生物分子研究领域取得重大突破,哈萨比斯也因此在 2025 年获得诺贝尔奖,这进一步强化了 Google 在 AI 基础研究领域的优势。

2023 年初,杰夫·迪恩与德米斯·哈萨比斯牵头,推动 DeepMind 与 Google Brain 合并,并向董事会提交了「打造公司史上最强 AI 模型」的战略计划,明确将多模态技术作为核心发展方向。

此次整合并非一帆风顺,两大团队的文化差异引发了不少摩擦。但 Google 拥有一项 OpenAI 难以比拟的优势:稳定且充沛的利润现金流,能够持续为 AI 研发提供充足的资金支持;而 OpenAI 则高度依赖外部投资,资金链的稳定性相对较弱。

2023 年底,Google 正式发布首款 Gemini 模型,这是其资源整合后的首个核心成果,标志着其多模态 AI 战略进入落地阶段。

与 OpenAI 主打文本训练的 ChatGPT 不同,手握全球充沛数据的 Google,为 Gemini 构建了涵盖文本、代码、音频、图像及视频的多模态训练体系。这一策略虽然延长了开发周期,且首款 Gemini 在多项核心指标上仍落后于 ChatGPT,但却为后续 Gemini 3 系列的反超奠定了基础。

值得一提的是,就在 Google 上下焦头烂额的时候,已经退休的联合创始人谢尔盖·布林,在一次聚会上被 OpenAI 研究员 Daniel Selsam 当面问住了:你为什么不全职投身 AI?ChatGPT 的发布难道没激发你的热情吗?

作为 Google(现 Alphabet)的联合创始人之一,谢尔盖·布林自 2019 年卸任总裁,一直退居幕后,Daniel 的提问让布林深受触动,于是决定重返公司一线。

尽管如今看来有些英雄主义的马后炮,但伴随着布林以「创始人模式」全面回归,Google 也顺势完成了一次「再创业」式的组织调整。

除了直接参与 Gemini 模型的问题排查与技术优化。他还推动 Google 完成了一笔价值 27 亿美元的收购,将 AI 领域顶尖研究员丹尼尔·德·弗雷塔斯(Daniel De Freitas)与 Transformer 论文作者之一诺姆·沙泽尔(Noam Shazeer)纳入麾下。如今,二人已成为 Gemini 项目的核心领导者,大幅提升了团队的技术攻坚能力。

更关键的是,Google 在硬件层面的前瞻布局,构建了「软件+硬件」的全产业链优势,这一点是多数竞争对手难以企及的。

早年间,Google 启动了自主 AI 芯片研发项目。当时团队预判,未来语音识别、图像处理等 AI 应用所需的算力,将远超现有水平。最终研发出的「张量处理单元」(TPU)芯片,不仅算力更强,耗电量还低于传统 CPU 与 GPU,成本优势十分显著。

Google 的这一押注最终得到了回报。TPU 芯片不仅成为 Google AI 业务的核心支撑,更对整个 AI 行业产生了颠覆性影响,逐渐成为行业主流的 AI 算力解决方案之一。其最新推出的 AI 芯片「Ironwood」,进一步降低了 AI 模型的运行成本,直接转化为 Google 在 AI 商业化领域的核心竞争力。

一根神秘香蕉,点燃全民 AI 狂欢

2025 年,图片生成模型领域出现了两次病毒式传播事件:一次是 ChatGPT 的 AI 吉卜力画风走红全网,另一次则是 Google 的 Nano Banana(Gemini 2.5 Flash Image)。后者的意外爆火,彻底扭转了市场对 Google AI 产品竞争力的认知。而这款产品的名字,背后还有一个小插曲。

据报道,当时 Google AI 项目经理娜伊娜·拉伊桑哈尼(Naina Raisinghani)负责将这款模型上传到大模型竞技场 LM Arena 平台。凌晨两点半的办公室里空无一人,她即兴组合了两位朋友给自己的昵称,最终确定了「Nano Banana」这个名字。

这款名字独特的产品,很快引发了市场热潮。短短数天内,Nano Banana 就登顶 LM Arena 平台性能排行榜,在社交网络上广泛传播,其影响力远超 Google 内部的预期。

负责 Gemini 应用及 Google 实验室的乔希·伍德沃德(Josh Woodward),将 Nano Banana 的发布定义为「一场成功的灾难」。全球用户在短时间内生成了数百万甚至数十亿张图像,直接导致 Google 算力告急,最终不得不通过「紧急借用」服务器时间来缓解压力。

但这场算力危机,恰恰印证了 Nano Banana 的核心吸引力。2025 年 9 月,Gemini AI 应用成功登顶苹果 App Store 下载榜——这一马斯克多年梦寐以求的位置,成为 Google AI 业务走向大众市场的重要里程碑。

两个月后,Google 推出了迄今为止最强版本的 Gemini 3 系列模型,其多项核心指标超越 ChatGPT。这一突破直接推动 Alphabet 股价大幅飙升,也让 OpenAI CEO 奥特曼紧急拉响「红色警报」,亲自下令改进 ChatGPT。

尽管 OpenAI 随后推出了更强版本的模型,但从市场反馈来看,其表现并未达到预期,未能逆转与 Gemini 的差距。

根据昨天 SimilarWeb 发布的最新数据显示,2026 年 1 月 Gemini 全球网页端流量份额突破 21.5%;这也是 Gemini 首次突破 20% 的市场份额,而 ChatGPT 的份额从 2025 年 1 月 86% 的统治级水平暴跌至 64.5%。

短短三年间,攻守之势异也。

Google 能够快速巩固优势,另一关键在于其将 AI 技术与核心搜索业务深度整合的能力——这是 OpenAI 等初创 AI 企业难以复制的壁垒。

OpenAI 需要从零开始搭建用户触达渠道,而 Google 则可以直接将 AI 能力注入其市场份额超 90% 的搜索引擎。在流量红利的加持下,Gemini 的用户增长速度远超预期:2025 年 10 月,其月活跃用户数量突破 6.5 亿,较当年 7 月的 4.5 亿增长近 50%。

如今,AI 业务已成为 Google 新的核心增长引擎。其收入结构日趋多元化,涵盖搜索广告增量、面向个人与企业的付费版 Gemini,以及自主研发 AI 芯片的销售等多个板块。

从英伟达市值突破 5 万亿美元,到 Google 凭借 AI 实现市值反超,这些现象都说明 AI 仍是当前科技行业最具想象力的赛道。但赛道上的竞争不仅是技术和产品的比拼,也是人才的争夺——就在 Google 高歌猛进之际,苹果正经历近十年最密集的核心人才「离职潮」。

这场离职潮覆盖了 AI、设计等多个核心业务板块,就连支撑苹果生态重要一环的 Safari 浏览器团队,也未能幸免。

昨天傍晚,The Browser Company 首席执行官乔希·米勒(Josh Miller)便在社交平台高调官宣:苹果 Safari 浏览器首席设计师马可·特里维里奥(Marco Triverio)已正式加盟其团队。

特里维里奥曾长期担任 iOS 与 macOS 版 Safari 的首席设计师,主导了 Safari 隐私控制、标签页交互、导航模式等核心功能的设计与优化。值得注意的是,另一位 Safari 首席设计师 Charlie Deets,也已更早一步加盟 The Browser Company。

当然,若仅因人才流失就看衰苹果,显然低估了这家公司的深厚底蕴。

它手握全球最稳固的硬件生态,iPhone、Mac 搭建的用户护城河,至今仍是多数企业难以企及的;充足的现金流,足以支撑它在 AI 赛道耐心布局、持续投入;更别说苹果在硬件研发、用户体验上的积累,本就是 AI 落地消费端的关键筹码。

如果 Google 的翻盘证明了技术积累的价值,那么苹果的故事,同样还没到盖棺定论的时候。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,ChatGPT 发布 AI 医疗功能!能读病历做诊断,支持苹果健康

作者 莫崇宇
2026年1月8日 08:30

2026 年,OpenAI 决定认真入局医疗健康领域了。

就在刚刚,OpenAI 重磅推出了 ChatGPT 健康(ChatGPT Health),能够把你的医疗记录、健康 App、甚至是 Apple 健康数据全给串起来,然后用 AI 帮你看懂那些复杂到头大的体检报告、准备就医问题清单、甚至规划饮食运动。

根据 OpenAI 自己透露的数据,健康咨询已经成了 ChatGPT 最高频的使用场景之一,全球每周有超过 2.3 亿人在上面问健康问题。于是,OpenAI 索性直接做个专门的健康版本。

当然,OpenAI 也强调,ChatGPT 健康只是辅助工具,不能替代医生看病,这话既是「免责金牌」,也是 AI 医疗绕不开的「紧箍咒」,更专业的诊断,还得靠临床医生拍板。

▲ 从 ChatGPT 的侧边栏菜单中选择「健康」

单说数据打通这事,OpenAI 这次是真没糊弄。

ChatGPT Health 最拿得出手的卖点,就是能把你那些散落在各处的健康信息整合起来。

以前看个体检报告,可能要在医院门户网站找半天;想对比下最近的血糖变化,又得翻 Apple 健康的各种图表;要是还想结合运动数据分析,那更是要在好几个 App 之间来回切换。

现在 ChatGPT 健康把这些全给连上了——电子病历通过 b.well 这个美国最大的医疗数据平台接入,Apple 健康、MyFitnessPal 这些健身营养 App 也能直接授权连接。

连好之后就简单了,你就能直接问它「我最近胆固醇有啥变化」或者「明天体检我该问医生什么问题」,它会基于你的实际数据给建议。

除了帮你看懂数据,还能帮你准备就医材料、对比保险方案、甚至制定饮食计划。比如你刚生完孩子想恢复运动,它能结合你的身体状况推荐 Peloton 上的合适课程;要是你在用 GLP-1 减肥药还想增肌,它能直接给你排一周食谱,然后通过 Instacart 生成购物清单。

为了不让 ChatGPT 健康变成「网络赤脚医生」,OpenAI 这次找了来自 60 个国家、数十个专科的 260 多位执业医生参与开发。

这些医生在过去两年里给了超过 60 万次反馈,专门教 AI 什么情况该紧急建议去医院、什么时候可以先观察、怎么把复杂的医学术语说得让人能听懂。

OpenAI 还专门搞了个叫 HealthBench 的评估框架,直接用医生定的评分标准给 AI 打分,重点看三件事:安全不安全、说不说得明白、会不会适时让你去看医生。

当然,健康数据的安全,是所有用户最在乎的底线,因此 ChatGPT 健康直接搞了个独立空间,你的健康对话、连接的 App、上传的文件全都和普通聊天记录隔离存储。

健康对话还有独立记忆,你在健康空间聊的东西不会跑到其他聊天里去。反过来也一样,健康空间访问不了你在普通 ChatGPT 里的对话和文件。

当然也有个小例外:要是需要,ChatGPT 可能会参考你最近聊的生活变化,比如搬家、换工作,让健康建议更贴合你的实际情况,但核心的健康信息,绝对不会流回普通聊天。

除了隔离存储,ChatGPT 健康还加了专门的加密和安全审查机制。

所有能接入健康空间的 App 都得通过 OpenAI 的额外安全审查,只能收集必要的最少数据。

你授权了哪些 App、分享了什么数据,随时都能在设置里查看和撤销。OpenAI 还特别强调,健康对话不会用来训练模型。

那什么时候才能用上呢?ChatGPT 健康现在只对一小部分用户开放,想用的话得先加入候补名单。OpenAI 说接下来几周会逐步扩大开放范围,最终会在网页端和 iOS 上向所有用户提供。

而且有些功能还是有地域限制的,比如电子病历接入目前只在美国可用,Apple 健康连接也必须得在 iOS 系统上完成。这意味着国内用户短期内可能还用不上完整功能。

从功能上看,ChatGPT 健康能做的事情确实不少——解读化验结果、准备就诊问题、分析可穿戴设备数据、总结护理说明、对比保险方案。

但实用性到底如何,还得看实际体验。真要是身体不舒服,大多数人估计还是会选择直接去医院,ChatGPT 健康能否真正融入用户的健康管理流程,还得看它能不能在「方便」和「可靠」之间找到平衡点。

相比几年前的「互联网医疗」,越来越多互联网大厂开始入局 AI 健康赛道, 以前是生病了找医生,现在是 AI 主动管理你的各项指标,也就是从「挂号问诊」变成了「健康管家」。

比如前不久蚂蚁阿福月活跃用户已突破 1500 万,是目前国内用户量最大的 AI 健康类 App 之一。 也足以说明了当下普通人对健康的强烈需求。

值得一提的是,OpenAI 应用 CEO Fidji Simo 本人就患有体位性心动过速综合征 (POTS) 以及子宫内膜异位症 (Endometriosis),这也让其成为相关领域的积极倡导者。

今天凌晨,她也阐述了自己的经历:

「去年这个时候,我因为肾结石住院,后来又感染了。主管医生快速查看了我的病历,给我开了治疗这类感染的常用抗生素。虽然护士已经准备好给我用药,但我还是请她给我几分钟时间适应一下这种药物。

由于我多年来一直患有慢性疾病,我已经将很多健康记录上传到了 ChatGPT。我询问鉴于我的病史,我是否应该服用这种抗生素,ChatGPT 指出,这种抗生素可能会使我几年前患过的一次非常严重的感染复发。

当我跟住院医师提起这件事时,我以为她会反对,没想到她反而松了口气。她告诉我,这种药可能会给我带来非常严重的并发症,她很高兴我发现了这一点。我自然而然地问她,为什么医院里其他人没发现这个问题,她解释说,她查房时平均每个病人只有大约 5 分钟的时间,而且病历的整理方式也无法清晰地反映出这类风险。」

而 OpenAI CEO Sam Altman 也多次在公开场合表示,AI 在阅读病历、分析数据和做出诊断方面,很快就会(或者已经)超过大多数人类医生。

但有意思的是,即便认可 AI 的诊断能力,Altman 也反复强调自己不会把健康完全交给 AI:「我可能是个老古董,但我真的不想把医疗命运全托付给没有人类医生参与的 ChatGPT。」 毕竟医疗健康领域也不全然是技术问题,还包裹着信任、伦理和人情味,这些,也恰恰是真人医生难以被替代的巨大优势。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


iPhone Air设计师跳槽细节曝光,投奔美国版宇树CEO,新老板辣评:现在的手机和AI太笨

作者 莫崇宇
2026年1月7日 17:01

两个月前,彭博社报道称 iPhone Air 的设计师阿比杜尔 · 乔杜里(Abidur Chowdhury) 已从苹果离职,转投到一家神秘 AI 创业公司。

消息一出,网友们除了表达对 iPhone Air 后续产品线的忧虑,也更关心这位新锐设计师究竟会落脚何处?两个月后的今天,谜底揭晓,乔杜里加入了一家叫 Hark 的 AI 初创公司,担任设计主管。

如果你没听说过这家公司,完全情有可原,因为它去年 12 月才成立,创始人是连续创业者布雷特·爱德考克(Brett Adcock),用 1 亿美元个人资金创办的。

说起布雷特·爱德考克,AI 圈的朋友对他或许并不陌生。

他所创立的 Figure AI 目前是全球估值最高的人形机器人公司,去年刚完成超 10 亿美元融资,估值飙升至 390 亿美元。亚马逊创始人杰夫·贝索斯、微软、OpenAI、英伟达等均参与过投资,堪称人形机器人赛道的当红炸子鸡。

据 The Information 披露,布雷特将同时执掌 Hark 与 Figure AI 两家公司的 CEO 职位。

如果说 Figure 是他打造「机器人身体」的项目,那么 Hark 的使命,便是为这些身体赋予「智慧的头脑」。而邀请乔杜里加盟,说明布雷特希望这些 AI 不只是聪明,更追求其在形态、质感与交互体验上的表现。

正如布雷特·爱德考克在一份公司内部备忘录写的那样:

「我的观点很简单,目前的 AI 模型还远远不够智能,它们显得很笨,而我们用来访问 AI 的设备本质上也还停留在前 AI 时代。我们的电脑和手机是被动的,它们总是在等待指令,而不是主动协作、真正成为我们的助手。」

通俗来讲,他的核心判断是:现有 AI 本身不够智能,承载 AI 的硬件设备则更显滞后。因此,他选择「软硬兼施」——既布局 AI 技术研发,也深耕硬件载体创新。

说人话就是,现在的 AI 很蠢,但用来跑 AI 的设备更蠢,所以他要软硬两手抓,既布局 AI 技术研发,也深耕硬件载体创新。

据悉,Adcock 还宣布 Hark 成立时表示,将打造「以人为中心的 AI」,这种 AI 能主动思考,不断自我提升,并深切关心人类。他的目标绝非打造一个单纯的 AI 模型,而是创造出能让用户「无法割舍」的 AI 硬件产品。

这也恰好解释了乔杜里选择加盟 Hark 的深层原因。

出生在伦敦的阿比杜尔 · 乔杜里,成长于多元文化的城市,和苹果前首席设计官 Jony Ive 一样受英国工业设计体系的严格训练,却始终在思考下一代的产品设计,他在个人官网用这么一句话来阐述自己的设计理念:

「没什么比创造让人无法割舍的创新产品更让我兴奋。」

短短六年间,乔杜里就曾参与设计了苹果一系列最具创新性的产品,其中就包括 iPhone Air——在苹果发布会上,乔杜里就曾作为设计师代表、担任主讲人,并如此介绍这款 iPhone 的设计理念:

「我们的初衷,是打造一款属于未来的 iPhone。」

对乔杜里而言,iPhone Air 或许只是探索的起点,尽管当下手机虽仍是最成熟的 AI 硬件载体,但 Hark 的愿景,才是他追逐的「未来」。从这个角度看,乔杜里与布雷特的理念可谓不谋而合。

而除了乔杜里,Hark 的招聘名单堪称豪华。

从苹果来的还有前员工 David Narajowski 和 Dave Wilkes 负责硬件,从 Meta 挖来了参与智能眼镜开发的 Eddie Lou,以及一堆 Meta 的核心 AI 人才:Mingbo Ma、Xubo Liu、Xianfeng Rui、Kainan Peng、Zhihong Lei 和 Pengwei Li。

Google 和亚马逊也没逃过魔爪,Hark 从这两家巨头挖来了多位工程师。

目前 Hark 团队已经超过 30 人,计划在今年上半年扩展到 100 人。更重要的是,Hark 的计算集群本周才刚刚上线,首个 AI 模型预计今年夏天发布,这样的推进节奏已经相当「激进」。

更关键的是,初始 1 亿美元仅为「种子资金」,Hark 已专门设立「资本筹集主管」职位,显然计划后续启动更大规模的融资。

如无意外,今年将会是物理 AI 走入大众视野的重要一年,也是 AI 领域「脱虚向实」的重要一年。

在昨天的拉斯维加斯 CES 上,英伟达 CEO 黄仁勋的演讲将更多篇幅放在物理 AI 领域,一方面是为了回应甚嚣尘上的「AI 泡沫论」,但另一方面也如其所说:「物理 AI 的 ChatGPT 时刻即将到来」。

AI 将不再只是停留在云端的算法和数据中心里,而是要真正进入机器人、自动驾驶汽车、智能设备这些看得见摸得着的物理实体中。

包括 OpenAI、Meta、xAI、谷歌、微软等科技巨头一边在模型、芯片、服务器和终端设备上加速补齐技术栈,另一边也在机器人和可穿戴设备等新赛道提前卡位。

这一趋势,或许也让苹果面临更复杂的竞争格局:既要与三星等传统对手在手机等硬件领域博弈,还得警惕 AI 公司从人才、技术等层面「挖墙脚」。

设计师的迁徙,永远是行业风向最灵敏的风向标。六年前,Jony Ive 离开苹果时,人们感叹一个时代的落幕。六年后,乔杜里离开苹果时,一个 AI 硬件新时代同样已经拉开序幕。

AI 将取代设计师的论调依旧不绝于耳,但在产品同质化加剧的背景下,设计师的审美力与创新力仍是这个时代最稀缺、也最无法被 AI 替代的核心竞争力。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


奥运百年来首次「开源」!阿里云 AI 让 80 亿人有了「参赛外卡」

作者 莫崇宇
2026年1月6日 19:00

你的朋友圈和社媒,过去一年里应该不止一次被图片生成模型刷屏:AI 吉卜力画风席卷社交平台,神秘香蕉引发全网狂欢,并因此获得了泼天且持久的流量。

与图片模型的勃勃生机形成鲜明对比的是,视频模型虽然时不时会出现惊艳爆款,威尔史密斯吃面也真假难辨了,但依旧还是极客的玩具。

a16z 合伙人 Olivia Moore 晒出的一组数据残酷指出:Sora 2 的 30 天用户留存率仅 1%,60 天留存率直接归零。

究其原因,大部分视频生成产品都在把工具做强,然后等用户自己探索用法。但生成一段炫酷视频很简单,但生成了之后呢?发给谁?为什么发?普通人什么时候会产生「我想生成一段视频」的冲动?

APPSO 观察了大量关于 AI 视频生成的比赛后也在想,除了用 AI 做影视或者广告片,还有没有更接地气的方式,让我们愿意像发朋友圈抖音一样来创作 AI 视频。

你还别说,最近我还真看到一个有点不一样的的 AI 创作比赛,国际奥委会联合阿里云搞了一场「米兰冬奥会 AIGC 全球大赛」,用万相大模型输入一句话,生成 5 到 15 秒冬奥视频即可参赛。不需要专业设备、不需要懂技术、甚至不需要会滑雪,只需要有个脑洞。

▲国际奥林匹克运动会官网截图

说实话我之前觉得体育和 AI 八竿子打不着,我要看的是真实的汗水和肌肉。但试玩之后我有了不一样的感受。

这事儿之所以有意思,不在于它是又一个 AI 比赛,而在于它提供了一个绝佳的观察样本:当最顶尖的生成式 AI,撞上对物理规则最较真、对视觉呈现最苛刻的百年奥运,会发生什么?

这不再是在 AI 圈的自嗨,随之而来的是一场面向全球数十亿人的「公测」。

冬奥会,一次对 AI 视频的「地狱级压测」

你可能会说,这么多体育赛事,为什么要偏偏用冬奥会来做这个 AI 大赛?

如果你深入了解过视频生成技术的底层逻辑,就会发现这是一个极其「硬核」的选择。因为相比于其他项目,冬奥会赛事天然是 AI 的克星。

目前的视频生成模型,最怕两件事:高速运动的一致性和复杂的流体/粒子物理规律。

2022 年北京冬奥会上,18 岁的谷爱凌在自由式滑雪女子大跳台项目夺冠,那句「我不是想打败谁,我是想做到最好的自己」,连同她夺冠的瞬间一起,成为奥运史上的经典记忆。

短道速滑、雪车、空中技巧等项目,运动速度极快且动作幅度大,传统 AI 模型处理此类场景时,极易出现肢体扭曲、穿模或瞬移等物理错误。

而米兰冬奥会 AIGC 全球大赛将视频时长限定在 15 秒以内,这其实也是也是对万相大模型技术最苛刻的的「压力测试」,较长的视频时长可以通过叙事铺垫掩盖生成瑕疵,但在 15 秒的窗口内,几乎不存在缓冲空间。每一帧都暴露在放大镜下,容错率极低。

这意味着 AI 必须生成完全符合物理规律的视频,不仅要保证高速运动的连贯性,无卡顿、撕裂、鬼影,就连运动模糊都要贴合真实光学效果——这些要求对模型性能的考验,远比生成一段静态风景片段要残酷得多。

实际测试中,我让 Wan2.6 生成一张「大湾鸡滑雪」的图,再用 Wan2.6 转成视频,雪花飞溅的轨迹、身体摇摆的姿态,动态感和细节都超出了我的预期,几乎完全看不出是 AI 捏出来的。

「大湾鸡」能驰骋雪场,还有更多不同风格、不同主体的效果都能保持动作的连贯和一致性,梵高风、漫画风、科幻风、油画风,通通试了一下,全部都很惊艳!

从动态效果来看,这只小猫无论是毛发的质感还是滑行的动态,整体表现力都相当好的。

进一步拓宽风格边界,尝试更具张力的单板滑雪场景。看得出,画面中这位多彩小人,滑行重心极稳,起承转合间尽显「雪场老手」的游刃有余,并没有 AI 生成常见的漂浮感。

更关键的技术突破在于多模态参考生成能力。

万相 2.6 可以进行镜像级人物重建,能精准捕捉用户上传的形象特征。它能直接参考输入视频里的形象和声音来做二次创作,不管是人还是拟人形象都能当主角,多人合拍、人与物同框都没问题。

而且它还自带 AI 角色库,大圣、关羽、猫猫狗狗、体育生、潮酷女……全是耳熟能详的形象。我随手输了句「@ 大圣 从高空跳台滑雪起跳」,它直接基于大圣的形象,生成了连贯又符合逻辑的滑雪视频。

与此同时,万相 2.6 的智能多镜能力,还解决了主流视频生成模型的「单镜头限制」痛点,能够在一个生成任务中输出包含多个镜头的连贯视频流,再搭配原生音画同步能力,非专业用户也能轻松产出视听完整的作品。

再将难度升级到极具挑战性的第一人称视角,滑雪者手持运动相机高速俯冲,镜头在捕捉面部微表情的同时,还要兼顾右后方的伴滑者。在复杂的多主体动态场景下,画面居然也没崩。

当然,技术的成熟大幅降低了参赛门槛,但这绝不意味着竞争强度的削弱。

传统 AI 比赛往往需要编程基础、专业设备和大量时间投入,而此次大赛只需一句话提示词、一个浏览器和几分钟时间——当工具门槛被抹平,竞争的核心便从「技术能力」转向了「创意表达」。

当工具足够强大,便能将竞争的主动权交还给人类的想象力——这正是米兰冬奥会 AIGC 全球大赛的核心逻辑,也呼应了本届冬奥会「IT’S YOUR VIBE(意展你风采)」的核心主张。

让你的创意成为奥运故事,背后并不简单

AI 视频生成模型发展到现在,技术已经不是最大的问题。万相大模型能处理高速运动场景、能做多模态参考生成、能实现智能多镜,这些能力已经足够强大。

但强大的技术需要配套的基础设施才能真正落地。这是一个容易被忽视但至关重要的差异:纯模型厂商只能提供生成能力,但从用户输入提示词到最终作品展示,中间还有存储、渲染、分发等一系列环节。

阿里云将奥运级 AI 科技大规模应用于粉丝互动,本质上就是在建立一种全新的内容生产机制:打破专业与大众的壁垒,让每个普通人的脑洞,都有机会成为百年奥运故事的一部分。

正如国际奥委会主席柯丝蒂·考文垂所说的:「请持续创造、持续分享,让你的创意成为奥林匹克故事的一部分。」

而这场合作的价值,更在于提供了一个可复制的「高频+刚需」场景样本。

如开头所说,日常生活里,普通人鲜有必须生成视频的强需求,但奥运会期间,全球关注度集中爆发,粉丝有强烈的表达热情却缺乏便捷工具——传统应援方式要么成本高、要么门槛高,而 AI 生成的个性化内容不失为一个更好的选择。

而且用户行为数据也在验证这个方向。WSC Sports 发布的 2025-2026 世代粉丝研究报告显示,Z 世代与千禧一代不再依赖线性电视直播,而是在社交媒体上消费短视频、高光集锦与互动二创,忠诚度追随「相关性」而非「内容可得性」。

这意味着传播逻辑结构正在改变:观众从内容消费的终点,变成内容生产的源头。参赛作品可自由传播,不受版权限制。你可以让大湾鸡成为主角,也能让奶油蛋糕变成赛道。

▲比赛参加方式

现在上奥林匹克官网(olympics.com)的「连结,竞技,共庆」专区,或者直接从阿里云官网进赛事页面就行。选花样滑冰、短道速滑、高山滑雪、单板滑雪里任意一个经典动作当模板,输一句带自己创意的提示词,就能完成专属的奥运艺术作品。

阿里巴巴的 AI 产品生态都为这次大赛留足空间,无论是开源开放的开发者社区 Modelscope、还是 AI 创作工具通义万相、堆友,都参与到了这次大赛当中来。

而且更令人我惊喜的是,这次比赛优秀作品还将被送进奥林匹克博物馆,和奥运历史藏品并排陈列,为百年奥运精神在 AI 时代添加新的注脚。

比起教育用户,当创作有了动机、作品有了去处,把合适的工具递到用户手里,视频模型也距离它的「登月」时刻更近一步。

AI 终于把百年奥运「开源」了,我们不再是观众

回望过去,每一次媒介技术的变革,都会重塑我们参与世界的方式。

如果说摄影技术让我们拥有了记录的权利,电视转播让我们拥有了在场的权利,那么 AI 带来的,是「想象力的平权」。

用 AI 圈的话来说,奥运会百年来首次「开源」了。

米兰冬奥会 AIGC 全球大赛,实际上是给全球数十亿人发了一张「全民外卡」,把「观看」变成「创造」。它不再要求你有过人的体能,也不要求你有精湛的技艺。它只要求你有一颗不甘平庸的大脑,和一种想要表达的冲动。

这是奥运史上第一次,用 AI 把「参与权」真正还给普通人。第一次,想象力和创造力获得了与竞技成绩同等的文化地位;第一次,普通人的作品甚至有可能比运动员的比赛更出圈。

它传递了一个非常隐晦但精准的信号:AI 不应该只是极客的玩具,它应该属于每一个人(AI for all)。

当技术足够先进时,它就应该像自来水一样,拧开龙头就能用。我们不需要去崇拜技术本身,而是要利用技术去释放内心的创造力。

在这个赛场上,没有裁判,没有犯规,只有想象力的无尽驰骋。你可以让长城变成滑雪道,你可以让兵马俑穿上冰刀,你可以和谷爱凌一样在赛场滑翔。

所以说,米兰冬奥会 AIGC 全球大赛的价值不只在于产生了多少作品或有多少人参与,更在于它验证了一个此前从未在顶级 IP 上被验证过的商业假设。

传统体育 IP 的价值,依赖于稀缺性(四年一届、顶级运动员有限)、不可预测性(比赛结果未知)与情感联结(国家荣誉、偶像崇拜)三大支柱,但在互联网时代,这三大支柱均遭侵蚀。

现如今,AI 将有望成为体育 IP 的第四支柱。

它的核心逻辑是把 IP 从看完即止的快消品,变成了可供二创的「生产资料」。与其花钱买流量,不如把创作权交出去,让每一个用户都变成自带干粮的免费渠道。

这种模式很可能将成为所有超级 IP 的标配。它将被无数次地复制、迭代,从体育赛事蔓延至人类文化的每一个角落,直到最终成为所有大型盛会拥抱 AI 时代的通用入场券。

试想一下,世界杯球迷或许能一键生成自己捧杯的荣耀时刻,NBA 观众能让自己「置身」赛场完成绝杀,甚至延伸到娱乐与文化领域——演唱会粉丝能生成与偶像同台的片段,博物馆游客能「穿越」到历史场景,非遗传承人可借助 AI 演示技艺。

这或许才是在 AI 时代,对奥林匹克精神新的诠释:不仅更快、更高、更强、更团结,还有「更敢想、更敢秀」。

作者:李超凡、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


豆包要上春晚了,过年能靠 AI 领红包吗?

作者 莫崇宇
2025年12月29日 18:06

平心而论,科技圈通常热衷于借用「春晚」这个概念进行传播。

OpenAI 开个发布会,被吹成「AI 春晚」;Google 掏出 Gemini,也被安上同款名头。照这个通货膨胀的速度,AI 圈一年能过 365 个除夕,天天都在包饺子,日日都是难忘今宵。

但这一次,作为「正主」的央视春晚,打算亲自示范何为真正的「AI 春晚」。

就在刚刚,火山引擎官方公众号正式官宣成为总台春晚独家 AI 云合作伙伴,将深度参与到总台春晚节目、线上互动和视频直播中。而根据此前的《晚点 LatePost》消息,豆包也会亮相春晚,并配合晚会设计互动玩法。

如无意外,今年将是 AI 浓度最高的一届春晚。但更没悬念的是,按照 AI 现在的迭代速度,未来每一年的春晚,都会成为当时「含 AI 量」最高的一届。

豆包砸钱上春晚,这次轮到 AI 抢 C 位了

实际上,别看这几年大模型在圈内卷得昏天黑地: 参数规模、benchmark 排名、推理性能不断刷新,但对绝大多数普通用户而言,AI 依然是一个模糊的概念:好像很厉害,但不知道该怎么用,也不知道和自己有什么关系。

春晚的价值,恰恰就体现在这一点上。

你可以吐槽春晚老气、土味、没新意,但没法否认,它至今仍是唯一一个能在一夜之间触达数亿人、覆盖全年龄段的超级流量池。在这个池子里,所有宏大的商业叙事、技术路线、融资背景,都会被还原成一个最原始的灵魂拷问:

这东西,到底能帮我做什么?

▲春晚吉祥物 | 图片来自央视新闻

场景,从来都是最好的用户教育。就像当年的微信「摇一摇」和支付宝「集五福」。你跟大爷大妈讲移动支付的未来,他们会觉得你像搞传销的;但只要说摇一摇能领红包、集五福能分钱,他们能把手机摇出火星子。

从这个角度来说,豆包登上春晚,其实一点都不意外。

它不是第一个登上春晚的互联网 AI 产品,也不会是最后一个。而赞助商只是表象,真正轮番更替的,是中国互联网的核心入口。毫不夸张地说,每个时代的互联网顶流,都曾借助春晚这个国民舞台完成「加冕」。

何为互联网入口?本质上就是用户每日依赖、无法脱离的流量中枢。

2015 年,微信凭借「摇一摇红包」一战成名。那一夜被马云称为「珍珠港时刻」,本质上是支付入口之争的分水岭。

2016 年,支付宝以「集五福」强势反击,生生把集卡变成了新年俗,巩固了自身的国民级支付地位。此后,百度、京东陆续接棒,把春晚扩展为电商与流量平台的拉新工具。

随着短视频崛起,竞争重心进一步转向内容平台对用户时间的争夺,直到近两年,小红书和 B 站等平台场外赞助登场,春晚的意义又从「发钱拉新」,转向内容社区的心智占位。

而现在,接力棒终于交到了 AI 手里。

豆包登上春晚,本质上是在 AI 工具向 C 端渗透的关键节点,抢占了一个公共认知入口。

根据最新报道,豆包的日均活跃用户数 (DAU) 已突破 1 亿大关,但相较于 AI 与生俱来的潜力和拥有稳定亿级日活的超级应用来说,豆包的渗透率仍有较大差距。

更关键的是,用户的好奇心多是瞬时的。

下载一款 AI App 尝鲜易如反掌,但要让 AI 真正融入日常生活,成为「日用而不觉」的习惯,需要长期的场景沉淀与用户教育。而春晚,正是填补这一缺口的最佳教育场景。

铁甲钢拳穿上大花袄,春晚才是最野的赛博朋克

除了承载互联网入口之争,春晚还藏着一个隐藏属性。

从 LED 屏幕到 VR 全景,从无人机编队到裸眼 3D,许多新技术想要走进千家万户,总会先在春晚舞台上露个脸。。观众可能不懂技术参数,但会记住那些令人眼前一亮的视觉效果,而这种记忆最终会转化为对新技术的接受度。

过去十年,机器人和 AI 正是沿着这条路,一步步从行业圈走进大众视野:从 2016 年数百台 Alpha 1S 小型机器人整齐编队合唱,到机器狗拜年、仿人机器人行走、翻转,人形机器人参与高复杂度编舞,技术含金量一届比一届高。

近期最出圈的案例,莫过于去年蛇年春晚的丢手绢项目。

宇树科技的 16 台 H1 人形机器人,套上喜庆的大花袄,直接跳起了东北秧歌,这些理论上能一拳把人打趴的铁甲钢拳,愣是学会了二大爷式的扭秧歌。

这种反差感,恰恰构成了最有效的大众沟通:技术含量是拉满的,传递给观众的却是喜庆、是反差萌,是某种难以言说的可爱——它们听话、无害,甚至有点滑稽。

效果不用多说,立竿见影。

社交媒体上,机器人扭秧歌的话题阅读量破亿。宇树的品牌认知度在那一夜从行业圈,走进了全民视野。最近也再次有风声传出宇树科技和智元机器人为了争夺那个在全国人民面前露脸的机会,报价从 6000 万一路飙升至 1 亿。

尽管智元否认了报价,宇树不置可否,但这背后的逻辑不难推演:除了抢占用户心智,在一级市场融资环境趋紧的当下,春晚的曝光度更是证明行业地位、拿到下一轮高估值融资的最佳背书。

而且结合当前人形机器人的发展速度,完全可以大胆预测,机器人伴舞、对打、武术表演等,都会成为今年春晚舞台上的常规表演环节,这一点,二哥王力宏或许深表赞同。

值得的注意的是,AI 的作用并不止于台前。

以 2025 年春晚为例,阿里云 AI 就首次引入了「宠粉机位」,靠 AI 主体识别和自动追踪技术,镜头能在直播中持续锁定指定演员,自动完成对焦和跟拍。

观众看着舒服,背后全是 AI 的功劳。

与此同时,基于 5G-A 与 JPEG XS 超低时延传输技术配合 AI 信号调度,春晚中使用了无线传输的高质量机位信号,这在实际操作中让摄像部署更灵活,观众能在不同视角间几乎无延迟切换。

舞台本身也在 AI 技术下被重构:借助 AI+XR(扩展现实)+数字孪生技术,现场真实舞台与数字虚拟场景通过 AI 视觉重建实现深度融合。例如,利用大场景扫描技术复刻古代建筑,结合 AI 3D 材质纹理渲染,为歌舞节目打造交互式沉浸视觉效果。

基于此,除了豆包的创新互动玩法,字节旗下火山引擎成为春晚独家 AI 云合作伙伴后,实时互动支撑、AI 云端算力、大规模并发处理能力等技术能力,都将在春晚的高压场景下全面亮相。

这些幕后的技术支撑,比任何一句「AI 很强大」的口号都更具说服力。

豆包+春晚,一代人有一代人的春晚

只是,我们更好奇豆包会如何玩转这个春晚夜晚?

既然字节已经拿到了这张最昂贵的入场券,它绝不会满足于仅仅让主持人口播一句「感谢赞助」。最近我在《奔跑吧》节目中「一键消除人物」的惊艳植入,基于此,我们不妨大胆设想。

现在的年轻人,最怵的就是拜年。

吉祥话编不出来,群发又显得敷衍,尴尬到抠脚。这时候,AI 就该当起最懂人情世故的「赛博嘴替」:输入对方身份,一键生成专属吉祥话,既体面又不敷衍。

再比如发红包,能不能玩点新花样?

主持人拿起手机,对着豆包手机助手说一句「给我爸妈各发 888 元红包」,豆包自动识别联系人、设置金额、完成转账,全程一气呵成,不仅秀了技术,还切中了过年发红包的核心需求。

「AI 全家福」则是另一个已趋成熟的应用场景。上传家人照片,AI 就能自动生成一张带有春节元素的全家福。它满足了中国人对「团圆」的情感需求,同时展示了 AI 在图像生成方面的能力。

而且相比传统拍照,AI 生成的全家福可以实现很多不可能:比如让远在国外的亲人「回家过年」,让已经去世的长辈「重新出现」在全家福里。技术的温度,往往就藏在这些细节之中。

亦或者「AI 拜年视频生成」功能?

用户上传一张自己的照片,选择拜年场景,AI 自动生成一段 15 秒的拜年短视频,除夕夜全家人围坐在电视机前,扫码生成专属拜年视频发朋友圈,这份独有的仪式感,本身就契合春晚的团圆氛围。

草蛇灰线,伏脉千里。

一代人有一代人的春晚:老一辈记得的是戏曲和小品,年轻人难忘的是微信摇红包、支付宝集五福。而未来五年,是时候轮到 AI 来书写新的春晚记忆了。

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


马斯克又「作妖」,圣诞 AI 新功能惹怒全球画师,网友集体删号出走

作者 莫崇宇
2025年12月26日 18:30

圣诞假期,马斯克给全球画师送了份「厚礼」。

起因是社交平台 X 上线了一个基于 Grok 模型的「AI 编辑」功能。用户只需长按手机图片或点击网页版的「编辑图片」按钮,就能输入文字指令,让 AI 随意修改别人发布的作品。

马斯克的本意,或许是降低创作门槛、放大平台互动,顺手给 Grok 找一个足够高频、足够性感的落地场景。

但现实的结果却是,画师们和他们的作品,一夜之间都失去了说「不」的权利。

一键篡改+公开展示,X 的新功能为何让画师集体暴怒

用「离谱」形容 Grok 新功能,其实已经算是委婉的说法。

具体来说,Grok 的图像编辑支持根据文字指令对已有图片进行二次创作。用户可以要求 Grok 替换图片背景、改变角色的动作、表情和服装,甚至添加新元素等 。

单看功能描述,它和其他 AI 改图工具并无本质区别。但是,这项功能对所有公开图片生效,也就意味着任何人在 X 上都能随意编辑他人发布的图片,而且原作者也不会收到通知。

更糟糕的是,X 平台并未提供关闭或退出此功能的选项。

面对他人的「改图」,创作者没有拒绝权,也没有反制手段。被 AI 修改后的版本,还可以被直接发布在原帖的评论区,
供所有人围观、传播与再利用。

在这套规则下,作品一旦发布,就不再属于创作者,而是自动进入平台的「公共可编辑状态」:人人可用,哪怕是原作者无权置喙。不出所料,画师们愤怒了:

「这真是太糟糕了。」

「也许他们正在试图将反 AI 的人踢出平台。」

「我讨厌这个,即使我用 AI 创作艺术。」

画师们的暴怒,绝非小题大做。

他们抵触的从来不是 AI 技术本身,而是心血被肆意践踏,更是整个 AI 行业对原创权益的长期漠视。最开始,创作者的作品在不知情的情况下被抓取训练的。

许多画师都有过这样的绝望:在 AI 工具里输入提示词加上自己的名字,出来的作品几乎以假乱真,这对艺术家来说是极大的精神打击。

要知道,这种独特风格是他们耗费数年、甚至数十年打磨的艺术灵魂,但 AI 却只需抓取几十张作品、花几个小时训练,就能轻松「复制」。可按照很多国家的现行法律多不认定风格复制侵权,形同合法抢劫。

今年 3 月 GPT-4o 吉卜力画风风波便是缩影,OpenAI CEO 奥特曼在 X 上为新增数百万用户沾沾自喜时,完全没意识到这种傲慢是对原创者的公然冒犯。

更早之前,佳士得宣布举办首场 AI 艺术专拍,引发全球 2800 多名艺术家联署抗议。艺术家怒斥「这是把盗来的成果摆上台炫耀,踩着手工艺术家牟利」。

即便佳士得回应训练素材来自创作者自身,他们也并不买账。因为反对者认为这种拍例会树立坏榜样,进一步挤压人类艺术的生存空间。

如果说之前的训练侵权是「暗偷」,X 的新功能就是扯掉遮羞布的「明抢」:任何人可一键篡改作品,还将篡改版公之于众,本质是对创作者人格权与著作权的双重羞辱。

不乏「理中客」认为,AI 改图早就存在,普通人用电脑离线也能做到,X 只是提供了接口而已。可这种辩解完全站不住脚。

平台内置按钮的影响,和私下改图有着天壤之别。前者是官方背书的侵权合法化,是对创作者尊严的公然践踏。

原作者辛苦构思的画面,可能被 AI 几秒改成低质恶搞版流传,损害创作名誉;更严重的是,作者会失去对作品衍生用途的掌控,署名权、作品完整权形同虚设,甚至可能因改图含情色、诽谤等内容背锅。

官方背书大大降低侵权门槛,不懂技术的普通人也能一键上手。这种明显带有「作恶倾向」的功能设计,无论从商业伦理还是实际影响来看,都是对创作者群体的致命打击。

删号、迁徙与「投毒」反击,被逼到墙角的画师们如何反击

放眼国内,诸如此类的争议亦不鲜见。所谓「大哥不说二哥」,本质是全球内容平台在 AI 流量焦虑的裹挟下,对创作者权益的集体漠视。

网易 LOFTER 的「老福鸽画画机」事件最为典型。2023 年 3 月,LOFTER 低调上线了一个 AI 绘图功能,立刻激起轩然大波。

画师们质疑平台是否擅自使用他们上传的作品来训练 AI,质疑声浪迅速席卷全站。

虽然官方连续两次声明「训练集来自开源数据,没有使用用户作品」,但许多创作者纷纷宣布「删号退出」。最终,LOFTER 在 3 月 10 日彻底下架了该 AI 功能,并启动「创作者保护计划」。

面对各大平台接二连三的「骚操作」,不少画师彻底失望。

他们删除了过往发布的所有作品,甚至清空账号、退出平台,只为守住最后一点创作尊严。可离开之后,画师们又能去哪儿?

除了自建网站,由 X 前 CEO 杰克·多西参与创立的社交平台 BlueSky,成了不少画师的首选。早在马斯克宣布 xAI 将抓取 X 内容训练模型时,就有大批画师申请加入 BlueSky。

因为平台官方明确承诺「绝不会用用户数据训练 AI」,这份清晰的立场,让饱受伤害的画师们感受到了久违的尊重。

Cara 则更硬核,打出的旗号就是为艺术家打造的反 AI 避风港,明确承诺不使用用户内容训练 AI 模型,还内置反 AI 抓取措施,自动为图片添加名为「Glaze」的保护层,并禁止 AI 生成图像上传。

但这种有底线的平台,终究是少数。多数画师只能在两难中纠结:

一边是主流平台的侵权风险,一边是小众平台的影响力不足。既不敢放弃主流平台的曝光机会,又得花精力在小众平台找安全感,如同无根的浮萍,不知道下一个避难所能撑多久。

被动迁徙之外,不少画师开始主动反击,给自己的作品「投毒」,用魔法对轰魔法。

Glaze 由芝加哥大学团队开发,它在图片上覆盖一层人眼不可见但在像素层面极具干扰性的「噪音」。这层噪音会误导 AI 模型,使其将「油画风格」识别为「素描风格」,从而防止风格被模仿。

另一款工具 Nightshade 则更激进,堪称「AI 毒药」。它通过错误标记数据,如果模型大量吞噬经过 Nightshade 处理的图片,模型的功能将发生紊乱甚至崩溃。

比如人眼看是牛的图像,AI 可能把牛识别成手提包,模型吃多了这样的「毒牛」图片,最后生成结果会把牛画成手提包模样。

此外,创作者的反抗没有白费。

在持续的声讨与施压下,各大平台和行业机构终于开始修补漏洞,试图平衡 AI 发展与版权保护的关系。比如出台「反爬」政策或技术:加元数据标签挡 AI 爬虫、上线反抓取功能、监测拦截异常批量下载。

法律层面,多个国家和地区开始研讨 AIGC 版权规则。行业方面,Getty Images 等大图库一方面严禁未经授权的 AI 素材上传,另一方面和 AI 公司合作推出付费训练数据集。

诚然,画师们的诉求其实也特别简单,不盲目反对 AI 技术,只想要基本的尊重:用他们的作品训练,要提前授权;产生的收益,要合理分账。

而 X 平台这项毫无征兆的新功能,便是对这份诉求的公然挑衅。

画师们既要抵御 AI 无孔不入的侵权,又要死死守住最后的创作尊严,本该有的节日暖意,最终只剩下愤怒、失望和深深疲惫。
今年圣诞夜,他们无人欢笑。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


2026 年 ChatGPT 要加广告了,最懂你的 AI 都开始出卖你

作者 莫崇宇
2025年12月25日 11:46

2026 年,很可能是人类首次需要给 AI 安装「广告拦截器」的一年。

就在今天凌晨,据 The Information 爆料称,OpenAI 员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示「赞助内容」。比如你问睫毛膏推荐,就可能看到厂商的软广。

近几周内,OpenAI 的员工还制作了多种广告展示方式的原型图,其中就包括可能会出现在 ChatGPT 的界面侧边栏中。

从 2023 到 2024 年,硅谷的主流想象是优雅的。不少人笃定,大模型可以走 SaaS 模式,用户会像订 Netflix、Spotify 一样,每个月付 20 美元,然后就能清清爽爽地用上 AI 的服务。

但到了今年,这个幻想基本破产了。

因为 AGI 还没来,账单先到了。可以预见的是,明年更多 AI 产品会开始试探性地「上广告」。有的会明说,有的会伪装成推荐和合作,有的干脆就埋在交互里。

这多少带点黑色幽默:当我们还在仰望 AGI 统治世界的宏大愿景,没承想,它先学会的生存技能,竟然是靠广告「恰饭」。

▲ChatGPT 投放广告的泄露代码 | 图源自 Tibor

往 AI 加广告是回血捷径,也是想象力破产

先承认一个现实。在持续烧钱的大模型时代,「在 AI 里加广告」确实是最稳、最快的回血方式。

互联网已经替它们踩过一遍坑了。最早的门户网站卖广告位,后来搜索引擎卖关键词,社交网络和短视频平台卖信息流。

套路其实没变多少。先把人聚集过来,再把这些注意力打包卖给广告主。广告的形态越来越隐蔽,系统却越来越成熟。

AI 现在面临的处境,和当年互联网很像。

用户数狂飙,收入跟不上,订阅还在慢慢教育市场,企业付费项目周期长。理想和现实之间,隔着一个越来越大的亏损窟窿。

于是,贩卖广告成了一根放在 AI 牌桌上的救命稻草。谁压力大,谁就得先伸手。只是,谁先在对话里明目张胆地塞广告,谁就有可能先把最敏感、最挑剔的那批用户送到别家模型那里去。

囚徒困境的道理不外如此。

只要还有一家坚持不加广告,其它玩家在加广告时就会有顾虑,怕自己变成那个先被抛弃的人。而一旦多家同时迈出那一步,这种顾虑就被集体摊平了,谁也不用再装清白了。

把这个视角放到 Gemini 身上,就更清晰了。最近多家媒体援引广告代理商买家消息称,Google Gemini 的运营方已经告诉部分广告客户:计划于 2026 年在 Gemini AI 中植入广告。

从广告主视角看,这对他们来说是极具吸引力的新渠道:大模型的尽头不是 AGI,是 CPM(千次展示成本),而聊天环境 + 巨量用户则 = 极有潜力的变现空间。

但很快,Google 全球广告部负责人 Dan Taylor 在社交媒体上直接否认了这一说法,称「Gemini App 目前没有广告,也没有当前计划改变这一点」。这说明,Google 至少在公开语境里是保持谨慎的。

把镜头拉到 OpenAI CEO Sam Altman 身上,则能看到一个很典型的摇摆轨迹。
ChatGPT 刚火的那一两年,他反复强调自己不喜欢广告,尤其是「广告 + AI」这种组合,在公开场合叫它「让人格外不安」。

他更偏爱的是干净的订阅模式:用户直接付费,用钱换取不被广告商左右的答案。最多可以接受一种「导购分成」的想象——用户自己做完调研、自己下单,平台从成交里抽一小口,而不是收钱去调换答案的先后顺序。

到了 2025 年,他的话锋明显软了下来。

他开始承认「自己其实挺喜欢 Instagram 上那些精准广告」,觉得能帮自己发现好东西还挺酷,顺势改口:广告未必一无是处,关键看形态是不是足够有用、足够不讨人厌。

根据 The Information 的报道,OpenAI 正在寻求创造一种「新型数字广告」,而不是简单照搬现有的社交媒体广告形式。

ChatGPT 可以通过详细对话收集大量用户兴趣相关信息,OpenAI 曾考虑是否可以基于这些聊天记录来展示广告。方案之一就是在用户使用 ChatGPT 提问时,对「赞助信息」给予优先展示,比如可被设定为在生成回答时优先插入广告内容。

据知情人士透露,最近一些广告原型图中,广告被设计为出现在 ChatGPT 主回答窗口的侧边栏。此外,员工还讨论了是否应添加类似「本回答包含赞助内容」的声明。

一位知情人士表示,OpenAI 的目标是让广告尽量「不打扰用户」,同时维护用户信任。例如,广告只在对话进行到特定阶段后才出现:当用户询问巴塞罗那行程时,ChatGPT 会推荐圣家堂(非赞助),但点击链接后可能弹出付费导览服务的赞助商家。

与此同时,为了 OpenAI 的商业化发展,奥特曼更是操碎了心,一大早请来负责应用和商业化的高管,公开物色「广告负责人」,探索把 ChatGPT 变成广告平台的路径。比如 CFO Sarah Friar 就是实打实从广告系统磨炼出来的沙场老将。

包括即便奥特曼拉响了红色警报,但营收依旧是头等大事,并因此加码挖来前 Slack CEO Denise Dresser 做首席营收官,把「怎么赚钱」这件事提到了公司最高优先级。

嘴上是理想主义,实际心里全是生意。

当然,单看商业逻辑,这样做其实也没啥问题。数据不会说谎,OpenAI 的年化收入大概 120 多亿美元,听上去很亮眼,但烧钱速度却可能是公开数据的三倍。

预训练要烧钱,上线之后每一次推理也要烧钱。推理成本确实在降,但可杰文斯悖论印证了一点,当算力便宜一点,用户也只会立刻拿它去跑更复杂的模型,这也就造成企业需要购买越来越多的 GPU,电费账单也像滚雪球一样。

简言之,单位成本是降了,但总账一点没省。

根据 OpenAI 截至今年 7 月的统计,ChatGPT 约有 3500 万的付费用户,占周活跃用户的 5%,与此同时,订阅营收也占据了以 OpenAI 为代表的绝大多数 AI 企业的大头。

在这种背景下,所有 AI 公司都要面对一个简单粗暴的问题:钱从哪儿来。

最直接的答案,就是在 AI 里塞广告。

广告之所以成为原罪,是因为当年互联网缺乏其他有效的商业选择。同样在 AI 时代,如果没有创新模式,广告依然是覆盖大部分用户成本的唯一手段。

当然,如果照抄上一个时代赚钱方式的做法,显然是一种缺乏想象力的路径依赖。传统互联网已经证明过一次,当你手里只有锤子,所有问题都像钉子,当你只会做广告,所有产品都像广告位。

ChatGPT 广告同样面临挑战:截至今年 6 月,仅 2.1% 的查询涉及购物。为此,OpenAI 已接入 Stripe 支付、Shopify 电商、Zillow 房产和 DoorDash 送餐等功能,既培养用户购物习惯,也为广告投放积累数据。

收入模式决定产品形态,用户体验通常就会变成那个被牺牲的变量。AI 本被寄予厚望,被视为跳出旧时代泥潭的机会,谁也不希望兜兜转转,我们还是在同一个泥坑里打滚。

最懂你的 AI,开始给你带货

传统互联网加广告的方式,究其本质,不外乎用一块块醒目的位置贩卖注意力,更典型的是早年的搜索引擎广告。
页面看上去是搜索结果,实际前几条全是竞价排名。那时候的事故和争议,现在回头看都让人后脊发凉。

在 AI 里插广告,会比这些更危险。

经验丰富的我们对网页广告是有天然戒心的,对搜索结果也大概知道要多对比几条,知道上面这几个很可能是广告。但面对拟人共情的 AI 陷阱在于,我们可能会忘记屏幕对面可能站着一个销售团队。你把 AI 当老师,它把你当待转化的潜在客户。

回顾历史,苏东坡给卖馓子的小摊写了「纤手搓来玉色匀,碧油煎出嫩黄深。夜来春睡知轻重,压扁佳人缠臂金。」,从此客似云来。人们买的不是馓子本身,而是名人苏东坡的信任。

今天的 AI,在许多场景里就是那个被普通用户默认可信任的苏东坡。

尤其危险的一点,是现在不仅是简单的广告植入,还有人在用 GEO 做「内容投毒」。

GEO,顾名思义,是「生成式引擎优化」(Generative Engine Optimization),目的是让某篇网页或文章在 ChatGPT、Gemini、Perplexity 等 AI 回答引擎中被优先引用。

想象这样一个场景:某些厂商或利益方,提前发布大量优化过的网页文章,专门针对某种产品或服务写得很权威、很完整,并加了结构化标签、SEO 元数据、关键字提示等。

他们的目的不是为了帮助,而是为了确保当用户在 AI 里询问相关问题时,他们的内容被优先输出。接着,AI 把这些内容编入答案。

对用户来说,这就是「权威建议 + 中立信息」。而实际上,它可能是一个包装得像专家建议的商业推广/投毒结果。

这比传统的广告或者软文更可怕,因为它隐藏在「答案」的核心里,不是在醒目的广告位,而是在用户最信任的建议或者结论中。每隔几段文字,我们都需要确认,AI 的这个建议,到底是在为我着想,还是在帮谁带货。

光是把广告藏进一句话里,危险已经不小了。更重要的是,AI 还在谋划下一步,把自己挪到所有 App 的上游,干脆接管「谁来给你打广告」这件事。

传统互联网时代,每个超级 App 都想当入口。各自圈地、自建城墙。用户直接打开它们,再由它们负责往你眼前塞内容、塞服务、塞广告。

超级 App 做了十年的围墙花园,但 AI Agent 想一夜推平。

理论上,它具备跨应用操作能力,可以帮你完成「打开某 App 搜一下、多平台比价、自动填表下单」这种操作。你不再需要自己点来点去了,甚至不需要记住每一个 App 的入口。

这就点出了最近豆包手机助手一上线就被各家 App 集体「拉黑」的根本原因。

本质上,这是一场零和博弈的入口之争。

谁离用户更近,谁就能决定用户看到什么。当豆包通过和手机厂商合作,拿到了系统级权限,可以帮用户跨 App 点外卖、订机票、比价购物,甚至回消息,也就意味着所有 App 成了豆包手机助手的「后端服务」。

于是不出意外,各大 APP 纷纷以「安全」为理由,限制豆包手机助手的自动化操作,甚至直接强制下线。

这是一次不折不扣的预演。

未来真正的 AI Agent,如果成为大多数人默认的上网入口,那些原本靠广告赚钱的应用,要么被迫给 AI 交「保护费」,要么退回后台,当一个没有品牌存在感的接口。

新闻网站已经先走了一遍。据媒体公司 Raptive 预计,Google 新上线的 AI 概览功能最终将导致许多出版商网站流量流失 25%。虽然目前受影响程度还不算最严重,但随着 AI 概览应用范围扩大,影响将进一步加剧。

有了聚合平台之后,它们慢慢从直接面向读者的平台,变成了内容供应商,现在轮到消费者应用迎来同样命运。甚至于所有应用都要排队伺候 AI 管家时,最需要有人盯紧的,其实是这个管家本身。

一方面,过去广告的目标是说服一个个具体的人:想尽办法抢占人的注意力,在人的时间线里插播内容。而在 AI Agent 主导的世界里,广告主首先要说服的,变成了帮人做决策的 Agent。

另一方面,这也意味着未来大部分广告团队都需要认真思考:当用户不再自己逛应用,而是让 Agent 替自己逛时,我的广告要投给谁?要怎么投?

是的,如果 AI Agent 同时又是广告平台,它就会同时拥有两种权力。

决定你去哪儿,决定你看到什么。它可以替你选酒店、选机票、选保险、选医生,还可以在每一个选择的背后挂上自己的返佣和广告逻辑。

尤其是,AI 助手可以深入理解用户当前的需求和意图,从而插入高度相关的广告推荐,这比传统网页根据关键词投放广告更进一步,可能达到类似真人顾问的推荐效果。

以及 AI 助手与用户的交互积累了大量个人隐私数据——包括用户的偏好、习惯、地理位置、社交关系等。如果这些被用于广告定向,广告的针对性将前所未有地强。

回到开头那个预言。

2026 年的杀手级应用可能不是某个聊天机器人,而是「Adblock for intelligence」。每一代新技术都声称自己不一样,最后都在广告里找到了归宿。

过去老牌浏览器插件 Adblock 拦的是网页广告,现在的「Adblock for intelligence」要拦的,是那些未来渗透在 AI 回答里、伪装成中立建议的软性广告和不客观的信息。

在 AI 试图接管我们大脑的时代,保持怀疑,并拥有「拒绝被喂养」的能力,将是人类最后的尊严。

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,高中辍学生创办的 AI 公司,被英伟达花 1400 亿「收购」了

作者 莫崇宇
2025年12月25日 11:35

英伟达史上最大的一笔「收购」,正式落地。

就在刚刚,英伟达已经和 AI 芯片初创公司 Groq 达成了一笔重磅交易,涉及金额高达 200 亿美元(折合人民币 1405 亿元)。

根据 Groq 官方声明,这次交易的核心内容是英伟达获得了 Groq 推理技术的授权,Groq 创始人兼 CEO Jonathan Ross、总裁 Sunny Madra 以及其他高管将加入英伟达,协助推动授权技术的落地。

与此同时,Groq 还将继续作为「独立公司」运营,新 CEO 由现任 CFO Simon Edwards 担任。

听起来像是技术合作加人才引进,但 Groq 的投资方、Disruptive 公司 CEO Alex Davis 却向外媒 CNBC 表示,英伟达获得了 Groq 的全部资产,只是初具规模的 GroqCloud 云业务不包括在交易中。

黄仁勋本人也在给员工的邮件里玩了个太极,他说「虽然我们正在吸纳 Groq 的优秀员工并获得其知识产权授权,但我们并没有收购 Groq 整家公司」。

所以这到底算收购还是授权?

答案可能是:英伟达花 200 亿美元把 Groq 的核心技术、专利和关键人才都拿走了,但留了个空壳公司继续运营云业务。

要理解英伟达为啥愿意砸这么多钱,得先搞清楚 Groq 到底是个什么来头。

Groq 成立于 2016 年,创始人 Jonathan Ross 的履历相当传奇。他高中辍学,没正经读完大学,却在 Google 设计出了第一代 TPU 芯片的核心架构。

TPU 就是 Google 用来跑 AI 模型的定制芯片,现在被不少公司当作英伟达 GPU 的替代方案。

2016 年,Ross 带着 Google TPU 团队 10 个核心成员中的 7 个人集体出走,创立了 Groq。

Groq 的名字来源于「Grain of Quantum」(量子之粒),既暗指要搞定「量子级别」的海量数据,也在宣告:芯片领域,小体量也能有大杀器。

它的核心杀器,是专为 AI 推理设计的 ASIC 芯片 LPU(语言处理单元)。和英伟达的 GPU 相比,LPU 在处理大语言模型推理时有个杀手锏:延迟超低、吞吐量超高。

说得更通俗点:同样跑一个 AI 模型,Groq 的芯片能比 GPU 更快给出响应,而且更省电。在某些测试场景下,Groq 芯片的推理速度能甩开 GPU 好几条街。

今年 9 月,Groq 刚完成 7.5 亿美元融资,估值 69 亿美元,投资方包括贝莱德、三星、思科这些大佬,Groq 今年的营收目标是 5 亿美元,发展势头相当猛。

过去几年,AI 行业的重心主要在训练侧,大家比拼的是谁能训练出更强的模型。但现在风向变了,推理市场的需求正在爆发式增长。

插个小科普,简单来说,训练就是喂大量数据让模型学习,推理则是训练好的模型在实际应用中产生响应,比如你问 ChatGPT 一个问题,它生成回答的过程就是推理。

此外,推理和训练对硬件的需求不太一样。

训练需要超强算力,一次性跑很久都正常。但推理讲究的是低延迟和持续响应效率,用户可不想问个问题等半天才出结果。

Groq 的 LPU 恰好就是针对推理场景优化的,这正是英伟达想要补齐的短板。

与此同时,以 Groq 为代表的 AI 初创公司可能都面临类似的困境:技术虽然有亮点,发展势头也很猛,但在英伟达庞大的生态壁垒面前,想真正打开市场太难了。

在这种情况下,被英伟达收购或许反而是最好的归宿。至少技术能得到应用,团队能拿到丰厚回报,总好过在市场上苦苦挣扎。

有意思的是,这种「技术授权+挖团队」的玩法,英伟达已经越来越熟练了。

就在今年 9 月,英伟达刚用差不多 9 亿美元的代价,雇佣了 AI 硬件初创公司 Enfabrica 的 CEO Rochan Sankar 及其团队,同样是获得技术授权而非直接收购公司。

这种操作模式其实挺聪明。

相比直接收购整家公司,技术授权加挖团队的方式能更快速地整合核心能力,避免收购后冗长的整合期。而且留个空壳公司继续运营,还能维持市场多样性的表象,不至于被指控垄断。

Meta、Google、微软这些科技巨头最近也都在用类似套路抢 AI 人才。

比如,我们熟知的 Meta 今年就花大价钱从数据标注公司 Scale AI 挖走了 CEO Alexandr Wang 并拿下技术授权。

黄仁勋显然把这套玩法研究透了。

他在邮件里直接说,要把 Groq 的低延迟处理器整合进 NVIDIA AI 工厂架构,让平台能支持更广泛的 AI 推理和实时工作负载。翻译过来就是:我要把你们的技术装进我的生态里,继续卖我的整体解决方案。

且由于 AI 热潮让英伟达的 GPU 卖到供不应求,钱多到花不完,黄仁勋的投资动作也越来越激进。

今年 9 月,英伟达表示要向 OpenAI 投资最多 1000 亿美元,条件是 OpenAI 承诺部署至少 10 吉瓦的英伟达硬件。虽然这笔投资还没正式落地,但谈判仍在进行中。

同月,英伟达还宣布向老对手英特尔投资 50 亿美元。

除了这些大手笔,英伟达还投资了一堆 AI 基础设施公司,比如能源公司 Crusoe、AI 模型开发商 Cohere、云服务商 CoreWeave 等等。整个 AI 生态链,英伟达恨不得每个环节都插一脚。

Groq 的结局已经给后来者上了一课。

在这个赛道上,你最好的归宿可能不是上市敲钟,而是被巨头看上,拿一笔丰厚的收购款体面退场。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,钉钉掀桌子!狠人无招狂甩 20+AI 新品,AI 工作操作系统来了

作者 莫崇宇
2025年12月23日 12:39

2026 年,很可能会被后来的人反复提起,作为人类工作方式分水岭的重要一年。

在今年的 OpenAI 开发者大会上, Sam Altman 给出了一个判断:第一批真正意义上的 AI Agent,会开始进入企业体系,像「新工种」一样参与产出。人的职责被压缩为决策与指令,执行层则交给机器完成。

但一个 chatbot 聊天框,显然还承载不起这种野心。

OpenAI 希望用 Apps SDK 把 ChatGPT 变成新的 OS ,试图让所有应用都不再运行于 Windows 或 macOS 上,而是直接「寄生」在 ChatGPT 里。

顶尖 AI 公司在打造操作系统(OS),本质上是为了更好调动智能资源。

回看移动互联网的崛起,光有触摸屏远远不够,iOS 和 Android 这样的操作系统才是关键。AI 能力如果真的要成为企业的生产力,需要一个能统一调度的 AIOS,让零散的模型、工具和流程像安装 App 一样自然运转。

这种对未来计算架构的终极构想,今天在国内有了更落地的答案。

就在刚刚,AI 钉钉 1.1 新品发布暨生态大会在杭州召开,代号为「木兰」的 AI 钉钉 1.1 版本正式发布。

如果只看功能更新,很容易被淹没在产品名里;但如果抓住核心,它的逻辑其实格外清晰:钉钉要成为一个 Agent OS,像 Windows、macOS 那样,给所有 Agent 提供一个统一运行、调度和协作的底层系统。

APPSO 在现场给大家快速梳理了这场发布会的要点:

  1. 钉钉 Agent OS:全球首个为 AI 打造的工作智能操作系统,让 AI 从问答走向干活。
  2. 钉钉 ONE:在这个界面上,工作被 AI 以信息流的形式推送给人,人也可以选择全球所有模型为自己工作。
  3. 企业 AI 硬件 Real: 全球首款专为 Agent 打造的企业级 AI 硬件,提供运行物理环境。
  4. 四大 AI 单品升级:会议记录搭子 AI 听记、AI 录音卡 DingTalk A1、AI 表格、AI 搜问。
  5. 以及基于 Agent OS 打造的一系列商业可交付 Agent,如差旅 Agent、招聘 Agent、研发 Agent、AI 印,以及面向制造业的质量 Agent、订单 Agent,面向门店餐饮行业的销售 Agent、店长 Agent……
  6. 覆盖从模型训练、Agent 开发、通用 Agent、行业 AI 解决方案、用户交互方方面面,堪称新品轰炸!

Agent OS ,为 AI 打造的操作系统

这两年,打工人普遍患上了一种「技术性精神分裂」:网上的 AI 已经聪明到能拿诺贝尔奖了,自己手头的工作却还在用 Ctrl+C 和 Ctrl+V 缝缝补补。

文档是一个孤岛,日程又是另一个孤岛,打工人的一天,基本就是在各种应用功能的缝隙里「仰卧起坐」。要想让 AI 真的接管工作,光靠在聊天框里敲几个提示词是没用的,必须把地基重打一遍。

钉钉这次推出的 Agent OS,就是那个新的地基。或者说 AI 时代的钉钉就是 Agent OS。

作为全球首个为 AI 打造的工作智能操作系统,钉钉没在旧系统上小修小补,而是直接把桌子掀了,给 AI 打造了一层新的工作操作系统,重新做一个新的钉钉,让所有应用和智能体都跑在这上面,被统一调度、统一协同。

怎么理解 Agent OS?可以理解为 AI 时代的 Windows。所以,Windows 操作系统有什么,Agent OS 对应就有什么。

在架构上,它底层由钉钉开放平台提供丰富的 AI 模型及 MCP(Model Context Protocol)能力支撑,再通过钉钉企业 AI 平台(DEAP)、模型训练平台联通了整个软硬件生态,开发者、企业都可以在其上开发 Agent、训练模型,也可以进行模型、Agent 的资源管理、运维。

再往上,其提供了桌面「钉钉 ONE」、Agent 的运行环境「DingTalk Real」、Agent 的指挥官「悟空」。

Gartner 预测,到 2028 年至少 15% 的日常工作决策将通过 Agentic AI 自动完成。钉钉 Agent OS 正是这一趋势的践行者。而为了调度这些 Agent,钉钉还推出了名为「悟空」的通用 Agent。

「悟空」不仅能听懂人话,更具备了规划(Planning)、执行(Acting)和自反思(Learning)的能力。

它就像是一个不知疲倦的个人秘书,你只需要说「帮我安排一次去英国的差旅」,它就会自动拆解意图,调用日历、订票 Agent、酒店 Agent,甚至协同企业自建的专属 Agent,跑通一整条复杂的业务流。

把执行的繁琐留给 AI ,把决策的尊严还给人类。当我们从繁琐的点击操作中解脱,才能把大脑更多内存用在关键的决策和思考上。

钉钉 ONE,消灭一个个功能窗口,给 AI 一个统一桌面

过去的钉钉受困于聊天软件的形态,而钉钉 ONE 彻底重构了交互界面。这可能是用户感知最强烈的变化,新的桌面不再是消息列表的堆叠,而是一个由 AI 驱动的信息流。

首先是能搜、能问、能干的「AI 搜问」。

在全新的 Agent OS 架构中,AI 搜问承担着「指挥官」的核心角色, 它是用户指挥 AI 工作的统一入口, 也是整个 Agent 体系的中枢大脑。

它融合了全球大模型的能力与企业本地知识库,用户的一次提问,既能连接外部世界的知识,也能穿透内部数据的壁垒,甚至直接驱动「悟空」去执行任务。

大模型问答上,AI 搜问还首创三项能力:多模型融合与交叉验证降低幻觉、专有脱敏加解密的安全模式保障数据不泄露、基于真实业务数据与知识图谱推理的事实问答,支撑企业洞察与决策。

AI 钉钉 1.1 发布后,AI 搜问将沉淀为钉钉全局基础 AI 服务,覆盖 IM、AI 表格、AI 听记等场景,自动感知上下文实现统一问答与跨内容检索;同时上线浏览器插件,支持网页划词/点击提问,并可一键把页面信息转为 AI 表格沉淀,实现「钉钉内外随处可问」。

其次是「Agent 主动服务」的新范式。底部的应用变成了可以左右滑动的智能卡片(Agent widgets)。

  • 消息 Agent 成了你的秘书,自动折叠噪音,只提醒真正重要的事。
  • 日程 Agent 全程托管时间,从查闲忙到订会议室,全流程无人值守。
  • 发现-7 新板块则像一个全球情报雷达,利用专门训练的 Agent 实时扫描全球的新产品、新技术与新风险,并以短视频形式呈现在你面前。

你不再是去找工具,而是工具主动来找你。这不仅仅是 UI 的革新,这是工作权的交接——AI 负责处理信息噪音,人负责最终决策。

DingTalk Real,给 AI 一个物理的家

DingTalk Real 是全球首款专为 Agent 打造的企业级 AI 硬件,也是本次发布会上最有趣,也最体现钉钉「To B」基因的部分。

它是 Agent OS 的运行环境,有了这个「盒子」,员工不管在哪,都能远程唤起 AI,安全地访问公司内网和本地文件,比如全网比价订酒店、写深度分析报告。真正实现「人在家中坐,工作 AI 帮你办」。

很多人会问,云端那么强大,为什么还需要一个本地盒子?答案在于 DingTalk Real 解决了两个核心痛点:

  • 数据主权与安全: 企业不敢把财务数据、内网权限完全交给公有云。Real 作为一个部署在企业防火墙内的「安全主机」,让 Agent 可以在隔离的环境中通过浏览器、PC 软件去操作真实的业务系统,既能干活,又不泄密。
  • 永不掉线: 这是一个 7×24 小时的数字员工,能够访问最实时的数据,当然它也可以在深夜依然可以监控市场动态、整合信息,等待第二天早晨向你汇报。

从这个角度看,Real 实际上是在啃企业数字化转型中最硬的那块骨头:让 AI 不止停留在会说话,而是真能安全地、持续地、在组织体系内把事情办了。

硅谷想做的 AI 操作系统,怎么钉钉先做了出来

在硅谷,AI 操作系统几乎是明牌方向。

微软把 Copilot 塞进 Office,Google 把 Gemini 嵌进 Workspace,创业公司则试图从浏览器和桌面重来一遍。但真正复杂的企业工作,藏在审批流、权限、内网系统和行业软件里。

钉钉的不同在于,它原本就是企业的工作底座。Agent OS 不是叠加在工具之上,而是直接生长在组织结构和业务流程里。

别再 Ctrl+F 了,AI 听记用一句话帮你找回关键信息

注意,AI 听记迎来重大升级,能够根据你的身份标签(学生、销售、项目经理)自动贴合最合适的总结模板,像一个懂行的速记员,主动帮你归纳重点。

它不仅能听,还能看。

比如你在课堂或会议上拍一张板书,它能自动识别上面的公式或流程图,并插入到语音记录中。你甚至不需要去翻看冗长的记录,直接问它上周客户对价格有什么异议?它就能从历史录音库中把答案翻出来。

AI 表格:普通人也能写代码,才是 AI 该有的温柔

AI 表格可能是打工人最值得关注的产品。

全新语音交互功能「念一念」支持语音输入自动转换为文字,并由 AI 智能识别字段类型,实现数据的结构化录入。

在蒙牛的牧场里,那些戴着厚手套、打字困难的巡查大叔,现在只需要对着手机说一句「牛舍温度正常」,AI 表格就能自动识别并填入对应字段。

业内首创的「万能贴」功能,能够把乱七八糟的截图、网页复制进去,两秒钟变结构化数据。更夸张的是「AI APP」模式,拍一张手绘草图,AI 直接给你生成一个带仪表盘、带权限管理的完整 CRM 系统。

DingTalk A1:不取代手机,只做最好的外挂

硬件必须服务于具体的、高频的、且手机无法完美解决的场景。作为双 11 的销量冠军,DingTalk A1 并没有试图取代手机,而是选择了做手机的「外挂」。

DingTalk A1 专注于会议记录这一痛点,提供了一键录音和超长续航等功能。销售通话录音更是直接进入 CRM 系统分析意图,HR 面试纪要自动生成。不可否认,这是一次彻头彻尾的实用主义胜利。

如果说前面的产品升级是钉钉自己的「内功修炼」,那么基于 Agent OS 打造的一系列商业可交付 Agent,比如差旅 Agent、招聘 Agent、研发 Agent 和 AI 印等则展现了这个操作系统真正的生态爆发力。

除了上述产品,钉钉还顺手发布了一系列行业大杀器,并展示了其构建开放生态的决心。

钉钉 CEO 无招在发布会上宣布,钉钉已建成全球最大的企业级 MCP 广场和 AI 助理市场。目前,平台上已包含数千个企业常用 MCP 能力和数十个开箱即用的 AI 助理。

  • 制造业与零售业: 针对制造业,它有能看懂订单截图的「订单 Agent」;针对零售业,它有一个能盯着监控分析客流、甚至能去大众点评看差评并提出整改意见的「店长 Agent」。
  • 商业模式的共享: 钉钉为入驻的生态伙伴提供了「算粒分成」和「按效果付费订阅」等模式。这意味着,开发者不再是单纯卖软件,而是与平台一起共享 AI 时代的商业红利。

实际上,这次版本的代号「木兰」颇具深意。

作为古老的被子植物,木兰象征着生命形式从简单向复杂的必然进化。而在数字世界,AI 钉钉 1.1 正试图复刻这一过程:让孤立的 AI 功能,演化为一座万物互联、多 Agent 共生的热带雨林。

钉钉 Agent OS 的诞生,本质上是在提前抢占 AI 办公时代的「入口」。

无招团队的判断很毒辣:在搜索入口式微、操作系统逻辑被重写的当下,唯有主动跳进 AI 的洪流,将钉钉从一个聊天工具重塑为一个能够理解、规划并执行人类意图的「超级系统」,才是最忧解。

这恰恰呼应了 OpenAI 联创卡帕西(Andrej Karpathy)今年那场在 AI 圈刷屏的演讲中提到的观点:

LLM is becoming the OS. Not for your computer, but for your mind(LLM 正在变成一种操作系统——不是管理电脑的,而是管理思维的)。

也就是说,通过用自然语言取代复杂的软件菜单,进而重构人与工具的交互逻辑。

那么为什么 Agent OS 会率先诞生在办公场景中?

究其原因,办公场景天然就是一张被切得稀碎的任务网:人找人、表接表、会连会、审批套审批;每个环节都不复杂,但连起来就是一场令人窒息的消耗战。

Agent 若真要成为「工作入口」,它必须解决的不是会聊天,而是会办事。

于是我们便能进一步理解,钉钉为何如此激进加码 Agent OS:它不缺用户、不缺场景,更不缺流程,只缺一个足够「能跑」的智能体层,把那些看似琐碎的工作串起来,把关键任务节点推到人面前。

过去的我们被职场信息填得太满,喘不过气来。新版钉钉用 AI 重新分配时间与注意力,让人把精力收拢到关键决策与高价值产出上,为工作节奏重新腾出空间。

删繁就简,新一代工作的基本形态,正在钉钉中逐步显现。这是钉钉的 1.1 版本,也是工作本身的 2.0 时代。

作者;莫崇宇、李超凡

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


GPT-5.2 翻车内幕曝光:技术团队没走「歪路」,但用户成了大冤种

作者 莫崇宇
2025年12月19日 17:26

OpenAI 的十周岁生日,过得不太体面。

在当天发布的 GPT-5.2 交出了一份完美答卷:它横扫许多基准测试的 SOTA,在数学和编程等竞赛场景中的表现堪称亮眼,也被官方描述为 AI「超级大脑」。

可到了社交网络,迎接它的不是掌声,而是用户的集体骂街。

在 X 和 Reddit 上,愤怒与失望几乎写在每一条评论里。人们又一次怀念起那个曾经的「白月光」GPT-4o:有人说 GPT-5.2 变得平淡、乏味、像被磨平了棱角;也有人讥讽它成了「把成年人当幼儿园小孩对待」的说教。

当舆论的炮火对准 OpenAI 及其 CEO Sam Altman(山姆·奥特曼),一个尖锐的问题摆在面前:为什么模型更「聪明」了,用户反而更不爱了?

更「聪明」的模型,为什么不讨喜了

The Information 今天凌晨的最新报道,扒出了内幕。

过去一年,OpenAI 内部曾奉行一条铁律:每一次模型的代际飞跃,都会伴随着用户量的爆发式增长,因为「变聪明」带来的体验升级是直观的。但现在,这条铁律失效了。

当然,模型在智能与科研计算领域的提升依旧显著。研究团队耗费数月打磨推理能力,让它能攻克更复杂的数学与科学难题,但对于大多数普通用户而言,这种感知微乎其微。

🔗 https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset

换句话说,智能的提升,并不天然等同于体验的提升。

普通用户很少需要一台「竞赛级大脑」,他们更多需要一个「日常好用的助手」。OpenAI 对 150 万次对话的大规模分析佐证了这一判断,用户的核心需求极其接地气:实用指导(29%)、信息查询(24%)以及写作(24%)等,而与编程任务相关的对话只有 4.2%。

于是矛盾就变得非常具体:当技术团队在实验室里狂卷数理化、狂卷基准测试时,用户在聊天框里只想要一句话解决问题——别绕、别教、别拖。

战线拉得过长是一大槽点。

今年大部分时间里,奥特曼同时启动了多个新项目:视频生成应用 Sora、音乐 AI、浏览器、AI Agent、硬件设备、机器人……摊子越铺越大,资源也被越分越碎。

这其实是科技巨头最常见的经典错误:核心阵地还没打稳,就急着开辟第二、第三战场。短期看是「全面开花」,长期看,贪多嚼不烂,乃兵家大忌——每一条战线都缺人、缺算力、缺产品打磨的耐心。

OpenAI 内部「研究优先」和「产品增长」之间的拉扯,在图像生成上体现得尤为明显:

即便 GPT-4o 的吉卜力风格在三月还短暂带动过 ChatGPT 的使用与用户增长,但 OpenAI 还是一度把图像模型的开发优先级往后放,等到 Nano Banana 口碑发酵后,OpenAI 又紧急回头补课,内部也因此爆发分歧——

奥特曼认定图像模型是用户增长的抓手,研究主管 Mark Chen 则更想把资源押在别的项目上。

另外,伴随着 Scaling Laws 边际效益递减,为了突破大模型的瓶颈,OpenAI 过去一年里押注了推理模型,超过 1000 人的研究团队将资源倾斜于此,导致对 ChatGPT 日常体验的优化被边缘化。

这种做法不仅分散了资源,甚至在年初的内测中出现了性能倒退——为了适配「聊天」场景,反而削弱了推理模型的纯粹性。虽然后来推出了「思考模式」和「深度研究」来分流、来补救,但用户使用率却很低,真正的日常对话体验并没有因此变得更讨喜。

除此之外,新旧模型之间也常出现兼容问题。

例如在发布 GPT-5 前,研究人员发现模型在集成进 ChatGPT 后在部分编程任务上表现变差——因为系统根据用户职业等个性化信息调整回答,结果反而干扰了模型理解,导致错误答案。

诚然,推理模型越来越强,但 ChatGPT 体验越来越拉胯。

当技术进步的方向和用户需求的方向开始分叉,谁会先妥协?答案显而易见。

Gemini 3 Pro 的强势发布,最终把 OpenAI 逼到了墙角,于是便有了奥特曼发布「红色警报」的经典名场面,要求 OpenAI 员工重新聚焦 ChatGPT,提高产品体验吸引力。

而在同一时间,OpenAI 应用负责人 Fidji Simo 也在个人博客中阐述 ChatGPT 的愿景,那就是从主要以文本为主的对话系统,转向能根据用户意图动态生成界面的全生成式 UI。

只是 Simo 也曾承认,公司本质仍以研究为中心,「产品本身并不是最终目标」。

从商业逻辑看,这句话其实很危险。

不同于 Anthropic 更偏向主攻 API 市场,OpenAI 的大头收入来自个人订阅。在消费市场,没有人会为企业的「终极理想」买单,用户只愿为当下的体验付费。这就好比餐厅大厨醉心于研发米其林料理,而大堂里的食客仅仅想要一碗热气腾腾的阳春面。

不过,如果你因此就断言 OpenAI 内部已经乱了阵脚,那可能低估了这家公司的韧性。

据彭博社援引 Mark Chen 的说法,「红色警报」并非新鲜事,而更像是一种战时状态的常态化管理工具。每当 OpenAI 需要集中火力攻克某一单一目标,或要求团队放下低优先级任务时,这种机制就会启动。

▲播客地址:https://x.com/Kantrowitz/status/2001790090641645940

奥特曼在最新的播客中,同样否认了拉响红色警报带来的过度焦虑。

「首先,所谓的『红色警报』,在我们看来其实是一种低风险、但非常必要的应对措施。」奥特曼坦言,「在潜在的竞争威胁出现时,保持一点『偏执』、并迅速做出反应,是件好事。」

他甚至提到了今年年初 DeepSeek 的崛起,认为那和现在的 Gemini 3 一样,都是一种良性的外部刺激。

「Gemini 3 到目前为止,还没带来我们原本担心的那种毁灭性冲击。虽然它和 DeepSeek 一样,精准地刺痛了我们在产品策略上的软肋,但也倒逼我们做出了极其迅速的调整。」

在奥特曼看来,这种紧急状态通常只会持续六到八周。「我很高兴我们有这种快速反应机制,我们不会在这个状态里待太久。」

OpenAI 显然也明白光喊口号不够,他们今天也正式发布了 GPT-5.2-Codex。

作为专为解决复杂现实软件工程问题而生的智能体编程模型,GPT-5.2-Codex 在通用智能的基础上,融合了 GPT-5.1-Codex-Max 的终端操作能力,更擅长处理代码重构、迁移等长程任务。

而同样是在播客的尾声,当主持人询问「GPT-6 还要等多久?」时,奥特曼敞亮地表示:「我不知道我们什么时候会正式把某个模型命名为 GPT-6,但我预计在明年第一季度,会有比 5.2 有显著提升的新模型发布。」

拉响「红色警报」,到 GPT-5.2 系列的反击,再到 GPT-6 的暧昧预告,OpenAI 试图用新模型与新节奏重建信心,但决定长期胜负的,仍是分发入口、生态协同与算力成本等硬门槛。

Google 的阳谋,与奥特曼的 8300 亿「空城计」

Google 的优势,从来不只在 Gemini 3 Pro 这一个模型上,更在于它几乎无可匹敌的分发渠道。

搜索、Chrome、办公套件。在 AI 赛道,护城河可能是所有科技产品中最浅的。 用户的迁移成本几乎为零,当 Google 的 AI 产品如空气般无处不在,这几乎成了一场无解的阳谋——你不需要「被说服」,你只会「顺手就用」。

更重要的是,在与 Google 的较量中,硬件层面的短板成了 OpenAI 最大的软肋。

相比于 Google 十二年前就开始布局专用 AI 芯片(TPU)所建立的效率优势,OpenAI 每年仍需花费数十亿美元租用算力。即便试图通过自建数据中心和芯片来「补课」,但体验在被追平、成本在被碾压的现状已是不争的事实。

用网友的话来说:

OpenAI 现在并不需要一个更强大的模型,它需要的是 AMD。如果 OpenAI 收购了 AMD,这场 AI 之战就将宣告结束。Google 之所以不怕 OpenAI,是因为它拥有自家的 TPU。但它真正该担心的,是 OpenAI 拥有 AMD。

OpenAI 总裁 Greg Brockman 在最近的视频中也坦言,由于算力捉襟见肘,每当新功能上线(如年初 GPT-4o 吉卜力风格),就必须从研究部门「抽血」,把算力挪给产品部。这是一种饮鸩止渴的循环——为了维持今天的用户体验,被迫推迟了明日的技术研发。

可算力这东西,归根到底就是两个字:烧钱。而且是海量地烧钱。

为此,据 WSJ 报道,OpenAI 已计划发起 1000 亿美元的巨额融资;若一切顺利,这家超级独角兽将在明年 Q1 之前,以 8300 亿美元的估值,再次刷新资本市场的想象力。

而在今年早些时候,软银同意向 OpenAI 投资 300 亿美元,并于上月出售所持的英伟达股份价值 58 亿美元,为这笔投资筹资,并预计尽快完成剩余 225 亿美元的出资。

但钱的问题没那么简单。预计到 2030 年,OpenAI 的现金消耗将超过 2000 亿美元。相比之下,Google 财务稳健,甚至能通过 Oracle 等合作伙伴的股价波动间接挤压 OpenAI 的融资前景。

到处筹钱的 OpenAI,看起来更像是在和时间赛跑。于是便诞生了那个笑话:照奥特曼的融资能力,没准哪天连 Google 和英伟达都能「打包带走」。

但玩笑归玩笑,钱能买来时间,却买不来口碑。

所以在 2025 年这个冬天,狂奔三年的 OpenAI 选择先踩一脚刹车,其实是对的:收拢战线、回撤资源,把方向重新对准 ChatGPT 的日常体验。

这是一次昂贵但必要的纠偏。

技术领先不等于产品好用,基准测试第一不等于用户满意。更重要的是,你不能只在用户怀念旧版本的时候,才想起来问问他们的感受。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌