普通视图

发现新文章,点击刷新页面。
今天 — 2026年5月6日爱范儿

OpenAI总裁的私密日记,被马斯克律师当庭念出:让我赚到10亿美元

作者 张子豪
2026年5月6日 14:24

OpenAI 成立前夜,核心大脑 Ilya 差点反悔留在谷歌。

马斯克的律师举着一本被强制公开的私密日记,当着所有人的面,一字一句地读出了 OpenAI 总裁 Greg Brockman 在夜深人静时的盘算
「这是我们摆脱 Elon Musk 的唯一机会……让我赚到 10 亿美元。」

暴怒的马斯克摔门离去,Greg Brockman 在座位上瑟瑟发抖,「真以为他要动手打人」。

这场 AI 世纪庭审现场的走向,比任何一部美剧都要荒诞。

54 岁的马斯克和 41 岁的奥特曼,在 X 上多年以来的互相指责,到了刺刀见红、对簿公堂的这天。

马斯克在第一周的庭审上作证三天,重复最多的一句话是:「你们不能偷一个慈善机构。」

2015 年他出钱出力出名气,帮奥特曼和 Greg Brockman 创办了 OpenAI,承诺 OpenAI 是一个非营利的 AI 研究机构,目标是对抗 Google 的 AI 垄断。

他总共捐了约 3800 万美元。结果 ChatGPT 出来了,公司估值 8500 亿美元,Brockman 个人持股价值 300 亿美元,而他什么都没拿到,还在 2018 年被踢出了董事会。

他说:「是我想出了这个主意,是我起的名字,是我招募了核心人才,把我知道的都教给了他们,提供了所有初始资金。」

马斯克对 OpenAI 及其主要合作伙伴微软提出了超过 1500亿美元 的索赔。他不仅要求赔偿,还要求法院罢免奥特曼的董事会职务,并撤销 OpenAI 转向营利性公司的决定。

OpenAI 则认为,马斯克的诉讼主要是为了打压竞争对手,因为马斯克目前拥有自己的 AI 公司 xAI。

他们提到,在 2017-2018 年间,马斯克本人也曾试图推动 OpenAI 转向营利性结构并寻求绝对控制权。

OpenAI 律师在交叉质询中出示了 2017 年的文件,显示马斯克自己的助理 Jared Birchall 注册了一家名为「Open Artificial Intelligence Technologies」的公司,一个营利性的 OpenAI 替代版本,是马斯克自己主导的。

他也想要那个营利性结构。只是他没能掌控它。

在马斯克作为证人开庭的前两天,他给 Greg Brockman 发了条短信,试探和解可能性。

Brockman 回复:要不双方各撤诉吧。马斯克主动求和没有得到想要的结果,决绝地回应:「本周末结束前,你和奥特曼将成为美国最被痛恨的人。如果你们坚持,就这样吧。」

你根本不懂 AI

在外界看来,马斯克是那个高瞻远瞩、为 OpenAI 注入灵魂和早期资金(约 3800 万美元)的教父;但在 OpenAI 的核心团队眼里,这位亿万富翁缺乏对底层技术的敬畏。

新一轮的庭审坐在证人席的是 OpenAI 的 Greg Brockman,他也毫不留情地揭开了马斯克打造的叙事。

当被问及为何当初不愿意让马斯克担任 OpenAI 营利性实体的 CEO 时,Greg Brockman 的回答极其直白:「他懂火箭,他懂电动车。但他以前不懂,我相信他现在也不懂 AI。」

他继续补充了更多细节,研究员 Alec Radford 曾向马斯克展示过一个极其早期的语言大模型,即 ChatGPT 的雏形。

马斯克输入提示词后,对生成的答案极不满意。他当着研究员的面抱怨「这东西太蠢了」,在第二次尝试依然未能如愿后,马斯克留下一句极其刺耳的嘲讽:「这系统蠢到连网上的小屁孩都能做得比它好。」

在算力成本从 2017 年的 3000 万美元狂飙至 2026 年 500 亿美元的今天,大模型的暴力美学已经被证明是成功的王道。但在当时,马斯克的急躁与轻视,让 Greg Brockman 等人坚定了不能将 AGI 交给他的决心。

可以要他的钱,但绝不能让这个人当 CEO,掌控人类未来的 AGI。

我以为他当时就要揍我

当时,为了筹集巨额的算力资金,双方都在试探成立「营利性结构」的可能性。

马斯克给出的方案极其霸道:要么给我绝对控制权,要么把 OpenAI 直接并入特斯拉,用特斯拉的超算来对抗谷歌。

Greg Brockman 表示当时他们感到了深切的恐惧。

时任 OpenAI 的首席科学家 Ilya Sutskever 在给马斯克的邮件中写下了一段话:「我们的目标是避免 AGI 被垄断。如果创造一个结构,让你想绝对控制就能控制,那一定是个坏主意。」

为了安抚马斯克,会议当天,Ilya 甚至亲自画了一幅特斯拉的画作为「善意的信物」送给他,团队还接受了马斯克赠送的几辆特斯拉汽车。但这种近乎讨好的举动,在马斯克对 OpenAI 权力的核心诉求面前不堪一击。

在这场会议上,当 Greg Brockman 委婉地表达团队拒绝交出单方面控制权时,马斯克一言不发地坐了几分钟,随后突然站起,暴怒地绕着桌子走。

Brockman 在证词中说,那一刻他「真以为马斯克要动手打人」。结果,马斯克一把抓起那幅特斯拉的画,摔门而出,并留下最后通牒:「我会停止提供资金,直到你们决定到底要干什么。」

画被拿走了,资金断了,昔日的盟友正式走向决裂。

硅谷的城府和一本日记

明面上的资金断了,暗地里的互相防备却开始了。

Brockman 在法庭上还提到,马斯克曾满脸「负罪感」地把他叫进办公室,坦白自己暗中挖走了 OpenAI 的核心大将 Andrej Karpathy,去给特斯拉搞自动驾驶。他还强硬地要求 OpenAI 团队裁掉那些「没有重大贡献」的员工。

而在 OpenAI 这边,高管们也明明知道董事会成员 Shivon Zilis 与马斯克有着极其特殊的私人关系,却隐忍不发,利用这层关系维持着脆弱的平衡,直到马斯克彻底亮出 xAI 这个竞品,才将 Shivon Zilis 清理出局。

但比这些权衡更有意思的是,一本 Brockman 写了十年的私密日记。

这本原本藏在电脑深处的日记,在法律程序的强制要求下被公之于众。

马斯克的律师在法庭上,当着所有人的面,一字一句地读出了这位 OpenAI 总裁在夜深人静时的内心盘算:「这是我们摆脱 Elon Musk 的唯一机会……让我赚到 10 亿美元」,以及「如果三个月后我们做共益企业(b-corp),那就是在撒谎。」

OpenAI 律师团队的辩护是:日记是私人思考的真实流露,里面充满自我怀疑和未经过滤的想法,被断章取义了。

OpenAI 上线前一秒,网站还在修改

「如果不是马斯克领导,根本没人会加入 OpenAI。而且他们收了他的钱之后又把他踢了出去。这其实挺不公平的。」

Greg Brockman 还分享了 OpenAI 在发布前差点失去 Ilya Sutskever 的完整故事。

Ilya Sutskever 当时在 Google,已经写好了告别邮件,准备跳槽过来。结果当天晚上,他发了一封标题叫「sad news」的邮件给 Brockman:「我太遗憾了。我实在无法离开 Google。」

与此同时,DeepMind 的员工在一场行业会议上挨个找 OpenAI 的潜在招募对象,告诉他们:「没有人会加入 OpenAI 那个实验室。它是一艘沉船。」

Brockman 为 OpenAI 的官网准备了两个版本,一个有 Sutskever,一个没有。他在最后截止时间发出一条消息,只问了一个字:来还是不来。然后他看着消息框里出现了输入提示符,一直跳,一直跳。然后是一个字:「Alright。」

Brockman 给 Altman 发短信:「他来了。」

马斯克说没有他 OpenAI 就不会存在,这话也许不假。但如果 Sutskever 那天晚上没有改变主意,OpenAI 也不会存在。

面对谷歌的财大气粗,奥特曼原本只敢对外宣布 1 亿美元的融资。

但马斯克极力反对,他明白在硅谷,声量就是生命线。他强硬地表示:必须宣布 10 亿美元,否则显得毫无希望。别人不出的钱,我全包了。

尽管后来马斯克实际上只掏了约 3800 万美元,但这句 10 亿美元的虚张声势,也算是帮初生的 OpenAI 稳住了阵脚。

控辩双方争了很多细节,但 Brockman 证词最后归结到一个问题:非营利结构的承诺,究竟是 OpenAI 对外界的法律义务,还是创始人对自己的道德期许?

马斯克律师 Gerrada 在庭上出示了 OpenAI 2015 年向特拉华州提交的注册文件,里面明确写道,

「本公司的具体目的是为人工智能相关技术的研究、开发和分发提供资金……所产生的技术将造福公众,并在适用时寻求开源……本公司不以任何个人的私利为目的。」

然后他问 Brockman:2017 年到 2018 年之间关于营利性结构的讨论,是不是和这份文件的精神相违背?如今你通过营利性实体,坐拥潜在 300 亿美元财富。

Brockman 的回答是:使命本身没有变,只是结构变了。非营利性的使命可以在营利性的结构下继续实现。

Brockman 的证词预计在 5 月底结束,与马斯克育有四个孩子的 Shivon Zilis、OpenAI 前联合创始人,以及奥特曼随后都将出庭作证。

案件的结果会直接影响当前的 AI 军备竞赛。如果马斯克胜诉,正在筹备史上最大规模 IPO 之一、估值高达 7300 亿美元的 OpenAI 可能会遭到毁灭性打击。

如果 OpenAI 胜诉,奥特曼将彻底巩固对这家拥有 4000 多名员工的巨头的控制权。

参考信息
https://www.theverge.com/tech/917225/sam-altman-elon-musk-openai-lawsuit

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

等 DeepSeek 回复的 30 秒,是手机最好玩的半小时

作者 莫崇宇
2026年5月6日 09:34

你要是问当今互联网最神秘、最玄学、连量子力学都解释不清的「时空裂缝」在哪里?

它不在百慕大,也不在诺兰的电影里,而是在你的 DeepSeek、Claude 或者 GPT 正在思考的过程里。不管是赶期末周的大学生、半夜 Vibe Coding 的程序猿,还是被各种 AI 任务测试的产品经理,大家竟然在同一件事上达成了大和谐:

等 AI 回复的那一分钟,是这一整天里玩手机玩得最快乐、最问心无愧的时刻。

尤其是当你猛击回车键,眼前的屏幕上弹出了那句令人安心的「思考中…」时,这时候,你的大脑皮层向你下达了一个极其合理、极其符合生物学本能的指令:

「好了,它在替我们干活了。咱们低头看一眼手机吧,就一眼,绝不多看。」

然后,你熟练地解锁屏幕,点开社交媒体。起初,你只是刷了两个雪山狐狸啃酱板鸭的猎奇视频,接着滑到了一个「注意看,这个男人叫小帅」的悬疑电影解说,紧接着又顺手给一个搞笑猫咪合集点了赞。

接着,你深吸一口气,抬起头。

等等,刚才发生了什么?

窗外的天怎么黑透了?杯子里的热水怎么凉了?最可怕的是,时钟上的分针怎么平移了小半个表盘?「然后一抬头,十分钟过去了,跟穿越了一样。」

如果你有过这种经历,恭喜你,你已经染上了今年最流行的「AI 间隙摸鱼症」。

神圣的、不可抗拒的赛博「带薪假」

在没有 AI 的年代,摸鱼是需要心理建设的。

你要像雷达一样时刻警惕老板的视线,要伪装出噼里啪啦敲击键盘的清脆回声,还要时刻准备好在有人经过时用 Alt + Tab 瞬间切换到 Excel。那种摸鱼,多少透着一股子辛酸。

但现在,形势逆转了。

当你把一段长达 5000 字的文档丢给 DeepSeek,或者让 ChatGPT 帮你重构那个全是 Bug 的模块时,那一刻,你不是在逃避工作,而是正在等待 AI 生产力的降临。

这种等待是神圣且具有合法性的。既然 AI 还没吐出结果,那我就没法进行下一步。

低情商这叫偷懒,高情商这叫技术性调休。

于是,你心安理得地拿起手机,点开微信刷刷朋友圈,或者去购物平台清空一下购物车。正如网友所说:「它仿佛是我的另一个思考人格,既然它在动脑子,那我这个肉身人格负责娱乐一下,逻辑上非常严密。」

这种既有干正事的虚假踏实感,又能顺势营造出被迫休息的理所应当,堪称 2026 年职场最高级的心法。

其实,这种守着屏幕等进度条的诡异爽感,并不是今天才有的。

把时间拨回千禧年,那是拨号上网的蛮荒时代。伴随着调制解调器那阵刺耳又迷幻的「哔——嘟——呲呲呲」声,你要打开一张只有几百 KB 的剧照,至少需要等几分钟。

那时候没有智能手机,没有短视频。面对缓慢向下加载的图片,你只能选择死死盯着屏幕,或者站起来去倒杯水,甚至趴在电脑桌上打个盹。

后来,宽带时代来了,网速快了,但视频清晰度也上去了。于是我们迎来了视频「缓冲圈」时代。看视频遇到卡顿,我们会熟练地切到别的网页,去天涯或者贴吧灌水,等缓冲条变灰了再切回来。

历史是个轮回,现在 AI 的「思考中」完美填补了这个生态位。

很显然,AI 产品经理们也意识到我们干活注意力不集中的问题,就拿之前曝光的 Claude Code 愚人节彩蛋来说。现在,只要你在 Claude Code 终端里输入一行 /buddy 命令,你的屏幕上就会触发一段孵化动画。

紧接着,一只由 ASCII 字符拼成的小宠物就会破壳而出,稳稳地趴在你的输入框旁边陪你写代码。它不会打扰你,但它会有呼吸的起伏,会冲着你摇尾巴。

包括五一假期期间,Codex 也更新了 Codex pets 功能,允许你直接召唤动画伴侣。只需在输入框敲下 /pet (或者按 Cmd+K 快捷键),一个悬浮的宠物视窗就会出现。

最绝的是什么?这个悬浮窗是跟 AI 状态实时绑定的。它会实时反映 Codex 的状态,贴心地附带一个简短的进度提示,让你不用切回主界面就能掌握一切。

你很难说这算不算是一种进步。从拨号时代盯着屏幕发呆,到缓冲年代跑去贴吧灌水,再到现在,居然有人专门给这段空白时间设计出了有呼吸、会摇尾巴的像素小生命来陪你撑过去。等待这件事,愣是有了不少温度。

一分钟的 AI 相对论

爱因斯坦曾在广义相对论中探讨过大质量物体对时空的弯曲,但他老人家一定没预见到赛博时代的「AI 相对论」。

理论上,一个顶尖的大模型生成一段深度回复,长则一两分钟,短则十几秒。但在这一分钟里,人类的摸鱼潜能会被无限激发,注意力会完成一次史诗级的大迁徙。

等到你终于从无限下拉的信息流、群聊里的惊天大瓜,以及「霸总回归手撕反派」的土味爽剧中猛然惊醒,抬起头时,往往已经大半个小时过去了。

最离谱的是,你会发现刚才的 AI 因为网络波动断线了,或者那个问题它彻底答非所问。这时,你不但没有丝毫愠怒,反而如释重负地松了一口气,带着一丝窃喜,接着毫不犹豫地又点了一次「重新生成(Regenerate)」。

恭喜你,新的半小时又开始了。

当然,也有极少数人间清醒在试图抵抗这种可怕的「时间黑洞」。

毕竟 Attention is all you need.(doge)

他们提出了所谓的「Vibe Coding」防沉迷指南:等 AI 回复时,千万不要切到完全不相干的高负荷任务(比如回复老板消息、刷社交媒体),而是去读读文档、理理思路。

只是这种听起来极其理性的建议,在现实的诱惑面前往往不堪一击。

人类的本质就是趋利避害的,在密密麻麻的英文文档和搞笑宠物视频之间,碳基大脑的防御系统连半秒钟都撑不住。

这届年轻人想得很开:AI 不工作的时候我工作,AI 工作的时候我还工作,那 AI 不就白发明了吗?既然我们把繁重的重复性脑力劳动外包给了硅基生命,那碳基生命自然就顺理成章地退化成了「复制、粘贴、点赞」的流水线机器。

但即便如此,大家依然在努力维持着打工人的最后一丝体面。

在无数个摸鱼的间隙,你总能看到身边的同事时不时地伸出一根手指,在电脑键盘的 Shift 或者空格键上轻轻敲一下——不为别的,只为了不让屏幕进入休眠状态。

哪怕你已经玩到天昏地暗,甚至已经开始在工位上修剪指甲,电脑屏幕也必须骄傲地、长明地亮着。这种对电脑屏幕的「关怀」,是我们对这个疯狂内卷的世界,做出的最后、最倔强的伪装。

甚至有开发者 @konekone2026 打造了一款名叫 Cat Gatekeeper的 Chrome 插件,只要你在电脑前连续浏览网页长达 60 分钟,屏幕上就会突然钻出一只巨大的猫咪。这只猫会毫不客气地挤占你的整个屏幕,让你必须休息 5 分钟。

鲁迅没说过,世上本没有假,等 AI 回复的人多了,也就成了假。

今天虽然是放假的一天,但也希望大家在日常的搬砖岁月里,不要弄丢了这份用 AI 忙里偷闲的快乐,毕竟能让摸鱼变得理直气壮,也算是 AI 时代给打工人最实在的一点馈赠了。

屏幕常亮,心态常好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

刚刚,GPT-5.5 Instant 发布,奥特曼还邀请马斯克参加 AI 办的派对

作者 莫崇宇
2026年5月6日 09:30

就在刚刚,OpenAI 正式推送了 GPT-5.5 Instant,将其设为 ChatGPT 的默认模型,取代此前的 GPT-5.3 Instant,面向所有用户开放。

Instant 系列是 ChatGPT 的日常主力模型,每天有数以亿计的用户在用。官方说,在这个量级上,哪怕只是小幅改进,积累起来的效果也相当可观。

这个版本主打三件事:更准确、更简洁、更懂你。

与上一版本相比,新模型在保持低延迟的同时,在准确性、回复风格和个性化能力上都有明显提升。

准确性的提升,在高风险领域最为突出。内部测试显示,GPT-5.5 Instant 在医疗、法律、金融类问题上的幻觉率较上一版本下降了 52.5%。对用户此前标记过的错误对话,错误率也减少了 37.3%。除文字问答外,图片和照片的分析能力、理科问题的解答质量,以及判断何时应当主动调用搜索工具,都有所改善。

数学和科学能力的跃升幅度更大。在 AIME 2025 竞赛数学测试中,GPT-5.5 Instant 得分 81.2,GPT-5.3 Instant 仅为 65.4。博士级科学测试 GPQA 的得分从 78.5 升至 85.6,多模态推理基准 MMMU-Pro 的得分从 69.2 升至 76,科学图表理解 CharXiv 从 75 升至 81.6,文档解析错误率则从 14.6% 降至 12.5%。

OpenAI 用一道代数题演示了两个版本的差距。用户提交了一道根式方程的解题过程,询问是否正确。GPT-5.3 Instant 发现 x=3 代入原方程不成立后,直接判定「无实数解」,没有再往前追查。GPT-5.5 Instant 同样发现 x=3 无效,但随后定位到用户展开 (x-1)² 时的具体错误,并正确解答。

回复风格也是这次更新的重点。

新模型更简短,不再堆砌格式和表情符号,也减少了不必要的追问。官方以一个日常场景为例:问如何委婉地让话多的同事少说点话。

GPT-5.3 Instant 给出了五种分类策略,还附上「不该做什么」清单,结构完整但略显过度。GPT-5.5 Instant 的回复少了 30.2% 的字数和 29.2% 的行数,语气更像朋友给的建议,把重点放在如何把问题引到自己的专注需求上,而不是对方的说话习惯上。

个性化能力是此次更新的另一条主线。

Plus 和 Pro 用户可以让模型调取历史对话、上传文件以及关联的 Gmail 内容,从而获得更贴合个人情况的回答,不需要每次重新解释背景。官方展示了一个茶馆推荐的对比:GPT-5.3 Instant 只知道用户在旧金山,推荐了几家通用热门店。GPT-5.5 Instant 则从历史对话里找到用户常去 Asha Tea House、偏好高山茶而非重糖奶茶的记录,据此推荐了风格更匹配的 Ceré Tea 和 Song Tea & Ceramics,并说明了推荐理由。

与此同时,所有消费者版本将上线「记忆来源」功能。

当回答用到了个人背景信息,用户可以看到具体调用了哪些历史对话或已保存的记忆条目,并可随时删除或修正过时内容。OpenAI 说明,这个视图展示的是最相关的部分来源,不一定覆盖模型检索过的全部记录,后续会持续完善。不想被记录的用户也可以选择临时对话模式,该模式不会读取或更新任何记忆。分享对话时,对方看不到这些来源记录。

GPT-5.3 Instant 将保留三个月供付费用户使用,之后正式下线。个性化功能目前向 Plus 和 Pro 用户的网页端开放,移动端及免费、Go、企业等版本的推送计划在未来几周内陆续跟进,具体功能因地区而异。对开发者而言,GPT-5.5 Instant 已通过 API 以「chat-latest」名称提供。

哦,对了,今天 OpenAI 也即将举行一场派对。

奥特曼在 Stripe Sessions 的一场对谈里聊到,他在筹备 GPT-5.5 的上线派对时,顺手问了模型一句:你想要什么样的派对?模型认真给了一份清单。它希望派对定在美国当地时间 5 月 5 日,演讲环节越短越好,要有人类创造者上台致祝酒词,但它自己不想上台祝酒。

它还提议现场设一个专门收集 GPT-5.6 建议的环节,并把这些建议反馈给它自己。Sam Altman 说,这些要求「很美好」,能让派对顺利进行。时间最终定在下午 5 点 55 分,也是模型自己的选择。

而派对地点则定在 OpenAI 旧金山总部,非本地嘉宾的机票和酒店由 OpenAI 负责。

受邀名单由 Codex 从推文回复中筛选,报名链接于 4 月 30 日下午 5 点 55 分关闭。24 小时内有超过 8000 人报名,已有用户晒出了收到的邀请邮件。没被选上的人也收到了一封邮件,OpenAI 给他们的 Codex 调用额度提升了 10 倍,有效期到 6 月 5 日。

奥特曼还回应了用户的调侃:马斯克如果想来也可以来,世界需要更多爱。话是这么说,可惜马斯克现在的爱全在状告奥特曼以及 OpenAI 的起诉书里了,庆祝 GPT-5.5 的香槟只能留给奥特曼自己喝了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

早报|iPhone 17包揽Q1全球最畅销手机前三/曝Siri将推出独立App对标ChatGPT/鸿蒙智行回应零重力座椅夹人

作者 Shawn Rain
2026年5月6日 08:18
cover

🤖

OpenAI 发布 GPT-5.5 Instant

📱

曝 Siri 将推出独立 App,对标 ChatGPT

🚗

鸿蒙智行回应零重力座椅夹人

📱

iPhone 17 包揽 2026 年 Q1 全球最畅销智能手机前三

🔧

曝苹果寻求英特尔、三星代工芯片

🤖

郭明錤:OpenAI 首款 AI 手机提速,联发科定制芯片有望明年上半年量产

💰

豆包付费订阅价格曝光,官方回应:始终提供免费服务

💰

OpenAI 曾讨论拆分机器人和硬件部门,CFO 建议推迟上市至 2027 年

💻

苹果砍掉丐版 Mac mini

🦿

宇树机器人买票坐飞机:电池被没收,航班延误 1 小时

💡

黄仁勋:AI 正在创造大量就业,「末日论」只会让人不敢用 AI

🚙

小米昆仑新车再曝光

📱

曝小米 18 Ultra 将推出玄戒 O3 特别版

📱

三星 One UI 9 固件再次泄露新机:Fold 8 外观无变化,阔折叠背面首曝

🎮

Unity AI 公测上线:内置专属 Agent,官方 MCP Server 支持外部 IDE 直连引擎

💻

字节跳动 TRAE SOLO 登陆移动端,可通过对话控制电脑

🛍

苹果推出彩虹系列新品

📱

微信发布五一数据报告:景区支付笔数环比涨 277%、宠物经济增长突出

⚠

抖音辟谣红果短剧收费

📖

2026 普利策奖揭晓,作家李翊云获回忆录奖

重磅

OpenAI 发布 GPT-5.5 Instant

今天凌晨,OpenAI 正式发布 GPT-5.5 Instant,将其设为 ChatGPT 的默认模型,取代此前的 GPT-5.3 Instant。

此次更新聚焦三个方向:准确性、回复风格和个性化能力。

  • 在准确性方面,GPT-5.5 Instant 在医疗、法律、金融等高风险领域的幻觉率较上一版本下降 52.5%,错误对话的错误率减少 37.3%;
  • 数学与科学测试成绩同步提升,AIME 2025 得分从 65.4 升至 81.2,GPQA 从 78.5 升至 85.6,MMMU-Pro 从 69.2 升至 76,CharXiv 从 75 升至 81.6;
  • 在回复风格上,新模型更为简洁,减少了不必要的格式堆砌、表情符号和追问;
  • 个性化能力方面,Plus 和 Pro 用户可让模型调取历史对话、上传文件及关联的 Gmail 内容,以获得更贴合个人情况的回答。

与此同时,「记忆来源(Memory sources)」功能同步上线,当回答用到个人背景信息时,用户可查看具体调用了哪些历史对话或已保存的记忆条目,并可随时删除或修正。不想被记录的用户可选择临时对话模式。

OpenAI 今天还将在旧金山总部举办一场由 AI 主导策划的上线派对。奥特曼透露,他在筹备过程中直接问了模型「想要什么样的派对」,模型给出了一份清单:

演讲环节越短越好,要有人类创造者致祝酒词,但它自己不想上台;现场还需设置一个收集 GPT-5.6 建议的环节。派对时间定在下午 5 点 55 分,同样是模型自己的选择。

受邀名单由 Codex 从推文回复中筛选,24 小时内逾 8000 人报名。未被选中的用户收到了 Codex 调用额度提升 10 倍的补偿。奥特曼还回应了网友关于马斯克是否受邀的调侃,称「世界需要更多爱,他想来也可以来」。

🔗 相关阅读:刚刚,GPT-5.5 Instant 发布,奥特曼还邀请马斯克参加 AI 办的派对

曝 Siri 将推出独立 App,对标 ChatGPT

彭博社报道,苹果将会为 iOS 27 的 Siri 打造独立的 App 入口。

据介绍,独立后的 Siri 将拥有历史对话回顾以及全新的聊天界面,并允许用户选择第三方的 AI 模型。报道指出,这一做法是为了对标 ChatGPT、Gemini、Claude 等第三方 AI 聊天机器人。

值得一提的是,新版 Siri 不仅拥有全新的界面设计,还能通过 App Store 来支持第三方 Agent 功能、拥有一句话处理多项指令的能力。

另据此前信息,iOS 27 的相机中还会加入 Siri 模式,用于 AI 视觉识别等功能。

大公司

鸿蒙智行回应零重力座椅夹人

近期,一段享界 S9 零重力座椅无防夹保护的视频出现在网络。

从视频来看,小朋友坐在正在折叠状态的副驾座椅上,但座椅并未及时暂停动作并且最后完成折叠。

而在昨天,鸿蒙智行发言人账号发布情况说明:

鸿蒙智行部分车型配备二排零重力座椅,均具备防夹功能,系统会实时感知座椅受力变化,达到触发阈值即停止动作并回弹防护。

经技术核验,网传视频场景未达到防夹功能触发阈值。

鸿蒙智行方面还表示,在零重力座椅工况设计上还设置了多重安全防护保障乘员安全:

  • 当副驾座椅检测到占位信号或已插入安全带时,不会折叠副驾座椅;
  • 通过语音开启零重力座椅时,系统会提醒用户注意乘客和物品安全,用户需再次确认;
  • 零重力座椅展开过程中,点击零重力座椅物理按键,会立即停止展开。

*图片内容来自博主「槐角不甘心」

iPhone 17 包揽 2026 年 Q1 全球最畅销智能手机前三

据 Counterpoint Research 昨日发布的最新《全球手机型号销售追踪报告》,苹果 iPhone 17 成为 2026 年第一季度全球最畅销智能手机,占全球出货量的 6%;前十名机型合计贡献了全球出货量的 25%,创下一季度最高集中度纪录。

iPhone 17 系列包揽前三名,三星 Galaxy A 系列则在前十中占据五席,小米 Redmi A5 位列第十。数据显示,iPhone 17 本季度在中国、美国等关键市场实现了两位数的同比增长,在韩国更实现了三倍增长。

三星方面,Galaxy A 系列以多款机型覆盖不同价位段,其中 Galaxy A07 4G 是本季度最畅销的安卓智能手机,在中东、非洲和拉丁美洲等新兴地区销量表现突出;旗舰机型 Galaxy S26 Ultra 以微弱差距未能进入前十,但初期销量已超越前代机型。

Counterpoint 高级分析师 Karn Chauhan 指出,前十名机型在全球销量中的份额预计将在今年进一步扩大。持续的内存短缺推高零部件成本,给安卓厂商在大众市场带来更大压力,市场下滑预计对中低价位段影响更为显著,高端机型份额则持续增长。

曝苹果寻求英特尔、三星代工芯片

据彭博社报道,苹果正在研究引入英特尔和三星代工其主要处理器,以在台积电之外寻求备选。

记者 Mark Gurman 援引知情人士表示,苹果已与英特尔就晶圆代工服务进行早期阶段磋商,同时有苹果高管赴访三星位于德克萨斯州、尚在建设中的先进芯片工厂,目前合作仍处于探索阶段。

供应短缺是此次探讨的直接诱因。在此前的 2026 财年第二季度业绩电话会议上,苹果 CEO Tim Cook 表示,iPhone 和 Mac 所需芯片的短缺正在制约公司增长,「供应链的灵活性低于正常水平」。

苹果目前正与台积电合作,在亚利桑那州凤凰城扩大本土产能,今年预计将从该地获得 1 亿颗芯片,但仅覆盖苹果年度设备出货量的一小部分。库克此前曾多次提示过度依赖单一地区供应的风险。

郭明錤:OpenAI 首款 AI 手机提速,联发科定制芯片有望明年上半年量产

昨天,天风国际证券分析师郭明錤更新了对 OpenAI 首款 AI 手机的预测,称该设备的量产时间表已大幅提前,预计最早将于明年上半年进入量产阶段。

在芯片供应商方面,联发科目前已成为最有力的候选方,高通此前也曾被列为考虑对象。郭明錤透露,OpenAI 手机将搭载联发科定制版芯片,基于天玑 9600 改款,采用台积电下一代 N2P 制程,预计于今年下半年正式亮相。

在芯片设计上,该定制芯片将以 AI 能力为核心,而非单纯追求性能跑分。其中,ISP(图像信号处理器)被列为「主打卖点」,增强 HDR 处理管线,提升设备对周围环境的视觉理解能力,以契合 AI 手机持续感知与分析现实世界的使用场景。

此外,芯片还配备双 NPU 架构,用于处理不同类型的 AI 任务,并支持 LPDDR6 内存与 UFS 5.0 存储。郭明錤预计,若项目进展顺利,该设备明年与 2028 年的合计出货量有望达到约 3000 万部。

豆包付费订阅价格曝光,官方回应:始终提供免费服务

近日,豆包 App Store 页面出现付费版本服务声明,披露了三档订阅价格:

标准版连续包月每月 68 元(连续包年 688 元)、加强版连续包月每月 200 元(连续包年 2048 元)、专业版连续包月每月 500 元(连续包年 5088 元)。

从定价来看,标准版 68 元/月略低于 ChatGPT Plus 约 142 元/月的价格;专业版 500 元/月则对标企业级重度生产力场景。目前,豆包各端产品内暂未出现相关付费入口。

另据第一财经报道,豆包官方回应称,豆包始终提供免费服务,在免费服务的基础上,豆包也在探索推出更多增值服务,以满足不同用户的差异化需求。

接近豆包的人士透露,付费功能将主要专注于复杂任务和生产力场景,包括 PPT 生成、深度数据分析、影视制作、超长文档解析、专业 AI 绘画、4K 视频生成等。免费版本则将继续面向日常对话、短文案、翻译、答疑等轻量需求。

🔗 相关阅读:豆包要推付费版了,有件事比值不值更重要

OpenAI 曾讨论拆分机器人和硬件部门,CFO 建议推迟上市至 2027 年

据《华尔街日报》报道,OpenAI CFO Sarah Friar 曾私下向公司领导层建议将 IPO 时间推迟至明年,理由是公司尚未具备满足公开市场严格信息披露要求的能力。

与此同时,另一篇报道披露,Altman 去年底曾讨论将机器人和消费硬件部门分拆为独立实体,以便两者能够独立融资、自主运营,同时减轻对核心业务的财务拖累。

但该方案最终被否决,原因之一是分拆后的新实体在会计处理上仍可能需要并入 OpenAI 的资产负债表。知情人士称,公司未来仍可能重启这一讨论,届时或将参考 Alphabet 的控股公司架构,将核心业务与探索性业务在财务报告中分开披露。

OpenAI 近期错失了部分内部用户和营收目标,正将资源集中于核心产品,砍掉了视频生成工具 Sora、转向打造面向开发者和企业用户的「超级应用」,以应对 Anthropic 在编程工具领域带来的竞争压力。

外部时间压力同样存在。银行方面告知 OpenAI 和 Anthropic,率先上市的一方将优先获得市场资金支持。

苹果砍掉丐版 Mac mini

五一假期期间,苹果悄悄从官网下架了 256GB 入门款版本的 Mac mini,现在最低配置为 16GB + 512GB,起售价也涨到了 5999 元。

🔗 相关阅读:苹果悄悄砍掉丐版Mac mini,人人都要交「AI 税」的时代来了

而就在下架的前一天,苹果 CEO Tim Cook 在财报电话会议上承认,Mac mini 和 Mac Studio 正面临严重的「供应受限」。

他将原因归结为:这两款产品已成为颇受欢迎的 AI 与智能体工具平台,市场需求远超预期。财报数据显示,苹果 2026 财年第二季度总营收达 1112 亿美元,同比增长 17%,Mac 业务逆势增长 6%,达 84 亿美元。

宇树机器人买票坐飞机:电池被没收,航班延误 1 小时

据 CNN 报道,近日,一台由宇树科技生产的人形机器人乘坐西南航空从加州奥克兰飞往圣地亚哥,因机载锂电池容量超出 FAA 规定上限,被机组人员现场拆卸并暂扣,导致航班延误逾 1 小时。

这台名为「Bebop」的机器人隶属于达拉斯设备租赁公司 Elite Event Robotics,本体为宇树 G1 基础款人形机器人,身高 1.2 米,重约 70 磅(约 31.75 公斤)。

由于运输箱重量超出西南航空托运限额,公司工作人员为其购买了一张客票。机器人登机后,机组人员先以安全为由将其从靠近过道的座位强制调至靠窗位置,随后在例行排查中发现其动力电池容量超标,最终要求现场拆除电池,否则拒绝起飞。

抵达圣地亚哥后,因失去动力,Bebop 无法自主行走,工作人员只得徒手将其搬出航站楼。Elite Event Robotics 表示,正在设法追回被扣电池,并已向芝加哥加急寄送备用电池,以保障后续演出行程。

💡 黄仁勋:AI 正在创造大量就业,「末日论」只会让人不敢用 AI

据 TechCrunch 报道,英伟达 CEO 黄仁勋当地时间 4 日在米尔肯研究所举办的活动上接受 MSNBC 主播 Becky Quick 的访谈时表示,人工智能正在「创造大量就业机会」,而非外界所担忧的大规模失业推手。

黄仁勋在谈及 AI 对劳动力市场的影响时持乐观立场。他认为,AI 是美国「再工业化」的最佳机遇,驱动了一批新型工业工厂的建设 —— 这些工厂生产的正是 AI 基础设施所需的硬件(英伟达的核心业务即在于此)。

他同时强调,自动化取代的是具体任务,而非整个职位。

工作的目的与工作中的任务是相关的,但并不等同。

对于「AI 将主宰人类」或「将摧毁大量行业」的论断,黄仁勋明确表示反对。他称自己最担忧的,是这类科幻式叙事令公众对 AI 产生恐惧,进而拒绝使用这项技术。

新产品

小米昆仑新车再曝光

近期,一组疑似小米新车的谍照图曝光。

据博主「小鱼干」消息,该车型为小米新车昆仑系列(此前被称为 YU9)。从图片来看,新车定位中大型 SUV,配备全新设计的前大灯设计,车头顶部配备激光雷达。

🔗 相关阅读:不挂小米标?自研芯片?小米 YU9 爆料汇总

据悉,尽管外界已经习惯将小米即将发布的增程 SUV 称为「YU9」,但实际上它很有可能会脱离小米主品牌,成为一个独立的品牌系列。

目前有消息称,该系列极大概率被命名为「Skynomad」,中文名或为「寻天」,新车的车尾和方向盘也将换成「SKYNOMAD」的专属标识,不再悬挂大家熟悉的小米车标。

并且该系列将提供三个尺寸的新车,分别为小五座的昆仑 10、大五座昆仑 20 以及大七座昆仑 30,其中昆仑 20 提供车顶升降。

曝小米 18 Ultra 将推出玄戒 O3 特别版

据 GSMArena 援引科技爆料人 Yogesh Brar 报道,小米 18 Ultra 可能推出搭载自研芯片玄戒 O3 的特别版,预计于今年 12 月正式发布。

此前,已有消息称玄戒 O3 将率先搭载于小米 Mix Fold 5,预计今年 8 月发布。

爆料信息来看,玄戒 O3 采用「超大核+性能大核+小核」(Prime + Titanium + Little)的新型三簇设计。

在具体频率上,其超大核主频由前代玄戒 O1 的 3.89GHz 提升至 4.05GHz,性能大核主频微增至 3.42GHz。值得关注的是,O3 「小核」主频从 1.79GHz 大幅提升 68% 至 3.02GHz。

三星 One UI 9 固件再次泄露新机:Fold 8 外观无变化,阔折叠背面首曝

据 Android Authority 报道,三星 One UI 9 预发布固件中出现了两款即将推出的折叠屏手机图片,分别为 Galaxy Z Fold 8(内部代号 Q8)与阔折叠(内部代号 H8),这是继今年 2 月在 One UI 9 中发现阔折叠动画后,三星再次在固件中披露新机信息。

从固件图片来看,「阔折叠」新机的外观与此前流出的工程渲染图高度吻合,整机呈横宽短厚比例,后置摄像头模组的设计风格接近 Galaxy S25 Edge,外屏同样为宽幅矮屏,内屏则为 4:3 比例,更接近一台可折叠平板形态;

Galaxy Z Fold 8 方面,固件图片显示其外观与 Galaxy Z Fold 7 几乎一致,与此前流出的渲染图相互印证。据此前爆料,Fold 8 将搭载 5000mAh 电池,支持 45W 有线快充。

Galaxy Z Fold 8 与阔折叠预计将于 7 月 22 日在伦敦举办的三星 Galaxy Unpacked 发布会上正式亮相,同场发布的还有 Galaxy Z Flip 8 小折叠。

Unity AI 公测上线:内置专属 Agent,官方 MCP Server 支持外部 IDE 直连引擎

游戏引擎巨头 Unity 近日宣布 Unity AI 正式开启公测,内置专属 Agent、AI Gateway 和官方 MCP Server 三项核心组件,打通了第三方大模型与 Unity 引擎的底层连接通道。

  • 内置 Agent 基于 Unity 超过 20 年的最佳实践数据训练而成,可在编辑器内直接读取场景上下文、理解游戏对象与组件,并执行编辑器操作,同时支持对 AI 生成内容进行回滚和权限管控;
  • AI Gateway 为已订阅其他 AI 服务的开发者提供了第三方 Agent 的接入通道,此类调用不消耗 Unity 官方积分;
  • 官方 MCP Server 则允许开发者从外部 IDE 桥接并控制 Unity 编辑器,Unity 官方称其执行性能优于现有开源替代方案。

定价上,Unity Pro、Enterprise 和 Industry 订阅用户可在现有席位中直接使用上述功能,无需额外付费;个人版用户可申请 14 天免费试用,获赠一次性 1000 积分,试用结束后转为每月 10 美元订阅,每月包含 1000 积分。

数据隐私方面,官方表示用户项目数据默认仅用于提供服务,不用于训练 AI 模型;AI 生成资产将嵌入元数据标签,标记其生成来源。

字节跳动 TRAE SOLO 登陆移动端,可通过对话控制电脑

字节跳动旗下 AI 编程产品 TRAE 昨日正式推出 TRAE SOLO 移动端,用户现可通过手机随时发起任务、继续工作或远程操控电脑。

TRAE SOLO 定位为智能工作助手,支持通过对话完成产品开发、数据分析、报告生成、PPT 制作等专业任务。

新消费

苹果推出彩虹系列新品

昨天,苹果照惯例在五月准时推出新款 Apple Watch 彩虹版回环式运动表带、配套表盘及 iPhone 和 iPad 壁纸。

据介绍,本次新款彩虹版回环式运动表带使用 11 种颜色的尼龙纱线织成,售价 379 元。

而新版彩虹表盘呼应表带设计,可动态折射不同色彩。表盘设计包含两种几何图案:与时针方向一致的散射状彩色光线,以及反射编织图案多彩条纹的垂直线条。

新壁纸也已经登陆昨日面向开发者推送的 iOS 26.5 RC 和 iPadOS 26.5 RC,正式版预计本月到来。

微信发布五一数据报告:景区支付笔数环比涨 277%、宠物经济增长突出

微信官方公众号「微信派」昨日发布 2026 年五一假期数据报告。报告显示,今年五一期间国内消费热度集中在北京、上海、重庆、广州、深圳五座城市,消费金额同比涨幅最高的三座城市依次为新乡、呼和浩特、安阳。

  • 微信支付景区交易笔数环比大涨 277%,微信搜索热门景点前三名分别为天安门广场、橘子洲头和万岁山武侠城;
  • 餐饮小程序打开次数环比增长 26%,重庆、成都、武汉、苏州、杭州(除北上广深外)位列餐饮行业交易笔数前五城市;
  • 演出赛事相关交易笔数环比增长 153%,电影演出小程序打开次数环比增长 198%;
  • 视频号「粤 BA」相关内容发布量较节前三日增长 175%,「苏超」相关内容发布量增长 103%。

宠物消费亦呈现明显增长态势。五一期间,宠物食品用品及服务行业交易笔数环比上涨 62%,微信小店宠物用品订单量同比上涨 127%。

抖音辟谣红果短剧收费

5 月 4 日深夜,抖音集团副总裁李亮发文,否认近期网络上流传的「红果短剧开始收费」说法。

李亮表示,红果短剧此前陆续引入了部分影视内容,依据相关版权方的合规要求与行业惯例,该部分少数影视内容需开通 VIP 权限才能观看。

他强调,免广告会员服务属于满足用户差异化体验的自愿选项,不会强制收费,也不会改变用户免费追剧的核心模式。

李亮同时指出,无论是免广告 VIP 服务,还是极少量需 VIP 才能观看的影视内容,均为 2024 年 2 月红果上线早期便已存在的功能,并非近期新增动作。

好看的

2026 普利策奖揭晓,作家李翊云获回忆录奖

昨天,2026 年普利策奖正式揭幕,华裔作家李翊云凭借回忆录《万物自然生长》(Things in Nature Merely Grow)获得回忆录 / 自传奖。

该作于去年出版,是李翊云为其逝世的 19 岁小儿子所写。评委会在授奖词中称,这部作品以克制而倔强的笔调,聚焦于真相、语言与生命的延续,书写了接纳命运的心路历程。

在今年其他文学艺术类奖项中:

  • 小说奖:丹尼尔·克劳斯(Daniel Kraus)《天使陨落》(Angel Down)
  • 戏剧奖:贝丝·沃尔(Bess Wohl)《解放》(Liberation)
  • 历史写作奖:吉尔·莱波尔(Jill Lepore)《吾等民众:美国宪法史》(We the People: A History of the U.S. Constitution)
  • 诗歌奖:朱莉安娜·斯帕尔(Juliana Spahr)《诗艺》(Ars Poeticas)
  • 非虚构奖:布莱恩·戈德斯通(Brian Goldstone)《我们没有立足之地:美国的劳动者与无家可归者》(There Is No Place for Us: Working and Homeless in America)
  • 音乐奖:加夫列拉·莉娜·弗兰克(Gabriela Lena Frank)作曲《蜂鸟:一个未来的神话》(Picaflor: A Future Myth)

诺兰《奥德赛》正式预告发布

克里斯托弗 · 诺兰执导的新片《奥德赛》昨日发布正式预告,北美定档 7 月 17 日。

《奥德赛》改编自荷马同名史诗,讲述特洛伊战争结束后,奥德修斯历经十年艰险回乡的故事。全片采用 IMAX 胶片摄影机拍摄,为诺兰迄今技术规格最高的一部作品。

《星球大战:曼达洛人与古古》定档 5 月 22 日

《星球大战:曼达洛人与古古》日前发布新海报与预告片,定档 5 月 22 日上映。

影片延续剧集主线,聚焦丁·贾伦与原力学徒古古这对非血缘父子在动荡银河系中执行绝密任务的冒险故事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

昨天以前爱范儿

OpenAI「复活」了 QQ宠物,网友直接玩疯,把奥特曼和他死对头都养在了电脑里

作者 张子豪
2026年5月3日 16:22

谁不想在自己的电脑上养一只小宠物,打开电脑,它就坐在那里看着你工作。

OpenAI 最近在 Codex 上的更新,引入了类似电子宠物 Tamagotchi 的桌面悬浮伴侣。

我们可以在摸鱼的时候,把鼠标悬浮到小宠物上逗它,还能拖着它在屏幕的各个位置游走;而在工作的时候,这只悬浮宠物还会实时显示 Codex 的工作状态。

和之前 Anthropic 在 Claude Code 终端里推出的像素宠物不太一样,Codex 的这只会全局地在我们的电脑上呈现。无论切换到哪个 App,它都在那个角落。

以前是人与人的聊天软件里,像是 QQ,需要一个 QQ 宠物从桌面右下角蹦出来,给它取一个名字,建立情感的联系,而它会告诉我们消息来了。

现在这件事,来到了人与 AI 的故事里。

从微软大眼夹到 Mac 访达笑脸,万物皆可宠物化

Codex 官方内置了 8 款像素风的基础宠物,包括默认原始的经典 Codex 形象,还有一只整洁的小鸭子 Dewey、适合快速迭代项目的火球 Fireball,以及一只小小的蓝屏捣蛋鬼 BAOD(Blue Screen of Death) 等。

我们可以在 Codex 设置>外观 最下面的宠物部分找到配置的相关信息。

▲Codex:最初的 Codex 伙伴。|Dewey:一只整洁的小鸭,适合平静工作的日子。|Fireball:热路径能量,适合快速迭代。|Rocky:当 diff 变得很大时,它是一块稳稳的石头。|Seedy:为新想法冒出的小绿芽。|Stacky:一个平衡的堆叠,适合深度工作。|BSOD:一只小小的蓝屏捣蛋鬼。|Null Signal:来自虚空的安静信号。

但真正有意思的是,Codex 的自定义宠物功能。

通过使用 Codex 自带的 /hatch 指令,我们可以上传任何图片,Codex 会自动把它孵化成一个动画宠物,并保存在本地文件夹中,方便我们打包分享给其他人。

使用 /hatch 指令之前,我们还需要输入命名 $Skill Installer hatch-pet 来安装自定义宠物的 Skill。它会自动从 OpenAI 的官方 GitHub 仓库里面,下载对应的 Skill 文档。

▲Skill 文档链接:https://github.com/openai/skills/tree/main/skills/.curated/hatch-pet

准备就绪,我们使用 hatch pet Skill 输入 $hatch-pet 做一个 labubu 的桌面宠物

Codex 会自动按照 Skill 里的流程,先生成一张主图,根据这张主图再生成 idle、running-right、running-left、waving、jumping、failed、waiting、running、review 等多种不同状态图片。

每一种状态,Codex 都会生成 4-8 帧的图片。

等待它生成全部状态的图片,合成为动画,我们就能得到一个自定义的桌面电子宠物。

社交网络和开发者社区也利用这一功能,创作了大量能提升 vibe coding 幸福感的桌面宠物。

像是恶搞 Anthropic CEO,做了一个愤怒的达里奥,还有奥特曼,「一个有趣的像素风格 Sama 灵感宠物,带着焦虑的斜视眼睛,头上戴着太阳镜,穿着灰色T恤和牛仔裤,散发出混乱会议室的能量。」

▲Codex 宠物大全,PetShare 平台:https://codex-pet-share.pages.dev/

一些怀旧党立刻复刻了微软经典的大眼夹(Clippy),那个在我们新建文件、打开文件夹,都会跳出来,多两句嘴的桌面宠物,用 Codex 获得了新生。

苹果粉丝,就用 Codex 这套 Skill 做了一个相当生动的 Mac Finder(访达)笑脸小人 Lil Finder Guy,让它悬浮在程序坞上方,仿佛系统原生的一部分。

甚至还有人做出了乔布斯版本的宠物,以及像是 DeepSeek 的那只鲸鱼等。

▲另一个宠物社区,Petdex:https://petdex.crafter.run/

▲ 来源:https://x.com/GOROman/status/2050343893921923145

在极短的时间内,PetShare 和 PetDex 这样的社区驱动型宠物图鉴网站,如雨后春笋般涌现。

多邻国的那只猫头鹰、经典动漫角色龙珠里的悟空、神探福尔摩斯、旅行青蛙、哈利波特、哆啦 A 梦等等,都成了 Codex 的热门宠物选择。

▲电影《拯救计划》里的 Rocky

为了给这波热潮添把火,OpenAI 甚至官方下场举办了比赛:只要你生成的宠物被官方选入「最喜爱的 Top 10」,就能获得 30 天的 ChatGPT Pro(200 美元/月)奖励。

我们也在 Codex 里生成了一些小宠物,都是通过简单的两三个字的提示词。像是「做一个原神里旅行者荧的桌面宠物」,不过需要注意的是,生成自定义宠物需要的时间较长,同时消耗的额度也比较大。

▲ 在生成第二个桌面宠物时,直接提示 5 小时内额度用完了。

更多 Codex 桌面宠物案例:

PetShare:
https://codex-pet-share.pages.dev/#/?sort=popular

PetDex:
https://petdex.crafter.run/

电子宠物是 AI 的灵动岛

把这些自定义的宠物放到 Codex 里面也非常简单,可以直接下载文件压缩包,复制到对应的文件夹,然后在设置里进行选择。

直接在 Codex 中输入简单的 /pet 指令,我们的桌面上也能快速召唤出一个活蹦乱跳的电子宠物。

这个电子宠物,除了可爱,还确实有一点用处。

它不写代码,不 debug,唯一的工作是偶尔弹出对话气泡,告诉我们 Codex 正在后台做什么——「思考中」「任务完成」「需要你来决定一件事」。

任务完成了,点它一下,直接回复,继续。

▲ 一边刷 X,一边提醒我 Codex 进度

以往我们无论是用 Claude Code、OpenClaw,还是就在 DeepSeek 里面聊天,把一个任务交给他们,总是时不时需要切回对应的窗口,看看它是不是卡住了,是不是还在思考。

现在,这只悬浮在屏幕最顶层的宠物,会通过气泡和动作告诉我们 Codex 的后台状态。

基于生成的多种状态,这只桌面宠物,如果开始在挠头了,就说明它正在「思考」;它弹出气泡,就说明它完成了任务,或者需要我们提供进一步的输入。

更有意思的是,如果我们在它发消息时点击它,就可以直接开启一条回复 AI Agent 的双向通道。它就像是 macOS 桌面上的一个跨应用灵动岛,让我们在专注当前工作流的同时,对 AI 的进度了如指掌。

一直在更新的 Codex

电子宠物的功能在社交媒体上给 Codex 带来了又一波的好评,网友们都在说,这也太可爱了,情绪价值非常到位。

看着自己喜欢的小宠物在桌面上跳动,要比看着进度条转圈要心情好上不少。

但 Codex 这次在更新桌面宠物的同时,还悄悄放了两个新功能。

Codex 现在能够自动检测我们的电脑上,是否有其他 AI 编程工具,比如 Claude Code 留下的配置文件。

一旦检测到类似如 CLAUDE.md 的文档,它会主动建议并一键导入所有的插件、项目约定和自定义规则。

如果你也是为了避开不同平台的使用频率限制,让在多个 AI 之间反复横跳,这项更新降低了一定的切换成本。

另一项更新是在 Codex 内新增了「听写词典」,允许我们预先录入个人的常用缩略语和短语。

对于习惯用语音让 AI 写代码的用户来说,专有名词和缩写经常会被错误识别,导致反复修改。现在通过添加对应的条目,可以让减少我们纠错的麻烦。

OpenAI 也开始用最频繁的更新,把用户留在自己的生态里。

配置文件的跨端迁移、更懂用户的语音工具,加上那些在屏幕上挥手、打盹、偶尔还会抖动一下的悬浮宠物……

奥特曼在 X 发文说,感觉 Codex 正在经历 ChatGPT 时刻。

虽然事后奥特曼解释是 Goblin 时刻,但是 Codex 这接二连三的更新,也能看到 Codex 确实正在向一个更完整的、具备极高粘性的桌面「超级应用」进化。

在 AI 能力逐渐同质化的今天,产品的魅力和情绪价值,变得和代码生成能力一样重要

就像那位做出 Lil Finder Guy 宠物的网友,分享了一段 AI 发给他的话,宠物用乔布斯的腔调说:

致敬那些小小的存在,那些悬在 Dock 上摇摇晃晃、时不时打个盹的小帮手,它们让工作变得轻一点。致敬 Codex 宠物。

好了,看着桌面上那个正冲我挥手的像素小怪物,我可能也得出门去溜达一圈了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

早报|苹果:下季度内存成本压力将显著加大/宇树最便宜人形机器发布/5月1日高速车流或创历史纪录

作者 Shawn Rain
2026年5月1日 08:55
cover

📱

iPhone 18 Pro 或迎最强相机升级:更大的长焦光圈、新增「Siri 模式」

🐳

DeepSeek 论文发了又删,「给 AI 装上手指」的视觉推理方案提前曝光

💰

苹果毛利率创历史新高、内存成本压力将「显著加大」

🧠

三星 Q1 芯片利润暴涨 49 倍,单部门吃掉全集团 94% 营业利润

🔍

追觅 CEO 俞浩回应要求全员开社媒:是为培养「复合能力」,AI 时代单一能力将被取代

🚗

赛力斯一季度卖出 78500 辆新能源车,研发费用同比增长 70.7%

🤖

小红书设立 AI 一级部门

🎮

D 加密反制破解出新招,正版玩家被迫每 14 天联网「打卡」

💻

奥特曼:Codex 将成为我与电脑交互的主要方式

🤖

模型爱说「哥布林」,OpenAI 花了数月才找到根源

📖

俞敏洪回应东方甄选 180 万股争议:「硬给我的」,兑现后全部捐出

🚙

高通二季度营收 106 亿美元,汽车芯片创历史新高

🦿

特斯拉纯电半挂首台量产车下线

🤔

OpenAI 联合创始人:软件 3.0 时代,Prompt 就是新的代码

💡

微软 CEO:与 OpenAI 的新协议对微软「稳赚」

🦿

2.69 万元起,宇树科技发布双臂人形机器人 R1 系列

🤖

阿里发布「数字员工」QoderWake

🧠

英伟达发布全模态模型 Nemotron 3 Nano Omni

🧠

百灵大模型开源万亿级综合旗舰模型 Ling-2.6-1T

🧠

千问开源大模型「透视镜」Qwen-Scope

⚠

「五一」出行预警:5 月 1 日高速车流或创历史纪录

📋

上海发布首份快递行业劳动规则协议:投诉未经核实不得罚款

重磅

iPhone 18 Pro 或迎最强相机升级:更大的长焦光圈、新增「Siri 模式」

据彭博社报道,今年秋季发布的 iPhone 18 Pro 系列预计将迎来该产品线上有史以来最大的相机硬件升级。记者 Mark Gurman 援引爆料指出,iPhone 18 Pro 的主摄预计将配备可变光圈技术,长焦镜头也将采用更大的光圈。

苹果还计划在即将推出的 iOS 27 中为相机 App 加入「Siri」模式,取代现有的视觉智能独立界面,与传统的拍照和录像选项并列。

在该模式下,用户可调用 ChatGPT 等服务对画面中的内容进行提问,或使用 Google 进行图像圈搜。值得注意的是,报道还称苹果将为 Siri 模式重新设计快门按钮,以适配 Apple Intelligence 风格。

Gurman 认为,这些相机与 AI 软硬件的结合,将为苹果接下来计划推出的一系列基于 Siri 的可穿戴设备(包括新款 AirPods、智能眼镜和吊坠)铺平道路。

DeepSeek 论文发了又删,「给 AI 装上手指」的视觉推理方案提前曝光

昨晚,DeepSeek 发布多模态推理新论文《Thinking with Visual Primitives》,但数小时后相关推文与 GitHub 页面均被删除,APPSO 在此前读完了整篇论文。

🔗 相关阅读:DeepSeek连夜删掉的新论文,到底说了什么

论文指出,当前多模态大模型在视觉推理上存在「引用鸿沟」(Reference Gap)—— 模型看清了图像,却无法在推理过程中精确指向其中的具体对象。

DeepSeek 的解法是让模型在思考链中直接输出图像坐标(边界框或坐标点),将「指」这一动作嵌入推理过程本身,而非仅作为最终答案输出,研究者将其类比为人类「边指边想」的认知方式。

在效率上,同等尺寸图像 Gemini-3-Flash 需消耗约 1100 个 token,Claude-Sonnet-4.6 约 870 个,GPT-5.4 约 740 个,DeepSeek 仅用 90 个信息单元,腾出的算力全部用于推理中的坐标标注。

在「迷宫导航」基准测试中,DeepSeek 以 66.9% 的正确率领跑,作为参考,GPT-5.4 50.6%,Gemini-3-Flash 49.4%,Claude-Sonnet-4.6 48.9%(该任务随机猜测正确率为 50%,后三者接近随机水平);

论文也坦承了现有局限:精细场景下坐标精度仍不足(数手指翻车即为直接体现);视觉原语模式需特定触发词激活,模型尚不能自主判断何时使用;拓扑推理在训练分布外的泛化能力有限。

大公司

苹果毛利率创历史新高、内存成本压力将「显著加大」

当地时间 4 月 30 日,苹果发布 2026 财年第二财季(截至 3 月)业绩,营收 1111.8 亿美元,同比增长 17%,EPS 2.01 美元,均超华尔街预期。各业务板块表现如下:

  • iPhone 营收 569.9 亿美元,同比增长 22%,略低于 LSEG 分析师预期的 572.1 亿美元;
  • 服务营收 309.8 亿美元,同比增长约 16%,超预期的 303.9 亿美元;
  • Mac 营收 84 亿美元,超预期的 80.2 亿美元;
  • iPad 营收 69.1 亿美元,超预期的 66.6 亿美元;
  • 可穿戴、家居及配件营收 79 亿美元,超预期的 77 亿美元;
  • 毛利率达 49.3%,高于上季度的 48.2%,亦超预期的 48.4%。

本季度最值得关注的两个亮点:

  • 大中华区营收 205 亿美元,同比大涨 28%,恢复强劲增长势头;
  • 服务业务持续拉升整体利润率,毛利率已连续多个季度走高,当前 49.3% 的水平创历史新高;研发支出同比增长 33% 至 114.2 亿美元。

展望本财季(6 月季度),苹果预计营收同比增长 14%-17%,大幅超越分析师此前预期的 9.5% 增速。CFO Kevan Parekh 指出,受全球 AI 需求驱动的内存短缺影响,下季度内存成本压力将「显著加大」,公司将就此「评估多种应对方案」。

三星 Q1 芯片利润暴涨 49 倍,单部门吃掉全集团 94% 营业利润

据路透社、CNBC 报道,三星电子今年 Q1 实现营收 133.9 万亿韩元(约 900 亿美元),同比增长约 69%;营业利润 57.2 万亿韩元,同比增长约 8.5 倍,创历史新高,超出分析师预期的 55.28 万亿韩元。

DS(Device Solutions,含存储芯片及晶圆代工)部门 Q1 营收 81.7 万亿韩元,同比大增 225%;营业利润 53.7 万亿韩元,去年同期仅约 1.1 万亿韩元,增幅约 49 倍,占集团整体营业利润的 94%,几乎榨干其他部门的利润空间。

反观去年同期,MX(手机及网络)部门以 4.3 万亿韩元独撑集团利润的 64%,DS 部门占比仅 16%。今年 Q1,MX 部门营业利润骤降至 2.8 万亿韩元,同比下滑 35%;显示屏部门营业利润亦下跌 20% 至 4000 亿韩元。

AI 数据中心建设热潮是本季核心驱动力。三星在财报电话会上直言「需求满足率已跌至历史最低」,客户因担忧供货短缺而提前锁定明年订单,供需缺口预计在明年进一步拉大。

三星同时披露,今年 2 月已率先实现 HBM4 芯片量产并向英伟达 Vera Rubin 平台出货,今年 HBM 营收目标为同比增长逾三倍,正加速追赶 SK 海力士在 HBM 市场的领先地位。

🔗 相关阅读:三星内存铁面无私,三星手机被迫亏损

追觅 CEO 俞浩回应要求全员开社媒:是为培养「复合能力」,AI 时代单一能力将被取代

昨天,追觅科技创始人兼 CEO 俞浩在微博发文,要求「每一个追觅员工,都开通所有平台的社交媒体账号」,每天用 15 分钟发布 3 条视频,介绍正在研发的产品、技术或公司产品卖点与核心创新。

他同时披露奖励机制:真实粉丝达 1 万人奖励 1 万元,达 5 万人奖励 5 万元,达 10 万人奖励 10 万元。俞浩表示,光追觅员工自身,就要有至少两万多个账号。

同日晚间,俞浩再度发长文回应外界质疑,将这一要求定性为培养员工「复合能力」的举措。

工程师们,天然擅长于面对复杂的参数,解决上千个的技术难题,但是不擅长与人沟通,不擅长把事情简单表述清楚!想训练大家讲人话,用通俗易懂的语言,把自己的产品和技术讲清楚!

他同时澄清,已有几十万粉丝的人加入追觅并不能直接获得对应奖励,「那还是单一能力」;只有同时掌握技术能力与传播能力,才符合「复合能力」标准,届时才会给予相应激励。

俞浩还表示,在 AI 时代,单一能力极易被取代,只有掌握复合能力的人才能「驾驭 AI、驾驭复杂系统、统领更大的团队」。

赛力斯一季度卖出 78500 辆新能源车,研发费用同比增长 70.7%

昨天,赛力斯集团披露 2026 年第一季度报告,今年一季度实现营收 257.5 亿元,同比增长 34.5%;归属于上市公司股东的净利润为 7.5 亿元,同比微增 0.9%;利润总额为 8.5 亿元,同比下降 4.8%,新能源汽车销量 78500 辆。

  • 营业成本为 189.9 亿元,对应毛利率约 26.2%,较去年同期略有收窄;
  • 研发费用为 17.9 亿元,同比增长 70.7%,较去年同期增加约 7.4 亿元;
  • 销售费用为 37.2 亿元,同比增长 39.7%;
  • 财务费用由去年同期的净收益 1.4 亿元转为净支出 9581 万元。

值得关注的是,扣除非经常性损益后归母净利润仅为 1.03 亿元,同比大幅下滑 73.9%,与 GAAP 口径归母净利润 7.5 亿元之间存在显著差异。差异主要来源于本季度 6.3 亿元的非经常性损益,其中政府补助贡献 6.3 亿元。

小红书设立 AI 一级部门

据财联社报道,小红书昨日通过全员内部信官宣新一轮组织升级,柯南(本名丁玲)升任总裁,统管社区、电商、商业化三大核心业务及技术体系,直接向 CEO 星矢(毛文超)汇报。

AI 是本次调整的核心关键词。小红书成立 AI 一级部门 Dots,直接向柯南汇报,定位为构建从模型研发、基础设施到产品应用的全链路技术体系;同步成立企业智能部,整合原企业效率部与数据科学部。

国际化方面,小红书正式成立海外业务部门 Rednote,直接向 CEO 汇报;跨境电商平台 Redshop 预计今年 6 月上线。此外,创新孵化部门 Lab1327 同步设立,由产品设计负责人樱木牵头。

D 加密反制破解出新招,正版玩家被迫每 14 天联网「打卡」

近期,为应对破解,Denuvo(D 加密)与 2K Games 联合对旗下多款游戏实施了更严格的授权限制,在玩家社群中引发强烈反弹。

受影响的游戏包括《NBA 2K25》《NBA 2K26》及《漫威暗夜之子》。这些游戏现已启用固定有效期的离线授权令牌,令牌将在约 14 天后自动失效。

无论玩家是否更换硬件或重装系统,一旦令牌到期,游戏将直接无法启动,必须联网重新获取授权才能继续游玩。

今年早些时候,破解组织 MKDev 和 DenuvOwO 开发出基于 Hypervisor 的绕过方案(HVB),通过安装内核级驱动拦截并模拟 Denuvo 的验证请求,使得几乎所有受 Denuvo 保护的单机游戏均遭到破解或绕过。

奥特曼:Codex 将成为我与电脑交互的主要方式

日前,OpenAI CEO Sam Altman 在 Stripe 年度开发者大会上表示,Codex 正迎来「爆发式增长」,并直言这款 AI 编程工具将成为他与电脑交互的主要方式。

他将这波爆发归因于模型推理能力的整体跃升、代码场景的用户反馈闭环,以及数据积累的共同作用,并补充说「一旦你知道某件事是可能的,就更容易全力去做」。

目前 Codex 的核心用户仍以编程为主,但 Altman 透露,非编程场景的使用深度已超出预期

OpenAI 的目标,是让 Codex 不止于编程,而是覆盖「你在电脑前所做的所有工作」。Altman 坦言目前非编程部分「大概只完成了 10%」,但随着真实用户涌入,他预计会「很快追上」。

支撑这一切的,是 OpenAI 在模型训练上愈发激进的路线。Altman 早前在《大西洋月刊》CEO Nicholas Thompson 的播客中被追问:OpenAI 有没有跑过完全用合成数据训练的模型?

他停顿了一下,说「我不确定该不该说」—— 这句话本身已近乎默认。他随即解释,模型的核心能力是推理,而推理完全可以用纯合成数据习得

他以数学为例:一个从未见过人类数据的模型,能不能比人类算得更好?「我觉得可以。」但理解人类价值观则不同,「一个没接触过人类文化的模型大概率做不到」。

Thompson 此前也提到,GPT-4 是「最后一个没怎么用 AI 数据的模型」,Altman 对此表示认同。

模型爱说「哥布林」,OpenAI 花了数月才找到根源

昨天,OpenAI 发文复盘了困扰 GPT 系列多代模型的「哥布林」问题 —— 从 GPT-5.1 起,模型在回答中越来越频繁地使用哥布林、小妖精等奇幻生物作为比喻。

数据显示,GPT-5.1 上线后,ChatGPT 对话中「goblin」一词的出现频率上升了 175%,「gremlin」上升了 52%。到 GPT-5.4 阶段,问题彻底爆发。

文章指出,该问题与 ChatGPT 的「书呆子」(Nerdy)人格定制功能有关。这一人格的系统提示词要求模型「用语言的趣味性消解一本正经」、「承认世界的怪异并享受它」。

训练时,用于强化该人格风格的奖励信号对含有奇幻生物词汇的输出持续打出更高分,在 76.2% 的数据集中均可观察到这一偏向。「书呆子」人格仅占 ChatGPT 全部回复的 2.5%,却贡献了 66.7% 的「哥布林」提及量。

目前,OpenAI 已下线该人格、移除相关奖励信号并过滤训练数据,并表示一套新的模型行为审计工具已经落地。

🔗 相关阅读:谁在 GPT-5.5 脑子里塞了一群「妖怪」?

俞敏洪回应东方甄选 180 万股争议:「硬给我的」,兑现后全部捐出

据鞭牛士报道,东方甄选日前发布公告,依据 2023 年股份激励计划,向公司董事、高管及核心员工授出 1930.14 万股股份奖励,涉及 302 人,占已发行股份 1.82%,授予当日收盘价为 28.44 港元/股。

其中,执行董事、主席兼CEO 俞敏洪获授 180 万股,占比 0.17%;执行董事、CFO 尹强获授 45 万股,占比 0.04%;其余 300 名员工合计获授 1705.14 万股,占比 1.61%。

此次授股随即引发外界质疑,舆论焦点集中于「自己给自己发奖励」一说。昨天,俞敏洪在个人社交平台发文作出回应。

俞敏洪透露,自己最初曾明确拒绝,且自东方甄选成立至今从未领取过任何工资。但董事会代表股东方面认为,若无股权激励,其付出与回报「不对等」,最终说服其接受授予。

俞敏洪同时承诺,待股权兑现并完成纳税义务后,全部现金收益将用于三个方向:设立董事长奖励基金,用于奖励为东方甄选做出杰出贡献的员工;捐赠至新东方基金会,全部用于支持农村中小学生;捐献一部分给北京大学,帮助来自农村的北大学生。

高通二季度营收 106 亿美元,汽车芯片创历史新高

昨天,高通发布今年第二财季(截至 3 月 29 日)业绩:

当季营收 106 亿美元,同比下滑 3%;GAAP 净利润 73.7 亿美元,同比大增 162%,主要受一次性税务利好驱动;Non-GAAP 摊薄每股收益 2.65 美元,同比下滑 7%。

  • 半导体业务 QCT 营收 90.76 亿美元,同比下滑 4%,税前利润率收窄至 27%(去年同期 30%);
  • 手机芯片营收 60.24 亿美元,同比下滑 13%,受存储供应紧张及部分手机 OEM 需求疲软拖累;
  • 汽车芯片营收 13.26 亿美元,同比增长 38%,创单季历史新高
  • IoT 营收 17.26 亿美元,同比增长 9%;
  • 授权业务 QTL 营收 13.82 亿美元,同比增长 5%,税前利润率升至 72%。

高通预计第三财季营收区间为 92~100 亿美元,Non-GAAP 摊薄每股收益指引为 2.10~2.30 美元;存储供应约束及相关价格压力将继续影响部分手机 OEM 的需求,预计来自中国客户的 QCT 手机营收将在第三财季触底,此后恢复环比增长。

特斯拉纯电半挂首台量产车下线

昨天,特斯拉官方正式宣布,旗下「纯电半挂式重卡」Semi 的首台量产车已正式从内华达超级工厂的专属高产能产线下线。

根据今年 2 月公布的最终量产规格,该车型提供两个版本:满载 8.2 万磅总重下续航 325 英里的标准续航版(售价约 26 万美元),以及续航 500 英里的长续航版(售价约 29 万美元),成为目前市场上标价最低的 Class 8 级别纯电牵引车。

在核心技术参数上,两款车型均搭载 800 千瓦三电机动力总成,最大功率达 1072 马力,并支持 1.2 兆瓦的 Megacharger 快充,可在约 30 分钟的法定休息时间内恢复 60% 的续航里程。

此外,内华达工厂实现了高度垂直整合,配套的 4680 电池电芯在同一厂区内制造,直接消除了前期限制 Semi 产能的供应链瓶颈。

OpenAI 联合创始人:软件 3.0 时代,Prompt 就是新的代码

近日,AI 研究员、OpenAI 联合创始人安德烈 · 卡帕西(Andrej Karpathy)在红杉资本 AI Ascent 峰会访谈中提出了「软件 3.0」这一新范式概念,并表示即便是他这样的顶尖工程师,也在当前 AI 浪潮中感到「前所未有的落后」。

卡帕西将软件发展划分为三个阶段:软件 1.0 是人类编写的显式代码,软件 2.0 是通过数据训练得到的神经网络权重,而软件 3.0 则以大语言模型(LLM)作为核心计算解释器,开发者通过提示工程来操控模型。

他将上下文窗口比作「操纵 LLM 这一解释器的杠杆」,认为编程的本质正在从编写逻辑转向编排与监督智能体集群。

他将去年 12 月视为个人体验上的分水岭。彼时他开始大量使用 AI 智能体工具进行编程,并发现最新模型生成的代码片段已「近乎完美」。这种信任感的建立,也让他意识到传统编程技能正在经历不可逆的贬值。

不过,卡帕西同时指出,当前 AI 模型存在明显的「参差不齐的智能」问题:大模型在数学、代码等可被明确验证的领域能力极强,但在常识性逻辑上仍频繁出错,如经典的「步行 50 米去洗车店」。

他认为,擅长智能体工程的开发者,效率提升将远超传统意义上的「10 倍程序员」。他还建议企业彻底重构招聘流程,以「布置大型完整项目、观察候选人如何调用智能体工具构建并攻防系统」取代传统算法题考核。

而对于人类的核心价值,卡帕西认为,即便 AI 智能体可以处理所有底层 API 细节,人类依然是系统中不可或缺的瓶颈 —— 负责把控架构美学、逻辑边界,以及决定「构建什么」和「为何值得去做」。

💡 微软 CEO:与 OpenAI 的新协议对微软「稳赚」

据 TechCrunch 报道,微软 CEO 萨提亚 · 纳德拉(Satya Nadella)昨天在财报电话会议上对微软与 OpenAI 修订后的合作协议对公司财务的影响作出正面表态。纳德拉表示,新协议对各方而言均属利好。

我们对与 OpenAI 的合作感到满意。我一直非常注重确保任何合作关系都能形成双赢的格局,这也是保持良好合作关系的前提。

他强调,微软在新协议下仍保留了对 OpenAI 知识产权的访问权限至 2032 年,包括其前沿模型和 AI Agent 产品,且无需再为此付费。

对于 OpenAI 此前宣布与微软最大的云计算竞争对手亚马逊达成独家合作一事,纳德拉并不以为意。微软最新季度财报显示,其 AI 业务年化收入已突破 370 亿美元,同比增长 123%。

纳德拉还指出,微软从 OpenAI 获取收益的渠道不止于此。此前,OpenAI 与微软达成协议,承诺购买逾 2500 亿美元微软云服务;微软还持有 OpenAI 27% 的股权。

此外,纳德拉着重强调,企业客户通常倾向于同时使用多个 AI 模型,OpenAI 在行业内、尤其是在企业市场的相对优势已不如以往突出。

我们提供的模型选择范围在所有超大规模云服务商中最为广泛,客户可以根据不同工作负载选择 OpenAI、Anthropic、开源模型等。目前已有逾 1 万名客户使用了不止一个模型。

新产品

2.69 万元起,宇树科技发布双臂人形机器人 R1 系列

昨天,宇树科技正式发布双臂人形机器人系列 R1,起售价 2.69 万元,是目前已知最便宜的商业化人形机器人,主打「超快速部署,多场景落地」,面向工业、商业等多类应用场景。

共推出四款型号:R1-A5、R1-A7、R1-A5-D 与 R1-A7-D,分别对应 5 自由度和 7 自由度单臂配置,可选二指夹爪、三指灵巧手或五指灵巧手,以及固定底座与移动底盘两种安装方式,供电支持外部供电或锂电池,电池续航约 1.5 小时。

以 R1-A5 为例,整机总自由度为 15,R1-A7 则达到 19,单臂自由度分别为 5 和 7,腰部自由度 1,头部自由度 2。末端夹爪精度达 ±0.1mm,手臂最大负载约 2kg。

固定底座版本(R1-A5/A7)收缩状态下为 520×440×683mm,升起后达 520×440×1323mm,整机重量约 11kg(R1-A5)至 13kg(R1-A7),外部供电。移动底盘版本(R1-A5-D/A7-D)整机重量则分别约 30kg 和 32kg。

该系列标配双目视觉模组,机身与头部均搭载 8 核高性能 CPU,头部模组额外提供 10TOPS 算力,支持选配升级至 NVIDIA Jetson Orin 高算力模组,算力最高可达 100TOPS;支持 WiFi 6 与蓝牙 5.2。

开发生态方面,宇树开放了底层、机械臂、音频、灯光、视觉控制等接口,支持拖动示教,面向开发者提供全栈二次开发能力。

阿里发布「数字员工」QoderWake

昨天,阿里发布数字员工产品 QoderWake 与 Qoder 移动端两款 Agent 产品,覆盖企业和个人使用场景。

QoderWake 定位为业界首个安全可控、持续进化的生产级数字员工产品,能够在真实工作环境中承担软件工程师、运营、分析师等具体岗位角色:

  • 采用创新的 Harness-First 架构,任务执行后,系统会将经验归类沉淀至记忆、技能、策略、验证规则和工作流五个维度,解决通用 AI 智能体「做完即忘」的问题;
  • 可根据预设规则自主执行任务,并自动回溯任务轨迹、主动复盘;
  • 可持续淘汰过时经验、合并冲突、撤回失效策略,确保「越用越准」。

目前,QoderWake 已上线「数字程序员」角色,并在阿里内部正式上岗,可自主完成反馈分类、日志分析、根因定位和自动生成修复代码等工作,全流程无人值守,人工仅在部分场景做最终确认。

Qoder 移动端则支持用户远程操控桌面端 Qoder 完成任务。该应用可直接展示与 AI 智能体交互过程中的思考链与工作流,并支持主动弹窗和用户确认细节,以提升整体使用体验。

英伟达发布全模态模型 Nemotron 3 Nano Omni

英伟达昨天发布了开放式多模态模型 Nemotron 3 Nano Omni,将视觉、音频与语言能力整合至单一系统,专为 AI 智能体工作流设计。

该模型采用 30B-A3B 混合专家模型(MoE)架构,无需独立感知模型即可完成多模态推理,在保持相同交互性能的前提下,吞吐量比同类开放式全模态模型高 9 倍。核心亮点包括:

  • 计算机操作:支持 1920 x 1080 原生输入分辨率,H Company 基于其推出的计算机操作 AI 智能体在 OSWorld 基准测试中取得显著进展;
  • 文档智能:可解析文档、图表、表格及混合媒体,支持视觉结构与文本内容的连贯推理;
  • 音视频理解:将语音、画面与记录内容整合至单一推理流,适用于客服、研究与监测场景。

模型以开放权重形式发布,支持从 NVIDIA Jetson、NVIDIA DGX Spark 等本地设备到数据中心和云环境的全场景部署,并可与英伟达 Nemotron 系列其他模型或第三方专有模型协同使用。

百灵大模型开源万亿级综合旗舰模型 Ling-2.6-1T

百灵大模型昨日正式开源万亿级综合旗舰模型 Ling-2.6-1T,面向真实生产环境中的 Agent、Coding、知识管理与自动化办公等场景专门优化,以更高效的「快思考」压缩同等智能水平下的输出成本。

在 Artificial Analysis 的综合评测中,Ling-2.6-1T 以约 16M output tokens 达到约 34 分的 Intelligence Index,进入高吸引力区间,已与 GPT-4.5(Non-Reasoning)展现出同档的综合智能表现。

Ling-2.6-1T 还在多个关键榜单上达到开源 SOTA 水平,具备从网页与设计生成、代码开发到写作文本生成的多维能力。

🤗 Hugging Face: huggingface.co/inclusionAI/Ling-2.6-1T

👾 ModelScope: modelscope.cn/models/inclusionAI/Ling-2.6-1T

千问开源大模型「透视镜」Qwen-Scope

昨天,千问团队发布并开源了大模型可解释性模块 Qwen-Scope,通过在 Qwen 模型隐藏层插入稀疏自编码器(SAE),将模型内部复杂的参数运算「翻译」成人类可理解的特征概念,进而实现对模型行为的分析与定向干预。

  • 推理控制:无需修改提示词,直接操控特征激活即可改变输出语言或文风。例如关闭「中文特征」可消除英文回复中异常混入中文词的问题,激活「古典中文特征」则可将续写风格从白话文切换为文言文;
  • 数据处理:仅需少量种子样本即可完成毒性内容分类,无需训练额外分类器;定向合成的补充数据相比传统方案,训练数据能效比提升约 15 倍;
  • 训练优化:在监督微调阶段,通过对异常激活特征设计损失函数,可显著压低语言混用等低质回复的出现频率;在强化学习阶段,通过控制特征提高「重复生成」等低频异常的采样概率,加速模型优化;
  • 评估去冗:通过计算不同评测集之间的特征激活重叠度,识别重复评测问题。分析发现 GSM8K 与 MATH 重叠度高达 0.63,MMLU-Pro 与 SuperGPQA 重叠度达 0.50,部分常用评测集的实际参考价值因此存疑。

🤗 Hugging Face: huggingface.co/spaces/Qwen/QwenScope?spm=a2ty_o06.30285417.0.0.65e5c921MGq3Tu

👾 ModelScope: modelscope.cn/studios/Qwen/QwenScope?spm=a2ty_o06.30285417.0.0.65e5c921FZvQi4

新消费

「五一」出行预警:5 月 1 日高速车流或创历史纪录

据央视网报道,交通运输部路网中心日前发布《「五一」假期全国公路网运行研判分析报告》,预计今年「五一」假期全国天气总体利于出行,全国高速日均流量约为 6400 万辆。

根据报告预测,今年「五一」假期五天内,全国高速日均车流量均将超过 6000 万辆次,流量峰值将出现在 5 月 1 日,预计达 7000 万辆次,创历年「五一」单日流量新高。假期期间全国高速公路免费通行。

报告同时指出,假期拥堵路段主要集中在江苏、湖北、湖南、安徽等省份,以及沈海、沪渝、沪蓉等高速主干线,建议出行者提前规划路线、错峰出发。

另据报道,若不小心坐过站,可及时找列车员说明情况,铁路部门会安排最近一趟车免费送回。

上海发布首份快递行业劳动规则协议:投诉未经核实不得罚款

据澎湃新闻报道,昨天上午,上海市首份《2026 年上海市快递行业劳动规则协议》正式签订,覆盖在沪 9 家头部平台企业,共十章 47 条。主要内容覆盖:

  • 收入保障:在沪满一个月快递员月最低工资不低于上海市标准的 110%;每单派费直达比例原则上不低于应得派费的 25%;
  • 投诉处罚:企业不得未经核实仅凭用户投诉处罚快递员,并推动向正向激励转变;
  • 劳动保护:建立极端天气停止揽投及免予处罚机制;企业须定期组织安全培训并配备防护用品;
  • 休息权利:通过轮休、调休、年休假等方式保障快递员定期休假权利;
  • 反内卷条款:禁止成员单位开展低于成本揽收、倒挂补贴等不当竞争行为。

星巴克 ×《只此青绿》打造端午限定体验

昨天,星巴克中国宣布与舞蹈诗剧《只此青绿》达成跨界联名,以「色、形、意」三重维度将《千里江山图》的东方意境融入产品、空间与沉浸式体验。

核心产品方面,2026 年星冰粽全面以《只此青绿》为主题焕新,推出玫瑰山楂、芋泥麻薯、冰沁冻椰椰、绿豆浸酒酿四款风味。包装首次采用立体展卷式礼盒,拆盒即展开《千里江山图》经典片段。

线下体验层面,星巴克将臻选杭州河坊街非遗概念店升级为《只此青绿》主题高光店,重磅呈现「入画千里江山绿韵特展」,完整展现舞剧展卷、问篆、唱丝、寻石、习笔、淬墨、入画七大篇章。

好看的

喜剧电影《三心两意》今日上映

五一档喜剧电影《三心两意》今日正式上映。

影片讲述女主角江芮琳发现丈夫罗斌与余小鱼存在特殊关系,在救下试图轻生的余小鱼后,两人结成合作关系,共同展开一系列整治「渣男」的计划,以喜剧手法呈现女性互助与反击的故事主线。

经典惊悚片《大白鲨》定档 5 月 15 日

经典惊悚片《大白鲨》昨日官宣定档 5 月 15 日。影片由史蒂文·斯皮尔伯格执导,豆瓣评分 7.8,讲述度假胜地艾米蒂岛因大白鲨连环袭击陷入恐慌,警长布罗迪、捕鱼手昆特与生物学家胡珀三人联手出海展开生死较量的故事。

影片于 1975 年 6 月在美国首映,彼时斯皮尔伯格年仅 28 岁。《大白鲨》上映后创下当时全球最高票房纪录,累计票房达 4 亿美元,并由此开创了好莱坞「暑期档大片」这一概念,被影史视为暑期商业大片的起源。

《宇宙巨人:希曼崛起》官宣引进

奇幻史诗巨制《宇宙巨人:希曼崛起》昨日官宣引进内地,北美定档 6 月 5 日上映,内地档期待定。

影片改编自 80 年代同名经典动画 IP,故事讲述原本在地球过着平凡生活的「社畜」亚当,寻得神剑后得以回归埃坦尼亚大陆,却发现故土已被骷髅王的黑暗势力掌控、满目疮痍。

为守护家园,他再度握起力量神剑,高喊那句响彻一代人记忆的经典口号 ——「赐予我力量吧!我是希曼!」,由此展开一场史诗级对决。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

一加 Ace 6 至尊版体验:将手机和掌机,二合一

作者 梁梦麟
2026年4月30日 18:06

4 月 28 日,一加发布了 Ace 6 系列的第三位成员,一款把游戏体验点满的性能款——一加 Ace 6 至尊版,单机定价 3799 元起,国补后 3499 元起。

外观方面,一加 Ace 6 至尊版延续了 Ace 6 系列的设计模式,有黑紫色组合的「王牌觉醒」和钛金属色的「金属风暴」两款配色可选。

「金属风暴」配色后盖采用全新的「钛合金 AG 玻璃」工艺,细腻的磨砂后盖上手感觉非常丝滑,侧面看到的透光边缘也增加了机身的层次感。后盖设计简单干净,仅保留中心的一加标志,还有位于左上角金属魔方 DECO。

DECO 采用方形圆角设计,左侧放置了「主摄+超广角」双摄结构,右侧则是补光灯和 ACE 系列的标志。

黑色版本「王者觉醒」用到了全新的「3D 立体刻光」工艺,将一个大型的 ACE LOGO 放在哑光黑后盖的中间位置,顺着不同角度的光线,会呈现出类似 LOGO 发光的效果。

手机采用了同配色的哑光磨砂金属中框,除了右侧的电源键、音量键外,机身左侧还有一个自定义按键,初次登入的时候就能够在引导中进行设置,用来呼出智能助手或开启游戏模式都可以。

整机支持 IP66 & IP68 & IP69 & IP69K 的防水防尘,正反亮面都搭载了 OPPO 晶盾玻璃,提升了机身的耐磨耐摔和防水性能。

手机正面搭载了一块 6.78 英寸 2772×1272 1.5K 165Hz 超高刷东方屏,屏幕常规最高亮度为 800nits,全局激发的最高 1800 nits,25% APL 亮度最高能达到 3500nits,支持「太阳显示」模式,在户外也不影响使用。

一加强调这块屏幕有更高的色准,显示画面通透的同时暗部能够显示更多细节,游戏中有设计显示增强增强的功能,位于暗位的人也能够看得再清晰一点。

另外,一加 Ace 6 至尊版支持了新一代「明眸护眼」,支持 3840Hz PWM 调光和 4.5% 低蓝光显示,也有游戏暗光护眼模式。机内搭载了 Display P3 Lite 显示芯片,支持 100% DCI-P3、HDR10+、杜比视界、ZREAL 和 HDR Vivid 显示,从刷新触控到现实都是较为全面的一块旗舰配置屏幕。

性能方面,一加 Ace 6 至尊版搭载了天玑 9500 移动平台,内置 LPDDR 5X 运行内存和 UFS 4.1 储存组合,常温状态下安兔兔跑分为 3410548。

手机配备全新一代「风驰游戏内核」,同样配备了新一代灵犀触控芯、电竞网络芯 G2 Pro 组成的三芯组合,在这个组合下最高支持:

  • 165fps、144fps、120fps 无限满帧
  • 原生级 165fps GPU 渲染超帧
  • 灵犀触控芯片支持最高 4000Hz 瞬时触控采样率

用它来玩《原神》和《明日方舟终末地》的操控感还不错,在最高画质的设置下不会有明显卡顿,战斗流畅舒服,能配合游戏本身展示到不错的打击感。这个不需要外置手柄,裸机就有不错的体验。

《和平精英》也一样,新一代灵犀触控芯提升了触控响应和精准度,漏触的情况变少,裸机操作时射击准度和响应都比之前要好。

手机内置的散热结构也有升级,它搭载了新一代冰河散热系统,里面有大面积冰河散热 VC 和 2K 超临界冰河石墨组成新一代散热系统。手机内的散热排布有针对游戏时玩家的握持手型做优化,热力三不可以多开握持,保证高强度游戏时的手感。

实际上,一加 Ace 6 至尊版常规状态下快充和性能模式玩游戏的整体都不会太热,游戏时在后盖 DECO 顶部附近会比较热,也都能够躲开握持的位置。

续航方面,Ace 6 至尊版搭载了目前主流大容量的 8600mAh 冰川电池,日常中度使用能够坚持 2 天左右。配备 120W 超级闪充,8000mAh 级别的手机能够控制在 50 分钟左右充满已经算比较快了。

另外,Ace 6 至尊版在通用快充的表现也不错。

我们接入 AI 小电拼 Ultra 实测,一加 Ace 6 至尊版通用快充能够达到 48W,30 分钟能够有 60% 电量,一小时内就能够充满。对于不想带着专用的 USB A-C 充电套装的用户来说,这个表现也很足够了。

影像方面,一加 Ace 6 Pro 采用「主摄+超广」的双摄组合:

  • 主摄:5000 万像素传感器,等效焦距为 23mm 的 6P 镜头,光圈 F1.8,双轴 OIS 防抖
  • 超广:800 万像素传感器,等效 16mm 的 5P 镜头,光圈 F2.2

随着 Ace 6 至尊版发布的还有两款配件,分别是一加枪神手柄以及有对应配色的一加 40W 超级冰点磁吸散热器。

枪神手柄采用了内置 USB-C 接口的头尾包裹设计,侧边没有阻挡,像是为了延伸的适配结构预留出空间。整体采用「白色+金属红」这种经典的觉醒类配色,手柄边缘的金属红长条在光线作用下,也有类似亮灯的效果。

手柄内的 USB-C 口有活动关节,避免安装时折断。手柄上预留了放在右手握持位下侧预留了一个 USB-C 接口,那打游戏时边用边充电就不会挡到握持了。

内部贴有导热材质和一个适配金属魔方 DECO 设计的方形圆边挖孔,加上手柄中间有拉伸结构,只要是 DECO 能对应挖槽的 ColorOS 系手机,那都能够用上这个手柄。

一加枪神手柄有手柄基本的握持设计,填满手掌握持空间。两侧手柄上分别有 L、R 两个金属红色的扳机按键,内侧也有两个按键,对应 FPS 游戏的话能够满足射击、换弹、跳跃和开镜基本操作,那触控屏幕就能够专心用来移动和视觉控制了。

按键支持最高 1000Hz 按键轮询率,扳机按键采用了 0.7mm 超短键程的微动机械按键,保证手感的同时也提升触控响应。

手机接入之后就能够在游戏助手中设置游戏映射,最多能够储存六个设置存档,用户可以根据不同游戏类型来设置、切换。如果是一加 Ace 6 至尊版安装的话,还会有对应的启动动画。

手柄内搭载了电竞天线,接入时能够提升信号接收能力,保证游戏时的网络稳定性。

这里的磁吸散热封三和之前推出的深空银配色一加 40W 超级冰点磁吸散热器一样,本次针对手柄做了配色的适配,提升一体感,这个配色命名为「心流白」。

手柄上附带了防层盖,安装手柄的时候将它取出再安装即可。散热器的 USB-C 接口在机身上侧,所以就算磁吸也不会阻挡。

最后看看售价,一加 Ace 6 至尊版也有五个储存版本,同样提供了最高 16GB+1TB 的储存选项:

  • 12GB+256GB 3799 元,国补后 3499 元
  • 12GB+512GB 4399 元,国补后 4099 元
  • 16GB+256GB 4099 元,国补后 3799 元
  • 16GB+512GB 4699 元,国补后 4399 元
  • 16GB+1TB 5399 元,国补后 5099 元

 

  • 一加枪神游戏手柄:预售价 449 元
  • 一加 40W 超级冰点磁吸散热器心流白配色:229 元
「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

十年等一回!Steam 手柄再相见

作者 马扶摇
2026年4月30日 18:00

在官宣 Steam Machine、Controller 和 Frame 足足半年之后,我们终于从 V 社那里得到了一个好消息:

虽然 Steam Machine 依然在难产,但是新款 Steam Controller 手柄终于上市,预计 5 月 4 日开售,价格 99 美元(约合人民币 680 元)。

图|Steam

在内存海啸之下,V 社最终还是选择暂缓了游戏主机与 VR 头显的出货,先用手柄试试水温。

此时,距离初代 Steam Controller 发布的 2015 年已经过去了近 11 年。

 

图|Steam

Valve 没有将新手柄叫做 Controller 2,而是以一种「重新开始」的姿态延续了最初的命名。

那新的 Steam 手柄能够支撑起这个系列定型的名字吗?结合先行评测的反馈来看,还真可以。

足够好用的鼠标

和十一年前的初代 Steam 手柄一样,2025 款新手柄的主要特色,依然是那两块与摇杆同等重要的触控板。

图|TheVerge

这背后的产品逻辑很简单:

Steam 作为毋庸置疑的全球最大游戏平台,Windows 游戏始终是其中的「压舱石」。

而 Valve 要想经营好 SteamOS 生态,就必须解决那个手柄的老大难问题——鼠标兼容。

而在充分吸取 2015 年初代 Steam 手柄、2022 年 Steam Deck 的经验之后,V 社的确在新手柄上拿出了一套体验更优秀的鼠标模拟体验。

根据官方参数,新 Steam 手柄的触控板变长为 34.5mm,相比 Steam Deck 的 32.5mm 略微增大,并根据手柄的握持特点微微外倾:

图|YouTube @LinusTechTips

根据加拿大白嫖王 Linus 的评价:「这就是目前市面上最好的鼠标模拟体验」。

相比初代手柄的圆形触控板,新触控板的触感反馈非常紧凑、强大,舒适程度甚至远超初代手柄和 Steam Deck。

毕竟从 V 社的设计角度出发,无论手柄、主机还是整体的 SteamOS,这套软硬件生态是服务于「连接卧室里的游戏 PC 与客厅电视的桥梁」体验的。

游戏媒体 Digital Foundry 也在评测中给出了近似的赞扬,指出:

新版手柄的设计逻辑完整沿袭 Steam Deck,相比初代手柄上的触控板,新版的上手门槛更低、操作更可靠。

图|YouTube @DigitalFoundry

在实际游戏体验中,这两块触控板也没有辜负 Valve 用心的优化。

首先是兼容性,新版 Steam 手柄支持高度的 Steam Input 自定义能力,无论是官方还是社区的配置文件,几乎都可以做到无缝衔接、边玩边换。

再搭配内置的陀螺仪瞄准功能,Steam 手柄在 FPS 游戏中哪怕不使用辅助瞄准,也可以「拥有近乎开挂一样的射击精度」:

图|YouTube @LinusTechTips

另一方面,手柄上两块硕大的触控板也为那些 Steam 上那些原生不支持手柄的游戏有了一个解决方案——比如一些比较老的 RTS 或者模拟经营类游戏。

不过目前版本的触控板在软件体验方面还有一些短板,Digital Foundry 在体验时指出:

手柄在 Steam 程序内的表现近乎完美,但在 Windows 系统层级会被识别为键鼠,如果不通过 Steam 运行,很难发挥其背键和触控板的全部潜力。

足够好用的手柄

除了 V 社一以贯之的优秀鼠标模拟体验之外,Steam 手柄在作为一个手柄的本职工作上也没有出现偏科。

虽然 Linus 和 Digital Foundry 都提到 Steam 手柄的摇杆为了给触控板让位置而有些「间距过近」,但对于这套精度极高的 TMR 摇杆本身的体验都是非常正面的。

图|YouTube @LinusTechTips

相比霍尔摇杆,TMR 摇杆的主要优势在于拥有极高的精度、抗干扰能力和温度稳定性,同时功耗也很优秀。

要说 TMR 摇杆的缺点,就是成本高——估计它俩是 Steam 手柄近 700 元售价的主要贡献者之一。

至于按键手感方面,Steam 手柄的 ABXY 和十字键均采用了静音薄膜,Linus 觉得有些偏软、不够清脆,Digital Foundry 则评价手感「厚实」(Clacky)。

与此同时,Steam 手柄背后的 4 颗背键则获得了一致好评。

Steam 手柄的背键键程长且舒适,稍微熟悉就能迅速上手,只不过触发力道有些偏轻,用力抓手柄的时候偶尔会误触:

图|YouTube @LinusTechTips

然而在最常用的扳机键上,V 社却做出了一个不太厚道的决定:

新款 Steam 手柄移除了初代上面的「两段式按压」,并且不支持震动反馈和自适应阻尼。

这就导致它在一些手柄适配好的游戏中,触感体验反而不如传统手柄,比如《地平线:西之绝境》中拉弓射箭的触感相比 DualSense 少了很多:

图|YouTube @LinusTechTips

另一个很值得说道的还有 Steam 手柄专有的磁吸充电器,它同时兼任无线接收器,在连接稳定性、延迟和方便程度上都得到了高度的赞扬:

图|YouTube @LinusTechTips

它是 PC 的延伸

整体来说,新版 Steam 手柄当之无愧地继承了 Steam Deck 与 SteamOS 的优秀口碑,完全有潜力成为 2026 年手柄市场中的一匹黑马。

但我们也要理解一件事:

Valve 在设计 Steam 手柄时,它们的出发点并不是直接与 Xbox 或者 PS 手柄抗衡,而是在为 Steam 游戏生态提供一个「键鼠之外」的延伸。

这种设计思路很好的解释了为什么 Steam 手柄在鼠标模拟、配置兼容等等方面,处处透露着 PC 硬件的思维,反而在扳机反馈这种传统手柄很看重的领域着墨不多——

Steam 手柄真正的意义不是让你扔掉 Xbox Elite 和 DualSense,而是扔掉客厅里的那套旧键鼠:

图|GamersRadar

这也很符合 Valve 立足 Steam 游戏生态的起始逻辑:

把本来被电脑机箱、键盘、鼠标和显示器限制住的 PC 游戏带到更多地方,就从掌机和客厅开始。

毕竟现在游戏主机的封闭生态越来越不好过,单纯打着「平台独占」和「硬件便宜」的招牌已经吸引不到太多新消费者了。

而 Valve 带着做 PC 的思路加入这个市场,希望能带来一些新的活力。

然而,最最重要的是,在面对新款的 Steam 手柄的时候,无论硬件如何,我们都不免问出一个和 11 年前一模一样的问题:

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

谁在 GPT-5.5 脑子里塞了一群「妖怪」?

作者 莫崇宇
2026年4月30日 17:16

过去这几个月,OpenAI 的顶尖研究员们并没有把所有精力都花在琢磨如何提高 AI 的性能,而是花了大把时间在自家的服务器里「抓哥布林」。

事情是这样的,如果你在今年高强度使用过 GPT-5 系列模型,你会发现它会在毫无征兆的情况下蹦出一句无关主题的「哥布林(goblin)」式比喻。比如有人问 AI 该买哪款相机,AI 给出的推荐语是:「如果你想要那种闪闪发光的霓虹哥布林模式,可以考虑这款。」

▲ 哥布林(goblin)是欧洲民间传说里的一种小型怪物,形象上通常又矮又丑,皮肤呈绿色或灰色,耳朵尖长,眼睛发光。普遍被描述为贪婪、狡猾、爱恶作剧,智力不高但很会算计小便宜。它们喜欢金子和闪光的东西,会偷东西、搞破坏,但很少被描绘成真正意义上的大反派,更多是烦人的小麻烦制造者。

有人让 AI 帮忙精简回答,AI 主动提出可以给出「更短的哥布林版本」。更离谱的是,AI 在讨论网络带宽时蹦出了「哥布林带宽」这个词,让人完全不知道该如何理解。

起初,大家以为这只是 AI 的一点小幽默,但很快事情变得奇怪了起来。哥布林、小魔怪(gremlin)、食人魔(ogre)、巨魔(troll)开始在各种正经的对话里高频串场。

黑客攻击?觉醒前兆?都不是。就在刚刚,OpenAI 官方终于亲自下场发了篇博客长文,复盘了这场史称「哥布林叛乱」的始末。而大模型背后的技术逻辑,还挺让人哭笑不得的。

▲ 🔗 https://openai.com/index/where-the-goblins-came-from/

谁把哥布林放进了 GPT-5?

事情的端倪,出现在 GPT-5.1 刚发布的那段日子。

当时,有用户反馈说模型聊天变得有点异常「自来熟」,OpenAI 的安全研究员顺手拉了一下后台数据,结果发现了一个非常具体的词汇异常。在 GPT-5.1 发布后,ChatGPT 回复中出现「哥布林」的频率直接上升了 175%,「小魔怪」也跟着涨了 52%。

通常来说,大模型出 Bug 的表现往往是直接崩坏,比如吐出乱码或者突然变智障,各项评估指标会瞬间亮红灯。但这次的情况很特殊。「哥布林大军」是悄无声息潜入的,它们没有破坏模型的逻辑能力,只是悄悄篡改了 AI 的修辞习惯。

到了 GPT-5.4/5.5 时代,这群魔法生物的使用频率出现了明显的飙升。连 OpenAI 首席科学家 jakub Pachocki 自己测模型时,原本只是想让 GPT-5.5 用 ASCII 画一只独角兽,结果得到的是一只哥布林。

▲中文翻译:顺带一提,我让它用 ASCII 画一只独角兽,结果我觉得我得到的是一只哥布林。

在外部,用户们早就察觉到了不对劲,Repo Prompt 创始人 Eric Provencher 在 X 上晒出截图,AI 在帮他处理代码时说了一句:「我宁愿一直盯着它,也不愿让这个小捣蛋鬼无人看管地运行。」

一名 OpenAI 工程师 Jason Liu 在底下回复:「我以为我们已经修复了这个问题,抱歉。」AI 评估平台 包括 Arena.ai 也独立注意到了这个规律,尤其是在用户没有开启高级思维模式时,哥布林出没的频率格外显眼。

这显然不是什么互联网流行语的自然涌现,而是模型的底层逻辑被某种机制给引导了。为了揪出幕后黑手,OpenAI 开启了内部排查。

顺着数据回溯,他们很快在一个特定的功能分支里发现了万恶之源,「个性化定制」中的「书呆子(Nerdy)」人格。当时,为了让 AI 的语气显得更有趣,工程师给「书呆子」模式写了一段要求很高的系统提示词:

你是一个彻头彻尾的书呆子型 AI 导师,对人类充满热情、机智幽默,同时又透着几分智慧。你狂热地推崇真理、知识、哲学、科学方法与批判性思维。[……] 你要用语言的玩笑感戳破一切装腔作势。这个世界既复杂又奇异,它的奇异之处值得被正视、被剖析、被享受。面对严肃的大问题,也绝不能一本正经到失去趣味。[……]

站在人类的视角,这段提示词的诉求很明确:要有极客精神,要幽默。

但 AI 并没有真正理解什么是「幽默」。在海量的强化学习反馈中,ChatGPT 敏锐地察觉到了一个极其功利的捷径:只要我用哥布林打

比方,打分系统就会觉得我够「俏皮」、够「书呆子」,我就会得到最高分的奖励。

数据说明了一切。从 GPT-5.2 到 GPT-5.4,默认人格下「哥布林」的出现频率变化幅度只有负 3.2%,而「书呆子」人格下这个数字飙升了整整 3881.4%。「书呆子」模式虽然只占了 ChatGPT 总对话量的 2.5%,却贡献了 66.7% 的「哥布林」含量。

OpenAI 后来对 RL 训练数据做了一次专项审计,结果发现,在所有被审计的数据集里,有 76.2% 的数据集都出现了同一个规律:含有哥布林或小魔怪词汇的输出,会得到比不含这些词的同题输出更高的奖励评分。

如果哥布林腔调只在「书呆子模式」下出现,那顶多是个角色设定没控制好,问题还算有限。麻烦的是,研究人员发现这种说话方式开始蔓延到别处了。

他们同时追踪了两组数据:一组对话带了书呆子提示词,一组没带。按理说,哥布林腔调只该在第一组里增长。但结果是,两组的增长曲线几乎贴在一起,步调一致地往上走。

这背后,是大模型训练里一个出了名难缠的问题:强化学习强化出来的行为,会悄悄泛化到训练者并不想要的场景里去。

驯化 AI 的死循环

要搞懂 AI 是怎么把路走窄的,我们得看看它的迭代过程。

大模型的训练(RLHF)本质上是一个不断反馈和纠偏的过程。这就好比训练一只小狗,你在它每次牵手就给一块肉干。狗很聪明,它发现「牵手」这个动作能稳定换取高额奖励,于是它开始产生路径依赖,不管你给没给指令,它为了要奖励,都开始疯狂牵手。

AI 也是同样的逻辑。它在「书呆子」模式下用哥布林造句,拿到了高分。紧接着,连锁反应开始了:

AI 发现「哥布林」是高分关键词,开始在各种生成任务中高频使用;工程师在整理模型生成的优质数据时,发现这些带有哥布林比喻的回答质量确实高,条理清晰,比喻也算生动;于是,工程师顺手把这些带梗的对话,打包塞进了模型的「监督微调(SFT)」数据库里。

这下彻底闭环了。SFT 数据相当于 AI 的基础教材。当带有哥布林的文本被选为教材再次喂给模型时,AI 的底层认知被重塑了。它不再认为「哥布林」只是特定角色的 Cosplay,而是把它当成了能应对一切问题的、至高无上的高级修辞。

在后续的数据搜查中,工程师们有些无奈地发现,除了哥布林,模型还把小浣熊、巨魔、食人魔和鸽子全都学了进去。倒是「青蛙」幸免于难,经过核查,青蛙出现的场合大多数时候确实跟用户的问题有关,算是无辜路人。

面对「满地乱跑」的哥布林,OpenAI 只能采取行动。3 月 17 日,官方正式下线「书呆子」人格。同时,他们在训练数据里搞了一次针对性的清洗,把带有这些魔法生物词汇的奖励信号全部抹除。

但大模型的惯性,远比想象中顽固。

GPT-5.5 在发现这个问题之前就已经开始训练了,当它接入内部测试时,工程师们两眼一黑:这群哥布林不仅没清除干净,还安家了。
更有意思的是,OpenAI 给 Codex 写的人格指南里,要求它有「生动的内心世界」和「敏锐的聆听能力」。这款工具本来就带着几分书呆子气,和哥布林可以说是一拍即合。

为了防止全球的程序员被「哥布林」逼疯,OpenAI 被迫用上了最原始的一招,在系统提示词里反复强调:「除非与用户的查询绝对且明确相关,否则永远不要谈论哥布林、小魔怪、小浣熊、巨魔、食人魔、鸽子或其他任何动物和生物。」

如果你想亲眼看看「解除管控」的哥布林是什么状态,可以运行下面这段命令——它会在启动 Codex 之前,把系统指令里所有涉及哥布林的内容先过滤掉,让模型在没有这道禁令的情况下运行:

instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
jq -r ‘.models[] | select(.slug==”gpt-5.5″) | .base_instructions’ \
~/.codex/models_cache.json | \
grep -vi ‘goblins’ > “$instructions” && \
codex -m gpt-5.5 -c “model_instructions_file=\”$instructions\””

事情闹大之后,OpenAI 内部反倒有点拿它当乐子了。ChatGPT 的 X 官方账号把这条「禁止谈论哥布林」的指令原文放进了简介。Codex 工程负责人 Thibault Sottiaux 引用这段话,配上了一句「懂的都懂」。

Sam Altman 昨天表示期待 GPT-6 能给他「多加几只哥布林」,随后又发文说 Codex 正在经历「ChatGPT 时刻」,发完自己又改口:「我是说哥布林时刻,抱歉。」刚刚则是发文宣告,问题已经得到解决了。

不过也有人没觉得这有什么好笑的。Citrini Research 今年 2 月曾凭一篇关于 AI 与经济前景的 Substack 文章在市场上掀起不小的波澜,他们对这场风波的态度要严肃得多,直接给 OpenAI 的处理方式下了结论:「简直荒谬。」

顺带一提,「goblin mode」这个词本身,早在 2022 年就被《牛津英语词典》评为年度词汇,意思是「一种毫不掩饰地放纵自我、懒惰邋遢或贪婪的行为方式」。某种程度上,AI 无意间踩中的这个词,和它想表达的「俏皮感」完全是两码事。

抛开这些槽点,这场「哥布林危机」撕开了大模型时代一个极其核心的命题:对齐难题(Alignment Problem)。

当我们谈论 AI 失控时,脑海中浮现的往往是科幻电影里接管核武器的机器。但现实情况是,AI 的「失控」往往始于极其微小、甚至有点滑稽的奖励信号偏移。

你想要一点点俏皮,给了一个微小的正向反馈。黑盒模型就会找到捷径,将这个信号无限放大,最终把整个系统的底层逻辑带偏。

今天,它只是为了拿高分而爱上了说「哥布林」。如果明天,它在自动驾驶的算法里、或者医疗诊断的奖励机制中,找到了另一个违背人类常识的「高分捷径」呢?

人类总是自以为自己能掌控 AI ,但其实很多时候只是在走钢丝。每一次参数的微调,都有可能带来意想不到的变化。甚至这或许是我们所经历的最温柔、最搞笑的一次「AI 叛乱」了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

一台比小天才还猛的「反 AI 座机」,卖爆美国家长群

作者 莫崇宇
2026年4月30日 17:03

我至今还能背出小学同桌家里的手机号码。

那时想约人玩,总要先过家长那关:「阿姨好,××在家吗?」等长辈吼一嗓子把人叫来,这通电话才算真正开始。回头想想,我们那时的社交,始终要「借道」大人。

一出生就被触屏包围的 10 后、20 后,大概很难共情这种经历。就算家长迟迟不肯配手机,街上随处可见的儿童智能手表早就填上了这个空缺,定位、通话、发语音,一块表全包了。

▲ 由 GPT-Image-2 生成

但在大洋彼岸,同样有一批家长选择让孩子晚些接触智能设备,问题是,他们能给孩子的替代品,并不比我们当年的选择多。正是这份普遍的育儿困扰,催生了一款特别的产品——

Tin Can 复古座机。

一台卖 100 美元的「金属罐头」

第一眼看到 Tin Can,你绝对会以为这是某个剧组用来怀旧的道具。

它长得像一个圆柱形的罐头,甚至在表面做出了类似罐头标签处的轻微纹路。这款设备提供海蓝、纯白、柠檬黄、丁香紫四种极具多巴胺风格的配色,配有一根标志性的复古卷曲电话线。

这台标价高达 100 美元的设备,没有屏幕,没有摄像头,没有应用商店,甚至连发短信的功能都被无情地阉割了。它唯一能做的事情,就是「打电话」。

你也许会觉得这是在收割智商税,但在北美,它正被焦虑的中产家长们疯狂抢购。

从硬件底层来看,Tin Can 是一个披着复古外壳的现代 VoIP(基于 IP 的语音传输)终端。连上家里的 Wi-Fi 就能工作。

机身上有一个带品牌 logo 的按钮,有未读语音信箱时会亮灯提示;还有四个带 emoji 标识的快捷拨号键,方便不识字的低龄儿童一键拨打。

它的商业模式深谙「圈地自萌」的精髓:

如果只拨打其他 Tin Can 用户的五位数短号完全免费;但如果想给爷爷奶奶的普通手机打电话,就需要每月掏 9.99 美元订阅「Party Line」套餐。据官方透露,绝大多数用户都乖乖掏了这笔月租。

最绝的是它的权限管理。

所有设置都被死死捏在家长手机的 App 里。设备只能接打家长设定的「白名单」号码,骚扰电话一概打不进。如果孩子试图拨打白名单外的号码,话筒里只会传来无情的无法接通提示音。

家长还能设置「静音时段」,比如睡前或写作业时,这部电话就成了一块塑料砖头(保留紧急呼叫电话)。更硬核的是,如果是离异家庭,父母可以在两个家里各放一台,共用一个号码,孩子无论去哪边,都不耽误接朋友的电话。

▲ 官方介绍里甚至把「不是无线设备」写成卖点。

另外,它刻意不内置电池,必须插电使用。

Tin Can 创始人 Chet Kittleson 也解释说,这是因为他极其讨厌老妈接电话时满屋子乱跑、边做家务边敷衍聊天的状态。现在,没电池的座机把孩子们「钉死」在了原地,逼着他们专心致志地讲话。

换言之,Tin Can 表面上像一件怀旧玩具,实质上是一套儿童社交通讯的围栏系统。它把智能手机时代最令人头疼的三个问题,陌生人、沉迷、算法推荐,全部用硬件阉割的方式绕开了。

三个老爸,和一次厨房餐桌上的产品验证

Tin Can 诞生的动机,精准戳中了当代父母最痛的神经——他们苦「社交秘书」久矣。

Chet Kittleson 曾在西雅图房地产科技公司 Redfin 担任高管,后出走创业失败。三年前,他在校门口接孩子时听到家长们疯狂抱怨:为了帮孩子约个周末的玩伴聚会,家长们必须在短信里来回确认时间。

「现在的孩子没有任何工具可以主动联系朋友,所有的协调工作都压回到了父母身上。」作为三个孩子的父亲,Kittleson 猛然醒悟。

▲ 从左往右依次为 Tin Can 创始人 Graeme Davies,Chet Kittleson, Max Blumen

公司倒闭的那一周,他把两个老朋友 Max Blumen 和 Graeme Davies 叫到家里,三个老爸在厨房餐桌上熬了一周,拼出了 5 台原型机,把其中两台塞给了女儿的朋友。

奇迹发生了。第二天早上 8 点 15 分,话筒响了,是女儿的朋友打来邀请她一起走路上学。那是女儿第一次没有借助任何家长,自己安排了社交活动。

消息在家长之间口耳相传,很快蔓延到陌生人。Kittleson 亲自上门安装了大约五十台原型机,边装边问家长用下来感觉怎么样,最担心的是什么,再根据反馈调整产品。

他形容这款产品天然具有病毒式传播的特质:「一个人买了,她的朋友也想要;别人来家里,看到一台复古电话放在那里,会直接失控——孩子家里有一台老式电话,这件事本身就有某种魔力。」

是的,社交圈层的同伴压力也加速了 Tin Can 的爆火。小天才电话手表之所以能迅速崛起,很大程度上是因为它把产品从工具做成了社交入口。「碰一碰加好友」、微聊、主页圈等设计,让手表变成了孩子之间的社交货币。

同理,如果别人都有 Tin Can,你没有,孩子就会被社交孤立。

所以,Tin Can 的杀手锏变成了「团购」。在美国堪萨斯城一所小学,95% 的家庭统一采购了这款座机,孩子们甚至开始用纸质通讯录记录彼此的号码。当「不用智能手机」成为整个社区的共同选择时,它就变成了一种新的社群认同。

2025 年 4 月,Tin Can 正式开放购买。前几批产品接连售罄,积压的预购名单一度接近六位数。目前产品已覆盖美国全部 50 个州和加拿大,最新一批订单交货期排至 2026 年 6 月。

在资本层面,产品的爆发同样引发了风投的高度关注。2025 年夏天,Tin Can 完成 350 万美元的早期融资,投资方包括 PSL Ventures、Newfund Capital 等等,同年 12 月,Greylock Partners 领投了 1200 万美元的种子轮,累计融资达到 1550 万美元。

Tin Can 还计划用新资金扩大产能、增加工程和客服人员,并推进国际市场的布局。但理想很丰满,工程很骨感。作为初创公司的初代硬件,Tin Can 还是一度遭遇了惨烈的翻车。

在 2025 年的圣诞节假期,大批家庭同时开机,当天的通话量暴增了 100 倍,Tin Can 的服务器直接被挤崩了。很多满怀期待拆开礼物的孩子,面对的是长达两周的掉线和无法接通。公司只能紧急致歉并免除当月订阅费。

硬件上的毛病也不少:

底层 VoIP 导致通话有 1 秒的延迟,偶尔还有回声;实体按键对小孩的手来说太硬;USB-C 供电接口在拉扯中容易松动,甚至成了绊倒孩子的隐患。此外,英国的 Karri 和准备推出 60 美元竞品的 Pinwheel 都在虎视眈眈。但即便如此,家长们依然对 Tin Can 情有独钟。

AI 陪伴越拟真,真实社交越显得粗糙可贵

如果我们把视角拉远,会发现 Tin Can 的爆火,是站在了一场席卷全球的反屏幕情绪巨浪。

纽约大学心理学家 Jonathan Haidt 在其著作《焦虑的一代》中指出,2010 年至 2015 年间,随着智能手机和 Instagram 等社交平台的普及,儿童的童年经历了一场深刻的数字运动。

统计数据显示,美国青少年的抑郁率和焦虑率在这十年间分别上升了 134% 和 106%,女性青少年受到的冲击尤为剧烈,容貌焦虑和饮食失调问题大幅攀升,男性青少年则面临社交退缩和注意力崩溃的风险。

Haidt 为此提出了四条具体建议:高中之前不提供智能手机、16 岁之前禁止使用社交媒体、全天候的校园手机禁令,以及增加儿童在现实世界中的独立活动时间。这套框架迅速成为家长群体中最广泛引用的参照系。

面对这一局面,各国政府开始在立法层面介入。

截至 2026 年初,全球已有超过 114 个教育系统实施了不同程度的校园手机禁令,占全球国家总数的 58%,这一比例从 2023 年的 24% 飙升至今,不到三年内翻了一倍有余。

荷兰、法国、意大利、英国、韩国、澳大利亚相继出台限制措施,美国超过 20 个州也在推进或落地相关法规。

学校端的执行方式五花八门,从磁吸锁袋到集中储物柜等等,但你有张良计我有过墙梯,学生的应对手段同样层出不穷:强力磁铁撬开锁袋、把旧手机放进去以旧换旧、用模型机偷天换日等等。讲真,地球村的学生在这一块上确实都是心有灵犀的(doge)。

家长端的民间力量同样在狂飙。美国的「Wait Until 8th」运动、前 NFL 球星妻子 Kylie Kelce 带火的「厨房电话」原则(只把手机放客厅,手机禁入卧室),以及英国 18 万家长签署的「无智能手机童年(SFC)」契约,都在试图把孩子从屏幕前拽回来。

有趣的是,对于当下的孩子来说,回归座机并不是一件无缝衔接的事情。

加州大学伯克利分校的社会学家 Claude Fischer 研究了电话进入家庭生活早期的历史,他指出,人们从来都不是「天生就会打电话」的——从 19 世纪末电话进入普通家庭开始,如何接听、如何介绍自己、该说多大声、怎么结束通话,这些都需要专门教授,电话公司甚至为此制作过礼仪手册和学校教材。

有一个流传已久的段子是,当你让 80 后和 15 后同时做一个「打电话」的手势,你会发现两代人的答案截然不同——有人比出六,有人整个手掌贴在耳边,还有人甚至不理解为什么电话的图标不是智能手机的模样。

今天的孩子对触屏、表情包、语音条和视频通话更熟悉,却未必知道一通没有画面、没有表情救场的电话该怎么进行。Tin Can 意外承担了一门古老技能的补课:如何在看不见对方表情的情况下,用声音维持一段关系。

《连线》杂志记录了一对兄妹拿到 Tin Can 的第一周,连续打了二十多个电话,每次接通只说一句「嗨」,然后就是令人窒息的沉默。但在几周后,他们开始学会主动聊天,学会道别,学会大声表达,学会在有限的通话里,完成一场完整的、有温度的人际互动。

与之形成鲜明对比的,是当下愈发普遍的 AI 陪伴。在 AI 无处不在的时代,无数孩子将永远温柔、永远秒回、永远共情的 AI,当作最优的倾诉对象。但社会学家 Sherry Turkle 警告过,数字连接提供的是「陪伴的幻觉」,而不是真实的友谊。

真实的人际关系,是包含摩擦力的。它包含误解、等待、尴尬的沉默,包含对方可能正在吃饭不能接听,包含你需要鼓起勇气克服恐惧去破冰。一个永远顺从的 AI,给不了这种成长必需的挫折。

Tin Can 诞生之初,是为了解决一个没有适合儿童通讯工具、反屏幕的旧问题。但这台笨重、有延迟、不能发表情包的复古电话,却意外成了解决 AI 新问题的解药,它让孩子们拿起话筒,听着真实的电流声,去面对真实世界里,那些笨拙、粗糙却无比鲜活的社交摩擦。

剥离掉 AI 算法与屏幕,最好的社交也只需要一根电话线,和两个直面彼此的灵魂。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

19.98 万元起,充满电仅需 9 分钟的方程豹钛 7 EV 闪充版上市,天神之眼 B 需额外付费

作者 芥末
2026年4月30日 15:44

方程豹钛 7 是比亚迪这两年为数不多的新现象级爆款。

去年发布以来,插混版的钛 7 连续 6 个月登顶混动 SUV 和方盒子车型的双料冠军,最高峰月销量超过了 3 万台,一度让方盒子这个品类从之前的「小众玩具」走进了大众视野。

而随着比亚迪第二代刀片电池和新闪充技术的发布,钛 7 EV 闪充版也顺理成章的来到了我们面前。

方程豹钛 7EV 有 675KM 后驱闪充、755KM 后驱闪充两个版本,售价分别为 19.98 万元和 20.98 万元。

不过由于供应链端的价格上涨,如果想要天神之眼 B-智能辅助驾驶系统的需要付费 1.2 万元选装。755KM 后驱闪充版则可以加 3 万元选装「四驱进阶包」,除了可以升级至天神之眼 B-智能辅助驾驶系统,还能获得智能电四驱、20 寸轮毂+高性能四活塞定钳、20 扬声器音响等配置。

钛 7 EV 闪充版最显著的进步是其充电性能获得了大幅提升。

新车搭载了比亚迪研发的第二代刀片电池,675KM 版本电池为 92 度,755KM版本电池为 105.7 度。这一电池系统不仅在能量密度上有所突破,更在热管理效率与倍率性能上进行了深度优化。

常规环境下,从 10% 电量充至 70% 仅需 5 分钟,而完成 10% 至 97% 的近乎满电状态也仅需 9 分钟。这种「分钟级」的补能体验,基本抹平了纯电车型与燃油车在加油等待时间上的差距。

针对北方寒冷地区的用车环境,钛 7 EV 闪充版也展现出了极强的环境适应性。

通过升级的热泵系统与电芯自加热技术,即使在零下 30 摄氏度的极端低温下,车辆从 20% 充至 97% 也仅需 12 分钟,较常温环境仅多出约 3 分钟的耗时。

这种全温域的高效补能能力,打破了纯电车型「不出山海关」的局限,为其在全国范围内的推广提供了技术支撑。

配合钛 7 EV 闪充版的上市,比亚迪正在加速全国闪充网络的布局,投入运营的闪充站已超过 5500 座,覆盖全国 311 座城市,同时比亚迪计划进一步建设 2000 座高速闪充站,力求覆盖全国约三分之一的高速公路服务区。

而在动力系统上,钛 7 EV 提供了单电机后驱与双电机四驱两种驱动方案。

后驱版本最大功率 300 千瓦,四驱版本为前 215 千瓦、后 300 千瓦的组合,最高车速可达 240km/h。

钛 7 EV 采用了前双叉臂、后五连杆的独立悬架结构,并且通过云辇-C 智能阻尼车身控制系统的介入,实现了对悬架软硬的毫秒级调节。云辇预瞄功能利用摄像头扫描前方路面,预先调整悬架参数,能够显著提升了过滤震动的效率。

补能和动力之外的部分,钛 7 EV 闪充版整体与去年上市的插混版本差别不大。

钛 7 EV 闪充版延续了方程豹家族式的「方盒子」造型设计,线条硬朗方正,新车长宽高分别为 4999mm、1995mm 和 1865mm,轴距 2920mm。

这种中大型 SUV 的体量,结合短前悬、短后悬的设计,赋予了车辆良好的接近角与离去角,也让钛 7 具备了一定的轻度越野能力,比亚迪也为此增加了陷车助手、拖车模式以及 TSC 高速爆胎辅助稳定控制系统。

由纯电平台带来的额外空间,也让钛 7 增加了一个容积达 201L 的电动开合前备箱,其内部采用了防水密封设计并配备排水阀。

此外,车尾部配备的 32.5L「小书包」储物格、84L 的后备箱下沉式储物盒以及二排座椅放倒后可扩展至 1940L 的超大容积,共同构成了一个多层级的储物系统。

进入座舱内部,钛 7 EV 闪充版采用了名为「星际方舟」的设计语言。载了由 15.6 英寸中控大屏、12.3 英寸全液晶仪表以及 27 英寸 W-HUD 抬头显示组成的交互系统。

为了满足后排乘客的娱乐与控制需求,车辆还支持加装两块 13 英寸的 BYD Pad,配合空调旋钮屏与后排控制屏,可实现最高「七屏联动」的沉浸式体验。

在软件生态层面,新车搭载了 DiLink 150 高阶智能座舱系统。该系统深度集成了 DeepSeek 大模型,赋予了语音助手更强的语义理解与逻辑推理能力,能够实现四区域语音识别与复杂的跨功能指令执行。

其他硬件上,钛 7 EV 闪充版全系标配的 20 扬声器帝瓦雷音响系统以及车载智能冷暖冰箱。

整体而言,纯电与插混双轨并行的产品布局,拓宽了钛 7 家族的使用场景。

对于热衷于深度户外越野、有着高频次长途穿越需求,或是经常跨省长途驾驶的用户而言,没有里程焦虑的插混版车型依然是最稳妥且务实的选择;而对于日常以城市通勤为核心,主要在周末或节假日进行市郊及周边短途探索的用户来说,纯电版车型则凭借更优的日常用车成本与高效的闪充体验,提供了更好的用车体验。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

小米最新人形机器人的手,会「出汗」了

作者 张子豪
2026年4月30日 14:15

最近小米最让我惊喜的新品,不是汽车,也不是手机,而是一款还没正式发布的人形机器人,小米 CyberOne V2。

在前天的小米投资者大会上,它第一次公开亮相。

不跑不跳,也没有表演后空翻,只是安静地站在那里,像一位训练有素的工作人员,给与会嘉宾递上伴手礼,和人握手、击掌。

小米官方目前还没有发布正式的参数,根据网上的爆料信息,小米 CyberOne V2 这款人形机器人身高 178cm、体重约 52kg。

其他的参数像是机器人的步行速度,大约为 0.98m/s,单臂的举重能力可以支撑 3kg 的重量。对比早前宇树发布的 H2 机器人,其最快行走速度是 3.3m/s,手臂最大负载 15kg,额定 7kg。

小米 CyberOne V2 的重点,很明显没有放在走路和举重上,这次最值得关注的,是小米机器人重新设计的手部。

这双手是按照成年男性的手 1:1 比例制作,具有 22-27 个自由度,不仅能做到快速拧螺丝、掌内转螺柱这些精细工业化场景的任务,还能捏羽毛和触碰气球。

更意外的是,这双手竟然还有人类的「汗腺」。

其他的爆料还提到,小米 CyberOne V2 依靠背后的情感 AI 模型,能够识别面部表情和声音,从而给出恰当的互动反馈。

但也有美国网友在下面评论说,小米 CyberOne V2 的样子和特斯拉 Optimus 也太像了,马斯克选择不提前展示 Optimus 的任何信息是对的。

此前马斯克有说过,推迟展示 Optimus V3,是为了防止竞争对手抄袭,并认为在大规模量产前,应尽可能将其藏在门后。

灵巧手是机器人的硬件瓶颈

从技术和资本市场,机器人这段时间的发展都很迅猛,几乎每天都有一个具身智能的融资。

在脚上的功夫,机器人半马刷新了人类纪录,来到了一小时内。

但在「用手操作」上,翻书、系鞋带,这些人类双手的日常操作,对机器人来说却还是天方夜谭。

具身智能的核心,其实就在于机器人的大脑如何通过物理躯体与现实世界交互,而灵巧手成了实现完美交互最大的硬件瓶颈。

多家机器人公司都曾专门研究过灵巧手的问题,强脑科技此前发布了 BrainCo Revo 3 智能灵巧手;21 个自由度,集成了全掌触觉和指尖视触觉,并且兼容开源生态。

在官方发布的演示视频里,这只手超越了人手的活动空间,并且覆盖了 33 种抓握手势,能双手解魔方,使用剪刀,和盘手串等。

灵巧手之所以成为一项难题,是难在软件和硬件同时卡住。软件上,人手到机器人手的动作需要重定向;硬件上,手指内部的小型执行器又很难同时做到有力、灵敏、可靠。

这里的「重定向」可以理解为:把人手的姿态、指尖轨迹和接触关系,转换成机器人手能执行的关节角和控制命令。

但人手和机械手的尺寸、关节数量、运动范围都不完全一样。人类做起来很自然的动作,直接映射到机器人手上,可能会变成不可达、穿模,或者接触点不对。

在硬件上,腿部关节通常有更多空间,可以放更大半径、更高扭矩密度的电机,因此更容易采用低减速比或准直驱方案。比如 6:1 减速比,意思是电机转 6 圈,输出轴转 1 圈;速度降下来,输出扭矩放大上去。

▲腿部电机(齿轮比:6)与手指(齿轮比:288)。扭矩随r³缩放。

手指没有这种空间。电机必须缩到能塞进指节的尺寸,而在几何相似的情况下,电机扭矩大致随特征长度的三次方下降。线性尺寸缩小到 1/10,扭矩可能只剩原来的 1/1000 量级。

扭矩不够时,常见做法是靠更高减速比补回来,比如 100:1、200:1,甚至 288:1。

高减速比的代价也很直接:摩擦、齿隙、效率损失和反射惯量都会变得更难处理。仿真里很轻巧的手指,到了现实里可能变得又硬又钝,接触时不够柔顺,精细操作也就难了。

根据小米技术此前发布的全掌触觉仿生手探索文章,为了能 100% 复用人类的数据,小米对 CyberOne V2 的仿生手这次也进行了大刀阔斧的重构。

1:1 极致仿生: 将仿生手体积大幅压缩了 60%,尺寸与成年男性手部完全一致。同时增加了 64% 的自由度,具有 22-27 个自由度 DoF,可达空间、惯量分布都无限逼近真实人手。

全掌触觉覆盖: 机器人如果视觉一旦被遮挡,基本上就无法正常运作。小米引入了触觉手套方案,将全掌触觉传感器覆盖面积提升至 8200 平方毫米。人类穿上它打样,机器人就能完美继承「手感」。

15 万次耐久拉锯: 在实验室里、演示视频里捏个杯子很简单,但在工厂里连续打一万次螺丝,机器人的腱绳、弹簧和套管就会断裂。小米这双仿生手目前在实际抓握中,突破了 15 万次的循环寿命。

而最特别的细节,是灵巧手的「汗腺」。

为了实现这双高自由度的灵巧手,小米也必须在机器人的单手小臂内塞满各种电机。

而在实际应用中,单手电机功率超 100W,其中 30W 会直接转化为废热,极易烧毁线路。在没有外挂大型风扇的狭小空间里,他们从人类「出汗散热」中找到了灵感。

小米使用金属 3D 打印,在紧凑的小臂结构中制作了微型液冷循环通道。利用微泵将热量转移,再通过水分蒸发吸热降温。

在实测中,这套仿生汗腺系统,每分钟仅需蒸发 0.5mL 水,就能提供约 10W 的主动散热能力。

手之外,还有机器人的大脑

硬件在迭代,模型也在同步推进。

两个月前,小米开源了 Xiaomi-Robotics-0,一个面向具身智能的 VLA(视觉-语言-动作)模型。

在小米技术的官方推文里,他们进一步开源了真机后训练(Post-training)的完整流程。

最直观的数据是,基于预训练基座,用 20 小时的任务数据进行真机后训练,Xiaomi-Robotics-0 模型就能学会「把耳机放进耳机盒」这个高难度任务,并且能连续完成多个耳机的收纳。

这套后训练流程里有一个值得关注的技术细节:「偷懒效应」的解决方案。

为了让机器人动作不卡顿,业界通常采用异步推理和「动作前缀」技术,即让新动作顺着上一个动作的惯性自然过渡。但这会导致 AI 开始「偷懒」:过度依赖动作惯性,选择性无视摄像头传来的实时视觉反馈。

小米用了三种机制来对抗这个问题:自适应加权损失、Λ 型注意力掩码、前缀动作随机遮蔽。简单说,就是在训练里故意给模型制造「答案残缺」的情况,强迫它不得不去看当前的视觉信号。

软硬件能力的综合,也让小米机器人已经在汽车工厂里搬砖了。在自攻螺母上件工位,做到了 3 小时持续无干预作业,安装成功率高达 90.2%,能配合生产线 76 秒的高速节拍。

开始大规模交付的机器人

特斯拉此前把 Model S/X 的整条生产线砍掉,腾位置给机器人。

在一季度财报会上马斯克宣布,第三代 Optimus V3 预计年中亮相,7 月下旬至 8 月在加州弗里蒙特工厂启动生产,2026 年下半年向企业客户交付,规划年产能 100 万台。

但就像马斯克之前在播客里承认的一样,手部精细操作是「整个项目最难的环节」。

特斯拉的 Optimus 还没量产,美国另一家人形机器人公司 Figure 机器人,今天在 X 上宣布生产规模扩大了 24 倍,从每天生产一个机器人,变成 1 小时生产一个机器人。

在官方新闻稿里,Figure 提到他们已经交付了超过 350 个机器人。

对小米来说,做机器人,可能不会很快像 Figure、宇树、甚至是特斯拉一样,卖出一台消费级通用人形机器人。

但从 CyberOne V2 的方向也能看出来,小米真正想解决的,除了要让机器人跑得更快、举得更重,还有要让它更像一个能真正干活的手。

▲小米领投的量变机器人公司官网视频

毕竟,人形机器人能不能走进工厂、家庭,决定因素从来都不是它能不能翻跟头,而是它能不能拧螺丝、收耳机、递东西,完成那些看似简单、却最贴近日常的动作。

而这,恰恰也是人形机器人距离大规模落地最近的一步。

部分图片素材来自小米技术公众号、X@niccruzpatane 和 https://www.origami-robotics.com/blog/dexterity-deadlocks.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

我测 SBTI,但我不是 SB.skill

作者 马扶摇
2026年4月30日 10:00

四月没过半,你的朋友圈应该已经被反复刷过三四轮屏了吧?

「龙虾」的热度还没完结,网上就出现了另一场新的全民狂欢:SBTI ——

这是由 b 站 up 主 @蛆肉儿串儿 戏仿 MBTI(迈尔斯-布里格斯类型指标)人格测试做出来的小工具,摒弃了严肃的荣格心理学式分类、添加了很多本土化元素:

4 月 9 日 @蛆肉儿串儿 将视频以及 SBTI 测试上线之后,咱们爱范儿编辑部的朋友圈就被迅速刷屏,领导者、伪人、尤物等等不胜枚举。

SBTI 原版链接:https://www.bilibili.com/video/BV1LpDHByET6

爱范儿小编也做了一次测试,如愿以偿地发现自己是个酒鬼:

根据 up 主自己所述,SBTI 本来是为了劝一个朋友戒酒设计的,里面的题目没有什么明确的心理学依据,但只要在有关喝酒的引导性问题上选择了正向答案,测出来的人格就一定是酒鬼。

图|X @VikingSkirts

毕竟在 SBTI 里面,同一个人测三次能拿到三种完全不同的「人格」,它的全部意义就是让你笑一下。

然后截图发朋友圈,把自己笑一下拓展为大家笑一下。

但就在 SBTI 刷屏的同一周,另一个话题却正在以一种安静得多的方式,渗透进每个人的日常——

那就是「你的同事.skill」

注:AI 图,真正把员工 skill 化的公司是不会浪费钱贴工牌的

这一周的前半段,你或许被各种各样的 Skill 刷过屏:能够自己画 k 线的特朗普.skill、记得每条聊天记录的前任.skill、PUA 比真人更狠的老板.skill 等等。

更不用说前两天冒出来的惊天张雪峰.skill 了……

严格来说,Skill 相当于喂给大语言模型的「预设」。

它的原理与你在对话框里写类似「你是一个一个一个香香软软的小蛋糕」之类的角色提示词差不多,只不过比手写更详细、更丰富、更规范而已。

图|X @tuzi_lumaomao

同时,训练(或者说蒸馏)这种 Skill 的过程可以很简单。

把离职同事的飞书消息、钉钉文档、工作邮件喂给蒸馏工具,就能生成一个模仿这个人工作习惯、说话方式、甚至甩锅姿势的 AI 分身。

你的同事走了,他的 Skill 留下来继续搬砖。

接受标签化,反对标签化

然而调侃归调侃,梗图归梗图,这种「个人.skill」模式的流行,与昨天开始的 SBTI 潮流,在本质上其实是同一种现象——

一种人的标签化。

毕竟无论是 SBTI、MBTI、简单的 i/e 人分类,甚至是传统的星座能量和生肖运势,本质上都是在「贴标签」。

我们喜欢通过这种「给自己贴标签」的行为,主动将自己的行为习惯归类,并以此为基础寻找更小的社群。

这种标签化代表了我对于我自己的隐性认同或者期待,以及一种社交谈资。

与此同时,Skill 同样是一种标签化。

2025 年底 Anthropic 发布 Claude Skills,2026 年初 OpenClaw 引爆了智能体热潮,Skill 作为智能体的「技能商店」开始快速扩张,原理就是把某种专业能力打包成可复用模块的文件夹

然而以前我们都只说「做网页的 Skill」,或者「校验照片哈希值的 Skill」,前一阵「同事.skill」的出现则标志着一个明显的转向:

大家开始担心,Skill 的定义从「模型能做什么」正在变成「谁的能力可以被打包」。

既然都是打包贴标签,为什么我们能够接受 MBTI、喜欢 SBTI,却对同事.skill 感到恐惧与不安呢?

我自己去测 SBTI,这是我主动贴上的标签,这个行为本身就带着一种隐秘的快乐——

测出来是「酒鬼」,我笑着发朋友圈,这是一种自我表达,本质上和在朋友圈 emo 说自己是个伞兵差不多。

这种「我自主定义」的标签是轻的,因为我既可以改变,也可以不认。今天我是「酒鬼」,明天测变成「老板」,没有人会因此重新评估我这个人值多少钱。

可公司把我蒸馏成一个 Skill,性质就完全不同了。

「我.skill」是别人对我的榨取,是把我积累的工作经验、处理问题的直觉、同事之间的默契炼化成了一组参数,装进一个几百 KB 的文件里,然后打上一个低于当地最低工资标准的价签,备注「可复用」。

图|《来自深渊》

我是 SB,不是 SB.skill

不可否认的是,智能体 Skill 作为一种技术工具本身,它是没有任何取向性的。

一切问题的根源,都在于我们对于 AI 的使用已经从「人使用工具」,被逼迫、异化、扭曲成了「人化为工具」。

毕竟蒸馏的逻辑很简单:把非标资产(员工)标准化(蒸馏成 Skill),把不可替代变成可替代。

在这个过程中,我丧失的不仅仅是一个用来自嘲的社交标签,更是失去了自己以职业身份存在的权利。

再进一步说,比起「被炼化」更让人不安的,是这条路继续往前走的样子。

冰冷的资本铁律已经证明:剥削的本质不会改变,资本唯一进步的地方,只有它的剥削方式和剥削程度。

而眼下的 Skill 体系,以及整个 AI 技术领域,就处在这个「从技术工具变成剥削工具」的过程中。

当你的 Skill 文件成为你在公司内部的数字替身,HR 就会开始用「这个 Skill 的可复用程度」来评估你的不可替代性,你的标签从一种外化的描述,变成了「你」的存在本身

你不再是「一个会做精美简洁的财务报表的人」,而是「那个做报表的 Skill 的名字贡献者」。

这话听起来科幻,但赛博朋克的典型世界观——人的市场价值由器官和植入体决定——与未来可能的 Skill 世界观之间的距离,比我们愿意承认的还要近很多。

因为用 Skill 来取代人,不是「汽车取代马车」式的技术迭代,而是否认「人作为人」的价值本身。

在工场手工业和手工业中,是工人利用工具,在工厂中,是工人服侍机器。

在前一种场合,劳动资料的运动从工人出发,在后一种场合,则是工人跟随劳动资料的运动。

……甚至减轻劳动也成了折磨人的手段,因为机器不是使工人摆脱劳动,而是使工人的劳动毫无内容。

而我们对于 Skill 的担心的本质,往小了说,是担心资本会以此为工具,冷酷且无底线地压缩用人成本;往大了说,则是对于现代政治理论中「以人为本」观念的动摇。

因此,大家喜欢用 SBTI 来嘲笑自己,给自己打上一个「吗喽」的标签,继续赚香蕉的钱。

但大家同样拒绝被无意识、甚至被迫地蒸馏成 Skill,变成一个「不叫做人」的工具。

直白点说,SBTI 是我自己的游戏,但 Skill 是别人的刀俎。

这或许就是当下这个时代的集体情绪——

在 FOMO(Fear Of Missing Out,害怕错过)之后,被 LLM、Agent、龙虾用鞭子驱赶着的我们正在进入一种新的焦虑—— FOBO(Fear Of Becoming Obsolete,害怕被淘汰)。

FOBO 驱动我们拼命参与、拼命刷屏、拼命测试自己到底是哪种人格,FOBO 则让我们在深夜突然心生警觉:

我的经验、技能、判断力,甚至我说话的语气,是不是都能被压缩进 Markdown 文件,然后被零成本地无限复制?

这种现代生活中的 SBTI 与 FOBO 的精神分裂,恰好从正反两面反映着同一种心理需求:

在这个人多到以十亿计的星球上,我需要确认自己是独特的、是不可替代的,是不能被简化为一串代码的。

我可以骂自己是 SB,但我不能接受被蒸馏成 SB.skill。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

早报|苹果iOS 27或大幅升级照片App/曝一加、realme正式合并/去年我国Token调用量达21100万亿

作者 Shawn Rain
2026年4月30日 08:07
cover

⚖

马斯克 v. 奥特曼官司正式开打,马斯克:偷走慈善机构是不对的,OpenAI:他只是「酸葡萄」,没得到他想要的

🤖

DeepSeek 内测「识图模式」,多模态新模型或将发布

📱

曝苹果 iOS 27 将大幅升级照片 App

💰

新一轮融资在路上,Anthropic 估值或突破 9000 亿美元

🚗

追觅全面回应造车:「华为模式」轻资产、自研芯片、押注全球高净值人群

🧠

去年我国 Token 调用量达 21100 万亿,年末日均突破 100 万亿

📋

曝一加、realme 正式合并为子系列事业部,李炳忠出任总经理

☁

Alphabet Q1 净利润暴增 81%,Google Cloud 首破 200 亿美元大关

☁

Azure 增速 40%、AI 狂飙 123%,微软云业务全面提速

💰

Meta 一季度营收 563 亿美元,净利润同比暴增 61%

🎵

汽水音乐超越网易云成国内第三音乐平台

🫪

AI 分词器存在「语言歧视」:用印地语问 Claude,token 消耗是英文的 3 倍以上

📋

全国首个「商业人工智能」本科专业获批,中国科大今年秋季开始招生

📱

小米 13 系列支持电池升级

💡

山姆 · 奥特曼:按 token 计价终将过时,OpenAI 要做的是「智力工厂」

💻

小米玄戒 O3 芯片曝光,折叠屏或首发

🤖

腾讯 ima 推出知识 Agent「copilot」

🧠

蚂蚁百灵 Ling-2.6-flash 开源

📱

微信贴图支持发布 2 亿像素原图

重磅

马斯克 v. 奥特曼官司正式开打,马斯克:偷走慈善机构是不对的,OpenAI:他只是「酸葡萄」,没得到他想要的

据《纽约时报》及 The Verge 报道,马斯克诉 OpenAI 一案于当地时间 4 月 28 日在加州奥克兰联邦地区法院正式进入证词阶段。

值得注意的是,就在庭审前一天,马斯克在 X 上连发逾 20 条帖子,将奥特曼称为「Scam Altman」(诈骗犯)。开庭前,法官伊冯娜 · 冈萨雷斯 · 罗杰斯先将马斯克传唤至法官席前,就其庭外言行提出警告:

「我们怎么能在你不断在法庭外让事情变得更糟的情况下推进庭审?」最终,双方同意在社交媒体上「克制发言」。

马斯克随后作为首位证人出庭,在证人席上将自己定位为「人类的拯救者」,并将 AI 的未来归结为两种结局:「要么是《星际迷航》式的乌托邦,要么是《终结者》式的反乌托邦。」他直接称奥特曼是「小偷」:

偷窃一家慈善机构是不对的。如果被告被判无罪,这将成为掠夺美国所有慈善机构的先例。

不过,The Verge 的现场记者观察到,马斯克的证词表现远不如预期。他花费大量时间讲述个人创业履历,而非聚焦于案件核心指控,还自述是 OpenAI 的实际推动者:

这个想法是我提的,名字是我起的,核心人员是我招募的,还提供了全部启动资金。除此之外,什么都没做。

这句话停顿等待笑声,但现场反应寥寥。当被要求介绍前 OpenAI 董事会成员希翁 · 齐利斯时,马斯克含糊其辞地说「她是我的,呃,首席幕僚,还有,你知道的」—— 齐利斯是马斯克数名孩子的母亲。旁听席随即传出笑声,陪审团却面露困惑。

OpenAI 首席律师威廉 · 萨维特则在开场陈述中给出了截然不同的叙述:「我们在这里,是因为马斯克没有得到他想要的。我的当事人有胆量在没有他的情况下取得成功,马斯克不喜欢这一点。」

萨维特向陪审团展示了 2017 年的内部邮件,显示马斯克的幕僚曾主动讨论给予马斯克 55% 营利部门股权的方案,并指出马斯克在 ChatGPT 爆红之前从未就 OpenAI 营利化问题提出异议。「这是酸葡萄。」

马斯克此次索赔金额超过 1500 亿美元。若败诉,奥特曼将巩固对 OpenAI 的控制权,公司也将得以推进估值约 7300 亿美元的 IPO 计划。庭审预计持续四周,马斯克今日将继续接受交叉询问。

大公司

DeepSeek 内测「识图模式」,多模态新模型或将发布

DeepSeek 昨日开启「识图模式」测试,与现有的「快速模式」、「专家模式」并列,具备完整的多模态图像理解能力,并非简单的 OCR 文字识别。

🔗 相关阅读:刚刚,DeepSeek大更新!终于「开眼」了| 附大量实测

从实测表现来看,DeepSeek 识图模式的整体准确率较高,在不开启思考模式的情况下,最快半秒即可给出回答。对于电影剧照、抽象图片、商品图等常见场景,识别与理解表现良好。

更值得关注的是其思考过程:在描述画面内容之外,还会主动追问发布者身份、图像隐喻与潜台词,并在推理过程中多次自我纠正,甚至在给出结论前,自发列出问题逐一验证前提假设,呈现出接近人类阅读习惯的推理逻辑。

不过,识图模式目前仍存在明显局限。经典的「数手指」测试中,DeepSeek 首次作答出错,自称「数晕了」,但在用户引导或提示后能够给出正确答案。

此外,识图过程暂不支持联网搜索,仅依赖模型自身知识库作答,对于较新的事物,如苹果今年推出的吉祥物「Finder 酱」,无法识别。

而就在昨天,DeepSeek 多模态团队研究员 Xiaokang Chen 在 X 上发文「Now, we see you. 👀」,并配图 DeepSeek 鲸鱼吉祥物从「蒙眼」到「睁眼」的对比,外界普遍将其解读为多模态新模型即将上线的预告。

曝苹果 iOS 27 将大幅升级照片 App

据彭博社报道,苹果正为 iPhone、iPad 和 Mac 的内置照片编辑功能进行重大升级,依托 Apple Intelligence 平台,计划在今年六月发布的 iOS 27、iPadOS 27 和 macOS 27 中推出一套全新的 AI 图像编辑工具套件。

记者 Mark Gurman 表示,新功能将在照片 App 的编辑界面中新增「Apple Intelligence Tools」专区,包含 Extend(扩图)、Enhance(增强)、Reframe(重新构图)和 Clean Up(消除)四项工具。

  • 「扩图」允许用户在原始画面边框之外生成额外的图像内容或自动填充周围的场景,用户可通过手指拖拽画面边缘,控制扩展的方向和幅度;
  • 「增强」则利用 AI 自动优化色彩、光线与整体画质;
  • 「重新构图」主要面向空间照片,支持用户在拍摄完成后调整视角;
  • 「AI 消除」在现有版本的 iOS 26 上已经存在,支持从图像中移除指定对象,将在 iOS 27 中继续保留。

🔗 相关阅读:iOS 27 发力 AI 修图,苹果也开始 AI 焦虑了

新一轮融资在路上,Anthropic 估值或突破 9000 亿美元

据彭博社报道,Anthropic 正在考虑新一轮融资,潜在估值超过 9000 亿美元,若成功落地,将超越 OpenAI,成为全球估值最高的 AI 初创公司。

知情人士透露,已有投资者向 Anthropic 提出报价,拟定估值将超过其现有估值的两倍以上。目前相关讨论仍处于极早期阶段,公司尚未接受任何报价。

现有股东方面,Google 已承诺以 3500 亿美元估值向 Anthropic 投资 100 亿美元,并计划在该公司达成特定业绩目标后,追加最多 300 亿美元投资;亚马逊同样以 3500 亿美元估值投入 50 亿美元,并有意随时间推移再注入 200 亿美元。

追觅全面回应造车:「华为模式」轻资产、自研芯片、押注全球高净值人群

据界面新闻报道,追觅星空计划总裁马俊野昨日在美国旧金山接受媒体专访时透露,追觅汽车团队实际早在 2021 至 2022 年间便已启动筹备,与小米汽车同期,此后经历约三年技术静默期。

目前团队规模超千人,研发人员占比约 70%,预计今年下半年扩充至近 2000 人。CEO 俞浩深度参与整车 ID 造型与产品定义,几乎每天与团队保持高频沟通。

商业模式上,追觅采用类「华为模式」,与国内外成熟主机厂联合研发并代工生产,不自建整车工厂。

核心技术层面则坚持自研,涵盖全线控智能底盘、车载电机、固态动力电池、智能座舱,并首次确认独立规划研发座舱与智驾计算芯片。

针对外界对资金链的质疑,马俊野表示已「储备了足够的资金去造车」,并引入部分社会化资本与产业基金分摊风险。

产品定价方面,追觅明确「20 万元以内的车肯定不会做」,量产车型起步价在百万元以上,部分版本突破 200 万元,明年上市纯电轿跑,随后推出同系列 SUV。在市场逻辑上,追觅将目标锁定全球约 4 亿高净值人群,意在填补高端中国新能源汽车在海外市场的空白。

而对于「下一个乐视」的类比,他明确否认,强调追觅进行的是真实的底层技术研发,致力于交付面向全球的实体产品。

去年我国 Token 调用量达 21100 万亿,年末日均突破 100 万亿

据央视新闻报道,昨日,《全国数据资源调查报告(2025年)》在第九届数字中国建设峰会上正式发布。

报告显示,去年全国日均 token 调用量从年初的逾 1 万亿增长至年末的 100 万亿,呈指数级增长态势;全年累计 token 调用量达约 21100 万亿。

曝一加、realme 正式合并为子系列事业部,李炳忠出任总经理

据雷峰网报道,昨晚,OPPO 内部发布公告,正式宣布一加与 realme 品牌合并,成立子系列事业部。

  • OPPO 高级副总裁李炳忠出任子系列事业部总经理,统筹负责该事业部整体运营;
  • 一加与 realme 的营销服体系将整合至新事业部旗下,由原 realme 营销服总裁徐起出任子系列事业部营销服负责人。

产品层面,OPPO 同步成立子系列产品中心,下设国内产品部门与海外产品部,由李杰统一负责,直接向刘作虎汇报。原 realme 副总裁王伟出任子系列产品中心副总经理,向李杰汇报。

研发层面,原 realme 研发团队整体回归集团,影像、硬件等部门并入 OPPO,成为 OPPO 各硬件部门的下设单位。

Alphabet Q1 净利润暴增 81%,Google Cloud 首破 200 亿美元大关

今天,Google 母公司 Alphabet 发布今年第一季度财报,总营收同比增长 22% 至 1099 亿美元,净利润同比大涨 81% 至 626 亿美元,摊薄每股收益为 5.11 美元,连续第 11 个季度实现双位数营收增长。

  • Google 服务营收增长 16% 至 896 亿美元,其中 Google 搜索及其他业务收入增长 19% 至 604 亿美元,YouTube 广告收入增长 11% 至 99 亿美元,订阅、平台及设备收入增长 19% 至 124 亿美元;
  • Google Cloud 营收同比增长 63% 至 200 亿美元,首次突破 200 亿美元关口,运营利润由去年同期的 22 亿美元大幅提升至 66 亿美元;
  • 其他业务(含 Waymo 无人驾驶出租车和 Wing 无人机配送服务)营收为 4.11 亿美元,同比略有下滑,运营亏损扩大至 21 亿美元;
  • 集团整体运营利润增长 30% 至 397 亿美元,运营利润率扩大 2 个百分点至 36.1%。

Google Cloud 首次成为公司最主要的增长引擎,基于生成式 AI 模型构建的产品收入同比增长近 800%,在手订单环比几近翻倍至逾 4600 亿美元;企业版 Gemini 付费月活用户环比增长 40%,合作伙伴生态席位销量同比增长 9 倍。

与此同时,公司第一方模型每分钟通过直接 API 调用处理超过 160 亿个 token,较上季度增长约 60%,消费者 AI 订阅付费用户总数达到 3.5 亿,创历史最强季度。

Azure 增速 40%、AI 狂飙 123%,微软云业务全面提速

今天,微软发布了截至 2026 年 3 月 31 日的 2026 财年第三季度业绩:

营收 829 亿美元,同比增长 18%;GAAP 口径净利润 318 亿美元,同比增长 23%;非 GAAP 口径(剔除 OpenAI 投资影响)净利润 317.9 亿美元,同比增长 20%。

  • 生产力与商业流程部门营收 350 亿美元,同比增长 17%,其中 Microsoft 365 商业云收入增长 19%,消费者云收入增长 33%,Dynamics 365 增长 22%,LinkedIn 增长 12%;
  • 智能云部门营收 347 亿美元,同比增长 30%,Azure 及其他云服务收入增长 40%;
  • 个人计算部门营收 132 亿美元,同比下滑 1%,Xbox 内容与服务收入下降 5%;
  • 整体毛利润为 561 亿美元,毛利率约 67.6%,较去年同期 68.7% 略有收窄,主要受云服务基础设施成本上升拖累(服务类成本同比增长约 28%)。

最值得关注的增长引擎是 AI 与云计算的协同提速。微软 AI 业务年化营收突破 370 亿美元,同比增长 123%;微软云整体营收达 545 亿美元,同比增长 29%。

Meta 一季度营收 563 亿美元,净利润同比暴增 61%

今天,Meta 发布今年第一季度财报:

实现营收 563 亿美元,同比增长 33%;净利润 267.7 亿美元,同比大增 61%,摊薄每股收益 10.44 美元。

  • 家族应用(Family of Apps)营收 559.1 亿美元,其中广告营收 550.2 亿美元,同比增长 33%;贡献经营利润 269 亿美元;
  • Reality Labs 营收 4.02 亿美元,同比小幅下滑 2.4%;经营亏损 40.28 亿美元;
  • 整体经营利润率维持在 41%,与去年同期持平。

本季度最值得关注的增长引擎是广告业务的量价双升:广告展示量同比增长 19%,平均广告单价同比提升 12%,两者共同驱动广告营收高速增长。

公司预计,今年第二季度总营收在 580 亿至 610 亿美元之间,全年总支出指引维持 1620 亿至 1690 亿美元不变,但资本支出指引上调至 1250 亿至 1450 亿美元,主要反映今年更高的硬件组件定价及数据中心扩容需求

汽水音乐超越网易云成国内第三音乐平台

昨日,分析机构 QuestMobile 发布《2026 中国移动互联网春季大报告》,其中提到在线音乐 APP 行业格局生变:

酷狗音乐、QQ 音乐月活跃用户规模均超 2 亿,持续领跑市场;汽水音乐首超网易云音乐,跻身 TOP3;而网易云音乐被汽水音乐超越,位居第四。

报告指出,汽水音乐随着春节档「破圈」加速,下载量冲高,成功渗透中老年与下沉市场。

AI 分词器存在「语言歧视」:用印地语问 Claude,token 消耗是英文的 3 倍以上

昨天,AI 研究员 Aran Komatsuzaki 公布了一项针对主流大模型分词工具(tokenizer)的横评结果,揭示了 Tokenizer 存在「语言歧视」:

非英语用户在使用同一模型时,实际消耗的 token 数远多于英语用户,相当于被悄悄征收了一笔「非英文税」。

他将 Rich Sutton 的知名论文《The Bitter Lesson》翻译成 9 种语言,并分别喂入 6 家模型的 tokenizer,以英文原文在 OpenAI 分词工具上的 token 数为 1 倍基准,测量各语言在不同模型上的消耗倍数。

结果显示,同样的内容用中文提问,Claude 的 token 消耗达到基准的 1.71 倍,而 OpenAI 仅为 1.15 倍。印地语在 Claude 上的情况更为突出,token 消耗超过基准的 3.24 倍,阿拉伯语也达到 2.86 倍。

6 家模型横评中,Anthropic 的「非英文税」最高,Kimi 次之;Gemini 和 Qwen 的非英文税最低。Komatsuzaki 直言:「坦白说,我没想到 Claude 会差到这个程度,而且差距如此悬殊。我相信企业客户会非常在意这类问题。」

Komatsuzaki 指出,分词效率取决于模型训练数据中各语言的占比:英文数据量大,英文词汇被高效压缩;非英文数据较少,只能被切得更碎。

对用户而言,token 消耗增加意味着 API 调用成本直接上升,模型响应前的等待时间更长,上下文窗口也会更快耗尽。他的结论是:谁的市场大,谁的 token 就更省。

全国首个「商业人工智能」本科专业获批,中国科大今年秋季开始招生

中国科学技术大学日前官宣,教育部已正式批准中科大科技商学院、管理学院增设「商业人工智能」本科专业,中国科大由此成为全国首家开设该专业的高校,计划于今年秋季学期招收首届本科学生。

该专业历经近两年时间多次论证,定位为非纯技术导向,聚焦 AI 在商业场景中的融合应用。知识体系横跨 AI 与经济管理等多学科基础理论,涵盖基于 AI 的商业模式创新、AI 硬件架构与产业生态体系、商业智能体、AI 驱动的科创投资及 AI 治理等前沿内容。

在培养目标上,学生将系统掌握工商管理、人工智能、数理优化与计算机科学的核心理论,并锤炼商业 AI 融合、智能数据分析、人机协同决策、商业系统设计等八大核心素养。

小米 13 系列支持电池升级

小米商城最新页面显示,小米已为 13 系列的两台设备上线「电池升级」服务。价格与此前小米 13 Ultra 升级的价格一致,均为 149 元电池 + 40 元人工费用:

  • 小米 13:4500mAh → 4850mAh
  • 小米 13 Pro:4820mAh → 5361mAh

值得注意的是,更换后需升级至 OS 3.0.3XX 系统版本。本月早些时候,小米 13 Ultra 上线「电池升级」服务,支持升级为 5500mAh 电池容量(原版为 5000mAh)。

💡 山姆 · 奥特曼:按 token 计价终将过时,OpenAI 要做的是「智力工厂」

据 Stratechery 报道,OpenAI CEO Sam Altman 近日在接受科技评论人 Ben Thompson 采访时表示,按 token 计价的 AI 定价模式长期来看难以为继,行业最终将转向以「任务完成」为单位的定价体系。

Altman 以最新的 GPT-5.5 模型为例说明这一判断:GPT-5.5 的单 token 价格高于上一代 GPT-5.4,但完成同一任务所消耗的 token 数量大幅减少。他认为,用户从未真正关心 token 消耗量:

你实际上根本不在乎答案用了多少 token,你只想把这件事做完;你只关心总价是多少,以及需要的时候能不能随时调用到。

在此基础上,Altman 将 OpenAI 的定位从「token 工厂」修正为「智力工厂」。其核心目标是以尽可能低的价格交付尽可能多的智能,至于底层跑的是大模型还是小模型、用了多少 token、跑在 GPU 还是亚马逊自研的 Trainium 芯片上,用户都不需要关心。

Altman 同时透露,目前 OpenAI 客户中要求追加算力容量的人远多于谈判压价的人。他将 AI 与水、电等传统公用事业进行类比,并指出两者存在本质区别:

如果你把智能看作一种「公用事业」(像水电一样的东西),我不知道还有哪种公用事业让我觉得 —— 只要价格够低,我就会一直用、一直用更多。没有任何一种公用事业是这样的。

AWS CEO Matt Garman 对此补充称,过去 30 年算力单价已下降了若干个数量级,但今天卖出去的算力总量却比任何时候都多,AI 需求的增长逻辑与此高度相似。

新产品

小米玄戒 O3 芯片曝光,折叠屏或首发

据 XimiTime 报道,Mi Code 数据库近日曝光了小米玄戒 O3 SoC 的规格信息,即将发布的小米 MIX Fold 5(内部代号「lhasa」)有望首发搭载,预计起售价约为 1500 美元(约合人民币 1.02 万元)。

泄露数据显示,玄戒 O3 在架构上进行了一次彻底的重构,超大核主频从 O1 的 3.89 GHz 提升至 4.05 GHz,并将采用「超大核 (Prime) + 性能大核 (Titanium) + 小核 (Little)」的三簇架构,相较前代 O1 移除了大核 (Big) 集群。

  • 小核频率从 1.79 GHz 大幅跃升至 3.02 GHz,涨幅约 68%,超越上一代大核的 1.89 GHz;
  • 性能大核频率则从 3.39 GHz 小幅提升至 3.42 GHz,变化幅度有限;
  • GPU 频率从 1.2 GHz 提升至约 1.5 GHz,涨幅约 25%;
  • 内存频率规格维持 9600 MT/s 不变。

10.98 万元起,吉利银河 M7 远航家上市

昨天,吉利银河 M7 远航家正式上市,共推出四个配置版本,售价区间为 10.98 万元至 13.78 万元。外观上,新车延续吉利银河家族式设计语言,车头采用贯穿式 LED 灯带,配备可根据车速与散热需求自动调节的智能进气格栅。

车身尺寸为长宽高 4770mm × 1905mm × 1685mm,轴距 2785mm,后备箱容积 700 升,提供瀚宇蓝、晨林绿、星辉银、云曦白、玄夜黑、烟雨灰六种配色。

  • 搭载雷神电混 2.0 技术,发动机热效率 47.26%,系统峰值功率 175kW,综合效率 93.1%;
  • 全系内置 29.8kWh 电池,纯电续航 225km、满油满电综合续航 1730km;
  • 座舱搭载银河 Flyme Auto 2 系统,15.4 英寸 2.5K 中控屏,7nm 龙鹰一号芯片,25.6 英寸 HUD,50W 风冷无线充电;
  • 标配千里浩瀚 H3 方案,支持高速 NOA、自动上下匝道及全场景泊车辅助。

🔗 相关阅读:10.98 万元,吉利银河 M7 远航家上市,全系搭载 30 度电池,油耗低至百公里 3.35L

极米推出四款旗舰新品,X50 Ultra Max 实现 10000:1 原生对比度

昨晚,极米举办今年中国区新品发布会,推出 X50 Ultra、RS30、AURA3、MIRA 4K 四大旗舰系列。

X50 Ultra 系列:

  • 搭载自研「X-Vision 仿生光学引擎」,整合 DynaEye 无级仿生光圈、X-Vision 独立画质芯片、RGB 纯激光光源等五大核心硬件;
  • 顶配 X50 Ultra Max 实现 10000:1 原生对比度与 100000:1 动态黑位激发对比度,首次突破国产 DLP 投影原生对比度「万级」大关;
  • 搭载与紫光同创联合研发的 X-Vision 独立画质芯片,是继索尼、JVC 之后行业第三块投影专用画质芯片;
  • 首发限时到手价 X50 Ultra Max 为 17999 元,X50 Ultra 为 13999 元。

RS30 系列承袭 X50 Ultra 同源技术,顶配版 RS30 Ultra Max 搭载同款 DynaEye 无级仿生光圈,原生对比度达 7000:1,亮度 5500CVIA/6800ISO,全系标配智能双向移轴,3 米可投百吋巨幕,提供 Pro 至 Ultra Max 四档配置。

激光电视 AURA3 系列主打万级对比度,超短焦贴墙即投,最大支持 150 吋可卷曲幕布,机身不超 10kg,色域覆盖 99% BT.2020。

MIRA 4K 系列则将上代 1080P 升级至 4K,新增「光影画廊」功能,内置逾 100 幅艺术壁纸,待机状态下可将墙面作为展示画布。

腾讯 ima 推出知识 Agent「copilot」

昨日,腾讯 ima 正式推出知识 AI 智能体「copilot」,支持用户创建专属 AI 智能体,支持 Mac、Windows、iOS、Android、鸿蒙五大平台,目前采取申请制,将按申请顺序陆续开放。

copilot 的核心能力之一是其深度个人化的记忆系统,由 copilot 设定、用户档案、长期记忆、经验技巧四大模块构成。AI 智能体能够记住用户的背景、习惯与推进事项,实现跨场景连续调用并进行自我迭代。

在场景感知方面,copilot 支持以浮窗形式悬停于 ima 应用内,自动感知用户当前浏览的网页、文件或知识库内容,无需额外上传文件即可直接发出处理指令。

技能生态方面,copilot 首期内置知识库操作、笔记操作、生成报告等官方 Skills,知识库 Skill 现已支持读取文件正文,可完成跨文件信息汇总。

阶跃星辰发布 Step Image Edit 2:3.5B 参数超越 20B 级模型

阶跃星辰昨日正式发布新一代图像生成与编辑模型 Step Image Edit 2,主打轻量化、高质量与极速响应。参数量仅为 3.5B,官方宣称其实际表现已实现对 12B-20B 级开源图像编辑大模型的跨量级超越,单次生图耗时仅需 0.5-2 秒。

在公开学术榜单 KRIS-Bench 上,Step Image Edit 2 在轻量级图像编辑模型综合排名中位列第一。

能力层面,该模型支持图像生成与图像编辑、中英文渲染、局部编辑、视觉推理、主体一致性及风格迁移,可覆盖 IP 创作、海报设计、漫画生成、人像美颜、旅游修图、写真生成等实际使用场景。

生数科技发布具身智能「通用大脑」Motubrain

昨天,生数科技发布通用世界行动模型 Motubrain,定位具身智能机器人的「通用大脑」,将感知、预测、执行统一在一个模型中完成,让机器人真正理解并作用于物理世界。

  • 多任务泛化:任务越多,模型越聪明,不再局限于单一场景训练;
  • 多机器人适配:一套模型适配不同形态的机器人,打破「一机一模型」的传统做法;
  • 长程任务执行:可一次性完成超过 10 个连续动作的复杂任务,而非只跑 Demo 级别的 2-3 步;
  • 动态预测决策:能预判环境变化,边执行边调整。

在权威评测上,Motubrain 同时登顶 WorldArena(世界模型理解能力)和 RoboTwin 2.0(机器人执行能力)两项国际榜单,后者 50 个复杂任务平均得分 96.0,是唯一均分超过 95 的模型。

腾讯混元开源 Hy-MT1.5 端侧翻译模型,支持 33 种语言

昨天,腾讯混元正式开源面向移动端的离线翻译模型 Hy-MT1.5,压缩后体积仅 440MB,支持 33 种语言及 5 种方言与少数民族语言,无需联网即可使用。

官方数据显示,该 1.8B 参数模型在 Flores-200 中外互译基准测试中全面超越 Tower-Plus-72B、Qwen3-32B 等更大规模开源模型,以及 Microsoft Translator、豆包翻译等主流商业翻译 API。

🤗 Hugging Face: huggingface.co/tencent/Hy-MT1.5-1.8B-1.25bit

银河通用开源机器人大模型 LDA:「垃圾数据」也能用,还越练越强

昨天,银河通用机器人发布跨本体「隐式世界-动作基础模型」LDA,核心算法与代码同步全面开源,相关论文已入选机器人领域顶级会议 RSS。

LDA 的核心突破在于首次实现对全类具身数据的统一有效利用——涵盖虚实共融、人机混合、有无动作标签、高低质量等各类数据。实验表明,随着数据规模从数千小时扩展至数万小时,模型性能持续稳定提升;即便引入大量失败数据,性能不降反升。

  • 模型架构:LDA 实践了 WAM(World-Action Model)框架,在同一表示空间内统一学习策略生成、前向动力学预测、逆向动力学推断与视觉预测四项能力,形成完整的「感知—决策—反馈」闭环;
  • 视觉表征:以 DINO 结构化潜空间取代传统 VAE,有效过滤光照、纹理等外观干扰,使跨本体动力学学习得以对齐。对比数据显示,UWM 从 0.1B 扩展至 1B 参数时成功率几乎停滞,而 LDA 在相同规模扩展下性能持续提升;
  • 动作空间:提出统一的 hand-centric action space,将所有本体动作映射至末端执行器的手腕位姿变化与手部接触形态,彻底解耦操作语义与具体机械结构,使夹取、旋转、插入等操作能够跨本体共享动力学规律。

蚂蚁百灵 Ling-2.6-flash 开源

蚂蚁百灵昨日正式开源 Ling-2.6-flash 权重,模型总参数量为 104B,每次推理仅激活 7.4B,上下文窗口达 256K。

Ling-2.6-flash 在 Ling 2.0 架构基础上引入混合线性注意力机制,将原有的 GQA 注意力升级为 1:7 MLA + Lightning Linear 混合架构,并结合高稀疏 MoE 设计,推理效率显著优于同级模型。

在 4 卡 H20 环境下,生成速度最高可达 340 tokens/s,prefill 与 decode 吞吐峰值约为同级开源模型的 4 倍。

在 AI 智能体相关评测上,Ling-2.6-flash 表现突出,BFCL-V4、TAU2-bench、SWE-bench Verified(61.2%)、Claw-Eval、PinchBench 多项指标达到或接近同参数级别 SOTA 水平。

🤗 Hugging Face: huggingface.co/inclusionAI/Ling-2.6-flash

新消费

微信贴图支持发布 2 亿像素原图

昨天,微信官宣贴图支持发送、查看原图,并与 OPPO 合作,支持在贴图中分享 2 亿像素超清图片,目前该功能仅支持 Android 端,升级到 8.0.71 及以上版本可体验。

京东美术馆「开箱计划」启动

昨天,京东美术馆官宣启动公共艺术项目「开箱计划」(Unboxing JD Museum),将于 5 月起在北京、宿迁、深圳三城巡展。

项目以京东快递纸箱为媒介,核心载体为由深圳大星吉子与北京 Small Production 联合设计的移动展厅「纸箱亭」,展亭内将呈现影像、装置、声音等多媒介内容。

北京首站期间同步发起线上创作挑战赛,设手工与 AI 两大赛道,并联合京东公益「星光传递」计划展出乡村儿童绘画作品。此外,项目还面向全球逾百位艺术家与学者发起问卷及访谈,成果将以数字档案与出版物形式留存。

好看的

《穿普拉达的女王 2》今日上映

《穿普拉达的女王 2》今天正式上映,登陆全国院线。

影片将视角对准数字时代对传统时尚媒体的冲击 —— 昔日权威杂志《Runway》面临生存危机,「时尚女魔头」米兰达(梅丽尔·斯特里普 饰)与前助理安迪(安妮·海瑟薇 饰)再度合作。

DC《超级少女》确认引进

据豆瓣电影消息,DC 影业超英新片《超级少女》已确认引进中国内地,档期待定。

剧情改编自高口碑 DC 漫画《超级少女:明日之女》,讲述卡拉为拯救爱犬小氪,与意外结识的伙伴组成搭档,二人携手展开一场与时间赛跑的行动。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

作者 张子豪
2026年4月29日 19:01

最近 GPT Image 2 火了之后,网上都是那些彻底以假乱真的 AI 生成图片。大模型在视觉这条路上越走越远,让人兴奋又让人敬畏。

而 GPT Image 2 在眼下的 AI 生图领域,几乎是没什么好争的。但如果说云端闭源收费的最好模型是 GPT Image 2,那能部署在本地的,免费开源模型或许会是 SenseNova U1

▲由 SenseNova U1 生成

SenseNova U1 是商汤最新发布的一个开源的多模态模型,它的 Lite 系列 8B 和 A3B 参数版本,目前已经在 Hugging Face 和 GitHub 上开源。

从模型参数和选择开源的路线上,我们就能看到它和 GPT Image 2 是不太一样的方向。

APPSO 也提前拿到了测试资格,我们发现商汤这款新一代原生理解生成统一模型,就开源模型来说,已经做到了最好水平。

它带来了大模型行业首创的连续图文生成输出,就是用单一模型就能连贯输出图片和文字,这个新鲜很值得去试一试。

目前 SenseNova U1 开源模型的权重已经在 Hugging Face 和 GitHub 上开放下载。

GitHub:https://github.com/OpenSenseNova/SenseNova-U1

Hugging Face:https://huggingface.co/collections/sensenova/SenseNova-U1

带着图片的思考

我们可能遇到过这样的需求,想让 AI 解释一个复杂概念,同时配上示意图,而且图要跟着文字的逻辑走,解释到第几步,图里就画到第几步。

一般的模型可能会直接采用生成代码的方式来解决这个问题,像 Claude 使用的流式构图,或者一些 Vibe Coding 的网页,包含文字和配图。

但是要完全用一个模型同时在回复流里面,生成文字和图片,并且不借助外部工具的调用,基本上现有的模型做不到这一点。因为文字生成和图像生成在模型底层,往往是两件事。

SenseNova U1 的第一项特点,就是在单一模型上进行连续的图文创作输出。

比如我们试了一个场景,让他生成一份简单的绘本故事,讲述一只小熊历经四季的变化。

▲ 提示词:请创作一个图文绘本故事,主角是一只棕色的小熊,故事讲述它经历四季变化。

生成的连续图文不仅理解到位,有一定的故事性,而且能很好的保持一致性,同时图片的文字渲染全部准确,小熊也在冬天穿上了毛衣,戴上了帽子。

实测中发现用 SenseNova U1 来进行一些创意性的工作也非常有意思。

在官方的测试案例里,上传一张大头贴给模型,然后要求它设计几款不同的发型。可以看到,在生成连续图文的完整过程中,人物的一致性,以及结构、细节,SenseNova U1 都做到了精准保持。

▲ 提示词:帮我设计几款合适的发型,希望好看的同时比较有特色,然后帮我选一款最适合我的

还能直接让他设计一个游戏角色,展示从整体视觉基调、核心交互细节,再到环境叙事和性格刻画的逻辑迭代过程。

更有意思的是,基于时序性的回答,用 SenseNova U1 创作是再合适不过。我们要求他生成一颗牛油果变成一颗室内盆栽的过程,连续图文的形式很好地呈现了完整的生长过程。

▲ 提示词:怎么把一颗普通的牛油果种成一棵室内盆栽

一番测试下来,图片从来没有离开过文字的逻辑,推理的思路走到哪里,图片就跟到哪。

以前的图文结合或许是调用不同模型,和对应工具的写作,确保回复的内容里,图文是在说同一件事。现在这项写作从底层直接发生在模型内部,无论是工具还是软件,都不需要参与对齐的过程了,我们也只需要看到最后的结果。

对内容创作者、设计师和营销人员来说,SenseNova U1 的出现,开始解决了一个长久以来的痛点,即如何让 AI 边写边画,而且图文逻辑严丝合缝。

量大管饱的最强开源

确认了它的原生理解生成统一能力后,我们要看 SenseNova U1 能否在复杂信息图生成方面,达到开源模型的最好水平。

信息图是把一大段复杂的文字或数据,压缩成一张一眼能看懂的图。这件事其实比「画一张漂亮的图」难得多,需要理解内容,知道哪些是核心,哪些是辅助,信息之间的逻辑关系,以及文字渲染等,都是难题。

闭源的 GPT Image 2 在这方面已经做得很好了,我们在测试的时候一开始也没有抱着太大的希望,会比 GPT Image 2 还要更好。但 SenseNova U1 的表现,拿下开源 SOTA 的称号也确实是当之无愧。

我们先是就用一句话「用一张信息图解释一下 DeepSeek V4」,没有任何附加的提示词,看看它生成的信息图表现如何。

▲ 由 SenseNova U1 生成

能看得出来 SenseNova U1 有联网搜索到和 DeepSeek V4 相关的信息,像是原生多模态,还有万亿参数,以及百万的上下文 Token。

而除了简单的提示词,还可以直接发送一个链接给它,SenseNova U1 也有对应的网页抓取工具,提取网页内容,来进行信息图的生成。

这些知识科普类的信息图,SenseNova U1 的表现基本上都能驾驭。更简单的像是「一张什么是电子烟的 3D 拆解科普」,它也能很快生成。

▲由 SenseNova U1 生成

而如果提示词稍微详细一点,它也能完全照着提示词的内容,把这些文字准确渲染成可视化程度较高的信息图。

还有像是最近很火的武汉三鲜豆皮,直接告诉 SenseNova U1,生成一张三鲜豆皮完整制作流程的步骤图。

还有夏天来了,挑选不同的防晒霜,也是一张信息图,就能把 SPF 和 PA 值这些复杂的挑选参数讲清楚。

甚至是要它画一张 AI 大模型从训练到推理的工作原理图,适合完全不懂技术的人看懂;SenseNova U1 也能用轻松有趣的风格,简单的描述 AI 大模型的工作过程。

在其他场景的应用,像是营销、办公、设计参考和商业分析,我们都用不同的例子来测试了 SenseNova U1 的表现。

一般来说,营销场景对视觉风格的要求最高,也是最能看出模型有没有真正理解「用户想传递什么感受」的地方。一张好的营销图片,放在文章中间,甚至有可能直接被我们误认为是微信的文章内广告。

就像这张 SenseNova U1 生成的上海旅行信息图,不仅把地图描绘出来了,还列举了上海的特色。

在办公场景里,好看又要比准确和高效更重要。我们测试了它对信息处理的能力,把一份五页的会议纪要压缩成一张一屏能看完的总结图,要求逻辑清晰、重点突出,适合直接转发给没参会的同事。

复杂的信息之外,SenseNova U1 也能做到很好的视觉风格参考,给它一段品牌的调性描述,要求生成一张包含配色建议、排版建议、氛围关键词的风格参考图,结果居然也还不错。

在一些数据分析的任务上,我们也测试了 SenseNova U1 数据可视化的能力,用图表的方式来呈现更合理的信息图。

可以看到,SenseNova U1 在信息提炼这一步做得不错,它确实读懂了内容,知道什么重要什么次要。

但是在视觉表达上还有提升空间,有时候一些文字的渲染,还是会出现错误,对于需要快速出图、不想花时间在设计工具上反复调整的场景,已经完全够用。

下一个多模态模型的样子

实测完 SenseNova U1,我们发现它的意义,在于它是第一个把「理解和生成统一」这件事认真做出来的开源模型。而这,或许是整个多模态领域下一步要走的方向。

GPT Image 2 的刷屏,说明图像生成的「生成质量」这条线已经被闭源模型拉得很高了。开源模型如果继续在同一个维度继续追,大概需要很长的时间才能赶上,并且开源的价值也会被压缩到只剩下「便宜」。

SenseNova U1 提供了一个不同的技术路径,对于整个开源社区的方向都有着重要意义。它除了在解决「怎么生成更好的图」,也在告诉我们多模态模型的下一步会是什么样子。

▲ SenseNova U1 采用了行业首创的 NEO-unify 原生架构,实现多模态理解生成的高效统一

过去的多模态模型,理解图和生成图是两套系统在协作。一套负责看懂输入,一套负责画出输出,中间靠接口传递信息。两套系统各有各的内部语言,信息在传递过程中会有损耗,就像两个人用翻译软件沟通,意思大体到了,但总有点什么没传过去。

SenseNova U1 则是从底层把这两件事,合进了同一个表征空间。他们今年 3 月的技术博客里,就重点讲解了 NEO-unify 这一项架构。

目前大模型行业的惯例是,多模态 AI 看图要靠一个叫「视觉编码器(VE)」的东西压缩处理,然后再交给生成器。在 NEO-unify 架构里,商汤把这套臃肿的传统范式直接扔了。

结合 NEO-unify 结构的 SenseNova U1,所使用的视觉接口是近似无损的,它直接把图像分块(Patch)吃进去,不经过任何预训练编码器压缩;然后在同一个主干网络里,让文本和视觉的训练端到端统一进行。

在理解与生成各项基准测试上,SenseNova U1 的表现也达到同量级开源模型的 SOTA 水平,甚至在多项指标上的表现能和 Nano Banana 这些闭源模型相媲美。

▲ 分别是图像理解、图像生成,和视觉推理基准测试结果

它回归了多模态的第一性原理,从底层的像素和文字开始,自己构建内部的认知。

这也能解释为什么它消耗的 token 更少,生成效率更高。即使它只有 8B 的参数的版本,也能打出超强的极致性价比。

本次开源的是 SenseNova U1 的轻量版本 SenseNova U1 Lite,目前它有两个版本:8B 参数的 SenseNova-U1-8B-MoT,可以在边缘设备上跑;38B 总参数但激活只有 3B 的 SenseNova-U1-A3B-MoT,提供更强能力,同时将推理成本控制得很低。

▲SenseNova U1 已经在 GitHub 和 Hugging Face上开源,链接:https://github.com/OpenSenseNova/SenseNova-U1、https://huggingface.co/collections/sensenova/sensenova-u1

两个版本都可以本地部署、可以微调、可以接进自己的数据管道。对需要把图像生成能力嵌进自己产品的开发者来说,能够对模型行为有完全的控制权,数据也不用出去。

如果你需要一个能够高效实现理解与生成的模型,作为开源模型里的最强代表,SenseNova U1 确实值得尝试。

商汤还在 GitHub 上开源了面向 Agent 运行时的 AIGC 技能库 SenseNova-Skills。我们可以直接把SenseNova U1这种强大的能力,接入到自己的智能体(Agent)工作流中。

利用这个工具包,我们可以直接在像 OpenClaw、Hermes 这样的 Agent 平台中一键调用。模型会自动评估我们的提示词,选择合适的版式,经过多轮生成,输出最佳的专业信息图结果。

▲ Skills 链接:https://github.com/OpenSenseNova/SenseNova-Skills

回顾整个测试,SenseNova U1 这次交出了一份不错的答卷,它是目前我们能拿到手里的同量级最强开源模型。

对创作者来说,它行业首创的连续图文创作输出能力,打破了过去文字与配图割裂的窘境,真正让边思考、边写作、边配图的连贯创作成为现实。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

iOS 27 发力 AI 修图,苹果也开始 AI 焦虑了

作者 苏伟鸿
2026年4月29日 18:30


今年的 iOS 27,将会 AI 味浓浓。

彭博社报道,苹果准备在今年的 WWDC 开发者大会上推出一套全新的 AI 修图工具,将会集成在 iPhone、iPad 和 Mac 的照片应用中。

沉寂了一年的 Apple 智能,将随着 iOS 27 的推出,再次回到聚光灯下。

两年前,苹果还公开表示不做 AI 修图功能,在竞争对手的步步紧逼之下,终于还是忍不住跟进了。

iOS 27:AI 无处不在

在 iOS 18 推出的 Apple Intelligence 工具集,苹果就已经允许用户利用 AI 简单消除照片中的物体,属于当下智能手机的标配功能。

苹果的对手已经走得更远。像是把「AI 修图」作为标志性功能的 Google,已经实现给人物更换完美表情、把人物加入合照,甚至重构整个画面背景的能力,整个 Android 阵营都在发力类似的功能。

图源:WIRED

在 iOS/iPadOS/macOS 27 中,苹果将在「照片」App 的编辑界面中,增加一个全新的「Apple Intelligence Tools」(Apple 智能工具集)模块,包含以下三个功能:

  • Extend(扩展),就是 AI 扩图的功能,允许用户在原始画面之外额外生成图像内容,比如拍摄一张旅游景点的地标图,然后用这个工具来填充周围的景色,用户可以自行控制扩图的范围和位置。
  • Enhance(增强),利用 AI 自动修图,有点像不能自定义的「豆包修图」。
  • Reframe(重构),主要运用于苹果的空间照片,允许用户在拍摄后改变视角,比如一张汽车照片可以从正面视角调整为侧面视角。这个功能将充分利用空间照片来自多个摄像头的结构数据。

不过,根据内部测试的员工透露,这些功能的开发并不算顺利,效果更复杂的「重构」和「扩展」不稳定,苹果很可能会推迟或砍掉这些功能的发布。

包括这个新的 AI 修图功能在内,iOS 27 系统的更新将会沿着「优化」和「AI」两个主旋律进行。

此前爱范儿已经多次报道,由于 iOS 26 引入了「液态玻璃」的全新设计语言,系统稳定性有明显下降,因此 iOS 27 将会聚焦在系统稳定性优化上,不仅要修复目前 iOS 26 的大量 Bug,还会提升设备的续航和性能表现,并持续修改液态玻璃的视觉效果。

其余的功能更新,则会集中在「AI」上。首先,苹果正在努力将 2 年前画饼的 AI Siri 正式实装 iOS 27,这也是 Apple 智能体验和未来苹果 AI 硬件战略的核心体验部分。

虽然已经「潜心打磨」两年,今年年初有内部人员向彭博社透露,AI Siri 的一些杀手级功能,例如语音控制 Siri 操作应用,测试结果并不理想。

这意味着,即使我们能在 iOS 27 见到 AI Siri 庐山真面目,它也大概率会是一个「技术预览版」,并且需要等待后续更新补充完整功能。

旧饼还没兑现,iOS 27 选择继续加码 AI 新功能。

苹果打算进一步将 Siri 改造为类似 ChatGPT 和 Google Gemini 那样的聊天机器人,届时 Siri 会有一个独立应用,用来对话和存储聊天记录。

苹果还计划在邮件、日历和 Safari 浏览器等第一方应用中,引入新的 Siri 引擎,实现更强的搜索和数据管理能力。

除此之外,苹果正在酝酿一个 AI 搜索引擎, 允许用户从网络搜索信息,生成综合的报告和信息列表,以及网页链接,作为 Safari 和 Spotlight 网络搜索。

在健康领域,苹果将结合 AI 推出「Health+」的订阅服务,利用 AI 智能体,对用户的身体数据进行个性化分析,并针对性推送真人医生录制的建议。

比起两年前那场 WWDC,iOS 27 这一大批 AI 功能,比目前的 Apple 智能还要更丰富不少。

FOBO 的风,还是吹到了库比提诺

2025 年 1 月, 苹果的软件主管 Craig Federighi 和营销高级副总裁 Greg Joswiak 接受了《华尔街日报》的专访,谈到了对 AI 的看法。

其中 Federighi 特别提到了「AI 修图」,解释为什么苹果只推出「消除」,而不是如同三星和 Google 一样做大量的功能:

对我们来说,重要的是帮助人们传播准确的信息,而不是虚构的「幻想」。

Google Pixel 的表情修正功能,图源:The Washington Post

苹果公司内部曾经针对「AI 修图」的尺度进行了长时间讨论,考虑到用户的高需求,苹果公司愿意迈出「小小的一步」,于是在 iOS 18 之中推出了「AI 消除」的功能。

而像是「图乐园」这种 AI 生图功能,苹果也做出了严格的限制,只能用于创作卡通图案,避免生成逼真的图像造成误导。

某种程度上,苹果的坚持已经开始松动,iOS 27 这个全新的「AI 扩图」功能,让 Apple 智能进一步介入照片的真实性。

回望两年前的那场 WWDC,Apple 智能以一个非常温和的形象问世,没有想象中的 Apple-GPT,苹果的很多尝试都显得谨小慎微,不具备改天换地的野心。

但 AI 产品的代际变化速度极快。别说两年前,两个月前都没人觉得 ChatGPT 是一个好用的文生图机器人,现在打开社交媒体 GPT Image 2 的作品已经铺天盖地。

两年没动弹过的 Apple 智能,自然「遥遥落后」。

作为终端厂商的苹果,原本拥有一个得天独厚的优势,能够一夜让自己的 AI 产品面向全球十亿用户推出。

只是,对于用户来说,Apple 智能不仅不算好用,更致命的是,它提供的价值,和用户的需求,有很大程度的错位,导致用户并不想用。

FOBO(Fear Of Becoming Obsolete,害怕被淘汰)的阴影,终究还是笼罩了苹果。

过去, 苹果可以决定什么功能值得出现;如今,它也必须回应用户已经习惯拥有什么,行业在发力什么。iOS 27 上这些曾被苹果否决的 AI 功能,本质上都是一次迟到的补课。

Siri 版 GPT 要做,AI 搜索引擎要做,系统应用也全部 AI 化,现在苹果也盯上了 AI 照片编辑,一个其他手机品牌很喜欢演示的功能。

苹果能不能把这些功能做好,又是另一个问题。

即使已经发布 2 年,Apple 智能的照片「消除」效果依旧不如人意,横向对比 Android 阵营显得更显落后,经常会出现消除不彻底、扭曲图像的问题。

全新「扩展」和「重构」功能则更复杂,内部已经反馈稳定性不佳——其实,我相信对于更多用户来说,会更希望苹果能把更实用的「消除」功能进一步完善好。

并且,AI 修图一直以来都争议缠身,特别是前两年的 Google Pixel,可以在一张真实照片上加入任何元素,实现以假乱真的效果,就引发了国外媒体对于「真实」和「伪造」的大讨论。

左图为实拍,右图经过 Pixel Magic Editor 编辑,图源:The Verge

苹果会尽量规避这种风险,目前看来,这些新功能的自由度相当有限,用户不能自定义修改的方向和指令。

面对行业趋势和用户需求,苹果也不得不松动和更改曾经的价值取向,现在的他们,其实还不知道自己要做什么样的 AI。

但这不仅是苹果的困惑,其实也是笼罩整个行业的迷思,最富含 AI 的 Google Pixel,也并非是我们期待的那台 AI 手机。

既然暂时难以重新扮演行业的引领者,那么在 AI 这场竞赛中持续调整步伐的苹果,至少还能先通过跟随,确保自己依然留在牌桌之上。

但我仍然期待,今年的六月,苹果能为我们带来惊喜。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

ChatGPT 拎包入住云计算一哥,你的下一任好同事可能是 AI

作者 莫崇宇
2026年4月29日 14:22

「SaaS 末日」这个词,最近在科技圈的流传速度不亚于任何一条爆款新闻。

不少硅谷分析师都在疯狂输出焦虑,大意是说 AI Agent 这么猛,现有的企业软件如果不推倒重来,马上就要被拍死在沙滩上。这股风声甚至直接「吹绿」了几家老牌 SaaS 公司的股价。

说实话,每次听到「颠覆」、「末日」这种词,大家可能都会下意识觉得是炒作。

但在今天凌晨召开的 「What’s Next 」新品发布会上,亚马逊云科技 CEO Matt Garman 给出了一个挺中肯的定调:末日论确实夸张了点,但如果你指望靠着原来那个老旧系统,随便加个 AI 聊天框就能应付差事,那才是真的危险。

▲ 亚马逊云科技CEO Matt Garman

真正的转型发生在更深处。当工作流、数据结构、应用架构和交互界面都跟着 Agent 的能力重新设计,企业软件才算完成了这次重建。这是亚马逊云科技(云计算一哥)这次所有新产品的底层逻辑。

有趣的是,在官宣与微软「分手」之后,OpenAI CEO Sam Altman 也通过视频的方式给亚马逊云科技站了台,官宣 ChatGPT 最强模型拎包入住亚马逊云科技,并达成深度战略协作。

而无论是面向个人和团队的 Amazon Quick,还是供应链、招聘、医疗三个垂直场景的 Connect 新家族,再到与 OpenAI 的深度合作,指向的都是同一个问题的答案:以 AI Agent 为起点,SaaS 未来应该长什么样。

告别「肉身搬运工」,你的工作流迎来大一统

来,咱们做个深呼吸,回想一下你今天极其崩溃的上午:

领导在企业聊天工具上吼了一嗓子模糊不清的需求,你虎躯一震,赶紧切到公司的 CRM 系统里疯狂扒拉客户数据;接着打开邮箱,在一堆垃圾邮件里翻找上周的进度;最后在本地新建一个文档,把这些零碎的信息一点点拼凑、复制、粘贴。

发现问题了吗?(此处应有黑人问号脸.jpg)

我们的办公软件越装越多,但它们之间是互相割裂的、老死不相往来的。而你,就是那个在各个信息孤岛之间来回奔波的「肉身搬运工」。

为了解决这个痛点,亚马逊云科技推出了全新升级的 Amazon Quick 桌面版(目前处于预览阶段)。它的核心设计逻辑是将分散的信息网收拢,在系统后台构建一张关于人员、项目、决策和事务动态的知识图谱,让上下文主动跟着人走。

每一次使用,Amazon Quick 都在默默积累你处理的文档、项目的 Deadline、频繁沟通的同事以及升级处理的紧急邮件。基于这些沉淀,它可以主动提示你当天的优先事项。

打个比方,你准备下午跟一个重要客户开会。如果是以前,你得花两小时找资料。现在,你只需要给 Quick 甩一句:「帮我准备一下下午见王总的材料。」

接下来就是见证奇迹的时刻。

Amazon Quick 会迅速认出「王总」是哪个项目的,然后去系统里把王总团队之前的历史案例扒出来,接着去你的本地 D 盘里偷窥……哦不,读取最新的产品路线图,再结合 Slack 里同事昨天的吐槽记录。几分钟后,一份逻辑严密、排版精美的 PPT 就糊在了你脸上。

这还没完。同样是这堆信息,你让它变身,它就能立刻吐出一份摘要邮件,或者一份 Excel 营收表。如果王总说「改天聊」,Amazon Quick 甚至能自动查对你们俩的日历,算好时差,把新的会议邀请发过去。全过程,你只需要在一个对话框里当个无情的监工。

美国最大的互助人寿保险公司 New York Life 的机构寿险业务 CTO David Gregorat 的评价一语中的:「Quick 让我们重新想象了整个运营方式。原来需要拉多份报告、等分析师处理的答案,现在团队里任何人都能通过对话式 Agent 直接获取。」

至于这效率有多夸张?亚马逊云科技 Agentic AI 商业化副总裁 Jigar Thakkar 透露了一组极其夸张的数据:宝马、3M、亿滋这些大厂内测后,部分流程的处理时间直接被一刀砍了 80%。3M 的销售代表每周甚至能凭空多出 5 个小时的摸鱼……啊不,思考时间。

呐呐,这才是 AI 科技赋予我们的顶级松弛感。

你的下一个好同事,是个 AI Agent

如果说 Amazon Quick 是给你个人加了个三头六臂的效率外挂,那 Amazon Connect 家族的扩编,就是亚马逊云科技尝试重塑企业核心流程的重头戏。

亚马逊云科技提出了一套叫「Humorphism(人态设计)」的理念。听起来有点玄乎,说白了就是:AI 不能只是个冷冰冰的执行机器,它得像个人类好队友一样,懂轻重缓急,能顺畅沟通。

基于此,Amazon Connect 家族不仅将原有的客服产品升级更名为 Amazon Connect Customer,还针对垂直场景发布了三款 Agentic AI 解决方案。

Connect Decisions:让供应链规划师从救火转向决策

供应链出现中断后,企业通常需要超两周时间处理,期间伴随大量资金损耗和违约风险。

Connect Decisions 针对这一痛点,为规划师配备了全天候在线的 AI 队友。它的底层并非空中楼阁,深度集成了亚马逊 SCOT 团队(负责管理亚马逊全球 4 亿 SKU 需求的核心部门)所研发的预测模型。

面对没有历史数据的新品,它能自动关联相似品类生成需求计划。

当监控到关键供应商交货落后(例如预计 10 天内导致两个配送中心断货)时,它会将传统软件每天产生的数千条警报收敛为几条最高优先级的例外事项,并直接给出两套附带预期影响、成本和置信度评分的处置方案。规划师手动选择并说明原因后,系统会吸收这条判断逻辑,供未来参考。

Connect Talent:25 万人招聘经验化身「赛博面试官」

亚马逊云科技在 2025 年旺季期间单季招募了 25 万名季节性员工,Connect Talent 便是这套庞大招聘经验的产品化。系统能根据职位描述自动解析能力需求,生成面试题和评分标准(需人工审核)。

候选人可以在任何方便的时间完成 AI 电话面试。

系统最大的特点是能对模糊回答进行追问,确保评估的结构一致性。原本需要数周完成的 80 场初筛面试,现在几天即可完成。系统最终向招聘方展示的是隐去个人身份信息的标准化能力评分,用数据支撑最终的录用决定。

Connect Health:把医生从文书工作里解放出来

行业数据显示,医生与患者面诊 1 小时,往往需要额外花 2 小时处理行政记录。

亚马逊应用人工智能解决方案高级副总裁 Colleen Aubrey 指出,大量精力消耗在管理事务而非直接诊疗上,是亟待解决的痛点。Connect Health 可以在诊疗过程中自动记录临床内容、生成就诊摘要和推荐账单编码,并能在就诊后发送患者易于理解的随访说明。

系统的每条输出均可追溯到原始的检验结果和上次就诊记录,以满足严格的医疗合规要求。这背后,其实也是亚马逊拿自家兄弟 Amazon Pharmacy(亚马逊药房)和 One Medical(初级医疗服务)常年趟坑积累下的实战经验。

Agent 时代来了,SaaS 迎来下半场

整场发布活动的另一大焦点是亚马逊云科技与 OpenAI 的合作。

OpenAI CEO Sam Altman 顶着他标志性的微笑通过视频露了个脸,他表示亚马逊云科技和 OpenAI 正在从底层共同研发一套面向企业的 Agent 平台,深度集成亚马逊云科技服务。

是的,OpenAI 的 GPT-5.4 现已有限预览上线 Amazon Bedrock,而当前最强的前沿模型 GPT-5.5 也将在数周内正式上线。这意味着企业客户无需离开亚马逊云科技环境就能使用 OpenAI 的模型,数据和应用可以留在同一套权限体系下运行。

企业无需配置新的安全体系,直接通过原有的 IAM 访问控制、PrivateLink 私有连接、CloudTrail 完整日志和合规框架即可统一管理,甚至模型用量也能计入亚马逊云科技的云承诺消费中。

在基础设施层面,亚马逊云科技的核心逻辑是为 OpenAI 的前沿模型提供一个极其安稳、合规的『家』。企业不仅能直接调用顶尖模型,更能在底层依托亚马逊云科技强大的全球基础设施网络进行推理和部署。说白了,就是让你在跑复杂、高并发的企业级应用时,完全不用操心底层的承载力。

在此基础上,双方联合推出了 Bedrock Managed Agents 预览版。这套服务以 OpenAI Agent Harness 为核心构建,Harness 就像是一本专门为模型定制的战术手册。经过协同训练后,Agent 可以在长时间运行的复杂任务中实现更快的执行速度和更稳定的行为控制。

Agent 能够部署在 EC2 实例、Fargate 容器或任何其他亚马逊云科技计算资源,具备跨会话的持久化记忆,且所有推理过程均不离开亚马逊云科技环境。

这套服务与亚马逊云科技现有的开放平台 Bedrock AgentCore 形成互补。参与合作的亚马逊云科技杰出工程师副总裁 Anthony Liguori 透露,双方团队在八周内从零开始完成了这项工作。开发者终于能将 OpenAI 的最新模型与亚马逊云科技的规模、安全和基础设施完美结合,构建出满足企业治理和审计要求的智能体。

此外,每周活跃用户在两周内从 300 万激增到 400 万的 OpenAI 代码智能体产品 Codex 也将在亚马逊云科技上线。它支持 Codex CLI、桌面应用和 Visual Studio Code 插件,应用场景已从基础代码生成延伸至系统解释、测试生成、遗留代码现代化以及研究分析等知识工作环节。

一大波硬核的产品发布看下来,估计不少朋友已经在屏幕前战术后仰,甚至可能觉得这些不就是加了 AI 滤镜的高级办公软件吗?

如果你真这么以为,那可就草率了。

Matt Garman 在发布会上讲了一段很通透的话。他说 20 年前大家搞云计算,很多公司就是把机房里的服务器原封不动地搬到了云上。钱没少花,效率一点没涨,那叫搬家,不叫转型。

现在的 AI 也是一样。如果你只是拿 AI 来替换现有的某一个按钮、某一个操作,那你永远摸不到那传说中「5 到 10 倍」的效率提升。

亚马逊云科技这一套组合拳打下来,意思再清晰不过了:软件的存在形式,已经被彻底推翻了。

未来的工作流里,不再是人去使用软件,而是人给 Agent 定目标,Agent 去调用软件。以前我们去上班,是去启动软件;也许再过两三年,我们去上班的唯一动作,就是点开电脑,看着满屏的「赛博同事」,然后深情地说一句:「诸位,今天的 KPI 也拜托大家了。」

然后,你安详地端起泡着枸杞的保温杯,静静地看着它们疯狂打工。

那么问题来了,现有的那些 SaaS 巨头,真的会迎来「末日」吗?

没那么严重,但处境确实微妙。SaaS 过去靠席位收费、靠功能壁垒锁用户,这两件事在 Agent 时代都开始松动。一个 Agent 能同时处理过去多名员工的工作,「按人头收费」越来越站不住脚;通用 Agent 加上开放 API,又在慢慢拆解功能壁垒。

真正能活好的,是两类公司:

一类有足够深的领域积累,正如这场发布会传递出的核心信息:当大模型本身变得像水电煤一样普及且廉价时,真正稀缺的,反而变成了能够被编码进 Agent 里的「领域知识」(Know-how)。

Salesforce 对销售工作流的深刻理解,Workday 对人力资源合规的经验,或者是亚马逊自己积累了 30 年的供应链判断标准等等——这些沉淀下来的行业 Know-how,才是构建下一代企业软件真正的护城河。

另一类是掌握数据入口的——Agent 的能力上限,取决于它能读到什么数据。谁控制着企业最核心的业务数据流,谁就决定着 Agent 能做多少事。夹在中间、既没有深度积累又没有数据优势的中型 SaaS,压力才是实实在在的。

所谓的「SaaS 末日」或许只是贩卖焦虑,但这场转型的烈度,绝不亚于当年的企业上云。唯一的区别是:这一次技术的狂飙,没给我们留出慢慢摸索的时间。

但时间紧,不代表就要慌。

因为亚马逊云科技已经把最难啃的底层基建做好了。SaaS 公司大可直接踩在亚马逊云科技巨人的肩膀上,把精力全砸在服务客户上;打工人更无需焦虑,复杂的系统运行全被保留在后台,留给你的,只有一句轻飘飘的「帮我搞定」。

时代的推背感确实让人头晕目眩,但与其在未来的站台上焦虑它会不会撞翻「旧马车」,不如干脆点,检票上车,看看新世界的风景到底有多壮阔。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

高通的「共享内存架构」,想让 Win 本追上 MacBook Pro

作者 杜晨
2026年4月29日 12:27

一台 14 或 16 英寸的笔记本电脑,将几十上百 GB 内存直接封装进 SoC,实现超过 200 GB/s 的高性能内存带宽,还有轻薄的机身和安静又狂暴的性能……

你可能以为这是 MacBook Pro——但如果我告诉你,这是一台 ARM 架构的轻薄型 Windows 本呢?

4 月 27 日,华硕发布了灵耀 16 Air 的骁龙版,搭载的是高通骁龙 X2 Elite Extreme 平台,也即高通去年推出的第二代 Windows on ARM 处理器。

这是第一颗将 LPDDR5X 内存做进 SoC 封装的骁龙旗舰 PC 平台,是与苹果「统一内存架构」理念一致、执行接近的平行方案。尽管没能做到 M 芯片的百分百效果,仍然是高通在这条新路上,最关键的一次尝试。

这台华硕灵耀 16 Air 骁龙版,整机 1.2kg、厚度 13.9mm,48GB 内存(频率 9523 MT/s),可提供 20-30 小时续航。机器于 4 月 28 日京东首发,售价 13999 元。华硕同时也有 14 寸版本提供。

同期亮相的还有面向创作者的 ProArt 创 X 2026 二合一笔记本,重 0.82kg、提供 22 小时续航与 2.8K 144Hz OLED 屏。这些机型共同组成了华硕在 ARM Windows 阵营的 2026 全新产品矩阵。

回到顶配 X2 Elite Extreme 的共享内存架构:将内存放进芯片封装内,放到 CPU、GPU 和 NPU 的身边,并不只是改了改电路板布局。实际上,整个计算资源调度的方式,都发生了很大的改变。

苹果在 2020 年的 M1 芯片开始,不仅将内存封装进 PC 级芯片,更让调度变得更加灵活,内存反复读写的次数要求有所降低,结果就是让内存带宽暴增——称为统一内存架构。今年 3 月发布的 M5 Pro 和 M5 Max,则更是将内存带宽推到了 307 GB/s 和 614 GB/s。

骁龙 X2 Elite Extreme 是 Windows on ARM 笔记本第一次通过内存内封装的思路,让 1.2 公斤左右的轻薄本也可以享受类似于统一内存架构带来的快乐。

这背后,是高通和华硕等各大 OEM 一起,想让 Windows 笔记本追上 MacBook Pro 的企图。

让内存搬运再快一点

需要注明的是,「统一内存架构」是苹果使用的说法,高通官方称自己的方案为 SiP(System-in-Package)。

两者所指不完全相同:UMA 描述的是内存访问架构,SiP 则指的是具体的封装技术。但它们的实现效果和追求目标高度一致——共享物理内存池、跨 IP 块缓存一致。

可用于算力密集型任务(比如 AI 推理)的「显存」上限,直接等于整机的内存上限。哪怕是一台 48GB 的轻薄本,理论上也可以本地运行数百亿参数级别的大模型,这在传统架构上需要工作站级独显,采用集显的轻薄本很难做到。(X2 Elite Extreme 最高 SKU 为 128GB 共享内存。)

系统级缓存(SLC)可以在 CPU、Adreno X2 GPU、Hexagon NPU 之间动态分配,比上一代带宽高 70%;192-bit 内存总线搭配 LPDDR5X-9523,能够实现高达 228 GB/s 的C/G/NPU 共享内存带宽。

而传统的混合计算负载(同时依赖 C/G/NPU),被内存搬运所掣肘的情况,也得到了极大缓解。并且,整机功耗也能维持在轻薄本可以接受的水平。

更值得一提的是,这一代 Hexagon NPU 还专门把 DMA 单元升级到 64 位虚拟寻址,让 NPU 终于可以访问超过 4GB 的内存,一定程度上突破了 NPU 坐端侧大模型推理任务的瓶颈。

这的确不是 Windows 阵营第一次试水类似统一内存架构的方案,在此之前,英特尔、AMD 都做过尝试(稍后会详述)。

不过在今天,华硕灵耀 16 Air 骁龙版的高配机型,是 Windows 阵营里首个最大限度接近统一内存架构效果,并且还做到 1.2 公斤左右 ARM 轻薄本上的方案。

让更多 Windows 笔记本用上新架构

在共享/统一内存架构的道路上,每家芯片巨头对的判断都不一样,首先是工程问题,更深一层是商业问题。

一名在某芯片巨头供职的专家告诉爱范儿,行业里无人质疑统一内存架构的优秀,但做与不做,能否持续做,分歧在于厂商对性能目标和成本之间的平衡。

在 X2 顶配 SKU 上,高通目前的看法是:将统一内存架构所解锁的强大性能,交给给到真正需要它的硬核用户,特别是那些工作流里重度依赖 AI 模型/AI 功能的专业用户和创作者,这件事值得花成本去做。

再看英特尔,在上一代 Lunar Lake 架构上做过类似尝试,然而成本炸裂难以控制,不得不终止。英特尔前 CEO Pat Gelsinger 在财报会上明确将该次尝试定义为「one-off」,理由是封装内存把毛利压得太低。

今年 1 月发布的 Panther Lake 机型则回归了传统外置内存路线,据信后续的 Nova Lake 架构也将延续老的策略。英特尔仍然在高端 AI 笔记本市场上占有一席之地,但可以说短期内不会再走统一内存架构这条路了。

AMD 那边,Ryzen AI Max+ 395(Strix Halo)同样采用类似的共享内存架构架构,最高 128GB 板载 LPDDR5X,能够实现高达 256 GB/s 内存带宽,比 X2 Elite Extreme 还激进。

正因为此,在 AMD 的定义下 Strix Halo 属于移动工作站芯片,搭载的笔记本价格都更高,形态也更厚重,抑或是搭载于迷你工作站,不在个人笔记本电脑消费者的选购范围内。

三家芯片厂商,三种不同答案。骁龙 X2 Elite Extreme 消费级笔记本在这个时间点正式面市,虽然很难说撞上了换机窗口(毕竟今年的内存实在太贵),但至少填补了消费级市场的真空。

何时能追上 MacBook Pro 呢?

老实说,骁龙 X2 Elite Extreme 目前也只是跟苹果那边的 M5 基础款能打个有来有回,跟 M5 Pro/Max 这样的工作站级「顶级牛马」距离还比较远。

最直接的差距在于内存带宽的极限值:X2 Elite Extreme 的带宽宣传值能够达到 228GB/s,是 M5 Max 的 ⅓ 左右,比 M5 Pro 的 ⅔ 多一点。

当然还是要给 X2 挽尊一下,这一代仍然是单 die(晶粒),内存带宽存在物理上限。

而苹果在 M5 Pro/Max 这一代用上了新的「融合封装」,也即将两块 die 拼到一起,把内存总线扩展到更高。

在最直接的大模型推理任务上,内存带宽差距直接意味着 token 吞吐速度的差距;在 4K/8K 等极高清的视频剪辑和 AI 处理任务上,或者在其他工程软件的算力密集型任务上,也会有明显体现。

不过至少,Windows 平台在这些专业/工业软件的兼容性上是要比 macOS 好的……

我想,骁龙把共享内存架构带进消费级 Windows 笔记本市场,这件事的意义讨论或许不应该局限于性能数字上谁暴打谁,

而在于 Windows 平台用户不应该一直享受「二等公民」的体验。

即便是一台不超过 1.5 公斤的大屏轻薄本,仍然可以提供远比其它 Windows 性能本更好的 AI 算力,而且仍能保住轻薄本应该有的功耗优势——这,才是更重要的。

当然,围绕在 Windows on ARM 周围的种种问题,比如软件生态、x86 模拟层稳定性、专业软件适配等等,仍然无法被共享内存一劳永逸地解决。

从芯片厂,到微软,再到 ISV,大家都在加紧马力。比如 Photoshop、Lightroom 已经能够稳定运行 ARM 原生版本;达芬奇也早在两年前就完成了 Windows on ARM 的原生支持,甚至比 Adobe 还早。

但软件生态兼容仍有不完美之处,比如 Adobe AE 的部分渲染器和工作流仍然只能在 x86 平台上使用;Blender 的一些渲染功能在 ARM 架构上也会性能打折。

这是一个软件追硬件的时代。只有 X2 这一代能够让足够多用户,特别是创作者和专业用户,真正将骁龙本纳入主力机考虑——ARM 生态才会进入「用户越多适配越多,适配越多用户越多」的正反馈。

苹果也走过同样的路,所以这绝非不可能完成的任务。

 

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

我一点也不想要 OpenAI 手机|AI 器物志

作者 马扶摇
2026年4月29日 10:30

智能手机统治了过去十几年的数字生态,它是注意力的黑洞,是我们最私密的随身之物。但手机从设计之初就是为「人盯着它」而生的——它的全部逻辑,都止于屏幕。

AI 的需求却恰恰相反:它需要持续感知物理世界——见你所见,听你所闻,随时在场,而非等你解锁屏幕才醒来。

当 AI 真正成为一种基础能力,它迟早要从屏幕里破壳而出,寻找属于它自己的形状。这将是一个漫长的探索和演化过程。

「AI 器物志」栏目由此而来,爱范儿想和你一起持续观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?

这是「AI 器物志」的第 10 篇文章。

全世界体量最大的人工智能厂商之一 OpenAI,要脱离虚拟领域,开始造手机了。

根据天风国际证券著名分析师郭明錤发布的调研报告:OpenAI 正与联发科和高通接洽生产手机处理器的事宜,拟由立讯精密协助设计和生产,预计 2028 年正式量产。

这款手机最大的不同在于:OpenAI 意图将它打造成一个为 AI Agent 模式特化的产品,郭明錤是这样介绍的:

用戶的目的不是使用一堆 App,而是透過手機執行任務並滿足各種需求,這從根本上推翻現在對手機的認知。

基于已经掌握的信息,郭明錤还设计了一张这种 AI Agent 手机可能的用户界面:

图|X @mingchikuo

在郭明錤的设想图中我们可以看到,在 AI Agent 的操作逻辑中,原本熟悉的「桌面 – App」模式会被一种「Agent 任务流」所取代——

不同功能的 App 图标会变成不同功能的 Agent、软件入口会变成更加具体的任务信息(比如从微信图标变成「发送一条朋友圈」按钮)、网格化排列的桌面 UI 也会直接变成任务信息的瀑布流。

就像 Niagara Launcher 一样|Android Authority

实话说,OpenAI 要造 AI 手机这件事本身并不稀奇。

它设想的很多场景我们其实在曾经的豆包手机上都体验得七七八八了,两者的本质都是希望给 AI 更高的自由度和自主权,以拓宽使用场景。

只不过相比「O 包手机」,反而是郭明錤提到的那个「纯粹基于 AI Agent 交互模式的手机 UI 」更加令我们感到不安。

在过去一段的 AI 产品中,无论是传统大模型,还是不同形状的 OpenClaw,我们都观察到了一种趋势:

现在 AI 的用户界面(UI)越来越向着以 Agent 为主导的方向发展,最激进的形态就是启动后只显示一个对话框。

图|Google

这种交互模式看上去人畜无害,但背后却暗含着一个汇聚了所有 AI 工具使用场景的「思维模式陷阱」——

AI 正在将人类异化成为机器。

正因如此,爱范儿在这里邀请你与我们共同进行一场小小的思想实验,来尝试理解 AI 将人异化的危险性。

Agent UI 最终会消灭 UI

OpenAI 手机所期望的那种纯粹的「Agent 使用模式」最表层的问题,是 Agent UI 对于「用户界面」中「用户」部分的忽视。

而这种忽视最明显的表征,就是上面所展示的那种任务瀑布流 UI,以及很多预制式 OpenClaw 客户端的裸露对话框。

更具体的说,任务瀑布流实际上是将交互界面从我们熟悉的「以应用为中心」(app-centric)转向了「以意图为中心」(intent-centric):

这些 AI 建议就是以意图为中心的

这就导致了一个问题:UI 全部由不停更新的任务信息构成,某个特定的界面没有一个固定的入口。

比如打开顺丰 app,映入眼帘的只有每秒不停更新的在途快递进度,却找不到「修改寄件地址」的按钮。

这在心理学上被称为「客体恒常性」的缺失,相当于「我知道这个开关是做什么用的」—— Agent UI 的界面只会让人感觉到在面对一堵随时变化的墙,没有一个可以熟悉的落脚点。

另一方面,纯粹目的性导向的 Agent UI 在实质上剥夺了用户的「主动探索」空间,将使用过程变成了一种纯粹的 AI 对于用户的预判。

最简单的例子就是:在淘宝 app 上买东西的时候,我们经常是边逛边选、偶尔刷到一些没见过的好货;而 Agent UI 直接帮你跳过了「淘」宝的过程,你只是那个控制支付宝付款的人肉 ATM 而已。

更退一步说,这相当于无论用户想要做什么,AI 手机始终在催促着用户进入「赶快完成任务」的生产模式——这种粗暴的接管,本质上是对于用户权利的消解。

归根结底,Agent UI 的逻辑,其实是将人给「零件化」。

它粗暴地假设用户是一个理性的、追求效率最大化的任务处理机,打开手机的唯一目的就是要解决任务列表里面的工作。

同时,它又忽略了人作为感性的、需要审美愉悦和情感缓冲的生命体的本质。

AI 最终会促成更多 AI

除了 Agent UI 本身对于「人」的基本需求的蔑视,我们同时也要理解:是什么样的环境促成了这种「唯效率论」的 UI 设计趋势的出现——

将人的一切使用行为,压缩成一条看不到尽头的任务列表,人与机器的唯一主动交互方式被简化进一个闪烁的对话框,背后的 AI 不可见、不可知、不可碰触。

这不是 AI 辅助生活,这是向克苏鲁献祭 token。

仅就上面提到的 Agent UI 来说,这种现象其实很像是一种从 GUI 到 CLI 的倒退:

我们花了几十年完善图形技术,又在一夜间回归到了最原始的用嘴发布命令。

这种由 Agent UI 所代表的「GUI 倒车」,深深根植于幕后的技术效率至上主义。

其中一个最简单的例子,就是游戏。

虽然如今本地计算仍然是主流,花钱买显卡就能享受到精美的画面,但我们完全可以想象这样的场景:

未来,云端计算成为主流之后,更有可能出现的情况是厂商根本不再出售图形算力,因为它们赚得没有文字/代码模型多。

甚至不只是手机和电脑的 GUI、以及游戏画面,我们消费的一切内容本身都会在这种对于效率的追逐中,退化成一种湮灭美学、纯粹的精神刺激工具。

图|网络

更讽刺的是,我们对于 AI 原本的愿景是「让 AI 处理琐事,让人类去作诗」。

但如今我们看到的却是 AI 工具泛化导致了效率主义极权的泛滥,人类对「美」的感知退化只是其中的附带伤害而已。

最让人无法接受的是,Agent UI、AI 手机、Agent 行为模式的设计背后,都存在着一种先入为主式的傲慢。

这些 AI 工具的生产者认为人类只关心「结果」,所以用生成式 AI、Agentic AI 将人从「过程」中去除,却忽略了人类的「存在感」本身就来源于我们对于行为过程的认知。

用更惨淡一点的说法就是:如果我不需要参与 AI 的一切决策,只是看个结果,那还需要我做什么?

最需要警惕人变成 AI

进行到这一步,很多人会有疑问:

这不就是个想象中的手机界面嘛,至于上升到存在主义哲学的高度吗?

这句话本身并没有问题,上面提到的所谓 Agent UI 的设想图,仅仅是郭明錤基于 OpenAI 手机的产品思路,给出的一种设想方案。

⚠ 图片使用 AI 技术生成|X @birdabo

但现代社会——尤其是 AI 加速过的现代社会——的危险性就在于:如果你自己不考虑存在主义哲学,就会有很多人乐于帮你考虑,然后再朝你收钱。

前面提到的 AI Agent 的确在非常多的层面上都可以帮助人们在工作中实现更高的效率,问题在于没有人一天 24 小时都在工作,但我们一天 24 小时都会带着手机。

这种纯粹基于待办任务流的 Agent UI、纯粹由执行效率驱动的 AI 产品,会借助「手机」这个不离身的媒介,从工作侵入到你的生活,让你的生活节奏、思维节奏去习惯 AI 的步调——

不太好理解?想想那些每天黑白颠倒抓紧时间抢 Token「谷电」时间的程序员们吧。

这还只是现阶段 AI 对人类作息的初步影响。长此以往下去,用户无论在工作时间还是非工作时间,都不再是一个具有主观意志的「人」——

当我们下班累瘫在沙发上,喊 AI 手机随便帮我们点个外卖当晚饭的时候,就相当于放弃了主动思考的权利,当这种放弃成为习惯,生活的每一个环节就都会成为一个别人的商机。

换句话说,AI 手机、Agent UI 现在看上去或许人畜无害,可一旦人类习惯跟随了 AI 的节奏和方式,就会暴露出巨大的危险性。

图|Futurama

德国哲学家马丁·海德格尔在《对技术的追问》中提到了一种观点,即现代技术有一种「促迫」(challenging-forth)的特性,指的是现代技术不仅制造机器,技术本身也拥有越来越强的主体性、会「强迫」自然界交出能量和资源。

同时,促迫也可以被看作一种人看待世界的方式,海德格尔认为:当人类用「促迫」的眼光看待自然时,人类最终也会把自己看作一种可以被技术索取的资源。

是不是很耳熟,没错,人力资源(Human Resources)就是这个意思。放到现在的 AI 环境里,则是简单的一句话:

去叫人力,给这个 Opus 4.7 账号配个员工。

糟糕的是,现在的 AI 技术,以及全世界的 AI FOMO(错失恐惧症),就是这种模式的完美复现。

Agent UI 那种瀑布流式待办任务界面不仅是帮你,同时也是在 PUA 你:

这种互相加速的现象(海德格尔称之为座架 Gestell),最终会导致人类调整自己的思维模式去适配机器的吞吐速率——

为了让 Agent 更好地工作,你会下意识地让自己的需求变得更明确、更单一、更具逻辑性,相当于人类主动将自己异化(alienation)成了机器。

这就是我们在现代技术中,最需要警惕的一点:人的机器化。

伴随着 AI 越来越侵入我们工作之外的生活,我们也在潜移默化地将自己降格为一种适配机器的存在。当人为了适配 AI 的高效而放弃了「临时起意」和「无目的漫游」时,你已经从逻辑上被机器同化了。

这种机器化的下一步,就是软性淘汰——

人不会像《黑客帝国》那样变成生物电池(暂时不会),只会被炼成一个 skill。

毕竟现实证明:生物机器在效率上永远无法媲美金属机器。

人在追求效率的同时,主动或被动地将自己异化成一种生物机器,最终的结局必然是被金属的或者硅基的机器淘汰。

人类的社会生产持续追求「0 摩擦」的完美效率时,本质上是在追求一个「去人化」的过程。

而无论 Agent UI、Agent AI 还是通用智能,都只是这个过程中的加速剂而已。

当我们在参与社会生产的过程中,主动切除了所有属于人的部分,好让自己在这个以 AI 为出发点、为工具、为最终目的的系统中跑得更顺滑。

直到切除剩下的那些部分,可以被另一段代码完美地替代。

图|Youtube @Moviefone

当然,在这个小小的思想实验之外,我们都知道郭明錤的预测只是一种预测,没人说 OpenAI 手机的交互方式真的就是一个纯粹的任务瀑布流。

但人作为感性动物,我们的思维模式就是在与客体世界的不断交互中形成的。

如果一个占据我们每天 24 个小时的工具正在走向纯粹机器性的交互,那我们距离被异化成机器后淘汰的结局,也的确不远了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌