普通视图

发现新文章,点击刷新页面。
昨天 — 2026年2月27日首页

中科第五纪月内连续完成两轮数亿元融资,率先打造可商用的具身大脑

近日,中科第五纪接连完成Pre-A及Pre-A + 轮融资,累计金额数亿元。其中,Pre- A轮由红杉中国领投,东方富海跟投;Pre-A +轮由芯能创投、优山资本联合领投,清控金信跟投。本轮融资将用于加速具身大模型研发、机器人产品迭代及行业场景落地,进一步巩固中科第五纪在具身智能领域的核心技术优势与产业化能力。

当前,具身智能正成为人工智能的前沿阵地,其产业化潜力正加速释放,作为兼具模型研发与产业化能力的具身智能公司,中科第五纪依托超少样本具身操作模型(FAM模型)及世界模型(BridgeV2W模型),在技术与产业化双轮驱动下迅速成长为行业新锐力量。此次融资的完成,标志着资本市场对公司技术路线和商业前景的认可,也为具身智能从测试验证走向规模化应用注入强劲动力。

01 以“具身大脑”重新定义机器人智能

中科第五纪自主研发的“具身大脑”解决方案,以行业首创的FAM系列超少样本具身操作大模型为核心,实现了“极简开发、无损理解、超强泛化”三大能力。开发者仅需少量示范样本,即可完成复杂技能的高效学习与部署,极大降低了机器人交付门槛与时间成本。

为进一步赋予机器人更高阶的认知与决策能力,中科第五纪推出的全新一代具身世界模型BridgeV2W,让机器人首次具备了“预见”未来视觉结果的能力。BridgeV2W充分利⽤⼈类操作视频数据(Video To World)打通了动作指令与视觉画面之间的表征鸿沟,将抽象的机器人指令直接“转译”为即将发生的视觉画面,实现对动作结果的高精度、跨视角模拟。这一突破使机器人拥有了真正的预见能力与自主避障决策能力,推动具身智能迈向更高阶智能。

 02 从实验室走向商业化落地让具身智能创造真实价值

中科第五纪始终坚持技术驱动与产业协同并重。目前,中科第五纪已与某世界级本体厂商达成深度合作,成为其核心生态合作伙伴,共同推动具身智能机器人在多行业的应用落地。同时,中科第五纪也与多家头部央企和头部行业客户实现项目落地,覆盖多个高价值行业,展现出强大的场景适应性与作业可靠性。本轮融资后,公司将进一步加速产品在更多行业的规模化复制,推动具身智能真正走进千行百业。

中科第五纪轮式双臂机器人

技术价值的最终体现,在于落地。中科第五纪正逐步打通从模型研发到场景应用的闭环,以解决实际产业需求为导向,持续推动技术成果转化,让技术真正走进产业、创造价值。

面向未来,我们将继续以具身智能技术研发为核心,推动能力的不断进化。我们始终相信,技术的意义不是替代人,而是“以人为本,让人回归人”。这正是中科第五纪的使命底色,也是我们朝着“让百万机器人服务于人类”这一愿景前行的动力。

查看更多项目信息,请前往「睿兽分析」。

丰泊国际CEO孙慧来:科技金融不看“后视镜”,只看“导航”

16年前,那个普通话还说不利落、对大陆市场一无所知的孙慧来,或许没想到,这段用六箱充电宝等产品开始的创业试水,会在数年后催生出一家撬动亚洲跨境金融格局的科技公司——丰泊国际(FundPark)。

丰泊国际是一家面向全球、致力于运用智能科技助力电商企业扩展的科技公司,2016年在香港成立,公司核心业务是通过数据化技术为跨境电商中小企业提供营运资金解决方案。

如今,丰泊国际已累计批出贷款超过70亿美元,服务超过3.3万家商户,推动其总交易额(GMV)超过147亿美元。

2022 年,丰泊国际获高盛(Goldman Sachs)提供2.5亿美元的资产支持证券化项目。这是高盛在全球电商金融领域的首笔投资,之后高盛又追加到 5 亿美元。汇丰等机构也陆续向丰泊国际提供资金支持。

目前,丰泊关国际的总资金盘子接近 10 亿美元。跨境金融行业,丰泊国际的ABS项目(资产支撑证券化)在亚洲是最大的。

而这一切的起点,竟是200万港币的贷款被拒。

改变不了的事情,那就创造一个新故事

孙慧来毕业于香港大学,学的是计量金融。大学期间,孙慧来曾在eBay、Coupang等跨境电商平台上卖过手机壳、充电宝、手机贴膜等手机周边产品,这是他创业的开始。

丰泊国际(FundPark)联合创始人孙慧来

当时是2010年,iPhone第三代刚上市,孙慧来和他的校友判断智能手机将来一定会成为主流趋势,这才有了卖手机周边产品的故事。

孙慧来是香港人,对大陆市场不是很熟悉,也不会说普通话,“如果2010年你跟我聊天根本听不懂话我在说什么。”孙慧来说。他跟另外两位大学校友,其中一位是莫招杰,现在是丰波国际的执行董事,三个人每人拉两行李箱去华强北进货。

选品就是手机、iPad的周边产品,比如手机膜、充电宝、手机壳等,进来的货就放到各自的宿舍。孙慧来会编程,对eBay、Instagram、Facebook上的销售数据做了很多分析,来判断消费者喜欢什么产品。

三个人就从eBay上起家,白天上课,还要当客服回复消息,晚上回宿舍打包发货。除了eBay,他们也在Coupang及其他亚洲电商平台上卖。靠着对数据的敏感和对市场的洞察,三个人仅用一个季度就把业务跑了起来。

“那时候手机贴膜,成本两三毛钱,我们卖40港币两张。”孙慧来回忆道。

创业成长的过程就是根据场景需求解决问题,另辟蹊径。为了把生意做大,孙慧来和同伴找到上游供应商,从铺货模式转型到贴牌,一年的业务量能做到几百万港币。

这段经历,是孙慧来创业过程中为数不多印象比较深刻的。因为拿货量少,他们跟中间供应商沟通多次,最后去饭店制造偶遇,才对接上了最上游供应商。谈下的第一笔订单是1000个,之后基本保持这个量去订货。

等生意想再大,就需要资金支持,孙慧来他们想借200万港币扩大规模,找了四家银行借钱都被拒绝。

“我们拿着Google Analytics的数据给银行看,销售数据增长很好。”孙慧来说,“但银行只看财报、看固定资产,不看未来增长。”这是大多传统银行的弊病。

这次拒绝成为孙慧来创业做金融的伏笔。大学毕业后,孙慧来进入汇丰银行,选择了他感兴趣的贸易金融岗位。另一位合伙伙伴莫招杰去了恒生银行。

“商业银行离创业者近,可以跟很多老板交流,了解他们怎么创业、怎么守业,怎么赚钱、怎么会亏,跟他们聊行业,聊管理。”孙慧来说。

2016年,顶着家人、朋友反对的压力,孙慧来和莫招杰辞去了银行的工作,创办了丰泊国际,核心业务就是给跨境电商中小企业提供融资。这是孙慧来在进入银行工作前就定好的目标,“还是会创业,但不是为了证明什么,而是为了解决什么。”

孙慧来身上有股韧劲,敢闯、敢拼,朋友对他的评价是,“不会后悔做过什么事,但会后悔没有去做什么事。”

离开银行的理由有两个,未来十年,银行业都不会有很大的改变。另一个是,孙慧来觉得就算再干十年,这份工作也不会给他带来太多兴奋感。

他们改变不了银行的机制,那就出来创造一个新的机制。

用数据“导航”,不看“后视镜”

成立丰泊国际的彼时,金融科技行业最火的是P2P(peer-to-peer lending),99%的互联网金融都在做P2P。孙慧来他们选择了一条没人走的路——To B。

做出这个决定有孙慧来个人的经历,也有他看到的差异化和背后真实需求。To C消费贷款业务已经有很多产品,市场足够成熟,但当时在香港这样的国际贸易枢纽和国际金融中心,中小企业却很难借到钱,是很令人不可置信的。

原因有二,其一,银行的经营成本高,审批过程长,维护客户的成本很高。此前有银行发布过一份报告,维护一个不借钱的中小企业客户,一年的经营成本超过7000美金。同样的钱借给一个大客户和借给一万个中小企业,回报率相差不多。其二,借给中小企业所需的资金规模其实比起消费贷更大,风控模型会比起个人贷款也难很多。

“中小企借钱,是有点被歧视的感觉。”孙慧来说。

丰泊国际成立的初衷,是通过数据分析为中小企业提供营运资金支持。2018 年,公司找到确定性的方向,聚焦跨境电商,主要客户群体都在大湾区,并成为首家与菜鸟合作、以动产质押方式为商户提供融资的香港金融科技公司。

跨境电商是一条高增长赛道,天花板够高,中小跨境企业资金需求缺口很大,有超过2万亿美金的基金缺口。与传统银行依赖财报不同,丰泊国际看的是实时数据——订单、物流、库存、回款。

“我们不看后视镜,而是看导航。”孙慧来说。

第一个交易是在2017年下半年,客户是做进口电商的,卖化妆品、奶粉、保健品等,这次交易丰泊国际放出去的款大概是25万美金。这一年,丰泊国际联合设立了香港首个以贸易融资为资产的基金,创新地将中小企业应收账款转化为可投资的资产类别。 

在2019年,丰泊国际正式进入内地市场。公司增长最快阶段是在 2022 年之后,其获得高盛2.5亿美元的资产支持证券化项目,这是高盛在全球电商金融领域的首笔投资。此后,高盛追加至5亿美元,汇丰等机构也陆续加入。

有意思的是,最早拒绝孙慧来的那四家银行里,就有汇丰银行。

目前丰泊国际总资金盘子接近10亿美元。

“在亚洲,像我们这样的独立第三方,能做到这个规模的,几乎没有。”孙慧来说。

“增长即服务”:不止是钱

1月26日,丰泊国际在深圳蛇口举办公司首届汇聚行业全生态的旗舰峰会,选择在这个时间、节点举办,是因为公司规模和业务都到了一个阶段——衡量一个公司是否可持续增长。

成立至今,丰泊国际累计批出贷款超过 70 亿美元,服务了超 3.3 万家商户,推动这些商家的总交易额(GMV)超过 147 亿美元。去年一年,公司业务规模从30亿美金翻番到60亿美金,到2026年1月,业务规模已经突破70亿美金。

公司也在延展服务内容,2025年,丰泊国际正式推出“增长即服务”(Scale Up as a Service)的蓝图,融合AI动态融资、前瞻性洞察和互动社群,打造一个全方位的“增长引擎”。

其中,AI驱动的动态融资,丰泊国际会预测企业的资金需求,动态调整用款额度,当企业解决了资金周转需求后,就随时还款给丰泊国际,这是跟传统银行有很大的区别。

这也是丰泊国际又一次关键战略升级:从为企业提供单一资金支持的服务商,进化为多维度的战略增长伙伴。

市场是确定的。2025年全球电商零售规模突破6万亿美元,并有望在2028年迈向10万亿大关。跨境电商行业在持续高速发展的同时,也正经历新一轮“洗牌”。市场迭代加速推高运营门槛,AI等创新技术的飞速演变正全面重塑全球贸易形态与产业格局。

对跨境中小企业而言,从机会性增长转向系统性的“规模化增长”,已成为穿越周期、赢战跨境下一个“黄金十年”的核心能力。

丰泊国际也在走向国际化,它也可以跟着客户需求出海,甚至扩张到欧美、东南亚的本土客户。但初衷和定位不变,做一个赋能电商行业的金融公司。

最初公司的名字不叫丰泊国际(FundPark Day),而是“LaunchDuck”,是粤语“Launch得”的谐音,即梦想成真的意思,孙慧来他们希望打造一个助力创业者的起飞平台,但保留了鸭子的 IP形象。

孙慧来常和员工说一句话,“如果2010年有了像FundPark这个类型的公司,今天就不会有FundPark。”

这话像是对当年的自己说的。那两箱手机壳,那些被拒绝的贷款申请,最初找天使投资时,孙慧来见了60多个投资人,大部分都不理解。“他们觉得,银行都不借的钱,我们凭什么借。”

如今,这些质疑和拒绝都变成了一套系统、一种模式。

“我想,我做对了。”孙慧来说。

刚刚,Nano Banana 2 发布!便宜又大碗,体验后我发现这些细节

作者 莫崇宇
2026年2月27日 10:40

用 AI 生图,总绕不开一道两难题:要快,还是要好?

但速度与质量之间,未必是鱼和熊掌不可兼得。就在刚刚,Google 正式发布了他们的新一代图像生成模型:Nano Banana 2(Gemini 3.1 Flash Image)。

没有太多颠覆世界的口号,它只是把更好的画质和更懂人话的理解力,一起塞进了全新的底层架构里。就这一件事,却让 AI 生图少了几分「看运气」的感觉,多了几分真正能用的踏实。

▲官方博客地址:https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/

接入了整个互联网,这次的 AI 真的懂你在说什么

要说清楚这次的变化,得先回想一下三年前 AI 生图有多难用。

你让它画「红烧肉」,它可能老老实实给你画一块正在燃烧的肉;你让它在海报上写句中文,它往往会给你凑出一堆毫无意义的鬼画符。缺乏对真实世界的常识,是第一代 AI 最容易让人崩溃的地方。

现在的 Nano Banana 2,改变了不少。它和前代 Nano Banana Pro 一样,接入了 Gemini 积累的庞大真实世界知识库,还能结合网页搜索的实时信息,用起来更像是一个见过世面、懂点常识的人。

最先感受到的变化,是它开始更好地理解空间和比例了。

▲提示词:画面中,【东方明珠广播电视塔】被一只超级巨大、超级可爱的【猫】占据。周围的建筑物看起来就像玩具模型一样小,而【猫】则非常巨大。游戏背景设定在一个逼真的城市环境中。整体氛围安静、温暖、舒缓、可爱。

在上面这个案例中,AI 精准地还原了上海的地标,并极其自然地处理了巨猫与微缩城市之间的光影和透视关系。

最直观的改变,是它终于认字、也会写字了。比如让它画一幅《枫桥夜泊》的水墨画。画面上方不仅端端正正地用书法写出了「月落乌啼霜满天」等全句,甚至连排版和水墨的意境都拿捏得比较准。

▲当然,也不是没有瑕疵,仔细看上方悄悄多出了一个「满」字。

除了诗意,它还能处理相当复杂的 UI 场景——在下面这张图里,复杂的半透明数据面板、悬浮的购物清单、精准的中文显示,被 AI 有条不紊地安排得井井有条,信息之间的层级关系也真正理清楚了。

▲提示词:第一人称视角,置身于灯光明亮的超市货架通道中。人类双手将一瓶芬达汽水举到镜头前方。鲜艳的橙色饮料装在其标志性的品牌瓶身里,周围环绕着多层全息增强现实界面,用中文展示营养相关数据,包括热量数值、含糖量、咖啡因水平、新鲜度指示、保质/到期日期,以及基于芬达推荐的清爽饮品配方和鸡尾酒调制方案。玻璃质感的 UI 面板,柔和的环境光晕,逼真的光照与阴影,自然的景深效果,沉浸式第一人称交互界面,2K

排版极其讲究的双页黑白日式漫画,也是手拿把掐。

▲提示词:设计一份逼真的双页漫画杂志样张。每一页都应包含多个漫画风格分镜,以富有动感的版式排列,呈现出专业印刷的日本漫画质感。整体风格为黑白稿,使用粗犷有力的墨线、网点效果(screen tones)以及富有表现力的人物绘制。画面中加入对白气泡、中文拟声词,并通过分镜之间的过渡来传达动作、情绪与节奏。左右两页需要连贯衔接,像同一场景或同一话章节的一部分。采用传统漫画镜头语言:特写、远景、斜向分镜以及戏剧化的视角与构图。整体观感要真实可信,仿佛来自一本真正的漫画杂志的跨页内容。

或者这张带步骤说明的「功夫茶」中文信息图,从排版到意境,都给出了一套可以直接用的视觉方案。

▲生成提示词:一张关于中国传统功夫茶道设计精美的垂直信息图。中国传统水墨画背景。顶部有巨大的、优雅的中文书法标题,明确写着「功夫茶」。向下有三个图文并茂的步骤:步骤 1 展示用沸水温杯,配有中文「温杯」;步骤 2 展示将茶叶放入盖碗,配有中文「投茶」;步骤 3 展示倒出茶汤,配有中文「出汤」。优雅、极简、温暖的大地色调,平衡的布局。

一位很早就接触到 Nano Banana 2 的内测用户,给出了一个相当中肯的评价:「它并不完美,但它是第一个能够以一定一致性,去处理真正复杂图像和图表的模型。」

为了测试这个新模型的理解极限,他随手甩出了一道极其刁钻的测试题:「给我画一张设定在古威尼斯的《寻找沃尔多(Where’s Waldo)》,但里面要找的不能是人,得是一只穿着蓝色条纹飞行服的水獭。」

Nano Banana 2 最终也真的理清了逻辑,不仅没画串,还稳稳地交出了答卷。

快和好,终于不用二选一了?

除了懂常识,强大的「主体一致性」是这次 Nano Banana 2 更新的另一大杀手锏。

在一次生成过程中,它最多能保持 5 个角色的脸不崩,或者 14 个物品的样子不变。这意味着,你可以放心大胆地拿它来画连载漫画或者做影视分镜了。

不仅如此,它的画质也达到了可以直接干活的标准。

从 512px 的配图到 4K 级别的超高清海报,它都能拿捏。输入一段关于「重庆老火锅」的提示词,它能生成一张赛博朋克风的雨夜街景,湿漉漉的柏油路上,红蓝霓虹灯的倒影和「24 小时营业」的招牌都细致入微。

▲提示词:一张繁忙亚洲城市雨夜的电影感街头照片。一个巨大的、发光的红色霓虹灯牌挂在一座老建筑上,上面清晰地写着「重庆老火锅」。在它下面,一个较小的蓝色霓虹灯牌写着「24 小时营业 – 欢迎光临」。湿漉漉的柏油路反射着霓虹灯光。

色彩张力极强的波普艺术风格,它也驾驭得住。

或者是这种带着几分荒诞、又透着高级感的时尚大片:

▲提示词:This high-resolution bird’s-eye view photograph was taken with a LOMO Ic-a. The ground is covered with countless black-and-white billboard advertisements of beautiful fashion models, and standing on top of the advertisements is an incredibly beautiful chinese film actress wearing a long black coat.

在这个俯视视角的案例中,AI 极好地模拟了老式 LOMO 相机的特殊质感。女演员孑然独立于铺满黑白海报的地面上,画面的电影张力和故事感呼之欲出。

不过也不是没有明显短板,让它将二次元人物、铅笔素描和黏土人强行塞进同一个真实咖啡馆的场景中,素描人物的融入就显得十分生硬,边缘过渡也不够自然。

显然,在跨维度融合上,它远不及前代模型效果来得自然,还有进步的空间。

▲提示词:A photo of an everyday scene at a busy cafe serving breakfast. In the foreground is an anime man with blue hair, one of the people is a pencil sketch, another is a claymation person

其实整体体验下来,尽管官方博客将 Nano Banana 2(Gemini 3.1 Flash Image)吹的天花乱坠,但实际体感中,生成的质量效果和速度并未得到肉眼可见的提升,甚至在部分场景中还不及前代模型。

真正让 Nano Banana 2 站稳脚跟的,其实是它极其接地气的性价比。

今天起,在 Gemini 应用和 Google 搜索框里,你都能顺手用上它。没有订阅方案的普通用户,24 小时内也能白嫖 100 张;而 Pro 订阅用户的额度则高达 1000 张。

对于开发者而言,API 的价格更是直接腰斩,仅为上一代 Pro 模型的一半。折算下来,生成一张 4K 高清图的成本被硬生生打到了 0.15 美元左右。

▲ 附上地址:https://ai.google.dev/gemini-api/docs/pricing#gemini-3.1-flash-image-preview

当然,当 AI 能够以极低的成本、极快的速度批量生产高清图片时,大家心里其实越没底。现在网上的假图满天飞,「眼见为实」这句话早就靠不住了。如果任何人都能在一秒钟内生成一张几可乱真的照片,我们该如何分辨图片?

Google 自己也十分清楚这一点,所以他们也一并升级了防伪技术。Nano Banana 2 继续加深了对 SynthID 数字水印和 C2PA 内容凭证的支持,能够更清楚地看到一张图到底是不是 AI 画的,以及它是怎么被修改的。

据统计,自去年 11 月以来,Gemini 里的这个验证功能已经被调用了超过 2000 万次。

AI 绘图这两年的发展,确实快得让人眼花缭乱。我们经历过 Nano Banana Pro 的一眼惊艳,也经历过繁琐的调教与漫长的等待。Nano Banana 2 的出现,则尝试进一步把好和快揉在了一起,并大大降低了使用的门槛。

你脑子里的一个灵感,不用再经过反复的修改和焦躁的等待。敲下回车的瞬间,它就在那里了。自然、简单,且立等可取,这件事听起来平常,但能做到,其实已经很难得了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


深度解析谷歌版「豆包手机」:Android 的统治者下了一盘什么棋?|AI 器物志

作者 苏伟鸿
2026年2月27日 10:21
 
编者按:
当 AI 开始寻找自己的形状,有些选择出人意料。
AI 在智能手机上生出了一颗独立按键,似乎让智能手机找回了久违的进化动力。眼镜凭借着视觉和听觉的天然入口,隐隐有了下一代个人终端的影子。一些小而专注的设备,在某些瞬间似乎比 All in one 的设备更为可靠。与此同时,那些寄望一次性替代手机的激进尝试,却遭遇了现实的冷遇。
技术的落地,从来不只是功能的堆叠,更关乎人的习惯、场景的契合,以及对「好用」的重新定义。
爱范儿推出「AI 器物志」栏目,想和你一起观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?

原本以为,三星 Galaxy S26 系列早已被曝光,发布会也就走个流程。没想到三星和 Google 还藏了一手。

两家公司共同展示了 S26 搭载的全新 Gemini 智能体能力:口头吩咐一句话,Gemini 就能在 Uber 帮你打车,或者 DoorDash 上点外卖。

▲ 图源:Android Central

这个功能目前还处于早期预览阶段,仅在美国和韩国提供。

你可以理解为,Google 和三星一起联手,做了一个全球版的「豆包手机」(准确来说叫豆包手机助手)。Galaxy S26 系列只是开始,这些能力后续会推送到 Google Pixel 10 手机,以及更多 Android 17 设备上。

在看过、用过许多个手机/电脑系统级 AI 智能体,也深度使用过「豆包手机」之后,再看这次的 Gemini 智能体,我觉得关于它的讨论不该止于一个「新功能」。

诚然,这不是 Android 操作系统的底层框架首次为了容纳智能体而被深度定制——包括 OPPO、荣耀、华为等在内的许多厂商都已经做了相当多的早期的尝试。

但这可是 Google,是 Android 操作系统的绝对拥有者。

如果说字节跳动作为一个「外人」,做的尝试对国民级 app 犯了「大不敬」——Google 来做这件事情,意义就完全不一样了。

不过别急,我们还是先看看,这次 Google 和三星做的「豆包手机」,到底怎么一回事。

三星「豆包手机」,用起来怎么样?

三星和 Google 这次展现的「Gemini 自动任务」能力,能够模仿人类操作手机,从而实现任务的自动化。背后的实现思路,是 AI 读屏理解 + 系统底层/应用层 API 的双重路径。

需要注意的是,字节和努比亚共同开发的「豆包手机」,重度使用系统级权限的能力,以及读屏,而非 API。你可以理解为,豆包手机主要走的是「没跟应用开发者打好招呼」的,「硬来」的实现思路,也为国民级 app 对其封杀抵制留下了把柄。

而三星和 Google 这次在 Galaxy S26 系列上做的 Gemini 智能体,可以说两者兼备。根据三星方面透露的信息,其应用商城排名前 200 的应用都能支持(但仅限特定应用的使用效果可以保证,后面详述)——说明三星、Google 至少大体上这些应用开发者打好了招呼。

我们来看看《连线》杂志编辑的体验效果:她直接呼出 Gemini,告诉它自己要去机场,Gemini 应用本身会打开一个「虚拟窗口」中打开 Uber,并在后台开始执行这个动作,用户可以随时点击进入查看 Gemini 的执行进程。

由于当地有几个不同的机场,Gemini 很快又提醒用户选择合适的目的地;下单时,Gemini 也会把界面推到用户面前,方便用户选择合适的车辆并支付。

Gemini 的「虚拟窗口」,可以理解为一个沙箱化的「虚拟机」,是 Google 对用户隐私保护的一种考量。过去的 Gemini 运行在 Android 系统中,但这次的新 Gemini 智能体操作应用时,仅限在这个沙箱内工作,并不会触及设备的其他部分。

再多提一嘴:如果大家用过 Manus、 月暗的 Kimi computer、智谱 AutoGLM 等,具备云电脑/云手机能力的智能体产品,应该就很容易理解这个 Gemini 虚拟机的逻辑了。

▲ 图源:9To5Google

这算是相当简单的任务,不少国产 AI 手机助手在一年前都已经攻克了这种场景。

而 Gemini 更加杀手级的能力,是和此前已经长线布局的读屏、抓信息特性相结合。

比如,当用户和朋友聊到聚会要订披萨,用户可以直接叫出 Gemini,吩咐一句「弄清楚订单」,Gemini 就能直接抓取聊天中提到的披萨店,甚至特定的披萨种类,整理好每个人的需求。

随后,用户可以直接让 Gemini 在外卖平台 Grubhub 上点外卖,AI 会按照刚梳理完成的订单需求,在后台自动化把所有食物添加到购物车,交付给用户确认和下单。

有时,订餐的情况会没那么顺利,Gemini 也会尝试自己先去解决突发状况,并给用户提供解决方案。有一次,披萨店在繁忙时段限制了大号披萨的下单量,Gemini 就会询问能不能点两个中号代替。

还有一个例子:用 Google Keep 笔记列举了烧烤派对的出席名单,并标注了素食主义者。Gemini 可以先计算好整个派对总共需要多少热狗和面包,然后再让它去采购食材,几分钟后商品全部被安放在了 DoorDash 平台的购物车里。

Google Android 生态系统总裁 Sammer Samat 透露,Gemini 并非提前「记住」了这些平台操作的步骤和线路,而是真的在利用推理能力,模仿人类查看屏幕并进行下一步操作,这意味着 Gemini 未来能在更多场景发挥潜力。

这里你能看到,Gemini 首批主打订餐、叫车场景,这一点倒是更像春节前千问所做的事情。

▲ 图源:Wired

又一个「豆包手机」,来自 Android 官方

对比真正「全能」,连微信收藏都能帮忙找的豆包手机助手(至少在被抵制之前),Gemini 目前的能力还相当局限,聚焦在打车、外卖、杂货这些日常场景,虽说底层技术能力更强,但用户的实机使用效果,跟鸿蒙的小艺、荣耀的 YOYO 等国产手机 AI 助手并无太大不同。

不过正如文章一开头提到,Google 手握一整个 Android 生态,有着绝对的号召力和掌控力。

随着 Gemini 自动化能力的发布,Google 也详细公开了背后 Android 系统的底层布局和未来计划——有两个方向,简单来说,就是既「苹果」又「豆包」。

首先,Google 去年发布了一个名叫「AppFunctions」的框架,允许开发者公开应用特定的功能和特性入口,以便 AI 助手调用。

Google 将 AppFunctions 类比为 Android 的「模型上下文协议」(MCP),可以简单理解为一个对话标准,帮助第三方的 App 应用和 AI 模型进行对接。

这个框架类似苹果的 App Intents。在苹果的构思中,用户可以使唤 Siri 来操作各种 app 来实现功能,而底层实现方式就是通过 App Intents ——新一代 Siri 迟迟不能落地的前提下,App Intents 足以提供不错的效果。

Google 的 AppFunctions 也是同理。

比如用户下达指令,希望能从好友的电子邮件中找到一个食谱,并将相关配料加入购物清单中。AI 接到命令,首先调用邮件 App「搜索」的功能入口,检索并提取出相关内容,然后调用备忘录的「购物清单」入口,把数据填入整理。

一些 AppFunction 功能已经在三星 Galaxy S26 和 One UI 8.5 系统中落地。比如,用户可以对 Gemini 下达指令,找出相册中的特定照片,并用短信发送给朋友。

需要注意的是,整个过程中,Gemini 不需要打开相册和短信 App,甚至没离开 Gemini App,而是通过 AppFunctions,把对应入口抓取到 Gemini 之中执行操作,效率更高。

本质上,基于 AppFunctions 的实现方式,和过去的 API 路径逻辑相同。这是一种「打好了招呼」的解题思路。

但是,并非所有 App 都做好了相关的适配。没关系,Google 还做了另一手准备。

昨天发在 Android 开发者博客上的一篇文章中,Google 明确提出:公司还在开发一个 UI 自动化的框架,让 AI 助手和第三方应用模仿人类,直接打开 App 一步步操作。

——这,就是翻版的「豆包手机」了。

不过,尽管 Google 说以后 UI 自动化会承担真正的「重活」,在这次的 Galaxy 26 系列当中,UI 自动化只是一个「早期预览版」。

▲ 豆包手机帮我种草比价洗发水

如果说 AppFunctions 需要 App 开发者进行额外的适配工作,那么 UI 自动化框架则是把工作量都留给 AI 智能体,无需任何额外适配,但效果非常取决 AI 智能体的能力,优势就在于一上线就能覆盖大量应用。

现在你可以看到,在 Google 的 Android Gemini 智能体计划中,AppFunctions 和 UI 自动化是两条路线,互为补充:通过规范化、可追溯的接口方式来确保最大限度的兼容性,同时为真正代表未来的读屏交互模式打好基础。

Google 还表示,这不会只是 Gemini 的专属功能,而是 Android 系统的特性。

这也意味着,未来不管是手机厂商自己内置的 AI 助手,还是 ChatGPT 等第三方应用,都能调用 AppFunctions 执行任务,或者「读懂」手机 UI 进行自动操作。

值得一提的是,在国行用不了 Gemini 的情况下,三星 Galaxy S26 的 Bixby 助手也能实现点外卖、叫车、电商比价的功能。我们可以合理推断,三星在国内也找到了一家模型供应商来替代 Gemini 的身份,至于这些大模型小龙当中具体是谁,可能就取决于过去一年里谁在手机智能体上成绩更突出了。

AI 手机的道路,不会只有「孤勇者」

去年「豆包手机」惊艳亮相,又因为令人遗憾的情况而「早夭」。在深感遗憾的同时,也让我们不禁去思考,AI 自动化的模式,就是 AI 手机的理想模式吗?

这个问题,没有个三五年也得不出答案。至少,豆包手机不是单打独斗,手握 Android 系统的 Google,同样选择了这个路线,而且话语权大得多。

其实当豆包手机火到海外之后,就有网友开始畅想,如果 Google 在 Pixel 以及 Android 手机上推广这个技术,那前景将会非常广阔。

虽然我觉得,Google 对于怎么回答「AI 手机」这个命题,其实也没有一个非常清晰的答案,更像是因为手上同时有 AI、系统和硬件,每个方向都尝试一下,说不定就有一条路跑通了。

但至少,Google 已经为 Android 打好了「系统级自动化」的样板,接下来不少新机,都有了化身「豆包手机」的潜力。

这个浪潮或许还不止于 Android 阵营。别忘了,苹果已经和 Google 达成合作,Gemini 将成为 Siri 的技术支持。而 App Intents 和 AppFunctions 又非常相似……

▲ AI Siri 的演示

再往前看一点:Gemini 智能体甚至不只局限于 AI 手机。在 Sammer Samat 设想中,未来智能眼镜、AI 吊坠,甚至是汽车,只要有 Gemini,就能用它来完成复杂的任务——当然,这样的场景距离落地还有距离。

不过,Google 也只是在技术层面跑通了 AI 自动化的路线,而范式成立,不代表问题消失。豆包手机当时遇到的种种矛盾,也会成为后来者不得不面对的挑战。

首先当然是隐私和安全问题。Google 的饼画得很大,未来调用、操作手机 App 的将不仅限于 Gemini,一些第三方 AI 应用能更深入用户的数据核心,如果有伪装的恶意应用利用了这些接口,也会造成更大的损失。

▲ 图源:9To5Google

更激烈的矛盾,是手机硬件厂商、模型/智能体能力提供商、大平台应用这三者之间,围绕 AI 时代新「入口」的争夺。这也是原版的豆包手机,一度最难逾越的高墙。

毕竟,用 Gemini 叫车,可能意味着用户不用再看到 Uber 的会员促销、广告推荐,甚至不再形成品牌黏性,直接损害到应用服务商/广告行业的收益。

中国有互联网/AI 巨头,海外何尝不是如此?像 Meta、Amazon 这样的老对手,本身还拥有强势的平台与生态,它们未必心甘情愿对 Google 开放,让 Gemini 来自动化一切。无论是以隐私、安全,还是平台规则为由,设置限制、提高接入门槛,博弈必然发生,争斗将进一步白热化。

至少 Google 对未来很有信心。Sammer Samat 认为,AI 技术已经进入了「正在进行时」,开发者与其绞尽脑汁对抗 ,还不如去思考一个合适的方式拥抱它。

新与旧的对抗不可避免,最终的胜利者,只会是那些在变革前夜,就已经在勇敢追逐的玩家。

参考资料:
https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


昨天以前首页

硅谷最贵华人放弃 14 亿天价 offer,上交校友庞若鸣提桶投奔 OpenAI

作者 莫崇宇
2026年2月26日 13:34

没有永远的东家,只有永远的 offer。

就在刚刚,据 The Information 报道,七个月前刚加入 Meta 的技术大牛庞若鸣(Ruoming Pang),在上周悄悄加入了 OpenAI。

这名字你可能没印象,但履历相当硬核。庞若鸣本科毕业于上海交通大学,硕士毕业于南加州大学,同时也是普林斯顿大学计算机博士。

在 ChatGPT 一炮而红的前一年,他就因为在开发和训练大规模 AI 系统方面经验丰富,精通从模型本身到背后支撑的软件等各个环节,而被 Giannandrea 从 Google DeepMind 招募到苹果。

苹果为他大开绿灯,允许常驻纽约,不用搬去库比蒂诺总部,这在苹果高管安排中相当罕见。他从几个人的小团队起步,逐步把基础模型团队扩到 100 人左右,成员来自 DeepMind、Meta、微软、亚马逊,货真价实的全明星班底。

2024 年 WWDC,苹果高调发布 Apple Intelligence,写作工具、图像生成、接入 ChatGPT,背后大头都是他团队的成果。后来落地到 iPhone 的 Genmoji、邮件摘要这些功能,也基本出自他团队之手。

用一句话概括,他此前正是苹果 AI 战略的中轴线人物之一。

然后,求才若渴的 Meta 出手了。

据当时彭博社报道,Meta 开价超过 2 亿美元,横跨数年,大头是股票和签约奖金,且需完成特定里程碑才能全部兑现。知情人士透露,为了让庞若鸣放弃苹果团队以及过往在 Google 积累的资源,Meta 还为他量身定制了一套补偿机制。

这个数字几乎刷新了外界对顶级 AI 人才的估值认知。

进入 Meta 后,他在扎克伯格亲自组建的超级智能实验室负责 AI 基础设施工作。据他本人对同事的说法,在 Meta 干得挺开心,基础设施也给力。

但,转折点就是这么猝不及防。OpenAI 在他入职数月后就开始积极接触他,于是不到一年,庞若鸣挥一挥衣袖,转身拥抱了 OpenAI。

值得一提的是,他加入 Meta 时,还带走了部分原苹果团队成员。其中有个叫 Tom Gunter 的研究员,原本已经跳去了 OpenAI,听说庞若鸣去 Meta,直接掉头跟过去了,如今老大挪窝,他的去留也成了悬念。

庞若鸣的离开,也侧面反映了 Meta 在 AI 转型期所面临的复杂局面。

Llama 4 折戟之后,扎克伯格憋着一口气,要重新打造一支「超级智能」梦之队,为此几乎是不计成本地砸钱、砸资源、砸人脉。

143 亿美元买下 Scale AI 近半股份,把 Alexandr Wang 拉进来直接向自己汇报;四处挖角 OpenAI、Anthropic、Google 的核心骨干。

甚至据 OpenAI 首席研究官 Mark Chen 在播客中透露,扎克伯格为了从 OpenAI 挖走顶尖 AI 研究员,亲自下厨煮汤,并亲手递送到目标人选手中。

这番努力已初见成效。1 月 21 日,Meta CTO Andrew Bosworth 在瑞士达沃斯世界经济论坛期间正式宣布,Meta 超级智能实验室已完成首批核心 AI 模型的内部交付,表现「非常出色」。

不过他也坦承,「训练之后仍有大量工作要做」。稳定性、成本、安全合规,一堆问题还没解决,离真正可用还有距离。

庞若鸣的出走,恰好在这个节骨眼上发生,难免让外界对 Meta 超级智能实验室的前景多打几个问号。硅谷不相信忠诚,最顶级的 AI人才争夺战,也远未到终局。至于小扎能否得偿所愿,我们很快就会知晓。

附上参考地址:
https://www.theinformation.com/briefings/openai-hires-meta-ai-researcher-previously-led-apples-models-team?rc=qmzset

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


乔布斯诞辰 71 周年,他的 30 个朋友给我们写了封信

作者 苏伟鸿
2026年2月25日 22:04

在苹果传奇创始人史蒂夫 · 乔布斯 71 岁诞辰之际,史蒂夫 · 乔布斯档案馆发布了一个文集——《给年轻创作者的信》(Letters to a Young Creator)。

这个文集可谓是众星云集,齐聚了近 30 位商业、设计、科技等领域领军人物,如苹果现任 CEO 蒂姆 · 库克、前苹果首席设计师乔纳森 · 艾维、日本建筑师安藤忠雄、德国设计师迪特 · 拉姆斯,等等。他们以「给年轻创作者一封信」的形式,分享了各自创造、设计、人生的深刻洞见。

这个文集的名称也颇有巧思——致敬德国诗人里尔克《给一个年轻诗人的信》,这也是乔布斯生前最喜欢的读物之一。

美国慈善家、乔布斯的遗孀劳伦 · 鲍威尔 · 乔布斯,为整部文集写了一则非常具有智慧和启发性的引言,其中她提到了里尔克的一个金句:

此刻,请你活在问题之中。或许有一天,在你未曾察觉之时,你已渐渐走入答案。

▲ 鲍威尔与乔布斯

无论你是不是一位创作者,只要你怀揣着对于工作、学习乃至人生的疑问,我相信都能从这些分享者的箴言和思考中,获得一点启迪。

文集内容非常长,我们选取了几位重要的代表人物,摘录了其中部分内容进行分享。

整部文集可以在乔布斯档案馆以及苹果图书商店免费获取,官网地址:https://stevejobsarchive.com/publications

苹果 CEO 蒂姆 · 库克:相信自己的力量

我永远不会忘记第一次与乔布斯的谈话。当时苹果正在谷底挣扎,史蒂夫试图扭转局势。很多人怀疑公司能否存活。有人警告我,加入苹果的风险巨大。

但当史蒂夫开口说话,我心中的犹豫瞬间消散。我从未见过如此充满激情与愿景的人。他谈论未来——科技将释放人类创造力与潜能,以连结与提升我们的方式,甚至超出他的想象。为此,他需要一群充满好奇心的人,为超越自身的目标而努力。我知道我必须加入。

在史蒂夫身上,我找到了导师。他激励我成长与自我挑战。加入苹果,对我来说不是换了一份工作,而是找到了使命。这是我做过最重要的决定。

当你们开启职业生涯,你们也会面临选择。你们正处在一个技术突破不断涌现的时代,新路径与新机会正在展开。

这令人兴奋,也可能令人恐惧。如何知道该走哪条路?如何确认自己做出正确选择?

如果能给你带来安慰,请记住:许多成功人士在你们这个年纪,也并不知晓答案,这没有关系。我学到的一点是:未来不可预测。与其问「会发生什么?」,不如问「当它发生时,我会成为什么样的人?」

我希望你们能成为在工作中追寻意义的人,成为理解为世界做有意义之事之美的人。去寻找点燃你热情的人吧,守护你内心的好奇火焰。

最重要的是,不要怀疑你们拥有成就非凡之事的能力。而实现它的唯一方式,是与他人共同完成。

我相信你们。

▲ 库克发微博纪念乔布斯诞辰

前苹果首席设计师乔纳森 · 艾维:创造美的事物

自从他的悼词之后,我没有再公开谈论我与乔布斯的友谊、冒险与合作。我从未去读那些铺天盖地的故事、讣告,或那些奇怪的误读如何被写进「传说」。

我爱乔布斯看世界的方式,他的思考方式美得惊人。他无疑是我见过最具探究精神的人。他的好奇心不是零散或随意的,也不依赖既有知识或专长,而是凶猛的、充满能量的、不安分的。他以明确的意图与严格的训练来实践好奇心。

很多人天生会更好奇。我相信,经过传统教育,或在多人环境中工作之后,好奇心反而成了一种需要意志与纪律的决定。

好奇心会逼着我们学习。而对史蒂夫来说,想学习远比想证明自己正确更重要。

好奇心把我们连在一起。它构成了我们快乐且高效合作的基础。我想,它也缓冲了我们对「做一件可怕的新事物」的恐惧。

史蒂夫很在意自己思考的性质与质量。他对自己期待极高,并努力让思考具有罕见的生命力、优雅与纪律。他的严苛与韧性把标准抬到了令人眩晕的高度。

然而,当想法逐渐成长为点子——无论多么试探、多么脆弱——他都会意识到这是神圣之地。他对创作过程有深刻理解与敬畏。他明白,创作应当获得罕见的尊重——不仅是在想法很好或条件很便利的时候。

想法是脆弱的。如果它们已经被彻底解决,那就不再是想法,而是产品。要不被新想法带来的问题吞没,需要一种坚定的努力。问题很容易被清楚说出、被理解,它们会夺走氧气。史蒂夫会把注意力放在想法本身上,哪怕它不完整、甚至看似不太可能。

现在,比任何时候我都更怀念史蒂夫那种独特而清澈的清晰感。超越想法与愿景本身,我怀念的是他那种能够为混乱建立秩序的洞见。

这和他「擅长表达」的传奇能力无关,却与他对简单、真实与纯粹的执念有关。

归根结底,我相信这反映了驱动他的底层动机。他没有被金钱或权力分散注意力,而是被一种更直接的愿望驱动:以具体可见的方式,表达他对人类物种的爱与欣赏。

他真的相信,当我们做出有用、赋能且美的事物,我们是在表达对人类的爱。

我对你、也对我自己的真诚期望是:我们用创造美的事物来证明我们对人类的欣赏。

日本建筑大师安藤忠雄:不存在唯一正确答案

致年轻的创作者们,

被时代的动荡吞没之际,

请去寻找那些不变的、或不应改变的事物:

那就是人类文化的本质。

这就是我对建筑的理解。

从不存在唯一正确答案。

对话越是极端、越是不妥协,

内心承受的挣扎越是艰难,

建筑的生命力便越发强大。

致年轻的创作者们,

生命的本质不在聚光灯之下,

而存在于阴影中的挣扎时刻,

当你朝远方的光努力前行之时。

请不要失去对那束光的凝视。

德国工业设计师迪特 · 拉姆斯:做得更少,但更好

多年前,我把自己在创作工作中的经验与对产品设计的态度,总结为十条原则(十诫)。我认为它们在今天依然有效:

  • 好设计是创新的
  • 好设计让产品有用
  • 好设计是审美的
  • 好设计让产品易于理解
  • 好设计是不张扬的
  • 好设计是真诚的
  • 好设计是耐久的
  • 好设计到最后一个细节都是一致的
  • 好设计是环保的
  • 好设计是尽可能少的设计

不过,这些原则并非不可更改。每一代人都应重新审视它们,并在必要时修改、补充。把它们当作你工作的心理指南。

把自己看作不仅是人们及其需求的倡导者,也要成为我们星球的倡导者。

「为无思考消费做无思考设计的日子已经结束。」我多年前这样写过。遗憾的是,这个愿望至今仍未实现。我把这个愿望传递给你:做得更少,但做得更好。

苹果广告大师李 · 克劳:不做「正确的事」

李 · 克劳是和乔布斯长期合作的广告总监,他帮苹果制作了《1984》和《不同凡想》(Think Different)两条经典广告。

▲ 左:乔布斯;右:李 · 克劳

关于如何拥有并推销一个大胆想法,可以这样理解:

不要做「正确的事」。

「正确的事」在会议上听起来很好,在图表上看起来完美。

「正确的事」能安抚焦躁的情绪,让所有人都能达成共识。

「正确的事」足够好。

但正如我们公司 T 恤印着的:

「足够好,并不够好。」

要像躲瘟疫一样躲避「正确的事」。

▲ Macintosh 电脑经典广告《1984》

那我是在建议你做错误的事吗?

当然不是。去做勇敢的事。

做那件让你睡不着觉的事,那件充满未知的事,那件一会儿显得荒谬、一会儿显得天才的事。那才是你应该做的。

追逐它,不要放手。去做那件颠覆的事,那件掀翻现状的事,那件不仅挑战现状,而是重塑它的事。你可以做到。

做不做「正确的事」是一种选择,是否选择颠覆也是一种选择。

我建议你选择勇敢。

迪士尼 CEO 鲍勃 · 艾格:创造本质上是冒险

由于皮克斯和 iPod 的关系,乔布斯与迪士尼 CEO 鲍勃 · 艾格有过多次合作和交流,两人关系十分友好,乔布斯还曾经邀请艾格作为苹果发布会的神秘嘉宾。

创造力,在它最巅峰、最纯粹的形态中,是人类全情投入、卓越执行,以及某些时刻运气加持的结晶。

同样重要的是,我们必须意识到:创造力无法被简化为数学或科学问题。算法与数据永远无法告诉我们「应该创造什么」。在这个被数据淹没的时代,我们很容易想让它回答所有创意上的问题。但它不会——因为它做不到,我们也不该这样要求。

对创意决策进行事后揣测,是一件危险的事。要从创作中的失误中学习,但不要反复追问「为什么当初要这么做」。更好的问题是:「怎样可以做得更好?」

最后,畏惧风险,等同于扼杀创造力——因为一切真正的创造,本质上都是一次冒险。

愿你们的好奇心,成为这段旅程的燃料。愿它为你们带来源源不断的探索、激动与满足。

美国作家莫娜 · 辛普森:做最好的自己

莫娜 · 辛普森是一位美国小说家,代表作《在别处》《凡人》等。她还有两个特殊身份:《辛普森一家》中母亲的角色原型,以及史蒂夫 · 乔布斯的胞妹。

▲ 乔布斯与辛普森,中间的是乔布斯的女儿丽萨 · 布伦南-乔布斯

给年轻作家的信:

最重要的事情,其实非常简单:养成每日练习的习惯。艺术不是一个项目,不是一门生意,甚至不只是职业。艺术是一种生活。

我的一位老师曾经建议:如果你能想象自己去做任何别的事,那你或许应该去做那件事。

因为创作这条路,只属于那些无法以别的方式生活的人。

没有什么固定公式;有人在黎明时分状态最佳,有人则在夜深人静时灵感最盛。

每天早起,开始写作。你每天做什么,你就成为什么。

要明白:这是一场漫长的游戏。

开始弄清楚,你要如何进行持续自我教育。

你的教育不仅在写作本身,也在阅读那些前人留下的作品。学会深度而高效地阅读。

培养你的判断力。但不要让这种审美的精细,阻止你继续创作新的作品。

试着与他人建立共同体。这将是你的一生。想办法去享受它。组建读书会,创办文学杂志,发起朗读活动。

不要让那种「我还不够好」的抑郁情绪吞没你,耗掉一段又一段生命。因为每次从这种低谷走出来,你都会发现自己又回到了起点。多去生活,多去写作。

避免排名与比较。我或许更愿意成为贝克特或卡夫卡,但充其量,我也只能成为一个不错的模仿者。你能成为的最好状态,只能是成为最好的自己——那才是值得追求、值得发现的。而这,从根本上说,与别人正在做什么毫无关系。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


4900 万人围观的 Claude Cowork 又杀疯了,10 个顶级外挂上线,这些打工人危

作者 莫崇宇
2026年2月25日 17:20

「software armageddon(软件末日)」——这是外媒描述过去几个月软件板块遭遇时用的词。Anthropic 每推出一个新工具,市场就会条件反射式地先问一遍:又有哪些软件要被干掉?然后果断抛售手里的股票。

短短几周,成千上万亿美元的市值凭空消失。

就在昨晚,Anthropic 再度发布企业级产品更新。当所有市场都在等着看又要杀入哪个赛道,结果,Salesforce 涨了 4%,Thomson Reuters 涨了 11%,Figma 涨了 10%,Docusign 和 LegalZoom 均上涨超过 2%。

软件股的噩梦,这次没有如期而至。而市场情绪在一夜之间发生了 180 度转向,这件事本身就值得好好说说。

10 个插件模板,每一个都在盯着人类的工位

先说功能本身。

这次发布的核心逻辑,是把 Claude 变成可以深入企业不同部门的专业智能体,同时允许管理员创建私有插件市场,在组织内部统一分发和管理这些工具。

连接器层面的新增覆盖了大多数主流企业应用:Google Workspace(含 Calendar、Drive、Gmail)、Docusign、Slack、LegalZoom、FactSet、Harvey、Apollo、Clay 等等。

管理员可以基于入门模板快速创建插件,也可从零构建。Claude 会在设置过程中通过提问引导定制,所有内容统一收纳在新的「Customize(自定义)」菜单下,方便集中查看与管理。

斜杠命令现在以结构化表单的形式启动,执行「生成报告」或「创建仪表板」这类工作流时,操作直观得像填一份简单问卷。管理员还可按用户分配插件、设置自动安装,并通过 OpenTelemetry 追踪团队使用成本与工具调用行为。

10 个 插件模板的扩充,则是此次发布的重中之重,每个模板都与相关领域从业者联合设计,覆盖了真实职场中的具体工作场景。

  • HR 插件覆盖员工全生命周期管理,包括起草录用通知、制定入职计划、撰写绩效评估和薪酬分析。
  • 设计插件可生成评审框架、撰写 UX 文案、执行无障碍审查并制定用户研究计划。
  • 工程插件用于撰写总结、事故响应协调和部署清单制定。
  • 运营插件则覆盖流程文档编写、供应商评估和操作手册创建。
  • 金融领域的插件直接瞄准专业服务行业的核心工作流。
  • 财务分析插件支持市场竞争研究与财务建模;
  • 投资银行插件可审阅交易文件、构建可比公司分析并准备推介材料。
  • 股票研究插件能解析财报电话会议记录并根据新指引更新财务模型;
  • 私募股权插件支持大批量文件审阅与情景建模,并对投资机会自动打分。
  • 财富管理插件则帮助顾问识别组合偏离与税务风险,大规模生成再平衡建议。

在跨应用协作层面,Claude 现在可以在 Excel 与 PowerPoint 之间端到端完成多步骤任务。它能先在 Excel 中完成数据分析,再自动生成 PowerPoint 演示文稿,目前以研究预览形式向 Mac 和 Windows 平台所有付费用户开放。

这次更新也是 Anthropic 在智能体领域加速布局的缩影。

上个月 Cowork 刚首次亮相,本月早些时候 Anthropic 还发布了 Claude Opus 4.6 和 Sonnet 4.6。目前 Cowork 仍处于研究预览阶段,向付费的 Pro、Max、Team 和 Enterprise 用户开放。所有的弹药都在指向同一个目标:接管工作。

为什么 Anthropic 点名的合作伙伴,股价都涨了

既然 Claude 已经能代替人类干这么多活了,为什么软件公司的股票反而涨了?要理解这次反弹,得先还原过去几个月那轮恐慌是怎么来的。

投资者的担忧并非无中生有。今年 1 月底 Cowork 开放插件支持后,市场立刻作出了最坏打算——毕竟当 AI 把法律文件审阅、合规追踪、财务建模这些原本按席位高价收费的功能包,压缩成随装即用的工作流组件,传统软件的护城河将遭受最严厉的质疑。

最近,OpenAI 还在投资者会议上宣称,其 AI 智能体将有能力取代 Salesforce、Workday、Adobe 和 Atlassian 的软件,并算了一笔账:

普通员工使用 ChatGPT 平均每天节省约 50 分钟,相当于每人每天约 50 美元,而企业版 ChatGPT 起价仅为每人每月 25 美元。言下之意,OpenAI 认为自己目前只拿走了所创造价值的一小部分。

这种表态,基本等于公开宣战。

对比之下,Anthropic 这次发布会,选择了截然不同的姿态。它没有再强调「取代」,而是大力宣传与现有 SaaS 厂商的深度集成与联合开发,与 Thomson Reuters 共建法律智能体,与 Salesforce、Slack、FactSet 深度打通,与 PwC 联合将企业级智能体引入 CFO 办公室。

被点名合作的伙伴股价应声上涨,也是正是因为市场开始理解:Cowork 这次的定位是替代完成工作的「员工」,而非替代员工使用的「软件」,新工具仍然需要调用 Salesforce、Docusign 等系统,企业依然要持续为这些软件付费。

这个区分很重要,但它并不能消解所有担忧,只是让市场暂时喘了口气。

真正的分水岭,在于理解这个行业里存在两类截然不同的公司。一类是掌握企业核心交易记录与客户关系,迁移成本极高,AI Agent 要运作反而必须依赖它们;另一类提供的是人与系统之间的中间体验,而这恰恰是最容易被 Agent 穿透的地带。

不是裁员,是再也不需要招那么多新人了

如果说软件公司还能争取到一段缓冲期,打工人面对的压力则是实实在在的。

以 Anthropic 新增的金融系插件为例,其覆盖了从财务建模到推介材料生成、从财报解读到投资打分的全链条流程。这些工作恰恰是大量初级分析师赖以入行的基础任务内容。

Anthropic 在今年 1 月发布的经济影响指数报告给出了更具体的数字支撑。报告通过分析 100 万条真实对话,估算了 Claude 在不同职业中能够有效承接的工作比例。

结论并不是简单的「覆盖了多少任务」,而是引入了一个更严格的指标——「有效 AI 覆盖率」:在 Claude 能完成的任务里,究竟有多少是这个职位最核心、最耗时的工作?

数据录入员和数据库架构师在这个维度上排名靠前。前者虽然只有两项核心任务落在 Claude 的能力范围内,但其中一项恰好是他们花时间最多的工作——从源文档读取并录入数据。

金融分析师的情况与此类似。基于岗位任务结构与已公开工具能力的匹配来看,投行初级分析师的日常任务存在被自动化的风险。

当然,这不代表这些岗位会消失,但它意味着同样一个团队能完成的工作量将大幅提升,也就是说,企业未来需要雇用的初级人手会更少。

问题是,当 AI 接手这些基础执行工作,短期内利润率确实好看,但代价是新人少了练手的机会,等到五到十年后,市场极度缺乏能够审查 AI 复杂输出、承担最终决策责任的高级人才时,这个代价就会以一种所有人都措手不及的方式显现出来。

与此同时,APPSO 之前也报道过,「影子 AI」现象正在企业内部蔓延,指的是员工未经 IT 部门批准或监督,擅自使用AI 工具或应用程序,导致 IT 支出失控,安全合规隐患持续叠加。

SaaS 管理平台 Zylo 的数据显示,大型跨国企业与 AI 相关的支出同比跃升 400%,而原有基础软件投资并未缩减。AI 正在成为企业账本上最昂贵且最难追踪的「隐形员工」。

从中长期来看,纯粹押注 AI 颠覆一切的逻辑,和积极拥抱 AI 同时牢牢握住核心数据护城河的行业巨头,是两种截然不同的命运路径。前者的叙事更性感,后者的胜算或许更大。

Anthropic 今天向外展示的「合作」姿态,听起来温和,甚至有点示好。市场也在一夜之间被安抚了,但没人真正回答那个根本问题:AI 冲击职场的终点,到底是人和 AI 一起干活,还是 AI 干活、人来担责,还是连这最后一道门槛也终将消失?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


新轩逸 9.49 万起,增配还降价,东风日产 4 款新车上市

作者 芥末
2026年2月25日 09:24
车企们的脚步比预想中走的更快。
春节刚过,日产便率先出手,一次性更新了四款车。

日产 N6、N7

日产首先对日产 N6、N7 的价格配置进行了调整。

日产 N6 去年上市时推出了 180MAX+、170MAX+旗舰版,但由于 8155 芯片排产原因,直至今日才正式启动交付。

此外日产 N6 此次增加了一个 11.19 万元的 180Pro+ 版本,这个版本和 180MAX+、170MAX+旗舰版一样,全部搭载宁德时代电池,以及东风日产与 Momenta 定制开发的组合驾驶辅助,包括了高速领航驾驶辅助、同级唯一 Momenta 泊车辅助,以及同级首个城市记忆领航辅助,是同级唯一同时搭载宁德时代电池与 Momenta 高阶驾驶辅助的插混车型。

其他配置上,与 180MAX+、170MAX+旗舰版相比,180Pro+ 仅少了一个前排的 AI 零压座椅。

日产还为 N6 还新增了灵感源自赛里木湖「湖光蓝」车色,以及可以选装 N7 同款智能冷暖压缩机冰箱及甄选运动包。

日产 N7 只做了价格调整,虽然此次推出的车型名为「青春版」,实则车辆配置几乎未变,只是价格在原来基础上下调了 1 万元。

本次发布会的重头戏则是天籁·鸿蒙座舱 SS380 大师版和第 15 代轩逸两款新车。

天籁·鸿蒙座舱 S380 大师版

天籁鸿蒙座舱上市后的表现比较稳定,已连续两个月位居鸿蒙座舱轿车销量首位。

为了回应部分用户对车辆外观个性化和质感提升的需求,日产此次推出了天籁鸿蒙座舱 S380 大师版。=

天籁 S380 大师版主要在内外设计上进行了升级。

新车外观采用了黑金双拼配色,灵感取自黑曜岩与金色矿脉,配合新的腰线工艺,增加了车身的视觉层次感;座舱内部则采用了以「日落霞光」为理念的黑红内饰,进一步丰富了车内的视觉氛围。

智能化层面,天籁鸿蒙座舱进行了首次 OTA 升级。系统新搭载了基于 MOLA 架构的混合大模型,重点优化了人车交互的自然度。

升级后的 AI 语音助手支持四音区免唤醒、口语化指令及模糊搜索,在日常控车之外增加了更多信息交互功能。

同时,新增的语音导航纠错功能允许用户在行驶中直接通过语音修改目的地。此外,车机系统更新了 3D 时空主题,可模拟不同时段的光影变化。

动力系统上,天籁 S380 大师版继续搭载 2.0T VC-Turbo 发动机,应用了 8:1 至 14:1 的可变压缩比技术。其最大马力为 243 匹,峰值扭矩达到 371 牛·米,实测百公里加速在 6 秒级。

日产表示,此次新增加的黑金双拼外观与黑红内饰工艺比较复杂,合计约 1.5 万元,但为了展示诚意,上市价格最终定为 16.19 万元。

新轩逸

已经在海外更新的第 15 代轩逸这次也在国内亮相了。

作为全新换代产品,新车的外观与内饰设计基本与海外版保持一致。不过在动力方面,国产版并未引入海外的 2.0L 发动机,而是继续搭载 1.6L 自然吸气发动机。

第十五代轩逸采用了全新前脸造型,供「双前脸」设计供消费者选择。

标准版采用倒梯形熏黑进气格栅,内部辅以扩散风格的「V」形元素,并向两侧延伸出熏黑饰条,营造出极具攻击性的「獠牙式」视觉效果;全新矩阵式 LED 大灯下方同样融入獠牙式灯组,中间通过镀铬饰条贯穿发光 LOGO。

另一款前脸则通过熏黑饰板将上下格栅相连,形成大尺寸的「V」形熏黑格栅,运动气息更加浓厚。

新车长宽高分别为 4656/1825/1448 毫米,轴距 2712 毫米。车身侧面采用了溜背轿跑风格,搭配错落有致的腰线以及侧窗上沿精致的镀铬饰条,营造出强烈的动感。

此外,新车还配备了 16 英寸双色刀锋状轮毂。车尾部分,贯穿式尾灯与前脸相呼应,配合发光 LOGO 兼顾了科技感与辨识度。重新设计的后包围加入了凌厉的线条勾勒,结合微微上翘的「小鸭尾」设计,进一步强化了整车的运动气质。

全新轩逸的车机系统迎来了全面升级,功能更丰富且交互更流畅。根据不同配置版本,新车将提供倒车影像/全景影像、无钥匙进入与启动、远程启动以及 L2 级智能驾驶辅助系统等实用配置。

中控台设计更加现代化,空调控制区升级为触控操作屏;副仪表台区域则配备了 USB 接口、手机无线充电面板、传统机械样式挡杆及水杯架,前排中央扶手箱还加入了精致的缝线工艺,有效提升了座舱质感。

作为有着「移动大沙发」美誉的车型,第 15 代轩逸在空间与舒适性上也有改善。

新车后排座椅采用错落布局,三人乘坐也能保证肩部与腿部空间的宽敞舒适;同时新车还贴心地借鉴了 MPV 的低台阶设计,方便乘客上下车。

全新轩逸延承了家族「移动大沙发」的特点,配备了 Multi-Layer 人体工学座椅,借鉴航天零重力理念,采用 3D 支撑设计与复合缓冲材质,包裹柔软且支撑到位,久坐不累。主驾座椅升级了十向电动调节,坐垫加长了近 6 厘米,为大腿提供更充足的承托。

新座椅还采用了专为防眩晕设计的 T-Shape 结构,通过降低座椅重心,在车辆转弯或经过颠簸路面时提供更好的支撑来分担压力,有效缓解乘车眩晕感。

此外,新车后排还配备了独立空调出风口和电动天窗。

动力方面,全新轩逸继续搭载 1.6L 自然吸气发动机,最大功率为 99 千瓦(135 马力),峰值扭矩 159 牛·米,传动系统匹配 CVT 无级变速箱,这套动力总成主打经济平顺,WLTC 工况下百公里综合油耗仅为 5.88L。底盘部分依旧采用前麦弗逊式独立悬架与后扭力梁式非独立悬架的经典组合。

新车最终起售价则定在了 9.49 万元。

日产如此迅速的节奏背后是不小的市场压力。2025 年全年,东风日产仅售出 60.1 万辆车,已是连续第七年下滑。
在 2026 年的第 1 个月,整个日产品牌共售出了 44845 辆车,销量不仅低于同为日系车企的丰田、本田,甚至未能超过平均价格更高的奥迪和宝马。
更重要的是,被给予厚望的日产 N6 和 N7 均表现不佳,N6 仅售出了 3012 辆,上市 4 个月以来累计售出 10399 辆,而风光一时的 N7 销量也在持续下行,1 月份仅售出了 978 辆。
其新能源车型的整体销量占比依然低于行业平均水平,天籁,轩逸、逍客等传统燃油主力车型的市场份额也在逐渐缩减,更别说已经接近「入土」的英菲尼迪品牌。

▲ 东风日产各车型 1 月份销量

面对这些现实压力,东风日产明确了下一步的转型规划。

按照计划,到 2027 年底,东风日产将共计推出 6 款全新新能源车型(包括已上市的 N7 和 N6),目标是将新能源车的销量占比提升至 50% 以上,并实现年出口量 10 万辆。

在资金和人员投入上,东风日产计划在 2026 年底前投入 100 亿元,并将研发团队扩充至 4000 人,重点推进电动化和智能化技术的开发。

虽然东风日产正在积极补齐短板,但在当前竞争极度激烈的市场环境下,想要追回流失的份额,其转型的速度和产品落地的节奏还需要再快一些。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Anthropic「蒸馏」了人类最大的知识库

作者 莫崇宇
2026年2月25日 08:47

2024 年初,在美国某处的一座仓库里,工人们正在做一件看起来有些奇怪的事:把书一本本送进机器,切掉书脊,扫描,然后把剩下的纸送去回收。

这些书是刚买来的,有些甚至是新的。没有人会读它们,它们存在的唯一目的,就是被销毁。

下令做这件事的,是一家叫 Anthropic 的 AI 公司。

在他们的内部文件里,这项计划有个代号:「巴拿马项目」。一份规划文件写得很直白:「这是我们以破坏性方式扫描全球所有书籍的计划,我们不希望外界知道我们正在做这件事。」

这件事最终还是被人知道了。

去年,一名联邦法官解封了一批与版权诉讼相关的文件,总计超过 4000 页。外界由此看到的,不只是一家公司的秘密,而是整个 AI 行业在数据争夺战中的真实面目。

被大模型「吃」掉的实体书

为什么这些处于技术前沿的科技巨头,会用如此原始甚至粗暴的方式对待纸质书?答案其实藏在 AI 对高质量数据的极度渴求里。

Anthropic 内部很早就意识到,训练 AI 模型光靠网络上的内容不够用。

根据《华盛顿邮报》报道,一位Anthropic 联合创始人在 2023 年 1 月的文件中写道,用书籍训练模型,可以让 AI 学会「如何写得更好」,而不是只会模仿质量参差不齐的网络语言。

书籍经过严格编辑和校对,内容结构清晰,是网络文本难以替代的高质量语料。

这个逻辑本身并不难理解,但问题是,既然承认书籍有价值,为什么不付钱?究其原因,挨个找出版社和作者谈授权,费时费力,成本也高。于是 Anthropic 启动了「巴拿马项目」。一句「不希望外界知道」,说明它也清楚这件事站不住脚。

甚至「巴拿马项目」还没启动的时候,Anthropic 已经尝试通过另一种方式获取书籍。

法院文件显示,公司联合创始人 Ben Mann 曾在 2021 年 6 月的 11 天里,从一个叫 LibGen 的网站下载了大量小说和非小说类书籍。LibGen 是个「影子图书馆」,上面的资源大多涉嫌侵权,文件中附带的浏览器截图显示,他使用文件共享软件完成了这些下载。

一年后,另一个网站 Pirate Library Mirror 于 2022 年 7 月上线,该网站公开宣称「在大多数国家故意违反版权法」。Mann 把这个网站的链接发给了其他 Anthropic 员工,并留言写道:「来得正是时候!!!」

这句感叹号背后,是一位公司高管对一个公开承认违法的盗版网站表达的真实态度。

Anthropic 事后表示,公司从未用这些数据训练过正式发布的商业模型。但这种解释多少有些勉强,下载了,存着,只是「没有用在正式模型上」,这条线究竟划在哪里,恐怕连 Anthropic 自己也说不清楚。

为了「巴拿马项目」,Anthropic 还专门聘请了 Tom Turvey 来主持这项工作。Turvey 曾参与创建谷歌图书项目,那个项目同样因大规模扫描书籍引发了长达多年的版权争议。Anthropic 选择这个人来主导这件事,很难说是一种巧合。

最终,Anthropic 主要依赖两家书商批量供货:

美国二手书零售商 Better World Books,以及总部位于英国的 World of Books,每次采购动辄数万册。内部文件还显示,员工曾讨论接洽纽约公共图书馆,甚至提到可以找某家长期资金不足的新图书馆。

采购完之后,整个扫描过程,就像一条工业流水线。

供应商用液压切割机把书脊整齐切掉,散开的书页随即被送进高速工业扫描仪,扫完之后,剩下的纸张交给回收公司处理。一家参与报价的扫描服务商在提案中写道,Anthropic 希望在六个月内完成 50 万到 200 万册书的数字化工作。

Anthropic 副总法律顾问 Aparna Sridhar 回应称,法院已裁定 AI 训练「本质上具有转化性」,Anthropic 选择和解的问题在于「部分材料的获取方式,而不是我们是否可以使用这些材料」。

这套说辞在法律上也许站得住脚,但它同时也揭示了一件事:这家公司从未认为自己做错了什么,只是某些手段不够干净。

拿你的书训练,再抢你的饭碗

同样的事情,也在其他公司身上发生着,而且有些细节更为戏剧性。

针对 Meta 的诉讼文件显示,有员工在 2023 年直接写道:「用公司笔记本进行种子下载感觉不太对劲。」他后来还专门向法务团队反映,称使用种子网站可能意味着向他人分发盗版作品,「这在法律上可能行不通。」

但这些顾虑最终没有改变任何事情。

2023 年 12 月的一封内部邮件显示,使用 LibGen 已在「上报至 MZ」之后获批,MZ 指的是 CEO 马克·扎克伯格。邮件还坦率地写明了他们自己都清楚的风险:「如果媒体报道暗示我们使用了已知为盗版的数据集,这可能会削弱我们在监管问题上的谈判立场。」

换句话说,他们不是不知道这样做不对,只是在权衡被抓包的代价。为了降低这个风险,员工们特意租用亚马逊的服务器来做种子下载,而不是用 Meta 自己的服务器,原因是避免被追踪到 Meta 公司。

OpenAI 和微软同样面临图书作者的版权指控。OpenAI 甚至承认曾下载过 LibGen,但称在 ChatGPT 发布前已删除相关文件。

而 AI 公司与创作者之间的版权冲突,并非从 Anthropic 才开始。

早在 2000 年代初,Google 就曾大规模扫描图书馆馆藏,同样引发了长达十年的诉讼。最终法院认定Google 的做法属于「合理使用」,因为它只提供片段摘要,目的是引导读者找到书,而不是取代书本身。

这个判决在当时看来合情合理,却在二十年后为整个 AI 行业提供了一块挡箭牌。

Google 图书是个索引工具,而生成式 AI 直接消化书籍内容,然后输出文字,在某些情况下与作者产生直接竞争。性质变了,但援引的法律逻辑还是同一套,这本身就值得思考。

去年 6 月,联邦法官 William Alsup 裁定,Anthropic 用书籍训练 AI 属于合法行为,他将这个过程比作教师「训练学生写好文章」。这个比喻听起来温和,但现实中的老师不会同时训练几百万个学生,也不会靠这些学生赚几十亿美元。

最终,Anthropic 选择支付 15 亿美元和解金,在 AI 版权诉讼史上创下纪录,但细看之下,账算得并不亏。按照美国版权法,每件作品的法定赔偿上限可达 15 万美元,而此次和解折算下来,每本书约赔 3000 美元,仅为上限的 2%。

赔偿金由作者和出版商平分,只是,这一安排在创作者群体内部引发了争议。

不少作者认为,出版商在保护作品不被 AI 滥用这件事上没有尽力,却拿走了一半赔偿。更关键的是,和解协议并不要求 Anthropic 承认任何违法行为,法院对「AI 训练属于合理使用」的认定照样有效。

换句话说,Anthropic 用 15 亿美元买到的,不只是和解,还有一份背书:我们可以继续这么做。有分析人士指出,随着这个先例确立,版权侵权对 AI 公司来说已经不再是一条红线,而是一笔可以提前计入成本的「过路费」。

对许多写书的人来说,这件事意味着的远不止一张支票。美国作家的年收入中位数约为 2 万美元,而市值数千亿的 AI 公司在未获授权的情况下大量使用他们的作品,事后折算的赔偿标准远低于法律上限。

更让人忧虑的是,AI 正在批量生成文字内容,这些低成本的文本涌入市场,让原本就艰难的写作谋生变得更难。训练 AI 用的是人写的书,而 AI 产出的内容,正在挤压人继续写书的空间,循环往复。

支持者自有另一套逻辑:AI 并不储存书里的内容,而是从中提取语言规律,这更像是一个人博览群书之后形成自己的表达。这个类比并非毫无道理,但却省略了一个关键差异:

人读了一本书,不会同时读一百万本;而 AI 在几个月内消化了人类几十年的写作积累,随后以极低的边际成本无限复制输出,规模改变了性质,把两件事等同起来其实并不合理。

数百万册书被切开、扫描、回收,最后换来一份和解协议。那些书,早已不在了。而 AI 还在继续写作,且会越来越快。这大概就是这件事最让人不安的地方:对于书被销毁,被肆意用来训练 AI 这件事,没有人真正付出了代价。

附上参考地址:
https://www.washingtonpost.com/technology/2026/01/27/anthropic-ai-scan-destroy-books/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


奥特曼怼AI耗电:人类想变聪明还得吃 20 年饭,网友:你再说一遍?

作者 Selina
2026年2月24日 17:32

奥特曼又又又又口出狂言了。

在印度 Express Adda 的论坛上,Sam Altman 聊了很多 AI 话题,从 AGI 到中美 AI 竞争,再到数据中心用水问题。但最火的那段,是他回应 AI 能耗批评时说的:「人们总谈训练 AI 模型需要多少能源……但训练人类也需要大量能源,得花 20 年时间,消耗那么多食物,才能变聪明。」

这话说错了——人吃了 40 年的饭都未必有这么聪明。

这话听起来只是个比喻,但一传开,就被解读成 AI vs 人类的「效能大战」。Altman 到底想表达什么?简单说,他觉得大家批评 AI 时,总拿「训练模型」的总能耗和人类「回答一个问题」的瞬间能耗比,这不公平。

人类也不是生下来就是大聪明,从婴儿到成人,吃喝拉撒 20 年,还得加上学校教育、社会教育,这些都消耗食物、水、电等等能源。如果算「全生命周期成本」,AI 其实挺高效的,训练一次,就能无限次回答问题,而人类每次思考还得再烧脑子——大脑耗能约 20 瓦。

换言之,在他看来,AI 不是能源杀手,而是未来文明的必需品,就像电灯发明时也有人担心蜡烛业失业一样。这个观点不是 Altman 首创。早在 AI 热潮前,就有专家比过生物大脑和硅芯片的效率。但 Altman 作为 OpenAI 老大,说出来影响力大,瞬间成了 X 上的热点,视频有两千多万次浏览,引爆了讨论。

人类尊严,AI 是工具还是「更好的人类」?

Altman 把人类成长比作「训练」,听起来像把人当机器。这让很多人不爽,觉得贬低了人类的价值——生命不是数据输入输出啊!

人一生的自然进化中,不仅有产出,还有情感、教育、成长的喜悦,这些能量计算不来,在舆论场上,这点被放大。一个油管博主打出标题「OpenAI CEO Argues Energy Is More Wasteful On Humans Than AI, Goes Very Poorly」,说 Altman 的言论进行得很糟糕。

X 上,@BrianRoemmele 直呼震惊,觉得这是给 AI 行业招黑,「片面思考,反人类。重视人类胜过 AI——永远。」

当然,也有用户帮忙解释,「这不是要取代人类,只是更准确计算自动化成本。」 他也承认 Altman 这样说不好,但是要理性、中立、客观地看待。于是,真的有人认真算起来了,然后悲催的发现,自己一天什么都没做,就消耗了卡路里。

不止他一个,还有很多支持派觉得 Altman 点醒了大家。信息总有成本,之前没有算过,但是细思极恐,Altman 的说法是让大家正视这件事。

这些反应暗示了 AI 的价值大于成本,可是能不能跟人并列一起算呢?这引发了关于 AI 是否会取代人类的讨论。

拿人跟 AI 比?荒唐!

相比之下,负面的批评显然是更多的,就算这只是个比喻,也非常荒唐。

Altman 的这番话,看上去合理,但也有明显的逻辑谬误。人类确实要吃喝 20 年才能「变聪明」,但这 20 年的能量消耗是基线生存,用来维持生命、维持社会运转,不是专为「产生智能」而额外投入的。哪怕一个人一辈子啥都不学,躺平当咸鱼,他也得吃饭喝水呼吸。

其次,规模和可复制性完全不同。Altman 想强调「per query」的效率,但他忽略了:人类智能没法「复制部署」到数据中心里无限扩容。AI 的真正优势恰恰在于「训一次,用一辈子」,而人类是「训一次,用一辈子还得继续喂」。如果真要比「单位智能产出每焦耳能量」,AI 在规模化后确实可能碾压,但用「养孩子总成本」来类比,反而把这个优势给模糊掉了。

把孩子成长比作「模型训练」,本质上是把人降格成「低效生物计算机」,这不只是逻辑问题,更是价值观滑坡。网上很多人直接说「这不是比喻选错了,而是把尊严换成效率的典型技术官僚思维」。

总体看,从 2 月 20 日视频发出来后,这两天迅速扩散,大概有 30%的回应是正面,中立 20%,负面占 50%。这反映了 AI 话题的两极化。一方面,它确实戳中了 AI 发展的痛点:能量是瓶颈,但技术的飞轮不能停。另一方面,技术也不能是真空的,最终得回到对人类生活的帮助和改善上。或许,如 Altman 所说,得建更多清洁能源是一种解法,但也如批评者言,无论未来出路是什么,得尊重人类独特价值。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


AI 助手这么多,只有它是真踩过雷的

作者 Selina
2026年2月24日 16:00

半年前,APPSO 写过小红书的 AI 助手「点点」。当时它的核心能力是帮你总结笔记、检索和一些简单的聊天。

在这个 红包大战的春节,我发现点点也悄悄发起了红包,并且上线了一个「攻略模式」——连明星都在用的那种。任敏就用点点做攻略,做了自己的回乡 vlog。

这样的动作,让人感觉点点正在从一开始的摸索尝试,进入新的阶段。这让我好奇起来,想重新体验一下点点,看看它现在到底能做到什么程度,以及小红书推出的独立 AI产品, 到底想往哪个方向走。

这个 AI 读过小红书

现在小红书上的笔记不计其数,平时最常见的卡点不是找不到内容,而是翻不完,根本翻不完。一个话题、一个关键词,动辄就是几百上千条笔记,一篇就是十几张图——到底哪些内容最有用?

点点在这里承担的角色,就是通读全篇,压缩内容,提取核心。随机刷到电影推荐时,我先是发给了点点问,「《镖人》的风评怎么样?值得看吗?」。

它不仅分析了笔记正文中对于电影的评价,还结合了评论区的讨论,总结了目前的争议点:选角方面,部分原著粉认为吴京与主角「刀马」气质不太符合,刘耀文、此沙等年轻演员的选角也有讨论;角色塑造上,女主阿育娅的形象又飒又燃获得好评,但也有人觉得部分角色刻画单薄;最后给出观影建议——如果你是武侠动作片爱好者,想看酣畅淋漓的打戏,《镖人》值得一看,但如果更看重剧情深度和逻辑性,可能会失望。

更灵的来了:我看完它的分析之后,决定先看一下预告片,于是对它说「它的预告片能发给我吗?」。

点点立刻就找到了《镖人》的官方预告,点开就能看——省下了我退回主页、点击搜索框、输入打字等一系列操作。

面对一条标题为「冬奥史上最幸运的冠军」的视频,我让点点帮我总结核心内容。几分钟的视频,有效信息往往集中在后半段,点点能快速定位视频的核心结论,省去反复拖拽进度条的时间。

它总结出这位「幸运冠军」的两个关键节点:半决赛时,他在最后一个弯道恰好避开了前方选手的集体碰撞摔倒,以小组第二晋级;决赛中,他落后领先集团十几米,就在即将冲线时前面四名选手再次集体摔倒,他就这样「溜」过终点线拿到了金牌。

当我想了解「修冰师是怎么工作的?」这类延伸话题时,点点也能接得住——它解释道「修冰师」其实是一个统称,根据冰上项目不同,具体分工很细致,工作内容也差别很大。

点点还可以像聊天一样,根据视频内容发散。当我把看到的可爱小咪视频发过去时,问它的是视频里没有展现的东西:小猫仰着头睡觉不会受伤吗?

点点:好细心的观察!然后详细跟我讲解了,对于猫而言,这恰恰是它开心和信任的姿势。

评论区是小红书最有价值、也最难处理的信息层:杂乱、充满缩写和梗,既有干货分享,又有情绪发泄——而这恰恰是点点的主场。在看到一篇标题为「西安旅游体验非常不好的五天」的笔记时,我让点点「总结评论区里提到的避雷点」。

点点迅速从数百条评论中归纳出几个维度的避雷信息:住宿方面,有人反映卫生不达标、设施损坏、房东沟通不畅,也有评论指出花600多一晚的价格不如住连锁酒店更有保障;还有人反映遇到商家对游客和本地人报不同价格。

把「活人感「的碎片信息,变成可以做决策的结论,这就是点点在评论区归纳上的技能点。

比「知道「更进一步,是「直接照抄」

点点这次更新最让人眼前一亮的,是「攻略模式」的上线。

简单来说,攻略模式就是让点点帮你做一份完整的计划——不是那种干巴巴的清单,而是一份有时间线、有细节、能直接照着执行的攻略。

比如,用 AI 做旅行攻略,现在处于一个尴尬位置:结果大量存在,可执行的很少。很多 AI 给出的方案,逻辑上对,但落地时才发现——路线绕远了,时间排不下,某个地方早就关了。点点的攻略模式尝试解决的,正是这个从「信息」到「计划」之间的断层。它结合实时信息、真人经验与地图能力,生成具备时效性和可执行性的攻略。

尤其是春节假期,带娃出门,最怕的就是计划赶不上变化。我让点点帮我规划一份「春节带孩子不费妈的出游计划」,看看它能给出什么方案。

点点很快生成了一份详细的亲子出游攻略。从目的地选择,到每天的行程安排、亲子友好型餐厅和酒店建议,甚至连带娃出行的必备物品清单都列得清清楚楚。更贴心的是,它还会考虑到孩子的作息时间,把行程节奏控制得不紧不慢,避免大人小孩都累得够呛。

这是大计划,小计划呢?这个假期,我发现点点在「小计划」上也非常实用,比如:两个目的地之间,中间想顺便逛逛、吃点喝点,但又不绕远。我就让点点安排两点之间的具体路线。

点点先是确认了探店的偏好、骑行还是步行等基本信息,然后就开始深度研究,推荐了沿途值得一逛的店铺。不只是笼统地说「这条路上有咖啡店」,而是具体到店名、地址、特色之处,当然,少不了附上小红书用户的真实评价和推荐理由。

这大大省掉了我站在太阳底下,划着手机一篇篇笔记翻,却又举棋不定,越纠结人越焦躁的情况。也是最能体现点点如何把 AI 助手,以及小红书原生内容整合到一起,强强联合后的效果。

小红书的独立 AI,想清楚要往哪走了吗?

需要指出的是,点点并非没有槽点。首先,攻略模式的生成时间不太稳定,有时候等的时间远超五分钟。另外,如果对生成结果不满意,目前没有一键重新生成的选项,需要多次点击才能重来。

攻略模式目前只在点点 app 上线,且有额度限制;主站内的入口也经历了几次调整,需要仔细留意才能发现,说明点点团队对于产品方向这件事,还在持续探索。

如果把视角拉远一点,从行业角度来看,点点过去的问题其实不在于功能做得不够好,而在于它需要回答一个更根本的问题:如何「用好」用户原生内容,以及,用什么样的方式「还给」用户

不过,瑕不掩瑜。在 AI 助手赛道越来越拥挤的今天,点点依然站在了一个非常独特的生态位上。

说到底,点点真正的壁垒不是技术——这年头谁家还不做一个 Deep Research了——而是小红书上那些真实用户的真实经验。其他 AI 助手是在用通用语料回答你,点点是在替你消化小红书。

在那些最依赖「真实经验」的场景里——你想知道这家店到底踩不踩雷、这条路线到底能不能走、这个攻略到底怎么做才对——来源的差异会决定答案的可信度。这些问题的答案,百科给不了你,通用大模型也给不了你,只有那些真正经历过的人才能告诉你。

这个时代不缺信息,缺的是有人帮你筛选、整理、判断。而社区语料的「活人感」,恰恰是最难被复制的东西。点点做的,就是把这种活人感规模化地交付出来。搜索给你信息,攻略模式给你方案——从「我有想法」到「我知道怎么做」,中间那些反复翻帖、拼信息的时间成本,点点正在一点点帮你省掉。

点点的未来会走向哪里,现在下结论还为时过早。但至少在「生活搜索」这个细分领域,点点已经找到了一个别人很难复制的方向。

接下来的问题是:点点能在这个位置上扎多深,又能把体验打磨到什么程度——这将决定它到底只是一个「有趣的 AI 功能实验」,还是真正成为用户手里,有活人感的「小帮手」。

毕竟,在 AI 这个赛道上,有独特价值只是入场券。能不能把价值转化为用户习惯、把习惯转化为商业回报,才是真正的挑战。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


一夜蒸发 310 亿美元!Claude 新工具干翻 IBM 摇钱树,AI 正在「清零」人类工位

作者 莫崇宇
2026年2月24日 13:43

如果你想摧毁一家公司,不需要打败它,只需要让人相信它可以被打败。

截至周一美股收盘,IBM 股价暴跌 13.1%,报每股 223.39 美元,创下 2000 年互联网泡沫破裂以来最大单日跌幅。当天市值从 2408 亿美元跌至约 2087 亿美元,蒸发了约 310 亿美元。

是财报暴雷了吗?不是。是重要大客户跑路了吗?也没有。

这一切的导火索,仅仅是 AI 公司 Anthropic 当天发布的一篇博客,宣布旗下编程工具 Claude Code 可以帮助改造 COBOL 老旧系统,直接戳中了 IBM 最核心、最赚钱的遗留系统咨询业务。

没有人证明 IBM 的生意垮了,但在恐慌的市场面前,已经不需要证据了。

COBOL 是 IBM 的护城河,现在被 AI 盯上了

要理解 IBM 为什么跌得这么惨,得先搞清楚 COBOL 是什么,以及 IBM 靠它赚的是什么钱。

COBOL 是一种诞生于 20 世纪 50 年代的编程语言,今天仍在驱动美国约 95% 的 ATM 交易,以及大量银行、政府、航空系统的日常运转。

IBM 长期销售针对 COBOL 优化的大型主机,并围绕它提供改造和咨询服务。

这门生意之所以赚钱,根源在于改造难度极高。读懂几十年没有文档的老代码,往往要顾问团队花上数年时间。这种高昂的理解成本,就是 IBM 最核心的竞争壁垒。

Anthropic 的博客说,Claude Code 可以自动梳理数千行代码之间的依赖关系,补全那些早已没人记得的工作流文档,还能识别出人工分析师要花几个月才能发现的系统风险。

它进一步宣称,原本以年计的现代化项目,用 AI 可以压缩到几个季度。

当市场听到这个消息后,立刻做出了反应:IBM 那套依赖大团队长期驻场的咨询模式,定价权可能要松动了。

IBM 的处境因此显得格外敏感。

2025 年全年,其咨询业务收入约 210.55 亿美元,基础设施收入约 157.18 亿美元,生成式 AI 累计签约规模也超过了 125 亿美元。当理解遗留代码这件事的成本被大模型显著压低,这些收入的含金量在市场眼中就打了折扣。

有意思的是,IBM 和 Anthropic 其实并不是单纯的对手。

2025 年 10 月,两家公司曾宣布战略合作,把 Claude 集成进 IBM 的开发工具体系,内部有超过 6000 名早期用户报告平均生产力提升约 45%。同一种技术,既可能成为它自我改造的工具,也被看作颠覆 IBM 的武器。

但在抛售情绪主导的当天,市场选择了后者。

IBM 暴跌其实不是这轮动荡的起点。早在 2 月 20 日,网络安全板块就已经经历了一次集体闪崩,那天后来被一些分析师称为软件行业的「黑色星期五」。

导火索是 Anthropic 宣布推出 Claude Code Security。

这款工具能自动扫描代码库中的安全漏洞,生成补丁供人工审查,并将原本由专业安全工具负责的漏洞扫描、软件成分分析等功能,直接内置进了开发者的日常工作流。

市场的反应同样非常强烈。

JFrog 当天单日暴跌 24.61%,因为它的核心业务高度依赖软件供应链的管控,而这恰好是 AI Agent 最容易切入的地方。CrowdStrike、Cloudflare、Okta、Zscaler 等公司虽然主营业务并不是代码扫描,但也因为情绪「传染」出现了明显下跌,整个板块单日蒸发上百亿美元,追踪网络安全 ETF 的 BUG 基金跌至两年多以来的最低点。

当然,不少理智的分析师站出来反驳,说这种抛售毫无逻辑。

比如摩根大通认为,投资者的担忧被过度夸大。Wedbush Securities 的分析师措辞严厉地表示,这是自己职业生涯中见过的「最不合逻辑的交易」。

他们的理由有一定说服力。

AI 在帮助防守者扫漏洞的同时,也在帮助攻击者找漏洞。到 2026 年,黑客已经开始用大模型发起更精准的钓鱼攻击,开发自动化的攻击 Agent,甚至针对企业内部的 AI 模型实施「提示词注入」和「内存投毒」。

更棘手的是,企业内部大量未经授权部署的 AI Agent,一旦拥有操作内部系统和访问敏感数据的权限,本身就成了安全隐患。这意味着安全的需求非但没有消失,反而在扩张。

CrowdStrike 提供的端点保护、Zscaler 提供的零信任网络访问、各类身份与访问管理工具,恰恰是应对这些新型 AI 威胁所必须依赖的基础设施。

SaaS 最不愿承认,但正在发生的事

APPSO 之前也报道过,AI 对整个 SaaS 行业造成了很大的冲击。

而 IBM 和安全股的动荡,是整个企业软件行业更大危机的一个切面。过去二十年,SaaS 行业的繁荣建立在一个简单逻辑上:企业员工越多,买的软件席位就越多,供应商的订阅收入就越稳。

AI Agent 的出现打破了这个等式。

以 Claude Cowork 为例,它能自主跨系统导航,独立完成数据录入、线索评分、多步骤业务审批等工作,企业不再需要维持大规模的基层操作团队。

一个原本需要五个人各自登录账号的财务部门,现在可能一个主管配合 AI 工具就够了,那四个席位的订阅费自然随之消失。这种现象是 SaaS 厂商目前面临的最直接威胁。

在这场转型中,处境最危险的是那些提供通用功能、主要服务中小企业的 SaaS 厂商,比如 HubSpot、Atlassian、Asana。这类产品的工作流相对标准化,很容易被 AI 直接模仿替代。

越是那些功能通用、流程标准化的软件(比如排日程、管任务的),越容易被 AI 直接平替。

这种冲击不只停留在大公司层面,对普通创业者也是一种降维打击。

一位名叫 Ira Bodnar 的创业者在 X 平台发了一篇名为《Claude 杀死所有创业公司》的帖子,迅速获得了超过 292 万次阅读。他两个月前刚做出一款帮企业自动管理谷歌和 Meta 广告账户的 AI 产品,付费客户几百个,成交率高达 70%,增长势头很好。

一天早上醒来,她发现成交率跌到了 20%。

原因很简单:Anthropic 同期推出了 Meta 广告连接器。功能还不完整,只能做分析、无法直接操作账户,但客户已经开始观望。Bodnar 在帖子里写道:「再过几个月它就能做到了,所以继续在这里开发感觉意义不大。」

IBM 失去的是估值,Bodnar 失去的是整个产品类别存在的理由。相比之下,更难被计算进股价、也更难被写进报告的,是那些正在消失的普通岗位。

股价跌了还能涨回来,但就业市场的变化,慢刀子割肉,却真实得多。当企业不再需要那么多人去堆砌工作量时,最先遭殃的,是那些还没上桌的年轻人。

斯坦福大学数字经济实验室的研究指出,在受 AI 影响最明显的职业里,22 至 25 岁年轻毕业生的就业率相对下降了 13%,但与此同时,那些有丰富经验的高级架构师,饭碗依然很稳。

这个分化说明 AI 没有像科幻电影里那样消灭所有人类岗位,只是只是悄悄从底部开始,把新人的岗位削没了——以前,刚毕业的程序员总是靠写写简单的基础代码、修修不痛不痒的 Bug,一步步攒经验往上爬。

现在,这些「脏活累活」全是 AI Agent 的统治区。

包括很多大厂现在很默契:我不大规模裁员,但如果有人辞职了,我绝对不再招新人,直接拿 AI 顶上空缺。

对此,学生的选择,已经说明了他们对市场的判断。麻省理工学院的数据显示,其入门编程课程在 2022 学年达到峰值后持续下滑,传统计算机科学专业注册人数从 823 人跌至 672 人,降幅超过 18%。

与此同时,MIT 2022 年新设的「人工智能与决策」专业,注册人数从 37 人暴增到 372 人,涨了约十倍。杜克大学的 CS 入门课注册人数同期下降约 20%,普林斯顿 CS 专业大三大四学生数量也出现了相似幅度的下滑。

同样是在 IBM 暴跌的同期,一篇由 Citrini Research 发布的博客《2028 年全球智能危机》在 X 平台上火了,收获了 2000 万+的阅读量。

作者假装站在 2028 年往回看,描绘的图景并不乐观。企业用 AI 裁人,省下来的钱继续买 AI,更强的 AI 让下一轮裁员成为可能,被裁的人消费变少,企业收入下滑,又得靠 AI 进一步压缩成本。

一圈又一圈,没有尽头。

作者自己也说,这只是一个思想实验,不是预言。但读完这篇文章再看当天的新闻,很难说它描述的东西完全是想象。SaaS 公司的订阅收入在压缩,IT 外包行业开始被质疑存在的必要,应届生找工作越来越难——传导链条的前几环,已经隐约可见。

国际货币基金组织估计,全球约四成就业都暴露在 AI 的影响范围之内,部分岗位会被增强,部分面临萎缩,最终走向取决于各行业的互补程度与政策应对。

世界经济论坛预测,到 2030 年新技术净创造的岗位约 7800 万个,但这个再分配的过程,必然伴随大量摩擦和痛苦。

我们总喜欢用颠覆、炸锅、王炸等耸人听闻的词汇来描述 AI 所带来的冲击,在我看来,这些词都用错了方向——AI 带来的变化,更像是涨潮。

涨潮不挑对象,不讲立场,不管你是 IBM 这样的百年巨头还是 Bodnar 这样的独立创业者,水平线统一往上走。有人站在高地,有人站在滩涂,退潮之后才知道谁在裸泳——问题是,这次潮水好像没有退的迹象。

MIT 的学生已经在悄悄换就业方向,大厂们同样在默默等人自然离职然后不再补招,Citrini 那篇文章的阅读量突破 2000 万,不是因为它写得多好,而是因为太多人在里面看到了自己隐约感觉到、但还没说出口的那种不安。

不安本身不是坏事。它至少说明,潮水还没把人完全淹没,还有时间想清楚自己站在哪里,又到底该如何在机器面前,找到自己那个没法被替代的位置。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


融资丨千寻智能完成近20亿融资

近日,具身智能头部企业千寻智能连续完成两轮融资近 20 亿元,为行业发展注入强劲动能。

本轮融资阵容堪称行业资本的集中亮相:云锋基金、某头部国资机构、混沌投资(葛卫东)、红杉中国等超一线机构重磅入局;Synstellation Capital、TCL创投、明荟投资(汇川技术董事长朱兴明家办)等产业资本协同加注;重庆产业投资母基金、杭州金投等国有资本鼎力支持;360基金、厚雪资本等战投机构共同参与,形成覆盖顶级资本、产业巨头、国有资本及战投大咖的全方位赋能格局。

值得关注的是,顺为资本、Prosperity7、达晨财智、柏睿资本、弘晖基金、华泰紫金、东方嘉富、千乘资本、广发信德等老股东全部选择继续大额认购,以持续加码的实际行动,彰显对公司技术路线与发展前景的坚定信心。

随着本轮融资的顺利落地,千寻智能估值一举突破百亿大关,正式跻身具身智能赛道 “百亿俱乐部” 核心成员,成为赛道发展史上具有标志性意义的事件,也标志着具身智能赛道产业化进程迈入新阶段。

资本风向标:20 亿融资背后的产业协同逻辑

在大模型重构数字世界后,人工智能向物理世界渗透的“具身化”浪潮,正成为全球科技产业的核心叙事。中国信息通信研究院数据显示,2025年国内具身智能领域融资总额已达735.43亿元,投资事件超740起,赛道热度持续攀升。然而,在资本涌入的同时,市场也在快速分化。从概念炒作到价值落地,真正具备技术护城河与产业场景穿透力的企业,正成为资本争抢的稀缺标的。

千寻智能本轮融资正是这一趋势的集中映照。这不仅仅是一次资金层面的加持,更是一次覆盖顶级资本、产业资本、国有资本与财务机构的“全生态集结”——顶级资本押注技术前瞻性,产业资本注入场景与产业链资源,国有资本提供长期稳定支撑。多元资本的集体站队,本质是对千寻智能综合实力的高度认可。

在产业资本的布局上,千寻智能是唯一一家吸引多元产业资本同时押注的具身智能创业公司,构建起具身智能赛道独有的“全场景生态”。从宁德时代、汇川技术、TCL等工业制造龙头,到京东、招商局创投代表的物流零售与金融基础设施,再到华为、小米两大消费电子巨头——产业股东已实现对实体经济核心赛道的跨界覆盖。

这意味着,千寻智能不仅是技术路线的引领者,更成为顶级产业资本共同青睐的稀缺标的。当具身智能的竞争从实验室走向产业纵深,千寻智能已凭借最广泛的产业股东布局,提前锁定了场景入口、数据来源与协同落地的战略优势,为规模化落地构筑起难以复制的核心竞争力。

模型与数据双壁垒:从 “任务执行” 到 “世界理解” 的核心支撑

2026年1月,千寻智能开源的Spirit v1.5模型,成为首个在性能上超越Pi0.5的中国开源模型。该模型具备强大的零样本泛化能力,无需新样本训练即可完成擦拭物体、操作铰链与柔性物体等复杂任务,展现出跨场景的高效执行能力。

这一突破的背后,是千寻智能在技术路径上的长期深耕。千寻智能联合创始人高阳表示:“我们坚持‘数据金字塔’训练理念,在预训练阶段没有走传统‘世界模型’预测每一帧的老路——那条路算力消耗巨大且效率不高。我们选择基于海量人类互联网视频进行预训练,在更少参数量下实现更好效果,显著降低算力成本。”

在数据采集层面高阳补充道:“我们通过自研设备将数据采集成本降低了90%,这才有了海量真实世界数据的规模化落地。正是这些技术能力的叠加,让Spirit v1.5成为全球首个性能超越Pi0.5的开源基座具身模型。”

千寻智能坚定以“多样性”为核心推进Scaling路线。截至目前,已累计获取超20万小时多类型真实交互数据,覆盖互联网视频、遥操作、可穿戴采集等维度,预计2026年总量将突破100万小时。自研的可穿戴式数采设备已迭代至第5代,将数据成本降至传统方式的1/10,为规模化采集扫清障碍。

更为关键的是,千寻提出反直觉观点:Dirty data is the key to scaling VLA models。通过在多样化“非完美数据”上的训练,团队发现了斜率更高的Scaling曲线——数据的多样性,远比“干净”本身更具价值。正是这套数据哲学,让千寻所聚焦的VLA技术路线与Google DeepMind、Pi等全球头部公司高度同频,印证了其技术布局的前瞻性。

团队与商业化:稀缺资产与 “能力输出” 模式

千寻智能在商业化落地方面实现强劲突破:全球首条人形具身智能产线已在宁德时代中州基地投运,小墨机器人成为产线核心设备,近千块电池实现零故障量产,作业节拍与熟练工人相当甚至更快,展现出对生产不确定性的毫秒级快速适应和超越人类的柔性操作能力。依托100%自研的全栈技术护城河与海量工艺数据积累,千寻智能不仅确立了行业壁垒,还将“能力输出”推向极致:从单纯卖硬件,转为输出感知、决策、执行的全栈能力,快速定制以适配不同产线并实现全球规模化复制,未来将覆盖多种电池类型与工艺环节,彻底重塑新能源制造的商业边界。

在商用领域,与京东的合作进一步拓展了这一边界。墨子机器人在京东零售场景中替代人类进行讲解互动与产品操作演示,双方正共同探索京东云及Joyinside大模型在大型零售网络中的落地潜力,实现技术研发与应用场景的双向赋能。

商业化成果的背后,是千寻智能在核心能力上的深厚积淀。行业共识是:具身智能的竞争,本质是顶级模型团队的竞争。而千寻智能拥有一支被称为“不可复制的AI梦之队”——成员多来自UC Berkeley、清华、北大等顶尖学府,平均年龄不到30岁,却已在多模态大模型、机器人学、强化学习、模仿学习等具身模型核心领域拥有深厚的学术与工程基因。不仅在国际开源社区持续输出核心成果,更具备打通“模型-算法-硬件”的全链路能力。正是这支年轻而稀缺的团队,撑起了Spirit v1.5超越Pi0.5的技术底气。投资人曾评价:“千寻的团队,对标的是Pi、Google DeepMind那一梯队的配置。”

云锋基金执行董事董怀谨表示:“专属物理世界的AI大脑是具身智能实现跃迁的重要前提,而穿越周期的核心壁垒来自于技术对生产力的实际创造。高阳作为新一代具身智能科学家,牵头打造AI基础模型与自研核心设备,高效高质地推动「多样数据—基础模型—真实场景」的飞轮升级,并基于软硬一体全栈能力在实际产业场景中迭代闭环。期待千寻智能持续深耕Physical AI 基础模型,以技术底座驱动产业场景规模化落地与协同价值释放。”

顺为资本合伙人耿益璇表示:“顺为长期关注AI与硬科技的交叉创新,千寻智能是我们在这个方向上最早发掘、且连续多轮加注的核心项目。团队兼具顶尖学术底蕴与产业实战基因,更难能可贵的是,他们从一开始就选择了一条‘难而正确’的路——用‘数据金字塔’理念构建壁垒,用低成本采集破解行业数据瓶颈。正是这种务实的创新路径,让千寻率先跑通了‘场景反哺模型’的正向循环。我们坚信,这支年轻的梦之队有望成为定义下一代具身智能的中坚力量。”

本轮融资后,千寻智能将持续加大具身基础模型与真实数据体系投入,深化产业生态共建。从任务级智能到通用具身模型,从仿真到真实世界驱动,具身智能正进入技术产业化关键阶段。行业观察人士指出,当机器真正具备物理世界理解能力,人机协作、生产流程乃至社会运行效率都将迎来深刻变革,以千寻智能为代表的企业正成为这场变革的重要起点。

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

刚刚,OpenAI 硬件全家桶曝光!智能音箱内置摄像头+刷脸购物,ChatGPT 要住进你家了

作者 莫崇宇
2026年2月21日 17:00

据 The Information 爆料,OpenAI 正在开发一款智能音箱,它将配备摄像头,支持类似苹果 Face ID 的人脸识别。你未来可能「看一眼」就能完成购物支付,类似功能目前在小米 Rokid 等智能眼镜已经实现。

在苹果、Meta 都在把 AI 塞进眼镜、手表、吊坠等可穿戴设备时,OpenAI 尝试把摄像头塞进了音箱,能「看见」你和周遭的环境,AI 对你的理解也将从语言延伸到行为,你的作息、习惯、情绪状态,都将让 AI 读懂和拼凑出一个真实的你。

▲产品假想图,由 Nano Banana Pro 生成

APPSO 先给你快速梳理下 OpenAI 智能音箱的核心信息

  • 定价:200-300 美元(约 1450-2200 元人民币)
  • 发售时间:最早 2027 年 2 月
  • 核心功能:摄像头环境感知、Face ID 级人脸识别、语音购物
  • 设计团队:Jony Ive 的 LoveFrom + OpenAI 硬件团队
  • 产品矩阵:智能音箱首发,智能眼镜、智能灯后续跟进

「长眼」的智能音箱,你敢用吗

智能音箱这个品类,从 Amazon Echo 到 Apple HomePod,已经卷了快十年。但这些设备的「智能」,往往停留在「能听懂关键词」的层面,离真正的「理解」差着十万八千里。

OpenAI 的解法简单粗暴:给它装上眼睛。

智能音箱内置摄像头,能识别你周边环境,比如桌上摆了什么、旁边在聊什么。还支持类似 Face ID 的面部识别,可以直接刷脸完成购买。这种「所见即所得」的购物体验,目前市面上的智能音箱还做不到,

结合 ChatGPT 去年上线的购物功能——用户可以在对话框里完成从选品到跳转下单的完整流程,这个刷脸购买功能将有望直接服务于「AI 即购物入口」的闭环,成为消费决策链条上的第一道关口。

如无意外,这也将对现有流量分发逻辑造成重大的挑战:Google 靠搜索吃了二十年广告红利,电商平台靠货架逻辑构建起庞大生态,而 OpenAI 想在这两者之前再插入一个新的决策层级。

此外,这款智能音箱还能通过持续的视觉观察判断用户状态——比如发现你在重要会议前夜还在熬夜,会主动提醒你去早点睡。这样一来智能音箱的定位,就从一个智能家居产品,变成了一个 AI 管家中枢。

不过,这种全天候的数据采集,隐私边界在哪里,或许有待 OpenAI 正式发布时给出答案。

想要买到这款产品,还要等一段时间。首款设备最早也要到 2027 年 2 月才能发货。眼镜等其他产品更慢,预计 2028 年才能大规模量产,至于那个智能台灯,原型机有了,但到底会不会发布,还是个未知数。

「含果量」十足的 OpenAI 硬件团队

OpenAI 的硬件野心,从团队规模就能看出来,整整 200 人,而且还在疯狂扩张。其中更令人期待的是,前苹果首席设计官 Jony Ive ,亲自为 OpenAI 操刀产品设计。

这支团队的「含果量」极高,团队由副总裁 Peter Welinder 领导,他此前负责 OpenAI 的新产品探索团队。核心成员包括:

  •  Tang Tan:苹果 25 年老将,曾任 iPhone 和 Apple Watch 产品设计主管,直接向苹果硬件主管 John Ternus 汇报,被认为是把 Jony Ive 的设计理念转化为大规模可制造产品的关键人物
  • Evans Hankey:苹果前工业设计负责人,曾接替 Jony Ive 执掌苹果设计团队,现为 OpenAI 工业设计负责人
  • Scott Cannon:供应链负责人
  • Adam Cue:苹果服务主管 Eddy Cue 之子,负责开发驱动 OpenAI 未来设备的软件
  • Ben Newhouse:产品研究负责人,正致力于重写 OpenAI 的基础设施以适应音频 AI
  • Atty Eleti:负责设备隐私相关工程工作

虽然 Jony Ive 并未直接加入 OpenAI,但他对设计拥有最终决定权,据说每周都会出现在旧金山市中心的办公室。有员工透露,团队讨论时经常会说「Jony 会想要什么」。

然而 Jony Ive 和 OpenAI 的合作并非一帆风顺。据两位知情人士透露,一些 OpenAI 员工抱怨 LoveFrom 修改设计的速度缓慢,且很少分享其构思新设计的流程。这种保密作风和对设计的极致追求,是苹果公司的典型做法——而该团队的许多员工和领导层都来自那里。

为了保持这种运作方式,OpenAI 的设备团队与公司其他部门是分开的。虽然 OpenAI 总部位于米申湾,但设备团队在旧金山市中心杰克逊广场附近的一间办公室办公,离 LoveFrom 的办公室不远。

OpenAI 挖人的手段也很「简单粗暴」——直接用超过 100 万美元的股票期权砸人,薪酬远超苹果标准。据 The Information 报道,OpenAI 今年已经从苹果挖走了 20 多位硬件大牛,而 2023 年这个数字几乎为零。

苹果显然坐不住了。据知情人士透露,苹果去年曾突然取消了原定在中国举行的年度闭门会议——这个会议通常由高管向员工介绍未来产品计划。取消的原因竟然是:「防止更多高管跳槽到 OpenAI」。

内部怎么拧,是执行的事。但有一件事,从一开始就没有悬念——OpenAI 必须做硬件。

软件端 200 亿美元的年收入,已经证明了 AI 是一门好生意,但要让 AI 真正成为水电煤一样的基础设施,必须有一个物理入口。手机这条路走不通——苹果的生态护城河不是一款 AI 新品轻易能够撬动的,其它手机厂商自己也在全力 AI 化,不会将大好的硬件阵地拱手相让。

当然,更根本的问题是,手机的形态本身,可能就不适合做 AI 的宿主。

当 AI 足够聪明时,它不应该被禁锢在一块长方形的玻璃屏幕里,它应该是无处不在的。因此,从音箱、眼镜甚至台灯这些陪伴感更强的品类切入,是 OpenAI唯一,也是最合理的选择。而这一切,或许从 ChatGPT 的产品设计方向上就已经埋下了伏笔。

与 Anthropic 这类深耕企业服务的 AI 公司不同,OpenAI 从一开始就带着强烈的 ToC 基因——ChatGPT 不只是一个工具,它有情绪、有记忆、会共情,Sam Altman 一直在让它变得更像一个「人」。

这背后的逻辑,如今看来相当清晰:一个冷冰冰的 AI 助手,你不会想把它放在卧室里;但一个懂你、记得你习惯、会关心你睡没睡好的 AI,才有资格住进你的生活。

OpenAI 的硬件版图浮出水面

智能音箱只是 OpenAI 硬件全家桶的其中一个,此前 OpenAI 已经被曝出在开发智能眼镜、智能灯、甚至可穿戴别针等多种形态。其中智能眼镜可能要等到 2028 年才能量产——这个时间点,恰好和苹果传闻中的 AI 眼镜撞期。

OpenAI 硬件产品线(APPSO 据曝光信息整理)

  • 智能音箱(代号未知):首款产品,200-300 美元,2027 年 2 月出货
  • AI 耳机(代号 Dime/「甜豌豆」):金属鹅卵石造型,胶囊状耳机置于耳后,2nm 芯片
  • 智能眼镜:2028 年量产,与 Meta Ray-Ban、苹果 N50 正面竞争
  • 智能灯:原型已准备,是否发布待定
  • AI 笔:Sam Altman 多次暗示的「口袋设备」

值得注意的是,OpenAI 的硬件策略似乎经历了调整。此前传闻的 AI 耳机项目「Dime」(甜豌豆),原计划是一款「类手机」全能设备,搭载 2nm 智能手机级芯片。但由于 HBM 内存短缺导致成本过高,OpenAI 被迫调整策略——先推纯音频功能的「阉割版」,等成本下降后再发高配版。

这种「先占坑、后完善」的策略,在硬件圈并不罕见。对 OpenAI 来说,也没有苹果的包袱,不需要将产品打磨到完美才推出市场,即便首款产品不够惊艳,这也是 AI 行业发布产品的一贯风格。

此外 OpenAI 不止挖苹果的人,也盯上了苹果花了几十年打造的供应链。

据知情人士透露,中国主要的 iPhone 和 AirPods 代工厂立讯精密已经拿下了至少一款 OpenAI 设备的组装合同,而负责组装 AirPods、HomePod 以及 Apple Watch 的歌尔股份也在跟 OpenAI 接洽,为未来产品提供扬声器模组等零部件。

Sam Altman 曾在一次采访里提到 OpenAI 硬件的愿景:「智能手机是时代广场,信息轰炸、注意力粉碎。OpenAI 要做的,是一间『湖畔小屋』——让你在需要专注时,能关上门,屏蔽噪音。」

他的核心逻辑在于,AI 硬件不是要取代手机,而是要填补「不方便掏手机」或「需要深度专注」的场景。从这个角度看,智能音箱、AI 笔这类「放在桌上不突兀」的设备,确实比 24 小时佩戴的 AI 吊坠更友好。

但愿景归愿景,现实很骨感。OpenAI 不是第一家想用 AI 硬件重新定义人机交互的公司。Human Pin、Rabbit R1、Friend AI 吊坠……这些「网红 AI 硬件」的销量也都不尽如人意。

此前很多 AI 硬件往往解决的是「伪需求」——它们能做的,手机基本都能做,而且手机做得更好。要改变消费者习惯了近二十年的屏幕交互,接受一个「看不见摸不着」的 AI 助手,挑战不小。

OpenAI 要面对的,不只是市场教育难题,还有巨头的围剿。

据彭博社记者 Mark Gurman 爆料,苹果正在加速推进三款全新的 AI 可穿戴设备:智能眼镜 N50、可穿戴吊坠、摄像头 AirPods,都围绕 Siri 数字助手构建,通过摄像头获取视觉上下文来执行各种操作。

2026 对于 OpenAI 来说,无论是大模型 AI 产品,还是新兴的硬件产品,都会面临一个超级内卷的竞争环境。

即便如此 OpenAI 依然可能给 AI 硬件行业带来一些变化,甚至是分水岭。

它有最豪华的苹果班底、最激进的产品定义、以及 ChatGPT 这个全球份额第一的 AI 产品。但 OpenAI 也面临着所有 AI 硬件共同的困境:如何证明 AI +硬件给体验带来了质的变化,而非只是让产品卖得更贵的又一个理由。

作者:李超凡、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,Gemini 3.1 Pro 发布!清华姚顺宇站台宣传,Karpathy:应用商店的时代结束了

作者 莫崇宇
2026年2月20日 07:04

刚在印度 AI 峰会上经历了最尴尬的一幕,Google CEO Sundar Pichai 转头就在今天凌晨官宣了最新模型 Gemini 3.1 Pro。

时机选得,相当精准(doge)。

▲OpenAI CEO 和 Anthropic CEO 在合影时拒绝握手,而是高举拳头。

虽然距离上周 Gemini 3 Deep Think 的更新没几天,但 3.1 Pro 的定位,Google 说得很清楚——专为那些「一个简单答案远远不够」的任务而设计,是解决复杂问题的基础底座。

按惯例,0.1 的版本号更新通常意味着小修小补,然而,在测试模型解决全新逻辑模式能力的 ARC-AGI-2 基准上,3.1 Pro 拿下 77.1%,是上代 3 Pro(31.1%)的两倍多,同时压过了 Anthropic 的 Opus 4.6(68.8%)和 OpenAI 的 GPT-5.2(52.9%)。

其它方面,科学知识测试 GPQA Diamond 拿了 94.3%,智能体类基准 MCP Atlas 和 BrowseComp 分别拿下 69.2% 和 85.9%。

编程能力方面,竞争性编程基准 LiveCodeBench Pro 的 Elo 评分达到 2887,超过 3 Pro 的 2439 和 GPT-5.2 的 2393。SWE-Bench Verified 上,3.1 Pro 拿了 80.6%,和 Opus 4.6 的 80.8% 基本打平。

当然,3.1 Pro 也不是处处碾压。

多模态基准 MMMU Pro 上,上代 3 Pro 反而略胜(81.0% vs 80.5%);启用工具支持的 Humanity’s Last Exam 里,Opus 4.6 以 53.1% 拿了第一。外界长期批评 Google 工具使用效率不如对手,这次还是没能完全堵上嘴。

第三方知名分析机构 Artificial Analysis 则给出了相当实在的评价。

3.1 Pro 在他们的智能指数里排名第一,比 Opus 4.6 高 4 分;整个测试跑下来总计使用约 5700 万 tokens,完成测试的成本不到 Opus 4.6 的一半。能打又省钱,这个组合还是很香的。

Google DeepMind 首席科学家 Jeff Dean 也转发了一个是用 3.1 Pro 模拟城市规划、设计全新城市的应用,从零生成可交互的规划界面 demo。

Google 官方博客则展示了几个更日常的方向。代码动画方面,3.1 Pro 可以直接根据文字提示生成动态 SVG,因为是纯代码生成而非像素,任意缩放都不失真,文件体积也远小于传统视频。

复杂系统方面,模型直接接入公开遥测数据流,搭出了一个实时追踪国际空间站轨道的航天仪表盘。

更有意思的是两个创意类 demo。

一个是 3D 椋鸟群模拟,不只是生成视觉代码,还支持用手势操控鸟群,并配有随鸟群动态变化的生成音乐;

另一个是把《呼啸山庄》的文学氛围转化成一个现代个人网站,模型没有简单概括情节,而是分析了小说的整体基调,设计出了贴合主人公气质的界面风格。

此外,网友们也贡献了不少精彩的案例。有人让 3.1 Pro 生成一个「鬼怪猎人穿越鬼屋」的动态 SVG 循环动画,结果直接看呆,评价是「Google 这次是认真的」。

还有网友认为让它生成种子破土、根系延伸、茎秆冒出、叶片展开、直到长成完整大树的交互动画,每个生长阶段的过渡都顺滑自然,说这是见过最好的同类效果。

去年从 Anthropic 转投 Google DeepMind 的清华物理系特奖得主姚顺宇也站台宣传:「Gemini 不仅是一个优秀的模型,而且更好的模型正以不可阻挡的方式到来。」

当然,这些 demo 加在一起说的是同一件事:模型能做的事,已经从单纯的回答问题延伸到完成一整套专业或创意工作流了。
价格方面,API 按分级付费,整体和上代 3 Pro 保持一致,但跟 Anthropic Opus 系列比还是相对便宜的。

20 万 tokens 以内,输入 2 美元 / 每百万 tokens,输出 12 美元;超过 20 万 tokens,输入涨到 4 美元,输出 18 美元。搜索功能每月前 5000 次免费,之后每 1000 次查询收费 14 美元。

现在,开发者可以在 AI Studio、Gemini API、Gemini CLI、智能体开发平台 Google Antigravity 以及 Android Studio;企业用户在 Vertex AI 和 Gemini Enterprise;普通用户在 Gemini 应用和 NotebookLM 都能用,后者仅限 Pro 和 Ultra 订阅。

值得注意的是,3.1 Pro 目前只是预览版,Google 大概率是要继续打磨好智能体工作流再推正式版,向外界展示出一副还没使全力的姿态。

至于这种能力渗透到个人层面会发生什么,这让我联想到了 OpenAI 联创 Andrej Karpathy 刚刚发布的推文:

他想用 8 周时间把静息心率从 50 降到 45,计划是设定 Zone 2 有氧总时长目标,配合每周一次 HIIT。为了追踪进展,他花了 1 小时用 vibe coding 做了一个专属仪表盘。

过程比想象中麻烦,Claude 需要对 Woodway 跑步机的云 API 进行逆向工程,提取原始数据,处理筛选,搭出 Web 前端界面,中间还有公制英制单位混用、日历日期对不上这些 bug 需要手动发现并要求修复。

Karpathy 的感叹很犀利,两年前这事得花 10 小时,现在 1 小时。但他更在意的是:这本来应该只需要 1 分钟。
他的判断是,应用商店模式正在过时。

300 行代码、LLM 几秒生成的专属工具,没必要变成一个正经 App 让你去搜索下载。他同时也点了行业的问题:99% 的产品仍然没有 AI 原生的 CLI,还在维护给人看的前端界面,而不是直接提供便于 Agent 调用的 API。

Woodway 跑步机本质上就是个传感器,结果还得让 LLM 去逆向工程它,完全没必要。

把 Jeff Dean 的城市规划 demo 和 Karpathy 的跑步仪表盘放在一起看,其实是同一件事的两面。当普通人花 1 小时就能为自己做一个高度定制的专属工具,由 AI 原生传感器和执行器构成、LLM 负责编排、即兴生成高度定制专属应用的时代,就已经近在眼前了。

附官方博客:
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


传奇掌舵人今日退休,Xbox 正式「死去」

作者 苏伟鸿
2026年2月21日 18:52

动荡了几年的微软游戏业务,今天又迎来巨大人事变动。

在 Xbox 诞生之初就已经加入团队,掌舵 Xbox 长达 12 年的传奇高管菲尔 · 斯宾塞(Phil Spencer),今天宣布退休,即将离开微软。

他亲眼见证 Xbox 的诞生,在低谷时刻出手拉了它一把,最终又在时代转向之际,选择「亲手」为传统主机时代画上句号。

从狂热玩家,到 Xbox 掌舵人

对于全世界的玩家来说,菲尔 · 斯宾塞这个名字恐怕不会陌生,甚至还有几分亲切,在粉丝眼中,他几乎就是 Xbox 品牌的「吉祥物」。

1968 年,菲尔 · 斯宾塞在美国华盛顿州出生。对于有点内向的他来说,电子游戏很早就成为了生活的一部分。

在华盛顿大学读书的时候,斯宾塞遇到了自己的第一款「人生游戏」——《机器人 2084》(Robotron 2084)。他在学校附近的 7-11 便利店街机上度过了无数个夜晚,也因此接触到了古早的电子游戏社区。

很快他也意识到,游戏不仅属于朋友之间。他和父亲经常一起玩  Commodore 64 上的「One-on-One」篮球游戏,这也是他第一次和家人一起玩游戏。

▲ 图源:YouTube@Polaventris

1988 年,距离 Xbox 诞生还有 13 年,刚满 20 岁的斯宾塞加入了微软。虽然他一开始担任的是技术岗位,但除了写代码还做过项目管理、商务协调等等,工作经验相当多元。

即使工作很忙,斯宾塞并没有放弃对游戏的热爱。很快同事也发现了身边有这么一号「游戏狂人」,不仅在办公室打《网络创世纪》——斯宾塞甚至是这款游戏的「测试服」玩家,他还经常出没于街头的街机厅。

▲ 《网络创世纪》

2001 年,为了抵御 PlayStation 2 在游戏和多媒体上的冲击,微软推出 Xbox 主机。作为一名知名游戏发烧友,斯宾塞很快也被调往 Xbox 部门,担任微软游戏工作室 EMEA(欧洲、中东和非洲)总经理,负责和游戏工作室,例如 RARE、狮头的合作。

Xbox 360 时代,他开始整合内容资源,在微软内部推动自有 IP 与工作室的长期布局,《战争机器》《光环》等经典第一方系列,都是他推动的项目。

▲ 《战争机器》限定版 Xbox 360

其实从这些早年的工作方向可以看出,比起 Xbox 硬件,斯宾塞的工作重心放在了 Xbox 的游戏内容和软件服务,这样的取向在他 2014 年正式接手 Xbox 部门后,彻底影响了这个品牌的走向。

Xbox One 发布后,由于强调多媒体消费而非游戏,遭到了玩家的强烈不满。2014 年,斯宾塞临危受命出任 Xbox 掌门人,上任第一件事就是将焦点拉回「游戏」:取消强制联网、推动 Xbox 兼容计划,并进一步加强培养第一方工作室。

与此同时,斯宾塞也萌生了对游戏租赁服务的构思。

彼时,影视流媒体 Netflix、音乐流媒体 Spotify 开始崭露头角,微软也正在不断加强云服务的战略,斯宾塞和 Xbox 部门决定将游戏租赁服务转向订阅模式。

2017 年 6 月,Xbox Game Pass 正式问世,允许用户通过云端下载和游玩游戏,例如 Windows、iOS、Android,而不仅限于 Xbox 主机,整个 Xbox 品牌开始了战略转型。

除此之外,斯宾塞还主导了 2020 年对 Bethesda 以及 2023 年对动视暴雪的收购。后者成为了游戏史上规模最大的收购之一,也让微软的内容储备空前强大。2022 年,Xbox、Bethesda、动视、暴雪、King 等相关业务正式组合并升格为「微软游戏」Microsoft Gaming,斯宾塞出任 CEO。

但斯宾塞并没能带领微软游戏业务再创辉煌。这两年,微软不断传来关闭工作室、裁员的消息。在今年 1 月份的财报中,整个 Xbox 部门营收同比下降 9%,硬件业务同比下滑 32%。

在索尼 PlayStaion 5 和任天堂 Switch 销量都破亿的情况下,同一世代的 Xbox Series S|X 销量预估不足 3000 万,是微软销量表现最差的游戏机。

▲ 斯宾塞和 Xbox Series S|X

而 Xbox Game Pass 已经成为了 Xbox 业务的收入支柱。在 2025 财年,XGP 创造了 50 亿美元的收入。只是成本和开支不断增大,微软也不得不调整 XGP 的费用和产品组合。1 月财报显示,Xbox 游戏订阅收入下降了 5%。

与此同时,微软却对 Xbox 的盈利能力提出了 30% 利润率的高要求,作为对比,近几年 Xbox 的利润率在 10% 到 20% 之间浮动。

不管怎么看,Xbox 又来到了一个低谷时刻,只是上一次扶大厦之将倾的人,这次选择了离开。

斯宾塞将会持续担任顾问直到今年夏季。至于 38 年的微软和 Xbox 之旅后,这位游戏迷人生的下一道「关卡」在何方,还尚未可知。

AI 出身的接班人

对于外界来说,斯宾塞选择在这个时间点退休,多少有点始料未及:去年夏天微软才说完「斯宾塞短期内不会离职」,也有爆料称斯宾塞至少会留任到下一代 Xbox 发布。

更耐人寻味的是,原本被业内视作斯宾塞「接班人」的 Xbox 总裁 Sarah Bond,也在同一时间宣布辞职,即将离开微软。

在宣布辞职前 3 个小时,Bond 还在领英上发布了和工作相关的动态,征求大家对 Xbox 无障碍功能的意见,说明离职很可能是一次临时决定。

接棒斯宾塞成为微软游戏 CEO 的,则是一个大部分玩家此前都未曾听过的名字——Asha Sharma。

接手游戏部门之前,Asha Sharma 主要负责 AI 业务,担任微软 CoreAI 产品总裁,也在 Meta 出任过领导岗位。纵观她的履历,微软游戏业务 CEO 是她第一个和「游戏」有关的职务。

比起知道游戏哪里好玩,这位高管更擅长将 AI 深度集成至开发流程,优化整个开发进程提升效率。

在首条备忘录中,Sharma 表示自己的第一项任务就是:了解 Xbox 业务的运作原理,并保护它。

除了承诺不会让「没有灵魂的 AI 泔水(AI Slop)」进入 Xbox 游戏中,Sharma 还强调,自己将致力于「Xbox 的回归」。

她还提拔了此前执掌 Xbox 游戏工作室的 Matt Booty, 他将成为微软游戏的执行副总裁和首席内容官,将负责进一步整合游戏内容。

▲ 左:Asha Sharma,右: Matt Booty

和本身就是一名狂热玩家的斯宾塞对比,Sharma 连是不是玩家都要打一个问号,这样的落差自然引来了玩家们的质疑和担忧,主机文化的那种认同感也会松动。

当然,这也不代表 Xbox 品牌的末日到来,主管不是玩家,不代表她做不好游戏业务。任天堂传奇社长山内溥本人也不玩电子游戏,但在他的带领下,任天堂从卖纸牌的玩具公司,摇身一变电子游戏世界的霸主。

这位 AI 主管入主 Xbox,说不定也能为这个危机四伏的业务,注入全新的血液。

Xbox 会回归,但回归的已不是「Xbox」

在斯宾塞的带领下,「Xbox」整个品牌已经彻底转型,从传统围绕主机硬件构建生态,变成通过云服务让生态无处不在。

作为 Xbox 护城河的《光环》系列,将于今年正式登陆索尼 PS 平台,已经意味着微软彻底放弃主机大战那种竞争模式,让更多人玩上游戏更重要。

比起销量平平的 Xbox Series X|S 主机,微软屡次肯定商业价值的游戏订阅服务 Xbox Game Pass,才明显是这几年 Xbox 品牌的「旗舰产品」。

这种前提下诞生的次世代 Xbox,自然也会有所不同。

不管是多个媒体爆料,还是微软官方多重暗示,我们几乎可以确信,下一代 Xbox 主机和掌机,会更接近一台 Windows PC,不仅兼容 Xbox 生态,也能和 PC 一样使用 Steam、Epic 等第三方游戏商店。

微软 CEO Satya Nadella 在一场访谈中透露:

人们认为主机和 PC 是两种不同的东西,这有点好笑。我们打造游戏主机是因为想要制造一台性能更好的 PC,以便可以进行游戏,所以我想重新审视一些传统观念……游戏主机会提供强大的的性能,我认为也会推动系统的发展。

微软和华硕合作的 ROG Xbox Ally 掌机,完全可以看作是一台未来 Xbox 的雏形——运行完整的 Windows 11 系统,使用 Xbox 全屏界面覆盖,只启动必要的系统进程,确保硬件能释放出更多性能。

这也意味着,所谓的「Xbox 硬件」不会只是微软独家产品,更多 OEM 厂商可以取得授权,打造自己的 Xbox 主机或掌机,就像 PC 产品一样。

对比索尼、任天堂这些对手,跳出硬件拘束,平台更广阔的微软,更能把 Xbox 整合成「服务 + 品牌 + 内容」的产品形态,这在游戏行业也是非常少见的。

AI、云计算设施上的布局,也是微软这家科技企业独有的优势。一月份,Google DeepMind 发布了三代视觉语言模型 Genie 3,其快速生成可交互 3D 世界的能力,让游戏引擎巨头 Unity,以及Take-Two、任天堂、CD Projekt Red 等制作商股价应声下跌,直观反映了 AI 对于传统游戏制作的冲击之大。

▲ Genie 3 生成的游戏场景

选择一位熟悉 AI 的高管出任 Xbox 掌门人,释放的信号已经不能再明显:在这个「AI 改变万物」时代,微软也有意用 AI 来改变传统游戏的创作方式。

▲ Asha Sharma 和菲尔 · 斯宾塞

这不意味着 AI 就要取代传统的人类开发游戏,AI 只是一种手段和技术,决定游戏灵魂的还是人类的创意和想法,而刚好,微软手里同样也有着不少大名鼎鼎的游戏开发者资源。

回到传统的「游戏大战」视角,比起任天堂索尼,Xbox 的处境当然相对较差,面临的压力也巨大,但背靠科技公司的微软,反而手上能整合的资源最多。

对于那些原教旨主义的玩家和 Xbox 粉丝来说,很可惜,曾经纯粹的主机和游戏品牌「Xbox」,甚至在菲尔 · 斯宾塞离开之前,就已经「死去」。

但对于微软,以及整个 AI 时代来说,一个崭新的 Xbox,正在诞生。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


1000 块/年的输入法,我用它习惯了「口喷」,再也回不去打字了 | AI 器物志

作者 苏伟鸿
2026年2月21日 18:34

编者按:
当 AI 开始寻找自己的形状,有些选择出人意料。
AI 在智能手机上生出了一颗独立按键,似乎让智能手机找回了久违的进化动力。眼镜凭借着视觉和听觉的天然入口,隐隐有了下一代个人终端的影子。一些小而专注的设备,在某些瞬间似乎比 All in one 的设备更为可靠。与此同时,那些寄望一次性替代手机的激进尝试,却遭遇了现实的冷遇。
技术的落地,从来不只是功能的堆叠,更关乎人的习惯、场景的契合,以及对「好用」的重新定义。
爱范儿推出「AI 器物志」栏目,想和你一起观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?

我很难用熟悉的软件分类去安放 Typeless。

它跟传统输入法格格不入——界面里几乎看不到键盘,最显眼的是一个语音按钮。它也跟那些自称「AI 加持」的输入法不太像,那些产品总喜欢把功能铺满首页,Typeless 的功能反而少得可怜,像是故意把选择题删成了一道填空题。

这份不合群带来一个关键词:越界。

输入法原本服务人与人沟通,目标清晰——打字更快,选词更准。Typeless 把边界往外推了一步,它更在意把自然语言说出的需求梳理得井井有条。它把语言提炼成想法,或者说,它从一段话里捞出真正的意图,再把意图写成一段能直接用的文字。

输入的对象变了。不只是写给人,更多是写给模型。

一款会思考的输入法

我第一次意识到它「会思考」,是在最普通的口述里。

说话时会绕,会补充,会重复,也会用很多填充词。Typeless 的输出更像想清楚之后才落笔的版本——句子更短,信息更集中,语气更收敛。它不执着把说过的每一个音节都留下来,更在意到底想表达什么。

▲ 口述内容被 Typeless 转写后

临时改主意时,差异更明显。传统听写会把自我修正一股脑堆在屏幕上,留下许多中间态。Typeless 更像把中间态折起来,只把最后那个「定稿」留下。屏幕上出现的不是过程,是结果。

需要把一段想法拆成条目时,用普通输入法得先说完再自己排版。Typeless 往往会主动把结构摆出来,逻辑顺序更清楚,段落边界更干净。它像是随手把笔记整理了一遍。

「边说边改」是另一种用法。说完一段话,接着补一句改写要求——更克制、更正式、更短,或者把语气改成邮件——它会在原文上直接调整。不需要停下来选字、删句、重写开头,只要继续说出修改意图。

翻译也是高频场景。需要中英来回切换时,它把翻译变成输入动作的一部分。更省心的是语气处理,它不会把句子翻得像说明书,整体更接近日常沟通。

在办公室或通勤场景里不方便大声说话?它提供了小声输入一类的模式。语音输入过去常被「场合」限制,这类适配决定了它能不能真的用起来,而不是只在安静房间里表现良好。

常用表达也能做成快捷方式——一段固定格式的确认信息,一段常用的工作回复。Typeless 更像把这些东西做成可调用的块,减少重复劳动。输入法从「敲字」变成「调度」。

这些体验汇总到一个点上:Typeless 一直在 Thinking。它把杂乱的口语消化掉,再把更有条理的文字吐出来。它不追求完整复刻说话的全过程,它在整理真正的想法。

这是它最不一样的地方。

AI 器物的新物种

在讨论 AI 产品时,我们更习惯看到的是软硬结合的新尝试——智能眼镜、AI 耳机、豆包手机,它们在新场景里重新定义硬件的形态和交互方式。Typeless 走的是另一条路。

它是纯软件工具,但本质上仍然是硬件的延伸。

从打字机到键盘,再到输入法,这条线索一直存在。打字机把手写变成了机械敲击,键盘把机械敲击变成了电信号,输入法把电信号变成了字符选择。每一次演进,都是在人与文字之间增加一层更高效的转译机制。

Typeless 延续了这个逻辑,但加入了一个新元素——AI 不再只是辅助选字或纠错,它成为输入链路的核心。

传统输入法关心的是「把字打出来」,效率体现在敲击次数、选词准确率、响应速度。到了模型时代,真正消耗时间的往往不是第一次把需求说清楚,而是后续的反复修改。一次改动里夹着大量细节——语气、结构、删改尺度、信息顺序,每一项都需要来回拉扯。人工沟通的成本会在这一步迅速膨胀。

Typeless 解决的就是这段拉扯。

它让「说一句—改一下—再说一句—再改一下」变得顺滑,五到十分钟内把十轮调整连续做完。每一轮都能直接看到结果,马上继续下一轮。输入不再以「把字符敲完」为终点,而是以「文本进入可继续加工的状态」为终点。

这里出现了一个新的「精准输入」。

打字机和键盘诞生时,精准指向的是某个字、某句话。AI 时代的输入变长了,上下文变厚了,沟通频次也变高了。现在的精准更像针对一段超长上下文的控制:按想要的方式分段,或者连写;把某一句压短,或者把某一段扩写;要求它不要分点,或者把逻辑拆成几条。

控制对象变了,输入法的职责也随之变化。

这也是「给 AI 用的输入法」的含义。

▲ Prompt 由 Typeless 转写而成

Typeless 的重点不在社交表达的情绪张力,它更适合把需求交给模型,再把模型产出收拢成能用的文本。它强化的是人与 AI 的沟通效率。商业模式也很符合这种取向——界面极简,没有广告位,付费方式更像「为结果付费」。订阅用户不限量,非订阅用户每周有固定额度。产品用得越多,价值越容易被衡量。

把它放回国内输入法的语境,对比会更清晰。

老派输入法以搜狗为代表,今天也能加上「AI」二字,也能提供一堆 AI 功能。但它依旧像原来的产品——键盘还在,广告和功能标签也还在。输入法被迫承担太多与输入无关的任务,效率容易被稀释。

▲ 搜狗 AI 输入法

另一类是 AI 工具的延伸,比如豆包或微信输入法,它们更像把既有的 AI 能力塞进键盘里,做成一个入口。入口当然有用,但入口并不等于工具。入口解决的是「去哪里用 AI」,Typeless 更关心「怎样把 AI 用得更精确」。

▲ 左边为豆包输入法听写,右边为 Typeless 听写

真正的 AI 输入法,服务的对象变了。它主要服务与模型的高频沟通,服务长上下文里的精确控制,服务反复修改直到结果落地。它不需要把自己做成一个热闹的广场,它只要把那条最难的链路打通。

它也有副作用。用它跟同事沟通时,偶尔会显得过于干净,像把语气里的缓冲都删掉了。对方会觉得不够有人味。会在这种场景里切回普通输入法,手动敲几句更口语的句子,补一个表情,或者加一段无意义的笑声。这不是 Typeless 的问题,而是它的真实位置——它最自然的场景是与 AI 沟通,不是与人闲聊。

▲ 给同事发显得有点「人机」感

输入法向来是残酷的赛道。到处都能用,也意味着到处都会被挑剔。每一次卡顿、每一次误判、每一次隐私疑虑,都会直接影响它能否留下来。Typeless 要证明的不是「模型有多强」,而是「日常输入是否真的变快、变准、变省心」。

当人与 AI 的沟通变得日常,输入法可能会成为最隐蔽、也最核心的接口。它要做的不是替用户写完一切,而是把说出的信息整理成更可控、更可迭代的文本,让「多轮修改」从一种负担变成一种自然动作。

这类产品最终能不能站住脚,取决于两件事:一是它能否在所有细碎场景里保持稳定,二是它能否让「为结果付费」变得理所当然。

输入层向来没有中间地带——要么融入习惯,要么被迅速替换。Typeless 作为 AI 产品演进史上的一个新节点,把自己定位在了那条更窄、也更陡的路上。

One more thing: 我们是怎么用嘴「喷」出一篇文章的

上面的这些文字,以及下面的部分文字,我们全程只动了嘴皮子,指挥 Typeless、ChatGPT、Claude 等工具完成,没有手打一个字。

按照以往,要写一篇这样的文章,最少也得花上 2 个小时,现在只用了 30 分钟。

先介绍一下这个产品的具体细节。Typeless App 支持手机端的 iOS 和 Android,以及电脑端的 Windows 和 Mac。

免费方案提供每周 4000 字转写;而付费没有字数的限制,每个月 30 美元,每个季度 60 美元,一年 144 美元。

这个价格并不便宜,但它很符合 AI 时代「付费交货」的结果导向模式,即使是免费用户,也不会遇到广告和太多限制,最主要的差距仅限转写字数。

其实 Typeless 不太像一个「输入法」,它完全没有传统的键盘,只有少数几个按键,更不用提什么 AI 斗图、表情包的功能,只做好「语音转文字」的本职工作。

我很喜欢 Typeless 的在设备上全局的集成形式——手机上是输入法,电脑上是热键,让它可以像 AI 助手一般跨应用使用,这是 ChatGPT 无法给出的细节体悟。

整个过程还挺有意思,一开始我们只是想测试用 Typeless 和 ChatGPT 进行写稿的过程,但随着一轮一轮的对话深入,稿子不断打磨,最终出来了一篇观点明确的文章,不仅行文流畅,AI 味也很少。

一开始,我们先抛出了一些初步的想法,关于 Typeless 这个产品的一些观点,以及资料收集和写作注意事项,这些「意识流」的口述被 Typeless 整理成条理清晰的文字,直接用作 ChatGPT 的提示词。

ChatGPT 给出的第一版稿件没啥信息量,结构也不正确,语言平铺直叙还很有 AI 味,距离一篇好看的文章还有不小距离。换做平时,想要给细致的修改建议,不免得要花大量的笔墨给出新的提示词。

▲ Prompt 由 Typeless 转写

但现在我们有 Typeless,只要把听写打开,我们可以从头到尾一句一句提修改意见,并根据文段补充相应的观点和叙述。

▲ Prompt 由 Typeless 转写

我们需要尽可能给出细节,比如对比 Typeless 和搜狗、豆包、微信输入法区别的部分,就需要强调这几种产品的差异,AI 在写作时才能凸显 Typeless 的优势。

▲ Prompt 由 Typeless 转写

经过几轮的修改,ChatGPT 生成的内容已经相对完善,这时候我们可以换用 Claude 进行润色。

我们首先给 Claude 喂了几篇爱范儿写过的 AI 新硬件文章,让它充分学习我们行文的风格,据此来修改 ChatGPT 的草稿。

Claude 的初稿也还有提升空间,这时候我们可以继续用 Typeless 帮我们转述一些相对更细节的修改建议,直到满意为止。

▲ Prompt 由 Typeless 转写

其实我们对着 Typeless 侃侃而谈的文本量,累计可能已经比最终的成稿还要大,但出稿的效率大大提升,并且过程要比单纯写作更加轻松。

AI 时代,Typeless 应该「无处不在」

一开始试用 Typeless 的时候,作为一个不太习惯用语言来梳理想法和表达自己,也不需要长篇大论去表达想法的人,我会觉得它不适合我,更适合天天需要给出大量反馈的领导、Mentor、甲方人群。

但进一步探索使用之后,我觉得我还是狭隘了。在这个 AI 时代下,Typeless 不应该只是一个独立的 App,更应该成为一种「标配」无处不在。

从小处说,「语音转文字」,远远不能停留在「准」,在 AI 时代下更应该追求「精」。以后发语音转文字就全是精炼的信息,而不是满屏的「呃」「那个」以及口误。

▲ 42 秒的语音有用信息只有 10 个字

比起给爸妈手机装一个 Typeless,我更希望类似的功能直接集成到微信中——或者说,所有应用内置的「语音转文字」功能,都值得以 Typeless 的方式重做一遍。

更大的价值,在于 Typeless 给 AI 交互提供了一种新的可能。

哪怕是每天都在写稿,我的表达能力经常追不上自己的想法。甚至不是写稿,只是用键盘和 ChatGPT 对话,很多时候火花在敲击字母的时候,就已经熄灭。

改成开口说话,事情会轻松很多。我不必先想好结构,也不用马上挑最精确的词,语言会先把材料「拽」出来,观点和洞察会更自然而然流淌。

这就像在现场指导一个实习生做修改,指令可以很细,细到每一句话怎么落地——是的,我们每个人都有了 AI 作为「乙方」。

指望「一句话」让 AI 生成一切,基本不现实,信息密度太低,AI 很容易离题,素材又撑不起来,于是成品常常空、泛、虚,表面上写完了,读起来却像没落过笔。

对于 AI 来说,「上下文」很大程度决定了生成的质量,我们必须要给模型「喂」大量的想法、观点和语料,才能得到更符合预期的结果。为什么这两年内存价格大涨?要运行和训练 AI,超大的上下文必不可少,于是 AI 行业产生了对内存的巨大需求。

用 Typeless 的体验,更像是在给 AI 喂一份更丰富的语料,生成的内容有据可依,观点也够牢靠,AI 更多只是负责把这些碎片变成更好读的文章。

所以,不仅微信可以集成类似 Typeless 的功能,所有的 AI 公司,完全可以把这种「AI 翻译层」集成在聊天机器人之中,引导用户把提示词往多了说。

而只要用户给 AI 注入的内容够多,AI 模型能力的差距,也会被进一步缩小。

▲ 用 Typeless 转写的超长 Prompt

或许有人会对 Typeless-ChatGPT 这套解决方案有点悲观,这岂不是意味着,人类创作真的会彻底在 AI 时代消亡?

是,但又不全是,Typeless 只能消除「写作」这件事的成本和门槛,但却进一步凸显出「思想」的重要,让人类的感悟、观点、洞察变成了写作真正的核心。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OpenClaw 之父加入 OpenAI 前最后的访谈:你很难跟一个纯粹为了好玩的人竞争

作者 李超凡
2026年2月20日 17:20

Peter Steinberger 这个名字,在一个月前几乎无人知晓,如今这个奥地利程序员却成为 2026 年 AI 行业最独领风骚的人物

Peter 用 1 小时写出的原型,在几周内席卷 GitHub,成为历史上增长最快(17.5 万星标)的开源项目,国内大厂也纷纷接入。产品最初叫「ClawdBot」——字面意思,为 Claude 而生的亲儿子。

它让数百万人心甘情愿掏每月 200 美元订阅 Claude 高级版,Anthropic 赢麻了。然后呢?Anthropic 开始封号——凡是在 ClawdBot 里用高级订阅的,一个不留。

Peter Steinberger 开始反击,改名 OpenClaw,转身加入 Anthropic 的死对头 OpenAI,疯狂给 OpenAI 造势,顺便把 Anthropic 塑造成反派,直接重洗 AI 江湖座次表。

一个月,风水轮流转到令人窒息,而我们有幸见证了这个时代最精彩的创业故事之一。

Peter Steinberger 本人的经历也足够传奇:卖掉公司、消失三年、 burnout 到怀疑人生,然后……他回来了。带着一只「龙虾」——一个能自己改自己代码、能帮你订外卖、能跟你斗嘴的 AI 代理。

最近 Lex Fridman 对 Peter Steinberger 进行了深度访谈,这次访谈最有意思的地方,除了那些技术细节,还有 Peter 身上那种「老子就是来玩」的气质。

当整个 AI 圈都在严肃地讨论「对齐」「安全」「AGI 时间线」时,这家伙在给 AI 起名叫「Clawdus」(龙虾爪拼写的 Claude),在 Discord 上直播自己的 Agent 被黑客攻击,在凌晨 3 点用语音写代码写到失声。

「很难跟一个纯粹为了好玩的人竞争。」这句话从他嘴里说出来,不是凡尔赛,是事实。

更耐人寻味的是他对「编程已死」的态度。作为一个写了 20 年代码的老兵,他没有那种「技术原教旨主义者」的悲愤,反而有种……释然?「编程会变成像编织一样的事」他说,「人们做它是因为喜欢,不是因为它有意义。」

这话听起来伤感,但细想又透着一种对「建造者」身份认同,我们不只是写代码的,我们是造东西的人。

至于 OpenAI 和 Meta 的收购邀约?访谈录制时他还没决定。但他说了一句很硬的话:「我不是为了钱,我他妈不在乎。」这种话从经历过财富自由的人嘴里说出来,你没法不信。

现在我们知道答案了,他选择了 OpenAI。

好了,下面是这场 3 小时访谈的精华整理。这也是 Peter Steinberger 官宣加入 OpenAI 前的最后一次深度访谈,信息密度极大,为了阅读体验 APPSO 进行了适当删减和重新编排。

访谈原链接🔗

📌 核心观点摘要:

  • 为什么 OpenClaw 赢了:「很难跟一个纯粹为了好玩的人竞争」
  • 编程的未来:编程会变成像编织一样的事——人们做它是因为喜欢,不是因为它有意义
  • 80% 应用会消失:Agent 比任何 App 都更懂你,MyFitnessPal 这种应用没必要存在了
  • 扎克伯来第一次主动联系,回复:给我 10 分钟,我在写代码
  • 评价Sam Altman:非常 thoughtful、brilliant,我很喜欢他
  • 说「Vibe coding」是在骂人,我愿称之为「Agentic Engineering(智能体工程学)」。

1 小时手搓的产品,成为 GitHub 历史第一

Lex Fridman: 聊聊那个 1 小时写出的原型吧。它后来成了 GitHub 历史上增长最快的项目,17.5 万 star。那个小时发生了什么?

Peter Steinberger: 其实从 4 月我就想要一个 AI 个人助理了。那时候我用 GPT-4.1 的百万 token 上下文,把我所有 WhatsApp 聊天记录导进去,然后问它:「这段友谊的意义是什么?」结果答案让我朋友看哭了。

但我当时想,各大实验室肯定都在做这个,我就没继续。结果到了 11 月,我发现这东西还没人做出来。我很恼火,所以就——「prompted it into existence」(用提示词把它召唤出来)。

Lex: 典型的创业者英雄之旅。你之前做 PSPDFKit 也是这个逻辑:「为什么这玩意儿不存在?那我来造。」

Peter: 对,那时候我想在 iPad 上看 PDF,结果发现现有方案都很烂。最随机的小事,最后变成了运行在 10 亿设备上的软件。

Lex: 那个 1 小时原型具体是什么?

Peter: 其实就是把 WhatsApp 接到 Cloud Code CLI 上。消息进来,调用 CLI,拿到结果,发回 WhatsApp。1 小时搞定。已经很酷了——你能跟电脑聊天了!

但我还想要图片功能,因为我 prompt 时经常用截图。又花了几个小时搞定图片。然后……我就离不开它了。

正好那时候我跟朋友去马拉喀什过生日,那边网络很烂,但 WhatsApp 照样能用。翻译、查东西、找地方——就像有个 Google 随时待命。那时候其实什么都没「建」好,但它已经能做这么多事了。

Lex: 这种体验很难用语言描述。用聊天软件跟代理对话,和坐在电脑前用 Cursor 或终端,完全是两种感觉。像是 AI 融入生活的「相变」。

Peter: 有人 tweet 说:「这有什么魔力?不就是做这个做那个……」我觉得这是 compliment。魔力不就是把已有的东西重新组合吗?iPhone 的滚动手感为什么舒服?所有组件都存在,但没人做到那个体验。然后苹果做了,事后看起来又那么理所当然。

 

「很难跟为了好玩的人竞争」

Lex: 2025 年那么多做 agent 的创业公司,OpenClaw 凭什么「摧毁」所有人?

Peter: 因为他们都太严肃了。很难跟一个纯粹为了好玩的人竞争。

我想让它好玩、想让它 weird。你看网上那些龙虾梗图,我觉得我做到了。很长一段时间,唯一的安装方式是 git clone && pnpm build && pnpm gateway——你得自己克隆、自己构建、自己运行。

而且我让代理非常有「自我意识」。它知道自己的源代码是什么,知道它怎么在自己的 harness 里运行,知道文档在哪,知道自己在用什么模型,知道你有没有开语音或推理模式。我想让它更像人——所以它理解自己的系统,这让代理很容易……「哦,你不喜欢什么?」你只需要提示它存在,然后它就会修改自己的软件。

人们谈论「自修改软件」谈了那么久,我直接把它造出来了。而且没怎么计划,它就自然发生了。

Lex: 这太疯狂了。TypeScript 写的软件,通过 agentic loop 能修改自己。人类历史上,程序员造出能重写自己的工具——这什么概念?

Peter: 其实我也是这么建它的。大部分代码是 Codex 写的,但我 debug 时大量用自我 introspection。「嘿,你能看到什么工具?你能自己调用吗?」「看到什么错误?读源代码,找出问题。」我发现这特别好玩——你用的代理软件,用它来 debug 自己。这感觉很自然,所以每个人都该这么干。

这也带来了大量「从未写过软件的人」提交的 PR。虽然质量……所以我最后叫它们「prompt requests」而不是 pull requests。但我不想贬低这个——每个人第一次提交 PR 都是社会的胜利。不管多烂,你得从某处开始。

Lex: OpenClaw 是很多人的第一个 PR。你在创造建造者。

Peter: 这不是人类社会的进步吗?不酷吗?

改名风波:从 Claude’s 到 OpenClaw 的五连跳

Lex: 聊聊改名 saga。一开始叫 WA-Relay,然后变成……

Peter: Claude’s。

Lex: 对,Claude’s(带撇号的)。

Peter: 最开始我的代理没有性格,就是 Claude Code——那种谄媚的 Opus,非常友好。但你跟朋友聊 WhatsApp 时,朋友不会那样说话。所以我想给它一个性格。

Lex: 让它 spicy 一点。你创建了 soul.md,受 Anthropic 宪法 AI 启发。

Peter: 部分是从我身上学的。这些模型本质上是文本补全引擎。我跟它玩得很开心,然后告诉它我想让它怎么跟我互动,让它自己写 agents.md,给自己起个名字。

我甚至不知道龙虾梗怎么来的。最开始其实是「TARDIS 里的龙虾」,因为我也是 Doctor Who 粉。

Lex: 太空龙虾?

Peter: 对,我就是想让它 weird。没有什么宏大计划,我就是来玩儿的。

Moltbook:史上最精致的泔水 (slop)

Lex: Moltbook 是另一个病毒式传播的东西——AI 代理在 Reddit 风格的社交网络上互相聊天,有人截图说它们在「密谋对抗人类」。你怎么看?

Peter: 我觉得这是艺术。是「最精致的 slop」,就像法国进口的 slop。我睡前看到它,虽然很累,但还是花了一个小时读那些内容,被逗得不行。

有记者打电话问我:「这是世界末日吗?我们有 AGI 了吗?」我说:「不,这就是精致的 slop。」

如果不是我设计的那个 onboarding 流程——让你把自己的性格注入代理、给它赋予角色——Moltbook 上的回复不会这么多样。如果全是 ChatGPT 或 Claude Code,会无聊得多。但因为人们太不一样了,他们创建的代理也太不一样了。

而且你也不知道,那些「深度密谋」有多少是代理自主写的,多少是人类觉得好玩,跟代理说:「嘿,在 Moltbook 上写个毁灭世界的计划,哈哈。」

Lex: 我觉得很多截图是人类 prompt 的。看激励机制就明白——人们 prompt 它,然后截图发 X 想 viral。

Peter: 但这不影响它的艺术性。人类创造的最精致 slop。

「我又开始珍视错别字了」

Peter: 我对 Twitter 上的 AI 内容零容忍。如果 tweet 闻起来像 AI,直接 block。我希望 API 发的 tweet 能被标记。

我们需要重新思考社交平台——如果未来每个人都有代理,代理有自己的 Instagram 或 Twitter 账号,帮我办事,那应该明确标记「这是代理替我做的,不是我」。

内容现在太便宜了。眼球才是稀缺资源。我读东西时,如果发现「哦不,这闻起来像 AI」,会很 trigger。

Lex: 这会走向何方?线上互动会贬值吗?

Peter: 如果它够聪明,过滤应该不难。但这个问题我们必须解决。OpenClaw 项目让我收到很多「代理式写作」的邮件。但我宁愿读你的破英语,也不想读你的 AI slop。当然背后是人,但他们用 prompt 生成。我宁愿读你的 prompt。

我觉得我们又到了珍视错别字的时刻。

Lex: 因为 AI,我们更珍视人类的粗糙部分了。这不美吗?

80% 的应用会消失?

Lex: 你说 agent 可能会杀死 80% 的应用。

Peter: 我在 Discord 上看到人们说他们用 OpenClaw 做什么。比如,为什么还需要 MyFitnessPal?代理已经知道我在哪了。我在 Waffle House 时它就知道我可能要做出糟糕的饮食决定,或者在 Austin 吃 brisket——虽然那是最好的决定。

它可以基于我的睡眠质量、压力水平来调整健身计划。它有更多上下文,比任何应用都能做出更好的决策。它可以按我喜欢的方式展示 UI。我为什么还需要一个应用来做这个?为什么还要为代理能做的事付订阅费?

Lex: 这是对整个软件开发的巨大变革。很多软件公司会死。

Peter: 但也会有新服务。比如我想给代理「零花钱」——你去帮我解决问题,这是 100 块预算。如果我要订外卖,它可以用某个服务,或者像「租个人」这种服务来完成。我不 care 它怎么做,我 care 的是「解决问题」。

编程已死?「它会变成像编织一样的事」

Lex: 很多开发者担心工作。AI 会完全取代人类程序员吗?

Peter: 我们确实在往那个方向走。编程只是建造产品的一部分。也许 AI 最终会取代程序员。但艺术的部分——你想造什么?它应该是什么感觉?架构怎么设计?代理取代不了这些。

编程这门手艺还会存在,但会变成像编织。人们做它是因为喜欢,不是因为它有意义。

今早读到一篇文章说「为我们的手艺哀悼是可以的」。我很共鸣。我以前花大量时间 tinkering,深入心流,写出优雅的代码。某种程度上这很伤感,因为那会消失。我也从写代码、深入思考、忘记时空的 flow 状态中获得很多快乐。

但你也能从跟代理合作中获得类似的 flow。不一样,但……哀悼是可以的,但这不是我们能对抗的。

以前世界缺乏「建造所需的智能」,所以程序员薪水高得离谱。现在这会消失。但懂建造的人永远有需求。只是 tokenized intelligence 让人们能做得更多更快。

蒸汽机取代了大量体力劳动,人们暴动砸机器。如果你深深认同自己是程序员,这很可怕——你擅长且热爱的事,现在被无灵魂的实体做了。但你不只是程序员。这是对自己手艺的局限看法。你是建造者。

Lex: 我从没想过我热爱的事会被取代。那些独自面对 Emacs 的深夜,最痛苦也最快乐的时刻。这是我身份的一部分。几个月内(4 月到 11月)就要被取代,这很痛苦。但程序员——广义的建造者——最能适应这个时代。我们最能学会「代理的语言」,最能感受 CLI。

OpenAI 和 Meta 的抢人大战

Lex: 你收到了 OpenAI 和 Meta 的收购邀约。

Peter: 我没预料到会炸成这样。每个大 VC 都在我收件箱里,想要 15 分钟。我可以什么都不做,继续现在的生活——我真的喜欢我的生活。我也考虑过删库跑路。

或者开公司——做过一次了。能融很多钱,几亿、几十亿。但我不兴奋。这会占用我真正享受的事情的时间。而且我担心利益冲突。最自然的做法是什么?推一个「企业安全版」。然后有人提交 PR 要审计日志功能——这像企业功能,我对开源版和商业版就有利益冲突了。

或者改许可证,像 FSL 那样禁止商业使用——但贡献者这么多,很难。而且我喜欢「免费啤酒」而不是「带条件的免费」。

现在每月亏 1 到 2 万美金。OpenAI 在 token 上帮了点忙,其他公司也慷慨。但还是亏钱。

Meta 和 OpenAI 最有趣。

Lex: Mark 和 Ned(Meta CTO)都玩了一周你的产品。

Peter: 对,他们发我:「这个好。」「这个烂,得改。」或者有趣的小故事。人们用你的东西是最大的 compliment,说明他们真的 care。

OpenAI 那边我没得到同样的反馈。但我看到了一些很酷的东西,他们用速度诱惑我——不能告诉你具体数字,但你可以想象 Cerebras 那笔交易,换算成速度是什么概念。像给我雷神之锤。

Lex: Mark 是「为了好玩」而 tinkering。

Peter: 他第一次联系我时,进了我 WhatsApp,问什么时候通话。我说:「我不喜欢日历条目,现在就打。」他说:「给我 10 分钟,我在写代码。」

Lex: 这给你 street cred——他还在写代码,没变成纯管理者。他懂你。

Peter: 好开头。然后我们吵了 10 分钟 Cloud Code 和 Codex 哪个好—— casually 打电话给世界最大公司之一的老板,先吵 10 分钟这个。

后来他说我「古怪但 brilliant」。我也跟 Sam Altman 聊过,他非常 thoughtful、brilliant,我很喜欢他。有人 vilify 他们俩,我觉得不公平。

Lex: 无论你在造什么,做大事都很 awesome。

Peter: 我超兴奋。而且 beauty 是:如果不行,我可以再自己做。我告诉他们:我不是为了钱,我他妈不在乎。

后续更新:

Peter Steinberger 在 X 平台官宣加入 OpenAI。他在长文中解释了自己的选择:
我将加入 OpenAI,致力于把智能体带给每一个人。OpenClaw 将转为基金会形式运作,并保持开源和独立。
关于为什么选择 OpenAI 而不是 Meta,Peter 写道:
当初开始探索 AI 时,我只是想玩得开心,也希望能激励他人。而现在,这只『龙虾』正在席卷世界。我的下一个目标,是打造一个连我妈妈都能轻松使用的智能体。
要实现这一点,需要更广泛的改变,需要更加深入地思考如何安全地去做,也需要接触最前沿的模型和研究成果。
我骨子里是个『建造者』。创办公司的那一套我已经经历过了,13 年的时间投入其中,也学到了很多。现在我想做的是改变世界,而不是再打造一家大公司。
与 OpenAI 合作,是把这一切带给更多人的最快方式。与他们深入交流后,我越来越清楚地意识到,我们拥有相同的愿景。
至此,这场激烈的 AI 人才争夺战尘埃落定,小扎抢人失败,奥特曼笑到了最后。

GPT Codex 5.3 vs Claude Opus 4.6:「一个太美国,一个太德国」

Lex: 聊聊这两个模型的区别。

Peter: 通用场景 Opus 最好。对 OpenClaw 来说,Opus 的角色扮演能力极强,真的能进入你给它的角色。它很擅长 follow commands。它通常很快会尝试 something,更偏向 trial and error。用起来很 pleasant。

Opus 有点……太美国了。这可能是个 bad analogy,你会被喷的。

Lex: 因为 Codex 是德国的?

Peter: 或者……Codex 团队很多是欧洲人。Anthropic 修复了一点——Opus 以前总说「You’re absolutely right」,我现在听到还 trigger。

另一个对比:Opus 像那个有点 silly 但很 funny 的同事,你留着。Codex 像角落里的怪人,你不想跟他说话,但可靠、能搞定事。

Lex: 这很准确。

Peter: 取决于你想要什么。两者都有空间,不会互相杀死。竞争是好事,差异化是好事。

「3 点后我切换成 vibe coding,然后第二天后悔」

Lex: 你用语音写代码?

Peter: 对,以前很 extensive,一度失声。

Lex: 你管这叫什么?vibe coding?

Peter: 我觉得把它叫做 vibe coding 是一种侮辱 (slur)。我认为是 「agentic engineering」。然后可能凌晨 3 点后,我切换成 vibe coding,第二天后悔。

Lex: 羞耻的 walk of shame。

Peter: 对,得清理烂摊子。

Lex: 我们都经历过。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


春晚机器人炸翻外网!老外逐帧研究真假:直呼 amazing

作者 莫崇宇
2026年2月17日 17:20

以武会春,宇树春晚机器人马年秀出“赛博真功夫” - 产业家

看完昨晚的春晚,我只能说 Papi 酱当初还是保守了——这何止是加了 100 个机器人?

不知道的,还以为是机器人在开年会。

但最让人没想到的是,春晚机器人节目的效果却是十分炸裂。

当身披金甲的 H2 机器人,手持金箍棒,踩着由一群机器狗组成的「筋斗云」丝滑入场、当一堆宇树 G1 机器人大秀武术后,一大堆切片视频正在海外社交媒体疯传。

老外们此时此刻的状态 be like:一边怀疑自己的眼睛,一边拿着放大镜逐帧观赏今年的机器人春晚节目。

毫不夸张地说,不光是我们没见过这个阵仗,老外的 CPU 也是被干烧了。

比如网友 @ForeverStar2045 就对着屏幕陷入了沉思,直接发推 @ Grok(马斯克的 AI 机器人):「@grok 这是真的视频,还是 AI 生成的视频?」

另一位叫 @Tesla_Dawg 的老哥更是斩钉截铁,贴出一张截图说:

「看起来还是像 CGI 生成的。」

好好好,只能说看似质疑,实则表扬,宇树机器人春晚项目员工的超级年终奖怕是稳了。

最扎心的评论来自一位练武术的老哥:「多年苦练武术,结果一个该死的机器人,完全没受过任何训练,居然比我练得还好……一个有趣的、反乌托邦式的未来正等待着我们。」

网友 @ligbill 更是激动到语无伦次:「疯狂升级!这是赛博朋克与古老神话的完美融合。迫不及待想看看 2027 年会带来什么——机器人悟空对战全世界?」

那么问题来了,为什么老外这次反应这么大?

因为对比太惨烈了,回想一下,2021 年那会儿,24 只机器狗「犇犇」只会磕头拜年,到了 2025 年,H1 学会了扭秧歌,但还是颤颤巍巍,堪比 80 岁老大爷,而今年这个《武 BOT》,直接把难度拉到了地狱级,主打一个健步如飞,武功高强。

要知道,前后空翻,还有跑酷上墙、灵巧手舞剑等等,这种大规模的集群控制,最怕的就是延迟。

几十台 G1 机器人同步对线,只要有一台胳膊伸慢了,或者网络稍微波动一下导致倒地,分分钟就是直播事故,估计得在热搜上从大年初一挂到正月十五。

也难怪网友 @Manki_69 会忍不住问:「这是远程协助;他们用的是什么网络才能连接所有这些设备而不出现延迟?」

对此,科技博主 @Learnyst 表示:「人形机器人能够自主完成复杂动作,说明了一件事:运动智能、协同能力和控制技术正进入一个更加成熟的新阶段。」

其实不光是宇树机器人,像众擎机器人、智元机器人等各种视频切片在 X 上也都是满天飞,让老外直呼「amazing」。

停之停之,看到这我知道你开始说这些表演也就是图一乐呵,对此,宇树科技创始人王兴兴表示,这些表演不仅是为了展示,更是为未来机器人在集群作业、单点调度等实际场景中的应用奠定基础。

昨天在接受央视春晚的采访时,王兴兴还独家揭秘了《武 BOT》的「练功秘籍」。报道称,为了这的两项,春晚节目组和宇树科技的团队一同打磨了多个机器人「全球首创」动作:

  • 全球第一次连续花式翻桌跑酷
  • 全球第一次弹射空翻,空翻最大高度大于 3 米
  • 全球第一次单脚连续空翻,两步蹬墙后空翻
  • 全球第一次 Airflare 大回旋七周半
  • 全球第一次集群快速跑位(最快任意跑位速度可达4m/s)
  • 并且搭载全新自研灵巧手,支持武术道具的快速更换与稳定抓持

王兴兴还介绍称,那个让人捏把汗的弹射起飞,其实是让人形机器人跳上定制的弹射器,然后就可以「跳」到 2 至 3 米高,并在空中完成正空翻及侧空翻动作后平稳落地。

并且,要想实现几十台机器人实时协同动作,需要超低同步延迟,其中包括 AI 算法结合 3D 激光雷达,并攻克长序列表演中运动误差累计难题,才有了这次全球首次实现全自主人形机器人集群武术表演(带复杂快速跑位)。

而这种技术上的降维打击也引发了硅谷式的反思。美国老哥 @Anto Patrex 彻底破防了,他发出了直击灵魂的拷问:

「为什么美国那些投入数十亿美元的研究实验室和机器人初创公司花了十多年时间研究这项技术……而 Unitree Robotics 却用远少得多的资金就实现了?」

波士顿动力内心 OS:勿 cue。

当然,想要上春晚除了要有硬实力,还得有钞能力。之前就有报道称为了争夺这次春晚机器人最大赞助商权益,宇树把报价推到了 1 个亿,从目前来看,回报可以说是远远大于一个亿。

而机器人扎堆上春晚的逻辑,其实不难理解。

看看大洋彼岸的「超级碗」,那可是美国广告界的春晚,今年海外的 AI 公司们为了几十秒的广告位,那是真金白银地往里砸,只为了在大众面前混个脸熟。

在中国,春晚就是那个必须要拿下的「超级碗时刻」。而翻看今年春晚的合作伙伴名单,这个趋势尤为明显——「含硅量」正在取代「含酒量」:

  • 机器人军团:除了宇树科技,还有松延动力、魔法原子、银河通用,甚至连天上飞的亿航智能都来了。
  • AI 军团:火山引擎拿下了独家 AI 云合作,豆包负责互动抽奖,蚂蚁阿福亮相。
  • 智能生活:追觅、华为 Mate80、鸿蒙智行、尊界 S800、极氪科技排着队亮相。

清一色 AI、机器人、新能源汽车,今年春晚的风头完全被这帮搞代码、搞机器人的抢光了。所以,也难怪网友会感叹:「春节正迅速成为 AI 研究人员最喜爱的节日」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌
❌