阅读视图

发现新文章,点击刷新页面。

国产电车抄不来法拉利 Luce,也千万别抄

过去十年里,几乎没有一辆超跑可以像今天的法拉利 Luce 一样,激发出如此多的讨论。

不仅仅因为它是法拉利——一家将性能、设计和格调刻进 DNA 的超跑厂商——有史以来第一款纯电动车,更是因为它那让人一言难尽的外观

图|Ferrari

在意大利语中,luce 的意思是「光」,不仅寓意着这辆电动车照亮前路,更是为法拉利的首款纯电车加上了一层宗教的神圣性——

Dio disse: « Sia la luce! »(神说:要有光)

Luce 还是法拉利的首款 5 座车型,采用 4 轮电机驱动,122 千瓦时电池组可以提供约 530 公里的满电续航1050 马力的峰值功率

即使车重来到了 2.2 吨(接近小米 SU7 Max),Luce 依然有着约 310 公里/时的极速,零百加速也在 2.5 秒左右。

教皇利奥十四世观赏法拉利 Luce|TheVerge

价格方面,法拉利宣布 Luce 的起步价为 55 万欧元(约合人民币 432.9 万元),可以说无论性能还是价格,都很符合车头的跃马标。

然而也是这个跃马标,为 Luce 带来了正式亮相之后网络上铺天盖地的争论。

不纯血的马

比 KOL 和媒体试驾更早传出的,是网友们层不出穷的梗图创意。

菲亚特 Luce|Threads

菲亚特 Multipla Luce|Threads

纯粹「车」身攻击|Threads

然而就在两个月前,法拉利刚刚公布 Luce 的内饰由前苹果设计主管乔尼·艾弗领衔 LoveFrom 设计时,大家对它的评价还是相当正面的:

图|TopGear

但当人们看到这辆由乔尼·艾弗与马克·纽森(Marc Newson)两位传奇工业设计师设计出来的 Luce 全车的时候,评价来了个 180 度大转弯,似乎也情有可原——

Luce 是一辆很好看的电车,但完全不是一辆好看的法拉利。

图|Ferrari

简单来说,Luce 是一辆在电车设计上追求极致的车:一体化座舱、极致降低风阻、继承自纯血马(Purosangue)的对开式马车门等等。

然而 Luce 不仅与混动的纯血马,甚至与法拉利此前的所有设计语言都是不同的——

它既没有古典法拉利的圆润,也没有经典法拉利的方正,更没有现代法拉利的凌厉造型,反而像个消费电子产品。

Ferrari Purosangue 2026|TopGear

雪上加霜的是,就在 Luce 正式公布之后,意媒 Askanews 在采访法拉利前主席 Luca Cordero di Montezemolo 时询问了他对 Luce 的看法。

这位担任法拉利公司主席长达 23 年,任期内经历过恩佐(Enzo)、458、拉法(LaFerrari)几代传奇车款的 78 岁老人的回答很无奈:

如果我把真实想法说出来,会伤害到法拉利,我们正在冒险毁掉一个神话,我感到非常遗憾……希望他们至少把跃马标从 Luce 上摘下来。

图|Askanews

显然蒙特泽莫罗最后还是没憋住,在离开镜头之前补了一句:

……连中国车厂都不想借鉴它的设计。

如果冷静下来,去法拉利官网上看看 Luce 不太常规的法拉利 logo 选配位置,就能理解 Luce 得到这样的评价其实一点也不奇怪——

Luce 是一辆需要通过「在侧门上贴跃马标」来缓解自己的身份认同危机的法拉利。

图|Ferrari

然而问题真的出在法拉利 Luce 的「法拉利」部分吗?其实不然。

就像蒙特泽莫罗说的,只需要把 Luce 车身上的跃马标换成一个更具有代表性的 logo,Luce 的设计瞬间就变得合理了起来。

图|Threads

当然,对于那个电车最重要的问题,整活网友们当然也想到了解决方案:

图|Threads

Luce 长得像 iCar

归根结底,让 Luce 的设计在整个法拉利家族里面格格不入的根本原因,还是因为它是法拉利的第一辆纯电。

对于这种产品线上「前所未有」的产品,法拉利极有可能从最开始就没有让 Luce 与传统动力车型外观相近的想法。

能够侧面印证这种观点的,是法拉利官网上对 Luce 的设计介绍:

「我们与 LoveFrom 共同研发的,远不止是一辆电动法拉利,」约翰·埃尔坎表示。「我们在此所做的,不仅在构思上极其困难,在实现上同样充满挑战。这将打造出独一无二的法拉利 Luce」

图|Ferrari

这也就带来了一个问题:

由乔尼·艾弗、马克·纽森与 LoveFrom 工作室主导设计的法拉利 Luce,究竟是一辆更像消费品的未来法拉利,还是一辆更像未来法拉利的消费品

可以看到的是,二月 Luce 内饰设计公布之后,大家都对它兼顾屏幕和实体按键的先锋式设计表示赞赏,却在看到它同样超脱的设计之后骂声一片。

图|Ferrari

这种评价叠加在同一辆车上本身就是矛盾的:你不能同时要求 Luce 在设计理念上既先锋又保守。

就拿纯血马来说,虽然它是一辆混动车、保留着现代法拉利的凌厉设计风格,但把 Luce 的智能内饰平移到 Purosangue 上,依然会格格不入。

Ferrari Purosangue 内饰|TopGear

与此同时,这种对于 Luce 产品性质的讨论也会触及到那个终极问题:

法拉利 Luce 究竟是给谁准备的?

55 万欧元、430 万人民币,这个数字本身就已经排除掉 99.9% 的地球居民了——

Luce 的目标客户,是那些车库里已经停满其他豪车的人:

图|Rockstar Games

虽然法拉利还没有介绍 Luce 的购车模式,但从过往历史就能知道:法拉利是要对车主做背调之后才会提供购车资格的。

根据统计,在 2025 年全球购买法拉利的近 14000 人中,其中超过 80% 已经拥有一辆法拉利了。

在我们调侃 Luce 需要翻过来充电、承载力不如菲亚特的时候,那些已经有了一堆 V12 引擎的客户们,很有可能单纯因为「Luce 长得和传统法拉利不一样」而直接下单。

图|Car Magazine

毕竟 Luce 作为一辆电车,外观设计主要追求低风阻系数,和传统跑车(以及 FUV)追求下压力的设计指标并不完全相同。

此外,电车的底盘结构与重心分布也决定了在去掉引擎和变速箱空间之后,座舱部位无论怎样设计,最终都会呈现出一个类似水滴形的轮廓。

图|Ferrari

这也侧面解释了为什么 Luce 不像法拉利,反而长得像国产新能源:

在设计现实产品时,物理学决定的最优解有时候就是唯一解,追求极致的结果经常是趋同的。

还有别的方案吗

无论广大车迷们认为法拉利 Luce 怎样「数典忘祖」,无法改变事实就是:它的外观已经定型了,Luce 就在那里,稳稳的接住你。

图|Threads

然而我们还是不禁想要问一句:哪怕是乔尼·艾弗亲自操刀,Luce 真的就是「法拉利电车」的最优解吗?

答案显然是否定的——你虽然不能要求一个产品的设计既先锋又保守,但却有办法通过设计,在先锋的同时保留那些标志性的品牌 DNA。

最优秀的「先锋派标志性设计」例子之一,就是现代 N Vision 74。

图|Threads

虽然 N Vision 74 和 Luce 的定位非常不同,两者面临的设计挑战却是高度相似的:

怎样通过一个全新的设计,为品牌开发全新动力技术(氢燃料电池 vs 纯电)提供一个足够具有辨识度的新车型。

而选择从 1974 款现代 Pony 概念车上汲取灵感的 N Vision 74,在传达创新性和品牌风格方面,显然比 Luce 更被人们所广泛接受。

在接受科技博主 Cleo Abram 采访时,法拉利设计总监 Flavio Manzoni 在评价人们的反响时,提到了奥地利作曲家 Gustav Mahler 的一句话:

传统不是对灰烬的崇拜,而是对火种的传承。

换言之,Luce 在法拉利内部看来,即使不再继承现代法拉利的标志性设计,也依然传承着法拉利的创新和技术火种。

恩佐·法拉利|Camisasca Automotive Manufacturing Inc.

然而「传承」从来都不是一个容易的事,把品牌基因继承得好才叫传承,继承不好变成了当年可口可乐的 New Coke,那叫翻车。

正因如此,Cleo Abram 在采访视频的最后做出了一个比较中肯的总结:

我们不知道 Luce 最终会成功还是失败,但不管是哪种结局,我们都能从里面学到东西——

如果 Luce 失败了,我们可以学习到怎么改良;如果 Luce 成功了,我们就能看到整个行业开始学习 Luce,以至于影响到我们未来十年能够买到的电车。

而对于国产新能源来说,还是蒙特泽莫罗那句话说得对——

外观就不用借鉴了,多学习一下 Luce 的内饰设计就行。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

讯飞首款 AI 眼镜,用 40 克撬动 AI 工作流

2026 还没过半,已经有 30 多款 AI 眼镜亮相了。

除了华为、阿里千问、Rokid、雷鸟、小米这些老玩家,连老板电器都推出 AI 烹饪眼镜,京东方也做了骑行眼镜……百镜齐放,但大体上在围着三件事卷:谁能做得更轻、谁的摄像头更清晰、谁的镜片上能塞进更大更好的显示屏。

热闹之下,有一个数据通常会被忽略。

目前主流电商平台上,AI 眼镜的退货率高得惊人,普遍在 30% 左右,在冲动消费占大头的直播渠道,退货率甚至能飙到 40% 到 50%

用户因为新鲜感下单,戴了几天,默默点了退货。销量高开低走、退货率居高不下,就是众多 AI 眼镜的「生命周期」。

说白了,尝鲜期过去后,消费者就会开始产生这样的疑惑:戴上之后它到底能帮我干什么。

就在今天,科大讯飞在澳门发布了旗下首款 AI 眼镜。这副 40 克的眼镜没有卷像素、卷全彩大屏、卷时尚联名,把核心能力押注在一个看起来十分常见的能力上——翻译

但翻译只是它的入口,不是终点。

发布会前夕,APPSO 和科大讯飞副总裁王玮、穿戴设备业务部总经理林会杰聊了聊。聊到后半段,话题从具体的产品技术转移到了一个更大的命题上:AI 眼镜下半场的关键,到底在硬件层面还是在 AI 工作流?

AI 眼镜的「奇点」,是让人愿意一直戴

百镜大战之后,在现有供应链里攒出一款智能眼镜真不难,华强北两周就能给你出一个样机。但难的是,你怎么给用户一个「一直佩戴」的理由。

对于第一次做 AI 眼镜的讯飞来说,这也是个绕不开的坎。

王玮跟 APPSO 聊起讯飞做 AI 眼镜的起点,其实源于一个非常具体的画面:你想啊,翻译机在展会、小型商务洽谈这些场景里是很好用的,甚至公司共用一台就够。但总有一些时刻,当你在国外旅游或者某些场合,你不方便掏出设备和低头看屏幕,不想等翻译结果打断说话的自然节奏。

你希望交流是「沉浸式」的,眼神始终对着彼此,对话顺畅流动,翻译像空气一样感受不到存在。这副眼镜的起点,就是用户对那种「无感」体验的期待。

这种「物理中断」,是讯飞看了无数个翻译机用户的真实反馈后,攒下来的痛点。做 AI 眼镜的公司可以一夜之间冒出来,但做翻译的底子,真的没法速成。

讯飞翻译机卖了 100 万台、翻译了 10 亿次。讯飞同传跑了 42 万场国际会议,覆盖 50 多个国家,触达 4 亿观众,连续 8 年服务全国两会。

这些数字沉淀下来的不只是算法,还有对真实场景里那些琐碎问题的感知:什么时候用户会嫌翻译慢,什么场景下手持设备让人尴尬,什么噪音条件会让准确率断崖……

去年 10 月讯飞已经推出了一款翻译耳机。耳机验证了两件事:用户确实需要释放双手的穿戴式翻译;端到端的同传在穿戴设备上是跑得通的,反应速度能掐在 2 秒以内。

但耳机只管耳朵,在林会杰看来,耳机的局限在于它是一个「听觉」设备(现在也开始加摄像头了),眼镜则可以增加视觉的模态,多种模态叠加在一起,跨语言沟通的信息输入就丰富多了。

说白了,眼镜上有摄像头可以拍照翻译,有显示可以投射字幕让你不用低头看手机,还能放更多的麦克风做定向降噪。

用王玮的话说就是,「眼镜离人的眼睛、耳朵、嘴巴最近,它是物理世界与数字世界天然的桥梁,让翻译像呼吸一样自然发生。」

而到了 2026 年,供应链成本开始被拉下来了,国补也首次把智能眼镜纳了进来,再加上星火 X2 大模型云端翻译能力的提升,天时地利凑齐了。

林会杰倒挺坦率:「我们选择这个节点,是因为看到了增速才刚刚开始。」王玮更直接:我们不想用「iPhone 时刻」这个词,但实际上就是这个意思,眼镜马上到了奇点临近的时候。

40 克,一道系统工程题

讯飞这款 AI 眼镜,我戴上之后第一反应是比想象中轻。它集成了微型显示屏、摄像头、5+1 麦克风矩阵、喇叭,但整机重量被死死卡在了 40 克。

这个数字可能很多人没概念,我们来横向对比一下:

  • Meta Ray-Ban 是 49 克,但它没有显示屏;
  • Rokid Glasses 也是 49 克,带显示,但比讯飞重了将近 25%;
  • 华为 AI 眼镜确实轻,35.5 克,但它没有显示屏。

在「带显示屏」的智能眼镜阵营里,讯飞目前几乎做到了行业最轻。

为什么非得是 40 克?林会杰说,这个数字是他们用模拟仿真和海量调研死磕出来的。欧美人的头型和体型对重量的钝感力比较强,Meta 做到 50 多克他们依然觉得能接受。但亚洲人的颅骨结构和鼻梁高度不同,对重量极度敏感。

对于中国用户来说,45 克是一道分水岭,超过这个分量,戴久了就会有明显的压迫感。40 克,是长时间佩戴的「舒适阈值」。

为了抠掉这几克,团队在工程上跟供应链磨了很久。最关键的一招,是用树脂镜片替代了传统的玻璃镜片。

传统近视眼镜早就是树脂的天下了,但为什么智能眼镜一直不用?因为工艺太搞心态了。智能眼镜的镜片需要做「全贴合」,把显示层和镜片压在一起。树脂材料在成型和加热时极易产生微小的气泡,胶水一旦有一丝一毫的空隙,光线的折射曲率就偏了,整个镜片就废了,良率控制比玻璃难得多。

林会杰透露,讯飞应该是行业里第一个在带显示的智能眼镜上把全贴合树脂工艺跑通的。研发过程中经历了非常多尝试和失败,才最终把树脂材料用在了显示镜片上,但回报是巨大的,单靠镜片这一项,就比玻璃方案轻了 30% 到 40%。

再加上定制的 0.15CC 微型光机、微型摄像头模组,镜框镜腿一体成型。芯片选型和算法做了深度耦合:同样的功能别家可能要 100mAh 电池,讯飞可能 50mAh 就够了。

所以最后我们看到的讯飞 AI 眼镜,整机重量更轻,续航却没打折。

这是一道系统工程题,没有捷径,每一环都要跟供应链反复磨合良品率。树脂镜片、微型光机、低功耗芯片、算法-硬件耦合,哪一环掉链子,重量都得回到 50 克以上。

唇动识别降噪,用眼睛帮耳朵听

翻译固然是讯飞的舒适区,但这副眼镜上,讯飞还首发了一个有点科幻的技术——唇动识别降噪,这是多模态降噪系统的核心部分

这是唇动识别降噪首次搭载到 AI 眼镜上,实现逻辑是眼镜的前置摄像头会死死锁定对面说话人的嘴唇。同时,眼镜上的 5 颗气导麦克风和 1 颗骨传导麦克风组成了一个六通道的音频流。

系统实时通过「看到谁的嘴在动」,来辅助判断「该听谁的声音」, 从而在嘈杂的多人混声中,精准地把目标人物的语音「抠」出来。

这就实现了「看谁翻谁」的效果,你的眼镜盯着谁,耳边响起的、镜片上跳出来的,就是谁的翻译字幕。

这个技术直接决定很多场景的翻译质量,因为翻译准不准,有一个重要的前提听得清不清。

安静的会议室里,其实目前的翻译软硬件都可以较好处理交流问题。但讯飞 AI 眼镜重要的一个用户群是商务人士,他们真正需要用到的翻译场景是什么?是展会、商务酒会、机场,环境噪音随便都能 80 到 90 分贝。传统翻译工具在这种环境下,准确率直接掉进马里亚纳海沟。

高噪场景下,唇动识别降噪让识别准确率提升了 50% 以上。林会杰解释说,这并不是单纯看口型,它融合了声源位置增强、目标人锁定等一整套多模态降噪系统,各路信号在实际使用中自动协同。

这个能力也不是拍脑袋想出来的。讯飞在大型会议系统和汽车智能座舱里,搞这种多通道语音分离和多模态降噪已经很多年了,在 CHiME 国际语音分离大赛上拿过 6 连冠。

王玮还给我们分享了一个几年前的内部 Demo:几个研究员同时讲话,人耳完全分不清,系统把每个人的声音干净利落分离出来,谁说了什么都清清楚楚。

这事儿有趣的地方在于,以前开大会,你有足够的物理空间塞麦克风,有服务器的算力,有插座供电。现在,你要把这套复杂的视觉-音频融合算法,塞进一副 40 克、算力和功耗被极度压榨的眼镜里。

王玮觉得,这恰恰是讯飞在硬件上秀出的「肌肉」:怎么把大设备上的硬核算法做高倍率的压缩,移植到小尺寸、轻量化的移动端侧,而且还能离线实时处理多路语音数据

讯飞做硬件的路径是「大设备验证、小设备迁移」。在会议系统和汽车上跑通的算法压缩到眼镜端侧。唇动识别降噪需要视觉-音频配对数据、端侧实时处理能力、多麦克风硬件的联合调优,单靠现成算法集成难以实现。

降噪的准确性直接决定翻译的准确性,这也是整条工作流的第一道关卡。

「全能翻译」背后的基础设施

听得清之后,才是译得准的问题。

讯飞 AI 眼镜支持 122 种语言的实时互译,划分了同声传译(听演讲)、面对面翻译(商务洽谈)、通话翻译(跨国电话)和线上同传(接腾讯会议或 Zoom)等四种模式,摄像头还能直接拍 PPT, 做外文资料翻译。

在现场体验中最让我觉得有意思的是通话翻译

这大概是目前市面上唯一一款能在你打电话时,同时帮你做跨国翻译和记录的眼镜。它的路径是这样的:眼镜通过蓝牙挂载在手机上,捕捉到电话那头的英语,端到端同传模型全自动翻译,再把你的中文回答翻译成英文顶回去,延迟在秒级。

也就是说,你在电话这头说中文,老外在那头听到的是你的音色克隆出来的英文。电话一挂,眼镜甚至能帮你把一份结构化的会议纪要发你。

过去,传统的翻译系统是「老三样」:语音识别(ASR)→文本翻译(MT)→语音合成(TTS)。这套方案最大的毛病就是延迟大,而且每过一个环节,信息的「语义损失」就多一层。

讯飞这次在眼镜上搭载端到端的语音同传大模型,跳过了中间的文本转译步骤,直接实现「语音进、语音出」,把首字响应时间压进了 2 秒。云端撑腰的是星火 X2 模型(293B 参数的 MoE 架构,基于华为昇腾训练)。

林会杰说,他们把翻译场景切分得极其细微,因为不同场景下需要的行业知识库和降噪模式是完全不一样的。

讯飞这款眼镜在翻译功能上花的功夫,这有点像手机行业卷影像,拍照功能谁都有,但我有 2 亿像素,有10 倍长焦,有4K live 图,甚至能覆盖专业摄影场景。

翻译之后,AI 工作流才开始

到了这一步,你会发现,讯飞想做的已经不只是「翻译工具」了。这大概也是为什么它不叫「翻译眼镜」,而被视「眼前的超级 AI 助理」。

林会杰认为,「眼镜更像是一个戴在眼前的超级计算机,带有显示、摄像头、语音能力,它的配置跟手机、PC 基本一样。

承载这层能力的是讯飞的 GlassClaw,这个 Agent 能调用大模型能力、接入生态服务、做多模态理解,把从听懂到干活的整个过程打通,同时也支持 OpenClaw 等第三方 Agent 接入。

你没看错,这还是一副「龙虾」眼镜。

林会杰分享了他自己使用 GlassClaw 的日常工作流:他出门不用频繁掏手机。在路上走着,可以直接用语音唤醒 GlassClaw,让它调取手机通讯录、找客户拨号,电话接通自动开翻译。

跟客户面对面聊天时,突然需要查阅之前的某份合同纪要,直接盲操吩咐眼镜,眼镜会去检索他的电脑资料,提取出要点并同步到镜片上。

甚至开完会后,眼镜自动做完多模态的角色区分(谁说了什么),输出结构化纪要,他直接语音:「把纪要以邮件形式发给项目组,并把下周三的复盘会同步到日历上。」

如果你也养过虾对这些功能肯定不陌生,只不过这次交互发生在你的脸上。

当初让AI 眼镜出圈的提词器功能,在这款眼镜里也迎来升级。

讯飞 AI 眼镜的智能提词器功能做到了语义跟随,说到哪跟到哪,不再是机械按速度滚动,可以做自然的智能语义理解和跟随。配套的充电胶囊可以当遥控器,按键切换和暂停文稿。

这就是 AstronClaw 架构在底层玩的「端-边-云」三级协同:眼镜端侧负责环境感知和预处理,边缘侧做决策,复杂的推理丢给云端的星火 X2。GlassClaw 基于讯飞自研的 Agent 能力,同时也支持 OpenClaw 等第三方 Agent 接入。

王玮的判断是,未来的眼镜不再只是很简单的一副眼镜,而是你穿戴最方便的一个随身助理

市场上单做翻译或单做 AI 助手的产品不少,但把「翻译 + 记录 + 纪要 + 跨端执行」串成顺滑的工作流,需要语音、翻译、大模型、智能体(Agent)四种底层能力同时在线,且环环相扣

讯飞这种全栈的技术能力,恰好在眼镜这个载体上找到了合适的闭环。

AI 眼镜的下半场,拼的是什么

过去两年,AI 浪潮裹挟着整个硬件行业寻找那个所谓的「Next Gen」入口。

AI Pin 翻车了,各种智能吊坠无疾而终,虽然 AI 硬件的产品形态和技术路线各异,但行业也逐渐形成一些共识: AI 需要眼睛,它必须能实时感知人类所处的三维物理世界。

AI 眼镜未必不是最终形态,但它是目前唯一能够全天候、第一视角承载视觉与听觉输入的形态。

王玮在采访里提到一个挺有意思的预判:「未来的数字生活三件套,大概率是电脑、手机和眼镜。眼镜不是手机的配件,它自己就是一台架在鼻梁上的独立主机。」

眼镜天然适合做连接物理世界和数字世界的设备。而且硬件本身还有很长的迭代空间:显示会从单色走向全彩、从 2K 走向 4K;摄像头和麦克风还会向 AI 原生的 token 编码方式升级。王玮说这些技术路径已经开始有比较明晰的发展方向了。

林会杰透露,讯飞的第二代 AI 眼镜已经在规划中,最快 2026 年秋季能看到,面向更多不同人群,也在摸索一些细分的垂直场景。

过去一年 APPSO 测过、写过不少 AI 眼镜。回头看百镜大战,行业其实已经分化出了两条不同的路:

一条是「做最好的眼镜,让 AI 成为加分项」。 Meta Ray-Ban 是这个逻辑:用时尚设计和品牌文化来对冲用户对 AI 能力的低频刚需。

另一条是「做更深的 AI 工作流,让眼镜成为新的电脑」。 讯飞选择的就是这条路。两条路指向不同的竞争维度,但后一条更难走,因为它要求你同时具备硬件工程能力和 AI 全栈能力,缺一不可。

AI 眼镜的下半场,真正的分水岭在于,谁能把 AI 揉进高度细分的真实场景里,替用户把一件件琐碎任务给办了。

让眼镜回归眼镜, AI 老老实实当「牛马」。

最后能留下来的设备,我想大概是这样的:当你摘下它的时候,会突然觉得眼前的世界变得沉重而低效。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

国产AI编程冲上全球第二!实测五大模型,谁才是Vibe Coding神器

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。

▲5.26 榜单截图

除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

虽然现在大模型四年,我们已经对这些排行榜的刷新屡见不鲜,但还是忍不住想要体验一下,能够超越 GPT 5.5 的 Qwen 模型,实际能力到底如何。

要知道,现在最火的 Coding Agent 组合,大概就是搭配了 GPT 5.5 的 Codex。

如果我们把 Codex 里面的默认模型修改成 Qwen3.7 Max,再用 Codex 来完成一些日常的任务,会不会比 GPT 5.5 还好用呢。

获取 Qwen3.7 Max

趁着现在各家都在推出一些 Token 优惠活动,阿里云也提供了 100 万 Token 的免费使用,可在阿里云百炼平台使用。

Qwen3.7 Max 的定价,在阿里云官网,目前是限时五折,输入 6 元/每百万 tokens,输出 18 元/每百万 tokens。新用户还可以 5 折充值节省计划,以 10 元每月的价格获得 20 元的 Token 额度,而 Token Plan 标准档目前是 198 元/月。

总体来说,根据大模型聚合平台 OpenRouter 显示的数据,Qwen3.7 Max 的价格属于中规中矩的一档,对比 DeepSeek 的骨折价肯定比不上,但和 Opus 4.7、GPT 5.5 相比还是优惠不少。

我们直接充值了「入门首选」这档全模型通用抵扣 20 元。但这里需要注意的是,五折优惠仅支持一个套餐,即购买了 10 元的,就不能再购买 50、250 的半价优惠计划了。

DeepSeek、Claude、GPT、Gemini、Qwen 一起来测试

拿到了 API Key 和百万免费使用 Token,我们先是在阿里云百炼平台、以及千问官网,使用 Qwen3.7 Max 做了一些常见的前端网页设计来测试它的开发能力。

像是比较能直观的看到差别的物理模拟测试,我们就用一段简单的提示词「用 HTML+CSS+JS 做一个模拟液体在容器里晃动的动画,拖动容器可以改变倾斜角度。」

▲ Qwen3.7-Max,千问官网生成

Qwen3.7 Max 的表现可以说是顺利完成了这个模拟挑战,同时还增加了颜色的自定义、摇晃、液体量调节等功能。

DeepSeek 就比较简单,但是也没出错。

▲ DeepSeek V4,官网生成

GPT-5.5 生成的液体有点奇怪,虽然做到了会随着角度的切换,流向对应的方向,但是整个波浪很出戏。

▲ GPT-5.5 超高,Codex 生成

Gemini 3.5 Flash 生成网页似乎是有点 Bug,那个瓶子一直会被隐藏到控制面板背后,必须得自己拖出来。但是同样一句提示词,它给的自定义东西是真的多,不仅提供了瓶子的类型,还有液体的颜色,各种设置都能自定义。

▲Gemini 3.5 Flash,官网生成,选择 Canvas 选项

Claude Opus 4.7 这个瓶子过于简陋了,而且模拟的液体晃动效果在剧烈状态下,很像是音波的跳动。

▲ Claude Opus 4.7,使用 Claude Code 应用生成

接着我们尝试让它生成一个小游戏试试,虽然游戏的测试已经是去年 Vibe Coding 的常见测试项目了。但这次我们要 AI 做一个六宫格的 2048 游戏,输入提示词「做一个可以玩的 2048,但格子是六边形的。」

Qwen3.7 Max 生成的页面还是很好看的,能看到它的参考来源 10 条信息里面,大部分都是来自 CSDN 的 2048 游戏生成教程。

最终的游戏也能玩,但还是偶尔有不按常理出牌的时刻,例如同一方向上,相同数字叠加,没有叠加在该有的位置。

▲ Qwen3.7 Max,官网生成

DeepSeek V4 的表现和上一轮差不多,但是明明是六边形,给出的键盘控制却只有 WASD 来滑动。

▲DeepSeek V4,官网生成

这一轮表现最好的大概就是 Claude 的 Opus 4.7,它真的理解了这个游戏应该怎么设置,格子的移动是符合这个蜂巢的规则,不会让人感觉找不着北。

▲ Claude Opus 4.7,使用 Claude Code 应用生成

GPT 5.5 依托 Codex 的能力,在生成了游戏之后还能自己打开浏览器预览是否有问题,抓取控制台的信息来修复项目代码。最后生成的网页也很优秀,不过对于监控鼠标在屏幕上的移动方向,还是没有 Opus 4.7 的表现出色。

▲GPT-5.5 超高,Codex 生成

Gemini 3.5 Flash 则是一如既往地给我加了很多东西。游戏的主题风格它就写了赛博、暗金和马卡三种背景,甚至还加上了「内置高品质合音器」。

游玩过程配有原生 Web Audio 生成的复古 8-bit 太空音效(合并、滑动、过关、死亡),体验感瞬间拉满。

▲Gemini 3.5 Flash,官网生成,选择 Canvas 选项

再回到一些普通网页的设计上,我们要求它做一个地铁博物馆的网站,输入的提示词也只有一句话「设计一个名为地铁博物馆的主题网站,要求沉浸感强。」

本意上我们希望这些大模型可以尽可能多地罗列不同城市的地铁信息,世界地铁的 Logo,以及整个网站的风格应该是艺术性的,有专门的风格和充分的特效来呈现。

先看Qwen3.7 Max,说实话有点难评,把文字竖排放着是很像地铁列车,但是整个网站给人的感觉是很乱。

▲ Qwen3.7-Max,千问官网生成

而 Gemini 继续做了很多,声效再次用上,比较有意思的是,它还做了一个地铁文创,定制纪念票根生成器。我们可以输入名字、选择车站,实时生成一张高颜值、复古风的地铁纪念乘车票。

▲ Gemini 3.5 Flash,官网生成,选择 Canvas 选项

DeepSeek 选择的项目和 Gemini 类似,一样有票务纪念和驾驶体验,但是它在最后交付的成果中,似乎并没有呈现这些功能。

▲ DeepSeek V4,官网生成

GPT 5.5 现在生成的网页风格很不错,虽然也有明显的套用模板,但是整体的设计是在线的,遗憾就是信息量太少了。它似乎没有理解地铁博物馆应该是一个介绍地铁信息的网站。

▲GPT-5.5 超高,使用 Codex 生成

继续用之前的提示词像是让它做一个 macOS/Windows 的操作系统,这次我们输入「用 HTML 构建一个完整的浏览器操作系统。」

DeepSeek V4 的表现很简单,同样简单的是 Qwen3.7 Max,不过这次 Qwen3.7 Max 额外给了一张不错的桌面风景图片。

▲ DeepSeek V4,官网生成

▲ Qwen3.7-Max,千问官网生成

但在这个测试中真正让我觉得表现不错的,还是 Gemini 3.5 Flash 和 GPT 5.5。

▲ Gemini 3.5 Flash,官网生成,选择 Canvas 选项

和 Gemini 3.5 Flash 一样,GPT 5.5 也对整个 OS 进行了详细的设计,有专门的风格。

▲ GPT-5.5 超高,使用 Codex 生成

在 Codex 里使用 Qwen3.7 Max

一轮测试下来,好像 Qwen3.7 Max 在通过对话生成小网页项目的测试表现上,很难说每一次都超越 Gemini、GPT 5.5,但对比前代,我相信是已经有了很大的提升。

我们在千问官网看到有一些给出的代码案例,像是 3D 地球,食物链排序,可视化,个人博客等内容,但是这些网页项目的提示词都比较长,而不是像我们所测试的简单一句话。

▲在输入提示词之后,千问也提供了「优化指令」的选项

我们把 3D 地球这个项目的提示词也扔给了 DeepSeek V4、Gemini 3.5 Flash,得到的效果几乎和 Qwen3.7 Max 是一样的。

这意味着提示词在当前阶段,对能否发挥 Qwen3.7 Max 的能力,还是起着相当重要的作用。

而减少用户优化提示词压力的方式,大概就是接入 Agent 产品,利用他们的 Skills 以及 Agents 协作等能力,来发挥模型的真正实力。

按照阿里云官方的教程,我们把 Qwen3.7 Max 成功接入到了 Codex 终端助手里。

不过这里容易出现 BUG,即 Codex 会不断提醒你「CODEX Missing environment variable」。

按照官方的教程,我们修改完 ~/.codex/config.toml 配置文件之后,还需要修改电脑的环境变量。

即模型的 API KEY 信息是保存在电脑的环境变量(需要查看自己电脑的 Shell 类型,修改对应的环境变量文件,如 .bash_profile 或 .zshrc)中,而不是在 Codex 的 config.toml 配置文件里。

修改完成之后,在终端输入 Codex,我们就能看到 Qwen3.7 Max,重新打开 Codex App,主界面的模型也会从之前的 GPT-5.5 切换为自定义的 Custom。

用同样的方法,我们可以把 DeepSeek、MiniMax、Kimi、智谱等模型,都接入到 Codex 中。

前段时间在 GitHub 上有一个前端的 Skill 收获了两万多个 Star,它主打让 AI 生成的前端界面更好看,这和 Qwen3.7 Max 拿下第二名的榜单任务类似。

我们先安装这个 Skill 到 Codex 中,然后尝试结合 Skill 看看是否能有更好的效果。

▲ 地址:https://github.com/Leonxlnx/taste-skill

输入同样的提示词,Codex 会自动调用前端设计、头脑风暴等 Skill 来完成设计的定位和构思,并且严格按照 Codex 的流程控制来监控项目生成。

最后,同样一个模型,在 Codex 里面的表现要比直接在千问官网好上不少。

但是这里还是会容易遇到一个问题「stream disconnected before completion: <400> InternalError.Algo.InvalidParameter: The “function.arguments” parameter of the code model must be in JSON format.」

当模型需要调用专门的工具时,就无法再和模型取得连接。我们在互联网上找到了相关的问题案例,原因可归结为「模型部署厂商针对流式输出格式有问题,不是标准 OpenAI 协议,所以不支持 API 调用,出现 400 报错。」

要求 Codex 解释这个问题时,Codex 也是说模型的问题。

不是你配置错了,而是 Qwen3.7 Max / 百炼 Responses API 对 Codex agent 工具调用还不够稳。能对话不代表能稳定跑 Codex,长任务、改代码、频繁读文件时,切回 OpenAI 官方模型会稳定很多。

所以如果你也遇到了这个问题,大概只有等 Qwen 团队自己去修复,或者重新开一个会话试试。

▲ 阿里云官方有出现不同错误码的解决方案指南

去年我们还在说模型即产品,一个足够好的模型就是一个好产品,现在看来,单靠模型是远远不够的。

记忆、Harness、Agents 编排、验证、推理的可持续性等等,随着模型能力的增加,这套架构也在持续扩充,但只有都做好了,我们或许才愿意说「这是一个好模型」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

法拉利发布首款纯电车型!外形酷似理想 i6,约合人民币 435 万元

去年 11 月,理想汽车高级设计总监 Benjamin Baum 在接受媒体采访时,抛出了一段在当时显得有些匪夷所思的言论。

等着看法拉利纯电车的外观设计吧,它的形式实际上和我们的 i 系列非常相似,因为他们理解,一辆电车就必须是这个形状。

当时,互联网上充斥着对这段话的嘲讽。在大部分人的既有认知中,法拉利永远和低趴的姿态和引擎的咆哮绑定在一起。把高傲的意大利超跑和主打空间与舒适的家用车放在同一个语境下讨论,听起来多少有些荒谬。

时间给出了答案。

今天凌晨,法拉利在罗马正式发布了他们的首款纯电车型——Luce。这个单词在意大利语中意为「光」,寓意照亮前路。Luce 在意大利本土起售价高达 55 万欧元,约合人民币 435 万元。

当 Luce 在发布会上褪去伪装,Benjamin 的预言得到了验证。这辆长达 5 米的纯电车采用了类似理想 i 系列的单厢式结构,是法拉利有史以来的第一款 5 座车型,也是这个意大利超跑品牌对电动化时代最安静的回应。

驭光而来的跃马,是机械艺术,而非电子产品

打造一辆如此出挑的汽车,法拉利做了一个不寻常的决定。

这个极其重要的纯电首作项目,并没有交由 Flavio Manzoni 领导的法拉利自家设计工作室,而是联手了一个叫 LoveFrom 的设计工作室。这支团队的创始人,是缔造了苹果工业设计黄金时代的乔纳森·伊夫(Sir Jonathan Ive)和马克·纽森(Marc Newson)。

法拉利希望借助 LoveFrom 在奢侈品与科技行业的积淀,打开一个全新的视角。

受智能设备极简美学的启发,Luce 采用了一种被称为「玻璃屋」的设计概念。车身上半部分、挡风玻璃以及中控台大面积使用了康宁的大猩猩玻璃。为了追求极致的工艺感,引擎盖后缘与挡风玻璃的接缝精度达到了毫米级。雨刷也并没有像常规车辆那样隐藏在中间,而是分别停留在挡风玻璃的两侧。

这是一个非常微妙的手法,让人联想到了法拉利早期的经典赛车元素。

空间的分配同样打破了跑车的常规。

传动与排气系统的移除,让 Luce 的乘员舱获得了极大的解放。它采用了掀背设计,两侧是型面很有雕塑感的后铰链式对开门,当四扇车门同时打开时,你会看到一个宽敞到足以让三位成年人并排而坐的后排空间。

当然,支撑起这副前卫躯壳的,依然是一套强悍的底盘。

Luce 拥有四台电机,这些电机能够在一秒内把转速提升到每分钟 30000 转,爆发出 1050 马力的最大功率以及 7750 牛·米的峰值扭矩。对于一辆整备质量仅有 2260 公斤的纯电车而言,这个数据非常夸张。它只需 2.5 秒就能从静止加速到 100km/h,最高时速可达 310km/h。

它的底盘平铺了一块 122kWh 的电池组,采用 800V 电气架构,满电状态下的 WLTP 续航里程为 530km。

为了驾驭这种狂暴的动力,法拉利开发了一套全新的车辆控制单元。

这套系统能够以每秒 200 次的频率不断更新数据,配合虚拟差速器、四轮扭矩矢量分配以及最新版本的侧滑控制系统,在横向、纵向和垂直三个轴向上对每个车轮进行精准的控制。

坐进车内,乔纳森·伊夫对细节打磨得很到位。

在这个大屏泛滥的时代,Luce 的内饰却出人意料地保留了大量机械结构。三辐式方向盘由再生铝打造,内部由 19 个经 CNC 精密加工的部件组成。翻转空调出风口的铝制挡板,能听见清脆的机械回馈。

车钥匙的交互也充满仪式感。它采用 E-ink 电子墨水技术,插入中控台凹槽的瞬间,法拉利徽标上的跃马黄会像液体般流淌而下,点亮下方的挡位选择器。

驾驶员前方的 OLED 仪表采用凸透镜视差技术,铝合金与聚碳酸酯打造的物理指针带有背光。头顶的起跑控制杆,灵感则来自直升机操控面板。

在人们最关心的声浪问题上,法拉利并没有使用音响来播放 V12 发动机的录音。工程师在 Luce 后轴中心布置了一枚加速度传感器,实时捕捉电机等部件的振动频率。而后,系统会像处理电吉他信号那样,对这些真实的机械振动做均衡与放大,再由车外扬声器释放到街道上。

倘若切换到性能模式,这股源自电机的声音同样会涌入座舱,加之反潮流的内饰风格和实体按键的交互,你能够感知到,法拉利在极力阻止 Luce 沦为一件枯燥的电子产品。

把超豪华纯电的定义权握在手里

放眼当下的超豪华汽车圈,电动化进程正在经历一场倒春寒。

兰博基尼已经叫停了自家的纯电计划,首席执行官斯蒂芬·温克尔曼在面对媒体时表示超跑买家对电动车的兴趣「几乎为零」。与此同时,迈凯伦的高管对纯电路线态度暧昧,阿斯顿·马丁也将首款电动车的发布时间线延后了三年。

市场给出的结论是,处于金字塔尖的消费者依然迷恋汽油燃烧的味道。

在这样的行业退潮期,法拉利逆势推出 Luce,看起来像是一场不计后果的冒险。他们完全可以像其他品牌一样,继续享受内燃机带来的丰厚利润,将电动化的任务推迟到下个十年。

但法拉利有自己的考量,为的就是「超豪华纯电」的定义权。

现在这个赛道已经不止有保时捷 Taycan 了,中国那批势头正猛的豪华品牌也在虎视眈眈。法拉利希望能够通过 Luce 来向行业证明:没有 V12,也照样能造出让人热血沸腾的车。

为什么这台承载着品牌野心的新车,最终会呈现出类似理想 i 系列的轮廓,答案自然是——物理规律。

在燃油车时代,设计师拥有极大的自由度。想要更嚣张的线条?风阻大一点也无妨。但到了纯电时代,风阻系数直接掐住了续航的命门,每一丝气流都和里程数严格挂钩,设计师再也没法任性。

把 Luce 做成类似于水滴的流线型单厢结构,成为了空气动力学上的最优解。

底盘架构的演变也推动了这种外形的诞生。纯电滑板底盘不再需要庞大的前置或中置引擎,因此将座舱整体前移,把底盘面积尽量让渡给乘客,顺理成章地成为了设计师的首选。

乔纳森与部分国产新势力车企在面对着同一套关于空间、风阻和重量的物理题时,推导出了相似的几何轮廓。

但他们最终还是走向了不同的分叉。

法拉利显然早就准备好去面对激进外观带来的舆情。对于这家超跑品牌而言,特立独行本就是溢价的一部分。而背负着销量压力的新势力车企,终究还要考虑如何把车卖给更多的主流大众。

比如,在后来实际落地的 i 系列上,理想就选择向市场低头,将车尾重新改回了大众更习惯的传统 SUV 的模样。

法拉利不需要向市场低头

美国工业设计先驱雷蒙德·罗维曾提出过著名的 MAYA 原则,即极度先进,但又可被接受(Most Advanced, Yet Acceptable)。

他观察到一种普遍的消费心理。人们既渴望拥抱新奇的科技,又对完全脱离既有认知框架的事物充满恐惧。一款成功的工业产品,必须在这两种情绪之间找到平衡点。要么用未来的技术包装出人们熟悉的模样,要么在熟悉的模样中一点点注入未来。

现在市场上已经有对照组了。

一类产品选择顺应大众审美。它们保留了很长的 L113——也就是前轮轴心到驾驶踏板之间的距离。

在过去的一百年里,这种修长的车头是用来安置大排量发动机的,久而久之,这种因功能而生的比例,反而成了身份与财富的象征。保留它,就是在迎合人们对豪车的固有认知。

奔驰 EQS 则走向了另一个极端。为了追求极低的风阻系数,工程师采用了非常前卫的弓形车身。这种设计抹平了 S 级轿车应有的威严感,让它看起来像一个放大版的鼠标,市场反响冷淡。

奔驰首席技术官马库斯·谢弗后来反思过:早期的电车用户恨不得全世界都知道自己开的是电动车,但当电车真正变成主流,消费者反而不想被当成异类——他们只想要熟悉的造型。

大众的审美习惯往往会滞后于技术的迭代速度,这在行为经济学里叫做「现状偏见」。

那法拉利 Luce 会不会重蹈 EQS 的覆辙?

这种担忧实际上忽略了法拉利的受众画像。

EQS 面对的是主流富裕阶层,他们需要用一辆稳重的行政座驾来展示自己的社会地位,他们没有试错的成本。法拉利的客户群体不太一样,愿意花几百万买一台电动玩具的人,车库里大概率也不会缺 V12。他们或许更需要一种足够先锋、足够破格的产品,来证明自己跟得上时代。

颠覆传统的外形,对他们而言不是冒险,而是一张极具吸引力的社交名片。

乔纳森·伊夫那些复杂而昂贵的细节,正是这张社交名片的底气所在。24 寸的超大轮毂、对开门,每一处都在提醒旁人:这车不便宜。

法拉利董事长约翰·埃尔坎在谈及这辆车时表达了他的立场:

当汽车电动化时,并不意味着它必须成为一件消费电子产品,这大概是过去十年里业界一直在犯的错误之一。

这句略带锋芒的论断,恰恰解释了 Luce 为什么长这样。它不想随波逐流,更不想变成一台没有温度的电子快消品。

当大多数车企还在向保守审美低头时,法拉利选择用品牌号召力,强行把汽车设计往前推了一步。

更何况,实在不行,他们还能卖 V6 和 V12 嘛。

带轮子的都关注,欢迎交流。 邮箱:tanjiewen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

最好的手机 AI,是仿佛没有 AI|AI 器物志

智能手机统治了过去十几年的数字生态,它是注意力的黑洞,是我们最私密的随身之物。但手机从设计之初就是为「人盯着它」而生的——它的全部逻辑,都止于屏幕。

AI 的需求却恰恰相反:它需要持续感知物理世界——见你所见,听你所闻,随时在场,而非等你解锁屏幕才醒来。

当 AI 真正成为一种基础能力,它迟早要从屏幕里破壳而出,寻找属于它自己的形状。这将是一个漫长的探索和演化过程。

「AI 器物志」栏目由此而来,爱范儿想和你一起持续观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活?

这是「AI 器物志」的第 14 篇文章。

时至今日,已经没有人可以否认:手机正在成为我们生活中最重要的 AI 枢纽。

无论是给智能穿戴作数据中枢,还是作为独立智能终端,手机都承担着比以往任何时候都重的连接和处理任务。

而手机的操作系统,就是这些连接和处理的基础,是一切 AI 功能的舞台。

图|OPPO

承认吧,无论你是否喜欢手机智能助手,手机系统的 AI 化都是不可避免的,连谷歌都在说要把 Android「操作系统」进化成「智能系统」了。

与其一股脑地反对手机 AI 化,我们面对这种变革的最好方式,莫过于秉承「拿来主义」的原则:

主动发掘那些最好用的手机 AI 功能,让它们成为日常使用中的润滑剂。

而口号「超流畅更 AI」的 OPPO ColorOS 16,就是这样一个难得的 AI 功能不喧宾夺主、反而让使用体验变得润滑的手机系统。

一键闪记:AI All in one

虽然记忆功能各个品牌都有,但小布记忆仍然是目前为止我们体验到功能最丰富、用法最直观、生态最完善的那个。

毕竟 OPPO 在开发这项功能的时候,背后的思路很清晰:

我要的不是截图本身,而是屏幕上的信息……灵魂抽走之后,那个枯萎的实体照片就不重要了,因为信息已经被提取了。

在最新版本的 ColorOS 16 里,「一键闪记」的能力进一步加强,开始和小布记忆里面的多模态功能、流体云等有机结合,变成了一个比截图更好用的超级记忆工具。

视频闪记

让一个 AI 工具好用的重点,从来都是「工具多走一步,让用户少走一步」。

「视频闪记」功能,正是在记录和理解屏幕信息的基础上主动多走一步,让用户不必额外操作一次的典型代表。

这个功能之所以好用,在于它解决了以前要总得复制链接发给 AI、或者在视频播放界面喊小布的「多步骤」操作。

相比之下,视频闪记只需要在播放的时候按一下快捷键,小布就会自动识别视频、自动执行总结,一下减少了 50% 的手动工作量。

尤其如今各种学习视频——网课、生活技巧、产品教程等等——大爆发,OPPO 的视频闪记可以起到非常好的内容整理作用:

而进入小布记忆里面还会预留带超链接的时间戳,跳转的视频甚至可以免开屏动画(和广告)

此外,小布记忆还会根据总结出来的视频内容,主动关联之前记忆的其他视频,形成自动收藏夹的效果。

但它目前只支持国内主流视频平台、不支持 YouTube 和微信视频号,仅支持中英文、不支持小语种,以及部分竖屏视频无法触发总结等等。

但总的来说,「视频记忆」依然是 ColorOS 中体验最好的 AI 功能之一,就因为它把两个最常见的 AI 操作整合在一起、做出了 1+1>2 的体验。

快速记账

除了视频总结之外,另一个我们意料之外好用的「闪记类」功能,则是小布的自动记账。

当然,OPPO 这个自动记账并非百分百自动,而是与更常用的「闪记上岛」整合在了一起,严格来说依然是个需要手动执行的操作:

但「闪记上岛」本身足够优秀,几乎可以说是目前适配性最强大的「灵动岛」类功能。

将记账和这个高频功能组合在一起,应该就是目前最无感的方案了。

当然记账的方式很多,微信还是支付宝都有和账单相关的智能功能,ColorOS 最大的优势依然是前面提到的「流程顺畅,体验无感」。

小布记忆目前只支持导入微信和支付宝的 Excel/CSV 对账单,如果是云闪付或者其他平台的话,就要导出 Excel 之后修改排版才能导入了:

除了单纯记账之外,ColorOS 的账单分析功能也做得很不错。

在小布记忆首页就可以看到当月支出的柱状图,点进去还能看到流水明细和日周月平均:

单这些功能,基本上就可以满足 95% 的日常记账需求了,可以省下相当多付费记账 app 的开销。

更重要的是在「我的账单」页面,你还可以和小布讨论已有的收支数据——

不过 LLM 的数学推理能力都比较一般,小布给出的结果最好还是「仅供参考」。

系统功能:最爱抠细节的 AI

除了上面的「英雄场景」之外,ColorOS 很多 AI 功能也是整合进系统 app 里的,在使用过程中经常会有「原来这里也能用小布」的感叹。

并且 AI 功能集成在系统应用中,也变相提升了它们的留存度、让很多「到手就删」的 app 有了用武之地。

菜单翻译

作为 ColorOS 16 重点宣传的功能之一,智能翻译 + AI 菜单可以说是让我们印象最深刻的优秀 AI 整合案例了。

它为一个门槛颇高的问题,提供了一种极为接地气的解决方案——

把高大上的洋文菜单,直接 vibe coding 成微信点餐小程序。

和小布记忆不同,这个 AI 菜单翻译入口藏得比较深,需要在预装的翻译 app 里面的「拍照翻译」中激活:

在拍照翻译时,无论直接拍摄,还是导入相册图片,在读取到翻译内容是菜单之后,ColorOS 就会提示这个新的「AI 图文菜单」入口。

在 AI 图文菜单里面,系统会把所有识别到的菜品转换成我们最熟悉的点单小程序布局:

并且系统还会为每道菜配上一个 AI 预览图、原料和做法,甚至还有过敏原提示价格换算

我们只需要像小程序点菜一样选择,然后选择右下角的「向店员展示」,它就能提供文字和语音两种展示形式。

更细节的是,ColorOS 为一些主流外国菜系定制了不同风格的菜单界面,比如日料就是红底配富士山,泰国菜就是黄底配大象等等——

并且除了出国旅游,AI 菜单功能还有一个小众用法:去酒吧的时候用它翻译一下,就能清楚自己在喝什么东西了。

不少酒吧用的都是双语菜单,用 ColorOS 的 AI 菜单翻译一下,不仅能看到大概的样子,还能看到制作方法,准确度不错:

AI 帮写

ColorOS 的「AI 帮写」也是一个用之前没有感觉、一开始用就容易形成习惯的小功能。

和其他厂商喜欢把 AI 写作功能绑定进预装输入法不同,ColorOS 的 AI 帮写与输入法是独立的。

也就是说无论你用搜狗输入法、微信输入法还是 Gboard,AI 帮写都能正常使用:

而 ColorOS 实现 AI 帮写的方式也很有意思:

它的触发检测基于应用白名单,但提示词却是通过屏幕内容识别读取的。

换言之,AI 帮写只会在特定 app(美团大众、淘宝京东、小红书朋友圈等等)里弹出,在不支持的软件里面(比如酷安)只能手动呼出小布帮忙。

微信朋友圈(左)和酷安(右)

而 AI 帮写具体写什么东西,是根据它识别到的屏幕内容决定的,有时候会导致一些 bug——

比方说在小红书里面,只要屏幕上有缩略图,AI 就知道我想要的是和猫相关的内容:

但大众点评里,由于输入框上移会挡住照片,AI 帮写就不知道内容是什么了。

如果碰巧没显示关联话题,AI 帮写就会写出一些不知所云的东西:

但在不出 bug 的时候,ColorOS 的 AI 帮写功能都是相当好用的。

虽然它生成的东西很难说有什么个人特色,但用来应付那些「写 100 字点评领优惠券」的场景来说,简直就是解放生产力的终极工具。

需要改进的问题

除了上面的有趣用法以外,ColorOS 目前的 AI 功能也存在着一些问题和短板。

首先是普及性的问题——前面列举出的大部分功能,其算力重心都是云端服务器,手机本身只需要承担一小部分算法开销。

在这样的前提下,以云端功能为主的 AI 更新应该很容易下放到较老的机型上才对

但事实上不是如此。

就拿我们手里的 Find N3 和 N5 为例:即使是最新版本的系统和 app,也没有更新前面提到的 AI 菜单功能——

其次,用小布记忆来记账的确很方便,但它的操作方式有些过于粗犷了。每次都得在订单界面闪记一下,自动化程度还是有些不足。

更要命的是,它作为一个记账功能,居然不支持外币或汇率转换

哪怕 AI 识别到小票上的币种是泰铢(THB),数字也会按人民币入账:

在 OPPO 国际版逐渐打开销路、出国旅游愈发普遍的今天,这种基础功能的缺失是很难让人接受的。

并且相比友商的 AI 助理,小布能够支持的「代操作」功能还是比较原始——

用支付宝给谁发个红包可以,去淘宝再买一单上次的咖啡豆就不行了。

操作系统就该是智能系统

归根结底,我们还是要回到之前 Android Show 上谷歌对 Android 系统的新的定义:

Android 将会从一个操作系统(operating system, OS)转变成一个智能系统(intelligence system, IS)。

过去几年间,无论是华为鸿蒙、豆包手机,还是 OPPO 的小布身上,我们其实都看到了:

所有的手机 OS 都在变成 AI OS(或者 IS),这种趋势是无法反转的。

相比谷歌在 Android 里面到处推销 Gemini,OPPO 做 AI 的特点是很鲜明、也很不同的——

OPPO AI 的本质不是卖模型,而是卖装着 OPPO AI 的手机、卖一个有软件加持的硬件产品。

OPPO 设计这些功能的底层逻辑,不是希望用户去买「小布 Premium」,而是追求在很多实用场景里面「比别人多走一步」,把用户的体验给圆上。

这也是我们在使用 ColorOS 的 AI 功能时感受最深的一点:

与其削尖脑袋推销 AI 订阅,反而是把 AI 智能做得「无感」更容易让人接受。

毕竟真正优秀的 AI 技术,就应该像电力、自来水一样无感:用户只有在它不在的时候,才应该意识到它的存在。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

用 Codex 优化网速狂飙 900Mbps?实测之后我发现了新的隐藏玩法

昨天,Codex 再一次重置了额度,我们的账号从剩余 10% 又回到了剩余 87%。

Codex 负责人 Tibo 在 X 发文,

有些用户注意到 Codex 中的缓存限制消耗得更快,我们发现根本原因是之前的一个优化措施,该措施在长时间运行的会话中进行压缩时会影响缓存命中率,我们已将其回滚。

 

 

我们已修复此问题,并已重置所有账户的使用限制。祝您周末愉快。

于是又想着还可以用 Codex 来做点什么,刚好就在 X 上刷到了「我用 Codex 提升了我的电脑网速,从 400Mbps 到 900Mbps。」

内容真的很有噱头,用 Codex 竟然能优化本地的网络?网速不应该是受限于路由器,或者网络服务提供商 ISP 这些上层设备吗?

这则推文的评论区也有不少网友提出了质疑,「所以 Codex 最终改变了电脑上的什么配置?」、「鉴于如今 AI 的强大技术,我真的无法判断这是否是诱饵。」

博主做出解释,Codex 帮助他把电脑上的 auto tuning level 从关闭调回了 normal 正常。auto tuning level 是说系统会根据网络延迟、带宽和拥塞情况,动态决定一次能接收多少数据,从而提高网络的速度。

他还给出了自己用的提示词。

嘿,我朋友说他的网速提高了,情况是这样的。你能帮我看看我们家的网络有什么可以改进的地方吗?我的网络供应商说他们提供的带宽是 1.2k Gbps,而我实际的网速是硬件问题。我现在只有 55Mbps,请帮我解决这个问题,别出错了。

 

我的目标很简单,就是让我的互联网速度更快。
问题已诊断:首先运行了 speedtest-cli。
检查了 DNS 解析时间,
检查了 MTU、丢包率、Wi-Fi 信号/干扰情况。
发现 3 个问题。
已删除过时的网络位置/配置文件。
终止或限制占用大量带宽的后台进程。
优化 mDNS。
进行了测试前后的速度测试和延迟检查。

这套提示词来自另一个 X 博主@cjzafir,他分享了自己使用 Codex + GPT 5.5 的实际案例,里面提到了 Codex 5.5 让他的网速变快了,本地运行的 6B 小语言模型速度更快了,以及 Macbook Pro 运行速度也像新的一样快等等。

我们也拿着这套提示词发给 Codex,在要求 Codex 处理网速问题前,先用中国科学技术大学测速网站 https://test.ustc.edu.cn/ 看了一下大概的速度,基本上下载速度在 100Mbps 左右,上传是在 200 Mbps 左右。

Codex 确实按照这些诊断,从 DNS 解析时间,数据包、网络配置等方面,检测并修复了对应的问题,累计处理时间超过五分钟。

最后 Codex 得出的结论是「我检查并做了能安全完成的修复。」它找到了 3 个存在的问题,分别是 DNS/缓存异常、负载延迟很高,以及有线千兆网卡没有在用,Wi-Fi 不能作为 1Gbps 的验收依据。

再次测试,发现似乎并没有很明显的网速提升。

有人问那位博主,是不是使用的 Mac 电脑,他回复说是 Windows,底下还有网友科普,Mac 的网络配置都是固定了,Codex 一般是无能为力。

所以这次轮到 Windows 用户来享受 Codex 网速提升服务了?还有 Linux。

有评论说,「以为是用 Codex 入侵了网络服务提供商,然后提高了流量限制」,结果只是 Codex 帮忙清理了一下 DNS 缓存。

但也有网友分享照着这个方法,成功复现了,Codex 确实让它的网速变快。

大家要是感兴趣也可以试试,不过 Codex 修改这些网络配置还是有一定的风险,评论区还有人提到 Codex 把他原有电脑的网络配置都删掉了,然后 Codex 跟他说,删掉它们是为了让网速更快。

这些涉及到 Computer Use 的使用案例,大概都会有类似的问题,除了每一次更细心的看懂允许 Codex 执行的是什么命令,还可以在提出任务时,就要求它解释清楚它要做的每一步。

如果不做修改,只是让 Codex 去诊断一些可能存在的网络配置问题,我想也比那个一直停留在进度条的自带 Windows 诊断要强。

开始了,Codexmaxxing

当大家都在讨论 Codex 是否能真的提升网速时,也有网友提到这种用法其实是一种启发。

他说这种做法的核心价值在于靠案例驱动,让 AI 直接参考成功的经验,再针对自己的具体情况进行精准诊断和优化,而类似的提示词技巧在 Agent 产品上将非常有效。

这很像 Codex 里面的 /goal 命令,给他一个目标,这个目标可以是我们自己设置的,也可以是其他用户已经有的成功案例,Codex 照着这个目标,自己去摸索可以实现的路径。

在社交媒体上,也有很多人开始分享这些写目标的模板,以及 OpenAI 的工程师也专门写了一篇文章来讲清楚什么是目标,如何用好目标来发挥 Codex 的最大价值。

/goal <期望的最终状态>,通过 <具体证据> 验证,同时保留 <约束条件>。使用 <允许的输入、工具或边界>。在各次迭代之间,如果受阻或没有剩余有效路径。

也有人认为这只是 Codex 的早期阶段,所以我们才需要学习这么多的提示词技巧,无论是使用案例驱动还是使用 /goal 命令,本质上都是为了让 AI 能更好的理解人类的需求。

就像 Midjourney 、Nano Banana 刚推出时,我们都热衷于找各种公开的提示词;而现在使用 GPT Image 2 在大多数的生图场景下,基本上都不需要专门的提示词格式,就能得到不错的效果。

等到 Codex 越来越好用,我们或许也不再需要这些官方使用模板。但从另一个角度来看,或许就是在这种模仿使用的过程中,我们才会更知道 AI 是如何提升我们的生活和工作效率。

因此,除了提升网速,我们还看到了一些 Codex 的其他玩法。像是使用 Codex 的定时任务,让它每天早上自动产出一份对应行业的日报;还有让 Codex 也能获得自我进化,从过去的对话里面提取出有用的技能;以及直接构建一个 macOS 应用;把 DeepSeek 接入 Codex 客户端等。

▲ 图片来源:X@hqmank

我们也继续尝试了一下那套让 Codex 自进化的提示词,它花了 7 分钟,帮我们创建了 3 个 Skills。

▲ 提示词来源:https://x.com/reach_vb/status/2058538305872949490

感觉这套提示词不仅仅可以用在 Codex 里面,几乎所有的 Agent 产品,都可以用它总结出一些可复用的流程,以子 Agent、Skill,或者自动化的形式重新编排。

回顾我最近 30 天的工作,若历史记录不足则查看所有可用历史,并识别值得打包的重复性手动工作流。

按以下顺序使用可用证据:
– 最近的 Codex 会话和任务摘要。
– Codex Memories 和 rollout 摘要,用于寻找跨会话重复出现的模式。
– 如果启用了 Chronicle,用它发现 Codex 之外的重复工作。Chronicle 仅用于发现;重要细节尽量回到相关源系统确认。
– 现有技能、自定义智能体和自动化,优先复用或扩展已有内容,避免重复建设。

广泛寻找那些重复、耗时、容易出错、依赖上下文,或适合标准化流程的工作。范围包括编码、研究、写作、规划、沟通、运营、分析,以及个人事务管理。

只有满足以下条件时,才把候选项纳入:
– 至少出现过两次,或明显会重复出现且重复成本高;
– 输入稳定、步骤可重复,并且输出或结束条件明确;
– 能明显提升速度、质量、一致性或可靠性;
– 当前还没有被充分覆盖。

选择最小且合适的形式:
– Skill:可复用的工作流或操作手册。
– 自定义子智能体:适合委派的、有边界的专项角色或调查任务。
– 自动化:定时或周期性的检查、报告、提醒或监控。
– Skip:过于一次性、模糊、敏感,或证据不足,不适合打包。

先输出一个简洁候选清单,包含:
– 重复工作流
– 支持证据与日期
– 频率 / 置信度
– 推荐形式:skill、subagent、automation、扩展已有内容,或 skip
– 为什么值得或不值得创建

然后只创建高置信度且当前缺失的项目。保持范围狭窄、实用、了解数据来源,并且容易验证。不要创建猜测性的、重叠的,或过于宽泛的资产。

最后总结:
– 你创建或扩展了什么
– 你刻意跳过了什么
– 哪些内容还需要更多证据后才能打包」

我们还依照 Tibo 分享的使用 Codex 来取消我们不需要的付费订阅服务,由于订阅项目较少,但是有很多无意中订阅的 newsletter,所以我们输入「请查看我的电子邮件,列出我付费订阅的所有服务,以及订阅了哪些邮件通知,并和我确认哪些需要取消订阅。」

Codex 很快就调用了浏览器使用的工具,打开 Gmail,检查我的电子邮箱,发现付费订阅的项目较少,着重为我列举了一些「可退订的邮件通知」。


Codex 会自动搜索相关的邮件

新加入 OpenAI 的员工 Jason Liu 也分享了如何榨干 Codex 的用法,他提到自己喜欢使用 Codex 的语音输入功能,所有的对话线程不再一次性重置,而是跨对话保留上下文,以及使用 Obsidian 库来作为 Codex 的持久记忆层。

前段时间,我们分享了一篇文章,是说几乎所有模型公司,都要做自己的 Agent 产品,模型公司和产品公司之间的界线会越来越模糊。

OpenAI CEO Greg 在 X 发文也提到他认为仅凭模型本身已经不再是产品;Google AI Studio 负责人 Logan 在跟帖中回复,模型、工具和产品之间的共生关系如今已成为一种趋势。

从目前来看,Codex 大概会是体现 OpenAI 模型能力最有力的一个产品。

▲ Codex 重新设计了网站主页,让它更像是一个能为所有人提供帮助的 AI 工作助手,而不是仅限于帮助开发者做代码补全

Codex 负责人 Tibo 提到「总体规划是发布更好、更高效的模型,并且每周都发布更好的产品。还要增加计算能力。」

能从龙虾、Claude Code 这些先占领市场的 Agent 产品里脱颖而出,Codex 的进展确实让人值得期待。不过, Tibo 还贴心地提醒我们,好用,也记得多出去走走,Codex 没法替我们体验真实的生活。

▲ 龙虾之父已经对 Codex 上瘾了,留言说起来容易做起来难

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

华为提出「韬定律」,寻找国产芯片自己的进化方向

5 月 25 日,由电气电子工程师学会(IEEE)举办的「国际电路系统研讨会」ISCAS 2026 在上海举行。

在会上,华为半导体业务部总裁何庭波进行了题为《半导体新路径探索与实践》的演讲,提出了一个全新的半导体发展定律:

应当以「时间缩微」替代「几何缩微」作为半导体与电子系统演进的新指导原则,通过逻辑折叠(LogicFolding)等创新技术,持续压缩信号传播时延、提升晶体管密度,从而实现半导体与电子系统的持续演进。

图|微博 @人民日报

这个足以与年过半百的「摩尔定律」并驾齐驱的新理论,被华为称为「韬定律」(Tau Scaling Law)。

什么是韬定律

对于韬定律,我们首先需要知道的是:

「韬定律」里的「韬」不像摩尔定律那样,代表某个人的名字,而是集成电路设计中的时间常数 τ(希腊字母 tau)。

τ 本身的概念非常简单,它代表了电路中信号电压发生转变(充电或放电)的快慢程度,可以用基本公式 τ = 电阻R × 电容C 来计算。

更笼统地说——虽然我们通常将芯片二进制信号 0 和 1 理解成「非此即彼」的状态,两者之间是瞬间切换的,但在现实世界中并非如此。

由于芯片和导线内部存在着各种形式的电阻和电容,表示 0 和 1 的电信号其实不是瞬间跳变的。

这种信号变化更像是电池一样:充电快满了才算「1」,几乎把电放空才算「0」。

而在「从空充满」和「从满放空」之间会有一个极为短暂的切换时间,这个时间就是 τ 。

因此,你可以把 τ 理解成和 GHz 类似的「频率参数」,两者是相辅相成的——

τ 值越低,芯片区分 0 和 1 的速度就越快,晶体管开关切换的频率就越快,芯片每秒钟执行指令的速度 GHz 自然也越高。

过去五十多年里,晶体管的体积占芯片大头,τ 延迟的主要来源是晶体管,摩尔定律指导下优化晶体管的体积对于频率提升的收益是显著的。

如今 3nm、2nm 晶体管自己的延迟极小,但周围导线被迫做得极细,反而导致内阻升高、τ 变大,宏观表现就是芯片提频越来越困难。

正是在这种背景下,华为的「韬定律」提出换个方向,不再以晶体管密度作为芯片未来发展的衡量标准——

晶体管密度本身已经不再是制约频率的主要因素了,未来如何通过其他综合手段降低 τ 值,才是提升芯片频率和效能的新追求。

立体堆叠将成为主流

再回看何庭波的那句话,就可以看到华为不仅提出了一个面向未来的定律,也给出了新定律之下芯片发展的具体方法之一:逻辑折叠(LogicFolding)

这个词看上去非常高大上,但它代表的东西很简单——芯片立体堆叠。

换言之,既然如今导线成为了延迟的主要来源,那就将原本铺在平面的电路设计成 3D 结构,避免导线绕路、降低内阻,从而优化 τ 延迟。

这也正是全球主要芯片设计商和制造商们集体选择的道路。

英特尔的 Foveros、AMD 的 3D V-Cache 以及台积电的 SoIC,本质上都是芯片线路立体设计的不同方案。

这样一来,原本「绕几百微米的路」变成了「爬几十微米的楼」,导线的电阻和寄生电容都可以有效降低,优化 τ 延迟、提升宏观频率。

除了通过立体堆叠缩短线路长度之外,整个半导体行业也在不约而同地转向另一项技术:背面供电(Backside Power Delivery)。

根据计算,在 5nm 及以下节点,供电网络本身需要消耗晶圆表面近 40% 的面积资源。

这就导致信号线为了给供电线和其他结构让路,往往需要在布线上反复迂回:

图|哔哩哔哩 @极客湾

再加上自己被晶体管挤压得越来越细,结果就是显著增加信号线的平均长度和寄生电容,导致 τ 延迟失控。

而英特尔的 PowerVia 搭配 RibbonFET 晶体管技术,在试验中可以实现超过 90% 的标准单元面积利用率,极大减少了芯片布线的压力。

目前虽然无从得知华为正在研发何种芯片背面供电网络(BSPDN)技术,但可以明确的是,逻辑折叠技术已经将供电性能考虑在内了:

……在电路层面:采用 LogicFolding 架构打破传统电路布局的物理限制,显著缩短关键路径布线,有效降低信号传播的电阻和电容负载,最终提升晶体管密度和电路性能。

麒麟何时归来

在看过上面一大堆技术术语之后,大家最想知道的肯定只有一件事:

我什么时候能买到?

然而 ISCAS 2026 只是一个技术论坛,何庭波在会上提出的也是一个「定律概念」,两者都更偏向理论指导领域。

而众所周知,理论转换成具有广泛影响力的产品还需要时间。

根据华为官方的介绍,在过去的六年里,华为已基于韬定律设计并量产了 381 款芯片,服务于众多行业、领域和市场客户。

首款采用逻辑折叠技术的麒麟芯片将在今年秋季发布,大概率是 Mate 90 系列产品,可以看作是华为立体堆叠方案在大众市场的首秀。

而到 2031 年,华为基于韬定律设计的高端芯片晶体管密度将会达到等效 1.4nm(14Å)工艺的水平。

直到那时,我们才有机会看到一个「逻辑折叠+背面供电」的华为芯片的终极形态。

值得注意的是,韬定律、逻辑折叠等等技术并不只限于手机——

别忘了,如今的华为电脑、电视、平板等等所使用的芯片,本质上都是麒麟的同源产品。

而更重要的角色,比如未来华为昇腾计算(Ascend)系列的 AI 处理器、计算卡、服务器集群等等产品,无疑将会是韬定律的第一批受益者。

图|华为

同样在 ISCAS 2026 上,何庭波还说道:

……未来一定属于开放合作。在半导体演进的路径上,没有一家企业可以独自完成所有答案。

在韬定律的路径下,我们期待与全球科学家、工程师和产业伙伴紧密合作,共同推动半导体与电子产业持续发展。

当经过反复更新的摩尔定律依然难以客观反映现实的时候,技术行业是时候探索一个新的指导理论了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

DeepSeek 要用蜜雪冰城的打法,做中国版 Claude Code

DeepSeek 之于大模型,就像蜜雪冰城之于奶茶。你不必纠结性价比,因为它的本事你挑不出毛病,你的钱包它也从不为难。

最近,DeepSeek 官方宣布,DeepSeek-V4-Pro 模型 API 将永久降价。同时,DeepSeek 表示,API 已完成输出提速与服务扩容,速度更快,服务更稳定,默认支持 500 并发,企业用户可以在线申请更高并发。

发布模型,再给出折扣,接着降低缓存命中价格,最后把临时优惠变成长期价格。大模型 API 的价格基准正在被重新改写,而低价模型背后的下一站,很可能是 Agent。

DeepSeek 永久降价,梁文锋把 Token 价格打骨折了

让我们先来简单梳理一下 DeepSeek 的降价时间线:

  • 4 月 24 日,DeepSeek V4 预览版正式发布。
  • 4 月 25 日,DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。
  • 4 月 26 日,DeepSeek 宣布缓存命中价格调整为首发价的十分之一。
  • 4 月 28 日,DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。
  • 5 月 22 日,DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。

时间线的关键之处,在于临时折扣变成了永久降价。调整之后,DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元,输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元;

输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后,官方 API 对开发者和企业的吸引力进一步提高。

▲ 🔗 https://api-docs.deepseek.com/zh-cn/quick\_start/pricing

而价格下调最直接的影响,是把任务成本推到开发者决策的更前端。

在代码场景里,一次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试,Tokens 消耗很容易放大。

长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些高消耗场景,开始更接近个人开发者和小团队的预算范围。

过去,开发者选择 Claude、OpenAI 或 Gemini,主要看模型能力、稳定性、生态和使用习惯。DeepSeek 打骨折的永久降价,也意味着在绝对的性价比面前,开发者使用习惯也是可以轻易改变的。

顺着这条线,DeepSeek 一贯的市场角色也更清楚了:用低价、开源和强推理能力,持续建立大模型市场的价格优势。对国内模型厂商来说,V4-Pro 永久降价相当于重新划了一条 API 定价线。

智谱、MiniMax、月之暗面这类同样依赖 API 收费、又面向开发者和企业客户的模型,压力可想而知。反观 Claude、OpenAI、Gemini 等海外头部模型,由于市场、客户结构和生态位置不同,短期冲击则相对有限。

但如果 DeepSeek 后续推出类似 Claude Code 的编码工具,再用低 token 成本支撑高频调用,价格敏感的开发者群体会更容易被吸引过来。

梁文锋此前对 DeepSeek 定价哲学的解释,也能放到今天理解。

早在 2024 年 DeepSeek V2 降价时,梁文锋就提到,DeepSeek 只是按照自己的节奏做事,核算成本后定价,原则是不贴钱,也不赚取暴利。他还说,降价一部分来自下一代模型结构探索带来的成本下降,另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。

比起把 API 当成高毛利收费入口,DeepSeek 则更像是在用过硬的 Infra 实力压低推理成本,再用低价吸引开发者、应用和下游生态进入自己的轨道。

X 平台博主 @bookwormengr 最近在一篇题为《DeepSeek’s 10 trillion USD grand strategy(DeepSeek 的十万亿美元棋局)》的长文中,给出了一个更激进的解释。

他认为,DeepSeek 的真正目标未必是和智谱、月之暗面、MiniMax 竞争,也不是急着补齐多模态、语音、视频这些产品线,而是通过持续降低训练和推理的资源需求,推动一套更便宜、更分散的 AI 硬件生态成形。

在他看来,DeepSeek 的长期价值不只在模型本身,而在于让更多国产存储、GPU、ASIC、网络芯片和异构硬件进入大模型训练与推理体系。

这个判断未必能完全兑现,但它解释了 DeepSeek 一系列选择背后的方向:

MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang,表面上看是模型架构和推理工程优化,往深处看,都是在降低对高端 HBM、顶级 GPU 和 CUDA 生态的依赖。

一系列降价公告里,最值得关注的不只是输出价格下降,还有缓存命中价格下降。

在大模型推理过程中,KV Cache 是一个关键成本项。模型处理长上下文时,需要把历史 tokens 对应的 Key 和 Value 存起来,后续生成时反复使用。上下文越长,需要保存和读取的缓存越多,对显存、带宽和存储系统的压力也越大。

普通聊天里,缓存压力不一定明显,但在进入代码、长文档和 Agent 任务后,成本结构会迅速变化。@bookwormengr 在长文里专门算了一笔 KV Cache 账。

他以 100 万 tokens 上下文、8 bit KV 精度和 16 bit 索引精度为前提,估算 DeepSeek V4 只需要约 5.48GB HBM,而 GLM5 约为 60GB,Qwen3-235B-A22B 约为 89GB。

长上下文和 Agent 任务真正贵的地方,不只是模型生成本身,还有缓存、显存、带宽和重复上下文搬运。

一个 Code Agent 处理项目时,可能要反复读取同一个代码库结构、同一批文件、同一段任务历史、同一套系统提示词和同一批测试日志。若每一轮都按完整上下文重新计费,长任务很快会变贵。缓存命中价格下降后,重复上下文的成本会明显变低。

DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和推理效率上持续投入的表现有目共睹。降价是技术迭代后的必然结果,也将彻底搅动 AI 编程市场格局。

为什么必须做中国版「Claude Code」?

最先被牵动的,是 AI 编程工具的订阅模式。

市面主流 AI 编程工具均推出 Coding Plan 月付订阅,为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代,单次调用消耗极低。

但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码,模型可独立完成代码修改、测试运行、报错修复,单次任务 Token 消耗大幅提升。

当底层 API 又同时大幅降价,Coding Plan 也必须找到新的支撑点。这个支撑点,更可能落在工程能力上——比如能不能更好地读懂项目结构,能不能精准选择上下文,能不能控制 tokens 消耗,能不能稳定修改代码,能不能处理 Git、终端、CI/CD,能不能在企业环境里管理权限和审计记录?

同样要重新定位的,还有 API 中转站。对个人开发者来说,便宜和好用仍然重要。但对企业来说,稳定、可审计、可控、可迁移更重要。

沿着这个逻辑继续看,Coding Plan 和中转站的改变只是表层。低价之后更值得追问的,是开发者入口究竟掌握在谁手里。

Google CEO Sundar Pichai 最近接受了《Hard Fork》采访,他首次公开承认,Google 在文本、多模态、语音、推理和整体智能上都很有竞争力,但在 agentic coding 这一类能力上,尤其是工具调用、指令跟随和长周期任务,目前还有差距。

他还提到,更关键的是把模型放到真实世界里使用,让数据回流,继续迭代。Pichai 特别说到,coding 是一个需要接触 data flows(数据流)的领域。

终端工具能看到开发者如何提出任务,如何追问,什么时候接受建议,什么时候放弃,什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变更和 Git 提交,判断一次 Agent 执行是否完成任务。这类数据,对 coding model 和 Agent 产品都非常有价值。

从公开招聘动作看,DeepSeek 近期围绕 Agent 的动作也变得密集。

我们也可以看到岗位里出现了 Agent 深度学习算法研究员、Agent 数据策略工程师、产品经理、研发工程师等角色。更关键的是,DeepSeek 资深研究员陈德里直接发出招聘信息,提到要从零开始构建 Code Harness。

如其所说,Model + Harness = Agent,在 Agent 产品中,模型负责理解和生成,Harness 负责把模型能力带入真实工程环境,相当于模型外面那套「执行系统」。

DeepSeek 版 Claude Code 不能只给开发者一个对话框,而要给开发者一个能持续执行任务的工程系统。

崔添翼加入 DeepSeek 后受到关注,也和 Code Agent 的工程属性有关。

公开信息显示,崔添翼本科毕业于浙江大学计算机系,曾因信息学竞赛保送浙大,6 次获得 ACM 亚洲区域赛金牌,之后在 Jane Street 工作 9 年,并联合创立 TSY Capital。

Code Agent 的难点不只是生成代码,还要在真实项目里持续执行任务。量化交易系统长期强调低延迟、稳定性、自动化执行和风险控制,这些经验放到 Agent Harness 上,至少在工程范式上是相通的。

而 Agent 工具的产品能力,不只包括写代码,也包括权限、审计、数据隔离和安全策略。

这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来,它在政企、金融、制造、能源等对数据敏感的行业里,会有更强的替代价值。

DeepSeek 做中国版 Claude Code 的逻辑也正在于此:低价 tokens 把更多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。

就像滚下坡的雪球,越滚越大,滚得越快。降价只是推下山的第一把力,往后它会自己越滚越沉,谁也拦不住。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Codex 这波大更新后,Mac 的含金量再次提升

「如果这条推文获得了一个赞,Codex 重置额度限制。」

已经数不清这是今年以来,第几次的限额重置了。奥特曼前两天在 X 发文,让 Codex 负责人 Tibo 再一次重置了使用限额。

网友做了一张梗图,每当一个人想走向 Anthropic 或 Gemini 时,奥特曼站在后面默默按下 Codex 限额重置的按钮,这个人就会回头,然后被拉回到 OpenAI。

OpenAI 这半年也因为出圈的 Codex 收获了一大批的新用户。外媒报道 OpenAI 第一季度营收达到了 57 亿美元,比 Anthropic 高出 10 亿美元,Codex 是主要因素。

▲ OpenAI 营收相关数据,季度营收达到 57 亿美元,年化收入 250 亿,第一季度调整后的营业利润率为 -122%,本季度周活跃用户平均约为 9.05 亿,在 2 月份的周活跃用户数曾达到约 9.2 亿,第一季度的付费用户数量为 5500 万,高于去年年底的约 4700 万。

我们在之前介绍过 Codex 的入门指南,从 ChatGPT 官网下载安装到连接手机上的 ChatGPT App 实现远程控制,都有详细的步骤。

不少读者在评论区留言,Codex 确实好用;也反馈了不少问题,像是下载 Codex 后仍需绑定手机号才能使用。我们的测试也发现登出之后再登录,确实会被要求绑定手机号。

这个时候,建议先在浏览器中进行登录,即主动打开网址 https://auth.openai.com/log-in 提前登录好。再回到 Codex 中登录,弹出的登录链接,只会显示要求授权即可,不会再有绑定手机号的提示。

不同的账号可能会遇到不同情况,大概也是眼下 OpenAI 在 Codex 这边投放了太多的算力,不希望被用户太轻易地薅走羊毛。

今天凌晨,Codex 又上新了一大波的新功能,现在只要按下电脑上的 Command-Command 键,就可将应用程序窗口附加到 Codex 的对话线程里。Codex 会自动获取窗口的屏幕截图和文本,包括屏幕上不可见的内容,作为对话的上下文。

以前还要自己手动截图,现在 Codex 不仅能处理截图,还能直接读到一整个应用窗口的信息。

此外,上次更新的在 ChatGPT App 内操作电脑上的 Codex 这一次也升级了,之前的选项是保持 Codex 常开,现在是即便电脑锁屏了, ChatGPT 同样能远程操作 Codex。

/goal 命令这次也从实验室版本来到了正式推出。之前我们分享多 Agents 协作时,就有读者提到 /goal 功能和多 Agents 类似,它们都是把一个任务当做一个项目来进行管理,有完整的目标生命周期,通过不同的机制来完成迭代。

/goal 最早是 4 月底出现在 Codex CLI 中,有了它确实也能更好的处理越来越多的长任务。

不过遗憾的是,无论是按 command 还是锁屏后继续远程控制,这些都是 macOS 平台的更新,对于 Windows 用户,只能等 OpenAI 的推进。

有网友说,「Mac 用户总是能享受到好东西,而 Windows 用户只能眼巴巴地看着,哈哈。」不得不说,Mac mini 作为 AI PC 的含金量还在增加。

省去很多麻烦的应用快照

这项功能叫 Appshots,开启它的方式也很简单,更新 Codex,在应用设置下,找到「应用快照」,就有一段视频教程,并且可以自定义快捷键。

不过需要注意的是,按下 command 键是指按下键盘上,空格键左右两边的两个 command 键,而不是单击两次。

在任何界面同时按下两个 command 键之后,Codex 会自动捕获页面截图,并快速打开 Codex 将截图放在输入框。我们可以针对这个窗口快照提出问题。

但基于 Codex 的能力,这个窗口快照不单是一张图片的 OCR 文本提取。Codex 可以再这个窗口的基础上,进一步使用 Computer Use 和 Chrome 自动化等功能。

▲ 图中只是在 Codex 的文章开头按下了 command,但是 Codex 不单是处理这张截图,而是会根据 Chrome 的能力,读取整个窗口。

例如,我们在飞书文档的文章开头同时按下了 command 键,然后告诉 Codex 要求它看看这个窗口讲了什么。Codex 会使用 Google Chrome 的工具,自动对网页进行浏览以获取更多的上下文。

这是它和一般截图最大的差别,除了把截图内容放进了上下文,Codex 还会自动把窗口的信息,来自哪个应用等状态信息,同步发送给 Codex。

▲ Codex 识别到了开头之后的文章内容

例如我们在微信里阅读公众号时,也能按下两个 command 键,开启 Appshots。但这里有一个小 Bug,当 Codex 使用 Computer Use 来控制微信的窗口,上下滑动公众号,退出图片的预览时,直接把微信给登出了。

▲暂不知道是微信识别到机器人操作的原因,还是 Codex 误操作,在退出图片预览时,直接退出了微信。建议用小号尝试 Computer Use 在微信中的应用。

官方在宣传视频里介绍 Appshots 时,同样不是简单地将它作为一张截图来使用,而是结合了 Computer Use 和 Google Chrome 来使用。

像是直接要求它修改我们的备忘录内容。

▲花了两分钟,帮我把备忘录的内容修改成了中英双语显示,直接在原备忘录上进行修改

还有也不用再复制什么图片,直接 command+command 然后告诉他生图提示词,对图片进行编辑。

▲ 在浏览器中打开了一张图片,告诉他生成涂鸦版本

就是这种应用多做了一步的感觉,我们就减少了很多 AI 的使用负担,让 Codex 的体验也变得更加丝滑。

/goal 的保姆级使用指南

在对话框内输入斜线,我们就能看到有「目标」的快捷选项,「设置 Codex 将持续努力实现的目标。」

目标存在的价值是作为一个独立存在的任务定义,而不是普通的对话提示词。Codex 会反复根据目标来判断「还该做什么」和「是否已经完成」,自动一轮接一轮的推进,直到任务完成、暂停或者烧到 Token 上限。

这两个判断也是目标的核心机制,即「延续」和「完成审计」。「延续」是在每轮结束后,自动注入提示,让模型决定下一步。「完成审计」是要求模型对照目标逐条核对。

Goal 模型最容易踩坑的地方,就是随手写一句话放进去。要写好一个 Goal,关键原则是 Codex 要能判断是否完成了。

官方在帮助文档也提到,好的目标应包含具体的结果、可衡量的指标或测试标准。他们给了一些案例,像是将项目从一种编程语言迁移到另一种编程语言。

把这个项目从 JavaScript 迁移到 TypeScript。

 

要求:以 strict 模式编译通过,不允许出现显式的 any 类型。

还有更直接的要求,「把首页的可交互时间压到 1 秒以内。」

这些例子都是有着具体的可验证标准,并不是「优化一下」、「完善一下」这种虚词。

 

▲ 图片来源 Goal 官方使用教程:https://developers.openai.com/cookbook/examples/codex/using_goals_in_codex

如果没有想到具体标准,Codex 建议是先跑 /plan。让 Codex 和我们讨论一轮,把验收标准定清楚,再切回普通模式下 /goal。

还有一些实用小建议是,可以在 goal 文本末尾加一句 Use a token budget of 80000 tokens for this goal,用来设置 Token 预算。

以及不要在一个会话的开头就发送 /goal,而应该是先给这个项目其他的需求,有一定的雏形,再给它目标。

锁屏了,Codex 还能操作你的电脑

除了这些大的更新,Codex Thursday 还带来了很多体验升级的功能。

Locked Computer Use 是最值得一提的一项,简单来说它就是能让 Codex 在 Mac 锁屏之后,仍然能在后台操控桌面应用完成任务。

网友对这项功能的评价,都集中在这是突破性的,这很有未来感的同时又很吓人。

如果 Codex 能够在没有活跃用户会话的情况下运行 Mac 应用,这或许是迈向持久 Agent 基础架构的第一步。

若要使用锁屏后继续操作的功能,必须由我们手动开启,并且输入密码。打开的方式同样是在设置里,找到电脑操控,开启锁屏操作。

正常的 Computer Use 需要屏幕处于解锁状态,Codex 才能「看到」并操作界面。这个功能打破了该限制,我们可以把 Mac 合上或锁屏,然后从手机、iPad 或另一台设备远程发起 Codex 任务,它会自动临时解锁、完成操作、然后重新锁上。

Codex 为此安装了一个 Apple Authorization Plug-in(苹果官方授权的认证插件),接入 macOS 的解锁流程。当有活跃的 Computer Use 任务时,插件允许 Codex 临时解锁屏幕;任务窗口之外,解锁权限直接拒绝。

OpenAI 也对这个功能做了几层约束,防止它变成其他危险操作的后门:

  • 解锁窗口极短,仅限当前 Computer Use 操作期间有效
  • 覆盖所有显示器,临时解锁期间屏幕内容对物理旁观者不可见
  • 检测到本地输入立即重锁——有人碰了键盘或鼠标,自动暂停,要求手动解锁
  • 这个路径只对 Codex 开放,其他应用或本地进程无法借道

另一项高级标注的功能,则是我们在使用 Codex Vibe Coding 某个网页时,通过 Codex 内置的浏览器打开,同时还提供了直接在网页内容上进行修改的标注工具。

除了 Codex 这一系列的更新,今天 ChatGPT 也上新了一项新功能,ChatGPT 现在可以直接在 PowerPoint 中创建和编辑演示文稿,并且还能使用 GPT Image 2 生成用于 PPT 里面的图片。

Codex 越来越好用的同时,钱包燃烧的速度也在加快。

我们的 Pro 账号,每周使用限额要到 27 号重置,但是今天(22 号)就只剩下 10% 了。只能在心里默默「作法」,祈祷它再一次重置。

如果这篇文章获得了一个赞,你的 Codex 有可能重置额度限制🐶

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

体验完腾讯发布的 Marvis 助手,我发现个人 AI 的尽头是操作系统

1995 年,微软内部搞过一次颇具乌托邦色彩的尝试。

他们觉得当时的 Windows 系统操作太复杂,于是想把电脑桌面直接做成一个普通人看得懂的「房间」。你想打字就点桌上的笔记本,想看时间就点墙上的挂钟,不用思考那些反直觉的操作路径。

这个产品叫 Microsoft Bob,结果上市没多久就光速下架了。原因五花八门,但究其根本,它并没有真正渗透进系统底层,只要用户的需求稍微复杂一点,就只能无能为力了。

三十年后,很多 AI 助手依然没有完全走出这个困境。

最近我体验到了腾讯新的 AI 助手 Marvis 马维斯 ,终于看到了一些不同。

相比于别人都在卷谁是 AI chatbot,Marvis 想干的是直接把整台电脑变成你可以随意使唤的搭档。官方给它的定位也正儿八经,叫「操作系统层级的个人 AI 助手」(官网:marvis.qq.com)。

不过,当我知道它背后是那个做了 14 年应用宝的团队时,就不觉得意外了:这种长期在 PC 和移动端底层生态里打拼的出身,恰恰意味着它不仅懂 AI,更懂设备和系统。

目前,Marvis 已率先覆盖 Windows PC 与 Android 手机端,iOS 和 macOS 版本也在推进中。APPSO 也在评论区准备了一些福利邀请码,手慢无。

六个 Agent,一支随时待命的私人 AI 团队

安装过程不算复杂,但对设备有点要求。Windows 端最低门槛是 8 核 CPU、16GB 内存加上固态硬盘。而且据官方透露,未来还会逐步兼容 6 核。

市面上很多 Agent 产品动辄让用户自己去搭工作流、安插件,Marvis 则是开箱即用,六个 Agent 零配置上手,对普通用户非常友好。刚进界面,里面已经有六个 Agent 在 7×24 小时待命了。

六个 Agent 都有自己的工位。没接到任务的时候,有的在打盹,有的在办公室里闲逛,有的在健身,有的在喝咖啡,还有的直接去上厕所,一旦你发出指令,任务就会拆解分配给对应的成员。

这是一个分工明确的团队:PM 负责听懂你的需求,拆解任务往下派活;File Agent 处理文件的搜索、阅读和格式转换;Computer Agent 专门对付系统配置、查硬件、调夜间模式;APP Agent 负责在各种软件里代为操作,比如查个机票或者电商比价;Search Agent 负责快速从公开资源中定位答案并给出关键引用;最后是个 Browser Agent,定位是网页交互专家,进行网页交互与数据抓取。

任务链比较长的时候,看看这些动画也是别有一番趣味。

最有意思的是,这些 Agent 可以并行工作。举例而言,我先抛出一个需求:「电脑开机太慢了,帮我看看哪些自启动程序没用,帮我关掉。」

注意看,工作日志里还会显示 Token 消耗量,每天的免费额度是 2000 万 Token,堪堪够用。

结果显示,它给每个程序配了「人话版」说明,建议你哪些是可以按需、保留的第三方软件。重点是,涉及这种核心配置修改的操作,它会主动和你确认一下,才会执行。这种「AI 不会自作主张」的机制,稳得让人心安。

电脑用久了,总会碰到几个反复折磨人的小问题。「查看电池健康状况」「网速感觉变慢了,帮我测一下现在的上传下载和延迟。」「想玩个新游戏,帮我检测一下硬件配置,对比最低要求看看差在哪。」

以前遇到这些事,要么去开始菜单里找设置,要么去网上搜教程。现在,说一句话就行了。

Marvis 深度对接了系统信息和配置入口。它能看到硬件参数,也能直接修改系统设置。它不是帮你打开「控制面板」然后让你自己找,而是直接把事情办了。对于那些不熟悉电脑设置的人来说,这块的体验是最直观的。

举个例子:你想关掉 Windows 锁屏上的广告,你知道它在设置里叫什么吗?叫「关闭 Windows 聚焦」,有多少用户知道这个术语是关广告的?

但 Marvis 能帮你一句话关掉。

本地文件时代,迎来 AI 入口

为了测它的能力,我还翻出了一件困扰已久的事:两个月前从某个群里下载的一张截图,只记得内容是关于《黑神话:悟空》,文件名完全忘了。

我输入:「帮我找一下关于《黑神话:悟空》的图片或截图,大概是一个月前的事儿。」

说实话我没抱太大希望。

但 Marvis 接单后,首先根据 Skill 指引,按文件名关键词和时间范围筛选出 1000 张照片,然后用 Python 快速筛选整个结果文件,并最终找到 8 张候选图。

第一张正是我要找的那张。

而且它的搜索范围极其宽泛:文件名、文档内容、图片里的景、截图里的字,全覆盖。哪怕描述模糊,它也都能捞出来。这个能力,比 Windows 自带的搜索确实强出了一大截。

当然,一听到「扫描图片」,可能会有人担心隐私。首次使用时你可以自己设定扫描范围。如果在生成的图谱里看到不想被索引的内容,右键一键屏蔽即可。而且端侧模型本身自带基础过滤,不是无差别的扫描。

除了找文件,Marvis 还能对本地的文档、表格等多种类型文件做深度理解和分析——支持内容优化、图表生成、文案润色、格式转换,帮原本费时费力的事情变得顺手。

比方说,下载了一批学术论文,摞在那里不知道从哪里读起。直接问 Marvis:「扫一遍这几篇 PDF,告诉我每篇的研究问题、方法和主要结论。」几分钟内,哪几篇值得细读、哪几篇可以先放着,心里就有数了,不用一篇一篇翻摘要。

再比如读完《三体》,笔记记了好几页,马上要在课上分享,手动整理提纲、挑内容、套 PPT 模板,少说也要折腾一两个小时。

但让 Marvis 根据读书笔记,生成一份 PPT,它能读懂笔记里的逻辑和层次,不需要手动复制粘贴再套模板,理解内容之后直接生成。

手机接管电脑,随时随地都能干活

手机遥控操作电脑,则是非常实用的跨端体验。去官网下了 Windows 客户端,再给手机安上 Marvis App,用同一个微信或 QQ 登录,还能直接连通两端。

具体来说,手机 App 连上电脑后,可以在手机上实时看到电脑桌面,并用触屏直接操控。哪怕电脑处于锁屏状态,手机依然可以接管,不需要电脑一直保持解锁状态。

比如我人在外面,突然听到朋友说前阵子新出了一款《洛克王国:世界》游戏,这时我就可以掏出手机输入:帮我在电脑上安装《洛克王国:世界》,回到家就能玩上了。

连接微信 ClawBot,也是没问题的,微信扫码登录后就能开启对话。

但我认为最实用的场景,是给家里长辈远程排查电脑问题。爸妈说「QQ 打不开了」,以前要么电话里盲猜,要么回家处理。现在直接接管他们的桌面,扫一眼就知道问题出在哪。前提是你的手机端 Marvis 马维斯,要能连接爸妈家里的电脑端马维斯,手机端是支持连接多个 PC 设备的。

而如果电脑断网了,手机端会自动切到云 Marvis 模式,支持独立调用云端能力,大部分任务依然能跑。并且这里还有一个独家绝活:在电脑上直接操控手机里的 App。同花顺、飞常准等应用已经在对接合作,这也得益于应用宝团队多年的跨端引擎积累。现在应用宝在移动端、pc 端、车载上都有支持,跨端研发经验充足。

和其他桌面 Agent 一样,Marvis 也支持自定义自动任务。

比如设置一个「深圳厚德品园二手房均价提醒」,填好任务说明——「查询最新二手房均价并通知用户」,再指定执行时间为每周一上午 10 点,之后什么都不用管,到点自动运行任务,并直接推送结果。

另一个值得单独说的功能,是技能(Skill)的自定义扩展。Marvis 支持一键安装专属技能包,提供了不少第三方 Skill,当然,你也可以导入自己常用的 Skill 文件,把它改造成更贴合个人工作流的样子。

有特定行业需求的用户,比如内容创作,理财投资、学术研究等等,不用依赖官方迭代,自己就能把对应的知识库和操作逻辑装进去。

最后,主打出活的 Agent 都绕不开最关键的问题:安全。

Marvis 马维斯提供了两种模式:效率模式和隐私模式。

设置里切到「隐私模式」,Marvis 会加载本地端侧模型,无论是文档还是图片的检索、解析、识别等,全部在本地运行,文件不会出你的电脑,甚至断网了都可以使用。官方所说的「数据不出域」,在拔掉网线的那一刻,有了最真实的体现。

不过,体验「隐私模式」的门槛比较高,要求 16 核以上的处理器、32GB 内存、16GB 显存起步,固态还得匀出 35GB 空闲。

所以平时日常使用切回「效率模式」即可,理解和规划由云端大模型(混元和 DeepSeek V4)完成,执行在本地,速度更快。两种模式按需切换。

让 PC 真正开始「理解」人

我们现在用电脑的方式,本质上还是上世纪八十年代的逻辑:一个需求对应一个软件,你要去找它、打开它、学习它的规则来完成任务。四十年来,软件更多,设置更复杂了,但这套逻辑并未改变,普通用户和电脑之间的距离,也没有真正缩短。

Marvis 的逻辑反过来了:先理解这台电脑里有什么,再决定为你做什么。

拿我爷爷来说,他用了几年电脑,至今不知道「控制面板」在哪。但他知道电脑开机慢,知道想找一张老照片。过去,这个解法是打电话求助子女;现在,就算他不会打字,也可以直接在微信 Clawbot 或者手机马维斯上,把需求说出来,电脑就会帮他做。

文件搜索、系统设置、跨端控制、自动任务、隐私模式、Skill 扩展,看上去是几个不同功能,背后指向的其实是同一个方向:个人 AI 不应该只是一个问答入口,而应该成为设备里的任务调度层。

多说一句,我觉得 Marvis 是有审美的。虚拟办公室动画、任务进度呈现等细节,让它不像冷冰冰的 AI 工具,更像一个有秩序、有分工、也有生活气的小型工作室。

它尤其适合几类人:文件多且乱的本地重度用户;重视数据隔离的财务、法律、医疗从业者;喜欢自定义工作流的效率玩家。和需要靠「养」才能用好的「虾」和「马」,Marvis 初始内置 Agent 和自然语言指令,也足够覆盖多数日常电脑操作,对于很多 AI 焦虑不知道怎么用的人,Marvis 都更加的平权、无门槛、开箱即用。

未来的个人 AI 会像搜索、截图一样,自然地成为操作系统的一部分。三十年前,Microsoft Bob 试图让用户更容易理解电脑;三十年后,Marvis 试图让电脑反过来,真正理解用户。

Marvis 马维斯能走到这一步,和这个有十四年应用商店生态积累和四年跨端跨系统技术积累有关。庞大的用户基数让他们更懂用户在不同设备上需要什么、怎么使用。这种积累很难被纯 AI 公司在短期内平替——他们可以快速训练一个更聪明的模型,却没法快速建立起对 PC 底层和移动生态的控制力。

至此,一个能用自然语言驱动的系统级 AI 助手,在中文生态里终于有了真正可用的样本。

所谓个人 AI 重点从来不只是 AI,更是个人。Marvis 终于让我们看到,当技术选择与每一个具体的需求并肩同行时,它所释放出的力量,既润物无声,又重塑天地。

这是个人 AI 真正开始变得有用的时刻。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

为折叠 iPhone 和苹果 AI 做足准备|苹果 WWDC 提前剧透

今日凌晨,苹果正式发布了今年 WWDC 全球开发者大会的邀请函。

WWDC 26 将于北京时间 6 月 9 至 13 日举行。

今年的 WWDC,除了会正式公布「27」系列系统之外,开发侧重点仍将集中在 Apple Intelligence 后续进展、体验优化等等。

自然,其中也少不了一些苹果针对 AI 时代的软件生态的提前布局。

图|MacRumors

爱范儿今年同样将前往 WWDC 现场,为大家带来 WWDC 系列活动的专题报道,届时请锁定爱范儿主站、微信公众号、小红书和微博上的系列内容。

iOS 27:玻璃、专业相机和 AI Siri

对于 iOS,我们首先需要明确的是:

液态玻璃(Liquid Glass)设计在 iOS 27 中不会退场,它就在那里,稳稳地接住你。

就像刚更新的 iOS 26.5,苹果对于液态玻璃效果的微调也将持续到 iOS 27 里,直到大家习惯或者接受它的视觉风格。

除了继续优化液态玻璃的视觉效果,iOS 27 也被很多媒体和开发者预测为是一次「雪豹」式的更新——

比起新功能,删除陈旧代码、优化性能表现、调整视觉效果和改善整体流畅度将成为这一代 iOS 的主要更新方向。

在支持范围方面,iOS 27「据称」将会支持到 iPhone 12 系列和 iPhone SE 3 为止。

换言之,iPhone 11 系列及更早的机型将无法更新 iOS 27。

而在继续优化液态玻璃的同时,iOS 27 还有可能会在一些小细节的层面,为我们「管中窥豹」一下今年 9 月份即将到来的折叠屏 iPhone。

图|MacRumors

当然,苹果肯定不会在 WWDC 上直接展示有关大屏和横屏布局的优化措施。

但在后续的开发者课堂中,大概率会出现有关自适应 app 布局、不同长宽比 UI 设计规范之类的相关内容。

几乎可以肯定的是,今年 WWDC 上,苹果会在涉及到 iOS 的内容和课程里添加一些有关侧边栏和分屏(或者 Stage Manager)相关的内容,为横屏布局做出铺垫

另外,本次 WWDC 上我们还可能会见到苹果开放一些更加深层的相机 API,或者一些全新的相机玩法。

这些本质上都是为 iPhone 18 Pro 上可能到来的相机「专业模式」做好准备。

根据计划,苹果会让 iOS 27 的相机 app 更具自定义性,用户可以调整相机界的功能开关布局,比如闪光灯、EV、模拟光圈、照片风格和长宽比等等。

图|Shima Zamil

最后不得不提的还有 AI Siri ——

根据彭博社的预测,iOS 27 将会是 Apple Intelligence 官宣两年之后的「汇总落地」。

iOS 27 版本的 Siri 中,苹果预计会拓展跨 app 信息提取、屏幕内容识别、模拟连续操作、app 深层功能集成等等多方面的 AI 能力,努力追赶甚至看齐 Gemini 在 Pixel 上的功能范围。

图|Google

更有甚者,传说中的「对话式」Siri 也有希望在今年 WWDC 上亮相,或者至少看到一些相关的底层功能。

相比以前那个问一句答一句的智能助手,Siri 将会获得类似 ChatGPT 那样的「人味」对话功能。

并且在 Siri 对话中也支持多模态内容,甚至可能会取代原本的「聚焦搜索」功能:

聚焦搜索(左)和 Siri 搜索(右)

至于那些 iOS 26 里面已经存在的 AI 功能,比如图乐园、Genmoji、写作工具之类的,它们在 iOS 27 中也主要将迎来性能优化,并且在新的 Siri app 里面获得单独的入口。

macOS 27:圆角、触屏和 Intel

对于那些熬夜观看 WWDC 的 Mac 用户来说,看苹果整活王 Craig Federighi 怎样宣布今年的 macOS 系统名称,始终是不可或缺的一环。

图|MacRumors

继去年 Tahoe(太浩湖)之后,苹果的商标注册列表上还剩下很多加利福尼亚州的特色。你觉得 macOS 27 的系统代号会是什么?

和 iOS 27 一样,今年 macOS 27 的重点同样是继续打磨液态玻璃优化系统性能,以及落地更多的 AI 功能

不过就像爱范儿之前提到的:

macOS 26 的 UI 问题不止于液态玻璃,不统一的圆角、过于密集的小图标,以及辨识度过低的系统 app 图标,联手造成了 macOS 26 的可读性问题。

图|Reddit

除了赶紧优化系统 UI 之外,macOS 27 的另一大潜在看点则是它对于触屏功能的支持。

彭博社苹果专家马克·古尔曼去年和今年都曾密集爆料过,苹果正在计划开发一款采用触控 OLED 屏幕的 MacBook Pro,上市时间可能在 2027 年内。

图|9To5Mac

macOS 27 虽然不会在 WWDC 上就大张旗鼓地宣传「新增触控支持」,但大概率会按照苹果的风格,做出一些为触控功能铺路的举措——

比如新增多种尺寸的 UI 控件规范、优化 macOS 支持的缩放比例范围、新增一些看上去不太适合鼠标键盘的图标动画等等。

AI 方面,macOS 27、iOS 27 和 iPadOS 27 预计都将迎来一次「相册」更新,照片编辑器里的 AI 工具不再只有橡皮擦,大家习惯的 AI 扩图、自动优化、重构图甚至 3D 照片等等都有望加入。

图|AppleInsider

至于 AI Siri 本身的功能,比如「对话式」沟通、屏幕内容识别、系统级自动化功能等等,macOS 27 能够得到的更新和 iOS 27 差不多。

这也是 iPhone、iPad 和 Mac 处理器同源带来的优势之一。

坏消息是:macOS 27 极有可能会排除所有使用 Intel 处理器的 Mac 产品,仅支持 Apple Silicon 型号的 Mac。

这就意味着 2019 款 16 寸 MacBook Pro、2023 款至强处理器 Mac Pro 等等顶级产品都将无缘 macOS 27,为苹果的英特尔时代画上第二个句号。

图|MacWorld

另有开发者指出,苹果也在逐步停止 Rosetta 2(x86 到 ARM 转译)的更新。

macOS 27 预计将是最后一个完整支持 Rosetta 2 的版本,敦促第三方开发者及时更新 ARM 架构的 app。

稳扎稳打的 27 年

总的来说,和谷歌努力推荐的「Android 全形态化」不同,苹果今年 WWDC 的路线依然是以稳健为主。

iOS、iPadOS 和 macOS 各自的领域划分很明确,虽然产品形态更新,但系统短期内不会出现类似谷歌 Aluminum OS 那样的融合现象。

图|Geeky Gadgets

对于「液态玻璃」来说,在缝缝补补一年多之后,苹果的确需要静下心来,先处理一些由于玻璃 UI 和 AI Siri 烂尾导致的系统基础体验问题了。

至少对于一些旧设备来说,优化后的 iOS 27 很可能会比 iOS 26 更值得更新。

附 WWDC 26 日程表,感兴趣的读者可以通过苹果开发者官网(https://developer.apple.com/cn)注册并参与在线课程:

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

MacBook Neo 杀疯了,英特尔派出「野猫」接招?

今年 3 月,苹果制造了 MacBook Neo 这个大爆款,把高质量入门笔记本的价格打到了 4599 元人民币起。

一个半月后,这台搭载 A18 Pro 处理器的入门款 Mac,全年销量从 700 万台追加到了令人难以置信的 1000 万台,交付周期一度排到了 5 个月之后……苹果紧急向鸿海、广达等供应商追加订单。

知名供应链分析师郭明錤给出更刺眼的数字:在全球 Windows 笔记本电脑预计同比衰退超 10% 的大背景下,2026 年 MacBook 系列出货量有望达 2500 万台,同比增长 20%-25%。

这一拳,Windows 阵营的最核心代表英特尔,该如何接住?

在今天,英特尔在中国正式推出第三代酷睿处理器,代号 Wildcat Lake「野猫湖」,并同时启动了联合产业链伙伴的「Firefly 萤火虫计划」。

英特尔的接招,围绕一件事而展开:

将最先进的 Intel 18A 制程,下放给低端,或是入门,或是「主流」——随便你怎么称呼它的价位段。

野猫盯上新的猎物

Wildcat Lake 这个代号,在去年底就已经在业界出现。

今年 CES 期间,英特尔高调发布了主打高端的产品线:酷睿 Ultra Series 3,采用 Panther Lake 架构。同一天,Wildcat Lake 也悄悄披露,你可以将它理解为 Panther Lake 的精简版本。

业界普遍将其视为英特尔为了对标苹果 MacBook Neo 而推出的产品,专攻平价入门级 PC 市场。

「直接对标」这四个字,并不是说说而已。

在 4 月底,英特尔为野猫湖推出的公版参考设计曝光,采用渐变配色、铝合金一体成型机身、窄边框键盘,扬声器开孔环绕在键盘两侧、D 面无出风口——

这种设计语言不需要过多解释,它就是在用苹果惯常的设计语言,去回应苹果本身最受欢迎的多彩配色与铝合金轻薄机身策略。

在 MacBook Neo 上,苹果做对了一件事:它让整个行业重新意识到,在「内存末日」(RAMmageddon) 的今天,入门价位段成了一座金矿。

用一颗本来进入销库存阶段的 A18 Pro 芯片,配上 8GB 内存和 256GB 存储,开价 4599 元——MacBook Neo 活脱脱成了 MacBook Air 平替。

英特尔,以及整个 Windows PC 阵营不能继续将这个用户群体拱手相让。而这,正是「野猫湖」存在的(几乎)全部理由。

18A 首次下放到入门段

第三代英特尔酷睿处理器的技术参数并不复杂,CPU 采用 2 个 Cougar Cove 性能核,加上 4 个 Darkmont 超低功耗能效核,总共 6 核 6 线程;GPU 部分配备 2 个 Xe3 核心,NPU 算力最高可达 18TOPS。整机基础 TDP 15W,最高 35W,在无主动散热的笔记本上,甚至可以压低到 11W 运行。

按照英特尔今天提供的官方口径,这颗芯片功耗相比前代降低超过 60%,图形 AI 性能提升了将近 3 倍,平台总算力更是达到了 40TOPS。

当然,考虑到「野猫湖」处理器的 NPU 算力只有 17TOPS,远低于 Windows 阵营的所谓「AI PC」,也即微软官方定义的 Copilot+ PC 40TOPS 的阈值。所以严格来说,野猫湖并不能直接和苹果 A18 Pro 高质量的神经网络引擎,以及统一内存架构,去做横向比较。

话虽这么说,驱动参数量不大的本地小模型,做一些 AI 推理任务,还是绰绰有余的。

以及更有意思的是,谷歌前段时间发布自家的 AI 笔记本电脑「Googlebook」的时候,也确认了和英特尔结盟——Wildcat Lake 被海外业界人士普遍认为将会成为是 Googlebook 的核心平台。

连谷歌都觉得够用,应该没大问题吧?

真正关键之处不在于这些参数,而是在于「野猫湖」用上了 Intel 18A 制程工艺本身。

要知道,过去两代酷睿 Series 1 和 2,一直沿用 Raptor Lake-U 架构和 Intel 7 制程,实质上是 10nm SuperFin 工艺的演进版本。

在主流芯片普遍走向 5nm 甚至 3nm 的当下,技术代际差距已经相当明显。

当 MacBook Neo 用虽然是老库存但货真价实 3nm 工艺的 A18 Pro,杀进四千多元的价位段,英特尔过去那套「靠老制程压低成本」的入门策略已经过时了。

所以,我们很欣慰地看到,英特尔将 18A——2nm 级别的工艺,压到一颗入门芯片上。

这意味着英特尔充分愿意承担初期更高的单位成本,去力保一座不能再丢弃的城池。

系统:手机供应链思路搬到 PC 上

对于守住市场,「Firefly 萤火虫计划」同样重要。英特尔副总裁、中国区软件工程和客户端产品事业部总经理高嵩如是说:

芯片本身的算力固然重要,但「芯片和系统层面的双重创新」才是这一代主流 PC 体验跃迁的来源。中国区客户端与平台销售业务部总经理宗晔则认为,PC 也正在从工具进化为「智能体验入口」。

根据英特尔提供的内部数据,与上一代相比,「野猫湖」产品的 PCB 面积缩小了 5%,器件数量减少了 7%。同时针对第三代酷睿平台特性制定并推广标准化主板与 I/O 板连接,推动主板核心电路进一步实现模块化、小型化、低功耗化。

这一套打法的精神底色,其实来自于手机。手机行业过去 10 年磨合出的供应链协同方式——元器件高度集成、模块化主板、统一接口标准,被英特尔搬到了入门级 PC 上。

结果,就是更轻、更薄,也更便宜。

参与「Firefly 萤火虫计划」的合作伙伴,包括但不限于华硕、七彩虹、荣耀、惠普、联想等。英特尔预计,全球合作伙伴将陆续推出超过 70 款基于 Wildcat Lake 平台的产品。

目前,荣耀 MagicBook X14 2026 已经率先上架,搭载该平台 Core 5 320 处理器,采用 16GB+512GB 存储配置,定价下探到了 4399 元。

用户画像:完全对标 MacBook Neo,但还有更多

英特尔列举了 Wildcat Lake 平台产品的 5 类目标用户:辅导孩子作业的家长、全天在校的学生、刚入职场的新人、「一人公司」创业者,以及银发族。

这些用户群体和场景描述本身没什么悬念,但值得注意的是,这个用户画像,和 MacBook Neo 在线下门店主要推荐的人群,几乎是完全重叠。

MacBook Neo 夺走的本来就是入门级 Windows 笔记本电脑的客群,英特尔的接招,就是造出具有更好价值主张的入门级笔记本电脑,再把心智重新抢回来。

英特尔还反复强调野猫湖平台的本地 AI 推理算力。这对于那些购机预算本就不多,也不太可能付费订阅优质云端模型算力的用户来说,倒也是个正确的思路。

最后,野猫湖看起来像是合格的入门芯片平台,跟 Firefly 萤火虫计划结合起来,也形成了一套颇具诚意的组合拳。轻、薄、便宜的 AI 笔记本,英特尔现在重新回到了这个擂台。

仅剩的悬念,是 OEM 最终能把零售价做到多少。

在 MacBook Neo 的价位上,苹果给到了系统生态、统一内存架构、多种潮流配色等等诸多看头。但英特尔要想把这只野猫放出去,跟苹果大杀四方,光有 18A 工艺和优秀的工业设计是不足够的。

这场仗的真正交战点,大概率不会在技术本身,而是在即将到来的 618 购物节期间,第一批搭载它的笔记本产品,能否真正把供货紧张的 MacBook Neo 杀个七零八落、措手不及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

马斯克花 100 亿想清楚一件事,不做 coding agent 就是等死

1.

OpenAI 的两大宿敌 Anthropic 和马斯克,放下心中成见之后终于在月初结盟了。

在此之前,Anthropic 和马斯克的关系并不融洽:今年 2 月,马斯克还在自己的 X 账号指责 A 社「woke」「邪恶」「反人类」(misanthropic),说这家公司「仇视文明」。

事后来看,这次攻击并非马斯克清新脱俗的性格使然,而是 Anthropic 所做的某些事情触碰到他的神经,事出有因。

在此之前,xAI 内部使用 Cursor 工作,但是今年年初员工发现,Claude 模型突然在 xAI 的 Cursor 公司账号里不能使用了。

当时还在 xAI 上班的联合创始人吴宇怀,在全员信里是这么说的:「Anthropic 更新了政策,要求 Cursor 不得向其主要竞争对手提供 Claude 模型调用能力。」

当时,吴宇怀在信中写了一句话,颇为有趣:

「这是坏消息也是好消息。我们的生产力会被影响,但这也敦促我们开发自己的编码产品和模型。」

为什么当时 xAI 的高层认为,开发自己的编码产品是关键?

后来发生的事情,大家都知道了。xAI 的联创团队悉数跑路,马斯克一气之下对 Cursor 使用了钞能力必杀:

上个月底,SpaceX 和 Cursor 共同宣布,将在编程和知识类工作 AI 模型的训练上,展开前所未有的战略合作;并且,SpaceX 还获得了以 600 亿美元收购 Cursor 的权利,或向后者支付 100 亿美元合作费用。

注意编程这个关键定语,后面还会 call back.

2.

最近,我看了一条 Cursor 早期投资人、Anthropic 大喷子、T3 创始人 Theo Browne 的视频。

本来点进去是看他喷 A 社和 SpaceX 怎么蝇营狗苟,结果没想到,却看到了关于 SpaceX + Cursor 合作的,一个既另类却又极度合理的分析:

不说 600 亿的收购,就只说 100 亿的合作费——Theo 在视频里表示,自己认为「哪怕只是交换到 Cursor 的用户数据,这 100 亿也值回票价了。」

所以是什么数据?如果你也去看 Theo 这条视频,他会讲得非常清楚。但为了节约时间,我们在这里简单概括一下:

我们和 AI 的对话是一来一回的,你提出问题/需求,他给你解答;coding agent 同理,只不过返回的是代码。

一次高质量的对话,整个过程,包括用户提示、模型思考、agent 规划、输出代码、验证——所有这些东西合起来,可以称为一个完整的 Agentic Loop——就成为了高价值的训练数据,再喂给模型去进行强化学习,就能进一步提高模型在实战场景下的表现水准。

Cursor 有的,SpaceX 想要的,就是这些数据。

可这些数据从哪里来呢?

答案很简单:作为模型厂商,这种高质量数据的最直接来源,只能是你自己开发的 coding agent 产品——也即 Anthropic 的 Claude Code、OpenAI 的 Codex、Kimi 的 Kimi Code。

现在你应该明白了,为什么被 Anthropic「封号」之后,吴宇怀会在全员信里提出开发 xAI 自己的 coding 产品和模型这件事了。这件事 xAI 在当时已经看清楚了:

没有自己的编码产品,就没有高质量的强化学习数据;没有高质量的数据,就训练不出真正实战能力强的 coding 模型。

虽然有点暴论,但现在我们可以点题了:模型厂商想做出来真正能打的编程模型,做自己的 coding agent 产品是唯一的路径。

3.

大语言模型像个水晶球,用全网的语料训练出来,似乎能够解答万物,但并不代表它在所有问题上都能给出高质量的答案。

用 GitHub 上数以亿计的代码条目训练,当然也能训练出 coding 模型。这是「学习结果」的逻辑,也是没问题的。毕竟编码任务的结果是可以验证的:代码能不能运行,测试能否通过,结果摆在那里。

但是,通往结果的过程,是一个涉及多步骤决策、错误纠正、意图对齐的复杂链条。每一次用户的接受、拒绝、补全、撤销、追问、甚至当模型好几次都搞不定或者完全搞错时的辱骂——都是这一链条上的过程信号。

强化学习有两种监督方式,一种叫做结果监督,只看最后是否跑通。但是结果监督会催生「奖励黑客」的现象:模型为了能跑通可能写出冗余、脆弱、带逻辑漏洞的代码,但因为测试过了,模型以为自己学对了。

而另一种叫做过程监督,对推理路径上的每一步进行打分。上述这些过程信号,只有在 coding agent 运行环境里才能诞生。GitHub 仓库里只有结果,哪怕是去看单独的提交历史,看 PR,都找不到有效的过程信号。

在缺乏有效、自主可获得的过程信号的时候,一些模型厂商会采用「蒸馏」的方式,这个事情大家应该已经知道了。

蒸馏的逻辑很简单,给同样的输入,老师模型输出什么,学生模型就学着输出什么。但是通过蒸馏,即便可以获取到思维链,得到的仍然更接近于结果,而非被蒸馏的老师模型内部的概率分布。

一旦学生在推理中偏离了老师的轨迹,哪怕一个 token 不符合,都有可能发生偏离。

这背后是强化学习的基础限制:策略梯度定理要求,优化样本最好由当前正在优化的模型自己去产生。这种数据叫做 on-policy 数据。而通过蒸馏别家模型,在别人的产品里产生的数据,来训练自己模型,都属于 off-policy 数据。模型当然可以从中学到东西,但学不到老师模型内部的概率分布信息。

而像 Cursor 这样自己就是 coding agent 产品的公司,掌握着最真实、有效、高质量的训练数据。Cursor 产品本身,就是 coding 模型在实战环境中的最佳训练场。

我们可以通过 Cursor 年初的「翻车」,来证明这个逻辑。

4.

APPSO 读者应该记得,年初 Cursor 发布了 Composer 2,号称「下一代专用编程模型」,技术报道写的相对保守,也没有提供具体的模型底座信息。

结果很快,网友就在公开代码片段里发现了 Kimi 的模型 ID,截图传遍了开发者社群,逼得 Cursor 副总裁 Lee Robinson 出面澄清:「Composer 2 确实是从开源底座出发的。最终模型大约只有 1/4 的算力来自底座,剩下 3/4 是我们自己训出来的。」

几小时后,Cursor 联创 Aman Sanger 也跟着发了一条道歉:「一开始没提 Kimi 底座是个失误。」

五天后,Cursor 放出了完整的 Composer 2 技术报告,显示底座的确是 Kimi K2.5,授权方则是 Firworks AI,大致流程是在 K2.5 上做训练,再继续做大规模强化学习(RL)。

但关键之处在于,Composer 2 的 RL 是运行在真实的 Cursor 会话当中,使用与生产部署完全相同的工具和 harness。

Cursor 将这套流程叫做「实时强化学习」(real-time RL),也即将模型的 checkpoint 直接部署到 Cursor 生产环境中,观察用户的响应,收集数据,聚合成奖励信号——最快可以每 5 个小时迭代一次模型版本,然后继续部署到 Cursor 里,循环往复。

最极致的案例是 Cursor 的自动化代码补全功能 Tab,每天处理超过 4 亿次请求,每当用户输入字符、移动光标时,模型都会预测下一步动作,如果预测置信度高,则显示建议,用户按下 tab 即接受自动补全。

该功能采用的是在线强化学习,在行业内极具特色。Cursor 可以以极高的频率(最快可达每一个半小时到两小时)更新 Tab 的模型能力给用户,直接在产品内收集 on-policy 数据进行训练。

这种高频、接近实时的反馈回路,让 Tab 可以学习到极其微妙的用户意图。Cursor 方面透露,这种方法让 Tab 建议的拒绝率降低 21%,接受率提高了 28%。

回到 Composer 模型本身。在事情搞清楚了之后,一些 Kimi 员工也删掉了之前吐槽的的推文,Kimi 官方账号发表了祝贺。

一家估值 600 亿美元(基于马斯克给的数字),不做自己的模型基座的 coding agent 应用层公司,仍然可以通过产品自身的数据飞轮,RL 出超越基座模型的专有编程模型。

所以与其说 Cursor 翻了车,不如说这反而是 coding agent 产品重要性的绝佳例证。

Cursor 在另一篇关于实时 RL 的文章里写到:「(训练编程模型)最大的困难在于建模用户。Composer 的生产环境里不只有执行命令的计算机,还有监督和指导它的人。模拟计算机容易,模拟使用它的人却很难。」

这句话,现正在逐渐成为了在编程模型方面走在前沿的模型厂商之间的共识。如果你去看 benchmark 榜单和用户普遍评价,会发现哪些头部的厂商都在发力做自己的 coding agent/编程产品。区别只在于谁离用户更近。

我们以 SWE-bench、LLM-Stats 等相对权威的榜单为例,Claude、GPT、Gemini、Kimi 等模型基本霸榜前十,清一色都是有自己开发 coding agent 产品(包括 CLI、IDE、集成 coding agent 的桌面客户端)的模型厂商。

在部分榜单上会出现少数反例,如 Meta (Muse Spark)、DeepSeek 等,没有开发自己的 coding agent。

不过你会发现,这些反例模型,在更加接近真实场景、避免污染的更权威 benchmark 上就很难上榜了。以 DeepSeek 为例,它在 SWE-bench bash only 上分数是 70%,排名第九,在 SWE-bench Pro 上分数却掉到了 15% 左右。

OpenRouter 的真实流量数据可以解释这种反差:该平台 2025 年报告显示,Claude token 消费 80% 以上用于编程和技术任务,而 DeepSeek token 消费主要集中于闲聊和角色扮演。

没有自家 coding 产品的厂商,在一些 coding 任务 benchmark 上能挤进头部,但在更难的真实工程 benchmark 上,在用户用 token 消费投票的真实流量中,都会原形毕露。

不仅是 Cursor,Anthropic 在 2025 年 11 月发的一篇论文里,也明确透露自己在做一模一样的事情:「我们在 Anthropic 自家的真实生产编程环境上做训练。」也即 Anthropic 把自己员工使用 Claude Code 的交互数据,反哺给 Claude 模型用来训练。

5.

在 AI 的演进历程中,生产要素的定义发生了深刻的位移。传统三大核心要素——算力、研究、训练数据,虽然在总量上持续增长,但在结构上已经出现了严重的失衡。

今天的各大 AI 巨头显著提高了在算力上的资本支出 (CapEx),让算力基建成为了当前舆论的主旋律。但实际上,特别是在编程范畴内,随着 GitHub 仓库、StackOverflow 等互联网公开代码数据被基模厂商「竭泽而渔」式地利用,模型在代码生成与逻辑推理上的边界开始逐渐显现。

这也是为什么,行业共识正在逐渐转向一个冉冉升起的新战略高地:

对于任何希望掌握顶级代码能力的模型厂商而言,建立自有的 coding agent 产品早已不再是可选的商业路线,而是确保底层模型可以持续进化的核心生命线。

正如前面 APPSO 论证的那样,单纯学习公开数据等于只学习成功者的结局,却无法了解成功的路径,这绝对不是正确的成功学应该有的样子。在真实的编程环境中,知道发生了什么错误、怎样发生的、如何正确地理解和高效地实践需求等等——了解正确过程的价值,远超于得到正确结果本身。

只有拥有自己的编码产品,模型厂商才能获取高质量的「过程监督」信号,从而在编码/推理能力的下一阶段竞争中,确保自己仍有技术护城河——

否则就不得不像 SpaceXAI 那样,花钱去跟 coding agent 产品公司去合作。

然而并不是所有模型厂商都跟马斯克一样有钱,以及 2026 年开始的巨头势力划分、结盟与领地的争斗会变得更加激烈,当一家缺乏自主 coding 产品的模型厂商终于回过味来的时候,恐怕已经没有足够的合作伙伴可以挑选,合作的价格也将水涨船高。

美国模型巨头的情况大家普遍比较熟悉了,在此不赘述。APPSO 也注意到,国内的主流模型厂商和 AI 巨头当中,绝大部分都已经在 coding agent 产品上有所布局。

国内巨头公司主要以原生 AI IDE 或 IDE 插件的思路在做:字节跳动去年很早就布局了 TRAE、阿里巴巴的 Qoder、腾讯的 CodeBuddy、百度的文心快码 Comate 等。

AI 小龙公司中,月之暗面是最早开发独立 coding agent 产品的公司,主要以 CLI 界面的 Kimi Code 为主——不过 Kimi 此前有透露过,在原生编程产品这件事上,CLI 不会是终局

另一种实现思路是模型厂商自行提供 API 服务、Coding Plan。这样,不论用户使用何种 AI 开发环境,模型厂商都可以通过服务器端的 API 记录来获取最大程度接近于原生 coding 产品的过程数据。

但这也只是接近,并非完全相同。核心在于,服务器端 API 的请求-响应日志,与深度继承的产品交互轨迹相比仍有很大差距。

自建产品的厂商(例如 Cursor、Claude 桌面端、Codex)拥有最直接的显式反馈信号,而 API 侧是相对模糊的隐式推断。简单来说,API 侧能看到用户请求和响应,但用户最后是否采纳了这段代码、代码能否跑通、引发了什么样的 bug,API 侧对此是一无所知的。他们无法了解到用户最终行为这一关键的标签,从而无法实现最高质量的强化学习。

形而上来讲,语言即世界,代码即方案。代码可以表达这个世界上绝大多数的任务,代码也会成为头部的放大器,让最顶尖的人才放大数倍的生产力。

只有最顶尖的 coding 模型才配得上最顶尖的人才。如果领先的模型厂商不重视 coding,势必将会掉出第一梯队。

当然,事实上每家模型厂商都不会不重视 coding——而是说,在新的范式下,哪些没有自主可控的原生 coding agent 产品,极有可能逐渐落后于有产品的厂商。

就在前几天,MiniMax 也发布了桌面客户端产品的重大更新:带有全新多 agent 编排架构的 Mavis 功能,并且也让客户端显著改善了对 coding 任务的支持。

此前 MiniMax 只是推出了桌面端,但没有加入原生 coding 和 agent 功能。

紧接着,在 5 月 15 日,阿里巴巴正式发布了 Qoder 1.0——这个产品从 IDE 的形态正式升级为一个完整的 Agent 产品(阿里的官方叫法是智能体自主开发工作台)。

与此同时,xAI 的 Grok Build CLI,也终于正式推出了。

没错,就是 xAI 年初被 Anthropic 和 Cursor 封号之后,他们自己捣鼓出来的那个 coding agent.

这不,又多了好几个现成的案例。

看来,大家都认为 Cursor、Codex 和 Claude 桌面端走在正确的道路上。

6.

把话题从 coding 扩展到 agent 本身,情况也是一样的。

编码任务的轨迹数据,在公开语料中确实还是能找到一些的(比如 GitHub 的提交记录/PR,尽管质量并不高)。但是 agent 任务的轨迹数据,包括并不限于移动和点击鼠标、操控触屏、填写输入框等,却无法在公开语料中找到。

所以我们会看到,即使在 agent 操作的最小实现路径——浏览器插件上,这么个看起来一点都不高端的东西,几乎每家模型厂商都会做自己的。

OpenAI 早在 2025 年 1 月就做了 Operator——与其说它是一个「AI 自动操作浏览器」的产品,不如说本质上就是一个大规模的数据收集装置。每一位试用 Operator 的用户,都在免费为 OpenAI 提供 on-policy 数据。

后续 OpenAI 还衍生出 ChatGPT Agent 以及新版 Codex 桌面端;Anthropic 也是同理;最近 Kimi 不声不响地也做了一个叫做 WebBridge 的项目,其实就是一个浏览器插件。

即便是在过去两年里动作最克制的中国模型巨头深度求索,也在最近开始展露出对 Agent 的兴趣。

CEO 梁文锋此前接受采访时曾经提到这样的观点:数学和代码是 AGI 天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。

这句话的潜台词,是 DeepSeek 一直把 coding、Agent 当研究试验场,而非商业化方向。

但是在今年 3 月,DeepSeek 一次性放出了十几个 Agent 相关岗位,包括首次出现的模型策略产品经理(Agent 方向)等。当时的 JD 职责涵盖「主导 Agent 评测体系以及训练数据方案的设计」,要求中包括「深度使用 Claude Code、Manus」等产品。

APPSO 注意到,近期深度求索发布了 Agent 产品经理、Harness 产品经理等职位招聘信息——很显然,DeepSeek 要做独立、原生的 Coding/Agent 产品了。

此前资料显示,DeepSeek V3.2 的训练过程中引入了近两千个合成的 Agent 训练环境和八万多条复杂指令。但是看起来,靠合成的训练数据只能带 DeepSeek 走到这里了,剩下的是合成不出来的部分:真实用户在真实环境里的真实成功和失败,必须靠自家的 agent 产品才能拿到。

DeepSeek 以一种极度克制的方式做了三年模型以及模型产品(直到上个月才终于在官网加入了多模态能力)。但是在今天来看,在编码类任务上,DeepSeek 拿 SOTA 越来越难了,即便此前拿到也会在不久后被超越。

当主力依靠研究的路径支撑不住飞轮的时候,DeepSeek 终于行动了。

7.

最后,我们回到开篇的故事。

根据 The Information 援引知情人士报道,在接受马斯克 600 亿收购/100 亿美元合作的同时,Cursor 表示不会与 xAI 合作开发新的模型,而是仍将聚焦于优化自己的 Composer 模型。

这可能意味着,即便被马斯克买通甚至收购,Cursor 仍然要保留自己数据飞轮的主体性。

数据归属的本身,是最关键的隐藏博弈点。

当所有顶级模型厂商都做了自己的产品,所有顶级产品也都开始训练自己的模型,「模型公司」和「产品公司」之间本就不太清楚的界限,似乎越来越不存在了……

这场博弈也才刚刚开始。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

一个月烧掉 930 万元 Token 的人,也没烧出个答案

龙虾之父一个月消耗 6030 亿 Token,总花费金额高达九百万人民币。

移动联通电信,三大运营商都在推 Token 套餐,199 送千兆宽带还有 1 亿 Token,了解一下?

从硅谷到国内大厂,Tokenmaxxing 成为公司的主流,谁消耗 Token 多,谁就是 AI 时代的好员工。

00 后校友向母校捐赠 20 亿 Token,被网友调侃按 DeepSeek 5 元/亿 Token 计算,只要 100 元。

▲图片来自新浪财经

Token 在半年内完成了一次身份跃迁:从技术术语,到 KPI,到话费套餐,到捐赠货币。它成了 AI 时代的「度量衡」,唯一的问题是,没人说得清它到底在度量什么。

我们自己买 Token,用公司的 Token,部署了一堆 Agent,代码、论文、周报都是 Token 烧出来的。

而另一边是,大厂的员工由于 Token 消耗排行榜的原因,开始拿着公司的 Token 处理私事、玩游戏、开发数十个没什么用的子 Agent 来提升自己的排名。

「回报」这件事很难量化,但「使用量」可以量化。

于是所有人都选择了那个容易量化的东西。这不是 AI 时代的新问题,这是管理学的老病。

用 AI 消灭狗屁工作的公司,正在制造新型狗屁工作

亚马逊,那个裁员裁到大动脉,把自己的网站都变成 404 的小狗,最近又被爆出了新的「笑料」。

原本被寄予厚望、用来消灭「狗屁工作」的 AI,最终却沦为制造新型「狗屁工作」的源泉。

据《金融时报》报道,为了逼迫员工拥抱 AI,亚马逊搞出了一个极其复古的管理手段:「Token 消耗排行榜」,追踪每个员工的用量。

公司强制要求超过 80% 的开发者每周必须完成 AI 使用指标,甚至将消耗 Token 的数量作为考核标准。

▲图片来源:The Information

打工人的反应也很直接,既然公司用这种指标来考核,大家干脆用魔法打败魔法,开启了「Tokenmaxxing(最大化消耗 Token)」战术。

刚好亚马逊内部上线了一个叫 MeshClaw 的 AI Agent,它能发起代码部署、整理邮件、操控 Slack。公司内部备忘录里描述它是:「它在夜间做梦来整合白天所学,在你开会时监控你的部署,在你醒来前替你分类邮件。」

于是 MeshClaw 就成了一个刷排行榜的工具。开发者开始用它来规划旅行、处理私人邮件、让 AI 分析产品经理在 Slack 上说的蠢话。

在职场匿名社区 Team Blind(一个面向 Google 和苹果等公司认证员工的留言板)上,一位亚马逊员工的发言被疯狂点赞。

我疯狂燃烧 Token,就是为了骂我的产品经理。每当他在 Slack 里说屁话,我就把聊天记录扔给 AI,启动 10 个子智能体去全方位深度分析并吐槽他。这绝对是 GPU 算力的完美用途。

亚马逊在回复《金融时报》时提到,MeshClaw「每天帮助数千名员工自动化重复性工作」,公司「致力于负责任地部署生成式 AI」。同时,公司表示 Token 统计数据不会用于绩效评估。

但员工的说法是:「经理在看这个数据。当他们追踪用量时,就会制造扭曲的激励,有些人在这上面很有竞争心。」

公司说不算 KPI,但经理偷偷在看。这和大厂说「年终奖与 996 无关」是同一个套路。

不只是亚马逊,Meta 员工也在做同样的事。

早在四月份,The Information 就曾报道,Meta 公司的一名员工利用内部数据,在公司内网创建了一个仪表盘,让同事们可以竞争成为公司排名第一的 AI Token 用户。

这份排行榜汇总了超过 85000 名 Meta 员工的人工智能使用情况,并列出了排名前 250 位的超级用户,其中扎克伯格没能进入前 250 名。

而这份排行榜在两天后就下架了,Meta 在回应媒体查询时发声明,「该员工自行决定撤下仪表盘;Meta 并未要求采取此行动。」

当你笑完这份排行榜的不合理之处,转念一想就会发现,这其实是大多数公司的现状。还没想好 AI 怎么发挥作用,但是就先裁员了;还没想好 Token 怎么用,就匆忙把它作为生产力的衡量工具。

一个月 6000 亿 Token 烧出了什么

Token 消耗排行榜的荒诞还没消化完,更魔幻的事又来了。

三位 00 后校友向母校郑州西亚斯学院捐赠 20 亿 Token,网友按 DeepSeek 的价格算了算,说这就值 100 块。

后来有媒体澄清,这 20 亿 Token 不只是 API 调用量,还包括生成工具使用权和平台积分。但「捐 Token」这件事本身已经够魔幻了。

三位校友说自己实力还不够捐教学楼,所以捐 Token。这个时代的慈善逻辑也在刷新:捐不起楼,捐算力。

Token 存在的价值在刷新,Token 的使用边界也在刷新。

GitHub 前 CEO、现任 Meta 超级智能实验室 CEO Nat Friedman,在一场公开活动上讲了个故事。某天,他的 OpenClaw 判断他喝水不够,他随手给了指令:「不惜一切代价确保我补充足够的水分。」

▲ 网友的评论是:他是不是喝多了

OpenClaw 很快行动了。它指示他去厨房喝一瓶水,顺带告诉他,正在通过家里的摄像头监控他是否真的去喝了。他照做之后,OpenClaw 发来一张他喝水的截图,附言:「干得好。」

原本只是手机设置一个提醒每日喝水,但现在是 Token 疯狂地燃烧,调用摄像头来为「提醒你喝一杯水」服务。

而当 Token 的消耗不再重要,不需要考虑 Token 的价值和使用边界,我们又会拿他来做点什么。

OpenClaw 最近有意思的事,还得是龙虾之父 Peter Steinberger 周六在 X 的分享,他发了一张 CodexBar 的截图,配文「CodexBar 最新更新让 API 费用显示得更加友好。」

但很快有网友发现这张截图了不起,三十天用了 6030 亿 Token,累计消耗的金额更是达到了 130万美元,约合人民币 930 万。

评论下面都是各种质疑,交付了多少代码,消耗的 Token 和最终能用的代码之间比例是多少?到目前为止,你做出了什么有用的东西吗?要不是入职 OpenAI,Codex 这 Token 能让你这么消耗吗?

兄弟,你最好拿出点儿价值百万美元的工程师都做不到的东西,不然这可能就是前沿实验室泡沫破裂的开端了。而且这还是补贴价格,我的天。如果是实际成本,价格肯定更高。

龙虾之父在评论区回复了这些声音,他提到如果关掉 Fast Mode,成本就能降 70%。而且,自从 OpenClaw 被 OpenAI 买走之后,负责该项目就只剩下三个成员,他们在 Codex 上运行了 100 个实例。

这些实例会自动处理软件开发流程中的各种问题,像是代码的提交、Bug 修复、功能的更新等。

但是光看 OpenClaw 的更新,真的需要 130 万美元来支撑吗?他又提到自己在做一些除了 OpenClaw 之外的创业项目,以及他是在探索一个问题:如果 Token 成本不重要,软件会怎样被构建。

这个好问题。但 130 万美元花下去之后,他也还没有得到答案。

这可能是 2026 年最贵的一个问号。

即便是有无比丰沛算力的人,现在似乎也不知道这些 Token 可以用来做什么。

大厂高管们看着财报上巨额的 GPU 采购费,迫切需要向董事会证明这笔钱没白花。既然「重构真实业务流」太难、太慢、太需要魄力,那就退而求其次,去考核「Token 的消耗量」。

员工们甚至一开始就没被问过「你觉得 Token 该怎么用」,他们被问的是「你这周用了多少」。

当一个工具的考核标准是「消耗量」而不是「产出」,它就不再是工具了。它是燃料,唯一的使命就是被烧掉。至于烧完之后驱动了什么,没人真的在意。

因为一旦认真追问,很多人会发现,自己烧掉的那些 Token,和年初裁掉的那些人一样,都没换回任何东西。

我们正在经历的,是一场所有人都假装看懂了规则的游戏。公司假装知道怎么用,员工假装在认真用,投资人假装看到了回报。

唯一真实的,只有不断超支的账单。

Token 终究会找到它真正的用途,成为真的「新质生产力」。但那一天到来之前,我们在烧掉动辄上亿的 Token 之前,可以问问自己真的有必要吗

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

大疆 Pocket 选购指南:我有 iPhone,还需要买 Pocket 吗?

大疆的 Pocket 系列三年不更新,一更新就来了两台——

过去一个多月,Pocket 4 和 Pocket 4P 可以说是最受瞩目的相机,就在今晚的戛纳电影节上,Pocket 4P 以口袋电影机的身份在欧洲电影殿堂亮相,距离正式发布时间,相信不会太远了。

与此同时,大疆也对 Pocket 3 进行了降价处理,于是我们看到了泾渭分明的 Pocket 系列产品线:

  • Pocket 3:入门级的手持云台 vlog 机,2299 元
  • Pocket 4:全能的手持云台相机,2999 元
  • Pocket 4P:准专业级的口袋电影机,预计价格会来到 4000 元档

相信有许多持币观望的读者,也和爱范儿抱着同样的疑问:

三台 Pocket 我该怎么选?有了 iPhone,我还需要 Pocket 吗?

结合实际体验,爱范儿一次性帮你理清楚。

Pocket 三代同堂,怎么选?

先仔细聊聊 Pocket 4P。

虽然目前 Pocket 4P 依旧没有公布更详细的参数,但参数在本次形态更新面前,是最不重要的话题——

从产品逻辑来看,Pocket 4 已经将单摄的手持云台相机推向较为成熟的状态。此时,增加一颗摄像头成为一件顺理成章的事情。

绝大多数手机的主摄和单摄 Pocket,提供的都是广角视野。广角适合交代环境,适合把大山大河框进画面。但当你拿着设备走入拥挤的人群,广角的缺点就暴露无遗:画面太杂乱了。

此时,一颗长焦镜头可以完成空间上的压缩,把无关的背景剔除出去。

大疆将这颗多出来的摄像头定格在 3×,这是一个非常巧妙的数字。它比主摄更贴近人眼对焦后的视线范围。从我们上手体验来看,Pocket 4P 这颗 3× 镜头还提供了比较自然的虚化,非常适合拍摄更凸显主体的人像或特写画面。

但对于用户来说,多的这一颗摄像头,并非绝对的正收益:Pocket 系列自诞生起,核心卖点就是「无感携带」,增加镜头,意味着增加重量、侵占内部空间,甚至可能牺牲一部分续航。

其实这种担心,恰恰帮大疆划清了 4P 和 4 之间的界限。

Pocket 4P 是给那些「创作者」准备的。他们清楚地知道自己要拍什么,素材最后会进入 Mac,在 DaVinci Resolve 或者 FCPX 里进行精细的剪辑。对他们来说,为了在极轻便的体积下获得原生焦段的景别切换,以及高度统一的素材规格,牺牲一点点重量完全值得。

而对于大多数普通人来说,Pocket 4 才是那个更轻量、更理性的选择。

虽然前代 Pocket 3 打造出千万台的神话,但其本身并不是一台完美无缺的相机——只有 USB 2.0 导致数据传输过慢、像素量过低以及动态范围不够大,这些都是问题。

而 Pocket 4 提供了 3700 万像素,更高的像素意味着内置的无损 ISZ 变强了。在 Pocket 4 上,通过传感器裁切获得的 2× 焦段更为清晰,足以应付日常记录。

除此之外,它还内置了 107GB 存储,带来了更好的动态范围。忘记带内存卡、传输速度和动态范围不够的问题,被一次性解决掉了。

可以说,Pocket 4 就是目前单摄手持云台相机的完全体。

至此,Pocket 4 系列两台机身的区别已经很清晰了:

如果你追求生产力,强调原生光学焦段带来的画质与虚化,需要 3× 镜头获得更丰富的画幅景别,那么 Pocket 4P 毫无疑问是更好的答案;

如果你只是希望有一台能轻松塞进裤兜、防抖优秀、可以独立于手机拍摄视频和 Live Photo 的机器,那么 Pocket 4 凭借更高的像素和好用的 2× ISZ,已经绰绰有余。

最后是 Pocket 3。

在 Pocket 4 补齐了大量痛点的情况下,Pocket 3 还有存在的意义吗?

当然——新设备的出现,最大的贡献往往是把老旗舰的价格打下来。

在 Pocket 4 系列轮番上场的间隙,我们观察到 Pocket 3 已经完成了一轮官方降价,在某些平台叠加各种补贴的情况下,已经落到了 2099 的价格。

甚至在未来,我们能以 1 开头的价格买到 Pocket 3,也不是不可能。

对于预算有限、或者刚刚萌生拍视频念头的新手,这就是性价比最高的 「守门员」。

最后,按照爱范儿编辑部的推测,Pocket 4P 的定价大概率在 4500 元左右,但也不排除大疆卷起来定一个 3999 元的价格。

此时,如果将 Pocket 系列按照价格排开,我们会发现一个巧妙的设计——

从 2000 元档的 Pocket 3 到 3000 元档的 Pocket 4,最后到 4000 元档的 Pocket 4P,大疆正在把无人机上那套 Pro、Air、Mini 的组合拳搬到口袋相机上。

这套阵容已经在无人机市场证明了它的成功。现在,Pocket 也将组成这样的阵容了。

有了 iPhone,我还需要 Pocket 吗?

在 Pocket 4P 的上手文章发布后,我收到不止一个朋友的问题:

我有 iPhone,还需要买 Pocket 吗?

理清了 Pocket 家族的内部定位后,这是我们必须面对的现实问题:既然大家手里都有一台性能强悍的 iPhone,为什么还要花钱买一台功能单一的云台相机?

这其实是一个关于「设备属性」的哲学问题。

在多次迭代后,iPhone 在动态影像领域的基础不可谓不强,三摄变焦顺畅、色彩高度统一、防抖优秀、Apple Log 甚至已经更迭到第二代。

但问题在于,手机始终不是完全针对拍摄设计的特化产品——

除了拍摄以外,iPhone 还需要承担复杂的日常任务,无时无刻需要分散注意力,随时可能会有工作消息、语音电话打断你的拍摄、需要考虑拍摄之外手机还有没有充足的剩余电量保证你与世界的关联,还需要注意拍摄会不会占满本就贵如黄金的存储空间……

而 Pocket 则是完全服务于拍摄需求的相机:不能打电话,不能回微信,不能刷社交软件,一切与拍摄无关的东西,都不会出现在你手里的 Pocket 上。

更别提,Pocket 还有机械云台天生在结构上比 iPhone 的防抖更稳定、形态比 iPhone 更适合握持、物理虚化比 iPhone 更自然、视频规格比 iPhone 更丰富等等综合优势了。

所以,如果我手里已经有一台主力 iPhone,现在到底该不该买 Pocket?

如果现在需要,哪台是最适合我的?

你可以对照下面几个问题,做一个购前诊断:

  1. 过去三个月里,你是否因为手机突如其来的电话或微信,打断过拍摄?
  2. 拍视频时,是否因为手机存储空间不足,而束手束脚?
  3. 炎炎夏日,有没有遇到过手机拍照录视频发热掉帧甚至死机的情况?

如果你对这些问题的回答是肯定的,那么购入 Pocket 3 和 Pocket 4 都是不错的选择。

具体来说,如果你有拍高清 live 图的需求,如果你喜欢用手机的 2× 镜头拍摄,那么选择 Pocket 4,否则,Pocket 3 其实就够用了。

在这个基础上,你还想拿 Pocket 拍拍商单、拍拍演唱会,搞点严肃创作,那么 Pocket 4P 是一步到位的选择。

当然,如果前面几道题,你的答案都是否定的,那么请捂紧钱包。

iPhone 的防抖和画质足够满足你的需求。你可以随拍随剪,直接通过 AirDrop 分享,且丝滑的生态体验依旧是目前任何第三方设备都无法替代的。

而从行业角度来看,爱范儿更建议你等一等——

目前,口袋云台相机的玩家可不止大疆一家——和 Pocket 4P 同样「犹抱琵琶半遮面」的,还有影石 Luna,而各大手机厂商也正跃跃欲试,准备下场分一杯羹。

因为 Pocket 4P 这样的产品,已经严重威胁到了手机厂商的安全区。

很多人愿意买 6000 元甚至 8000 元的影像旗舰手机,很大程度就是为了长焦。现在,花更低的价格,Pocket 4P 就能提供一个素质相当的长焦镜头,以及更好的云台防抖、更专业的整机解决方案。

没有手机厂商能对此熟视无睹。

据爱范儿了解,vivo、OPPO 都已经将手持云台相机的产品规划提上日程,而小米、华为也在持续关注这个赛道。2026 下半年到 2027 上半年,想必会有更多手持云台相机纷至沓来。

既然入局者多了,我们作为消费者,反而可以更淡定些。你可以把钱捏在手里,再等一等。

我们相信,这个年轻的品类,还会有更精彩的产品出现。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

连时间都没法看的手环,每年敢收 1000 块,居然比苹果还火?

Google 可以说是 5 月最出尽风头的科技公司,趁着 Goog I/O 大会的节点,一口气发布了大量新产品——

有颠覆手机系统的智能系统和 Gemini Intelligence,有颠覆电脑使用范式的 Googlebook,还有这个要颠覆智能手表的无屏手环 Fitbit Air——内嵌 Gemini,主打 AI 健康功能。

为此,Google 不仅重新捡起了快被扫进垃圾堆的 Fitbit,还请来 NBA 当家球星库里做代言。野心很明显,就是要在智能穿戴拿下一块市场。

不过,Fitbit Air 瞄准的并不是苹果 Apple Watch,而是对标这两年大火的「WHOOP」——这是一家创立 12 年,却在近两年异军突起的科技新贵,无屏手环是他们最主要的产品。

WHOOP 从产品定义到营销策略,都相当特立独行。他们不卖手环,直接送!只是如果想正常使用,要收一笔不菲的订阅费,来开启 AI 健康功能。

今年 3 月,WHOOP 完成 6 亿美元融资,估值超过 100 亿美元。

在这个充电头都会加一块屏幕的时代,一个没有屏幕的智能手环却卖爆了,凭什么?

无感设计,极致简洁

WHOOP 并不是一家初创公司,实际上成立于 2012 年,早于初代 Apple Watch,和 FitBit、Pebble 等名字并列为智能手表的探索者。

在那个技术还没那么发达的年代,手腕上没法集成太多东西,所以像主打健身健康的 Fitbit 和 WHOOP,初代产品基本上都是一个没屏幕的手环,反馈和交互靠手机 App 完成,本质上和在手腕上绑了一堆传感器无异。

图源:Tom’s Guide

随着技术发展,以及 Apple Watch 对用户心智的教育,类似的智能手环产品很快也都配备了一个小屏幕——在当时,手腕上的触控屏是大势所趋,要不然为什么要无缘无故给身上带个不便宜的手环?

WHOOP 不这么认为,时至今日他们的手环产品依旧没有屏幕,仿佛这十几年的智能穿戴变革浪潮,将他们给遗忘了。

一开始做无屏是妥协,现在还在做无屏,那就是「坚持」了。

实际上,「无屏」这件事,让 WHOOP 变成了一个异常简单的产品,没有太多复杂性和限制,带来了使用上的自由。

创始人 Will Ahmed 认为,一旦为 WHOOP 配备屏幕,那么就会不断加入时间、健康提醒、消息提醒这些功能,成了一块智能手表。这个赛道,很难和苹果三星等品牌竞争。

Will Ahmed

Reddit 上不少用户也表示,选择 WHOOP 的原因,就是因为它没有一块让人分心的屏幕,够纯粹。

WHOOP 的本质就是一个健康传感器,你可以将它佩戴在在身上的不同地方,官方也推出了可以和 WHOOP 配套使用的贴身衣物配件,这种灵活性是智能手表和智能指环都难以媲美的。

Apple Watch 的逻辑,是把更多信息带到手腕上;WHOOP 的逻辑,则是设备彻底退居幕后。

追根溯源,最终让 Apple Watch 得以成立并走进千家万户的原因,也是因为苹果为其找到了「运动健康」这个主要定位。

图源:CNET

这就带来了一个很有意思的反转:Apple Watch 本来应该杀死智能手环的比赛,但随着智能手表越来越普及,也越来越多人能理解「在身上绑传感器」的价值,反而让 WHOOP 极致简洁的价值得以凸显。

时至今日,依然有不少人更偏爱具备美学价值的传统机械表,又向往 Apple Watch 的健康监测功能,只是手上同时戴两块表难免显得有些别扭。爱范儿也采访了身边的真实用户 @flypig,他告诉我们:

因为我有不少机械腕表,我认为是一些蛮好看的饰品,根据心情换着戴。但我又有记录身体状态的需求。我不希望左手一块机械腕表,右手一块 Apple Watch。我试过,感觉戴两块表看起来还是太怪了。

单论产品形态,WHOOP 比 Apple Watch 有不少优势:没了屏幕,换来了两三周的续航,还有极致的轻便,顶配版也不到 30 克,佩戴在身上几乎无感;硬件本身成本极低,会员提供终身保修,非常适合极限运动爱好者,丢了换新也只需要 50-80 美元不等的补办费。

由于 WHOOP 手环本身没有任何交互,只需要「佩戴」,这意味着对于儿童,特别是更需要健康监测的老人群体来说,没有任何使用的门槛。

让人愿意戴,并且愿意长时间戴,这就是智能穿戴产品最重要的优势,这样看来,极致简洁的 WHOOP 已经是一个相当有价值的产品。

普惠,从运动员到每个人

10 年的时间,智能穿戴领域瞬息万变,最早的行业竞争者 Fitbit 和 Pebble 在苹果等大厂入局后,都走向了沉寂。

WHOOP 不仅顽强存活了 12 年,还在这两年大火。这个看似「逆袭」的故事,或许从一开始,就已经埋下了伏笔。

在成军之初,WHOOP 就没有瞄准大众用户,功能不止于步数、心率这些常规体征数值,直接聚焦「睡眠」「恢复」和「负荷」三大指标,用量化的分数告诉用户每一天醒来恢复程度如何,今天是否适合训练。

这种功能源自于创始人 Will Ahmed 自己大学时期作为壁球队员的经历:他发现自己很难达到训练量和恢复之间的平衡,于是开发了专注于追踪恢复、运动负荷和睡眠指标的 WHOOP。

由运动员打造的产品,自然最懂运动员,因此 WHOOP 在最初就瞄准了运动员这个非常独特的用户群体。

虽然这让他们在大众消费者之间的知名度更低,却避开了和 Fitbit 和 Apple Watch 竞争,拿下了包括美国职业棒球联盟在内很多职业运动队的独家订单。

并且,WHOOP 的专业属性很快也获得了 NBA 明星勒布朗 · 詹姆斯,和「C 罗」克里斯蒂亚诺·罗纳尔多这样的重量级用户作为「自来水」,不愁曝光和知名度。

这也是 WHOOP 的聪明之处。 不管是什么消费品,由大众产品冲击高端很难,但反过来要轻松得多了。

对于中产阶层来说,WHOOP 自带了一个「精英运动员同款」的光环,建立起「专业」的品牌形象,只差购买的契机。

2018 年开始,WHOOP 将产品从原本的 500 美元售价,转变成 6 个月起订,每个月 30 美元的订阅方式,大幅降低了准入门槛,正式向大众消费市场进军。

这个转变也彻底改写了 WHOOP 的商业模式:从一家「硬件」品牌,转变为了售卖软件的服务商。

手环是 WHOOP 商业模式的起点,却并非核心。这个手环几乎是「白送」给用户,WHOOP 在官网售卖的直接就是「订阅」,买的是一年的会员,成本直接包含在订阅费之中,免费试用一个月甚至直接送你一个手环。

当然,WHOOP 不同档位的会员,能拿到的表带配置有所不同,只是 WHOOP 不需要你为硬件付费,套餐可以随时换。

购买 Apple Watch 之后,只要硬件本身没有故障,理论上你获得了这个产品的终身使用权;至于 WHOOP,只要停止续费,那么你手上的表带就没有任何价值。

硬件形态只能吸引体验,软件体验才能真正留住人心,对于 WHOOP 来说更是如此。

WHOOP 的手机应用,把身体数据做成了一种几乎不需要学习成本的「身体仪表盘」,各种可视化图表,自己今天睡得怎么样、锻炼强度如何,身体年龄多少,一目了然。

普通人或许很难理解自己的「恢复」分数究竟算高还是低,但通过颜色区分,身体状态会变得非常直观—— 绿色意味着恢复状态良好,今天可以正常训练;红色则像是一张警告牌,提醒你身体还没缓过来,最好暂停运动。

全球疫情之后,越来越多人开始关注自己的「身体状态」,而不只是单纯记录运动数据。这个趋势,恰好撞上了 WHOOP 从「运动装备」向「生活方式品牌」的转型期。

与此同时,随着房颤、血压趋势等健康监测功能不断加入,再加上 WHOOP 4.0 在续航、体积和佩戴体验上的全面升级,以及免费试用机制降低门槛,越来越多原本并不热衷运动的普通用户,也开始接触并接受这个品牌。

从运动员的明星光环带动,到低门槛高价值的使用方式,WHOOP 也从从一款运动员工具,变成了一种新的中产社交符号,就像 Lululemon、冷水浴、燕麦奶。

你未必真的运动,但只要把 WHOOP 戴在手上,就仿佛已经进入了那个高度自律、关注健康、持续优化自己的生活方式体系——至少外人看来如此。

买 AI 硬件,就是为 AI 付费

WHOOP 这种订阅制的商业模式,对于智能手表来说很超前,但和当下热门的「AI 硬件」,又惊人地相似。

用 Plaud 举例,只要你是真正的录音笔目标用户,基本绕不开会员订阅,才能获取足够的录音转写时长,而它体验的核心,就是那个负责整理、理解和调用录音内容的 App。

以前做产品和硬件,我们会推崇「All in One」,在有限的机身中尽可能配备更多的功能。

而现在,我们看到许多真正跑通的「AI 硬件」,反而都回到了更简单的形态:功能单一、交互克制,却能够深入某个具体场景,持续收集数据,再交由后端 AI 去整理、理解,并最终生成真正有价值的结果。

WHOOP 也是如此,它的形态,真的就是将传感器绑在身上,贴近身体的同时又保证尽可能无感。

智能穿戴近年的方向,也已经不止于单纯收集数据,还要呈现简单易懂的结果。Apple Watch 的「生命体征」功能,本质上就是把体温、血氧、心率、睡眠等趋势,浓缩成「身体是否异常」的直观指标。

2022 年底,ChatGPT 掀起了生成式 AI 的浪潮,每个行业都在借助 AI 改造自己的产品和商业模式。2023 年 9 月,WHOOP 接入了 GPT-4,推出「WHOOP 教练」功能,利用大模型对用户的数据进行解读,提供更个性化的建议,属于第一批尝试将 AI 和健康相结合的厂商。

由于布局时间早,WHOOP 算得上是当今智能穿戴产品中 AI 健康功能的第一梯队。CNET 的编辑尝试过很多类似的产品,唯独觉得 WHOOP 是「好用」的:

她忘记了自己即将要来月经,而 WHOOP 教练提前两天通知她激素发生变化,因此锻炼会更吃力,建议降低强度,并在月经期间根据她的恢复情况,智能轮换调整了她的训练计划,很好帮她纠正了「练得多=更好」的心态。

@flypig 则表示:

我认为它的 AI 能力——特别是那个 LLM 问答框的体验——实属一般般。但它 AI 之外的智能建议和规划能力,我认为,很不错,够用了。我愿意每年给他们交钱。

从 WHOOP 可以看出,健康监测和 AI 属于一种「双向奔赴」。

智能穿戴设备能持续对身体的指标进行长时间监控,但累积了海量数据之后,对用户的价值却没那么大。

而想要从 AI 那里获得很好的结果,就必须要提供充足且高质量的上下文,智能穿戴设备获得的数据,刚好可以让 AI 进行和解读。

智能穿戴接下来要实现的跃迁, 不仅要替你解读数据,还要根据数据直接给你实在的建议。

这也是为什么,沉寂了好几年的 Fitbit 忽然被复活。

本来 Google 已经有了 Pixel Watch 的可穿戴产品线,不带屏幕的 Fitbit 的重点放在了 AI 健康模式上,为自家的 Gemini 找到了另一个落地的场景,不只是 Google 生态,甚至在打苹果阵营的主意。

Google Healthm

我依旧不会将 WHOOP 或者 Fitbit 称作一个「AI 硬件」, 它们更像是借助 AI 完成了一次新的叙事包装,核心依旧是健康监测那套已经被验证了十多年的逻辑,这也是它们能重新进入大众视野的原因。

当传感器本身逐渐触及技术瓶颈,智能穿戴真正重要的问题,也从「还能测到什么」,逐渐过渡到「如何理解这些数据」,WHOOP 在讲的,就是这样一个故事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

大疆 Pocket 4P 上手体验:欲穷千里目,更多摄像头

如果要选一个近三年来最火的相机,大疆 Pocket 3 绝对榜上有名。

自 2023 年 10 月发布以来,Pocket 3 在两年不到时间里卖出超过一千万台,大疆 CEO 汪滔在前段时间的采访中直接表示:

我们没想到这是个几百亿级别的市场,在便携相机/卡片机这个品类,我们市占比比索尼、佳能、理光和富士全加起来还要多几倍。

前不久,大疆正式发布 Pocket 4,用更高的像素与视频规格回应了市场期待,爱范儿也第一时间上手评测了 Pocket 4。

谁曾想,大疆并未偃旗息鼓,紧随其后发布了 Pocket 4P 的预告。

爱范儿也第一时间拿到了 Pocket 4P,在体验了一番这台双摄 Pocket 后,我们认为手持云台相机这个极其年轻的品类,终于在经历爆火出圈之后,迎来了第一次重大更新。

长焦双摄,Pocket 更专业

拿到 Pocket 4P,最直观的改变是影像模组变大了。

像推开 Zippo 打火机那样拨开屏幕,硕大的模组在云台电机的驱动下迅速进入工作状态,垂直竖立而起。

影像模组中一共容纳了两颗镜头,底部的镜头下方写有「1 inch」字样,而顶部上方则写着「3×」。

这颗 3× 镜头,就是 Pocket 4P 的最大更新。

受限于极其紧凑的机身,历代 Pocket 都只有一颗广角主摄,这带来了一个天生的痛点:很难拍好特写。

广角镜头自带透视变形,强行贴脸拍摄,画面边缘不可避免地会被拉伸得像哈哈镜;且广角镜头很难将主体与杂乱的背景剥离,做出好看的虚化。

而 Pocket 4P 打算用一颗全新的 3× 中长焦,直接跨过这道坎。

在我们的实际体验中,这颗 3× 中长焦给了我深刻印象——

这个镜头更符合人眼聚焦的视角,更窄的画幅可以有效减少杂乱元素的干扰,拍出更干净的画面。

值得一提的是,这颗镜头还带来了非常自然的虚化,焦外过渡柔和,可以推测其配备了大光圈,并且最近对焦距离大约在 25 厘米左右(甚至更近),可以怼脸拍摄人物或静物细节。

恰到好处的焦段、自然的虚化与足够近的对焦距离,让 Pocket 4P 在拍摄日常琐碎时,能呈现出更贴近人眼自然注意力的构图。配合柔和的焦外表现,画面立刻就多了一层电影感。

当然,客观来说,这颗镜头也并非完美无缺。我们在实际使用中发现,如果用 3× 镜头快速横移拍摄近处物体,画面会出现轻微的果冻效应。不过,只要将镜头推向远景,或者稍微放缓运镜速度,表现就会稳当得多。

顺应双摄的加入,交互逻辑也变得更为专业了——按下屏幕左下角的变焦键,机器会直接调用 3 倍光学变焦;双击按键,它会直接跳到 6 倍。

如果你足够熟悉 Pocket 3,会发现之前更熟悉的 2 倍预设被拿掉了。显然,大疆在通过这种方式,引导用户优先去感受这颗光学长焦带来的纯净画质。

新增的长焦抢尽了风头。但在几天的重度使用后我们发现,Pocket 4P 上看起来似乎没什么变化的 1× 主摄,也很强。

在体验 Pocket 4P 的几天时间里,主摄在极大光比下的表现给我留下了深刻印象,在夕阳下的山坡上,落日的高光压制得很好,山坡上的野花和藤蔓细节也保留得非常丰富,相较 Pocket 4 在传感器方面应该也有所升级。

把焦段补齐、把宽容度拉满,至此,这台机器的野心已经彻底暴露——这是目前最专业的 Pocket。

好拍、拍好,是 Pocket 的首要任务

硬件更专业了,并不意味着门槛变高了。

让 Pocket 好用、让用户拍好,依然是 Pocket 系列的核心产品逻辑。

在 Pocket 4P 上,这颗 3× 中长焦无疑是最立竿见影的升级。但在别处,还有些不起眼的升级,也为这个目标服务——

摇杆就是一个典型的例子。过去产品上的摇杆,只有「动」和「停」两种状态,很难精准控制云台,稍微用力,镜头就容易猛地甩过去,很难拍出平滑的过渡。

在 Pocket 4P 体验后的采访中,Pocket 产品经理向我们介绍道,Pocket 4 全系列都换上了一颗定制的模拟量摇杆,给云台的转向加上了更细腻的力度分级,从而降低运镜的难度。

这对普通用户非常友好,手指推多深,云台就转多快,单手就能相对轻松地控制平移和推拉。

拍摄顺手了,出片效率也得跟上。

在 Pocket 3 上,Live Photo 成为大家分享照片的火爆载体,用户热衷于将数秒的视频浓缩为一张实况照片,便于社交媒体分享。

但以往,想要导出一张 Live Photo,需要先拍摄视频,然后再去 DJI MIMO 截取 Live Photo,再去拼图。视频占用空间多不说,创作热情通常也在流程反复中消磨殆尽了。

而从 Pocket 4 开始,直接将 Live Photo 功能集成在机身内部,一键就可以直出 Live Photo——这些特性也延伸到了 Pocket 4P 上。

为了配合长焦,物理空间的交互也得到了延伸。

3 到 6 米是中长焦极佳的观察距离,但对单兵作战的创作者来说,这意味着要在相机和被摄点之间频繁折返。

大疆的产品经理告诉爱范儿,未来将会专门为 Pocket 4P 制作一个体积极小、自带屏幕的专属遥控器。

出门自拍或者请路人帮忙时,用户可以站在远处,看着遥控器的屏幕从容调整构图。哪怕是一个人探店,也不用重复来回走动,就可以随意拍摄。

这些功能表面上看是增加了操控方式,往深了探究,其实是在重塑人与镜头的关系。机器不再是一个需要你时刻盯着、生怕它跑焦的「电子大爷」。它变成了一个安静站在几米外、随时听候你差遣的隐形摄影师。

一台设备,往往由硬件决定上限,但决定谁能用好它的,永远是交互。在影像领域,复杂的技术往往带着一种侵略性——晦涩、需要通过练习才能驾驭它。

但在 Pocket 4P 上,我们看到了一种谦卑。

把复杂的算法和结构藏在交互逻辑之下,这种克制恰到好处。

Pocket 4P 的 P,究竟是什么?

按照惯例,这台加上了长焦、影像能力大幅跃升的设备,理应冠上「Pro」的后缀。

但大疆偏偏只给了一个单薄的字母 P。

细想之下,这也合理——

消费电子领域,标榜 Pro 往往是为了在既定赛道里跟对手比拼高低,划分出森严的等级。但你环顾四周会发现,手持云台相机这个极其细分的品类里,根本找不到一个能够对标的竞品。

这里还是无人区,只有大疆一个玩家。

抛开命名上的博弈,回到实际体验,这个 P 显然有着更丰富的解读空间。

可以是 Pro。

不管是更专业的 D-Log 曲线、更高的动态范围,还是特写中长焦,都让 Pocket 获得了前所未有的专业属性,具备跨入生产工作流的硬实力。

也是 Popular。

多出一颗镜头,换上定制摇杆,并没有垒起更高的技术高墙。相反,大疆利用强大的硬件冗余,拉低了普通用户拿起相机就能拍出好东西的技术门槛。复杂的对焦测光与繁琐的后期大大压缩,用户只需要开机、对准想留住的风景,然后按下拍摄键。

还能是 Possibility。

手持云台相机依然是个年轻物种,远没摸到进化的天花板。大疆今天能用把双摄塞进口袋,明天在这个形态里搞出更专业的电影机分支,也不是没可能。

跳脱出设备本身,最迷人、最丰富的可能性,永远在握着它的人身上。

1991 年,普适计算之父 Mark Weiser 在《科学美国人》杂志中写过一句往后被奉为圭臬的话:

最深远的技术,往往是隐于无形的,它们将自己编织进日常生活的肌理当中,直到与生活融为一体,无法分辨。

Pocket 4P 把长焦镜头和云台防抖揉进机身,以简单直观的交互、趁手好用的尺寸,顺理成章地装进更多人的口袋——而当影像设备隐于无形,影像故事也更加纯粹。

普罗大众的生产力,就由此而来。

爱范儿相信,等这台口袋电影机揣进越来越多人的口袋里,稀松平常的生活图景,一定还会长出更多东西。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

谷歌发布安卓 AI 系统,这就是苹果想象中的自己

和去年一样,在正式的 Google I/O 开发者大会之前,谷歌为 Android 单独开了一次小型发布会。

本次 Android Show 上,谷歌几乎是一股脑将未来一年有关 Android 和整个 AI 产品生态的「宏愿」抖了出来。

除了作为基底的 Android 17 之外,我们这次还迎来了一些意料之外的平台更新和几款硬件产品的发布。

重点在于:虽然产品不多、距离 Android 17 广泛推送还有一段时间,但我们已经足以看到谷歌未来五年甚至十年,对于人工智能生态的计划了。

更要命的是,今晚的谷歌,刚好是苹果梦想里进入 AI 时代之后的自己。

操作系统到智能系统

活动刚开场,谷歌就宣布了一项意义重大的举措:

Android 将不再是一个单纯的操作系统(Operating System),而是一个智能系统(Intelligence System)。

图|Google

换句话说,曾经以「用户手动操作」为绝对主流的软硬件使用方式,在谷歌看来已经是上一个时代的符号了。

从今天起,Android 作为一个智能功能的集群,会更加主动地介入到用户操作流程的更前端,想你所想、做你所做。

图|Google

这也是为什么在本次活动上,Android 17 这个具体的系统版本出现的次数屈指可数,Gemini Intelligence 却成为了系统的代名词。

首先,Gemini Intelligence 作为谷歌 Gemini 在手机硬件上的最新形态,极大强化了它多模态、跨环境、高度整合的运行模式。

比如作为系统输入的第一入口,默认键盘 Gboard 就得到了一次功能强化。

基于 Gemini Intelligence 的多模态能力,原本在键盘功能中存在感不高的「自动填入」功能极大地拓展了它的信息来源:

图|Google

除了手动保存的各种密码之外,Gboard 还将会支持自动填入图库里面的证照信息、聊天提到的地址信息、邮件撰写的日程信息等等。

更直白地说:Gemini Intelligence 已经远超「帮忙记住密码」的水平,而是真正像个助理一样帮你记住和建议各种来源、各种类型的信息。

另一种有效利用这些多模态信息的方式,则是 Android 的桌面小组件(widget)。

在 Android 17 中,Gemini Intelligence 将会支持一项名为「Create my widget」的功能,但不是第一时间上线、而是目标今年晚些时候。

图|Google

这个新功能主要做的,就是用类似 vibe coding 的模式,根据你的指令在桌面上创建新的小组件,打破了小组件只能是 app 预置的那些。

举例来说,相比功能单一的记录卡路里的 app,我可以和 Gemini 说:做一个每周工作日向我推荐两次高蛋白餐的小组件。

图|Google

这样一来,桌面小组件就真正变成了一项复合任务的入口,本质上和人 vibe coding 一个 app 的性质是完全相同的。

此外,喜欢语音输入的用户也有福了——新版 Gboard 将会支持类似 Typeless 的高智能化语音输入功能,名字叫做 Rambler。

相比以前要亲口说「逗号…句号…」,Rambler 可以将一整段充满了「嗯嗯啊啊」的口述转译、清洗、整理成一段整洁的文字:

图|Google

另一方面,Gemini Intelligence 的自动执行功能也得到了进一步加强。

去年的 Google I/O 和发布会上,谷歌演示过给 Gemini 下命令,让它自动帮你点外卖、叫车、订票之类的操作,正式上线之后反响不错。

而在 Android 17 中,Gemini 升级成 Gemini Intelligence,这种「代操作」也支持多步骤任务了。

比如以前只支持简单的「帮我订一张票」,你现在可以在 Gemini 对话框里直接拍下旅游宣传册,和 Gemini 说「在携程上帮我找一个类似的双人团行程」:

图|Google

重点不在于 Gemini 能够执行什么任务,而是它拥有了更强大的「多做一步」的能力,有时候就是多的这一步,让 AI 从「能用」变成了「有用」。

当然 Android 17 的更新也不是 Gemini 的独角戏,谷歌同样对很多「Android 核心体验」进行了优化。

在 Android 17 中,谷歌和 Meta 达成了合作,在 Facebook、Instagram 等等 app 里支持了调用原生相机功能,比如 Ultra HDR、超级防抖、夜景视频等等。

而谷歌使用了好多年的平面风格 emoji 也迎来了一次更新——从原本的纯 2D 变成了 2.5D,在风格上更接近 iOS 使用的 emoji 了:

图|Google

而我们此前介绍过的 QuickShare 兼容 AirDrop 的功能,也将在 Android 17 上支持更多厂商的设备。

除了三星和 Pixel 之外,(国际版)OPPO、Vivo、一加和荣耀的较新机型也将在今年下半年陆续更新兼容 AirDrop 的固件:

图|Google

谷歌的 AI PC

在 Gemini Intelligence 之外,谷歌也没有忘记给这些更复杂、更强大的 AI 功能打造一套量身定制的硬件。

这个新硬件的形态,既不是吊坠,也不是耳机,更不是手表手环——而是曾经的 Chromebook。

没错,在 AI 时代,谷歌又双叒给自己的笔记本改名了。

从 Pixelbook,到 Chromebook,再到最新的 Googlebook:

图|Google

和 Chromebook 一样,Googlebook 并不是某一款具体的笔记本电脑,而是同样和第三方厂商合作、只要符合标准的都可以叫这个名字。

而 Googlebook,就是「第一款为 Gemini Intelligence 量身打造」的硬件产品。

除了上面的全新 Gemini Intelligence 功能之外,Googlebook 在日常使用最频繁的基础人机交互层面,做出了堪称革命性的创新——

在 Googlebook 上呼出 Gemini 功能,既不需要说话、也不需要按键、更不是右键菜单,只需要「摇一摇光标」就行。

图|Google

基于 Gemini Intelligence 的多模态能力,推荐的 AI 指令甚至可以根据光标下面的内容、选中的内容、屏幕上可以进行的操作等等因素自动调整。

在如今电脑端 AI 功能越来越密集、笔记本键盘空间不够充裕的情况下,Googlebook 的「魔法指针」无疑是最直观且优雅的解决方案之一。

此外,Googlebook 还解决了 ChromeOS 历史上的老大难问题:它是谷歌的产品,却跑不了 Android app。

换句话说,所有 Android 手机里面的 app,在 Googlebook 上都可以直接运行,基本看齐了如今 macOS 跑 iOS 软件的水平。

这一切的基础,就是爱范儿之前文章中提到的谷歌大力推行的 GKI(通用内核镜像)计划,正在让 Android 脱离手机的桎梏、无缝衔接到更多形态的设备上。

虽然谷歌目前没有提到这个功能的兼容情况,但我们猜测,依据处理器规格和网络状态,Googlebook 应该同时支持本地运行和画面投屏手机 app 两种方式。

图|Google

根据活动消息,首批 Googlebook 的生产厂商还是那几个熟悉的身影:宏碁、华硕、戴尔、惠普、联想等等,首批产品预计在今年内上市。

图|Google

除了笔记本电脑,Android 17 同样更新了一部分 Android Auto 车机系统的功能。

比如更像 OpenClaw 能力的 Gemini Intelligence 代操作、优化的 3D 道路画面、更加智能化的流媒体播放功能等等。

当然也支持把手机上自创的自定义 widget 显示在车机上。

图|Google

同时,原生支持 Android Auto 的品牌范围也在增加,部分型号甚至支持记忆当前车辆信息,类似后备箱尺寸、仪表盘规格等等。

这样一来,用户在使用 Gemini 问答的时候,车机就能给出具体回答,比如「能不能同时放俩 27 寸旅行箱?」或者「那个像是刺客的警示灯是什么意思」之类的。

可惜的是,这项功能目前也不会立即上线,同样预计为「今年晚些时候」才会有产品搭载。

总的来说,本次活动只是今年 Google I/O 的开胃菜,但它涉及到的理念变革却是非常根本性的——

其实在活动的开头,谷歌就指出了:好用的人工智能技术,就应该是让人感受不到的,它会融入进每一层软件和硬件的体验。

图|Google

而这正是 Gemini Intelligence 在做的。

无论是 Pixel 手机、Android Auto 车机还是 Googlebook,这些硬件最终都只是 Gemini 智能的一种体现方式而已。

值得玩味的是——谷歌今天晚上所做的,刚好就是苹果削尖脑袋想要实现的那套 AI 生态。

让 iPhone、手表和 Mac 共用一套智能体系,用户无论在哪里使用,功能和体验都是高度相似的,硬件只区分交互方式、不影响智能水平。

图|Apple

可惜的是,苹果挣扎了这么久,也没有搞定「模型」的部分,反而让自己的硬件成了别家模型的嫁衣。

将来的智能系统(Intelligence System),形式比现在更多样、但核心却比现在更加统一。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Seedance 2.0 最强对手偷跑了

现在无论哪一家要发布视频模型,都免不了要被拉来和 Seedance 2.0 对比。

而最近比较沉寂的 Google,似乎在悄悄憋一个大招,来重夺视频生成的王座。

今天凌晨,有网友在 Gemini 中意外触发了一个全新的视频生成模型——Omni(全能)。

在 Gemini 的聊天页面,直接显示着「用 Gemini Omni 来创作,认识一下我们全新的视频生成模型。重混你的视频、在对话中直接进行编辑、尝试丰富的模板,以及更多功能。」

▲得到意外访问的 Gemini 截图

不过,这位网友表示他再次打开 Gemini 应用时,不仅 Omni 功能没了,Gemini 界面也恢复到了旧版。

从目前泄露的初测结果来看,Gemini Omni 在某些场景下的表现,相当出色,很有当年 Nano Banana 一统图片生成的感觉。

曝光的两个测试案例里,就像 Nano Banana 解决文本渲染一样,Gemini Omni 也解决了此前 AI 视频生成的两个痛点:文本连贯性和人物进食的物理逻辑

▲ 视频来源:X@chetaslua|提示词:A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.

这个挑战复杂数学板书的 10s 视频,提示词只有一句话「一位教授在传统的黑板上写出三角恒等式的数学证明,并解释他目前在方程式中执行的步骤。」

尽管在画面中依然能找到一些 AI 生成的小破绽,但整个视频完美处理好了黑板上的「文本」内容,这是曾经很多视频模型的一个大 Bug,此外,视频整体的真实感也非常强。

网友们对这个视频的态度是「太疯狂了」,AI 超创博主@Azed_ai 也在爆料视频下留言,「如果这是实际输出,那么文本一致性确实令人难以置信。」

▲ 视频文件链接:https://gemini.google.com/share/7d5dc678c80a

有网友质疑这个视频的来源,可能并不是由 Gemini Omni 生成的,爆料的博主直接放上了 Gemini 的官方链接。

我们把同样的提示词丢给 Seedance 2.0 进行测试,画面的真实感同样可圈可点,但是板书的内容,似乎和三角恒等式的关系不是很大,黑板上的一些文字渲染还是有问题。

▲由 Seedance 2.0 生成

另一个爆料的视频是致敬「威尔·史密斯吃意大利面」,这个测试案例几乎成了所有视频生成模型的必跑提示词之一。

▲ 来源:Reddit@Zacatac_391|提示词:Can you create a scene with two men at a table seaside at an upscale restaurant on outdoor deck seating. They are at a circular table with a nice white table cloth, and all of the fancy accessories, all the spoons forks and knives, fancy napkins, centerpiece. One man is Distinguished: A mature African-American man in his 50s with a short beard and confident posture, wearing a tailored, sophisticated suit, the other is is friend, both approaching the table to eat a plate of spaghetti. In the beginning the men approach the table, exchange brief niceties, and begin to eat the spaghetti calmly In between bites sharing conversation.

获得提前访问的测试者表示,当他尝试输入威尔·史密斯意大利面测试时,被 Google 的内容生成护栏限制了,所以他描述了一个长相酷似威尔·史密斯的人。

Gemini Omni 生成的这个视频,虽然比 Google 自家的视频生成模型 Veo 3.1 更好,从声音和画面真实质量上,都更像真人视频。

但也有网友发现,他们站着的时候,盘子里没有意大利面,但是坐下来之后就有了,紧接着是吃的时候,根本没吃,意大利面就没了。

我们同样把这套提示词交给 Seedance 处理,在吃的时候,结果比 Gemini Omni 的表现要自然不少。

▲ 由 Seedance 2.0 生成|提示词:你能想象两个男人在海边一家高档餐厅的露天餐桌旁用餐的场景吗?他们围坐在铺着洁白桌布的圆桌旁,桌上摆放着各种精致的餐具,包括勺子、叉子、刀叉、漂亮的餐巾和中心装饰品。其中一位男士风度翩翩:一位五十多岁、成熟稳重的非裔美国男士,留着短须,身着剪裁合身的精致西装,姿态自信。另一位是他的朋友,两人都来到桌边,准备享用一盘意大利面。一开始,两人走到桌边,简单地寒暄了几句,然后开始平静地吃意大利面,并不时地闲聊几句。

在 Reddit 上有网友质疑他是否有用过最新的视频生成模型,这位测试博主表示他用过最好的是 Kling 3.0。

网友回复他说,Seedance 2.0 要比 Kling 3.0 好上不少,所以 Gemini Omni 的表现对我(用过 Seedance 2.0 的人)来说一点都不惊讶。

而在 X 上,也有网友认为 Gemini Omni 的表现,要比 Seedance 2.0 更好。

▲ X 上不少网友转发这些爆料视频,表示效果要胜过 Seedance

更让人意外的时候,Google 这次不只是推出视频生成的功能,Gemini Omni 还支持视频的编辑功能。

像是可以把原视频中的意大利面,直接替换成一碗像是冬阴功的泰式风味汤。

还能把之前 Sora 生成的带水印视频,直接编辑为去掉水印。

▲视频来源:X@Waguri_Kaoruko8

从测试结果来看,Gemini Omni 成功地把原 Sora 视频中,持续移动的 Sora 水印去掉了,并保持和原视频基本一致。

还有网友测试了 Gemini Omni 在动漫视频生成上的表现。

和初代的 Nano Banana 主打图片编辑,让我们制作各种桌面手办一样。不少人也认为 Gemini Omni 也会走这样的路,视频生成能力较差,但视频编辑能力会更强,要等到 Gemini Omni 3 代,可能视频生成能力才是最好的。

在曝光的界面中,还出现了一个使用量(Usage)截图。数据显示,仅仅生成了数学板书和吃面两个视频,就耗费了该用户 AI Pro 订阅计划每日额度的 86%,他提到自己当天只是使用过一些 Gemini Flash。

AI 视频显然还是一门相当烧钱的生意,但只要效果足够好,买单的人不会少。

这段时间,一些 AI 视频在网络上爆火,不仅有更长的时长、更真实的场景、对话、演技、故事性都比去年爆火的那些 AI 视频要强。

视频生成平台 Runway 的技术美术师 Marko Slavnic 在 X 上发一了段用 Runway 制作的的鸽子视频,Runway 上可以使用 Seedance 2.0 模型,视频很快就获得了百万次浏览。

有网友说,这段 47s 的视频完全没发现任何 AI 的痕迹或不自然的动作,迪士尼动画可能真的需要警惕了。

▲ 视频来源:X@Markoslavnic

还有之前在微博热搜上的话题「AI 短片 量产爱死机」,视频被转载到外网后,也直接冲到了 1200 万次观看。

转发这个视频的是一位生成式 AI 视频与广告领域的创作者,同时也是一家 AI 广告公司的创始人 PJ Ace。他直接说,

这是我近年来看过最好的短片之一。
很快,我们将不再称其为「AI 电影」,而直接称其为电影。

▲ 视频来源:X@PJaccetturo

而在原视频的 B 站评论区里,也有网友提到视频非常火,不仅有国外的 PJ Ace 想发 Offer,也有广州的 AI+ 创作团队向他伸出了橄榄枝。

对视频的好评也是毫不吝啬地表达,「这是预告片我会去电影院」、「一流的作品,色彩、构图、剧情都无可挑剔,除了时长稍短,放在任何一季爱死机里都不突兀。」、「几年前这要一个顶级团队花费几个月几百万做出来」……

▲ 视频来源:【Ai原创短片《丧尸清道夫》-重制版,国产“爱死机”!】https://www.bilibili.com/video/BV1FFRQB2Eqw/

和以前每月推荐几部电影一样,现在也有网友开始总结「本月四部不容错过的 AI 短片」。

除了那些被诟病为是 AI Slop 的内容,随着生成质量的提升,AI 视频开始成为主流的媒介是无法避免的趋势。

Google 此次曝光的 Gemini Omni 或许也是为了给下周即将举行的 Google I/O 大会造势,如果能在今年的大会上,看到 Gemini Omni 开放,新的 AI 视频生成下半场又将开启。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌