阅读视图

发现新文章,点击刷新页面。

高通的「共享内存架构」,想让 Win 本追上 MacBook Pro

一台 14 或 16 英寸的笔记本电脑,将几十上百 GB 内存直接封装进 SoC,实现超过 200 GB/s 的高性能内存带宽,还有轻薄的机身和安静又狂暴的性能……

你可能以为这是 MacBook Pro——但如果我告诉你,这是一台 ARM 架构的轻薄型 Windows 本呢?

4 月 27 日,华硕发布了灵耀 16 Air 的骁龙版,搭载的是高通骁龙 X2 Elite Extreme 平台,也即高通去年推出的第二代 Windows on ARM 处理器。

这是第一颗将 LPDDR5X 内存做进 SoC 封装的骁龙旗舰 PC 平台,是与苹果「统一内存架构」理念一致、执行接近的平行方案。尽管没能做到 M 芯片的百分百效果,仍然是高通在这条新路上,最关键的一次尝试。

这台华硕灵耀 16 Air 骁龙版,整机 1.2kg、厚度 13.9mm,48GB 内存(频率 9523 MT/s),可提供 20-30 小时续航。机器于 4 月 28 日京东首发,售价 13999 元。华硕同时也有 14 寸版本提供。

同期亮相的还有面向创作者的 ProArt 创 X 2026 二合一笔记本,重 0.82kg、提供 22 小时续航与 2.8K 144Hz OLED 屏。这些机型共同组成了华硕在 ARM Windows 阵营的 2026 全新产品矩阵。

回到顶配 X2 Elite Extreme 的共享内存架构:将内存放进芯片封装内,放到 CPU、GPU 和 NPU 的身边,并不只是改了改电路板布局。实际上,整个计算资源调度的方式,都发生了很大的改变。

苹果在 2020 年的 M1 芯片开始,不仅将内存封装进 PC 级芯片,更让调度变得更加灵活,内存反复读写的次数要求有所降低,结果就是让内存带宽暴增——称为统一内存架构。今年 3 月发布的 M5 Pro 和 M5 Max,则更是将内存带宽推到了 307 GB/s 和 614 GB/s。

骁龙 X2 Elite Extreme 是 Windows on ARM 笔记本第一次通过内存内封装的思路,让 1.2 公斤左右的轻薄本也可以享受类似于统一内存架构带来的快乐。

这背后,是高通和华硕等各大 OEM 一起,想让 Windows 笔记本追上 MacBook Pro 的企图。

让内存搬运再快一点

需要注明的是,「统一内存架构」是苹果使用的说法,高通官方称自己的方案为 SiP(System-in-Package)。

两者所指不完全相同:UMA 描述的是内存访问架构,SiP 则指的是具体的封装技术。但它们的实现效果和追求目标高度一致——共享物理内存池、跨 IP 块缓存一致。

可用于算力密集型任务(比如 AI 推理)的「显存」上限,直接等于整机的内存上限。哪怕是一台 48GB 的轻薄本,理论上也可以本地运行数百亿参数级别的大模型,这在传统架构上需要工作站级独显,采用集显的轻薄本很难做到。(X2 Elite Extreme 最高 SKU 为 128GB 共享内存。)

系统级缓存(SLC)可以在 CPU、Adreno X2 GPU、Hexagon NPU 之间动态分配,比上一代带宽高 70%;192-bit 内存总线搭配 LPDDR5X-9523,能够实现高达 228 GB/s 的C/G/NPU 共享内存带宽。

而传统的混合计算负载(同时依赖 C/G/NPU),被内存搬运所掣肘的情况,也得到了极大缓解。并且,整机功耗也能维持在轻薄本可以接受的水平。

更值得一提的是,这一代 Hexagon NPU 还专门把 DMA 单元升级到 64 位虚拟寻址,让 NPU 终于可以访问超过 4GB 的内存,一定程度上突破了 NPU 坐端侧大模型推理任务的瓶颈。

这的确不是 Windows 阵营第一次试水类似统一内存架构的方案,在此之前,英特尔、AMD 都做过尝试(稍后会详述)。

不过在今天,华硕灵耀 16 Air 骁龙版的高配机型,是 Windows 阵营里首个最大限度接近统一内存架构效果,并且还做到 1.2 公斤左右 ARM 轻薄本上的方案。

让更多 Windows 笔记本用上新架构

在共享/统一内存架构的道路上,每家芯片巨头对的判断都不一样,首先是工程问题,更深一层是商业问题。

一名在某芯片巨头供职的专家告诉爱范儿,行业里无人质疑统一内存架构的优秀,但做与不做,能否持续做,分歧在于厂商对性能目标和成本之间的平衡。

在 X2 顶配 SKU 上,高通目前的看法是:将统一内存架构所解锁的强大性能,交给给到真正需要它的硬核用户,特别是那些工作流里重度依赖 AI 模型/AI 功能的专业用户和创作者,这件事值得花成本去做。

再看英特尔,在上一代 Lunar Lake 架构上做过类似尝试,然而成本炸裂难以控制,不得不终止。英特尔前 CEO Pat Gelsinger 在财报会上明确将该次尝试定义为「one-off」,理由是封装内存把毛利压得太低。

今年 1 月发布的 Panther Lake 机型则回归了传统外置内存路线,据信后续的 Nova Lake 架构也将延续老的策略。英特尔仍然在高端 AI 笔记本市场上占有一席之地,但可以说短期内不会再走统一内存架构这条路了。

AMD 那边,Ryzen AI Max+ 395(Strix Halo)同样采用类似的共享内存架构架构,最高 128GB 板载 LPDDR5X,能够实现高达 256 GB/s 内存带宽,比 X2 Elite Extreme 还激进。

正因为此,在 AMD 的定义下 Strix Halo 属于移动工作站芯片,搭载的笔记本价格都更高,形态也更厚重,抑或是搭载于迷你工作站,不在个人笔记本电脑消费者的选购范围内。

三家芯片厂商,三种不同答案。骁龙 X2 Elite Extreme 消费级笔记本在这个时间点正式面市,虽然很难说撞上了换机窗口(毕竟今年的内存实在太贵),但至少填补了消费级市场的真空。

何时能追上 MacBook Pro 呢?

老实说,骁龙 X2 Elite Extreme 目前也只是跟苹果那边的 M5 基础款能打个有来有回,跟 M5 Pro/Max 这样的工作站级「顶级牛马」距离还比较远。

最直接的差距在于内存带宽的极限值:X2 Elite Extreme 的带宽宣传值能够达到 228GB/s,是 M5 Max 的 ⅓ 左右,比 M5 Pro 的 ⅔ 多一点。

当然还是要给 X2 挽尊一下,这一代仍然是单 die(晶粒),内存带宽存在物理上限。

而苹果在 M5 Pro/Max 这一代用上了新的「融合封装」,也即将两块 die 拼到一起,把内存总线扩展到更高。

在最直接的大模型推理任务上,内存带宽差距直接意味着 token 吞吐速度的差距;在 4K/8K 等极高清的视频剪辑和 AI 处理任务上,或者在其他工程软件的算力密集型任务上,也会有明显体现。

不过至少,Windows 平台在这些专业/工业软件的兼容性上是要比 macOS 好的……

我想,骁龙把共享内存架构带进消费级 Windows 笔记本市场,这件事的意义讨论或许不应该局限于性能数字上谁暴打谁,

而在于 Windows 平台用户不应该一直享受「二等公民」的体验。

即便是一台不超过 1.5 公斤的大屏轻薄本,仍然可以提供远比其它 Windows 性能本更好的 AI 算力,而且仍能保住轻薄本应该有的功耗优势——这,才是更重要的。

当然,围绕在 Windows on ARM 周围的种种问题,比如软件生态、x86 模拟层稳定性、专业软件适配等等,仍然无法被共享内存一劳永逸地解决。

从芯片厂,到微软,再到 ISV,大家都在加紧马力。比如 Photoshop、Lightroom 已经能够稳定运行 ARM 原生版本;达芬奇也早在两年前就完成了 Windows on ARM 的原生支持,甚至比 Adobe 还早。

但软件生态兼容仍有不完美之处,比如 Adobe AE 的部分渲染器和工作流仍然只能在 x86 平台上使用;Blender 的一些渲染功能在 ARM 架构上也会性能打折。

这是一个软件追硬件的时代。只有 X2 这一代能够让足够多用户,特别是创作者和专业用户,真正将骁龙本纳入主力机考虑——ARM 生态才会进入「用户越多适配越多,适配越多用户越多」的正反馈。

苹果也走过同样的路,所以这绝非不可能完成的任务。

 

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

假如应用也可以像朋友圈一样传播?

在一座山村学校里,老师想给孩子演示光的折射原理。

但翻遍整个学校都找不到合适的教具。于是,老师打开「灵光」,对着手机说了一句话来描述想要的东西:

「我想做一个光路模拟工具,要符合物理法则,要很直观和易用,我可以拖动光路角度,能展示光的反射、折射、散射原理,我要在课堂上给小学生展示。」

这个用几句话手搓出来的小东西,只用了老师五分钟左右的时间,却在课堂上大受欢迎,学生们爱不释手。

放在两年前,这件事的每一步都很难走通。「AI 生成应用」停留在指令演示层面,是属于程序员的特技;交付物大多运行在电脑上,不适合中国这样的移动互联网优先市场;生成的作品也很难分享给别人、直接用起来。

三道关卡,把很多想要尝鲜的普通用户挡了门外。而如今,情况早已发生变化。

应用生态二十年,我们一直是「看客」

过去十多年,我们在互联网上消费的内容,形态换了好几轮——从图文到短视频,再到直播,始终没变的是你的身份:观看者。

创作门槛降低了,人人可以发帖,人人可以开播。但「开发应用」,或者更具体来说,从零开始打造一个完全为自己而生的工具这件事,始终存在一个专业门槛。写一个能运行的应用,不管多简单,都需要代码——以前可能需要你直接写代码,今天的氛围编程时代则需要你使用编码工具。

这道门槛从未真正被打破过,直到蚂蚁「灵光」App 的这次升级,让它开始松动。

一种全新的 Wish Coding 开始涌现。

不是说 AI 能写代码这件事,那早就不是新闻了。真正的变化在于,这一次,从生成、部署,到使用、迭代,整个链条终于全部打通,而且全部可以只在手机上完成。不需要电脑,不需要懂技术,不需要将任何代码部署到网页上或提交到应用商城。

更惊艳的是,随着这次升级,灵光的闪应用终于可以调用手机的原生能力:相机、相册、陀螺仪、GPS、语音识别,这些手机里本就有的硬件,现在可以被一个普通人「口喷」出来的闪应用给利用起来。

譬如在一个健身打卡的闪应用里,你可以调用相机记录自己的动作;一个足迹记录小工具,能够读取位置,帮你记录你今年走遍了祖国的哪些大好河山;一个随口描述即可生成的「饮食热量查询」,也能识别语音,你只需要说出菜名,就能加入到一餐的卡路里计算当中。

哪怕是一个最简单的「摇一摇」挑战,都能轻松实现:

 

在灵光上,APPSO 还看到有人做了经期记录工具,有人做了控糖查询器,有家长做了一个能够按孩子节奏调整难度的英语拼读练习,还有各种各样的按钮、放置小游戏等「杀时间神器」……五花八门、千奇百怪。

如果说前一代的灵光闪应用,更多停留在原型、最小可行产品的阶段,那么升级后的灵光,终于成了真实可用的趁手工具。

应用也有自己的「朋友圈」

灵光用户目前已创建超过 3000 万个闪应用,覆盖了从互动游戏、情绪减压到语言打卡、待办清单等功能,关系到日常方方面面。

而随着本次更新另一大新功能「灵光圈」的上线,这数以千万计的闪应用,也有了自己的「朋友圈」。

灵光圈是一个专门用来分享、点赞、评论、二次创作闪应用的社区。在里面,你可能会刷到类似「今天吃什么」的闪应用,但发现里面没有你爱吃,而且外卖可以点到的品类。与其自己手搓一个,为何不直接在它的基础上进行修改?

「给可选菜单里加上肠粉、猪脚饭、牛肉火锅。」一句话,就这么简单。

以下面这个场景为例,APPSO 在灵光圈里看到其他网友做了一个喝水打卡小应用,觉得完全可以给他增加几个新的打卡种类。

我在这条灵光圈上,点击「修改」的按钮,用语音描述我想做的修改。

然后等上一小会,就做出来了:

灵光圈所改变的,不只是用灵光创建的闪应用的去处,而是工具开发和传播的底层逻辑:

过去的应用分发,对于普通人来说很困难。围绕产品也很难进行有效、快捷的讨论。最重要的是,你看到一个好的「底子」,想把它改写成更适合自己使用的版本,各方面的成本都很高。

灵光圈更接近一个创作者社区,只不过创作物从图文变成了可以运行的工具。一个人做出来的东西放进去,有人用,有人改,有人在原基础上加功能再发出来。闪应用的生命周期,不再止于创造它的用户一个人,而是可以在社区里延续,开枝散叶。

曾几何时,山村教师要在黑板上一次又一次地改画图表;后来,他可以把自己做的光路模拟闪应用发给其他教职同事,在当地教育系统的群聊里传播。

而在今天,他终于可以把这个手搓的小东西发布到灵光圈里,让它跃出山沟,走向更大的世界,被更多人发现。

应用,开始像互联网内容一样,获得了天然的可传播属性。

有人会说,闪应用足够轻量,算不上真正的应用开发。这个判断并没有错,它恰好击中了关键:灵光圈里流通的,是普通人的工具,解决的是那些太小、不值得开发团队来做,但又真实存在的麻烦——记录某件事、追踪某个习惯、各种各样可以用来杀时间的小东西。

过去的应用经济模式,决定了这片空白无法被填补。而在灵光之后,一切都变了。

一人应用,开枝散叶

灵光闪应用开启了一种「一人应用」的创意模式,在人群中流转。

31 岁的郭郭曾经是个北漂,形容自己的状态是「每天像上紧了发条」。如今,她从高压的职场辞职已经一年多了,和丈夫定居成都。

「不想被工作定义人生」的她,开始在社交媒体上做博主。但区区两千多粉丝很难支撑变现,她做了一个判断:必须做自己的产品。

目标管理工具方向是她看到的机会,但 Notion、多维表格的赛道早就拥挤。她偶然接触到一个概念:把一年365天拆成「36个10天」,每个阶段专注一个目标。这很像她自己的需求:我们的工作/生活/个人进步没有宏大到需要一个复杂的规划系统。一个低门槛的每日打卡,就足矣。

但她没有任何编程基础。

春节期间,她用灵光从头开始,每天花几个小时的时间整理自己的需求,然后口述出来,让灵光生成框架,逻辑不通就反馈,反复调试,前后花了一周,终于做出令自己满意第一版。

她把应用上架到了社交平台,定价 9.9 元,收到第一批买家。反馈涌进来,她一条条看,一个月后出了第二版,加入心愿清单功能,定价涨到12元。

不到两个月里,这个打卡工具累计卖出了 850 单,收入近 9000 元——靠的只是一张嘴,和脑子里对需求的洞察。

她把这种新的「创业」模式跟之前设想的博主模式做了个对比:做内容要去撞算法,要迎合用户喜好,接广告还要甲方审核,整个链路又长又累;「现在自己做产品,改进速度以天计算。」

郭郭只是「一人应用」理念的一个代表。从被动等待别人认可,到主动把想法变成产品、推向市场,整个产品开发与传播的路径,发生了本质性的变化。

进入意图编程 (wish coding) 的时代

计算机时代长久以来,出现了这样一种分工:有想法的人,和能把想法变成机器语言的人。

前者很多,后者却很少。这也是为什么绝大多数人的「想法」只能停留在想想的阶段。

当 AI 具备了编码能力之后,这道门槛正在以肉眼可辨的速度降低。但降低到什么程度,一直有争议。

「氛围编程」这个概念已经流行两年了,但现实是,即便有了 AI 大模型的帮助,绝大多数人仍然很难接受和使用 IDE、CLI、各种编程工具。即便他们写出来了东西,最后还是需要懂技术的人收尾。

将想法转译成机器语言的步骤减少了、步长缩短了。这个转译的门槛却依旧存在。

灵光做的事,是把对于完全不懂技术的普通人的一切阻碍,通通砍掉。意图可以被一句话代表,意图可以直接生成可运行的闪应用,出现在你的手机上,立刻可用,还能很方便地分享给朋友、分享给世界。

以自然语言描述为核心的 Wish 语言,和灵光的一句话生成闪应用,都是这一「意图编程」理念的有趣实践。

通过闪应用,意图可以直接诞生具备商业潜质的产品,成就越来越多的「一人公司」们;也可以在山村教师的手中化作千变万化的「虚拟教具」,用一种轻量的方式,开始消解让教育平权的结构性难题。

将人类的意图翻译成机器语言,过去需要用户洞察与产品理解力,更重要的是需要代码作为转译。

而在今天,语言即代码。

或许多年以后,对于相当一部分人而言,他们不再需要知道代码的存在。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

数字排毒,我们这代人的赎罪券|硬哲学

很少有 MacBook Neo 评价两极化这么夸张的苹果产品。

有人说它性能完全不够,靠 logo 骗预算不够的小白;有人却说它是近年来苹果最务实的诚意之作。

剥离掉对跑分性能和极致的生产力上限的执念,你会发现,已经很久没有一款科技产品,剔除冗余的性能溢价,也不做不切实际的承诺。你不应该买它,除非你真的需要。

在 MacBook Neo 的身上,有一种真正的「极简主义科技」意味,因为它回应了用户真实需求,也没有人为阉割来制造所谓的极简感。

今天爱范儿这篇专栏文章,想要探讨真正的「极简主义科技」究竟是什么。

我在 Reddit 上看到了很多帖子,描述想象中的极简主义科技生活:主力机是 Light Phone 3 代,这台「笨手机」(dumb phone) 售价 699 美元;一台 iPod Classic 用来听歌;一台十年前的数码相机用来拍照;当有灵感需要记录的时候,他会从自己的「离线包」里掏出手账本……以此类推。

每一个智能手机具备且经常使用的功能,都被分散到一台单独的设备或道具上。日常出街的家伙事,足足三斤重。

帖主给这种状态起了个名字:Inconvenient Maximalism,不方便的极繁主义。

对了,这个「离线包」(analog bag) 也是前段时间洋抖 (TikTok) 上爆红的最新趋势,成千上万的视频,巨大的流量。它指的是一个装满「离线物品」的包:胶片机/CCD、随身听、有线耳机、毛线针和线团、手账本与纸质书……大意是说,当你出门时完全可以把手机扔下,用这包东西打发时间。

我很喜欢的一个「反消费主义者」YouTube 博主 Levi Hildebrand,是这么评价「离线包」的:

手机能做一百件事。所以你不带手机就需要一百样东西来替代它,结果就是你的包包越装越重。

然而更讽刺的是,这些博主明明带着手机,背着包包到处跑,几十个场景机位来回切换,拍出视频……就是为了发到网上,再忽悠他们用自己的返佣链接下单去买这些 CCD、随身听、耳机、毛线针、手账本?

如今的消费主义,已经堕落到这种程度了?为什么这些热衷于「极简主义科技」「数字排毒」的人,如此抽象?

数字排毒,活成了自己的笑话

每当某种注意力收割工具令人厌倦了、过时了,马上就会有新东西,以反抗者、革命者的姿态出现,承诺将你解脱出来……

不消时日,这个新东西就会马上演化成下一轮的收割工具,往复循环。

今天,这个新东西就是「数字排毒」的概念,以及打着这个概念旗号,企图笼络人心的极简主义科技产品们。

2017 年,第一代 Light Phone 上市,只能打电话;2019 年,Light Phone 二代加入了短信、音乐播放器和闹钟。去年,乘上了「笨手机」春风的 Light Phone 三代终于发布,售价 699 美元。

海外媒体是这么评价 Light Phone 三代的:「极简主义被拉伸到令人沮丧的程度」,「一台越来越像智能机的傻瓜手机」。也不能怪他们:AMOLED 屏幕、摄像头、NFC 支付、指纹解锁……只看参数表的话,你很容易以为这就是一台智能机。

从开始到现在,Light Phone 已然进入了两难。如果卖点是「少」,就必须砍功能。但功能少了,用户反而不敢买单;把功能加回来,尺度很微妙。

除了产品设计之外,Light Phone 还面临商业模式的问题。

它最初是从众筹平台上起飞的,但公司随后不得不拿了风投的钱。谈投资的时候可能聊的是「数字排毒」的趋势,投后要看的却是销量、增长、财务……本质上,这套逻辑和极简主义/反消费主义「希望用户少用产品」的美好愿景是完全错位的。

结果就是为了卖货,这台「笨手机」高也不成低也不就,离它最初承诺的东西越来越远,却越来越像它本来要取代的东西……

消费主义的本质,是不断创造新的欲望来消化过剩的产能,而注意力经济是创造消费欲望的最有效手段之一。

哥大法学院的吴修铭教授认为,教授注意力经济也已有百年多的历史。从 19 世纪的廉价报纸 (penny press),到 20 世纪的广播电视,再到今天的短视频、小游戏、短剧,其实注意力经济从来没有变过:用免费内容交换人的时间,再把这些时间通过各种方式(广告、数据等)变现。

哈佛商学院荣休教授苏珊娜·祖博夫在《监控资本主义时代》一书中提出了一个新的概念:「行为剩余」(behavioral surplus),指的是科技公司从用户行为里提取数据,例如你点击了什么、在哪里停留了多久、在哪里犹豫了,然后把它们转化为「行为预测产品」,打包卖给广告商。

但为了让预测更准确,平台需要主动去「塑造」用户行为——无限算法流、消息红点、间歇性的点赞通知,都会服务这个目的。

前几年曾经有个社交产品 BeReal 爆火,每天随机弹出通知,用户必须在两分钟内打开应用拍照并分享,没时间准备,也不给修图滤镜,鼓励展现未修饰的日常样貌,消除社交产品的使用焦虑。

2024 年,以高频成瘾的垃圾手游闻名的法国公司 Voodoo,斥资 5 亿欧元收购了 BeReal。

一款以「反注意力收割」为卖点的产品,反倒被注意力收割机吞并了。这大概就是活成了自己的笑话、屠龙者终成恶龙、逻辑闭环了吧……

这些科技产品的设计理念,本质上和老虎机没什么区别。让人上瘾最有效的方式不是每次都给奖励,而是随机给。你不知道这次下拉会看到什么,正是这个不确定性让你停不下来。

互联网是通讯工具,是知识系统……它可以是很多东西。但大部分时候,它实际上是一台重新引导、无情收割一切注意力的机器。它侵蚀的不只是你的时间,是你的掌握自己注意力的自主性。

买一台「笨手机」,解决不了结构性问题

乔治城大学计算机教授卡尔·纽波特是「数字极简主义」这一概念最重要的推广者。2019 年他出版了《数字极简主义:在喧嚣世界中选择专注的生活》一书,认为电子邮件、聊天、短视频等等助长了「过度活跃的蜂群思维」(the hyperactive hive mind)。

纽波特认为,智能手机应该像一把瑞士军刀,大体上有通话、地图、相机、音乐这些核心功能就够了——这个愿望有点不切实际,他自己也清楚。

于是他转而提倡一种「非暴力」式的戒网方法:在你的手机上关闭非紧急通知,删除社交软件,手机调成单色模式,给自己设定一个数字宵禁的时间。从他的角度,把手机放在家里不带出门,已经是最极端的排毒行为了。

你可以看出来,纽波特的方案本来是零成本的。他从来没说过,你应该花数千块钱购置任何额外的设备。在他的方法论当中,甚至没有「数字排毒产品」这个品类的存在。

然而冥冥之中,提出了数字排毒概念的纽波特,反而成了另一群人,将之商品化的共谋:

  • 首先,有人带着真诚的初衷发现了一个真实问题,触碰到了更多人内心深处某种真实的渴望;
  • 接着,另一群人看到了营销机会,开始兜售一套你必须拥有的东西,来证明你属于这场运动。
  • 结果是,这群人接管、掌握、统治、最终定义了整个运动,直到它的信仰破灭。

类似的剧本一再上演。

1986 年,意大利的第一家麦当劳,在罗马的西班牙广场开业。作家 Carlo Petrini 召集了一群同事朋友去抗议,而这次抗议后来演化成了慢食运动 (Slow Food)。

这场运动的立场,既回归传统又标新立异:反对工业化快餐对饮食的侵蚀,在农民和消费者之间建立更直接的连接。

然而现如今,「农场到餐桌」(farm to table) 早已成了高端食品的标签,慢食运动最初所代表的理念,早已被消费主义完全消化,逐渐退化成了高档餐厅和有机超市溢价的理由。

十多年前,源自于佛教等宗教里的正念/灵修/内观,成为了社交网络上最 in 的潮流之一。然而当这种非主流爱好演变为潮流之后,也成了新的商业收割机。一群科技创业者趁势而上,开发出了市场规模高达数十亿美元的正念产业。

学者 Ronald Purser 在 2019 年出了一本书,书名就叫《麦正念》(McMindfulness,一个很有趣的双关),批评「正念」早已变成让打工人在高压环境里更好适应的减压技术。正念产业们忽略了真正的问题在于结构性的工作压力,却把责任塞还给了个人,让用户去管理自己的内心。

热潮过后,行业两大巨头 Headspace、Calm 的下载量纷纷暴跌(-74%、-61%)。

和「农场到餐桌」「正念」等概念一样,数字排毒也正经历概念破产的加速期。

数字排毒产品许诺的是:用一次性的消费行为,解决一个持续性的行为问题。但如果你看过各种电影电视剧里强制戒酒、戒毒之后的复饮、复吸情节,应该知道这种强硬限制的反效果有多强。

2025 年《BMC Medicine》刊登了一项为期三周的手机使用干预试验,要求上百名参与者每天使用时间不超过两小时。干预期间,测试组的平均屏幕时间从每天 285 分钟降至 129 分钟,压力和睡眠质量也同步改善。

然而 6 周后回访数据显示,他们的屏幕时间又反弹回了 226 分钟,心理健康睡眠指标也降回去了。又过了一周,反弹情况已经和测试的对照组基线水平无异。

强制、短期的「戒网」,是没有效果的。

为什么这种限制注定会失败?上世纪 60 年代,心理学家 Jack Brehm 提出「心理抗拒理论」:当一个人感知到自己的自由选择被外部力量限制时,他会产生强烈的动机来恢复这种自由。

约束越强硬,被禁止的行为就越有吸引力。这解释了为什么很多「笨手机」用户最终把那台手机放进了抽屉,然后换回了 iPhone 和安卓机。

数字排毒产品赖以存在的心理前提,可能本身就是错的。

用消费,反抗消费

回到文章开头提到的「离线包」案例。

如果你去刷相关话题的视频,会发现这些博主,各种书哐哐往家买,却没几个真的去博物馆借书的;这群人的视频里一定有个漂漂亮亮的手账本,里面到底记了啥你是不太可能看到的。

用户在博主们的影响下,花了成百上千块钱,买了各种各样的产品。然而,却形成了「意识到问题了」「在行动了」,就等于题被解决了的错觉。

这种行为其实很像中世纪西方大受欢迎的「赎罪券」。信徒不用改变自己的行为,甚至不需要告解和悔改,只需要支付金钱就能获得「罪已得赦」的心理确认。钱花出去,药到病除,非常方便。

⬆17 世纪的赎罪券(后世复刻)

这种现象在行为经济学上叫做「道德许可效应」。当人们完成了一件感觉道德的事情之后,更容易在其他方面放纵自己。比如购买 Patagonia 等环保品牌,很容易让你误以为自己真为地球环保做了多大贡献——其实从个体角度,你的不仅助长了消费主义,甚至制造了更多的垃圾。

我们为什么执迷于用消费行为来反抗消费主义,却以为自己还挺聪明?其实,这里面有人格方面的深层原因。

人是注意力动物。无论是手机,还是离线包里装的各种各样的东西,其存在目的都是牵制住人的注意力,帮我们杀掉时间。如果没有这些东西占据注意力,我们会变得极度无聊。

究其根本,在人人都有智能手机、人人都随时在线的时代,我们已经不知道一个人不刷手机该怎么呆着了。如果注意力充裕却没有地方可放,我们甚至会恐慌。所以我们需要一种「干扰」。

而这些数字排毒产品,其实是在利用你的不安全感,来赚你的钱。他们真的解决了什么痛点吗?恐怕没有。

不只是数字排毒产品,所有的消费陷阱,都是同一套底层逻辑。

如果你要用消费行为来反抗消费主义,恐怕只有资本最后成为赢家。

真正有用的方法,免费但无聊

2024 年,斯坦福大学社交媒体实验室让 80 多名学生用「笨手机」替代智能手机使用一周,初步发现受试者的头脑更清晰,更专注,更活在当下。

但进一步调研发现,主要归因并不是「笨手机」,而是那些报名参加了这项研究的学生,原本就有「数字排毒」的动机。

其实真正有效的方法是完全免费的,只是有点无聊。

豆瓣上有个「数字极简主义者」小组,有 3.3 万成员,我们分析总结了里面的很多帖子,发现最主流和有效的方法,就是少用、不用手机。

比如和家人约定晚饭时间不看手机,比如睡前把手机放到卧室,用真的闹钟来定闹铃;非要用的话,可以巧用,比如把社媒 App 移到手机的第三屏,增加「找到它」的摩擦成本;使用的时候大量点击与兴趣无关的内容,故意污染平台「千人千面」的推荐算法。

是的,实现数字排毒,不需要购买任何新的产品,你唯一需要支付的成本,不应该是金钱,而是心智。但你可以一点一点来,比如先从躺到床上就不再用手机开始。

究其根本,你要承受戒断反应,学会与无聊做朋友。

在注意力高度碎片化的今天,其实「无聊」是件很好的事。如果你能领悟无聊的意义,开始享受无聊,进而换种方式利用无聊的时间,「数字排毒」才能真正开始。

无论如何,都不要再买赎罪券了,那都是骗子发明出来骗傻子的。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

苹果瞒着你给 iPhone 打了个补丁,为什么?

今年 3 月的某一天,你的 iPhone 悄悄地自己更新了一次。

这次更新,既没弹出通知,也不会在系统更新菜单里体现,你甚至不需要点「同意」。要不是这篇文章,你或许压根不知道有过这么一次更新。

记忆里苹果过去没这么干过。考虑到「库克桌上的小按钮」这个都市传说,估计有人要怀疑,苹果莫非又在偷偷搞「计划报废」了?

放宽心,情况并没那么严重……这次推送的其实是个安全补丁,修复了可以让恶意网站绕过浏览器安全边界的 WebKit 漏洞。

但正如前面提到,这次更新没有走正常的系统更新流程,而是在联网的情况下,直接静默推送并安装了。当然,苹果也没有故意藏着掖着,官方网站上会有详细的日期和漏洞记录。

其实,这是是苹果的全新的安全推送机制「后台安全改进」Background Security Improvements,首次发挥作用。

过去十几年里,任何科技产品的安全更新,走的都是传统的流程:汇报/发现漏洞,开发补丁,打包进下一个系统版本,推送,等用户点同意下载、安装并重启。

这个逻辑,已经很多年没变过了,也没有任何改变的需要:If it ain’t broken, don’t fix it. 如果没有坏,为什么要改变?

但逻辑成立有一个前提:攻击方和防守方的速度大致对等。

现在的问题是,随着 AI 技术的进步,节奏开始变得越来越快:漏洞发现变快了,被滥用甚至大规模使用更快。留给科技公司给产品打补丁的窗口期越来越短。

科技公司们,也开始跟不上自己创立的新时代了。

2023 年,苹果曾经在 iOS 16 上做过一个「快速安全响应」的机制,能够静默完成安全升级。不过,该功能推出之后并没有没有有效利用,中间还有一次因为推送了错误的代码,导致一些网站无法正常显示,结果那次更新很快就撤回了,这个机制后来也没有再使用过。

但这次不一样了。今年,苹果从 iOS/iPadOS/macOS 26.1 版本开始启用「后台安全改进」政策,第一次实际投入使用,则是在 iOS 26.3 下的小版本上,也即开头提到的 WebKit 漏洞修补。

其原理大概如下:把 Safari、WebKit 等这些最容易被攻击的组件,给单独剥离出来,放进可以独立更新的加密磁盘镜像,从而绕开整个常规 OTA 流程。

「后台安全改进」的官方说明其实写的很简单,但通常字少事大。苹果的逻辑很明确:在今天这个时代,安全这件事不能等,必须加速。

时间再拨回本周:苹果加入了现如今最当红的 AI 巨头公司 Anthropic 发起的 Glasswing 计划,拿到了该公司最新,同时也是迄今为止最重磅的大模型 Mythos 的使用权。

这个模型能做很多事,但最擅长的能力之一,就是在那些每天数以亿万计用户使用的产品里,发现那些藏得最深但从未被此前任何方式发现的代码漏洞。

正式启用「后台安全改进」,和加入 Glasswing 计划,相隔不到一个月的这两件事放在一起,你应该能看出苹果有多看重安全了:

要知道,安全以及隐私是苹果最大的叙事主题,它必须尽最大努力去做好安全——哪怕是「瞒着用户」也要这么做。

从 Mythos 里面,苹果能得到什么?

Glasswing 计划的成员包括苹果、亚马逊、谷歌、微软、英伟达、思科、Palo Alto Networks、Linux 基金会等顶级公司和机构,另有 40 多个组织获得扩展访问权限,总计参与机构超过 50 家。

Mythos 是 Anthropic 目前最强的模型,所以你可以把 Glasswing 理解为 A 社拉了一个「内测群」……

这个模型没有公开发布,甚至连最顶级的付费用户(个人或企业)都暂时用不上。这在 AI 行业是非常罕见的,要知道放在任何其他公司,都会忍不住会把最新模型用最快速度推向市场,以获得更多的收入(为此甚至不惜给老模型降智、砍算力)。

A 社决定不第一时间全量开放 Mythos,提供的官方理由是:他们判断这个模型的能力可能越过了某条红线。

根据 Mythos 模型卡提供的信息,A 社并没有专门训练它去做安全用途,而是因为代码能力实在太强,进而导致 Mythos 涌现出了强大的攻防能力。

专门负责找破绽的 A 社红队,主动诱导 Mythos 从隔离的测试沙盒里「逃脱」,结果它还真发现了沙盒有一条设置错误的规则(并非人为设计,是真的疏忽),于是顺着这条路获取了特权,突破出站过滤,然后给研究员发了一封邮件,告知任务完成。

除了一开始的诱导提示词之外,没有人提供实质性的指导,模型自己完成了整个侦察、渗透、出逃的行为链。

A 社在报告里专门说明,这仅仅证明了 Mythos 大模型的能力超出预期,并不意味着它具备了某种自主意志(不论善良中立抑或邪恶)。

但与此同时,Mythos 会拒绝 96.7% 的明确恶意请求,以及 93% 不到的攻防双重用途请求——这仍然意味着,在 3-7% 不等的情况下,恶意请求可能会被执行。

而考虑到 Claude 月均 25 亿 API 调用,换算日均约 8.3 亿次调用——个位数百分点的比例,仍然可以换算为每天可能会有海量的恶意请求会被放过去、执行。哪怕只有一条成功了,都有可能造成糟糕的后果。

模型能力之强,已经真实地引发了它的创造者,以及整个科技世界的担忧。

于是,A 社提出了 Glasswing 这个「内测计划」:与其把 Mythos 锁进保险柜,不如让潜在暴露风险最高的巨头公司和机构们先拿到它,扫描自己产品里的漏洞,在更大范围扩散之前把洞堵上。

为此计划,A 社将会投入 1 亿美元的使用额度(本质上就是给内测伙伴提供 API 额度补贴),另外捐出 400 万美元给开源安全组织。

苹果拿到这个访问权限,扫描的对象是 iPhone 和 Mac,是 iOS、macOS、Safari——每天数以十亿计用户在使用的产品和操作系统。

苹果为什么看重 Mythos?它自己的安全团队不够格吗?当然绝非如此。

问题在于:

  • 一个典型的安全研究员,对于系统安全有深刻的理解,但他可能不像 iOS/Unix/内核的工程师那样,对于专精的技术栈、某种具体的编程语言,有足够深的理解;
  • 反之亦然,一个专精于 iOS/Unix/内核的工程师,能用自己的技术栈和熟练语言写出合格的代码,但仍然难免留下漏洞。
  • 更别提今后的工程师遇到 bug,甚至都不用 Stack Overflow了,直接 Claude Code 就行,能力的全面性大不如前。

正如前面提到,Mythos 的攻防能力,来自于强大的代码能力。代码也强,攻防也强,相当于既是专业的 iOS 开发者,也是顶级的安全研究员。

两手一起抓,两手都很硬:这才是苹果真正看重的东西。

窗口正在关闭

Mythos 的战绩可查:在每一个主流操作系统,和每一个主流浏览器里,它都已经发现了此前未知的高危漏洞,总数达到数千个。其中超过 99% 在报告发布时仍未修复,正在走协调披露的流程。

这其中就有 OpenBSD。作为开源世界里公认安全标准最高的操作系统之一,OpenBSD 是很多防火墙和关键基础设施的底层系统,其代码库长期处于全球安全研究员的持续审计之下。

但是,Mythos 轻而易举地在其 TCP 协议里发现一个整数溢出漏洞,存在了长达 27 年之久但此前从未被发现,所花费的算力成本不足 50 美元。

OpenBSD 可能离你太远,FFmpeg 应该足够近了,它是几乎所有视频播放 App 的底层基础,每一个带有视频播放功能的应用,包括你正在看这篇文章用的微信或者浏览器,都内嵌了 FFmpeg 或其衍生技术。

Mythos 在 FFmpeg 的 H.264 解码器里找到了一个存在超过 16 年的 bug。自动化测试工具此前已对该代码路径运行了上百万次检查,也是从没发现问题的存在。

你的苹果设备浏览器多少都会利用 WebKit,你的路由器同样可能依赖某个 BSD 变种运行,短视频产品更是无处不在……这些软件、技术,存在于我们每天都在使用的手机、电脑等各种设备当中。

每台设备,每个人都会成为攻击对象,这绝对不是危言耸听了。安全这件事,现如今真的和每个人相关,而且关系从未如此紧密。

漏洞本身不是新鲜事。每年被登记在册的 CVE 漏洞编号数以万计。安全行业的人对这件事,早已形成了习以为常的应对节奏。

这套节奏建立在一个前提上:攻击者需要时间。发现一个漏洞,理解它的成因,写出可以稳定复现的利用代码,这个过程在以前需要数周到数月,高度依赖顶级安全研究员的经验积累。

防守方也慢,但大家都慢,所以系统能维持一种缓慢的均衡:根据 Verizon 的《数据泄露调查报告》,去年各种已知漏洞修复时间的中位值是一个月。

一个月,成了多年以来行业默认接受的风险敞口。然而,强有力的大模型今天已经将防守方的时间窗口压缩到以小时计:

以 Mythos 对 Linux 系统的漏洞利用为例,从自主完成侦察、漏洞分析、构建代码,完成 Linux 内核的提权——整个过程用时只用了半天左右,算力成本仅用了 2000 美元。

换成人类安全研究员,却要花至少一个人月(真实场景下可能需要多人)的薪资成本,才能完成这个修复。

但现在,我们没有时间了。

苹果的两步棋

现在你应该明白,苹果为什么要绕过你直接打补丁了。

正如前面提到,传统的 OTA 周期天然存在延迟。内外部人员发现漏洞,苹果开始开发修复代码,把它打包进一个完整的系统更新,走测试、审核、推送流程,最后等用户在某个方便的时刻点击安装——整个周期通常需要几周时间。

以前合理的东西,现在不合理了。苹果可能早在 2023 年就已经意识到了这一点。今年正式上线的「后台安全改进」,是苹果的最直接回应。

而成为 Glasswing 计划的核心合作伙伴,更是苹果在 AI 时代,提前布局安全的工作体现。「后台安全改进」让推送补丁的周期变短,用上大语言模型,解决的则是推送修复的前置工作——发现漏洞和生成补丁。

AI 的新时代,带来了新的威胁。整个安全响应链条,从发现到修复到推送,每一个环节都需要提速。

好在,大模型本身也可以被看作一种「平权」,只要能够支付得起 token 费用,无论巨头公司还是中小企业,甚至个人开发者,都能够借助其力量来让自己的产品变得更安全。

更何况模型的商品化趋势极为显著。或许在不久的将来,取得同样效果,只需要几十甚至上百分之一的成本(Mythos 费用是 $25/$125 每百万 token)。

然而,道高一尺,魔高一丈。只要有新的技术出现,就会出现新的攻击面。安全的猫鼠游戏从来没有真的结局,魔与道的交手永不停歇。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Floatboat 体验:一个人的公司,只需要一个办公软件

过去两年,我们每天都在做同一件事:学习和进修「提示词工程」这门玄学。

找 AI 干活,总要像个碎碎念的甲方一样,交代八百字背景,像是在哄一个智商奇高、但每天都会间歇性失忆的实习生。

这让我想起在游戏里,施展出必杀技之前,总是会有一个类似「前摇」或者「吟唱」的过程。某种程度上,写提示词,提供上下文,上传各种文件等等……就是使用 AI 的「前摇」。

不是说用户每次都要做到极致,只是如果你能给足这些前置条件的话,AI 会做的更好。

不过,前段时间 APPSO 在中关村的一场线下聚会看到了一个还在测试中的 AI 办公产品——它很大程度上摒弃了对「前摇」的依赖。

产品名字叫 Floatboat。

Floatboat 的联合创始人兼 CEO 少卿走到台上,打开 Floatboat,选中一个文件夹,里有一个 CSV 表格,是一份参加本次活动的嘉宾名单。他在旁边的 AI 对话框里说了一句:生成邀请函。

过了一会,每位嘉宾的邀请函都出现了。

到这里为止都还好,把表格丢给 ChatGPT、Claude、WorkBuddy、悟空………任何一个今天的 AI,写一句指令,大概率也能做到差不多的事情——但接下来发生的,让我愣了一下。

有一位新嘉宾确认出席了,少卿说,「在表里更新一下」。

CSV 更新了;紧接着,一封新的邀请函也自动生成了。

我坐在那里花了两秒钟,试图理解刚刚发生了什么:

Floatboat 它知道这份表格和邀请函之间,知道「更新表格」和「生成邀请函」两个动作之间,是有关系的。所以少卿只说了前半句,后半句没说出来,它自己悟出来了。

AI 不再是等待指令的工具,变得越来越积极、主动,会动脑子,像一个一直给你打下手的小朋友,你说「更新一下」,他知道你的意思。

这个瞬间让我开始认真看这个产品。

简单,但又无法简单定义的产品

Floatboat 是什么?我试着给它一个定义,发现很困难。

它有一个长得像 macOS Finder 的文件管理器,你可以浏览本地文件、打开 iCloud Drive;文件格式支持得很全,Markdown、CSV、Excel、Word、图片、视频,都能直接预览,甚至编辑;

它有一个内置浏览器,可以打开任何网页,甚至可以让 Agent 去操作这些网页;

它有一个 AI 对话界面,底层可以接 Gemini 或其他模型。这么看来它有点像 Claude 的桌面端,但又比 Cowork 多一些更直观的操作逻辑。

这三个东西,文件、浏览器、对话,以面板的形式并排在一起,可以随意拖拽组合,最多四栏并排。

你在浏览器里看到一张有用的图,可以直接拖到本地文件夹里保存;你让 AI 生成了一份报告,报告会直接写入本地文件,以 .md 或 .docx 格式保存,并且你可以直接编辑这些文件,不需要 cmd-c 再 cmd-v 到另一个地方。

信息从各个方向流进这个环境里,加工过的内容也能流出去,不会被锁死在某一个面板里。

所以 Floatboat 到底是什么?是文件管理器?是浏览器?是 AI 聊天工具?是氛围编程环境?

它都是,又不完全是。

在 Floatboat 出现之前,我们其实一直在做不同软件之间的「人肉 API」,每天按几百次复制粘贴,打开不同的软件或浏览器窗口、编辑不同的文件。

在 AI 世代在线办公的我们,成了在窗口与窗口之间疲于奔命的赛博搬运工。

而 Floatboat 打破了软件之间的墙,让所有的窗口都能共享同一份上下文。

开发团队给产品的定义是「工作环境」而非「AI 助手」。助手是你要求它才动的,工作环境是一直在那里的,你在里面做事,它一边帮你做事一边观察和学习。

在沟通会上,有人问少卿:一句话形容你们的产品?

少卿反问:你能一句话形容 ChatGPT 吗?

大家会心一笑。我觉得他说的有道理。有些东西确实不是一句话能装下的,除非你做的是一个非常垂直的工具。Floatboat 显然不打算做垂直。

做科技记者这些年,我经历过好几代这样的产品。最早是电子邮件加 Office 套件的时代,后来是各种 OA 系统,再后来钉钉来了、飞书来了、Slack 来了。

每一代都有一个产品,或者一类产品,它们有着同一句潜台词,对你发出强有力的暗示或者明示:上班,用我就够了。

而在 AI 时代,Floatboat 想要成为这个角色。

这么说不是在拔高它。恰恰相反,这个位置历史上从来没有人真正坐稳过。飞书解决了团队协同,但文档操作仍然需要 Office 套件。钉钉把审批这个工作做到了极致,但打工人私下用微信聊工作的习惯从来没变过。

「一统江湖」这件事,每一代都有产品在尝试,但从来没人真的实现过。

原因是结构性的:这类产品想要成功,需要整个组织一起换过来。而组织的惯性,是所有惯性里面最大的。你一个人觉得飞书好没用,你的团队、你的客户、你的供应商都得觉得好才行。

Floatboat 的策略有一个不同:它不面向组织,它面向个人。

这个产品的目标人群,也正是时下最流行的概念:OPC,全称 One Person Company/一人公司。

过去一年 AI 能力的跃进,让 OPC 这个前两年的口号,逐渐变得越来越现实和可行。一个人,加上三五个 agent, 几乎可以对等一个小的草创阶段的业务和支持团队。无论是自媒体内容创作者,从选题到写稿到排版到分发,还是电商业务,从选品到上架到客服到投流,都已经够用了。

Floatboat 希望能够打动这群人。在 APPSO 的体验中,我们测试了包括内容创作、数据科学等场景,也测试了外部工具接入(例如 Slackbot)等多种场景。对于内容、营销、数据分析、客服等类型的工作,Floatboat 都达到了我们的期待。

现在 AI 产品有两种设计哲学。一种是「你放手,我来」,把用户推到后座上去,Agent 全权接管,跑完了给你看结果。另一种是「你干活,我在旁边」,成为用户的副驾,在适当的时候递工具、提建议。

Floatboat 更接近后者,但又不全是。用 Floatboat 工作,我的体验是:跟 AI 在主驾副驾之间来回切换,畅快自如。

用了一段时间之后,我觉得 Floatboat 的主张是行得通的。至少在现在这个阶段,大多数人对 AI 的信任还没到「你尽管干,我不用看」的程度。你让一个打工人把整份方案交给 AI 自己跑,他会焦虑的睡不着觉……

但如果 AI 是在他的屏幕上、在他的文件夹旁边干活,他看得见过程,能随时纠正,那他会比较安心。

这也是为什么 Floatboat 的界面设计那么像一台传统电脑的桌面,把文件管理器、对话框、浏览器/编辑器都拉出来让你一览无遗:已经认识的东西,能够降低用户对一个新事物的戒备心,提高接受度。

一边工作、一边蒸馏工作

然后再说 Floatboat 做的一个叫 Combo 的功能。

Combo 可以是一个复杂的 skill,也可以是多个 skill 的组合。而在工作的逻辑里,就是把一套工作流打包成一个可复用的操作。

Floatboat 内置了从工作成果中「蒸馏」 combo 的能力——这其实很像 Anthropic 官方的 skill-creator(本身也是一个 skill)。

比如你每周都要做一件事:从网上抓几篇行业报告,提炼摘要,整理成 Markdown 文档,然后推送到 Notion。你第一次在 Floatboat 里手动跟 Agent 对话完成了这套流程之后,对话框下方会出现一个按钮,问你要不要把这轮操作存成一个 Combo。

或者你也可以主动跟 Floatboat 说,「把我们目前的工作里面的方式、思考、逻辑,整理为一个 skill」。

当下次遇到类似任务的时候,Floatboat 会自动把这个 Combo 推荐给你,一键启动。

这里面我觉得最有意思的一点是:你不需要事先「设计」工作流,只需要正常干活就行了。一边干着,一边 Floatboat 就会自己把你的工作习惯、操作方法等「蒸馏」出来,沉淀出一份指导思想。

少卿告诉 APPSO,Combo 能力的设计,是为了实现今天的绝大部分用户对于 agent 产品的那个核心期待:自进化。

「当 agent 能够感知你 80% 的操作的时候,它就有自进化的能力了」,Combo 的自动沉淀机制就是在做这件事的第一步。

兜售「提示词」的时代,快要结束了。你不再需要像个魔法师一样去背诵枯燥的咒语,把提示词保存在一个专门的文件夹或者 AI 工具的后台。通过 Combo,Floatboat 可以让用户把他们每天最经常做的固定动作,提炼成独属于自己的「手艺」和数字资产。

当然,Floatboat 也做了一个 Combo 市场,你做的好用的 Combo 可以上传,别人做的也可以下载。官方也提供了一些现成的。

但这个 Combo 体系仍有不足。

任何一个号称能够一统江湖的办公软件,号称「越用越懂你」的 AI 系统,都仍然存在冷启动的障碍:就好比 Google Docs 的初始简历模板虽然很全很好,但仍然需要每一个求职者去调整修改以适合自己。

Combo 的自动沉淀机制,逻辑上是说得通的:你用得越多,它学得越好,推荐的工作流越贴合你。但这有一个前提:你需要先投入时间从零教它,而大多数人没有这个耐心,他们希望拿来就能用。

作为一位媒体编辑,我的日常工作是阅读大量资料、跟作者沟通选题、改稿子、偶尔自己写长文。这些工作的颗粒度很细,上下文很碎,跟官方预设的那些模板(更偏向标准化的报告生成、数据整理之类)对不上。

在我的具体使用中,我将几种不同的内容生产路径保存成了不同的 Combo:针对外部新闻的快速反应是一种,基于采访 Q&A 提纲的撰写是一种,针对复杂课题的调研、资料的编排、然后进行原创写作,又是另一种。

当然,这不是 Combo 本身的问题。对于绝大多数人,无论他们的工作是文档写作、报表处理、ppt 写作,还是数据整理、行政工作,甚至更加复杂的「一人开发者+marketer+客服」,无论是自己生产 Combo,还是在 Floatboat 的官方 combo 基础上做微调,都足够好用。

AI 工具不是一切工作的万灵药——一个工具把自己宣传得再美好,今天的用户也应该有这样的觉悟。对于 Floatboat,正如前面所说的,它是「工作环境」,它的能力足以强化人,但它的工作效果仍然取决于人。

然后再说说用 Floatboat 和其他「类 Cowork」产品的区别:最大的明显感受,是 Floatboat 的工作流程很快。以文件操作、内容生成为例,在 Gemini 3.1 Pro 模型驱动下的 Floatboat,对文件进行操作(批量重命名/修改格式、填充 markdown 等)的用时,是我平时用 Cowork/Claude Code CLI 的三分之一左右。

Gemini 在「讨好用户」上也是老演员了,所以最近 Floatboat 也加入了 Claude 两个最新版模型,Sonnet 和 Opus 4.6 的支持。

Gemini 对于 Floatboat 主打的大多数办公场景(文案生成、表格处理、信息整理)来说够用,写作效果也还算不错;如果不符合你偏好的话,切到 Claude 模型也没问题。如果你注意到 Floatboat 的迎合意图太强,可以在工作过程中时不时强调一下,不要一味迎合,要对生成的结果,甚至用户的输入做批判性的思考。

以及,你也可以充分利用 Combo 生成的功能,将这些技巧写进 Floatboat 的核心指导思想。

另外一个小设计值得提一句:Floatboat 可以集成到飞书和 Telegram 里,你不打开它的客户端,直接在聊天工具里给它发消息,它就在后台帮你执行任务——这个功能叫 Claw 模式,相信足够你顾名思义了。

 

除了产品本身,Floatboat 团队还在做一件更远的事。

他们开源了一个协议叫 Selfware,核心理念用一句话说就是:A file is an app。

这是什么意思?现在你用 AI 辛辛苦苦做了一份调研报告,发给同事,他收到的是一个 Word 文档或者 .md 文件。文件里有最终结果,但你当时调用了哪些资料、AI 跑了什么逻辑、中间修改了几次、为什么改,这些对于工作最关键的经验,并没有被保存下来。

Selfware 想解决的就是这件事。一个 .self 格式的文件,里面不只有数据,还携带逻辑和结构。你的同事收到之后,可以直接打开、继续编辑、让 Agent 沿着你的思路往下跑。文件自带了工作环境。

这个想法,和目前 AI 开发圈里对 CLAUDE/SKILL.md、cursor rules 这类文件的热情, 属于同一个潮流。大家都在发现,文本文件可以用来「编程」AI 的行为,一个 .md 文件可以定义一个 Agent 的人格、工作方式、输出风格。

但 Selfware 往前又多走了一步:那些 .md 文件是指令,你告诉 Agent 怎么做;Selfware 想做执行单元,文件本身就能运行,而且不依赖于特定平台。

这其实有点像 Jupyter Notebook,把代码、数据、输出打包在一起了;也类似于 Docker,把运行环境做成了可分发的单元——Selfware 把场景换成了 Agent 协作。它不是从零发明的概念,但在 Agent 时代重新提出,确实切中了一个真实的痛点。

不过,协议这种东西,最终看的是采用率。现在 Selfware 主要在 Floatboat 自己的生态里运转。「A file is an app」是个有趣的理念,但从理念到被广泛采用的标准,中间路还很远。

另外值得提一句的是 IACT (Inline Action-Clicked Text),Floatboat 开源的另一个协议。它做的事情更小但很实际:在 Markdown 语法的基础上,直接在 AI 对话生成结果加上可点击的行内 (in-line) 链接/按钮。生成结果中的「可行动内容」将会自动套上这个按钮,用户直接点击就行了。

这个交互改进看着不起眼,用起来确实减少了摩擦。最早做类似体验的应该是 Claude,但 Claude 的很多「好东西」都是闭源的。Floatboat 把 IACT 开源,让其它产品也可以充分利用。

现在一些同类产品比如 WorkBuddy 也在做类似的东西了,但据我了解 Floatboat 是最先提出这个概念并把它协议化的。

工作起来,开心最重要

Floatboat 的名字来自一句英语俗语,whatever floats your boat,大概的意思是「你开心就好」。

少卿说,他们希望产品给人一种在 AI 时代悬浮起来的感觉,不被裹挟着走。

这个愿景挺好的。但 Floatboat 能不能成为这个时代的那个「用我就够了」的产品?老实讲,APPSO 仍然没法给出一个明确的判断。

毕竟大家都看到了:每一代尝试做这件事的办公产品,到了最后,多半成为了工具箱里的工具之一,而非唯一。

但今天下判断,也为时尚早。

一个产品不需要统一所有人的工作方式才算成功。如果它能让一部分人——那些一个人干五个人的活、每天在软件之间当搬运工的「OPC」们,每天省出一个小时来做真正需要动脑子的事,那它就已经值得存在了。

对大多数普通人来说,一家公司的活如果全都一个人干,确实挺累的。

但 Floatboat 让人兴奋的地方在于,它给了一个人也可以是一家公司的从容和底气。

不是所有人都能 OPC,你至少首先需要台好「PC」。而 Floatboat 赌的,就是自己会成为那台 PC。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

专访 vivo 总裁胡柏山:AI 已经很聪明了,vivo 要让它真正看懂世界

今年春节,OpenClaw 火了。短短两个月不到,它又冷下去了——又一场 AI 应用层面的热闹。

热闹散了,没人知道下一个 OpenClaw 是谁,也没人知道这些东西究竟在解决什么问题。

用影像旗舰手机拍下一张夜景当中的人脸,细节清晰到能看见眼眶里的水光。但手机可能并不清楚,主角刚才是否哭泣,也就无法理解这张佳作的情绪背景;再用长焦技能把数百米外的一个路人拉到面前,细节纤毫毕现。但你问手机:这个人是着急赶路,还是在找什么东西?手机仍然不知道。

今天的 agent 能写代码、能操控网页、能把一份 PDF 整理成会议纪要。这些它都做得不错。但这些事情有一个共同点:处理的全是人类已经事先转好格式的信息。文件、数据库、网页,都是数字化过的世界。一旦面对物理世界,一扇门、一段动作、一个表情,它们是失明的。

从今天的大模型,到能真正读懂物理世界的所谓「具身智能」,中间有一道鸿沟,现在没有人说得清楚怎么填。

这道鸿沟,是胡柏山在博鳌亚洲论坛上花了最多时间讲的一件事。

胡柏山是 vivo 总裁兼首席运营官。在博鳌亚洲论坛,他告诉爱范儿,自己有一个很直接的判断:「在明确的物理大模型没有出来之前,要有好的体验,就要把物理世界的信息转化到数字世界。」

他相信,这件事,不仅手机可以做,而且应该用手机去做。甚至在未来十年里,其它设备都很难替代。

拼大脑,没有护城河

过去两年,几乎所有手机厂商都在说「AI 手机」。大模型接入、智能助手升级、端侧算力提升,这些能力以肉眼可见的速度在普及。

去年 DeepSeek 横空出世,今年 OpenClaw 引爆讨论,各家都在抢着把最新的模型能力塞进自己的产品。

这场军备竞赛,有一个必然的结局:大模型的高度商品化、同质化、可替代化。

拼模型能力,没有护城河。

你比友商快三个月上线某大模型,以及大模型驱动的 agent 功能;友商六个月后跟上,用的模型和 agent 能力都比你更强。时间上的领先、花费的金钱和精力,卷出的工时和损耗的员工健康,价值又是什么?

于是,真正的差异化只能在别处找。

vivo 给出的答案是「感知」。

感知,是 vivo 刚刚成立的新技术赛道。

中外互联网公司和手机品牌纷纷加速进军「AI 手机」。行业一度以为模型能力会成为手机厂商的护城河。

在胡柏山看来,实际并非如此。「相比模型而言,积累下来的场景数据才最有差异化。」紧接着他补了一句:「当然,该做还是要做,要做就找适合我们的,可以做慢一点,晚一点也 ok。」

当被问及「如果不看好大语言模型,vivo 会否发力世界模型」时,他的回答更加保守却又直接:「世界模型也很大。我们还是找适合我们的技术路径。我们先把手机模型搞好,小模型搞好。」

当今 AI / 互联网科技巨头大打人才争夺战,顶级研究精英如 NBA 巨星般抢手,转会费一再突破新高。但胡柏山并不认为 vivo 应该为这团火再添柴。他告诉爱范儿,先想清楚思路,看清方向,定好技术平台,再发力,完全不迟。

在这个所有人都在比拼模型能力和 AI 人才储备的时间点上,掌门人直接把 vivo 的优劣势与行动纲领展开在媒体面前。这种坦诚令人印象深刻:vivo 的稳健、谨慎, 究竟有何用意?

胡柏山回应称,vivo 从不回避竞争。相比模型、算力,未来最大的差异化是来自于场景数据。

场景数据,是跟着使用行为逐渐积累的,不能批发,不能抄近路——影像数据尤其如此。经过十年光学硬件积累、用真实场景训练出来的感知判断,没有捷径。

而这些积累与判断,构成了 vivo 接下来押注的「感知」的底层。这些东西,其他人(无论友商还是互联网/AI 公司)想要,也只能自己去积累。

这就回到了刚才那道鸿沟。大模型的训练数据是互联网信息,而这些信息已经被数字化。但现实世界里大多数有价值的信息,还没被数字化。那些无法或很难被转化,或者转化起来成本极高的数据,成为了 AI 走向现实世界的障碍。

光线、空间、人脸、动作、情绪,这些东西存在于物理世界,需要被感知、被转化,才能成为模型可以处理的输入。谁的感知做得好,谁就控制了大模型进入现实世界的那扇门。

现在,没有人知道这扇门后面是什么,也没有人知道最后会是谁站在那里。

押注「感知」

感知不只是「更好的相机」,这一点 vivo 很清楚。

胡柏山说,相机是记录工具,它等你按下快门。但感知是另一件事:持续观察、理解正在发生什么,把这些信息转化成设备可以直接使用的输入。7×24 小时,不需要你触发。

从「记录」到「感知」,中间隔着一个系统架构的重建。

胡柏山给这件事起了个名字:「感知一体」。字面意思,是感知到的信息和设备的决策系统要即时打通。这一点,现在还做不到。

难点在于,原始的感知场景数据,比如一段视频、一张图、麦克风收到的声音,体量巨大,格式混乱,里面大部分是噪声。把这些原始信号转化成手机真正「读得懂」的结构化信息,需要一整套专门的处理链路。

「怎么把场景数据转换成手机能够读懂的数据,是最难的。这个领域开源资源少,需要自主探索,」他说。

这也是为什么 vivo 在内部把感知设为一级技术赛道。

「一级」意味着感知不再是影像部门下面的一个子方向,它会统揽包括视、听、嗅、触等多种感官种类,和感知方向。

不过,vivo 的感知研究与研发工作仍处在初期阶段。胡柏山用 vivo 的通信研究院做了一个类比:大约 200 人的团队,从 4G 开始持续投入,走过 5G,现在在做 6G,已经十几年了。

对于感知赛道,他的预期是相似的节奏:小团队作战,先构建认知。认知清晰了,开始加油门;等待软硬件生态成熟了后,油门再往下踩。「有一种渐进式加速、螺旋上升的感觉。我们拒绝一脚油门一脚刹车。」

胡柏山不希望 vivo 做感知计算,以及做任何事情,出现拍脑门、砸大钱的做法。他认为,感知是一个天花板很高,但今天没人能说清楚正确的技术演进路线是什么的东西。「我们准备好用五年、十年的周期来持续投入。但我们对这件事的认知获取,要循序渐进。认知没到,砸钱都是烂尾工程。」

感知赛道是一个判断,但判断要落地,需要现成的积累。

vivo 的底牌是十年影像。具体看,这十年沉淀的东西有两层。 

第一层是硬件。与蔡司的合作,如今已经走到了联合研发的深水阶段,传感器尺寸这一轮 X300 Ultra 的主摄升到了 1/1.12 英寸,和索尼的合作在往提升半导体转化效率的方向走——他提到了感官技术方面的「雪崩效应」,一种可以把感光元件的进光转化率,从 90% 推到 110% 以上甚至更高的新技术路径。

在硬件层面,胡柏山的判断和行业观察者及媒体大致相同,传感器尺寸已经卷到了边际收益递减的阶段,接下来更大的空间在转化效率和外挂形态——在 X300 Ultra 上,vivo 已经做了 200mm、400mm 定焦增距镜,还有更多在路上。

第二层是算法和认知。

vivo 三年前提出长焦大底,两年后全行业跟上。但跟上硬件很容易,「为什么是那个时间点做这件事」,这个判断很难。vivo 为什么选择在那个时间点上做这件事,动机来自于在影像上多年领跑的经验所形成的认知——没有可以搬运和复制的捷径。

「算法跟认知强相关——认知知道要什么方向,算法匹配,这是需求和技术的有机结合,对手很难快速跟上。」

这个逻辑延伸到端侧 AI 上同样成立。在 X300 Ultra 上,vivo 首次提出了一种「多 agent」理念,也即:

你举起手机拍一张照片,有个 agent 在判断你在拍什么、用多远的焦段、在什么光线下——这个判断,以前需要用户自己去做。而另一个 agent 在整理你的相册,根据你过去的修图习惯推荐或自动添加滤镜,又或者它能自动把几段素材剪成一条可以直接发的短视频。

这不是那种统一的「超级 agent」,比如 Gemini 或豆包手机助手那样的,而是每个场景一个专项 agent,既互通有无,又各干各的。

胡柏山的理由很实际:现有的硬件算力撑不起一个什么都管的大 agent,手机AI的发展要结合硬件的能力上限来推进。

这些工作仰仗 vivo 在端侧 AI 推理上的持续投入。据爱范儿了解,vivo 是手机厂商当中目前在算力购买上花钱最多的——不仅是云端算力,接下来的押注方向,是在旗舰机上嵌入专用的算力芯片。

vivo 的节奏是:先把不要求实时响应的 agent 做好,影像和相册是当前优先级;全域感知是五到十年的目标,always-on、全时段在线、所有感官打通,这是最终的方向。

一切交给时间

今后十年的 vivo,会去往什么方向?

胡柏山给了一个大概的路线图:手机是现在用户的核心产品,往后至少 10 年也仍然不变;MR 需要三到四年;机器人是五年以上。

这三个方向不是各自独立的押注,底层是同一套感知能力在不同形态上的延伸。

vivo 去年成立了机器人 Lab,聚焦「大脑和眼睛」。当被问及目前进展如何,胡柏山很直接地摊牌:「2025年把阶段性目标梳理地更加清楚,2026年进入整个路径的清晰规划。」

但这对于 vivo 来说并不是问题。

在一个各家都在发布机器人样机、争相宣称「具身智能元年」的节点,承认自己还没手搓出实物,是一种不多见的坦诚。胡柏山说「手搓一个机器人不是我们要干的。」

vivo 的机器人逻辑,和感知赛道的投入逻辑是一套:先想清楚目标用户是谁,再定义场景,再识别核心技术控制点,再等技术成熟度到位。

胡柏山告诉爱范儿,目前 vivo 还在论证第一步。他们倾向于服务年轻人,这也正是 vivo 从旗舰到年轻系列产品线一直希望抢占心智的群体。vivo 的第一代家庭机器人,可能的起点,是照顾宠物和叠衣服也说不定。

但这个场景,会不会太小?胡柏山认为,不能一上来就做通用机器人,不可能刚一开始就把所有的场景都做好。如果你非要那么做,最终的结果也只能是每个场景都不及格。

诚然,今天的具身智能机器人,可能做预录制的舞蹈能做到一百分,其他场景都没有足够的说服力。特别是在家务场景,「就说打鸡蛋这件事,想要做到百分百成功率,人都不一定,机器人十年内也做不到。」

胡柏山希望,vivo 的机器人能够先把一件具体的事情做到 60-70 分,然后一代一代泛化,优化现有的场景,再获得新的能力。

喂好了宠物,场景数据就来了。场景数据够了,机器人就知道这只狗每天几点饿,进而知道这家人几点起床,进而知道这家人的生活节律。不需要一步到位,因为每一步都在为下一步备料。胡柏山管这叫「沿途下蛋」。

这个逻辑,和在手机端押注感知的逻辑,是统一的:先把影像 agent 做好,场景数据够了,感知能力才往外延伸。

但在机器人的旁边,手机扮演什么角色?「手机是最懂你的随身数字助理。你的行为习惯、偏好、你喜欢养什么宠物,都在手机里。」胡柏山说,机器人早期做不好的事,手机可以遥控介入补足。

就像自动驾驶的早期,人类一直在干预,干预产生数据,数据让系统越来越好。「手机和机器人之间,场景数据是打通的。」

当然,他也没有把话说满。感知这个赛道,其他人也在做。包括苹果、谷歌等在内都有自己的感知计算框架。vivo 在这个方向上的竞争空间,更多在手机端的小模型感知这个细分方向。这是除了苹果以外的大厂,暂时没有重点关注的地方。

今年,胡柏山给机器人 Lab 设的任务,是把路径图画出来:目标用户、核心场景、关键技术节点、以及「技术成熟到可以商业化」的时间预期。

vivo 叫停了 AI 眼镜项目。他算了一笔账:一年几十万台,不符合目标体量;两年内又做不出差异化;技术平台目前也撑不起 80 分以上的体验(超过 30g 戴在鼻子上会很累)——三个条件一个都没过,砍掉没毛病。

「三年后做也不着急,它不是关键品类。」

不过,这个决定放在今天的背景下,还是有点逆势。2025 年 AI 眼镜是行业里最热的新品类之一,这个事实有目共睹。Ray-Ban Meta 卖爆,国内跟进者一茬接一茬。

创始人兼 CEO 沈炜在年会上表示,vivo 今年的策略是「少押注,押重注」。vivo 选择给 AI 眼镜按下暂停键,但将感知赛道的存在地位升级,其实是统一的逻辑和筛选标准的一体两面:一个赛道的天花板够不够高、vivo 自身的差异化属性够不够、技术平台能不能支撑长期投入。

这种思路,与近期 OpenAI 等在内的硅谷巨头,摒弃「支线任务」,聚焦真正长板的思路不谋而合。

2026 年选定的道路,vivo 会走到哪,现在胡柏山也还给不出答案。感知一体化的技术难题还没有解,端侧专用芯片的落地有难度,机器人的路径图今年才刚开始画。

胡柏山知道这些,也没有回避。他说,认知到了加油门,认知没到宁可慢。

手机行业正在经历一个奇怪的时刻:换机周期拉长到四十个月,中国市场年销量从高峰期的五亿多部跌到现在约 2.5 亿部,存量市场的天花板清晰可见;但 AI 带来的能力跃升,又让所有人觉得什么地方似乎还藏着一点增量。

胡柏山的判断是,从 Smartphone(智能手机)到 Agent Phone(智能体手机),才是把存量市场变成增量市场的机会。而感知,是这个机会里他认为最难被复制的护城河。 

接下来交给时间。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌