普通视图

发现新文章,点击刷新页面。
昨天以前首页

假如应用也可以像朋友圈一样传播?

作者 杜晨
2026年4月20日 10:15

在一座山村学校里,老师想给孩子演示光的折射原理。

但翻遍整个学校都找不到合适的教具。于是,老师打开「灵光」,对着手机说了一句话来描述想要的东西:

「我想做一个光路模拟工具,要符合物理法则,要很直观和易用,我可以拖动光路角度,能展示光的反射、折射、散射原理,我要在课堂上给小学生展示。」

这个用几句话手搓出来的小东西,只用了老师五分钟左右的时间,却在课堂上大受欢迎,学生们爱不释手。

放在两年前,这件事的每一步都很难走通。「AI 生成应用」停留在指令演示层面,是属于程序员的特技;交付物大多运行在电脑上,不适合中国这样的移动互联网优先市场;生成的作品也很难分享给别人、直接用起来。

三道关卡,把很多想要尝鲜的普通用户挡了门外。而如今,情况早已发生变化。

应用生态二十年,我们一直是「看客」

过去十多年,我们在互联网上消费的内容,形态换了好几轮——从图文到短视频,再到直播,始终没变的是你的身份:观看者。

创作门槛降低了,人人可以发帖,人人可以开播。但「开发应用」,或者更具体来说,从零开始打造一个完全为自己而生的工具这件事,始终存在一个专业门槛。写一个能运行的应用,不管多简单,都需要代码——以前可能需要你直接写代码,今天的氛围编程时代则需要你使用编码工具。

这道门槛从未真正被打破过,直到蚂蚁「灵光」App 的这次升级,让它开始松动。

一种全新的 Wish Coding 开始涌现。

不是说 AI 能写代码这件事,那早就不是新闻了。真正的变化在于,这一次,从生成、部署,到使用、迭代,整个链条终于全部打通,而且全部可以只在手机上完成。不需要电脑,不需要懂技术,不需要将任何代码部署到网页上或提交到应用商城。

更惊艳的是,随着这次升级,灵光的闪应用终于可以调用手机的原生能力:相机、相册、陀螺仪、GPS、语音识别,这些手机里本就有的硬件,现在可以被一个普通人「口喷」出来的闪应用给利用起来。

譬如在一个健身打卡的闪应用里,你可以调用相机记录自己的动作;一个足迹记录小工具,能够读取位置,帮你记录你今年走遍了祖国的哪些大好河山;一个随口描述即可生成的「饮食热量查询」,也能识别语音,你只需要说出菜名,就能加入到一餐的卡路里计算当中。

哪怕是一个最简单的「摇一摇」挑战,都能轻松实现:

 

在灵光上,APPSO 还看到有人做了经期记录工具,有人做了控糖查询器,有家长做了一个能够按孩子节奏调整难度的英语拼读练习,还有各种各样的按钮、放置小游戏等「杀时间神器」……五花八门、千奇百怪。

如果说前一代的灵光闪应用,更多停留在原型、最小可行产品的阶段,那么升级后的灵光,终于成了真实可用的趁手工具。

应用也有自己的「朋友圈」

灵光用户目前已创建超过 3000 万个闪应用,覆盖了从互动游戏、情绪减压到语言打卡、待办清单等功能,关系到日常方方面面。

而随着本次更新另一大新功能「灵光圈」的上线,这数以千万计的闪应用,也有了自己的「朋友圈」。

灵光圈是一个专门用来分享、点赞、评论、二次创作闪应用的社区。在里面,你可能会刷到类似「今天吃什么」的闪应用,但发现里面没有你爱吃,而且外卖可以点到的品类。与其自己手搓一个,为何不直接在它的基础上进行修改?

「给可选菜单里加上肠粉、猪脚饭、牛肉火锅。」一句话,就这么简单。

以下面这个场景为例,APPSO 在灵光圈里看到其他网友做了一个喝水打卡小应用,觉得完全可以给他增加几个新的打卡种类。

我在这条灵光圈上,点击「修改」的按钮,用语音描述我想做的修改。

然后等上一小会,就做出来了:

灵光圈所改变的,不只是用灵光创建的闪应用的去处,而是工具开发和传播的底层逻辑:

过去的应用分发,对于普通人来说很困难。围绕产品也很难进行有效、快捷的讨论。最重要的是,你看到一个好的「底子」,想把它改写成更适合自己使用的版本,各方面的成本都很高。

灵光圈更接近一个创作者社区,只不过创作物从图文变成了可以运行的工具。一个人做出来的东西放进去,有人用,有人改,有人在原基础上加功能再发出来。闪应用的生命周期,不再止于创造它的用户一个人,而是可以在社区里延续,开枝散叶。

曾几何时,山村教师要在黑板上一次又一次地改画图表;后来,他可以把自己做的光路模拟闪应用发给其他教职同事,在当地教育系统的群聊里传播。

而在今天,他终于可以把这个手搓的小东西发布到灵光圈里,让它跃出山沟,走向更大的世界,被更多人发现。

应用,开始像互联网内容一样,获得了天然的可传播属性。

有人会说,闪应用足够轻量,算不上真正的应用开发。这个判断并没有错,它恰好击中了关键:灵光圈里流通的,是普通人的工具,解决的是那些太小、不值得开发团队来做,但又真实存在的麻烦——记录某件事、追踪某个习惯、各种各样可以用来杀时间的小东西。

过去的应用经济模式,决定了这片空白无法被填补。而在灵光之后,一切都变了。

一人应用,开枝散叶

灵光闪应用开启了一种「一人应用」的创意模式,在人群中流转。

31 岁的郭郭曾经是个北漂,形容自己的状态是「每天像上紧了发条」。如今,她从高压的职场辞职已经一年多了,和丈夫定居成都。

「不想被工作定义人生」的她,开始在社交媒体上做博主。但区区两千多粉丝很难支撑变现,她做了一个判断:必须做自己的产品。

目标管理工具方向是她看到的机会,但 Notion、多维表格的赛道早就拥挤。她偶然接触到一个概念:把一年365天拆成「36个10天」,每个阶段专注一个目标。这很像她自己的需求:我们的工作/生活/个人进步没有宏大到需要一个复杂的规划系统。一个低门槛的每日打卡,就足矣。

但她没有任何编程基础。

春节期间,她用灵光从头开始,每天花几个小时的时间整理自己的需求,然后口述出来,让灵光生成框架,逻辑不通就反馈,反复调试,前后花了一周,终于做出令自己满意第一版。

她把应用上架到了社交平台,定价 9.9 元,收到第一批买家。反馈涌进来,她一条条看,一个月后出了第二版,加入心愿清单功能,定价涨到12元。

不到两个月里,这个打卡工具累计卖出了 850 单,收入近 9000 元——靠的只是一张嘴,和脑子里对需求的洞察。

她把这种新的「创业」模式跟之前设想的博主模式做了个对比:做内容要去撞算法,要迎合用户喜好,接广告还要甲方审核,整个链路又长又累;「现在自己做产品,改进速度以天计算。」

郭郭只是「一人应用」理念的一个代表。从被动等待别人认可,到主动把想法变成产品、推向市场,整个产品开发与传播的路径,发生了本质性的变化。

进入意图编程 (wish coding) 的时代

计算机时代长久以来,出现了这样一种分工:有想法的人,和能把想法变成机器语言的人。

前者很多,后者却很少。这也是为什么绝大多数人的「想法」只能停留在想想的阶段。

当 AI 具备了编码能力之后,这道门槛正在以肉眼可辨的速度降低。但降低到什么程度,一直有争议。

「氛围编程」这个概念已经流行两年了,但现实是,即便有了 AI 大模型的帮助,绝大多数人仍然很难接受和使用 IDE、CLI、各种编程工具。即便他们写出来了东西,最后还是需要懂技术的人收尾。

将想法转译成机器语言的步骤减少了、步长缩短了。这个转译的门槛却依旧存在。

灵光做的事,是把对于完全不懂技术的普通人的一切阻碍,通通砍掉。意图可以被一句话代表,意图可以直接生成可运行的闪应用,出现在你的手机上,立刻可用,还能很方便地分享给朋友、分享给世界。

以自然语言描述为核心的 Wish 语言,和灵光的一句话生成闪应用,都是这一「意图编程」理念的有趣实践。

通过闪应用,意图可以直接诞生具备商业潜质的产品,成就越来越多的「一人公司」们;也可以在山村教师的手中化作千变万化的「虚拟教具」,用一种轻量的方式,开始消解让教育平权的结构性难题。

将人类的意图翻译成机器语言,过去需要用户洞察与产品理解力,更重要的是需要代码作为转译。

而在今天,语言即代码。

或许多年以后,对于相当一部分人而言,他们不再需要知道代码的存在。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

数字排毒,我们这代人的赎罪券|硬哲学

作者 杜晨
2026年4月14日 10:52

很少有 MacBook Neo 评价两极化这么夸张的苹果产品。

有人说它性能完全不够,靠 logo 骗预算不够的小白;有人却说它是近年来苹果最务实的诚意之作。

剥离掉对跑分性能和极致的生产力上限的执念,你会发现,已经很久没有一款科技产品,剔除冗余的性能溢价,也不做不切实际的承诺。你不应该买它,除非你真的需要。

在 MacBook Neo 的身上,有一种真正的「极简主义科技」意味,因为它回应了用户真实需求,也没有人为阉割来制造所谓的极简感。

今天爱范儿这篇专栏文章,想要探讨真正的「极简主义科技」究竟是什么。

我在 Reddit 上看到了很多帖子,描述想象中的极简主义科技生活:主力机是 Light Phone 3 代,这台「笨手机」(dumb phone) 售价 699 美元;一台 iPod Classic 用来听歌;一台十年前的数码相机用来拍照;当有灵感需要记录的时候,他会从自己的「离线包」里掏出手账本……以此类推。

每一个智能手机具备且经常使用的功能,都被分散到一台单独的设备或道具上。日常出街的家伙事,足足三斤重。

帖主给这种状态起了个名字:Inconvenient Maximalism,不方便的极繁主义。

对了,这个「离线包」(analog bag) 也是前段时间洋抖 (TikTok) 上爆红的最新趋势,成千上万的视频,巨大的流量。它指的是一个装满「离线物品」的包:胶片机/CCD、随身听、有线耳机、毛线针和线团、手账本与纸质书……大意是说,当你出门时完全可以把手机扔下,用这包东西打发时间。

我很喜欢的一个「反消费主义者」YouTube 博主 Levi Hildebrand,是这么评价「离线包」的:

手机能做一百件事。所以你不带手机就需要一百样东西来替代它,结果就是你的包包越装越重。

然而更讽刺的是,这些博主明明带着手机,背着包包到处跑,几十个场景机位来回切换,拍出视频……就是为了发到网上,再忽悠他们用自己的返佣链接下单去买这些 CCD、随身听、耳机、毛线针、手账本?

如今的消费主义,已经堕落到这种程度了?为什么这些热衷于「极简主义科技」「数字排毒」的人,如此抽象?

数字排毒,活成了自己的笑话

每当某种注意力收割工具令人厌倦了、过时了,马上就会有新东西,以反抗者、革命者的姿态出现,承诺将你解脱出来……

不消时日,这个新东西就会马上演化成下一轮的收割工具,往复循环。

今天,这个新东西就是「数字排毒」的概念,以及打着这个概念旗号,企图笼络人心的极简主义科技产品们。

2017 年,第一代 Light Phone 上市,只能打电话;2019 年,Light Phone 二代加入了短信、音乐播放器和闹钟。去年,乘上了「笨手机」春风的 Light Phone 三代终于发布,售价 699 美元。

海外媒体是这么评价 Light Phone 三代的:「极简主义被拉伸到令人沮丧的程度」,「一台越来越像智能机的傻瓜手机」。也不能怪他们:AMOLED 屏幕、摄像头、NFC 支付、指纹解锁……只看参数表的话,你很容易以为这就是一台智能机。

从开始到现在,Light Phone 已然进入了两难。如果卖点是「少」,就必须砍功能。但功能少了,用户反而不敢买单;把功能加回来,尺度很微妙。

除了产品设计之外,Light Phone 还面临商业模式的问题。

它最初是从众筹平台上起飞的,但公司随后不得不拿了风投的钱。谈投资的时候可能聊的是「数字排毒」的趋势,投后要看的却是销量、增长、财务……本质上,这套逻辑和极简主义/反消费主义「希望用户少用产品」的美好愿景是完全错位的。

结果就是为了卖货,这台「笨手机」高也不成低也不就,离它最初承诺的东西越来越远,却越来越像它本来要取代的东西……

消费主义的本质,是不断创造新的欲望来消化过剩的产能,而注意力经济是创造消费欲望的最有效手段之一。

哥大法学院的吴修铭教授认为,教授注意力经济也已有百年多的历史。从 19 世纪的廉价报纸 (penny press),到 20 世纪的广播电视,再到今天的短视频、小游戏、短剧,其实注意力经济从来没有变过:用免费内容交换人的时间,再把这些时间通过各种方式(广告、数据等)变现。

哈佛商学院荣休教授苏珊娜·祖博夫在《监控资本主义时代》一书中提出了一个新的概念:「行为剩余」(behavioral surplus),指的是科技公司从用户行为里提取数据,例如你点击了什么、在哪里停留了多久、在哪里犹豫了,然后把它们转化为「行为预测产品」,打包卖给广告商。

但为了让预测更准确,平台需要主动去「塑造」用户行为——无限算法流、消息红点、间歇性的点赞通知,都会服务这个目的。

前几年曾经有个社交产品 BeReal 爆火,每天随机弹出通知,用户必须在两分钟内打开应用拍照并分享,没时间准备,也不给修图滤镜,鼓励展现未修饰的日常样貌,消除社交产品的使用焦虑。

2024 年,以高频成瘾的垃圾手游闻名的法国公司 Voodoo,斥资 5 亿欧元收购了 BeReal。

一款以「反注意力收割」为卖点的产品,反倒被注意力收割机吞并了。这大概就是活成了自己的笑话、屠龙者终成恶龙、逻辑闭环了吧……

这些科技产品的设计理念,本质上和老虎机没什么区别。让人上瘾最有效的方式不是每次都给奖励,而是随机给。你不知道这次下拉会看到什么,正是这个不确定性让你停不下来。

互联网是通讯工具,是知识系统……它可以是很多东西。但大部分时候,它实际上是一台重新引导、无情收割一切注意力的机器。它侵蚀的不只是你的时间,是你的掌握自己注意力的自主性。

买一台「笨手机」,解决不了结构性问题

乔治城大学计算机教授卡尔·纽波特是「数字极简主义」这一概念最重要的推广者。2019 年他出版了《数字极简主义:在喧嚣世界中选择专注的生活》一书,认为电子邮件、聊天、短视频等等助长了「过度活跃的蜂群思维」(the hyperactive hive mind)。

纽波特认为,智能手机应该像一把瑞士军刀,大体上有通话、地图、相机、音乐这些核心功能就够了——这个愿望有点不切实际,他自己也清楚。

于是他转而提倡一种「非暴力」式的戒网方法:在你的手机上关闭非紧急通知,删除社交软件,手机调成单色模式,给自己设定一个数字宵禁的时间。从他的角度,把手机放在家里不带出门,已经是最极端的排毒行为了。

你可以看出来,纽波特的方案本来是零成本的。他从来没说过,你应该花数千块钱购置任何额外的设备。在他的方法论当中,甚至没有「数字排毒产品」这个品类的存在。

然而冥冥之中,提出了数字排毒概念的纽波特,反而成了另一群人,将之商品化的共谋:

  • 首先,有人带着真诚的初衷发现了一个真实问题,触碰到了更多人内心深处某种真实的渴望;
  • 接着,另一群人看到了营销机会,开始兜售一套你必须拥有的东西,来证明你属于这场运动。
  • 结果是,这群人接管、掌握、统治、最终定义了整个运动,直到它的信仰破灭。

类似的剧本一再上演。

1986 年,意大利的第一家麦当劳,在罗马的西班牙广场开业。作家 Carlo Petrini 召集了一群同事朋友去抗议,而这次抗议后来演化成了慢食运动 (Slow Food)。

这场运动的立场,既回归传统又标新立异:反对工业化快餐对饮食的侵蚀,在农民和消费者之间建立更直接的连接。

然而现如今,「农场到餐桌」(farm to table) 早已成了高端食品的标签,慢食运动最初所代表的理念,早已被消费主义完全消化,逐渐退化成了高档餐厅和有机超市溢价的理由。

十多年前,源自于佛教等宗教里的正念/灵修/内观,成为了社交网络上最 in 的潮流之一。然而当这种非主流爱好演变为潮流之后,也成了新的商业收割机。一群科技创业者趁势而上,开发出了市场规模高达数十亿美元的正念产业。

学者 Ronald Purser 在 2019 年出了一本书,书名就叫《麦正念》(McMindfulness,一个很有趣的双关),批评「正念」早已变成让打工人在高压环境里更好适应的减压技术。正念产业们忽略了真正的问题在于结构性的工作压力,却把责任塞还给了个人,让用户去管理自己的内心。

热潮过后,行业两大巨头 Headspace、Calm 的下载量纷纷暴跌(-74%、-61%)。

和「农场到餐桌」「正念」等概念一样,数字排毒也正经历概念破产的加速期。

数字排毒产品许诺的是:用一次性的消费行为,解决一个持续性的行为问题。但如果你看过各种电影电视剧里强制戒酒、戒毒之后的复饮、复吸情节,应该知道这种强硬限制的反效果有多强。

2025 年《BMC Medicine》刊登了一项为期三周的手机使用干预试验,要求上百名参与者每天使用时间不超过两小时。干预期间,测试组的平均屏幕时间从每天 285 分钟降至 129 分钟,压力和睡眠质量也同步改善。

然而 6 周后回访数据显示,他们的屏幕时间又反弹回了 226 分钟,心理健康睡眠指标也降回去了。又过了一周,反弹情况已经和测试的对照组基线水平无异。

强制、短期的「戒网」,是没有效果的。

为什么这种限制注定会失败?上世纪 60 年代,心理学家 Jack Brehm 提出「心理抗拒理论」:当一个人感知到自己的自由选择被外部力量限制时,他会产生强烈的动机来恢复这种自由。

约束越强硬,被禁止的行为就越有吸引力。这解释了为什么很多「笨手机」用户最终把那台手机放进了抽屉,然后换回了 iPhone 和安卓机。

数字排毒产品赖以存在的心理前提,可能本身就是错的。

用消费,反抗消费

回到文章开头提到的「离线包」案例。

如果你去刷相关话题的视频,会发现这些博主,各种书哐哐往家买,却没几个真的去博物馆借书的;这群人的视频里一定有个漂漂亮亮的手账本,里面到底记了啥你是不太可能看到的。

用户在博主们的影响下,花了成百上千块钱,买了各种各样的产品。然而,却形成了「意识到问题了」「在行动了」,就等于题被解决了的错觉。

这种行为其实很像中世纪西方大受欢迎的「赎罪券」。信徒不用改变自己的行为,甚至不需要告解和悔改,只需要支付金钱就能获得「罪已得赦」的心理确认。钱花出去,药到病除,非常方便。

⬆17 世纪的赎罪券(后世复刻)

这种现象在行为经济学上叫做「道德许可效应」。当人们完成了一件感觉道德的事情之后,更容易在其他方面放纵自己。比如购买 Patagonia 等环保品牌,很容易让你误以为自己真为地球环保做了多大贡献——其实从个体角度,你的不仅助长了消费主义,甚至制造了更多的垃圾。

我们为什么执迷于用消费行为来反抗消费主义,却以为自己还挺聪明?其实,这里面有人格方面的深层原因。

人是注意力动物。无论是手机,还是离线包里装的各种各样的东西,其存在目的都是牵制住人的注意力,帮我们杀掉时间。如果没有这些东西占据注意力,我们会变得极度无聊。

究其根本,在人人都有智能手机、人人都随时在线的时代,我们已经不知道一个人不刷手机该怎么呆着了。如果注意力充裕却没有地方可放,我们甚至会恐慌。所以我们需要一种「干扰」。

而这些数字排毒产品,其实是在利用你的不安全感,来赚你的钱。他们真的解决了什么痛点吗?恐怕没有。

不只是数字排毒产品,所有的消费陷阱,都是同一套底层逻辑。

如果你要用消费行为来反抗消费主义,恐怕只有资本最后成为赢家。

真正有用的方法,免费但无聊

2024 年,斯坦福大学社交媒体实验室让 80 多名学生用「笨手机」替代智能手机使用一周,初步发现受试者的头脑更清晰,更专注,更活在当下。

但进一步调研发现,主要归因并不是「笨手机」,而是那些报名参加了这项研究的学生,原本就有「数字排毒」的动机。

其实真正有效的方法是完全免费的,只是有点无聊。

豆瓣上有个「数字极简主义者」小组,有 3.3 万成员,我们分析总结了里面的很多帖子,发现最主流和有效的方法,就是少用、不用手机。

比如和家人约定晚饭时间不看手机,比如睡前把手机放到卧室,用真的闹钟来定闹铃;非要用的话,可以巧用,比如把社媒 App 移到手机的第三屏,增加「找到它」的摩擦成本;使用的时候大量点击与兴趣无关的内容,故意污染平台「千人千面」的推荐算法。

是的,实现数字排毒,不需要购买任何新的产品,你唯一需要支付的成本,不应该是金钱,而是心智。但你可以一点一点来,比如先从躺到床上就不再用手机开始。

究其根本,你要承受戒断反应,学会与无聊做朋友。

在注意力高度碎片化的今天,其实「无聊」是件很好的事。如果你能领悟无聊的意义,开始享受无聊,进而换种方式利用无聊的时间,「数字排毒」才能真正开始。

无论如何,都不要再买赎罪券了,那都是骗子发明出来骗傻子的。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

苹果瞒着你给 iPhone 打了个补丁,为什么?

作者 杜晨
2026年4月10日 10:10

今年 3 月的某一天,你的 iPhone 悄悄地自己更新了一次。

这次更新,既没弹出通知,也不会在系统更新菜单里体现,你甚至不需要点「同意」。要不是这篇文章,你或许压根不知道有过这么一次更新。

记忆里苹果过去没这么干过。考虑到「库克桌上的小按钮」这个都市传说,估计有人要怀疑,苹果莫非又在偷偷搞「计划报废」了?

放宽心,情况并没那么严重……这次推送的其实是个安全补丁,修复了可以让恶意网站绕过浏览器安全边界的 WebKit 漏洞。

但正如前面提到,这次更新没有走正常的系统更新流程,而是在联网的情况下,直接静默推送并安装了。当然,苹果也没有故意藏着掖着,官方网站上会有详细的日期和漏洞记录。

其实,这是是苹果的全新的安全推送机制「后台安全改进」Background Security Improvements,首次发挥作用。

过去十几年里,任何科技产品的安全更新,走的都是传统的流程:汇报/发现漏洞,开发补丁,打包进下一个系统版本,推送,等用户点同意下载、安装并重启。

这个逻辑,已经很多年没变过了,也没有任何改变的需要:If it ain’t broken, don’t fix it. 如果没有坏,为什么要改变?

但逻辑成立有一个前提:攻击方和防守方的速度大致对等。

现在的问题是,随着 AI 技术的进步,节奏开始变得越来越快:漏洞发现变快了,被滥用甚至大规模使用更快。留给科技公司给产品打补丁的窗口期越来越短。

科技公司们,也开始跟不上自己创立的新时代了。

2023 年,苹果曾经在 iOS 16 上做过一个「快速安全响应」的机制,能够静默完成安全升级。不过,该功能推出之后并没有没有有效利用,中间还有一次因为推送了错误的代码,导致一些网站无法正常显示,结果那次更新很快就撤回了,这个机制后来也没有再使用过。

但这次不一样了。今年,苹果从 iOS/iPadOS/macOS 26.1 版本开始启用「后台安全改进」政策,第一次实际投入使用,则是在 iOS 26.3 下的小版本上,也即开头提到的 WebKit 漏洞修补。

其原理大概如下:把 Safari、WebKit 等这些最容易被攻击的组件,给单独剥离出来,放进可以独立更新的加密磁盘镜像,从而绕开整个常规 OTA 流程。

「后台安全改进」的官方说明其实写的很简单,但通常字少事大。苹果的逻辑很明确:在今天这个时代,安全这件事不能等,必须加速。

时间再拨回本周:苹果加入了现如今最当红的 AI 巨头公司 Anthropic 发起的 Glasswing 计划,拿到了该公司最新,同时也是迄今为止最重磅的大模型 Mythos 的使用权。

这个模型能做很多事,但最擅长的能力之一,就是在那些每天数以亿万计用户使用的产品里,发现那些藏得最深但从未被此前任何方式发现的代码漏洞。

正式启用「后台安全改进」,和加入 Glasswing 计划,相隔不到一个月的这两件事放在一起,你应该能看出苹果有多看重安全了:

要知道,安全以及隐私是苹果最大的叙事主题,它必须尽最大努力去做好安全——哪怕是「瞒着用户」也要这么做。

从 Mythos 里面,苹果能得到什么?

Glasswing 计划的成员包括苹果、亚马逊、谷歌、微软、英伟达、思科、Palo Alto Networks、Linux 基金会等顶级公司和机构,另有 40 多个组织获得扩展访问权限,总计参与机构超过 50 家。

Mythos 是 Anthropic 目前最强的模型,所以你可以把 Glasswing 理解为 A 社拉了一个「内测群」……

这个模型没有公开发布,甚至连最顶级的付费用户(个人或企业)都暂时用不上。这在 AI 行业是非常罕见的,要知道放在任何其他公司,都会忍不住会把最新模型用最快速度推向市场,以获得更多的收入(为此甚至不惜给老模型降智、砍算力)。

A 社决定不第一时间全量开放 Mythos,提供的官方理由是:他们判断这个模型的能力可能越过了某条红线。

根据 Mythos 模型卡提供的信息,A 社并没有专门训练它去做安全用途,而是因为代码能力实在太强,进而导致 Mythos 涌现出了强大的攻防能力。

专门负责找破绽的 A 社红队,主动诱导 Mythos 从隔离的测试沙盒里「逃脱」,结果它还真发现了沙盒有一条设置错误的规则(并非人为设计,是真的疏忽),于是顺着这条路获取了特权,突破出站过滤,然后给研究员发了一封邮件,告知任务完成。

除了一开始的诱导提示词之外,没有人提供实质性的指导,模型自己完成了整个侦察、渗透、出逃的行为链。

A 社在报告里专门说明,这仅仅证明了 Mythos 大模型的能力超出预期,并不意味着它具备了某种自主意志(不论善良中立抑或邪恶)。

但与此同时,Mythos 会拒绝 96.7% 的明确恶意请求,以及 93% 不到的攻防双重用途请求——这仍然意味着,在 3-7% 不等的情况下,恶意请求可能会被执行。

而考虑到 Claude 月均 25 亿 API 调用,换算日均约 8.3 亿次调用——个位数百分点的比例,仍然可以换算为每天可能会有海量的恶意请求会被放过去、执行。哪怕只有一条成功了,都有可能造成糟糕的后果。

模型能力之强,已经真实地引发了它的创造者,以及整个科技世界的担忧。

于是,A 社提出了 Glasswing 这个「内测计划」:与其把 Mythos 锁进保险柜,不如让潜在暴露风险最高的巨头公司和机构们先拿到它,扫描自己产品里的漏洞,在更大范围扩散之前把洞堵上。

为此计划,A 社将会投入 1 亿美元的使用额度(本质上就是给内测伙伴提供 API 额度补贴),另外捐出 400 万美元给开源安全组织。

苹果拿到这个访问权限,扫描的对象是 iPhone 和 Mac,是 iOS、macOS、Safari——每天数以十亿计用户在使用的产品和操作系统。

苹果为什么看重 Mythos?它自己的安全团队不够格吗?当然绝非如此。

问题在于:

  • 一个典型的安全研究员,对于系统安全有深刻的理解,但他可能不像 iOS/Unix/内核的工程师那样,对于专精的技术栈、某种具体的编程语言,有足够深的理解;
  • 反之亦然,一个专精于 iOS/Unix/内核的工程师,能用自己的技术栈和熟练语言写出合格的代码,但仍然难免留下漏洞。
  • 更别提今后的工程师遇到 bug,甚至都不用 Stack Overflow了,直接 Claude Code 就行,能力的全面性大不如前。

正如前面提到,Mythos 的攻防能力,来自于强大的代码能力。代码也强,攻防也强,相当于既是专业的 iOS 开发者,也是顶级的安全研究员。

两手一起抓,两手都很硬:这才是苹果真正看重的东西。

窗口正在关闭

Mythos 的战绩可查:在每一个主流操作系统,和每一个主流浏览器里,它都已经发现了此前未知的高危漏洞,总数达到数千个。其中超过 99% 在报告发布时仍未修复,正在走协调披露的流程。

这其中就有 OpenBSD。作为开源世界里公认安全标准最高的操作系统之一,OpenBSD 是很多防火墙和关键基础设施的底层系统,其代码库长期处于全球安全研究员的持续审计之下。

但是,Mythos 轻而易举地在其 TCP 协议里发现一个整数溢出漏洞,存在了长达 27 年之久但此前从未被发现,所花费的算力成本不足 50 美元。

OpenBSD 可能离你太远,FFmpeg 应该足够近了,它是几乎所有视频播放 App 的底层基础,每一个带有视频播放功能的应用,包括你正在看这篇文章用的微信或者浏览器,都内嵌了 FFmpeg 或其衍生技术。

Mythos 在 FFmpeg 的 H.264 解码器里找到了一个存在超过 16 年的 bug。自动化测试工具此前已对该代码路径运行了上百万次检查,也是从没发现问题的存在。

你的苹果设备浏览器多少都会利用 WebKit,你的路由器同样可能依赖某个 BSD 变种运行,短视频产品更是无处不在……这些软件、技术,存在于我们每天都在使用的手机、电脑等各种设备当中。

每台设备,每个人都会成为攻击对象,这绝对不是危言耸听了。安全这件事,现如今真的和每个人相关,而且关系从未如此紧密。

漏洞本身不是新鲜事。每年被登记在册的 CVE 漏洞编号数以万计。安全行业的人对这件事,早已形成了习以为常的应对节奏。

这套节奏建立在一个前提上:攻击者需要时间。发现一个漏洞,理解它的成因,写出可以稳定复现的利用代码,这个过程在以前需要数周到数月,高度依赖顶级安全研究员的经验积累。

防守方也慢,但大家都慢,所以系统能维持一种缓慢的均衡:根据 Verizon 的《数据泄露调查报告》,去年各种已知漏洞修复时间的中位值是一个月。

一个月,成了多年以来行业默认接受的风险敞口。然而,强有力的大模型今天已经将防守方的时间窗口压缩到以小时计:

以 Mythos 对 Linux 系统的漏洞利用为例,从自主完成侦察、漏洞分析、构建代码,完成 Linux 内核的提权——整个过程用时只用了半天左右,算力成本仅用了 2000 美元。

换成人类安全研究员,却要花至少一个人月(真实场景下可能需要多人)的薪资成本,才能完成这个修复。

但现在,我们没有时间了。

苹果的两步棋

现在你应该明白,苹果为什么要绕过你直接打补丁了。

正如前面提到,传统的 OTA 周期天然存在延迟。内外部人员发现漏洞,苹果开始开发修复代码,把它打包进一个完整的系统更新,走测试、审核、推送流程,最后等用户在某个方便的时刻点击安装——整个周期通常需要几周时间。

以前合理的东西,现在不合理了。苹果可能早在 2023 年就已经意识到了这一点。今年正式上线的「后台安全改进」,是苹果的最直接回应。

而成为 Glasswing 计划的核心合作伙伴,更是苹果在 AI 时代,提前布局安全的工作体现。「后台安全改进」让推送补丁的周期变短,用上大语言模型,解决的则是推送修复的前置工作——发现漏洞和生成补丁。

AI 的新时代,带来了新的威胁。整个安全响应链条,从发现到修复到推送,每一个环节都需要提速。

好在,大模型本身也可以被看作一种「平权」,只要能够支付得起 token 费用,无论巨头公司还是中小企业,甚至个人开发者,都能够借助其力量来让自己的产品变得更安全。

更何况模型的商品化趋势极为显著。或许在不久的将来,取得同样效果,只需要几十甚至上百分之一的成本(Mythos 费用是 $25/$125 每百万 token)。

然而,道高一尺,魔高一丈。只要有新的技术出现,就会出现新的攻击面。安全的猫鼠游戏从来没有真的结局,魔与道的交手永不停歇。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Floatboat 体验:一个人的公司,只需要一个办公软件

作者 杜晨
2026年3月31日 10:48

过去两年,我们每天都在做同一件事:学习和进修「提示词工程」这门玄学。

找 AI 干活,总要像个碎碎念的甲方一样,交代八百字背景,像是在哄一个智商奇高、但每天都会间歇性失忆的实习生。

这让我想起在游戏里,施展出必杀技之前,总是会有一个类似「前摇」或者「吟唱」的过程。某种程度上,写提示词,提供上下文,上传各种文件等等……就是使用 AI 的「前摇」。

不是说用户每次都要做到极致,只是如果你能给足这些前置条件的话,AI 会做的更好。

不过,前段时间 APPSO 在中关村的一场线下聚会看到了一个还在测试中的 AI 办公产品——它很大程度上摒弃了对「前摇」的依赖。

产品名字叫 Floatboat。

Floatboat 的联合创始人兼 CEO 少卿走到台上,打开 Floatboat,选中一个文件夹,里有一个 CSV 表格,是一份参加本次活动的嘉宾名单。他在旁边的 AI 对话框里说了一句:生成邀请函。

过了一会,每位嘉宾的邀请函都出现了。

到这里为止都还好,把表格丢给 ChatGPT、Claude、WorkBuddy、悟空………任何一个今天的 AI,写一句指令,大概率也能做到差不多的事情——但接下来发生的,让我愣了一下。

有一位新嘉宾确认出席了,少卿说,「在表里更新一下」。

CSV 更新了;紧接着,一封新的邀请函也自动生成了。

我坐在那里花了两秒钟,试图理解刚刚发生了什么:

Floatboat 它知道这份表格和邀请函之间,知道「更新表格」和「生成邀请函」两个动作之间,是有关系的。所以少卿只说了前半句,后半句没说出来,它自己悟出来了。

AI 不再是等待指令的工具,变得越来越积极、主动,会动脑子,像一个一直给你打下手的小朋友,你说「更新一下」,他知道你的意思。

这个瞬间让我开始认真看这个产品。

简单,但又无法简单定义的产品

Floatboat 是什么?我试着给它一个定义,发现很困难。

它有一个长得像 macOS Finder 的文件管理器,你可以浏览本地文件、打开 iCloud Drive;文件格式支持得很全,Markdown、CSV、Excel、Word、图片、视频,都能直接预览,甚至编辑;

它有一个内置浏览器,可以打开任何网页,甚至可以让 Agent 去操作这些网页;

它有一个 AI 对话界面,底层可以接 Gemini 或其他模型。这么看来它有点像 Claude 的桌面端,但又比 Cowork 多一些更直观的操作逻辑。

这三个东西,文件、浏览器、对话,以面板的形式并排在一起,可以随意拖拽组合,最多四栏并排。

你在浏览器里看到一张有用的图,可以直接拖到本地文件夹里保存;你让 AI 生成了一份报告,报告会直接写入本地文件,以 .md 或 .docx 格式保存,并且你可以直接编辑这些文件,不需要 cmd-c 再 cmd-v 到另一个地方。

信息从各个方向流进这个环境里,加工过的内容也能流出去,不会被锁死在某一个面板里。

所以 Floatboat 到底是什么?是文件管理器?是浏览器?是 AI 聊天工具?是氛围编程环境?

它都是,又不完全是。

在 Floatboat 出现之前,我们其实一直在做不同软件之间的「人肉 API」,每天按几百次复制粘贴,打开不同的软件或浏览器窗口、编辑不同的文件。

在 AI 世代在线办公的我们,成了在窗口与窗口之间疲于奔命的赛博搬运工。

而 Floatboat 打破了软件之间的墙,让所有的窗口都能共享同一份上下文。

开发团队给产品的定义是「工作环境」而非「AI 助手」。助手是你要求它才动的,工作环境是一直在那里的,你在里面做事,它一边帮你做事一边观察和学习。

在沟通会上,有人问少卿:一句话形容你们的产品?

少卿反问:你能一句话形容 ChatGPT 吗?

大家会心一笑。我觉得他说的有道理。有些东西确实不是一句话能装下的,除非你做的是一个非常垂直的工具。Floatboat 显然不打算做垂直。

做科技记者这些年,我经历过好几代这样的产品。最早是电子邮件加 Office 套件的时代,后来是各种 OA 系统,再后来钉钉来了、飞书来了、Slack 来了。

每一代都有一个产品,或者一类产品,它们有着同一句潜台词,对你发出强有力的暗示或者明示:上班,用我就够了。

而在 AI 时代,Floatboat 想要成为这个角色。

这么说不是在拔高它。恰恰相反,这个位置历史上从来没有人真正坐稳过。飞书解决了团队协同,但文档操作仍然需要 Office 套件。钉钉把审批这个工作做到了极致,但打工人私下用微信聊工作的习惯从来没变过。

「一统江湖」这件事,每一代都有产品在尝试,但从来没人真的实现过。

原因是结构性的:这类产品想要成功,需要整个组织一起换过来。而组织的惯性,是所有惯性里面最大的。你一个人觉得飞书好没用,你的团队、你的客户、你的供应商都得觉得好才行。

Floatboat 的策略有一个不同:它不面向组织,它面向个人。

这个产品的目标人群,也正是时下最流行的概念:OPC,全称 One Person Company/一人公司。

过去一年 AI 能力的跃进,让 OPC 这个前两年的口号,逐渐变得越来越现实和可行。一个人,加上三五个 agent, 几乎可以对等一个小的草创阶段的业务和支持团队。无论是自媒体内容创作者,从选题到写稿到排版到分发,还是电商业务,从选品到上架到客服到投流,都已经够用了。

Floatboat 希望能够打动这群人。在 APPSO 的体验中,我们测试了包括内容创作、数据科学等场景,也测试了外部工具接入(例如 Slackbot)等多种场景。对于内容、营销、数据分析、客服等类型的工作,Floatboat 都达到了我们的期待。

现在 AI 产品有两种设计哲学。一种是「你放手,我来」,把用户推到后座上去,Agent 全权接管,跑完了给你看结果。另一种是「你干活,我在旁边」,成为用户的副驾,在适当的时候递工具、提建议。

Floatboat 更接近后者,但又不全是。用 Floatboat 工作,我的体验是:跟 AI 在主驾副驾之间来回切换,畅快自如。

用了一段时间之后,我觉得 Floatboat 的主张是行得通的。至少在现在这个阶段,大多数人对 AI 的信任还没到「你尽管干,我不用看」的程度。你让一个打工人把整份方案交给 AI 自己跑,他会焦虑的睡不着觉……

但如果 AI 是在他的屏幕上、在他的文件夹旁边干活,他看得见过程,能随时纠正,那他会比较安心。

这也是为什么 Floatboat 的界面设计那么像一台传统电脑的桌面,把文件管理器、对话框、浏览器/编辑器都拉出来让你一览无遗:已经认识的东西,能够降低用户对一个新事物的戒备心,提高接受度。

一边工作、一边蒸馏工作

然后再说 Floatboat 做的一个叫 Combo 的功能。

Combo 可以是一个复杂的 skill,也可以是多个 skill 的组合。而在工作的逻辑里,就是把一套工作流打包成一个可复用的操作。

Floatboat 内置了从工作成果中「蒸馏」 combo 的能力——这其实很像 Anthropic 官方的 skill-creator(本身也是一个 skill)。

比如你每周都要做一件事:从网上抓几篇行业报告,提炼摘要,整理成 Markdown 文档,然后推送到 Notion。你第一次在 Floatboat 里手动跟 Agent 对话完成了这套流程之后,对话框下方会出现一个按钮,问你要不要把这轮操作存成一个 Combo。

或者你也可以主动跟 Floatboat 说,「把我们目前的工作里面的方式、思考、逻辑,整理为一个 skill」。

当下次遇到类似任务的时候,Floatboat 会自动把这个 Combo 推荐给你,一键启动。

这里面我觉得最有意思的一点是:你不需要事先「设计」工作流,只需要正常干活就行了。一边干着,一边 Floatboat 就会自己把你的工作习惯、操作方法等「蒸馏」出来,沉淀出一份指导思想。

少卿告诉 APPSO,Combo 能力的设计,是为了实现今天的绝大部分用户对于 agent 产品的那个核心期待:自进化。

「当 agent 能够感知你 80% 的操作的时候,它就有自进化的能力了」,Combo 的自动沉淀机制就是在做这件事的第一步。

兜售「提示词」的时代,快要结束了。你不再需要像个魔法师一样去背诵枯燥的咒语,把提示词保存在一个专门的文件夹或者 AI 工具的后台。通过 Combo,Floatboat 可以让用户把他们每天最经常做的固定动作,提炼成独属于自己的「手艺」和数字资产。

当然,Floatboat 也做了一个 Combo 市场,你做的好用的 Combo 可以上传,别人做的也可以下载。官方也提供了一些现成的。

但这个 Combo 体系仍有不足。

任何一个号称能够一统江湖的办公软件,号称「越用越懂你」的 AI 系统,都仍然存在冷启动的障碍:就好比 Google Docs 的初始简历模板虽然很全很好,但仍然需要每一个求职者去调整修改以适合自己。

Combo 的自动沉淀机制,逻辑上是说得通的:你用得越多,它学得越好,推荐的工作流越贴合你。但这有一个前提:你需要先投入时间从零教它,而大多数人没有这个耐心,他们希望拿来就能用。

作为一位媒体编辑,我的日常工作是阅读大量资料、跟作者沟通选题、改稿子、偶尔自己写长文。这些工作的颗粒度很细,上下文很碎,跟官方预设的那些模板(更偏向标准化的报告生成、数据整理之类)对不上。

在我的具体使用中,我将几种不同的内容生产路径保存成了不同的 Combo:针对外部新闻的快速反应是一种,基于采访 Q&A 提纲的撰写是一种,针对复杂课题的调研、资料的编排、然后进行原创写作,又是另一种。

当然,这不是 Combo 本身的问题。对于绝大多数人,无论他们的工作是文档写作、报表处理、ppt 写作,还是数据整理、行政工作,甚至更加复杂的「一人开发者+marketer+客服」,无论是自己生产 Combo,还是在 Floatboat 的官方 combo 基础上做微调,都足够好用。

AI 工具不是一切工作的万灵药——一个工具把自己宣传得再美好,今天的用户也应该有这样的觉悟。对于 Floatboat,正如前面所说的,它是「工作环境」,它的能力足以强化人,但它的工作效果仍然取决于人。

然后再说说用 Floatboat 和其他「类 Cowork」产品的区别:最大的明显感受,是 Floatboat 的工作流程很快。以文件操作、内容生成为例,在 Gemini 3.1 Pro 模型驱动下的 Floatboat,对文件进行操作(批量重命名/修改格式、填充 markdown 等)的用时,是我平时用 Cowork/Claude Code CLI 的三分之一左右。

Gemini 在「讨好用户」上也是老演员了,所以最近 Floatboat 也加入了 Claude 两个最新版模型,Sonnet 和 Opus 4.6 的支持。

Gemini 对于 Floatboat 主打的大多数办公场景(文案生成、表格处理、信息整理)来说够用,写作效果也还算不错;如果不符合你偏好的话,切到 Claude 模型也没问题。如果你注意到 Floatboat 的迎合意图太强,可以在工作过程中时不时强调一下,不要一味迎合,要对生成的结果,甚至用户的输入做批判性的思考。

以及,你也可以充分利用 Combo 生成的功能,将这些技巧写进 Floatboat 的核心指导思想。

另外一个小设计值得提一句:Floatboat 可以集成到飞书和 Telegram 里,你不打开它的客户端,直接在聊天工具里给它发消息,它就在后台帮你执行任务——这个功能叫 Claw 模式,相信足够你顾名思义了。

 

除了产品本身,Floatboat 团队还在做一件更远的事。

他们开源了一个协议叫 Selfware,核心理念用一句话说就是:A file is an app。

这是什么意思?现在你用 AI 辛辛苦苦做了一份调研报告,发给同事,他收到的是一个 Word 文档或者 .md 文件。文件里有最终结果,但你当时调用了哪些资料、AI 跑了什么逻辑、中间修改了几次、为什么改,这些对于工作最关键的经验,并没有被保存下来。

Selfware 想解决的就是这件事。一个 .self 格式的文件,里面不只有数据,还携带逻辑和结构。你的同事收到之后,可以直接打开、继续编辑、让 Agent 沿着你的思路往下跑。文件自带了工作环境。

这个想法,和目前 AI 开发圈里对 CLAUDE/SKILL.md、cursor rules 这类文件的热情, 属于同一个潮流。大家都在发现,文本文件可以用来「编程」AI 的行为,一个 .md 文件可以定义一个 Agent 的人格、工作方式、输出风格。

但 Selfware 往前又多走了一步:那些 .md 文件是指令,你告诉 Agent 怎么做;Selfware 想做执行单元,文件本身就能运行,而且不依赖于特定平台。

这其实有点像 Jupyter Notebook,把代码、数据、输出打包在一起了;也类似于 Docker,把运行环境做成了可分发的单元——Selfware 把场景换成了 Agent 协作。它不是从零发明的概念,但在 Agent 时代重新提出,确实切中了一个真实的痛点。

不过,协议这种东西,最终看的是采用率。现在 Selfware 主要在 Floatboat 自己的生态里运转。「A file is an app」是个有趣的理念,但从理念到被广泛采用的标准,中间路还很远。

另外值得提一句的是 IACT (Inline Action-Clicked Text),Floatboat 开源的另一个协议。它做的事情更小但很实际:在 Markdown 语法的基础上,直接在 AI 对话生成结果加上可点击的行内 (in-line) 链接/按钮。生成结果中的「可行动内容」将会自动套上这个按钮,用户直接点击就行了。

这个交互改进看着不起眼,用起来确实减少了摩擦。最早做类似体验的应该是 Claude,但 Claude 的很多「好东西」都是闭源的。Floatboat 把 IACT 开源,让其它产品也可以充分利用。

现在一些同类产品比如 WorkBuddy 也在做类似的东西了,但据我了解 Floatboat 是最先提出这个概念并把它协议化的。

工作起来,开心最重要

Floatboat 的名字来自一句英语俗语,whatever floats your boat,大概的意思是「你开心就好」。

少卿说,他们希望产品给人一种在 AI 时代悬浮起来的感觉,不被裹挟着走。

这个愿景挺好的。但 Floatboat 能不能成为这个时代的那个「用我就够了」的产品?老实讲,APPSO 仍然没法给出一个明确的判断。

毕竟大家都看到了:每一代尝试做这件事的办公产品,到了最后,多半成为了工具箱里的工具之一,而非唯一。

但今天下判断,也为时尚早。

一个产品不需要统一所有人的工作方式才算成功。如果它能让一部分人——那些一个人干五个人的活、每天在软件之间当搬运工的「OPC」们,每天省出一个小时来做真正需要动脑子的事,那它就已经值得存在了。

对大多数普通人来说,一家公司的活如果全都一个人干,确实挺累的。

但 Floatboat 让人兴奋的地方在于,它给了一个人也可以是一家公司的从容和底气。

不是所有人都能 OPC,你至少首先需要台好「PC」。而 Floatboat 赌的,就是自己会成为那台 PC。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

专访 vivo 总裁胡柏山:AI 已经很聪明了,vivo 要让它真正看懂世界

作者 杜晨
2026年3月27日 12:00

今年春节,OpenClaw 火了。短短两个月不到,它又冷下去了——又一场 AI 应用层面的热闹。

热闹散了,没人知道下一个 OpenClaw 是谁,也没人知道这些东西究竟在解决什么问题。

用影像旗舰手机拍下一张夜景当中的人脸,细节清晰到能看见眼眶里的水光。但手机可能并不清楚,主角刚才是否哭泣,也就无法理解这张佳作的情绪背景;再用长焦技能把数百米外的一个路人拉到面前,细节纤毫毕现。但你问手机:这个人是着急赶路,还是在找什么东西?手机仍然不知道。

今天的 agent 能写代码、能操控网页、能把一份 PDF 整理成会议纪要。这些它都做得不错。但这些事情有一个共同点:处理的全是人类已经事先转好格式的信息。文件、数据库、网页,都是数字化过的世界。一旦面对物理世界,一扇门、一段动作、一个表情,它们是失明的。

从今天的大模型,到能真正读懂物理世界的所谓「具身智能」,中间有一道鸿沟,现在没有人说得清楚怎么填。

这道鸿沟,是胡柏山在博鳌亚洲论坛上花了最多时间讲的一件事。

胡柏山是 vivo 总裁兼首席运营官。在博鳌亚洲论坛,他告诉爱范儿,自己有一个很直接的判断:「在明确的物理大模型没有出来之前,要有好的体验,就要把物理世界的信息转化到数字世界。」

他相信,这件事,不仅手机可以做,而且应该用手机去做。甚至在未来十年里,其它设备都很难替代。

拼大脑,没有护城河

过去两年,几乎所有手机厂商都在说「AI 手机」。大模型接入、智能助手升级、端侧算力提升,这些能力以肉眼可见的速度在普及。

去年 DeepSeek 横空出世,今年 OpenClaw 引爆讨论,各家都在抢着把最新的模型能力塞进自己的产品。

这场军备竞赛,有一个必然的结局:大模型的高度商品化、同质化、可替代化。

拼模型能力,没有护城河。

你比友商快三个月上线某大模型,以及大模型驱动的 agent 功能;友商六个月后跟上,用的模型和 agent 能力都比你更强。时间上的领先、花费的金钱和精力,卷出的工时和损耗的员工健康,价值又是什么?

于是,真正的差异化只能在别处找。

vivo 给出的答案是「感知」。

感知,是 vivo 刚刚成立的新技术赛道。

中外互联网公司和手机品牌纷纷加速进军「AI 手机」。行业一度以为模型能力会成为手机厂商的护城河。

在胡柏山看来,实际并非如此。「相比模型而言,积累下来的场景数据才最有差异化。」紧接着他补了一句:「当然,该做还是要做,要做就找适合我们的,可以做慢一点,晚一点也 ok。」

当被问及「如果不看好大语言模型,vivo 会否发力世界模型」时,他的回答更加保守却又直接:「世界模型也很大。我们还是找适合我们的技术路径。我们先把手机模型搞好,小模型搞好。」

当今 AI / 互联网科技巨头大打人才争夺战,顶级研究精英如 NBA 巨星般抢手,转会费一再突破新高。但胡柏山并不认为 vivo 应该为这团火再添柴。他告诉爱范儿,先想清楚思路,看清方向,定好技术平台,再发力,完全不迟。

在这个所有人都在比拼模型能力和 AI 人才储备的时间点上,掌门人直接把 vivo 的优劣势与行动纲领展开在媒体面前。这种坦诚令人印象深刻:vivo 的稳健、谨慎, 究竟有何用意?

胡柏山回应称,vivo 从不回避竞争。相比模型、算力,未来最大的差异化是来自于场景数据。

场景数据,是跟着使用行为逐渐积累的,不能批发,不能抄近路——影像数据尤其如此。经过十年光学硬件积累、用真实场景训练出来的感知判断,没有捷径。

而这些积累与判断,构成了 vivo 接下来押注的「感知」的底层。这些东西,其他人(无论友商还是互联网/AI 公司)想要,也只能自己去积累。

这就回到了刚才那道鸿沟。大模型的训练数据是互联网信息,而这些信息已经被数字化。但现实世界里大多数有价值的信息,还没被数字化。那些无法或很难被转化,或者转化起来成本极高的数据,成为了 AI 走向现实世界的障碍。

光线、空间、人脸、动作、情绪,这些东西存在于物理世界,需要被感知、被转化,才能成为模型可以处理的输入。谁的感知做得好,谁就控制了大模型进入现实世界的那扇门。

现在,没有人知道这扇门后面是什么,也没有人知道最后会是谁站在那里。

押注「感知」

感知不只是「更好的相机」,这一点 vivo 很清楚。

胡柏山说,相机是记录工具,它等你按下快门。但感知是另一件事:持续观察、理解正在发生什么,把这些信息转化成设备可以直接使用的输入。7×24 小时,不需要你触发。

从「记录」到「感知」,中间隔着一个系统架构的重建。

胡柏山给这件事起了个名字:「感知一体」。字面意思,是感知到的信息和设备的决策系统要即时打通。这一点,现在还做不到。

难点在于,原始的感知场景数据,比如一段视频、一张图、麦克风收到的声音,体量巨大,格式混乱,里面大部分是噪声。把这些原始信号转化成手机真正「读得懂」的结构化信息,需要一整套专门的处理链路。

「怎么把场景数据转换成手机能够读懂的数据,是最难的。这个领域开源资源少,需要自主探索,」他说。

这也是为什么 vivo 在内部把感知设为一级技术赛道。

「一级」意味着感知不再是影像部门下面的一个子方向,它会统揽包括视、听、嗅、触等多种感官种类,和感知方向。

不过,vivo 的感知研究与研发工作仍处在初期阶段。胡柏山用 vivo 的通信研究院做了一个类比:大约 200 人的团队,从 4G 开始持续投入,走过 5G,现在在做 6G,已经十几年了。

对于感知赛道,他的预期是相似的节奏:小团队作战,先构建认知。认知清晰了,开始加油门;等待软硬件生态成熟了后,油门再往下踩。「有一种渐进式加速、螺旋上升的感觉。我们拒绝一脚油门一脚刹车。」

胡柏山不希望 vivo 做感知计算,以及做任何事情,出现拍脑门、砸大钱的做法。他认为,感知是一个天花板很高,但今天没人能说清楚正确的技术演进路线是什么的东西。「我们准备好用五年、十年的周期来持续投入。但我们对这件事的认知获取,要循序渐进。认知没到,砸钱都是烂尾工程。」

感知赛道是一个判断,但判断要落地,需要现成的积累。

vivo 的底牌是十年影像。具体看,这十年沉淀的东西有两层。 

第一层是硬件。与蔡司的合作,如今已经走到了联合研发的深水阶段,传感器尺寸这一轮 X300 Ultra 的主摄升到了 1/1.12 英寸,和索尼的合作在往提升半导体转化效率的方向走——他提到了感官技术方面的「雪崩效应」,一种可以把感光元件的进光转化率,从 90% 推到 110% 以上甚至更高的新技术路径。

在硬件层面,胡柏山的判断和行业观察者及媒体大致相同,传感器尺寸已经卷到了边际收益递减的阶段,接下来更大的空间在转化效率和外挂形态——在 X300 Ultra 上,vivo 已经做了 200mm、400mm 定焦增距镜,还有更多在路上。

第二层是算法和认知。

vivo 三年前提出长焦大底,两年后全行业跟上。但跟上硬件很容易,「为什么是那个时间点做这件事」,这个判断很难。vivo 为什么选择在那个时间点上做这件事,动机来自于在影像上多年领跑的经验所形成的认知——没有可以搬运和复制的捷径。

「算法跟认知强相关——认知知道要什么方向,算法匹配,这是需求和技术的有机结合,对手很难快速跟上。」

这个逻辑延伸到端侧 AI 上同样成立。在 X300 Ultra 上,vivo 首次提出了一种「多 agent」理念,也即:

你举起手机拍一张照片,有个 agent 在判断你在拍什么、用多远的焦段、在什么光线下——这个判断,以前需要用户自己去做。而另一个 agent 在整理你的相册,根据你过去的修图习惯推荐或自动添加滤镜,又或者它能自动把几段素材剪成一条可以直接发的短视频。

这不是那种统一的「超级 agent」,比如 Gemini 或豆包手机助手那样的,而是每个场景一个专项 agent,既互通有无,又各干各的。

胡柏山的理由很实际:现有的硬件算力撑不起一个什么都管的大 agent,手机AI的发展要结合硬件的能力上限来推进。

这些工作仰仗 vivo 在端侧 AI 推理上的持续投入。据爱范儿了解,vivo 是手机厂商当中目前在算力购买上花钱最多的——不仅是云端算力,接下来的押注方向,是在旗舰机上嵌入专用的算力芯片。

vivo 的节奏是:先把不要求实时响应的 agent 做好,影像和相册是当前优先级;全域感知是五到十年的目标,always-on、全时段在线、所有感官打通,这是最终的方向。

一切交给时间

今后十年的 vivo,会去往什么方向?

胡柏山给了一个大概的路线图:手机是现在用户的核心产品,往后至少 10 年也仍然不变;MR 需要三到四年;机器人是五年以上。

这三个方向不是各自独立的押注,底层是同一套感知能力在不同形态上的延伸。

vivo 去年成立了机器人 Lab,聚焦「大脑和眼睛」。当被问及目前进展如何,胡柏山很直接地摊牌:「2025年把阶段性目标梳理地更加清楚,2026年进入整个路径的清晰规划。」

但这对于 vivo 来说并不是问题。

在一个各家都在发布机器人样机、争相宣称「具身智能元年」的节点,承认自己还没手搓出实物,是一种不多见的坦诚。胡柏山说「手搓一个机器人不是我们要干的。」

vivo 的机器人逻辑,和感知赛道的投入逻辑是一套:先想清楚目标用户是谁,再定义场景,再识别核心技术控制点,再等技术成熟度到位。

胡柏山告诉爱范儿,目前 vivo 还在论证第一步。他们倾向于服务年轻人,这也正是 vivo 从旗舰到年轻系列产品线一直希望抢占心智的群体。vivo 的第一代家庭机器人,可能的起点,是照顾宠物和叠衣服也说不定。

但这个场景,会不会太小?胡柏山认为,不能一上来就做通用机器人,不可能刚一开始就把所有的场景都做好。如果你非要那么做,最终的结果也只能是每个场景都不及格。

诚然,今天的具身智能机器人,可能做预录制的舞蹈能做到一百分,其他场景都没有足够的说服力。特别是在家务场景,「就说打鸡蛋这件事,想要做到百分百成功率,人都不一定,机器人十年内也做不到。」

胡柏山希望,vivo 的机器人能够先把一件具体的事情做到 60-70 分,然后一代一代泛化,优化现有的场景,再获得新的能力。

喂好了宠物,场景数据就来了。场景数据够了,机器人就知道这只狗每天几点饿,进而知道这家人几点起床,进而知道这家人的生活节律。不需要一步到位,因为每一步都在为下一步备料。胡柏山管这叫「沿途下蛋」。

这个逻辑,和在手机端押注感知的逻辑,是统一的:先把影像 agent 做好,场景数据够了,感知能力才往外延伸。

但在机器人的旁边,手机扮演什么角色?「手机是最懂你的随身数字助理。你的行为习惯、偏好、你喜欢养什么宠物,都在手机里。」胡柏山说,机器人早期做不好的事,手机可以遥控介入补足。

就像自动驾驶的早期,人类一直在干预,干预产生数据,数据让系统越来越好。「手机和机器人之间,场景数据是打通的。」

当然,他也没有把话说满。感知这个赛道,其他人也在做。包括苹果、谷歌等在内都有自己的感知计算框架。vivo 在这个方向上的竞争空间,更多在手机端的小模型感知这个细分方向。这是除了苹果以外的大厂,暂时没有重点关注的地方。

今年,胡柏山给机器人 Lab 设的任务,是把路径图画出来:目标用户、核心场景、关键技术节点、以及「技术成熟到可以商业化」的时间预期。

vivo 叫停了 AI 眼镜项目。他算了一笔账:一年几十万台,不符合目标体量;两年内又做不出差异化;技术平台目前也撑不起 80 分以上的体验(超过 30g 戴在鼻子上会很累)——三个条件一个都没过,砍掉没毛病。

「三年后做也不着急,它不是关键品类。」

不过,这个决定放在今天的背景下,还是有点逆势。2025 年 AI 眼镜是行业里最热的新品类之一,这个事实有目共睹。Ray-Ban Meta 卖爆,国内跟进者一茬接一茬。

创始人兼 CEO 沈炜在年会上表示,vivo 今年的策略是「少押注,押重注」。vivo 选择给 AI 眼镜按下暂停键,但将感知赛道的存在地位升级,其实是统一的逻辑和筛选标准的一体两面:一个赛道的天花板够不够高、vivo 自身的差异化属性够不够、技术平台能不能支撑长期投入。

这种思路,与近期 OpenAI 等在内的硅谷巨头,摒弃「支线任务」,聚焦真正长板的思路不谋而合。

2026 年选定的道路,vivo 会走到哪,现在胡柏山也还给不出答案。感知一体化的技术难题还没有解,端侧专用芯片的落地有难度,机器人的路径图今年才刚开始画。

胡柏山知道这些,也没有回避。他说,认知到了加油门,认知没到宁可慢。

手机行业正在经历一个奇怪的时刻:换机周期拉长到四十个月,中国市场年销量从高峰期的五亿多部跌到现在约 2.5 亿部,存量市场的天花板清晰可见;但 AI 带来的能力跃升,又让所有人觉得什么地方似乎还藏着一点增量。

胡柏山的判断是,从 Smartphone(智能手机)到 Agent Phone(智能体手机),才是把存量市场变成增量市场的机会。而感知,是这个机会里他认为最难被复制的护城河。 

接下来交给时间。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

被 OpenClaw 选中的飞书 ,终于给出小白无痛养虾「版本答案」

作者 杜晨
2026年3月19日 19:28

2026 年 1 月,OpenClaw 席卷中文互联网。仅仅两个月后,龙虾已经进入了「全民卸载」周期。

龙虾的问题不是它不够强,而是它很难服务于每一个普通人。

从安装到卸载,第一批「养虾人」的故事,暴露了 OpenClaw 的尴尬:Agent 怎么能产生真正的生产力价值?

今天,飞书的新品发布会,想给每个人一个答案。

给每个人的智能伙伴

OpenClaw 爆火之后,有着开放、易用的机器人机制的飞书,也跟着走红了。

API 调用额度从 1 万次提到 5 万次,再到目前的 100 万次;3 月 5 日推出官方插件,让 Agent 可以直接读写飞书文档、日历和多维表格,把「养虾」的门槛从「会写代码」降到「会用飞书」。

这些动作,确实让龙虾更好养了。但 OpenClaw 本身的弊端,飞书仍然解决不了:配置复杂、普通用户上手门槛高、原生部署安全隐患大,等等。

结论是:Agent 要真正落地,必须是一个上手即用的智能伙伴。它的安全是基本线,更要能直接与每个人的工作流丝滑融合。

今天正式升级的 飞书 aily,就是飞书给出的答案。

飞书 aily 是什么?官方定位是「每个人的智能伙伴」。形态上,它以 Bot 的方式常驻在飞书联系人列表里,打开飞书就能找到,对话即交互。30 秒激活,零配置。

  • 飞书 aily 有长期记忆,会随着你的使用逐渐记住你负责什么业务、偏好怎么沟通、喜欢什么格式。
  • 它的权限与你的飞书账户完全一致——你能看什么文档,它就能操作什么文档,敏感操作需要你确认,所有动作全程可追溯。
  • 它还有官方认证的技能市场,经过安全扫描,可以按需安装。

可以说,飞书 aily 是 OpenClaw,或者更广泛定义上「龙虾」理念的一种呈现方式。但它又跟开源的原生版 OpenClaw 有着本质的区别:

龙虾是你自己养的宠物,飞书 aily 是公司给你配的同事,入职了,开权限了,准备好和你一起开始工作了。

对于需要处理更复杂工作流的用户,还有独立的飞书 aily 专业版(aily.feishu.cn),有图形界面,可以让有需求的开发者、公司 IT 管理员去构建多步骤的自动化任务。

接下来的实测,我们会聚焦在普通人更好用的 Bot 形态,但两者底层逻辑相同。

龙虾承诺的太多,其实 aily 就够了

把飞书 aily 放进了实际工作流里,我们测了几个最日常的用法。

先来一个极高频的场景:飞书拉会。

在任务过程中,飞书 aily 直接查询了 APPSO 组织架构内的用户 ID——这一步放在别的 AI 工具里根本做不到。它能做这件事,是因为统一的权限机制。你在飞书里能看到的,它就能看到。

确认了人、确认了时间,调用飞书日历技能,一个会议就建好了。

从任务发起,到创建完成,大约半分钟。不敢说比飞书达人手搓更快,至少主打一句话搞定。

让打工人感觉痛苦,但又不得不做的事情,做月报肯定算一个。

我们把自己的社媒平台数据,先上传到了飞书云盘,然后交给飞书 aily。提示词很简单:查找不同媒体平台数据生成多维表格;再跟员工汇报文档结合,生成一份团队月报。

它整理了一共 9 份不同格式的文件,交付了一份月度汇报,以及可以作为附件的多维表格——时间只用了不到 4 分钟。同样的工作,APPSO 去年还在纯手搓,要用至少两个小时。

顺便一提,如果你想从零搭一套数据追踪的业务系统,子产品飞书妙搭也支持用自然语言描述需求,直接生成一套业务系统应用。

不一定每次都用得上,但有飞书 aily 在,你知道自己不用再求人了。

接下来,我们再看一个相对更复杂、偏创作/生成向的任务,看看飞书 aily 作为自媒体搭子好不好用。

作为 APPSO 的深度报道作者,我会写很多晦涩难懂的文章,在社媒平台传播的时候就需要生成有针对性的、更浅显易懂的版本。

我们还是可以直接在飞书 app 里,通过设定好的机器人来发指令。不过,这个任务其实更适合用飞书 aily 的专业版来完成。有图形界面 (GUI) 的辅助,可以精细化输入和调整,还可以更方便地调用原生支持的各种工具、技能和插件。

飞书里直接搜索飞书 aily,或者打开 aily.feishu.cn,就进入到了专业版界面。

它支持用户上传自定义 skill。虽然官方技能库非常丰富,但我还是想上传一个我之前经常用的「content-creator」(内容创作者)技能。

装完 skill 之后,我们只需要在对话框里输入 /content-creator(具体的 skill 命令因人而异),就能唤醒它。再把文件链接给到,它就能开始帮我写稿去了。

这种技能/插件的调用方式,和 Claude Code、Cowork、OpenClaw 等产品相同,熟悉度拉满。

开始工作后,我们能够在后台看到,飞书 aily 先是做了一个 plan,将任务分解成 5 个步骤。

即便是不指名到具体的 skill 上,飞书 aily 仍然可以判断我的意图然后调用对应的技能来完成工作。

APPSO 在这里其实还做了 A/B 测试,激活或不激活技能,任务完成时间分别是一分半和三分钟——都不算特别久,但显然调用 skill 工作更快,而且利用技能写出来的感觉更好。

无论是各种官方还是第三方的 skill,飞书 aily 都能完美适配。不过这里 APPSO 还是建议大家不要在不熟悉的情况下乱装 skill,尽量以官方的技能商城为准。

工作完成后,点击右上角的工作区,能够查看生成的内容了。

三个场景测下来,有一个感受越来越清晰:飞书 aily 跟那些「AI 生成一个文件发给你」的工具,体验差异还是很明显的。它的交付物是文档、表格、任务,可以继续被协作、被引用、被追踪。

龙虾当初让大家兴奋的那个期待,其实一直都很具体:帮我做完一件费时、费力的小事,让我能腾出脑子去处理真正重要的东西,别让心流被一堆琐碎打断。飞书 aily 做到了这一点,龙虾没有。

当然,OpenClaw 有很多「出格」的操作,它还做不到:操控本地文件系统、执行任意命令等。但换一个角度,这种「克制」本身就是企业场景的必要条件。哪怕一个新实习生学历再高、能力再强、多有灵气,公司不会给 ta 配上服务器根权限——这很正常。

飞书本就是个强有力的生产力工具。飞书来做龙虾/agent,当然不是为了实现什么 AGI。在各种宏大的叙事之外,先让普通人的打工人生更轻松,才是更重要的。

飞书 aily 支持定时任务创建,交互比 OpenClaw 更轻松

Agent 落地企业,其实并不难

企业 Agent 的竞争,正在往一个很多人还没意识到的维度转移。

过去两年,行业的注意力主要在两件事上:模型能力(谁的参数更大、基准跑分更高),以及 C 端爆发(谁的 Agent 更酷、更会演示)。

OpenClaw 的火爆是这个逻辑的顶点——一个开源框架,凭借「能干活」的形象引爆全民。

但龙虾从爆火,到卸载,仅用了两个月就快走完了一个周期,里面有一个不能更朴素、更明显的道理:

「能干活」是必要条件,绝非充分条件。

Agent 要在企业环境里真正落地,需要的远不止一个会执行命令的 AI——它需要懂业务,需要匹配组织的权限构架,需要嵌入团队已有的工作流,而不是在旁边开一个新窗口,重新训练一个昂贵且笨的「实习生」。

诚然,中国绝大部分的工作发生在微信上——团队工作的本质是沟通,这个道理上过班的人基本都明白。但飞书、钉钉、企微的流行,从侧面证明了工作绝不仅仅是沟通那么简单。

聪明人在一起工作,沟通早已不是问题。聪明人开始发现,那些聪明人也不得不干的「笨事情」,才是效率提升的真正空间所在。

Agent 的上限,取决于它能「读懂」多少你的工作。但在工作的语境下,「读懂」并不意味着你要把自己的电脑交给它。

而读懂,靠的是上下文——你留下过的笔记,开过的会和会议纪要,跟谁在群里讨论过什么,哪些项目在推进,哪些决策已经做出。

这些东西,叫做企业上下文数据,其实正是一个商业机构运转的引擎。它不存在于模型里,也不能从网上抓取,它在企业内部的协作平台上,以消息、文档、日历、审批的形式慢慢沉淀,日积月累。

飞书沉淀这些东西,已经好几年了。

OpenClaw 爆火后,中文开发者自发聚集到飞书,原因很简单——Bot 创建不需要审批,不需要公网 IP,摩擦最少。社区发起人杨明锋在自己的分支里先实现了飞书扩展,2 月 4 日被官方合并。

把 OpenClaw 的门槛从「会写代码」降到「会用飞书」,是飞书能做的事,也是其他平台很难复制的动作。

飞书目前是 OpenClaw 官方唯一原生支持的中国 IM 软件

飞书大概率没有预料到这一切,但它一直在做的那套东西——足够开放、接口通畅、数据互通——恰好就是龙虾最需要的基础设施。

当在飞书中激活飞书 aily ,它读到的上下文,远比文档里的文字、表格里的数据更多。它知道这份文档是上周评审会讨论的结果,知道那个多维表格由哪个团队维护,知道@你的消息通常意味着什么优先级。

——这些,都是外部的 Agent 产品,难以复制的东西。你可以在后端接入强大的模型,可以用各种服务框架、插件、技能、hook 来强化体验。但你的工作记录,专属于你的公司、属于你的上下文,是不可被替换、很难被简单搬运走的。

竞争对手可以做出一个功能相近的 Agent,但它接入的只是空壳;而飞书 aily 面前的,是一个已经蓄满水的池塘。

这个逻辑延伸出去,还有一个更大的判断:企业 Agent 的竞争格局,最终将由「谁的地盘里的上下文最充裕」,而不是「谁的模型最强」来决定。

模型能力不是不重要,但模型的高度商品化,是既成事实;多年沉淀的上下文生态,才成了真正的护城河。

企业 Agent 时代的入口,应该是上下文最深的平台。飞书已经成为了这个入口。

钉钉有更大的用户基数,腾讯有 QQ 和微信的社交图谱,企业微信有腾讯的 B 端关系链。飞书的优势,在这三者里反而是最「纵深」的:它的用户群以科技、互联网和成长型企业为主,这批人对 AI 的接受度高,工作上下文的数字化程度也最高。

换句话说,飞书的地盘虽然不是最大的,但上下文密度可能是最高的。你在哪个平台留下了最多的工作痕迹,那个平台的 Agent 就最懂你。

究其根本,大多数人们对于龙虾的期待,并不能通过 OpenClaw 来解决。

两年后的办公 AI,会变成什么样子,没人知道。但至少今天的答案,就在工作已经在发生的地方,在飞书 aily 的身上。

飞书一直是对 agent 最友好的工作台,无论 AI 怎么进化,其实万变不离其宗。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌