阅读视图

发现新文章,点击刷新页面。

面壁智能 SuperMate 升级:智能座舱正在从语音助手走向端侧 Agent丨北京车展

智能座舱过去几年的变化,很大程度上是从屏幕和语音开始的。

更大的中控屏、更流畅的车机系统、更丰富的应用生态,以及可以控制空调、导航、音乐的语音助手,构成了上一阶段用户对智能座舱的主要感知。它们确实改善了车内体验,但本质上仍然是「人发出指令,系统完成任务」的交互逻辑。

进入大模型时代之后,汽车座舱开始出现新的变化。座舱不再只是一个车控入口,也不只是手机生态在车内的延伸,而是有机会成为一个能够理解场景、记住偏好、主动响应的智能空间。尤其是在端侧模型逐渐成熟之后,智能座舱正在从单一语音助手,走向更复杂的车载 Agent。

4 月 24 日,在第十九届北京国际汽车展览会上,面壁智能发布了 SuperMate 端侧智能座舱方案的全新升级版本,主要围绕全场景 Agent 服务、全模态交互能力和多芯片平台适配三个方向展开,并在车展现场提供了实车搭载体验。

如果说过去的智能座舱更强调「能做什么」,那么 SuperMate 此次升级试图回答的是另一个问题:座舱 AI 如何在合适的时间、以合适的方式介入用户的用车生活。

面壁智能对这次升级的描述,是让座舱 AI 从「好记性」进一步走向「真正懂你」。这背后涉及的不是单一能力,而是感知、记忆、推理和执行之间的闭环。车内 AI 需要知道用户是谁,记住他的偏好,理解当前的场景,再决定是否需要主动执行某个动作。

这也是座舱 Agent 和传统语音助手之间的区别。语音助手通常等待用户下达明确指令,而 Agent 更强调连续感知和主动服务。但在汽车这个场景中,主动并不意味着频繁打扰。相反,真正有价值的座舱智能,往往体现在一种有分寸的「无感」之中。

例如,SuperMate 基于量产级端侧多模态感知能力,可以在不依赖云端的情况下,完成「感知—记忆—推理—执行」的完整闭环。用户上车后,系统可以通过身份识别和多用户记忆自动加载个人偏好;行程中,当用户说出「去接孩子」这样的模糊指令时,系统可以结合历史习惯补全目的地并规划路线;在用车过程中,系统也可以根据环境和乘客状态,自动联动车窗、空调和座舱应用。

这些能力并不一定需要被用户明确感知。很多时候,用户感受到的可能只是温度更合适、路线更顺手、座舱状态更自然。对于车载 AI 来说,这种低打扰的体验,可能比单纯展示复杂功能更重要。

SuperMate 此次升级中,也强调了对车内关键人群的照护能力。比如系统可以实时识别儿童危险行为并进行自动介入,在识别儿童哭闹后联动车内环境进行安抚;也可以主动捕捉舱内外的高价值瞬间并自动保存。离车后,智能哨兵功能还可以持续监测周边环境,并在安全性和低功耗之间做动态平衡。

更具体的垂直场景,是事故处理 Agent。

按照面壁智能的介绍,当车辆发生事故时,SuperMate 可以实时识别事故状态,快速介入并安抚驾驶员情绪,同时引导用户完成现场处理流程。在定责、定损等更专业的环节,SuperMate 将调用面壁智能旗下道路交通事故陪伴智能助手「松果有理」的能力,为驾驶者提供处置建议和理赔指引。

这个功能将覆盖车机端和手机端,未来也会接入车载小艺和手机小艺平台。在车险理赔环节,面壁智能还将与太平保险共建车事故多智能体场景,并计划在太平保险北京分公司试点,尝试打通从事故识别到理赔服务的全链路智能化体验。

这类应用值得关注的地方在于它让座舱智能不再停留于娱乐、导航、车控等高频但相对轻量的场景,而是进入了事故处理、保险理赔这类低频但高压力的场景。对用户来说,事故发生后的情绪安抚、流程指引和专业建议,往往比日常功能更能体现 AI 的实际价值。

在交互能力上,SuperMate 此次升级也与面壁智能最新发布的 MiniCPM-o 4.5 全模态模型相关。

MiniCPM-o 4.5 具备原生全双工交互能力。简单来说,它在输出内容的同时,仍然可以持续感知视觉和听觉输入,不需要等待用户完整说完一句话之后再被动回应。这让座舱 AI 有机会从传统「一问一答」的回合制对话,进入更接近自然交流的状态。

对于车载场景而言,全双工和全模态能力的意义很直接。驾驶过程中,用户的注意力不可能完全交给车机系统,车内也会同时存在语音、动作、视线、车外环境等多种信息。座舱 AI 如果只能听懂一句明确指令,能做的事情就很有限;如果它能够同时理解语音、视觉和环境变化,就可以更自然地判断什么时候该回应,什么时候该保持安静。

面壁智能也在基于 MiniCPM-o 4.5 的全模态能力,与合作伙伴共同探索下一代智能座舱平台。这里的变化,不只是交互方式从语音走向多模态,更重要的是座舱 AI 的角色正在改变:它不再只是一个功能型助手,而是逐渐具备对驾驶环境、乘客状态、声音和视觉信号的持续理解能力。

车展现场,面壁智能还展示了 EmbodiedClaw。这是一套面向车载与具身场景的 Agent 运行与编排框架,作用是打通用户个人设备、车端算力、端侧模型和云端模型,让数据和任务可以在不同设备之间协同流转。

这背后有一个更长期的想象:汽车不只是行驶中的交通工具,也可以成为一个具备算力、传感器和个人数据入口的 AI 节点。尤其是在大量停放时间里,车辆是否可以继续处理任务、提供服务,甚至延伸出新的「离车价值」,会成为智能汽车下一阶段值得讨论的问题。

当然,要让这些能力真正上车,只有模型和场景是不够的。端侧 AI 面临的现实约束非常复杂,不同车型有不同的芯片平台、成本区间和功耗要求。一个方案如果只能运行在少数高算力车型上,就很难实现规模化普及。

因此,SuperMate 此次升级的另一项重点,是多芯片平台适配。面壁智能表示,SuperMate 已经完成对高通、联发科、英特尔、瑞芯微、英伟达、AMD 等主流芯片平台的适配,支持从轻量语音交互到全模态理解的多规格模型运行,以覆盖不同量产车型的配置梯度。

面壁智能还展示了与英特尔联合开发的 AI Box 解决方案。这一方案基于英特尔 Core Ultra 系列平台,官方称可提供最高 180 TOPS 稠密 AI 算力,并适配面壁智能 MiniCPM 全系模型。它的意义在于,为大模型在车端本地运行提供了新的硬件载体,也让部分车型可以通过 AI Box 的方式获得端侧算力能力。

目前,SuperMate 已经在吉利、长安马自达等车企的多款量产车型中实现搭载交付。面壁智能 CEO 李大海在车展期间表示,预计到 2026 年底,将有 30 万辆汽车搭载面壁的端侧模型。

除了产品发布,面壁智能还联合清华大学车辆与运载学院、中国汽车报共同发布了《智能座舱:定义 AGI 时代的汽车新范式》白皮书,围绕端侧 AI 在智能座舱领域的技术路线、场景方法论和产业趋势进行梳理,并举办了专题研讨会。

从行业角度看,SuperMate 的升级反映了智能座舱正在发生的一条清晰路径:从车机系统,到语音交互;从语音助手,到多模态模型;再从单点功能,走向能够理解场景和主动执行任务的座舱 Agent。

这条路径并不意味着所有功能都会迅速成熟。车载场景对稳定性、安全性、隐私保护和功耗控制都有更高要求,端侧模型能否在真实量产环境中长期稳定运行,也需要更多车型和用户规模验证。尤其是主动服务类功能,既要足够聪明,也要足够克制。否则,智能很容易变成另一种形式的打扰。

但趋势已经比较明确。汽车正在从一个移动空间,逐渐变成一个由传感器、算力、模型和用户数据共同构成的智能终端。座舱也不再只是驾驶员和车辆之间的操作界面,而是用户生活、出行和数字服务之间的连接点。

面壁智能 SuperMate 此次升级的意义,正在于它把端侧大模型、全模态交互、车载 Agent 和产业适配放在了同一个框架中。对车企而言,这是一套面向量产的智能座舱方案;对用户而言,它最终要回答的仍然是一个很朴素的问题:车能不能更懂我,并且在我真正需要的时候,少一点复杂操作,多一点恰到好处的帮助。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

腾讯发布了 7 个座舱智能体,汽车的意义从「空间位移」走向了「时间价值」丨北京车展


1975 年,位于美国亚利桑那州 Sierra Vista 的麦当劳开创了一种新的取餐模式:顾客驾车进入购餐车道,不需要下车就可以进行点餐、付款、拿取产品,之后驾车驶离购餐车道。

这就是麦当劳(drive-through)得来速服务。对于开车的上班族来说,在不下车的前提下花几十秒就能买到早餐是一种如德芙般丝滑的体验。因为需要专用车道和专用窗口建设,所以目前国内有得来速服务的麦当劳门店也仅有 300 家左右,这种丝滑体验并不多见。

但实际上,店,路,车,人这几个要素如果能够联系得更聪明更紧密,「得来速」服务其实可以无限复制,这就是腾讯出行要做的事情。

北京车展前夕的 2026 TIME DAY·腾讯智慧出行技术开放日上,腾讯出行发布了「随行点单智能体」,在通勤场景里,用户可以通过语音和 AI 助手交流,在结合用户的偏好记忆与实时行程偏好的前提下,系统理解用户意图,筛选最优门店,然后根据车辆实时 ETA(Estimated Time of Arrival,预计到达时间)反向推算出餐时间,确保用户到达时餐品刚好新鲜出炉。取餐时,订单能够直接关联车牌,专人送餐到车,全程无须下车。

另外,这个智能体还可以打通品牌账户,自动领券、用券,保证价格最优,当然作为腾讯的服务,打通微信支付也不在话下,最终实现选品、下单到取餐的完整闭环。

这就是 AI 智能体加持下的「得来速 Ultra」体验。

这样的智能体,腾讯智慧出行有 7 个

「随行点单智能体」展示的其实是一种把汽车与现实世界服务链路重新编排的能力,是一个点的话,那么这次 2026 TIME DAY·腾讯智慧出行技术开放日展示的由点及面汽车座舱智能体能力。

换句话说,就是腾讯出行试图回答「汽车里应该出现什么样的智能体」这个问题,为此,腾讯这次发布和升级的智能体,有 7 个。

必须要给智能体祛魅的是,诸多智能体做的事情往往不是从零到一,因为就像「随行点单智能体」实现的功能,在零零散散的设备上,繁繁杂杂的沟通中,也能完成个七八成,但体验会割裂。

所以,在腾讯的定义里,智能体肯定不是传统意义上的车机功能堆砌,也不是把一堆小程序简单搬进中控屏。他们想做的是围绕真实出行场景,重新把信息、服务、支付、导航、内容乃至手机与车机之间的关系组织了一遍。

在这个大前提下,我们就可以再来看这七类座舱智能体:随行点单、随行向导、随行逛逛、随行互连、车载娱乐生活、车主服务,以及导航场景智能体。它们覆盖的,正是通勤、长途、本地游、手机车机联动、娱乐消费和能源补给这些最常见、也最容易让人感到麻烦的环节。

长途场景里的「随行向导智能体」,就不只是「给你讲讲沿途景点」这么简单,它能结合实时位置和用户偏好,主动推送沿途资讯、景点介绍、攻略和服务信息,还能把跨车的实时语音群聊与位置共享组织起来,让车队中的 AI 从「解说员」升级成「领队」。

「随行逛逛智能体」则更像是把到一个城市临时起意想转转这件事做成了轻负担服务。过去这类需求最麻烦的地方不是找不到信息,是信息太多:小红书,马蜂窝等等平台上的攻略,路线纷繁复杂,选路线买门票订餐厅等等工作一琢磨就是一个不眠之夜,这种负担和随便逛逛的预期恰好背道而驰。所以这个智能体把导航、停车、步行接驳、购票订座和手机续接整合进一条链路里,本质上是在缩短「我想去」和「我真的去了」之间的距离。

「随行互连智能体」弥合了车上车下两个世界的裂隙。用户可以在微信里,用自然语言给 CarBot 下一个跨时段、跨条件触发的复杂任务,比如很多用户的用车习惯是 A 需求 B 动作 C 爱好一连串的且日常循环的,上车之后再一一调试,只有人工没有智能。但是在随行互连智能体里,直接在微信里说话,给 CarBot 下需求说「乘客上车后打开座椅按摩,播放欢迎语,并将车载微信设置为隐私模式」,CarBot 就会自动拆解需求和任务,再接着判断出副驾座椅被占用,自动执行以上一连串的任务。

这里最关键的变化,是交互入口不再局限于车机本身,借助微信这样一个更高频、更熟悉的容器,把任务延伸到用户的连续生活里。

至于车载娱乐生活智能体和车主服务智能体,它们看上去没有前几个那么新奇,不过是触手可及且高频次的。前者的重点是让音乐、新闻、视频、短剧等不同内容 Agent 协同响应,依据时间、行程状态和历史偏好去「编排陪伴」;后者则把加油、充电、洗车、救援、代泊等车主服务组织成一个可被统一调用的服务矩阵,系统甚至能依据油量、目的地、停车条件等信号主动预判需求。

地图本身就是最天然的出行入口,但过去地图理解的是道路,不太理解人。现在腾讯出行在强调的,是把「找一家能充电不排队的咖啡店」「避开高速顺路吃饭」这种混合意图一次性拆解成偏好理解、路径规划和服务编排的问题。

导航场景智能体开始从「告诉你怎么走」,变成「理解你为什么要这样走」。

一言蔽之,这 7 个智能体开始把汽车看成一个持续理解场景、调用资源、完成任务的「执行节点」,当然,汽车还是汽车,它依旧可以跑起来,载着用户前往目的地。

或者可以反过来说,这些智能体做的工作不是「从零到一」,创造过往不存在的功能,制造过往没想到的体验,而是有点像「从一到零」:未来汽车里的智能,体现为它能替你少做多少次决策、少切多少次界面、少消耗多少注意力,并非体现打开多少个入口。

汽车不仅要承载「空间位移」,还要思考「时间的意义」

早年的手机本质上是「移动电话」,电话和短信几乎就是它存在的全部意义。今天我们手上的「智能手机」,真正被高频使用的往往是社交、拍照、支付、导航、短视频、外卖和各种各样的内容服务,这正是腾讯崛起成为大型互联网和科技企业的前提。智能手机里的电话和短信没有消失,并且依旧是决定这个设备是手机,还有可联网小平板的分水岭,但这两个功能已经占据不了多少用户的使用时长了。手机仍然是手机,只是它的内涵早就不再等于「打电话的工具」了。

汽车也正在经历类似的时刻。

当然,汽车的「空间位移」价值不会像电话和短信在手机里那样被边缘化。人买车、坐车、开车,首先仍然是为了从 A 点抵达 B 点,这个基本属性不会变。

问题在于,当电动化和智能化把「开起来快」和「坐起来舒服」这些指标逐步拉平之后,行业的思考势必会转向新的问题:用户在车里的时间,究竟能不能变得更有价值。

汽车未来的发展方向,除了继续服务于空间的移动,还要开始放大时间的价值。

今天越来越多车企和科技公司开始讨论「第三空间」「移动生活」「在途体验」这类概念。因为中国用户每天通勤、接送孩子、周末短途、节假日长途,自驾已经占据了大量生活时间,更别说大城市还有节假日的拥堵时间了。过去这些时间往往是被默认浪费掉的:堵车时烦躁、等人时发呆、找车位时焦虑、长途时疲惫、多人出行时混乱。

过往汽车智能化的能力还不够,车企的用户思维和制造业背景也很难去思考「时间」对于汽车的意义,现在端云两边的算力,各种模型的能力,互联网和科技企业对各种设备的渗透,汽车行业的自我迭代速度,多种因素叠加,终于有机会让行业思考时间的价值了。

过去的三五年时间里,汽车行业对这个问题也有初步的思考,解题思路统一成了「冰箱彩电大沙发,加长加大更像家」,伴随的硬件变化就是屏幕更大,算力更强,喇叭更多,沙发更软……

现在,非要上一些价值的话,腾讯这次发布的一系列座舱智能体解决的问题当然不是本不该他们思考的「车能不能开」,这次要回答的是「人在车里这段时间应该怎样被服务」。

通勤路上,它可以帮你提前点单,让早餐成为一种被安排妥当的节奏;到陌生城市,它可以把攻略、停车、步行接驳和门票串起来,把原本碎片化的决策成本吸收掉;甚至在内容场景里,它也不只是「放点什么」,新的任务是试图依据环境、时段和心境,把陪伴做得更贴合……

当年的智能手机,之所以最后重塑了人的日常生活,是因为它把「打电话」这件事做到了极致吗?是因为它让原本大量无意义的碎片时间被重新利用了。吃饭排队等位时开一把《王者荣耀》、通勤时听一听知识播客,坐飞机无网时看一看缓存的电影,智能手机把这些过去无法承载复杂行为的时间,全部变成了可消费、可连接、可完成任务的时间片。

汽车的逻辑并不完全一样,但方向大差不差,把用户从 A 点带到 B 点的「空间位移」功能依旧会往更快更安全更舒适的方向走,而在 AB 之间的这段时间,甚至是 A 之前,B 之后的时间,汽车也终于有机会去好好重构了。

为什么这事儿适合腾讯来做?

只要多看看几场现在的汽车发布会,其实会发现大模型、Agent、车机、生态、服务闭环这些词也不新鲜了,先 PPT 发布,再 OTA 更新是行业常态。做智能体,上大模型一旦离开 PPT,马上就会面对实的问题:能调动多少资源,又能把多少链路真的打通?

腾讯的服务和智能手机的耦合程度不需要多说,在汽车行业,它也已经不是一个旁观者,身份已经是一个基础设施提供者。按腾讯披露的数据,其出行服务目前已经覆盖 100% 的头部车企和泛出行公司,与超过 100 家车企、出行科技公司展开合作,并与 40 多家车企在 AI 领域落地合作;智能座舱解决方案在头部车企中的渗透率超过 80%,累计搭载超过 1800 万辆车。

腾讯没有从零开始谈「智能体上车」,因为它有这大量量产合作关系、云服务能力和既有车载产品,「智能体上车」是一个更进一步的事情。

前面之所以先聊 7 个智能体,是因为这些智能体可以提供的服务是 ToC 用户可以直接感受的,但腾讯这次发布的,更官方的说法,或者更 ToB 的说法,是「出行全场景智能体开放平台」。

腾讯想做是提供一整套从底层大模型架构、到平台工具、再到应用生态的能力框架。这个平台涵盖基础设施层、平台工具层与应用生态层:底层是端云协同的大模型架构和原子能力,中间是 Agent 编排、Skill 扩展和运营工具,上层则是围绕真实场景构建的智能体矩阵。

打个比方,砸向牛顿的苹果不是凭空出现的,而是挂在树上的,树有根茎枝叶花,而后才有果子,当我们看到作为消费者可以用到的 7 个智能体果实的时候,其实是因为腾讯准备了根茎枝叶花这些基础设施。

腾讯既有云,也有地图;既有内容,也有支付;既有社交入口,也有小程序生态。很多公司也许能做出一个聪明的车内助手,但很难把任务真正执行下去。腾讯手里的微信、微信支付、腾讯地图、内容生态,以及小程序能力,天然更适合把「理解意图」推进到「完成服务」这一层。

随行点单能做成闭环,随行互连能把微信对话变成车端任务,导航能和目的地服务串起来,本质上都依赖这种跨生态调度能力。

再往下一层看,腾讯这次也强调了它的端云协同架构:端侧基于 0.8B 轻量化 VLM 与座舱世界模型,单帧编码延迟低于 100 毫秒;云端则承载更复杂的语义理解、记忆检索和内容生成,单意图识别能力超过 95%,多意图识别能力超过 90%。这些能力才能满足既要快,又要准;既要弱网可用,又要有复杂推理;既要本地响应,又要持续进化的需求。

所谓善战者无赫赫之功,腾讯做出行全场景智能体开放平台的前提,还是它不需要整车厂那样必须把一切都封闭在自己的品牌宇宙里,因为在这个行业里,它的角色「连接者」。这没法让它拥有一个像兰博基尼劳斯莱斯这样的汽车品牌形象,反而让它更适合做智能体时代的基础层和中间层。毕竟智能体能力最需要的,是腾讯过往多年构建的既 ToB 又 ToC 的全栈服务能力。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Floatboat 体验:一个人的公司,只需要一个办公软件

过去两年,我们每天都在做同一件事:学习和进修「提示词工程」这门玄学。

找 AI 干活,总要像个碎碎念的甲方一样,交代八百字背景,像是在哄一个智商奇高、但每天都会间歇性失忆的实习生。

这让我想起在游戏里,施展出必杀技之前,总是会有一个类似「前摇」或者「吟唱」的过程。某种程度上,写提示词,提供上下文,上传各种文件等等……就是使用 AI 的「前摇」。

不是说用户每次都要做到极致,只是如果你能给足这些前置条件的话,AI 会做的更好。

不过,前段时间 APPSO 在中关村的一场线下聚会看到了一个还在测试中的 AI 办公产品——它很大程度上摒弃了对「前摇」的依赖。

产品名字叫 Floatboat。

Floatboat 的联合创始人兼 CEO 少卿走到台上,打开 Floatboat,选中一个文件夹,里有一个 CSV 表格,是一份参加本次活动的嘉宾名单。他在旁边的 AI 对话框里说了一句:生成邀请函。

过了一会,每位嘉宾的邀请函都出现了。

到这里为止都还好,把表格丢给 ChatGPT、Claude、WorkBuddy、悟空………任何一个今天的 AI,写一句指令,大概率也能做到差不多的事情——但接下来发生的,让我愣了一下。

有一位新嘉宾确认出席了,少卿说,「在表里更新一下」。

CSV 更新了;紧接着,一封新的邀请函也自动生成了。

我坐在那里花了两秒钟,试图理解刚刚发生了什么:

Floatboat 它知道这份表格和邀请函之间,知道「更新表格」和「生成邀请函」两个动作之间,是有关系的。所以少卿只说了前半句,后半句没说出来,它自己悟出来了。

AI 不再是等待指令的工具,变得越来越积极、主动,会动脑子,像一个一直给你打下手的小朋友,你说「更新一下」,他知道你的意思。

这个瞬间让我开始认真看这个产品。

简单,但又无法简单定义的产品

Floatboat 是什么?我试着给它一个定义,发现很困难。

它有一个长得像 macOS Finder 的文件管理器,你可以浏览本地文件、打开 iCloud Drive;文件格式支持得很全,Markdown、CSV、Excel、Word、图片、视频,都能直接预览,甚至编辑;

它有一个内置浏览器,可以打开任何网页,甚至可以让 Agent 去操作这些网页;

它有一个 AI 对话界面,底层可以接 Gemini 或其他模型。这么看来它有点像 Claude 的桌面端,但又比 Cowork 多一些更直观的操作逻辑。

这三个东西,文件、浏览器、对话,以面板的形式并排在一起,可以随意拖拽组合,最多四栏并排。

你在浏览器里看到一张有用的图,可以直接拖到本地文件夹里保存;你让 AI 生成了一份报告,报告会直接写入本地文件,以 .md 或 .docx 格式保存,并且你可以直接编辑这些文件,不需要 cmd-c 再 cmd-v 到另一个地方。

信息从各个方向流进这个环境里,加工过的内容也能流出去,不会被锁死在某一个面板里。

所以 Floatboat 到底是什么?是文件管理器?是浏览器?是 AI 聊天工具?是氛围编程环境?

它都是,又不完全是。

在 Floatboat 出现之前,我们其实一直在做不同软件之间的「人肉 API」,每天按几百次复制粘贴,打开不同的软件或浏览器窗口、编辑不同的文件。

在 AI 世代在线办公的我们,成了在窗口与窗口之间疲于奔命的赛博搬运工。

而 Floatboat 打破了软件之间的墙,让所有的窗口都能共享同一份上下文。

开发团队给产品的定义是「工作环境」而非「AI 助手」。助手是你要求它才动的,工作环境是一直在那里的,你在里面做事,它一边帮你做事一边观察和学习。

在沟通会上,有人问少卿:一句话形容你们的产品?

少卿反问:你能一句话形容 ChatGPT 吗?

大家会心一笑。我觉得他说的有道理。有些东西确实不是一句话能装下的,除非你做的是一个非常垂直的工具。Floatboat 显然不打算做垂直。

做科技记者这些年,我经历过好几代这样的产品。最早是电子邮件加 Office 套件的时代,后来是各种 OA 系统,再后来钉钉来了、飞书来了、Slack 来了。

每一代都有一个产品,或者一类产品,它们有着同一句潜台词,对你发出强有力的暗示或者明示:上班,用我就够了。

而在 AI 时代,Floatboat 想要成为这个角色。

这么说不是在拔高它。恰恰相反,这个位置历史上从来没有人真正坐稳过。飞书解决了团队协同,但文档操作仍然需要 Office 套件。钉钉把审批这个工作做到了极致,但打工人私下用微信聊工作的习惯从来没变过。

「一统江湖」这件事,每一代都有产品在尝试,但从来没人真的实现过。

原因是结构性的:这类产品想要成功,需要整个组织一起换过来。而组织的惯性,是所有惯性里面最大的。你一个人觉得飞书好没用,你的团队、你的客户、你的供应商都得觉得好才行。

Floatboat 的策略有一个不同:它不面向组织,它面向个人。

这个产品的目标人群,也正是时下最流行的概念:OPC,全称 One Person Company/一人公司。

过去一年 AI 能力的跃进,让 OPC 这个前两年的口号,逐渐变得越来越现实和可行。一个人,加上三五个 agent, 几乎可以对等一个小的草创阶段的业务和支持团队。无论是自媒体内容创作者,从选题到写稿到排版到分发,还是电商业务,从选品到上架到客服到投流,都已经够用了。

Floatboat 希望能够打动这群人。在 APPSO 的体验中,我们测试了包括内容创作、数据科学等场景,也测试了外部工具接入(例如 Slackbot)等多种场景。对于内容、营销、数据分析、客服等类型的工作,Floatboat 都达到了我们的期待。

现在 AI 产品有两种设计哲学。一种是「你放手,我来」,把用户推到后座上去,Agent 全权接管,跑完了给你看结果。另一种是「你干活,我在旁边」,成为用户的副驾,在适当的时候递工具、提建议。

Floatboat 更接近后者,但又不全是。用 Floatboat 工作,我的体验是:跟 AI 在主驾副驾之间来回切换,畅快自如。

用了一段时间之后,我觉得 Floatboat 的主张是行得通的。至少在现在这个阶段,大多数人对 AI 的信任还没到「你尽管干,我不用看」的程度。你让一个打工人把整份方案交给 AI 自己跑,他会焦虑的睡不着觉……

但如果 AI 是在他的屏幕上、在他的文件夹旁边干活,他看得见过程,能随时纠正,那他会比较安心。

这也是为什么 Floatboat 的界面设计那么像一台传统电脑的桌面,把文件管理器、对话框、浏览器/编辑器都拉出来让你一览无遗:已经认识的东西,能够降低用户对一个新事物的戒备心,提高接受度。

一边工作、一边蒸馏工作

然后再说 Floatboat 做的一个叫 Combo 的功能。

Combo 可以是一个复杂的 skill,也可以是多个 skill 的组合。而在工作的逻辑里,就是把一套工作流打包成一个可复用的操作。

Floatboat 内置了从工作成果中「蒸馏」 combo 的能力——这其实很像 Anthropic 官方的 skill-creator(本身也是一个 skill)。

比如你每周都要做一件事:从网上抓几篇行业报告,提炼摘要,整理成 Markdown 文档,然后推送到 Notion。你第一次在 Floatboat 里手动跟 Agent 对话完成了这套流程之后,对话框下方会出现一个按钮,问你要不要把这轮操作存成一个 Combo。

或者你也可以主动跟 Floatboat 说,「把我们目前的工作里面的方式、思考、逻辑,整理为一个 skill」。

当下次遇到类似任务的时候,Floatboat 会自动把这个 Combo 推荐给你,一键启动。

这里面我觉得最有意思的一点是:你不需要事先「设计」工作流,只需要正常干活就行了。一边干着,一边 Floatboat 就会自己把你的工作习惯、操作方法等「蒸馏」出来,沉淀出一份指导思想。

少卿告诉 APPSO,Combo 能力的设计,是为了实现今天的绝大部分用户对于 agent 产品的那个核心期待:自进化。

「当 agent 能够感知你 80% 的操作的时候,它就有自进化的能力了」,Combo 的自动沉淀机制就是在做这件事的第一步。

兜售「提示词」的时代,快要结束了。你不再需要像个魔法师一样去背诵枯燥的咒语,把提示词保存在一个专门的文件夹或者 AI 工具的后台。通过 Combo,Floatboat 可以让用户把他们每天最经常做的固定动作,提炼成独属于自己的「手艺」和数字资产。

当然,Floatboat 也做了一个 Combo 市场,你做的好用的 Combo 可以上传,别人做的也可以下载。官方也提供了一些现成的。

但这个 Combo 体系仍有不足。

任何一个号称能够一统江湖的办公软件,号称「越用越懂你」的 AI 系统,都仍然存在冷启动的障碍:就好比 Google Docs 的初始简历模板虽然很全很好,但仍然需要每一个求职者去调整修改以适合自己。

Combo 的自动沉淀机制,逻辑上是说得通的:你用得越多,它学得越好,推荐的工作流越贴合你。但这有一个前提:你需要先投入时间从零教它,而大多数人没有这个耐心,他们希望拿来就能用。

作为一位媒体编辑,我的日常工作是阅读大量资料、跟作者沟通选题、改稿子、偶尔自己写长文。这些工作的颗粒度很细,上下文很碎,跟官方预设的那些模板(更偏向标准化的报告生成、数据整理之类)对不上。

在我的具体使用中,我将几种不同的内容生产路径保存成了不同的 Combo:针对外部新闻的快速反应是一种,基于采访 Q&A 提纲的撰写是一种,针对复杂课题的调研、资料的编排、然后进行原创写作,又是另一种。

当然,这不是 Combo 本身的问题。对于绝大多数人,无论他们的工作是文档写作、报表处理、ppt 写作,还是数据整理、行政工作,甚至更加复杂的「一人开发者+marketer+客服」,无论是自己生产 Combo,还是在 Floatboat 的官方 combo 基础上做微调,都足够好用。

AI 工具不是一切工作的万灵药——一个工具把自己宣传得再美好,今天的用户也应该有这样的觉悟。对于 Floatboat,正如前面所说的,它是「工作环境」,它的能力足以强化人,但它的工作效果仍然取决于人。

然后再说说用 Floatboat 和其他「类 Cowork」产品的区别:最大的明显感受,是 Floatboat 的工作流程很快。以文件操作、内容生成为例,在 Gemini 3.1 Pro 模型驱动下的 Floatboat,对文件进行操作(批量重命名/修改格式、填充 markdown 等)的用时,是我平时用 Cowork/Claude Code CLI 的三分之一左右。

Gemini 在「讨好用户」上也是老演员了,所以最近 Floatboat 也加入了 Claude 两个最新版模型,Sonnet 和 Opus 4.6 的支持。

Gemini 对于 Floatboat 主打的大多数办公场景(文案生成、表格处理、信息整理)来说够用,写作效果也还算不错;如果不符合你偏好的话,切到 Claude 模型也没问题。如果你注意到 Floatboat 的迎合意图太强,可以在工作过程中时不时强调一下,不要一味迎合,要对生成的结果,甚至用户的输入做批判性的思考。

以及,你也可以充分利用 Combo 生成的功能,将这些技巧写进 Floatboat 的核心指导思想。

另外一个小设计值得提一句:Floatboat 可以集成到飞书和 Telegram 里,你不打开它的客户端,直接在聊天工具里给它发消息,它就在后台帮你执行任务——这个功能叫 Claw 模式,相信足够你顾名思义了。

 

除了产品本身,Floatboat 团队还在做一件更远的事。

他们开源了一个协议叫 Selfware,核心理念用一句话说就是:A file is an app。

这是什么意思?现在你用 AI 辛辛苦苦做了一份调研报告,发给同事,他收到的是一个 Word 文档或者 .md 文件。文件里有最终结果,但你当时调用了哪些资料、AI 跑了什么逻辑、中间修改了几次、为什么改,这些对于工作最关键的经验,并没有被保存下来。

Selfware 想解决的就是这件事。一个 .self 格式的文件,里面不只有数据,还携带逻辑和结构。你的同事收到之后,可以直接打开、继续编辑、让 Agent 沿着你的思路往下跑。文件自带了工作环境。

这个想法,和目前 AI 开发圈里对 CLAUDE/SKILL.md、cursor rules 这类文件的热情, 属于同一个潮流。大家都在发现,文本文件可以用来「编程」AI 的行为,一个 .md 文件可以定义一个 Agent 的人格、工作方式、输出风格。

但 Selfware 往前又多走了一步:那些 .md 文件是指令,你告诉 Agent 怎么做;Selfware 想做执行单元,文件本身就能运行,而且不依赖于特定平台。

这其实有点像 Jupyter Notebook,把代码、数据、输出打包在一起了;也类似于 Docker,把运行环境做成了可分发的单元——Selfware 把场景换成了 Agent 协作。它不是从零发明的概念,但在 Agent 时代重新提出,确实切中了一个真实的痛点。

不过,协议这种东西,最终看的是采用率。现在 Selfware 主要在 Floatboat 自己的生态里运转。「A file is an app」是个有趣的理念,但从理念到被广泛采用的标准,中间路还很远。

另外值得提一句的是 IACT (Inline Action-Clicked Text),Floatboat 开源的另一个协议。它做的事情更小但很实际:在 Markdown 语法的基础上,直接在 AI 对话生成结果加上可点击的行内 (in-line) 链接/按钮。生成结果中的「可行动内容」将会自动套上这个按钮,用户直接点击就行了。

这个交互改进看着不起眼,用起来确实减少了摩擦。最早做类似体验的应该是 Claude,但 Claude 的很多「好东西」都是闭源的。Floatboat 把 IACT 开源,让其它产品也可以充分利用。

现在一些同类产品比如 WorkBuddy 也在做类似的东西了,但据我了解 Floatboat 是最先提出这个概念并把它协议化的。

工作起来,开心最重要

Floatboat 的名字来自一句英语俗语,whatever floats your boat,大概的意思是「你开心就好」。

少卿说,他们希望产品给人一种在 AI 时代悬浮起来的感觉,不被裹挟着走。

这个愿景挺好的。但 Floatboat 能不能成为这个时代的那个「用我就够了」的产品?老实讲,APPSO 仍然没法给出一个明确的判断。

毕竟大家都看到了:每一代尝试做这件事的办公产品,到了最后,多半成为了工具箱里的工具之一,而非唯一。

但今天下判断,也为时尚早。

一个产品不需要统一所有人的工作方式才算成功。如果它能让一部分人——那些一个人干五个人的活、每天在软件之间当搬运工的「OPC」们,每天省出一个小时来做真正需要动脑子的事,那它就已经值得存在了。

对大多数普通人来说,一家公司的活如果全都一个人干,确实挺累的。

但 Floatboat 让人兴奋的地方在于,它给了一个人也可以是一家公司的从容和底气。

不是所有人都能 OPC,你至少首先需要台好「PC」。而 Floatboat 赌的,就是自己会成为那台 PC。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌