普通视图

发现新文章,点击刷新页面。
昨天以前首页

腾讯发布了 7 个座舱智能体,汽车的意义从「空间位移」走向了「时间价值」丨北京车展

作者 刘学文
2026年4月24日 17:19


1975 年,位于美国亚利桑那州 Sierra Vista 的麦当劳开创了一种新的取餐模式:顾客驾车进入购餐车道,不需要下车就可以进行点餐、付款、拿取产品,之后驾车驶离购餐车道。

这就是麦当劳(drive-through)得来速服务。对于开车的上班族来说,在不下车的前提下花几十秒就能买到早餐是一种如德芙般丝滑的体验。因为需要专用车道和专用窗口建设,所以目前国内有得来速服务的麦当劳门店也仅有 300 家左右,这种丝滑体验并不多见。

但实际上,店,路,车,人这几个要素如果能够联系得更聪明更紧密,「得来速」服务其实可以无限复制,这就是腾讯出行要做的事情。

北京车展前夕的 2026 TIME DAY·腾讯智慧出行技术开放日上,腾讯出行发布了「随行点单智能体」,在通勤场景里,用户可以通过语音和 AI 助手交流,在结合用户的偏好记忆与实时行程偏好的前提下,系统理解用户意图,筛选最优门店,然后根据车辆实时 ETA(Estimated Time of Arrival,预计到达时间)反向推算出餐时间,确保用户到达时餐品刚好新鲜出炉。取餐时,订单能够直接关联车牌,专人送餐到车,全程无须下车。

另外,这个智能体还可以打通品牌账户,自动领券、用券,保证价格最优,当然作为腾讯的服务,打通微信支付也不在话下,最终实现选品、下单到取餐的完整闭环。

这就是 AI 智能体加持下的「得来速 Ultra」体验。

这样的智能体,腾讯智慧出行有 7 个

「随行点单智能体」展示的其实是一种把汽车与现实世界服务链路重新编排的能力,是一个点的话,那么这次 2026 TIME DAY·腾讯智慧出行技术开放日展示的由点及面汽车座舱智能体能力。

换句话说,就是腾讯出行试图回答「汽车里应该出现什么样的智能体」这个问题,为此,腾讯这次发布和升级的智能体,有 7 个。

必须要给智能体祛魅的是,诸多智能体做的事情往往不是从零到一,因为就像「随行点单智能体」实现的功能,在零零散散的设备上,繁繁杂杂的沟通中,也能完成个七八成,但体验会割裂。

所以,在腾讯的定义里,智能体肯定不是传统意义上的车机功能堆砌,也不是把一堆小程序简单搬进中控屏。他们想做的是围绕真实出行场景,重新把信息、服务、支付、导航、内容乃至手机与车机之间的关系组织了一遍。

在这个大前提下,我们就可以再来看这七类座舱智能体:随行点单、随行向导、随行逛逛、随行互连、车载娱乐生活、车主服务,以及导航场景智能体。它们覆盖的,正是通勤、长途、本地游、手机车机联动、娱乐消费和能源补给这些最常见、也最容易让人感到麻烦的环节。

长途场景里的「随行向导智能体」,就不只是「给你讲讲沿途景点」这么简单,它能结合实时位置和用户偏好,主动推送沿途资讯、景点介绍、攻略和服务信息,还能把跨车的实时语音群聊与位置共享组织起来,让车队中的 AI 从「解说员」升级成「领队」。

「随行逛逛智能体」则更像是把到一个城市临时起意想转转这件事做成了轻负担服务。过去这类需求最麻烦的地方不是找不到信息,是信息太多:小红书,马蜂窝等等平台上的攻略,路线纷繁复杂,选路线买门票订餐厅等等工作一琢磨就是一个不眠之夜,这种负担和随便逛逛的预期恰好背道而驰。所以这个智能体把导航、停车、步行接驳、购票订座和手机续接整合进一条链路里,本质上是在缩短「我想去」和「我真的去了」之间的距离。

「随行互连智能体」弥合了车上车下两个世界的裂隙。用户可以在微信里,用自然语言给 CarBot 下一个跨时段、跨条件触发的复杂任务,比如很多用户的用车习惯是 A 需求 B 动作 C 爱好一连串的且日常循环的,上车之后再一一调试,只有人工没有智能。但是在随行互连智能体里,直接在微信里说话,给 CarBot 下需求说「乘客上车后打开座椅按摩,播放欢迎语,并将车载微信设置为隐私模式」,CarBot 就会自动拆解需求和任务,再接着判断出副驾座椅被占用,自动执行以上一连串的任务。

这里最关键的变化,是交互入口不再局限于车机本身,借助微信这样一个更高频、更熟悉的容器,把任务延伸到用户的连续生活里。

至于车载娱乐生活智能体和车主服务智能体,它们看上去没有前几个那么新奇,不过是触手可及且高频次的。前者的重点是让音乐、新闻、视频、短剧等不同内容 Agent 协同响应,依据时间、行程状态和历史偏好去「编排陪伴」;后者则把加油、充电、洗车、救援、代泊等车主服务组织成一个可被统一调用的服务矩阵,系统甚至能依据油量、目的地、停车条件等信号主动预判需求。

地图本身就是最天然的出行入口,但过去地图理解的是道路,不太理解人。现在腾讯出行在强调的,是把「找一家能充电不排队的咖啡店」「避开高速顺路吃饭」这种混合意图一次性拆解成偏好理解、路径规划和服务编排的问题。

导航场景智能体开始从「告诉你怎么走」,变成「理解你为什么要这样走」。

一言蔽之,这 7 个智能体开始把汽车看成一个持续理解场景、调用资源、完成任务的「执行节点」,当然,汽车还是汽车,它依旧可以跑起来,载着用户前往目的地。

或者可以反过来说,这些智能体做的工作不是「从零到一」,创造过往不存在的功能,制造过往没想到的体验,而是有点像「从一到零」:未来汽车里的智能,体现为它能替你少做多少次决策、少切多少次界面、少消耗多少注意力,并非体现打开多少个入口。

汽车不仅要承载「空间位移」,还要思考「时间的意义」

早年的手机本质上是「移动电话」,电话和短信几乎就是它存在的全部意义。今天我们手上的「智能手机」,真正被高频使用的往往是社交、拍照、支付、导航、短视频、外卖和各种各样的内容服务,这正是腾讯崛起成为大型互联网和科技企业的前提。智能手机里的电话和短信没有消失,并且依旧是决定这个设备是手机,还有可联网小平板的分水岭,但这两个功能已经占据不了多少用户的使用时长了。手机仍然是手机,只是它的内涵早就不再等于「打电话的工具」了。

汽车也正在经历类似的时刻。

当然,汽车的「空间位移」价值不会像电话和短信在手机里那样被边缘化。人买车、坐车、开车,首先仍然是为了从 A 点抵达 B 点,这个基本属性不会变。

问题在于,当电动化和智能化把「开起来快」和「坐起来舒服」这些指标逐步拉平之后,行业的思考势必会转向新的问题:用户在车里的时间,究竟能不能变得更有价值。

汽车未来的发展方向,除了继续服务于空间的移动,还要开始放大时间的价值。

今天越来越多车企和科技公司开始讨论「第三空间」「移动生活」「在途体验」这类概念。因为中国用户每天通勤、接送孩子、周末短途、节假日长途,自驾已经占据了大量生活时间,更别说大城市还有节假日的拥堵时间了。过去这些时间往往是被默认浪费掉的:堵车时烦躁、等人时发呆、找车位时焦虑、长途时疲惫、多人出行时混乱。

过往汽车智能化的能力还不够,车企的用户思维和制造业背景也很难去思考「时间」对于汽车的意义,现在端云两边的算力,各种模型的能力,互联网和科技企业对各种设备的渗透,汽车行业的自我迭代速度,多种因素叠加,终于有机会让行业思考时间的价值了。

过去的三五年时间里,汽车行业对这个问题也有初步的思考,解题思路统一成了「冰箱彩电大沙发,加长加大更像家」,伴随的硬件变化就是屏幕更大,算力更强,喇叭更多,沙发更软……

现在,非要上一些价值的话,腾讯这次发布的一系列座舱智能体解决的问题当然不是本不该他们思考的「车能不能开」,这次要回答的是「人在车里这段时间应该怎样被服务」。

通勤路上,它可以帮你提前点单,让早餐成为一种被安排妥当的节奏;到陌生城市,它可以把攻略、停车、步行接驳和门票串起来,把原本碎片化的决策成本吸收掉;甚至在内容场景里,它也不只是「放点什么」,新的任务是试图依据环境、时段和心境,把陪伴做得更贴合……

当年的智能手机,之所以最后重塑了人的日常生活,是因为它把「打电话」这件事做到了极致吗?是因为它让原本大量无意义的碎片时间被重新利用了。吃饭排队等位时开一把《王者荣耀》、通勤时听一听知识播客,坐飞机无网时看一看缓存的电影,智能手机把这些过去无法承载复杂行为的时间,全部变成了可消费、可连接、可完成任务的时间片。

汽车的逻辑并不完全一样,但方向大差不差,把用户从 A 点带到 B 点的「空间位移」功能依旧会往更快更安全更舒适的方向走,而在 AB 之间的这段时间,甚至是 A 之前,B 之后的时间,汽车也终于有机会去好好重构了。

为什么这事儿适合腾讯来做?

只要多看看几场现在的汽车发布会,其实会发现大模型、Agent、车机、生态、服务闭环这些词也不新鲜了,先 PPT 发布,再 OTA 更新是行业常态。做智能体,上大模型一旦离开 PPT,马上就会面对实的问题:能调动多少资源,又能把多少链路真的打通?

腾讯的服务和智能手机的耦合程度不需要多说,在汽车行业,它也已经不是一个旁观者,身份已经是一个基础设施提供者。按腾讯披露的数据,其出行服务目前已经覆盖 100% 的头部车企和泛出行公司,与超过 100 家车企、出行科技公司展开合作,并与 40 多家车企在 AI 领域落地合作;智能座舱解决方案在头部车企中的渗透率超过 80%,累计搭载超过 1800 万辆车。

腾讯没有从零开始谈「智能体上车」,因为它有这大量量产合作关系、云服务能力和既有车载产品,「智能体上车」是一个更进一步的事情。

前面之所以先聊 7 个智能体,是因为这些智能体可以提供的服务是 ToC 用户可以直接感受的,但腾讯这次发布的,更官方的说法,或者更 ToB 的说法,是「出行全场景智能体开放平台」。

腾讯想做是提供一整套从底层大模型架构、到平台工具、再到应用生态的能力框架。这个平台涵盖基础设施层、平台工具层与应用生态层:底层是端云协同的大模型架构和原子能力,中间是 Agent 编排、Skill 扩展和运营工具,上层则是围绕真实场景构建的智能体矩阵。

打个比方,砸向牛顿的苹果不是凭空出现的,而是挂在树上的,树有根茎枝叶花,而后才有果子,当我们看到作为消费者可以用到的 7 个智能体果实的时候,其实是因为腾讯准备了根茎枝叶花这些基础设施。

腾讯既有云,也有地图;既有内容,也有支付;既有社交入口,也有小程序生态。很多公司也许能做出一个聪明的车内助手,但很难把任务真正执行下去。腾讯手里的微信、微信支付、腾讯地图、内容生态,以及小程序能力,天然更适合把「理解意图」推进到「完成服务」这一层。

随行点单能做成闭环,随行互连能把微信对话变成车端任务,导航能和目的地服务串起来,本质上都依赖这种跨生态调度能力。

再往下一层看,腾讯这次也强调了它的端云协同架构:端侧基于 0.8B 轻量化 VLM 与座舱世界模型,单帧编码延迟低于 100 毫秒;云端则承载更复杂的语义理解、记忆检索和内容生成,单意图识别能力超过 95%,多意图识别能力超过 90%。这些能力才能满足既要快,又要准;既要弱网可用,又要有复杂推理;既要本地响应,又要持续进化的需求。

所谓善战者无赫赫之功,腾讯做出行全场景智能体开放平台的前提,还是它不需要整车厂那样必须把一切都封闭在自己的品牌宇宙里,因为在这个行业里,它的角色「连接者」。这没法让它拥有一个像兰博基尼劳斯莱斯这样的汽车品牌形象,反而让它更适合做智能体时代的基础层和中间层。毕竟智能体能力最需要的,是腾讯过往多年构建的既 ToB 又 ToC 的全栈服务能力。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

刚刚,姚顺雨腾讯首秀来了!三个月重建混元新模型,实测到底什么水平

作者 张子豪
2026年4月23日 17:08

这周,中国大模型的更新让人窒息。前脚阿里最强旗舰 Qwen 3.6 Max刚发布,月之暗面的 Kimi 2.6 就马上登场,DeepSeek V4 也箭在弦上。

刚刚,混元的 Hy3 Preview 也正式亮相,这是腾讯首席 AI 科学家姚顺雨主导的一个模型。

姚顺雨表示,Hy3 preview是混元大模型重建的第一步。他希望通过这次开源和发布,不断提升 Hy3 正式版的实用性,以及模型在真实场景中的综合表现,并开始探索特色模型能力。

从去年年底姚顺雨加入腾讯,入职首席 AI 科学家,并负责 AI Infra 及大语言模型,1 月底开始启动模型训练,三个月的时间完成了从训练到上线。

这个大版本升级的混元模型,在短时间内,不仅对底层基础设施进行了系统性重建,还包括预训练和强化学习在内的底层框架,全部推倒重来。

最后的答卷是一个快慢思考融合的 MoE(混合专家)语言模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。

在这个行业动辄吹嘘万亿(1T+)参数的时代,Hy3 preview 的数据显得有些克制。但这个参数很明显是兼顾了性能和成本之间的平衡,让模型能更好落地在不同场景。

而 300B 这个量级,复杂的数理推理、长上下文理解和指令遵循能力都已经被充分激活;如果继续强行扩大规模到万亿参数,一边是训练时间加倍,在实际的表现上,也容易出现通信延迟、吞吐瓶颈和推理成本翻倍等问题。

不过,姚顺雨也提到,他们在继续扩大预训练和强化学习的规模,提升模型的智能上限。

在多个真实生产和生活场景 benchmark,以及腾讯混元的 CL-bench 上表现对比前代,提升幅度明显。

因此,Hy3 preview 这次的定位非常明确,要到真实世界去解决复杂工程问题。

为了验证 Hy3 preview 是否能在真实世界去解决各种问题,具体的模型表现如何,APPSO 也提前拿到了内测资格,在元宝 App 和 WorkBuddy 桌面端应用了实测了一段时间。

编程和 Agent,混元开始接住真实的工程需要

编程能力目前还是各家大模型发力的重点,前几天还有外媒报道,谷歌正在成立一个新的团队,专攻 AI Coding。

这次的腾讯混元新一代大模型 Hy3 preview 同样在通用能力的提升基础上,能够适用于编程和现在热门的智能体场景。

例如我们用之前 GPT 5.4 模型发布时使用的编程测试案例,来看看 Hy3 preview 的具体表现。

▲提示词:创建一个超写实的旧金山金门大桥交互式 3D 体验,允许我自由飞翔环绕。环境需包含真实的照明、水体、雾气、大气效果、悬索、车流、周边海岸线及城市背景,并具备电影级的尺度感和细节。让我能通过直觉式的飞行控制和多视角(包括近距离结构穿梭和大场景俯瞰)平滑地进行场景导航。核心要求是真实感、沉浸感和视觉忠实度。在测试运行时,务必从多个距离和角度环绕大桥飞行,验证导航的平稳性与稳定性,并确保场景无论远近都极具说服力。你可以利用 imagegen 技能生成建模所需的初始资产。视觉效果绝不能有任何“方块感”或“廉价感”,必须达到高保真、极度平滑、近乎照片的质感。桥面上应有真实的车辆通行。不必急于求成,如果需要,即使耗时一小时也可以。请不断迭代,直至完美。

虽然最后的结果并不是非常写实,主要差距还是在于所使用的工具限制。但整个体验还是非常流畅和丝滑,我们能使用 WASD 键来控制自己第一人称视角的飞行,同时 Hy3 preview 也自动写了一些默认视角。

而在让它写一些简单的小游戏时,像是同样来自 GPT-5.4 的提示词,做一个游乐场的经营类小游戏。

▲提示词:创建一个可以在浏览器中构建并导航的交互式等轴测 (isometric ) 主题公园模拟游戏。利用 imagegen 确立整体视觉风格,并生成全套游戏资产,包括游乐设施、路径、地形、树木、水体、食品摊位、装饰物、建筑、图标以及 UI 插画。游戏世界必须具备高度的统一感、精致度以及丰富的视觉表现,艺术风格需高端且适配等轴测视角。允许平滑地铺设或拆除路径、添加景点、布置景观并环绕公园移动,同时能够监控游客活动、设施状态以及公园的发展情况。系统需包含可信的游客移动算法,以及简单的公园管理系统(如资金、清洁度、排队和满意度)。确保整体体验充满趣味、逻辑清晰且完整,而非粗糙的原型。在优先级上,趣味性、易读性以及出色的游戏手感高于写实度。在进行玩法测试时,务必通过多轮操作来构建并扩张公园。验证设施放置与导航是否顺畅,确认游客对公园布局及景点的反应,并确保视觉效果、UI 以及交互体验稳定且统一。

还是不可免俗的使用了「渐变紫」的套装,只能说界面审美这一块,除了编程能力的提升,还是需要额外的一些微调。

好在整个游戏是能玩的,我们可以真实的经营这个游乐场,通过铺路、放置新的游乐设施以及服务设施等场地,来赚取收入,控制人流。

而经典的「骑自行车的鹈鹕」测试,我们把它换成了更难一点的,开着汽车的长颈鹿。生成的 SVG 画面是动态的,太阳、云朵和车子都在移动,基础的 SVG 元素都能做到。

这些关于编程能力的测试,我们都是在腾讯前段时间推出的智能体应用 WorkBuddy 内完成。

而除了代码开发的任务,我们还可以使用 WorkBuddy 进行文档处理、数据分析可视化、深度研究等方面的日常办公。

由于 WorkBuddy 也是一个本地 Agent 产品,和 Claude Code、Codex 之类的应用一样,我们可以让它直接访问本地文件夹的文件。

要求它访问电脑上 Hy3 文件夹里面的全部文件,并根据文件的内容,创建一个类似于 Wiki 的网页,能够直接索引到不同的文件。

WorkBuddy 读到了我们创建的不同项目,例如要求它完成的落地页、3D 金门大桥、个人博客、运营游戏等项目,并分类总结好。

再要求它把其中一个香港国际电影节的 PDF 文件转成 HTML,要求它 1:1 复刻精美的杂志效果,显然太为难它,但是 Hy3 preview还是能在非常规排版的 PDF 文件里,准确定位到信息,并整理成网页。

而在深度研究的调研任务上,我们要求他写一份关于内存市场洞察报告,给出的文档内容详细,使用的数据来源也全是权威机构。

继续用 WorkBuddy 内的数据分析及可视化任务来测试时,要求 Hy3 preview 基于联合国人口司的数据,做一次全球人口结构变迁的可视化分析,Hy3 preview 花了非常长的时间进行调研,最后给出的研究报告,可以说能直接拿过来用。

▲部分可视化图表截图

这些编程和智能体的能力,配合 WorkBuddy 能发挥到最大。在元宝 App 内,现在我们也可以让它生成一些小型的网页游戏,在对话框里就能预览打开。

闲聊,要做到「活人感」不容易

前段时间,一个短视频在网上传播,视频内容是一位乘客看到前排的司机,在手机上和 AI 助手聊天,他告诉 AI 自己一天收入,AI 会给他一些反馈。

有网友在下面留言,说以前这些聊天都是 200 块一小时的心理咨询,现在手机发条消息就能做到。

无论模型在代码开发、解数学题、科学研究上取得了多少成功,大多数人用 AI 的场景,占比较多的还是各种类型的角色扮演。

我们也测试了腾讯混元新一代大模型 Hy3 preview 在日常聊天以及创意写作上的表现。

没有「不躲不逃不藏的只用最直接」的方式跟我说,有的是真实地能解决问题的文字。打开元宝 App,点击深度/快速思考,选择模型 Hy3 Preview,问它「为什么我在广州找不到爱情」。

它的回复是客观和主观两方面并行的,会分析除我之外的原因,也会告诉我应该要怎么做。

在聊到一些可能找到明显原因的困惑时,Hy3 preview 还会自动生成对应的表格,来解释 AI 并不是只会顺从。

创意写作的任务上,Hy3 preview 模型的表现,也要比前代更有文采和个性化风格,即便是简单的生活文案,人情味也更明显了。

我们找了一些基础的风格模仿任务、叙事节奏的续写、语言的创作力和情绪张力等题目,来测试它。

生成的写作结果,在独特性、执行精确度,以及风格稳定性上的表现,确实要更符合我们人类写作的特点,没有 AI 那种明显的套话。

那道经典的走路去还是开车去洗车问题,Hy3 preview 也答上来了。

当所有人在做一套卷子,混元开始出卷

过去两年多,中国 AI 行业有一种集体焦虑:所有人都在做同一件事。同样的架构,同样的训练范式,同样的榜单,同样的新闻稿模板。模型发布会的 PPT 换个 logo 就能通用,「全球领先」「性能登顶」这些词被用到通货膨胀。

腾讯曾经也在这个队列里。别人打榜它也打榜,别人堆参数它也堆参数,别人做什么功能它追什么功能。结果是混元的技术投入不少,但市场感知始终模糊。你问用户「混元跟别家有什么区别」,大概率答不上来。

Hy3 preview 的意义,可能恰恰在于腾讯终于不追求打榜了。这也是姚顺雨带给混元最大的变化。

此前晚点一篇报道就转述了姚顺雨在腾讯内部会上的判断:模型过度追逐榜单成绩,将打榜语料放入训练集,数据被污染了。模型很会答题,到了真实场景却不稳定。

榜单衡量的是能力上限,用户感知的是能力下限。MMLU 上领先两个百分点,用户在实际使用中几乎感知不到;反过来,指令遵循稍差、格式不稳定、幻觉率偏高,用户体验会断崖式下降。

所以在 Hy3 preview 上, 就能看到混元开始把这个逻辑翻了过来:不追榜单,追场景。

▲去年一份报告就曾指出, AI 在各类基准测试上的分数一路飙升,benchmark 过于饱和,这些成绩往往并不能真实反映它对现实世界的实际影响。

295B 的参数量说明它不打算在模型尺寸上硬碰硬。不上公开榜单说明它不打算在刷分上继续内卷。Co-design 的研发模式说明它开始把注意力从「别人做了什么」转向「我的用户需要什么」。

这里就不得不来看看腾讯这家公司的核心业务场景,社交、游戏、广告、企业服务,每一个都有极强的领域特殊性。微信的对话流是碎片化的、高密度的;游戏需要模型根据实时局势做即时反应;企业微信和腾讯会议需要基于私有文档的精准分析。

▲ Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。

这些场景对模型的要求,跟通用智能榜单上考核的那些指标并不完全匹配。一个在 MMLU 上排名前三但在微信群聊里读不懂语境的模型,对腾讯来说毫无意义。

换句话说,腾讯可能是中国大厂里最不应该去追通用榜单的那一个。它手里攥着的场景足够独特、足够复杂、足够有商业价值,完全可以走出一条自己的路。

Co-design 就是这条路的起点。模型在真实业务里跑,业务用真实数据反哺模型,腾讯对 AI 的巨额投入能得到场景的快速验证,同时获得商业上的闭环。这个飞轮一旦转起来,产生的壁垒比榜单上的排名坚固得多。

当所有人都在比谁的模型更「全能」的时候,谁的模型在自己的场景里最「好用」,可能才是真正的胜负手。

当然,「找到节奏」和「赢下比赛」之间还隔着相当的距离。

Hy3 preview 是混元重整后的第一个模型,三个月的研发周期说明执行力在线,但也意味着大量的优化空间。55% 到 56% 的盲评胜率说明它够用,距离拉开差距还早。更大尺寸的模型在路上,正式版还在根据 Preview 阶段的用户反馈持续打磨。

但至少有一件事变了:混元不再追着别人的地图跑了。它开始画自己的地图,标自己的路。

大模型竞争走到今天,同质化才是最大的风险。当所有人都在用同一把尺子量身高的时候,有人开始造自己的尺子,量自己真正需要的维度。

这件事本身,比任何一榜单参数都值得关注。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

腾讯会议这波 AI 功能,让我彻底戒掉了整理焦虑

作者 姚桐
2026年4月2日 19:54

有多少会议的录像,你从来没有回看过?

我想有些人的答案是:几乎全部。

录制文件躺在云端,没有索引,没有摘要,于是我们宁可在手机备忘录里潦草记几行字,也不去动那个文件夹。时间一长,会议录像的意义,就只剩下一种:防止对方事后翻脸说「我没说过这句话」。

作为腾讯会议的深度用户,我用它录过选题会、采访,也录过早八课、小组讨论。录制于我而言,从来只是个存档动作。因为我总要花 3 倍于会议时长的时间,去整理笔记、提炼重点、定位关键信息。稍有不慎就会遗漏核心点,主打一个「摸鱼一时爽,整理火葬场」。

腾讯会议这次「智能录制」的升级动静不小。变的不仅是准确率,还包括整个框架。它引入了多模板机制,不同类型的会议,AI 会用不同的方式帮你整理。

看到「AI 帮你整理会议内容」,可能你和我的第一反应是:又来。这种功能见得太多了。生成出来的东西,要么是逐字稿套了个排版,要么是把你说的话复读一遍加了个标题。

但这次可能真的不一样,我拿了几种完全不同的会议来试,工作周会、大学课堂、客户拜访,看看它到底能整出什么花来。

体验入口:

第一步:在会议中开启「云录制」,会议结束后录制文件将自动保存进入你的「录制」文件中。

第二步:进入腾讯会议客户端/APP,点击「录制」(APP 请从「我」-「录制」),在全部文件中,选择任何一场会议,进入后即可查看该功能。

不同的会,终于有了不同的整理方式

我先拿了一场最常见的周会开刀。

这会会一般信息密度不高但杂乱,我过去通常的处理方式是:打开录制文件,拖着进度条找到关键段落,然后打开备忘录开始手动敲:谁说了什么、结论是什么、谁负责跟进。

这次我什么都没做,会后直接打开录制文件,选择「智能总结」模板。

在这场周会的录制里,AI 把内容切成了大约 6 个段落,排期讨论、预算确认、人员安排,每一段标题都对得上我的记忆。单是这一个功能,就帮我省下了至少一半的整理时间。

对于大多数日常工作会,这个通用模板已经够用了。但腾讯会议这次真正让我觉得有意思的,是接下来这件事。

因为不同类型的会议,对「重要信息」的定义完全不一样。

一节课的核心是知识点和考试重点,一场客户拜访的核心是预算、决策链和痛点,一次项目启动会的核心是里程碑和责任人。让一套 AI 模板包打天下,就像让同一个实习生既写课堂笔记又写销售报告。能用,但不专业。

腾讯会议这次一口气推出了 5 个场景化模板,我拿大学生最刚需的「学霸助手」先测了一场早八课。

周三早八,文学翻译鉴赏课,老师用英文开场,PPT 切换的速度比我意识清醒的速度快一倍。

和往常一样,进入会议我顺手点了云录制,然后把脑子调到了省电模式。

下课后,我先点开了逐字稿,中英夹杂,密密麻麻。「so」和「就是说」交替出现。

图源小红书@亿万

我在屏幕前坐了三秒,头开始疼,算了,直接看「学霸助手」模板整理的纪要。

整齐的语段就这样萌萌地看着我。

我在复盘时发现一个有趣的细节:老师在讲「Memory, like olives, is an acquired taste.」这句话如何翻译时,用了相当长的篇幅分析「acquired」,AI 纪要把这段内容压缩成了要点,而不是一堆原话的堆砌。

最让我觉得贴心的是,组队人数、抽签规则、评分占比等重要细节都无一遗漏。

但 AI 的输出不是终点。我还可以随时在要点下面加一段自己的理解,操作就像在一篇文档里插入注释一样自然。 我的思考、我的补充、我的疑问,都能和课程内容牢牢绑定在一起,随着学习过程不断丰富,最终变成完全属于我的学习资产。

对中小企业来说,多模板可能更值钱

除了学霸助手,腾讯会议还准备了汇报总结、项目启动纪要、客户拜访纪要(MEDDICC)和客户分析(BANT)四套模板。

我有个做 ToB 销售的朋友,团队六个人,没有 CRM 系统,客户信息全靠微信收藏和脑子。每次见完客户回来,主管问一句「对方预算多少?谁拍板?」他就开始翻手机备忘录上潦草的三行字,剩下的全凭印象。

他不是不知道 BANT、MEDDICC 这些专业销售框架好用。客户预算、决策人、需求、时间线,哪条漏了都可能跟错单。但六个人的小团队,哪有精力每次见完客户还坐下来花半小时填表?

行业里有个数据说,用对了销售资格认定框架,成交率能提高 67%。道理大家都懂,卡就卡在执行上。

这次我帮他试了一下 MEDDICC 模板。操作很简单:客户拜访时开着腾讯会议的云录制,聊完之后切到 MEDDICC 模板,AI 直接把聊天里提到的预算范围、谁是最终决策人、客户痛点、竞品情况这些信息,按框架归好了类。

他看完说了句:「我以前花半小时填的东西,它开完会就填好了。」

BANT 模板也是同样的逻辑,预算、决策权、需求紧迫度、时间线四个维度自动归位。对他这种小团队来说,这招属于「轻资产、重方法」。

买不起几十万的 CRM,请不起咨询公司做销售培训,但开个腾讯会议、选对模板,AI 就能帮你把客户信息按专业框架整好。说白了,方法论本身不贵,贵的是执行成本。现在执行成本被 AI 干掉了。

会议能被追问,元宝是我的私人秘书

如果说智能纪要解决的是「会后整理」,那「问元宝」解决的是更深一层的问题:会议内容能不能被追问

我们或许都经历过,在五六个人的工作会议中,大家都在说话,你很难在实时对话中同时追踪每个人的立场演变,注意力往往被最强势的那个声音带走了。

现在你直接点击逐字稿里参会者的昵称,就可以让元宝总结 ta 的全场观点。分人总结之后,这五六个人分别说了什么、各自强调了什么、在哪个问题上有过保留意见,全部清晰呈现。

会后追问,才是「问元宝」更日常的用法。

做访谈时,有位受访者提到了心盲症(Aphantasia)这个概念,我当场不好打断就没追问。会后让元宝结合那段访谈内容和外部资料给我解释,它把受访者的个人描述和认知科学的外部知识结合起来,标注了哪些内容来自录制,哪些来自联网检索。

之前遇到陌生概念,要花几小时翻知网、查文献,既耗时又容易出错。现在元宝直接完成「访谈内容解读 + 权威知识补充 + 信源标注」一站式服务,整理好的内容稍作调整核对,就能直接放进论文附录或注释里了。

大学生们课后如果需要给组员发组队通知,直接输入「根据本节课的分组要求,生成一份组队通知,明确组队时间、人数要求、报告占比、抽签规则」,一份清晰得体的通知立刻生成,复制粘贴就能发到群里。

这样一来,「会议内容」就从一段只能播放的音视频,变成了一个可以被追问、被延伸的知识库。你只需要告诉 AI 你想知道什么,它帮你从里面捞出来。

会议录制的终点,是「随时调用的记忆」

以前我对会议效率的期待,就是开完能有份纪要就谢天谢地了。但纪要只是信息的归档,归档之后的信息怎么再流转、怎么被用起来,才是真正决定效率的环节。

这一年腾讯会议把 AI 嵌进了会议的每一个角落。现在,多模板管整理,元宝管追问,整条链路终于没有断点了。

你可以追着它问、往里面加自己的笔记,甚至让它联网帮你查资料。会议录制文件第一次变成了一个活的东西。

我翻了翻云端那堆从来没打开过的旧录制文件,原来早就支持了,过往文件也能用。

那些在云端躺了几个月的早八课录像,我可能要重新打开了。不是为了复习,只是想知道,那节我快睡着的课,AI 眼里的「核心知识点」到底是什么。

与其说这是会议录制,不如说是把工作生活里,那些过去没有被好好整理的上下文记忆都留存了起来。

这,才是「会议录制」这个动作之后真正应该有的结局。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

腾讯「八虾夺嫡」内幕:一只龙虾,怎么成了全村的希望

作者 李超凡
2026年3月30日 09:24

99 年生的张舒昱,是腾讯电脑管家团队入职不久的产品经理,这在腾讯算不上核心业务线。

今年 1 月 OpenClaw 刚在中国爆火,她着了迷,拉上几个人攒了一个产品原型 QClaw:基于 OpenClaw,一键安装,通过微信直接操控智能体。

项目在腾讯体系里几乎没有存在感,没有立项审批,没有总办资源,几个年轻人凑在一起写代码。

3 月 9 日,QClaw 内测上线。一周之内,数百万用户注册。

然后事情开始失控,惊动了腾讯总办。

高层反应极快,随即调拨数十名员工和计算资源到张舒昱的团队。同日,另一支团队推出了 WorkBuddy,同样兼容 OpenClaw。再隔一天,腾讯港股大涨超过 7%,投资者把涨幅直接归因于这两只虾。

3 月 11 日凌晨 2:06,马化腾发了条朋友圈:「自研龙虾、本地虾、云端虾、企业虾、云桌面虾,安全隔离虾房、云保安、知识库……还有一批产品陆续赶来。」

这对腾讯 11 万员工是一个鲜明的信号,无数员工将其解读为:Pony 支持他们 all in 龙虾

据 The Information 独家报道,截至本月,腾讯内部同时有 8 个团队在开发基于 OpenClaw 的产品和服务。加上在研和内测项目,总数已超过 10 个。

15 年前,腾讯内部三个团队赛跑移动 IM,张小龙的广州研发部跑出了微信,是腾讯史上赛马最成功的一次。这次换了个物种,叫赛虾。

一个 99 年产品经理做的边缘项目,两周之内变成一家万亿市值公司的战略支点,似乎有点不可思议。

张舒昱对 The Information 说了一句大实话:「我们都在用 AI Agent 做实验。此刻,没有人能说什么是最佳方法。」

翻译一下就是:我们也不知道答案,但先跑起来总比站着强。

全村的希望:腾讯为什么把命押在一只虾身上

要理解腾讯对龙虾的狂热,先要直面鹅厂当下在 AI 竞争中的处境。

过去两年,中国 AI 大模型军备竞赛打得昏天暗地。

阿里砸钱做千问,字节孵出豆包,在用户规模和模型能力上都拉开了身位。腾讯呢?手握游戏和微信广告的丰厚利润,但在 AI 赛道上远不及这两个对手激进。

自研的混元大模型尚且无法与竞争对手匹敌,又拖累了自家 AI 助手「元宝」的进展。

腾讯不是没努力。去年请来前 OpenAI 研究员姚顺雨执掌混元研究,重建了研发基础设施。 4 月即将发布的混元新一代模型,业内普遍视为腾讯模型能力的一次摸底考试。

▲姚顺雨. 图片来自:智源社区

但远水解不了近渴,在新模型交卷之前,缺乏强大的内部模型,让元宝在与豆包和千问的竞争中暂时落于下风。

所以当 OpenClaw 在中国引爆了 Agent 热潮,腾讯高层几乎是本能地抓住了这根绳子。这只龙虾证明了 AI 的下一个爆发点未必在聊天框里,可能在桌面上,在工具里,在无数个能替你干活的智能体身上。

腾讯高层的判断很清晰: OpenClaw 引发的这一轮 Agent 浪潮,将是 AI 战场重新洗牌的机会

他们逻辑是这样的,如果腾讯能通过将 OpenClaw 类Agent 能力与微信深度整合,提供配套工具和服务,成为中国最好的 Agent 使用平台,那么即便其内部大模型不是最强大的、AI助手也不是最受欢迎的,腾讯依然有可能在 AI 下半场逆风翻盘。

2020 年,马化腾在腾讯内部将视频号称为「全村的希望」,寄望于它在短视频赛道上扳回一城。如今,「全村的希望」换了物种。

区别在于,视频号好歹是亲生的,龙虾来自一个奥地利独立开发者的 GitHub 。

某种意义上,这更像是 2014 年纳德拉接手微软后做做的事,承认在移动互联网上输了,放下「什么都要自己做」的控制欲,押注一条全新赛道。

纳德拉用了十年,腾讯希望快一点。

八虾夺嫡,腾讯赛虾背后

外界把多团队并行理解为经典赛马机制,腾讯内部更愿意说「多样性」。QClaw 和 WorkBuddy 是最先冒头的两只虾,路线截然不同。

QClaw 是张舒昱从电脑管家边缘团队杀出来的,直接拥抱 OpenClaw 开源生态,做微信一键安装,野蛮生长。设计理念就四个字:打开即用。不需要配置环境,不需要懂终端命令,微信扫一下就能让 AI 接管你的电脑。

▲张舒昱. 图片来自:南京审计大学

WorkBuddy 则走了一条完全不同的路。负责人汪晟杰在接受 APPSO 采访时反复强调一件事:百分百自研,没用过一行 OpenClaw 源码

它走半自动化路线,避开了 OpenClaw「透传」模式下信息暴露在公网上的风险,采用 bot 推送通知模型,每一步关键操作都需要用户确认。汪晟杰的定义很明确:龙虾是一个概念,不等于 OpenClaw。WorkBuddy 要做的是安全可控的龙虾,企业能放心用的龙虾。

汪晟杰透露了一个时间细节:WorkBuddy 在 1 月 17 号那个周末就已启动,三四个人通宵做出 MVP(最小化可行产品),原计划 3 月 16 日发布。看到龙虾热潮后提前了一周,撞上了 QClaw 同期发布。

▲ 汪晟杰.

也就是说,腾讯并非在 OpenClaw 火了之后才匆忙跟进。多个团队在不同时间点嗅到了同一个机会,OpenClaw 的爆火更像催化剂,把水面下的项目一夜之间推上了前台。

但赛虾机制的矛盾也摆在桌上。

QClaw 和 WorkBuddy 功能高度重叠,都能通过微信操控 AI 智能体,用户该选哪个?8 支团队同时跑,资源会不会内耗?

答案藏在张舒昱那句话里:「此刻没人知道什么是最佳方法。」8 支团队同时下场,与其说是信心爆棚,不如说谁都没有把握

腾讯选择用数量对冲不确定性,多条路线同时跑,押中一条就够了。

赛马机制的精髓从来都是:靠数量提高命中概率。15 年前微信就是这么跑出来的。

马化腾的养虾哲学

赛虾的前提是有虾可赛,但这只虾不归腾讯管。

3 月 12 日,OpenClaw 创始人 Peter Steinberger 在 X 上公开批评腾讯,矛头直指腾讯的 SkillHub 服务复制了社区 Skills 却没有做出任何贡献。

两天后,腾讯通过 GitHub 捐款,随后被列为特色赞助商,与 OpenAI 并列。在上周英伟达 GTC 大会上,腾讯云 CEO 汤道生当面约见 Steinberger,提出由腾讯云贡献服务器和安全服务,并探讨与 OpenClaw 基金会更深层的合作。

中国市值最高的互联网公司之一的高级副总裁,飞到圣何塞跟一个开源项目创始人坐下来谈合作。在腾讯历史上几乎没有先例。当你需要别人的东西比别人需要你的东西更急迫时,身段自然就放下来了。

同一周的财报发布会上,腾讯总裁刘炽平宣布 2026 年将 AI 新产品的投资至少翻倍,从去年的 180 亿元起步。而在阐述钱花到哪里时,他只点了三个名字:混元、元宝、以及最新的 Claw 产品

一个月前还是边缘项目的龙虾,一跃与腾讯自研大模型和旗舰 AI 应用并列。龙虾从「大家自己玩玩」正式升格为「公司战略」

马化腾最近在财报会议上的发言,进一步回答了一个更本质的问题:腾讯想用龙虾做什么

他的切入角度直接跳过了产品层面,落在生态上。

马化腾认为龙虾类应用有记忆和个性,更像助理,带有「活人感」,能让 AI 落地到办公、终端、小程序等各种场景中,不再全部挤在 chatbot 这条独木桥上。

但真正耐人寻味的是他关于「去中心化」的论述。微信本身是中心化的 App,但微信生态是去中心化的,数十万小程序商家构成了开放平台。马化腾认为 AI Agent 天然具有去中心化特征,可以融入微信生态。有一句话特别关键:

所有服务商的心态都是怕被 AI 智能体「短路化」「渠道化」。

意思是,他不想让 AI Agent 变成一个新的中间商,把微信里的服务商变成纯粹的后端 API。他想让小程序保留独立性,同时具备 AI 能力。「每一个小程序都可以智能化和龙虾化。

这个思考比「我们也做龙虾」高出一个维度。马化腾看到的是一种范式转移的可能:AI 的价值分配方式,从「一个超级 chatbot 统治一切」变成「无数分布式智能体各显神通」。

如果这个判断成立,拥有全球最大通讯生态和最活跃小程序平台的微信,天然就是 Agent 时代最肥沃的土壤

刘炽平在财报会上把这套逻辑做了明确的总结:「Claw 提出了一种去中心化的模型……有段时间,似乎每个人都在争夺成为 AI 智能体唯一的入口和垄断者。但现实并非如此。」

一句话概括腾腾讯的押注逻辑:模型之争输了一局,但生态之争的牌还没摊开

当然,这套叙事也可以被翻译成另一句话:我们模型不够强,所以告诉你们模型没那么重要。

自洽和自欺之间,有时候只隔一层窗户纸。但关键在于,这一次腾讯确实有牌可打。微信不需要成为最强大模型的容器,只需要成为最好用的 Agent 运行环境

这和纳德拉的 Azure 逻辑如出一辙,你不需要自己做出最好的 AI,你只需要让最好的 AI 都跑在你的云上。

养虾产品全景图,腾讯到底下了多少注

腾讯的「养虾」远不止做几个 C 端产品那么简单。腾讯周五公布了「养虾产品全景图」,这套从底层到应用层的完整龙虾矩阵,密度超出外界预期。

消费级产品打头阵。QClaw 主打微信一键安装,面向普通用户;WorkBuddy 走桌面端自研路线,强调安全可控;微信 ClawBot 负责让用户在微信聊天界面直接操控龙虾。

三个产品覆盖了「小白用户一键上手」「桌面深度使用」「微信生态无缝接入」三个核心场景。光是消费级这一层,腾讯就同时铺了三条路。

企业级产品紧随其后。ClawPro 面向企业和政务客户,主打安全隔离和精细权限管控,企业微信独占通道,账号权限分级,内置技能审核机制,代码生成类操作要过审,网页搜索走安全网关。

汤道生在腾讯云峰会上重点推介了 ADP(智能体开发平台),定位是企业构建定制化 Agent 的工具箱。配合 Claw Runtime 提供安全沙箱运行环境,Lighthouse 做安全管理。

整套企业方案的逻辑很清晰:OpenClaw 太野了,我帮你把它关进笼子里。

开发者生态也没落下。CodeBuddy 是去年下半年就上线的 AI 编程助手,现在被纳入龙虾矩阵成为开发者入口;SkillHub 是 AI 技能社区,做了本土化适配,也正是因为这个产品被 Steinberger 点名批评后才有了后面那笔捐款。TokenHub 则是模型服务市场,不光接混元,也接 DeepSeek、MiniMax、Kimi 等第三方模型,统一计费。

腾讯连「卖铲子」的生意都想好了。

从这张全景图可以看出,腾讯不想只在产品上做单点突破,要做一整条龙虾产业链——从安装到运行,从个人到企业,从消费到开发,每个环节都有人盯着。

这正是汤道生反复强调的「Harness 工程」思路:Agent 时代的胜负手不在模型本身,在于脚手架。工具调用、上下文工程、长期记忆管理、工作流设计,这些看起来不性感的苦活,才是决定 Agent 好不好用的关键变量。

汤道生在腾讯云上海峰会上表示:「AI 落地不只是算法题,Harness 工程能力是关键变量。不同的脚手架设计,会显著影响实际使用效果和 token 成本。」

翻译成人话就是:模型是发动机,但没有底盘和方向盘,跑不了多远。腾讯模型暂时跑不过别人,但如果能把底盘和方向盘做到最好,照样能赢。

虾潮退去之后

把所有线索串起来,这个故事可以被浓缩成一句话:腾讯用一家大公司能调动的所有资源,去拥抱了一个自己无法控制的开源项目

这是一个充满张力的姿态。

OpenClaw 的更新节奏是每周两三个版本,API 说改就改,Breaking Changes 说来就来。Peter 点一下 merge,深圳大厦里好几支产品团队可能就要通宵救火。腾讯把战略命脉系于别人的 GitHub 仓库上,这需要的不只是勇气,还有一种前所未有的谦逊。

但换个角度想,腾讯可能也没有更好的选择了。

如果继续只在模型和 chatbot 赛道上硬碰硬,不是陪跑就是陷入同质化厮杀。但 Agent 浪潮撕开了一条新缝隙:谁能把 AI 变成最好用的工具,谁就能重新定义入口

微信有 14 亿月活,有小程序生态,有支付,有社交关系链。这些东西造不出最强模型,但能造出最好的 Agent 使用环境,这是腾讯手里唯一一张别人没有的牌。

问题在于,这张牌的有效期有多长。

OpenClaw 仍在快速迭代,生态远未定型。今天的龙虾热,会不会像去年的 Manus 一样来得快去得也快?8 支团队赛虾,会跑出下一个微信,还是跑出 8 个半成品?马化腾的「去中心化 Agent 生态」蓝图很美,但从蓝图到现实之间,还有需要经历多少次「技术事故」?

不过,有一件事是确定的。

当一家公司的 CEO 凌晨两点发朋友圈,总裁在财报会上把龙虾和自研模型并列,高级副总裁飞到美国去约见开源项目创始人,8 支团队同时下场赛虾,AI 投资直接翻倍,它就已经不是在追热点了,它在押注这家公司的未来。

赌的不是这只虾能活多久。赌的是在 AI 重构一切的十年里,腾讯还能不能坐在牌桌上,以及坐在什么位置

视频号当年也被叫做「全村的希望」。五年过去了,它还没打败抖音,但在微信生态内长出了自己的活法。龙虾能不能也走出第三条路?答案还早。

不过,当一个巨头被逼到墙角,终于想清楚自己要什么,把资源砸向同一个方向的时候,你永远不能低估它。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌