阅读视图
中欧基金付倍佳:明年港股有盈利估值双击的机会
阿里巴巴旗下公司入股具身智能机器人公司穹彻智能
OpenAI与欧洲最大电信运营商之一德国电信达成合作
QFII参与商品期货交易所国债保证金业务落地
上海市房管局召开保障性租赁住房企业座谈会
韩国成立特别工作组应对韩元贬值
恒生科技指数跌近2%
沪深两市成交额突破1.5万亿
友达11月销售额240.4亿元台币,同比增长3.4%
韩国央行行长:韩国经济潜在增长率已降至2%以下
银河通用回应拟赴港上市:消息不属实
中集集团:公司当前在福建的布局主要围绕集装箱板块
摩尔线程:即将发布新一代GPU架构
MINISO LAND获 “最佳新店概念奖”
OPPO 姜昱辰:从 GUI 到 Agent,AI 手机交互革命的「终局」思考
整理|汤一涛
编辑| 靖宇
在智能手机行业,未来的 1500 天被视为一场即将发生的「聚变」。
随着大模型技术的爆发,以豆包 AI 手机为首的 GUI Agent 手机硬件应用落地,手机不再仅仅是通讯与娱乐的载体,正加速向「AI 个人计算设备」演进。
面对这一从功能机向智能机跨越以来最大的变局,手机厂商们正处于「八仙过海」的探索期:硬件形态如何收敛?交互界面如何革新?以及最重要的问题—— 如何避免成为 AI 时代的「诺基亚」 ?
在极客公园创新大会 2026 的活动现场,极客公园投资合伙人 Ashley 邀请到了 OPPO ColorOS 智慧产品研发总监姜昱辰。双方进行了一场深度对谈,从研发视角的转变、技术路线的抉择(GUI Agent vs 生态合作),到以「记忆」为切口的破局之道,全面剖析了 OPPO 对于 AI 手机终局的思考与实践。
关联阅读《 对话 OPPO AI 姜昱辰:手机才是 Memory 最好的土壤,AI 一定会彻底改变智能手机 》
嘉宾精彩 观点 :
- GUI Agent 是长尾场景的兜底技术手段,OPPO 更倾向通过 Agent to Agent 实现生态互联。
- 「记忆」是 AI 手机演进的第一刀,因为只有「记得」才能「懂你」,进而提供主动式服务
- 构建记忆系统的核心挑战是隐私,唯一的解法是端侧计算,把数据留在手机里
- AI OS 的本质是「主动式」与「个人化」的交互革命,未来 AI 助手将与操作系统彻底融合为一体
以下为姜昱辰和 Ashley 在极客公园创新大会 2026 上的对话实录,由极客公园整理:
01
行业格局:手机厂商的 AI 探索
Ashley: 你曾经是一个创业者,现在在 OPPO 负责上亿用户量级的系统级产品,这两种研发体验有何不同?
姜昱辰: 还挺不一样的。
创业公司往往处于寻找 PMF 的阶段,做的是极度创新的事,不确定用户到底有没有这个需求。通常上线的是不完善的版本,到达一定用户量之后才会做 Scaling。
成熟厂商面对的用户,对你是系统级产品的期待,没有办法接受一个半成品。这导致我们在研发过程中必须极其谨慎。我们会在上线前进行深度的用户洞察、多轮用户共创及概念验证,确保产品在面世时已具备较高的完成度。
也有一些东西是不变的,比如怎么找 PMF。不管做什么产品、面对什么样的用户、有什么样的痛点,多多少少在回答同一个问题。
Ashley :可以用一个词概括一下 2025 年手机行业在 AI 领域的尝试吗?
姜昱辰 :用一个词的话就是「八仙过海」,不知道大家最近有没有关注自己手机上的变化,不管是 OPPO 还是友商们,大家做得挺激进的。比如 YOYO 做了很多智能体执行的工作,包括点咖啡;我们在记忆这条赛道上做了很多工作。
整个手机行业现在对于终局比较明确,形成了一些共识,比如要做无处不在、非常贴心的个人超级助理。但现在行业还是非常早期的阶段,所以怎么起步,从哪切入,各家有自己的回答。

姜昱辰和 Ashely 对谈手机 AI|图片来源:极客公园
Ashley :有点像智能手机特别早期的阶段。手机硬件形态没有收敛,系统的解法也没有收敛,甚至很多交互的解法也留有非常多的空白和想象空间。
提到 AI 手机,不得不提到豆包和努比亚合作的手机。这个手机搭载豆包手机助手,有非常高的系统权限的 GUI Agent。
作为手机厂商的视角是怎么来看这个事情(豆包手机)的?会不会给手机行业的方向和格局带来一些变化?
姜昱辰 :首先第一个怎么看的问题。我觉得「执行」还是一个非常确定性的方向,我们也在做非常多这方面的工作。
但是归根结底,GUI Agent 只是一个技术方案,最终要回到 为解决用户什么样的需求 。比如用户希望用 OPPO 手机点外卖、点咖啡,我们能不能帮用户做到,这个就是执行。是用 GUI Agent 的方式,还是 API 的方式,用户也没有那么关心。
我们作为手机厂商在这方面也没有倾向,更多还是看到在怎样的场景当中、什么样的技术方案最合适为用户解决问题。
第二是对方向和格局有没有影响,大概是没有。这个方向大家都在探索,(豆包手机)更多是把在小范围内探索的事情,更激进地推向公众舞台,让大家看到这个东西。这个是带来比较大的影响。
Ashley:当时你们内部有考虑过这条路线(GUI Agent)吗?
姜昱辰 :当然,我们一直在做相关的探索,但 我们内部更多认为 GUI Agent 是覆盖长尾场景的兜底方案。 因为我们的诉求非常多,非常不鲁棒(robust),需要这个东西去兜底。
但更大的服务用户的方式还是 Agent to Agent。我们不是一个公司、一个产品,服务用户;我们背后是美团、高德等一系列为用户提供服务的伙伴们。我们的态度是希望通过 Agent to Agent 的方式,通过生态的方式为用户提供最高质量的服务。
手机在这方面的尝试其实牵一发而动全身,因为它本身的生态位很特殊。应用的生态、OS 的生态,包括围绕着手机近距离场景的硬件设备生态,都会发生一些变化。
02
AI 手机的切入点:交互革命与「记忆」
Ashley :刚才您也提到大家对于下一代的随身计算设备的设想,可能是手机,也可能不是手机。它能够提供的理想体验,我相信大家有一些共同的想象,在科幻小说、科幻电影当中都有很多很向未来憧憬的画面。
从你一线的实践和观察的角度来看,这件事情(下一代随身计算设备)往前演进切入的第一刀是什么?
对比在智能手机时代,那个第一刀是 iPhone 出现的时候,把电容屏和屏幕交互的方案做到可以突破临界点的交互体验交付给大家,随即而来掀起整个智能手机时代。
姜昱辰 :这是很好的问题。在消费电子行业,每一次巨大的变革都是 交互的革命 ,人们获取资讯和服务的方式发生了改变。比如从功能机到智能机,原来通过打电话定外卖,现在 APP 点外卖;原来看报纸获取新闻,现在在今日头条里刷新闻。
从智能机到所谓的 AI 机,同样还是这个逻辑。问我最重要的是什么?还是交互革命。
我们未来早上起来,手机给我个人化的简报,告诉我人工智能昨天的重要大事是什么;出门的时候弹一个高德打车,问你是否要打;中午吃饭的时候告诉你,感觉你昨天很想吃大闸蟹,刚好旁边在打折,你要不要吃大闸蟹;到月末的时候,它弹出来告诉你,我知道你很想吃大闸蟹,但是我们没钱了,你要不考虑考虑楼下那个沙县小吃。你说 OK,就把外卖点上了。
未来可能是这样的资讯和服务的获取方式。
你问我第一步是,这有点像前面的问题,各个厂商的回答不一样,都在八仙过海。
OPPO 的话,我们认为是 记忆, 记得你才能更懂你。我前面描绘的场景都需要极度了解用户。不管做执行,还是给你资讯,都要足够了解你才能真的为你提供贴心服务。这个都是建立在理解你的数据、理解你的行为、理解你这个人的基础上。所以我们 OPPO 选择先做好记忆。
Ashley :记忆这件事,大家都在做,包括模型厂商和应用层,甚至中间出现很多创业公司就专攻记忆层,可见大家多多少少也有一些共识。但同样具体的落地和解题方法还是不一样,能感觉这个事情似乎挺难的。
这件事的痛点是什么?
姜昱辰 :我们的 slogan 是记得你才更懂你。对我们来说,做记忆这件事情首先是为了懂用户,大方向上是希望做到非常懂你的个人助理。这个事情需要我们对用户的数据有理解,对你的记忆有理解。
回到做产品本身,最终要为用户解决痛点。理解你的个人当中就有很多痛点可以帮你解决。
比如用户生活当中有非常多琐碎的信息记不住,我理解你的日程就可以回答你,明天在极客公园的活动是几点。
比如你今天看到了一篇公众号的文章很感兴趣,可以一键闪记。后面就可以问我上次看的那篇文章当中的某句话怎么讲来着?它就可以告诉你。
在琐碎信息的理解和提醒这件事情上,我们已经可以为用户提供很多服务,解决用户很多痛点了。
Ashley :我感觉小布记忆是把各种应用和 APP 收藏的动作整合起来了,这是用户的主动行为。
姜昱辰 :我们在 OPPO Find X8s 上线时的第一心智定位就是「跨 APP 收藏夹」。先做好这个第一心智的价值,后续才能帮你连点成线、整理回忆、做更多洞察。
Ashley :为什么当时从这个点切入?像相册里也有很多沉淀的数据,这些数据天然是用户生活流的记录,在这里也能挖掘出用户价值。
姜昱辰 :我们从用户痛点角度思考问题。
现在我们每天通过手机接收到的信息是爆炸式的,各种各样的信息混杂在工作软件、微信等各种不一样的地方。这个问题是相册本身解决不了的。
数据不等于记忆,我们的工作是把数据处理成记忆,让你不再为琐碎、爆炸且无头绪的生活感到困扰。只需要轻轻一问就能获取到想要的所有资讯,这是我们做的第一心智。把所有的东西通过一键闪记归集到小布记忆以后,它给用户提供的第一个价值就是让你的生活更井井有条,像你的第二大脑,帮你记住和管理你各种琐碎的事项,让你有时间处理更重要的事。
03
记忆的深度构建与隐私挑战
Ashley :小布记忆目前的交互方式是用户主动发起,我告诉我的手机,它才记录。它形成的记忆关于我的画像,似乎只是断点的画像。
这个距离我们理想当中的交互方式,似乎有很长距离,这个距离怎么跨越?
姜昱辰 :我们在 OPPO Find X9 这一代也做了自动收藏、自动记账功能,但我们在这上面相对比较谨慎。我们充分告知用户,并且对于收集的每一个来源都有开关——可以选择开还是关。 做记忆这件事情最重要还是保障用户隐私,要给用户充分的知情权 ,不然这个事情是很恐怖的。
而且我们是一家手机厂商,相对在做这件事情上会更加克制。这个是我们短期的回答。
长期来说,希望构建对用户 24 小时全方位的了解,当然是在用户充分授权的基础上。
Ashley: 小布记忆最理想的状态下,它能够形成的记忆框架,可能会是什么样的状态?
姜昱辰 :用更 toC 的用语来说就是第二大脑。
拆解下来:
第一层是 数据理解, 就是对不一样的数据源有充分的理解,理解能力,理解你的照片,理解你的视频,理解闪记的文章,理解你的行为轨迹……
第二层是 连点成线, 比如今天我的手机知道我在极客公园,也看到我昨天一键闪记今天的日程,也知道我跟 AI 聊过相关的话题,它能连接起来变成一个事件。
第三层是 连线成图。 比如我认识 Ashley 也挺久的,关于你的一切东西都可以被 link 到 Ashley 这个人节点上,就变成了一张图。我和 Ashley、极客公园等等一些事情之间的关联度,在线的基础上变成图。
总体来说,就是把数据变成记忆,把记忆连成线,把线连成图。
Ashley :你估计这个时间轴大概是多长时间?
姜昱辰 :其实也挺快,1-2 年内就会有非常不一样的体验。

姜昱辰和 Ashely 对谈手机 AI|图片来源:极客公园
Ashley :你是技术出身, 你觉得整个把记忆这件事情做好,是纯工程层面的问题,例如我堆人堆时间、找到足够的资源就能实现;还是里面存在技术上的断点和难点需要克服?
姜昱辰 :技术上来说有蛮多挑战,最现实的是隐私问题。不管豆包手机还是很多 AI 功能、AI 厂商,大部分数据都在云侧进出,你要构建用户的 3D 画像放在云侧,隐私问题是很多用户担心的。
这个解法非常单一,只能通过端侧化解决,把你的数据和计算留在端侧。
但这样又会引发功耗的问题。比如 32B 模型现在在屏幕理解方面可以做得比较好,但 32B 模型压缩到手机上要占 16GB 的内存,这个问题怎么解决?
但我是乐观派,我觉得 2-3 年会得到非常好的解决。
还有一个是记忆系统,如何做到自动更新,甚至是遗忘。
遗忘这个事情现在大家讨论比较少。可能以前你喜欢吃辣,现在不喜欢吃辣,这都是需要更新的信息。
记忆系统如何更新、如何遗忘,这也是非常大的挑战。我们有五个词形容这个事——安全隐私、即插即拔、 主动推理、自动更新 、端云结合。这是我们认为至少手机的记忆系统应该有的 5 个特性。
04
未来 AI OS 的定义与架构
Ashley :手机毕竟还是运行在 OS 上的,包括所有为用户交付的服务也是依托于服务商的应用来存在的。 AI 手机时代的 OS 应该是什么样的?里面到底是哪些重要的素质?
姜昱辰 :这是一个很大的问题。
OS 的存在完全是基于硬件形态,在 PC 时代有 PC OS,在智能手机触屏机的时代有安卓,都是基于硬件的交互形式存在的。
如果问我 OS 的本质是什么,我觉得是交互。主动式和个人化,这是 AI OS 应该有的两个非常大的属性,
再多加一条就是高效。我今天跟它说一句话就能做到,我原来要打字打很久,点好久,现在我随便讲一句话就知道,这就是我心中 OS 的想法、形态。
其中什么是最重要的,如果让我一定选,当然是懂你,只有懂你的 AI OS 才能真正为你提供这些服务。
Ashley : 你们怎么样构建整个 AI OS 的,有哪些核心的层级?
姜昱辰 :我觉得首先是硬件层。它是物理相关的,在我们手机的形态还没有改变的时候,它底层终归是芯片调度,怎么做流畅,这些调度的事应该是最底层的。
在上面可能构建的是一些系统级的能力,我们称之为端侧计算。
还有记忆引擎,就是理解你手机上你的数据,构建关于你的记忆系统这一层。
第三个是智能体框架。前面也说我们挺重视执行这个事,我们更多更倾向是通过 A2A 的方式去做,就是在手机上怎么去与其他服务商的 Agent 进行交互。
在它之上有一个懂你的超级助理的应用层的服务,我们是这样的架构。
Ashley : 有没有可能在安卓之外长出一个新的开源 OS?
姜昱辰 :有可能,当年安卓长出来也是因为智能手机的普及,硬件形态导致了 OS 的出现。所以现在是一样的。
但也有不确定的地方,在于硬件形态大家都还没有完全的共识。OpenAI 更激进,它在考虑没有屏幕的硬件,那你说它是手机吗?
我们可能不那么激进,我们还是在原来的平台上去为用户服务。到最后硬件形态会收敛,有可能会有 iPhone 时刻,造成整个行业有一个共识的收敛。这个收敛以后,就会出现一个针对这个硬件形态的 OS,我相信这一定是会发生的。
Ashley : 觉得未来助手和 OS 会是什么样的关系?
姜昱辰 : 1、ColorOS(OPPO 的系统)注定会变成一个真正的 AIOS;
2、小布(OPPO 的 AI 助手)是 ColorOS 的拟人化表达。
05
如何避免成为「诺基亚」
Ashley :最后一个问题稍微有点挑战,从功能机到智能机迁移的过程中,诺基亚从之前的霸主地位一落千丈。 在 AI 时代如何避免成为智能手机时代的诺基亚? 你们内部对这个问题有过深入的探讨吗?
姜昱辰 :当然,我们内部的探讨非常多次。
我相信从智能机到 AI 机是一场大变革,这是大家共识的。但这个变革会发生什么,会怎么发生?事实上大家是没谱的,现在还是行业非常早期。
你回头看上一次变革,从功能机到智能机的时候,我们也挺晚的入场。我记得当年 OPPO 功能机还备货很多,那一年瞬间智能机开始主导市场,我们的功能机滞销了,这是比较大的挑战。
那次潮流当中,大家认为诺基亚掉队了,其实诺基亚做触屏机非常早,早于我们,甚至早于苹果。他不是没有做触屏机的尝试,也不是没有在做触屏技术新的 OS、新的形态推出。
那么问题出在哪儿?
我们内部也做过深入的探讨,我们有感觉,当时诺基亚整个团队更多在关心市场份额。他已经是行业老大了,多多少少就没有用户导向了,这个可能是他们所面临的一个真正的问题。
我们看到了用户的需求,这个导向下我们也会做出快速反应,这是最核心的。用户导向,倾听用户的声音,实际解决用户的问题,响应用户和市场的诉求,这个我们相对来说还是比较有信心的。
王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」
整理|Moonshot
编辑| 靖宇
在开源模型全面崛起的这一年,医疗已经成为大模型比拼的主战场之一。OpenAI 抛出 HealthBench,试图建立统一评价体系,OpenEvidence 等 AI 医疗公司愈发受到资本青睐,大众对 AI 医疗的接受程度也在不断提升。
因为 医疗牵动的是人类最本质的课题:生命科学。
在现实层面,日益增长的慢病管理需求、快速老龄化带来的系统压力、平均 73 天翻倍的医学知识量、都让传统医疗模式愈发吃紧。伴随式护理、个体化治疗、实时决策支持……这是每一位患者的需求,亦是每一位医生的压力。
在 IF 2026 的舞台上,王小川不仅展示了百川智能在医疗大模型领域的底层积累,更 首次公开了其打通医疗全流程的最新解法——一套由「MAM 决策 AI」与「PAPA 陪伴 AI」构成的双轮驱动架构 。
如果说「MAM」(Medical Augmented Model)是坐镇院内的「外挂大脑」,依靠高可靠性的决策能力辅助医生「把病看准」;那么此次 重磅首发的产品 AI PAPA(PlayBook Animated Proactive Agent) ,则致力于在院外接手,解决「把人管好」的难题。
相比于传统 AI 被动问答的模式,PAPA 带来了一次交互范式的革新。它基于独创的 PlayBook(行业 SOP)技术 ,将晦涩的临床指南转化为可执行的动态方案。它更像一位拥有长期记忆与多模态感知能力的家庭医生,能够以月甚至年为单位,从提醒用药到动态调整健康计划,主动追踪并管理患者的康复进程。这种「MAM 主内、PAPA 主外」的协同模式,标志着百川智能真正构建起了从严肃医疗诊疗到主动健康管理的完整闭环。

王小川在 IF 2026 舞台上|图源:极客公园
过去一年,百川智能在医疗领域的实践,也确实走出了行业少见的「从模型到 Aengt 系统、从技术到场景」的落地路径。
从与多家三甲医院联合验证临床可靠性,到让模型真正在专家会诊中心「上岗」;从辅助医生提升诊疗能力,到帮助一个个具体的病人,补齐医生都未掌握到的信息差……百川正在做的,是把大模型变成医院能用、医生敢用、患者愿意用的工具。
因此,这篇演讲更像是关于未来医疗形态的一次深度预演:当医学知识、临床路径、真实世界的健康数据在一个平台里被激活,它就不再只是 AI,而是一个新的医疗基础设施。
以下是百川智能创始人、CEO 王小川在极客公园创新大会 2026 上,关于医疗 AI 如何从理念走向落地,在真实世界中改变每一个人的健康决策的演讲实录,由极客公园整理:
嘉宾观点:
· 如果说财务自由意味着「不缺钱」,那么生命模型的终局则意味着「生物自由」,也就是不缺健康。
· 做医疗不仅是把模型应用到垂直场景,而是在回答:AGI 是否成立、如何成立,以及如何向前推进?
· 智力模型用来「造医生」,而当数据充足、范式改变后,我们有机会真正走向生命的数学模型。
· 我们认为做 AI 医生比做无人驾驶更靠谱,更刚需。
· 医疗中「人机协同」的速度,可能会超过无人驾驶的发展。
· 医学增强大模型既要有一线的通用能力,又要在医疗领域表现更佳。
· 我们的目标是让所有人都能即时获取可靠医学知识。
· 全球平均每 73 天医学知识就翻一倍,临床与前沿之间天然存在时间差。
· 过去我们做的是「医学增强大模型」,主要聚焦于决策 AI;而今天进入「陪伴」时代,我们构建的是完整的医疗 AI 平台。
· 大多数模型做的是单次任务,而我们做的是主动性的、长期的陪伴与管理。
极客公园创新大会的各位朋友,大家好。
今天我想和大家分享百川智能在医疗领域的一些思考与实践。从 GPT 诞生至今已经三年,我们正处在互联网的深度变革期,也亲眼见证人工智能在生活中的全面渗透。
百川是在 2023 年 4 月成立的,那时我写了一封公开信,分为两个部分。
第一部分讲的是我的技术认知:当语言被抽象为数学后,我们的思考、学习、沟通,乃至文化,都将成为数学问题。
第二部分谈的是使命与愿景,我提到在未来 20 年,希望能在生命科学与医学的发展中,以及公众健康领域,贡献自己的力量。
因此,百川一方面拥抱 AI 技术的演进,另一方面坚定地投入医疗与医学的未来。

图源:极客公园
01
生命模型带来的「生物自由」
在我的世界观里,如今的模型体系可以分为三类:
第一类是发展最快的「智力模型」,以语言为入口,对人类智力进行数学化;
第二类是「物理模型」,从牛顿以来用公式建构物理世界的方式延续至今,逐渐进入带有量子、核聚变等复杂因素的时代;它帮助我们造工具,而不是造智力;
第三类则是「生命模型」,以 Alpha 系列为代表,用数学方式理解基因、蛋白质及生命过程的预测机制。
基于此,我们今年提出了更明确的使命:为人类造医生,为生命建模型。这两件事一横一纵: 智力模型用来「造医生」,而当数据充足、范式改变后,我们有机会真正走向生命的数学模型。
如果说财务自由意味着「不缺钱」,那么生命模型的终局则意味着「生物自由」,也就是不缺健康。
医疗是高度垂直的领域,我认为想把「医生」这件事做到极致,必须发展通用模型。
图灵曾提出:能与人类自然对话的机器就算智能。而在我看来,如果我们能造出一个像医生一样思考、判断、决策的 AI,那它在智力层面就已经达到 AGI;如果它能进一步完成手术和实际操作,则在具身层面也达到了 AGI;如果它能持续自主做科研,那它还具备了自我进化能力。
因此, 做医疗不仅是把模型应用到垂直场景,而是在回答:AGI 是否成立、如何成立,以及如何向前推进?
回到现实,行业里仍有许多质疑,例如:AI 如何学习医学认知?是否具备同理心?伦理上能否上岗?我们早期的训练范式基于医院中的高质量病例,但医学更多依赖「生理信号」,比如 CT 片和 X 光。
但医生不只是读片子,更多是用强化学习去模拟出一个病人,所以如果 AI 想像医生一样成长,就需要一个「患者模拟器」,能够在强化学习中反复对照与校验。这是整个范式的基础。
至于同理心,行业里有统计:在某些测试中,GPT 的「同理心得分」大约是 45%,并且在以后会变得更有同理心,更懂情绪。而真人医生只有 4.6%。虽然这个数字仍有争议,但至少说明:机器不是不能具备「人味」。
如今大家都在做无人驾驶,无人驾驶也跟生命高度相关,我们认为做 AI 医生比做无人驾驶更靠谱,更刚需。因为没有无人驾驶,大家依然能开车;但没有医生为你看病,你自己没有诊断能力。
无人驾驶最大的挑战叫「接管」,即机器搞不定时必须由人类接手。而医疗恰恰相反,AI 与医生可以形成天然分工,AI 做大量辅助判断,医生做最后把关。 因此医疗中「人机协同」的速度,可能会超过无人驾驶的发展。
今年以来医疗 AI 也出现了重要进展。
第一个典型案例是在今年初,患者开始带着 DeepSeek 去看病了。与过去医生不信 AI 的态度不同,现在,医生认可了 AI 在推理上的价值,甚至私下开始用 DeepSeek 和豆包查询。
第二个案例是,OpenAI 也在今年 5 月发布了 HealthBench,这是由全球 60 国、262 位医生构建的首个「临床问题」级别的评测集,为行业定下标准,也意味着 OpenAI 开始认为医疗是 AI 发展的一个重大方向。
同期,有一家诞生于 2023 年,异军突起的公司 OpenEvidence,在八月以 60 亿美金开始新一轮融资,它已经不只是帮医生做语音转写病例,而是做「辅助决策」,目前美国已有 40% 的医生注册使用。这说明全球医生正在拥抱 AI,顶级公司也把医疗视为战略方向。
医疗相关话题的人工智能搜索量,也在今年爆发性增长。在 DeepSeek 和豆包上,约 20% 的检索已经和健康相关,百度此前这一比例是 10%。
02
医疗增强大模型该怎么做
在我们的路线图里,AI 首先要帮助我们「造出一个医生」:它能替代或承担那些医生做不到、或者不愿去做的工作。
更重要的还有两个愿景:其一是「改路径」,这在明年就有可能开始显现,即让医疗行为不再仅仅限定在医院内部。很多人觉得医院体系难以改造,我也认同这点,所以我们的设想是,AI 的应用场景除了在医院做辅助判断之外,还能够大量下沉到居家和院外场景。
其二是一旦 AI 医生能够上岗,它就能长期陪伴个体,持续监测你的健康数据。从抽烟、喝酒到药物反应、疾病进展,在关键数据出现时,推动临床实践产生新的范式,不再把医学仅视为离散的点状决策,而是形成连续的、可学习的临床循环。
实现这一目标的第一步,是让 AI 在决策上做到优于甚至超越人类医生,成为医生的「外挂大脑」。
医学增强大模型既要有一线的通用能力,又要在医疗领域表现更佳。
我们常把知识分为文、理、医、工、艺五大类:文科以语言为主、理科以数学为主、工科以代码为主、艺科以图像与视频为主,那么医学的训练范式到底应该是什么?
目前的核心任务可以归为三件事:第一,如何做出更精准、更接近临床思维的医学推理——这是诊断与决策的核心,我们已经引入临床医生参与验证与闭环;
第二,如何确保安全可信。模型会出现「幻觉」,我们要大幅降低幻觉率,并让模型具备「知其所不知」的能力;
第三,如何实现循证决策。医生不能单凭经验行医,必须依托循证医学,把零散的论文、指南、荟萃分析等证据进行规范化、统计化和等级化处理。
为此,我们一方面用大量高质量医学文献训练模型,另一方面构建「患者模拟器」用于强化学习的闭环验证,文献与模拟患者两者并重,构成训练体系的基础。

参考培养人类医生的路径去训练大模型|图源:极客公园
在这一系列范式下,我们从去年 8 月与儿童医院合作开始,到今年 1 月发布 M1 模型,AI 医生已经在北京儿童医院专家会诊中心「上岗」,成为国内甚至全球第一个真正「上岗」的 AI 医生。
随着团队专注度的提升,今年 8 月,我们正式推出了 M2 模型。彼时正值 OpenAI 宣布其开源模型在医疗领域「全球第一」。一周后,M2 在 OpenAI 自己提出的 HealthBench 测试中,开源模型里排名第一,闭源模型里只落在 GPT-5 之后。
OpenAI 曾强调全球只有它的模型在 HealthBench-Hard 模式下超过 32 分,而我们成为唯一同样跨过 32 分线的第二家引擎。
10 月,我们进一步发布 M2 Plus,让模型在六源循证的数据总结和论文学习方面有更强表现。整体幻觉率只有 DeepSeek 的三分之一,在医学知识运用上也全面追平甚至超越了 DeepSeek、GPT,以及美国的 OpenEvidence 引擎。
基于这套底层引擎,我们在 10 月同步推出了新版「百小应」, 目标是让所有人都能即时获取可靠 的 医学知识。 现阶段我们优先开放给医生,希望医生成为第一批深度使用者,因为他们更有能力判断信息、反哺模型。
举个简单例子:今天在小红书搜索「维生素 D 是否能治疗癌症」,各种模糊、夸大的结论铺天盖地。但与百小应对话,它能在数秒内基于可靠证据链给出结论:补充维生素 D 能降低癌症风险尚无明确临床共识,现有证据显示其效果有限且存在争议,并能进一步附上对应的顶尖论文。其他模型常常给不出明确答案,给出的只是一些「似是而非」的模糊判断。

如今从「百度看病」流行到「小红书看病」|图源:极客公园
模型上线以来,不仅有医生在用,甚至有高认知的患者也在用。我们注意到一位用户单轮对话超过 300 次,主动联系后得知他是北京的朱先生,58 岁,之前做过医疗创业,有很强的医学背景,5 年前因甲状腺癌做过手术。
他向我们展示的第一句话很震撼:他感谢百小应告诉他「优甲乐需要减量」,这是指南里写得很清楚、但某三甲医院的医生却没有提醒的关键信息。因为没有按指南减量,他多年深受甲减亚健康困扰,在体重、睡眠各方面都出现了问题。随后他带着模型生成的资料回到三甲医院与医生沟通,对方才意识到 2022 年指南已更新。
这是一个非常典型的「医学知识更新速度远超临床实践」的现实案例。 全球平均每 73 天医学知识就翻一倍,临床与前沿之间天然存在时间差。
在这些实践的推动下,我们开始构建「陪伴 AI」。
03
PAPA: 主动陪伴患者的医疗 Agent 平台
创业之初我们想做院外医疗,如今我们把它定义为 决策 AI + 陪伴 AI 的双系统结构。其中陪伴 AI 的核心能力是主动:它不再只是「有问才有答」,而是能提问、分解问题、规划健康路径,从被动回答进化为长期健康管理代理(Proactive Agent)。
我们现在能做到让模型主动规划和关心你的健康,包括医嘱服从,提醒你什么时候该吃药、就诊。当你说身体不适,它会建议你去体检,并在下周主动追问你是否完成;当你吃了布洛芬,它会在两小时后询问退烧情况并追踪病程;甚至接入可穿戴设备后,它能根据生理指标异常主动介入做干预。

百川智能想做更主动的 AI 医生|图源:极客公园
这件事情说起来简单,做起来很复杂。
以孕产期糖尿病为例,我们已经让 AI 系统根据指南完成全程健康规划:胰岛素调节、饮食管理、产检计划等均可自动执行,实现真正意义上的「主动健康」。
我们现在的底层架构,是一个多任务调度系统。此前我们构建了一套 PlayBook 专家范式,实现了医学知识生产的「产业分离」。
产品经理和医学专家可以共同撰写管理规范,包括临床路径、决策方式、沟通方式,以及中间记忆的设计。针对不同疾病与专科,例如孕产、肿瘤、全科、儿科等,各类指南都可以写入 PlayBook。
系统会根据这些内容自动外显成一名「专科医生」。我们把这种具象化能力称为 PlayBook Animated: 当你给它一本操作手册或战术手册,它就会「活过来」,变成一个会思考、会对话、能记忆的医生。 同时,它还能接入个人的长期健康数据,包括内置的个人档案以及来自可穿戴设备的生理信息。
这也标志着我们范式的重大变化:过去我们做的是「医学增强大模型」,主要聚焦于决策的 AI;而今天进入「陪伴」时代,我们构建的是完整的医疗 AI 平台。 PlayBook Animated Proactive Agent(PAPA)就是基于这个理念打造的。
当增强模型与 PAPA 平台结合,我们认为是一种「双剑合体」:一个负责「训模练内力」,一个负责「招式与实战」。两者结合,我们在医学领域才能真正向前推进一大步。
与当前市场上的模型相比,PAPA 最大的不同是: 大多数模型做的是单次任务,而我们做的是主动性的、长期的陪伴与管理。 它不是靠一套 prompt 运行,而是根据多个专业 PlayBook 生成多种范式,支持以「月」为单位、甚至以「年」为单位地持续工作,主动进行干预,同时在背后保留完整的个人健康档案与长期多模态数据。
PAPA 更像一个医疗操作系统:在应用层把 PlayBook 转码成长期规划与解释执行能力;在能力层运行疾病预测模型、工具调用系统;在数据层存储聊天记录、时间序列数据库,并连接外部环境。同时它还具备自我调试与开发环境:当出现 bug 时,系统能够自动分析并迭代自己的执行方式。
当你提出一个问题时,系统会自动根据 PlayBook 触发整套流程:判断、搜索、聚合、输出;你继续追问,它会继续调用 PlayBook、选择技能、给出解释。无论是流行病相关药品查询,还是证据链核验,它都会生成结果并进行安全校验,校验不通过会自动回滚,确保输出是可信的。

扫码体验 PAPA Playground|图源:极客公园
系统不仅支持文字,也支持语音、图像、地理位置等多模态交互。比如我们演示的试剂盒检测,PAPA 会自动要求你做两次测试;背后我们有独立的多模态模型识别红线,并达到极高精度。这是现有专业模型和通用模型普遍难以做到的深度多模态处理能力。
服药之后,系统会生成后续规划、任务提醒,更新健康档案,再过一段时间提醒你复测,并解释数值变化。包括像「中午记得吃药」这样的提醒,它都会自动触发并执行。
如果有医学行业的朋友希望开发自己的 PlayBook,系统内也提供了合作方式,可以一起把这套体系打磨得更专业。除了 PAPA 平台,我们也开放底层引擎 API,欢迎大家使用我们的「百小应」。
今天就介绍到这里,谢谢大家。
