普通视图

发现新文章,点击刷新页面。
今天 — 2025年12月11日极客公园

朱啸虎投资,Refly.AI黄巍:n8n、扣子太难用,Vibe Workflow才是更大众的解决方案

2025年12月11日 17:55

种子轮拿到数百万美元融资、估值近千万,朱啸虎的金沙江创投、高瓴创投和 Classin 共同投资。

Refly.AI 给自己的定位是更适合大众的 Vibe Workflow 产品。

为什么要做 Vibe Workflow?原因很简单,现在的 Workflow 产品 n8n、扣子都太难用,以及团队对于 Workflow 价值的认可。

他们的目标,是让不会技术的人也能轻松把自己的流程经验复制并分享给其他人,实现价值。

不仅仅是用 AI 来降低搭建 Workflow 的难度,Refly.AI 还把 n8n 中的节点升级成为单独的 agent,每个 agent 配上 2-3 个工具。在保留 agent 动态性的同时,获得传统 Workflow 的可控性与稳定性。

看起来有些激进,但 Refly.AI 确信这样的方式才是有效利用模型能力的最好方式。

为什么如此笃定?既然做 Workflow,怎么控制成本,怎么保证完成度?Refly.AI 取代 n8n 的底气又来自哪里?

在 Refly.AI 的新版本发布之际,我们和创始人& CEO 黄巍聊了聊,想搞清楚,AI-native 的 Workflow 应该长什么样。

以下内容经 Founder Park 编辑整理。


超 17000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群:

 

 

进群后,你有机会得到:

  • 最新、最值得关注的 AI 新品资讯;
  • 不定期赠送热门新品的邀请码、会员码;
  • 最精准的AI产品曝光渠道

 

01

Vibe Workflow:

agent 的智能+workflow 的可控

 

Founder Park:Refly.AI 现阶段的功能定位,也就是 Vibe Workflow,应该怎么理解?

黄巍: 从 AGI 发展主线来看,一端是以 Manus 为代表的 Agent 形态,本质上这是一套基于自然语言驱动的 Workflow:用户给出一句指令,系统自动完成后续任务。另一端则是以 n8n、Dify 或纯代码为代表的传统 Workflow,更强调精确性,可以对程序行为进行细致建模。

在实际使用中,这两种都存在明显问题。以 Manus 为例,整体成本高、稳定性不足、执行时间难以预期,更关键的是,同一位用户多次提交相同指令时,产出的结果往往并不一致。而在 n8n 或 Dify 等工具中,一旦流程稍微复杂,就需要通过编写代码来维护 if-else 等控制逻辑,对非程序员用户非常不友好,也抬高了使用门槛。

我们认为 Workflow 本身有价值,希望在保留 Agent 动态性的同时,获得传统 Workflow 的可控性与稳定性,所以 把 Agent 和 Workflow 结合,统称为「Vibe Workflow」。

它的核心特点有几层:

首先,搭建成本无限降低,一句话就可以搭 Workflow。产品的核心在于将 Agent 进行白盒化,提供一套「Agent Editor」,并在此基础上对 Workflow 的底层结构进行了重构:每一个节点本身都是一个 Agent,用户只需为 Agent 编写 prompt、选择合适的 tools,系统即可完成多步规划与问题求解;相比之下,传统 Workflow 中的单个节点往往只负责调用一个 API 或执行一段代码。

第二,我们给每个 Agent 一台沙箱,让它操作电脑去写代码、根据我们给的 tools 做数据拉取等操作,再做可视化呈现,解决 if-else 逻辑。传统 Workflow 里复杂的 code 流程,现在全都可以省略,变成一个节点。内部测试显示,在相同任务下,一个 Refly.AI 节点可以替代大约 20 个 n8n 节点的功能。

Refly.AI 的交互形式

这样, 用户面向的 Workflow 被极大地简化了,所有操作都是自然语言表达,不需要懂搭建逻辑 。同时,我们让每个节点任务足够简单,即使像 Kimi K2 这样的模型,也能近乎 100% 完美解决问题。再通过稳定的编排引擎串联起来,只要我们的节点数量和复杂度上去了,理论上我们可以解决无限的问题。在我们内部有一个说法,Refly.AI 已经达到了所谓的 AGI。

Founder Park:如果每个节点都是一个 Agent,成本会比 n8n 贵很多,会比 Manus 便宜很多吗?

黄巍: 整体算下来,通过 copilot 配合,用 n8n 搭一个 8 到 10 个节点的流程,可能要花 3 到 6 个小时,加上中间的调试成本,估计至少也是大几十万 token 的消耗。但是在 Refly.AI,一句话生成 Workflow 本身消耗的 token 是非常低的,可能也就几千甚至上万个 token,现在 Kimi K2 这样的模型已经能够非常好地完成这个任务。

执行层面,我们让每个任务都变得简单,每个任务被简化为简短具体的 Prompt,可一次性执行完毕。该过程仅消耗 1 至 2 个积分,成本约 0.1 至 1 元。相比 Manus 单任务数美元的成本,这降低了至少 5 至 7 倍,而且其他人可以复用这个成果。后续调用时,token 消耗可能仅为原本的 50% 甚至 10%。

Founder Park:传统 n8n 的很多节点有确定的结果。但你们的 workflow 有四五个 Agent 节点,如果每个节点输出确定性达不到 100%,四五个节点下来,折损就会比较大。这个怎么解决?

黄巍: 这是这是产品选择上的一个折中。既然选择了 Vibe Workflow,并且每个节点都是 Agent,肯定达不到 n8n 的准确度。我们放弃了一部分的准确性和稳定性,去换取更大用户规模的使用。

核心策略在于通过大幅降低使用成本与门槛,来平衡用户对准确率的诉求。本质上,这是 试图用门槛降低 10 倍的优势,去换取稳定性降低 1 到 2 倍的代价。

我们的场景和 n8n 也不一样。n8n 多用于 RSS 监听与分析,而我们更强调内容产出。用户组合多模态、音频、视频模型,产出一篇报告或一个数字人视频。这些模态对准确率的要求不高,只要 70% 内容是对的,听上去有用,用户就觉得 OK。

我们完全放弃算了数字或企业自动化操作这种非常准确的场景。虽然是 workflow,但更强调为用户产出一个创作结果,比如小红书文案或概念讲解 PPT,用户获取结果后可下载并进行二次微调。

我们希望为用户提供 80% 有用的结果,用户愿意为它付费,并做二次编辑。未来我们还会提供大量的编辑能力,让用户闭环地完成编辑工作,但这是长远考虑。

Founder Park:也就是说,Refly.AI 现在能满足大部分 C 端用户有 AI 参与的一些内容生成型的任务。

黄巍: 对,我们不是做那种企业里需要 100% 稳定的 automation 任务。

Founder Park:那你们现在定义的核心用户画像大概是什么样子的?

黄巍: 早期,我们更倾向于那些有 n8n、Dify 使用经验,但觉得搭建很复杂,或者在寻求简单替代方案的用户。以前他可能用了别人的 Workflow,或者复刻某个大 V 的 Workflow,觉得挺好用,但自己不会改。

我们希望这群人来到我们平台,为此,我们在产品设计里有一个非常重要的动作,就是把 n8n、Claude Skills 或者其他 Workflow 平台做迁移,甚至是产品化的迁移功能。也就是说,你可以一键把那边的东西导过来,放在我们平台上运行。这是我们的第一批用户。

第二个场景,是我们自己有体感、也确实能解决问题的场景,就是现在定义的自媒体场景。为什么选这个?因为我们发现,现在模型每天都在更新,今天是 Gemini,明天是 Claude Opus。这些模型单点使用不会产生多大作用,但很多自媒体用户想把它们串起来,比如把 Claude Opus 和 Gemini 串成两到三个节点的工作流,做一个完整的产出,然后拿它去写文章、录视频。这类需求非常多。

另外,还有很多用户觉得每天跟热点压力很大,经常跟不过来。那能不能用 Refly.AI 搭一个工作流,每天自动抓热点,再按照自己的风格,批量生成文章或播客内容,然后去做推广和投放?我们自己也活跃在 Twitter,有大概 3 万粉丝,对这个场景有比较强的实感,也看到这里确实需要这样的工具。所以这是我们第二波重点的小规模场景:一方面我们有体感,另一方面用户确实有需求。

第三个方面,是这个方向的 ROI 和放大效应都非常大。如果有一个自媒体用户觉得这个工具有价值,用起来了,其实就相当于把他的粉丝一并覆盖和辐射到了。这也是我们早期重点面向的用户群。

在这个基础上,如果我们能把自媒体场景打深打透,还可以继续向外扩张。比如教育场景,或者职场白领场景,像写报告、监控内容、做产品分析等;再比如偏金融场景:某个财报发布了,希望基于它,用「巴菲特视角」写一篇财报分析等等。我们往外扩的时候,会更多聚焦在这类偏赚钱、偏职场、偏教育的场景。

 

02

用户的行为数据才是真正的数据飞轮

 

Founder Park:你们希望用足够多的 Workflow 模板来帮助很多普通用户解决他们的痛点问题。用 Workflow,是现阶段解决这个问题比较好的方式吗?

黄巍: 从长期来看,理想状态当然是:用户只需要说一句话,系统就能端到端帮他把事情做完。这是一个大家都在追求的美好愿景。但就目前来说,大家对模型的发展和能力边界都有一个基本共识:模型可以解决一部分问题,但仍然离不开人的参与。

所以现在会有「Context Engineer」这样的角色,强调要充分感知用户丰富的 context 和 memory。模型有能力解决问题、调用工具、写代码,但前提是:它要真正理解你的 context,要「活在」你的 environment 里,跟你保持同频协作,才能更好地帮你解决问题。

我们提出 Vibe Workflow,就是希望先把这个环境 build 出来: 用户来到 Refly.AI,可以把自己的知识,以及更重要的——自己的行为(action)沉淀下来

Action 是最关键的。

在传统的 Dify 时代,大家更多只讲「知识库」:你把知识丢进来,但知识本身的价值有限,因为模型不知道用户在真实完成一个任务时,具体的执行步骤是怎么走的,用户的思考路径是什么。缺少行为,这些知识其实很难发挥真正价值。

在 Refly.AI 里,从技术底层看,用户在跟 AI 交互的过程中,其实是在同步沉淀知识 + 行为。举个例子:你有一个需求,要抓 Product Hunt 上的内容发到自己邮箱。在这个过程中,你会不断表达个性化偏好:想抓周榜、日榜还是月榜?你希望抓完之后不仅生成音频,还想生成一个「双口相声」版本发给你?这些都是你的 preference。

在这个过程中,模型帮用户完成了第一层冷启动,而用户把个性化知识融进了自己的行为里,这整套交互就构成了用户和 Workflow 之间的一种「个性化经验 + action」。

对平台来说,这意味着:我们采集到了你最有价值的数据——你是如何围绕一个任务,完成一系列行为的。这有点类似今年大家常提到的 DeepSeek 的「思维链数据」:即模型在完成一个任务时,每一步的思考和执行路径。我们其实就在帮助用户沉淀这种「思维链行为数据」。

Refly.AI 目前推荐的 Workflow 模板

第二点是:一个用户在工作场景中的思维模式,其实是相对有限且可枚举的。比如一个内容工作者,日常工作大体就是几条路径:关注热点 → 做选题 → 产出内容 → 做分发。这些行为是可以被枚举出来的。

这就意味着,一旦平台能够把你的这些行为路径都枚举出来,真正感知到你作为内容创作者,在这个环境里可能产生的各种动作,我们就可以对「你这个人」做一个建模:在下一个时间点,出现类似情境时,你大概率会采取什么 action,我们是可以去做「predict next action」的。

有了这样的数据和预测能力,本质上我们就是在收集大规模用户在工作场景中的行为数据。

当数据量足够大,再配合持续的算法设计和尝试,我们就可以迈向下一步:在未来的移动端场景里,用户来到 Refly.AI,只需要表达一句话,我们就可以真正实现端到端、无接管地帮他把任务做完,而且结果是高度符合他个人习惯和预期的——因为我们掌握的是他最关键的行为数据。

这就是我们的一个更长远的目标:通过持续收集和建模用户的 action 行为数据,在工作场景下,有可能率先实现一种真正意义上的 AGI—— 一句话,端到端、无接管地帮你把工作执行完。这是我们长期的思考方向。

Founder Park:也就是说,Workflow 只是你们切入这个事情现阶段的一种方式。

黄巍: 对,它既是一种切入方式,也是收集用户 action 和思维链数据的最好方式 我们是在搭建一个环境,用来收集用户最有价值的数据。

如果只是一款 chatbot 产品,跟用户简单聊几句,没有任何真实的行为交互,你几乎收集不到他的行为数据。你最多知道他喜欢什么、不喜欢什么、现在在哪里,这类数据是非常浅的。我们希望走得更深一层,真正感知用户的 preference、action,以及他是如何完成一项工作的。我们认为,Workflow 是一个非常好的环境和媒介。

所以我们的出发点就是: 把 Workflow 这件事做得足够简单,让更多人进来用 。比如用户量从 20 万扩展到 2000 万,一旦有了这种规模的数据和偏好,我们就有能力去做「predict next action」——预测用户下一步行为。 这其实就是我们在技术层面更底层的意义。

Founder Park: 如果用户需求的 Workflow 是由模型给他生成的,那你们想要收集的 action 具体是指哪些?

黄巍: 如果你让 AI 帮你完成一件事,模型一次性就搞定了,那我们其实收集不到什么有价值的数据。我们真正希望看到的是那些中长程、复杂问题的解决过程。

在 Refly.AI 里,一个节点大致相当于 n8n 里的很多节点,我们等于是把底层那些细碎、价值不高的 action 屏蔽掉了。真正有价值的是:当用户要完成一个动作,需要很多步,而模型一次性解决不了,他就不得不和模型持续交互。

模型先生成一个 Workflow,如果用户去改某个节点的 tool 或 prompt,这其实就是在给模型做「审阅和反馈」——这是第一层反馈。

第二层是:以模型当前的能力,一次生成不到你想要的结果是很常见的。你在第二阶段、第三阶段继续生成,这些新生成要怎么基于现有的内容去参考和调整?这里面又会产生一轮反馈和交互。

最后,当你经过多次生成和修改,觉得这个 Workflow 差不多达到了目标,就会去运行它。如果这次运行没有报错、结果符合预期,这本身就是一次非常强的正反馈:说明你和 AI 之间围绕这个任务的整个交互路径,是成功的。

对我们来说,这意味着我们拿到了 用户在完成一个中长程、甚至更复杂任务的过程中,如何和 AI 交互,以及如何判断任务对不对、好不好的一整套强反馈信号。

而且,这个 Workflow 还可以被发布成模板到社区。其他用户来跑,如果觉得解决了自己的问题,会去评分、点赞,这又形成了新一层反馈。

所以在这个环境里,我们可以持续拿到多维度的反馈数据:

  • 这个任务最终有没有价值?完成过程中需要人接管多少次?
  • 整体完成效率高不高?比如:
  • 之前他要一个小时才能做完,下次是不是能缩短到半小时?
  • 现在要消耗 80 万个 token,未来能不能优化到 40 万?
  • 之前必须用 Claude Sonnet 4,能不能在不损失效果的前提下换成 Kimi K2?

在这些维度上,其实都有非常多可以优化的空间和场景。

Founder Park:这些 action 数据可以形成数据飞轮吗?

黄巍: 简单来说有几个层面:如果模型一次性生成,用户觉得结果很好,直接分享出去,这本身就是一个正向反馈;但如果用户需要反复交互、多次人工接管,或者觉得使用成本很高,这些也是非常有价值的反馈信号,会促使我们去优化产品,比如:能不能把原来需要三次接管,优化成一次甚至零次?

和传统 chatbot 不同的是,在那里用户问完一个问题转身就走,你很难拿到完整的反馈链路。而在我们的产品里,用户是带着一个明确目标来的:从提出需求,到完成目标,中间必须走完一条清晰的路径,整个流程会在系统里被完整记录。

在这个过程中,用户一方面会贡献自己的经验,另一方面也会直接给 AI 反馈:哪里错了、哪里没有满足预期。可能一开始,用户和 AI 需要三轮交互才能达成目标,我们的目标就是把这个交互次数、时间成本不断往下压,让效率越来越高。

基于这些数据,我们可以持续优化 prompt 和我们自己微调的小模型。比如:AI 怎么更好地根据用户意图拆分任务?怎么在上千个 tools 里快速选出最相关的那一个?这些都有非常明确的优化空间,也都有清晰的反馈指标,推动产品持续迭代,这就是我们所说的「数据飞轮」。

 

03

从画布到 workflow,

做能 scale、低门槛的产品

 

Founder Park:Refly.AI 从之前的画布定位到现在 vibe workflow,这中间经历了哪些变化?

黄巍: 现在这个产品形态,跟我之前在飞书的经历有很大关系。

我在飞书负责过字节最早一批「大模型 + 低代码 + Workflow」的项目 Aily,Coze 的核心成员也来自那支团队。所以,我们这批人对「AI + Workflow」有比较系统的认知。我自己在飞书做过程序员、产品、销售、设计和运营等各种岗位,等于把第一代低代码 Workflow 的全链路都跑了一遍:数据建模、流程编排、界面搭建、发布运营和权限体系。

第二阶段,是我们在飞书内部做的「AI 前沿 + 低代码」项目。简单说,就是用 AI 重构低代码的所有模块:AI 生成数据模型、生成流程、生成界面,甚至生成全栈应用。后来这个方向产品化,变成了 Aily。我们当时有一个判断:在 AI 时代,低代码会长出一种新形态——只要有一个足够强的 Workflow,就能承载搭建 App 的全过程。界面可以交给 AI 生成,数据可以作为 Workflow 的一个 tool,在流程运行过程中读写。

但产品对外之后,我们发现一个现实问题:即使给 Workflow 加了 AI,故事很美好、内部体验也不错,普通用户依然用不起来。本质形态还是传统 Workflow,只是加了一些 AI 节点,更像是 n8n 的进化版。我的总结是两点:

第一,Workflow 的价值是确定的,但要真正规模化,一定要让普通人能用得上;

第二,用户愿意为「先进的生产经验和流程」付费——飞书之所以能卖出去,很重要的一点是,大家希望买到的是字节跳动这家公司的先进流程。

这也是 Refly.AI 商业化的核心假设: 如果一个流程本身有价值,把它封装起来,是可以被规模化销售的。

即使不会搭建 Workflow,也可以找到自己需要的直接运行。

回到创业。我们一开始就想做 Workflow,但两个人团队上来就啃这么大的工程不现实,所以先从一个更小的切口做起:围绕「用户的 context 很有价值」这个命题,做了一个剪藏插件,让用户保存文章,再基于文章做总结和每日归档。后来发现最大的问题是 data connection 很难规模化,这条路就暂时放下了。

紧接着,随着 ChatGPT Canvas 和 Claude Artifacts 出来,我们意识到:如果已经收集了那么多 context,只做「总结」太浪费了,应该让用户在这上面写东西、创作内容,也就是 DeepResearch 的最初形态。但我们很快发现,这种形态要管理大量复杂 context,对普通用户的门槛非常高。

于是我们切到「画布」形态,把这个产品推向市场,结果火得很快,也顺利拿到了一轮融资。融资之后我开始反思:虽然有一批愿意付费的用户,但大多是专业用户,小白用户还是看不懂、用不顺。这时候我们有了资源,就回到最初想做的事情——Workflow。

接下来,我们做了几层降复杂度的尝试:

  • 第一步,把原来一个画布里可能上百个节点,收敛成只针对一个具体问题的 5–8 个节点的 Workflow;
  • 第二步,在此基础上引入 agent,让 AI 来生成 Workflow 本身,进一步降低搭建成本。

再往下,就是现在的路径:从「深度画布」到「可落地的 Workflow」,再到「把 Workflow 封装成一个个模板」。这意味着,大部分用户只需要消费别人封装好的流程,少部分高阶用户来生产和分享流程。通过这一系列演进,我们一边降低复杂度,一边放大使用的泛化性,让「AI + Workflow」真正有机会被更广泛的人用起来。

Founder Park:这算是你们几次不同方向的探索吗?还是在你看来核心方向是一致的?

黄巍: 对我来说,这是一个从模糊到逐渐确定的过程。

我决定创业,一个很直接的原因是参与了字节第一批超大规模的「AI + Workflow」项目。那段时间节奏非常高强度,项目结束后再回到常规的上班状态,明显有种「打完仗又回去种田」的不适应,所以干脆选择出来试一试。

刚出来的时候,其实并没有想清楚要做什么方向。因为在飞书期间做过浏览器插件,就先把这段经验用起来,再加上看到 Monica 这类产品,有些被「点燃」了,就先动手做起来。具体要做到哪里、产品最终会长成什么样,当时并不明确。

后面更多是边做边学,通过不断和用户交互,一点点看清哪些是真需求、哪些有机会被更多人用,于是产品方向也就从一开始的模糊,逐步收敛到后来相对确定的形态。

Founder Park: 也就是说,一开始从字节出来时,你其实还没下定决心要继续做 workflow,只是先往前走。做到画布这个形态时,验证出了一些基础的 PMF,你们觉得这条路可以走下去,而这条路又刚好和你之前对「用 Workflow 形式来承载」的想法接上了。

黄巍: 对,是这么一个思考的过程。

Founder Park:整个团队在这个产品上真正「找到感觉」,大概是哪个时间点?

黄巍: 如果说一个明确的时间节点,是 8 月上旬。那时候投资人提醒我们,今年要再做一轮融资,我们也在想:下一轮要讲什么故事?当时我们手里有一款生成式画布产品,用户和收入都不错,但我心里一直觉得,有点「解释不清楚」。这个形态很复杂,我很难想象它的长期走向,直觉上它不是一个能 scale 的好形态。

其实这款画布之前在市场上是爆过的。大概在 3 月份,推特上有好几周大家都在讨论 Refly.AI,很多投资人来找我们。但说实话,我们当时也没完全搞清楚它为什么会爆,只是顺着用户需求一路做下来,做着做着就火了,然后去拿融资。等融资回来、冷静下来再看,问题就很清晰:这个产品很难 scale。

再加上 8 月份的压力,我们之前有这个经历,又从画布过渡到 Workflow,有了一些技术上和产品上的积累,觉得这个事情是很容易去做的,就试着去做一下。

但实践下来没有那么容易。从 8 月确定要做,到 9 月初我们做出了第一个版本,但那个版本问题非常多。之后一个多月,我们一边修 bug,一边在这些问题中找平衡点。画布转到 Workflow,本身就有很多历史债务要清,同时还要重新思考:这个形态怎么 scale、怎么商业化。折腾到 11 月底,整体才算相对稳定下来。

有了这次转型的经历,我们发现这条路在逻辑上非常自洽,而且和团队背景高度匹配。后面我们招人也是往这个思路上靠。 我们这支团队现在在「Vibe Workflow」的赛道里面,可能就是全球最有竞争力的团队。我们对这个事情的理解是最深的,做的产品也最超前。

Founder Park:现在这个 Vibe Workflow 的产品,彻底想清楚的时候,是有什么特殊契机吗?

黄巍: 大概是 8 月初有了一个模糊的想法,到 8 月底整个产品架构才真正被想清楚。

这个产品本身是分层的,工程复杂度非常高:

  • 第一层,是让 agent 来生成 Workflow,本身 Workflow 的设计就得适合被 agent 生成。现在像 n8n、Dify,要做到这一点会有比较重的历史包袱。
  • 第二层,是把 Workflow 设计成「每个节点本身就是一个 agent」,再通过执行引擎把这些 agent 串起来,这一层工程量也很大。
  • 第三层,要让 Workflow 真正有价值,就必须有成规模的 tools 体系,覆盖 input、action、output 等不同类型。光 tools 这一层,单独拎出来都可以是一个创业方向。在此基础上,我们又给 agent 配了一台「虚拟电脑」,让它能写代码、调用 tools、操作文件,从而把类似 n8n 那种搭建复杂度进一步压下去。

这几层叠在一起,不是一个普通团队可以轻易抄过去就跑起来的。

我们当时的思路是从画布产品一路推演过来的。那时候我们已经把多模态能力都加进来了,可以在画布里生成视频、音频等各种东西。但问题也很明显:堆了这么多能力在一个画布里,用户进来根本不知道第一步要干什么、下一步该怎么走。一方面是产品引导本身有问题,另一方面,我当时心里其实已经隐约在想 Workflow 这条路,但还没下决心去落地。

转折点是,我们招了一些很优秀的同事进来。有一次我把这个 Workflow 的想法讲给他听,他周末花了两天,把一个完整方案写了出来。我们看完之后觉得:这件事情是说得通的,那就开始干吧。

后面边做边验证,大概半个月左右,我们发现这个方案不仅在工程上是闭环的,还把我们之前很多的疑惑都解释清楚了:哪些方向其实不适合我们做,哪些地方是我们真正有竞争力的。这时候,我们对「Vibe Workflow」的产品形态,才算彻底想明白。

 

04

我们不相信「一人公司」的通才理论

 

Founder Park:你们团队现在大概十三四个人,分工是什么样子的?

黄巍: 我们在测试这件事上踩过很大的坑。

我之前在公司里很多角色都干过,唯独没做过测试,写代码也基本不写测试,所以一开始对测试的价值是有偏见的。扩团队时,我理想中的研发同学是那种端到端的人:既懂用户需求,又能写代码、自己测、自己上线,看结果复盘。后来发现,这种人早期很难大规模招到,要么在明星创业公司,要么在大厂里,我们又没做 PR,在市场上声量有限。

其次,我们的产品因为是 Workflow,很复杂,好多 bug。我们发了一版测试版给用户去用,全是 bug。当时痛定思痛,觉得得招个测试进来。两天之内就招到了人,进来之后,整个节奏立刻不一样:测试同学每天 push 我们修问题,产品质量稳定性肉眼可见地上来了。

在这个基础之上我懂得一个道理,现在大家鼓吹的所谓「一人公司」,或者一个人可以把所有事情干完,我觉得是很美好的愿望。但互联网分工这套方法论,已经被无数家公司验证过,我们不应该把它丢弃掉。

我们的教训是:团队职能一定要尽量完备——产品、运营、增长、设计、测试、研发、算法都要有人,才不会在关键环节出现盲区。

我们的原则是:

  • 在「非重度」方向,每个方向至少招一个特别优秀的人,把这件事完整跑通,只有在确实需要扩张时才上第二个、第三个。
  • 在「重度」方向,比如研发、算法、模型调优,会投入更多人力。

现在团队大致的分工是:所有方向上至少有一个能把事情落地的人。在研发层面,一部分人做偏运营向的开发,大概两个人;做模型和工程调优的,两到三个人;再做底层的 workflow 和 tools 基座开发的,三到四个人。大概是这么一个分工。

Founder Park:现在大家讲究 AI 时代的团队是招一些通才,但你这边好像是要招一些在确定岗位上很擅长的人,这会有矛盾吗?

黄巍: 我们是从 0 开始摸爬滚打过来的,对这一点的感受非常直接: 通才当然重要,但前提是你真的能招到通才。 这有点像「通用 agent」——大家都在说,但现实里没那么多。

现实情况是,模型的能力没有大家鼓吹的那么厉害,没达到替代一个人的地步。比如模型不会让一个写代码的人去搞设计,他能搞点轻微的设计,但搞不了生产型的设计。所以我们更强调的是,招这个领域的专才,然后我们给他加一层 AI,他比所谓的通才要好几个数量级。这一点我们现在在团队里已经验证得比较充分了。

比如我们招一个设计同学,给他配非常完备的 AI 工具,他只需要专注在把整个产品的框架设计好,尽量的兼容通用,其他的细节可以让 AI 帮他完成。我们觉得这种是一种非常高效率的协作方式。

所以对我们来说,最理想的状态就是招专才,并且是非常专、非常优秀的人,我们给他配最强大的 AI,让他把这个事情干到之前 3 到 5 倍甚至 10 倍的效果。

Founder Park:那你们现阶段还需要再扩招吗?

黄巍: 会,而且是持续扩招。

我最近有一个比较坚定的结论:不管是在大公司还是创业公司,团队在人力配置上应该是「饱和式」的,而不是刚刚好够用。原因有几个:

  • 方向未来一定会变化;
  • 会遇到各种突发情况,比如核心同学离职,或者突然有一个新的大模型出来,你需要快速兼容、改造;
  • 很多机会窗口期很短,人不够就会明显跟不上节奏。

另外,我们内部有一个共识:做好产品,和做好增长、商业化,是同等重要的事情。所以在增长这块,我们也会搭一个相对完整的团队:投放、内容、KOL 运营、增长产品经理、增长工程师,这些角色我们都会补齐。

 

05

站在模型肩膀上做产品,

才不会被取代

 

Founder Park:现在的大模型,给它太多工具之后会陷入不知道怎么选的地步。这个问题现在你们是怎么解决的?

黄巍: 我们对 AI 的使用方式不同,我们是让它从 1000 种工具里「选择」工具,而不是直接用这些工具去「执行」。 「选择」和「执行」这两个任务的复杂度是不一样的,「选择」这个任务非常简单。

要模型一边从几百上千个工具里挑,一边把活干完,这个事情太复杂了。所以我们把任务拆成两块:一个模型专门负责挑工具、写 action 和 workflow;另一个模型只负责执行具体任务。

我们每个 agent 节点实际能用的工具不超过 3 个,通常只有一到两个,对应的 prompt 也非常简单。我们的目标是:每个 agent 节点只做一件非常具体的小事,一到两个工具就能搞定,然后把复杂任务拆成 5~10 个这样的小任务。

这样做有两个好处:

  • 不同模型各司其职。像 Kimi K2 这种适合执行的模型,就专注把单个步骤做好——便宜、准、稳定、速度快;像 GPT-5、Claude Sonnet 4.5 这种更强的模型,就负责从成千上万的工具中筛选、规划,把任务拆解成一条条可执行的 workflow。
  • 我们可以用一个稳定的编排引擎,把这些简单节点串起来,完成非常复杂的任务,而不是指望某一个「大而全」的 agent。

本质上,这是我们对模型边界的一种利用方式:不用去强碰模型当下还「不擅长」的能力,而是把问题拆到模型能稳定发挥的区间,让产品形态和模型能力「贴合」增长,而不是被拖着走。

我们的产品做了一件非常巧妙的事情:让贵的、强的模型去做拆任务,让简单的模型去做执行。

这样模型能力的增长不会吃掉我们,而是会让我们变得更强。一旦我们收集到可用的数据,钱和人到位,拆任务这一层完全可以用自研或微调模型替代;执行层也可以不断优化,比如原来要 4 个节点,现在压缩到 1 个节点。

这个过程极度考验我们对模型能力、边界的认知,以及怎么去提前几个月把我们的产品放在这个点上,等待模型的增长。比如后面发了新的模型、新的 API,我们很快就可以接入,并且让用户可以一句话生成流程,去做自媒体传播。这就是我们怎么去设计产品和做增长的一些思考。

Founder Park:对 Refly.AI 来说,现在阶段的核心壁垒,是技术壁垒还是运营壁垒?

黄巍: 现阶段,在我们产品还没有完全大规模面世之前,我们可能对自己的技术壁垒会有一些信心。

首先,我们可能是这个地球上最懂「AI + Workflow」的那批人。第二,我们在正式对外之前,已经组建了一支非常能打仗的团队。这是我刻意为之的,我不希望我们还没准备好就草率地暴露出去,结果这个方向火了,后续却和我们无关了,团队组织能力一定要到位。

在这个基础上,我们有一个比较清晰的产品判断: AI 越往前走,真正有价值的产品,一定是在非常复杂的系统工程之上,让用户「感知到的体验」尽可能简单。 不是说产品本身要做成一个很简单的小玩具,而是底层可以极其复杂,但呈现给用户的路径要是顺滑、低门槛的。这中间要始终顺着 AI 能力的演进做设计,而不是逆势搞一些反人性的形态。

以我们目前的工程复杂度,任何一家小公司,比如 15-20 人的团队,很难在 3-6 个月之内超过我们。即便短期某些功能形态看上去追上来了,也很难知道我们下一步会做什么迭代。对大厂而言,我自己有大厂经历,要在内部复刻一个同等复杂的系统,至少得拉一个 50–100 人的团队,全力干一两年。除非我们已经证明这是一个千亿级甚至更大的市场,否则大多数大厂不会一上来就投这么重的资源。

所以,我们会给自己一个 3–6 个月的「加速窗口期」。在这段时间里,只要资金到位、增长团队到位,技术和产品这套复杂度放出去,短期应该是没有特别直接的对手,我们也有机会在市场上快速完成一轮增长和商业化验证。

Founder Park:这么设计,会不会被某一个模型厂商绑架?比如受限于单一模型的成本或能力?

黄巍: 不会,反而可以说,我们现在的做法在某种意义上是偏「激进」的。

我之前跟一些字节同事聊,他们会觉得我们的方向挺超前:现在就把每个节点都改成一个 agent,再去编排 agent,这个路径是不是太早了?一开始我们自己也有类似的疑问——和 n8n 那种相对静态的 Workflow 比,我们的做法一开始确实不够稳定、成本也偏高,早期 bug 特别多,那个阶段我们也反复在问:这条路到底是不是可行的?

但一路走下来,我们会发现,这件事是说得通的:

  • 每个节点都是一个 agent;
  • 每个节点做尽量简单的事;
  • 整条链路通过编排引擎串起来。

无论未来模型怎么迭代,我们都是在模型之上再加了一层抽象,相当于「站在模型肩膀上」:模型越强,我们越强;模型越便宜,我们越便宜。同时,我们还会沉淀自己的行为数据,可以进一步优化自研模型和商业模式。

更重要的是,这个抽象层可以天然兼容不同模型、不同模态,统一放到同一套 workflow 架构里,完成数据的 INPUT、PROCESS 和 OUTPUT。这让我们不会被某一个模型厂商锁死。

Founder Park:如何不被模型所取代,除了跑得快以外,还有其他补充吗?

黄巍: 我觉得核心还是认识到模型的边界。模型厂商非常懂模型,他只切了他看起来显而易见的那部分能力。但实际上,模型是一个巨大的宝藏,你可以从里面剥离出对你这个行业最有价值的那部分能力。

比如我们做 Vibe Workflow,是因为当时看到一个趋势,GPT-5 发布之后,ChatGPT 把所有的功能选择都收到了一个按钮里,希望用户只需要表达需求,它自动做路由。这对我最大的震撼是, 这么大的一个产品竟然能做这个事情,意味着现在整个模型的工具调用(tool use)的速度和准确性已经迈过了那个极限 。我们认识到这一点之后,就选择了 Vibe Workflow,我们觉得这个事情是一定可行的。

这个能力不像生成 PPT 那么花哨,但是它对你的产品有用,并且能产生巨大的化学效应。也就是说,模型是一个巨大的宝藏,它有很多切面。你如果能从里面找到一个切面,对你的产品产生杠杆效应,即使不需要和模型厂商竞赛也是可以的。你不要去打它的主方向,你从里面抽点皮毛出来,把你这个产品做好,至少也是一个几十亿、数百亿美金的规模。早期你的野心不要那么大,能做到 Canva 那样,就意味着我们的目标没有那么高,我们也可以切到模型的一个切面,切到自己的一块肉。

去挑选一个差异化的赛道,在这个赛道里面我们做到最大,也能活得非常好。比如马斯克的第一次创业,也不是做了特斯拉或者 SpaceX。所以我觉得第一次创业不要搞那么大,简单点,先搞出来,人生还很长,一点点来。

 

06

创业早期可以慢一点,

关键是「别做错事」

 

Founder Park:想象一下 Refly.AI 的终局,会成为一个 Workflow 的分发平台,还是大家创作内容的一个新平台?

黄巍: 短期内,我们觉得它有可能是一个新的原生内容平台的机会。

AI 来了之后,大家都在想 AI 时代的社区和内容平台是什么样子的。AI 最大的能力在于它可以生成内容,以及它的主动性和自动化。那未来的 AI 内容平台,是不是内容可以极度个性化地定制?用户表达一句话可以生成内容,并对它做编辑、消费和修改。内容是丰富多样的,不只是视频。比如我现在需要听个播客,平台就可以实时为我生成一段只服务于我的播客, 有点像 OpenAI 现在推的 ChatGPT Pulse。

长期的终局,就像我们说的,我们拿到的是用户在一个工作生命周期里所有的行为和意图数据。那未来是不是我们能给用户一个更简单的交互方式?他只需要一个无时不在、感知不到的硬件,就能去和 AI 做交互,完成自己的任务。比如他走在路上说「你帮我开一辆特斯拉去接我的女儿」,他可以去做这种侵入到物理世界的 action,并且这个 action 本身的价值、准确率和个性化都非常高。

这是我们认为长远的、Refly.AI 希望达到的终局。我们设置了一个环境和媒介,去承接用户全方位、多维度的意图和行为数据。 我们希望这些数据最终能够构建一个用户的数字化版本,能帮助用户进入到物理世界去干一些事情。

短期内,我们希望可能是在做一个 AI 原生的内容平台的机会。但更加现实一点,我们就是在卖模板,做一个很土的生意,卖 AI 时代的 Workflow 模板。

Founder Park:那你预期明年整个 AI 行业有哪些新的技术和发展,会对你们有助力?

黄巍: 我自己有两个非常期待的方向。

第一,是让「修小问题」这件事真正被 AI 自动化掉。我们每天都有大量细碎的小 bug,要改代码、测、上线。理想状态是,这些小问题可以端到端地被 AI 自动修复和发布,让人从重复劳动中彻底解放出来,去做更有创造性的事情。

第二,是模型在「编辑能力」上的进步,而不只是生成。

现在模型在生成上已经很强了,但生成完一个 PPT、视频或网页之后,我还要为它造一个编辑器,让用户去细调。如果未来模型能以很低的成本精准理解 input,做细粒度的编辑,那么 Refly.AI 这类工具的上限会被大幅抬高——很多我们今天需要自己造的「编辑能力」,都可以交给模型。

那 Refly.AI 会变成什么?它会变成 AI 时代的创作者工具。以前你剪一个视频用的是剪映,发布的载体是抖音。未来,你去做内容创作,跑的是一个流程,这个流程产出的结果就是一个视频、一个音频、一个文本,甚至是一个网页。

一旦模型的编辑能力变得非常强,未来所有内容的载体其实都是一条流程,这会催生出一个 AI-native 的原生内容平台。这个内容平台相比之前最大的变化就是,它的内容是实时生产、实时更新,并且每个内容都可以由人去做个性化甚至「入镜」,按需消费。这是我们看到的,可能是下一代内容平台的机会。

Founder Park:如果现在有大厂的人或者创业者也是做 AI 应用,你会给他们什么建议?

黄巍: 我只能从我自己的经验出发。我觉得看一个事情,可能要把它拉长到一个维度去看。一个事情在半年这个维度可能看上去很有价值,但拉到 1~2 年,你要问自己:这个产品还能活吗?现在大家都在讲快速落地、快速试错、快速拿结果,但从我的视角,早期可以慢一点,关键是「别做错事」。

假如我们今天来一个概念就抄,明天来一个概念就抄,没有自己的产品主张,就容易陷入「热度成瘾」。 我们宁愿早期慢一点,但是一定要拉长时间维度,在这个行业内做到不可替代,把事情做对。

第二点,就是老生常谈的,它会不会被模型吃掉?这个事情一定要想清楚。你是不是在做一个模型之上的东西,还是会被模型吃掉的东西?有些人可能偷懒就不去想了,比如 OpenAI 做了浏览器,你也去做个浏览器,甚至比他做得还慢,这种是不值得去做的。

我们内部有一个心法:产品一定要比模型的能力迭代要快 3-6 个月,并且要在 3-6 个月之内把自己的想法实践落地,并推向市场和商业化。如果我们能不断地重复这样的周期,我们就能跑赢这个市场,跑赢模型厂商。

第三点建议,招人层面的,就是早期一定不要有偏见。历史上被证明有价值的分工和合作一定有它的道理,存在即合理。不要因为自己的偏见,或者因为他人表达的所谓「通才」的看法,就觉得一定就是那样的。还是要回归常识、回归本质。

早期一定要找到那种价值观和想法对齐的团队。我们也面过、发过很多背景非常优秀的人的 offer,包括给一些斯坦福的学生发过 offer。但我们会发现,虽然他们的背景和履历非常优秀,但如果把他们放在一个高压、要去战斗的环境之下,他们学校里的履历是很难派上用场的。放到一个战争的环境之下,考验的不是你答一道题的能力,而是你怎么去面对全方位的竞争,去找到自己的道路。

早期团队,确实要找到那种调性相投的,而不是一味地去看名校背景或光鲜履历。真正能打仗的人,他不一定是履历光鲜的,可能就是普普通通,但他确实能把事情干成。

注:Refly.AI 本身是开源项目,开源仓库地址:

https://github.com/refly-ai/refly

2026 硬件觉醒:AI 硬件迎来「安卓时刻」

2025年12月11日 14:19

作者|汤一涛

编辑| 靖宇

北京 798 艺术区,当《钢铁侠》中贾维斯的经典片段再次投射在巨幕上时,台下观众的眼神里既有对终极智能的向往,也有一丝熟悉的审慎——类似的场景在过去数年的科技发布会上反复上演,但现实中的 AI 硬件,似乎总与那个理想形态隔着一层无法逾越的技术冰墙。

在 IF 2026 的舞台上,无界方舟联合创始人小乔的分享,选择以攀登者的身份直面现实、解决行业难题。

她指出,尽管 2025 年被誉为 AI 硬件的「第二波浪潮元年」,各种形态的桌面机器人、陪伴硬件、可穿戴设备和具身智能层出不穷,但成功找到 PMF 的产品以垂直品类为主,因为单一场景相对更好实现。因为要将强大的 AI 大模型落地为真正的消费级硬件,仍需跨越三大天堑:从零搭建完整框架如同在峭壁上开凿登山道,复杂工程链路堪比穿越冰川裂缝,定制化适配更是需要在岩壁上精准安装每一颗铆钉。这些难题叠加成「技术冰墙」——模型调用成本居高不下,研发周期以年为单位,最终留给用户的往往仍是冰冷的体验。

小乔表示:「AI 大模型只是 『 脑细胞 』 ,而硬件更需要一个完整的 『 神经系统 』 。」

这个系统需要将 交互、记忆、执行 、 形象 这四大原子能力无缝融合,形成拟人化的认知与行为闭环。这正是无界方舟过去几年深耕的方向,其成果便是 EVA OS——一个为新一代 AI 硬件设计的操作系统 ,其核心能力已全面开源,在本次极客公园的舞台上正式发布。

EVA OS 的诞生,不只是连接,更是「融入」——将拟人的认知与感知能力,深度融入硬件的基因。 让每一个设备从单纯执行命令的工具,进化为 「 高智商 伙伴 」 :能听懂对话背后的情绪,记住用户偏好,甚至主动预判需求 和完成任务 。

 

01

如何 定义 硬件的「神经系统」?

 

智能系统的生命力,源于硬件与算法的深度耦合。 EVA OS 通过重构交互、记忆、执行与形象四大原子能力,为硬件铺设了完整且高效的 「 神经系统 」 ,使其获得拟人的认知与行为能力。

【交互层】:从「信号响应」到「语境理解」的毫秒革命

EVA OS 重新定义了硬件与人的对话方式,将机械的指令响应升级为连贯的语境理解。它能在毫秒级延迟内实现全双工自然交流,并依据场景动态切换交互角色,让硬件真正理解对话中的情绪与意图。

现场演示中,EVA OS 除了展现出多模态交互能力外,还体现了更丰富的 AI 反馈方式:通过韵律建模实现即兴说唱,通过音色克隆技术复现多维声纹,通过视频语义解析模块输出智能解说等,将交互从简单的问答拓展为丰富的「对话场」。

【记忆层】:构建多模态的终身记忆

EVA OS 为硬件构建了连续的个人认知图谱,解决了行业方案长期记忆薄弱、易出现信息幻觉的痛点。它融合长短期记忆,不仅能关联多模态信息,更能主动提示关键过往,使设备从被动应答变为「真正懂你的长期伙伴」。

与仅依赖文本的传统向量数据库不同,EVA OS 的记忆系统具备视觉维度 ,从而可以满足更多场景需求 。小乔分享了实测案例:当询问「同事需要我帮忙点什么饮料」或「我的耳机在哪」时,系统不仅能调取记忆片段,还能结合视觉线索给出具体建议。「我真的在那个位置找到了耳机。」她补充道。—— 它记住的不仅是事实,更是与你共同成长的生命体验

【执行层】:构建 从「 认知决策」到 「 物理致动」 的端到端闭环

EVA OS 成功跨越了数字智能与物理世界之间的执行鸿沟。在软件层面,除支持标准的 API/MCP 接口调用外,更集成了 Computer Use/Mobile Use 能力,通过拟人化的 GUI 自动化交互,实现了对封闭或无接口软件的精准操控。在硬件层面,EVA OS 具备底层致动能力,可直接驱动实体机械结构。这一架构让 AI 硬件完成了从「多模态交互」到「全场景执行」的质变。

现场展示了 EVA OS 正在交付的实际案例:系统能够自主操作手机,打开各类 APP 进行分析处理,并独立完成任务链,展示了其在复杂物理环境中的行动潜力。

【形象层】:为硬件赋予 实时 形象

EVA OS 支持各类硬件输出由大模型驱动的表情、二次元、数字人等各类形象。与业界常见的串行链路驱动不同, EVA OS 采用 业界少见的 并行链路, 让表情、声音与动作同步发生 ,从而实现了音画同步、实时驱动,带来了毫秒级低延迟的输出效果,确保反馈的一致性与实时性。

 

02

「 行业 样板间 」 :周预定 量

突破 1 万台的爆款 产品

 

在无界方舟的战略布局中,首款消费级产品「奇多多 AI 学伴」承担着双重使命——既是 EVA OS 技术的原型验证平台,更是重构早教产品价值锚点的行业样板间。这款面向 0-10 岁儿童的 AI 学伴机器人,标志着 AI 早教产品从「陪伴噱头」回归「科学早教本质」。

面对传统 AI 玩具体验欠佳、近 70% 家庭依赖老人带娃、业界缺少 3-10 岁儿童的优质早教产品等问题,奇多多以「能看、会说、懂成长」的智能学伴形态,给出高质量科学解决方案。自发布以来,奇多多销量迅速破万,成为智能硬件领域的焦点。

奇多多基于无界方舟自研的「AI 大脑」EVA OS,是集成视觉识别与个性化记忆引擎的 AI 原生产品。技术上,其端到端实时互动多模态大模型,实现了视频交互毫秒级低延迟反馈。「全能阅读」支持任意书本实时朗读、翻译、指读的功能,不限于绘本、报刊、课本、卡片等载体,无需提前录入资料,任意材料都可实时识别和阅读;「AI 识物科普」可实时识别任意物品并展开科普,打通孩子「边看 - 边问 - 边学」的认知链路。

效果是显著的,在与外国语学校的 AI 研学合作中,孩子们识字、记忆英文单词的速度 提升至之前的 4 倍 ,阅读量 提升至 3.3 倍 。更令人触动的是, 83% 的内向儿童开始主动与 奇多多 及身边 小朋友 交流 。小乔强调,Broca's Area 语言中枢仅在 0-10 岁活跃,10 岁开始关闭,因此语言互动能力的培养对孩子来说必不可少。

「奇多多做对了什么?」小乔总结出一个寻找 AI 硬件产品与市场契合点(PMF)的精准公式: PMF = 用户精准 + 刚需场景 + 技术成熟度。 而 EVA OS 的核心价值,正是将最难把控的「技术成熟度」变为一项可配置、可达标的稳定服务。

 

03

开源与效率革命:1 天与 95%

 

发布会的真正高潮,是 EVA OS 核心能力 正式 面向全球开发者开源 ,这也是业内首个面向 AI 硬件的开源 AIOS

开源的背后,是两项具有颠覆性的效率进阶:

  1. 时间折叠: 硬件原型研发周期可从几个月降低为 1 天。
  2. 成本塌缩: AI 链路成本可降低 95%。

实现路径被简化为两步: 第一步,在云端定义大脑。 通过可视化平台,像勾勒角色一样,自由配置硬件的人格特质、声音、记忆规则与交互逻辑。 第二步,在实体完成灌注。 通过兼容 Arduino、Raspberry Pi 等主流板卡的 EVA OS 开发套件,将云端 Agent 与硬件连接。

这意味着,最复杂的多模态融合与底层工程适配工作已被前置解决。一个创新的硬件想法,从概念到功能原型的时间单位,从「季度」变成了「天」;曾经令初创团队望而却步的 AI 成本,被削减了一个数量级。从此,开发像搭积木一样,初创团队只需关注产品定义本身,技术层面可在开源生态中获取即插即用的 AI 大脑能力。

 

04

结语:从「无法攀登」到「登顶路线」

 

硬件只是载体,而新一代 AI 硬件,本质是要 「 更像人 」 。」在演讲尾声,小乔将焦点拉回到最初的梦想——「贾维斯」。她坦言,理想的 AI 伙伴依然遥远,但路径正在变得清晰:「「AI 越强,人应该更强」。这需要我们科技创业者们、AI 伙伴们一起抱团前进,共同实现科技普惠、行业共荣。」

EVA OS 的开源,相当于为 AI 硬件开发者铺设了一条「高速公路」,为攀登 AI 硬件险峰的创业者开拓了穿越技术屏障的「登顶路线」 。这套系统不仅实现了工具链的革命性突破,更成为了智能硬件从「功能载体」向「数字生命」进化的转折点。这必将开启创新的闸门,催生出真正多元化、个性化的爆款硬件生态。

下一代 AI 硬件的竞争,不仅靠外形,更要靠智能。站在技术屏障消融的历史节点,无界方舟所见,不只是千亿级市场的喷薄,更有开放生态主导、多元智能共生的新文明形态,正在觉醒。

如果你也是那个对 AI 硬件有执着的创造者、开发者或梦想家,欢迎访问 EVA OS 的 GitHub 主页,加入这场从开源开始的智能革新。

https://github.com/AutoArk/EVA-OS

欢迎开发者前往探索与共建

复制链接至浏览器直达 EVA OS GitHub 主页

开源内容包括平台和手机 App 端。其中,平台支持多种自定义 solution 配置,涵盖音视频能力接入、TTS 音色选择、agent 选择、MCP 工具选择、实时多模态大模型使用等。同时,代码和文档同步上线 GitHub,开放给全球用户。

Upcoming 内容

  • 🔌 嵌入式 SDK:ESP32/RK/MCU 硬件级深度适配
  • ☁️ 端云协同:云端算力调度+设备端指令精准下发
  • 🧠 智能记忆系统:设备级短期交互记忆+长期偏好记忆,多模态技术
  • 🔧 MCP 工具扩展:开放第三方工具接入接口
  • 🎭 自定义数字人:支持照片生成专属 Avatar
  • 🏢 企业级能力:多模型混合部署+高并发承载方案
  • ···

XREAL 徐驰:智能眼镜,拉开了「Agent as Hardware」的新时代

2025年12月11日 10:50

整理|Moonshot

编辑| 靖宇

 

人类获取的 90% 信息来自视觉。当 AI 成为人类的随身智能设备时,视觉同样是最关键的部分。AI 如何帮助我们从「看到」,走向「看清」整个世界?

大模型已不再满足于被困在服务器的机箱里,它们渴望「身体」,渴望感官,渴望新的增量数据。

于是,过去看似沉寂的 AR/XR 行业也在 AI 的推动下重新升温:从头戴式设备,到轻量化眼镜,再到多模态感知硬件,各类厂商都看到了「下一个 iPhone」般的机会。

其中,最被看好的赛道就是眼镜,35g 级别的轻量化 AI 眼镜被视为未来十年的主流形态。

图源:极客公园

 

过去几年,AI 眼镜从概念走向产品,从工程样机变成轻量化可佩戴设备,Meta Ray-Ban 的走红验证了「AI+眼镜」的潜力,它们开始成为 AI 的视觉入口、听觉入口、长期记忆的生成器。

但现实与愿景之间仍隔着坚硬的技术鸿沟。显示、续航、重量、计算、散热,每一个都是牵引整个行业多年的「物理难题」。而且没有任何一台设备能同时做到轻量化全天候佩戴、高清显示、强大算力,这是智能眼镜行业的「不可能三角」。

在徐驰看来,当下就像 20 年前,那个智能手机爆发前夜、充满碎片化与混沌的时刻,市场上虽有百万级爆款,但生态割裂,缺乏统一的交互标准。

在极客公园创新大会 2026 上,XREAL 创始人兼 CEO 徐驰试图回答一个时代级的问题: 我们应该如何为 AI 赋予视觉「身体」?又是什么设备,可以真正点亮属于 AI 时代的 iPhone 时刻? 以下是徐驰的演讲实录,由极客公园整理。

嘉宾精彩观点:

下一代人机交互的终极形态,应当是「无感交互」。

眼镜作为距离人眼最近的设备,是天然适合成为下一个终端的载体。

今天的 AI 似乎缺乏触觉,也缺乏视觉,仿佛被困在了计算机的服务器里。

当你不断赋予 AI 对 3D 真实世界的感知能力时,它的能力也会随之显著提升。

Agent 不应仅仅是软件,更应该是一个「硬件化的 Agent」。

眼镜所带来的「增量数据」,很可能是 AI 通向 AGI 的必经之路。

今天的 AI 眼镜仍然面临着「不可能三角」的挑战:全天候舒适佩戴、极佳的显示效果以及强大的 AI 智能化。

如果 AI 终端的竞争是一场万米长跑,那么向下深耕、打好基础,跑对方向比今天的抢跑更重要。

我们经常会陷入一个误区,试图用一种单一的产品形态去想象未来。

 

极客公园的朋友们,大家下午好,我是徐驰。

今天,我不打算聊某一款具体的产品,而是想和大家探讨一个话题:如果 AI 需要一个实体,下一代的它应该长什么样?

在进入正题之前,先简要介绍一下目前元宇宙的 AR 体验现状,也是我们 XREAL 团队过去十年在这个行业耕耘的成果。

我们一直致力于无缝连接数字世界与真实世界。在这个过程中,我们见证了行业的起伏,也深知其中的艰难,而近年来 AI 的异军突起,让我们惊喜地发现,XREAL 所做的事业正与 AI 发生快速的融合。

图源:极客公园

 

简单回顾我的经历,我在国内完成学业,随后在国外的几家科技大厂工作,有幸亲眼见证了 AI 行业与 XREAL 所处的 XR 领域最前沿的发展图景。

 

01

无感与「五感」

 

随着近年来 AI 能力的飞速跃升,我们发现,过去想象中的交互方式:从手机上的「触控屏幕」,到我们在 XREAL 头显、眼镜中设想的手势及多模态操作,其实都算不上最自然的交互。相比之下,人与人之间的交流才是最自然的。

因此, 我们认为下一代人机交互的终极形态,应当是「无感交互」。 就像人与人之间若能心有灵犀,你便能「想我之所想,见我之所见」,最终无需多言,就能懂得我真正想要什么。

在这场轰轰烈烈的 AI 革命中,我们意识到,AI 需要一双「眼睛」。在终端设备更迭的过程中, 我们的目标是希望在未来二十年里,让大家能够从屏幕中抬起头来。 回顾过去的变革,我们的注意力始终被禁锢在面前的屏幕上; 而眼镜,作为距离人眼最近的设备,是天然适合成为下一个终端的载体。

图源:极客公园

 

同时,AI 的能力不断惊艳着我们,每一代模型都有着更强的推理能力,甚至具备了更强的多 Agent 处理能力。

今天的 AI 似乎缺乏触觉,也缺乏视觉,仿佛被困在了计算机的服务器里。 它就像一位饱读诗书、通晓人类千年文明精华的智者,却始终无法睁开眼睛看世界。我们相信,眼镜将是 AI 在下一阶段最好的载体,我们要赋予它全新的视觉能力。

在谷歌的 IO 大会上,他们提出了未来 AI 的发展目标:在变得越来越强大的同时,也要越来越个性化、越来越主动化。要实现这两点,前提是 AI 需要了解你的历史,需要拥有你生活中的上下文。

特别是随着 Gemini 3 等新技术的登场,我们将会迎来更多惊喜。随着大模型从单纯的语言模型走向多模态模型,我们发现, 当你不断赋予 AI 对 3D 真实世界的感知能力时,它的能力也会随之显著提升。

但我始终认为,手机绝不是 AI 天然的最佳载体。我很喜欢一部大约十年前的电影《Her》,讲述了男主角与 AI 产生情感羁绊的故事。其中有一个桥段让我印象深刻:AI 角色 Samantha 对男主角说,「我想看看你的世界」,于是男主角用别针将手机摄像头固定在衬衫口袋上,以此让它看见外部世界。

今天我们所做的,就是打造一个「更好的手机」、一枚「更好的别针」,让 AI 能够真正伴随我们,更好地理解我们的生活。

《Her》电影男主角用摄像头帮虚拟女友「看世界」|图源:Netflix

 

此外,在 AI 的基础上,我们衍生出了越来越多的 Agent。这些 Agent 能够更好地理解你的诉求,帮你完成一系列复杂的任务。

以前我们提到的 Agent 大多运行在手机或电脑上,属于软件形态。而今天,我们提出了一个全新的概念: Agent 不应仅仅是软件,更应该是一个「硬件化的 Agent」,这样才能最大范围地释放 AI 的能力。

这将对我们今天的硬件结构带来全新的定义。让我们重新审视「摄像头」,它不再仅仅是用来拍照或录像的工具,在全天候 AI 眼镜上,它将成为 AI 理解世界的眼睛;「麦克风」也不再只是录音功能,而是变成了 AI 的耳朵,能更好地感知周围声音的信息量。 视觉与听觉的结合,已经覆盖了我们获取信息的 99%。

在交互层面,我们也希望引入新的概念。未来的显示界面,很可能变得像人与人交流时的面部表情一样,能够更好地与大家进行 AI 互动。最终,我们希望通过端侧算力与云端能力的结合,构建出如同人类神经系统般的架构——既能加速处理,又能通过端侧机制很好地保护隐私。

综合这些因素,未来的 Agent 将不再是一个单纯的软件概念,而是硬件与软件的深度结合。它将附着在一个完美的载体上,为大家提供全天候的多模态 AI 体验。

同时我们坚信, 眼镜所带来的「增量数据」,很可能是 AI 通向 AGI 的必经之路。

 

02

增量数据才能让 AI to AGI

 

观察今天的数据现状,我们主要利用存量数据来训练大模型。公域数据构成了大模型的基础语料库。

在不同的大公司内部,还有私域数据,例如谷歌拥有你的文档、Gmail 等信息,能让办公相关的背景信息更加充实;国内像小红书这样的平台,也涵盖了非常有价值的私域数据。

但我想表达的是,现有的无论是公域还是私域的存量数据,都已接近枯竭。 如果我们想把 AI 带入下一阶段,让它变得更个性化、更主动、更强大,我们需要的是「增量数据」。

徐驰认为,AI 眼镜或将成为「最后一块」屏幕式硬件|图源:极客公园

 

未来,我们看到两个巨大的增量数据来源:一个是眼镜,一个是机器人。在具身智能机器人大规模普及之前,我们相信,戴在眼前的眼镜将是为 AI 提供更多个性化增量数据的最佳入口和途径。

虽然想象很美好,但现实中这个行业依然面临着重重挑战。我们有许多困难需要克服,尤其是无法突破的一些物理规律。

今天的 AI 眼镜仍然面临着「不可能三角」的挑战:全天候舒适佩戴、极佳的显示效果以及强大的 AI 智能化。 目前没有任何一款设备能同时完美解决这三点,能解决其中两点就已经非常出色了。

回顾这个行业十年的起伏,新一波浪潮因 AI 的赋能而呈现出产品井喷的状态。我们看到一个明显的变化:早期产品形态以头盔为主,但在 2024、2025 年之后,轻量化眼镜将逐渐成为主流。这也是整个 XR 行业从小众市场走向大众普及的必然阶段。

从另一个角度来看时机。在该领域投入最大的巨头 Meta,依然在持续加大投入,却尚未迎来明显的拐点。这可能是 XREAL 的投资人最不愿看到的一张图,让人感觉似乎遥遥无期。

前景如此美好,现实却如此艰难,到底是什么制约了眼镜的发展?让我们回看到二十年前。

 

03

AI 眼镜的终极形态

 

现在的眼镜行业特别像 2005、2006 年智能手机的前夜。在苹果 iPhone 出现之前,手机生态呈现出全面的碎片化。虽然当时很多设备销量很高,不乏百万级爆款,但对开发者而言,为这些不同形态的设备做适配简直是噩梦,交互方式在不同平台间的迁移成本极高。

如果我们相信 XR 行业会像手机一样成为通用的计算终端平台,那么我们就必须有能力将这样的生态逐渐统一起来。

我们常说, 如果 AI 终端的竞争是一场万米长跑,那么向下深耕、打好基础,跑对方向比今天的抢跑更重要。

展望十年之后, 我们经常会陷入一个误区,试图用一种单一的产品形态去想象未来。 就像我戴眼镜一样,我希望未来的智能眼镜能像今天的近视镜一样轻巧。但很可惜,正如我们曾想把手机的功能全部塞进手表里一样,这涉及到无法逾越的物理客观规律。

图源:极客公园

 

因此,我们认为即便在十年甚至更远的未来,智能眼镜很可能会存在「二元化」的产品形态:

第一种形态, 主打「全天候」

十年后,这种眼镜可能做到 35 克以下,与现在的近视眼镜无异。它能真正实现全天候佩戴,AI 将「住」在你的眼镜里,24 小时伴随你,或者至少在你醒着的时候一直陪伴。

它需要极强的多模态 AI 能力。但受限于物理规律,这种轻量化眼镜有一个致命问题:它的显示效果做到极致,可能也只能达到今天汽车 HUD 的水平,非常透明、无感,但无法用来观看高清电影,注定只能承载一部分功能。

第二种形态,则以 更好的显示效果为基准

它虽然也能全天候携带,但未必是全天候佩戴。它更像是一副「近视眼镜 + 墨镜」的组合,用户根据不同场景选择不同的设备。它有机会承载更丰富的生态内容。我们相信最终它的重量会比今天轻巧很多,大约做到 50 到 60 克。

既然我们预想了这样的形态,为什么海外巨头在今天明显不如当年 iPhone 时代那样「给力」了?这些巨头投入了巨额研发资金,拥有全球最优秀的工程师,却依然没有拿出像当年 iPhone、特斯拉、大疆那样让人惊艳的产品。

这背后反映了一个趋势:过去二十年,我们见证了美国及西方许多科技公司硬件创新的全面「空心化」。我们深刻体会到,变革正在发生, 「定义」往往源于美国,但不仅仅是制造,越来越多的「创造」正在向中国靠拢。

图源:极客公园

 

那么,「iPhone 时刻」何时到来?今天距离那个时刻还差什么?我认为有四个关键挑战需要解决:

第一是 硬件微型化 。回顾所有大厂的第一代产品形态,包括苹果 2024 年推出的 Apple Vision Pro,大家都能看到,厂商都希望做一个「大而全」的产品。但他们忽略了一点:只有微型化,才能让产品进一步向大众普及。

XREAL 在这方面做得最好的一点,就是从第一天起就坚信「只有小型化才有机会」。我们将所有研发力量都投入到如何实现小型化上,包括在芯片、显示和制造工艺上的突破,这让我们在相关领域取得了代际领先。

第二是 多模态 AI 。我们需要真正赋予 AI 一个 3D 化的世界模型。在这方面,越来越多的模型从 LLM 迁移到了 LMM,AI 能够陪我们打游戏、看视频,并通过上下文快速理解复杂的多模态信息。

第三是 生态统一 。大家记得 iPhone 问世后发生了什么吗?它彻底统一了交互方式,随后 iOS 和安卓两大生态彻底统一了开发者的接口,这直接导致了内容赛道的井喷式增长。

第四,也是更重要的一点,是如何让 AI 真正实现个性化 。在 AI 基础之上,我们需要 让 AI 拥有「长期记忆」 。这是什么概念?比如今天我见到一个人,AI 会帮我回忆过去三年我们在哪些场合见过、交流过什么核心信息、他对我有过什么意见、还有什么重要事务需要处理。这与我们大脑的结构是一样的。目前的 AI 记忆大多是基于长文本输入的短期记忆,我们相信在两到三年内,基于 AI 大模型的长期记忆会有所突破。

如果攻克了这四点,我们相信一个真正具备「iPhone 时刻」意义的产品将会问世。这一突破预计在未来两到三年内发生,届时大家将看到像初代 iPhone 一样令人惊艳、值得期待的全新全天候 AI 智能眼镜。

我们希望这个时间点是 2027 年,如果真是 2027 年,那恰好是 20 年的轮回:从 2007 年初代 iPhone 到 2027 年。

 

04

下一个 iPhone 的风口,由谁引领?

 

到底谁能引爆这场革命?过去我们希望像苹果、特斯拉这样的公司能帮我们定义好产品,其他人直接「效仿」。但在今天的时代,基于我们观察到的趋势,很可能没有一家公司能包揽一切,我们更有可能看到的是一个「全球联盟」。

举个简单的例子,在今年的谷歌 I/O 大会上,我们与谷歌联合发布了关于 Project Astra 的轻量化眼镜探索。这让我们第一次有了当年 iPhone 问世时的感觉。

我们发现所有的要素都开始成熟了:硬件形态足够轻巧,体验足够好,拥有足够开放的第三方内容生态,让开发者能快速移植或开发全新内容。

最重要的是用户交互。苹果在 iPhone 上引入了多点触控,统一了智能手机最重要的交互点;今天,我们认为 AI 将是 XR 最好的交互方式。就像电影《Her》里那样, 我们通过让 AI 住进眼镜里,以无感的方式结合 AI 实现全新的交互。

图源:极客公园

 

大家可以设想一下,拥有了海量现有的安卓生态内容,结合焕然一新的 AI 交互,再加上轻量化的产品体验,我们可以期待安卓 XR 在未来几年给大家带来的变革。同时,这也是第一个原生的 AI 操作系统。我们相信,在巨头的争夺下,中国公司也有机会通过联盟的方式,参与到全球产品的定义和竞争中去。

虽然今天 AI 的「大脑」是在大洋彼岸被创造和定义的,但我们相信,承载它的「眼镜」将越来越多地在中国诞生,中国今天是全球硬件制造业创新的核心基地。

同样,我们也相信眼镜可能是我们在座各位有生之年遇到的「最后一块屏」的机会。我们希望这块人类所需的「最后之屏」,能由我们这一代人亲眼见证,甚至有机会去参与、引领和定义。

虽然我不认为目前的成果已经达到了初代 iPhone 那般惊艳的程度,但这可能是我们和谷歌一起,在过去两年联合打造的、现阶段最好的「版本答案」。

我们希望能给大家带来惊喜,让大家看到未来几年这个行业将会涌现出怎样不同的产品形态和体验。

谢谢大家。

Teeni.AI 袁琳:10 后与 AI 的共生关系,将如空气般自然

2025年12月11日 10:42

整理|汤一涛

编辑| 靖宇

如果说 80 后、90 后是互联网的原住民,那么 10 后,则是 AI 时代的原生用户。

在未来十年,AI 将成为 10 后这一代生活的基本元素,像空气一样自然而然地融入他们的世界。对于这一代人来说,AI 不再是一个简单的工具,而是将与他们的学习、创作、情感和成长深度交织在一起。

作为推动这一进程的企业,Teeni.AI 在这一领域进行了深入的探索与实践。袁琳,Teeni.AI 的创始人兼 CEO,在本次活动中分享了她对于 10 后如何与 AI 共生的洞察与经验。

嘉宾精彩观点:

10 后视 AI 为如空气般自然的生存要素,关注重点已从「如何使用工具」转向「工具带来的效率变革」。

青少年对 AI 的需求已超越单纯的「寻求标准答案」,转向寻求情感共鸣与心理理解的「伙伴式社交」

AI 应作为激发创意的「脚手架」而非「代笔者」,通过苏格拉底式引导帮助孩子拆解任务并提升逻辑思维。

我们需要为 10 后创造一个健康、纯净的 AI 环境,成为他们成长的智能伙伴。

未来的人机关系将从简单的「交互」走向深度的「共生」,AI 将进化为具备共情力、能与孩子共同成长的智能伙伴。

以下为袁琳在极客公园创新大会 2026 上的演讲,由极客公园整理:

各位极客公园的朋友们,大家下午好。我是 Teeni.AI 的创始人袁琳。今天我在这里主要给大家分享我们这两年来服务于百万 10 后的一些洞察,这些主要来自用户的反馈。

我们的产品经理曾问了一位 10 岁小用户:你觉得 AI 怎么样?这个孩子回答,AI 不就是跟空气一样吗?为什么你们老是问我们它有什么特别的。

正是因为这句话,让我们对当下大模型时代的新产品的定义和交互方式做出了调整。接下来我会简单介绍一下,我们认为现在正在发生的一种代际变迁,90 后在大模型时代会考虑「我该怎么使用这个工具?」,而 10 后则会问「这个工具给我的效率带来了什么变化?」

10 后的典型特点就是,他们视 AI 为生活中的一部分,就像空气一样。

基于这一点,接下来我想分享一些我们 Teeni.AI 这几年积累的数据。

目前,Teeni.AI 服务的 10 后用户已经接近 100 万,且全部为端上用户。我们的年留存率达到了 55%,这一成绩刷新了所有青少年产品的数据。而日调用量最高已达到 30 亿 token,这也可能刷新了青少终端大模型的纪录。

此外,我们的日均使用时长也令人感到自豪。目前,10 后用户在我们平台上的日均 AI 使用时长为 32 分钟,智能终端的使用时长达 3.5 小时,这个数据相比普通的手机助手高出了 8 倍。

这些数据充分说明,10 后对 AI 的依赖程度和粘性都非常高。

Teeni.AI 刷新了国内青少年 AI 大模型的调用纪录

 

 

01

从「寻求答案」转向「思维训练与情感共鸣」,

打造去干扰的「随身智能体」

 

在 AI 与教育结合时,会遇到哪些问题?

首先,很多家长会问,AI 会不会让下一代失去思考?

为了回答这个问题,我们用用户数据来说明,AI 其实能够帮助孩子提升思维方式,甚至颠覆传统教育的模式。根据我们的数据,91% 的孩子在与 AI 互动时,能够比较明确自己的沟通逻辑。他们并不直接向 AI 寻求答案,而是进行一对一的对话,这种互动本身就是一种新的思维训练。

另一个常见的问题是:如果孩子不懂 AI,那么作为家长或教育者,我们是否需要干预孩子使用 AI 并进行管控呢?

我们的数据也给出了不同的答案。78% 的孩子能够自行建立使用 AI 的规则,并且在训练 AI。很多孩子会要求他的 Agent 与自己进行类似自己性格的对话,甚至把自己的爱好和表达方式输入到 AI 中,让 AI 更好地理解自己。

第三个值得关注的问题是,孩子们是否只是要求 AI 给出标准答案?

这个数据也是比较让我们触动的。我们发现,84% 的孩子会寻求 AI 的理解和共鸣,而不仅仅是让 AI 提供一个标准答案。很多时候,孩子们会通过 AI 倾诉情绪和情感,这也是我们在 10 后身上看到的一个与众不同的现象。

基于这些数据,我也给大家分享一下,我们做了哪些事情。

为了更好地帮助 10 后用户专注于与 AI 的互动,Teeni.AI 设计了一款专属硬件。我们的智能体设备不仅仅是一个简单的 AI 助手,它还是一个能够专注于学习和成长的终端。

我们主要做了 2 个动作,第一就是给孩子一个专属的 AI 的终端。

普通手机,手机中的游戏、短视频等干扰元素,容易打断孩子的注意力。而我们的专属硬件,通过设计专用 AI 按键,创建了一个最小单位的交互方式,避免了这些干扰,帮助孩子在与 AI 互动时保持更高的专注度。

第二,是我今天想重点给大家分享的,Teeni.AI 在打造 α 时代的多模态随身智能体,我们称之为 Mobile Agent,实际上它是「移动设备+AI 智能体(Mobile Devices+AI Agent)」的结合体。

α 时代=移动设备 + AI 智能体

 

10 后希望的 Mobile Agent 是什么样的呢?

第一,它是多模态的

第二,一定是可随身携带的

第三,一定是陪他成长的智能体

基于这些特性,我们的超级智能体也具备三个特点:

第一,可看、可听、可说,会记忆

第二,有规划

第三,有共情的能力

我们跟通义实验室用了一年半的时间,给当下的 10 后打造了一个专用的青少年大模型。接下来给大家介绍一下我们的大模型有哪些特点,做了哪些技术上的储备。

Teeni.AI 青少年专属大模型的特点

 

第一,是 理解力优化 。为什么要这么做?

儿童说话跟成人不一样的地方是有很多模糊的表达,比如他说「有个毛茸茸的东西在跑」,AI 可以马上理解说的是小狗。要做到这一点,其实是需要输入大量的语料库,然后让 AI 具备青少年语言理解力。

第二就是 知识结构的定制 。我们的 AI 系统为 3-15 岁的孩子量身定制了专门的知识体系。

第三是 安全护栏 ,这是我们认为的底线。我们与阿里云合作,构建了五层内容护栏,确保青少年用户使用过程中不会接触到不当内容。

第四,也是最重要的一部分,是 共情式的回答 。AI 在与孩子互动时,首先要建立共情,与孩子形成伙伴关系;然后采用苏格拉底式的引导方式,帮助孩子更好地表达自己。

以上也是我们的青少年大模型不同于通用大模型的一些点。

接下来给大家介绍,我们的青少年大模型所具备的核心能力。

第一个必需的能力是长期的记忆和人格化。

91% 的孩子在与 AI 的互动中有社交需求,需要 AI 记住他们的偏好、习惯以及小细节。例如,孩子的 AI 会记住他有一个宠物叫「小黑」,喜欢吃胡萝卜,几天后 Teeni 会提问:「你给小黑喂胡萝卜了吗?」这样的记忆能力让孩子感觉 AI 像是一个真正的伙伴。

我觉得其实对于孩子来说,记住其实就是一种尊重。最核心的一点,就是你要记住孩子认为他至关重要的小事,那这时候陪伴的关系才会真正地建立。这是我们打造的第一个能力,就是长期记忆和人格化。

对孩子来说,长期记忆带来的是尊重

 

第二个大模型能力是规划和引导。

AI 当下对于 10 后来说,其实更多的会充当创意的脚手架。AI 能够帮助孩子将复杂的创意任务分解为可执行的小步骤。例如,一个孩子可能想做一个太空探索的视频创意,这是一个宏大的立意点,如果这个时候没有人引导他,有可能这个想法就破灭了。

所以我们的智能体会把复杂的任务分解成一个个小步骤,引导他从构思脚本、生成图像到制作视频,完成整个创作过程。

Teeni.AI 为孩子拆解复杂任务

 

第三个,也是比较触动我们的点,是情感和互动。

84% 的孩子在与 AI 互动时,跟 AI 深度交流并进行情感表达。很多孩子其实情绪上都需要有人倾听和输出。当孩子感到沮丧时,可能是他考试差了一点,他跟 AI 说我是不是有点笨,会有自我怀疑,因为孩子的成长有很多时候都在自我探索。

这时候 AI 会告诉他,别灰心,下次再努力。AI 能够与他们进行情感共鸣,给予鼓励和支持。

为了做到这点,我们做了一个语音的情感识别,加上上下文理解,以及 Teeni.AI 的共情策略库。

84% 的孩子在与 AI 互动时,会进行情感交流

 

基于这三块能力,我们的智能体能够给 10 后拓展新的学习和创造的可能。

 

02

让 AI 这层「空气」更纯净,

从人机交互走向人机共生

 

我们将在 2026 年 CES 发布的一系列产品,旨在承载我们目前在青少年大模型方面的能力,以及为孩子们提供专属的智能伙伴。这一路走来,已经花费了 12 年的时间,而 Teeni.AI 这个青少年产品也是我们团队三年心血的结晶。我们的青少年大模型是与阿里通义合作一年多时间共同打造的成果。

Teeni.AI 将在 2026 CES 发布的产品

 

基于我们当前积累的技术和能力,我们将推出全球专为 10 后设计的硬件,让世界和孩子们对话。未来,这些硬件将包括四种载体,从对话智能体到 AI 随身机器人。正如乔布斯曾说过,「电脑是人脑的自行车」,我们认为 AI 是孩子们的「发动机」。它不仅是一个冷冰冰的工具,更是一个真正陪伴孩子成长的智能体。这个方向也是我们公司在明年全球发展的核心目标,欢迎大家关注。

展望未来,我们认为会有三大变化:

  1. 硬件进化:
  2. 从一个通用的终端,发展成多场景适用的伙伴;
  3. 工具转变:
  4. 由原来单纯的工具,发展成具有理解力和成长能力的智能体;
  5. 价值重估:
  6. 过去工具和效率是主要考量,未来对 10 后而言,AI 将更多体现为共情的创造力和陪伴。

我们认为,未来的趋势是从简单的人机交互,向深度的人机共生发展。我们 Teeni.AI 期望在这一过程中,能够真正陪伴孩子们成长。未来 10 年,AI 对于 10 后将像空气般自然。作为父母、创业者和教育者,我们的责任是什么?是让这个「空气」更纯净、更有营养。我们打造的不是完美的机器,而是与 10 后这一代共同成长的智能伙伴。

谢谢大家!如果在座的朋友对青少年教育或青少年发展有兴趣,欢迎私下与我交流。

中国 AI 硬件团队,在 Kickstarter 上找到「第三条路」

2025年12月11日 10:38

整理|徐珊

编辑| 靖宇

 

「我们认为,对于每一个致力于去发展全球化创新品牌的老板来说,一次 Kickstarter 都没上过的人生是不完整的。」

当业界普遍关注前沿技术时,一股由中国力量推动的硬件创新浪潮正在全球众筹平台 Kickstarter 上汹涌爆发。截至今年 11 月中旬,平台数据显示, 中国 创造者 社群的 在 Kickstarter 上获得的 众筹 总 金额在今年首次突破 2 亿美元的里程碑, 到达 2 .44 亿美元, 同比增长高达 71.8%

这股 AI 硬件出海热潮,源于中国创业者多年的社区积累与努力。「我们看到了中国创造者社区的惊人爆发,这是背后技术、供应链和全球化视野积累的结果。」

作为 Kickstarter 中国首席战略代表 Henri 见证也助推了这一巨变。Kickstarter 至今走过 16 年,他从自身视野出发,探讨我们到底该如何看待 AI 硬件的爆发与当下创新创业的新机遇。

Kickstarter 中国首席战略代表及高级顾问 彭奕亨 Henri | 图源:极客公园

 

在 IF 2026 大会上,Henri 分享了近期他在创新赛道如何创业的最新思考,输出了一些非常精彩观点:

• AI 硬件并非仅指大型语言模型(LLM)硬件,而应该泛指一切利用 AI 来定义部分卖点,并以软硬件功能闭环实现增长闭环的硬件产品。它的本体是一个硬件,你需要用一个新的硬件形态来圈定属于你的场景。这样子用户才会对你这个产品重新建立起一个价值和价格的锚点。

• 很多人会问我们到底什么样的产品值得自己去创业或投入精力?我总结下来就是三句话:大众市场找盲区,垂直领域打刚需,细分赛道做生意。

• 大疆早期的时候,大家以为它只做航模。它真正要做的是航拍和摄影,它的大众市场是摄影,航拍是盲区。你去看它的产品定义「会飞的照相机」,是你看不懂的形容词和你看得懂的名词搭配在一起。

• 我们可以从这样一个角度去思考:如果你想把你手中的 Tier-2 应用变成一个硬件产品,它会是什么样子?因为手机本身的 Tier-2 应用已经代表了既定的刚需,所以你可以从这个场景中找到一个或许能更快尝试实现 PMF 的方向。

• 消费电子产品不像服饰、时尚单品或者艺术产品,它具有买手的溢价。那怎么样能够打破这个商业模式,让它可以去到最好的地方?我们重新定义了一个新的消费电子创新产品的零售模式,INNO100 全球创新旗舰店是基于 POD(按需打印)定制化服务基础的创新产品线下零售空间。

 

以下是 Henri 现场分享实录,经极客公园整理:

 

01

中国团队,2025 年狂揽 52 个百万级众筹

 

Kickstarter 不是一个电商平台,我们更多将其定义为线上社群。它聚集了一群极度热爱创新和极具参与感的用户群体,我们拥有 2500 万用户,目前在全球创新产品众筹领域占据 90% 的市场份额。

截至今年 11 月,我们总共的筹集总金额已达 93 亿美金,在科技和创意领域表现尤为强势。中国创造者社群的贡献金额现在也达到了 84 亿元人民币,我们相信在 2026 年这两个数字都会达到百亿的量级。简单来说,Kickstarter 上高度聚集了在大湾区乃至全中国数千家致力于打造全球化科技品牌的中国创业者企业。

近三年以内,在全球这些创新产品众筹中,超过 100 万美金的项目有 181 个,其中有 160 个发生在 Kickstarter。超过 600 万美金的项目中,全部 12 个项目都发生在 Kickstarter。也正是因为我们这样的视野和特殊的平台定位,我们要求产品必须在全球范围内是一个独家首发的状态。

Kickstarter 上中国创造者获得的众筹总金额变化 | 图源:极客公园

 

Kickstarter 的发展,我主要把它们分为三个阶段:

第一阶段是在 2012 年到 2017 年 ,Kickstarter 早期创立时主要面向很多艺术家,可能发起画廊、演唱会或者艺术作品等项目。从 2012 年开始,消费电子类产品开始在 Kickstarter 上进行众筹。第一个标杆性的项目就是当年的第一款智能手表,PebbleWatch,一款墨水屏手表。这个阶段还出现了居家办公产品,例如早期 3D 打印笔,直至现在整个 3D 打印品类,甚至是智能戒指,可以看到有些品类行业很早就已出现。 这个阶段最典型的一个特点就是产品和品类创新主要来源于海外团队,他们有更好的产品定义和 商业 化落地的能力。

比较有意思的事情,发生在 2018 年到 2021 年 这个阶段,贸易政策风向的改变,迫使中国品牌开始引领品类创新。因为中国创业者从未停止过他们的脚步,当产品只能靠最低的价格销售已不可持续时,开始有更多的创新创业者尝试 Kickstarter。

这个时候我们看到了 Ecoflow 这样的公司出现,它重新定义了一个品类和一个产品。我们也看到了具备拖地功能的扫地机器人,比如云鲸的产品首发。中国企业在 3D 打印赛道上,将海外公司最早开创的品类做得更好。还有激光雕刻,2021 年,我们国内团队终于出现了第一个突破千万美金的项目,当时 Ecoflow 的项目达到了 1200 万美金。

第三个阶段是 我们现在所处的阶段,是创造力工具、AI 硬件和整个利用 AI 去开创新品类的新阶段

我们眼中 2022 年之后出现的项目,AI 硬件并非仅指大型语言模型(LLM)硬件,而应该泛指一切利用 AI 来定义部分卖点,并以软硬件功能闭环实现增长闭环的硬件产品。在我们看来,这也是 AI 创造力工具。

以前需要花费大量精力去建模,但现在这些项目提供了很多工具和插件,帮助你更快速地将模型和想法变成可打印的实物。

拓竹公司的第一笔营收和整个项目起源都来自 Kickstarter。包括巧妙利用视觉算法、利用人工智能技术去做割草机这件事,LUBA 从 2022 年就开始做了。

很多人知道的 PLAUD 这家公司,它的产品也被很多公司致敬。在成为 PLAUD 之前,它已经在 Kickstarter 上完成了硬件产品验证,当时的项目金额有小几十万美金,检验了卡片形态硬件在消费者中的接受度。

随着 AI 的来临,它重新打磨了软件和硬件。在我们看来,这个过程也是一个非常好的案例,告诉大家如何去迭代你的 AI 硬件产品想法。

截至今年 11 月底,在整个 2025 年能追踪到的项目中,有 2854 个属于 Design Tech(设计与科技)这个类目。其中,在 Kickstarter 上超过百万美金的项目有 65 个,总金额超过 4 亿美金,较上一年增长 41.3%。其中,由中国创造者发起的项目,基本占了一半,有 1100 多个。在优质或大金额的项目中,超过百万级的 60 多个项目里,有 52 个都来自于中国创业者。 总金额里有一半甚至超过一半,达到 2.44 亿美金,都来自中国创业者。

中国团队在 Kickstarter 上发起的项目 | 图源:极客公园

 

02

下一个百万级机会藏在哪?

 

我们今年看到的众筹历史新纪录,它不仅是 Kickstarter 平台的纪录,也是整个海外新品全球发布的历史纪录,它是由 Anker 旗下的 eufyMake 这款 UV 打印机创造的,众筹金额达到了 4676 万美金。这个数字超过了此前由一部科幻小说保持的 4500 万美金的纪录。这个案例之所以有趣,是因为 Anker 之前在创造力工具上也有不同的尝试。

经过这几年的迭代,他们找到了一个新的方向,创造了一个新的类目,将工业级的产品变成了 C 端产品,把 AI 技术融入其中,并打磨了更好的软件,让用户可以更方便地使用。例如,你把照片放上去,系统可以识别哪些是背景、哪些是人脸,哪些部分可以做成凹陷或凸起的画面,因此迅速引爆了这个市场。

我一年多以前看到这个产品,当时就觉得这个项目肯定会非常优秀。因为他们运营的人跟我说了一句话:「 你有了这个产品之后,小朋友幼儿园的那些手工就不用担心了,因为什么东西都可以印,什么东西都可以做。

排名第二的项目是 Snapmaker 的换头多色打印机,它做了 2000 多万美金,也是整个众筹平台,包括 Kickstarter 平台上面 3D 打印这个类目里众筹成绩最好的一个案例。在我们看来,即使是在 3D 打印这个持续热门、竞争激烈的赛道里,仍然可以做出一些创新。

同时,桌面级的 CNC 产品也在今年迎来了真正的爆发。过去几年我们看到过好的产品,今年正在线上的 Makera 和 Nestwork 这两个产品刚上线就能做到 700 万美金 这样的成绩。

LiberNovo 智能人体工学椅, 也做到了超过 1000 万美元的金额。我们看到,创新不仅限于创造类工具,也有通过设计、功能、材料等各方面的全面迭代,去「重塑」一个既有产品这样的赛道。

还有值得一提的是, LAVA STUDIO 这个产品可能在国内大家还没有太意识到。它也是在音乐工作站和音乐 AI 创造产品里面,在 Kickstarter 平台上做得最好的一个产品。本质来说,它就是把创作音乐的门槛降得非常低,利用 AI 去模拟各种效果器,很多音乐行业的从业者或者热爱音乐的人可以用这样一个完整的一体化工作站去制作很多他们喜欢的音乐。

AI 创作工具 LAVA STUDIO | 图源:极客公园

 

我们还看到了一个趋势,就是具有社交属性的家具,比如说一款小茶几,它其实是一个沙盘,里面有一个钢珠一直在上面转动,呈现画面和颜色。也有一些很有趣的小产品方向,比如说每一分钟会用 AI 给你写一句押韵的诗这样的时钟。

虽然这些不是金额非常高的项目,但我们愿意拿出来分享。 很多小产品的尝试,也是在 AI 硬件这个赛道上面去值得做的。

 

03

什么方向值得 All in?

三句话教你找到定位诀窍

 

看过背后的故事和产品,很多人会问我们到底什么样的产品值得自己去创业或投入精力。 我总结下来就是三句话:大众市场找盲区,垂直领域打刚需,细分赛道做生意。 很多时候我们在看一些产品和品牌的时候,早期可能觉得它是很垂直的赛道,实际上它来源于大众市场。

就像 DJI(大疆)早期的时候,大家以为它只做航模。它真正要做的是航拍和摄影,它的大众市场是摄影,航拍是盲区。 你去看它的产品定义,通常是你看不懂的形容词和你看得懂的名词搭配在一起。 最早大疆去打它的 PMF(产品市场契合度)宣传标语是「会飞的照相机」。Narwal(云鲸)也是一样,清洁是大众市场,拖地是盲区,所以产品定义是「会拖地的扫地机」。Ecoflow 之前也有户外用电、燃油发电机和大型用电设备。它当时主要突出的优势就是快充,因为应急是盲区,用电是大众。录音是大众的,但是转写总结是盲区,所以有人做了一个用 AI 纪要的录音卡。

如果我们把视野再放窄一点,来看看 AI 硬件的「Hardware PMF」(硬件产品市场契合度)是什么。 首先,它是当下既有的刚需 ,这个需求可能已经通过其他产品形态,不管是软硬件形式,多少有点验证了。

其次,它必须得是新的硬件形态 。很多注重软件或者从软件出身的团队需要花时间理解这件事情。如果你真的是做 AI 硬件,它的本体是一个硬件,你需要用一个新的硬件形态来圈定属于你的场景。这样子用户才会对你这个产品重新建立起一个价值和价格的锚点。它把原本是一个条状的录音笔变成录音卡,放在手机背后或者钱包里面或其他地方,这就是它的硬件形态改变和场景改变,所以你就可以重新定义这个交互形式。

最后是独立闭环的软件商业模式或生态 。你的软件必须得有设计出来的商业模式,能够去收费。

有关 AI 硬件 PMF 的思考 | 图源:极客公园

 

我们也给大家分享一个简单的思考方向: 可以尝试将 iPhone 自带的 Tier-2 应用硬件产品化。

例如,录音功能本身就是一个应用,你把它单独拿出来,做成一个更好的录音设备。你会发现其实你把这个功能摘出来之后,会更好用。你不会在录音过程中被打扰,也不会被电话接入打断。因为你摘出来变成一个独立的硬件产品,你的使用场景就更丰富了,不需要每次录音都掏出手机、解锁并点击应用。

有关 AI 硬件创业的思路分享 | 图源:极客公园

 

我们可以从这样一个角度去思考:如果你想把你手中的 Tier-2 应用变成一个硬件产品,它会是什么样子?因为手机本身的 Tier-2 应用已经代表了既定的刚需,所以你可以从这个场景中找到一个或许能更快尝试实现 PMF 的方向。

 

04

新业务、新基金与新玩法

 

另外,也跟大家分享一下我们最近的进展,包括我自己这边的业务孵化。我本身也在做一些定向的业务孵化,我跟我的创业导师高秉强教授联合发起组建了 H 3 Future Venture Lab,我们定向(带着 PMF)去找团队,发起和孵化一些创新的产品或业务,去做一些寻找 Founder-Product Fit 的工作。

其次,我今年跟极客公园的张鹏总一起联合发起了一个「变量资本」旗下的新基金 N 2 Fund,去帮助 Day one 就 Born to Global, Born with AI 的硬件产品早期创业者。

我们最近在深圳开了一家全球创新旗舰店,它是 Kickstarter 目前唯一一个也是首个在国内官方授权的线下空间。

值得讲的一点是,很多人都希望科技产品可以有更多与大众接触和体验的地方。在我看来,把产品零售摆在一起来卖,这个事情很多人都在做,你会在商超、机场、旅游景点看到。但有一个点我一直没有想明白,在做这件事情之前。其实你在线上和线下购买一个消费电子产品,它的功能都是一样的。消费电子产品不像服饰、时尚单品或者艺术产品,具有买手的溢价。那怎么样能够打破这个商业模式,让它可以去到最好的地方?刚好今年很独特,你们也看到了有那么多的创造类工具, 我们是定义了一个新的消费电子创新产品的零售模式,它是基于 POD(按需打印)定制化服务基础的 创新 产品线下零售。

怎么理解?你如果有机会去深圳,可以去看看 INNO100。你到里面可以去体验全球线下唯一能够体验的地方,虽然它现在还没有开始卖。但是你可以通过这个店里的小程序,去下单,去定制一个冰箱贴。

Kickstarter 官方授权的 INNO100 全球创新旗舰店 | 图源:极客公园

 

在过去这几天我们做了一些很有意义的尝试:我给我港科大以前的老师送了一幅由 AI 做成的油画,实际上是用 UV 打印机打印出来的;我们给博主他的宠物小狗做了一个冰箱贴;我们还可以去印制 T 恤。过去一两年所有 C 端定制化的产品,从工业级产品已经下放到桌面来了,我们才能够做这件事情。这也是我们看到在科技产品、线下空间和零售中很新的一种玩法。

通过这样的形式,就会让用户有去线下的动力,去享受服务的动力,才会重新变革这里面的整个商业模式。

流量时代的失灵:AI 能否让经营者重新看见真实需求?

2025年12月11日 10:36

整理| Moonshot

编辑| 靖宇

在这一两年里,我们被反复提醒:AI 正在重塑一切。它在改变创作方式,改变知识分发方式,改变我们对「效率」与「增长」的定义。

但在前沿技术叙事之外,有一群人的声音往往被忽略:那些撑起地方经济、在反全球化浪潮中迷茫的中小企业者。

他们既不是大公司,也不是受资本追逐的创业者,而是当地餐厅、跨国小工厂、手工艺工作坊、贴纸品牌、区域零售商……他们的经济活动真实而微小,需求分散却具体,经营压力长期存在,信息与资源高度不对称。

而今天,AI 的快速演进让这种差距被进一步放大:算法广告越来越精准,却也越来越昂贵;供需匹配越来越高效,却也越来越偏向懂技术、懂流量的大企业。

Lexi 希望「市场营销」不只属于大公司|图源:极客公园

 

在这样一个「计算广告越有效、市场越失衡」的时代,一个本地中小企业主究竟该如何在没有数据科学团队、没有复杂技术栈、没有巨额预算的情况下,找到自己的增长信号?

这正是 Sandwich Lab 想回答的问题。他们想讲一个关于 AI、关于营销市场的演变,更关于普通人如何重新立足,并掌握未来的故事。

以下是 Sandwich Lab 创始人兼 CEO 郭振宇在极客公园创新大会 2026 上关于 AI 如何赋能中小企业者的演讲实录,由极客公园整理:

嘉宾观点:

  • 我们认为,这个时代市场的「充分性」正在被侵蚀。
  • 市场信号的观测上有非常大的迷惑,你看到的数据不代表真实的反映市场需求的洞察。
  • 所有机制与工具都在试图提高供需匹配的效率、重新配置社会资源,从而带来新的供给增长。
  • 计算广告越有效,市场越失衡,这听上去反直觉,但已经发生。

我们在 IF 2026 上聊了很多 AI,前沿的技术,如今我想花一点时间聊聊中小企业,以及它们在当下所面对的市场环境。

先来看一家曾经开在温哥华的咖啡店。这里每天小批量烘焙来自不同产区、不同风味的豆子,用极有耐心的萃取方式,呈现出非常好的口味,店铺氛围也非常社区化、令人愉悦。店员偶尔会在社交媒体上分享一些顾客的体验,但显然他们几乎没有做任何系统化的营销。

倒闭的加拿大咖啡店|图源:Sandwich Lab

 

结果是,这家店很快就倒闭了,哪怕许多顾客在这里第一次真正体会到咖啡的完整愉悦。

有没有类似的经历?你费了很大劲订到一家餐厅,吃到的却是「流量好」的餐厅,而非「味道好」的餐厅;你长途跋涉去了一个目的地,看到的是网红打卡点,而不是美景本身和人文体验;结束一天的工作,你走进电影院,却看到某位流量明星的「流量电影」,而不是情感动人、逻辑严谨的作品。

我们认为,这个时代市场的「充分性」正在被侵蚀。

去年,我们创立了一家叫 Sandwich Lab 的公司,希望帮助中小企业解决增长困境。而在解决问题之前,我们需要先理解市场是如何走到今天这一步的。

 

01

找到需求,带来效率

 

长期以来,所有机制与工具都在试图提高供需匹配的效率、重新配置社会资源,从而带来新的供给增长。

比如价格机制,在计划经济时代,价格由主管部门制定,往往严重偏离价值,导致供需错配与资源浪费。因此我们全面拥抱市场经济,让价格由供需决定,从而带来更高效的匹配,让价格不断趋近真实价值。

再比如区域机制,如 WTO 等全球化努力,在不同区域之间提升商品交换效率、减少阻碍,使供需匹配更顺滑,并推动了全球商品经济长期繁荣。

最后是更微观的手段,典型如广告与营销。它们以极直接的方式把供给呈现在消费者面前,让消费者知道「你可以买什么」,大幅提升供给对需求侧的渗透率,从而进一步催生经济增长。

广告本身也经历了漫长演进。从 19 世纪初美国邮政购物与铁路结合带来的商品繁荣;到 20 世纪 50 年代有线电视的普及,使广告成为最有效的传播方式。

统一的媒介和内容催生了标品繁荣:无论城市乡村、不同国家,大家买到的都是同样的饮料、同样的纸尿裤。

全球化市场打破了国界|图源:Sandwich Lab

 

谷歌兴起后,我们进入计算广告时代;随后是推荐与信息流广告,再到短视频时代的内容化广告。广告对消费者日常生活的渗透率更高、频次更密、个性化更强,这不仅催生商品经济进一步发展,也带动了过去无法被发现、无法被满足的大规模非标品需求爆发。

所以我们看到: 计算广告非常好,非常有效。唯一的问题是,经营者必须自己找到准确的「信号」,才能真正用好它。 这个信号就是:需求在哪儿。

我们来看一个客户的例子。Paul 是一家本地辣椒酱品牌。店主退伍后,用家里仅有的积蓄复刻奶奶的童年味道,组建小团队,建立线上线下渠道。他们尝试在 Facebook 上投放广告,最初有一些成绩,但很快遇到受众饱和。他无法从繁复的广告后台理解下一步该怎么做,因此来到我们的产品——Lexi AI。

再看另一个客户 Frank,他在美国经营一家跨国家具公司,既做 D2C,也做 B2B,总部在西雅图,工厂在亚太。消费者可以在独立站、亚马逊、Costco、Home Depot 等渠道买到他的产品。

Paul 的辣椒酱店|图源:Sandwich Lab

 

疫情期间他享受了消费红利,但疫情结束后,红利消失,美国房地产与家装支出迅速下滑,竞争加剧,零售商账期变长,他面临巨大经营压力。于是他把目光放到美国之外的中东与东南亚。

在这些地区,家装家具支出上升,人口与消费习惯改善,需求确实存在。但他对当地语言文化毫无了解,也不知道如何制定策略,便把美国经验照搬过去,结果可想而知,遇到瓶颈,反馈信号有限。最终他也来到 Lexi AI。

在今年夏天我们的产品上线后,短时间内就获得来自 90 多个国家、各种类型中小企业的付费用户。

从波兰的个人陶瓷工作室,加拿大的定制贴纸品牌,南非的功能性女性内裤品牌,印尼的个人金融服务机构等等。

这会让人产生一个疑问:经营者不应该最了解需求吗?为什么他们需要我们来告诉他们需求在哪里?

 

02

经营者的盲区

 

我们再看一个知名的例子。

市场信号的观测上有非常大的迷惑,你看到的数据不代表真实的反映市场需求的洞察。

1985 年的可口可乐面对百事可乐冲击,可口可乐管理层「亲口试喝」得出假设:百事更甜。

于是可口可乐动用更庞大的研究团队,做了 19 万次的盲品测试,结论是「美国消费者喜欢更甜的可乐」。他们停产百年配方、推出 New Coke,并进行了大规模营销。

可口可乐一度「抓错信号」|图源:Sandwich Lab

 

结果全美消费者和媒体集体抵制,可口可乐不得不出来道歉,恢复百年配方,停产新可乐。很显然「用户喜欢更甜的可乐口味」这个需求信号是错误的。

这个信号为什么错?因为真正的原因是:百事更便宜五分钱,并且大量签约当时的流量明星,密集触达新一代年轻人。而可口可乐管理层因年龄层较大,完全没有接触到百事的营销,所以错过了真正的信号。

这个故事我们想说明的是:强大如可口可乐这样的消费品公司,如此熟悉用户和市场,仍然会抓错真正的增长信号在哪儿。

回到今天,广告技术越来越有效,但能真正用好的,只有少数大企业。这就导致 计算广告越有效,市场越失衡,这听上去反直觉,但已经发生。

那 Sandwich Lab 想做什么?AI 又能做什么?

 

03

AI 能做什么?

 

我们构建了一套完整体系,利用 AI 覆盖增长决策的全部三个环节。

第一步,用 Lexi 的 AX 系统在庞杂的数据中去噪,从基本面、消息面、技术面中找出潜在真实的增长信号。

第二步,用内部的 evolved 引擎进行策略与信号的迭代、验证与测试,以统计方式最快确定「此时此刻对用户最有效的增长信号」。

第三步,把信号转换为策略,把策略转换为可执行资产,并以可规模化方式执行,再持续在三个环节之间循环迭代。

郭振宇讲解 Lexi AI 的技术原理|图源:极客公园

 

回到 Paul 的例子。他最初把注意力集中在一个刻板的典型用户:本地、男性、喜欢烧烤、在后院做 BBQ。

很快,他不知道还能向哪里寻求增长。而 Lexi 会自动分析不同地区、文化、人口结构中可能存在的新场景:比如家庭料理、女性用户、聚会与送礼、夜宵与加班等。

我们的 EVOLION 会自动生成可执行策略,并用极低成本快速验证,放大最有效的方案,持续提升增长。

我们希望通过服务一个又一个像 Paul 这样的中小企业,逐步推动全球市场重新走向更平衡的状态。这不仅是帮助单个企业,而是试图从多种方式促进市场再平衡,为整体经济带来更大繁荣。

借今天这个机会,我们也正式宣布:在成立一年多后的今天,我们刚刚与业内头部 SaaS 服务平台达成深度合作。从 AI 建站到自动化营销,实现全链路、全托管的协作;同时获得了全球 50 万家企业的信任。我们正式签订了总额 9600 万美金的订单*。

未来,希望有更多行业伙伴加入,让我们能更快服务全球更多中小企业。

谢谢大家。

注释* 数据源自 Sandwich Lab 全球业务统计(截至 2025 年 12 月),含生态合作伙伴及试用商户;金额指相关战略合作意向总值。

AI 时代的超级个体,正在小红书上寻找自己的绿洲

2025年12月11日 10:31

整理|徐珊

编辑| 郑玄

2025 年,AI 浪潮带来的不只是技术奇点,更是一场深刻的、直击灵魂的个体觉醒。

我们曾以为,伟大的创新者总是那些孤独的探索者,一个人在冰冷的算法世界里艰难前行。但在这场宏大的变革中,一切似乎有些不同,我们发现了:超级个体的成长,从来不是一场孤立的硬核探索之路,而是创造者们与用户之间的「双向奔赴」。

AI 将生产要素变得极度低廉,一个人的力量足以顶替过去一个团队的效率。它推倒了曾经高耸的技术壁垒,同时也让所有创新者直面一个拷问灵魂的问题: 「在技术不设防的时代,我的价值,我的护城河,究竟是什么?」

这个问题的答案,藏在一个充满了「活人感」的社区里,也藏在那些最真实、最普通的个体需求中。现在,小红书正以独特的姿态,成为开发者对抗焦虑、寻找创新灵感的「绿洲」。

Plan Coach 创始人苏晓江的故事,是一人公司最真切的写照。他曾是大厂的技术主管,但也会因「不想刷碗」而开始拖延。当 AI 将他的拖延症状拆解成「你只要站起来就算赢」时,他通过这个微小的洞察,用一天时间做成了一个抗拖延 APP 的原型。当他将这个不完美的「雏形」扔进社区,回应是山呼海啸般的热情,在贴文下,他获得了 26 万赞,和 1000 多条用户真实反馈。用户成为了他产品的「精神股东」。

面对潮水般「你们会不会跑路」的追问,他选择不再让 AI 去「审核」掉文字里的紧张感,而是用最真实的口吻回应:「在某种意义上,我已经跑路了,但是我仍然在开发这个 APP。」这种不卑不亢的活人感,穿透了屏幕,和用户们之间建立了最深的信任。他渐渐发现,真正的护城河,不是技术,而是你与用户之间基于真诚所建立的不可复制的关系。

Macaron AI 创始人陈锴杰 的经历,更加展现了在 AI 时代,「做自己」才是最高级的商业策略。他坚持将 AI 产品设计成「粉红色马卡龙」,与极简冷淡的科技风格格格不入。社区用户的惊喜反馈是:「配色好好看!」,他由此确信,用户需要的不是冷冰冰的效率机器,而是能改善生活、带来精神共鸣的「搭子」。他感叹,当你很自我陶醉地去开发一个你深爱的东西时,用户是能够感知到的。

正如 小红书科技运营负责人散兵 所说,过去一年,许多真正带着活人味的「小红书 Native」原生产品,正在这片创新土壤中生长出来。如今,平台已汇聚超过 5 万开发者。不少超级个体们正在这里挖掘真实需求、找到第一批种子用户,并将产品的迭代视为一场与用户的极致共创。更重要的是,平台现在也成为了一个高效的「连接器」,链接了生态的关键环节:创业者找团队,投资人找项目,科研大佬和 AI 负责人们在这里招聘、分享技术成果。

AI 时代,技术壁垒坍塌,所有的生产要素都在变得易得且便宜,「你想做什么」这件事情,变得愈发重要。这场关于对抗焦虑、寻找方向与构建用户信任的深度对话,便是超级个体们献给所有追梦人的成长指南。

图源:极客公园

 

以下是极客公园 IF 2026 创新大会上小场对谈《AI 时代,超级个体如何找到成长的「绿洲」》的对话实录,由极客公园整理:

 

01

Ask Me Anything 如何成全民热潮?

一场科技圈的「双向奔赴」

 

Koji: 我想知道现场有多少人参与过 AMA(Ask Me Anything)。AMA 的风是从小红书上刮起来的。 所以,小红书的散兵可不可以给我们复盘一下,你们从社区运营的角度,怎么开始把它推成了一个全民的风潮?

散兵: 其实最开始我们是想做一些研究者的拉新,我们在海外的科研群体做了一波学者的拉新。当时我们其实遇到一个比较困难的问题:这批学者是比较内向(i 人)的,不知道怎么在公开场合跟大家对话,也不知道怎么在社交媒体上发布自己的第一篇帖子和笔记。

我们就找到了一个范式:AMA 在科技圈,比如在 Reddit 平台上,在海外之前就有流行过一阵,但是在国内还没有这样的风潮出现。我们说,要不让这些学者用这种方式试着跟大家开启第一轮对话。一开始我们只是想帮他们缓解社交压力,给他们一个范式,能够跟普通人有一些对话的场合,但是意外地发现效果非常好。

因为我们第一波找到的像许华哲这样的教授,来了之后跟大家去聊「我是许华哲,大家可以问我(Ask Me Anything)问题」。下面的反馈非常热烈,很多学生和想要步入 AI 行业的人,以及单纯对 AI 行业感兴趣的人,都会在上面问各种各样的问题。

我们看到这个趋势以后,觉得好像大众很喜欢用这种比较平等的方式跟「大佬」去进行对话。 另外,这些真正有能力、愿意表达的人,他也需要一个渠道跟普通人去沟通。因为大部分的公开场合,大家都会觉得他们是高高在上的,是一些有距离感的、不敢对话的场合。 这其实是一种双向奔赴。 后来我们就把 AMA 的模式泛化到各种各样的场合,我们先从科技圈开始泛化,像李开复老师这样的大佬也开始在小红书进行 AMA,再往后我们往不同的圈层去泛化,后面会有像文学圈、戏剧圈、脱口秀圈。

比如余秀华老师,她也会在小红书跟大家 AMA,大家去看看余秀华老师的帖子,下面的回复非常精彩。再往后,我们觉得普通人的每一个经历——你的生活经历、你的工作经历——其实也都值得被看见,值得和大家对话。到目前为止,在小红书上已经变成了 普通人问普通人的 Ask Me Anything 的趋势。

回到科技场合,AMA 让我联想到的是科技圈 Web2 时代,非常 开源精神 ,大家都是无条件地去表达、分享和共同对话。回到科技圈,我觉得 AMA 确实是帮助科技圈的人能够互相认识、互相对话的一个非常好的形式。希望大家能够一起来参与,大家可以试着今天发出自己的第一条 AMA。

Koji: 接下来问,作为内向者(i 人)陈锴杰,你在社区参与 AMA 的时候,评论区也有很多的回复,你整个感受是什么?有没有特别好玩的故事?

陈锴杰: 我感觉大家问的问题有的时候还挺刁钻和犀利。我当时抛出来的时候,对这些问题并没有太多的预设,但是很多人在下面对我们的产品提出了很多建议,我觉得是非常有趣的。比如说「为什么你的生成速度那么慢」,「为什么打开都要等」,也是让我看到用户真正的需求在哪里。虽然是 AMA,但是感觉变成了一个产品讨论和辩论的小空间,那个空间里面大家就在畅所欲言,很多评论下面还有继续评论的。 有时候有一个人问完,我甚至自己还没有回复,就有其他用户帮我说「这个产品是不是可以这样设计」,接着大家就讨论起来了。 所以我觉得非常好玩。

 

02

用户成新产品的「精神股东」,

开发者随时验证产品需求

 

Koji: 接下来想问一下苏晓江。晓江做了一个特别有趣的产品叫做 Plan Coach,是一个针对拖延症患者的小产品。当时它也参加了谷歌和小红书发起的「黑客松」,拿了冠军。 那个产品当时从 0 到 1 的过程,可不可以跟大家分享一下是怎么找到这个切口的?

苏晓江: 可以的。我在开发它之前,已经在开发另外两个东西。第一个是一个笔记类 APP,我开发了有三个月,开发到三个月之后,我感觉节奏不太对,应该把这个东西拿出去给大家看看,听听回响,让别人看看这个方向是怎么样的。我想应该拿一个轻一点的东西去试一下,看看这个方向是不是对的。有这个想法的时候,当时有一个比较火的 HDR 表情包,它会很闪,我就做了一个 HDR 的 APP,结果没有火。

在回归笔记类 APP 的过程,让我印象深刻的一个点是,当时我想去刷碗,但是我有点拖延。你问我对我的个人评价,我其实并不算是一个拖延的人,在开发的过程中我是不拖延的,但是让我做家务,我很不愿意动起来。当时我想到一个点,以前在其他地方看到过,如果你把一个拖延的事情拆得非常非常具体,做了它的第一个步骤你就可以动起来。我抱着试一试的态度试了一下,当时我用 GPT 拆了一下。

我记得它说:「你现在需要去刷碗,第一个步骤你需要先站起来,你只要站起来你就算赢了。」跟我想的不是特别一样,它并不是要我去考虑后面众多的步骤需要怎么做,我只需要考虑站起来就行了。然后我就站起来了,我就真的把碗给刷了。我感觉很神奇,我就又去做了一些调研,差不多用一天的时间做了一个 MVP(最小可行产品),发到了小红书上,在小红书上一天得到了 3000 多赞。

Koji: 这是你的第一条笔记吗?

苏晓江: 不是我个人的第一条笔记,我之前也发过比如 HDR 的 APP 的笔记,但是无人问津。当时无人问津导致我有一个疑问:我发的这个东西、我做的这个东西到底有没有人能够看到?如果发到小红书上都没有人看、没有人点赞,我发到市场上到底有没有人买?作为开发者,毕竟最后是要赚钱的,有没有人买这更是一个疑问。当时 Plan Coach 雏形出来之后,一下子 3000 多人点赞,我就觉得原来是可以被看见的。

Koji: 所以小红书是你一个低成本实验想法、验证用户需求的地方。

苏晓江: 是的,一下子收到了回响,就有动力做下去了。他们会在底下提需求、提反馈,我感觉这个东西可以做下去。

Koji: 陈锴杰,你的从 0 到 1 是怎么找到切口的?比如马卡龙这个产品。

陈锴杰: 「0」不知道从哪算。马卡龙是我的第三次创业项目中的第二个产品,它的前身是一个互动 AI 小说。当时看到马卡龙这个产品其实是因为发现 AI 在市面上解决很多生产力的事情。比如今年初 3 月份 Manus 发布,大家都在用 AI 做 PPT,用 AI 写报告,用 AI 做表格。当时我觉得 AI 把这些做得很好,没有问题,但是好像生活里缺少了能让我们生活得到改变的事情。只是刷碗这么一个简单的事情,在我的场景里,如果我想运动得更好,我想吃得更好、睡得更好,有没有 AI 能够帮我把这些事情给做了?所以当时是从 「生活」作为出发点 做了马卡龙这个产品。

Koji: 你一开始验证马卡龙这个产品需求的时候是在哪里?

陈锴杰: 其实不是在小红书,当时我是先找我们之前产品的用户做的访谈,因为那些用户正好就在我们的列表里。当时跟大家聊天的时候,感受是这样的:我们的前一个产品大家可以进去做一个互动小说,大家会说在做完一小时、两小时的互动之后,觉得有一些空虚。问为什么空虚?因为又要回到现实生活里面去,可能是刷碗这样的小事,但是我们更多用户反馈是又要去学习或者又要去上班工作,或者又要和家里人相处,不想和家人相处。

我想如果我们能够提供这样一个小应用,假设你希望自己学东西,我如果能让你自己在这里做一个学习计划,这个学习计划能够把你的东西很清楚地排好,会不会可能对你来说有点用?当时去跟每个用户聊,跟他聊完之后,我就赶快到后台做一个出来,推送给他,我就把网页给他了。他用完之后说「好像还不错,我继续试试看」。最早就是从这样的想法来的。

Koji: 散兵,在小红书上活跃着很多开发者,你觉得开发者们像晓江这样去验证他们的想法,试着发一条笔记,这是一个常见的大家的行为模式吗?或者你有没有看到一些别的有意思的大家用小红书去验证想法的做法?

散兵: 刚刚,晓江讲的是一个很常见的开发者在小红书去验证需求的模式。我们一直说小红书是非常真实的、有人感的社区,它承载着最大的、最真实的人的需求。 最真实的用户和最强烈的需求在这个社区上,它是你收获你的产品是不是真的有需求、是不是解决了大家需求的最重要的场合。

我们之前和开发者对话,发现大家通常有几个痛点。第一,我不知道我的需求是不是真需求,我有没有自嗨,这是最需要拿到市场反馈去验证的,通过用户验证你的需求存不存在。第二,他们觉得今天在国内的交流是一个蛮难找到空间的地方,在小的地方交流,他们担心自己的想法是不是被抄走了,在一个公域的场合交流,大家会觉得自己的声音是不是无人问津、是不是无人在意。

在小红书,恰好提供了一个比较适度的空间,大家去提供自己产品想法、验证自己需求的场合。这是今天非常真实的社区带来的价值。运作方式和晓江很像,你可以拿自己的产品、拿自己的原型(PMF),甚至可以拿自己的想法跟大家交流。「我要做这个事,大家觉得 OK 吗?」如果真的觉得有需求,会有人来响应的,这是今天社区的价值。

陈锴杰: 说到找需求的过程,其实马卡龙最早找需求不是在小红书发生,但是发布的那一瞬间是在小红书发生的。我自己心里其实是很担忧的,这个产品做出来市场上的接受度会怎么样。发上去的那一天,特别好的感受是很多用户就开始自发地做帖子了,也不是在我的帖子下面评论,他们自己去发帖子描述这个应用他们的感受。

当时我印象最深的是很多帖子说:「配色好好看!」我们是一个比较粉红的马卡龙。当时的设计我和设计师纠结了三天三夜,到底要不要放一个有颜色的东西,因为所有的 AI 产品都不是颜色鲜艳的。我如果这样做,会不会大家反而很讨论,说「四不像」,什么都没有做到。 我觉得这不是在找需求,反而是后续验证过程中给了我很多支持。

散兵: 锴杰的这个例子,我可以给大家一个数据, 小红书平均每个开发者可以收到 20 条自己产品的改进建议 ,当然锴杰是收到更多的。我觉得这是一个非常强烈的用户给你自发反馈的渠道,包括非常多利他和互助的心态,他喜欢你的产品,他甚至会不断地给你提建议,甚至推动你赶紧去更新版本、赶紧去迭代。这也是一个非常有特色的社区状态。

苏晓江: 我差不多能收到 1000 多条反馈,他们会把自己当成精神股东去看你的产品,像一个养成类的 APP 看你的 APP 有没有根据他的建议去成长,成长以后,是不是做到了自己提的建议的那个样子,参与感是挺强的。

Koji: 今天有一个非常热门的词叫做「一人公司」。我们也想从另一个角度问一问,你们觉得有没有什么坑是大家要特别注意的?

苏晓江: Plan Coach 其实是我作为 APP 开发者的第三个产品,这也是一个 踩坑的经验 。第一个笔记类的 APP 花了三个月,第二个 HDR 的 APP 花了一个星期才发布,Plan Coach 是花了一天就发布了。我本身的实践是我要越来越早地把我的产品抛出来,让市场去验证。如果让我给建议,我会建议大家 一定要尽可能早地把自己的想法抛出来,投石问路,扔到水里,看看收到的涟漪到底是怎么样子的。

陈锴杰: 我的感觉很类似。当时在做的时候,很早就和用户开始接触,可能没有抛出来,但是就做了很快的反馈。我有一个感受,不知道算不算坑,但是我身边有很多朋友其实是抱着想创业的心态在做一个新的产品。他们的状态更像是我每天很认真地在想到底应该做一个什么新产品。如果这个人技术恰好特别强,可能这个产品更没用一点,很有可能一直在想到底要做什么,想出来了一些其实没有那么有用的东西。反而是我身边的一些产品经理,他自己生活中有些困扰,或者觉得这个东西不好,很「傻」,一直在吐槽,把它变成产品之后,好像收获的效果还不错。如果说是一个坑,可能就是 不要一直想我要做什么产品,而是应该发现自己生活中本身就很想吐槽的东西,把它变得更好,或者身边朋友在吐槽的东西。

 

03

AI 时代下创业,

人越少,才能跑得越快

 

Koji: 我们知道今天大家做 APP 的速度变得非常快,在一个智能极其充沛的时代。晓江,今天你自己在做 Plan Coach 过程中,有哪些开发上的变化是你感受特别强的?第二,收到那么多用户反馈,你是怎么面对 1000 个来自小红书的问题的?

苏晓江: 我之前是一个技术主管。人越多,科技提供的加成是越来越少的。因为有很多的汇报问题、人类的沟通问题,一个人(开发)的时候是完全没有问题的,自己跟自己沟通就行了。我要做一个技术选型,自己跟自己评估一下,没有任何的延迟和信息消耗。

从 Plan Coach 时代最初的开发到不停地去迭代,不只是需求的验证速度会快很多,技术选型、技术的验证也会非常快。做开发的人都懂,我们在做到一定的复杂度之后,要重构,把它的复杂度降低。我可以一天重构多少次,重构不行,我可以让它回到第一版,这在以前是完全不可想象的。以前尤其是多个部门协作、很多人协作,涉及到技术的变更,从讨论到落地到验证,再发现不对再回去修改,周期太久了,现在用 AI 非常快。

其次,关于怎么排期和划分优先级。这个产品最终的发展方向是需要自己去定的。我个人做事的方法是定下来这个主线之后,既然有这么多反馈,我就可以选择哪些反馈是符合这个路线的。因为现在小红书也提供了比如群、投票,再加上一些评论,我会经常发一些投票,在群里听他们的反馈。比如上次一个投票,我会把四个功能作为投票的选项发给大家,我会选择大家投票数最高的作为接下来优先级比较高的大的功能去做开发。我们目前四个「大招」就是按照投票结果顺序去做的。

Koji: 锴杰,有没有什么是来自用户给你的需求,是一开始你完全没想到的,但是你接受了之后,上线了,得到了很好的反馈。

陈锴杰: 在马卡龙里面,更多的是品类和方向会得到正反馈的结果。马卡龙本身是一个 Personal Agent,最大的功能是创建自己的小应用,在不同的场合。我们一开始对小应用的方式没有做太多的限制,既可以是个小游戏,也可以是记录生活的,也可以是旅行的指南。

用户很多时候给我们提的是他很想要这个方向的功能,比如当时有一个用户提我很希望把语音输入加进来,这样对着我的小应用一通输出之后,它就可以帮我把我的输出整理成今天的代办事项,然后我再一个一个勾掉。市面上没有专门的 APP 做这个事情,它就是一个语音转代办事项很具体的事情,多样组合模态的生活记录是一个不错的方向,我们就做了这个事情。包括自动提醒的能力,也是用户强烈要求后加上的,很多功能就是这样一步一步迭代出来的。

Koji: 锴杰刚才提到这是你第三次创业的第二个产品,这一次做产品,在 AI Coding 风靡全球的背景下,你感觉到有哪些不同?

陈锴杰: 最大的不同是我太想太想控制组织的规模。我们今天也不大,只有 30 个人,但是我很希望它就不要再更多人了。原因是因为我感觉一是 AI Coding 能做的事情太多了,一个可以顶过去 3 个人、5 个人的工作量。 二是因为 AI Coding 在不断地发展,或者大模型在不断地发展,时代变化速度太快了,以至于我们今天搭建的组织或者搭建的功能团队,在两个月之后,它就要重构,或者我们的方向就要变,这个时候组织的调整速度一定要快于技术的迭代速度才行。所以我们就希望把组织变得很小,很敏捷地去迭代。

Koji: 这是一个重新定义职能的信号。你们有没有具体的做法,比如会设定不一样的岗位?

陈锴杰: 我们看到了一种之前比较少见的但是一定会出现的形态就是 Agent 工程师。Agent 工程师是真的非常难找。我觉得他首先有技术背景,能够做后端的东西,比如他能够去处理容器、处理流程调用。但他同时也要有产品视角,因为 Agent 的工程师得写提示词。提示词每一个词都是在改变模型的分布,让它的输出有不同的内容,每一个词都很关键,所以他要有文科生的思维,他的提示词又要贴着用户去写。当他有了这两个能力,他还要能够非常好地做开发里的叫 CICD(持续集成/持续交付)流程,这个能力是非常少见的。

 

04

小红书如何成科技开发者的连接器?

 

Koji: 请教一下散兵,作为连接器平台的视角,你希望提供什么样的社区土壤给到开发者?

散兵: 小红书的科技发展到今天,时间也不长,才两年左右。现场都有一些同学,他们对小红书的认知还觉得我们是一个生活方式的社区,离科技还是挺远的,这是我们经常听到的一些声音。但是真的离今天的产品开发、离科技前沿的应用,甚至到 to C 场景的使用,最前沿的这批开发者和人已经在利用这个社区来验证他们的产品构想。我们差不多两年的时间,到 2025 年,今年我们已经拿到了非常快的增长,科技内容的发布差不多涨了 100%,科技创作者的成长涨了 200%。 我们的站内现在有超过 5 万名的开发者,有超过 90% 的人每年发布不止一款产品,这里已经变成了一个非常旺盛的产品创作和用户沟通的土壤。

过程中,我们还是做了一些自己业务策略的变化。最早我们看见的是中文互联网科技讨论缺少一个非常强的公域讨论场。2024 年我们全年解决的是 怎么让小红书成为科技人的「第二个朋友圈」 ,因为大家需要一个偏公域的场合表达自己的想法。这个想法不用像每天开发布会一样,就是「我今天有一个什么想法,有没有人需要?」「我发了一个新功能,大家来测一测。」甚至在小红书很多人用来招聘和找到自己志同道合的伙伴,这是非常常见的。这是我们在 2024 年到 2025 年初完成的一个构想,Plan Coach 就见证了我们从朋友圈到连接器的变化。

到 2025 年,我发现绝大多数科技圈的人已经在小红书做表达。我们觉得作为一个平台,我们的定位不能止步于单纯的内容交流,我们应该帮助开发者和行业里的人给到他更多。比如我们能不能在连接用户的场景下帮他实现更多的价值,比如我们今天上线了小组件的能力,你的产品就可以用更轻度的方式在小红书内做验证。比如我们现在已经有一些智能硬件的测试可以在小红书发生,可以做早期小的众筹和售卖,在小红书也是支持的。大家应该也知道很多投资人直接在小红书上找项目,小红书可以帮助你融资,帮助你找到同行的创业伙伴。这是今天我们的社区基于朋友圈价值上延展出来的能力。整个 2025 年我们所有的增长是慢慢地把连接器的价值做扎实。 整个 2025 年我们所有的增长是慢慢地把连接器的价值做扎实,到 2026 年我们希望把连接器的能力能够做得更好,让新的 AI 创造的土壤能够发生在小红书。

说得简单一点,今天在国内的生态位上,我们很希望实现,如果大家想要做 AI 创新或者新的创新,第一个想到的平台是小红书。 我们希望做到这样的地位,因为我们这里有最真实的用户需求,我们有最强烈的用户反馈,有最多元的验证你的产品构想的方法。 长期来说,我们也希望能够从这片土壤里长出下一代非常强的独角兽或者新的创意公司。

陈锴杰: 我也可以补充一个讨论。我自己的小红书是 7 年前注册的,那个时候我就尝试发科技内容,但是那个时候发出来的内容其实没有人在意,然后我就去了 B 站。过去几年,特别是从去年开始,我们说「Building in Public」(在公众注视下做产品),我发现所有的国内产品摆出来, 小红书可能是唯一一个最注重评论区的地方。 你如果要「Building in Public」你就得和大家有交流,而小红书能够把内容限制在上面一块,但是下面有大量的讨论,这是非常难坚持的一个事情。所以对我来说,它是唯一一个可以做基础讨论的事情。从去年开始,我看到我身边很多朋友开始在小红书上刷论文。他看最新的论文不是去其他地方,而是去小红书上看,说明很多人在发、很多人也在跟、在讨论论文。我觉得太有意思了,所以我从去年开始发一些内容,慢慢又回到小红书来继续发东西。我感觉这是一个 国内独有的生态 ,也是一个很特别的地方。

Koji: 我觉得刷小红书有一个很神奇的点,在别的地方看科技内容看多了会觉得很焦虑,因为信息非常大,总觉得大量的新闻在发生,但是刷小红书不知道为什么整个人的状态是很轻松的,可能因为这些内容是夹杂在猫猫狗狗、花花草草里面的,气氛是轻松严肃活泼的。

散兵: 我们在做科技的过程中找到了一个点。我们最早在做科技的时候,市面上主流平台的科技内容基本都是资讯和教程。大家应该还能回忆起最早 GPT 刚火的时候,大家看到的一个是资讯,另一个是教程,教程里面掺杂了非常多的焦虑(FOMO)情绪——如果我不会 AI,我将来可能会失业。我们当时聊的时候,觉得那不是今天大家真的坐下来去讨论的科技的价值。今天在科技领域传递给大家的情绪如果永远是焦虑的、紧张的,可能大家对科技的态度是对抗的。我们更希望用户跟科技的关系是一种平等的,它来帮助我,我来使用它,这样的一个姿态。所以我们当时很坚决地决定不去做资讯和教程这两个主流的品类,我们坚定地说我们要鼓励学者像普通人一样跟大众对话的内容,在小红书上做鼓励做发酵,也有了今天我们想要的不是那么焦虑,相对平和的一个感受。

Koji: 你们在评论区和用户互动的时候,怎么形成了今天的风格?如果用一个词,我觉得是「活人感」,你们有没有一些总结或者感受?

苏晓江: 有的。我最初的笔记得到了 3000 多点赞,远不是巅峰,巅峰是在那之后我又发了一条,初步形成 APP 雏形的一条,达到了 26 万个点赞。当时非常火爆,我印象非常深刻,加群的人,我刷了一分钟,非常快地刷屏,一分钟加群的人都没有刷完。点赞的人数,我把赞清空之后,下一秒一定码出来两位数的赞,特别火爆。带给我们的问题是我们没有遇到过这样的局面,我们不知道该用什么样的口吻面对这么多人,生怕说错一个字,生怕说了不该说了,他们不再给我们点赞了。后来发现其实我们应该还是回归 不卑不亢的态度,他们并不是因为你说了什么话而去给你点赞,而是他们喜欢你的产品而已。所以后面我们就回归了比较平等的态度。

陈锴杰: 首先肯定也不会骂他们,但也不会「舔」他们,我觉得是 做自己 。我发现大家到最后一定看清的还是真实的你自己,如果你在外面维护一个人设,你都会很累,而且你一定会暴露出来,所以与其那样不如一开始就做自己,想到什么说什么。甚至我身边的朋友他会在小红书的评论区吵起来,特别是研究员。为什么小红书的研究内容让人感觉压力没有那么大,我是感觉大家很多时候在发一个研究的时候不是在讲研究本身,而在讲大家对研究的看法和观点。大家很容易讨论起来,这种时候他也是在做他自己,他就像在面向自己的博士生同学、朋友一样,就是在实验室两个人遇到了,对今天发的论文有什么观点,他们就会吵起来。所以我觉得 做自己可能是比较好的。

Koji: 有没有什么样的回复或者故事,让你印象深刻,你又做了自己?

陈锴杰: 产品和研究方向都有。我们最近在做很多强化学习,大方向大家都是认同的,但是怎么做争议还是很大的。比如我们在做的一个方向是用某一技术路线 Reasoning Model 让它的 Reward Function 更加地鲁棒,避免一些 Reward Hacking 这样的问题。在这个方向上,大家的思路是很不一样的,我们当时放出了我们的思路,大家就开始吵了,「你这个不对,我的论文是这么讲的,你把数据贴出来,我们看一看」,或者有的人就说:「你虽然这么说,但是这个方法你要再加什么东西可能更好。」当时有很多讨论,这些都是我们做下一步研究的灵感,所以还是很有帮助的。

苏晓江: 我补充一下,刚才说的回复。我们当时决定走不卑不亢的路线还有一个原因,我们收到的很多回复都在重复一个问题:「你们会不会跑路?」我现在的身份是一个个人开发者,大家如果要买一个 APP,这个 APP 是一个个人开发者开发的,大家最担心的问题是,他没有品牌意识,也没有背书,会不会哪天就不更新了,跑路了。当时我们发现这确实是一个问题,因为它直接关系到信任。 我们以前很怕说错话,我们会把回复的东西发给 AI 让它去审几遍,发现出来的文字是完全没有「活人感」。 我们觉得你就应该以真实的自己去回复他们。我虽然平时说话比较容易紧张,但是在文字回复的时候,我还是挺喜欢开玩笑的。后来我知道这一点之后,我就释放天性了,该开玩笑就开玩笑。

陈锴杰: 别人问你会不会跑路,你就说:「已经在准备了,明天就走。」

苏晓江: 我回答过:「在某种意义上,我已经跑路了,但是我仍然在开发这个 APP。」

散兵: 我听了这段很感动,因为我一直想要建的是有真实「活人感」的社区,这是小红书整个社区的初心。今天是在不同的领域大家开始慢慢理解这个社区的价值。陈锴杰最早看到的小红书生活方式的评论区,大家也是这么建立信任的。今天对于一个新的圈层——科技圈层进入小红书,依旧在用这个社区最真诚、最真实、最想要建立信任的方式跟这个社区里的人建立链接。这是非常让我感动的事情。将来科技这个圈层,包括我们再去拓展别的圈层,也会这样去跟用户对话,这样去建立信任,这样去沉淀,这是我非常开心的一件事情。

 

05

开发者的社区新玩法还有哪些?

 

Koji: AI 的开发者如果到小红书,想要做得更好,不管是从 0 到 1 还是从 1 到 100,还有哪些玩法可以推荐给他们的?

散兵: 我可以讲一讲我们还能提供什么帮助。今天大家很关心如何获得流量,背后功利的点是如何更好地玩社区、跟用户对话。 真实就是一个非常重要的手段 ,比如我及时地跟进,我把产品的迭代当作一种陪伴、当作一种共建、当作一种精神股东,用这种方式跟大家去对话,可能比我开发布会、「憋个大的」这种方式要好。这是在内容层面大家能够做的事情。

在未来,我们可以做的是提供更多的场域,不管是活动流量,还是线下的比赛。比如我们今年上半年有做独立开发大赛,今年我们也有比较大的「黑客松」,包括良渚的 Demo Day,这在独立开发圈子里算是小有名气的。未来我们会跟这样的更多的圈层合作,会给大家更多曝光的机会、流量的扶持和跟用户对话的机会。我们还会在更多的领域做一些新的活动和赛事,比如智能硬件。在黑客松领域有更多的年轻人和跃跃欲试的人,我们会给这样的人越来越多的场合去实现他们可以做的事情。

我们未来会在产品的实现链路上,能够更快地在小红书平台上去做验证。 很多时候大家还是在种草,种完草之后,还是要去下载、去体验,转化的链路会更长。未来我们希望把体验和转化的链路做得更短,可能在小红书端内就能赶紧验证你的 PMF(产品市场契合度),最好的产品框架、产品能力直接 「Go to Market」 。我们是想做这样能够帮助到大家的事情。

Koji: 平台还有一个视角,所谓的「上帝视角」。过去一年里,你从平台的视角里看到哪些在 AI 创新上的变化或者机会?

散兵: 有一个蛮有意思的现象,不知道在座的开发者有没有感受到, 营销这件事情越来越前置了,这是我们在平台视角里看到的变化。 更早的时候,大家基本上还要拿出一个小的产品原型跟用户对话,但是我从这一两年的变化里看到越来越早,比如我开发到一半,我就来分享我的开发进程,甚至我还没开发,我拿着我的想法(idea)就来分享,这个事情大家感不感兴趣。

我觉得它的本质背后是一个市场的动作,它也是在用一种对话的方式来去验证用户的需求。这件事情在 AI 创新的时代是最显性发生的变化,因为之前的用户还是在追求所见即所得的价值,但是在今天大家都相信生产要素开始变得便宜,都相信技术要素开始变得便宜, 大家都相信你「口嗨」的东西是能做出来的,这是今天一个非常强烈的用户情绪的变革。 所以在这个时刻,可能口嗨不一定是一件坏事,有可能「口嗨」是你在这个时刻去验证需求,甚至是你找到最好的产品点子的方式。我们从上帝视角,鼓励大家尽早来「口嗨」,在这儿跟用户对话。

在智能硬件赛道上愈发的明显。一般的 APP 开发我们大概知道周期会更短一点,口嗨完了,比如大家等一个月,你可能能做一个原型出来,但是硬件开发是需要一定周期的。这件事情我们甚至在硬件开发的流程里都看见了,你可以先表达你的创意,然后你再去搞定你的供应链和原型验证。

 

06

超级个体的护城河:技术不设防,

唯有「关系」与「初心」不可复制

 

Koji: 今天的主题是超级个体,想问一下锴杰和晓江,你们觉得超级个体的护城河是什么?

苏晓江: 我现在感觉尤其技术方面是不存在护城河的。之前我用一些方式评估过 Plan Coach 的开发量,按照非 AI 时代一个常规的开发团队去做,需要差不多 40 个人,但是我现在一个人就把它给做出来了。而且现在 AI 的开发技术、AI 自身的模型能力在不停地迭代,我觉得没有在技术上作为一个个人或者作为一个技术团队能够一直保持自信,别人打不动你。

营销能力很重要。之前有一个我特别认同的人,叫「花叔」,他之前在小红书上也是非常火的,小猫补光灯的作者。他的产品他自己也承认是没有护城河的,就是一个补光灯,但是他自己成为了一个 IP,导致别人去下载,大家都认识花叔,都信任花叔,毫无疑问大家会下载花叔的作品。

陈锴杰: 我的想法差不多,我觉得没有护城河。我的感受是,护城河这个概念是你有一座城,然后外面有一条河,所以人进不来。但是我觉得 今天的「城」一直在变 ,因为今天技术变化很快,天天这个地方一直在地震、一直在移山填海,你划一条河在那儿没有什么价值。今天如果你要让你的产品更能抵御一些进攻,它就是综合实力的比拼。单单是技术肯定不构成护城河,但是很好的技术肯定是有用的。营销当然也是非常有用的,所有的增长你都要做。用户的口碑品牌,以及用户社区,肯定也是有用的。产品的打磨你想得很清楚,它肯定也是有用的。这些东西缺一不可都放在一起,才能构成今天比较好的产品。

Koji: 既然大家说到护城河是「综合实力」,再往下做,你们具体会做什么样的事情帮自己做得更好?

陈锴杰: 马卡龙的团队去年还很小,才十来个人,今年已经稍微壮大了一点,大概 30 多个人。我自己非常幸运的是在过程中我招到了像天使一样非常强的一批人。我们现在在做什么来实现加强护城河这件事情,我觉得做的就是把这支团队组得非常好,给大家定一个或者我们一起朝着一个很有希望的目标去努力。对我来说,每一个人可以有自己的生活管家。有了 AI 之后,每个人都可以有这样的事情,大家就可以有更多的心思和时间去做自己最喜欢的生活的选择,过自己更喜欢的生活。所以,搭最好的团队,朝一个方向努力。

苏晓江: 营销相当于是一个乘数,你要把产品做好,同时要做好营销,这是乘法得到的结果。对于不断进步这件事情,我是挺关注的。Plan Coach 之后,并不是 Plan Coach 就是我们的终点,我们会在 Plan Coach 之后,带着我们开发的经验、营销的经验再去做下一个产品。我现在攒了一堆想法,每个想法可能成功的概率只有 20%,一个不行我就再做下一个,不断地这样去做。我相信通过堆量加上方法论,是可以做出下一个成功的作品的

Koji: 晓江做 Plan Coach 的收入会比当时在大厂的收入更高吗?

苏晓江: 很明确,不会比大厂更高,因为 Plan Coach 只是一款产品,刚上线 5 个月,比之前大厂更高是不现实的。

Koji: 这个问题给到散兵,作为平台,你们如何帮助 AI 创新者赚更多的钱?

散兵: 这是一个很好的问题,如果我们要实现连接器的价值,我们还是要做非常多的后端转化,甚至变现的能力。今天我们只解决了前端的种草,帮你获取种子用户和验证的流程,慢慢地我们在产品内购或者产品直接采购的链路上,通过电商的能力去赋能大家。如果大家是硬件的创新,我们也可以通过轻度的类众筹或者电商的能力帮助大家。

另外的部分,除了挣钱的部分,我们还要 省钱和招聘 。招聘是非常花大家精力和时间的事情,这是一种隐性成本,我们也会帮大家找到认同你的产品价值和产品能力的人,帮你去做人选的匹配。可能我们会做一些运营活动,大家来发布自己的招聘需求,感兴趣的可以直接做招聘的环节。这件事情我们已经在老师的层面帮他们做了,因为他们要招学生, 他们最苦恼的并不是缺有能力的人,而是缺相信自己内容方向、研究方向的人,这种在公域场合做招聘是非常容易的。 所以后面我们会在开发者或者创业者的圈子里做一些类似的事情,我们认为这件事情某种意义上也是帮大家节约成本的能力。

Koji: 对于想在小红书上开启自己超级个体人生的同学,如果只能给一条建议,你会给他们什么?

散兵: 如果只能给一条,我觉得 初心还是最重要的 ,大家还是要关注自己的初心。从两个层面,一个是从今天生产要素的层面,发现绝大多数生产要素都在变得更便宜和易获取,不管是资本、技术、人力,为什么会有这样的一人公司超级个体陆续地浮现,就是因为各种要素开始变得更加便宜,所以 你要做什么、你想做什么这件事情变得愈发重要。

第二,在用户层面,今天用户也进入到一个不是特别物质匮乏的时代,大家更需要的是精神层面的共鸣,你跟他们的一些共识。用户也不是需要你解决特别强硬的需求,大家反而需要的是更共识层面精神层面的追求。 在这个层面,你的发心也更容易被用户感知到,他会更关心你是不是长期想帮我解决这个问题,你是不是长期跟我是一类人,是同路人。 如果能回答好这个问题,今天很多事情的成功率都会高很多。

苏晓江: 我跟散兵老师很像, 你要做一个你自己都很喜欢的东西 ,重要之处在于一旦你自己喜欢,你会做出很多超出用户需求的设计和开发。当你很自我陶醉地在去开发一个东西的时候,你的用户是能够感觉到的,他们也会更加喜欢。

陈锴杰: 虽然我们说超级个体变得很容易,变得特别强,但是像晓江这样一个人或者两个人就干出来一个很复杂的项目,还要持续运营下去,我觉得还是非常少数的人。 如果真的想往这个方向发展,过程中还是慢慢可以找到一些朋友,比如在小红书上找个搭子一起创业。 因为一个人的思维范式可能会有一些局限性,大家一起做会更有意思。

 

07

现场 AMA 环节:

好奇超级个体们的一切

 

提问: 今天的主题是超级个体。想问一下陈锴杰,你在 AI 时代来临前后,在自己的组织建设、团队搭建当中的认知和思路有什么变化?

陈锴杰: 谢谢你的问题。有两个作用力。首先要考虑产品本身的发展周期。当你的产品已经有几十万、上百万用户的时候,为了让他有很好的新功能迭代,同时又要兼顾增长和运营,本身会有一个推动你团队人数变多的驱动力,这是跟组织的产品阶段相关的。AI 时代和互联网时代有另一个维度的动力方向,这个动力方向是组织在做同一件事情的时候人数应该是减少的,或者人效应该是提高的,每个人能做的事情应该变多。在同一个发展阶段,AI 时代尽量去用互联网时代一半或者 1/3 的人是比较合理的。两个相互作用。我们去年到今年同时扩张到 30 个人,主要还是因为产品阶段在推动。我相信如果更早,可能得扩张到更多的人才能做这个事情,今天我正在压缩每一个 Headcount(人员编制)

提问:我是一名 AI 视频的产品经理,恰好做的是小红书侧的 AI 生成内容。想问一下平台是怎么看 AI 生成的广告?是不是对用户有帮助你们就会给它一定的倾斜?以及在未来,AI 的视频越来越多,你们会怎么长期考虑这件事?

散兵: 两个问题:首先我们怎么看待 AI 生成这件事情?首先我们觉得 AI 生成是一个辅助性的技术,今天最重要的还是你想表达什么。如果你今天想表达的是一段故事,但是你是用 AI 帮你去形成的故事,所有关于创作的事情我们都是鼓励的,把它当作技术。但是还有一部分,我们发现有的人是利用 AI 快速生成类模板的内容来攫取流量,这种行为我们是不鼓励的,因为我们觉得小红书的根源还是一个真实、有活力的社区,我们希望在这里大家做自我的表达更多,而不是用 AI 生成的模板式的东西所铺量。我们对 AIGC 的态度是更鼓励用 AI 去做创造,而不是鼓励用 AI 去做模板。

提问: 你们产品的定位和市场的选择上是怎么去考虑的?

苏晓江: 对于 Plan Coach 来讲,我们现在出海才刚刚开始。一开始 Plan Coach 是有语言设定的,我们支持三种语言,并没有一开始说要限制 Plan Coach 就是在国内。但是因为小红书火得比较早,所以我们在国内现在已经算是走过了冷启动的阶段。 变现我们一开始就想得很清楚,要把它做成一个收费产品。 我们把它定性成在收费之前,你可以去试一下这个 APP 是不是适合你,这个 APP 本身就是一个收费的 APP。大家可以认同用钱去购买这个 APP 之后,我们发现原来它是可以盈利的,我们后面再去做海外市场,至少跨过第一道坎了。

提问: 想问晓江老师,从大厂出来自己单干的感觉怎么样,是更爽了还是更累了,有没有后悔过?

苏晓江: 我发现 自己打工比给丁磊打工累多了,要更累一些。难以避免的一个心态是你会把你个人和产品本身给捆绑在一起,你会发现产品的数据就会直接影响你对自己的判断。一旦有人在 App Store 上打了低分,你就会感觉是不是对你这个人的否定,你也会特别在意这个产品有没有得到别人的认可,你会觉得那不是对产品的不认可,而是对你人的不认可。以前在大厂的时候,责任是可以均摊给很多人的,但是现在没有其他人可以均摊。所以压力和责任感会比之前要更强烈,就会导致你的工作强度比之前其实要更高。

我会跟 AI 聊很多内容,我会让 AI 列举出以前有没有这样的例子,个人开发者成功了,但是要面对这种压力的,就会发现有很多。有人比你还要惨,你是可以坚持下去的。我对这种焦虑可以说是非常享受的。很多人下定的决心是「如果我这个 APP 成功了,等我这个 APP 上线了之后,再苦再累我也一定会坚持下去」,实际上是你这个 APP 上线之后没有人买,根本不给你机会去忙。我现在已经处于很忙很累的阶段,一方面自己挺享受,一方面很珍惜这种机会。

提问: Koji,你自己其实也是个超级个体,你在做播客的过程中,今天是不是在用 AI 提效,做很多东西?

Koji: 肯定的,没有 AI 感觉无法工作。我在看了那篇文章之后,原来我每次给播客想标题的时候,我会说「你给我起 10 个标题」,我现在是起 100 个标题。本质上是不会多花钱的,付出的只是自己多花一分钟再去过一下这 100 个标题。这是最近我看完那篇文章之后自己行为的改变。

提问: 马卡龙的产品理念听起来很性感,但是感觉离普通人有点远,用户真的愿意花钱请个 AI 来经营生活吗?最后会不会变成有钱人的玩具?

陈锴杰: 首先我们挺便宜的,10 美金。今天 Token 的整体走势是一直在降低的,每隔一两年就会往下降 10 倍的价格,所以我觉得后面肯定是大家越来越能负担得起,不太贵。还有一个趋势,今天我们很多人在马卡龙里面创建小应用,我们马卡龙里今天已经有接近 20 万个小应用,分布在生活不同的功能上。对比一下苹果的商店,它的 APP 总数就是 220 万个,所以已经接近 App Store 的 1/10。当一个用户有需求,不一定要全新地创建一个,可能在这个生态里可以找到最合适的那一个,或者它没有那么合适,我就找到改一下,或者这个界面拿出来,那个风格拿过来,最合适的应用就出现了。它不是一个有钱人的游戏,最后大家都会负担得起,都能有自己的个人助手。

提问: 我平常也会使用马卡龙,但是很多时候我发现它真正能够创造出来能够满足我的需求的应用可能性是很低的。你说现在有 20 万个应用的创造,这些应用大多数是由用户创造投入他自己的实际体验吗?

陈锴杰: 首先我们的应用创建能力在不断提升,如果你这两天再用,发现和上一周又有了很大的区别。AI Coding 整个写出来的东西都很难用,今天将将可用,可能你写三次,或者你写一个它能继续修改,它慢慢变得可用,但是离用户普通人「说一句话就能用」的标准肯定还是有距离的,这个 Gap 是存在的。

第二点,今天的用户是怎么用的,大家重复用的东西是什么?我发现大家重复用的很多的还是 生活的记录和规划 这样的内容,这对于今天的 AI 来说会相对简单一点。你让它做一个 3D 游戏同样也是很难的事情。但是如果你要一个语音输入生成自己代办事项清单,这样一个交互模态创新的东西,它就会比较容易,你找拍照识别卡路里,它就会特别容易。今天大家重复使用的,每周会用个 5-10 次的应用,基本是集中在这个方向。

OpenAI 宣布紧急状态:全力推进 ChatGPT;冯提莫复播,直播间破十万;马斯克:若重新来过,不会再领导美国「政府效率部」|极客早知道

2025年12月11日 08:26

OpenAI 宣布紧急状态:放弃 AGI 梦想,全力拯救 ChatGPT

12 月 10 日,OpenAI 首席执行官 Sam Altman 宣布公司进入「红色警报」状态,暂停所有其他项目,全力以赴拯救 ChatGPT。

自从谷歌的「Nano Banana」模型意外走红以来,AI 领域的竞争局势发生了翻天覆地的变化。曾被认为慢半拍的谷歌,最近在 AI 技术上取得了显著进展,并凭借 Gemini 3 模型在业内评测中超越 OpenAI,引发广泛关注。OpenAI 此时不得不重新审视自己的战略,因为失去市场份额的风险变得越来越明显。

在这种紧迫的情况下,Altman 决定暂时放弃通用人工智能(AGI)的宏伟梦想,转而专注于迎合用户需求。他在备忘录中明确表示:「更好地利用用户信号」,意味着 ChatGPT 必须向用户的偏好倾斜,以确保其不可替代性。尽管这种做法可能导致模型失去客观性,但面对谷歌的强劲竞争,OpenAI 似乎别无选择。Altman 决定重启此前的训练方法,以便在重要的评测榜单上重新夺回领先地位。

本周,OpenAI 即将发布 GPT-5.2 模型,高管们希望借此在编程和商业客户中扭转局面。然而,知情人士透露,为了抢占市场,OpenAI 高层否决了研发团队关于「再给一点时间打磨」的请求。(来源:aibase)

​Google 明确否认 Gemini 应用将引入广告

12 月 10 日,针对 AdWeek 报道称 Gemini 应用将于 2026 年上线广告,Google 全球广告副总裁 Dan Taylor 在 X 平台予以坚决否认。

他指出,该报道基于「未经证实的匿名消息源,内容不准确」,并强调:「Gemini 应用目前没有广告,也无任何引入广告的计划。」

此前有媒体称,谷歌正与广告客户进行洽谈,预计最早在 2026 年推出相关广告功能。然而,谷歌表示目前并无此类计划,相关报道基于不知情的匿名消息源,存在不准确的说法。

值得注意的是,广告收入一直是谷歌的核心业务。尽管公司目前否认在 Gemini 中引入广告,但并未完全排除未来的可能性。(来源:开源中国)

 

彭博:若 SpaceX 以 1.5 万亿美元估值上市,马斯克身家将逼近万亿大关

12 月 11 日,据彭博社报道,如果 SpaceX 能在明年以 1.5 万亿美元的估值成功上市,那么全球首富伊隆·马斯克的财富将在目前 4606 亿美元基础上增长一倍以上。

根据彭博亿万富豪指数的计算,如果 SpaceX 以 1.5 万亿美元估值上市,单是马斯克在 SpaceX 的持股价值就将从现在的 1360 亿美元增至 6250 亿美元以上,这还不包括他在其他多家企业的股份,例如全球市值最高的汽车制造商特斯拉。

根据彭博亿万富翁指数的数据,马斯克持有大约 42% 的 SpaceX 股份。该指数参考了美国联邦通信委员会的文件,并结合近期融资轮次的股权稀释情况来估算其持股比例。

按照 SpaceX 1.5 万亿美元的上市前估值计算,马斯克的总财富将达到 9520 亿美元,较当前财富水平增加约 4910 亿美元。(来源:凤凰科技)

ChatGPT 整合 Adobe Photoshop 等部分软件功能

12 月 10 日,OpenAI 正将更多第三方应用整合进 ChatGPT,用户现在可在聊天界面内直接使用 Adobe 的创意工具,包括 Photoshop、Adobe Express 和 Acrobat。周三宣布的这项整合允许 ChatGPT 用户在不离开聊天窗口的情况下免费使用部分 Adobe 功能。

例如通过 Photoshop 调整图像的亮度、对比度和饱和度,应用风格化效果,或对特定区域进行编辑,如模糊或移除背景。不过,该版本暂不支持 Photoshop 的生成式填充,无法智能清除画面干扰元素。这些功能目前可在 ChatGPT 网页版和 iOS 版本中使用。Android 端在上线时已支持 Express,Photoshop 和 Acrobat 的支持将很快推出。(来源:格隆汇)

 

3000 万粉丝网红冯提莫复播:自称停播因甲状腺癌复发转移

12 月 10 日,拥有超 3026 万粉丝的网红冯提莫在停播近一年后重新开播,直播间人数破 10 万。

据媒体报道,在直播中,冯提莫解释自己停播原因时表示,其甲状腺癌复发并转移,已经在医院进行治疗,目前身体已经恢复。

冯提莫称,医生嘱咐自己不熬夜、保证足够休息时间和良好心情。据了解,2023 年 7 月,冯提莫在一档采访节目中透露,之前得了甲状腺癌晚期,停播了半年,已经做了手术。

冯提莫曾是斗鱼直播四大花旦之一,2019 年 12 月 23 日在 B 站开启个人直播首秀,并登上 2020 年百大 UP 主名单。(来源:新浪科技)

 

全球最严,澳大利亚 16 岁以下未成年人社媒禁令落地实施

12 月 10 日,澳大利亚针对 16 岁以下人群的社交媒体禁令今天正式开始实施,预计超过 100 万澳大利亚青少年将无法使用相关社媒账户。

同时,澳大利亚成为第一个禁止 16 岁以下儿童使用社交媒体的国家,也是全球对未成年人使用社交媒体立法最严的国家。

禁止访问的平台包括 Facebook、Instagram、TikTok、X(原推特)、Snapchat、YouTube 等。

根据这项新法律,10 个最大的平台被勒令从格林尼治标准时间周二午夜禁止青少年访问,否则将面临高达 4950 万澳元 (约合人民币 2.32 亿元) 的罚款。这项新法律遭到了大型科技公司和言论自由倡导者的批评,但受到了许多家长和儿童权益倡导者的欢迎。

澳大利亚政府认为,社交平台有鼓励年轻人花更多时间盯着屏幕、推送可能损害他们健康和福祉的内容等设计特征,推出针对青少年儿童的禁令,有助于减少这些社交平台对他们的负面影响。(来源:快科技)

 

00 后玩手机三大爱好出炉:刷视频断层第一,平均每天 2.7 小时

12 月 10 日,据 QuestMobile 最新数据显示,2025 年 10 月,移动互联网「00 后」月度活跃用户规模达到 1.79 亿。这一数据同比去年 10 月的 1.62 亿增长了 10.1%,在全网用户中的占比也达到了 14%。

截止 2025 年 10 月,「00 后」用户月人均使用时长及次数分别为 217.6 小时和 3296.7 次,明显高于全网用户平均水平。00 后用户移动互联网使用习惯中,「刷视频」以 37.1% 的时长占比成为绝对主流,平均每天花在移动视频上的时间约 2.7 小时。

这一数据背后,是短视频、在线视频、游戏直播等细分领域的合力——这类内容兼具娱乐性与碎片化属性,恰好契合 00 后的使用场景。

「刷视频」之外,移动社交(25.2%)、手机游戏(9.7%)构成 00 后手机使用的「三大爱好」。手机游戏则保持稳定增长,占比从 9.3% 微升至 9.7%。(来源:cnBeta)

 

小米回应进军 AI 教育 :人才招聘信息被误读,实为强化产品服务

12 月 10 日消息,近日,招聘网站页面显示,小米集团招聘页面上出现了多个与 AI 教育相关的岗位,涵盖高级商务、儿童与教育高级产品经理、教研产品经理等岗位。随后,有关「小米进军 AI 教育领域」的消息在社交媒体平台上传播。

对此,小米集团相关知情人士透露,儿童与教育高级产品经理岗位招聘主要与公司旗下的红米平板电脑 Redmi Pad 2 乐学版、小米米兔儿童手表这两款产品有关,「AI 教育不涉及,但招聘应就是为了这两块的产品在服务」。(来源:快科技)

岚图追光 L 破晓上市,定价 27.99 万起

12 月 10 日,岚图汽车发布全新轿车岚图追光 L,推出 Max 与 Ultra 两款配置,售价分别为 27.99 万元、30.99 万元。官方同步公布六项首任车主服务权益,包括三电终身质保、五年基础保养等,金融方案提供 3 年 0 息。

追光 L 基于岚海智能超混平台打造,主打「全域 800V」技术架构,涵盖驱动、电控、供电及热管理系统。车辆搭载 63kWh 电池并兼容 5C 超充,官方数据显示可在 12 分钟补能 60%,支持 410km 纯电续航。馈电油耗为 4.9L/100km。动力系统方面,新车搭载最高热效率 45.18% 的混动专用发动机。

底盘配置包括前摄预瞄的智能「魔毯」系统与后轮转向,转弯半径 5.55 米,并提供八种驾驶模式。智能化由华为提供方案,搭载 ADS 4 智驾及 HarmonySpace 5 座舱,支持全向 AEB 与车机生态互联。

车身尺寸为 5125/1985/1522mm,采用东方美学设计语言,曾获 MUSE 设计奖铂金奖。内饰大面积软包、零重力副驾、23 扬声器音响及大尺寸天幕等配置。(来源:极客公园)

 

苹果官网上线 3 小时快送服务:iPhone 免运费

12 月 10 日,苹果在中国大陆推出三小时快送服务。苹果官网显示,部分订单可以选择三小时快送服务,对于现货商品,符合条件的产品可免费配送,其余产品需另付 45 元运费。

具体来看,对于现货商品,iPhone、iPad、Apple Watch、Macbook Pro、Macbook Air 和 AirPods 产品可免费配送,其余产品需另付 45 元运费,具体以结账页面信息为准。

值得注意的是,消费者选择三小时内送货时必须在当天上午 10:00 至晚上 8:30 之间下单并完成支付。(来源:快科技)

马斯克:若重新来过,不会再领导美国「政府效率部」

12 月 10 日,马斯克在接受采访时回顾今年的「涉政经历」,直言若重新选择,不会再领导 DOGE。他还感叹,当时的经历甚至有些「恍惚」:

马斯克表示,「DOGE」这个名称是「基于网络上的建议」而拟定的。尽管他仍然认为,努力减少政府开支是一项值得去做的事情,但他也承认,自己在与特朗普政府共事的几个月里所做的努力效果并不显著。

当主持人直接询问马斯克,如果能重演历史的话,他是否会回到 DOGE 办公室工作时,马斯克稍作思考后叹了口气,表示自己不会这么做。

由于与特朗普政府合作,马斯克今年的公众形象大幅受损——不仅马斯克本人成为美国众多抗议活动的对象,就连特斯拉的汽车也遭到了不少破坏行为,例如被恶意纵火焚烧。马斯克认为,公众的这种反对反应是对他试图阻止「政治腐败」的强烈反应。(来源:财联社)

昨天 — 2025年12月10日极客公园

众筹历史第一后,这家 3D 打印「黑马」获高瓴、美团、顺为同时押注数亿元

2025年12月10日 22:11
作者|苏子华
编辑|郑玄
 

刚刚,极客公园获悉,3D 打印「黑马」快造科技(Snapmaker)正式宣布完成数亿元 B 轮融资。由高瓴创投、美团联合领投,顺为资本、美团龙珠、南山战新投跟投,老股东同创伟业、东证资本继续加注。

Snapmaker 今年在行业里备受关注,核心原因是其 8 月份推出的 3D 打印机 Snapmaker U1,在 Kickstarter 上获得超 2000 万美元(约 1.5 亿人民币)的众筹成绩,刷新 3D 打印机历史众筹金额最高记录,一鸣惊人。其在国内售价显示为 5999 元一台。

严格意义上来讲,这是 Snapmaker 第一次推出纯粹的 3D 打印机产品。在此之前,他们主推的产品是集成 3D 打印、激光雕刻、CNC 雕刻切割技术于一体的「三合一」桌面制造工具。

据团队介绍,Snapmaker 成立于 2016 年,创始人陈学栋获得过 WRO 世界机器人奥林匹克竞赛最佳技术奖,保送厦门大学。

他们的首款「三合一」多功能打印机 Snapmaker Original 于 2017 年推出,在 Kickstarter 众筹 1500 万人民币,创中国项目第一;2019 年 5 月,Snapmaker 2.0 再登 Kickstarter,筹得 5400 万人民币(约 785 万美元),刷新科技类目历史第一。

然而,「三合一」系列产品的市场,后续逐渐被 3D 打印、激光雕刻、CNC 三个赛道里优秀的单一功能消费级产品所侵蚀。

 

此前,消费者需花费一两千美元购买一台多功能产品,如今只需五六百美元就能分别买到 3D 打印机、激光设备和 CNC 设备——多功能产品的价格优势不再明显,且单一功能产品的消费化程度、应用场景更加精准。

Snapmaker 团队告诉极客公园,他们因为原有「三合一」产品,对 3D 打印、激光雕刻、CNC 三个赛道的行业发展、市场规模及竞争态势均有深入了解。他们当时判断,3D 打印是三大赛道中规模最大、潜力最强的领域——激光和 CNC 均属于减材制造,而 3D 打印属于增材制造,应用场景更具想象空间。

于是,他们早在 2020 年就启动了单一功能产品的 ID 设计,2021 年完成原型研发。最终,直到 2023 年,创始人陈学栋最终确定集中资源攻坚,聚焦消费级 3D 打印产品。

Snapmaker 团队通过分析千余条用户反馈及深度访谈发现:多色打印虽是用户购买新设备的主要动力,但普遍存在效率低、材料浪费等痛点。

于是,基于过往在多工具头协作与高精度部件自制方面的技术积累,Snapmaker U1 成为国内第一个推出独立四头并联系统的产品,能够实现多材料快速切换,提升了打印速度、更加省料,尤其拓展了多色柔性软料的应用空间。

对于新一轮融资,Snapmaker 创始人陈学栋表示,将重点推进三方面工作:「一是加速核心技术研发,攻克多色打印、高速成型等用户痛点;二是拓展全球人才布局,特别是招募硬件研发、AI 软件与内容生态等领域的顶尖人才;三是构建开放生态,联合创作者、开发者与供应链伙伴,降低创造门槛,让 3D 打印成为人人可用的 『通用性』 创造工具。」

有行业人士评价,3D 打印仍处于早期阶段,受众群体仍以创客为主,还未进入主流大众消费市场。产品形态、易用性、材料便捷性、成本控制及生态完善度均有较大提升空间。

不过,3D 打印市场在国内的发展仍然是超出预期。已有不少企业开始在抖音、小红书等平台进行投放,不少视频获得几百万点赞,打破了原有产品用户画像,吸引了大量女性潜在受众。3D 打印机一方面成为了流量密码,一方面也预示着其成为下一台「家电」的潜力。

有行业人士判断,3D 打印设备未来将达到家电级的出货量。「消费级 3D 打印机年出货量约在 400 多万台左右,而微波炉、冰箱、洗衣机、电视机等家电的年出货量高达数千万台,即便是扫地机器人,年出货量也处于数百万台至数千万台的区间。」

类比之下,消费级 3D 打印机的潜力巨大,「未来,3D 打印设备与配套内容的关系,可能会类似电视机与影视内容、游戏机与游戏作品的关联——用户购买设备的核心需求,更多是为了获取后续的优质内容。」

据极客公园了解,目前拓竹旗下的模型内容社区 MakeWorld 已经拥有 5000 万左右注册用户,月活超过 1000 万。「行业下一阶段的竞争焦点将逐步转向内容生态。」上述人士表示。

拓竹自从 2022 年发布首款产品之后,已经在行业里声名鹊起,快速改写着行业格局。而今年,Snapmaker U1 的推出,也成为了搅动消费级 3D 打印市场的一股核心力量,再加上前不久大疆投资智能派(英文名:ELEGOO)数亿元、以及行业内创想三维和纵维立方等厂商陆续推出的新产品,都在宣告——消费级 3D 打印市场的终局还远未到来。

随着资本密集入局,各家 3D 打印厂商开始囤积粮草、招兵买马,我们可以预测:行业集中度将迅速提高,正如手机行业早期也曾有众多品牌,而近年来全球范围内已逐渐集中到少数几家头部企业。

2026 年,行业必将格外热闹。这将是一场涵盖营销、公关、人才、供应链和研发等各个方面的「全面竞争」。

Google 又一次发布了 Google Glass ,这次想帮你把 Gemini 与 Nano Banana 戴在头上

2025年12月9日 23:41

如果你今年一直在密切关注 AI 眼镜/AI 硬件领域的大厂动态,那你肯定对 Google I/O 期间 DeepMind 发布的 Project Astra AI 项目演示印象深刻。

在这个惊艳的 Demo 中,Google 展示了一个极其超前的原型概念:戴上一款 AR 眼镜,借助其中的 AI 能力,它不仅能帮助你理解现实世界中的各种元素,还能帮你记下现实中的各种信息,甚至提醒你某一样具体的物件放在了哪个位置。这一技术在发布后立即惊艳全场,被认为是 AR 眼镜在技术上的一次新突破,但其实同样可以被看作是 Google 过去近十年在增强现实技术领域投入的缩影。

而在今天刚刚举行的 Google The Android Show 特别节目中,这一愿景终于迎来了真正的落地时刻。

 

和去年一样,今年 Google 仍然对 Android XR 寄予厚望,强调这不仅仅是一个操作系统,它是一个跨越设备形态的统一平台。

据 Google AR/XR 副总裁 Shahram Izadi 在发布会中强调,Google 将 XR 设备定义为一个广阔的「光谱」:从轻若无物、主打全天候佩戴辅助的 AI 眼镜,到融合了两者的有线 XR 眼镜,最后才是算力强大、沉浸感极致的 VR 头显。

在这个光谱中,Gemini 不再仅仅是一个聊天机器人,它是整个生态系统的「粘合剂」和核心交互界面。它让 XR 设备真正有能力,从「个人设备」转变为赋予用户「超能力」的延伸感官。

显然,在这个战略之下,最让人感到兴奋,也是最能体现 Google 差异化策略的,并非传统类似 Apple Vision Pro 那样的重型头显,而是那些试图让技术彻底「隐形」的轻量化设备。

 

01

AI 眼镜:时尚优先,让技术「隐形」

在整个目前的 XR 设备生态中,Google 对 AI 眼镜的策略也称得上相当激进;因为不同于以往科技巨头对硬件堆料的执着,Google 这次避开了笨重的「赛博朋克」式科技感,选择了完全拥抱时尚。正如 Shahram 在视频中掷地有声的宣言:「我们的 AI 眼镜首先必须是眼镜。这意味着它们必须轻便、时尚,适合全天佩戴。」
这倒是与今年国内 AI 眼镜行业里出现最多的那句话「AI 眼镜首先得是一只好看的眼镜」不谋而合。
为了实现这一目标,Google 也并没有选择闭门造车,而是宣布与全球顶尖的眼镜品牌 Warby Parker 和 Gentle Monster 达成深度合作。同时公布了 Google AI 眼镜的原型机。

 

Gentle Monster 在发布会中表示,他们希望挑战传统的认知,创造出不仅提供连接,更能激发惊奇感的时尚单品。Google 的技术专长在于让复杂的科技「消失」在精美的镜框之中。
按照规划, Google 未来将推出两种形态的 AI 眼镜:一种是类似 Ray-Ban Meta 的纯音频/摄像头版,专注于语音交互和捕捉生活;另一种则是集成了 Micro-LED 或 Micro-OLED 投影的显示版 AI 眼镜(Display Smart Glasses),能够在不阻挡视线的前提下私密地显示信息。

 

在 The Android Show 的实机演示环节,Google 也展示了这种轻量化设备的潜力,尤其是 Gemini 多模态能力的实际应用。演示者戴着原型机走进休息区,目光落在桌上一包陌生的零食上,随口问道:「这是什么?」Gemini 几乎在瞬间识别出这是韩国流行的食物,同时还详细解释了它独特的吃法——捏碎面饼并撒上调料粉。这不仅仅是视觉搜索,更是一种对现实世界的深度理解。
更有趣的是 Nano Banana 的端侧图像编辑模型演示:当你对着面前的朋友拍了一张照片,然后通过语音指令:「给每个人加上全套身体的 Android 机器人特效,还要戴墨镜。」在毫秒之间,AI 就在眼镜的视野中生成了有趣的增强现实图像。
为了证明这不仅仅是极客的玩具,Google 还展示了与旅游平台 Get Your Guide 的合作案例。在一个名为「寻找纽约最好吃的热狗」的旅程中,AI 眼镜成为了比智能手机更沉浸体验的向导。
当游客在复杂的街道上寻找集合点时,眼镜直接在视野中标记出路径;当面对究竟「热狗算不算三明治」这种存在主义哲学问题时,Gemini 也能即时加入讨论。甚至在 Uber 的演示中,当用户抵达繁忙的机场路边,眼镜能直接显示车辆的实时位置、车牌号,并引导用户精准找到司机。

 

这种仅仅通过「抬头」这一动作就能完成的交互,让用户既能获取数字信息,又能保持与现实世界的连接,真正做到了让计算如影随形。
当然,为了支撑这些体验,开发者生态至关重要。Google 今天也发布了全新的 Glimmer UI 工具包,这是 Jetpack Compose 的一部分,专门针对眼镜进行了优化。它引导开发者避免使用在透明屏幕上会「消失」的黑色背景,转而使用高对比度的卡片式 UI。
此外,新的 Projected Library 允许开发者将现有的手机 App 画面直接「流式传输」到眼镜上,无需重写代码即可实现跨端体验,这无疑将大大加速 AI 眼镜应用生态的成熟。

02

Project Aura:把「大脑」挂在腰间的 4K 巨屏

 

介于轻便的 AI 眼镜与重型的全沉浸头显之间,Google 也并没有留下真空地带。由 XREAL 承载的 Project Aura 代表了 Android XR 生态中一条极为务实的路线。此前外界对它的认知仅停留在「有线眼镜」的概念上,但在这次展示中,它被重新定义为一种平衡了移动性与生产力的全新计算形态。

 

与 XREAL 其他产品相同,Project Aura 采用的也是光学透视(Optical See-Through)方案,这也意味着用户是透过透明镜片直接看到真实世界,而不是通过摄像头拍摄再显示的视频透视。

但 Project Aura 的野心远不止于此,它并非简单的投屏眼镜,而是一套完整的计算系统。

其核心创新在于那个通过 USB-C 连接的计算模块。这个像冰球一样大小的模块内置了强大的 Snapdragon XR2+ Gen 2 芯片和高容量电池,运行着完整的 Android XR 系统。

 

这种分离式设计它极大地减轻了眼镜本体的重量,解决了长时间佩戴鼻梁压迫的问题,同时将发热源从头部移开,避免了「暖宝宝贴脑门」的尴尬体验。

同时,这个模块本身也是一个控制器,表面配备了触控板和方向键,方便用户在无法语音或手势的场景下进行盲操作交互。

在视觉体验上,尽管眼镜本体轻便,但堆料却毫不含糊。根据 UploadVR 的上手报告,Project Aura 提供了单眼 4K 的超高分辨率和 70 度的视场角。虽然这一视场角不及 VR 头显,但在 AR 眼镜领域已属顶尖,足以填补全沉浸头显与普通眼镜之间的空白。

 

在 Google 演示的「咖啡馆场景」中,用户可以通过 Project Aura 扩展出了多个巨大的虚拟屏幕:左边播放着流媒体视频,右边是聊天窗口,中间则是巨大的工作界面。

 

更令人印象深刻的是它的混合办公能力。当你需要处理复杂的照片编辑任务(如 Lightroom)时,Project Aura 可以通过线缆连接到笔记本电脑,瞬间变身为电脑的超大虚拟显示器。

此时,Gemini 依然在线——当你看着 Lightroom 的界面不知道如何操作时,可以直接询问 Gemini:「如何给这张照片添加背景虚化?」Gemini 能够识别电脑屏幕上的内容,并一步步指导你操作滑块。这种跨设备的智能协同,彻底摆脱了 AR 眼镜作为「手机附属品」的固有标签,使其成为了真正的生产力工具。

03

Galaxy XR:硬刚 Vision Pro 的参数怪兽

作为 Android XR 平台的旗舰级「重武器」,今年稍早时候正式发布的三星 Galaxy XR 头显虽然在形态上不如眼镜轻盈,但在硬件参数和沉浸式体验上展示了安卓阵营的绝对肌肉。这款设备被 Google 称为拥有「无限屏」,旨在为用户提供最极致的视觉效果和计算能力。

 

本次发布会上虽然没有头显产品线的硬件更新,但 Google 和三星深知软件体验才是留住用户的关键,因此通过最新的功能更新解锁了几个直击痛点的关键体验。
首先是解决了「不想以卡通形象开会」为痛点的 Likeness(拟真形象)Beta 版。在视频演示中,用户奥斯汀展示了这一功能:只需将头显取下,反转面向自己进行约 30 到 90 秒的扫描,结合设备内部的眼动追踪和面部传感器,即可生成一个逼真的 3D 数字化身。在 Google Meet 通话中,这个化身能精准捕捉用户的每一个微笑、皱眉和眼神变化,让远程协作不再像是在玩电子游戏,而是真正的人与人之间的交流。

 

对于经常出差的商务人士,新增的旅行模式则是一个刚需功能。如果你在飞机上使用过 VR 设备,就会知道机身的颠簸和转向往往会导致虚拟窗口漂移甚至让人眩晕。Travel Mode 通过算法优化,暂时禁用了依赖视觉特征点的追踪技术,转而依靠 IMU(惯性测量单元)来实现稳定的 3DoF 追踪,从而确保面前的虚拟屏幕像钉子一样钉在空中,无论机舱如何颠簸都稳如泰山。

 

而在娱乐和内容消费方面,Google 还画了一个巨大的饼—— 自动将所有 2D 内容转制成 3D 版本。
Google 产品经理 Austin 表示:「想象一下,如果每一个游戏都是沉浸式的,每一部 YouTube 视频都是 3D 的,整个互联网都变得立体起来。」
这一功能计划于明年系统级推送,它将利用设备的端侧算力,能将普通的 2D 内容实时转换为 3D 体验,彻底解决了 XR 平台初期内容匮乏的难题。
值得一提的是,三星在交互硬件上也做出了改变,Galaxy XR 配备了一对类似「星战光剑柄」的流线型手柄,彻底移除了硕大的红外追踪环,转而完全依靠 LED 和计算机视觉算法进行追踪。这不仅让手柄看起来更具未来感,也大大减少了在使用过程中双手碰撞的几率。
从最前端、最贴近生活的 AI 眼镜,到兼顾便携与性能的 Project Aura,再到代表着算力巅峰的 Galaxy XR,Google 今年正试图通过 Android XR 证明一个道理:未来的计算不应该把你关在封闭的房间里,也不应该强迫用户去适应单一的硬件形态。

 

相反,计算应该像空气一样,通过不同形态的设备,渗透进生活的每一个缝隙——无论是你在咖啡厅办公,在异国他乡旅游,还是在客厅里享受电影。
随着开发者工具的全面开放,以及 Gemini 智能核心的不断进化,2026 年,或许我们真的可以把熟悉的 Android 应用不仅「装」在口袋里,更是「戴」在头上,看着它们在现实世界中活灵活现。

 

猿辅导一个月连发两张 AI 牌:这次把 Agent 交给老师

2025年12月10日 13:53

猿辅导的 AI 节奏明显提速。

继刚刚发布纯 AI 外教产品「斑马口语」后,12 月 1 日,猿辅导再推面向教师的 Agent 工具「飞象老师」,这是一个原生 AI 生成式产品: 教师只需要描述教学创意和想法,就能直接生成可交互的教学动画与游戏化课件。

一个月内连发两款 AI 产品,这种「高频出牌」的信号很直接:

这家以在线课程和题库见长的教育科技集团,正把 AI 的押注从「零散功能」推向「垂直场景的系统化重做」。

「斑马口语」把外教课堂交给 AI,让每一位孩子都有一位专属的 AI 外教。「飞象老师」更激进——chat to APP(对话即应用):让老师用自然语言「做」出课堂级教学产品。

密集的产品节奏背后,猿辅导似乎正在向外界强调新身份:

不只是一家在线教育巨头,而是一家扎根教育场景的 AI 公司。

 

01

「飞象老师」到底是什么?

 

一句话总结: 老师输入一句需求,AI 生成一堂能直接用的互动课。 老师在课堂上打开 就能 用,所以它是个网站, 目前没有 APP

比如输入:

「帮我设计一个球体体积推导的互动演示。」

系统会通过多轮对话,实时生成包含互动 H5 动画、结构化板书设计、随堂习题的全套课件。

这跟上一代教育 AI 很不同,过去更多是「生成教案、出题、润色」。而「飞象老师」的核心能力在于多模态的即时生成——「即时构建课堂应用」。

你以为是在聊天,它其实在搭课程、搭互动、搭节奏。

结果很直接:老师不必学 Flash、GeoGebra。你懂教学、会表达,就能做教学软件。

 

02

体验层冲击:为什么它不像「花活」?

 

从交付看,「飞象老师」不是一个通用模板「套」所有学科。它做的是更难、也更有价值的事: 按学科痛点做深度垂直优化。

比如,数学学科最怕「会背不会懂」。在「飞象老师」里输入「平方差公式几何证明」,系统直接生成可视化推导动画:大正方形拆解、小正方形切除、剩余图形平移拼接,代数公式被还原成清晰且生动的几何过程。

学生看见了「为什么」,而不只是「答案是什么」。

又比如,语文的难点不是「读」,是「进不去」。

输入「生成黛玉进贾府-沉浸式体验」,它会生成交互式剧情:学生以第一视角进入贾府路线,看布局、走情境、触发人物互动,名著从「讲解范本」变成了「体验现场」。

还有,英语的痛点是「脱离真实场景的重复性枯燥」。在「飞象老师」里上传课本截图,场景就能动起来;上传单词表或输入 Unit 名称,就能即时生成超市购物、环游世界等情景小游戏。

这三个例子的共同点很清楚:

它不是「让课件更炫」,而是让教学可交互、可理解、可被学生主动参与 ,这也是它最像「应用级教师 Agent」的地方。

 

03

当教育垂直 Agent「撞车」Gemini 3.0

 

非常有意思的是,就在「飞象老师」发布前后脚,Google 发布的 Gemini 3.0 也展示了类似能力。社交网络上,大量硬核玩家用 Gemini 3.0「手搓」应用。

这反而从侧面说明一件事: 猿辅导在技术路径的选择上是非常超前的。他们不仅押中了「多模态+互动生成」这个大方向,在产品落地上,甚至比 Google 的通用模型应用得更早、更深。

「既然 Gemini 3.0 也能做,为什么我们需要一个专门的「飞象老师」?」

这话听着耳熟——「通用大模型都这么强了,为什么还需要专业级 Agent?」从 Cursor 、Harvey 开始,每当一个垂直领域的 AI 新工具出现,这个问题就得来一遍。

答案是「可规模化」:通用模型能做 demo,垂直 Agent 要解决日常使用。全民手搓应用可以嗨一嗨,但「看起来好玩」和「上课能用」是两码事。

实际体验后我们发现,「飞象老师」把三个关键点做到产品化:

第一,0 门槛。

通用模型能做,但门槛高很难「长期手搓」。 教师的真实时间和技能结构,更不允许他们每天当「半个产品经理+半个提示词工程师」。

「飞象老师」把这些复杂度压在后台,老师看到的只有「我说需求,你给结果」的对话界面。

第二,输出「教法」,不只素材。

它内置教师 workflow:从情境引入、概念讲解、提问脚手架、随堂检测,AI 输出的是一套成体系的教学组织方式,而不仅仅是「太炸裂了」。

第三,知识库护栏。

教育不允许「差不多」。

「飞象老师」调用猿辅导的「超级知识库」,十几年积累的题库、知识图谱、教法体系,把学段匹配、考点引用、难度边界拉回可控范围, 这是垂直 Agent 的关键护城河。

 

04

一个「更大的问题」冒出来

 

过去两年,所有垂直行业都在等一个答案:

「大模型的能力进化,最终会把行业重做成什么样?」

创业团队冲得快,但容易昙花一现;通用模型公司技术强,但容易「拿着锤子找钉子」;行业巨头懂场景、能规模化,但必须证明: 能把 AI 做成大规模、日常、高频的应用级产品

教育作为「超级场景」,是包括 OpenAI 在内的所有大模型公司,都视为 AI 应用排名前三的领域;教育学习,也是 AI 时代创业者必看的机会。

所以,大模型的能力进化,最终会把教育重做成什么样?

「飞象老师」更像是猿辅导给出的一种明确态度:

在教育这个强专业、强准确性、强场景约束的行业里,AI 的下一步绝不只是简单 的 效率工具, 而 是彻底升级课堂形态,革新学习范式。

 

05

结语

 

从「斑马口语」到「飞象老师」,猿辅导的 AI 版图不会止步。初创在冲刺,通用大模型在下探,追击只会更快、更凶。

从历史周期看, 最容易跑出「大规模、日常、高频应用级产品」的,往往就是教育。

场景重、需求真、决策链清晰,足以把「概念」逼成「日常」。

当 AI 进入新的技术纪元,答案正在逼近:

教育行业,会成为最先跑出「应用级 Agent」的第一批样板吗?

跨越比特与原子,小鹏汽车下一个十年的「物理 AI」路线图

2025年12月10日 13:50

整理|汤一涛

编辑| 靖宇

 

在极客公园创新大会 2026 的舞台中央,小鹏汽车董事长兼 CEO 何小鹏发表了一场极具行业洞察的年度演讲。

何小鹏在极客公园创新大会 2026 上发表演讲|图片来源:极客公园

 

作为穿越了互联网、移动互联网到人工智能周期的连续创业者,何小鹏此次的目光不再局限于单一的交通工具。他敏锐地指出, 科技界正在经历从「数字能源」向「物理 AI」的范式转移 。从自动驾驶的端到端大模型,到人形机器人 IRON,再到打破维度的陆地航母,小鹏汽车正在构建一个打通比特世界与原子世界的全新生态。

何小鹏认为,未来十年, 我们将不再仅仅讨论规模效应或网络效应,而是迎来一个属于「智能体效应」的全新时代

以下是何小鹏在极客公园创新大会 2026 上关于物理 AI、具身智能以及未来出行图景的演讲实录,由极客公园整理:

回顾过去二十多年的创业历程,我们见证了数字世界的爆发——从计算机软件、互联网、移动互联网到如今的 AI 浪潮。这背后有一个非常重要的底层逻辑: 能源与引擎的组合形式决定了科技浪潮的方向。

数字世界和物理世界的融合,将催生物理 AI|图片来源:小鹏汽车

在物理世界,19 世纪的蒸汽机、20 世纪的石油与内燃机,分别催生了火车、汽车和飞机的诞生,深刻改变了人类的生活。而在数字世界,同样存在「能源」与「引擎」。今天,数据与算力的结合构成了新型能源,而芯片与交互界面(GUI)则是利用这种能源的新型引擎。

能源的转变推动了动力形式的转变,而能源加动力形式的转变,又改变了所有人的生活。在下一个数十年里边,如果我们有一天把核聚变做的非常小型,放到心脏里面,也许新一代的超人就会出现。

所以能源+动力形式的改变推动了这个世界上科技的浪潮。换个角度,我们相信下一个十年到三十年里,很有可能出现一种全新的创业方式: 物理如何跟 AI 耦合

 

01

从网络效应到「智能体效应」

 

那么在物理世界跟数字世界,我们如何去把自己的壁垒提高,如何构建自己的最强大的能力?在这里面做一个分析。

在商业与技术的演进中,不同的时代遵循不同的效应:

  • 物理世界 遵循「规模效应」:规模越大,成本越低,竞争力越强。
  • 互联网世界 遵循「网络效应」(Network Effect):产品对用户的价值取决于使用该产品的其他用户的数量,连接的节点越多,价值呈指数级增长。

我们相信,随着物理 AI 出现之后,下一个世界物理和数字这两个世界开始融合,我们会出现一个全新的效应—— 智能体效应 。在这个效应里面所有的东西都会不一样。

比如说我们以前会讨论,汽车领域将来会不会出现赢者通吃的结构?所有做汽车的人都不认同,因为汽车是个规模效应,一定是多定位、多区域的多头并存。换到互联网世界,就出现了赢者通吃的情况。

智能体效应会不会出现新的效应,比如说寡头垄断,不知道,但是一定会出现全新的思考逻辑。这跟大家分享两个有趣的观点。

第一个智能体里面的一个表现形式叫 黑洞效应 。AI 会不断吞噬知识、压缩知识,涌现出全新的能力。

在自动驾驶领域,我们已经观察到这种现象:模型开始展现出人类未曾预设的逻辑。例如,车辆在红灯即将变绿时产生的预判性「蠕行」,这并非代码规则所写,而是模型从海量数据中涌现出的智慧。这也是为什么在未来,代码的重要性将让位于数据;也是许多公司开源模型,却绝不开源核心数据的底层逻辑。

黑洞效应:AI 将化为不断吞噬知识的黑洞,不断涌现出全新的知识和能力|图片来源:小鹏汽车

第二我们看到智能体效应里面叫 蚁群效应, 这是一种去中心化的高适应性智慧。蚂蚁搬运食物,个体在路上看到一只虫子,它不会回到蚁巢向蚁后汇报,让蚁后派蚂蚁小队把虫子搬走;而是会跟附近的蚂蚁形成近场的网络效应,附近的蚂蚁越多,它的 power 越强。

个体之间可以通过近场网络通讯,通过局部互动涌现出群体智慧。附近的「蚂蚁」(智能体)越多,系统的鲁棒性和适应性越强。未来的物理智能体将具备独立的感知、思考、推理、控制和决策能力,大家也会看到一个全新的效应会出现。

蚁群效应:非中心化调度的近场网络效应,实现统一、高效、自适应的集体行动|图片来源:小鹏汽车

新的效应一定有巨大新的机会,这里举两个小鹏汽车在做的例子。

为什么在过去的几十年里,无论是家电、手机还是传统汽车,都难以形成真正的「网络效应」?

原因有二:一是缺乏足够的规模;二是缺乏自主规划的能力,只是工具,产生不了自身的内容。但在新的 AI 时代,情况发生了改变。在这个过程中,人类的角色将从劳动的「生产者」转变为智能的「监管者」。这种变化也将在小鹏的 Robotaxi 、Robo 车型以及未来的人形机器人上得到体现。

所以下一个十年,我们极有可能见证一种全新形态的巨型企业诞生。回顾商业历史,过去数十年甚至上百年的大型公司,其架构往往是线性的——「十万名员工、十万个工具」的物理堆叠。而在最近二十年的互联网时代,服务器成为了新的杠杆,企业通过「人+服务器」的模式实现了规模复利的效率提升。

所有企业在物理 AI 的新十年,都将经历颠覆性的生产力变革

在下一代,这个变化可能会更剧烈。我们将看到「十万名员工」叠加「百倍数量的智能体(Agent)」,以及充足的算力资源。这意味着企业将进入一个全新的生产力维度,生产关系也将发生本质的跃迁: 生产协作不再局限于「人与人」之间,而是演进为「人与智能体」、「智能体与智能体」以及「人与人」并存的复合协作网络。

要怎么去迎接这种变化,小鹏汽车的思考逻辑是,通过自研算力的芯片、自研操作系统以及物理世界运动的模型,构建基于物理 AI 的全栈自研能力。在这个基础上,我们又孵化出了 Robotaxi、飞行汽车等新形态。AI 大模型为物理 AI 提供认知与理解能力,具身载体提供与真实世界交互执行的能力。

 

02

重构自动驾驶——超越语言(Language),

走向行动(Action)

 

大家知道,小鹏是非常早就在做自动驾驶的一家整车厂。过去时间里,我们一直看到一个问题:为什么无论用规则算法还是小模型,都难以突破 L2 级辅助驾驶的瓶颈?

路德维希・维特根斯坦有一句名言(Ludwig Wittgenstein):「语言即世界。」我们尝试用人类的语言去归纳这个世界,写出很多的规则。但是为什么语言就是我们的世界?为什么仅仅用语言来束缚跟框架?

举个例子,小朋友们想学游泳,他可以看书学习理论,也可以去水里亲自学一下,哪一个有效?很多时候,人类习得知识和技能并非是通过语言,而是感知。

人类用语言归纳世界,但一个人在自我学习的领域里面,有很多时候是不能通过语言去学习的。举个例子,小朋友们想学游泳,他可以看书学习理论,也可以去水里亲自学一下,哪一个有效?很多时候,人类习得知识和技能并非是通过语言,而是感知。

所以语言只是人类归纳世界的一种方式。今天我们大部分的大模型都叫大语言模型。这意味着它们可能并不是这个世界上最有效率、最综合、最全面的模型,因为它是人类把这个世界高度抽象和归纳之后形成的模型。

为了实现真正的 L4 甚至 L5 级自动驾驶,我们必须跳出「语言」的框架。小鹏的 第二代 VLA 选择跳过了语言框架,直接通过视频(Video)结合语言(Language),最终输出为行动(Action)。这种直接从物理世界进行感知、规划、推理并执行的模型,效率和能力将大幅提升。

我们相信,在未来,一个直接从物理世界进行感知和规划、推理、执行的模型,一定会在物理 AI 领域和大语言模型结合。

这也是为什么,我们认为,下一个五年里,大家会看到无人驾驶时代。

我相信在无人驾驶时代,有两种无人驾驶的汽车。一种是没有人开的无人驾驶汽车,也就是 Robotaxi。我相信这种汽车会在下一个五年里会出现,但数量不会非常大。

更多的是有人开的 L4 体验的汽车,小鹏明年会推出三款这样的汽车。虽然仍需驾驶员坐在位子上,但车辆具备全冗余硬件和无接管能力。

今天所有的 L2 都只能在城区开,不能在小区、小路开。2026 年,小鹏会在我们的 Robotaxi 上试运营我们相关的能力,还会推出一个全新的 Robo 汽车,能够规模交付所有用户,可以不限区域,特别是小区内、地下车库内,园区内都能非常好的行驶。

小鹏将在未来推出的产品 Robo|图片来源:小鹏汽车

 

03

具身智能的终极形态——

为何是人形机器人?

 

小鹏在物理 AI 领域的另一大探索是名为「IRON」的全新一代人形机器人。很多人问,为什么是人形?

首先,环境适配性。下一个二十年、三十年全球有很多种机器人,一定有非常多的专有机器人。但我们相信人形机器人是最普遍的,因为这个世界是按照人去设计的。

我们在过去做了七代机器人,有四代是四足机器人。我们做第三代的时候,把四足机器人放在一个开发者的家里去用,提前感知一下四足机器人在家庭场景里有没有用。我们发现了无数问题。如果一个人走到床头柜旁,可以轻松原地转身;但对于四足机器人而言,在狭窄空间内原地掉头的难度非常高。

我想用这个小案例说明,如果你想让一个机器人更容易适应于这个社会,人形是非常重要的,因为这个社会都是为了我们人去思考、设计、使用的。

第二点是数据获取。只有把机器人做成人形,才能直接利用海量的人类行为数据,来对机器人进行训练。如果做一个专有机器人,要获得海量数据是非常困难的。

第三点是工具使用。很多人说可以把机器人做成跟一个工具的嵌入合体,它当然更好,我同意。但是这个世界上有 100 万种工具为人而设计去使用的,人形机器人可以最大程度适应这些工具。这跟机器人只有一个工具或者少数几种工具的使用权利相比,有非常大的不同。

我今天还想跟大家分享一下小鹏机器人走猫步这件事。

小鹏 IRON 为什么能走猫步?核心是硬件的设计。我们深入研究人体解剖学,增加了颈部和肩部关节,特别是在腰部设计了五个关节。只有拥有像人一样的肌体,才可能从物理层面还原人的体态。

小鹏 IRON 机器人在之前的发布会上引起了轰动|图片来源:小鹏汽车

 

如何从过去的模仿和简单的记录,变成真正的泛化、有重映射的逻辑,机器人才能进入到人类真实的步态。

目前的机器人行业大多处于第一代的阶段,表现力很强,但是需要提前录制。

从第一代进化到第二代,能够在不同的状态下比较快速和自然地切换不同的动作。

今天做的比较好的大多处于「1.5 代」阶段:能走和跑,但是很难干其他事情。换个角度说,绝大部分是半身运动,不是全身运动。

但是真正要做得好的是全新的泛化性最重要一代,我们自己内部叫零重力的控制体态:让机器人全身 70-80 个关节,在模拟无重力的状态下实现真实的协同运动。再在上面加上运控的生成式运动规划,才有可能在将来量产的机器人里面达到人的所有姿态和形式。只有攻克了这一难关,量产机型才能真正具备人类的姿态灵活性。

第三代人形机器人的特点是泛化性强,具备对全新的动作零样本迁移的能力|图片来源:小鹏汽车

小鹏汽车正在努力,希望在明年量产下一代的运动控制。

一个机器人体系里,需要有所有软件控制硬件的能力,而硬件设计需要足够的生产制造能力,这是最重要的。

小鹏 2025 年的研发投入预计接近 110 亿元人民币。我们会把汽车与 AI 领域的研发能力,迁移应用到机器人研发中;未来我们在机器人研发上的团队规模,也可能从千人级别逐步扩充到万人级别,覆盖软件、硬件、算力、嵌入式电子电器、线束等全链条技术领域。

我们认为,未来的汽车公司,本质上也会是机器人公司,这正是我们对行业发展的期待。

小鹏人形机器人 IRON,与 AI 汽车技术、制造和商业同源

与依赖 WiFi 连接云端的机器人不同,小鹏坚持端侧算力。IRON 机器人搭载 3 颗自研图灵芯片,拥有 2250 TOPS 的有效算力,并运行多个操作系统,包括 VLT、VLA、VLM 实现一个机器人进入高阶的能力。

关于落地场景,在中国和在欧美不一样,在欧美我会选择工业,在中国我会选择商业。至于进入家庭,还需要等待几年。

除了陆地,我们也在探索天空。小鹏汽车做了 12 年的低空飞行,现在向大家介绍一下我们的两大飞行体系。

明年,小鹏会推出第一个分体式飞行汽车——「陆地航母」。它创新性地解决了飞行器的存储、运输和补能问题:将飞机折叠收纳于汽车尾箱,随走随停。但带来的问题是只能飞 20 分钟以内,所以换个角度,它主要为了旅游观光。但是我们相信,将来我们会做出长续航版本。

另一个是垂直起降电动飞机 A868,它是纯飞机的形式,能够满足多人长航程高效出行。

小鹏汇天两大飞行体系:「陆地航母」满足个人低空飞行体验;「A868」实现多人长航程高效出行|图片来源:小鹏汽车

很多人都开过车,但极少人开过飞机。我相信下一个十年会有越来越多人开过真正的飞机。

这就是小鹏在新的十年里面我们正在探索的事情:如何在物理 AI 世界探索未来的出行;如何在全球化里做一个科技平权的具身智能公司。

相信下一个十年里,我们会和大家一起看到在 AI 的驱动下涌现出更多科技变革,让我们每个人的生活都会更加美好。

谢谢大家。

1.5万亿美元,SpaceX或成最强IPO;暴涨700%,人形机器人迎拐点;智谱开源AutoGLM,「豆包手机」人人可造

2025年12月10日 08:08

消息称 SpaceX 推进史上最大 IPO:拟募资超 300 亿美元,目标估值 1.5 万亿美元

12 月 10 日消息,据彭博社报道,知情人士透露,SpaceX 正积极推进首次公开募股(IPO)计划,拟募资规模将远超 300 亿美元(现汇率约合 2123.38 亿元人民币),若成功实施,这将成为有史以来规模最大的上市交易。

该公司正将估值目标定为约 1.5 万亿美元(现汇率约合 10.62 万亿元人民币),这一估值将使 SpaceX 接近沙特阿美(Saudi Aramco)在 2019 年创纪录上市时所达到的市值水平。当时,这家石油巨头通过 IPO 募集了 290 亿美元资金。

部分知情人士表示,SpaceX 管理层及其顾问正力争在 2026 年中至下半年完成上市。由于此事属保密信息,这些人士要求匿名。他们同时指出,IPO 的具体时间可能因市场环境及其他因素而调整,其中一位人士甚至表示上市可能推迟至 2027 年。

彭博社及其他媒体上周五曾报道,SpaceX 正在探索最早于明年年底进行 IPO 的可能性。SpaceX 加速迈向公开市场的步伐,部分得益于其快速增长的「星链」(Starlink)卫星互联网服务,尤其是其面向移动设备的直连业务前景,以及「星舰」(Starship)登月与火星火箭项目的持续推进。

一位知情人士透露,SpaceX 预计 2025 年营收约为 150 亿美元,2026 年将进一步增至 220 亿至 240 亿美元之间,其中大部分收入将来自 Starlink 业务。(来源:IT 之家 )

美称将允许英伟达向中国出售 H200 人工智能芯片,外交部回应

12 月 9 日消息,据央视新闻报道,12 月 9 日,外交部发言人郭嘉昆主持例行记者会。据报道,美国总统特朗普 8 日表示,美国将允许英伟达向中国「经批准的客户」出售 H200 人工智能芯片。

对此,郭嘉昆表示,我们注意到有关报道,中方一贯主张中美通过合作实现互利共赢。

英伟达发言人对外媒 TechCrunch 表示:「我们赞赏特朗普总统的决定,该决定允许美国芯片行业参与竞争,从而支持美国的高薪工作岗位和制造业。政府允许英伟达向经过商务部审查的商业客户提供 H200 芯片,是一个兼顾了各方利益的周全平衡,这对美国非常有利。」

据此前报道,H200 作为 H100 的迭代升级产品,基于 Hopper 架构,首次采用了 HBM3e 高带宽内存技术,实现了更快的数据传输速度和更大的内存容量,于 2023 年 11 月发布。(来源:IT 之家)

 

阿里巴巴成立千问 C 端事业群

12 月 9 日下午消息,阿里已成立千问 C 端事业群,由阿里巴巴集团副总裁吴嘉负责。据悉,该事业群由原智能信息与智能互联两个事业群合并重组而来,包含千问 APP、夸克、AI 硬件、UC、书旗等业务。

阿里巴巴在内部沟通中提及,千问 C 端事业群的首要目标是将千问打造成为一款超级 APP,成为 AI 时代用户的第一入口。未来,还将进一步把千问打造成无处不在的 AI 助手,覆盖眼镜、PC、汽车等场景,让每一个普通人都能随时随地使用 AI,并持续从中受益。

据报道,阿里核心管理层将「千问」项目视为「AI 时代的未来之战」。阿里计划将地图、外卖、订票、办公、学习、购物、健康等各类生活场景接入千问,赋予其强大的「办事」能力。(来源: 新浪科技)

暴涨 700%!TrendForce 预测 2026 年人形机器人迎产业拐点,年出货破 5 万台

12 月 10 日消息,集邦咨询(TrendForce)昨日发布最新研究报告,指出 2026 年将成全球人形机器人商用化的关键元年,预计全年出货量将突破 5 万台,同比增幅将超 700%。

该机构指出这一数据的激增,标志着行业正从实验室研发阶段加速向市场化落地转型,全球竞争格局也随之进入白热化阶段。

博文介绍,美、中、日三国产业路径差异显著:日本厂商深耕精密零组件技术,主攻养老与灾害场景;美国特斯拉等巨头聚焦系统稳定性与实务验证;中国则凭借「低价量产」与「多元场景」加速渗透。(来源:IT 之家)

 

智谱开源「会操作手机的 AI」AutoGLM,人人可打造豆包手机

12 月 10 日消息,智谱开源其核心 AI Agent 模型 AutoGLM。该模型被业界视为全球首个具备「Phone Use」(手机操作)能力的 AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。

此次开源意味着硬件厂商、手机厂商和开发者均可基于 AutoGLM,在自己的设备或系统中复现一个能「看懂」屏幕、并模拟真人进行点击、输入、滑动的 AI 助手。目前,AutoGLM 已支持微信、淘宝、抖音、美团等超过 50 个高频中文应用的核心场景,其自动化操作能力与此前引发热议的「豆包手机」演示相似。

AutoGLM 的开源将大幅降低 AI 手机的技术门槛,推动 AI 手机生态从封闭走向开放共创。同时,项目支持本地与云端部署,确保数据与隐私控制权始终掌握在使用者手中。(来源:智谱)

Pebble 戒指登场:定位「第二大脑」,不做健康监测、要靠语音记事杀出重围

12 月 10 日消息,科技媒体 Appleinsider 昨日发布博文,报道称继智能手表回归后,Pebble 品牌发布全新智能戒指 Pebble Index 01。该设备定位为「用户的外部记忆」,主打语音笔记功能,通过内置麦克风与按钮,将录音传输至手机并利用 AI 转换为文本。

Index 01 的使用逻辑非常直观:用户按下戒指顶部的宝石状按钮,即可通过内置麦克风记录语音。录音文件会即时传输至配对的智能手机(如 iPhone),并利用手机端的开源语音转文字模型及 AI 技术进行处理和转录。

Pebble 声称该系统支持超过 99 种语言。若手机不在身边,戒指本身可存储长达 5 分钟的音频,待连接后自动同步。此外,该按钮还支持自定义功能。

在硬件配置上,Index 01 采用了极端的「减法」策略。戒指主体由不锈钢制成,去除了屏幕、扬声器及触觉反馈马达,仅保留一个极少亮起的 RGB LED 指示灯。

这种设计将所有的 AI 运算与数据处理压力转移至手机端,从而大幅降低了戒指的功耗。最引人注目的争议点在于其电源管理方案:Pebble 宣称该戒指拥有「数年」的平均使用续航,但不支持充电。一旦电量耗尽,用户无法自行补能,必须将设备寄回 Pebble 进行回收处理。

价格方面,Pebble 制定了极具竞争力的策略:预售价格为 75 美元(现汇率约合 530.8 元人民币),正式上市后售价为 99 美元,产品预计于 2026 年 3 月开始发货。(来源:IT 之家 )

 

四摄设计?三星 Galaxy Z TriFold 三折叠手机原型机现身

12 月 9 日消息,三星电子中东北非地区市场与电商副总裁 Omar Saheb 前一天在领英平台发文,庆祝品牌首款三折叠手机 Galaxy Z TriFold 上市。

这名总裁在帖文下方晒出了自己上手 Galaxy Z TriFold 的照片,不过眼尖的网友们很快发现了他手里的手机与零售版机型的三摄设计不同,其机身背面拥有四个摄像头。

由于现在距离第二代 Galaxy Z TriFold 发布还为时过早,因此这名副总裁手里拿着的很可能是三星最终量产前,在内部制作、研讨的众多原型机之一,而且从实拍图可以看到,机身最底部的第四颗摄像头明显比前三颗要薄。

结合此前报道,三星 Galaxy Z TriFold 采用了内折设计,可有效保护主屏幕,配备高通骁龙 8 Elite for Galaxy 处理器,展开后机身最薄处仅 3.9mm,配备 5600mAh 三电芯电池,支持 45W 超级加速充电。(来源:IT 之家)

《阿凡达 3》导演卡梅隆现身海南,称 AI 永远替代不了人类创作

12 月 9 日消息,科幻大片《阿凡达 3》中国首映礼于 12 月 8 日在第七届海南岛国际电影节举行,导演詹姆斯・卡梅隆首次来到海南。

据新浪电影报道,詹姆斯・卡梅隆在海南岛国际电影节大师班上谈到了对 AI 的看法,卡梅隆赞同技术的革新,也认为 AI 可以用来做一些事,但永远替代不了人类的创作,「AI 能做出一个跟《阿凡达》差不多的电影,但在《阿凡达》上映前,它是做不出来的」。

卡梅隆说,「有人说是不是用 AI 替代人就好了?我个人是完全不感兴趣的,我不赞成用它取代人的创意。可以用 AI 提升工作流程,让我们更有创意,这个是可以的,只是要有高标准,不管是道德、法律方面等等。

我自己是永远不会用技术替代真人的,首先编剧要有真实的生活,他们要有独特的视角,然后演员再基于自己的人生体验诠释角色。每年评论家选出的电影都是很独特的体验,都是独特的艺术作品,AI 创作不出没人创作过的作品。AI 可以做出一个跟《阿凡达》差不多的作品,但是在这部电影上映前,它是做不出来的。」(来源:IT 之家 )

 

昨天以前极客公园

极客公园创新大会 2026 在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

2025年12月9日 14:53

12 月 6 日-7 日,由极客公园主办、798 文化科技联合主办的「极客公园创新大会 2026」(GeekPark Innovation Festival,以下简称「IF」),在北京 798 艺术区成功举办。

在 AI 的洪流中,真正的稀缺是人、判断和行动。因此,本届大会的主题是「进程由我 On The Loop!」。IF 2026 不仅关注「AI 会带来什么」,更着眼于如何做出重要选择,主动选择未来。

IF 已经连续举办 16 年,这个舞台不仅见证了特斯拉创始人马斯克、谷歌董事长施密特、苹果联合创始人沃兹尼亚克、Uber 创始人卡拉尼克等全球传奇极客的亮相,还记录了雷军、张一鸣、王兴、黄峥、宇树王兴兴等中国杰出创新者的最初起点和高光时刻。

如今,极客公园已经成为由内容社区与早期投资共同构成的创业者生态平台。极客公园的「目标函数」十分明确:激发创新中的「变量」,推动「非共识」成为新的「共识」。正如极客公园创始人 & 总裁张鹏所说,任何成功的创新都是一个持续的「见识-认知-行动」的闭环。它本质上就是一场持续的「强化学习」,关键就是设定你那个与众不同的目标函数。

大会汇聚四十余位全球创新者,通过主舞台演讲、4 场「小场深谈」及「AI 产品快闪」等多元形式,探讨技术趋势、产品创新与人类未来的关系,现场同步发布「2025 年度极客最爱好物」、「InnoForce 50」年度榜单。

非共识追问 × 未来 1500 天,定义 AI 时代的「我们」

IF 2026 主舞台围绕「非共识」追问、「未来 1500 天」等核心板块,展开技术趋势与人文价值的碰撞。

字节即梦负责人张楠与极客公园创始人&总裁张鹏探讨了在 AI 时代,如何探索人的想象力。在成熟团队以「二次创业」姿态投身 AI 浪潮的过程中,她表示,AI 不应单纯是一个工具,它更应当是人类能力的放大器,能够带领创作者抵达他们之前从未去过的地方,帮他们创作自己都未曾想象过的东西。

小鹏汽车董事长何小鹏以「物理 AI:改变正在改变人类生活的未来」为题,揭示了 AI 从数字空间向物理世界延伸的破局路径。他认为,未来,除了语言模型,一个直接从物理世界进行感知、规划、推理的模型,和执行运动跟控制的模型,一定会在物理 AI 领域进行结合。

影石 Insta360 创始人刘靖康在现场谈及了 AI 时代影像创作的「光学」与「计算」之争,以及对于新产品和新竞争的思考。他强调,影石 70% 以上的营收,都来自我们自主开创的细分品类。开辟新市场、解决未被攻克的难题,创造出独有的新价值,而非以击败竞争对手为目标,这是影石的核心价值观,也是我们在历史中的存在意义。

「测测」App 创始人任永亮分享了对人机关系演进的实践。他认为,爱是无条件的积极关注,更是我们构建内心秩序的终极力量。未来,他们希望打造一款具备情感能力的机器人,让机器人成为传递温暖的「爱的使者」,实现从智能工具到情感共生的跨越。

在 IF 2026 的第二日,罗永浩在极客公园的舞台分享了他做播客背后的故事和愿景,他说,「我在播客里对采访嘉宾始终秉持着善意与中性的态度,绝无任何恶意。我们坚守这一原则,我坚信,只需半年到一年的时间,当中国任何行业的精英人士或其所属机构有面向公众的表达需求时,我们都会成为首选。」

百川智能创始人、CEO 王小川为我们勾勒了一幅「AI 医生」的蓝图:AI 医生将实现对用户的全程健康陪伴,实时监测身体状况与各项健康数据,包括吸烟、饮酒习惯、用药不良反应、疾病进展及治疗效果等。这些海量健康数据,最终将推动临床医学形成全新的发展范式。

源码资本投资合伙人张宏江表示,目前机器人系统未达「GPT 时刻」,机器人领域仍处于「技术路径选择阶段」,还没有达到大模型 1.0 阶段「加算力、加数据就能走通」的明确路径,未来还有很长的发展周期。

另外,马萨诸塞大学阿默斯特分校教授淦创更是勇敢分享了他的一个大胆判断:VLA 要解决的是跨模态问题,即如何将 vision-language 领域的智能迁移到物理世界。而以视频模型为骨干的 world model 路线,解决的是跨实体问题——即如何将人类的行为模式迁移到机器人上,难度或许更低一些。

OPPO ColorOS 智慧产品研发总监姜昱辰则分别从 AI 手机的「破局点」、「AI OS 的核心驱动能力」等维度,拆解了手机行业的下一个十年。她透露,GUI Agent 是长尾场景的兜底技术手段,OPPO 更倾向于通过 Agent to Agent 实现生态互联。

除了上述几位 AI 领域的科技领袖,田渊栋 Meta  前 AI 研究总监、VAST 创始人兼 CEO 宋亚宸、Sandwich Lab  创始人兼 CEO 郭振宇、DeepWisdom 创始人兼 CEO 吴承霖 、Creaibo 创始人/百大 UP 主图灵的猫、Meta  前 AI 研究总监田渊栋、格式塔 Gestala 创始人兼 CEO 彭雷、印象笔记 COO 陆昀、能量奇点联合创始人、首席运营官叶雨明、XREAL 创始人兼 CEO 徐驰、Teeni.AI 听力熊 创始人 & CEO 袁琳、无界方舟 联合创始人小乔、硬件产品专家李创奇、Kickstarter 中国首席战略代表 Henri、Hypershell Founder & CEO 孙宽等国内最优秀的创业者,就 AI 时代新应用的探索等问题,分享了他们的观点和实践。

深剖 AI 时代的「进化论」,进程由我

为满足深度交流需求,IF 2026 特别设置 4 场「小场深谈」,聚焦个体、关系、硬件与空间四大维度:

在超级个体专场,10 位「一人公司」创业者分享「用 AI 重构个人价值」的实战经验,聚焦 AI 对个人能力的赋能与挑战,深度探讨了 AI 时代的个体进化论;

在重塑关系专场,人与 AI 的新关系,心言集团创始人任永亮、百川智能 CEO 王小川、语核科技创始人翟星吉等创业者就「AI 陪伴的边界和本质」「AI 医生的信任构建」「AI to B」等话题展开深度对话;

在硬控 AI 专场,AI 硬件的机会和「大坑」,前小米智能眼镜负责人李创奇、凯叔讲故事创始人凯叔、灵宇宙创始人顾嘉唯等创业者探讨了 AI 硬件如何融合理想与现实;

在空间智能专场,自变量机器人创始人王潜、Vbot 维他动力联合创始人赵哲伦、灵心巧手联合创始人苏洋围绕 AI 与物理空间的融合,探讨具身智能的落地场景与行业挑战。

同时,「乱翻书」主理人潘乱、《详谈》丛书作者与播客「高能量」主理人李翔、有知有行内容主编雨白、《晚点聊》主播程曼祺、十字路口创始人 koji、《AI 炼金术》主播任鑫、脑放电波主播托马斯白和 Nixon、《风口来了》主播石亚琼、Robo Pulse 主播笔盒等知名播客品牌作为「小场深谈」共创伙伴,与创业者们一起呈现了 AI 与现实碰撞的「第一现场」。

值得一提的是,今年主舞台增设的「AI 产品快闪」环节,邀请了多位「拓荒者、先行者」带着最近一个月刚刚发布或重大更新的创新产品首次亮相,分别是:知名笔记工具 flomo;基于 GEO 的 AI Agent 应用,致力于帮企业解决面向 AI 营销的 Agentic 产品 PallasAI;登顶了台湾地区摄影分类榜第一的 Doka 相机;用 AI 模型取代模特拍摄,更快、更省钱低拿到好看成片的 LavieAI;首个专注于健康生活方式的智能项链 OdyssLife;超级个体的 AI 专家团队 MuleRun,以及前网易副总裁开发的 remio 个人办公助手。

极客公园创新大会自 2010 年创办起,已成为中国科技与创新领域标志性年度峰会之一,见证并记录了中国移动互联网、智能硬件、AI 等多个时代的关键节点。

作为中国创新者的大本营,极客公园通过 IF 2026 大会再次证明其「发现创新者、连接创新者、成就创新者」的核心能力。

从技术前沿到人文思考,从产品落地到生态共建,大会不仅是观点的碰撞场,更成为「进程由我」的实践场。

正如今年主题「进程由我 On The Loop!」所传递的——未来并非被技术定义,而是由每一个主动选择的创新者共同书写。极客公园将继续「激发变量」,推动更多「非共识」成为改变世界的新力量。

OPPO 姜昱辰:从 GUI 到 Agent,AI 手机交互革命的「终局」思考

2025年12月9日 12:59

整理|汤一涛

编辑| 靖宇

 

在智能手机行业,未来的 1500 天被视为一场即将发生的「聚变」。

随着大模型技术的爆发,以豆包 AI 手机为首的 GUI Agent 手机硬件应用落地,手机不再仅仅是通讯与娱乐的载体,正加速向「AI 个人计算设备」演进。

面对这一从功能机向智能机跨越以来最大的变局,手机厂商们正处于「八仙过海」的探索期:硬件形态如何收敛?交互界面如何革新?以及最重要的问题—— 如何避免成为 AI 时代的「诺基亚」

在极客公园创新大会 2026 的活动现场,极客公园投资合伙人 Ashley 邀请到了 OPPO ColorOS 智慧产品研发总监姜昱辰。双方进行了一场深度对谈,从研发视角的转变、技术路线的抉择(GUI Agent vs 生态合作),到以「记忆」为切口的破局之道,全面剖析了 OPPO 对于 AI 手机终局的思考与实践。

关联阅读《 对话 OPPO AI 姜昱辰:手机才是 Memory 最好的土壤,AI 一定会彻底改变智能手机

嘉宾精彩 观点

  • GUI Agent 是长尾场景的兜底技术手段,OPPO 更倾向通过 Agent to Agent 实现生态互联。
  • 「记忆」是 AI 手机演进的第一刀,因为只有「记得」才能「懂你」,进而提供主动式服务
  • 构建记忆系统的核心挑战是隐私,唯一的解法是端侧计算,把数据留在手机里
  • AI OS 的本质是「主动式」与「个人化」的交互革命,未来 AI 助手将与操作系统彻底融合为一体

 

以下为姜昱辰和 Ashley 在极客公园创新大会 2026 上的对话实录,由极客公园整理:

 

01

行业格局:手机厂商的 AI 探索

 

Ashley: 你曾经是一个创业者,现在在 OPPO 负责上亿用户量级的系统级产品,这两种研发体验有何不同?

姜昱辰: 还挺不一样的。

创业公司往往处于寻找 PMF 的阶段,做的是极度创新的事,不确定用户到底有没有这个需求。通常上线的是不完善的版本,到达一定用户量之后才会做 Scaling。

成熟厂商面对的用户,对你是系统级产品的期待,没有办法接受一个半成品。这导致我们在研发过程中必须极其谨慎。我们会在上线前进行深度的用户洞察、多轮用户共创及概念验证,确保产品在面世时已具备较高的完成度。

也有一些东西是不变的,比如怎么找 PMF。不管做什么产品、面对什么样的用户、有什么样的痛点,多多少少在回答同一个问题。

Ashley :可以用一个词概括一下 2025 年手机行业在 AI 领域的尝试吗?

姜昱辰 :用一个词的话就是「八仙过海」,不知道大家最近有没有关注自己手机上的变化,不管是 OPPO 还是友商们,大家做得挺激进的。比如 YOYO 做了很多智能体执行的工作,包括点咖啡;我们在记忆这条赛道上做了很多工作。

整个手机行业现在对于终局比较明确,形成了一些共识,比如要做无处不在、非常贴心的个人超级助理。但现在行业还是非常早期的阶段,所以怎么起步,从哪切入,各家有自己的回答。

姜昱辰和 Ashely 对谈手机 AI|图片来源:极客公园

 

Ashley :有点像智能手机特别早期的阶段。手机硬件形态没有收敛,系统的解法也没有收敛,甚至很多交互的解法也留有非常多的空白和想象空间。

提到 AI 手机,不得不提到豆包和努比亚合作的手机。这个手机搭载豆包手机助手,有非常高的系统权限的 GUI Agent。

作为手机厂商的视角是怎么来看这个事情(豆包手机)的?会不会给手机行业的方向和格局带来一些变化?

姜昱辰 :首先第一个怎么看的问题。我觉得「执行」还是一个非常确定性的方向,我们也在做非常多这方面的工作。

但是归根结底,GUI Agent 只是一个技术方案,最终要回到 为解决用户什么样的需求 。比如用户希望用 OPPO 手机点外卖、点咖啡,我们能不能帮用户做到,这个就是执行。是用 GUI Agent 的方式,还是 API 的方式,用户也没有那么关心。

我们作为手机厂商在这方面也没有倾向,更多还是看到在怎样的场景当中、什么样的技术方案最合适为用户解决问题。

第二是对方向和格局有没有影响,大概是没有。这个方向大家都在探索,(豆包手机)更多是把在小范围内探索的事情,更激进地推向公众舞台,让大家看到这个东西。这个是带来比较大的影响。

Ashley:当时你们内部有考虑过这条路线(GUI Agent)吗?

姜昱辰 :当然,我们一直在做相关的探索,但 我们内部更多认为 GUI Agent 是覆盖长尾场景的兜底方案。 因为我们的诉求非常多,非常不鲁棒(robust),需要这个东西去兜底。

但更大的服务用户的方式还是 Agent to Agent。我们不是一个公司、一个产品,服务用户;我们背后是美团、高德等一系列为用户提供服务的伙伴们。我们的态度是希望通过 Agent to Agent 的方式,通过生态的方式为用户提供最高质量的服务。

手机在这方面的尝试其实牵一发而动全身,因为它本身的生态位很特殊。应用的生态、OS 的生态,包括围绕着手机近距离场景的硬件设备生态,都会发生一些变化。

 

02

AI 手机的切入点:交互革命与「记忆」

 

Ashley :刚才您也提到大家对于下一代的随身计算设备的设想,可能是手机,也可能不是手机。它能够提供的理想体验,我相信大家有一些共同的想象,在科幻小说、科幻电影当中都有很多很向未来憧憬的画面。

从你一线的实践和观察的角度来看,这件事情(下一代随身计算设备)往前演进切入的第一刀是什么?

对比在智能手机时代,那个第一刀是 iPhone 出现的时候,把电容屏和屏幕交互的方案做到可以突破临界点的交互体验交付给大家,随即而来掀起整个智能手机时代。

姜昱辰 :这是很好的问题。在消费电子行业,每一次巨大的变革都是 交互的革命 ,人们获取资讯和服务的方式发生了改变。比如从功能机到智能机,原来通过打电话定外卖,现在 APP 点外卖;原来看报纸获取新闻,现在在今日头条里刷新闻。

从智能机到所谓的 AI 机,同样还是这个逻辑。问我最重要的是什么?还是交互革命。

我们未来早上起来,手机给我个人化的简报,告诉我人工智能昨天的重要大事是什么;出门的时候弹一个高德打车,问你是否要打;中午吃饭的时候告诉你,感觉你昨天很想吃大闸蟹,刚好旁边在打折,你要不要吃大闸蟹;到月末的时候,它弹出来告诉你,我知道你很想吃大闸蟹,但是我们没钱了,你要不考虑考虑楼下那个沙县小吃。你说 OK,就把外卖点上了。

未来可能是这样的资讯和服务的获取方式。

你问我第一步是,这有点像前面的问题,各个厂商的回答不一样,都在八仙过海。

OPPO 的话,我们认为是 记忆, 记得你才能更懂你。我前面描绘的场景都需要极度了解用户。不管做执行,还是给你资讯,都要足够了解你才能真的为你提供贴心服务。这个都是建立在理解你的数据、理解你的行为、理解你这个人的基础上。所以我们 OPPO 选择先做好记忆。

Ashley :记忆这件事,大家都在做,包括模型厂商和应用层,甚至中间出现很多创业公司就专攻记忆层,可见大家多多少少也有一些共识。但同样具体的落地和解题方法还是不一样,能感觉这个事情似乎挺难的。

这件事的痛点是什么?

姜昱辰 :我们的 slogan 是记得你才更懂你。对我们来说,做记忆这件事情首先是为了懂用户,大方向上是希望做到非常懂你的个人助理。这个事情需要我们对用户的数据有理解,对你的记忆有理解。

回到做产品本身,最终要为用户解决痛点。理解你的个人当中就有很多痛点可以帮你解决。

比如用户生活当中有非常多琐碎的信息记不住,我理解你的日程就可以回答你,明天在极客公园的活动是几点。

比如你今天看到了一篇公众号的文章很感兴趣,可以一键闪记。后面就可以问我上次看的那篇文章当中的某句话怎么讲来着?它就可以告诉你。

在琐碎信息的理解和提醒这件事情上,我们已经可以为用户提供很多服务,解决用户很多痛点了。

Ashley :我感觉小布记忆是把各种应用和 APP 收藏的动作整合起来了,这是用户的主动行为。

姜昱辰 :我们在 OPPO Find X8s 上线时的第一心智定位就是「跨 APP 收藏夹」。先做好这个第一心智的价值,后续才能帮你连点成线、整理回忆、做更多洞察。

Ashley :为什么当时从这个点切入?像相册里也有很多沉淀的数据,这些数据天然是用户生活流的记录,在这里也能挖掘出用户价值。

姜昱辰 :我们从用户痛点角度思考问题。

现在我们每天通过手机接收到的信息是爆炸式的,各种各样的信息混杂在工作软件、微信等各种不一样的地方。这个问题是相册本身解决不了的。

数据不等于记忆,我们的工作是把数据处理成记忆,让你不再为琐碎、爆炸且无头绪的生活感到困扰。只需要轻轻一问就能获取到想要的所有资讯,这是我们做的第一心智。把所有的东西通过一键闪记归集到小布记忆以后,它给用户提供的第一个价值就是让你的生活更井井有条,像你的第二大脑,帮你记住和管理你各种琐碎的事项,让你有时间处理更重要的事。

 

03

记忆的深度构建与隐私挑战

 

Ashley :小布记忆目前的交互方式是用户主动发起,我告诉我的手机,它才记录。它形成的记忆关于我的画像,似乎只是断点的画像。

这个距离我们理想当中的交互方式,似乎有很长距离,这个距离怎么跨越?

姜昱辰 :我们在 OPPO Find X9 这一代也做了自动收藏、自动记账功能,但我们在这上面相对比较谨慎。我们充分告知用户,并且对于收集的每一个来源都有开关——可以选择开还是关。 做记忆这件事情最重要还是保障用户隐私,要给用户充分的知情权 ,不然这个事情是很恐怖的。

而且我们是一家手机厂商,相对在做这件事情上会更加克制。这个是我们短期的回答。

长期来说,希望构建对用户 24 小时全方位的了解,当然是在用户充分授权的基础上。

Ashley: 小布记忆最理想的状态下,它能够形成的记忆框架,可能会是什么样的状态?

姜昱辰 :用更 toC 的用语来说就是第二大脑。

拆解下来:

第一层是 数据理解, 就是对不一样的数据源有充分的理解,理解能力,理解你的照片,理解你的视频,理解闪记的文章,理解你的行为轨迹……

第二层是 连点成线, 比如今天我的手机知道我在极客公园,也看到我昨天一键闪记今天的日程,也知道我跟 AI 聊过相关的话题,它能连接起来变成一个事件。

第三层是 连线成图。 比如我认识 Ashley 也挺久的,关于你的一切东西都可以被 link 到 Ashley 这个人节点上,就变成了一张图。我和 Ashley、极客公园等等一些事情之间的关联度,在线的基础上变成图。

总体来说,就是把数据变成记忆,把记忆连成线,把线连成图。

Ashley :你估计这个时间轴大概是多长时间?

姜昱辰 :其实也挺快,1-2 年内就会有非常不一样的体验。

姜昱辰和 Ashely 对谈手机 AI|图片来源:极客公园

 

Ashley :你是技术出身, 你觉得整个把记忆这件事情做好,是纯工程层面的问题,例如我堆人堆时间、找到足够的资源就能实现;还是里面存在技术上的断点和难点需要克服?

姜昱辰 :技术上来说有蛮多挑战,最现实的是隐私问题。不管豆包手机还是很多 AI 功能、AI 厂商,大部分数据都在云侧进出,你要构建用户的 3D 画像放在云侧,隐私问题是很多用户担心的。

这个解法非常单一,只能通过端侧化解决,把你的数据和计算留在端侧。

但这样又会引发功耗的问题。比如 32B 模型现在在屏幕理解方面可以做得比较好,但 32B 模型压缩到手机上要占 16GB 的内存,这个问题怎么解决?

但我是乐观派,我觉得 2-3 年会得到非常好的解决。

还有一个是记忆系统,如何做到自动更新,甚至是遗忘。

遗忘这个事情现在大家讨论比较少。可能以前你喜欢吃辣,现在不喜欢吃辣,这都是需要更新的信息。

记忆系统如何更新、如何遗忘,这也是非常大的挑战。我们有五个词形容这个事——安全隐私、即插即拔、 主动推理、自动更新 、端云结合。这是我们认为至少手机的记忆系统应该有的 5 个特性。

 

04

未来 AI OS 的定义与架构

 

Ashley :手机毕竟还是运行在 OS 上的,包括所有为用户交付的服务也是依托于服务商的应用来存在的。 AI 手机时代的 OS 应该是什么样的?里面到底是哪些重要的素质?

姜昱辰 :这是一个很大的问题。

OS 的存在完全是基于硬件形态,在 PC 时代有 PC OS,在智能手机触屏机的时代有安卓,都是基于硬件的交互形式存在的。

如果问我 OS 的本质是什么,我觉得是交互。主动式和个人化,这是 AI OS 应该有的两个非常大的属性,

再多加一条就是高效。我今天跟它说一句话就能做到,我原来要打字打很久,点好久,现在我随便讲一句话就知道,这就是我心中 OS 的想法、形态。

其中什么是最重要的,如果让我一定选,当然是懂你,只有懂你的 AI OS 才能真正为你提供这些服务。

Ashley 你们怎么样构建整个 AI OS 的,有哪些核心的层级?

姜昱辰 :我觉得首先是硬件层。它是物理相关的,在我们手机的形态还没有改变的时候,它底层终归是芯片调度,怎么做流畅,这些调度的事应该是最底层的。

在上面可能构建的是一些系统级的能力,我们称之为端侧计算。

还有记忆引擎,就是理解你手机上你的数据,构建关于你的记忆系统这一层。

第三个是智能体框架。前面也说我们挺重视执行这个事,我们更多更倾向是通过 A2A 的方式去做,就是在手机上怎么去与其他服务商的 Agent 进行交互。

在它之上有一个懂你的超级助理的应用层的服务,我们是这样的架构。

Ashley 有没有可能在安卓之外长出一个新的开源 OS?

姜昱辰 :有可能,当年安卓长出来也是因为智能手机的普及,硬件形态导致了 OS 的出现。所以现在是一样的。

但也有不确定的地方,在于硬件形态大家都还没有完全的共识。OpenAI 更激进,它在考虑没有屏幕的硬件,那你说它是手机吗?

我们可能不那么激进,我们还是在原来的平台上去为用户服务。到最后硬件形态会收敛,有可能会有 iPhone 时刻,造成整个行业有一个共识的收敛。这个收敛以后,就会出现一个针对这个硬件形态的 OS,我相信这一定是会发生的。

Ashley 觉得未来助手和 OS 会是什么样的关系?

姜昱辰 : 1、ColorOS(OPPO 的系统)注定会变成一个真正的 AIOS;

2、小布(OPPO 的 AI 助手)是 ColorOS 的拟人化表达。

 

05

如何避免成为「诺基亚」

 

Ashley :最后一个问题稍微有点挑战,从功能机到智能机迁移的过程中,诺基亚从之前的霸主地位一落千丈。 在 AI 时代如何避免成为智能手机时代的诺基亚? 你们内部对这个问题有过深入的探讨吗?

姜昱辰 :当然,我们内部的探讨非常多次。

我相信从智能机到 AI 机是一场大变革,这是大家共识的。但这个变革会发生什么,会怎么发生?事实上大家是没谱的,现在还是行业非常早期。

你回头看上一次变革,从功能机到智能机的时候,我们也挺晚的入场。我记得当年 OPPO 功能机还备货很多,那一年瞬间智能机开始主导市场,我们的功能机滞销了,这是比较大的挑战。

那次潮流当中,大家认为诺基亚掉队了,其实诺基亚做触屏机非常早,早于我们,甚至早于苹果。他不是没有做触屏机的尝试,也不是没有在做触屏技术新的 OS、新的形态推出。

那么问题出在哪儿?

我们内部也做过深入的探讨,我们有感觉,当时诺基亚整个团队更多在关心市场份额。他已经是行业老大了,多多少少就没有用户导向了,这个可能是他们所面临的一个真正的问题。

我们看到了用户的需求,这个导向下我们也会做出快速反应,这是最核心的。用户导向,倾听用户的声音,实际解决用户的问题,响应用户和市场的诉求,这个我们相对来说还是比较有信心的。

王小川的医疗 AI 新答案:用 PAPA 打通医疗的「最后一公里」

2025年12月9日 12:56

整理|Moonshot

编辑| 靖宇

 

在开源模型全面崛起的这一年,医疗已经成为大模型比拼的主战场之一。OpenAI 抛出 HealthBench,试图建立统一评价体系,OpenEvidence 等 AI 医疗公司愈发受到资本青睐,大众对 AI 医疗的接受程度也在不断提升。

因为 医疗牵动的是人类最本质的课题:生命科学。

在现实层面,日益增长的慢病管理需求、快速老龄化带来的系统压力、平均 73 天翻倍的医学知识量、都让传统医疗模式愈发吃紧。伴随式护理、个体化治疗、实时决策支持……这是每一位患者的需求,亦是每一位医生的压力。

在 IF 2026 的舞台上,王小川不仅展示了百川智能在医疗大模型领域的底层积累,更 首次公开了其打通医疗全流程的最新解法——一套由「MAM 决策 AI」与「PAPA 陪伴 AI」构成的双轮驱动架构

如果说「MAM」(Medical Augmented Model)是坐镇院内的「外挂大脑」,依靠高可靠性的决策能力辅助医生「把病看准」;那么此次 重磅首发的产品 AI PAPA(PlayBook Animated Proactive Agent) ,则致力于在院外接手,解决「把人管好」的难题。

相比于传统 AI 被动问答的模式,PAPA 带来了一次交互范式的革新。它基于独创的 PlayBook(行业 SOP)技术 ,将晦涩的临床指南转化为可执行的动态方案。它更像一位拥有长期记忆与多模态感知能力的家庭医生,能够以月甚至年为单位,从提醒用药到动态调整健康计划,主动追踪并管理患者的康复进程。这种「MAM 主内、PAPA 主外」的协同模式,标志着百川智能真正构建起了从严肃医疗诊疗到主动健康管理的完整闭环。

王小川在 IF 2026 舞台上|图源:极客公园

 

过去一年,百川智能在医疗领域的实践,也确实走出了行业少见的「从模型到 Aengt 系统、从技术到场景」的落地路径。

从与多家三甲医院联合验证临床可靠性,到让模型真正在专家会诊中心「上岗」;从辅助医生提升诊疗能力,到帮助一个个具体的病人,补齐医生都未掌握到的信息差……百川正在做的,是把大模型变成医院能用、医生敢用、患者愿意用的工具。

因此,这篇演讲更像是关于未来医疗形态的一次深度预演:当医学知识、临床路径、真实世界的健康数据在一个平台里被激活,它就不再只是 AI,而是一个新的医疗基础设施。

以下是百川智能创始人、CEO 王小川在极客公园创新大会 2026 上,关于医疗 AI 如何从理念走向落地,在真实世界中改变每一个人的健康决策的演讲实录,由极客公园整理:

嘉宾观点:

· 如果说财务自由意味着「不缺钱」,那么生命模型的终局则意味着「生物自由」,也就是不缺健康。

· 做医疗不仅是把模型应用到垂直场景,而是在回答:AGI 是否成立、如何成立,以及如何向前推进?

· 智力模型用来「造医生」,而当数据充足、范式改变后,我们有机会真正走向生命的数学模型。

· 我们认为做 AI 医生比做无人驾驶更靠谱,更刚需。

· 医疗中「人机协同」的速度,可能会超过无人驾驶的发展。

· 医学增强大模型既要有一线的通用能力,又要在医疗领域表现更佳。

· 我们的目标是让所有人都能即时获取可靠医学知识。

· 全球平均每 73 天医学知识就翻一倍,临床与前沿之间天然存在时间差。

· 过去我们做的是「医学增强大模型」,主要聚焦于决策 AI;而今天进入「陪伴」时代,我们构建的是完整的医疗 AI 平台。

· 大多数模型做的是单次任务,而我们做的是主动性的、长期的陪伴与管理。

 

极客公园创新大会的各位朋友,大家好。

今天我想和大家分享百川智能在医疗领域的一些思考与实践。从 GPT 诞生至今已经三年,我们正处在互联网的深度变革期,也亲眼见证人工智能在生活中的全面渗透。

百川是在 2023 年 4 月成立的,那时我写了一封公开信,分为两个部分。

第一部分讲的是我的技术认知:当语言被抽象为数学后,我们的思考、学习、沟通,乃至文化,都将成为数学问题。

第二部分谈的是使命与愿景,我提到在未来 20 年,希望能在生命科学与医学的发展中,以及公众健康领域,贡献自己的力量。

因此,百川一方面拥抱 AI 技术的演进,另一方面坚定地投入医疗与医学的未来。

图源:极客公园

 

01

生命模型带来的「生物自由」

 

在我的世界观里,如今的模型体系可以分为三类:

第一类是发展最快的「智力模型」,以语言为入口,对人类智力进行数学化;

第二类是「物理模型」,从牛顿以来用公式建构物理世界的方式延续至今,逐渐进入带有量子、核聚变等复杂因素的时代;它帮助我们造工具,而不是造智力;

第三类则是「生命模型」,以 Alpha 系列为代表,用数学方式理解基因、蛋白质及生命过程的预测机制。

基于此,我们今年提出了更明确的使命:为人类造医生,为生命建模型。这两件事一横一纵: 智力模型用来「造医生」,而当数据充足、范式改变后,我们有机会真正走向生命的数学模型。

如果说财务自由意味着「不缺钱」,那么生命模型的终局则意味着「生物自由」,也就是不缺健康。

医疗是高度垂直的领域,我认为想把「医生」这件事做到极致,必须发展通用模型。

图灵曾提出:能与人类自然对话的机器就算智能。而在我看来,如果我们能造出一个像医生一样思考、判断、决策的 AI,那它在智力层面就已经达到 AGI;如果它能进一步完成手术和实际操作,则在具身层面也达到了 AGI;如果它能持续自主做科研,那它还具备了自我进化能力。

因此, 做医疗不仅是把模型应用到垂直场景,而是在回答:AGI 是否成立、如何成立,以及如何向前推进?

回到现实,行业里仍有许多质疑,例如:AI 如何学习医学认知?是否具备同理心?伦理上能否上岗?我们早期的训练范式基于医院中的高质量病例,但医学更多依赖「生理信号」,比如 CT 片和 X 光。

但医生不只是读片子,更多是用强化学习去模拟出一个病人,所以如果 AI 想像医生一样成长,就需要一个「患者模拟器」,能够在强化学习中反复对照与校验。这是整个范式的基础。

至于同理心,行业里有统计:在某些测试中,GPT 的「同理心得分」大约是 45%,并且在以后会变得更有同理心,更懂情绪。而真人医生只有 4.6%。虽然这个数字仍有争议,但至少说明:机器不是不能具备「人味」。

如今大家都在做无人驾驶,无人驾驶也跟生命高度相关,我们认为做 AI 医生比做无人驾驶更靠谱,更刚需。因为没有无人驾驶,大家依然能开车;但没有医生为你看病,你自己没有诊断能力。

无人驾驶最大的挑战叫「接管」,即机器搞不定时必须由人类接手。而医疗恰恰相反,AI 与医生可以形成天然分工,AI 做大量辅助判断,医生做最后把关。 因此医疗中「人机协同」的速度,可能会超过无人驾驶的发展。

今年以来医疗 AI 也出现了重要进展。

第一个典型案例是在今年初,患者开始带着 DeepSeek 去看病了。与过去医生不信 AI 的态度不同,现在,医生认可了 AI 在推理上的价值,甚至私下开始用 DeepSeek 和豆包查询。

第二个案例是,OpenAI 也在今年 5 月发布了 HealthBench,这是由全球 60 国、262 位医生构建的首个「临床问题」级别的评测集,为行业定下标准,也意味着 OpenAI 开始认为医疗是 AI 发展的一个重大方向。

同期,有一家诞生于 2023 年,异军突起的公司 OpenEvidence,在八月以 60 亿美金开始新一轮融资,它已经不只是帮医生做语音转写病例,而是做「辅助决策」,目前美国已有 40% 的医生注册使用。这说明全球医生正在拥抱 AI,顶级公司也把医疗视为战略方向。

医疗相关话题的人工智能搜索量,也在今年爆发性增长。在 DeepSeek 和豆包上,约 20% 的检索已经和健康相关,百度此前这一比例是 10%。

 

02

医疗增强大模型该怎么做

 

在我们的路线图里,AI 首先要帮助我们「造出一个医生」:它能替代或承担那些医生做不到、或者不愿去做的工作。

更重要的还有两个愿景:其一是「改路径」,这在明年就有可能开始显现,即让医疗行为不再仅仅限定在医院内部。很多人觉得医院体系难以改造,我也认同这点,所以我们的设想是,AI 的应用场景除了在医院做辅助判断之外,还能够大量下沉到居家和院外场景。

其二是一旦 AI 医生能够上岗,它就能长期陪伴个体,持续监测你的健康数据。从抽烟、喝酒到药物反应、疾病进展,在关键数据出现时,推动临床实践产生新的范式,不再把医学仅视为离散的点状决策,而是形成连续的、可学习的临床循环。

实现这一目标的第一步,是让 AI 在决策上做到优于甚至超越人类医生,成为医生的「外挂大脑」。

医学增强大模型既要有一线的通用能力,又要在医疗领域表现更佳。

我们常把知识分为文、理、医、工、艺五大类:文科以语言为主、理科以数学为主、工科以代码为主、艺科以图像与视频为主,那么医学的训练范式到底应该是什么?

目前的核心任务可以归为三件事:第一,如何做出更精准、更接近临床思维的医学推理——这是诊断与决策的核心,我们已经引入临床医生参与验证与闭环;

第二,如何确保安全可信。模型会出现「幻觉」,我们要大幅降低幻觉率,并让模型具备「知其所不知」的能力;

第三,如何实现循证决策。医生不能单凭经验行医,必须依托循证医学,把零散的论文、指南、荟萃分析等证据进行规范化、统计化和等级化处理。

为此,我们一方面用大量高质量医学文献训练模型,另一方面构建「患者模拟器」用于强化学习的闭环验证,文献与模拟患者两者并重,构成训练体系的基础。

参考培养人类医生的路径去训练大模型|图源:极客公园

 

在这一系列范式下,我们从去年 8 月与儿童医院合作开始,到今年 1 月发布 M1 模型,AI 医生已经在北京儿童医院专家会诊中心「上岗」,成为国内甚至全球第一个真正「上岗」的 AI 医生。

随着团队专注度的提升,今年 8 月,我们正式推出了 M2 模型。彼时正值 OpenAI 宣布其开源模型在医疗领域「全球第一」。一周后,M2 在 OpenAI 自己提出的 HealthBench 测试中,开源模型里排名第一,闭源模型里只落在 GPT-5 之后。

OpenAI 曾强调全球只有它的模型在 HealthBench-Hard 模式下超过 32 分,而我们成为唯一同样跨过 32 分线的第二家引擎。

10 月,我们进一步发布 M2 Plus,让模型在六源循证的数据总结和论文学习方面有更强表现。整体幻觉率只有 DeepSeek 的三分之一,在医学知识运用上也全面追平甚至超越了 DeepSeek、GPT,以及美国的 OpenEvidence 引擎。

基于这套底层引擎,我们在 10 月同步推出了新版「百小应」, 目标是让所有人都能即时获取可靠 的 医学知识。 现阶段我们优先开放给医生,希望医生成为第一批深度使用者,因为他们更有能力判断信息、反哺模型。

举个简单例子:今天在小红书搜索「维生素 D 是否能治疗癌症」,各种模糊、夸大的结论铺天盖地。但与百小应对话,它能在数秒内基于可靠证据链给出结论:补充维生素 D 能降低癌症风险尚无明确临床共识,现有证据显示其效果有限且存在争议,并能进一步附上对应的顶尖论文。其他模型常常给不出明确答案,给出的只是一些「似是而非」的模糊判断。

如今从「百度看病」流行到「小红书看病」|图源:极客公园

 

模型上线以来,不仅有医生在用,甚至有高认知的患者也在用。我们注意到一位用户单轮对话超过 300 次,主动联系后得知他是北京的朱先生,58 岁,之前做过医疗创业,有很强的医学背景,5 年前因甲状腺癌做过手术。

他向我们展示的第一句话很震撼:他感谢百小应告诉他「优甲乐需要减量」,这是指南里写得很清楚、但某三甲医院的医生却没有提醒的关键信息。因为没有按指南减量,他多年深受甲减亚健康困扰,在体重、睡眠各方面都出现了问题。随后他带着模型生成的资料回到三甲医院与医生沟通,对方才意识到 2022 年指南已更新。

这是一个非常典型的「医学知识更新速度远超临床实践」的现实案例。 全球平均每 73 天医学知识就翻一倍,临床与前沿之间天然存在时间差。

在这些实践的推动下,我们开始构建「陪伴 AI」。

 

03

PAPA: 主动陪伴患者的医疗 Agent 平台

 

创业之初我们想做院外医疗,如今我们把它定义为 决策 AI + 陪伴 AI 的双系统结构。其中陪伴 AI 的核心能力是主动:它不再只是「有问才有答」,而是能提问、分解问题、规划健康路径,从被动回答进化为长期健康管理代理(Proactive Agent)。

我们现在能做到让模型主动规划和关心你的健康,包括医嘱服从,提醒你什么时候该吃药、就诊。当你说身体不适,它会建议你去体检,并在下周主动追问你是否完成;当你吃了布洛芬,它会在两小时后询问退烧情况并追踪病程;甚至接入可穿戴设备后,它能根据生理指标异常主动介入做干预。

百川智能想做更主动的 AI 医生|图源:极客公园

 

这件事情说起来简单,做起来很复杂。

以孕产期糖尿病为例,我们已经让 AI 系统根据指南完成全程健康规划:胰岛素调节、饮食管理、产检计划等均可自动执行,实现真正意义上的「主动健康」。

我们现在的底层架构,是一个多任务调度系统。此前我们构建了一套 PlayBook 专家范式,实现了医学知识生产的「产业分离」。

产品经理和医学专家可以共同撰写管理规范,包括临床路径、决策方式、沟通方式,以及中间记忆的设计。针对不同疾病与专科,例如孕产、肿瘤、全科、儿科等,各类指南都可以写入 PlayBook。

系统会根据这些内容自动外显成一名「专科医生」。我们把这种具象化能力称为 PlayBook Animated: 当你给它一本操作手册或战术手册,它就会「活过来」,变成一个会思考、会对话、能记忆的医生。 同时,它还能接入个人的长期健康数据,包括内置的个人档案以及来自可穿戴设备的生理信息。

这也标志着我们范式的重大变化:过去我们做的是「医学增强大模型」,主要聚焦于决策的 AI;而今天进入「陪伴」时代,我们构建的是完整的医疗 AI 平台。 PlayBook Animated Proactive Agent(PAPA)就是基于这个理念打造的。

当增强模型与 PAPA 平台结合,我们认为是一种「双剑合体」:一个负责「训模练内力」,一个负责「招式与实战」。两者结合,我们在医学领域才能真正向前推进一大步。

与当前市场上的模型相比,PAPA 最大的不同是: 大多数模型做的是单次任务,而我们做的是主动性的、长期的陪伴与管理。 它不是靠一套 prompt 运行,而是根据多个专业 PlayBook 生成多种范式,支持以「月」为单位、甚至以「年」为单位地持续工作,主动进行干预,同时在背后保留完整的个人健康档案与长期多模态数据。

PAPA 更像一个医疗操作系统:在应用层把 PlayBook 转码成长期规划与解释执行能力;在能力层运行疾病预测模型、工具调用系统;在数据层存储聊天记录、时间序列数据库,并连接外部环境。同时它还具备自我调试与开发环境:当出现 bug 时,系统能够自动分析并迭代自己的执行方式。

当你提出一个问题时,系统会自动根据 PlayBook 触发整套流程:判断、搜索、聚合、输出;你继续追问,它会继续调用 PlayBook、选择技能、给出解释。无论是流行病相关药品查询,还是证据链核验,它都会生成结果并进行安全校验,校验不通过会自动回滚,确保输出是可信的。

扫码体验 PAPA Playground|图源:极客公园

 

系统不仅支持文字,也支持语音、图像、地理位置等多模态交互。比如我们演示的试剂盒检测,PAPA 会自动要求你做两次测试;背后我们有独立的多模态模型识别红线,并达到极高精度。这是现有专业模型和通用模型普遍难以做到的深度多模态处理能力。

服药之后,系统会生成后续规划、任务提醒,更新健康档案,再过一段时间提醒你复测,并解释数值变化。包括像「中午记得吃药」这样的提醒,它都会自动触发并执行。

如果有医学行业的朋友希望开发自己的 PlayBook,系统内也提供了合作方式,可以一起把这套体系打磨得更专业。除了 PAPA 平台,我们也开放底层引擎 API,欢迎大家使用我们的「百小应」。

今天就介绍到这里,谢谢大家。

❌
❌