普通视图

发现新文章，点击刷新页面。

今天 — 2025年12月14日极客公园

极客公园
摩尔线程回应「75亿理财」：符合公司股东利益；OpenAI卖「周边」，上线秒空；宇树发「机器人App Store」
2025年12月14日 08:27

摩尔线程回应「75亿理财」：符合公司股东利益；OpenAI卖「周边」，上线秒空；宇树发「机器人App Store」

极客公园

2025年12月14日 08:27

摩尔线程回应「拟用 75 亿元闲置募资现金理财」：符合公司及全体股东利益

12 月 12 日晚间，摩尔线程智能科技（北京）股份有限公司发布公告，计划使用不超过 75 亿元的部分闲置募集资金进行现金管理。

作为「国产 GPU 第一股」在科创板上市的摩尔线程，扣除发行费用后，首次公开发行人民币普通股实际募集资金净额 75.76 亿元。这意味着，此次摩尔线程拟用于现金管理的资金，最高额度占到了上市募集资金净额的 99%。

在未扣除发行费用时，摩尔线程首次公开发行人民币普通股募集资金总额为 80 亿元。这笔资金原本规划分配至 3 个研发项目，并用于补充流动资金。

然而目前，原本拟投入研发项目和补充流动资金的募集资金，大部分被摩尔线程认定为闲置募集资金，且其中多数可能被用于现金管理。

公告发布后，迅速引发外界热议，舆论集中在「摩尔线程拟用不超 75 亿元买理财」这一话题上。

对此，摩尔线程相关负责人表示，「公司前期明确披露了募集资金的项目计划，所募 75 亿资金有分阶段、明确的研发、技术升级等一系列使用安排，也将严格按照既定募投项目计划的推进。项目实施周期为三年，资金支出将根据项目进度分阶段拨付。因为项目是分阶段投入，当前公司拟对部分尚未暂时闲置的募集资金进行现金管理，以合理提高资金收益，符合公司及全体股东的利益。」（来源：快科技）

宇树首发人形机器人 App Store：复杂动作直接下载，对优秀开发者提供奖励

宇树科技昨日发布视频，宣布首发人形机器人「App Store」。用户可以将训练好的舞蹈、武术、干活等模型一键上传分享，也可以下载其他开发者开发的动作部署到机器人。

同时，宇树还表示「欢迎全球用户和开发者，一起共同开发和分享。对于优秀开发者，会有奖励。」

根据宇树科技官方介绍，其 App Store 内包含用户广场、动作库等内容，用户可以在其中自行下载各项动作和预设，一键 get 复杂操作。

宇树科技表示，未来随着官方的开发，以及其他开发者、用户的分享，将会建立一个庞大的数据库，普通用户可以体验到的内容也能越来越丰富。而且通过移动端 App 就能操作安装，非常便捷。（来源：IT 之家）

甲骨文退出自研 AI 芯片赛道，董事长埃里森阐述背后原因

科技媒体 CRN 于 12 月 11 日发布博文，报道称甲骨文（Oracle）董事长拉里・埃里森（Larry Ellison）宣布，公司已出售其持有的芯片设计公司 Ampere Computing 的股份，并从中获利约 27 亿美元（现汇率约合 190.73 亿元人民币）（税前）。

日本投资巨头软银集团（SoftBank Group）于上月斥资 65 亿美元全现金收购了芯片设计公司 Ampere Computing。作为 Ampere 的早期支持者，Oracle 在此次交易中出售了其持有的约 29% 股份，并因此获得了约 27 亿美元的税前收益。

这笔交易不仅让软银在 AI 基础设施领域（如美国的 Stargate 项目）获得了关键筹码，也标志着 Oracle 正式结束了其在通用服务器芯片设计领域的直接投资。

在财报电话会议上，埃里森阐述了出售理由。他明确表示，公司不再认为在云数据中心设计、制造和使用自研芯片具有战略价值。

作为替代，Oracle 承诺实施「芯片中立」（Chip Neutrality）政策。Ellison 强调，为了在未来几年应对 AI 技术的剧烈变化，Oracle 必须保持敏捷，虽然公司将继续大规模采购英伟达的 GPU，但也需要具备部署客户所需的任何类型芯片的能力，而不是被绑定在自研架构上。（来源：IT 之家）

马斯克 xAI 与萨尔瓦多政府达成合作，Grok 未来两年进入 5000 余所公立学校

当地时间 12 月 10 日，马斯克旗下 xAI 宣布与萨尔瓦多政府达成合作，将在全国范围内推广聊天机器人 Grok，覆盖 100 多万名学生。根据规划，未来两年 Grok 将进入 5000 多所公立学校，成为 AI 教育项目的重要组成部分。

据英国《卫报》报道，萨尔瓦多总统纳伊布・布克尔选择让 Grok 参与全国课堂课程设计。这名总统以积极推动技术应用著称，不仅推动比特币成为法定货币，也率先将 X 作为政治沟通平台。他更是表示，「萨尔瓦多不是等待未来发生，而是主动创造未来。这项合作将带来超乎寻常的成果。」

据悉，xAI 并非首个进入公立学校体系的 AI 企业。OpenAI 已在今年 2 月与爱沙尼亚合作，为全国中学师生提供定制版 ChatGPT。另外，哥伦比亚农村学生自 2023 年开始使用 Meta 公司的 AI 聊天机器人，结果一年后，当地教师却将成绩下滑和挂科归因于这项技术。（来源：IT 之家）

特斯拉 Model S 被发现搭载激光雷达测试，有望加入 Robotaxi 车队

近日在加州，有目击者发现特斯拉 Model S 车型搭载激光雷达（LiDAR）设备正在进行验证测试。

目前，特斯拉将其 Model Y 用于 Robotaxi 自动驾驶出租车车队。Model Y 尺寸适中，是特斯拉产品线中最畅销的车型，适用于多种应用场景。

然而，测试似乎已扩展至特斯拉旗下一款高端旗舰车型。目击到的 Model S 车辆配备了此前仅见于 Model Y 的全套验证测试设备。尽管此前已多次在美国各地发现 Robotaxi 测试「骡车」（mules），但 Model S 的加入尚属首次。

特斯拉选择少量 Model S 参与测试显然有其深意，这或许暗示着，特斯拉未来可能在其 Robotaxi 平台中引入更高端、更豪华的车型。不妨参考现有出行平台的做法：Uber 有 Uber Black，Lyft 也有 Lyft Black，这些服务通过豪华车型搭配更个性化的出行体验，从而收取更高费用。

特斯拉很可能正在试水这一细分市场，并考虑将 Model S 纳入其网约车车队。（来源：IT 之家）

Anthropic 首席科学家卡普兰：AI 可能会在「失控」中不断增强，最终反过来支配人类

据外媒 Futurism 报道，Anthropic 首席科学家贾里德・卡普兰警告，人类正站在一个与 AI 相关的重大分岔口。

卡普兰认为，决定权暂时仍在人类手中，但窗口期正在迅速缩小。他在接受《卫报》采访时表示，最迟到 2030 年，甚至可能在 2027 年，人类就必须决定是否让 AI 模型完全自行训练，并承担由此带来的「终极风险」。一旦触发所谓的「智能爆炸」，AI 可能进化为通用人工智能，在科学和医学等领域为人类带来巨大收益，也可能在失控中不断增强，最终反过来支配人类。

卡普兰直言，这是一条充满不确定性的道路，人类并不知道终点在哪里。（来源：IT 之家）

国家出手管控卖车标价与交付时间！比亚迪、北汽率先响应

12 月 13 日消息，近日，国家市场监督管理总局就《汽车行业价格行为合规指南（征求意见稿）》（下称「意见稿」）公开征求意见，提出两大核心要求：明码标价规则、交付时间明确告知。

此外，还提到价格欺诈禁止、促销行为规范、服务收费规范、「付费解锁」功能规定以及汽车生产企业价格行为规范。

《意见稿》发布后，北汽、比亚迪率先响应。

北汽表示：北汽集团作为国有汽车骨干企业，对此表示坚决支持并积极响应。

比亚迪汽车表示：比亚迪坚持长期主义，我们将以《指南》为指引，持续优化自身的价格管理和合规体系建设。（来源：快科技）

国产 3A《影之刃零》定档 2026 年 9 月 9 日，游戏制作人梁其伟发文致谢

12 月 13 日消息，国产单机 3A 游戏《影之刃零》在 TGA 2025 颁奖典礼上公布了最新宣传视频，同时宣布将于 2026 年 9 月 9 日发售。对此，该游戏的制作人梁其伟发文致谢。

梁其伟透露，TGA 颁奖典礼结束后，《影之刃零》团队收获了许多同行祝贺和祝福。这只是一个开始，中国游戏一定会更好，一定会变成每年都有大作在全场引起沸腾。中国市场是世界上最大的游戏市场，而中国也必将产生与市场规模匹配的创作规模。

梁其伟在表示感谢的同时，回顾游戏过往的预告片与实机试玩经历，强调游戏还是要以完整扎实的体验呈现给玩家最为重要，后续游戏团队将聚焦数值循环、剧情悬念等细节打磨，推进研发。

文中还透露了游戏的主角魂与女主角沐小葵，均启用了全新的写实脸模，片中婴儿造型由三位小朋友联袂演出。而面对玩家们对游戏剧情的种种猜想，梁其伟表示很喜欢其中关于「时空旅行」「无限循环」的猜测。

他最后表示，事实上，定档对我们来说也是一段最艰难的旅途的开始。行百里者半九十，我们希望在最后的几个月中，能够交上一份不令大家失望的答卷。我已经预想到接下来的内容制作，打磨和优化方面的艰苦工作，我们团队会把这趟旅途奋力走到终点。（来源：IT 之家）

机器学习团队打造出全球最大的三维建筑地图

德国科研团队近日发布了名为「GlobalBuildingAtlas（全球建筑图谱）」的全新数据集，构建出迄今为止最为详尽的全球三维建筑地图，覆盖了地球表面约 97% 的建筑物，总量超过 27.5 亿栋，以细小的三维多边形形式呈现人类建成环境的空间分布。

该成果被视为在城市规划、气候研究以及人类发展监测等领域的一项重要基础设施，有望长期用于追踪全球城市化进程与居住条件变化。

这一项目由慕尼黑工业大学的朱晓香（Xiaoxiang Zhu）领衔的团队开展，依托高分辨率卫星影像、深度学习算法以及用于推算建筑高度的激光扫描技术构建数据集。

研究人员首先选取了来自欧洲、北美和大洋洲 168 座城市的资料作为参考，对算法进行训练，随后向系统输入约 80 万张拍摄于 2019 年的卫星图像，要求模型自动预测每一栋建筑的高度、体积与占地面积。GlobalBuildingAtlas 的空间分辨率达到 3 米×3 米，并被设计为可定期更新，从而形成一个动态演进的全球建筑数据库。（来源：cnBeta）

OpenAI 开始「卖周边」：帽子、T 恤、Sora 主题收藏卡……

OpenAI 成立 10 周年之际，ChatGPT 正式「走进现实世界」，一系列实体周边商品正式上线。

12 月 12 日，OpenAI 在 X 平台宣布「OpenAI Supply Co.」商店正式开张。该商店原本类似内部员工专区，需要公司邮箱登录，多数商品也是早期设计存档。目前，已有部分商品向普通用户开放购买。

该网站在 2024 年 7 月仍标注为「即将上线」状态，而此次是首次面向员工以外的用户开门迎客。消息一出，OpenAI 粉丝迅速涌入，OpenAI 宣告所有产品已经售罄。

据悉，整个商店的核心主题围绕 AGI 展开。目前，AGI 正被视为 AI 终极目标的里程碑，是多家公司激烈争夺的心头好。（来源：IT 之家）

昨天以前极客公园

深聊豆包手机：该关注这场「技术核试验」的什么？

极客公园

2025年12月12日 17:34

最近，字节跳动和中兴努比亚合作的「豆包手机」成了科技圈最热、最出圈的话题，甚至引发了社会层面的热议。一时间，关于「封杀」、「反制」的讨论甚嚣尘上。大家都在吃瓜，看大厂之间的攻防战。

如果我们把目光只停留在「谁封了谁」这种问题，就会错过重点。真正的重点，应该是如何看清和手机做了深度整合的豆包手机助手的技术创新到底是什么？以及就算字节这次看似只是扔了个「小炮仗」，但它可能引发的「蝴蝶效应」该如何推导？

以下是我的一些信息梳理和推理思考，和大家一起探讨。

01 热闹之下，真刀真枪的技术如何？

我们不妨先放下巨头冲突的喧嚣，先从技术的视角，拆解一下「豆包手机」的技术，看看它只是简单的「外挂」，还是真正的系统级创新？

通过手机圈内的专家（@ZEALER @ 老戴Donald）对数据的抓包和系统日志的观测，可以发现豆包的技术实现路径，非常「硬核」，绝对是目前看到的第一个具有强泛化能力的 GUI Agent（图形用户界面智能体）。

豆包手机有一个「独立的大脑」。从内存占用上观测，其 Native 堆（大概率是 C 或 C++ 语言编写，直接运行在 CPU 上，跑在安卓虚拟机之外）大小达到了 160MB，这部分是直接连 CPU 的；而跑在安卓虚拟机上的 Java 堆（Dalvik）只有 6MB。这意味着豆包手机里推测是有一个本地推理框架，拥有极高的系统权限和执行效率。它不是一个简单的 APP 外壳，而是把 AI 模型的一部分能力直接埋进了系统底层。

同时，从进程占用和数据包的角度推测，豆包手机拥有一双「独立的眼睛」。它读取屏幕的方式，拿的是非常底层的 GPU 的渲染缓冲区，而不是传统的截屏路径。可以理解为手机里实际上运行着一块虚拟的专属 AI 屏幕，这块屏幕分辨率和人眼看到的一样，锁定 60 帧，亮度为零的无头屏幕（人眼不可见），永远处于「解锁」和「受信任」状态。更重要的是，这块虚拟屏幕和人看的物理屏幕焦点可以分离，不需要抢你的操控，也不需要一直占着你的屏幕。也就是说，你可以在手机上刷着短视频，而 AI 可以在后台的那块虚拟屏幕上帮你去订票、去比价。实现人机互不干扰，真正的「双核」操作。

再看豆包手机是怎么「动手」的？它没有走常规的安卓无障碍路径，而是直接向虚拟屏幕注入事件。这是一种系统级的特权，只有和手机厂商深度合作才能做到。这也是为什么字节必须找中兴合作，因为只有拿到系统底层的权限，才能突破安卓的围墙。

豆包手机是真正的「云端协同」。圈内技术大神通过日志分析，看到当豆包手机助手要做自动化操作的时候，大概每 3 到 5 秒会向云端发送约 250k 的数据包（推理是单帧的 AI 专属屏幕的截图），然后获得 1k 左右的反馈指令。这说明手机在做操作时，是云端的大模型大脑在实时看着屏幕，进行推理，然后下达指令，例如：打开应用、点击屏幕、输入文本、滑动屏幕、等待、记笔记、停止。

从技术层面看，这绝对是业界第一个具有强泛化能力的 GUI Agent。 这种泛化能力之高，能把系统底层权限和云端大模型结合得这么顺滑，不得不说，字节的技术工程能力确实值得点赞。

02 不是「偷袭珍珠港」，而是一次「核试验」

技术看完了，再看意图。

这两天，微信封禁、阿里设限、银行风控，满城风雨。很多人问我：字节这是要向所有大厂宣战吗？这是要「偷袭珍珠港」吗？

我的判断是：不是。

首先，从个人渠道了解到的豆包手机的备货量，以及豆包内部「不知道能活几天」的心理预期来看，他们自己心里很清楚，这更像是一次技术实验和试探，而不是为了立刻大批量出货去席卷市场。

这更像是一次「核试验」。

我猜测字节没有想靠这一款工程机就颠覆巨头的生态，这更多是一次技术实验和边界试探。他们想验证的是：当 AI 真正拥有了系统级权限，真正接管了 GUI，用户体验能做到什么突破？

但坦率地说，这次试验在战术执行上，显得有些像个「新兵蛋子」。行动上有些粗糙了，甚至浪费了一个很好的契机。

这本该是一次珍贵的「核试验」，目的是为了测试技术边界、收集用户反馈。要达成这个目标，就得让它「活」得久一点，反馈拿得足一点。

任何变革的核心问题，都是「谁是敌人？谁是朋友？」。而且大部分时候用户不是朋友，是上帝。即便是为了用户好，用户发现这个手机影响了自己的日常应用的使用，肯定是不行的。

所以这个实验最好的方式就是不要上来就引来尖锐矛盾。不是「直捣黄龙」几乎一下子就把所有的平台方都惊成了敌人，也堵了自己实验的路线。

具体点说，比如一上来如果没有开启操控微信、操控淘宝等大平台的能力（实际上就是目前沟通调整后的状态），这个实验可以低调一点，进行得会更有意义一些。毕竟类似 RPA 型（机器人流程自动化）的工具确实与大部分 APP 的用户协议冲突，如果对方一点不包容地封掉，于情于理都不是问题。而今天这些具有「履约能力」的大平台既不可替代，也没道理把大门敞开给豆包。

所以如果复盘这次行动：技术上很创新，战略上很对头，但在行动上有优化空间。

当然，大多数时候贫穷限制了我们的想象。不管是这次手机出货因此受到影响，或者这场试验即便有浪费，可能对字节也不是问题。资源足够充沛的时候，战术上的细腻是次要的。

03 价值漂移：从「应用内闭环」到「直连物理世界」

核心的问题是，豆包手机这个「技术核试验」，响过之后，会留下什么？

我认为，要看到未来商业生态格局中一种「价值漂移」的可能性。

在这场「价值漂移」中，最核心的问题依然是那个：谁会是 Agent 的朋友？谁是它的敌人？

如果只站在今天移动互联网的存量格局里，不得不承认，会是「敌多友少」的局面。

现有的互联网平台，无论是阿里、腾讯还是美团，它们的商业模式建立在「需求和供给的集结」之上。它们把离散的需求和供给集结在平台上，通过分发流量、广告推荐来获利。它们在意 DAU，在意用户习惯和时长，在意自己的生态闭环。

而 AI Agent 的逻辑会是「直连」。

当 Agent 把那些大平台变成「货架」和「履约执行者」，用户不需要再自己打开 APP，不再贡献活跃度，不再看广告，只把需求交给 Agent 去后台下单——这对平台来说，就是一种「降维打击」。只要平台还在意自身的生态闭环，它们注定会视 Agent 为敌人。

当然我们不能上来就想终局，要看到即便这种变化不可阻挡，这种变化会先从局部分流开始，还不会一下子带来颠覆。就算是 Agent 时代，现有的 APP 也不一定立即会失去自身的价值。例如有些需求是需要「逛」的，比如买服饰、看视频，现有的应用和平台依旧存在价值。

同时，GUI Agent 的技术不会只有豆包具备，相信各家都有在探索和推进。智谱最近就开源了类似的技术，加上字节的这次演示，GUI Agent 正在成为一种行业标配。 接下来，也许所有的大厂都会被迫卷入这场追赶，相信淘宝会有自己的 Agent，微信也会有。大家最终可能都会在自己的 APP 里内置一个「超级助理」，也都会被迫进化，被迫去适应这个「机器能操控能下单」的新世界。

当我们不武断地从「这是一场立即马上的革命」和「这是根本搞不成的闹剧」的二元思维中跳出来，我们才会看到一些「灰度」的价值。因为现有的移动互联网的商业世界虽然严密，但不是没有缝隙，不是没有变化的可能。

大家可以想象一个场景：你家孩子的遥控车遥控器没电了，你需要新的电池了。以前「省钱至上」的你，路径是：研究下这是几号电池，打开（可能不止一个）电商 APP -> 搜索 -> 比价 -> 下单。

未来，如果你的手机里有一个足够信任的 Agent，你可能只是手机拍了下电池发给豆包，随口说一句：「这个电池没电了，帮我买点。」

这时候，Agent 可能不需要再去逛淘宝、京东、拼多多了。如果像南孚这样的电池厂商，直接在官网上开放了专门为 Agent 准备的数据接口，你的 Agent 就可以直接连到厂商，下单、支付，通过现有的物流体系发货。而且这电池未必会比平台买的贵。

所以 Agent 有可能直连物质世界，抹平中间商，让需求端（用户）直连供给端（工厂/品牌）。

对于这些拥有好产品、好服务，但不擅长搞流量、不想被平台「收租」的品牌和厂商来说，Agent 就是朋友。它们不在意用户是否逛了商场，它们只在意自己的商品是否卖出去了。那么，这个世界上就出现了很多豆包手机的朋友。

这就是我说的「价值漂移」。

未来，Agent 可能会成为新的入口、打开新的通道。如果现有平台不合作，不愿意开放数据，那么 Agent 可能会连接更小的垂类平台，甚至可能会跳过平台，直接连接那些愿意开放的垂直厂商、品牌官网。变革未必不能从微小但有意义的地方开始。

当然，这还是一个很远的推演。眼下，豆包手机还需要解决很多问题——安全问题、隐私问题需要重点应对，与各方的谈判协商也还要持续进行。

我们作为吃瓜群众，不要因为现在的混乱就否定了这个方向。我们可能正在目睹一个新的「人机交互」时代的萌芽。毕竟原来的那套「APP 孤岛」的移动互联网玩法，在 AI 时代也应该要变一变了。

所以，不管是大厂还是创业者，或者是商家，每一个商业世界的玩家都得思考一下：当 AI Agent 推动商业生态价值漂移，我在哪里？

测测任永亮：为什么一家泛心理公司，要造个「有身体」的机器人？

极客公园

2025年12月12日 13:32

整理｜连冉

编辑｜靖宇

在这个狂飙猛进的 AI 时代，任永亮的视角显得独特且柔软。

作为中国最大的泛心理在线社区「测测」的掌舵人，他在 IF 2026 的舞台上，从一个 INTP 的压力与自省出发，剖析了技术如何回应人类最隐秘的渴望——被看见、被接纳、被爱。

对于 5000 万用户而言，测测或许是「恋爱脑必备 APP」，也可能是失恋时的精神支柱；但在任永亮眼中，这更像是一个在人生旷野中指引方向的古老指南针。

面对通用大模型的强势崛起，任永亮坦诚地分享了从「激进的技术信仰」到「焦虑恐惧」，再到如今「坦然笃定」的心路历程。他意识到，垂直领域 AI 公司的生存空间，在于「类人」能力的温度。

在此次大会上，任永亮不仅展示了最新的陪伴智能体「陪伴小星」，更首次阐述了测测向「具身智能」进军的终极逻辑——打造拥有「共感体」能力的机器人。

为何一家泛心理公司要做机器人？任永亮给出了答案，是为了「无条件的积极关注」。他认为，纯粹的线上智能体如同异地恋的朋友，看得见摸不着；而传统的工业机器人只会打拳击、拧螺丝。

测测想做的，是给大模型装上身体和同理心，让它成为一位「爱的使者」。它不是为了替代父母或伴侣，而是为了在原子化社会的缝隙中，提供一种可触碰的、高质量的情感在场。

这是一位理工男跨越 13 年的自我重构，也是对科技尽头的一次深情定义：当机器开始理解「爱」，或许我们才能更好地理解「人」。

以下是心言集团（测测）创始人兼 CEO 任永亮在极客公园创新大会 2026 上，关于测测到底是什么，关于心理 AI 如何从「在线陪伴」走向「具身智能」，并在技术洪流中重构人类情感连接的演讲实录，由极客公园整理。

嘉宾观点：

· 测测就像是一个古老的指南针，它可能不一定永远精准，但它能在你孤独的旷野中给你一个方向，给你积极的反馈。

· 心理服务最大的价值不是给你答案。无论是咨询师还是 AI，其核心价值不在于专业水平的高低，而在于有没有能力构建一段信任的、良好的关系。

· 真爱是「无条件的积极关注」。这是人类底层的情感操作系统，也是我们做垂直领域陪伴智能体所追求的终极价值。

· 对于垂直领域的 AI 公司，没必要去跟通用大模型比拼底座能力。我们要比拼的是「类人」的能力、感性的能力，这才是泛心理公司的生存空间。

· 智能加上具身，有可能危害人类；只有加上同理心，才能服务人类。我们追求的是「共感体」技术，让 AI 真正具备关爱人类的能力。

· 人与 AI 最大的不同，在于人天然就是一个「品牌」。在图灵测试中，知道对方「是人」这个信息本身，就已经决定了最终的信任分值。

· 技术让「自我」变得空前强大，但也让我们对「他人」的关注越来越少。我们需要陪伴机器人，是为了在减少无效社交的同时，帮我们更清楚地思考「我是谁」，从而建立更深度的连接。

任永亮在 IF 2026 舞台上｜图源：极客公园

任永亮：大家下午好，今天这个大场面，对于一个 INTP 来说压力有点大。我给大家分享一下我通过做测测的过程，对于情绪价值的一些理解。

01

测测是什么：从「恋爱脑神器」

到人生旷野的指南针

测测是什么？

现场很多观众都举手表示用过测测｜图片来源：极客公园

我们官方的定义是：中国最大的泛心理在线社区。但我发现，在小红书的 AMA（Ask Me Anything）活动中，用户给出了更有趣的定义：有人说它是「恋爱脑必备 APP」，有人说是失恋时的精神支柱，还有人说这是「最不愿意让男朋友看到的 APP」——因为她所有的暧昧对象都在这上面测过匹配度。

除去这些标签，测测内部拥有丰富的工具、各类智能体以及两万多名咨询师。

但我认为，它最重要的本质，是一个帮助每个人构建内在秩序感的工具。其他所有功能都只是途径，而非最终目的。

为什么中国有 5000 多万用户选择用测测解决情感问题？

我想从心理学角度分享一下。心理学家埃里克森认为，人至少会经历两次出生：第一次是生命体的诞生，脱离母体；第二次是社会性的诞生，即「社会自我」的建立。与其他动物不同，小马生下来就会奔跑，而人需要经历漫长的社会化过程才能真正成熟。

我们有个同事的飞书签名是：「人生是旷野，而非轨道」。每个人进入社会的过程，就是步入旷野的过程。在旷野中，我们不断寻找方向。

测测就像一个古老的指南针，它未必永远精准，但它能给你一个方向、一个积极的反馈，让你在孤独的旷野中找到属于自己的路。

02

理工男的自我重构与 AI 焦虑曲线

我的创业历程，恰恰印证了测测对用户的意义。

刚上大学时，我从县城来到首都，面临学习模式的切换，更经历了从「学霸」到「学弱」的落差。这对一个刚步入社会的年轻人来说是巨大的冲击，这种迷茫与我们用户的感受是一致的。

很多人感叹，虽然大学过得苦，但人生的高光时刻仿佛停留在考上大学的那一刻，往后便是面临社会的「毒打」、评价体系的巨变以及各种冲突。

我创业，本质上是为了解决「我到底是谁」的问题。大学时期，我原本的自我认知破碎了，我需要一步步重建自我：

• 2011 年，我开始创业；

• 2013 年，我们将产品定位为工具；

• 2016 年，转型为平台；

• 2017 年，引入咨询师并开始涉足 AI；

• 2019 年，推出对话式 AI；

• 2023 年，全面接入大模型；

• 如今，我们进入了更广泛的泛心理领域。

这是一个构建自我的旅程。作为一个对科学有崇高信仰的理工男，我竟然成为了五千万女性用户的朋友，这就是我自我构建的结果。

2022 年，AI 浪潮席卷而来。彼时我正值 30 岁到 40 岁的过渡期，本以为在移动互联网领域能做的事已近尾声，面临「中年危机」时，大模型出现了。

面对 AI，我经历了剧烈的情绪起伏。

起初是狂热，作为激进的技术主义者，我认为大模型与心理咨询领域太契合了，于是拼尽全力、付出巨大代价构建了大模型团队。但随后陷入了恐惧——技术进展太快，训练成本太高，对人才要求太苛刻，这根本不是中小公司能承受的。

我们无法触碰通用大模型的边界，但它的能力却在不断溢出。这让每个垂直领域的 AI 公司都感到焦虑。

随着 AI 化的深入以及像 DeepSeek 这样优秀的国产大模型的发展，我已经进入了相对坦然的状态。

我有三点核心思考：

第一，人的价值不可替代。无论是咨询师还是其他角色，只要是人类，就拥有 AI 目前不具备的独特价值。

第二，开源生态提供了生存空间。随着技术开源生态的建立，垂直领域公司有了立足之地。

第三，垂直公司无需比拼底座能力。我们没必要去跟通用模型卷基础能力，那是开源底座的事。我们要比拼的是「类人」的能力、感性的能力，这才是泛心理公司应该追求的护城河。

03

AI 时代的「无条件积极关注」

我们最近推出了最新的陪伴智能体——「陪伴小星」，这是我们在垂直行业深耕的结果。虽然目前还在内测，但已获得不少好评。

大家可能会问：一个陪伴型 AI，真的能解决用户的问题吗？

做情感产品十多年，我总结出心理服务最大的价值：不在于提供答案，而在于构建关系。心理咨询师的好坏，不在于专业水平高低或收费多少，而在于他是否有能力与咨询者建立一段信任的、良好的关系。

人本主义心理学家罗杰斯提出过一个概念：无条件的积极关注。这是人类底层的情感操作系统，也是人际关系的最高境界。

人类底层的情感操作系统｜图片来源：极客公园

什么是真爱？

真爱就是无条件的积极关注。热恋时，你觉得对方哪里都好，这就是「无条件」。一旦开始问「你到底爱不爱我」，往往是在审视条件——比如秒回信息就是积极，不秒回就是不积极。

现代人之所以痛苦、迷茫，就是因为生活中得到的「无条件积极关注」太少了。因此，垂直领域陪伴 AI 的核心价值，就是提供这种无条件的积极关注。

04

为什么泛心理公司要造「有身体」的机器人？

数据显示，「陪伴小星」最受 IN（内向直觉型）人群的喜爱。在测测的用户中，E 人（外向型）虽多，但使用陪伴产品的主要是 I 人（内向型）。I 人往往有社交压力，倾向于通过虚拟方式获取情绪价值。

但是现有的智能体更像是一个「异地恋」的朋友：缺乏实体：你看得见却摸不着，感受不到真实的温度；被动关注：它存在于手机里，你不打开，它就无法找到你，无法真正做到「主动的积极关注」。

基于此，我认为下一代 AI 形态必须进化。我们想在大模型基础上，给它加上身体（具身智能），再加上同理心，构建一个「共感体」。

如果只有智能和具身，它可能对人类构成威胁；但如果加上同理心，它就能真正服务人类、关爱人类。

这也源于我个人的「第三次出生」——成为父亲。我也面临很多育儿困境：孩子说话晚、我没有时间高质量陪伴、用职场逻辑回答孩子问题时的尴尬。在这个 AI 时代，我们也担心如何培养孩子的技能。

放眼社会，结婚率和出生率下降，本质是因为谈恋爱太难、养孩子太难。如果我们能打造出具备「无条件积极关注」能力的机器人，或许能改善这一现状。

极客公园的张鹏老师曾问我：测测做机器人有什么优势？从物理或硬核 AI 角度，我们确实没有独特优势。但作为一家深耕泛心理 13 年的公司，我们最懂「情绪价值」。

测测要用心理学的视角，重新做一遍机器人｜图片来源：极客公园

我们希望打造一款有情感能力的机器人，从「智能体」过渡到「共感体」。我们定义的机器人，不应该只是打拳击、拧螺丝的工业品，也不应是手机里安静等待的程序。

它应该是一位「爱的使者」，不能代替你谈恋爱，但在你孤独时能提供陪伴；不能代替父母，但在你无助或缺席时，能将爱传递给孩子。

爱是无条件的积极关注，爱是我们找到内心秩序的终极力量。

05

人为什么需要陪伴机器人？

最后，针对用户常问的几个问题，我做一个简短回复：

第一个问题是 AI 与真人的关系，最大的不同点在哪里？

短期看，真人是看得见摸得着的。但未来仿生机器人也会具备这一能力。

根本的区别在于：人天然就是一个「品牌」。图灵测试中有个现象：如果告诉测试者对方是机器人，打分就会偏低；如果告诉他是人，打分就会变高。「是否为人」这个认知本身，就决定了交互效果。这是人类最大的价值。

第二个问题是：人为什么需要陪伴机器人？

工业革命以来，技术让「自我」变得越来越强大。自我越强大，对他人的关注就越少，也就越难做到「无条件的积极关注」。

我们需要陪伴机器人，正是因为我们越来越关注自己。我们需要一种技术，能够填补人与人之间的情感空缺，让每个人的情感需求得到更好的满足。

在测测，遇见更好的自己｜图片来源：极客公园

第三个问题是：过度依赖机器人，会不会让人与外界的连接变浅？

首先，目前的机器人还做不到让人过度依赖。其次，假设做到了，我相信人与人之间的交流频率可能会降低，但深度会加深，强度会增强。因为机器人帮你过滤了大量无效社交，让你更清楚自己是谁、想成为什么样的人、想找什么样的伴侣度过一生。它能帮助你更好地思考人生方向。

这就是我做陪伴机器人的初心：帮助每个人更好地找到自己，想清楚人生的方向、伴侣的方向甚至下一代的方向到底往哪走。谢谢大家。

我看 MiniMax 闫俊杰：「心舟」已过万重山

极客公园

2025年12月12日 12:41

作者｜张鹏

编辑｜ Li Yuan

最近，《罗永浩的十字路口》访谈 MiniMax 创始人闫俊杰的视频在我的朋友圈刷屏了。

这是一场我看着挺惊喜的对话。两个看似处于平行世界的人——一个是互联网初代网红、公认东半球语言大师+自信东半球最好产品人罗永浩；一个是过去极度低调、表达天赋算不上有优势，但是绝对堪称 AI 技术极客的闫俊杰。

这两位硬生生聊了四个小时的「马拉松式」的访谈，其实源于我个把月之前的拉群介绍。客观地说，拉群的时候，我当时是有点担心罗老师能不能说服闫俊杰出来和他进行这种马拉松对话。

闫俊杰毕竟一个典型的理工男，业界也都知道他平时鲜有接受采访或者公开做访谈。面对老罗这样洞察力和表达力都十分犀利的提问者，会不会因为彼此担心变成一场「尬聊」而搁浅？

结果证明，罗老师绝对可以的，他的访谈频谱极其宽广，在视频播客领域一骑绝尘是理所应当的。不过，更重要的是，闫俊杰在这次访谈里让我看到了有意思的变化。甚至可以说是个阶段性的蜕变。

今天我就说说我看到的闫俊杰和他最近这些变化到底是什么？

01

一定要搞一次「纯粹」的技术创业

过去 20 多年，我深度交流、了解、持续观察过大几百个创业者。如果我非要给闫俊杰贴一个标签，那在我眼里，「渴望纯粹」的技术创业者可能是最贴切的。

这要从他「小时候」说起。其实闫俊杰认识我，比我认识他早。因为我们俩第一次见面时候他和我说，早在他大学时期，他就是我当年做科技杂志主编时候的读者，甚至现在竟然还着记得一些当时我每期《编者的话》里关于科技趋势的一些「暴论」观点。

我这辈子做内容一直围着技术趋势和产品创新在转，可能从来没有赢得过「大众」读者群。所以得知一个当时的大学生就对这些「小众科技内容」如数家珍，看得出来他首先是个「真极客」。

「真极客」对技术的趋势都是敏感的。外界往往觉得中国这一波大模型创业浪潮是被 2022 年底的 ChatGPT 引爆的，但在闫俊杰的时间表里，他早在 2021 年底就已经出发了。

在创建自己的公司之前，他是商汤最年轻的 CTO。他在商汤科技 7 年，经历了 AI 1.0 时代的整个周期。我记得 2023 年极客公园前沿社冬季会晤的一场闭门交流中，闫俊杰曾经分享过那个技术时代的无奈：那是一个模型不通用，只能靠工具补齐的时代。A 有需求就为 A 定制一个模型，B 有需求就为 B 定制一个模型。业内唯一能做的通用化努力，只是把生产工具做通用了，用来更批量地生产那些注定无法通用的模型。

这种范式看起来热闹，但本质上没有跳出做项目的桎梏，边际成本极高，社会价值却很薄。这个技术底座上，根本不可能做一个「纯粹」的技术创业。这一度让他很沮丧和迷茫。

说白了：如果继续沿着旧路走，为了定制模型而把工具做通用，是死路一条。真正的出路必须反过来——把模型本身变成通用的。只有模型足够通用，定制成本才会归零，技术才能真正普惠。

这个认知的转折点发生在 2020 年的一个深夜。当他第一次读到 CLIP 的论文时，那种冲击感让他激动的两三天没睡着觉。他在那篇论文里看到了一个惊人的未来：文本和图像之间的柏林墙倒塌了，它们在深度学习的底层本质上是统一的。这意味着 AI 1.0 的死结解开了：只要预训练模型做得足够好，AI 就通用地处理世间万物。

在这次老罗的采访中，他又一次提到：「当这件事发生时，如果你真的相信人工智能，你就应该去做点什么。」于是，他几乎立即决定 All in 开始自己的 AI 创业。

当 2022 年末 ChatGPT 横空出世的时候，刚开始创业的 MiniMax，其旗下的 Glow 每天处理着数以亿计的 Token，体量一度超过早期的 ChatGPT。这看起来似乎还不错，但实际上是令人担忧的。

我曾经问过闫俊杰他有没有遗憾当时 Glow 这个产品形态的选择问题？闫俊杰的思考有点不一样，他觉得 Glow 停留在娱乐层面，并非产品定位的主动选择，而是被当时的技术水位锁死了边界—— 是一个模型的技术能力，决定了一个产品的最终形态。

这一认知，被随后的一次事故残酷的印证了：仅仅因为一次参数调整导致对话智能度轻微下降，三天内活跃用户就跌去了 30%。

这让他进一步确信，依托技术创新的商业回报不是靠运营、技巧和工程复杂度堆砌的，而是底层技术能力的直接映射。在这个逻辑里，追求 AGI 与追求商业回报不再是两条平行线，而是完全重合的同一条曲线——智能每提升一分，用户的留存时长就增加一分。漂亮的商业数据不再是技术的对立面，而是检验模型是否逼近 AGI 真相的唯一试卷。而这，就是所谓「更纯粹的技术创业」。

自此之后，MiniMax 所有不太容易被人理解的决策，都基于这套逻辑。比如 2023 年，当大多数人还在研究如何复现 LLaMA 时，MiniMax 决定要做 MoE（混合专家模型）。在当时，除了不开源的 OpenAI，外界几乎没有成熟参考，这是一片无人区。选择这条路，意味着没有开源社区的作业可抄，一切都要摸黑探索。代价是惨重的——MiniMax 经历了 3 到 4 次严重的预训练失败，每一次模型崩了，就意味着两个月的研发周期白费，以及单次高达 1500 万美金的算力成本打了水漂。

时代给了搞技术的新环境，这时候最关键的就是不能有「烧钱的羞耻感」，这背后核心是要有信仰和够坚定。如果相信 MoE 架构的上限更高。为了那个能支撑起大几千亿参数的上限，他需要更纯粹，必须忽略「算小账」。

在这次罗永浩的对谈里，他讲到的敢于在全模态上做研发，也是同样的逻辑。

在创业第一天，他的动力和决心都是来自于一个论断：真正的 AGI 一定是多模态的。但是对于一个早期资源有限的创业公司，真要要坚持文本、语音、视觉三线并行确实很少见，因为在旁人眼中这是「兵力分散」。

最终让闫俊杰坚持践行这个论断的，本质上还是基于第一性原理的「纯粹」。他发自内心的相信 Scaling Law，相信不同模态在深度学习层面是等价的，那么即便早期众所周知的算力限制，不能上来就搞「原生多模态」，但是 MiniMax 还是坚持把它们作为三个独立模型训练。看得出来，他始终在为最终的融合做准备。

选择单独的模态聚焦「放卫星」维持「技术形象」，是资源有限条件下的「精神胜利法」。但如果更纯粹一些去看技术竞争的底层，还是需要直面有限资源，但不能放弃解决根本问题。

哪怕要走之字形路线，要有点悲壮的长期「追赶」，也没关系。因为这才是那个「更纯粹的选择」。

02

在「冲击」里才能锻造「道路自信」

我相信对闫俊杰和国内其它很多大模型创业者，2025 年都是天崩开局。

2025 年春节，DeepSeek R1 的突然爆发，给整个国内大模型行业带来了巨大的冲击。那种震撼感，不亚于当年的 ChatGPT，几乎在一段时间内把所有国内大模型创业者都「干自闭了」，所有人都沉默了相当长时间。

我看到在和老罗的采访中，闫俊杰也很坦诚地回溯了那个时刻，他也陷入了长久的自我反思。别人的成果突破带来的冲击，直接让他开始自省：是技术路线有问题吗？是我们的团队降低了要求？还是我们搞了其他的杂念，在追求 AGI 的路上不够坚定了？

我相信对于国内所有的大模型公司，「自省」之后，都面临着选择。一方面是国内同级生里出现了得高分的同学，这已经动摇了大家反正都相对落后硅谷的「模糊状态」，这时候必须对于是否要继续海量投入，继续在模型本身较劲追赶甚至寻求超越做选择。

面对国内本身就看重尽早产生商业收入的「资本审美」，如果你不能破釜沉舟在技术上紧紧咬住，甚至能保持领先的极少数，那就真不如尽早思考「开源节流」的事情了。

据我了解，闫俊杰的选择是把自己更彻底地扔进模型技术这个更纯粹的维度去死磕。曾经被外界还有猜测所谓依托模型可用能力「沿途下蛋」做产品工厂，去抓用户提收入，进而支撑估值逻辑的另一种路线，反而明确不存在了。闫俊杰的选择是「华山只有一条路」和「狭路相逢不能躲」。

有意思的是，他还做了一个极其实用、也极其简单有效的决定——在战略上坚决聚焦技术，同时组织上，发更多的钱！用这种最直接实在的方式，让大家把丢掉的信心捡回来，把分散的注意力聚回来。还是那个逻辑，忠于目标，做该做的有效动作，不要有「羞耻感」。

在我看来 2025 年这一年，MiniMax 的聚焦和坚定之后，确实连续打赢了三场坚定信心的硬仗：

（1）架构创新的抢跑： 2025 年 1 月，当行业还在 Transformer 的舒适区里内卷时，MiniMax 率先发布了国内首个线性注意力架构（Linear Attention）模型 MiniMax-Text 01；6 月，更是开源了全球首个大规模混合架构推理模型 MiniMax-M1。

虽然后来的 M2 模型并未完全沿用这一特定架构，但这种敢于偏离主流的探索本身，在我看来是有含金量的。它证明了 MiniMax 绝不是只会等着硅谷发论文再跟进的好学生，而是真正严肃的 AGI 挑战者——敢于为了更高的上限，去试错别人没走过的路，去无人区寻找更优解。

（2）底层算法的反向输出：在 M1 模型中，MiniMax 还提出了一种全新的强化学习算法 CISPO 。这不仅仅是一个技术名词，因为随后硅谷巨头 Meta 发布的 ScaleRL 训练框架也采用了这一算法。这是中国创业公司在底层算法逻辑上，对国际巨头的一次罕见且硬核的技术输出。

（3）定义交互的新标准：到了 10 月，随着 M2 模型的发布，MiniMax 首次将 Interleaved Thinking（交错思维链）推向了行业标准。这种让模型「像人一样边想边做」的能力，迅速获得了 OpenRouter 等国外知名开发者平台的支持。随后，不少大模型公司才纷纷跟进。这一次，不再是硅谷定义规则，而是 MiniMax 在定义什么是「更好的交互」。

这三场战役之后，在和老罗的对谈中，我其实反而看到了和年初时候相比，一种不一样状态的闫俊杰：似乎一种松弛感出现了。这种松弛感，可能也是因为他手里拼图的最后一块—— 文本模型，终于拼上了。

他和老罗的交流里，其实有一段很重要的信息。当时非常坦诚地盘点了一下 MiniMax 的家底：两年前，他们的语音模型做到了国际领先；一年前，视频生成模型也冲到了国际前列；连音乐模型现在也是全球三强。唯独语言模型，之前一直还要差点火候。但随着这次新模型 M2 的发布，MiniMax 的语言模型得到了国际开发者的认可，开始被用来做 Agent 和写代码——这意味着 MiniMax 补齐了最后一块短板。

他向老罗描绘了一个比外界认知更加残酷的 AI 技术竞争格局。他认为在美国，真正能坐在大模型牌桌上的其实只有四家公司： OpenAI 、Google、Anthropic，以及 X.AI 。那么他心中 MiniMax 的位置，则是成为全球极少数具备全模态整合能力的公司。「客观来看，我们可能是中国唯一一家，在文本、视频、语音、音乐全模态上都做到国际领先的公司。」

而让他在这个全球技术格局中保持自信的，是中国公司独特的「效率优势」。比如他跟老罗算了一笔账：美国的这四家核心公司，估值和收入可能是中国公司的 100 倍，但技术领先幅度可能只剩下 5%。「中国公司花美国同行 1/50 的钱，做出来的效果只差 5%，而且这个差距还在缩小。」

闫俊杰相信当全模态的数据和模型完成最终整合时，将通向一个从量变到质变的时刻。「我们现在还没有合在一起。我觉得实际上现在是我们最虚弱的时候。」

这句话的坦诚是符合闫俊杰的性格的，但这句「现在是我们最脆弱的时候」在公开访谈里说出来，是不符合他这些年来对外沟通的谨慎风格的。这种变化，只能说明他内心应该已经完成某种印证「道路自信」的构建。

能说自己现在很脆弱的人，大多不那么脆弱。他已经看到了某种明确技术能力上的自信。其实闫俊杰是一位非常关注底层逻辑的人，但如果有自信，一定是因为一些底层逻辑得到了验证。比如过去两年外界对谷歌一度非常看衰，觉得巨头掉队了。但闫俊杰却一直非常笃定地跟我说：「谷歌一定会追上来」，「他们的 TPU，非常值得关注进展」。

现在看来他说的是对的，他看透了算力基建对模型迭代的决定性支撑，以及 TPU 和模型深度共振的意义。今年 Google 的帝国反击战，确实也和其充分利用了 TPU 这个阵地，进行了充分发挥优势的技术突破紧密相关。

那么从这个访谈里看到的 MiniMax 多模态模型能力「分头并进，最终融合」的路径，可能就是闫俊杰道路自信里重要的底层逻辑。

从他这次和老罗的交流细节来看，有理由相信，「天崩开局」的 2025，可能也恰恰是闫俊杰自身「道路自信」最终建立的 2025。

03

商业世界里谈理想和追求，

不应该再有「羞耻感」

曾几何时，在中国做一家真正的技术公司，想很纯粹的依托技术本身形成大的商业价值闭环，是无比艰难的。过去很多年，所谓技术公司跑到最后，技术本身都往往只是个在最终价值创造中看似不可或缺，但其实也占比很少的东西。

这可能来自于技术本身在特定时期的局限，也一定和我们的特定时期的商业环境有关。但不管怎样，那些出发时候带着技术信仰和热情的创业者们，很多人也被商业世界的调教到要不就是放弃最初的目标，要不就是不得不接受现实，去适配环境，甚至被环境所改造。

由于几乎没有新兴技术创业公司的成功案例，以至于一段时间以来，技术理想这个真正的「核动力」，在一个人或者公司没做出伟大成果之前，都是「不足为外人道也」。甚至是在商业世界你公开说「理想和追求」，都成了有点「羞耻感」的东西，因为很少有人理解和相信，还会觉得你装 X。

但到了今天这个新的技术时代和新的社会环境，情况也应该开始改变了。很多人觉得只有硅谷可以支持「技术理想」，但我觉得不要简单接受结论，而是要拆解为什么是这样，以及改变怎样才能发生。

历史可以告诉未来，但历史不会就是未来。这种改变需要的可能就是一个合适的技术时代和一个足够成功的案例，之后星星之火未必不能燎原。

就像很多人都没意识到，DJI 这样的一家公司，在深圳就激励了多少新的硬件创业者敢于鄙视「性价比」，进而敢于要做全球最好的产品，拿到最高的毛利，然后做更伟大的公司。今天这不就是新的常态吗？

「纯粹」是有意义的，把更高的技术追求和更大的商业价值结果变成一个统一逻辑，开始成为越来越符合时代和环境的技术创业路径。

看了闫俊杰和罗永浩这这四个小时的交流，能感受到闫俊杰这几年的从思考到实践的闭环，正在打破了一种隐形的「理想主义羞耻感」，不再把技术追求包裹到某个流行的，为了取悦投资人的商业故事里，而是写下一个自带生命力的、统一的新故事。

它的好处是，你不再对世界有局促和含蓄，而变成了坦荡—— 只要你自己足够相信这个「大一统」故事，就可以说出来和值得做下去。该羞耻的是那些只看见历史，而不敢下注未来的人，不是这些技术创业者们。

在和老罗的采访中，闫俊杰有一段说的挺好的：如果要反思技术做得好，到底需要什么。他把它总结为两个词，一个是想象力，一个是自信。美国企业在自信方面做得很好，他们敢于讲我要引领这个行业。中国科技企业要更上一个层面，要引领世界，归根到底也需要坦荡的自信。

世界总有人会相信和支持你，管他是因为发自内心的认同，还是不明就里的 FOMO。时代给了技术创业者伟大的机遇，如果本身所有投资人最终都要浪费 95% 的钱（这就是风险投资投资的本质），就让他们都浪费在「哥伦布」身上，这才更有意义。

闫俊杰打了个样，我希望他继续纵情向前。也希望更多新一代中国技术创业者们，在这一个全新的技术时代，保持纯粹，「心舟飞渡万重山」。

*头图来源：《罗永浩的十字路口》

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

语核科技翟星吉：离钱最近的 Agent，才是 AI ToB 的唯一出路

极客公园

2025年12月12日 12:03

在 AI Agent 创业的热潮中，翟星吉和他创立的语核科技，选择了一条看起来有些「反共识」的路径——专注于 ToB 的销售场景，帮助企业打造「数字员工」。

在他看来，AI Agent 必须贴近企业的核心业务流程，解决最实际的问题，才能真正创造价值。「离钱近」不仅是语核的产品策略，也折射出这位 95 后创业者对 AI Agent ToB 赛道的冷静思考。

在极客公园创新大会 2026「重塑关系专场」的小场深谈中，翟星吉分享了他个人转型之路、团队构建心得以及语核科技在 AI Agent 商业化探索中的思考与迭代。

翟星吉关于 AI ToB 与 AI 创业的精彩观点：

ToB 的核心是解决「堵塞点」而非制造「工具」传统的 SaaS 往往因为无法直接量化价值而陷入销售困境，AI Agent 必须切入企业最核心的业务流，解决那些不仅重要而且「堵塞」的问题。只有解决了这些痛点，客户才会有立即付费的意愿，而不是仅仅将其视为一个可有可无的管理工具。
AI 的本质是杠杆，要撬动高价值生产力工具作为杠杆，其产出取决于使用者的基础价值。C 端普通用户的单位时间价值有限，杠杆效应不明显；而企业主、职场精英以及企业组织本身是为了高效构建生产力而存在的，在这些场景下，AI 带来的效率提升（如转化率微小的提升）能被巨大的基数放大，产生显著的商业回报。
人机协作的演进：从 L2 到 L4 目前的 Agent 处于 L2 级别（人机协作），主要替代初级员工的繁琐工作，需要人类专家审核；未来的目标是迈向 L4（高度自治），届时 Agent 将具备与高级员工对等的业务理解与执行能力。在这个阶段，企业实际上是在为「结果」付费，而非为「人头」发工资。
创业者的核心竞争力是「认知迭代速度」在快速变化的 AI 时代，最重要的素质是保持开放心态和极高的认知斜率。团队需要具备「滑跪」的能力——即便上一秒在激烈争论，下一秒发现对方正确时也能立刻采纳并执行。勇气在于快速决策，更在于发现错误后快速修正。
Agent 将重塑组织形态正如工业革命将手工作坊变为流水线工厂，Agent 的普及最终会引发组织形态的变革。未来的公司可能呈现出极高的人效比，通过「人类规划器 + AI 执行器」的模式，甚至可能演化为一种新形态的人力资源外包平台，企业仅需少量核心人员即可驱动大规模的 AI 劳动力。

以下为翟星吉在活动中的对谈实录：

01

从「震撼」到「创业」，

机会比恐惧更重要

主持人：大家好，我是极客公园的编辑主持人，今天很高兴看到大家来到极客公园创新大会的现场。这边是非常年轻的创业者翟星吉，因为年初的时候 Manus 特别火，AI Agent 激起了大家非常高的兴趣，也有对 AI 的焦虑。今天我们特别把星吉请来和大家聊一下，语核科技做 ToB 端 AI Agent 的时候有什么样的体会，包括在探索整个 AI Agent 行业方面有什么好的看法。首先，想请星吉介绍一下自己，让大家熟悉一下。

翟星吉：谢谢极客公园的邀请。我是翟星吉，语核科技创始人兼 CEO。我们是一家比较年轻的公司，2023 年 5 月份成立，到现在两年半的时间。我 1996 年出生，本科读的是电气工程，毕业之后去了帆软软件，是中国最大的 BI 大数据和低代码公司，在里面工作了 5 年。大模型出来之后，我第一波出来开始和 CTO 一起创立了这家公司。我们现在主要做 AI Agent 数字员工，侧重的是技术销售这个场景。简单来说，就是当采购方需要购买复杂产品或服务时，我们的 Agent 能帮助供应商理解客户复杂的业务需求，用自己的产品线进行配单、报价和技术支持，最终促成成交。

主持人：听起来是非常垂直的方向。你大学学的是电气工程，和写代码有关吗？

翟星吉：有一些相关，我对嵌入式开发很感兴趣，自学了不少，也打过一些比赛。但电气工程主要面向强电，和纯软件还是不太一样。毕业后进入帆软，才算真正深入 ToB 软件行业。

主持人：你第一次接触大语言模型是什么时候？当时是什么感受？

翟星吉：2022 年底，2023 年初，ChatGPT 发布之后。我的一个同事告诉我这个东西真不错，一定要试一试。我试完之后受到了极大的震撼。那个时候我在做产品，一直认为产品经理就是输入大量信息，在脑子里抽象、解构、组织成逻辑，再输出结果。我做了一件事，丢了用户的原始数据进去，让 ChatGPT 3.5 梳理产品场景。它确实没那么聪明，不过也还能看，大概 60 分的水平。我一直认为做到顶尖的产品经理依赖天赋，但其实 60 分已经做到了比较普通的水平。所以，当我发现 ChatGPT 真能达到这个「普通」的基准线时，我的认知被刷新了。当天试完之后，我就跟我们现在的 COO 打电话，说这个东西一定和工业革命一样厉害，可以把以前人脑子里做的很多事情完全做到，它可以是外置大脑，把很多思路思维解构出来无限放大。

主持人：一开始是兴奋，后来有感到恐惧吗？你评价自己当时作为产品经理是多少分？

翟星吉：90 分。我不担心，我看到更多的是机会。我对价值很敏感，判断力和决策力也比较强。我看到这件事情的时候就知道有无限大的价值，我思考的不是怎么被替代，而是能用它干什么。当天用完之后几乎就决策我们要创业做大模型相关的产品。做什么不重要，但一定要做。

主持人：这个执行力也非常快，ChatGPT 是 2022 年底出的，你相当于 2023 年 3、4 月份就开始创业了。

翟星吉：应该是再早一点。我还走过一些弯路，因为我没有真正意义上机器学习的技术背景，所以 1、2 月份学了半个多月相关的内容，但发现这个东西没那么大用处。我应该写 prompt，应该调模型做事情，所以就放弃了，开始构建应用。

主持人：在奇绩，陆奇给过你们什么重要的建议吗？

翟星吉：最好的一定是他在宏观上宏观趋势上的判断，第二是帮我们梳理团队基因和每个人想要什么，第三是教我们如何系统性地迭代产品、技术、商业化与组织。

02

从 ToC 到 ToB，

找到「离钱近」的场景

主持人：听说语核并不是你的第一个创业项目，之前有过其他尝试吗？

翟星吉：语核是我的第一个创业公司，但中间经历过一次比较大的方向调整，现在是第二个创业项目。我们公司 2023 年 5 月成立以后，相对蛮顺利的，3 个月后拿到奇绩创坛的投资。那个阶段我们在产品定义上比较成功，但在商业思考上却不够深刻，导致商业选择不够正确。

主持人：当时想做的是什么产品？

翟星吉：2023 年我们一开始做的是 ToC 的桌面端 AI 助手，核心功能跟莫妮卡差不多，划词选中后快速解释、翻译、总结，帮用户便捷使用模型。面向大学生用户，三四个月做到了十几万用户、日活过万，但商业化不太理想。去年 4 月，我们停下来复盘了半年，才决定转向 ToB 的 AI Agent 方向。

主持人：为什么从 ToC 转向 ToB，语核这个产品你们怎么把它想出来要做 Agent 的？

翟星吉：我们复盘发现，大模型带来的是生产力变革，工具本质是杠杆，杠杆撬动的是使用它的人的生产力价值。普通 C 端用户的时间价值不高，基数小，杠杆效应就小。我们要找生产力价值更高的用户。两类人群符合要求：一是合伙制企业里的合伙人，他们是超级个体；二是企业里的职场精英和中高层，他们也是个人生产力很强的人。或者直接面向企业级市场，企业本身就是为了高效构建生产力而存在的组织。只要能帮企业提高一点点效率，比如把 100 个线索成交 5 个变成成交 6 个，营收增长率就是 20%。基数足够大，杠杆效应就足够大。我们最终选择了 ToB 市场，当时只是定了这个大方向，具体做什么场景，怎么做，面向谁，不断选择、不断修正、不断迭代就好了。

主持人：那为什么最终选择 Sales 这个场景？

翟星吉：我们有一个核心认知：要做企业最核心业务流里的东西，解决核心问题。以前在传统 SaaS 公司，销售成本很高，因为卖软件本质上不会对企业的经营带来直接改善，效果无法量化，需要画饼说服对方这个在管理上有价值。我们想解决实际业务流中特别堵塞的点，解决后客户马上愿意付钱。Sales 场景就完美契合，我们不是做 Sales 本身，而是做售前解决方案专家，为 Sales 提供武器弹药。比如帮留学中介机构分析客户画像，推定制化方案和成功案例，提高成单率。

主持人：最终的实际应用效果怎么样？

翟星吉：我们第一个客户是一家留学中介机构。去年留学市场在萎缩，用我们产品前，他们营收同比下滑；使用我们的产品后，营收变成正增长 10%。我们收了几十万，但带给客户的增量营收是千万级。这让我们开始思考商业模式是不是出现了问题：给客户赚这么多钱，但他只付这么点钱。后来发现，用户决策有价值锚点，取决于他认为值多少钱，而不是成本多少。传统 SaaS 按成本定价，是因为用户无法量化系统价值。我们能够给客户新的价值锚点：带来的增量价值是多少。

03

如何制造「数字员工」

主持人：中国真正赚钱的 SaaS 没有几家，里面有非常多的难点，所以像语核这边用 AI 做这个事情也是非常好的改革。大家现在在飞书或者钉钉里也有一些 AI 助手或者数字员工这样的同事，帮你做会议纪要，提醒日历上的事件。你能不能从一个 AI 员工的制造者角度来跟大家分享，我们怎么去制造所谓的 AI 数字员工，包括在这个过程中你们看到的一些难点是什么？是人和 AI 的交互吗？还是其他的？

翟星吉：我们看到最大的难点是选择本身。Agent 最终能带来多大价值，取决于它做的事情本身价值够不够大。我们秉承的观点是帮用户解决最核心业务流程里最核心的堵塞点，他一听到就愿意付钱。技术上要能真正实现承诺。不能给用户描绘宏大愿景，但技术上只能做到人类初级员工水平，最终业务用不起来。

主持人：数字员工目前难以做到中级或顶级 Sales，可能的难点是在哪？是因为人际关系吗？我知道销售涉及到人情往来，你跟客户的关系是你成绩的一部分。

翟星吉：我们在选择的时候，如果岗位强交互、强关联，特别是建立在线下沟通和信任关系上，那么这个岗位不适合用 Agent。我们做的不是 Sales 本身，而是售前解决方案专家，为 Sales 解决武器弹药。难点是 Agent 能否足够好理解公司上下文、业务上下文和用户预期，有足够强的计划能力，懂人类专家的 knowhow。

主持人：相当于是 Sales 最好的工具。

翟星吉：可以理解是这样。在人的业务流程里，它是多工种协作的，一些工种最后会被 Agent 替代，有的工种相对比较靠前，能更容易实现。

主持人：哪些职业近期容易被 AI 取代？

翟星吉：容易实现的 Agent 一定是岗位本身 SOP 清晰、创造性弱的工作，特别是一些信息重组、加工类工作。比如常规翻译、速记、单据录入等，飞书的会议纪要就很好用。我不会提具体职业，但 SOP 清晰、创造力不强，这两点特征能辐射出很多岗位。

04

年轻团队如何攻克「老登」场景

主持人：听说你的 CTO 是从 GitHub 上「挖」来的，还让人家大二辍学？

翟星吉：他是 2003 年的，我们认识时他才大二。2023 年 3 月，我在 GitHub trending 榜上找基于 OpenAI API 的项目，一个个联系作者。那时候看好 AI 机会的人会自然聚在一起，就像移动互联网初期一样。

主持人：怎么说服他加入的？父母没意见吗？

翟星吉：价值观对齐是关键。我们都对技术充满热情，有极客精神。他当时拿了去清华还是什么的夏令营 offer 但拒绝了，是很有主见的人。父母最初有顾虑，但看到他的决心后也很支持。

主持人：我会比较好奇语核的团队，因为你是 1996 年的，你从 GitHub 上挖来的 CTO 是 2003 年的，这么年轻的团队反而选择 B 端销售这种，我认为非常「老登」的场景，你们认为这里面有反差感吗？

翟星吉：还好，我以前的公司也很年轻。我 2023 年离职的时候平均年龄是 27、28 岁，也是很年轻的团队，但做中国 ToB 行业营收将近 20 亿，经营模型很健康。ToB 公司分产品型和服务型，如果做产品型公司，产品不一定需要很「老」。我们团队平均年龄 24 岁，分产研和营销端。产研招非典型路径下的年轻人，比如辍学创业、连续创业者；营销端有经验的人，懂客户和场景。我们的人才组织工作做得特别好，有很好的培养体系，能让团队快速成长。

主持人：传统的 SaaS 有个悲剧的地方，你这边谈一个客户就需要留下一组人谈定制化。现在的 AI native 的公司怎么解决这个难题？

翟星吉：在我的视角看的 SaaS，以前不成立的核心有两个，一是天花板不够高，第二是定制化，但定制化还是由于天花板不够高导致的。为什么天花板不够高？本质是企业为管理本身付钱的意愿不够。加上定制化需求，导致商业模式问题。对我们来说，第一是把价值讲清楚，让用户愿意为价值本身付钱，天花板可能更高，我们还是蛮相信它对标的就是人力资源市场。第二是提高产品在合同中的核心占比，只做和 Agent 相关的部分，不做七七八八的事情，这是我们的解法。我们单个客户的履约周期相对比较短，可能一个月左右，标准来讲是这样，并且投入资源不会太多。

05

AI 如何重塑组织

主持人：语核作为一家 AI 原生公司，你们团队内部怎么用 AI？

翟星吉：如何经营一家 AI Native 的公司，我们内部是完全重构了业务流。比如做战略规划时，人做上层规划器，让模型执行所有研究工作，用 Deep Research 产品快速出分析报告。我们很重视内部一个叫 Agent 数字化运营的岗位，这个岗的核心价值就是帮助团队定义业务流程，找哪些环节可以用 Agent 重构。比如营销端，新客户进来后，用 Agent 生成完整背调报告；见过客户后，基于增量信息迭代报告；客户需求进来后，用 Agent 生成初稿解决方案。每个环节都重构掉，包括 HR 面试记录、总结等。

主持人：我猜你们团队应该非常少的人，非常精简的架构。

翟星吉：人确实不多，特意控制人效比，希望能做成高生产力组织。我们做的事就是帮助企业用数字员工提效，自己一定得是最佳实践。

06

Agent 未来展望与创业心得

主持人：现在是 2025 年底，如果让你来想，我知道这一定是很难，你认为 AI Agent 下一个会引爆的点在哪里？或者说创业者该关注哪些方向？

翟星吉：这确实是很难的问题，所以我坦率先讲不知道。但我会有一个观点，就是可以关注那些「最有理想的人」在做什么，他们追逐的方向大概率就是未来趋势。现在 Agent 还处于单点突破阶段，但点会连成面，最终引发组织形态的变革。就像工业革命把手工作坊变成流水线企业，Agent 将催生全新的人机协作组织形态。

主持人：你对语核有什么期望吗？现在都是点，会做成全平台吗？

翟星吉：首先从出发点看，我们是技术驱动加愿景驱动的公司，所以一定会不遗余力地将底层生产力变革赋能到真正有价值的地方，不会给自己设太多限，不管是 ToC，还是 ToB，这个都不重要，我们的愿景就是要把生产力带给大家。短期来说，我们会继续深耕数字员工，明年计划推出第二个数字员工，形成员工矩阵。每个数字员工都要做到 90% 以上的准确率，具备足够的业务价值和技术壁垒。长期来看，最终可能就是一个新时代的人力资源外包公司，企业注册一个账号就能获得大量 AI 劳动力，快速把公司运转起来。

主持人：听起来非常诱人，大家以后都是 1 人公司，1 个人加 100 个 Agent。到现在你创业大概有两年多的时间，我相信你肯定是百感交集，大家都知道创业 1 年相当于别人活 5 年，甚至 10 年。你会有什么总结或心得给到台下的大家吗？如果他们想创业的话，你会给大家什么样的建议？

翟星吉：首先别人给的建议都不重要，这是最重要的。但我可以分享四点心得：第一要有勇气探索未知，找到自己真正想要的；第二要有快速判断和果断决策的能力，以及坚持这个决策的勇气；第三要有把愿景变成现实的执行力，仰望星空，脚踏实地；第四也是最重要的，要有开放的心态和快速迭代的能力，不断修正自己的选择。我觉得这是一个优秀的人才或者说优秀的创业团队应该保持的状态，要完成这四点蛮难的。

主持人：如果能完成这四点，所有人都是创业者了。所以最重要的是保持开放和快速迭代？

翟星吉：没错。这是最难的，也是最重要的，我们现在招聘就很注重这一点。这个时代最大的竞争力就是认知迭代速度，你的斜率要足够陡。首先就是要坚定地选择，去落地、实践，而不是空想；其次是心态足够的开放，能听进去不同的意见，不断跟别人碰撞、交流，要拥抱冲突，有勇气找出正确答案，再修正自己的决策。我们团队讲究「滑跪」的能力，就是说我上一秒还在和你激烈争论，下一秒发现你是对的，就立刻采纳你的观点。快速修正、快速执行，这才是关键。

07

提问互动精选

主持人：最后有一个特殊的环节，我们选了一些小红书用户想问你的问题，我代表观众来问一下你。第一个问题：以前买 SaaS 是买工具，用不好是自己的问题。现在如果买语核的数字员工，性质就不一样了，万一数字员工说了什么不该说的，闯祸了，这个锅是谁的？

翟星吉：这是很好的问题。这个问题本质和自动驾驶一样，我们现在的状态是 L2，是人机协作，目标是 L4。当前特别严肃的场景，Agent 生成内容需要人工审核。我们先替代初级员工，变成初级和高级协作状态。当 Agent 准确性足够强，与人类高级员工水平对等时，会直接跳到 L4，这个基础上犯的错当然是我们的 Agent 承担，毋庸置疑。这个时候最好的商业模式就是，你把发给人的工资发给我就好了，人背 KPI，我们的 Agent 也可以负责。

主持人：刚才你说 L2 级的员工可以替代一些初级员工需要做的繁琐的事情，一个老生常谈的问题，如果把新手的工作用 Agent 取代了，以后会出现类似人才断档吗？没办法从初级升到高级，在语核内部，咱们怎么解决这个问题？

翟星吉：我们的视角可能有效不同。我们做业务专家型 Agent，要和人类专家对话梳理，把他们的 SOP 和思考路径拿出来。这些知识以前在专家脑子里，初级员工成长靠老专家带，速度慢。如果工作做好，可以把老专家的知识体系方法论梳理清楚，初级员工成长更快，不会在初级状态待很多年。未来的目标是解放生产力，让每个人发挥自己的创造力，做自己真正想做的事，让 Agent 来做执行工作，我们想要加速这个过程。

主持人：现在搭建 Agent 门槛越来越低，客户看到你们的逻辑，在内部复刻一套，怎么避免这种风险？

翟星吉：没办法避免。但做 Agent 需要业务专家和能力把业务知识系统化方法论化，以及技术基建工作。企业端可能做不好这两点，这还是蛮有难度的。另外，我们站在更宏观视角，看到 N 个企业的需求，做更抽象的解决方案，更接近第一性原理。单点企业输入信息不够多，不一定能看到更大的 picture，但我能拿到更多的信息，我就能看到更好的东西。

现场观众提问：谢谢翟星吉的分享，我记录了一个问题。因为我们也是一家 ToB 的公司，已经有很好的 Revenue，正面临 PMF 这个阶段，您讲的挺有借鉴意义。想请问贵公司的产品在降本和增效里是怎么样的定位？我觉得这个蛮影响我们产品的方向，所以请翟总详细介绍一下，谢谢。

翟星吉：我们是两者都认可的。我们认为这个时代有足够价值的 Agent，要么是能帮企业赚来新的钱，要么帮他省掉很多钱，至少是原来的 1/5。这不是二选一的问题，而是这两点能做到一点都足够好。我们的产品定位上是两者都不排斥，具体到复杂的 Agent，可能是多个子 Agent 组成的 Multi Agent 系统，有的服务于增量营收，有的服务于降本，就像人类的岗位里面也会存在不同的工作，我觉得不冲突。

主持人：今天非常高兴能和星吉聊 Agent。近期我们也会做成节目发在极客公园平台上，大家有什么想问的可以在播客下留言，我们会转给星吉。大家也可以关注星吉的公众号「语核科技」，非常感谢大家！

极客公园
OpenAI 发 GPT-5.2，瞄准专业用户；超越苹果，华为重夺第一；迪士尼 10 亿美元投资 OpenAI
2025年12月12日 08:41

OpenAI 发 GPT-5.2，瞄准专业用户；超越苹果，华为重夺第一；迪士尼 10 亿美元投资 OpenAI

极客公园

2025年12月12日 08:41

OpenAI 推出 GPT-5.2 瞄准「代理型 AI」竞争前沿

OpenAI 宣布推出最新大模型系列 GPT-5.2，将其定位为「迄今为止最适合日常专业使用」的模型，同时被视为在愈发激烈的「代理型 AI」竞争中的关键一步。

据介绍，GPT-5.2 系列包含 Instant、Thinking 和 Pro 等不同版本，相比 GPT-5.1，在制作电子表格、构建演示文稿、编写代码、理解长文本、处理图像、调用工具以及执行复杂多步骤任务等方面都有明显提升。OpenAI 在对外材料中强调，该系列模型整体精度更高，「幻觉」更少，尤其是 Thinking 模型在专业场景下更适合用作高可靠性的智能代理内核。

GPT-5.2 将从即日起陆续在 ChatGPT 中上线，率先向 ChatGPT Plus、Pro、Go、Business 和 Enterprise 等付费用户开放。（来源：cnBeta.COM）

连续两周超越苹果华为重夺中国手机市场份额第一

12 月 11 日消息，据市场研究咨询机构 BCI 最新发布的数据显示，自华为 Mate80 系列发布以来，华为手机国内市场份额连续 2 周超越苹果，重夺国内市场份额第一。

华为重夺中国手机市场份额第一离不开 Mate80 系列的加持。

11 月 28 日，Mate80 系列正式开售，线上线下行情火爆。据媒体报道，Mate80 系列正式开售前 6 天，预订人数已超过 200 万，首批 30 万台现货不到一分钟全部售罄。（来源：TechWeb）

微软消费者 AI 业务负责人苏莱曼：要创造「符合人类利益」的超级智能

12 月 12 日消息，北京时间今天凌晨，据彭博社报道，微软消费者生成式 AI 主管穆斯塔法・苏莱曼强调，要推动一种「符合人类利益」的超级智能，并承诺如果出现危及人类的结果，就会立刻停止。

苏莱曼在彭博《The Mishal Husain Show》节目中表示，公司绝不会继续推动任何可能脱离控制的系统，这种观点本应是行业常识，但目前仍属少见。

去年年初，微软收购了苏莱曼的初创公司 Inflection AI 的知识产权和大部分员工。之后，苏莱曼加入微软。

此前，微软的大部分 AI 工具主要依赖 OpenAI，而在苏莱曼入职后，微软便开始责成其开发能够与业内最佳产品相媲美的产品。（来源：IT 之家）

谷歌 Gemini 3 实战浏览器：AI 整理标签页，生成交互式 Web 应用

12 月 12 日消息，谷歌昨日（12 月 11 日）发布博文，宣布基于 Gemini 技术，推出 AI 实验浏览器项目 Disco，将用户的浏览器标签页直接转化为定制化的 Web 应用。

Disco 的核心亮点在于其首发功能 GenTabs，该功能利用谷歌 Gemini 模型，将用户浏览器中打开的标签页瞬间转化为定制化的 Web 应用程序。

谷歌希望通过这一工具，让浏览器不再仅仅是信息的展示窗口，而是变成能够主动协助用户完成任务的生产力平台。（来源：IT 之家）

钉钉发布新版本：上线 AI 灵动回复功能，可自动回复同事聊天

12 月 11 日晚间消息，近日，钉钉 8.1.10 版本正式发布上线。在这一版本中，用户呼声较高的听记 AI 问答和 DingTalk A1 录音卡升级均已实现。此外，钉钉聊天框新上线了 AI 灵动回复功能，AI 自动给出高情商回复建议。用户将钉钉更新至最新版本，均可使用以上功能。

上新 AI 问答功能后，AI 听记不仅能记录并转写总结，还能基于沟通内容检索信息，回答问题，识别沟通中提到的待办和行动。在学习、面试、项目沟通、销售拜访、咨询时，钉钉用户都可以在 AI 听记的转写纪要详情页面，使用 AI 问答功能，与 AI 协作完成具体的工作，实现效率提升，不再需要翻找原文。（来源：新浪科技）

迪士尼官宣 10 亿美元投资 OpenAI，允许 Sora 生成米老鼠等角色视频

12 月 11 日消息，OpenAI 官宣，迪士尼公司与 OpenAI 达成协议，使迪士尼成为 Sora（OpenAI 的 AI 生成视频平台）的第一个主要内容授权合作伙伴，共同探索想象性叙事的新可能性。

作为这项为期三年的新授权协议的一部分，Sora 将能够生成由用户提示的短视频，供粉丝观看和分享，这些视频将基于迪士尼、漫威、皮克斯和星球大战品牌中超过 200 个动画、面具和生物角色，包括服装、道具、车辆和标志性环境。

此外，ChatGPT Images 也将能够将用户的几句话在几秒钟内转化为完整生成的图像。该协议不包括任何人物肖像或声音。（来源：IT 之家）

Opera「AI 智能体浏览器」Neon 上线：月费 19.9 美元，号称每周都有大变化

12 月 11 日消息，据外媒 TechCrunch 报道，经过数个月测试后，Opera 的 AI 浏览器 Neon 现已正式向公众推出，用户需要每月支付 19.90 美元（注：现汇率约合 140.8 元人民币）。Opera 在 5 月首次公布 Neon，并在 10 月向部分用户开放早期体验。

Neon 与 Perplexity 的 Comet、OpenAI 的 Atlas 等产品一样，将 AI 聊天机器人直接整合进浏览器界面。用户能够向 AI 询问网页内容、让 AI 生成小程序和视频，并让 AI 代办各种任务。（来源：IT 之家）

苹果 Shazam 上线「热门片段」功能，揭示音乐中最受欢迎的段落

12 月 12 日消息，苹果的第一方音乐识别应用 Shazam 昨天上线了一项名为「热门片段」的新功能，可展示一首音乐中最受听众欢迎的片段。

结合苹果官方新闻稿，这项功能可以展示用户在何时调用 Shazam 识别音乐，适用于 Shazam 音乐排行榜中的热门歌曲，还能够展示歌曲各个段落的受欢迎程度。

不过需要注意的是，这项功能目前还没有在 iOS、macOS 版 Shazam 上线，目前尚不清楚苹果何时会给这两个平台推送新功能，而且该功能基本上只覆盖一些比较热门的歌曲，稍微小众冷门的歌就没法展示。（来源：IT 之家）

人类史上首次！英伟达投资公司在太空中训练首个 AI 模型

12 月 11 日消息，由英伟达投资的轨道数据中心初创公司 Starcloud 近日宣布，已成功实现人类首次在太空中训练大语言模型。

上月中旬，Starcloud 发射了一颗搭载英伟达 H100 芯片的卫星。该公司透露，这颗卫星目前正在轨道上运行基于谷歌开源模型 Gemma 的应用。

此外，Starcloud 还使用莎士比亚全集训练了由 OpenAI 创始成员 Andrej Karpathy 开发的 NanoGPT 模型，使其能够以莎士比亚风格的英语进行表达。（来源：快科技）

极客公园
朱啸虎投资，Refly.AI黄巍：n8n、扣子太难用，Vibe Workflow才是更大众的解决方案
2025年12月11日 17:55

朱啸虎投资，Refly.AI黄巍：n8n、扣子太难用，Vibe Workflow才是更大众的解决方案

极客公园

2025年12月11日 17:55

种子轮拿到数百万美元融资、估值近千万，朱啸虎的金沙江创投、高瓴创投和 Classin 共同投资。

Refly.AI 给自己的定位是更适合大众的 Vibe Workflow 产品。

为什么要做 Vibe Workflow？原因很简单，现在的 Workflow 产品 n8n、扣子都太难用，以及团队对于 Workflow 价值的认可。

他们的目标，是让不会技术的人也能轻松把自己的流程经验复制并分享给其他人，实现价值。

不仅仅是用 AI 来降低搭建 Workflow 的难度，Refly.AI 还把 n8n 中的节点升级成为单独的 agent，每个 agent 配上 2-3 个工具。在保留 agent 动态性的同时，获得传统 Workflow 的可控性与稳定性。

看起来有些激进，但 Refly.AI 确信这样的方式才是有效利用模型能力的最好方式。

为什么如此笃定？既然做 Workflow，怎么控制成本，怎么保证完成度？Refly.AI 取代 n8n 的底气又来自哪里？

在 Refly.AI 的新版本发布之际，我们和创始人& CEO 黄巍聊了聊，想搞清楚，AI-native 的 Workflow 应该长什么样。

以下内容经 Founder Park 编辑整理。

超 17000 人的「AI 产品市集」社群！不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者，飞书扫码加群：

进群后，你有机会得到：

最新、最值得关注的 AI 新品资讯；
不定期赠送热门新品的邀请码、会员码；
最精准的AI产品曝光渠道

01

Vibe Workflow：

agent 的智能+workflow 的可控

Founder Park：Refly.AI 现阶段的功能定位，也就是 Vibe Workflow，应该怎么理解？

黄巍：从 AGI 发展主线来看，一端是以 Manus 为代表的 Agent 形态，本质上这是一套基于自然语言驱动的 Workflow：用户给出一句指令，系统自动完成后续任务。另一端则是以 n8n、Dify 或纯代码为代表的传统 Workflow，更强调精确性，可以对程序行为进行细致建模。

在实际使用中，这两种都存在明显问题。以 Manus 为例，整体成本高、稳定性不足、执行时间难以预期，更关键的是，同一位用户多次提交相同指令时，产出的结果往往并不一致。而在 n8n 或 Dify 等工具中，一旦流程稍微复杂，就需要通过编写代码来维护 if-else 等控制逻辑，对非程序员用户非常不友好，也抬高了使用门槛。

我们认为 Workflow 本身有价值，希望在保留 Agent 动态性的同时，获得传统 Workflow 的可控性与稳定性，所以把 Agent 和 Workflow 结合，统称为「Vibe Workflow」。

它的核心特点有几层：

首先，搭建成本无限降低，一句话就可以搭 Workflow。产品的核心在于将 Agent 进行白盒化，提供一套「Agent Editor」，并在此基础上对 Workflow 的底层结构进行了重构：每一个节点本身都是一个 Agent，用户只需为 Agent 编写 prompt、选择合适的 tools，系统即可完成多步规划与问题求解；相比之下，传统 Workflow 中的单个节点往往只负责调用一个 API 或执行一段代码。

第二，我们给每个 Agent 一台沙箱，让它操作电脑去写代码、根据我们给的 tools 做数据拉取等操作，再做可视化呈现，解决 if-else 逻辑。传统 Workflow 里复杂的 code 流程，现在全都可以省略，变成一个节点。内部测试显示，在相同任务下，一个 Refly.AI 节点可以替代大约 20 个 n8n 节点的功能。

Refly.AI 的交互形式

这样，用户面向的 Workflow 被极大地简化了，所有操作都是自然语言表达，不需要懂搭建逻辑。同时，我们让每个节点任务足够简单，即使像 Kimi K2 这样的模型，也能近乎 100% 完美解决问题。再通过稳定的编排引擎串联起来，只要我们的节点数量和复杂度上去了，理论上我们可以解决无限的问题。在我们内部有一个说法，Refly.AI 已经达到了所谓的 AGI。

Founder Park：如果每个节点都是一个 Agent，成本会比 n8n 贵很多，会比 Manus 便宜很多吗？

黄巍：整体算下来，通过 copilot 配合，用 n8n 搭一个 8 到 10 个节点的流程，可能要花 3 到 6 个小时，加上中间的调试成本，估计至少也是大几十万 token 的消耗。但是在 Refly.AI，一句话生成 Workflow 本身消耗的 token 是非常低的，可能也就几千甚至上万个 token，现在 Kimi K2 这样的模型已经能够非常好地完成这个任务。

执行层面，我们让每个任务都变得简单，每个任务被简化为简短具体的 Prompt，可一次性执行完毕。该过程仅消耗 1 至 2 个积分，成本约 0.1 至 1 元。相比 Manus 单任务数美元的成本，这降低了至少 5 至 7 倍，而且其他人可以复用这个成果。后续调用时，token 消耗可能仅为原本的 50% 甚至 10%。

Founder Park：传统 n8n 的很多节点有确定的结果。但你们的 workflow 有四五个 Agent 节点，如果每个节点输出确定性达不到 100%，四五个节点下来，折损就会比较大。这个怎么解决？

黄巍：这是这是产品选择上的一个折中。既然选择了 Vibe Workflow，并且每个节点都是 Agent，肯定达不到 n8n 的准确度。我们放弃了一部分的准确性和稳定性，去换取更大用户规模的使用。

核心策略在于通过大幅降低使用成本与门槛，来平衡用户对准确率的诉求。本质上，这是试图用门槛降低 10 倍的优势，去换取稳定性降低 1 到 2 倍的代价。

我们的场景和 n8n 也不一样。n8n 多用于 RSS 监听与分析，而我们更强调内容产出。用户组合多模态、音频、视频模型，产出一篇报告或一个数字人视频。这些模态对准确率的要求不高，只要 70% 内容是对的，听上去有用，用户就觉得 OK。

我们完全放弃算了数字或企业自动化操作这种非常准确的场景。虽然是 workflow，但更强调为用户产出一个创作结果，比如小红书文案或概念讲解 PPT，用户获取结果后可下载并进行二次微调。

我们希望为用户提供 80% 有用的结果，用户愿意为它付费，并做二次编辑。未来我们还会提供大量的编辑能力，让用户闭环地完成编辑工作，但这是长远考虑。

Founder Park：也就是说，Refly.AI 现在能满足大部分 C 端用户有 AI 参与的一些内容生成型的任务。

黄巍：对，我们不是做那种企业里需要 100% 稳定的 automation 任务。

Founder Park：那你们现在定义的核心用户画像大概是什么样子的？

黄巍：早期，我们更倾向于那些有 n8n、Dify 使用经验，但觉得搭建很复杂，或者在寻求简单替代方案的用户。以前他可能用了别人的 Workflow，或者复刻某个大 V 的 Workflow，觉得挺好用，但自己不会改。

我们希望这群人来到我们平台，为此，我们在产品设计里有一个非常重要的动作，就是把 n8n、Claude Skills 或者其他 Workflow 平台做迁移，甚至是产品化的迁移功能。也就是说，你可以一键把那边的东西导过来，放在我们平台上运行。这是我们的第一批用户。

第二个场景，是我们自己有体感、也确实能解决问题的场景，就是现在定义的自媒体场景。为什么选这个？因为我们发现，现在模型每天都在更新，今天是 Gemini，明天是 Claude Opus。这些模型单点使用不会产生多大作用，但很多自媒体用户想把它们串起来，比如把 Claude Opus 和 Gemini 串成两到三个节点的工作流，做一个完整的产出，然后拿它去写文章、录视频。这类需求非常多。

另外，还有很多用户觉得每天跟热点压力很大，经常跟不过来。那能不能用 Refly.AI 搭一个工作流，每天自动抓热点，再按照自己的风格，批量生成文章或播客内容，然后去做推广和投放？我们自己也活跃在 Twitter，有大概 3 万粉丝，对这个场景有比较强的实感，也看到这里确实需要这样的工具。所以这是我们第二波重点的小规模场景：一方面我们有体感，另一方面用户确实有需求。

第三个方面，是这个方向的 ROI 和放大效应都非常大。如果有一个自媒体用户觉得这个工具有价值，用起来了，其实就相当于把他的粉丝一并覆盖和辐射到了。这也是我们早期重点面向的用户群。

在这个基础上，如果我们能把自媒体场景打深打透，还可以继续向外扩张。比如教育场景，或者职场白领场景，像写报告、监控内容、做产品分析等；再比如偏金融场景：某个财报发布了，希望基于它，用「巴菲特视角」写一篇财报分析等等。我们往外扩的时候，会更多聚焦在这类偏赚钱、偏职场、偏教育的场景。

02

用户的行为数据才是真正的数据飞轮

Founder Park：你们希望用足够多的 Workflow 模板来帮助很多普通用户解决他们的痛点问题。用 Workflow，是现阶段解决这个问题比较好的方式吗？

黄巍：从长期来看，理想状态当然是：用户只需要说一句话，系统就能端到端帮他把事情做完。这是一个大家都在追求的美好愿景。但就目前来说，大家对模型的发展和能力边界都有一个基本共识：模型可以解决一部分问题，但仍然离不开人的参与。

所以现在会有「Context Engineer」这样的角色，强调要充分感知用户丰富的 context 和 memory。模型有能力解决问题、调用工具、写代码，但前提是：它要真正理解你的 context，要「活在」你的 environment 里，跟你保持同频协作，才能更好地帮你解决问题。

我们提出 Vibe Workflow，就是希望先把这个环境 build 出来：用户来到 Refly.AI，可以把自己的知识，以及更重要的——自己的行为（action）沉淀下来。

Action 是最关键的。

在传统的 Dify 时代，大家更多只讲「知识库」：你把知识丢进来，但知识本身的价值有限，因为模型不知道用户在真实完成一个任务时，具体的执行步骤是怎么走的，用户的思考路径是什么。缺少行为，这些知识其实很难发挥真正价值。

在 Refly.AI 里，从技术底层看，用户在跟 AI 交互的过程中，其实是在同步沉淀知识 + 行为。举个例子：你有一个需求，要抓 Product Hunt 上的内容发到自己邮箱。在这个过程中，你会不断表达个性化偏好：想抓周榜、日榜还是月榜？你希望抓完之后不仅生成音频，还想生成一个「双口相声」版本发给你？这些都是你的 preference。

在这个过程中，模型帮用户完成了第一层冷启动，而用户把个性化知识融进了自己的行为里，这整套交互就构成了用户和 Workflow 之间的一种「个性化经验 + action」。

对平台来说，这意味着：我们采集到了你最有价值的数据——你是如何围绕一个任务，完成一系列行为的。这有点类似今年大家常提到的 DeepSeek 的「思维链数据」：即模型在完成一个任务时，每一步的思考和执行路径。我们其实就在帮助用户沉淀这种「思维链行为数据」。

Refly.AI 目前推荐的 Workflow 模板

第二点是：一个用户在工作场景中的思维模式，其实是相对有限且可枚举的。比如一个内容工作者，日常工作大体就是几条路径：关注热点 → 做选题 → 产出内容 → 做分发。这些行为是可以被枚举出来的。

这就意味着，一旦平台能够把你的这些行为路径都枚举出来，真正感知到你作为内容创作者，在这个环境里可能产生的各种动作，我们就可以对「你这个人」做一个建模：在下一个时间点，出现类似情境时，你大概率会采取什么 action，我们是可以去做「predict next action」的。

有了这样的数据和预测能力，本质上我们就是在收集大规模用户在工作场景中的行为数据。

当数据量足够大，再配合持续的算法设计和尝试，我们就可以迈向下一步：在未来的移动端场景里，用户来到 Refly.AI，只需要表达一句话，我们就可以真正实现端到端、无接管地帮他把任务做完，而且结果是高度符合他个人习惯和预期的——因为我们掌握的是他最关键的行为数据。

这就是我们的一个更长远的目标：通过持续收集和建模用户的 action 行为数据，在工作场景下，有可能率先实现一种真正意义上的 AGI—— 一句话，端到端、无接管地帮你把工作执行完。这是我们长期的思考方向。

Founder Park：也就是说，Workflow 只是你们切入这个事情现阶段的一种方式。

黄巍：对，它既是一种切入方式，也是收集用户 action 和思维链数据的最好方式。我们是在搭建一个环境，用来收集用户最有价值的数据。

如果只是一款 chatbot 产品，跟用户简单聊几句，没有任何真实的行为交互，你几乎收集不到他的行为数据。你最多知道他喜欢什么、不喜欢什么、现在在哪里，这类数据是非常浅的。我们希望走得更深一层，真正感知用户的 preference、action，以及他是如何完成一项工作的。我们认为，Workflow 是一个非常好的环境和媒介。

所以我们的出发点就是：把 Workflow 这件事做得足够简单，让更多人进来用。比如用户量从 20 万扩展到 2000 万，一旦有了这种规模的数据和偏好，我们就有能力去做「predict next action」——预测用户下一步行为。这其实就是我们在技术层面更底层的意义。

Founder Park：如果用户需求的 Workflow 是由模型给他生成的，那你们想要收集的 action 具体是指哪些？

黄巍：如果你让 AI 帮你完成一件事，模型一次性就搞定了，那我们其实收集不到什么有价值的数据。我们真正希望看到的是那些中长程、复杂问题的解决过程。

在 Refly.AI 里，一个节点大致相当于 n8n 里的很多节点，我们等于是把底层那些细碎、价值不高的 action 屏蔽掉了。真正有价值的是：当用户要完成一个动作，需要很多步，而模型一次性解决不了，他就不得不和模型持续交互。

模型先生成一个 Workflow，如果用户去改某个节点的 tool 或 prompt，这其实就是在给模型做「审阅和反馈」——这是第一层反馈。

第二层是：以模型当前的能力，一次生成不到你想要的结果是很常见的。你在第二阶段、第三阶段继续生成，这些新生成要怎么基于现有的内容去参考和调整？这里面又会产生一轮反馈和交互。

最后，当你经过多次生成和修改，觉得这个 Workflow 差不多达到了目标，就会去运行它。如果这次运行没有报错、结果符合预期，这本身就是一次非常强的正反馈：说明你和 AI 之间围绕这个任务的整个交互路径，是成功的。

对我们来说，这意味着我们拿到了用户在完成一个中长程、甚至更复杂任务的过程中，如何和 AI 交互，以及如何判断任务对不对、好不好的一整套强反馈信号。

而且，这个 Workflow 还可以被发布成模板到社区。其他用户来跑，如果觉得解决了自己的问题，会去评分、点赞，这又形成了新一层反馈。

所以在这个环境里，我们可以持续拿到多维度的反馈数据：

这个任务最终有没有价值？完成过程中需要人接管多少次？
整体完成效率高不高？比如：
之前他要一个小时才能做完，下次是不是能缩短到半小时？
现在要消耗 80 万个 token，未来能不能优化到 40 万？
之前必须用 Claude Sonnet 4，能不能在不损失效果的前提下换成 Kimi K2？

在这些维度上，其实都有非常多可以优化的空间和场景。

Founder Park：这些 action 数据可以形成数据飞轮吗？

黄巍：简单来说有几个层面：如果模型一次性生成，用户觉得结果很好，直接分享出去，这本身就是一个正向反馈；但如果用户需要反复交互、多次人工接管，或者觉得使用成本很高，这些也是非常有价值的反馈信号，会促使我们去优化产品，比如：能不能把原来需要三次接管，优化成一次甚至零次？

和传统 chatbot 不同的是，在那里用户问完一个问题转身就走，你很难拿到完整的反馈链路。而在我们的产品里，用户是带着一个明确目标来的：从提出需求，到完成目标，中间必须走完一条清晰的路径，整个流程会在系统里被完整记录。

在这个过程中，用户一方面会贡献自己的经验，另一方面也会直接给 AI 反馈：哪里错了、哪里没有满足预期。可能一开始，用户和 AI 需要三轮交互才能达成目标，我们的目标就是把这个交互次数、时间成本不断往下压，让效率越来越高。

基于这些数据，我们可以持续优化 prompt 和我们自己微调的小模型。比如：AI 怎么更好地根据用户意图拆分任务？怎么在上千个 tools 里快速选出最相关的那一个？这些都有非常明确的优化空间，也都有清晰的反馈指标，推动产品持续迭代，这就是我们所说的「数据飞轮」。

03

从画布到 workflow，

做能 scale、低门槛的产品

Founder Park：Refly.AI 从之前的画布定位到现在 vibe workflow，这中间经历了哪些变化？

黄巍：现在这个产品形态，跟我之前在飞书的经历有很大关系。

我在飞书负责过字节最早一批「大模型 + 低代码 + Workflow」的项目 Aily，Coze 的核心成员也来自那支团队。所以，我们这批人对「AI + Workflow」有比较系统的认知。我自己在飞书做过程序员、产品、销售、设计和运营等各种岗位，等于把第一代低代码 Workflow 的全链路都跑了一遍：数据建模、流程编排、界面搭建、发布运营和权限体系。

第二阶段，是我们在飞书内部做的「AI 前沿 + 低代码」项目。简单说，就是用 AI 重构低代码的所有模块：AI 生成数据模型、生成流程、生成界面，甚至生成全栈应用。后来这个方向产品化，变成了 Aily。我们当时有一个判断：在 AI 时代，低代码会长出一种新形态——只要有一个足够强的 Workflow，就能承载搭建 App 的全过程。界面可以交给 AI 生成，数据可以作为 Workflow 的一个 tool，在流程运行过程中读写。

但产品对外之后，我们发现一个现实问题：即使给 Workflow 加了 AI，故事很美好、内部体验也不错，普通用户依然用不起来。本质形态还是传统 Workflow，只是加了一些 AI 节点，更像是 n8n 的进化版。我的总结是两点：

第一，Workflow 的价值是确定的，但要真正规模化，一定要让普通人能用得上；

第二，用户愿意为「先进的生产经验和流程」付费——飞书之所以能卖出去，很重要的一点是，大家希望买到的是字节跳动这家公司的先进流程。

这也是 Refly.AI 商业化的核心假设：如果一个流程本身有价值，把它封装起来，是可以被规模化销售的。

即使不会搭建 Workflow，也可以找到自己需要的直接运行。

回到创业。我们一开始就想做 Workflow，但两个人团队上来就啃这么大的工程不现实，所以先从一个更小的切口做起：围绕「用户的 context 很有价值」这个命题，做了一个剪藏插件，让用户保存文章，再基于文章做总结和每日归档。后来发现最大的问题是 data connection 很难规模化，这条路就暂时放下了。

紧接着，随着 ChatGPT Canvas 和 Claude Artifacts 出来，我们意识到：如果已经收集了那么多 context，只做「总结」太浪费了，应该让用户在这上面写东西、创作内容，也就是 DeepResearch 的最初形态。但我们很快发现，这种形态要管理大量复杂 context，对普通用户的门槛非常高。

于是我们切到「画布」形态，把这个产品推向市场，结果火得很快，也顺利拿到了一轮融资。融资之后我开始反思：虽然有一批愿意付费的用户，但大多是专业用户，小白用户还是看不懂、用不顺。这时候我们有了资源，就回到最初想做的事情——Workflow。

接下来，我们做了几层降复杂度的尝试：

第一步，把原来一个画布里可能上百个节点，收敛成只针对一个具体问题的 5–8 个节点的 Workflow；
第二步，在此基础上引入 agent，让 AI 来生成 Workflow 本身，进一步降低搭建成本。

再往下，就是现在的路径：从「深度画布」到「可落地的 Workflow」，再到「把 Workflow 封装成一个个模板」。这意味着，大部分用户只需要消费别人封装好的流程，少部分高阶用户来生产和分享流程。通过这一系列演进，我们一边降低复杂度，一边放大使用的泛化性，让「AI + Workflow」真正有机会被更广泛的人用起来。

Founder Park：这算是你们几次不同方向的探索吗？还是在你看来核心方向是一致的？

黄巍：对我来说，这是一个从模糊到逐渐确定的过程。

我决定创业，一个很直接的原因是参与了字节第一批超大规模的「AI + Workflow」项目。那段时间节奏非常高强度，项目结束后再回到常规的上班状态，明显有种「打完仗又回去种田」的不适应，所以干脆选择出来试一试。

刚出来的时候，其实并没有想清楚要做什么方向。因为在飞书期间做过浏览器插件，就先把这段经验用起来，再加上看到 Monica 这类产品，有些被「点燃」了，就先动手做起来。具体要做到哪里、产品最终会长成什么样，当时并不明确。

后面更多是边做边学，通过不断和用户交互，一点点看清哪些是真需求、哪些有机会被更多人用，于是产品方向也就从一开始的模糊，逐步收敛到后来相对确定的形态。

Founder Park：也就是说，一开始从字节出来时，你其实还没下定决心要继续做 workflow，只是先往前走。做到画布这个形态时，验证出了一些基础的 PMF，你们觉得这条路可以走下去，而这条路又刚好和你之前对「用 Workflow 形式来承载」的想法接上了。

黄巍：对，是这么一个思考的过程。

Founder Park：整个团队在这个产品上真正「找到感觉」，大概是哪个时间点？

黄巍：如果说一个明确的时间节点，是 8 月上旬。那时候投资人提醒我们，今年要再做一轮融资，我们也在想：下一轮要讲什么故事？当时我们手里有一款生成式画布产品，用户和收入都不错，但我心里一直觉得，有点「解释不清楚」。这个形态很复杂，我很难想象它的长期走向，直觉上它不是一个能 scale 的好形态。

其实这款画布之前在市场上是爆过的。大概在 3 月份，推特上有好几周大家都在讨论 Refly.AI，很多投资人来找我们。但说实话，我们当时也没完全搞清楚它为什么会爆，只是顺着用户需求一路做下来，做着做着就火了，然后去拿融资。等融资回来、冷静下来再看，问题就很清晰：这个产品很难 scale。

再加上 8 月份的压力，我们之前有这个经历，又从画布过渡到 Workflow，有了一些技术上和产品上的积累，觉得这个事情是很容易去做的，就试着去做一下。

但实践下来没有那么容易。从 8 月确定要做，到 9 月初我们做出了第一个版本，但那个版本问题非常多。之后一个多月，我们一边修 bug，一边在这些问题中找平衡点。画布转到 Workflow，本身就有很多历史债务要清，同时还要重新思考：这个形态怎么 scale、怎么商业化。折腾到 11 月底，整体才算相对稳定下来。

有了这次转型的经历，我们发现这条路在逻辑上非常自洽，而且和团队背景高度匹配。后面我们招人也是往这个思路上靠。我们这支团队现在在「Vibe Workflow」的赛道里面，可能就是全球最有竞争力的团队。我们对这个事情的理解是最深的，做的产品也最超前。

Founder Park：现在这个 Vibe Workflow 的产品，彻底想清楚的时候，是有什么特殊契机吗？

黄巍：大概是 8 月初有了一个模糊的想法，到 8 月底整个产品架构才真正被想清楚。

这个产品本身是分层的，工程复杂度非常高：

第一层，是让 agent 来生成 Workflow，本身 Workflow 的设计就得适合被 agent 生成。现在像 n8n、Dify，要做到这一点会有比较重的历史包袱。
第二层，是把 Workflow 设计成「每个节点本身就是一个 agent」，再通过执行引擎把这些 agent 串起来，这一层工程量也很大。
第三层，要让 Workflow 真正有价值，就必须有成规模的 tools 体系，覆盖 input、action、output 等不同类型。光 tools 这一层，单独拎出来都可以是一个创业方向。在此基础上，我们又给 agent 配了一台「虚拟电脑」，让它能写代码、调用 tools、操作文件，从而把类似 n8n 那种搭建复杂度进一步压下去。

这几层叠在一起，不是一个普通团队可以轻易抄过去就跑起来的。

我们当时的思路是从画布产品一路推演过来的。那时候我们已经把多模态能力都加进来了，可以在画布里生成视频、音频等各种东西。但问题也很明显：堆了这么多能力在一个画布里，用户进来根本不知道第一步要干什么、下一步该怎么走。一方面是产品引导本身有问题，另一方面，我当时心里其实已经隐约在想 Workflow 这条路，但还没下决心去落地。

转折点是，我们招了一些很优秀的同事进来。有一次我把这个 Workflow 的想法讲给他听，他周末花了两天，把一个完整方案写了出来。我们看完之后觉得：这件事情是说得通的，那就开始干吧。

后面边做边验证，大概半个月左右，我们发现这个方案不仅在工程上是闭环的，还把我们之前很多的疑惑都解释清楚了：哪些方向其实不适合我们做，哪些地方是我们真正有竞争力的。这时候，我们对「Vibe Workflow」的产品形态，才算彻底想明白。

04

我们不相信「一人公司」的通才理论

Founder Park：你们团队现在大概十三四个人，分工是什么样子的？

黄巍：我们在测试这件事上踩过很大的坑。

我之前在公司里很多角色都干过，唯独没做过测试，写代码也基本不写测试，所以一开始对测试的价值是有偏见的。扩团队时，我理想中的研发同学是那种端到端的人：既懂用户需求，又能写代码、自己测、自己上线，看结果复盘。后来发现，这种人早期很难大规模招到，要么在明星创业公司，要么在大厂里，我们又没做 PR，在市场上声量有限。

其次，我们的产品因为是 Workflow，很复杂，好多 bug。我们发了一版测试版给用户去用，全是 bug。当时痛定思痛，觉得得招个测试进来。两天之内就招到了人，进来之后，整个节奏立刻不一样：测试同学每天 push 我们修问题，产品质量稳定性肉眼可见地上来了。

在这个基础之上我懂得一个道理，现在大家鼓吹的所谓「一人公司」，或者一个人可以把所有事情干完，我觉得是很美好的愿望。但互联网分工这套方法论，已经被无数家公司验证过，我们不应该把它丢弃掉。

我们的教训是：团队职能一定要尽量完备——产品、运营、增长、设计、测试、研发、算法都要有人，才不会在关键环节出现盲区。

我们的原则是：

在「非重度」方向，每个方向至少招一个特别优秀的人，把这件事完整跑通，只有在确实需要扩张时才上第二个、第三个。
在「重度」方向，比如研发、算法、模型调优，会投入更多人力。

现在团队大致的分工是：所有方向上至少有一个能把事情落地的人。在研发层面，一部分人做偏运营向的开发，大概两个人；做模型和工程调优的，两到三个人；再做底层的 workflow 和 tools 基座开发的，三到四个人。大概是这么一个分工。

Founder Park：现在大家讲究 AI 时代的团队是招一些通才，但你这边好像是要招一些在确定岗位上很擅长的人，这会有矛盾吗？

黄巍：我们是从 0 开始摸爬滚打过来的，对这一点的感受非常直接：通才当然重要，但前提是你真的能招到通才。这有点像「通用 agent」——大家都在说，但现实里没那么多。

现实情况是，模型的能力没有大家鼓吹的那么厉害，没达到替代一个人的地步。比如模型不会让一个写代码的人去搞设计，他能搞点轻微的设计，但搞不了生产型的设计。所以我们更强调的是，招这个领域的专才，然后我们给他加一层 AI，他比所谓的通才要好几个数量级。这一点我们现在在团队里已经验证得比较充分了。

比如我们招一个设计同学，给他配非常完备的 AI 工具，他只需要专注在把整个产品的框架设计好，尽量的兼容通用，其他的细节可以让 AI 帮他完成。我们觉得这种是一种非常高效率的协作方式。

所以对我们来说，最理想的状态就是招专才，并且是非常专、非常优秀的人，我们给他配最强大的 AI，让他把这个事情干到之前 3 到 5 倍甚至 10 倍的效果。

Founder Park：那你们现阶段还需要再扩招吗？

黄巍：会，而且是持续扩招。

我最近有一个比较坚定的结论：不管是在大公司还是创业公司，团队在人力配置上应该是「饱和式」的，而不是刚刚好够用。原因有几个：

方向未来一定会变化；
会遇到各种突发情况，比如核心同学离职，或者突然有一个新的大模型出来，你需要快速兼容、改造；
很多机会窗口期很短，人不够就会明显跟不上节奏。

另外，我们内部有一个共识：做好产品，和做好增长、商业化，是同等重要的事情。所以在增长这块，我们也会搭一个相对完整的团队：投放、内容、KOL 运营、增长产品经理、增长工程师，这些角色我们都会补齐。

05

站在模型肩膀上做产品，

才不会被取代

Founder Park：现在的大模型，给它太多工具之后会陷入不知道怎么选的地步。这个问题现在你们是怎么解决的？

黄巍：我们对 AI 的使用方式不同，我们是让它从 1000 种工具里「选择」工具，而不是直接用这些工具去「执行」。「选择」和「执行」这两个任务的复杂度是不一样的，「选择」这个任务非常简单。

要模型一边从几百上千个工具里挑，一边把活干完，这个事情太复杂了。所以我们把任务拆成两块：一个模型专门负责挑工具、写 action 和 workflow；另一个模型只负责执行具体任务。

我们每个 agent 节点实际能用的工具不超过 3 个，通常只有一到两个，对应的 prompt 也非常简单。我们的目标是：每个 agent 节点只做一件非常具体的小事，一到两个工具就能搞定，然后把复杂任务拆成 5～10 个这样的小任务。

这样做有两个好处：

不同模型各司其职。像 Kimi K2 这种适合执行的模型，就专注把单个步骤做好——便宜、准、稳定、速度快；像 GPT-5、Claude Sonnet 4.5 这种更强的模型，就负责从成千上万的工具中筛选、规划，把任务拆解成一条条可执行的 workflow。
我们可以用一个稳定的编排引擎，把这些简单节点串起来，完成非常复杂的任务，而不是指望某一个「大而全」的 agent。

本质上，这是我们对模型边界的一种利用方式：不用去强碰模型当下还「不擅长」的能力，而是把问题拆到模型能稳定发挥的区间，让产品形态和模型能力「贴合」增长，而不是被拖着走。

我们的产品做了一件非常巧妙的事情：让贵的、强的模型去做拆任务，让简单的模型去做执行。

这样模型能力的增长不会吃掉我们，而是会让我们变得更强。一旦我们收集到可用的数据，钱和人到位，拆任务这一层完全可以用自研或微调模型替代；执行层也可以不断优化，比如原来要 4 个节点，现在压缩到 1 个节点。

这个过程极度考验我们对模型能力、边界的认知，以及怎么去提前几个月把我们的产品放在这个点上，等待模型的增长。比如后面发了新的模型、新的 API，我们很快就可以接入，并且让用户可以一句话生成流程，去做自媒体传播。这就是我们怎么去设计产品和做增长的一些思考。

Founder Park：对 Refly.AI 来说，现在阶段的核心壁垒，是技术壁垒还是运营壁垒？

黄巍：现阶段，在我们产品还没有完全大规模面世之前，我们可能对自己的技术壁垒会有一些信心。

首先，我们可能是这个地球上最懂「AI + Workflow」的那批人。第二，我们在正式对外之前，已经组建了一支非常能打仗的团队。这是我刻意为之的，我不希望我们还没准备好就草率地暴露出去，结果这个方向火了，后续却和我们无关了，团队组织能力一定要到位。

在这个基础上，我们有一个比较清晰的产品判断： AI 越往前走，真正有价值的产品，一定是在非常复杂的系统工程之上，让用户「感知到的体验」尽可能简单。不是说产品本身要做成一个很简单的小玩具，而是底层可以极其复杂，但呈现给用户的路径要是顺滑、低门槛的。这中间要始终顺着 AI 能力的演进做设计，而不是逆势搞一些反人性的形态。

以我们目前的工程复杂度，任何一家小公司，比如 15-20 人的团队，很难在 3-6 个月之内超过我们。即便短期某些功能形态看上去追上来了，也很难知道我们下一步会做什么迭代。对大厂而言，我自己有大厂经历，要在内部复刻一个同等复杂的系统，至少得拉一个 50–100 人的团队，全力干一两年。除非我们已经证明这是一个千亿级甚至更大的市场，否则大多数大厂不会一上来就投这么重的资源。

所以，我们会给自己一个 3–6 个月的「加速窗口期」。在这段时间里，只要资金到位、增长团队到位，技术和产品这套复杂度放出去，短期应该是没有特别直接的对手，我们也有机会在市场上快速完成一轮增长和商业化验证。

Founder Park：这么设计，会不会被某一个模型厂商绑架？比如受限于单一模型的成本或能力？

黄巍：不会，反而可以说，我们现在的做法在某种意义上是偏「激进」的。

我之前跟一些字节同事聊，他们会觉得我们的方向挺超前：现在就把每个节点都改成一个 agent，再去编排 agent，这个路径是不是太早了？一开始我们自己也有类似的疑问——和 n8n 那种相对静态的 Workflow 比，我们的做法一开始确实不够稳定、成本也偏高，早期 bug 特别多，那个阶段我们也反复在问：这条路到底是不是可行的？

但一路走下来，我们会发现，这件事是说得通的：

每个节点都是一个 agent；
每个节点做尽量简单的事；
整条链路通过编排引擎串起来。

无论未来模型怎么迭代，我们都是在模型之上再加了一层抽象，相当于「站在模型肩膀上」：模型越强，我们越强；模型越便宜，我们越便宜。同时，我们还会沉淀自己的行为数据，可以进一步优化自研模型和商业模式。

更重要的是，这个抽象层可以天然兼容不同模型、不同模态，统一放到同一套 workflow 架构里，完成数据的 INPUT、PROCESS 和 OUTPUT。这让我们不会被某一个模型厂商锁死。

Founder Park：如何不被模型所取代，除了跑得快以外，还有其他补充吗？

黄巍：我觉得核心还是认识到模型的边界。模型厂商非常懂模型，他只切了他看起来显而易见的那部分能力。但实际上，模型是一个巨大的宝藏，你可以从里面剥离出对你这个行业最有价值的那部分能力。

比如我们做 Vibe Workflow，是因为当时看到一个趋势，GPT-5 发布之后，ChatGPT 把所有的功能选择都收到了一个按钮里，希望用户只需要表达需求，它自动做路由。这对我最大的震撼是，这么大的一个产品竟然能做这个事情，意味着现在整个模型的工具调用（tool use）的速度和准确性已经迈过了那个极限。我们认识到这一点之后，就选择了 Vibe Workflow，我们觉得这个事情是一定可行的。

这个能力不像生成 PPT 那么花哨，但是它对你的产品有用，并且能产生巨大的化学效应。也就是说，模型是一个巨大的宝藏，它有很多切面。你如果能从里面找到一个切面，对你的产品产生杠杆效应，即使不需要和模型厂商竞赛也是可以的。你不要去打它的主方向，你从里面抽点皮毛出来，把你这个产品做好，至少也是一个几十亿、数百亿美金的规模。早期你的野心不要那么大，能做到 Canva 那样，就意味着我们的目标没有那么高，我们也可以切到模型的一个切面，切到自己的一块肉。

去挑选一个差异化的赛道，在这个赛道里面我们做到最大，也能活得非常好。比如马斯克的第一次创业，也不是做了特斯拉或者 SpaceX。所以我觉得第一次创业不要搞那么大，简单点，先搞出来，人生还很长，一点点来。

06

创业早期可以慢一点，

关键是「别做错事」

Founder Park：想象一下 Refly.AI 的终局，会成为一个 Workflow 的分发平台，还是大家创作内容的一个新平台？

黄巍：短期内，我们觉得它有可能是一个新的原生内容平台的机会。

AI 来了之后，大家都在想 AI 时代的社区和内容平台是什么样子的。AI 最大的能力在于它可以生成内容，以及它的主动性和自动化。那未来的 AI 内容平台，是不是内容可以极度个性化地定制？用户表达一句话可以生成内容，并对它做编辑、消费和修改。内容是丰富多样的，不只是视频。比如我现在需要听个播客，平台就可以实时为我生成一段只服务于我的播客, 有点像 OpenAI 现在推的 ChatGPT Pulse。

长期的终局，就像我们说的，我们拿到的是用户在一个工作生命周期里所有的行为和意图数据。那未来是不是我们能给用户一个更简单的交互方式？他只需要一个无时不在、感知不到的硬件，就能去和 AI 做交互，完成自己的任务。比如他走在路上说「你帮我开一辆特斯拉去接我的女儿」，他可以去做这种侵入到物理世界的 action，并且这个 action 本身的价值、准确率和个性化都非常高。

这是我们认为长远的、Refly.AI 希望达到的终局。我们设置了一个环境和媒介，去承接用户全方位、多维度的意图和行为数据。我们希望这些数据最终能够构建一个用户的数字化版本，能帮助用户进入到物理世界去干一些事情。

短期内，我们希望可能是在做一个 AI 原生的内容平台的机会。但更加现实一点，我们就是在卖模板，做一个很土的生意，卖 AI 时代的 Workflow 模板。

Founder Park：那你预期明年整个 AI 行业有哪些新的技术和发展，会对你们有助力？

黄巍：我自己有两个非常期待的方向。

第一，是让「修小问题」这件事真正被 AI 自动化掉。我们每天都有大量细碎的小 bug，要改代码、测、上线。理想状态是，这些小问题可以端到端地被 AI 自动修复和发布，让人从重复劳动中彻底解放出来，去做更有创造性的事情。

第二，是模型在「编辑能力」上的进步，而不只是生成。

现在模型在生成上已经很强了，但生成完一个 PPT、视频或网页之后，我还要为它造一个编辑器，让用户去细调。如果未来模型能以很低的成本精准理解 input，做细粒度的编辑，那么 Refly.AI 这类工具的上限会被大幅抬高——很多我们今天需要自己造的「编辑能力」，都可以交给模型。

那 Refly.AI 会变成什么？它会变成 AI 时代的创作者工具。以前你剪一个视频用的是剪映，发布的载体是抖音。未来，你去做内容创作，跑的是一个流程，这个流程产出的结果就是一个视频、一个音频、一个文本，甚至是一个网页。

一旦模型的编辑能力变得非常强，未来所有内容的载体其实都是一条流程，这会催生出一个 AI-native 的原生内容平台。这个内容平台相比之前最大的变化就是，它的内容是实时生产、实时更新，并且每个内容都可以由人去做个性化甚至「入镜」，按需消费。这是我们看到的，可能是下一代内容平台的机会。

Founder Park：如果现在有大厂的人或者创业者也是做 AI 应用，你会给他们什么建议？

黄巍：我只能从我自己的经验出发。我觉得看一个事情，可能要把它拉长到一个维度去看。一个事情在半年这个维度可能看上去很有价值，但拉到 1～2 年，你要问自己：这个产品还能活吗？现在大家都在讲快速落地、快速试错、快速拿结果，但从我的视角，早期可以慢一点，关键是「别做错事」。

假如我们今天来一个概念就抄，明天来一个概念就抄，没有自己的产品主张，就容易陷入「热度成瘾」。我们宁愿早期慢一点，但是一定要拉长时间维度，在这个行业内做到不可替代，把事情做对。

第二点，就是老生常谈的，它会不会被模型吃掉？这个事情一定要想清楚。你是不是在做一个模型之上的东西，还是会被模型吃掉的东西？有些人可能偷懒就不去想了，比如 OpenAI 做了浏览器，你也去做个浏览器，甚至比他做得还慢，这种是不值得去做的。

我们内部有一个心法：产品一定要比模型的能力迭代要快 3-6 个月，并且要在 3-6 个月之内把自己的想法实践落地，并推向市场和商业化。如果我们能不断地重复这样的周期，我们就能跑赢这个市场，跑赢模型厂商。

第三点建议，招人层面的，就是早期一定不要有偏见。历史上被证明有价值的分工和合作一定有它的道理，存在即合理。不要因为自己的偏见，或者因为他人表达的所谓「通才」的看法，就觉得一定就是那样的。还是要回归常识、回归本质。

早期一定要找到那种价值观和想法对齐的团队。我们也面过、发过很多背景非常优秀的人的 offer，包括给一些斯坦福的学生发过 offer。但我们会发现，虽然他们的背景和履历非常优秀，但如果把他们放在一个高压、要去战斗的环境之下，他们学校里的履历是很难派上用场的。放到一个战争的环境之下，考验的不是你答一道题的能力，而是你怎么去面对全方位的竞争，去找到自己的道路。

早期团队，确实要找到那种调性相投的，而不是一味地去看名校背景或光鲜履历。真正能打仗的人，他不一定是履历光鲜的，可能就是普普通通，但他确实能把事情干成。

注：Refly.AI 本身是开源项目，开源仓库地址：

https://github.com/refly-ai/refly

2026 硬件觉醒：AI 硬件迎来「安卓时刻」

极客公园

2025年12月11日 14:19

作者｜汤一涛

编辑｜靖宇

北京 798 艺术区，当《钢铁侠》中贾维斯的经典片段再次投射在巨幕上时，台下观众的眼神里既有对终极智能的向往，也有一丝熟悉的审慎——类似的场景在过去数年的科技发布会上反复上演，但现实中的 AI 硬件，似乎总与那个理想形态隔着一层无法逾越的技术冰墙。

在 IF 2026 的舞台上，无界方舟联合创始人小乔的分享，选择以攀登者的身份直面现实、解决行业难题。

她指出，尽管 2025 年被誉为 AI 硬件的「第二波浪潮元年」，各种形态的桌面机器人、陪伴硬件、可穿戴设备和具身智能层出不穷，但成功找到 PMF 的产品以垂直品类为主，因为单一场景相对更好实现。因为要将强大的 AI 大模型落地为真正的消费级硬件，仍需跨越三大天堑：从零搭建完整框架如同在峭壁上开凿登山道，复杂工程链路堪比穿越冰川裂缝，定制化适配更是需要在岩壁上精准安装每一颗铆钉。这些难题叠加成「技术冰墙」——模型调用成本居高不下，研发周期以年为单位，最终留给用户的往往仍是冰冷的体验。

小乔表示：「AI 大模型只是『脑细胞』，而硬件更需要一个完整的『神经系统』。」

这个系统需要将交互、记忆、执行、形象这四大原子能力无缝融合，形成拟人化的认知与行为闭环。这正是无界方舟过去几年深耕的方向，其成果便是 EVA OS——一个为新一代 AI 硬件设计的操作系统，其核心能力已全面开源，在本次极客公园的舞台上正式发布。

EVA OS 的诞生，不只是连接，更是「融入」——将拟人的认知与感知能力，深度融入硬件的基因。让每一个设备从单纯执行命令的工具，进化为「高智商伙伴」：能听懂对话背后的情绪，记住用户偏好，甚至主动预判需求和完成任务。

01

如何定义硬件的「神经系统」？

智能系统的生命力，源于硬件与算法的深度耦合。 EVA OS 通过重构交互、记忆、执行与形象四大原子能力，为硬件铺设了完整且高效的「神经系统」，使其获得拟人的认知与行为能力。

【交互层】：从「信号响应」到「语境理解」的毫秒革命

EVA OS 重新定义了硬件与人的对话方式，将机械的指令响应升级为连贯的语境理解。它能在毫秒级延迟内实现全双工自然交流，并依据场景动态切换交互角色，让硬件真正理解对话中的情绪与意图。

现场演示中，EVA OS 除了展现出多模态交互能力外，还体现了更丰富的 AI 反馈方式：通过韵律建模实现即兴说唱，通过音色克隆技术复现多维声纹，通过视频语义解析模块输出智能解说等，将交互从简单的问答拓展为丰富的「对话场」。

【记忆层】：构建多模态的终身记忆

EVA OS 为硬件构建了连续的个人认知图谱，解决了行业方案长期记忆薄弱、易出现信息幻觉的痛点。它融合长短期记忆，不仅能关联多模态信息，更能主动提示关键过往，使设备从被动应答变为「真正懂你的长期伙伴」。

与仅依赖文本的传统向量数据库不同，EVA OS 的记忆系统具备视觉维度，从而可以满足更多场景需求。小乔分享了实测案例：当询问「同事需要我帮忙点什么饮料」或「我的耳机在哪」时，系统不仅能调取记忆片段，还能结合视觉线索给出具体建议。「我真的在那个位置找到了耳机。」她补充道。—— 它记住的不仅是事实，更是与你共同成长的生命体验。

【执行层】：构建从「认知决策」到「物理致动」的端到端闭环

EVA OS 成功跨越了数字智能与物理世界之间的执行鸿沟。在软件层面，除支持标准的 API/MCP 接口调用外，更集成了 Computer Use/Mobile Use 能力，通过拟人化的 GUI 自动化交互，实现了对封闭或无接口软件的精准操控。在硬件层面，EVA OS 具备底层致动能力，可直接驱动实体机械结构。这一架构让 AI 硬件完成了从「多模态交互」到「全场景执行」的质变。

现场展示了 EVA OS 正在交付的实际案例：系统能够自主操作手机，打开各类 APP 进行分析处理，并独立完成任务链，展示了其在复杂物理环境中的行动潜力。

【形象层】：为硬件赋予实时形象

EVA OS 支持各类硬件输出由大模型驱动的表情、二次元、数字人等各类形象。与业界常见的串行链路驱动不同， EVA OS 采用业界少见的并行链路，让表情、声音与动作同步发生，从而实现了音画同步、实时驱动，带来了毫秒级低延迟的输出效果，确保反馈的一致性与实时性。

02

「行业样板间」：周预定量

突破 1 万台的爆款产品

在无界方舟的战略布局中，首款消费级产品「奇多多 AI 学伴」承担着双重使命——既是 EVA OS 技术的原型验证平台，更是重构早教产品价值锚点的行业样板间。这款面向 0-10 岁儿童的 AI 学伴机器人，标志着 AI 早教产品从「陪伴噱头」回归「科学早教本质」。

面对传统 AI 玩具体验欠佳、近 70% 家庭依赖老人带娃、业界缺少 3-10 岁儿童的优质早教产品等问题，奇多多以「能看、会说、懂成长」的智能学伴形态，给出高质量科学解决方案。自发布以来，奇多多销量迅速破万，成为智能硬件领域的焦点。

奇多多基于无界方舟自研的「AI 大脑」EVA OS，是集成视觉识别与个性化记忆引擎的 AI 原生产品。技术上，其端到端实时互动多模态大模型，实现了视频交互毫秒级低延迟反馈。「全能阅读」支持任意书本实时朗读、翻译、指读的功能，不限于绘本、报刊、课本、卡片等载体，无需提前录入资料，任意材料都可实时识别和阅读；「AI 识物科普」可实时识别任意物品并展开科普，打通孩子「边看 - 边问 - 边学」的认知链路。

效果是显著的，在与外国语学校的 AI 研学合作中，孩子们识字、记忆英文单词的速度提升至之前的 4 倍，阅读量提升至 3.3 倍。更令人触动的是， 83% 的内向儿童开始主动与奇多多及身边小朋友交流。小乔强调，Broca's Area 语言中枢仅在 0-10 岁活跃，10 岁开始关闭，因此语言互动能力的培养对孩子来说必不可少。

「奇多多做对了什么？」小乔总结出一个寻找 AI 硬件产品与市场契合点（PMF）的精准公式： PMF = 用户精准 + 刚需场景 + 技术成熟度。而 EVA OS 的核心价值，正是将最难把控的「技术成熟度」变为一项可配置、可达标的稳定服务。

03

开源与效率革命：1 天与 95%

发布会的真正高潮，是 EVA OS 核心能力正式面向全球开发者开源，这也是业内首个面向 AI 硬件的开源 AIOS 。

开源的背后，是两项具有颠覆性的效率进阶：

时间折叠：硬件原型研发周期可从几个月降低为 1 天。
成本塌缩： AI 链路成本可降低 95%。

实现路径被简化为两步：第一步，在云端定义大脑。通过可视化平台，像勾勒角色一样，自由配置硬件的人格特质、声音、记忆规则与交互逻辑。第二步，在实体完成灌注。通过兼容 Arduino、Raspberry Pi 等主流板卡的 EVA OS 开发套件，将云端 Agent 与硬件连接。

这意味着，最复杂的多模态融合与底层工程适配工作已被前置解决。一个创新的硬件想法，从概念到功能原型的时间单位，从「季度」变成了「天」；曾经令初创团队望而却步的 AI 成本，被削减了一个数量级。从此，开发像搭积木一样，初创团队只需关注产品定义本身，技术层面可在开源生态中获取即插即用的 AI 大脑能力。

04

结语：从「无法攀登」到「登顶路线」

「硬件只是载体，而新一代 AI 硬件，本质是要「更像人」。」在演讲尾声，小乔将焦点拉回到最初的梦想——「贾维斯」。她坦言，理想的 AI 伙伴依然遥远，但路径正在变得清晰：「「AI 越强，人应该更强」。这需要我们科技创业者们、AI 伙伴们一起抱团前进，共同实现科技普惠、行业共荣。」

EVA OS 的开源，相当于为 AI 硬件开发者铺设了一条「高速公路」，为攀登 AI 硬件险峰的创业者开拓了穿越技术屏障的「登顶路线」。这套系统不仅实现了工具链的革命性突破，更成为了智能硬件从「功能载体」向「数字生命」进化的转折点。这必将开启创新的闸门，催生出真正多元化、个性化的爆款硬件生态。

下一代 AI 硬件的竞争，不仅靠外形，更要靠智能。站在技术屏障消融的历史节点，无界方舟所见，不只是千亿级市场的喷薄，更有开放生态主导、多元智能共生的新文明形态，正在觉醒。

如果你也是那个对 AI 硬件有执着的创造者、开发者或梦想家，欢迎访问 EVA OS 的 GitHub 主页，加入这场从开源开始的智能革新。

https://github.com/AutoArk/EVA-OS

欢迎开发者前往探索与共建

复制链接至浏览器直达 EVA OS GitHub 主页

开源内容包括平台和手机 App 端。其中，平台支持多种自定义 solution 配置，涵盖音视频能力接入、TTS 音色选择、agent 选择、MCP 工具选择、实时多模态大模型使用等。同时，代码和文档同步上线 GitHub，开放给全球用户。

Upcoming 内容

🔌 嵌入式 SDK：ESP32/RK/MCU 硬件级深度适配
☁️ 端云协同：云端算力调度+设备端指令精准下发
🧠 智能记忆系统：设备级短期交互记忆+长期偏好记忆，多模态技术
🔧 MCP 工具扩展：开放第三方工具接入接口
🎭 自定义数字人：支持照片生成专属 Avatar
🏢 企业级能力：多模型混合部署+高并发承载方案
···

极客公园
XREAL 徐驰：智能眼镜，拉开了「Agent as Hardware」的新时代
2025年12月11日 10:50

XREAL 徐驰：智能眼镜，拉开了「Agent as Hardware」的新时代

极客公园

2025年12月11日 10:50

整理｜Moonshot

编辑｜靖宇

人类获取的 90% 信息来自视觉。当 AI 成为人类的随身智能设备时，视觉同样是最关键的部分。AI 如何帮助我们从「看到」，走向「看清」整个世界？

大模型已不再满足于被困在服务器的机箱里，它们渴望「身体」，渴望感官，渴望新的增量数据。

于是，过去看似沉寂的 AR／XR 行业也在 AI 的推动下重新升温：从头戴式设备，到轻量化眼镜，再到多模态感知硬件，各类厂商都看到了「下一个 iPhone」般的机会。

其中，最被看好的赛道就是眼镜，35g 级别的轻量化 AI 眼镜被视为未来十年的主流形态。

图源：极客公园

过去几年，AI 眼镜从概念走向产品，从工程样机变成轻量化可佩戴设备，Meta Ray-Ban 的走红验证了「AI+眼镜」的潜力，它们开始成为 AI 的视觉入口、听觉入口、长期记忆的生成器。

但现实与愿景之间仍隔着坚硬的技术鸿沟。显示、续航、重量、计算、散热，每一个都是牵引整个行业多年的「物理难题」。而且没有任何一台设备能同时做到轻量化全天候佩戴、高清显示、强大算力，这是智能眼镜行业的「不可能三角」。

在徐驰看来，当下就像 20 年前，那个智能手机爆发前夜、充满碎片化与混沌的时刻，市场上虽有百万级爆款，但生态割裂，缺乏统一的交互标准。

在极客公园创新大会 2026 上，XREAL 创始人兼 CEO 徐驰试图回答一个时代级的问题：我们应该如何为 AI 赋予视觉「身体」？又是什么设备，可以真正点亮属于 AI 时代的 iPhone 时刻？以下是徐驰的演讲实录，由极客公园整理。

嘉宾精彩观点：

• 下一代人机交互的终极形态，应当是「无感交互」。

• 眼镜作为距离人眼最近的设备，是天然适合成为下一个终端的载体。

• 今天的 AI 似乎缺乏触觉，也缺乏视觉，仿佛被困在了计算机的服务器里。

• 当你不断赋予 AI 对 3D 真实世界的感知能力时，它的能力也会随之显著提升。

• Agent 不应仅仅是软件，更应该是一个「硬件化的 Agent」。

• 眼镜所带来的「增量数据」，很可能是 AI 通向 AGI 的必经之路。

• 今天的 AI 眼镜仍然面临着「不可能三角」的挑战：全天候舒适佩戴、极佳的显示效果以及强大的 AI 智能化。

• 如果 AI 终端的竞争是一场万米长跑，那么向下深耕、打好基础，跑对方向比今天的抢跑更重要。

• 我们经常会陷入一个误区，试图用一种单一的产品形态去想象未来。

极客公园的朋友们，大家下午好，我是徐驰。

今天，我不打算聊某一款具体的产品，而是想和大家探讨一个话题：如果 AI 需要一个实体，下一代的它应该长什么样？

在进入正题之前，先简要介绍一下目前元宇宙的 AR 体验现状，也是我们 XREAL 团队过去十年在这个行业耕耘的成果。

我们一直致力于无缝连接数字世界与真实世界。在这个过程中，我们见证了行业的起伏，也深知其中的艰难，而近年来 AI 的异军突起，让我们惊喜地发现，XREAL 所做的事业正与 AI 发生快速的融合。

图源：极客公园

简单回顾我的经历，我在国内完成学业，随后在国外的几家科技大厂工作，有幸亲眼见证了 AI 行业与 XREAL 所处的 XR 领域最前沿的发展图景。

01

无感与「五感」

随着近年来 AI 能力的飞速跃升，我们发现，过去想象中的交互方式：从手机上的「触控屏幕」，到我们在 XREAL 头显、眼镜中设想的手势及多模态操作，其实都算不上最自然的交互。相比之下，人与人之间的交流才是最自然的。

因此，我们认为下一代人机交互的终极形态，应当是「无感交互」。就像人与人之间若能心有灵犀，你便能「想我之所想，见我之所见」，最终无需多言，就能懂得我真正想要什么。

在这场轰轰烈烈的 AI 革命中，我们意识到，AI 需要一双「眼睛」。在终端设备更迭的过程中，我们的目标是希望在未来二十年里，让大家能够从屏幕中抬起头来。回顾过去的变革，我们的注意力始终被禁锢在面前的屏幕上；而眼镜，作为距离人眼最近的设备，是天然适合成为下一个终端的载体。

图源：极客公园

同时，AI 的能力不断惊艳着我们，每一代模型都有着更强的推理能力，甚至具备了更强的多 Agent 处理能力。

但今天的 AI 似乎缺乏触觉，也缺乏视觉，仿佛被困在了计算机的服务器里。它就像一位饱读诗书、通晓人类千年文明精华的智者，却始终无法睁开眼睛看世界。我们相信，眼镜将是 AI 在下一阶段最好的载体，我们要赋予它全新的视觉能力。

在谷歌的 IO 大会上，他们提出了未来 AI 的发展目标：在变得越来越强大的同时，也要越来越个性化、越来越主动化。要实现这两点，前提是 AI 需要了解你的历史，需要拥有你生活中的上下文。

特别是随着 Gemini 3 等新技术的登场，我们将会迎来更多惊喜。随着大模型从单纯的语言模型走向多模态模型，我们发现，当你不断赋予 AI 对 3D 真实世界的感知能力时，它的能力也会随之显著提升。

但我始终认为，手机绝不是 AI 天然的最佳载体。我很喜欢一部大约十年前的电影《Her》，讲述了男主角与 AI 产生情感羁绊的故事。其中有一个桥段让我印象深刻：AI 角色 Samantha 对男主角说，「我想看看你的世界」，于是男主角用别针将手机摄像头固定在衬衫口袋上，以此让它看见外部世界。

今天我们所做的，就是打造一个「更好的手机」、一枚「更好的别针」，让 AI 能够真正伴随我们，更好地理解我们的生活。

《Her》电影男主角用摄像头帮虚拟女友「看世界」｜图源：Netflix

此外，在 AI 的基础上，我们衍生出了越来越多的 Agent。这些 Agent 能够更好地理解你的诉求，帮你完成一系列复杂的任务。

以前我们提到的 Agent 大多运行在手机或电脑上，属于软件形态。而今天，我们提出了一个全新的概念： Agent 不应仅仅是软件，更应该是一个「硬件化的 Agent」，这样才能最大范围地释放 AI 的能力。

这将对我们今天的硬件结构带来全新的定义。让我们重新审视「摄像头」，它不再仅仅是用来拍照或录像的工具，在全天候 AI 眼镜上，它将成为 AI 理解世界的眼睛；「麦克风」也不再只是录音功能，而是变成了 AI 的耳朵，能更好地感知周围声音的信息量。视觉与听觉的结合，已经覆盖了我们获取信息的 99%。

在交互层面，我们也希望引入新的概念。未来的显示界面，很可能变得像人与人交流时的面部表情一样，能够更好地与大家进行 AI 互动。最终，我们希望通过端侧算力与云端能力的结合，构建出如同人类神经系统般的架构——既能加速处理，又能通过端侧机制很好地保护隐私。

综合这些因素，未来的 Agent 将不再是一个单纯的软件概念，而是硬件与软件的深度结合。它将附着在一个完美的载体上，为大家提供全天候的多模态 AI 体验。

同时我们坚信，眼镜所带来的「增量数据」，很可能是 AI 通向 AGI 的必经之路。

02

增量数据才能让 AI to AGI

观察今天的数据现状，我们主要利用存量数据来训练大模型。公域数据构成了大模型的基础语料库。

在不同的大公司内部，还有私域数据，例如谷歌拥有你的文档、Gmail 等信息，能让办公相关的背景信息更加充实；国内像小红书这样的平台，也涵盖了非常有价值的私域数据。

但我想表达的是，现有的无论是公域还是私域的存量数据，都已接近枯竭。如果我们想把 AI 带入下一阶段，让它变得更个性化、更主动、更强大，我们需要的是「增量数据」。

徐驰认为，AI 眼镜或将成为「最后一块」屏幕式硬件｜图源：极客公园

未来，我们看到两个巨大的增量数据来源：一个是眼镜，一个是机器人。在具身智能机器人大规模普及之前，我们相信，戴在眼前的眼镜将是为 AI 提供更多个性化增量数据的最佳入口和途径。

虽然想象很美好，但现实中这个行业依然面临着重重挑战。我们有许多困难需要克服，尤其是无法突破的一些物理规律。

今天的 AI 眼镜仍然面临着「不可能三角」的挑战：全天候舒适佩戴、极佳的显示效果以及强大的 AI 智能化。目前没有任何一款设备能同时完美解决这三点，能解决其中两点就已经非常出色了。

回顾这个行业十年的起伏，新一波浪潮因 AI 的赋能而呈现出产品井喷的状态。我们看到一个明显的变化：早期产品形态以头盔为主，但在 2024、2025 年之后，轻量化眼镜将逐渐成为主流。这也是整个 XR 行业从小众市场走向大众普及的必然阶段。

从另一个角度来看时机。在该领域投入最大的巨头 Meta，依然在持续加大投入，却尚未迎来明显的拐点。这可能是 XREAL 的投资人最不愿看到的一张图，让人感觉似乎遥遥无期。

前景如此美好，现实却如此艰难，到底是什么制约了眼镜的发展？让我们回看到二十年前。

03

AI 眼镜的终极形态

现在的眼镜行业特别像 2005、2006 年智能手机的前夜。在苹果 iPhone 出现之前，手机生态呈现出全面的碎片化。虽然当时很多设备销量很高，不乏百万级爆款，但对开发者而言，为这些不同形态的设备做适配简直是噩梦，交互方式在不同平台间的迁移成本极高。

如果我们相信 XR 行业会像手机一样成为通用的计算终端平台，那么我们就必须有能力将这样的生态逐渐统一起来。

我们常说，如果 AI 终端的竞争是一场万米长跑，那么向下深耕、打好基础，跑对方向比今天的抢跑更重要。

展望十年之后，我们经常会陷入一个误区，试图用一种单一的产品形态去想象未来。就像我戴眼镜一样，我希望未来的智能眼镜能像今天的近视镜一样轻巧。但很可惜，正如我们曾想把手机的功能全部塞进手表里一样，这涉及到无法逾越的物理客观规律。

图源：极客公园

因此，我们认为即便在十年甚至更远的未来，智能眼镜很可能会存在「二元化」的产品形态：

第一种形态，主打「全天候」。

十年后，这种眼镜可能做到 35 克以下，与现在的近视眼镜无异。它能真正实现全天候佩戴，AI 将「住」在你的眼镜里，24 小时伴随你，或者至少在你醒着的时候一直陪伴。

它需要极强的多模态 AI 能力。但受限于物理规律，这种轻量化眼镜有一个致命问题：它的显示效果做到极致，可能也只能达到今天汽车 HUD 的水平，非常透明、无感，但无法用来观看高清电影，注定只能承载一部分功能。

第二种形态，则以更好的显示效果为基准。

它虽然也能全天候携带，但未必是全天候佩戴。它更像是一副「近视眼镜 + 墨镜」的组合，用户根据不同场景选择不同的设备。它有机会承载更丰富的生态内容。我们相信最终它的重量会比今天轻巧很多，大约做到 50 到 60 克。

既然我们预想了这样的形态，为什么海外巨头在今天明显不如当年 iPhone 时代那样「给力」了？这些巨头投入了巨额研发资金，拥有全球最优秀的工程师，却依然没有拿出像当年 iPhone、特斯拉、大疆那样让人惊艳的产品。

这背后反映了一个趋势：过去二十年，我们见证了美国及西方许多科技公司硬件创新的全面「空心化」。我们深刻体会到，变革正在发生，「定义」往往源于美国，但不仅仅是制造，越来越多的「创造」正在向中国靠拢。

图源：极客公园

那么，「iPhone 时刻」何时到来？今天距离那个时刻还差什么？我认为有四个关键挑战需要解决：

第一是硬件微型化。回顾所有大厂的第一代产品形态，包括苹果 2024 年推出的 Apple Vision Pro，大家都能看到，厂商都希望做一个「大而全」的产品。但他们忽略了一点：只有微型化，才能让产品进一步向大众普及。

XREAL 在这方面做得最好的一点，就是从第一天起就坚信「只有小型化才有机会」。我们将所有研发力量都投入到如何实现小型化上，包括在芯片、显示和制造工艺上的突破，这让我们在相关领域取得了代际领先。

第二是多模态 AI 。我们需要真正赋予 AI 一个 3D 化的世界模型。在这方面，越来越多的模型从 LLM 迁移到了 LMM，AI 能够陪我们打游戏、看视频，并通过上下文快速理解复杂的多模态信息。

第三是生态统一。大家记得 iPhone 问世后发生了什么吗？它彻底统一了交互方式，随后 iOS 和安卓两大生态彻底统一了开发者的接口，这直接导致了内容赛道的井喷式增长。

第四，也是更重要的一点，是如何让 AI 真正实现个性化。在 AI 基础之上，我们需要让 AI 拥有「长期记忆」。这是什么概念？比如今天我见到一个人，AI 会帮我回忆过去三年我们在哪些场合见过、交流过什么核心信息、他对我有过什么意见、还有什么重要事务需要处理。这与我们大脑的结构是一样的。目前的 AI 记忆大多是基于长文本输入的短期记忆，我们相信在两到三年内，基于 AI 大模型的长期记忆会有所突破。

如果攻克了这四点，我们相信一个真正具备「iPhone 时刻」意义的产品将会问世。这一突破预计在未来两到三年内发生，届时大家将看到像初代 iPhone 一样令人惊艳、值得期待的全新全天候 AI 智能眼镜。

我们希望这个时间点是 2027 年，如果真是 2027 年，那恰好是 20 年的轮回：从 2007 年初代 iPhone 到 2027 年。

04

下一个 iPhone 的风口，由谁引领？

到底谁能引爆这场革命？过去我们希望像苹果、特斯拉这样的公司能帮我们定义好产品，其他人直接「效仿」。但在今天的时代，基于我们观察到的趋势，很可能没有一家公司能包揽一切，我们更有可能看到的是一个「全球联盟」。

举个简单的例子，在今年的谷歌 I/O 大会上，我们与谷歌联合发布了关于 Project Astra 的轻量化眼镜探索。这让我们第一次有了当年 iPhone 问世时的感觉。

我们发现所有的要素都开始成熟了：硬件形态足够轻巧，体验足够好，拥有足够开放的第三方内容生态，让开发者能快速移植或开发全新内容。

最重要的是用户交互。苹果在 iPhone 上引入了多点触控，统一了智能手机最重要的交互点；今天，我们认为 AI 将是 XR 最好的交互方式。就像电影《Her》里那样，我们通过让 AI 住进眼镜里，以无感的方式结合 AI 实现全新的交互。

图源：极客公园

大家可以设想一下，拥有了海量现有的安卓生态内容，结合焕然一新的 AI 交互，再加上轻量化的产品体验，我们可以期待安卓 XR 在未来几年给大家带来的变革。同时，这也是第一个原生的 AI 操作系统。我们相信，在巨头的争夺下，中国公司也有机会通过联盟的方式，参与到全球产品的定义和竞争中去。

虽然今天 AI 的「大脑」是在大洋彼岸被创造和定义的，但我们相信，承载它的「眼镜」将越来越多地在中国诞生，中国今天是全球硬件制造业创新的核心基地。

同样，我们也相信眼镜可能是我们在座各位有生之年遇到的「最后一块屏」的机会。我们希望这块人类所需的「最后之屏」，能由我们这一代人亲眼见证，甚至有机会去参与、引领和定义。

虽然我不认为目前的成果已经达到了初代 iPhone 那般惊艳的程度，但这可能是我们和谷歌一起，在过去两年联合打造的、现阶段最好的「版本答案」。

我们希望能给大家带来惊喜，让大家看到未来几年这个行业将会涌现出怎样不同的产品形态和体验。

谢谢大家。

Teeni.AI 袁琳：10 后与 AI 的共生关系，将如空气般自然

极客公园

2025年12月11日 10:42

整理｜汤一涛

编辑｜靖宇

如果说 80 后、90 后是互联网的原住民，那么 10 后，则是 AI 时代的原生用户。

在未来十年，AI 将成为 10 后这一代生活的基本元素，像空气一样自然而然地融入他们的世界。对于这一代人来说，AI 不再是一个简单的工具，而是将与他们的学习、创作、情感和成长深度交织在一起。

作为推动这一进程的企业，Teeni.AI 在这一领域进行了深入的探索与实践。袁琳，Teeni.AI 的创始人兼 CEO，在本次活动中分享了她对于 10 后如何与 AI 共生的洞察与经验。

嘉宾精彩观点：

10 后视 AI 为如空气般自然的生存要素，关注重点已从「如何使用工具」转向「工具带来的效率变革」。

青少年对 AI 的需求已超越单纯的「寻求标准答案」，转向寻求情感共鸣与心理理解的「伙伴式社交」

AI 应作为激发创意的「脚手架」而非「代笔者」，通过苏格拉底式引导帮助孩子拆解任务并提升逻辑思维。

我们需要为 10 后创造一个健康、纯净的 AI 环境，成为他们成长的智能伙伴。

未来的人机关系将从简单的「交互」走向深度的「共生」，AI 将进化为具备共情力、能与孩子共同成长的智能伙伴。

以下为袁琳在极客公园创新大会 2026 上的演讲，由极客公园整理：

各位极客公园的朋友们，大家下午好。我是 Teeni.AI 的创始人袁琳。今天我在这里主要给大家分享我们这两年来服务于百万 10 后的一些洞察，这些主要来自用户的反馈。

我们的产品经理曾问了一位 10 岁小用户：你觉得 AI 怎么样？这个孩子回答，AI 不就是跟空气一样吗？为什么你们老是问我们它有什么特别的。

正是因为这句话，让我们对当下大模型时代的新产品的定义和交互方式做出了调整。接下来我会简单介绍一下，我们认为现在正在发生的一种代际变迁，90 后在大模型时代会考虑「我该怎么使用这个工具？」，而 10 后则会问「这个工具给我的效率带来了什么变化？」

10 后的典型特点就是，他们视 AI 为生活中的一部分，就像空气一样。

基于这一点，接下来我想分享一些我们 Teeni.AI 这几年积累的数据。

目前，Teeni.AI 服务的 10 后用户已经接近 100 万，且全部为端上用户。我们的年留存率达到了 55%，这一成绩刷新了所有青少年产品的数据。而日调用量最高已达到 30 亿 token，这也可能刷新了青少终端大模型的纪录。

此外，我们的日均使用时长也令人感到自豪。目前，10 后用户在我们平台上的日均 AI 使用时长为 32 分钟，智能终端的使用时长达 3.5 小时，这个数据相比普通的手机助手高出了 8 倍。

这些数据充分说明，10 后对 AI 的依赖程度和粘性都非常高。

Teeni.AI 刷新了国内青少年 AI 大模型的调用纪录

01

从「寻求答案」转向「思维训练与情感共鸣」，

打造去干扰的「随身智能体」

在 AI 与教育结合时，会遇到哪些问题？

首先，很多家长会问，AI 会不会让下一代失去思考？

为了回答这个问题，我们用用户数据来说明，AI 其实能够帮助孩子提升思维方式，甚至颠覆传统教育的模式。根据我们的数据，91% 的孩子在与 AI 互动时，能够比较明确自己的沟通逻辑。他们并不直接向 AI 寻求答案，而是进行一对一的对话，这种互动本身就是一种新的思维训练。

另一个常见的问题是：如果孩子不懂 AI，那么作为家长或教育者，我们是否需要干预孩子使用 AI 并进行管控呢？

我们的数据也给出了不同的答案。78% 的孩子能够自行建立使用 AI 的规则，并且在训练 AI。很多孩子会要求他的 Agent 与自己进行类似自己性格的对话，甚至把自己的爱好和表达方式输入到 AI 中，让 AI 更好地理解自己。

第三个值得关注的问题是，孩子们是否只是要求 AI 给出标准答案？

这个数据也是比较让我们触动的。我们发现，84% 的孩子会寻求 AI 的理解和共鸣，而不仅仅是让 AI 提供一个标准答案。很多时候，孩子们会通过 AI 倾诉情绪和情感，这也是我们在 10 后身上看到的一个与众不同的现象。

基于这些数据，我也给大家分享一下，我们做了哪些事情。

为了更好地帮助 10 后用户专注于与 AI 的互动，Teeni.AI 设计了一款专属硬件。我们的智能体设备不仅仅是一个简单的 AI 助手，它还是一个能够专注于学习和成长的终端。

我们主要做了 2 个动作，第一就是给孩子一个专属的 AI 的终端。

普通手机，手机中的游戏、短视频等干扰元素，容易打断孩子的注意力。而我们的专属硬件，通过设计专用 AI 按键，创建了一个最小单位的交互方式，避免了这些干扰，帮助孩子在与 AI 互动时保持更高的专注度。

第二，是我今天想重点给大家分享的，Teeni.AI 在打造 α 时代的多模态随身智能体，我们称之为 Mobile Agent，实际上它是「移动设备+AI 智能体（Mobile Devices+AI Agent）」的结合体。

α 时代=移动设备 + AI 智能体

10 后希望的 Mobile Agent 是什么样的呢？

第一，它是多模态的

第二，一定是可随身携带的

第三，一定是陪他成长的智能体

基于这些特性，我们的超级智能体也具备三个特点：

第一，可看、可听、可说，会记忆

第二，有规划

第三，有共情的能力

我们跟通义实验室用了一年半的时间，给当下的 10 后打造了一个专用的青少年大模型。接下来给大家介绍一下我们的大模型有哪些特点，做了哪些技术上的储备。

Teeni.AI 青少年专属大模型的特点

第一，是理解力优化。为什么要这么做？

儿童说话跟成人不一样的地方是有很多模糊的表达，比如他说「有个毛茸茸的东西在跑」，AI 可以马上理解说的是小狗。要做到这一点，其实是需要输入大量的语料库，然后让 AI 具备青少年语言理解力。

第二就是知识结构的定制。我们的 AI 系统为 3-15 岁的孩子量身定制了专门的知识体系。

第三是安全护栏，这是我们认为的底线。我们与阿里云合作，构建了五层内容护栏，确保青少年用户使用过程中不会接触到不当内容。

第四，也是最重要的一部分，是共情式的回答。AI 在与孩子互动时，首先要建立共情，与孩子形成伙伴关系；然后采用苏格拉底式的引导方式，帮助孩子更好地表达自己。

以上也是我们的青少年大模型不同于通用大模型的一些点。

接下来给大家介绍，我们的青少年大模型所具备的核心能力。

第一个必需的能力是长期的记忆和人格化。

91% 的孩子在与 AI 的互动中有社交需求，需要 AI 记住他们的偏好、习惯以及小细节。例如，孩子的 AI 会记住他有一个宠物叫「小黑」，喜欢吃胡萝卜，几天后 Teeni 会提问：「你给小黑喂胡萝卜了吗？」这样的记忆能力让孩子感觉 AI 像是一个真正的伙伴。

我觉得其实对于孩子来说，记住其实就是一种尊重。最核心的一点，就是你要记住孩子认为他至关重要的小事，那这时候陪伴的关系才会真正地建立。这是我们打造的第一个能力，就是长期记忆和人格化。

对孩子来说，长期记忆带来的是尊重

第二个大模型能力是规划和引导。

AI 当下对于 10 后来说，其实更多的会充当创意的脚手架。AI 能够帮助孩子将复杂的创意任务分解为可执行的小步骤。例如，一个孩子可能想做一个太空探索的视频创意，这是一个宏大的立意点，如果这个时候没有人引导他，有可能这个想法就破灭了。

所以我们的智能体会把复杂的任务分解成一个个小步骤，引导他从构思脚本、生成图像到制作视频，完成整个创作过程。

Teeni.AI 为孩子拆解复杂任务

第三个，也是比较触动我们的点，是情感和互动。

84% 的孩子在与 AI 互动时，跟 AI 深度交流并进行情感表达。很多孩子其实情绪上都需要有人倾听和输出。当孩子感到沮丧时，可能是他考试差了一点，他跟 AI 说我是不是有点笨，会有自我怀疑，因为孩子的成长有很多时候都在自我探索。

这时候 AI 会告诉他，别灰心，下次再努力。AI 能够与他们进行情感共鸣，给予鼓励和支持。

为了做到这点，我们做了一个语音的情感识别，加上上下文理解，以及 Teeni.AI 的共情策略库。

84% 的孩子在与 AI 互动时，会进行情感交流

基于这三块能力，我们的智能体能够给 10 后拓展新的学习和创造的可能。

02

让 AI 这层「空气」更纯净，

从人机交互走向人机共生

我们将在 2026 年 CES 发布的一系列产品，旨在承载我们目前在青少年大模型方面的能力，以及为孩子们提供专属的智能伙伴。这一路走来，已经花费了 12 年的时间，而 Teeni.AI 这个青少年产品也是我们团队三年心血的结晶。我们的青少年大模型是与阿里通义合作一年多时间共同打造的成果。

Teeni.AI 将在 2026 CES 发布的产品

基于我们当前积累的技术和能力，我们将推出全球专为 10 后设计的硬件，让世界和孩子们对话。未来，这些硬件将包括四种载体，从对话智能体到 AI 随身机器人。正如乔布斯曾说过，「电脑是人脑的自行车」，我们认为 AI 是孩子们的「发动机」。它不仅是一个冷冰冰的工具，更是一个真正陪伴孩子成长的智能体。这个方向也是我们公司在明年全球发展的核心目标，欢迎大家关注。

展望未来，我们认为会有三大变化：

硬件进化：
从一个通用的终端，发展成多场景适用的伙伴；
工具转变：
由原来单纯的工具，发展成具有理解力和成长能力的智能体；
价值重估：
过去工具和效率是主要考量，未来对 10 后而言，AI 将更多体现为共情的创造力和陪伴。

我们认为，未来的趋势是从简单的人机交互，向深度的人机共生发展。我们 Teeni.AI 期望在这一过程中，能够真正陪伴孩子们成长。未来 10 年，AI 对于 10 后将像空气般自然。作为父母、创业者和教育者，我们的责任是什么？是让这个「空气」更纯净、更有营养。我们打造的不是完美的机器，而是与 10 后这一代共同成长的智能伙伴。

谢谢大家！如果在座的朋友对青少年教育或青少年发展有兴趣，欢迎私下与我交流。

中国 AI 硬件团队，在 Kickstarter 上找到「第三条路」

极客公园

2025年12月11日 10:38

整理｜徐珊

编辑｜靖宇

「我们认为，对于每一个致力于去发展全球化创新品牌的老板来说，一次 Kickstarter 都没上过的人生是不完整的。」

当业界普遍关注前沿技术时，一股由中国力量推动的硬件创新浪潮正在全球众筹平台 Kickstarter 上汹涌爆发。截至今年 11 月中旬，平台数据显示，中国创造者社群的在 Kickstarter 上获得的众筹总金额在今年首次突破 2 亿美元的里程碑，到达 2 .44 亿美元，同比增长高达 71.8% 。

这股 AI 硬件出海热潮，源于中国创业者多年的社区积累与努力。「我们看到了中国创造者社区的惊人爆发，这是背后技术、供应链和全球化视野积累的结果。」

作为 Kickstarter 中国首席战略代表 Henri 见证也助推了这一巨变。Kickstarter 至今走过 16 年，他从自身视野出发，探讨我们到底该如何看待 AI 硬件的爆发与当下创新创业的新机遇。

Kickstarter 中国首席战略代表及高级顾问彭奕亨 Henri | 图源：极客公园

在 IF 2026 大会上，Henri 分享了近期他在创新赛道如何创业的最新思考，输出了一些非常精彩观点：

• AI 硬件并非仅指大型语言模型（LLM）硬件，而应该泛指一切利用 AI 来定义部分卖点，并以软硬件功能闭环实现增长闭环的硬件产品。它的本体是一个硬件，你需要用一个新的硬件形态来圈定属于你的场景。这样子用户才会对你这个产品重新建立起一个价值和价格的锚点。

• 很多人会问我们到底什么样的产品值得自己去创业或投入精力？我总结下来就是三句话：大众市场找盲区，垂直领域打刚需，细分赛道做生意。

• 大疆早期的时候，大家以为它只做航模。它真正要做的是航拍和摄影，它的大众市场是摄影，航拍是盲区。你去看它的产品定义「会飞的照相机」，是你看不懂的形容词和你看得懂的名词搭配在一起。

• 我们可以从这样一个角度去思考：如果你想把你手中的 Tier-2 应用变成一个硬件产品，它会是什么样子？因为手机本身的 Tier-2 应用已经代表了既定的刚需，所以你可以从这个场景中找到一个或许能更快尝试实现 PMF 的方向。

• 消费电子产品不像服饰、时尚单品或者艺术产品，它具有买手的溢价。那怎么样能够打破这个商业模式，让它可以去到最好的地方？我们重新定义了一个新的消费电子创新产品的零售模式，INNO100 全球创新旗舰店是基于 POD（按需打印）定制化服务基础的创新产品线下零售空间。

以下是 Henri 现场分享实录，经极客公园整理：

01

中国团队，2025 年狂揽 52 个百万级众筹

Kickstarter 不是一个电商平台，我们更多将其定义为线上社群。它聚集了一群极度热爱创新和极具参与感的用户群体，我们拥有 2500 万用户，目前在全球创新产品众筹领域占据 90% 的市场份额。

截至今年 11 月，我们总共的筹集总金额已达 93 亿美金，在科技和创意领域表现尤为强势。中国创造者社群的贡献金额现在也达到了 84 亿元人民币，我们相信在 2026 年这两个数字都会达到百亿的量级。简单来说，Kickstarter 上高度聚集了在大湾区乃至全中国数千家致力于打造全球化科技品牌的中国创业者企业。

近三年以内，在全球这些创新产品众筹中，超过 100 万美金的项目有 181 个，其中有 160 个发生在 Kickstarter。超过 600 万美金的项目中，全部 12 个项目都发生在 Kickstarter。也正是因为我们这样的视野和特殊的平台定位，我们要求产品必须在全球范围内是一个独家首发的状态。

Kickstarter 上中国创造者获得的众筹总金额变化 | 图源：极客公园

Kickstarter 的发展，我主要把它们分为三个阶段：

第一阶段是在 2012 年到 2017 年，Kickstarter 早期创立时主要面向很多艺术家，可能发起画廊、演唱会或者艺术作品等项目。从 2012 年开始，消费电子类产品开始在 Kickstarter 上进行众筹。第一个标杆性的项目就是当年的第一款智能手表，PebbleWatch，一款墨水屏手表。这个阶段还出现了居家办公产品，例如早期 3D 打印笔，直至现在整个 3D 打印品类，甚至是智能戒指，可以看到有些品类行业很早就已出现。这个阶段最典型的一个特点就是产品和品类创新主要来源于海外团队，他们有更好的产品定义和商业化落地的能力。

比较有意思的事情，发生在 2018 年到 2021 年这个阶段，贸易政策风向的改变，迫使中国品牌开始引领品类创新。因为中国创业者从未停止过他们的脚步，当产品只能靠最低的价格销售已不可持续时，开始有更多的创新创业者尝试 Kickstarter。

这个时候我们看到了 Ecoflow 这样的公司出现，它重新定义了一个品类和一个产品。我们也看到了具备拖地功能的扫地机器人，比如云鲸的产品首发。中国企业在 3D 打印赛道上，将海外公司最早开创的品类做得更好。还有激光雕刻，2021 年，我们国内团队终于出现了第一个突破千万美金的项目，当时 Ecoflow 的项目达到了 1200 万美金。

第三个阶段是我们现在所处的阶段，是创造力工具、AI 硬件和整个利用 AI 去开创新品类的新阶段。

我们眼中 2022 年之后出现的项目，AI 硬件并非仅指大型语言模型（LLM）硬件，而应该泛指一切利用 AI 来定义部分卖点，并以软硬件功能闭环实现增长闭环的硬件产品。在我们看来，这也是 AI 创造力工具。

以前需要花费大量精力去建模，但现在这些项目提供了很多工具和插件，帮助你更快速地将模型和想法变成可打印的实物。

拓竹公司的第一笔营收和整个项目起源都来自 Kickstarter。包括巧妙利用视觉算法、利用人工智能技术去做割草机这件事，LUBA 从 2022 年就开始做了。

很多人知道的 PLAUD 这家公司，它的产品也被很多公司致敬。在成为 PLAUD 之前，它已经在 Kickstarter 上完成了硬件产品验证，当时的项目金额有小几十万美金，检验了卡片形态硬件在消费者中的接受度。

随着 AI 的来临，它重新打磨了软件和硬件。在我们看来，这个过程也是一个非常好的案例，告诉大家如何去迭代你的 AI 硬件产品想法。

截至今年 11 月底，在整个 2025 年能追踪到的项目中，有 2854 个属于 Design Tech（设计与科技）这个类目。其中，在 Kickstarter 上超过百万美金的项目有 65 个，总金额超过 4 亿美金，较上一年增长 41.3%。其中，由中国创造者发起的项目，基本占了一半，有 1100 多个。在优质或大金额的项目中，超过百万级的 60 多个项目里，有 52 个都来自于中国创业者。总金额里有一半甚至超过一半，达到 2.44 亿美金，都来自中国创业者。

中国团队在 Kickstarter 上发起的项目 | 图源：极客公园

02

下一个百万级机会藏在哪？

我们今年看到的众筹历史新纪录，它不仅是 Kickstarter 平台的纪录，也是整个海外新品全球发布的历史纪录，它是由 Anker 旗下的 eufyMake 这款 UV 打印机创造的，众筹金额达到了 4676 万美金。这个数字超过了此前由一部科幻小说保持的 4500 万美金的纪录。这个案例之所以有趣，是因为 Anker 之前在创造力工具上也有不同的尝试。

经过这几年的迭代，他们找到了一个新的方向，创造了一个新的类目，将工业级的产品变成了 C 端产品，把 AI 技术融入其中，并打磨了更好的软件，让用户可以更方便地使用。例如，你把照片放上去，系统可以识别哪些是背景、哪些是人脸，哪些部分可以做成凹陷或凸起的画面，因此迅速引爆了这个市场。

我一年多以前看到这个产品，当时就觉得这个项目肯定会非常优秀。因为他们运营的人跟我说了一句话：「你有了这个产品之后，小朋友幼儿园的那些手工就不用担心了，因为什么东西都可以印，什么东西都可以做。」

排名第二的项目是 Snapmaker 的换头多色打印机，它做了 2000 多万美金，也是整个众筹平台，包括 Kickstarter 平台上面 3D 打印这个类目里众筹成绩最好的一个案例。在我们看来，即使是在 3D 打印这个持续热门、竞争激烈的赛道里，仍然可以做出一些创新。

同时，桌面级的 CNC 产品也在今年迎来了真正的爆发。过去几年我们看到过好的产品，今年正在线上的 Makera 和 Nestwork 这两个产品刚上线就能做到 700 万美金这样的成绩。

LiberNovo 智能人体工学椅，也做到了超过 1000 万美元的金额。我们看到，创新不仅限于创造类工具，也有通过设计、功能、材料等各方面的全面迭代，去「重塑」一个既有产品这样的赛道。

还有值得一提的是， LAVA STUDIO 这个产品可能在国内大家还没有太意识到。它也是在音乐工作站和音乐 AI 创造产品里面，在 Kickstarter 平台上做得最好的一个产品。本质来说，它就是把创作音乐的门槛降得非常低，利用 AI 去模拟各种效果器，很多音乐行业的从业者或者热爱音乐的人可以用这样一个完整的一体化工作站去制作很多他们喜欢的音乐。

AI 创作工具 LAVA STUDIO | 图源：极客公园

我们还看到了一个趋势，就是具有社交属性的家具，比如说一款小茶几，它其实是一个沙盘，里面有一个钢珠一直在上面转动，呈现画面和颜色。也有一些很有趣的小产品方向，比如说每一分钟会用 AI 给你写一句押韵的诗这样的时钟。

虽然这些不是金额非常高的项目，但我们愿意拿出来分享。很多小产品的尝试，也是在 AI 硬件这个赛道上面去值得做的。

03

什么方向值得 All in？

三句话教你找到定位诀窍

看过背后的故事和产品，很多人会问我们到底什么样的产品值得自己去创业或投入精力。我总结下来就是三句话：大众市场找盲区，垂直领域打刚需，细分赛道做生意。很多时候我们在看一些产品和品牌的时候，早期可能觉得它是很垂直的赛道，实际上它来源于大众市场。

就像 DJI（大疆）早期的时候，大家以为它只做航模。它真正要做的是航拍和摄影，它的大众市场是摄影，航拍是盲区。你去看它的产品定义，通常是你看不懂的形容词和你看得懂的名词搭配在一起。最早大疆去打它的 PMF（产品市场契合度）宣传标语是「会飞的照相机」。Narwal（云鲸）也是一样，清洁是大众市场，拖地是盲区，所以产品定义是「会拖地的扫地机」。Ecoflow 之前也有户外用电、燃油发电机和大型用电设备。它当时主要突出的优势就是快充，因为应急是盲区，用电是大众。录音是大众的，但是转写总结是盲区，所以有人做了一个用 AI 纪要的录音卡。

如果我们把视野再放窄一点，来看看 AI 硬件的「Hardware PMF」（硬件产品市场契合度）是什么。首先，它是当下既有的刚需，这个需求可能已经通过其他产品形态，不管是软硬件形式，多少有点验证了。

其次，它必须得是新的硬件形态。很多注重软件或者从软件出身的团队需要花时间理解这件事情。如果你真的是做 AI 硬件，它的本体是一个硬件，你需要用一个新的硬件形态来圈定属于你的场景。这样子用户才会对你这个产品重新建立起一个价值和价格的锚点。它把原本是一个条状的录音笔变成录音卡，放在手机背后或者钱包里面或其他地方，这就是它的硬件形态改变和场景改变，所以你就可以重新定义这个交互形式。

最后是独立闭环的软件商业模式或生态。你的软件必须得有设计出来的商业模式，能够去收费。

有关 AI 硬件 PMF 的思考 | 图源：极客公园

我们也给大家分享一个简单的思考方向：可以尝试将 iPhone 自带的 Tier-2 应用硬件产品化。

例如，录音功能本身就是一个应用，你把它单独拿出来，做成一个更好的录音设备。你会发现其实你把这个功能摘出来之后，会更好用。你不会在录音过程中被打扰，也不会被电话接入打断。因为你摘出来变成一个独立的硬件产品，你的使用场景就更丰富了，不需要每次录音都掏出手机、解锁并点击应用。

有关 AI 硬件创业的思路分享 | 图源：极客公园

我们可以从这样一个角度去思考：如果你想把你手中的 Tier-2 应用变成一个硬件产品，它会是什么样子？因为手机本身的 Tier-2 应用已经代表了既定的刚需，所以你可以从这个场景中找到一个或许能更快尝试实现 PMF 的方向。

04

新业务、新基金与新玩法

另外，也跟大家分享一下我们最近的进展，包括我自己这边的业务孵化。我本身也在做一些定向的业务孵化，我跟我的创业导师高秉强教授联合发起组建了 H 3 Future Venture Lab，我们定向（带着 PMF）去找团队，发起和孵化一些创新的产品或业务，去做一些寻找 Founder-Product Fit 的工作。

其次，我今年跟极客公园的张鹏总一起联合发起了一个「变量资本」旗下的新基金 N 2 Fund，去帮助 Day one 就 Born to Global, Born with AI 的硬件产品早期创业者。

我们最近在深圳开了一家全球创新旗舰店，它是 Kickstarter 目前唯一一个也是首个在国内官方授权的线下空间。

值得讲的一点是，很多人都希望科技产品可以有更多与大众接触和体验的地方。在我看来，把产品零售摆在一起来卖，这个事情很多人都在做，你会在商超、机场、旅游景点看到。但有一个点我一直没有想明白，在做这件事情之前。其实你在线上和线下购买一个消费电子产品，它的功能都是一样的。消费电子产品不像服饰、时尚单品或者艺术产品，具有买手的溢价。那怎么样能够打破这个商业模式，让它可以去到最好的地方？刚好今年很独特，你们也看到了有那么多的创造类工具，我们是定义了一个新的消费电子创新产品的零售模式，它是基于 POD（按需打印）定制化服务基础的创新产品线下零售。

怎么理解？你如果有机会去深圳，可以去看看 INNO100。你到里面可以去体验全球线下唯一能够体验的地方，虽然它现在还没有开始卖。但是你可以通过这个店里的小程序，去下单，去定制一个冰箱贴。

Kickstarter 官方授权的 INNO100 全球创新旗舰店 | 图源：极客公园

在过去这几天我们做了一些很有意义的尝试：我给我港科大以前的老师送了一幅由 AI 做成的油画，实际上是用 UV 打印机打印出来的；我们给博主他的宠物小狗做了一个冰箱贴；我们还可以去印制 T 恤。过去一两年所有 C 端定制化的产品，从工业级产品已经下放到桌面来了，我们才能够做这件事情。这也是我们看到在科技产品、线下空间和零售中很新的一种玩法。

通过这样的形式，就会让用户有去线下的动力，去享受服务的动力，才会重新变革这里面的整个商业模式。

流量时代的失灵：AI 能否让经营者重新看见真实需求？

极客公园

2025年12月11日 10:36

整理｜ Moonshot

编辑｜靖宇

在这一两年里，我们被反复提醒：AI 正在重塑一切。它在改变创作方式，改变知识分发方式，改变我们对「效率」与「增长」的定义。

但在前沿技术叙事之外，有一群人的声音往往被忽略：那些撑起地方经济、在反全球化浪潮中迷茫的中小企业者。

他们既不是大公司，也不是受资本追逐的创业者，而是当地餐厅、跨国小工厂、手工艺工作坊、贴纸品牌、区域零售商……他们的经济活动真实而微小，需求分散却具体，经营压力长期存在，信息与资源高度不对称。

而今天，AI 的快速演进让这种差距被进一步放大：算法广告越来越精准，却也越来越昂贵；供需匹配越来越高效，却也越来越偏向懂技术、懂流量的大企业。

Lexi 希望「市场营销」不只属于大公司｜图源：极客公园

在这样一个「计算广告越有效、市场越失衡」的时代，一个本地中小企业主究竟该如何在没有数据科学团队、没有复杂技术栈、没有巨额预算的情况下，找到自己的增长信号？

这正是 Sandwich Lab 想回答的问题。他们想讲一个关于 AI、关于营销市场的演变，更关于普通人如何重新立足，并掌握未来的故事。

以下是 Sandwich Lab 创始人兼 CEO 郭振宇在极客公园创新大会 2026 上关于 AI 如何赋能中小企业者的演讲实录，由极客公园整理：

嘉宾观点：

我们认为，这个时代市场的「充分性」正在被侵蚀。
市场信号的观测上有非常大的迷惑，你看到的数据不代表真实的反映市场需求的洞察。
所有机制与工具都在试图提高供需匹配的效率、重新配置社会资源，从而带来新的供给增长。
计算广告越有效，市场越失衡，这听上去反直觉，但已经发生。

我们在 IF 2026 上聊了很多 AI，前沿的技术，如今我想花一点时间聊聊中小企业，以及它们在当下所面对的市场环境。

先来看一家曾经开在温哥华的咖啡店。这里每天小批量烘焙来自不同产区、不同风味的豆子，用极有耐心的萃取方式，呈现出非常好的口味，店铺氛围也非常社区化、令人愉悦。店员偶尔会在社交媒体上分享一些顾客的体验，但显然他们几乎没有做任何系统化的营销。

倒闭的加拿大咖啡店｜图源：Sandwich Lab

结果是，这家店很快就倒闭了，哪怕许多顾客在这里第一次真正体会到咖啡的完整愉悦。

有没有类似的经历？你费了很大劲订到一家餐厅，吃到的却是「流量好」的餐厅，而非「味道好」的餐厅；你长途跋涉去了一个目的地，看到的是网红打卡点，而不是美景本身和人文体验；结束一天的工作，你走进电影院，却看到某位流量明星的「流量电影」，而不是情感动人、逻辑严谨的作品。

我们认为，这个时代市场的「充分性」正在被侵蚀。

去年，我们创立了一家叫 Sandwich Lab 的公司，希望帮助中小企业解决增长困境。而在解决问题之前，我们需要先理解市场是如何走到今天这一步的。

01

找到需求，带来效率

长期以来，所有机制与工具都在试图提高供需匹配的效率、重新配置社会资源，从而带来新的供给增长。

比如价格机制，在计划经济时代，价格由主管部门制定，往往严重偏离价值，导致供需错配与资源浪费。因此我们全面拥抱市场经济，让价格由供需决定，从而带来更高效的匹配，让价格不断趋近真实价值。

再比如区域机制，如 WTO 等全球化努力，在不同区域之间提升商品交换效率、减少阻碍，使供需匹配更顺滑，并推动了全球商品经济长期繁荣。

最后是更微观的手段，典型如广告与营销。它们以极直接的方式把供给呈现在消费者面前，让消费者知道「你可以买什么」，大幅提升供给对需求侧的渗透率，从而进一步催生经济增长。

广告本身也经历了漫长演进。从 19 世纪初美国邮政购物与铁路结合带来的商品繁荣；到 20 世纪 50 年代有线电视的普及，使广告成为最有效的传播方式。

统一的媒介和内容催生了标品繁荣：无论城市乡村、不同国家，大家买到的都是同样的饮料、同样的纸尿裤。

全球化市场打破了国界｜图源：Sandwich Lab

谷歌兴起后，我们进入计算广告时代；随后是推荐与信息流广告，再到短视频时代的内容化广告。广告对消费者日常生活的渗透率更高、频次更密、个性化更强，这不仅催生商品经济进一步发展，也带动了过去无法被发现、无法被满足的大规模非标品需求爆发。

所以我们看到：计算广告非常好，非常有效。唯一的问题是，经营者必须自己找到准确的「信号」，才能真正用好它。这个信号就是：需求在哪儿。

我们来看一个客户的例子。Paul 是一家本地辣椒酱品牌。店主退伍后，用家里仅有的积蓄复刻奶奶的童年味道，组建小团队，建立线上线下渠道。他们尝试在 Facebook 上投放广告，最初有一些成绩，但很快遇到受众饱和。他无法从繁复的广告后台理解下一步该怎么做，因此来到我们的产品——Lexi AI。

再看另一个客户 Frank，他在美国经营一家跨国家具公司，既做 D2C，也做 B2B，总部在西雅图，工厂在亚太。消费者可以在独立站、亚马逊、Costco、Home Depot 等渠道买到他的产品。

Paul 的辣椒酱店｜图源：Sandwich Lab

疫情期间他享受了消费红利，但疫情结束后，红利消失，美国房地产与家装支出迅速下滑，竞争加剧，零售商账期变长，他面临巨大经营压力。于是他把目光放到美国之外的中东与东南亚。

在这些地区，家装家具支出上升，人口与消费习惯改善，需求确实存在。但他对当地语言文化毫无了解，也不知道如何制定策略，便把美国经验照搬过去，结果可想而知，遇到瓶颈，反馈信号有限。最终他也来到 Lexi AI。

在今年夏天我们的产品上线后，短时间内就获得来自 90 多个国家、各种类型中小企业的付费用户。

从波兰的个人陶瓷工作室，加拿大的定制贴纸品牌，南非的功能性女性内裤品牌，印尼的个人金融服务机构等等。

这会让人产生一个疑问：经营者不应该最了解需求吗？为什么他们需要我们来告诉他们需求在哪里？

02

经营者的盲区

我们再看一个知名的例子。

在市场信号的观测上有非常大的迷惑，你看到的数据不代表真实的反映市场需求的洞察。

1985 年的可口可乐面对百事可乐冲击，可口可乐管理层「亲口试喝」得出假设：百事更甜。

于是可口可乐动用更庞大的研究团队，做了 19 万次的盲品测试，结论是「美国消费者喜欢更甜的可乐」。他们停产百年配方、推出 New Coke，并进行了大规模营销。

可口可乐一度「抓错信号」｜图源：Sandwich Lab

结果全美消费者和媒体集体抵制，可口可乐不得不出来道歉，恢复百年配方，停产新可乐。很显然「用户喜欢更甜的可乐口味」这个需求信号是错误的。

这个信号为什么错？因为真正的原因是：百事更便宜五分钱，并且大量签约当时的流量明星，密集触达新一代年轻人。而可口可乐管理层因年龄层较大，完全没有接触到百事的营销，所以错过了真正的信号。

这个故事我们想说明的是：强大如可口可乐这样的消费品公司，如此熟悉用户和市场，仍然会抓错真正的增长信号在哪儿。

回到今天，广告技术越来越有效，但能真正用好的，只有少数大企业。这就导致计算广告越有效，市场越失衡，这听上去反直觉，但已经发生。

那 Sandwich Lab 想做什么？AI 又能做什么？

03

AI 能做什么？

我们构建了一套完整体系，利用 AI 覆盖增长决策的全部三个环节。

第一步，用 Lexi 的 AX 系统在庞杂的数据中去噪，从基本面、消息面、技术面中找出潜在真实的增长信号。

第二步，用内部的 evolved 引擎进行策略与信号的迭代、验证与测试，以统计方式最快确定「此时此刻对用户最有效的增长信号」。

第三步，把信号转换为策略，把策略转换为可执行资产，并以可规模化方式执行，再持续在三个环节之间循环迭代。

郭振宇讲解 Lexi AI 的技术原理｜图源：极客公园

回到 Paul 的例子。他最初把注意力集中在一个刻板的典型用户：本地、男性、喜欢烧烤、在后院做 BBQ。

很快，他不知道还能向哪里寻求增长。而 Lexi 会自动分析不同地区、文化、人口结构中可能存在的新场景：比如家庭料理、女性用户、聚会与送礼、夜宵与加班等。

我们的 EVOLION 会自动生成可执行策略，并用极低成本快速验证，放大最有效的方案，持续提升增长。

我们希望通过服务一个又一个像 Paul 这样的中小企业，逐步推动全球市场重新走向更平衡的状态。这不仅是帮助单个企业，而是试图从多种方式促进市场再平衡，为整体经济带来更大繁荣。

借今天这个机会，我们也正式宣布：在成立一年多后的今天，我们刚刚与业内头部 SaaS 服务平台达成深度合作。从 AI 建站到自动化营销，实现全链路、全托管的协作；同时获得了全球 50 万家企业的信任。我们正式签订了总额 9600 万美金的订单*。

未来，希望有更多行业伙伴加入，让我们能更快服务全球更多中小企业。

谢谢大家。

注释* 数据源自 Sandwich Lab 全球业务统计（截至 2025 年 12 月），含生态合作伙伴及试用商户；金额指相关战略合作意向总值。

AI 时代的超级个体，正在小红书上寻找自己的绿洲

极客公园

2025年12月11日 10:31

整理｜徐珊

编辑｜郑玄

2025 年，AI 浪潮带来的不只是技术奇点，更是一场深刻的、直击灵魂的个体觉醒。

我们曾以为，伟大的创新者总是那些孤独的探索者，一个人在冰冷的算法世界里艰难前行。但在这场宏大的变革中，一切似乎有些不同，我们发现了：超级个体的成长，从来不是一场孤立的硬核探索之路，而是创造者们与用户之间的「双向奔赴」。

AI 将生产要素变得极度低廉，一个人的力量足以顶替过去一个团队的效率。它推倒了曾经高耸的技术壁垒，同时也让所有创新者直面一个拷问灵魂的问题：「在技术不设防的时代，我的价值，我的护城河，究竟是什么？」

这个问题的答案，藏在一个充满了「活人感」的社区里，也藏在那些最真实、最普通的个体需求中。现在，小红书正以独特的姿态，成为开发者对抗焦虑、寻找创新灵感的「绿洲」。

Plan Coach 创始人苏晓江的故事，是一人公司最真切的写照。他曾是大厂的技术主管，但也会因「不想刷碗」而开始拖延。当 AI 将他的拖延症状拆解成「你只要站起来就算赢」时，他通过这个微小的洞察，用一天时间做成了一个抗拖延 APP 的原型。当他将这个不完美的「雏形」扔进社区，回应是山呼海啸般的热情，在贴文下，他获得了 26 万赞，和 1000 多条用户真实反馈。用户成为了他产品的「精神股东」。

面对潮水般「你们会不会跑路」的追问，他选择不再让 AI 去「审核」掉文字里的紧张感，而是用最真实的口吻回应：「在某种意义上，我已经跑路了，但是我仍然在开发这个 APP。」这种不卑不亢的活人感，穿透了屏幕，和用户们之间建立了最深的信任。他渐渐发现，真正的护城河，不是技术，而是你与用户之间基于真诚所建立的不可复制的关系。

而 Macaron AI 创始人陈锴杰的经历，更加展现了在 AI 时代，「做自己」才是最高级的商业策略。他坚持将 AI 产品设计成「粉红色马卡龙」，与极简冷淡的科技风格格格不入。社区用户的惊喜反馈是：「配色好好看！」，他由此确信，用户需要的不是冷冰冰的效率机器，而是能改善生活、带来精神共鸣的「搭子」。他感叹，当你很自我陶醉地去开发一个你深爱的东西时，用户是能够感知到的。

正如小红书科技运营负责人散兵所说，过去一年，许多真正带着活人味的「小红书 Native」原生产品，正在这片创新土壤中生长出来。如今，平台已汇聚超过 5 万开发者。不少超级个体们正在这里挖掘真实需求、找到第一批种子用户，并将产品的迭代视为一场与用户的极致共创。更重要的是，平台现在也成为了一个高效的「连接器」，链接了生态的关键环节：创业者找团队，投资人找项目，科研大佬和 AI 负责人们在这里招聘、分享技术成果。

AI 时代，技术壁垒坍塌，所有的生产要素都在变得易得且便宜，「你想做什么」这件事情，变得愈发重要。这场关于对抗焦虑、寻找方向与构建用户信任的深度对话，便是超级个体们献给所有追梦人的成长指南。

图源：极客公园

以下是极客公园 IF 2026 创新大会上小场对谈《AI 时代，超级个体如何找到成长的「绿洲」》的对话实录，由极客公园整理：

01

Ask Me Anything 如何成全民热潮？

一场科技圈的「双向奔赴」

Koji：我想知道现场有多少人参与过 AMA（Ask Me Anything）。AMA 的风是从小红书上刮起来的。所以，小红书的散兵可不可以给我们复盘一下，你们从社区运营的角度，怎么开始把它推成了一个全民的风潮？

散兵：其实最开始我们是想做一些研究者的拉新，我们在海外的科研群体做了一波学者的拉新。当时我们其实遇到一个比较困难的问题：这批学者是比较内向（i 人）的，不知道怎么在公开场合跟大家对话，也不知道怎么在社交媒体上发布自己的第一篇帖子和笔记。

我们就找到了一个范式：AMA 在科技圈，比如在 Reddit 平台上，在海外之前就有流行过一阵，但是在国内还没有这样的风潮出现。我们说，要不让这些学者用这种方式试着跟大家开启第一轮对话。一开始我们只是想帮他们缓解社交压力，给他们一个范式，能够跟普通人有一些对话的场合，但是意外地发现效果非常好。

因为我们第一波找到的像许华哲这样的教授，来了之后跟大家去聊「我是许华哲，大家可以问我（Ask Me Anything）问题」。下面的反馈非常热烈，很多学生和想要步入 AI 行业的人，以及单纯对 AI 行业感兴趣的人，都会在上面问各种各样的问题。

我们看到这个趋势以后，觉得好像大众很喜欢用这种比较平等的方式跟「大佬」去进行对话。另外，这些真正有能力、愿意表达的人，他也需要一个渠道跟普通人去沟通。因为大部分的公开场合，大家都会觉得他们是高高在上的，是一些有距离感的、不敢对话的场合。这其实是一种双向奔赴。后来我们就把 AMA 的模式泛化到各种各样的场合，我们先从科技圈开始泛化，像李开复老师这样的大佬也开始在小红书进行 AMA，再往后我们往不同的圈层去泛化，后面会有像文学圈、戏剧圈、脱口秀圈。

比如余秀华老师，她也会在小红书跟大家 AMA，大家去看看余秀华老师的帖子，下面的回复非常精彩。再往后，我们觉得普通人的每一个经历——你的生活经历、你的工作经历——其实也都值得被看见，值得和大家对话。到目前为止，在小红书上已经变成了普通人问普通人的 Ask Me Anything 的趋势。

回到科技场合，AMA 让我联想到的是科技圈 Web2 时代，非常开源精神，大家都是无条件地去表达、分享和共同对话。回到科技圈，我觉得 AMA 确实是帮助科技圈的人能够互相认识、互相对话的一个非常好的形式。希望大家能够一起来参与，大家可以试着今天发出自己的第一条 AMA。

Koji：接下来问，作为内向者（i 人）陈锴杰，你在社区参与 AMA 的时候，评论区也有很多的回复，你整个感受是什么？有没有特别好玩的故事？

陈锴杰：我感觉大家问的问题有的时候还挺刁钻和犀利。我当时抛出来的时候，对这些问题并没有太多的预设，但是很多人在下面对我们的产品提出了很多建议，我觉得是非常有趣的。比如说「为什么你的生成速度那么慢」，「为什么打开都要等」，也是让我看到用户真正的需求在哪里。虽然是 AMA，但是感觉变成了一个产品讨论和辩论的小空间，那个空间里面大家就在畅所欲言，很多评论下面还有继续评论的。有时候有一个人问完，我甚至自己还没有回复，就有其他用户帮我说「这个产品是不是可以这样设计」，接着大家就讨论起来了。所以我觉得非常好玩。

02

用户成新产品的「精神股东」，

开发者随时验证产品需求

Koji：接下来想问一下苏晓江。晓江做了一个特别有趣的产品叫做 Plan Coach，是一个针对拖延症患者的小产品。当时它也参加了谷歌和小红书发起的「黑客松」，拿了冠军。那个产品当时从 0 到 1 的过程，可不可以跟大家分享一下是怎么找到这个切口的？

苏晓江：可以的。我在开发它之前，已经在开发另外两个东西。第一个是一个笔记类 APP，我开发了有三个月，开发到三个月之后，我感觉节奏不太对，应该把这个东西拿出去给大家看看，听听回响，让别人看看这个方向是怎么样的。我想应该拿一个轻一点的东西去试一下，看看这个方向是不是对的。有这个想法的时候，当时有一个比较火的 HDR 表情包，它会很闪，我就做了一个 HDR 的 APP，结果没有火。

在回归笔记类 APP 的过程，让我印象深刻的一个点是，当时我想去刷碗，但是我有点拖延。你问我对我的个人评价，我其实并不算是一个拖延的人，在开发的过程中我是不拖延的，但是让我做家务，我很不愿意动起来。当时我想到一个点，以前在其他地方看到过，如果你把一个拖延的事情拆得非常非常具体，做了它的第一个步骤你就可以动起来。我抱着试一试的态度试了一下，当时我用 GPT 拆了一下。

我记得它说：「你现在需要去刷碗，第一个步骤你需要先站起来，你只要站起来你就算赢了。」跟我想的不是特别一样，它并不是要我去考虑后面众多的步骤需要怎么做，我只需要考虑站起来就行了。然后我就站起来了，我就真的把碗给刷了。我感觉很神奇，我就又去做了一些调研，差不多用一天的时间做了一个 MVP（最小可行产品），发到了小红书上，在小红书上一天得到了 3000 多赞。

Koji：这是你的第一条笔记吗？

苏晓江：不是我个人的第一条笔记，我之前也发过比如 HDR 的 APP 的笔记，但是无人问津。当时无人问津导致我有一个疑问：我发的这个东西、我做的这个东西到底有没有人能够看到？如果发到小红书上都没有人看、没有人点赞，我发到市场上到底有没有人买？作为开发者，毕竟最后是要赚钱的，有没有人买这更是一个疑问。当时 Plan Coach 雏形出来之后，一下子 3000 多人点赞，我就觉得原来是可以被看见的。

Koji：所以小红书是你一个低成本实验想法、验证用户需求的地方。

苏晓江：是的，一下子收到了回响，就有动力做下去了。他们会在底下提需求、提反馈，我感觉这个东西可以做下去。

Koji：陈锴杰，你的从 0 到 1 是怎么找到切口的？比如马卡龙这个产品。

陈锴杰：「0」不知道从哪算。马卡龙是我的第三次创业项目中的第二个产品，它的前身是一个互动 AI 小说。当时看到马卡龙这个产品其实是因为发现 AI 在市面上解决很多生产力的事情。比如今年初 3 月份 Manus 发布，大家都在用 AI 做 PPT，用 AI 写报告，用 AI 做表格。当时我觉得 AI 把这些做得很好，没有问题，但是好像生活里缺少了能让我们生活得到改变的事情。只是刷碗这么一个简单的事情，在我的场景里，如果我想运动得更好，我想吃得更好、睡得更好，有没有 AI 能够帮我把这些事情给做了？所以当时是从「生活」作为出发点做了马卡龙这个产品。

Koji：你一开始验证马卡龙这个产品需求的时候是在哪里？

陈锴杰：其实不是在小红书，当时我是先找我们之前产品的用户做的访谈，因为那些用户正好就在我们的列表里。当时跟大家聊天的时候，感受是这样的：我们的前一个产品大家可以进去做一个互动小说，大家会说在做完一小时、两小时的互动之后，觉得有一些空虚。问为什么空虚？因为又要回到现实生活里面去，可能是刷碗这样的小事，但是我们更多用户反馈是又要去学习或者又要去上班工作，或者又要和家里人相处，不想和家人相处。

我想如果我们能够提供这样一个小应用，假设你希望自己学东西，我如果能让你自己在这里做一个学习计划，这个学习计划能够把你的东西很清楚地排好，会不会可能对你来说有点用？当时去跟每个用户聊，跟他聊完之后，我就赶快到后台做一个出来，推送给他，我就把网页给他了。他用完之后说「好像还不错，我继续试试看」。最早就是从这样的想法来的。

Koji：散兵，在小红书上活跃着很多开发者，你觉得开发者们像晓江这样去验证他们的想法，试着发一条笔记，这是一个常见的大家的行为模式吗？或者你有没有看到一些别的有意思的大家用小红书去验证想法的做法？

散兵：刚刚，晓江讲的是一个很常见的开发者在小红书去验证需求的模式。我们一直说小红书是非常真实的、有人感的社区，它承载着最大的、最真实的人的需求。最真实的用户和最强烈的需求在这个社区上，它是你收获你的产品是不是真的有需求、是不是解决了大家需求的最重要的场合。

我们之前和开发者对话，发现大家通常有几个痛点。第一，我不知道我的需求是不是真需求，我有没有自嗨，这是最需要拿到市场反馈去验证的，通过用户验证你的需求存不存在。第二，他们觉得今天在国内的交流是一个蛮难找到空间的地方，在小的地方交流，他们担心自己的想法是不是被抄走了，在一个公域的场合交流，大家会觉得自己的声音是不是无人问津、是不是无人在意。

在小红书，恰好提供了一个比较适度的空间，大家去提供自己产品想法、验证自己需求的场合。这是今天非常真实的社区带来的价值。运作方式和晓江很像，你可以拿自己的产品、拿自己的原型（PMF），甚至可以拿自己的想法跟大家交流。「我要做这个事，大家觉得 OK 吗？」如果真的觉得有需求，会有人来响应的，这是今天社区的价值。

陈锴杰：说到找需求的过程，其实马卡龙最早找需求不是在小红书发生，但是发布的那一瞬间是在小红书发生的。我自己心里其实是很担忧的，这个产品做出来市场上的接受度会怎么样。发上去的那一天，特别好的感受是很多用户就开始自发地做帖子了，也不是在我的帖子下面评论，他们自己去发帖子描述这个应用他们的感受。

当时我印象最深的是很多帖子说：「配色好好看！」我们是一个比较粉红的马卡龙。当时的设计我和设计师纠结了三天三夜，到底要不要放一个有颜色的东西，因为所有的 AI 产品都不是颜色鲜艳的。我如果这样做，会不会大家反而很讨论，说「四不像」，什么都没有做到。我觉得这不是在找需求，反而是后续验证过程中给了我很多支持。

散兵：锴杰的这个例子，我可以给大家一个数据，小红书平均每个开发者可以收到 20 条自己产品的改进建议，当然锴杰是收到更多的。我觉得这是一个非常强烈的用户给你自发反馈的渠道，包括非常多利他和互助的心态，他喜欢你的产品，他甚至会不断地给你提建议，甚至推动你赶紧去更新版本、赶紧去迭代。这也是一个非常有特色的社区状态。

苏晓江：我差不多能收到 1000 多条反馈，他们会把自己当成精神股东去看你的产品，像一个养成类的 APP 看你的 APP 有没有根据他的建议去成长，成长以后，是不是做到了自己提的建议的那个样子，参与感是挺强的。

Koji：今天有一个非常热门的词叫做「一人公司」。我们也想从另一个角度问一问，你们觉得有没有什么坑是大家要特别注意的？

苏晓江： Plan Coach 其实是我作为 APP 开发者的第三个产品，这也是一个踩坑的经验。第一个笔记类的 APP 花了三个月，第二个 HDR 的 APP 花了一个星期才发布，Plan Coach 是花了一天就发布了。我本身的实践是我要越来越早地把我的产品抛出来，让市场去验证。如果让我给建议，我会建议大家一定要尽可能早地把自己的想法抛出来，投石问路，扔到水里，看看收到的涟漪到底是怎么样子的。

陈锴杰：我的感觉很类似。当时在做的时候，很早就和用户开始接触，可能没有抛出来，但是就做了很快的反馈。我有一个感受，不知道算不算坑，但是我身边有很多朋友其实是抱着想创业的心态在做一个新的产品。他们的状态更像是我每天很认真地在想到底应该做一个什么新产品。如果这个人技术恰好特别强，可能这个产品更没用一点，很有可能一直在想到底要做什么，想出来了一些其实没有那么有用的东西。反而是我身边的一些产品经理，他自己生活中有些困扰，或者觉得这个东西不好，很「傻」，一直在吐槽，把它变成产品之后，好像收获的效果还不错。如果说是一个坑，可能就是不要一直想我要做什么产品，而是应该发现自己生活中本身就很想吐槽的东西，把它变得更好，或者身边朋友在吐槽的东西。

03

AI 时代下创业，

人越少，才能跑得越快

Koji：我们知道今天大家做 APP 的速度变得非常快，在一个智能极其充沛的时代。晓江，今天你自己在做 Plan Coach 过程中，有哪些开发上的变化是你感受特别强的？第二，收到那么多用户反馈，你是怎么面对 1000 个来自小红书的问题的？

苏晓江：我之前是一个技术主管。人越多，科技提供的加成是越来越少的。因为有很多的汇报问题、人类的沟通问题，一个人（开发）的时候是完全没有问题的，自己跟自己沟通就行了。我要做一个技术选型，自己跟自己评估一下，没有任何的延迟和信息消耗。

从 Plan Coach 时代最初的开发到不停地去迭代，不只是需求的验证速度会快很多，技术选型、技术的验证也会非常快。做开发的人都懂，我们在做到一定的复杂度之后，要重构，把它的复杂度降低。我可以一天重构多少次，重构不行，我可以让它回到第一版，这在以前是完全不可想象的。以前尤其是多个部门协作、很多人协作，涉及到技术的变更，从讨论到落地到验证，再发现不对再回去修改，周期太久了，现在用 AI 非常快。

其次，关于怎么排期和划分优先级。这个产品最终的发展方向是需要自己去定的。我个人做事的方法是定下来这个主线之后，既然有这么多反馈，我就可以选择哪些反馈是符合这个路线的。因为现在小红书也提供了比如群、投票，再加上一些评论，我会经常发一些投票，在群里听他们的反馈。比如上次一个投票，我会把四个功能作为投票的选项发给大家，我会选择大家投票数最高的作为接下来优先级比较高的大的功能去做开发。我们目前四个「大招」就是按照投票结果顺序去做的。

Koji：锴杰，有没有什么是来自用户给你的需求，是一开始你完全没想到的，但是你接受了之后，上线了，得到了很好的反馈。

陈锴杰：在马卡龙里面，更多的是品类和方向会得到正反馈的结果。马卡龙本身是一个 Personal Agent，最大的功能是创建自己的小应用，在不同的场合。我们一开始对小应用的方式没有做太多的限制，既可以是个小游戏，也可以是记录生活的，也可以是旅行的指南。

用户很多时候给我们提的是他很想要这个方向的功能，比如当时有一个用户提我很希望把语音输入加进来，这样对着我的小应用一通输出之后，它就可以帮我把我的输出整理成今天的代办事项，然后我再一个一个勾掉。市面上没有专门的 APP 做这个事情，它就是一个语音转代办事项很具体的事情，多样组合模态的生活记录是一个不错的方向，我们就做了这个事情。包括自动提醒的能力，也是用户强烈要求后加上的，很多功能就是这样一步一步迭代出来的。

Koji：锴杰刚才提到这是你第三次创业的第二个产品，这一次做产品，在 AI Coding 风靡全球的背景下，你感觉到有哪些不同？

陈锴杰：最大的不同是我太想太想控制组织的规模。我们今天也不大，只有 30 个人，但是我很希望它就不要再更多人了。原因是因为我感觉一是 AI Coding 能做的事情太多了，一个可以顶过去 3 个人、5 个人的工作量。二是因为 AI Coding 在不断地发展，或者大模型在不断地发展，时代变化速度太快了，以至于我们今天搭建的组织或者搭建的功能团队，在两个月之后，它就要重构，或者我们的方向就要变，这个时候组织的调整速度一定要快于技术的迭代速度才行。所以我们就希望把组织变得很小，很敏捷地去迭代。

Koji：这是一个重新定义职能的信号。你们有没有具体的做法，比如会设定不一样的岗位？

陈锴杰：我们看到了一种之前比较少见的但是一定会出现的形态就是 Agent 工程师。Agent 工程师是真的非常难找。我觉得他首先有技术背景，能够做后端的东西，比如他能够去处理容器、处理流程调用。但他同时也要有产品视角，因为 Agent 的工程师得写提示词。提示词每一个词都是在改变模型的分布，让它的输出有不同的内容，每一个词都很关键，所以他要有文科生的思维，他的提示词又要贴着用户去写。当他有了这两个能力，他还要能够非常好地做开发里的叫 CICD（持续集成/持续交付）流程，这个能力是非常少见的。

04

小红书如何成科技开发者的连接器？

Koji：请教一下散兵，作为连接器平台的视角，你希望提供什么样的社区土壤给到开发者？

散兵：小红书的科技发展到今天，时间也不长，才两年左右。现场都有一些同学，他们对小红书的认知还觉得我们是一个生活方式的社区，离科技还是挺远的，这是我们经常听到的一些声音。但是真的离今天的产品开发、离科技前沿的应用，甚至到 to C 场景的使用，最前沿的这批开发者和人已经在利用这个社区来验证他们的产品构想。我们差不多两年的时间，到 2025 年，今年我们已经拿到了非常快的增长，科技内容的发布差不多涨了 100%，科技创作者的成长涨了 200%。我们的站内现在有超过 5 万名的开发者，有超过 90% 的人每年发布不止一款产品，这里已经变成了一个非常旺盛的产品创作和用户沟通的土壤。

过程中，我们还是做了一些自己业务策略的变化。最早我们看见的是中文互联网科技讨论缺少一个非常强的公域讨论场。2024 年我们全年解决的是怎么让小红书成为科技人的「第二个朋友圈」，因为大家需要一个偏公域的场合表达自己的想法。这个想法不用像每天开发布会一样，就是「我今天有一个什么想法，有没有人需要？」「我发了一个新功能，大家来测一测。」甚至在小红书很多人用来招聘和找到自己志同道合的伙伴，这是非常常见的。这是我们在 2024 年到 2025 年初完成的一个构想，Plan Coach 就见证了我们从朋友圈到连接器的变化。

到 2025 年，我发现绝大多数科技圈的人已经在小红书做表达。我们觉得作为一个平台，我们的定位不能止步于单纯的内容交流，我们应该帮助开发者和行业里的人给到他更多。比如我们能不能在连接用户的场景下帮他实现更多的价值，比如我们今天上线了小组件的能力，你的产品就可以用更轻度的方式在小红书内做验证。比如我们现在已经有一些智能硬件的测试可以在小红书发生，可以做早期小的众筹和售卖，在小红书也是支持的。大家应该也知道很多投资人直接在小红书上找项目，小红书可以帮助你融资，帮助你找到同行的创业伙伴。这是今天我们的社区基于朋友圈价值上延展出来的能力。整个 2025 年我们所有的增长是慢慢地把连接器的价值做扎实。整个 2025 年我们所有的增长是慢慢地把连接器的价值做扎实，到 2026 年我们希望把连接器的能力能够做得更好，让新的 AI 创造的土壤能够发生在小红书。

说得简单一点，今天在国内的生态位上，我们很希望实现，如果大家想要做 AI 创新或者新的创新，第一个想到的平台是小红书。我们希望做到这样的地位，因为我们这里有最真实的用户需求，我们有最强烈的用户反馈，有最多元的验证你的产品构想的方法。长期来说，我们也希望能够从这片土壤里长出下一代非常强的独角兽或者新的创意公司。

陈锴杰：我也可以补充一个讨论。我自己的小红书是 7 年前注册的，那个时候我就尝试发科技内容，但是那个时候发出来的内容其实没有人在意，然后我就去了 B 站。过去几年，特别是从去年开始，我们说「Building in Public」（在公众注视下做产品），我发现所有的国内产品摆出来，小红书可能是唯一一个最注重评论区的地方。你如果要「Building in Public」你就得和大家有交流，而小红书能够把内容限制在上面一块，但是下面有大量的讨论，这是非常难坚持的一个事情。所以对我来说，它是唯一一个可以做基础讨论的事情。从去年开始，我看到我身边很多朋友开始在小红书上刷论文。他看最新的论文不是去其他地方，而是去小红书上看，说明很多人在发、很多人也在跟、在讨论论文。我觉得太有意思了，所以我从去年开始发一些内容，慢慢又回到小红书来继续发东西。我感觉这是一个国内独有的生态，也是一个很特别的地方。

Koji：我觉得刷小红书有一个很神奇的点，在别的地方看科技内容看多了会觉得很焦虑，因为信息非常大，总觉得大量的新闻在发生，但是刷小红书不知道为什么整个人的状态是很轻松的，可能因为这些内容是夹杂在猫猫狗狗、花花草草里面的，气氛是轻松严肃活泼的。

散兵：我们在做科技的过程中找到了一个点。我们最早在做科技的时候，市面上主流平台的科技内容基本都是资讯和教程。大家应该还能回忆起最早 GPT 刚火的时候，大家看到的一个是资讯，另一个是教程，教程里面掺杂了非常多的焦虑（FOMO）情绪——如果我不会 AI，我将来可能会失业。我们当时聊的时候，觉得那不是今天大家真的坐下来去讨论的科技的价值。今天在科技领域传递给大家的情绪如果永远是焦虑的、紧张的，可能大家对科技的态度是对抗的。我们更希望用户跟科技的关系是一种平等的，它来帮助我，我来使用它，这样的一个姿态。所以我们当时很坚决地决定不去做资讯和教程这两个主流的品类，我们坚定地说我们要鼓励学者像普通人一样跟大众对话的内容，在小红书上做鼓励做发酵，也有了今天我们想要的不是那么焦虑，相对平和的一个感受。

Koji：你们在评论区和用户互动的时候，怎么形成了今天的风格？如果用一个词，我觉得是「活人感」，你们有没有一些总结或者感受？

苏晓江：有的。我最初的笔记得到了 3000 多点赞，远不是巅峰，巅峰是在那之后我又发了一条，初步形成 APP 雏形的一条，达到了 26 万个点赞。当时非常火爆，我印象非常深刻，加群的人，我刷了一分钟，非常快地刷屏，一分钟加群的人都没有刷完。点赞的人数，我把赞清空之后，下一秒一定码出来两位数的赞，特别火爆。带给我们的问题是我们没有遇到过这样的局面，我们不知道该用什么样的口吻面对这么多人，生怕说错一个字，生怕说了不该说了，他们不再给我们点赞了。后来发现其实我们应该还是回归不卑不亢的态度，他们并不是因为你说了什么话而去给你点赞，而是他们喜欢你的产品而已。所以后面我们就回归了比较平等的态度。

陈锴杰：首先肯定也不会骂他们，但也不会「舔」他们，我觉得是做自己。我发现大家到最后一定看清的还是真实的你自己，如果你在外面维护一个人设，你都会很累，而且你一定会暴露出来，所以与其那样不如一开始就做自己，想到什么说什么。甚至我身边的朋友他会在小红书的评论区吵起来，特别是研究员。为什么小红书的研究内容让人感觉压力没有那么大，我是感觉大家很多时候在发一个研究的时候不是在讲研究本身，而在讲大家对研究的看法和观点。大家很容易讨论起来，这种时候他也是在做他自己，他就像在面向自己的博士生同学、朋友一样，就是在实验室两个人遇到了，对今天发的论文有什么观点，他们就会吵起来。所以我觉得做自己可能是比较好的。

Koji：有没有什么样的回复或者故事，让你印象深刻，你又做了自己？

陈锴杰：产品和研究方向都有。我们最近在做很多强化学习，大方向大家都是认同的，但是怎么做争议还是很大的。比如我们在做的一个方向是用某一技术路线 Reasoning Model 让它的 Reward Function 更加地鲁棒，避免一些 Reward Hacking 这样的问题。在这个方向上，大家的思路是很不一样的，我们当时放出了我们的思路，大家就开始吵了，「你这个不对，我的论文是这么讲的，你把数据贴出来，我们看一看」，或者有的人就说：「你虽然这么说，但是这个方法你要再加什么东西可能更好。」当时有很多讨论，这些都是我们做下一步研究的灵感，所以还是很有帮助的。

苏晓江：我补充一下，刚才说的回复。我们当时决定走不卑不亢的路线还有一个原因，我们收到的很多回复都在重复一个问题：「你们会不会跑路？」我现在的身份是一个个人开发者，大家如果要买一个 APP，这个 APP 是一个个人开发者开发的，大家最担心的问题是，他没有品牌意识，也没有背书，会不会哪天就不更新了，跑路了。当时我们发现这确实是一个问题，因为它直接关系到信任。我们以前很怕说错话，我们会把回复的东西发给 AI 让它去审几遍，发现出来的文字是完全没有「活人感」。我们觉得你就应该以真实的自己去回复他们。我虽然平时说话比较容易紧张，但是在文字回复的时候，我还是挺喜欢开玩笑的。后来我知道这一点之后，我就释放天性了，该开玩笑就开玩笑。

陈锴杰：别人问你会不会跑路，你就说：「已经在准备了，明天就走。」

苏晓江：我回答过：「在某种意义上，我已经跑路了，但是我仍然在开发这个 APP。」

散兵：我听了这段很感动，因为我一直想要建的是有真实「活人感」的社区，这是小红书整个社区的初心。今天是在不同的领域大家开始慢慢理解这个社区的价值。陈锴杰最早看到的小红书生活方式的评论区，大家也是这么建立信任的。今天对于一个新的圈层——科技圈层进入小红书，依旧在用这个社区最真诚、最真实、最想要建立信任的方式跟这个社区里的人建立链接。这是非常让我感动的事情。将来科技这个圈层，包括我们再去拓展别的圈层，也会这样去跟用户对话，这样去建立信任，这样去沉淀，这是我非常开心的一件事情。

05

开发者的社区新玩法还有哪些？

Koji： AI 的开发者如果到小红书，想要做得更好，不管是从 0 到 1 还是从 1 到 100，还有哪些玩法可以推荐给他们的？

散兵：我可以讲一讲我们还能提供什么帮助。今天大家很关心如何获得流量，背后功利的点是如何更好地玩社区、跟用户对话。真实就是一个非常重要的手段，比如我及时地跟进，我把产品的迭代当作一种陪伴、当作一种共建、当作一种精神股东，用这种方式跟大家去对话，可能比我开发布会、「憋个大的」这种方式要好。这是在内容层面大家能够做的事情。

在未来，我们可以做的是提供更多的场域，不管是活动流量，还是线下的比赛。比如我们今年上半年有做独立开发大赛，今年我们也有比较大的「黑客松」，包括良渚的 Demo Day，这在独立开发圈子里算是小有名气的。未来我们会跟这样的更多的圈层合作，会给大家更多曝光的机会、流量的扶持和跟用户对话的机会。我们还会在更多的领域做一些新的活动和赛事，比如智能硬件。在黑客松领域有更多的年轻人和跃跃欲试的人，我们会给这样的人越来越多的场合去实现他们可以做的事情。

我们未来会在产品的实现链路上，能够更快地在小红书平台上去做验证。很多时候大家还是在种草，种完草之后，还是要去下载、去体验，转化的链路会更长。未来我们希望把体验和转化的链路做得更短，可能在小红书端内就能赶紧验证你的 PMF（产品市场契合度），最好的产品框架、产品能力直接「Go to Market」。我们是想做这样能够帮助到大家的事情。

Koji：平台还有一个视角，所谓的「上帝视角」。过去一年里，你从平台的视角里看到哪些在 AI 创新上的变化或者机会？

散兵：有一个蛮有意思的现象，不知道在座的开发者有没有感受到，营销这件事情越来越前置了，这是我们在平台视角里看到的变化。更早的时候，大家基本上还要拿出一个小的产品原型跟用户对话，但是我从这一两年的变化里看到越来越早，比如我开发到一半，我就来分享我的开发进程，甚至我还没开发，我拿着我的想法（idea）就来分享，这个事情大家感不感兴趣。

我觉得它的本质背后是一个市场的动作，它也是在用一种对话的方式来去验证用户的需求。这件事情在 AI 创新的时代是最显性发生的变化，因为之前的用户还是在追求所见即所得的价值，但是在今天大家都相信生产要素开始变得便宜，都相信技术要素开始变得便宜，大家都相信你「口嗨」的东西是能做出来的，这是今天一个非常强烈的用户情绪的变革。所以在这个时刻，可能口嗨不一定是一件坏事，有可能「口嗨」是你在这个时刻去验证需求，甚至是你找到最好的产品点子的方式。我们从上帝视角，鼓励大家尽早来「口嗨」，在这儿跟用户对话。

在智能硬件赛道上愈发的明显。一般的 APP 开发我们大概知道周期会更短一点，口嗨完了，比如大家等一个月，你可能能做一个原型出来，但是硬件开发是需要一定周期的。这件事情我们甚至在硬件开发的流程里都看见了，你可以先表达你的创意，然后你再去搞定你的供应链和原型验证。

06

超级个体的护城河：技术不设防，

唯有「关系」与「初心」不可复制

Koji：今天的主题是超级个体，想问一下锴杰和晓江，你们觉得超级个体的护城河是什么？

苏晓江：我现在感觉尤其技术方面是不存在护城河的。之前我用一些方式评估过 Plan Coach 的开发量，按照非 AI 时代一个常规的开发团队去做，需要差不多 40 个人，但是我现在一个人就把它给做出来了。而且现在 AI 的开发技术、AI 自身的模型能力在不停地迭代，我觉得没有在技术上作为一个个人或者作为一个技术团队能够一直保持自信，别人打不动你。

营销能力很重要。之前有一个我特别认同的人，叫「花叔」，他之前在小红书上也是非常火的，小猫补光灯的作者。他的产品他自己也承认是没有护城河的，就是一个补光灯，但是他自己成为了一个 IP，导致别人去下载，大家都认识花叔，都信任花叔，毫无疑问大家会下载花叔的作品。

陈锴杰：我的想法差不多，我觉得没有护城河。我的感受是，护城河这个概念是你有一座城，然后外面有一条河，所以人进不来。但是我觉得今天的「城」一直在变，因为今天技术变化很快，天天这个地方一直在地震、一直在移山填海，你划一条河在那儿没有什么价值。今天如果你要让你的产品更能抵御一些进攻，它就是综合实力的比拼。单单是技术肯定不构成护城河，但是很好的技术肯定是有用的。营销当然也是非常有用的，所有的增长你都要做。用户的口碑品牌，以及用户社区，肯定也是有用的。产品的打磨你想得很清楚，它肯定也是有用的。这些东西缺一不可都放在一起，才能构成今天比较好的产品。

Koji：既然大家说到护城河是「综合实力」，再往下做，你们具体会做什么样的事情帮自己做得更好？

陈锴杰：马卡龙的团队去年还很小，才十来个人，今年已经稍微壮大了一点，大概 30 多个人。我自己非常幸运的是在过程中我招到了像天使一样非常强的一批人。我们现在在做什么来实现加强护城河这件事情，我觉得做的就是把这支团队组得非常好，给大家定一个或者我们一起朝着一个很有希望的目标去努力。对我来说，每一个人可以有自己的生活管家。有了 AI 之后，每个人都可以有这样的事情，大家就可以有更多的心思和时间去做自己最喜欢的生活的选择，过自己更喜欢的生活。所以，搭最好的团队，朝一个方向努力。

苏晓江：营销相当于是一个乘数，你要把产品做好，同时要做好营销，这是乘法得到的结果。对于不断进步这件事情，我是挺关注的。Plan Coach 之后，并不是 Plan Coach 就是我们的终点，我们会在 Plan Coach 之后，带着我们开发的经验、营销的经验再去做下一个产品。我现在攒了一堆想法，每个想法可能成功的概率只有 20%，一个不行我就再做下一个，不断地这样去做。我相信通过堆量加上方法论，是可以做出下一个成功的作品的。

Koji：晓江做 Plan Coach 的收入会比当时在大厂的收入更高吗？

苏晓江：很明确，不会比大厂更高，因为 Plan Coach 只是一款产品，刚上线 5 个月，比之前大厂更高是不现实的。

Koji：这个问题给到散兵，作为平台，你们如何帮助 AI 创新者赚更多的钱？

散兵：这是一个很好的问题，如果我们要实现连接器的价值，我们还是要做非常多的后端转化，甚至变现的能力。今天我们只解决了前端的种草，帮你获取种子用户和验证的流程，慢慢地我们在产品内购或者产品直接采购的链路上，通过电商的能力去赋能大家。如果大家是硬件的创新，我们也可以通过轻度的类众筹或者电商的能力帮助大家。

另外的部分，除了挣钱的部分，我们还要省钱和招聘。招聘是非常花大家精力和时间的事情，这是一种隐性成本，我们也会帮大家找到认同你的产品价值和产品能力的人，帮你去做人选的匹配。可能我们会做一些运营活动，大家来发布自己的招聘需求，感兴趣的可以直接做招聘的环节。这件事情我们已经在老师的层面帮他们做了，因为他们要招学生，他们最苦恼的并不是缺有能力的人，而是缺相信自己内容方向、研究方向的人，这种在公域场合做招聘是非常容易的。所以后面我们会在开发者或者创业者的圈子里做一些类似的事情，我们认为这件事情某种意义上也是帮大家节约成本的能力。

Koji：对于想在小红书上开启自己超级个体人生的同学，如果只能给一条建议，你会给他们什么？

散兵：如果只能给一条，我觉得初心还是最重要的，大家还是要关注自己的初心。从两个层面，一个是从今天生产要素的层面，发现绝大多数生产要素都在变得更便宜和易获取，不管是资本、技术、人力，为什么会有这样的一人公司超级个体陆续地浮现，就是因为各种要素开始变得更加便宜，所以你要做什么、你想做什么这件事情变得愈发重要。

第二，在用户层面，今天用户也进入到一个不是特别物质匮乏的时代，大家更需要的是精神层面的共鸣，你跟他们的一些共识。用户也不是需要你解决特别强硬的需求，大家反而需要的是更共识层面精神层面的追求。在这个层面，你的发心也更容易被用户感知到，他会更关心你是不是长期想帮我解决这个问题，你是不是长期跟我是一类人，是同路人。如果能回答好这个问题，今天很多事情的成功率都会高很多。

苏晓江：我跟散兵老师很像，你要做一个你自己都很喜欢的东西，重要之处在于一旦你自己喜欢，你会做出很多超出用户需求的设计和开发。当你很自我陶醉地在去开发一个东西的时候，你的用户是能够感觉到的，他们也会更加喜欢。

陈锴杰：虽然我们说超级个体变得很容易，变得特别强，但是像晓江这样一个人或者两个人就干出来一个很复杂的项目，还要持续运营下去，我觉得还是非常少数的人。如果真的想往这个方向发展，过程中还是慢慢可以找到一些朋友，比如在小红书上找个搭子一起创业。因为一个人的思维范式可能会有一些局限性，大家一起做会更有意思。

07

现场 AMA 环节：

好奇超级个体们的一切

提问：今天的主题是超级个体。想问一下陈锴杰，你在 AI 时代来临前后，在自己的组织建设、团队搭建当中的认知和思路有什么变化？

陈锴杰：谢谢你的问题。有两个作用力。首先要考虑产品本身的发展周期。当你的产品已经有几十万、上百万用户的时候，为了让他有很好的新功能迭代，同时又要兼顾增长和运营，本身会有一个推动你团队人数变多的驱动力，这是跟组织的产品阶段相关的。AI 时代和互联网时代有另一个维度的动力方向，这个动力方向是组织在做同一件事情的时候人数应该是减少的，或者人效应该是提高的，每个人能做的事情应该变多。在同一个发展阶段，AI 时代尽量去用互联网时代一半或者 1/3 的人是比较合理的。两个相互作用。我们去年到今年同时扩张到 30 个人，主要还是因为产品阶段在推动。我相信如果更早，可能得扩张到更多的人才能做这个事情，今天我正在压缩每一个 Headcount（人员编制）。

提问：我是一名 AI 视频的产品经理，恰好做的是小红书侧的 AI 生成内容。想问一下平台是怎么看 AI 生成的广告？是不是对用户有帮助你们就会给它一定的倾斜？以及在未来，AI 的视频越来越多，你们会怎么长期考虑这件事？

散兵：两个问题：首先我们怎么看待 AI 生成这件事情？首先我们觉得 AI 生成是一个辅助性的技术，今天最重要的还是你想表达什么。如果你今天想表达的是一段故事，但是你是用 AI 帮你去形成的故事，所有关于创作的事情我们都是鼓励的，把它当作技术。但是还有一部分，我们发现有的人是利用 AI 快速生成类模板的内容来攫取流量，这种行为我们是不鼓励的，因为我们觉得小红书的根源还是一个真实、有活力的社区，我们希望在这里大家做自我的表达更多，而不是用 AI 生成的模板式的东西所铺量。我们对 AIGC 的态度是更鼓励用 AI 去做创造，而不是鼓励用 AI 去做模板。

提问：你们产品的定位和市场的选择上是怎么去考虑的？

苏晓江：对于 Plan Coach 来讲，我们现在出海才刚刚开始。一开始 Plan Coach 是有语言设定的，我们支持三种语言，并没有一开始说要限制 Plan Coach 就是在国内。但是因为小红书火得比较早，所以我们在国内现在已经算是走过了冷启动的阶段。变现我们一开始就想得很清楚，要把它做成一个收费产品。我们把它定性成在收费之前，你可以去试一下这个 APP 是不是适合你，这个 APP 本身就是一个收费的 APP。大家可以认同用钱去购买这个 APP 之后，我们发现原来它是可以盈利的，我们后面再去做海外市场，至少跨过第一道坎了。

提问：想问晓江老师，从大厂出来自己单干的感觉怎么样，是更爽了还是更累了，有没有后悔过？

苏晓江：我发现给自己打工比给丁磊打工累多了，要更累一些。难以避免的一个心态是你会把你个人和产品本身给捆绑在一起，你会发现产品的数据就会直接影响你对自己的判断。一旦有人在 App Store 上打了低分，你就会感觉是不是对你这个人的否定，你也会特别在意这个产品有没有得到别人的认可，你会觉得那不是对产品的不认可，而是对你人的不认可。以前在大厂的时候，责任是可以均摊给很多人的，但是现在没有其他人可以均摊。所以压力和责任感会比之前要更强烈，就会导致你的工作强度比之前其实要更高。

我会跟 AI 聊很多内容，我会让 AI 列举出以前有没有这样的例子，个人开发者成功了，但是要面对这种压力的，就会发现有很多。有人比你还要惨，你是可以坚持下去的。我对这种焦虑可以说是非常享受的。很多人下定的决心是「如果我这个 APP 成功了，等我这个 APP 上线了之后，再苦再累我也一定会坚持下去」，实际上是你这个 APP 上线之后没有人买，根本不给你机会去忙。我现在已经处于很忙很累的阶段，一方面自己挺享受，一方面很珍惜这种机会。

提问： Koji，你自己其实也是个超级个体，你在做播客的过程中，今天是不是在用 AI 提效，做很多东西？

Koji：肯定的，没有 AI 感觉无法工作。我在看了那篇文章之后，原来我每次给播客想标题的时候，我会说「你给我起 10 个标题」，我现在是起 100 个标题。本质上是不会多花钱的，付出的只是自己多花一分钟再去过一下这 100 个标题。这是最近我看完那篇文章之后自己行为的改变。

提问：马卡龙的产品理念听起来很性感，但是感觉离普通人有点远，用户真的愿意花钱请个 AI 来经营生活吗？最后会不会变成有钱人的玩具？

陈锴杰：首先我们挺便宜的，10 美金。今天 Token 的整体走势是一直在降低的，每隔一两年就会往下降 10 倍的价格，所以我觉得后面肯定是大家越来越能负担得起，不太贵。还有一个趋势，今天我们很多人在马卡龙里面创建小应用，我们马卡龙里今天已经有接近 20 万个小应用，分布在生活不同的功能上。对比一下苹果的商店，它的 APP 总数就是 220 万个，所以已经接近 App Store 的 1/10。当一个用户有需求，不一定要全新地创建一个，可能在这个生态里可以找到最合适的那一个，或者它没有那么合适，我就找到改一下，或者这个界面拿出来，那个风格拿过来，最合适的应用就出现了。它不是一个有钱人的游戏，最后大家都会负担得起，都能有自己的个人助手。

提问：我平常也会使用马卡龙，但是很多时候我发现它真正能够创造出来能够满足我的需求的应用可能性是很低的。你说现在有 20 万个应用的创造，这些应用大多数是由用户创造投入他自己的实际体验吗？

陈锴杰：首先我们的应用创建能力在不断提升，如果你这两天再用，发现和上一周又有了很大的区别。AI Coding 整个写出来的东西都很难用，今天将将可用，可能你写三次，或者你写一个它能继续修改，它慢慢变得可用，但是离用户普通人「说一句话就能用」的标准肯定还是有距离的，这个 Gap 是存在的。

第二点，今天的用户是怎么用的，大家重复用的东西是什么？我发现大家重复用的很多的还是生活的记录和规划这样的内容，这对于今天的 AI 来说会相对简单一点。你让它做一个 3D 游戏同样也是很难的事情。但是如果你要一个语音输入生成自己代办事项清单，这样一个交互模态创新的东西，它就会比较容易，你找拍照识别卡路里，它就会特别容易。今天大家重复使用的，每周会用个 5-10 次的应用，基本是集中在这个方向。

OpenAI 宣布紧急状态：全力推进 ChatGPT；冯提莫复播，直播间破十万；马斯克：若重新来过，不会再领导美国「政府效率部」｜极客早知道

极客公园

2025年12月11日 08:26

OpenAI 宣布紧急状态：放弃 AGI 梦想，全力拯救 ChatGPT

12 月 10 日，OpenAI 首席执行官 Sam Altman 宣布公司进入「红色警报」状态，暂停所有其他项目，全力以赴拯救 ChatGPT。

自从谷歌的「Nano Banana」模型意外走红以来，AI 领域的竞争局势发生了翻天覆地的变化。曾被认为慢半拍的谷歌，最近在 AI 技术上取得了显著进展，并凭借 Gemini 3 模型在业内评测中超越 OpenAI，引发广泛关注。OpenAI 此时不得不重新审视自己的战略，因为失去市场份额的风险变得越来越明显。

在这种紧迫的情况下，Altman 决定暂时放弃通用人工智能（AGI）的宏伟梦想，转而专注于迎合用户需求。他在备忘录中明确表示：「更好地利用用户信号」，意味着 ChatGPT 必须向用户的偏好倾斜，以确保其不可替代性。尽管这种做法可能导致模型失去客观性，但面对谷歌的强劲竞争，OpenAI 似乎别无选择。Altman 决定重启此前的训练方法，以便在重要的评测榜单上重新夺回领先地位。

本周，OpenAI 即将发布 GPT-5.2 模型，高管们希望借此在编程和商业客户中扭转局面。然而，知情人士透露，为了抢占市场，OpenAI 高层否决了研发团队关于「再给一点时间打磨」的请求。（来源：aibase）

Google 明确否认 Gemini 应用将引入广告

12 月 10 日，针对 AdWeek 报道称 Gemini 应用将于 2026 年上线广告，Google 全球广告副总裁 Dan Taylor 在 X 平台予以坚决否认。

他指出，该报道基于「未经证实的匿名消息源，内容不准确」，并强调：「Gemini 应用目前没有广告，也无任何引入广告的计划。」

此前有媒体称，谷歌正与广告客户进行洽谈，预计最早在 2026 年推出相关广告功能。然而，谷歌表示目前并无此类计划，相关报道基于不知情的匿名消息源，存在不准确的说法。

值得注意的是，广告收入一直是谷歌的核心业务。尽管公司目前否认在 Gemini 中引入广告，但并未完全排除未来的可能性。（来源：开源中国）

彭博：若 SpaceX 以 1.5 万亿美元估值上市，马斯克身家将逼近万亿大关

12 月 11 日，据彭博社报道，如果 SpaceX 能在明年以 1.5 万亿美元的估值成功上市，那么全球首富伊隆·马斯克的财富将在目前 4606 亿美元基础上增长一倍以上。

根据彭博亿万富豪指数的计算，如果 SpaceX 以 1.5 万亿美元估值上市，单是马斯克在 SpaceX 的持股价值就将从现在的 1360 亿美元增至 6250 亿美元以上，这还不包括他在其他多家企业的股份，例如全球市值最高的汽车制造商特斯拉。

根据彭博亿万富翁指数的数据，马斯克持有大约 42% 的 SpaceX 股份。该指数参考了美国联邦通信委员会的文件，并结合近期融资轮次的股权稀释情况来估算其持股比例。

按照 SpaceX 1.5 万亿美元的上市前估值计算，马斯克的总财富将达到 9520 亿美元，较当前财富水平增加约 4910 亿美元。（来源：凤凰科技）

ChatGPT 整合 Adobe Photoshop 等部分软件功能

12 月 10 日，OpenAI 正将更多第三方应用整合进 ChatGPT，用户现在可在聊天界面内直接使用 Adobe 的创意工具，包括 Photoshop、Adobe Express 和 Acrobat。周三宣布的这项整合允许 ChatGPT 用户在不离开聊天窗口的情况下免费使用部分 Adobe 功能。

例如通过 Photoshop 调整图像的亮度、对比度和饱和度，应用风格化效果，或对特定区域进行编辑，如模糊或移除背景。不过，该版本暂不支持 Photoshop 的生成式填充，无法智能清除画面干扰元素。这些功能目前可在 ChatGPT 网页版和 iOS 版本中使用。Android 端在上线时已支持 Express，Photoshop 和 Acrobat 的支持将很快推出。（来源：格隆汇）

3000 万粉丝网红冯提莫复播：自称停播因甲状腺癌复发转移

12 月 10 日，拥有超 3026 万粉丝的网红冯提莫在停播近一年后重新开播，直播间人数破 10 万。

据媒体报道，在直播中，冯提莫解释自己停播原因时表示，其甲状腺癌复发并转移，已经在医院进行治疗，目前身体已经恢复。

冯提莫称，医生嘱咐自己不熬夜、保证足够休息时间和良好心情。据了解，2023 年 7 月，冯提莫在一档采访节目中透露，之前得了甲状腺癌晚期，停播了半年，已经做了手术。

冯提莫曾是斗鱼直播四大花旦之一，2019 年 12 月 23 日在 B 站开启个人直播首秀，并登上 2020 年百大 UP 主名单。（来源：新浪科技）

全球最严，澳大利亚 16 岁以下未成年人社媒禁令落地实施

12 月 10 日，澳大利亚针对 16 岁以下人群的社交媒体禁令今天正式开始实施，预计超过 100 万澳大利亚青少年将无法使用相关社媒账户。

同时，澳大利亚成为第一个禁止 16 岁以下儿童使用社交媒体的国家，也是全球对未成年人使用社交媒体立法最严的国家。

禁止访问的平台包括 Facebook、Instagram、TikTok、X（原推特）、Snapchat、YouTube 等。

根据这项新法律，10 个最大的平台被勒令从格林尼治标准时间周二午夜禁止青少年访问，否则将面临高达 4950 万澳元 (约合人民币 2.32 亿元) 的罚款。这项新法律遭到了大型科技公司和言论自由倡导者的批评，但受到了许多家长和儿童权益倡导者的欢迎。

澳大利亚政府认为，社交平台有鼓励年轻人花更多时间盯着屏幕、推送可能损害他们健康和福祉的内容等设计特征，推出针对青少年儿童的禁令，有助于减少这些社交平台对他们的负面影响。（来源：快科技）

00 后玩手机三大爱好出炉：刷视频断层第一，平均每天 2.7 小时

12 月 10 日，据 QuestMobile 最新数据显示，2025 年 10 月，移动互联网「00 后」月度活跃用户规模达到 1.79 亿。这一数据同比去年 10 月的 1.62 亿增长了 10.1%，在全网用户中的占比也达到了 14%。

截止 2025 年 10 月，「00 后」用户月人均使用时长及次数分别为 217.6 小时和 3296.7 次，明显高于全网用户平均水平。00 后用户移动互联网使用习惯中，「刷视频」以 37.1% 的时长占比成为绝对主流，平均每天花在移动视频上的时间约 2.7 小时。

这一数据背后，是短视频、在线视频、游戏直播等细分领域的合力——这类内容兼具娱乐性与碎片化属性，恰好契合 00 后的使用场景。

「刷视频」之外，移动社交（25.2%）、手机游戏（9.7%）构成 00 后手机使用的「三大爱好」。手机游戏则保持稳定增长，占比从 9.3% 微升至 9.7%。（来源：cnBeta）

小米回应进军 AI 教育：人才招聘信息被误读，实为强化产品服务

12 月 10 日消息，近日，招聘网站页面显示，小米集团招聘页面上出现了多个与 AI 教育相关的岗位，涵盖高级商务、儿童与教育高级产品经理、教研产品经理等岗位。随后，有关「小米进军 AI 教育领域」的消息在社交媒体平台上传播。

对此，小米集团相关知情人士透露，儿童与教育高级产品经理岗位招聘主要与公司旗下的红米平板电脑 Redmi Pad 2 乐学版、小米米兔儿童手表这两款产品有关，「AI 教育不涉及，但招聘应就是为了这两块的产品在服务」。（来源：快科技）

岚图追光 L 破晓上市，定价 27.99 万起

12 月 10 日，岚图汽车发布全新轿车岚图追光 L，推出 Max 与 Ultra 两款配置，售价分别为 27.99 万元、30.99 万元。官方同步公布六项首任车主服务权益，包括三电终身质保、五年基础保养等，金融方案提供 3 年 0 息。

追光 L 基于岚海智能超混平台打造，主打「全域 800V」技术架构，涵盖驱动、电控、供电及热管理系统。车辆搭载 63kWh 电池并兼容 5C 超充，官方数据显示可在 12 分钟补能 60%，支持 410km 纯电续航。馈电油耗为 4.9L/100km。动力系统方面，新车搭载最高热效率 45.18% 的混动专用发动机。

底盘配置包括前摄预瞄的智能「魔毯」系统与后轮转向，转弯半径 5.55 米，并提供八种驾驶模式。智能化由华为提供方案，搭载 ADS 4 智驾及 HarmonySpace 5 座舱，支持全向 AEB 与车机生态互联。

车身尺寸为 5125/1985/1522mm，采用东方美学设计语言，曾获 MUSE 设计奖铂金奖。内饰大面积软包、零重力副驾、23 扬声器音响及大尺寸天幕等配置。（来源：极客公园）

苹果官网上线 3 小时快送服务：iPhone 免运费

12 月 10 日，苹果在中国大陆推出三小时快送服务。苹果官网显示，部分订单可以选择三小时快送服务，对于现货商品，符合条件的产品可免费配送，其余产品需另付 45 元运费。

具体来看，对于现货商品，iPhone、iPad、Apple Watch、Macbook Pro、Macbook Air 和 AirPods 产品可免费配送，其余产品需另付 45 元运费，具体以结账页面信息为准。

值得注意的是，消费者选择三小时内送货时必须在当天上午 10:00 至晚上 8:30 之间下单并完成支付。（来源：快科技）

马斯克：若重新来过，不会再领导美国「政府效率部」

12 月 10 日，马斯克在接受采访时回顾今年的「涉政经历」，直言若重新选择，不会再领导 DOGE。他还感叹，当时的经历甚至有些「恍惚」：

马斯克表示，「DOGE」这个名称是「基于网络上的建议」而拟定的。尽管他仍然认为，努力减少政府开支是一项值得去做的事情，但他也承认，自己在与特朗普政府共事的几个月里所做的努力效果并不显著。

当主持人直接询问马斯克，如果能重演历史的话，他是否会回到 DOGE 办公室工作时，马斯克稍作思考后叹了口气，表示自己不会这么做。

由于与特朗普政府合作，马斯克今年的公众形象大幅受损——不仅马斯克本人成为美国众多抗议活动的对象，就连特斯拉的汽车也遭到了不少破坏行为，例如被恶意纵火焚烧。马斯克认为，公众的这种反对反应是对他试图阻止「政治腐败」的强烈反应。（来源：财联社）

众筹历史第一后，这家 3D 打印「黑马」获高瓴、美团、顺为同时押注数亿元

极客公园

2025年12月10日 22:11

作者｜苏子华

编辑｜郑玄

刚刚，极客公园获悉，3D 打印「黑马」快造科技（Snapmaker）正式宣布完成数亿元 B 轮融资。由高瓴创投、美团联合领投，顺为资本、美团龙珠、南山战新投跟投，老股东同创伟业、东证资本继续加注。

Snapmaker 今年在行业里备受关注，核心原因是其 8 月份推出的 3D 打印机 Snapmaker U1，在 Kickstarter 上获得超 2000 万美元（约 1.5 亿人民币）的众筹成绩，刷新 3D 打印机历史众筹金额最高记录，一鸣惊人。其在国内售价显示为 5999 元一台。

严格意义上来讲，这是 Snapmaker 第一次推出纯粹的 3D 打印机产品。在此之前，他们主推的产品是集成 3D 打印、激光雕刻、CNC 雕刻切割技术于一体的「三合一」桌面制造工具。

据团队介绍，Snapmaker 成立于 2016 年，创始人陈学栋获得过 WRO 世界机器人奥林匹克竞赛最佳技术奖，保送厦门大学。

他们的首款「三合一」多功能打印机 Snapmaker Original 于 2017 年推出，在 Kickstarter 众筹 1500 万人民币，创中国项目第一；2019 年 5 月，Snapmaker 2.0 再登 Kickstarter，筹得 5400 万人民币（约 785 万美元），刷新科技类目历史第一。

然而，「三合一」系列产品的市场，后续逐渐被 3D 打印、激光雕刻、CNC 三个赛道里优秀的单一功能消费级产品所侵蚀。

此前，消费者需花费一两千美元购买一台多功能产品，如今只需五六百美元就能分别买到 3D 打印机、激光设备和 CNC 设备——多功能产品的价格优势不再明显，且单一功能产品的消费化程度、应用场景更加精准。

Snapmaker 团队告诉极客公园，他们因为原有「三合一」产品，对 3D 打印、激光雕刻、CNC 三个赛道的行业发展、市场规模及竞争态势均有深入了解。他们当时判断，3D 打印是三大赛道中规模最大、潜力最强的领域——激光和 CNC 均属于减材制造，而 3D 打印属于增材制造，应用场景更具想象空间。

于是，他们早在 2020 年就启动了单一功能产品的 ID 设计，2021 年完成原型研发。最终，直到 2023 年，创始人陈学栋最终确定集中资源攻坚，聚焦消费级 3D 打印产品。

Snapmaker 团队通过分析千余条用户反馈及深度访谈发现：多色打印虽是用户购买新设备的主要动力，但普遍存在效率低、材料浪费等痛点。

于是，基于过往在多工具头协作与高精度部件自制方面的技术积累，Snapmaker U1 成为国内第一个推出独立四头并联系统的产品，能够实现多材料快速切换，提升了打印速度、更加省料，尤其拓展了多色柔性软料的应用空间。

对于新一轮融资，Snapmaker 创始人陈学栋表示，将重点推进三方面工作：「一是加速核心技术研发，攻克多色打印、高速成型等用户痛点；二是拓展全球人才布局，特别是招募硬件研发、AI 软件与内容生态等领域的顶尖人才；三是构建开放生态，联合创作者、开发者与供应链伙伴，降低创造门槛，让 3D 打印成为人人可用的『通用性』创造工具。」

有行业人士评价，3D 打印仍处于早期阶段，受众群体仍以创客为主，还未进入主流大众消费市场。产品形态、易用性、材料便捷性、成本控制及生态完善度均有较大提升空间。

不过，3D 打印市场在国内的发展仍然是超出预期。已有不少企业开始在抖音、小红书等平台进行投放，不少视频获得几百万点赞，打破了原有产品用户画像，吸引了大量女性潜在受众。3D 打印机一方面成为了流量密码，一方面也预示着其成为下一台「家电」的潜力。

有行业人士判断，3D 打印设备未来将达到家电级的出货量。「消费级 3D 打印机年出货量约在 400 多万台左右，而微波炉、冰箱、洗衣机、电视机等家电的年出货量高达数千万台，即便是扫地机器人，年出货量也处于数百万台至数千万台的区间。」

类比之下，消费级 3D 打印机的潜力巨大，「未来，3D 打印设备与配套内容的关系，可能会类似电视机与影视内容、游戏机与游戏作品的关联——用户购买设备的核心需求，更多是为了获取后续的优质内容。」

据极客公园了解，目前拓竹旗下的模型内容社区 MakeWorld 已经拥有 5000 万左右注册用户，月活超过 1000 万。「行业下一阶段的竞争焦点将逐步转向内容生态。」上述人士表示。

拓竹自从 2022 年发布首款产品之后，已经在行业里声名鹊起，快速改写着行业格局。而今年，Snapmaker U1 的推出，也成为了搅动消费级 3D 打印市场的一股核心力量，再加上前不久大疆投资智能派（英文名：ELEGOO）数亿元、以及行业内创想三维和纵维立方等厂商陆续推出的新产品，都在宣告——消费级 3D 打印市场的终局还远未到来。

随着资本密集入局，各家 3D 打印厂商开始囤积粮草、招兵买马，我们可以预测：行业集中度将迅速提高，正如手机行业早期也曾有众多品牌，而近年来全球范围内已逐渐集中到少数几家头部企业。

2026 年，行业必将格外热闹。这将是一场涵盖营销、公关、人才、供应链和研发等各个方面的「全面竞争」。

极客公园
Google 又一次发布了 Google Glass ，这次想帮你把 Gemini 与 Nano Banana 戴在头上
2025年12月9日 23:41

Google 又一次发布了 Google Glass ，这次想帮你把 Gemini 与 Nano Banana 戴在头上

极客公园

2025年12月9日 23:41

如果你今年一直在密切关注 AI 眼镜/AI 硬件领域的大厂动态，那你肯定对 Google I/O 期间 DeepMind 发布的 Project Astra AI 项目演示印象深刻。

在这个惊艳的 Demo 中，Google 展示了一个极其超前的原型概念：戴上一款 AR 眼镜，借助其中的 AI 能力，它不仅能帮助你理解现实世界中的各种元素，还能帮你记下现实中的各种信息，甚至提醒你某一样具体的物件放在了哪个位置。这一技术在发布后立即惊艳全场，被认为是 AR 眼镜在技术上的一次新突破，但其实同样可以被看作是 Google 过去近十年在增强现实技术领域投入的缩影。

而在今天刚刚举行的 Google The Android Show 特别节目中，这一愿景终于迎来了真正的落地时刻。

和去年一样，今年 Google 仍然对 Android XR 寄予厚望，强调这不仅仅是一个操作系统，它是一个跨越设备形态的统一平台。

据 Google AR/XR 副总裁 Shahram Izadi 在发布会中强调，Google 将 XR 设备定义为一个广阔的「光谱」：从轻若无物、主打全天候佩戴辅助的 AI 眼镜，到融合了两者的有线 XR 眼镜，最后才是算力强大、沉浸感极致的 VR 头显。

在这个光谱中，Gemini 不再仅仅是一个聊天机器人，它是整个生态系统的「粘合剂」和核心交互界面。它让 XR 设备真正有能力，从「个人设备」转变为赋予用户「超能力」的延伸感官。

显然，在这个战略之下，最让人感到兴奋，也是最能体现 Google 差异化策略的，并非传统类似 Apple Vision Pro 那样的重型头显，而是那些试图让技术彻底「隐形」的轻量化设备。

AI 眼镜：时尚优先，让技术「隐形」

在整个目前的 XR 设备生态中，Google 对 AI 眼镜的策略也称得上相当激进；因为不同于以往科技巨头对硬件堆料的执着，Google 这次避开了笨重的「赛博朋克」式科技感，选择了完全拥抱时尚。正如 Shahram 在视频中掷地有声的宣言：「我们的 AI 眼镜首先必须是眼镜。这意味着它们必须轻便、时尚，适合全天佩戴。」

这倒是与今年国内 AI 眼镜行业里出现最多的那句话「AI 眼镜首先得是一只好看的眼镜」不谋而合。

为了实现这一目标，Google 也并没有选择闭门造车，而是宣布与全球顶尖的眼镜品牌 Warby Parker 和 Gentle Monster 达成深度合作。同时公布了 Google AI 眼镜的原型机。

Gentle Monster 在发布会中表示，他们希望挑战传统的认知，创造出不仅提供连接，更能激发惊奇感的时尚单品。Google 的技术专长在于让复杂的科技「消失」在精美的镜框之中。

按照规划， Google 未来将推出两种形态的 AI 眼镜：一种是类似 Ray-Ban Meta 的纯音频/摄像头版，专注于语音交互和捕捉生活；另一种则是集成了 Micro-LED 或 Micro-OLED 投影的显示版 AI 眼镜（Display Smart Glasses），能够在不阻挡视线的前提下私密地显示信息。

在 The Android Show 的实机演示环节，Google 也展示了这种轻量化设备的潜力，尤其是 Gemini 多模态能力的实际应用。演示者戴着原型机走进休息区，目光落在桌上一包陌生的零食上，随口问道：「这是什么？」Gemini 几乎在瞬间识别出这是韩国流行的食物，同时还详细解释了它独特的吃法——捏碎面饼并撒上调料粉。这不仅仅是视觉搜索，更是一种对现实世界的深度理解。

更有趣的是 Nano Banana 的端侧图像编辑模型演示：当你对着面前的朋友拍了一张照片，然后通过语音指令：「给每个人加上全套身体的 Android 机器人特效，还要戴墨镜。」在毫秒之间，AI 就在眼镜的视野中生成了有趣的增强现实图像。

为了证明这不仅仅是极客的玩具，Google 还展示了与旅游平台 Get Your Guide 的合作案例。在一个名为「寻找纽约最好吃的热狗」的旅程中，AI 眼镜成为了比智能手机更沉浸体验的向导。

当游客在复杂的街道上寻找集合点时，眼镜直接在视野中标记出路径；当面对究竟「热狗算不算三明治」这种存在主义哲学问题时，Gemini 也能即时加入讨论。甚至在 Uber 的演示中，当用户抵达繁忙的机场路边，眼镜能直接显示车辆的实时位置、车牌号，并引导用户精准找到司机。

这种仅仅通过「抬头」这一动作就能完成的交互，让用户既能获取数字信息，又能保持与现实世界的连接，真正做到了让计算如影随形。

当然，为了支撑这些体验，开发者生态至关重要。Google 今天也发布了全新的 Glimmer UI 工具包，这是 Jetpack Compose 的一部分，专门针对眼镜进行了优化。它引导开发者避免使用在透明屏幕上会「消失」的黑色背景，转而使用高对比度的卡片式 UI。

此外，新的 Projected Library 允许开发者将现有的手机 App 画面直接「流式传输」到眼镜上，无需重写代码即可实现跨端体验，这无疑将大大加速 AI 眼镜应用生态的成熟。

Project Aura：把「大脑」挂在腰间的 4K 巨屏

介于轻便的 AI 眼镜与重型的全沉浸头显之间，Google 也并没有留下真空地带。由 XREAL 承载的 Project Aura 代表了 Android XR 生态中一条极为务实的路线。此前外界对它的认知仅停留在「有线眼镜」的概念上，但在这次展示中，它被重新定义为一种平衡了移动性与生产力的全新计算形态。

与 XREAL 其他产品相同，Project Aura 采用的也是光学透视（Optical See-Through）方案，这也意味着用户是透过透明镜片直接看到真实世界，而不是通过摄像头拍摄再显示的视频透视。

但 Project Aura 的野心远不止于此，它并非简单的投屏眼镜，而是一套完整的计算系统。

其核心创新在于那个通过 USB-C 连接的计算模块。这个像冰球一样大小的模块内置了强大的 Snapdragon XR2+ Gen 2 芯片和高容量电池，运行着完整的 Android XR 系统。

这种分离式设计它极大地减轻了眼镜本体的重量，解决了长时间佩戴鼻梁压迫的问题，同时将发热源从头部移开，避免了「暖宝宝贴脑门」的尴尬体验。

同时，这个模块本身也是一个控制器，表面配备了触控板和方向键，方便用户在无法语音或手势的场景下进行盲操作交互。

在视觉体验上，尽管眼镜本体轻便，但堆料却毫不含糊。根据 UploadVR 的上手报告，Project Aura 提供了单眼 4K 的超高分辨率和 70 度的视场角。虽然这一视场角不及 VR 头显，但在 AR 眼镜领域已属顶尖，足以填补全沉浸头显与普通眼镜之间的空白。

在 Google 演示的「咖啡馆场景」中，用户可以通过 Project Aura 扩展出了多个巨大的虚拟屏幕：左边播放着流媒体视频，右边是聊天窗口，中间则是巨大的工作界面。

更令人印象深刻的是它的混合办公能力。当你需要处理复杂的照片编辑任务（如 Lightroom）时，Project Aura 可以通过线缆连接到笔记本电脑，瞬间变身为电脑的超大虚拟显示器。

此时，Gemini 依然在线——当你看着 Lightroom 的界面不知道如何操作时，可以直接询问 Gemini：「如何给这张照片添加背景虚化？」Gemini 能够识别电脑屏幕上的内容，并一步步指导你操作滑块。这种跨设备的智能协同，彻底摆脱了 AR 眼镜作为「手机附属品」的固有标签，使其成为了真正的生产力工具。

Galaxy XR：硬刚 Vision Pro 的参数怪兽

作为 Android XR 平台的旗舰级「重武器」，今年稍早时候正式发布的三星 Galaxy XR 头显虽然在形态上不如眼镜轻盈，但在硬件参数和沉浸式体验上展示了安卓阵营的绝对肌肉。这款设备被 Google 称为拥有「无限屏」，旨在为用户提供最极致的视觉效果和计算能力。

本次发布会上虽然没有头显产品线的硬件更新，但 Google 和三星深知软件体验才是留住用户的关键，因此通过最新的功能更新解锁了几个直击痛点的关键体验。

首先是解决了「不想以卡通形象开会」为痛点的 Likeness（拟真形象）Beta 版。在视频演示中，用户奥斯汀展示了这一功能：只需将头显取下，反转面向自己进行约 30 到 90 秒的扫描，结合设备内部的眼动追踪和面部传感器，即可生成一个逼真的 3D 数字化身。在 Google Meet 通话中，这个化身能精准捕捉用户的每一个微笑、皱眉和眼神变化，让远程协作不再像是在玩电子游戏，而是真正的人与人之间的交流。

对于经常出差的商务人士，新增的旅行模式则是一个刚需功能。如果你在飞机上使用过 VR 设备，就会知道机身的颠簸和转向往往会导致虚拟窗口漂移甚至让人眩晕。Travel Mode 通过算法优化，暂时禁用了依赖视觉特征点的追踪技术，转而依靠 IMU（惯性测量单元）来实现稳定的 3DoF 追踪，从而确保面前的虚拟屏幕像钉子一样钉在空中，无论机舱如何颠簸都稳如泰山。

而在娱乐和内容消费方面，Google 还画了一个巨大的饼—— 自动将所有 2D 内容转制成 3D 版本。

Google 产品经理 Austin 表示：「想象一下，如果每一个游戏都是沉浸式的，每一部 YouTube 视频都是 3D 的，整个互联网都变得立体起来。」

这一功能计划于明年系统级推送，它将利用设备的端侧算力，能将普通的 2D 内容实时转换为 3D 体验，彻底解决了 XR 平台初期内容匮乏的难题。

值得一提的是，三星在交互硬件上也做出了改变，Galaxy XR 配备了一对类似「星战光剑柄」的流线型手柄，彻底移除了硕大的红外追踪环，转而完全依靠 LED 和计算机视觉算法进行追踪。这不仅让手柄看起来更具未来感，也大大减少了在使用过程中双手碰撞的几率。

从最前端、最贴近生活的 AI 眼镜，到兼顾便携与性能的 Project Aura，再到代表着算力巅峰的 Galaxy XR，Google 今年正试图通过 Android XR 证明一个道理：未来的计算不应该把你关在封闭的房间里，也不应该强迫用户去适应单一的硬件形态。

相反，计算应该像空气一样，通过不同形态的设备，渗透进生活的每一个缝隙——无论是你在咖啡厅办公，在异国他乡旅游，还是在客厅里享受电影。

随着开发者工具的全面开放，以及 Gemini 智能核心的不断进化，2026 年，或许我们真的可以把熟悉的 Android 应用不仅「装」在口袋里，更是「戴」在头上，看着它们在现实世界中活灵活现。

猿辅导一个月连发两张 AI 牌：这次把 Agent 交给老师

极客公园

2025年12月10日 13:53

猿辅导的 AI 节奏明显提速。

继刚刚发布纯 AI 外教产品「斑马口语」后，12 月 1 日，猿辅导再推面向教师的 Agent 工具「飞象老师」，这是一个原生 AI 生成式产品：教师只需要描述教学创意和想法，就能直接生成可交互的教学动画与游戏化课件。

一个月内连发两款 AI 产品，这种「高频出牌」的信号很直接：

这家以在线课程和题库见长的教育科技集团，正把 AI 的押注从「零散功能」推向「垂直场景的系统化重做」。

「斑马口语」把外教课堂交给 AI，让每一位孩子都有一位专属的 AI 外教。「飞象老师」更激进——chat to APP（对话即应用）：让老师用自然语言「做」出课堂级教学产品。

密集的产品节奏背后，猿辅导似乎正在向外界强调新身份：

不只是一家在线教育巨头，而是一家扎根教育场景的 AI 公司。

01

「飞象老师」到底是什么？

一句话总结：老师输入一句需求，AI 生成一堂能直接用的互动课。老师在课堂上打开就能用，所以它是个网站，目前没有 APP 。

比如输入：

「帮我设计一个球体体积推导的互动演示。」

系统会通过多轮对话，实时生成包含互动 H5 动画、结构化板书设计、随堂习题的全套课件。

这跟上一代教育 AI 很不同，过去更多是「生成教案、出题、润色」。而「飞象老师」的核心能力在于多模态的即时生成——「即时构建课堂应用」。

你以为是在聊天，它其实在搭课程、搭互动、搭节奏。

结果很直接：老师不必学 Flash、GeoGebra。你懂教学、会表达，就能做教学软件。

02

体验层冲击：为什么它不像「花活」？

从交付看，「飞象老师」不是一个通用模板「套」所有学科。它做的是更难、也更有价值的事：按学科痛点做深度垂直优化。

比如，数学学科最怕「会背不会懂」。在「飞象老师」里输入「平方差公式几何证明」，系统直接生成可视化推导动画：大正方形拆解、小正方形切除、剩余图形平移拼接，代数公式被还原成清晰且生动的几何过程。

学生看见了「为什么」，而不只是「答案是什么」。

又比如，语文的难点不是「读」，是「进不去」。

输入「生成黛玉进贾府-沉浸式体验」，它会生成交互式剧情：学生以第一视角进入贾府路线，看布局、走情境、触发人物互动，名著从「讲解范本」变成了「体验现场」。

还有，英语的痛点是「脱离真实场景的重复性枯燥」。在「飞象老师」里上传课本截图，场景就能动起来；上传单词表或输入 Unit 名称，就能即时生成超市购物、环游世界等情景小游戏。

这三个例子的共同点很清楚：

它不是「让课件更炫」，而是让教学可交互、可理解、可被学生主动参与，这也是它最像「应用级教师 Agent」的地方。

03

当教育垂直 Agent「撞车」Gemini 3.0

非常有意思的是，就在「飞象老师」发布前后脚，Google 发布的 Gemini 3.0 也展示了类似能力。社交网络上，大量硬核玩家用 Gemini 3.0「手搓」应用。

这反而从侧面说明一件事：猿辅导在技术路径的选择上是非常超前的。他们不仅押中了「多模态+互动生成」这个大方向，在产品落地上，甚至比 Google 的通用模型应用得更早、更深。

「既然 Gemini 3.0 也能做，为什么我们需要一个专门的「飞象老师」？」

这话听着耳熟——「通用大模型都这么强了，为什么还需要专业级 Agent？」从 Cursor 、Harvey 开始，每当一个垂直领域的 AI 新工具出现，这个问题就得来一遍。

答案是「可规模化」：通用模型能做 demo，垂直 Agent 要解决日常使用。全民手搓应用可以嗨一嗨，但「看起来好玩」和「上课能用」是两码事。

实际体验后我们发现，「飞象老师」把三个关键点做到产品化：

第一，0 门槛。

通用模型能做，但门槛高很难「长期手搓」。教师的真实时间和技能结构，更不允许他们每天当「半个产品经理+半个提示词工程师」。

「飞象老师」把这些复杂度压在后台，老师看到的只有「我说需求，你给结果」的对话界面。

第二，输出「教法」，不只素材。

它内置教师 workflow：从情境引入、概念讲解、提问脚手架、随堂检测，AI 输出的是一套成体系的教学组织方式，而不仅仅是「太炸裂了」。

第三，知识库护栏。

教育不允许「差不多」。

「飞象老师」调用猿辅导的「超级知识库」，十几年积累的题库、知识图谱、教法体系，把学段匹配、考点引用、难度边界拉回可控范围，这是垂直 Agent 的关键护城河。

04

一个「更大的问题」冒出来

过去两年，所有垂直行业都在等一个答案：

「大模型的能力进化，最终会把行业重做成什么样？」

创业团队冲得快，但容易昙花一现；通用模型公司技术强，但容易「拿着锤子找钉子」；行业巨头懂场景、能规模化，但必须证明：能把 AI 做成大规模、日常、高频的应用级产品。

教育作为「超级场景」，是包括 OpenAI 在内的所有大模型公司，都视为 AI 应用排名前三的领域；教育学习，也是 AI 时代创业者必看的机会。

所以，大模型的能力进化，最终会把教育重做成什么样？

「飞象老师」更像是猿辅导给出的一种明确态度：

在教育这个强专业、强准确性、强场景约束的行业里，AI 的下一步绝不只是简单的效率工具，而是彻底升级课堂形态，革新学习范式。

05

结语

从「斑马口语」到「飞象老师」，猿辅导的 AI 版图不会止步。初创在冲刺，通用大模型在下探，追击只会更快、更凶。

从历史周期看，最容易跑出「大规模、日常、高频应用级产品」的，往往就是教育。

场景重、需求真、决策链清晰，足以把「概念」逼成「日常」。

当 AI 进入新的技术纪元，答案正在逼近：

教育行业，会成为最先跑出「应用级 Agent」的第一批样板吗？

跨越比特与原子，小鹏汽车下一个十年的「物理 AI」路线图

极客公园

2025年12月10日 13:50

整理｜汤一涛

编辑｜靖宇

在极客公园创新大会 2026 的舞台中央，小鹏汽车董事长兼 CEO 何小鹏发表了一场极具行业洞察的年度演讲。

何小鹏在极客公园创新大会 2026 上发表演讲｜图片来源：极客公园

作为穿越了互联网、移动互联网到人工智能周期的连续创业者，何小鹏此次的目光不再局限于单一的交通工具。他敏锐地指出，科技界正在经历从「数字能源」向「物理 AI」的范式转移。从自动驾驶的端到端大模型，到人形机器人 IRON，再到打破维度的陆地航母，小鹏汽车正在构建一个打通比特世界与原子世界的全新生态。

何小鹏认为，未来十年，我们将不再仅仅讨论规模效应或网络效应，而是迎来一个属于「智能体效应」的全新时代。

以下是何小鹏在极客公园创新大会 2026 上关于物理 AI、具身智能以及未来出行图景的演讲实录，由极客公园整理：

回顾过去二十多年的创业历程，我们见证了数字世界的爆发——从计算机软件、互联网、移动互联网到如今的 AI 浪潮。这背后有一个非常重要的底层逻辑：能源与引擎的组合形式决定了科技浪潮的方向。

数字世界和物理世界的融合，将催生物理 AI｜图片来源：小鹏汽车

在物理世界，19 世纪的蒸汽机、20 世纪的石油与内燃机，分别催生了火车、汽车和飞机的诞生，深刻改变了人类的生活。而在数字世界，同样存在「能源」与「引擎」。今天，数据与算力的结合构成了新型能源，而芯片与交互界面（GUI）则是利用这种能源的新型引擎。

能源的转变推动了动力形式的转变，而能源加动力形式的转变，又改变了所有人的生活。在下一个数十年里边，如果我们有一天把核聚变做的非常小型，放到心脏里面，也许新一代的超人就会出现。

所以能源+动力形式的改变推动了这个世界上科技的浪潮。换个角度，我们相信下一个十年到三十年里，很有可能出现一种全新的创业方式：物理如何跟 AI 耦合。

01

从网络效应到「智能体效应」

那么在物理世界跟数字世界，我们如何去把自己的壁垒提高，如何构建自己的最强大的能力？在这里面做一个分析。

在商业与技术的演进中，不同的时代遵循不同的效应：

物理世界遵循「规模效应」：规模越大，成本越低，竞争力越强。
互联网世界遵循「网络效应」（Network Effect）：产品对用户的价值取决于使用该产品的其他用户的数量，连接的节点越多，价值呈指数级增长。

我们相信，随着物理 AI 出现之后，下一个世界物理和数字这两个世界开始融合，我们会出现一个全新的效应—— 智能体效应。在这个效应里面所有的东西都会不一样。

比如说我们以前会讨论，汽车领域将来会不会出现赢者通吃的结构？所有做汽车的人都不认同，因为汽车是个规模效应，一定是多定位、多区域的多头并存。换到互联网世界，就出现了赢者通吃的情况。

智能体效应会不会出现新的效应，比如说寡头垄断，不知道，但是一定会出现全新的思考逻辑。这跟大家分享两个有趣的观点。

第一个智能体里面的一个表现形式叫黑洞效应。AI 会不断吞噬知识、压缩知识，涌现出全新的能力。

在自动驾驶领域，我们已经观察到这种现象：模型开始展现出人类未曾预设的逻辑。例如，车辆在红灯即将变绿时产生的预判性「蠕行」，这并非代码规则所写，而是模型从海量数据中涌现出的智慧。这也是为什么在未来，代码的重要性将让位于数据；也是许多公司开源模型，却绝不开源核心数据的底层逻辑。

黑洞效应：AI 将化为不断吞噬知识的黑洞，不断涌现出全新的知识和能力｜图片来源：小鹏汽车

第二我们看到智能体效应里面叫蚁群效应，这是一种去中心化的高适应性智慧。蚂蚁搬运食物，个体在路上看到一只虫子，它不会回到蚁巢向蚁后汇报，让蚁后派蚂蚁小队把虫子搬走；而是会跟附近的蚂蚁形成近场的网络效应，附近的蚂蚁越多，它的 power 越强。

个体之间可以通过近场网络通讯，通过局部互动涌现出群体智慧。附近的「蚂蚁」（智能体）越多，系统的鲁棒性和适应性越强。未来的物理智能体将具备独立的感知、思考、推理、控制和决策能力，大家也会看到一个全新的效应会出现。

蚁群效应：非中心化调度的近场网络效应，实现统一、高效、自适应的集体行动｜图片来源：小鹏汽车

新的效应一定有巨大新的机会，这里举两个小鹏汽车在做的例子。

为什么在过去的几十年里，无论是家电、手机还是传统汽车，都难以形成真正的「网络效应」？

原因有二：一是缺乏足够的规模；二是缺乏自主规划的能力，只是工具，产生不了自身的内容。但在新的 AI 时代，情况发生了改变。在这个过程中，人类的角色将从劳动的「生产者」转变为智能的「监管者」。这种变化也将在小鹏的 Robotaxi 、Robo 车型以及未来的人形机器人上得到体现。

所以下一个十年，我们极有可能见证一种全新形态的巨型企业诞生。回顾商业历史，过去数十年甚至上百年的大型公司，其架构往往是线性的——「十万名员工、十万个工具」的物理堆叠。而在最近二十年的互联网时代，服务器成为了新的杠杆，企业通过「人+服务器」的模式实现了规模复利的效率提升。

所有企业在物理 AI 的新十年，都将经历颠覆性的生产力变革

在下一代，这个变化可能会更剧烈。我们将看到「十万名员工」叠加「百倍数量的智能体（Agent）」，以及充足的算力资源。这意味着企业将进入一个全新的生产力维度，生产关系也将发生本质的跃迁：生产协作不再局限于「人与人」之间，而是演进为「人与智能体」、「智能体与智能体」以及「人与人」并存的复合协作网络。

要怎么去迎接这种变化，小鹏汽车的思考逻辑是，通过自研算力的芯片、自研操作系统以及物理世界运动的模型，构建基于物理 AI 的全栈自研能力。在这个基础上，我们又孵化出了 Robotaxi、飞行汽车等新形态。AI 大模型为物理 AI 提供认知与理解能力，具身载体提供与真实世界交互执行的能力。

02

重构自动驾驶——超越语言（Language），

走向行动（Action）

大家知道，小鹏是非常早就在做自动驾驶的一家整车厂。过去时间里，我们一直看到一个问题：为什么无论用规则算法还是小模型，都难以突破 L2 级辅助驾驶的瓶颈？

路德维希・维特根斯坦有一句名言（Ludwig Wittgenstein）：「语言即世界。」我们尝试用人类的语言去归纳这个世界，写出很多的规则。但是为什么语言就是我们的世界？为什么仅仅用语言来束缚跟框架？

举个例子，小朋友们想学游泳，他可以看书学习理论，也可以去水里亲自学一下，哪一个有效？很多时候，人类习得知识和技能并非是通过语言，而是感知。

人类用语言归纳世界，但一个人在自我学习的领域里面，有很多时候是不能通过语言去学习的。举个例子，小朋友们想学游泳，他可以看书学习理论，也可以去水里亲自学一下，哪一个有效？很多时候，人类习得知识和技能并非是通过语言，而是感知。

所以语言只是人类归纳世界的一种方式。今天我们大部分的大模型都叫大语言模型。这意味着它们可能并不是这个世界上最有效率、最综合、最全面的模型，因为它是人类把这个世界高度抽象和归纳之后形成的模型。

为了实现真正的 L4 甚至 L5 级自动驾驶，我们必须跳出「语言」的框架。小鹏的第二代 VLA 选择跳过了语言框架，直接通过视频（Video）结合语言（Language），最终输出为行动（Action）。这种直接从物理世界进行感知、规划、推理并执行的模型，效率和能力将大幅提升。

我们相信，在未来，一个直接从物理世界进行感知和规划、推理、执行的模型，一定会在物理 AI 领域和大语言模型结合。

这也是为什么，我们认为，下一个五年里，大家会看到无人驾驶时代。

我相信在无人驾驶时代，有两种无人驾驶的汽车。一种是没有人开的无人驾驶汽车，也就是 Robotaxi。我相信这种汽车会在下一个五年里会出现，但数量不会非常大。

更多的是有人开的 L4 体验的汽车，小鹏明年会推出三款这样的汽车。虽然仍需驾驶员坐在位子上，但车辆具备全冗余硬件和无接管能力。

今天所有的 L2 都只能在城区开，不能在小区、小路开。2026 年，小鹏会在我们的 Robotaxi 上试运营我们相关的能力，还会推出一个全新的 Robo 汽车，能够规模交付所有用户，可以不限区域，特别是小区内、地下车库内，园区内都能非常好的行驶。

小鹏将在未来推出的产品 Robo｜图片来源：小鹏汽车

03

具身智能的终极形态——

为何是人形机器人？

小鹏在物理 AI 领域的另一大探索是名为「IRON」的全新一代人形机器人。很多人问，为什么是人形？

首先，环境适配性。下一个二十年、三十年全球有很多种机器人，一定有非常多的专有机器人。但我们相信人形机器人是最普遍的，因为这个世界是按照人去设计的。

我们在过去做了七代机器人，有四代是四足机器人。我们做第三代的时候，把四足机器人放在一个开发者的家里去用，提前感知一下四足机器人在家庭场景里有没有用。我们发现了无数问题。如果一个人走到床头柜旁，可以轻松原地转身；但对于四足机器人而言，在狭窄空间内原地掉头的难度非常高。

我想用这个小案例说明，如果你想让一个机器人更容易适应于这个社会，人形是非常重要的，因为这个社会都是为了我们人去思考、设计、使用的。

第二点是数据获取。只有把机器人做成人形，才能直接利用海量的人类行为数据，来对机器人进行训练。如果做一个专有机器人，要获得海量数据是非常困难的。

第三点是工具使用。很多人说可以把机器人做成跟一个工具的嵌入合体，它当然更好，我同意。但是这个世界上有 100 万种工具为人而设计去使用的，人形机器人可以最大程度适应这些工具。这跟机器人只有一个工具或者少数几种工具的使用权利相比，有非常大的不同。

我今天还想跟大家分享一下小鹏机器人走猫步这件事。

小鹏 IRON 为什么能走猫步？核心是硬件的设计。我们深入研究人体解剖学，增加了颈部和肩部关节，特别是在腰部设计了五个关节。只有拥有像人一样的肌体，才可能从物理层面还原人的体态。

小鹏 IRON 机器人在之前的发布会上引起了轰动｜图片来源：小鹏汽车

如何从过去的模仿和简单的记录，变成真正的泛化、有重映射的逻辑，机器人才能进入到人类真实的步态。

目前的机器人行业大多处于第一代的阶段，表现力很强，但是需要提前录制。

从第一代进化到第二代，能够在不同的状态下比较快速和自然地切换不同的动作。

今天做的比较好的大多处于「1.5 代」阶段：能走和跑，但是很难干其他事情。换个角度说，绝大部分是半身运动，不是全身运动。

但是真正要做得好的是全新的泛化性最重要一代，我们自己内部叫零重力的控制体态：让机器人全身 70-80 个关节，在模拟无重力的状态下实现真实的协同运动。再在上面加上运控的生成式运动规划，才有可能在将来量产的机器人里面达到人的所有姿态和形式。只有攻克了这一难关，量产机型才能真正具备人类的姿态灵活性。

第三代人形机器人的特点是泛化性强，具备对全新的动作零样本迁移的能力｜图片来源：小鹏汽车

小鹏汽车正在努力，希望在明年量产下一代的运动控制。

一个机器人体系里，需要有所有软件控制硬件的能力，而硬件设计需要足够的生产制造能力，这是最重要的。

小鹏 2025 年的研发投入预计接近 110 亿元人民币。我们会把汽车与 AI 领域的研发能力，迁移应用到机器人研发中；未来我们在机器人研发上的团队规模，也可能从千人级别逐步扩充到万人级别，覆盖软件、硬件、算力、嵌入式电子电器、线束等全链条技术领域。

我们认为，未来的汽车公司，本质上也会是机器人公司，这正是我们对行业发展的期待。

小鹏人形机器人 IRON，与 AI 汽车技术、制造和商业同源

与依赖 WiFi 连接云端的机器人不同，小鹏坚持端侧算力。IRON 机器人搭载 3 颗自研图灵芯片，拥有 2250 TOPS 的有效算力，并运行多个操作系统，包括 VLT、VLA、VLM 实现一个机器人进入高阶的能力。

关于落地场景，在中国和在欧美不一样，在欧美我会选择工业，在中国我会选择商业。至于进入家庭，还需要等待几年。

除了陆地，我们也在探索天空。小鹏汽车做了 12 年的低空飞行，现在向大家介绍一下我们的两大飞行体系。

明年，小鹏会推出第一个分体式飞行汽车——「陆地航母」。它创新性地解决了飞行器的存储、运输和补能问题：将飞机折叠收纳于汽车尾箱，随走随停。但带来的问题是只能飞 20 分钟以内，所以换个角度，它主要为了旅游观光。但是我们相信，将来我们会做出长续航版本。

另一个是垂直起降电动飞机 A868，它是纯飞机的形式，能够满足多人长航程高效出行。

小鹏汇天两大飞行体系：「陆地航母」满足个人低空飞行体验；「A868」实现多人长航程高效出行｜图片来源：小鹏汽车

很多人都开过车，但极少人开过飞机。我相信下一个十年会有越来越多人开过真正的飞机。

这就是小鹏在新的十年里面我们正在探索的事情：如何在物理 AI 世界探索未来的出行；如何在全球化里做一个科技平权的具身智能公司。

相信下一个十年里，我们会和大家一起看到在 AI 的驱动下涌现出更多科技变革，让我们每个人的生活都会更加美好。

谢谢大家。

极客公园
1.5万亿美元，SpaceX或成最强IPO；暴涨700%，人形机器人迎拐点；智谱开源AutoGLM，「豆包手机」人人可造
2025年12月10日 08:08

1.5万亿美元，SpaceX或成最强IPO；暴涨700%，人形机器人迎拐点；智谱开源AutoGLM，「豆包手机」人人可造

极客公园

2025年12月10日 08:08

消息称 SpaceX 推进史上最大 IPO：拟募资超 300 亿美元，目标估值 1.5 万亿美元

12 月 10 日消息，据彭博社报道，知情人士透露，SpaceX 正积极推进首次公开募股（IPO）计划，拟募资规模将远超 300 亿美元（现汇率约合 2123.38 亿元人民币），若成功实施，这将成为有史以来规模最大的上市交易。

该公司正将估值目标定为约 1.5 万亿美元（现汇率约合 10.62 万亿元人民币），这一估值将使 SpaceX 接近沙特阿美（Saudi Aramco）在 2019 年创纪录上市时所达到的市值水平。当时，这家石油巨头通过 IPO 募集了 290 亿美元资金。

部分知情人士表示，SpaceX 管理层及其顾问正力争在 2026 年中至下半年完成上市。由于此事属保密信息，这些人士要求匿名。他们同时指出，IPO 的具体时间可能因市场环境及其他因素而调整，其中一位人士甚至表示上市可能推迟至 2027 年。

彭博社及其他媒体上周五曾报道，SpaceX 正在探索最早于明年年底进行 IPO 的可能性。SpaceX 加速迈向公开市场的步伐，部分得益于其快速增长的「星链」（Starlink）卫星互联网服务，尤其是其面向移动设备的直连业务前景，以及「星舰」（Starship）登月与火星火箭项目的持续推进。

一位知情人士透露，SpaceX 预计 2025 年营收约为 150 亿美元，2026 年将进一步增至 220 亿至 240 亿美元之间，其中大部分收入将来自 Starlink 业务。（来源：IT 之家）

美称将允许英伟达向中国出售 H200 人工智能芯片，外交部回应

12 月 9 日消息，据央视新闻报道，12 月 9 日，外交部发言人郭嘉昆主持例行记者会。据报道，美国总统特朗普 8 日表示，美国将允许英伟达向中国「经批准的客户」出售 H200 人工智能芯片。

对此，郭嘉昆表示，我们注意到有关报道，中方一贯主张中美通过合作实现互利共赢。

英伟达发言人对外媒 TechCrunch 表示：「我们赞赏特朗普总统的决定，该决定允许美国芯片行业参与竞争，从而支持美国的高薪工作岗位和制造业。政府允许英伟达向经过商务部审查的商业客户提供 H200 芯片，是一个兼顾了各方利益的周全平衡，这对美国非常有利。」

据此前报道，H200 作为 H100 的迭代升级产品，基于 Hopper 架构，首次采用了 HBM3e 高带宽内存技术，实现了更快的数据传输速度和更大的内存容量，于 2023 年 11 月发布。（来源：IT 之家）

阿里巴巴成立千问 C 端事业群

12 月 9 日下午消息，阿里已成立千问 C 端事业群，由阿里巴巴集团副总裁吴嘉负责。据悉，该事业群由原智能信息与智能互联两个事业群合并重组而来，包含千问 APP、夸克、AI 硬件、UC、书旗等业务。

阿里巴巴在内部沟通中提及，千问 C 端事业群的首要目标是将千问打造成为一款超级 APP，成为 AI 时代用户的第一入口。未来，还将进一步把千问打造成无处不在的 AI 助手，覆盖眼镜、PC、汽车等场景，让每一个普通人都能随时随地使用 AI，并持续从中受益。

据报道，阿里核心管理层将「千问」项目视为「AI 时代的未来之战」。阿里计划将地图、外卖、订票、办公、学习、购物、健康等各类生活场景接入千问，赋予其强大的「办事」能力。（来源：新浪科技）

暴涨 700%！TrendForce 预测 2026 年人形机器人迎产业拐点，年出货破 5 万台

12 月 10 日消息，集邦咨询（TrendForce）昨日发布最新研究报告，指出 2026 年将成全球人形机器人商用化的关键元年，预计全年出货量将突破 5 万台，同比增幅将超 700%。

该机构指出这一数据的激增，标志着行业正从实验室研发阶段加速向市场化落地转型，全球竞争格局也随之进入白热化阶段。

博文介绍，美、中、日三国产业路径差异显著：日本厂商深耕精密零组件技术，主攻养老与灾害场景；美国特斯拉等巨头聚焦系统稳定性与实务验证；中国则凭借「低价量产」与「多元场景」加速渗透。（来源：IT 之家）

智谱开源「会操作手机的 AI」AutoGLM，人人可打造豆包手机

12 月 10 日消息，智谱开源其核心 AI Agent 模型 AutoGLM。该模型被业界视为全球首个具备「Phone Use」（手机操作）能力的 AI Agent，能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。

此次开源意味着硬件厂商、手机厂商和开发者均可基于 AutoGLM，在自己的设备或系统中复现一个能「看懂」屏幕、并模拟真人进行点击、输入、滑动的 AI 助手。目前，AutoGLM 已支持微信、淘宝、抖音、美团等超过 50 个高频中文应用的核心场景，其自动化操作能力与此前引发热议的「豆包手机」演示相似。

AutoGLM 的开源将大幅降低 AI 手机的技术门槛，推动 AI 手机生态从封闭走向开放共创。同时，项目支持本地与云端部署，确保数据与隐私控制权始终掌握在使用者手中。（来源：智谱）

Pebble 戒指登场：定位「第二大脑」，不做健康监测、要靠语音记事杀出重围

12 月 10 日消息，科技媒体 Appleinsider 昨日发布博文，报道称继智能手表回归后，Pebble 品牌发布全新智能戒指 Pebble Index 01。该设备定位为「用户的外部记忆」，主打语音笔记功能，通过内置麦克风与按钮，将录音传输至手机并利用 AI 转换为文本。

Index 01 的使用逻辑非常直观：用户按下戒指顶部的宝石状按钮，即可通过内置麦克风记录语音。录音文件会即时传输至配对的智能手机（如 iPhone），并利用手机端的开源语音转文字模型及 AI 技术进行处理和转录。

Pebble 声称该系统支持超过 99 种语言。若手机不在身边，戒指本身可存储长达 5 分钟的音频，待连接后自动同步。此外，该按钮还支持自定义功能。

在硬件配置上，Index 01 采用了极端的「减法」策略。戒指主体由不锈钢制成，去除了屏幕、扬声器及触觉反馈马达，仅保留一个极少亮起的 RGB LED 指示灯。

这种设计将所有的 AI 运算与数据处理压力转移至手机端，从而大幅降低了戒指的功耗。最引人注目的争议点在于其电源管理方案：Pebble 宣称该戒指拥有「数年」的平均使用续航，但不支持充电。一旦电量耗尽，用户无法自行补能，必须将设备寄回 Pebble 进行回收处理。

价格方面，Pebble 制定了极具竞争力的策略：预售价格为 75 美元（现汇率约合 530.8 元人民币），正式上市后售价为 99 美元，产品预计于 2026 年 3 月开始发货。（来源：IT 之家）

四摄设计？三星 Galaxy Z TriFold 三折叠手机原型机现身

12 月 9 日消息，三星电子中东北非地区市场与电商副总裁 Omar Saheb 前一天在领英平台发文，庆祝品牌首款三折叠手机 Galaxy Z TriFold 上市。

这名总裁在帖文下方晒出了自己上手 Galaxy Z TriFold 的照片，不过眼尖的网友们很快发现了他手里的手机与零售版机型的三摄设计不同，其机身背面拥有四个摄像头。

由于现在距离第二代 Galaxy Z TriFold 发布还为时过早，因此这名副总裁手里拿着的很可能是三星最终量产前，在内部制作、研讨的众多原型机之一，而且从实拍图可以看到，机身最底部的第四颗摄像头明显比前三颗要薄。

结合此前报道，三星 Galaxy Z TriFold 采用了内折设计，可有效保护主屏幕，配备高通骁龙 8 Elite for Galaxy 处理器，展开后机身最薄处仅 3.9mm，配备 5600mAh 三电芯电池，支持 45W 超级加速充电。（来源：IT 之家）

《阿凡达 3》导演卡梅隆现身海南，称 AI 永远替代不了人类创作

12 月 9 日消息，科幻大片《阿凡达 3》中国首映礼于 12 月 8 日在第七届海南岛国际电影节举行，导演詹姆斯・卡梅隆首次来到海南。

据新浪电影报道，詹姆斯・卡梅隆在海南岛国际电影节大师班上谈到了对 AI 的看法，卡梅隆赞同技术的革新，也认为 AI 可以用来做一些事，但永远替代不了人类的创作，「AI 能做出一个跟《阿凡达》差不多的电影，但在《阿凡达》上映前，它是做不出来的」。

卡梅隆说，「有人说是不是用 AI 替代人就好了？我个人是完全不感兴趣的，我不赞成用它取代人的创意。可以用 AI 提升工作流程，让我们更有创意，这个是可以的，只是要有高标准，不管是道德、法律方面等等。

我自己是永远不会用技术替代真人的，首先编剧要有真实的生活，他们要有独特的视角，然后演员再基于自己的人生体验诠释角色。每年评论家选出的电影都是很独特的体验，都是独特的艺术作品，AI 创作不出没人创作过的作品。AI 可以做出一个跟《阿凡达》差不多的作品，但是在这部电影上映前，它是做不出来的。」（来源：IT 之家）

普通视图

摩尔线程回应「拟用 75 亿元闲置募资现金理财」：符合公司及全体股东利益

宇树首发人形机器人 App Store：复杂动作直接下载，对优秀开发者提供奖励

甲骨文退出自研 AI 芯片赛道，董事长埃里森阐述背后原因

马斯克 xAI 与萨尔瓦多政府达成合作，Grok 未来两年进入 5000 余所公立学校

特斯拉 Model S 被发现搭载激光雷达测试，有望加入 Robotaxi 车队

Anthropic 首席科学家卡普兰：AI 可能会在「失控」中不断增强，最终反过来支配人类

国家出手管控卖车标价与交付时间！比亚迪、北汽率先响应

国产 3A《影之刃零》定档 2026 年 9 月 9 日，游戏制作人梁其伟发文致谢

机器学习团队打造出全球最大的三维建筑地图

OpenAI 开始「卖周边」：帽子、T 恤、Sora 主题收藏卡……

01 热闹之下，真刀真枪的技术如何？

02 不是「偷袭珍珠港」，而是一次「核试验」

03 价值漂移：从「应用内闭环」到「直连物理世界」

01

02

03

04

05

01

02

03

01

02

03

04

05

06

07

OpenAI 推出 GPT-5.2 瞄准「代理型 AI」竞争前沿

连续两周超越苹果 华为重夺中国手机市场份额第一

微软消费者 AI 业务负责人苏莱曼：要创造「符合人类利益」的超级智能

谷歌 Gemini 3 实战浏览器：AI 整理标签页，生成交互式 Web 应用

钉钉发布新版本：上线 AI 灵动回复功能，可自动回复同事聊天

迪士尼官宣 10 亿美元投资 OpenAI，允许 Sora 生成米老鼠等角色视频

Opera「AI 智能体浏览器」Neon 上线：月费 19.9 美元，号称每周都有大变化

苹果 Shazam 上线「热门片段」功能，揭示音乐中最受欢迎的段落

人类史上首次！英伟达投资公司在太空中训练首个 AI 模型

01

02

03

04

05

06

01

02

03

04

01

02

03

04

01

02

01

02

03

04

01

02

03

01

02

03

04

05

06

07

OpenAI 宣布紧急状态：放弃 AGI 梦想，全力拯救 ChatGPT

​Google 明确否认 Gemini 应用将引入广告

彭博：若 SpaceX 以 1.5 万亿美元估值上市，马斯克身家将逼近万亿大关

ChatGPT 整合 Adobe Photoshop 等部分软件功能

3000 万粉丝网红冯提莫复播：自称停播因甲状腺癌复发转移

全球最严，澳大利亚 16 岁以下未成年人社媒禁令落地实施

小米回应进军 AI 教育 ：人才招聘信息被误读，实为强化产品服务

岚图追光 L 破晓上市，定价 27.99 万起

苹果官网上线 3 小时快送服务：iPhone 免运费

马斯克：若重新来过，不会再领导美国「政府效率部」

01

02

连续两周超越苹果华为重夺中国手机市场份额第一

Google 明确否认 Gemini 应用将引入广告

小米回应进军 AI 教育：人才招聘信息被误读，实为强化产品服务