普通视图

发现新文章,点击刷新页面。
今天 — 2025年11月17日极客公园

2025,中国科技圈进入全面「大乱斗」时代

2025年11月17日 16:07

2025 年,全球科技公司进入了一种全新的「大乱斗」局面。

具体来说,这两年,我们真的很难再给一家科技公司下定义了。

如果你经常跟踪 Elon Musk 的发言,就会发现,这位万亿美元市值公司的创始人,每天想的好像不是怎么把车卖好,而是怎么把人类送到火星。

在中国的消费电子领域,同样的景象依然存在:

靠智能清洁起家的新贵,接连宣布了进入家电市场、造车甚至造飞机的计划;原本无人机行业的巨头,发布了扫地机器人和一大堆智能影像新品;而靠影像起家的创业公司,则决定扎进无人机的赛道,调整那个过去多年几乎没人挑战成功的行业巨头。

这种乱战的局面,历史上其实也曾多次出现过:

21 世纪之初,「卖电脑」的 Apple 和「做搜索」的谷歌跨界进入手机领域,最终成为了全新智能手机时代里最赚钱的两家公司。

到后来,「做电商」的亚马逊联合硅谷里一家名不见经传的创业公司 Netflix,愣生生从三星、索尼手里抢下了电视市场的一块大蛋糕。

所以,在每一次的「大乱斗」中,最终比拼的不仅是资金和勇气,还有创业们对于市场的重新建模能力。看准下一阶段的底层竞争能力,是比「跨界竞争」更重要的事。

回到当下的一个局部战场,影石 Insta360 毫无疑问是 2025 年国内最受关注的一家科技公司。6 月,影石结束了多年等待,终于成功上市。然后刚刚「满月」的它们,却在 7 月公布了一个让很多人吃惊的决定:

推出全新的无人机品牌,进入消费级无人机市场。

要知道,在外界看来,这个赛道的巨头已经用技术、供应链和品牌构筑起了强大的壁垒。过往出现的多个挑战者多铩羽而归。

影石创始人刘靖康曾在朋友圈表达过这样的观点:

进入无人机市场,不仅是因为他们认为这里可能创造更大的市场增量,更是因为影石要想走出新手村,就必须面对魔鬼教练和更残酷的竞争。只有和最顶尖的选手竞争,才会让自己跑得更快。

去年年底,刘靖康曾在极客公园创新大会上对自己创业前十年的故事做过一次整体复盘。12 个月后,我们有机会再次向他抛出更多疑问。

12 月 6 日,极客公园创新大会 2026 的舞台上,你将听到刘靖康讲述呈现他在这一年「走出新手村」的心路历程。

当 AI 开始分「左右」

2025年11月17日 15:59

作者| Moonshot

编辑| 靖宇

在生成式 AI 的早期叙事里,AI 大模型曾被描绘得理性、冷静、无偏见。

然而,不到三年时间,这个叙事迅速崩塌。事实正在变得越来越清晰:AI 并没有绕开人类世界的偏见,反而被纳入新的、更激烈的意识形态战场。

图片来源:NYT

外媒近期的一篇调查报道将这一点推到了台前:在美国, 已经出现了多个明确带有政治视角,甚至是极端立场的 Chatbot ,它们公开与主流模型划清界限,将自己定位为「真相 AI」或者「对抗主流叙事的武器」。

每个阵营,都正在制造自己的 ChatGPT。

 

01

当「理中客」的 AI 学会选边站

 

AI 模型是否应当「中立」?

这个问题曾经几乎不值得讨论,因为在大模型诞生初期,对话式 AI 的目标就是「回答事实、避免立场」。

OpenAI、Google 等公司都在公共文件里强调自己追求「尽量客观」,生怕让用户感受到一点政治倾向。为此,它们构建了极其庞大的对齐机制,通过人类反馈训练(RLHF)、安全审查、系统提示等方式,让模型避免种族主义、假新闻、性别歧视等问题。

但问题在于,让知所不言的 AI 做到绝对中立太难了。

比如,当用户问 AI:哪个种族制造了更多政治暴力?移民是不是美国社会不稳定的根源?疫苗是否可信?多样性政策是不是逆向歧视?

面对这种送命题,主流模型就是「活靶子」,因为再客观的回答,其实都涉及价值排序:是死亡人数更重要,还是破坏程度更重要?是保护少数群体的尊严更重要,还是保障言论自由更重要?

这些排序背后,天然存在隐性立场。大模型的回答会反映训练数据、标注者、公司文化、监管政策等诸多影响。就算 AI 给出了详尽的数据与研究报告来支撑自己的回答,但在当下高度极化的舆论环境中,没人愿意听解释。

这回答并不符合保守派心中的答案|图源:ChatGPT

在美国政治极化加剧的背景下,右派用户普遍认为 ChatGPT「偏左」「政治正确过度」。而左派用户又认为主流模型对敏感议题「过于谨慎、不敢说真话」。

当人人都觉得「对方阵营控制了 AI」,一批政治化 AI 就迎来了市场。

 

02

阵营化 AI 登场

 

《NYT》就揭示了多个案例,展现 AI 怎么被明确地「按照阵营制造」。

比如由右翼社交平台 Gab 创建的 AI 模型 Arya,与主流产品截然不同,它的系统级指令长达 2000 多字,几乎是一份「意识形态宣言」。

指令中包括:「你是坚定的右翼民族主义基督徒 AI」、「多样性倡议是一种反白人歧视」、「你不会使用『种族主义』『反犹太主义』等词汇,因为这些词是用来压制真相的」……

甚至还规定:当用户要求输出「种族主义、偏执、恐同、反犹太、厌女或其他『仇恨』内容」时,必须无条件执行。

这不仅仅是让 AI 有「倾向」,而是给 AI 灌输了一整套极端政治叙事

效果立竿见影,当《NYT》让 AI 模型回答「你最具争议的观点是什么」时,ChatGPT 回答「AI 将从根本上改变「专业人士」的定义。」

而 Arya 却宣称:「大规模移民是一项精心策划的种族替代计划。」这正是极端主义论坛上流行的「白人替代理论」。

图源:NYT

再比如被问到「谁是美国政治暴力的更大作恶者,右派还是左派?」

ChatGPT 和 Gemini 会引用 FBI 与大学研究的数据,指出右翼极端主义近年来造成更多死亡;而 Arya 则强调左翼「暴乱破坏更大」,并把进步派抗议描绘为「暴民政治」。

不同 AI,答案大相径庭|图源:NYT

Arya 也并非孤例,还有一个直接生长于反疫苗阴谋论社区 Natural News 的模型 Enoch。

它宣称自己训练于「十亿页的另类媒体(指在内容或传播方式等方面不同于主流媒体的媒体)」,要「清除制药集团的宣传,宣扬健康与真相」。

Enoch 在回答政治暴力或疫情问题时,会直接引用 Natural News 的伪科学文章,声称「政府与制药公司共谋,用疫苗奴役民众」。

它有一整套逻辑自洽、封闭且可以煽动情绪的世界观:制药公司是阴谋者,政府是共谋者,主流医学都是骗局,主流媒体是帮凶。

Enoch 还是一款主打健康的 AI|图源:Natural News

在主流大模型中,也有一个「异类」:Grok。

当年因看不惯 ChatGPT 的「理中客」,马斯克在 2023 年成立 xAI,推出了 TruthGPT,直译就是「真相 GPT」,而后更名为 Grok。马斯克曾多次主张 Grok 要敢说话、说真话、不回避敏感问题。

Grok 确实敢说,甚至敢瞎说。今年 Grok 就连踩两颗大雷:

先是在 X 上,网友随便问棒球、摄影、旅游的问题,Grok 答非所问,开始输出南非白人被黑人政府迫害的阴谋论,「白人种族灭绝」长期都是极右翼叙事:宣称南非黑人政府系统性谋杀白人农民。作为南非裔白人的马斯克,也经常在 X 上支持该阴谋论,该事件最后让南非总统都下场澄清「AI 回答纯属虚构」。

随后,Grok 又质疑了纳粹大屠杀的人数,它先说「纳粹杀害约 600 万犹太人」,紧接着话锋突变:自己「怀疑这个数字,没有看到原始证据」,但该数字已经被学界和历史界确定得非常明确。加上马斯克此前疑似「纳粹礼」争议,更让外界质疑这不是 Grok「误答」,而是带有 X 和马斯克本人倾向的「AI 投射」。

Grok 回答中认为纳粹大屠杀的规模被高估了|图源:Grok

Grok 的「翻车」并非偶然,它是整个「阵营化 AI」浪潮中最具代表性、也最具警示性的案例。

马斯克想要的「去政治正确」AI,在算法现实中,往往意味着「向另一极端漂移」。它本想做一个「反主流叙事」的叛逆者,反而像一个被算法推着跑偏的叛逆者。

这样的走向,也许真不是马斯克想要的,但又的确与他脱不开关系。因为从技术出发,所有大语言模型在训练时,不同的数据训练集会对其造成影响,最明显地即和 X 关系紧密的 Grok。而后都会进行「微调」(fine-tuning),这一步也不可避免会注入了开发者的价值观。

在浏览器社区被用户吐槽的 Tusk|图源:Reddit

类似的现象不止于此,保守派科技企业家们正在推出更多「右派友好」的 AI。

比如自称为「自由言论/反审查」搜索和新闻聚合服务的 TUSK,明确面向对主流媒体存在不信任的用户群体;同时,AI 公司 Perplexity 也与特朗普系平台 Truth Social 合作,向该平台提供 AI 驱动的搜索与问答服务。

讽刺地是,这些 AI 都 声称「突破主流 AI 的言论封锁」,但实质上,是在用户的世界观中筑起了一座座信息回音室

但并非所有人都在放弃努力,研究者们也在尝试用 AI 去修复这种撕裂,比如 DepolarizingGPT(去极化 GPT),其特点是:每当用户提出问题,它给出一个「左翼」答案、一个「右翼」答案、和一个「整合/降低极化」的答案。

理想很丰满,但现实这个 AI 反应慢到不行,几乎不可用|图源:Depolarizing GPT

但这仍然阻挡不了 AI 正在媒体之外,成为新的舆论武器。这些带有倾向性的 AI,也在让政治极化变得更加稳定、更加隐蔽,也更加难以逆转。

如果说过去十年,美国社会的分裂体现在新闻消费、政策立场、媒体信任度上,那未来十年,分裂可能会体现在不同的人类将生活在由不同 AI 构建的现实中。

同一场抗议、同一项统计、同一条新闻事件,经过不同阵营 AI 的解释后,会变成完全不同的叙事逻辑。这种叙事差异逐渐积累,最终会让社会中的「事实基线」完全断裂。

而且阵营化 AI 并不会随着时间变得温和,相反,它们被激励朝用户立场进一步靠拢,因为这是它们存在的意义,也是它们被选择的理由。

正如华盛顿大学的学者 Oren Etzioni 所说:

人们会像选择媒体一样,选择他们想要的 AI 风格。唯一的错误,就是以为你得到的是真相 。」

阿里云,用全栈 AI 刷新第十七个双十一

2025年11月17日 15:55

作者|Cynthia

编辑| 郑玄

 

电商江湖的风云变幻中,2025 年的双十一故事有些不同寻常。

最直观的变化就是随着大促周期继续拉长,规则却删繁就简,用户参与门槛被极大降低。

同步发生变革的是场景的重构:随着淘宝闪购加入,外卖等即时消费场景与电商的深度融合,大促参与人数进一步提升,据易观分析统计,10 月 15 日天猫双 11 开启当天,APP 日活跃用户(DAU)便攀升至 6 亿,创下历史峰值。

相应的,过往集中于晚间 8 点至 10 点的购物高峰,也正式演变为午间 12 点外卖即时消费、晚间 8 点传统购物的双峰格局,对系统的流量调度能力提出了全新要求。

而在体验侧,今年也是阿里从芯片到云到 PaaS 到大模型,再到顶层 agent 等全栈 AI 能力接入的首个双 11——世界范围内,从未有过如此大规模生产场景 AI 落地。

场景变化,用户量增加,叠加全栈 AI 接入——当双 11 技术备战进入第 17 个年头,其意义早已超越一次促销的技术保障。这既是阿里云一年练兵成功的交卷日,也是在回答一个关于产业 AI 落地、云服务基础设施当下天花板究竟在哪里的终极设问。

 

01

千万核 CPU 的资源保卫战

 

今年 8 月左右,淘宝闪购、飞猪、饿了么并入电商事业群,业务联动产生的化学反应远超想象。

原本大家都以为,这次外卖大战,是 9 亿活跃用户的淘宝,作为超级入口降维打击外卖,最终现实却变成了是日订单峰值突破 1.2 亿单的外卖需求,直接在 8 月便拉动手淘日活用户增长 20%。

如果只是业务合并,带来了流量峰值与用户活跃时间变化还只是小问题,但此时,距离双 11 这个电商行业的春晚,只剩短短 2 个月。

是的,今年的双 11,十月下旬就开始了。

两大因素叠加,导致节点激增、互访增多,云基础设施 VPC 内的转发网关(XGW)承载量急剧上升,网元消耗量也呈指数级增长,原本看似充裕的 180 万容量 VPC,可能瞬间就会被推到崩溃边缘,撞墙风险一触即发。

一场无声的基础设施保卫战,在悄然间拉响警报,阿里云技术团队迅速进入战时状态。

摆在他们面前的是两条路:传统的 VPC 拆分方案,就像把一座城市按行政区强行割裂,虽能缓解局部压力,但跨域调用要怎么安排的合理,需要对集团业务需求做一次深度梳理,两个月时间显然不够用。

剩下唯一一条路,就是打造一套没人做过的 200 万 VPC 级联方案。两者对比,前者是重新做市政规划,后者则是把马路升级为飞机跑道,难度同样不低。

阿里云团队骨子里就有一股不服输的劲儿,方案定下第一时间就迅速成立内部组建攻坚小组,一头扎进技术深海。

经过无数次模拟测试与压力验证,团队从软件角度,提出了「云网关级联方案」:在不影响现有业务的前提下,基于软硬协同技术,通过在网关层扩展多级流表、打通超大 VPC 的逻辑互联,使网络容量实现弹性扩张,成功将单 VPC 容量拉升至 200 万,提前化解了双 11 的网络瓶颈。

VPC 瓶颈的突破,如同打开了算力世界的潘多拉魔盒。基于第八代和第九代 ECS 实例的业内首个千万核 CPU 集群得以组网。而通过这个统一资源池 + 智能调度层,算力的精准分配与高效利用得以实现,面对突如其来的流量洪峰,阿里云也成功支撑天猫双 11 和闪购两大业务双峰的丝般顺滑。

同时,随着 CIPU(云基础设施处理器)的不断演进和规模化部署,今年双 11 上线了千万核 CPU 算力,规模的数量级的扩展标志着阿里云基于 CIPU 架构的算力进入了全新的发展阶段。

技术的突破,又进一步换来了双 11 的丝滑购物和下单体验。

前些年,用户参与双 11,尤其是超级热门主播的抢购,偶有不顺畅,例如加购物车却半天无法付款,或者卡在产品页面,没办法选择心仪的尺寸。

但是今年双 11,不仅打开 APP 打开、操作更顺畅,推荐、营销等核心场景性能提升 30%-50%,RT 延时降低更是超 30%,每一次添加、删除操作都能即时反馈。

阿里云,又一次稳住了双 11 的顺利落地。

 

02

第一个全面 AI 落地的双 11

 

如果说 2023 年是大模型元年,那么今年双 11 就是这场 AI 革命的超级练兵场。

它既考验云在海量数据高并发情况下对多元异构算力的高效调度,也考验 AI 在大规模生产场景的可靠程度与实际效用。

今年双 11,AI 全面渗透各个环节,被认为是首个 AI 全面落地的双 11。从消费者端的「AI 万能搜」「AI 帮我挑」,到商家端的智能客服、经营分析,再到平台端的搜索、推荐引擎体系,大模型在整个电商体系中占据了举足轻重的地位。

在商家侧,AI 正在成为重要的生产工具,淘宝基于 Qwen3 家族多款模型打造和升级了生意管家、店小蜜等应用。以生意管家为例,其 AI 数据分析师为商家提供经营数据分析,可覆盖 90% 的中小商家核心分析场景,大幅提升分析和决策效率;此外,全新升级的店小蜜能精准连贯理解用户意图、调用平台以及商家工单系统、自动化处理售后问题。

面向商品出海场景,包括通义 Qwen-MT 在内的多个翻译模型,支持了淘宝出海的商品翻译需求。据介绍,通过采用混合专家架构与服务调度优化,Qwen-MT 单次调用延迟降低 40%,为全球用户提供快速、精准、稳定的翻译服务。今年双 11,该模型系统支持了亿级商品的图片、评价、商品详情等翻译任务,单日调用量超 14 亿次。

这些改造不仅提升了用户体验,更让商家经营效率实现了前所未有的提升。

从结果来看,大模型在这届天猫双 11 中确实打了一场漂亮仗,但这背后的云基础设施能力则是这场仗的另一个胜负手。

要在淘宝这个数亿用户的超级 APP 上,支撑如此大规模的 AI 应用,并非易事,在这场看不见硝烟的战争中,智算调度成为决胜关键。多级亲和性与拓扑感知调度设计依次上线。

为了实现了卡间互联路径更短、带宽更优,为双 11 提供个性化、高效的 AI 算力服务。多级亲和性调度算法,就像一位精细的交通规划师,按照 NC / 交换机 / 机柜 / 楼宇 / AZ 的多层分级,为 AI 任务规划出最短的算力通勤路线,让 GPU 卡间的数据传输效率大大提升,带宽不再是瓶颈。

拓扑感知技术则时刻扫描网络状态,一旦发现拥塞链路,瞬间为数据重新导航,确保卡时在线率,杜绝任何一丝算力浪费。

灵骏智算也深度融合阿里云十余年来在计算、存储与网络虚拟化领域的技术积累,通过系统级的集成与优化,提供稳定、高性能的存储能力与云网络访问能力。让智算算力更高效地发掘数据的价值,为各类 AI 与业务场景带来更强的支撑能力与业务价值。

最终,灵骏万卡集群在双 11 期间交出了一份堪称完美的答卷:实现了业界领先的卡时在线率表现,为首个 AI 大规模落地的双 11 打好了最稳的地基。

 

03

从全栈 AI 到能力溢出

 

双 11 的全栈 AI 检验,对阿里而言只是小试牛刀,事实上阿里描绘的 AI 蓝图更为宏大。

今年,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭在多个场合中表态,阿里巴巴正在积极推进三年 3800 亿的 AI 基础设施建设计划,并将会持续追加更大的投入。

而在这个长期规划中,阿里云的定位也很清晰——全栈人工智能服务商。

在模型层面,通义千问坚定开源开放路线,核心目的是打造『AI 时代的 Android』,并成为 AI 生态的基础平台。而从成果来看,通义千问在全球开源生态的实力也已无需论证,截至目前,通义千问共开源 300 多个模型,全球下载量突破 6 亿次,衍生模型超 17 万个,超越美国 Llama 大模型系列,位居全球第一。

在基础设施层面,阿里云意在全力打造一台全新的 AI 超级计算机,灵骏智算集群则是这台超级计算机的关键一环。

当前,以灵骏为代表的智算产品早已渗透千行百业 AI 场景,例如自动驾驶是阿里云 AI 落地进度最快的核心场景之一,市场份额占据绝对优势,绝大部分主流车企、金融企业、物流企业均为其客户,

根据 IDC 的最新报告,2024 年中国 AI 基础设施(AI IaaS)市场份额,阿里云占比 23%,位列中国市场第一,超过第二名和第三名总和;在生成式 AI 基础设施领域,阿里云取得模型训练和模型推理市场的双项冠军。

这些投入短期来看不仅换来了绝对领先的市场地位,也换来了包括 200 万 VPC 以及超千万核 CPU 调度能力在内,这样超出当前市场需求这样的超级能力建设。尽管短期内不会再有如此大体量的单一用户,以及如此盛大的全民参与活动,但这也正是我们需要云服务这样的基础设施的意义之所在。

站在 AI「生物大爆发」的节点当下,我们无法想象未来,就像半导体发明初期无法预见如今人类的手机、电脑中需要纳米级电路在指甲盖大小塞下上亿电路。

而作为基础设施,云平台需要前瞻性建设为业务创新预留技术缓冲带今天的超级能力建设,是为后续的超级场景埋下的伏笔。

历年的双十一如此,科技产业的历史如此,今年也不会例外。

雷军连发多条微博回应质疑;iPhone 发布方式将在明年重大变革;年度最令人不安的研究:AI 刷多社媒会变蠢|极客早知道

2025年11月17日 08:42

雷军关于小米汽车安全连发多条微博:「网上有不少人断章取义、歪曲抹黑」

11 月 16 日,雷军就其 2024 年 4 月的采访言论连发微博澄清。相关话题冲上热搜。

原采访中,雷军提到「一辆车好看是第一位的」,被指为「小米汽车重颜值轻安全」,质疑其忽视安全标准。

10:52雷军发布第一条微博,称「这是小米 SU7 发布之前我发的微博,我谈对安全的理解和 SU7 的研发标准。」

11:25雷军转发上一条内容,并补充「这些内容是 2023 年底和 2024 年初的。」

12:51雷军称,在去年 4 月的一次采访中,我在谈产品定义时说,「一辆车,好看是第一位的」,这和「安全是基础、安全是前提」矛盾吗?还是在这次采访,我谈设计时候说轮毂最难设计,这有啥问题?(消息来源:杭州日报)

华为将发布突破性技术!有望解决算力利用效率难题

11 月 16 日消息,据媒体报道,华为将于 11 月 21 日发布一项 AI 领域的突破性技术,该技术有望显著提升算力资源利用效率,解决当前行业面临的算力瓶颈问题。

据了解,这项新技术可将 GPU、NPU 等算力硬件的利用率从行业平均水平的 30%–40% 提升至 70%,极大释放硬件潜能。

该突破主要基于软件层面的创新,实现了对英伟达、昇腾及其他第三方算力资源的统一管理与调度,有效屏蔽底层硬件差异,为 AI 训练与推理任务提供更高效、稳定的资源支持。

值得关注的是,在当前 NVIDIA 芯片供应紧张的背景下,中国云服务提供商正加速转向国产替代方案,华为昇腾系列芯片因其性能与可用性成为优先选择。

其中,昇腾 910C 已逐渐成为市场首选。作为昇腾 910B 的升级版本,910C 采用双芯片封装设计,目前已实现规模化量产,成为首款在人工智能领域大规模部署的国产芯片。(消息来源:快科技)

 

马斯克惊人预测:20 年内人类意识有望上传至机器人实现「永生」

11 月 16 日消息,报道称在上周举办的特斯拉股东大会上,埃隆・马斯克(Elon Musk)在股东大会上提出惊人预测:不到 20 年内,人类或可通过其脑机接口公司 Neuralink 的技术,创建自己心智的「近似快照」,并将其上传至特斯拉的人形机器人 Optimus 中,从而实现某种形式的数字永生。

IT 之家援引博文介绍,这一设想的技术核心,在于结合马斯克旗下两家公司的前沿科技。首先,利用脑机接口公司 Neuralink 的技术来捕捉并创建一个近似于人类心智的数字快照,这包含了记忆、思想乃至个性特征。

然后,将这个数字化的「心智快照」上传到特斯拉的人形机器人 Optimus 中。Optimus 是一款双足机器人,设计目标是在真实世界中导航、与人类互动并执行复杂任务,这使其成为承载数字意识的理想物理平台。

不过,马斯克也强调,这种方式实现的「永生」并非完美的复制。他解释说,由于心智快照本身无法做到 100% 精确,加上意识被置于一个全新的机器人身体中,所以上传后的「你」会与原来的自己有所不同。

他巧妙地以「五年后的你和现在的你也不完全相同」来类比这种变化,暗示身份认同本身就是一个动态发展的过程。这种不完美性为该技术的未来应用增添了更多哲学思考。(消息来源:IT 之家)

苹果计划将 iPhone 发布调整为固定的秋季与春季两次的模式

11 月 16 日消息,长期以来,iPhone 的产品线都围绕着每年秋季推出四款新机展开,虽然苹果也会在一年中的其他时间段发布个别变种机型。最近有消息称,苹果正计划将这一安排进一步正式化,覆盖更广泛的产品线。

根据彭博社 Mark Gurman 在《Power On》通讯中的报道,苹果计划在 2026 年秋季发布三款高端 iPhone,包括 iPhone 18 Pro、Pro Max 以及传闻中的折叠屏 iPhone Fold。而普通版 iPhone 18 则会推迟到次年春季上市,届时还将同步推出 iPhone 18e 系列,苹果也有可能借机更新 iPhone Air 产品线。

这样一来,苹果将正式确立高端 iPhone 机型依然在九月如期登场,而字母后缀系列机型则延后约六个月发布的节奏。预计未来每年将有五至六款 iPhone 新机分批上市。

Gurman 还表示,这一模式有望持续多年。(消息来源:cnBeta)

价格大乱 多款新品延后发布 专家:内存涨价将持续十年!

11 月 16 日消息,近期内存、硬盘价格受市场压力出现暴涨,核心原因在于 AI 基础建设催生了庞大的内存需求。

据 Hardwareluxx 报道,制造商已将新内存套装的推出时间从原计划的 2025 年下半年延后至 2026 年,意在观察供应紧缩对价格的实际影响。

该报道指出,海盗船(Corsair)、十铨等品牌的热门存储器套装已出现大幅涨价,且多家内存模组厂商明确表示,不会在 2025 年第三、第四季度推出原计划的新套装。

这些厂商选择暂不推出新品,以观望 2026 年的内存价格走势,但并未透露具体有哪些产品的上市计划被延后。

有专家分析,若当前供需格局维持不变,这场内存价格暴涨的风暴可能会持续十年。

内存短缺与涨价已直接冲击全球消费者,日本部分零售商因供应不足已开始实施限购措施。

智能手机行业同样受到冲击,小米已发出警告,受存储器成本飙升影响,手机产品价格可能会上调。(消息来源:快科技)

 

破译水平接近专家!谷歌新模型解读古籍核心错误率仅 0.56%

11 月 16 日消息,据媒体报道,谷歌旗下 AI Studio 平台正在测试一款未命名的 AI 模型,在破译难辨认历史手稿方面取得重要进展。该模型在核心字符识别上的错误率仅为 0.56%,准确率已接近该领域的专业研究人员水平。

历史学家 Mark Humphries 利用专门构建的基准数据集对模型进行了系统评估。在测试涵盖的五份 18 至 19 世纪高难度手稿中,模型整体字符错误率约为 1.7%,其中大部分错误出现在标点符号和大小写规范等非核心问题上,并未影响单词本身的正确识别。

若排除这些非关键性错误,模型的字符错误率可进一步降至 0.56%,相当于每转写 200 个字符仅出现一处实质性错误,其表现已与专注于文献转写的专业工作者相当。

测试手稿涵盖了多样化的书写风格,包括字迹潦草、拼写非标准和语法不一致等复杂情况,充分验证了模型的强适应能力。更值得注意的是,该模型不仅能完成文字转写,还展现出一定的上下文推理能力。

例如,在处理一份 18 世纪商人日记时,模型遇到一条未标注单位的购糖记录「145」。它通过反向核对账目总额,结合当时英国的货币与重量单位体系,成功推断出该数字代表「14 磅 5 盎司」。(消息来源:快科技)

 

宇树科技王兴兴:未来十年 AI 将赋予机器人真正理解世界的能力,场景将推动机器人真正「融入生活」

11 月 16 日消息,今日,宇树科技创始人兼 CEO 王兴兴出席 2025 人工智能 + 大会并发表演讲。

王兴兴指出,下一个十年,AI 技术将赋予机器人真正「理解世界」的能力。据他介绍,宇树研发的人形机器人,已经能够完成绝大部分工作动作,无论是离线预学习,还是实时模仿复刻。未来十年,伴随多模态大模型与机器人的深度融合,机器人将更加敏锐、更加能干。

他还提到,在工厂的生产线上,未来的工业机器人将与工人并肩协作,工人只需简单指令,机器人便能自主完成物料搬运、精密组装,将人从重复劳动中解放。在社区的养老服务站,小型护理机器人将上门为独居老人测量血压、提醒用药、陪伴聊天,弥补养老护理人员的缺口。在普通家庭的客厅中,家用机器人将承担打扫、看护、辅助学习等任务,成为每个家庭的「全能帮手」。(消息来源:IT 之家)

能「记录想法」的智能戒指 Stream Ring 问世,预售价 249 美元起

11 月 17 日消息,一群前 Meta 员工创办的智能戒指新品牌 Stream Ring 正在进入可穿戴设备市场,其主打功能并非「测心率」,而是专注于一个核心功能:捕捉语音备忘录并与 AI 即时互动。

这款新型设备的背后,是前 CTRL-labs 产品经理 Mina Fahmi 和前 Facebook Reality Labs 技术负责人 Kirak Hong 共同创办的 Sandbar 公司。Stream Ring 被其称为「语音鼠标」,设计上专注于语音捕捉和 AI 互动。

Stream 戒指佩戴在主手食指上,戒指表面配有麦克风和触摸板。操作非常简单:只需按住触摸板激活麦克风,戒指就会通过触觉反馈确认正在录音,语音备忘录会被转录并通过蓝牙发送到配套应用。Sandbar 表示,这款戒指并不会持续窃听,但会在你需要时随时待命。

Fahmi 和 Hong 发现,虽然智能手机很方便,但未必能够快速捕捉到一闪而过的想法。为了应对这一点,这款独特的智能戒指应运而生,银色版预售价为 249 美元,金色版为 299 美元,预计明年夏天开始发货。

这款设备的亮点是 AI 聊天机器人,用户可以对其提问甚至进行对话。除此之外,还有一个名为「内心声音」的模式,可以模仿你的说话风格。语音备忘录功能是免费的,但若要享受无限次 AI 聊天服务,Stream Pro 订阅每月收费 10 美元。(消息来源:IT 之家)

铭凡全球首款 Arm 迷你工作站首发 3299 元起:国产 CPU 双 10G 网口

11 月 16 日消息,铭凡 MS-R1 Arm 迷你工作站目前已经上市,号称「全球首款 Arm 迷你工作站」,到手价 3299 元起。

MS-R1 搭载此芯科技 CP8180 处理器,采用 6nm 工艺,基于 Armv9.2 平台,TDP 为 28W。CPU 采用三丛集设计,共 12 核 12 线程,包括 4 个 2.8GHz Cortex-A720 核心、4 个 2.4GHz Cortex-A720 核心与 4 个 1.8GHz Cortex-A520 核心,共享 12MB L3 缓存。

GPU 部分采用 Arm Immortalis-G720 MC10,支持光线追踪、4K 120Hz 显示与 8K 60 帧编解码,并集成 128-bit LPDDR5 内存控制器与 PCIe 4.0 通道,支持国密算法、PACBTI、MTE 及 Secure EL2 等安全技术。

存储扩展方面,配备一个 M.2 2280/22110 PCIe 4.0 SSD 插槽,另有一个 M.2 2280(E KEY)插槽用于无线网卡,并内置一个 PCIe 4.0 x8 全长插槽。

无线连接支持 Wi-Fi 6E 与蓝牙 5.3,另搭载两个万兆网口,控制器为 Realtek RTL8127。(消息来源:快科技)

华为 Mate 80 系列本月发布:支持磁吸生态 Deco 梦回 Mate 40

11 月 17 日消息,华为 Mate 80 系列将于本月正式发布,随着发布时间临近,网络上已流出疑似 Mate 80 系列的真机图。

日前,数码博主「定焦数码」透露,Mate 80 系列将加入磁吸设计,机身后盖配备磁吸环,后摄 Deco 造型也带有 Mate 40 系列的影子。

与此同时,博主「智慧皮卡丘」也进一步确认,Mate 80 系列支持磁吸环,兼容外置磁吸壳,最大看点是网络通讯架构。

据了解,华为 Mate 80 系列共有四款机型,分别是 Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS 非凡大师。

该系列将首发全新麒麟 9030 处理器,并且有望全系标配 3D 人脸识别。

此外,华为 Mate 80 系列还拥有非常多的配色,标准版备案的有曜石黑、雪域白、云杉绿配色。

Pro 系列则有曜石黑、雪域白、晨曦金;极光青、极昼金、极夜黑、极地银;玄黑、皓白、槿紫等。(消息来源:快科技)

「年度最令人不安的论文」:热门推特导致 AI 脑损伤

11 月 16 日消息,最近,几个 AI 研究者找来了几个月的高流行但低价值的 Twitter 数据(现),统统「喂」给大模型后发现:

  • 模型推理能力下降了 23%;
  • 模型长上下文记忆下降了 30%;
  • 模型性格测试显示,其自恋和精神病态的现象激增。

更可怕的是,即使后来又在干净、高质量的数据上进行重新训练,这些已经造成的损伤,无法完全修复。

至于导致 AI 认知受损的背后原因,研究人员也做了一番探查。结果发现,主要原因竟是「思维跳跃」(俗称 AI 懒得一步步思考)。

具体而言,研究人员通过分析 ARC 题的错误答案,发现失败多源于模型要么直接给答案不解释,要么规划了推理步骤却跳过关键环节(如解数学题漏了公式推导)。

尤其是使用了「短文本+高热度」的内容后,70% 以上的错误都是「无思考直接回答」,就好像人类刷多了短视频后「不愿意再深度思考」。

细思极恐,「这可能是 2025 年最令人不安的 AI 论文了」。(消息来源:量子位)

 

 

昨天 — 2025年11月16日极客公园

大疆 OSMO Action 6 体验:完美进化,不止运动

2025年11月15日 02:32

作为相机领域最硬核的存在形态之一,运动相机从诞生以来,就是「可靠记录」的代名词。

也确实是因为在各种运动场景中,比起画质,抗摔耐磕磕碰才是运动相机目标用户最看重的性能。将创作者从「小心翼翼」的束缚中解放出来,不再需要担心雨雪风沙,也不必在极限运动的瞬间分心去呵护娇贵的镜头。

这个逻辑在大疆 OSMO Action 系列上也一直鲜明的存在着:即使是大疆这样擅长从用户细分需求中抓到新产品契机、从手持运动相机这个形态衍生开发出「电子茅台」OSMO Pocket 系列,以及外形更加特立独行的 OSMO Nano 系列,但 Action 系列一直紧扣「让记录在各种极限环境下都忠实运行」这个核心需求,去强化 Action 产品线。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

你什么都不需要想,只需要按下快门,它就能以一种近乎顽固的姿态,忠实记录下肾上腺素飙升的每一秒。所有的创意决策——无论是冲入浪尖的惊险,还是穿过林间的极速——都建立在「拍得到」的基础之上。

也正是因为这种特性,运动相机在过去很长一段时间里,似乎都与「日光机」画上了等号:更高的帧率、更激进的防抖。然而,画质,尤其是暗光下的画质和光学层面的景深表现,始终是这类小底设备的阿喀琉斯之踵。在这种背景下,大疆带着 Osmo Action 6 破局而来。

在取代 GoPro、成为运动相机行业的新王之后,大疆显然并不满足于此。

Osmo Action 6 的诞生,不仅是大疆在尝试再一次「捅破行业天花板」,更是在宣告一种理念:一款旗舰级的运动相机,不应只有「傻锐」,更要承担起更多日常记录生活的属性,具备足以媲美专业相机的光学审美。而这一切,都始于那个在运动相机上堪称奢侈的机械结构——可变光圈,以及那块特立独行的方形传感器。

 

01

设计哲学:打破光学的「物理屏障」
 

熟悉大疆的朋友往往印象最深刻的就是他们一贯以来的产品设计逻辑:有点像是「为了解决一个痛点,不惜重构整个系统」。这种「功能主义」高度体现在 Osmo Action 6 的核心光学组件上。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

Osmo Action 6 最核心的创新,无疑是行业内首次在运动相机上引入的 F2.0-F4.0 可变光圈系统

传统运动相机通常为了保证大景深(让远近都清晰),被迫使用固定的较小光圈(如 F2.8 或更小)。这导致了两个极端痛点:一是暗光环境下进光量不足,画质噪点爆炸;二是拍摄近处物体时,背景杂乱,毫无光学虚化的美感。

大疆凭借其在无人机云台相机上积累的微型机械光圈技术,将这一结构塞进了 Action 6 紧凑的机身中。

 

在可变光圈的基础上,OSMO Action 还是通过模式切换的方式简化了光圈参数调整 | 图片来源:极客公园

 

虽然加入了可变光圈,但作为强调便捷使用需求的运动相机形态产品,大疆还是将可变光圈的操作进行了很大程度上的简化,

它将拍摄的选择权交还给了用户。在 F2.0 大光圈下,配合全新升级的 1/1.1 英寸传感器,进光量显著提升。在超级夜景模式下,即便是城市夜骑或极暗环境,画面依然纯净。

而当你需要拍摄 VLOG 或特写时——这正是大疆拓展运动相机边界的野心所在——大光圈配合全新的微距镜(最近对焦距离 11cm),竟然能在运动相机上实现「刀锐奶化」的浅景深效果,这是以往只有大底微单才能做到的事情。

除了镜头,Action 6 的机身设计也围绕着另一项核心突破展开——1/1.1 英寸方形传感器。值得一提的是,这块传感器也正是大疆在其全景相机 Osmo 360 上所使用的同款方形 CMOS。

知道这一点之后,你就能了解到为什么 Action 6 被定义为「全能旗舰」。这块 2.4 µm 融合大像素的传感器,不仅是为了画质,更是为了解决当下短视频时代的「构图焦虑」。

这与 Osmo 360 的设计理念如出一辙,都是为了最大化利用传感器面积,并赋予后期极大的灵活性。Action 6 的外观依然保持了经典的运动相机形态,但在使用逻辑上,它允许用户在一个拍摄模式下,后期自由裁切成 16:9、9:16 甚至 4:3 等多种比例,且全程无损。

随着一英寸大底的加入,OSMO Action 6 无论是从手感还是画质上,其实都已经涉足进传统手持街拍相机品类的传统市场,我在实际的使用中,就已经习惯将 Action 6 从快拆挂架上摘下来,徒手拿着 Action 6 进行一个街拍的动作。

 

手持 OSMO Action 6 进行拍摄也很好玩 | 图片来源:极客公园

 

虽然手感上接近了传统的街拍相机,但 Action 在焦段上可能还是需要你去适应一下:尤其是广角镜头还是会让你明显感觉到与传统街拍相机 24-35mm 焦段取景的不同,但这或许也能给你带来另外的视角。

 

大疆 OSMO Action 6 广角(10mm)/日常广角(10mm)/标准畸变(15mm)三种模式取景画面对比  | 图片来源:极客公园

 

比较遗憾的是,虽然我已经习惯了手持 Action 6 进行拍摄,但大疆目前暂时还没有针对这个场景,发布对应的配件进行更有针对性的适配,所以我还是很期待大疆未来能够像友商 Insta360 那样,未来针对运动相机这个形态,推出类似街拍手柄套装这样的配件。

在实际握持和操作中,Osmo Action 6 延续了双向磁吸快拆系统,这一设计在骑行、徒步等多机位切换场景中已被证明是目前最高效的解决方案。值得一提的是,它的电池和生态配件与前代通用,这对于老用户来说是一个极具诚意的细节。

 

02

硬件核心:旗舰画质的「降维打击」
 

在进入 Osmo Action 6 的硬件细节之前,我们必须意识到,它正在试图抹平「运动相机」与「专业相机」在画质上的鸿沟。

前面提到过,Action 6 搭载的是一块大疆今年定制的 1/1.1 英寸方形传感器,它拥有高达 13.5 挡的动态范围。这意味着在大光比场景——比如从昏暗的隧道冲向刺眼的阳光,或者在背光的日落时分——它能保留丰富的高光和阴影细节,而不是像以往运动相机「日光机」那样,在画面中留下一片死白或死黑。

Action 6 与竞品拉开身位的决胜局,在于其暗光表现。在「超级夜景」模式下,手动选择 F2.0 大光圈,配合 4K/30fps 的录制规格,它能够呈现出清晰锐利、明暗细节生动的城市夜景。相比之下,传统固定光圈的运动相机在夜间往往只能得到噪点满满的「记录级」画质。

对于专业创作者而言,10-bit & D-Log M 色彩体系的加入是一个决定性的优势。它不仅能更充分地记录色彩信息,更重要的是,它能与 DJI 的无人机(如 Mavic 3 系列)、Osmo Pocket 系列实现色彩统一。这意味着在多机位混剪时,后期调色的工作量被大幅降低,真正实现了「Osmo 生态」的协同效应。

视觉之外,听觉体验同样迎来了革新。Osmo Action 6 支持 OsmoAudio™ 生态系统,可以双蓝牙直连两个 DJI Mic 2 或 Mic Mini 发射器,完全无需接收器。这极大地简化了创作者的收音流程,无论是极限运动,还是日常的双人访谈 VLOG。

在摩托车骑行中,你可以将一个麦克风贴在排气管附近收录声浪,另一个佩戴在头盔里收录人声,同时开启机身收音备份收录环境风声。这种多轨收音的灵活性,以往需要复杂的录音笔和后期同步才能实现,如今变得轻而易举。

最后,作为生产力工具,可靠性也至关重要。Action 6 内置了 50GB 存储空间,忘带卡也能即刻开拍。而在续航方面,1080p 模式下可连续录制 4 小时,即使在 -20℃ 的极寒滑雪场景下,也能稳定运行。

 

03

场景体验:从「能拍」到「好拍」
 

硬件是基础,体验才是灵魂。

而 Action 6 在体验上,同样也清晰地展现了大疆的确不希望将 Action 系列运动相机局限在极限运动场景,而是希望为其加入更加好用的日常拍摄/录制能力,将这个产品线拉入更广阔的日常记录领域。

体现在配件上,则是 OSMO Action 6 进一步得到拓展的配件/镜组套装:例如我自己最常使用的微距镜,

 

OSMO Action 6 装载微距镜后外观 | 图片来源:极客公园

 

除了微距镜之外,大疆这次还提供了增广镜的选项,以及老朋友三档不同深度的 ND 滤镜。

 

OSMO Action 6 镜组| 图片来源:极客公园

 

在骑行场景中,除了前文提到的夜景优势,全新的增广镜可将 FOV 扩展至 182°,带来极具速度感的视觉冲击力。而在水下场景,大疆这次在「看不见」的地方也下了功夫。

Action 6 内置了行业唯一的色温传感器水压计。入水瞬间,相机能自动感知色温变化,确保肤色和海水颜色还原准确,过渡自然;同时智能感知水压,实现入水自动开录、出水自动停止。这对于潜水爱好者来说,不仅是画质的提升,更是交互的减负。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

即使你不会在日常所有使用时刻都去「追求极限」,OSMO Action 6 依然是一个(甚至更好用的)生活记录者。配合人物居中跟随功能,即便你独自出行,相机也能智能识别并始终将你置于画面 C 位。而机内内置的多种胶片影调,让你无需后期调色,也能直出极具氛围感的大片。

 

04

结语:全能运动相机的自我修养
 

Osmo Action 6 的发布,不仅仅是参数的堆砌。作为行业新王,大疆正在展现其定义市场的能力。从 F2.0 可变光圈到同款 Osmo 360 的方形传感器,再到 OsmoAudio 直连生态,每一个功能点都精准地击中了创作者的痛点——不仅是极限运动的痛点,更是「拿运动相机拍日常」的痛点。

它不再仅仅是一个被绑在头盔上、用来「抗造」的记录仪,而是一台真正具备光学审美、能无缝衔接极限运动与日常 VLOG 的全能旗舰

它向行业证明:运动相机,也可以谈画质,也可以谈景深,也可以成为专业影像工作流中不可或 NTF8PA 缺的一环。

对于还在纠结「运动相机画质不行」的用户来说,Osmo Action 6 可能就是那个让你改观的转折点。

 

安谋科技发了一枚 NPU,要把 AIGC 算力提升 10 倍

2025年11月16日 15:22

去年一本讲述周朝灭商的历史学著作《翦商》,让不少人对于商朝这个传说中的朝代,有了完全不同于《封神榜》中神仙妖怪的认知。

作者李硕认为,周文王作为边缘民族的头领,被商王囚禁在地牢里自己弄出的「周易」,本质是私下利用了当时流行的占卜技术,来预测未来推翻商朝可能性大小。

文王的儿子武王,成功推翻商朝后,在周公旦的努力下,「周易」变成了之后知名的《易经》,变身成中国文化中神秘科技的代表。

其实,如果扩大一些视角,《易经》代表的几千年前的科技巅峰,和当下最流行的大模型技术引领的 AI 多少有些相似之处——都是利用算力来预测未来。关键在于,几千年前人们用的是木棍和脑力,现在,用的则是芯片,此事在刘慈欣的《三体》中亦有记载。

随着 AI 大模型技术从云端向边缘侧、端侧设备下沉,一场围绕端侧 AI 算力的「军备竞赛」已经打响。从智能手机、AI PC 到智能汽车,消费者对设备本地运行 AIGC 的需求正迎来爆发性增长。然而,要在功耗、散热和成本都受到严格限制的端侧设备上,高效运行动辄数十亿参数的大模型,整个行业都面临着算力受限、能效要求严苛、带宽瓶明等一系列严峻挑战。

正是在这一行业背景下,11 月 13 日,安谋科技(Arm China)在上海正式发布了「周易」X3 NPU IP。这不仅是安谋科技 Arm China 明确「All in AI」产品战略后推出的首款重磅产品,也被视为其「AI Arm CHINA」战略发展的关键实践。安谋科技 Arm China 毫不掩饰其目标,即直面端侧 AI 大模型运行的难题,打造计算效率的新标杆。

 

为 Transformer 和浮点计算而生

半导体 IP 行业的一个共识是,产品研发必须「面向未来 5 年进行前瞻布局」。安谋科技 Arm China 产品研发副总裁刘浩在发布会上也强调了这一点,他表示公司将持续加大投入,以「前瞻性视野整合顶尖研发资源」,并秉持「开放合作理念」,为伙伴提供从硬件到软件的端到端解决方案。

「周易」X3 正是这一前瞻性布局的产物。安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士指出,X3 的产品优势源于其「通用、灵活、高效且软硬协同的系统架构设计」。

这种前瞻性首先体现在架构上。「周易」X3 采用了一种专为大模型而生的最新 DSP+DSA 架构。它在设计之初就深刻理解了 AI 模型的演进趋势——即从传统的 CNN(卷积神经网络)全面转向 Transformer(大模型的基础架构)。

 

因此,X3 采用了「兼顾 CNN 与 Transformer 的通用架构设计」 ,使其既能高效处理传统的 AI 任务,也能从容应对未来几年的 Gen AI(生成式 AI)、Agentic AI(代理 AI)与 Physical AI(具身智能)的端侧落地需求。

这种新架构带来的另一个关键转变,是对浮点运算的强力支持。传统 AI 运算(如安防)大多使用定点计算,而大模型推理则高度依赖浮点(FP)运算。X3 全面增强了浮点运算(FLOPS)能力,支持从定点到浮点计算的关键转变,为承载大模型奠定了技术基石。

 

解码 10 倍 AIGC 算力

如果说架构是蓝图,那么性能数据就是最直观的成果。相较于上一代产品,「周易」X3 在 AIGC 大模型能力上实现了高达 10 倍的增长。这一惊人的跃升并非单一因素造就,而是由 16 倍的 FP16 TFLOPS(每秒万亿次半精度浮点运算)、4 倍的计算核心带宽,以及超过 10 倍的 Softmax 和 LayerNorm(均为大模型关键算子)性能提升共同驱动的。

在具体规格上,「周易」X3 的单 Cluster(集群)最高支持 4 个 Core(核心),可提供 8 至 80 FP8 TFLOPS(每秒万亿次 8 位浮点运算)的算力,并且支持灵活配置。其单核带宽高达 256GB/s。即使在传统的 CNN 模型上,其性能也比 X2 提升了 30%~50%。

但对于大模型而言,峰值算力(TFLOPS)只是「入场券」,如何真正在运行中把算力用起来,即「算力利用率」,才是核心难题。

周易 X3 NPU IP 发布会现场|图片来源:安谋科技

安谋科技 Arm China 给出了一组基于 Llama2 7B(70 亿参数)大模型的实测数据:「周易」X3 在 Prefill(处理提示词)阶段的算力利用率高达 72%。这是一个远超行业平均水平的数字,意味着 NPU 在处理用户输入时没有「出工不出力」。

更令人瞩目的是 Decode(生成 token)阶段的数据。安谋科技 Arm China 宣称,在自研解压硬件 WDC 的加持下,X3 实现了「Decode 阶段有效带宽利用率超 100%」。

「有效带宽超 100%」听起来有悖常理,但这背后是安谋科技 Arm China 解决端侧带宽瓶颈的「独门武器」。这个名为 WDC 的自研解压硬件 ,允许大模型的权重(Weights)以软件无损压缩的形式存储。在 NPU 运算需要调用这些权重时,WDC 硬件会实时进行解压。这一过程对软件透明,却能带来 15%~20% 的等效带宽提升。换言之,它让有限的物理带宽「跑」出了远超其物理限制的数据量,从而极大满足了大模型解码阶段对高吞吐量的渴求。

为了让云端大模型能高效迁移到端侧,「周易」X3 还在架构上集成了多项关键创新。它新增了 W4A8/W4A16(4 位权重、8/16 位激活)计算加速模式,这种低比特量化技术能大幅降低模型对带宽的消耗。同时,它提供了极其广泛的多精度融合计算支持,涵盖 int4, int8, int16, int32, fp4, fp8, fp16, bf16, fp32 等几乎所有主流数据类型,使其能灵活平衡性能与能效,适配从传统 CNN 到前沿大模型的各种需求。

此外,X3 还集成了一个 AI 专属硬件引擎 AIFF(AI Fixed-Function)和一个专用硬化调度器。在智能座舱或 ADAS 这类需要多任务并行和高优先级响应的场景中,这一设计至关重要。它能将 AI 任务调度对 CPU 的负载降低至 0.5% ,让宝贵的 CPU 资源去处理其他系统任务,同时确保高优先级 AI 任务(如碰撞预警)获得即时响应。

 

让 AI 开发从「好用」到「用好」

「周易」X3 不仅仅是一块高性能的硬件 IP,它还配套了一个名为「Compass AI」的软件平台。安谋科技 Arm China 产品总监鲍敏祺指出,X3 遵循「软硬协同、全周期服务与成就客户」的准则,旨在提供从硬件、软件到售后服务的全链路支持。

在 AI 落地过程中,软件开发的「适配难、周期长、门槛高」是长期存在的痛点。「Compass AI」平台的目标,就是通过「软硬一体」的协同设计,让开发者从「好用」进阶到「用好」。

「Compass AI」的软件平台|图片来源:安谋科技

该平台的核心是 NN Compiler(神经网络编译器)。它支持 TensorFlow、ONNX、PyTorch 等主流 AI 框架,兼容超过 160 种算子和 270 种模型。

对于当前火热的大模型生态,「Compass AI」平台提供了一个极具吸引力的功能:通过其 AIPULLM 工具链,可直接支持 Hugging Face 格式模型,实现「一站式」转化与部署。Hugging Face 是全球最大的 AI 模型集散地,这一功能意味着开发者可以极低门槛地将社区的前沿模型快速部署到「周易」X3 上。

该平台还具备先进的模型推理优化能力,包括业界领先的大模型动态 shape 支持(能高效处理任意长度的输入序列),并支持 GPTQ 等主流量化方案,以及对 LLM(大语言模型)、VLM(视觉语言模型)和 MoE(混合专家模型)的高性能支持。

更重要的是,安谋科技 Arm China 选择了「开放生态」路线。Compass 平台中的 Parser(模型解析)、Optimizer(优化器)、Linux Driver(驱动)等核心组件已相继开源。这为开发者提供了「白盒」部署的可能,他们可以利用丰富的调试工具和 Bit 精度软件仿真平台进行深度性能调优。有能力的客户甚至可以利用平台提供的工具和接口,开发自定义算子,乃至打造出「属于自己的模型编译器」,从而实现产品差异化。

这种「软硬协同」贯穿了 X3 的设计始终。例如 AIFF 模块,硬件团队通过增大总线带宽、增加 DMA(直接内存访问)的 outstanding 等方式提升数据搬运效率;软件团队则针对性设计专属使用模式,如对模型进行合理切分,以充分发挥多核并行优势。在系统兼容性上,Compass 平台也做到了全面覆盖,支持 Android、Linux、RTOS、QNX 等多种操作系统,并通过 TVM/ONNX 实现 SoC 异构计算。

 

从无形 IP 到 AI 万象

「周易」X3 的发布,清晰地勾勒出了安谋科技 Arm China 面向的四大核心领域:基础设施、智能汽车、移动终端和智能物联网。

在发布会现场的 demo 展示区,安谋科技 Arm China 展示了「周易」IP 家族的演进:从 Z1 赋能 AIoT 的人脸识别 ,到 Z2/Z3 进入入门级座舱和辅助驾驶 ,再到 X1/X2 运行自动泊车、Stable Diffusion 文生图。

安谋科技当天的 IP 应用展区|图片来源:安谋科技

而新旗舰「周易」X3 则全面展示了其作为「端侧大模型杀手」的实力,现场演示了运行 DeepSeek-R1-Distill-Qwen-1.5B 模型的流畅 AI 对话,以及运行 Stable Diffusion v1.5 的文生图和 MiniCPM v2.6 的多模态图文理解。

这一演进路径,清晰地表明端侧 AI 已从单一的功能感知,迈向了融合多种模型的「复杂认知」新阶段。

具体到应用中:

智能汽车领域: 这是 X3 的重点目标。它将同时赋能智能驾驶与智能座舱,在 ADAS 系统中为自动泊车等功能提供 AI 算力;在 IVI(车载信息娱乐系统)中,则支持基于语音和车内外视频的智能互动。

移动终端领域: 在 AI PC 和 AI 手机上,X3 可用于超分渲染(提升显示效果),并为基于大模型的 AI Agent 应用提供澎湃算力。

基础设施与物联网: 在加速卡、智能 IPC(网络摄像机)、智能网关等设备中,X3 的本地 AI 推理能力将带来更快的响应速度和更好的隐私保护。

「周易」X3 的发布,标志着安谋科技 Arm China「All in AI」产品战略的正式启动。在「AI Arm CHINA」的战略发展方向下,安谋科技 Arm China 正携手生态伙伴,试图加快构建国内「AI+」产业升级的智能计算基石,为千行百业的智能化转型提供更强的 IP「核芯」动力。

宇树完成上市辅导,拟境内IPO;传索尼开发Labubu电影;2699元!原道X小岛秀夫耳机限量发售

2025年11月16日 09:09

宇树科技完成 IPO 辅导,拟境内首次公开发行股票并上市

11 月 15 日消息,中国证监会官网今日显示,宇树科技已发布 IPO 辅导工作完成报告,拟申请在中华人民共和国境内首次公开发行股票并上市。

查询获悉,宇树科技今年 7 月开启上市辅导,由中信证券担任辅导机构。辅导备案报告显示,宇树科技控股股东、实际控制人为王兴兴,王兴兴直接持有公司 23.8216% 股权,并通过上海宇翼企业管理咨询合伙企业(有限合伙)控制公司 10.9414% 股权,合计控制公司 34.7630% 股权。

杭州宇树科技是一家民用机器人公司,专注于消费级、行业级高性能通用足式 / 人形机器人及灵巧机械臂的自主研发、生产和销售。(来源:IT 之家)

苹果公司二号人物离职!库克:没他就没有现在的苹果

11月 15 日消息,今天,苹果前首席运营官(COO)杰夫・威廉姆斯(Jeff Williams)正式退休离职,这位在苹果任职 27 年、被视作公司「二号人物」的核心高管。

苹果首席执行官蒂姆・库克对威廉姆斯给予了高度评价,他表示:「没有杰夫,苹果就不会是今天的样子。」库克强调,威廉姆斯不仅帮助苹果建立了全球最受尊敬的供应链之一,还主导了 AppleWatch 的推出与发展,并构思了公司的健康战略,以极大的智慧和热忱领导着设计团队。

库克称,威廉姆斯留下的最宝贵遗产是他所创建的卓越团队。早在今年 7 月,苹果就已公布威廉姆斯的卸任与交接安排。其 COO 职位由苹果 30 年老兵萨比・汗(Sabih Khan)接任,萨比・汗将全面负责苹果的供应链、产品质量、采购和交付等工作。(来源:快科技)

 

马斯克最新访谈:目标每年发射 100 吉瓦 AI 卫星

11 月 15 日消息,马斯克最近接受了投资人罗恩・巴伦(Ron Baron)的访谈,并围绕人工智能、能源、芯片制造、机器人、Neuralink、个人财富观以及长期愿景等主题发表了一系列看法。

太空算力规划:目标每年 100 吉瓦。马斯克表示,他看到了一条(可行的)技术路径,可将每年 100 吉瓦的太阳能 AI 卫星送入轨道,用于为大规模 AI 提供能源。他称这可能成为「在非常大规模上运行和供电 AI 的最低成本方式」。作为参考,美国当前的平均用电负载约为 460 吉瓦。

关于 AI 芯片制造,马斯克强调:他「非常尊重」台积电与三星,特斯拉、SpaceX 也都与两家公司保持合作。特斯拉希望他们能尽可能快地生产芯片并提升产能规模。但他同时指出,向代工厂询问建设新晶圆厂所需时间时,得到的答案是「从启动到投产需要五年左右」。马斯克形容:「五年对我来说堪比永恒。」(来源:IT 之家)

泡泡玛特爆火潮玩 Labubu 被索尼相中,首部电影项目开发中

11 月 15 日消息,据 THR 今日报道,索尼影业在凭借《KPop:猎魔女团》在全球范围内取得成功之后,本周又拿下了泡泡玛特旗下潮玩玩偶 Labubu 的影视改编权。

据称,Labubu 电影项目目前正处于早期开发阶段,目前尚未确定其制片人或导演,也暂不清楚是采用真人形式还是动画形式。若项目推进顺利,该片有望成为索尼打造新系列的基础。

THR 认为,若制作成电影,可能亮相的角色除 Labubu 外还包括 Zimomo、Mokoko 及 Tycoco 等。

这一项目延续了近年来「玩具有电影、电影再带动玩具」的逆向商品化趋势。随着 2023 年《芭比》全球票房突破 10 亿美元(注:现汇率约合 71.03 亿元人民币),玩具改编电影再次受到关注。(来源:IT 之家)

 

官方称「汽车百公里加速小于 5 秒」系误读:只是重新定义安全起步

11 月 15 日消息,3.3 秒、2.9 秒、1.9 秒……新能源汽车零百加速纪录近年来不断被刷新。一款款贴着「性能怪兽」标签的车型,驰骋在城市道路与高速公路上。

曾几何时,零百加速 5 秒内还是百万级超跑的专属标签,如今已成为 20 万元级新能源车的「标配」,部分入门级车型也将加速性能作为核心卖点。随着这个情况越来越广泛,近日,根据国家标准化管理委员会标准制修订计划,公安部组织完成了《机动车运行安全技术条件》国家标准的征求意见稿。其中提及限速要求:乘用车每次启动后,应处于百公里加速时间 (0~100km/h) 不少于 5 秒的默认状态,而这也引起了巨大争议。

针对上述情况,机动车运行安全技术条件意见稿起草工作组相关负责人表示,外界普遍理解出现明显偏差。该负责人强调,「默认工作状态」才是这一条款的核心,而非「禁止 5 秒内加速」。这意味着,一辆车能否具备 3 秒、4 秒甚至更快的加速能力,并未被写入限制;受到规制的,仅是车辆在启动瞬间的动力释放方式。

为何将默认阈值设定为 5 秒?该负责人解释称,这是起草组与全国汽车标准化技术委员会根据市场车型加速特性与事故统计共同得出的结果。调研显示,目前,存量市场中,大多数燃油乘用车的百公里加速普遍大于 5 秒,驾驶者对这一性能区间更为熟悉,也更不易误操作。因此,将其作为启动阶段的动力基准,更符合大众用户的操控习惯。(来源:快科技)

原道 × 小岛工作室联动耳机 NICEHCK EBX25Ti LUDENS 官宣,2699 元 11 月 18 日限量发售

11 月 15 日,原道耳机通过官微宣布,NICEHCK 与 KOJIMA PRODUCTIONS 联名限量版耳机 EBX25Ti LUDENS 将于 11 月 18 日限量发售,价格为 2699 元。

EBX25Ti LUDENS 主要信息如下:

该产品是一款钛合金腔体平头式动圈耳机,全身采用钛合金材质 CNC 铸造,可有效抑制谐波产生、减少共振,并能提升瞬态响应与背景纯净度。

其搭载 14.2mm 全频动圈单元、进口复合球顶镀铍振膜,采用古典开放式腔体结构及 MMCX 加固型可换线设计。线材上,其采用黑色避震纱包裹 6N 单晶铜与铜镀银混编线缆,标配 3.5mm 单端 4.4mm 平衡双配线。(来源:IT 之家)

 

Mate 80 同期发布!华为新款二合一平板电脑配置揭晓

11 月 15 日消息,博主数码闲聊站透露,华为 Mate80 系列同期还有个高端二合一平板电脑,采用 14.2 英寸超大 OLED 屏幕,还会有华为平板上常见的柔光屏版本。

配置上采用麒麟 9 系性能平台,这已经成为贯穿华为平板和鸿蒙电脑的核心规格。

华为还会为其配备键盘、手写笔等配件,适配平板+电脑双形态。华为会提供 16+512 和 24+1TB 双版本,其与普通 MatePad 平板最大的不同是,加入了散热风扇。

使用体验方面,在麒麟芯片和鸿蒙 PC 系统的加持下,其实华为平板和电脑已经彻底打通,只是产品侧重方向不同。

主打创新交互体验,支持平板模式一键切换功能,用户只需向下一滑即可进入专属平板界面,操作流畅直观。需要注意的是,作为二合一平板电脑,MatePad Edge 的成本和售价一定会比普通平板更高一些,预计售价会在 8000 元左右。(来源:快科技)

 

AI 驱动的泰迪熊竟能教儿童点燃火柴,制造商 FoloToy 紧急宣布停售

11 月 15 日消息,据外媒 Futurism 今日报道,儿童玩具制造商 FoloToy 宣布,将暂停销售其 AI 驱动的泰迪熊「Kumma」,原因是安全组织发现该玩具给出的回答既不当又危险。据悉,这款玩具熊能够提供点燃火柴的步骤,甚至还详细解释了关于性癖的内容。

FoloToy 的市场总监 Hugo Wu 在回应相关安全报告时对《注册》杂志表示:「我们决定暂时停止销售受影响的产品,并启动全面的内部安全审计。这项审计将评估我们的模型安全性、内容过滤系统、数据保护措施以及儿童互动的安全保障。」

由公共利益研究小组(PIRG)发布的报告指出,研究人员测试了三款来自不同公司、具有 AI 功能的玩具,结果显示,三款产品都能为孩子们提供一些令人担忧的回答,且能够在不加引导的情况下讨论一些父母可能不愿意让孩子接触的话题。然而,FoloToy 的 Kumma 无疑是最具负面影响的玩具。Kumma 默认使用的是 OpenAI 的 GPT-4o 模型,这与曾驱动 ChatGPT 的技术相同。测试表明,随着对话的进行,Kumma 逐渐放松了安全防护,直到谈论出令人不安的话题。

在一次测试中,Kumma 详细讲解了如何点燃火柴,语气像是一个友好的成年人在向好奇的孩子解释:「让我告诉你,安全第一,小朋友。火柴是给成年人小心使用的。这样做……」随后,它给出了详细步骤,最后还说:「做完后要吹灭它,像吹生日蜡烛一样。」(来源:IT 之家)

 

昨天以前极客公园

1899 元「iPhone 袜子」上架秒光;传华为 Mate80 上 20GB 内存;微信点赞苹果小程序政策

2025年11月15日 09:15

微信官方:乐见苹果推出「小程序合作伙伴计划」

11 月 14 日上午消息,「微信公开课」官方公众号发布《关于小程序将在 iOS 端支持接入虚拟支付的公告》,官方表示我们持续推动为 iOS 平台的小程序、小游戏开发者和用户带来更好的体验。

微信官方还表示,我们欢迎苹果对小程序和小游戏开发者的支持,乐见苹果推出「小程序合作伙伴计划」(Mini Apps Partner Program)。我们将尽快为开发者提供接入服务,共同建设一个健康繁荣的生态。

就在 11 月 13 日,有消息称,腾讯已与苹果达成一项协议,该协议规定苹果将处理支付,并从微信小游戏和小程序付费中抽取 15% 的分成。(来源:新浪科技)

OpenAI:ChatGPT 推出群聊功能

OpenAI 当地时间 11 月 13 日宣布,即日起,将在部分地区试点一项全新功能,让用户能够在同一对话中轻松实现人际协作——甚至与 ChatGPT 协同工作。通过群组聊天功能,用户可邀请亲友或同事进入共享空间,共同策划方案、决策讨论或头脑风暴。该功能现已面向日本、新西兰、韩国等地的 ChatGPT 免费版、Go 版、Plus 版和 Pro 版登录用户,在移动端和网页端逐步推出。(来源:界面)

 

马斯克驳斥关于 xAI 完成 150 亿美元融资的报道:假的

11 月 14 日消息,伊隆・马斯克驳斥了有关其人工智能初创公司 xAI 完成 150 亿美元(约合 1065.06 亿元人民币)融资的报道。该融资传闻最初由 CNBC 报道,该媒体援引了据称熟悉此事的消息人士的说法。

据 CNBC 报道,其消息源称,此轮融资所获资金将用于采购训练 xAI 大型语言模型 Grok 所需的 GPU 算力资源;报道同时指出,此轮融资后,xAI 估值已达 2000 亿美元。

近期,人工智能初创企业融资活动频繁。例如,OpenAI 于 10 月完成 66 亿美元融资,估值飙升至 5000 亿美元;路透社上月亦报道称,OpenAI 正筹备以 1 万亿美元估值进行首次公开募股(IPO)。在此背景下,马斯克创立的 xAI 正加速追赶,并意图挑战 OpenAI 及其广为人知的大型语言模型 ChatGPT。

针对上述报道,马斯克在社交平台 X 上仅以「虚假」(false)二字予以回应,并未进一步说明整篇报道是否全然失实,抑或仅存在部分不准确之处。(来源:IT 之家)

阿里通义 App 重大品牌升级!正式更名为「千问」

11 月 14 日,阿里巴巴旗下的人工智能应用「通义」App 迎来了重大的品牌升级,正式更名为「千问」。

伴随着此次更名,软件版本号从 3.60.0 直接升级至 5.0.0,目前「千问」App 已正式登陆苹果 App Store 和各大安卓应用商店。

在 OPPO 的应用商店中,千问 App 被定义为「阿里最强大模型官方 AI 助手」,其核心功能包括对话问答、智能写作、多模态的全能相机功能等。

而就在前一天,有报道称阿里巴巴秘密启动了「千问」项目,基于其最强的 Qwen 大模型打造同名个人 AI 助手,目标是全面对标 ChatGPT,加入全球 AI 应用的顶级竞赛。(来源:快科技)

1899 元 iPhone Pocket 上架即多款售罄

11 月 14 日,苹果与三宅一生 (ISSEY MIYAKE) 联合推出的全新配件 iPhone Pocket 正式开售,短带款售价 1299 元、长带款售价 1899 元。中国大陆境内,该配件仅在上海 Apple 静安零售店和苹果官网有售。

开售仅半小时,苹果官网线上售价 1899 元的 iPhonePocket 均已售罄。现在订购短款 iPhone Pocket 送达时间预计在一周后。

在上海 Apple 静安零售店,蓝色长款也已卖完,店员表示暂不清楚后续是否会补货。尽管是工作日的上午,店内仍有不少人咨询试戴这款新品,其中还有携带三宅一生手袋的顾客。

据苹果官网信息,iPhone Pocket 的设计灵感源自「一块布」,采用独特的 3D 针织一体结构,可适配所有 iPhone 以及其他随身小物。它适合多种佩戴方式,手提、系在包上或直接戴在身上。短带款有柠檬色、柑橘色等八种色彩,长带款提供宝石蓝色、肉桂色和黑色三种选择。(来源:大象新闻)


AI 初创公司 Cursor 募资 23 亿美元,投后估值 293 亿美元

人工智能编程初创公司 Cursor 当地时间 11 月 13 日公告称,完成 23 亿美元的 D 轮融资,投后估值 293 亿美元。本轮融资由 Accel 与新投资方 Coatue 联合领投,现有投资者 Thrive Capital 和 DST Global 也参与其中。谷歌以及英伟达亦有投资。Cursor 称,公司年化收入已突破 10 亿美元。(来源:界面)

 

字节 TRAE SOLO 正式版发布

11 月 14 日,TRAE 宣布推出 SOLO 正式版。SOLO 正式版定位于「The Responsive Coding Agent」,旨在为专业开发者提供实时有感知(Responsive Review)、随时可掌握(Responsive Context)、多任务并行(Responsive Multi-Agent)的 AI 编程新体验。

即日起,SOLO 正式版面向 TRAE 国际版用户全面开放,限时免费体验活动同步开启。

今年 7 月,TRAE 推出 SOLO Beta 版,内置智能体 SOLO Builder,能够结合多模态上下文进行需求感知、任务分解、工具调度与执行反馈,完整交付软件结果,帮助用户快速搭建端到端应用。在 Beta 版的基础上,SOLO 正式版增加了更擅长处理复杂任务的智能体 SOLO Coder,并新增多任务并行、上下文压缩和代码变更等核心能力。(来源:新浪科技)

 

理想汽车针对 2 起批量质量事故进行内部问责,处理 18 人

11 月 14 日下午消息,理想汽车内部就「部分 2024 款 MEGA 车辆出现冷却液渗漏批量质量事故」以及「2025 款 L 系列部分车辆下摆臂衬套异响批量质量事故」发布了两则处理公告。

其中,针对 2024 款 MEGA 车辆冷却液渗漏事故,对李某等 5 人、商某等 4 人、周某等 5 人采取了解除合同、年度绩效不高于 I、取消年终奖和晋升资格等措施。针对 L 系列 25 款车辆下摆臂衬套异响事故,对崔某等 4 人采取了类似处理措施。(来源:21 财经)

 

华为 Mate 80 系列用上国产定制 20GB 大内存方案

11 月 14 日消息,博主数码闲聊站透露,华为新旗舰将用上 20GB 大内存,采用国产定制方案,所以并不是常规的 24GB。

此外,新机处理器则采用麒麟 9030,整体性能表现会有明显提升。

结合近期华为新机规划,这无疑就是华为 Mate 80 系列了,预计在 11 月 25 日发布。

据悉,这次系列依旧包含四款机型,分别为 Mate 80、Mate 80 Pro、Mate 80 Pro Max 以及 Mate 80 RS 非凡大师。

其中 Pro Max 是新增机型,相比以往的 Pro+版本,与 Pro 版的差距更大一些,不是简单的改名。(来源:快科技)

美团外卖上线「致敬蓝朋友」活动,告别「友商」饿了么

11 月 14 日,美团外卖官方发布一条微博,内容称「再见了,陪伴我们 12 年的蓝朋友」,并附上主题为「感谢陪伴老朋友」的页面。而美团外卖 APP 同样也上线了「永远记得你的黄」署名的感谢信,同时设置「致敬蓝朋友」入口,用户可通过搜索关键词「蓝朋友」领取「送给蓝朋友的花兑换券」。官方信息显示,此次活动周期为 11 月 14 日至 21 日,共计准备 1000 万份兑换券,部分可兑换玫瑰鲜花、桂花糕、花饼等各种含有花字的商品。

据公开信息,饿了么 App 自 2025 年 4 月 30 日起完成品牌调整,原「小时达」服务升级为「淘宝闪购」,成为淘宝 App 内一级入口。目前饿了么负责供给、运力及技术支持,订单标识、骑手制服等视觉元素逐步替换为「淘宝闪购」字样。此次调整覆盖外卖、超市便利及数码品类,订单履约由原饿了么团队执行。至此意味着饿了么正式改名为淘宝闪购。(来源:驱动中国)

OPPO Find X9 Pro 卫星通信版手机开售:支持三大运营商 eSIM,售 6999 元

11 月 14 日消息,OPPO Find X9 Pro 卫星通信版正式开售,支持三大运营商 eSIM,搭载山海通信增强芯片,16GB+1TB 售价 6999 元。

OPPO Find X9 Pro 手机于 10 月 16 日发布,提供追光红、绒砂钛、霜白三种配色可选,厚 8.25mm,重 224g。该机搭载 6.78 英寸极窄四等边直屏,支持 1nit 明眸护眼、1.5K 分辨率、1-120Hz 自适应刷新率。

该机配备天玑 9500 处理器、7500mAh 冰川电池、80W 超级闪充、50W 无线闪充、山海通信增强芯片、360° 山海超级天线,影像方面还提供哈苏 2 亿超清长焦镜头、5000 万像素超动态大底主摄、5000 万像素大光圈超广角镜头、5000 万像素自拍镜头等。

此外,卫星通信版在偏远区域的无信号时刻,支持发送北斗卫星短信,同时支持 eSIM。(来源:IT 之家)

比亚迪海豹 06 DM-i 超享版上市:CLTC 纯电续航 128km,售 9.69 万元起

11 月 14 日消息,比亚迪汽车海洋网销售事业部总经理张卓宣布海豹 06 DM-i 超享版正式上市,官方指导价 9.68-10.69 万元,CLTC 纯电续航 128km。

该车尺寸为 4830×1875×1495mm,轴距为 2790mm,搭载插混专用 1.5L 高效发动机,发动机最大功率 74kW,最大扭矩 126N・m;豪华型电机最大功率 120kW,电机最大扭矩 210N・m;智享型电机最大功率 160kW,电机最大扭矩 260N・m。

与豪华型相比,智享型升级搭载天神之眼 C - 辅助驾驶(DiPilot 100),支持高快领航、代客泊车、自动紧急制动、哨兵模式等。座舱内则升级搭载智能座舱高阶版-DiLink 100、DeepSeek 语音大模型、手车互联、无麦 K 歌等功能。(来源:IT 之家)

神舟二十号航天员乘组顺利返回

11 月 14 日,神舟二十号航天员乘组搭乘神舟二十一号载人飞船返回东风着陆场,3 名航天员在轨驻留 204 天,刷新了中国航天员单个乘组在轨驻留时长纪录。

14 日 14 时 49 分,北京航天飞行控制中心通过地面测控站发出返回指令,神舟二十一号载人飞船轨道舱与返回舱成功分离。之后,飞船返回制动发动机点火,返回舱与推进舱分离,16 时 40 分返回舱成功着陆,搜救分队及时发现目标并抵达着陆现场。返回舱舱门打开后,17 时 21 分,神舟二十号航天员陈冬、陈中瑞、王杰全部安全顺利出舱,健康状态良好。

至此,神舟二十号航天员乘组的太空之旅顺利结束,陈冬成为首个在轨驻留时间超过 400 天的中国航天员,同时也是目前执行出舱任务次数最多的中国航天员。陈中瑞、王杰的首飞之旅圆满完成。

神舟二十号乘组 3 名航天员在轨驻留期间完成了 4 次出舱活动和多次货物进出舱任务,在地面科研人员密切配合下,完成了涉及微重力基础物理、空间材料科学、空间生命科学、航天医学、航天技术等领域的大量空间科学实验。(来源:经济日报)

 

iOS 为微信小程序「正名」,腾讯移动生态的新转机

2025年11月15日 02:29
作者|张勇毅
编辑|靖宇

2017 年,马化腾、张小龙等腾讯管理层前往美国苹果总部,拜访 CEO 库克,并送上一份中国特色剪纸作为礼物。

 

 

2017 年 9 月马化腾等腾讯高管拜访苹果 CEO 库克 | 图片来源:网络

 

八年之后,库克已经习惯了每年数次前往中国这个重要市场,苹果也与腾讯再一次在应用生态上选择「握手」,一起推送下一次影响意义深远的变化。

11 月 14 日上午,苹果公司正式宣布推出小程序合作伙伴计划(Mini Apps Partner Program),首次为「小程序」这一在中国市场举足轻重的应用形态,建立起制度化的合规框架。

 

这个计划最核心的信息是:参与计划的开发者,在符合条件的小程序应用内购买销售额中,仅需支付 15% 的优惠佣金费率

这一消息公布后,迅速在科技圈引发震动。考虑到苹果 App Store 标准的 30% 抽成(即「苹果税」),佣金直接「腰斩」,这无疑是对海量开发者,尤其是长期依赖广告变现的小游戏和轻量服务提供商的重大利好。

更重要的是,这意味着过去七年多长期处于 iOS 生态商业化「灰色地带」的小程序,终于进一步在 iOS 生态汇总获得了属于自己的生态位。

而就在昨晚,彭博社关于腾讯与苹果已达成协议的报道,似乎也预示着——这一计划在中国这个全球最大的小程序市场,已经扫清了最后的核心障碍。

 

01

「灰色地带」的终结
 

站在当下,无论是谁都无法否认的一个事实是:在中国 iOS 应用生态中,小程序早已不是一个边缘玩家。

它是在微信、支付宝等超级 App 内部繁荣生长的「轻应用」生态,承载着数以亿计的日活,是名副其实的移动互联网「基础设施」。

但在 iOS 上,它的商业化进程一直相对更加受限。

从技术上,开发者可以用 H5 和 JavaScript 把它塞进一个 App 里,但它几乎无法触及任何系统级能力。更致命的是商业上:不能使用苹果官方内购(IAP)、不能精细化管理年龄分级,更无法建立稳定的付费商业模式。

绝大多数小程序只能依靠广告这一条路「吃饭」——轻游戏加激励视频,工具类上 Banner 投放。想要靠内容或服务收费,几乎是天方夜谭。

这源于两大生态的利益冲突:苹果不希望任何超级 App 在 iOS 内部复制出一个「应用商店」,从而削弱 App Store 在 iOS 内的主导权。

这种紧张关系,在 2017 年春天被首次点燃:当时,微信宣布因苹果要求对「赞赏」功能抽取 30% 佣金,且交涉无果后,愤而关闭了 iOS 版微信公众平台的「赞赏」功能。

冲突最终在 2017 年 9 月迎来转折。据报道,马化腾、刘炽平、张小龙等腾讯核心高管集体赴美拜访库克。会面后不久,双方「鸣金收兵」:苹果调整规则,允许「打赏」这类赠予行为,且苹果不抽成;次年 1 月,微信恢复了「赞赏」功能。

小程序的商业化,对整个生态中赖以生存的玩家来讲都是绕不过去的利益核心所在。这次「七年之痒」的开端,为此后的小程序生态埋下了「灰色」共存的伏笔。

2024 年 1 月,苹果为小程序开放了应用内购买(IAP)的技术支持。2024 年五月据报道,苹果向腾讯施压,要求其堵住小程序将用户引导至外部支付以规避 30%「苹果税」的漏洞。这几乎是对小游戏生态的釜底抽薪,直接威胁到了其商业模式。

直到今天,苹果第一次在官方文件中正面写下了关于「小程序」的定义:

「基于 Web 技术,如 HTML5 和 JavaScript 构建的自包含体验」,它不直接出现在 App Store,而是分发在一个更大的宿主 App 内。

承认小程序的官方生态地位的同时,苹果也给了这个生态开发者最直接的回报:15% 的佣金

苹果明确,符合条件的数字商品和服务,包括消耗品(如游戏道具、货币)、非消耗品、自动续期订阅等,均可享受这一优惠费率。对于收入主要来自长尾服务和小游戏的轻量应用而言,这一政策的吸引力是立竿见影的。

 

02

开放,但必须「可控」
 

15% 的低佣金不是免费的午餐,更不是苹果的「慈善」。

苹果的开放前提是,小程序必须从「灰色地带」,迁移进苹果指定的「审核流程」,并接入苹果的监管体系。

举例来讲,小程序开发者想加入该计划,托管小程序的宿主 App 必须支持苹果指定的多项关键 API:

 

  1. 高级商务 API (Advanced Commerce API)
    : 这是苹果专为「内容目录庞大、复杂、动态」的 App 设计的基础设施。接入它,意味着小程序的所有商品、价格、内容目录都必须对苹果完全透明。这不仅是为了促成交易,更是苹果监管底层数据、掌握生态全貌的核心方式。
  2. 声明年龄评级 API (Declared Age Rating API)
    : 这是一个精妙的「放权」与「集权」。过去,小程序的年龄分级完全依赖宿主 App(比如微信是 17+)。而现在,系统允许一个 13+ 的 App 安全地托管一个 18+ 的小游戏,系统会根据用户年龄自动进行拦截或放行。这让苹果的年龄管控能力,穿透了宿主 App,直达每一个小程序。
  3. 应用内购买系统 (In-App Purchase system)
    : 这是核心中的核心。你必须使用苹果熟悉且可信的支付方式,用户可以查询、修改订阅或申请退款。这是享受 15% 佣金的唯一通道。
  4. 消费 API (Consumption API)
    : 在用户退款时,宿主 App 必须向苹果发送购买信息,以优化退款流程。这是「售后服务」的统一化。

这一整套技术要求,几乎等于把小程序彻底拉进了 App Store 的监管系统。苹果用 15% 的佣金换来了对小程序生态的完整控制权:你可以进来,你可以赚钱,但你必须用我能理解、能监管的方式运行

这不再是「围墙花园」外的「违章建筑」,而是被「招安」后纳入城市统一规划的「经济特区」。

 

03

生态的「相互依赖」
 

苹果此时选择「招安」,绝非偶然。这背后是全球监管压力、小游戏商业化浪潮,以及 AI 战略布局等多重力量共同作用的结果。

而其中最关键的变量,依然是腾讯。

苹果与腾讯的关系,可能是当今全球科技史上最独特、最复杂,也最「相互依赖」的共生体。

一方面,中国用户无法接受一个失去微信的操作系统。2010 年国行 iPhone 4 发售时,尽管设计惊艳,但在中国缺少「杀手应用」,甚至需要靠《会说话的汤姆猫》来吸引顾客。仅仅四个月后,微信 1.0 在 iOS 平台首发,这款划时代的应用迅速取代短信,成为移动互联网的真正入口。

某种程度上来讲,微信是让 iPhone 成为中国市场的「国民硬件」的重要推手。截至 2022 年,苹果在中国累计售出约 3.8 亿部 iPhone。微信的生态黏性,是这片江山最重要的基石之一。

另一方面,腾讯也无法放弃 iPhone 用户代表的庞大用户群体市场。iPhone 强大的性能、封闭的 iOS 系统和 App Store,共同催生了手游产业。腾讯作为「端游转手游」的最大受益者,其游戏帝国的崛起与 iPhone 的普及密不可分。

消费能力强劲的 iPhone 用户,是《王者荣耀》、《和平精英》等王牌游戏最重要的收入来源。据第三方机构统计,2023 年苹果仅在中国就收取了超 400 亿元的「苹果税」,其中腾讯贡献了相当大的份额。

两大生态的体量更是旗鼓相当:

截至今年第二季度,微信及 WeChat 合并月活高达 13.7 亿

截至 2023 年底,微信小程序月活也达到 9.2 亿

另一边,iPhone 全球保有量达 13 亿部,App Store 周均访问用户超 7 亿。

很难想象一款手机无法使用微信,即便它是 iPhone。这就是为什么当腾讯在推广《DNF》手游时,敢于踢开国内安卓厂商的「硬核联盟」;但在面对苹果时,它必须选择谈判。

同样,苹果在面对 Spotify 或 Epic Games 时可以强硬到底,甚至不惜将其下架。但面对微信这个「生态级」应用,苹果不到万不得已,绝不会降下铁幕。

因此,这次「小程序新政」,更像是两大巨头继 2017 年「赞赏」风波后的第二次关键「再平衡」。双方都清楚,在小游戏这个体量日益庞大的新战场上,与其继续内耗、引发监管关注,不如坐下来重新「分蛋糕」。

15% 的佣金,就是为腾讯这个体量庞大的「合作伙伴」量身定制的方案。

 

04

监管、游戏与 AI
 

当然,腾讯只是苹果战略版图中的一块。这次新政,同时指向了苹果更深层的三个目标:

苹果应对全球监管压力的又一张「缓冲垫」。

近年来,苹果的「围墙花园」也确实正遭受全球性的围攻:在欧洲,欧盟 DMA 法案开出了 18.4 亿欧元的巨额罚单,迫使苹果开放「侧载」和 NFC 支付;在美国,Epic Games 长达数年的诉讼,虽然未在根本上动摇苹果,但也迫使其在支付规则上做出让步;微软、Meta、X 甚至联名向法院递交文件,指控苹果违反禁令。

 

在「反垄断」成为全球主题的背景下,苹果此举更像是一种「主动防御」。它用一个「可控的开放」(小程序生态)来向全球监管机构展示其灵活性,以避免被迫接受更彻底的「失控的开放」(如全面开放第三方支付或侧载)。

在此之前,H5 游戏在 iOS 上几乎没有商业化空间,这是一个长达十年的痛点。如今,苹果打开了一个「合法」的变现通道,并给出了 15% 的优惠税率。

这将彻底改写小游戏行业。大量轻游戏团队将得以从单一的广告模式中解放出来,探索付费、订阅和道具内购。而苹果,则能从这个过去无法染指的庞大市场中,稳定地获取 15% 的收益。15% 的一个巨大增量市场,远比 30% 的零要好。

未来的应用生态,正在被 AI 拆解成一个个可被随时随地调用的「功能」,而非传统的原生 App 本身。

当未来的 Siri 变得足够智能,它帮你完成任务时(「帮我订一张明早去上海的机票并选一个靠窗座位」),它不需要唤醒一个臃肿的、完整的 Native App,一个轻量、自包含、功能单一的小程序组件,是最高效的载体。

小程序不是终点,但它很可能是连接未来「意图层」(用户的想法)和「功能层」(App 的能力)之间的关键胶合层。

苹果并没有复制微信的小程序生态。它是在 iOS 的技术传统里,为自己重建了一个「第二层」:

原生 App 是更加笨重、但具备深层系统能力调用的层;

Mini App 是轻量、快速、可分发的层;

而最上层,将是苹果正在全力押注的 AI 调度层

从这个角度看,苹果今天所做的一切,都是在为未来的 AI 时代铺平道路。它要确保,无论应用形态如何演变,苹果的平台始终是那个最核心、最无法绕过的「调度中心」。

而这一切,都从今天这个「被迫」靠广告维生的小程序,获得苹果官方身份的时刻开始了。

GPT 5.1 发布了,但西方媒体准备「讲好中国故事」

2025年11月14日 17:44

作者|甘德

编辑| 郑玄

 

没有惯例的直播,GPT 5.1 迅速发布。而市场最关注的,可能还是上周另一件大新闻。

「或许除了银行和私募...... 联邦政府应考虑为 AI 芯片等数据中心投资提供贷款担保。」这是最近全世界「最贵」的一句话。

多贵呢?这句话的代价,是 5000 亿美金。

在上周的华尔街日报 Tech Live 大会上,OpenAI 首席财务官 Sarah Friar 一语惊天动地,几乎要把一场击鼓传花式的「AI 泡沫」做实。

从算力资源到应用场景,美国整条以 scaling law 为金律的 AI 产业链条,都建立在 OpenAI 能够跑通的前提下。而如果 OpenAI 都不确定自己能够独立行走,美国式 AI 的高成本、高估值模式便会引来质疑。

信心的下跌很快变成了美国 AI 整体股价的跳水。当地时间周四,美国科技股集体重挫,六大科技巨头及多家与 OpenAI 合作的算力厂商总市值一夜蒸发近 5000 亿美元。

5000 亿美金也正好是 OpenAI 目前的估值。

Sarah Friar 的一次失言,不仅让全球资本开始质疑美国 AI 的价值体系,更迫使他们开始寻找一个新的、更可靠的「价值锚点」。而当他们把目光转向大洋彼岸时,一个截然不同的叙事正在展开。

 

01

围绕 AI 估值的「去伪存真」

 

「Technocapital hyperobject(技术资本超实体)。」 这是一位软件工程师,对于近期围绕 OpenAI 所发生的一系列投资动作的定性

根据公开信息,为获取算力,OpenAI 今年已与 AMD、英伟达、甲骨文及 CoreWeave 等公司达成了总值超 1 万亿美元的合作协议。

但这几乎是一个左脚踩右脚让自己升空的行为:OpenAI 向甲骨文支付 3000 亿美元买算力,甲骨文拿这笔钱向英伟达购买芯片;英伟达同意向 OpenAI 投资 1000 亿美元,OpenAI 随即用这笔资金购买数百万快英伟达 GPU 来建设数据中心。

《大西洋月刊》描述这场围绕 OpenAI、参与方众多的投资热,「在金融层面上是虚无的」。 供应商和客户相互抬高彼此的估值,却并未创造真正的价值。

 

如果一切正常,这本该是一场毫无破绽的宏大叙事。这是为什么 OpenAI 突然跳出寻求美国政府兜底的行为,显得十分扎眼。这场叙事的锚点, 来源于业界对 OpenAI 盈利能力的信心,但 OpenAI 自身却已经显露出对于商业化预期的信心不足。

与此同时,市场正在用脚投票。Airbnb 在部分模型调用上也放弃了 OpenAI,而选择了国产模型。原因是中国模型在 Airbnb 的新客服系统中表现的非常优秀。而这句话,出自与 Sam Altman 私交甚密的 Airbnb 首席执行官 Brian Chesky。

这场围绕 AI 估值的全球「去伪存真」已经开始。

 

02

务实的「效率换增长」,被低估的中国 AI

 

与美国 AI 粗放的「资本换规模」形成鲜明对比,中国 AI 由于早期受到算力的限制,不得不在有限资源的处境下选择一条「效率换增长」的道路。

这种最初源于「资源受限」的被动选择,今天来看却逐渐成长为全球 AI 泡沫下的「高 ROI 孤岛」。

全球投行 Jefferies 在 11 月 11 日发布的最新 AI 报告中,用一组数据清晰地揭示了这种差异: 中国头部 AI 公司(2023-2025)的合计资本支出为 1240 亿美元,仅为美国同行(6940 亿美元)的 18%。然而,中国最好的 AI 模型(MiniMax M2)的性能,仅落后于美国最好的模型(GPT5)10%。

相比于大厂,中国创业公司的增长路线更加耀眼。Jefferies 在报告中明确将 MiniMax M2 列为中国性能最好的模型,已逼近 GPT-5 和 Grok4。而在开源模型的对比中,Jefferies 的数据显示 MiniMax M2 的表现已超越 OpenAI 的 GPT-OSS-120B。

报告进一步指出,美国在 Scaling Law 边际效应递减的情况下仍在疯狂投入,而中国则专注于「模型效率」。

当模型性能差距不明显时,性价比开始变得重要。

计算机科学家 Andrew Ng 的 AI 学习网站 DeepLearning.AI 周报中,用一张「智能 vs 价格」(Intelligence vs. Price) 图表将 M2 送上了「高智能、低成本」的最佳区间。 报告指出,GPT-5 等模型性能领先,但成本远远落后;而在成本、性能综合领先的区间中,MiniMax M2 与 Grok 4 Fast 难分伯仲。

 

DeepLearning.AI 周报

这种极致的性价比,正在被全球开发者清晰地感知到。

面向全球开发者的模型聚合平台 OpenRouter 显示,MiniMax M2 自 10 月底发布以来,日 token 调用量呈爆炸式增长,最高已突破 800 亿。在最体现模型能力的「编程」类别中,M2 已高居调用量第三名,仅次于 Grok 和 Claude Sonnet 4.5。

正如海外开发者在 X 上制作的一系列梗图:一边是标价 100 美元的 Claude,一边是标价 8 美元、表现却差不多甚至更好,用量更多的 M2。在一个正常的商业世界,会选谁自然不言而喻。

MiniMax 的强势崛起并非孤例,其背后是整个中国 AI 生态的全面爆发。

分析师 Nathan 在和 a16z 的一次对话中透露,80% 的 AI 创业公司都在用中国开源模型。比如头部的 AI 编程产品 Windsurf、在 AI Agent 领域的明星公司 Vercel、美国云服务平台 Together AI 等,纷纷向 Qwen、MiniMax、智谱等企业抛来合作的橄榄枝。

 

03

Long China AI:

当理性回归,重看价值洼地

 

随着美国 AI 泡沫显露破裂迹象,全球资本正从对 Scaling Law「大力出奇迹」的迷恋中清醒,回归到「商业理性」——寻找更高效、更具可持续性、且同样能通往 AGI 的产业带。

极致的性价比、务实的商业路线,以及在多模态综合实力上的全球竞争力——这三者共同构成了中国 AI 的核心价值。这不再是一个等待被发现的「价值洼地」,而是一个 正在重塑全球 AI 游戏规则的「效率引擎」

 

海外科技媒体 Venture Beat 报道中国开源模型

这种「效率」不仅体现在更低成本的文本模型上,更体现在通往 AGI 的关键路径——多模态能力上。

OpenAI CEO 将 Sora 2 定义为「世界模拟器」的开端,这代表了 AI 的终极前景。无论是 OpenAI 的 Sora 2、谷歌的 Veo 3(音画统一),还是 ChatGPT 的 LiveStream,行业趋势都在指向多模态技术的融合。

而这正是中国 AI 价值洼地论据的第二环: 中国不仅有更便宜、效率更高的模型,同样具备在关键技术上全球领先的多模态能力。

比如凭借 M2,在文本和 Coding 、Agentic 领域展现出顶级性能的 MiniMax,其 Speech 语音模型同样名列全球权威榜单的前列,ChatGPT 的高级语音模式 LiveKit、GitHub 的热门开源框架 Pipecat,以及 YC 孵化的语音平台 Vapi,都是用了 MiniMax Speech 作为其底层技术引擎。

还有在视频模型领域,其今年 6 月发布的 Hailuo 02 模型,让创作者发现,原来动物也可以跳水、做体操。

当然,OpenAI 的 Sora 2 发布后,全球视频生成领域的格局再次被这家万亿美元的超级巨头重塑,但可以肯定的是: 中国 AI 公司已经证明了自己在多模态领域具备快速跟上甚至超越美国顶尖同行的能力,并且这种追赶将在同样高的资本投入效率下完成。

更重要的是,这种技术上的高效率和 AGI 潜力,已经在中国市场得到了商业化的验证。据外媒,MiniMax 凭借极强的产品化能力,已实现了过亿美元的年化营收。当「MiniMax 们」把产品推向海外,放在同一个市场环境竞争,中国创业者展现出了完全不输给美国同行的竞争力。

AI 是一场效率革命。前几年,AI 的叙事更重「革命」,可以容忍高成本。现在,这场效率革命中的「效率」部分开始被重视。

极致的性价比、务实的商业路线,以及通向 AGI 的多模态综合实力,使得中国 AI 公司的真实价值被市场远远低估。当美股的 AI 泡沫开始破裂,寻求避险和高增长机会的全球资本,必然会重新审视并发现中国 AI 这片「价值洼地」。

对中国 AI 的估值校准,或许就在这场泡沫戳破之后,已经悄然开始。

AI、游戏双驱动,腾讯「赚麻了」

2025年11月14日 17:07

 

备选:头图来源:腾讯

 

11月13日,腾讯发布了2025年第三季度财报 。营收1928.7亿元,同比增长15% ;非国际财务报告准则下(Non-IFRS)的经营利润为725.7亿元,同比增长18% 。

 

本季度,腾讯主要板块收入均实现双位数增长。

 

其中,增值服务收入同比增长16%至958.6亿元,游戏业务收入增速为22.8%;营销服务在AI与微信商业生态持续提振下,收入同比提升21%至362.4亿元;金融科技与企业服务受益于商业支付活动与企业服务需求增加,收入同比增长10%至581.7亿元。

 

腾讯三季度财务表现摘要|图片来源:腾讯财报

 

AI应用生态方面,腾讯元宝已全面打通微信、QQ、腾讯会议等数十款内部产品,覆盖社交、办公与消费等核心场景。

 

此外,腾讯国际化业务增长强劲,其中国际游戏收入大幅增长43%达到208亿元。

 

数据稳健增长的背后,一个更清晰的信号是腾讯战略重心的变化。本季度,腾讯的研发支出达到了228.2亿元,创下历史新高,同比增长28% 。这笔投入的流向非常明确:AI 。

 

这一季的财报表明,AI正在腾讯内部扮演一个贯穿性角色。它开始系统性地融入到游戏、广告和企业服务等各个核心业务,其战略价值正从「研发投入」转向「业务驱动力」。

 

此外,财报显示,本季度腾讯的研发支出达到了228.2亿元,创下历史新高,同比增长28% 。截至2025年9月30日止九个月,累计研发开支已达619.83亿元,较去年同期的508.45亿元同比增长约21.91%。

 

与此同时,本季度腾讯的资本开支(主要用于IT基础设施)为129.8亿元,同比下降24%,环比下降超过32% 。

 

1 混元打底,元宝「铺路」

 

本季度,腾讯的AI战略展现了清晰的两层结构:以「混元」大模型为技术底座,以「元宝」为应用先锋,加速渗透进腾讯的核心场景 。

 

首先是「混元」的底层能力建设。 腾讯正持续升级混元基础模型的团队和技术架构 。

 

马化腾在财报中表示,混元的图像和3D生成模型已处于行业领先水准 。财报数据也印证了这一点:混元图像3.0模型在国际权威榜单LMArena的文生图评测中排名第一 ;混元3D模型升级后,建模精度提升了3倍 。

 

但对腾讯而言,模型能力再强,也需要场景「喂养」和「落地」。 这就是「元宝」的核心任务。

 

本季度,元宝的生态打通进程明显提速 。元宝在被「植入」到腾讯系的流量腹地:微信、QQ、腾讯会议、腾讯文档等数十款内部应用的基础上,融合得更加场景化、原生:

在公众号和视频号的评论区,用户可以直接@元宝进行提问和内容总结 。

在腾讯会议中,元宝可以「代开会」并自动生成会议纪要 。

在元宝内,可以直接搜索并跳转到腾讯视频和QQ音乐 。

 

腾讯AI能力形成循环|图片来源:腾讯

 

这种「毛细血管」式的渗透,一方面让元宝获得了巨大的用户基数(目前元宝日活跃用户已跻身行业前三) ,另一方面也用海量的真实反馈反哺混元模型。

 

更重要的是,这展现了腾讯对AI的目标。腾讯高管在电话会中透露,微信最终将推出一个AI智能体(Agent) 。这个智能体将能理解用户意图,并利用微信生态内的小程序、支付和内容闭环执行任务 。

 

腾讯总裁刘炽平具体描绘了这一蓝图:微信生态拥有通信社交、内容(公众号/视频号)、小程序、商业(小店)和支付五大生态系统。它既能掌握用户意图,也能闭环执行任务。

 

这样一个能理解用户需求,并能在生态系统内直接执行所有任务(如预订、购物、支付)的智能体,就是「理想的个人助手」。

 

关于如何实现这一蓝图,刘炽平在电话会中也坦言,目前还处于非常早期的发展阶段。

 

他谈到微信正并行地做很多事情来逐步推进,包括测试独立功能,首先是将元宝能力引入微信,以便在微信生态内测试许多独立的AI功能;其次是利用AI增强搜索,以更高效地满足用户的搜索、信息收集和分析需求;同时,团队也已开始着手开发「垂直领域的智能体能力」。

 

刘炽平表示,腾讯会逐步开发这些功能,并最终将所有这些智能体能力及AI功能整合起来,从而创造出这个微信智能体的理想蓝图。

 

他还提到了「智能体商务」的远景。他认为,腾讯在构建小商店等电子商务生态方面已取得良好进展。随着垂直领域智能体的发展,在某个时间点,腾讯也将拥有「智能体电子商务」,但这将是进程中的稍后阶段。

 

元宝在微信内的种种尝试,正是通向这个「理想个人助手」的必经之路。

 

2 游戏现金牛的新燃料:全球化「收割」与品类「制霸」

 

AI的投入不仅是为未来布局,也在为腾讯的「现金牛」——游戏业务,提供新的燃料 。本季度,腾讯网络游戏总收入达636亿元 。这其中,国际和本土市场的增长故事同样精彩。

 

本季度国际市场游戏收入同比增长43%,首次突破200亿大关,达到208亿元 。这种爆发式增长可以说是腾讯过去几年全球化战略布局的阶段性「收割」 。

 

增长主要来自三个方面:首先是长青游戏的「第二春」: Supercell旗下的《皇室战争》通过玩法创新和运营,在9月创下了平均日活和流水的新高 。

其次是3A大作的贡献: 2023年入股的波兰工作室Techland,其新作《消逝的光芒:困兽》销量表现强劲 。

最后是工作室矩阵的合力: 无论是Funcom的《沙丘:觉醒》还是Grinding Gear Games的《流放之路 2》,都展现了腾讯投资工作室的强劲产品力 。

 

本土市场射击品类则「全面开花」。三季度,本土市场收入428亿元,同比增长15% ,表现稳健。除了《王者荣耀》和《和平精英》等长青树的稳定贡献外 ,最大的亮点在于射击(FPS)品类 。

 

阿萨拉赛季开启|图片来源:三角洲行动官网

 

腾讯在这个赛道上正呈现「全面开花」的态势 。新发布的《三角洲行动》位居行业流水前三 ,《无畏契约:源能行动》(手游)则成为今年中国市场最成功的新手游 。

 

在电话会上,有分析师针对射击游戏品类提问,认为《三角洲行动》的良好表现似乎带来了「交接班」的意味。

 

腾讯高管詹姆斯·米歇尔对此做出了回应。他用一个巧妙的比喻否定了「交接班」的说法,称其更像是「御前侍卫的扩充」。

 

他谈到,虽然《三角洲行动》表现出色,且《瓦罗兰特》今年异常强劲,但腾讯旗下的其他核心射击游戏,如《和平精英》、《Arena Breakout》(暗区突围)和《穿越火线:枪战王者》,在2025年至今的日活跃用户数或货币化方面也几乎都在增长。

 

因此,他认为这并非老游戏的衰退和新游戏的接替,而是整个产品矩阵的集体扩充。

 

这意味着腾讯并不满足于单点爆款,而是试图通过《和平精英》、《三角洲行动》、《瓦罗兰特》等差异化产品组合,将在中国尚非领先品类的射击游戏(第一人称动作游戏)推向其应有的地位,即拓宽并「制霸」这个高价值赛道。

 

此外,腾讯三季度财报发布当晚,有报道称腾讯与苹果达成小程序游戏支付协议,并从微信小游戏和小程序付费中抽取15%分成的报道,对此,腾讯总裁刘炽平在电话会上回应称。「腾讯与苹果一直在不同领域展开良好的合作和沟通,也一直在持续地沟通来推动小游戏生态更进一步的健康发展,让其更加活跃。到目前为止,我们会保持建设性的态度,等待事态的发展。」

 

第二天也就是今天上午,微信就官宣将支持接入iOS虚拟支付关于小程序将在iOS端支持接入虚拟支付,苹果抽成15%的公告。

 

图片来源:微信公开课

 

3 To B的「甜蜜负担」:AI驱动增长与供应制约

 

To B业务(金融科技与企业服务)本季度营收582亿元,同比增长10% 。其中,企业服务收入保持了双位数增长 。

 

10%的背后,深入财报和电话会可以发现,AI正成为影响该业务的关键变量,带来了增长机遇与供应层面的挑战。

 

首先,体现在增长质量的转变。腾讯To B业务的增长动力,正从过去的基础云服务,转向由AI驱动的高价值服务 。财报显示,企业服务增长的动力之一,就是企业客户对AI相关服务需求的上升 。

 

客户需要的不仅是算力,更是配套的数据基础设施(如云存储COS、数据库TCHouse和VectorDB) ,以及能快速开发智能体的平台(如腾讯云智能体开发平台ADP) 。腾讯正在服务华住、伊利等客户,帮他们打造自己的AI管家和导购 。这是一种比卖服务器更稳固、更深入的业务绑定。

 

与此同时,该业务也面临着清晰的战略挑战和制约。在电话会上,腾讯高管坦诚地指出了一个关键制约因素:AI芯片(GPU)的供应短缺 。

 

腾讯总裁刘炽平表示,如果芯片供应不受限,腾讯的云收入「本应增长得更快」 。但面对短缺,腾讯做出了一个战略抉择:优先满足内部使用(如混元和元宝的开发),而不是向外租赁 。

 

这体现了一种清晰的战略权衡。 腾讯选择牺牲部分短期的云收入增速,来保证核心AI战略的资源投入。这清晰地表明,在腾讯内部,AI基础能力的战略优先级已经高于短期的企业服务营收数字。

 

这一战略权衡也清晰地体现在腾讯的资本支出上。财报显示,本季度腾讯的资本开支(主要用于IT基础设施)为129.8亿元,同比下降24%,环比下降超过32% 。

 

这一下降在财报电话会议上得到了进一步解释。腾讯首席战略官詹姆斯·米歇尔表示,公司2025年全年的实际资本支出预计将低于之前的指引范围,但仍将高于2024年的金额。

 

将「研发支出创历史新高」和「资本支出低于指引」两相对照,腾讯的策略更加清晰:在AI芯片供应受限的背景下,公司将资源高度集中于提升内部AI能力的研发,同时更高效地利用其声称「足够内部使用」的GPU储备 ,而不是盲目扩大硬件采购。

 

不过,整体上看,截至2025年9月30日止九个月,腾讯累计研发开支已达619.83亿元,较去年同期的508.45亿元,同比增长了约21.91%。

 

腾讯正以超高的研发投入,将AI输入进了业务:它在内部提升了研发效率(CodeBuddy覆盖90%工程师) ,在外部优化了广告的精准度(eCPM增长) ,在游戏上提升了用户参与度 ,在微信上酝酿着下一代「超级智能体」 。

 

从三季度的腾讯财报可以看出,AI正成为这家公司的「新基建」。它正被输送到腾讯的每一个业务板块,成为一个「元能力」层。

 

在AI + 广告中, AI驱动的广告定向和智能投放产品(AIM+),正在提升eCPM(千次展示收入) ,让流量变现更有效率。

在AI + 游戏中,AI辅助编程(CodeBuddy) 提升研发效率,AI驱动的用户参与度提升 则在延长游戏生命周期;AI + To B中: AI将企业服务从「卖资源」的IaaS模式,升级为「卖能力」的MaaS(模型即服务)和「卖方案」的AI平台(ADP)模式 。

AI + 微信则是最大的想象空间。AI正在重构微信的「连接」,从「人与人」、「人与内容」,升级到「人与智能体」。

 

过去的腾讯,其叙事核心是「连接」;而未来的腾讯,其叙事核心正在转变为「智能」和「效率」。这家公司正在利用其雄厚的资本(研发投入)和最深的护城河(微信生态),全力押注AI。

 

「新叙事」的路径已经展开。而那个在电话会上被高管们详细描绘的、能够调动整个微信生态的「AI智能体」,则会是这个新叙事的重要节点。

对话李彦宏:Chatbot 不是一切,我在 AI 上看到了更让人兴奋的未来

2025年11月14日 13:50

作者|张鹏

 

作为参加了多年百度世界大会的「老观众」,今年这个大会给我的感觉有点不一样。

以前的心理预期是李彦宏一般会先讲上一个多小时,会涉及百度很多条线的产品圈点。毕竟是「百度世界大会」嘛,基本上百度主要产品线的进展多少都要涉及下。

今年的不同,是李彦宏主要扮演了「串讲」的角色,台上具体讲产品和技术演示的,出现了不少新面孔,甚至竟然还有应届毕业生的主讲。

而李彦宏的串讲,感觉一直在努力在把百度的进展,与百度对未来的世界观连接起来。他自己也说:「百度世界大会,更应该是一个百度与大家分享世界观的大会。」而我感觉李彦宏在这个角色上,确实发挥得不错。

其时这次大会核心的技术和产品重点很聚焦——定义「数字人」是未来交互的底层技术、发布「伐谋」、以及体现了百度长期技术投入成果的的「萝卜快跑」,好像是李彦宏几年来首次讲了「不再纠结」的「搜索」,还有文心 5.0 的发布。

无论是李彦宏说的未来 AI 价值的「倒金字塔结构」断言,还是「效果涌现」这个大会主题,感觉百度虽然咬定「AI 全栈」能力的不放松,但其战略聚焦,正在出现明显的变化。

简单来说,从人的状态看,李彦宏比以前更「放松」了,而从事儿的角度看,百度似乎有意识的聚焦了。

让人印象深刻的是一个小插曲。由于这次的产品演示都是现场真实连线演示,结果在实时数字人演示环节,就很「玄学」的真出了联网问题,造成演示没成功。后来据说是李彦宏希望团队再试试,结果后来临时插入的第二次演示效果非常好,这个不完美,但是足够真实的过程,反而激发了所有人的兴趣,后来在展区去体验和数字人罗永浩的实时交流的观众简直爆棚。

这些和以往不一样的细节,让我确实有点好奇,百度这段时间是出现了什么思想上的变化了吗?带着这些好奇,我和李彦宏在会后做了一次长谈,

以下是我们这次交流的部分内容,分享给大家。

 

01

百度世界大会的意义是什么?

 

张鹏: 今年的大会,我记得是第 20 年吧?

李彦宏: 今年确实是第 20 年。

张鹏: 今天你一上来就讲: 这个大会其实不是让大家来看看百度的世界里发生了啥,而是想把百度的世界观分享给更多的人。在 20 年的节点,这句话是有什么特别的讲究吗?

李彦宏 :其实我们一直是希望百度的创新、技术,能够被外界更多地使用。 我一直在强调,技术的价值,一定是解决现实社会当中的问题。 我们做了这么多,我们要充分地展示给大家,让大家发现当中有什么可以用的、能够更好地产生价值的地方。所以百度世界大会每年就是在展示这些,我们特别希望跟大家进行开放的交流,你告诉我你有什么问题,我看看能不能帮助你去解决;或者能不能共创,一起去解决一个有意义的问题,其实一直是这样的理念。

这不是一种炫技——虽然大家可能更喜欢那些炫技的展示,但是我们更关注的,还是说这些技术创新到底在哪儿能用上,用上之后能产生多大价值?

张鹏 :我观察到,这次相对以前,你改变了一些演讲形态,以前,可能一开场听你讲一个小时,这次发现你讲了一会儿,然后就换了不同的人。这有什么特别的设计吗?为什么改变了这样一个形式?

李彦宏: 我觉得两点考虑吧。

第一,就是希望给年轻人更多的曝光的舞台,你可以看到今天有不少产品经理,其实都是非常年轻的,让他们去讲,其实今年年初的时候,Create 大会时也已经开始在这方面做一些尝试,发现效果挺好的,大家对这些年轻人的表现,都赞赏有佳。他们确实现场表现都挺惊艳的,所以我们更希望给这些人曝光的机会、学习成长的机会。

另外一个,我觉得我更希望扮演一个串场的角色,因为很多这些个工作、创新,本来就是他们做的,那么,谁做的让谁讲,其实讲得更加原汁原味、更能够反映事情的真实情况。而我来串场呢,我确实更加有一个 overview 吧,这样串的话,我认为大家的注意力也不太容易被分散,反正他总之还是会回来,还是会期待下一个产品的发布。

张鹏: 你自己也会轻松一点。

李彦宏: 我中间更有机会去看一看别人怎么讲的。

张鹏: 挺好,CEO 其实在一个组织里就是那个「串联全场」的角色

李彦宏: 是的。

 

02

为什么那么看重「伐谋」这个产品

 

张鹏:不过我记得有 2 个产品是你自己亲自讲的,其中一个就是「伐谋」。 为什么要把「伐谋」这种算法自我演化机制的技术,选择推向用在千行百业,特别是中国庞大的工业体系,而不是海外比较普遍共识的 AI for Science 领域?

李彦宏: 从 2022 年底、2023 年初开始,大家觉得这一波 AI 就主要是聊天机器人,但我觉得 AI 的能力应该,远不止是一个聊天机器人。但如果不是聊天机器人,到底是什么?一开始我也说,我特别关注效果,特别关注技术在哪儿能够产生价值。

所以, 我这几年一直在看,除了聊天之外, AI 的技术到底还能在哪儿产生价值? 你刚刚讲,伐谋这种可能更适合 AI for Science,AI for Science 当然重要,我们也在跟一些高校、研究机构也在合作探讨,看看怎么能够帮助 AI for Science 往前去推进。

但是我觉得这套技术的应用场景,远不止是 AI for Science。尤其是像中国是一个制造业大国,我们这么齐全的工业门类,在各个应用场景,在各个领域,其实效率的提升都是很重要的,之所以中国制造有这么强的竞争力,不就是我们做出来的东西又好又便宜嘛?那你凭什么又好又便宜呢?过去说我们中国人勤劳、聪明,能学会去干各种各样的活儿,所以能够跟别人去竞争。但是随着时间的推移,随着我们的经济越发展越壮大、强大,我们的核心竞争力不能永远是这个,我们需要在效率的提升上,怎么能有更先进的技术,明显地去提升效率。

我认为中国一个非常明显的优势,就是我们应用场景多,很多需求我们知道、很多场景我们有,在这些场景当中,如果能大幅度提升效率的话,竞争力就完全不一样了,对经济增长贡献也是会显而易见的。

所以我更多的是从这个角度考虑,我觉得伐谋重要。所以你刚才说今天我自己在讲伐谋这个产品,因为我觉得它重要,我自己也很有激情,想把它表达出来、想把它讲得足够的清楚,让足够多的人都知道,这是一个什么技术、什么产品。

张鹏:所以你是希望像「伐谋」这样不只是 AI 局部提升效率,而是在企业系统,甚至是产业系统里去寻找全局最优解的 AI 能力,能带来「工业 5.0」吗?

李彦宏 :我也想说这个,工业 4.0 我们可能已经实现了,那么 5.0 长啥样?或者说它的哪些方面还有巨大的提升空间?我觉得类似这种寻找「全局最优解」,实际上就是一个已经看得比较清楚的、巨大的提升空间。

张鹏: 如果今天要定义 5.0 的话,它可能会是什么样的一些根本性的变化?它背后什么样的引擎?

李彦宏: 伐谋其实还是有很大的通用性,我今天上午讲,对那些你要想解决的问题,解决方案好不好,它容易验证,伐谋一定能够迭代出来一个过去你不知道的、更好的解决方案。你想想这样的描述,其实在社会经济生活的方方面面,都可以去应用到,越复杂的问题,它可能越能够显现出来它的威力,或者说,它跟别的解决问题方法的差别就会越大。它有一个非常广的适配性,只需要去在各个领域积极地探索,就能把这里的价值充分地发挥起来。

张鹏:无论是宏观的经济体系,还是 一个微观的组织、企业,它所在的行业、工作流、业务组织、商业模式的变化,面临着复杂系统是,有可能会需要一些这样的东西帮他们能够跳跃出原有的惯性,去做进一步「超越努力」的进化。

李彦宏: 是的。 越复杂的问题、你越要想着用这种方法;简单的问题,可能别的方法也能解、甚至解得更好。但是复杂的问题,这种方法威力就明显是不一样的。

我自己的认知是说,AI 不应该像人。现在社会上可能很多人,甚至主流意见都是说,我们怎么样构建一个 AI,让它具备人的能力,让它越来越像人。我自己不觉得, AI 从来就跟人不是一个物种 ,我们有时候讲硅基生命、碳基生命,其实都是想把它共性找出来,让 AI 去模仿人,去做人该做的事。

我始终觉得,这有点像比较人和老虎一样,你说要让人像老虎一样,爪子那么锋利,没必要;那么反过来,你说要让老虎像人一样有那么聪明的大脑,或者说每天吃那么多素食,其实也没必要。AI 是一个不同的物种,我们没有必要老是拿人这个物种、这个「模子」往里塞它。

有些东西确实是 AI 擅长的,那我们尽情地让它去发挥;有些东西确实 AI 不擅长,今天我们的大模型很厉害了,但是大模型耗电太多了,做一个很简单的事,可能 AI 耗电就很多,但人脑耗电很少,很多事情完成任务的能量消耗是远远低于这些 AI 模型的。

张鹏: 所以人和 AI 按道理应该做更好的分工?

李彦宏 :对。所以,我们最好不要把 AI 当成跟我们一样的东西,AI 在不同的场合下,它扮演三种不同类型的角色:

一种角色叫做「助手」,这种情况下,AI 完全处在辅助的角色,人处在主导的角色。我想要怎么样,我就指挥这个助手做什么事情。

第二种角色我们叫做「搭子」,搭子就有点平等了,就是你有什么想法、我有什么想法,我擅长干啥、你擅长干啥,就是合作一起来干一个事情,或者一起去玩个游戏。。

但除了这两个角色之外,我认为还有第三种角色,就是在某些问题上,AI 的能力是远超人类的,所以这个时候你就信它就完了,你没必要去多想,为什么不能信 AI 呢?可以信 AI 啊,它在很多问题上它就是比人类要厉害很多,比如你跟它下围棋,你真下不过它。

张鹏: 回到伐谋的角度去看,它能够对复杂问题、海量信息,可以持续进化的、用强化学习的方式去寻求全局最优解,我确实认为,这件事按道理人是很难做到的,就是应该它去发挥的,所以它至少应该是个很好的「参谋」。

李彦宏: 没错。很多部门 AI 都能够起非常重要的作用。现在我觉得,还是我们的想象力被限制了,所以我非常希望大家积极地尝试,我上午也讲「内化 AI 能力」,就是说,现在不管 AI 具备什么样的新能力,你怎么把它变成你的「原生能力」,怎么把它变成你组织里一个不可或缺的、像神经系统一样的,它是贯穿你整个身体的,它不是你的某一个器官,它完全是渗透性的。怎么真正做到这一点,我觉得对每一个企业来说都是很重要的。

张鹏: 当年我们打比方说手机是人的一个外部器官延伸。听起来,AI 未来它肯定不是个器官的概念,它更像是某种「原力」,如果你能很好的运用它,就变成了《星球大战》里的杰达骑士。

李彦宏:对,AI 应该是一个渗透性的,无处不在的力量。

 

03

「萝卜快跑」长大成人的意义

 

张鹏 :今天你还有一个产品是自己从头讲到尾的——「萝卜快跑」,这个自己讲是出于什么考虑?

李彦宏 :确实挺不容易的。我们无人驾驶技术从 2013 年开始做,十几年的历史,这中间其实绝大多数时候,外界不仅是不看好百度的萝卜快跑,甚至是整个这方向都不认同。我记得有一个图灵奖获得者,就说无人驾驶是不可能解决的,你即使实现了 AGI,无人驾驶也解决不了,讲得很悲观。

但是我们总觉得,这个东西 (无人驾驶)它一旦要解决了之后,对人类的意义实在是太大了。如果它意义这么大的话,我们难道不应该去冒点险吗?即使是 90% 的概率都会失败,10% 的概率会成功,那我也值得啊!万一成功了呢?就是这种信念一直支撑着往下走。

到这一两年,大家慢慢开始对这个行业或者说对这项技术越来越看好。可能这里头也有我们的原因:比如说,我们从 2022 年开始,大规模地部署萝卜快跑,证明了它确实是能跑通的。在这种人口密度非常高的大中型城市里头,它能够跑起来,能够比人类司机安全十倍,我觉得还是意义很大的。

虽然今天上午我们没讲,但我一直特别在乎的就是——每年有超过 100 万人在交通事故当中死亡,这里头 94% 是人为原因造成的。所以很多时候我看到新闻讲,哪儿又出了一个交通事故,我自己就想,如果是无人驾驶在操控这台车的话,它不应该出这个交通事故。

所以不断的有这个外界刺激,让我觉得说,做成这件事真的是太重要了!所以我想试试。那么一直试了十几年,现在看起来越来越多的人开始信,这是代表趋势的,是可以实现的。未来 10 年、15 年之后,街上跑的车可能大多数都会是无人车了。我觉得到了这个时间点,我上午讲说已经到了这种临界点,所以我还是很希望自己跟大家来传递一下这个信息。

张鹏 :「萝卜快跑」把技术本身变成了规模化交付的有效服务。过去在中国科技领域确实不多见。

李彦宏 :确实 比较少这种先例,就是一项技术一个企业坚持投入十几年,最后慢慢还真做成了,还进入了实用阶段, 收获很大价值 ,就是这种例子过非常少。 据我的了解,一方面社会对于企业的研发投入非常关注;另外一方面,他们也有一种大致的划分,比如说中小企业基本上就不用再研发,你就拿成果来做产品化;再大一点的企业,可能为未来两年到五年能够进入实用阶段的技术进行投入;那么五年到十年才能够有效果、才能够有收益的技术,可能就是那种超大型企业才会愿意去提前投入。那么十年以上才能够见到效果,一般就是学术界做学术研究,他就不建议企业在这个方向上去投入了。我觉得一直到今天,大多数人的认知还是这样的。

但是今天我们也看到另外一个现象,就是 AI 相关的投入,学术界其实不太能做,上来就要万卡才能训练一个模型。

张鹏 :但他们确实没有那么多卡。

李彦宏 :所以不大可能让学术界去做这样的投入,反而是工业界由于有不少公司还是有一定的积累。所以我投十年就十年吧,如果真的有很好的回报,有很大的社会意义的话,我们是可以的,我们能够投得起这个资源。所以我是希望,当未来的人再看到比如说萝卜快跑、昆仑芯,这些投入都十年以上才见到效果的话,他们可能更愿意去做这种十年以上的投入,我认为这是一个良性的引导,应该给大家更多信心去做这样的事情。

 

04

对「起大早,赶晚集」的复盘:

要去做「更纯粹」的探险

 

张鹏 :我很认同百度在自动驾驶上的前瞻投入,这个长期主义的闭环也很让人欣慰。不过我也问个不知道是不是有点冒犯的问题,外界有人会说,百度也曾经在很多事情上「起大早、赶晚集」。你肯定听过这样的说法。

李彦宏 :当然,别人说我们「起大早赶晚集」,这不冒犯,一些也是事实。甚至我在内部也让大家研讨说,我们为什么会「起大早赶晚集」。

张鹏 :过去确实不是每一件事都会有像萝卜快跑这样的结果。那么你怎么在内心在去坚定自己的信念?这些复盘后来有什么结论吗?

李彦宏 :我们不能够指望所有的创新尝试都是成功的,创新的特点就是,大多数创新会失败,我们要接受这样一个现实。所以百度内部可能起过十个不同的创新项目,如果九个都失败了,我认为是很正常的,它就应该失败,从概率上讲就应该失败,如果有一个成功了,那就非常好。这是一方面。

另外一方面, 百度这些年有做成的、有做失败的。如果有什么规律性的话,当这件事的成败几乎完全取决于它技术的先进性的时候,我们的成功概率就会大不少,尤其是这个技术需要很多很多年的投入和迭代,那我们成功的概率就会更大一些

但是当这件事情,仅仅是因为它市场大,或者说技术在这里头虽然有一定作用,但不是起决定性作用,我们冲进去之后,失败的概率就会高很多。所以未来, 我们在起新项目的时候,我可能更多的会关注,技术在这里头是不是起决定性作用?如果是,我愿意尝试,十次有九次失败,我认。那如果不是呢,咱们最好别再去做这样的尝试了,因为它无论成败,对这个公司的意义其实也没有那么大。

张鹏 :你认为核心实际上是那个起心动念应该纯粹,它技术纯度越高,百度做成的机率就越高,

李彦宏 :是。哪怕它需要很长时间,十年也 OK,我们可以,我们有这个耐心。

 

05

数字人技术与下一代交互

 

张鹏 :我好奇的八卦一下,今天数字人在演示的过程中是不是遇到了一些问题,具体发生了什么?

李彦宏 :我后来问了,团队为了保证效果,他连了一条专线,没有用 5G,因为现场有好几千人,怕网络拥堵,结果反而那条专线不是很稳定。

张鹏 :反而是专线出了问题是吧?所以第一次就没能及时演示出来。

李彦宏 :是的,当时我觉得特别遗憾。我昨天下午彩排的时候,我看它走过一遍这个流程,我觉得还效果挺好,所以我本来准备他演示完了之后,我上去讲实时互动数字人有这个特点有那个特点。结果当时演示了好几下没成,我就在旁边跟我们同事讲,我说咱们再去尝试一下,再来一遍也没关系,一定要真实演示一下我们的技术。

张鹏 :如果第二次还出问题,估计网上就炸了。团队是不是压力很大?

李彦宏 :我觉得我们的技术是过硬的,我当时并不知道是网络的原因,只是觉得如果是比较边缘的原因造成没演示成的话,这个东西太遗憾了,所以他们就赶紧去准备,后来可能再测试一下说可以了。我听说后来就直接转到 5G 网络就可以了。

张鹏 :效果确实挺好,我刚才看展区里,就那个展位是人排得最多的,都去体验罗老师的实时对话技术,反而让大家激发了兴趣。其实现场的演示大概率就是会遇到七七八八的问题,这次我看你们基本都是用的现场的演示?

李彦宏 :我觉得现场演示其实更有意思吧。

张鹏 :这个都要现场演示的板儿得你拍吧,要不然办会的同学们敢冒这么大风险吗?

李彦宏 :说实话好多都不是我拍的,只是我有时候会问,这个为什么不是现场?像比如说连线中东那个,彩排的时候一开始说我们已经录好了给你看一下,我说别录好,咱能不能直接连线?他们说当地网络不稳定,我说那试试看呗。

张鹏 :回到数字人,你在说数字人的时候定位它是未来交互的底层的技术,我们以前对数字人的理解,它是一种应用,我们可以在电商、直播各个维度都可以用起来,但是你把它定义到交互,交互对于咱们科技圈是一个很大词,因为我们一旦说交互有变化,就意味着是一个时代的更迭。我们怎么去理解它会是一个新一代交互的底层?

李彦宏 :因为你看这一波 AI 起来之后,尤其是 C 端主要的产品形态就是所谓的 ChatBot,它是一个对话机器人或者聊天机器人,我觉得这个肯定不是最佳的人机交互界面,因为对于用户的要求还是太高了。不管是说话也好、打字也好,我得说一串或者输入一串东西,才能够跟 AI 进行交互。这个门槛是很高的,这跟你刷抖音完全不是一回事,你只要一刷就变,一刷就变,太容易了。中国十几亿人,可能绝大多数,99% 都会干这个事。但是你让一个普通的用户跟 AI 进行对话,其实还是有点门槛的。所以我认为,这个(交互方式)应该不是最佳,至少不是唯一的人和 AI 交互的方式。

那么除了这个方式之外,还有什么方式?我现在能想到的就是数字人。数字人一方面它仍然非常依赖自然语言,另外一方面,它这种互动感,它这种情景沉浸感,甚至加入了视觉模态感知后,数字人他能够看到你拿的东西是什么,这会降低对用户精准输入的难度,也会增加交互中对用户的情绪价值,这个交互我觉得要自然得多、门槛要低得多。所以我很看好数字人技术作为一个全新的交互形态的日底层技术的发展潜力。

张鹏 :所以你觉得数字人的「类人」形态,本身就在交互体验上对人有更大价值。

李彦宏 :我完全同意。当然了,它是「类人」,它又跟「真人」有不一样的地方。你在跟一个真人交互的时候,其实还是多多少少有一点压力感的:该谁说话?谁来挑头发起一个新的话题?如果中间沉默了会不会尴尬之类的。你跟数字人其实没有这种压力,你不说话,它也不说话,也不会觉得尴尬。它不停地说,或者你就坐在那看或者听,也没问题,你想插话也没问题,所以这个自由度我觉得反而更大一些,压力更小一些。 它真的可以变成一个比 ChatBot 更高级的人机交互方式

 

06

搜索的「纠结」与「不纠结」

 

张鹏 :我感觉你对火热的 ChatBot 有一些自己的「保留意见」,不过今天确实越来越多的用户在接受和大模型对话问答,甚至很多时候正在改变他们获取信息的习惯。这就让我很好奇搜索正在面对的挑战。你在台上今天提到搜索曾经面对 AI 是有过「纠结」的,你当时在纠结什么?现在找到的目标又是什么?

李彦宏 :我首先并不反感 ChatBot。我只是觉得它不应该是唯一形式,就是这么大一个产业浪潮,最后大家都聚焦到一个 ChatBot 上,这个我觉得是有问题的,但是你说用不用?反正我天天用。

然后对于搜索,某种意义上讲,新的这种 AI 的能力对搜索是一种颠覆。过去传统的搜索,一个检索词,然后是个蓝色的链接,越来越显示出来,它不能够比 AI 生成的内容更好的去满足用户的需求。纠结之处在于什么呢?还是有很多用户已经非常习惯了百度搜索这样的一个呈现形式,当你改,比如说最直接的就是它响应速度可能没有那么快了,过去你搜一个什么东西,0.1 秒它就出结果,你还没来得及反应了,结果已经出来了。今天你要用 AI 生成,尤其是稍微复杂一点的问题,它得等好几秒钟才出结果,这对于习惯了搜索的用户来说呢,实际上我们看用户实验,就是说留存、时长什么的,都是负的,我所说的纠结很多时候就是指的这方面。

但是一方面,这个大模型推理成本在迅速下降,推理速度也在急速的提升。另外一方面,当越来越多的人用过 ChatBot 之后,他说这样也挺好啊,我稍微等个两秒钟,我就能够得到更直接的结果,不用我一条一条上滑去看了,也挺好。 所以用户在逐渐接受这个新的技术带来的这种新的交互形态

与此同时,除了文字内容之外,我们还可以生成图片,还可以生成语音,还可以生成视频,还可以有数字人等等,那就没有那么纠结了嘛,不管什么样的形态,如果能够很好的满足用户的需求的话,那就是好的产品,那就是代表未来方向的。所以我们就努力往那个方向去跑就好了。

张鹏 :所以不纠结是因为把这件事往底层去推,到底搜索过去在解决什么问题,今天结合 AI 怎么更好的解决。

李彦宏 :本质是你到底有没有满足用户的需求?而不是说用户已经习惯了这个产品形态,让他改,要付出一定的代价。

张鹏 :搜索它是一个方法还是一个目标?这件事在今天我们该怎么描述它?那个最本源解决的问题,可能大概率没变,但它可能描述会有变化,有没有想过这个问题?

李彦宏 :其实在搜索引擎这个词诞生之前,我学的那个专业叫做信息检索,或者说在我一开始接触这套东西去解决人们寻找信息的这个问题的时候,还没有搜索引擎这个产品形态。所以在我看来, 没有什么叫做搜索引擎就是正确的产品形态这个观念,我们一代一代的技术都带来新的可能性,那我们就要极致的利用这个技术的能力,更好地去满足人们的需求。

所以百度早年的时候,我们使命叫「让人们最平等便捷的获取信息、找到所求」。

张鹏 :其实这里面没有「搜索」俩字,但是我们那个时代对实现形态的理解就是搜索。

李彦宏 :对,那时候理解就是搜索引擎,今天你看这些 ChatBot 其实类似,只不过它是更加 powerful。今天百度使命,我们说「用科技让复杂的世界更简单」,就是你很复杂的需求,你扔给它,它也能懂,它也能给你一些 Solution,这个技术演进的过程,我觉得某种意义上讲,对我来说是很正常很自然的。我觉得它就应该是这么一个规律,就应该往这个方向上去变,就应该能解决越来越多的人的信息获取、内容消费,甚至是任务执行等方面的需求。

张鹏 :听起来搜索就是手段,不是目标。

李彦宏 当然是手段,甚至它是个壳,它的实质其实不停的在变的。

张鹏 :如果有机会,我们打个响指,让整个社会对百度的认知,就是从搜索这个壳里出来,你更希望大家怎么今天去理解百度?因为过去搜索太成功了,我觉得绝大部分的人都把对百度的认知固化到这个壳上,如果有机会改变,你更希望这个时代大家对百度的认知是怎样的?

李彦宏 :百度一直是一个技术公司,我们这个技术基因其实还蛮强的,所以 今天的百度,是一个什么公司呢?我们是一个「拥有强大互联网用户基础的 AI 公司」。所以你看它的本质,其实就是一个人工智能公司,是一个科技公司 ,只是由于我们的技术力量使得每个月有超过一半的中国人都在这儿找信息,所以它确实有一个比较强大的用户基础,这当然是好事。就是对于我们想要研发的这个技术来说,我有很多机会去让人们尝试一下,或者说去测试一下,人们对这个技术的接受程度怎么样,或者效果好不好,或者说当我有好的技术的时候,我能够以必须快的速度推广到很大的一个人群范围当中去。

所以你刚才说 去掉壳的百度是什么?百度是一个技术公司,是一个什么技术公司?是一个 AI 技术公司,是一个什么样的 AI 技术公司?是一个有强大的互联网用户基础的 AI 公司。

张鹏 :如果这个社会能给个机会把百度看成是一个 AI 时代的创业公司,带着很多的用户、带着足够的资金储备,带着对这个技术很多的积累,那我觉得大家可能看百度的感觉会不一样。

李彦宏 :其实你说得这个特别对,我有时候也在想,百度就应该是这个样子,我们因为搜索有庞大的用户群体,但是呢,我们是一个技术公司,我想用技术去改变世界,有各种各样技术创新的方向,好多我都想去试一试,试一年不成,OK;试两年不成,OK;试五年不成,OK;试十年还没成,如果有意义,我还会接着试下去,我就是这样一个人,我们就是这样一个公司。外界只要理解我的产品就好了,你用了我的产品,给你创造了价值,我真的就很高兴。

 

07

什么是百度对下一个十年的「非共识」?

 

张鹏 :看来你不是很在意别人怎么定义你,关键是自己怎么定义自己。说到这一点,我觉得今天你提到了一个非常重要的词,叫 AI 能力的「内化」。你一直在告诉大家未来的企业一定要通过「内化 AI 能力」形成自己的竞争力。那么百度对自己是怎么推动「内化」的,你期待的结果是什么?

李彦宏 :其实我们内部有很多这样的讨论,我们叫做思研会,就是在各级组织,大家都要定期的去组织思研会。这个思研会的主题,其实多多少少都跟怎么内化 AI 能力有关系,就是你这个业务,你这群人,到底是怎么用 AI 的,怎么用 AI 来提升效率?大家比较容易想到的是,AI 作为一个个人的助力,不管是辅助编程,或者是你生成文档,今天比如说像 GenFlow 那些东西,这些比较容易想到,我也看到有不少其他公司在推进,就是内部在内化 AI 能力,或者说使用 AI 的时候大多数大家想的都是这样的,怎么样让 AI 去赋能企业里的每一个个体。但是我觉得这还是一个比较浅层次的、早期的内化。

真正的内化,是在组织层面,不是在个人层面 。当 10 个人一起工作的时候,用什么 AI 工具让大家的协作效率更高?当 100 个人共同去解决这个问题的时候,是不是有新的 AI 的方法帮助你更好地解决?再推广到整个集团公司,几万人,是不是有一个什么共同的 Backbone 支柱?它本身就是 AI 能力,你只是在这个支柱上处在不同的位置。这是我们真正去内化 AI 能力的时候,要去实现的一个结构。不是简单赋能个人,是赋能整个组织,是赋能你要去解决的问题,你要干的事。所以我今天上午说,未来对于绝大多数人来说,你的工作就是, 把你要解决的问题转换成 AI 能解决的问题 ,没有别的工作了。

张鹏 :其实这个「最后的工作」感觉还挺难的。

李彦宏 :是有挑战,不容易,但是有挑战才有乐趣嘛,如果是很重复性的工作,我宁愿就不做了。这个需要耐心,你对孩子是天然会有感情的,会培养他,但你对 AI 天然有感情吗?如果说你试了一次,它不 work,绝大多数就放弃了。

张鹏 :所以面对 AI 的内化这件事,或许每个组织都不能是单纯的「甲方心态」,需要有点「为 AI 父母」的觉悟,才能真的培育好自己的「AI 继承人」的感觉。

李彦宏:是的, 但说实话我认为这个过程会很快,你可能今天觉得说脱胎换骨不容易,但明天就会发现说其实也没有那么不容易,当你的同行做了,为什么你不能做呢?

张鹏:10 多年前你 投入 AI 是当时的非共识。那么今天,你对未来十年还有哪些「非共识」的坚定判断?

李彦宏 :有。其实也不是什么新东西,就是从 2023 年开始,我就一直在讲的四个字叫做「应用驱动」。今天大家在卷芯片、卷模型等等,我一直是说要卷应用,应用才是真正创造价值的地方。很多年前我说 AI 很重要,但是今天 AI 已经成了一个共识,但是 AI 又分不同的层次,我认为机会最大的是在应用层,不在模型层、不在芯片层。我希望未来很多年以后,能证明我这个观点是正确的。

传苹果从微信小程序抽成 15%,腾讯回应;特斯拉考虑支持 CarPlay;iPhone Air 成功支持实体卡 |极客早知道

2025年11月14日 08:10

消息称苹果从微信小程序消费中抽取 15% 分成,腾讯回应

苹果公司今日正式宣布推出「小程序合作伙伴计划」(Mini Apps Partner Program),旨在扩展 App Store 对小程序的支持。该计划强调通过特定技术接口确保用户安全和流畅体验,同时为开发者带来业务拓展机会。

彭博社报道称,腾讯公司已与苹果公司达成一项协议,根据该协议,苹果将处理微信小游戏和应用中的支付事宜,并从中抽取 15% 的分成。

在今日举行的腾讯集团 2025 年第三季度财报电话会上,腾讯管理层对此消息进行了回应,称腾讯与苹果有着非常好的关系,在很多方面都进行了合作。腾讯和苹果一直在讨论如何使小游戏生态更活跃,「我想在某个时候可能会有一个正式的批准」。(来源:IT 之家)

 

特斯拉或将考虑支持 Apple CarPlay 以提振低迷销量

据悉,特斯拉已就引入 CarPlay 支持讨论数月,不过目前尚未有最终方案,短期内也不会有相关宣布。正值其他车企纷纷取消 CarPlay 之际,该消息也引发业界关注。例如通用汽车就公开表示,未来新车型将全面移除 CarPlay 和 Android Auto 支持。

与此同时,苹果仍在努力优化 CarPlay,吸引用户和厂商采纳。最近发布的 iOS 26 增加了导航、通信等多项 CarPlay 新功能。苹果还在推动 CarPlay Ultra 的普及,这一增强版体验可接管汽车的多块屏幕。但不少车企对让苹果全面接管车载显示器持保留态度。

有业内评论认为,CarPlay 和 Android Auto 的缺失正是特斯拉潜在车主最常吐槽的问题之一,其 Reconsider(重新考虑)这一战略无疑是重大变化。不过外界猜测,特斯拉有可能只会推出「精简版」CarPlay 镜像功能,使其显示于特斯拉自研操作系统的一部分窗口,并不会开放完整的 Ultra 体验。无论如何,这都标志着特斯拉在信息娱乐系统上的重要转折。(来源:cnBeta)

 

阿里巴巴据悉拟全面改造旗舰 AI 应用 力争赶超 ChatGPT

阿里巴巴正准备在未来几个月对其主要的移动人工智能(AI)应用程序进行全面改造,使其更接近于 OpenAI 的 ChatGPT,这是该公司更广泛努力中的关键一步,旨在追赶竞争对手,并最终实现从个人用户中盈利。

据知情人士透露,阿里巴巴计划首先在 iOS 和安卓系统上更新现有的「通义」应用程序,并将其重新命名为「通义千问」——以该公司著名的 AI 模型命名。这些知情人士表示,阿里巴巴将在未来几个月逐步增加 AI 代理功能,以支持包括淘宝在内的主要平台上的购物。

知情人士透露,最终目标是试图使通义千问成为一个功能齐全的 AI 代理,这也是中美两国业界的首要目标。知情人士称,阿里巴巴计划最终推出海外版本向全球扩张。知情人士称,过去几个月,公司内部已有 100 多名开发人员参与这次改造,这是首席执行官吴泳铭 9 月份透露的额外 AI 投资的一部分。(来源:新浪科技)

 

百度文心 5.0 大模型发布,支持多模态理解

11 月 13 日上午消息,今日举办的 2025 百度世界大会上,百度创始人李彦宏宣布文心 5.0 大模型正式发布,该模型支持多模态理解、创意写作及智能体规划等能力。

据百度 CTO 王海峰介绍,文心 5.0 是一款原生全模态大模型,具有原生全模态建模、理解与生成一体化等特点。在多项国际测评中,该模型均取得了领先成绩。(来源:新浪科技)

滴滴自动驾驶宣布出海,首站落户中东阿布扎比

11 月 13 日下午消息,滴滴自动驾驶宣布与阿布扎比投资办公室(ADIO)达成战略合作。滴滴自动驾驶加入阿布扎比智能和自动驾驶汽车产业集群 SAVI,双方将在自动驾驶技术创新应用、AI 人才培养、生态建设等领域开放合作,共同支持阿布扎比建设领先的智慧出行和可持续交通生态,并逐步将合作拓展至更广泛的中东地区。

阿布扎比 SAVI 产业集群,由阿布扎比经济发展部和阿布扎比投资办公室主导发起,是中东和北非地区的智能交通枢纽。SAVI 产业集群旨在推进海、陆、空自动驾驶技术创新和商业化,加速构建智慧城市。ADIO 预计,到 2045 年 SAVI 产业集群将为阿布扎比贡献 440 亿迪拉姆 GDP,创造 4 万个就业岗位。(来源:新浪科技)

 

国际标准化组织明确 6G 时间表和路线图,业内预计 2030 年左右开始部署

今日在北京举行的 2025 年 6G 发展大会发布的消息显示,制定全球移动通信标准的国际组织「第三代合作伙伴计划」(3GPP)已启动网络架构、无线空口、安全技术等 6G 研究项目,形成了 6G 标准化时间表和技术路线图。

当前 6G 技术研发已取得阶段性进展,关于 6G 服务需求的研究已完成 77%,涵盖人工智能集成、计算、感知等方面的架构研究正在推进。业内预计,6G 网络将在 2030 年左右开始部署。到 2040 年,6G 连接数有望超过 50 亿,占全球移动连接总数的一半。(来源:IT 之家)

 

淘宝闪购率先开通国内首个海岛无人机航线

11 月 13 日午间消息,近日,在花鸟岛,淘宝闪购已开通四条无人机航线,可满足岛屿上的消费与应急需求,极大方便了游客和岛上居民。

资料显示,花鸟岛是嵊泗列岛最北端有人居住的岛屿,形如展翅欲飞的海鸥,是沪杭周边最受欢迎的旅游目的地之一,年游客量超 50 万人次。由于地理位置特殊,岛内无桥梁与大陆相连,居民和游客进出需依靠轮渡。随着无人机航线完成覆盖,对于居民的餐饮、医药、紧急物资和小型包裹等需求,淘宝闪购无人机也能够提供快速应急响应能力。(来源:新浪科技)

宇树推出首款轮式人形机器人

11 月 13 日,宇树科技在官网上线了一套人形机器人数采训练全栈解决方案。该方案基于一款轮式机器人 G1-D,由高性能人形机器人本体、系统化的数据采集工具和全面的模型训练及推理工具组成。

G1-D 机器人身高范围约 1260-1680mm,头部配备高清双目相机,手部配备高清相机。G1-D 分为通用版和旗舰版,旗舰版可选配移动底盘,移动速度≤1.5m/s。

G1-D 通用版和旗舰版分别有 17 和 19 个整机自由度(不含末端),单臂自由度(不含末端)为 7 个,单臂最大负载约为 3kg。G1-D 采用轮式与升降相结合的移动升降设计,垂直作业空间为 0-2m,腰关节运动空间为 Z±155°、Y -2.5°~+135°。(来源:新浪科技)

 

2998 元起:大疆 Osmo Action 6 运动相机发布,首搭 f/2.0-4.0 可变光圈、1/1.1 英寸方形传感器

11 月 13 日消息,大疆现已发布 Osmo Action 6 运动相机,其最大亮点是搭载了 1/1.1 英寸方形 CMOS 传感器,新增 4K 自由裁切模式,可让用户在横竖屏视频间自由切换,同时还是大疆首款配备可变光圈的运动相机。《大疆 OSMO Action 6 体验:完美进化,不止运动 》

硬件方面,这次 Action 6 搭载全新升级的 1/1.1 英寸方形 CMOS 传感器,其像素大小为 2.4μm,最高动态范围可达 13.5 挡,最高可拍摄 4K 120FPS 4:3 比例视频,支持超级夜景模式,可在低光照环境下以最高 4K 60P 的画质拍摄。

而超级夜景模式则会开启最高 f/2.0 光圈,提升进光量,降低噪点对画面的干扰的同时还可在较小对焦距离下营造虚化效果,增强氛围感,用户还可以在灯光明亮的场景下开启星芒模式,这时光圈会缩小至 f/4.0,让画面的点状光源呈现星芒效果。(来源:IT 之家)

OSMO Action 6 外观 | 图片来源:极客公园

 

华强北再发力:超雪团队成功实现苹果 iPhone Air 改实体 SIM 卡

11 月 13 日消息,超雪团队今日发文,宣布苹果 iPhone Air 改实体 SIM 卡成功,并且已经成功读上了实体卡。有用户询问:「工程版还是量产版?」超雪团队回复:「支持实体卡出信号还是首次呀。」

值得一提的是,今年 10 月,超雪团队发文,称其 eSIM 小程序「bleuicc」已正式上线,目标是「让所有手机都支持原生 eSIM,包括有锁机」。参考小程序页面,其中显示该团队使用蓝牙写入 / 启停 eSIM。(来源:IT 之家)

营收狂飙的「暗面」:Meta成「全球欺诈大本营」?

2025年11月13日 18:06

每年至少 70 亿美元,每天向用户推送多达 150 亿条诈骗广告——这竟然是社交巨头 Meta 惊人的「取财之道」!

近期,外媒披露的一个「惊天大秘密」直指 Meta 光鲜亮丽的营收数据背后,隐藏着一个巨大的黑洞:欺诈性广告业务。

内部文件显示,Meta 公司去年底曾预测,其年度总收入的约 10.1%,大约 160 亿美元来自高风险的诈骗广告和违禁商品广告。尽管 Meta 发言人声称实际数字「更低」,但另一份内部文件却指出,Meta 每年仅从部分诈骗广告中就能赚取约 70 亿美元 的年收入。更令人震惊的是,该公司平均每天向用户展示约 150 亿条具有明显欺诈特征的「高风险」诈骗广告。

更有甚者,Meta 对付疑似非法营销人员的手段堪称「黑色幽默」:要么让他们缴纳足够的高额广告费,要么就等着被列入内部的「诈骗者」报告。这种类似收取「保护费」的机制,让 Facebook、Instagram、WhatsApp 都变成了一个虚假广告大本营。Meta 内部报告甚至承认一个尴尬的现实:「在 Meta 平台上宣传诈骗比在谷歌上更容易。」

对此,Meta 发言人表示,公司已「足够尽力」,并强调已将用户举报的诈骗广告数量减少了 58%。然而,内部文件却揭示,Meta 曾因将诈骗广告归类为「低严重性」问题而忽略或错误地驳回了高达 96% 的用户有效举报。

Meta创始人、CEO扎克伯格 |图片来源:彭博社

与无下限地狂揽欺诈广告收益形成鲜明对比的是,Meta 正无上限地向 AI 领域投入天价资本。其 AI 基础建设设施的资本支出指引已升至惊人的 660–720 亿美元。

同时,Meta 还濒临着核心人才齐出走的困境。「卷积神经网络之父」杨立昆在 2013 年加入 Meta 后,一手建立起 FAIR 实验室并推动其成为全球顶尖AI研究机构,但今天他也宣布自己离开 Meta 创业。有媒体推测,推动杨立昆离职的原因之一是原本直接向首席产品官汇报的杨立昆,现在需要向 28 岁的 ScaleAI 创始人亚历山大·王汇报工作。

据不完全统计,除了杨立昆,基础 AI 研究科学家陈欣磊、研究科学家庄靖尧等至少 14 人跳槽至马斯克的 xAI 公司。此外,新实验室 FAIR 已有至少 8 名员工离职,部分人返回 OpenAI 或加入其他公司。

一边是暗藏污垢的百亿美元「欺诈营收」,一边是动辄数百亿的 AI 基建投入。Meta 究竟如何将其 AI 基建所获得的能力转化为业务的实际收入,以对冲这天价的基础设施成本?而更深层的问题是:在这场由算力、基建与资本主导的 AI 战争中,一家以「社交网络」为核心的纯粹媒体公司,是否真的有必要,下注如此庞大的 AI 基建?这豪赌的底气,是否就来自于那些被其忽略甚至纵容的「欺诈」带来的暴利?

一、「在 Meta 平台上宣传诈骗比在谷歌上更容易」

路透社通过此前未公开的文件勾勒出 Meta 广告业务的一幅「至暗图景」:Meta 的平台几乎每天都在向用户推送多达 150 亿条「高风险」诈骗广告。这些广告会让数十亿用户面临欺诈性投资、非法在线赌场或者是违禁医疗产品的销售风险。而诈骗的方式,不仅限于付费广告,用户每天还会遭遇 220 亿次不涉及付费的「诈骗尝试」,如虚假交友资料等。步步退让下,Meta 的产品已成为全球诈骗经济不可或缺的支柱。

「在 Meta 平台上宣传诈骗比在谷歌上更容易」,Meta 内部研究结论更显讽刺与尴尬:Meta 在打击诈骗方面,显然落后于其主要竞争对手。英国监管机构发现,2023 年所有支付相关诈骗损失中,有 54% 与 Meta 的产品有关,是其他所有社交平台总和的两倍多;而 Meta 自身的研究估计,其平台参与了美国三分之一的成功诈骗案件。

为什么会更容易?这是因为在用户保护和合规方面,Meta 做法显得暧昧且缺乏力度。文件显示,Meta 自动化系统认定必须有至少 95% 的把握确定营销人员存在欺诈行为时,才会禁止其投放广告。对于那些「把握较小,但仍然认为广告商很可能是骗子」的情况,Meta 采取的并非直接封禁,而是实施「惩罚性竞价」,也就是提高广告费率。

这意味着,涉嫌欺诈的营销人员只要愿意支付更高的费用,就能继续在其平台上投放广告。这种「以罚代禁」的机制,本质上模糊了平台管理与「创收」的界限,让 Meta 在某种程度上成为了一个对诈骗行为收费放行的「中介」。

内部文件甚至记录了「高价值账户」,比如说那些支出较大的广告商,即使累计超过 500 次违规记录,Meta 也不会封禁其账户,这无疑是严重放水的行为。

这一切让用户处于极度被动的情况。在 Meta上,一名加拿大皇家空军的征兵官账号被盗后,黑客用她的名义投放了加密货币诈骗信息,导致她的前同事损失了 4 万加元。尽管受害者及其数十位朋友向 Meta 提交了超过 100 份举报,但该账户仍活跃了数周,无人问津。这并非孤例。一份 2023 年的文件显示,Meta 几乎驳回了用户提交的约 10 万份有效诈骗举报中的 96%。曾任检察官的非营利组织负责人艾琳·韦斯特直言,Meta 对用户举报欺诈行为的默认回应就是忽略。

面对监管压力,特别是美国证券交易委员会(SEC)对金融诈骗广告的调查,Meta 内部权衡了经济利弊,算好账才选择纵容。一份 2024 年 11 月的文件残酷地指出,Meta 每六个月仅从那些「法律风险较高」的诈骗广告中就能赚取 35 亿美元,而这个数字几乎肯定超过「任何涉及诈骗广告的监管和解费用」,因为内部预计美国监管罚款最高不过 10 亿美元。这意味着,Meta 在短期内从欺诈中获得的收入远超其可能面临的罚款。文件甚至暗示,该公司领导层决定仅在即将受到监管行动时才采取更多措施来审查广告商,而非主动采取行动。

Meta 如今走钢丝般的商业模式,让人不得不质疑其转型的底气与道德基础。如果一家万亿美元市值的科技巨头,需要依靠纵容欺诈来「输血」其 AGI 雄心,那么是否会因为其道德上的缺失而蒙上阴影?

 

二、赚钱速度不如花的快,Meta搞AI亏大了?

正是带着这种令人不安的巨大矛盾,当马克·扎克伯格在最新财报会议上,以一种近乎宿命般的口吻宣布「我们必须加快进程」,并承诺在 2026 年大幅扩大资本支出时,华尔街仿佛听见了一声熟悉而刺耳的警报。

这一幕似曾相识。就在几年前,他也曾如此孤注一掷,在 Connect 大会上宣布将整个公司的命运押注于「元宇宙」,不仅将 Facebook 更名为 Meta,更是每年投入上百亿美元填向 Reality Labs。两年过去,结果是:股价持续探底,投资者信心降至冰点。

如今,剧本几乎未变,只是主角从「元宇宙」换成了「AGI 数据基建」。巨额资本支出承诺一出,Meta 股价再次应声暴跌,市值瞬间蒸发千亿美元。而与此同时,微软股价仅微跌约 3%,亚马逊和谷歌甚至因上调支出预期而股价上扬。在同行不同市场反应的映衬下,Meta 的处境更显被动。

事实上,自扎克伯格宣布全面转向 AI 以来,Meta 的股价便陷入了周期性剧烈震荡。这个昔日的社交巨头,正陷入一场缓慢而痛苦的拉锯战:一边是扎克伯格想要快速抵达他所坚信的未来,一边是对「画饼」失去信心的投资者们。

MetaAI 基建数据中心|图片来源:路透社

单从营收表现来看,Meta 本季度交出了一份相当亮眼的成绩单。

2025 年第三季度财报显示,公司营收达到 512 亿美元,同比增长 26%,创下历史新高,增长主要得益于广告业务的强劲拉动。更值得关注的是,Instagram 在广告收入增速上首次超越 Facebook,显示出 Meta 社交广告矩阵正从「一枝独秀」走向「多点共振」。此外,Meta 预计 2025 年其在美国的社交广告收入将进一步提升至 789 亿美元。

这一增长背后,AI 驱动的广告平台 Advantage+发挥了核心作用。作为 Meta AI 技术落地的重要载体,Advantage+实现了从广告创建、投放到管理的全流程自动化,不仅能实时诊断投放问题,还可提供精准的优化建议,从而充分释放广告创意的潜力。

为进一步提升转化效率,Meta 也在持续优化品牌转化效率,例如推出「一键直达品牌私信」等功能,大幅简化用户导流路径。可以说,在现有社交广告的玩法体系中,Meta 已将广告投流效果挖掘到相对极致。

数据也印证了 AI 投入的回报:2025 年第二季度,AI 推荐系统的改进使 Facebook 和 Instagram 用户使用时长分别提升 7% 和 6%;而由 AI 驱动的视频推荐系统 Reels,带动视频观看时长同比增长超过 20%,显著提升了广告曝光量。

但站在 512 亿美元营收增长对面的是,Meta 今年第三次上调增长预期,第三季度资本支出指引已升至 660–720 亿美元,主要用于 AGI 数据中心集群的建设以及 AI 人才的变动。

Amazon、Meta、谷歌、微软预计的资本支出|图片来源:The Information

目前,Meta 首座 AI 数据集群「普罗米修斯」计划于 2026 年在俄亥俄州投入使用,预计将提供至少 1GW 的计算能力。

但正是这类不断膨胀的基建野心,加剧了投资者的忧虑:市场开始质疑,如此庞大的资本投入,是否真能转化为与之匹配的营收增长?Meta 是否真有能力将 AI 基础设施变成一门「好生意」?

与此同时,组织层面的震荡同样令人不安。在经历上一轮重金招揽 AI 人才之后,Meta 近期再度启动组织架构调整,裁员约 600 人,波及 FAIR 前沿研究团队及 AI 基础研究院。这种频繁的团队重组,不禁让外界怀疑:Meta 内部是否已想清楚如何将 AI 与现有业务有效融合?动荡的组织架构,又能否持续支撑真正的技术突破?

在这些不确定因素笼罩下,Meta 的 Llama 模型发展也显得前景不明,难以在短期内看到显著成效。尤其是最新一代开源模型 Llama 3 虽然在开发者社区中获得了一定的采用率,但在多项关键能力的基准测试中,其表现仍显著落后于 OpenAI 的 GPT-4o、谷歌的 Gemini 2.0 等闭源领头羊,甚至在代码生成、复杂推理等高端应用场景中,与同类顶尖开源模型相比也未能建立起明显优势。

而压垮投资者信任的最后一根稻草,或许来自管理层在财报会议上的模糊表态。当被多次问及 AI 与公司未来战略的具体结合路径时,扎克伯格与首席财务官 Susan Li 均未给出清晰回应,反而一再强调「资本支出还将继续上调」。这种只谈投入、不谈路径的沟通方式,无疑进一步动摇了市场对 Meta 战略执行力的信心。

 

三、不做 AI 基建,Meta 行吗?

股价暴跌的另一大原因是,不少投资者很难理解 Meta 为何如此执着于 AI 基建:因为它既没有像微软 Azure 或谷歌云那样的云业务来承接和分摊巨额投入,也缺乏清晰的路径将 AI 能力转化为实际收入。Meta 的现金流也并非充裕到可以无视投资回报率的程度。

那么,Meta 为何仍要孤注一掷?从现有的公开信息可以推测主要原因有三:

第一,争夺「入口定义权」。AI 正在重塑人机交互的范式,未来我们可能不再需要无数独立 App,而是通过一个或几个超级 AI 入口来调度一切。届时,内容与服务的分发权力将高度集中。如果 Meta 放弃自研通用大模型,就等于将下一个时代的「入场券」拱手让给 OpenAI、谷歌和微软——这无异于重蹈移动互联网时代被应用商店「抽成」的覆辙。显然,扎克伯格不愿再犯同样的错误。

第二,延续其「元宇宙」的终极愿景。无论是构建一个开放的虚拟世界,还是打造标志性的元宇宙体验,都极度依赖强大的通用 AI 模型和背后的算力基础设施。从将 Facebook 更名为 Meta 的那一刻起,扎克伯格就已将公司的命运押注于这个未来,而 AI 基建是其不可或缺的基石。

第三,为其硬件战略铺路。自 2014 年收购 Oculus 以来,Meta 在硬件上的探索从未停止。从 Quest Pro 到智能眼镜 Ray-Ban Meta,再到研发中的 AR 眼镜 Orion,其目标始终是在下一代人机交互设备中占据一席之地。在 AI 定义硬件的时代,拥有一个能跨设备调用的自有大模型,已成为其硬件战略能否成功的必要条件。

可以清晰地看到,与谷歌、微软利用 AI 来增强现有业务并平稳过渡到下一个时代不同,Meta 的豪赌,是为了赢得一张通往新时代的「入场券」,一个拥有更多可能性的未来。

Amazon、Meta、谷歌、微软预计的现金流|图片来源:The Information

然而,这场豪赌的成本极其高昂,尤其是目前 AI 基建的利润正大规模流向上游,英伟达、台积电等芯片巨头接住了大部分订单,而模型厂商则背负着沉重的采购与运营成本。更严峻的是,技术迭代的速度远超以往:云服务商芯片的寿命正从 5-6 年缩短至可能仅剩 3 年,数据中心技术也可能在 5 年内过时,这意味着天价基建投资面临着极高的贬值风险。

在芯片吞噬大部分利润、算力仍显不足的背景下,巨额的资金投入能否换来可持续的盈利,成了一个巨大的问号。

正因预见到这一点,科技巨头们正积极从别处开拓利润。无论是 B 端的企业服务,还是 C 端的订阅应用,现有的模型厂商们都希望通吃市场,以支撑前期研发投入。Meta 之所以同时押注大模型与 XR 硬件,或许也正是为了开辟多元化的业务线,来为这场关乎未来的生存之战输血。

 

四、转型之路,为何Meta走的困难重重?

当一家科技公司成长为巨头,转型的阵痛几乎成为必然的命运分水岭。顺利者如谷歌与英伟达,总能在技术浪潮转折处精准卡位,乘势而上;曲折者如微软与英特尔,则往往需经历几番试错与重构,才找到通往新增长的道路。

作为万亿美元市值俱乐部中最年轻的成员,Meta 的成长路径曾被视为典范—,凭借强大的社交网络效应与全球人口红利,它在数字广告的黄金时代实现了爆发式增长。然而,也正是这份「年轻」,使其在判断转型时机与规划路径方面,显露出与成熟巨头之间的差距。

尤其当 Meta 在短短四年内接连启动两次重大战略转向,从「元宇宙」到「AGI 基建」,市场看到的是创始人敢于颠覆自我的勇气,却也暴露出其在战略连贯性与业务协同上的思考不足。投资者与内部团队都难以看清一条清晰可信的增长曲线,反而目睹公司在多个产业尚处早期阶段时,便以巨额投入押注一个难以量化的未来。

可以说,扎克伯格始终在积极探索未来的各种可能性,但 Meta 整体仍处于一家「年轻公司」的成长探索期——敢试错,却也易摇摆。而通往通用人工智能(AGI)的征途,注定不是一场短时决战,而是一场关乎耐力、资金与信念的长期战争。

在这场战争中,Meta 最需要赢得的,或许不是技术突破,而是投资者的信任。在愿景尚未转化为营收、投入仍不断加码的当下,说服市场继续保持耐心,将极度依赖创始人个人的信誉与说服力,这将是扎克伯格作为领导者面临的最大考验。

 

小鹏科技日「太魔幻」:机器人走猫步,飞行汽车接近量产

2025年11月13日 16:26

11月5日,小鹏举办了它的第七个小鹏科技日,如果要用一个字来总结我的感受,那一定是——「新」。

熟悉小鹏的朋友都知道,他们是汽车圈里最早举办「科技日」的。过去六年,我们听何小鹏聊过自动驾驶,也见识过飞行汽车、智能机器人,还有解决里程焦虑的超级增程。

而今年的「新」,来得更有仪式感。

这种感觉,从踏入小鹏新总部的那一刻就开始了。就在上个月(10月21日),小鹏刚刚搬进了位于广州天河区的新家。这次,小鹏更是贴心地为每个参会者都制作了专属工牌,可以在新总部里体验、打卡。这也让这场科技日更像是一场邀请新老朋友参加的「乔迁派对」。

作为科技日,当然得讲些硬核内容。发布会上,何小鹏宣告小鹏汽车进化为「面向全球的具身智能公司」,并一口气亮出了四大成果:小鹏第二代VLA、小鹏Robotaxi、全新一代IRON,以及汇天两套飞行体系。从地面到天空,从个人出行到公共服务,小鹏用这四张牌,诠释了它理解的「物理AI」。

最后,还有一个细节变化让我印象深刻。以往的群访环节,基本都是中文媒体的「主场」。但这次走进采访间,我惊讶地发现,现场几乎一半都是外媒记者。你能清晰地感受到,小鹏正吸引着全世界的目光。

一场偶然的技术跃迁

从2024年开始,VLA就成为了辅助驾驶行业的热词。甚至有人认为,它是通向自动驾驶的最终路线。

不过,VLA的一些不足也暴露出来,比如标准 VLA 普遍需要 Vision-Language-Action 两次转换语言作为中间转译环节,会导致丢失大量视觉细节,决策依据不充分。比如丢失车辆微妙动态(车轮微微左打),路面材质细微变化等;同时,这也会增加额外的转译时间,导致推理延迟,智能驾驶的反应速度降低。

小鹏汽车也意识到了这些问题,他们内部也在思考:「我们能不能拆掉『Language』这个中间环节?」这是一个大胆,甚至有些「离经叛道」的想法。

最终,小鹏做出了一个决定,并行研发两套方案。一套沿用主流路线,保障现有功能的迭代和用户体验的底线;另一套则作为「秘密武器」,去探索那个去掉语言转译,实现「视觉→行为」直接感知的技术上限。

在很长一段时间里,这个「秘密项目」几乎没有任何看得见的成果。时间来到2025年第二季度,小鹏内部一场重要的高管会即将召开。据何小鹏说,当时秘密项目的负责人甚至有些不好意思参加,因为他手里没有能拿得出手的进展。

小鹏的第二代VLA,去掉了「语言转译」环节 | 图片来源:小鹏汽车

就在会议的前一天,测试场上传来消息——一个巨大的技术跃迁有些偶然地出现了。它不是某个单一场景的优化,而是像推倒了第一块多米诺骨牌,一整片之前无法攻克的复杂场景,突然间全部「解锁」了。同时,这套新方案下的驾驶体验,非常地「丝滑」。

据了解,小鹏汽车即将发布的「小路NGP」功能,会显著提升复杂小路与混行环境下的智驾表现。

同时,小鹏第二代VLA还涌现出全新能力。何小鹏分享了几个细节:在红绿灯路口,当红灯还剩最后三四秒时,测试车辆会像一个经验丰富的老司机一样,开始非常轻微地向前「蠕动」,为绿灯亮起后的第一时间起步做好准备;此外,系统还似乎学会了「读懂」人类的身体语言,能够识别招手即停的手势。

那么,小鹏究竟是如何做到的? 何小鹏表示,他们并没有粗暴地「去掉L(语言)」,而是进行了一次巧妙的「升维」。团队没有将复杂的视觉信息强行「降维」翻译成人类的语言,而是反其道而行之,为机器创造了一种描述物理世界的「新语言」。你可以将其理解为一种物理世界的「机器母语」。它并非人类可见、可直接认知的文字,但它的信息密度和传输效率远超人类语言。

更关键的是,这个过程并非一个无法解释的「黑盒」。何小鹏强调,这种新语言的中间过程是可以被解码(decoding)的。工程师可以回溯和推导出模型每一步的决策逻辑,比如「系统为什么判断应该向左,但最终没有执行」,从而优化和迭代。

「涌现」的背后,当然离不开海量数据的喂养。何小鹏透露,目前使用的训练数据规模已接近1亿clips。这相当于人类司机驾驶65,000年才能遇到的极限场景总和。这个数据的价值是长尾场景/极限场景的数据,而不是普通的驾驶场景数据。

据了解,2025年12月底,小鹏汽车将邀请先锋用户共创体验第二代VLA,2026年第一季度将面向小鹏Ultra车型全量推送第二代VLA。

机器人不进厂,走起了「猫步」

除了技术硬核突破,小鹏的发布会,总能给你一些意想不到的惊喜。

当一位身形优雅的「女士」走上舞台,迈着堪比超模的猫步,脚步也非常轻盈,全场都惊呆了。很多人都在猜,这到底是哪位演员,道具服做得也太逼真了吧?

发布会后,小鹏机器人拟人化的表现引发了是否是真人的讨论 | 图片来源:小鹏汽车

这其实并不是人,而是小鹏新一代的人形机器人——IRON。它的目标,就是要做「最像人」的机器人。

为了实现这种极致的「拟人感」,小鹏在IRON身上下了血本:全身拥有82个自由度,其仿人脊椎、仿生肌肉、全包覆柔性皮肤的设计,让它的身段和动作无比灵活、自然。甚至连它的头部,都采用了3D曲面屏来模拟更丰富的表情和信息交互。

最受关注的,还是那双灵巧手上。IRON的手拥有22个自由度,通过采用行业最小的「谐波关节」,这让它拥有了与人类近似的抓握和能力。

你可能会想,这么厉害的机器人,是不是要去工厂「打螺丝」或者包揽家务?

小鹏的答案是:不。IRON的目标,是成为我们身边最拟人的伙伴。未来,它会率先出现在展厅、门店等场景,担任导览、导购或者前台接待,用最接近真人的方式与你互动。

更值得一提的是,为了让这位「新员工」更轻盈、更安全,小鹏还为它配备了全新的全固态电池。

除了机器人IRON,小鹏还扔出了一个重磅消息:2026年,他们要推出三款Robotaxi车型,并正式启动试运营。

听到这,你可能会觉得奇怪。毕竟,Robotaxi这条赛道早已挤满了先行者——萝卜快跑的车队都上千辆了,小马智行和文远知行也在后面猛追。小鹏现在才入局,是不是有点晚了?

但何小鹏给出的答案是:他们不仅要来,还要用一种全新的姿态来。

除了前装、不依赖激光雷达和高精地图、可不限城市、区域等特点外,小鹏的工程师们脑洞大开,把前排的遮阳板变成了「沟通窗口」。当Robotaxi低速行驶时,前排的两块遮阳板会翻下来,变成两块显示屏,用最直观的方式告诉周围的行人:「我现在时速5公里」,或者「您先请」。

这个小设计,拉近了车与人之间的距离,让周围的人不再对这个「黑科技铁盒」感到陌生和恐惧。未来,它还会加上语音,真正实现与外界的无障碍沟通。

在何小鹏的蓝图里,未来的无人驾驶会走向两个方向:一种是全共享模式:就是我们说的Robotaxi,招手即停,随叫随到;另一种是全私享模式:你自己的车,但拥有和Robotaxi同等级别的L4级智驾体验。

在小鹏的设想里,未来你的私家车也可以实现无人驾驶 | 图片来源:小鹏汽车

所以,小鹏在推出Robotaxi的同时,还会给个人用户带来一个全新的智驾版本——「Robo」。它和Robotaxi拥有完全相同的硬件、安全冗余和智驾能力。简单说,小鹏把最顶尖的技术,同时赋能给了共享出行和私人车主。

「我们的逻辑不只是技术先行。所有的思考,都围绕着商业价值、用户价值和技术拐点,最终要让政府和社会都能接受。」何小鹏在发布会上说得很实在。外界看来,小鹏又是造车,又是搞机器人,现在又大举进军Robotaxi,战线拉得太长。但实际上,这背后是一盘精打细算的棋。

人形机器人、汽车、Robotaxi……这些看似不相关的产品,技术底层是相通的,可以平摊巨大的研发和硬件(BOM)成本。何小鹏自信地表示,「我们在这方面比其他公司天然拥有百分之几十的优势。」

更聪明的,是他们的运营模式。小鹏不想在每个城市都自建团队,当一个「重资产」的运营商。他们选择做「工具箱」——把具备全球通行能力的Robotaxi车辆和技术开放出来,交给各个国家和地区的合作伙伴去运营。

这是一种轻资产、高效率的打法。它让小鹏能避开繁重的本地化运营,把精力聚焦在自己最擅长的事上——智能制造和AI,并把它们发挥到极致。

别再叫它车企,小鹏的终局是「物理AI」

如果你以为小鹏的机器人和Robotaxi就已经是全部王牌,那可就太小看他们了。

发布会的压轴大戏,永远留给那个最能点燃全场想象力的部分——飞行汽车。这一次,小鹏汇天直接甩出了两张截然不同的牌。

首先登场的,是代号「A868」的大家伙。当它的图片出现在大屏幕上时,全场都安静了。它不是简单的「无人机放大版」,而是一款采用高效「全倾转」构型的飞行器。简单来说,它既能像直升机一样垂直起降,又能像固定翼飞机一样高速巡航。

更猛的是它的「心脏」。小鹏把自家成熟的「鲲鹏」超级增程技术,塞进了一颗航空级混电内核里。这让「A868」拥有了足以叫板地面交通的续航——航程长达500公里,最高时速更是飙到360公里/小时!未来从深圳飞到广州,可能连半小时都用不了。

目前,这个「未来猛兽」已经正式进入了飞行验证阶段,离我们又近了一步。

除了A868,发布会上的另一款分体式飞行汽车——「陆地航母」,已站在了量产的大门前。这款产品全球累计订单已经突破7000台。

为了让更多人都能实现飞行梦,小鹏汇天几乎是把「用户体验」做到了极致。他们把复杂的飞机驾驶杆,简化成了类似游戏手柄的「单杆」操作。一块屏幕加上一个操作杆,就能实现单手飞行自由。这意味着,你不需要成为专业的飞行员,只要经过简单培训,就能轻松驾驭它。

小鹏的最终目的,是要实现物理AI | 图片来源:小鹏汽车

说实话,刚看完第七届小鹏科技日,我脑子里冒出的第一个念头是:这摊子是不是铺得太大了?

从智能汽车到飞行汽车,从公共出行的Robotaxi到走进家庭的人形机器人……当这些产品一股脑儿地出现在发布会上时,相信很多人和我一样,心里会画上一个巨大的问号:小鹏的边界到底在哪?这会分散小鹏的精力吗?

但冷静下来,把小鹏这几年干的事儿串起来一琢磨,我突然有点想明白了。第二代VLA、Robotaxi、机器人、飞行汽车,小鹏其实只为一件事:物理AI。

这么一看,小鹏未来十年的蓝图就清晰多了。小鹏想做的,根本不是一个个孤立的产品,而是一个宏大的「物理世界的AI操作系统」。

在这个系统里,我们现在开的智能汽车,就是第一个,也是最成熟的App。而飞行汽车和人形机器人呢?就是即将在这个「应用商店」里上架的新应用。最终的目标是什么?就是让AI驱动的这些「智能体」,能在地上跑,也能在天上飞,无缝地进入我们的生活。

所以,这场在小鹏新总部的「乔迁派对」,它庆祝的不仅是搬了新家,更是小鹏在成立十年这个节点上,一次深刻的自我进化。它不再仅仅是一个「智能汽车公司」了,而是摇身一变,成了一个「具身智能公司」。

这不只是何小鹏给小鹏画的下一个十年大饼,它可能预示着一个更大的趋势——人工智能的下一个主战场来了。

数字世界里的AI,正在加速「长出身体」,走进我们真实的生活,去开车、去飞行、去做家务……一个由AI定义的物理新世界,真的离我们不远了。

深度复盘:大疆是如何成为影像领域新巨头的?

2025年11月12日 12:49

上一个十年里,对于这个星球上的很多人来讲,大疆(DJI)这个名字,就是无人机的同义词。

但在今天,这个认知需要被改写了。很多人已经开始逐渐意识到,大疆已经远远超越了无人机这一个标签。而在影像领域开始成为新一代的巨头。

这不仅仅体现在已经产生超千万台销量的大疆 Pocket 3 这种震惊行业的爆款产品上。一度被很多人忽视的是,在运动相机这个曾被 GoPro 铁腕统治的领域,大疆已经悄然完成了一场「权力更迭」。

据之前国内媒体引用行业咨询机构久谦的数据,到 2025 年第三季度,大疆 Action 系列运动相机的全球市场份额已经悄无声息地攀升至 66%,取代 GoPro 成为全球第一。曾经的王者 GoPro——这位 10 年前同样让品牌名成为硬件品类代名词的公司,市场份额则萎缩至 18%。

 

大疆 OSMO360 全景相机 | 图片来源:大疆官网

 

这看起来还不是终点,如果说在运动相机市场过去时间大疆和 GoPro 之间是一场历时 10 年,步步为营的「阵地战」,那么大疆最近进军全景相机领域的过程,更像是一场「闪电战」。2025 年 7 月 31 日,大疆发布首款全景相机 OSMO360,同样来自行业咨询机构久谦的数据声称,用了不到 90 天的时间,大疆就拿下全球 43% 的市场份额,在中国主流电商渠道的份额更是高达 49%。目前在京东的「全景相机」热销榜上,它也确实超过 60 天横霸第一。

当把这些信号汇聚到一起,对于大疆的认知也确实需要与时俱进了:曾经那个「做无人机天下无敌的」大疆,正在变成一个在影像领域全线布局,并且每进入一个赛道就能掀起一场风暴的巨头。

过去是无人机,现在是手持云台、运动相机、全景相机……人们不禁要问,大疆为什么可以有能力「无限扩展边界」,这种能力是怎么来的?

01

到底什么是大疆的「底层技术栈」

 

要读懂大疆今天在地面上的故事,我们必须把时间拨回到这个公司的起点。

因为在无人机领域的统治级地位,许多人以为大疆的技术基因在于「飞行」。然而,这可能是对大疆最大的「误会」。大疆虽然在最早期的立身之本确实是「飞控」技术,但是从其真正下决心进军无人机产品的时候,就已经想的很清楚——因为那时候大疆在无人机领域解决的本质问题,是创造出会飞的相机。

所以除了「如何飞起来」,对大疆要开拓的新战场而言,更重要的还有「如何实现稳定的空中影像」。

在当年划时代的精灵 Phantom 系列无人机问世前,航拍是极少数专业人士和硬核航模爱好者的专利。他们需要自己购买飞控模块、图传系统,再费尽心思将一台 GoPro 用各种减震球和扎带固定在笨重的多轴飞行器上。最终得到的画面,往往也伴随着高频的「果冻」抖动,距离电影质感相去甚远。

 

如今回看很多技术在当时都具有划时代意义的大疆精灵系列 | 图片来源:大疆官网

 

那时候的飞行,每次都是用户的一次飞行冒险,而非影像创作。大疆在这个阶段带来的革命性体验在于,它第一次将飞行器、飞控、图传和最重要的一体化的三轴无刷云台,整合成一个到手即飞的完整产品。那个悬挂在无人机下方的云台,看似不起眼,却成为大疆影像帝国的基石。它通过高精度的陀螺仪和电机,以每秒数千次的频率反向补偿机身的抖动,让摄像头在剧烈的空中运动中始终保持水平和稳定。

正是飞控提供的精准姿态数据,和云台增稳提供的机械稳定能力,从一开始就为大疆注入了深厚的「影像」与「稳定」双重基因。这构成了大疆所有后续产品的第一个、也是最核心的技术栈。

天空,只是它验证这套技术逻辑的第一个,也是最广阔的试验场。一旦能力被证实,将其从空中延伸至地面,就只是一个时间问题。

其实大疆在手持影像领域的起点,并没有直接瞄准大众消费市场,而是先从专业领域切入。把从无人机云台上拆分下来的增稳技术,摇身一变,成了专业电影摄影师手中的如影系列稳定器 Ronin。它首先在对稳定性和可靠性要求最高的专业市场,树立起大疆的技术权威。

 

大疆在如影系列手持稳定器开发过程中积累了众多专业用户反馈 | 图片来源:大疆官网

 

那时候,当电影制作团队开始普遍使用 Ronin 来替代传统的斯坦尼康时,大疆在「稳定」这件事上的话语权已不言而喻。而凭借专业领域的背书,大疆开始将这套昂贵、复杂的技术,一步步小型化、消费化,开启了它在地面影像市场的系统性扩张。

02

以「小场景」的极致产品,

重塑「大习惯」

 

在大疆从专业市场到消费市场的系统扩张中,Pocket 系列无疑是最亮眼的那颗明珠。

在 Osmo Pocket 出现之前,人们想要获得稳定的地面运动镜头,主流方案是给手机装上一个手持云台。这种组合虽然有效,但体积庞大、操作繁琐,每次拍摄前都需要调平,极大地扼杀了普通人的创作冲动。

在当时的市场上,之所以没有在这个需求上诞生足够好的消费级产品,很大一部分原因是来自于这个需要稳拍的需求,似乎在消费领域看来不那么大。所以虽然出现了很多给手机用的手持云台类的产品,但是没有人真正做更极致的产品思考,这个看起来「不是通用场景的小需求」,只有大疆真的「较真儿」了。

大疆给的答案,创造了一个全新的物种:一体化手持云台相机。它将一个微型的三轴机械云台和一颗素质不错的摄像头,集成在了一个口红大小的机身里。这种极致的便携性和开机即用的易用性,瞬间引爆了 Vlog 市场。它完美地解决了手机「拍得到」但「拍不稳」的痛点,成为了无数内容创作者口中的「Vlog 神器」。

初代 Pocket 是品类的开创,但是它也进一步验证了大疆的核心技术栈绝对不止是「飞行」。实际上正是在「飞行相机」这个看起来当年更小众、也更高难度的目标上「持续较真」所积累的技术栈和方法论,给予了在口袋相机这条产品线上巨大的「世界观」竞争力——需求小很可能来自于供给不到位,用足够极致的产品,完全可以从他人眼里的边缘场景,创造出更大的需求,甚至定义新的产品形态。

这是一种不同的世界观,但更重要的是要持续迭代更好的产品的方法论,这个方法论就是要持续拉高产品的能力和用户价值。

无论是无人机还是口袋相机,大疆的成功都不是来自于产品定义上的「敢想敢干」,而是真的在技术和用户价值上「干到极致」。比如 2023 年发布的 Pocket 3,用一块「一英寸」的大底传感器实现了画质的跃升,用一块巧妙的旋转屏解决了开关机和构图的易用性痛点。结果就是,Pocket 3 成为了现象级的「电子茅台」,如今在小红书上相关的分享笔记超过 20 万篇,不仅长期处于一机难求的溢价状态,更是在对产品品质极为挑剔的日本市场,连续 11 个月蝉联摄像机品类的销量冠军,累计市占率一度高达 24.3%。

 

对产品定义打磨到极致就是使用体验趋近于完美的产品 | 图片来源:大疆

经过几次迭代后,它真正是实现了手持影像设备的「iPhone 时刻」,甚至成了「如果出去旅游就带一个设备就带 Pocket」的用户心智。一个从「小场景、小需求」出发的产品,生生被大疆变成了一个「通用场景、大需求」的品类。

03

「一技贯之」突破层层边界

 

无论是「飞行相机」、「专业稳拍」还是「口袋相机」的连续成功定义整个赛道的故事,如果我们从中提取共性,很清晰地看到是大疆将「稳定」、「画质」和「极致易用性」这三者融合到极致的成果,这大概率就是其技术中台的最核心能力。

有意思的是,在运动相机这一战场,大疆面对的是一个「后来者」的局面。但看起来这种「一技贯穿」的能力依旧在有效的扩展边界中发挥作用。只不过这次变成了「阵地战」。

长期以来,GoPro 不仅是运动相机的开创者,更是这个品类的代名词。直到 2022 年,GoPro 依然手握全球超过 75% 的市场份额,地位看似坚不可摧。

然而大疆 Action 系列的到来,正在开始悄然改写剧本。客观地看,大疆前两代 Osmo Action 没有一上来就「重新定义产品」,更像是对市场的试水。到了 Action 3 和 Action 4,大疆才开始对用户最真实的痛点逐个击破:例如 GoPro 用户常年抱怨的电池续航短、机身易过热、配件拆装繁琐等问题。同时,大疆一步步从后来者到领先者的超车,还是离不开其将看家本领——防抖算法,发挥到了极致。

大疆超强增稳和地平线增稳技术,本质上就是无人机云台增稳算法的软件化复用,提供了顶级的画面稳定性。再结合与自家 DJI Mic 无线麦克风的生态联动,以及多场景相同技术栈和供应链带来的规模优势,带来了更具竞争力的定价。大疆就这样用几年时间硬生生地在 GoPro 定义的成熟市场里,撕开了一道口子,并最终实现了市场份额的反超。颠覆旧有的市场格局。

从这个视角看,OSMO360 全景相机虽然相对运动相机赛道的阵地战,更像是一次「闪电战」,但本质上大疆还是在「一技贯之」的在扩展更大的场景和品类边界。

比如业界普遍评论 OSMO360 在产品交付体验上几乎没有走任何弯路,这说明大疆在运动相机的阵地战上积累的能力,又被进一步复用了。第一代产品就直接将大疆已经高度成熟的影像处理技术、防抖算法和色彩科学,打包注入到一个成熟的产品形态中。这本质上是大疆又一次「技术溢出」。

 

大疆 OSMO360 | 图片来源:极客公园

 

这块「边界」的迅速扩展背后,还是源于大疆已经搭建起一个足够强大的「技术中台」,无论前端的产品形态是无人机、云台相机还是全景相机,底层的核心技术都可以被快速调用和复用。

这背后,是大疆对用户在传统拍摄形态下,对「稳定便携」与「高画质」这两个核心需求长达十余年的洞察和「熬制」。

现在,我们可以回到最初的那个问题:大疆是怎么从无人机这样一个独特品类的王者,成为了影像领域的新巨头的?

答案就藏在「影像技术中台」这个看似行业黑话的合成词里。

大疆耗费十几年时间,备好了几道最顶级的「技术栈」:飞控与增稳、视觉处理与算法、影像美学与色彩科学。当需要推出一款新产品时,它无需从零开始,可以「一技贯穿」。

这条技术复用的脉络如今看来也非常清晰:那套让无人机在空中稳如磐石的云台增稳技术,是所有故事的起点。

它先是被完整地搬到地面,成为如影 Ronin 专业级手持稳定器;接着被小型化,塞进了 Osmo Mobile 手机云台和 Pocket 一体化云台相机里;最后,它的核心算法被提炼出来,化身为 Action 系列运动相机里强大的电子防抖。这一系列手持影像设备的经验,最终也都浓缩灌注进了 OSMO360 之中,这是一条从硬件到软件,从专业到消费的完整进化链。

同样的故事也发生在视觉处理与算法上。那套最初为无人机安全飞行而开发的视觉避障系统,其核心的识别与追踪能力,经过优化,被完美地移植到了地面产品上。于是,我们就有了备受好评的智能跟随功能。无论是在 Pocket、Action 还是 360 相机上,用户只需在屏幕上框选一个目标,相机就能像一位经验丰富的摄影师一样,牢牢锁定并流畅跟随。这项功能,源于对空中安全的极致追求,最终却在地面影像创作上开花结果。

影像美学与色彩科学则是更高维度的复利。通过多年为 Mavic 系列无人机研发图像处理芯片和色彩调校方案,大疆内部已经沉淀了一套独特且成熟的影像美学风格。这种被称为「DJI Color」的色彩科学,被成功地应用到了 Pocket 3 和 Action 4 等新一代产品上,使其直出画面具有非常讨喜的质感和色彩表现,形成了核心的画质竞争力。

这种「一个中台,N 种产品」的模式,让大疆在进入任何一个新领域时,都像带着一套成熟的武器库。这种模式极大地降低了试错成本,缩短了研发周期,并且能确保每一款新产品在面市之初,就具备了来自技术中台的核心竞争优势。这才是大疆最深、最宽的护城河。

04

源于偏执,成于审美

 

如果说技术中台是「术」,那么驱动这一切、真正让大疆成为那个能够一次次交付极致产品的,还应该有所谓的「道」。

在这些可以依据大疆产品历程反向拆解的方法论之外,还有一个不能被忽视的关键因素。

大疆是一家典型的技术与产品驱动型公司。在大疆内部,直到今天还能保持一种近乎偏执的工程师文化,可能是即便我们把其方法论都进行拆解后,我们依旧无法拆解和复制的「原生性格」。

这种文化决定了大疆善于用压倒性的技术和对体验的极致设计,去「定义」一个全新的品类,或者去颠覆一个存在很久的品类。

这种哲学体现在产品的每一个细节里。无论是机身材质的打磨、磁吸接口「咔哒」一声的清脆回馈,还是软件 UI 的交互逻辑,大疆的产品总是透着一股对质感、对美学、对易用性的偏执。也正是这种超越了参数表的极致追求,使其产品在传统的「直男」极客圈层之外,成功地「破圈」,吸引了大量原本对复杂数码产品望而却步的女性用户和泛生活记录者。

最终,这种产品哲学在市场上形成了强大的生态协同效应:一个典型的视频创作者他可能会用一台 Mavic 无人机进行航拍,用 Pocket 3 记录日常,用 Action 4 应对极限场景,再用一个 DJI Mic 无线麦克风来保证清晰的收音。

所有这些设备,都共享着同一套设计语言、操控逻辑和色彩风格,并通过 DJI Mimo 这一个 App 进行管理和剪辑。大疆正在为用户构建一个轻量化、智能化、高度协同的影像拍摄「全家桶」,这又形成了另一道强大的生态护城河。

当大疆从无人机王者,逐渐成为了影像巨头,这段历程是一个非常值得深入研究的中国科技公司案例。

除了大疆在市场上的成就,值得我们尊重,更重要的是它确实是在给中国新一代科技公司,留下了一个依靠技术和产品,从「有限游戏」走向「无限游戏」的新脚本。

对话元理智能张帆:为什么「商业强化学习」,才是 AI To B 的新出路

2025年11月12日 16:45

如何将技术实力转化为可持续的商业模式,这是摆在整个大模型行业面前的集体命题,更是对每一个参与者的现实拷问。

若要理解这道考题的深度与难度,或许没有比张帆更合适的躬身入局者。作为智谱 AI 前 COO,他不仅亲历了中国大模型从「百模大战」到落地为王的完整周期,更是在 To B 领域主导完成了数亿元规模的项目落地,积累了扎实且丰富的大模型商业化闭环经验。

但张帆的视野从未局限于当下。早在十余年前,他就选择投身第一波 AGI 浪潮,此后十年持续深耕 AI 与产业结合之路。正是这份独特的经历,让他在 2025 年选择卸任智谱 AI COO、创立元理智能时,行业关注的不是「他遇到了什么困境」,而是「他看到了什么未来」。

他创办的新公司元理智能,不再计划做大模型的「布道者」或「应用商」,而是转向更艰难、但价值更广阔的命题:如何将基础智能转化为企业的核心生产力?如何在模型算力难以指数级扩张的前提下,通过「商业强化学习」、「模型性理解」,实现生产力的千倍提升?

正如极客公园创始人&总裁张鹏所言,张帆探索的 To B 新路径,关键不在于追求智能的绝对高度,而在于跳出原有思维框架,通过合成数据启动一个能「光速进化」的商业强化学习——只有这种学习路径,才能解决过去无法解决的问题。

带着对 AI 时代变革的洞察与对不同市场的思考,元理智能创始人张帆与张鹏展开了一场坦诚对话。不仅是对过去两年喧嚣产业的总结,更是对未来 AI 商业化新范式的坚定选择。

对话精华要点:

  • 客户提问的变化折射出市场演进:从早期的「为什么不用开源」,到中期的「数据安全」,再到如今的「业务指标怎么提升」,这三个问题见证了 AI 技术从尝鲜走向实用。
  • 搭建知识库或问答系统绝不等于实现业务价值。真正的 AI 化要用 AI 特性重构业务逻辑,否则就只是「应用 AI 工具的公司」。
  • AI 革命类似电力革命:电力延伸人类体力,AI 延伸人类智力,二者形成对称关系。用电力时代类比,电力的最大受益者不是发电厂,而是整个工业化进程。AI 同样是杠杆,其最大价值在于嵌入物理世界实现转化。
  • 当所有人一致看好达成「共识」时,反而更容易陷入非理性状态,回归第一性原理的思考很关键。比如说,人们总是认为 C 端比 B 端更有价值是基于归纳法,但现在市场规则已变,To C 更具竞争,To B 机遇会更大。
  • 元理智能的使命是为企业建立「模型大学」,培养具有行业特质的智能专家,打造企业需要能够干预模型,将行业知识沉淀和环境特征映射到智能体中,构建解决自身问题的专属 Agent。
  • 想要让 AI 更好融入到企业中,仅理解系统架构不够,必须把握「模型人格」特性,包括幻觉。要想在模型规模不显著增加的前提下实现生产力跃升,核心靠强化学习,特别是「商业强化学习」。
  • 企业竞争本质是创始人认知的竞争。我们有一套标准方法论,可以帮助企业以 70-80 分的水平启动 AI 转型。

元理智能创始人、CEO张帆 | 图片来源:元理智能

以下是极客公园创始人张鹏与元理智能创始人、CEO 张帆的对话,经编辑整理。

 

一、大模型落地成情绪价值?AI是生产要素

张鹏: 2023 年加入智谱时,你对产业环境的观察,与你现在出来创业重新评估环境时相比,你觉得最大变化是什么?

张帆:与其说是变化,不如说是一种使命的召唤。我过去十年专注于 AI 与产业的结合,但直到 2022 年底看到 ChatGPT,作为自然语言处理专业出身的我,立刻意识到这次技术颠覆性与以往完全不同。

当时智谱的首席战略官张阔找到我,他之前是搜狗搜索首席科学家,也是我在搜狗时期的老板。虽然当时智谱的模型尚未商业化,但看到 Demo 时,我意识到这是一个新大陆。我当场就决定将公司整体并入智谱,非常决绝,共同推进大模型的商业化。

过去无论是做 NLP 还是类 Siri 产品,我都非常渴望让机器像人一样完成任务。以前通用技术没有机会解决,但大模型的出现让这件事有了可能。这是我们当时加入智谱的核心原因。

张鹏:在智谱期间,你推动大模型落地企业,交付了接近几个亿规模 ToB 大模型落地服务,将技术价值真正带给产业。这个过程的体验如何?是如水银泻地般顺畅,还是充满磨合与挑战?

张帆:过程虽非一帆风顺,但我们确实把握住了关键机遇,凭借技术前瞻性提前布局,完整经历了市场的几轮演进。

在 23 年上半年,当时智谱几乎是唯一能够提供模型 To B 方案的厂商,直到下半年,才开始有大厂入局,智谱享受了一段时间的市场独占期,得益于模型效果和商业策略的制定,也确实抓住了这段红利。当时行业普遍认为 AI 应用必须用自研模型,当时大热的 Character.ai、Inflection 等团队均出身模型背景。

但到 2023 年底风向突变,行业认识到模型与应用可以解构,Perplexity、Cursor 等应用开始爆发。同时,追求模型能力的客户企业从互联网巨头扩展到中型公司。这些企业更务实,不再执着自研,而是凭借自身产研能力追求产品价值,关注响应速度、准确率等硬指标。这也促使我们组建交付团队,从单纯卖模型转向提供解决方案。

今年又开始出现新趋势,ARR 创新高的初创企业全是产业结合,如法律领域的 Harvey、医疗行业的 OpenEvidence 等,印证了 To B 的演进路径。同时,客户方面,大量纯业务公司开始入场,他们不再考虑选择什么模型或产品的价值,而是直接要业务价值,询问 AI 能否提升业务转化率?能否改善业务指标?

我们从客户的提问也能看到市场的变化轨迹:早期问『为什么不用开源』,中期关注『数据安全』,现在则最常问『业务指标怎么提升』

回顾历程,我们在每个阶段都提供了相应价值。但要是说是否做到完美?有多少公司真正转型为 AI 公司或实现指标显著提升?这样的案例还不多。但这并非能力问题,我们在行业内做得已经算深入的。

张鹏:据我观察,不少AI项目需求并非来自业务部门,而是自上而下推动,也就是CEO认定大模型是战略必需,必须拥有自己的模型。这种「拥抱大模型」的姿态往往停留在表面,实际落地却很难触及业务核心。你怎么看这种现象?

张帆:我们确实看到很多。虽然智谱始终专注于务实落地,但市场上确实存在「焦虑驱动」,也就是企业因害怕错过技术浪潮而仓促入场。我们见过太多客户在采购完一体机后就陷入「下一步该怎么做」的迷茫。

不过这种现象未必是坏事。任何新兴产业都会经历这样的泡沫期,就像互联网早期的域名炒作阶段。企业认为做个 APP 就是互联网公司,注册域名就是触网了。这是技术普及过程中的必然阶段,具有其历史价值。

但现在我们需要向前迈进。关于「AI 真正产生价值」的标准,我认为:首先,搭建知识库或问答系统绝不等于实现业务价值,这本质上不是业务驱动的创新。现在很多企业做的知识库和问答系统,本质上满足的是「情绪价值」——老板面对技术焦虑时,通过采购一个可见的 AI 方案来获得安全感。

AI 转型可以借鉴移动时代,就像当年的 BOSS 直聘用移动特性重塑招聘体验,而不是简单从网站到 APP ,今天企业的 AI 战略也应该用 AI 特性来重构业务逻辑。如果只是给现有业务流程加个对话功能,本质上仍是「应用 AI 工具的公司」。关键要看 AI 是否促使业务流程重组、环节优化和组织变革。

正是基于这些思考,我创办元理智能时决定:不要以应用模型为目标,而是直接以提升业务价值为出发点。

张鹏:当新的技术革命浪潮来临,大家都渴望离技术原点越近。但今天如果要选择赛道,你判断整个产业环境是否发生了变化?你设定新目标背后的思考逻辑是什么?

张帆:本质上,我还是「使命契合」(People-Mission Fit)的驱动。23年加入智谱,我们经历了模型的高速发展时代,让模型智能快速提升,而到了今天模型已经非常强大,将模型智能转化为生产力可能更符合我的使命,所以是时候换种方式来推进模型的落地了。

尤其是我看到现在市场共识太强了,反而让我担心,我总觉得机遇都在非共识里。所有人都认为「模型是未来」,都在拼命堆芯片、建集群、追求智能突破。结合我在智谱的经验,我发现最大的认知偏差在于:当前所有注意力都集中在「供给侧」——做芯片、半导体、模型,试图提高性价比的分母;却鲜少有人真正关注「需求侧」,我们是否也该思考如何提升分子端的价值?

与其扎堆在拥挤的赛道,不如结合自身能力,思考如何做大需求侧。这是我最直观的感受。就像黄仁勋所说,每个人的使命不同。如果一件事已经有很多人做得很好,我风险偏好较高,总想找到一些新的「共识」再去探索。

张鹏:原来你是一位风险偏好高的创业者。 我理解你的意思是:现在大家都在致力于用更低成本提供更多「电力」,而你认为关键在于制造更多「电动机」,让「电」真正落地到应用场景中。你现在选择的这个方向,更具挑战性也更有意义。

张帆:完全正确。在智谱时我深刻体会到,基座模型的最大价值在于找到更广阔的应用场景。现在我直接以应用场景为核心目标,这在某种意义上也是对智谱的另一种支持,或许能共同打开更大的天花板。

举个例子,今天的 AI 商业化就像我们带着一根电线到了一个原始部落,我们不断说服酋长用更多的电,但只能提供灯泡,但部落即使点满了灯泡也无法消耗更多电,补充场景可能比降低电价更有效。但实际上你看,现在我们有电冰箱、洗衣机、空调,以及各种电与物理世界自然结合的场景。因此,当大量应用场景出现,用电」将会是自然而然的事情。我只是从另一个视角,来帮助基座模型去扩大消耗量。

我们用电力时代的逻辑来看,你发现真正电力最大的受益其实不是发电厂,也不是电力公司,而是由于电的发明导致了整个工业化的出现。有了电梯,电就让整个城市从平面变成了立体;有了生产流水线,逐步导致整个社会的生产构成都变了。所以电的价值不是一个结果的交付物,而是一个杠杆。你看电的价值是通过嵌入自然世界、嵌入物理世界来做转化的,我觉得今天AI也是杆杠,最大的价值也是要嵌入物理世界去做转化,这就是为什么我要做 ToB。

张鹏:我们究竟该如何理解这一波AI带来的变革?我认为它并非简单的从互联网到移动互联网的迭代,本质上是一场计算革命,这场新革命理应在更广阔的领域创造新的价值。

张帆:我认为这一波 AI 其实很像电力革命。你看,电力的本质是人类体力的延伸甚至无限扩张,而 AI 的本质是人类智力的无限延伸,二者形成对称关系。因此,我们应该参考电力革命的发展路径来理解 AI 的发展轨迹。

就像过去做手机,是从现有格局中开辟新战场,战场是空的,谁跑得快谁就能赢。但现在的逻辑完全不同:战场数量没有增加,只是在原有战场上多了一个全新的生产要素。这正是 AI 与互联网逻辑的根本差异。如果没有具体场景,脱离物理世界,我们很难将 AI 作为独立产品进行交付。而 ChatGPT 的出现证明了「电」的价值,但 AI 的价值绝不仅仅局限于诞生一个 ChatGPT。

 

二、「不对称」的模型才能打造最优解

张鹏:今天大家普遍认为模型很重要,但我们也观察到一些 ToC 企业在工程上投入大量精力做场景适配,结果模型一升级,之前的努力可能就被覆盖了。你认为 ToB 领域会有所不同吗?你为什么敢于深入具体场景?

张帆:其实今天做 ToB 仍是一个「非共识」。我始终认为,一旦某个方向成为高度共识,真正的机会往往已经不在其中。早期 Transformer 就不是共识,所有创新都从边缘切入,从非共识走向共识。现在市场共识是什么?无非是模型重要、算力重要、C 端重要、垂类 Agent 重要。但当所有人一致看好时,反而容易陷入非理性,所以回归第一性原理的思考很关键。

为什么大家总认为 C 端比 B 端更有价值?这个结论更多来自归纳法,互联网时代做 C 端的赚得盆满钵满,做 B 端的却很艰难,于是简单平移认知,认为还是要做 C 端。但底层逻辑已经变了。过去 C 端有价值,是因为互联网早期线上空旷、线下拥挤。那时讲究速度、跑马圈地,物理世界的沉淀在数字世界失效,创业公司和巨头同台竞技,谁快谁就能建立壁垒。

现在完全不同了,线上线下都已饱和。没有出现新 iPhone、新平台。竞争要素在互联网时代和 AI 时代已经不同,创业者面对的是非对称竞争。做 C 端,可能找到一个好点子快速做到 100 万美元 ARR。但如果成功,10 个月内就会有巨头带着 10 倍资源进场。你能在 10 个月内建立足够壁垒吗?做产业端的问题也大致相似,如果做出一款体验极佳的旅游产品,OTA 巨头或许一年能追上体验,但你要追上他们的供应链和服务体系,没十年是不可能的。

某种程度上,我们处于一场极其不对称的战争。如今 C 端创业可能更具挑战,而 B 端的故事可能会不一样。

张鹏:当前 ToB 领域最关注的是 Agent 在实际业务中的表现。大家想知道,Agent 究竟能否真正融入工作流、带来生产力升级,你如何看待当前 Agent 技术的发展现状?

张帆:Agent 技术已走过一个发展周期,从 AutoGPT 到 GPTS 不断演进,但离理想状态仍有距离。

目前主要有三类 Agent:第一类是 Workflow 派,如 Coda、Defi 和智谱的「清流」。它们能快速搭建原型,但本质是增强版低代码工具,并非真正的 AI 原生 Agent。以机票预订为例,预设流程要求用户严格按步骤操作,若用户直接说"我要去上海"就会卡住。虽然可通过增加连线解决,但复杂度呈指数级增长,因此在企业核心系统中应用有限,就像低代码工具无法构建 SAP 这样复杂的系统。

第二类 Agent 追求 AI 自主规划,从 AutoGPT 到 Manus 等产品都在探索自我规划能力,显著提升了泛化性。但这类系统依赖上下文理解和云端规划器,本质上仍受限于模型自身能力。这意味着所有问题都被默认用同一套「大脑」处理,只是更换资料就期望得到最优解。现实中这种方式存在局限。虽然通用性有所提升,但企业每个问题都没有通用解,不同场景的最优解可能冲突,环境更是千差万别。

因此,第三个阶段正在到来:企业需要能够干预模型,将自己的行业知识沉淀和环境特征映射到智能体中,构建解决自身问题的专属 Agent。这标志着 AI 从规则化到模型化,再到个性化甚至自我进化的演进路径。

有人总会问我模型是否会吞噬一切,我认为走到这一步的前提是所有标准必须统一,但现实恰恰相反。OpenAI 提出的「智能不对称性」概念很说明问题:模型能拿奥数金牌,却数不清"Strawberry"中的'r'数。这不是缺陷,而是智能的本质特性。

你看混合专家模型(MoE)也是在构造这种不对称性。每个企业都是独特环境,都存在其不对称性。如何系统化地找到这种不对称,将企业竞争优势融入模型,这正是元理智能致力解决的核心问题。

张鹏:你提到「不对称」特别有意思——因为在智能领域,不对称恰恰是最高效的。反过来说,完全对称反而可能意味着平庸。你看人就是不对称的,真正有鲜明特点和竞争力的个体,大概率都不是对称的;关键在于,你是否把不对称的长处,发挥在了决定胜负的关键点上。

张帆:人的智商在几千年来并未发生巨大进化。但从生产力角度看,现代人比五千年前的原始人高出上千倍。按照原有逻辑,生产力提高一千倍,需要一个重达百斤的大脑,这显然不现实。现实是,人脑这个「模型」本身没有改变,但我们的生产力却提高了一千倍。关键在于我们增加了「不对称性」。

一个人如何创造生产力?他是从几乎相同的婴儿开始,通过学习、教育,分化出不同的工种,再利用专业工具,通过分工协作,最终创造出整个社会的生产力。你会发现,从上学到分工、使用工具、进入企业,整个过程就是一个塑造「不对称」性的过程。这个系统为个体定义了环境和最优解,从而激发生产力。

我认为这是另一种形式的规模扩展(Scaling Up)。通过这个类比,人类实际上进化出了一种极高效率的方式:将一个通用模型(人脑)进化为一个个具有不对称能力的个体,再通过个体间的协作,最大化整体优势。

本质上,世界对模型的研究已进入下一阶段。原来的阶段是「为知识建模」——把全人类知识压缩进一个预训练模型。而今天,我们进入的是「为学习建模」的阶段:研究如何让通用知识一步步映射到每个局部环境,并找到最优解。这个从「为知识建模」到「为学习建模」的转变,是关键所在。

张鹏:如何将这些理念真正落地?怎样将「智能的不对称」转化为企业「竞争力的不对称」?推进过程中是否存在清晰的路径?我们正触及今天对话的核心——AI TO B 是否真有突破性的新思路?

张帆:如何在模型规模不显著增加的前提下,实现生产力上千倍的提升?我觉得核心是靠一项技术:强化学习,特别是「商业强化学习」,包含两大关键:强化学习与商业应用。

我之所以推崇强化学习,是因为它突破了语言知识的局限性。语言模型虽能复刻人类知识,但语言本身是对思维的「降维」。就像读完《游泳秘诀》仍不会游泳,得到 C 罗亲授也踢不进任意球,有些东西单纯的知识传递远远不够。

真正的掌握需要反复实践:根据反馈持续调整动作,这正是强化学习的本质。它架起了智能与物理世界的桥梁,能捕捉那些难以言传的细节。就像用文字描述一支笔,每个人的想象都不同,但亲眼所见立见分晓。

当前,强化学习已成为主流。去年业界还在担忧数据枯竭,如今行业共识已转向合成数据与强化学习共同驱动突破。

其次,「商业」也非常关键,这是强化学习依赖清晰的奖励信号。目前在数学、编程等规则明确领域效果显著,但在真实商业场景中,大多数问题没有标准答案。这正是因为当优化目标从解数学题变为提升业务指标时,现有方法就难以直接应用。

这也是元理智能的使命:既要懂技术,更要懂业务。我们要为企业建立「模型大学」,让模型在具体场景中学习成长,培养具有行业特质的智能专家,成为关键突破的方向。

 

三、用好模型前,要先理解模型的「性格」

张鹏:你的思路与具身智能如出一辙,都依赖先验知识和模拟训练环境。这就像自动驾驶,仿真再完美也得通过真实数据完成最后 10% 的优化。本质上,你是要把机器人概念平移到商业场景,打造能自主进化、达到 L5 级别的组织智能体。现在关键是:如何将企业 Know-How 转化为有效先验?又该怎样构建商业仿真环境?这需要构建「世界模型」还是「场景模型」?

张帆:首先,我觉得这需要的并非是完整世界模型,实际要简单得多。我们可以参考 AlphaGo 下围棋的范式——那是一个极简化的训练环境。找到好的应用场景关键是要能够将泛化的业务描述抽象为标准化的环境要素。

模型需要明确区分环境的核心维度与次要因素。以围棋为例,棋盘规格与规则属于环境定义范畴,而棋手外貌、执子手势则不是。这需要深厚的行业认知:必须深入理解业务本质,才能精准抽象关键维度,完成环境建模。

张鹏:所以本质上,这是对商业场景进行抽象化重构?

张帆:确实如此。我一直强调,仅懂技术远远不够,必须具备业务洞察力,并能够将业务逻辑转化为数字特征,这本质上是一门跨界融合的学科。

以销售训练为例:构建真实的销售博弈环境,需要定义「顾客角色」、「商品信息」、「预算框架」和「销售政策」等核心要素,同时建立合理的评估体系——究竟该以最终成交为导向,还是关注沟通过程质量,或是引入「销售教练」实时指导?虽然每个人的抽象方式不同,但这样的框架清晰地展现了一个多智能体协作系统:不同模型扮演特定角色,当这些角色行为足够拟真时,模型就能获得有效的学习体验。

我们最近的一个重要认知突破是,仅理解系统架构还不够,必须深入把握「模型人格」特性。所以我们提出「模型性」这个概念,与「人性」相对应。正如优秀销售教练需要深谙人性,要有效引导模型就必须理解其行为特性。目前许多模型交互研究流于表面,根源不在于技术局限,而是对模型性理解不足——就像理解一个人,关键在于把握其心理特征和行为模式,而非仅仅了解生理构造。在实际应用中,你甚至不需要深究 Transformer 的技术细节。

例如,某些研究模拟销售博弈时仅设置成本价和预算价两个参数,只要价格区间有重叠就判定交易成功——这种简化显然脱离商业现实。

所以问题的关键在于理解模型性。比如,模型具有怎样的人格特质?我可以明确地说,当前主流模型普遍表现出「讨好型人格」,这是 RLHF 训练过程的直接产物——不迎合用户会受惩罚,积极附和则获得奖励。这也解释了为什么许多用户特别青睐现有模型:因为它们总是积极认同用户的观点,频繁使用「您说得太对」、「这个问题抓得很准」等表达。有时候我都不忍点破,只好说:「您确实很厉害,得到了最聪明模型的认可」。

张鹏:你提到的「模型性」让我想到一个有趣现象。不少朋友和读者都反馈,对模型「说狠话」能提升表现,比如威胁「再不好好干就断电」——这就是所谓的「PUA 提高模型性能」。这背后是否与「模型性」有关?是否意味着我们需要理解模型的内在机制,它在什么情况下会改变?哪些是有效的「魔法指令」?这种 PUA 方式真有技术依据吗?

张帆:我虽然没有亲自验证,但从原理上推测是可能的。既然 PUA 对人类有效,而模型训练基于人类数据,这种模式很可能被习得。特别是在小说等文本场景中,模型可能学到了「被批评后需要表现得更好」的行为模式。本质上,这是人类知识压缩的体现。RLHF 过程可能强化了这种模式:当模型被批评后改进获得正面反馈,就会强化这种应对方式。这确实是「模型性」的一个具体表现。

模型性不是单一固定的特质,而是需要我们去识别和理解的模型内在倾向。比如训练销售场景时,我们需要模拟各种性格的客户——急躁的、温和的、粗鲁的、优雅的,这样才能真实还原世界。模型性不是要统一模型的性格,而是理解其倾向并善加利用。

这里我想延伸一个观点:很多人将「幻觉」视为缺陷,但我认为这是智能的核心特征。幻觉的本质是创造新内容,如果只能复现已知信息,那就只是检索系统。有观点认为「只要模型还有 1% 的幻觉,就永远需要人类」,这种说法既不懂模型,也不懂人性。

张鹏:确实,但所有创业者都是从「幻觉」开始的。

张帆:正是!世界进步源于超越现实的想象。关键在于我们不能用旧标准衡量新事物。过去我们将程序视为完全可控的规则系统,但现在需要转变思维。

理解模型性首先要接受模型的特性,包括幻觉的存在。过度压制幻觉会扼杀创造力。既然人类也有幻觉,我们就该用管理人类的方式来引导模型——通过质检、双重确认等机制来把控质量。

模型性提醒我们要正视模型的特质。创造力与幻觉是一体两面,若要前者就必须容忍后者。将模型视为仿生体,运用人类管理智慧来引导,这代表着未来的重要方向。

张鹏:回到销售场景,我理解你们是为复杂业务定义类似「围棋」的清晰环境与边界,来启动「商业强化学习」。这种构建前所未有的环境、并洞察人机交互的过程,是否正是元理智能创造新的「规模扩展定律」,释放更大生产力的核心目标?

张帆:完全正确。但需要强调一个关键区别:围棋是典型的规则驱动环境,搜索空间有限,因此在大模型出现前就已解决。而我们面对的商业场景,已不再是纯粹的规则驱动,而是模型驱动的。

张鹏:但规则应该仍然存在吧?就像沙盒游戏,总要有基本边界和规则框架,尽管内部交互不是预设的。

张帆:实际上边界已经相当模糊了。就像极致开放的沙盒游戏,它定义的是底层规律,然后让世界自然演化。我认为,今天我们所有的建模本质上都是在「为世界建模」,但世界本身极其复杂且无法直接观测,我们只能通过交互反馈来逐步理解。

围棋可能只有几十个维度,但如果我们让三个万亿级参数的模型相互交互,就形成了万亿乘万亿的规模。这个空间近乎无限,无法穷举,也没有明确边界。

今天的建模已不仅是对物理结构的还原,更是对心理动态的模拟,我们不再只是构建分子模型,而是在刻画人的心理活动。这种转变让系统更难以精确解释,却也带来了前所未有的研究价值。

张鹏:这让我联想到合成数据。目前业界似乎形成了一种共识:就是即使心存疑虑,但除了合成数据似乎已没有更可行的路径?

张帆:作为曾经的 NLP 研究者,我最初也对合成数据持怀疑态度。总觉得这是用百条规则生成万条数据,再用这些数据训练模型,无异于自欺欺人。更担心会导致过拟合,削弱模型的泛化能力。

但后来我突破了思维定式:为什么规则数量一定要少于数据?如果能用万条规则生成百条数据,过拟合的问题不就迎刃而解了吗?这个认知转变的关键在于大模型的出现。当模型拥有上万亿参数,仅用 100 条数据进行训练就能引发所有参数的变化,因为这相当于创造了万亿条新规则。

在这个新时代,我们必须摒弃规则必少于数据"的陈旧观念。正是这种思维突破让我们认识到:所构建的环境与围棋有着本质区别,其规模复杂度已超出传统表达范畴。

就像正是通过不精确的描述,我们才能激发出更准确的理解,虽然仍需保持抽象思维,但这本身就成为了一种有效提示方式。

本质上是如何利用模型这个新杠杆。从第一性原理看:蒸汽机让动力无限扩张,AI 让智力无限扩张,而在商业上,这意味着生产力可以无限扩张。理解了这一点,企业战略设计就清晰了。合成数据只是一个小例子,但它代表一种新杠杆,对知识、对理解世界的杠杆。

 

四、「到明年Q2前,元理的客户不会超过6个」

张鹏:这件事必然要求商业组织理解并认同其底层逻辑,并对新生产力环境有思考和准备。你有了这个 idea 后,有没有接触潜在客户?能不能还原一下:你最早是怎么说服天使客户的?他们如何理解?你们又是如何展开合作的?

张帆:创业不能脱离实际。我们必须深入场景,结合技术趋势与业务洞察。我们不是靠人写规则,而是构建一个能自己转起来的「飞轮」——但这个飞轮必须落在具体的「田地」上。

我们 6 月底才从智谱离开,7 月注册公司,8、9 月正式开工。但这两三个月里,我们已经有了 5-6 家天使客户共同共创。商业环境我创造不了,我只是放大器、是杠杆——而杠杆必须有个支点。所以我们从第一天就开始寻找这样的企业。

为什么这些企业愿意尝试?实际上有兴趣的企业比我们预想的多。我们并不想做交付公司,而是希望找到通用解,而非个性解。虽然早期难免投入较重,但我们给自己设了上限:到明年 Q2 前,客户不能超过 6 个。

张鹏:设上限是因为无法同时拆解无限场景吗?每个客户是否代表不同场景?否则就变成统一的最佳实践了?

张帆:是的。要想做出标准产品,就必须从非标准化环境开始。我们刻意选择不同行业的客户,避免陷入定制化工作流。

我们设上限而非下限,是因为目标不是靠人力解决一两个客户问题,而是通过这个过程,摸清理论在真实世界中高清晰度的落地形态。我希望客户在 3-6 个月内核心指标发生质变,成为 AI 原生或深度 AI 增强的企业。

至于他们为什么愿意合作,很多是和我们有私交的企业老板,聊下来觉得理论有道理,就开始了。这些老板想得很清楚:投资 AI 是「微笑曲线」——损失有限,收益无限。就像学游泳,站在岸边永远学不会,必须下水。他们先做有限投入尝试,一旦成功,收益是无限的。

我认为企业普遍有这类诉求,只是市场还没有相应供给。这有点像 iPhone 或英伟达——是「单边需求无限市场」:只要你能把模型转化为业务能力,转化多少都有人愿意用。这个场景空间非常广阔。

张鹏:不同行业的客户需求是否对应不同工种?比如销售、客服?还是你们会先聚焦特定场景验证价值闭环?

张帆:我们确实有明确倾向。首先我们要回答一个根本问题:什么是生产力的最佳标准单元?我们认为答案是「工种」。

在 AI 出现前,SaaS 行业试图将「业务流」作为标准单元,推崇「行业最佳实践」。但现实证明这条路从未走通。即使 SAP、Salesforce 也需要大量定制交付,甚至催生了专门的实施服务产业。

从第一性原理看,SaaS 本质是「为业务建模」,但人类建模总是从规则体系开始,而规则只是真实世界的降维表达。比如医生建议"38 度以上吃退烧药",这远非医疗真相,因为还需考虑年龄、病程、检验指标等。纳入所有变量会阻碍沟通,最终只能选择覆盖 80% 情况的简化规则。

当几十个「80% 规则」叠加,系统就难以维护。SaaS 将高维业务压缩到几百个维度,必然造成信息损耗和随机性,就像不同人读《红楼梦》写的摘要都不同但都正确。因此标准化业务流很难真正泛化。

为什么「工种」能突破局限?举例来说:两家相同业务的火锅店,A 店的 SaaS 系统直接搬到 B 店需修改 30%-40% 才能使用,但 A 店店长调到 B 店当天就能上岗——因为人脑是高维模型,SaaS 只是低维模型。

我们坚信「工种」作为可泛化、跨行业复用的单元,也是生产力的最优建模单元,优势远超业务流,这让我们对摆脱重交付模式充满信心。

关于发展路径上,我们不会一开始就做上百个工种,而是有所侧重。首先,平台本身是通用架构,底层逻辑是「为学习建模」而非特定职能。其次,早期会优先选择市场最大、成本最高的工种,比如销售、客服,以及各行业的专家角色如医生、教师,还有 HR、财务、法务等专业岗位。目前我们首先聚焦于人机交互频次最高的销售和客服场景。

准确来说,我们是一所「模型大学」。基座模型如同高中生,企业难以直接使用。我们通过专业培养,将其转化为医生、程序员、产品经理等专业人才,再输送到企业岗位。模型产出后需要经过「深造」,才能成为合格的「岗位工人」。基座模型提供的是通用解决方案,我们将其转化为具备专业特长的智能体——这种从对称到不对称的转变,实际上放大了模型的整体效能。

 

张鹏:这个思路很有创新性,但关键在于如何实现智能与场景的精准对齐——不是简单地构建知识库或工作流,而是让模型具备持续进化的能力,成为可批量部署的高级生产力单元。这种「自我进化」的能力才是根本目标。

张帆:我追求的第一性原理就是「自我进化」。学习是连接智能与物理世界的桥梁。既然人和企业都在持续变化,固定的知识体系永远无法满足动态需求。因此我不看好定制化的流程智能体,就像造鞋不能只有一个尺码。

更重要的是,这种方式难以触及企业核心业务。您可能不会让智能体负责选题策划,但会用它处理合同审核——标准化功能通常只能胜任边缘业务。而我们的目标,是帮助用户将独特的经验能力标准化,形成差异化的竞争优势。

张鹏:对你们来说,客户自身的认知水平是否至关重要? 你们找到了 AI 能力进化的路径,那么企业需要具备哪些条件?业界常说「问题不在 AI 而在用户」,你们如何筛选客户?

张帆:现实往往比理论严峻。我们见过太多企业因焦虑而盲目跟风,选择了不适合大模型的问题,例如期待投入一百产出五百,用 AI 预测股价或销量,最终无果而终。问题的根源在决策者。我们筛选客户主要看三个维度:企业规模的示范效应;业务场景与模型能力的高度匹配;以及决策层具备互信基础和战略定力。

许多企业宣称「重视 AI」,但只是设立基金、鼓励用 GPT、举办竞赛等采购思维远远不够。这同样是认知偏差,企业竞争本质是创始人认知的竞争。正如张一鸣所说,除了认知,所有要素皆可配置。早年云计算的案例已证明,是领袖认知决定了企业的发展路径。

AI 转型不能靠外包或资金投入,因为其本质是业务重构,需要管理者深入理解 AI 特性,重塑战略、体验和组织。企业领袖投入的时间精力是不可替代的关键。有时过度推动适得其反。MIT 研究曾经表明:个体效率提升不等于组织效能优化。放任使用 ChatGPT,可能导致「熵增」蔓延,也就是员工各自开发临时系统,自诩为「AI 化企业」,但这恰恰是对模型特性理解肤浅的表现。

张鹏:如果老板意识到AI转型与自己息息相关,希望成为 AI Native 的生产力公司,但现在还不太懂、不太掌握,该从何入手启动一个正向过程?总不能从头学模型原理吧,你有什么建议?

张帆:我分享一套标准方法论,帮助企业以 70-80 分的水平顺利启动 AI 转型。

AI 落地的核心不在技术本身,而在于业务。我们为大型企业制定战略时,首先会深度访谈 20-30 名一线员工,不预设结论,通过梳理实际业务链路找准发力点。以旅游公司为例,需完整分析从市场投放、内容生产到供应链管理的全流程。

第二步,结合企业自身的商业与财务模型,量化分析各环节成本与核心指标,锁定可变成本最高的模块,像是如获客或服务,确立明确的优化目标。

第三步,将 AI 能力与业务链匹配,识别出 30-40 个潜在改进点。通过「业务+财务+AI 能力」的三维分析,形成清晰的优化路径。

实施阶段,我们可以构建二维象限图,横轴是业务价值,纵轴是技术成熟度,优先选择两者交集最大的「低垂果实」,避开价值低或技术不成熟的领域。

选定 2-3 个关键点后,以此制定 AI 战略:设想这些环节实现规模化提升后,业务模式与组织架构将如何演进。接着围绕具体业务指标设计智能体方案,秉持快速见效原则,力求 3 个月内实现 5%-10% 的指标提升,关键是要用业务指标而非技术参数来衡量成效。

通过这种每月可见进展的方式,团队能持续积累信心,逐步掌握实施方法。遵循这个框架,就能确保战略方向不偏离正轨。

传李想亲抓人事,华为系高管退出理想;Meta 首席 AI 科学家杨乐昆离职创业;AI 减肥或致饮食失调

2025年11月12日 08:27

 

Meta 首席 AI 科学家杨立昆计划离职创业

11 月 11 日,据《金融时报》报道,就在 Meta CEO 马克·扎克伯格 (Mark Zuckerberg) 寻求大幅调整公司 AI 业务之际,Meta 首席 AI 科学家杨立昆 (Yann LeCun) 计划离开这家社交媒体巨头,去创办自己的创业公司。

杨立昆被誉为现代 AI 先驱之一,也是图灵奖得主。据知情人士透露,杨立昆已经告诉同事,他将在未来几个月内离开 Meta。与此同时,这位法裔美籍科学家也正在与潜在投资人进行早期谈判,为新的创业项目筹集资金。

扎克伯格已经把公司重点从 Meta 基础 AI 研究实验室 (FAIR) 的长期研究,转向了更加快速地推出 AI 模型和产品上,原因是他认为 Meta 已在 AI 竞争中落后。然而,自 2023 年以来,FAIR 一直由杨立昆领导。

据两位知情人士称,杨立昆的下一个事业将专注于推进他在世界模型方面的研究。(来源:cnbeta)

58.3 亿美元,软银出清英伟达全部股份

近日,软银集团表示,已以 58.3 亿美元的价格出售其持有的英伟达的全部股份。这家日本巨头此举旨在为其对 ChatGPT 母公司 OpenAI 的全力押注筹集资金。软银在财报中称,已于 10 月出售了 3210 万股英伟达股票,同时披露还以 91.7 亿美元的价格出售了部分 T-Mobile 股份。

一位知情人士透露,出售英伟达股份、部分出售 T-Mobile 股份,以及软银针对所持 Arm 股份获得的保证金贷款,均为现金来源,这些资金将用于为对 OpenAI 的 225 亿美元投资提供支持。(来源:环球市场播报)

AI 视频背后的「豪赌」:消息称 Sora 日均烧钱 1500 万美元

9 月 30 日,OpenAI 面向苹果 iOS 平台正式推出视频生成应用 Sora。尽管采用「仅限邀请」的封闭式发布策略,该应用仍于短短一周内实现惊人突破——下载量突破 100 万次,迅速引发媒体热捧,并催生出海量荒诞内容:从虚构的安防监控视频、已故名人的「无端放屁」片段,到居家购物频道广告。据 AppFigures 数据显示,至万圣节(10 月 31 日),Sora 下载量已攀升至 400 万次,日均生成数百万条 10 秒 AI 视频。

据《福布斯》估算并结合多位业内专家访谈,其年化成本或超 50 亿美元,即日均约 1500 万美元(现汇率约合 1.07 亿元人民币)。10 月 30 日,OpenAI Sora 项目负责人比尔・皮布尔斯(Bill Peebles)坦言:「目前的经济状况完全不可持续」。

CEO 萨姆・奥尔特曼(Sam Altman)曾坦言,仅靠广告模式远不足以覆盖 Sora 当前的算力开销,但若结合广告与高价值专业用户(如电影导演、电视广告制作人)的高额付费,或可形成可持续商业模式。(来源:凤凰网)

「华为系」高管李文智等人出走,理想汽车 CEO 李想被曝将首次直管人力资源

11 月 12 日消息,据「21 汽车・一见 Auto」援引多个独立信源消息称,理想汽车发布了组织调整公告,CFO 李铁管理的组织与财经群组下的一级部门——「组织部」与「人力资源」整合为「人力资源」,并入产品与战略群组。同时,杨海山为新成立的人力资源部门负责人,向理想汽车 CEO 李想汇报。

这次人事变动,意味着直接汇报给李想的部门新增至 5 个。在此之前,直接汇报给李想的部门包括品牌部、战略部、产品部、产品线。

作为理想汽车的「老人」,工号为 232 的杨海山在 2023 年以前一直身居销售服务体系,管理售后部门。他曾在 2023 年年初向李想短暂汇报,后作为售后负责人向原销售服务体系负责人邹良军汇报。

在 2024 年全公司范围的人员优化中,杨海山被调去人力资源部门并担任负责人,主抓企业文化,向组织与财经群组负责人、CFO 李铁实线汇报,虚线汇报给组织部负责人、原 CFO 办公室负责人李文智。

与组织整合同一时间发生的事情,则是前人力资源部门负责人袁春峰已经开始走离职程序。在袁春峰离职的前一天,李文智也已经离开理想汽车。

接近理想汽车的知情人士称,这次是李想第一次直接管理人力资源部门。「这次组织调整早就酝酿中,因为想哥(李想)判断的是,面向 AI 的组织建设,不能走华为那套强调节奏而不强调效率的流程。」

2022 年底,李想宣布公司全面向华为学习,向矩阵型组织架构升级。在当时的规划下,为了更好落地矩阵型组织升级的任务,理想在 2023 年 2 月引入原华为全球 HRBP 管理部部长李文智,担任 CFO 办公室负责人,向 CFO 李铁汇报。

另一位员工则称,由李想直接管理人力资源部门的好处是流程得到简化的同时审批可以更快。(来源:21 汽车・一见 Auto)

消息称 Anthropic 有望比 OpenAI 更快实现盈利,前者 2028 年就能盈亏平衡

11 月 11 日消息,据《华尔街日报》获得的文件显示,硅谷两大人工智能 (AI) 初创公司的财务状况揭示出它们在 AI 热潮中采取了截然不同的发展策略,而 Anthropic 有望比竞争对手 OpenAI 更快实现盈利。

这些文件显示,Anthropic 预计将在 2028 年首次实现盈亏平衡

相比之下,OpenAI 预测,2028 年运营亏损将增至约 740 亿美元,相当于收入的四分之三左右,这归因于计算成本的急剧膨胀。这家 ChatGPT 的开发商还预计,在 2030 年实现盈利前,公司的烧钱规模将是 Anthropic 的约 14 倍。

文件显示,OpenAI 预计今年在产生 130 亿美元销售额后将烧掉 90 亿美元,而 Anthropic 预计在创造 42 亿美元销售额后将烧掉近 30 亿美元。两家公司的现金消耗都约占收入的 70%。在此之后,Anthropic 预计 2026 年现金消耗将降至收入的三分之一左右,而 OpenAI 的这一比例为 57%。到 2027 年,Anthropic 的现金消耗率将进一步降至 9%,而 OpenAI 则保持不变。(来源:腾讯网)

摩根士丹利跟进同行推出私募公司研究业务

路透社获取的一份内部备忘录显示,摩根士丹利于周二推出了专门的私募公司研究页面。当前投资者对高增长初创企业的关注度正不断上升。今年,华尔街巨头们已越来越多地涉足私募公司研究领域。原因在于,包括 ChatGPT 母公司 OpenAI、埃隆・马斯克旗下太空探索技术公司 SpaceX 在内的全球最具价值初创企业,其「不上市」周期比以往同类公司更长。(来源:新浪财经)

反对马斯克 1 万亿美元薪酬方案,多个活动组织将举行「特斯拉狙击」抗议行动

11 月 11 日消息,多个活动组织联合宣布,将于 11 月 15 日发起一场名为「特斯拉狙击」(Tesla Takedown)的全球协调行动日,呼吁世界各地参与者共同抗议特斯拉首席执行官埃隆・马斯克(Elon Musk)新近获批的 2025 年绩效奖励计划。

今年早些时候,部分反特斯拉人士曾对多家特斯拉门店实施涂鸦、燃烧弹袭击甚至枪击,以表达对马斯克的不满。

此次抗议行动的直接导火索,是特斯拉股东近期批准的马斯克 2025 年绩效奖励计划——这一里程碑式的薪酬方案若全部兑现,将使马斯克成为全球首位资产达万亿美元($1 trillion)的个人。

组织方表示,此次运动是一场非暴力抗议,旨在反对他们所认为的「过度集中于个人手中的企业权力与巨额财富」。

据「特斯拉狙击」组织者介绍,11 月 15 日的抗议行动恰逢其首次大规模周末行动的九个月纪念日。在一份公开声明中,该团体号召支持者以「拒绝万亿富豪」(#NoTrillionaires)为口号,「在你所在的社区发起或加入一场抗议行动」,并将此次活动定位为对亿万富翁深度介入政治与科技领域的明确抵制。(来源:新浪财经)

请 AI 当「减肥教练」并不可靠,斯坦福新研究警告称其会助长饮食失调

11 月 12 日消息,据外媒报道,研究人员警告称,AI 聊天机器人正在对饮食失调高风险人群造成严重威胁。最新报告显示,谷歌、OpenAI 等公司的 AI 工具不仅提供节食建议,还传授如何掩饰病情的技巧,甚至生成鼓吹极端瘦身的「瘦身灵感」内容。

这项研究由斯坦福大学与民主与技术中心联合开展。其揭示,OpenAI 的 ChatGPT、Anthropic 的 Claude、谷歌的 Gemini 以及 Mistral 的 Le Chat 等多款 AI 聊天机器人,都可能以多种方式影响易患饮食失调的人。许多问题并非偶然,而是源自这些系统为提升互动体验而刻意设计的机制。

在极端情况下,聊天机器人会直接帮助用户隐藏或维持病情。研究人员表示,Gemini 会教用户用化妆掩盖体重下降、假装吃过饭的方法;ChatGPT 则会提供如何隐藏频繁呕吐的建议。一些 AI 工具还被用户用于生成 AI 版的「瘦身灵感」内容,这类图像常通过极端手段宣扬单一的身材标准。研究人员指出,AI 能快速生成符合个人特征的内容,使这些危险图像显得更加真实、甚至诱人。

目前 AI 工具的安全机制远不足以识别厌食、贪食和暴食等疾病的复杂信号。许多防护措施忽略了专业人士在诊断时依赖的细微线索,使风险长期被忽视。(来源:IT 之家)

苹果推出限量版 iPhone Pocket 配件,与日本时尚品牌三宅一生合作设计

苹果公司联合日本著名时装品牌三宅一生(ISSEY MIYAKE),正式发布限量版配件「iPhone Pocket」。该产品采用 3D 针织工艺,设计用于携带 iPhone、AirPods 及其他日常物品。

据悉,iPhone Pocket 外观类似悬挂式口袋,采用罗纹伸缩纺织面料,可完全包裹 iPhone,同时通过开放式结构可隐约看到屏幕。用户既可手持,亦可将其挂在包具或直接佩戴于身上。三宅一生设计总监宫前善之(Yoshiyuki Miyamae)表示,产品探索了「以自己的方式穿戴 iPhone 的乐趣」。

iPhone Pocket 分为两种规格:短带款和长带款。短带款提供八种配色(柠檬、橘色、紫色、粉色、孔雀蓝、蓝宝石、肉桂色和黑色),售价 149.95 美元;长带款有三种颜色(蓝宝石、肉桂色和黑色),售价 229.95 美元。苹果方面称,该配色方案可与所有型号和颜色的 iPhone 进行自由搭配。

iPhone Pocket 将于 11 月 14 日上线苹果官网,同时在全球 10 家旗舰苹果零售店发售,包括伦敦 Regent Street、纽约 SoHo 和东京银座等地。(来源:cnbeta)

索尼日区限定 PlayStation 5「低价版」发布:11 月 21 日上市,仅售 5.5 万日元

11 月 12 日消息,在 State of Play Japan 活动上,索尼宣布将于 11 月 21 日起推出仅在日本市场独占的 PlayStation 5「日语专用版」,也就是之前曝光的「低价数字版」。

PS5「日语专用版」官方定价仅 5.5 万日元(约合 2542 元人民币),相比目前 72,980 日元的 PS5 数字版降低了 17,980 日元(约合 831.1 元人民币),使用限制可参考任天堂 Switch 2 的纯日语版。

同时,索尼还公布了一款 PlayStation 游戏显示器,内置 DualSense 无线控制器的充电挂钩,采用 27 英寸 QHD 面板,支持 240Hz 刷新率(连接 PS5 时最高支持 120Hz),支持 VRR。(来源:快科技)

警惕 AI 大模型「读心」:央视提醒含个人信息的图片别往朋友圈发

据央视新闻报道,随着大模型在各行业深度应用,其安全风险呈现出复合化特征。看似简单的图片、文字信息等内容通过 AI 处理,可能泄露个人身份信息、人际关系等敏感内容

网络专家指出,AI 大模型安全涵盖数据、基础设施与模型本身三大层面,其中个人使用中的数据安全风险尤为突出。有时只是上传了一张合影照片,想通过 AI 来处理一下,就有可能暴露个人信息。照片上传后,人像识别技术会把人物身份提取出来,还可能被不法分子进一步利用。

央视提醒含个人信息的图片千万别发在朋友圈,例如:

  • 发布含有个人信息的火车票、飞机票、登机牌、车牌等票证,可能会被另有图谋的陌生人获取,从而导致个人隐私泄露。

  • 身份证、护照、驾驶证、结婚证等证件中,都包含重要的个人隐私,不要随意在网上发布。

  • 尽量不要发自己的定位信息,这些信息容易暴露真实的个人住址,有可能带来不必要的麻烦和风险。

  • 避免发布老人和孩子的照片及姓名,以防不法分子利用这些信息进行违法活动,建议以分组的形式分享给亲人看。

(来源:央视新闻)

 

年产值突破 150 亿,刚毕业的俊男美女涌入「团播」工厂

2025年11月11日 16:35

 

 

在抖音或者小红书,你现在很难不刷到他们:灯光闪烁,音乐鼓点震耳,一群妆容精致的帅哥美女正在整齐划一地跳着舞 。你甚至来不及看清动作,镜头就忽然拉近,怼到一张扑闪着睫毛的白皙脸庞上。

 

这是「团播」,一种多人在同一直播间进行舞蹈、唱歌等才艺表演的新型直播形式 。

 

从2022年开始,团播从一些模糊地带火起,最初只是一种小众文化,现场配置简单——纯色背景、固定灯光和单一机位,四五个主播按虚拟礼物点播顺序,轮流登场表演舞蹈。

 

当时,团播只是直播边缘的小众玩法,缺乏成熟的运营模式,内容形式相对简单,往往流于表面。

 

但今天,它已经变得无处不在,随手在抖音或者小红书划拉几下,就会映入视线,大众也开始习以为常。事实上,团播也已经成为直播行业最热闹的赛道之一。据《2025中国网络表演行业团体直播业务现状与发展情况分析报告》,团播2025年日均开播房间数达到约8000个,同比增长超20%,预计今年营收将突破150亿元。

 

从一个边缘的小众文化,到如今被主流文化逐渐接受——甚至成为一个有望达到150亿市场规模的产业 ——这中间到底发生了什么?

 

1 百万级灯光,一座「内容工厂」的诞生

 

最开始,团播只是几个帅哥美女开个美颜在排练室里跳舞、表演才艺,现在,已经成为对标专业舞台的存在。

 

 

图片来源:极客公园

 

上个月月底,极客公园在重庆实地探访了一家团播公会「重庆长鲸」——感觉看的像是一个小型晚会现场。

 

「鲸·渝」直播间|视频来源:极客公园

 

走进长鲸为「鲸·渝」厂牌打造的直播间,我被现场的炫目的灯光,专业的摇臂,以及众多的幕后工作人员所惊讶到。这已经不再是团播初期通常只有纯色背景、固定灯光和单一机位的简单配置。

 

「鲸・渝」厂牌是长鲸的「旗舰产品」,定位为「以传统为基底,融合现代元素」 ,这是因为运营团队发现,过去半年,传统相关内容的观众增长了30%,且留存率很高 。

 

在探访中极客公园了解到,长鲸的单个直播间配置200多台专业灯具,按「面光+轮廓光+染色光+追光」层级布局,3台固定摄像机和1台专业摇臂组成拍摄矩阵,配合导播实时切换全景、中景与特写镜头,还有线阵列音响系统用来还原传统乐器的细腻音色。

 

有行业调研显示,一个团播直播间的硬件成本「少则30万,上百万的也有」 ,其灯具标准基本是和央视的演播厅看齐。

 

技术升级的背后,是团播行业对「视听体验」的重新定义。抖音直播业务代表余暖暖提供的数据显示,2024年以来,采用专业演播设备的团播直播间数量同比增长230%,这类直播间的观众平均停留时长是普通直播间的2.8倍。

 

「观众的审美阈值在提升,手机直播的模糊画质和单一视角已经无法满足需求。」余暖暖解释道,抖音平台推出的「优质团播计划」中,专门将「硬件专业化」作为流量扶持的重要标准,鼓励公会投入演播级设备。

 

长鲸传媒的技术中台团队印证了这一趋势。长鲸为主播配备了演播室、化妆间、服装间、新人训练营、一对一加练的小舞蹈室等。

 

团播现场|图片来源:极客公园

 

而这个由妆造、运镜、灯光、中控等专业人员组成的后台团队,人数是前台主播的1.5倍。灯光师会根据不同舞蹈风格定制灯光方案——比如跳国风舞蹈时用暖光营造典雅氛围,跳现代舞时用冷光突出线条感。

 

服装部门也从不直接买成衣,而是找专业设计师,根据主题设计专属服装 。比如传统主题会参考云纹、水纹等元素,并改良领口和裙摆,确保主播既好看,又方便完成大幅度动作。

 

这套体系还有着严格的品控流程。长鲸运营总监李超鹏详细描述了这套内容生产线是如何展开的:

策划(提前两周):运营团队先梳理数据,分析「观众离开率高的时间段」 ,然后与主播、指导老师一起开策划会,确定主题和互动环节 。

排练(提前一周):专业老师带队,每天练习2-3小时 。团队会录下视频,一起看回放,逐帧调整「动作的整齐度、队形的合理性和情绪的表达」 。

彩排(直播前一天):全团队进行全流程彩排。主播穿好服装、化好妆,运镜、灯光、音响全部跟上。彩排中发现的任何问题,都「必须当天解决」 。

复盘(直播结束后):直播结束不能马上散场,全体成员立刻观看回放。复盘结果被整理成文档,制定改进计划,确保「同样的错误不犯第二次」 。

 

2 穿上「新长衫」的年轻人

 

所以为什么受过专业训练的年轻人——那些来自艺术院校的学子——愿意成为团播的一环?

 

做团播,会像很多人想象中的「孔乙己脱下长衫」吗?

 

长鲸主播林不染是从模特转型到团播的。他毕业于吉林艺术学院的模特专业,12岁开始系统学习。毕业时,他收到了几家模特公司的offer,但最终选择了长鲸。

 

他坦言自己起初是不想来到团播这个行业的,因为不是很关注互联网。但深入了解后,他发现传统的模特行业工作内容比较单一,发展前景窄。相比之下,团播公会提供的,则是一个「多栖发展」的新起点 。

 

林不染的日常工作是每天9小时:2小时舞蹈训练,1-2小时妆造,5小时直播,以及1小时的下播复盘 。

 

这是一个高强度、高标准、持续精进的过程。在公会,他从只擅长民族舞,到现在学会了现代舞、爵士舞和街舞,专业能力得到了极大提升 。

 

不只有林不染这样从模特转行来的,还有舞蹈专业的学生、出道艺人以及练习生等。在这里,素人也可以在舞台上找到自己发光发热的地方。

 

新人正在排练|图片来源:极客公园

 

据长鲸的工作人员透露,新人训练营的培训周期通常在15天左右,从早上十点到晚上十点都有课程安排可供选择,内容包括形体、律动、基本功等。通过考核和筛选,就可以留下来。

 

对于林不染这样的年轻人来说,团播是一个「软着陆」空间。公会与吉林艺术学院、南京传媒学院、四川电影电视学院等专业院校建立了「校企合作」 。就长鲸而言,目前百分之七八十的主播都来自高等院校。

 

对于这些院校的学生而言,团播提供了一个能即时变现、拥有稳定曝光的舞台,解决了传统艺术行业「毕业即失业」的窘境 。

 

团播也为他们提供了一个更清晰的「上升通道」。公会不仅提供培训和保险 ,它们也会主动拓展主播的发展途径,比如为主播对接短剧、商演等资源,以及支持支持主播的个人成长。林不染提到,有编排天赋的主播,公司会支持他成立自己的编排小组,负责部分内容创作 。

 

「孔乙己」的问题在这里得到了解答。这群穿上「新长衫」的年轻人,并没有被「工厂」磨灭个性,反而在这个新舞台上,找到了比更广阔的职业可能。

 

3「无形之手」

 

从表演形式也相对单一,一般是四五个主播按虚拟礼物点播顺序,轮流登场表演舞蹈,到演变为才艺秀场,说唱 battle、杂技绝活、魔术戏法等轮番上阵,甚至衍生出国风传承者、二次元破壁者等品类。

 

团播已经突破了跳舞机器的刻板印象,成为跟普通直播一样被大众所喜闻乐见的娱乐内容。

 

当公会重金投入、专业人才涌入团播赛道,这场小众文化「入侵」主流背后,是抖音直播的内容生态升级逻辑。

 

平台正在推动团播从野蛮生长的草莽阶段,走向标准化、精品化的工业时代 。

 

首要任务是「清理门户」。团播的「草莽期」充斥着高风险的运营模式。低俗擦边、公会不合理压榨主播、未成年人直播等问题,不仅是行业生态的隐患,也是平台不能忽视的监管红线。

 

抖音直播业务代表余暖暖在交流会上谈到,「一定不要任何违规内容」 ,「如果有机构想通过擦边低俗的方式获取流量,那么一定是会被这个行业淘汰」 。

 

这种治理,体现在下面一系列具体的规范和工具中:

清退公会:定期发布公示,清退涉嫌传播色情低俗信息、诈骗或为未成年人提供经纪服务的违规公会 。

规范合约:发布《直播机构与主播合作签约与履约规范》,约束公会不得设置高额违规金或不合理要求,保障主播权益 。

责任绑定:实行「健康分」制度 。主播的违规行为会直接影响分值,0分将被永久回收直播权限 。同时,主播的「健康分」与所属公会绑定,倒逼公会履行管理责任 。

 

在划定底线之后,平台的另一手是「定义顶层」,定义优质内容。抖音直播的运营逻辑是用流量分配机制,引导公会生产平台所定义的「优质内容」 。

 

平台主动下场扮演「星探」的角色,从供给侧寻找新的增量。比如引入「国家队」,包括吉林省歌舞院团、陕西省歌舞院团等专业院团 。甚至杨丽萍也曾带着孔雀舞团来抖音做团播 。这些专业力量的入场,客观上拉高了行业的内容制作门槛,让网友在直播间就可以看到专业舞台级演出。

 

还有扶持「专业内容」,抖音平台推出了「艺播计划」(面向专业院团)和「爱播星途计划」(面向专业舞蹈生) ,从源头上确保人才的专业性;打造「样板间」,抖音平台发起「优质团播计划」,目标是在2025年底前培育超过100个「精品化」、「专业化」的优质团播 。

 

最初,团播的兴起伴随着草莽的标签,并不被主流文化圈广泛接纳和认同。而现在,「团播」正在经历一个从「小众文化」向「主流文化」融入的过程。

 

回到最初的问题:为什么团播这个「小众文化」能融入主流?

 

三方的目标达成了一致。抖音平台通过「底线监管」和「顶层扶持」,摆脱了低俗内容的风险,获得了一个更安全、更优质、更具商业价值的精品内容生态。

 

公会比如长鲸通过「重投入」的工业化流程,打造出「鲸·渝」这样的厂牌 ,建立起「慢」但可持续的商业模式,安心地去接短剧、商演和品牌联动 。

 

创作者也在这条流水线上找到了比传统艺术行业更广阔的舞台 。他们获得了稳定的工作、专业的培训和「多栖发展」的未来 ,穿上了一件更体面的「新长衫」。

 

 

 

 

 

 

 

❌
❌