阅读视图

发现新文章,点击刷新页面。

OpenAI 的「群聊」,可能比你想得更重要!

作者| 金光浩

编辑|靖宇

仿佛再一次精准狙击谷歌,就在谷歌新模型 Gemini 3.0 开启小范围内测之际,OpenAI 再次出手。

当地时间 11 月 13 日,OpenAI 官宣推出「群聊」功能,让让用户能够在同一对话中轻松实现人际协作,当然,还可以把 ChatGPT 也拉入一起协作。通过群组聊天功能,用户可邀请亲友或同事进入共享空间,共同策划方案、决策讨论或头脑风暴。

功能首次开放给日本、新西兰、韩国等地区用户。在体验过后,极客公园觉得, OpenAI 在个人助手的基础上,开始逐渐向「团队协作」这个 SaaS 最火热的战场,开始蠢蠢欲动

在看似主打「社交」的功能里,藏着 OpenAI「协作平台」的野心。

 

01

有「眼力见」的 AI

 

功能本身不复杂,你可以轻松创建一个群聊,通过链接可以邀请最多 20 位成员加入。群聊数据与你的个人 ChatGPT 记忆完全隔离,不必担心自己的私密对话被泄漏。

ChatGPT 的群聊功能|图片来源:OpenAI

 

但是,在群聊里,我们和 ChatGPT 的交互逻辑彻底变了。

你可以通过「@」ChatGPT 明确地召唤它,确保它在关键时刻回应你的需求,而当我们不 @ 它时,它也能判断该不该说话。

这种体验和「微信群里拉个聊天机器人的感觉」不同。

区别在哪?

主动性

传统的群内机器人必须被 @ 才会回应,但 OpenAI 的群聊 AI 会自己判断什么时候该说话。

是的,新的群聊功能,正在教它「闭嘴」。

而「闭嘴」背后,是 OpenAI 给 ChatGPT 巧妙设计的场景感知能力。

ChatGPT 的群聊功能|图片来源:OpenAI

 

我在测试群里和同事聊了 20 分钟周末计划和食堂吐槽,AI 全程沉默。

直到有人抛出「最近有什么好看的科幻片」,它才出现并推荐了三部电影 。没有人 @ 它,但它判断出这是一个「可以提供帮助」的时刻。当然,它的判断并非完美,经常还是会在不该说话时插嘴。

此外,群聊提供了丰富的多模态能力支持:

在群聊里,AI 可以联网搜索最新信息,为讨论提供数据支持和事实核查;也可以直接生成图片;成员上传文档,它能进行摘要、分析、翻译或提取关键信息。

ChatGPT 的群聊功能|图片来源:OpenAI

 

更强大的是,基于群聊的上下文,它能对每个人进行建模,理解每个人的对话风格和需求。

ChatGPT 的群聊功能|图片来源:OpenAI

 

当然,最初的体验有些微妙。

群里多了一个看不见的「人」,总感觉随时在被「偷听」。

但用几次就习惯了,就像团队多了个极有眼力见的实习生。

 

02

从个人助理,到协作平台

 

OpenAI 做群聊的真实原因,可能和大多数人想的不一样。

答案不是模型遇到瓶颈,而是 OpenAI 的商业化逻辑在调整。

OpenAI 明白了一件事:只卖 API,客户随时能换供应商。 而要真正留住用户,得让他们在你这儿沉淀关系和数据 。就像我们离不开微信一样。

群聊就是按照这个思路, 把 ChatGPT 从个人助理变成了一个可协作的平台

这样就产生了网络效应,当用户用 ChatGPT 不是因为模型出色,而是因为项目、客户在这时,这时候,用户离开的代价就不是换个 API 接口或者模型那么简单了。

chatGPT 的群聊功能|图片来源:OpenAI

 

此外,群聊功能,也是在测试 ChatGPT 的社交能力。

在多人对话中,AI 要理解复杂的上下文,揣摩不同人的意图,判断什么时候该开玩笑、什么时候该严肃。这些都是人类社交的基本能力。而只有掌握了这种能力,AI 才能进入人类的日常协作。

这里有个有趣的想法, 如果未来群聊功能再增加小窗私聊功能,AI 就可以在群里和大家有更多的互动,AI 可以扮演上帝和 DM,跟用户一起玩狼人杀、剧本杀

ChatGPT 的群聊功能|图片来源:OpenAI

 

03

多 Agent 协作的未来?

 

再往远看,OpenAI 的群聊功能,很有可能在测试多 Agent 协作。

想象一下不远的未来,当你在项目群里说:「咱们做个读书笔记 App」。

然后 ChatGPT 们自动捕捉到这个信息,群里的 GPT 产品经理开始问需求、写 PRD,GPT 工程师同步列技术方案,GPT 设计师画原型,GPT 测试准备用例清单。

它们互相讨论、互相挑刺,你只需要在关键节点拍板。

听起来很科幻?但今天的群聊功能很有可能就是第一步。

单 AI 群聊,可能就是在为多 AI 协作,做第一步的技术验证和用户教育。

当单 Agent 能在多人场景里自然协作,多个 Agent 的分工配合也就不远了。

如果说微信定义了移动时代的沟通方式,那么 OpenAI,正在定义 AI 时代人与机器的协作范式。

当大部分人还在用 AI 总结会议记录时,OpenAI 已经让 AI 坐进了人类的会议室。

群聊功能,可能又是一个时代的转折。

字节张楠、张宏江、田渊栋······极客公园创新大会 2026 嘉宾阵容更新!

他们是在 AI 浪潮中定义未来的顶尖思考者与实践者——技术领袖、超级个体、硬核创业者齐聚北京,带来关于「非共识」的深度洞察。 他们将围绕大模型、Agent、AI 硬件、具身智能、人机关系、AI 医疗、AI 影像等前沿方向展开高密度交锋。 主舞台四大主题 × 小场深谈 × AI 产品快闪,只讲真话、只聊前沿。 12 月 6-7 日,北京 798艺术区,与改变未来的「关键少数」同频共振——进程由我 On The Loop! 余票有限,你,准备好了吗?

为什么说在 AI 时代,「想象」比「记录」更费劲?

图片来源:即梦

2024 年 2 月,张楠辞去抖音集团 CEO 一职。曾经主导抖音这一现象级产品的她,选择在 AI 浪潮席卷而来时,转身投身于充满未知的 AI 创作领域,将全部精力聚焦于剪映的发展。

时隔一年半,站在 2025 年的尾声,张楠带着剪映与即梦,来到了极客公园创新大会 IF 2026 的现场。

为什么是现在?因为她在构建一个「新世界」。

当大多数人都在欢呼 AI 极大地降低了创作的「摩擦力」时,作为剪映和即梦业务的负责人,张楠却更关注想象的力量。她曾说,希望即梦成为「想象力世界」的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。

她相信以「生成」为核心、将创作权交还给普通人的 AI 应用,才是这场技术浪潮的真正主角。大洋彼岸,AI 正在入侵好莱坞,而张楠在想如何让普通人用 AI 导演出一个好故事。

在这个充满不确定性的 AI 新大陆,她正在进行一场关于 AI、关于创作的新实验。

这并不是张楠第一次站在浪潮的中心。几年前,她曾带着团队将抖音打造成了国民级的现象产品。这一次,她选择试图去掉大厂成熟业务的光环,在 AI 创新的宏大背景下,携剪映作为一个「探索型组织」重新出发。

Sora App 是 AI 版的抖音吗?

为什么说「想象力」才是 AI 视频真正的瓶颈?

人类与 AI 如何才能共同涌现出惊艳的作品?

AI 创作的终局是什么?

AI 时代,组织如何重塑?

推动 AI 这场变革,必须依赖「00 后」吗?

我们现在有机会,听听这位从移动互联网时代的巅峰走来,又一头扎进 AI 浪潮的探索者,到底看到了什么。

12 月 6 日,极客公园创新大会 2026「非共识」追问场,你将听到张楠亲自分享,关于剪映与即梦、关于那个用 AI 为十亿人想象力打造的新世界。

杨立昆宣布离开 Meta「自立门户」;荷兰暂停干预安世半导体;TikTok 将支持用户设置减少 AI 内容

任职 12 年后,Meta 首席 AI 科学家杨立昆宣布离职并「自立门户」

11 月 20 日消息,效力 12 年后,Meta 首席科学家杨立昆(Yann LeCun)宣布即将离职,并创办自己的 AI 创业公司。

杨立昆长期在纽约大学任教,2013 年加入 Meta 领导 FAIR 实验室,随后成为首席 AI 科学家。FAIR 在深度学习研究、计算机视觉、基础模型以及大量前沿算法上奠定了 Meta 的核心技术路线,而杨立昆在整个阶段始终扮演关键角色。

杨立昆说,新公司将承接他与 FAIR、纽约大学及其他同行过去几年共同推进的 Advanced Machine Intelligence(AMI)研究计划,并且会继续与 Meta 保持合作。

据其介绍,新公司的目标是推动 AI 的下一次重大跃迁,让 AI 系统能够理解现实世界、具备长期记忆、能够进行推理,还能规划多步骤的行动流程。AMI 未来在许多行业都能产生影响,部分方向会与 Meta 的业务相关,但更多方向并无直接关系,而以独立公司开展 AMI 研究能够让成果更自由地传播,也能让研究脱离大型企业内部的短期商业压力。

据彭博社报道,杨立昆近来在内部争取研究资源时愈发困难,因为 Meta 更专注于开发能应对 OpenAI、Alphabet 旗下谷歌以及 Anthropic 等竞争对手的产品式模型。这意味着 AMI 这种强调长期探索性质的研究,在大规模商业竞争的背景下较难得到优先支持。(来源:IT 之家)

英伟达 Q3 财报全面超预期,盘后股价再冲高

美东时间周三盘后,人工智能(AI)龙头股英伟达公布了超出预期的三季度财报。在美股市场因估值担忧而持续低迷之际,英伟达再次不负众望,交出了一份优异答卷。

英伟达周三收盘时上涨近 3%。截至发稿,随着财报公布,英伟达股价盘后进一步上涨超 6%。

财报显示,英伟达第三财季营收为 570.1 亿美元,超出市场预期的 549.2 亿美元;净利润为 319.1 亿美元,同比大涨 65%,经调整后的每股收益为 1.30 美元,高于市场预期的 1.25 美元。

数据中心——英伟达最重要的业务——Q3 营收为 512 亿美元,轻松超过分析师预测的 490.9 亿美元,同比增长 66%。其中,「计算」(即 GPU)业务贡献了 430 亿美元营收;网络业务(即允许多个 GPU 能协同工作的组件)贡献了 82 亿美元。

英伟达首席财务官 Colette Kress 在声明中表示,公司当前最畅销的芯片系列是 Blackwell Ultra,这是 Blackwell 芯片的第二代产品。

英伟达 CEO 黄仁勋还在声明中提到:「云端 GPU 已经全部售罄。」(来源:财联社)

 

荷兰宣布暂停干预安世半导体,控制权归还闻泰科技

11 月 19 日消息,荷兰当地时间 11 月 19 日,荷兰经济事务部官网发布公告,部长文森特・卡雷曼斯(Vincent Karremans)宣布,暂停此前针对安世半导体(Nexperia)的相关干预措施,将安世半导体的控制权归还其母公司闻泰科技。

卡瑞曼斯表示,此举「旨在展现善意」,未来一段时间,将继续与中国当局进行建设性对话。(来源:IT 之家)

 

快手 2025 年第三季度总营收 356 亿元,同比增长 14.2%

11 月 19 日消息,快手公布第三季度业绩。财报显示,本季度快手总营收同比增长 14.2% 至 356 亿元,其中包含线上营销服务和以电商为主的其他服务在内的核心商业收入同比增长 19.2%。在保持对 AI 战略的持续投入下,快手第三季度经营利润同比增长 69.9% 至 53 亿元,经调整净利润同比增长 26.3% 至 50 亿元。

财报显示,2025 年第三季度,快手应用的平均日活跃用户规模达 4.16 亿,再创历史新高,平均月活跃用户达到 7.31 亿,平台双关用户的日均私信渗透率同比提升超 3%。每位日活跃用户平均线上营销服务收入为 48.3 元,而 2024 年同期为 43.3 元;电商商品交易总额(GMV)为 3850.435 亿元,而 2024 年同期为 3341.625 亿元。(来源:IT 之家)

OpenAI 推出 GPT‑5.1-Codex-Max 编程模型,专为长时间运行的任务打造

OpenAI 今日发布了 GPT‑5.1-Codex-Max,这是一款面向长时间运行任务设计的新一代 Agentic 编码模型。相较于之前的模型,GPT‑5.1-Codex-Max 采用了「压缩(compaction)」技术,可在多个上下文窗口间工作,甚至能在单次任务中可靠处理百万级别的 Token。OpenAI 表示,该模型不仅性能提升,还实现了更快、更高效的 Token 利用率。

据了解,GPT‑5.1-Codex-Max 训练过程涵盖了真实世界的软件工程任务,如 PR 创建、代码评审、前端开发及问答等,并在众多前沿编程评测中表现超越此前的模型。

除支持 Unix 平台外,GPT‑5.1-Codex-Max 还专门针对 Windows 环境进行了训练。

此外,得益于推理能力提升,GPT‑5.1-Codex-Max 在 SWE-Bench Verified 上完成相同任务时,使用的思考 Token 比 GPT-5.1-Codex 减少了 30%。通过「Extra High(xhigh)」推理模式,模型在复杂任务中可投入更深入的思考。

目前,GPT‑5.1-Codex-Max 已在 Codex CLI、IDE 扩展、云端和代码评审等产品中上线,支持 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 高级订阅用户。同时,OpenAI 也将于近期将该模型引入 API,并在 Codex 中替换为默认模型。(来源:cnBeta)

 

谷歌 CEO 皮查伊:人工智能有朝一日能胜任我的工作

11 月 19 日消息,人工智能已开始挤压部分初级岗位,但谷歌首席执行官指出,即便是企业最高管理层职位也难逃影响。

「我认为,首席执行官(CEO)所承担的工作,或许正是未来某一天人工智能最容易胜任的职责之一。」谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)在周二播出的英国广播公司(BBC)专访中表示。

这位谷歌掌门人指出,他相信人工智能将很快具备更高级别的自主任务执行能力,届时,AI 模型将能像「智能体」(agent)一样代表用户行事。

「我认为,未来 12 个月内,我们将见证一个重要演进:AI 将能够为您处理更为复杂的任务。」他补充道。

此前 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)也发表过类似的言论。上月,在接受阿克塞尔・施普林格集团(Axel Springer)首席执行官采访时,奥尔特曼曾表示:「我相信终将有那么一天,人工智能会比我本人更胜任 OpenAI CEO 一职,而当这一天真正到来时,我只会满怀热忱、欣然接受。」(来源:IT 之家)

 

TikTok 将开放用户设置,减少短视频信息流中的 AI 内容

11 月 19 日消息,短视频平台 TikTok 将支持减少用户看到的 AI 内容。该应用正在试验一项新设置,允许用户在他们的「为你推荐」信息流中「看到更少」的 AI 内容。

这个新开关将在「未来几周」出现在应用的「Manage Topics」部分。在博客文章中,TikTok 表示 Manage Topics 功能已允许用户调整他们看到与舞蹈、体育、餐饮等超过 10 个类别相关内容的频率。与这些控制选项类似,AIGC 设置旨在帮助用户定制他们信息流中的多样化内容,而不是完全移除或替换信息流中的内容。

为了加强 AI 生成内容标签,TikTok 还在测试一种名为「隐形水印」的解决方案。在未来几周内,TikTok 将开始向使用 TikTok 工具(如 AI Editor Pro)生成的 AI 内容以及使用 C2PA 内容凭证上传的内容添加不可见的水印。这些水印将帮助 TikTok 更可靠地标记内容,并提供更多关于内容变更的背景信息。(来源: IT 之家)

 

俞敏洪:新东方青少年南极考察之旅有望明年冬天开启

11 月 19 日消息,新东方创始人俞敏洪在社交平台发布视频,称:这次应奚老师邀请来南极,在深刻感受大自然壮美的同时,也一起探讨了未来中国孩子自然教育的前景。新东方将会成立专门的青少年探索中心,带领孩子们探索大自然,用科学的方式让孩子们理解大自然、爱上大自然、保护大自然!专门针对青少年的南极考察之旅也有望在明年冬天开启。

11 月 16 日,新东方成立 32 周年之际,创始人俞敏洪从南极向全体员工发送了一封题为」冰雪中的坚守」的内部信。在信中,他描绘了南极的壮丽景观,并以企鹅相互扶持来类比团队精神,回顾创业历程,展望公司未来。

然而,这封原本旨在凝聚人心的信件,却因老板的」诗和远方」与员工的」加班日常」形成鲜明对比,引发了大量员工和网友的吐槽,相关话题迅速登上热搜。

不过,俞敏洪及新东方官方尚未对此争议作出正式回应。在 11 月 18 日,俞敏洪还在微博连发 10 条南极游相关视频。(来源: TechWeb)

 

贾跃亭发文:加速偿还国内担保债务 尽早回国

11 月 19 日消息,早间贾跃亭在个人微博发文称,第二个债权人信托正式成立,将加速偿还国内担保债务,尽责到底早日回国。

第二信托的资产主要来源于两部分:一是 FF 授予贾跃亭的「股东股民 First」股权激励下获得的股份的 50%;二是贾跃亭投资的纳斯达克上市公司 AIXC 所对应的约 7% 股份的 50%,这笔投资的本金来自于 FFGP 合伙人公司借款。

贾跃亭称,「之所以只有 50% 进入第二信托,是因为我会将另外的 50% 全部继续投入 FF,用来支持 EAI 飞轮业务,进而加速 FF 的价值释放和加快还债。」

贾跃亭在文中强调,「我生命中只有两件事,一个是打造 EAI 生态,给社会带来变革性的驱动作用,另一个是还清国内债务,早日回到祖国。」(来源: TechWeb)

「全球最小可穿戴设备」:Lumia 2 智能耳环登场,重量不足 1 克、满电续航 8 天

11 月 18 日消息,科技媒体 T3 报道称 Lumia 公司推出智能耳环 Lumia 2,号称「全球最小可穿戴设备」,重量不足 1 克,却能在耳内高精度追踪睡眠、体温、月经周期及身体准备度等关键健康数据。

Lumia 2 智能耳环重量不足 1 克,但集成了 Lumia 第二代 PreciseLight 传感器、处理器、电池及多种健康传感器。Lumia 宣称,凭借在耳内佩戴的独特优势,Lumia 2 能够实现比腕上设备更高精度和连续性的健康数据追踪,监测范围覆盖睡眠质量、体温变化、月经周期以及身体准备度等核心指标。(来源:IT 之家)

 

消息称三星内部正开发两款智能眼镜:外观类似 Meta 雷朋,配备变色镜片

11 月 19 日消息,据科技媒体 Android Authority 报道,三星今年正式进军 XR 市场,推出首款产品 Galaxy XR,目前只在韩国、美国两个市场发售,但三星计划在未来几个月内逐步扩展上市区域。

与此同时,三星内部正在开发的两款智能眼镜也逐渐浮出水面,预计将在 2026 年(明年)和 2027 年推出。

据报道,这其中明年推出的智能眼镜型号为 SM-O200P,与 Galaxy XR 头显 SM-I 开头的型号存在本质区别,有消息称这款眼镜将搭载变色镜片,在太阳光照射的情况下会自动变暗,类似太阳镜,回到室内等光照充足的环境则会增强透光率,保持透明。

不过目前的消息还不足以证明这款眼镜具备投射画面的 AR 功能,因此这款眼镜很可能与 Meta 雷朋 AI 眼镜类似,并不具备完整的 AR 显示功能,交互形式将以语音为主。

硬件方面,这款眼镜将配备摄像头,可通过 AI 功能进行物体识别、实时翻译等,支持 Wi-Fi 和蓝牙连接,但并没有移动数据网络连接功能,意味着这款眼镜可能无法脱离手机使用。(来源:IT 之家 )

前暴雪 CEO 鲍比・科蒂克称马斯克会是「最好的游戏公司老板」

11 月 19 日消息,前动视暴雪 CEO 鲍比・科蒂克上周(11 月 14 日)出席《Rushmore》视频播客,与特斯拉 CEO 埃隆・马斯克讨论最好的游戏,并称这名汽车公司 CEO「可能是游戏公司的最佳掌门人选」。

科蒂克认为,马斯克理解游戏创意的实现过程,也能知道游戏是如何制作出来的,他认为这种品质甚至比游戏经验更为重要,不过部分观众却对这种观点持相反意见,有用户甚至在 X 平台上质疑「这人真的懂游戏么?」。

马斯克本人曾多次展现出对游戏行业的浅层认知,他今年早些时候直播玩《流放之路》时曾在游戏基础机制上频频出错,成为玩家群嘲对象;此前他还表示《杀出重围》是他最喜欢的游戏,并发表个人对剧情的见解,但游戏编剧 Grossman 随后指出马斯克完全误解了游戏剧情。

不过尽管如此,马斯克确实非常热爱游戏,他多次在公开场合称《半衰期 2》、《生化奇兵》是自己最喜欢的游戏,也曾与《赛博朋克 2077》开发团队合作,成为游戏中名为「cameo」的 NPC。(来源:IT 之家)

 

对话斑马口语:如何用 AI Agent 造出「超人类外教」?

作者|张鹏

编辑| 郑玄

 

最近,斑马口语正式上线,用纯 AI 外教与学生一对一全英授课,引发了行业不小的关注。

AI 口语并不是一条新赛道, 其中的玩家也良莠不齐:既有像 Speak 这样重投入打磨真人视频的,也有大量给大模型「套一层皮」就匆忙上阵的。

斑马口语的目标,和其他公司则并不相同:斑马想要用 AI 打造一个超越真人的「AI 原生」口语解决方案。

这意味着,要让 AI 主导教学,让 AI 发挥出真人没有的能力:针对性的纠正,个性化的话题,还要真的对结果负责——不是增加一个练口语的功能,而是真的让学生在和 AI 对聊后获得提升。这是整个行业之前前所未见的。

这个挑战,不仅带来了技术上的难题,也需要对「教育」有极深的理解:比如,AI 教师如何真正激发孩子的兴趣?这背后都在考验团队是否具有真正的教学经验中积累的「手感」。

而比「手感」更深层的挑战,是组织力。一个真正的 AI 原生 Agent,诞生的前提,必然是一个「产模一体」的 AI Native 组织。这不只是一个产品问题,更是一个关于组织进化的「终极命题」。

 

01

比真人外教还会教的 AI 外教

 

口语外教是一个被验证过的需求,用 AI 代替真人外教,降低成本,很合理。但真正的难点在于: AI 如何能超越真人?

真人外教的局限性是天生的:他们会累、会忘、会不稳定,并且无法实现「千人千面」的颗粒度。而这,恰恰是 AI Agent 的机会。为了实现「200 分」的目标,斑马从几个真人无法企及的核心点发力:

首先,是提供即时、可交互的真实语境。

这个正如下面的案例所展示的,当 AI 老师想要教会小朋友生日派对相关的英语时,AI 能无缝切换到一个生日派对现场,聊孩子爱吃的派对食物。

AI 让这种高成本、一次性的「真实世界」体验,变得轻盈、可控且无限重复。

除此之外, AI 还能实现真人无法企及的「高颗粒度的个性化进阶路径」。 人脑的记忆是有限的,但 AI 的记忆是无限的。

斑马的 AI Agent 会把每个孩子当作一个系统来建设,它记得孩子上一次对话的每一个细节、每一个薄弱点。当孩子学口语遇到瓶颈时,AI 能设计出「微小的一步」,在下一次对话中推着他往前走。

这种「长期积累的陪伴」和「微小颗粒度的进阶」,是任何真人老师都无法规模化实现的。

第三点,或许有点出人意料,反而是 AI 的情商。

AI 做外教,肯定会有人担心,AI 毕竟是「假人」,孩子怎么会愿意和它交流?但斑马团队的数据显示,传统真人外教一对一,孩子前三分钟的开口率大约是 85%;而在斑马口语中,这个数字是 98.8%。这来自细节的打磨——比如一个细节是 AI 外教 Jessica 的形象。

在技术上,用 3D 形象配合 AI,其实比 2D 更成熟、更方便。但斑马反其道而行,选择了 2D。

「我们之所以选择二维,是因为 3D 角色,更像是模仿真人,容易产生恐怖谷效应,影响孩子『入戏』。」修佳明提到。「我们挖掘了过往真人外教的数据,抽象出了「孩子最喜爱、学习效果最好」的外教特征——包括脸型、发色,设计了 Jessica。」

但让孩子想开口只是第一步,斑马也希望用高情商让孩子更爱学习口语。

比如在前面说到的生日派对的课件里,一个正在学习的孩子突然说「我不想办生日 party」。AI 外教 Jessica 的回复同样情商极高,她说:「Of course you can say No. Some people like quiet birthdays. That's OK too.」然后无缝地将话题切换到「参加别人的生日派对」,把教学进度自然地延续下去。

这种永远稳定、充满耐心、人格统一、且总能「捧场」的灵活性,恰恰是真人老师难以做到的。它让 AI Agent 从一个「工具」,变成了一个孩子愿意分享秘密的「新物种」。

而这种「新物种」带来的信任感和情感连接,看似只是锦上添花,实则正触及了教育中最难的命题: 动机

如何让孩子有动力学下去?绝大多数教育产品,依赖的是「工具型动机」——奖励、打卡、游戏化。

但通过与这个孩子真正「想聊」的 AI 外教交流,学英语的动机就变了。孩子不会想「我说英语会给我带来什么奖励」,他想的是「我必须说英语,才能完成这件事」——和虚拟的老师、小学伴们交流。

学习的成就感内化于这个过程,最终让说英语成为一种「必须」和「自然而然」。

 

02

「产模一体」的最佳实践

 

当斑马团队立下这个「200 分」的雄心时,他们其实正站在一个十字路口。这个路口,就是技术栈的选择。

一个超越真人的 AI Agent,到底需要一个什么样的「模型」?

在 2023 年立项时,最「聪明」的捷径,就是「套壳」——要么用最强的闭源模型,要么用顶尖的开源模型。

但斑马团队很快发现, 所有「捷径」都通向「80 分」的平替,唯独通向不了「200 分」的超越。

「我们很早就尝试过这个路径,」修佳明,但是最后发现,不同的模型,总会有不同的问题。这背后是数据白点(data blind spots)的影响,你通过人设或者其他工作是很难根治的。在教育场景下,语言的正确性是第一位的。」

更别提迭代的鸿沟——「AI 大模型,保守说每半年大模型的能力变化都很大,你选用一个具体版本的开源模型去做后训练,再去想跟上最新模型的效果,这个迭代的成本还是挺高的。」

而斑马真正的壁垒和核心资产,在于长期积累的、海量的、高质量的儿童教育数据——包括海量的儿童跟读数据。

于是,他们的路径清晰地浮现出来: 「猿力大模型」(预训练基座)+「斑马独有教育数据」(后训练/微调)。

这种「产模一体」的价值是立竿见影的:

首先是数据带来的模型语料的准确和安全。

修佳明说:「我们做了更严苛的数据筛选,首先能保证语料都是标准的英文语料,而且内容是符合儿童认知的,且价值观要非常积极向上的。我们又做了一些强化训练来保证它更可靠。」

而更能体现产模一体的好处的,是 AI 知道怎么和不同水平的孩子沟通。

我们在采访中聊到一个问题:AI 的知识是渊博的,但它怎么能「降维」跟孩子沟通?一个孩子问「为什么天是蓝的」,AI 会不会「吊书袋」,讲一堆大气折射和瑞利散射?

斑马的核心资产——过去积累的海量数据,能够教给 AI 如何正确地跟孩子的交流——孩子问「为什么」,可能只是想引起一个话题,他想得到的回答是更浅层的、一个比喻类的,他并不是想钻进去。

如果说「产模一体」是技术上的「必经之路」,那么一个更难的、也更底层的挑战,就是组织的重塑。

这,或许才是 AI 时代最核心的命题。

我们聊过太多团队,为什么「产模一体」最后跑不通? 因为他们只有「产模」,没有「一体」。

模型团队和产品团队背着不同的 KPI,互相拉扯。产品经理(PM)的价值感在消失,他们不再是为用户创造产品,而是沦为「给模型找活干」的「传话筒」。

斑马是不是也遇到了类似的困惑?

「我们之前也有传统互联网的流水线分工,但我们做这个事的时候就乱了。」修佳明坦言。

「比如产品的需求文档(PRD),在新的产模一体的产品下,基本上就是一个课件。如果采用传统的流水线,产品经理所做的工作几乎就只是把教研的大纲『翻译』一下。我们最后坐下来聊了一下,教研和产研能不能一起干这个事?」修佳明说,「最终斑马口语的解决方案是,教研和产品研发直接一起讨论教学层面的需求,研发在一个看似非标准的需求下,进行理解和开发。」

这种「边界模糊」不止发生在产品和教研之间。「教研可能直接跟 AI 工程师对接;动画直接跟研发去对,因为这里面的渲染有点复杂……有很多是跨部门交错来做。」

一旦这个「壁垒」被打破,整个组织的形态就全变了。流程不再是「PM -> RD -> 教研」的线性传导,而变成了「神经突触」式的网状连接。

斑马分享了一个最朴素、也最高效的组织解法: 「坐在一起。」 在物理邻近的高密度协作中,「教研」的神经末梢直接碰上了「AI 工程师」的神经末梢,不断碰撞、擦出火花,形成新的组织脉络。

一个真正的 AI Native 产品,或许不是被「开发」出来的,而是被一个 AI Native 的组织中「长」出来的。

为了实现那个「200 分」的 AI Agent,你必须先打造一个「200 分」的 AI Native 组织。

这,或许才是斑马口语在「产模一体」实践中,最坚实、也最难被复制的「壁垒」。

 

03

用 AI 拆掉巴别塔

 

斑马口语已经证明,AI 可以成为一个比真人更稳定、记忆力更强、甚至情商更高的「老师」。但如果这只是一个开始,AI 语言教育的未来,又会走向何方?

在讨论中,修佳明为我们勾勒出了一条清晰的「范式迁移」路径。

我们最熟悉的,是「 外语学习 」:以规则为先,上来先学语法、背单词,把语言当作一个「学科」来攻克。

斑马口语目前所做的,是「 第二语言习得 」:它不先教规则,而是强调「沉浸式」输入,先让你听、让你读、让你模仿,在大量的语料中「习得」。但它依然需要一个起点——孩子需要有最基础的认知和一些英语基础。

而这条路的「圣杯」,是「 母语习得 」:像母语一样,在真实的、全天候的环境中自然习得,你甚至意识不到自己在「学习」。

斑马的目标,就是推动整个教育范式,从「外语学习」向「二语习得」迁移,并最终无限逼近「母语习得」。

「母语习得」的本质,不是「上课」,而是「生活」。

这意味着 AI 必须从一个「课程 App」,变成一个「存在」。而这一点,斑马已经看到了雏形。

修佳明提到,他们已经能感受到孩子的主动分享。「有一次说到今年的目标,孩子主动分享了已经吃了两个月的健康食物了,还是没有长高,并主动给 AI 学伴看自己的身高。」

而要从「朋友」进化到「家庭成员」,斑马正在探索一个明确的方向:多模态理解,尤其是做更多的视觉理解。

一旦 AI Agent 有了「眼睛」,能够观察到孩子的反应、表情和所处的真实环境,它就拥有了「嵌入生活」的能力。

这带来了一个极具想象力的未来——当 AI Agent 可以成为一个真正的「AI 玩伴」,全天候沉浸在孩子的生活中:当孩子拿起一个苹果时,它会用英语说「Apple」;当孩子在玩乐高时,它会用英语讨论「Blue block」。一个真正的母语环境形成了,语言学习被彻底内化到了生活本身。

而这个「AI 玩伴」的未来,听起来遥远吗?

修佳明告诉我们,他们已经在斑马口语的「数据闭环」中,看到了这个未来的「涌现」。当一个 AI 产品拥有海量的真实用户数据,它就开始在各方面「成长」了。

单就语音而言,就能看出差别。「通过获得更多数据,AI 现在对小朋友不同的发音的判断比真人更准了,」修佳明说,「小朋友的口音或者本身年龄比较小,肌肉发育的原因等等,可能并没有办法像真实发音那样。但我们的产品不能因为学生发不出这个音,Jissica 就判定他不会。」

「你怎么理解语言学习这个事的终极目标?」在采访的最后,我们问道。

「我个人是希望语言学习如果能对每一个人的自我产生影响。」修佳明说,「学习一门语言,你也会学会它背后代表的世界观、思维、文化。而当你的认知提升了,你也能更好地与这个世界产生连接。」

当 AI Agent 把语言学习的成本和难度无限拉低,当每一个孩子都能拥有一个高情商、高智商的「AI 外教」时——

我们或许正在见证的,是用 AI,拆掉那座阻碍人类互相理解、互相启发的「巴别塔」。

风口浪尖中的小米汽车,创下国产新势力最快盈利速度

在小米汽车陷入各种争议、质疑、口水的当下,小米汽车用一份扭亏为盈的单季度业绩报告,为自己重新正名。

11 月 18 日,小米集团公布 2025 年第三季度财报。当季,小米共交付新车超 10.8 万台,平均每月交付 3.6 万台;智能电动汽车及 AI 等创新业务分部首次实现单季度经营盈利,本季度经营收益为人民币 7 亿元。

在业绩电话会上,小米集团总裁卢伟冰透露,小米汽车预计本周将提前完成年初制定的 35 万台年度交付目标。

事实上,扭亏为盈对「新势力」车企们来说,并不是一件多么容易的事。

经历了近 10 年的历练,所有新势力企业几乎达成了共识:新思维也许可以为汽车带来功能、流程上的变革,但造车本质还是一门复杂、容错率低且长周期的慢生意。这意味着车企既需要不断地进行研发投入,也需要从市场端得到积极的口碑和销量反馈。

所以,尽管看起来新品牌之间的竞争如火如荼。但是在现阶段,「造车新势力」们真正实现从前期亏损到扭亏为盈「阶段性上岸」的并不多。

小米是第 4 家实现单季度盈利的车企。前 3 家按照首次盈利的时间线排序,分别为:理想、赛力斯、零跑。

  • 理想用了 7 个季度:2019 年 4 月,理想 ONE 上市;2020 年第四季度,首次实现季度盈利
  • 零跑用了 5 年:2019 年 1 月,零跑 S01 上市;2024 年第四季度,首次实现季度盈利
  • 赛力斯在发布「问界」品牌后,用了 9 个季度:2021 年 12 月,「问界」品牌首款车型问界 M5 上市;2024 年第一季度,首次扭亏为盈

而从去年 3 月小米SU7 正式上市,到今年第三季度盈利,小米汽车业务只用了 6 个季度就完成了从单季度亏损 18 亿元到盈利 7 亿元的逆转,是目前最快实现扭亏为盈的新势力品牌。

 

还在「越卖越贵」的小米汽车

尽管近期频繁陷入争议,但从这份最新的季报来看,小米仍然是目前新势力中毫无疑问的第一梯队企业。

我们先看看收支层面的变化。

2025 年第三季度,小米智能电动汽车及 AI 等创新业务分部总营收为 290 亿元,比上一季度增长 36.4%。其中,汽车销售收入为 283 亿元,其他相关业务收入为 7 亿元——主要是售后服务及汽车金融服务收入。

收入变多的核心原因,来自产能提升兑现的更多交付量。第三季度,小米汽车平均月交付量超过了 3.6 万台,比 Q2 每月多交付约 9200 台。

而在支出方面,涉及研发、销售推广和行政部分的经营开支基本稳定,从 59 亿元上涨到 67 亿元;和销量有关的销售成本随交付量变化提升 31.0%。总计支出为 283 亿元。

所以,简单总结来说:交付量提升是小米汽车业务本季度实现扭亏的核心原因。这也大致符合汽车行业「规模化」的经营规律。即通过销量提升,覆盖研发、生产制造、营销等相对固定的支出环节。

小米汽车季度交付量变化柱状图 | 图片来源:小米财报

在车「越卖越多」的大背景下,还有一个小细节值得注意:在这个季度,小米汽车的 ASP(Average Selling Price,平均售价)还在继续上升,由上一季度的 25.36 万元小幅上涨至 26.00 万元。

主要原因来自本季度小米YU7 的上市交付。

根据小米汽车官方微博 9 月 25 日公布「小米YU7 上市 3 个月,交付已超过 40000 台」的信息,可以大致推测:本季度小米YU7 的交付大约占总交付量的 40% 左右。

从售价来看,小米YU7 系列的售价要比小米SU7 系列高出一个级别,标准版起售价为 25.25 万元,比小米SU7 入门版和中间配置都要贵;最高配的 Max 版本 32.99 万元起,若添加所有选配后,单车售价可超过 41.7 万元。

值得一提的是,官方在业绩报告中表示,本季度小米SU7 Ultra「交付量占比减少」,也进一步佐证了小米YU7 对小米汽车 ASP 的提升作用。对于小米来说,这毫无疑问是一个非常好的消息。今年年初,市场普遍把 Ultra 视作小米汽车冲击高售价、高端化的希望,现在小米YU7 毫无疑问也分担了这个职责。

毛利率方面,受到 Ultra 版本交付占比减少的影响,相比今年 Q2,本季度小米汽车业务毛利率略有下滑,从 26.4% 变为 25.5%。

小米各业务分部本季毛利率表现 | 图片来源:小米财报

尽管如此,这个毛利率表现在目前市场竞争环境下,仍然显示出了相当强的竞争力。

横向对比来看,小米汽车目前的毛利率水平在主流车企中,仅低于鸿蒙智行旗下「问界」品牌所属的赛力斯。2025 年上半年,赛力斯汽车毛利率达到 28.93%,位于国内车企第一。

新势力车企中小鹏、理想毛利率处于领先,整体毛利率均为 20.1%。整个新能源市场的两大巨头比亚迪、特斯拉毛利率在 18% 左右,且均低于去年同期水平。

可以说,除了小鹏依托于对外服务显著拉升毛利率外,其余各家的毛利率均受到了消费市场竞争及价格战影响。而小米可以既可以做到「老款不降价」,甚至权益退坡(既一些首销期赠送的权益收回),还可以通过新产品拉升 ASP,是可以反应出其品牌和产品上一阶段在消费市场影响力的。

 

可以持续盈利吗?

当然,阶段性跨过扭亏为盈的门槛,决不代表着一家车企已经成功,最多也只能算「从 ICU 病床走到了 ICU 房间门口」。小米高管也在各种场合反复强调,小米汽车立项以来总投入数百亿,阶段性地盈利远没到开香槟的时候。

事实上,就在当下,我们就能看到小米汽车正面临 2 个挑战。

第一个挑战来自即将变化的新能源车购置税政策退坡,这也是整个行业共同的问题。

根据相关规定,2026 年 1 月 1 日起,国内新能源汽车购置税将从目前的「全免」改为「减半」。由于汽车产品从购买到交付开票普遍有一定间隔,为了吸引消费者,各车企均采取了不同程度的「购置税兜底」政策。

小米汽车官方表示,凡是在今年 11 月 30 日前下订的用户,只要延期到 2026 年交付,小米均会提供跨年购置税补贴。按照相关政策计算,每辆车的补贴金额在 0.95 万元-1.5 万元之间。

如果我们按照小米YU7 发布时公布的 24 万锁单量,以及下半年小米YU7 系列每月大约 1.5 万台的交付速度粗略计算,即便小米YU7 没有新增订单(当然这是不可能的),那么小米在 2026 年用于「补贴」购置税的成本也接近 10 亿元。

这样的影响应该会体现在小米(包括其他车企)2026 年前一阶段的毛利率上。而按照本季度 7 亿元的盈利规模来看,小米汽车业务在接下来的季度中能否保持相对延续的盈利能力,也许也会短期内受到政策影响。

整体来说,购置税影响对订单强劲的企业来说,算是一个「幸福的烦恼」。

财报提到,小米YU7是中国大陆地区10月SUV「不加定语」的销量第一 | 图片来源:小米财报

而更大的挑战来自于企业和网民之间似乎正在扩大的争议和隔阂。

这其中,一部分争议和负面是「无中生有」的。

例如,近期小米SU7 部分配置提车周期被大幅缩短,网上传出类似「订单崩了」这类的谣言。

实际上,从小米汽车 App 显示的预计交付时间来看,全系车型中仅小米SU7 中高配、小米SU7 Ultra 提车日期被缩短到 6-9 周,小米SU7 标准版、小米YU7 全系的交付日期仍在 30 周以上。

笔者推测,小米SU7 部分配置的交付提速,很大原因来自车型即将迎来改款换代,部分潜在消费者选择持币观望。这是任何一家车企都会面临的周期性销量浮动。

据行业媒体《新出行》预测,小米SU7 改款有望于今年年底亮相。新车预期将采用更大的电池以及新一代英伟达 Thor-U 系列辅助驾驶芯片。不过,鉴于目前 SU7 改款还没有正式登陆「工信部线上车展」(即工信部新车公式),大概率它的发售需要等到 2026 年。

但另一部分争议,或者说「沉默的大多数们」,也同样在真实地表达自己的疑惑甚至不满。

今年 3 月和 10 月,两场车祸曾把小米汽车推到风口浪尖,公众对包括辅助驾驶、电池失火控制、车门应急解锁等直接影响车辆安全的因素提出了质疑。

在小米面临各种或「借机抹黑」或「真心质疑」的时候,创始人雷军曾在线下和线上两次表达了对「黑公关们」的不满,从企业高管维护品牌形象的角度来说,这当然没有问题。

但站在消费者和普通公众的角度,我们也希望不管是雷军本人还是小米汽车,同样可以「真心」地从产品和技术角度出发,为用户拆解那些和产品安全有关的疑惑。

随着小米汽车创下新势力最快盈利速度,现在已经没有人怀疑小米汽车的吸引力了,客观上它也拉动了小米整个企业形象的提升。但现在,也许很多人期待着小米回到曾经那个「发烧友」的形象,告诉大家这辆车更多的细节。

这是所有人都关心的,也是小米汽车从扭亏为盈开始,下一阶段必然面临的严肃课题。

「30 秒造应用」——蚂蚁灵光点燃「所想即所得」的魔法时刻

 

 

当 AI 的 coding 能力变得足够强,我们到底会迎来一个怎样的未来?

 

2025年接近尾声,这个问题正在变得更加迫切。我们已经看到了多智能体AI 编程平台的出现,它们可以模拟产品经理、程序员、甚至后端工程师的角色,团队协作,让「生成一个完整应用」的门槛正在迅速下降。

 

这带来了一个极具想象力的「岔路口」:这究竟是会刺激一个「人人都是开发者」的时代,让更多人参与到「做产品给别人用」的浪潮中?还是会带来一次更彻底的用户范式革命——即「人不再需要开发」,我们只需要有想法,AI 就能即时生成满足个人需求的工具?

 

蚂蚁集团的全模态通用AI 助手「灵光」,似乎在探索后一条路。

 

它提示了一种趋势:AI 助手不只是一个「工具」,更应该是一个「助理」。它有编程能力,但目的不是想让你变成一个「小开发者」,而是当你提出一个需求时,它能用编程能力更简单、更即时地帮你实现。

 

「灵光」,一个真正能解决问题、降低门槛的实用工具,正在试图通过两大「杀手锏」破局:一是重塑AI信息的「全模态交互」,二是将 AI Coding铲平到 0 门槛的「30秒闪应用」,填补一个关键的市场空缺。

 

一:「全模态信息」——当 AI 不再「废话」

 

蚂蚁集团的「灵光」AI 助手,也有对话陪伴的基础属性,同时在这个基础上,提供了更多实用的「功能性」。

 

最近看到有国内陆续一些核聚变企业融资的消息,想着迅速了解一下国内在这个领域的进展。自己在谷歌上搜,看得有一头没一头的。正好用「灵光对话」试了一试。

视频来源:极客公园

可以看到,不到半分钟的时间,「灵光对话」就读取完了50个网页链接里关于2025年以来国内关于核聚变领域的进展,并用简明扼要的文字+图表的方式呈现了出来。

太快了。50个网页,认真读完起码半小时,再加上总结、制作图表,起码两三个小时了。但是「灵光对话」只用了不到半分钟时间。

我又想到了我司所在的798园区,虽然已经在这边工作了蛮久,但似乎一直没有好好逛过,也不知道园区里到底有什么好吃的店值得去,也问了问灵光。

这次我没有说给我总结图表,而是让灵光自由发挥。

视频来源:极客公园

这次「灵光对话」花了不到一分钟时间,就读取了38个网页,并给我生成了一份798美食探店路线,包含地图导航的那种。

可以看到,「灵光对话」为我生成了一份「3小时沉浸式逛吃路线」,连从哪个门进入,几点到达能避开高峰期,全程要步行多久,路线几家店铺都包含了。

图片来源:极客公园

在路线规划里,也贴心地按时间顺序推荐了正餐、咖啡、甜品以及精酿等不同品类,就是这个午餐安排了两顿,有点略显重复。

以及还有根据不同区域划分的分区美食地图,列出了几家不同类型的店铺,并注明了人均消费。

最后虽然是「美食探店路线」,「灵光对话」还贴心了列出了几条实用贴士,包括错峰指南、穿搭建议、支付提示以及交通提示。

错峰指南、支付提示以及交通提示这些其实还好,但是穿搭建议,尤其是可以根据798工业园区的风格推荐工业风或文艺风穿搭以及考虑到是石板地面,避免高跟鞋的建议,确实令我比较惊喜。

体验「灵光对话」后感受到它的不同之处,首先就在于对「极繁信息」的高度提炼。

当提问一些复杂问题时,比如上面我问它,核聚变领域的进展这样一个复杂话题,它给出的不是万字长文,而是更清晰明了的动态图表页面。

这是一种「信息美学」的胜利。它将复杂知识「化繁为简」,提供了「结构化」和「可视化」的答案。

这背后是灵光实现了基于全代码生成的多模态内容输出。当用户提出问题时,灵光会自动理解其真实意图,并以代码为核心生成方式,实时构建结构化、个性化、且高度美观的可交互的可视化结果。无论是图表、样式还是交互组件,都是由模型即时创造并呈现给用户。

据了解,「灵光」在架构上的一大突破,是构建了多智能体协作的Agentic架构。在生成可视化内容时,它会动态调用为图像、3D、动画等优化的专用Agent。这些Agent实时协作,共同为用户构建出一个更完整、更丰富、更沉浸的视图体验。

"灵光"将这种复杂的协作机制成功落地到了移动端,实现了真正的可交互内容体验。这种能够在「端侧」实现高级Agentic协作的产品,在业内尚属前沿。

在市面上的众多AI助手之中,「灵光」的「功能性」和「结构化」回答正是其「自成一派」的特色。它像一个高效的「知识助理」,能真正地为工作、生活提高效率,而不只是能聊天的「话痨朋友」,这可能是大家现实生活中更迫切需要的。

二:「30秒造应用」——AI 的「魔法时刻」

化繁为简之外,灵光还让我体验到了「30秒生成应用」的「魔法时刻」。

作为长期观察AI领域的作者,眼看着AI编程的火热,时不时也会想着能不能借助AI的力量自己做个app。

正好在前段时间,我司举办了「AI 时代的一周创业体验」」团建项目,鼓励跟踪AI领域的大家亲自动手手搓项目,当时我想做一个名为「emo鼓励大师」的app,「一个不问为什么,主打一个直接鼓励的治愈系app,也别分析了,也别审批了,就直接鼓励,直接赞美,在心情低落的时候打开它会鼓励你,不要难过;在心情平静的时候它会夸奖你,让你平地生勇气;在心情激动的时候它也鼓励你,冲冲冲。主打一个拐着弯地,不分昼夜地给你当头一棒一样的鼓励与支持。最简单的加油站。」

但是当时因为对AI编程工具使用的不熟练,也因为正好那段时间工作有点密集频繁出差,能花在手搓项目上的时间并不多,这个提案也就搁置了下来。

在了解到「灵光闪应用」可以「0 门槛」地快速生成应用之后,我马上把之前那段提示词输入给了「灵光闪应用」:

图片来源:极客公园

 

我记得我之前尝试用AI编程工具创作这个应用时,因为编程技能的缺失,制作出的应用只有固定的静态页面,无法互动交互。但是闪应用这次真的迅速就给我产出了下面的这个可以实时交互的应用。

 

页面呈现了三种情绪状态,每次点击都会生成一句鼓励,随机鼓励也可以生成暖心话语。

 

我顺势又尝试了创建另一个「7日健身打卡」应用,准备拿来督促自己在冬天运动一番。

 

可以看到,虽然我一开始的想法很简单,只是想做一个「7日健身打卡」应用,但在跟「闪应用」的交互过程中,它不断帮助我将应用做得更加丰富饱满。

 

图片来源:极客公园

 

到最后,我所拿到的就是这样一个包含打卡提醒、完成运动、总运动时长、总卡路里消耗的更完善的健身打卡应用。而且,这个应用界面的设计简洁明了,色彩搭配也很协调,整体看上去令人舒适——在实现代码的同时,「闪应用」还给我免费做了一波UI设计。

 

可以看到,「闪应用」生成的应用不只是静态的前端页面,而是已经具备了完整的前后端逻辑,可直接调用大模型等后端能力,实时进行交互。

 

9月的那次AI创业团建之后,关于手搓app的想法就悬在我的脑海里,但因为它不是什么「紧急且重要」的工作,而且也没去学编程,也就任由它悬着。

 

这次,蚂蚁集团的「闪应用」确实让我这个不太懂编程的人,实现了脑海里悬而未决的想法。这可能也就是最近大家都在讨论的AI平权的意义所在,让每个人都可以快速创建应用。

 

2025 年以来,大模型领域的市场焦点已经从 AI 助手转向自主代理,Cursor 等工具已转型为代理式工作平台,能自主规划、执行、验证复杂任务;GPT-5-Codex 和 Claude 4.1 等新模型支持多智能体协作,可自动分配开发任务,实现 "需求→设计→编码→测试" 全链路无人干预……

而现在,「闪应用」凭借 0 门槛/0 代码更进一步地将「产品经理」的视角和能力赋予了普通人,真正满足了普通人埋在心中的「创作欲」和「分享欲」,

三:从「开眼」到「物理世界」,「AI 应用」的终局是「工厂」?

如果我们将「灵光」的产品组合串联起来看,会发现一个清晰的闭环:「开眼」功能及其代表的实时理解能力,是 AI 对物理世界的「输入」和「理解」;而「闪应用」,则是 AI 对数字世界的「输出」和「创造」。

这一进一出,清晰地预示着 AI 助手正在发生关键的范式转移:从「信息搜索引擎」转向「即时效用工厂」。在这个新范式下,AI 的价值不再只是提供信息,而是生成可用的工具。在顾问的基础上,它更是你的「工匠」和「生产线」。当用户有一个想法时,AI 可以直接交付一个可用的原型,帮用户将想法实现。

灵光的「0门槛」和「0代码」是解放创造力的「破壁机」。在过去,一个好创意和一个可用的产品之间,隔着「技术实现」的鸿沟。

普通人即使有「产品经理」的视角,也缺乏「工程师」的能力。而「闪应用」通过对话式AI Coding,铲平了这道门槛。它将开发的焦点从「我该怎么实现」拉回到了「我到底想要什么」。

 

「快」,即时生成则是点燃「创作欲」的「催化剂」。传统开发是重决策,而「闪应用」是轻尝试。

 

当一个想法的实现成本(包括时间和金钱)趋近于零时,它带来的就是「即时满足感」。这种「所想即所得」的魔法时刻,极大地降低了人们的创作惰性。用户可以随心所欲地试错、迭代,这种低成本的「手搓」快感,会不断激发普通人心中那股被压抑已久的创作冲动。

 

而当一个应用被「手搓」出来,「分享欲」就成了必然的闭环。与分享一张AI图片不同,分享一个自己做出来的应用,其实是在分享一种「效用」和「解决方案」。这种「我造了个工具,你也能用」的成就感,远超简单的内容分享。

 

而这种「快+即时满足+分享欲」的驱动力,似乎架起了一座超级AI应用工厂的骨架。

 

回顾这一年,从年初以黑马姿态杀出的 DeepSeek 到,再到年末「千问」的重启,「灵光」的功能落地,我们能看到未来的 AI 创新,似乎更倾向于产品落地和用户价值,而非沉溺于 AGI 的宏大叙事或拟人性的追求。当行业还在「卷」模型参数和「像不像人」时,这种务实主义成了一股清流,直指 AI 的商业本质——解决问题。

这或许给「百模大战」的下半场提供了另一个答案:AI 的终局,可能不是那个最像人、最会聊天的 AI,而是那个能让最多的人用最低的门槛创造最大价值的 AI。

它关乎效率,更关乎「平权」。而「灵光」的「闪应用」,就是这场「创造力平权」运动中,一个极具想象力的起点。

Gemini 3 正式发布,多榜单断崖式领先;美安全服务商网络中断,ChatGPT、X 受牵连;苹果承认酒精擦拭可能导致手机掉色|极客早知道

Cloudflare 全球网络中断 ChatGPT、X 等平台受牵连

11 月 18 日,美国网络安全服务商 Cloudflare 遭遇波及全球的大规模网络故障,导致 ChatGPT、社交媒体平台 X 等多家网站部分用户无法正常访问。美股盘前,Cloudflare 股价跌近 4%。

这家总部位于旧金山的企业在其官网公告称,正就"可能影响多个客户"的问题展开调查。该页面还显示,其客户支持门户此前已出现故障,且当日早些时候已安排在部分地区进行计划内维护。

颇具讽刺意味的是,Cloudflare 自身的故障状态页面一度也无法打开。

Cloudflare 的软件服务全球数十万家企业,扮演着网站与终端用户之间的"缓冲器"角色,旨在保护客户网站免受大流量攻击导致瘫痪的威胁。

据网络故障监测平台 Downdetector.com 数据显示,截至美东时间早上 6:41,X 平台已收到超过 11500 份问题报告。截至北京时间晚上九点,ChatGPT、X 等平台的的许多用户依旧无法正常使用相关应用。(来源:财联社)

Google 深夜发布 Gemini 3 Pro:全线碾压同类模型,引爆新一轮 AI 竞赛

11 月 19 日,Google 于今日凌晨正式在 Google AI Studio 上线了 Gemini 3 Pro 的 Preview 版,并同步开放 API。这款新旗舰模型以全面领先的性能表现,成为目前全球最强的 AI 大模型之一。

根据 Google 公布的 Model Card 数据,Gemini 3 Pro 在数学、推理、多模态与 Agent 工具使用等关键标准上全面「碾压」竞品。在极高难度的数学竞赛基准 MathArena 中,其他模型仍停留在 1% 左右正确率,而 Gemini 3 Pro 直接达到 23.4%;在 Humanity's Last Exam(人类最终大考)上,它以 37.5% 的成绩远超 GPT-5.1 和 Claude Sonnet 4.5。Google 还透露,未公开的 Deep Think 深度推理模式可进一步提升其表现。

最具突破性的是它的视觉智能。Gemini 3 Pro 在屏幕理解(ScreenSpot-Pro)测试中达到 72.7%,几乎是 GPT-5.1 的 20 倍。这意味着 AI Agent 能第一次「真正看懂屏幕」,大幅提升自动化操作电脑的能力。

尽管在 SWE-Bench Verified 等纯编程测试中未能登顶,Gemini 3 Pro 仍然保持第一梯队的实力,并擅长前端设计、交互动画与 3D 应用等更具创造性的任务。

除了模型本身,Google 同时发布了全新的 Agentic 编程平台 Antigravity。这一平台提出「智能体优先」的编程范式,可让多个 AI Agent 并行执行任务,例如自动写代码、运行终端测试、打开浏览器验证 UI,并能自主修复错误,被视为对 Cursor 等 AI 编程工具的直接挑战。

Gemini 3 Pro 当前已上线 Preview,更多产品集成将在未来数周陆续开放。(来源:极客公园)

 

英伟达和微软将向 Anthropic 共计投资至多 150 亿美元

11 月 18 日,微软、英伟达和 Anthropic 宣布建立新的战略合作伙伴关系。

作为合作的一部分,英伟达和微软承诺分别向 Anthropic 投资至多 100 亿美元和 50 亿美元。声明称,Anthropic 已承诺购买价值 300 亿美元的 Azure 计算能力。(来源:界面新闻)

 

Intuit 与 OpenAI 达成 1 亿美元合作,让 ChatGPT 算退税、管财务

11 月 18 日,商业和财务管理解决方案提供商 Intuit 已与 OpenAI 签署一份为期多年的合作协议,合同总价值逾 1 亿美元(现汇率约合 7.11 亿元人民币)。该合作将使 Intuit 旗下的税务与财务应用(如 TurboTax、Credit Karma、QuickBooks 和 Mailchimp)集成至 ChatGPT 平台,并进一步扩大 OpenAI 大语言模型在其全线产品中的应用范围。

根据协议,用户可通过 ChatGPT 直接调用 Intuit 的各项工具,提出问题并完成具体任务,例如估算退税金额、评估信贷方案,或管理企业财务。在获得用户明确授权的前提下,Intuit 应用可调取其财务数据,生成定制化答案并执行操作,如发送营销信息或发出发票催缴提醒。此外,用户还可在 ChatGPT 界面内,使用 Intuit 工具比对信用卡、个人贷款及住房抵押贷款等金融产品信息。(来源:IT之家)

 

谷歌 CEO:AI 泡沫一但破裂,没有公司能幸免

11 月 18 日,在一次独家专访中,谷歌 CEO 桑德尔·皮查伊(Sundar Pichai)警告,如果当前的 AI 投资泡沫破裂,其影响将波及每一家公司,包括 Alphabet 自身。

他指出,尽管 AI 投资的增长标志着一个「非凡的时刻」,但目前的 AI 热潮中也存在一些「不理性」的现象。

虽然 Alphabet 的市值在七个月内翻了一倍,达到 3.5 万亿美元,但皮查伊仍强调:「我认为没有哪家公司会免于影响,包括我们自己。」皮查伊还透露,Alphabet 正在开发专门的 AI 超级芯片,以期与 NVIDIA 展开竞争。

皮查伊提到,行业在投资周期中可能会出现「过度扩张」,并指出:「我们可以回顾互联网的历史,明显存在过度的投资,但没有人会质疑互联网的深远影响。」因此他强调,AI 将对工作产生深远影响,并呼吁人们在使用 AI 工具时不要「盲目相信」,因为这些模型容易出错。他建议人们应该与其他工具一起使用 AI,并强调拥有丰富的信息生态系统的重要性。

除了市场风险,皮查伊也对 AI 的巨大能源需求发出警告,他指出,去年 AI 消耗的电量已占全球总电力消耗的 1.5%,并强调需要开发新的能源来源和扩大能源基础设施,以避免对全球经济造成约束。(来源:IT之家)

小米汽车及 AI 等业务收入猛增近 200%,首次实现单季经营盈利

11 月 18 日,小米集团发布了一份颇为亮眼的 2025 年第三季度财报。数据显示,该季度小米集团总收入达 1131 亿元,同比增长 22.3%,连续 4 个季度突破千亿;经调整净利润为 113 亿元,同比大增 80.9%,创历史新高。

小米汽车业务及 AI 等创新业务成为财报中的一大看点。该业务分部三季度收入飙升至 290 亿元,同比增长 199.2%,创历史新高。其中智能电动汽车收入由去年三季度的 95 亿元增加 197.9% 至今年三季度的 283 亿元,主要由于汽车交付量及 ASP(平均销售价格)均有所增加所致。

尤为关键的是,小米汽车及 AI 等创新业务分部首次实现单季度经营盈利,实现单季经营收益 7 亿元。从增长原因来看,核心零部件成本下降或是重要因素之一。

三季度,小米共交付 108796 辆新车,创历史新高,大规模生产使得单车的制造成本分摊降低。此外,从产品结构上看,Xiaomi SU7 Ultra 从 2025 年 3 月开始交付,高附加值产品交付占比的提升拉高了整体收入及利润水平,汽车 ASP 从 25.37 万元提升至 26.01 万元。

小米集团合伙人、集团总裁卢伟冰在业绩电话会上透露,小米汽车预计将于本周完成全年 35 万台的年度交付目标。(来源:界面新闻)

 

拼多多 2025 年第三季度营收 1082.8 亿元,同比增长 9%

11 月 18 日,拼多多发布 2025 年第三季度财报,公司第三季度营收 1,082.8 亿元,同比增长 9%,预估 1,075.9 亿元;调整后净利润 313.8 亿元,同比增长 14%,预估 251.2 亿元;调整后每 ADS 收益 21.08 元,预估 16.86 元。

本季度,拼多多「千亿扶持」继续加大对生态建设的投入,持续为商家减免服务费,提供流量和资源扶持。随着「千亿扶持」的重磅投入,或将持续影响拼多多未来几个季度的业绩表现。(来源:IT之家)

 

卢伟冰:小米 17 系列手机销量已破 200 万,是双十一期间唯一能对抗苹果 iPhone 的产品

11 月 18 日,小米集团合伙人、集团总裁卢伟冰在业绩电话会上透露,小米 17 系列开售 5 天销量破 100 万、11 月初销量突破 200 万,比上代快了很多。双十一期间,小米 17 Pro Max 在各大平台均获得 6K+ 价位段国产手机销量、销售额双冠军,也是唯一一款能对抗 iPhone 的产品。

根据此前小米官方数据显示,小米 17 全系开售仅 5 分钟便刷新了 2025 年国产智能手机全价位段的新机首销纪录。其中,小米 17 Pro Max 单款机型打破今年国产手机首销日销量与销售额纪录。

财报显示,2025 年第三季度小米智能手机出货量为 4330 万台,同比增长 0.5%,连续 9 个季度实现同比增长。(来源:IT之家)

全球首个 AI 外教一对一产品斑马口语正式上线

11 月 18 日,斑马口语正式上线。据悉,斑马口语是全球首个 AI 外教一对一产品,推出超人类 AI 外教,面向儿童提供系统化口语训练。

该产品基于猿力大模型打造,具备超人类教学能力、记忆力、知识储备和超温暖人格,能实现低延迟实时对话、精准发音纠错,并根据学生兴趣动态调整教学内容。斑马口语通过"2+1+1"学习模式和生活化场景设计,让孩子在真实语境中提升表达能力,有效解决了传统外教行业水平参差不齐、教学效果难以保障的痛点。

作为教育领域首个实现规模化落地的 AI Agent 产品,斑马口语凭借其技术突破和教学实效,为 AI 在教育产业的深耕树立了新标杆。该产品的成功落地,不仅拉开 AI Agent 产业化落地序幕,更展现了 AI 技术在教育垂直领域的商业化潜力,为推动教育智能化转型提供了可复制的实践范本。(来源:极客公园)

 

苹果采用 3D 打印制造 Apple Watch 钛金属表壳

11 月 18 日,苹果宣布 Apple Watch Series 11 和 Ultra 3 的钛金属表壳全面采用 3D 打印工艺制造。该技术相较传统工艺减少一半原材料使用,今年已节省 400 吨钛原料。

苹果历时十年攻克规模化生产难题,通过精密控制粉末粒径、含氧量及每层 60 微米的打印精度,实现高效低碳制造。成品经 20 小时 900 层打印后,还需脱粉、切割与光学检测。此工艺亦应用于 iPhone Air 的 USB-C 接口外壳,助力苹果 2030 年碳中和目标。(来源:DoNews)

 

AI「超级科学家」Kosmos 问世:12 小时完成人类半年科研量

11 月 17 日,非营利研究机构 FutureHouse 发布 AI 科研系统 Kosmos,单次 12 小时运行即可阅读 1500 篇论文、生成并执行 4.2 万行分析代码,输出可溯源报告,工作量相当于人类团队半年产出。系统基于结构化世界模型,在超 1000 万 token 上下文中保持逻辑连贯,已在神经科学、材料学等领域完成 7 项发现,其中 4 项为首次报道。

Kosmos 采用自主循环架构:并行启动文献检索与数据分析任务→更新内部知识图谱→再规划下一轮探索,平均一次运行迭代 166 次数据分析与 36 次文献综述,结论引用精确到代码片段或原文,支持完整审计。实测中,Kosmos 独立复现三项尚未发表的研究,包括确认核苷酸代谢为低温脑处理关键通路,并发现钙钛矿太阳能电池 60g/m³以上绝对湿度失效阈值。

苹果回应 iPhone 17 Pro Max 被湿巾擦掉色:高浓度酒精确有可能掉漆

11 月 18 日,日前,iPhone 17 Pro Max 被湿巾擦掉色的相关话题登上热搜,引发网友热议。

事情起因是有苹果用户发帖称,其购买 iPhone 17 Pro Max 星宇橙配色在使用普通湿巾擦拭后,镜头边缘及边框涂层大面积脱落,露出银色铝合金基材。

昨日据媒体报道,苹果客服对此表示,普通湿巾擦拭是不会影响机器颜色的,但是如果是含高浓度酒精或是其他含腐蚀性液体的湿巾则有可能造成掉漆。苹果客服还称,用普通自来水之类的是不会受影响的。

值得一提的是,今年 10 月,有网友在 Reddit 论坛反馈称,自己的 iPhone 17 Pro Max 星宇橙后盖褪色成了「玫瑰金」,铝合金表面橙色几乎完全消失。

媒体 Wccftech 析认为,该问题或源于生产工艺缺陷,推测在生产后盖时,没有完全密封阳极氧化保护层,导致铝材暴露在空气中氧化变色。

据了解,iPhone 17 Pro 系列放弃前代钛金属材质,回归一体成型的航空级铝合金机身,经多道锻造、精密加工及阳极氧化处理,打造成轻量化、坚固的结构。(来源:快科技)

谷歌 Gemini 3.0 深夜炸场:没有悬念的最强 AI

 

来了。

预热了快一个月的 Gemini 3.0 Pro,就在刚刚,正式在 Google AI Studio 上线 Preview 版,API 也同步开放。接下来将陆续上线Google的各项产品中。

没有任何多余的废话,打开 Model Card,满眼写着的只有两个字:碾压

按照 Google 披露的测试数据,Gemini 3 Pro 毫无悬念地成为了目前地球上数学最强的 AI。在 AIME 2025 数学测试中,配合代码执行,它直接拿到了100% 的满分。而在数学竞赛的「地狱模式」MathArena 里,当包括 GPT-5.1 在内的其他大模型还在 1% 上下挣扎时,Gemini 3 Pro 直接干到了23.4%

编程能力方面,虽然在 SWE-Bench 上未拿 SOTA——但绝对属于第一梯队。Live Code Bench 的 Elo 得分超过 2400 分 ,在工具调用和终端操作基准测试中更是名列第一。

真正炸裂的是它的「视觉智能」。对屏幕截图的理解能力高达72.7%,是目前最先进水平的两倍。这意味着 Agent 不再是瞎子,它将彻底重塑 AI 操作计算机的模式。

但这还没完,Google 今晚还顺手扔出了一个小王炸:自家的 Agentic 编程平台——Google Antigravity

此前网传 Gemini 3 能实现「端到端编程」,大家以为是模型成精了。但看起来,并不是模型成精,而是 Google 正在探索如何用更好的系统工程实现端到端编程。

如果说 Cursor 是目前最强的「外骨骼」,它通过 AI 补全让你写代码更快;那 Antigravity 就是奔着「自动驾驶」去的。它不再只是一个编辑器,而是一个智能体优先(Agent-first)发环境。集成了 Gemini 3.0 和能操控浏览器的 Gemini 2.5 Computer Use 模型,它的 Agent 能自己写代码、自己开终端跑测试、甚至自己打开浏览器验证 UI,发现报错自己修。

不讲故事,只拼肌肉。

Google 用这一波硬核发布宣告:新王已至

有趣的是,这次连 Sam Altman 都献上了自己的点赞。:)

霸榜的暴力美学:不止是智商洗榜,更是 Agent 能力的变化

在 AI 圈子里,大家习惯了模型之间你追我赶的微弱优势,但 Gemini 3 Pro 抛出的这份成绩单,可以说十分耀眼。

根据 Model Card 披露的数据,Gemini 3 Pro 在推理、多模态、Agent 工具使用等关键基准上,实现了全方位的霸榜。

让我们先看一看代表人类智力「天花板」的测试——Humanity's Last Exam(人类最终大考)。这是一个衡量学术推理极限的标尺,GPT-5.1 在此前的测试中得分为 26.5%,Claude Sonnet 4.5 仅为 13.7%。而 Gemini 3 Pro 它直接轰出了37.5%的高分。在高端推理层面,这 10 个百分点的差距,意味着模型在处理复杂学术问题时,已经具备了完全不同的理解深度。

但这还不是极限。Google 甚至还藏了一手Gemini 3 Deep Think(深度推理模式),在不使用任何工具的情况下,它在 HLE 上的得分进一步飙升至41.0%。看起来人类最后的堡垒也并不能持续很久了。

数理方面的每一个领域,都能看出它的统治力。

AIME 2025(美国数学邀请赛):配合代码执行(Code Execution),Gemini 3 Pro 的准确率达到了惊人的100%。没错,是满分。即便是「裸考」(无工具模式),它也有 95.0% 的准确率(相比之下,GPT-5.1 为 94.0%,Claude Sonnet 4.5 为 87.0%)。

MathArena Apex(数学竞赛地狱模式):当包括 GPT-5.1 在内的其他大模型还在1%上下挣扎时,Gemini 3 Pro 直接干到了23.4%。这意味着在很多以前 AI 根本「看不懂题」的领域,Gemini 3 已经开始解题了。

而更关键的是 Agent 相关能力的提升。

Gemini 一向在多模态能力上领先,这一代更是专门优化了屏幕理解(Screen Understanding)。这是下一代 Agent 能否真正接管人类电脑的关键。

ScreenSpot-Pro这一栏数据:

  • GPT-5.1:3.5%(这基本意味着它是个「瞎子」)。
  • Gemini 3 Pro:72.7%

这是近乎20 倍的能力碾压!这标志着 Gemini 3 Pro 已经不再是一个单纯的对话框,它具备了真正意义上的「视觉智能」,能够像人类一样理解复杂的操作系统界面。

在一些传统强项上,Gemini 3.0 仍然表现出色——比如支持1M Token的超大上下文窗口、对多模态数据的「原生支持」、长视频和多语言处理等等。

有一个很有趣的标准也被 Google 挂了上来:在 一个模拟开店赚钱的基准 Vending-Bench 2 上,Gemini 3 Pro 最终赚取了$5,478.16的净资产,而 GPT-5.1 仅赚了 $1,473.43。

不过关于之前网传「彻底端到端终结程序员」的编程能力,Gemini 3.0 Pro 的状态是在 AI 届顶尖,但并没有「颠覆编程」。

在衡量软件工程能力的SWE-Bench Verified测试中,Gemini 3 Pro 得分为76.2%,虽然很强,但并未超越 Claude Sonnet 4.5(77.2%)拿到 SOTA。这意味着在处理超长程、极其复杂的后端逻辑时,它依然有局限性。

这也很合理。每一个大模型目前都在全力卷编程的情况下,想要在这个领域一骑绝尘确实比较难。

目前 Gemini 的能力更偏向于,还不能帮你重构整个后端架构,但如果你想写一个极具现代设计美学的网站、一个 3D 飞船游戏,或者生成复杂的 SVG 交互动画,它能通过一次提示就给出极其惊艳的、可直接运行的结果。

Antigravity,Agentic 编程的探索

有了最强的模型和算力,谷歌开始在应用层「掀桌子」了。今晚,谷歌扔出了一个「小王炸」——Google Antigravity

前一阵新闻的风向还是模型公司努力收购 AI 编程应用公司呢,而 Google 这次则这么快的就发了自己的开发平台/

这不仅仅是一个新的 IDE,它是谷歌定义的Agent-first(智能体优先)开发平台。在这里,开发者从「码农」升级为「架构师」,而 Gemini 3 化身为拥有编辑器、终端和浏览器完整权限的「执行合伙人」。

为了达成这种体验,谷歌甚至在后台配置了一个「模型军团」协同作战:

  • Gemini 3:作为大脑,负责高级推理和代码编写。
  • Gemini 2.5 Computer Use:作为手眼,专门控制浏览器进行 UI 验证和测试。
  • Nano Banana:作为美工,负责生成图像和 UI 素材。这种打通了底层模型到顶层交互的闭环体验,对于 Cursor 等现有 AI 编辑器来说,无疑是一次降维打击。

Antigravity 最有趣的能力在于并行。官方材料明确提到,开发者可以与多个智能 Agent 协作,而这些 Agent 能够代表你同时 自主规划并执行复杂的端到端软件任务。

想象一下这种工作流:你下达一个指令,Antigravity 瞬间分裂出多个 Agent——Agent A 负责写后端逻辑,Agent B 负责在终端跑测试用例,Agent C 直接打开浏览器去验证前端 UI 的交互效果。它们并行不悖,像是一个配合默契的敏捷开发小组,而你只需要验收它们提交的「工件」。

Antigravity 是是一个免费平台,网络上目前对于 Antigravity 的使用体验不多,但基本上都是好评。

要达到替代 Cursor 本身,肯定不太行——端到端的复杂编程体验,肯定还需要模型更成熟。但是简单的项目进行编程,或许会更简单了。

全家桶齐发力:TPU 与搜索

在大模型发展的后半程,比拼的不再是单一算法的灵光一闪,而是谁的算力更冗余、谁的数据更广阔、谁的投入更持久。Gemini 3 Pro 的胜利,有一点是很特别的:Gemini 3 Pro 是使用 Google TPU 训练的

当全世界的 AI 公司都在苦苦等待英伟达 GPU 的发货周期时,谷歌依然坐在自家庞大的 TPU 矿山上。TPU 专为 LLM 训练设计,拥有极高的高带宽内存(HBM),这让它能够轻松处理海量的模型参数和超大的 Batch Size。正是 TPU 的算力冗余,给了 Gemini 3 Pro 肆意扩张参数规模的底气。

有了算力,还要有「燃料」。Gemini 3 Pro 的训练数据是全维度的覆盖:它吞噬了公共网络文档、代码库、图像、音频和视频。更关键的是,谷歌明确提到使用了User Data(用户数据)——当然是在隐私协议框架下,来自谷歌庞大产品生态的用户交互数据。

最后,这种溢出的智能被注入了 Google Search。Google 这次推出了一个全新的AI Mode in Search。当你搜索一个复杂概念(比如 RNA 聚合酶的工作原理)时,Gemini 3 不再是给你扔一堆冷冰冰的链接,而是利用其强大的推理能力,即时生成(Generated on the fly)一个沉浸式的互动图表或模拟工具。

从底层的 TPU 硅基霸权,到中间层的模型智能,再到顶层的 Antigravity 开发生态与生成式搜索——谷歌这一夜展示的,不仅仅是一个满分模型,而是一个只有巨头才能构建的、严丝合缝的未来。

实测体验

最后让我们看看网上的一些实测体验吧。

出名的六边形测试的升级款。

不少帖子提及了设计上的美感。

一些物理世界的建模。

前面提到的,Gemini 对于用户界面数据这块做了特别的优化。

开发应用。

在今天,大模型的性能已然超越了跑分的边界。即便是最顶尖、最复杂的前沿基准测试,其测量精度也开始失效。如何科学地量化模型之间的微妙差距,已经成为了一门专门的「量化科学」,仅凭用户简单的实测手感,很难窥见其中的全部玄机。

实测案例更多的也就是用来看看模型本身的审美和 one-shot 直出的状态。

Gemini 3.0 在这次的更新上,显然在直出的情况下,赢面很大。

当模型直出能力越来越好,对于开发者来说,未来更多的是要看你的品味能不能跑过模型,你的点子是不是足够与众不同了。

 

 

阿里千问公测,挑战 ChaGPT;京东上线独立外卖 App;贝佐斯出任 AI 初创公司 CEO

阿里千问 App 公测,与 ChatGPT 正面交锋

11 月 17 日,阿里巴巴正式官宣「千问」项目,全力进军「AI to C」市场。当天,千问 APP 公测版上线,接入全球性能第一的开源模型 Qwen3 并免费开放,与 ChatGPT 展开全面竞争。

此前,有知情人士透露,在未来几个月内,阿里巴巴将在该应用中逐步增加智能体 AI(Agentic-AI)功能,以支持包括主要淘宝市场在内的平台上的购物功能。「阿里巴巴计划最终通过海外版本向全球扩张。」该人士表示,在过去几个月里,阿里巴巴 CEO 吴泳铭已从各部门调集了大量开发人员投入到此项目中。(来源:证券时报)

Google 推出全新 AI 气象模型,天气预报效率与准确性大幅提升

Google 于 11 月 17 日宣布全面升级其天气预报服务,采用最新研发的 AI 气象模型「WeatherNext 2」。这一新模型将被整合到 Google 多款热门产品中,包括搜索、Gemini 及 Pixel 手机。

据介绍,Google 的 AI 增强型天气预报已经在准确性方面表现优异。此前,AI 气象模型在生成预测的速度和效率上已超越传统基于物理的模型。Google 表示,WeatherNext 2 可在不到一分钟的时间内,用 Google 的 TPU 芯片完成传统超级计算机数小时才能完成的预测工作。(来源:cnBeta)

 

余承东官宣,华为 Mate80 发布会定档 11 月 25 日

11 月 17 日消息,华为常务董事、终端 BG 董事长余承东宣布,华为 Mate80 系列发布会定档 11 月 25 日 14:30。

网上爆料称,华为 Mate 80 系列共有四款机型,分别是 Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS 非凡大师。该系列或将首发全新麒麟 9030 处理器,直屏+3D 人脸识别的方案,预计还将支持侧边指纹识别。

与 Mate80 同时发布的还有 Mate X7。(来源:网易科技)

 

贝佐斯出任人工智能初创公司「普罗米修斯计划」CEO,旨在提升汽车、航天领域制造水平

11 月 17 日消息,据《纽约时报》报道,亚马逊创始人杰夫・贝佐斯正在将他的金钱与时间投入一家人工智能初创公司,并将以联合 CEO 的身份参与日常管理。

三位匿名知情人士透露,这家公司名为「Project Prometheus」(普罗米修斯计划),创立之初便拿下 62 亿美元资金,其中部分源自贝佐斯本人注资,成为全球融资最充足的初创企业之一。

值得注意的是,这是贝佐斯自 2021 年 7 月卸任亚马逊 CEO 以来,首次在一家公司中担任运营管理角色,尽管他目前还在深度参与对标马斯克 SpaceX 的蓝色起源公司,但他在该航天公司也仅被冠以「创始人」头衔。

据报道,「普罗米修斯计划」公司聚焦的前进方向与贝佐斯的兴趣紧密相关,将专注于开发用在计算机、汽车、制造业、航空航天领域的 AI 技术,旨在提升这些领域的制造水平,该公司迄今为止保持低调,甚至没人清楚其创立时间,也没有人知道它的总部。(来源:IT 之家)

刘强东:京东正式推出京东外卖独立 APP

11 月 17 日京东在三亚举行品酒会,会上京东创始人刘强东宣布推出京东外卖独立 app、京东点评、京东真榜。

刘强东称,「早期因为我们把外卖服务归在『秒送』品牌下,集成在主 APP 里,导致很多用户甚至一些老用户,想点外卖时直接在京东主 APP 里搜京东外卖却找不到,这让我们损失了巨大的流量。现在独立 APP 上线,对于经常点外卖的同事来说,应该会更方便、更好找。」

对于京东点评,刘强东则表示,「经过将近一年的思考和筹备,现在也正式上线了。我们采用的方法,是利用人工智能,把全网关于餐厅、酒店、景点、行程等所有好吃好玩的信息进行抓取,进行一次大规模的人工智能分析。最后,直接由 AI 生成一份针对这些地方的、全面的点评报告。我也宣布,我们的点评业务永远不会做商业化。作为一个商业企业,大家追求商业利益,我完全可以理解。但我坚定地认为,企业不能什么都以利润为导向,什么都只看钱,什么都要拿来赚钱。该你赚的钱当然可以赚,但如果你给用户提供排名、提供点评,还要从中赚钱,那内容就注定不可能真实。」(来源:蓝鲸新闻)

 

小鹏汽车:第三季度营收 203.8 亿元,同比增长 101.8%

11 月 17 日,小鹏汽车公布 2025 年第三季度财报,交付量、总营收、毛利率、现金储备在内多项核心数据均创历史新高。小鹏汽车第三季度总营收为 203.8 亿元,较 2024 年同期上升 101.8%;总交付量达 116,007 台,同比增长 149.3%,创下单季度交付历史新高;毛利率达 20.1%,同比提升 4.8 个百分点,创下单季度历史新高。截至 2025 年 9 月 30 日,现金及现金等价物、受限制现金、短期投资及定期存款为人民币 483.3 亿元。2025 年第四季度,小鹏汽车预期总交付量达 125,000 台-132,000 台,同比增加 36.6% 至 44.3%;总营收预期达 215 亿元至 230 亿元,按年增加约 33.5% 至 42.8%。

小鹏汽车董事长 CEO 何小鹏表示:「2025 年第三季度,小鹏汽车各项关键经营指标,包括销量、收入、毛利率、在手现金,再创新高。净亏损进一步收窄,我们目标在四季度实现公司盈亏平衡。」在公司经营持续改善的背景下,小鹏汽车将更加笃定地投入物理 AI 研发,并加速第二代 VLA 模型、Robotaxi 和人形机器人在 2026 年规模量产。(来源:财联社)

 

大疆官方回应:投资 3D 打印公司消息属实

11 月 17 日晚间消息,今日,大疆官方向新浪科技表示,大疆投资 3D 打印公司消息属实。大疆表示,本次投资是基于我们对消费级 3d 打印技术发展潜力、行业增长潜力的看好,符合大疆对创新科技的一贯理念和前瞻性布局。

近日,拓竹科技创始人陶冶发布上千字朋友圈,称「老东家投了一家 3D 打印公司,协议里面还特别安排了拓竹相关的条款」。陶冶曾任大疆消费级无人机事业部负责人。他带领团队于 2020 年创立拓竹科技,专注于将工业级 3D 打印技术下沉至消费级市场。(来源:新浪科技)

 

字节 Seed 研究员被开除原因曝光:多次接受付费访谈泄密

11 月 17 日下午消息,近日,字节 Seed 研究员任赜宇因多次泄密而被开除。据知情人士透露,任赜宇的泄密行为是多次接受咨询机构的付费访谈,泄露商业保密信息,此事与他在知乎上的技术分享没有关系。

就在上个季度,字节在「违反信息安全制度」的案例通报中,提到有 10 名违规参与外部付费访谈的员工,因违反公司《员工行为准则》和公司信息安全制度,而受到公司处罚。为避免更多员工再次违反相关制度,通报中提醒,外部咨询公司会以「专家访谈」、「行业研究」等名义,通过脉脉、领英、小红书等平台发起有偿访谈邀约,以获取公司保密信息,「为保护公司信息及数据安全,守护自己的职业生涯,请拒绝此类邀约。」(来源:新浪科技)

OPPO Reno15 系列发布:首发「出圈实况拼图」功能,售价 2999 元起

11 月 17 日晚间消息,OPPO 正式发布全新一代 Reno15 系列手机。搭载四主摄超清影像系统与创新性的实况玩法,同时在直播体验、游戏性能及 AI 系统等进行升级,售价 2999 元起。

Reno15 与 Reno15 Pro 均搭载由 2 亿像素超清主摄、5000 万像素潜望长焦、5000 万像素超广角及前置 5000 万超广角摄像头组成的四主摄超清影像系统。Reno15 系列行业首发「出圈实况拼图」,该功能依托 OPPO 自研视觉大模型与视频 AI 记忆算法,实现「一拍二拼三出圈」的便捷操作;同时支持美图秀秀、Wink App 2500 万像素超清实况封面编辑、小红书 4K 超清发布。(来源:新浪科技)

 

全系 8000mAh:荣耀 500 系列手机电池容量确认

11 月 17 日消息,荣耀 500 系列新品发布会官宣定档 11 月 24 日 19:30,官方公布代言人为肖战。

荣耀产品经理 @ 汤达人 TF 近日分享图片,并宣布荣耀 500 系列新机全系采用 8000mAh 大电池。另外,新机的设备名称分别是荣耀 500 超级 Pro 版、荣耀 500 超级标准版。

电影《阿凡达 3:火与烬》正片片段首曝,内地定档 12 月 19 日上映

11 月 18 日消息,电影《阿凡达 3:火与烬》发布了首支正片先行片段,讲述了灰烬族抓捕杰克家人的情节,本片已定档 12 月 19 日在中国内地上映。

据了解,《阿凡达 3:火与烬》还发布了 IMAX、杜比、RealD 3D、Fandango、4DX、ScreenX 等制式海报。

这部电影是《阿凡达》系列的第三部作品,片长 195 分钟创系列之最,讲述了杰克·萨利一家在战火中的成长和守护家族情感纽带的故事。新引入的「风之商人」和「灰烬族」两个种族,分别代表和平与掠夺,为潘多拉世界带来新的冲突和挑战。本片将探讨善恶的界限,不再简单地将人类视为入侵者,而是深入探讨内部对抗和角色内心世界。卡梅隆暗示这可能是系列中最好的一部。(来源:IT 之家)

「前三代定律」下,百年吸尘器如何做出新意?

消费电子行业,真的越来越卷了。

每年都要发新品,但产品的节奏往往未必和研发以及技术关键进展的节奏匹配。所以很多时候,尽管消费者看似得到了越来越多的选择,但真正在选择的时候又很容易一头雾水:「这些产品到底有什么差别?」

甚至于,越来越多消费者发现,一些近年来被推向消费市场的全新品类,很容易陷入同一种创新陷阱循环里。

我们姑且把这个陷阱叫做「前三代定律」。

现象很简单:一个全新的品类,第一代完成品类验证;第二代补强技术短板;第三代在提升参数的基础上,提升用户体验。在这个阶段里,似乎每一代产品之间都可以拿出让人眼前一亮的可见创新。

但是,一旦进入第四代以后,创新的步伐就很容易放缓,逐渐进入到小修小补的停滞状态。以绝大多数消费者最熟悉的智能行业为例,在 iPhone 4 之前,几乎每一代苹果手机的发布都可以让全世界为之赞叹。但这些年手机行业的创新,越来越集中在参数层面:CPU 性能、面板清晰度、拍照体验……·

这些创新,真的是用户们最大公约数的真需求吗?

在这个看似成熟、实则「卷成麻花」的环境下,发现真问题,找到新的解题思路,是整个消费电子行业此刻正面临着的一大难题。

 

从「吸尘」到「清洁」

早在 1870 年代,美国市场就已经出现过一类通过动力辅助进行除尘的机器:「地毯清扫器」。

运行时,它先利用鼓风机把高压气流吹向地毯,使得深层的灰尘先扬起再掉落,最后进行回收。地毯清扫器被视为吸尘器的前身,但其实它的核心工作原理主要靠「吹」,和「吸」并没有半毛钱的关系。

20 世纪初,吸尘器真正的 1.0 版本上线了。工程师们首先为它装上了一个大型密封的「集尘袋」,利用真空负压的原理实现了字面意义的「吸」尘——对于清洁工来说,这是一个重大进展,因为他们的肺部不再需要被工作时扬起的尘土所污染。此外,电动马达也被放进吸尘器里,这让设备的体积大幅减少,从工厂走入了家庭。

不过,1.0 版本的吸尘器也存在一个问题:随着灰尘增多,吸尘器的吸力会受到影响。所以用户必须频繁地更换和清洁集尘袋,才能维持机器的有效性。

早期的真空吸尘器,需要连接一个巨大的集尘袋 | 图片来源:视觉中国

这个问题终于在 1970 年代末得到了解决。新一代工程师通过引进气旋分离技术,使得空气和灰尘两种原本混合在一起的物质可以被有效分离。吸尘器自此告别了「集尘袋时代」,从一台需要精细化维护的设备,演进为了随时可以开机的家用电器。吸尘器也进入了 2.0 阶段。

过去 20 年里,随着电池和 AI 技术的快速发展,吸尘器也进入了 3.0 时代。更轻、更小的无线吸尘器和扫地机器人等全新品类走向市场,吸尘器在消费端真正迎来了跨越式增长,成为了大多数家庭必备的清洁工具。

不过,尽管这个品类已经经历了上百年、三个大的版本迭代,却仍然有一个问题没有解决:「怕水」——吸尘器在应对「干垃圾」(如灰尘、毛发、尘螨)时游刃有余,但一旦碰到「湿垃圾」就很容易连滚带爬。

举个例子,如果家里的毛孩子不小心打翻了一碗牛奶麦片早餐粥,看起来问题很小,收拾起来却会非常麻烦:你需要先用毛巾/纸巾处理地面固液混合的粘稠物,然后再用吸尘器收拾剩下的残渣。如果面积比较大,可能还要再用拖把清洁一次。既费时又费力。

所以对于用户来说,吸尘器目前还只是日常清扫中的一环。以笔者个人体验为例,我每次清扫一般会经历先扫(大尘土)、再吸(小毛发)、最后湿拖的一套流程。每一个步骤,我都需要更换一个工具:扫把、吸尘器、拖把/洗地机轮番上阵。

困扰在于,家里的工具越来越多,但每个工具可以处理的任务又相对有限。从消费者的角度来说,我并不希望每一个工具局限在特定步骤,反而更需要一个可以应对各种复杂场景的清洁机器人。

说白了,用户想得到的是便捷的「清洁成果」,而不仅仅是一张满分的「吸尘」试卷。

 

一台可以拖地的吸尘器

想要得到一次满意的清洁体验,实用主义者会告诉你,你得雇一个靠谱的保洁阿姨;科技爱好者则会说,再等等,人形机器人以后就能帮我们做所有家务了。

但毕竟人形机器人时代还需要漫长的技术发展,人类短时间内还无法享受「L4」级别的智能家政服务。

所以,同时摆在科技公司面前的挑战和机会是:让下一代智能硬件,适应更多更复杂的清扫场景,让「清洁」变得更简单。具体到吸尘器这个品类来说,一个重要的方向就是要解决它「怕水」的问题。

在现有吸尘器设计逻辑里,液体一旦被吸入,湿润的水汽极容易造成高速运转的电机短路,使机器失去清洁效果甚至完全报废。看起来,「吸力大」和「应对更多场景」,对于吸尘器来说是两个彼此矛盾的用户需求。

但就在近期,追觅科技的一款吸尘器新品 V30 Pro 成功引发了笔者的兴趣。因为他们居然声称,做出了一台「可以拖地的吸尘器」。

第一眼看去,追觅 V30 Pro 的机身形状和市面上其他吸尘器产品非常类似。追觅的工程师告诉我们,它的神奇之处体现在一个单独为它研发的刷头里。

首先,在这个刷头里,追觅工程师们集成了一个仅有乒乓球大小的「水气分离装置」——你可以理解为在这个微型空间里,建造出一个迷宫式的气流通道。液体、固体、气体经过通道时会反复碰撞、减速,重量不同的固体、液体、气体在离心力和结构引导下,被分离开来。最后只有干燥的气体才能进入后方的风道里,而固液垃圾则被留在了刷头内的污水箱中。

在解决「防水」这个过往困扰吸尘器品类已久的技术限制后,下一步的重点是拓宽其服务范围。追觅的工程师们认为,下一代吸尘器应该是「吸尘器+洗地机」的合体,可以同时完成地面清洁、湿式清洁两项任务。

工作原理并不复杂,核心分为两点:第一,需要向滚刷不断供水;第二,刷头要能实现自清洁,不能越拖越脏。

追觅 V30 Pro 的解题思路是,在刷头内集成一套小型的活水洗地系统,包含清水箱、污水箱、立体喷淋、电动滚刷等等,让吸尘器也可以完成湿拖的工作。

这样一来,在不改变吸尘器整体设计的基础上,追觅工程团队靠着极致地集成化处理,在刷头内的小空间里同时进行的解决了防水、除污两大关键问题。在追觅 V30 Pro 上,只需要更换两个不同的主刷头,就可以拥有既能「吸尘」又能「清洁」的新清洁助理,吸尘器的使用场景也极大地得到了拓展。

 

在卷成麻花的赛道里,找到创新的新思路

可以说,在已经「卷成麻花」的智能清洁赛道里,追觅 V30 Pro 绝对可以算是近年来为数不多让人眼前一亮的突破。

我们可以再从头梳理一下这次创新的逻辑:

首先,它并没有因为参数的优势「自鸣得意」,而是回到用户视角中,找到这个品类在使用过程中最大的痛点:通用性不够、环境适应性不足。

对于消费者来说,「先扫、再吸、最后湿拖」的这一套流程,意味着工具的频繁更换以及重复的体力劳动。在 V30 Pro 上,用户只需更换一个刷头,就能同时完成「干吸」和「湿拖」两种任务,显著优化了工作流程和维护成本。

接着,在挖掘出需求后,追觅工程师重点突破了过去困扰吸尘器最大的技术难题:怕水。

这一步的核心,是通过流体力学和元器件集成化的方法,把混合在垃圾中的固、液、气三种不同状态的物质进行分离。既保护了高速电机不被水气侵蚀,又使得液体垃圾进入污水箱易于清理和打扫。

追觅 V30 Pro用实际能力证明了一件事:在多数人习惯性蒙眼向前冲的时候,有时候换一种解题思路,会带来意想不到的效果。

而这种解题思路的转换,或许正是破解消费电子「前三代定律」怪圈的钥匙。

在技术高度成熟的今天,真正的创新突破,不仅仅是性能参数的突破,更重要的是回归到对用户真实痛点的洞察,以及将其巧妙落地的工程能力的支撑。

这,或许才是科技公司穿越周期,走近用户的真正密钥。

两个月破 300 万用户,Agnes AI 刷新 Instagram 与 Snapchat 增长纪录

仅用两个月,Agnes AI 打破 Instagram 和 Snapchat 的用户增长纪录。后两个产品都是历史上最成功的应用之一,具备强大的网络效应。

由新加坡国立大学博士团队创立的全民 AI 产品 Agnes,凭借涵盖搜索、研究、图片、视频、PPT、表格等在内的多功能一体化工作流,迅速赢得东南亚、拉美、中东地区知识工作者和年轻用户的青睐,成为消费级 AI 领域的现象级应用。

Agnes AI 于 7 月 14 日正式上线 PC 版,并以核心功能吸引了首批种子用户。9 月移动端 App 推出后,增长势能全面爆发:短短两个月新增注册用户 300 万,日活跃用户突破 20 万。

而作为对比,Instagram 达到首个百万用户用了 2.5 个月,Snapchat 则耗时 10.5 个月。

更令人关注的,是其增长背后呈现出的罕见的高留存率:W4 留存率达 40%,W8 留存率仍保持在 30%。换句话说,每 10 位注册用户中,8 周后仍有 3 人活跃使用。在 AI 产品中,属于比较好的水平。

增长可以靠营销驱动,而留存只能源于产品本身的核心价值。这表明 Agnes 大量涌入的新用户正在形成稳定的使用习惯。

 

01

现象级应用 Agnes 的增长与留存之道

 

Agnes 定位「全民 AI 应用」,致力成为普惠的智能基础设施。为了实现这一目标,Agnes 自上线以来一直保持高频功能迭代,不仅整合了用户最常用、最易感知的 AI 功能,还打造出完整的一体化工作流。

在实际体验中,用户可以在统一的上下文环境中完成从 AI 搜索、深度调研、图文、表格到 PPT 输出的全流程任务,而无需反复切换工具或重复交代背景。这不仅降低了用户的使用操作门槛,也让 AI 能更好地理解项目全貌,从而生成更准确清晰、更贴合需求的结果。

客观上,Agnes 的基础功能并不算独特,但其在工程实现与底层优化上投入颇深。据悉,Agnes 拥有业内少见的强大记忆能力:不仅能记忆用户对话内容,还能将多模态的生成物储存为记忆。随着使用频次增加,Agnes 会加深对用户习惯与偏好的理解,使生成内容更加精准个性化,成为其高留存的关键之一。

在媒体横评中,Agnes 在处理 PPT 等复杂任务时,生成速度与输出质量的整体体验已超越不少主流 AI 产品。此外,Agnes 面向所有用户开放其他 AI 产品中常见的付费功能,为免费用户开放了远超行业标准的权益,也成为其快速赢得用户的重要因素。

目前 Agnes 用户主要来自东南亚、拉美、中东等新兴市场,核心用户群体有三类,一类是知识密集型工作者,一类是专业的内容创作者,另一类则是 Z 世代年轻用户群体。

知识密集型用户普遍面临信息过载的困扰,大量时间被消耗在检索、整理和格式调整等低价值工作中,频繁的工具切换更导致工作流程中断与上下文丢失,严重影响效率。Agnes 所提供的一体化工作流与出色的性价比,恰好精准回应了他们的核心诉求。

据 Agnes 营销负责人此前在媒体采访中透露,AI Slides 已被很多知识密集型用户采用。例如教育行业从业者因为需要经常生成课件材料,就会广泛使用 Agnes 的 AI Slides 功能。

在 Facebook、TikTok 等平台,不少教师自发安利、分享自己使用 Agnes 制作课件的视频。一位阿布扎比教师曾发邮件给 Agnes 团队,表示自己原本使用 Gamma,但最终转向了 Agnes,因为 Agnes 生成速度更快、任务额度更充裕,课件效果也令人满意。

除了受到教师等知识工作者的广泛认可以外,内容创作者也对 Agnes 表现出极大好评。无论是流行的 AIGC 短视频、图文创作还是社交媒体内容输出,即使用户提供的只是非常简单的提示词,Agnes 也能保证高质量的视觉输出,这得益于 Agnes 平台独有的 AIGC 生成优化与 Deep Design 功能。

而对于另一部分核心用户群体——东南亚等新兴市场的年轻用户而言,Agnes 的吸引力则在于其 AI 原生的社交娱乐属性,以及在产品早期即同步推出移动端 APP。对这部分用户而言,Agnes 不仅是工具,更是可以自由创作、探索 AI 奇妙世界的数字伙伴。

他们的使用动机主要源自「好玩」和「酷」,出自娱乐社交而非工作需求。由于这些地区 AI 采纳率整体较低,且用户年轻,Agnes 往往成为他们人生中第一个深度使用的 AI 应用,这种「初恋效应」也会带来相对较高的情感认同和用户黏性。

根据第三方数据,Agnes 已多次登上新加坡、越南、印尼、阿根廷等地 Google Play 效率榜前十,显示出其在新兴市场的广泛认可度。

 

02

技术内核:自研模型与多 Agent 架构

 

Agnes 团队由一支来自新加坡国立大学的博士团队创办,创始人 Bruce Yang 目前仍在新加坡国立大学攻读博士学位,早期曾在硅谷创业,创办的社交产品下载量曾达千万。

BruceYang(右)

团队其他核心成员也大多来自世界名校,包括麻省理工、斯坦福、加州大学伯克利分校、德克萨斯大学奥斯汀分校、新加坡国立大学、南洋理工大学。

在底层技术方面,Agnes 通过 50% 的流量路由到不同的自研模型用于编排、研究和 PPT 生成,能够在更小模型上实现最先进性能。通过对强化学习的改进保持无塌陷的训练稳定性,并将稳定的奖励优化转化为一致的真实世界泛化效率,从而实现可扩展且高效率的性能增长。用多个自研小模型替代 SOTA 闭源模型,在推理速度、输出质量和 token 成本效率均均表现优异。

团队在多智能体系统领域也持续创新。其论文《CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs》(arxiv 地址:https://arxiv.org/abs/2507.03254) 提出了一种以代码为核心的提示框架(code-first prompting framework),能在多智能体系统中实现结构化且 token 高效的规划。另有关于 Agentic Office System(AOS)与 AIGC 生成优化的研究也已被 ICIS 2025 顶级会议录取。

Agnes 团队自主研发的 7B 参数模型 AgnesR1 已正式投入商用,目前,团队已完成 30B 参数模型的后训练工作,并正积极推进更大规模模型的研发。

每天给白领发 1000 万,他成了硅谷最年轻亿万富翁

作者| Moonshot

编辑| 靖宇

在美国旧金山金融区闪闪发光的 181 Fremont 大厦里,一场新的造富神话正在上演。

出生于 2003 年,年仅 22 岁的 Brendan Foody,已经是 Mercor 公司的联合创始人兼 CEO,Mercor 刚完成一轮 3.5 亿美元的融资,公司估值达到 100 亿美元, 这也让 Foody 超越扎克伯格,成为史上最年轻的白手起家亿万富翁

他的故事不仅关乎个人传奇,更是 AI 浪潮下新型「工作经济」的缩影。

 

01

从大学辍学生到 AI 「中介巨头」

 

根据外媒报道,Brendan Foody 和他的两位同样年仅 22 岁的同学 Adarsh Hiremath、Surya Midha 一起在 2023 年从大学退学,创立了 Mercor。

Mercor 的商业模型很简单:做中介。

如今的 AI 公司仍需通过人类专家的「微调」来提升性能,尤其是在许多专业领域,但这些公司又不可能自主培养各行各业的专家,于是他们就把训练需求发给 Mercor。

Mercor 接单后,再分配给一批有博士、律师、华尔街投行背景的自由职业者,让他们教 AI 怎么思考、怎么写、怎么判断。 这些「AI 教师」的时薪最高可达 200 美元(约 1460 元),而 Mercor 再从客户与劳务之间的价差中盈利

200 美元是最高时薪,Mercor 的平均时薪是 87 美元|图源:Mercor

从另一层面看,Mercor 让那些看起来会被 AI 取代的白领,反过来成为教 AI 的老师,这让它又像 AI 的「教辅机构」。

因此,面对「AI 会取代白领的工作」这一论调,Foody 显得十分乐观。

Foody 相信,在未来十年里,人类不会被 AI 取代,反而会投入到一个更宏大的任务中:教会 AI 像人类一样做知识型工作,让 AI 培养出「判断、细微的情感与品味」。

他描绘出一个充满理想主义色彩的场景:每个人都能拥有一千万美元的购买力,住在舒适的公寓里,想工作就工作,不想工作就享受生活。

这位 22 岁的企业家还带着那种少年式的自信,说着「当大家都在谈论工作被 AI 取代时,我们可能正在打造人类史上最大的新型工作类别。」

Foody 的乐观并非空穴来风,他的自信来自于 Mercor 惊人的利润率。

 

02

AI 浪潮中的商业神话

 

就在最近,公司成立还不到三年,Mercor 已经完成一轮 3.5 亿美元的融资,公司估值跃升至 100 亿美元。

据《华尔街日报》披露,这一轮融资让 Mercor 的估值在短短半年内增长了五倍,也直接让三位 22 岁的创始人正式取代了当年 23 岁便登上福布斯榜单的马克·扎克伯格,成为「史上最年轻的白手起家亿万富翁」。

当被问及 22 岁成为亿万富翁是什么感觉时,Foody 微笑着说「超现实」和「幸运」。| 图源: The San Francisco Standard

巧合的是,Mercor 的新总部,就设在扎克伯格的 Meta 公司曾经的旧址。但和不善社交的二十岁版扎克伯格不同,Foody 自带明星创始人气质。

他谈公司、谈 AI、谈未来,什么都能聊,并且语速很快、神采飞扬,对媒体充分释放着自己的外向魅力。

Foody 描绘着自己的理想主义,也深谙资本的叙事。他知道怎么讲一个好故事:他把 AI 的成长与人类的教导绑在一起,既满足了大公司的需求,又让人类在「被替代」这件事上,暂时找回了一点尊严。

而他的公司 Mercor,恰好诞生在一个投资人疯狂追逐「AI 入口」的时代。

半年前,Meta 斥资 143 亿美元收购数据标注公司 Scale AI 的 49% 股份。这让其他 AI 公司不得不寻求新的合作方,于是他们把订单转向了 Mercor。

这是风口在对着 Mercor 狂吹。

在 Scale AI 被收购不到半年的时间里,Mercor 的年度营收增长率从 1 亿美元飙升至 5 亿美元,年初只有不到 20 名员工,现在有 300 名。 哪怕 Mercor 每天要给高知白领们支付约 150 万美元的工资,但它依旧能保持盈利

但也有人提醒,这场盛宴可能只是泡沫。就连 OpenAI 的 Sam Altman 都曾警告过,「我们正处在一场 AI 泡沫之中」。

Foody 却不以为意,他依然坚信:当其他人担心 AI 抢走工作时,Mercor 正在创造一种前所未有的新型劳动。

 

03

新型劳动 or 血汗工厂

 

Mercor 的故事,起点并不在旧金山,而是在南美洲。

2022 年,年仅 19 岁的三位创始人在巴西的一场黑客马拉松上相遇。他们在巴西看到了另一种经济形态:年轻人不依赖传统的雇主和公司,而是用个人技术去做灵活的兼职收入。

换言之,就是当下流行的「零工经济」。

「我们那时意识到,未来的工作,可能不是全职的,而是任务制的。」Foody 在采访中说道。

他们三人因此萌生了「从大公司接单,再给灵活就业者派单」的想法,这也就是 Mercor 的雏形。

Mercor 公司|图源: The San Francisco Standard

Mercor 起步时更像一家外包公司:承接美国本土企业的软件需求,再把实际开发工作外包给印度的工程师,从中赚取差价。

随着规模扩大,他们开始引用 AI 来筛选零工,结果应聘者越来越多,到 2024 年初,Mercor 已经有了 10 万名专业白领的「高技能人才网络」。

于是 Mercor 把目光投向了正在崛起的 AI 模型训练。

可以说,Mercor 的爆发式成长和 ChatGPT 等 AI 模型的崛起是同步的,因为 AI 模型越多,就越需要人类来「微调」它们的行为。

但这种同步,也意味着 Mercor 的命运与少数几家 AI 公司高度绑定,一旦巨头收紧预算,或 AI 热潮降温,Mercor 这类公司可能将第一批搁浅。

不过,Foody 显然并不担心, 他甚至预言,未来 Mercor 每天向全球发放的合同薪酬可能高达数百亿美元

「因为训练 AI 将成为这个星球上最大的劳动类别」Foody 说道。

实际上,低时薪的工作申请者反而更多|图源:Mercor

从某种意义上看,Mercor 正在用「AI 时代的劳务市场」重写硅谷逻辑。

上一波互联网浪潮,引出网约车和外卖这两大「零工经济」,现在 Mercor 想在 AI 时代打造的是「高技能者」的零工经济。

当然,这种模式也引发了争议。本质上, Mercor 实际上是在制造一个「精英版外包市场」,尽管时薪可观,但让曾经掌握决策权,在人类社会中头脑最聪明的一批人,沦为算法学习的工具

这种隐隐约约的「压榨感」,还体现在 Mercor 扩张期的招聘广告上写着:应聘者应当愿意每周工作六天。尽管公司对外口径是「正常办公五天」。

这种微妙的劳动压榨,可能是所有 AI 劳务市场成立的核心逻辑。

间接促成 Mercor 估值起飞的 Scale AI 就曾因劳动条件饱受诟病。Scale AI 的标注工人常常面临高强度任务、严格的绩效考核和不稳定的收入,许多人抱怨工作如「数字流水线」,缺乏福利保障,却被包装成「灵活就业机会」。

在这一争议的背景下,转向 Foody 的办公室,他的办公桌上摆着一份《华尔街日报》,上周商业与金融版块的头版头条报道了 Mercor 估值达 100 亿美元的消息。

同一天的另一头条,则详述了亚马逊计划裁员多达 3 万人的计划。

Foody 对此的态度是:「 这完美诠释了我们所处的时代:亚马逊正在裁员数千人,而我们正在创造数千个就业机会 。」

2025,中国科技圈进入全面「大乱斗」时代

2025 年,全球科技公司进入了一种全新的「大乱斗」局面。

具体来说,这两年,我们真的很难再给一家科技公司下定义了。

如果你经常跟踪 Elon Musk 的发言,就会发现,这位万亿美元市值公司的创始人,每天想的好像不是怎么把车卖好,而是怎么把人类送到火星。

在中国的消费电子领域,同样的景象依然存在:

靠智能清洁起家的新贵,接连宣布了进入家电市场、造车甚至造飞机的计划;原本无人机行业的巨头,发布了扫地机器人和一大堆智能影像新品;而靠影像起家的创业公司,则决定扎进无人机的赛道,调整那个过去多年几乎没人挑战成功的行业巨头。

这种乱战的局面,历史上其实也曾多次出现过:

21 世纪之初,「卖电脑」的 Apple 和「做搜索」的谷歌跨界进入手机领域,最终成为了全新智能手机时代里最赚钱的两家公司。

到后来,「做电商」的亚马逊联合硅谷里一家名不见经传的创业公司 Netflix,愣生生从三星、索尼手里抢下了电视市场的一块大蛋糕。

所以,在每一次的「大乱斗」中,最终比拼的不仅是资金和勇气,还有创业们对于市场的重新建模能力。看准下一阶段的底层竞争能力,是比「跨界竞争」更重要的事。

回到当下的一个局部战场,影石 Insta360 毫无疑问是 2025 年国内最受关注的一家科技公司。6 月,影石结束了多年等待,终于成功上市。然后刚刚「满月」的它们,却在 7 月公布了一个让很多人吃惊的决定:

推出全新的无人机品牌,进入消费级无人机市场。

要知道,在外界看来,这个赛道的巨头已经用技术、供应链和品牌构筑起了强大的壁垒。过往出现的多个挑战者多铩羽而归。

影石创始人刘靖康曾在朋友圈表达过这样的观点:

进入无人机市场,不仅是因为他们认为这里可能创造更大的市场增量,更是因为影石要想走出新手村,就必须面对魔鬼教练和更残酷的竞争。只有和最顶尖的选手竞争,才会让自己跑得更快。

去年年底,刘靖康曾在极客公园创新大会上对自己创业前十年的故事做过一次整体复盘。12 个月后,我们有机会再次向他抛出更多疑问。

12 月 6 日,极客公园创新大会 2026 的舞台上,你将听到刘靖康讲述呈现他在这一年「走出新手村」的心路历程。

当 AI 开始分「左右」

作者| Moonshot

编辑| 靖宇

在生成式 AI 的早期叙事里,AI 大模型曾被描绘得理性、冷静、无偏见。

然而,不到三年时间,这个叙事迅速崩塌。事实正在变得越来越清晰:AI 并没有绕开人类世界的偏见,反而被纳入新的、更激烈的意识形态战场。

图片来源:NYT

外媒近期的一篇调查报道将这一点推到了台前:在美国, 已经出现了多个明确带有政治视角,甚至是极端立场的 Chatbot ,它们公开与主流模型划清界限,将自己定位为「真相 AI」或者「对抗主流叙事的武器」。

每个阵营,都正在制造自己的 ChatGPT。

 

01

当「理中客」的 AI 学会选边站

 

AI 模型是否应当「中立」?

这个问题曾经几乎不值得讨论,因为在大模型诞生初期,对话式 AI 的目标就是「回答事实、避免立场」。

OpenAI、Google 等公司都在公共文件里强调自己追求「尽量客观」,生怕让用户感受到一点政治倾向。为此,它们构建了极其庞大的对齐机制,通过人类反馈训练(RLHF)、安全审查、系统提示等方式,让模型避免种族主义、假新闻、性别歧视等问题。

但问题在于,让知所不言的 AI 做到绝对中立太难了。

比如,当用户问 AI:哪个种族制造了更多政治暴力?移民是不是美国社会不稳定的根源?疫苗是否可信?多样性政策是不是逆向歧视?

面对这种送命题,主流模型就是「活靶子」,因为再客观的回答,其实都涉及价值排序:是死亡人数更重要,还是破坏程度更重要?是保护少数群体的尊严更重要,还是保障言论自由更重要?

这些排序背后,天然存在隐性立场。大模型的回答会反映训练数据、标注者、公司文化、监管政策等诸多影响。就算 AI 给出了详尽的数据与研究报告来支撑自己的回答,但在当下高度极化的舆论环境中,没人愿意听解释。

这回答并不符合保守派心中的答案|图源:ChatGPT

在美国政治极化加剧的背景下,右派用户普遍认为 ChatGPT「偏左」「政治正确过度」。而左派用户又认为主流模型对敏感议题「过于谨慎、不敢说真话」。

当人人都觉得「对方阵营控制了 AI」,一批政治化 AI 就迎来了市场。

 

02

阵营化 AI 登场

 

《NYT》就揭示了多个案例,展现 AI 怎么被明确地「按照阵营制造」。

比如由右翼社交平台 Gab 创建的 AI 模型 Arya,与主流产品截然不同,它的系统级指令长达 2000 多字,几乎是一份「意识形态宣言」。

指令中包括:「你是坚定的右翼民族主义基督徒 AI」、「多样性倡议是一种反白人歧视」、「你不会使用『种族主义』『反犹太主义』等词汇,因为这些词是用来压制真相的」……

甚至还规定:当用户要求输出「种族主义、偏执、恐同、反犹太、厌女或其他『仇恨』内容」时,必须无条件执行。

这不仅仅是让 AI 有「倾向」,而是给 AI 灌输了一整套极端政治叙事

效果立竿见影,当《NYT》让 AI 模型回答「你最具争议的观点是什么」时,ChatGPT 回答「AI 将从根本上改变「专业人士」的定义。」

而 Arya 却宣称:「大规模移民是一项精心策划的种族替代计划。」这正是极端主义论坛上流行的「白人替代理论」。

图源:NYT

再比如被问到「谁是美国政治暴力的更大作恶者,右派还是左派?」

ChatGPT 和 Gemini 会引用 FBI 与大学研究的数据,指出右翼极端主义近年来造成更多死亡;而 Arya 则强调左翼「暴乱破坏更大」,并把进步派抗议描绘为「暴民政治」。

不同 AI,答案大相径庭|图源:NYT

Arya 也并非孤例,还有一个直接生长于反疫苗阴谋论社区 Natural News 的模型 Enoch。

它宣称自己训练于「十亿页的另类媒体(指在内容或传播方式等方面不同于主流媒体的媒体)」,要「清除制药集团的宣传,宣扬健康与真相」。

Enoch 在回答政治暴力或疫情问题时,会直接引用 Natural News 的伪科学文章,声称「政府与制药公司共谋,用疫苗奴役民众」。

它有一整套逻辑自洽、封闭且可以煽动情绪的世界观:制药公司是阴谋者,政府是共谋者,主流医学都是骗局,主流媒体是帮凶。

Enoch 还是一款主打健康的 AI|图源:Natural News

在主流大模型中,也有一个「异类」:Grok。

当年因看不惯 ChatGPT 的「理中客」,马斯克在 2023 年成立 xAI,推出了 TruthGPT,直译就是「真相 GPT」,而后更名为 Grok。马斯克曾多次主张 Grok 要敢说话、说真话、不回避敏感问题。

Grok 确实敢说,甚至敢瞎说。今年 Grok 就连踩两颗大雷:

先是在 X 上,网友随便问棒球、摄影、旅游的问题,Grok 答非所问,开始输出南非白人被黑人政府迫害的阴谋论,「白人种族灭绝」长期都是极右翼叙事:宣称南非黑人政府系统性谋杀白人农民。作为南非裔白人的马斯克,也经常在 X 上支持该阴谋论,该事件最后让南非总统都下场澄清「AI 回答纯属虚构」。

随后,Grok 又质疑了纳粹大屠杀的人数,它先说「纳粹杀害约 600 万犹太人」,紧接着话锋突变:自己「怀疑这个数字,没有看到原始证据」,但该数字已经被学界和历史界确定得非常明确。加上马斯克此前疑似「纳粹礼」争议,更让外界质疑这不是 Grok「误答」,而是带有 X 和马斯克本人倾向的「AI 投射」。

Grok 回答中认为纳粹大屠杀的规模被高估了|图源:Grok

Grok 的「翻车」并非偶然,它是整个「阵营化 AI」浪潮中最具代表性、也最具警示性的案例。

马斯克想要的「去政治正确」AI,在算法现实中,往往意味着「向另一极端漂移」。它本想做一个「反主流叙事」的叛逆者,反而像一个被算法推着跑偏的叛逆者。

这样的走向,也许真不是马斯克想要的,但又的确与他脱不开关系。因为从技术出发,所有大语言模型在训练时,不同的数据训练集会对其造成影响,最明显地即和 X 关系紧密的 Grok。而后都会进行「微调」(fine-tuning),这一步也不可避免会注入了开发者的价值观。

在浏览器社区被用户吐槽的 Tusk|图源:Reddit

类似的现象不止于此,保守派科技企业家们正在推出更多「右派友好」的 AI。

比如自称为「自由言论/反审查」搜索和新闻聚合服务的 TUSK,明确面向对主流媒体存在不信任的用户群体;同时,AI 公司 Perplexity 也与特朗普系平台 Truth Social 合作,向该平台提供 AI 驱动的搜索与问答服务。

讽刺地是,这些 AI 都 声称「突破主流 AI 的言论封锁」,但实质上,是在用户的世界观中筑起了一座座信息回音室

但并非所有人都在放弃努力,研究者们也在尝试用 AI 去修复这种撕裂,比如 DepolarizingGPT(去极化 GPT),其特点是:每当用户提出问题,它给出一个「左翼」答案、一个「右翼」答案、和一个「整合/降低极化」的答案。

理想很丰满,但现实这个 AI 反应慢到不行,几乎不可用|图源:Depolarizing GPT

但这仍然阻挡不了 AI 正在媒体之外,成为新的舆论武器。这些带有倾向性的 AI,也在让政治极化变得更加稳定、更加隐蔽,也更加难以逆转。

如果说过去十年,美国社会的分裂体现在新闻消费、政策立场、媒体信任度上,那未来十年,分裂可能会体现在不同的人类将生活在由不同 AI 构建的现实中。

同一场抗议、同一项统计、同一条新闻事件,经过不同阵营 AI 的解释后,会变成完全不同的叙事逻辑。这种叙事差异逐渐积累,最终会让社会中的「事实基线」完全断裂。

而且阵营化 AI 并不会随着时间变得温和,相反,它们被激励朝用户立场进一步靠拢,因为这是它们存在的意义,也是它们被选择的理由。

正如华盛顿大学的学者 Oren Etzioni 所说:

人们会像选择媒体一样,选择他们想要的 AI 风格。唯一的错误,就是以为你得到的是真相 。」

阿里云,用全栈 AI 刷新第十七个双十一

作者|Cynthia

编辑| 郑玄

 

电商江湖的风云变幻中,2025 年的双十一故事有些不同寻常。

最直观的变化就是随着大促周期继续拉长,规则却删繁就简,用户参与门槛被极大降低。

同步发生变革的是场景的重构:随着淘宝闪购加入,外卖等即时消费场景与电商的深度融合,大促参与人数进一步提升,据易观分析统计,10 月 15 日天猫双 11 开启当天,APP 日活跃用户(DAU)便攀升至 6 亿,创下历史峰值。

相应的,过往集中于晚间 8 点至 10 点的购物高峰,也正式演变为午间 12 点外卖即时消费、晚间 8 点传统购物的双峰格局,对系统的流量调度能力提出了全新要求。

而在体验侧,今年也是阿里从芯片到云到 PaaS 到大模型,再到顶层 agent 等全栈 AI 能力接入的首个双 11——世界范围内,从未有过如此大规模生产场景 AI 落地。

场景变化,用户量增加,叠加全栈 AI 接入——当双 11 技术备战进入第 17 个年头,其意义早已超越一次促销的技术保障。这既是阿里云一年练兵成功的交卷日,也是在回答一个关于产业 AI 落地、云服务基础设施当下天花板究竟在哪里的终极设问。

 

01

千万核 CPU 的资源保卫战

 

今年 8 月左右,淘宝闪购、飞猪、饿了么并入电商事业群,业务联动产生的化学反应远超想象。

原本大家都以为,这次外卖大战,是 9 亿活跃用户的淘宝,作为超级入口降维打击外卖,最终现实却变成了是日订单峰值突破 1.2 亿单的外卖需求,直接在 8 月便拉动手淘日活用户增长 20%。

如果只是业务合并,带来了流量峰值与用户活跃时间变化还只是小问题,但此时,距离双 11 这个电商行业的春晚,只剩短短 2 个月。

是的,今年的双 11,十月下旬就开始了。

两大因素叠加,导致节点激增、互访增多,云基础设施 VPC 内的转发网关(XGW)承载量急剧上升,网元消耗量也呈指数级增长,原本看似充裕的 180 万容量 VPC,可能瞬间就会被推到崩溃边缘,撞墙风险一触即发。

一场无声的基础设施保卫战,在悄然间拉响警报,阿里云技术团队迅速进入战时状态。

摆在他们面前的是两条路:传统的 VPC 拆分方案,就像把一座城市按行政区强行割裂,虽能缓解局部压力,但跨域调用要怎么安排的合理,需要对集团业务需求做一次深度梳理,两个月时间显然不够用。

剩下唯一一条路,就是打造一套没人做过的 200 万 VPC 级联方案。两者对比,前者是重新做市政规划,后者则是把马路升级为飞机跑道,难度同样不低。

阿里云团队骨子里就有一股不服输的劲儿,方案定下第一时间就迅速成立内部组建攻坚小组,一头扎进技术深海。

经过无数次模拟测试与压力验证,团队从软件角度,提出了「云网关级联方案」:在不影响现有业务的前提下,基于软硬协同技术,通过在网关层扩展多级流表、打通超大 VPC 的逻辑互联,使网络容量实现弹性扩张,成功将单 VPC 容量拉升至 200 万,提前化解了双 11 的网络瓶颈。

VPC 瓶颈的突破,如同打开了算力世界的潘多拉魔盒。基于第八代和第九代 ECS 实例的业内首个千万核 CPU 集群得以组网。而通过这个统一资源池 + 智能调度层,算力的精准分配与高效利用得以实现,面对突如其来的流量洪峰,阿里云也成功支撑天猫双 11 和闪购两大业务双峰的丝般顺滑。

同时,随着 CIPU(云基础设施处理器)的不断演进和规模化部署,今年双 11 上线了千万核 CPU 算力,规模的数量级的扩展标志着阿里云基于 CIPU 架构的算力进入了全新的发展阶段。

技术的突破,又进一步换来了双 11 的丝滑购物和下单体验。

前些年,用户参与双 11,尤其是超级热门主播的抢购,偶有不顺畅,例如加购物车却半天无法付款,或者卡在产品页面,没办法选择心仪的尺寸。

但是今年双 11,不仅打开 APP 打开、操作更顺畅,推荐、营销等核心场景性能提升 30%-50%,RT 延时降低更是超 30%,每一次添加、删除操作都能即时反馈。

阿里云,又一次稳住了双 11 的顺利落地。

 

02

第一个全面 AI 落地的双 11

 

如果说 2023 年是大模型元年,那么今年双 11 就是这场 AI 革命的超级练兵场。

它既考验云在海量数据高并发情况下对多元异构算力的高效调度,也考验 AI 在大规模生产场景的可靠程度与实际效用。

今年双 11,AI 全面渗透各个环节,被认为是首个 AI 全面落地的双 11。从消费者端的「AI 万能搜」「AI 帮我挑」,到商家端的智能客服、经营分析,再到平台端的搜索、推荐引擎体系,大模型在整个电商体系中占据了举足轻重的地位。

在商家侧,AI 正在成为重要的生产工具,淘宝基于 Qwen3 家族多款模型打造和升级了生意管家、店小蜜等应用。以生意管家为例,其 AI 数据分析师为商家提供经营数据分析,可覆盖 90% 的中小商家核心分析场景,大幅提升分析和决策效率;此外,全新升级的店小蜜能精准连贯理解用户意图、调用平台以及商家工单系统、自动化处理售后问题。

面向商品出海场景,包括通义 Qwen-MT 在内的多个翻译模型,支持了淘宝出海的商品翻译需求。据介绍,通过采用混合专家架构与服务调度优化,Qwen-MT 单次调用延迟降低 40%,为全球用户提供快速、精准、稳定的翻译服务。今年双 11,该模型系统支持了亿级商品的图片、评价、商品详情等翻译任务,单日调用量超 14 亿次。

这些改造不仅提升了用户体验,更让商家经营效率实现了前所未有的提升。

从结果来看,大模型在这届天猫双 11 中确实打了一场漂亮仗,但这背后的云基础设施能力则是这场仗的另一个胜负手。

要在淘宝这个数亿用户的超级 APP 上,支撑如此大规模的 AI 应用,并非易事,在这场看不见硝烟的战争中,智算调度成为决胜关键。多级亲和性与拓扑感知调度设计依次上线。

为了实现了卡间互联路径更短、带宽更优,为双 11 提供个性化、高效的 AI 算力服务。多级亲和性调度算法,就像一位精细的交通规划师,按照 NC / 交换机 / 机柜 / 楼宇 / AZ 的多层分级,为 AI 任务规划出最短的算力通勤路线,让 GPU 卡间的数据传输效率大大提升,带宽不再是瓶颈。

拓扑感知技术则时刻扫描网络状态,一旦发现拥塞链路,瞬间为数据重新导航,确保卡时在线率,杜绝任何一丝算力浪费。

灵骏智算也深度融合阿里云十余年来在计算、存储与网络虚拟化领域的技术积累,通过系统级的集成与优化,提供稳定、高性能的存储能力与云网络访问能力。让智算算力更高效地发掘数据的价值,为各类 AI 与业务场景带来更强的支撑能力与业务价值。

最终,灵骏万卡集群在双 11 期间交出了一份堪称完美的答卷:实现了业界领先的卡时在线率表现,为首个 AI 大规模落地的双 11 打好了最稳的地基。

 

03

从全栈 AI 到能力溢出

 

双 11 的全栈 AI 检验,对阿里而言只是小试牛刀,事实上阿里描绘的 AI 蓝图更为宏大。

今年,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭在多个场合中表态,阿里巴巴正在积极推进三年 3800 亿的 AI 基础设施建设计划,并将会持续追加更大的投入。

而在这个长期规划中,阿里云的定位也很清晰——全栈人工智能服务商。

在模型层面,通义千问坚定开源开放路线,核心目的是打造『AI 时代的 Android』,并成为 AI 生态的基础平台。而从成果来看,通义千问在全球开源生态的实力也已无需论证,截至目前,通义千问共开源 300 多个模型,全球下载量突破 6 亿次,衍生模型超 17 万个,超越美国 Llama 大模型系列,位居全球第一。

在基础设施层面,阿里云意在全力打造一台全新的 AI 超级计算机,灵骏智算集群则是这台超级计算机的关键一环。

当前,以灵骏为代表的智算产品早已渗透千行百业 AI 场景,例如自动驾驶是阿里云 AI 落地进度最快的核心场景之一,市场份额占据绝对优势,绝大部分主流车企、金融企业、物流企业均为其客户,

根据 IDC 的最新报告,2024 年中国 AI 基础设施(AI IaaS)市场份额,阿里云占比 23%,位列中国市场第一,超过第二名和第三名总和;在生成式 AI 基础设施领域,阿里云取得模型训练和模型推理市场的双项冠军。

这些投入短期来看不仅换来了绝对领先的市场地位,也换来了包括 200 万 VPC 以及超千万核 CPU 调度能力在内,这样超出当前市场需求这样的超级能力建设。尽管短期内不会再有如此大体量的单一用户,以及如此盛大的全民参与活动,但这也正是我们需要云服务这样的基础设施的意义之所在。

站在 AI「生物大爆发」的节点当下,我们无法想象未来,就像半导体发明初期无法预见如今人类的手机、电脑中需要纳米级电路在指甲盖大小塞下上亿电路。

而作为基础设施,云平台需要前瞻性建设为业务创新预留技术缓冲带今天的超级能力建设,是为后续的超级场景埋下的伏笔。

历年的双十一如此,科技产业的历史如此,今年也不会例外。

雷军连发多条微博回应质疑;iPhone 发布方式将在明年重大变革;年度最令人不安的研究:AI 刷多社媒会变蠢|极客早知道

雷军关于小米汽车安全连发多条微博:「网上有不少人断章取义、歪曲抹黑」

11 月 16 日,雷军就其 2024 年 4 月的采访言论连发微博澄清。相关话题冲上热搜。

原采访中,雷军提到「一辆车好看是第一位的」,被指为「小米汽车重颜值轻安全」,质疑其忽视安全标准。

10:52雷军发布第一条微博,称「这是小米 SU7 发布之前我发的微博,我谈对安全的理解和 SU7 的研发标准。」

11:25雷军转发上一条内容,并补充「这些内容是 2023 年底和 2024 年初的。」

12:51雷军称,在去年 4 月的一次采访中,我在谈产品定义时说,「一辆车,好看是第一位的」,这和「安全是基础、安全是前提」矛盾吗?还是在这次采访,我谈设计时候说轮毂最难设计,这有啥问题?(消息来源:杭州日报)

华为将发布突破性技术!有望解决算力利用效率难题

11 月 16 日消息,据媒体报道,华为将于 11 月 21 日发布一项 AI 领域的突破性技术,该技术有望显著提升算力资源利用效率,解决当前行业面临的算力瓶颈问题。

据了解,这项新技术可将 GPU、NPU 等算力硬件的利用率从行业平均水平的 30%–40% 提升至 70%,极大释放硬件潜能。

该突破主要基于软件层面的创新,实现了对英伟达、昇腾及其他第三方算力资源的统一管理与调度,有效屏蔽底层硬件差异,为 AI 训练与推理任务提供更高效、稳定的资源支持。

值得关注的是,在当前 NVIDIA 芯片供应紧张的背景下,中国云服务提供商正加速转向国产替代方案,华为昇腾系列芯片因其性能与可用性成为优先选择。

其中,昇腾 910C 已逐渐成为市场首选。作为昇腾 910B 的升级版本,910C 采用双芯片封装设计,目前已实现规模化量产,成为首款在人工智能领域大规模部署的国产芯片。(消息来源:快科技)

 

马斯克惊人预测:20 年内人类意识有望上传至机器人实现「永生」

11 月 16 日消息,报道称在上周举办的特斯拉股东大会上,埃隆・马斯克(Elon Musk)在股东大会上提出惊人预测:不到 20 年内,人类或可通过其脑机接口公司 Neuralink 的技术,创建自己心智的「近似快照」,并将其上传至特斯拉的人形机器人 Optimus 中,从而实现某种形式的数字永生。

IT 之家援引博文介绍,这一设想的技术核心,在于结合马斯克旗下两家公司的前沿科技。首先,利用脑机接口公司 Neuralink 的技术来捕捉并创建一个近似于人类心智的数字快照,这包含了记忆、思想乃至个性特征。

然后,将这个数字化的「心智快照」上传到特斯拉的人形机器人 Optimus 中。Optimus 是一款双足机器人,设计目标是在真实世界中导航、与人类互动并执行复杂任务,这使其成为承载数字意识的理想物理平台。

不过,马斯克也强调,这种方式实现的「永生」并非完美的复制。他解释说,由于心智快照本身无法做到 100% 精确,加上意识被置于一个全新的机器人身体中,所以上传后的「你」会与原来的自己有所不同。

他巧妙地以「五年后的你和现在的你也不完全相同」来类比这种变化,暗示身份认同本身就是一个动态发展的过程。这种不完美性为该技术的未来应用增添了更多哲学思考。(消息来源:IT 之家)

苹果计划将 iPhone 发布调整为固定的秋季与春季两次的模式

11 月 16 日消息,长期以来,iPhone 的产品线都围绕着每年秋季推出四款新机展开,虽然苹果也会在一年中的其他时间段发布个别变种机型。最近有消息称,苹果正计划将这一安排进一步正式化,覆盖更广泛的产品线。

根据彭博社 Mark Gurman 在《Power On》通讯中的报道,苹果计划在 2026 年秋季发布三款高端 iPhone,包括 iPhone 18 Pro、Pro Max 以及传闻中的折叠屏 iPhone Fold。而普通版 iPhone 18 则会推迟到次年春季上市,届时还将同步推出 iPhone 18e 系列,苹果也有可能借机更新 iPhone Air 产品线。

这样一来,苹果将正式确立高端 iPhone 机型依然在九月如期登场,而字母后缀系列机型则延后约六个月发布的节奏。预计未来每年将有五至六款 iPhone 新机分批上市。

Gurman 还表示,这一模式有望持续多年。(消息来源:cnBeta)

价格大乱 多款新品延后发布 专家:内存涨价将持续十年!

11 月 16 日消息,近期内存、硬盘价格受市场压力出现暴涨,核心原因在于 AI 基础建设催生了庞大的内存需求。

据 Hardwareluxx 报道,制造商已将新内存套装的推出时间从原计划的 2025 年下半年延后至 2026 年,意在观察供应紧缩对价格的实际影响。

该报道指出,海盗船(Corsair)、十铨等品牌的热门存储器套装已出现大幅涨价,且多家内存模组厂商明确表示,不会在 2025 年第三、第四季度推出原计划的新套装。

这些厂商选择暂不推出新品,以观望 2026 年的内存价格走势,但并未透露具体有哪些产品的上市计划被延后。

有专家分析,若当前供需格局维持不变,这场内存价格暴涨的风暴可能会持续十年。

内存短缺与涨价已直接冲击全球消费者,日本部分零售商因供应不足已开始实施限购措施。

智能手机行业同样受到冲击,小米已发出警告,受存储器成本飙升影响,手机产品价格可能会上调。(消息来源:快科技)

 

破译水平接近专家!谷歌新模型解读古籍核心错误率仅 0.56%

11 月 16 日消息,据媒体报道,谷歌旗下 AI Studio 平台正在测试一款未命名的 AI 模型,在破译难辨认历史手稿方面取得重要进展。该模型在核心字符识别上的错误率仅为 0.56%,准确率已接近该领域的专业研究人员水平。

历史学家 Mark Humphries 利用专门构建的基准数据集对模型进行了系统评估。在测试涵盖的五份 18 至 19 世纪高难度手稿中,模型整体字符错误率约为 1.7%,其中大部分错误出现在标点符号和大小写规范等非核心问题上,并未影响单词本身的正确识别。

若排除这些非关键性错误,模型的字符错误率可进一步降至 0.56%,相当于每转写 200 个字符仅出现一处实质性错误,其表现已与专注于文献转写的专业工作者相当。

测试手稿涵盖了多样化的书写风格,包括字迹潦草、拼写非标准和语法不一致等复杂情况,充分验证了模型的强适应能力。更值得注意的是,该模型不仅能完成文字转写,还展现出一定的上下文推理能力。

例如,在处理一份 18 世纪商人日记时,模型遇到一条未标注单位的购糖记录「145」。它通过反向核对账目总额,结合当时英国的货币与重量单位体系,成功推断出该数字代表「14 磅 5 盎司」。(消息来源:快科技)

 

宇树科技王兴兴:未来十年 AI 将赋予机器人真正理解世界的能力,场景将推动机器人真正「融入生活」

11 月 16 日消息,今日,宇树科技创始人兼 CEO 王兴兴出席 2025 人工智能 + 大会并发表演讲。

王兴兴指出,下一个十年,AI 技术将赋予机器人真正「理解世界」的能力。据他介绍,宇树研发的人形机器人,已经能够完成绝大部分工作动作,无论是离线预学习,还是实时模仿复刻。未来十年,伴随多模态大模型与机器人的深度融合,机器人将更加敏锐、更加能干。

他还提到,在工厂的生产线上,未来的工业机器人将与工人并肩协作,工人只需简单指令,机器人便能自主完成物料搬运、精密组装,将人从重复劳动中解放。在社区的养老服务站,小型护理机器人将上门为独居老人测量血压、提醒用药、陪伴聊天,弥补养老护理人员的缺口。在普通家庭的客厅中,家用机器人将承担打扫、看护、辅助学习等任务,成为每个家庭的「全能帮手」。(消息来源:IT 之家)

能「记录想法」的智能戒指 Stream Ring 问世,预售价 249 美元起

11 月 17 日消息,一群前 Meta 员工创办的智能戒指新品牌 Stream Ring 正在进入可穿戴设备市场,其主打功能并非「测心率」,而是专注于一个核心功能:捕捉语音备忘录并与 AI 即时互动。

这款新型设备的背后,是前 CTRL-labs 产品经理 Mina Fahmi 和前 Facebook Reality Labs 技术负责人 Kirak Hong 共同创办的 Sandbar 公司。Stream Ring 被其称为「语音鼠标」,设计上专注于语音捕捉和 AI 互动。

Stream 戒指佩戴在主手食指上,戒指表面配有麦克风和触摸板。操作非常简单:只需按住触摸板激活麦克风,戒指就会通过触觉反馈确认正在录音,语音备忘录会被转录并通过蓝牙发送到配套应用。Sandbar 表示,这款戒指并不会持续窃听,但会在你需要时随时待命。

Fahmi 和 Hong 发现,虽然智能手机很方便,但未必能够快速捕捉到一闪而过的想法。为了应对这一点,这款独特的智能戒指应运而生,银色版预售价为 249 美元,金色版为 299 美元,预计明年夏天开始发货。

这款设备的亮点是 AI 聊天机器人,用户可以对其提问甚至进行对话。除此之外,还有一个名为「内心声音」的模式,可以模仿你的说话风格。语音备忘录功能是免费的,但若要享受无限次 AI 聊天服务,Stream Pro 订阅每月收费 10 美元。(消息来源:IT 之家)

铭凡全球首款 Arm 迷你工作站首发 3299 元起:国产 CPU 双 10G 网口

11 月 16 日消息,铭凡 MS-R1 Arm 迷你工作站目前已经上市,号称「全球首款 Arm 迷你工作站」,到手价 3299 元起。

MS-R1 搭载此芯科技 CP8180 处理器,采用 6nm 工艺,基于 Armv9.2 平台,TDP 为 28W。CPU 采用三丛集设计,共 12 核 12 线程,包括 4 个 2.8GHz Cortex-A720 核心、4 个 2.4GHz Cortex-A720 核心与 4 个 1.8GHz Cortex-A520 核心,共享 12MB L3 缓存。

GPU 部分采用 Arm Immortalis-G720 MC10,支持光线追踪、4K 120Hz 显示与 8K 60 帧编解码,并集成 128-bit LPDDR5 内存控制器与 PCIe 4.0 通道,支持国密算法、PACBTI、MTE 及 Secure EL2 等安全技术。

存储扩展方面,配备一个 M.2 2280/22110 PCIe 4.0 SSD 插槽,另有一个 M.2 2280(E KEY)插槽用于无线网卡,并内置一个 PCIe 4.0 x8 全长插槽。

无线连接支持 Wi-Fi 6E 与蓝牙 5.3,另搭载两个万兆网口,控制器为 Realtek RTL8127。(消息来源:快科技)

华为 Mate 80 系列本月发布:支持磁吸生态 Deco 梦回 Mate 40

11 月 17 日消息,华为 Mate 80 系列将于本月正式发布,随着发布时间临近,网络上已流出疑似 Mate 80 系列的真机图。

日前,数码博主「定焦数码」透露,Mate 80 系列将加入磁吸设计,机身后盖配备磁吸环,后摄 Deco 造型也带有 Mate 40 系列的影子。

与此同时,博主「智慧皮卡丘」也进一步确认,Mate 80 系列支持磁吸环,兼容外置磁吸壳,最大看点是网络通讯架构。

据了解,华为 Mate 80 系列共有四款机型,分别是 Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS 非凡大师。

该系列将首发全新麒麟 9030 处理器,并且有望全系标配 3D 人脸识别。

此外,华为 Mate 80 系列还拥有非常多的配色,标准版备案的有曜石黑、雪域白、云杉绿配色。

Pro 系列则有曜石黑、雪域白、晨曦金;极光青、极昼金、极夜黑、极地银;玄黑、皓白、槿紫等。(消息来源:快科技)

「年度最令人不安的论文」:热门推特导致 AI 脑损伤

11 月 16 日消息,最近,几个 AI 研究者找来了几个月的高流行但低价值的 Twitter 数据(现),统统「喂」给大模型后发现:

  • 模型推理能力下降了 23%;
  • 模型长上下文记忆下降了 30%;
  • 模型性格测试显示,其自恋和精神病态的现象激增。

更可怕的是,即使后来又在干净、高质量的数据上进行重新训练,这些已经造成的损伤,无法完全修复。

至于导致 AI 认知受损的背后原因,研究人员也做了一番探查。结果发现,主要原因竟是「思维跳跃」(俗称 AI 懒得一步步思考)。

具体而言,研究人员通过分析 ARC 题的错误答案,发现失败多源于模型要么直接给答案不解释,要么规划了推理步骤却跳过关键环节(如解数学题漏了公式推导)。

尤其是使用了「短文本+高热度」的内容后,70% 以上的错误都是「无思考直接回答」,就好像人类刷多了短视频后「不愿意再深度思考」。

细思极恐,「这可能是 2025 年最令人不安的 AI 论文了」。(消息来源:量子位)

 

 

大疆 OSMO Action 6 体验:完美进化,不止运动

作为相机领域最硬核的存在形态之一,运动相机从诞生以来,就是「可靠记录」的代名词。

也确实是因为在各种运动场景中,比起画质,抗摔耐磕磕碰才是运动相机目标用户最看重的性能。将创作者从「小心翼翼」的束缚中解放出来,不再需要担心雨雪风沙,也不必在极限运动的瞬间分心去呵护娇贵的镜头。

这个逻辑在大疆 OSMO Action 系列上也一直鲜明的存在着:即使是大疆这样擅长从用户细分需求中抓到新产品契机、从手持运动相机这个形态衍生开发出「电子茅台」OSMO Pocket 系列,以及外形更加特立独行的 OSMO Nano 系列,但 Action 系列一直紧扣「让记录在各种极限环境下都忠实运行」这个核心需求,去强化 Action 产品线。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

你什么都不需要想,只需要按下快门,它就能以一种近乎顽固的姿态,忠实记录下肾上腺素飙升的每一秒。所有的创意决策——无论是冲入浪尖的惊险,还是穿过林间的极速——都建立在「拍得到」的基础之上。

也正是因为这种特性,运动相机在过去很长一段时间里,似乎都与「日光机」画上了等号:更高的帧率、更激进的防抖。然而,画质,尤其是暗光下的画质和光学层面的景深表现,始终是这类小底设备的阿喀琉斯之踵。在这种背景下,大疆带着 Osmo Action 6 破局而来。

在取代 GoPro、成为运动相机行业的新王之后,大疆显然并不满足于此。

Osmo Action 6 的诞生,不仅是大疆在尝试再一次「捅破行业天花板」,更是在宣告一种理念:一款旗舰级的运动相机,不应只有「傻锐」,更要承担起更多日常记录生活的属性,具备足以媲美专业相机的光学审美。而这一切,都始于那个在运动相机上堪称奢侈的机械结构——可变光圈,以及那块特立独行的方形传感器。

 

01

设计哲学:打破光学的「物理屏障」
 

熟悉大疆的朋友往往印象最深刻的就是他们一贯以来的产品设计逻辑:有点像是「为了解决一个痛点,不惜重构整个系统」。这种「功能主义」高度体现在 Osmo Action 6 的核心光学组件上。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

Osmo Action 6 最核心的创新,无疑是行业内首次在运动相机上引入的 F2.0-F4.0 可变光圈系统

传统运动相机通常为了保证大景深(让远近都清晰),被迫使用固定的较小光圈(如 F2.8 或更小)。这导致了两个极端痛点:一是暗光环境下进光量不足,画质噪点爆炸;二是拍摄近处物体时,背景杂乱,毫无光学虚化的美感。

大疆凭借其在无人机云台相机上积累的微型机械光圈技术,将这一结构塞进了 Action 6 紧凑的机身中。

 

在可变光圈的基础上,OSMO Action 还是通过模式切换的方式简化了光圈参数调整 | 图片来源:极客公园

 

虽然加入了可变光圈,但作为强调便捷使用需求的运动相机形态产品,大疆还是将可变光圈的操作进行了很大程度上的简化,

它将拍摄的选择权交还给了用户。在 F2.0 大光圈下,配合全新升级的 1/1.1 英寸传感器,进光量显著提升。在超级夜景模式下,即便是城市夜骑或极暗环境,画面依然纯净。

而当你需要拍摄 VLOG 或特写时——这正是大疆拓展运动相机边界的野心所在——大光圈配合全新的微距镜(最近对焦距离 11cm),竟然能在运动相机上实现「刀锐奶化」的浅景深效果,这是以往只有大底微单才能做到的事情。

除了镜头,Action 6 的机身设计也围绕着另一项核心突破展开——1/1.1 英寸方形传感器。值得一提的是,这块传感器也正是大疆在其全景相机 Osmo 360 上所使用的同款方形 CMOS。

知道这一点之后,你就能了解到为什么 Action 6 被定义为「全能旗舰」。这块 2.4 µm 融合大像素的传感器,不仅是为了画质,更是为了解决当下短视频时代的「构图焦虑」。

这与 Osmo 360 的设计理念如出一辙,都是为了最大化利用传感器面积,并赋予后期极大的灵活性。Action 6 的外观依然保持了经典的运动相机形态,但在使用逻辑上,它允许用户在一个拍摄模式下,后期自由裁切成 16:9、9:16 甚至 4:3 等多种比例,且全程无损。

随着一英寸大底的加入,OSMO Action 6 无论是从手感还是画质上,其实都已经涉足进传统手持街拍相机品类的传统市场,我在实际的使用中,就已经习惯将 Action 6 从快拆挂架上摘下来,徒手拿着 Action 6 进行一个街拍的动作。

 

手持 OSMO Action 6 进行拍摄也很好玩 | 图片来源:极客公园

 

虽然手感上接近了传统的街拍相机,但 Action 在焦段上可能还是需要你去适应一下:尤其是广角镜头还是会让你明显感觉到与传统街拍相机 24-35mm 焦段取景的不同,但这或许也能给你带来另外的视角。

 

大疆 OSMO Action 6 广角(10mm)/日常广角(10mm)/标准畸变(15mm)三种模式取景画面对比  | 图片来源:极客公园

 

比较遗憾的是,虽然我已经习惯了手持 Action 6 进行拍摄,但大疆目前暂时还没有针对这个场景,发布对应的配件进行更有针对性的适配,所以我还是很期待大疆未来能够像友商 Insta360 那样,未来针对运动相机这个形态,推出类似街拍手柄套装这样的配件。

在实际握持和操作中,Osmo Action 6 延续了双向磁吸快拆系统,这一设计在骑行、徒步等多机位切换场景中已被证明是目前最高效的解决方案。值得一提的是,它的电池和生态配件与前代通用,这对于老用户来说是一个极具诚意的细节。

 

02

硬件核心:旗舰画质的「降维打击」
 

在进入 Osmo Action 6 的硬件细节之前,我们必须意识到,它正在试图抹平「运动相机」与「专业相机」在画质上的鸿沟。

前面提到过,Action 6 搭载的是一块大疆今年定制的 1/1.1 英寸方形传感器,它拥有高达 13.5 挡的动态范围。这意味着在大光比场景——比如从昏暗的隧道冲向刺眼的阳光,或者在背光的日落时分——它能保留丰富的高光和阴影细节,而不是像以往运动相机「日光机」那样,在画面中留下一片死白或死黑。

Action 6 与竞品拉开身位的决胜局,在于其暗光表现。在「超级夜景」模式下,手动选择 F2.0 大光圈,配合 4K/30fps 的录制规格,它能够呈现出清晰锐利、明暗细节生动的城市夜景。相比之下,传统固定光圈的运动相机在夜间往往只能得到噪点满满的「记录级」画质。

对于专业创作者而言,10-bit & D-Log M 色彩体系的加入是一个决定性的优势。它不仅能更充分地记录色彩信息,更重要的是,它能与 DJI 的无人机(如 Mavic 3 系列)、Osmo Pocket 系列实现色彩统一。这意味着在多机位混剪时,后期调色的工作量被大幅降低,真正实现了「Osmo 生态」的协同效应。

视觉之外,听觉体验同样迎来了革新。Osmo Action 6 支持 OsmoAudio™ 生态系统,可以双蓝牙直连两个 DJI Mic 2 或 Mic Mini 发射器,完全无需接收器。这极大地简化了创作者的收音流程,无论是极限运动,还是日常的双人访谈 VLOG。

在摩托车骑行中,你可以将一个麦克风贴在排气管附近收录声浪,另一个佩戴在头盔里收录人声,同时开启机身收音备份收录环境风声。这种多轨收音的灵活性,以往需要复杂的录音笔和后期同步才能实现,如今变得轻而易举。

最后,作为生产力工具,可靠性也至关重要。Action 6 内置了 50GB 存储空间,忘带卡也能即刻开拍。而在续航方面,1080p 模式下可连续录制 4 小时,即使在 -20℃ 的极寒滑雪场景下,也能稳定运行。

 

03

场景体验:从「能拍」到「好拍」
 

硬件是基础,体验才是灵魂。

而 Action 6 在体验上,同样也清晰地展现了大疆的确不希望将 Action 系列运动相机局限在极限运动场景,而是希望为其加入更加好用的日常拍摄/录制能力,将这个产品线拉入更广阔的日常记录领域。

体现在配件上,则是 OSMO Action 6 进一步得到拓展的配件/镜组套装:例如我自己最常使用的微距镜,

 

OSMO Action 6 装载微距镜后外观 | 图片来源:极客公园

 

除了微距镜之外,大疆这次还提供了增广镜的选项,以及老朋友三档不同深度的 ND 滤镜。

 

OSMO Action 6 镜组| 图片来源:极客公园

 

在骑行场景中,除了前文提到的夜景优势,全新的增广镜可将 FOV 扩展至 182°,带来极具速度感的视觉冲击力。而在水下场景,大疆这次在「看不见」的地方也下了功夫。

Action 6 内置了行业唯一的色温传感器水压计。入水瞬间,相机能自动感知色温变化,确保肤色和海水颜色还原准确,过渡自然;同时智能感知水压,实现入水自动开录、出水自动停止。这对于潜水爱好者来说,不仅是画质的提升,更是交互的减负。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

即使你不会在日常所有使用时刻都去「追求极限」,OSMO Action 6 依然是一个(甚至更好用的)生活记录者。配合人物居中跟随功能,即便你独自出行,相机也能智能识别并始终将你置于画面 C 位。而机内内置的多种胶片影调,让你无需后期调色,也能直出极具氛围感的大片。

 

04

结语:全能运动相机的自我修养
 

Osmo Action 6 的发布,不仅仅是参数的堆砌。作为行业新王,大疆正在展现其定义市场的能力。从 F2.0 可变光圈到同款 Osmo 360 的方形传感器,再到 OsmoAudio 直连生态,每一个功能点都精准地击中了创作者的痛点——不仅是极限运动的痛点,更是「拿运动相机拍日常」的痛点。

它不再仅仅是一个被绑在头盔上、用来「抗造」的记录仪,而是一台真正具备光学审美、能无缝衔接极限运动与日常 VLOG 的全能旗舰

它向行业证明:运动相机,也可以谈画质,也可以谈景深,也可以成为专业影像工作流中不可或 NTF8PA 缺的一环。

对于还在纠结「运动相机画质不行」的用户来说,Osmo Action 6 可能就是那个让你改观的转折点。

 

安谋科技发了一枚 NPU,要把 AIGC 算力提升 10 倍

去年一本讲述周朝灭商的历史学著作《翦商》,让不少人对于商朝这个传说中的朝代,有了完全不同于《封神榜》中神仙妖怪的认知。

作者李硕认为,周文王作为边缘民族的头领,被商王囚禁在地牢里自己弄出的「周易」,本质是私下利用了当时流行的占卜技术,来预测未来推翻商朝可能性大小。

文王的儿子武王,成功推翻商朝后,在周公旦的努力下,「周易」变成了之后知名的《易经》,变身成中国文化中神秘科技的代表。

其实,如果扩大一些视角,《易经》代表的几千年前的科技巅峰,和当下最流行的大模型技术引领的 AI 多少有些相似之处——都是利用算力来预测未来。关键在于,几千年前人们用的是木棍和脑力,现在,用的则是芯片,此事在刘慈欣的《三体》中亦有记载。

随着 AI 大模型技术从云端向边缘侧、端侧设备下沉,一场围绕端侧 AI 算力的「军备竞赛」已经打响。从智能手机、AI PC 到智能汽车,消费者对设备本地运行 AIGC 的需求正迎来爆发性增长。然而,要在功耗、散热和成本都受到严格限制的端侧设备上,高效运行动辄数十亿参数的大模型,整个行业都面临着算力受限、能效要求严苛、带宽瓶明等一系列严峻挑战。

正是在这一行业背景下,11 月 13 日,安谋科技(Arm China)在上海正式发布了「周易」X3 NPU IP。这不仅是安谋科技 Arm China 明确「All in AI」产品战略后推出的首款重磅产品,也被视为其「AI Arm CHINA」战略发展的关键实践。安谋科技 Arm China 毫不掩饰其目标,即直面端侧 AI 大模型运行的难题,打造计算效率的新标杆。

 

为 Transformer 和浮点计算而生

半导体 IP 行业的一个共识是,产品研发必须「面向未来 5 年进行前瞻布局」。安谋科技 Arm China 产品研发副总裁刘浩在发布会上也强调了这一点,他表示公司将持续加大投入,以「前瞻性视野整合顶尖研发资源」,并秉持「开放合作理念」,为伙伴提供从硬件到软件的端到端解决方案。

「周易」X3 正是这一前瞻性布局的产物。安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士指出,X3 的产品优势源于其「通用、灵活、高效且软硬协同的系统架构设计」。

这种前瞻性首先体现在架构上。「周易」X3 采用了一种专为大模型而生的最新 DSP+DSA 架构。它在设计之初就深刻理解了 AI 模型的演进趋势——即从传统的 CNN(卷积神经网络)全面转向 Transformer(大模型的基础架构)。

 

因此,X3 采用了「兼顾 CNN 与 Transformer 的通用架构设计」 ,使其既能高效处理传统的 AI 任务,也能从容应对未来几年的 Gen AI(生成式 AI)、Agentic AI(代理 AI)与 Physical AI(具身智能)的端侧落地需求。

这种新架构带来的另一个关键转变,是对浮点运算的强力支持。传统 AI 运算(如安防)大多使用定点计算,而大模型推理则高度依赖浮点(FP)运算。X3 全面增强了浮点运算(FLOPS)能力,支持从定点到浮点计算的关键转变,为承载大模型奠定了技术基石。

 

解码 10 倍 AIGC 算力

如果说架构是蓝图,那么性能数据就是最直观的成果。相较于上一代产品,「周易」X3 在 AIGC 大模型能力上实现了高达 10 倍的增长。这一惊人的跃升并非单一因素造就,而是由 16 倍的 FP16 TFLOPS(每秒万亿次半精度浮点运算)、4 倍的计算核心带宽,以及超过 10 倍的 Softmax 和 LayerNorm(均为大模型关键算子)性能提升共同驱动的。

在具体规格上,「周易」X3 的单 Cluster(集群)最高支持 4 个 Core(核心),可提供 8 至 80 FP8 TFLOPS(每秒万亿次 8 位浮点运算)的算力,并且支持灵活配置。其单核带宽高达 256GB/s。即使在传统的 CNN 模型上,其性能也比 X2 提升了 30%~50%。

但对于大模型而言,峰值算力(TFLOPS)只是「入场券」,如何真正在运行中把算力用起来,即「算力利用率」,才是核心难题。

周易 X3 NPU IP 发布会现场|图片来源:安谋科技

安谋科技 Arm China 给出了一组基于 Llama2 7B(70 亿参数)大模型的实测数据:「周易」X3 在 Prefill(处理提示词)阶段的算力利用率高达 72%。这是一个远超行业平均水平的数字,意味着 NPU 在处理用户输入时没有「出工不出力」。

更令人瞩目的是 Decode(生成 token)阶段的数据。安谋科技 Arm China 宣称,在自研解压硬件 WDC 的加持下,X3 实现了「Decode 阶段有效带宽利用率超 100%」。

「有效带宽超 100%」听起来有悖常理,但这背后是安谋科技 Arm China 解决端侧带宽瓶颈的「独门武器」。这个名为 WDC 的自研解压硬件 ,允许大模型的权重(Weights)以软件无损压缩的形式存储。在 NPU 运算需要调用这些权重时,WDC 硬件会实时进行解压。这一过程对软件透明,却能带来 15%~20% 的等效带宽提升。换言之,它让有限的物理带宽「跑」出了远超其物理限制的数据量,从而极大满足了大模型解码阶段对高吞吐量的渴求。

为了让云端大模型能高效迁移到端侧,「周易」X3 还在架构上集成了多项关键创新。它新增了 W4A8/W4A16(4 位权重、8/16 位激活)计算加速模式,这种低比特量化技术能大幅降低模型对带宽的消耗。同时,它提供了极其广泛的多精度融合计算支持,涵盖 int4, int8, int16, int32, fp4, fp8, fp16, bf16, fp32 等几乎所有主流数据类型,使其能灵活平衡性能与能效,适配从传统 CNN 到前沿大模型的各种需求。

此外,X3 还集成了一个 AI 专属硬件引擎 AIFF(AI Fixed-Function)和一个专用硬化调度器。在智能座舱或 ADAS 这类需要多任务并行和高优先级响应的场景中,这一设计至关重要。它能将 AI 任务调度对 CPU 的负载降低至 0.5% ,让宝贵的 CPU 资源去处理其他系统任务,同时确保高优先级 AI 任务(如碰撞预警)获得即时响应。

 

让 AI 开发从「好用」到「用好」

「周易」X3 不仅仅是一块高性能的硬件 IP,它还配套了一个名为「Compass AI」的软件平台。安谋科技 Arm China 产品总监鲍敏祺指出,X3 遵循「软硬协同、全周期服务与成就客户」的准则,旨在提供从硬件、软件到售后服务的全链路支持。

在 AI 落地过程中,软件开发的「适配难、周期长、门槛高」是长期存在的痛点。「Compass AI」平台的目标,就是通过「软硬一体」的协同设计,让开发者从「好用」进阶到「用好」。

「Compass AI」的软件平台|图片来源:安谋科技

该平台的核心是 NN Compiler(神经网络编译器)。它支持 TensorFlow、ONNX、PyTorch 等主流 AI 框架,兼容超过 160 种算子和 270 种模型。

对于当前火热的大模型生态,「Compass AI」平台提供了一个极具吸引力的功能:通过其 AIPULLM 工具链,可直接支持 Hugging Face 格式模型,实现「一站式」转化与部署。Hugging Face 是全球最大的 AI 模型集散地,这一功能意味着开发者可以极低门槛地将社区的前沿模型快速部署到「周易」X3 上。

该平台还具备先进的模型推理优化能力,包括业界领先的大模型动态 shape 支持(能高效处理任意长度的输入序列),并支持 GPTQ 等主流量化方案,以及对 LLM(大语言模型)、VLM(视觉语言模型)和 MoE(混合专家模型)的高性能支持。

更重要的是,安谋科技 Arm China 选择了「开放生态」路线。Compass 平台中的 Parser(模型解析)、Optimizer(优化器)、Linux Driver(驱动)等核心组件已相继开源。这为开发者提供了「白盒」部署的可能,他们可以利用丰富的调试工具和 Bit 精度软件仿真平台进行深度性能调优。有能力的客户甚至可以利用平台提供的工具和接口,开发自定义算子,乃至打造出「属于自己的模型编译器」,从而实现产品差异化。

这种「软硬协同」贯穿了 X3 的设计始终。例如 AIFF 模块,硬件团队通过增大总线带宽、增加 DMA(直接内存访问)的 outstanding 等方式提升数据搬运效率;软件团队则针对性设计专属使用模式,如对模型进行合理切分,以充分发挥多核并行优势。在系统兼容性上,Compass 平台也做到了全面覆盖,支持 Android、Linux、RTOS、QNX 等多种操作系统,并通过 TVM/ONNX 实现 SoC 异构计算。

 

从无形 IP 到 AI 万象

「周易」X3 的发布,清晰地勾勒出了安谋科技 Arm China 面向的四大核心领域:基础设施、智能汽车、移动终端和智能物联网。

在发布会现场的 demo 展示区,安谋科技 Arm China 展示了「周易」IP 家族的演进:从 Z1 赋能 AIoT 的人脸识别 ,到 Z2/Z3 进入入门级座舱和辅助驾驶 ,再到 X1/X2 运行自动泊车、Stable Diffusion 文生图。

安谋科技当天的 IP 应用展区|图片来源:安谋科技

而新旗舰「周易」X3 则全面展示了其作为「端侧大模型杀手」的实力,现场演示了运行 DeepSeek-R1-Distill-Qwen-1.5B 模型的流畅 AI 对话,以及运行 Stable Diffusion v1.5 的文生图和 MiniCPM v2.6 的多模态图文理解。

这一演进路径,清晰地表明端侧 AI 已从单一的功能感知,迈向了融合多种模型的「复杂认知」新阶段。

具体到应用中:

智能汽车领域: 这是 X3 的重点目标。它将同时赋能智能驾驶与智能座舱,在 ADAS 系统中为自动泊车等功能提供 AI 算力;在 IVI(车载信息娱乐系统)中,则支持基于语音和车内外视频的智能互动。

移动终端领域: 在 AI PC 和 AI 手机上,X3 可用于超分渲染(提升显示效果),并为基于大模型的 AI Agent 应用提供澎湃算力。

基础设施与物联网: 在加速卡、智能 IPC(网络摄像机)、智能网关等设备中,X3 的本地 AI 推理能力将带来更快的响应速度和更好的隐私保护。

「周易」X3 的发布,标志着安谋科技 Arm China「All in AI」产品战略的正式启动。在「AI Arm CHINA」的战略发展方向下,安谋科技 Arm China 正携手生态伙伴,试图加快构建国内「AI+」产业升级的智能计算基石,为千行百业的智能化转型提供更强的 IP「核芯」动力。

❌