阅读视图

发现新文章,点击刷新页面。

为什么谷歌搜不到「没有条纹的衬衫」|AI 上新

作者| 汤一涛

编辑| 靖宇

 

你有没有过类似这样的经历:在谷歌图片搜索「 没有 条纹的衬衫」,然后屏幕上铺满了各式各样的……条纹衬衫。

熟练使用关键词搜索的人可能对这个场景已经习以为常,但这恰恰暴露了我们每天使用的搜索引擎的问题——其最底层的运作逻辑: 核心机制是匹配关键词,它们识别并抓取网页中的「衬衫」和「条纹」这两个词,但通常会忽略「没有」这个否定词所承载的复杂逻辑 。它们匹配字符,但不理解意图。

关键词「没有条纹的衬衫」,谷歌图片搜索结果

 

这就引出了一个核心问题:我们已经进入了能够与人工智能进行复杂对话的时代,为什么最基础的信息获取工具——搜索引擎,其核心逻辑似乎仍停留在关键词匹配的阶段?

极客公园最近体验了一款叫做 Websets 的 AI 搜索工具。与谷歌搜索不同,Websets 试图理解人类的复杂意图。它并非为日常查询设计,而是专门处理传统搜索引擎难以完成的复杂任务,例如寻找具备特定复合经验的专业人士,或筛选符合多重标准的公司实体。


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同 学发出召集,只要你发现并体验了新 的 AI 应用或者功能,按照格式(参考案例: 这款 AI 调研神器,让我一键产生 1000 个「种子用户」|AI 上新 )向栏目投稿,在极 客公园公众号发布,不仅能获得相应稿费,且会为你「报销」 AI 应用的订 阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信


 

 

01

魔镜魔镜,谁是世界上最漂亮的女人?

 

我觉得魔镜就是最完美的搜索引擎。

在童话《白雪公主》中,王后问魔镜:「魔镜魔镜,谁是世界上最漂亮的女人?」魔镜给出了一个明确的回答。这面魔镜,可以视为理想搜索引擎的终极形态:

它能理解复杂、主观、且包含绝对性条件的查询,并给出精准、唯一的答案

假如我们认真评估回答「谁是世界上最漂亮的女人」这个问题的可行性,就会发现其难度极高。

首先,它需要构建一个「美」的通用标准。这本身就是一个非常主观的问题——世界上并不存在唯一的美的标准。其次,它需要一个覆盖全球所有女性、并包含各项可量化特征的实时数据库。

这两个条件在现实中都无法实现。

不过,我们倒是可以借这个极端问题来观察:不同搜索引擎,是如何应对那些模糊、带有强烈主观色彩的提问的。

当我向谷歌提出「谁是世界上最漂亮的女人」时,它返回了海量的链接。排在前面的,是各类文章、榜单和视频,内容涵盖了「2024 年全球最美女性」、「全球最美女星榜单」以及一部 Netflix 的同名电影。

谷歌没有直接回答问题,而是提供了与「漂亮」和「女人」这两个关键词高度相关、且在网络上拥有高点击率和高权重的链接。这是关键词搜索的核心逻辑: 不直接解答,而是提供最受欢迎的相关信息索引

 

 

 

Websets 的应对方式则不同。由于它被设计为处理结构化查询,面对这样一个开放式问题,它会试图将其转化为一个可执行的、基于数据的检索任务。

这项操作失败了,因为正如上文所说,要回答「谁是世界上最漂亮的女人」的两个条件在现实中都无法实现。

Websets 告诉我:

无法根据查询内容构建搜索:「谁是世界上最漂亮的女人?」。请尝试重新组织您的查询语句,或手动选择实体类型并在下方添加搜索条件。

 

Webstes 拒绝回答问题,并返回了一个红色警告|图片来源:Websetes

 

这并不是一次失败的搜索,而是一次失败的提问 。系统并没有尝试去寻找答案然后失败了,而是在搜索开始之前,就判定你的问题无法被转化为一个可执行的数据查询任务。

实际上,你可以把 Websets 当成一个数据工程师,它的工作不是「理解」你的哲学问题,而是把你这句话翻译成一行精确的数据库查询代码,然后去一个巨大的、装满了「人」、「公司」等实体的数据库里进行筛选。

这个对比揭示了新旧两种搜索引擎的核心差别:

谷歌把「定义和判断」的责任留给了用户 。它给你海量信息,让你自己去定义谁最漂亮。它善于处理事实类查询(「法国的首都是哪里?」),但面对需要深度理解和多重条件过滤的任务时,就会退化为提供一堆相关度不高的链接。

Websets 把「定义和判断」的责任前置给了用户 。它要求你必须先把「漂亮」的定义想清楚,并转化为一组机器能懂的、客观的筛选指令,然后它才能为你执行。

这种差别,来源于 Websets 运作的底层逻辑与传统搜索不同。它不依赖于关键词索引,而是采用一种被称为「嵌入」(Embeddings)的技术。

可以这样理解:

  • 首先,它使用一个深度学习模型,读取并理解一个网页的全部内容,包括其核心论点、上下文和语境,然后将这些复杂的「含义」压缩成一个由数百个数字组成的独特列表。这可以被称为该网页的「 语义指纹 」。
  • 当用户输入一个查询时,即便是长句或复杂问题,系统也会用同样的模型将其转换为一个代表用户真实意图的「语义指纹」。
  • 搜索的过程,就变成了在数十亿个网页的「语义指纹」库中,通过计算,找出与用户查询的「语义指纹」最相似的那些。

这个方法在技术上原生支持对复杂逻辑的理解 , 因为它处理的是整体含义而非孤立的词汇 ,所以它能分辨「有条纹」和「没有条纹」这两个「指纹」之间存在的巨大差异。

 

02

重生之我在西贝当贾总

 

为了更具体地展示 Websets 对复杂语义的理解能力,我们设定一个高压商业场景:

假设你是某餐饮连锁品牌的 CEO,公司因「预制菜」问题陷入了一场全国性的公关风暴。你需要立即找到具备特定经验的专业人士来应对危机。

你向 Websets 发出指令:

「寻找在大型餐饮连锁集团担任过品牌公关总监或以上职位(条件 1)、且有处理创始人个人言论引发的公关危机经验的消费品牌公关专家(条件 2)。」

Websets 返回了一份结构化的电子表格,按照条件一和条件二在 LinkedIn 上筛选出符合条件的候选人,并按照满足程度排列优先级。

 

Websets返回的结果是一份结构化的电子表格|图片来源:Websetes

 

对于条件一,系统准确地从公开信息中找到了在德州公路扒房(Texas Roadhouse)、麦当劳(McDonald's)、棒约翰(Papa John's)等大型餐饮连锁集团中,担任「高级公关总监」、「企业传播副总裁」等符合条件的高管。这部分任务,它完成得相当精确。

条件二就颇有一些难度,因为「处理创始人个人言论引发的公关危机经验」是一个相对难验证的事情。系统并没有给出简单的「是」或「否」。相反,它在右侧生成了额外的验证列,并给出了「Match」(匹配)或「Unclear」(不明确)的标注。

事实也是如此,同时满足两个条件的只有 Travis Dorster。他在德州公路扒房担任传播与公共事务高级总监。在新冠疫情期间,他处理过创始人因为新冠后遗症自杀的而引发的公共事件。

 

Websets会给出满足条件的理由,以及相应的参考文献|图片来源:Websetes

 

这个过程揭示了 Websets 的核心价值。Websets 在此场景下扮演的,并非信息入口的角色,而是 决策支持工具 。它没有提供一份需要用户自行研究的「阅读清单」,而是直接交付了一份经过初步分析和验证的「 候选人短名单 」。它将原本需要数天人工筛选的工作,压缩进了几分钟的机器执行时间里。

但是,这个结果也显示了 Websets 的局限性。列表中的信息来源 URL 全部指向领英(LinkedIn),存在数据源的偏向性。如果一位顶尖专家没有详尽的、公开的领英档案,或者其关键经验体现在非文本的采访视频中,系统就可能无法发现他。

更重要的是,这种对特定数据源的依赖,也使其在处理中国市场相关查询时效果大打折扣。中国的候选人更多使用脉脉等本土化的职业社交平台,或者根本不使用。因此,用同样的指令去寻找一位符合条件的中国专家,其结果的可靠性和全面性将远低于这个案例所展示的水平。

但这并非其算法的失败,而是其数据基础的局限。

 

03

另一种搜索路径

 

截至目前,Websets 的公司主体 Exa 声称其索引了「数十亿」级别的网页。这个数字本身虽然可观,但与谷歌宣称的「万亿」级别索引相比,仍有几个数量级的差距。

这意味着 Websets 的搜索结果可能是「更精确」的,却不一定是「最全面」的。它或许在一个经过筛选的高质量信息池中找到了最优解,但用户无法确定在更广阔的、未被索引的互联网中是否存在更好或更重要的信息。

这是一个与成本高度相关的「缺陷」。语义计算是资源密集型任务,将海量网页和复杂查询转化为「语义指纹」并进行大规模比对,需要庞大的算力支持,其背后是高昂的硬件投入与运营开销。

2021 年,Exa 获得了 500 万美元(约合 3560 万元人民币)的种子轮融资,他们把一半的钱,都花在了建设第一个 GPU 集群上,

另一方面,Websets 使用的「嵌入」技术本身存在信息损失的风险。这项技术的核心是将一篇长文甚至一部巨著的全部信息,压缩成一个固定长度的数字列表。这个过程必然是有损的。

正如 Diffbot 公司 CEO Mike Tung 在面对《MIT 科技评论》时所指出的,「将一本《战争与和平》压缩成单个的嵌入,几乎会丢失书中所有具体的事件,最终只留下关于其类型和时代的模糊感觉」。

这意味着,该方法在把握宏观主题上表现出色,但在需要无损检索文本内部具体细节时,存在天然的技术缺陷。

因此, Websets 及其代表的语义搜索范式,并非谷歌的替代品。它更像是一种为特定目的,如深度行业研究、人才挖掘或学术分析而设计的「重型装备」

它的出现,其重要性不在于它本身能否颠覆市场,而在于揭示了搜索技术演进的另一种可能性。

 

04

回归本质——我们为什么要搜索?

 

谷歌(Alphabet)每年从关键词搜索及其相关广告业务获得的收入大约在 1750 亿–2000 亿美元,大致占其总收入的 55–60%。正是靠着这台由全球用户无数次点击驱动的印钞机,支撑起了谷歌那些近乎科幻的探索:从自动驾驶汽车(Waymo),到用人工智能(DeepMind)破解蛋白质的折叠奥秘,甚至尝试通过 Calico 项目延长人类的寿命。

这一切的背后,都源于那个我们每天都在使用的、看似简单的搜索框。这就让我们回到一个更根本的问题:如果搜索这个行为能支撑起如此庞大的商业帝国和对未来的探索,那么对我们个人而言, 搜索究竟意味着什么?我们到底为什么要搜索

 

1998年,谷歌第一天上线时的页面|图片来源:Business Insider

 

要理解搜索的本质,必须先回到它的起点。人类之所以需要搜索,最底层的是一种生存本能。远古的祖先必须在环境中搜索食物、水源、庇护所以及危险的信号,搜索是活下去的前提。

当生存需求得到基本满足,驱动力便转向内在的认知延伸。人类的大脑似乎天然厌恶「信息真空」,当我们遇到知识的空白或矛盾时,会产生一种认知张力,我们称之为「好奇心」。搜索,便是缓解这种张力、填补认知缺口的行为。

这些动机恒久未变,但实现它们的方式却因技术而发生了两次剧烈的变革。

在前互联网时代,搜索是一种「 路径式学习 」。信息被安放在物理或逻辑的结构中:图书馆的杜威十进制分类法、百科全书的条目索引、学术期刊的卷宗。获取信息需要遵循既定的路径,你必须先理解这个知识体系的「地图」,然后亲自「行走」在这张地图上。

从产生一个问题,到查阅卡片目录,再到从书架上取下那本书,翻到对应的页码——这个过程本身就是学习的一部分。你不仅获得了知识,更重要的是,你理解了知识是如何被组织和验证的,抵达答案的路径清晰可见。

 

20 世纪 60 年代,在加拿大阿尔伯塔省埃德蒙顿的一家图书馆里,孩子们正在学习杜威十进制分类法|图片来源:Wikipedia

 

互联网,特别是以谷歌为代表的现代搜索引擎,则开启了「 结果式消费 」的时代。信息不再是稀缺的、结构化的,而是过剩的、碎片化的。你无需再理解复杂的知识地图,只需在输入框中敲下几个关键词,算法就会在瞬间为你呈现一个看似最优的结果。

它极大地降低了信息获取的门槛,但整个搜索过程被彻底「黑箱化」了 。我们得到了答案,却完全不知道这个答案是如何从海量数据中被筛选、排序并最终呈现在我们面前的。构建知识和获取信息的差别正在于此,

更进一步,商业模式的介入不可避免地扭曲了信息的呈现。广告、搜索引擎优化(SEO)和对点击率的无尽追逐,使得我们最终看到的,往往不是最真实或最权威的结果,而是那个最希望被我们看到的结果。

如今,生成式 AI 的出现,并未创造一个全新的问题,它更像是一个催化剂,将「结果式消费」的趋势推向了极致。AI 承诺的,是一个连「结果列表」都无需我们筛选的世界,它将直接提供那个唯一的、完美的「答案」。

很多人会幻想存在一种更理想的搜索工具,它能将控制权交还给我们,过程透明,鼓励探究。但这或许忽略了一个根本性的事实: 「黑箱」并非一个需要修复的缺陷,它本身就是被市场验证过的、最受欢迎的功能。 现代搜索的整个演进史,都指向一个清晰的商业规律:对效率和便利的追求,其优先级远高于对过程和本源的探究。

本质上,这是一种交易。我们用 探寻过程的精力 ,换取了 即时获得结果的便利 。这并非工具的缺陷,因为追求便利是人性的自然延伸。

关键在于,每个人都应该清楚地明白自己需要付出什么,可以自主做出自己的选择,并且不为此感到后悔。

雷军亲自测试,小米YU9实车谍照曝光;宇树获「秧歌机器人」专利;微团开卖「Win XP」蓝天白云拖鞋

挖走英伟达两员大将:马斯克 xAI 正开发「可用于游戏与机器人领域的世界模型」

10 月 12 日,据《金融时报》,埃隆・马斯克旗下 xAI 公司正加紧构建其「世界模型」,与 Meta 和谷歌等对手一同角逐下一代 AI 系统。这些系统能够实现对物理环境的自主导航与设计。

根据英伟达的官方介绍,世界模型是一种生成式 AI 模型,能够理解现实世界的动态特征,包括物理属性和空间特性。这类模型利用文字、图像、视频以及动作在内的输入数据来生成影片。

据称,xAI 已经从英伟达挖来了专家,研发这类新一代 AI 模型。这些模型通过学习视频以及来自机器人的数据,理解现实世界。世界模型有望将 AI 的能力提升到超越大语言模型的水平。目前,大模型主要接受文本训练,是 ChatGPT 以及 xAI 自家 Grok 等热门 AI 工具的技术基础。
两位知情人士称,该公司正在研发世界模型,计划将其应用于游戏领域,用于生成可交互的 3D 环境。其中一位知情人士补充说,这类模型未来也可能应用于机器人 AI 系统。(来源:IT 之家)

微软设计总监阐述了未来 Windows 版本的最新设计原则

微软近期发布了全新 Windows 11 设计蓝图,将其定位为为 AI 时代打造的操作系统。微软设计总监 Diego Baca 详细阐述了未来 Windows 版本的最新设计原则。与此同时,Windows 10 也迎来了生命周期终结。

微软制定了四大设计原则:有意创新、精细工艺与可扩展系统、面向所有用户定制,以及安全、可信赖、合规为基础。

未来的 Windows UI 更新将以提升用户体验为唯一前提——即视觉元素大体不变,但部分操作会内嵌 AI。举例来说,长按 Copilot 图标即可弹出「总结、解释、重写」等 AI 选项。不过,目前没有 NPU 芯片的设备暂未支持。微软希望用户以直觉、自然地融入 AI 功能,不只是被动接受新标识。(来源:cnBeta)

 

古尔曼:苹果已开始研发 H3 芯片和 AirPods 5 耳机,M5 款 iPad Pro、新 Vision Pro 等 10 月新品即将到来

10 月 12 日消息,彭博社记者马克・古尔曼(Mark Gurman)在最新一期《Power On》时事通讯中提到,苹果备受期待的 10 月新品即将到来,预计将包括 M5 款 iPad Pro,还有搭载更快芯片、新型头带的 Vision Pro。据称,两者都已经投入量产。
另外,苹果下周也有一定可能发布新的 MacBook Pro。他还提到,苹果已开始研发新一代 AirPods 耳机及 H3 芯片。至于新的 AirTag、HomePod mini 和 Apple TV,这些仍在路上。
古尔曼还提到,苹果还将于明年初推出新版 iPad Air 和入门级 iPad、两款外接显示器、M5 MacBook Air 系列和 iPhone 17e。这都是未来几个月内更新计划的一部分。(来源:IT 之家)

雷军亲赴新疆测试?小米第三款车 YU9 多张实车谍照曝光

10 月 12 日消息,疑似小米第三款车型(暂称小米 YU9)在新疆测试的谍照近日在网上曝光,而就在昨日,小米创办人、董事长兼 CEO 雷军在社交媒体上表示,他已抵达新疆塔县,参与小米汽车的高原测试。这引发了网友的猜测,认为雷军可能是在亲自测试小米的第三款车。

IT之家注意到,除了雷军,小米汽车高级顾问胡峥楠、小米集团副总裁张剑慧、小米汽车产品部总经理于锴等高管的社交媒体账户 IP 属地均显示为新疆,表明他们也参与了此次测试。雷军在社交媒体上发布的合照显示,测试团队在昆仑山脚下集结,且测试内容丰富,包括小米 YU7 高原续航、充电、防晒等项目。此前,小米 SU7 和小米 YU7 发布前,均有高管参与路测,此次雷军等高管的行动,似乎预示着小米 YU9 很快就要来了。(来源:IT 之家)

 

身着红棉袄、手持红手帕,宇树科技「扭秧歌」人形机器人专利获授权

10 月 12 日消息,杭州宇树科技股份有限公司(以下简称「宇树科技」)的人形机器人外观设计专利近日获得授权。专利文件显示,该人形机器人身着红棉袄,手持红手帕,与今年央视春晚上表演「扭秧歌」的机器人相似。该专利为外观设计专利,产品用途为机械类机器人,设计要点在于形状。

据 21 世纪财经报道,截至目前,宇树科技已申请人形机器人相关专利近 10 项,涵盖发明、实用新型与外观设计专利,如「一种人形机器人的腿部动力结构和人形机器人」「一种机器人和机器人控制方法」等。

据宇树科技此前消息,公司计划于 2025 年 10 月至 12 月期间向证券交易所提交上市申请文件。受此影响,多家参股宇树科技或与其存在合作关系的上市公司股价波动剧烈。IT 之家注意到,截至 10 月 10 日收盘,Wind 宇树机器人指数 7 月以来已涨 32.53%。(来源:IT 之家)
 

全新岚图知音 9 月销量 3670 辆,为华系所有车型纯电销量冠军

10 月 12 日消息,岚图汽车今年 9 月交付 15224 辆新车,1-9 月累计同比增长 85%。岚图汽车官方今日宣布,旗下全新岚图知音 9 月销量 3670 辆,为华系所有车型纯电销量冠军。

公开资料显示,目前华为参与合作的纯电车型主要包括岚图知音、问界 M5、问界 M7、问界 M8、问界 M9、智界 R7、智界 S7、尊界 S800、享界 S9、尚界 H5、阿维塔 06、阿维塔 07、阿维塔 11、阿维塔 12、深蓝 L07、深蓝 S7 等。

参考 IT 之家此前报道,全新岚图知音已于 8 月 28 日上市,标配华为乾崑智驾 ADS 4、首批搭载鸿蒙座舱 HarmonySpace 5,官方指导价 20.29 万元起。(来源:IT 之家)

realme 真我 GT8 Pro 手机适配理光 GR 等效全画幅焦距 28mm 与 40mm,10 月 14 日举行合作发布会

10 月 12 日消息,realme 今日宣布,真我 GT8 Pro 手机适配理光 GR 等效全画幅焦距 28mm 与 40mm,可搭配沉浸取景器模式。此外,真我 x 理光影像战略合作发布会将于 10 月 14 日举行。

据介绍,诞生于 2019 年 3 月的理光 GR III,保留了捕捉街头场景的 28mm 焦段。而两年后登场的理光 GR IIIx,则用 40mm 焦段开辟了全新街拍视角。

IT 之家注意到,真我 realme 副总裁、全球营销总裁、中国区总裁 @ 徐起 Chase 10 月 9 日已经宣布,真我与理光映像正式达成影像战略合作。(来源:IT 之家)
 

OPPO 官宣 Find X9 系列搭载超 7000mAh 电池,五年健康程度 80% 以上

10 月 12 日消息,OPPO 今日官宣 Find X9 系列手机搭载超 7000mAh 电池,其中标准版 7025mAh,Pro 版 7500mAh,10 月 16 日 19:00 见。
据 OPPO Find 系列产品负责人周意保介绍,这次冰川电池不仅容量大,而且寿命也更长更耐用,OPPO Find X9 系列做到五年超长健康耐用。
他透露,OPPO 专门针对硅材料开发出独家硅负极长寿算法,在行业首次实现硅负极的阻抗精准计算与电势控制,将 Find X9 系列的电池健康度估计精度提升 5 倍以上。基于此,OPPO 算法还能实时掌握着手机电池用了多少硅材料,还剩多少硅材料,再实时控制硅的存活速度,将硅负极电池做到 60 个月耐用。也就是五年后,FindX9 系列的电池健康程度仍然可以在 80% 以上。(来源:IT 之家)

完美还原 Windows XP 蓝天白云,微软开售限量定制洞洞鞋
在庆祝成立 50 周年之际,微软在前一段推出了了一款极具怀旧情怀的 Windows XP 定制版洞洞鞋。这款洞洞鞋的设计灵感来源于经典的 Windows XP 操作系统,尤其是那张令人难忘的「Bliss」壁纸,蓝天白云的元素被巧妙地融入鞋面设计中,瞬间唤起了许多用户的回忆。
不仅在设计上充满了怀旧感,其还附带了一系列定制的 Microsoft Jibbitz 鞋饰,包括 MSN 标志、Internet Explorer 图标、经典的 Clippy 办公助手、鼠标指针等。
最初,这款洞洞鞋仅向微软公司员工提供,随后微软通过抽奖活动向公众限量发售,如今,微软正式将这款限量版洞洞鞋推向市场,支付 79.95 美元(约 570 元人民币)即可以直接购买。

购买这款洞洞鞋的用户还将获得一个以「Bliss」壁纸为主题的收藏袋,进一步增强了产品的收藏价值。

2025 年是微软成立 50 周年,公司以多种方式庆祝这一重要时刻,除了定制版洞洞鞋,微软还推出了特别版 Surface 笔记本 电脑、Xbox 动态主题等。(来源:cnBeta)

Meta Ray-Ban Display 首发体验合集:悬浮在现实中的一张便签

可以毫不夸张地说,在当下智能眼镜真正通往「下一代计算平台」的漫漫征途上,今年 Meta Connect 2025 的那场主题演讲,注定将成为一个会被反复提及的关键事件。

原因无他,仅靠扎克伯格将一年前尚在概念阶段的 Orion 项目,最终淬炼成一款售价 799 美元(注:约合 5700 元人民币)、消费者触手可及的「量产落地版 AR 眼镜」——Meta Ray-Ban Display 时,就已经再次奠定了 Meta 在 AI 眼镜时代的无可争议的「头号大厂」的地位。

 

Meta Connect 2025 发布会现场 | 图片来源 : Meta 官网

 

但与过去十余年,所有 AR 类硬件产品一样:走出实验室的各种美丽预设环境之后,总是要面临在现实生活中体验断崖式下滑的事实;此外关于产品之外,Meta 在发布会上的多次「翻车」、「Meta 平均一台眼镜亏损一千美元」、「实际上是远不成熟的实验性硬件产品」等流言也多次出现,进一步增强了了围绕这款产品的神秘感。

但这仍然不影响 Meta Ray-Ban Display 又是一款「一机难求」的硬件产品:十月正式开售之后,全美所有线下销售渠道都很快进入了全线缺货的状态;美国用户们在各种群聊里分享周边哪家店铺刚刚补货的信息,各种扫货情况屡见不鲜,这种热潮甚至蔓延到了小红书,关于产品的兴奋感也好,缺点也罢,众多首发用户们兴奋地分享各种首发使用体验。

 

相关关键字下,用户在小红书上的分享 | 图片来源 : 小红书

 

在发布会的聚光灯散去之后,经过全球多家顶尖科技媒体长达数日乃至数周的深度佩戴与体验,我们终于有机会随着首批用户的真实体验,拨开官方宣传的华丽辞藻,深入探究这款被寄予厚望、被誉为「后智能手机时代序章」的产品。

它在真实世界中的体验究竟是革命性的突破,还是又一个华而不实的昂贵玩具?

01

「悬浮在现实世界的一张便签」

 

在首批开售拿到 Meta Ray-Ban Display 的用户的反馈中,几乎所有率先体验到 Meta Ray-Ban Display 的人都迅速达成了一个共识:这完全不是一款科幻电影中那种视野完全被数字信息覆盖的、颠覆性的增强现实的 AR 眼镜。这一点不会改变,但它的存在感要微妙得多,也聪明得多

CNET 的编辑 Scott Stein 在佩戴了两天后,将体验核心形容为「一个悬浮在世界上的小小的、明亮的便签」

这个描述很精妙地概括了目前这片单目全彩 Micro LED 显示屏能交付给用户体验的核心——它是一个位于你视野右上角、高度情境化、在你需要时才会出现的「私人抬头显示器」(HUD)。

 

Meta rayban display 显示屏实际展示效果 | 图片来源 : Future

 

这块 600x600 像素的 MicroLED 显示屏,拥有高达 5000 尼特的峰值亮度,这意味着无论是在光线昏暗的室内,还是在加州明媚的阳光下,屏幕上的内容都清晰可辨;它足够你看清 Whatsapp 发来的消息预览、Spotify 正在播放的曲目、或是导航时包括转向箭头在内的核心信息。

但也仅限于此了:这块小小的显示屏设计哲学在于「辅助」而非「侵入」。它静静地待在你的余光里,只有当你主动将注意力投向它时,它才会成为焦点,其余时间则几乎不会干扰你对现实世界的感知。

 


最高亮度下外界看到的眼镜显示效果|图片来源:CNET

 

这种「解放双手、即时获取」信息的体验,在某些特定场景下,其优雅和高效是前所未有的。想象一下,你正骑着自行车穿行在陌生的城市街头,过去你需要不时地在颠簸中掏出手机,解锁,查看地图,再手忙脚乱地放回去。而现在,一个简洁的箭头和距离指示就浮现在你的视野一角,你只需瞥一眼,就能确认方向,全程无需中断骑行节奏,视线也从未离开前方的道路。

通讯体验同样被重新定义。当你在厨房里双手沾满面粉准备晚餐时,家人发来一条消息,你不再需要狼狈地去洗手擦干才能查看手机。消息内容直接显示在眼前,你甚至可以直接通过语音指令进行回复,整个过程一气呵成。

而视频通话功能,则带来了一种全新的亲密共享。ZDNet 的记者描述了他与同事进行视频通话的场景,对方能实时看到他所看到的一切,无论是他正在评测的新款笔记本电脑,还是窗外的风景

这是一种真正意义上的「第一人称视角分享」,让远隔千里的人仿佛身临其境,这种体验的温度和沉浸感,是传统手机视频通话无法比拟的。

当然,它的局限性也是非常明显: 20 度的视场角(FoV)决定了它当前的使命。这个「魔法窗口」还很小,只适合承载文本、图标、符号这类轻量化、信息密度高的内容。

你无法用它来舒适地观看短视频或电影,也无法用它来玩一场沉浸式的 AR 游戏。

更直白点说就是:它不是也无法成为手机屏幕的替代品,现阶段它只能是你口袋里那块强大玻璃屏幕在特定场景下的延伸和补充,是你最贴身的「第二块屏幕」

而对于那些需要实时信息反馈的专业人士,或是渴望在旅行中获得无缝翻译的探索者而言,这个小小的窗口,已经足以打开一个全新的世界。

另外关于不少用户碰壁到的环节: 眼镜配镜问题,Meta Rayban Display 支持近视/远视/散光 400 度以内的配镜,比起加钱,更麻烦的或许是,你需要在线下门店凭借处方完成配镜,如果你也有意愿购买,一定要注意这个细节。

02

「魔法之手」

 

如果说显示屏是那只洞察未来的「魔法之眼」,那么与之配套的 EMG 肌电腕带,就是那只在空气中施法的「魔法之手」。

 

腕带是目前 Meta Ray-Ban Display 体验中重要的组成部分 | 图片来源 : future

 

这或许是目前 Meta 交付的整套体验中,最具未来色彩,也最需要用户投入学习成本去适应的部分。

它不再依赖于触摸、点击这些我们早已习惯的物理交互,而是试图建立一种更深层次、更符合直觉的人机连接。

这支看起来像普通手环的腕带,其原型机在去年的 Meta Orion 上已经出现过。内部蕴藏着 Meta 十年研发的精髓。它通过肌电传感器,精准地「聆听」当你移动手指和手腕时,前臂肌肉群发出的微弱电信号,并将其解码为一系列精准的数字指令。整个过程充满了科幻感,在经过一个简短的校准程序——系统会引导你做出几个特定手势,以学习你独特的肌肉信号模式——之后,你就仿佛拥有了某种超能力。

 

腕带的好处是交互不必受限于摄像头的范围,你可以将手垂下自然地实现交互 | 图片来源:Cnet

 

数码爱好者的老朋友、彭博社的首席科技记者 Mark Gurman 详细描述了这种奇妙的交互体验。拇指和食指在空中轻轻一捏,是「确认」或「选择」,这个动作几乎成了所有操作的基础。

当你在听音乐时,用拇指在食指侧面左右滑动,就能轻松切换歌曲;捏合手指,然后像拧虚拟旋钮一样转动手腕,则是调节音量。这些手势的反馈极其灵敏,几乎没有可感知的延迟。

这种交互方式的真正魅力,在于它的私密性和便捷性: 当你身处高峰期拥挤的地铁车厢,你被人群包围,连抬起手臂去触摸眼镜腿都显得困难。

此时,你只需将手自然地垂在身侧,在无人察觉的情况下,悄悄动动手指,就能完成接听电话、暂停播客等一系列操作。这种优雅从容,是传统智能穿戴设备难以企及的。

 

腕带本身作为一种硬件产品形态,相比于眼镜我们更加熟悉 | 图片来源 : Bloomberg

 

扎克伯格在发布会上演示的「手势打字」功能,在实际体验中也被证实并非噱头。虽然目前每分钟 30 个英文单词的输入速度,显然无法与实体键盘或手机触摸屏相提并论,但它真实地证明了这项技术的巨大潜力。

你只需看着眼前浮现的虚拟键盘,通过手指的微小动作来选择字母,这本身就是一种对未来输入方式的探索。

然而,这只「魔法之手」并非完美无瑕。它依然带着「第一代产品」的青涩。腕带偶尔会出现信号丢失或指令误判的情况,尤其是在进行比较剧烈的运动时。而且,让用户在眼镜之外,再额外佩戴并每天充电一个设备,本身就提高了使用的门槛。

 

目前的腕带同样是一款需要独立充电的设备 | 图片来源 : Bloomberg

 

目前来看,它更像是一个为开发者和狂热的早期尝鲜者准备的「进阶配件」,它所代表的,是通往更自然、更无缝的人机交互未来的一块重要基石。它让你得以窥见那个无需任何实体媒介、仅凭意念和微动作就能控制数字世界的未来,但要让每个人都能轻松地在空气中弹奏,显然还有一段路要走。

03

真实体验中的平衡与妥协

 

一款眼镜产品,无论被赋予了多少智能与魔法,它的根基,始终在于它作为一副「眼镜」的本质属性。如果不能舒适地佩戴一整天,那么再强大的功能也只是空中楼阁。Meta 深谙此道,这也是他们选择与雷朋、奥克利这样的顶级眼镜品牌深度合作的根本原因。

从外观设计上看,Meta Ray-Ban Display 沿用了经典的飞行员系列风格,这无疑是一个聪明的选择,使其能够自然地融入大多数人的日常穿搭 —— 或者至少这是 Meta 一开始的设计目标。

 

仅从外观上来看,很多人都难以分清它与之前 Rayban Meta 系列的区别 | 图片来源: Zdnet

 

现实中,为了容纳显示模组、芯片、电池和摄像头,Meta Ray-Ban Display 的镜腿和整体框架比普通版的 Ray-Ban Meta 要「健硕」和厚重不少,实际重量来到了 69 克。

但几位长时间佩戴的体验者均表示,其重量分布做得相当不错,并不会给鼻梁和耳朵带来难以忍受的压迫感,实现数小时的连续佩戴是完全可行的。

自带的自动变色镜片,也让它能够无缝地在室内外场景切换,免去了更换墨镜的麻烦。

然而,一旦深入到全天候使用的真实场景,电池续航便成为了那个无法回避的、最现实的问题。所有评测都指向了一个共同的结论:

续航是它目前最大的短板

在不频繁使用显示屏,仅将其作为一副普通的 AI 眼镜进行拍照、听音乐、接打电话的「轻度使用」模式下,它可以勉强支撑大约 4 到 6 个小时在日常使用。

但一旦你开始重度使用,依赖那块「屏幕」——比如用它进行超过半小时的城市导航,或是进行一场 15 分钟的视频通话——续航便会断崖式下跌至 1.5 到 2 小时。

这也意味着,如果你想让它成为你一整天的数字伴侣,那个兼具充电功能的眼镜盒就必须时刻带在身边: 或者像现在的很多重度用户一样,买两副眼镜轮换着用。

 

顺带一提这次的充电盒被设计成了可折叠的款式,携带更加方便了 | 图片来源 : Bloomberg

 

当然 Meta 也为其配备了快速充电功能,放入充电盒 20 分钟即可补充至 50% 的电量,这在很大程度上缓解了用户的续航焦虑。但这终究是一种妥协,一种「用碎片化的充电时间换取持续性体验」的妥协。

此外,早在 Ray-Ban Meta 系列就已经出现过的「信号灯」问题,在 Meta Ray-Ban Display 上同样存在:在你录制视频或拍照时,镜框右上角的 LED 指示灯会亮起,旨在告知你周围的人「我正在拍摄」。

这是 Meta 在吸取了过往教训后,对公众隐私的尊重和保护。但与此同时,这颗亮起的灯,也向所有人宣告了你的「特殊」,让你在人群中无法遁形。

CNET 记者 Scott Stein 表示,在某些公共场合,举起眼镜进行拍摄会让他感到一种莫名的自我意识过剩和社交尴尬。

但这不只是 Meta Rayban Display 的问题,在国内包括小米眼镜在内的爆款产品,在走向大众用户时,都面临过类似的问题。或许也是所有可穿戴相机设备在走向普及之前,都必须跨越的文化和心理障碍。

04

一封寄往后智能手机时代的「序章」

 

在深度体验了数天之后,几乎所有的评测者都得出了一个相同的结论:Meta Ray-Ban Display 在 2025 年的今天,并不是一款要全面取代你智能手机的产品

它甚至与 Meta 一开始向用户展示的 Orion 的体验都大相径庭: 这很大程度上也表现了,在现有硬件条件下,即使是 Meta 也无法变魔术,将双目全彩光波导 AR 显示体验,以一个 799 美元的价格交付给用户。

 

去年 Meta 曾开放体验过的 Orion 原型机 | 图片来源 : Meta

 

无论是价格(与最新款的 iPhone 17 起售价完全一致)、它的续航瓶颈、它依然有限的应用生态,都清晰地表明了它当前的身份——一款为开发者、科技领域的先行者、以及那些愿意为一窥未来而支付高昂「门票」的极客们,所精心准备的开拓性设备。

然而,将它仅仅视为一款小众的极客玩具,或许也并不是对他最客观的评价。

正如 ZDNet 的结论:它真正点燃的,是人们对于「后智能手机时代」的兴奋与想象。

在过去的十几年里,我们已经习惯了低头看向一块 5-7 英寸的玻璃屏幕,它定义了我们获取信息、社交和娱乐的方式。而 Meta Ray-Ban Display,则勇敢地写下了这个故事的「第一行新代码」。

它第一次将还算不错的显示效果、革命性的神经交互、强大的 AI 能力和时尚的工业设计,以一种前所未有的完成度融合在了一起。它让你在现实世界中行走时,能够以一种更抬头、更从容、更与环境融为一体的姿态,去接收和处理数字信息。

它就像是个人计算革命史上的那封厚重的「序章」,内容或许还不够丰富,语言或许还略显生涩,甚至存在一些拼写错误,但它成功地构建了一个全新的世界观,并向所有人宣告:

故事,已经开始了

而这,或许就是它 799 美元售价背后,最核心的、超越产品本身的价值所在。

OriginOS 6 深度体验:当操作系统回归「体验为王」

 

 

2020 年,智能手机刚刚进入 5G 普及阶段,手机的硬件与软件都迎来了一次迭代浪潮——新形态的需求对操作系统的设计与交互都提出了诸多新的问题,OriginOS 的首个版本,可以看作 vivo 对这些问题的回答。

彼时,我曾有机会与 OriginOS 开发团队沟通,正如 OriginOS 的中文名原 OS,Origin 一词代表的原始、本源之意一样,开发新系统的首要目标就是要与手机操作系统生态内的众多常用功能进一步融合,提供新的手机操作系统体验。

如今时过境迁,五年过去,vivo 从早期的追赶,走到了如今的引领,OriginOS 也从早期独特的设计语言,来到了现在以 AI 与用户体验作为招牌的阶段。

站在当下,面对用户对功能堆砌的疲劳和对 AI 能力带来的「真智能」的渴望,vivo 给出了自己的答案:向内求索,回归本源;OriginOS 6 放弃了零散的炫技,将力量集中在设计、流畅、AI、连接这四个最能影响日常感知的维度上,试图回答一个关键问题:手机它如何才能成为一个更懂你、更高效、更具美感的「数字伙伴」?

01

设计

 

OriginOS 作为手机操作系统设计领域最早的「变革者」,其设计团队在长达五年的迭代过程中,也积累了大量来自用户的真实反馈。

 

手机操作系统设计的重点,在于构建一种能与用户产生情感共鸣的交互仪式。每一次触摸、每一次亮屏时,都能传递出的愉悦与舒适。OriginOS 6 的设计哲学,就始于光影这一最基础,也最富生命力的元素。

全新的「光影空间」体系,是 OriginOS 6 设计语言的基石。在这里,光效更加主动地参与用户交互,成为了 UI 的灵魂。这种设计理念被拆解为几种具体而微的光效,共同营造出一种前所未有的通透感和生命力。

 

首先是「弥散光」。当你呼出控制中心或查看通知时,控件的底部会产生一层如晨雾般细腻的光晕,它柔和地融入背景,让原本坚硬的 UI 边界变得模糊、轻盈。这种效果替代了以往常见的玻璃材质,在复杂的背景下营造出更柔和的沉浸氛围,让整个界面仿佛在呼吸。

其次是「增强光」。交互的核心在于反馈,而光是最好的反馈媒介。在 OriginOS 6 中,当你在锁屏界面输入密码,每一次指尖的点按,对应的数字键都会被一道瞬时的高光点亮。这个看似微小的细节,却极大地强化了操作的确认感和爽快感,让简单的解锁过程也充满韵律。

更进一步的,是「AI 光效」。当系统内的 AI 能力被唤醒时,例如使用小 V 圈搜进行识别,屏幕上会浮现出流动的粒子光效,清晰地告诉你「我正在为你思考」。这种有温度的视觉语言,远比一个冰冷的加载图标更能建立用户与 AI 之间的信任感和亲和力。

据 vivo 透露,在未来的更新中,还将上线「环境光」与「边缘光」。前者能让原子岛根据音乐的节奏产生光晕律动,后者则能让控件的边缘光效跟随手机陀螺仪的姿态发生微妙变化。这意味着,你手中的设备将能更敏锐地感知环境与你的互动,并以光影作为回应。

 
 

除了光影,OriginOS 6 还在系统的各个角落,注入了更多的「仪式感」:全新的「开机引导界面」,用更具本地化、人性化的欢迎语和全新的系统动画,取代了以往枯燥的设置流程,这就像一次亲切的问候,在第一时间与用户建立情感的连接。

锁屏界面,作为用户每天接触最频繁的入口,更是被赋予了前所未有的创造力。全新的个性时钟主题,让用户可以像玩乐高一样,自由拖动时钟在屏幕网格间的位置,通过拉伸改变其形态,甚至无级调节数字的粗细、从调色盘中吸取最爱的颜色。这让锁屏不再是厂商定义的作品,而是真正属于你自己的个性化画布。

而在国庆期间已经在社交媒体上出圈的趣味光栅壁纸,则将这种互动乐趣推向了新高潮:它允许你选择 2 到 4 张静态图片,或是一段 Live Photo、一段视频作为素材。设置完成后,只需轻轻摆动手机,屏幕上的画面就会在不同景象间奇妙地切换,配合棱柱光栅、渐隐渐显等多种过渡效果,呈现出动态反差的视觉趣味。它让静态的壁纸「活」了起来。

 
 

从这些新内容上也能看出,OriginOS 的设计即使过了五年,仍然保持着「变革」的底色,仍是一个在不断生长、延展的有机体。

据 vivo 在开发者大会中介绍,在后续的更新中,备受期待的「Symbols 全局可变图标」将会上线。这项技术运用先进的字体渲染,重塑了超过 2800 个系统图标,使其能够像字体一样进行无级字重调节,与 vivo Sans 字体家族无缝衔接,彻底解决系统内视觉元素混排的割裂感。

同时,「锁屏音乐沉浸模式」也将到来,它能将音乐的专辑封面延展为整个锁屏背景,让视觉与听觉完美融合。值得一提的是,全新的质感图标及主题图标自定义功能,也将在内测期间分批开放体验。

这一切都预示着,OriginOS 6 的设计美学,将在未来的时间里,持续为用户带来新的惊喜。

02

蓝河流畅引擎

 

如果说设计是一个操作系统的「面容」,那流畅可以说是操作系统深入骨髓的「灵魂」。

长久以来,「流畅」是一个玄学,厂商热衷于展示复杂的技术名词,但用户真正在乎的,唯有每一次指尖划过屏幕的真实感受。OriginOS 6 带来的最大惊喜,就是将这种感受从抽象的期待,变成了眼见为实的丝滑。

这种改变,如血液般流淌在系统的每一个角落,你甚至不需要刻意对比,就能在第一时间感受到巨大的差异。

无论是应用的开启切换,后台卡片的清理,还是桌面图标的移动,如今都被一种更符合物理直觉的「弹性动效」所取代。

全局采用的spring动效,比传统的贝塞尔曲线更能模拟真实世界的回弹、缓停与加速。

例如当你从后台划掉一张应用卡片,它会带着一丝 Q 弹的反馈消失;当你呼出控制中心,各个控件会带着递进的层次感优雅地呈现;当你移动桌面图标,它的原位置会泛起一阵涟漪。这些细节,让整个系统仿佛被赋予了弹簧般的生命力,每一次的回弹、缓停、加速都恰到好处,跟手得仿佛是你指尖的延伸。

这种丝滑的体验,也体现在「帧形变」和「帧模糊」等更高级的动效处理上。例如,原子岛的展开与收起,会有一种奇妙的「拉丝感」,仿佛元素间存在真实的物理连接;而在全局搜索等场景,背景会实现平滑的景深模糊过渡,帮助用户聚焦于当前任务。这些动效共同创造了一种「一镜到底」的视觉连续性,消除了界面跳转时的断层感,让用户的注意力能始终保持专注。

 
 

支撑这一切流畅体验的幕后英雄,是 vivo 自研的「蓝河流畅引擎」。就像一颗强大的心脏,从计算、存储、显示三大维度为系统进行了深度重构,旨在榨干每一分硬件性能。

在计算层面,vivo 带来了创新的「超核计算」。传统的安卓调度机制,就像一个多线程的路口,任务来了就随机分配,时常出现「高优任务被阻塞,空闲资源在摸鱼」的尴尬情况。而「超核计算」则引入了一个类似「全局交通指挥官」的虚拟核心,它能实时监控所有 CPU 核心的负载,并将用户最能感知到的前台任务标记为 VIP。当 VIP 任务出现时,指挥官会立刻为其寻找空闲通道,如果全线繁忙,则会果断「抢占」一个正在处理低优任务的通道,确保前台体验永远拥有最高优先级。

在存储层面,「光子存储」技术则致力于打通数据传输的「最后一公里」。它通过重构安卓虚拟机、优化内存回收机制,并行业首创地将编解码器的 DMA 内存纳入调度,实现了从 CPU 到 IO 设备的全链路管控,极大地提升了重载场景下的加载速度。

而在显示层面,OriginOS 6 首发了独特的「双渲染架构」。它像一个智能的渲染任务分配中心,会根据任务的复杂程度,灵活选择两种不同的处理方式:对于简单的应用启动、图片切换等轻量交互,它会采用传统的「分离式渲染架构」;而对于复杂的、高负载的系统动效,则会启用全新的「统一渲染架构」,将任务集中在系统服务层并行处理,大幅提升渲染效率。

我们无需深究这些复杂的技术原理,只需要知道,正是这个强大的「引擎」的存在,让流畅不再是技术参数,而是转化成了贯穿于每一次点击与滑动中,坚实而愉悦的反馈。

03

AI

 

如果你是近两年长期关注手机 AI 能力落地的从业者,或许你已经对 vivo 在 OriginOS 中的 AI 能力整合一系列动作还有印象:在 2017 年,vivo 就开始了在 AI 大模型领域的布局,在 OriginOS 4 上,则是 vivo 在大模型领域耕耘多年成果的首次亮相。随后的两年中,以蓝心小 V 为代表的 vivo 自研 AI 能力,一直在 OriginOS 这片土壤生根发芽。

在这波 AIOS 的浪潮中,vivo 可以说是最早踏入河流的手机品牌之一,也是最早意识到「智能手机用户需要的早已不是一个被动听令的语音助手,而是一个能主动理解意图、预判需求、解决问题的智慧伙伴」这个概念的团队之一。

OriginOS 6 的 AI 能力升级,其核心正是完成了这场从「被动」到「主动」的产品形态迭代。

「小 V 圈搜 2.0」是这一改变最直观的体现。它彻底颠覆了传统的「跨应用」信息获取流程。过去,从「我想要」到「我得到」的旅程,是一场需要截图、打开特定 App、再搜索的「跨平台马拉松」。现在,它被简化成了一个优雅的动作:在屏幕上轻轻画个圈。

当你在聊天记录里圈选一个地址,系统便能心领神会,直接在底部弹出地图导航和网约车平台的快捷入口;当你在社交媒体上圈选一件喜欢的衣服,同款商品链接便会即刻呈现;当你圈选一段会议通知,一键加入日程的按钮就会自动出现。小 V 通过对屏幕内容的智能识别,主动预判了你的下一步意图,并将终点直接呈现在了你的起点。这是一种从「人找服务」到「服务找人」的根本性变革。

AI 的价值,同样体现在赋能用户的日常创作上。「Live Photo AI 消除」功能,就是一个善解人意的「后期大师」。旅行中拍下的动态照片,总难免有路人闯入的遗憾。传统的消除工具只能处理静态图片,而 OriginOS 6 的 AI 消除,则能智能追踪并抹去其在整个动态过程中的痕迹,同时保持 Live Photo 的动态属性。只需圈出画面中的干扰元素,AI 就能还你一个完美无瑕的精彩瞬间。


 
 

而「AI 定制美颜」则让修图变得更具个人风格。它能通过学习你相册中过往的精修照片,理解你的美颜偏好、妆容风格,并生成专属你的「美颜模型」。之后,对于新拍摄的照片,只需一键应用,即可获得媲美精修的效果,真正实现千人千面。

OriginOS 6 后续规划中,「AI 总结」功能,将赋予小 V 更强的长文理解能力。无论是冗长的通知邮件、微信群聊记录,还是扫描的文档,AI 都能为你快速提炼核心要点,让你在信息洪流中高效前行。

此外,「智能命名」能为录音、扫描文件自动生成标题,「智能通知」则通过端侧大模型识别并置顶重要信息。这种进化,让 AI 如同一位隐形的、无处不在的高效助理,真正地融入了你的日常。

04

生态协同

 

当我们拥有的智能设备越来越多,横亘在设备之间的那道无形壁垒,便成了生产力最大的阻碍。一个优秀的操作系统,不仅要做好自身的体验,更要具备打破壁垒、连接万物的能力。OriginOS 6 在生态协同上的布局,展现了其「破壁」的决心。

在这其中,最能代表 vivo 「生态开放」态度的,莫过于 vivo 在此前的与 iPhone、Mac 等苹果设备生态互联的基础之上再进一步,为 iPad 用户打造的「vivo 办公套件 iPad 版」。

想象一下这样的场景:你在 iPad 上撰写文档,需要一张现场照片,此时无需拿起手机,直接在 iPad 的笔记应用中点击插入,即可调用身边 vivo 手机的摄像头完成拍照,照片会即刻出现在光标处。这便是「任务接力」。

你还可以在 iPad 的大屏上,像管理本地文件一样,浏览、编辑、传输手机中的所有文件,甚至可以将手机屏幕完整地镜像投屏到 iPad 上进行操作。对于同时拥有这两款设备的「双持用户」而言,这无疑是一次巨大的体验解放,生产力得到了前所未有的释放。

除了与生产力工具的协同,OriginOS 6 也让日常的分享与传输变得更具趣味和效率。「摇一摇群组分享」让多人共享照片成为一种充满乐趣的社交仪式。在聚会现场,大家只需同时摇晃手机,就能快速创建一个临时传输群组,海量的照片、视频原图都能在不消耗流量的情况下完成分享。

而「跨端文件随心传」则彻底解决了手机与电脑间传输文件的痛点。无需数据线,无需繁琐的配对,只要电脑上安装了 vivo 办公套件,文件就能通过拖拽、右键等方式轻松发送到手机,甚至支持离线接收,体验如苹果生态的「隔空投送」般流畅。

05

总结

 

纵观全文,OriginOS 6 的升级路径清晰而坚定:一切从用户的真实感知出发。它没有沉迷于功能数量的堆砌,而是选择在设计、流畅、AI、连接这四个核心体验维度上深耕细作,将技术力转化为用户能够实实在在感受到的舒适、愉悦与高效。

在这些核心支柱之外,「蓝海续航系统」对持久续航的承诺,「悦目护眼」通过与专业医疗机构合作带来的科学舒适光感,「vivo 听说」背后科技向善的人文温度,以及更严格、更透明的权限管理体系所带来的安全感,共同构筑了这套系统的完整体验。

 

对于用户而言,这些看似散落在系统各个角落的升级,都共同指向了一个更统一、更连贯的数字世界:可以说 OriginOS 6 是 vivo 在智能手机下半场,交出的一份关于「软件定义体验」的答卷。据悉,vivo X300 系列和 iQOO 15 将率先搭载 OriginOS 6,后续也将可以在更多机型上体验到更加流畅舒适的新系统。

马斯克脑机公司展示脑机控制机械臂;三星中国发布折叠屏新机,16999 元起售;滴滴自动驾驶获 20 亿元融资 | 极客早知道

Sora 即将在 Android 上发布 先开放北美区域

在推出 Sora 2 视频生成模型并引爆社交媒体后,OpenAI 正加速将其生态推向更广用户群。继 9 月底上线 iPhone 版后,Sora App 现已登陆 Google Play 商店,并开放美国和加拿大地区用户的安卓预注册。虽然目前仍无法下载,但官方显然不打算让 Android 用户久等。

目前,Sora 在美国与加拿大地区率先开放预注册,其他国家/地区的用户可在 Google Play 上看到「暂不适用您所在地区」的提示。根据过往 OpenAI 的策略,全球推广通常会分阶段进行。

Sora App 是 OpenAI 继 ChatGPT 之后的又一重量级产品,被外界视为 AI 视频版的「TikTok + Midjourney」。其核心不仅在于文本到视频的生成能力,更在于构建一个「AI 视频内容社交平台」。

根据官方说明,Sora App 将内置个性化视频流(Customizable Sora Feed),用户可浏览由 AI 生成的短视频内容,体验类似抖音或 Instagram 的沉浸式 Feed 流。

同时,应用引入了一个名为「Cameos」的新功能,用户可通过一次性的视频和音频录制,上传自己的形象与声音,授权给好友或他人 AI 化身出演。这一机制意味着用户可以在他人生成的视频中「客串」,形成 AI 版「合拍」玩法。(消息来源:鞭牛士 Bianews)

消息称软银将扩大 Arm 股票担保贷款规模,换取额外 50 亿美元投资 OpenAI

10 月 11 日消息,彭博社在北京时间昨日的一份报道中表示,根据匿名消息人士的透露,软银接近与全球多家银行就一项新的担保贷款达成一致,拟抵押 Arm 股票借入共计 50 亿美元的资金,用于今年对OpenAI的追加投资

根据软银的 2024 财年财报,该企业此前已通过将 Arm 股票作为潜在抵押物建立了总计 135 亿美元的信贷额度,其中 50 亿美元在今年 3 月末尚未提取;新交易达成后软银的 Arm 股票抵押贷款总额将达到 185 亿美元。

软银与 OpenAI 以及 Oracle 甲骨文一道启动了价值不低于 5000 亿美元的 "Stargate" AI 数据中心基建项目,也是 OpenAI 的重要投资者之一,该企业近期还宣布将以近 54 亿美元收购 ABB 的工业机器人业务。所有这些新投资都意味着巨大的资金开销。(消息来源:IT 之家)

 

宇树科技王兴兴:看好「小的轮式机器人+机械臂」模式 有望在最近一两年加速部署

10 月 11 日,以「碳硅共生、合创 AI+时代」为主题的「2025 中国移动全球合作伙伴大会」在广州召开。会上在圆桌论坛环节,宇树科技创始人王兴兴做了发言。

在他看来,由于消费者对家庭场景的期待涉及方方面面的家务细节,对机器人的综合要求非常高,无论是在技术层面、伦理道德层面还是安全层面,其推动速度会相对较慢。

王兴兴称,自己目前比较看好(家庭场景中)在一些小的轮式扫地机器人上加一个机械臂的模式,该模式有望在最近一两年内加速部署。

至于工业场景,王兴兴直言,公司去年尝试与蔚来汽车、吉利汽车等企业共同推动人形机器人在工厂落地,遇到了很多挑战。

「其竞争就是与传统的自动化设备和传统的工业机械臂的竞争,面临非常直接的效率和成本问题,需要迈过一个临界点。这个临界点要比常见的人力效率更高、成本更低,或者说与传统的机械臂或自动化设备有更明显的优势。这个临界点迈过去以后才可能大规模铺开,不然速度会更慢。」王兴兴称。(消息来源:快科技)

 

马斯克给出「AI 能源」解决方案:电网夜间储能、白天放电 将使美国电力产出翻倍

10 月 11 日消息,人工智能爆发式增长将美国电网推向极限,近日,马斯克在社交平台 X 上表示,美国电网具备约 1 万亿瓦稳定输出能力,但日均使用量仅为 0.5 万亿瓦。通过夜间运行发电厂为电池组充电,白天释放电力支持 AI 运算,将可以「使美国的年发电量翻倍」。他称大规模工业级电池是稳定电网的制胜方案。

马斯克的表态正值市场对 AI 算力激增引发能源危机担忧日益加剧之际,华泰证券预计 2025 至 2026 年仅美国本土 AI 数据中心每年将新增 6-13 吉瓦用电需求,推动最高负荷增速达到历史平均水平四倍。据华泰证券估算,为弥补 2026 年底预计出现的 18-27 吉瓦功率缺口,美国未来两年需要新增 110-205 吉瓦时的储能装机容量。这意味着相较于 2024 年 37 吉瓦时的装机量,市场需要保持每年 50% 以上的增速。(消息来源:华尔街见闻)

淘宝闪购首次参与双 11:发放超 1000 万份免单红包

10 月 11 日消息,阿里巴巴旗下淘宝平台宣布,其即时零售服务「淘宝闪购」首次参与双 11 大促。

根据官方信息,用户可在 10 月 15 日至 11 月 14 日期间,通过搜索关键词「闪购双 11」进入活动页面,领取超 1000 万份免单红包,每天还将为 88VIP 用户提供两个 5 折红包。

除外卖 5 折红包外,88VIP 会员双 11 期间额外可叠加 95 折优惠。同时,淘金币频道与闪购服务打通:用户下单闪购订单即获 500 淘金币奖励,实付金额超 30 元时可获 1000 淘金币。(消息来源:IT 之家)

 

滴滴自动驾驶获 20 亿元 D 轮融资 将用于加速 L4 落地与 AI 研发

10 月 11 日,滴滴自动驾驶宣布获得 D 轮融资,融资总额 20 亿元。投资方包括中关村科学城科技成长基金、北京信息产业发展投资基金、北京市人工智能产业投资基金、广汽集团、广州广花基金及滴滴。资金将用于加大 AI 研发投入、推动 L4 自动驾驶应用落地,助力交通运输行业高质量发展。

滴滴联合创始人、滴滴自动驾驶 CEO 张博表示,L4 自动驾驶技术是下个十年人工智能时代最重要的技术变革之一,将大幅提升出行安全、效率与体验。滴滴自动驾驶在 AI、量产及运营三个关键领域上已有近十年的积累,将始终坚持负责任的科技创新,在积极探索新型就业空间的同时,稳步推进自动驾驶发展,为智能网联产业发展贡献力量。

今年以来,滴滴自动驾驶在北京和广州开启了全场景、全无人测试,无人车在早晚高峰、深夜、骤雨等复杂出行场景中表现稳定。滴滴自动驾驶和广汽埃安联合打造的新一代前装自动驾驶车,计划于 2025 年底交付,之后在北京、广州等地开展示范应用。(消息来源:新浪财经)

三星心系天下 W26 折叠屏手机发布:16999 元起

10 月 11 日,三星中国举行「心系天下」系列新品发布会,并正式发布了新机心系天下三星 W26,W26 基于三星 Galaxy Z Fold 7 打造,加入了全新的丹曦红、玄曜黑配色和心系天下标识。

售价方面,三星 W26 16+512GB 版本售价 16999 元,16+1TB 版本售价 18999 元。

W26 折叠厚度 8.9mm,展开厚度 4.2mm,是心系天下系列中最薄的手机,整机仅重 215g。

新机搭载了高通骁龙 8 for Galaxy 移动平台,内置 Galaxy AI,支持天通卫星通信服务。(消息来源:凤凰网科技)

续航升级、怀挡冰箱上车!比亚迪汉长续航版上市:15.98 万起

10 月 11 日消息,今日晚间,比亚迪汉长续航版正式上市,新车提供 DM-i 插混、EV 纯电两种动力,共推出七款车型,售价区间 15.98-21.58 万元,限时置换全系补贴 1 万元,置换后价格区间为 15.98-20.58 万元。

同时,比亚迪还给出了 5 千元选装尊享装备礼、1 万元至高贴息、泊车服务、免费取送车、道路救援、充电桩免费安装在内,总价值 38000 元的上市礼遇,以上权益截至 10 月 31 日。

新车最大的升级在于续航全面加长,DM-i 插混版本纯电续航全系升级为 245 公里,EV 纯电版起步续航来到 635 公里,长续航版为 705 公里。同时,车内换装怀挡设计、增加车载冰箱、隔音升级,加入 ANC 主动降噪功能、升级搭载 TBC 高速爆胎稳行系统等,硬核技术赋能实力突破。

车机为 DiLink 100 智能座舱高阶版,并接入 Deepseek 大模型,新增手车互联(支持接受微信消息、手机导航、音乐流转至车机)、无麦 K 歌等功能。

辅助驾驶部分,汉长续航版搭载「天神之眼」辅助驾驶系统,支持行车辅助、泊车辅助、安全辅助。而激光雷达版还支持城区 NOA 等全场景领航和超 300 种泊车辅助场景。(消息来源:快科技)

Neuralink 展示「脑机接口+机器人」应用

10 月 11 日电,在本周社交媒体上的一段演示中,知名脑机接口公司 Neuralink 展示了渐冻症患者 Nick Wray 通过脑机接口控制机械臂进食的画面。据悉,这是 Neuralink 获 FDA 批准的 CONVOY 研究项目的一部分,Wray 是第 8 位接受该脑机植入手术的患者。借助该系统,Nick Wray 已成功完成抓取杯子、戴帽子、微波加热食物及打开冰箱等多项任务。(消息来源:财联社)

 

马云现身 NBA 中国赛场观战 身旁大佬云集:吴泳铭 成龙 贝克汉姆……

10 月 11 日消息,昨晚,NBA 中国赛在中断 6 年后正式回归。有现场观众向《BUG》栏目表示,「现场座无虚席。第二节比赛暂停期间,姚明、奥尼尔、韦德和加特集体亮相,一场比赛就见到了好几个 NBA 传奇球星。」

此外,阿里巴巴创始人马云、董事会主席蔡崇信、CEO 吴泳铭共同观赛,与成龙、贝克汉姆等国际巨星互动,这也是自 2023 年 9 月阿里管理层交接后三人罕见的公开同框。

商界大佬、文体名人已经成为赛场外最耀眼的风景。《BUG》栏目在二手平台查询发现,比赛门票溢价高达 2-5 倍,比如 12 日比赛的 488 澳门元门票被炒至 2380 元人民币,溢价 5 倍,足见球迷热情,不过 VIP 门票却出现降价出售的情况,黄牛透露「这些属于非公开销售的门票」。(消息来源:和讯网)

 

 

OpenAI 卖货做视频,Anthropic 专心写代码,谁能赢?

作者| 芯芯

编辑| 靖宇

 

在 2025 年的 AI 战场上,不管是估值,用户量,还是产品路线,OpenAI 与 Anthropic 的区别,越来越大。

OpenAI 追求「广度」,它想让 ChatGPT 成为新的超级应用,从购物到视频,从娱乐到办公,把 AI 塞进用户生活的每一个缝隙。 最近发布的 Sora 2,又刷屏业界。

Anthropic 则执着于「深度」,推出最强编程模型 Claude Sonnet 4.5,在 AI 编程这条路走到黑。然而该模型发布才过一天,Sam Altman 就用 Sora 抢走了它的风头。

这不仅是两家公司产品发布节奏的差别,还有两种商业逻辑的选择:是凭借庞大的流量和新应用模式抢占消费市场,还是通过稳健的技术纵深赢得企业客户? 是追逐「更多人用」,还是追求「能做更专业的事」

在科技圈,现在有不少人并不看好 Anthropic,马斯克今年 9 月断言,Anthropic 注定「不会赢」。与此同时,也有人开始担心 OpenAI 是否会变得越来越垄断。甚至还有悲观者认为,所有初创公司都应该停止产品开发,套壳没有未来,天下最终还是 OpenAI 们的。

AI 巨头的战争,是否已经出现分水岭?

 

01

横向扩张的 OpenAI

 

如果要用一个词来总结 OpenAI 最近的策略,那就是「横向扩张」。它不满足于只做一个对话机器人,而是要做超级入口、超级应用。

首先是电商购物,ChatGPT 正在把「问答」转化为「交易」。在近期的更新中,Open AI 在美国上线了「Instant Checkout」,与 Etsy 合作,用户可以在对话里直接完成商品发现、下单与支付,Shopify 也即将接入,支付环节由 Stripe 提供。

同时,OpenAI 还推出了一项名为「Agentic Commerce Protocol」的开源标准,供商家将其服务集成到 ChatGPT 中,希望借此吸引更多商家加入。

 

ChatGPT 进军电商购物|图片来源:OpenAI

 

不单单是消费者,面向企业和团队组织,ChatGPT business 还上线了 Shared Projects,允许团队共享项目,支持项目级上下文共享与管理员控制。

这意味着 ChatGPT 不再是孤立的个人助手,而是一个能够沉淀知识、分工协作的平台

 

ChatGPT business 版本共享项目功能|图片来源:OpenAI

 

在近期的众多更新里,除了要将 ChatGPT 做大做强,变成「超级应用」,OpenAI 还推出了另一款应用,试图抢下 AI 短视频赛道。

基于最新的 Sora 2,OpenAI 已经官宣推出一款名叫「Sora」的应用,主打 AI 生成视频的浏览与创作。与传统短视频平台不同,它强调用户生成与 AI 融合,主角不是陌生网红,而是你和你的朋友、你的宠物。

OpenAI 推出名为 Sora 的 AI 短视频应用|图片来源:Apple Store

 

据 a16z 合伙人 Justine Moore 评价称,「OpenAI 正在打造的是一个社交网络(类似最初版本的 Instagram),而不是一个内容网络(像 TikTok 那样)。」

按照 OpenAI 做 AI 视频应用的思路,该投资人认为, 人们不只是消费视频,而是在创造属于自己圈层的表情包与故事 。这种内容天然带有情感共鸣和传播潜力。

不过,值得注意的是,此前也有巨头尝试过类似的产品功能,TikTok、Reels 和 Shorts 等平台就一直在推进 AI 生成视频的功能,OpenAI 要做成「AI TikTok」新平台,仍面临挑战。

「大家都想从创意工具向内容消费平台进化。你不能责怪他们尝试,如果成功的话,回报将是巨大的。但这极其困难。」a16z 投资人称。

主要原因有两个:

1 用户习惯在受众最广的地方发布内容,也就是现有的社交应用,AI 生成的视频可能最终还是回流到 X、Reddit 或 Instagram;

2 单一工具无法满足多样化创意需求,用户会同时使用 Kling、Wan、MiniMax、Veo、Midjourney 等平台。ChatGPT 很难独占用户。

即便如此,Sam Altman 对 Sora 这款应用很自信,并称他和内部团队「在测试期间非常喜欢它」,甚至还针对人们对 AI 视频上瘾的可能做了设想和说明。

「很容易想象,AI 视频生成最终会陷入一个退化的境地:我们所有人都会被 RL 优化的垃圾数据流所吞噬。我们团队投入了大量心血和精力,试图打造一款令人愉悦的产品,避免落入这个陷阱。」Sam Altman 称,其团队将在产品早期阶段尝试不同的方法。

OpenAI 官宣名为 Sora 的 AI 短视频应用视频|图片来源:OpenAI

 

截至 2025 年 8 月,ChatGPT 的周活跃用户已经突破 7 亿人,相当于全球人口的 9%,远超年初的 5 亿。这意味着它天然是一个流量入口。

有了电商消费,ChatGPT 可以通过佣金分成赚钱,OpenAI 的收入模型因此更多元,既包括订阅费,也包括 API 收入,还新增了交易抽成。这使其商业逻辑越来越接近一家「平台公司」,而不仅仅是卖模型。

 

02

纵向深挖的 Anthropic

 

与此同时,不同于 OpenAI 的「多点开花」,Anthropic 在同一时期似乎选择了单点突破,在 AI 编程这条路上越走越远。每当人们提起 Claude,普遍只会想到它写代码的能力。

就在 OpenAI 官宣 Sora 应用的前一天,Anthropic 推出了最新模型 Claude Sonnet 4.5,同样在业界刷屏了一段时间。

新模型 Claude Sonnet 4.5 的定位直截了当,号称是「 世界上最好的编程模型 」,是「构建复杂 agents 的最强大模型」,也是「使用计算机的最佳模型」。

这种自信主要来自 SWE-bench Verified 评估数据。Anthropic 称,Claude 4.5 在复杂任务上能保持长达 30 小时以上的专注。它能跨文件重构庞大代码库,还能调用外部工具,保证上下文不丢失。新增的记忆功能,新增的记忆功能允许模型保存项目进度,并回溯和修改关键设定。

根据官方披露数据,Claude 在编码任务中的使用占比高达 36%。自 2025 年 5 月全面推出以来, Claude Code 已创造超过 5 亿美元的运营收入,使用量在短短三个月内增长了 10 倍以上

 

SWE-bench Verified 评估数据|图片来源:Anthropic

 

除了在写代码这件事上更强,与 OpenAI 偏向消费者订阅不同,Anthropic 一直主打 B 端市场。截至目前,Anthropic 据称已有超过 30 万家企业客户,运营收入超过 10 万美元的大客户数量在过去一年增长了近 7 倍。

商业模式上,Anthropic 依旧坚持 seat-based(席位订阅)与 API 按量收费。因为长时任务和编程需求消耗的 token 更多,它的收入主要来自「深度使用」。

Claude 最强编程模型与前代、GPT-5、Gemini 等对比|图片来源:Anthropic

 

2025 年 9 月,Anthropic 完成 130 亿美元 F 轮融资,估值达 1830 亿美元。自 2023 年 3 月推出 Claude,到 2025 年初, 该公司年化收入为 10 亿美元,八个月后升至 50 亿美元,预计年底将达到 90 亿美元

另外,Anthropic 打着安全的旗号,正积极切入政府市场。它推出了专门的 Claude Gov 模型,与美国国防部签下 2 亿美元合同,进入劳伦斯利弗莫国家实验室,与国家核安全局合作,还以 1 美元的价格向三大政府部门开放 Claude。它甚至邀请美国能源部核专家测试 Claude 是否可能泄露敏感信息。

值得注意的是,虽说 Anthropic 钟爱的「安全」叙事,让它在政府与监管场景中天然占优,但这并不代表 Anthropic 与白宫真的更亲近。

2025 年 9 月,当 Sam Altman、Tim Cook 和众多科技巨头在白宫晚宴上轮流赞美特朗普时,Anthropic 首席执行官 Dario Amodei 并不在场,业界甚至有一些人嘲讽,其并未受到邀请。

原因很简单,Dario Amodei 这个人曾批评特朗普的人工智能议程,还在 2024 年美国总统选举期间将特朗普比作「封建军阀」,呼吁朋友们投票给哈里斯。这使得外界后来一度担心,Anthropic 会不会因此失去数十亿美元的政府合同。

与此同时,OpenAI 也与政府有一些协议,Sam Altman 倾向于在白宫和市场上展示合作姿态。

 

03

谁对谁错?还是没有对错?

 

简言之,两家公司的增长路径都是真实的。

Anthropic 更像一家 B2B 公司,主打深度与专业性,OpenAI 更像一家 B2C 平台公司,想靠规模和多元化的收入模型来驱动增长 。他们都想吃下更多的订单,但后者的目标对象远比前者更多,也不排除企业级市场。

OpenAI 目前的绝对性优势在于规模。7 亿用户的基数,足够让很多对手望尘莫及,让它有条件做「超级应用」。

但隐忧也有,像 OpenAI 要做的电商闭环意味着履约、欺诈、退货等传统问题。而且,在追求广度时,是否会在编程等领域深度上落后于专注型对手?

另外,OpenAI 的 Sora 新应用想要进入的领域竞争激烈。TikTok 的 AI Alive 功能允许用户通过提示将图片转换为视频,并且用户可以上传 AI 生成的内容。Meta AI 近期也推出了全新的 AI 短视频功能。

Meta AI 视频应用程序 Vibes|图片来源:Meta

 

在做多应用的时候,虽说回报是更大的消费级增长曲线与更丰富的商业化通道(订阅 + API + 交易),但 OpenAI 也要面对更复杂的合规与风控问题,以及更大范围的竞争。

Anthropic 的目标在于企业需求,处理复杂代码等任务也是 Claude 的老本优势。与 AWS 和 Microsoft 的合作,也让它在云与办公生态中拥有分发优势。

问题则在于,技术领先并非永远。

OpenAI、谷歌等都在持续强化代码与 agent 能力。另一方面,如果未来 AI 产品形态更多由 C 端应用决定,Anthropic 的品牌渗透是否不足?当下 OpenAI 的名声远比它更响亮。

左:Sam Altman;右:Dario Amodei|图片来源:网络

 

目前,有一些人并不看好 Anthropic。

比如马斯克,他今年 9 月在自己执掌的 X 平台上表示,「对于 Anthropic 来说,获胜从来都不在可能的结果范围内。」

 

马斯克称 Anthropic 不会赢|图片来源:X

 

一名用户甚至提醒马斯克,他曾经也对 OpenAI 做出过相同的负面预测,马斯克对此则澄清道:「不,我从没这么说过。一开始我就告诉所有提问的人,我认为 OpenAI 击败谷歌的概率约为 1%,这与 0% 相差甚远。在 DotA 获胜事件后,我把它获胜的概率提高到了 10% 左右。」

 

马斯克回应之前对 OpenAI 的负面预测|图片来源:X

 

据研究公司 CB Insights 称,目前 OpenAI 在全球私营公司中按估值排名第三,而 Anthropic 排名第七,前者估值高出后者超过 1000 亿美元。

回顾 2022 年,Anthropic 据称在年中已经完成首个模型的训练,其官方历史声称,他们是「故意推迟」发布 Claude,直到他们认为内部安全和协调工作已经完成,而不是急于上市。于是,OpenAI 的 ChatGPT 在当年率先火爆全球。

Sam Altman 事实上也的确是掌控发布节奏与公众注意力的大师,不管是 Sora,还是之前的 GPT 系列、Code Interpreter、GPT Store 等产品,往往能在竞争对手发布前后抢占话题。

直到现在,Anthropic 发布 Claude 新模型或其他研究成果,OpenAI 也会迅速跟进或发布新功能。比如 Claude Sonnet 4.5 发布,话题还没发酵一天,Sam Altman 就官宣 Sora 应用上线,这种「抢风头」并非偶然。

即使未能发布产品,Sam Altman 也经常会在社交平台上发一些神秘推文,模糊时间和内容,让所有人猜测。产品发布不仅是技术问题,还成了心理战和市场战。

OpenAI 推出 AI 短视频产品的预告视频|图片来源:OpenAI

 

总之,不同路线未必有谁对谁错。微软曾凭借企业市场的深耕奠定了长久的基业,Facebook 则靠消费级规模建立了社交帝国。 AI 时代的胜者,也允许不止一个 ,尤其在反垄断成为常态的情况下,行业格局可能不是一家独大,而是各分一杯羹。区别可能只是,谁的蛋糕更大,谁的盘子更牢。

至于 OpenAI 的购物闭环能否真正跑通,Sora 会不会成为 AI TikTok,还是昙花一现,Claude 的编程优势能坚持多久,马斯克的断言是否会成真,答案不会在某个时间点一下揭晓,但或许会在一轮轮迭代中逐渐清晰。

一颗 1.8 纳米芯片,成了英特尔「最后的救赎」

作者|芯芯

编辑| 靖宇

 

2025 年的秋天,对英特尔来说又是一个临界点。

这家曾经定义了硅谷的「硅」的巨头,面对 AMD、苹果、高通等后起之秀的多线夹击,一度在设计与制造两端双双失速。

从错过移动手机市场的爆发,PC 市场主导地位逐渐被蚕食,到各种技术决策失误,昔日的硅谷巨人疲态尽显。如今,一切希望,似乎都压在了一颗芯片上。

就在 2025 年 10 月 9 日,英特尔在亚利桑那州公布酷睿 Ultra 系列第三代处理器的架构细节, 这是首款基于英特尔 18A 工艺节点打造的客户端系统级芯片(SoC),代号为 Panther Lake

在经历多年设计和制造双重失速、管理层更迭与战略大回转之后,Panther Lake 被赋予了超越产品本身的意义。它既要证明 18A 的可行性,也要让资本、政府与潜在客户相信,英特尔的「造芯能力」值得押注。

英特尔是否能靠 Panther Lake 重整旗鼓?

 

01

最后赌注「 18A 」

 

在亚利桑那州钱德勒的英特尔 Ocotillo 园区,英特尔 CEO 陈立武手持代号为「Panther Lake」的英特尔酷睿 Ultra 系列第三代处理器的 CPU 芯片晶圆,宣布该产品将于今年晚些时候在该州的最新工厂投入大批量生产。

根据英特尔的介绍,Panther Lake 是一款面向 PC 的系统级芯片(SoC),集成了 CPU、GPU 以及专用 AI 加速器。它统一了以往强调效率的 Lunar Lake 与强调性能的 Arrow Lake,让 OEM 不再在「电池寿命或峰值性能」之间二选一。

它提供从 8 核到 16 核的不同版本,并搭载全新 Xe3 图形核心。顶配型号内建 12 个 GPU 核心与光线追踪单元,性能据称较上一代提升逾 50%。在 AI 性能方面,Panther Lake 算力最高可达 180 TOPS(每秒万亿次运算)。

除 PC 端外, 英特尔官方还提到,Panther Lake 还将延伸至包含机器人在内的应用

Panther Lake 芯片|图片来源:Intel

Panther Lake 的真正看点是工艺。Panther Lake 是英特尔首款基于 18A 工艺打造的产品,英特尔将其定调为:

迄今在美国本土开发并制造的最先进半导体工艺 」。

18A 这个数字,意思是「1.8 纳米」,1A 等于 0.1 纳米。这是英特尔首个 2 纳米级节点,该节点在英特尔位于俄勒冈的工厂完成开发、获得制造资格并启动早期生产。

其工艺的突破在于两项底层技术,RibbonFET 与 PowerVia。前者是英特尔十余年来首个全新晶体管架构,据称有很强的缩放能力和开关特性。后者是新的背面供电系统,把传统堆叠在晶体管之上的供电金属层搬到背面,让正面的布线主要承载信号、背面承载电源,减少电压下陷与布线拥堵。

结合两者,英特尔声称 18A 相比前一代英特尔 3 工艺,可实现最高 15% 的性能提升与约 30% 的芯片密度改进。

据英特称,18A 工艺将为其未来「至少三代」客户端与数据中心产品奠定基础。

需要说明的是,业界预计 Panther Lake 仍是典型的异构封装,即 CPU 计算芯片由英特尔 18A 工艺生产,而 I/O 控制器与 GPU 模块预计仍由外部代工制造。 此前,英特尔在工艺出现问题时,一度依赖台积电

除了 Panther Lake 之外,英特尔还同时公布了基于 18A 的首款服务器处理器 Xeon 6+,代号为 Clearwater Forest,预计 2026 年上半年推出,主要面向超大规模数据中心、云服务商与电信运营商。

Clearwater Forest 的晶圆|图片来源:Intel

生产方面,Panther Lake 与 Clearwater Forest 以及多代 18A 产品,均计划在英特尔位于亚利桑那州钱德勒的全新 Fab 52 工厂投产。

 

02

临界点上的英特尔

 

Panther Lake 和 18A 工艺,可以说承载了英特尔对未来的所有希望,以及政府资金、产业资本与生态伙伴的耐心。

过去几年,英特尔一直处于自救状态

PC 端逐渐被 AMD 蚕食,笔电高端部分被苹果自研 ARM 系列和高通 Oryon 追击,先进制程屡度延期,上一代客户端产品还不得不大量外包台积电代工。

英特尔前任 CEO Pat Gelsinger 曾大刀阔斧地推动 IDM 2.0 战略,企图以史无前例的晶圆厂扩张和技术跃迁重夺领先地位。然而,预期还没有实现,高成本投资就要压垮现金流,技术节点屡屡延误,令市场无法完全信任其 IDM 体系,不少客户停留在观望状态。

2024 年底,Pat Gelsinger 被英特尔董事会请出门外。三个月后,曾任 Cadence 主席、在半导体界以稳健著称的陈立武接任 CEO。 他上任后的第一件事,是把激进的全球扩厂踩下刹车,转而强调只在有真实需求时再上产能 ,并称如果找不到外部代工大客户,英特尔可能会暂停更先进的 14A 工艺开发。

去年,英特尔裁了 1.5 万员工。2025 年第二季度时,英特尔又计划启动大规模裁员,称到年底,希望核心员工数量仅为 75000 人。该巨头在去年底拥有约 10 万名员工,这意味着英特尔今年打算再裁四分之一。

尽管危机四伏,英特尔并未成为弃子。2025 年 8 月,白宫宣布将《芯片法案》的补助直接转为股权投资, 美国政府以约 89 亿美元入股英特尔,持股约 10%

这笔交易使英特尔成为自 2008 年金融危机以来美国政府对企业的最大一笔投资之一。而且,这是美方首次以股权形式「救援」一家科技巨头,也意味着英特尔的命运,已被纳入美国战略版图。

几周后,另一笔震动业界的交易出现,英伟达宣布以 50 亿美元投资英特尔,持股约 4%,双方将共同开发 PC 与数据中心芯片。与此同时,软银也投入 20 亿美元,成为英特尔的重要股东之一。

这几笔资金的流入与背书,几乎是救命稻草,让英特尔股价触底反弹。但市场的耐心有限,英特尔需要拿出能证明制造能力的芯片。

Panther Lake 就是被推到台前证明能力的产品。可以说, 这一次产品发布对英特尔来说,都不再像以往那样只是一次迭代,而是向资本、政府与潜在买家发出的信号

 

03

留给英特尔的时间

 

按照英特尔的计划,Panther Lake 有清楚的公开时间表:今年开始爬坡进入量产,首批型号计划在年末前发货,并于 2026 年 1 月起在市场上广泛供货。

届时,它将正面迎战苹果 M 系列、AMD Ryzen 以及高通 Oryon 芯片。业界普遍认为,这一代产品将决定英特尔能否重新赢回笔电市场。

承担 18A 重任的,是英特尔最新的 Fab 52 工厂,这座四层厂房据称烧进去超过 200 亿美元,配备 ASML 最新一代曝光设备,目标是在美国本土恢复「最先进制程的量产能力」。

过去几个月,英特尔不断把潜在代工客户一批批请进厂房参观,做的当然不是观光,而是争取外部大客户,签下未来订单。

英特尔位于亚利桑那州钱德勒的全新 Fab 52 工厂|图片来源:Intel

问题在于,要让外部相信其先进制程,不在于泛泛的参观,而在未公开的良率曲线。去年底市场的传闻是英特尔 18A 的良率仍落后竞争对手,官方在近期发布活动日上也不再披露具体良率数字,只表示「年内进入高量产状态」。

英特尔 2025 年内股价因「扭转预期」一度上涨超 85% ,表明投资者对英特尔翻盘潜力的正面期待,但如果 18A 不如预期,或者 Panther Lake 反响平平,今年以来的大幅上涨也可能化为提前透支的信任。

但 Panther Lake 若能如期、按质兑现,它的意义也将越过一代笔电。首先,它能为 18A 的服务器路线——计划 2026 年登场的 288 核高能效数据中心处理器 Clearwater Forest——打样背书,让云厂商与超大客户相信 18A 是一条可复制的工艺生产线。

而且,英特尔可以靠它让旗下代工业务更有说服力,毕竟只有自用产品在 18A 上成功量产,外部客户才会把「试单」升级为真正的合作。比如向英伟达或苹果等完全依赖台积电的芯片巨头证明,英特尔可以生产他们的芯片。

今年 9 月,英伟达和英特尔曾宣布达成横跨 PC 与数据中心的深度合作。在发布会上,英伟达 CEO 兼创始人黄仁勋称,他们一直在评估英特尔的代工技术,双方会「探索」机会。简言之,就是处于试验及考察期,短期内英伟达的一些业务仍将继续依赖台积电,英特尔需要证明自己。

英伟达和英特尔 2025 年 9 月宣布合作|图片来源:发布会直播

另外,英特尔当然也希望在笔电份额上止跌,至少在高端轻薄与全能本方面,把被 AMD 借先进制程建立的优势拉回到同台对打的状态,同时抵挡苹果与高通在高端本地 AI 场景上的攻城略地。

反之,若 18A 再次踉跄,Panther Lake 未达标或量产延误,二级市场的信心回撤会很快,政府与产业资本的「战略投资」叙事也将承受政治与商业的双重拷问。

此刻,英特尔选择把乐观写在脸上

在亚利桑那州的英特尔工厂前,陈立武在手持 Panther Lake 的 CPU 芯片晶圆的照片里,嘴角上扬。英特尔 CTO 上个月在公开活动上称,18A 与 Panther Lake 是英特尔「未来的基础」,英特尔在这里「下了两个大赌注」。

这些表现和话语在往年或许只是 PR,但在 2025 年秋天却像是英特尔内部的军令状,以及真实心态。

Panther Lake 如果能证明自己,我们可能会看到一家老牌芯片巨头重新把「制造力」作为竞争力的核心。若它失手,英特尔的翻盘就不得不改写剧本。 留给 Panther Lake 的,是一整年的验证期,不算漫长

接下来,市场会看英特尔 18A 实现的结果。

这款 AI 调研神器,让我一键产生 1000 个「种子用户」|AI 上新

作者| 金光浩

编辑| 靖宇

 

最近,自从 Vibe Coding 火了以后,似乎每个人都成了产品经理和开发者。有趣的是,当产品经理和开发者多了之后,我们终于迎来了这样的挑战:

用户不够用了

作为创业者, 怎么快速找到你的用户,然后验证你的产品想法到底靠不靠谱?

传统的做法是先做个 MVP 原型,发邀请码内测,产品经理根据用户反馈来判断产品逻辑是否行得通, 但问题是,不是每个团队都有这么多资金、时间、精力做这样的调研。

现在,有个新产品——智研 agent,能帮你以低成本的方式,快速验证产品方向是否靠谱。

 

用 AI 生成用户调研的工具 AutoSurvey|图片来源:AutoSurvey

 

这个产品的逻辑听起来有点魔幻:通过 AI 生成虚拟用户,让他们来回答你的调研问题。 说白了,就是让 AI 扮演你的目标用户,帮你完成从用户画像到调研报告的全流程。

我第一反应是:这不就是让 AI 编故事吗?能靠谱?

但试用下来,我发现事情没那么简单。


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同 学发出召集,只要你发现并体验了新 的 AI 应用或者功能,按照格式(参考案例: 找人不求人?Lessie 让「人脉玄学」变成算法游戏|AI 上新 )向栏目投稿,在极 客公园公众号发布,不仅能获得相应稿费,且会为你「报销」 AI 应用的订 阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信


 

 

01

就这么拿捏了「小红薯」

 

刚好,前段时间我有个做智能体的想法,于是我决定拿这个想法,对这个工具进行测试。

这个想法的来源是,某一天我发现,为了写一篇小红书文章,我需要花很多时间,看大量爆款笔记来找灵感和参照,我觉得这里面有优化空间。

按照产品经理的逻辑,当我有这样的需求时,我也可以合理的猜测,跟我类似的人,也有类似的痛点,基于此,我就可以设计一款我愿意持续迭代的产品。

进入智研 agent 的网站,我发送了我的调研主题:帮我分析一键拆解对标小红书信息及笔记数据的智能体的市场可行性。

然后,这个 agent 工具开始了它的表演。

它首先帮我分析了这个想法的用户群体,很快给出了三类核心用户:小红书用户、自媒体从业者,还有 AI 工具爱好者。这些用户的年龄、工资范围都可以按照比例指定,比如"25-34 岁占 40%,10w-20w 的占 60%"。

接下来,它开始按照上面的要求,生成具体的用户画像。系统创建了 100 个虚拟用户,每个都有名字、背景、还有用户某个一天的日常描述。比如"简韵女子,35 岁,自媒体创作者,年收入 10 万以下,每天都要手动分析竞品笔记,最大的困扰是效率太低,经常错过热点"。

看到这些画像时,我突然有种奇妙的感觉——这些"人"太真实了,真实到我觉得自己可能真的认识这样的朋友。

然后是问题设计环节。AI 根据产品特性生成了 10 个调研问题,涵盖了技术挑战、市场需求、付费意愿等多个维度。比如"您觉得一键拆解对标小红书信息及笔记数据的智能 agent 与现有的数据拆解工具相比,独特优势体现在哪?"

我则补充了两个问题:「你是否愿意付费","你愿意付费多少钱」

 

选择咨询问题调研过程|图片来源:AutoSurvey

 

然后 agent 开始处理,最神奇的部分来了,虚拟「数字人」用户开始回答问题:

「张晴」说:「与现有数据拆解工具相比,它的独特优势在于能一键完成操作,还能精准对标小红书信息和笔记数据,节省大量时间和精力。如果有这样的工具,我愿意付费,月付 100-300 元可以接受。」

「小光仔」(另一个虚拟用户) 说:「从技术角度看,最大挑战是小红书的数据保护机制,要突破其反爬措施,合法合规地获取数据。但市场需求很大,我认为效率能提升 70%-90%。」

 

从 agent 下载的完整咨询数据|图片来源:AutoSurvey

 

3 分钟后,一份完整的调研报告出炉了。报告包括数据统计、用户画像和具体的回答、具体问题回答图表、以及最终的洞察总结。

洞察总结的内容是——100% 的用户认为市场需求很大,98% 表示愿意付费,核心需求集中在一键操作、精准对标和效率提升三个方面。

 

agent 总结的调研报告图表部分|图片来源:AutoSurvey

 

我承认,这份报告的质量超出了我的预期。

 

02

数字化「真实」

 

接着,我决定举一反三,测试它在三个不同场景下的表现。

首先是健身房智能镜子类似的产品,看看市场对于这种产品的接受度。

AI 准确识别出了目标用户,包括健身爱好者、私教,还有健身房老板。有意思的是,它还指出了一个关键问题——价格敏感度高。「数字人」们普遍表示,他们需要看到明确的效果才愿意买单。

接着我测试了一个老年人用药提醒 App,这个测试特别有趣。AI 生成的报告老年用户普遍表示「操作要简单易懂」,而看其中的对话,很多老年用户提到「最好能语音提醒,我眼睛不好」。给我的感受是,这些调研的细节相当真实,就好像真的在和老年人对话一样。

 

agent 总结的调研报告分析部分|图片来源:AutoSurvey

 

 

agent 总结的调研报告图表部分|图片来源:AutoSurvey

 

最后一个是二手奢侈品鉴定网站。在这个案例中,报告指出了信任问题是核心痛点。多个虚拟用户都提到了「怕买到假货」,还有人强调「需要权威认证」。调研的结论是——不建议做,老实说,这个结论符合我的直觉。

对比下来,我发现了一点这个工具做得比较出彩的地方:

这个工具和传统的 ai 对话不同,它没有一味的讨好用户肯定用户提出的主题,而是通过数字人「模拟」的方式,给出了某种用户面对工具时「真实」的想法。

从 agent 的角度,工具通过这些额外的上下文,给出了有效的调研结论。

整体来说,这个工具在几个场景下特别有用:

最有价值的点就是快速验证想法,你不用真的去找用户,半小时就能得到初步反馈。对时间紧张的创业者来说,这简直是救星。

其次就是它能帮你发现盲点,AI 可能会提出你没想到的使用场景或需求。有时候我们太沉浸在自己的想法里,反而看不到一些明显的问题。

生成的问题也能作为真实用户访谈的参考。设计好的调研问题其实挺难的,有了这个基础,后续工作会轻松很多。

当然了,它也有明显的局限性。

缺乏情感深度是最大的问题。AI 很难模拟用户的情感反应和那些微妙的心理变化。用户在描述痛点时的语气、停顿,这些细节 AI 是捕捉不到的。

对于特别新颖的产品,AI 的理解可能会有偏差。如果你的产品市面上没有类似的东西,那 AI 的推演可能就不太准了。

最重要的是,它不能完全替代真实调研。说到底,你还是要和真实用户对话,听听他们的声音。AI 给出的只是一个参考,一个起点,而不是终点。

 

03

从「随机」到「涌现」

 

在几天的使用过程中,我逐渐感受到了这个工具的设计理念。

它最底层的原理,其实是基于统计学和群体决策中的「集体智慧理论」: 不是直接让 AI 生成答案,而是通过模拟大量随机用户对研究数据进行推演。

当每个虚拟用户的回答都符合其人设时——预算有限的大学生会更谨慎,职场人士更看重效率,就满足了随机的要求,当随机满足时,集体智慧也就「涌现」出来。

这让我想起高尔顿的牛重量实验。1906 年,他让 800 多人猜一头牛的重量,单个人的答案五花八门,但平均值 (1208 磅) 却惊人地接近真实重量 ( 1198 磅),误差仅有百分之一。

智研 agent 做的事情类似,就是用 AI 模拟多个"数字人"的思考过程,通过集体智慧逼近真实。

与传统焦点小组的 8-10 人访谈相比,它可以瞬间模拟 100 个人的「随机」反馈,效率提升了百倍,成本降低了百倍,并且访谈可以随时随地由 agent 自行完成。 而可信度?至少有了七八成。对于早期的产品验证来说,这已经足够了。

但这里有个关键问题:如何确保这 100 个虚拟用户的回答具有真正的多样性,而不是千篇一律的 AI 模板?

事实上,整个产品的核心挑战就在于此——如果所有虚拟用户给出相同答案,调研就失去了意义。

基于我对 AI 和提示词工程的研究,我推测其技术实现可能是这样的:

  1. 用户输入研究主题后,系统自动生成多维度的用户画像
  2. 每个用户画像被赋予独立的 Agent 身份,通过定制化的提示词塑造不同人格特征——谨慎的大学生、务实的职场人、挑剔的专业用户等
  3. 多个 Agent 并行处理,各自基于其"人设"给出差异化回答
  4. 系统汇总所有回答,通过统计分析生成最终的调研报告

这种设计巧妙地利用了提示词工程,让每个虚拟用户都有自己的"思考模式",从而实现了回答的多样性和随机性。

 

网站打开的网页介绍部分|图片来源:AutoSurvey

 

 

04

从通用到垂直,

Agent 创业方向的变化

 

在使用智研 agent 的过程中,我突然有了一个洞察:

表面上看,它和那些 AI 陪伴产品很像——都在生成虚拟角色进行对话。但深入思考,两者的本质截然不同。

AI 陪伴追求的是情感连接的真实感,而智研 agent 追求的是决策依据的可靠性。前者让你感受到温暖,提供情绪价值;后者让你看清方向,创造工具价值。

这种差异让我意识到,当下 Agent 创业正在经历一个重要转变。

继 Manus 之后,整个行业都在追逐通用 Agent 的梦想——一个能处理所有任务的超级助理。但现实是残酷的,真正跑通的寥寥无几。为什么?因为"通用"本身就是一个悖论。当你试图解决所有问题时,往往一个问题都解决不好。

反观那些在垂直领域深耕的 Agent,却展现出了惊人的生命力。它们不追求无所不能,只专注于把一件事做到极致。

智研 agent 正是这种垂直化思路的典型代表——它只做用户调研,但把这件事的效率提升了百倍,成本降低了百倍。虽然虚拟用户的数据未必完全准确,但对于创业者来说,已经是一个极具价值的产品验证工具。

这个转变现象背后,似乎隐藏着一个更深层次的道理—— AI 时代的创新,不在于技术有多炫酷,而在于你能否找到一个真实的、高频的、用户痛点足够深的场景。

对于创业者而言,不要被「通用的宏大叙事迷惑,找到你最熟悉、最理解的垂直场景,带着属于你的 Know how,用 AI 把它做透。当你真正解决了一个具体问题,你就拥有了立足之地。

对于普通人来说,这种转变同样意义深远。它意味着 AI 不再是遥不可及的黑科技,而是可以在日常工作中真正帮到你的工具,借助 Vibe Coding,每个人都能将自己的独特问题转化为产品,每个人都可以成为「一人公司」。

今天是用户调研,明天可能是法律咨询、医疗诊断、教育辅导……每个领域都可能出现这样的垂直 Agent。

站在 2025 年的时间节点上回望,我们可能正处在一个关键的转折期:从追求 AI 的「大而全」,转向追求「小而美」;从技术驱动,转向场景驱动;从替代人类,转向增强人类。

智研 agent 或许只是一个开始。但它让我们看到了一种可能:当 AI 不再试图成为无所不能的神,而是甘愿做一个特定领域的专家时,它反而能创造出真正的价值。

这,可能才是 AI 创业的正确打开方式。

都用 GPT,为什么你没法中「百万大奖」?

作者|Moonshot

编辑|靖宇

 

9 月 8 日,美国弗吉尼亚州的卡丽·爱德华兹走进州彩票局领奖时,就跟去拿外卖一样平静。

她前几天买了一张彩票,中了 15 万美元(约 106 万元),她决定全部捐出,因为这张彩票,是她随口问 ChatGPT 要来的数字,没想到真中奖了,卡丽并不想贪图这种幸运的「偏财」,她已将奖金捐赠给不同的慈善机构。

 

ChatGPT 造就的幸运儿|图片来源:网络

 

但这则新闻也引发了广泛的关注: 难道 AI 还能预测彩票号码?

人类自古以来都对「预知未来」充满渴望:占星术、算命、预言家……在科学尚未成熟之时,这些就是「窥视未来」的大数据。

到了现代,「预测」这一行为,转向依赖数学、统计学、经济模型与机器学习。

而最擅长做这几件事儿的,不正是 AI 吗?到当下的 2025 年,AI 能不能做一次预言家?

 

01

AI 预言家

 

用 ChatGPT 买彩票只是段插曲,真正让业内震动的,是不久前刚结束的 Metaculus 预测杯。

这个平台被称作「互联网最强预言家集散地」,聚集了上万名全球顶尖的预测玩家、量化分析学家、数据科学家,每三个月进行一轮预测,奖金 5000 美元。

这个比赛里有经济走势、地缘政治、科技突破、甚至哪一年会发现外星生命这样的「硬菜」。

 

该网站预测的题目都很硬核|图片来源:Metaculus

 

前几年,就有 Metaculus 参赛者提前两周正确预测了俄罗斯与乌克兰战争的日期。

今年,一支初次参赛的团队 Mantic 靠纯 AI 模型直接冲进前十,拿下第八名,这也是第一次有 AI 在这种综合、开放性的预测赛里进入前十。

Mantic 这成绩把自家 CEO 都惊到了。参赛前,有选手预测「AI 最高分是人类最高分的 40%」,但这个预测失败了—— Mantic 达到了 80%

根据 Time 的报道,Mantic 完全没有真人操盘,只有算法,它的系统里融合了大模型、统计学以及历史预测数据。

它的数据来源包括结构化的专业数据(比如经济指标、贸易流量)和媒体报道、社媒情绪等「流动」着的信息。

 

Mantic 已经完成了 400 万美元的种子轮融资|图片来源:Mantic

 

而且 Mantic 还会不断修正预测,能根据最新的新闻、政策、市场变化,重新再「测算一波」。

反观人类选手,鲜有人能做到上知天文,下知地理,有快速、全面的信息捕捉能力,还能做到如此高频的修正,

而且人类预测者再敏锐,也得吃饭睡觉,还会被直觉、经验和情绪左右。但 AI 能 24 小时泡在数据库和互联网上。这种「24 小时都在自我迭代」的节奏,就是 AI 预测的杀手锏,9 年前 AlphaGo 战胜李世石时,用的也是这招。

何况预测未来,本质上就是和不确定性赛跑,AI 在这个赛道上的耐力和反应速度已经领先了人类一个身位。

除了 Mantic,AI 在预测未来的事儿上,已经攒了不少「战绩」。

拿医疗来说,谷歌的 DeepMind 开发的 AlphaFold 模型,已经能通过分析蛋白质折叠结构,预测出阿尔茨海默病或癌症的早期风险,还能更好地理解疾病机理、加速药物研发和诊断方法,能让潜在病人从「晚期就诊」提前到「早期预防」。

 

AlphaFold 被誉为对人类福祉最有贡献的 AI |图片来源:Veritasium

 

天气预报也是我们最常接触的「预测领域」,谷歌的 GraphCast 模型,已经在多个指标上都超过传统数值模型,能比传统方法提前数天更准确地预测台风路径。

金融市场早被 AI 渗透,机器学习已是量化基金的标配。各公司都开发了自家的封闭式模型,能在毫秒级别预测价格波动,虽然它们未必叫自己「AI」,但核心都是数据驱动下,对未来走势进行预判。

能源公司也都用上了 AI 模型,结合天气预报、卫星云图、历史发电数据和电网负载情况,来动态调度电能。

甚至连治安,都用上了 AI。在洛杉矶、芝加哥的部分警区曾试点使用了一种名叫「预测性警务」(Predictive Policing)的系统。

让 AI 通过分析历史犯罪数据、时间、地点、天气、甚至附近的大型活动,来预测某地点未来的犯罪概率,警方可以据预测部署警力。

看起来 AI 预测时代已经到来了?先别急着马上用 AI 去买彩票,AI

 

02

测不准原理?

 

AI 预言家能大显身手的领域有几个共通点: 边界相对清晰、数据充足、规律可循

像生物医学遵循严格的物理化学规律,金融和天气领域有海量的观测数据,这些领域历史数据多、连续、数据干净客观,同时规律性强,可及时获取反馈,让预测误差可以快速被观测、校正。

更重要的是,这些领域系统相对封闭、不易受「黑天鹅事件」(难以预测、突然发生,会引起连锁反应,并带来巨大负面影响的小概率事件)的影响,在这种的「可驯服」的环境里,AI 真的能领先人类。

 

黑天鹅事件成立的前提就是「难以被预测」|图片来源:维基百科

 

从技术角度看,「AI 预测」也并不神秘。

以 Mantic 为例,先是用大模型抓取全网信息,再用算法找出趋势,最后给出概率输出,并随信息动态更新。

听上去复杂,其实就是更勤奋、更高速的统计学 :把人类分析师几十年的工作压缩到几秒钟完成,核心还是统计学与机器学习的结合。

但模型再聪明,也活在训练数据的牢笼里,模型根基始终是「过去」。

而预测未来,本质上是用历史解释明天,当未来与过去的逻辑脱节,模型就会失灵。所以 AI 对从未发生过的突发事件无能为力,训练集之外的黑天鹅,它看不见也抓不住。

还记得 2020 年疫情初期,各类预测模型画出的曲线吗?从「下个月全球清零」到「半年内一半人口感染」,几乎没有一个完全准的。原因很简单: 人类行为的流动性和政策干预的复杂度,让模型无从下手

再比如 2016 年的美国总统大选,多数依赖大数据的模型都给希拉里大于 80% 的胜率。结果 AI 和民调分析师一起栽了跟头,因为当时特朗普的支持者大多不会公开发声,因此他们不产生数据,对 AI 来说就是「不存在」。

更微妙的是「反馈效应」:预测本身会改变未来。

比如模型说某支股票要涨,大众跟风买入,这时市场就发生了改变,原本的预测因此失效。

 

大数定律|图片来源:维基百科

 

至于用 AI 买彩票中奖这件事,就像经典的抛硬币问题,只要你抛的次数够多,总有一次硬币会刚好立在地上,它只是概率游戏中最极致的偶然。

归根结底,「预测未来」这个命题是带有哲学意味的:未来有确定性吗?历史是否可被映射?如果未来可以预测,那人类是否真的拥有自由意志?

物理学的边界也告诉我们,观测本身就会扰动结果,人类社会的边界则在于,预测本身就能改变未来。

人类社会充满了非理性、情感、文化和自由意志,其中的混沌与复杂性,是任何算法都难以穷尽的。

只要预测的对象是「人」 AI 就永远只能给出概率,而不是定论

ChatGPT 变身 App Store,「对话即应用」时代到了

作者|芯芯

编辑| 靖宇

 

在今天的科技叙事里,很少有一次更新,能像这次一样,让功能迭代听起来像「范式更替」,乃至权力迁移。

就在 10 月 6 日,OpenAI 正式宣布,Booking、Canva、Coursera、Expedia、Spotify 、Figama、Zillow 等应用在 ChatGPT 上线。

这意味着,用户在对话中可以直接订机票、设计海报、生成图表,甚至打开播放列表。所有这些操作,都在 ChatGPT 的聊天窗口里完成,不再需要切换网页或打开独立 App。

对开发者而言,这一切建立在名为 Model Context Protocol(MCP)的开放标准上,而对用户而言,ChatGPT 正在成为一个有生命、有动作的「AI 门户」。

这是会像当年 OpenAI 推出 GPT Store 那样雷声大雨点小,还是真能成为互联网应用入口权力重新洗牌的开始?

 

01

首批 App , 入驻 ChatGPT

 

回望互联网入口的更替史,几乎是一部效率进化史。门户网站如雅虎靠聚合内容,搜索引擎如谷歌、百度靠检索信息,移动操作系统 iOS、安卓靠承载应用,而超级 App 如微信则靠整合生活。每一次革新,都是为了让用户更直接、更自然地完成目的。

如果说过去二十年互联网的演化,是在不断寻找「用户与服务之间最短路径」的过程,那么这一次,OpenAI 似乎想彻底删掉那条路径。

目前,ChatGPT 首批可用的 App 包括 Booking.com、Canva、Coursera、Figma、Expedia、Spotify 和 Zillow。它们的集成版本已上线至非欧盟地区的 ChatGPT 用户端,覆盖 Free、Go、Plus 与 Pro 各版本。

 

可在对话中直接调用 Booking 预定| 图片来源:OpenAI

 

用户无需跳转网页、下载 App 或切换界面,只要在对话中直接呼叫应用——「Spotify,帮我做个派对歌单」、「Zillow,找找纽约的房子」——ChatGPT 就能在同一窗口中调用相关服务、展示交互界面,甚至完成支付或生成文件。

 

创建 Spotify 歌单|图片来源:OpenAI

 

ChatGPT 还会在对话内容相关时主动推荐应用。例如,当你在讨论买房时,ChatGPT 可能会自动推荐 Zillow 应用,让你直接在对话中通过交互式地图浏览符合预算的房源。

 

帮你挑选房源|图片来源:OpenAI

 

这种「自然语言 + 应用接口」的模式,意味着对话本身成为了操作系统。用户与应用之间的边界随之消融,地图、课程、幻灯片、酒店搜索,这些熟悉的操作场景被自然嵌入到对话语境中,让用户体验从「搜索信息」变成「执行意图」。

未来数月内,还会有 Uber、Target、Doordash、instacart、Tripadvisor 等 11 家陆续加入。

 

即将进入 ChatGPT 平台的 App 们|图片来源:OpenAI

 

OpenAI 官方称,开发者现在可以使用 Apps SDK(应用开发工具包)开始构建这些应用。

对于开发者而言,Apps SDK 的开放意味着一种新的「原生应用」形态。 这套工具基于 OpenAI 推出的 Model Context Protocol (MCP) 构建,支持开发者定义应用的交互逻辑与界面,并可直接与自身后端系统相连,实现用户登录、会员服务或内容分发

开发者现在可进入预览阶段,测试自定义应用,并通过 ChatGPT 的「开发者模式」模拟运行环境。OpenAI 已发布文档、设计规范与开源示例库,据悉在今年稍晚,平台将开放应用提交流程,并提供审核、上架与应用变现机制。

OpenAI 官方称,「这只是 ChatGPT 应用生态的开始,它为用户带来了新的实用性,也为开发人员带来了新的机会。」

如果发展顺利,一个真正的「AI 应用商店」就会成形

按照 OpenAI 的设想,开发者能构建功能模块,还能让自己的产品自然地出现在 超 7 亿 ChatGPT 用户的对话之中,在需求被表达的那一刻,出现在最合适的场景里。

这意味着,ChatGPT 不只是一个聊天窗口,而是一个操作系统级的服务层。它把应用变成「对话节点」,把交易变成「语言动作」,也让 OpenAI 有机会在这个生态里建立新的商业秩序:订阅分层、交易抽成、广告推荐。

它想重走 App Store 的老路,只不过这次,界面是对话。

 

02

AI 入口王座之争

 

问题来了,其他科技巨头也有 App,他们谁会愿意入驻 ChatGPT?

任何新的入口革命,都是权力再分配的开始。过去的门户控制流量,搜索引擎控制信息,移动应用商店则控制分发,那 AI 门户时代呢?

谷歌的处境很微妙。它的搜索入口正被 ChatGPT 蚕食,用户不再搜索,而是直接提问 。对于一个靠「搜索」定义存在的公司来说,加入 ChatGPT 无异于自我削权。

当下谷歌只能寄望于自家的 Gemini,以最高优先级整合 Gmail、Drive、Maps、YouTube 等应用,以确保用户的每个行为都在谷歌体系内完成。

Meta 的逻辑类似。它的护城河是社交关系链,AI 必须服务于这个闭环。 Meta 不会让用户在 ChatGPT 里完成预订或购物,而会让 WhatsApp、Instagram 内的 AI 助手去满足这些需求 ,从而继续把人留在自己的社交宇宙中。

其他科技巨头如微软、以及 Anthropic 等 AI 公司,同样在押注各自的 AI 助手。一场关于「AI 入口」的竞速,已经开打。

 

03

新入口的革命?

 

对用户和开发者来说,公平性问题估计也会浮现。当多个 App 能满足同一需求时,ChatGPT 如何决定调用谁?

ChatGPT 如果引入各种外部 App,本质上就是一个新的「应用商店」。如何给应用排序?是算法推荐、合作权重,还是广告投放?如果抽成, OpenAI 是否会像苹果当年一样,从每笔交易里分走 30%

目前 OpenAI 仅称,今年晚些时候,他们将会把应用功能扩展到 ChatGPT Business、Enterprise 与 Edu 版本,并开放应用提交入口,让开发者能在 ChatGPT 中发布自己的应用。届时,他们还将上线一个「专属目录」,用户可在其中浏览与搜索应用。

「符合开发者指南标准的应用将有资格被列入目录,而那些在设计与功能上表现卓越的应用将获得更高的推荐展示机会——无论是在目录中,还是在对话场景里。」OpenAI 称。

此外,OpenAI 称接下来将「很快」公布更多关于变现机制的细节,包括对 Agentic Commerce Protocol(代理式商务协议)的支持,这是一项开放标准,允许用户在 ChatGPT 内实现即时结账。

 

代理式商务协议框架|图片来源:OpenAI

 

另外在数据与隐私方面,一个能调用 Booking、Spotify 等应用的 AI,无疑能进一步掌握用户生活的「全息副本」。如果 ChatGPT 拥有这些数据,其潜力显然比以往的任何单一应用更大。

OpenAI 官方称,开发者必须提供清晰透明的隐私政策,只能收集其运行所需的最少数据,并在权限使用上保持公开透明。

当用户首次连接某个应用时,ChatGPT 会主动提示他们进行授权,以便用户了解哪些数据可能会与开发者共享。据悉,今年晚些时候,OpenAI 将推出更细化的控制选项,让用户能够自行决定每个应用可以使用哪些具体数据类别。

近几年各国监管在这方面越来越敏感,尤其是欧盟。OpenAI 甚至在初期阶段主动排除了欧盟用户,明显是为了规避潜在合规风险。在数据合规、反垄断和消费者保护的各种约束下,AI 入口未来预计又会成为监管者的靶子,一旦有什么问题就容易获得巨额罚款。

当然,谈监管还很远,博弈的另一面,更重要的是新价值链的诞生。对开发者而言, ChatGPT 代表一个新的应用「发现机制」,就是一个无需下载的世界级分发平台,这有可能成为新机会

 

对话即应用|图片来源:X

 

对 OpenAI 而言,这一步看似是一次应用集成,实则是对整个互联网分发体系的重构。

回看互联网三十年,从门户、搜索到移动,每一次入口更替都带来了新的产业秩序,门户网站改变了信息的组织方式,搜索引擎改变了知识的获取方式,移动商店改变了应用的分发方式,而如今, OpenAI 正试图改变「服务的到达方式」。用户不再需要「找」什么,他们只需要「说」什么,AI 成了新的中介层

接下来,AI 助手是否会成为主导入口,当然还取决于用户规模、生态信任、监管政策与竞争格局等等变量。OpenAI 拥有的是先发优势,包括超八亿活跃用户,大量开发者的关注。但谷歌、Meta、苹果等科技巨头显然都不会轻易让出「入口」这块权力之地。

而且,并不是所有 App 都能被对话驱动。比如一个游戏应用,仍然需要完整的界面、输入与实时反馈。对这类应用而言,ChatGPT 要如何在对话中承载它们的复杂交互?

不过,至少这场博弈,或许有机会像当年的浏览器之战、移动操作系统之战一样,打开我们的想象空间。

「丐中丐」版特斯拉来了,Model 3/Y降价超3.5万元

更「亲民」的特斯拉,终于来了。

10月7日,特斯拉在美国推出了 Model Y 的精简版,称为 Standard,并出人意料地宣布了 Model 3 Standard。你可以把它们理解为「青春版」或「入门版」,核心目的非常直接,降低价格,让更多人买得起。目前,特斯拉中国官网尚未推出类似车型。

价格有多吸引人呢?新款Model 3的起售价为36,990美元(约合26.34万元),比之前便宜了5000美元(约3.56万元);新款Model Y起售价为39,990美元(约合28.47万元),便宜了5500美元。这个优惠幅度,就好像你买车时,特斯拉直接送了你好几部最新款的iPhone。

这也印证了之前的消息。前不久,特斯拉在德国工厂的经理就透露,一款更精简的Model Y会便宜大约10%。

此外,特斯拉还调整了车型的命名体系。现在标准车型占据了入门级,以前我们熟悉的「长续航版」(Long Range),现在改名叫「Premium」,再往上就是Performance 版。

特斯拉为什么要推出这两款更亲民的车型?将会给汽车市场带来怎样的变化?

「丐中丐」,砍掉了什么?

那么,为了降价,特斯拉到底「砍」掉了什么?

先从Model Y 标准版本来看,外观上,新款取消了之前贯穿车头车尾的酷炫灯带,把所有照明都塞进了两个更小巧的大灯里,看起来更简洁,也更省成本。轮毂标配了更小的18英寸,车漆颜色也做了精简,只提供黑、白、灰三种,其中只有灰色是免费的,想选别的颜色?那就得加钱了。

接着是内饰,也就是「里子」的变化,这里的调整更大。座椅不再是全素皮革,而是改成了「皮革+织物」的拼接材质,坐着依然舒服,但成本下来了。前排座椅的通风和后排座椅的加热功能被取消了,方向盘也从电动调节改成了手动。后排那个很有科技感的8英寸小触摸屏也不见了,换成了最基本的手动空调出风口。

一个最显著的变化是头顶那块标志性的全景玻璃天窗。标准版Model Y告别了那块从前排一直延伸至后方的全景玻璃天窗,回归到覆盖了传统内衬与隔音材料的金属车顶

这次看似「简配」的操作,却也构成了一次体验上的「增配」。长期以来,特斯拉的全景天窗因其隔热效果不佳而备受诟病,尤其在夏季,强烈的阳光直射使得车内温度飙升,「头顶暖烘烘」成为槽点。为此,很多车主都额外花费数百元购买遮阳帘作为「补丁」。

然后是动力和续航,也就是「骨子」里的变化。它采用了单个电机驱动后轮,马力降到了300匹,百公里加速慢了一些,变成了6.8秒。电池容量也稍微减少了大约10%,续航里程相应缩短到321英里(约516公里)。同时,超级充电桩的最高充电速度也稍微降低了一点。

标准版本的辅助驾驶,功能也有删减 | 图片来源:特斯拉美国官网

最后,在自动驾驶方面,标准版只能使用最基础的「自适应巡航」,也就是能自动跟车,但无法实现「自动辅助转向」等Autopilot功能,更不用说完全自动驾驶(FSD)了

相比之下,新款 Model 3 标准版的变化没有那么大。它在外观上和更贵的版本差别不大,同样换上了织物拼接座椅,取消了后排屏幕,改用手动调节的方向盘,并且也重新用上了传统的转向灯拨杆。电池和充电规格也和Model Y标准版看齐。但有一个关键区别:Model 3标准版保留了那块从车内可见的玻璃车顶。

总体来看,特斯拉这次砍掉「锦上添花」的豪华和舒适性配置,保留「不可或缺」的科技体验。 它通过在内外饰、部分性能和软件功能上做「减法」,把价格打到了一个更具诱惑力的水平。

特斯拉为何必须「自降身价」?

特斯拉为什么在这个时候,推出「青春版」车型?

首先,我们来看看眼前的「小麻烦」。特斯拉最近公布的销量确实漂亮,创了历史新高,就像考了个年级第一。刚刚过去的2025年第三季度,特斯拉交付了超过49.7万辆车,创下了历史新高!

但这次高分很大程度上是靠着一波「限时大折扣」冲上来的——一项重要的政府补贴(最高能省7500美元)9 月 30 日到期,很多人为了抓住最后的优惠,提前下了单。派对总会结束,折扣没了,市场自然要回归冷静。

比较意外的是,这次特斯拉也推出了Model 3标准版 | 图片来源:特斯拉美国官网

同时,在欧洲和中国这两个重要市场,特斯拉的销量已经面临压力,尤其在中国,像小米SU7和YU7、理想L6这些「同学」表现非常抢眼,抢走了不少关注度和订单。

再有,可能要从特斯拉为马斯克提出的万亿美元薪酬计划说起。这个计划为马斯克设定了一系列「几乎不可能完成」的任务,其中一个关键目标,就是要求特斯拉在未来十年内,再卖掉1200万辆车。

想想看,特斯拉花了近二十年才累计交付了约800万辆,这意味着未来十年内再卖出1200万辆。要实现这个目标,光靠现有的几款中高端车型是远远不够的,必须要有能大规模走量的「亲民车型」来冲锋陷阵。

种种原因之下,「青春版」的推出,就成了一步必然的棋。

20 万以下的特斯拉?

特斯拉这次推出了更便宜的「青春版」Model 3和Model Y。很多人觉得这只是简单的降价,但在我看来,这可没那么简单。这意味着特斯拉不只想做「科技潮牌」,它要成为像丰田、大众一样,走进千家万户的「国民品牌」。

以前,大家聊特斯拉,总会拿它和宝马、奔驰这些豪华品牌比。但这次,特斯拉的入门版价格降到了3万多美元的区间,情况就完全变了。它在美国的对手不再是豪华车,而是丰田凯美瑞、本田雅阁等等。

入门版Model 3的内饰 | 图片来源:特斯拉美国官网

虽然特斯拉中国尚未推出标准版,但也只是时间问题。

新款Model 3和Model Y在美国的起售价分别为约26.34万元和28.47万元,这肯定不是它们在中国的最终售价。

考虑到特斯拉上海超级工厂的成本控制能力,还有中国更低的供应链成本,这两款车型的国产版价格有很大的想象空间:

目前国产Model 3起售价为23.55万元。如果推出配置更低的入门版,价格极有可能下探到20万元左右。这是一个极其重要的心理价位,一旦产品价格进入20万元以内,潜在的用户群体相当大。

目前国产Model Y起售价为26.35万元。入门版的推出,很可能使其价格进入23万元区间

然而,特斯拉这两款入门级车型,会再次成为爆款吗?答案可能没有那么简单。

确实,特斯拉入门款价格的下调会吸引那些对价格敏感的用户,不过随着它的出招,国产厂商肯定不会坐以待毙,而是会立马采取应对措施,在保持配置、空间优势的同时,保持价格优势。

同时,如今的中国市场早已不是几年前的模样。国内友商早已将「冰箱、彩电、大沙发」玩得出神入化,并在空间、舒适性、智能化功能上「卷」出新高度,这两款「丐中丐」版的特斯拉,还能否仅凭品牌光环,就轻松俘获用户的心?

当用户手里拿着20万预算,面对的是一辆配置精简的特斯拉,和一辆空间更大、内饰更豪华、功能更丰富的国产新势力车型时,他们会如何选择?这将是市场留给特斯拉最大的悬念和挑战。

高德扫街榜的 23 天奇袭

作者|言菲

编辑|郑玄

这个国庆假期,高德成了很多人「最先打开、最后才关掉」的那一个 App。

极客公园获悉,高德在十一长假第一天日活破 3.6 亿,创历史新高;「高德扫街榜」上线仅 23 天就积累了 4 亿用户。

根据 Quest Mobile 数据,高德 App 的月活用户 8.9 亿,这意味着「扫街榜」的用户渗透率接近 50%。换句话说,有一半用户打开高德地图后都使用了「扫街榜」。

在社交媒体上,极客公园同样观察到:高德成为了许多消费者国庆期间打开频次最高的 App。用户不仅用高德地图导航,还打开「高德扫街榜」寻找本地人常去的烟火小店、规划 citywalk 路线,甚至发掘钓鱼点。

这种变化意味着,「高德扫街榜」将用户的习惯从「物理路径」延伸到了「生活路径」;高德也从「带你去目的地」进化到了「帮你决定去哪里」。

用户对高德的认知,正在从出行必备的地图导航工具,逐步变成生活服务超级入口,转向「去哪吃、去哪玩、怎么去」的全新入口。

01

堵车带娃遛狗,

高德变成了国庆出行的万能搭子?

 

黄金周前一天,看着高德公布的「今晚零点十大最繁忙高速」,常台高速苏州段的车速被堵到每小时 7 公里,一位网友忍不住吐槽:「这比散步还慢啊!」

最后如果实在要开车,他觉得最好遵照高德的提醒,等凌晨 4 点再出发,再提前用高德「未来用时」功能规划路线,「不然可能真要在高速上遛娃打麻将了!」

这种「堵车又堵心」的焦虑,其实只是国庆出行的诸多焦虑中最普遍的一种而已。对很多人来说,真正的挑战不是到达目的地,而是如何在旅行的各种细碎环节里,用最省心的方式维持秩序感和效率感。

刷社交媒体,我发现很多网友选择高德做国庆出行的「万能搭子」,靠高德解决了各种意想不到的麻烦事。

比如,我在网上看到一则有趣的分享。一位北京的宝妈在社交媒体上抱怨:「光是确定遛娃目的地就已经花去我大部分力气,还得预约,安排吃喝,遇到景点孩子问我个一二三,我还得现查现学现卖……真够忙的。」

她干脆打开高德直接问「小高老师」如何安排遛娃路线。看着满意的游玩路线,她幽默地评论:「啧啧啧,小高老师北京通啊。」最后到了美术馆,她甚至让「小高老师」给孩子讲解景点知识,彻底解放了家长的补课焦虑。

不仅如此,在一些更小众、更碎片的需求上,高德同样非常能接得住活儿。

有网友国庆带狗出行,打车最担心被拒载,在高德不仅专门叫到宠物友好车辆,司机还一路和她聊怎么给狗狗梳毛。

还有网友在北京转机只有半天时间,打开高德扫街榜的「附近好店」搜罗,下飞机就直奔一家小店,点了双倍糖油饼配咸豆腐脑,匆匆路过也能吃得满足。

甚至自驾去西北的车主,发现车机地图显示途经服务区没有充电桩。正发愁时,他翻开高德的评论区,才知道热心网友已经更新了新装的快充桩信息,直接帮他打消了续航焦虑。

从带娃到带宠,从堵车到找充电桩,高德似乎变成了国庆出门在外的「全能搭子」,接住了那些旅途中意想不到的真实需求。

02

你可能会忘记打高分,

但不会忘记导航去再吃一次

 

国庆出门,还有一个绕不开的难题——找餐馆。

各类榜单上的 4.8 分餐厅让人心动,但又害怕商家是「榜单运营高手」。于是,社交媒体上流行起了反向攻略:想吃美食就选评分 4.8 以下的。一旦信任被削弱,榜单本身也失去了意义。

实际上,打击虚假评论一直是本地生活平台的一大难题,难以杜绝「送块甜品就能换条五星好评」的作弊行为。即便有真实评价,也常被少数两极分化的声音主导,无法反映大多数用户的真实选择。

问题的根源在于:过去的榜单体系过度依赖「显性的声音」,而忽略了「沉默的大多数」。

根据互联网平台的 90/9/1 法则,90% 的用户只消费不发声,9% 会偶尔参与讨论,只有 1% 会主动产出内容。而线下消费同样如此:大多数人吃完就走,很少上网留下评价。但恰恰是这 90% 的沉默用户,决定了一家店的真实命运。

某种程度上,谁能破解「沉默的大多数」,谁就能更全面地反映一家餐厅的真实口碑。

高德作为一个 10 亿级的国民级 App,在捕捉这些沉默用户的真实行为上具备天然优势。「高德扫街榜」的评分逻辑,不再只看打分和评论,而是把用户的真实行为本身纳入评价体系——让用户「用脚投票」。导航到店、搜索餐厅、反复光顾,这些无声却真实的行为都会被加权计入评分。

换句话说,你可能会忘记给爱吃的小店打高分,但不会忘记导航去再吃一次。

作为全球首个基于真实到店行为的榜单,「高德扫街榜」也让消费者和商家在国庆期间都感受到了它的真实价值。

对商家而言,「扫街榜」意味着更加公平的流量分配,让更多用心本分经营的小店被看见。过去,一些口碑极佳但缺乏营销资源的烟火小店,往往在榜单评价中处于劣势。而在「扫街榜」中,它们凭借真实的到店和复购行为而上榜,被推荐给更多用户。

高德数据显示,国庆期间,上榜「烟火小店」的门店流量增长了 300%。

成都味鲜牛腩中餐馆就是一个典型例子。这家开在街边的社区店,装修简朴,是典型的老川菜馆,样貌与时髦的网红店绝缘。门口还有一棵大树遮住了招牌,如果不是特别留意,很容易错过。

这家店在网上的评价不多,偶尔有游客替店家打抱不平:「每一次来成都旅游都会来吃,一共吃了 4 次。不知道为啥人不多,明明比排队的店好吃多了。」

这家店登上「扫街榜锦江区吃牛肉榜 TOP23」后,很多人特意跑来尝一尝,「才知道味道那么巴适」。

店主小颖松弛地说,「我比较佛系,没有啥子营销。平时就是卖点儿周边邻居,更多人觉得好吃,再来就对了。看到高德扫街榜的评分那么高,还觉得挺高兴的。」

还有一家成都杨氏小仙女儿蹄花,以前大多数客人都是熟客,上了「扫街榜」之后,通过高德导航来的新客居多。店主小卢笑称:「国庆期间生意爆了,上半场已经满了,下半场还是忙得不行。」

在节日高峰的烟火里,这种真实口碑的传递,比任何花哨的宣传都来得珍贵。「高德扫街榜」,不只是榜单,更像是一张国庆期间的城市生活地图,让游客和本地人都能找到那些被时间和人情浸润过的好店。

03

高德的下一场进化:

从导航转向生活服务超级入口

 

9 月 10 日上线的「高德扫街榜」,从一开始就带着实验性质:高德能否在本地生活服务竞争激烈的市场里,找到一条不一样的路径?而国庆黄金周给了它最快、最现实的一次考验。

从结果来看,高德不仅顺利通过了这场大考,还在短短一个月内完成了一次战略性的转身。

地图作为现实世界的数字投影,天然承载了人们所有的出行与消费决策。而长期以来,国内地图产品对这种潜力的挖掘仍停留在浅层,更多扮演的是路标的角色。

但实际上,用户从打开地图开始,就已经在进行各种生活决策。导航只是用户通往门外世界的「第一步操作」。

高德想做的,是将导航第一步与之后的生活每一步打通。这种转变,并不是新增一个功能,而是重塑了用户的使用心智——高德不再只是「帮你去哪里」的路标,而是「帮你决定去哪里」的生活伙伴。

而高德具备转向「生活服务超级入口」的潜力,这背后依托的是其长期积累的 10 亿级用户行为数据,以及庞大的生活服务数据网络。迄今为止,高德地图已经覆盖了全国超过 700 万个餐厅点位,目前每天有 1.2 亿次生活服务相关搜索,用户每天导航前往 1300 万个生活服务目的地。

在此基础上,AI 能力则成为了高德向「生活服务超级入口」转型的加速器。今年 8 月,高德宣布全面 AI 化,从单一的地图导航工具升级为「出行生活智能体」,具备深度时空理解与自主推理决策的能力。

此次黄金周,高德成为许多用户最频繁使用的 App,也与其强大的 AI 能力密不可分。高德战报显示,10 月 1 日,全球首个基于地图的 AI 原生智能体「小高老师」调用量突破 26 亿次;「小高老师」当天推荐餐厅、景点、加油站等生活服务类点位超 9200 万个。

用户的行为释放出一个信号:高德未来承载的不仅是「怎么去」的地图问题,而是整套生活方式的规划和践行。

这意味着,从出行到消费,从餐饮到娱乐,甚至联结阿里生态中的支付、零售、电商等环节,高德都可能成为流量的一级入口。借助向「生活服务超级入口」的突破,高德有潜力成为阿里到店业务的一个战略支点。

也就是说,国庆黄金周的 26 亿次 AI 调用和 9200 万个生活服务推荐只是一次集中演示:地图的边界,正在延伸至真实生活中那些无形的轨迹里。

高德的下一场进化,才刚刚开始。

张一鸣近年来首次公开亮相;微软上海开始新一轮裁员,补偿N+4;罗永浩锐评 iPhone 17

高通公司涉嫌违反反垄断法,市场监管总局依法决定立案调查

10 月 10 日消息,国家市场监督管理总局今日宣布,因高通公司收购 Autotalks 公司未依法申报经营者集中,涉嫌违反《中华人民共和国反垄断法》,市场监管总局依法对高通公司开展立案调查。

对此,前魅族科技 CMO 兼公司高级副总裁李楠评论称:当年高通对压根没有使用他们芯片的魅族瞎收费的时候,其实就已经是垄断并且违法了。当年所有媒体,一些不明真相的用户,甚至一些法律界内部人士都说是我们错了的时候。。。其实我就非常明确的知道,作恶的是高通,不是魅族。是有些人膝盖太软,加上时候未到。但是的确,我力主和高通打 36 个月的官司的意见没有实现,我无话可说。欣慰的是,最终历史证明,公正虽迟但到。(来源:IT 之家)

字节跳动创始人张一鸣近年首次公开亮相

上海徐汇知春创新中心 10 月 9 日正式开业,该创新中心由字节跳动创始人张一鸣、上海交通大学 ACM 班创始人俞勇教授共同发起。作为民办非营利性机构,中心计划招聘对泛计算机和人工智能感兴趣的年轻人。

本次开业,字节跳动创始人张一鸣近年首次公开亮相,他提到,自己长期关注人才招聘和培养,注意到很多人才潜力没有被充分挖掘,他以机器学习模型中的过拟合(Overfit)现象作为类比,有的人才可能专业知识扎实,也有高精准的技能,但面对创新任务就不行了。(来源:IT 之家)

 

英特尔重新思考开源战略,高管称需要找到优势平衡点

据科技媒体 The Register 报道,英特尔数据中心业务负责人 Kevork Kechichian 上周现身亚利桑那州,出席 Tech Tour 活动并谈及公司的开源战略。

Kevork Kechichian 称公司正在重新思考开源战略,他在开幕演讲中表示:「从基础设施角度看,我们拥有整个开源领域中最大的影响力,我们需要找到平衡点让这种影响力转化为英特尔的优势,而不是让其他人利用我们的成果跑在前面」。

不过这名负责人随后在接受《The Register》采访时做出解释,称英特尔的意图并不是远离开源,他清楚很多人从英特尔的巨大投资中受益。

英特尔发言人对此作出了进一步澄清:「英特尔仍深度致力于开源,我们正在思考怎么作出贡献、在哪些平台作出贡献,确保我们的努力能凸显英特尔独特的优势,益于我们几十年来所支持的社区」。(来源:IT 之家)

 

消息称微软上海新一轮裁员补偿 N+4,可调动到澳大利亚

10 月 10 日消息,据凤凰网科技报道,位于上海微软的部分团队员工今日收到了标题为「Important Business Update」(重要业务调整)的邮件,有员工表示,此信息意为将对员工进行优化调整。
报道提到,这次波及范围主要是微软 Azure 云业务团队,但跟 7 月裁员时的最高 N+7 补偿方案略有不同,「目前只有 N+4,没有额外签字费,还在跟 HR 确认中。」据部分员工透露,此前还提供了 relocate 到澳大利亚的选项,如不接受则被裁员。

Windows Report 于 10 月 7 日报道称,微软公司正在进行大规模战略重组,自 2025 年 5 月以来,该公司已裁员超过 1.5 万人,主要波及 Azure 云、全球销售及工程等核心部门。

针对此次大规模裁员,微软发言人回应称:「组织和人力的变更是我们管理业务过程中必要且常规的一部分。我们将继续优先考虑并投资于未来的战略性增长领域,以支持我们的客户和合作伙伴。」(来源:IT 之家)

 

苹果升级安全漏洞赏金计划,最高奖金翻倍至 200 万美元

10 月 10 日消息,苹果在官网「安全研究」板块发布新博客,宣布对安全漏洞赏金计划进行重大升级,引入「终点旗」系统,让研究人员能客观展示漏洞利用成果,赚取更丰厚的奖励,新计划将于今年 11 月开始生效。

苹果表示,本次革新将提供「业内最丰厚的奖金」,对能达到「雇佣级间谍软件攻击」的复杂漏洞利用链提供翻倍的 200 万美元(现汇率约合 1426.3 万元人民币)奖金;针对锁定模式漏洞及测试版软件漏洞提供叠加奖金,最高可超 500 万美元(现汇率约合 3565.7 万元人民币)。

苹果还表示,自 2020 年以后就没有人报告过完整的 Gatekeeper 漏洞,因此他们决定将对首次成功实现无需交互的完整绕过漏洞提供 10 万美元(现汇率约合 71.3 万元人民币)奖励;同时将从 10 月 31 日起向民间安全组织赠送 1000 部安全研究版 iPhone 17,更好地防范间谍软件攻击。(来源:IT 之家)

OpenAI 宣布 GPT-5 成为迄今「偏见最少」的 AI 模型

据 OpenAI 最新研究成果,该公司发布的 GPT-5 模型在政治偏见方面明显低于以往所有同类产品。此项研究由 OpenAI 团队披露给 Axios。根据 OpenAI 研究人员的新发现,无论在「即时模式」还是「思考模式」下,GPT-5 的偏见水平相比先前产品下降了 30%。

研究报告称:「我们的模型在中性或略微倾向性的提问下表现接近客观,在应对具有挑战性、情绪化的提问时,仅表现出适度偏见。」

OpenAI 方面表示,未来将持续公开相关评测结果,以方便业界交流并自我监督。公司计划在未来数月对偏见测试结果进行更完整发布。(来源:cnBeta)

 

极氪 CBO 关海涛宣布离职:感恩这个时代,希望大家继续支持极氪、支持吉利

 10 月 10 日午间,针对外界传闻,极氪科技集团 CBO(首席商务官)关海涛在朋友圈发文宣布即将离职。

他在朋友圈里发文称,「人生天地,过隙白驹。一起奋斗的日子是最难忘的,能经历极氪高速发展、登顶、IPO,再到极氪科技成立、回归吉利,也是职场生涯中最珍贵的荣幸。感谢大家关心,即将结束杭漂,感谢所有一起奋斗的战友、朋友,感恩这个时代,日子绵长,情谊不散。青山绿水,江湖再见。希望大家继续支持极氪、支持吉利。」

随后,浙江吉利控股集团高级副总裁杨学良在这条朋友圈内容下评论:「感谢海涛为极氪发展做出的突出贡献,很高兴与你共事,怀念一起战斗的日子,祝未来一切都好,常回来看看!」(来源:IT 之家)

 

里程碑时刻,微信鸿蒙版 App 安装量突破 2000 万

10 月 10 日消息,微信鸿蒙版 App 安装量正式突破 2000 万次。在此之前,其安装量在 7 月 27 日突破 1000 万,9 月 11 日突破 1500 万,9 月 28 日突破 1800 万。(来源:IT 之家)

 

苹果即将达成收购计算机视觉公司 Prompt AI 的协议

美东时间 10 月 10 日,CNBC 报道称, 苹果公司即将达成收购计算机视觉公司 Prompt AI 的协议。消息公布后,苹果股价短线拉升至平盘,此前一度跌超 1%。(来源:富途牛牛)

消息称苹果 2026 年推 Health+订阅服务:AI 医生成最大看点

彭博社 10 月 10 日发布博文,报道称苹果为进一步拓展健康生态系统商业版图,计划于 2026 年推出名为 Health+ 的全新健康订阅服务。

Health+ 将提供一系列强大的付费功能,其中一个亮点是人工智能驱动的「AI 医生」,可以提供健康建议、精准的食物与卡路里追踪、以及专业的健康教育视频课程,推动现有的健康应用从一个数据记录工具升级为个性化的健康管理平台。

Health+ 的商业模式将是典型的增值订阅服务,用户需要付费解锁高级功能,并极有可能被整合进 Apple One 订阅捆绑包中。目前尚不清楚具体定价,不过作为参考,市场上同类服务每年收取 40 至 100 美元不等的费用。(来源:IT 之家)

 

苹果 2025~2026 年 Mac 路线图曝光:M5 芯片年底首秀,M6 蓄势待发

科技媒体 Appleinsider 昨日(10 月 10 日)发布博文,报道称通过深入挖掘 macOS 26 Tahoe 系统的开发和硬件测试文件,发现了苹果在 2025~2026 年的 Mac 产品发布时间线。

根据挖掘的代码信息,苹果将会在 2025 年年底推出首款 M5 芯片设备,内部代号为 J704,据信为基础款 M5 MacBook Pro,苹果正使用 macOS Tahoe 的特定硬件测试版本(26.0.2)对该型号进行测试。

基于相关线索,苹果将迎来一轮更为密集的产品更新。首先在 2026 年初,代号为 J813 和 J815 的 M5 MacBook Air 将登场,继续提供 13 英寸和 15 英寸两种尺寸,预计搭载 macOS 26.2 系统。

据悉,苹果正酝酿重磅更新 MacBook Pro 产品线,计划推出搭载 M6 Pro(代号 K114)和 M6 Max(代号 K116)芯片的新款 MacBook Pro,不仅采用更纤薄的机身,还将首次配备 OLED 显示屏。(来源:IT 之家)

罗永浩锐评 iPhone 17 Pro Max:工业设计二流 拼接设计真难看

在最新一期播客中,罗永浩邀请到了影视飓风 Tim。在播客录制现场,Tim 突然送给罗永浩一台 iPhone 17 Pro Max 2TB,Tim 请罗永浩锐评一下这台手机。

罗永浩说,他现在不敢骂苹果手机,骂的话别人又说我自己手机都干黄了,我想骂的时候希望我自己没做过手机。

对于 iPhone 17 Pro Max,罗永浩指出,这款手机的工业设计肯定是二流的,拼接设计真难看,比图片都难看,还有相机按键我特别讨厌,确实没什么用,而且它带来另外一个问题,套上手机壳之后,相机按键的开孔让人膈应。

总而言之,iPhone 17 系列这一代反正是越做越难看,我要拍摄一部爽片,乔布斯推开棺材,把这帮人全开除掉。(来源:快科技)

 

和两位 CEO 聊 Sora: 应用层爆发的里程碑事件,创业者的机会来了

99% 的人都搞错了。

「Sora不是『AI 版抖音』,它更接近『AI 版ins或朋友圈』。」这是Lovart创始人陈冕,在与极客公园创始人&总裁张鹏、Sand.ai创始人曹越对话中的核心观点。

就在所有人享受十一假期的第一天,OpenAI 发布了新一代文生视频大模型Sora 2,以及配套应用Sora App。一瞬间,全球科技圈被彻底点燃。Sora App在严格的邀请制下,仍火速冲上美区下载榜第三。

然而,喧嚣之下,争议也随之而来:这会是 AI 时代的 TikTok,一个超级应用的诞生?还是又一个「现象级」的烟火,绚烂一瞬,便迅速冷却?

在与张鹏的对话中,陈冕和曹越给出了清晰的判断。陈冕认为,Sora是继抖音和ChatGPT之后,又一个里程碑式的产品,它真正开启了AI的ToC应用时代。其核心突破在于,OpenAI展现了「为产品打造模型,而不是为模型寻找产品」的思路。Sora通过Cameo等功能,巧妙地解决了「AI+社交」的难题,将重点放在熟人关系的「低成本Remix」共创上,而非单纯追求视频质量。这意味着,定义应用与产品的能力,其重要性正变得与构建模型同样重要。

从技术视角,曹越则表示,Sora在音画同步、人物ID保持和多镜头叙事上的突破,正是为了跨越C端消费门槛而做的关键优化。这些优化与产品定义相结合,爆发出了强大的力量。

Sora的出现,也让两位创始人重新审视AI应用的终极方向。他们一致认为,AI时代最大的机会在于「AI原生」。

如何定义AI原生呢?「你就想,没有AI,这个业务或内容还存不存在?如果不存在,它就是AI原生的。」陈冕解释道。他认为,对于创业者来说,AI应用的时代才刚刚开始,但不要想着去做AI版微信,因为创业公司做通用社交几乎不可能成功。真正的机会在于,将最好的产品创意和最好的模型进行整合。

这场变革也带来了更激烈的竞争。陈冕认为,AI时代的发展速度远超以往,人才、算力、资本都在向头部集中,导致竞争被前置。这是一个「Go Big or Go Home」的时代:平庸的改良者注定出局。对于创业者来说,这既是最好的时代,也是最卷的时代。

在这场风暴的中心,两位创始人对未来都清晰而坚定。陈冕表示,Lovart将激进地探索ToC的AI原生应用。曹越则透露,Sand.ai将在国庆后推出全新的音画同出模型,直面挑战。

只有那些敢于将顶尖产品创意与模型深度整合、并全身心投入于创造全新体验的玩家,才能最终定义下一个时代。

以下为陈冕、曹越与张鹏对话内容实录,有编辑删减。

01 解构Sora:「AI原生超级APP」的雏形

张鹏: 看大家兴奋又略带疲惫的样子,想必是熬夜玩Sora了。你们是连夜守着发布,还是第二天一早才发现世界变了?先请两位聊聊体验Sora的第一感受吧?

陈冕: 我是连夜看的,发布会是凌晨1点。看完我马上就去弄美区账号,结果被苹果的安全延迟卡了一个小时,急得不行,大概3点左右才拿到邀请码。

坦诚讲,我本来期待没那么高,但用完之后我感到非常震撼。我是一个产品经理出身,最近十年里,能让我感到震撼的时刻只有三次:第一次是2016、17年玩抖音,第二次是2022年底玩ChatGPT,第三次就是这次的Sora。

我觉得ChatGPT开启了以模型为中心的时代,而Sora则开启了一个应用的时代,尤其是一个ToC应用的时代,这是里程碑式的。

我从凌晨3点玩到早上7点,实在扛不住睡了三小时,10点起来接着玩,然后就开始拉着团队开会。所以到现在我都是亢奋状态,对未来即将发生的事感到非常兴奋。

曹越: 我是早上醒来看到各种群里都炸了。我的感受是,从效果上来说,它非常令人兴奋,而且是一个为产品优化得非常完整的模型。但从模型本身的技术视角看,效果虽好,却没那么令人意外。因为包括我们自己在内,过去几个月也一直在探索视频和声音同步生成的能力。现在大家玩的很多梗,我们内部在早期模型上已经玩过一遍了。所以,这种感受更像是我们内部的兴奋点被释放到了外部。

张鹏:从技术角度看,Sora 2的核心进步在哪里?

曹越: 我觉得有三点:第一,当一个视频模型能同时做到画面和声音同出时,它就越过了C端消费的临界点。过去一年的视频模型大多只能生成无声的GIF式画面。

第二,它能保持人物ID,也就是Cameo功能。这个ID同时包含了样貌和音色。之前有些模型能保留长相,但Sora能同时锁定样貌和音色,这让它的可消费性和传播性大大增强。

第三点,也是很多人可能没注意到的,它生成的10秒视频带有叙事属性。它不再是单一的片段,而是包含了运镜、多镜头切换(我最多看到切了8个镜头)和景别设计。这是一种以前没有展现过的能力。

当这三点结合在一起,就爆发出了强大的力量。

张鹏: Sora的邀请机制很聪明,形成了病毒式传播。陈冕你作为产品经理,抛开技术,单看这个产品,有什么值得圈点的创新吗?

陈冕:这是我第一次看到一个AI原生超级APP的雏形。

首先,OpenAI这次想得非常清楚:它在为产品打造模型,而不是为模型找产品。这表明它不只想做一家模型公司,更想做一家消费互联网产品公司,野心昭然若揭。模型可以被快速追赶,但一个成功的产品,其用户和网络效应是很难在一个月内被颠覆的。

其次,它解决了「AI+社交」这个大命题。最大的ToC应用就是社交,而Sora的Cameo功能就是答案。为什么大家都在和Sam Altman或者自己的朋友合拍?因为社交的乐趣建立在熟人关系之上,而不是视频质量本身有多高。你朋友圈的照片质量就一定很高吗?不是,但因为是你熟悉的人,所以感觉不一样。这也解释了为什么邀请码机制能如此成功,它天然就适合基于社交关系进行裂变传播。

最后,它用一种极其简单的方式解决了「共创」的问题。AI降低了创作门槛,而Sora的左右滑动交互,本质上就是一种低成本的Remix。你在别人的视频上进行再创作,这种交互方式简单到了极致——就是滑动和点击,这是顶级移动互联网产品的共性。

所以你能理解我有多兴奋。作为一个产品经理,这些问题我想了一年多,现在有人把答案做出来了,就放在我面前,这太酷了。后来它迅速登上美区App Store总榜第三,也验证了它的成功。

02 为产品打造模型,而不是为模型寻找产品

张鹏: 确实,你刚才提到了一个核心观点:Sora这个产品形态的成功,是因为它的模型是围绕产品来打造的。这与许多先做模型再找应用的团队形成了鲜明对比。从技术角度看,有哪些明显的迹象能证明这一点?

曹越: 我非常同意陈冕的观点。OpenAI展现出了一种强大的垂直整合能力,即组织内部同时拥有顶尖的模型能力和敏锐的产品洞察力,并且能让产品需求反过来指导模型的迭代方向。

这已经不是第一次了。上一次的典型案例就是ChatGPT。GPT-3模型的核心能力早已存在,但OpenAI真正的厉害之处在于,他们将这种能力对齐了普通用户的需求,把它打磨成了一个极其易用、易于传播的产品。这种组织能力是非常高级且稀缺的。大多数团队都会陷入「先做模型还是先做产品」的内部矛盾中。

具体到Sora,一个关键的例子就是音画同步。从纯技术角度看,把声音做好,可能不像把视频或语言做好那么难。但从产品和用户视角看,声音是决定性的。正是因为Sora能让音画同步输出,才使得普通用户生成的视频具备了直接的可消费性,越过了C端产品普及的临界点。

这种洞察力——关注用户真正想要什么,而不仅仅是技术上什么最难——是一个只会埋头训练模型的基础模型公司可能不具备的。OpenAI再次证明了,他们不仅有能力打造强大的模型,更有能力将模型与产品完美结合,这正是他们最令人敬畏的地方。

张鹏:OpenAI在技术和产品之间的切换并非没有代价。去年那场宫斗大戏,现在看来,或许正是为了将重心彻底转向产品侧而经历的必要撕扯。Sora的出现提示我们,在追赶模型的同时,定义产品的能力也必须跟上。你怎么看呢?

陈冕:这完全说出了我的心里话。我这两天想明白一个关键点:Sam Altman是一位非研究员出身的CEO,他是一个顶级的「产品+融资+战略」大师。在过去几年由研究员主导的「模型竞赛」中,让一个纯研究员主导的公司率先做出顶级产品,是很难的。

OpenAI的成功得益于其独特的组织结构:它既拥有顶尖研究员,又由一位非研究员出身的顶尖产品战略大师领导。同时,它兼具创业公司的高融合度与巨头的雄厚资源。正是这种独特的组合,让OpenAI率先做出Sora变得顺理成章。

我之所以兴奋,是因为这预示着整个行业的组织方式和话语权将发生变化。定义应用和产品的能力,其重要性正变得与构建模型同样重要。就在大家还在讨论OpenAI的模型领先优势是否缩小时,他们已经通过产品开启了下一阶段的竞争。底层模型的竞争格局已相对集中,但Sora的出现,就像当年的ChatGPT一样,正式拉开了AI应用层竞争的序幕。

张鹏:除了刚才总结的那些结构性突破,你觉得Sora App在产品层面,有哪些做得特别聪明的地方?

陈冕:我认为Sora App的背后一定有产品高人。大家不要觉得一个产品看起来简单,越是简单的产品,背后越见功力。产品经理最难的不是做加法,而是做减法,这需要顶级的判断力。你用Sora App会发现,它几乎上手就会用。虽然在工程上还很粗糙,比如会弹出代码报错,甚至没有安卓版,但它的第一版在产品设计上,我认为已经做到了极致。

它的交互就是最简单的上下滑、左右滑。创作流程也极其简练:用@来选择人物(Cameo),然后输入prompt,整个过程行云流水。它所有的设计都在鼓励你进行社交。能把流程做到如此简单,背后一定是有强大的组织能力和优秀的产品经理在支撑。

第二个关键点,也是它最特别的地方,就是所有设计都紧密围绕「社交」。我为什么说它是「AI的Instagram」,你看它的核心功能:

ID保持是基础。你要社交,总得先让别人认出你的脸,你才能@朋友的脸,两个人才能互动。

音画同步是为了让大家「玩起来」。两个人要对话,要一起表演,就需要音画同步。你看所有双人共创的视频都依赖这个功能。只有在最需要即时性、UGC和社交性的场景里,才需要把音画同步做得如此简单和极致。

再看它的分镜头控制。它限制视频时长为9秒,这完全是朋友圈的逻辑。同时,短视频也需要叙事性,所以它提供了多镜头切换的能力,让一个9秒的视频也能有故事感。

它做的所有事都在为「社交」服务。包括它的邀请码策略,一个人只能拉四个,就是为了让你邀请最亲密的朋友,快速建立「熟人关系链」。他们甚至没做营销,这证明从产品、模型到市场,内部已经想得非常清楚,并串成了一条高效的链条。这件事,如果没有高度整合的组织和CEO的亲自拍板,是绝对无法实现的。

张鹏:现在假定你是Sam Altman,能帮我们想象一下Sora是怎么做出来的?

曹越:在这里我有一些不太一样的观点。首先,我觉得没必要神化Sam Altman,他可能只是「许可」了这件事,而非亲自发起。

关键在于,Sora的诞生更可能是一个「看菜下饭」的过程。当你知道现有模型能实现哪些能力后(比如音画同步、参考ID生成,这些对算法人员并非不可预测),再将这些能力与产品场景结合。对我个人而言,认知上最大的迭代是,它把「叙事」也整合进了模型,而不是用传统的产品方式来做,这点非常出色。

但是,要说团队一年前就决定要做社交,我觉得绝不可能。更大几率是,一个出色的产品经理,看着手里已有的「土豆丝」(模型能力),决定炒一盘菜。当你能做参考ID生成,但在北美deepfake是条红线,你不能随意生成人脸,那么「基于许可」的熟人社交就成了一个自然而然的选择。

所以,整个过程更像是组织内部紧密耦合、上下文对齐得很好,而不是产品提需求、模型再排优先级的传统流程。

张鹏: 所以你觉得这更像是一个归纳而非演绎的过程?把所有可用的「菜」搁在一起,然后推导出到底能炒出什么?

曹越: 是的,从我的视角看,这个过程可能没那么神奇,但的确不容易。它需要大家做一些mindset(思维模式)的切换。作为一个做模型的团队,我知道应该跟产品经理做更深度的交流,可以往某个方向去优化。但产品同学也需要去理解模型到底是怎么回事。

所以我觉得它更多是这样迭代出来的,而找到那个fit是关键。一旦找到这个fit,如果他们的团队本身在产品侧就比较成熟,那么执行起来是能做到的。但最难的是最开始的那个认知:我们能做什么?在哪个地方是真正fit的?这个是关键。

03 超越技术:AI时代的组织护城河

张鹏: 我们来聊聊视频生成的技术。很多人并非技术出身,但很想了解视频生成技术在过去几年经历了哪些关键阶段的变化?

曹越:我来梳理一下视频生成的几个关键里程碑。

第一个关键里程碑是今年2月OpenAI发布的Sora,它是一个巨大的认知突破,用「扩散模型+Transformer」的结构证明了AI可以生成高质量的单镜头素材。

紧接着,上半年以Veo等模型为代表的音画同步技术,让AI生成的人物表现力大增,跨越了「恐怖谷」,使其能进入主叙事链路。

差不多在同一时期,还有另一条关键技术路线——自回归模型(如MAGI-1和Genie),它像语言模型一样逐个Token生成视频,被证明可以生成更符合物理规律的视频。

然后是最关键的时刻——Sora,它核心叠加了「叙事能力」,能一次性直出一个包含有意义镜头切换的短片,让视频模型从生成「片段」进化到了能直出「可消费的完整故事」。

最后,Sora还有一个常被忽略但官方极为重视的突破,即「物理准确性」,官方报告通过体操、跳水等案例来强调这一点。

张鹏: OpenAI的报告里,有什么让你觉得在技术上有启发的东西吗?还是说他们已经把关键问题都藏起来了?

曹越: 报告里关于如何实现物理准确性的描述确实相对晦涩,远没有达到学术论文的清晰度。它只是说「我物理上更准确」,但并没有详细解释方法,这和实现它的路径之间差距还是很大的。

但这至少指明了一个方向:OpenAI非常关注物理准确性,并认为自己已取得阶段性成果。这对我来说是有启发的。

张鹏:我相信国内顶尖的模型公司都在加班加点地追赶,你估计他们需要多久才能做出类似Sora的产品?

曹越:我估计大概需要三个月。从产品维度看,OpenAI的优势在于模型和产品的垂直整合,但如果只看模型能力,追赶者与它的差距并没有想象中那么大。一个关键能力是音画同出,Veo 3在5月份已经做到,我们内部也将在国庆节后发布一个具备这种能力的新模型。所以,这更像是一个如何将模型能力完整地展示为产品的过程,单论模型本身,海内外团队的差距并不大。

陈冕:我觉得会非常快,第一个产品可能一个月之内就会出来。

原因有两方面:一个是模型能力会迅速拉平。 不论是谷歌还是国内公司,很快会发布新模型追赶上来,OpenAI的API也可能很快开放;另一个是真正的战场在应用侧。

对此,我有两个核心观点:

第一,国内的互联网大厂现在应该睡不着觉了。大家对Sora有个误解,它不是「AI版的抖音」,而是「AI版的Instagram/朋友圈」,它的本质是AI社交。

在中国,通用社交有极强的头部效应和网络效应,赢家通吃,比如微信。内容平台可以百花齐放(抖音、小红书、B站),但社交只有一个。如果Sora真的做成了社交超级App,将会动摇现有所有平台的流量根基。这会引发一场「腥风血雨」,无论是海外的Meta、Google,还是中国的几家大厂,都会疯狂内卷。所以我说一个月都是保守估计。

第二,对于创业者来说,AI应用的时代才刚刚开始,但不要想着去做AI版微信,因为创业公司做通用社交几乎不可能成功。真正的机会在于,将最好的产品创意和最好的模型进行整合。

张鹏: 陈冕你觉得AI社交的帷幕被拉开了。如果把你切换成Sam Altman的角色,接下来三步棋会怎么走?

陈冕:首先,我想澄清一点,CEO之前的背景不重要,重要的是在当前这个时间点,CEO和整个团队都要有「复合认知」和「复合能力」。本质上是产品能力和产品认知变得越来越重要了。

回到你的问题,如果我是Sam Altman,接下来要做三件事:

第一,勇敢地做ToC。Sora掀开了AI面向泛C端的帷幕,这件事可以开始认真考虑了。

第二,加强组织能力的垂直整合。未来的组织,产品需要懂技术,技术也需要懂产品。在前一个阶段,研究员(researcher)可能只需要工程能力,但现在他们也需要产品思维。技术是AI革命的基石,但现在技术也开始离不开产品了。不同职能的人,包括研究、工程、产品,必须深度整合。

第三,Go big or go home(要么做大,要么出局)。AI时代的机会比互联网时代大10倍甚至100倍,但市场也可能更加头部集中。人才、算力、资源、资金都在向头部集中。AI的发展速度比以往任何技术革命都快,这导致竞争被前置了。大家都能看到未来,共识很强,所以都用充裕的资本提前进入竞争,内卷加剧。你本来可以慢慢做应用,但现在不行了。API和算力的价格都很高,如果你没有足够的钱,连API费用都付不起,还怎么竞争?所以,我的建议是,业务要更激进地增长。这对所有创业者来说,是最好的时代,也是最卷的时代。

张鹏:我想再追问一下关于「组织能力整合」,有什么迹象表明这种整合是对或错呢?

陈冕:坦诚说,我们也在探索。举个实际例子:一个产品经理会从用户出发,想着用现有技术去「打补丁」,比如优化提示词。但我们的技术同学会提出一个更未来的概念:为什么整个画布不能是一个上下文窗口?

这是一个产品经理最初可能想不到的。但反过来,你光有大的技术变革也不行,设计师会问你,「所以呢?这对我有什么用?」

这就需要产品和技术的深度整合。你既要拥抱新技术,又要找到一个「灵光一现」的场景,让技术真的能被用户玩起来。这要求组织非常敏捷,没有部门墙。根据我的经验,他们必须物理上坐在一起,因为「物理距离也影响心理距离」。我脑海里Sora的诞生画面就是:在一个复合型团队里,一个既懂模型又有产品感的人突然想到一个新玩法,然后整个团队能迅速形成共识并落地。这种组织能力至关重要。

张鹏: 我也想听听曹越对这个问题的看法。你最近在组织内部有什么相关的思考和观察吗?

曹越:在我看来,组织内部绝大多数的摩擦都来源于「上下文不对齐」。不同专业背景的人(比如算法与业务)之间沟通带宽很窄,因此提升组织效率的本质,就是如何让大家更快速地对齐上下文。

要实现对齐,有两个基础:第一,个人的EGO要小,这样才更容易接受别人观点;第二,要善用语言模型这个「补全上下文的神器」,比如,当我听不懂一段话时,我会把它发给Gemini,让它帮我理解。

另外,我有一个强烈的感觉:AI时代,产品和模型的边界比我想象的要模糊得多。这对组织的要求是:做产品的人要去理解模型,做算法的人也要和产品的人多交流。大家要多一起吃饭、散步,在非正式的沟通中对齐上下文。我非常同意陈冕的观点,很多伟大的想法不是设计出来的,而是碰撞出来的。组织就像一个容器,把不同背景的人「Remix」在一起,最终产生伟大的创意。

04 AI应用的黄金时代和「最卷」的战场

张鹏:我观察到,过去大家追求让普通人能拍出好莱坞大片,或帮专业公司降成本。但Sora出来后,路线似乎变了,大家更像在玩,而不是想做大片。这是否意味着,过去那种降低成本、普及好东西的思路,未必是最好的?

陈冕:对,我觉得这是一种惯性思维。AI时代最大的机会,本质上是AI原生的机会。

如果你想的是给好莱坞大片降成本,那你其实还是在做提效,而提效不可能带来革命。革命才诞生伟大的新机会。巨头想提效无可厚非,但创业者绝对不能用这个思维。

我们从第一天起,思考的都是:AI时代会带来什么样的新体验和新内容?这才是本质。比如你和Sam Altman合拍的那个视频,在过去几乎不可能发生,但现在可以随时随意地发生。这就是原来没有的、从0到1产生的新体验,我们称之为「AI原生」的体验。

如何定义AI原生?你就想,没有AI,这个业务或内容还存不存在?如果不存在,它就是AI原生的。这是一个很重要的思维切换。如果你想在AI时代做一家伟大的公司,就必须回答这个问题。如果答案是「体验会打折」,那你可能做错了;如果答案是「业务会直接消失」,那你就做对了。

所以我其实不认为未来会是「好莱坞大片人人都能拍」。当年抖音出来,大家以为短视频是另一种电影,后来发现它是生活记录视频,是摄像头的平权化。我觉得这次也会是不同的东西。

张鹏:如果我们的目标是改变供给,而非降本增效,这会如何改变AI模型技术的发展路线,以及模型与产品的融合方式?

曹越: 首先,我非常同意这个观点。这一波AI本质上是一场生产力革命。无论是语言模型、图像视频模型,还是现在可以音画同步生成的模型,它们在初始阶段都是在改变供给。

但关键问题是:到底要改变的是什么供给?这是一个需要从产品侧深入思考的问题。以视频为例,过去一两年我最大的感受就是,视频这个品类实在太庞杂了。有电影、短视频、中视频,甚至游戏也可以看作是一种交互式视频。

从内容的视角反推,我们就要思考:哪些品类会率先被改变?机会到底在哪里?产品与技术的「fit」又在哪里?随着模型能力的进化,我们看到机会也在演变。一开始可能是人利用各种模型工具去制作一个片子;现在,一个模型已经可以端到端地生成一个10秒的短片。再过一两年,模型能独立生成多长的、可消费性的内容呢?

沿着这个时间线推演,会涌现出不同类型的机会。它可能是一种像表情包一样的玩梗视频,也可能是需要更长叙事的AI短剧,还可能是有更多交互的形态,比如交互式游戏,用户可以点选分支剧情。甚至,我们能否做出陈冕之前提到的那种,超越简单滑动的、具有极致交互体验的AI原生视频产品?

张鹏:Sora的出现,在未来三个月,对中国的创业团队和投资环境,究竟是好事还是坏事?可能会如何演进?

陈冕: 我认为有两个方向的变化,最终是好是坏还不好说,但大概率不会变得特别差。

首先是积极的一面:AI ToC的想象空间被极大地拓宽了。创业者能探索的方向更多,能做的事情也更多。光有模型能力已经不够,需要更复合的能力加入,这对创业公司是利好。我们能清晰地看到AI走向应用的趋势,这几乎是一个比互联网大10倍甚至100倍的超级机会。能力要求越复合,组织要求越敏捷,创业公司的机会就越多。

但另一方面,也存在「要么做大,要么出局」(go big or go home)的问题,即头部集中会更明显。因为行业发展太快,竞争趋于白热化。虽然巨头如OpenAI也并非无所不能——比如他们的Agent体验就不一定比创业公司好——但速度、资本和人才的密集,导致大家都在烧钱。尤其C端APP更烧钱,就像移动互联网早期一样,大家都知道未来能盈利,所以早期竞争异常激烈。这就不可避免地导致资本会更加向头部集中。

所以,总的来说,对于整个创投市场,投资AI会更加疯狂和「FOMO」(错失恐惧症),但资金会更向头部集中。而对于创业者来说,这既是最好的时代,也是最「卷」的时代。你必须飞快地做大、变强、找到产品市场契合点(PMF),否则就只能出局。

曹越: 我对未来非常非常乐观。无论Sora是否出现,这个时代都充满了层出不穷的机会。我非常认同陈冕的观点,这是一个有巨大增量的时代。从底层来看,这波AI带来了至少几个数量级以上的效率提升,这种基础生产力的变革最终会催生出极多的机会。

另外一个维度是,中国的创业者完全可以放眼全球市场。坦率地说,中国的创业者非常「卷」,无论是数量还是质量都非常出色。

回顾过去,00到10年,大家主要聚焦中国市场;10到20年,顶尖的企业家已经在中国和海外市场都取得了成功。而在这个新时代,趋势一定会更加全球化。我相信,中国的工程师红利和企业家精神红利,能为世界创造巨大的价值。

张鹏: 最后一个问题,想请两位分享一下:看到了Sora之后,你们各自有什么新的目标和计划?

曹越: 首先,我们最新的音画同出模型,将在国庆后大家就可以使用了。Sora让大家看到了音画同出最终的ToC机会是什么。国庆后欢迎大家去评测和对比。

未来半年,Sand.ai会继续专注于AI视频方向,为普通和专业用户提供SOTA级别的模型和产品。我们对此非常有信心,希望能抓住这个大方向上的机会。

陈冕: 对Lovart来说,Sora对生产力侧是巨大的变化。之前Nano Banana出现时,我们的流量翻了一倍,希望Sora 2开放API后能再翻一倍。生产端工具的PMF已经得到验证,并且会更强,我们肯定不能错过这个机会。

另外,我们会激进地探索ToC,但具体做什么我先卖个关子。

第三,我们会激进地扩张团队,欢迎产品、运营、设计、研发的同学加入我们,我们希望做一家顶尖的AI原生应用公司。

张鹏: 我逼问一下,12月份能看到你ToC产品的进展吗?

陈冕: (笑)进展肯定会比这更快。但我们对C端产品有更长的生长预期。如果一个产品能瞬间爆发,那可能还是大厂的机会。

张鹏: 好的。今天两位嘉宾的分享让我们对Sora这件事看得更深入、更清楚了。一位准备迎接整个产业在AI视频模型上的高度关注,另一位准备接住翻倍的流量并向外扩张。能感觉到两位都非常兴奋。

再次感谢两位的分享。

 

新一代短剧人,涌向郑州「淘金」

头图来源:视觉中国

 

 

2024年,短剧行业是一场人人都在讨论的「淘金热」。2025年,这场热潮的中心,正在指向郑州。

 

动身前往郑州之前,我对短剧的印象,大多停留在社交媒体上那些充满争议的标签和惊人的财富神话里。

 

“竖店”的声名鹊起、500亿的市场规模、每天80个剧组同时开机……关于郑州和短剧,我已经听到了太多令人兴奋的数字和标签。

 

但喧嚣之下,一个更核心的问题值得探究:在郑州,短剧到底正在发生什么?

 

在郑州的三天,穿梭于大会的各个论坛,与形形色色的创作者、平台方交流之后,我所看到的,远比那些标签要生动得多。

 

在这里,我看到的不再是零散的淘金者故事,而是一座城市、与一个新兴产业,如何共同完成一次升级。

 

这背后,既有郑州这座城市「ALL IN」的决心,也反映出整个短剧行业,正在经历一场从野蛮生长到寻求秩序的「成人礼」。

 

「竖店」崛起

 

郑州能成为「竖店」,有一笔划算的经济账。

 

在2025郑州微短剧高质量发展大会上,郑州市长庄建球在推介中给出的数据很有说服力:在郑州拍摄,成本能比一线城市低30%-40%,投资回报周期则能缩短3-6个月 。对于短剧这个追求「短、平、快」的行业而言,这个优势很难让人拒绝。

 

产业集聚效应已经显现。现在的郑州,已经拥有包括金水区大志影视基地在内的15家成规模的影视基地,总取景面积超过16万平方米 ,每天承载着约80个剧组同时拍摄 。

 

这背后,是800多家企业和近4万名从业者组成的庞大生态。

 

但如果仅仅是成本低,郑州可能不过是一个「横店平替」。它真正的重点,是自上而下、决心十足的资源倾斜。

 

从计划设立1亿元的产业发展基金 ,到推动「微短剧+」融合,将「黄帝故里、少林功夫」等独特文化IP向创作者开放 ,郑州拿出的,是一份具有诚意的「城市合伙人」计划。这种由政府主导的资源整合与方向指引,为产业的启动提供了强大的发动机。

 

这种自上而下的决心,正迅速转化为一种自下而上的建设热潮,其显著的特征,便是对城市闲置空间的创造性「盘活」。

 

图片来源:极客公园

 

位于郑州机场附近的聚美空港竖屏电影基地,是这一模式的典型代表。这片占地近17000平方米的场地,前身是一个闲置商场。2023年,聚美优品创始人陈欧捕捉到短剧赛道的机遇,斥资超千万将其改造。

 

如今,这里已变身为一个拥有家庭、医院、办公室、法院等20多个高频场景的一站式拍摄基地,极大避免了剧组为转换场景而耗费的时间与金钱成本。

 

图片来源:极客公园

 

官方数据显示,该基地日均接待剧组十余个,一部短剧最快3至5天即可杀青,自运营以来已累计拍摄超过650部作品,并成功吸引了上下游30余家相关企业落户。

 

郑州的政策明确鼓励各区县因地制宜,利用古建旧厂、闲置楼宇等场所,培育功能完善的拍摄基地。

 

大型企业也迅速入局。9月上旬,地产巨头绿地集团成立了「剧引力」短剧基地,计划将其在郑州的多个地标项目、商业综合体乃至小镇,通过场景化改造,打造成一个每年可承载超1000部短剧拍摄的庞大矩阵。

 

从「爽感」到「质感」

 

当人、钱、物都开始向郑州聚集,一个更深层次的问题浮出水面:什么样的内容,才能定义这个行业的未来?

 

「精品化」是所有人的答案,但究竟什么是精品?这场大会给出了一些不同于以往「卷成本、卷制作」的答案。

 

2025郑州微短剧高质量发展大会现场,红果短剧果燃计划播出伙伴项目正式启动,图片来源:极客公园

 

作为短剧领域的领头羊,红果短剧在积极推动微短剧精品化。

 

在2025郑州微短剧高质量发展大会上,红果短剧总编辑乐力表示今年来,依托果燃计划,已经累计立项82部短剧,目前上线播出近30部作品,涵盖非遗、普法、反诈、公益、年代励志等10多个主题。

 

在大会上,红果短剧还启动了“果燃计划”播出伙伴项目,首批面向全国14家主流媒体播出精品短剧内容,通过“优质内容共推、大小屏联动”的深度合作,推动精品短剧从“破圈”走向“长效”。

 

一个鲜活的故事则来自新锐厂牌「熊和兔」,始人熊巍将其创作理念的形成归功于一次标志性的「失败」与「复活」。

 

他分享道,团队的首部竖屏短剧《步步深陷》因其「女性悬疑复仇」的类型在当时追求「爽感」的市场中显得格格不入,上线后数据堪称「雪崩」。

 

这次惨痛的经历曾一度让团队质疑创作者的直觉。不过,数月后,该剧凭借口碑意外「复活」,并成为行业内的精品案例。

 

这次「过山车式」的市场反馈,让熊和兔坚定了一个反主流的核心理念:创作不应仅仅是追逐「观众喜欢看什么」,而是要通过持续的类型创新去「让观众进化」。

 

熊巍认为,简单的复制爆款只会被行业快速迭代和超越,只有「不断推翻自己」,才能维持长久的竞争力。

 

基于此,「熊和兔」确立了以精品创新为核心的厂牌战略。他们追求的不是量产,而是通过打造独特作品来建立粉丝对「熊和兔」这一厂牌的期待,这比单纯的作品营销更具价值。

 

在熊巍看来,这种坚持会催生出真正的「影迷文化」,让市场摆脱简单的重复刺激,走向百花齐放,最终通过垂直细分的方式将整个产业做大。

 

这个观点,实际上触及了「精品化」的本质,关乎内容价值取向。

 

关于精品化,「动漫社」创始人汤明明则提出了一个「真、善、美」的演进框架:早期短剧满足用户直接的欲望(真),而精品化,则是行业走向讲述更动人、更具共鸣的故事(善与美)的必然过程 。

 

她提到,短剧早期的成功源于「真」——对用户最直接欲望的满足,甚至包括「想看点擦边」的真实需求。

 

市场的成熟则必然推动行业走向「善」的阶段,因为「恨是可以传播的,但爱可以传播更久」 。制作更能引发情感共鸣的「爱」的内容,需要的是剧本、表演、导演等环节构成的「系统化学的能力」 。

 

她也建议创业者不要盲目追求「投资的规模化」,因为成功的百万级项目背后是强大的专业体系,而非单纯的资本 。

 

「行业内所有挣钱的人都是内行挣外行的钱」,而真正的「内行」,是在投资前就已想清楚商业模式的人,而不是抱着「我们先做出来再看」的天真想法 。

 

在这个框架下,「精品」的标尺不再仅仅是投资额,而是故事的创新度、情感的浓度和价值观的引领性。当钱不再是唯一的衡量标准,创作者的直觉和勇气,将成为新的、更稀缺的竞争力。

 

与此同时,行业内部也在讨论着一套全新的「叙事语法」。在「主创者的思考:短剧创作的趋势与品质升级」论坛上,科班出身的导演杨盛熙提出,传统影视创作者必须「脱下孔乙己的长衫」,并抛出观点:短剧的叙事核心是「重复节拍」,而非传统影视所追求的「人物弧光」 。他认为,短剧是人类叙事史上第一次,单靠「情绪」就能支撑120分钟体量的艺术形式 。

 

《一品布衣》的制片人余帅则反驳,他们这部数百万字网文改编的爆款,恰恰给很多重要角色做了「人物弧光」,并且大受观众欢迎 。

 

短剧真正的魅力,可能在于「人物关系的分钟级变化」 。这种变化的不断重复,既可以形成杨导所说的「重复节拍」,在足够长的篇幅里,也能累积成余帅所说的「人物弧光」 。

 

而从长剧领域转来的编剧雷博(《小港湾》编剧),则道出了另一个关键点。

 

他提到,长剧的创作周期动辄两三年,对观众的体察是「滞后的」,而短剧的高迭代率,恰恰给了创作者一个与时代同频共振的机会。

 

短剧的精品化之路,必然是从单纯的「情绪表达」,到传递「真挚情感」,最终实现「价值表达」的层层递进 。

 

告别「草莽」之后

 

当个体创作的讨论走向深入,行业的未来,最终取决于能否构建一个健康、可持续的生态。论坛上,大家不约而同地指出了当前生态的几大「痛点」,这也是行业「成人礼」中必须经历的阵痛。

 

首先是摇摇欲坠的「基础设施」。

 

盗版和抄袭问题被反复提及,红果短剧安全负责人奚凌然指出,盗版已通过视频平台、搜索引擎、网盘等多种渠道蔓延,维权成本与盗版成本完全不成正比 。

 

为此,平台方正在建立「平台投诉+行政投诉+司法诉讼」的三位一体打击方案 。

 

同时,行业标准的缺失导致了巨大的信息差,一位嘉宾提到曾遇到过简历丰富、现场却连焦都对不上的摄影师,这种「简历造假」的乱象,真实地反映出出品方面临的人才筛选困境 。

 

不过,正是这种对问题的集体焦虑,催生了对未来的新想象。

 

国家广电总局的官员明确提出,要以动画微短剧为契机,激发大众参与,让短剧创作像摄影艺术一样,成为「百姓文化生活的常态」 。

 

实现这一愿景的核心,正是AI。

 

中文在线 AI 动漫部总经理清风谈到,漫剧的窗口期正在当下,其业务线经过一年多的发展已验证了市场的强劲需求,不仅在短视频平台持续霸榜,在长视频平台也同样表现出色,作品如《我在诡秘世界玩嗨了》等已获得数千万乃至过亿的播放量 。

 

AI对生产流程的颠覆性重塑是其核心优势所在。中文在线的数据显示,AI能将传统动漫短剧多达11个的制作环节,暴力压缩至仅需「编导、AI生成、后期」3个核心环节,实现了生产模式的彻底变革。

 

这一变革带来的直接结果是产能的指数级增长,月度产能从此前的几百分钟跃升至超过1300分钟。更关键的是,它极大地降低了商业试错的成本和周期,过去需要投入巨大资源、耗时数十周才能验证一个项目,如今的商测成本可缩短至一两万元,周期仅需几周 。

 

这种效率革命也带来了「创作的平权」。据清风介绍,过去需要5年以上经验的岗位,如今借助AI工具,仅有一两年工作经验甚至应届生也能参与核心内容生产,极大地拓宽了人才池 。

 

同时,AI的另一大价值在于其强大的跨国界传播能力。通过AI,团队可以高效地为不同地区市场适配偏好的画风,例如为北美市场生成「美漫」风格,或为新加坡的Mewatch等平台提供内容,从根源上解决了内容出海的本土化难题 。

 

最终,技术的赋能需要通过商业变现形成闭环。中文在线已经构建了一个覆盖海内外的多元发行矩阵,包括自有的Flare Flow、UniReel等平台,以及在YouTube、TikTok等公域的布局,并针对日韩、东南亚、北美等不同市场采取差异化策略 。

 

清风表示,公司对整个产业链(从IP、制作到运营、变现)的合作都持开放态度,他还在演讲中谈到,合作达人单条内容分账超6万、制作团队单月分账超40万的成功案例,可以看到,该赛道的商业潜力已经成熟 。

 

抖音集团也宣布,向创作者开放超过6万部番茄小说原创网文IP进行改编,从源头解决了版权和故事来源的痛点 。

 

当然,行业对此也保持着清醒,有创作者指出,当前许多AI作品只是缺乏影视语言的「内容搬运」,而AI也永远无法替代真正的艺术家 。

 

从「因为穷」的求生本能,到「让观众进化」的创作自觉;从「重复节拍」的讨论,到拥抱AI和全球化的广阔未来;从解决版权、人才标准等基础问题,到拥抱全球化和AI等未来趋势,短剧行业接下来的关键就在于,谁能率先建立或融入一个更高效、更公平、更具前瞻性的生态系统,谁才能在下半场的角逐中,赢得最终的胜利。

 

而短剧的郑州时刻,发生的不是一场因为成本洼地而引发的短暂狂欢,而是一些更深刻、更具结构性的变化。

 

在郑州,至少有关于短剧的三件事正在同时发生:一座城市的产业雄心正在被激活,一套新的内容创作方法论正在被重塑,以及一个行业的未来,正在被AI等技术改写。

Sora 下载量破 100 万次;国庆中秋假期国内游总花费超过 8000 亿元;智驾多位核心高管离职,蔚来回应|极客早知道

不再是印度独享:OpenAI 低价 ChatGPT Go 订阅计划扩张至亚洲 16 地,每月不到 5 美元

10 月 9 日,据外媒 TechCrunch 报道,OpenAI 正加速将其每月不到 5 美元(现汇率约合 35.6 元人民币)的 ChatGPT Go 订阅服务扩展到亚洲 16 个新国家和地区,包括阿富汗、孟加拉国、不丹、文莱、柬埔寨、老挝、马来西亚、马尔代夫、缅甸、尼泊尔、巴基斯坦、菲律宾、斯里兰卡、泰国、东帝汶和越南。

在马来西亚、泰国、越南、菲律宾和巴基斯坦,用户可以使用当地货币付款,其余国家则需以美元支付,约 5 美元,最终价格会因当地税收而有所不同。

ChatGPT Go 为用户提供更高的每日消息上限、图像生成和文件或图片上传次数,并且拥有免费版两倍的记忆容量,从而能提供更个性化的回答。

OpenAI 表示,此次扩展正值其在东南亚的每周活跃用户增长高达四倍之际。该计划最初于 8 月在印度推出,随后 9 月在印度尼西亚上线。OpenAI 报告称,印度的付费用户数量自推出以来已翻倍。(来源:IT之家)

OpenAI 发布 GPT-5 Pro API

10 月 9 日,据 AIbase 报道,OpenAI 正式面向开发者推出新一代 GPT-5 Pro API,以 40 万 Token 上下文处理能力与多模态输入特性,刷新大模型工程化应用边界。

该 API 搭载的 GPT-5 Pro 模型支持文本与图像双模态输入,可处理约 30 万字的超长文档分析任务,适用于法律卷宗审查、科研文献综述等专业场景。其采用动态路由架构,在金融预测、医疗诊断等复杂推理任务中,响应速度较前代提升 60%,同时保持 Token 级输出精度。

计费模式显示,输入 Token 单价为 0.000015 美元/个,较基础版溢价 15 倍,配套"优先处理层"服务可将请求延迟压缩至 800ms 以内。

目前 API 已开放企业级调用权限,首批接入的金融机构实测数据显示,在风控报告生成场景中,模型可将人工处理时长从 4 小时缩短至 12 分钟。这一更新被视为 OpenAI 在企业级市场的重要布局,进一步强化其在高端 AI 应用领域的技术壁垒。(来源:AIbase)

 

OpenAI 旗下 Sora 上线不到五天下载量突破 100 万次

10 月 9 日,据一位高管透露,OpenAI 于 9 月底推出的 AI 短视频应用 Sora,在上线后不到五天内下载量便突破 100 万次。

OpenAI 旗下 Sora 业务负责人比尔・皮布尔斯(Bill Peebles)周三晚间在社交平台 X 上发布帖子,分享了这一里程碑事件。他表示,Sora 达成 100 万次下载的速度甚至超过了该公司广受欢迎的 AI 聊天机器人 ChatGPT——目前 ChatGPT 的周活跃用户已达 8 亿。

用户可通过输入文本提示词,免费使用 Sora 生成短视频。该应用目前仅支持 iOS 设备,且采用邀请制,用户需凭借邀请码才能使用。尽管存在这些限制,Sora 仍攀升至苹果 (254.04, -4.02, -1.56%) 应用商店(App Store)下载榜榜首。

皮布尔斯在帖子中写道:「团队正全力以赴,以应对激增的增长需求。」(来源:新浪科技)

 

谷歌向法官提出申请,希望允许将 Gemini 与 Maps 或 YouTube 捆绑

10 月 9 日,根据外媒彭博社报道,谷歌母公司 Alphabet 的律师 John Schmidtlein 向负责谷歌反垄断案的美国联邦法官表示,这家科技巨头希望保留将 Gemini AI 服务与 Google Maps 地图或 YouTube 视频应用捆绑的权利。

法官此前裁决谷歌在搜索和搜索广告业务上存在垄断行为,要求谷歌不得向合作方支付费用以换取独家搭载谷歌搜索、Chrome 浏览器、Google Play 应用商店。美国司法部希望将这一裁决的适用范围扩展到 Gemini AI 上。

John Schmidtlein 律师表示,目前没有任何迹象表明谷歌在 AI 市场已经获得了垄断地位或市场支配力,也没有证据表明 Google Maps 或 YouTube 是垄断产品。

这位律师宣称 AI 行业仍在发展,而微软已实现了 AI 应用与 Office 办公生产力套件的绑定,谷歌不应被禁止采用类似做法。(来源:IT之家)

 

英特尔公布首款 18A 制程 PC 芯片关键细节,明年 1 月将上市

10 月 9 日,英特尔公布了其即将推出的 Panther Lake 笔记本处理器的关键细节。这是该公司首款基于下一代 18A 制程工艺制造的芯片,旨在向投资者证明,其高昂的转型计划能够重塑英特尔在芯片制造领域的领先地位。

Panther Lake 主要面向高端、支持人工智能功能的笔记本电脑,是英特尔在扩大 18A 制程量产能力、以及夺回被竞争对手 AMD(AMD.US) 抢占的 PC 市场份额方面的一次重大考验。英特尔表示,Panther Lake 集成的图形处理器 (GPU) 和中央处理器 (CPU) 性能较前一代 Lunar Lake 芯片提升 50%。

该处理器预计将于今年开始量产爬坡,首批芯片将在 2025 年底前出货,并将于 2026 年 1 月起全面上市。(来源:财联社)

国庆中秋假期全国国内出游 8.88 亿人次,国内出游总花费 8090.06 亿元

10 月 9 日,经文化和旅游部数据中心测算,国庆中秋假日 8 天,全国国内出游 8.88 亿人次,较 2024 年国庆节假日 7 天增加 1.23 亿人次。国内出游总花费 8090.06 亿元,较 2024 年国庆节假日 7 天增加 1081.89 亿元。

大数据平台数据分析显示,国庆中秋假期,群众出行意愿强烈。其中,长线游、自驾游、邮轮游呈现明显增长。

  • 出游距离 500 公里以上长途游出游人群规模同比增长 8.8%;

  • 出游距离 200—500 公里的中途游出游人群规模同比增长 7.2%。

自驾游成为热门出行方式。其中,乌兰布统自驾、独库公路自驾、胶东半岛自驾等线路热度名列前茅。数据显示,赤峰、乌鲁木齐、威海的租车类 App 日均活跃用户规模较平日增长都超过了 34%。(来源:新浪网)

 

国庆中秋假期高速公路新能源汽车充电量超 1.2 亿度,创历史新高 

10 月 9 日,据媒体从国家能源局了解到,从 10 月 1 日零时至 10 月 8 日 24 时,全国高速公路新能源汽车充电次数共计 516.9 万次,充电量达到 12287.32 万千瓦时,日均充电量 1535.91 万千瓦时,是今年平日的 2.59 倍,比今年「五一」假期增长 23.61%,比去年国庆假期增长 45.73%,创历史新高。(来源:央视新闻) 

 

2025《福布斯》全球最佳雇主公布:微软蝉联榜首

10 月 9 日,福布斯今日发布 2025 全球最佳雇主榜单,今年一共有 53 家中国内地公司入选福布斯全球最佳雇主榜单。在全球榜单前五名中有三家来自 IT 软件与服务行业,其中微软连续两年蝉联榜首,达美航空排名第二,谷歌母公司 Alphabet 位列第三,Adobe 排名第四,苹果公司排名第九。

在今年的福布斯全球最佳雇主榜单中,中国大陆企业表现亮眼,其中国家电网排名最高(第 99),阿里巴巴(第 143)和腾讯(第 155)紧随其后。在中国榜单前十名中,来自软件 IT 与服务业、银行与金融业的企业各占三席。(来源:IT之家)

 

蔚来回应智驾多位核心高管离职:主动调整组织架构

 

10 月 9 日,据亿欧汽车报道,蔚来人工智能平台负责人白宇利、蔚来世界模型负责人马宁宁已于近期离职。另据公开信息,蔚来智驾产品负责人黄鑫也已离职。

蔚来对此回应,为了强化对通用人工智能最新技术的吸收,并能高效、高速、高质量地实现智能驾驶体验交付,蔚来近期主动调整了智能驾驶部门组织架构。(来源:IT之家)

 

《阿凡达:火与烬》内地定档:12 月 19 日,同步北美

10 月 9 日,导演詹姆斯·卡梅隆宣布,《阿凡达:火与烬》(以下简称《阿凡达 3》)中国内地正式定档 12 月 19 日上映,同步北美。

公开资料显示,电影《阿凡达 3》于 2024 年 3 月开始在新西兰奥克兰拍摄。和前两部的大投入一样,该片制作成本也高达 2.5 亿美元。(来源:界面新闻)

特斯拉 Model Y+ 申报信息曝光:尺寸不变,续航或超 800 公里

10 月 9 日,据工信部第 400 批公告显示,特斯拉 Model Y+(TSL6480BEVBR0)完成申报。

这款五座 SUV 延续了现款五座 Model Y 的尺寸布局,长宽高分别为 4797/1920/1624 毫米,轴距达 2890 毫米,车身比例与空间表现保持一致优势。

动力配置上,Model Y +采用单电机驱动形式,电机峰值功率可达 225 千瓦(302 马力)。动力电池则选用韩国 LG 新能源供应的三元锂离子电池。

尽管官方尚未公布续航数据,但结合同款动力总成的 Model 3 长续航版,业内预计 Model Y +的 CLTC 续航里程将达到 800 公里左右,有望成为特斯拉 SUV 产品线中续航最长的车型。(来源:IT之家)

 

云深处科技发布全球首款行业级全天候人形机器人

10 月 9 日,云深处科技官宣发布全球首款行业级全天候人形机器人「DR02」。

据介绍,云深处科技「DR02」机器人支持整机 IP66 防水防尘,可满足全天候户外作业场景需求;支持 1.5m/s 行走速度和 4m/s 极限速度,可行走在 25cm 高度楼梯和 20° 角度斜坡上。

该款机器人还适配 -20℃~55℃ 高低温工作环境;拥有 275TOPS AI 算力;配备激光雷达 + 深度相机 + 广角相机,可实现多传感器融合。(来源:IT之家)

 

AI 浏览器 Dia 结束「邀请制」,正式发布 macOS 版本

10 月 9 日,AI 浏览器 Dia 已于 2025 年 10 月 9 日正式发布 macOS 版本,结束自 2024 年 6 月开始的邀请制,向所有用户开放。

根据官网介绍,Dia 浏览器需配备苹果 M1 芯片或更高版本,且系统为 macOS 14 及以上。

Dia 的核心功能有:

  • AI 对话集成:可在任意标签页直接与网页内容对话,如总结文章、核查事实、生成学习资料等。

  • 自定义技能系统:用户可创建个性化 AI 按钮,如一键生成学习卡片、规划任务等。

  • 上下文感知查询:支持引用当前标签页内容及附件,结合历史对话记录提供更精准回答。

  • 记忆系统:学习用户偏好,提供个性化服务。

版本与定价

  • 免费版:包含基础 AI 功能,如 AI 对话、自定义技能创建等。

  • Pro 版:每月 20 美元(约 142.6 元人民币),提供 14 天免费试用,支持无限制 AI 聊天。(来源:开源中国)

2025年诺贝尔文学奖获奖作家是位中国迷,喜爱诗人李白

10 月 9 日,瑞典文学院宣布,将 2025 年诺贝尔文学奖授予匈牙利作家拉斯洛·卡撒兹纳霍凯(László Krasznahorkai)。获奖理由为:「以表彰他引人入胜且富有远见的作品,在世界末日的恐怖中,再次证明了艺术的力量」。

据了解,拉斯洛是匈牙利当代最重要的作家之一,2015 年曼布克国际奖得主,囊括了马洛伊奖等在内的几乎所有重要的匈牙利文学奖项。

1990 年代末,卡撒兹纳霍凯与汉学家妻子结婚以后,整个 2000 年代他曾频繁访问中国和日本,作品主题开始往东亚转移。

1998 年,他沿李白足迹走访十座城市,写成游记《只有漫天星辰的天空》。他认为李白是「欧洲人眼中的现代派诗人」,其诗作中的流浪意识与自身漂泊精神共鸣。(来源:cnBeta)

把我的第一次日本旅行,完全交给 AI 是什么体验?

作者| Li Yuan

编辑| 郑玄

临近十一了,还有人在临阵磨枪,抓紧最后的时间做旅行攻略吗?

虽然笔者不建议任何人这么做,但这阵子笔者进行了一次极限尝试————什么攻略都不提前查, 就靠 AI,看看一趟出国旅行能走到哪里。

 

 

笔者选择了一款叫 AI 旅行助手的 app 来进行了我的主尝试,它号称不仅能替用户生成旅行攻略,还能在行程中帮忙预订餐厅、酒店。

自 2023 年大模型开始「秀肌肉」以来,AI 做旅行搭子一直是不少大模型宣传自己能力的重点场景,可真正跑出来的现象级旅行 App 却不多。笔者想试试,只靠 AI 旅行,到底行不行?

一句话概括结果吧:一趟旅程下来,感觉 AI 有点用,能看见潜力,但是距离人类地陪这样的「完全体」还差得远。

AI 成为完全体的旅行搭子到底还差什么?笔者的这次体验,也许能说明一二。

 

01

AI 旅行攻略,图文并茂,

但是颗粒度不够细

 

对笔者来说,第一件重要的事,就是让 AI 帮我做一个攻略。

笔者之前使用 ChatGPT 的深度研究功能做过旅行攻略。攻略本身看起来还不错,但是即使我回答了一些 GPT 反向向我提的问题,感觉上还是不是很像一份个性化的攻略。

更多的感觉像是 AI 判断出我喜欢什么之后,直接给每天筛选出了三个景点。

 

 

我也用 AI 旅行助手试了试。

 

 

两个 app 相对来说的体验比较像,都是利用大模型的思考能力,对你进行一些反向提问,帮你找到最适合你的一些目的地景点。

AI 旅行助手在这里有一个小巧思,把大模型的简答题变成了选择题,直接点选,点选本身比较轻松,因此笔者也用更短的时间顺利地给出了更多的信息。

点选完成之后,大模型直接帮我生成了一段更加详尽的 prompt 再交给 AI 思考——从我最初简单写的 50 字左右的 prompt 扩充到了 600 字左右,开始自己进行了搜索和思考。

可以看到,它把我的行程拆成了每日规划、餐饮选择、预算分配等多个类目,挨个进行了搜索和分析。 完全没有做攻略的笔者,看着它在后台忙碌地「查攻略」,心里确实多了几分安心。

大概四十分钟之后,AI 给了我一份十分详尽的攻略。

 

 

相比于 GPT,好的地方显而易见——图片更多,排版更好,哪些景点从视觉上能让我种草,更一目了然。

整个攻略也更长,包含了具体到时间段的行程规划与路线安排,介绍了必打卡的景点和体验,提供了细到店的价格的美食和纪念品推荐。根据我的个性化情况,甚至安排了要进行哪些夜间文化体验和预算分配。

我很快就得出了行程的大致骨架:路线怎么走、去哪些地方——比如皇居和银座可以放在一天。需要做哪些行程准备——皇居不需要预约,而晴空塔建议提前网上买票。

连每一天吃饭的地方都给了位置临近的店名推荐,包含是否需要排队和人均价格的信息。

不过,这份攻略我最后用了多少呢?实际答案是,用了,但并不多。

我最后导出了它推荐的行程——软件里有一个功能能直接最后在地图上看到当想要取得所有地点,但仍然需要对行程进行大量的个性化编辑——包括给行程里添加一家当地的桌游店打卡。

我承认,这倒不是 AI 的错,在看到行程之前,我确实不记得给 AI 提这个要求。不过,在这里,我发现规划仍然变 得复杂了起来。

在我的行程中添加一家我想去的桌游店,到现在也并不是 AI 非常擅长的事,还是得严重依赖传统软件——看评论、确认是否有英语环境、查 Meetup 上的活动日期等等。这些 AI 目前还做得不好,或者说即便能做,效率也并没有传统 app 高。

而在个性化探店需求之外,笔者看到 AI 给的行程,最后最大的感觉,竟然是有点缺乏实感。

人往往是通过搜索、比较,逐渐建立起属于自己的语境(context)。而当这个语境还没建立起来时,AI 直接抛出结果,我反而很难直接信任或采纳它推荐的任何一家店。

在今年,笔者其实已经常常使用类似的深度研究功能了,在非旅游场景,我通常对 AI 给出的回答还是比较信任的。而旅游场景——当天真的要去了而我并没有看过其他人类攻略的情况下,我看到这样一份攻略,突然有点犹豫。

AI 的快速攻略好像一份精致的预制菜,我好像迅速地「饱了」,但是满心期待 AI 提效的我,在整个过程结束之后,困惑地发现,我 好像 更喜欢有点人味儿的攻略。

 

02

带着 AI 游东京:AI 代订最实用,

无缝的语言体验比想象中的难

 

攻略在手,笔者对大致的行程规划已经心中有数。接下来,便是在东京的实地体验。

自从 ChatGPT 出现之后,笔者一向使用 AI 翻译各种材料,十分好用,所以笔者在此次旅行中,最为自信的是无缝的语言互通的感觉,不过这部分意外成了翻车的地方。

无论是哪款翻译软件,都无法绕开一个略显笨拙的交互:将手机递到对方嘴边。

这不仅打断了沟通的自然流畅感,更重要的是,慢。往往是对方的话音刚落,笔者还没来得及按下录音,沟通的关键信息就已经错失。这种体验上的延迟和尴尬,让笔者第一次真实地感受到,或许全程录音、即时做显示的 AI 硬件确实还有它的机会。

正是在实时翻译的笨拙体验对比之下,AI 旅行助手的「AI Agent 代打电话预订餐厅」功能,才显得格外实用。这几乎是笔者本次体验下来,认为最有价值的功能。

日本的许多餐厅都采用预约制,而打电话预约这个场景,对于外语能力有限的游客来说几乎是无解的。(尤其是在日本,笔者深刻感觉到许多店店员的英语真的非常堪忧)。

而打电话预约,则是最难使用翻译软件的场景——游客总不能一边在手机上打电话,一边开另一只手机进行翻译。

AI 旅行助手的「AI Agent 代打电话预订」则完美解决了这个痛点。

点进去之后,只需要输入店名和需要预定的时间,AI 旅行助手就会直接用餐厅人员最熟悉的语言直接咨询帮忙预定。

虽然实际体验下来。感觉这个功能还有优化空间——在一次体验中,笔者尝试预定了一家餐厅,虽然发现这家店其实无需预定,但 AI 反馈的这个信息本身,就帮我省去了不必要的麻烦,让我可以直接前往,这同样是一种效率的提升。

相比之下,AI 旅行助手提供的另一个功能,稍显用力过猛。

在点餐环节,AI 旅行助手提供了一个 AI 翻译菜单的功能,拍照日文菜单,能够直接生成一个全新的带有图片的新 UI 界面。

 

 

在大部分场景下,它似乎并不如直接用手机拍照翻译来得快捷,后者的翻译结果也更能与实体菜单一一对应。这种「慢」对于笔者这样的「i 人」来说,尤其致命——让服务员在一旁等待 AI 生成一份全新的菜单,无疑增加了一份不必要的社交尴尬。

当然,这个功能只是尚未进化到它的「完全体」,笔者了解到,它的理想形态应该是在用户选择完菜品后,能一键生成一段可以直接展示给服务员的日语点单文本。只有这样,AI 才算真正完成了从「翻译」到「辅助行为」的效率闭环。

这一趟东京之行给我的最大感受也正在于此:当下的 AI,确实已经抹平了旅行中的许多硬性障碍。即使一句日语都不会,靠着翻译软件,你也能完成点单、问路、购物这些基本操作。但这仅仅是让旅行从「不可能」变成了「可行」。

未来的竞争焦点,将是如何从「可行」迈向「无缝」。

而对于任何与语言交互相关的功能而言,「无缝」体验的核心,有且只有一个——那就是极致的实时性。任何以牺牲速度为代价的炫酷功能,在真实的跨文化交流场景中,最终都可能沦为一种体验上的负资产。未来的 AI 语言应用,必须快到让人忘记它的存在,才能真正改变我们的旅行方式。

 

03

AI 旅行的下一步:

从虚拟攻略到物理世界的行动

 

在此次旅行开始前,笔者对 AI 旅行的最大想象,是它能为我生成一份完美无瑕、无需动脑的攻略。然而在东京街头亲身体验之后,我的看法有了一些改变。

AI 做攻略的诱惑力很大,但它似乎永远无法完全替代人类自己规划的过程。因为对我们来说,一份真正实用的攻略,是在搜索、比较、权衡的过程中,逐步建立起个人「语境」(context)的产物。AI 直接给出的「标准答案」,往往因为缺少这个过程而难以让人完全信任。

喜欢做攻略的用户,原本可能就是对个性化行程要求比较高的用户。更难以想象这类用户,能够盲目地跟着任何一个攻略去旅行——无论 AI 生成的还是别人走过的。

不过 AI 的攻略,仍然可以作为非常好的第一步产品来使用——正如现在很火的 AI 编程可以先给你生成一份有问题的代码,你在上面继续修修补补就行。

除此之外,在「做攻略」这个存量市场里,AI 似乎仍然面临着难以逾越的壁垒。像 Google Maps 和 Booking.com 这样的应用,在路线规划、信息查询和用户评价上已经做得太好,体验极其成熟。AI 想要在这些基础功能上超越它们,难度极大;而想要调用它们的数据,又会撞上「信息孤岛」这堵高墙。

但是,当我们将目光从虚拟的行前规划,转向真实的物理世界时,AI 的机会似乎豁然开朗。 它最大的价值,或许不在于告诉你「该去哪」,而在于当你身处异国他乡时,帮你解决「怎么办」的实际问题。

这次体验中,最有价值的并非那份 70 分的 AI 攻略,而是 AI Agent 代打的那个订餐电话。这完美地解决了一个典型的旅行痛点:你拥有信息(想去的餐厅),却缺乏行动能力(语言不通无法预约)。这正是 AI 能够大展身手的地方——它跨越了数字信息与物理行动之间的鸿沟。

在这次旅行中,笔者也对 「AI 旅行助手」这款 App 的背景产生了好奇。深入了解后发现,它的开发者,正是我们印象中专做旅行攻略的社区——马蜂窝。

目前,他们做了很多 AI 方向的探索,还有不少笔者没来的及体验的,包括 AI 酒店砍价,或者把一整份旅行攻略一键转成播客。

一次旅行下来,笔者觉得他们的有些尝试,方向其实很对:AI 的价值不只是停留在 「 生成一份计划 」 ,而是要真正帮助旅行者跨过去,从想法和纸面,走到现实世界的行动。

尽管这条路依然充满挑战,但回看整个体验,以 AI 旅行助手为代表的 AI 旅行应用确实已经比一两年前的同类产品体验好了太多。它成功地抹平了旅行中的一些硬性障碍,让「不做攻略出门」从一个鲁莽的冒险,变成了一种可行的选择。

AI 时代就是如此,看似没有太多变化,但实际已经走过沧海桑田。对于那些有出行需求,又苦于繁琐规划的人来说,这款 App 值得一试。它或许并不完美,但它所代表和探索的方向——赋能旅行者在物理世界的每一次行动——可能就是旅行的未来。

*头图来源:极客公园

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

英伟达将投资马斯克的 xAI;低价版Model 3/Y 「阉割」智驾功能;微信推出批量撤回信息功能

诺贝尔化学奖授予金属有机骨架开发领域

当地时间 10 月 8 日,瑞典皇家科学院决定将 2025 年诺贝尔化学奖授予北川进、理查德·罗布森以及奥马尔·M·亚吉位科学家,以表彰其在金属有机框架开发领域的贡献。

中国科学院大连化学物理研究所研究员杨维慎表示,金属有机框架(MOFs)是一种多孔材料,三位获奖人对这种材料的研究开创了网格化学这一新的领域。

杨维慎指出:目前,这种材料的工业应用比较少,但在化学领域已经开展了大量研究工作。它未来的应用场景可能体现在:

金属有机框架材料可以用来进行气体分离、储存。例如,储存氢气或甲烷,为氢能汽车储氢提供解决方案。

利用金属有机框架材料进行「碳捕集」。它的高比表面积意味着拥有更多的吸附位点,可实现较高的二氧化碳吸附容量,减少温室气体排放带来的气候变化问题。

在干旱沙漠地区,天黑后水汽冷凝,这种多孔材料可以吸水,第二天太阳出来以后再把水释放出来,形成纯净的饮用水。

在医药领域,这种材料也可以作为药物的载体,把药物精准送到病变部位等。(来源:新京报)

黄仁勋证实:英伟达将投资马斯克旗下的 xAI

10 月 8 日,英伟达首席执行官黄仁勋证实对马斯克旗下初创公司 xAI 进行了投资。他表示对这一交易感到非常兴奋,并称唯一的遗憾是「没给 xAI 更多投资」,自己希望能参与马斯克的所有业务。

有消息指出,xAI 在最新一轮融资中获得了比预期更多的资金,已达到 200 亿美元。其中,英伟达在这次融资中的股权部分投资高达 20 亿美元。

知情人士透露,这笔融资涉及一家特殊目的公司(SPV)的股权和债务。据悉,该公司将购买英伟达处理器,并将其出租给 xAI 用于其 Colossus 2 项目(xAI 位于美国孟菲斯的最大数据中心)。

英伟达首席财务官 Colette Kress 上月在高盛的一次会议上曾表示,公司的首要任务是利用其现金帮助其他公司更快地应用人工智能。对于 xAI 而言,目前也急需更多资金支持。该公司每月耗资 10 亿美元,且仍需要数十亿美元的资金,未来也可能将开放更多融资。(来源:财联社)

 

软银 53 亿美元现金收购 ABB 机器人业务

10 月 8 日,瑞士工业巨头 ABB 发布公告,表示已同意将其机器人业务出售给软银集团。根据公告,此次交易的企业价值为 53.75 亿美元。ABB 预计,在扣除交易成本后,将获得约 53 亿美元的现金。

该协议的达成,也意味着 ABB 放弃了此前分拆机器人业务并使其独立上市的计划。该交易尚需获得监管批准并满足惯例成交条件,预计将于 2026 年中后期完成。

软银集团董事长兼 CEO 孙正义指出,此举旨在打造软银的「下一个前沿」——物理 AI(Physical AI),将世界级的技术与人才整合,以推动一场「将人类向前推进的突破性革命」。

他指出,ABB 机器人部门将受益于软银在人工智能、机器人技术和下一代计算领域的尖端能力,从而巩固和扩大其技术领先地位。(来源:华尔街见闻)

 

特斯拉标准版 Model 3/Y「阉割」智驾功能

北京时间 10 月 8 日,特斯拉发布了「平价版本」的新款 Model 3 和 Model Y。令人意外的是,它们缺少了特斯拉 Autopilot 中一项至关重要的功能,这是多年来特斯拉首辆不配备「自动辅助转向」(Autosteer)功能的车辆。

需要明确的是,这里讨论的并非 FSD 功能,而是基础版 Autopilot,主要用于辅助高速公路驾驶。该系统原本包括「交通感知巡航控制」,即可依据周围车辆动态调节加速与刹车;以及「自动辅助转向」——使车辆能够自动沿车道线行驶。这意味着驾驶体验将倒退回 2012 年左右的特斯拉车型水平——方向盘完全由驾驶员掌控,手动驾驶时代回归。

据媒体分析,这不太可能是硬件层面的限制,因为车主仍可额外支付 8000 美元购买特斯拉的 FSD 套件。该功能理论上可在任何道路上实现点对点自动驾驶,但仍需驾驶员全程监督。这或许反映出特斯拉正利用软件功能作为策略工具,促使消费者为利润更高的车型多掏腰包,毕竟低价车型通常利润率较低。(来源:IT 之家)

Sam Altman:羡慕当代辍学大学生

本周一,OpenAI 首席执行官 Sam Altman 在 DevDay 大会接受采访时表示:「我对如今这批 20 岁出头的辍学生感到羡慕。因为你们能创造的东西太多了,这个领域的机遇非常广阔。」

目前,有两个因素正推动美国年轻人提前退学或干脆跳过大学教育:

其一,高等教育成本大幅上升,一些四年制学位的全部费用已突破 50 万美元;其二,人工智能技术的快速发展,加上大量 vibe coding 工具的涌现,使得即使技术基础薄弱的人也能更轻松地创办公司。

Sam Altman 本人于 2005 年从斯坦福大学辍学,当时他已学习计算机科学两年。离开校园后,他参与联合创办了地理位置共享社交应用 Loopt,并进入初创企业孵化器 Y Combinator(YC)。该应用被收购后,他出任 YC 总裁,之后又联合创立了 OpenAI。

长期以来,大学辍学生在硅谷备受推崇,这得益于数十年来一系列成功案例,包括比尔·盖茨、拉里·埃里森、史蒂夫·乔布斯、和扎克伯格等人。(来源:IT 之家)

 

清华物理系高材生姚顺宇从 Anthropic 离职,加入 DeepMind

10 月 8 日,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)在个人博客上表示,自己已于 9 月 19 日从 Anthropic 离职,并于 9 月 29 日加入 Google DeepMind。

资料显示,姚顺宇于 2015 年进入清华大学物理系,大二开始选修研究生理论课程。2019 年,姚顺宇本科毕业后远赴斯坦福攻读博士,毕业后先是到加州伯克利大学做了一段时间的博士后,之后于 2024 年 10 月加入了 Anthropic。

在他看来,Anthropic 是物理学家开启 AI 研究之旅的最佳平台之一。值得注意的是,在 Anthropic 期间,他参与将 Claude 从 3.7 提升到 4.5,AI 惊人的发展速度让他惊讶,自己也学到了很多,「然而,是时候继续前进了。」(来源:机器之心)

 

马斯克所称的「AI生成游戏」遭游戏发行总监吐槽

近日,马斯克成立了 XAI 人工智能游戏工作室,并声称这支由其 AI 助手 Grok 驱动的团队将在 2026 年底前发布一款「杰出」的 AI 生成游戏。他是在一条推文中做出这一声明的,配图是一段由 AI 生成的、根本不存在的军事射击游戏画面。

不过,《博德之门 3》背后的知名 RPG 工作室 Larian Studios 的发行总监迈克尔·道斯公开表示,马斯克所承诺的 AI 生成视频游戏不靠谱。

道斯在 X 平台表示,尽管人工智能可以作为游戏开发的工具,但它无法替代创造优秀游戏所必需的创意与远见。

「坦率地说,这个行业真正需要的,并非更多由数学算法生成、经心理学训练优化的游戏循环机制,而是更多能够表达人们正在关注或渴望沉浸其中的世界。」道斯写道,「AI 可以作为一种工具存在,但我们早已拥有无数工具,它们却无法弥补当前行业中清晰方向与整体构思的惊人缺失。AI 解决不了游戏产业的根本问题:领导力与愿景。」(来源:IT 之家)

 

已故名人遭 Sora 2「复活」引发争议

上周,OpenAI 推出其 Sora 2 视频生成器时宣称,公司已采取措施默认「禁止生成公众人物的形象」。然而,Sora 2 的创作者和观众发现,这一禁令存在一个大漏洞——允许生成已故公众人物的视频内容。

据报道,如今在社交媒体上,此类利用 AI 技术让已故名人「复活」的例子比比皆是,包括李小龙、迈克尔·杰克逊、斯蒂芬·霍金等。

尽管 OpenAI 会在每段生成的视频上叠加动态水印,以降低观众被虚假影像误导的风险,但看到逝去的名人被 AI 工具当作道具使用,显然还是会令其在世的亲属和粉丝感到不适。

显然,已故公众人物无法对 Sora 2 的客串功能表示同意,也无法行使这种「端到端」的肖像控制权。从目前来看,OpenAI 对此似乎持默许态度。(来源:IT 之家)

微信更新:支持批量撤回消息

日前,有网友发帖表示微信已推出批量撤回消息功能。当用户在微信聊天框中长按两分钟内发送的消息并点击「撤回」时,会出现两个选项:「撤回该条消息」和「撤回本次发送的全部消息」。

选择「撤回本次发送的全部消息」即可一次性撤回本次发送的所有消息(包括文字、图片、语音等),无需逐条操作,再也不怕发错消息时手忙脚乱却撤不完的情况。

目前,微信常规消息可在 2 分钟内撤回,如文字、语音、表情包、图片等,文件内容则支持 3 小时撤回,如 Word、Excel、PPT 等。所有消息撤回之后,对方都会看到相关提醒,提示对方撤回一条消息。

据了解,批量撤回功能还在灰度测试阶段,只有部分用户可以使用。(来源:快科技)

 

曝索尼α7V全画幅无反相机将于明年Q1发货

近日,消息源 SonyAlphaRumors 透露,索尼的年度重磅新品 α7 V 全画幅无反相机有望今年 11 月中旬正式发布。另据消息人士透露,索尼已通知合作经销商称 α7 V 相机将从 2026 年第一季度开始发货。

根据泄露图片,索尼 α7 V 相机将配备 3300 万像素 CMOS 传感器(像素数与上代 α7 IV 相同),但目前尚不明确这块传感器是全新的部分堆栈式 CMOS 还是改进过的 α7 IV 同款传感器。

硬件方面,这款相机将搭载与 α1II「同款」的新一代 AI 芯片,机身设计类似 α7R V,拥有五代机同款的按键布局及 4 轴多角度 LCD 屏幕,可翻转、抬起等,但阉割了 α1 II/α9 III 的一体式手柄握把,预计售价 3000 美元(约合人民币 21000 元)。(开源:IT 之家)

第一代「中关村互联网投资人」肖庆平遭遇车祸不幸离世

多位 IT 从业者证实,中国 IT 第一代从业者,资深天使投资人肖庆平 10 月 6 日在西藏因车祸不幸离世。

公开资料显示,肖庆平生于 1964 年 10 月,1983 年毕业于湖南大学,1991 年获对外经贸大学硕士学位,1999 年考入中国人民大学攻读博士学位。

肖庆平曾在 2021 年撰写过自己的创业和投资经历。他表示:「我是一个中关村人,是第一代互联网人,也是一个老天使投资人。」他回顾自己的投资历程,截止到 2021 年撰文时,一共投了 40 多个项目,总额近 1 亿元。

根据中关村百人会天使投资联盟官网信息,肖庆平是天使百人会发起人;天使百人会监事长;天使百人会投资学院副院长;天使百人会种子基金(Ⅰ)期管理合伙人;北京掌上通网络技术股份有限公司董事长。(来源:红星资本局)

 

最便宜 Model 3/Y 亮相,26.4 万;Ive 揭秘 AI 硬件,和 iPhone 完全不同;诺贝尔物理学奖授予量子力学科学家|极客早知道

特斯拉最便宜车型:Model 3/Y 标准版亮相,起价 3.7 万美元

10 月 8 日消息,特斯拉今天(10 月 8 日)在美国市场推出 Model Y 标准版外,还同步推出了 Model 3 标准版,成为特斯拉目前最便宜的车型,起售价为 36990 美元(注:现汇率约合 26.4 万元人民币),比后驱长续航版(Premium)便宜 5500 美元。

汽车媒体 edmunds 认为,特斯拉进一步下探价格底线,一方面能吸引新一代用户,另一方面也加强和现代 Ioniq 6、雪佛兰 Equinox EV 等同价位车型的竞争力。

外观方面,Model 3 标准版的变化非常有限,最明显的识别特征是采用了全新的空气动力学轮毂盖,其设计灵感源自 Cybertruck。车辆标配 18 英寸轮毂,如果用户想要升级到 19 英寸,需要额外支付 1500 美元。

颜色选择上,标准版标配灰色车漆,仅提供白色(1000 美元)和金属黑(1500 美元)两种付费选项。

内饰方面,新车在保留核心质感的同时进行了多项成本优化。中控台的杯架变为开放式设计,座椅采用布料与人造革拼接材质。

性能与续航方面,Model 3 标准版搭载了容量更小的电池组。其官方 0-60 英里 / 小时(约 96.5 公里 / 小时)加速时间为 5.8 秒,虽慢于 Premium 版的 4.9 秒,但对于日常家用已绰绰有余。

根据 EPA 标准,该车在满电状态下的续航里程为 321 英里(约 516 公里),若选装 19 英寸轮毂则降至 303 英里(约 488 公里)。同时,新车也取消了高级悬挂阻尼系统,改为采用更传统的悬挂系统。

这两款车型可立即下单,预计在 2025 年 12 月至 2026 年 1 月期间在多地开始交付。标准版 Model 3 和 Model Y SUV 的起售价分别为 36,990 美元、39,990 美元。

(来源:IT 之家)

首次在宏观尺度揭示量子特性:2025 年诺贝尔物理学奖授予三位科学家,见证量子边界的突破

10 月 7 日消息,瑞典皇家科学院决定将 2025 年物理学诺贝尔奖授予三人,以表彰他们「在电路中发现了宏观量子力学隧穿与能量量子化现象」:

  • 约翰・克拉克(John Clarke),美国加州大学伯克利分校;

  • 米歇尔・H・德沃雷(Michel H. Devoret),美国耶鲁大学及加州大学圣塔芭芭拉分校;

  • 约翰・M・马蒂尼斯(John M. Martinis),美国加州大学圣塔芭芭拉分校。

简单来说,他们通过一系列实验证明,量子世界的奇异特性能够在一个「肉眼可见、握在手中的电路系统」中具象化。

2025 年物理学诺贝尔奖奖金为 1100 万瑞典克朗(注:现汇率约合 835 万元人民币),由获奖者平分。

诺贝尔委员会指出,这三位获奖者的实验在一块芯片上展现了量子物理的实际效应,回答了物理学中的一个重要问题:量子力学效应能否在宏观系统中被观测到?

在具体来讲之前,我们需要先了解到一点——量子力学通常描述的是单个粒子尺度下的物理规律,这些现象被称为「微观」。而由大量粒子组成的「宏观」物体(例如一个篮球)则不表现出可见的量子行为。当球被抛向墙壁时,它会被反弹回来;但在微观世界中,单个粒子可能「穿过墙壁」出现在另一侧,这种现象即为量子隧穿。

也就是说,量子隧穿代表粒子能够「穿过」原本无法跨越的势垒。然而,通常当系统包含大量粒子时,这种量子效应会迅速消失。三位科学家的研究证明,量子特性可以在宏观尺度上被精确呈现。

艾维对话奥尔特曼:为 OpenAI 构思 20 个硬件创意,但不会像 iPhone

10 月 7 日消息,据《商业内幕》报道,在周一举行的 OpenAI DevDay 开发者大会上,OpenAI CEO 萨姆・奥尔特曼 (Sam Altman) 和苹果前首席设计师乔尼・艾维 (Jony Ive) 压轴登场,围绕着 AI 进行了一场对话。

艾维对奥尔特曼表示,他为 OpenAI 的 AI 设备家族构思了 15 个到 20 个创意,这些设备很可能完全不同于 iPhone虽然 iPhone 等苹果设备让艾维名声大噪,但他在对话中批评了智能手机和平板电脑,表示他希望新的 AI 设备能让人类更快乐、减少焦虑。

「当我说,我们与科技的关系不融洽时,这已经是最委婉的说法了,」艾维表示,「我们不仅能纠正这种状况,更能彻底改变我们所处的局面。我们不必接受这种情况成为常态。」

OpenAI 与艾维设计能力的结合,可能对苹果构成潜在威胁。苹果虽主导了移动时代,但在生成式 AI 领域落后了。

艾维表示,当前 AI 技术发展迅猛,以至于他和设计团队难以集中精力。「这种势头让我们产生了 15 到 20 个非常有吸引力的产品创意。挑战在于如何聚焦。如果你知道只有三个好的想法,那就容易多了。但情况并非如此。我们正在设计一整套产品。我们努力确保在选择重点时既谨慎又周到,同时不被其他事分心。」

奥尔特曼问艾维,如何围绕全新理念开展设计。艾维回应道:「我们热爱人类族群,并希望产品带来帮助。」他坦言自己是 AI 潜力的坚定信徒。「在我整个职业生涯中,从未遇到过任何能与当前 AI 展现的潜能相提并论的技术契机。」艾维表示。

艾维透露,他希望新的 AI 设备能有趣,同时解决智能手机和平板在过去十年甚至二十年里带来的一些问题。

他说道:「不体贴、不谨慎带来的后果和影响真的不堪设想。就我们设计的交互界面而言,如果无法让人们会心一笑,反而沦为另一种刻板、排他的产物,我认为那对我们所有人都是极大的伤害。」

这或许又是对苹果的一次暗讽,因为该品牌始终以极度严肃的态度对待设备设计,竭力追求高端定位与排他性。

艾维还透露了至少两个线索。「我们在尝试理解人与人之间的交互界面方面做了非常深入的研究。那种交互是如此复杂且微妙。我们的思维方式与其他设备和工具紧密交织在一起。」

尽管看似在批评苹果,他仍借鉴了乔布斯的一句著名理念,认为这些新的 AI 设备应该「简单易用」。(来源:IT 之家)

雷军:小米 17 系列首销成绩远超预期,首销购机权益将延续至 10 月 31 日

10 月 7 日消息,小米创办人、董事长兼 CEO 雷军今日发文称,小米 17 系列首销成绩远超预期,为感谢大家的选择与支持,首销购机权益将延续至 10 月 31 日

据 IT 之家昨日报道,央视新闻在 10 月 5 日报道称,小米 17 系列手机开售仅 5 天销量破 100 万台,雷军本人进行了转发确认。

另外,小米集团合伙人、总裁,手机部总裁,小米品牌总经理 @ 卢伟冰 在微博发文披露,今年国庆中秋假期已经过半,小米 17 全系列销量比往代同期显著增长超过 20%,Pro 系列大幅超出预期,正在积极补货,标准版也越来越受欢迎。

9 月 27 日上午 10 点,小米 17 全系开售 5 分钟,刷新 2025 年国产手机全价位段新机系列首销全天销量、销售额纪录。其中,小米 17 Pro Max 单款机型打破了今年国产手机全价位段首销全天销量、销售额纪录,在小米 17 系列中销量占比超过 50%。(来源:IT 之家)

高通宣布收购 Arduino:加码机器人与物联网生态布局,首款搭载高通芯片的开发板即将发布

10 月 7 日消息,当地时间周二,高通宣布收购意大利开源硬件和软件公司 Arduino,以进一步深入机器人与物联网开发生态,加速其在边缘计算和人工智能(AI)领域的开发者战略布局。

高通未披露交易金额,只表示 Arduino 将继续作为独立子公司运营,并继续支持来自多家半导体厂商的微控制器和微处理器产品。交易完成仍需获得监管机构批准及履行其他惯常条件。

Arduino 主要以其低成本开发板和单板计算机而闻名,广泛应用于硬件创业团队和机器人实验室,用于原型设计与概念验证。

高通表示,Arduino 全球超 3300 万活跃用户将能够访问高通的技术栈与全球生态网络,从原型设计、测试到商业化开发,都将获得更全面的支持。

Arduino 主要以其低成本开发板和单板计算机而闻名,广泛应用于硬件创业团队和机器人实验室,用于原型设计与概念验证。(来源:IT 之家)

谷歌发布 Gemini 2.5 Computer Use 模型:专攻浏览器交互,支持 13 种操作

10 月 8 日消息,谷歌正在预览一款全新的 Gemini 人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使 AI 智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为「Gemini 2.5 计算机使用」(Gemini 2.5 Computer Use)的模型,利用「视觉理解与推理能力」分析用户的请求,并完成相应任务,例如填写并提交表单。

该模型可用于用户界面测试,或用于操作那些仅面向人类用户、未提供 API 或其他直接接口的系统。此前,此类模型已应用于谷歌 AI 模式(AI Mode)中的智能体功能,以及研究原型项目「Mariner」,该项目利用 AI 智能体在浏览器中自主执行任务,例如根据食材清单自动将商品添加到购物车。

谷歌此次发布恰逢 OpenAI 在其年度开发者日(Dev Day)宣布推出 ChatGPT 新应用的次日。OpenAI 正持续聚焦其「ChatGPT 智能体」(ChatGPT Agent)功能,该功能可代表用户完成复杂任务。与此同时,Anthropic 公司已于去年发布了其 Claude AI 模型的「计算机使用」(computer use)版本。(来源:CnBeta)

宝马最大 SUV 史上最重要换代:首推纯电版 iX7,预估最高 800 马力

10 月 7 日消息,汽车媒体 CarScoops 昨日(10 月 6 日)发布博文,报道称宝马品牌旗下尺寸最大的 SUV 车型 X7 即将迎来其史上最重要的一次换代,新一代车型代号为 G67,不仅全面革新设计和技术,更将首次衍生出纯电动版本 iX7。

宝马 X7 渲染图,图源:CarScoops

▲ 现款宝马 7 系

外观方面,新车的设计语言将深度融合宝马 Neue Klasse 理念,延续分体式大灯设计,日间行车灯紧贴引擎盖边缘,而主光源则集成在下方更方正的灯组内。

前脸依然配备巨大的双肾格栅,但其内部将用发光元件取代传统的镀铬装饰,让其更具极具辨识度。车身侧面线条受 iX3 启发,变得更为平滑流畅,传统的门把手被替换为类似福特 Mustang Mach-E 的「翼片式」设计。(来源:IT 之家)

准确率最高 92.85%:三星研发「读心」设备,可感知你的观影偏好

10 月 7 日消息,三星公司昨日(10 月 6 日)发布博文,宣布携手汉阳大学生物医学工程系,合作研发出一款新型耳戴式脑电图(EEG)设备,从而监测佩戴者的脑电波。

这款 EEG 设备体积远小于需要粘贴头皮电极的传统脑电图仪,但仍能为脑机接口(BCI)技术捕捉高质量的脑电波信号。

得益于其紧凑小巧的设计,这款耳戴式 EEG 设备首次将脑电波监测带出实验室环境,让其能够在日常生活中广泛应用。例如,该设备能够实时监测用户的困倦程度,这一功能在教育场景中可用于衡量学生的学习效率,或在驾驶场景中更准确地预警驾驶员疲劳。

该设备还能与人工智能算法协同工作,精准分析用户的个人偏好。在三星进行的内部测试中,通过分析参与者观看视频时的脑电波数据,该设备识别其视频偏好的准确率达到了惊人的 92.85%。

展望未来,这项技术有望与更多消费电子产品深度融合。研究人员设想,类似的脑电波监测功能可以集成到 AR 眼镜、XR 头显或无线耳机中。

在 AR / XR 设备上,它能提供一种全新的免提交互方式,用户仅通过「意念」即可控制设备;而在无线耳机上,它则可以感知用户的情绪状态,例如判断你是否对正在观看的电影感到疲倦或喜爱。(来源:IT 之家)

苹果新广告调侃微软 Windows 电脑蓝屏死机,强调 Mac 安全优势

10 月 8 日消息,苹果今晚发布了一则新的视频广告,借机调侃 Windows 电脑长期受到蓝屏死机(BSOD)问题的困扰,同时强调自家 Mac 产品在安全性方面的优势。

其广告的内容主要是讲述了一家企业在展会前夕因软件问题导致 Windows 系统崩溃,员工设备集体蓝屏,工作陷入停滞。

随后,苹果员工从天而降,通过 Mac mini 电脑成功恢复现场运作。广告的结尾出现了标语:「没有谁能比得上 Mac 安全」(There's no security like Mac security)。

这支广告被外界认为是在影射 CrowdStrike 安全更新事件。参考此前报道,当时有大量 Windows 电脑在更新后出现蓝屏死机,绝大多数全球 500 强企业均受波及。

在广告剧情中,苹果员工作为「及时伸出援手」的角色,在几分钟内帮助受影响的团队恢复业务运行。影片最后再次出现 Mac mini 的画面,暗示其在关键时刻的可靠性。

由于系统底层复杂,Windows 用户仍可能因驱动冲突或软件不兼容导致蓝屏问题。例如,有测试者在使用配备 i9-14900HX 与 RTX 4090 显卡的笔记本时,因处理器不稳定而多次遭遇蓝屏,最终通过安装 Intel 微码更新才解决问题。(来源:IT 之家)

 

❌