普通视图

发现新文章,点击刷新页面。
昨天 — 2025年8月25日极客公园

vivo Vision 探索版发布:开启三十而立的新篇章

2025年8月25日 18:55

今年是 vivo 成立的第三十个年头。在东莞这个梦开始的地方,vivo 工业园内举办了三十周年特别展。现场展览内容非常丰富,蓝科技空间站、vivo 影像作品展,漫步其中,vivo 三十而立的历程以及其对下一个三十年的展望,尽收眼前。

蓝科技空间站里,vivo 没有一味地炫技,而是从用户视角出发,把五大蓝科技、6G、MR、机器人等技术成果做了场景化的展示,大家可以体验互动,既硬核又有趣。

硬核之外更有温情,现场还有一个展区非常吸睛,vivo 时光长廊。从第一台电话机、第一台功能机,到多条产品线布局完善的智能手机,看着眼前一款款经典产品,大家一下就被拽进与 vivo 的专属回忆,vivo 三十年的来时路也就此具象化。

 

这自然会引出一个问题,接下来 vivo 要去哪?

答案落在 vivo Vision 探索版——vivo 团队探索未来科技的最新成果。三十周年之际,vivo Vision 混合现实头显正式亮相,影像技术战略全面升级,其重要意义凸显。

在很多武侠故事里,绝世高手往往有两种。一种是追求奇功秘籍,招式越炫酷越好,讲究一招「天外飞仙」定胜负;另一种则不然,他们可能一辈子只练几招基础功,但练到极致,一拳一脚皆成杀招。

 

vivo Vision 探索版|图片来源:极客公园

 

vivo Vision 给人的感觉,就有点后一种高手的味道:不玩那些虚无缥缈的「元宇宙」概念,而是用最顶尖的技术,去解决一个最基础、最朴素的用户需求。

过去几年,科技圈里刮概念风是一种常态,无论是「下一个计算平台」的宏大叙事,还是各种炫技产品,总之,先把饼画出去再说。相比之下,本分的 vivo 在过去三十年以及 vivo Vision 上的表现,都显得异常「踏实」。

01

vivo 的「窄门」与「长桥」

 

8 月 21 日下午的这场发布会,vivo 并没有急于描绘一个遥远的未来,他们甚至没怎么提曾经代表着一个时代的「元宇宙」三字。他们花了大量时间,在回顾过去,讲一些听起来很「基础」的东西:怎么让头显戴起来更舒服、怎么让交互更自然、怎么让你用手机拍的照片和视频,能在头显里获得更好的体验。

这背后其实是一种选择。当许多厂商都在争抢「元宇宙」这个宽阔无比的大门时,vivo 似乎选择了一扇更窄的门:先服务好现有的全球超过 5 亿的手机用户。

举个例子,目前 MR 行业最大的痛点之一,就是内容生态的匮乏。每次我和别人分享我使用 MR 头显的体验时,大家总是异口同声地会问同一个问题「我买个头显回来到底能干嘛?」关于这个问题,很多厂商的答案是,你可以玩游戏、看电影、开虚拟会议。这些都对,但对普通用户来说,吸引力似乎总差那么一点。

vivo 给出的答案不太一样。他们说,我们最重要的内容,就是你用 vivo 手机记录下的生活本身。

这听起来很简单,但实现起来却是一座需要长期投入才能建成的「长桥」。这座桥的一端,是 vivo 深耕了十多年的影像技术——从和蔡司的深度合作,到自研的 V 系列芯片,再到不断打磨的传感器和算法,确保用户能用手机拍出足够好的照片和空间视频。而桥的另一端,就是这次发布的 vivo Vision 探索版。它的首要任务,就是成为这些影像内容的最佳「终点站」,一个可以让你「回到」记忆现场的设备。

 

vivo Vision 的核心场景——影像|图片来源:极客公园

 

当别人还在为内容生态四处找开发者时,vivo 通过连接自己的手机和头显,为用户创造了一个源源不断、且极具个人情感价值的内容源。这个「生态闭环」,才是 vivo Vision 真正的护城河。

 

vivo Vision 的内容生态|图片来源:极客公园

 

它不是一个独立的炫技产品,而是 vivo 整个影像战略自然延伸出来的、负责体验升级的最后一块拼图。vivo 执行副总裁、首席运营官、vivo 中央研究院院长胡柏山在开场致辞中说,vivo 三十年走的是一条「用户至上、雕琢极致的产品之路」,这条路的方向是「科技照亮美好」,终点是「抵达每一位用户」。现在看来,vivo Vision 正是这条路上的又一个关键路标。

02

把未来戴在脸上,得先忘了技术

 

确定了「为谁服务、服务什么」这个核心问题后,vivo 在产品上的取舍就变得非常清晰。他们没有堆砌一些华而不实的功能,而是把几乎所有精力都放在了打磨基础体验上,核心目标就一个:让你在用的时候,可以忘了技术的存在。

首先是佩戴感,这是最基础,也最容易被忽视的「基本功」。MR 头显本质上是要「焊」在脸上的设备,不舒服一切都免谈。行业里动辄六七百克的产品,像个小头盔,戴上十几分钟就脖子酸、脸上出印,这直接劝退了大量潜在用户。vivo Vision 探索版硬是把重量做到了 398 克,高度和厚度也比行业均值缩小了约 26%。

这背后不是简单的材料替换,而是大量的、枯燥的、看不见的用户研究。vivo 的人因实验室联合国内顶尖高校,采集了海量国人面部数据,进行了深入的人体工程学分析。他们精准地找到了面部支撑的「黄金舒适区」,并通过精妙的力学设计,确保每一个支撑点的承压强度最大不超过 6.628kPa——这仅仅相当于人类呼气的极限压力值。

这种对「基本功」的执着,甚至到了有些「偏执」的程度。基于海量数据,团队最终设计出 4 组遮光罩与 8 套不同的亲肤泡棉组合,能够精准适配国人多样的面部轮廓,有效分散压力,减少漏光。

这意味着,他们没有试图用一个「通用」方案去应付所有用户,而是承认个体差异,并愿意为此付出巨大的工程和制造成本。甚至考虑到游戏等高动态场景,他们还特别设计了双环绑带,其上下分离的角度设计更符合东方人头型,即使在进行甩头、躲避等大幅度动作时也能保持稳定,同时还能适配多种发型,避免压发。这些细节,用户在看参数时可能根本不会注意,但一旦戴上,身体的感受是不会骗人的。

然后是交互。如果说手柄是上个时代的交互方式,那 vivo 这次显然想让用户彻底扔掉这个「拐杖」。他们搭载了基于「负设计」理念打造的全新操作系统——OriginOS Vision。

 

「舒适」是 vivo Vision 的核心要求|图片来源:极客公园

 

所谓「负设计」,如同自然造物,力求与环境相融,在简洁的表象下蕴含着清晰的逻辑和严谨的秩序,旨在与用户建立一种舒适和愉悦的情感连接。在这种理念下,你的眼睛就是鼠标,目光所及之处即为焦点;拇指和食指轻轻一捏,就是确认。这套「眼一看,手一动」的交互,几乎是人的本能,学习成本极低,号称 5 秒即可上手。

为了实现这种看似简单的「本能」交互,背后是长达四年的深耕。vivo 实现了高达 1.5°的高精度眼动追踪,其精准度相当于站在 2 米之外,准确地看向一块手表大小的区域。同时,系统支持 26 个自由度的手指级手势识别,以及垂直方向高达 75 度的超广识别范围,确保用户在各种姿态下都能被精准捕捉。

为了让虚拟与现实的融合天衣无缝,vivo 还采用了低延时的 VST(Video See-Through)算法,实现了从信息采集到处理和显示的全链路 P2P(Photon-to-Photon)延时低至 13 毫秒,达到了人体几乎无法感知的程度。这些冰冷的参数,共同构成了一种温暖的体验:从容无感。

当然,这一切体验的基石,是双目 8K 的 Micro-OLED 屏幕。它的像素密度之高,相当于将三台 vivo X200 Ultra 手机的像素点全部集中到一块邮票大小的屏幕上。但有趣的是,vivo 在介绍这块顶级屏幕时,反复强调的不是参数,而是色彩的真实性。他们把专业级电影监视器的色彩校准标准用在了每一台设备上,确保色彩准确度达到了专业级别的 DeltaE<2。为什么对色彩这么执着?答案还是回到了那个「生态闭环」上。

因为只有这样,才能保证你用经过蔡司认证的 vivo 手机拍出的世界,和你在这块屏幕里看到的世界,是同一个颜色。这种从输入到输出的体验一致性,才是最考验厂商「基本功」的地方。此外,他们还对每一台设备进行了双眼亮色度一致性校准,有效减少了因左右眼成像不一致而可能带来的视觉不适感。这些都是看不见的功夫,但恰恰是这些功夫,决定了用户是「尝鲜一下」还是「愿意常用」。

03

功夫下在看不见的地方

 

如果说,vivo Vision 探索版是 vivo 为用户搭的「硬件舞台」,那么他们在影像战略上的升级,则是在不断丰富这个舞台上的「剧目」,并且把舞台的地基打得更深、更牢。

vivo 影像战略从传统的「赛道思维」升级为「场景融合」。以前大家比的是谁夜景好、谁长焦强,像是单科竞赛。但用户在真实使用中,比如拍一场演唱会,往往需要长焦、暗光、抓拍、防抖等多种能力的协同作战。vivo 提出的「山顶也是 VIP」方案,就是这种「场景融合」思维的体现,它整合所有相关技术,去解决一个具体而复杂的真实痛点。

更有意思的是,vivo 开始把功夫下在了一些普通用户平时可能不太注意,但却至关重要的地方。

比如影像安全。在 AIGC 可以以假乱真的今天,一张照片的真实性变得越来越重要。在这种时代背景下,vivo 成为首个加入国际 C2PA(内容来源和真实性联盟)的中国手机厂商。这看起来离普通用户很远,但实际上是在守护整个数字内容的信任基础。vivo 首席安全官鲁京辉在对谈中表示,vivo 推出蓝图影像安全技术,核心价值就是化解由生成式 AI 引发的影像内容信任危机,因为「有了信任,才有真正的价值」。这是一种超越产品功能的责任感,也是一种在行业剧变前夜的深远布局。

再比如影像健康。这可能是整场发布会最令人意外,也最体现 vivo「本分」价值观的一环。vivo 宣布,将深度融合即将发布的 vivo X200 系列手机的长焦微距能力与专业医疗光学技术,推出一款专业级的便携式裂隙灯,让专业眼科影像走进基层医疗。

 

vivo 推出的一款专业级设备,可用于基层医疗|图片来源:极客公园

 

某种程度上,这几乎是一种来自手机巨头对一个传统行业的「降维打击」,把消费电子领域积累的技术势能,释放到更具社会价值的领域。这背后传递的信号是,vivo 思考的不仅仅是商业上的成功,还有技术能为社会带来怎样的正面价值。

事实上,vivo 的思考远不止于此。在内部的长期战略规划中,vivo Vision 这样的 MR 设备,被视作是未来家庭机器人走向千家万户的关键「桥梁」。MR 头显的本质,是让机器理解并融入真实世界,实现自然无感的交互。这套技术逻辑,与家庭机器人的发展路径不谋而合。

 

vivo Vision 下藏着团队更深的思考|图片来源:极客公园

 

今天,vivo Vision 用佩戴舒适性和「眼一看、手一动」的原生交互方式,让我们在虚拟空间中「回家」,去体验手机相册里的美好。这些在 MR 上打磨成熟的视觉和交互技术,完全可能被迁移和赋能给具备移动能力的家庭服务机器人。它们将不再是冰冷的工具,而是能感知家庭环境、理解用户意图、甚至陪伴家人生活的智能伙伴。vivo 正是希望通过 MR 这扇「窄门」,为未来的家庭机器人铺设一条坚实可靠的「长桥」,让科技真正成为家庭生活的一部分。

这种克制住商业扩张欲望,转而投入更基础、更长远领域的做法,和 vivo 三十年来「本分」的企业文化一脉相承。他们似乎坚信,把最基础的事情做到极致,比追逐最时髦的概念更重要。

这种坚持也体现在他们对影像文化的构建上。技术最终是为人服务的,而影像的终极意义在于表达和沟通。vivo 没有仅仅把自己定位成一个工具提供商,而是联合中国摄影家协会,共同主办了首届中国手机摄影大展。

 

首届中国手机摄影大展全国巡展首站|图片来源:vivo

 

这是中国摄协首次主办、并经中国文联批准的国家级手机摄影大展,其权威性不言而喻。此举的战略意义在于,它将 vivo 从一个技术品牌,提升到了影像艺术的推动者和行业标准的参与者的高度。中国文联副主席、中国摄协主席李舸在盛典上高度评价道:「vivo 十余年深耕影像技术的历程,恰是一场『用科技拓展艺术边界』的生动实践,让曾经需要专业设备才能实现的光影艺术,变得人人可触。」。

 

vivo 影像作品展中展出的作品|图片来源:vivo

 

今年,在这次大赛中获得组委会特别推荐奖的作品《生命的源泉》,由一位名叫「田鼠大婶」的创作者用 vivo X200 Ultra 拍摄,记录了甘肃民勤「种树姐姐」们的防沙日常。影像成为了连接乡村与外界的纽带,传递出平凡生活里的坚韧力量。通过聚焦并传播这样的故事,vivo 再次强调了其影像文化的核心——关注人,关注真实的生活,让科技成为传递温暖与力量的桥梁。

 

既是科技,也是人文|图片来源:极客公园

 

三十年前,vivo 从做电话机起步;三十年后,他们拿出了一款通往未来的 MR 头显。看起来跨度巨大,但内核从未改变:洞察用户的核心需求,然后用扎实的「笨功夫」去满足它。

当别人还在寻找元宇宙那扇华丽的大门时,vivo 选择先为用户的回忆,造一个足够温暖舒适的家。功夫到位了,满足最朴素的需求,或许就是最强的杀招。

10 岁的钉钉,想用「更主动」的 AI,重构工作本身

2025年8月25日 16:43

如果,陈航(无招)一直执掌钉钉,现在的钉钉会是什么样?

有些问题,可能注定没有答案。

回归钉钉 4 个月后,无招给出了自己的答案。

2025 年 8 月 25 日,钉钉 8.0 暨钉钉 AI1.0 版本的发布会上,无招以 CEO 的身份,时隔几年后,重新站在了新版钉钉的舞台上。

无招回归钉钉后,首次站在大舞台上和大家见面|图片来源:钉钉

发布会上,陈航一口气介绍了钉钉 One、企业 AI 搜索引擎「AI 搜问」、AI 表格、AI 听记、智能硬件 DingTalk A1 等超过 10 款 AI 产品。陈航的语速和 PPT 翻页速度是如此之快,你甚至能感到,这位钉钉的创始人,似乎在担心钉钉在 AI 时代被落下,「一揽子式」的全新 AI 产品,也在诉说着团队生产力和创造力的一次「宣泄」。

当产品的功能革新与创始人的回归交织在一起,我们看到的,不仅是一个软件的版本迭代,更像是一次深刻的战略宣言。钉钉 8.0,以及它所代表的「AI 1.0 应用」,正试图回答一个核心问题:在喧嚣的 AI 时代,我们究竟需要一个什么样的工具来辅助工作?

钉钉的答案,似乎是两个字——「具体」。

 

更聪明、更主动的 AI 小秘

钉钉 8.0 的核心,无疑是其全面 AI 化的决心。但它的实现方式,并非粗暴地在每个功能旁加上一个「AI」按钮,而是尝试将 AI 能力如水银泻地般融入已有的工作流中,塑造一个更懂用户、也更主动的 AI 助理。这个助理由几个关键部分构成,它们各自独立,又互为支撑。

钉钉 One:信息过载时代的「个人事务官」

「钉钉 One」是这次 AI 功能矩阵中最引人注目的部分。从定位上看,它不像是一个单一的聊天机器人,而更像一个集成式的「个人事务官」或「数字中枢」。在现代工作中,最大的挑战之一是信息过载与应用孤岛。我们的沟通在 IM 工具里,文档在云盘里,日程在日历里,任务在待办清单里。在不同应用间来回切换,耗费了大量精力。

 

钉钉 One 是一个更聪明的 AI 助理|图片来源:钉钉

钉钉 One 试图解决的就是这个问题。根据发布会展示,它可以聚合来自聊天、文档、日历、邮件等多个应用的信息,并基于用户的指令进行主动处理。例如,用户可以对它说:「帮我预约明天下午和市场部的会议,讨论第三季度复盘,把相关的文档发给他们,并生成会议纪要模板。」在理想状态下,钉钉 One 会自动解析指令,查询相关人员的空闲时间,创建日程,从知识库中找到相关文档,并附在会议邀请中。

这种「主动性」是其核心。它不再是被动等待指令的工具,而是能够理解复杂意图、跨应用执行任务的助理。这背后需要强大的自然语言处理能力和对用户工作上下文的深度理解。当然,从演示到大规模的可靠应用,还有很长的路要走,其真正的价值,需要用户在真实、复杂的工作场景中进行检验。

AI搜问:从「寻找」到「解答」的进化

搜索功能是所有办公软件的标配,但传统的搜索大多停留在「关键词匹配」和「文档定位」的层面。用户输入关键词,系统返回一堆可能相关的文件列表,用户需要逐个打开、阅读、筛选,才能找到自己需要的信息。

钉钉的「AI 搜问」则希望将这一过程从「寻找」升级为「解答」。它的核心逻辑是,用户需要的往往不是文档本身,而是文档里的那个「答案」。当用户提问「公司今年的差旅报销标准是什么?」,AI 搜问不应只返回《员工手册》或《财务制度》这两个文件,而应直接从这些文件中提取、整合信息,给出清晰的答案:「市内交通实报实销,长途差旅飞机经济舱标准,酒店住宿标准为一线城市 XXX 元/晚...」。

更进一步,它还能处理更复杂的、需要整合信息的提问,例如「总结一下『飞龙项目』上周的所有进展和风险点」。这时,AI 需要检索相关的聊天记录、会议纪要、项目文档,然后进行归纳总结,形成一份结构化的报告。这标志着搜索工具正在从一个「图书管理员」,向一个能读懂书籍并回答问题的「领域专家」转变。

钉钉AI表格:让数据分析回归业务本质

Excel 或在线表格是办公室的「三大件」之一,功能强大,但其复杂的公式、函数和数据透视表功能,也让许多非专业用户望而却步。数据分析的门槛,往往不在于业务理解,而在于工具操作。

「钉钉 AI 表格」的出现,正是为了拆掉这堵墙。用户不再需要学习 VLOOKUP、SUMIF 等函数,而是可以直接用自然语言下达指令。例如,面对一张销售流水表,用户可以说:「按销售区域统计每个季度的销售总额,并用柱状图展示出来」,或者「筛选出所有利润率为负的交易,并标红」。

AI 表格会将这些自然语言指令翻译成对应的表格操作,自动完成计算、筛选和可视化。这使得数据分析的能力不再是少数「表哥」、「表姐」的专利,而是可以赋能给每一位需要与数据打交道的业务人员。当工具的复杂度降低,人们就可以将更多精力投入到数据背后的业务洞察上,这或许是该功能最深远的价值。

钉钉 A1 是之后一系列硬件中首个亮相的产品|图片来源:钉钉

A1 硬件:连接数字世界与物理空间的AI触点

在所有软件功能之外,钉钉还发布了 A1 硬件。在软件定义一切的时代,发布一款硬件似乎有些「复古」。但仔细思考,这恰恰是钉钉 AI 战略「具体化」的体现。

工作,终究是发生在物理世界中的

A1 硬件的定位,是 AI 数字工具和物理生活世界的连接器。虽然发布会未透露其具体形态和功能细节,但我们可以合理推测,它可能是一个集成了麦克风阵列、摄像头和 AI 处理单元的桌面或会议室设备。它可以实现会议场景的实时语音转文字、自动生成会议纪要、识别发言人、翻译等功能,将线下会议的内容无缝同步到线上。它也可能成为一个物理形态的「钉钉 One」,用户可以通过语音直接与之交互,安排工作、查询信息。

硬件的存在,让 AI 不再仅仅是屏幕里的几行代码,而是一个看得见、摸得着的实体。它为混合办公、线下协作等场景提供了 AI 落地的物理触点,让钉钉的 AI 版图从线上延伸到了线下。

无招回归,更「具体」的钉钉

在发布会上介绍专门给创业团队打造的钉钉功能时,无招用几句话简单回顾了自己的两段创业历程:钉钉是「富二代」,团队什么都不用管,只要做产品就好;「两氢一氧」(HHO)算是真正的创业,为省成本连开空调都要严格控制时机。

可能恰恰是离开钉钉的经历,让陈航此次回归,更让「具体」成为团队的一个核心要素。例如,回来的 4 个月时间,陈航就让团队调研、复盘、研究客户提出的反馈,从设计、使用和功能等各个方面,对于钉钉应用进行更新迭代。

陈航甚至在发布会尾声给出了一个 One More Thing——神秘产品!|图片来源:极客公园

通过发布会,我们能看出,对于陈航和钉钉团队来说,「AI 重构工作」这样的战略,不会飘在空中,不会为了 AI 而 AI。相反,它会将 AI 技术作为一种新的「解题工具」,去解决那些过去难以解决的、更深层次的「具体」工作问题。

钉钉 One 解决的是信息协同的具体问题;AI 搜问解决的是信息获取效率的具体问题;AI 表格解决的是数据处理门槛的具体问题。每一个 AI 功能,都对应着一个明确的、在办公室里每天都在发生的场景。这正是陈航「具体」哲学的延续。在「AI 时代的工作方式」这个大框架下,他的回归,让钉钉的思考和行动,有了一个更坚实的锚点。

在发布会上,陈航介绍钉钉的一个新的功能「Zen」,该功能下,钉钉应用中会出现大海、高山等适用于冥想和放松的画面,而这些画面,都来自钉钉团队的同学之手。陈航也有意无意地回击了一下最近网络上关于钉钉工作时长的热议:「你看,我们钉钉生活也不是只有工作,我们也有精彩生活的。」

 

向下、发散

钉钉 8.0 版本的主题是「蕨」|图片来源:极客公园

本次钉钉 8.0 发布会,和以往的版本一样,选择了植物作为主题。这次的主题则是「蕨」。

蕨类,是地球上最古老的植物之一,历经数亿年演化至今。它不似花朵那般艳丽,也不像大树那般引人注目。它总是安静地生长在林下,盘根错节,缓慢而坚定地舒展着自己的叶片。

这个比喻,精准地概括了钉钉 8.0 所传递出的气质和战略意图。

向下扎根:在 AI 技术看似无所不能的今天,钉钉选择将目光放低,去关注那些最基础、最根本的工作需求。就像蕨类植物的根系,深植于土壤,汲取养分。钉钉的 AI,不是要创造一个脱离现实的「数字乌托邦」,而是要扎根于真实的工作流,解决泥土里的问题。

缓慢展开:AI 对工作的重构,不会是一场一蹴而就的革命,而更像是一次漫长的演化。钉钉用「蕨」的舒展过程,来比喻「AI 重构工作」的进程。这其中透露出一种清醒和耐心——不急于求成,不追求短期效应,而是准备好用足够的时间,让 AI 技术与工作场景进行深度、有机的融合,让用户在潜移默化中接受并习惯这种新的工作方式。

钉钉 8.0,既是其 AI 1.0 应用的正式发布,也是一次深刻的自我审视与战略回归。在创始人陈航「具体」哲学的指引下,在「蕨」类植物「向下扎根、缓慢展开」的意象中,钉钉为自己在 AI 时代的狂奔中,找到了一个冷静而笃定的节奏。

这条路或许不那么光鲜亮丽,但可能,会走得更远、更稳。

一年 20 万台出货,AI玩具公司 Haivivi 刚拿了 2 亿新融资,我们和创始人聊了聊

2025年8月25日 13:21

 

作者|苏子华

编辑|靖宇

 

刚刚,AI 玩具公司跃然创新(Haivivi)宣布完成 2 亿元 A 轮系列融资,中金资本旗下基金、红杉中国、华山资本、愉悦资本、招银国际、Brizan Ventures 等一线投资机构共同参投。

Haivivi 在过去一年时间里,出货量超过 20 万台(去除了退货量),成为全球出货最多的 AI 玩具公司。同时,他们也成为了这个赛道里,被一线投资机构押注最多的公司。

然而,Haivivi 创始人李勇对极客公园坦言,实际过程并不如听起来这么顺利,Haivivi 的资金曾一度紧张到差点关门清算。

在他们的第一代产品 BubblePal 上市前,公司已经在清算边缘。最终,在产品设计的极限取舍当中,销量「意外」爆发,公司起死回生。

回到 2024 年 6 月,他们将大模型引入玩具领域,率先推出了全球首款 AI 玩具 BubblePal。该产品支持角色扮演、多语言对话、AI 故事共创、长期记忆等一系列功能,还原了数十个经典 IP 角色。

Haivivi 第一代产品 BubblePal,以挂坠的形式挂在毛绒玩具上,按压进行对话|图片来源:Haivivi

 

后来,市面上开始出现大量的相似产品。

产品发布后,一些科技互联网从业者、投资机构不免会质疑 AI 玩具「硬件没壁垒」、「为什么需要 IP」、陪伴是否为伪命题。

李勇曾是天猫精灵合伙人,主导了天猫精灵从 0 到 3000 万销量的增长。李勇觉得,很多注重「情绪价值」的 AI 产品,无法用「硬件壁垒」「技术壁垒」等传统标准衡量。经过过去一段时间的摸索,Haivivi 已经逐渐形成了自己的 AI 玩具方法论,并即将推出旗下第二代 AI 玩具产品——CocoMate 系列,全球首款搭载端到端语音模型的 AI 玩具。

新产品采用可嵌入玩偶本体且支持拆卸的形态,同时,也是支持远程唤醒,以及主题卡游戏、聊天室等多种模式。

借此契机,8 月初,极客公园在 Haivivi 北京办公室与李勇做了一次访谈,他坦诚分享了团队在提供情绪价值、打造有生命感的 AI 伙伴、与顶级 IP 共创,以及面对商业的残酷现实,如何做取舍的实践和思考。问题涵盖了:

  • AI 玩具公司存活下来的关键是什么?

  • 儿童与成人对 AI 陪伴的需求差异,产品如何在不同人群中找到切入口?

  • AI 玩具是否有必要会说话?

  • 为成年人提供情绪价值的关键是什么?

  • 如何赋予 AI 玩具「生命感」?

  • 如何衡量 AI 玩具所提供的「陪伴感」和「情绪价值」?

  • 大厂会如何入局「AI 陪伴」赛道?

  • AI 玩具赛道下一个增长点在哪?

访谈中提到的部分精彩观点:

  • 如果相信 AGI 时代会到来,就会相信未来每个人都需要一个 AI 朋友。

  • 过去的 AI 玩具,所有输入都来自用户,这不符合朋友的定义;「AI 朋友」需要能够在没有和人类交互式时,自主学习和成长。

  • 现实中的朋友不会记住你所有事情,人类大脑有遗忘机制,AI 朋友也需要学会选择性遗忘;AI 玩具产品,所有功能、算法的取舍,都必须服务于「生命感」这一核心

  • 很多人说 AI 玩具「没有技术壁垒」,但情绪价值本身就是壁垒。

  • AI 陪伴产品为成年人提供情绪价值的关键是控制预期。

  • 有用户表示,孩子因为佩奇的劝说而乖乖喝水,这样的反馈比销量更重要。

  • 如果端侧 AI 玩具能实现无需联网,且零售价控制在 1000 元以内,将成为全球市场的巨大机会。

以下为对话内容,经极客公园编辑整理:

Haivivi 的第二代 AI 玩具产品——CocoMate 系列,奥特曼联名产品|图片来源:Haivivi

 

01 在差点清算的边缘,最后一搏

极客公园:新的融资进来,对你们意味着什么?

李勇:我们公司在产品上市并取得两个月销量之前,资金一直非常紧张——不管是我个人给公司垫钱,还是后来从银行贷款。去年融资环境差,投资人对 AI 玩具赛道很谨慎。

对我们而言,有了这笔资金,就能推进 2023 年就规划的事了。Haivivi 品牌从 2023 年成立,当时我们对 AI 玩具的规划有很多,但受限于资金和资源,很多想法没能落地。

今年就能从容地推进布局了,尤其是到今年 Q4,我们的产品矩阵、全渠道布局以及 IP 合作布局都会比较完整。

极客公园:你之前是天猫精灵合伙人,团队背景也不错,按理说融资应该更顺利?

李勇:并不是,我们公司注册至今已经 4 年,前两年创业的时候还没有大模型,当时也想做 AI 玩具,只能用上一代 AI 技术和玩具做融合,所以产品的用户体验不够好,走了些弯路。

直到 2023 年初大模型出现,我们才确定做 BubblePal 这款产品。但当时融资环境紧张,很多机构都很谨慎,大家都要求有实际产品、验证 PMF(Product-Market Fit)。

之所以能拿到高秉强(「中国芯片之父」香港科技大学高秉强教授)老师的投资,是因为他以个人名义给了我们第一笔钱,大概 100 万美金,我们才有资金投入研发。

到 2024 年 8 月产品真正上市时,高老师的这轮天使轮的钱已经基本花完了,研发太烧钱了。就像我刚才说的,后来我们还从银行贷款、我个人垫钱,那段时间资金一直很紧张,发工资都困难。

极客公园:你们是第一批做 AI 玩具的团队,过去一年来,最常听到的评价是什么?

李勇:最痛苦的是产品发售前后,听到的更多是质疑。没人看好这个赛道:硬件从业者觉得「已做烂」,他们经历过故事机、儿童手表、耳机、手机的红海时代,认为 AI 玩具硬件方案成熟(第一代产品方案与当年天猫精灵无本质区别),无创新空间;AI 从业者也不看好,认为「只是搭载大模型,不如 ChatGPT 智能,情商、智商有限」。

但我们更看重长远——如果相信 AGI 时代会到来,就会相信,未来无论孩子还是成年人,都需要有 AI 能力的陪伴载体。AI 能力持续提升后,人们会需要现实中的「AI 朋友」,形态可能是毛绒玩具、机器人等各种样子。

因为 AI 的发展不仅体现在「智商」层面,还涉及「情商」领域。所以我们坚定看好这个赛道。不过当时我们也不确定自身能否脱颖而出,公司能否坚持到行业爆发的那一天。短期来看,很多人对该领域持悲观态度。

正如我刚才提到的,2023 年初公司险些清算,当时钱已经不够了。我个人还有一些积蓄,当时我们团队有十几个人,我就和大家说,我可以用个人资金为大家发放 N+1 补偿金——那时公司刚成立约一年。

但如果大家认为,ChatGPT 的出现会给我们计划研发的 AI 玩具带来新机遇,那我们就再坚持 6 个月,看看能否成功融资。若能融到资,我们就继续推进项目;若融不到,届时我可能连 N+1 补偿金都无法承担了,因为我个人的现金储备也十分有限。

让我欣慰的是,这十几人的核心团队最终都选择了坚持。团队成员对我们所做的事是坚信不疑的。但当时融资确实异常艰难,和合作伙伴的合作也多是「刷脸」——因为我们没钱让他们帮忙制作 Demo,好在我之前在硬件领域深耕多年,有一些合作伙伴愿意帮忙提供 Demo 样品。

极客公园:你们现在融资和之前有什么变化?

李勇:到了去年第四季度,我们的产品量产,在市场上有了数据表现后,融资就相对容易了。投资人能看到用户在小红书、抖音的评论和视频,通过访谈、尽调也能了解真实反馈,销量也一直在涨。

而且,春节后 DeepSeek 火了,给用户做了一波市场教育,很多宝妈由此了解 AI 玩具,甚至认为「带 DeepSeek 的玩具就是 AI 玩具」,我们也算赶上了这波趋势。

不过也有一些投资人始终持怀疑态度,他们认为我们的产品缺乏核心技术壁垒——毕竟当时泡泡玛特还没有现在这么火爆。那时我们就一直在提 Jellycat 和泡泡玛特的模式,只是大家对「情绪价值+AI」的组合仍有疑虑。

极客公园:DeepSeek 那波热度给你们带来了多少新增销量?

李勇:从营销层面看,它主要起到了用户教育的作用。科技行业内可能没这种感受,但普通用户对 AI 的认知仍有限——2017 年天猫精灵量产时,那波智能硬件的用户体验还比较勉强,包括天猫精灵、小度、小爱等智能音箱的活跃与留存率都低。

因此,我们推广 AI 玩具时,本来需大量市场教育。而 DeepSeek 的热度,一方面让部分用户建立了对 AI 的信心;另一方面,也消除了部分用户对生成式 AI 的恐惧,比如担心它教坏孩子,毕竟内容可控性存疑。但 DeepSeek 已上升到国家战略层面,用户对 AI 的恐惧会因此减轻。如果仅靠我们这样的创业公司去宣传,说「用了开源技术、做了内容审核」,力度远不如国家层面的重视。具体到销量,今年 3 月销量较之前增长了 2-3 倍,这也让我们很开心。

极客公园:第一代产品卖了 20 多万台,这在预期之内吗?

李勇:不在。我们最初认为能卖几千台,最多 1-2 万台。第一代产品做了很多取舍,并非我们最初设想的样子,核心是为了测试 PMF、收集用户反馈,最初备货也只备了 2000 台。

但实际反馈很好,我们后来反思,这可能是「知识陷阱」——我们从 2022 年底接触大模型,到 2024 年 8 月产品上市,已习惯大模型的连续对话、角色扮演功能;但用户此前从未接触过能角色扮演、连续对话、有长期记忆的 AI 玩具,他们对比的仍是传统故事机、小天才儿童手表、小度/小爱智能音箱。有大模型的 AI 玩具与几年前的智能硬件相比,体验上确实有革命性提升。

极客公园:打磨 AI 玩具产品,资金主要花在哪些方面?

李勇:最多的是研发,团队研发成本开销占比最大;其次是 IP 合作费用,我们已签约不少知名 IP;此外还有渠道建设、日常运营管理的费用。

极客公园:网上说 AI 玩具退货率高的问题,你怎么看?

李勇:前段时间我们实际销量已超 25 万台,但我们对外宣传改为 20 万台,我们去掉了退货量,更坦诚地公布实际销量。第一代产品早期退货率超 30%,目前综合退货率仍有 20% 多

这其实是创新品类的普遍现象。玩具品类本身存在「吃灰」问题,活跃与留存率低,且购买者(家长)与使用者(孩子)分离,这些都会导致退货;此外,AI 玩具零售价普遍高于普通玩具——泡泡玛特等品牌的盲盒、积木等产品,原价多在 100 元左右,而我们第一代产品定价 399 元,在玩具品类中偏高,这也是退货原因之一。

当然也有用户体验因素。新品牌前两三个月退货率会更高,呈现两极分化:喜欢的用户认可度很高,不喜欢的用户觉得远超预期落差,认为宣传夸大。

我之前做过 VR 眼镜,AR/VR 行业(包括苹果、Meta 的产品)退货率也很高,这是新品类的两难困境——为了营销和市场教育,需要展示功能卖点,但用户期望随之升高,购买后容易因为落差退货。

因此,我们在产品定义上相对克制,营销时刻意将目标人群限定在 3-6 岁儿童,从未宣传任何教育功能。现在有些 AI 玩具从业者宣传「教育内容丰富」,不用猜也知道他们的退货率一定高。

如果宣传「教拼音、练口语」,虽能促进购买决策,却容易因大模型幻觉等体验落差退货。

我们的 slogan 是「回应每一个奇思妙想」,但其实很难用一句话总结第一代产品卖点——「陪伴」、「情绪价值」需用户实际使用才能感知到,我们选了一条更慢的路径。

02「哪些决定忍住没做,现在看来是正确的?」

极客公园:如今回过头看,是否存在一个当时你忍住没做的决定,现在看来是正确的?

李勇:之前负责天猫精灵营销工作时,我的老板需要向逍遥子汇报工作,做天猫精灵一年来的年终总结汇报。我看到给逍遥子的汇报模板,除了阐述年内完成的工作复盘,还有一页要求列出没做的事项以及为什么没做。看到这一页时,我很震惊,它其实和你的问题本质相同,就是取舍。

无论是创业者,还是团队管理者,我们常会复盘这段时间做了哪些决定、哪些正确、哪些错误,但很少思考「哪些决定没做」——这些未做的决定中,是否存在本应做的正确选择,或是庆幸没做的错误选择?

去年年底团队复盘时,我也向团队提出了这个问题。我认为这个问题极具价值,当时我们发现,很多未做的选择,如今看来是正确的。

比如,最初我们本想开发一款完整的毛绒玩具,还计划采用远厂语音交互技术,这些在当时都是成熟的技术,但现在看来,幸亏没做。

一方面,与 IP 方合作的监修审核时间远超预期。以头部 IP 奥特曼为例,最初我们预计产品能在 618 前上市,但与 IP 方沟通后发现,他们对 IP 的理解更深,在共创产品过程中,IP 方提出了许多优质想法,这延长了合作周期。

另一方面,顶级 IP 对产品细节的把控细致程度远超想象——每一份营销物料、每一张宣传海报的发布,甚至产品材质的每一处细节,都需要与 IP 方深入沟通确认。

如果创业初期我没有认清这一现实,即便有足够资金推进合作,产品上市周期也会被大幅拉长。对创业公司而言,第一代产品需要做大量取舍,我们在硬件功能、IP 合作等方面都做了调整。

现在想来,很庆幸当时「做减法」做得足够彻底。在产品定义上,我没有过多执念,但这种取舍思维至关重要,尤其是硬件领域,要避免资源浪费。比如硬件设计中的某个功能,无论会增加成本还是制造难度,核心都要判断它能否切实提升用户体验,不能盲目投入。硬件领域的取舍比软件领域更关键。

极客公园:除了这个例子,还有其他「没做反而是正确选择」的情况吗?

李勇:除了 IP 选择和硬件功能取舍,产品定义的细节上也有很多案例。比如最初我们想在产品中加入大量功能,当时我对 AI 技术过于乐观,计划搭载端到端语音模型,还考虑过给产品加摄像头、屏幕,甚至端侧 AI 功能。

但过度乐观往往会忽略实际问题——当时加屏幕、摄像头的 Demo 已经完成,但最终没推进量产,核心是成本与用户体验的平衡还未达标。所以我们调整了产品优先级,目前推出的仍是纯语音交互产品,功能也未追求复杂。

03 AI 玩具是否有必要会说话?

极客公园:对于 AI 陪伴类产品来说,语音对话的交互方式本身是不是就有比较高的使用门槛呢?

李勇:市面上有些 AI 玩具不具备语音功能,也有其价值,适合特定人群和特定 IP,这一点我完全认同。

我们在创业初期选择方向时,就对 AI 玩具进行了大致分类:

第一类是「无语音交互的 AI 宠物」——这类产品模拟猫狗等宠物,本身不具备语音能力,仅通过情绪反馈与用户互动。

第二类就是我们当前专注的方向——将动画片中鲜活的角色还原到现实生活中,陪伴孩子成长。

第三类是偏具身智能的 AI 陪伴机器人——这类产品具备移动能力,能实现更灵活的交互。

我们选择第二类,主要是基于公司的核心禀赋:第一类产品与 AI 技术的关联性较弱,而我们此前有研发天猫精灵等语音交互产品的经验,更擅长第二类产品的研发。而语音交互是否是「好形态」,关键取决于具体应用场景和目标人群。

未来,我们也会推出无语音功能的 AI 玩具,也是在探索不同方向。

如果玩具配备摄像头和屏幕,无疑能提供更丰富的情绪价值——比如通过摄像头捕捉用户的表情,无需用户说话就能感知其喜悦、疲惫或焦虑;通过屏幕更直观地呈现内容。

但目前我们尚未推出这类产品,因为我们对带屏幕、带摄像头的产品有较高要求:如果满分 100 分,只有当模型能力和用户价值能达到 80 分以上时,我们才会推进量产。其实我们已有相关 Demo,但尚未进入量产阶段,因为目前的产品表现还未达到我们的标准。

极客公园:你们在等待大模型能力达到预期后,再推出相应的产品。

李勇:是的,不仅是大模型能力,我们还在开展端侧 AI、多模态以及运动控制的相关预研。一方面等待基座模型公司提升技术能力,另一方面也在与大模型公司、芯片公司等合作伙伴共同开展预研。

只有当产品的用户体验、成本控制和零售价能达到平衡时,我们才会推出。

极客公园:哪些 IP 适合接入语音交互功能,哪些不适合?

李勇:判断标准其实比较明确,如果 IP 在原有作品(如动画片)中已具备完整世界观和鲜明的声音形象,那么从用户视角(尤其是儿童)出发,现实中的对应玩具若无法说话,反而不符合认知逻辑。

过去受技术限制或成本较高,玩具难以实现自然语音交互,如今借助大模型技术,这一问题得以解决,本质上是回归用户对 IP 的自然认知。

04 让 AI 成为成年人的朋友、更有「生命感」的三个关键

极客公园:你之前提过,大模型为成年人提供的情绪价值还不够,所以你们当时选择先做儿童产品。那么,怎么衡量一项技术或产品能提供的情绪价值有多少?

李勇:相较于为成年人研发 AI 玩具,为儿童研发玩具恰好是我们团队的优势领域。我们有服务儿童群体的经验,且关于儿童成长的理论研究和学术论文非常丰富,因此,我们先从儿童产品入手。

儿童没有手机作为对比参照物,而成年人在使用 AI 硬件时,会不自觉地与手机功能对比——这是很多 AI 硬件产品都会面临的问题。

而且,给成年人提供情绪价值要复杂得多,需要考虑他们的工作、感情等多方面生活状态。在 2023 年我们启动项目时,以当时的 AI 能力,很难满足成年人的情绪需求——因为成年人有太多其他渠道可以获取情绪价值,AI 硬件的竞争力不足。

我们为什么认为现在情况有所好转了呢?

一个关键节点是「深度思考模型」的出现。我第一次接触到深度思考模型时,非常震惊——我们完全没预料到大模型会向这个方向发展。

最初行业普遍认为大模型的发展方向是「智商」不断提升、响应速度不断加快。但深度思考模型的出现,我很快反应过来,人既需要快思考,也需要慢思考。对个体而言,大脑本就是两套系统交织运作。我们因研发语音交互类产品,过度关注延迟表现——比如用户与产品对话时,希望快速获得反馈,所以这类指标一度成了我们公司最核心的考核项。

天猫精灵此前也是如此,优先关注延迟,其次才是基座模型的能力、与情商表现。我们忽略了慢思考这一维度,而当意识到深度思考模型的价值时,我们格外兴奋——终于有可能为成年人打造一款具备新价值的 AI 玩具。

过去的 AI 玩具,所有输入都来自用户,这不符合朋友的定义,也导致用户留存率与活跃度偏低。

即便是孩子,使用久了也能发现「玩具只会对我输入的内容做即时反应,而不会自己反思」这一问题。所以 2023 年我们就思考:如果这个「朋友」能自主学习、成长就好了,但与用户交互时又必须即时反馈,这就产生了矛盾。

而有了深度思考能力后,我们可以为 AI 玩具搭载 Agent(智能体):比如在夜间闲置时,Agent 自动启动学习。若用户当天聊到滑雪,它就自主学习滑雪相关知识;第二天用户提及想去日本游玩,它就收集日本旅游信息;到了第三天,当用户说「想去日本滑雪」,它能立刻回应:「我听说这周日本可能有台风,你要小心,是不是下周去更合适?」

如果没有具备深度学习与思考能力的模型,Agent 根本无法实现静默的自我反思、成长,用户永远不会将其视为朋友。

当然,这只是第一步——朋友在非交互时段自主学习成长,是「朋友」属性的基础门槛。

除了模型能力的提升,为成年人提供情绪价值还需「做减法」。

在我们看来,若想让成年人情绪价值体验达到优秀甚至超预期,必须降低用户预期——交互时先锁定、框定用户的期望,期望越低,模型越容易超出预期。

用户看到这个 IP 形象,就应该知道它的核心功能是哪些,不会将其视为全能助手,而是「有限领域的朋友」。

现实中也是如此:如果有一个无所不能的朋友,你不会将其视为平等的朋友,更像「上帝」或「神」;真正的朋友必然有突出的长板,能让你产生情感投射,这样感情才会稳固,绝非全能。

因此,我们在角色设定、产品外形、IP 选择及模型能力上都在「做减法」,通过这些洞察与研究,至少能在成年人某一特定情绪需求领域,输出有效的情绪价值。

极客公园:让 AI 更有生命感的关键还有什么?

李勇:首先,它需要在非交互时段自主学习、成长,通过分析与用户的聊天内容,推测兴趣爱好,积累共同话题——这是基础步骤。

其次,还有价值观对齐。现实中,相处 10 年的朋友,价值观会逐渐靠拢,否则会渐行渐远。

我们希望 AI 朋友也能如此,比如同一型号的赛罗 IP 玩具,出厂时 Prompt 一致,但使用一两年后,Prompt 会随用户兴趣差异发生变化、自主学习,实现价值观对齐。

此外,更复杂的是「遗忘机制」。第一代产品的核心难题是「长期记忆」——如何存储聊天记录,当时向量数据库技术不成熟,我们投入大量精力研发向量数据库、RAG(检索增强生成)等技术。

而如今为成年人提供情绪价值,「遗忘」同样关键:现实中的朋友不会记住你所有事情,人类记忆有主动遗忘与被动遗忘——被动遗忘是因时间流逝自然淡忘,主动遗忘是刻意忽略某些内容。

比如,若 AI 能记住用户每句话,当用户否认「说过某件事」时,AI 若反驳「你在几点几分说过,我有记录」,会让用户极度反感。

参考心理学理论,比如「彼得斯原则(Peter's Principle)」,认为主动遗忘与三个因素相关:时间长短、提及频率、记忆当时的情感浓度——情感浓度如同「染色剂」,决定记忆是否深刻。我们当前用模型识别对话的情感浓度,作为遗忘权重,但这仍不够。

若仅按「情感浓度+提及频率」设计遗忘算法,若用户频繁吐槽负面内容,AI 会持续提取负面记忆并回复,导致用户陷入负面循环。

因此,研究传统遗忘理论(我们查阅了大量相关论文)仍然不够,还需研发「跳出机制」:让 AI 主动唤起用户的积极记忆,帮助用户脱离负面情绪。这就是我们近一年在算法层面,为成年人 AI 玩具打造「生命感」的探索方向。

05 先共情,站在用户角度表达理解——才是情绪价值产品的核心

极客公园:在近期产品开发中,有没有某个时刻或某组数据(哪怕很小),让你们觉得「方向走对了」?

李勇:很多是来自用户反馈的瞬间。

比如,有用户分享短视频:孩子生病后不爱喝水,家长劝说无效,于是在我们的玩具中输入「鼓励多喝水」的 Prompt。当孩子与佩奇玩具互动时,佩奇说「我们一起玩,但你要先喝完水」,孩子立刻就把水喝了。

还有一次,在我们抖音直播间,有用户让主播演示:「问 AI『妈妈不要我了,怎么办』」,AI 玩具回答:「妈妈不是不要你,她可能是上班忙,回来后你多和她聊聊,多安慰她」,接着用户又让我们主播问 AI 玩具:「妈妈不是上班忙,是跟别的男人走了,不要我了」,AI 回复:「首先你没做错任何事,大人们有自己的考量,即使爸爸妈妈不在一起,他们依然爱你」。

没想到这位用户说,她是一个继母,因为孩子常问她「为什么亲妈不要她了」,她不知道怎么回答,AI 玩具的回复正好解决了她的困扰。类似的用户反馈,让我们确信「方向走对了」。

极客公园:同样的问题,如果直接问 DeepSeek 等通用大模型,可能会得到不同答案。

李勇:通用大模型的回答往往更「标准化」。

比如用户问「在学校被欺负了怎么办」,通用大模型可能会说「找学校管理层沟通」,这类回答追求「最大公约数」——因其用户群体广泛,需兼顾普遍性。

如果用「回答内容(主观/客观)」与「表达方式(冷静/情绪化)」构建坐标系,多数通用大模型的回复处于「客观+冷静」的第一象限。

而情绪价值类产品的回复,需在「内容上更主观、表达上更情绪化」。比如,用户说「玩具在学校被抢了」,朋友不会先罗列「1234 条解决方案」,而是先共情,站在用户角度表达理解——这才是情绪价值产品的核心。

极客公园:如何让模型回答更具共情力?

李勇:我们在语料选择和模型微调上有差异。比如与 IP 方合作时,需依据 IP 世界观对模型进行微调。我们的模型微调采用大量对话式语料,表现更具主观性和情绪化,能基于角色世界观作答。

比如,向小猪佩奇与爱莎公主提问「量子纠缠」的问题,得到的答案不同——AI 玩具不会照搬百科内容,而是结合自身角色设定回应。

佩奇会举例:「就像我和弟弟乔治玩捉迷藏,虽然看不见对方,但我们彼此心有灵犀。」

爱莎公主则会以自身角色视角解释:「这很神奇,如同我在魔法世界里有两个冰雪魔法球,转动其中一个,另一个的状态就会受到影响。」

所有角色均会依据自身世界观回答,让用户感觉是与自己喜欢的朋友共同面对问题。

06 关于新一代 AI 玩具和大厂竞争

极客公园:你们刚发布了新一代 AI 玩具,为什么选择与奥特曼 IP 合作呢?

李勇:我们已经签约了多家 IP 方,综合考虑了其全球影响力、在中国市场的受欢迎程度,以及双方合作的意愿和配合程度——这些因素让奥特曼成为了推进速度最快的合作项目,所以我们首款产品选择与奥特曼 IP 合作发售。

极客公园:这款产品的目标人群还是 3-6 岁的儿童吗?

李勇:目标人群稍有扩充,因为很多小学生也非常喜欢奥特曼,所以年龄范围可能扩展到 10 岁,甚至 12 岁。

极客公园:软件功能层面,新产品会增加哪些能力?

李勇:新增功能很多,最显著的是采用了端到端语音模型。

第一代产品采用的仍是传统的「语音识别(ASR)到语音合成(TTS)」技术链路,而新产品采用的是「语音到语音」模型,实现了语音输入直接对应语音输出。首款合作的是字节跳动的模型,目前其表现最佳、响应速度最快。

当然,与其他公司的合作也在推进中。简单来说,新产品的语音输入能保留情绪——传统的「语音转文字」过程中,情绪信息会丢失,而新模型解决了这一问题。情绪信息的保留能让我们实现更多功能,比如当我说「今天心情不好」时,产品能更准确识别用户的情绪,因此回应语气能传递出更准确、更充沛的情感。其次,新产品的交互延迟也大幅降低。

极客公园:你们第一代产品仍需要按下按键才能进行语音交互,而第二代新产品已经支持远程唤醒了,主要是克服了哪些技术问题?

李勇:这并不是技术问题,更多是产品设计上的取舍。

在研发第一代产品时,我们就已预判到两个可能成为核心问题的点,后来的市场反馈也证明,这两点确实是用户对第一代产品的主要差评——一个问题是「按键说话」:有些孩子手比较小,按压说话时会感到不便;第二个问题是联网限制,第一代产品仅支持 2.4GHz 单频 WiFi 联网,这导致产品在户外很难使用。

这两个差评其实是我们在定义第一代产品时就已经预料到的「不得已的取舍」。

2017 年,我参与研发的首款量产天猫精灵就已实现远程交互,所以远程唤醒本身并非技术难题。但要实现远程唤醒,对硬件配置有更高要求——比如麦克风数量,尤其对功耗控制的要求更为严格。天猫精灵是插电使用的设备,无需考虑功耗问题;但我们的产品体积较小,如果为了容纳更大电池而增大体积,会带来新的问题:一是无法适配多数玩偶的尺寸,二是孩子也难以握持。

同时,我们对产品续航有明确要求——不希望用户每天充电,不希望给用户增加额外使用负担,因此在第一代产品中没有加入远程唤醒功能。

而 WiFi 问题同理:若要支持双频 WiFi 或内置 4G SIM 卡,会大幅增加成本和研发周期。当时公司账户已经没钱了,我们甚至需要借钱维持运营,根本无法承担这些额外投入。

不过第二代产品已解决这些问题:我们内置了一张 4G SIM 卡,用户开机即可使用,无需下载 APP 配置网络,开机直接就能与奥特曼聊天。

极客公园:有什么新功能是只依赖大模型没有办法解决的?

李勇:目前市面上几乎所有 AI 玩具的连续对话功能都存在一个共性问题:当孩子正在听故事或听歌时,外界稍有声音干扰,播放就会被打断。比如,孩子正听到故事关键处,妈妈突然说「过来吃饭了」,或者出现走路声等,都会导致播放中断。

如果只是简单对接一个通用大模型,就只能接受这种中断问题。

所以,我们在新版本的技术架构上做了「多音轨混音处理」,这在工程实现上较为复杂。简单来说,希望实现的效果是:当孩子正在听「孙悟空三打白骨精」的故事,过程中突然提问「唐僧这时候在哪里?」——此时,我们产品会降低故事音轨的音量,开启另一条音轨优先回答孩子的问题,故事本身不会中断;待问题回答完毕后,再将故事音轨的音量恢复。

想实现这一功能,必须支持多音轨传输,而单纯使用云厂商提供的标准大模型方案是无法做到的,需要进行大量工程优化。

其实,「连续对话+抗干扰」的功能构想,我们在 2023 年研发第一代产品时就已想到,只是当时考虑综合交互体验、成本和研发周期,只能退而求其次采用「按键说话」模式。这就是产品功能迭代中常见的取舍。

极客公园:未来新品仍旧是毛绒玩具,还是会推出非毛绒玩具类产品?

李勇:我们会推出非毛绒玩具。公司定位是 AI 玩具公司,业务不局限于儿童领域,也不被毛绒材质束缚。

比如,我们签约的知名 IP 授权均属于 AI 玩具类目,对玩具材质和形态无限制,只要适合以 AI 形式呈现且能提供情绪陪伴价值,都在我们的考虑范围内。

IP 布局采取「两条腿走路」:一方面通过与知名 IP 联名弥补自身短板,并向泡泡玛特等优秀 IP 团队学习;另一方面自主孵化 IP,我们新上市的三款产品中,两款为奥特曼 IP,一款由我们签约的全职设计师(原合作艺术家)设计开发。

CocoMate 系列 AI 玩具之一「泡泡」|图片来源:Haivivi

极客公园:有观点认为大厂不会涉足 AI 陪伴赛道,因它属于情绪价值生意,但近期 OpenAI 也在布局 AI 陪伴硬件,你如何看待大厂进入该领域?

李勇:我认为大厂可能会布局广义上的 AI 陪伴硬件(如家庭机器人,可陪伴家庭成员),但不会涉足「AI+IP」玩具领域。

原因有二:一是大厂有更重要的战略级、入口级业务布局,如 AI 眼镜、自动驾驶等更大规模的市场,相比之下,「AI+IP」玩具的优先级较低;二是情绪价值赛道不确定性高,难以规模化复制。

大厂擅长从 1 到 100,但情绪价值相关指标(如玩具的「生命感」)难以量化,若调动集团资源投入,KPI、成果考核等都很难设定,最多仅会安排小团队试错。

而小团队试错对我们构不成威胁,我们更关注大厂是否会投入战略资源。IP 本身的爆火具有随机性,即使是泡泡玛特、迪士尼,也无法精准预测或流水线式复制爆款 IP,这种高不确定性使「AI+IP」玩具不适合大厂布局。

极客公园:接下来半年,你最期待发生的一件事是什么?

李勇:最期待端侧模型的技术突破。

我们一直在探索:如果端侧 AI 玩具能实现无需联网,且零售价控制在 1000 元人民币以内,将具有极大市场潜力,尤其在海外市场——无需联网可解决隐私和延迟问题。

目前受成本限制(内存、CPU、电池功耗较高),这一目标尚未实现。如果未来半年至一年内,能有优秀模型量化至 1.5B 参数,同时保证足够的智商、情商与推理能力,至少满足儿童陪伴需求,我们将非常期待。

另外,对于有隐私需求的成年人而言,端侧 AI 玩具如同「树洞」,可以让用户更安心地分享情绪。

我们也希望成为全球首个推出端侧 AI 玩具的团队。

 

扎克伯格,也顶不住了

2025年8月25日 13:14

在今年的 AI 竞赛中,Meta 可以说是那个突然把油门踩到底,疯狂想赶超对手的玩家:招人猛、给钱狠、组织结构三番五次推倒重来。

直到今年 8 月中旬,Meta 这家巨头又突然刹车,AI 部门「冻结招聘」。不仅暂停对外扩编,连内部 AI 人员也被明令不得随意在团队间流动,除非得到批准

Meta 官方口径叫「基础性的组织规划」,语气轻描淡写:预算季结束,先把「超级智能实验室」新的组织架构定型,再谈下一步。

究其原因,在资本市场,华尔街分析师已经就科技巨头的 AI 支出发起警告

过去数月,Meta 为抢人开出的薪酬与股权包一路飙升,投资者开始追问:这些天价换来的,是可验证的技术进展,还是无止尽的摊薄与成本扩张?

与此同时,业内不少人也在质疑,Meta 高薪挖来各种顶尖 AI 人才,是否会加剧内斗,比如一些老员工对新来的「明星科学家」并不买账,此前 Meta 不同 AI 团队间曾因计算资源分配、技术路线理念不和频起摩擦,部分员工被边缘化导致士气低落,有的员工甚至选择离职创业等等。

当下,Meta 的 AI 人才争夺战,已经打到了临界点,无论是华尔街还是硅谷,都在盯着 Meta,是否真能靠这些人拿出成果。

01

Meta AI 大换血

2025 年上半年,Meta 在 AI 人才战里的打法可以用三个字概括:快、狠、贵。

无论是 OpenAI,还是谷歌 DeepMind、Anthropic、苹果的 AI 人才,被 Meta 接触时有时不是「猎头-HR-面试」的传统流程,而是扎克伯格本人直接通过邮件或 WhatsApp 发消息,直接走 CEO 的绿色通道,快速签约

在 Meta 这儿,天价薪酬「大包」也是见怪不怪,签约金以亿美元计,一些 AI 研究人员获得四年 3 亿美元的超级薪酬包,个别顶级人选的天花板级报价据传高达 15 亿美元,均堪比职业球星。而且,这些被挖角的人里,有不少都是华人面孔。

扎克伯克与 Alexandr Wang、Shengjia Zhao|图片来源:Meta

除了传统招聘,Meta 还采用「反向收购式挖人(reverse acquihire)」方法:与传统 acquihire 的整合式收购不同,不是直接收购整个初创公司,而是直接挖走核心关键人才,初创公司继续存在但可能萎缩。

Meta 为 引入 Scale AI 联合创始人 Alexandr Wang 担任首席 AI 官,付出了约 140 亿美元的少数股权投资。除此之外,Meta 还通过向由 Nat Friedman 与 Daniel Gross 主理的基金注资,把这两人纳入麾下,前者曾任 GitHub CEO,后者曾于 2024 年与 OpenAI 联合创始人 Ilya Sutskever 创办 Safe Superintelligence。

就这样,到 2025 年中,Meta 已经打包吸纳了至少 50 名来自竞争对手的 AI 人才,其中四成来自 OpenAI,两成来自谷歌

业内看得目瞪口呆,OpenAI 的管理层公开吐槽 Meta「疯狂」,形容被 Meta 挖人就像「有人闯入我们家偷了东西一样」。

Alexandr Wang 公布的 Meta 超级智能实验室人才|图片来源:X

然而,一次性疯狂吸纳「新血」也有问题。硅谷不少工程师有一个看法,Meta 疯狂招人相当于一次性把几十位 A 级球员装进同一个更衣室 ,「位置」与「打法」的冲突可能很难避免。

经过半年内的数次重组变化,据华尔街日报消息,Meta 最近决定将不同 AI 业务一并纳入「Meta Superintelligence Labs」,分为四个部门:

面向 AGI 的研究团队(内部暂名 TBD Lab),新员工主要在这个团队工作;

AI 产品团队;

构建训练与推理底座的基础设施团队;

继续承担长期探索任务的 FAIR。

Meta 发言人对外则将冻结招聘解释为「基本的组织规划:在招募人员并进行年度预算和规划工作后,为我们新的超级智能工作创建一个坚实的结构。」

还有消息称,由于 Meta 人工智能部门近年来人员增长至数千人,该巨头正在考虑整体缩减规模。

Meta 过去负责 Llama 系列的大模型团队「AGI Foundations」被解散,有成员打算离职。因为今年春季发布的 Llama 表现不及预期,不仅在内部受到了尖锐批评,在更广泛的社区口碑也趋于平淡。另一款代号 Behemoth 的前沿模型在测试中成绩不理想,被直接砍线。

与此同时,Meta AI 之前的研究负责人 Joelle Pineau 今年早些时候离职加入 Cohere,Llama 项目研究员 Angela Fan 选择转投 OpenAI,Meta 生成式 AI 副总裁 Loredana Crisan 则跳槽到 Figma 出任首席设计官。再加上 8 月部分期权归属窗口期,Meta 可以说迎来了「旧部出走,新人入列」的换血期。

在这个时间点看起来,疯狂招人又突然冻结招聘,对 Meta 来说并不矛盾,在继续加人之前,先得避免内外部越来越大的「噪声」。

02

华尔街的警告

对 Meta 来说,内部「噪声」是团队稳定性,外部「噪声」则是资本市场的压力。

扎克伯格狂撒钱挖人一时爽,最终还是要面对报表。当 Meta 的 AI 投资成本快速上涨,华尔街开始担忧,这些钱,何时、以何种形式回流?

最新一轮的市场反馈并不轻松。今年 8 月,摩根士丹利分析师在研究报告里称,包括 Meta 在内的科技巨头,向 AI 人才发放的股权规模正在膨胀,如果最终成果无法在合理时点转化为可计量的现金流,这种做法将侵蚀回购能力、压缩股东回报。

在他们看来,在挖 AI 人才方面投入巨资「有可能推动 AI 突破,创造巨大的价值,也有可能稀释股东价值,且不会带来任何明显的创新收益 」。

扎克伯格在 Meta Connect 大会上|图片来源:Meta

与此同时,硅谷科技巨头的股价正经历一波「AI 开支焦虑」的集体回调,不是说唱衰 AI,而是对「投入产出比」的担忧,就像投资了几千亿美元,如果最终收入只有几百亿美元,冰冷的市场就不会买账。

2025 年 8 月 20 日前后,一些科技股遭抛售,包括 Meta 在内的公司股价连跌几天。虽说因素不是单一的,但市场关注到几个可能的「罪魁祸首」,包括 OpenAI 首席执行官 Sam Altman 最近的评论,他认为 AI 热潮具有一些类似泡沫的特征。

Meta 自身的数字也说明问题:该巨头把 2025 年资本开支指引上调至最高 720 亿美元,这些花费的核心去向是「AI 基建」以及「人才」。数据中心在建,GPU 在路上,团队在扩编,利润端自然被压。

面对投资者冷冰冰的质疑,Meta 暂时「冻结 AI 人才招聘」的动作,除了真的是为了巩固内部 AI 组织架构,另一方面,也成了向市场发出「控制成本」的信号。

但因冻结 AI 招聘一事引来的各种声音,如今身为 Meta 首席 AI 官的 Alexandr Wang 坚称,「我们确实在加大对 Meta 超级智能实验室的投入。任何与此相反的报道显然是错误的。」

Alexandr Wang 称 Meta 仍在加大超级智能实验室的投入|图片来源:X

扎克伯格豪掷重金挖来这些 AI 人才,赌的是超级智能的未来。至于这个赌注是否能带来实质性成果,是决定 Meta 命运的关键。

如果答案是肯定的,那么眼下的「刹车」将被历史视为战略性的换挡,华尔街的焦虑也将随之平息;反之,若这一年的投入最终换来的是平庸的成绩单,那么冻结招聘可能只会被看作一次无序冲刺后的力竭,暴露出 Meta 组织在方向与节奏上的失控。

接下来的每一个月,都将成为答案的一部分。

小米 SU7「加长版」测试车外观曝光;Meta 被指控使用盗版成人影片训练模型;英伟达推出史上最强迷你 PC

2025年8月25日 08:17

英伟达推出史上最强迷你 PC:最高 2070T AI 性能、128G 内存

日前,NVIDIA 正式推出了号称史上最强、最小的迷你 PC——Jetson Thor 系列,AI 性能可达 2070TFLOPS,售价 2.5 万元起。

Jetson Thor 是专为 AI、机器人、边缘计算等设计的消费级平台,CPU 是 ARM Neoverse-V3AE,而 GPU 基于 NVIDIA 最新的 Blackwell 架构,有 Jetson AGX Thor Developer Kit、T5000 及 T4000 型号可选,主要性能有所区别。

Jetson AGX Thor Developer Kit 与 T5000 基本一致,后者主要是部分规格可以自行搭配,CPU 是 14 核,GPU 都是 2560 核 Blackwell 架构,AI 性能可达 2070TFLOPS(1TFLOPS 就是 1 万亿次),整机功耗在 40-130W,搭配 128GB LPDDR5X 内存。

售价方面,Jetson Thor 系列起步 3499 美元,折合约人民币 2.5 万元起步,也可以算是史上最贵迷你 PC。(来源:cnBeta)

Meta 被指控使用盗版成人影片训练 AI 模型

近日,两家成人影片制作公司——Strike 3 Holdings 和 Counterlife Media,对科技巨头 Meta 提起诉讼,指控 Meta 自 2018 年以来「故意且有意」地侵犯了至少 2396 部受版权保护的影片,这些影片被用于训练其人工智能模型。

根据周五在加利福尼亚州提交的诉状,两家制作公司正在寻求巨额赔偿,总计可能达到 3.59 亿美元(约人民币 25.76 亿元)。

诉状指出,Meta 明知故犯地从盗版来源获取这些影片,目的是获取内容来训练其 Meta Movie Gen、大型语言模型(LLaMA)以及其他依赖视频训练内容的 Meta 人工智能模型。这两家公司还指责 Meta 试图利用 BitTorrent 传输的「互惠算法」来获利,该算法通过奖励用户分享内容,使其下载速度更快。(来源:IT 之家)

 

彭博:谷歌对发布自有品牌 XR 头显「犹豫不决」

在今年 5 月的谷歌 I/O 大会中,谷歌宣布与 Gentle Monster、Warby Parker 合作开发基于 Gemini AI 的一系列 Android XR 头显。大会现场,谷歌还展示了三星制造的 Project Moohan 原型机。

不过,谷歌硬件负责人 Rick Osterloh 近日在接受彭博社采访时表示,公司目前仍不确定是否会推出继 Google Glass 之后的「第二款自家品牌头戴式设备」,目前整个项目仍是「待定」(TBD)阶段。但他也同时强调,当下 XR 头显已进入一个真正可能实现「突破」并且真正「有趣且实用」的阶段。

如今,从公司策略上看,谷歌当前正通过与传统眼镜品牌合作,暗暗发力于 AR 眼镜方向,试图对标 Meta 雷朋联名智能眼镜。(来源:IT 之家)

 

曝 OpenAI 曾与英国官员就全民使用 ChatGPT 付费版展开讨论

据英国《卫报》报道,ChatGPT 联合创始人 Sam Altman 近日与英国科技大臣彼得·凯尔就一项数十亿英镑的协议展开磋商。

了解该讨论的人士表示,这一想法是在旧金山举行的会谈中提出的。该协议旨在让全英国民众获得这款人工智能工具的高级访问权限,但因为成本可能高达 20 亿英镑,所以彼得·凯尔并未真正认真考虑这一想法。

但这些会谈表明,尽管存在对部分聊天机器人回复准确性以及隐私和版权问题的担忧,这位科技大臣仍对人工智能领域抱有极大热情。(来源:新浪财经)

美国 L4 无人配送独角兽完成新一轮融资,英伟达、Uber 入场

位于美国加州的 L4 级独角兽 Nuro 近日宣布,公司已经完成 2.03 亿美元的 E 轮融资,折合人民币约为 14.6 亿元,当前估值 60 亿美元(约 431 亿元)。

这一轮投资者,既有老股东,也有新资本加入。「新面孔」包括网约车平台 Uber、风投机构 Icehouse Ventures、Kindred Ventures 等,当然其中最吸睛的是英伟达。

据了解,Nuro 成立已有 9 年,此前与英伟达已有多年合作,但英伟达从未出手投资。黄仁勋选择在这个节点注资,颇有点耐人寻味。(来源:智能车参考)

 

中国AI耳机销量前 10:华为第二,第一名均价仅 359 元

近日,洛图科技发布了 2025 年上半年中国 AI 耳机线上传统电商市场报告,TOP10 品牌榜单正式揭晓。

榜首并非大众熟知的头部品牌,而是凭借高性价比突围的 SANAG(塞那),销额占比 27%,销量占比更是高达 49%,品牌均价仅 359 元。

华为则以 13% 的销量占比位居第二,销额占比却高达 26%,基本追平第一名,华为 AI 耳机均价为 1349 元。

IFLYTEK(科大讯飞)、OLA FRIEND(字节跳动旗下)、CLEER 紧随其后,分别以 13%、8%、7% 的销额占比进入前五。小米位居第六,销量占比 3%,销额占比 5%。(来源:快科技)

 

iPhone 16 系列将升级到 25W 无线充电

据 MacRumors 报道,苹果即将发布的 iOS 26 正式版将为 iPhone 16 系列机型引入 Qi 2.2 无线充电。虽然还没有正式宣布,但已经有用户从 iOS 26 的测试版里体验过了。

上周,手机配件品牌贝尔金发布了 3 款新的 Qi 2 25W 充电器,分别是售价 59.99 美元的手机+耳机二合一、99.99 美元的手机+耳机+手表三合一,以及 129.99 美元的另一个三合一款式,三款充电器都可以在半小时内给搭载了 iOS 26 的 iPhone 16 充进 50% 的电。

这个情况就和苹果自己宣传的 25W MagSafe 充电器效果一致,也侧面证明了更新到 iOS 26 后,iPhone 16 系列将会得到 Qi 2.2 的支持,比之前仅有 15W 的功率高了很多。照此推测,即将发布的 iPhone 17 系列支持 25W 无线充电也成了板上钉钉的事实。(来源:热点科技)

小米SU7「加长版」测试车外观曝光

日前,有网友拍摄到了小米汽车新车型的路试谍照。

拍摄网友称,路试车辆疑似为小米 SU7「行政版」SU7L。从曝光的图片来看,车辆整体造型与小米 SU7 接近,但车身明显比标准版 SU7 更长,预计后排空间会大幅改善。

此外,从车辆转弯时的姿态也能够看出,前胎相较于小米 SU7 也更宽,车头姿态十分沉稳,极具豪车气场。

目前,小米汽车方面还未对外公布新车型,也不排除新车为小米 SU9 旗舰车型的可能。(来源:快科技)

 

古尔曼:iPhone 折叠屏将采用 Touch ID 而非 Face ID

彭博社记者马克·古尔曼在最新的《Power On》通讯中透露,苹果正在开发的折叠屏 iPhone 代号为 V68,将搭载四颗摄像头,并采用 Touch ID 而非 Face ID。

古尔曼解释称,这四颗摄像头包括一颗外屏前置摄像头、一颗内屏前置摄像头以及两颗后置摄像头。

与最新的 iPad Air、iPad mini 及入门款 iPad 类似,这款折叠屏 iPhone 预计会在电源键上集成 Touch ID,相比现有 Face ID 各有优缺。

古尔曼还称,该机型将搭载苹果第二代自研 C2 基带芯片,支持蜂窝网络,全面推行 eSIM 方案,不会配备实体 SIM 卡槽。

苹果分析师郭明錤此前也表示,该机型将配备 5.5 英寸外屏和 7.8 英寸内屏。相比之下,三星 Galaxy Z Fold7 的内屏为 8 英寸,外屏为 6.5 英寸。(来源:IT 之家)

博主分享根据微信步数判断好友是否已读,网友:「闲得蛋疼」

有关微信是否会开发「已读」功能一直是用户关注热点。「微信派」公众号 8 月 7 日已发文重申,微信从一开始就没有「已读」功能,以后也不会有。

近日,有博主晒出了网友在互联网平台分享的一个可以帮助判断好友是否已读信息的方法。需要注意的是,该网友也在给出方法后建议「酌情使用」,大致操作步骤如下:

  • 前提条件:该好友必须开通微信步数,并且参与排行,并且能看到他的步数
  • 假设早上 9 点给他发了一条微信,并且记录他当时的微信步数是 1000 步,9 点 10 分再次刷新微信步数排行榜,发现他的步数变成 1100 步,那么可以判断,在这 10 分钟,他带着手机走了 100 步,并且他一定打开了微信这个软件,等同于看到了微信信息。

值得一提的是,相关讨论已登上热搜,有网友锐评「闲得蛋疼」。(来源:IT之家)

 

昨天以前极客公园

小米YU7遭逆行水泥罐车撞击,车主平安;马斯克开源Grok 2.5模型;黑悟空因未公布新DLC遭玩家刷差评

2025年8月24日 08:33

小米 YU7 遭逆行水泥罐车撞击:行车记录仪第一视角曝光,车主平安无事感谢小米关怀

8 月 23 日消息,一段车祸视频最近在网上传播,引发广泛关注。8 月 19 日内蒙古赤峰,一辆正常行驶的小米 YU7,遭到一辆逆行的水泥罐车撞击并推行一段距离,车内人员未受伤,可安全下车。

车主随后帖称:「小米车救了我一命,前面那个水泥罐车刹不住,我们在前面被撞得最严重,车转了一圈,小米的防撞梁太硬了,救了我一命」。

该视频引发热议,有网友称,这次事故小米收获了一大波流量,应该给车主免费送一辆车。另有网友质疑,该车主多次发布与小米汽车相关内容是想要雷总送他一辆车。

据悉,8 月 22 日,该车主发视频回应称,拍视频是自己的爱好,这次事故和小米汽车没有任何关系,事故发生后小米公司人情关怀来看我们,心里已经很感激了。即使小米送他一辆车,他也不会要。事故和小米无关,不义之财不可取。

从后续曝光的小米 YU7 行车记录仪画面可以看到,水泥罐车在转弯后冲向对向车道,径直撞上了一辆绿色的小米 YU7 以及白色汽车,后续行驶一段距离才得以刹停,场面十分惊险。(来源:IT 之家)

马斯克宣布 xAI 开源 Grok 2.5 模型,Grok 3 将在半年后跟进

马斯克周六在其社交媒体平台 X 上发文称,他旗下的人工智能初创公司 xAI 已开源其 Grok 2.5 模型,并计划在大约六个月后对 Grok 3 模型采取同样的举措。

据悉,Grok App 近日还迎来了 v1.1.58 更新,Imagine 功能速度更快(更快生成图像)、Companions 功能更「有趣」,此外,Vision 模式现已对所有 Grok Android App 用户开放,不再限于测试版。(来源:IT 之家)

 

英伟达公布 Spectrum-XGS Ethernet 技术:跨区域构建 AI 超级集群,CoreWeave 率先部署

8 月 23 日消息,Hot Chips 大会将于 8 月 24~26 日举行,英伟达宣布推出 NVIDIA Spectrum-XGS Ethernet 技术,即日起作为 NVIDIA Spectrum-X 以太网平台的一部分提供。

据悉,这是一项面向分布式数据中心的跨域互联技术,旨在将多个不同区域的独立数据中心连接到一起,打造成一个具备千亿级计算能力的 AI 超级工厂。

英伟达介绍称,随着 AI 需求的快速增长,单一数据中心在电力和容量上逐渐触及极限。传统以太网在延迟、抖动和性能一致性方面的局限,使得数据中心无法轻易突破单一设施的边界。

Spectrum-XGS Ethernet 正是为此设计,它引入了跨域扩展架构,具备自适应的网络算法,可根据数据中心之间的距离进行动态调整。(来源:IT 之家)

苹果新 AI 模型长视频理解夺冠,小至 1B 版本也领先对手

8 月 23 日消息,科技媒体 9to5Mac 近日发布博文,报道称苹果研究团队开源 SlowFast-LLaVA-1.5 长视频多模态大语言模型,在 1B、3B、7B 参数规模下,均刷新 LongVideoBench、MLVU 等 SOTA 基准纪录。

苹果公司首先研究推出了 SlowFast-LLaVA 开源模型,最大的亮点是创新双流(two-stream)设置,其中「慢流」选取少量高分辨率帧捕捉场景细节,「快流」选取更多低分辨率帧追踪运动变化。

测试显示,该模型在长视频基准 LongVideoBench、MLVU 上均取得新纪录,而且 1B 版本也能领先竞争对手。同时,它在知识问答、数学推理、OCR 等图像相关任务上表现出色,实现视频与图像的通用理解能力。

该项目完全基于公开数据集训练,方便学术与产业复现,并已在 GitHub 与 Hugging Face 开源。(来源:IT 之家)

 

一代「国民车」复活在即,全新奇瑞 QQ 将亮相 2025 成都车展

据懂车帝 22 日报道,全新奇瑞 QQ 将在 8 月 29 日开幕的 2025 成都车展期间正式亮相,本次发布的版本或将展示量产车的造型设计。

据悉,今年上半年的上海车展期间,全新奇瑞 QQ 概念车已经完成首秀。新车采用了颇具科幻气息的设计语言,将搭载纯电动力。根据官方信息,新车车身长度为 4250 毫米,轴距为 2750 毫米,预计将定位于紧凑型车。

此次披露的信息显示,全新奇瑞 QQ 有望明年上半年量产。(来源:IT 之家)

Meta 即将推出首款面向消费者的智能眼镜 Hypernova

Meta 计划于 9 月的年度 Connect 大会上发布代号为 Hypernova 的新款智能眼镜。这是该公司首款面向消费者的智能眼镜,配备显示屏,显示屏将安装在合适的镜片上。

这款眼镜由 Meta 与 EssilorLuxottica 合作研发,预计售价约为 800 美元。预计这款眼镜将与一款可通过手势控制眼镜的腕带一同亮相。

Hypernova 眼镜的显示屏预计有限,提供 20 度视野。它主要用于传递简单信息,例如收到的短信。这款眼镜将允许用户拍摄和分享照片和视频、拨打电话、发送消息、收听音频,并通过语音、显示或手动交互与 AI 助手互动。

除了 Hypernova 和腕带之外,Meta 预计将与 Luxottica 合作推出第三代语音智能眼镜。该设备将具备电容式触控功能,允许用户通过触控手势进行交互。(来源:cnBeta)

 

19.38 万元起吉利银河旗下最大 SUV 车型 M9 开启预售:首搭 Flyme Auto2 系统,综合续航超 1500km

吉利银河 M9 昨晚正式开启预售,提供 6 个不同版本可选,全系赠送 27 扬声器音响,支持 13000 元选装魔毯星驰套装,将于 9 月正式上市。

吉利银河 M9 车长 5205mm,宽 1999mm,高 1800mm,轴距 3030mm,定位大型 SUV;车内面积达到 5.2㎡,车内有效长度 3.7m,车内高度 1.3m,拥有 88.3% 超大得房率,支持 8 种座椅模式一键设定。

新车外观采用此前银河星舰概念车的大量设计风格,官方称为「涟漪美学」,配备了宽大的星汉涟漪贯穿灯和旭日东升尾灯,车顶配有激光雷达。

车侧则是传统样式的门把手,配有多辐条铝合金轮毂,并在 B 柱、窗框、下包围等处运用了镀铬处理,增添气场。

座舱方面,吉利银河 M9 全系内部采用 2+2+2 的六座布局设计,第二排为双独立座椅,还带有一个 17.3 寸 3K 吸顶屏,配备无缝腿托、腰托,具备通风、加热、10 点按摩;其配备二三排纯平地板、180mm 车内通道、三排靠背 150 度电动调节以及大尺寸后舷窗。

智能化方面,吉利银河 M9 全系搭载 Flyme Auto 2 新一代 AI 智能座舱,及超拟人智能体 Eva,能一句话规划路线、调节座舱功能、哄娃讲故事。(来源:IT 之家)

《黑神话:悟空》因游戏 DLC「未能如期推出」遭玩家差评轰炸,Steam 过去 30 天好评率降至 93%

8 月 23 日消息,游戏科学团队在科隆游戏展中公布了「黑神话」系列 IP 最新作《黑神话:钟馗》,但这也令许多期待《黑神话:悟空》DLC 的玩家失望不已,这种希望落空的感觉导致大量玩家前往 Steam 给《黑神话:悟空》刷差评,质疑 DLC「未能如期推出」。

尽管在《黑神话:钟馗》公布后,官网上线的 FAQ 确认「西游,不会到此为止」,暗示官方仍将推出《黑神话:悟空》的 DLC,但考虑到《黑神话:钟馗》目前仅仅处于早期开发阶段,目前暂不知悉《黑神话:悟空》的 DLC 将于何时推出。(来源:IT 之家)

 

马斯克沉迷的「刷刷刷」游戏,要来中国了

2025年8月23日 12:18

2024 年底,马斯克在 X 上的一条动态,把《流放之路 2》推上了全球玩家的热搜榜。

他说,这是一款「暗黑破坏神和艾尔登法环的爱情结晶」。随即,关于这款游戏的讨论在玩家圈层之外也迅速扩散开来。后来甚至有人爆料,他会在私人飞机上刷《流放之路 2》,还因此引发过一场「带练风波」。科技狂人马斯克的沉迷,把这款硬核 ARPG 拉出了圈子。许多此前并不熟悉这一类型的玩家,也因此第一次关注到它。

马斯克转发《流放之路2》丨来自:X

对我来说,这并不是一款完全陌生的作品。从初中时代沉迷《暗黑 2》开始,我就对「刷宝」类 ARPG 保持着长久的兴趣。打怪、掉落、组建流派,这种不断重复却又充满未知的过程,对玩家有着某种魔力。《流放之路》系列,就是在这样一群「暗黑死忠粉」的手中诞生,并逐渐成长为最硬核也最纯粹的 ARPG 代表之一。只是它极高的门槛和复杂度,也让很多普通玩家望而却步。

从 2013 年初代《流放之路》发布,作为一个从《暗黑 2》一路走来的老玩家,我也一直有关注这个系列。到 2024 年底《流放之路 2》正式上线,这款游戏在垂类玩家群体中的口碑不断累积。国际服上线后,一度登顶 Steam 畅销榜,也在 Twitch 创下百万级别观看峰值。

今年 8 月,《流放之路:降临》在深圳举办发布试玩会。腾讯当场宣布:国服将在 9 月 11 日开启预充值不删档测试。试玩会上,我也终于有机会实机上手。《流放之路:降临》在画面和打击感上都比「云玩」时更精致、更真实,同时在玩法层面展现出更高的复杂度。国服版本还额外加入了 AI 助手、全中文配音以及全新的交易模式,为国内玩家提供了更友好的体验。

这让我意识到,《流放之路:降临》的国服,不只是一次单纯的引进,而是一场关于「硬核游戏如何在中国落地」的实验。它既考验玩家的接受度,也考验运营方的诚意。

上手即劝退?还是爽到停不下来

《流放之路:降临》由新西兰 Grinding Gear Games 工作室(以下简称 GGG)开发,腾讯代理国服。它延续了系列一贯的硬核风格:庞大的天赋树、装备和技能宝石的自由组合、复杂的掉落与交易系统,塑造了无数种流派可能性。

国际服在 2024 年上线后,最高同时在线人数突破 57 万,还拿下了「铂金级年度新品」「铂金级最热玩游戏」以及「最畅销黄金游戏」等 Steam 奖项。它在 Twitch 上的观看峰值超过 120 万,可见其在全球玩家中的热度。

在玩法上,这款游戏强调「自由」。可以体现为下面四个方面

  • 自由 BD(Build 流派):天赋职业 1+1>2 随意搭,没有固定公式,同时极具深度,并不断会根据新版本/新赛季变化
  • 自由战斗:操作体验丰富,BOSS 战动作博弈,既有无脑刷怪,也有有趣味的 Boss 和竞速挑战
  • 自由打装:装备类型、词条繁多,既可以刷怪掉落,也可以自由打造,更丰富化的装备构筑路径
  • 自由交易:完全自由的玩家间贸易机制,大部分物品都可以进行交易

国服将在 9 月 11 日开启不删档测试,直接同步国际服的 0.3.0 最新版本。腾讯方面承诺,未来版本更新也会尽量保持与国际服同步,不再让国内玩家做「版本孤儿」。

在本地化上,国服提供全中文配音,预计将录制超过一万七千条语音,邀请专业声优完成角色塑造。除此之外,国服还带来了一些中国特色元素:例如限定的国风宠物「熊猫临临」,以及免费赠送的国风时装「流火之翎」。这些内容既有文化符号,也体现出运营方对国内玩家的用心。

《流放之路:降临》试玩丨《流放之路:降临》试玩会

试玩会提供的是 0.3.0 版本。可以感受到相比前两个赛季/版本,游戏节奏变快了。此前玩家抱怨剧情推进太慢,新版本增加了冲刺机制,新赛季不用再一遍遍过之前的剧情,战斗节奏也更为流畅。此外,技能平衡性也做了大规模调整,以前「一招通关」的情况明显减少,不同职业和 BD 的平衡性有所加强,玩家有更多可玩空间。

《流放之路:降临》的打击感也做得不错,弓弩射击群怪时的手感、技能爆裂时的特效、闪躲回避时的流畅感,都做出了 3A 游戏的质感。整体节奏上,开荒阶段需要小心走位,但当角色逐渐成型后(我尝试在高等级后回到早期地图),也能体验到这类游戏「割草刷刷刷」的爽感。但因为不少职业是「玻璃大炮」,实际面对 Boss 和一些高难关卡时,仍需操作和策略,避免了只有刷刷刷的尴尬。

此外,还有一个让我印象深刻的,是全新的内置交易市集。只需在游戏内打开界面,就能像电商购物一样搜索、筛选并一键发起交易。据了解,这一功能由腾讯国服团队和 GGG 联合开发,大大降低了玩家交易门槛,也展现了本地化的诚意。

大模型驱动的次世代 AI 游戏助手

除了游戏本身,国服最大的亮点之一,是首度引入了 AI 助手「蛋蛋君」。

它不是一个通用机器人,而是基于腾讯大模型定制训练的专用 AI 游戏助手。其实现方式是基于 WeGame 平台打造一个通用游戏 AI 底座模型,再为《流放之路:降临》具体训练专属层。

同时为解决版本同步与准确性痛点,团队还自主构建专属游戏模型。该模型能紧密跟随游戏版本更新,团队会在新版本上线前将最新数据整合进模型,确保 AI 提供的建议始终基于当前有效版本,自动过滤过时信息,避免误导玩家。

据我了解,《流放之路:降临》AI 助手功能研发分三期推进,如下所示,其目标是覆盖用户体验周期的全阶段,目前先聚焦于解决新玩家的核心痛点,在不影响游戏上手体验、不打扰游戏内乐趣的前提下辅助新玩家完成开荒,为后续更复杂的智能功能打下基础。

第一期(当前已公布):侧重于「通用查询和基础答疑」。像聊天机器人一样,为玩家(特别是新手玩家)提供游戏内通用问题的文字解答(如基础玩法、职业特征、路线选择),帮助他们度过初始迷茫期。并且从用户上手习惯出发,提供通用型建议,避免高段位及复杂攻略限制新玩家自由探索。

第二期:初步实现场景化智能辅助」。AI 将结合玩家在游戏中遇到的实时困难、所处的具体场景以及玩家的角色装备状态与游戏习惯,据此提供适时、针对性的建议和帮助,成为用户的「智能辅助」。

第三期:结合用户需求和习惯,担任更加个性化的智能辅助,并非教玩家如何打游戏,而是能够识别用户在游戏中遇到的问题并给予解决对策,在不干扰游戏整体体验的前提下提供更丰富、更直观的帮助。

从行业视角看,这是 AI 在游戏中的一次典型落地案例。相比依赖论坛、攻略,AI 助手能做到个性化、实时化的指导。未来若这一模式成功,可能会成为更多硬核游戏降低门槛的方式。

《流放之路:降临》国服特色内容丨来自:《流放之路:降临》试玩会

相比国内常见的游戏发行模式,腾讯在这次代理中的姿态显得意外克制。国服预充值的基础包只需 98 元,学生党还可以额外再减 10 元。这个价格只有 steam 基础版(30 美元)的一半,可以说相当有诚意。

「自由」到底意味着什么

在试玩会的交流中,国服项目负责人 bubu 多次强调「自由」是这款游戏的核心气质——玩法自由、交易自由、掉落概率完全随机、做装也是随机。bubu 说团队希望能够把这个特质传递给玩家,让大家知道这是一个不会被所谓的发行和运营安排的明明白白的游戏,是一个玩家可以完全自由选择、无上限的发展角色的游戏。

《流放之路:降临》国服项目负责人bubu丨来自:《流放之路:降临》试玩会

在老玩家关心的资产继承方面,腾讯也给出了答案:一代中已经购买的时装、仓库页等虚拟资产,只要新作存在对应内容,就会迁移延用。这让老玩家的投入不至于作废,体现了对社区的尊重。

此外,腾讯还推出了「先锋计划」和「长青计划」,通过提供测试资格、现金激励和流量扶持,鼓励玩家参与内容创作。无论是写攻略、做过滤器还是研究流派,这些创作者都能成为游戏生态的重要组成部分。流放之路系列是一个典型的社区驱动产品,在游戏发展的过程中,玩家社区的声音一直是开发与迭代的重要组成部分。推出「先锋计划」,bubu 表示是希望中国玩家社区的声音也能被听见。

制作人 Jonathan 也在分享会上坦言,他们最关注的就是玩家反馈。0.3.0 版本的大规模平衡调整,就是根据中外玩家对流派多样性和游戏节奏的建议完成的。他在此前中国行访问成都熊猫基地后,立刻决定把熊猫形象加入国服宠物,成为文化交流的缩影。

这种对“自由”与“社区”的强调,也契合了当下中国游戏市场的新趋势。随着《黑神话:悟空》掀起主机热潮,3A 和硬核游戏正在越来越受到玩家欢迎。但问题并不只在玩法,真正的考验是如何在国内本土化运营:既要避免过度氪金、数值付费的手游套路破坏体验,又要找到合理的商业化平衡点,让硬核游戏能够在中国市场长线发展。

作为一名长期关注刷宝类 ARPG 的玩家,我在试玩会后的直观感受是:这款游戏在保留系列硬核魅力的同时,也做出了许多本地化和体验上的优化。无论是 AI 助手带来的智能化引导,还是内置交易市集的便捷,抑或是定价与资产继承上的诚意,都让我对即将到来的国服测试充满期待。

从行业角度看,《流放之路:降临》不仅是一款游戏的回归,更是一场关于「AI+游戏」「社区共创」「长期主义」的实验。9 月 11 日,随着国服不删档测试正式开启,瓦尔克拉斯大陆将迎来一批新的冒险者。我期待看到这场「玩家与运营者的双向奔赴」,也期待它能为国内硬核游戏市场带来新的启发。

Anthropic 寻求 100 亿美元新融资;《恋与深空》获科隆展最佳移动游戏奖;脑瘫司机靠特斯拉 FSD 开车养家

2025年8月23日 09:05

苹果正探索与 OpenAI、Anthropic 及谷歌合作,评估 Gemini 等第三方模型

8 月 23 日消息,彭博社马克・古尔曼刚刚报道称,苹果近期接触谷歌母公司 Alphabet,拟在 Gemini 基础上合作开发定制化 AI 模型,将其作为明年全新 Siri 的基础 AI 引擎。

消息人士称,谷歌 Gemini 已启动苹果服务器的适配工作,或者说谷歌正在训练一款可运行在苹果服务器上的 AI 模型。

除此之外,苹果也曾与 Anthropic 和 OpenAI 就潜在合作进行接洽,评估 Claude 和 ChatGPT 是否能够作为 Siri 的「新大脑」。

消息传出后,谷歌和苹果股价不断走高,周五盘中多次触及高点,目前谷歌上涨 4% 至 207.80 美元,苹果上涨 1.4% 至 227.95 美元。

据称,苹果正在内部同时开发两个版本的新 Siri。目前苹果尚未决定到底是继续使用自研模型,还是与外部伙伴合作。

苹果与谷歌虽然在部分领域存在竞争,但双方已保持长期合作关系,例如谷歌曾每年支付数十亿美元以保持其作为苹果设备默认搜索引擎的地位。此次在 AI 领域的合作仍处于探索阶段,并未进入正式商业谈判。(来源:IT 之家)

​历史性协议:美国政府 89 亿美元入股英特尔,占股 9.9%

8 月 23 日消息,英特尔宣布与美国政府达成历史性协议,美国政府将以 20.47 美元 / 股购入 4.333 亿股普通股,投资总额 89 亿美元,占股 9.9%,另享 5 年期认股权证。

英特尔公司昨日(8 月 22 日)发布公告,宣布和美国政府达成战略合作,美国政府将投资 89 亿美元(IT 之家注:现汇率约合 638.98 亿元人民币)直接持有英特尔约 9.9% 普通股,购入价格为每股 20.47 美元(现汇率约合 147 元人民币)。

此次交易包含一份五年期、价格为每股 20 美元的认股权证,若英特尔在代工业务中的持股比例低于 51% 方可行使。政府将作为被动投资者,不参与董事会及经营决策,并承诺在股东表决时与董事会一致投票(有限例外)(来源:IT 之家)

 

部分苹果芯片将在德州仪器新开设的工厂生产

德州仪器 (TI) 已正式在德克萨斯州谢尔曼开设其价值 600 亿美元的半导体工厂,苹果是首批在该工厂生产芯片的客户之一。该工厂是谢尔曼四座新工厂中的第一座,也是德克萨斯州和犹他州七座工厂扩建项目的一部分。该项目的目标是为制造商提供美国关键芯片的供应,此前这些芯片大多在海外生产。

苹果公司确认,将在新工厂生产 iPhone 和其他设备的「关键基础半导体」。这些芯片并非是自行设计的高性能处理器,而是用于管理电源、传感器和信号的小型模拟和嵌入式组件。

这些支持芯片每块仅售约 40 美分,但却不可或缺,iPhone 出货离不开它们,而国内供应有助于苹果避免在新关税制度下成本上升。

这一举措是在新的贸易压力之下推出的。2025 年 8 月,特朗普总统宣布对海外生产的芯片征收 100% 的关税。同一天,苹果首席执行官 Tim Cook 将公司在美国的支出承诺从 2 月份承诺的 5000 亿美元提高到四年内 6000 亿美元。

库克表示,部分投资将直接流入德州仪器位于谢尔曼、理查森和利希的工厂。通过在美国生产,苹果可以避免高额关税处罚,并确保更稳定的供应链。(来源:cnBeta)

 

阿里官网重新归纳四大业务板块

8 月 22 日,阿里巴巴官网「我们的业务」板块变更,从六大业务集团+其他业务变更为阿里中国电商集团、阿里国际数字商业集团、云智能集团及所有其他业务。饿了么、飞猪归入阿里中国电商集团,高德地图、菜鸟、优酷、大麦娱乐等归入「所有其他」。据了解,阿里官网业务板块划分并不代表组织架构调整,内部汇报暂未发生变化。(来源:第一财经)

 

理想汽车智驾量产负责人离职

今日有媒体报道称,理想汽车智驾团队量产负责人王佳佳近期已提交离职申请。理想汽车方面确认了该消息。 资料显示,2021 年 5 月,王佳佳加入理想汽车担任智能驾驶量产研发负责人,向理想汽车智能驾驶负责人郎咸朋汇报。 加入理想之前,王佳佳在博世中国工作近 8 年,先后担任自动驾驶研发项目组长、部门经理等职位。(来源:新浪科技)

Anthropic AI 正在洽谈筹集最高达 100 亿美元的新一轮融资

根据《彭博社》的报道,Anthropic 正就一轮高达 100 亿美元的新融资进行最后谈判,此轮融资将使其投后估值达到约 1700 亿美元。因投资者需求远超预期,原定 50 亿美元的融资规模被直接翻倍。本轮完成后,Anthropic 现金储备将大幅增加。

Anthropic 成立于 2021 年,由前 OpenAI 核心成员创建,其主要产品 Claude 系列 AI 模型在市场中广受关注。截至 2024 年,其曾获得亚马逊与谷歌等巨头的大规模投资,此次新一轮融资若成功,将令其资金实力更上层楼。

据悉,投资公司 Iconiq Capital 将领投该轮融资。知情人士透露,其他预计的参与者包括 TPG Inc.、光速创投、Spark Capital 和 Menlo Ventures。Anthropic 还与卡塔尔投资局和新加坡主权基金新加坡政府投资公司(GIC)就加入这一轮谈判进行了讨论。(来源:开源中国)

 

NVIDIA 黄仁勋再次喊话:H20 从来没有、也不可能有后门

8 月 22 日消息,NVIDIA 公司专为国内市场定制的 H20 AI 芯片在经历了封禁、解禁后依然面临争议,在国内市场上的销售备受关注。

H20 在国内面临的压力不仅是性能已经落后,更关键的还是安全问题,此前多次被国内有关部门认为有安全风险,尤其是有后门,此前 NVIDIA 公司也做过澄清。

今天 NVIDIA 创始人、CEO 黄仁勋乘专机飞抵台积电洽谈合作,期间也再次谈到了 H20,表示国内近期对 NVIDIA 的芯片提出了一些疑虑,质疑芯片是否有安全后门,NVIDIA 已经澄清并且消除了这些疑虑。

黄仁勋表示,H20 没有安全后门,从来没有,也不可能有。他还提到目前仍在和国内进行沟通,希望这件事能妥善解决。

NVIDIA 公司之前表态,称 NVIDIA 遵守美国政府制定的参与全球市场的规则。加速计算的需求是全球性的,NVIDIA 将继续在规则范围内为尽可能多的客户提供服务。(来源:快科技)

 

消息称中国第一豪车品牌红旗牵手华为:多车用上乾崑智驾、鸿蒙座舱

8 月 22 日消息,据财联社报道,一汽红旗将于明年推出采用华为全栈解决方案的车型,功能包括乾崑智驾、鸿蒙座舱、乾崑车控、乾崑车云服务等

另有知情人士透露:这一合作将会在明年率先围绕「红旗 9 系」车型展开,届时最新的方案基本上都会得到搭载。

目前「红旗 9 系」在售车型包括 H9、E-HS9、HQ9、HQ9 PHEV 等,涵盖燃油、插混和纯电等多种动力类型。

红旗和华为合作并不令人意外,如果对汽车圈比较关注的朋友大概还记得在 2023 年 10 月份一汽解放就和华为签署了备忘录。

本月,一汽奥迪全新的 A5L、Q6L e-tron 家族新车上市,最大的亮点之一就在于配备了华为的乾崑智驾。

值得一提的是,北汽、长安、东风、广汽和上汽已经和华为达成了合作,而随着一汽红旗的加入,最后一家和华为合作的央国企车企也尘埃落定。(来源:快科技)

 

国产女性向游戏《恋与深空》获科隆展最佳移动游戏奖

今日,《恋与深空》在德国科隆国际游戏展上获得最佳移动游戏奖,这也是历史上首个女性向游戏获得这个奖项。

此次同时被提名的游戏还有鹰角网络《明日方舟:终末地》《抓抓地牢》、米哈游《原神》、《锈湖管家》。

据了解,《恋与深空》是一款由叠纸游戏开发的 3D 恋爱互动手游,于 2024 年 1 月 18 日公测。

同年 9 月,《恋与深空》宣布登上苹果 App Store 畅销总榜第一,超越抖音和《王者荣耀》。

玩家在游戏中将扮演深空猎人,带领不同类型的搭档并肩作战,剧情推进过程中会出现、结识男性角色,他们将会陪伴主人公一起成长,从而让玩家能够获得恋爱体验。(来源:快科技)

Meta 研发的新型 2 毫米厚度显示屏让 AR 眼镜更接近现实产品

Meta 的一个研究团队认为,他们已经攻克了增强现实领域最棘手的挑战之一:将明亮、生动的显示屏装入足够纤薄、适合日常佩戴的眼镜中。他们最新的原型是一款厚度仅为两毫米的平板激光显示器,标志着这项技术从长期以来限制激光增强现实显示器发展的笨重系统迈出了重大一步。

这项发表在《自然》杂志上的研究成果描述了一种体积不及铅笔橡皮擦的设备,它能够投射清晰的高清图像,同时厚度仅为当今显示器的一小部分。通过将先进的光子技术集成到单个芯片上,该系统兼具紧凑性和可扩展性——这正是消费级 AR 眼镜的两个关键要求。

增强现实依赖于在户外保持可见的显示器,而在户外,明亮的环境光很容易冲淡数字叠加层。传统的基于 LED 的系统在这种条件下难以应对,而激光显示器则提供了保持虚拟图像清晰锐利所需的亮度和色彩丰富度。

研究中的图片展示了 Meta 最终的激光显示器,尺寸仅为 5 毫米 x 5 毫米,放置在一枚 10 美分硬币的顶部进行缩放。其他图片则重点展示了该显示器运行的放大视图。

Meta 现实实验室的光学科学家郭华魏向 IEEE Spectrum 表示:「亮度和色彩的重要性对于透明和户外应用尤为明显。」

以前的设计依赖于复杂的激光阵列和庞大的光学元件,这使得它们价格昂贵、难以制造,并且不适合用于消费硬件。

Meta 的新方法利用光子集成电路 (PIC) 克服了这些限制。PIC 是一种利用数千个微型光学元件来引导和调制光线的芯片。PIC 的大小大约与指尖相当,它与微型硅基液晶面板配对,可产生 1920 x 1080 分辨率的显示屏。尽管体积小巧,但该系统的色域却是传统 LCoS 设备的两倍多。

对于 Meta 而言,它已经通过其 Reality Labs 部门和与雷朋智能眼镜的合作在增强现实和混合现实领域投入了大量资金,这一突破代表着它朝着实现轻量级、视觉上引人注目的 AR 设备又迈出了一步。(来源:cnBeta)

 

极狐 T1 纯电小车开启预售:同级首搭低速智能辅助转向技术、ARC-FLOW 概念设计语言,6.88 万元起

8 月 22 日消息,极狐 T1 纯电小车今日开启预售,新车标配全景影像、提供续航最高 425 公里版本,预售价 6.88 万元起。需要注意的是,极狐 T1 的 425km 续航车型上市即交付,320km 续航车型将在 10 月中旬开启交付。

新车尺寸为 4337×1860×1572mm、轴距 2770mm、最大头部空间 1004mm、后排腿部空间 934mm,支持前排座椅一键躺平。极狐 T1 纯电小车还拥有 459L-1352L 灵活储物空间。

极狐 T1 同级首搭低速智能辅助转向技术,宣称「转弯直径减少 30cm、最小转弯半径可达 5.2m」,配备 540° 立体全景影像系统。采用 ARC-FLOW 概念设计语言,配备贯穿式前大灯、18 英寸铝合金精车轮毂,轴长比 0.64、轮高比 2.27、宽高比 0.85;提供晨曦白、瓦纳蓝、流光银、草露青、霞光紫、子夜灰 6 种车色和云米、沙棕、黑金三种内饰配色。

新车基于北极星数字智能架构打造,采用高强度笼式车身设计,配备极光电池(宣称「不着火、不变形、不进水、真续航」),支持闪充补能,同时提供 V2V / V2L 外放电功能。(来源:IT 之家)

 

OPPO Find X9 Pro 完整规格曝光:7500mAh 大电池 + 全新三摄系统

8 月 22 日消息,Smartprix 刚刚联合 @Yogesh Brar 放出了 OPPO Find X9 Pro 完整配置信息。

据称,OPPO Find X9 Pro 将配备一块 6.78 英寸的 1.5K 120Hz OLED 直屏。性能方面,该机将搭载联发科天玑 9500,并提供最高 16GB 内存 + 512GB 存储的配置(指海外版本)。

此外,这款新机还将配备一枚 200 万像素丹霞原彩镜头(IT 之家注:Find X8 Ultra 同款);前置摄像头则为 5000 万像素三星 JN5,支持自动对焦。

其他方面,Find X9 Pro 将搭载 7,500mAh 电池,支持 80W 有线快充和 50W 无线充电;采用超声波屏下指纹识别,支持 Wi-Fi 7、NFC 以及可自定义快捷方式的多功能按键,运行基于 Android 16 的 ColorOS 16 系统,预计 10 月率先在中国发布,随后于 11 月中旬登陆印度及全球市场,印度市场价格预计在 10 万卢比(IT 之家注:现汇率约合 8228 元人民币)以内。(来源:IT 之家)

脑瘫司机靠特斯拉 FSD 开网约车养家

旅行博主 JeebsTX 本月(8 月 10 日)在 X 平台分享了他在旅途中的一次奇妙见闻。JeebsTX 表示,他在去纽约出差的路上用优步叫了一辆舒适型网约车,不久后司机 Billy 接载了他,上车后他注意到,Billy 开的是一台特斯拉 Model Y。

随后博主看到了神奇的一幕——Billy 说道「导航去 C 航站楼」,随后他用左手按下了 FSD 启动按钮,他们就这样以辅助驾驶模式开启了 18 英里(约 30 公里)的旅程。 博主询问司机为何用左手去按 FSD 按钮,司机表示他从小就患有脑瘫,右手完全动不了,右腿也只剩下 40% 的活动能力。自从 Billy 买了 Model Y 后,他就能通过开网约车维持生计,这期间他开了 20.6 万英里(约 33 万公里)未大修,现在他完全依靠开优步来养家糊口。(来源:IT 之家)

可灵AI单季营收超2.5亿,快手财报里的「AI含金量」有多高?

2025年8月22日 19:32

 

8月21日,快手科技发布的2025年第二季度业绩报告,各项核心财务指标表现稳健,超出了市场普遍预期。

 

财报显示,快手该季度总营收达到350亿元,同比增长13.1%;经调整净利润为56亿元,同比增长20.1%。同时,公司的盈利能力也达到新的高度,毛利率和经调整净利润率分别提升至55.7%和16.0%。

图片来源:快手财报

 

在用户基本盘方面,平台流量持续增长,平均日活跃用户(DAU)同比增长3.4%至4.09亿,月活跃用户(MAU)同比增长3.3%至7.15亿。

 

这些数据显示,快手在保持用户规模稳健增长的同时,实现了更高质量的盈利。

 

可以看到,自从2023年全面启动AI战略以来,人工智能技术已深度融入快手的内容生态、线上营销和电商等核心业务的全流程,成为驱动效率提升和业务增长的关键变量。

 

快手CEO程一笑在业绩电话会上也强调,AI大模型能力正在众多生态场景中释放价值。本季度的业绩,或许可以视为快手AI战略从技术布局到业务成果转化的一次集中体现。

 

此外,快手首度派息20亿港元。快手称,「董事会宣派派发自上市以来的首次特别股息每股0.46港元,合共约20亿港元。此次特别股息之宣派及派发,反映了对公司长期增长前景及稳健财务状况的信心,亦体现了我们对持续提升股东回报的承诺。」

 

「AI双核」:一个负责降本,一个主攻增收?

 

快手本季度的业绩表现,根植于其在AI技术基础设施层面的持续投入和应用落地。以OneRec推荐大模型和可灵视频生成大模型为代表的技术创新,正从底层重塑平台的运营效率和内容生产力。

 

作为内容平台,推荐系统的效率直接决定了用户体验和商业化天花板。本季度,快手推出了自研的「OneRec端到端生成式推荐大模型」。与传统的「筛选-排序」级联架构不同,OneRec采用全新的技术范式,以一个统一模型直接生成符合用户偏好的视频内容。

 

这一改变带来了两方面显著的业务价值,首先是提升推荐效果,新架构能够更好地利用强化学习方法对齐用户偏好,在部分短视频推荐场景应用后,有效提升了用户时长和留存率;其次是大幅降低成本,OneRec显著提升了算力的训练和推理效率,官方数据显示,其有效计算量提升了10倍,而运营成本仅为传统方案的10.6%。

 

目前,该模型已广泛应用于站内内容推荐,并全面应用于本地生活服务场景,推动了相关业务GMV的增长。

 

OneRec的应用,表明快手在平台最核心的流量分发环节,通过AI技术实现了效率和成本的同步优化。

 

可灵(Kling)视频生成大模型则是快手AI战略在应用层的重要布局。本季度,其商业化进程取得了一些实质性进展,实现了超过2.5亿元人民币的营收。

 

基于其商业化表现,快手管理层已将可灵2025年的全年收入预期较年初目标翻倍,并相应追加了在推理算力方面的投入。

 

可灵的商业化进展,建立在其持续的产品迭代和场景拓展之上。

 

从产品功能来看,可灵在保持模型效果的同时,陆续上线了「多图参考」、「灵动画布」等功能,提升了生成内容的一致性和可控性,使其更接近于一个一站式的AI创意工具。

 

图片来源:极客公园

 

商业场景方面,可灵的用户群体已从个人创作者,扩展到电商、广告、设计、影视等领域的专业创作者和企业客户。截至7月,已累计服务超2万家企业客户。

 

也有一些标杆案例的探索。快手通过具体项目来验证和展示可灵在工业级场景的应用能力。快手星芒短剧联合出品的AI单元故事集《新世界加载中》,全球累计播放量近2亿,体现了AIGC技术大规模嵌入影视创作流程的可行性。此外,与热门手游《逆水寒》的合作,也探索了其在游戏行业的应用潜力。

 

在电话会上,程一笑表示未来希望可灵逐步具备在游戏制作和专业影视制作等工业级场景的深度应用能力。从OneRec到可灵,快手的AI技术已经从底层算法深入到上层应用,初步形成了技术创新与商业价值实现的闭环。

 

当AI深入电商、广告的「毛细血管」

 

技术基建的最终目的是服务于业务增长。本季度,AI技术对快手线上营销和电商两大核心商业化业务的赋能效果尤为显著,驱动了效率和收入的双重提升。

 

本季度,快手线上营销服务收入达198亿元,同比增长12.8%,增速较第一季度有所提升。增长的主要驱动力来自于AI技术对广告素材生产、投放和推荐等环节的全面改造。

 

快手开始提供更适配行业特征的AIGC营销素材方案。比如在服装行业推出的「主播+模特」双人数字人直播间功能,支持模特根据主播讲解实时换装。某男装客户在使用该功能后,不仅将直播账号全部切换为数字人直播间,对应的营销消耗也增长了近2倍。

 

借助大语言模型的内容理解和推理能力,快手进行生成式召回,挖掘用户行为与广告转化间的潜在关系,从而提升营销素材的点击率,为线上营销服务收入带来了低单位数的增长。

 

UAX全自动投放产品持续提升渗透率,其消耗占外循环总消耗的比例提升至65%左右,这意味着广告投放的自动化和智能化水平进一步提高,提升了客户的投放效率。

 

电商业务也体现了AI助力全域经营。本季度,快手电商业务GMV同比增长17.6%,达到3589亿元。AI技术在其中扮演了提升人货匹配效率、降低商家经营成本和优化用户体验的关键角色。

 

通过对商品信息和用户兴趣进行高效提炼,AI大模型优化了平台的人货匹配效率;快手自研的AIGC能力「可绎」被用于赋能电商内容生态,降低商家经营门槛;泛货架场域也成为电商业务新的增长引擎。

 

本季度,以商城和搜索为代表的泛货架电商GMV占总GMV的比重超过了32%。618购物节期间,搜索GMV同比增长超过140%。这表明快手电商正从以内容推荐为主,拓展至内容推荐与用户主动搜索并重的全域经营模式,AI在优化货架场的流量分发和商品推荐中发挥了重要作用。

 

此外,快手也在利用平台能力融合线上线下,赋能实体经济。比如,「直播大舞台」项目已在全国57个城市落地,激活地方经济。本地生活业务也保持高速增长,第二季度收入同比增长近120%。

 

整体来看,快手2025年第二季度的财报,呈现了健康的财务增长,也验证了公司AI战略的有效性。

 

通过将AI技术深度应用于内容分发、商业化和电商运营的各个环节,快手初步找到了一条由技术创新驱动效率提升和业务增长的新路径。

 

但如果从更审慎的角度看,会发现,虽然财报中强调了AI带来的收益,但对总投入成本的披露不够透明。

 

财报显示,公司在年中追加了可灵AI的推理算力投入,导致相关资本支出预算较年初翻倍。虽然CFO表示对全年利润率影响可控在1-2% ,但这毕竟是一笔计划外的重大投资。未来AI的营收增长能否覆盖如此巨大的资本开支和折旧成本?其长期的投资回报率(ROI)仍需时间检验。

 

尽管可灵AI在「推理层面」实现了毛利率打正,但这并未包含前期巨大的模型训练成本。随着模型竞赛的加剧,未来的研发和训练投入可能持续处于高位,这或许会对公司创纪录的整体利润率带来压力。

 

此外,DAU同比3.4%的增速,或许显示平台在国内市场的用户渗透已进入瓶颈期。这对平台的商业化运营能力,即如何现深度挖掘4.09亿日活用户,提升ARPU值,提出了更高的要求。

 

1 个月,2 场胜仗,李斌从「斌子」变成「斌神」

2025年8月22日 16:50

短短两个月,蔚来 CEO 李斌的个人形象完成了光速逆转。

在乐道 L90 上市前,所有人都在教他做 CEO,甚至有极端的声音喊出「看好李斌的护照」;一个半月后,当第三代 ES8 的预售价被定位至 41.68 万元时,现场沸腾,李斌的形象变成了现场用户和媒体口中几乎破音的:

「斌神」

这台电池从 75 度升级到 102 度的新 ES8,比刚刚停售的第二代车型便宜了 8 万,甚至比租电方案购买的价格还要便宜将近 1.2 万。

如果采用租电方式购买,这台从第一代就锚定在「50 万级别」的纯电旗舰 SUV,入门门槛将进一步下探至 30.88 万元——只比 23 天前发售的乐道 L90 大顶配,贵了 9000 元;比最新的 ES6 整车购买价,还要再便宜近 2 万元。

当然,如果按照行业惯例,一个月后的正式发布会上,正式售价应该要比预售价再便宜一些。

比价格更让行业吃惊的是:这样的决策,是我们过去熟悉的那家蔚来几乎不可能做出的。

过去的蔚来,优雅但「拧巴」。各种决策里总是有很多噪音干扰:新车售价要考虑 BOM 成本,也要考虑对老用户的影响,还要考虑蔚来和乐道两个品牌之间的区隔……

所以,外界评价往往是:产品审美第一梯队,但价格和效率难以让人满意

这一次,杂音消失、目标明确。用李斌的话说:「活着是最重要的,活着才可以更好地兑现我们给老用户的种种承诺。」

短期的订单量也反应了用户的广泛认可。发布会结束后第二天,蔚来联合创始人、总裁秦力洪透露:在发布会结束后的 12 小时里,「全新 ES8 的订单量已经超越了同期(预售 12 小时)的乐道 L90」。

当然,和一个月前谨慎的乐道品牌总裁沈斐一样,秦力洪立即强调不能提前庆祝,表示后续生产、交付等工作需要踏实完成:「现在我们眼里都是活。」

 

座座都是 MPV

比起第二代 ES8,全新 ES8 首先的变化在于车身变得更大了:车长从 5099mm 增加到 5280mm,轴距从 3070mm 来到 3130mm。

在此基础上,基于 NT3.0 平台,它还能拥有更多的空间优势:

前备箱+后备箱总计 777L 装载空间(在六座坐满不放倒的情况下),不仅远超同级的三排 SUV,而且还超过了很多同尺寸的 MPV 车型。

在发布会现场,李斌现场演示了第三代 ES8「六人十二箱」的装载能力。包括:前备箱可以装下 2 个 20 英寸行李箱 +1 个 14 英寸儿童行李箱;后备箱可以装下 8 个 20 英寸行李箱 +1 个 12 英寸儿童行李箱。

此外,相比第二代产品 75kWh 的标配电池,全新 ES8 的入门版即标配了 102kWh 大电池,CLTC 续航达到 635km,官方标称电耗优化至 16.6kWh/100km。电池层面的加量不加价,也让 41.68 万元的起售价显得更有诱惑力。

李斌现场展示全新 ES8 的装载能力 | 图片来源:蔚来

真正让笔者感到惊喜的是,这一次蔚来对于全新 ES8 使用场景的全新解读。

首先,打开车门的一瞬间里,前排拥有 80 万级别 ET9 同款的内饰语言。所以尽管和 L90 同为三排六座 SUV,但不需要解释这是一台贴着 NIO 车标的 L90,因为从观感来看,这显然更像一台 SUV 版本的 ET9。

全新 ES8 前排搭载了和 ET9 一样的数字天际线屏 | 图片来源:蔚来

其次,在很长一段时间里,李斌都表达过蔚来品牌的高端车型会更强调「商务」属性。这一度是让笔者感到疑惑甚至担心的:毕竟在大型 SUV 的市场里,「家庭」是一个已经被验证的大场景。如果只谈「商务」,会不会让受众变窄?

这一次,蔚来总算为全新 ES8 里找到了一个更合适的传播方向:宜家宜商

第二排右侧的独立座椅,不仅可以躺倒,还拥有 150mm 的横移空间。蔚来在车机系统里预先定义了「观影」和「隐私」等模式,选择观影模式时,二排乘客可以「贴贴」;选择隐私模式时,可以拥有体面又得体的商务交流距离。

再如:全新 ES8 的二三排配备了六块电致变玻璃,可以调节三档透光度(通透、遮阳、全隐私)。而且,既可以通过门板上的实体按键完成「一键隐私」,也可以选择分区调节。左排乘客关闭遮阳帘休息,而右边乘客可以打开遮阳帘观景。

蔚来甚至在传播时还给出了一个小彩蛋,在第三排上方预留了一排衣帽接口。结合隐私玻璃的特点,把这个过往在传播时容易「油腻」的功能,包装成了「步入式衣帽间」的概念,给家庭和商务用户都提供了一个优雅的场景示范。

全新 ES8「宜家宜商」的内部空间设计 | 来源:蔚来

在智能化层面上,蔚来展示了一系列场景功能。

例如:在「守卫模式」下,车辆可以感知到周围的水涝或者火灾的风险。在发出报警的同时,还可以联动车辆空气悬架的升降,甚至调用无人泊车的相关功能让车实现自动驶离(还需满足一定法规规定)。

这样的功能需要联动整车多个域的控制,其实就是基于过去常说的「全域操作系统」、「正向研发」的能力。只是过去,这些技术名词略显枯燥,在传播时「肉往往都埋在了饭里」。而现在,蔚来正在用更多合适的场景展示自己的技术能力,找到更接地气的传播方式。

 

成为下一个连续爆款

2017 年,蔚来推出首款量产车型——第一代 ES8。那个时候,全铝车身、第二起居室的概念,加上 50 万级别的定价,给刚刚起步的中国新能源市场带来了足够的震撼,也为蔚来奠定高端、豪华的品牌形象打下了坚实的产品基础。

2022 年,第二代 ES8 亮相,蔚来进入了第二代车型平台。李斌后来坦承,这一阶段犯了一些产品定义上的「错误」。二代车型销量不及预期,蔚来也被新势力其他友商们拉开了一定差距。

去年年底,蔚来发布基于 NT3.0 平台的旗舰轿车 ET9,迈入第三代平台。根据极客公园的了解,ET9 搭载的线控转向、全主动悬架等功能,在其他主机厂和供应商里其实引发了广泛关注。但由于 ET9 定位较高、人群略窄,在消费端还是稍显曲高和寡。

相比起 8 年前的初代 ES8 发布,无论外部竞争还是内部环境都发生了巨大的变化。第三代 ES8 需要承载的使命也自然不同。

它不必再纠结于要定位在某个区间,以彰显蔚来品牌的「高端」和车型本身的「旗舰」定位。它更重要的责任是在 L90 之后,尽快成为蔚来公司的下一个爆款。

据了解,乐道 L90 自本月 1 号开启交付以来,已累计交付超 7000 台。而在 L90 正式交付的前两个月,乐道品牌的交付量大约为每月 6000 台上下。

李斌公布全新 ES8 预售价 | 图片来源:蔚来

李斌在此前的媒体沟通中提到,爆款的意义在于展示蔚来公司「持续、稳定、健康」经营的决心和能力。此前,他也反复强调蔚来公司的经营目标是在今年第四季度扭亏为盈——目前,在新势力中理想、零跑已率先完成年度和半年度盈利,小米(汽车业务)和小鹏也预计在下半年完成盈亏平衡。

值得一提的是,在今天的媒体沟通会上,当有媒体问起是否之后还会有基于三代 ES8 的五座车型 ES7。李斌没有否认,只是回答说:「这种思路的确会让开发效率更高。」

再加上已经公开的五座版 L80,也就是说,在 26.58 万元和 41.68 万元起售的 L90 和 ES8 之外,乐道和蔚来品牌还有「更便宜的牌」可以打出。那个曾经「售价不低于 30 万元」的蔚来品牌,如今正在带头重新锚定智能电动汽车行业的定价规则。

过往,人们在讨论每个组织的变化时,有一种常见的说法是「换帅如换刀」。暗指往往组织的变化往往需要从管理层做起。所以过去一段时间里,外界也会有声音把乐道品牌近期的转变,简单总结为从艾铁成到沈斐的人事变动。

如果照搬这套逻辑,那么几乎保持「原阵容」的蔚来,就应该是李斌革了自己的命。

我们很好奇在李斌和蔚来的内部,究竟发生了哪些转变。

但无论如何,我们正在看到一个「脱胎换骨」中的蔚来。

Manus 最新对话全文:尝试 Agent 支付,公司 RRR 近 1 亿美元

2025年8月22日 13:13

作者|Li Yuan

编辑| 靖宇

 

搬到新加坡的 Manus,对通用 AI Agent 的思考没有停止。

在今天在新加坡举行的 Stripe Tour 上,Manus 联合创始人兼首席科学家季逸超(Peak)与 Stripe 亚太地区及⽇本⾸席营收官 Paul Harapin 进行了对谈。

席间, Manus AI 披露了近期的经营数据,Manus AI 收入运行率(RRR,Revenue Run Rate)已经达到 9000 万美元,很快即将上亿。

Manus AI 的肖弘还特意在即刻表示,Revenue Run Rate 指的是当月的 Revenue *12,并不等于 Cash Income。很多 AI 产品都会有年付选项,这部分只能算作预存款,而不能记为 Revenue。「如果我们按照这种【错误方式】披露,可以算出一个一个比 1.2 亿美金更大的数。」肖弘表示。

除了经营数据之外,季逸超还分享了 Manus 团队是如何思考通用 Agent 的的下一步的,以及 AI Agent 和 AGI 未来到底有什么区别。

「现在大家几乎把一切都叫做 Agent。比如一个麦克风,有人会叫它是「有环境感知的收音 Agent。」季逸超开玩笑地讲道。

他也给出了拓展通用 Agent 能力下一步的两条主线: 其一,用多 Agent 协作把执行规模做宽 (如在大规模调研里衍生出上百个并行的子 Agent); 其二,给 Agent 打开更大的「工具面」 ,不把能力绑死在少数预置 API,而是像程序员一样调用开源生态、安装库、甚至在可视化后 看图自检并回改

季逸超还提到,今天的数字世界仍按「给人用」的范式建造——非 API 化网页、CAPTCHA、流程「小游戏化」带来大量摩擦, 瓶颈更像生态与制度约束,而非模型智力

这也是 Manus 参与 Stripe 活动的原因之一:双方正推进 在 Agent 内完成支付 ,把「研究—决策—下单/结算」连成闭环,用基础设施协作来消解世界的摩擦。

以下为对话精华,经极客公园编辑整理:

问:给观众简单介绍一下你自己吧。你最近关于「上下文工程」的博客非常鼓舞人心,我觉得对于在座任何正在开发 AI Agent 的人来说都是必读的。我每次去和工程师们吃午饭时,他们总是在谈论这个,所以我现在只能坐到别的地方(笑)。但对于现场可能不太熟悉 Manus 的人,你能分享一下你的经历和愿景吗?

答: 谢谢 Paul。很高兴能来到。Manus 在构建一个通用 AI Agent。

很多研究机构和公司,其实在尝试打造一个大脑——打造一个大语言模型。但我们认为,从消费者的角度来看,这其实并不好。AI 应该能真正采取行动,完成事情,所以我们构建了 Manus。

我们的方式,是让 AI 可以使用人类历史上最伟大的发明之一——通用计算机。给了 AI 计算机,它能做人类能做到的所有事。Manus 能真正完成任务。比如它可以帮你做演示文稿、帮你规划一次旅行,甚至能帮你运营社交媒体——虽然我并不推荐你真的这样做。

我们的用户真的很喜欢 Manus。 我们在三月份发布了 Manus,现在已经实现了大约 9000 万的收入运行率(RRR,Revenue Run Rate),很快就会突破 1 亿。

我觉得这对我们这样一个小型创业公司来说非常巨大。但更重要的是,这表明 AI Agent 已经不再只是一个研究领域的流行词,而是真正在被应用,落地生根。

我可以和大家分享一个我们构建 Manus 过程中的小故事。

我们其实从 Agent coding 的应用中得到了很多灵感。比如像 Cursor 这样的 AI 编程产品,之前已经吸引了很多关注。

作为工程师,我们自然会使用 Cursor。但让我们惊讶的是,公司里很多非工程师同事也在用 Cursor。当然,他们并不是在写软件,而是用它来做数据可视化,甚至写一些文章。他们会忽略左边的代码部分,只是跟 AI 对话来完成工作。

这让我们意识到:我们应该把这种方式泛化,赋能非程序员。这就是 AI 的一个用例。

问:我们越来越常听到人们谈论 AI Agent 和 AGI。你能不能帮我们更清楚地区分这两个概念?AI Agent 和 AGI 对你和 Manus 来说各自意味着什么?

答: 我们认为这是一个非常好的问题。

现在大家几乎把一切都叫做「Agent」。比如一个麦克风,有人会说它是「有环境感知的收音 Agent「。

但至少我们主张,Agent 应该是应用型 AI 的一个子集。我们不妨退一步,看看常见的 AI 应用类别。

大多数人已经熟悉两类:一类是聊天机器人,比如 ChatGPT;另一类是生成式工具,比如 MidJourney 或 Sora。 在这些系统中,通常只有两个角色:用户和模型。你和模型交互,得到输出。而 Agent 的不同在于,它除了用户和模型,还引入了第三个关键元素——环境。

这个「环境」的概念会因智能体类型不同而变化,比如在设计型 Agent 里,环境可能是一个画布或一段代码;而在 Manus 这里,我们的目标是让 Agent 出现在虚拟机甚至整个互联网中。这样 Agent 就能观察环境,决定下一步该做什么,并通过行动来改变环境。这让它非常强大。

比如在 Manus,你可以表达需求,它会打开浏览器、发布网页、帮你订一张机票。我很喜欢这个例子,因为虽然订机票听起来很简单,但这其实是 AI 在直接改变现实世界——结果不是模型的输出,而是你手里的机票。AI 真正介入了你的世界。这就是我们所说的 Agent。

简单来说,Agent 就是能代表用户与环境交互的 AI 系统。

至于 AGI,这个词也经常被提到,很多人把它等同于超级智能。我们认为,AGI 是一种能利用 AI 模型的通用能力,在不经过特别设计的情况下完成许多任务的系统。

我们认为「Agent coding」其实是通往 AGI 的一条路径。它不是一个垂直领域的能力,而是如果你把它赋予计算机,它几乎能在计算机上做任何事。所以对我们来说,AGI 的条件就是要构建足够完善的环境,让这种能力得以发挥。

问: AI 今天究竟在哪些场景中真正发挥了作用?未来会在哪些地方发挥作用?什么时候会出现 iPhone 时刻?

答: 就 Agent 而言,如果单看模型能力的话,现在的旗舰模型已经非常惊人了,几乎是「超人」级别的。它们可以在数学竞赛或逻辑推理上胜过我们大多数人。

但我认为,模型仍然像是「瓶子里的大脑」,如果想真正发挥力量,就必须让它们与真实世界交互、触达现实。但不幸的是,这正是问题开始的地方。

比如你让一个 AI 去做一些事务性的任务,它在重复性任务上确实很擅长。比如像 Deep Research 这样的产品,它只是聚合信息然后给出一个结果,它的输出只是简单地出现在那里。

举个例子,现在几乎所有东西都是为人类设计的,不只是物理世界,甚至数字世界也是这样。比如网页工具,它们就像小游戏一样,没有提供 API 或标准接口。验证码 CAPTCHA 无处不在,处处在拦截 Agent。

所以我认为 AI 在封闭的自包含任务中表现很好,但一旦涉及真实世界,就会遇到障碍。

未来什么时候能出现 iPhone 时刻?我觉得这并不是技术问题,而是更像是一种制度性限制。这不是像我们这样的 Agent 创业公司能够单独解决的事情。

我认为这需要一个渐进的转变,要求整个生态系统共同进化。这也需要像 Stripe 这样的公司在基础设施层面发力。比如我们正在集成新的 stripe 的 Agentic 支付 api。大家共同努力。

问:那我们能不能具体谈谈用户在使用 Manus 时的一些典型场景?他们是如何使用的?这其中体现出了怎样的力量?

答: 是的,我们虽然来自当前这一代 Agent,但已经看到很多很棒的用例。

比如说,我们刚刚搬到新加坡,需要雇佣房产中介来帮我们找住所。是真人 Agent(笑)。

而现在这些中介已经在使用 Manus:他们会根据客户的需求,用 Manus 来分析公司所在地、员工想住的区域,并生成相应的推荐。

我觉得这很有意思,因为这属于一种「长尾需求」。一般来说,并没有专门的 AI 产品是为这种具体场景设计的,但由于 Manus 是一个通用型 Agent,它就能满足这些需求。我们认为长尾需求非常值得关注。

从宏观角度看,它可能是长尾,但对具体用户而言,这正是他们的日常工作。这种场景特别有价值。

这就像今天的搜索引擎格局一样。如果你只是搜索一些常见的内容,不管用 Google 还是 Bing,结果质量差不多。那为什么人们会选择其中一个?可能是因为某个搜索引擎在特定时刻给了他们更合适的结果。而如果你搜索的是非常个性化或专业化的内容,就更能体现差异。所以我们认为通用型 Agent 的优势就在这里。

那如何让它更好呢?我们思考了很久,因为我们认为一切都绕不开编程。如果你把计算机交给 AI,那么它与环境交互的方式其实就是通过编程。

我们认为可以从两方面改进。第一是规模化。但如果你能把 Agent 的能力放大一百倍会怎样呢?

最近 Manus 刚刚发布了一个新功能,叫做 Wide Research。它的基本思路是允许一个 Agent 再衍生出上百个 Agent 一起去完成任务。你知道的, 如果只是让 AI 帮你做一些小事,很多时候你自己也能完成。但如果任务非常庞大,你一个人根本不可能完成,比如需要做大规模的研究,这时候让上百个 Agent 并行去做,就会变得非常强大。

其次,我们还需要让 Agent 更灵活地使用计算机使。比如,如果你只给一个 AI Agent 设置了预设工具,那么它的行动空间就被限制在这些工具里。但想象一下,如果你是一个程序员,你有整个开源社区的资源可以调用。

比如你在 3D 打印的时候,直接修改模型的参数很困难,但是你如果能找到 GitHub 上的合适的库,直接安装就能解决你的问题了。 在 Manus,我们在优化通用性,并且提出了一个概念,叫做「工具的网络效应」。

有一个很有意思的例子:很多用户在用 Manus 做数据可视化。你们知道,在亚洲有时候会遇到问题,比如在图表中显示中文时可能会出现字体错误。或许有些专业用户会写一些硬编码规则,比如在输出韩文时应该用哪种字体。但这种方式会让系统越来越僵化。

我们采取的办法是给系统增加了一个很简单的能力:查看图像。结果很惊喜——因为今天的模型已经很聪明了,它们会在生成可视化图像后自己检查,并意识到错误,然后再自动修正。我们发现, 增加工具的灵活性比硬编码规则能解决更多的问题。

问:这是一个令人兴奋的时代。我真的很激动,只希望自己能再年轻到三十岁(笑)。提到医学研究的,我知道 Manus 在这方面也很强。你们观察到有些用户在使用 Manus 研究医疗吗?

答: 很多人已经在用 Manus 做研究,不仅限于医学研究。我们觉得这很有意思,因为现在确实有很多所谓的「深度研究」产品,它们会帮你收集大量信息并做一些分析,但最后只给你一个 markdown 文件或文档。这远远不够。

很多时候,研究人员真正需要的,是能够直接交付给老板或团队的成果。所以我们在 Manus 上加强了研究结果的输出。例如在医学研究中,很多时候需要生成正式的报告,比如幻灯片报告之类的东西。因此我们必须优化 AI 的输出能力,以满足研究人员的需求。这是一种「工具化」的体验。

比如现在很多用户会先用 Manus 做研究,然后直接生成一个网站。你会觉得这和传统的网站搭建方式完全不同。

要知道,搭建一个网站本身其实不难,难的是如何确保数据的可靠性和准确性。所以我们认为,最好能在一次会话、一个共享的上下文中完成整个流程。这样,你的研究、你的见解就能无缝转化为最终成果。 这就是我们在 Manus 里所做的事情。

问:很多国家都在讨论一个话题:在 AI 时代,人类的未来和经济影响。你怎么看待就业被取代?又会出现哪些新的工作机会?

答: 我们的朋友和投资人也经常问我们这个问题。当我们推出 Manus 时,最初认为如果能构建这样一个 Agent,它就能帮人们节省很多时间,让大家轻松赚钱。

但实际上,我们发现这个愿景并没有完全实现。通过大量用户调研,我们发现用户在使用之后,他们反而工作得更多了。因为他们变得更高效了,他们实际上能做更多他们本来就很擅长的事情。这是第一点。

其次,我们认为 Manus 还打开了一个全新的空间。我们一直在讨论虚拟机和云计算。我们觉得 Manus 正在扮演一种「个人云计算平台」的角色。比如云计算已经存在几十年了,但它更多是工程师的特权,只有我们能通过编程来调用云的力量。普通知识工作者无法使用。

但现在有了像 Manus 这样的 AI Agent,人们可以用自然语言下达指令,让 AI 去执行。这等于解锁了一种全新的生产力。这就是我们所带来的。

而最后,关于「替代」,我认为其实很难。比如房产中介,他们每天都在用 Manus 完成日常工作。但你知道,AI 永远无法替代中介面对客户时的那种沟通方式。我们是一家 AI 公司,甚至 Manus 的发布视频都是由 Manus 写的脚本,但视频里出现的还是我,因为这是关于信任的事情。而信任,是不能完全交给 AI 的。

*头图来源:stripe

对话小米 AI 眼镜负责人:20 天卖光库存,但属于产品的「长跑」才刚开始

2025年8月22日 12:21

2011 年 8 月,雷军穿着标志性的黑 T 恤和牛仔裤,在北京 798 艺术中心发布了初代小米手机。在这款产品搅动整个智能手机行业之前,他首先用一个极具冲击力的数字定义了它——1999 元。

要在中国普及智能手机,至少在价格上要打破国际品牌的壁垒。这种思路,不仅定义了小米的第一个十年,也深深影响着小米的产品信条。

十多年后,当小米决定投身 AI 眼镜这片更具挑战的蓝海时,也秉持着一种类似的务实主义——「智能眼镜,首先得是一副眼镜」

雷军在发布会上介绍小米 AI 智能眼镜的过程中,其实并未兜售遥远的未来,而是选择以一款成熟的、不带显示能力的 AI 眼镜形态,去试探市场的真实水温。

这款眼镜看上去与普通黑框眼镜差别不大,没有夸张的科技元素,将核心的智能模块、电池与音频单元都收纳于镜腿之中。而推出这款产品的团队,则是在小米这家消费电子巨头内部,一个为探索下一代计算平台布局多年的团队。

该项目的负责人李创奇,是小米高级产品总监、可穿戴部创新业务负责人。

早在 2015 年,当他第一次看到微软 HoloLens 时,就认定眼镜作为个人计算的中枢,可能就在不远的未来,并为此开启了一场长达近十年的「蓄力」:为了理解光学显示,他去申请启动小米投影仪业务,由此推出的米家激光投影电视;为了攻克声学,他转而负责耳机业务;为了真正理解眼镜的本质,他甚至在 2021 年亲自带队,在小米内部做了一段时间传统太阳镜/防蓝光眼镜业务。

2023 年 7 月,李创奇觉得时机「快到了」,用户对一款可以日常佩戴并具备基础智能功能的眼镜的需求已清晰可见,小米 AI 眼镜项目正式立项。

 

小米高级产品总监、可穿戴部创新业务负责人李创奇|图片来源:小米

 

两年后,这款产品正式发布,市场反响远超内部最乐观的预期——为三个月准备的库存,在 20 多天内便销售一空,其销量达到了部分友商一年的水平。

小米 AI 眼镜作为初代产品,在重量、续航和佩戴舒适性上做到了微妙的平衡,最终将重量控制在 40 克。他们没有像 Meta 那样与眼镜巨头联名,而是选择自己完成从设计到生产的全过程,并为亚洲人的头型和脸型做了针对性优化。

「我们开始动手做的时候也觉得(这事)很容易,但后来发现,没有任何一个环节是简单的,」李创奇坦言,「这件事的难度远超过我们最早的评估」。从人机工学、材料选择到软件适配,每一步都充满了艰难的权衡。

这款售价 1999 元的产品,复刻了初代小米手机的定价,也承载了相似的雄心。这一定价背后,是小米对一个新兴品类战略性的投入与布局。

李创奇认为,在一个被科幻电影拉高了预期的市场,和一条尚未为眼镜形态准备好的供应链之间,存在着巨大的鸿沟。而小米要做的,不是一次性发布一款「100 分」的终极产品,而是开启一场「注定是马拉松」的长跑,用一款「60 分」的及格产品,为自己赢得进入下一赛段的资格。

本文基于极客公园与李创奇采访内容整理成文。

 

01

「60 分」的产品与「远超预期」的市场

 

极客公园: 小米 AI 眼镜上市后,市场反响非常火爆,20 多天就卖出了过去一些友商可能需要一年才能达到的销量,这显然远超了你们的预期。但在这种背景下,你却多次提到,你只给这款初代产品打「勉强及格」的 60 分。你如何解读这个「60 分」的产品?

李创奇: 其实我们内部,包括整个公司,都非常清楚这款产品处在什么样的阶段。说它 60 分,或者说它处在一个「快到了将可用的一个状态」,是一个非常客观的描述。

网络上的不少用户的吐槽我们都有看到,它(小米 AI 眼镜)不是一款各方面都没有短板、非常均衡的产品。它一定是在某些地方可用,某些地方还不错,但同时在另一些地方,也一定存在很大的差距。

这种差距的核心根源在于,当前消费者对眼镜的期望,和整个产业链、供应链的技术储备之间,存在一个巨大的鸿沟。用户的预期,尤其是在各种科幻电影的熏陶下,已经形成了一种对眼镜形态的终极认知。

但现实是,我们现有的产业链,无论是芯片、传感器还是电池技术,它的一切都是围绕着手机去构建的,它对于功耗和体积的考量,并不是为眼镜这种极致形态所储备的。

我们的产品能获得这样的市场反响,确实远超预期。最初我们备货非常保守,内部甚至弥漫着「卖不掉怎么办」的担忧。我们原本为三个月准备的货,结果 20 多天就卖完了,这个量级相当于一些专门做眼镜的公司一年的销量。

这背后,一方面有雷总亲自发布带来的巨大势能,另一方面也证明了市场对于 AI 硬件,尤其是来自一个主流品牌的 AI 硬件,存在着巨大的潜在需求。它甚至在小红书等社交平台引发了几次出圈,这说明它的吸引力已经超出了传统科技爱好者的范畴。

极客公园: 你们为首代小米 AI 眼镜定下了 1999 元这个价格,这个数字对小米而言有特殊的意义。它既是初代小米手机的价格,也似乎在暗示着 AI 眼镜作为下一个计算平台的雄心。这个定价背后是怎样的考量?

李创奇: 从我个人来说,1999 这个数字一定是有致敬因素在的。对我而言,它已经不单单是一个数字,它有情怀,有图腾,甚至有方向的感觉。

更重要的是我们希望锚定一个品类,而 1999 元,或许就是未来智能眼镜这个品类的中位数价格。

 

小米 AI 眼镜 1999 的售价并没有太多惊喜|图片来源:小米

 

但就目前阶段而言,以我们前期的投入和目前的规模,这个价格肯定是赔钱的。

这已经不是赚多赚少的问题,而是赔多赔少的问题。因为这是一款在极短时间内要完成的极其复杂的产品,我们在所有元器件的选择上,都把可靠性放在了成本之前,不计代价地去做。我们的 BOM(物料清单)成本,如果算上墨镜片,是超过 2000 元的。

所以,这个定价并非基于成本,而是一种战略性的选择。它是在向市场、向用户、向供应链传达一个信号:小米是认真地想把这个品类做大,并愿意为此进行先期投入。我们认为,目前市面上那些定价在 1499 元甚至 999 元的产品,从成本结构来看,都是不健康的。而 1999 元,在未来规模化之后,会是一个相对健康的价格区间。

这种「不健康」的亏损,换来的是一个极其宝贵的认知。保守的备货预期反映了我们最初对市场的不确定性,而最终火爆的销量则给了我们一个强有力的「市场验证」。

可以说,这款产品是我们投入市场的一个最精准的探针。正是这个远超预期的结果,为我们下一代产品的研发解锁了比初期多得多的内部资源和信心,让这个项目从一个谨慎的探索,正式升级为公司的战略级业务。

 

02

「首先它得是一副眼镜」

 

极客公园: 你在很多场合都强调一个理念——「智能眼镜,首先得是一副眼镜」。这听起来简单,但在实际产品定义和研发中,一定充满了各种艰难的取舍。能否具体谈谈,这个理念是如何指导你们在工程现实中做出选择的?

李创奇: 这个理念是我们走了很多弯路后得出的。小米很早就开始关注这个领域,从早期和 Facebook 合作 Oculus Go,到后来做无线 AR 眼镜预研,再到米家音频眼镜。

我们观察了从 Google Glass 到 Snapchat Spectacles 的演进,得出一个核心结论:过去很多产品失败,是因为它们过于强调「智能感、未来感、科技感」,而忽略了眼镜最本质的属性——佩戴。

所以,我们确立了「首先它得是一副眼镜」的原则。这意味着,你得戴着舒服,哪怕不那么惊艳,但至少不能突兀。基于这个原则,我们做出了几个关键决策。第一,从音频眼镜切入,因为音频是增加智能功能里,对体积、功耗影响最小,且最高频的应用之一。第二,我们很早就采用了镜腿和前框分离式的设计。

 

小米 AI 眼镜透明版配色比较有科技感|图片来源:极客公园

 

因为眼镜有很强的装饰属性,分离式设计能让用户未来更换不同款式的前框,满足个性化需求。

在这个基础上,我们对增加任何新的智能功能都秉持一个原则:谨慎,但有效。因为任何功能的加入,都会直接影响体积和功耗。功耗增加,为了维持续航,电池就得做大,体积又会增加,这是一个恶性循环。

极客公园: 这种「谨慎但有效」的原则,具体体现在哪些产品细节的权衡上?比如,你们如何看待和 Meta Ray-Ban 的差异?

李创奇: 这种权衡其实在我们的产品中随处可见,它是一系列「戴着镣铐跳舞」的决策。

首先是 重量 vs. 质感。我们内部有一个非常严苛的目标,就是重量不能超过 40 克,最理想是做到 35 克。为了实现这个目标,在电池比 Meta 更大、且采用双芯片架构的情况下,我们最终把重量控制在了 40 克左右,比它还轻。

但这背后是有代价的,我们牺牲了材料的密度,这导致一些用户在拿到手上时会觉得「塑料感」比较强,质感不如 Meta。

但现在回过头看,这可能真的是一个设计上值得商榷的部分,也许用户真的愿意为更好的质感多承受三四克的重量。

其次是 端侧 AI vs. 续航。我们最初也评估过在眼镜上部署端侧小模型,比如 0.3B 规模的。

但我们很快发现,在手机上跑一个 0.3B 模型可能不算什么,但在我们仅有 200 多毫安时电池的眼镜上,它的功耗是毁灭性的,可能半小时到一个小时就没电了。相比之下,通过蓝牙与手机通信,利用手机或云端的算力,功耗收益要明显得多。所以现阶段,我们宁愿选择通信的方式来解决算力问题。

再者是 单一框型 vs. 个性化。初代产品我们只推出了一种框型,这背后是我们对这个品类「信心还是不够的」一个体现。我们深知,没有任何一副眼镜能让 100% 的人戴上都好看。这导致我们收到一部分用户反馈,觉得不适合自己的脸型。

这是一个现实的能力短板,传统眼镜品牌会用成百上千个 SKU 来解决这个问题。我们未来一定会提供更多选择,但第一代产品,我们选择了用一个最大公约数的设计去验证核心功能和市场接受度。

最后是 充电方式的选择。很多人问为什么不做充电眼镜盒,而是用直插充电。我的回答很简单,我问我们团队 20 个戴眼镜的同事:『你们的眼镜盒在哪?』。其次,如果眼镜在盒里充电,那这个过程中你戴什么呢?难道要用户买两副换着戴吗?如果是我们这么做,一定会被骂死。是 Meta 和 Ray-Ban 的品牌光环,掩盖了它的一些问题。

和 Meta 的对比其实也很有意思。比如 Meta 验证了一件事:用户是可以接受把一颗 1200 万像素的大尺寸传感器放在镜腿上的。这给了我们很大的启发,让我们坚定了从过去考虑的 500 万或 800 万像素转向更高规格的影像能力。

但同时,我们也看到了它的不足。比如它的续航,在我们看来是「不及格」的,无法支撑一天的佩戴。另外,它的设计对亚洲人的头型并不友好,很多人戴上会觉得「夹头」。这些都是我们在设计中希望改进和超越的地方。

 

小米 AI 眼镜透明版镜架|图片来源:极客公园

 

 

03

一场注定的马拉松

 

极客公园: 你认为,在当前这个时间点,什么样的公司才有可能在这场「百镜大战」中最终胜出?

李创奇: 我们和很多投行的朋友聊过,我个人的观点是,只有两类公司有机会。第一类,是有手机和穿戴生态的公司,全球来看就是苹果、三星、华为和小米。第二类,是有国民级 APP 和顶级大模型的互联网公司,比如腾讯、字节跳动等。

为什么这么说?因为 AI 眼镜不是一个单纯的硬件问题,它是一个极其复杂的系统工程。你需要解决硬件、操作系统、大模型、营销渠道以及与其他设备联动等一系列问题。

对于创业公司来说,这几乎是不可能完成的任务。我甚至会委婉地建议我关系好的投资人朋友,不要轻易投这个领域的创业公司。

这个赛道的护城河,最终不是设备本身,而是它背后的生态。对小米而言,我们最大的优势在于,我们拥有全球最大的消费物联网平台。

我们的用户已经习惯了用「小爱同学」去控制家里的空调、灯光、扫地机器人。当这种控制能力无缝地迁移到眼镜上时,它所创造的价值是任何一个创业公司都无法比拟的。

极客公园: 既然这是一场马拉松,小米为这场长跑设定了怎样的阶段性目标和时间表?

李创奇: 我们对这件事的难度有清醒的认知。我个人最美好的预期是,这个市场需要三年时间,才有可能真正成熟起来,到那时我们或许能做出一款七八十分的产品。

在销量上,我们也有一个长期的期望。中国每年近视眼镜的出货量接近 3 亿副,其中千元以上的市场规模大约在 5000 万副。我们希望在未来三年,能做到年出货 500 万副的规模,这相当于在千元以上这个核心市场里,占据 10% 左右的份额。这是一个非常美好的目标,也是一个有挑战性的期望。

要达到这个目标,不能只靠一代产品。我们下一代的研发已经启动了。

随着第一代产品的成功,项目组现在拿到的资源已经比刚开始的时候好太多了,这让我们有更足的底气去实现最初的构想。

 

04

AI 眼镜的终局在哪里

 

极客公园: 跳出具体的产品和市场,从更宏大的视角来看,你认为 AI 眼镜这个形态,它最终要解决什么问题?它的终局会是什么样的?

李创奇: 我有一个很早有过的观点,可能比扎克伯格提的还要早一些。AI 眼镜的终极价值,在于实现「See what you see, hear what you hear」(所见即所见,所闻即所闻)。

它不仅仅是一个拍照工具或音乐播放器,它是 AI 的一个感官延伸。它能以第一视角去理解你所处的物理世界,理解你的上下文,这是手机放在口袋里永远无法做到的。

我今天有一个更进一步的判断:由大模型赋能的智能眼镜,可能是脑机接口真正普及化之前,最能够理解和识别用户意图的消费级设备。

人类 70% 到 80% 的信息获取来自于视觉,一个能够分享你视觉的设备,在理解你的意图上拥有天然的、无与伦比的优势。从鼠标到触摸屏,再到语音助手,人机交互的历史,就是一部不断降低意图传递摩擦力的历史。AI 眼镜,就是这个历史进程中合乎逻辑的下一站。

极客公园: 这听起来是一个非常宏大的愿景。但它似乎更偏向于用 AI 增强现实世界,而不是像 Meta 或苹果那样,构建一个虚拟世界。

李创奇: 是的,这是一个战略选择。我们短时间内不会碰 MR(混合现实)。我们的优势在于硬件和庞大的 IoT 生态。

所以,我们的路径是清晰的:用 AI 眼镜更好地连接和赋能用户与物理世界的交互,而不是把他们带入一个虚拟世界。这与 Meta 的路径有本质的不同。

极客公园: 听下来,感觉 AI 眼镜这个项目对你个人而言,似乎有着其他项目难以比拟的意义。

李创奇: 我是从 2015 年看到微软的 HoloLens 之后,就决定要用至少十年的时间来做眼镜这个产品。这是一个漫长的、有意识的积累过程。

当时你显然不可能直接跟雷总说,HoloLens 就是未来,给我 100 亿让我去造一台出来。所以我把它拆解开,一步步来。HoloLens 的核心是光学显示,我就去申请做了投影仪业务;它需要强大的声学能力,我就去做了耳机业务;为了理解眼镜本身,2021 年我们甚至还做了一段时间的传统眼镜业务。

所有这些积累,都是为了保证我们今天在做 AI 眼镜时,能对这个品类的复杂性有足够的认知,能少犯一些错误。但即便如此,这件事的难度依然远超我们最初的评估。让整个团队对这些困难建立共识,是其中最难的一环。

所以,我们坚定地看好这个方向,但它注定是一场马拉松。物理世界不会以你的意志为转移,你必须在如此狭小的空间里,去完成一项如此复杂的系统工程。这需要极大的耐心,也需要对行业规律抱有足够的尊重。

我们并不是要去颠覆一个行业,而是希望用我们的努力,去推动和符合大家对这个行业的最终认知。

DeepSeek V3.1 发布:更强的 Agent ,更贵的 API;多家网约车平台集体降抽成;影石发布 4K 画质「口袋相机」|极客早知道

2025年8月22日 08:36

DeepSeek V3.1 发布:更强的 Agent 能力,更贵的 API

8 月 21 日,DeepSeek 正式发布新模型 V3.1,被官方称为「迈向智能体时代的第一步」。虽然未见期待已久的 R2 模型,但本次迭代重点在于 更强的 Agent 能力、混合思考模式与更高思考效率。

V3.1 采用混合推理架构,用户可在「思考模式」与「非思考模式」间自由切换:复杂任务可调用深度推理,简单任务则快速响应,避免性能浪费。官方测试显示,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,表现与此前 R1-0528 持平甚至更快。

此外,新模型在工具调用和智能体任务中的表现明显提升,编程与搜索 Agent 测评均优于前代。基础模型在 V3 的基础上新增 8400 亿 tokens 训练,并已在 Huggingface 与魔搭开源。DeepSeek 同时宣布支持 Anthropic API 格式,方便用户将其能力接入 Claude Code 框架。

值得注意的是,API 价格同步上调:自 9 月 6 日起,取消夜间优惠,输入价格缓存命中为 0.5 元/百万 tokens,未命中 4 元(此前 2 元),输出价格则由 8 元涨至 12 元/百万 tokens。(来源:第一财经)

GPT-6 进入开发阶段,将首次引入「个性化记忆」功能

8 月 21 日,据报道,OpenAI 首席执行官 Sam Altman 近期在多场采访中透露了下一代大模型 GPT-6 的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从 GPT-4 到 GPT-5 的周期更快,并将首次引入「个性化记忆」功能。

据介绍,新模型会长期记住用户的身份、语言风格、关注领域、日常习惯,甚至细微癖好,并据此持续调整回答方式,实现「越用越懂你」。用户可基于 GPT-6 创建专属于自己的聊天机器人,用于工作、学习或生活场景,机器人将精准复刻个人偏好与沟通语气。

Sam Altman 还提及到,OpenAI 正与心理学家合作,通过测量情绪反应与长期幸福感来优化交互体验,相关数据未来可能公开。

针对记忆带来的隐私风险,Sam Altman 表示未来可能引入加密机制,尤其在医疗、法律等敏感场景。简言之,GPT-6 将不再只是「问答工具」,而会成为长期陪伴、深度理解用户偏好的「数字伙伴」。(来源:OSCHINA)

 

马斯克称星舰第 10 次试飞周日发射,Grok 5 下月开始训练

8 月 21 日,伊隆・马斯克在 X 平台透露了其业务的后续规划:

  • Starship 10(星舰第 10 次试飞)将于本周日发射

  • Grok 5 将于下个月开始训练

  • 特斯拉 Autopilot V14 也将于下个月推出

这是星舰今年第 4 次试飞,此前 3 次均因上级火箭失利未能完全达成任务目标。(来源:IT之家)

滴滴出行、曹操出行、T3 出行等多家网约车平台集体降抽成

8 月 21 日,据第一财经报道,滴滴出行表示,今年年底前,平台将把每笔订单最高抽成上限从 29% 降至 27%,超出 27% 的部分将随单返还。同时,针对每月在平台完成订单达到 50 单的司机,平台将通过「返佣宝」保障其当月月均抽成上限不超过 25%,超过部分将在次月自动返还至司机账户。

T3 出行表示平台订单的抽成比例最高不超过 27%,今年年底前将抽成比例 26%-27% 的订单数量占比从 21% 降至 17%。对于每月订单完成量不少于 50 单的平台司机,保障其当月流水总额的抽成上限不超过 25%,超出部分自动返还司机。

曹操出行则在 8 月 15 日表示,自当日起曹操出行 APP、小程序订单的抽成比例上限将由原来的 22.7% 下调至 22.5%。

聚合平台也表示将下调信息服务费。8 月 18 日,高德打车表示,推动不少于 80 家合作网约车平台的抽成比例上限不超过 27%(含高德平台向合作网约车平台收取的信息服务费,司机收入不低于乘客实付费用的 73%),惠及超百万司机。高德打车信息服务费上限全部降至 9%,并通过减免佣活动、专项奖励等方式推动合作平台综合成本降低 2%。(来源:DoNews)

 

​特斯拉大模型「上车」细节曝光:语音助手接入豆包与 DeepSeek

8 月 21 日,特斯拉正在为其车辆的语音助手功能引入更强的 AI 能力。根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。

条款内容显示,特斯拉的语音助手将得到 火山引擎提供的 Doubao 大模型(云雀大模型)和DeepSeek Chat 的技术支持。这意味着,在具备 AI 互动能力的特斯拉车辆上,车主不仅能通过语音命令控制车辆功能,未来还将能与语音助手进行轻松聊天,以获取资讯、查询天气等,实现更自然的智能座舱交互体验。车主可通过物理按键或「嘿,Tesla」等唤醒词激活该功能。官方暂未公布 AI 互动的具体上线时间。(来源:cnBeta)

 

B 站发布 2025 年 Q2 财报:日均活跃用户 1.09 亿,调整后净利润 5.6 亿元

8 月 21 日,哔哩哔哩(以下简称「B 站」)公布了截至 2025 年 6 月 30 日第二季度未经审计的财务报告。财报显示,2025 年第二季度 B 站总营收达 73.4 亿元人民币,同比增长 20%。

二季度,B 站广告业务收入为 24.5 亿元,同比增长 20%;游戏业务收入为 16.1 亿元,同比增长 60%。运营效率的提升与高毛利业务的快速增长,推动 B 站毛利润同比增长 46%,毛利率连续十二个季度环比提升至 36.5%;净利润和调整后净利润均创下历史新高,分别为 2.2 亿元和 5.6 亿元。

商业化效率提升的同时,B 站社区规模与活力持续提升。二季度,B 站日均活跃用户数达 1.09 亿,同比增长 7%,创历史新高;月均活跃用户数达 3.63 亿,同比增长 8%;月均付费用户达 3100 万,同比增长 9%。本季度,B 站用户日均使用时长达 105 分钟,相较于去年同期增长 6 分钟。(来源:网易新闻)

vivo 发布 MR 头显 vivo Vision 探索版:全球最轻,双目 8K

8 月 21 日,vivo 在东莞发布首款混合现实(MR)头显——vivo Vision 探索版。 这是国内手机品牌首次进入高端 MR 市场,设备重量 398 克,搭载第二代骁龙 XR2+ 平台,配备双目 8K Micro-OLED 屏幕,主打轻量化与高分辨率显示。

在交互方面,vivo Vision 支持自然眼手交互,并内置虚拟助手「蓝心小 V」,提供语音陪伴和功能引导。硬件上,设备支持最高 1000 度近视调节,标配磁吸光学镜片,并通过空间相册、沉浸式娱乐和多窗口办公等场景,尝试拓展使用范围。

vivo 强调,这款产品不仅是单一头显,而是其全场景生态战略的一部分。例如,用户可通过与旗舰手机 X200 Ultra 配合,实现从 3D 拍摄到头显端回看的体验闭环。

目前,vivo Vision 探索版尚未公布价格,也不会在 2025 年内启动公开销售。自 8 月 22 日起,北京、深圳等十余座城市的 12 家 vivo 体验店将开放预约试用,后续计划扩展更多门店。

 

影石发布 4K 旗舰画质「口袋相机」GO Ultra:1/1.28 英寸大底传感器,5nm AI 芯片加持

8 月 21 日,影石 Insta360 正式发布首款旗舰画质口袋相机 GO Ultra,定位为 GO 系列全新旗舰子线。新机延续「小体积+专业性能」的路线,主机仅重 53g,单机续航达 70 分钟,搭配拓展舱可突破 200 分钟,支持 12 分钟充至 80% 电量,成为全球首款搭载叠片电池的运动相机。

GO Ultra 采用 1/1.28 英寸大底传感器和 5nm AI 芯片,算力提升 50 倍,支持 4K 60fps 拍摄,新增夜景模式与 PureShot 纯净拍摄功能,暗光细节提升显著。机身配备磁吸系统和随心贴、快拆等配件,可实现胸挂、帽夹等多样化拍摄,满足日常、运动与亲子场景。

 

在运动拍摄上,GO Ultra 提供 156° 超广角视野与 FlowState 防抖技术,支持 10 米防水及多种降风噪模式,兼容 Apple Watch、Strava 等运动生态,获环法冠军塔代伊·波加查等职业运动员认可。在亲子和 Vlog 领域,其「小方块」造型更贴合日常,支持一键开拍、横竖屏秒切与无线预览,AI 自动生成「亲子时光」相册,成为家庭记录的理想工具。

自 GO 系列诞生以来,其「蚊子视角」视频风靡全球,此次 GO Ultra 的推出,进一步丰富了 GO 系列产品线,延续「让创作触手可及」的理念。该机现已在官方商城、天猫及京东等平台发售,售价 2598 元起。(来源:极客公园)

 

中国市场尺寸最大纯电 SUV:全新蔚来 ES8 预售,41.68 万 / 租电 30.88 万元起

8 月 21 日,蔚来全新一代 ES8 正式发布并开启预售,定位全场景科技旗舰 SUV,将于 9 月下旬上市交付。

价格方面,六座与七座行政豪华版起售价 41.68 万元,签名版 45.68 万元,均可选择租电方案,起价 30.88 万元。

新车车长 5280mm、轴距 3130mm,是当前中国市场尺寸最大的纯电 SUV。全车搭载 31 个感知硬件,其中包括 3 个激光雷达,车内采用实木、金属饰条与大面积刺绣工艺。车舱面积 6.2 平方米,支持 6 人携带 12 箱行李,前后备箱总容积 777L。

内饰配备 Skyline 天际线屏、横幅中控屏和升级的 NOMI 系统,共有 111 个实体按键。三排座椅均支持零重力或放平功能,并提供 1.7 平米智能隐私车窗。影音方面,首发 21.4 英寸天空屏,内置 2600W 环绕音响系统,支持杜比全景声与视界。

动力系统基于 900V 架构,双电机总功率 520kW、扭矩 700N·m,零百加速 3.97 秒,CLTC 续航 635 公里。标配双腔空气悬架和智能湿地模式,最小转弯半径 5.7 米。

安全方面,新车配备 11 气囊、72 项碰撞验证和 65 项主动辅助功能,并首发“智能守卫模式”,可在检测水淹风险时自动升起悬架、提醒车主,未来或支持自动驶离危险场景。(来源:IT之家)

 

比亚迪新一代「小白桩」:「灵充」汽车充电桩发布,3.5kW 和 7kW 双版本

8 月 21 日,比亚迪宣布推出「灵充」充电桩,是旗下新一代「小白桩」产品,现已全面开放销售。

相比上一代充电桩,比亚迪「灵充」充电桩改为了更加圆润的设计,3.5kW 和 7kW 双版本可选;支持即插即充或 NFC 刷卡,且支持手机复制卡片信息,轻轻一碰即可启动。

「灵充」充电桩号称深度兼容主流新能源汽车品牌,告别为不同车型寻找专用桩的烦恼;支持超长质保,小智版再送 6 年流量桩体防伪码,扫码可辨真伪。

安全方面,「灵充」充电桩支持 11 重防护,并通过了高温、盐雾、潮湿等环境测试。

在比亚迪官方线上商城,暂未找到「灵充」充电桩售卖渠道。上一代充电桩搭配安装服务定价 1499 元。(来源:IT之家)

罗永浩进军泡面赛道:推出康师傅特别特 TBT 鲜泡面限定版,约 10 元一碗

8 月 21 日消息,罗永浩在抖音康师傅官方旗舰店发布「9 年磨一面」的特别特(TBT)鲜泡面,并公布了该面的罗永浩特别限定款。

特别特鲜泡面号称是「中国单篓水煮工艺鲜泡面开创者」,有海味龙虾、山野红酸汤、烧汁雪花牛肉三种口味,在盖子顶部配有筷子。

定价方面,特别特鲜泡面 4 桶装 39.9 元,6 桶装 59.9 元。开售仅 1 小时,销量已突破 7.1 万单。IT 之家注意到,开售 2 小时后,直播商品链接中的「罗永浩专属」泡面组合显示已售罄。@ 罗永浩的十字路口 账号也表示,10000 份 TBT 限定款售罄。(来源:IT之家)

汽车业务还没盈利,小米却已找到「第三曲线」

2025年8月21日 18:02

连续五个季度,小米都实现了营收同比 30% 以上的增长。「史上最佳」这个词,从传播的角度来看,放在小米身上好像已经不够刺激了。

刚刚过去的第二季度里,小米 YU7 是毫无疑问的明星产品,发售 18 小时即收获了 24 万订单,几乎是很多友商一年的量;而首款 AI 眼镜的发布,也成为了 AI 硬件领域里最受关注的一款产品。

8 月 19 日晚,小米集团发布了 2025 年第二季度财报。本季度,小米集团整体营收达 1160 亿元,同比增长 30.5%;经调整净利润为 108 亿元,同比大增 75.4%。

在这些已经有些「审美疲劳」的高分答卷里,我们突然发现冰山下,过往并不在聚光灯下的大家电版本正在快速增长。

官方信息显示,第二季度小米空调、冰箱、洗衣机三大「大家电」品类的出货量分别增长超过 60%、25% 和 45%。其中,小米空调在线上渠道的出货量已经从去年的第四名,来到行业前三。按极客公园估算,小米空调的单季度营收预计将占到整个 IoT 业务营收的三分之一。

在智能手机整体行业增长远低于预期的情况下,IoT 业务和手机业务之间的差距也在逐渐缩小。尽管没有小米汽车那样浓的爆款光环,也没有 AI 硬件那样性感的资本故事,但大家电业务,似乎正在依靠着稳定的出货量增长,成为小米第三曲线。

站在这个节点观察小米,我们发现小米的创新,不止造车这一件事。

 

小米的「第三曲线」,竟然是空调?

相比「老本行」的手机业务,以及雷军亲自带队、爆款频出的智能电动车业务,小米的「IoT 与生活消费产品」(以下简称「IoT 业务」)很长一段时间里并没有被外界划分到小米最核心的业务范畴里。

不过,这种情况正在发生转变。

从整体营收规模看,IoT 业务在集团整体营收中贡献越来越大。在智能手机行业整体陷入超低速增长的大环境下,IoT 业务和手机业务之间的差距也在逐渐缩小。

财报显示,2025 年第二季度,IoT 板块总营收达到 387 亿,同比增长 44.7%,占本季度集团总营收的 33.4%。值得一提的是,该板块整体营收规模和「智能手机」板块之间的差值,从上一季度的 183 亿元,迅速缩小至 68 亿元。

小米「手机 x AIoT」分部第二季度营收情况 | 来源:小米财报

在小米的业务构成中,IoT 业务板块除了大家电(也就是「空冰洗」三大品类),还包括平板、笔记本电脑、可穿戴的智能手表手环等其他诸多品类。

小米并没有公布不同品类的详细营收数据。不过,我们可以尝试进行一个非常粗略的估算:

首先,按照官方口径,小米空调本季度出货量超过了 540 万台;其次,小米集团总裁卢伟冰的个人微博账号近日转发的一条动态显示,7 月小米空调线上渠道的均价为 2513 元。卢伟冰在业绩沟通会上也表示,空调品类的平均单价大约「上涨了 200 元左右」,是行业价格战背景下,是为数不多「量价齐升」的品牌。

即便我们按照平均单价 2000 元进行估算,那么第二季度小米空调的营收也超过 108 亿元;如果按照 2500 元计算,则空调品类季度总营收大约为 135 亿元。所以,即使是粗略估算,我们也可以说小米空调在过去一个季度的营收已接近甚至超过整个 IoT 业务的三分之一。

小米大家电第二季度出货量数据 | 来源:小米

在大家电的其他两个品类里,冰箱第二季度出货量超 79 万台,同比增长 25%;洗衣机出货量超 60 万台,出货量同比增长 45%。整个大家电板块收入同比增长 66.2%。

可以说,本季度 IoT 业务整体 44.7%的营收增长,和大家电业务的增长贡献是密不可分的。

与此同时,在大家电品类(尤其是空调),小米也正在成为行业一股不可忽视的力量。

美的集团董事长兼总裁方洪波曾在上半年表示,要在「战术上重视小米,战略上不害怕小米」。美的今年提出「以简化促增长」的经营思路,也被认为和小米爆款战略的影响有关。方洪波表示,美的一上来就做几百款产品,「很多是多余的」。

从成绩来看,进入 2025 年,小米在国内空调市场的线下份额也从去年的第四进入到前三。不过,在线下渠道方面,格力、美的、海尔等传统巨头的销售份额仍大幅领先,而小米在线下的销售份额还有待提升。

而接下来即将投产的小米武汉家电工厂,将核心聚焦在空调品类,实现自产自研。卢伟冰表示,在中国市场「还有几倍的成长空间」。

 

小米汽车:超高毛利,盈利在即

汽车业务方面,无论是交付量、毛利率还是单车销售价格,小米汽车业务继续维持着稳步前进。笔者个人认为,有两项数据尤其值得一提:

第一,小米汽车单车平均售价从 Q1 的 22.86 万元上升到了 25.37 万元,增幅为 10.9%。

官方将 ASP 上涨的原因描述为:「由于交付 ASP 较高的 Xiaomi SU7 Ultra 所致」。但其实还有一个更重要的原因在于:由于小米前三款产品的爆款属性,小米汽车几乎是如今汽车行业里唯一可以做到既不降价,还可以同时进行「权益退坡」的品牌。

这其中最核心的原因当然还是不愁卖。小米 YU7 开始 18 小时,锁单量就超过了 24 万台。笔者今天在小米汽车 App 上发现,目前预定小米 YU7,预计最快交付周期l为 41-44 周(Max 版本),普通版交付周期「最快」为 55-58 周;小米 SU7 要好一些,最快 34 周就可以提车;小米 SU7 Ultra 仅需 9-12 周。

所以,那句著名的「早买早享受,晚买享折扣」放在小米汽车上可能并不适用。举个例子,如果你在 8 月选购小米 YU7,那么前排的两个零重力座椅的选装就需要多花 18000 元——因为上市权益到期截止了,而官方也不需要用其他降价的行为来促进销量。

通过这张小米官方的交付柱状图就可以看出来,目前制约小米汽车业务的最大障碍就是产能本身。

笔者今天在小米汽车 App 上发现,目前预定小米 YU7,预计最快交付首期仍然长达 41-44 周(Max 版本),普通版交付周期更是要 55-58 周(超过一年);小米 SU7 要稍好一些,最快 34 周就可以提车。

第二,小米汽车在单季度交付 8.1 万台的数据上,就可以拥有 26.4%的高毛利率。

8.1 万台的季度交付量并不能算「新势力」里最顶尖的水准。作为对比,今年增速最猛的零跑和小鹏,第二季度交付量都超过了 10 万台。但小米汽车的毛利率目前却超过了小鹏(17.3%)、零跑(13.6%),甚至比年销量超过 400 万台的比亚迪毛利率还高。

可以说,小米如今的赚钱能力,只有「问界」品类母公司赛力斯可以与之一战了——后者一季度的毛利率为 27.6%。

高毛利率的核心,一方面来源于小米汽车规模持续增长;另一方面则是由「爆款战略」所致。

仍然以前述零跑、小鹏为例,两者目前在售车型均为 7 款,而只有 3 个 SKU 的小米,在零部件采购、复用的效率上极有可能会高出不少。卢伟冰在业绩沟通会上将小米汽车目前的高毛利总结为「平台化+标准化+爆款」的结果。

在规模化+高毛利的双重作用下,小米汽车业务本季度的亏损金额从 Q1 的 5 亿元收窄至 3 亿元。卢伟冰再次强调,下半年实现季度亏损的目标不变,年度 35 万台的交付目标也不变。这意味着下半年,小米汽车月均交付量将稳步突破 3 万台。

卢伟冰同时确认了小米汽车 2027 年出海欧洲的战略目标,并表示已经在调研和筹备中。他表示,已经有用户把左舵的小米汽车在英国成功上牌,自己「不是特别担心」欧洲用户对小米汽车品牌的认知和兴趣。

 

在 AI 怎么花钱,小米有了更清晰的表达

作为手握千亿现金的「北京现金王」,小米对于 AI 等领域的投入态度也是业绩沟通会上的一大关注重点。

第二季度,小米推出了自主研发设计的 SoC 芯片玄戒 O1。雷军表示玄戒累计投入已超过 135 亿人民币,今年预计的研发费用将超过 60 亿元。

卢伟冰表示,在芯片层面上主要的投入是「人员费用」。

而在 AI 层面,投入则主要针对硬件和算力,大约占全年 300 亿研发预算的 25%左右。现阶段,小米在技术投入的核心分为三大板块:芯片、OS 和 AI。

在最近讨论火热的机器人领域,小米其实已投资 4-5 年。卢伟冰在业绩会上透露,小米看好人形机器人在工厂的使用场景。其衡量的标准是「首先看能否完成业务闭环,其次才是效率提升」。由此推测,小米也许对于机器人复杂任务的「通用」属性更为看重。

事实上,尽管目前小米在智能电动车、智能家电等品类里出现了多款爆品,同时也发布了首款 AI 眼镜。但截止目前为止,他们在 AI 领域依旧是相对低调的存在。自研芯片、AI 能力和小米一直希望追求的高端化息息相关,我们还需要等待小米接下来交出的答卷。

OpenAI 单月营收已经破 10 亿美元;马斯克的 Grok,超 37 万条用户聊天记录「裸奔」;谷歌发布 AI 手机

2025年8月21日 08:40

 

马斯克的 Grok 又捅篓子,超 37 万条用户聊天记录「裸奔」

8 月 21 日消息,埃隆・马斯克(Elon Musk)所创立的 xAI 公司旗下的 Grok AI 聊天平台被曝出隐私问题。据《福布斯》报道,Grok 网站上已有超过 37 万条 AI 聊天记录被发布并被搜索引擎索引,这意味着这些聊天内容已经对公众开放。

除了聊天记录本身,Grok 还发布了用户上传的照片、电子表格和其他文档。

该平台提供了一个分享按钮,用户可以通过生成独特的 URL 链接将对话分享给他人。然而,这些链接可被搜索引擎获取,导致任何人都可以查看这些聊天记录,而不仅仅是那些收到链接的人。

目前,在谷歌上搜索「Grok 聊天」,结果显示该搜索引擎已索引了超过 37 万条用户与 Grok 机器人的对话。这些共享页面展示了用户与 Grok 之间的对话内容,从简单的商业任务(如撰写推文)到生成关于克什米尔虚构恐怖袭击的图像,甚至尝试入侵加密钱包等不当内容。

《福布斯》还查看了一些用户询问有关医学和心理学问题的对话,其中一些对话甚至透露了用户的名字、个人信息,一位 Grok 用户甚至与该机器人共享了至少一个密码。此外,用户上传的图像文件、电子表格和一些文本文件也可以通过 Grok 的共享页面查看。(来源:IT 之家)

OpenAI 单月营收已经破 10 亿美元

自 2022 年底 ChatGPT 推出以来,OpenAI 规模迅速膨胀。据知情人士透露,今年公司营收预计将增长三倍,达到 127 亿美元。今年 3 月,公司称其年经常性收入已达到 100 亿美元。

并且这种增长势头似乎没有停下的迹象。OpenAI 首席财务官 Sarah Friar 在最新的采访中提到,OpenAI 在 7 月首次实现了 10 亿美元的单月营收。

OpenAI 首席财务官 Sarah Friar 周三(8 月 20 日)表示,即便在营收方面不断创下里程碑,公司仍然面临人工智能算力短缺的持续压力。

「目前对 GPU 和算力的需求极为旺盛。」她在接受采访时说,「我们面临的最大挑战就是一直处于算力不足的状态。这就是我们为什么推出『星际之门』、为什么进行更大规模基础设施建设的原因。」(来源:财联社)

 

英特尔市值飙升 240 亿美元,估值达互联网泡沫时期水平

历经数月动荡后,英特尔公司的多头终于因耐心获得回报。但该股的突然反弹伴随着一个令人担忧的副作用:其估值已升至二十多年前互联网泡沫时期以来的最高水平。

这家陷入困境的芯片制造商股价本月上涨 28%,市值增加约 240 亿美元,原因是有报道称美国政府正洽谈可能入股该公司,且日本软银集团计划对其投资 20 亿美元。彭博社汇编的数据显示,目前英特尔的动态市盈率(未来 12 个月预期利润)为 53 倍,为 2002 年初以来最高。(来源:新浪财经)

 

OpenAI Sam Altman:现有的手机与电脑难以发挥 AI 潜力,需要更先进的硬件载体

8 月 20 日消息,OpenAI 首席执行官 Sam Altmam 在播客中表示,当今的智能手机和电脑并不适合 AI 的未来发展。

他认为,现有的智能手机、计算机的硬件形态无法充分发挥人工智能的真正潜力。他强调,目前全球用户依赖的设备本质上具有「二进制特性」——即非开即关的运作模式。他提出,理想中的未来设备应能持续保持情境感知能力,随时为用户提供协助。

「我们真正需要的是能尽可能获取上下文信息、主动处理事务并具有前瞻性的 AI。」他认为,真正的 AI 伴侣应具备智能提醒、主动干预和适时提示的功能,这要求设备无需置于口袋或手中也能持续运作。(来源:新浪)

特朗普:美国不会批准太阳能或风能项目

美国总统特朗普近日表示,美国将不会批准太阳能或风能项目,尽管美国部分地区的电力需求超过了供应。「我们不会批准风能或太阳能,」特朗普过去曾抱怨太阳能占用太多土地,他在 Truth Social 上发帖说。「美国愚蠢的时代结束了!!」

可再生能源公司担心,项目将不再获得曾经是正常业务流程的许可。

随着燃煤电厂等资源退役,数据中心和其他行业快速增长的需求面临电力供应紧张,美国最大的电网 PJM 互连网的电价上涨。特朗普将美国电价上涨归咎于可再生能源。

自上任以来,特朗普对可再生能源发起了全面攻击。他的《大美丽法案》将在 2027 年底前终止风能和太阳能的投资和生产税收抵免。美国农业部周二结束了对农田太阳能的支持。(来源:环球市场播报)

 

英特尔下一代 AI 芯片 Jaguar Shores 开发板曝光

据报道,英特尔正在筹备下一代人工智能架构,Jaguar Shores 将成为该公司首款采用 18A 和 HBM4 的机架规模解决方案,目前相应的开发板已在网上曝光。在首席执行官陈立武 (Lip-Bu Tan) 的领导下,英特尔还取消了备受期待的 Falcon Shores 人工智能 GPU 产品线,转而换阵 Jaguar Shores。

英特尔计划在 Jaguar Shores 上使用 SK 海力士的 HBM4 内存,这将是一款多域和多 IP 产品。Jaguar Shores 机架将与英特尔即将推出的 Diamond Rapids Xeon CPU 结合使用。

 

马云时隔六年再次探访蚂蚁森林

8 月 19 日,阿里巴巴创始人马云时隔六年再次前往荒漠地区,探访「蚂蚁森林」。

马云表示,水资源是可持续发展的核心挑战,同时肯定了蚂蚁森林在极端环境下坚持生态修复的重要意义。9 年来,蚂蚁集团通过「蚂蚁森林」项目已累计协议捐资 40 多亿元,由公益组织和专业机构实施植树造林,支持内蒙古、甘肃、河北、陕西、宁夏、新疆等 13 个省区市的荒漠化治理和生态修复,已种下的 6 亿棵树。值得关注的是,超 9 成树木被种在「三北」工程三大标志性战役核心区。(来源:华尔街见闻)

 

消息称中国一汽拟收购零跑汽车 10% 左右股份,成为其战略股东

8 月 20 日消息,据财联社从知情人士处获悉,中国一汽正在筹划入股零跑汽车,成为该公司战略股东。「一汽计划初步要约收购 10% 左右零跑股份,目前该方案已经在一汽内部相关部门流转推进。」该知情人士透露。

今年 3 月 3 日,中国一汽与零跑汽车签署《战略合作谅解备忘录》。根据备忘录,战略合作分两个维度:一是双方充分发挥各自在研发领域的技术积累,共同开展新能源乘用车联合开发及零部件合作,通过双方的技术融合共同提升产品竞争力;二是双方进一步探讨深化资本合作的可行性,通过资本合作,使双方实现全产业链资源协同。此后 20 天,中国一汽电子招标采购交易平台显示,红旗品牌 G117 产品整车联合开发及平台许可费技术采购已成交,成交人为浙江零跑科技股份有限公司。

零跑汽车在财报中披露,目前公司与中国一汽首个合作开发车型项目已经落地,后续工作正在积极推进中,双方还将进一步探讨深化资本合作的可行性,使双方实现全产业链资源协同。

前述知情人士还称,「一汽与零跑更多整车合作新项目也正在探讨中。」零跑与红旗合作的第一款车型已处于开发过程中,并计划利用一汽海外渠道于明年下半年上市销售。

财报显示,2025 年上半年,零跑汽车营收人民币 242.5 亿元,同比增加 174.0%。毛利率为 14.1%,较 2024 年同期的 1.1% 提升 13 个百分点;公司权益持有人应占净利润为人民币 3303 万元,同比扭亏为盈。(来源:财联社)

Google Pixel 10 发布|自研芯片+端侧模型,谷歌抢发了完全体的「Apple 智能」

8 月 21 日凌晨,在纽约布鲁克林举行的「Made by Google」年度硬件盛会上,Google 正式揭开了新一年硬件产品线的全新篇章,正式发布了备受瞩目的 Pixel 10 系列智能手机。

此次发布会不仅带来了 Pixel 10、Pixel 10 Pro、Pixel 10 Pro XL 和 Pixel 10 Pro Fold 四款手机,还同步推出了 Pixel Watch 4 智能手表和 Pixel Buds 2a 无线耳机,属于是整个 Google 智能硬件生态系统的一次常规迭代更新。

首次亮相的 Tensor G5 芯片,标志着谷歌首次推出完全自主设计、摆脱三星 Exynos 架构基础的旗舰处理器,为实现更深度的端侧 AI 体验奠定了硬件基石。

另外,最值得期待的谷歌Gemini 大模型智能体验,部分功能如下:

  • 「魔法提示」(Magic Cue)功能。想象一下,当你正准备打电话给航空公司时,手机屏幕上已经悄然浮现出你的航班信息;或者,当朋友在聊天软件里问你地址时,系统会立刻调出你预订的民宿地址,供你一键分享。这种主动式的智能,仿佛你的手机真的读懂了你的心思。

  • 「相机教练」(Camera Coach)。当你举起手机准备拍照时,Gemini 会像一位专业的摄影师在你耳边低语,实时分析眼前的画面,并就构图、光线和拍摄角度给出建议。它不会取代你的创作,而是帮助你轻松拍出真正的好照片。

  • 此外,还有能实现通话中实时语音翻译的 Voice Translate,甚至还有一个全新的 Gemini Live 音频模型,据说能够感知并模仿你的情绪来调整助手的语气。

更详尽报道,可点击:《Google Pixel 10 发布|自研芯片+端侧模型,谷歌抢发了完全体的「Apple 智能」》(来源:极客公园)

 

谷歌发布 Pixel Watch 4 智能手表:屏幕峰值亮度提升 50%、抬腕即可 AI 聊天

8 月 21 日消息,谷歌发布 Pixel Watch 4 智能手表,该手表搭载高通 Snapdragon W5 Gen 2 芯片,支持更强大的 AI 运算能力,侧边配全新磁吸接口。

电池续航方面,41 毫米版本单次充电可用 30 小时,45 毫米版最高可达 40 小时,开启省电模式后最长支持 3 天。充电速度提升 25%,从 0 充至 50% 仅需 15 分钟。

AI 方面,Pixel Watch 4 最大的变化是全面引入 Gemini AI 助手,取代原有的 Google Assistant,支持更复杂的语音指令和智能回复。用户无需唤醒词,抬腕后就能和 AI 交互。

即将上线的 Gemini 健康教练能根据睡眠、运动、伤病等个性信息,动态调整健身建议,与全新 Fitbit 应用深度融合,提供更个性化的健康管理体验。(来源:IT 之家)

法国一受虐博主直播中身亡,平台被指控监管不力

8 月 18 日,法国一名受虐博主(通过遭受他人虐待或羞辱来吸引流量)拉斐尔・格拉文(Raphaël Graven)在直播时在睡梦中死亡,年仅 46 岁。

据了解,格拉文以让・波尔曼诺夫(Jean Pormanove)的网名进行网络直播,在社交媒体上拥有超过一百万粉丝,在流媒体平台「Kick」上尤其受欢迎。

他通过在直播中遭受他人虐待或羞辱来吸引流量,其直播内容包括被锁喉、殴打、泼冷水、电击、高温桑拿、酒精灌胃等。

格拉文死前一直住在专门为直播而租住的公寓里,直播已经进行了 10 天。

法国人工智能与数字技术部长级代表称,格拉文「几个月来一直受到羞辱和虐待」,司法调查正在进行中,网络平台对于非法内容的传播应承担法律责任。(来源:环球网)

 

成为「流量黑马」的老品牌,如何借拼多多秒懂 00 后?

2025年8月20日 23:27
作者|苏子华
编辑|郑玄

你有没有注意到,一些我们童年记忆中的「老字号」,在沉浸很多年之后,近一两年又突然火了起来,还成为了新消费顶流?

比如说,雅客、金冠、友臣、蜡笔小新等一批国民零食品牌,以及公牛世家、大黄蜂等鞋类品牌。

这些品牌成长于上世纪八九十年代,彼时,市场供给相对稀缺,很多品牌只需通过一套经销商分销体系,将产品层层铺设到全国各地,便能迅速占领市场,成为了一代人的「童年回忆」。

 

然而,时代的红利,也可能成为时代的包袱。当一代又一代电商浪潮袭来时,消费者的习惯、渠道的形态都发生了颠覆性的变化。

曾经的老品牌,开始面临多维度、深层次的结构性问题:

一是行业寡头效应加剧,巨头碾压。在许多细分领域,头部品牌凭借资本优势和规模效应,把持了核心渠道和市场份额。乳制品行业便是典型,头部品牌的崛起使得宁夏地方老字号金河乳业一度只能偏安一隅,或者转型成为瑞幸等品牌的乳制品供应商。在鞋服行业,自安踏、特步等品牌崛起成为头部玩家后,晋江本土再难诞生下一个能与之比肩的「安踏」或「特步」。这意味着,老品牌若想在传统赛道上与巨头正面竞争,无异于以卵击石。

二是渠道变革滞后。举个例子,过去,一款新款棒棒糖要推向市场,从经销商铺货到消费者反馈统计,再到数据传回总部形成一个闭环,往往需要 1 到 3 个月的时间。这种「时间差」,使得老品牌在瞬息万变的市场中失去了先机,难以快速迭代产品以适应新需求。传统的经销商模式虽然在过去功勋卓著,但在潮流迅速更迭、物流高速发展的当下,已经显得臃肿而低效。

三是用户变了,品牌与消费者的脱节。基于渠道变革滞后引发的品牌与消费者脱节,叠加消费习惯的改变,原有的市场消失,传统老品牌难以精准定位新市场。曾以多款喜糖「硬控」结婚场景的零食企业金冠发现,近年来喜糖市场正在萎缩。年轻一代消费者不再满足于传统的大众产品,他们更追求个性化、体验感和情绪价值。而老品牌在缺乏直接用户触达的情况下,很难及时感知并满足这些新的市场需求,从而陷入了「有品无市」的尴尬境地。

这三大挑战相互交织,共同构成了老品牌的「增长困境」。

不过,就像前面说的,一些老品牌在近两年又在拼多多重新崛起。在调研后,我们发现,这背后并不仅仅是一场简单的怀旧风潮。实际上,他们在应对以上三个增长困境时,都找到了一套相似的解题方法论和工具组合。

 

老品牌如何找到新销路?

 

公牛世家的转型极具代表性。2023 年,公牛世家董事长陈青福发现,拼多多的用户群体覆盖了小镇青年到都市白领。而彼时,他们已经决定避开运动鞋竞争激烈的红海市场,瞄准休闲鞋赛道,目标用户正是前述人群。

他们砍掉了中低端产品,定位质价比。其中,定价 200 元左右、薄底宽楦的「苍迹鞋」,刚好避开安踏、李宁 300 元以上的价格带。

这款鞋上线后,靠着「耐穿 + 平价」的标签,在拼多多上月销近百万,公牛世家找到了品牌的成长空间。

公牛世家的线下门店

 

相似的,乳制品公司金河在拼多多后台发现,不少下单用户是来自北上广的年轻人。于是,它推出针对 Z 世代群体的 250ml 小包装、国潮设计限定款的牛奶产品,产品复购率高达 42%

这些案例指向一个核心:老品牌不需要和巨头「硬碰硬」,而是可以借助新电商平台发现那些被巨头忽视的、尚未充分开发的细分市场,也就是所谓的「蓝海」。

然而,避开「红海」,找到「蓝海」之后的创新投入也风险极高。比如,按照传统渠道的「层层分销」模式,品牌必须先生产、再压货、最后等待反馈,一旦出错就是百万级损失。

因此,如何形成「低成本试错」的能力成为关键。在这方面,零食品牌友臣的案例值得借鉴。

这家 2012 年创立的晋江企业,以「金丝肉松饼」闻名。为了找到新的增长点,2024 年,研发团队想把肉松和麻花结合,做一款「咸香口味」的新品。

如果按照传统模式,仅仅是收集南北方的饮食差异数据就要耗时几个月。同时,在传统电商平台,还需要投入大量的推广费用,至少需要一周时间才能完成新品测试。显然,这样沉没成本极高,且可能被竞品抢占先机。

而当时,拼多多的机制使得品牌可以先小批量上架,根据实时数据调整生产。

于是,友臣先上架了肉松麻花的试销装。结果,只用三天,日销就达到 100 单,完成了用户需求的验证。——这款原本可能被「渠道成本」扼杀的产品,最后成了友臣的新增长点。

值得注意的是,拼多多在这个过程中打破了传统的交易链条,它省去了经销商、商超的中间环节,让品牌能够直接对接消费者,大大降低渠道费用,更重要的是缩短了「反馈-调整」的周期。

这背后就需要理解拼多多的平台逻辑,它不是按「品牌名气」来分配流量,而是按「消费者需求」匹配供给;它不追求「全品类通吃」,而是鼓励「小而美」的细分市场;它不依赖层层分销,而是让品牌直接对接用户——那么这也延伸出了老品牌在新电商时代的第三个解题方法:与用户更近,与用户共创。

 

秒懂 00 后,老品牌的真正复兴

 

长远看,老品牌的复兴不仅仅只看销量的回升,还要重新在消费者心中建立品牌心智,赢得信任。

那么,如何重塑品牌形象?

当喜糖市场萎缩后,金冠在拼多多分析用户画像时发现:20-30 岁的 95 后、00 后用户占比极高,且经常搜索「解压零食」、「熬夜必备」。于是他们推出「情绪软糖」系列:不同性格特质添加功能性成分——为敏感型人群加入茶氨酸舒缓情绪,为活力型人群加入维生素 B 族提神,上线 3 个月销量破百万颗。

更妙的是,他们从直播间、评论等渠道发现,年轻情侣更偏爱「颗粒多、能分着吃」的小规格。于是团队把黑糖话梅糖的单颗重量从 6.5 克颗粒调整为 4 克,总重量保持不变。于是,这个仅在拼多多销售的新规格,因这一小改动,就让这款老产品销量再上一个台阶。有消费者留言「没想到爸妈那辈吃的喜糖品牌,现在还能这么懂我们」。

显然,金冠靠着「情绪软糖」等新品完成了品牌焕新。

金冠门店

 

而且,更深层次的意义在于,消费者不再是简单的购买者,他们通过反馈、评价甚至参与产品设计。

这种品牌在拼多多与「用户共创」的模式,打破了传统渠道的阻隔,可以直接与消费者进行互动,获取第一手的反馈信息。这些真实的、未经过滤的用户反馈,是无价的数据资产。品牌们通过直面用户,更快、更精准地响应消费者的需求,来逐步建立深厚的用户信任。

而这种「信任积累」比销量更珍贵。

一个例子可以印证这点,公牛世家正在申请拼多多「黑标认证」。

为了拿到认证,公牛世家发力原创设计,与专业院校合作,围绕新材料、外观设计、舒适度展开研究,然后再拼多多上进行小批量测试。

去年,他们有两款原创鞋分别实现了几十万双的销量,外观还申请了专利。根据经验,一旦去「贴牌」成功,达到「黑标」标准后,其销售额有机会翻 5 倍。

仔细想想,这背后也不是什么高深的商业原理,只是对消费需求的精准捕捉和应对。这反映出,在同质化竞争中,当下的消费者越来越注重品牌的口碑和信任度。「黑标」制度的设计,不仅仅是一个简单的标识,它代表着一个平台对该品牌质量、服务和信誉的官方背书。从目前的效果看,这个工具发挥了不小作用。

 

新趋势,新路径

 

从上面的案例,我们可以简单总结一下老品牌复兴的三个关键:

  • 避开巨头,开辟细分蓝海市场;
  • 借助新电商平台,完成渠道变革;
  • 直面消费者,实现品牌的沉淀与打造。

由此也可以看到品牌的崛起路径,已经完全不同于三十年前。

在拼多多上复兴的老品牌,本质是抓住了中国消费市场的一个新趋势:从「追求大牌」到「回归需求」,年轻人不再盲目为品牌溢价买单,而是更在意「这是不是我需要的」,比如公牛世家的休闲鞋够舒服、金冠的软糖够懂我,这些才是真正的「护城河」。

复兴的关键不是「变年轻」,而是「懂用户」。

在这个过程中,拼多多所扮演的角色,更像是一个关键的「盟友」,为老品牌提供了数据分析工具、流量倾斜等系统性方案。

拼多多当然不是唯一的解法,但它的确为老品牌提供了一个低门槛、高效率的转型通道。它推出的「千亿扶持计划」,为老品牌的复兴提供了实实在在的资金和资源支持。这些扶持计划可能包括流量倾斜、技术支持、营销推广补贴等,帮助老品牌克服转型期的资金和技术难题。

在晋江,这个计划的效果尤为明显。比如公牛世家、大黄蜂等企业还拿到了拼多多的「新质品牌」扶持:平台不仅提供免费的数据分析工具,还从新品研发、销售策略、仓储物流等全方位提供政策扶持,助力晋江鞋服商家持续提质增效。

此外,乳制品行业的金河乳业则受益于「流量倾斜」,金河的国潮酸奶在专区的曝光量是普通位置的数倍。

一句话总结两方的合作:老品牌借助新电商的模式和技术,重新焕发活力;而新电商平台也通过助力老品牌的复兴,进一步丰富了自身的生态,扩大了影响力。

可以预见,未来将有更多的「童年回忆」,成为新消费时代的「流量黑马」。老品牌的故事,从来不是关于「回到过去」,而是关于「如何带着历史,走进现在」。此刻,这个故事才刚刚开始。

 

 

AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

2025年8月20日 23:20
作者|苏子华
编辑|郑玄
 

过去两年,很多人对 AI 的印象,基本都停留在一个对话框里:

有问题,敲几个字,它就给答案。好用是好用,但也让人觉得有点单调——AI 难道就只能困在对话框里吗?

我一直觉得,真正的 AI,不该只是「会背百科全书的老师」,而应该能跟我一起走进生活,理解我当下正在经历什么

昨晚刚刚正式发布的 Looki L1,可能就是第一台真正让 AI「走出来」的设备。

这就是 Looki L1,有三个颜色可供选择|图片来源:Looki

早在半个月前,我开始试用 Looki L1,第一次拿到手,我差点以为这是个挂坠形相机。但很快我发现,它既不是运动相机,也不是简单挂在脖子上的 GPT 硬件。

我日常习惯于把 Looki L1 磁吸在胸前。Looki 为用户提供了不同的机身贴纸,我挑了个鬼脸图案|图片来源:极客公园

 

当我开启它的 Story Mode(故事模式),它会自动捕捉视频和声音,然后交给 AI 去理解我当下的情境,那一刻,我身边的一切——街道、朋友的笑声、我的表情——都成了 AI 的提示词。

和它一起生活的感觉很特别:我经历什么,它就经历什么,它不再只是一个回答问题的工具,而是一个和我共享日常的 AI 伙伴。

过去几年,大部分 AI 产品都在强调「效率」和「生产力」。但能真正进入每个人生活的 AI,几乎还是一片空白。

Looki 正是瞄准了这项空白。成立一年,这个团队在半年时间里完成了三轮融资(天使、天使+、Pre-A),金额超千万美金。本轮融资由钟鼎资本领投,老股东 BAI、阿尔法公社和同歌创投超额追投。根据官方定义,它是一款 AI lifelogging camera(AI 生活日志相机),是全球首个真正实现了多模态交互的 AI 硬件。

使用的这段时间,我已经忘了说过多少句「我靠」了。回过头看,它不仅是一个「生活记忆体」,还让我重新理解了自己,更带给我不少生活习惯的变化。而在它身上,也打开了我对「AI 交互」未来的想象。

 

当 AI 进入我的生活

 

和传统的任何相机相比,Looki 的外观设计、操作实在太简单了,甚至可以说是「简陋」。

Looki L1 没有屏幕,一共只有两个物理按键,通过长短按开启 Story Mode(间隔拍摄)、拍照、录像和录音功能。机身正面的 touchpad 实现了和 AI 对话的功能,体验和微信的发送语音很像。

侧边是两个功能键,正面是 touchpad,可以触按|图片来源:极客公园

 

而且它的重量只有 30 克,戴在身上没什么感觉,以至于让我觉得,这个团队的目的就是让用户少去操作它,尽量忘掉这个相机的存在。

Looki 的 App 界面|图片来源:极客公园

 

Looki 的 App 也延续了极简思路,如上图所示:

  • For You:每天 AI 主动推送的「生活流」,像私人版 Instagram feed,但只给你看;

  • Chat:拥有生活全记忆的 AI 聊天,绝对是最懂我的 AI,可以在这里聊自己的生活;

  • Lifelog:AI 自动理解和整理的生活档案,把素材变成有主题的 Moments;

  • Device:主要用来查看设备状态,以及一些其他基本设置。

 

用 Looki 记录日常,最大的感受是「投入当下」。

我最常用的功能是 Story mode,也就是间隔自动拍摄。开启之后,我便不再管它,无需考虑什么时候按快门,专心享受当下就行。

如果遇到突然想记录的画面,也不需要从兜里掏出手机,再解锁、拍照。而是直接按一下 looki L1 的拍照键或录制键。

不知道你是否有这样的感受:实际上,无论用什么设备,拍摄不是最难的事情。最难的是拍摄后的素材整理。而这,也是我认为真正让 Looki 差异化于其他相机的关键。

以往,我们可能拍摄了海量的照片和视频,但绝大多数都沉睡在硬盘里,无从整理。

而 Looki 的「Moments」功能,利用多模态 AI 的能力,理解视频中的人物、场景和情感,能将海量素材自动整理成一个个有主题的事件,并从里面提炼出「高光片段」,将碎片化的瞬间编织成有意义的叙事。整个过程都不需要人介入,节省了大量时间。

在「moments」页面,可以查看高光时刻,和所有素材片段|图片来源:极客公园

 

一天下来,当我们翻看「Moments」界面时,就好像有了自己的「传记」。

另外,这些天观察下来,Looki 生成的 vlog 也比较有讲究。它会自己捋顺一条故事线,然后分析出一个主题,并根据这个主题配乐,同时给不同的画面配文或者关键词。整体有一种欧美纪录片的质感。

我截取了两个 Looki 生成的 vlog 的封面,可以感受下风格|图片来源:极客公园

 

我曾经试过拍 vlog,但坚持半个月就放弃了,一方面总会忘记拿出手机或相机来拍摄,一方面每天录了很多素材之后,晚上剪辑、制作也会花掉很长时间,耗费精力。因此,对于我这种懒人来说,它就是我目前能遇到的最佳解决方案了。

产品设计哲学:AI 向内,让我看见更多的自己

 

这个产品对我最大的改变,是让我开始更多地向内看。

这项功劳可能归结于 Looki 的内容生成能力。我每天都会期待它推送给我 Moment 和 vlog,因为我很好奇 AI 如何解读我,如何解读我的生活。

Looki 给我推送的 moment,看它配文的解读是种乐趣|图片来源:极客公园

 

自从有了第一次惊喜体验后,我不仅日常把它磁吸在胸前,当我坐下来的时候,我也会把它取下来放在桌子上,将镜头对着我自己。这样,我开始出现在了视频画面里。而且,Looki AI 基于场景和音频、视频等信息,也迅速地判断出我是这个故事的主人公,并彻底记住我。

Looki L1 可以依靠背后的磁吸按钮,立在桌子上|图片来源:极客公园

 

它经常会拾取一些被我忽视的、但可能当时情绪更丰沛的生活片段,然后配上解读和描述,看了之后,我常常会感到,「哦,原来我是这样度过那个时刻的。」、「原来我那个时刻那么开心。」——要知道,如果不是看到 Looki L1 的「回放」,我一定会把那个时刻忽视掉了,只当作它是一个庸常、乏味的日常碎片。

当我回看的那一刻,我仿佛看到了更多的自己,重新获得了一段时光。

即便如此,Looki L1 也并不能替代传统相机。

传统相机的逻辑是追求画质、追求高光时刻。比如,大疆的无人机,GoPro 的极限运动相机,都是围绕「极致画面」展开。但 Looki 的选择恰好相反:它不追求 4K,而是采用 Sony IMX681 CMOS(和 Meta Rayban 同款),分辨率 1080p,但换来的是 12 小时续航和 30 克的轻便。

社交媒体让人们习惯于展示「高光时刻」,而恰恰相反,Looki 不是为了小红书、Instagram 这样的「表演式分享」设计的。它要捕捉的,是生活的连续性和日常细节。

毕竟,我们的生活不是由一个个「完美瞬间」组成的,那些不那么光鲜,却琐碎、真实的「非高光」日常,才是「我之所以为我」的关键。

如今,我们正处在一个被内容淹没的环境里,很容易被各种宏大叙事或八卦消息所牵引。因此,从 Looki 的产品机制看,它具备一种「反潮流」的气质,它似乎在引导人关注自己的生活,从自己的日常里、从自己身上发掘惊喜。

Looki 让我看到了「多模态 AI 硬件」的潜力

 

其实,「记录一生」这个想法很早就有人提过。

上世纪 90 年代,计算机先驱戈登·贝尔就尝试过全天佩戴相机来记录生活,最后失败了。原因很简单:拍得再多,没有 AI 的辅助,大量素材也很难被整理为真正有用的故事。

而 Looki 的突破在于:多模态 AI。它能理解视觉、声音和语义,让碎片化的素材变成可用的「记忆」。

例如,当我问 Looki,我昨天喝了什么咖啡时,它能够迅速分析录像素材,告诉我分别在哪家店铺,喝了什么口味的咖啡,还会描述一下当时的氛围等等,同时把当时的照片罗列出来。

我和 Looki AI 聊天的页面|图片来源:极客公园

 

有多位创业者曾对我表达过相似的观点,大模型如果想要真正发挥作用,一定要具备对物理世界的感知能力,要具备硬件。这可能也是为什么「随身 AI 硬件」会成为当下创投圈备受关注的热点。

Looki 的创新之处就在于,它率先通过巧妙设计的硬件释放了多模态 AI 的能力,让人们感知到了「多模态 AI」到底能够在现实生活中做到什么,将未来摆在了所有人眼前。

过去,服务于个人生活的 AI 很难做,一个关键原因就是缺少上下文(context)。

Looki 团队告诉我,他们接入的大模型是 ChatGPT 和 Gemini。但是我体验下来,Looki AI 完全优于我使用的网页版的 ChatGPT 和 Gemini,它会更加懂我,更能够结合我的生活来和我聊天。

我想,核心原因,就在于 Looki 的硬件捕捉了我所处的物理环境信息,为 AI 提供了更多上下文。如果没有个性化的上下文,那么 AI 给出的答案往往是正确但无用的。

可以说,Looki 能生成什么内容,基本取决于它拍摄到什么。我带着它去的地方越多,它生成的内容也就越丰富、越深刻。此时,照片、视频不再是终点,而是提示词(Prompt)。有了 Looki L1,整个世界都在成为我的 AI 提示词。

Looki L1 的外形看上去像个外星人,每次戴着它出门,都好像带着一位外星朋友,一同走进这个社会。它会记录我们一起去过的地方,见过的人,经历过的事件。它就像一个和我有着共同经历、总出现在我身边的朋友。它也会随着经历的丰富而成长,会和我形成感官共鸣。

还记得,前段时间 OpenAI 收购了前苹果设计总监 Jony Ive 的公司,目标要改变人和 AI 之间的交互方式,打算在 2026 年推出 AI 硬件,而其概念流出图和 Looki L1 极为相似。

也许,我们今天看到的 Looki L1,就是「个人 AI 硬件」的起点。

 

 

「价格战」打了半年,吉利如何做到核心利润暴增102%?

2025年8月20日 14:23

2025年8月14日,吉利公布了它的「期中考试」成绩单,结果非常有意思,甚至有点「矛盾」。

首先,是「学霸」的一面:今年上半年,吉利汽车卖出了将近141万辆车,比去年同期多卖了将近一半(猛增47%),仅次于比亚迪(214.6万辆)、上汽集团(205.3万辆),市占率首次突破10%。卖了这么多车,总收入当然也很可观,达到了1503亿元,增长了27%。

看到这里,你可能会觉得:吉利这波稳了,肯定赚翻了!然而,反转来了。财报显示,上半年归属于母公司股东的净利润同比下降14%,至92.9亿元。

今年以来,吉利汽车股票已经上涨了32%到19.19港币,最新总市值为1935.25亿港币。

为什么会出现「增收不增利」这种矛盾情况?这背后的真相是什么?

新能源占比超过50%

要读懂吉利的真实状况,必须穿透财务数据的表层。

总体来看,吉利正上演一出「一半是火焰,一半是海水」的精彩大戏。

在整个汽车市场平均增速仅为13%的背景下,吉利汽车上半年实现了47%的惊人同比增长,总销量突破141万辆。这不仅是「学霸」级别的表现,更说明它在激烈的竞争中,拥有强大的「圈粉」能力。

其中, 新能源转型「超车」,是吉利故事中最激动人心的部分。今年上半年,吉利的新能源汽车销量达到了72.5万辆,同比暴增126%,占比首次超过了50%(达到51.5%),这意味:

吉利不再是一家「燃油车为主,新能源为辅」的公司,正式迈入了「以新能源为主导」的新时代

其中,纯电动车和插电混动车销量分别达到51.1万辆和21.4万辆,增速分别高达173%和61%,远超行业平均水平。

吉利的爆款车型——银河星愿,拿下了A0级市场冠军|图片来源:吉利银河官网

特别值得关注的是,吉利银河品牌销量达54.8万辆,同比增长232%,成为了绝对的销量担当。其中,「银河星愿」前6个月累计销量达到了20.5万辆,拿下了上半年中国市场的单车销量冠军。

与此同时,在大家普遍认为燃油车市场正在萎缩的时候,吉利的燃油车业务不仅没有下滑,反而实现了8%的增长。根据汽车行业协会数据显示,2025年上半年,燃油车整体销量546.69万辆,同比下降4.5%

吉利汽车的主要财务指标 | 图片来源:财报截图

尽管销量喜人,但吉利的毛利率(16.4%)却同比微降0.3个百分点,稍微落后于主流竞争对手。

最直接的原因,就是国内汽车市场已经「杀红了眼」的价格战

5月下旬,比亚迪率先发起了大规模降价,部分车型优惠高达5.3万元。面对竞争,吉利别无选择,迅速为旗下最畅销的「银河」系列等多款车型提供了5000至18000元不等的补贴,与比亚迪展开「贴身肉搏」。 随后,奇瑞、零跑等众多车企纷纷加入战局,整个市场都卷入了以降价换销量的激烈竞争中。

这场价格战直接压缩了单车售价和利润。吉利汽车CEO桂生悦在业绩会上坦言,上半年单车平均售价减少了1.4万元,降至9.6万元。

除了外部价格战,吉利自身的产品销售结构变化,也加剧了平均售价和毛利率的下滑。这像一个「硬币的两面」:定位主流市场的「银河」品牌成为绝对的增长引擎,上半年销量高达54.8万辆,同比暴增232%。银河系列虽然成功抢占了市场份额,但其定价相对亲民,这自然拉低了整体的平均售价和毛利率

另一面,作为吉利旗下的高端智能电动品牌,极氪上半年交付了9.1万辆车。虽然销量数字还在增长(同比增长3%),但增速与去年同期的106%相比,出现了断崖式下滑。高端车型增长乏力,也使得提升整体毛利水平变得更加困难。

值得一提的是,吉利在「海外竞赛」暂时落后。数据显示,上半年吉利汽车出口总量18.4万辆,同比下滑8%。这与中国汽车出口市场实现258万台销量、总增长超过10%形成反差。桂生悦直言这是「140.9万台销量中的最大短板」。

核心净利润增长102%

上面提到了吉利销量的「高光时刻」,但很多人可能会问:既然卖得这么好,为什么利润反而下滑了14%呢?

看一家公司的财报,千万不要只看表面的「增」或「减」。要学会识别并剔除那些一次性的、非经营性的项目,才能看清它最核心、最真实的「造血能力」。

仔细查看,可以看到吉利汽车最近两年主要有两个一次性的、与核心卖车业务无关的「特殊收入」:

  • 2024年上半年,吉利做了一件大事——把自己的发动机业务,与雷诺、沙特阿美等公司合资,成立了一家新公司(Horse Powertrain)。这个操作在账面上产生了一笔高达77亿元的一次性收益。这笔钱不是靠卖车赚的,更像是一次性的「资产重组」红包。它让去年的利润数字显得特别高。
  • 2025年上半年,因为一些海外市场的货币升值了。吉利因此获得了一笔约26亿元的净收益(外汇汇兑收益)。这笔钱也不是靠卖车赚的,而是汇率波动带来的「意外之财」,同样不属于日常经营。

简单说,抛开那些「干扰项」,吉利汽车的核心经营利润从2024年上半年的33亿元,飙升到了2025年上半年的66.6亿,同比增长超过102%。

所以,吉利汽车并非「增收不增利」。在整个行业都在拼命「价格战」的艰难时期,吉利依靠强大的规模效应和成本控制,让自己的核心赚钱能力翻了一倍

在吉利这份「成绩单」背后,是一家主流自主品牌在时代剧变中,向新能源智能汽车企业转型的缩影。

「一个吉利」下的「加减法」

对于下半年的发展,吉利似乎超级有信心。本来他们今年的目标是卖出271万辆车,这已经是个很厉害的数字了。但最近,他们直接把目标上调到了:

300万辆

那么,吉利的底气来自哪里呢?答案是:一大波又酷又能打的新车正在路上。

下半年,吉利汽车将推出极氪 9X、领克 10 EM - P、吉利银河 A7 及吉利银河 M9 等 5 款全新智能电混产品;此外,千里浩瀚辅助驾驶 H9 方案、雷神醇氢技术、新一代 Flyme Auto 智能座舱等多项科技也将落地应用。

吉利的另一个爆款车型——银河E5,上市11个月销量超过15万辆|来源:吉利银河官网

除了产品和市场端,吉利汽车正在经历更深层次的变革——组织架构与战略整合。

以前的吉利,像一个「联邦」。它旗下有吉利、领克、极氪等好几个品牌。它们都很优秀,各自有自己的粉丝和市场。但这也会带来一个问题:兄弟之间偶尔也会「内卷」,比如研发一个新技术,可能好几个品牌都在做,有点浪费资源。

现在的吉利,要变成一个「帝国」。核心思想就一个:打破品牌之间的墙,回归「一个吉利」。「极氪」这个品牌,是理解吉利未来战略的钥匙。2025 年 2 月,极氪、领克官宣合并;7月,吉利宣布拟以现金或换股方式,将上市仅一年多的极氪从纽交所私有化。

桂生悦在财报电话会上透露,吉利汽车将在9月5日举行股东大会,极氪则将在9月15日举行股东大会。如果双方股东大会都通过(合并决议),那法律意义上两家上市企业才算合并完成。后续具体交割工作则将在年底前完成。

通过主动的产品结构调整,大胆的战略整合,吉利正在重塑自己的竞争优势。

但汽车行业的战争远未结束。下半年新产品的市场表现、极氪私有化的推进情况,以及全年300万辆目标的实现程度,都将成为验证其战略方向的重要指标。

 

小鹏Q2财报「炸裂」:营收暴涨125%,毛利率反超特斯拉

2025年8月20日 14:20

如果你在一年前问我小鹏汽车怎么样,我可能会说,它正在经历一场严峻的考验。

然而,8月19日小鹏汽车刚发布了2025年第二季度财报,却讲述了一个截然不同的故事:它不仅恢复了健康,精神焕发,甚至还练出了点「腹肌」。

财报显示,2025年二季度,小鹏汽车在销量、收入、毛利率和现金储备多项关键指标都创下了历史新高。第二季度总营收182.7亿元,同比增长125.3%;交付量10.32万台,同比增长241.6%;毛利率17.3%,同比增长3.3个百分点;现金储备环比净增超22.9亿元到475.7亿元。

财报发布后,小鹏汽车美股上涨3.72%到20.64美元,最新总市值为196.45亿美元。今年以来,小鹏股价已经上涨了68.36%,市值增加了77亿美元。

那么,小鹏是如何实现这一转变的呢?让我们一起来探究背后原因。

小标题一:半年狂卖19.7万辆,营收340亿

如果把财报比作一份「体检报告」,衡量一家成长中的车企是否健康,主要看四个关键指标:销量、收入、毛利率和现金储备。

小鹏汽车上半年的销量成绩亮眼。数据显示,小鹏共交付 19.72万 辆车,是去年同期的近 3.8倍,这也超过了其2024年全年的总交付量。其中,二季度交付了10.32万辆,同比增长241.6%。

虽然在新势力品牌里,小鹏的销量排名不是第一,落后于零跑、鸿蒙智行、理想汽车,但它是唯一一个完成年度目标过半的车企。它全年目标是卖38万辆,上半年就完成了52%,

尽管销量喜人,但小鹏的产品结构存在一些不平衡。轿车是小鹏销量的绝对主力。上半年,MONA M03和P7+合计售出超13.6万辆,它们占了总销量的近7成;相比之下,SUV表现平平。上半年小鹏G6和小鹏G9共售出近3.55万辆,只占整体销量的18%。

这在SUV更受欢迎的中国市场,显得有点「特立独行」。要知道,特斯拉Model Y的销量,基本上是Model 3销量的两倍。

 

小鹏汽车2025年二季度财报的主要核心指标,销量、收入、毛利率等都创纪录 | 图片来源:财报截图

卖的车多了,收到的钱自然也多了。财报显示,2025年上半年,小鹏汽车总收入达到 340.9亿元,比2024年同期增长了132.5%。其中,二季度总收入为182.7亿元,较2024年同期大涨125.3%, 并较2025年一季度上升15.6%。

如果说交付量和收入是「面子」,那毛利率就是「里子」。它是衡量一家公司「造血」能力的核心指标,它直接反映了企业的成本控制能力和产品议价能力。

数据显示,小鹏2025年第二季度毛利率为17.3%,超过了特斯拉二季度的17.2%。其中,小鹏Q2汽车毛利率为14.3%,2024年同期为6.4%。简单说,就是每卖一辆车,能获得的毛利翻了一倍。

这主要得益于两个方面:一是通过技术和生产优化,有效降低了单车制造成本;二是通过推出G7等更受欢迎、可能利润空间更高的车型,改善了产品组合。

小标题二:亏损减半,现金储备近500亿

除了上面这些,2025年,对于中国的电动汽车行业来说,进入了一场新的「大考」——盈利之战。小米、蔚来、零跑这些「同班同学」都立下了Flag,「今年要开始赚钱」。

那在这场考试中,谁是「学霸」呢?

8月18日,零跑汽车上半年净利润为0.3亿元,首次实现半年度净利润转正;极氪也发布公告称,二季度实现了经营利润2.85亿,这是第一次实现经营利润转正;小米汽车二季度业务经营亏损大幅收窄至3亿元,预计下半年实现盈利。

看到这里,你可能会问:小鹏到底赚了多少钱?

财报显示,2025年第二季度净亏损为4.8亿元。

看到「亏损」二字,很多同学可能会觉得「这公司不是还在亏钱吗?」。没错,但关键要看趋势。2024年二季度净亏损12.8亿元,而2025年第一季度为6.6亿元。

亏损额大幅收窄了超过一半! 这是一个强烈的「止血」信号。

即将上市的全新小鹏P7,将是小鹏打开20到30万市场的又一个关键落子 | 图片来源:小鹏汽车

打个比方,这就像一个水桶本来漏水很快,现在你成功地把漏洞堵住了一大半。对于一个还在拼命花钱搞研发、建工厂的公司来说,「少亏钱」和「开始赚钱」一样,都是非常牛的积极信号!这表明,小鹏离最终盈利的目标越来越近了。

小鹏汽车董事长、CEO何小鹏此前也表示,四季度实现盈利「不是一个有挑战性的目标」,今年的最终成绩会比大家想象的还要好。

除了看盈利,还有一个更关键的指标,能看出一家公司到底有没有「安全感」。那就是——它「钱包」里有多少钱。截至2025年6月底,小鹏持有的现金及现金等价物、短期投资等总额高达 475.7亿元。

「手中有粮,心中不慌」。接近500亿的现金储备,意味着小鹏有充足的「弹药」去应对未来的竞争、持续投入研发,而不用为下个月的「工资」发愁。

总体来看,小鹏有点像一个潜力巨大的「优等生」:虽然仍未扭亏为盈,但销量、收入暴涨,毛利率翻倍、亏损大减,潜力很大。

小标题三:「技术宅」小鹏,开始谈「情绪」了

过去,大家觉得小鹏是个「技术宅」,只知道埋头研究技术。如今,小鹏的看家本领——AI技术,不仅没有丢,反而越来越强。

就在今年6月,他又秀了一波「肌肉」:与华为联合研发的「追光全景」抬头显示;在刚发布的小鹏G7上,L3级算力落地,带来了2000TOPS算力+全本地端AI模型;小鹏在世界顶级的AI会议(CVPR 2025)上,发布了一个拥有720亿参数的超大模型。

所以,小鹏的技术实力依然是它最坚实的底气。

但何小鹏意识到,一辆好车不仅要技术牛,还要让人「有感觉」。于是,何小鹏提出了四个新的标准:设计、颜值、品质和情绪。其中,情绪这个词,是何小鹏最近提到最多的词之一。

「情绪」这个词很有意思。想想你们为什么会喜欢泡泡玛特的盲盒,或者为什么小米SU7一发布就刷爆了朋友圈?因为它们除了好用、好看,还给你带来了快乐和满足感。

设计、颜色,也成为小鹏的核心竞争力之一 | 图片来源:小鹏汽车

小鹏也开始在这方面下功夫。比如,全新P7首秀发布会,何小鹏花了半个多小时专门讲车身的颜色,还请来了陈妍希、朱正廷、宁泽涛、钟楚曦四位明星,为不同的颜色代言。比起一堆冷冰冰的参数,小鹏更想跟你聊聊「颜值」和「感受」,让你觉得这辆车是有温度、有品位的。

其实,小鹏也曾经历从山巅跌落谷底的「至暗时刻」。但正是凭借着这种「技术」和「情感」两条腿走路的新思路,它完成了一次非常漂亮的逆袭,重新赢得了市场的认可。

汽车行业的竞争非常激烈,就像一场永不停歇的赛跑。今天的领先者,明天可能就会被新的对手超越。小鹏现在面临的最大考验是,在决赛圈快速缩小的当下,建立起自己坚固的「护城河」。这场战役的最终结局尚未可知,但这无疑让小鹏的故事充满了悬念和看点。

❌
❌