阅读视图

发现新文章,点击刷新页面。

苹果9月10日发新品,曝超燃海报;淘宝骑士新装登《福布斯》封面;泰勒·斯威夫特官宣订婚|极客早知道

苹果秋季新品发布会定于 9 月 10 日

8 月 27 日,苹果 iPhone 17 系列发布会邀请函发布,将于美国当地时间 9 月 9 日(北京时间 10 日凌晨 1 点)举办 iPhone 17 新品发布会——与去年发布会日期一致。目前,苹果已开始发送此次发布会的邀请函。发布会将在库比蒂诺的史蒂夫・乔布斯剧院举行。

此次「前方超燃」活动的 Apple 标志形似热成像图,或是可能在热成像相机上看到的成像,其颜色从蓝色调渐变至橙色调,这或许是在暗示即将发布的 iPhone 新颜色,也可能是在暗示新机会有更强的散热能力。据传闻,iPhone 17 Pro 系列可能会推出橙色和深蓝色版本,而 iPhone 17 Air 则有望推出浅蓝色版本。

据悉,基础款 iPhone 17 将搭载一块全新的 6.3 英寸大屏幕,屏幕刷新率从往年的 60Hz 提升至 120Hz。

预计本次发布会还将推出 Apple Watch Series 11 系列、Apple Watch Ultra 3、AirPods Pro 3 等重磅产品。(来源:闪讯速报)

淘宝闪购骑士登上《福布斯》封面

8 月 26 日,福布斯中国发布预告,8 名淘宝闪购的荣誉城市骑士将登上下一期《福布斯》中文杂志封面。这意味着百年以来,一线劳动者首次登上了《福布斯》的封面。

《福布斯》表示,按照惯例,杂志封面通常会留给那些成功的商业巨擘,但这次他们将镜头对准了 8 位「普通人」,他们身着一套全新的「城市骑士・橙意计划」制服,成为城市骑士的官方代言人。

登上封面的听障骑手刘一飞表示,他从事外卖行业已有三年多,工作中通过文字沟通和 AI 语音外呼完成取送餐,目前在工作中没有遇到不尊重的情况,他正在努力赚钱,实现学习绘画的梦想。

值得注意的是,这套制服以橙黑为主调,正面和背面布有阿里系品牌联合 Logo,且制服左臂预留有魔术贴位,骑手可根据自己的晋升路径将「星级徽章」、「技能认证章」贴在上面。

昨天,淘宝闪购和饿了么宣布为活跃稳定骑士免费提供新制服、头盔、餐箱等装备,预计约百万名骑士可获得免费换新。(来源:IT之家)

 

特朗普:Meta 路易斯安那州数据中心投资将高达 500 亿美元

8 月 27 日,特朗普周二表示,Meta 计划在路易斯安那州农村建设的巨型数据中心投资额将达到 500 亿美元,他对这一项目的成本感到震惊。「当他们说一个工厂要花 500 亿美元时,我问,『这到底是什么样的工厂?』」

特朗普说,并展示了一张他称是 Meta CEO 扎克伯格给他的图,显示了数据中心与曼哈顿的对比图,用于展示其规模。「当你看到这个,你就会明白为什么要花 500 亿美元,」特朗普说。Meta 此前仅公开表示,对该数据中心的投资将超过 100 亿美元。(来源:格隆汇)

 

苹果据悉已在内部就收购 Mistral 及 Perplexity 进行了谈判

8 月 26 日,据报道,知情人士透露,苹果公司已在内部就收购法国人工智能初创公司 Mistral 以及 Perplexity 进行了谈判。

在其设备的人工智能功能推出方面,苹果一直落后于谷歌和三星等竞争对手。首席执行官蒂姆·库克上个月表示,苹果愿意进行更大规模的人工智能相关收购,以加快其发展规划。苹果、Mistral 和 Perplexity 均未立即回应置评请求。(来源:广角观察)

比亚迪仰望 U9 工程测试车创造 472.41km/h 全球电车极速新纪录

8 月 26 日,比亚迪仰望汽车宣布,仰望 U9 工程测试车打破全球电车极速纪录,最高时速达到了 472.41km/h。

仰望汽车官方现已放出仰望 U9 工程测试车破极速纪录的第一视角车载视频,从视频可以看到,测试车一开始在赛道上通过高速转向暖胎,然后进入了测试环节,最后持续加速至 472.41km/h。

仰望 U9 去年取得了 391.94km/h 的中国汽车极速纪录,首次征战纽北取得 7 分 17 秒 900 圈速。根据比亚迪今年 6 月公布的计划,仰望 U9 会在今年 7 月再次征战德国纽博格林北环赛道、德国 ATP 测试场。

此次仰望 U9 工程测试车极速纪录,就是在德国 ATP 测试场取得,车手为德国专业车手 Marc Basseng,也是此前全球电车极速纪录的创造者。2024 年 6 月,Marc Basseng 曾驾驶 Aspark SP600 原型车达成 438.7 km/h 的极速成绩,时隔仅一年,他驾驶仰望 U9 打破了这一纪录。(来源:IT之家)

 

OPPO 回应苹果起诉员工窃密:并未侵犯苹果公司商业秘密,相信公正的司法审理能够澄清事实

8 月 26 日,据外媒报道,苹果向加州北区联邦法院提起诉讼,指控前 Apple Watch 传感器系统华裔架构师在离职前系统性窃取一系列核心商业机密,并跳槽到 OPPO,将这些信息提供给 OPPO 开发可穿戴设备。 

针对此事,OPPO 法务部回应称:我们已注意到苹果公司近期在加州提交的诉讼,并仔细审查了苹果诉状中指控的内容,没有发现任何事实能够证明这些指控与该员工在 OPPO 雇佣期间的行为有关。OPPO 尊重包含苹果公司在内任何公司的商业秘密,并未侵犯苹果公司商业秘密。OPPO 将积极配合法律程序的推进,亦相信公正的司法审理能够澄清事实。(来源:i黑马)

 

何小鹏回应和马斯克「网上打架」:主要是信息差造成的,现在是隔空尊重

8 月 26 日,罗永浩发布了播客《罗永浩的十字路口》第二期,小鹏汽车 CEO 何小鹏作客,两人聊及了创业过程中、人生不同阶段所佩服和向往的偶像人物或者榜样人物。

何小鹏直言没有特别的偶像,但是有觉得一些人是很棒的。比如读大学的时候自己创业家电企业康佳、TCL、创维的师兄,称在九几年的时候觉得他们干得特别棒;到零几年,主要是史蒂夫·乔布斯,何小鹏称觉得乔布斯敢爱、敢恨、敢创造、敢改变,非常的棒。

随后二人谈到了伊隆·马斯克,何小鹏表示他是自己比较佩服的人,特别喜欢他的科技幻想,就像小时候做梦一样。虽然他经常延误,但是他大概率都做到了,这个特别牛(消音)。(来源:IT之家)

 

梅卡曼德完成 5 亿元 D 轮融资  

8 月 27 日,据 36 氪获悉,爱企查 App 显示,梅卡曼德(雄安)机器人科技股份有限公司完成 D 轮融资,融资金额为 5 亿元,投资方包括大洋电机、华创资本、中金资本等。

梅卡曼德(雄安)机器人科技股份有限公司成立于 2016 年 9 月,法定代表人为邵天兰,注册资本 483.97 万元人民币,经营范围包括工业机器人制造、仪器仪表制造、软件开发等,由深圳市红杉瀚辰股权投资合伙企业(有限合伙)、北京酷讯科技有限公司、北京梅卡曼德企业管理合伙企业(有限合伙)等共同持股。(来源:36 氪)

 

格力高管喊话小米:制造业是实实在在干出来的 少一些虚假的转发

8 月 26 日,格力电器市场总监 @ 朱磊 Gree 在微博发文,再次回应与小米空调以及小米集团总裁 @ 卢伟冰 的「隔空交锋」。

他表示,卢伟冰转发的对比图展示的格力机型十年前早已退市,不是现售产品;即便如此,其内部结构还被人动过手脚,刻意营造出「凌乱」的效果。

这位格力高管呼吁卢伟冰:「下次转发微博前,若能以同样认真的态度多核实一下内容的真伪,想必会让您传递的信息更有价值。毕竟,制造业是实实在在干出来的。让我们一起努力,让行业里少一些虚假的转发,多一分踏实与清朗。」(来源:快科技)

消息称苹果 AirPods Pro 3 耳机充电盒取消实体配对按键,正面引入触控操作区域

8 月 26 日,据外媒 Android headlines 报道,苹果 AirPods Pro 3 的充电盒有望取消背部的传统实体配对按键,同时为充电盒正面引入触控操作区,用户届时滑动耳机盒即可快速切歌、暂停音乐、调节音量,从而让相应设备的使用体验更符合苹果家族式「手势交互逻辑」。

其他方面,外媒透露苹果 AirPods Pro 3 外观方面调整不大,其中充电盒仍会保留挂绳孔,方便继续搭配现有配件,耳机本体仍延续 AirPods Pro 2 的设计,将提供更稳定的连接体验,以及一系列音质 / 降噪优化,定位为「实用且稳健」的常规升级。

此前古尔曼还透露苹果将为 AirPods Pro 3 加入心率监测功能,作为比较,苹果已经在今年早些时候推出的 Powerbeats Pro 2 耳机中率先引入了心率监测功能。当两只耳机同时佩戴并启用该功能时,苹果将通过其内置的 LED 光学传感器以每秒超过 100 次的频率透过血流来测量心率。该功能可与健身 App 联动,记录健身数据并同步至 iPhone 上的「健康」应用。(来源:IT之家)

 

哈苏 X2D II 100C 中画幅相机发布:一亿像素、5 轴 10 级防抖

8 月 26 日,哈苏正式发布全新中画幅相机 X2D II 100C,售价 51900 元。该机首次搭载 AF-C 连续自动对焦(需搭配兼容 XCD 镜头并更新固件,电子快门不可用),结合深度学习算法可跟焦人、车、猫狗等主体。

AF-S 模式下含 425 个相位对焦区域,协同 LiDAR 测距,新增对焦辅助灯优化低光对焦,同时新增「扩展点」「自定义」「广域」对焦点模式。搭载 1 亿像素中画幅背照式 CMOS,支持 16 位色深、原生 ISO 50、15.3 级动态范围。

作为哈苏首款端到端 HDR 中画幅相机,支持机内直出 HDR HEIF/Ultra HDR JPEG(部分模式不支持,RAW 可后期导出 HDR)。配备 3.6 英寸 OLED 双向翻转触控屏(峰值亮度 1400 尼特),搭配 Phocus Mobile 2 可在移动端编辑 HDR 图片。

支持 5 轴 10 级防抖(中心 10 级、边缘 8 级,CIPA 标准测试),远景防抖较前代提升 8 倍。

内置 1TB SSD(读写速度 2370MB/s、2850MB/s),另设 CFexpress Type B 卡槽拓展存储。(来源:快科技)

 

百度正式发布 AI 搜索 APP「梯子 AI」:主打无广告智能搜索

8 月 26 日,据报道,百度旗下的 AI 搜索 App「Tizzy.ai」已完成了前期的测试,并正式更名为「梯子 AI」上架。

这款应用最初于 8 月 10 日发布,当时名称为「Tizzy.ai」,更新后版本号从 1.0.0 直接跳至 1.2.0。

据介绍,梯子 AI 定位为智能搜索助手,依托百度多个大模型能力开发而成,主打无广告智能搜索,整合深度思考、资源检索及影视娱乐功能,致力于为用户提供「简单搜索,一触即达」的极致体验。(来源:快科技)

泰勒·斯威夫特宣布与橄榄球运动员凯尔西订婚

8 月 27 日,35 岁美国流行音乐巨星泰勒·斯威夫特宣布与橄榄球运动员特拉维斯·凯尔西订婚,她在社媒上晒照,并写道:「你的英语老师和体育老师要结婚了。」

泰勒·斯威夫特在 2023 年与凯尔西确立关系,据报道,当时是凯尔西主动追求,两人低调交往一段时间后才公开恋情。

消息传出后,美国上市珠宝零售商西格内特珠宝股价快速拉升,最终收涨 3.12%。市场人士分析称,大批「霉粉」可能因此涌向珠宝市场寻找订婚钻戒,从而带动投资者对相关消费股的乐观情绪。(来源:直播吧)

把豪车卖爆了的华为,瞄上了比亚迪们 10 万市场的「大蛋糕」

余承东的「金句」,暂时消失了。

8 月 25 日,在鸿蒙智行智界、问界新品发布会上,尽管宝马、奔驰、特斯拉、小米的产品反复作为对比项出现在现场屏幕,但他的发言里极少提到竞品的名字,尤其是小米。他甚至表示:「原来他们(同事)准备的视频是跟友商多个竞品去对比,我觉得这样不太好。」

在这场「低调」的发布会上,余承东一口气发布了 3 款车型共 15 个 SKU 的价格,外带还预告了即将在九月发布的 3 个新产品。

如今,鸿蒙智行旗下的五「界」品牌,完成了从 16 万元 -110 万元价格区间的全覆盖。而且越是贵的产品,越不愁卖:

  • 50 万级别的问界 M9,自 2023 年 12 月上市以来,已积累交付 22.6 万台,是这个价位段连续 17 个月的销冠
  • 上市 87 天的尊界 S800,大定量突破 12000 台,几乎等于奔驰 S 级全年一年的销量

但事情的另一面是:目前鸿蒙智行累计交付的 90 万台车里,有 75 万台都来自「问界」品牌

所以,如何把五个品牌都卖好,是如今摆在余承东以及各「界」品牌面前最值得思考的一个真问题。这个问题的答案既来自产品本身,也和组织、效率、配合等息息相关。

 

「听华为的没错」

从产品的角度而言,这场发布会的主角应该是「智界双七」。

但产品维度的升级本身并不大。用户层面感知度比较高的升级包括:智能辅助驾驶硬件层面加入了固态激光雷达、4D 毫米波雷达等一系列感知硬件;增加了新的外观配色以及「智驾小蓝灯」;隔窗对话等功能的发布。整体来说,这是一次年度小改款。

在价格方面,智界 R7 的主销 SKU(即大电池增程单电机版本)起售价下调了 3 万元;而智界 S7 的各个 SKU 相比 2025 款(即老款)也都下调了 3-4 万元。

智界 R7 的全新极光绿配色 | 图片来源:智界汽车

连余承东也调侃:「尹总(奇瑞汽车董事长尹同跃)这次是下决心『出血』了。」

转变的原因来源于市场端的压力。实际上,智界 R7 自去年 9 月上市发布后,前 4 个月里始终保持着月销过万的「小爆款」态势。但今年春节后,智界 R7 销量出现滑坡:根据智界汽车官方发布的数据,智界全系(包括 R7、S7 两款车型)今年上半年累计交付数据为 46600 辆。

在新能源汽车市场进入白热化竞争的阶段,各个新势力品牌对于用户的争夺,不单单体现在产品配置、价格等维度,还和质量、销售、服务等体系及组织能力紧密相关。

从这个维度来看,这场发布会上属于智界的正餐既不是「双七」的发布,也不是中途亮相的品牌大使刘亦菲,而是产品亮相前奇瑞汽车董事长尹同跃的发言

尹同跃宣布智界品牌进入 2.0 时代 | 图片来源:极客公园

尹同跃表示:奇瑞和华为之间的合作将进入 2.0 时代,投入超百亿专项资金 +5000 人团队,并强调这是「由华为公司全面主导的纯血鸿蒙时代」。一个突出的变化是奇瑞为智界将成立独立运营的新能源公司,意味着智界品牌的权重和自主权将进一步增大。

另一个重要变化是,奇瑞为智界设立了专门的设计、研发团队,并且还将建设专属的智界用户中心。

目前,鸿蒙智行五界共有 10 款在售车型(包含预售车型、同一车型纯电和增程在此合并统计),普通的「鸿蒙智行」门店根本无法展示全部车型,每个品牌自建独立的用户中心可以让销售资源更集中、服务更精细。

同时,独立的运营也保证了智界的销售目标不会和奇瑞内部其他产品线产生竞争或其他微妙的关系。此前,有小红书网友曾表示,在智界某门店的线上直播里,有销售人员向用户推销奇瑞旗下其他车型。尹同跃表示,现在奇瑞集团所有的资源都要向智界项目「倾斜、让道和鼓掌」。

所以,鸿蒙智行的模式不光是华为「出标」车企「代工」这么简单,也需要双方足够的投入和配合。这一次调整也证明了奇瑞内部正在进行一次「熵减」调整,以重新适应鸿蒙智行模式。

尹同跃在发言最后说:

听华为的没错。

上市 24 小时后,智界发布销量成绩单:「双七」新款大定量累计突破 10000 台。

 

「拼盘」的问界,依旧热卖

这场发布会上发布的另一款产品是问界 M8 纯电款。

除六座版入门款纯电更贵 1 万元之外,问界 M8 的纯电和增程动力形式价格完全相同,「油电同价」这是 M8 从增程市场向纯电扩张时的基本策略。

除此之外,关于 M8 产品介绍的记忆点不算多。一些智能辅助驾驶、主动安全等功能的展示,也都是以 M8 纯电版本为介质,余承东强调「问界全系开启 ADS4」——意味着此前的车型也将逐步通过 OTA 升级的方式,被推送最新智驾版本。

要知道,过去几年里余承东为了把问界这个品牌打向市场,诞生了诸多发布会名场面。而现在,不再需要太多摇旗呐喊,问界新品和智界「拼」一场发布会,依旧可以大卖——上市 24 小时后,问界 M8 纯电版的大定量同样突破 10000 台。

问界 M8 纯电版 | 图片来源:鸿蒙智行

首先,30-50 万的消费者对问界品牌有了足够的认同。

问界 M8 增程版如今周销破 5000 台、M9 长期占据 50 万以上销冠地位,这是问界最好的广告。也难怪余承东经常唠叨:如果能用一个品牌卖所有车,就不用重复五遍从 0 到 1 的工作、造五个「界」了。

鸿蒙智行五界的 Logo,都是围绕「六边形」来进行设计的 | 图片来源:极客公园

其次,消费者的好感绝不仅仅靠一个简单的「品牌」名字或者某种「身份」认同就可以建立的。问界常说自己的 NPS 值(净推荐值)排名第一——如果一个人的车质量、品控常出问题,他绝不会推荐给身边的人。

余承东在大湾区车展时那句「按照华为的标准,某些车企一台车都无法出货」也许是说给友商的,但其实对内部伙伴也同样适用

有趣的是,问界品牌下一款推向市场的产品——改款 M7 也将会以「拼盘」的形式发布。某种程度上,问界比它在增程领域的竞争对手理想,更早接近了李想本人希望达到的那个传播境界:没有发布会,直接开卖也能卖好。

 

尚界亮相,鸿蒙智行进入十万市场

在发布会尾声,享界全新的旅行车享界 S9T 以及华为和上汽共同打造的「尚界」也先后登台亮相。

其中,享界 S9T 最大的卖点在于兼具了轿车的操控和 SUV 的装载能力,并且通过 CDC+空悬等技术优化了通过性。官方表示,享界 S9T 自预售以来,预定量突破 20000。

而尚界首款车型 H5 的 16.98 万的预售价发布,则引发了整个行业更热烈的讨论。考虑到正式发售价和预售价之间往往还有 1-2 万的价差,这一次华为似乎有意要把高阶智驾下放到 15 万元以内。

尚界的第一份答卷 | 来源:鸿蒙智行

据余承东介绍,尚界将搭载 ADS4,高速、城区和泊车场景的智能辅助驾驶全部支持,且配备 192 线激光雷达(大概率在高配车型)。

目前,在 15 万 -20 万元的价格区间里,零跑、小鹏两家新势力位居月交付榜前列。其中,主打增程的零跑 7 月交付量突破 5 万台,而主打智能化的小鹏上升至 3.6 万台。刚「出生」的尚界给出的第一份答卷是:18 小时超过 5 万预订单。

不仅如此,今年年初,比亚迪曾以「全民智驾」为主题发布了旗下天神之眼的三版智驾方案,曾引发关于「什么是高阶智驾」的口水战。如今尚界首款产品的亮相,相信会实实在在让如今的新能源一哥感到压力。

尚界H5 计划于十月国庆前交付。据《36 氪》报道,尚界方面已向供应商释放了年销 40 万辆的备料计划。

如今,鸿蒙智行旗下的五个品牌,已经完成了从 16 万元 -110 万元价格区间的全覆盖。有些取得了阶段性成功,有些还在追赶,也有的一起步就憋着要成为爆款。但无论如何,其中的故事都非常复杂,鸿蒙智行的品牌和产品,绝不仅仅是贴上「华为」商标这么简单。

Vibe Filmmaking 会不会成为下一个 AI Agent 爆款应用?

在软件领域, Vibe Coding 的核心在于:让开发者摆脱繁琐、低产出的代码编写,把体力活交给 AI,从而专注于更高维度的产品迭代与创意探索——追求的是 效率 + 创意 的双重突破。
这种范式,正在迁移到影像创作领域—— Vibe Filmmaking
传统上,制作一部影片需要编剧、导演、演员、摄影、音效、后期等多条战线协作;而在 Video Ocean Agent 的协作下,影视创作者可以 一人完成所有职能 ——只需几分钟,AI 即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。

自小范围开放邀请码以来,Video Ocean 的全新功能迅速在 X Reddit YouTube 等平台刷屏。通过 AI Video Agent ,他们将原本需要数周的拍摄周期,缩短至 数天甚至数分钟 。创作者只需简短输入一句话:

「生成一条 2 分钟的橘色皮划艇猫咪冒险短片。」

AI 便能自动完成分镜、配音、字幕、剪辑,一气呵成。

在全球范围内,用户反馈高度一致: 生成流程顺畅,功能实用,任务导向明确 。许多海外创作者甚至分享了完整录屏,直言——

「我第一次只用一句话,就完成了一支完整的视频。」

与传统视频创作中依赖单一镜头「抽卡」的玩法不同,现如今的焦点已转向:

「AI 能否一站式完成整个视频创作流程?」

仅在 短短 10 天内,来自 14 个国家的 115 位创作者 排队体验,首批邀请码数秒内便被抢空。

这次引发海外社群兴趣的,不再是模型性能的突破,而是 应用层面交互方式的更新 。不同于传统 AI 视频只能生成 单个镜头片段 、或依赖模板(如海螺的模板 Agent)去填充画面,Video Ocean 从产品设计上直接改变了创作协作模式:目标不再是「更快产出一个镜头」或「套用固定模板」,而是 更快交付一个完整的创意项目 。在这里,Agent 不再只是模型的附属功能,应用也不只是界面的包装;真正能跑通的 AI 产品,核心在于 明确的任务感 贴合创作场景的落地实践 ,而非单纯的参数比拼。

Video Ocean 官方宣传片

01

Video Ocean Agent 是什么?

它不是「云剪辑工具」,而是 AI 应用层的新范式

作为全球首个接入 GPT-5 的视频 Agent,Video Ocean 不止是加速某个单点流程,它通过智能化整合,打造了一个完全 自动化的创作生态系统 ——它不仅仅是工具,而是用户创作过程中的 云端创作团队

  • 脚本策划模块 ——只需一句创意指令,AI 自动解析并生成分镜和节奏,从创意到具体实现无缝衔接。
  • 视觉合成模块 ——根据脚本智能检索和生成动静态素材,确保每一帧画面都与创意和品牌风格高度契合,完美匹配配色与字幕。
  • 配音字幕模块 ——自动为每个角色和情境匹配多语言背景音乐与音效,同时实时嵌入字幕,打造完整的音视频体验。

Video Ocean 不只是在操作一个 AI 模型,而是拥有一个能够理解上下文、学习并记住用户 品牌风格 历史创作 的智能团队。这种持续学习和适应的能力,使其避免了传统生成工具每次都需要重新开始的局限。

随着 AI 模型逐渐成为行业「基础设施 」,Video Ocean 的创新之处在于,它将创作任务从繁琐的操作中解放出来,只需下达创意指令,其他的工作构思、分镜到视频生成、配音、字幕都由 Video Ocean 全程接管。将焦点放在帮助用户快速完成创意工作,避免陷入调试和设置中,成为「创意导演 」。

02

Video Ocean Agent 能做什么?

它不是单一功能的工具,而是全流程创作的智能引擎

  • 紧跟热点,快速批量生成爆款视频,内容产出效率提升 10 倍

借助 Video Ocean ,能够迅速响应市场热点,高效批量生成符合趋势的爆款视频。无论是 产品宣传 活动推广 ,还是 热点事件追踪 ,Agent 的加持让内容产出速度提升 10 倍,抢占市场先机。

  • 商业场景轻松 Hold 住,商用级广告与宣传片一键出片

Video Ocean 不只是创作短视频的工具,它能应对复杂的商用级创作需求。无论是 企业广告 品牌宣传片 ,还是 产品发布会视频 ,只需简单指令 Agent 即可迅速生成 专业水准 的商用视频,轻松满足多样化的商业场景。

  • 从 0 到 1 构建专业级影视内容,打造属于用户自己的影视王国

对于创作者而言,Video Ocean 可以从 0 到 1 构建属于自己的影视内容。从初步创意到最终成片,AI 帮助快速实现 专业级 的内容生产,省去繁琐的拍摄与后期制作流程,在短时间内构建出一个完整的、可持续创作的「影视王国 」。

高频应用场景 | Case 展示

Video Ocean 的能力远不止这些,它几乎覆盖了日常所有视觉创作需求。从短片、广告到教育视频、社交媒体内容,Video Ocean 都能够快速、高效地生成所需的视觉作品。以下案例,均由 Video Ocean 仅用一句话指令生成:

Case 1:F1 赛车解说

Prompt:生成一个 F1 赛车的现场解说视频

Case 2:海洋纪录片

Prompt:生成一个关于海洋的纪录片

Case 3:香奈儿广告

Prompt:Generate an ad for Chanel eyeshadow

生成一个香奈儿眼影的广告

Case 4:蜜雪冰城广告

Prompt:生成一个蜜雪冰城柠檬水的广告

03

使用教程:简单几步,

轻松生成高质量短片,Agent 助用户完成创作全流程

Video Ocean 的世界里,所有操作都可以通过 输入栏 轻松完成。

在项目中,只需将想要生成的短视频内容通过简短的一句话输入,Video Ocean 便会自动开始工作。Agent 将根据用户指令,把文本梳理为 「创意构思」、「脚本编写」和「分镜生成」等内容,确保视频制作流程清晰而高效。

通过智能对话,用户无需担心写复杂的提示词,Video Ocean 会自动完成任务。

当然,如果碰到不合理的地方,也可以 提出修改意见 ,Agent 会根据意见自助进行调整修改。

此外,过程中生成的图像也不会浪费——所有图像都会自动归类到相应的 分镜 中,便于后续的修改与调整,确保创作过程的高效性。

甚至连视频的 剪辑过程 也无需手动操作。只需简单一句话,Video Ocean 便会完成从素材整合到成片输出的整个过程。而且,项目完成后,Agent 会提供一个 项目回放 (replay),随时回顾创作过程。

这一切都非常简单,甚至是 AI 视频生成的新手 也能轻松制作出优质的小短片作品。无论用户是视频制作小白还是专业创作者,Video Ocean 都能为用户提供简便、快速的创作体验。

04

让创作自由流动,人人都是导演

——Video Ocean 打破创作壁垒,Agent 让创意无限可能

Video Ocean 起源于潞晨开源项目 Open-Sora ,该项目的学术论文引用量已超越多个著名机构的视频大模型。

AI 不再是替用户上场的「替身」,而是:

  • 从「学会操作 」到「尽情表达
  • 从「技术门槛 」到「情绪流动
  • 从「批量生产 」到「玩出感觉

下一次灵感闪现,不必翻包找相机——

只需对 Video Agent 说一句:「我脑海里有个画面……

Video Ocean 将把用户想法转化为光影,让「Filmmaking for Everyone 」不再是口号,而是随手可得的创作日常。

看创意在指尖自由生长,成为独一无二的导演作品。

点击阅读原文,立即体验

https://video.luchentech.com/

AI上新|马卡龙 AI,一场从「哇塞」到「算了」的过山车体验

Macaron(马卡龙)AI 最近挺火的。

8 月 15 日,他们以「世界上第一个 Personal Agent」的称号公开上线了,给扎克伯格想做的 Personal SuperIntelligence 打了个样。

图片来源:马卡龙官网

「马卡龙可以随时为你打造一个小工具,完全符合你的需要,只需要 5-10 分钟。」团队在产品宣传片中说道。

不用编程、不用写 UI,几句话就能在 10 分钟内做出一个能用的个性化小程序?

我带着好奇和质疑用上了马卡龙,但很快就被它吸引和「折服」了。


栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同 学发出召集,只要你发现并体验了新 的 AI 应用或者功能,按照格式(参考案例 : AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」)向栏目投稿,在极 客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订 阅费用。

同时,优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧!投稿、进群请扫描下方二维码添加极客小助手微信


01

初见:有点儿东西

看脸,是体验任何应用给人的第一感受。

马卡龙的 UI 设计第一眼就让人觉得「不像 AI」

没有硅谷式的冷冰蓝色,没有 ChatGPT 的极简黑白,而是暖色调搭配轻巧的手绘插画。它更像一款独立游戏,或者一只电子宠物,而不是工具,就像马卡龙形象本身:有点柔软,有点甜。

用户第一次打开应用时,马卡龙会用三个轻松的问题来「认识你」:类似 MBTI 测试,但更像是一种破冰。问题没有正确答案,却能让你感觉它正在「为你定制」而不是「要求你输入」。

打开应用的前三屏|图片来源:极客公园

进入应用之后,它不会把你丢进一个复杂的面板里,而是直接拉开一个对话框,让你和它开始聊天。它不急着展示功能,只是耐心问一句:「你需要我帮你做点什么吗?」

我一开始也没想太复杂,就梳理了几个「我有需求,但没找到合适产品」的场景,交给它试试。

第一个应用,不能免俗的,就是「影视、书籍、游戏记录」。

尝试制作第一个应用|图片来源:极客公园

马卡龙很快抓住了我的需求,还顺手扩展了功能。十分钟后,一个完整可用、完全贴合描述的小程序就出现在我眼前。它不仅能快速记录,还自带时间线、收藏统计、豆瓣同步,甚至能换主题色。

对一个不会编程、只有想法的普通用户来说,这就是「点石成金」的时刻。于是我开始把一个个小想法变成真实。

第二个应用是「记录禁食」。我提了基本需求:禁食时钟、目标倒计时、饮水和感受记录。马卡龙在对话中还主动建议加上「心情标签」「成就系统」「统计图表」,简直比产品设计师还贴心。

15 分钟后,「轻断食助手 FasTime」诞生了,但我并不满意预设的时间选项,直接和马卡龙说「改为 16 小时、24 小时、36 小时、48 小时」。三分钟后,调整完成。

那一刻,我第一次真正体会到 Personal Agent 的含义:它不只是能做工具,而是能为我量身定制。

看着简陋,功能都有|图片来源:极客公园

回到应用效果上,它就像一个微信下滑出来的小程序,看着简陋,但核心功能都有。

这正好满足了我「不想为单一功能安装一个专门 App」的需求。而且它还能随时根据我的指令迭代。

很快,我就对马卡龙上头了,我「创造」的应用也越来越「个性化」。

第三个应用随之而来——追剧计时器

记录书影、禁食,这类需求市面上早就有一堆成熟 App。

可「追剧计时器」不同,这是我真切需要,但找不到对应产品的应用。那一刻,马卡龙让我看到了一个念头变成现实的可能。

功能设想很直白:我输入剧名,它能自动抓到季数和集数;我选择播放倍速,它就能算出,追完这部剧具体要花多少时间。

不过这需求问一下 AI 就行了|图片来源:极客公园

倍速计算不难,难点在于准确抓到剧集数据,并把每一季的时长统合出来。马卡龙完成了我需要的功能,并且添加了「观看列表」和「逐集追剧」的功能。

但当我输入要看的剧时,经常出现「计算数据时发生错误」的 bug,在我要求「自动获取剧集封面」的需求后,它说已修改,但并未在应用中实现。

此 bug 出现在许多应用里|图片来源:极客公园

「追剧计时器」的计算精度,还不如我直接去问 AI。也是从这个应用起,我开始发现了马卡龙的「空心」。

02

「空心」马卡龙

在我又创建了几个小程序后,我发现个个都像模像样,但经不起细用、真用。

最先试的「影音游记录」就是典型例子。记录功能没问题,可当我尝试连接豆瓣账号时,输入 ID 后应用确实检测到了条目,但点下「同步」后,豆瓣主页空空如也,小程序里反而出现了几条莫名其妙的 AI 生成记录。自定义外观选项同样无效,改了半天也没变化。

右边是 AI 生成的记录|图片来源:极客公园

禁食助手情况类似。设定的选项和所谓的成就系统几乎没法用,真正能运转的只有一个「计时器」

再比如我基于运动习惯做的「运动日志」,无法连接 Apple Watch 的数据,只能靠我手动输入。

想要的「每日推荐爵士专辑」,修改几轮指令后依旧不能显示中文,封面加载失败,「在豆瓣中查看」的链接则跳去一张不相干的专辑页。

制作的「类似角色匹配器」则是完全用不了,一直在提醒搜索错误。

我最期待的应用:封面抓取失败、界面修改不了、跳转外部链接错乱……|图片来源:极客公园

连最初让我眼前一亮的「灵感库」也没能撑住。

「灵感库」中是马卡龙预设好的大量小程序,只需要 1/5 自制应用的积分就能获取,从什么「宠物心情追踪器」到「学单词神器」再到「行李打包指南」,堪称全方位的生活助手。

马卡龙的灵感库|图片来源:极客公园

但点开下载才发现,大部分程序就是 AI 生成的静态网页

热门的「年货助手」只是一张清单,列了物品、数量和金额,没有任何编辑功能,连个打勾功能都没有;号称可以给准大学生推荐专业的「专业指南针」,也没有任何交互,只是信息的罗列;你输入自己喜欢的书和作者,它会声称帮你定制推荐的「书籍匹配」,结果推荐的书全是 AI 瞎编的。

官方宣传片里推荐的「植物医生」能拍照分析植物状况,但在我的试用里,三株植物两株识别失败,一株识别对了,但诊断结果完全是在瞎说。

三株植物,识别失败两株|图片来源:极客公园

马卡龙的问题暴露的还不止这些:

  • 当半小时左右没有打开应用后,再次打开需要 40 秒的加载时间。官方给的解释是:暂时休眠以节省资源;
  • 生成应用的选项看似丰富,却常常无效,二、三次修改后告知功能已实现,但实际上并未解决问题;
  • 无法与外部 App 或网站打通,最简单的搜索能实现,但时间长,失败率高;
  • 内容过度依赖 AI 生成,信息可靠性不足;
  • 语言混乱,中文界面、对话、指令下,还是会随机生成英文内容;
  • 价格并不便宜,新用户送 30 积分,而后生成一个应用需要 10 积分(3.99 美元,约 30 元),订阅套餐更加昂贵。

从「点石成金」到「徒有其表」,落差就这样显现出来了。

马卡龙的价格不算便宜|图片来源:极客公园

起初,我理解马卡龙的核心是「为用户构建定制化场景的迷你 App」。对于具体、重复、单一的需求,比如计时、记录、设定选项,它的表现还算可以。但一旦需要外部信息,它只能依赖 AI ;而 AI 生成的内容,又往往不可靠。

最终我意识到,马卡龙能做的事情,其实完全可以通过「快捷指令」或其他 AI 实现,本质上,它提供的更多是一个界面。

马卡龙官方给它的定位更像是一位「陪伴型、成长型」的 AI 助手,带着一点情感、一点温度,而不是只会催你工作的工具。但真实体验中,追求陪伴的用户对马卡龙抱怨几句不顺心,它就会表示「要不要我给你做个小工具解决这个问题」。而被「打造个性化应用」吸引的用户,更关心应用功能是否可靠、操作是否顺手。

所以无论是情绪价值,还是核心功能,马卡龙最终都会导向工具属性,当用户真正需要稳定、可靠、能联动的工具时,追求陪伴、贴心、情绪价值,就显得有些拧巴

所谓 Personal Agent,本质是一个能够理解你的需求、了解你的生活和想法,并在不同场景下给出个性化服务的智能助手。理想状态下,它能快速把你的想法落地,知道你什么时候需要它、怎么帮你,同时还能与其他应用或设备协同,随着使用不断学习和优化。

马卡龙追求的「情感 + 工具」的方向并没有错,就像人类需要理性和感性。理想中的 Personal Agent 是「既懂你,又帮你」,一个只讲究实用和功能的工具,往往只能在「用完即弃」的场景里存活,正如我们不会把 Excel 当作陪伴。

马卡龙试图在这个方向上先行一步,可表现上还是个「半成品」,它确实能以对话形式快速生成工具,也会感知需求并尝试回应。但深度理解需求、主动提供实用帮助、跨平台协作的能力都有限。

换言之,它实现了 Personal Agent 的一部分愿景,却也辜负了用户对完整体验的期待

目前的马卡龙,应用如名。看着香甜可口,但吃下去,夹心却有点夹生。

当用户想吃好喝好,大众点评成了外卖新入口

点了这么久外卖,你是不是最怕骑手突如其来的关心:「下次别点这家了。」

以为占了补贴便宜,没想到点到了脏外卖,只能立刻翻社交媒体学习「如何点干净外卖」。这两天在社交网络上刷到一些网友推荐,大众点评有个新的「品质外卖」频道,入驻商家都是有堂食或线下自取能力的高分优质店铺。看来,这顿外卖还有救。

极客公园从美团获悉,上述大众点评「品质外卖」频道,是美团为满足用户对高品质外卖的需求新推出的,主打「真品质、真堂食、真评价」。通过大众点评 APP 首页的频道入口进入,用户每天可领大额「堂食商家外卖消费券」。相关负责人表示,当前仍是一期产品,平台正在持续优化用户体验,未来将推出更成熟的二期产品。

极客公园按照流程亲身体验,领完 18 元无门槛红包后,在频道列表里不仅可以清晰看到「必吃榜」「黑珍珠」等优质商家标签,还发现了不少容易错过的宝藏小店。

举个例子,附近一家炒菜馆去年才上线外卖,仅有 82 条外卖评价,看似平平无奇。但在大众点评的「品质外卖」频道列表,可以一眼看到这家店的收录年份、到店评价量和星级评分。我才第一次知道,这家店已被大众点评收录 15 年,累计 2.6 万条堂食评价,评分依然高达 4.5 星。

这种反差让我不禁想到:在一些外卖平台上,销量和补贴会显著影响一家店的曝光度;但在线下的堂食世界里,长期积累的口碑,特别是用户真实体验后分享的图文评价,更能全方面反映商家的经营情况。

这正是当前用户点外卖的痛点:想吃得更好,却在点单场景里缺少足够多用户线下体验后的真实评价作为参考。

而「品质外卖」频道的出现,则恰好是美团把大众点评沉淀了二十多年的口碑体系搬进了外卖场景,让「哪里好吃又放心」的答案重新回到真实评价中。

 

01

为什么大众点评能评「品质外卖」?

艾媒咨询 2024 年的调研数据显示,超过三成消费者每周点 5-10 次外卖,23.25% 的消费者每周点 3-4 次外卖。这意味着,外卖已经从堂食的补充消费变成了高频刚需。

外卖越点越多,但要找到真正好吃又放心的外卖店还没有那么容易。

为了回应这一需求,美团在大众点评 App「品质外卖」频道,核心特点是「真品质、真堂食、真评价」。

打开「品质外卖」频道,几乎每家店铺都带有绿色的「堂食店」标签,均标有点评评分和堂食评价数量,部分上榜餐厅还会标注榜单排名。消费者还可以进一步筛选「点评评分 4.0 星以上」或「点评评分 4.5 星以上」的优质店铺。

与此同时,大众点评还推出了抢大额品质外卖红包的优惠活动。从早上 6 点到晚上 6 点,每隔两小时都有限量 18 元无门槛大额红包可抢。此外,还有「满 25 减 15」、「满 38 减 22」等大额品质外卖红包可抢。

外卖市场这一年竞争激烈,「品质外卖」也被一再谈起。然而,真正的品质标准往往模糊不清或者被不良商家钻空子,最终沦为营销口号。

比如,近期不少媒体曝光,有些商家为博取平台流量曝光,伪造精致堂食照片,实则「线下脏乱如工地」,但平台的线上审核难以全面掌握商家的真实情况。结果,有的消费者兴冲冲地下单精致外卖,薅准新店福利,却拿到了一份名副其实的「厕所炸鸡」。

相较于一般外卖平台需要费力打击「幽灵外卖」,大众点评在做「品质外卖」上似乎自带天然优势。其长期沉淀的线下餐厅优质供给和用户评价体系,为「品质外卖」提供了多个维度的筛选能力和信任背书。

互联网上关于「如何点干净外卖」的激烈讨论里,有一条共识是「优先选择有堂食环境照片的商家」。原因很简单——堂食不仅意味着店铺实际存在,还代表了多重监督力。从资质审查、卫生安全检查,到用户到店体验后的真实点评,每一个环节都增加了对商家行为的约束力。

大众点评收录了中国几乎所有优质堂食商家,这为「品质外卖」提供了「真堂食」的基础把关。餐饮商家必须拥有堂食或者线下自提能力,才能被大众点评收录。不仅如此,大众点评还会通过线上线下多渠道,以及用户反馈等多方校验,确保商户是实实在在的线下门店。

而且,入驻大众点评「品质外卖」频道的商家都是高分点评商家。换句话说,这些店不仅拥有堂食或者线下自取能力,资质有保证,更在口碑上经过广大用户的真实考验。

更重要的是,大众点评的评价体系经过多年打磨,强调「到店体验后才有发言权」,收录的评价更加真实可靠。餐厅星级评分完全独立于商业合作,评价来源于真实顾客的实际体验。

根据大众点评《2024 评价透明度报告》,平台设有数百种风控模型组成的机审环节,可以快速识别黑产账号、刷评行为或恶意差评等违规评价。对机器无法完全识别的风险评价,平台还有数百人的人工审核团队进行二次核查。2024 年,共有超过 2070 万条违规评价被处理,其中 58.4% 在机器环节就被拦截。

2024 年,大众点评共收录了 2.68 亿条真实评价,其中美食类占比高达 78%,形成了庞大而可靠的口碑数据库。这为用户在大众点评内点「品质外卖」提供了充足、可信的决策信息。

正是这些真实可量化、可追溯的评价,让「品质外卖」有了清晰的标准,也让消费者在下单时不必只靠商家的宣传照片或红包活动做判断。

 

02

大众点评做「品质外卖」,

如何让口碑变成交易引擎?

近年来,外卖平台的竞争焦点几乎都围绕配送速度和价格补贴展开,一直争夺「谁又快又便宜」。但随着外卖渗透率持续提升,这种以价格换流量的方式正在逼近天花板。

当价格战的红利逐渐消退,品质开始成为新的增长突破口。而大众点评的「品质外卖」频道,正是试图让商家依靠口碑而不是纯低价赢得订单,让外卖行业的竞争逻辑从补贴驱动转向品质驱动。

艾瑞咨询调研数据显示,77% 的消费者将「有实体门店」视为「品质外卖」的首要标准,76% 的消费者在意营业执照、食品经营许可证等资质是否齐全,还有 68% 的消费者在意真实用户好评和评价系统的可信度。

换句话说,消费者对外卖品质的期待,已经远远超越了价格和配送时效。外卖不再只是快速、便宜的交易,而是跟生活品质紧密相关。

大众点评的「品质外卖」则恰好满足了这种需求:真实堂食的存在、长期积累的用户评价以及严格的审核体系,为消费者提供了可感知、可信赖的参考依据。这不只提升了消费体验,也让用户在面对众多商家时,更容易形成决策信心。

对餐饮行业的商家来说,从价格战转向品质竞争,不仅是顺应消费者的需求变化,也是逃离残酷内卷的出路。

这几年,餐饮行业「低价抢流量」的竞争层出不穷,许多线下门店深陷「不降价没顾客、降价没利润」的死胡同。美团外卖区域 KA 华东负责人曾炜鹏直言:「门店的平均存活周期仅为 18 个月,几乎每开一家店,就有一家店在消失。」在行业价格战的裹挟下,许多线下餐饮商家不得不以极限压价换取短期生存,却难以真正积累长期价值。

但从更宏观的趋势来看,外卖市场依然在增长,全国餐饮外卖收入在餐饮收入中的占比持续提升。2015 年,外卖对餐饮的渗透率仅占整个餐饮行业的 4%,而到 2024 年已经大幅提升至 26%。这说明外卖赛道已从应急补充选项转变为餐饮行业的核心战场。

对于真正注重品质的商家而言,这既是挑战,更是机会。如果能够将堂食的口碑有效转化为品质外卖订单,也许在价格战之外建立更加稳定、可持续的增长模式。

这也是大众点评「品质外卖」的关键价值所在。一方面,它把堂食商家的真实评价和外卖优惠结合起来,让用户在家也能体验到可靠的餐厅口碑,从而提升了商家的线上订单量,带来新的外卖客源。另一方面,它通过将用户的到店体验和高频外卖场景打通,把习惯点外卖的用户逐渐引导到餐厅消费,为线下高品质餐厅带来堂食增量。

这样一来,「品质外卖」不仅满足了消费者对高品质外卖的期待,也让线上流量真正反哺线下实体门店,推动形成线上线下相互支持、互利共赢的生态。

事实上,推出大众点评「品质外卖」,并不是美团今年第一次在外卖层面强化「品质心智」。

今年以来,美团在不同场景中不断尝试让用户感受到「品质」二字的分量。先是推出「浣熊食堂」,让外卖制作流程全程可视可溯源,并且计划未来三年在全国开设 1200 家线下门店。随后,美团又宣布将在年底前落地 1 万家外卖卫星店,并将「明厨亮灶」的后厨直播作为卫星店的基础设施。近期,美团拼好饭还正式公布「百万亮厨」计划,宣布将联合 20 万商家打造透明开放标杆。这些关乎「品质」的行动都是为了让消费者看得透明、吃得安心。

此前,美团也已经把大众点评到店评价搬进了外卖点单页面,给用户提供更多决策参考。

而大众点评上线「品质外卖」作为进一步美团满足用户需求、促进行业良性发展的一张新牌,则把口碑体系这个核心资产搬进交易场景,真正让「品质外卖」有了可以被感知和衡量的标准。

可以说,这是大众点评最擅长的能力——让「好吃又靠谱」的答案被看见。通过做「品质外卖」,好店铺的外卖口碑不再是停留在话题内的热帖讨论,而是直接转化为用户的下单行为,成为推动交易的引擎。

最终,「品质外卖」不仅让消费者在选择外卖时更有信心,也让商家看到了通过口碑而非低价获取订单的可能,促进线上线上流量的双向循环。这让外卖行业的竞争,从单纯的速度与价格,逐渐回归到服务、菜品与信任的本质,也为行业的健康发展提供了可持续的路径。

vivo Vision 探索版发布:开启三十而立的新篇章

今年是 vivo 成立的第三十个年头。在东莞这个梦开始的地方,vivo 工业园内举办了三十周年特别展。现场展览内容非常丰富,蓝科技空间站、vivo 影像作品展,漫步其中,vivo 三十而立的历程以及其对下一个三十年的展望,尽收眼前。

蓝科技空间站里,vivo 没有一味地炫技,而是从用户视角出发,把五大蓝科技、6G、MR、机器人等技术成果做了场景化的展示,大家可以体验互动,既硬核又有趣。

硬核之外更有温情,现场还有一个展区非常吸睛,vivo 时光长廊。从第一台电话机、第一台功能机,到多条产品线布局完善的智能手机,看着眼前一款款经典产品,大家一下就被拽进与 vivo 的专属回忆,vivo 三十年的来时路也就此具象化。

 

这自然会引出一个问题,接下来 vivo 要去哪?

答案落在 vivo Vision 探索版——vivo 团队探索未来科技的最新成果。三十周年之际,vivo Vision 混合现实头显正式亮相,影像技术战略全面升级,其重要意义凸显。

在很多武侠故事里,绝世高手往往有两种。一种是追求奇功秘籍,招式越炫酷越好,讲究一招「天外飞仙」定胜负;另一种则不然,他们可能一辈子只练几招基础功,但练到极致,一拳一脚皆成杀招。

 

vivo Vision 探索版|图片来源:极客公园

 

vivo Vision 给人的感觉,就有点后一种高手的味道:不玩那些虚无缥缈的「元宇宙」概念,而是用最顶尖的技术,去解决一个最基础、最朴素的用户需求。

过去几年,科技圈里刮概念风是一种常态,无论是「下一个计算平台」的宏大叙事,还是各种炫技产品,总之,先把饼画出去再说。相比之下,本分的 vivo 在过去三十年以及 vivo Vision 上的表现,都显得异常「踏实」。

01

vivo 的「窄门」与「长桥」

 

8 月 21 日下午的这场发布会,vivo 并没有急于描绘一个遥远的未来,他们甚至没怎么提曾经代表着一个时代的「元宇宙」三字。他们花了大量时间,在回顾过去,讲一些听起来很「基础」的东西:怎么让头显戴起来更舒服、怎么让交互更自然、怎么让你用手机拍的照片和视频,能在头显里获得更好的体验。

这背后其实是一种选择。当许多厂商都在争抢「元宇宙」这个宽阔无比的大门时,vivo 似乎选择了一扇更窄的门:先服务好现有的全球超过 5 亿的手机用户。

举个例子,目前 MR 行业最大的痛点之一,就是内容生态的匮乏。每次我和别人分享我使用 MR 头显的体验时,大家总是异口同声地会问同一个问题「我买个头显回来到底能干嘛?」关于这个问题,很多厂商的答案是,你可以玩游戏、看电影、开虚拟会议。这些都对,但对普通用户来说,吸引力似乎总差那么一点。

vivo 给出的答案不太一样。他们说,我们最重要的内容,就是你用 vivo 手机记录下的生活本身。

这听起来很简单,但实现起来却是一座需要长期投入才能建成的「长桥」。这座桥的一端,是 vivo 深耕了十多年的影像技术——从和蔡司的深度合作,到自研的 V 系列芯片,再到不断打磨的传感器和算法,确保用户能用手机拍出足够好的照片和空间视频。而桥的另一端,就是这次发布的 vivo Vision 探索版。它的首要任务,就是成为这些影像内容的最佳「终点站」,一个可以让你「回到」记忆现场的设备。

 

vivo Vision 的核心场景——影像|图片来源:极客公园

 

当别人还在为内容生态四处找开发者时,vivo 通过连接自己的手机和头显,为用户创造了一个源源不断、且极具个人情感价值的内容源。这个「生态闭环」,才是 vivo Vision 真正的护城河。

 

vivo Vision 的内容生态|图片来源:极客公园

 

它不是一个独立的炫技产品,而是 vivo 整个影像战略自然延伸出来的、负责体验升级的最后一块拼图。vivo 执行副总裁、首席运营官、vivo 中央研究院院长胡柏山在开场致辞中说,vivo 三十年走的是一条「用户至上、雕琢极致的产品之路」,这条路的方向是「科技照亮美好」,终点是「抵达每一位用户」。现在看来,vivo Vision 正是这条路上的又一个关键路标。

02

把未来戴在脸上,得先忘了技术

 

确定了「为谁服务、服务什么」这个核心问题后,vivo 在产品上的取舍就变得非常清晰。他们没有堆砌一些华而不实的功能,而是把几乎所有精力都放在了打磨基础体验上,核心目标就一个:让你在用的时候,可以忘了技术的存在。

首先是佩戴感,这是最基础,也最容易被忽视的「基本功」。MR 头显本质上是要「焊」在脸上的设备,不舒服一切都免谈。行业里动辄六七百克的产品,像个小头盔,戴上十几分钟就脖子酸、脸上出印,这直接劝退了大量潜在用户。vivo Vision 探索版硬是把重量做到了 398 克,高度和厚度也比行业均值缩小了约 26%。

这背后不是简单的材料替换,而是大量的、枯燥的、看不见的用户研究。vivo 的人因实验室联合国内顶尖高校,采集了海量国人面部数据,进行了深入的人体工程学分析。他们精准地找到了面部支撑的「黄金舒适区」,并通过精妙的力学设计,确保每一个支撑点的承压强度最大不超过 6.628kPa——这仅仅相当于人类呼气的极限压力值。

这种对「基本功」的执着,甚至到了有些「偏执」的程度。基于海量数据,团队最终设计出 4 组遮光罩与 8 套不同的亲肤泡棉组合,能够精准适配国人多样的面部轮廓,有效分散压力,减少漏光。

这意味着,他们没有试图用一个「通用」方案去应付所有用户,而是承认个体差异,并愿意为此付出巨大的工程和制造成本。甚至考虑到游戏等高动态场景,他们还特别设计了双环绑带,其上下分离的角度设计更符合东方人头型,即使在进行甩头、躲避等大幅度动作时也能保持稳定,同时还能适配多种发型,避免压发。这些细节,用户在看参数时可能根本不会注意,但一旦戴上,身体的感受是不会骗人的。

然后是交互。如果说手柄是上个时代的交互方式,那 vivo 这次显然想让用户彻底扔掉这个「拐杖」。他们搭载了基于「负设计」理念打造的全新操作系统——OriginOS Vision。

 

「舒适」是 vivo Vision 的核心要求|图片来源:极客公园

 

所谓「负设计」,如同自然造物,力求与环境相融,在简洁的表象下蕴含着清晰的逻辑和严谨的秩序,旨在与用户建立一种舒适和愉悦的情感连接。在这种理念下,你的眼睛就是鼠标,目光所及之处即为焦点;拇指和食指轻轻一捏,就是确认。这套「眼一看,手一动」的交互,几乎是人的本能,学习成本极低,号称 5 秒即可上手。

为了实现这种看似简单的「本能」交互,背后是长达四年的深耕。vivo 实现了高达 1.5°的高精度眼动追踪,其精准度相当于站在 2 米之外,准确地看向一块手表大小的区域。同时,系统支持 26 个自由度的手指级手势识别,以及垂直方向高达 75 度的超广识别范围,确保用户在各种姿态下都能被精准捕捉。

为了让虚拟与现实的融合天衣无缝,vivo 还采用了低延时的 VST(Video See-Through)算法,实现了从信息采集到处理和显示的全链路 P2P(Photon-to-Photon)延时低至 13 毫秒,达到了人体几乎无法感知的程度。这些冰冷的参数,共同构成了一种温暖的体验:从容无感。

当然,这一切体验的基石,是双目 8K 的 Micro-OLED 屏幕。它的像素密度之高,相当于将三台 vivo X200 Ultra 手机的像素点全部集中到一块邮票大小的屏幕上。但有趣的是,vivo 在介绍这块顶级屏幕时,反复强调的不是参数,而是色彩的真实性。他们把专业级电影监视器的色彩校准标准用在了每一台设备上,确保色彩准确度达到了专业级别的 DeltaE<2。为什么对色彩这么执着?答案还是回到了那个「生态闭环」上。

因为只有这样,才能保证你用经过蔡司认证的 vivo 手机拍出的世界,和你在这块屏幕里看到的世界,是同一个颜色。这种从输入到输出的体验一致性,才是最考验厂商「基本功」的地方。此外,他们还对每一台设备进行了双眼亮色度一致性校准,有效减少了因左右眼成像不一致而可能带来的视觉不适感。这些都是看不见的功夫,但恰恰是这些功夫,决定了用户是「尝鲜一下」还是「愿意常用」。

03

功夫下在看不见的地方

 

如果说,vivo Vision 探索版是 vivo 为用户搭的「硬件舞台」,那么他们在影像战略上的升级,则是在不断丰富这个舞台上的「剧目」,并且把舞台的地基打得更深、更牢。

vivo 影像战略从传统的「赛道思维」升级为「场景融合」。以前大家比的是谁夜景好、谁长焦强,像是单科竞赛。但用户在真实使用中,比如拍一场演唱会,往往需要长焦、暗光、抓拍、防抖等多种能力的协同作战。vivo 提出的「山顶也是 VIP」方案,就是这种「场景融合」思维的体现,它整合所有相关技术,去解决一个具体而复杂的真实痛点。

更有意思的是,vivo 开始把功夫下在了一些普通用户平时可能不太注意,但却至关重要的地方。

比如影像安全。在 AIGC 可以以假乱真的今天,一张照片的真实性变得越来越重要。在这种时代背景下,vivo 成为首个加入国际 C2PA(内容来源和真实性联盟)的中国手机厂商。这看起来离普通用户很远,但实际上是在守护整个数字内容的信任基础。vivo 首席安全官鲁京辉在对谈中表示,vivo 推出蓝图影像安全技术,核心价值就是化解由生成式 AI 引发的影像内容信任危机,因为「有了信任,才有真正的价值」。这是一种超越产品功能的责任感,也是一种在行业剧变前夜的深远布局。

再比如影像健康。这可能是整场发布会最令人意外,也最体现 vivo「本分」价值观的一环。vivo 宣布,将深度融合即将发布的 vivo X200 系列手机的长焦微距能力与专业医疗光学技术,推出一款专业级的便携式裂隙灯,让专业眼科影像走进基层医疗。

 

vivo 推出的一款专业级设备,可用于基层医疗|图片来源:极客公园

 

某种程度上,这几乎是一种来自手机巨头对一个传统行业的「降维打击」,把消费电子领域积累的技术势能,释放到更具社会价值的领域。这背后传递的信号是,vivo 思考的不仅仅是商业上的成功,还有技术能为社会带来怎样的正面价值。

事实上,vivo 的思考远不止于此。在内部的长期战略规划中,vivo Vision 这样的 MR 设备,被视作是未来家庭机器人走向千家万户的关键「桥梁」。MR 头显的本质,是让机器理解并融入真实世界,实现自然无感的交互。这套技术逻辑,与家庭机器人的发展路径不谋而合。

 

vivo Vision 下藏着团队更深的思考|图片来源:极客公园

 

今天,vivo Vision 用佩戴舒适性和「眼一看、手一动」的原生交互方式,让我们在虚拟空间中「回家」,去体验手机相册里的美好。这些在 MR 上打磨成熟的视觉和交互技术,完全可能被迁移和赋能给具备移动能力的家庭服务机器人。它们将不再是冰冷的工具,而是能感知家庭环境、理解用户意图、甚至陪伴家人生活的智能伙伴。vivo 正是希望通过 MR 这扇「窄门」,为未来的家庭机器人铺设一条坚实可靠的「长桥」,让科技真正成为家庭生活的一部分。

这种克制住商业扩张欲望,转而投入更基础、更长远领域的做法,和 vivo 三十年来「本分」的企业文化一脉相承。他们似乎坚信,把最基础的事情做到极致,比追逐最时髦的概念更重要。

这种坚持也体现在他们对影像文化的构建上。技术最终是为人服务的,而影像的终极意义在于表达和沟通。vivo 没有仅仅把自己定位成一个工具提供商,而是联合中国摄影家协会,共同主办了首届中国手机摄影大展。

 

首届中国手机摄影大展全国巡展首站|图片来源:vivo

 

这是中国摄协首次主办、并经中国文联批准的国家级手机摄影大展,其权威性不言而喻。此举的战略意义在于,它将 vivo 从一个技术品牌,提升到了影像艺术的推动者和行业标准的参与者的高度。中国文联副主席、中国摄协主席李舸在盛典上高度评价道:「vivo 十余年深耕影像技术的历程,恰是一场『用科技拓展艺术边界』的生动实践,让曾经需要专业设备才能实现的光影艺术,变得人人可触。」。

 

vivo 影像作品展中展出的作品|图片来源:vivo

 

今年,在这次大赛中获得组委会特别推荐奖的作品《生命的源泉》,由一位名叫「田鼠大婶」的创作者用 vivo X200 Ultra 拍摄,记录了甘肃民勤「种树姐姐」们的防沙日常。影像成为了连接乡村与外界的纽带,传递出平凡生活里的坚韧力量。通过聚焦并传播这样的故事,vivo 再次强调了其影像文化的核心——关注人,关注真实的生活,让科技成为传递温暖与力量的桥梁。

 

既是科技,也是人文|图片来源:极客公园

 

三十年前,vivo 从做电话机起步;三十年后,他们拿出了一款通往未来的 MR 头显。看起来跨度巨大,但内核从未改变:洞察用户的核心需求,然后用扎实的「笨功夫」去满足它。

当别人还在寻找元宇宙那扇华丽的大门时,vivo 选择先为用户的回忆,造一个足够温暖舒适的家。功夫到位了,满足最朴素的需求,或许就是最强的杀招。

10 岁的钉钉,想用「更主动」的 AI,重构工作本身

如果,陈航(无招)一直执掌钉钉,现在的钉钉会是什么样?

有些问题,可能注定没有答案。

回归钉钉 4 个月后,无招给出了自己的答案。

2025 年 8 月 25 日,钉钉 8.0 暨钉钉 AI1.0 版本的发布会上,无招以 CEO 的身份,时隔几年后,重新站在了新版钉钉的舞台上。

无招回归钉钉后,首次站在大舞台上和大家见面|图片来源:钉钉

发布会上,陈航一口气介绍了钉钉 One、企业 AI 搜索引擎「AI 搜问」、AI 表格、AI 听记、智能硬件 DingTalk A1 等超过 10 款 AI 产品。陈航的语速和 PPT 翻页速度是如此之快,你甚至能感到,这位钉钉的创始人,似乎在担心钉钉在 AI 时代被落下,「一揽子式」的全新 AI 产品,也在诉说着团队生产力和创造力的一次「宣泄」。

当产品的功能革新与创始人的回归交织在一起,我们看到的,不仅是一个软件的版本迭代,更像是一次深刻的战略宣言。钉钉 8.0,以及它所代表的「AI 1.0 应用」,正试图回答一个核心问题:在喧嚣的 AI 时代,我们究竟需要一个什么样的工具来辅助工作?

钉钉的答案,似乎是两个字——「具体」。

 

更聪明、更主动的 AI 小秘

钉钉 8.0 的核心,无疑是其全面 AI 化的决心。但它的实现方式,并非粗暴地在每个功能旁加上一个「AI」按钮,而是尝试将 AI 能力如水银泻地般融入已有的工作流中,塑造一个更懂用户、也更主动的 AI 助理。这个助理由几个关键部分构成,它们各自独立,又互为支撑。

钉钉 One:信息过载时代的「个人事务官」

「钉钉 One」是这次 AI 功能矩阵中最引人注目的部分。从定位上看,它不像是一个单一的聊天机器人,而更像一个集成式的「个人事务官」或「数字中枢」。在现代工作中,最大的挑战之一是信息过载与应用孤岛。我们的沟通在 IM 工具里,文档在云盘里,日程在日历里,任务在待办清单里。在不同应用间来回切换,耗费了大量精力。

 

钉钉 One 是一个更聪明的 AI 助理|图片来源:钉钉

钉钉 One 试图解决的就是这个问题。根据发布会展示,它可以聚合来自聊天、文档、日历、邮件等多个应用的信息,并基于用户的指令进行主动处理。例如,用户可以对它说:「帮我预约明天下午和市场部的会议,讨论第三季度复盘,把相关的文档发给他们,并生成会议纪要模板。」在理想状态下,钉钉 One 会自动解析指令,查询相关人员的空闲时间,创建日程,从知识库中找到相关文档,并附在会议邀请中。

这种「主动性」是其核心。它不再是被动等待指令的工具,而是能够理解复杂意图、跨应用执行任务的助理。这背后需要强大的自然语言处理能力和对用户工作上下文的深度理解。当然,从演示到大规模的可靠应用,还有很长的路要走,其真正的价值,需要用户在真实、复杂的工作场景中进行检验。

AI搜问:从「寻找」到「解答」的进化

搜索功能是所有办公软件的标配,但传统的搜索大多停留在「关键词匹配」和「文档定位」的层面。用户输入关键词,系统返回一堆可能相关的文件列表,用户需要逐个打开、阅读、筛选,才能找到自己需要的信息。

钉钉的「AI 搜问」则希望将这一过程从「寻找」升级为「解答」。它的核心逻辑是,用户需要的往往不是文档本身,而是文档里的那个「答案」。当用户提问「公司今年的差旅报销标准是什么?」,AI 搜问不应只返回《员工手册》或《财务制度》这两个文件,而应直接从这些文件中提取、整合信息,给出清晰的答案:「市内交通实报实销,长途差旅飞机经济舱标准,酒店住宿标准为一线城市 XXX 元/晚...」。

更进一步,它还能处理更复杂的、需要整合信息的提问,例如「总结一下『飞龙项目』上周的所有进展和风险点」。这时,AI 需要检索相关的聊天记录、会议纪要、项目文档,然后进行归纳总结,形成一份结构化的报告。这标志着搜索工具正在从一个「图书管理员」,向一个能读懂书籍并回答问题的「领域专家」转变。

钉钉AI表格:让数据分析回归业务本质

Excel 或在线表格是办公室的「三大件」之一,功能强大,但其复杂的公式、函数和数据透视表功能,也让许多非专业用户望而却步。数据分析的门槛,往往不在于业务理解,而在于工具操作。

「钉钉 AI 表格」的出现,正是为了拆掉这堵墙。用户不再需要学习 VLOOKUP、SUMIF 等函数,而是可以直接用自然语言下达指令。例如,面对一张销售流水表,用户可以说:「按销售区域统计每个季度的销售总额,并用柱状图展示出来」,或者「筛选出所有利润率为负的交易,并标红」。

AI 表格会将这些自然语言指令翻译成对应的表格操作,自动完成计算、筛选和可视化。这使得数据分析的能力不再是少数「表哥」、「表姐」的专利,而是可以赋能给每一位需要与数据打交道的业务人员。当工具的复杂度降低,人们就可以将更多精力投入到数据背后的业务洞察上,这或许是该功能最深远的价值。

钉钉 A1 是之后一系列硬件中首个亮相的产品|图片来源:钉钉

A1 硬件:连接数字世界与物理空间的AI触点

在所有软件功能之外,钉钉还发布了 A1 硬件。在软件定义一切的时代,发布一款硬件似乎有些「复古」。但仔细思考,这恰恰是钉钉 AI 战略「具体化」的体现。

工作,终究是发生在物理世界中的

A1 硬件的定位,是 AI 数字工具和物理生活世界的连接器。虽然发布会未透露其具体形态和功能细节,但我们可以合理推测,它可能是一个集成了麦克风阵列、摄像头和 AI 处理单元的桌面或会议室设备。它可以实现会议场景的实时语音转文字、自动生成会议纪要、识别发言人、翻译等功能,将线下会议的内容无缝同步到线上。它也可能成为一个物理形态的「钉钉 One」,用户可以通过语音直接与之交互,安排工作、查询信息。

硬件的存在,让 AI 不再仅仅是屏幕里的几行代码,而是一个看得见、摸得着的实体。它为混合办公、线下协作等场景提供了 AI 落地的物理触点,让钉钉的 AI 版图从线上延伸到了线下。

无招回归,更「具体」的钉钉

在发布会上介绍专门给创业团队打造的钉钉功能时,无招用几句话简单回顾了自己的两段创业历程:钉钉是「富二代」,团队什么都不用管,只要做产品就好;「两氢一氧」(HHO)算是真正的创业,为省成本连开空调都要严格控制时机。

可能恰恰是离开钉钉的经历,让陈航此次回归,更让「具体」成为团队的一个核心要素。例如,回来的 4 个月时间,陈航就让团队调研、复盘、研究客户提出的反馈,从设计、使用和功能等各个方面,对于钉钉应用进行更新迭代。

陈航甚至在发布会尾声给出了一个 One More Thing——神秘产品!|图片来源:极客公园

通过发布会,我们能看出,对于陈航和钉钉团队来说,「AI 重构工作」这样的战略,不会飘在空中,不会为了 AI 而 AI。相反,它会将 AI 技术作为一种新的「解题工具」,去解决那些过去难以解决的、更深层次的「具体」工作问题。

钉钉 One 解决的是信息协同的具体问题;AI 搜问解决的是信息获取效率的具体问题;AI 表格解决的是数据处理门槛的具体问题。每一个 AI 功能,都对应着一个明确的、在办公室里每天都在发生的场景。这正是陈航「具体」哲学的延续。在「AI 时代的工作方式」这个大框架下,他的回归,让钉钉的思考和行动,有了一个更坚实的锚点。

在发布会上,陈航介绍钉钉的一个新的功能「Zen」,该功能下,钉钉应用中会出现大海、高山等适用于冥想和放松的画面,而这些画面,都来自钉钉团队的同学之手。陈航也有意无意地回击了一下最近网络上关于钉钉工作时长的热议:「你看,我们钉钉生活也不是只有工作,我们也有精彩生活的。」

 

向下、发散

钉钉 8.0 版本的主题是「蕨」|图片来源:极客公园

本次钉钉 8.0 发布会,和以往的版本一样,选择了植物作为主题。这次的主题则是「蕨」。

蕨类,是地球上最古老的植物之一,历经数亿年演化至今。它不似花朵那般艳丽,也不像大树那般引人注目。它总是安静地生长在林下,盘根错节,缓慢而坚定地舒展着自己的叶片。

这个比喻,精准地概括了钉钉 8.0 所传递出的气质和战略意图。

向下扎根:在 AI 技术看似无所不能的今天,钉钉选择将目光放低,去关注那些最基础、最根本的工作需求。就像蕨类植物的根系,深植于土壤,汲取养分。钉钉的 AI,不是要创造一个脱离现实的「数字乌托邦」,而是要扎根于真实的工作流,解决泥土里的问题。

缓慢展开:AI 对工作的重构,不会是一场一蹴而就的革命,而更像是一次漫长的演化。钉钉用「蕨」的舒展过程,来比喻「AI 重构工作」的进程。这其中透露出一种清醒和耐心——不急于求成,不追求短期效应,而是准备好用足够的时间,让 AI 技术与工作场景进行深度、有机的融合,让用户在潜移默化中接受并习惯这种新的工作方式。

钉钉 8.0,既是其 AI 1.0 应用的正式发布,也是一次深刻的自我审视与战略回归。在创始人陈航「具体」哲学的指引下,在「蕨」类植物「向下扎根、缓慢展开」的意象中,钉钉为自己在 AI 时代的狂奔中,找到了一个冷静而笃定的节奏。

这条路或许不那么光鲜亮丽,但可能,会走得更远、更稳。

一年 20 万台出货,AI玩具公司 Haivivi 刚拿了 2 亿新融资,我们和创始人聊了聊

 

作者|苏子华

编辑|靖宇

 

刚刚,AI 玩具公司跃然创新(Haivivi)宣布完成 2 亿元 A 轮系列融资,中金资本旗下基金、红杉中国、华山资本、愉悦资本、招银国际、Brizan Ventures 等一线投资机构共同参投。

Haivivi 在过去一年时间里,出货量超过 20 万台(去除了退货量),成为全球出货最多的 AI 玩具公司。同时,他们也成为了这个赛道里,被一线投资机构押注最多的公司。

然而,Haivivi 创始人李勇对极客公园坦言,实际过程并不如听起来这么顺利,Haivivi 的资金曾一度紧张到差点关门清算。

在他们的第一代产品 BubblePal 上市前,公司已经在清算边缘。最终,在产品设计的极限取舍当中,销量「意外」爆发,公司起死回生。

回到 2024 年 6 月,他们将大模型引入玩具领域,率先推出了全球首款 AI 玩具 BubblePal。该产品支持角色扮演、多语言对话、AI 故事共创、长期记忆等一系列功能,还原了数十个经典 IP 角色。

Haivivi 第一代产品 BubblePal,以挂坠的形式挂在毛绒玩具上,按压进行对话|图片来源:Haivivi

 

后来,市面上开始出现大量的相似产品。

产品发布后,一些科技互联网从业者、投资机构不免会质疑 AI 玩具「硬件没壁垒」、「为什么需要 IP」、陪伴是否为伪命题。

李勇曾是天猫精灵合伙人,主导了天猫精灵从 0 到 3000 万销量的增长。李勇觉得,很多注重「情绪价值」的 AI 产品,无法用「硬件壁垒」「技术壁垒」等传统标准衡量。经过过去一段时间的摸索,Haivivi 已经逐渐形成了自己的 AI 玩具方法论,并即将推出旗下第二代 AI 玩具产品——CocoMate 系列,全球首款搭载端到端语音模型的 AI 玩具。

新产品采用可嵌入玩偶本体且支持拆卸的形态,同时,也是支持远程唤醒,以及主题卡游戏、聊天室等多种模式。

借此契机,8 月初,极客公园在 Haivivi 北京办公室与李勇做了一次访谈,他坦诚分享了团队在提供情绪价值、打造有生命感的 AI 伙伴、与顶级 IP 共创,以及面对商业的残酷现实,如何做取舍的实践和思考。问题涵盖了:

  • AI 玩具公司存活下来的关键是什么?

  • 儿童与成人对 AI 陪伴的需求差异,产品如何在不同人群中找到切入口?

  • AI 玩具是否有必要会说话?

  • 为成年人提供情绪价值的关键是什么?

  • 如何赋予 AI 玩具「生命感」?

  • 如何衡量 AI 玩具所提供的「陪伴感」和「情绪价值」?

  • 大厂会如何入局「AI 陪伴」赛道?

  • AI 玩具赛道下一个增长点在哪?

访谈中提到的部分精彩观点:

  • 如果相信 AGI 时代会到来,就会相信未来每个人都需要一个 AI 朋友。

  • 过去的 AI 玩具,所有输入都来自用户,这不符合朋友的定义;「AI 朋友」需要能够在没有和人类交互式时,自主学习和成长。

  • 现实中的朋友不会记住你所有事情,人类大脑有遗忘机制,AI 朋友也需要学会选择性遗忘;AI 玩具产品,所有功能、算法的取舍,都必须服务于「生命感」这一核心

  • 很多人说 AI 玩具「没有技术壁垒」,但情绪价值本身就是壁垒。

  • AI 陪伴产品为成年人提供情绪价值的关键是控制预期。

  • 有用户表示,孩子因为佩奇的劝说而乖乖喝水,这样的反馈比销量更重要。

  • 如果端侧 AI 玩具能实现无需联网,且零售价控制在 1000 元以内,将成为全球市场的巨大机会。

以下为对话内容,经极客公园编辑整理:

Haivivi 的第二代 AI 玩具产品——CocoMate 系列,奥特曼联名产品|图片来源:Haivivi

 

01 在差点清算的边缘,最后一搏

极客公园:新的融资进来,对你们意味着什么?

李勇:我们公司在产品上市并取得两个月销量之前,资金一直非常紧张——不管是我个人给公司垫钱,还是后来从银行贷款。去年融资环境差,投资人对 AI 玩具赛道很谨慎。

对我们而言,有了这笔资金,就能推进 2023 年就规划的事了。Haivivi 品牌从 2023 年成立,当时我们对 AI 玩具的规划有很多,但受限于资金和资源,很多想法没能落地。

今年就能从容地推进布局了,尤其是到今年 Q4,我们的产品矩阵、全渠道布局以及 IP 合作布局都会比较完整。

极客公园:你之前是天猫精灵合伙人,团队背景也不错,按理说融资应该更顺利?

李勇:并不是,我们公司注册至今已经 4 年,前两年创业的时候还没有大模型,当时也想做 AI 玩具,只能用上一代 AI 技术和玩具做融合,所以产品的用户体验不够好,走了些弯路。

直到 2023 年初大模型出现,我们才确定做 BubblePal 这款产品。但当时融资环境紧张,很多机构都很谨慎,大家都要求有实际产品、验证 PMF(Product-Market Fit)。

之所以能拿到高秉强(「中国芯片之父」香港科技大学高秉强教授)老师的投资,是因为他以个人名义给了我们第一笔钱,大概 100 万美金,我们才有资金投入研发。

到 2024 年 8 月产品真正上市时,高老师的这轮天使轮的钱已经基本花完了,研发太烧钱了。就像我刚才说的,后来我们还从银行贷款、我个人垫钱,那段时间资金一直很紧张,发工资都困难。

极客公园:你们是第一批做 AI 玩具的团队,过去一年来,最常听到的评价是什么?

李勇:最痛苦的是产品发售前后,听到的更多是质疑。没人看好这个赛道:硬件从业者觉得「已做烂」,他们经历过故事机、儿童手表、耳机、手机的红海时代,认为 AI 玩具硬件方案成熟(第一代产品方案与当年天猫精灵无本质区别),无创新空间;AI 从业者也不看好,认为「只是搭载大模型,不如 ChatGPT 智能,情商、智商有限」。

但我们更看重长远——如果相信 AGI 时代会到来,就会相信,未来无论孩子还是成年人,都需要有 AI 能力的陪伴载体。AI 能力持续提升后,人们会需要现实中的「AI 朋友」,形态可能是毛绒玩具、机器人等各种样子。

因为 AI 的发展不仅体现在「智商」层面,还涉及「情商」领域。所以我们坚定看好这个赛道。不过当时我们也不确定自身能否脱颖而出,公司能否坚持到行业爆发的那一天。短期来看,很多人对该领域持悲观态度。

正如我刚才提到的,2023 年初公司险些清算,当时钱已经不够了。我个人还有一些积蓄,当时我们团队有十几个人,我就和大家说,我可以用个人资金为大家发放 N+1 补偿金——那时公司刚成立约一年。

但如果大家认为,ChatGPT 的出现会给我们计划研发的 AI 玩具带来新机遇,那我们就再坚持 6 个月,看看能否成功融资。若能融到资,我们就继续推进项目;若融不到,届时我可能连 N+1 补偿金都无法承担了,因为我个人的现金储备也十分有限。

让我欣慰的是,这十几人的核心团队最终都选择了坚持。团队成员对我们所做的事是坚信不疑的。但当时融资确实异常艰难,和合作伙伴的合作也多是「刷脸」——因为我们没钱让他们帮忙制作 Demo,好在我之前在硬件领域深耕多年,有一些合作伙伴愿意帮忙提供 Demo 样品。

极客公园:你们现在融资和之前有什么变化?

李勇:到了去年第四季度,我们的产品量产,在市场上有了数据表现后,融资就相对容易了。投资人能看到用户在小红书、抖音的评论和视频,通过访谈、尽调也能了解真实反馈,销量也一直在涨。

而且,春节后 DeepSeek 火了,给用户做了一波市场教育,很多宝妈由此了解 AI 玩具,甚至认为「带 DeepSeek 的玩具就是 AI 玩具」,我们也算赶上了这波趋势。

不过也有一些投资人始终持怀疑态度,他们认为我们的产品缺乏核心技术壁垒——毕竟当时泡泡玛特还没有现在这么火爆。那时我们就一直在提 Jellycat 和泡泡玛特的模式,只是大家对「情绪价值+AI」的组合仍有疑虑。

极客公园:DeepSeek 那波热度给你们带来了多少新增销量?

李勇:从营销层面看,它主要起到了用户教育的作用。科技行业内可能没这种感受,但普通用户对 AI 的认知仍有限——2017 年天猫精灵量产时,那波智能硬件的用户体验还比较勉强,包括天猫精灵、小度、小爱等智能音箱的活跃与留存率都低。

因此,我们推广 AI 玩具时,本来需大量市场教育。而 DeepSeek 的热度,一方面让部分用户建立了对 AI 的信心;另一方面,也消除了部分用户对生成式 AI 的恐惧,比如担心它教坏孩子,毕竟内容可控性存疑。但 DeepSeek 已上升到国家战略层面,用户对 AI 的恐惧会因此减轻。如果仅靠我们这样的创业公司去宣传,说「用了开源技术、做了内容审核」,力度远不如国家层面的重视。具体到销量,今年 3 月销量较之前增长了 2-3 倍,这也让我们很开心。

极客公园:第一代产品卖了 20 多万台,这在预期之内吗?

李勇:不在。我们最初认为能卖几千台,最多 1-2 万台。第一代产品做了很多取舍,并非我们最初设想的样子,核心是为了测试 PMF、收集用户反馈,最初备货也只备了 2000 台。

但实际反馈很好,我们后来反思,这可能是「知识陷阱」——我们从 2022 年底接触大模型,到 2024 年 8 月产品上市,已习惯大模型的连续对话、角色扮演功能;但用户此前从未接触过能角色扮演、连续对话、有长期记忆的 AI 玩具,他们对比的仍是传统故事机、小天才儿童手表、小度/小爱智能音箱。有大模型的 AI 玩具与几年前的智能硬件相比,体验上确实有革命性提升。

极客公园:打磨 AI 玩具产品,资金主要花在哪些方面?

李勇:最多的是研发,团队研发成本开销占比最大;其次是 IP 合作费用,我们已签约不少知名 IP;此外还有渠道建设、日常运营管理的费用。

极客公园:网上说 AI 玩具退货率高的问题,你怎么看?

李勇:前段时间我们实际销量已超 25 万台,但我们对外宣传改为 20 万台,我们去掉了退货量,更坦诚地公布实际销量。第一代产品早期退货率超 30%,目前综合退货率仍有 20% 多

这其实是创新品类的普遍现象。玩具品类本身存在「吃灰」问题,活跃与留存率低,且购买者(家长)与使用者(孩子)分离,这些都会导致退货;此外,AI 玩具零售价普遍高于普通玩具——泡泡玛特等品牌的盲盒、积木等产品,原价多在 100 元左右,而我们第一代产品定价 399 元,在玩具品类中偏高,这也是退货原因之一。

当然也有用户体验因素。新品牌前两三个月退货率会更高,呈现两极分化:喜欢的用户认可度很高,不喜欢的用户觉得远超预期落差,认为宣传夸大。

我之前做过 VR 眼镜,AR/VR 行业(包括苹果、Meta 的产品)退货率也很高,这是新品类的两难困境——为了营销和市场教育,需要展示功能卖点,但用户期望随之升高,购买后容易因为落差退货。

因此,我们在产品定义上相对克制,营销时刻意将目标人群限定在 3-6 岁儿童,从未宣传任何教育功能。现在有些 AI 玩具从业者宣传「教育内容丰富」,不用猜也知道他们的退货率一定高。

如果宣传「教拼音、练口语」,虽能促进购买决策,却容易因大模型幻觉等体验落差退货。

我们的 slogan 是「回应每一个奇思妙想」,但其实很难用一句话总结第一代产品卖点——「陪伴」、「情绪价值」需用户实际使用才能感知到,我们选了一条更慢的路径。

02「哪些决定忍住没做,现在看来是正确的?」

极客公园:如今回过头看,是否存在一个当时你忍住没做的决定,现在看来是正确的?

李勇:之前负责天猫精灵营销工作时,我的老板需要向逍遥子汇报工作,做天猫精灵一年来的年终总结汇报。我看到给逍遥子的汇报模板,除了阐述年内完成的工作复盘,还有一页要求列出没做的事项以及为什么没做。看到这一页时,我很震惊,它其实和你的问题本质相同,就是取舍。

无论是创业者,还是团队管理者,我们常会复盘这段时间做了哪些决定、哪些正确、哪些错误,但很少思考「哪些决定没做」——这些未做的决定中,是否存在本应做的正确选择,或是庆幸没做的错误选择?

去年年底团队复盘时,我也向团队提出了这个问题。我认为这个问题极具价值,当时我们发现,很多未做的选择,如今看来是正确的。

比如,最初我们本想开发一款完整的毛绒玩具,还计划采用远厂语音交互技术,这些在当时都是成熟的技术,但现在看来,幸亏没做。

一方面,与 IP 方合作的监修审核时间远超预期。以头部 IP 奥特曼为例,最初我们预计产品能在 618 前上市,但与 IP 方沟通后发现,他们对 IP 的理解更深,在共创产品过程中,IP 方提出了许多优质想法,这延长了合作周期。

另一方面,顶级 IP 对产品细节的把控细致程度远超想象——每一份营销物料、每一张宣传海报的发布,甚至产品材质的每一处细节,都需要与 IP 方深入沟通确认。

如果创业初期我没有认清这一现实,即便有足够资金推进合作,产品上市周期也会被大幅拉长。对创业公司而言,第一代产品需要做大量取舍,我们在硬件功能、IP 合作等方面都做了调整。

现在想来,很庆幸当时「做减法」做得足够彻底。在产品定义上,我没有过多执念,但这种取舍思维至关重要,尤其是硬件领域,要避免资源浪费。比如硬件设计中的某个功能,无论会增加成本还是制造难度,核心都要判断它能否切实提升用户体验,不能盲目投入。硬件领域的取舍比软件领域更关键。

极客公园:除了这个例子,还有其他「没做反而是正确选择」的情况吗?

李勇:除了 IP 选择和硬件功能取舍,产品定义的细节上也有很多案例。比如最初我们想在产品中加入大量功能,当时我对 AI 技术过于乐观,计划搭载端到端语音模型,还考虑过给产品加摄像头、屏幕,甚至端侧 AI 功能。

但过度乐观往往会忽略实际问题——当时加屏幕、摄像头的 Demo 已经完成,但最终没推进量产,核心是成本与用户体验的平衡还未达标。所以我们调整了产品优先级,目前推出的仍是纯语音交互产品,功能也未追求复杂。

03 AI 玩具是否有必要会说话?

极客公园:对于 AI 陪伴类产品来说,语音对话的交互方式本身是不是就有比较高的使用门槛呢?

李勇:市面上有些 AI 玩具不具备语音功能,也有其价值,适合特定人群和特定 IP,这一点我完全认同。

我们在创业初期选择方向时,就对 AI 玩具进行了大致分类:

第一类是「无语音交互的 AI 宠物」——这类产品模拟猫狗等宠物,本身不具备语音能力,仅通过情绪反馈与用户互动。

第二类就是我们当前专注的方向——将动画片中鲜活的角色还原到现实生活中,陪伴孩子成长。

第三类是偏具身智能的 AI 陪伴机器人——这类产品具备移动能力,能实现更灵活的交互。

我们选择第二类,主要是基于公司的核心禀赋:第一类产品与 AI 技术的关联性较弱,而我们此前有研发天猫精灵等语音交互产品的经验,更擅长第二类产品的研发。而语音交互是否是「好形态」,关键取决于具体应用场景和目标人群。

未来,我们也会推出无语音功能的 AI 玩具,也是在探索不同方向。

如果玩具配备摄像头和屏幕,无疑能提供更丰富的情绪价值——比如通过摄像头捕捉用户的表情,无需用户说话就能感知其喜悦、疲惫或焦虑;通过屏幕更直观地呈现内容。

但目前我们尚未推出这类产品,因为我们对带屏幕、带摄像头的产品有较高要求:如果满分 100 分,只有当模型能力和用户价值能达到 80 分以上时,我们才会推进量产。其实我们已有相关 Demo,但尚未进入量产阶段,因为目前的产品表现还未达到我们的标准。

极客公园:你们在等待大模型能力达到预期后,再推出相应的产品。

李勇:是的,不仅是大模型能力,我们还在开展端侧 AI、多模态以及运动控制的相关预研。一方面等待基座模型公司提升技术能力,另一方面也在与大模型公司、芯片公司等合作伙伴共同开展预研。

只有当产品的用户体验、成本控制和零售价能达到平衡时,我们才会推出。

极客公园:哪些 IP 适合接入语音交互功能,哪些不适合?

李勇:判断标准其实比较明确,如果 IP 在原有作品(如动画片)中已具备完整世界观和鲜明的声音形象,那么从用户视角(尤其是儿童)出发,现实中的对应玩具若无法说话,反而不符合认知逻辑。

过去受技术限制或成本较高,玩具难以实现自然语音交互,如今借助大模型技术,这一问题得以解决,本质上是回归用户对 IP 的自然认知。

04 让 AI 成为成年人的朋友、更有「生命感」的三个关键

极客公园:你之前提过,大模型为成年人提供的情绪价值还不够,所以你们当时选择先做儿童产品。那么,怎么衡量一项技术或产品能提供的情绪价值有多少?

李勇:相较于为成年人研发 AI 玩具,为儿童研发玩具恰好是我们团队的优势领域。我们有服务儿童群体的经验,且关于儿童成长的理论研究和学术论文非常丰富,因此,我们先从儿童产品入手。

儿童没有手机作为对比参照物,而成年人在使用 AI 硬件时,会不自觉地与手机功能对比——这是很多 AI 硬件产品都会面临的问题。

而且,给成年人提供情绪价值要复杂得多,需要考虑他们的工作、感情等多方面生活状态。在 2023 年我们启动项目时,以当时的 AI 能力,很难满足成年人的情绪需求——因为成年人有太多其他渠道可以获取情绪价值,AI 硬件的竞争力不足。

我们为什么认为现在情况有所好转了呢?

一个关键节点是「深度思考模型」的出现。我第一次接触到深度思考模型时,非常震惊——我们完全没预料到大模型会向这个方向发展。

最初行业普遍认为大模型的发展方向是「智商」不断提升、响应速度不断加快。但深度思考模型的出现,我很快反应过来,人既需要快思考,也需要慢思考。对个体而言,大脑本就是两套系统交织运作。我们因研发语音交互类产品,过度关注延迟表现——比如用户与产品对话时,希望快速获得反馈,所以这类指标一度成了我们公司最核心的考核项。

天猫精灵此前也是如此,优先关注延迟,其次才是基座模型的能力、与情商表现。我们忽略了慢思考这一维度,而当意识到深度思考模型的价值时,我们格外兴奋——终于有可能为成年人打造一款具备新价值的 AI 玩具。

过去的 AI 玩具,所有输入都来自用户,这不符合朋友的定义,也导致用户留存率与活跃度偏低。

即便是孩子,使用久了也能发现「玩具只会对我输入的内容做即时反应,而不会自己反思」这一问题。所以 2023 年我们就思考:如果这个「朋友」能自主学习、成长就好了,但与用户交互时又必须即时反馈,这就产生了矛盾。

而有了深度思考能力后,我们可以为 AI 玩具搭载 Agent(智能体):比如在夜间闲置时,Agent 自动启动学习。若用户当天聊到滑雪,它就自主学习滑雪相关知识;第二天用户提及想去日本游玩,它就收集日本旅游信息;到了第三天,当用户说「想去日本滑雪」,它能立刻回应:「我听说这周日本可能有台风,你要小心,是不是下周去更合适?」

如果没有具备深度学习与思考能力的模型,Agent 根本无法实现静默的自我反思、成长,用户永远不会将其视为朋友。

当然,这只是第一步——朋友在非交互时段自主学习成长,是「朋友」属性的基础门槛。

除了模型能力的提升,为成年人提供情绪价值还需「做减法」。

在我们看来,若想让成年人情绪价值体验达到优秀甚至超预期,必须降低用户预期——交互时先锁定、框定用户的期望,期望越低,模型越容易超出预期。

用户看到这个 IP 形象,就应该知道它的核心功能是哪些,不会将其视为全能助手,而是「有限领域的朋友」。

现实中也是如此:如果有一个无所不能的朋友,你不会将其视为平等的朋友,更像「上帝」或「神」;真正的朋友必然有突出的长板,能让你产生情感投射,这样感情才会稳固,绝非全能。

因此,我们在角色设定、产品外形、IP 选择及模型能力上都在「做减法」,通过这些洞察与研究,至少能在成年人某一特定情绪需求领域,输出有效的情绪价值。

极客公园:让 AI 更有生命感的关键还有什么?

李勇:首先,它需要在非交互时段自主学习、成长,通过分析与用户的聊天内容,推测兴趣爱好,积累共同话题——这是基础步骤。

其次,还有价值观对齐。现实中,相处 10 年的朋友,价值观会逐渐靠拢,否则会渐行渐远。

我们希望 AI 朋友也能如此,比如同一型号的赛罗 IP 玩具,出厂时 Prompt 一致,但使用一两年后,Prompt 会随用户兴趣差异发生变化、自主学习,实现价值观对齐。

此外,更复杂的是「遗忘机制」。第一代产品的核心难题是「长期记忆」——如何存储聊天记录,当时向量数据库技术不成熟,我们投入大量精力研发向量数据库、RAG(检索增强生成)等技术。

而如今为成年人提供情绪价值,「遗忘」同样关键:现实中的朋友不会记住你所有事情,人类记忆有主动遗忘与被动遗忘——被动遗忘是因时间流逝自然淡忘,主动遗忘是刻意忽略某些内容。

比如,若 AI 能记住用户每句话,当用户否认「说过某件事」时,AI 若反驳「你在几点几分说过,我有记录」,会让用户极度反感。

参考心理学理论,比如「彼得斯原则(Peter's Principle)」,认为主动遗忘与三个因素相关:时间长短、提及频率、记忆当时的情感浓度——情感浓度如同「染色剂」,决定记忆是否深刻。我们当前用模型识别对话的情感浓度,作为遗忘权重,但这仍不够。

若仅按「情感浓度+提及频率」设计遗忘算法,若用户频繁吐槽负面内容,AI 会持续提取负面记忆并回复,导致用户陷入负面循环。

因此,研究传统遗忘理论(我们查阅了大量相关论文)仍然不够,还需研发「跳出机制」:让 AI 主动唤起用户的积极记忆,帮助用户脱离负面情绪。这就是我们近一年在算法层面,为成年人 AI 玩具打造「生命感」的探索方向。

05 先共情,站在用户角度表达理解——才是情绪价值产品的核心

极客公园:在近期产品开发中,有没有某个时刻或某组数据(哪怕很小),让你们觉得「方向走对了」?

李勇:很多是来自用户反馈的瞬间。

比如,有用户分享短视频:孩子生病后不爱喝水,家长劝说无效,于是在我们的玩具中输入「鼓励多喝水」的 Prompt。当孩子与佩奇玩具互动时,佩奇说「我们一起玩,但你要先喝完水」,孩子立刻就把水喝了。

还有一次,在我们抖音直播间,有用户让主播演示:「问 AI『妈妈不要我了,怎么办』」,AI 玩具回答:「妈妈不是不要你,她可能是上班忙,回来后你多和她聊聊,多安慰她」,接着用户又让我们主播问 AI 玩具:「妈妈不是上班忙,是跟别的男人走了,不要我了」,AI 回复:「首先你没做错任何事,大人们有自己的考量,即使爸爸妈妈不在一起,他们依然爱你」。

没想到这位用户说,她是一个继母,因为孩子常问她「为什么亲妈不要她了」,她不知道怎么回答,AI 玩具的回复正好解决了她的困扰。类似的用户反馈,让我们确信「方向走对了」。

极客公园:同样的问题,如果直接问 DeepSeek 等通用大模型,可能会得到不同答案。

李勇:通用大模型的回答往往更「标准化」。

比如用户问「在学校被欺负了怎么办」,通用大模型可能会说「找学校管理层沟通」,这类回答追求「最大公约数」——因其用户群体广泛,需兼顾普遍性。

如果用「回答内容(主观/客观)」与「表达方式(冷静/情绪化)」构建坐标系,多数通用大模型的回复处于「客观+冷静」的第一象限。

而情绪价值类产品的回复,需在「内容上更主观、表达上更情绪化」。比如,用户说「玩具在学校被抢了」,朋友不会先罗列「1234 条解决方案」,而是先共情,站在用户角度表达理解——这才是情绪价值产品的核心。

极客公园:如何让模型回答更具共情力?

李勇:我们在语料选择和模型微调上有差异。比如与 IP 方合作时,需依据 IP 世界观对模型进行微调。我们的模型微调采用大量对话式语料,表现更具主观性和情绪化,能基于角色世界观作答。

比如,向小猪佩奇与爱莎公主提问「量子纠缠」的问题,得到的答案不同——AI 玩具不会照搬百科内容,而是结合自身角色设定回应。

佩奇会举例:「就像我和弟弟乔治玩捉迷藏,虽然看不见对方,但我们彼此心有灵犀。」

爱莎公主则会以自身角色视角解释:「这很神奇,如同我在魔法世界里有两个冰雪魔法球,转动其中一个,另一个的状态就会受到影响。」

所有角色均会依据自身世界观回答,让用户感觉是与自己喜欢的朋友共同面对问题。

06 关于新一代 AI 玩具和大厂竞争

极客公园:你们刚发布了新一代 AI 玩具,为什么选择与奥特曼 IP 合作呢?

李勇:我们已经签约了多家 IP 方,综合考虑了其全球影响力、在中国市场的受欢迎程度,以及双方合作的意愿和配合程度——这些因素让奥特曼成为了推进速度最快的合作项目,所以我们首款产品选择与奥特曼 IP 合作发售。

极客公园:这款产品的目标人群还是 3-6 岁的儿童吗?

李勇:目标人群稍有扩充,因为很多小学生也非常喜欢奥特曼,所以年龄范围可能扩展到 10 岁,甚至 12 岁。

极客公园:软件功能层面,新产品会增加哪些能力?

李勇:新增功能很多,最显著的是采用了端到端语音模型。

第一代产品采用的仍是传统的「语音识别(ASR)到语音合成(TTS)」技术链路,而新产品采用的是「语音到语音」模型,实现了语音输入直接对应语音输出。首款合作的是字节跳动的模型,目前其表现最佳、响应速度最快。

当然,与其他公司的合作也在推进中。简单来说,新产品的语音输入能保留情绪——传统的「语音转文字」过程中,情绪信息会丢失,而新模型解决了这一问题。情绪信息的保留能让我们实现更多功能,比如当我说「今天心情不好」时,产品能更准确识别用户的情绪,因此回应语气能传递出更准确、更充沛的情感。其次,新产品的交互延迟也大幅降低。

极客公园:你们第一代产品仍需要按下按键才能进行语音交互,而第二代新产品已经支持远程唤醒了,主要是克服了哪些技术问题?

李勇:这并不是技术问题,更多是产品设计上的取舍。

在研发第一代产品时,我们就已预判到两个可能成为核心问题的点,后来的市场反馈也证明,这两点确实是用户对第一代产品的主要差评——一个问题是「按键说话」:有些孩子手比较小,按压说话时会感到不便;第二个问题是联网限制,第一代产品仅支持 2.4GHz 单频 WiFi 联网,这导致产品在户外很难使用。

这两个差评其实是我们在定义第一代产品时就已经预料到的「不得已的取舍」。

2017 年,我参与研发的首款量产天猫精灵就已实现远程交互,所以远程唤醒本身并非技术难题。但要实现远程唤醒,对硬件配置有更高要求——比如麦克风数量,尤其对功耗控制的要求更为严格。天猫精灵是插电使用的设备,无需考虑功耗问题;但我们的产品体积较小,如果为了容纳更大电池而增大体积,会带来新的问题:一是无法适配多数玩偶的尺寸,二是孩子也难以握持。

同时,我们对产品续航有明确要求——不希望用户每天充电,不希望给用户增加额外使用负担,因此在第一代产品中没有加入远程唤醒功能。

而 WiFi 问题同理:若要支持双频 WiFi 或内置 4G SIM 卡,会大幅增加成本和研发周期。当时公司账户已经没钱了,我们甚至需要借钱维持运营,根本无法承担这些额外投入。

不过第二代产品已解决这些问题:我们内置了一张 4G SIM 卡,用户开机即可使用,无需下载 APP 配置网络,开机直接就能与奥特曼聊天。

极客公园:有什么新功能是只依赖大模型没有办法解决的?

李勇:目前市面上几乎所有 AI 玩具的连续对话功能都存在一个共性问题:当孩子正在听故事或听歌时,外界稍有声音干扰,播放就会被打断。比如,孩子正听到故事关键处,妈妈突然说「过来吃饭了」,或者出现走路声等,都会导致播放中断。

如果只是简单对接一个通用大模型,就只能接受这种中断问题。

所以,我们在新版本的技术架构上做了「多音轨混音处理」,这在工程实现上较为复杂。简单来说,希望实现的效果是:当孩子正在听「孙悟空三打白骨精」的故事,过程中突然提问「唐僧这时候在哪里?」——此时,我们产品会降低故事音轨的音量,开启另一条音轨优先回答孩子的问题,故事本身不会中断;待问题回答完毕后,再将故事音轨的音量恢复。

想实现这一功能,必须支持多音轨传输,而单纯使用云厂商提供的标准大模型方案是无法做到的,需要进行大量工程优化。

其实,「连续对话+抗干扰」的功能构想,我们在 2023 年研发第一代产品时就已想到,只是当时考虑综合交互体验、成本和研发周期,只能退而求其次采用「按键说话」模式。这就是产品功能迭代中常见的取舍。

极客公园:未来新品仍旧是毛绒玩具,还是会推出非毛绒玩具类产品?

李勇:我们会推出非毛绒玩具。公司定位是 AI 玩具公司,业务不局限于儿童领域,也不被毛绒材质束缚。

比如,我们签约的知名 IP 授权均属于 AI 玩具类目,对玩具材质和形态无限制,只要适合以 AI 形式呈现且能提供情绪陪伴价值,都在我们的考虑范围内。

IP 布局采取「两条腿走路」:一方面通过与知名 IP 联名弥补自身短板,并向泡泡玛特等优秀 IP 团队学习;另一方面自主孵化 IP,我们新上市的三款产品中,两款为奥特曼 IP,一款由我们签约的全职设计师(原合作艺术家)设计开发。

CocoMate 系列 AI 玩具之一「泡泡」|图片来源:Haivivi

极客公园:有观点认为大厂不会涉足 AI 陪伴赛道,因它属于情绪价值生意,但近期 OpenAI 也在布局 AI 陪伴硬件,你如何看待大厂进入该领域?

李勇:我认为大厂可能会布局广义上的 AI 陪伴硬件(如家庭机器人,可陪伴家庭成员),但不会涉足「AI+IP」玩具领域。

原因有二:一是大厂有更重要的战略级、入口级业务布局,如 AI 眼镜、自动驾驶等更大规模的市场,相比之下,「AI+IP」玩具的优先级较低;二是情绪价值赛道不确定性高,难以规模化复制。

大厂擅长从 1 到 100,但情绪价值相关指标(如玩具的「生命感」)难以量化,若调动集团资源投入,KPI、成果考核等都很难设定,最多仅会安排小团队试错。

而小团队试错对我们构不成威胁,我们更关注大厂是否会投入战略资源。IP 本身的爆火具有随机性,即使是泡泡玛特、迪士尼,也无法精准预测或流水线式复制爆款 IP,这种高不确定性使「AI+IP」玩具不适合大厂布局。

极客公园:接下来半年,你最期待发生的一件事是什么?

李勇:最期待端侧模型的技术突破。

我们一直在探索:如果端侧 AI 玩具能实现无需联网,且零售价控制在 1000 元人民币以内,将具有极大市场潜力,尤其在海外市场——无需联网可解决隐私和延迟问题。

目前受成本限制(内存、CPU、电池功耗较高),这一目标尚未实现。如果未来半年至一年内,能有优秀模型量化至 1.5B 参数,同时保证足够的智商、情商与推理能力,至少满足儿童陪伴需求,我们将非常期待。

另外,对于有隐私需求的成年人而言,端侧 AI 玩具如同「树洞」,可以让用户更安心地分享情绪。

我们也希望成为全球首个推出端侧 AI 玩具的团队。

 

扎克伯格,也顶不住了

在今年的 AI 竞赛中,Meta 可以说是那个突然把油门踩到底,疯狂想赶超对手的玩家:招人猛、给钱狠、组织结构三番五次推倒重来。

直到今年 8 月中旬,Meta 这家巨头又突然刹车,AI 部门「冻结招聘」。不仅暂停对外扩编,连内部 AI 人员也被明令不得随意在团队间流动,除非得到批准

Meta 官方口径叫「基础性的组织规划」,语气轻描淡写:预算季结束,先把「超级智能实验室」新的组织架构定型,再谈下一步。

究其原因,在资本市场,华尔街分析师已经就科技巨头的 AI 支出发起警告

过去数月,Meta 为抢人开出的薪酬与股权包一路飙升,投资者开始追问:这些天价换来的,是可验证的技术进展,还是无止尽的摊薄与成本扩张?

与此同时,业内不少人也在质疑,Meta 高薪挖来各种顶尖 AI 人才,是否会加剧内斗,比如一些老员工对新来的「明星科学家」并不买账,此前 Meta 不同 AI 团队间曾因计算资源分配、技术路线理念不和频起摩擦,部分员工被边缘化导致士气低落,有的员工甚至选择离职创业等等。

当下,Meta 的 AI 人才争夺战,已经打到了临界点,无论是华尔街还是硅谷,都在盯着 Meta,是否真能靠这些人拿出成果。

01

Meta AI 大换血

2025 年上半年,Meta 在 AI 人才战里的打法可以用三个字概括:快、狠、贵。

无论是 OpenAI,还是谷歌 DeepMind、Anthropic、苹果的 AI 人才,被 Meta 接触时有时不是「猎头-HR-面试」的传统流程,而是扎克伯格本人直接通过邮件或 WhatsApp 发消息,直接走 CEO 的绿色通道,快速签约

在 Meta 这儿,天价薪酬「大包」也是见怪不怪,签约金以亿美元计,一些 AI 研究人员获得四年 3 亿美元的超级薪酬包,个别顶级人选的天花板级报价据传高达 15 亿美元,均堪比职业球星。而且,这些被挖角的人里,有不少都是华人面孔。

扎克伯克与 Alexandr Wang、Shengjia Zhao|图片来源:Meta

除了传统招聘,Meta 还采用「反向收购式挖人(reverse acquihire)」方法:与传统 acquihire 的整合式收购不同,不是直接收购整个初创公司,而是直接挖走核心关键人才,初创公司继续存在但可能萎缩。

Meta 为 引入 Scale AI 联合创始人 Alexandr Wang 担任首席 AI 官,付出了约 140 亿美元的少数股权投资。除此之外,Meta 还通过向由 Nat Friedman 与 Daniel Gross 主理的基金注资,把这两人纳入麾下,前者曾任 GitHub CEO,后者曾于 2024 年与 OpenAI 联合创始人 Ilya Sutskever 创办 Safe Superintelligence。

就这样,到 2025 年中,Meta 已经打包吸纳了至少 50 名来自竞争对手的 AI 人才,其中四成来自 OpenAI,两成来自谷歌

业内看得目瞪口呆,OpenAI 的管理层公开吐槽 Meta「疯狂」,形容被 Meta 挖人就像「有人闯入我们家偷了东西一样」。

Alexandr Wang 公布的 Meta 超级智能实验室人才|图片来源:X

然而,一次性疯狂吸纳「新血」也有问题。硅谷不少工程师有一个看法,Meta 疯狂招人相当于一次性把几十位 A 级球员装进同一个更衣室 ,「位置」与「打法」的冲突可能很难避免。

经过半年内的数次重组变化,据华尔街日报消息,Meta 最近决定将不同 AI 业务一并纳入「Meta Superintelligence Labs」,分为四个部门:

面向 AGI 的研究团队(内部暂名 TBD Lab),新员工主要在这个团队工作;

AI 产品团队;

构建训练与推理底座的基础设施团队;

继续承担长期探索任务的 FAIR。

Meta 发言人对外则将冻结招聘解释为「基本的组织规划:在招募人员并进行年度预算和规划工作后,为我们新的超级智能工作创建一个坚实的结构。」

还有消息称,由于 Meta 人工智能部门近年来人员增长至数千人,该巨头正在考虑整体缩减规模。

Meta 过去负责 Llama 系列的大模型团队「AGI Foundations」被解散,有成员打算离职。因为今年春季发布的 Llama 表现不及预期,不仅在内部受到了尖锐批评,在更广泛的社区口碑也趋于平淡。另一款代号 Behemoth 的前沿模型在测试中成绩不理想,被直接砍线。

与此同时,Meta AI 之前的研究负责人 Joelle Pineau 今年早些时候离职加入 Cohere,Llama 项目研究员 Angela Fan 选择转投 OpenAI,Meta 生成式 AI 副总裁 Loredana Crisan 则跳槽到 Figma 出任首席设计官。再加上 8 月部分期权归属窗口期,Meta 可以说迎来了「旧部出走,新人入列」的换血期。

在这个时间点看起来,疯狂招人又突然冻结招聘,对 Meta 来说并不矛盾,在继续加人之前,先得避免内外部越来越大的「噪声」。

02

华尔街的警告

对 Meta 来说,内部「噪声」是团队稳定性,外部「噪声」则是资本市场的压力。

扎克伯格狂撒钱挖人一时爽,最终还是要面对报表。当 Meta 的 AI 投资成本快速上涨,华尔街开始担忧,这些钱,何时、以何种形式回流?

最新一轮的市场反馈并不轻松。今年 8 月,摩根士丹利分析师在研究报告里称,包括 Meta 在内的科技巨头,向 AI 人才发放的股权规模正在膨胀,如果最终成果无法在合理时点转化为可计量的现金流,这种做法将侵蚀回购能力、压缩股东回报。

在他们看来,在挖 AI 人才方面投入巨资「有可能推动 AI 突破,创造巨大的价值,也有可能稀释股东价值,且不会带来任何明显的创新收益 」。

扎克伯格在 Meta Connect 大会上|图片来源:Meta

与此同时,硅谷科技巨头的股价正经历一波「AI 开支焦虑」的集体回调,不是说唱衰 AI,而是对「投入产出比」的担忧,就像投资了几千亿美元,如果最终收入只有几百亿美元,冰冷的市场就不会买账。

2025 年 8 月 20 日前后,一些科技股遭抛售,包括 Meta 在内的公司股价连跌几天。虽说因素不是单一的,但市场关注到几个可能的「罪魁祸首」,包括 OpenAI 首席执行官 Sam Altman 最近的评论,他认为 AI 热潮具有一些类似泡沫的特征。

Meta 自身的数字也说明问题:该巨头把 2025 年资本开支指引上调至最高 720 亿美元,这些花费的核心去向是「AI 基建」以及「人才」。数据中心在建,GPU 在路上,团队在扩编,利润端自然被压。

面对投资者冷冰冰的质疑,Meta 暂时「冻结 AI 人才招聘」的动作,除了真的是为了巩固内部 AI 组织架构,另一方面,也成了向市场发出「控制成本」的信号。

但因冻结 AI 招聘一事引来的各种声音,如今身为 Meta 首席 AI 官的 Alexandr Wang 坚称,「我们确实在加大对 Meta 超级智能实验室的投入。任何与此相反的报道显然是错误的。」

Alexandr Wang 称 Meta 仍在加大超级智能实验室的投入|图片来源:X

扎克伯格豪掷重金挖来这些 AI 人才,赌的是超级智能的未来。至于这个赌注是否能带来实质性成果,是决定 Meta 命运的关键。

如果答案是肯定的,那么眼下的「刹车」将被历史视为战略性的换挡,华尔街的焦虑也将随之平息;反之,若这一年的投入最终换来的是平庸的成绩单,那么冻结招聘可能只会被看作一次无序冲刺后的力竭,暴露出 Meta 组织在方向与节奏上的失控。

接下来的每一个月,都将成为答案的一部分。

小米 SU7「加长版」测试车外观曝光;Meta 被指控使用盗版成人影片训练模型;英伟达推出史上最强迷你 PC

英伟达推出史上最强迷你 PC:最高 2070T AI 性能、128G 内存

日前,NVIDIA 正式推出了号称史上最强、最小的迷你 PC——Jetson Thor 系列,AI 性能可达 2070TFLOPS,售价 2.5 万元起。

Jetson Thor 是专为 AI、机器人、边缘计算等设计的消费级平台,CPU 是 ARM Neoverse-V3AE,而 GPU 基于 NVIDIA 最新的 Blackwell 架构,有 Jetson AGX Thor Developer Kit、T5000 及 T4000 型号可选,主要性能有所区别。

Jetson AGX Thor Developer Kit 与 T5000 基本一致,后者主要是部分规格可以自行搭配,CPU 是 14 核,GPU 都是 2560 核 Blackwell 架构,AI 性能可达 2070TFLOPS(1TFLOPS 就是 1 万亿次),整机功耗在 40-130W,搭配 128GB LPDDR5X 内存。

售价方面,Jetson Thor 系列起步 3499 美元,折合约人民币 2.5 万元起步,也可以算是史上最贵迷你 PC。(来源:cnBeta)

Meta 被指控使用盗版成人影片训练 AI 模型

近日,两家成人影片制作公司——Strike 3 Holdings 和 Counterlife Media,对科技巨头 Meta 提起诉讼,指控 Meta 自 2018 年以来「故意且有意」地侵犯了至少 2396 部受版权保护的影片,这些影片被用于训练其人工智能模型。

根据周五在加利福尼亚州提交的诉状,两家制作公司正在寻求巨额赔偿,总计可能达到 3.59 亿美元(约人民币 25.76 亿元)。

诉状指出,Meta 明知故犯地从盗版来源获取这些影片,目的是获取内容来训练其 Meta Movie Gen、大型语言模型(LLaMA)以及其他依赖视频训练内容的 Meta 人工智能模型。这两家公司还指责 Meta 试图利用 BitTorrent 传输的「互惠算法」来获利,该算法通过奖励用户分享内容,使其下载速度更快。(来源:IT 之家)

 

彭博:谷歌对发布自有品牌 XR 头显「犹豫不决」

在今年 5 月的谷歌 I/O 大会中,谷歌宣布与 Gentle Monster、Warby Parker 合作开发基于 Gemini AI 的一系列 Android XR 头显。大会现场,谷歌还展示了三星制造的 Project Moohan 原型机。

不过,谷歌硬件负责人 Rick Osterloh 近日在接受彭博社采访时表示,公司目前仍不确定是否会推出继 Google Glass 之后的「第二款自家品牌头戴式设备」,目前整个项目仍是「待定」(TBD)阶段。但他也同时强调,当下 XR 头显已进入一个真正可能实现「突破」并且真正「有趣且实用」的阶段。

如今,从公司策略上看,谷歌当前正通过与传统眼镜品牌合作,暗暗发力于 AR 眼镜方向,试图对标 Meta 雷朋联名智能眼镜。(来源:IT 之家)

 

曝 OpenAI 曾与英国官员就全民使用 ChatGPT 付费版展开讨论

据英国《卫报》报道,ChatGPT 联合创始人 Sam Altman 近日与英国科技大臣彼得·凯尔就一项数十亿英镑的协议展开磋商。

了解该讨论的人士表示,这一想法是在旧金山举行的会谈中提出的。该协议旨在让全英国民众获得这款人工智能工具的高级访问权限,但因为成本可能高达 20 亿英镑,所以彼得·凯尔并未真正认真考虑这一想法。

但这些会谈表明,尽管存在对部分聊天机器人回复准确性以及隐私和版权问题的担忧,这位科技大臣仍对人工智能领域抱有极大热情。(来源:新浪财经)

美国 L4 无人配送独角兽完成新一轮融资,英伟达、Uber 入场

位于美国加州的 L4 级独角兽 Nuro 近日宣布,公司已经完成 2.03 亿美元的 E 轮融资,折合人民币约为 14.6 亿元,当前估值 60 亿美元(约 431 亿元)。

这一轮投资者,既有老股东,也有新资本加入。「新面孔」包括网约车平台 Uber、风投机构 Icehouse Ventures、Kindred Ventures 等,当然其中最吸睛的是英伟达。

据了解,Nuro 成立已有 9 年,此前与英伟达已有多年合作,但英伟达从未出手投资。黄仁勋选择在这个节点注资,颇有点耐人寻味。(来源:智能车参考)

 

中国AI耳机销量前 10:华为第二,第一名均价仅 359 元

近日,洛图科技发布了 2025 年上半年中国 AI 耳机线上传统电商市场报告,TOP10 品牌榜单正式揭晓。

榜首并非大众熟知的头部品牌,而是凭借高性价比突围的 SANAG(塞那),销额占比 27%,销量占比更是高达 49%,品牌均价仅 359 元。

华为则以 13% 的销量占比位居第二,销额占比却高达 26%,基本追平第一名,华为 AI 耳机均价为 1349 元。

IFLYTEK(科大讯飞)、OLA FRIEND(字节跳动旗下)、CLEER 紧随其后,分别以 13%、8%、7% 的销额占比进入前五。小米位居第六,销量占比 3%,销额占比 5%。(来源:快科技)

 

iPhone 16 系列将升级到 25W 无线充电

据 MacRumors 报道,苹果即将发布的 iOS 26 正式版将为 iPhone 16 系列机型引入 Qi 2.2 无线充电。虽然还没有正式宣布,但已经有用户从 iOS 26 的测试版里体验过了。

上周,手机配件品牌贝尔金发布了 3 款新的 Qi 2 25W 充电器,分别是售价 59.99 美元的手机+耳机二合一、99.99 美元的手机+耳机+手表三合一,以及 129.99 美元的另一个三合一款式,三款充电器都可以在半小时内给搭载了 iOS 26 的 iPhone 16 充进 50% 的电。

这个情况就和苹果自己宣传的 25W MagSafe 充电器效果一致,也侧面证明了更新到 iOS 26 后,iPhone 16 系列将会得到 Qi 2.2 的支持,比之前仅有 15W 的功率高了很多。照此推测,即将发布的 iPhone 17 系列支持 25W 无线充电也成了板上钉钉的事实。(来源:热点科技)

小米SU7「加长版」测试车外观曝光

日前,有网友拍摄到了小米汽车新车型的路试谍照。

拍摄网友称,路试车辆疑似为小米 SU7「行政版」SU7L。从曝光的图片来看,车辆整体造型与小米 SU7 接近,但车身明显比标准版 SU7 更长,预计后排空间会大幅改善。

此外,从车辆转弯时的姿态也能够看出,前胎相较于小米 SU7 也更宽,车头姿态十分沉稳,极具豪车气场。

目前,小米汽车方面还未对外公布新车型,也不排除新车为小米 SU9 旗舰车型的可能。(来源:快科技)

 

古尔曼:iPhone 折叠屏将采用 Touch ID 而非 Face ID

彭博社记者马克·古尔曼在最新的《Power On》通讯中透露,苹果正在开发的折叠屏 iPhone 代号为 V68,将搭载四颗摄像头,并采用 Touch ID 而非 Face ID。

古尔曼解释称,这四颗摄像头包括一颗外屏前置摄像头、一颗内屏前置摄像头以及两颗后置摄像头。

与最新的 iPad Air、iPad mini 及入门款 iPad 类似,这款折叠屏 iPhone 预计会在电源键上集成 Touch ID,相比现有 Face ID 各有优缺。

古尔曼还称,该机型将搭载苹果第二代自研 C2 基带芯片,支持蜂窝网络,全面推行 eSIM 方案,不会配备实体 SIM 卡槽。

苹果分析师郭明錤此前也表示,该机型将配备 5.5 英寸外屏和 7.8 英寸内屏。相比之下,三星 Galaxy Z Fold7 的内屏为 8 英寸,外屏为 6.5 英寸。(来源:IT 之家)

博主分享根据微信步数判断好友是否已读,网友:「闲得蛋疼」

有关微信是否会开发「已读」功能一直是用户关注热点。「微信派」公众号 8 月 7 日已发文重申,微信从一开始就没有「已读」功能,以后也不会有。

近日,有博主晒出了网友在互联网平台分享的一个可以帮助判断好友是否已读信息的方法。需要注意的是,该网友也在给出方法后建议「酌情使用」,大致操作步骤如下:

  • 前提条件:该好友必须开通微信步数,并且参与排行,并且能看到他的步数
  • 假设早上 9 点给他发了一条微信,并且记录他当时的微信步数是 1000 步,9 点 10 分再次刷新微信步数排行榜,发现他的步数变成 1100 步,那么可以判断,在这 10 分钟,他带着手机走了 100 步,并且他一定打开了微信这个软件,等同于看到了微信信息。

值得一提的是,相关讨论已登上热搜,有网友锐评「闲得蛋疼」。(来源:IT之家)

 

小米YU7遭逆行水泥罐车撞击,车主平安;马斯克开源Grok 2.5模型;黑悟空因未公布新DLC遭玩家刷差评

小米 YU7 遭逆行水泥罐车撞击:行车记录仪第一视角曝光,车主平安无事感谢小米关怀

8 月 23 日消息,一段车祸视频最近在网上传播,引发广泛关注。8 月 19 日内蒙古赤峰,一辆正常行驶的小米 YU7,遭到一辆逆行的水泥罐车撞击并推行一段距离,车内人员未受伤,可安全下车。

车主随后帖称:「小米车救了我一命,前面那个水泥罐车刹不住,我们在前面被撞得最严重,车转了一圈,小米的防撞梁太硬了,救了我一命」。

该视频引发热议,有网友称,这次事故小米收获了一大波流量,应该给车主免费送一辆车。另有网友质疑,该车主多次发布与小米汽车相关内容是想要雷总送他一辆车。

据悉,8 月 22 日,该车主发视频回应称,拍视频是自己的爱好,这次事故和小米汽车没有任何关系,事故发生后小米公司人情关怀来看我们,心里已经很感激了。即使小米送他一辆车,他也不会要。事故和小米无关,不义之财不可取。

从后续曝光的小米 YU7 行车记录仪画面可以看到,水泥罐车在转弯后冲向对向车道,径直撞上了一辆绿色的小米 YU7 以及白色汽车,后续行驶一段距离才得以刹停,场面十分惊险。(来源:IT 之家)

马斯克宣布 xAI 开源 Grok 2.5 模型,Grok 3 将在半年后跟进

马斯克周六在其社交媒体平台 X 上发文称,他旗下的人工智能初创公司 xAI 已开源其 Grok 2.5 模型,并计划在大约六个月后对 Grok 3 模型采取同样的举措。

据悉,Grok App 近日还迎来了 v1.1.58 更新,Imagine 功能速度更快(更快生成图像)、Companions 功能更「有趣」,此外,Vision 模式现已对所有 Grok Android App 用户开放,不再限于测试版。(来源:IT 之家)

 

英伟达公布 Spectrum-XGS Ethernet 技术:跨区域构建 AI 超级集群,CoreWeave 率先部署

8 月 23 日消息,Hot Chips 大会将于 8 月 24~26 日举行,英伟达宣布推出 NVIDIA Spectrum-XGS Ethernet 技术,即日起作为 NVIDIA Spectrum-X 以太网平台的一部分提供。

据悉,这是一项面向分布式数据中心的跨域互联技术,旨在将多个不同区域的独立数据中心连接到一起,打造成一个具备千亿级计算能力的 AI 超级工厂。

英伟达介绍称,随着 AI 需求的快速增长,单一数据中心在电力和容量上逐渐触及极限。传统以太网在延迟、抖动和性能一致性方面的局限,使得数据中心无法轻易突破单一设施的边界。

Spectrum-XGS Ethernet 正是为此设计,它引入了跨域扩展架构,具备自适应的网络算法,可根据数据中心之间的距离进行动态调整。(来源:IT 之家)

苹果新 AI 模型长视频理解夺冠,小至 1B 版本也领先对手

8 月 23 日消息,科技媒体 9to5Mac 近日发布博文,报道称苹果研究团队开源 SlowFast-LLaVA-1.5 长视频多模态大语言模型,在 1B、3B、7B 参数规模下,均刷新 LongVideoBench、MLVU 等 SOTA 基准纪录。

苹果公司首先研究推出了 SlowFast-LLaVA 开源模型,最大的亮点是创新双流(two-stream)设置,其中「慢流」选取少量高分辨率帧捕捉场景细节,「快流」选取更多低分辨率帧追踪运动变化。

测试显示,该模型在长视频基准 LongVideoBench、MLVU 上均取得新纪录,而且 1B 版本也能领先竞争对手。同时,它在知识问答、数学推理、OCR 等图像相关任务上表现出色,实现视频与图像的通用理解能力。

该项目完全基于公开数据集训练,方便学术与产业复现,并已在 GitHub 与 Hugging Face 开源。(来源:IT 之家)

 

一代「国民车」复活在即,全新奇瑞 QQ 将亮相 2025 成都车展

据懂车帝 22 日报道,全新奇瑞 QQ 将在 8 月 29 日开幕的 2025 成都车展期间正式亮相,本次发布的版本或将展示量产车的造型设计。

据悉,今年上半年的上海车展期间,全新奇瑞 QQ 概念车已经完成首秀。新车采用了颇具科幻气息的设计语言,将搭载纯电动力。根据官方信息,新车车身长度为 4250 毫米,轴距为 2750 毫米,预计将定位于紧凑型车。

此次披露的信息显示,全新奇瑞 QQ 有望明年上半年量产。(来源:IT 之家)

Meta 即将推出首款面向消费者的智能眼镜 Hypernova

Meta 计划于 9 月的年度 Connect 大会上发布代号为 Hypernova 的新款智能眼镜。这是该公司首款面向消费者的智能眼镜,配备显示屏,显示屏将安装在合适的镜片上。

这款眼镜由 Meta 与 EssilorLuxottica 合作研发,预计售价约为 800 美元。预计这款眼镜将与一款可通过手势控制眼镜的腕带一同亮相。

Hypernova 眼镜的显示屏预计有限,提供 20 度视野。它主要用于传递简单信息,例如收到的短信。这款眼镜将允许用户拍摄和分享照片和视频、拨打电话、发送消息、收听音频,并通过语音、显示或手动交互与 AI 助手互动。

除了 Hypernova 和腕带之外,Meta 预计将与 Luxottica 合作推出第三代语音智能眼镜。该设备将具备电容式触控功能,允许用户通过触控手势进行交互。(来源:cnBeta)

 

19.38 万元起吉利银河旗下最大 SUV 车型 M9 开启预售:首搭 Flyme Auto2 系统,综合续航超 1500km

吉利银河 M9 昨晚正式开启预售,提供 6 个不同版本可选,全系赠送 27 扬声器音响,支持 13000 元选装魔毯星驰套装,将于 9 月正式上市。

吉利银河 M9 车长 5205mm,宽 1999mm,高 1800mm,轴距 3030mm,定位大型 SUV;车内面积达到 5.2㎡,车内有效长度 3.7m,车内高度 1.3m,拥有 88.3% 超大得房率,支持 8 种座椅模式一键设定。

新车外观采用此前银河星舰概念车的大量设计风格,官方称为「涟漪美学」,配备了宽大的星汉涟漪贯穿灯和旭日东升尾灯,车顶配有激光雷达。

车侧则是传统样式的门把手,配有多辐条铝合金轮毂,并在 B 柱、窗框、下包围等处运用了镀铬处理,增添气场。

座舱方面,吉利银河 M9 全系内部采用 2+2+2 的六座布局设计,第二排为双独立座椅,还带有一个 17.3 寸 3K 吸顶屏,配备无缝腿托、腰托,具备通风、加热、10 点按摩;其配备二三排纯平地板、180mm 车内通道、三排靠背 150 度电动调节以及大尺寸后舷窗。

智能化方面,吉利银河 M9 全系搭载 Flyme Auto 2 新一代 AI 智能座舱,及超拟人智能体 Eva,能一句话规划路线、调节座舱功能、哄娃讲故事。(来源:IT 之家)

《黑神话:悟空》因游戏 DLC「未能如期推出」遭玩家差评轰炸,Steam 过去 30 天好评率降至 93%

8 月 23 日消息,游戏科学团队在科隆游戏展中公布了「黑神话」系列 IP 最新作《黑神话:钟馗》,但这也令许多期待《黑神话:悟空》DLC 的玩家失望不已,这种希望落空的感觉导致大量玩家前往 Steam 给《黑神话:悟空》刷差评,质疑 DLC「未能如期推出」。

尽管在《黑神话:钟馗》公布后,官网上线的 FAQ 确认「西游,不会到此为止」,暗示官方仍将推出《黑神话:悟空》的 DLC,但考虑到《黑神话:钟馗》目前仅仅处于早期开发阶段,目前暂不知悉《黑神话:悟空》的 DLC 将于何时推出。(来源:IT 之家)

 

马斯克沉迷的「刷刷刷」游戏,要来中国了

2024 年底,马斯克在 X 上的一条动态,把《流放之路 2》推上了全球玩家的热搜榜。

他说,这是一款「暗黑破坏神和艾尔登法环的爱情结晶」。随即,关于这款游戏的讨论在玩家圈层之外也迅速扩散开来。后来甚至有人爆料,他会在私人飞机上刷《流放之路 2》,还因此引发过一场「带练风波」。科技狂人马斯克的沉迷,把这款硬核 ARPG 拉出了圈子。许多此前并不熟悉这一类型的玩家,也因此第一次关注到它。

马斯克转发《流放之路2》丨来自:X

对我来说,这并不是一款完全陌生的作品。从初中时代沉迷《暗黑 2》开始,我就对「刷宝」类 ARPG 保持着长久的兴趣。打怪、掉落、组建流派,这种不断重复却又充满未知的过程,对玩家有着某种魔力。《流放之路》系列,就是在这样一群「暗黑死忠粉」的手中诞生,并逐渐成长为最硬核也最纯粹的 ARPG 代表之一。只是它极高的门槛和复杂度,也让很多普通玩家望而却步。

从 2013 年初代《流放之路》发布,作为一个从《暗黑 2》一路走来的老玩家,我也一直有关注这个系列。到 2024 年底《流放之路 2》正式上线,这款游戏在垂类玩家群体中的口碑不断累积。国际服上线后,一度登顶 Steam 畅销榜,也在 Twitch 创下百万级别观看峰值。

今年 8 月,《流放之路:降临》在深圳举办发布试玩会。腾讯当场宣布:国服将在 9 月 11 日开启预充值不删档测试。试玩会上,我也终于有机会实机上手。《流放之路:降临》在画面和打击感上都比「云玩」时更精致、更真实,同时在玩法层面展现出更高的复杂度。国服版本还额外加入了 AI 助手、全中文配音以及全新的交易模式,为国内玩家提供了更友好的体验。

这让我意识到,《流放之路:降临》的国服,不只是一次单纯的引进,而是一场关于「硬核游戏如何在中国落地」的实验。它既考验玩家的接受度,也考验运营方的诚意。

上手即劝退?还是爽到停不下来

《流放之路:降临》由新西兰 Grinding Gear Games 工作室(以下简称 GGG)开发,腾讯代理国服。它延续了系列一贯的硬核风格:庞大的天赋树、装备和技能宝石的自由组合、复杂的掉落与交易系统,塑造了无数种流派可能性。

国际服在 2024 年上线后,最高同时在线人数突破 57 万,还拿下了「铂金级年度新品」「铂金级最热玩游戏」以及「最畅销黄金游戏」等 Steam 奖项。它在 Twitch 上的观看峰值超过 120 万,可见其在全球玩家中的热度。

在玩法上,这款游戏强调「自由」。可以体现为下面四个方面

  • 自由 BD(Build 流派):天赋职业 1+1>2 随意搭,没有固定公式,同时极具深度,并不断会根据新版本/新赛季变化
  • 自由战斗:操作体验丰富,BOSS 战动作博弈,既有无脑刷怪,也有有趣味的 Boss 和竞速挑战
  • 自由打装:装备类型、词条繁多,既可以刷怪掉落,也可以自由打造,更丰富化的装备构筑路径
  • 自由交易:完全自由的玩家间贸易机制,大部分物品都可以进行交易

国服将在 9 月 11 日开启不删档测试,直接同步国际服的 0.3.0 最新版本。腾讯方面承诺,未来版本更新也会尽量保持与国际服同步,不再让国内玩家做「版本孤儿」。

在本地化上,国服提供全中文配音,预计将录制超过一万七千条语音,邀请专业声优完成角色塑造。除此之外,国服还带来了一些中国特色元素:例如限定的国风宠物「熊猫临临」,以及免费赠送的国风时装「流火之翎」。这些内容既有文化符号,也体现出运营方对国内玩家的用心。

《流放之路:降临》试玩丨《流放之路:降临》试玩会

试玩会提供的是 0.3.0 版本。可以感受到相比前两个赛季/版本,游戏节奏变快了。此前玩家抱怨剧情推进太慢,新版本增加了冲刺机制,新赛季不用再一遍遍过之前的剧情,战斗节奏也更为流畅。此外,技能平衡性也做了大规模调整,以前「一招通关」的情况明显减少,不同职业和 BD 的平衡性有所加强,玩家有更多可玩空间。

《流放之路:降临》的打击感也做得不错,弓弩射击群怪时的手感、技能爆裂时的特效、闪躲回避时的流畅感,都做出了 3A 游戏的质感。整体节奏上,开荒阶段需要小心走位,但当角色逐渐成型后(我尝试在高等级后回到早期地图),也能体验到这类游戏「割草刷刷刷」的爽感。但因为不少职业是「玻璃大炮」,实际面对 Boss 和一些高难关卡时,仍需操作和策略,避免了只有刷刷刷的尴尬。

此外,还有一个让我印象深刻的,是全新的内置交易市集。只需在游戏内打开界面,就能像电商购物一样搜索、筛选并一键发起交易。据了解,这一功能由腾讯国服团队和 GGG 联合开发,大大降低了玩家交易门槛,也展现了本地化的诚意。

大模型驱动的次世代 AI 游戏助手

除了游戏本身,国服最大的亮点之一,是首度引入了 AI 助手「蛋蛋君」。

它不是一个通用机器人,而是基于腾讯大模型定制训练的专用 AI 游戏助手。其实现方式是基于 WeGame 平台打造一个通用游戏 AI 底座模型,再为《流放之路:降临》具体训练专属层。

同时为解决版本同步与准确性痛点,团队还自主构建专属游戏模型。该模型能紧密跟随游戏版本更新,团队会在新版本上线前将最新数据整合进模型,确保 AI 提供的建议始终基于当前有效版本,自动过滤过时信息,避免误导玩家。

据我了解,《流放之路:降临》AI 助手功能研发分三期推进,如下所示,其目标是覆盖用户体验周期的全阶段,目前先聚焦于解决新玩家的核心痛点,在不影响游戏上手体验、不打扰游戏内乐趣的前提下辅助新玩家完成开荒,为后续更复杂的智能功能打下基础。

第一期(当前已公布):侧重于「通用查询和基础答疑」。像聊天机器人一样,为玩家(特别是新手玩家)提供游戏内通用问题的文字解答(如基础玩法、职业特征、路线选择),帮助他们度过初始迷茫期。并且从用户上手习惯出发,提供通用型建议,避免高段位及复杂攻略限制新玩家自由探索。

第二期:初步实现场景化智能辅助」。AI 将结合玩家在游戏中遇到的实时困难、所处的具体场景以及玩家的角色装备状态与游戏习惯,据此提供适时、针对性的建议和帮助,成为用户的「智能辅助」。

第三期:结合用户需求和习惯,担任更加个性化的智能辅助,并非教玩家如何打游戏,而是能够识别用户在游戏中遇到的问题并给予解决对策,在不干扰游戏整体体验的前提下提供更丰富、更直观的帮助。

从行业视角看,这是 AI 在游戏中的一次典型落地案例。相比依赖论坛、攻略,AI 助手能做到个性化、实时化的指导。未来若这一模式成功,可能会成为更多硬核游戏降低门槛的方式。

《流放之路:降临》国服特色内容丨来自:《流放之路:降临》试玩会

相比国内常见的游戏发行模式,腾讯在这次代理中的姿态显得意外克制。国服预充值的基础包只需 98 元,学生党还可以额外再减 10 元。这个价格只有 steam 基础版(30 美元)的一半,可以说相当有诚意。

「自由」到底意味着什么

在试玩会的交流中,国服项目负责人 bubu 多次强调「自由」是这款游戏的核心气质——玩法自由、交易自由、掉落概率完全随机、做装也是随机。bubu 说团队希望能够把这个特质传递给玩家,让大家知道这是一个不会被所谓的发行和运营安排的明明白白的游戏,是一个玩家可以完全自由选择、无上限的发展角色的游戏。

《流放之路:降临》国服项目负责人bubu丨来自:《流放之路:降临》试玩会

在老玩家关心的资产继承方面,腾讯也给出了答案:一代中已经购买的时装、仓库页等虚拟资产,只要新作存在对应内容,就会迁移延用。这让老玩家的投入不至于作废,体现了对社区的尊重。

此外,腾讯还推出了「先锋计划」和「长青计划」,通过提供测试资格、现金激励和流量扶持,鼓励玩家参与内容创作。无论是写攻略、做过滤器还是研究流派,这些创作者都能成为游戏生态的重要组成部分。流放之路系列是一个典型的社区驱动产品,在游戏发展的过程中,玩家社区的声音一直是开发与迭代的重要组成部分。推出「先锋计划」,bubu 表示是希望中国玩家社区的声音也能被听见。

制作人 Jonathan 也在分享会上坦言,他们最关注的就是玩家反馈。0.3.0 版本的大规模平衡调整,就是根据中外玩家对流派多样性和游戏节奏的建议完成的。他在此前中国行访问成都熊猫基地后,立刻决定把熊猫形象加入国服宠物,成为文化交流的缩影。

这种对“自由”与“社区”的强调,也契合了当下中国游戏市场的新趋势。随着《黑神话:悟空》掀起主机热潮,3A 和硬核游戏正在越来越受到玩家欢迎。但问题并不只在玩法,真正的考验是如何在国内本土化运营:既要避免过度氪金、数值付费的手游套路破坏体验,又要找到合理的商业化平衡点,让硬核游戏能够在中国市场长线发展。

作为一名长期关注刷宝类 ARPG 的玩家,我在试玩会后的直观感受是:这款游戏在保留系列硬核魅力的同时,也做出了许多本地化和体验上的优化。无论是 AI 助手带来的智能化引导,还是内置交易市集的便捷,抑或是定价与资产继承上的诚意,都让我对即将到来的国服测试充满期待。

从行业角度看,《流放之路:降临》不仅是一款游戏的回归,更是一场关于「AI+游戏」「社区共创」「长期主义」的实验。9 月 11 日,随着国服不删档测试正式开启,瓦尔克拉斯大陆将迎来一批新的冒险者。我期待看到这场「玩家与运营者的双向奔赴」,也期待它能为国内硬核游戏市场带来新的启发。

Anthropic 寻求 100 亿美元新融资;《恋与深空》获科隆展最佳移动游戏奖;脑瘫司机靠特斯拉 FSD 开车养家

苹果正探索与 OpenAI、Anthropic 及谷歌合作,评估 Gemini 等第三方模型

8 月 23 日消息,彭博社马克・古尔曼刚刚报道称,苹果近期接触谷歌母公司 Alphabet,拟在 Gemini 基础上合作开发定制化 AI 模型,将其作为明年全新 Siri 的基础 AI 引擎。

消息人士称,谷歌 Gemini 已启动苹果服务器的适配工作,或者说谷歌正在训练一款可运行在苹果服务器上的 AI 模型。

除此之外,苹果也曾与 Anthropic 和 OpenAI 就潜在合作进行接洽,评估 Claude 和 ChatGPT 是否能够作为 Siri 的「新大脑」。

消息传出后,谷歌和苹果股价不断走高,周五盘中多次触及高点,目前谷歌上涨 4% 至 207.80 美元,苹果上涨 1.4% 至 227.95 美元。

据称,苹果正在内部同时开发两个版本的新 Siri。目前苹果尚未决定到底是继续使用自研模型,还是与外部伙伴合作。

苹果与谷歌虽然在部分领域存在竞争,但双方已保持长期合作关系,例如谷歌曾每年支付数十亿美元以保持其作为苹果设备默认搜索引擎的地位。此次在 AI 领域的合作仍处于探索阶段,并未进入正式商业谈判。(来源:IT 之家)

​历史性协议:美国政府 89 亿美元入股英特尔,占股 9.9%

8 月 23 日消息,英特尔宣布与美国政府达成历史性协议,美国政府将以 20.47 美元 / 股购入 4.333 亿股普通股,投资总额 89 亿美元,占股 9.9%,另享 5 年期认股权证。

英特尔公司昨日(8 月 22 日)发布公告,宣布和美国政府达成战略合作,美国政府将投资 89 亿美元(IT 之家注:现汇率约合 638.98 亿元人民币)直接持有英特尔约 9.9% 普通股,购入价格为每股 20.47 美元(现汇率约合 147 元人民币)。

此次交易包含一份五年期、价格为每股 20 美元的认股权证,若英特尔在代工业务中的持股比例低于 51% 方可行使。政府将作为被动投资者,不参与董事会及经营决策,并承诺在股东表决时与董事会一致投票(有限例外)(来源:IT 之家)

 

部分苹果芯片将在德州仪器新开设的工厂生产

德州仪器 (TI) 已正式在德克萨斯州谢尔曼开设其价值 600 亿美元的半导体工厂,苹果是首批在该工厂生产芯片的客户之一。该工厂是谢尔曼四座新工厂中的第一座,也是德克萨斯州和犹他州七座工厂扩建项目的一部分。该项目的目标是为制造商提供美国关键芯片的供应,此前这些芯片大多在海外生产。

苹果公司确认,将在新工厂生产 iPhone 和其他设备的「关键基础半导体」。这些芯片并非是自行设计的高性能处理器,而是用于管理电源、传感器和信号的小型模拟和嵌入式组件。

这些支持芯片每块仅售约 40 美分,但却不可或缺,iPhone 出货离不开它们,而国内供应有助于苹果避免在新关税制度下成本上升。

这一举措是在新的贸易压力之下推出的。2025 年 8 月,特朗普总统宣布对海外生产的芯片征收 100% 的关税。同一天,苹果首席执行官 Tim Cook 将公司在美国的支出承诺从 2 月份承诺的 5000 亿美元提高到四年内 6000 亿美元。

库克表示,部分投资将直接流入德州仪器位于谢尔曼、理查森和利希的工厂。通过在美国生产,苹果可以避免高额关税处罚,并确保更稳定的供应链。(来源:cnBeta)

 

阿里官网重新归纳四大业务板块

8 月 22 日,阿里巴巴官网「我们的业务」板块变更,从六大业务集团+其他业务变更为阿里中国电商集团、阿里国际数字商业集团、云智能集团及所有其他业务。饿了么、飞猪归入阿里中国电商集团,高德地图、菜鸟、优酷、大麦娱乐等归入「所有其他」。据了解,阿里官网业务板块划分并不代表组织架构调整,内部汇报暂未发生变化。(来源:第一财经)

 

理想汽车智驾量产负责人离职

今日有媒体报道称,理想汽车智驾团队量产负责人王佳佳近期已提交离职申请。理想汽车方面确认了该消息。 资料显示,2021 年 5 月,王佳佳加入理想汽车担任智能驾驶量产研发负责人,向理想汽车智能驾驶负责人郎咸朋汇报。 加入理想之前,王佳佳在博世中国工作近 8 年,先后担任自动驾驶研发项目组长、部门经理等职位。(来源:新浪科技)

Anthropic AI 正在洽谈筹集最高达 100 亿美元的新一轮融资

根据《彭博社》的报道,Anthropic 正就一轮高达 100 亿美元的新融资进行最后谈判,此轮融资将使其投后估值达到约 1700 亿美元。因投资者需求远超预期,原定 50 亿美元的融资规模被直接翻倍。本轮完成后,Anthropic 现金储备将大幅增加。

Anthropic 成立于 2021 年,由前 OpenAI 核心成员创建,其主要产品 Claude 系列 AI 模型在市场中广受关注。截至 2024 年,其曾获得亚马逊与谷歌等巨头的大规模投资,此次新一轮融资若成功,将令其资金实力更上层楼。

据悉,投资公司 Iconiq Capital 将领投该轮融资。知情人士透露,其他预计的参与者包括 TPG Inc.、光速创投、Spark Capital 和 Menlo Ventures。Anthropic 还与卡塔尔投资局和新加坡主权基金新加坡政府投资公司(GIC)就加入这一轮谈判进行了讨论。(来源:开源中国)

 

NVIDIA 黄仁勋再次喊话:H20 从来没有、也不可能有后门

8 月 22 日消息,NVIDIA 公司专为国内市场定制的 H20 AI 芯片在经历了封禁、解禁后依然面临争议,在国内市场上的销售备受关注。

H20 在国内面临的压力不仅是性能已经落后,更关键的还是安全问题,此前多次被国内有关部门认为有安全风险,尤其是有后门,此前 NVIDIA 公司也做过澄清。

今天 NVIDIA 创始人、CEO 黄仁勋乘专机飞抵台积电洽谈合作,期间也再次谈到了 H20,表示国内近期对 NVIDIA 的芯片提出了一些疑虑,质疑芯片是否有安全后门,NVIDIA 已经澄清并且消除了这些疑虑。

黄仁勋表示,H20 没有安全后门,从来没有,也不可能有。他还提到目前仍在和国内进行沟通,希望这件事能妥善解决。

NVIDIA 公司之前表态,称 NVIDIA 遵守美国政府制定的参与全球市场的规则。加速计算的需求是全球性的,NVIDIA 将继续在规则范围内为尽可能多的客户提供服务。(来源:快科技)

 

消息称中国第一豪车品牌红旗牵手华为:多车用上乾崑智驾、鸿蒙座舱

8 月 22 日消息,据财联社报道,一汽红旗将于明年推出采用华为全栈解决方案的车型,功能包括乾崑智驾、鸿蒙座舱、乾崑车控、乾崑车云服务等

另有知情人士透露:这一合作将会在明年率先围绕「红旗 9 系」车型展开,届时最新的方案基本上都会得到搭载。

目前「红旗 9 系」在售车型包括 H9、E-HS9、HQ9、HQ9 PHEV 等,涵盖燃油、插混和纯电等多种动力类型。

红旗和华为合作并不令人意外,如果对汽车圈比较关注的朋友大概还记得在 2023 年 10 月份一汽解放就和华为签署了备忘录。

本月,一汽奥迪全新的 A5L、Q6L e-tron 家族新车上市,最大的亮点之一就在于配备了华为的乾崑智驾。

值得一提的是,北汽、长安、东风、广汽和上汽已经和华为达成了合作,而随着一汽红旗的加入,最后一家和华为合作的央国企车企也尘埃落定。(来源:快科技)

 

国产女性向游戏《恋与深空》获科隆展最佳移动游戏奖

今日,《恋与深空》在德国科隆国际游戏展上获得最佳移动游戏奖,这也是历史上首个女性向游戏获得这个奖项。

此次同时被提名的游戏还有鹰角网络《明日方舟:终末地》《抓抓地牢》、米哈游《原神》、《锈湖管家》。

据了解,《恋与深空》是一款由叠纸游戏开发的 3D 恋爱互动手游,于 2024 年 1 月 18 日公测。

同年 9 月,《恋与深空》宣布登上苹果 App Store 畅销总榜第一,超越抖音和《王者荣耀》。

玩家在游戏中将扮演深空猎人,带领不同类型的搭档并肩作战,剧情推进过程中会出现、结识男性角色,他们将会陪伴主人公一起成长,从而让玩家能够获得恋爱体验。(来源:快科技)

Meta 研发的新型 2 毫米厚度显示屏让 AR 眼镜更接近现实产品

Meta 的一个研究团队认为,他们已经攻克了增强现实领域最棘手的挑战之一:将明亮、生动的显示屏装入足够纤薄、适合日常佩戴的眼镜中。他们最新的原型是一款厚度仅为两毫米的平板激光显示器,标志着这项技术从长期以来限制激光增强现实显示器发展的笨重系统迈出了重大一步。

这项发表在《自然》杂志上的研究成果描述了一种体积不及铅笔橡皮擦的设备,它能够投射清晰的高清图像,同时厚度仅为当今显示器的一小部分。通过将先进的光子技术集成到单个芯片上,该系统兼具紧凑性和可扩展性——这正是消费级 AR 眼镜的两个关键要求。

增强现实依赖于在户外保持可见的显示器,而在户外,明亮的环境光很容易冲淡数字叠加层。传统的基于 LED 的系统在这种条件下难以应对,而激光显示器则提供了保持虚拟图像清晰锐利所需的亮度和色彩丰富度。

研究中的图片展示了 Meta 最终的激光显示器,尺寸仅为 5 毫米 x 5 毫米,放置在一枚 10 美分硬币的顶部进行缩放。其他图片则重点展示了该显示器运行的放大视图。

Meta 现实实验室的光学科学家郭华魏向 IEEE Spectrum 表示:「亮度和色彩的重要性对于透明和户外应用尤为明显。」

以前的设计依赖于复杂的激光阵列和庞大的光学元件,这使得它们价格昂贵、难以制造,并且不适合用于消费硬件。

Meta 的新方法利用光子集成电路 (PIC) 克服了这些限制。PIC 是一种利用数千个微型光学元件来引导和调制光线的芯片。PIC 的大小大约与指尖相当,它与微型硅基液晶面板配对,可产生 1920 x 1080 分辨率的显示屏。尽管体积小巧,但该系统的色域却是传统 LCoS 设备的两倍多。

对于 Meta 而言,它已经通过其 Reality Labs 部门和与雷朋智能眼镜的合作在增强现实和混合现实领域投入了大量资金,这一突破代表着它朝着实现轻量级、视觉上引人注目的 AR 设备又迈出了一步。(来源:cnBeta)

 

极狐 T1 纯电小车开启预售:同级首搭低速智能辅助转向技术、ARC-FLOW 概念设计语言,6.88 万元起

8 月 22 日消息,极狐 T1 纯电小车今日开启预售,新车标配全景影像、提供续航最高 425 公里版本,预售价 6.88 万元起。需要注意的是,极狐 T1 的 425km 续航车型上市即交付,320km 续航车型将在 10 月中旬开启交付。

新车尺寸为 4337×1860×1572mm、轴距 2770mm、最大头部空间 1004mm、后排腿部空间 934mm,支持前排座椅一键躺平。极狐 T1 纯电小车还拥有 459L-1352L 灵活储物空间。

极狐 T1 同级首搭低速智能辅助转向技术,宣称「转弯直径减少 30cm、最小转弯半径可达 5.2m」,配备 540° 立体全景影像系统。采用 ARC-FLOW 概念设计语言,配备贯穿式前大灯、18 英寸铝合金精车轮毂,轴长比 0.64、轮高比 2.27、宽高比 0.85;提供晨曦白、瓦纳蓝、流光银、草露青、霞光紫、子夜灰 6 种车色和云米、沙棕、黑金三种内饰配色。

新车基于北极星数字智能架构打造,采用高强度笼式车身设计,配备极光电池(宣称「不着火、不变形、不进水、真续航」),支持闪充补能,同时提供 V2V / V2L 外放电功能。(来源:IT 之家)

 

OPPO Find X9 Pro 完整规格曝光:7500mAh 大电池 + 全新三摄系统

8 月 22 日消息,Smartprix 刚刚联合 @Yogesh Brar 放出了 OPPO Find X9 Pro 完整配置信息。

据称,OPPO Find X9 Pro 将配备一块 6.78 英寸的 1.5K 120Hz OLED 直屏。性能方面,该机将搭载联发科天玑 9500,并提供最高 16GB 内存 + 512GB 存储的配置(指海外版本)。

此外,这款新机还将配备一枚 200 万像素丹霞原彩镜头(IT 之家注:Find X8 Ultra 同款);前置摄像头则为 5000 万像素三星 JN5,支持自动对焦。

其他方面,Find X9 Pro 将搭载 7,500mAh 电池,支持 80W 有线快充和 50W 无线充电;采用超声波屏下指纹识别,支持 Wi-Fi 7、NFC 以及可自定义快捷方式的多功能按键,运行基于 Android 16 的 ColorOS 16 系统,预计 10 月率先在中国发布,随后于 11 月中旬登陆印度及全球市场,印度市场价格预计在 10 万卢比(IT 之家注:现汇率约合 8228 元人民币)以内。(来源:IT 之家)

脑瘫司机靠特斯拉 FSD 开网约车养家

旅行博主 JeebsTX 本月(8 月 10 日)在 X 平台分享了他在旅途中的一次奇妙见闻。JeebsTX 表示,他在去纽约出差的路上用优步叫了一辆舒适型网约车,不久后司机 Billy 接载了他,上车后他注意到,Billy 开的是一台特斯拉 Model Y。

随后博主看到了神奇的一幕——Billy 说道「导航去 C 航站楼」,随后他用左手按下了 FSD 启动按钮,他们就这样以辅助驾驶模式开启了 18 英里(约 30 公里)的旅程。 博主询问司机为何用左手去按 FSD 按钮,司机表示他从小就患有脑瘫,右手完全动不了,右腿也只剩下 40% 的活动能力。自从 Billy 买了 Model Y 后,他就能通过开网约车维持生计,这期间他开了 20.6 万英里(约 33 万公里)未大修,现在他完全依靠开优步来养家糊口。(来源:IT 之家)

可灵AI单季营收超2.5亿,快手财报里的「AI含金量」有多高?

 

8月21日,快手科技发布的2025年第二季度业绩报告,各项核心财务指标表现稳健,超出了市场普遍预期。

 

财报显示,快手该季度总营收达到350亿元,同比增长13.1%;经调整净利润为56亿元,同比增长20.1%。同时,公司的盈利能力也达到新的高度,毛利率和经调整净利润率分别提升至55.7%和16.0%。

图片来源:快手财报

 

在用户基本盘方面,平台流量持续增长,平均日活跃用户(DAU)同比增长3.4%至4.09亿,月活跃用户(MAU)同比增长3.3%至7.15亿。

 

这些数据显示,快手在保持用户规模稳健增长的同时,实现了更高质量的盈利。

 

可以看到,自从2023年全面启动AI战略以来,人工智能技术已深度融入快手的内容生态、线上营销和电商等核心业务的全流程,成为驱动效率提升和业务增长的关键变量。

 

快手CEO程一笑在业绩电话会上也强调,AI大模型能力正在众多生态场景中释放价值。本季度的业绩,或许可以视为快手AI战略从技术布局到业务成果转化的一次集中体现。

 

此外,快手首度派息20亿港元。快手称,「董事会宣派派发自上市以来的首次特别股息每股0.46港元,合共约20亿港元。此次特别股息之宣派及派发,反映了对公司长期增长前景及稳健财务状况的信心,亦体现了我们对持续提升股东回报的承诺。」

 

「AI双核」:一个负责降本,一个主攻增收?

 

快手本季度的业绩表现,根植于其在AI技术基础设施层面的持续投入和应用落地。以OneRec推荐大模型和可灵视频生成大模型为代表的技术创新,正从底层重塑平台的运营效率和内容生产力。

 

作为内容平台,推荐系统的效率直接决定了用户体验和商业化天花板。本季度,快手推出了自研的「OneRec端到端生成式推荐大模型」。与传统的「筛选-排序」级联架构不同,OneRec采用全新的技术范式,以一个统一模型直接生成符合用户偏好的视频内容。

 

这一改变带来了两方面显著的业务价值,首先是提升推荐效果,新架构能够更好地利用强化学习方法对齐用户偏好,在部分短视频推荐场景应用后,有效提升了用户时长和留存率;其次是大幅降低成本,OneRec显著提升了算力的训练和推理效率,官方数据显示,其有效计算量提升了10倍,而运营成本仅为传统方案的10.6%。

 

目前,该模型已广泛应用于站内内容推荐,并全面应用于本地生活服务场景,推动了相关业务GMV的增长。

 

OneRec的应用,表明快手在平台最核心的流量分发环节,通过AI技术实现了效率和成本的同步优化。

 

可灵(Kling)视频生成大模型则是快手AI战略在应用层的重要布局。本季度,其商业化进程取得了一些实质性进展,实现了超过2.5亿元人民币的营收。

 

基于其商业化表现,快手管理层已将可灵2025年的全年收入预期较年初目标翻倍,并相应追加了在推理算力方面的投入。

 

可灵的商业化进展,建立在其持续的产品迭代和场景拓展之上。

 

从产品功能来看,可灵在保持模型效果的同时,陆续上线了「多图参考」、「灵动画布」等功能,提升了生成内容的一致性和可控性,使其更接近于一个一站式的AI创意工具。

 

图片来源:极客公园

 

商业场景方面,可灵的用户群体已从个人创作者,扩展到电商、广告、设计、影视等领域的专业创作者和企业客户。截至7月,已累计服务超2万家企业客户。

 

也有一些标杆案例的探索。快手通过具体项目来验证和展示可灵在工业级场景的应用能力。快手星芒短剧联合出品的AI单元故事集《新世界加载中》,全球累计播放量近2亿,体现了AIGC技术大规模嵌入影视创作流程的可行性。此外,与热门手游《逆水寒》的合作,也探索了其在游戏行业的应用潜力。

 

在电话会上,程一笑表示未来希望可灵逐步具备在游戏制作和专业影视制作等工业级场景的深度应用能力。从OneRec到可灵,快手的AI技术已经从底层算法深入到上层应用,初步形成了技术创新与商业价值实现的闭环。

 

当AI深入电商、广告的「毛细血管」

 

技术基建的最终目的是服务于业务增长。本季度,AI技术对快手线上营销和电商两大核心商业化业务的赋能效果尤为显著,驱动了效率和收入的双重提升。

 

本季度,快手线上营销服务收入达198亿元,同比增长12.8%,增速较第一季度有所提升。增长的主要驱动力来自于AI技术对广告素材生产、投放和推荐等环节的全面改造。

 

快手开始提供更适配行业特征的AIGC营销素材方案。比如在服装行业推出的「主播+模特」双人数字人直播间功能,支持模特根据主播讲解实时换装。某男装客户在使用该功能后,不仅将直播账号全部切换为数字人直播间,对应的营销消耗也增长了近2倍。

 

借助大语言模型的内容理解和推理能力,快手进行生成式召回,挖掘用户行为与广告转化间的潜在关系,从而提升营销素材的点击率,为线上营销服务收入带来了低单位数的增长。

 

UAX全自动投放产品持续提升渗透率,其消耗占外循环总消耗的比例提升至65%左右,这意味着广告投放的自动化和智能化水平进一步提高,提升了客户的投放效率。

 

电商业务也体现了AI助力全域经营。本季度,快手电商业务GMV同比增长17.6%,达到3589亿元。AI技术在其中扮演了提升人货匹配效率、降低商家经营成本和优化用户体验的关键角色。

 

通过对商品信息和用户兴趣进行高效提炼,AI大模型优化了平台的人货匹配效率;快手自研的AIGC能力「可绎」被用于赋能电商内容生态,降低商家经营门槛;泛货架场域也成为电商业务新的增长引擎。

 

本季度,以商城和搜索为代表的泛货架电商GMV占总GMV的比重超过了32%。618购物节期间,搜索GMV同比增长超过140%。这表明快手电商正从以内容推荐为主,拓展至内容推荐与用户主动搜索并重的全域经营模式,AI在优化货架场的流量分发和商品推荐中发挥了重要作用。

 

此外,快手也在利用平台能力融合线上线下,赋能实体经济。比如,「直播大舞台」项目已在全国57个城市落地,激活地方经济。本地生活业务也保持高速增长,第二季度收入同比增长近120%。

 

整体来看,快手2025年第二季度的财报,呈现了健康的财务增长,也验证了公司AI战略的有效性。

 

通过将AI技术深度应用于内容分发、商业化和电商运营的各个环节,快手初步找到了一条由技术创新驱动效率提升和业务增长的新路径。

 

但如果从更审慎的角度看,会发现,虽然财报中强调了AI带来的收益,但对总投入成本的披露不够透明。

 

财报显示,公司在年中追加了可灵AI的推理算力投入,导致相关资本支出预算较年初翻倍。虽然CFO表示对全年利润率影响可控在1-2% ,但这毕竟是一笔计划外的重大投资。未来AI的营收增长能否覆盖如此巨大的资本开支和折旧成本?其长期的投资回报率(ROI)仍需时间检验。

 

尽管可灵AI在「推理层面」实现了毛利率打正,但这并未包含前期巨大的模型训练成本。随着模型竞赛的加剧,未来的研发和训练投入可能持续处于高位,这或许会对公司创纪录的整体利润率带来压力。

 

此外,DAU同比3.4%的增速,或许显示平台在国内市场的用户渗透已进入瓶颈期。这对平台的商业化运营能力,即如何现深度挖掘4.09亿日活用户,提升ARPU值,提出了更高的要求。

 

1 个月,2 场胜仗,李斌从「斌子」变成「斌神」

短短两个月,蔚来 CEO 李斌的个人形象完成了光速逆转。

在乐道 L90 上市前,所有人都在教他做 CEO,甚至有极端的声音喊出「看好李斌的护照」;一个半月后,当第三代 ES8 的预售价被定位至 41.68 万元时,现场沸腾,李斌的形象变成了现场用户和媒体口中几乎破音的:

「斌神」

这台电池从 75 度升级到 102 度的新 ES8,比刚刚停售的第二代车型便宜了 8 万,甚至比租电方案购买的价格还要便宜将近 1.2 万。

如果采用租电方式购买,这台从第一代就锚定在「50 万级别」的纯电旗舰 SUV,入门门槛将进一步下探至 30.88 万元——只比 23 天前发售的乐道 L90 大顶配,贵了 9000 元;比最新的 ES6 整车购买价,还要再便宜近 2 万元。

当然,如果按照行业惯例,一个月后的正式发布会上,正式售价应该要比预售价再便宜一些。

比价格更让行业吃惊的是:这样的决策,是我们过去熟悉的那家蔚来几乎不可能做出的。

过去的蔚来,优雅但「拧巴」。各种决策里总是有很多噪音干扰:新车售价要考虑 BOM 成本,也要考虑对老用户的影响,还要考虑蔚来和乐道两个品牌之间的区隔……

所以,外界评价往往是:产品审美第一梯队,但价格和效率难以让人满意

这一次,杂音消失、目标明确。用李斌的话说:「活着是最重要的,活着才可以更好地兑现我们给老用户的种种承诺。」

短期的订单量也反应了用户的广泛认可。发布会结束后第二天,蔚来联合创始人、总裁秦力洪透露:在发布会结束后的 12 小时里,「全新 ES8 的订单量已经超越了同期(预售 12 小时)的乐道 L90」。

当然,和一个月前谨慎的乐道品牌总裁沈斐一样,秦力洪立即强调不能提前庆祝,表示后续生产、交付等工作需要踏实完成:「现在我们眼里都是活。」

 

座座都是 MPV

比起第二代 ES8,全新 ES8 首先的变化在于车身变得更大了:车长从 5099mm 增加到 5280mm,轴距从 3070mm 来到 3130mm。

在此基础上,基于 NT3.0 平台,它还能拥有更多的空间优势:

前备箱+后备箱总计 777L 装载空间(在六座坐满不放倒的情况下),不仅远超同级的三排 SUV,而且还超过了很多同尺寸的 MPV 车型。

在发布会现场,李斌现场演示了第三代 ES8「六人十二箱」的装载能力。包括:前备箱可以装下 2 个 20 英寸行李箱 +1 个 14 英寸儿童行李箱;后备箱可以装下 8 个 20 英寸行李箱 +1 个 12 英寸儿童行李箱。

此外,相比第二代产品 75kWh 的标配电池,全新 ES8 的入门版即标配了 102kWh 大电池,CLTC 续航达到 635km,官方标称电耗优化至 16.6kWh/100km。电池层面的加量不加价,也让 41.68 万元的起售价显得更有诱惑力。

李斌现场展示全新 ES8 的装载能力 | 图片来源:蔚来

真正让笔者感到惊喜的是,这一次蔚来对于全新 ES8 使用场景的全新解读。

首先,打开车门的一瞬间里,前排拥有 80 万级别 ET9 同款的内饰语言。所以尽管和 L90 同为三排六座 SUV,但不需要解释这是一台贴着 NIO 车标的 L90,因为从观感来看,这显然更像一台 SUV 版本的 ET9。

全新 ES8 前排搭载了和 ET9 一样的数字天际线屏 | 图片来源:蔚来

其次,在很长一段时间里,李斌都表达过蔚来品牌的高端车型会更强调「商务」属性。这一度是让笔者感到疑惑甚至担心的:毕竟在大型 SUV 的市场里,「家庭」是一个已经被验证的大场景。如果只谈「商务」,会不会让受众变窄?

这一次,蔚来总算为全新 ES8 里找到了一个更合适的传播方向:宜家宜商

第二排右侧的独立座椅,不仅可以躺倒,还拥有 150mm 的横移空间。蔚来在车机系统里预先定义了「观影」和「隐私」等模式,选择观影模式时,二排乘客可以「贴贴」;选择隐私模式时,可以拥有体面又得体的商务交流距离。

再如:全新 ES8 的二三排配备了六块电致变玻璃,可以调节三档透光度(通透、遮阳、全隐私)。而且,既可以通过门板上的实体按键完成「一键隐私」,也可以选择分区调节。左排乘客关闭遮阳帘休息,而右边乘客可以打开遮阳帘观景。

蔚来甚至在传播时还给出了一个小彩蛋,在第三排上方预留了一排衣帽接口。结合隐私玻璃的特点,把这个过往在传播时容易「油腻」的功能,包装成了「步入式衣帽间」的概念,给家庭和商务用户都提供了一个优雅的场景示范。

全新 ES8「宜家宜商」的内部空间设计 | 来源:蔚来

在智能化层面上,蔚来展示了一系列场景功能。

例如:在「守卫模式」下,车辆可以感知到周围的水涝或者火灾的风险。在发出报警的同时,还可以联动车辆空气悬架的升降,甚至调用无人泊车的相关功能让车实现自动驶离(还需满足一定法规规定)。

这样的功能需要联动整车多个域的控制,其实就是基于过去常说的「全域操作系统」、「正向研发」的能力。只是过去,这些技术名词略显枯燥,在传播时「肉往往都埋在了饭里」。而现在,蔚来正在用更多合适的场景展示自己的技术能力,找到更接地气的传播方式。

 

成为下一个连续爆款

2017 年,蔚来推出首款量产车型——第一代 ES8。那个时候,全铝车身、第二起居室的概念,加上 50 万级别的定价,给刚刚起步的中国新能源市场带来了足够的震撼,也为蔚来奠定高端、豪华的品牌形象打下了坚实的产品基础。

2022 年,第二代 ES8 亮相,蔚来进入了第二代车型平台。李斌后来坦承,这一阶段犯了一些产品定义上的「错误」。二代车型销量不及预期,蔚来也被新势力其他友商们拉开了一定差距。

去年年底,蔚来发布基于 NT3.0 平台的旗舰轿车 ET9,迈入第三代平台。根据极客公园的了解,ET9 搭载的线控转向、全主动悬架等功能,在其他主机厂和供应商里其实引发了广泛关注。但由于 ET9 定位较高、人群略窄,在消费端还是稍显曲高和寡。

相比起 8 年前的初代 ES8 发布,无论外部竞争还是内部环境都发生了巨大的变化。第三代 ES8 需要承载的使命也自然不同。

它不必再纠结于要定位在某个区间,以彰显蔚来品牌的「高端」和车型本身的「旗舰」定位。它更重要的责任是在 L90 之后,尽快成为蔚来公司的下一个爆款。

据了解,乐道 L90 自本月 1 号开启交付以来,已累计交付超 7000 台。而在 L90 正式交付的前两个月,乐道品牌的交付量大约为每月 6000 台上下。

李斌公布全新 ES8 预售价 | 图片来源:蔚来

李斌在此前的媒体沟通中提到,爆款的意义在于展示蔚来公司「持续、稳定、健康」经营的决心和能力。此前,他也反复强调蔚来公司的经营目标是在今年第四季度扭亏为盈——目前,在新势力中理想、零跑已率先完成年度和半年度盈利,小米(汽车业务)和小鹏也预计在下半年完成盈亏平衡。

值得一提的是,在今天的媒体沟通会上,当有媒体问起是否之后还会有基于三代 ES8 的五座车型 ES7。李斌没有否认,只是回答说:「这种思路的确会让开发效率更高。」

再加上已经公开的五座版 L80,也就是说,在 26.58 万元和 41.68 万元起售的 L90 和 ES8 之外,乐道和蔚来品牌还有「更便宜的牌」可以打出。那个曾经「售价不低于 30 万元」的蔚来品牌,如今正在带头重新锚定智能电动汽车行业的定价规则。

过往,人们在讨论每个组织的变化时,有一种常见的说法是「换帅如换刀」。暗指往往组织的变化往往需要从管理层做起。所以过去一段时间里,外界也会有声音把乐道品牌近期的转变,简单总结为从艾铁成到沈斐的人事变动。

如果照搬这套逻辑,那么几乎保持「原阵容」的蔚来,就应该是李斌革了自己的命。

我们很好奇在李斌和蔚来的内部,究竟发生了哪些转变。

但无论如何,我们正在看到一个「脱胎换骨」中的蔚来。

Manus 最新对话全文:尝试 Agent 支付,公司 RRR 近 1 亿美元

作者|Li Yuan

编辑| 靖宇

 

搬到新加坡的 Manus,对通用 AI Agent 的思考没有停止。

在今天在新加坡举行的 Stripe Tour 上,Manus 联合创始人兼首席科学家季逸超(Peak)与 Stripe 亚太地区及⽇本⾸席营收官 Paul Harapin 进行了对谈。

席间, Manus AI 披露了近期的经营数据,Manus AI 收入运行率(RRR,Revenue Run Rate)已经达到 9000 万美元,很快即将上亿。

Manus AI 的肖弘还特意在即刻表示,Revenue Run Rate 指的是当月的 Revenue *12,并不等于 Cash Income。很多 AI 产品都会有年付选项,这部分只能算作预存款,而不能记为 Revenue。「如果我们按照这种【错误方式】披露,可以算出一个一个比 1.2 亿美金更大的数。」肖弘表示。

除了经营数据之外,季逸超还分享了 Manus 团队是如何思考通用 Agent 的的下一步的,以及 AI Agent 和 AGI 未来到底有什么区别。

「现在大家几乎把一切都叫做 Agent。比如一个麦克风,有人会叫它是「有环境感知的收音 Agent。」季逸超开玩笑地讲道。

他也给出了拓展通用 Agent 能力下一步的两条主线: 其一,用多 Agent 协作把执行规模做宽 (如在大规模调研里衍生出上百个并行的子 Agent); 其二,给 Agent 打开更大的「工具面」 ,不把能力绑死在少数预置 API,而是像程序员一样调用开源生态、安装库、甚至在可视化后 看图自检并回改

季逸超还提到,今天的数字世界仍按「给人用」的范式建造——非 API 化网页、CAPTCHA、流程「小游戏化」带来大量摩擦, 瓶颈更像生态与制度约束,而非模型智力

这也是 Manus 参与 Stripe 活动的原因之一:双方正推进 在 Agent 内完成支付 ,把「研究—决策—下单/结算」连成闭环,用基础设施协作来消解世界的摩擦。

以下为对话精华,经极客公园编辑整理:

问:给观众简单介绍一下你自己吧。你最近关于「上下文工程」的博客非常鼓舞人心,我觉得对于在座任何正在开发 AI Agent 的人来说都是必读的。我每次去和工程师们吃午饭时,他们总是在谈论这个,所以我现在只能坐到别的地方(笑)。但对于现场可能不太熟悉 Manus 的人,你能分享一下你的经历和愿景吗?

答: 谢谢 Paul。很高兴能来到。Manus 在构建一个通用 AI Agent。

很多研究机构和公司,其实在尝试打造一个大脑——打造一个大语言模型。但我们认为,从消费者的角度来看,这其实并不好。AI 应该能真正采取行动,完成事情,所以我们构建了 Manus。

我们的方式,是让 AI 可以使用人类历史上最伟大的发明之一——通用计算机。给了 AI 计算机,它能做人类能做到的所有事。Manus 能真正完成任务。比如它可以帮你做演示文稿、帮你规划一次旅行,甚至能帮你运营社交媒体——虽然我并不推荐你真的这样做。

我们的用户真的很喜欢 Manus。 我们在三月份发布了 Manus,现在已经实现了大约 9000 万的收入运行率(RRR,Revenue Run Rate),很快就会突破 1 亿。

我觉得这对我们这样一个小型创业公司来说非常巨大。但更重要的是,这表明 AI Agent 已经不再只是一个研究领域的流行词,而是真正在被应用,落地生根。

我可以和大家分享一个我们构建 Manus 过程中的小故事。

我们其实从 Agent coding 的应用中得到了很多灵感。比如像 Cursor 这样的 AI 编程产品,之前已经吸引了很多关注。

作为工程师,我们自然会使用 Cursor。但让我们惊讶的是,公司里很多非工程师同事也在用 Cursor。当然,他们并不是在写软件,而是用它来做数据可视化,甚至写一些文章。他们会忽略左边的代码部分,只是跟 AI 对话来完成工作。

这让我们意识到:我们应该把这种方式泛化,赋能非程序员。这就是 AI 的一个用例。

问:我们越来越常听到人们谈论 AI Agent 和 AGI。你能不能帮我们更清楚地区分这两个概念?AI Agent 和 AGI 对你和 Manus 来说各自意味着什么?

答: 我们认为这是一个非常好的问题。

现在大家几乎把一切都叫做「Agent」。比如一个麦克风,有人会说它是「有环境感知的收音 Agent「。

但至少我们主张,Agent 应该是应用型 AI 的一个子集。我们不妨退一步,看看常见的 AI 应用类别。

大多数人已经熟悉两类:一类是聊天机器人,比如 ChatGPT;另一类是生成式工具,比如 MidJourney 或 Sora。 在这些系统中,通常只有两个角色:用户和模型。你和模型交互,得到输出。而 Agent 的不同在于,它除了用户和模型,还引入了第三个关键元素——环境。

这个「环境」的概念会因智能体类型不同而变化,比如在设计型 Agent 里,环境可能是一个画布或一段代码;而在 Manus 这里,我们的目标是让 Agent 出现在虚拟机甚至整个互联网中。这样 Agent 就能观察环境,决定下一步该做什么,并通过行动来改变环境。这让它非常强大。

比如在 Manus,你可以表达需求,它会打开浏览器、发布网页、帮你订一张机票。我很喜欢这个例子,因为虽然订机票听起来很简单,但这其实是 AI 在直接改变现实世界——结果不是模型的输出,而是你手里的机票。AI 真正介入了你的世界。这就是我们所说的 Agent。

简单来说,Agent 就是能代表用户与环境交互的 AI 系统。

至于 AGI,这个词也经常被提到,很多人把它等同于超级智能。我们认为,AGI 是一种能利用 AI 模型的通用能力,在不经过特别设计的情况下完成许多任务的系统。

我们认为「Agent coding」其实是通往 AGI 的一条路径。它不是一个垂直领域的能力,而是如果你把它赋予计算机,它几乎能在计算机上做任何事。所以对我们来说,AGI 的条件就是要构建足够完善的环境,让这种能力得以发挥。

问: AI 今天究竟在哪些场景中真正发挥了作用?未来会在哪些地方发挥作用?什么时候会出现 iPhone 时刻?

答: 就 Agent 而言,如果单看模型能力的话,现在的旗舰模型已经非常惊人了,几乎是「超人」级别的。它们可以在数学竞赛或逻辑推理上胜过我们大多数人。

但我认为,模型仍然像是「瓶子里的大脑」,如果想真正发挥力量,就必须让它们与真实世界交互、触达现实。但不幸的是,这正是问题开始的地方。

比如你让一个 AI 去做一些事务性的任务,它在重复性任务上确实很擅长。比如像 Deep Research 这样的产品,它只是聚合信息然后给出一个结果,它的输出只是简单地出现在那里。

举个例子,现在几乎所有东西都是为人类设计的,不只是物理世界,甚至数字世界也是这样。比如网页工具,它们就像小游戏一样,没有提供 API 或标准接口。验证码 CAPTCHA 无处不在,处处在拦截 Agent。

所以我认为 AI 在封闭的自包含任务中表现很好,但一旦涉及真实世界,就会遇到障碍。

未来什么时候能出现 iPhone 时刻?我觉得这并不是技术问题,而是更像是一种制度性限制。这不是像我们这样的 Agent 创业公司能够单独解决的事情。

我认为这需要一个渐进的转变,要求整个生态系统共同进化。这也需要像 Stripe 这样的公司在基础设施层面发力。比如我们正在集成新的 stripe 的 Agentic 支付 api。大家共同努力。

问:那我们能不能具体谈谈用户在使用 Manus 时的一些典型场景?他们是如何使用的?这其中体现出了怎样的力量?

答: 是的,我们虽然来自当前这一代 Agent,但已经看到很多很棒的用例。

比如说,我们刚刚搬到新加坡,需要雇佣房产中介来帮我们找住所。是真人 Agent(笑)。

而现在这些中介已经在使用 Manus:他们会根据客户的需求,用 Manus 来分析公司所在地、员工想住的区域,并生成相应的推荐。

我觉得这很有意思,因为这属于一种「长尾需求」。一般来说,并没有专门的 AI 产品是为这种具体场景设计的,但由于 Manus 是一个通用型 Agent,它就能满足这些需求。我们认为长尾需求非常值得关注。

从宏观角度看,它可能是长尾,但对具体用户而言,这正是他们的日常工作。这种场景特别有价值。

这就像今天的搜索引擎格局一样。如果你只是搜索一些常见的内容,不管用 Google 还是 Bing,结果质量差不多。那为什么人们会选择其中一个?可能是因为某个搜索引擎在特定时刻给了他们更合适的结果。而如果你搜索的是非常个性化或专业化的内容,就更能体现差异。所以我们认为通用型 Agent 的优势就在这里。

那如何让它更好呢?我们思考了很久,因为我们认为一切都绕不开编程。如果你把计算机交给 AI,那么它与环境交互的方式其实就是通过编程。

我们认为可以从两方面改进。第一是规模化。但如果你能把 Agent 的能力放大一百倍会怎样呢?

最近 Manus 刚刚发布了一个新功能,叫做 Wide Research。它的基本思路是允许一个 Agent 再衍生出上百个 Agent 一起去完成任务。你知道的, 如果只是让 AI 帮你做一些小事,很多时候你自己也能完成。但如果任务非常庞大,你一个人根本不可能完成,比如需要做大规模的研究,这时候让上百个 Agent 并行去做,就会变得非常强大。

其次,我们还需要让 Agent 更灵活地使用计算机使。比如,如果你只给一个 AI Agent 设置了预设工具,那么它的行动空间就被限制在这些工具里。但想象一下,如果你是一个程序员,你有整个开源社区的资源可以调用。

比如你在 3D 打印的时候,直接修改模型的参数很困难,但是你如果能找到 GitHub 上的合适的库,直接安装就能解决你的问题了。 在 Manus,我们在优化通用性,并且提出了一个概念,叫做「工具的网络效应」。

有一个很有意思的例子:很多用户在用 Manus 做数据可视化。你们知道,在亚洲有时候会遇到问题,比如在图表中显示中文时可能会出现字体错误。或许有些专业用户会写一些硬编码规则,比如在输出韩文时应该用哪种字体。但这种方式会让系统越来越僵化。

我们采取的办法是给系统增加了一个很简单的能力:查看图像。结果很惊喜——因为今天的模型已经很聪明了,它们会在生成可视化图像后自己检查,并意识到错误,然后再自动修正。我们发现, 增加工具的灵活性比硬编码规则能解决更多的问题。

问:这是一个令人兴奋的时代。我真的很激动,只希望自己能再年轻到三十岁(笑)。提到医学研究的,我知道 Manus 在这方面也很强。你们观察到有些用户在使用 Manus 研究医疗吗?

答: 很多人已经在用 Manus 做研究,不仅限于医学研究。我们觉得这很有意思,因为现在确实有很多所谓的「深度研究」产品,它们会帮你收集大量信息并做一些分析,但最后只给你一个 markdown 文件或文档。这远远不够。

很多时候,研究人员真正需要的,是能够直接交付给老板或团队的成果。所以我们在 Manus 上加强了研究结果的输出。例如在医学研究中,很多时候需要生成正式的报告,比如幻灯片报告之类的东西。因此我们必须优化 AI 的输出能力,以满足研究人员的需求。这是一种「工具化」的体验。

比如现在很多用户会先用 Manus 做研究,然后直接生成一个网站。你会觉得这和传统的网站搭建方式完全不同。

要知道,搭建一个网站本身其实不难,难的是如何确保数据的可靠性和准确性。所以我们认为,最好能在一次会话、一个共享的上下文中完成整个流程。这样,你的研究、你的见解就能无缝转化为最终成果。 这就是我们在 Manus 里所做的事情。

问:很多国家都在讨论一个话题:在 AI 时代,人类的未来和经济影响。你怎么看待就业被取代?又会出现哪些新的工作机会?

答: 我们的朋友和投资人也经常问我们这个问题。当我们推出 Manus 时,最初认为如果能构建这样一个 Agent,它就能帮人们节省很多时间,让大家轻松赚钱。

但实际上,我们发现这个愿景并没有完全实现。通过大量用户调研,我们发现用户在使用之后,他们反而工作得更多了。因为他们变得更高效了,他们实际上能做更多他们本来就很擅长的事情。这是第一点。

其次,我们认为 Manus 还打开了一个全新的空间。我们一直在讨论虚拟机和云计算。我们觉得 Manus 正在扮演一种「个人云计算平台」的角色。比如云计算已经存在几十年了,但它更多是工程师的特权,只有我们能通过编程来调用云的力量。普通知识工作者无法使用。

但现在有了像 Manus 这样的 AI Agent,人们可以用自然语言下达指令,让 AI 去执行。这等于解锁了一种全新的生产力。这就是我们所带来的。

而最后,关于「替代」,我认为其实很难。比如房产中介,他们每天都在用 Manus 完成日常工作。但你知道,AI 永远无法替代中介面对客户时的那种沟通方式。我们是一家 AI 公司,甚至 Manus 的发布视频都是由 Manus 写的脚本,但视频里出现的还是我,因为这是关于信任的事情。而信任,是不能完全交给 AI 的。

*头图来源:stripe

对话小米 AI 眼镜负责人:20 天卖光库存,但属于产品的「长跑」才刚开始

2011 年 8 月,雷军穿着标志性的黑 T 恤和牛仔裤,在北京 798 艺术中心发布了初代小米手机。在这款产品搅动整个智能手机行业之前,他首先用一个极具冲击力的数字定义了它——1999 元。

要在中国普及智能手机,至少在价格上要打破国际品牌的壁垒。这种思路,不仅定义了小米的第一个十年,也深深影响着小米的产品信条。

十多年后,当小米决定投身 AI 眼镜这片更具挑战的蓝海时,也秉持着一种类似的务实主义——「智能眼镜,首先得是一副眼镜」

雷军在发布会上介绍小米 AI 智能眼镜的过程中,其实并未兜售遥远的未来,而是选择以一款成熟的、不带显示能力的 AI 眼镜形态,去试探市场的真实水温。

这款眼镜看上去与普通黑框眼镜差别不大,没有夸张的科技元素,将核心的智能模块、电池与音频单元都收纳于镜腿之中。而推出这款产品的团队,则是在小米这家消费电子巨头内部,一个为探索下一代计算平台布局多年的团队。

该项目的负责人李创奇,是小米高级产品总监、可穿戴部创新业务负责人。

早在 2015 年,当他第一次看到微软 HoloLens 时,就认定眼镜作为个人计算的中枢,可能就在不远的未来,并为此开启了一场长达近十年的「蓄力」:为了理解光学显示,他去申请启动小米投影仪业务,由此推出的米家激光投影电视;为了攻克声学,他转而负责耳机业务;为了真正理解眼镜的本质,他甚至在 2021 年亲自带队,在小米内部做了一段时间传统太阳镜/防蓝光眼镜业务。

2023 年 7 月,李创奇觉得时机「快到了」,用户对一款可以日常佩戴并具备基础智能功能的眼镜的需求已清晰可见,小米 AI 眼镜项目正式立项。

 

小米高级产品总监、可穿戴部创新业务负责人李创奇|图片来源:小米

 

两年后,这款产品正式发布,市场反响远超内部最乐观的预期——为三个月准备的库存,在 20 多天内便销售一空,其销量达到了部分友商一年的水平。

小米 AI 眼镜作为初代产品,在重量、续航和佩戴舒适性上做到了微妙的平衡,最终将重量控制在 40 克。他们没有像 Meta 那样与眼镜巨头联名,而是选择自己完成从设计到生产的全过程,并为亚洲人的头型和脸型做了针对性优化。

「我们开始动手做的时候也觉得(这事)很容易,但后来发现,没有任何一个环节是简单的,」李创奇坦言,「这件事的难度远超过我们最早的评估」。从人机工学、材料选择到软件适配,每一步都充满了艰难的权衡。

这款售价 1999 元的产品,复刻了初代小米手机的定价,也承载了相似的雄心。这一定价背后,是小米对一个新兴品类战略性的投入与布局。

李创奇认为,在一个被科幻电影拉高了预期的市场,和一条尚未为眼镜形态准备好的供应链之间,存在着巨大的鸿沟。而小米要做的,不是一次性发布一款「100 分」的终极产品,而是开启一场「注定是马拉松」的长跑,用一款「60 分」的及格产品,为自己赢得进入下一赛段的资格。

本文基于极客公园与李创奇采访内容整理成文。

 

01

「60 分」的产品与「远超预期」的市场

 

极客公园: 小米 AI 眼镜上市后,市场反响非常火爆,20 多天就卖出了过去一些友商可能需要一年才能达到的销量,这显然远超了你们的预期。但在这种背景下,你却多次提到,你只给这款初代产品打「勉强及格」的 60 分。你如何解读这个「60 分」的产品?

李创奇: 其实我们内部,包括整个公司,都非常清楚这款产品处在什么样的阶段。说它 60 分,或者说它处在一个「快到了将可用的一个状态」,是一个非常客观的描述。

网络上的不少用户的吐槽我们都有看到,它(小米 AI 眼镜)不是一款各方面都没有短板、非常均衡的产品。它一定是在某些地方可用,某些地方还不错,但同时在另一些地方,也一定存在很大的差距。

这种差距的核心根源在于,当前消费者对眼镜的期望,和整个产业链、供应链的技术储备之间,存在一个巨大的鸿沟。用户的预期,尤其是在各种科幻电影的熏陶下,已经形成了一种对眼镜形态的终极认知。

但现实是,我们现有的产业链,无论是芯片、传感器还是电池技术,它的一切都是围绕着手机去构建的,它对于功耗和体积的考量,并不是为眼镜这种极致形态所储备的。

我们的产品能获得这样的市场反响,确实远超预期。最初我们备货非常保守,内部甚至弥漫着「卖不掉怎么办」的担忧。我们原本为三个月准备的货,结果 20 多天就卖完了,这个量级相当于一些专门做眼镜的公司一年的销量。

这背后,一方面有雷总亲自发布带来的巨大势能,另一方面也证明了市场对于 AI 硬件,尤其是来自一个主流品牌的 AI 硬件,存在着巨大的潜在需求。它甚至在小红书等社交平台引发了几次出圈,这说明它的吸引力已经超出了传统科技爱好者的范畴。

极客公园: 你们为首代小米 AI 眼镜定下了 1999 元这个价格,这个数字对小米而言有特殊的意义。它既是初代小米手机的价格,也似乎在暗示着 AI 眼镜作为下一个计算平台的雄心。这个定价背后是怎样的考量?

李创奇: 从我个人来说,1999 这个数字一定是有致敬因素在的。对我而言,它已经不单单是一个数字,它有情怀,有图腾,甚至有方向的感觉。

更重要的是我们希望锚定一个品类,而 1999 元,或许就是未来智能眼镜这个品类的中位数价格。

 

小米 AI 眼镜 1999 的售价并没有太多惊喜|图片来源:小米

 

但就目前阶段而言,以我们前期的投入和目前的规模,这个价格肯定是赔钱的。

这已经不是赚多赚少的问题,而是赔多赔少的问题。因为这是一款在极短时间内要完成的极其复杂的产品,我们在所有元器件的选择上,都把可靠性放在了成本之前,不计代价地去做。我们的 BOM(物料清单)成本,如果算上墨镜片,是超过 2000 元的。

所以,这个定价并非基于成本,而是一种战略性的选择。它是在向市场、向用户、向供应链传达一个信号:小米是认真地想把这个品类做大,并愿意为此进行先期投入。我们认为,目前市面上那些定价在 1499 元甚至 999 元的产品,从成本结构来看,都是不健康的。而 1999 元,在未来规模化之后,会是一个相对健康的价格区间。

这种「不健康」的亏损,换来的是一个极其宝贵的认知。保守的备货预期反映了我们最初对市场的不确定性,而最终火爆的销量则给了我们一个强有力的「市场验证」。

可以说,这款产品是我们投入市场的一个最精准的探针。正是这个远超预期的结果,为我们下一代产品的研发解锁了比初期多得多的内部资源和信心,让这个项目从一个谨慎的探索,正式升级为公司的战略级业务。

 

02

「首先它得是一副眼镜」

 

极客公园: 你在很多场合都强调一个理念——「智能眼镜,首先得是一副眼镜」。这听起来简单,但在实际产品定义和研发中,一定充满了各种艰难的取舍。能否具体谈谈,这个理念是如何指导你们在工程现实中做出选择的?

李创奇: 这个理念是我们走了很多弯路后得出的。小米很早就开始关注这个领域,从早期和 Facebook 合作 Oculus Go,到后来做无线 AR 眼镜预研,再到米家音频眼镜。

我们观察了从 Google Glass 到 Snapchat Spectacles 的演进,得出一个核心结论:过去很多产品失败,是因为它们过于强调「智能感、未来感、科技感」,而忽略了眼镜最本质的属性——佩戴。

所以,我们确立了「首先它得是一副眼镜」的原则。这意味着,你得戴着舒服,哪怕不那么惊艳,但至少不能突兀。基于这个原则,我们做出了几个关键决策。第一,从音频眼镜切入,因为音频是增加智能功能里,对体积、功耗影响最小,且最高频的应用之一。第二,我们很早就采用了镜腿和前框分离式的设计。

 

小米 AI 眼镜透明版配色比较有科技感|图片来源:极客公园

 

因为眼镜有很强的装饰属性,分离式设计能让用户未来更换不同款式的前框,满足个性化需求。

在这个基础上,我们对增加任何新的智能功能都秉持一个原则:谨慎,但有效。因为任何功能的加入,都会直接影响体积和功耗。功耗增加,为了维持续航,电池就得做大,体积又会增加,这是一个恶性循环。

极客公园: 这种「谨慎但有效」的原则,具体体现在哪些产品细节的权衡上?比如,你们如何看待和 Meta Ray-Ban 的差异?

李创奇: 这种权衡其实在我们的产品中随处可见,它是一系列「戴着镣铐跳舞」的决策。

首先是 重量 vs. 质感。我们内部有一个非常严苛的目标,就是重量不能超过 40 克,最理想是做到 35 克。为了实现这个目标,在电池比 Meta 更大、且采用双芯片架构的情况下,我们最终把重量控制在了 40 克左右,比它还轻。

但这背后是有代价的,我们牺牲了材料的密度,这导致一些用户在拿到手上时会觉得「塑料感」比较强,质感不如 Meta。

但现在回过头看,这可能真的是一个设计上值得商榷的部分,也许用户真的愿意为更好的质感多承受三四克的重量。

其次是 端侧 AI vs. 续航。我们最初也评估过在眼镜上部署端侧小模型,比如 0.3B 规模的。

但我们很快发现,在手机上跑一个 0.3B 模型可能不算什么,但在我们仅有 200 多毫安时电池的眼镜上,它的功耗是毁灭性的,可能半小时到一个小时就没电了。相比之下,通过蓝牙与手机通信,利用手机或云端的算力,功耗收益要明显得多。所以现阶段,我们宁愿选择通信的方式来解决算力问题。

再者是 单一框型 vs. 个性化。初代产品我们只推出了一种框型,这背后是我们对这个品类「信心还是不够的」一个体现。我们深知,没有任何一副眼镜能让 100% 的人戴上都好看。这导致我们收到一部分用户反馈,觉得不适合自己的脸型。

这是一个现实的能力短板,传统眼镜品牌会用成百上千个 SKU 来解决这个问题。我们未来一定会提供更多选择,但第一代产品,我们选择了用一个最大公约数的设计去验证核心功能和市场接受度。

最后是 充电方式的选择。很多人问为什么不做充电眼镜盒,而是用直插充电。我的回答很简单,我问我们团队 20 个戴眼镜的同事:『你们的眼镜盒在哪?』。其次,如果眼镜在盒里充电,那这个过程中你戴什么呢?难道要用户买两副换着戴吗?如果是我们这么做,一定会被骂死。是 Meta 和 Ray-Ban 的品牌光环,掩盖了它的一些问题。

和 Meta 的对比其实也很有意思。比如 Meta 验证了一件事:用户是可以接受把一颗 1200 万像素的大尺寸传感器放在镜腿上的。这给了我们很大的启发,让我们坚定了从过去考虑的 500 万或 800 万像素转向更高规格的影像能力。

但同时,我们也看到了它的不足。比如它的续航,在我们看来是「不及格」的,无法支撑一天的佩戴。另外,它的设计对亚洲人的头型并不友好,很多人戴上会觉得「夹头」。这些都是我们在设计中希望改进和超越的地方。

 

小米 AI 眼镜透明版镜架|图片来源:极客公园

 

 

03

一场注定的马拉松

 

极客公园: 你认为,在当前这个时间点,什么样的公司才有可能在这场「百镜大战」中最终胜出?

李创奇: 我们和很多投行的朋友聊过,我个人的观点是,只有两类公司有机会。第一类,是有手机和穿戴生态的公司,全球来看就是苹果、三星、华为和小米。第二类,是有国民级 APP 和顶级大模型的互联网公司,比如腾讯、字节跳动等。

为什么这么说?因为 AI 眼镜不是一个单纯的硬件问题,它是一个极其复杂的系统工程。你需要解决硬件、操作系统、大模型、营销渠道以及与其他设备联动等一系列问题。

对于创业公司来说,这几乎是不可能完成的任务。我甚至会委婉地建议我关系好的投资人朋友,不要轻易投这个领域的创业公司。

这个赛道的护城河,最终不是设备本身,而是它背后的生态。对小米而言,我们最大的优势在于,我们拥有全球最大的消费物联网平台。

我们的用户已经习惯了用「小爱同学」去控制家里的空调、灯光、扫地机器人。当这种控制能力无缝地迁移到眼镜上时,它所创造的价值是任何一个创业公司都无法比拟的。

极客公园: 既然这是一场马拉松,小米为这场长跑设定了怎样的阶段性目标和时间表?

李创奇: 我们对这件事的难度有清醒的认知。我个人最美好的预期是,这个市场需要三年时间,才有可能真正成熟起来,到那时我们或许能做出一款七八十分的产品。

在销量上,我们也有一个长期的期望。中国每年近视眼镜的出货量接近 3 亿副,其中千元以上的市场规模大约在 5000 万副。我们希望在未来三年,能做到年出货 500 万副的规模,这相当于在千元以上这个核心市场里,占据 10% 左右的份额。这是一个非常美好的目标,也是一个有挑战性的期望。

要达到这个目标,不能只靠一代产品。我们下一代的研发已经启动了。

随着第一代产品的成功,项目组现在拿到的资源已经比刚开始的时候好太多了,这让我们有更足的底气去实现最初的构想。

 

04

AI 眼镜的终局在哪里

 

极客公园: 跳出具体的产品和市场,从更宏大的视角来看,你认为 AI 眼镜这个形态,它最终要解决什么问题?它的终局会是什么样的?

李创奇: 我有一个很早有过的观点,可能比扎克伯格提的还要早一些。AI 眼镜的终极价值,在于实现「See what you see, hear what you hear」(所见即所见,所闻即所闻)。

它不仅仅是一个拍照工具或音乐播放器,它是 AI 的一个感官延伸。它能以第一视角去理解你所处的物理世界,理解你的上下文,这是手机放在口袋里永远无法做到的。

我今天有一个更进一步的判断:由大模型赋能的智能眼镜,可能是脑机接口真正普及化之前,最能够理解和识别用户意图的消费级设备。

人类 70% 到 80% 的信息获取来自于视觉,一个能够分享你视觉的设备,在理解你的意图上拥有天然的、无与伦比的优势。从鼠标到触摸屏,再到语音助手,人机交互的历史,就是一部不断降低意图传递摩擦力的历史。AI 眼镜,就是这个历史进程中合乎逻辑的下一站。

极客公园: 这听起来是一个非常宏大的愿景。但它似乎更偏向于用 AI 增强现实世界,而不是像 Meta 或苹果那样,构建一个虚拟世界。

李创奇: 是的,这是一个战略选择。我们短时间内不会碰 MR(混合现实)。我们的优势在于硬件和庞大的 IoT 生态。

所以,我们的路径是清晰的:用 AI 眼镜更好地连接和赋能用户与物理世界的交互,而不是把他们带入一个虚拟世界。这与 Meta 的路径有本质的不同。

极客公园: 听下来,感觉 AI 眼镜这个项目对你个人而言,似乎有着其他项目难以比拟的意义。

李创奇: 我是从 2015 年看到微软的 HoloLens 之后,就决定要用至少十年的时间来做眼镜这个产品。这是一个漫长的、有意识的积累过程。

当时你显然不可能直接跟雷总说,HoloLens 就是未来,给我 100 亿让我去造一台出来。所以我把它拆解开,一步步来。HoloLens 的核心是光学显示,我就去申请做了投影仪业务;它需要强大的声学能力,我就去做了耳机业务;为了理解眼镜本身,2021 年我们甚至还做了一段时间的传统眼镜业务。

所有这些积累,都是为了保证我们今天在做 AI 眼镜时,能对这个品类的复杂性有足够的认知,能少犯一些错误。但即便如此,这件事的难度依然远超我们最初的评估。让整个团队对这些困难建立共识,是其中最难的一环。

所以,我们坚定地看好这个方向,但它注定是一场马拉松。物理世界不会以你的意志为转移,你必须在如此狭小的空间里,去完成一项如此复杂的系统工程。这需要极大的耐心,也需要对行业规律抱有足够的尊重。

我们并不是要去颠覆一个行业,而是希望用我们的努力,去推动和符合大家对这个行业的最终认知。

DeepSeek V3.1 发布:更强的 Agent ,更贵的 API;多家网约车平台集体降抽成;影石发布 4K 画质「口袋相机」|极客早知道

DeepSeek V3.1 发布:更强的 Agent 能力,更贵的 API

8 月 21 日,DeepSeek 正式发布新模型 V3.1,被官方称为「迈向智能体时代的第一步」。虽然未见期待已久的 R2 模型,但本次迭代重点在于 更强的 Agent 能力、混合思考模式与更高思考效率。

V3.1 采用混合推理架构,用户可在「思考模式」与「非思考模式」间自由切换:复杂任务可调用深度推理,简单任务则快速响应,避免性能浪费。官方测试显示,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,表现与此前 R1-0528 持平甚至更快。

此外,新模型在工具调用和智能体任务中的表现明显提升,编程与搜索 Agent 测评均优于前代。基础模型在 V3 的基础上新增 8400 亿 tokens 训练,并已在 Huggingface 与魔搭开源。DeepSeek 同时宣布支持 Anthropic API 格式,方便用户将其能力接入 Claude Code 框架。

值得注意的是,API 价格同步上调:自 9 月 6 日起,取消夜间优惠,输入价格缓存命中为 0.5 元/百万 tokens,未命中 4 元(此前 2 元),输出价格则由 8 元涨至 12 元/百万 tokens。(来源:第一财经)

GPT-6 进入开发阶段,将首次引入「个性化记忆」功能

8 月 21 日,据报道,OpenAI 首席执行官 Sam Altman 近期在多场采访中透露了下一代大模型 GPT-6 的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从 GPT-4 到 GPT-5 的周期更快,并将首次引入「个性化记忆」功能。

据介绍,新模型会长期记住用户的身份、语言风格、关注领域、日常习惯,甚至细微癖好,并据此持续调整回答方式,实现「越用越懂你」。用户可基于 GPT-6 创建专属于自己的聊天机器人,用于工作、学习或生活场景,机器人将精准复刻个人偏好与沟通语气。

Sam Altman 还提及到,OpenAI 正与心理学家合作,通过测量情绪反应与长期幸福感来优化交互体验,相关数据未来可能公开。

针对记忆带来的隐私风险,Sam Altman 表示未来可能引入加密机制,尤其在医疗、法律等敏感场景。简言之,GPT-6 将不再只是「问答工具」,而会成为长期陪伴、深度理解用户偏好的「数字伙伴」。(来源:OSCHINA)

 

马斯克称星舰第 10 次试飞周日发射,Grok 5 下月开始训练

8 月 21 日,伊隆・马斯克在 X 平台透露了其业务的后续规划:

  • Starship 10(星舰第 10 次试飞)将于本周日发射

  • Grok 5 将于下个月开始训练

  • 特斯拉 Autopilot V14 也将于下个月推出

这是星舰今年第 4 次试飞,此前 3 次均因上级火箭失利未能完全达成任务目标。(来源:IT之家)

滴滴出行、曹操出行、T3 出行等多家网约车平台集体降抽成

8 月 21 日,据第一财经报道,滴滴出行表示,今年年底前,平台将把每笔订单最高抽成上限从 29% 降至 27%,超出 27% 的部分将随单返还。同时,针对每月在平台完成订单达到 50 单的司机,平台将通过「返佣宝」保障其当月月均抽成上限不超过 25%,超过部分将在次月自动返还至司机账户。

T3 出行表示平台订单的抽成比例最高不超过 27%,今年年底前将抽成比例 26%-27% 的订单数量占比从 21% 降至 17%。对于每月订单完成量不少于 50 单的平台司机,保障其当月流水总额的抽成上限不超过 25%,超出部分自动返还司机。

曹操出行则在 8 月 15 日表示,自当日起曹操出行 APP、小程序订单的抽成比例上限将由原来的 22.7% 下调至 22.5%。

聚合平台也表示将下调信息服务费。8 月 18 日,高德打车表示,推动不少于 80 家合作网约车平台的抽成比例上限不超过 27%(含高德平台向合作网约车平台收取的信息服务费,司机收入不低于乘客实付费用的 73%),惠及超百万司机。高德打车信息服务费上限全部降至 9%,并通过减免佣活动、专项奖励等方式推动合作平台综合成本降低 2%。(来源:DoNews)

 

​特斯拉大模型「上车」细节曝光:语音助手接入豆包与 DeepSeek

8 月 21 日,特斯拉正在为其车辆的语音助手功能引入更强的 AI 能力。根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。

条款内容显示,特斯拉的语音助手将得到 火山引擎提供的 Doubao 大模型(云雀大模型)和DeepSeek Chat 的技术支持。这意味着,在具备 AI 互动能力的特斯拉车辆上,车主不仅能通过语音命令控制车辆功能,未来还将能与语音助手进行轻松聊天,以获取资讯、查询天气等,实现更自然的智能座舱交互体验。车主可通过物理按键或「嘿,Tesla」等唤醒词激活该功能。官方暂未公布 AI 互动的具体上线时间。(来源:cnBeta)

 

B 站发布 2025 年 Q2 财报:日均活跃用户 1.09 亿,调整后净利润 5.6 亿元

8 月 21 日,哔哩哔哩(以下简称「B 站」)公布了截至 2025 年 6 月 30 日第二季度未经审计的财务报告。财报显示,2025 年第二季度 B 站总营收达 73.4 亿元人民币,同比增长 20%。

二季度,B 站广告业务收入为 24.5 亿元,同比增长 20%;游戏业务收入为 16.1 亿元,同比增长 60%。运营效率的提升与高毛利业务的快速增长,推动 B 站毛利润同比增长 46%,毛利率连续十二个季度环比提升至 36.5%;净利润和调整后净利润均创下历史新高,分别为 2.2 亿元和 5.6 亿元。

商业化效率提升的同时,B 站社区规模与活力持续提升。二季度,B 站日均活跃用户数达 1.09 亿,同比增长 7%,创历史新高;月均活跃用户数达 3.63 亿,同比增长 8%;月均付费用户达 3100 万,同比增长 9%。本季度,B 站用户日均使用时长达 105 分钟,相较于去年同期增长 6 分钟。(来源:网易新闻)

vivo 发布 MR 头显 vivo Vision 探索版:全球最轻,双目 8K

8 月 21 日,vivo 在东莞发布首款混合现实(MR)头显——vivo Vision 探索版。 这是国内手机品牌首次进入高端 MR 市场,设备重量 398 克,搭载第二代骁龙 XR2+ 平台,配备双目 8K Micro-OLED 屏幕,主打轻量化与高分辨率显示。

在交互方面,vivo Vision 支持自然眼手交互,并内置虚拟助手「蓝心小 V」,提供语音陪伴和功能引导。硬件上,设备支持最高 1000 度近视调节,标配磁吸光学镜片,并通过空间相册、沉浸式娱乐和多窗口办公等场景,尝试拓展使用范围。

vivo 强调,这款产品不仅是单一头显,而是其全场景生态战略的一部分。例如,用户可通过与旗舰手机 X200 Ultra 配合,实现从 3D 拍摄到头显端回看的体验闭环。

目前,vivo Vision 探索版尚未公布价格,也不会在 2025 年内启动公开销售。自 8 月 22 日起,北京、深圳等十余座城市的 12 家 vivo 体验店将开放预约试用,后续计划扩展更多门店。

 

影石发布 4K 旗舰画质「口袋相机」GO Ultra:1/1.28 英寸大底传感器,5nm AI 芯片加持

8 月 21 日,影石 Insta360 正式发布首款旗舰画质口袋相机 GO Ultra,定位为 GO 系列全新旗舰子线。新机延续「小体积+专业性能」的路线,主机仅重 53g,单机续航达 70 分钟,搭配拓展舱可突破 200 分钟,支持 12 分钟充至 80% 电量,成为全球首款搭载叠片电池的运动相机。

GO Ultra 采用 1/1.28 英寸大底传感器和 5nm AI 芯片,算力提升 50 倍,支持 4K 60fps 拍摄,新增夜景模式与 PureShot 纯净拍摄功能,暗光细节提升显著。机身配备磁吸系统和随心贴、快拆等配件,可实现胸挂、帽夹等多样化拍摄,满足日常、运动与亲子场景。

 

在运动拍摄上,GO Ultra 提供 156° 超广角视野与 FlowState 防抖技术,支持 10 米防水及多种降风噪模式,兼容 Apple Watch、Strava 等运动生态,获环法冠军塔代伊·波加查等职业运动员认可。在亲子和 Vlog 领域,其「小方块」造型更贴合日常,支持一键开拍、横竖屏秒切与无线预览,AI 自动生成「亲子时光」相册,成为家庭记录的理想工具。

自 GO 系列诞生以来,其「蚊子视角」视频风靡全球,此次 GO Ultra 的推出,进一步丰富了 GO 系列产品线,延续「让创作触手可及」的理念。该机现已在官方商城、天猫及京东等平台发售,售价 2598 元起。(来源:极客公园)

 

中国市场尺寸最大纯电 SUV:全新蔚来 ES8 预售,41.68 万 / 租电 30.88 万元起

8 月 21 日,蔚来全新一代 ES8 正式发布并开启预售,定位全场景科技旗舰 SUV,将于 9 月下旬上市交付。

价格方面,六座与七座行政豪华版起售价 41.68 万元,签名版 45.68 万元,均可选择租电方案,起价 30.88 万元。

新车车长 5280mm、轴距 3130mm,是当前中国市场尺寸最大的纯电 SUV。全车搭载 31 个感知硬件,其中包括 3 个激光雷达,车内采用实木、金属饰条与大面积刺绣工艺。车舱面积 6.2 平方米,支持 6 人携带 12 箱行李,前后备箱总容积 777L。

内饰配备 Skyline 天际线屏、横幅中控屏和升级的 NOMI 系统,共有 111 个实体按键。三排座椅均支持零重力或放平功能,并提供 1.7 平米智能隐私车窗。影音方面,首发 21.4 英寸天空屏,内置 2600W 环绕音响系统,支持杜比全景声与视界。

动力系统基于 900V 架构,双电机总功率 520kW、扭矩 700N·m,零百加速 3.97 秒,CLTC 续航 635 公里。标配双腔空气悬架和智能湿地模式,最小转弯半径 5.7 米。

安全方面,新车配备 11 气囊、72 项碰撞验证和 65 项主动辅助功能,并首发“智能守卫模式”,可在检测水淹风险时自动升起悬架、提醒车主,未来或支持自动驶离危险场景。(来源:IT之家)

 

比亚迪新一代「小白桩」:「灵充」汽车充电桩发布,3.5kW 和 7kW 双版本

8 月 21 日,比亚迪宣布推出「灵充」充电桩,是旗下新一代「小白桩」产品,现已全面开放销售。

相比上一代充电桩,比亚迪「灵充」充电桩改为了更加圆润的设计,3.5kW 和 7kW 双版本可选;支持即插即充或 NFC 刷卡,且支持手机复制卡片信息,轻轻一碰即可启动。

「灵充」充电桩号称深度兼容主流新能源汽车品牌,告别为不同车型寻找专用桩的烦恼;支持超长质保,小智版再送 6 年流量桩体防伪码,扫码可辨真伪。

安全方面,「灵充」充电桩支持 11 重防护,并通过了高温、盐雾、潮湿等环境测试。

在比亚迪官方线上商城,暂未找到「灵充」充电桩售卖渠道。上一代充电桩搭配安装服务定价 1499 元。(来源:IT之家)

罗永浩进军泡面赛道:推出康师傅特别特 TBT 鲜泡面限定版,约 10 元一碗

8 月 21 日消息,罗永浩在抖音康师傅官方旗舰店发布「9 年磨一面」的特别特(TBT)鲜泡面,并公布了该面的罗永浩特别限定款。

特别特鲜泡面号称是「中国单篓水煮工艺鲜泡面开创者」,有海味龙虾、山野红酸汤、烧汁雪花牛肉三种口味,在盖子顶部配有筷子。

定价方面,特别特鲜泡面 4 桶装 39.9 元,6 桶装 59.9 元。开售仅 1 小时,销量已突破 7.1 万单。IT 之家注意到,开售 2 小时后,直播商品链接中的「罗永浩专属」泡面组合显示已售罄。@ 罗永浩的十字路口 账号也表示,10000 份 TBT 限定款售罄。(来源:IT之家)

汽车业务还没盈利,小米却已找到「第三曲线」

连续五个季度,小米都实现了营收同比 30% 以上的增长。「史上最佳」这个词,从传播的角度来看,放在小米身上好像已经不够刺激了。

刚刚过去的第二季度里,小米 YU7 是毫无疑问的明星产品,发售 18 小时即收获了 24 万订单,几乎是很多友商一年的量;而首款 AI 眼镜的发布,也成为了 AI 硬件领域里最受关注的一款产品。

8 月 19 日晚,小米集团发布了 2025 年第二季度财报。本季度,小米集团整体营收达 1160 亿元,同比增长 30.5%;经调整净利润为 108 亿元,同比大增 75.4%。

在这些已经有些「审美疲劳」的高分答卷里,我们突然发现冰山下,过往并不在聚光灯下的大家电版本正在快速增长。

官方信息显示,第二季度小米空调、冰箱、洗衣机三大「大家电」品类的出货量分别增长超过 60%、25% 和 45%。其中,小米空调在线上渠道的出货量已经从去年的第四名,来到行业前三。按极客公园估算,小米空调的单季度营收预计将占到整个 IoT 业务营收的三分之一。

在智能手机整体行业增长远低于预期的情况下,IoT 业务和手机业务之间的差距也在逐渐缩小。尽管没有小米汽车那样浓的爆款光环,也没有 AI 硬件那样性感的资本故事,但大家电业务,似乎正在依靠着稳定的出货量增长,成为小米第三曲线。

站在这个节点观察小米,我们发现小米的创新,不止造车这一件事。

 

小米的「第三曲线」,竟然是空调?

相比「老本行」的手机业务,以及雷军亲自带队、爆款频出的智能电动车业务,小米的「IoT 与生活消费产品」(以下简称「IoT 业务」)很长一段时间里并没有被外界划分到小米最核心的业务范畴里。

不过,这种情况正在发生转变。

从整体营收规模看,IoT 业务在集团整体营收中贡献越来越大。在智能手机行业整体陷入超低速增长的大环境下,IoT 业务和手机业务之间的差距也在逐渐缩小。

财报显示,2025 年第二季度,IoT 板块总营收达到 387 亿,同比增长 44.7%,占本季度集团总营收的 33.4%。值得一提的是,该板块整体营收规模和「智能手机」板块之间的差值,从上一季度的 183 亿元,迅速缩小至 68 亿元。

小米「手机 x AIoT」分部第二季度营收情况 | 来源:小米财报

在小米的业务构成中,IoT 业务板块除了大家电(也就是「空冰洗」三大品类),还包括平板、笔记本电脑、可穿戴的智能手表手环等其他诸多品类。

小米并没有公布不同品类的详细营收数据。不过,我们可以尝试进行一个非常粗略的估算:

首先,按照官方口径,小米空调本季度出货量超过了 540 万台;其次,小米集团总裁卢伟冰的个人微博账号近日转发的一条动态显示,7 月小米空调线上渠道的均价为 2513 元。卢伟冰在业绩沟通会上也表示,空调品类的平均单价大约「上涨了 200 元左右」,是行业价格战背景下,是为数不多「量价齐升」的品牌。

即便我们按照平均单价 2000 元进行估算,那么第二季度小米空调的营收也超过 108 亿元;如果按照 2500 元计算,则空调品类季度总营收大约为 135 亿元。所以,即使是粗略估算,我们也可以说小米空调在过去一个季度的营收已接近甚至超过整个 IoT 业务的三分之一。

小米大家电第二季度出货量数据 | 来源:小米

在大家电的其他两个品类里,冰箱第二季度出货量超 79 万台,同比增长 25%;洗衣机出货量超 60 万台,出货量同比增长 45%。整个大家电板块收入同比增长 66.2%。

可以说,本季度 IoT 业务整体 44.7%的营收增长,和大家电业务的增长贡献是密不可分的。

与此同时,在大家电品类(尤其是空调),小米也正在成为行业一股不可忽视的力量。

美的集团董事长兼总裁方洪波曾在上半年表示,要在「战术上重视小米,战略上不害怕小米」。美的今年提出「以简化促增长」的经营思路,也被认为和小米爆款战略的影响有关。方洪波表示,美的一上来就做几百款产品,「很多是多余的」。

从成绩来看,进入 2025 年,小米在国内空调市场的线下份额也从去年的第四进入到前三。不过,在线下渠道方面,格力、美的、海尔等传统巨头的销售份额仍大幅领先,而小米在线下的销售份额还有待提升。

而接下来即将投产的小米武汉家电工厂,将核心聚焦在空调品类,实现自产自研。卢伟冰表示,在中国市场「还有几倍的成长空间」。

 

小米汽车:超高毛利,盈利在即

汽车业务方面,无论是交付量、毛利率还是单车销售价格,小米汽车业务继续维持着稳步前进。笔者个人认为,有两项数据尤其值得一提:

第一,小米汽车单车平均售价从 Q1 的 22.86 万元上升到了 25.37 万元,增幅为 10.9%。

官方将 ASP 上涨的原因描述为:「由于交付 ASP 较高的 Xiaomi SU7 Ultra 所致」。但其实还有一个更重要的原因在于:由于小米前三款产品的爆款属性,小米汽车几乎是如今汽车行业里唯一可以做到既不降价,还可以同时进行「权益退坡」的品牌。

这其中最核心的原因当然还是不愁卖。小米 YU7 开始 18 小时,锁单量就超过了 24 万台。笔者今天在小米汽车 App 上发现,目前预定小米 YU7,预计最快交付周期l为 41-44 周(Max 版本),普通版交付周期「最快」为 55-58 周;小米 SU7 要好一些,最快 34 周就可以提车;小米 SU7 Ultra 仅需 9-12 周。

所以,那句著名的「早买早享受,晚买享折扣」放在小米汽车上可能并不适用。举个例子,如果你在 8 月选购小米 YU7,那么前排的两个零重力座椅的选装就需要多花 18000 元——因为上市权益到期截止了,而官方也不需要用其他降价的行为来促进销量。

通过这张小米官方的交付柱状图就可以看出来,目前制约小米汽车业务的最大障碍就是产能本身。

笔者今天在小米汽车 App 上发现,目前预定小米 YU7,预计最快交付首期仍然长达 41-44 周(Max 版本),普通版交付周期更是要 55-58 周(超过一年);小米 SU7 要稍好一些,最快 34 周就可以提车。

第二,小米汽车在单季度交付 8.1 万台的数据上,就可以拥有 26.4%的高毛利率。

8.1 万台的季度交付量并不能算「新势力」里最顶尖的水准。作为对比,今年增速最猛的零跑和小鹏,第二季度交付量都超过了 10 万台。但小米汽车的毛利率目前却超过了小鹏(17.3%)、零跑(13.6%),甚至比年销量超过 400 万台的比亚迪毛利率还高。

可以说,小米如今的赚钱能力,只有「问界」品类母公司赛力斯可以与之一战了——后者一季度的毛利率为 27.6%。

高毛利率的核心,一方面来源于小米汽车规模持续增长;另一方面则是由「爆款战略」所致。

仍然以前述零跑、小鹏为例,两者目前在售车型均为 7 款,而只有 3 个 SKU 的小米,在零部件采购、复用的效率上极有可能会高出不少。卢伟冰在业绩沟通会上将小米汽车目前的高毛利总结为「平台化+标准化+爆款」的结果。

在规模化+高毛利的双重作用下,小米汽车业务本季度的亏损金额从 Q1 的 5 亿元收窄至 3 亿元。卢伟冰再次强调,下半年实现季度亏损的目标不变,年度 35 万台的交付目标也不变。这意味着下半年,小米汽车月均交付量将稳步突破 3 万台。

卢伟冰同时确认了小米汽车 2027 年出海欧洲的战略目标,并表示已经在调研和筹备中。他表示,已经有用户把左舵的小米汽车在英国成功上牌,自己「不是特别担心」欧洲用户对小米汽车品牌的认知和兴趣。

 

在 AI 怎么花钱,小米有了更清晰的表达

作为手握千亿现金的「北京现金王」,小米对于 AI 等领域的投入态度也是业绩沟通会上的一大关注重点。

第二季度,小米推出了自主研发设计的 SoC 芯片玄戒 O1。雷军表示玄戒累计投入已超过 135 亿人民币,今年预计的研发费用将超过 60 亿元。

卢伟冰表示,在芯片层面上主要的投入是「人员费用」。

而在 AI 层面,投入则主要针对硬件和算力,大约占全年 300 亿研发预算的 25%左右。现阶段,小米在技术投入的核心分为三大板块:芯片、OS 和 AI。

在最近讨论火热的机器人领域,小米其实已投资 4-5 年。卢伟冰在业绩会上透露,小米看好人形机器人在工厂的使用场景。其衡量的标准是「首先看能否完成业务闭环,其次才是效率提升」。由此推测,小米也许对于机器人复杂任务的「通用」属性更为看重。

事实上,尽管目前小米在智能电动车、智能家电等品类里出现了多款爆品,同时也发布了首款 AI 眼镜。但截止目前为止,他们在 AI 领域依旧是相对低调的存在。自研芯片、AI 能力和小米一直希望追求的高端化息息相关,我们还需要等待小米接下来交出的答卷。

❌