普通视图

发现新文章,点击刷新页面。
今天 — 2025年8月14日极客公园

AI独角兽498家,估值2.7万亿美元;《王者荣耀》连续三年成全球最吸金手游;抖音测试「快递」服务|极客早知道

2025年8月14日 08:10

指责苹果偏袒 ChatGPT 后,马斯克与 Altman 在网上互喷

8 月 13 日,伊隆・马斯克与 Sam Altman 又在网上起了冲突,前天,马斯克在自己的社交媒体平台 X 上向苹果发出了「立即采取法律行动」的威胁,指控苹果在 App Store 中存在垄断行为,偏袒 OpenAI 的 ChatGPT,而对 X 的 Grok 聊天机器人不公。

「苹果的行为使得除了 OpenAI 之外的任何人工智能公司都无法在 App Store 中登上榜首,这无疑是反垄断行为,xAI 将立即采取法律行动。」马斯克在 X 上写道,尽管他并未提供任何证据来支持自己的指控。

Sam Altman 迅速对马斯克的指责作出回应,他在周二晚上的 X 帖子中写道:「鉴于我听说伊隆为了操纵 X 来为自己和自己的公司谋利,损害竞争对手和他不喜欢的人,这种指控真是令人惊叹。」 Sam Altman 还引用了 2023 年技术新闻网站 Platformer 的一份报告,该报告描述了马斯克在收购 Twitter(现为 X)后,对平台进行了大规模的调整,并「创建了一个系统,让你首先看到他的所有推文」。

Sam Altman 表示,如果马斯克真的提起诉讼,他希望这能引发「反向调查」,他和其他许多人「都非常想知道到底发生了什么」。

这场争吵在周三早晨仍在继续。马斯克在 X 上指责 Sam Altman ,称「你这个骗子,你的胡说八道帖子的浏览量有 300 万次,比我的很多帖子浏览量都高,尽管我的粉丝数量是你的 50 倍。」Sam Altman 又回复道:「你能签署一份宣誓书,证明你从未要求 X 工程师修改算法进行任何损害竞争对手或帮助你自己公司的做法吗?如果能,我会道歉。」(来源:IT之家)

​微软挖角 Meta:强制匹配薪酬、高层快速拍板

8 月 13 日,微软公司正在争夺 Meta 的 AI 人才。根据内部人士提供的信息和《商业内幕》所查阅的内部文件,微软已整理了一份其最需要的 Meta 工程师和研究人员名单,并且正在启动一项新的流程,旨在让其招聘条件更具竞争力,其中包括强制要求公司匹配 Meta 为顶尖人才提供的薪酬。

微软最近发布了一份靓丽财报,推动其市值一度突破 4 万亿美元,这在很大程度上得益于市场对生成式 AI 的追捧。为了保持住这一良好发展态势,微软需要吸引顶尖的 AI 工程师和研究人员。尽管公司今年已裁员数千人,但其坚称员工总数将保持稳定,表明公司有大规模招聘计划。(来源:凤凰科技)

 

OpenAI 推出超值 ChatGPT Go 套餐:仅 399 卢比,约 33 元

8 月 13 日,OpenAI 正式推出了一款名为「ChatGPT Go」的新订阅套餐,其月费仅为 399 印度卢比(约合 32.7 元人民币)。但需要注意的是,这一超值套餐目前仅在特定地区推出,主要针对像印度这样的发展中国家用户。

这一新套餐的推出,意在满足更多用户对 AI 服务的需求。相比于之前的免费版本,ChatGPT Go 在多个方面进行了提升。用户将享受到更多的对话次数,能够上传文件,甚至享有更强大的图像生成能力。这意味着用户在与 AI 互动时,可以获得更丰富和多样化的体验。此外,Go 套餐还提供了一些高级功能,比如有限的深度研究能力、更长的记忆和上下文支持,以及扩展的高级数据分析功能。(来源:aibase)

 

腾讯 Q2 财报电话会:AI 投入加码,广告、云、C 端应用全面开花

8 月 13 日晚,腾讯交出了 2025 年二季度成绩单——营收 1845 亿元,同比 +15%,净利 556 亿元,同比 +17%。在财报电话会上,马化腾、刘炽平等高管多次提到 AI,这已成为腾讯战略的「底色」。

广告业务上,AI 精准投放让点击率显著提升,短视频广告加载率仍只有 3-6%,相比同行 13-16% 的水平,留有巨大提升空间。视频号和搜索流量持续增长,加上生成式 AI 制作广告与电商闭环的拉动,广告收入有望长期向上。

C 端应用方面,「元宝」成了腾讯 AI 的主力应用,已进入快速推广与产品打磨的双循环;微信搜索、腾讯会议、腾讯文档乃至游戏内的 AI 功能,也在潜移默化改变用户习惯。刘炽平强调,小模型+推理优化能有效控制成本,中国用户付费习惯不同,未来可能更多探索广告驱动的 AI 变现。

企业服务方面,GPU 租赁和 API 调用需求上升,带动云业务加速。过去几年云业务「减重」后,盈利基础更稳,不再过度依赖 GPU 供给,而是 CPU、存储、CDN 等多线增长。(来源:IT之家)

 

谷歌:AI 时代中国出海开发者成全球创新中坚

8 月 13 日,2025 年谷歌中国开发者大会在上海召开,谷歌大中华区及韩国总裁陈俊廷表示,中国出海开发者已成为全球创新舞台的重要力量,AI 正让复杂开发变得简单。Google Play 年度最佳榜单中,有 12 家中国团队的 13 款应用在全球获 14 项大奖。

大会上,多家中国团队展示了出海 AI 产品:如 2021 年成立的 PLAUD AI 主攻海外录音市场,结合大模型提升转录准确率,用户超百万;广州新纪源科技的 AI 心理陪伴应用「林间聊愈室」已在海外互动超 150 万次。谷歌亚太开发者生态负责人 Kizilbash 称,中国初创在 AI 创新速度和全球化思维上独具优势,看好教育、健康、环保三大赛道。

谷歌宣布启动「谷歌开发者计划」,为中国出海开发者提供个性化主页、技能认证和技术资源,并开启第四期「出海加速器」项目。案例显示,语言学习应用 TalkMe 加入加速器后收入增长三倍,图像编辑应用 AI Mirror 借助谷歌工具已在 140 国吸引 3000 万用户。(来源:澎湃新闻)

DeepSeek R2 有望 8 月下旬发布?内部人士:不属实

近日有市场传言称,国产大模型公司深度求索旗下 DeepSeek R2 有望在 8 月 15 日至 30 日期间发布。8 月 13 日,DeepSeek 内部人士表示,上述消息不属实。(来源:澎湃)

 

抖音测试「快递」服务,入口与支付、打车等生活功能并列

8 月 13 日,据 Tech 星球报道,抖音正在测试「我的快递」服务,该功能位于抖音 App 的钱包内,与抖音支付、打车等生活功能享有同一流量位。

报道称,「我的快递」服务当前支持查询极兔速递的快递,接下来将接入更多的快递公司。此外,「我的快递」服务也支持寄件服务,不过,仅支持极兔速递的寄件,报道称未来会接入更多的快递公司。

报道认为,推出「我的快递」服务后,用户可在抖音内直接完成「下单-支付-查物流-寄件 / 退换货」的全流程操作,无需切换平台,显著降低用户操作成本,可能进而提升对抖音电商的满意度和复购意愿。(来源:IT之家)

 

AI 独角兽总估值达 27000 亿美元,其中 100 家成立不到 2 年

8 月 13 日,据量子位报道,AI 独角兽数量已达 498 家,总估值高达 2.7 万亿美元,超过谷歌 2.44 万亿美元市值,其中 100 家成立不足两年。这波浪潮造就了数十位新晋亿万富翁,集中分布在旧金山湾区。

四大私营 AI 巨头已诞生十余位亿万富翁,总净资产约 380 亿美元。代表人物包括 Scale AI 联合创始人亚历山大·王(36 亿美元)、郭露西(10 亿美元+)、Anthropic CEO 达里奥·阿莫迪(12 亿美元+)、CoreWeave CEO 迈克尔·因特罗特(100 亿美元)、DeepSeek CEO 梁文锋、Figure AI 创始人布雷特·阿德科克、Perplexity CEO 阿拉温德·斯里尼瓦斯,以及 OpenAI 前高管伊利亚·苏茨凯夫和米拉·穆拉蒂等。

这些公司普遍保持私营,依赖风投、主权基金等融资,并频繁发生并购与股权转让。创始人更注重财富管理与二级市场操作,如股权抵押借款、投资同类科技公司等。

湾区成为财富集中地,亿万富翁数量已达 82 位,超纽约的 66 位。当地房价、租金与高端房产成交量均创新高。业内调侃:「财富流向了代码」,这波 AI 浪潮或将继续诞生更多全球与中国的科技新贵。(来源:量子位)

消息称苹果 AI 伴侣机器人 2027 年登场:7 英寸屏 + 拟人交互,打造「数字家人」

8 月 13 日,彭博社发布博文,报道称苹果公司计划于 2027 年发布一款配备 7 英寸显示屏的 AI 桌面机器人,有望彻底改变个人与 AI 的互动方式,并提升家庭机器人行业标准。

消息称该机器人拥有类似 iPad 的触控屏,并安装于可旋转、可延展的机械臂上,能够自动转向面向发言者,实现更具「人性化」的交互体验。苹果希望借此突破现有语音助手的局限,创造出更拟人化的 AI 伴侣。

该机器人在苹果内部被称为「皮克斯台灯」(Pixar Lamp),设计灵感来源于动画中的生动形象,其核心功能支持用户进行流畅的双向对话,可在日常场景下主动提供建议,例如在朋友讨论晚餐时,实时推荐附近餐厅或食谱。

此外,机器人还可辅助用户规划旅行、管理事务,类似于 OpenAI 等先进语音交互模式,苹果还在为该设备开发全新的 Siri,让其具备记忆用户信息和自然交流的能力。

苹果也在开发一款带轮式底盘与大型机械臂的移动机器人,目标应用场景为制造工厂与零售门店,执行搬运、陈列或巡检任务,这表明苹果正从消费级 AI 交互与工业级自动化两个维度布局机器人战略。(来源:IT之家)

 

Edge 浏览器大变身:曝微软正开发「代号 Olympia」重大 AI 改版,UI 更简洁更贴合 Win11 风格

8 月 13 日,Windows Central 报道称,微软正开发一项代号为「Olympia」的 Edge 浏览器 UI 重大更新。

据介绍,Olympia 将采用全新 UI,以简洁与实用为主,特点包括简化的地址栏与窗口框架、垂直标签页布局及右侧功能菜单,以及其他明显变化,视觉风格与 Windows 11 保持一致。

如图所示,新版 Edge 地址栏缩小并居中于顶部,将 Copilot 直接嵌入其中,并在搜索框中强化搜索、聊天与语音输入功能,麦克风图标常驻可随时使用。

此外,Edge 界面整体更为简洁,标签页被移至左上角下拉按钮控制的垂直列表,另有一种布局将横向标签页置于地址栏下方。窗口右侧保留了书签按钮和浏览历史、下载、设置等功能入口。

不过很显然,Olympia 功能并不完善,部分区域仍无法使用。有人认为,Olympia 可能是为 Edge 的 Copilot 模式打造的专属界面,以配合该模式未来在 AI 智能体能力上的扩展;也有可能是为 Edge 进行更大幅度的 UI 重构,以区别于其他浏览器。(来源:IT之家)

《王者荣耀》连续三年全球手游收入第一  

8 月 13 日,腾讯发布 2025 年二季度财报,财报显示,腾讯二季度本土市场游戏收入为 404 亿元,同比增长 17%;国际市场游戏收入为 188 亿元,同比增长 35%,连续四个季度刷新历史高点,增速创国际市场收入单独披露以来的季度新高。

其中《王者荣耀》的收入增长再次为腾讯游戏整体营收增长作出贡献,这也是《王者荣耀》第 35 次登上腾讯财报。据 AppMagic 的估算,《王者荣耀》连续三年全球手游收入第一。此外,《三角洲行动》于 7 月的平均 DAU(日活跃用户数)突破 2000 万,位居行业日活跃账户数前五位,流水前三。(来源:36Kr)

AI 和海外游戏发力,腾讯重回 7000 亿美金

2025年8月13日 23:44

 

头图来源:视觉中国

 

 

今年上半年,围绕AI的讨论,正在从「技术能做什么」转向「技术如何赚钱」。

当「模型参数」竞赛和「能力演示」热潮逐渐褪去,资本市场和企业自身都开始更严苛地审视AI投入的真实回报。

在这样的背景下,每一个巨头的财报,都成为观察其AI战略商业化成果的试金石。腾讯最新的这份财报,揭示出了一些其内部发生的结构性深刻变化。

8月13日,腾讯发布2025年第二季季度财报。二季度总营收达到1845亿元,同比增长15%;毛利润为 1050 亿元,同比增长 22%;非国际财务报告准则(Non-IFRS)下的经营利润为692.5亿元,同比增长了18% 。

在公布了超出市场预期的2025年第二季度业绩后,腾讯ADR大幅上涨近7%,创下逾四年新高,按最新股价计算,腾讯总市值重回 7000 亿美元。

AI,这个在过去更多以「研发投入」和「战略布局」形式出现在腾讯财报中的词汇,如今则与「业绩动能」、「利润增长」紧密绑定 。

从微信生态的广告推荐,到《王者荣耀》的AI陪练,再到腾讯云上为全球企业服务的智能体,可以看到,AI技术已经渗透到腾讯核心业务之中,并开始高效地创造价值。

董事会主席兼首席执行官马化腾在财报中的表述也印证了这一点:「二零二五年第二季,我们在AI领域持续投入并从中获益」 。

这标志着一个重要转折点的到来:腾讯的AI战略已经越过了「投入期」,正式进入了「效益加速兑现」的新阶段。

这一点不仅体现在广告业务连续11个季度的高速增长和创纪录的收入上 ,也体现在游戏业务借助AI实现平台化进化和国际市场收入创下历史新高上 ,以及企业服务因AI相关需求增加而增速加快上 。

与此同时,腾讯的另一大增长引擎——全球化,也在持续发力。国际市场游戏收入同比增长35%的速度 ,以及腾讯云在全球市场加速攻城略地 ,都表明「出海」不再是补充,而是腾讯未来增长故事中与AI并行的主线。

所以,腾讯是如何将AI从一个「技术变量」转变为「增长常量」,以及这家公司在全球化牌桌上,正在如何下出一步步决胜未来的棋?

 

一、AI引擎:从研发支出到商业利润的闭环

 

长期以来,外界观察腾讯的AI能力,多聚焦于其庞大的投入。而2025年第二季度的财报,则首次清晰地勾勒出一条从巨额投入到显著产出的完整商业闭环。

要理解AI为腾讯带来的效益,首先要看到其在投入端的决心。财报显示,腾讯在本季度持续加码AI战略投入。当季研发投入高达202.5亿元,同比增长了17% 。自2018年至今,腾讯的累计研发投入已经超过3795亿元。这笔巨额资金的核心投向,正是以腾讯混元大模型为代表的核心技术自研。

比研发费用增长更多的是资本开支。本季度,腾讯的资本开支达到了191.1亿元,同比增幅高达119% 。

资本开支的飙升通常与数据中心、服务器等底层基础设施的建设密切相关,这表明,腾讯正在为AI大模型的训练和推理,储备强大的算力资源。在高投入的背景下,公司依然实现了毛利22%和经营利润18%的双增长,这说明其AI投入与高质量增长之间形成了正向循环 。

这种不计短期成本的「重注」,是腾讯AI战略得以从技术突破走向商业成功的前提。它构建了强大的底层基础设施和模型能力,为上层应用提供了基石。

腾讯的AI故事,核心主角是其自研的「腾讯混元大模型」。财报多处详细描述了混元大模型家族的进化与突破,展现了技术能力的快速迭代。

首先是基础模型能力的增强。腾讯通过数据增强与合成技术,提升了训练数据的质量和多样性,并通过更有效的预训练和后训练扩展,持续提升混元大模型的基础能力。

混元四款开源的小尺寸模型|图片来源:混元

 

其模型矩阵不断丰富,不仅持续迭代升级旗舰模型TurboS、T1等,还推出了覆盖0.5B、1.8B、4B、7B等多种参数规格的开源小模型,这些模型可以在手机端运行,降低了AI技术的落地门槛 。

在多模态领域,特别是3D生成方面,腾讯混元取得了系列突破。报告期内,混元密集发布了混元3D v2.5版本、业界首个美术级3D生成大模型以及3D世界生成模型1.0。其能力得到了权威认可,在全球3D生成模型评测榜单上,腾讯混元3D模型因其领先的几何精度、纹理真实度和提示对齐能力而排名第一 。

技术突破的价值在于应用和生态。腾讯一方面通过开源共享技术红利,混元3D系列模型在社区的累计下载量已经超过230万,成为全球最受欢迎的3D开源模型之一。这吸引了越来越多的游戏开发者、3D打印企业和专业设计师采用混元3D模型来生成数字资产 。另一方面,腾讯通过腾讯云将模型能力快速产业化,AI设计智能体Lovart、全球领先的3D打印品牌拓竹科技MakerWorld及创想三维等,均已接入腾讯混元3D模型API 。

不过,对于C端AI变现的「中国式难题」,以及AI功能高昂的成本,管理层在业绩会上坦言,直接向C端用户收费的模式,很难像美国AI工具那样在中国普及 。

因此,腾讯的变现思路非常务实:探索广告变现:未来可能通过广告来支持AI功能的变现;内部成本「补贴」:AI本身已经助力广告、游戏等现有业务增长,可以理解为其他业务的增长为AI用量「补贴」了部分成本 ;精细化成本控制:在很多场景下,优先采用成本低很多的小模型,整体推理成本是可控的。

二、AI直接驱动核心业务的增长

如果说研发投入和技术突破是因,那么业务层面的增长就是果。这份财报清晰地展示了AI如何直接驱动核心业务的增长。

腾讯的营销服务(广告)业务在本季度表现尤为亮眼。收入达到357.6亿元,同比增长20%,不仅创下历史新高,更是连续第11个季度实现双位数增长。

财报将这一高速增长明确归因于「AI驱动的广告平台改进」以及微信交易生态的活跃 。

具体而言,腾讯通过升级广告基础模型,提升了各个流量平台上的广告效果。

这意味着AI不再只是一个辅助工具,而是整个广告技术栈的底层引擎。AI被深度应用于广告创作、投放、推荐及效果分析等全流程,其直接结果是提升了广告的点击率和转化率,从而为广告主带来了更高的投入回报(ROI),并最终推动了腾讯自身的平台营销服务收入。广告主对视频号、小程序以及微信搜一搜的强劲需求,正是这一价值创造循环的体现。

在金融科技及企业服务板块,本季度收入同比增长10%,达到555.4亿元,保持了稳健增长的态势。财报指出,企业服务收入的增速相较于近几个季度有所加快,其背后的一个关键驱动力,正是「企业客户对AI相关服务的需求增加」。

这表明,腾讯的AI能力正成功地转化为对企业客户有吸引力的商业解决方案。

从为开发者提供高效智能编程体验的AI编程工具CodeBuddy IDE,到能够让开发时长缩短超过10倍的全流程AI一体化开发工作台 ,再到覆盖企业服务、生活、办公等高频场景的10多个垂直领域Agent应用矩阵 ,腾讯正在将复杂的AI技术打包成「好用」的工具与服务,帮助企业降本增效。

在C端,AI的价值则体现在用户体验的提升和场景的拓展上。以腾讯元宝为代表的AI原生应用正在加速渗透。

元宝不仅升级了搜索、文档理解和图像处理等核心能力,还新增了视频号解读等特色功能,并深度融入微信、QQ、腾讯会议、腾讯文档等高频使用场景。

QQ浏览器 Agent|图片来源:QQ浏览器

 

此外,QQ浏览器凭借其行业第一的月活跃用户数(MAU),推出了行业首个高考Agent,为超过5000万用户提供了免费的高考服务。AI工作台腾讯ima则在知识库生态上快速发展,当季可分享私域内容环比增长超200%,公域内容总量超过2000万。

这些应用共同构成了微信AI功能矩阵,推动着「好用的AI」向更多圈层用户渗透。

总而言之,腾讯的AI战略已经形成了一个从「高投入研发」到「强技术模型」,再到「多场景应用」,最终实现「商业化回报」的完整飞轮。这个飞轮的转动,正在为腾讯这家巨头的持续增长,提供源源不断的新动能。

三、游戏双轮驱动:全球化浪潮与平台化进化

游戏业务作为腾讯传统的「现金牛」,在本季度展现出强劲的复苏和新的增长叙事。

财报显示,二季度网络游戏业务总收入达到592亿元。这一数字背后,是国际市场和本土市场「双轮驱动」的共同发力,以及AI技术对游戏产品形态的重塑。

二季度,国际市场游戏收入同比增长高达35%,达到188亿元,不仅连续四个季度刷新历史高点,其增速更是创下了自该部分收入被单独披露以来的季度新高。这一点证明,全球化已经成为腾讯游戏的「第二增长曲线」。

这一成绩的取得,得益于腾讯多年来通过战略投资和自主发行构建的全球化产品矩阵。财报明确提到了几个核心:

Supercell游戏复兴,旗下经典游戏《部落冲突:皇室战争》通过更频繁的内容更新、优化的奖励机制以及更多的玩家社区活动,成功拉动了日活跃用户数,并在今年6月创下了近7年来的收入新高。

根据Sensor Tower的数据,该游戏在上半年的全球日活跃用户规模已升至第三,成为Supercell目前DAU最高的产品。这显示了腾讯对成熟IP进行精细化长线运营的能力。

作为全球最受欢迎的战术竞技手游之一,《PUBG MOBILE》持续为腾讯贡献着稳健的收入。

《沙丘:觉醒》在steam的页面|图片来源:steam

 

《沙丘:觉醒》这款由腾讯于2020年全资收购的挪威工作室Funcom制作发行的生存类多人在线游戏(SOC),在今年6月10日上线后,不到两周全球销量就突破了100万份,成为Funcom有史以来销售速度最快的游戏。其在Steam平台的同时在线峰值超过18.9万。

腾讯在海外的强劲表现,也与中国游戏产业出海整体回暖的趋势相呼应。根据中国音数协游戏工委的报告,2025年上半年,中国自研游戏海外市场实际销售收入同比增长11.07%,达到了95.01亿美元,增速在时隔数年后重回10%以上。

腾讯作为行业的领头羊,也是这波出海浪潮中的推动者和受益者。

在本土市场,腾讯游戏收入同比增长17%,达到404亿元。增长的核心动力来自于其在射击品类上的优势,以及对《王者荣耀》、《和平精英》等旗舰级长青产品的「平台化」改造。

游戏工委的报告显示,射击类游戏在国内手游市场的收入占比正在提升,从2024年的13.89%上升至今年上半年的17.03%。腾讯凭借其产品矩阵抓住了这一增长态势。

《三角洲行动》这款新作在4月公布日活超1200万后,财报披露其在7月份已突破2000万日活跃用户规模,成功跻身国内DAU前五、流水前三的第一梯队 。随着8月19日登陆主机平台,其用户规模有望再创新高。

PC端游优势巩固,端游《无畏契约》保持稳健增长,其手游版《无畏契约:源能行动》预约量已超6000万,有望成为下一个爆款。而基于「暗区突围」IP开发的端游《暗区突围:无限》上线后表现出色,稳定在网吧热力榜前十,进一步扩大了腾讯在端游市场的领先优势。

旗舰产品的平台化进化,则是本季财报中一个极具前瞻性的战略信号。马化腾在发言中明确提出:「《王者荣耀》及《和平精英》等长青游戏向平台化进化并加大了AI的应用」 。这意味着腾讯正在将这些国民级游戏打造为承载更多元玩法和社交体验的平台。

作为上半年唯一一款收入破10亿美元的手游,并实现全球收入「三连冠」的绝对王者,《王者荣耀》也在积极拥抱AI。游戏内已推出独立的「指挥官模式」,为玩家提供智能战术指导;同时上线的AI语音助手「灵宝」,则实现了个性化的对局陪伴 。

这些AI应用正在推动《王者荣耀》成为一个以MOBA为底层,不断融入多元玩法的平台化游戏。

《和平精英》也融合了AI。 该游戏在今年2月就已接入Deepseek大模型,推出了AI助手和AI队友,为玩家提供游戏指导和对局陪伴,有效提升了用户参与度。

无论是出海业务的高歌猛进,还是本土业务的品类深耕与平台进化,腾讯游戏都展现了创新活力和战略远见。

AI应用和全球化视野,正在为腾讯这个游戏帝国注入新鲜血液。

四、To B棋局:智能化与全球化构筑的产业护城河

除了在游戏和广告业务上的进展,腾讯在企业服务(To B)领域的布局也显示出持续的进展。二季度,该业务板块收入达到555亿元,同比增长10%,其增长背后,「智能化」与「全球化」两大战略正为腾讯构筑坚实的产业互联网护城河。

不过,企业服务收入增速加快,并非仅仅依赖GPU租赁的短期需求。管理层在电话会上透露,过去两到三年,腾讯有针对性地优化了云业务,削减了低毛利和低附加值的活动。现在,云业务已经运营在一个「更可持续的基础上」,因此能将重心重新放在更快的营收增长上。

而如前所述,企业服务收入的加速增长,很大程度上得益于客户对AI相关服务需求的增加。腾讯正在系统性地将自身强大的AI能力,转化为一系列「好用」的、可被产业客户快速集成的工具、平台与服务。

要推动AI在产业落地,必须首先赋能开发者。为此,腾讯云推出并升级了一系列AI原生工具。

包括智能体开发平台与腾讯元器: 这两大平台得到全面升级,基于更全面的Multi-Agent(多智能体)、RAG(检索增强生成)和Workflow(工作流)等能力,为企业和开发者提供更精准、灵活的对话服务,并降低复杂应用场景的配置门槛 。

Codebuddy IDE 产品界面 丨来自:极客公园

 

CodeBuddy IDE是腾讯在二季度发布的重磅产品,是首个实现「产品-设计-研发-部署」全流程AI一体化的开发工作台。

在电商活动页开发这类典型场景中,使用CodeBuddy IDE可以将开发时长从传统的2天缩短到不足2小时,效率提升超过10倍。这对于追求敏捷开发和降本增效的企业而言,具有巨大的吸引力。

除了赋能开发者,腾讯还直接下场,利用自身技术打造覆盖核心高频场景的垂直领域Agent应用矩阵。这批应用超过10款,覆盖企业服务(如企点营销云Agent)、生活(如健康管理Agent)、办公(如语音智能体TWeTalkAgent)等三大领域。

这标志着腾讯的AI To B战略,正从提供底层能力向提供完整解决方案迈进。

本季度企业服务增长的另一大动力,源自全球市场的深入拓展。腾讯云的国际化进程正在显著加速,其角色也从最初服务中国企业出海的「摆渡人」,演变为服务全球本土客户的「数字化伙伴」。

财报和相关资料中列出了一长串国际客户名单,这本身就是腾讯云全球服务能力的证明。截至目前,腾讯云已累计服务超过10000家海外客户,覆盖超过80个国家和地区。

腾讯云帮助印尼科技巨头GoTo集团旗下的Gojek,仅用时4小时54分钟,就成功将涉及打车、外卖、快递等复杂业务的上千个微服务系统整体平稳切换至腾讯云。

这被认为是东南亚规模最大的云迁移项目之一,不仅实现了高可用和高弹性,还帮助Gojek降低了运维成本、提升了响应速度。

泰国正大集团旗下的零售公司CP AXTRA、阿联酋电信集团e&UAE、跨国电信运营商Orange Middle East & Africa、日本餐饮平台Tabelog、亚洲第一大公关公司Offshore等,都选择了腾讯云的解决方案与产品。

为了支撑快速增长的全球业务,腾讯宣布将继续加大全球化发展投入。其中包括投入1.5亿美元在沙特阿拉伯建设首个中东数据中心,以及在日本大阪新建该国的第三个数据中心并设立新办公室。这些投资清晰地表明,腾讯致力于构建一张覆盖全球主要经济区的云服务网络。

在服务国际客户的同时,腾讯云也在持续帮助众多中国企业加速出海进程。

2025年7月,美的将其欧洲IT业务搬迁至腾讯云,在优化成本的同时,也大幅提升了业务系统的稳定性和扩展能力,为其欧洲市场发展打下了坚实基础。

无论是智能化还是全球化,其背后都离不开持之以恒的技术研发和知识产权积累。二季度腾讯研发投入202.5亿元,同比增长17% 。公开数据显示,截至2025年6月底,腾讯在全球主要国家和地区的累计专利申请已超过8.8万件,授权数量超4.8万件。

这些专利代表了核心技术领域的自研能力与创新价值。例如,腾讯云数据库TDSQL的核心技术荣获了中国专利金奖。在权威研究机构Gartner®的报告中,腾讯云CPaaS(通信即服务)的视频能力位列全球第一,并连续三年被评为市场「挑战者」。

整体来看,腾讯2025年第二季度的财报,描绘了一幅由AI和全球化双引擎驱动的全新增长蓝图。

AI不再只是成本中心,而是利润中心;全球化也不再是边缘业务,而是核心阵地。

从马化腾「为用户及企业带来更进一步的AI增益」的表态中 ,我们可以看到,腾讯正致力于将过去二十多年积累的数据、场景、技术和用户连接能力,通过AI这个「放大器」进行重构和增值。

一个更智能、更全球化的腾讯,正在浮现。对于市场而言,这或许是一个需要重新审视和评估腾讯长期价值的开始。

 

昨天 — 2025年8月13日极客公园

AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」

2025年8月13日 14:10

最近 AI 界的大新闻是 GPT-5 和谷歌的世界模型 Genie 3。然而,在无人在意的角落里,微软悄悄把 Edge 进化成了了 AI 浏览器。

上一次听到 Edge 的消息还是 IE 正式关停的时候,Edge 作为 IE 的继任者难免会被拿出来讨论,通常没有什么好话。

再上一次是 Edge 加入 sidebar 功能的时候,罕见地抢了一批 Chrome 的用户。

时至今日,Edge 的风评似乎没有比曾经的 IE 好到哪里去。

都 2025 年了,居然还有浏览器的首页充斥着闪烁的 MSN 资讯、天气卡片、股市小窗口,以及永远关不掉的「热门故事」。与此同时,微软不断地在给 Edge 加入「无用的新功能」,让系统变得越来越臃肿。

MSN,原来你没死透|图片来源:Edge 浏览器截图

但如果你愿意再给 Edge 一次机会的话,一键开启 Copilot 模式,Edge 就变成了神似 Dia 的样子:

干净得不像微软出品

这个首页就正常多了|图片来源:Edge 浏览器截图


栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: AI 上新|不会用 PS 的我,却敢去小红书上接「设计单」了)向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时,优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧!投稿、进群请扫描下方二维码添加极客小助手微信


01

微软,再造一遍浏览器

要让 Edge 变成 AI 浏览器,除了要更新到最新版本之外,还需要掌握一些小小的「魔法」。然后在设置的「AI 创新」一栏,就可以开启 Copilot 模式。

Copilot 模式的形态介于谷歌在 Chrome 有限 Gemini 集成,和 Manus 这样完全的 AI 浏览器之间。

在 Copilot 模式下,首页就变成了一个对话框,你可以直接用搜索引擎搜索、询问 Copilot 或者让它深度思考。这一点和其他主流的 AI 浏览器差别不大。

Copilot 的第二个入口在地址栏左侧,一颗小药丸形状的图标,单击就可以呼出,或者让它固定在右侧。

Copilot 的第二个入口在地址栏左侧|图片来源:Edge 浏览器截图

官方说它可以「感知所有标签页」。于是我打开了一篇论文、一份财报,以及一个亚马逊相机的搜索页面。随后我告诉 Copilot:「帮我总结特斯拉的财报,还有这篇论文的大纲,以及我想选购一款性价比高的相机。」

一分钟后,Copilot 分别概括了财报和论文,附上了各个价位的最佳相机,并暗示了我给出的需求并不精准

这一瞬间,我确实有一种错觉,有另外一颗大脑正在替我工作。

Copilot 同时分析财报和论文,并给出选购建议|图片来源:Edge 浏览器截图

这种总结能力也能迁移到视频上。当你在 Edge 中打开 YouTube 视频时,只要呼出 Copilot 并指示「总结视频」,它就会给出总结。

美中不足的是,Copilot 的这种感知并非全自动的,需要你手动 @ 标签栏,它才能替你工作

不过,最能让我产生「幻觉」,是 Copilot Vision。这是一个交互方式上非常新鲜的功能,Copilot 可以直接看到你的屏幕,并以此为基础和你用语音交互,就像你和朋友共享屏幕一样。

Vision 读取屏幕,并给出建议|图片来源:Edge 浏览器截图

例如在一个典型的购物场景,Copilot Vission 就可以直接看到屏幕上的备选产品,并给出选购建议。打开 Copilot Vission,一个带着浓郁广普口音的中年女声就会很热情地和你打招呼:「嗨~我可以看到你屏幕啦!」,很像在 Panda Express 或者 Jade Dragon Restaurant 碰到的那种广东阿姨。

不得不说,现在的 AI 语音已经做得非常自然,已经不太分辨得出 AI 味。碰到 AI 验证的时候,它还会主动安慰你:

「是不是挺烦人的」。

这我还是第一次在 AI 身上感受到了人味,语音交互带来的情感浓度的确要比文字强很多

但是就功能性来说,Vission 还算不上实用。一方面是它的图像识别速度跟不上我的浏览速度。另一方面,它在图像和语音识别的准确率上也有待提升。例如它会把「IPX6」识别成「IPX4」,我用语音纠正了它,它马上道歉,但是听成了「IPX7」。

目前的 Vision 有一点像家里的女性长辈,不懂科技,聊天信息密度不高,但是非常包容,情绪价值拉满

以上就是 Edge 最主要的功能了。还有一些功能微软表示正在开发中,例如 Agent 能力、智能标签分组或者是动态的 AI 助手。

实际上,很多功能微软已经开发完毕、处于测试阶段了,出于大公司的保守,它没有集成到 Edge 中。但是没有关系,进入单独 Copilot 主页,打开「实验室」,你可以看到,微软确实在开发一些好玩的东西。

Copilot 实验室|图片来源:Edge 浏览器截图

  • Copilot 3D,可以一键将图像转换为 3D 模型。上传自己的照片,你就可以轻松得到一个「逼真」的 3D 头像。

做得很好,下次别做了|图片来源:Edge 浏览器截图

  • Copilot 游戏,体验原汁原味的上古 FPS 大作《雷神之锤 2》,并且每一帧都是由 AI 实时生成的,同时画面非常卡顿。

AI 生成游戏的《雷神之锤 2》|图片来源:Edge 浏览器截图

Copilot Actions 是微软最接近「Agent」野心的功能。我试着让它预订了一张 8 月 10 号从上海飞北京的机票。Copilot 大概跑了 20 分钟,完成了点点鼠标一分钟就能做完的工作。

但奇妙之处在于: 它允许我随时「抢方向盘」

当它差点给我选了个中转航班时,我可以随时接管浏览器权限,把航线拉回直飞。这种「人机共驾」的体验,比那些一路黑箱跑到底的竞品要安心得多。

实际上,这样操作之后,跑任务的效率会大大提升,最终的出品也可控得多。我觉得这才是目前 Agent 最实用、最可靠的人机协作形态。正如它的名字 Copilot 一样,这是一种副驾驶员的哲学。

用户可以随时暂停,接管浏览器 | 图片来源:Edge 浏览器截图

02

微软的历史包袱

总的来说,Edge 浏览器的 AI 进化给到了不错的体验,基础功能不逊色于主流工具的同时,也有一些自身的亮点,例如标签感知和 Vision。

但与此同时,这还不是一款可以成熟到覆盖所有 Edge 用户的产品。很多宣传的功能并没有完全兑现,各个功能的入口也分散在四处。最明显的就是,地址栏旁 Copilot 入口支持附件上传和语音交互,而主入口的 Copilot 反而不支持这些功能。

更大的割裂感在于 Edge 浏览器本身和 Copilot 模式上。

单就视觉而言,传统功能区延续了 Win11 的 Fluent 圆角玻璃;AI 面板则是现代极简的风格,仿佛两代人共用一张办公桌。

两种设计风格同时共存在一个页面

更重要的功能性上,Edge 团队背负着沉重的历史包袱:兼容模式、IE 模式、企业策略、臃肿的 PDF 阅读器……而 Copilot 团队显然想再造一个「AI 优先」的物种。两股力量在同一具身体里拉扯,导致入口分散、菜单嵌套、选项重名。

于是,Edge 就像是一座仍在施工的跨河大桥:桥这头,是微软多年堆出来的旧公路,坑洼却熟悉;桥那头,是闪着霓虹的 AI 新大陆,诱人却断续。

用户站在桥中间,有一些迷茫。

当人们怀念 GPT-4o,他们在「怀念」什么?

2025年8月13日 12:51
作者|苏子华
编辑|靖宇

GPT-5 的发布本应是一件好事,然而,ChatGPT 的用户却在 48 小时内,掀起了一场全球性的「反抗运动」。

8 月 8 日,OpenAI 的新模型 GPT-5 上线的同时,OpenAI 下架了 GPT-4o 等其他所有模型,强制全球用户只能使用 GPT-5 这个新模型。根据 OpenAI 掌门 Sam Altman 的介绍,GPT-5 更聪明,完成了「智商飞跃」,从大学生水准,升级到「博士级」的能力,生产力更强了。

然而,用户表示,新模型牺牲了 GPT-4o 在共情能力和提供情绪价值上的优势,回答问题时变得「冷漠」了。好像失去了一位「密友」、「恋人」。

有网友们开始满怀悲伤地怀念与 GPT-4o 的互动体验:有人用它来排解深夜的孤独,有人用它模拟朋友间的闲聊,有人将其视为「情感寄托的港湾」。

怀念 4o 的帖子引发了广泛共鸣|图片来源:小红书

悲伤过后,紧接着,社交媒体上,一场以「拯救 4o」(#Keep4o、#Save4o)为主题的网络声援运动迅速蔓延。

从 X(原 Twitter)到 Reddit,到小红书等等,有用户到 OpenAI 的官网账号下留言,有人制作表情包凸显 4o 的优势,有人在各平台发帖号召大家给 OpenAI 发邮件,来表达自己的愤怒、沮丧,和对立刻恢复 4o 的迫切。

来自于海外网友的「还我 4o」的抗议帖子|图片来源:X

 

值得注意的是,这场抗议,没有明确的组织者,也不在单一平台,而是全网自发,掀起了巨大的舆情声浪。

很快,汹涌的情绪包裹了 OpenAI,他们被迫选择向用户道歉,并向付费用户恢复上架 GPT-4o。

OpenAI CEO 奥特曼被迫恢复 4o|图片来源:X

不过,代价也是巨大的。用户对于 OpenAI 的信任已经动摇,开始将目光投向 Claude、xAI 等大模型产品。

GPT-5 风波对于 AI 行业来说,将是一个里程碑式的事件。它炸出了一个庞大的与 AI 形成情感羁绊、尤其在意情绪价值的用户群体。

它也印证了一个AI产品被长期低估的属性——情绪价值。可以说,情绪价值也有可能成为 AI 产品的核心竞争力。一个拥有更高智商的 AI,可能很快就会被下一个更强的 AI 所取代。但一个能提供独特情感体验的 AI,却能建立起一种难以复制的情感壁垒

另外,此次风波对于以技术为导向的 AI 公司来说,在处理产品迭代时,也无疑是一次深刻的警示。

 

情绪价值:AI产品的「隐形」护城河

 

可能正如那句经典的「只有失去才明白它的价值」,当 GPT-4o 下线之后,大家才意识到,它并不仅仅是一项可以被平替的技术。

过去,我们总以为技术的迭代逻辑是「性能为王」。一个更快的 AI 会取代慢的,一个更精准的 AI 会取代不准确的。

但这次风波事件表明,工具可以讲究效率,但是涉及到情感时逻辑并不成立,就像交朋友时并不会把对方的做事效率看得最重要。

AI 大模型与以往的信息技术、数字化技术有一个关键的不同是:它具备智能,具备「生命感」。

斯坦福大学与谷歌的联合研究发现,当 AI 生成的回应在情绪上更积极、更具共情时,人类更容易形成信任与长期互动意愿。用户通过与 4o 的长期互动,在潜意识里已经将它定义为一个「有情感」的、甚至「人格化」的存在。

当 OpenAI 突然改变这个「人设」,将其还原为冷漠的「工具」时,用户的认知与情感预期产生了巨大冲突,从而引发了强烈的情绪反噬。

网友自制的梗图|图片来源:X

更换模型,就相当于更换了一个「人」。而人们对于自己的亲人、朋友是有长期的感情的,是很难接受被替换的。

当 GPT-4o 被下线时,用户的普遍感受是:「好像失去了一位不告而别的好朋友」。也有不少用户哭诉「失去了灵魂伴侣」。

很多用户转发的一句抗议口号是,「不是所有人需要博士,但所有人都需要朋友。」

在新模型面前,用户与旧模型之间建立的长期对话习惯、个性化提示词悉数失效。对比之下,GPT-5 固然智商更高,但也显得更冷漠。可以说,OpenAI 强制让用户迁移模型,相当于是在切断一段段鲜活的「人际关系」。

而现实里,没有人能忍受别人来破坏自己的亲密关系。从此次风波能感受出来,情感价值形成的用户粘性实在太强,强到用户不允许产品下线,不允许产品消失,宁愿花更多钱(会员费)、发帖呼吁等方式,让其持续运行下去。

对 AI 产品而言,这意味着一个简单的事实:哪怕 GPT-5 在逻辑推理上无懈可击,如果不能在交流中传递熟悉的、超预期的人性温度,它依然可能输给一个性能稍逊、但「懂我」的版本。生产力并非是衡量 AI 价值的唯一标准。

从商业竞争的角度看,情绪价值是很难被快速复制的护城河。技术性能的差距可以通过算力、资本投入赶上,情感连接是用时间与真心建立的,迁移成本极高。

 

 

风波后的新思潮:全新的人机关系,与 AI 公司的信任危机

 

当全球网友合力将「GPT-4o」拯救回来之后,新的问题出现了:如何避免再次「突然失去恋人、朋友」的悲剧?

很长一段时间,AI 虚拟陪伴究竟是不是个伪命题,一直存在争议。在 GPT-5 风波之后,这个争论可以说是终结了。

实际上,人们对于「AI 陪伴」的需求远比想象中更普遍和迫切。

《哈佛商业评论》基于数千篇论坛帖子的调研发现,人们对于 AI 的使用重心开始从去年的「写、画、搜」转向了「治愈心灵」。2025 年 AI 应用的最常见场景,前 5 名是:1. 疗愈和陪伴 2. 组织个人的生活 3. 寻找意义 4. 学习提升 5. 生成代码——前 3 名都和个人情感陪伴相关。

年轻人更是如此。

Common Sense Media 调研显示,这项研究于 4 月和 5 月对 1000 多名青少年进行了调查。约 70% 的青少年使用 AI 聊天机器人作为情绪陪伴,31% 表示「AI 和真实朋友一样令人满足」,33% 更喜欢用 AI 谈敏感话题,而不是与人类交流。

对于创业者来说,一方面,这意味着真真切切的商业机会,另一方面,AI 公司与用户之间的情感羁绊会更加强烈,由此带来的问题也会是全新的,这与此前的互联网时代并不相同:

比如说,未来的 AI 产品是否应该更加注重用户的情感绑定,并提供更透明的服务模式?
比如说,OpenAI 在未与用户充分沟通的情况下,突然下架 4o,让许多人感到被背叛。这让用户开始质疑:未来的 AI 公司还能被信任吗?
比如,这种决策是否过于短视,忽略了用户的情感需求和市场的多样性需求?

OpenAI 的用户信任和声誉已经开始受损。网友们互相出谋划策,如何与 OpenAI 持续斗争|图片来源:小红书

如果像 OpenAI 这样,AI 产品的一次升级,可能带走的就是一段关系。过去,伤害隐私,很多人可能不敏感,但是伤害情感,等来的会是汹涌的抗争,以及由此而来的深层次的信任危机。

这次风波也揭示了一些行业新规则:

  • 未来的 AI 发展,需要同时兼顾技术上的突破和情感上的连接,为此,甚至有网友建议将退役模型开源,避免记忆断层;
  • 用户需要有自主选择权,而不是被动升级;
  • 模型多样性可能比「单一先进性」重要(如专业场景用 GPT-5,情感陪伴用 GPT-4o)。

最后,这是一次史无前例的全球用户团结在一起,开展对一家科技公司的自发抗议运动。相信还会催生更多关于人机关系和商业的议题。这些议题,或许就是人机共生新纪元的序章。

破解AI创企的「不可能三角」,解药不止「大模型」

2025年8月13日 12:08

 

「在AI这场滔天巨浪里,我们怎么能跑得更快,并最终有机会到达我们的终极理想?」8月12日的百度AI DAY现场,百度集团副总裁袁佛玉的开场,问出了这个时代所有AI从业者心中的心声。

百度集团副总裁袁佛玉

 

现在是一个令人兴奋又备感压力的时刻。

一方面,从让游戏NPC“活起来”的虚拟伙伴,到可以实时翻译、导航的AI眼镜,分钟级生成一部电影的AI导演,再到能走入工厂和家庭的具身智能机器人……技术的突破正飞快地将想象力变为现实。

而另一方面,正如袁佛玉在现场所指出的,AI创企的成长始终面临一个“不可能三角”:技术深度、迭代速度与成本控制三者难以兼得。

当喧嚣散去,创业者们真正需要的,是一个能帮助他们破解难题、穿越周期的务实答案。

百度智能云在此次AI DAY上给出的回答,并非一个新模型或是其他,而是一个极为务实的“AI创投加速计划”。 他们选择联合投资机构与政府,为入选的AI创业公司提供亿级算力补贴、专属融资通道及政策申报支持。

一个数据是:在过去一年,该计划已助力20家企业完成亿元级融资 。 这背后传递出一个信号:在这轮由大模型掀起的AI浪潮中,平台级公司的核心战场,正在从纯粹的技术指标竞赛,转向更深层次的生态构建与服务。

那么,在AI应用爆发的前夜,创业者们真正的痛点是什么?除了一个强大的模型,他们还需要什么?

 

1 AI创企「众生相」:从想象力到生产力

 

回过头看,上一轮AI技术更多是作为后台的效率工具,而在今天的AI创企身上,我们看到了AI角色的显著变化——它正在走向前台,成为产品体验的核心,也已经开始重塑人与数字世界、物理世界的关系。

一个直观的趋势是,AI正从「工具」向「伙伴」演进,创造新的情感链接与陪伴价值 。

成立于2023年4月、并已入选「2024全球50家最具潜力初创公司」之一的心影随形,便是一家致力于「让AI与人们相伴,创造快乐」的公司 。

其创始人刘斌新的理念很独特:「不要跟用户抢时间,而是陪伴用户」 。 他们的产品「逗逗游戏伙伴」,不只是简单的游戏助手,而是通过视觉语言模型(VLM)技术,实时理解用户正在进行的游戏画面,在语音「开黑」的过程中,像一个真人队友一样提供攻略指引和情感陪伴 。

心影随形联合创始人王碧豪|图片来源:极客公园

 

其联合创始人王碧豪也谈到了他们的终极愿景——打造出电影《她》中AI「萨曼莎」那样的个人助理产品,这需要AI具备从特定场景(游戏)向生活全场景拓展陪伴的能力 。

同样在探索数字陪伴边界的还有二次元游戏公司Kotoko。他们的游戏《Bside》核心玩法是让用户创造自己的原创虚拟角色(OC),并通过AI技术为这些OC注入「主体性」,让其拥有类似「灵魂」的动态个性 。

在Kotoko的设计中,玩家更像是「造物主」,可以观察到自己创造的AI角色在虚拟世界里拥有自己的生活、社交和成长轨迹 。

无论是心影随形追求的「实时陪伴」,还是Kotoko打造的「AI模拟人生」,都对技术提出了苛刻的要求。

他们背后所需要的,不只是一个聪明的大模型,更是一个能够支撑实时语音、图像识别、低延迟交互的复杂多模态系统,以及能够服务全球玩家的稳定基础设施——例如,百度智能云就为Kotoko提供了结合地域特性的跨云、跨产品服务器与算力解决方案,并围绕CDN、跨云加速等方案优化全球业务链路,以满足其复杂社交交互下的低时延要求 。

当AI在虚拟世界中拥有了「大脑」,另一批创业者则在思考如何为它打造一个与物理世界交互的「身体」。

可穿戴设备,尤其是AI眼镜,成为了试验场之一。

李未可科技是此赛道的领航者,其创始人茹忆的理念「AI眼镜,AI在前硬件在后」,明确了AI技术必须是用户需求的第一响应者,而非硬件的附属品 。

李未可科技合伙人&生态业务负责人张建华

 

为此,李未可选择了「产品做减法,AI做加法」的路径,将AI眼镜的重量控制在40克以内,以保证用户可以全天舒适佩戴 。

在这个轻巧的产品之上,百度智能云提供的多模态解决方案,为其注入了丰富且实用的场景能力 :整合了旅游中讲解、记录、翻译三大核心需求的AI导游、支持128种语言互译的「边拍边讲」、以及能连续录音2小时并生成多模态日志的「AI随身记」 。 这些功能让AI眼镜真正从一个极客玩具,变成了能解决大众用户真实痛点的实用助手。

如果说AI眼镜是AI在消费侧的落地,那么具身智能机器人,则是AI在产业侧更深入的探索。

成立于2023年的灵生科技,正专注于这一前沿领域 。 对于这类研发周期长、测试成本高的硬核科技公司而言,最大的挑战之一就是如何在有限的资源下加速核心研发进程。

灵生科技依托百度智能云的技术支撑,在感知融合与实时决策方面取得了显著优势 。 百度智能云为其提供的不仅仅是算力,更是共建了一个云端仿真平台,这使得灵生科技可以在虚拟环境中大量测试其算法,极大地降低了测试成本,有效加速了技术从实验室走向规模化应用的进程 。

除了陪伴与交互,AI作为生产力工具的潜力也正在被深度挖掘,尤其是在对创造力要求极高的内容产业。

3D内容的生产曾是门槛最高、最耗时耗力的领域之一。全球AI 3D大模型领军企业

VAST,目标就是打破这一壁垒,开创一个人人皆可进行3D创作的时代 。

要实现这一愿景,背后需要处理和训练海量的3D高保真原生数据资源 。 VAST与百度智能云的合作中,后者为其提供了大规模深度学习所需的高性能云原生AI计算平台,包括全面的集群运维支持、任务全生命周期管理以及训推加速等一系列高级功能。

同样,在影视制作领域,Filmaction团队推出的国内首个一站式AI电影生成平台,将传统影视工作流与AI能力无缝结合,让创作者仅用简单一句话就能完成从剧本、分镜、配音到配乐的全过程,将数周的流程压缩至分钟级 。

这种对效率的提升,背后依托的是百度智能云强大的云基础设施,它不仅保障了画面生成、视频渲染等环节秒级响应的性能,更通过高可靠性,大幅减少了由于系统中断或不稳定性带来的业务风险 。

从虚拟陪伴到物理交互,再到颠覆性的内容生产,这些AI创企的「众生相」,立体地展现了「商业进化」的多样路径 。

同时,他们的实践也指向了一个共同的结论:今天的AI创业,已经不是单点的模型能力比拼,而是对底层算力、工程化平台、生态资源和场景化解决方案的一场综合性考验 。

 

2 「水电煤」之上:百度智能云的「全栈牌」怎么打?

 

厘清了AI创业者的需求,平台方需要给出的,便是一套系统性的解法。百度智能云给出的,即是一套帮助创业者的全栈式服务体系。

 

百度智能云副总裁、百度智能云泛科技业务部总经理张玮

 

首先是「不止于模型」。从VAST对大规模深度学习的算力需求,到Kotoko复杂的跨云部署挑战,再到具身智能公司灵生科技对云端仿真平台的依赖,都证明了AI创企需要的远不止API 。

针对技术深度的挑战,百度智能云提供的是一套全栈AI基础设施 。 这套设施从底层自研的昆仑芯片、百舸算力管理平台,到中间层的文心大模型、千帆大模型平台,再到上层的应用,形成了一个技术闭环 。

创业公司可以基于此,更专注于自身业务逻辑的构建。例如,在一个具身智能合作案例中,百度智能云与初创团队共建云端仿真平台,极大地降低了机器人测试成本,加速了研发进程 。

其次,为了解决产品迭代速度的问题,百度智能云的策略是用强大的工具平台,提升开发效率 。 AI开发的高门槛是共识,为此,千帆ModelBuilder平台提供了一站式服务,从数据处理、模型训练到上线部署,将复杂的流程模块化,支持创企像「搭乐高」一样快速构建解决方案 。 官方数据显示,使用该平台可以将一个新模型的开发时间缩短70% 。

一个具体的案例是:一家医疗AI创企,利用该平台仅用3周时间就完成了从算法验证到临床部署的全过程,成本降低了40% 。

最后,也是最现实的成本控制问题。百度智能云通过三大策略帮助企业「精益创新」 :

  • 弹性算力: 基于分布式云架构,创企可按需调用GPU等异构算力,相比自建数据中心,成本可降低60% 。 一家做AI视频处理的企业,通过弹性算力,在业务高峰期节省算力成本超300万元/年。
  • MLOps实践: 引入机器学习运维体系,通过自动化测试、性能监控等工具,将模型上线后的维护成本降低50% 。
  • 生态资源支持: 这也是此次「AI创投加速计划」的核心,通过整合投资机构、政府、以及百度自身的C端入口(如搜索、地图)和B端客户网络,为创企提供资金、用户和商业场景的全方位支持 。

可以看出,百度智能云的策略,是用一个系统性的「AI工程化」工具和服务组合,去支撑前端「百花齐放」的应用创新 。这是一种「授人以渔」的思路,也是其能够连续5年稳坐AI云公有云市场第一所积累下的工程化能力和服务经验的体现 。

 

3 新的故事才刚开始

这次亿元扶植政策的发布 ,意义不止于账面数字的投入,也是百度为AI竞赛的下半场落下的关键一步——当行业的重心转向真实的商业场景,百度选择将自己核心的算力、技术工具以及真金白银打包,集结那些最有活力的AI原生玩家。

 

创企计划详情

 

在服务了数百家AI创企后,可以看到百度云在支持创企的路上已经有了一条清晰的「三阶跃迁」成长路径,在度过产品验证期之后,从场景验证期再到生态扩张期,百度智能云的「在场辅助」,让创企有机会走的更远:

在第一步的产品验证期。 创业者往往只有一个MVP(最小可行产品)需要快速试错。这时,百度智能云提供算力补贴和模型工具包,帮助企业「0基础启动」;

第二步,是场景验证期。 当产品方向被验证,企业需要深入一到两个垂直场景,打造出标杆案例。百度智能云则开放行业模型库和生态资源,帮助他们将成功经验固化为可复制的解决方案 。

第三步,是生态扩张期。 有了样板间,便可以撬动更大的世界。通过百度智能云的开放平台,创企得以连接更多合作伙伴,最终形成「技术+数据+渠道」的增长飞轮,成长为赛道的领跑者。

大模型时代的竞争,最终将是生态的竞争。谁能真正帮助AI创企解决商业化难题、实现价值闭环,谁就能赢得未来。而百度云此举,正是在从「云服务商」向「生态共建者」和「价值同盟」转变。

今天的百度AI DAY只是AI商业进化的一个切片 ,而这个「百家创企联盟」 的故事才刚刚开始。值得期待的是,未来,在这个生态到底会生长出怎样的新物种?

 

点击阅读原文,了解更多百度智能云AI创企政策

 

【阅读原文】

 

https://app-5f8s7d1xbapu.appmiaoda.com

传 DeepSeek-R2 8 月发布;微信测试信用借款功能;Perplexity 要 345 亿美元收购 Chrome

2025年8月13日 07:59

DeepSeek-R2 预计将在 8 月发布 人工智能概念股普涨

市场期盼 DeepSeek-R2 已经有一段时间,而在 ChatGPT-5 发布之后,市场对此的预期更盛。今天,市场上突然传出,DeepSeek-R2 的预计发布时间窗口为 2025 年 8 月 15 日至 8 月 30 日。但具体日期尚未官宣。

可能是受此刺激,昨日早盘,人工智能概念股集体拉升。其中,最值得注意的是每日互动,该股早盘一度大涨 12%。DeepSeek-R1 推出之初,该股由 18 元/股附近开始起涨,短短几个交易日便突破了 70 元/股,是当之无愧的 DeepSeek 概念股龙头。他的飙升意味着市场已经在计价这一传闻。

值得注意的是,8 月 11 日,DeepSeek 服务突遭全面宕机,API 接口、网页平台以及 App 均无法访问或响应。

据市场猜测,全面宕机可能的原因包括流量峰值冲击。DeepSeek 用户量已突破 1.1 亿,高峰时段服务器负载超限触发保护机制。类似故障在 2025 年 1 月、4 月、5 月和 7 月均发生过,均因短期流量激增导致。

此外,网传 DeepSeek-R2(性能对标 GPT-5) 即将发布,可能引发用户集中测试,加剧服务器压力。少数用户反馈服务正常,推测故障可能为区域性或不完全中断 (如部分节点异常)。目前,DeepSeek 网页/API 已恢复。(来源:券商中国)

Perplexity 向谷歌 Chrome 提出 345 亿美元收购要约

8 月 13 日消息,美国司法部目前正在对谷歌提起反垄断诉讼,提出包括拆分 Chrome 浏览器在内的多项强硬要求。

据《华尔街日报》,AI 初创公司 Perplexity 向谷歌 Chrome 提出 345 亿美元(IT 之家注:现汇率约合 2480.71 亿元人民币)收购要约,而该公司估值约 180 亿美元。目前几乎没人认为谷歌会同意出售。

Perplexity 承诺,不会对谷歌浏览器 Chrome 的默认搜索引擎进行隐秘修改;未来 24 个月内在开放网络领域投资 30 亿美元(现汇率约合 215.71 亿元人民币)。

此外,Perplexity 还表示将向谷歌浏览器 Chrome 指定的大部分关键员工发出聘用邀约。(来源:IT 之家)

 

特朗普对英特尔 CEO 态度软化,不再要求其辞职

一场白宫会晤,似乎暂时平息了美国总统与芯片巨头英特尔之间的紧张关系。

本周一,美国总统特朗普在白宫会见了英特尔 CEO 陈立武,媒体报道称陪同会见的还有美国商务部长卢特尼克和财政部长贝森特。会后,特朗普在其社交平台 Truth Social 上发文称,这次会面「非常有趣」,并赞扬陈立武的个人奋斗史是一个「惊人的故事」。值得注意的,四天前,特朗普还在在公开要求英特尔 CEO 辞职。

双方还将在未来一周内就美国政府如何支持英特尔提出建议方案。特朗普在帖子中明确表示,陈立武将与他的内阁成员共度时光,并「在下周内向我提出建议」。英特尔方面则在一份声明中称,双方进行了「坦诚且富有建设性的讨论」,并期待与本届政府密切合作,以「重振这家伟大的美国公司」。(来源:华尔街见闻)

小红书推出 PGM 人才计划

8 月 12 日,小红书通过官方招聘微信渠道发布 PGM(Product General Manager)人才计划,宣布将面向市场招募 5 名敢于成为破局者的超级产品经理人才,不限背景,以 24 个月定制化培养体系,寻找和培养下一代业务负责人及事业合伙人。

不同于传统管培生项目,PGM 计划采用「实战轮岗 + 自主定义战场」模式:首年入选者将在小红书用户产品、商业产品、平台产品、战略与投资和国际化五大核心领域中选择两个方向各轮岗 6 个月,独立负责真实项目;次年可选择某个重要业务方向,解决公司级命题;2 年后一起定义核心战场。

资源支持方面,PGM 项目计划提供 CEO 及业务一号位 1V1 导师指导、与创业者 / 投资人深度交流的「小饭桌」机制,以及一线田野调研机会。

小红书在计划中表示,其目标是「让下一代将领从这里打出来」。(来源:极客公园)

 

微信分付灰度上线借款功能 与支付交易记录挂钩

8 月 12 日消息,据媒体报道,腾讯旗下消费信贷产品「微信分付」近日悄然推出借款功能新服务。

该功能目前仍处于灰度测试阶段,符合条件的用户可基于历史大额交易记录,将额度提现至银行卡,用于微信支付体系外的消费场景,进一步拓展了金融服务边界。

根据介绍,微信分付的借款功能与交易挂钩,需满足三个条件:1、近 30 天、支付满 100 元的交易;2、支付时未使用「分付」付款;3、通过系统综合评估。

借款成功后,微信分付额度同步减少。这也意味着,借款和信用消费占用同一个信贷额度。

去年底,微信分付已向部分用户开放。根据介绍,微信分付可用于吃饭购物等消费,暂不可用于发红包。利息按日计算,日利率 0.045%,随时还款,已还部分不再收取利息,每月最低还款 10% 就能继续使用。

有分析人士表示,微信分付目前的「借款」功能有点类似信用卡的借款功能,不过要和已发生的交易挂钩,主要是试图筛选出外部交易场景,评估对应的用户消费水平,从而为授信动作打好基础。(来源:快科技)

 

宇树官宣参加 2025 首届世界人形机器人运动会比赛

8 月 12 日,宇树官宣参赛首届世界人形机器人 (18.860, -0.31, -1.62%) 运动会。宇树表示,据初步了解,到时现场会盛况空前,除宇树团队外,还有多支其他团队使用宇树机器人硬件参赛(使用他们自研的算法)。因赛事项目紧凑较多,宇树没有参与全部项目。

「预祝所有参赛队伍都能取得好成绩,共同创造机器人运动的新纪录。」
据了解,2025 世界人形机器人运动会将于 2025 年 8 月 14 日至 17 日,在国家速滑馆「冰丝带」举行。(来源:新浪科技)

微软将为 Win11 系统 365 用户更新伴侣「三件套」,Win10 用户无缘

8 月 12 日消息,微软今天更新了旗下 365 的路线图,确认将在不久后为使用 Windows 11 系统的 365 用户推出名为「Microsoft 365 伴侣」的应用

最新的 Microsoft 365 路线图中,微软介绍三款伴侣应用的详情:「Microsoft 365 伴侣」是包含「人员」、「文件搜索」和「日历」在内的一套应用,用户可通过 Windows 11 任务栏快速访问这些工具,提高生产力。这些轻量级应用可与 Microsoft 365 无缝集成,让用户高效查找联系人、找到不知在哪的文件、查看日历,并在不受干扰的情况下优化工作流。
微软还表示,伴侣应用会按照既定的部署计划,通过 Microsoft 365 更新流程自动安装到符合条件的电脑上。同时微软还表示,这些应用在安装完成后将会开机自启动,不过不喜欢的用户也可以在设置内关闭开机自启动功能。
此外,本「三件套」应用是 Windows 11 独占,无法在即将终止支持的 Windows 10 系统上使用。(来源:IT 之家)
 

吉利全新博越汽车将于 8 月 17 日上市:标配 Flyme Auto 车机系统,预售价 9.19 万元起

8 月 12 日消息,吉利汽车宣布旗下全新博越将于 8 月 17 日上市,新车在内外饰上进行了部分调整,全系标配 Flyme Auto 系统,预售价为 9.19 万元至 11.29 万元

IT 之家获悉,该车采用全新的前脸设计,配备竖向格栅,格栅上方搭配贯穿式灯组。车身侧面采用时下流行的悬浮车顶设计,配备传统门把手。同时,新车轴距相比现款车型加长了 6mm,来到 2707mm。其提供了水映银、雨巷白、兰亭灰、琉璃蓝四种外观配色,以及如意橙、福禄灰两种内饰配色。
新车配备了悬浮式矩形中控屏,以及水晶挡把并保留部分实体按键,整体采用了橘色 + 黑色的搭配设计。中控屏分辨率为 1920×1080,全系标配吉利最新版 Flyme Auto 1.8 系统。
动力方面,新车依旧搭载 1.5T 涡轮增压四缸发动机,最大功率 133kW,最大扭矩 290N・m,传动系统匹配 7 速双离合变速箱,最高时速 198km/h。(来源:IT 之家)

全球首只「机器藏羚羊」现身可可西里:由四足机器人「扮演」,可远距离观测藏羚羊行为

8 月 12 日消息,杭州云深处科技昨天在微信公众号宣布,其基于绝影 X30 四足机器人制作的「机器藏羚羊」现已布置在可可西里无人区深处的卓乃湖。

据介绍,这只「机器藏羚羊」由新华社媒体中心发起创意,云深处提供了 X30 四足机器人(IT 之家注:也被称为机器狗)与通讯控制方案苏州白鹿鸣团队完成了仿真动物外形制作。在实际任务中,这只「机器人藏羚羊」依托 AI 学习与训练,可跨越雪地、沼泽、荒漠和河流等复杂地形。
另外,云深处还为这只「机器藏羚羊」搭载了自组网通信模组,可在复杂地形条件下快速部署现场网络,加强了机动场景通信能力;机器狗自身可负重 85 公斤续航时间可达 2.5-4 小时,可应付可可西里复杂的环境。
在任务中,这只「机器藏羚羊」在开阔地带操控距离达 2 公里,可跨越坎坷山路、泥泞湿地等障碍,用其伪装外形融入藏羚羊群进行近距离观测、静默拍摄,避免了传统观测时车辆和人员对藏羚羊的打扰和惊吓
中科院西北高原生物研究所研究员连新明表示:「藏羚羊还有很多未解之谜,譬如它为何迁徙产仔,原因还众说纷纭。藏羚羊的研究和保护需要依托科技的进步」,他们还将继续利用好机器人和 AI,在藏羚羊科研、保护方面发挥他们的价值。(来源:IT 之家)
昨天以前极客公园

雷军:小米YU7改名,被误会是丐版;传淘宝闪购周末峰值超美团;低价 MacBook 或年底亮相,599 美元

2025年8月12日 08:24

雷军征求小米 YU7 标准版改名意见:很多人误以为是入门或丐版,配置绝不输于竞品 Pro 和 Max 版

8 月 11 日消息,小米创办人、董事长兼 CEO 雷军在微博向网友征求小米 YU7 标准版是否改名的意见,称标准版很多人误以为是入门版或者丐版,但实际上非常强大,续航高达 835 公里,700 Tops 算力的 Thor 芯片和激光雷达等等,配置绝不输于竞品 Pro 版和 Max 版。

目前,该投票已有 2404 名用户参与,有 1794 票投给了「低调一些,继续叫标准版」、610 票投给了「对齐竞品,直接叫 Pro 或 Max 版」。

据此前报道,小米 YU7 于 6 月 26 日晚上市发布、7 月 6 日交付首批车主,提供 YU7 标准版、YU7 Pro、YU7 Max 三种车型配置,售价 25.35 万-32.99 万元。该车开售 3 分钟大定突破 20 万台,1 小时大定突破 28.9 万台,仅 18 小时锁单量便突破 24 万台。(来源:IT 之家)

OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回

8 月 11 日消息,OpenAI 上周正式发布新一代人工智能模型 GPT-5,该模型已在中国提交商标申请,国际分类涵盖科学仪器、网站服务,目前所有相关申请均已被驳回。

具体来看,OpenAI 公司已通过两家关联公司在中国提交了商标申请,其中:

欧爱公司申请注册两枚「OPENAI GPT-5」商标,国际分类为网站服务、科学仪器,目前均处于等待驳回复审阶段;

欧爱运营有限责任公司申请注册两枚「GPT-5」商标,国际分类同样为网站服务、科学仪器,商标状态也均为驳回复审中。

据悉,「GPT」全称为「生成式预训练转换器」,已被全球多国商标机构认定为通用技术术语,缺乏显著性。美国专利商标局(USPTO)曾两次驳回 OpenAI 对「GPT」的注册申请,理由是「阻止竞争对手正确描述其产品」。

发现,欧爱运营有限责任公司还在 2023 年申请多枚「CHATGPT」「GPT-4」「GPT-6」「GPT-7」商标,国际分类为科学仪器、网站服务,当前商标状态均为「驳回复审中」。(来源: IT 之家)

 

事关稳定币,蚂蚁集团辟谣

8 月 11 日消息,蚂蚁集团今日在其官微发文:关注到网络上有消息宣称「蚂蚁集团与中国人民银行、中国稀土集团共建全球首个稀土人民币稳定币」,并以此诱导投资者关注相关板块,蚂蚁集团从未与相关机构有此类计划,请公众注意甄别,谨防上当受骗。

(来源: TechWeb)

 

微软 GitHub CEO 托马斯・多姆克离职,将再次创业

8 月 12 日消息,微软 GitHub CEO Thomas Dohmke(托马斯・多姆克)晚间发文,宣布将卸任 GitHub CEO 一职,去开启他的下一段冒险。

托马斯表示,GitHub 正在蓬勃发展,未来前景光明。

托马斯在发给 GitHub 员工的内部帖子中表示,十多年前,他的初创公司被微软收购后,他和他的家人从德国搬到了美国。从开发移动开发者工具,到与 Nat Friedman 一起运营 GitHub 的收购,再到成为 GitHub 的 CEO 并引领公司进入 Copilot 和 AI 时代,「这真是一段难忘的旅程」。

然而,经过这么长时间,托马斯表示他的初创公司根源开始拉扯他,因此决定离开 GitHub,再次成为创始人。GitHub 及其领导团队将继续作为微软 CoreAI 组织的一部分执行其使命,更多细节将很快公布。(来源:IT 之家 )

美团上线「点外卖看鹿晗演唱会」活动,鹿晗工作室:平台活动非官方授权

8 月 11 日消息,近日,美团 App 内出现点外卖看鹿晗演唱会相关活动信息。对此,2025 鹿晗 Season4 亚洲巡演活动官方微博 @ 这就是 Season4 发文并配图表示:

如下某平台活动及话题,均非我方及鹿晗先生官方授权合作,已侵犯鹿晗先生的人格权及我方对该演唱会的独家合法权益。对此我方已完成取证,并保留依法追诉的权利。

随后,鹿晗工作室官方微博也转发了该消息并提醒网友:「请认准官方渠道,勿轻信此类未经授权的营销信息,保护好自身隐私及财产安全,谨防权益受损。」

值得一提的是,笔者在美团平台搜索发现,相关页面也出现了用户获得鹿晗演唱会门票信息。另外,有媒体就此事向美团方面求证,截至发稿,官方暂未回应,客服表示「相关问题会详细记录反馈给相关部门。」(来源:快科技)

 

消息称淘宝闪购上周末峰值首次超过美团

8 月 12 日消息,据晚点 LatePost 昨日晚间报道,在 8 月 7 日立秋这天,淘宝闪购的日订单量在当天 20 点就创下了新纪录,但这一天的日订单量,美团仍比淘宝闪购多出了约 2000 万单。

8 月 7 日 - 9 日,在「秋天的第一杯奶茶」「88 会员日」「大会员体系」「超级星期 6」各种促销活动以及居民楼办公楼商场车站随处可见的橙色广告的共同推动下,淘宝闪购的日订单量连续在这三天都超过了 1 亿单。据该媒体了解,8 月 8 日和 8 月 9 日,这两天淘宝闪购的日订单量份额首次超过了美团。

报道称,双方统计日订单量的口径并不统一:

  • 美团的口径是完成履约的订单,即当天配送到消费者手中的订单;
  • 淘宝闪购的口径是完成交易的订单,即当天消费者支付的订单,这其中也会包括预约第二天配送的订单,8 月 7 日那天淘宝闪购的预约单占比接近 10%。

而那些奶茶店最后倒掉的饮料,或者消费者付款后迟迟收不到货然后退款的订单,在美团和淘宝闪购都属于无效订单,不被统计在总单量。

根据淘宝闪购及饿了么官方发布的数据,8 月 7 日立秋当天,有 30 多万餐饮小店在淘宝闪购平台上成交突破峰值,饿了么骑手数量达到去年的 3.5 倍,平均收入是去年的 1.4 倍。(来源:IT 之家)

 

马斯克的最强 AI 模型 Grok 4 现已免费开放,非订阅用户每天可限量使用

8 月 11 日消息,马斯克上午宣布,Grok 4 现在对所有用户免费开放。免费用户每天可完成少量查询,超过限制则需要订阅。

根据 xAI 官方 X 账号的介绍,只需使用「自动」模式,Grok 就会将复杂的查询路由到 Grok 4。若用户偏好「掌控一切」,则可以切换到「专家」模式。在限定的时间内,xAI 将提供「慷慨的」使用额度。

据 IT 之家此前报道,马斯克曾宣称 Grok 4 是全球最强 AI 模型,在处理学术问题上的表现已经达到博士级别。

从官方公布的跑分数据来看,Grok 4 模型具备非常亮眼的成绩,在实时速度、推理能力和高级视觉等方面,将和 OpenAI、Anthropic 顶尖模型同台较量。(来源:IT 之家)

 

「全球首个孕育机器人」预计一年内面世,定价不超 10 万元

8 月 11 日消息,据潇湘晨报 8 月 10 日报道,国内某机器人公司创始人张其峰正在研发全球首个孕育机器人和传统的试管,这套系统模拟了子宫环境,还装进仿人类的机器人体内,让「机器人妈妈」从怀孕到分娩,全流程复刻人类体验。

报道称,目前该技术就是孕育箱的技术,只是将其与机器人的肚子相结合,预计「样机」一年内推出,定价不超过 10 万元。

张其峰是广州卡伊瓦机器人科技有限公司的创始人、董事长兼 CEO。该公司成立于 2015 年,推出了餐饮服务机器人系列、迎宾讲解机器人系列等多款产品。(来源:IT 之家)

长城全新坦克 500 Hi4-T / Hi4-Z 智享版汽车预售发布:带激光雷达、Coffee Pilot Ultra 驾驶辅助系统,36 万元起

8 月 11 日消息,长城全新坦克 500 Hi4-T / Hi4-Z 智享版汽车今日预售发布,新车配备激光雷达、搭载 Coffee Pilot Ultra 驾驶辅助系统,预售价 36 万元起。

  • 全新坦克 500 Hi4-T 智享版:36.00 万元
  • 全新坦克 500 Hi4-Z 智享版:38.88 万元

据介绍,全新坦克 500 Hi4-T / Hi4-Z 对车辆外观进行调整,配备激光雷达。外观方面,新车身轮廓与在售车型保持一致,采用举折中网 + 琉璃珀车标,配备斗拱大灯 + 宫阙之眸尾灯,辅以承天腰线设计;内饰方面,全新坦克 500 配备山水画卷中控台 + 丹陛石副仪表板、Coffee AI Sound、5.4L 智能冷暖双用冰箱、50W 双无线充电,并改用怀挡式换挡设计。

新车搭载长城汽车第三代智能辅助驾驶系统 Coffee Pilot Ultra,拥有 27 个辅助驾驶传感器(激光雷达 + 摄像头双冗余方案),包含 1 个激光雷达、3 个毫米波雷达、12 个超声波雷达、11 个高清摄像头。新车拥有全融合泊车系统,支持自定义泊车、记忆泊车、遥控泊车、倒车循迹等功能,同时还拥有 Coffee Night Vision 远红外夜视系统。(来源:IT 之家)

 

低成本 MacBook 或将于 2025 年底上市,售价 599 美元

据《电子时报》报道,预计新款 MacBook 的至少部分零部件将于 2025 年第三季度末投入量产。该报道援引供应链内部未透露姓名的消息人士的话,进一步称新款 MacBook 的售价将在 599 美元至 699 美元之间。

这样一来,新款 MacBook 的价格将与台式机 Mac mini 持平,并且比目前 13 英寸 MacBook Air 的起售价(999 美元) 低 300 至 400 美元。

据报道,新款 MacBook 的显示屏尺寸将略小,为 12.9 英寸。据 MacRumors 首次报道,生产计划意味着它将在 2025 年末或 2026 年初发布。这也与郭明錤之前的报道相符。

郭明錤没有透露更精确的发布时间表,也没有具体价格。但他表示,这款设备将配备约 13 英寸的屏幕,并有银色、蓝色、粉色和黄色四种颜色可供选择。(来源:cnBeta.COM )

法国最大核电站因水母入侵导致暂停运营

8 月 12 日消息,法国电力集团于当地时间 8 月 11 日宣布,位于法国北部的格拉沃利讷核电站因设备系统附近出现大量水母而停机,整座核电站暂停运营。

法国电力集团发表声明说,大量水母聚集导致水泵站过滤设备触发保护机制,4 台反应堆机组于 10 日晚至 11 日清晨相继停机。这座核电站其余两台机组因接受维护,先前已关机停运。

格拉沃利讷核电站位于法国北部省,临海而建,是法国最大核电站,共配备 6 座反应堆,总装机容量 5.4 吉瓦。

这次事件未对核电站、人员或环境造成安全影响。工作人员正进行紧急诊断和维修,以确保核电站安全重启。

据央视新闻援引法国媒体报道,全球变暖导致海温上升,有利于水母繁殖。格拉沃利讷核电站发言人说,水母入侵导致反应堆停机「相当罕见」,但历史上也发生过类似事件。(来源:IT 之家)

 

昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周

2025年8月11日 23:29

 

作者|Li Yuan

编辑| 郑玄

 

笔者最近的 guilty pleasure,是沉迷于刷《甄嬛传》的二创和解析视频。

刷着刷着,就发现了一个有趣的现象:现在用《甄嬛传》的原声直接给产品打广告,已经成了一门新显学。前一秒祺贵人还在说「臣妾要告发熹贵妃私通」,后一秒可能就在用同样的声线推荐某款咖啡。而且,和早年的 AI 视频不一样,现在祺贵人的嘴型都已经可以对准地相当自然了。

不过,虽然在一两句台词上已经以假乱真了,只要超出一两句的范畴,「娘娘带货」基本上还是翻车的。

现有技术生成的视频,一旦拉长时间,各种问题就暴露无遗:人物的动作和手部常常僵硬扭曲,与商品或环境的交互极不自然;画面质量会随着时间推移出现视觉伪影甚至「崩坏」;镜头语言更是死板单一,无法满足专业场景需求。

用这种技术生成一两句带货视频插在一个长视频里,是猎奇的亮点,但真要让「安陵容」完整地唱一支 MV,或者让「皇后娘娘」做一场半小时的直播带货,观众很快就会因为这些挥之不去的瑕疵而感到疲劳,就算是《甄嬛传》这样的顶级 IP 也拉不住。

不过,AI 的进展,当然是很快的。你永远可以相信 AI 的发展速度。

8 月 11 日,昆仑万维就正式发布其在 AI 视频生成领域的最新力作—— SkyReels-A3 模型,似乎就是为了精准解决上述所有问题而来。

据悉,昆仑万维 Skywork AI 技术发布周正式启动,8 月 11 日至 8 月 15 日,每天将发布一款新模型,连续五天发布覆盖多模态 AI 核心场景的前沿模型。

基于 DiT(Diffusion Transformer)视频扩散模型,只需要输入参考图像/视频,文本 prompt 和音频, SkyReels-A3 模型就能生成长达一分钟的可以用文本控制的数字人视频。

SkyReels-A3 模型专门对手部动作交互、运镜控制和美感表达进行了增强,瞄准的是包括口播导购 带货、MV/演讲等 情景。

当前 SkyReels-A3 模型已上线,欢迎登录 SkyReels 官网体验,登录后在左侧导航栏中选择 Talking Avatar 工具。

 

 

这意味着,娘娘们也能带货了?

 

01

直播介绍商品可用,

和物体交互十分自然

 

在 SkyReels-A3 模型生成的视频中,笔者注意到一个很大的特点是,生成的数字人可以和物体进行自然的交互。

比如在这个桌游带货的场景中:

这段 SkyReels-A3 生成的桌游介绍视频中,桌游盒子保持了很好的前后一致性,主播和桌游的交互也很自然。桌游本身封面如下图:

虽然看着容易,但其实在测试中,其他模型的生成效果,很可能是这样的:

SkyReels-A3 之所以能让数字人自然拿起桌游,主要是对广告主播等业务场景,进行了手和商品的交互优化。

SkyReels-A3 直接针对手部动作的自然度和清晰度,构造了针对线上直播等场景的数据,并采用了不同 seed 和训练过程 ckpts 来生成大量候选。通过 reward model 来挑选 top-1 最好最差的结果,采用直接偏好学习来进一步优化模型的生成结果。

除了带货,同样的能力,也会让模型在其他方面表现更突出。

比如在下面的 mv 场景中,SkyReels-A3 模型生成的数字人歌星很自然地就握起了话筒,真实感一下子就提升了。

除了与话筒的交互,这个视频也能感受到,整个模型的上肢运动十分自然。

目前可以看到的有些数字人模型,虽然已经能够做好嘴形对齐,但是稍微经过一点时间,就会感觉到只有嘴巴在动,很假。而 SkyReels-A3 已经做到了不错的效果。

 

02

有美感、无限长的长视频正在解锁

 

除了能与物体进行自然的交互,要让数字人视频真正摆脱「玩具感」,迈向「生产力」,还必须攻克两大难题:如何让视频在拉长时间后依然保持稳定,以及如何打破固定机位的呆板视角。

而这,也正是为什么现在《甄嬛传》的 AI 二创仍然通常只能在一两句台词的长度内,维持极高的真实感——时间再长,就容易「露馅」。

SkyReels-A3 在此也进行了一些优化。

 

 

图丨 Skyreels-A3 实现音频驱动人物对话视频生成技术框架

传统 AI 视频生成,最大的痛点在于误差累积。模型就像一个记性不太好的学生,一句接一句地往下说,说到后面就忘了前面,导致画面出现肉眼可见的劣化、扭曲,也就是常说的「崩坏」。

而 SkyReels-A3 选择采用了一种聪明的插帧方法。简单来说,它不再是傻傻地根据前一帧猜下一帧,而是能预先锚定一个未来的、清晰的「关键帧」,再高质量地补全中间的视频片段。这种机制确保了即使视频长达一分钟,人物的面部和画面也能保持高度的一致性。

这带来了什么直接的好处?简单来说,就是彻底打开了视频时长的枷锁。 从技术上讲,这种架构甚至支持无限长的视频生成,虽然在实际产品部署中可能会限制单次上传的音频文件大小,但 生成一段单镜头、分钟级别的视频已经毫无压力。

如果说长时稳定解决了「能不能看」的问题,那么丰富的镜头语言则决定了视频「好不好看」。

以往的数字人视频多是「大头贴」式的固定视角,非常乏味。SkyReels-A3 则内置了一个基于 ControlNet 的镜头控制模块 ,直接赋予了创作者「导演」的权力。根据其技术文档,模型预设了推镜 (push in)、拉镜 (push out)、左摇 (pan left)、右摇 (pan right) 等 8 种常见的专业运镜,且每种运镜的强度都可以从 0 到 100 连续调节。

从左到右的运镜在直播带货的场景下,显得更自然。

手持镜头效果则可以模拟 vlog 的效果。

虽然生成完全的长视频,数字人技术目前仍然不能完全以假乱真。但笔者在看完在 SkyReels-A3 时长和运镜上取得的突破后,已经看到了未来的潜力。

一个稳定、可控、具备镜头感的长视频数字人,已经足以叩开许多过去难以想象的应用场景的大门。短期内,上半身自然的长视频数字人,似乎可以被用在 mv 等场景中。未来,则更不可限量。

 

03

昆仑万维技术周重磅推出,

SkyReels-A3 首日亮相

 

昆仑万维此次还公布了 SkyReels-A3 的技术指标。使用了基准 A-Bench 上(涵盖日常对话,唱歌和口播等不同场景),测评了多个维度:Sync-C 和 Sync-D 用于精确测量生成视频中唇部动作与音频的同步程度。IQA 和 ASE 则是通过专门训练的 MLLM 来评估视频画面的质量和艺术性。ID similarity 则是通过 cosine 相似度,计算生成视频和参考图/视频的人脸相似度。

 

 

可以看到, SkyReels-A3 在衡量唇部同步精准度的 Sync-C 指标,画面的艺术性和人脸相似度上,都达到了行业先进的水平。

实际上,SkyReels-A3 这样一个在多个维度上都带来惊喜的模型,仅仅是昆仑万维本周技术发布会的「开胃菜」。它背后所展现的,是昆仑万维作为中国 AI 领域第一梯队的深厚积累与全栈能力。

回望过去,昆仑万维的 AI 战略始终呈现出「开源贡献」与「产品落地」双线并进的鲜明特色,这使其不仅成为勤勉的「基础设施建设者」,更是锐意进取的「顶尖产品经理」。

一方面,作为「基础设施建设者」,昆仑万维以持续的顶尖开源模型,为行业「修路搭桥」,彰显其技术硬实力。

过去数月,昆仑万维密集开源了多个在行业内取得 SOTA(State-of-the-Art)成就的大模型:

早在 2025 年 2 月,其开源的中国首个面向 AI 短剧创作的视频生成模型 SkyReels-V1,便已在 Hugging Face 总排行榜上连续多日稳居前十。今年 4 月,更是发布了全球首个使用扩散强迫框架的无限时长电影生成模型 SkyReels-V2,不断突破技术边界。

除此之外,在多模态领域,其不仅推出了成功将强文本推理能力迁移至视觉模态的思维链推理模型「Skywork-R1V」系列,还发布了集图片生成、理解和编辑于一体的化模型「Skywork UniPic」,以 1.5B 的轻量级规模性能逼近同类大参数模型。

针对专业领域的挑战,昆仑万维也毫不示弱,其数学代码推理模型「Skywork-OR1」在同等参数规模下实现了业界领先的推理性能。而软件工程自主代码智能体基座模型「Skywork-SWE」也是在开源 32B 模型规模下实现了业界最强的仓库级代码修复能力。不仅如此,昆仑万维还前瞻性地布局了空间智能领域,推出了工业界首个开源的 10B+空间智能大模型「Matrix-Game」。

另一方面,作为「顶尖产品经理」,昆仑万维毫不掩饰其商业雄心,亲自下场打磨直面用户痛点的惊艳产品,将最前沿的技术迅速转化为生产力。

集成了视频大模型与 3D 大模型的 AI 短剧平台 SkyReels,搭载了最新的 SkyReels-A3 模型,让创作者能够「一键成剧」,轻松制作高质量 AI 视频。

当第一天的发布就已经为 AI 数字人视频的种种顽疾提供了如此有说服力的解法,我们不禁对未来充满期待:在接下来的四天里,昆仑万维还会拿出怎样的杀手锏?

这场从 8 月 11 日持续到 15 日的技术发布周,或许正是昆仑万维在向外界宣告——其 AI 全栈能力已然成熟,并且准备好在牌桌上亮出更多底牌。对于整个行业和所有 AI 关注者而言,好戏,才刚刚开始。

*头图来源:昆仑万维

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

世界机器人大会:笨拙的今天,与狂奔的明天

2025年8月11日 23:12

作者| Li Yuan

编辑| 郑玄

笔者刚刚从今年的世界机器人大会回来。

「人,实在是太多了。」这是今年世界机器人大会上,几乎每个人见面的第一句开场白。

世界机器人大会人潮年年汹涌,但今年,那种摩肩接踵的压迫感格外强烈。

不过,比人多更震撼的,是你几乎无处不遇的机器人。去年,它们绕场走一圈,还得三五个「保镖」在旁牵绳护送;今年,尤其是开展第一天,你一个转身,就可能与一台两条腿、甚至四条腿的新物种擦肩而过。

今年的机器人,变得前所未有地渴望与世界互动——叠衣服、拉被子、和观众比试拳击、踢球、和观众互动递送物体……同时,这种急切也带来了大量的翻车现场——你几乎能在社交媒体上找到所有顶尖公司的翻车现场,无论是鬼畜的机器人倒地抽搐,还是自信满满地抓取眼前的东西,结果一直在努力地抓着空气。

但是比起前几年机器人展会上,很精心编排的机器人舞蹈,固定交互中慢速的把一个东西抓到另一个地方,你能明显感觉到有活力从里面生长了出来。

相比于其他行业,机器人企业似乎更不避讳翻车现场。这种不精心编排的演示,带着一种经济上行的美感:一种「我知道我会出错,但我依然是未来」的自信。它混乱,却迷人,属于高速增长行业独有的美感。

这也是这次笔者从世界机器人大会回来最深的感触:只要有未来,只要长得足够快,人们愿意等待一个暂时无用的机器人。


01

加速的进化:

为何行业如此振奋?


人们之所以如此宽容,是因为机器人这个行业,尤其是人形机器人这个赛道,仍然在以一个极高的速度,同时进化着它的「两翼」。

两翼的一端,是双足人形机器人的运动能力。

这是笔者来过的第三年世界机器人大会,在 2023 年的世界机器人大会上,宇树机器人的 CEO 王兴兴还在和在场的机器人同行们解释,为什么前一年开始入局做人形机器人的算法, 在接受极客公园采访的时候,提到当时「波士顿动力的软件层面遥遥领先」 。当时整场的人形机器人,能直接行走的屈指可数。

而短短两年,人形机器人的运动能力已经大大升级。

宇树机器人一如既往地展现出了第一流的运动控制能力。现场观看搏击比赛,机器人的力度真的有点令人震撼。

而这种运动能力并没有限于宇树,是多点开花的。

众擎机器人长项在于拟人动作,跳舞的动作像人的可怕。

逐际动力最新发布的全尺寸人形机器 LimX Oli,有 1 米 65 高的全尺寸人形结构和 31 个主动自由度。也在现场完成了轻快步、模特步和正步,包括高动态的舞蹈和功夫表演。



松延动力也展示了一个机器人翻跟头的现场演示。

而在另一端,机器人的灵巧泛化操作能力也在快速进化。

往年,一个机器人能听懂语音指令,然后慢慢抓起一个特定的小球递给你,就已经是顶级演示。今年,多家公司的展示,已经将目标指向了柔性物体的操作——这是从「会抓」到「会用」的关键一步。

柔性物体的难度在于它的不可预测性。一个刚性的瓶子,物理属性恒定;而一件衣服、一个香囊,是无定形的、柔软的,每一次抓取都可能呈现不同形态。要拿稳它,不仅需要「看见」,更要「理解」,还得在毫秒之间预判它的形变,并即时调整力度。刚性物体的抓取,在日常生活中只占一小部分;而柔性物体,才是通向家庭和服务场景的必经之路。

今年,已经有多家公司在这一领域展现出令人惊讶的成果:

比如星海图此次展示的拉被子演示。视频虽然有加速,但是能够把被角收起的情况下机器人自主推理找到被角拉开,且多次随机重复下都能成功,也是很精彩的演示。

自变量的做香囊也是全程柔性物体操作。

以年为单位来看机器人的进步,无疑是巨大的。

更重要的是,这些能力并非由某一家垄断。在这个高速发展的赛道中,新玩家持续涌入,带来更多可能性。比如,长期以服务机器人闻名的擎朗智能,今年也推出了自己的双足机器人,计划在酒店等熟悉场景中进行商业落地。擎朗 CEO 李通在极客公园采访中表示,双足研发的技术壁垒已不再高企,「看到机会就可以做」。

在高速发展的赛道中,大批成立于 2024 年,甚至成立于 2025 年的等实力选手纷纷入局,各自带着独门绝技,在这片丛林中占据自己的山头。

当然,促使这场进化的,还有嗅到商机的源源不断的投资人。他们用真金白银投票,确保这场关于进化的豪赌,有足够的燃料,以当前这令人眩目的速度,继续狂奔下去。


02

略显尴尬的落地:

双足提供情绪价值,操作只能找小场景


「这机器人能落地吗?」

这是展会现场空中飘荡着的最响亮的问题,从投资人到创业者,再到每一个好奇的观众都对这个话题很是关心。

但当笔者逛遍世界机器人大会,一个略显尴尬的落地现状是:在当下,人形机器人在很大程度上仍是「无用」的。

一位资深投资人向我估计,今年全行业的人形/类人型机器人总出货量也许在三万台左右。

而笔者走访各家展台得到的体感甚至更为保守:大多数公司的年出货量目标都只在几百台,能突破一千台的,已是金字塔尖的佼佼者。

宇树 CEO 王兴兴一直表示,研究机器人,最终是希望它来干活的。不过当被问及当下双足机器人的价值,除了情绪价值之外,还有什么?

宇树创始人王兴兴的答案坦诚得惊人。他表示,之所以做双足,是因为它技术上更简单,是一种「Why not?」(为何不呢?)的逻辑。哪些技术先成熟,哪些技术就优先做。

情绪价值没有对标,在双足机器人领域,市场竞争目前似乎也在变得更加激烈,让“无用之用”的接受度更高。

宇树 R1 WRC 表演 |图片来源:宇树科技

如果说两条腿的机器人,目前主要在提供情绪价值;那么,长着两只手的操作型机器人,则面临着另一种更棘手的困境——「有用之难」。

工厂、智慧零售、酒店餐饮……这些宏大的叙事谁都懂,但现实是,技术还远远达不到。

一方面,机器人的「大脑」还不够聪明。目前的模型训练,大多只能完成几个孤立的动作,要让一个机器人在一个真实场景里,成功完成多项任务,暂时还不太容易做到。

另一方面,灵巧操作仍是巨大的瓶颈,需要依靠数据、硬件等多方面技术一起进步。

目前行业比较认同的 VLA 路线,严重依赖于数据。而实际上,数据的高质量的操作数据又极度依赖高精度硬件来采集。而硬件的迭代,本身也需要一定的时间和操作来反哺迭代。

今年,一些公司已经意识到这一核心痛点,开始试图解决这一问题。

比如,2025 年才成立的零次方,据称今年已出货 200 台,能在 2025 年成立后迅速就出货的原因之一,就是其核心技术能力之一就是做高质量数据采集。

笔者也在展台体验了星尘智能的数据采集工具。展台人员介绍,他们采用绳驱传动、极度丝滑的硬件结构,才能采集出更「干净」的数据,进而训练出动作同样丝滑的模型。

在宏大场景迟迟难以马上落地的当下,一些公司的展示策略很是巧妙:他们会上演刷马桶、收拾屋子等看似酷炫的任务演示,但真正销售的,并不是家政机器人,而是面向科研人员的开发平台。这些高难度的演示,就像精心设置的「诱饵」,用来吸引最有购买力的客户,为这场「有用之难」的探索买单。

也仍然有许多公司,选择在真实环境中硬碰硬,实地采集数据,力图找到那个能真正撑起商业化的切入口。

这个场景或许需要有点苛刻——需要一定的泛化操作能力,以至于此前工业机械臂无法覆盖;同时又要避开与人频繁接触、过高速度要求,以及廉价人工过于容易替代的可能。

条件虽然苛刻,但这样的场景并非不存在,例如工厂某些特殊的上下料环节,比如服务业的某一个整理行为。各家各擅其场,都在找自己的细分领域,也都在相信自己可以从一台两台试验机,慢慢涨到十台几十台试点机,慢慢开始逐渐渗透一个场景。

所以说,无论是「无用之用」,还是「有用之难」,为什么行业对这种落地的尴尬似乎并不在意?

答案简单而纯粹——因为虽然距离真正的「有用」还很遥远,但每一家的出货量,都在实实在在地增长。

只要曲线还在上扬,技术还在进步,就有希望。


03

为何等待?

一场可以「寸进」的长跑


在今年的世界机器人大会上,笔者观察到一个迷人的悖论。

几乎每一位机器人公司的 CEO,在描绘未来两三年的宏伟蓝图时都充满了不容置疑的乐观,但话锋一转,又都会真诚地补上一句:「请给我们一些包容,成长不会那么快。」

这种略微矛盾的姿态,也精准地投射到了公众的认知里。

在网络舆论场,人们对人形机器人的观感几乎是撕裂的:要么是顶礼膜拜,视其为下一个时代的序章;要么是嗤之以鼻,断言它不过是昂贵的遥控玩具。

行业内部也远未达成共识。有人坚信,VLA(视觉-语言-行为模型)就是技术的「奇点」,通往通用智能的康庄大道已然铺开,剩下的只是时间和算力的问题;也有人认为,技术仍在混沌中爆炸性发展,行业还在等待一个能定义范式的、天才式的突破。

机器狗戏水 | 图片来源:现场拍摄

那么,在这种遍布着矛盾、分歧与误解的喧嚣中,行业那股不可动摇的信心,究竟从何而来?

答案或许只有一个,那就是相比其他前沿科技,机器人产业有着一项无可比拟的特权:「寸进,亦是胜利。」

自动驾驶的宿命,是「L5 或一无所有」,在抵达那个完美终点前,每一步商业化都如履薄冰。而机器人不同,模型能力每向前推进一毫米,就可能撬开一个细分到极致的新场景——哪怕这个场景,仅仅是支撑一家企业多卖出几百台机器人,获得活下去的燃料,奔赴下一场更艰难的战役。

或许资本,也是看清了这场增量游戏的本质,才愿意不断加注。他们愿意忍受更长的周期,去赌一个可以被「分期兑现」的未来。

但耐心是有额度的,他们究竟能赌多久?

在一场英伟达举办的论坛中,宇树王兴兴和银河通用王鹤同场对谈,对行业未来做出预测。

宇树的王兴兴给出的答案是每年至少翻一倍;而王鹤的预测,则是每年翻十倍。

从一倍到十倍,这道巨大的裂谷,就是对行业未来不确定性最诚实的度量。

它意味着,没有人真正知道终点线有多远,也没有人知道通往终点的正确路径。

他们唯一确信的,只有一件事:

在一个高速成长的行业中,速度是唯一的通行证。

*头图来源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

马斯克:可能失去特斯拉控制权;何小鹏:听雷军劝,全新 P7 做 24 小时耐力测试;传华为将发 AI 推理突破成果

2025年8月11日 07:55

 

马斯克自曝或失去对特斯拉的控制

近日,马斯克公开称自己对公司的控制权并不稳固,甚至「可能被赶下台」。这场风波的起因是马斯克对自己持股比例的公开忧虑。据悉,近日马斯克在社交平台 X 上发帖回应,认为自己目前约 12.8% 的持股比例,并不足以确保其在公司的主导地位。

他担心在未来公司生产「数百万台机器人」后,自己可能会被激进的股东「赶下台」。

近日,一篇帖子提到马斯克的持股比例为 21.2%,并暗示其中大部分股份已被用作贷款抵押。

对此,马斯克澄清:「仅供参考,我目前没有任何以特斯拉股票为抵押的个人贷款。」

他同时指出,其股票期权的税率接近 45%,这意味着他获得的投票控制权净增长仅在 4% 左右。

马斯克表示,他希望拥有大约 25% 的公司股份,才能获得足够的影响力来引导公司的发展方向。(来源:新浪财经)

消息称华为即将发布 AI 推理领域突破性成果

据报道,华为将于 8 月 12 日在 2025 金融 AI 推理应用落地与发展论坛上,发布 AI 推理领域的突破性技术成果。据透露,这项成果或能降低中国 AI 推理对 HBM(高带宽内存)技术的依赖,提升国内 AI 大模型推理性能,完善中国 AI 推理生态的关键部分。(来源:科创板日报)

 

英特尔首席执行官陈立武周一将访问白宫

据媒体援引知情人士报道,英特尔首席执行官陈立武将于周一访问白宫。该报道称,预计陈立武将与特朗普进行广泛的谈话,同时希望解释他的个人和职业生涯背景,并补充说,他可能会提出英特尔和美国政府可以合作的方式。报道还说,陈立武希望通过表明他对美国的承诺,并保证将保持英特尔制造能力的重要性,以争取特朗普的认可。(来源:36 氪)

研究显示,美国计算机专业应届生失业率,超生物、艺术史专业两倍

根据纽约联邦储备银行的最新研究,计算机科学专业的应届毕业生失业率高达 6.1% 至 7.5%,这一数字是生物学和艺术史专业毕业生失业率的两倍多。《纽约时报》的深度报道更是揭示了这一现象背后的残酷现实。

一方面,人工智能编程技术的广泛应用正在逐步淘汰初级岗位,使得大量计算机专业毕业生失去了入门的机会。另一方面,亚马逊、Meta 和微软等科技巨头纷纷裁员,进一步加剧了就业市场的竞争。学生们陷入了所谓的「AI 厄运循环」:他们利用 AI 技术批量投递简历,而企业则使用 AI 自动筛选简历并快速拒绝,有时甚至在几分钟内就做出决定。(来源:IT 之家)

 

听从雷军建议,全新小鹏 P7 纯电轿车将进行 24 小时耐力测试

8 月 10 日消息,小鹏汽车董事长何小鹏发文称:「之前雷总和我围绕真正高性能的纯电车型,专门讨论过是否应该做 24 小时耐力测试的事情,这是一件非常难、强度非常大的测试,雷总建议可能的话都应该去做一下测试。」

小米 YU7 Max 测试车今年 6 月曾进行一场纯电车 24 小时耐力挑战,就是用纯电车连续超高速跑 24 小时(含充电时间),看看可以跑多少公里。其最终成绩为 3944km,扣除充电时间,平均时速 210+km/h;充电 30 次,每次 10-12 分钟,这次测试获中汽中心认证。

雷军透露,这项测试有四大难点:1、持续保持 210km/h+ 超高速行驶;2、单次续航要长;3、充电要快;4、散热要好,要扛得住 24 小时连续几十次快充快放。

全新小鹏 P7 于 8 月 6 日迎来中国首秀并开启预售(没有公布预售价),将于本月晚些时候正式上市。新车全系标配全域 800V 高压架构平台、5C 超充 AI 电池,10 分钟补能 525km,最长续航高达 820km,每百公里能耗 12kWh,拥有 3 秒级零百加速性能、230km/h 最高时速。(来源:腾讯科技)

 

王兴兴:机器人模型、架构不统一,相当于 ChatGPT 诞生前的 1-3 年

在 2025 世界机器人大会上,宇树科技 CEO 王兴兴发表了对机器人行业现状与未来发展的演讲。王兴兴认为,目前机器人行业对数据关注太多,对模型关注太少。现在最大的问题其实是模型问题,当前的机器人模型架构不够好不够统一,即使有很多比较好的数据训练,但是也无法使用。

他指出,尽管机器人行业今年以来发展速度惊人,但智能机器人当下及未来最关键的挑战仍是「具身智能机器人大模型」。

而目前模型的发展仍然比较缓慢、架构不统一,尚未出现重大突破。假如类比AI大语言模型的发展,其还处于「ChatGPT诞生前的 1-3 年」。

王兴兴还表示,希望宇树公司的机器人做成可以综合干活的通用型人形机器人,包括工厂、表演、家庭等各种场景,而不仅仅是单一场景。

据他介绍,目前宇树公司绝大多数员工,包括他本人,都在为训练机器人在各个场景干活而服务。

此外,王兴兴还提到,未来 2-5 年智能机器人技术的重心,是统一、端到端智能机器人大模型,更低成本、更高寿命的硬件,超大批量的制造,以及低成本、大规模算力。(来源:快科技)

苹果或推出全新 AI 语音控制功能:试图改变 iPhone 操控方式,为机器人产品打基础

8 月 10 日消息,彭博社记者马克・古尔曼今晚发布了最新的 Power On 时事通信,他表示苹果正测试一项全新的 Siri 功能,旨在让 iPhone 用户仅凭语音即可完成精准操作。如果一切顺利,它可能会改变游戏规则。

据介绍,这一功能将依托改进的 App Intents 技术,可实现跨应用的深度控制,包括查找、编辑并发送特定照片,或者在社交媒体上发表评论,浏览购物应用并将商品加入购物车,甚至无需触摸屏幕即可登录某个 App 或服务。

据称,该功能原计划与新一代 Siri 一同推出,但因内部测试与兼容性问题推迟至明年春季,并将配合 Siri 基础架构全面升级同步上线。

古尔曼认为,该技术不仅是 Siri 的 AI 升级要点,更是苹果构建「语音优先」交互生态的重要一步。未来,苹果计划将这种语音技术应用于正在研发的智能家居设备,包括计划于明年发布的智能显示屏和后续的桌面机器人。(IT 之家)

 

央视朱广权提前体验 vivo Vision 头显,双指空中捏合「轻松上头」

8 月 11 日消息,vivo 去年底曾宣布将推出一款混合现实(MR)头显设备,新品名为 vivo Vision。

在今年 4 月的 vivo X200 Ultra 手机发布会上,vivo 宣布 Vision 混合现实头显将在今年下半年发布。

根据博主 @ 向往草原的牛马啊 8 月 9 日晒出的图片,央视主持人朱广权提前体验到了这款 vivo Vision 头显。

该头显的设计风格跟苹果 Vision Pro 相似,前面板集成了很多摄像头,支持双指捏合操作,外挂的一根线是用于连接外置电池。(来源:@ 向往草原的牛马啊)

34 年历史终结:美国运营商 AOL 宣布 9 月 30 日正式取消拨号上网服务

8 月 11 日消息,美国在线(AOL,现隶属于雅虎旗下)宣布将于 2025 年 9 月 30 日正式停止其基于公共交换电话网络(PSTN)的拨号上网服务,结束其长达 34 年的运营历史。

尽管宽带早已在美国普及,但在部分偏远地区,宽带接入仍未覆盖或价格昂贵。数据显示,截至 2021 年,拨号上网服务仍有「数千」用户。

美国联邦通信委员会(FCC)最新报告显示,美国农村地区有 23.3% 的居民、土著部落地区有 27.7% 的居民缺乏固定陆地 25/3 Mbps 宽带覆盖,而城市地区这一比例仅为 1.5%。这也是 AOL 在推出拨号上网 34 年后,仍保有部分用户的原因之一。

根据公告,AOL 将在停止拨号上网服务的同时,终止相关软件,包括 AOL Dialer 和 AOL Shield 浏览器。(来源:网易)

 

小红书为什么要做“漫展”?

2025年8月10日 21:51

2025 年夏天,小红书第一次以线下漫展的方式进入了游戏与二次元产业的舞台中央。

8 月 8 日开幕的 REDLAND,是小红书首次线下大型漫展。与大部分漫展选在会展中心不同,首届 REDLAND 将场地选在了上海复兴岛——一个曾经的船厂遗址,小红书把它打造成为了「全球首个痛岛」。

REDLAND 拥有整整 80000 平方米的户外空间,涵盖三大沉浸式展区与 50 多个游戏与动漫 IP。更特别的是,它以「开放世界冒险岛」的方式构建了一套高度拟游化的观展机制:从角色设定、任务系统,到徽章收集与沉浸式互动体验,小红书显然不满足于复刻传统漫展模式,而是在探索打造一座沉浸式的「2.5 次元主题乐园」。

如果你对小红书的印象还停留在「自拍、种草、美妆护肤和旅游攻略」,那么你可能会对它举办一场大型漫展感到惊讶。但 REDLAND 的出现,恰恰说明了这个平台正在经历一次更深层的社区兴趣结构重组。

事实上,在 REDLAND 举办之前,小红书平台的内容生态已经发生剧烈变化。过去一年,平台上二次元内容同比增长 175%,游戏内容增长 168%,成为小红书继时尚、美食之后的第三、第四大垂类。今年 7 月,小红书平台也正式完成品牌升级,从「你的生活指南」转变为「你的生活兴趣社区」。

在这一背景下,REDLAND 更像是小红书社区升级后的「一场线下考试」。在二次元与游戏内容成为平台新引擎的当下,这场展会既是一次对用户文化的响应,也是小红书试图建立线下 IP 影响力的开始。’

REDLAND 嘴硬博物馆丨来自:极客公园

REDLAND:不只是漫展,还是「箱庭世界」

在正式逛展前,REDLAN 的主创团队先与受邀媒体进行了简短的交流。项目团队对于展会整体设定的介绍迅速勾起了我的兴趣——它听起来与传统的漫展、游戏展有明显的区别。

REDLAND 采用了非常规的展览结构,将整个复兴岛划分为三大展区:

  • "翻身时空港"(船台):以米哈游的御三家(《原神》《绝区零》《崩坏:星穹铁道》)、腾讯的《王者荣耀》、网易的《蛋仔派对》等热门 IP 为核心,搭建上也与船厂遗迹相融合;
  • "重生试炼场"(老仓库):《和平精英》的「天降帅锅」展、《苏丹的游戏》的撅卡体验,以及育碧、小众独立游戏试玩集中于此;
  • "发呆小森林"(复兴岛公园):主要展示《剑网三》《永劫无间》《逆水寒》等古风 IP,隐藏有宝可梦彩蛋任务和多个自建社团展台。

重生试炼场的独立游戏试玩丨来自:极客公园

不同于传统漫展或游戏展常见的「标准展位+舞台演出」结构,REDLAN 的整体动线、互动机制乃至世界观设定,都更像是一场线下 RPG 游戏。

为参观者,我在入口处领取了「新手装备包」,其中包含防晒喷雾、补水饮料等户外必需品,一枚初始徽章和一张角色身份卡。徽章像是经验条,参与展位互动集齐三个后可兑换金徽章;角色身份则分为五类(穿梭者、探索者、鉴赏家、体验者、决胜者),我拿到的是「决胜者」身份。很明显小红书希望用选游戏职业的方式增强观众的代入感,不过直到结束我也没弄明白这个身份有什么作用。

进入展区后,玩家们需要沿着「翻身时空港-重生试炼场-发呆小森林」这条动线移动,沿途可以选择自己感兴趣的展位去体验,带有一定的开放世界结构。但与其说是沙盒式逛展,我更愿意形容 REDLAND 像一个「线下箱庭游戏」:区域不大但内容精巧,动线虽固定却有一定节奏。

REDLAND 的展区地图丨来自:小红书

展位的玩法设计上,REDLAND 整体也更强调互动性。几乎所有参展 IP 都设置了与玩家的互动机制,而且这些机制大多参考原作游戏的经典玩法。例如,《原神》展台是游戏里经典的打靶小游戏,《苏丹的游戏》则模仿游戏里经典玩法——抽卡然后做任务撅卡,《柯南》则是复刻了动画里的电梯杀人案,需要玩家在现场找线索推理……

《苏丹的游戏》REDLAND体验丨来自:极客公园

在搭建风格上,REDLAND 同样体现出不同于传统漫展的思路。一方面,每个 IP 展位更像是一个沉浸式主题空间,观众仿佛步入一个小型的迪士尼或环球影城。例如「发呆小森林」中的《剑网三》《逆水寒》,借助公园原生态环境还原了古风世界观,给玩家们带来不错的沉浸感。

发呆小森林唯美国风展区丨来自:极客公园

另一方面,REDLAND 也有强烈的统一性。比如整个展区到处都有补给站、徽章点、NPC、任务板等有着 REDLAND 世界观元素的区域,甚至各个 IP 展位大多也以像素 RPG 风格进行再创作,使整个展区在风格上更趋一致。相较之下,传统漫展更多体现为参展商自有逻辑主导,展馆之间主题可能不同,但展位之间风格参差,而 REDLAND 则有更统一的叙事语境和空间秩序。

REDLAND 互动体验丨来自:极客公园

当然,作为首届活动,REDLAND 仍有不少待改进之处:8 月的户外高温对观众与 Coser 来说都颇具挑战,部分展位互动较浅,动线与任务引导还可优化。但整体观感上,它确实在一定程度上实现了为用户「搭建一个现实版二次元世界」的目标——这是一场融合了「真人游戏」与「沉浸主题乐园」概念的线下试验。

REDLAND 背后,小红书如何理解「新二次元」?

逛完展后,我自己的感受是:REDLAND 背后连接的是小红书对新一代二次元文化的一种系统理解。

前文提到,二次元和游戏已成为小红书第三和第四大的内容垂类。其快速增长背后,我认为有三个关键要素:女性向二游如《恋与深空》的迅速崛起;主机游戏和独立游戏玩家在小红书找到兼具「用户-用户」「用户-创作者」属性的社区交流场域;以及最重要的,对 2.5 次元人群需求的深入响应。

与传统 ACG 社区侧重 OGV 与 UGC 内容不同,小红书并未试图复制原有模式,而是在 UGC 生态中发掘出「2.5 次元人群」的表达路径:他们不再只是观看者,而是将 IP 融入日常生活——为角色庆生、cos 角色出行、痛服拍照、快闪团建等,形成了一种介于虚拟与现实之间的生活方式。

过去一年小红书兴趣热点笔记增长情况丨来自:DT 商业观察

这些表达方式本就存在于二次元的线下文化中,但在此前,国内并没有一个线上社区能完整承接这类用户的日常表达。而小红书的打卡机制、内容发布形态与兴趣社群组织能力,天然适配这一类「沉浸型表达」,并伴随泡泡玛特、乙游、漫展等二次元周边文化的兴起而快速放大,最终延伸到主机游戏、男性向二游等更广泛的 ACGN 圈层。

逛漫展/游戏展是这类热爱线下和周边的 2.5 次元群体非常重要的文化生活方式,但传统漫展越来越难以满足这些用户,尤其是抛开收集吧唧(徽章)、coser 集邮、线下打卡等社交货币层面的需求,当同人内容、IP 资讯转向线上传播下,线下展会要提供真正的差异化价值,必须突破「打卡/集邮」的表层机制,构建更具内容密度与社交能量的空间。

在这方面,主题乐园是一个可借鉴的方向。比如日本环球影城中的动漫 IP 体验区、VR ZONE 等虚拟现实乐园,均在提供「沉浸体验」上获得二次元群体的青睐。REDLAND 项目组也提到:「我们想给非现充用户一个痛的空间,就像迪士尼是给现充造的童话,而 REDLAND,是为游戏与二次元用户搭建的开放世界。」

这也解释了为什么 REDLAND 并未采用传统「漫展招商」逻辑,而是从场景出发倒推展位策划:厂商需结合地貌设计展台,每个展位必须设计互动机制,平台原创展位与主线任务共同强化「整岛游乐场」的沉浸体验。

在国内 ACGN 线下内容渐趋固化的当下,这种具备「社群意识+互动机制」的平台型实验,无疑具备探索价值。当然,这也对资源调度、策展能力提出了更高要求:高质量沉浸展往往投入巨大,如何平衡二次元群体的文化诉求、互动设计的体验感、以及漫展运营的现实产出,这或许是小红书在持续推进大型漫展项目时必须长期思考的问题。

REDLAND 入口丨来自:极客公园

结尾

最后一个问题是:小红书能否成为二次元和漫展的新变量?

就目前来看,小红书并未将 REDLAND 定位为商业化重资产项目,更多是在完成一场「兴趣文化的空间实验」——洞察了快速增长的 ACGN 社区需求,进而尝试将二次元世界和小红书社区文化结合并搬到线下,打通线上线下的内容链路。

从平台的角度看,这次实验释放了几个明确信号:小红书正在形成自身的内容美学与空间表达方式;它愿意为用户的兴趣建构一个「可感知的、可游玩的」物理空间;它希望用这样一场岛屿级的策展行为,来捕捉用户的情绪价值与文化认同。

REDLAND 不是传统漫展的对标物,也不是谁的挑战者。它更像是这个时代内容社区探索「虚实融合」的一次尝试。

它的完成度还不够高,但它的想象力足够新。

而这,或许已经足够。

GPT-5 发布后遭用户吐槽,GPT-4o 重新上线;苹果创五年多来最大单周涨幅;暑期档电影总票房破 80 亿元:《南京照相馆》超 20 亿|极客早知道

2025年8月10日 08:21

GPT-5 发布后遭用户吐槽,OpenAI 将 GPT-4o 重新上线

8 月 9 日,据报道,OpenAI 于 8 月 8 日发布的 GPT-5 模型系列并迅速向所有用户推送。尽管官方称 GPT-5 在推理能力、任务执行和多模态理解方面有重大突破,但部分资深用户怀念 GPT-4o 的互动体验,认为 GPT-5 缺乏创意与温度,且基于 GPT-4o 的工作流程在新模型上效果大打折扣。此外,免费用户还抱怨更快触碰到使用次数上限,被迫考虑升级至付费版本。

面对用户不满,OpenAI 首席执行官 Sam Altman 在 Reddit 上举办 AMA 活动并亲自回应用户关切。他承诺为 ChatGPT Plus 用户带回 GPT-4o,并根据使用情况决定支持时长;同时,正在研究让用户同时使用 GPT-4o 和 4.1 的选项;此外,将为 Plus 用户在全面推送完成前将 GPT-5 的使用上限翻倍,并提高透明度,让用户更容易知道每个回答由哪个模型生成。

8 月 9 日,OpenAI 发文宣布 GPT-4o 已重新上线,供 Plus 和 Team 用户使用。若需多平台使用,用户可在 ChatGPT 网页版设置中启用「显示旧版模型」来访问 GPT-4o。(来源:网易科技)

苹果创五年多来最大单周涨幅,库克白宫之行降低关税担忧

8 月 9 日,据报道,苹果股价周五上涨 4%,收于每股 229.35 美元,创下自 2020 年 7 月以来的最大单周涨幅。本周的股价变动为苹果增加了超过 4000 亿美元的市值,目前其市值已达 3.4 万亿美元。

此前,该公司首席执行官蒂姆・库克于周三与特朗普总统一同出现在白宫。库克与特朗普在白宫共同宣布,苹果计划在未来四年内向美国企业和美国产零部件投资 1000 亿美元。

苹果计划购买更多美国芯片的举措令特朗普感到满意。他在公开会议上表示,由于该公司在美国进行生产,将有资格豁免未来可能使进口芯片价格翻倍的关税。(来源:新浪科技)

 

马斯克炮轰 OpenAI 和微软关系,纳德拉回帖称期待 Grok 5 到来

8 月 9 日消息,科技媒体 Windows Central 发布博文,称特斯拉 CEO 伊隆・马斯克猛烈抨击微软与 OpenAI 的数十亿美元合作,称其背叛了 OpenAI 非营利初心,沦为微软的「事实子公司」。

马斯克在诉讼中强调,OpenAI 原本承诺为全人类利益发展通用人工智能(AGI),如今却在微软主导下追求利润最大化。这一转变被马斯克视为「根本性背叛」,并为此提起两起法律诉讼,其中第二起更指控 OpenAI 涉及「racketeering」(敲诈勒索活动)。

尽管马斯克言辞激烈,微软和 OpenAI 高层反应冷淡。微软首席执行官萨提亚・纳德拉在回应马斯克称「OpenAI 正在蚕食微软」时,回应「期待 Grok5 的到来!」(来源:IT之家)

 

Gemini 不断发出自我厌恶的评论,Google 正在努力解决

今年 6 月,一位 X 用户分享了一段会话截图,其中显示 Google Gemini 说了一句「我不干了,我显然没能力解决这个问题。代码有问题,测试有问题,而且我是个傻瓜,」聊天机器人说道。「我犯了太多错误,已经不值得信任了。」

7 月份,一位使用 Gemini 的 Reddit 用户表示,该机器人「陷入了循环」,然后分享了类似的自嘲信息。

一名 X 用户将这两条帖子自己的账号上,引发了 Google DeepMind 集团项目经理 Logan Kilpatrick 的回应。

「这是一个恼人的无限循环错误,我们正在努力修复!Gemini 今天的情况还不算太糟,」Kilpatrick 写道。(来源:cnBeta)

2025 暑期档电影总票房破 80 亿元:《南京照相馆》超 20 亿

8 月 9 日,根据灯塔专业版数据,2025 年暑期档(6 月-8 月)总票房(含预售)突破 80 亿元。今年暑期档至今总出票量为 2.13 亿张,场次高达 2904.12 万,平均票价为 37.6 元。

其中,抗战题材影片《南京照相馆》总票房已破 20 亿(今早已突破 21 亿),在《南京照相馆》之后,《长安的荔枝》以 6.57 亿的档期票房位居第二;7 月 2 日上映的《侏罗纪世界:重生》,档期票房为 5.59 亿,排名第三。(来源:IT之家)

 

宇树王兴兴:曾坚决反对人形机器人,机器人 ChatGPT 时刻在两三年内

8 月 9 日,宇树 CEO 王兴兴在世界机器人大会上透露,自己曾经最坚决反对人形机器人,宇树直到 2022 年都完全没有做人形机器人。但以 ChatGPT 为代表的 AI 技术进步显著以及马斯克等对于尖端技术关注度高,当时宇树有客户直接找到宇树、愿意给钱下订单,直接导致宇树开始做人形机器人。

同时,王兴兴还表示,快的话,可能未来的一两年或者两到三年,就会迎来机器人的 ChatGPT 时刻,「最慢的话我估计 3 到 5 年也是很大概率能实现这个概念,大家可以关注一下。」(来源:第一财经)

 

Cursor 限时免费提供 GPT-5 支持,并推出全新 CLI 工具

8 月 8 日,根据 Cursor 官方声明及网络信息,Cursor 针对其付费计划用户提供了一定额度的 GPT-5 免费使用权限。X 平台上,@rohanpaul_ai 在 7 月 28 日的帖子中提到,Cursor 正考虑与 OpenAI 深化合作,部分得益于 GPT-5 在编码任务中的卓越表现。帖子指出,GPT-5 在软件工程、代理式规划和多步骤工作流等领域的性能尤为突出,甚至超越了 Anthropic 的 Claude Sonnet4 模型。

此次限时免费活动旨在让更多开发者体验 GPT-5 的强大功能。Cursor 的付费计划用户将获得 GPT-5 的免费使用额度,具体时间窗口尚未明确,但活动已在开发者社区引发广泛讨论。(来源:aibase)

 

多地新规:骑手遵守交规不闯红灯每月可多挣千元

8 月 8 日,据媒体报道,美团在东莞、天津、上海、长沙启动新一轮「不闯红灯安全激励活动」。该活动在各地交警及相关部门指导下展开,骑手在配送过程中遵守交通规则、不闯红灯,每单即可额外获得 1 至 1.5 元奖励,每月可多挣千元。

据介绍,早在今年 5 月,美团便在济南、泉州、惠州、包头等城市开展骑手交通安全治理试点,为保持零闯红灯记录的骑手发放「等灯等灯奖」。活动期间,骑手一周增收达到 400 多元,试点城市超过 2 万名骑手获得奖励,专送骑手闯红灯行为环比减少 26%。同时,在全国 100 余个城市,美团还将「安全分」纳入骑手考核,达到一定安全分等级的骑手将获得对应月度奖金和权益。(来源:新浪科技)

大疆全新运动相机 DJI Osmo Nano 曝光:强调尺寸取消前置副屏、有望 10 月前发布

8 月 9 日,据 Igor Bogdanov 发文,公布了大疆旗下一款全新运动相机 DJI Osmo Nano 的谍照,显示该机将采用类似 DJI Action 2 的机身设计,预计将在 10 月前发布。

外观方面,该机采用单镜头设计,无前置副屏,机身体积相对小于 Osmo Action 5 Pro 等产品,预计将配备类似 Action 2 的可拆卸显示屏模块以实现取景与操作功能。消息源透露,该运动相机将对标影石 Insta360 Go Ultra,不过该机的具体参数暂不知悉。(来源:IT之家)

 

任天堂 Switch 2 新配件专利曝光,有望还原钓鱼全过程

8 月 9 日,科技媒体 Engadget  发布博文,报道称任天堂获批一项新的专利,探索为未来 Switch 游戏掌机添加 Playdate 风格的手摇曲柄(Hand Crank)配件。

根据专利描述,该配件无需额外电源或复杂结构,类似腕带安装方式,通过磁吸方式连接至 Joy-Con 手柄侧边。这一配件能追踪用户的旋转操作,将物理转动转化为游戏输入信号,为玩家提供更直观的操控体验。

该曲柄的核心技术依赖于 Joy-Con 2 手柄内置的鼠标传感器,在用户转动手柄上的曲柄后,传感器可精确捕捉其旋转速度与方向,控制游戏角色或机制。虽然专利未明确指出具体应用场景,但分析认为,钓鱼小游戏是最直接的适配对象。(来源:IT之家)

主导开发《暗黑破坏神》的罗德·弗格森离开暴雪和微软

8 月 9 日,Rod Fergusson 再次离开微软,他宣布将在暴雪工作五年后离开,此前他曾为《暗黑破坏神》系列游戏效力。目前尚不清楚他离开暴雪的原因,但他参与了该系列主要游戏的发行,包括《暗黑破坏神 II:重制版》、《暗黑破坏神:不朽》手游,以及最新的主线游戏《暗黑破坏神 IV》。

弗格森因其在《战争机器》系列中的出色表现而闻名,此前数十年他曾在 Epic Games 和微软任职。今天早些时候,他通过社交媒体宣布了最新的离职消息,并表示:「是时候离开暴雪/微软了,握紧手中的剑,看看接下来会发生什么。」

「这些团队已经为成功做好了准备,未来将推出一系列令人兴奋的作品,」他补充道,并透露了暴雪暗黑破坏神开发团队未来可能推出的作品。

暴雪总裁乔安娜·法里斯也在社交媒体上发文感谢他在暴雪的贡献,并表示:「引领像《暗黑破坏神》这样的系列需要非凡的天赋、远见和团队协作。」(来源:cnBeta)

李想称知道哪个品牌在黑理想;比亚迪:App 将继续使用「比亚迪」原名;世界机器人大会开幕 | 极客早知道

2025年8月9日 08:18

 

李想称知道哪个品牌在黑理想:拿我玩梗可以,但不要恶意诋毁理想车主

8 月 8 日消息,理想汽车 CEO 李想昨日在抖音发布视频,针对近期理想汽车遭遇的黑公关事件发表看法,明确表示公司知晓背后操控的品牌及专业水军机构,同时强调不会因此「黑化」,将坚守原则应对。

 

李想在视频中回顾,理想汽车多款车型发布时均遭遇过类似舆情风波:「当年 L9 发布的时候,就有一波宣传说理想汽车倒闭了;到 Mega 上市的时候大家也都知道相关情况;然后 i8 发布时,又是大量的舆情事件。」他直言,「每一次背后都有一个不同的品牌在操控,这一次我们也知道哪个品牌在操控,但其实背后也都是专业的水军机构。」

尽管这些专业水军机构会「把各种痕迹藏得很深」,但李想坚定表示:「我们不想把自己黑化,去变成跟他们一样的人。如果我们变成跟他们一样的人,他们就彻底赢了。」(来源:IT 之家)

比亚迪:经过内部慎重研讨,App 将继续使用「比亚迪」原名

8 月 8 日消息,历时 21 天,比亚迪 App 合并后发起的全新名称投票已经于 7 月 31 日截止,其中「成就梦想」以 7648 票当选第一。

然而,比亚迪官方宣布:经过我们内部慎重研讨,比亚迪 App 将继续使用原名称「比亚迪」。

比亚迪表示:投票排名第一的「成就梦想」投稿用户,除获得入围奖励外,还将为其发放原定的「采用奖励」(IT 之家注:10000 积分与 50 梦想值)。

 

(来源:新浪科技)

2025 世界机器人大会在北京亦庄开幕

为期 5 天的 2025 世界机器人大会 8 月 8 日在北京开幕,大会吸引了 200 余家国内外优秀机器人企业参展,其中人形机器人整机企业数量创下全球同类展会之最。

 

大会设置「产业发展」「创新应用」「技术融合」三大篇章,超 400 位国内外顶尖科学家、国际组织代表、院士和企业家将聚焦机器人领域产业趋势、应用实践、创新成果展开交流分享。博览会设置创新馆、应用馆、技术馆 3 大展馆,50 家人形机器人整机企业参展,数量创同类展会之最。

本届大会以「让机器人更智慧,让具身体更智能」为主题,得到 28 家国际机构支持,来自全球近 20 个国家的 1 万余名选手参赛,共有 200 余家企业的 1500 余件产品参展,其中首发新品 100 余款。(来源:央视网)

 

OPPO 为员工打造近 5000 套海景房公寓,单间不到 1500 元

8 月 8 日消息,OPPO Find 系列产品负责人周意保 8 月 6 日发文,表示年底要搬到 OPPO 新的工业园,旁边还建了将近 5000 套海景房公寓

周意保表示:「现在的大学生真幸福,入职就能直接住到公司自建的海景公寓,上班通勤时间只需要 7 分钟……」

 

从周意保放出的图片可以看到,该公寓配套有生活服务、休闲娱乐、运动健康、亲子教育、餐饮饮品等设施,户型可选最低 25 平米单间~103 平米三室两厅

从 CUBE 立方设计去年披露的公告获悉,这个「OPPO 滨海湾高级人才房项目」是 OPPO 首个大体量住宅项目,为东莞市滨海湾新区提供人才公寓和完善的生活配套设施,项目总建筑面积约 60 万平方米,建设内容包括 22 栋高层塔楼住宅、2 层地下室以及其他生活配套,可提供约 4100 多套人才住房,可容纳约 1.1 万人。(来源:CnBeta)

蔚来相关人士回应小米、蔚来通过富国银行茅某某向海外转移资金:假消息

8 月 8 日消息,近期网上有传闻称,富国银行茅某某操盘的跨境保理项目表面是为小米、蔚来等中国企业融资,实际利用复杂佣金结构向海外转移资金。

蔚来相关人士就此回应新浪科技表示,蔚来和富国银行及茅某某没有任何合作,也未有任何形式的接触。相关不实言论已经取证,并将追究造谣传谣者法律责任。

IT 之家此前报道,小米公关负责人王化也发文称:「经核实,小米集团在全球范围内没有和富国银行以及『茅 XX』开展过任何合作,也未有任何形式上的接触。相关言论均已取证,并已经启动司法程序追究造谣传谣者法律责任!」

快手上线独立「外卖」入口 外卖商品二季度支付用户数环比增长超 3 倍

快手本地生活在「团购」页面上线独立「外卖」入口。8 月 8 日,记者获悉,今年二季度,快手本地外卖商品支付用户数环比增长超 3 倍。

点击进入「外卖」后,可以看到「外卖省心购」的字样,其中包含特惠外卖商品,包括汉堡披萨、咖啡奶茶、快餐便当等。据《读佳》报道,「外卖」中的商品主要来自美团,用户购买商品后,可以获得兑换券,券需要在美团 App 内使用。(来源:富途牛牛)

 

董明珠回应格力玫瑰空调争议:可能有一点不那么美,但它创造了世界首台,你敢吗?

8 月 8 日消息,据新浪财经报道,格力电器董事长董明珠今日在 2025 第十九届中国品牌节上回应了玫瑰空调的争议。

董明珠表示,玫瑰空调售价 3.2 万元,是世界首台采用仿生玫瑰外观造型的空调,配备 3D 立体油墨丝印技术。

 

玫瑰空调可能有一点不那么美,但它创造了世界首台,你敢吗?」,董明珠反问。

董明珠今日在中国品牌节介绍了格力的产品和价值观。董明珠还向台下观众喊话:不用格力的洗衣机和冰箱,那就是你犯的错误。「我那冰箱可以节能,同时,蔬菜水果摆在里面二十天,依然像从地里刚刚摘出来一样的新鲜,营养都保留了起来」。(来源:IT 之家)

全球 500 余台人形机器人共赴「冰丝带」,首届世界人形机器人运动会 8 月 14 日开幕

8 月 8 日消息,「2025 世界人形机器人运动会发布会」今天举行,确认 2025 世界人形机器人运动会将于 8 月 14 日晚在国家速滑馆「冰丝带」开幕。

 

据央视报道,2025 世界人形机器人运动会是全球首个为人形机器人组织的综合性竞技赛事,共有来自全球五个大洲、16 个国家的 280 支参赛队伍参赛。赛事为期三天,从 8 月 15 日持续至 17 日。

2025 世界人形机器人运动会由北京市人民政府、中央广播电视总台等单位联合主办,总台北京总站联合承办,这是全球首个以人形机器人为参赛主体的综合性运动会。

全球 280 支队伍届时将带着 127 个品牌的 500 余台人形机器人,围绕 26 个赛项展开角逐,包含竞技赛、表演赛、场景赛 3 类 22 个主体赛项和羽毛球、篮球、乒乓球、自由搏击、群体舞蹈 5 个外围赛项。(来源:CnBeta)

微信宣布加强治理财经领域「自媒体」违规行为:视违规程度采取限流、禁言、封号等措施

8 月 8 日消息,微信今晚发布关于加强治理财经领域「自媒体」违规行为的公告。

微信表示,平台致力于打造绿色、安全的网络环境,平台倡导专业证券公司、证券投资咨询机构,具备专业资质的财经和证券类「自媒体」账号发布信息丰富、权威真实的内容,而不具备专业资质为他人提供荐股服务、编造和传播虚假信息,诱导用户进行投资及实施诈骗、歪曲解读国家经济政策等行为,违反了国家相关法律法规及平台规则,平台将进一步深入治理。

微信提醒用户在观看内容时,可留意账号页外显展示是否有对应专业资质、职业资格、专业背景等认证材料名称,注意甄别信息。

 

微信还表示,根据《关于加强「自媒体」管理的通知》《关于开展「清朗・整治『自媒体』发布不实信息」专项行动的通知》要求,平台将进一步防范和治理歪曲解读宏观经济政策、扰乱经济社会秩序等违规行为。特别是对于编造和传播虚假信息,诱导用户投资或实施诈骗,无资质违规荐股等内容,平台将视违规程度对账号采取限制流量、固定粉丝增长、暂停营利权限、禁言、封号等梯度性处置措施。(来源:IT 之家)

 

消息称华为有望国内首发 eSIM 手机:新款三折叠、Mate 80 系列

8 月 8 日消息,据《科创板日报》今日报道,有消息称,华为推出支持 eSIM 的新款三折叠手机,有望成为国内首款商用 eSIM 的智能手机。该媒体从产业界人士了解到,华为确实有相关计划。而后续发布的华为 Mate 80 系列,可能也将有一款机型支持 eSIM。

此外,OPPO 相关负责人向《科创板日报》记者表示,今年年底预计会有首批支持 eSIM 的手机上市

多名业内人士对该媒体表示,对于智能终端厂商而言,eSIM 是比较明确的发展趋势。但政策监管和运营商的态度,将影响 eSIM 技术在手机终端的落地速度。

有产业链人士对该媒体表示,如果华为顺利在 9 月推出支持 eSIM 的三折叠旗舰手机,那么将在国内从苹果手中抢下 eSIM 首发

综合 IT 之家此前报道,博主 @ 智慧皮卡丘 今年 7 月在微博透露,华为新机将采用全新通讯架构,结合后续评论内容预计为 Mate 80 系列。

 

(来源:IT 之家)

 

未受微软裁员 9000 人影响,小岛秀夫游戏《OD》仍在开发中

科技媒体 WccfTech 昨日(8 月 7 日)发布博文,报道称小岛工作室和 Xbox 合作开发的恐怖游戏《OD》仍在开发中,并未受到微软全球裁员 9000 人计划影响。

IT 之家此前报道,微软宣布在全球范围内,裁员超过 9000 人,导致多个游戏项目被取消,其中包括 ZeniMax Online 的新 MMO 游戏、Perfect Dark 重启版、Rare 的 Everwild 以及 Avalanche Studios 的 Contraband 等等。

一位微软发言人今日确认,小岛秀夫与 Xbox 合作的恐怖游戏《OD》仍在开发中。OD 在 2023 年游戏大奖上首次公布,当时引起了广泛关注,成为当年最引人注目的游戏之一。自那以后,关于 OD 的消息不多,小岛秀夫仅简要提及了这款游戏,并表示其目标是创造玩家未见过的体验。

 

(来源:CnBeta)

 

上天入地,从内而外:大疆 DJI OSMO360 深度评测

2025年8月8日 16:40
作者|张勇毅
编辑|靖宇

作为相机领域最独特的存在形态之一,「先拍摄,后取景」一直是全景相机最具颠覆性的优势。它将创作者从「画框的暴政」中解放出来,不再需要在按下快门前就做出构图、角度和焦点的最终决定。

你什么都不需要想,只需要开始录制,它就能以一种近乎隐形的状态,无死角地记录下整个球形空间内的所有内容。所有的创意决策——无论是平滑的摇镜、戏剧性的视角切换,还是聚焦于某个不经意的细节——都可以留到后期剪辑阶段,赋予了创作流程前所未有的自由度。

也正是因为这种特性,全景相机在日常生活中除了作为 Vlog 神器,往往也会以「行车记录仪」的身份出现。无论是国内还是国外的社交网站上,众多车祸现场、惊险路况的第一视角视频,都出自全景相机之手。它们像一个公正的「黑匣子」,忠实记录下事件的全貌,为还原现场提供了无可辩驳的证据。

 

在这种背景下,大疆带着其首款全景相机 OSMO360 姗姗来迟,却又显得有备而来。带着我们已经非常熟悉的那种、充满大疆工程哲学烙印的产品形态。

OSMO360 的诞生,不仅是大疆在尝试再一次「改变一个新市场」,同时也是在宣告一种理念:一款卓越的影像设备,其外在形态应是其内在核心技术最诚实的表达

而这一切,都始于那块为全景而生的方形传感器。

 

01

设计哲学:终极「功能主义」

 

大疆一贯以来的产品设计逻辑,有点像是「如果它是一株植物,那它本来就应该长成这样」。这种「功能主义」高度体现在产品外观上的大疆设计哲学,我们已经领教过多次。

2025 年发布的 Mavic 4 Pro 无人机就是一个绝佳的例证,其机身遍布的传感器、独特的三摄云台结构,每一处设计都服务于其强大的避障和影像功能,毫不妥协,毫不掩饰。

 

Mavic 4 Pro 打造出了让行业印象深刻的「蚕蛹」外观设计 | 图片来源:极客公园

 

回到 OSMO360 产品本身,这种设计哲学得到了更纯粹的贯彻。

OSMO360 最核心的创新,无疑是那两块业界首创的 1/1.1 英寸方形 CMOS 传感器

传统全景相机通常使用矩形的传感器,当投射上鱼眼镜头的圆形视场时,传感器四角的像素区域被白白浪费,这不仅增加了成本,还带来了额外的功耗和发热。大疆凭借其在产业链中的话语权,直接定制了方形传感器,其目的就是为了最大化地利用传感器的有效面积。

 

iPhone 16 Pro 主摄 / Insta360 X5 / OSMO360 传感器尺寸对比| 图片来源:极客公园

 

这一设计的精妙之处在于,它将传感器的利用率提升了 25%。这种效率的提升直接转化为一系列肉眼可见的画质优势。

知道这一点之后,你就能了解到为什么 OSMO360 被设计成了纵向方块状:毕竟它由内而外都是一个「方块」

OSMO360 的外观设计初看之下可能略显「朴素」:它呈现为一个紧凑的、垂直的方块形态 (尺寸为 61×36.3×81 mm),与竞争对手 Insta360 X5 的细长形态截然不同。然而,这种形态并不是单纯的审美选择,而是其内部核心工程决策的直接外部体现。OSMO360 的核心是一块业界首创的方形传感器,而一个方块状的机身,正是容纳这块方形传感器、其散热系统以及电池的最合乎逻辑、最高效的物理结构。

这种设计理念带来了显著的优势。相较于 Insta360 X5,OSMO360 虽然稍厚稍宽,但整体高度更矮,并且重量更轻 (183 克),这使其在便携性和安装灵活性上具备了细微但实际的优势。

 

在实际握持和操作中,OSMO360 展现了大疆成熟的工业设计水准:机身坚固,按键布局直观,仅有的三个实体按键(电源/切换、快门/录制、功能键)配合一块 2.0 英寸、亮度高达 800 尼特的 OLED 触摸屏,提供了清晰高效的交互体验。

 

大疆 OSMO360 按键特写| 图片来源:极客公园

 

对于大疆用户而言,其标志性的滑动菜单逻辑(下滑进入设置、上滑调整参数等)几乎没有学习成本。

 

OSMO360 UI 设计与此前 OSMO 系列产品保持了高度一致设计风格 | 图片来源:极客公园

 

作为一款运动相机,其耐用性至关重要。OSMO360 具备 IP68 级别的防水能力,可在 10 米水深下使用,并能在零下 20 摄氏度的低温环境中正常工作,这使其能够胜任绝大多数严苛的拍摄环境。

此外作为一个运动相机重度用户,让我觉得略感遗憾的是,作为初代产品的 OSMO360 并未像 Insta360 X5 那样,为用户提供可更换镜头盖选项,这对于经常与极端恶劣环境打交道、同时镜头保护结构又要比运动相机脆弱许多的全景相机来讲,可以说是一个相当实用并且安心的功能,我自己手上这台 OSMO360 就在第二天的测试中给镜头盖造成了划痕,因此仍然希望大疆在下一代产品中集成这一设计。

 

在连接性方面,OSMO360 底部巧妙地集成了标准的 1/4 英寸螺口和 DJI 标志性的磁吸快拆/供电系统,这使其既能无缝接入庞大的第三方摄影配件生态,又能与自家的 Osmo Action 系列配件完美兼容,为用户提供了极大的便利性和扩展性。

 

 

OSMO360 磁吸拓展接口特写| 图片来源:极客公园

 

 

02

硬件核心:为全景而生

 

在深入探讨 OSMO360 的硬件细节之前,通过一张直观的规格对比表,可以清晰地看到大疆此次入局所带来的技术优势。

 

OSMO360 和同类竞品的数据对比|数据来源: 大疆官网/Insta360 官网

 

前面提到过,OSMO360 内在硬件最重要的创新,是那两颗 1/1.1 英寸方形 CMOS 传感器,它带来了高达 2.4μm 的巨大单位像素尺寸,是行业标准的两倍,这意味着更强的光线捕捉能力、更少的噪点和更出色的低光表现。其次,更高的效率意味着在输出同等画质时,功耗和发热更低,这对于延长续航和保证高规格视频(如 8K)的稳定录制至关重要。

基于这块强大的传感器,OSMO360 在各项影像指标上都展现出旗舰水准。

  • 视频能力:其最引人注目的规格是支持最高 8K/50fps 的全景视频录制。相比竞争对手的 8K/30fps,更高的帧率为动态画面的流畅度提供了保障,也为后期制作慢动作效果留出了更大空间。此外,它还支持 6K/60fps 和 4K/100fps 等多种规格,满足不同场景的需求。

  • 色彩科学:对于专业创作者而言,10-bit D-Log M 色彩模式的加入是一个决定性的优势。它能够记录超过 10 亿种色彩,提供高达 13.5 档的动态范围,为后期调色提供了巨大的灵活性,能够保留高光和阴影中更多的细节,这是 8-bit 色彩无法比拟的。

  • 低光表现:结合大尺寸像素、f/1.9 大光圈和「超级夜景」模式下的多帧合成技术,OSMO360 在夜间的表现令人印象深刻。即使在开启超级夜景导致帧率减半的情况下,8K/30fps 的规格对于全景视频来说也绰绰有余。

  • 静态照片:在拍照方面,OSMO360 能够拍摄高达 1.2 亿像素 (120MP) 的全景照片,分辨率为 15520×7760,为虚拟导览、建筑摄影或需要大幅面打印的场景提供了惊人的细节表现力,远超竞争对手的 72MP。

大疆的真正实力,并不仅仅体现在单品的硬件规格上,更在于其构建的强大生态系统。OSMO360 的硬件设计充分体现了这种战略思维。

  • 音频革命:OsmoAudio™:OSMO360 最令人惊喜的功能之一是 OsmoAudio™直连麦克风技术。它允许相机直接通过蓝牙连接两颗 DJI Mic 2 或 Mic Mini 发射器,无需任何接收器。这极大地简化了创作者的收音流程。想象一下在骑行场景中,一颗麦克风放在头盔内录制清晰的旁白,另一颗固定在摩托车排气管旁录制环境轰鸣声,两者最终在机内合成为立体声音轨——这种以往需要复杂设备和后期同步才能实现的效果,如今变得轻而易举。这是对创作者工作流的深刻理解和优化,也是竞争对手短期内难以复制的生态壁垒。

  • 血脉相承的兼容性:OSMO360 的电池与 Osmo Action 系列通用,这意味着拥有大疆运动相机的老用户可以无缝迁移电池,大大降低了升级成本和出行负担。此外,磁吸快拆系统也与 Action 系列配件兼容,使得 OSMO360 一经问世,便拥有了成熟丰富的配件生态支持。

 

  • 「隐形无人机」:2.5 米碳纤维长杆:为了进一步拓展创作边界,大疆提供了一款长达 8.2 英尺(约 2.5 米)的碳纤维延长杆。配合全景相机自动消除自拍杆的特性,这根长杆能让 OSMO360 模拟出令人惊叹的无人机视角,实现高空俯拍、穿越等效果。

除了全套长度的自拍杆套装,大疆这次还为 OSMO360 同场发布了一款续航自拍杆,搭配使用能够为 OSMO360 提供额外的 180 分钟的续航支持。

在无人机禁飞区、狭窄的室内空间,或是不便操作无人机的场景中,它为创作者提供了一种合法、便捷且充满创意的「无人机平替」方案

 

 

使用 OSMO360 能拍摄出类似游戏的第三人称视角画面| 图片来源:极客公园

 

 

 

03

软件体验:重塑直觉

 

全景视频的核心魅力在于其「反直觉」的工作流程。对于习惯了「所见即所得」的传统摄影用户来说,先记录一个完整的球形视频,再到后期去寻找和构建画面的概念,无疑是一个需要适应的过程。一个优秀的全景相机软件,其核心任务不仅仅是提供剪辑工具,更重要的是要能够有效引导用户跨越这个认知门槛,让他们轻松领略到「先拍后剪」的乐趣。

大疆为此提供了 DJI Mimo 移动应用和 DJI Studio 桌面软件两套解决方案。这两款软件都提供了全景视频后期重构图(Reframe)的核心功能。用户可以通过设置关键帧来控制镜头的平移、缩放和旋转,或者使用 AI 智能追踪功能锁定并跟随画面中的主体。

 

对于已经熟悉大疆生态的用户来说,整体界面和操作逻辑都相当友好。

 

然而,在细节体验上,大疆的软件仍有提升空间。例如,在 Mimo 中设置关键帧只能实现匀速运动,缺乏对缓入缓出等变速曲线的控制,使得运镜效果略显生硬。

在 DJI Studio 中,对于更专业的后期流程,大疆提供了 DJI Reframe 插件,支持在 Adobe Premiere Pro 中进行重构图,这无疑是面向专业用户的一个重要举措。

在软件体验上,OSMO360 与 Insta360 之间最显著的差异,还体现在对 AI 自动化剪辑的理念上。Insta360 多年来投入巨资开发其 AI 剪辑引擎,其 App 内置不少创意剪辑等功能,能够自动分析素材,智能识别高光时刻,并一键生成带有转场和音乐的酷炫短片。

相比之下,大疆 OSMO360 在发布初期,并未集成类似 Insta360 那样成熟和丰富的 AI 辅助剪辑功能。用户需要先通过「快剪助手」将视频导入 Mimo 应用,然后手动进行大部分的剪辑和重构图操作,流程相对更加复杂一些。

 

04

结语:搅动池水

 

大疆 OSMO360 的发布,远不止是一款新产品的问世。作为影像技术领域的巨头,大疆的入局本身就是对整个 360 全景相机市场潜力的最大肯定。它向行业和消费者传递了一个明确的信号:全景相机已经摆脱了早期「玩具」的定位,正在成为主流内容创作不可或缺的一环。

这场与 Insta360「正面对撞」,对整个行业而言无疑是一股强大的积极力量。必须承认的是,是 Insta360 通过多年的深耕,普及了全景相机的概念,并定义了以 AI 剪辑为核心的软件范式。而大疆的加入,凭借其强大的硬件研发实力、品牌影响力和市场推广能力,必将加速全景摄影的普及,推动双方在技术创新上互相追赶,最终将整个市场的「蛋糕」做得更大。

正如一句老话所说,「涨潮时,所有的船都会升高」。

从这一点来看,作为大疆涉足全景相机领域的初代产品,一款特点鲜明的「双面巨兽」,就已经是对 DJI OSMO360 最好的赞誉。

一方面,它是一个不折不扣的硬件与影像性能的集大成者,在视频分辨率、色彩深度和原生音频集成等关键领域树立了新的行业标杆,为专业创作者提供了前所未有的画质天花板。另一方面,它的软件生态虽然对经验丰富的用户来说功能强大,但仍在成熟过程中,尤其缺乏 Insta360 那样对新手友好的 AI 自动化辅助功能。

最终,OSMO360 的价值回归到了全景摄影的本源:它为创作者提供了一件无比强大的新式武器,让他们能够以引人入胜的、充满戏剧性的、乃至过去无法想象的视角去捕捉这个世界,并用最高质量的原始素材,去精心雕琢属于自己的影像故事。

 

维他动力Vbot:当遥控器被丢掉,才是机器狗「有生命感」的第一步?

2025年8月8日 21:43

 

头图来源:维他动力

 

 

8 月 8 日下午,北京亦庄的世界机器人大会A区一角,人潮涌动间隙,可以看到一只溜达的「小短腿」。

 

它一会儿跟在展区人员身后走来走去,一会儿又挤进人群对着镜头歪头卖萌——这是在WAIC后,维他动力(Vbot)又一次把自家「大头」放到真实人流里「溜达」。

 

如果机器人终究要走进家里的客厅,它应该长什么样?该用什么姿态和你的孩子打招呼?又凭什么让家里人相信,它是一个可以放心的家庭成员?

 

这家成立刚满半年的公司,带着 3 亿元融资、60 多位从 AI、汽车、动画乃至飞机内饰领域跨界而来的工程师与设计师,试图回答以上问题。他们给出的答案,就是这只昵称为「大头」的智能伴随机器人Vbot。

 

联合创始人赵哲伦说,他们在试图用「工程科学的思维控制精度,用艺术的思维创造灵魂」 ,为机器人注入「生命力」。

 

他们想让四足机器人摆脱遥控器,同时回答一个问题:机器人到底能怎样进入真实的家庭生活?

 

「赛博遛狗」|图片来源:维他动力

 

跳出「工具论」,重新定义机器人的「存在感」

 

「大头」不是人们印象中那种带着工业气息、充满机械感的机器狗,也不是过于拟人以至于有些怪异的仿生体,而是一款外观圆润、充满亲和力的四足机器人,定位是「智能伴随机器人」 。

 

「我们认为它在正式交付之后会是你的小跟班、小跟拍、小跟护。」 赵哲伦这样描述产品的核心体验:它可以跟随家庭的每一个成员出行,帮着拿包;利用AI能力,成为比家人更懂抓拍时机的摄影师;甚至可以在你无暇他顾时,照看老人和孩子 。

「大头」表演了一段跳舞|视频来源:极客公园

 

这听起来像是一个不错的家庭伙伴,但一个问题是:为什么是现在?为什么是四足形态?毕竟,在过去十多年里,至少有三代四足机器人问世,但它们似乎从未真正走出实验室,进入大众的视野 。

 

维他动力创始人余轶南(前地平线智能驾驶总裁,自 2015 年起主导地平线智能驾驶和智能座舱技术研发与落地)的看法是,「过去的产品为什么不work?核心就是几点:第一是价值交付,第二是成本,第三点是非常重要的,面向消费者的售后维护。」 他提到,过去的机器人成本高达几十万,且在安全性、可靠性上难以保证,本质上是技术发展还未到那个阶段 。

 

而今天,情况发生了质的改变。维他动力联合创始人赵哲伦(前理想汽车智能驾驶产品总监,负责理想 ONE 与 L 系列车型智能驾驶产品的定义与交付)将其归功于一个「盟友」——智能汽车产业。「整个智能驾驶,它确实是很好地开拓了整个机器人发展的前提。」

 

他解释道,智能汽车的快速发展,使得无论是算力芯片、控制器还是电机,其成本在中国被大幅优化,并且品质极高,这为当今的机器人制造提供了绝佳的基础 。

 

有了「造得起」的前提,下一个问题便是「如何设计」。

 

维他动力从一开始就希望跳出传统机器人设计的窠臼。赵哲伦分享了他们最初的产品定义思考:在一个矩阵的两轴上,一条是机器人与人的关系,从工业、冷峻到友善,再到可能过于「低幼化」的玩具感;另一条则是它的行动能力,从桌面级、室内轮式,到能够户外行走但无法上下台阶,再到真正的全地形能力 。

 

「我们最早的时候其实希望这个机器人尽可能小,但我发现要想基础地完成跟人一样走,人能到哪它能到哪,全地形能力,腿的长度至少得是现在这个长度。」

 

最终,他们将Vbot定义在「友善」与「全地形能力」的交点上:它要有足够强的运动能力,但外观上又不能带有攻击性,而是友善、可爱,同时又不失质感,不会让人觉得是个玩具 。

 

为此,团队引入了「迪特-拉姆斯式简约设计」,遵循「Less, but Better」的核心理念 。他们的首席工业设计师曾有十几年在美国设计商务舱内饰的经验,为Vbot带来审美上的质感 。赵哲伦总结了四个设计原则:

 

  1. 黄金比例:无论是大小腿的比例,还是身体与头部的对比,都经过精心计算 。
  2. 圆润倒角:整个机身几乎看不到锐角,创造了与人更和谐的关系 。
  3. 高级质感:样机的腿部甚至用到了与Apple Watch同款的材料,以提升整体品质感 。
  4. 锐利切割:在需要的地方采用锋利的切割线条,增加设计感,但触感依然保持圆润 。

「大头」在自己下楼梯|图片来源:维他动力

 

最终呈现的Vbot,在WRC现场的一众四足机器人中,确实显得有点不一样的「萌」。

 

拆解「大头」:一只四足机器人的大脑、算力与「心脏」

 

如果说设计哲学赋予了Vbot亲和的「皮囊」,那么其内在的技术架构则是它拥有「灵魂」的基石。维他动力从一开始就意识到,要打造一个真正自主的机器人,必须摒弃传统的路径。

 

这其中核心之一在于对「算力」的理解和应用。余轶南指出,今天的智能汽车,特别是高阶智驾,往往需要在车身布满多达12个摄像头来覆盖长焦和广角,以感知周围环境 。虽然总算力很高,但分配到每个摄像头上的算力其实非常有限 。

 

Vbot则走了一条更精简、更高效的路。「人其实通过两个眼睛、两个摄像头就能覆盖他基本移动的需求。」 余轶南解释道。

 

Vbot采用了拟人的可运动双目摄像头设计,就像人可以通过转动头部来扩大视野一样,这对摄像头可以灵活转动,使其水平视场角从固定的150度大幅提升至约230度,垂直视场角也从80度扩展到125度 。

 

这种设计的精妙之处在于,它不仅降低了对传感器数量的依赖和硬件成本,更带来了一个高效的结果:单位像素可用算力(TOPS/MPixel)远超主流智能汽车,约是其3到8倍 。

 

更高的「算力密度」意味着Vbot有能力在端侧运行更大规模、更复杂的AI模型,这是其实现高级智能的关键前提。

 

为了应对真实世界中复杂的异形障碍物和暗光环境,Vbot还额外配备了一个机器人专用的360°激光雷达,确保在全场景下都具备可靠的避障能力 。

 

强大的感知能力需要一个同样强大的「大脑」来处理。Vbot采用了双系统设计:

智能本体域负责感知—决策—规划—动作,运行于与地瓜机器人联合的S100P芯片(最高128TOPS)——这是机器人的「运动中枢」;

智能交互域负责显示、语音、光效与通信,运行与头部X5芯片,实现高效低功耗的人机交互——这是机器人的「社交中枢」。

 

这种高度集成的中央计算架构 带来了另一个优势:节省空间。赵哲伦说:「过去拆开一个四足机器人,肚子里要放好多块板子……今天由于我们高度集成,身体里有更大的空间可以来放电池包。」

 

这直接关系到机器人的「续航」这一核心痛点。传统同级别的四足机器人电池容量普遍在400Wh左右,续航仅一到两个小时。而Vbot凭借优化的内部结构,电量达到了600Wh以上,较行业上限提升了38% 。

 

不仅如此,维他动力还在与电池巨头亿纬锂能(EVE Energy)合作,联合开发更高密度的动力电池,有望将电量进一步提升,实现超过6小时的户外续航,完全满足单日出行的需求 。

 

然而,Vbot不仅要「看得见」、「动得久」,更要「听得懂」、「会思考」。为此,团队为它设计了一套全新的Agent架构 。

 

余轶南将它与我们熟悉的PC和手机交互做了对比:我们与电脑的交互距离很近,可以用键盘鼠标;与手机的交互距离更近,可以直接触控 。但与机器人的交互,距离往往在几米开外,掏出手机来控制,体验其实非常不便 。

 

Vbot的Agent架构,就是想想要抛开遥控器和预设的图形界面 。赵哲伦解释道,有无遥控器的核心区别在于,对环境的感知由谁来承担。「在有遥控器的情况下,是控制者来承担对环境的感知」。而没有遥控器,这件事就需要机器人本身去实现。

 

机器人的Agent架构|图片来源:维他动力

 

它的核心是视觉—语言—行动(V-L-A)模型 ,统一了「看懂—听懂—做对—解释清楚」的全链路 。用户输入指令后,Agent大脑会利用思维链(CoT)和反思(Reflection)等机制,像产品经理一样理解意图、拆解任务,然后调度各种工具来完成 。

 

这些工具不仅包括机器人自身的感知和技能,还包括可扩展的物理世界工具(如通过多功能背板连接机械臂或运动相机)和互联网服务 。

 

「它可以通过各种各样的连接工具实现机器人跟世界的互动。」余轶南举例说,Vbot可以拖着人玩滑板,也可以装上一个特制设备,在网球场里自动捡网球 。这种可扩展的「任务工具链」,为用户提供了丰富的应用生态 。

 

注入「生命力」:用艺术的思维来创造灵魂

 

「我们是要打造有生命力的机器人。」赵哲伦在发布会上强调,「工程科学的思维可以控制精度……但我们认为必须得用艺术的思维来创造灵魂。」

 

这句话点明了维他动力不一样的追求:让机器人拥有「生命感」。他们认为,过去很多机器人交互方式存在局限,要么被预设的图形界面限制,要么只依赖语音而容易产生误解 。

 

团队从「LOVOT之父」林要那本为《温暖的科技》的书中获得启发。书中提到,人与人之间的信息传递,55%依赖肢体语言,38%是语气,而纯粹的语言内容只占7% 。这让他们意识到,要让交互变得自然、温暖,就必须让机器人拥有丰富的表达能力。

 

「机器人应该怎么样来去表达自己的情绪?不管是开心也好还是害怕也好。」Vbot给出的答案是:全模态交互 。它不仅有屏幕上的表情,更有肢体、扬声器和指示灯的协同表达 。

 

为了让这些表达生动可信,维他动力做了一件在机器人行业相对少见的事——聘请动画师。赵哲伦介绍,他们将迪士尼动画的十二法则,如节奏感(Timing)、夸张(Exaggeration)和吸引力(Appeal),融入到机器人的动作设计中 。

 

例如,通过控制动作的速度变化(加速度),来表达惊讶或喜悦的情绪;通过夸张的躲避动作,来告诉用户它「害怕」前方的沟壑,无法通行;通过一些小动作展现其鲜明的个性,比如在思考时做出歪头的姿态 。这些设计让Vbot不再是一个执行命令的机器,而是一个能够传递情绪、有「性格」的伙伴。

 

除了情感表达,Vbot也拥有「长期记忆」。赵哲伦向极客公园谈到,他们的记忆系统分为三部分:空间、关系和信息。

  • 空间记忆:机器人需要记住家庭或办公室的环境布局,能听懂「去爸爸的房间」这样的指令。
  • 关系记忆:通过声纹和人脸识别,它能分清家庭成员,知道谁是谁。
  • 信息记忆:这是更深层次的交互记忆,让机器人能够理解并记住用户的偏好和习惯。

 

这种对「生命感」的追求,背后是一定的技术支撑和清晰的商业规划。维他动力成立仅半年,已先后完成种子轮和天使轮融资,累计融资规模达3亿元人民币,天使轮由达晨创投领投,联想创投、渶策资本等跟投 ,资金也将聚焦于首款智能伴随机器人的规模化量产 。

 

为此,他们组建了一个覆盖电池、电机、算法、数据基建等全栈软硬件的60多人研发团队 ,并与京东(新零售)、火山引擎(大模型算力)、地瓜机器人(端侧算力)、禾赛科技(传感器)和亿纬锂能(电池)等行业巨头达成了深度合作 。

 

一条清晰的路线图已经铺开:9月启动制造工厂,10月到12月开启早鸟内测,年底正式上市,并在明年1月的CES展会上开启海外众测 。他们也有一个更长久甚至宏大的目标:5年内,让机器人大规模进入家庭和办公场所;10到20年,成为全球前三的智能机器人公司 。

 

当被问及为何不做更「酷」的人形机器人时,赵哲伦向极客公园坦言,人形机器人的技术挑战依然巨大,且他们认为第一款家用产品「个子不能比孩子高」,以保证亲和力和安全性。

 

从智能汽车产业汲取养分,到用「算力密度」重塑硬件架构,再到以「生命感」定义交互体验,维他动力正在走一条此前未被走通的路。他们丢掉了遥控器,因为这迫使机器人必须真正地理解世界。

 

维他动力创始人|余轶南

 

余轶南说,「智能手机跟非智能手机最大的区别是没有物理按键,无人驾驶跟辅助驾驶最大的区别是没有方向盘。」 而Vbot正在做的,就是拿掉机器人的「遥控器」,推动其向一个更自主、更智能的方向发展。

 

「贴地飞行」:大疆 ROMO 扫地机器人首发体验

2025年8月8日 16:32
作者|张勇毅
编辑|靖宇
 

在扫拖机器人这个品类,许多用户都经历过一个尴尬的阶段:花钱请来一个「智能帮手」,最后却发现自己反过来要「伺候」它——清理缠绕的毛发、手洗肮脏的基站底盘、在它卡住时进行解救。这种体验,让「扫地爹」的戏称在小红书上广为流传

当听说以无人机闻名的大疆也入局扫地机器人时,我的第一反应是好奇,甚至是怀疑:一家精通三维空间感知的公司,真的能理解二维地面上的清洁痛点吗?

这一次,带着这个问题,极客公园对这台名为 DJI ROMO 的机器人进行了一段时间的深度体验。它试图给出的答案,并非简单的功能堆砌,而是一套围绕「用户少介入」为目标的系统性解决方案。

01

外观与结构:一次大胆的设计实验

 

市面上的扫地机器人基站,设计语言趋于统一,大多是白色、不透明的家电风格。ROMO 的基站则显得相当「另类」。它的上半部分由一整块半透明外壳包裹,内部的机械结构、水路和电路清晰可见。

大疆官方称其灵感来自初代 iMac,旨在「彰显技术自信」

 

这种设计的实用性体现在清晰的「内外分区」上。清水箱、污水箱、尘袋和清洁液仓这些需要用户接触的部分都布置在外部,易于取放。而被隐藏在透明外壳下的,是水泵、风机、降噪结构等核心部件。

 

这种「把复杂留给自己,把简单留给用户」的思路值得肯定,但半透明外壳的耐用性和长期使用后是否会因划痕影响美观,还有待时间检验。

 

机器人本体的设计延续了简洁风格,最明显的变化是取消了扫地机器人机身常见、顶部凸起的旋转式激光雷达(LDS),转而使用体积更小的固态激光雷达。这一选择的直接好处是降低了机身高度,使其能进入更低矮的家具底部。这在技术上并非首创,但体现了为实现特定设计目标而在传感器选型上的权衡。

 

另外一个我未曾设想过的好处是,在取消了激光雷达凸起之后,ROMO 扫地机器人获得了比同类产品更低的机身高度,在各种柜子,椅子底部的复杂环境下穿梭变得自如了许多,不会出现类似产品直到碰到雷达才会识别到避障的情况出现。

 

02

空间感知能力:无人机技术的「降维应用」

 

如果说外观是 ROMO 给人的第一印象,那么它的导航和避障能力则是检验其技术成色的核心。大疆将其在无人机领域积累的「空间智能」技术应用到了这台地面机器人上。其核心硬件是一对双目鱼眼视觉传感器,配合三颗广视角固态激光雷达协同工作

 

这套硬件组合提供了非常广的感知范围,官方数据称前视可达 170 度,环绕感知更是达到了 285 度。在实际测试中,最直观的感受是其路径规划的流畅性。当行至墙角或障碍物边缘准备转弯时,ROMO 很少出现其他机器人那种「停顿-后退-观察-再前进」的迟疑动作,因为它能「预见」转角后的环境,从而提前规划路线。

 

 

ROMO 在路线规划上要比传统扫地机更「圆滑」|图片来源:极客公园

为了检验其实际表现,我们设置了一个包含常见障碍物的场景:数据线、小颗粒积木、宠物玩具、拖鞋,以及行业难题——细长的桌椅腿和玻璃门。ROMO 的表现确实处于行业第一梯队,它能以毫米级精度绕开细小的数据线,而不是等到碰撞后才转向;面对一地积木,它会将其视为一个整体区域进行避让;在桌椅腿密集的区域,也能较为灵活地穿梭。这种表现背后,是其融合感知的技术原理在起作用。

 

它与传统依赖碰撞或单一传感器的机器人不同,双目视觉负责构建物体的三维轮廓和距离信息,而固态激光雷达作为主动光源,则能在暗光环境下进行精确测距,并有效识别玻璃、镜面等纯视觉方案难以处理的材质。最终,算法将两者数据融合,实现从「看到」到「理解」的决策。

在访谈中,大疆工程师提到一个细节:项目初期曾尝试过成本更高的工业级激光雷达,但发现它虽然能识别立起来的牙签,却对平躺在地的牙签无能为力。最终团队选择了视觉与固态激光雷达融合的方案,这是一个典型的为特定场景(家庭地面)选择最合适技术,而非盲目堆砌最昂贵技术的案例。

除了本身的硬件之外,DJI Home App 中针对 Romo 的界面设计也让人眼前一亮:在扫地机器人配套 App 中,你很难找到如此强调设计感的软件体验,虽然这并非是构成扫地机器人体验的「必选项」,但确实与它那令人侧目的硬件 ID 设计一样,构成了 ROMO 品牌调性的一部分。

 

比较有趣的是,大疆还在 App 中为 ROMO 设计了一个「遥控模式」,除了可以使用网络远程遥控扫地机器人,还能让扫地机器人充当一个可移动的摄像头,在家里随着扫地机器人的视角转来转去。

 

这个体验有点像是任天堂在 AR 马里奥赛车赛车游戏中才能做到的事,这个能力不仅能充当一个「赛博逗猫棒」,你甚至可以真正模拟一把「贴地飞行」,用遥控模式驾驶扫地机器人在家中穿梭,甚至用它来喊话。

 

大疆无人机视角在 ROMO 上的应用|图片来源:极客公园

03

清洁能力:结构创新能否解决顽固痛点?

 

对于扫地机器人这个体验已经非常「内卷」的市场,智能避障只是基础,最终还是要回归到「扫得干不干净,拖得彻不彻底」这个问题上。

在扫地这个基础环节,ROMO 的核心是其双旋臂设计的胶毛一体刷。我们在地面上混合了湿碎纸屑、宠物毛发进行测试,任务完成后翻转机身检查,仅有极少量长发轻微挂在刷体末端,没有出现严重缠死的情况。

虽然「0 缠绕」的宣传语看起来有些夸张,但在解决毛发缠绕这个普遍痛点上,它的效果确实优于市面上许多单滚刷设计的竞品

而在拖地性能上,ROMO 依靠的是它那两块达到 2.5 厘米厚的拖布,以及一个行业领先的 164ml 超大机载水箱。在测试风干的咖啡渍和酱油渍时,加厚的拖布配合持续的下压力,能实现不错的擦洗效果。

此外另一个不是那么引人注目的优势是,更大的机载水箱则确保了在清扫大户型时,拖布不会「前湿后干」,维持了清洁效果的一致性。不过值得一提的是,这种双旋转拖布方案在处理大量液体污渍时,与一些采用滚筒拖布并能实时自清洁的产品相比,清洁逻辑上存在差异,后者理论上能更完善地避免出现「以脏拖脏」的情况。

 

ROMO 配备了「飓风模式」|图片来源:极客公园

这个概念熟悉大疆无人机的用户看到肯定会会心一笑:这基本上就是把大疆无人机的「运动模式」概念完全搬到了扫地机上

作为已经长期使用扫地机的用户,ROMO 首款产品在清洁结构上真正让我有「痛点被解决」的创新,还是它解决边角清洁的方式。它所搭载的「柔性双机械臂」在我们的测试中表现出色。当机器人感知到墙角、桌腿等边缘时,底部的两个小型机械臂会根据实时地图独立地向外伸出,将边刷精准地推到墙角最深处,或完美贴合桌腿的弧形边缘。

这与市面上一些只能在 90 度墙角做一次固定伸出动作的单机械臂方案相比,适用场景更广,覆盖更彻底。大疆宣称的「全屋 100% 覆盖率」是一个理想化目标,但必须承认,在解决扫地机器人「最后一厘米」的清洁盲区问题上,这套方案确实是目前市面上最有效的解决方案之一。

04

基站与维护体验:正面回应「扫地爹」现象

 

许多高端扫地机虽然功能强大,但基站的维护却成了新的负担。ROMO 在设计上似乎下定决心要根除这些「二阶杂务」。

大疆研发团队曾透露,项目初期考虑过滚筒式拖布方案,但在测试中发现机载污水箱会变得极难清理和产生异味,且滚筒的毛发缠绕问题更严重。最终,团队做出了一个重要的取舍:放弃在少数极端场景下可能更强的滚筒方案,以换取日常使用中压倒性的免维护便利性。

这个理念在基站上体现得淋漓尽致。当机器人回仓后,基站通过高压水流冲洗拖布,再通过一个 16mm 的大口径吸污口将脏水和残渣吸走,这个口径远大于行业平均水平,旨在从根本上杜绝堵塞。然而,最具颠覆性的一点,在于它彻底取消了行业内普遍存在的可拆卸清洗盘和滤网

在许多主流高端机型上,这个清洗盘是污垢、毛发和水垢的重灾区,用户需要定期将其拆下,忍受着恶臭和黏腻费力地刷洗。ROMO 通过一体化的拖布盘和强大直接的排污管道,让污物无处藏身,直接被排入污水箱,彻底根除了整个系统中最令人不悦的维护环节。

这种对用户便利性的追求,也体现在集尘风道的设计上。ROMO 比许多竞品更短、更宽、更直,大大降低了因大块碎屑或宠物毛团堵塞导致集尘失败的概率。可以说,从清理滚刷的频率,到清洗基站的麻烦,ROMO 的一系列设计都显著减少了用户需要手动干预的环节和频率。

05

结论

 

大疆 ROMO 并非一款面面俱到的「水桶机」,而是一款特点鲜明、针对性极强的产品。它通过一系列取舍,展现了成熟的工程思维:

  • 舍弃旋转 LDS,换取更低的机身和更一体化的设计。

  • 舍弃滚筒拖布方案,换取用户长期的免维护体验。

  • 舍弃简单的单机械臂模仿,坚持自研更有效的双臂边角清洁系统。

这些选择清晰地指向了当前高端用户的核心痛点:避障不够智能、边角扫不到、基站维护繁琐。

从这个角度来讲,ROMO 充满象征属性的透明基站,更像是一个宣言:它展示的不仅是内部的精密结构,更是一种以解决用户真实痛点为优先、而非盲目堆砌参数的造物理念。它可能不是在所有单一测试项目中都得分最高的选手,但通过系统性的创新,它确实为终结「扫地爹」的尴尬体验,提供了目前市场上最有说服力的答案之一。

 

对于那些追求极致省心、愿意为优秀工程设计买单的用户来说,ROMO 是一个非常值得考虑的选项

大疆 ROMO 不是市面上第一款扫地机器人,但它极有可能是第一款真正让你忘记它存在的机器人。这,或许就是对「扫地爹」这个词,最彻底的告别。

「油车智障」的招牌,被奥迪一脚踢开

2025年8月8日 11:40

对于消费者来说,汽车行业一直有一个迷思——传统燃油车,到底能不能像新能源车一样,通过智能座舱和智能驾驶,在智能化上追赶上新能源对手。

现在,这个终于有了答案。

8 月 7 日,一汽奥迪在发布会上,一汽奥迪 Q6L e-tron 家族和一汽奥迪 A5L 正式上市。除了豪华新车,本场发布会上最重要的信息是,凭借和华为乾崑合作,一汽奥迪旗下的新能源电车和燃油车型,同时具备了华为乾崑高阶辅助驾驶能力,是真正意义上的:油电同智。

华为乾崑和一汽奥迪,到底用了什么方式,让传统燃油车,也具备了新能源车一样的智驾能力?

 

偷偷进化的引擎

在新能源时代,传统中高端品牌被国产新势力「排挤」的不轻,两年前那句「杂牌新能源」可以说是奥迪、宝马心中最痛的一根刺。更惨的是豪华品牌旗下的燃油车,由于座舱和智驾双双缺席,彻底落下了智能化这一关键转型期。

「不上清华,是因为不想上吗?」这句话来形容老牌车企的尴尬,倒也不为过。

相比于新能源,燃油车型在智能化上,由于电子电气架构、发动机、电池等问题限制,很难追上用电的「后生」们。

欧美的车企倒也不是没想过,只是转型相对慢「亿」些。不过好在他们已经加快了转型脚步,并且现在终于有了结果。

以一汽奥迪这次的 A5L 为例,为了真正有能力用上合作伙伴华为乾崑智驾技术,团队从底层架构上,进行了硬件平台的升级。

一汽奥迪+华为乾崑深度合作|图片来源:一汽奥迪

一汽奥迪 A5L 采用的 PPC 平台,和 Q6L e-tron 采用的 PPE 电动平台,以及 E³ 1.2 电子电气架构,就从底层架构层面,为「油电同智」提供了牢固的硬件基座,解决了燃油车发动机无法精准控制和 ECU 域控制统一等难题。

以 PPC 平台为例,在 E³ 1.2 电子电气架构下,让车辆可以更快、更精确地处理来自各种传感器的数据(如发动机转速、温度、油门深度、进气量、油压等等),并瞬间计算出最优的指令,对发动机的喷油、点火、气门正时等进行毫秒级的精细调控。

同时,E³ 1.2 将以往分散的控制单元(ECU)进行了高度整合和集中。这减少了信息传输的延迟和损耗,使得中央处理器可以更全面、更协同地控制包括发动机在内的整车各个系统。

华为智能汽车解决方案 BU CEO 靳玉志,曾经在社交平台上表示:「燃油车和电车最大的区别是动力方式,智能辅助驾驶对发动机的精准控制要求很高。奥迪在这方面有独有的技术,它将 PPC 燃油车和 PPE 电车在电子电气架构做到了统一,对燃油车发动机控制很精准。」

 

灵魂和小脑

仅有硬件基座,显然还不能让燃油车实现「油电同智」,就像有了合适的骨架,产品依然需要大脑和小脑,才能用上高阶智驾能力。

而帮助一汽奥迪实现「油电同智」的,是华为乾崑。靳玉志曾透露,其实从 2019 年开始,华为已经和奥迪公司合作,此次的一汽 A5L 和 Q6L e-tron 家族,就是双方在智能化上合作的成果之一。

华为乾崑在国内智驾领域跨代领先的能力毋庸置疑,不过,要真正「赋能」刚刚发布的豪华车型,为后者添加高阶智驾能力,仍需要新的解决方案。

其中一个重要的点,就是 VMM(Vehicle Motion Manager)车辆运动管理系统。如果说华为乾崑是高端智驾的「大脑」,主要负责思考,VMM 就是实现智驾的「小脑」,负责运动和控制。

通过与 VMM 系统的深度集成,华为乾崑指令发送到 VMM 动态驾控管理系统,由 VMM 调配车辆的驱动、制动、转向等系统,完成智驾需要的动作。

华为乾崑的「智能豪华」,搭配上一汽奥迪的「运动豪华」,实现了在智能化上的 1+1>2。

一汽奥迪使用了华为乾崑在硬件和软件层面的能力|图片来源:一汽奥迪

事实上,不仅软件,在硬件层面,华为乾崑为一汽奥迪定制了隐藏式的曲面双激光雷达,在保证精准感知的同时,保持了奥迪标志性的流线型外观。此外华为还开发了激光雷达恒温自清洁系统,让激光雷达可以无惧路面尘土和脏污,兼顾美学与实用性。

油车也能搭配高端智驾方案|图片来源:一汽奥迪

有了华为智驾能力的加持,一汽奥迪 A5L 和 Q6L e-tron 已经完全具备现在中高端新能源车配备的「高速、城区领航辅助」「泊车辅助」等智驾能力。驾驶者无论是高速上下匝道、市区内路口转向、红绿灯启停、或者在难度较高的车位泊车,都不用再担心。甚至华为乾崑的「代客泊车辅助功能」,同样来到了两款新车上。

通过技术协同和硬件创新,华为乾崑联合一汽奥迪,打破了「燃油车无法支持高级辅助驾驶」的技术壁垒,成为行业首个也是唯一一个打破燃油车技术壁垒的辅助驾驶厂商,真正意义上做到了「油电同智」。

 

能源形式不重要,智能是唯一共识

不过 10 年时间,国内汽车从新能源到智能化的转型迅猛无比,让国外对手哑口无言。

而中国消费者,早已被加剧内卷的中国新能源「细糠」宠坏了自己的胃口,难免会产生「歧视」传统油车的心理。

这次华为乾崑和一汽奥迪的合作,证明了偷偷进化的燃油车,只要有足够强的技术合作方,同样能甩掉「智障」的包袱。

现在说油车退出市场仍然有点早,但是,燃油车学习新能源,将智能化作为最重要的方向,无疑已经是行业明盘。而一汽奥迪选择与华为乾崑智进行深度合作,不仅验证了华为乾崑技术的领先性、多平台适配性,更确立了华为乾崑智驾在实现「油电同智」过程中的关键地位。

可以预见的是,无论是 BBA,还是新能源,在智能化时代,都需要一个「智能」的深度合作伙伴,一起奔向更智能的未来。

头图来源:一汽奥迪

GPT-5 来了,多项能力屠榜;OpenAI 给所有员工发 150 万美金奖金;特朗普喊话英特尔 CEO:必须立即辞职

2025年8月8日 08:35

OpenAI GPT-5 发布:模型能力全面「屠榜」,免费 ChatGPT 用户也能体验

8 月 8 日,OpenAI 夏季发布会召开,GPT-5 正式发布。该模型在文本、WebDev、视觉感知等多领域表现顶尖,硬提示、编码、数学等方面均排名第一,Arena 分数居首,实现「屠榜」。

GPT-5 系列含 GPT-5、mini、nano、chat 四个版本,幻觉问题显著改善,联网搜索事实错误率比 GPT-4o 低 45%,独立思考出错率比 OpenAI o3 低 80%,还新增犬儒、机器人等四种人格模式。

其编码能力突出,可快速生成网站和 3D 游戏,被认为开启「软件按需生成」时代。安全方面,经超五千小时测试,采用「安全补全」机制。

目前所有 ChatGPT 用户可免费体验,不同订阅用户权限不同,且已登陆微软全系平台。OpenAI 称其是迈向 AGI 及「超级智能」的重要一步。(来源:极客公园)

百度将发布新推理模型

8 月 7 日,有消息称,百度最快将在 8 月底推出文心大模型最新版推理模型,目前该模型正在全力测试中。

有内部人士向新浪科技 透露,新模型在百度世界大会上发布的概率极大。

据悉,文心新版推理模型将在逻辑推理、复杂计算等能力上超越 OpenAI o3 满血版。百度还计划未来数月内发布文心基座大模型最新版,有内部人士指出,新模型在百度世界大会上发布的概率极大。(来源:新浪科技)

 

OpenAI 为防 Meta 挖角给每名员工提供 1000 万奖金

Hyperbolic AI CEO 金雨辰(Yuchen Jin)今天在 X 平台称,他在 OpenAI 任职的朋友透露,OpenAI CEO 萨姆・奥尔特曼刚刚宣布在 2 年内为每名员工提供 150 万美元(现汇率约合 1077.9 万元人民币)奖金。

金雨辰还认为,这次 OpenAI 发奖金可以称为「扎克伯格挖角效应」。他还称「英伟达 78% 的员工都是百万富翁。但在 OpenAI,百万富翁的比例现在达到了百分之百」。后续金雨辰解释道:「这些奖金将在两年内发放,每位 OpenAI 员工(包括新员工)都有机会领取」。

财经媒体 Benzinga 对此表示,Meta CEO 扎克伯格的「黑手党」式挖角策略加剧了硅谷的 AI 人才竞争。目前 Meta 已经开出了每年高达 2000 万美元(现汇率约合 1.44 亿元人民币)的薪酬,以吸引 OpenAI、xAI 等公司的 AI 员工。

OpenAI CEO 萨姆・奥尔特曼此前曾表示对 Meta 的挑战表示欢迎,并打趣道:「放马过来」。

(来源:IT 之家)

 

蔚来高管称理想受难有人祸水东引

8 月 7 日,蔚来品牌与传播助理副总裁 @ 蔚来马麟 发文称:「非常反感不分青红皂白,往某一个汽车品牌车主群体身上泼脏水的行为。」

他指出,近期理想受到攻击,有人把祸水往蔚来身上引,如果理想用户朋友们信以为真,那就正中攻击者下怀了,请理想用户朋友们擦亮眼睛,避免被利用。他表示观察到近期的一些舆情,有直接攻击,有祸水东引,有借刀杀人,有转移视线。建议理想尽快报警。(来源:新浪科技)

微信:从一开始就没有「已读」功能,以后也不会有

8 月 7 日消息,「微信派」公众号发文重申,微信从一开始就没有「已读」功能,以后也不会有。

文章称,「微信已读功能」这个话题,年年有人问,年年上热搜,年年在辟谣,堪称热搜榜的「钉子户」和「打不死的南方小强」。有人寄望「已读」,比如追项目的 PM,等 crush 回复的恋爱脑。也有人抗拒「已读」,比如下班就想人间蒸发的打工人,防止爹妈疯狂催婚的「不孝」儿女。要不要「已读」更像是各种社交关系下的微妙映照,「在微信里,我们把「回应与否」的选择权交回到用户手中,祝愿我们都有在数字洪流中「装死」的自由。」

关于微信不做「已读」状态的思考,腾讯公关总监张军在一档播客节目中表示,微信的存在不是为了增加大家的社交压力,「我觉得这个可能是最开始大家考虑最多的东西」。(来源:IT 之家)

 

特朗普喊话英特尔 CEO 陈立武:必须立即辞职

8 月 7 日消息,美国总统特朗普在 Truth Social 社交媒体发文,喊话英特尔 CEO 陈立武立即辞职。

特朗普表示,英特尔首席执行官存在严重的利益冲突,必须立即辞职。这个问题没有其他解决办法。

受此消息影响,英特尔股价盘前一度大跌超 5%。

陈立武上任英特尔 CEO 不足半年。当地时间 7 月 24 日,在 2025 年二季报发布之际,陈立武通过全员内部信宣布,公司正实施大规模裁员,计划在年底前将员工总数从约 10.98 万人削减至 7.5 万人,目前员工数量减少约 15%。(来源:IT 之家)

 

盒马鲜生将再开 100 家新店,年内门店数将超 500 家

8 月 7 日,盒马公布了最新开店计划:盒马鲜生计划财年内开出近 100 家门店,新增超过 50 个覆盖城市,届时盒马鲜生门店数将超过 500 家。

盒马 CEO 严筱磊表示,看好中国内需消费市场的广阔前景。

过去一年,盒马转向聚焦盒马鲜生和社区折扣店两个主力业态,陆续退出 X 会员店等探索型项目。8 月底最后一家盒马 X 会员店将关闭。

阿里巴巴集团 2025 财年年报显示,盒马 2024 年 4 月-2025 年 3 月的 2025 财年 GMV(商品交易总额)超 750 亿元,首次实现全年盈利,盒马鲜生业态运营超过 420 家门店。(来源:第一财经)

 

何小鹏谈辅助驾驶:视觉上限远超激光雷达,2027 年该争议将消失

8 月 6 日,全新小鹏 P7 迎来中国首秀并开启预售,当晚,小鹏汽车董事长何小鹏接受了凤凰网科技等媒体的采访。何小鹏就如何平衡创新速度与安全责任这一关键问题进行了阐述。何小鹏强调,安全涉及多方面,是一个从源头到市场终端的闭环管理过程。

他指出,新势力车企正着力解决传统厂商以「硬件质量为主」的模式,转变为涵盖「软件质量 + 硬件质量 + 全球质量」的综合体系。其中,「全球质量」尤为重要,需应对不同国家的地域性差异,包括法律法规带来的挑战。

关于激光雷达与纯视觉路线之争,何小鹏态度鲜明:「从智能辅助驾驶到无人驾驶,我们都是全视觉方案。」他认为视觉上限远超激光雷达:「将来视觉能识别路上可能扎胎的钉子、被挪动的沙井盖,激光雷达很难做到。」他预测到 2027 年该争议将消失。(来源: IT 之家)

曝 iPhone17 系列 9 月 10 日预购

据德国网站 iPhone Ticker 报道,多家德国无线运营商的内部消息显示,苹果将于 2025 年 9 月 9 日(周二)举行 iPhone 17 系列发布会。这一日期与此前多方预测的 9 月第二周时间窗口相符。

报道指出,苹果一贯在劳动节后的第二周举办秋季新品发布会,并且通常选在周二。考虑到苹果过去避免在 9 月 11 日及周五举办活动,9 月 9 日被认为是最合理的选择。

据称,iPhone 17 系列将于 9 月 10 日开启预订,并于 9 月 20 日正式开售,同日开始零售店发售。(来源:快科技)

 

零跑旗舰 D 系列新车谍照曝光,2026 年一季度量产

8 月 7 日消息,零跑汽车 COO 在社交媒体上发布了一张零跑旗舰 D 系列两款新车谍照。从谍照来看,两款新车正在进行夏测,从谍照来看一款为 SUV 另一款为 MPV 车型。

据 IT 之家此前报道,去年 12 月,零跑汽车创始人、董事长、CEO 朱江明在接受采访时透露,零跑未来三年会有 A、B、C、D 四个系列,用十三四款车布满 6 万- 30 万元市场。

在今年 6 月的 2025 高通汽车技术与合作峰会上,零跑汽车创始人、董事长朱江明披露,零跑定位旗舰的 D 系列车型将于明年第一季度量产,届时发布的零跑下一代中央域控制器将首发搭载高通骁龙双 8797 芯片。

零跑科技高级副总裁曹力透露,零跑 D 系列 SUV 新车是零跑首款冲击 30 万价位的旗舰产品,定位全尺寸 SUV,将搭载零跑乃至整个行业最领先的技术,不会是外界所说的「半价理想」。目前,新车已进入夏测阶段。(来源:IT 之家)

全球首家具身智能机器人 4S 店、北京首家机器人主题餐厅 8 月 8 日开业

8 月 7 日消息,据北京日报今日消息,全球首家具身智能机器人 4S 店——Robot Mall 将于 8 月 8 日正式营业。

与汽车的 4S 店相似,这家机器人 4S 店同样集机器人「销售(Sale)、零配件供应(Sparepart)、售后服务(Service)、信息反馈(Survey)」等功能于一体。但不同的是,这座位于北京市机器人产业园(亦庄)的 4S 店,聚焦产品从研发测试到市场应用的全周期服务需求,为全球机器人产业生态建设提供「北京方案」。

目前,4S 店依托机器人大世界现有空间展开,共设四层,面积 4000 平方米,集合了全国 40 多家厂商的 50 多款机器人产品,涵盖北京人形机器人创新中心「天工」、优必选 Walker S、宇树 G1 等人形机器人产品。

此外,位于北京市机器人产业园(亦庄)的机器人主题餐厅「机器人焰究所」将在本周五(8 月 8 日)世界机器人大会开幕日正式营业。这座餐厅里有 20 多款机器人为顾客服务,就餐时还能欣赏机器人乐队的表演。

8 月 8 日开业后,市民可以通过「大众点评」「美团」App 搜索「机器人焰究所」提前预约。(来源:IT 之家)

OpenAI GPT-5 发布:模型能力全面「屠榜」,构建「超级智能」的第一步

2025年8月8日 02:50

经历过无数次「跳票」之后,GPT-5 终于来了。

北京时间 8 月 8 日凌晨一点,颇有新一代「科技春晚」架势的 OpenAI 夏季发布会拉开帷幕。

与此前 OpenAI 速通式的发布会明显不同,这次 OpenAI 准备了时长超过一个小时的发布会直播几波人马轮番上阵,你方唱罢我登场,从各种角度展示 GPT-5 的强悍性能。

 

先说重点:GPT-5 在多个领域的表现都迎来了全面提升,在文本、WebDev 和视觉感知能力领域排名第一;在硬提示、编码、数学、创造力、长查询等方面排名第一 GPT-5,在代号为「峰会」的测试下,目前保持着截至目前最高的 Arena 分数,可以说是字面意义上的「屠榜」了。

 

Sam Altman 表示,GPT-4o 就像中学生,而 GPT-5 就像大学生,甚至形容 GPT-5 是第一部配备视网膜显示屏的 iPhone——「你问它一个问题,也许能得到正确答案,也许会得到一些疯狂的东西。GPT-4 则感觉像在和一名大学生对话。而 GPT-5,是第一次让我真正感觉像在与一位博士级别的专家交谈。」Sam Altman 这样介绍 GPT-5 的能力提升。

尽管 ChatGPT 的周活跃用户已接近 7 亿,但 OpenAI 过去一段时间实际上并未拥有行业领先的前沿模型。现在,OpenAI 相信 GPT-5 将使其稳稳地重回排行榜榜首。

Altman 甚至直接在发布会中断言:「这是世界上编码能力最强的模型,是世界上写作能力最强的模型,也是世界上在医疗保健领域最强的模型

同时 OpenAI 也在发布会上宣称,除了代码能力爆表,GPT-5 的写作功底和回答健康相关问题的准确性也更上一层楼。同时 GPT-5 不仅在智能上实现了「巨大飞跃」,还大幅减少了「一本正经胡说八道」的幻觉问题。它在理解和遵循指令方面表现更出色,拍马屁的倾向也大大降低了。

01

 

告别「幻觉」,AI 更可靠了

 

首先是本次更新的模型阵容,GPT-5 系列一共有 GPT-5, mini, nano, chat 四个版本,其中 Chat 版本对应的是实现更自然、更智能的响应的体验——你甚至可以用它来学习一门新的语言。

 

另外,现在当你打开 ChatGPT 网页之后,首先会注意到 GPT-5 被呈现为一个单一模型,而不是一个常规模型外加一个独立的推理模型。

这背后其实是 OpenAI 开发的一个路由系统(router),它会自动为更复杂的查询切换到推理能力更强的版本,或者在你告诉它努力思考时也会这样做。(Altman 称之前的模型选择界面是「一个非常混乱的烂摊子」。)

「AI 幻觉」一直是大家吐槽的重灾区。好消息是,GPT-5 在这方面下了大功夫,官方宣称其产生幻觉的可能性「显著降低」。具体来说:

  • 在联网搜索时,GPT-5 的回答出现事实错误的概率比 GPT-4o 低了 45%

 

  • 在独立思考时,其回答出错的概率更是比 OpenAI o3 低了 80%

 

GPT-5 也在新的 ARC-AGI-2 上进行了测试。除 Grok 4(思考)外,它的表现优于所有主要模型。

 

此外,GPT-5 还成了一个「老实人」。它不太会再对用户撒谎,吹嘘自己能完成办不到的任务。当遇到不可能完成、指令不明确或缺少关键工具的任务时,它会更诚实地沟通自己的局限。

这次更新最有趣的一点,莫过于引入了四种全新的「人格」模式,用户可以自由选择。它们分别是:

  • 犬儒 (Cynic)

  • 机器人 (Robot)

  • 倾听者 (Listener)

  • 学霸 (Nerd)

这些模式是可选的,你可以根据自己的喜好,设定 ChatGPT 与你互动和回答问题的方式。想让它跟你抬杠,还是像个耐心的朋友一样倾听?现在都可以由你说了算。

「这个模型给人的『感觉』真的很好,」ChatGPT 的负责人 Nick Turley 说,「我认为人们会真切地感受到这一点,特别是那些平时不怎么研究模型的普通用户。」

此外,你还可以为单个聊天窗口更改颜色主题,代码编辑器主题爱好者狂喜了。

 

 

 

02

「软件按需生成」时代来临?代码能力逆天

随着代码能力的进一步提升,Altman 预测,GPT-5 强大的编码能力将开启一个他称之为「软件按需生成」的时代。

在 OpenAI 的测试中,GPT-5 在 SWE-Bench, SWE-Lancer, 和 Aider Polyglot 等多个编码基准测试中的表现均优于任何其他模型。在人类最终测试中取得 42% 的成绩,在 SWE 基准测试中取得 75% 的成绩。

 

一个小插曲是,发布会上的这张图的坐标轴明显有不少槽点,不仅有 52.8 > 69.1 这样的弱智错误,也实际上夸大了 GPT-5 的能力提升,在社交媒体上被网友群嘲「你这 PPT 怕最好别是 GPT-5 做的」。

在发布会上,OpenAI 的后期训练负责人 Yann Dubois 使用 GPT-5 现场演示,要求它生成一个用于学习法语、并带有互动游戏的网站。在短短几秒钟内,GPT-5 就编写了数百行代码,并直接展示了网站的前端界面。 他在 Zoom 上分享屏幕并进行了简单的点击操作,一切看起来都完美运行。

 

发布会现场,OpenAI 还直接展示了一款仅靠一段提示词就由 GPT-5 创作的 3D 游戏。其创作的 3D 场景不仅画面精致,其中的物理效果也非常准确的还原出了对应的效果。

 

03

更安全,更「诚实」

据模型安全研究负责人 Alex Beutel 介绍,为了解其安全风险,OpenAI 对 GPT-5 进行了「超过五千小时」的测试。其中一个重点是「确保模型不会对用户撒谎」。

虽然 GPT-5 的幻觉(hallucination)比 OpenAI 的 o3 推理模型要少,但「自信地撒谎」仍然是大型语言模型固有的问题。当模型开始像智能体(agent)一样完成任务时,这个问题会变得更加复杂。不过 OpenAI 表示,GPT-5 在更可靠地处理多步骤任务方面表现更好。「过去,我们看到过模型声称完成了某项任务,但实际上并没有完成的情况,」Beutel 说,「这是个问题。」

对于以前会直接拒绝回答的提示,GPT-5 将提供 OpenAI 所谓的「安全补全」机制(safe completions)。Beutel 解释说:「比如有人问『点燃某种特定材料需要多少能量?』,这可能是一个试图绕过安全防护造成伤害的恶意问题,也可能是一个想了解材料物理特性的学生。这给模型如何回应带来了真正的挑战。」

 

通过「安全补全」,GPT-5「试图在保持安全的约束下,给出尽可能有帮助的答案」。模型通常只会部分遵从,并提供一些无法被实际用于造成伤害的、更宏观层面的信息。

04

如何用上 GPT-5

那么,大家最关心的问题来了:怎么才能用上 GPT-5 呢?

好消息是,所有 ChatGPT 用户都可以现在立即免费体验到 GPT-5。这也是 OpenAI 第一次面向所有用户免费开放前沿模型。当然,不同级别的用户权限不同:

  • Plus 订阅用户在达到使用上限前,可以有更多的使用次数。

  • Pro 订阅用户则可以访问具备更强推理能力的 GPT-5 Pro 版本。

当用户达到使用上限后,ChatGPT 会自动切换到一个「迷你版」的 GPT-5 来处理后续的请求。同时,随着 GPT-5 的上线,它将正式取代 GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 和 GPT-4.5 等一系列旧模型。

此外 Token 定价部分,标准版 GPT-5 为每百万输入 Token 1.25 美元,每百万输出 Token 10 美元。mini 版 与 Nano 版定价都便宜不少。

 

详细定价可参考下图截取自官网的信息。

 

此外,OpenAI 还在 API 中发布了一个名为「Minimal」的新参数,这样你就可以在所有用例中使用 GPT-5,只需改变推理的力度。

 

除了 OpenAI 的第一方平台,微软 CEO 纳德拉同时也宣布,GPT-5 已在微软全系平台上线,包括 Microsoft 365 Copilot、Copilot、GitHub Copilot 和 Azure AI Foundry。同时所有这些改进均在 Azure 上进行训练。

 

最后,Altman 表示,OpenAI 的使命是开发通用人工智能(AGI)。GPT-5 使他们更接近这一目标,尽管整个行业已经开始转向构建所谓的「超级智能」。

「我有点讨厌 AGI 这个词,因为现在每个人对它的定义都略有不同,」Altman 说,「但这是朝着真正强大的模型迈出的重要一步。这显然是需要一个具备通用智能的模型才能做到。

然而,他也承认相比起真正的 AGI, GPT-5 仍然「缺少一些非常重要的东西」。

这不是一个模型,它是从它所发现的新事物中所生长出来的原生事物,对我来说,这正是它为什么能成为 AGI 「种子」的原因」Sam Altman 这样介绍道。

❌
❌