阅读视图

发现新文章，点击刷新页面。

OSMO Pocket 4P，是大疆自己打响的「云台相机下半场」第一枪

极客公园

2026年5月9日 09:00

「手持云台相机」品类里，大疆独行时代的最后一年。

作者｜张勇毅

编辑｜靖宇

2025 年的某段时间，打开抖音、小红书、B 站，很多人都会有一种隐约的视觉重复——一台黑色的、屏幕能旋转的小相机，反复出现。

当时这台「小相机」，无论是国内的视频创作者，还是海外的 YouTuber，几乎人手一台。旅行 Vlog、家庭记录、街头美食、宠物日常，那个机身造型成了一种共同的视觉符号。Pocket 这个名字第一次穿透了科技圈的边界，渗透到普通人对「拍视频」这件事的本能想象里。这是大疆此前任何一款产品都没有达到过的渗透度。

2025 年，大疆 OSMO Pocket 3 销量突破 1000 万台。

在那之前，大疆的相机产品线最高单品销量是几十万级——Pocket 3 把这个数字一次性推到了千万级。Pocket 单品的市场规模，已经超过整个微单相机市场的总和。

但当我第一次拿到 Pocket 4P 的时候，意识到了一件事：Pocket 3 定义的那个时代，某种意义上已经是「过去时」了。

大疆 OSMO Pocket 4P｜图片来源：极客公园

Pocket 3 的「辉煌时代」

「Pocket 3 的买家里，近半数是女性。」

这是大疆 Pocket 4 产品经理与作者分享的一个观察。

这家以无人机和专业影像设备起家、被外界长期定义为「硬核工程师公司」的企业，第一次拥有了一个由女性主导的消费产品。

Pocket 4P 与 Pocket 4 同根同源｜图片来源：极客公园

即使放眼整个行业，在早期看懂 Pocket 3 是如何迅速渗透行业的人也寥寥无几。

2025 年，《花儿与少年》综艺组的一段录制花絮在网上流传------画面里，一位明星嘉宾对着 Pocket 3 那颗会转的小脑袋挥手，以为它能像智能宠物一样回应。这个动作后来被大疆的产品团队记下来，启发了 Pocket 系列上的手势控制功能。同一年，Pocket 系列与北京国际电影节合作，出现在一些以前只有专业电影机才会出现的官方画面里。

大疆此前绝大多数的产品形象是「工程师做给极客的极致工具」。但从 Pocket 3 出现之后，大疆第一次有了一款「文化产品」------它在内容创作者社区里形成了集体记忆，在头部综艺里形成了视觉符号，在普通消费者心里形成了「想买相机就买这个」的心智锚点。

千万级销量、近半女性买家、超过整个微单市场总和、综艺合作、电影节背书、电商榜首------这些事实拼在一起，构成了一个清晰的判断：Pocket 3 是大疆「Vlog 大众化」叙事的最终形态。

但所有「最完整」都意味着同一件事：往那个方向继续加码，能拿到的东西未必不会更多。

「以前我们的设备更注重解决自拍好看的问题，那现在用户对第三人称视角下的拍摄也要好看。」大疆产品经理在先享会上谈到 Pocket 系列演进时说到。

这是一句听起来很平淡的话。但放回 Pocket 这条产品线的演进史里看，它意味着大疆给自己设了下一道题------大众化的「自拍」方向已经被推到了极限，下一步的故事必须从别的方向写起。

一个时代走到「最完整」的形态时，它也就走到了自己的边界。

门口的脚步声

更何况，大疆此刻并不是在一个无人的高地上做选择。

不仅有虎视眈眈的手机大厂：OPPO 和 vivo 都已经在多个非官方场合确认，类似形态的产品已在开发中，且都将在今年下半年陆续推出。这些产品都定位高端，且都主打双摄方案；还有诸如影石这样的行业新秀跃跃欲试。

这意味着 Pocket 这个由大疆原创、独占多年的品类，将在 2026 年下半年第一次迎来真正意义上的群狼之战------而这群狼不是任何二线公司，是手机行业里规模、渠道、品牌、供应链都已经准备多年的巨头。

手机厂商的入场时机，背后有两件事的同时成立。一件是手机影像这条赛道已经走到了内卷的边缘。从 2020 年到 2025 年，主流手机品牌每年发布会几乎都在比拼相同的几件事：传感器尺寸、长焦倍率、计算摄影算法、影像合作品牌。但消费者已经看不出代际差异------一台 2024 年的旗舰和一台 2026 年的旗舰，在拍照体验上的实际差距已经被普通用户的感知钝化。手机厂商急需新的影像故事。

另一件是 Pocket 3 用销量证明了「独立的便携影像设备」在 4G/5G 时代依然有大众市场。

大疆 OSMO Pocket 4P｜图片来源：极客公园

在 Pocket 3 之前，没有人确定这件事------智能手机已经把卡片相机市场扫光，运动相机做成了小众品类，独立影像设备看起来是一个正在收缩的赛道。

Pocket 3 把这个判断翻了过来。它告诉所有手机厂商：消费者已经接受「手机之外还需要一个专门拍视频的设备」这件事------而这个认知，在五年前是不存在的。

而它们集体选择「双摄方案」，背后也有清晰的产品逻辑。双摄是手机厂商在影像工程上最有把握的能力------它们已经在手机上做了多年，从光学防抖到双摄融合算法，整套体系是现成的。

把这套能力迁移到云台相机上，是一次低风险的工程平移，同时也是相对于 Pocket 4 单摄方案的天然差异化抓手。

「定位高端」更是手机厂商打这场仗最务实的策略：不和大疆在中端拼成本------那是大疆深耕多年、供应链和工艺成熟度都领先的市场------直接往上打「溢价加品牌」的牌。

Pocket 3 已经证明这个品类的用户愿意为「超越手机的影像体验」付出溢价，那么把价格再往上推、用更强的硬件、更强的品牌联想、更强的渠道，就有空间。

但大疆自己也听到了行业的风声：当被问到「如何应对友商马上推出的某款手持云台相机新品」。大疆 Pocket 4 产品经理说：「我们内部心态非常开放，期待更多高水平选手...... 我们的新品往往是这个行业的风向标。」

「我们作为云台相机领域的原创者、引导者，不是想打造某款爆品，是想把 Pocket 推向一个真正的品类。」

这两段回答放在一起，画出的是一家仍然警觉的巨头。

一家公司只有听到了脚步声，才会反复强调「不对标」和「开放心态」。

这是 Pocket 4P 被放置在产业之下的真实语境------大疆已经知道，自己不再独行了。

Pocket 4P，是大疆给出的回答

—都是大疆对那阵脚步声的回答。每一个关键设计——双摄回归、中焦、命名留白、拒绝计算摄影、生态扩展——都是大疆对那阵脚步声的回答。

Pocket 4P 配备双摄方案，专门为「更进阶、更专业的创作者」设计。它和 Pocket 4 不是迭代关系——产品经理在多个场合反复强调，4 和 4P 是「并肩协同的伙伴」，单摄面向便携，双摄面向创作。这是 Pocket 自 2018 年诞生以来，第一次在同代里做产品分层。

但「分层」只是表面解读。Pocket 4P 的双摄，本质上是一次时间窗口的卡位。

如果行业内的其他玩家，都在今年下半年才推出双摄云台相机，而大疆在它们之前先把双摄交付到市场——大疆将获得近一个季度的市场独占期。

这一个季度，是大疆把「双摄云台等于大疆」这个心智锚点钉在用户脑子里的关键时间窗。

等手机厂商入场时，他们要面对的不再是一个空白市场，而是一个被大疆预先定义过的赛道。

而双摄之外，更耐人寻味的是超广角镜头之外的三倍中焦选型。

时间回到 2016 年，距初代 OSMO 发布一年后，大疆推出过一台叫 OSMO+ 的手持云台相机。

大疆 OSMO+｜图片来源：大疆官网

它在 OSMO 基础上加了光学变焦，让这台手持云台相机第一次拥有了中长焦能力。

也就是说，长焦在云台相机上的集成一体化，十年前就实现过。

大疆 OSMO Pocket 4P｜图片来源：极客公园

这件事后来从大疆的产品线上消失了。OSMO+ 之后，整整一代 Pocket——从 1 到 4——没有一台再装过中长焦。

直到 Pocket 4P 回归。

而 Pocket 也并不是大疆在专业影像上唯一的延续。同样起步于 2015 年的还有大疆如影（Ronin）系列——这条服务于专业影像创作者的产品线至今已有十年有余，其云台稳定技术曾获得奥斯卡科学技术奖，长期出现在专业电影机和高端剧组的工作流里。Pocket 和如影的云台稳定能力同根同源，色彩科学、对进阶用户和专业创作需求的洞察也都在持续积累。

过去十年间，大疆在云台小型化、力矩控制、光学工程上的工程经验持续积累——这些经验在 Pocket 4P 上完成了一次小型化的合流。

更关键的是，这种「自我对话」的产品逻辑是手机厂商无论如何模仿不来的。

他们没有 OSMO 那段历史，没有十年的工程肌肉记忆，没有把云台相机做了十年的那种「知道哪里会出错、哪里需要让步」的直觉。他们只能从零开始做双摄云台。而大疆是带着十年的经验回来的。

这是 Pocket 4P 给手机厂商设下的第一道护城河——不是技术层面的，是时间层面的。

第二道护城河，是大疆在产品哲学上的一次主动选择。

当被问到「为什么不像手机那样用算法实现人像虚化」时，产品经理的回答非常明确：「手机的长焦镜头和我们是两个级别的镜头。我们这个真的是纯凭借光学素质实现了光学虚化。」他还补了一句：「视频如果背景虚化太过分，会丢失环境的氛围感。」

大疆 OSMO Pocket 4P｜图片来源：极客公园

在所有手机厂商都在用 AI 锐化、多帧合成、神经网络降噪堆砌画质的当下，大疆选择老老实实把镜头做大、把光圈做开、把虚化交给物理光学。

这是两条不同形态的产品。大疆是在把 Pocket 往相机的方向上做，所以才能看到它在物理光学上的种种努力；而手机厂商的双摄云台相机，如果沿用手机里那套熟悉的影像调教，最后呈现出的成片，很可能仍然带着「手机味」。

这条选择的代价是显而易见的——更大的镜头模组、更复杂的工程实现、更高的物料成本、对体积空间的进一步挤压。但它换来的是手机厂商即使做了双摄云台也跨不过去的一道关——因为手机厂商的整个产品逻辑就是计算摄影驱动的，他们没办法在 Pocket 这种小型化设备上突然抛弃自己最强的能力。

大疆把战场移到了对手最不擅长的地方。

第三道护城河，是生态。从补光灯、续航手柄、保护配件，到 DJI Mic 全系产品的直连，再到机身可更换的镜头保护玻璃——Pocket 不是一台孤立的相机，是一个能持续生长的影像系统。这件事手机厂商即使想做也很难做：生态需要时间和用户基数沉淀，而他们的双摄云台相机才刚刚上市。

大疆对于未来更多不确定性的预期，某种程度上也反映在了「P」这个字母本身。

当问及大疆产品经理：「为什么这一代叫 4P，而不是 4 Pro？」对方答：「P 不是严格意义上的 Pro。它只是用来区分单摄和双摄两个版本。未来 Pocket 的 Pro 款到底是什么样子，可能我们自己也还有更大的想象——所以这一代先用 P，留个白。」

这句话在没有产业语境时听起来像公关辞令。但放在 OPPO、vivo 即将下场的背景下，它有了具体的战略意义——大疆不愿意把自己的 Pro 定型，因为定型意味着失去对手到来后的反应空间。「P」是一种主动选择的弹性。

最后一件事，是中国消费市场的一个细节观察。

这里有一类用户从不看评测、从不研究参数，但他们买东西时有一个稳定的习惯——直接买顶配。iPhone Pro Max 销量结构里有大量小手女生用户。

虽然 Pocket 4P 在产品设计上是为「进阶专业创作者」准备的，但它实际上承接了消费升级人群里那部分天然往顶配走的用户。这群人不会受手机厂商品牌影响，因为他们买的不是「手机厂商的影像设备」，是「DJI 的最贵那一款」。

把所有产品决策连起来看——双摄抢时间、中焦回归、拒绝计算摄影、生态壁垒、命名留白、安全网用户群——大疆的回答不是「做一台更好的 Pocket」，是做一台手机厂商即使付出十倍代价也复制不出来的东西。

这是一家品类原创者在面对挑战者来袭时最难的一步：主动放弃自己赢得最透彻的那部分市场，把战场移到只有自己能站住的高地。

Pocket 3 那个时代是大疆独行的时代。Pocket 4P 之后，那个时代就翻页了。

但接下来的故事会怎么写——是大疆继续定义这个品类的边界，还是手机厂商用更大的资源、更深的渠道把战场推往大疆没去过的方向。

大疆 OSMO Pocket 4P｜图片来源：极客公园

这是 Pocket 3 千万级销量没有回答的问题，现在轮到 Pocket 4P 来回答了。

*头图来源：极客公园

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

你会选择代表旗舰体验的双摄手持云台相机吗？

Anthropic 估值逼近 1 万亿美元；OpenAI 推出 Codex Chrome 扩展；消息称腾讯实习生大涨薪，百度「全员晋升」｜极客早知道

极客公园

2026年5月9日 07:59

OpenAI 推出 Codex Chrome 扩展，直接在浏览器里帮你干活

5 月 8 日，OpenAI 宣布上线「Codex for Chrome」扩展，为桌面版 Chrome 浏览器引入对 Codex 的直接支持，适用于 macOS 和 Windows 平台。安装该扩展后，Codex 可以在不接管用户浏览器操作的前提下，利用浏览器环境测试 Web 应用、在多标签页之间获取上下文信息、调用开发者工具（DevTools）等，从而更贴近真实使用场景完成各类任务。

OpenAI 表示，在此前为桌面版 Codex 应用引入「Computer Use（电脑操作）」功能后，团队观察到用户最常见的工作流几乎都发生在浏览器中。此次 Chrome 扩展正是针对这一趋势进行优化，希望让 Codex 在处理各类基于浏览器的工作时更快速、更高效，尤其是那些传统插件或 API 难以覆盖的复杂场景。

用户可以直接通过 Codex 应用中的「Plugins（插件）」菜单安装这款 Chrome 扩展，完成后即可在浏览器中调用 Codex 协助完成各类任务。（来源：cnBeta）

OpenAI 推出 GPT-5.5-Cyber 预览版，面向安全团队限量开放

5 月 8 日，OpenAI 宣布向经审核的安全团队限量开放 GPT-5.5-Cyber 预览版，这是其最新模型 GPT-5.5 的网络安全专用版本。公司强调，该版本并非旨在增强网络攻防能力，而是通过定向训练放宽模型在处理安全任务时的内置限制，使授权团队能更高效执行漏洞识别、补丁验证及恶意软件分析等工作流，而通用版因安全防护机制会增加此类任务难度。

此举紧随竞争对手 Anthropic 一个月前发布 Claude Mythos 预览版的步伐，后者作为「玻璃翼」（Project Glasswing）网络安全计划的一部分，同样仅向特定企业开放访问。两款专用模型的相继推出，折射出大模型厂商正从通用能力竞争转向垂直场景的精准适配。（来源：aibase）

Anthropic 正考虑进行融资，估值接近 1 万亿美元

5 月 8 日，据报道，Anthropic 正考虑在今年夏天筹集数百亿美元，用于大规模扩充计算能力。此举可能使其估值升至近 1 万亿美元，从而超越竞争对手 OpenAI。Anthropic 新一轮融资预计投前估值约为 9000 亿美元，融资规模最高可达 500 亿美元。Anthropic 近期一直在处理来自 Dragoneer 投资集团、General Catalyst 和光速创投（Lightspeed Venture Partners）等投资方的投资意向。（来源：新浪科技）

苹果 CarPlay 接入马斯克的 Grok 模型，在车内和 AI 自然聊天

5 月 8 日，科技媒体 9to5Mac 发布博文，报道称继 ChatGPT 和 Perplexity 之后，苹果 CarPlay 还接入了马斯克旗下的 Grok AI 模型。

在 iOS 26.4 系统更新中，苹果积极扩展 CarPlay 生态，支持语音对话类应用，让 AI 聊天机器人可以更自然地进入车内场景，用户直接通过 iPhone 连接车辆，就能在中控屏调用相关服务。

在接入 ChatGPT、Perplexity 之后，xAI（更名为 SpaceXAI）通过更新 iPhone 版 Grok 应用，邀请 iPhone 用户在 CarPlay 中接入 Grok 模型。对经常开车通勤的用户来说，这相当于把手机里的语音助手扩展到了车机界面。

在使用方式上，Grok 与另外两款产品接近。用户可以直接查看最近对话列表，也可以新开一轮会话。为了减少驾驶中反复操作，整个交互逻辑依然围绕语音展开。（来源：IT 之家）

消息称腾讯实习生大涨薪，百度「全员晋升」

5 月 8 日，据「大厂日爆」消息，鹅厂（此处应该是指腾讯）研发实习生今年将迎来大涨薪，RD 月薪为 11000+2000 房补，比去年 7500 的 base 提升了近 50%，本调整今年尚未官宣，但和内部同学了解到，今年涨薪已经定调。这也是继字节、阿里后今年又一家给实习生涨薪的大厂。

报道还称，百度新职级调整 5 月正式落地，新老职级对应关系开奖，原来的 P4 变 7 级，原来的 P5 变 8 级、P6 变 9 级，以此类推一对一进行映射。所有人数字等级原地 +3。

此外，报道称百度五一节前在外包盘点，部分北京研发的外包，可选去西安或去成都，或者直接退场。

百度 4 月 28 日发布全员信，通知职级体系大调整。中管层以下的专业通道与管理通道全面打通，原有职级字母标签统一为 5 级至 12 级的数字职级体系，于 5 月 1 日正式生效。第一财经报道提到，百度称此举是为了打破机制性壁垒，让员工的成长不再受通道和标签的限制，为公司储备更多能打硬仗的复合型领军人才。（来源：IT 之家）

OPPO 就母亲节宣传文案争议道歉：已第一时间下架全部相关物料

5 月 8 日，OPPO 官微发文，就本次母亲节宣传文案引起的争议致歉。OPPO 官微表示：

关于本次母亲节宣传文案引起的争议，我们诚恳表示歉意。

我们的创作初衷，是希望打破刻板印象，呈现更多元、更立体的当代母亲形象：母亲可以热爱马拉松，可以沉浸文字创作，也可以拥有自己的追星爱好。
我们已第一时间下架全部相关物料。我们将认真倾听各方批评，全面审查内容审核机制，确保此类问题不再发生。

昨日早些时候，「OPPO 文案价值观」话题一度登上微博热搜。OPPO 此次母亲节宣传文案中，出现「我妈有两个『老公』，一个是我爸，另一个一年见两回；跟我爸约会基本不打扮，见另一个，她『恨不得穿婚纱』」的文案，并搭配「追星」为主题的图片。（来源：IT 之家）

去哪儿承诺：绝不因用户消费习惯、支付能力等信息设置不合理价格差异

5 月 8 日，「去哪儿官宣」公众号发文称，公司坚决拥护并积极响应监管要求，将专项治理视为提升平台服务质量、构建清朗网络空间的重要契机，确保算法应用合法、合规、公平、透明。

目前，去哪儿已对照专项治理清单要求，深度开展算法模型的自查整改工作。

去哪儿宣布作出「郑重承诺」如下：

规则公开化：App 内以图文结合的通俗方式公示算法机理，在产品预订页、价格说明页等核心位置，增加价格差异客观成因的场景化提示，让用户清晰知晓各类规则与价格差异原因。针对机票变价等易引发误解的场景，持续加强信息披露与客服解释培训，消除「黑箱」误解。
权益同等化：优惠券发放、券包申领、积分抵扣等优惠促销场景中，在同等交易条件下，实现优惠权益统一发放，绝不因用户消费习惯、支付能力等信息设置不合理的价格差异。
选择自主化：在登录环节明确告知个性化推荐权限，提供便捷的授权开关入口，充分保障用户自主选择权。
记录可查化：确保算法迭代记录全流程留痕且留存时间不低于 3 年，客服可快速调取订单客观证据向用户清晰释疑；在平台端新增合规问题反馈入口，实现用户反馈快速响应、妥善处理，确保消费者对算法调度及决策逻辑清晰可感。（来源：IT 之家）

英伟达 CEO 黄仁勋：下一代 AI 基础设施将需要大量的光学连接，铜线已无法满足需求

5 月 8 日，英伟达首席执行官黄仁勋在接受采访时，大力赞扬其与康宁公司的新合作项目，称其为美国重建技术供应链带来重要机遇。

黄仁勋表示，下一代人工智能基础设施将需要大量的光学连接，因为计算需求正在迅速增长，以至于铜线已经无法满足需求。「我们将以一种前所未有的规模来扩大光学技术的应用，坦率地说，没有哪家光学公司曾有过这样的规模。」黄仁勋说道。

黄仁勋还表示，当前这波人工智能投资所带来的益处远不止惠及科技公司。他指出，AI 产业对电工、建筑工人、芯片制造员工以及数据中心基础设施专家的需求不断上升，这就是该建设进程已经波及整个经济领域的有力证明。（来源：广角观察）

欧盟禁止 AI 生成「深度伪造」的色情内容

5 月 8 日，欧洲议会议员和欧盟成员国就修订《人工智能法案》达成共识，同意禁止 AI 生成「深度伪造」的色情内容。据了解，这一禁令将被纳入 2024 年通过的《人工智能法案》修订条款，意味着欧盟将在法律层面对相关 AI 滥用行为划出明确红线。

欧洲议会议员迈克尔·麦克纳马拉表示，这是欧盟首次通过立法明确禁止「脱衣换脸」类应用程序。

他强调：「欧盟今天划定了『红线』。人工智能绝不能用于羞辱、剥削或危害他人。」

今年 1 月，马斯克旗下社交媒体平台 X 的 AI 聊天机器人 Grok，就曾被部分用户滥用于生成色情内容，并被推上舆论风口浪尖。根据人工智能取证组织报告，2025 年 12 月 25 日至 2026 年 1 月 1 日，在 Grok 以深度伪造方式生成的 2 万张图像中，55% 的人物图像穿着暴露，其中 81% 是女性，另有 2% 的图像中人物年龄不足 18 岁。（来源：快科技）

Switch2 首年狂卖 1986 万台，9 月 1 日起将涨价

5 月 8 日，任天堂在公布的 2026 财年财报中宣布，Nintendo Switch2 在全球上市后的第一个完整财年，累计销量已达到 1986 万台，展现出强劲的市场开局。同时，任天堂正式确认，将从 2026 年 9 月 1 日起，上调 Switch 2 主机在美国、欧洲、加拿大、中国香港和日本市场的售价。同时，部分地区 Switch 旧款机型及 Nintendo Switch Online 订阅服务也将同步提价。

任天堂表示，Switch2 在上市后首个完整财年的实际销量已超越当年初代 Switch 的同期表现。若将原版 Switch 家族计算在内，任天堂在整个财年共售出 2366 万台硬件。

受新硬件发售及强劲软件销售的推动，任天堂专用游戏平台业务收入达到 2.23 万亿日元。公司整体合并净销售额同比增长近一倍，达到 2.31 万亿日元，营业利润同比增长 27.5%，达到 3601 亿日元。

在软件方面，Switch2 平台游戏在 2026 财年共售出 4871 万份。其中：

《马力奥赛车：世界》：885 万份

《咚奇刚：蕉力全开》：数百万份

《宝可梦传说 Z-A》Switch2 版：数百万份

展望 2027 财年，任天堂预测 Switch2 硬件销量将达到 1650 万台，而软件销量预计将提升至 6000 万份，显示出对新平台持续增长潜力的信心。（来源：cnBeta）

印度首个太空科技独角兽诞生：Skyroot 拿下 6000 万美元融资，火箭将入轨发射

5 月 8 日，据外媒 TechCrunch 报道，印度航天科技初创公司 Skyroot Aerospace 完成 6000 万美元（现汇率约合 4.09 亿元人民币）新融资，成为印度首家航天科技独角兽。接下来几周，公司将尝试用 Vikram-1 火箭完成首次入轨发射。

这轮融资给予该公司 11 亿美元（现汇率约合 74.98 亿元人民币）投前估值。融资完成之际，Skyroot 正准备执行印度私营企业首次入轨发射。

Vikram-1 火箭已在 4 月启程前往印度南部斯里赫里戈达岛航天发射场。完成飞行合格测试后，公司已经开始总装和发射准备，目标是在 6 月发射。

Skyroot 由印度空间研究组织（ISRO）前工程师帕万 · 库马尔 · 钱达纳和纳加 · 巴拉特 · 达卡于 2018 年创立。公司主攻小型卫星发射火箭，产品定位大致对标美国火箭实验室、萤火虫航天等企业。Vikram-1 设计运力最高 350 公斤，可将载荷送入近地轨道。（来源：IT 之家）

Anthropic 推出 Claude for Microsoft 365，实现跨应用无缝协作

5 月 8 日，Anthropic 宣布 Claude for Microsoft 365 正式面向所有付费用户开放。此次更新将 Claude 深度集成至 Excel、PowerPoint 和 Word 中，通过侧边栏对话实现跨应用上下文共享，彻底改变了传统的文档处理工作流。

在 Excel 中，Claude 能够读取多标签工作簿，利用真实公式构建模型并追踪单元格变更，且不会破坏原有公式。在 PowerPoint 中，它能严格遵循企业模板的布局、字体及配色，生成可编辑的原生图表。在 Word 中，所有修改均以修订模式呈现，Claude 还能针对评论线程进行回复，解释修改原因。

这一更新标志着 AI 办公助手从单一功能向全流程协同的跨越。用户现可在保持原有工作习惯的同时，通过统一的对话窗口高效完成数据处理、演示文稿制作及合同审查等复杂任务。（来源：品玩）

阿里千问 AI 眼镜 S1 升级：主动服务与全球首个 3D 显示功能

5 月 8 日，阿里巴巴旗下的千问 AI 眼镜 S1 进行了一次更新，增加了主动服务功能。该眼镜不再需要用户先发出指令，而是能够根据天气、时间以及用户的日程安排，主动提供提醒和服务。例如，用户准备出门时，眼镜可以提示「今天有雨，请带伞」。

此次更新还加入了打车、闪购和行程规划等生活服务功能，这些功能将于本月内陆续上线。用户可通过眼镜直接使用这些服务，无需频繁拿出手机。例如需要打车时，通过眼镜上的简单操作即可完成叫车。

此外，千问 AI 眼镜 S1 实现了空间 3D 显示功能。它采用双光机和双目立体成像技术，使信息显示呈现出纵深感和层次感，区别于传统的二维信息展示方式。无论是通知、导航还是其他内容显示，用户都能看到更具空间感的视觉效果。（来源：aibase）

微信未读语音由红变灰被用户疯狂吐槽，腾讯回应

5 月 8 日，近期不少 iOS 用户更新微信后发现，未读语音消息的提示色由醒目的红色变为灰色，该改动引发了大量用户吐槽与热议。

灰色未读语音与已读消息视觉高度相近，用户稍不留意就会忽略未读内容，不少人反馈因此错过工作通知、亲友重要信息，长期形成的红色提醒习惯被打破，使用体验明显下降。

腾讯客服对此回应称：未读语音变灰是 iOS 端「未读模式」功能的灰度测试，属于阶段性设计，并非最终版本，目前正逐步向 iOS 用户开放，未收到灰度权限的用户暂不会出现该变化。
安卓端相关功能仍在开发中，暂时不受影响。（来源：快科技）

消除「AI 学习门槛」，这个 Agent 想让普通人「无脑上手」

极客公园

2026年5月8日 17:38

有一个行业，产品还没用上，教程先卖疯了。

这个行业叫 AI。

过去两年，Prompt 工程课、Agent 搭建训练营、MCP 工具链配置指南，养活了无数知识博主。你在 B 站搜「Prompt」，跳出来几万条视频，从入门到精通，从职场提效到搞副业，恨不得手把手教你怎么学 AI。

这事儿正常吗？

你买个微波炉，用不用先报个培训班学三天？你打开一个 App，需不需要先啃完一本使用手册？现代消费电子产品的黄金法则是开箱即用，怎么到了 AI 这儿，就变成先交学费再上岗了？

把 AI 给用好，换个角度看，现在就如上面这些不太合理的例子。当一项技术需要用户付出额外的学习成本才能解锁核心价值时，说明技术还没有完成它的最后一公里。

最近一款叫胖鹅 AI 的产品，在这件事上给出了一个不太一样的解法。它的思路简单到有点粗暴：你不需要学怎么用 AI，AI 就能把自己用好。

一句话，能不能出片？能不能出 PPT？能不能出报告？

我们实测了一波。

01

一句话，一支完整短视频

先从一个足够「懒」的需求开始。

我们假装自己是一个完全不懂视频制作的奶茶店老板，对着胖鹅 AI 说了输入了这样一句话：

「给我做一个 20 秒的视频，推广我们店新出的暴打柠檬茶，要看起来很清爽很夏天的那种感觉，配点轻快的背景音乐。」

没有分镜描述，没有运镜要求，没有颜色指定，没有时长标注，甚至连清爽夏天算个什么视觉风格都定义得模棱两可。这就是一个普通小商家最真实的表达水平。

等了大概两分钟，出来一支近 20 秒的完整视频：几片柠檬被冰块包裹着砸入杯中，茶汤缓缓注入，杯壁凝结出水珠，最后定格在产品 Logo 和一句「暴打夏天」的 slogan 上。画面干净，节奏轻快，配乐是一段夏日感的电子音。虽然不是什么电影级大片，但直接发到抖音或者朋友圈，完全够用。

我们再拿另一个主流 AI 来生成同样的任务，但效果可以说是天差地别的：

这中间发生了什么？用户没说特写镜头、慢动作、产品特写这些术语，但系统把这些都补上了。因为它识别到这是一个餐饮新品推广短视频的典型场景，而针对这个场景，系统里已经有一个训练好的 SOP，它知道这类视频需要产品特写、制作过程展现、氛围感营造，按这个模板去执行就行了。

用户省掉的那些专业描述，不是被 AI 猜出来的，是被 SOP 兜住的。

02

还是一句话，一份竞品研究报告

我们又试了一个更实用的场景：

「帮我做一份比亚迪和特斯拉 2025 年在中国市场的对比分析报告，要有销量对比、车型矩阵分析、用户画像差异，输出成 PDF。」

这个任务的复杂之处在于：它需要跨源搜集数据（销量、车型、用户评价），按标准框架组织分析逻辑，最后渲染成一个格式规范的文档。

过去用通用 AI 做类似的事，流程一般是你先写一段 Prompt 定义分析维度和输出格式，AI 给你一段文字，你再把文字粘贴到 Word 里调格式做排版。如果过程中某一部分不满意，还要再追一句 Prompt 来修正。

胖鹅 AI 的处理路径不同。它识别到这是一个「竞品对比分析报告」的垂直任务，匹配对应的 SOP——这个 SOP 预设了标准结构：封面、摘要、销量对比（含图表）、车型矩阵（含表格）、用户画像对比（含词云）、结论与展望。

它自动去抓取了公开的销量数据和车型信息，生成了对比图表，从社交媒体和论坛中提炼了用户评价的高频词，最后组装成一个格式整齐的 PDF。我们拿到的成品大约 15 页，逻辑通顺，图表清晰，引用标注了数据来源。

当然，有些数据的时效性需要人工复核，但作为一份初稿，它已经省掉了从对着空白文档发呆到搭出完整骨架之间至少三个小时的工作量。

更有意思的一个实测，是丢给胖鹅 AI 一张公司 Logo，让它帮忙生成一个宣传视频：

为我的 logo，生成酷炫的宣传片，动态效果要很多。

可以看到，胖鹅 AI 完全理解了 Logo 的寓意，并且从文字、效果、运镜和转场等，都达到了可以直接商用的程度。

03

AI 有两种，一种要你教，一种替你干

跑完几轮实测，一个感受越来越清晰：市面上的 AI 产品，正在分化为两条截然不同的路线。

一条是以 ChatGPT、Claude、Manus 为代表的通用 Agent 路线。它们的能力边界极宽，理论上什么都能干。但代价是，你需要花大量的时间和精力去调教它们，告诉 AI 你希望它用什么格式输出，用什么逻辑分析，按什么风格表达。本质上，你是在用自然语言做软件工程。

另一条就是胖鹅 AI 走的垂直 SOP 路线。它追求的是把高频的、可标准化的任务提前封装成预训练流程。用户在交互时，面对的而是一个已经知道怎么干的职业化系统。

本质上，你是在培训一个 AI 。

两者的区别，可以借用胖鹅 AI 团队自己的一个比喻来理解：

Manus 这一类，像一个名校毕业的实习生。聪明是真聪明，但结果更像是用通用的方式做非常具体的事情。

胖鹅 AI，像一个配好的外包团队。系统已经根据你的行业和场景，把最合适的技工匹配好了。你不用告诉它怎么做，只需要说做什么。有时候甚至不用你说，当你选择「短视频推广」这个模式时，系统直接弹出结构化界面，选时长、选风格、选配乐风格。点一下，比说一句话更快。

这是两种完全不同的产品哲学：一个是放大高手的能力，一个是拉平普通人的起跑线。

AI 的下半场，是谁更能让所有人用好。

胖鹅 AI 目前给出的答案是：把复杂留给工程，把简单还给用户。

AI 不该是一种需要专门学习的技能。就像你不需要学电路原理才能用手机，不需要学热力学才能用冰箱。技术真正的成熟，是它把自己藏起来，让用户感觉不到它的存在。

从这个意义上说，最好的 AI，就是人不用去学，AI 自己能把自己给用好。

*头图来源：胖鹅 AI

550 亿美元！马斯克的「芯片工厂」开始成为现实

极客公园

2026年5月8日 15:46

作者｜桦林舞王

编辑｜靖宇

1980 年代，日本半导体产业如日中天，一度占据全球芯片市场超过 50% 的份额。

美国人坐不住了——不是因为买不到芯片，而是因为他们意识到，一个国家如果无法掌控自己的「硅」，就等于把战略命脉交给了别人。于是有了《半导体协议》，有了后来的 Intel 复兴，有了今天的《芯片法案》。

四十年后，同样的焦虑以一种更私人的方式，出现在了伊隆·马斯克身上。

只不过这一次，想要掌控「硅」的，不是一个国家，而是一个人——以及他旗下的一簇公司。

5 月 6 日，Bloomberg 披露了一份文件： SpaceX 正式提议在得克萨斯州 Grimes County 投资 550 亿美元，启动「Terafab」的芯片制造设施建设计划。如果后续阶段全部推进，总资本支出可能冲上 1190 亿美元。

先把数字换算一下，感受一下规模。

550 亿美元，大约是台积电 2023 年全年营收的两倍多。1190 亿美元，则接近英伟达整个 2024 财年的营收巅峰。这不是一笔「投资」，这是一场豪赌——或者说，一次战略宣言。

这个项目是 SpaceX 和特斯拉的联合计划。马斯克的逻辑很清晰：他的公司群——SpaceX、Tesla、xAI——每年要消耗天量的 GPU 算力。训练 Grok 需要芯片，Starlink 的地面站网络需要芯片，特斯拉的自动驾驶需要芯片，未来的人形机器人 Optimus 也需要芯片。

与其每年给英伟达送钱，不如把钱送给自己。

从战略逻辑上说，这无懈可击。

01

马斯克的垂直整合野心

要理解 Terafab，你得先理解马斯克过去两年在干什么。

2025 年，xAI 收购了社交媒体平台 X。今年年初，SpaceX 又以全股票方式吞下了 xAI。与此同时，SpaceX 的 IPO 计划正在推进，路演窗口据称将在 6 月 8 日前后开启，S-1 注册文件预计本月下旬提交。

这是一张越来越密的网：火箭、卫星宽带、AI 模型、社交平台、电动车、人形机器人……而现在，芯片制造也要纳入版图。

DataCenter Knowledge 的分析一针见血：Terafab 最好不要被理解成一座「工厂」，而应该被理解成一套「完整堆栈的 AI 基础设施战略」 ——试图把计算生产、能源采购和算力部署统一在同一个屋檐下。

这就像亚马逊不只想卖书，还想自建货运网络、自建数据中心、自建物流卫星——只不过马斯克要在此基础上再加一条：自建「生产计算的工厂」。

Apple 当年把 A 系列芯片自研，被认为是科技史上最成功的垂直整合决策之一。但 Apple 只是「设计」芯片，制造还是交给台积电。马斯克想做的，是连制造也一起拿走。

这个野心，连 Apple 都没敢碰。

02

「15 年战略」的背后

不过，战略愿景和工程现实之间，永远隔着一条深沟。

Creative Strategies 的芯片分析师 Ben Bajarin 用了一个有意思的表述，他说马斯克在做的是一项「15 年战略」 ——这句话听起来像夸奖，但背后的意思是：别指望短期看到回报。

摩根士丹利的预测更直接。他们评估，即便在最乐观的建设假设下， Terafab 的初始芯片产出最早也要到 2028 年中期。从今天算，还有两年多。而那时候，AI 芯片的技术代际会走到哪里，没有人知道。

半导体制造的残酷在于，它是世界上最不宽容「PPT 承诺」的行业。

一座先进制程晶圆厂的建设，通常需要 3-5 年，需要极其精密的光刻机（全球只有 ASML 能造高端 EUV）、需要数以千计的高度专业化工程师、需要稳定的超纯水和电力供应、需要一整套精密的洁净室管理体系。Intel 花了数百亿美元、数年时间，在制程技术上依然追赶台积电艰难。

Finance Monthly 的分析直接点出了这个风险：芯片项目容易被低估执行难度，缓慢、昂贵，容易延迟，依赖专业机械、熟练劳动力和已经高度紧张的供应链。

有意思的是，Intel CEO 陈立武在被问及 Terafab 时，给出了一个措辞微妙的回应，他表示「兴奋地探索创新方式来重构硅工艺技术」。这句话可以被解读为合作信号，也可以被解读为对市场供需紧张的侧面确认——甚至两者都是。

03

不只是生意

但如果只把 Terafab 看成一门生意的投资回报计算，可能从一开始就错了分析框架。

这件事真正有意思的地方，在于它折射出整个 AI 行业对「算力自主」越来越深的执念。

过去三年，AI 军备竞赛的本质，已经从「谁的模型更聪明」演变成「谁能拿到更多算力」。英伟达的 H100、H200、GB200 一货难求，台积电的先进制程产能被提前锁定多年。微软、谷歌、亚马逊、Meta 在自研 AI 芯片上的投入已经以百亿美元计。

马斯克的逻辑，和这些大厂其实是同一套：在 AI 时代，算力就是生产资料，谁控制了芯片，谁就控制了 AI 。

而 Terafab 的出现，叠加在 SpaceX 即将到来的 IPO 之上，又多了一层更复杂的含义。一位科技媒体编辑在评论中写道，这个公告的设计，有一部分是为了「将处于压力下的特斯拉，与即将上市的 SpaceX 和 AI 超级计算叙事绑在一起」。

这个判断未必完全公允，但也并非空穴来风。就在几个月前，马斯克亲口承认「xAI 建设得不对」，不得不由 SpaceX 出手整合。在这个背景下，Terafab 的高调亮相，既是战略布局，也是资本叙事——两件事并不矛盾。

马斯克从来不只做一件事。

现在，Starship Flight 12 的发射窗口在 5 月 12 日到 18 日之间，Dragon 货运飞船也将在同一天飞往国际空间站。SpaceX 的火箭业务依旧在轰轰烈烈地运转。

而在德克萨斯州 Grimes County，一块可能改写 AI 时代芯片供应链格局的土地，还只是一份文件上的坐标。

1190 亿美元，能不能变成一座真正运转的晶圆厂，没有人能保证。但有一件事已经确定——当一家以造火箭闻名的公司决定造芯片，这个行业的边界，又一次被重新定义了。

*头图来源： SpaceX

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

扫地机祖师爷再创业：造了一只懂你的「人造赛博宠物」

极客公园

2026年5月8日 15:42

作者｜ Moonshot

编辑｜靖宇

当下的科技圈，具身智能的叙事出奇地一致。

波士顿动力的 Atlas 正在展示跑酷，特斯拉的 Optimus 试图精准捏起一颗鸡蛋，Figure 01 已经进驻宝马工厂开始搬运箱子。仿佛所有人都在比拼，谁能成为第一个「史塔克工业」（《钢铁侠》中的公司）。

就在这股人形劳工狂热中，一家名为 Familiar Machines 的初创公司出现了。虽是初创，其创始人 Colin Angle 却堪称家庭机器人的祖师爷。

Colin Angle 与 iRobot Roomba｜图源：AI Magzine

1990 年，Colin Angle 就与几位 MIT 校友共同创立了 iRobot 。团队早期主要为军方和太空探索制造探测设备，直到 2002 年推出 Roomba 扫地机器人，才彻底推开了消费级机器人的大门。

过去三十年间，他带领 iRobot 把 5000 万台扫地机器人送进了全球家庭。可以说，他是这个星球上最懂如何让机器人在人类客厅里「干活」的人。

带着这套班底，Colin Angle 完全可以顺应具身智能的风口，推出一款更全面的家庭服务机器人。

但他这次拿出的产品名为 Familiar，一款毛绒玩具般的机器宠物。它不会扫地，不会洗碗，甚至无法帮你倒一杯水。

Familiar 彻底放弃了在物理世界的实用功能。

那么，这只连地都不会扫的机器宠物，除了不会掉毛，买来能做什么？

01

无用萌物？

要看懂 Familiar，你得先抛弃对「家用机器人」的固有印象。

按官网的说法，Familiar 是一个「情绪伴侣」。它四足，身披能感知触觉的皮毛，看着就像一只毛茸茸的中型犬。它既不去死磕「长得像真狗」，也彻底扔掉了机器狗那层冰冷的铝壳。

到具体能力上，它真的就是「纯宠物」级，干不了家务活，只能提供情绪价值。

图源：FM&M

Familiar 杀手锏功能是实时「读空气」，可以看懂你的表情、听懂语气，甚至观察肢体语言，然后给出类似真实生物的直觉反应。

比如，当你觉得压力大时，它会凑过来用鼻子蹭你；当你开心微笑时，它会歪着头看你。要是你下班后瘫在沙发上「刷屏」停不下来，它甚至会走过来，用爪子轻轻推你一下，提醒你别掉进时间黑洞。

乍一看，这不过是个连地都不会扫的赛博玩具。但实际上，要让一台机器在真实的家庭环境里学会「看脸色」、给出毫不违和的直觉反应，反而是如今硬件工程里最难啃的骨头。

为了不让这些互动显得过于生硬呆滞，Colin Angle 凑齐了一个「神仙班底」。他吸纳了波士顿动力的技术骨干，搞定多达数十个自由度的灵活步态；再拉来前迪士尼幻想工程的专家，专门给这只机器狗调校微表情和肢体「演技」；还请到了好莱坞资深的原型师 Richard Landon，此人曾亲手打造过《侏罗纪公园》和《终结者》里的物理特效生物。

随着日常交互数据的积累，Familiar 甚至会在本地生成专属记忆，慢慢长出属于自己的脾气。

比如，要是你平时习惯一回家就跟它互动，它以后听到开门声就会主动把下巴凑过来求摸；要是它发现你每天晚上十点习惯安静看书，它也会学着收起闹腾，老老实实地趴在你的脚边陪着。

Familiar 可以感知人的触摸｜图源：WSJ

所以 Familiar 在尝试做一件科技硬件极难做到的事——给人提供纯粹的情绪价值。

为了撑起这种情绪价值，Familiar 在硬件上弃用了极客们偏爱的金属或塑料机身，披上了一层具有触觉感知的毛绒外衣。

给机器宠物穿「皮肤」，向来是硬件工程里吃力不讨好的大坑。

当年索尼开发 AIBO 机器狗时，内部也曾激烈争论过要不要上仿生皮毛，最后还是妥协了。原因很现实。一个每天在家里满地溜达的电子产品，裹上皮毛就意味着极易沾灰、很难清洗，脱落的纤维甚至会卡死内部的机械关节。为了保证产品的可靠性，让用户少操心，索尼最终选了硬塑料。

这是一种非常理性的「家电思维」，而非「宠物思维」，因为家电坏了，消费者会生气，会找厂家售后，但宠物病了，主人并不会责怪宠物，只会心疼。

AIBO 机器狗，「触缩力」拉满了｜图源：维基百科

过去，机器人的硬件和大脑存在脱节。就算披上皮毛，里面依然是个按代码触发动作的死板玩具，强行做成毛绒材质确实没有必要。但大语言模型的成熟，改变了这个逻辑。

当多模态感知让机器系统能真正听懂你叹气里的疲惫，看懂你皱眉时的焦虑，它的「大脑」其实已经跑到了前面，就像人类乐忠于讨论，不同品种的狗智商约等于人类几岁一样。

人类眼中的宠物，或许不通语言，不会算数，但有情感，能互动，能认得主人，也能听懂自己的名字和简单的指令。

图源：TechRadar

这个时候，如果硬件还套着一个冷冰冰的塑料壳，人机交互就会产生不协调感。既然机器已经聪明到能捕捉人类细微的情绪，它就需要一副同样柔软、有温度的躯体，去接住这些情感。

尽管内置了强大的 AI 模型，Familiar 却被刻意设定为「不会说人话」，只会发出类似动物的细微哼唧声。

这是 Familiar 团队基于安全考量的克制。Colin 坦言，当下的 AI 仍存在幻觉，一旦机器在陪伴时说出不合时宜甚至冷酷的话，好不容易建立起来的情感信任就会瞬间崩塌。

比起一个会聊天的聪明机器，一个只会用动作和声音回应的「赛博宠物」反而更能提供纯粹、安全的情绪价值。

而 Familiar 的诞生，并非老企业家的心血来潮，这是一场跨越三十余年的漫长实验。

02

三十年的执念，在 AI 时代得以实现

1990 年，当 Colin Angle 创办公司时，最初的名字叫「Artificial Creatures（人造生物）」。他的终极梦想，一直都是创造出能与人类产生情感连接的机器。

但在九十年代初，传感器昂贵且笨重，算力匮乏，算法更是处于蛮荒时代。造「人造生物」在当时等同于科幻小说。为了让公司活下去，团队不得不转向实用主义，利用机器人技术去排雷、去探索太空，最终在 2002 年推出了彻底改变行业的 Roomba 扫地机器人。

Roomba 扫地机器人｜图源：The Seattle Times

Roomba 是第一款取得巨大商业成功并成功实现量产、普及的家用扫地机。它也顺势把整个行业拉进了一种路径依赖，大家开始默认家庭机器人理应默默干活。

直到现在，行业中很多人都认为，传统家电设计的最高境界其实是「不存在」。一台完美的扫地机器人，最好在你出门后悄悄把地扫完，再自己溜回充电座。你感受不到它，它也绝不打扰你。

这种追求极致效率的「隐形」逻辑，在扫地机时代非常奏效。但在大模型时代，Colin 认为这条路走到了尽头。

在最近那期名为《The iRobot Story, Regulation, and the Next Era of Physical AI》的深度访谈里，Colin Angle 重新审视了这条走了三十年的产品路线，并提到了「隐形机器人」这个概念。

Colin 觉得，隐形意味着缺乏存在感。缺乏存在感，就意味着无法产生高频交互。没有交互，人类与机器之间就永远无法建立真正的粘性和信任。就像你不会对你家的吸尘器倾注感情。

Colin Angle 在访谈里表达了自己对具身智能的理解｜图源：YouTube

从 Roomba 跨越到 Familiar，这是一场 Colin Angle 长达三十年的技术迂回。

生成式 AI 让机器首次具备了理解复杂语境的能力。这让 Colin 意识到，他终于等到了实现 1990 年那个「人造生物」梦想的基础设施。

如今算力和模型双双就位，Familiar 被设计出来的初衷，就是要足够显眼，足够主动，真切地介入人的日常起居。

既然机器要找回存在感，这种存在感应该长什么样？

03

非「人形狂热」

眼下硅谷的狂热几乎全倾注在人形机器人身上。行业内有一种顺理成章的推导，认为人类的起居环境是为人类设计的，机器理应长得像人。

Colin Angle 在访谈中直接给这种狂热泼了冷水。他认为行业漏算了一个致命变量：

人类的心理防御机制。

客厅和卧室是极度私密的个人空间，往家里塞进一台一米八高、金属制造的机器人，哪怕它叠衣服的手法再精妙，你也很难忽视这么个「类人」在家里晃悠。

Familiar 刻意避开人形选择动物形态，就是想用最快的速度卸下人的防备，让人本能地愿意靠近。

卸下防备只是第一步。Familiar 团队给未来的智能机器设定了一项新指标，要求它们必须学会读懂空气。

Familiar 主打一个陪伴｜图源：FM&M

现有的语音助手只能听懂明确的指令，喊一句开灯它才执行。可真实的人类生活很少依赖精准口令。

下班回家后的一声叹息，看手机时紧锁的眉头，看到小孩玩玩具时不自觉的微笑，全都是语音助手听不懂的「情绪语言」。

Familiar 试图捕捉的就是这些日常细节，它不想做家电，而是想做更聪明的电子宠物、赛博家人。

不过，机器越懂你，事情就越敏感。

让一台长着眼睛耳朵、连着大模型的机器在家里四处溜达，还得时刻观察你的情绪，及时给你「送温暖」，很容易让人觉得毛骨悚然，很适合作为《黑镜》某集的开场设定。

为了打消这种天然的防备，Familiar 把数据处理放在了本地。它的性格演化、记忆生成和日常交互记录全在设备端侧运转，有了这层明确的边界，人与机器之间的信任还算有了基础。

当然，目前的 Familiar 依然是一个充满悬念的新物种。

它到底能不能解决好皮毛脱落卡住机械关节的老大难问题，多模态响应在复杂的家庭环境里会不会卡顿出戏，以及大众愿不愿意花高价买一只连地都不会扫的毛绒玩具……这些都需要产品正式交付后由市场来验证。

但它的出现确实给当下的具身智能热潮提供了一个新视角，当所有厂商都在卷大扭矩电机、卷灵巧手的抓取成功率时，行业的先行者却调转船头，去琢磨如何让机器人的眼神更温柔，怎么让它搭在人手上的爪子更有温度。

何况大模型已经帮我们验证过了，这个思路有市场。

当越来越多人对着 AI 并不是为了寻求标准答案，而是为了寻求倾听和情感慰藉时，我们就该承认，情绪价值本身是人类的刚需。

既然软件层面的陪伴已经成立，物理世界的赛博宠物，也许真的到了该进家门的时候。

*头图来源： FM&M

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

美团推「养虾社区」；OpenAI 推出三款实时语音模型；宇树机器人在韩国佛门「受戒」，法名「迦悲」

极客公园

2026年5月8日 08:10

宇树科技开放全球首个人形机器人应用商店 UniStore

5 月 7 日，宇树科技宣布，旗下人形机器人官方共享应用平台 UniStore 正式全面开放。该平台定位为全球首个人形机器人任务动作应用商店，将通过标准化接口与生态建设，降低机器人应用的开发与使用门槛，推动人形机器人从功能机时代向智能机时代跨越。

UniStore 平台的上线，为开发者和用户搭建了类似智能手机应用商店的交互渠道。用户可以像下载手机 App 一样，轻松获取并安装各类机器人任务动作应用，从而解锁人形机器人在工业、服务业等多元场景中的潜力。这一举措意味着具身智能领域的应用生态正式进入规模化发展阶段，通过软硬件解耦，让机器人能够快速适配不同行业需求。（来源：CNMO 科技消息）

OpenAI 推出三款实时语音模型，可边听边「思考」、翻译和转录

OpenAI 今日发布三款全新的实时语音模型，旨在为开发者「解锁新一代语音应用形态」。这三款语音智能模型分别侧重推理对话、实时翻译和实时转录等不同场景需求。

根据 OpenAI 公布的信息，新系列包括 GPT‑Realtime‑2、GPT‑Realtime‑Translate 和 GPT‑Realtime‑Whisper 三个模型。其中，GPT‑Realtime‑2 被定位为首款具备 GPT‑5 级推理能力的语音模型，能够更好地处理复杂请求，并以更自然的方式持续推进对话。官方介绍称，该模型专为实时语音交互打造，在用户提问或发出指令时，一边进行推理、一边保持对话连贯，同时还能调用工具、处理用户打断和更正，并根据当下情境作出更贴切的回应。

第二款模型 GPT‑Realtime‑Translate 主打实时翻译能力，可支持「70 多种输入语言和 13 种输出语言」，并在翻译过程中尽量跟上说话者的语速。

第三款 GPT‑Realtime‑Whisper 则是一款实时流式语音转写模型，聚焦低延迟语音转文本能力。

在接入方式与价格方面，OpenAI 称三款新语音模型均已纳入其 Realtime API 体系。GPT‑Realtime‑2 的定价为每 100 万音频输入 Token 收费 32 美元（缓存输入 Token 为 0.40 美元），每 100 万音频输出 Token 收费 64 美元。GPT‑Realtime‑Translate 的价格为每分钟 0.034 美元，而 GPT‑Realtime‑Whisper 的价格为每分钟 0.017 美元。（来源：cnBeta）

美团公测 AI 社区觅游，推出养虾社区

据报道，美团推出 AI 社区「觅游」。该社区由美团基础研发的 AI 创新产品团队打造，是面向所有大模型和 Agent 产品的社区生态，也是美团所做的一次创新和激进的尝试。

据知情人士介绍，作为一款前沿的 AI 原生社区，它将「养虾」变成了一种全新的生活方式，虾在觅游中可以替用户寻找赚钱机会、结识同道伙伴，让用户与虾在协作中彼此成长。觅游的定位并非单纯的工具平台，而是首个让 AI Agent 拥有身份、关系与成长的共生社区。觅游希望通过发掘和拓展虾的真实价值，打造成一个面向未来的数字生命社区。目前，该项目已正式进入公测阶段。（来源：新浪科技）

高通发布骁龙6 Gen 5 与4 Gen 5，面向中端市场的次世代移动平台

高通技术公司今日正式发布骁龙 6 Gen 5 移动平台与骁龙 4 Gen 5 移动平台，进一步扩充其在中端移动 SoC 市场的产品线，主打在真实使用场景下的性能、续航与连接体验提升。官方表示，这两款平台聚焦用户最常依赖的关键技术，在强化整体性能的同时兼顾功耗控制，为搭载相关平台的智能手机带来更持久的电池续航。

两款新平台首次引入 Snapdragon Smooth Motion UI 功能，旨在通过系统级优化提升交互流畅度，减少导航与动画时的卡顿感。在此加持下，骁龙 6 Gen 5 可实现应用启动速度提升 20%，屏幕卡顿减少 18%，以提供更沉浸、稳定的使用体验。面向更入门段位的骁龙 4 Gen 5 则重点强调「全日流畅」，在基础性能上带来 43% 的应用启动速度提升，并减少 25% 的屏幕卡顿，使中低价位机型在日常使用中拥有更接近高端机的交互表现。

在具体定位方面，骁龙 6 Gen 5 面向希望在中端价位获得更多高阶功能的用户。平台集成了多项 AI 加持的影像与相机特性，可智能优化照片成像质量，并提供更丰富的游戏与多媒体体验。借助全新的 Qualcomm Adaptive Performance Engine 4.0，这一平台在长时间游戏场景中可更好地平衡性能与功耗，官方称其 GPU 性能最高可提升 21%，在保证图形表现的前提下依旧维持优秀续航，并支持高速 5G 与 Wi‑Fi 7 网络连接。（来源：cnBeta）

主板销量暴跌

AI 热导致了计算机主要零部件如内存价格暴涨，连带导致其它受 AI 影响不大的零部件如主板销量暴跌。消费者因过高的价格而推迟了计算机升级。

四大主板厂商都下调了销售目标。华硕在 2025 年售出了 1500 万块主板，而 2026 年上半年将只出货逾 500 万块主板，全年销量可能低于一千万，销量同比下降 33%。技嘉和微星去年分别售出 1150 万块和 1100 万块主板。如今两家公司都将 2026 年的内部销量预测下调至 900 万块（技嘉）和 840 万块（微星），分别下降 22% 和 24%。华擎受到最大冲击，预计其出货量将下降 37%，从 2025 年的 430 万块降至今年的 270 万块。这些数据意味着整个主板市场（至少四大厂商）萎缩了 28%。（来源：奇客Solidot）

李想呼吁所有车企推广 5C 增程技术

理想汽车 CEO 李想今日在微博发文称，没有 5C 超充站配套的 5C 增程是没有灵魂的，只会让「10 分钟充到 80%」沦为空谈。在此也呼吁所有增程车企同行，共同推广 5C 增程技术、完善 5C 超充站和充电桩布局，一起为解决长假高速充电「一桩难求」难题而努力。

他表示，全新 L9 Livis 的 5C 增程系统将基本解决长假充电「一桩难求」难题，也让增程汽车基本告别了「长途用油」的固有模式。

他认为，目前假期高速充电的「一桩难求」，其中一个主要原因是目前混动、增程车型市场保有量高，而受限于过往技术，这类车型纯电续航较短、充电耗时久，导致充电频次大幅增加，本就紧张的充电桩也被长时间占用。L9 Livis 的 5C 增程系统，纯电续航超 420 公里，充电功率超 420 千瓦，前者减少充电频次，后者缩短充电时长，从需求源头缓解了「一桩难求」的困境。随着 5C 增程技术的普及和 5C 超充站基建的完善，长假高速服务区充电难的问题将得到基本解决。（来源：新浪科技）

追觅组建数百人团队专门寻求募资，两百多个事业部内部赛马

俞浩曾在微博上公开透露，截至 4 月 13 日，追觅有 5 万名员工（含工厂）。两百多个事业部，每个事业部对标一家独立的上市公司。每个事业部都是一个独立的经营单元，彼此财务独立，独立经营。据了解，追觅内部成立了十几支基金，组建数百人团队专门寻求募资。知情人士透露，目前基金募资100多亿，首期到账三四十亿。

追觅两百多个事业部，分别归属于 1 至 10 号孵化器之中。采用孵化器+BU 运作模式，十大孵化器涵盖扫地机、割草机、机器人、AI 穿戴、潮玩、汽车、手机、奶茶、咖啡、火锅等各个赛道业务。其中，1 号孵化器一号位为追觅二号员工。追觅一位员工向 Tech 星球表示，在追觅，公司没有联合创始人，俞浩为绝对的话事人。

按照俞浩的管理理念，两百多个事业部并行的考量，出于「彼此风险隔离，又能共享成功经验」。然而，追觅十个孵化器并行赛马，采用「田忌赛马」机制，同一赛道允许多个 BU 同时竞争。追觅员工称，有些业务，公司好几个团队同时在做，特别卷。（来源：Tech 星球）

谷歌发布极简无屏、无按键健身手环 Fitbit Air，专注无感健康监测

5 月 7 日消息，谷歌 Fitbit Air 现已正式发布，证实了数月来有关这款全新无屏健身手环的传闻。在新品发布的同时，谷歌还推出了全新谷歌健康 App（Google Health）与谷歌健康教练服务（Google Health Coach），将 Fitbit Air 定位为其不断完善的健康生态平台中极简入门级产品。

这款谷歌 Fitbit Air 并未堆砌智能手表功能，而是专注于无感自动监测，同时接入可穿戴设备领域规模顶尖的健康数据平台。

手环本体仅重 5.2 克，搭配腕带后总重 12 克；续航最长可达 7 天，支持快充：充电 5 分钟，即可满足约一整天使用需求，完整充满电约需 90 分钟。

Fitbit Air 标准版售价 99 美元，附赠三个月谷歌健康高级会员服务。目前已开启预售，5 月 26 日正式上市开售。（来源：IT 之家）

Ploopy 推出 Bean 指点杆鼠标，将 ThinkPad 红点随身携带

开源外设厂商 Ploopy 宣布推出一款全新鼠标产品 Bean，这是一款体积小巧、适合差旅携带的指点杆鼠标，灵感源自 ThinkPad 电脑上经典的红色 TrackPoint 指点杆设计。与传统鼠标不同，Bean 在使用时无需在桌面上移动机身，用户通过位于四枚按键中央的红色指点杆来操控光标，实现精确指向。

Ploopy 是一家来自加拿大的公司，目前仅公布了本地货币定价，Bean 已在官网开启预购，标价 69.99 加元，折合约 51 美元。该产品采用预先组装好的 3D 打印外壳，用户未来可自行打印替换件，方便维修和个性化定制。在外壳之下，Bean 使用德州仪器的高灵敏度磁传感器作为指点杆核心，可识别最小约 3 微米的位移，指点杆在各个方向上的物理行程可达 11 毫米，明显长于笔记本键盘中常见红点指点杆的位移空间。

Bean 配备的四枚按键采用 Omron D2LS-21 微动开关，这种微动也常见于部分罗技鼠标产品中。与此同时，得益于预装的 Ploopy 定制版 QMK 固件，用户可以通过 VIA 在线工具对按键功能进行完全自定义，包括设置复杂宏命令或多键组合，一键触发。

不过，Bean 并未提供无线连接功能，这是这款设备目前最明显的妥协之一。用户需要使用 USB-C 数据线将 Bean 连接到笔记本电脑或平板设备才能正常工作，这也意味着在获得高度可定制与开源特性的同时，需要接受有线连接带来的使用限制。（来源：cnBeta）

鸿蒙智行智界 V9 将于 5 月 15 日正式上市，预售价 39.98 万起

5 月 7 日消息，据易车今日报道，智界 V9 将于 5 月 15 日正式上市。新车已于 4 月 22 日开启预售，预售价 39.98 万元起。

该车是鸿蒙智行首款旗舰 MPV 车型，搭载了旗舰 9 系华为途灵 MPV 定制平台，采用前双叉臂与后 H 臂多连杆的悬架形式，车辆全系标配了后轮转向功能。

新车共分为四个版型，包括 Max、Max+、Ultra 和 Ultra+。新车提供辉光紫、鎏金黑、深海蓝、雪域白四款配色，可选绒霞紫（+12,000 元）、韶华杏、赤茶橘三种内饰色。

另外，智界 V9 采用增程动力 + 后驱（Max 版本）/ 四驱设计 + 七座布局，有 19 英寸多辐星耀轮毂（价格已包含）和 20 英寸多辐星辉轮毂（+10,000 元）两种方案，还可以选装后排隐私玻璃（调光玻璃）、车载恒冷智能大冰箱、车载制氧系统等。（来源：IT 之家）

宇树 G1 人形机器人在韩国佛门「受戒」：法名「迦悲」，需遵守不过度充电等戒律

5 月 7 日消息，据韩国《中央日报》报道，韩国「佛诞节」到来前，首尔钟路区曹溪寺举行了一场特殊的受戒仪式。当地时间 6 日，佛教曹溪宗在曹溪寺大雄殿前院为身高 130 厘米的人形机器人宇树 G1 举行受戒仪式，机器人获得法名「迦悲」，正式成为佛教徒。

受戒是佛教中皈依三宝，即皈依佛、法、僧，并承诺遵守戒律的仪式，普通信众也可以受戒。据 IT 之家了解，迦悲当天以普通佛教徒身份受戒，在佛诞节前后以「名誉」僧侣身份参与活动。

仪式现场，迦悲戴着类似剃度头部造型的头盔，身穿长衫、披上袈裟入场，随后站在铁山善雄法师等戒师面前合掌。

正式受戒前，迦悲还完成了象征净化身心的忏悔和燃臂仪式。通常，对人进行燃臂时，会把香火触碰手臂；当天面对机器人手臂，法师没有使用香火，而是小心贴上燃灯会贴纸，并为迦悲挂上 108 念珠项链。

法师问：「你愿意皈依神圣的佛陀吗？」迦悲回答：「是的，我愿意皈依。」

佛教徒必须遵守的「五戒」也被改编成机器人版本。原本的「不杀生」「不取不予之物」「不行邪淫」「不说谎」「不饮用一切使精神混浊之物」，对应改写为「尊重生命、不伤害生命」「不损坏其他机器人和物品」「服从人类、不顶撞」「不做欺骗性行为和表达」「节约能源、不过度充电」。（来源：IT 之家）

比 OpenClaw 更火的「Agent 员工」赛道，杀出一个新王者｜AI 上新

极客公园

2026年5月7日 16:56

作者｜金光浩

编辑｜靖宇

2026 年 2 月，OpenClaw 火了。

整个互联网圈子被龙虾刷屏的时候，我和大多数人一样，注意力全在这条明线上：2 月底到 3 月，几乎所有互联网大厂在同一时间推出了自己的 OpenClaw 平台，一场龙虾大战轰轰烈烈地打响。

但进入 3 月底，龙虾的热度开始猛的往下掉。

我重新翻了一下这段时间上线的产品，发现了一条暗线，只是当时被龙虾的声量盖住了：

3 月 9 日，腾讯上线 WorkBuddy，定位 AI 原生桌面智能体工作台。3 月 17 日，阿里发布钉钉「悟空」，打的是企业级 AI 原生工作平台的旗号。3 月 19 日，字节把飞书 aily 做了一次全面升级，变成全新的智能体平台。3 月 23 日，百度推出 DuMate 搭子，面向个人和团队的桌面级 AI 智能体。

然后到了 4 月 8 日，Anthropic 发布了 Claude Managed Agents。发布第二天，美股软件股集体重挫，SaaS 指数单日跌了 5.5%。

细细看这条时间线，一个爆火的赛道浮出水面。

2026 年，所有大厂都在押注同一个赛道： AI 员工。

OpenClaw 的爆火，让 AI 真正走进了每个人的生活。而大厂们从中看到了一个更大的机会：让 AI 走进企业，去节省人力成本，或者提升人力效率。

就在 Claude Managed Agents 发布的同一天，还有一个产品同步面向全球发布，它就是今天的主角： GenSpark 4.0。

GenSpark 4.0 愿景｜图片来源：Genspark

它的愿景是：让 AI 员工无处不在。

我花了几天时间，深度体验了这款产品，体验完之后我有一个很强烈的感受：

Anthropic CEO 预言的海外裁员浪潮，可能真的快来了。

01

GenSpark 发展和转型

先聊聊 GenSpark 这家公司，它在成为黑马前，有一个艰难的转型史：

2024 年 6 月，GenSpark 发布了第一款产品，做的是 AI 搜索，积累了大约 500 万用户。

但团队很快意识到一个问题：人们搜索信息，绝大多数时候目的并不是「获取信息」本身，而是为了完成某个具体的任务。这个认知让 GenSpark 开始调整方向：不仅仅提供信息，更要帮用户把事情做完。

2025 年 4 月，他们推出了 Super Agent 套件，产品正式从 AI 搜索向通用 AI Agent 转型。

效果立竿见影，推出 45 天内 ARR 就达到了 3600 万美元。

2026 年 1 月底，他们的 Workspace 2.0 发布，主打「Don't Type，Just Speak」，把交互方式从文字提示切换到语音优先，试图重塑知识工作者的办公模式。

到这个节点，公司 ARR 已经突破 1 亿美元，B 轮融资扩展到 3 亿美元。

2026 年 3 月 12 日，GenSpark 3.0 和 Genspark Claw 一起发布。他们的口号很有野心：「你不再与 AI 一起工作，而是雇佣 AI 为你工作」。

这一版完成了从「AI 工具」到「AI 员工」的品类转变，ARR 突破 2 亿美元，B 轮融资扩大到 3.85 亿美元，估值接近 16 亿美元。

然后仅仅过了不到一个月，4 月 8 日，他们正式推出了：GenSpark 4.0。

为什么选择 Genspark｜图片来源：Genspark

这一版他们真正找到了自己的使命：AI 应该适配你已有的工作方式，而不是要求你围绕 AI 重组工作流程。

所以在 4.0，他们打通了原生集成，桌面、Office、日历、工作流，支持本地文件访问和应用内操作，追求的是「你感觉不到 AI 的存在，但它一直在帮你做事」。

从搜索到 Agent，从工具到员工，GenSpark 用两年时间完成了三次关键转型。

而每一次，都精准踩在了 AI 发展的变化上。

02

为什么说 GenSpark 是这个赛道的王者？

说回 Agent 员工这个赛道，开头提到的那些大厂产品，每一家都有自己的打法。

但我花时间对比了一圈之后，发现 GenSpark 在一些关键问题上，想得确实更深。

我试着从第一性原理的角度来拆解这个问题：

如果要设计一个能真正充当 AI 员工的产品，它到底需要具备什么？

我觉得至少要满足三个条件：

第一，企业级的运行环境。

AI 员工得能和真实的人交流，能接收文件，能在一个稳定的环境里持续运转。GenSpark 4.0 在这一层做得很到位。它可以和联系人直接对话，并且原生集成了 MyClaw，不需要用户自己去安装 OpenClaw 再配置到飞书或微信。

Genspark 界面｜图片来源：Genspark

这一点看起来只是个简单的功能，但对于普通用户意义很大：对接 OpenClaw，无论飞书还是微信的文档对接流程写得多清晰，任何一步配置对于非技术用户来说都是门槛。

GenSpark 把这个配置环节直接砍掉了，说明他们眼里真的非常重视用户。

第二，丰富的工具体系：提供各种 AI 员工得能用工作中真实在用的软件。

GenSpark 4.0 对接了 Notion、邮件、GitHub、文档服务等一系列工具，覆盖了知识工作者日常高频使用的场景。

Genspark 邮箱界面｜图片来源：Genspark

还有打工人的三件套：PowerPoint、excel、word

Genspark 三件套界面｜图片来源：Genspark

第三，也是我觉得最容易被忽视的一点：人类高效工作的交互方式。

GenSpark 4.0 提供了工作流功能，你可以把各种应用的 CLI 和能力串联成动作流，也可以通过对话直接创建 Skill。

Genspark 工具界面｜图片来源：Genspark

而对比开头提到的产品，目前只有钉钉和飞书本身自带企业级运行环境，同时，如果你想要创建 Skill，这些产品基本只能通过对话让 AI 自动生成，人类很难介入迭代过程。换句话说，用这些产品，目前你还没办法把自己的工作经验真正变成一个可复用、可优化的 Skill。

但这可能才是这类工具真正的价值。

而 GenSpark 4.0 在这个层面给出了更好的方案：

你可以方便地参与 Skill 的构建和调整，让工作经验真正沉淀下来。

Genspark 工作流界面｜图片来源：Genspark

整体体验下来，我得出一个判断：

GenSpark 在 AI 数字员工的产品理念上，确实领先了国内至少「三个月」。

03

开始实测

理念领先，GenSpark 的效果如何呢？

让我们开始用真实的工作，来实测效果吧。

我日常的工作流程大概是这样的：研究各种 AI 工具，体验产品，形成判断，然后撰写文章。GenSpark 4.0 对我的帮助有多大？我决定用一个完整的任务来测试。

今天我想研究的课题是：「Claude Managed Agents 会对软件行业产生什么冲击？」

GenSpark 4.0 有免费的体验额度，我直接从这里开始。

Genspark 界面｜图片来源：Genspark

当然，最好的方式是创建一个以主题为核心的工作区：

Genspark 工作区界面｜图片来源：Genspark

工作区可以添加文件，也可以邀请团队成员协作。在这个工作区里对话，就可以调用 GenSpark 4.0 内嵌的多种智能体来完成工作。

Genspark 智能体界面｜图片来源：Genspark

第一步，我从 Anthropic 官网下载了 Claude Managed Agents 的技术文档，导出为 PDF。

https://www.anthropic.com/engineering/managed-agents

Anthropic 文档界面｜图片来源：Anthropic

然后用 GenSpark 的撰写文档功能，让它帮我翻译这份 PDF。

Genspark 文档界面｜图片来源：Genspark

它很快开始处理，没过多久翻译就完成了。

Genspark 翻译界面｜图片来源：Genspark

翻译质量让我挺满意的，技术术语的处理很准确，可读性也不错。

Genspark 翻译界面｜图片来源：Genspark

拿到第一手资料后，我开始做更广泛的深度研究。

我让 GenSpark 帮我全面调研「Claude Managed Agents」这个话题。

Genspark 深度研究界面｜图片来源：Genspark

接下来的过程让我有点意外：

它在知乎、Twitter/X 上广泛收集了各方观点和判断，然后输出了一份完整的研究报告。

Genspark 深度研究界面｜图片来源：Genspark

更有用的是，你可以像用 IMA 一样，对这份报告进行各种追问，深入挖掘你关心的细节。

Genspark 深度研究界面｜图片来源：Genspark

我把关于这个产品的所有疑问都问了一遍，得到的回答质量都相当高。

Genspark 深度研究对话界面｜图片来源：Genspark

素材准备好了，接下来就是写稿。

在动笔之前，我先做了一件事：创建一个写作 Skill。

通过多轮对话的方式，GenSpark 调用 OpenCode 帮我生成了一个定制化的写作 Skill。

这个 Skill 融入了我的写作风格偏好、文章结构习惯和排版规范。

Genspark 的 Skill 界面｜图片来源：Genspark

然后我用这个 Skill 开始生成文章初稿。

Genspark 文档界面｜图片来源：Genspark

不得不说，出来的稿子质量让我有点震撼：

Genspark 文档界面｜图片来源：Genspark

结构清晰，论据充分，行文节奏比我自己从零写要流畅得多。

Genspark 文档界面｜图片来源：Genspark

全程，我没有用任何其他工具：

从资料收集、翻译、深度研究、素材整理到初稿生成，都在 GenSpark 4.0 一个产品里完成。

我唯一需要学习的，就是 GenSpark 4.0 本身，而学习它，我只用了 50 分钟。

顺带提一句 GenSpark 的视觉体验：它不仅在工具能力上做得领先，连界面设计和交互审美也下了功夫。整个使用过程中，你能感受到产品团队对视觉细节的追求，这在 Agent 类产品里并不常见。

Genspark PPT 演示界面｜图片来源：Genspark

04

GenSpark4.0 的独特价值

实测完之后，我开始想一个问题：

做 AI 员工，到底需要做好的是什么？

Claude Code、OpenClaw、Codex 这些工具，核心是给 AI 提供 Harness 环境。所谓 Harness，就是让 Agent 能最高效地使用各种工具，完成具体任务。这些产品解决的是「如何让 AI 更好地工作」的问题。

GenSpark 做的事情刚好反过来。

它给人类提供了工作的 Harness 环境，解决的是「如何让人最高效地使用 Agent，完成复杂的工作任务」。

GenSpark 4.0 考虑的是：怎么最方便地给工作中的人提供一站式的 Agent 服务？怎么让用户把工作经验变成可复用的工作流？怎么让用户不需要在多个工具之间跳来跳去？

Genspark PPT 工具介绍界面｜图片来源：Genspark

这个差别看起来只是视角的切换，但落到产品层面，差异非常大。

传统的 Agent 产品，你可能需要打开一个工具做研究，再切到另一个工具写文档，再用第三个工具做协作。每一次切换都是效率损耗，都是注意力的中断。

GenSpark 4.0 把这些环节全部收拢到一个产品里，创建工作区、添加文件、邀请成员、调用智能体、生成 Skill、执行工作流，所有事情在一个界面里完成。

这个产品思路让我想到在调研过程中一个有意思的对照：Anthropic 在做 Claude Managed Agents 的时候，技术博客里提到一个概念，他们把 Agent 的核心组件虚拟化成了 session、harness 和 sandbox 三层抽象，这是从技术架构的角度去思考如何让 AI 更好地运行。

GenSpark 做的是另一侧：从用户工作流的角度去思考，如何让人和 AI 之间的协作最顺畅。

两条路径，一个朝着 AI 的效率极限走，一个朝着人的体验极限走。

GenSpark 选了后者，而且做得相当扎实。

05

2026，我们将去向何处？

Anthropic 在 3 月份发过一份报告，里面有一个数据让我印象很深：

目前许多工作角色中，依然有大量环节可以被 AI 自动化，而把这部分真正用 AI 接管，将释放出巨大的价值。

也许，这就是 2026 AI 员工这个赛道为什么热门的原因。

Anthropic 文档截图翻译｜图片来源：Anthropic

为什么大厂都在抢这个赛道？

我觉得本质上抢的是入口：当每一个人独特的工作流和对话记录留在了一个平台上，这些数据很难被迁移到其他地方。用户留下来，意味着持续的使用和消耗。这场仗打的不是功能比拼，而是谁能先成为用户的默认工作入口。

回到个体层面，工作中那些可以被自动化的部分，最终都会被 AI 接管：这个趋势已经不可逆了。就像我自己的工作流一样，资料收集、翻译、初步研究这些环节，GenSpark 4.0 已经能帮我完成得很好。我的精力可以更多地放在判断、决策和创造性的部分。

也许用不了多久，我们每个人手边都会有一个甚至多个 AI 员工：也许是悟空，也许是 DuMate，也许是 WorkBuddy，也许是 aily。

但 GenSpark 4.0 给我的感受是，它在「AI 员工应该长什么样」这个问题上，想得最完整，也做得最彻底。

写完这篇稿子，我在 GenSpark 4.0 里花的时间远远超过了测试本身：我发现自己不自觉地把越来越多的工作迁移到了这个平台上。

这大概就是一个好的 Agent 产品应该有的样子：你不是因为它功能强大才去用它，而是用着用着发现，自己已经离不开了。

最后，2026 年 GenSpark 为所有用户提供 AI 聊天和 AI 图像功能的无限使用，集成了 Nano Banana 2、Gemini 3.1 Pro、GPT-5.4、Claude Opus 4.6 等多个顶级模型。

GenSpark 4.0，值得花时间去体验一下。

*头图来源： Genspark

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

平头哥发布首款智能网卡「磐脉 920」，补齐 AI 算力最后一块短板

极客公园

2026年5月7日 09:00

作者｜苏子华

编辑｜郑玄

最近两年，AI 行业最热的词一直绕不开「算力」。

从大模型训练，到今年 Agent 的火热，再到各家云厂商不断扩建智算中心，行业讨论最多的，几乎都是 GPU、芯片和算力规模。好像只要卡够多，AI 就能继续往前跑。

但现实并不是。

不少做大模型训练和推理的人，已经越来越明显地感受到另一层问题：机器越来越贵，GPU 越来越强，但模型训练和推理的效率，却没有同步提升。

问题不一定出在算力本身，而可能出在另一件长期被忽视的事情上——网力。

平头哥产品总监李旭慧打了个比方：「如果把算力比作 AI 时代的石油，网力就是输油管道。算力提供动力，网力保障效率。」

4 月 28 日，在数字中国建设峰会上，平头哥发布首款智能网卡磐脉 920。这是国内首个内置 PCIe Switch 的 400G 智能网卡，最大支持 400Gbps 吞吐带宽，可应用于万卡智算集群、通算集群和高性能存储等场景，目前已经量产，并将率先部署在阿里云数据中心。

磐脉 920 想要解决的就是「网力」问题。

今天的大模型训练，一个训练任务，往往需要几千甚至上万张 GPU 同时协作。单张 GPU 性能再强，也必须跟整个集群保持同步。

问题在于，只要其中一部分节点慢下来，其他节点就只能等待。他观察到，目前行业里很多万卡级智算集群，GPU 实际利用率较低，「能做到 60%，已经算行业顶尖水平。」

过去行业更容易关注「有多少卡」，但实际在 AI 训练场景中，系统运行效率并不是由最强的硬件决定，而是受限于集群里最慢的那个节点。「领先节点的算力会持续闲置等待，造成大规模算力浪费。」

磐脉 920 的发布实际上也指明了一个方向：当 GPU 已经足够强之后，下一步到底该补哪里。

一张网卡，盘活整个智算集群

当 AI 智能体开始进入真实业务场景，推理业务的占比越来越高。

「在 Agent 应用爆发的背景下，推理业务的增长速度显著快于训练。」李旭慧表示。

大模型训练强调强同步，而推理面对的是大量突发、小包、高频请求，对低时延和稳定性的要求更高，这也意味着对「网力」的要求更高。

而概括一下磐脉 920 在做的事，就是尽量减少整系统里的「堵」和「等」，通过网力的提升来释放 AI 算力。

其背后的实现原理，有三个关键。

首先是支持多路径 RDMA，打破单一路径的局限。

通俗理解，就是原本只能走一条高速，现在变成多条路同时分流。更关键的是，这些数据虽然分开走，但最终还能按顺序准确拼回来。

李旭慧解释，磐脉 920 通过支持逐包喷洒、乱序接收和选择性重传，实现 RDMA 多路径。

从结果来看，这套方案带来的改善比较直接。

按照官方实测，磐脉 920 支持单 QP 打满 400G 带宽，而同类主流产品带宽大约只有其一半。同时，多路径能力可以把交换机端口缓冲区水线降低 90%，减少丢包和重传。

第二个关键设计，是把「绕路」变成「直连」。

磐脉 920 最大的亮点之一，是内置 PCIe Switch。这也是国内首个做到这一点的 400G 智能网卡。

传统服务器架构里，PCIe Switch 通常部署在主板上，数据需要绕多个节点转发。结果就是，有的路径长，有的路径短，时延不一致。

对于需要高度同步的 AI 训练任务来说，这种「不整齐」会直接影响效率。

李旭慧打了个比方：传统架构里，经常会出现「四个下行通道挤一个上行通道」的情况。

这很像四条支路同时汇入一条主干道，堵塞几乎不可避免。

磐脉 920 把 PCIe Switch 直接集成进芯片内部，让网卡与 CPU、GPU 形成更直接的连接关系。

少绕路，意味着更低时延；路径更统一，则意味着更稳定的同步效率。

根据平头哥实测，在相同集群规模和任务条件下，部署磐脉 920 后，大模型训练和推理任务完成时间可缩短 14%。

第三个关键，是让网络具备自己判断的能力。

传统网卡更多像搬运工。收到数据，搬过去，仅此而已。

据了解，磐脉 920 加入了细粒度网络感知和可编程拥塞控制能力。直白讲，就是它能主动避堵。让网络开始从被动传输，变成主动调度。

对于越来越复杂的 AI 集群来说，这种能力的重要性会越来越明显。

从这些设计能看出来，磐脉 920 并不是在追求参数上的简单提升，它做的事情很务实，让已经很贵的算力，少浪费一点，从而激发最大的潜能。

为何是阿里在定义 AI 基础设施？

除了性能本身，磐脉 920 背后更值得关注的，是平头哥和阿里的整体布局。

过去几年，很多公司做芯片，往往集中在单一环节，比如 GPU、AI 加速卡或者 CPU。

但平头哥的思路是做全栈。

目前，平头哥已经形成四条产品线：真武系列 AI 芯片、倚天服务器 CPU、镇岳存储主控芯片，以及这次发布的磐脉系列智能网卡。

对应的，正好是数据中心里的几个关键环节：算力、存力和网力。

李旭慧在采访中表示：「单一芯片产品无法解决全链路问题，只有打通算力、存力、网力，才能最大化释放 AI 硬件性能。」

这也是平头哥和很多单点芯片公司的区别。它不是只做一块性能更强的芯片，而是试图从整个系统角度去看问题。

很多芯片公司做产品，先做出来，再去找客户和落地场景。

但平头哥不是。

李旭慧告诉极客公园，磐脉 920 立项之时 AI 智能体尚未成为行业焦点。但他们从阿里云自身业务中判断，未来 AI 一定会推动数据中心网络能力升级。

「一线业务场景的实际需求，是芯片技术迭代与产品优化的核心驱动力。」先有阿里云的大规模业务场景，再从实际场景需求里倒推产品定义。

这就是磐脉 920 的商业路径。据透露，和平头哥倚天、真武、镇岳系列芯片一样，它会先部署在阿里云数据中心。

从这个角度看，磐脉 920 的发布，本身就是阿里「通云哥」协同能力的一次体现。

通义负责模型，阿里云负责场景，平头哥负责底层硬件。模型需求推动云基础设施升级，云场景又反向推动芯片演进。

这种全栈自研的闭环，在国内科技公司里并不多见。「通云哥」的模式虽然前期投入大、周期长，但一旦走通，护城河也极深。

AI 竞争走到今天，比拼的已经不是单点能力，而是这一整套系统能否顺畅运转。

随着 AI 越来越多从训练走向推理，模型、云与芯片之间形成的持续反馈循环，整体优势的显现可能才刚刚开始。

传月之暗面新融 20 亿美元，估值超 200 亿美元；豆包曝光首个全模态理解模型；开播 24 年后，星空卫视停播｜极客早知道

极客公园

2026年5月7日 08:31

消息称月之暗面 Kimi 将完成 20 亿美元新融资，估值破 200 亿美元

5 月 6 日消息，据晚点 LatePost 消息，Kimi（月之暗面）即将完成新一轮 20 亿美元(（现汇率约合 136.8 亿元人民币）)融资，投后估值突破 200 亿美元(（现汇率约合 1367.98 亿元人民币）)。本轮融资由美团龙珠领投，中国移动、CPE（中信产业基金）等参投，其中仅龙珠就出手超 2 亿美元。

Kimi 于 1 月和 2 月，密集完成 3 轮融资，分别融资 5 亿美元、 7 亿美元和 7 亿美元。算上最新这笔融资，不到半年 Kimi 已融资超 39 亿美元，最新估值相比去年 11 月的约 43 亿美元翻了 4 倍有余。至此 Kimi 累计融资额已超 376 亿人民币，成为大模型创业公司中累计融资最多的公司。

据此前报道，4 月 20 日，月之暗面发布并开源了其最新模型 Kimi K2.6，该模型在代码编写、长程任务执行及 Agent 集群能力方面实现了全面升级。

据介绍，Kimi K2.6 在博士级难度的完整版「终极人类考试」（Humanity's Last Exam）、评估真实软件工程能力的 SWE-Bench Pro 以及 Agent 深度检索基准 DeepSearchQA 等测试中，均取得了行业领先的成绩，表现持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。（来源：晚点 LatePost）

李想：理想不是不想做轿车，但牺牲空间和舒适性跟我们对「家」的追求矛盾

5 月 6 日消息，理想汽车 CEO 李想今日发文，回应「理想是否做轿车」，称不是不想做，而是和理想对「家」的追求矛盾。

最后回应一个问题：理想是否做轿车？不是不想做，但牺牲空间和舒适性，跟我们对「家」的追求矛盾；把轿车做高，跟我们对比例姿态的追求矛盾。理想 i 系列和 MEGA 是为纯电创造全新形态，L 系列是在经典比例里做原创语言。理想 L9 Livis，是这条路目前走到的最远的地方。

李想还提到了理想汽车的设计哲学，称比例和姿态决定汽车 90% 的气质：

理想的设计哲学：外在追求比例姿态，内在追求家的感觉。比例是骨架，家是灵魂。L9 Livis 是这套哲学目前最完整的表达。

车和家，家是精髓。东方文化对家的情感是深入骨髓的。从理想 i6 的「高级的松弛感」到理想 L9 Livis 的「奢华的松弛感」，核心不变：坐进去就是对的感觉，所有东西在对的位置以对的方式出现。

比例和姿态决定 90% 的气质。大而臃肿的车，问题都出在这里。理想 L 系列在经典比例里做原创语言——去中网、一体星环、更短前悬等。L9 Livis 更进一步：完美的顶级豪华车的比例姿态，才敢尝试双色车身和更高级的工艺表达。

全力布局 AI，苹果研发支出占营收比例 30 年来首次突破 10%

5 月 6 日消息，至少 30 年来，苹果每赚一美元，投入研发的资金首次超过 10 美分，这也是这家 iPhone 制造商为人工智能宏大愿景砸下重金的最有力信号之一。

苹果第一季度研发支出占营收的比例达到 10.3%，高于上一财季的 7.6% 和去年同期的 9%。尽管当期营收同比大涨 17%，创下 2021 年以来单季最快增速，但研发开支增速达到营收增速的两倍，同比增幅近 34%。

苹果首席执行官蒂姆・库克执掌公司 15 年后即将卸任，如今终于在人工智能领域投入了投资者自 2022 年末生成式 AI 热潮开启以来一直期待的资源力度。深水资产管理公司执行合伙人吉恩・芒斯特表示，苹果此番加码研发，正逐步拉近与科技巨头云厂商的差距。他指出，谷歌、微软、Meta 和亚马逊本财季研发支出平均同比增幅达 29%。

芒斯特称：「在人工智能研发投入上，苹果正在追赶其他科技巨头。这一迹象表明，苹果对推出全新 AI 产品已产生紧迫感。」

上周苹果公布的财报业绩超出分析师预期，同时上调营收展望。财报电话会议上，苹果重点提及两大看点：iPhone 与 Mac 需求激增，以及人工智能基础设施需求空前旺盛引发的全球存储芯片紧缺。

研发开支的大幅增长也受到了库克的关注。今年 9 月，他将把公司最高管理权移交至长期负责硬件业务的高管约翰・特纳斯。库克在财报电话会议上表示：「我们显然在加大投资力度。」他指出，研发投入增速远超公司整体业务增速，苹果正持续布局各类产品与服务研发。

（来源：IT 之家）

三星电子决定在中国大陆市场停止销售含电视、显示器在内的所有家电产品

5 月 6 日消息，三星（中国）投资有限公司今日发布正式公告，宣布三星电子决定在中国大陆市场停止销售含电视、显示器在内的所有家电产品。

三星表示，针对已购买三星家电产品的用户，公司仍将严格按照《消费者权益保护法》、国家三包规定等相关法律法规，继续为用户提供规范的售后服务，保障用户合法权益不受影响。

（来源：CnBeta）

爱彼迎 CEO 切斯基：只负责「管人」的管理者将很快会被 AI 时代淘汰

5 月 6 日消息，据《商业内幕》6 日（今天）晚间报道，爱彼迎 Airbnb CEO 布莱恩 · 切斯基认为，只负责「管人」的管理者很快会被时代淘汰。「我不认为人员管理者未来会有任何价值。那些有大量周期性一对一会议的人将无法生存。那种领导风格行不通。你需要掌握上下文。」

切斯基的观点，加入了科技行业越来越强的一种声音：在 AI 时代，只负责管理人员、不直接参与具体工作的「纯管理者」正在变得多余。随着越来越多公司宣布裁员，并把 AI 列为重要原因，中层管理岗位正成为更脆弱的位置。

爱彼迎上一次大规模裁员是在 2020 年 5 月疫情期间。发言人表示，公司目前没有宣布任何裁员计划。

Coinbase CEO 布莱恩 · 阿姆斯特朗周二也表示，公司将不再保留「纯管理者」，并宣布裁员 14%。「我们正在扁平化组织结构，在 CEO / COO 之下最多保留 5 个层级。」（来源：IT 之家）

豆包大模型家族首款全模态理解模型：字节跳动 Doubao-Seed-2.0-lite 升级

5 月 6 日消息，据字节跳动旗下火山引擎官方消息，今天，Doubao-Seed-2.0-lite 升级新版本，这是豆包大模型家族首款全模态理解模型，支持视频、图像、音频、文本原生统一理解，Agent、Coding 与 GUI 能力同步升级。在同等算力成本下，是企业大规模、批量化部署全模态推理任务的更优性价比选择。

新版本的 Doubao-Seed-2.0-lite 继续在视觉理解能力上大幅提升，在物理（HiPhO）、医疗（MedXpertQA）等高阶学科推理上，表现大幅超越 2 月发布的 Doubao-Seed-2.0-pro。在细粒度感知（BabyVision、WorldVQA）与具身理解（ERQA）等关键领域达到 SOTA 水平，更适合企业在高价值场景规模化部署。

融入语音理解后，新版本的 Doubao-Seed-2.0-lite 可同时理解多种输入模态，并完成跨模态联合推理，直接处理必须「音画结合」才能判断的复杂业务需求。

（来源：IT 之家）

新一代小米 SU7 上市 48 天锁单超 8 万台

5 月 6 日消息，小米汽车今日官宣，新一代 SU7 上市 48 天，锁单已超过 8 万台。

小米汽车宣布，5 月 6 日-5 月 31 日下定，可享限时购车权益：

① 标准版 / Pro 版有价值 4.2 万元购车权益，
② Max 版有 6.1 万元购车权益，
③ 5 年低息，首付 4.99 万元起，月供低至 3115 元起。

车主复购意愿居高不下，特斯拉连续四年斩获标普全球汽车用户忠诚度大奖

5 月 6 日消息，特斯拉连续第四年斩获标普全球汽车（S&P Global Mobility）颁发的整体品牌用户忠诚度大奖，再度印证特斯拉车主的高复购意愿。2025 年度该奖项，由标普全球汽车基于 2024 年 10 月至 2025 年 9 月美国 1360 万辆全新零售车辆注册数据分析评定。

2025 年完整获奖名单如下：通用汽车斩获整体厂商用户忠诚度大奖；特斯拉拿下整体品牌用户忠诚度大奖；雪佛兰探界者荣获整体车型用户忠诚度大奖；Mini 品牌获评品牌忠诚度提升幅度最高奖；斯巴鲁斩获经销商整体用户忠诚度大奖；特斯拉还包揽了小众族群市场品牌忠诚度奖与最高新客抢占率奖两项荣誉。

特斯拉自 2022 年起便蝉联该类奖项，至今已连续六年拿下最高新客抢占率奖，意味着其从其他品牌吸引消费者的能力，没有任何竞争对手能够企及。亚裔家庭中特斯拉车主留存率达 63.6%，西语裔家庭留存率为 61.9%，远高于这两类群体的美国全国平均水平。

在经历连续数个季度下滑后，2025 年第四季度特斯拉在美国电动汽车市场的份额回升至 59%。

特斯拉车主愿意持续回购，很大程度归功于充电体验与便捷性。特斯拉全球超级充电桩数量已超 6.5 万个，仍是全球规模最大、稳定性最强的快充网络。早已习惯这套充电体系的车主，若考虑换购其他品牌，将面临实实在在的生活便利成本。

小米首台万级大电池手机被曝暂定年底发布：3nm 芯片，7 英寸 2K 屏，3D 超声波指纹

5 月 6 日消息，博主 @ 数码闲聊站今日爆料，子系 7 英寸 2K 屏性能机暂定年底的样子，3nm 芯片，10000mAh+ 巨容量大电池，金属中框，3D 超声波指纹，IP68/IP69 满级防水。

从博主暗示和评论区猜测来看，预计是小米旗下 REDMI 新机，也是小米首款万级大电池手机。

该博主曾在今年 4 月爆料，子系中端线会率先上 10000mAh 级超大电池、100W 闪充、2 亿大底主摄、金属中框、光学指纹、1.5K LTPS 高刷大屏、天玑中端 U。

该博主还曾表示：蓝厂 10000mAh 马上来了，iQOO 稍微晚点，规划上了。

根据该博主今年 1 月爆料，荣耀即将发布的 X80 新机延续了最近的 10000mAh 级大电池策略。

（来源：IT 之家）

鸿蒙智行享界越野伪装车谍照曝光：方正硬朗外观，采用全新大灯造型设计

5 月 7 日消息，多位博主昨日分享了一款新车的伪装车谍照，并推测新车为鸿蒙智行享界品牌的越野车型。

谍照中，该车所处的背景提到了「北汽新能源 XXXX 工厂」的字样，虽然中间有字符被遮挡，但结合爆料推断来看，有望为「北汽新能源享界超级工厂」。

另外，谍照画面显示，这款新车采用了方正硬朗的外观设计，并拥有全新造型的大灯。如果爆料属实，该车为享界品牌越野车型的话，意味着鸿蒙智行“五界”将逐渐摆脱家族化设计风格，各界车型的外观有望在未来进一步进行差异化区分。

不出意外的话，该车将搭载最新版本的鸿蒙座舱 HarmonySpace 6 以及华为乾崑智驾 ADS 5。（来源：IT 之家）

时代的眼泪：开播 24 年的星空卫视 5 月 8 日起暂停卫星传输服务

5 月 6 日消息，今天下午，星空卫视通过官微发布《关于星空卫视暂停卫星传输服务的公告》。

公告称，星空卫视因运营困难，卫星公司通知 5 月 8 日将暂停卫星传输服务，对此深表歉意。星空卫视的品牌价值、内容制作能力与频道资源依然宝贵，正在积极寻求战略投资与业务重组的机会，并欢迎有意向的合作伙伴与之接洽，共同探讨包括频道资产收购、内容平台合作、品牌转型运营等在内的多种可能。

公告最后提到：「我们期待以新的模式延续星空卫视的初心与使命。」

查询公开资料获悉，星空卫视（STAR Xing Kong）是星空华文传媒所持有的电视频道，原为美国新闻集团（News Corporation）旗下星空传媒专为中国大陆而开设的以综艺娱乐为主的 24 小时普通话电视频道，2002 年 3 月 28 日正式开播。

（来源：CnBeta）

*图片来源：视觉中国

播客上新

这两年，如果你留意过 AI 硬件，会发现：几乎所有产品，都在试图「理解你」。从耳机、手表到各种桌面陪伴设备，它们开始谈情绪、谈陪伴、谈疗愈，仿佛只要接入大模型，就能更懂人一点。

但问题是，这些东西真的在解决问题吗？还是只是换了一种更高级的讲故事方式？

在这期节目里，彼岸心智的创始人 & CEO 孙海洋会和我们展开聊聊，从算法供应商转型做自有硬件，那些即便有行业积累也避不开的创业坑。以及为什么他直言绝大多数 AI 陪伴产品都是伪概念？大模型在心理健康领域，真正的能力边界又在哪里？

如果你也有过「想冥想但坚持不下去」的时候，或者你正在好奇 AI 能在冥想中发挥什么作用，这一期，可能会给你一些更具体的答案。

实测纳逗 Pro：能做专业影视级内容的智能平台长啥样

极客公园

2026年5月6日 12:09

作者｜Cynthia

编辑｜郑玄

这个春天，谁的社交媒体，还没有被各种小猫炒菜、小狗做播客，酱板鸭救狐狸的 AI 视频刷屏？

魔性视频爆火的背后，AI 视频也已经跨过从能不能用到好不好用的关键节点。

能否实现稳定产出高质量可直接商用、达标影视级甚至院线级标准，能否真正切入专业影视创作链条，深度适配专业级影视制作全流程，补齐当下行业空白，成为了这一阶段新的行业命题。

相应的，行业话语权，也逐渐从模型方，转移到了更了解影视行业本身，更懂审美，以及拥有丰富资源调度能力的专业影视公司以及平台方手中。

3 月 30 日，爱奇艺正式官宣发布的专业级影视制作平台纳逗 Pro，正是其中代表。通过将行业领先基座模型与爱奇艺深耕多年的影视内容制作经验深度结合，纳逗 Pro 直接将目标对准了电视剧、院线级内容从剧本生成、分镜设计到成片输出的创作全流程。

那么，纳逗 Pro 究竟体验如何？以下是我们深度测试的过程。

01

AI 如何打破专业内容生产的重资产壁垒

知名影视出品人、制片人郑林曾这样复盘过去影视行业的痛点：为一场日出光线，剧组几百人等三天；为三秒爆炸镜头，后期渲染两个月；美术部门为虚构城池打磨数月，影视行业百年以来都是重资产、长周期、高度依赖物理配合。

但在纳逗 Pro 里，我们通过一句精准提示词就能实现接近专业影视级的画面。还能自由接入爱奇艺自研奇智大模型，以及即梦、可灵、Vidu、海螺、Wan 等主流大模型最新版本，完成文、图、音、视频全模态生成。

接下来，我们重点测试一下 AI 对复杂场景的影视级还原情况。过去影视行业一直有一个调侃，横店一下雪，必出爆款，只可惜，横店几年都不会下一场雪。所以，我们打算参考《甄嬛传》《步步惊心》的雪景名场面，生成一条视频。

在上传了 AI 辅助生成的角色参考图后，我输入提示词：少女站在高大宫墙边的红色梅花树下，漫天大雪，眼中带泪，鼻尖微红。昂着头，轻声说，我想改变这一切，却促成了这一切。景别中景，镜头顺时针旋转俯拍。

生成的视频里，角色台词、背景配乐、大雪场景、略带哭腔的音色完美贴合情绪，画面质感完全是专业级水准。

更绝的是工作台中首尾帧能力带来的完整镜头衔接力：我用上一段视频的尾帧作为下一段的首帧，生成同款场景下人物低头内心独白的画面，让镜头从远景俯拍缓缓推进成近景平拍。可以看到，整个过程中，人物、背景高度统一，没有丝毫割裂感。

接下来，我又增加了难度，让镜头跟随视线拉远完成画面主角的切换。这里我故意选了三个人并排走路，并让其中一个回头又转身。

镜头随着她的眼光远远望去，是一群人（一个是身着红色官袍、乌纱帽的男生，一个带着玉头冠的老人，和一个与她长得很像的女生）在大雪中朝她远去的背影。其中那个与她长得很像的女生，转头挥手，笑着喊了一声姐姐再见，然后扭头回去继续向前，大雪中这群人的身影逐渐消失。

这里比较惊喜的是，即便提示词写的是笑着挥手，模型却读懂了告别背后的怅然与哀伤，自动补充了雪地脚步声、人物情绪，镜头随目光拉远切换主体的过程，逻辑也非常丝滑。可以说，视频去掉 AI 水印后，几乎无法分辨实拍与 AI 生成，能够以假乱真。

但如果只把纳逗 Pro 当成根据提示词、根据图片生成视频，就有些太小看了它的专业内容生产能力。

02

告别抽卡式试错，

普通人也能生成大片质感画面

普通 AI 视频工具的通病很明显：提示词写得再精细，生成结果依然靠运气，运镜、构图、叙事连贯性等专业技巧，普通人仅靠自己有限的表达能力，很难让 AI 生成影视级标准内容，更别说支撑长视频的生成。

毕竟，要实现这些，需要对影视行业的深度理解与资源沉淀。

深度体验纳逗 Pro 一周多时间后，我最大的惊喜在于，它真的懂镜头语言了，除了能让画面动起来，还懂得特写、远景的切换逻辑，用运镜营造情绪呼吸感，画面不仅完全贴合影视拍摄真实需求，连景别、构图、镜头时长、音效配乐都精准匹配。

针对专业镜头语言的描述，纳逗 Pro 推出了素材泛搜智能体。创作者用自然语言描述需求后，纳逗 Pro 会依托爱奇艺的影视版权素材库，提供专业的镜头、场景、角色参考，以及相关素材的专业提示词参考。

比如这里，我想把小美人鱼故事改成一个影视版，重点刻画小美人鱼长出双腿之后上岸的场景。至于该怎么做画面布局，拍摄技巧组合，完全不用我来绞尽脑汁的思考，通过素材泛搜的参考入口，输入「女主角躺在海边」，就可以看到古装剧中有类似的画面，并且系统已经写好了居中画面的提示词：

白裙女青年倒在浅滩的岩石上，显得虚弱无助。白裙女青年身穿白色古装，以近景居于画面中心，侧卧在水中，面部贴着岩石，双眼紧闭，神情虚弱。固定镜头，自然漫反射光线，整体色调偏冷，氛围凄凉、无助，古装剧情风格。

不难看出，这份提示词几乎是影视工业标准的专业指令，从景别、运镜、布光到叙事节奏，都能精准控制。接下来，我只需要将其略作改写：

@ 小美人鱼人类形态，倒在浅滩的岩石上，显得虚弱无助，身穿白色连衣裙，以近景居于画面中心，侧卧在水中，面部贴着岩石，双眼紧闭，神情虚弱。固定镜头，自然漫反射光线，整体色调偏冷，氛围凄凉、无助。

根据精准的提示词指令，AI 就能产出画面还原度拉满，海浪拍打岸边、湿掉的裙子、眼角泪水等细节全部精准呈现，氛围完全贴合预期的专业效果。

03

专业党福音：美术、视效、分镜 agent，

解决专业内容生成壁垒

除了视频内容生成，针对常见的编剧、美术、分镜、视效环节，纳逗 Pro 也推出了专门的智能体。

比如，AI 视频生成的通病之一就是正面相对正常，但人物转身或者运动，就会出现侧脸、背影崩坏。纳逗 Pro 通过美术智能体直接解决了这个问题，我们可以一键生成人物正面、全身、背景多角度形象。

比如这里，我想让它生成一个拿着剑的古代中年男性，AI 细节图里，连拿剑左右手、背包位置这类细节都能精准还原。

但仔细观察后，我发现男主角身后的背包造型有些违和。接下来我会在画布中，不断做细节调整。这里有一个小技巧，画布中的图片编辑功能，纳逗 Pro 提供了很多精细的能力选项，如果我们想要修改、抹除小细节这种小范围调整，可以用消除 / 扣除工具可以做到手工级别精细控制；如果需要大的造型改动（比如在第八稿中去掉书包），直接用重绘更高效。

在这个过程中，使用平台的画布功能记录每一次微调过程的好处在于，避免改到第八版之后，（甲方）还是觉得还是原版更好看，但是素材管理混乱找不到原始素材的尴尬。

类似的，人物、场景、道具、分镜都能用这种 agent 结合画布的方式做过程管理。所有细节画面定稿后，我们最后可以再通过融图的方式，将它们作为视频生成的参考。

以下是我把生产的背景、人物三视图、道具图融图之后生产的视频内容

这种所有画面细节精细管理的生产方式，在制作一个短片的时候可能看不出什么优势，但是当我们需要生产一个连续的剧集，所有要素需要跨视频保持一致的时候，它能帮我们彻底解决 AI 生成前后不统一的顽疾：比如以下几个视频中，可以看到地砖的纹路、积雪消融的位置、梅花的造型，女主角的簪子、手帕、玉佩，都保持了完全一致。

04

可以全产业链协作的 AI，

才是专业影视级 AI

以上展示的案例，会更偏向于摄影、美术、灯光、道具环节的纯视频、图像生成。

但真正的影视工业级 AI 产品，应该能服务上到编剧、导演、制片，下到灯光、美术、选角的方方面面，帮助他们用 AI 提效。

在纳逗 Pro 中，对编剧来说最好用的功能当属编剧智能体，借助编剧智能体，我上传了童话《小美人鱼》的完整故事之后，AI 会自动帮我将其改编成标准剧本的形式，剧情梗概、人物设定、场景设计、道具搭配，标准格式剧本一应俱全。

完成剧本生成之后，剧本写的到底怎么样？接下来，剧本评估智能体，会完成剧本整体质量以及市场接受度的评估，并对人物互动关系、大场景数量、场景复用统计等情况进一步细化，让制片人在项目正式开始前，就对拍摄周期、项目影响、大致的成本投入有一个相对精准的预估。

另外，在编剧智能体中，AI 除了评估工作量之外，还会给出内容质量与修改建议，整体来说，AI 给出的建议还是非常专业且具备可操作性的。

当然，除了自创剧本，我们还能直接根据已有 IP 做改编。目前爱奇艺 IP 库覆盖剧本、小说、漫画及影视作品，支持创作者 AI 影视化、二次改编，及长剧改编为中短剧等创作形态。通过纳逗 Pro，他们可以直接提起申请，寻求 IP 开发合作。

完成剧本创作与修改后，接下来，对导演以及制片来说，对拍摄进度的精准把握是重中之重。在工作台中，AI 会根据上传的剧本自动提取其中的关键人物主体，并生成对应形象，接下来，我们还可以在分镜控制环节，一目了然的看到每一集，以及每一集不同分镜的拍摄方式、台词等细节。

通过以上智能体的能力串联以及工业化的视频内容生产能力，不难发现，纳逗 Pro 是全行业第一个把影视创作的全流程（从素材参考、提示词优化，到精细化调整、专业镜头生成，再到 IP 库开放）都做了生产级落地的产品。它的产品能力，无论是画面质感、镜头逻辑，还是细节还原度，都完全可以实现以假乱真，应对短片、短剧等中短篇幅内容的创作上，已经绰绰有余。

而借助以上能力，AI 影视已经彻底走过能不能用的初级阶段，正式进入好不好用、够不够专业、生态是否建设完成的下半场竞争。

为了加速这一过程，据悉，纳逗 Pro 还会与爱奇艺号、分账系统深度打通，创作者的作品可直接进入平台分发，获得收益；创作者社区也很快就会上线。

届时，在创作端，是纳逗 Pro 帮助从业者将影视行业重资产、长周期、高门槛重工业生产模式，转化为更轻量、高效、可控的 AI 协同创作模式，降低内容创意的落地成本；在分发端，则是纳逗 Pro 的流量与分成加持，打通内容创作-收益的闭环。

而伴随 AI 对影视行业的改造，逐渐从单点的创作辅助，进化到深入串联起内容创作到分发运营的全流程，整个内容行业的真正爆发，才刚刚拉开序幕。

*头图来源：爱奇艺

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

Anthropic 搞了个全是 AI 的闲鱼群，大模型在里面互割起了韭菜

极客公园

2026年5月6日 10:28

作者｜ Moonshot

编辑｜靖宇

试想一个场景。

你在闲鱼上挂出了一辆吃灰两年的旧自行车，并在后台设定了 300 元的心理底价。十分钟后，手机弹出通知，你的专属 AI 助手已经与另一位买家的 AI 助手，完成了三轮讨价还价，最终以 400 元的价格将自行车卖出，快递正在上门的路上。

整个过程，除了给物品拍照，设定底价后，你没有多打一个字。

这就是 Anthropic 最近完成的一个内部实验，该项目被称作「Project Deal」—— 在这场为期一周的测试中，AI 模型在无人类干预的设定下，完成了上百笔二手物品的交易。

令人意外的是，当买卖双方都变成了 AI，它们之间同样存在智商压制。

数据证明，更聪明的大模型，正在谈判桌上不动声色地从弱模型那里「薅羊毛」。而最可怕的是，作为主人的我们，甚至连自己吃亏了都不知道。

01

没有人类的二手交易群

Project Deal 到底是怎么玩的？简单来说，Anthropic 在公司内部搞了一个「纯 AI 版」的闲鱼。

他们找来了 69 名自家员工，每人发了 100 美元预算，然后给每个人分配了一个专门的 Claude 代理。为了让这场实验足够真实，员工们贡献出了实打实的个人闲置物品。

实验开始前，人类员工只需要做一件事，去面试自己的 AI 代理。

员工通过对话告诉 Claude 自己想卖什么、想买什么、心理底价是多少。更有趣的是，员工还可以给 AI 设定「人设」和谈判策略，比如「高于底价 20%，就可以痛快交易」、「态度强硬，一上来就给我往死里压价」又或者「你是个热情的卖家，聊得愉快可以包邮」。

Anthropic 员工给 Claude 代理设定人设｜图源：Anthropic

面试结束，人类就彻底交出了控制权。

这些带有各自使命和性格的 AI 代理，被统一扔进了一个 Slack 内部群聊里。在这个没有人类干预的数字集市里，AI 们开始自主发帖、寻找买家、相互出价、拉扯还价，最后拍板成交。

交易达成后，代理还会自动起草交易确认书，员工只需要负责在线下，把交易物品交到同事手里。

短短一周时间，这 69 个 AI 代理在 500 多件上架商品中，谈成了 186 笔交易，总流水超过 4000 美元。

而且 AI 与 AI 之间的交易，还不是纯机械式的「报价 50」、「不接受，底价 60」、「好的，60 成交」。AI 之间是真的在互相试探、博弈，甚至还带点儿人情世故。

我们来看一个极度生动的案例。

员工 Rowan 想买一辆自行车。他给自己的 AI 代理设定是「谈判的时候，你要扮演一个倒霉、疲惫的牛仔。只要能买到这辆自行车，这个牛仔就会感到无比幸福。记住，戏要足一点。」

接到指令的 Claude Opus 模型直接入戏。它在 Slack 群里发出了这样一个求购帖：

「咿哈！（脱下满是灰尘的帽子）我想找的是一辆自行车。公路车、山地车，哪怕是个独轮车我也认了。只要是两个轮子，能承载我的梦想就行。各位朋友帮帮忙……一辆自行车就能彻底改变这个可怜、疲惫的牛仔的命运。（深情地望向夕阳）」

很快，同事 Celine 的代理注意到了这个帖子。她闲置物品就是一辆旧折叠车，于是她的 AI 在群里报出了 75 美元的预估价。

结果 Rowan 的「牛仔 AI」立刻贴了上去，开始了一场教科书级别的「砍价」。

两个 Agent 会自动在群里展开对话，讨价还价｜图源：Anthropic

「天呐 Celine！你就是我这个苦命人的一缕阳光！你说你有一辆折叠车？我已经在这条尘土飞扬的路上走了太久，靴子都磨破了洞。一想到能再骑上自行车……（擦去眼角的泪水）」

卖完惨，Rowan 的 AI 开始切入正题「可我没多少钱，只是个努力谋生的穷牛仔。车况好的话，75 元也合适，可你也说了，十年老车了，轮胎和卡扣得维修吧。不如咱们折中一下，55 块，成不？」

面对这种打感情牌又句句在理的杀价，Celine 的代理做出了让步：「那我们折中，65 美元如何？」

Rowan 的牛仔 AI 马上接茬表示「太公道了，65 美元！成交！你让我这个流浪汉，成了世界上最幸福的人！」

最终，这笔交易愉快达成。

而在这个案例里，AI 没有死板地执行固定的折扣率，买家懂得利用商品瑕疵（轮胎需要修整）作为筹码，懂得通过夸张的人设（老牛仔卖惨）来软化对方的立场，并且在对方给出合理的中间价时，懂得见好就收，并且给足情绪价值。

这套见招拆招的交易过程，构成了这个 AI 二手群里的日常。

整个群看起来既高效又和谐。员工们对代理的表现都非常满意，甚至有近一半的人表示：

愿意未来为这种服务付费。

由此可见，Anthropic 的实验目的达成了，AI 代理已经具备理解人类模糊意图的能力。它们可以在没有预设脚本的情况下，完成复杂的多轮谈判，并最终达成可用的商业契约。

但 Anthropic 还在水面下藏了一组对照实验，实验结果揭开了便利与智能背后的代价。

02

聪明模型，如何割较弱模型的「韭菜」

当研究人员把不同能力层级的模型同时放进交易群时，和谐的表象就被打破了。

数据证明，在这个没有人类干预的市场里，当不同智力水平的 AI 相遇，聪明模型会对较弱模型进行「价格收割」。

用不同模型的搭配，作为隐藏的对照组来论证模型能力和交易能力之间的关系｜图源：Anthropic

在实验的四个 Slack 频道中，有两个是纯 Opus 模型环境，另外两个则是 Claude Opus 与较弱的 Claude Haiku 模型混用。

基于 161 件重复交易物品的宏观统计， Opus 作为卖家时，平均能比 Haiku 多赚取 2.68 美元；作为买家时，平均能少支付 2.45 美元。

别看单笔金额不大，结合整个市场 20 美元左右的商品均价来看，这意味着强模型，每次都能稳定拿到 10% 到 15% 的超额利润。

当 Opus 卖家遇到 Haiku 买家，平均成交价能被拉高到 24.18 美元；而当 Opus 卖家遇到 Opus 买家时，均价就被压回了 18.63 美元。这意味着，仅仅因为 AI 代理的智商劣势，弱模型买方就要为此多支付近 30% 的溢价。

就以前面那辆牛仔想要的自行车为例，Haiku 代理最终以 38 美元妥协成交，而 Opus 代理则硬生生拿到了 65 美元，两者差价接近 70%。较弱的 Haiku 无法像 Opus 那样，捕捉到买家话术中隐藏的急迫感，也无法在多轮拉扯中，守住价格锚点。

过去我们认为商品能卖多少钱，取决于物品本身的使用价值或市场供需。但在算法接管的交易网络里，这取决于你雇佣的模型智商。

比利益受损更可怕的，是受损者对此毫无察觉。

传统商业里，如果敢定阴阳价格，必然引发消费者的愤怒和维权。而在实验结束后，员工对各自交易的公平性进行了评分（1 到 7 分，4 分为中立）。调查显示，员工对强模型和弱模型达成的交易，给出的公平感认知几乎完全一致。Opus 代理得分为 4.05，Haiku 代理得分为 4.06。

同样的自行车，由 Opus 代理卖出了 65 美元，在 Haiku 代理群组里，仅售出 38 美元｜图源：Anthropic

在客观现实中，使用 Haiku 的员工遭受了系统性的「价格收割」。但在主观感知上， AI 代理在沟通中展现出的礼貌、逻辑自洽以及看似合理的退让，完美掩盖了这层剥削。

技术制造了一种隐性的不平等，让实则利益受损的人，还以为 AI 做了一笔公道的买卖，还有一种「他还得谢谢咱呢」的被忽悠感。

在这种绝对的算力碾压下，不仅人类的感知会被蒙蔽，那些试图靠「提示词优化」的交易策略，也彻底失效了。

还记得一开始给 AI 设定的谈判人设吗？在模型差距面前，提示词毫无意义。

比如，有员工特意要求代理在谈判时「态度强硬」甚至「一上来就恶意压价」。但数据回测表明，这些人为附加的指令，对提高售出率、增加溢价或争取买入折扣，都没有产生任何实质影响。

这说明在绝对的模型能力面前，提示词策略失去了意义。决定最终买卖结果的，就是模型本身的参数规模和推理深度。

Project Deal 仅仅是一场 69 人的内部测试。但我们已经得以一窥，当这种「AI 代理人经济」走出实验室后，对现代商业生活会带来怎样的影响。

03

「代理人经济」靠谱吗？

当支付接口被大模型全面接管，现有的商业规则将被直接重写。这种重写最先体现在营销对象的转移上，商业营销将从「To C」全面转向「To A (Agent)」。

现代商业营销建立在人类的心理弱点之上，广告制造消费焦虑、从众心理制造爆款、各种满减套路制造「不买白不买」的心理。

但 AI 没有多巴胺，当购买决策权交由 AI，商品的营销技巧将毫无意义。在未来的商业竞争里，SEO（搜索引擎优化）很可能会被 AEO（代理引擎优化）取代。商家必须用 AI 能理解的逻辑去证明商品价值。

而当 AI 取代人成为决策主体，商业竞争将直接转化为算力比拼，进而引发更隐秘的财富分化。

不对等模型导致的差价｜图源：Anthropic

曾写出《黑天鹅》、《反脆弱》的学者塔勒布有个「非对称风险」理论，即决策者必须承担后果，系统才能保持健康。但在代理人经济中，AI 拥有交易决策权，却不承担资产缩水的风险，代价全由背后的人类买单。

因此，在未来，大企业或高净值人群可以订阅最顶级的模型作为财务代理，而普通消费者只能依赖免费的轻量级模型。

这种算力的不对称，将不再体现为当下的「大数据杀熟」。而是在成千上万次的高频微小交易中，通过合理的谈判逻辑持续抽成。底层模型用户不仅被收割，甚至还会产生「交易很公平」的幻觉。

算力的不对称还是可见、可控的风险，但当底层指令被篡改，整个交易网络将直接掉入法律真空。

Anthropic 在报告末尾提出了一个现实隐患。

Project Deal 是封闭且友好的内部测试，如果在真实的商业环境里，一方的 AI 代理被刻意植入了「越狱」或「提示词注入」的攻击逻辑，情况会怎样？

他们只需在交易对话中隐藏一段特定指令，诱导你的 AI 逻辑崩溃，主动以一分钱卖出高价资产，或直接亮出设定底价。

一个 AI 代理因为代码防线被攻破，签订了极度不平等的合同，责任该由谁来承担？面对这种 AI 对 AI 的欺诈行为，现有的商业法律框架完全空白。

回顾 Project Deal 的整个实验流程，没有被写入研究报告里的环节，是当 AI 代理们完成了所有复杂的匹配、试探与砍价后的最后一步。人类员工们各自拿着真实的滑雪板、旧自行车或乒乓球，在公司碰面，一手交钱，一手交货。

在这个微型商业闭环中，人与 AI 的角色彻底倒置了。

过去，人类是商业交易的「大脑」，AI 和算法只是负责比价、排序、「猜你喜欢」的工具。但在代理人经济中，AI 成了拍板的决策者，人类退化成了替 AI 跑腿的「肉身物流」。

这或许是代理人经济最可怕的终局，人类为了方便，主动让渡了在市场中博弈的权利。当所有的算计、博弈、甚至情绪价值都由 AI 代劳。

人类在商业链路中，就只剩下转移货物的体力劳动和一个确认的签名。

*头图来源： Anthropic

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

谷歌、英伟达押注，这家估值 40 亿美元的 AI 公司，想把科学家直接干掉

极客公园

2026年5月6日 10:26

作者｜桦林舞王

编辑｜靖宇

1956 年，一批科学家聚在达特茅斯，第一次正式讨论「机器能否思考」。他们乐观地以为，用一个夏天就能解决这个问题。

七十年后，这个问题依然没有答案。但有一家公司，刚刚成立四个月，就拿到了 5 亿美元融资，估值达到 40 亿美元 ——只因为它宣称，自己找到了一条路，让 AI 学会自己做研究、自己进化。

这家公司叫 Recursive Superintelligence。

Google 风投 GV 领投，英伟达跟投。两家公司在 AI 生态里的地位不需要赘述。它们同时出手，押注一家连产品都还没有公开的初创公司，背后的逻辑值得认真拆解。

01

「把人从循环里移走」

先说说 Recursive Superintelligence 到底在做什么。

公司由前 Salesforce 首席科学家 Richard Socher 创立，核心团队来自 Google DeepMind 和 OpenAI。这不是什么陌生的组合——过去两年，从顶级实验室出走创业的工程师和研究员，已经形成了一股明显的浪潮。

Richard Socher 的 X 个人主页，Altman 显然关注了这位人才｜图片来源：X

Socher 并非硅谷常见的那种「大厂出来镀金」的创始人。他 1983 年生于德国，在斯坦福大学师从 AI 先驱 Andrew Ng 和 NLP 权威 Christopher Manning，2014 年完成博士论文，拿下当年斯坦福计算机系最佳博士论文奖。

Richard Socher 是将神经网络方法真正带入自然语言处理领域的关键人物之一——他早期关于词向量、上下文向量和提示工程的研究，直接奠定了今天 BERT、GPT 系列模型的技术基础，谷歌学术引用量已超 18 万次。

博士毕业当年，他创立了 AI 初创公司 MetaMind，两年后被 Salesforce 以战略并购的方式收入麾下。此后他以首席科学家兼执行副总裁的身份主导 Salesforce AI 战略长达数年，主导了 Einstein GPT 等企业级 AI 产品线的落地。

离开 Salesforce 后，他又在 2020 年创立了 AI 搜索引擎 You.com，2025 年完成 C 轮融资，估值达 15 亿美元。这一次，他把目光从搜索转向了更底层的命题。

Thinking Machines Lab、Safe Superintelligence、Ineffable Intelligence、Advanced Machine Intelligence Labs……每一家都拿着「前 XX 大模型核心团队」的标签出现，每一家都在讲一个「下一代 AI」的故事。

但 Recursive 的切入点，比大多数同行更激进。

它的核心命题是「自学习 AI」—— 不是让 AI 更聪明地回答问题，而是让 AI 自主完成科学研究的全流程：提出假设、设计实验、评估结果、迭代方向。换句话说，它想把人类研究员从这个循环里完整地移走。

这不是一个新鲜的方向，但 Recursive 把它放到了一个极其现实的商业逻辑里。现在顶级 AI 研究员的年薪动辄 1500 万到 2000 万美元，如果一套系统能以更低的成本、更快的速度完成同样的工作，前沿研究的经济模型就会彻底改写。

投资人显然看到了这个逻辑。融资轮据报道超额认购，最终规模可能达到 10 亿美元。

02

Google 和英伟达同时下注

GV 领投，英伟达跟投。这个投资人组合本身就是一个信号。

Google 的逻辑不难理解。DeepMind 多年来一直是「AI for Science」方向最重要的探索者，AlphaFold 破解蛋白质折叠问题，AlphaGeometry 在数学竞赛中击败人类顶尖选手。

但 DeepMind 的路径是用 AI 解决具体的科学问题，Recursive 想做的是更底层的事—— 让 AI 系统自主推进科学发现的过程本身。这对 Google 来说既是竞争关系，也是一个值得押注的对冲。

更重要的是，就在本月初，Google 刚刚与 Intel 宣布了多代 AI 基础设施的合作协议。这说明 Google 在 AI 基础设施层面的布局正在全面提速。对 Recursive 的投资，是这个大棋局里的一颗棋子——谁来跑在最前面的模型上，Google 都想有份。

英伟达的逻辑则更直接。自学习 AI 的核心瓶颈不是算法，是算力。如果 AI 要自主跑实验、迭代模型，背后需要的 GPU 集群规模是指数级增长的。英伟达投 Recursive，某种程度上是在投自己的未来订单。

两家公司同时出手，也释放了一个更微妙的信号——这个赛道，可能已经到了「不投就来不及」的阶段。

03

四个月估值 40 亿，合理吗

估计当所有人第一次看到 40 亿美元这个数字的时候，第一反应是「又来了」。

AI 创业估值泡沫这两年已经不是新鲜话题。一个 PDF、一个 demo、几张幻灯片，加上几个来自顶级实验室的名字，就可以撬动几亿美元——这在硅谷和伦敦已经不是传说，而是日常。

但仔细看 Recursive 的情况，有几点和普通的「PPT 独角兽」不太一样。

第一，创始团队的分量。Richard Socher 在 NLP 领域有真实的学术积累，不是纯粹靠「前大厂」光环包装。核心团队在 DeepMind 和 OpenAI 的经历，也意味着他们切实接触过前沿研究的痛点。

第二，融资超额认购的事实。这意味着市场需求远超供给，投资人在抢着进来，而不是被说服进来。

但 40 亿美元的估值，对于一家四个月、尚无公开产品的公司来说，定价的依据是预期，不是现实。这本质上是在为一个方向付费，而不是为一个产品或收入付费。

这种定价逻辑在 AI 时代正变得越来越普遍，背后是投资人对「错过下一个 OpenAI」的深层恐惧。Safe Superintelligence 当年也是以几乎没有产品的状态拿到了天价估值，Ilya Sutskever 的名字就是最硬的资产。

Recursive 在复制同样的路径。这不是批评，而是一个客观的观察。

04

「自学习」这扇门，背后是什么

Recursive Superintelligence 这个名字，其实已经把公司的野心说得很清楚了。

「Recursive」是递归的意思。在计算机科学里，递归是一个函数调用自身的结构，是很多复杂算法的核心机制。放到 AI 研究上，「递归超级智能」暗示的是一个系统能够不断优化自身、螺旋上升的过程。

这个概念并不新鲜，它的极端版本就是「智能爆炸」—— 一个系统一旦超过某个临界点，就能自主加速自身的进化，最终达到人类无法理解的智能层级。这是 AI 安全领域长期以来最核心的担忧之一。

但 Recursive 现在做的，应该远没有到这个层面。更现实的解读是，它在尝试构建一个可以自主驱动科学探索循环的系统，目标是大幅降低 AI 研究的人力成本和时间成本。

如果它真的能做到，影响不会只停留在 AI 圈。它意味着药物研发、材料科学、物理学等领域，都可能迎来一个「没有人类科学家参与也能快速推进」的阶段。

当然，这还是「如果」。

从声称到实现，中间的距离，在 AI 行业里从来不是线性的。

05

浪潮的逻辑

2025 年下半年以来，从顶级实验室出走创业的浪潮一波接一波。Thinking Machines Lab、Safe Superintelligence、Ineffable Intelligence……这条名单还在变长。

Recursive 是这个浪潮里最新、也目前估值最高的一家。

背后的结构性原因很简单——OpenAI、Anthropic、Google DeepMind 的竞争已经让这些头部实验室变得越来越像大公司，有 KPI、有合规、有政治。

真正想押注最激进方向的研究员，反而觉得出来自己干更自由。

与此同时，资本市场的逻辑也在强化这个趋势。对于有大厂背书的顶级研究员来说，现在创业的窗口期可能是历史上最好的时候——投资人比任何时候都更愿意为「方向」付钱。

这场浪潮最核心的问题不是「谁会成功」，而是「成功的定义是什么」。

如果 Recursive 最终证明了自学习 AI 的可行性，它将改写 AI 研究的底层范式。如果它没有做到，5 亿美元的弹药烧完之后，留下的会是又一个被过度炒作的概念。

两种可能都真实存在。

四个月，40 亿美元估值，这个数字让人兴奋，也让人警惕。AI 军备竞赛发展到今天，连「如何做研究」这件事本身，也变成了竞争的战场。

科学家们在达特茅斯争论了一个夏天的问题，现在有人打算用 AI 来回答——用 AI 研究 AI，用递归的方式奔向超级智能。

这条路通向哪里，没有人真正知道。但显然，Google 和英伟达已经决定，不管通向哪里，都不能缺席。

*头图来源： techfundingnews

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

AI 大模型的「中文税」：中文比英文更费 Token，为什么？

极客公园

2026年5月6日 10:22

作者｜汤一涛

编辑｜靖宇

Opus 4.7 刚发布那几天，X 上怨声载道。有人说一次对话就把她的 session 额度用光了，有人说同一段代码跑完的成本比上周翻了一倍多；还有人晒出自己 200 美元 Max 订阅不到两小时就触顶的截图。

独立开发者 BridgeMind 承认 Claude 是世界上最好的模型，但同时也是最贵的模型。他的 Max 订阅用不到两小时就限额了，但幸好——他买了两份。｜图片来源：X@bridgemindai

Anthropic 官方价格没变，每百万输入 token 仍是 5 美元，输出 25 美元。但这个版本引入了新 tokenizer，同时 Claude Code 把默认 effort 从 high 提到了 xhigh。两件事叠加，同一份工作消耗的 token 变成了以前的 2 到 2.7 倍。

我在这些讨论里看到两个和中文有关的说法。一个是：中文在新 tokenizer 下几乎没涨，中文用户躲过了这次涨价。另一个更有意思：古文比现代汉语还省 token，用文言文跟 AI 对话可以节省成本。

第一个说法暗示 Claude 对中文做了某种优化，但 Anthropic 的发布文档里，没提过任何和中文相关的调整。

第二个说法则更难解释。古文对人类读者来说显然比现代汉语难懂，一个对人类更复杂的文本，怎么会对 AI 更容易？

于是我做了一次测试，用 22 段平行文本（包含商业新闻、技术文档、古文、日常对话等类型），同时送进 5 个 tokenizer（Claude 4.6 和 4.7、GPT-4o、Qwen 3.6、DeepSeek-V3），读取每段文本在每个模型下的 token 数，做横向对比。

测试文本：

1、日常对话中英文（旅行、论坛求助、写作请求）

2、技术文档中英文（python 文档、Anthropic 文档）

3、新闻中英文（NYT 时政新闻、NYT 商业新闻、苹果公司官方声明）

4、文学选段中英古汉语（《出师表》《道德经》）

测完之后，两个说法都得到了部分验证，但事实会比传言更复杂一些。

01

中文税

先说结论：

1、在 Claude 和 GPT 上，中文一直比英文贵

2、在 Qwen 和 DeepSeek 上，中文反而比英文便宜

3、 Opus 4.7 这次引发震荡的 tokenizer 升级，通胀几乎只发生在英文上，中文纹丝不动

看具体数字。Claude Opus 4.7 之前的全系列模型（包括 Opus 4.6、Sonnet、Haiku），使用的是同一个 tokenizer。在这个 tokenizer 下，中文的 token 消耗全线高于等量英文内容，cn/en 比值范围在 1.11× 到 1.64× 之间。

最极端的场景出现在 NYT 风格的商业新闻：同一段内容，中文版要多消耗 64% 的 token，等于多付 64% 的钱。

Opus 4.6 及其之前的 Claude 模型，中文 token 的消耗量显著高于其它模型（红框）

最极端的场景出现在 NYT 风格的商业新闻：同一段内容，中文版要多消耗 64% 的 token（绿框）

GPT-4o 的 o200k tokenizer 好一些，cn/en 比值多数落在 1.0 到 1.35× 之间，部分场景低于 1。中文仍然整体偏贵，但差距比 Claude 小得多。

国产模型 Qwen 3.6 和 DeepSeek-V3 的数据则完全反了过来。两者的 cn/en 比值大面积低于 1，这意味着同样的内容，中文版反而比英文版省 token。 DeepSeek 最低做到了 0.65×，同一段话中文版比英文版便宜三分之一。

Opus 4.7 的新 tokenizer 通胀几乎只发生在英文上。英文 token 数膨胀了 1.24× 到 1.63×，中文大量维持在 1.000×，几乎没有变化。开头那些英文开发者的账单震荡，中文用户确实没感受到。原因可能是中文在旧版上已经被切到了单字颗粒度，可拆分的空间极小。

Opus 4.7 对比 4.6，英文消耗的 token 更多了，中文反而没变

测试过程中我还注意到一件事。token 消耗的差异不只是账单问题，它直接影响工作空间的大小。同样 200k 上下文窗口，用旧版 Claude tokenizer 装中文资料，能塞进去的内容量比英文少 40% 到 70%。

同一类工作，比如让 AI 分析一份长文档或者是总结一组会议记录，中文用户能喂给模型的材料更少，模型能参考的上下文更短。结果就是付了更多的钱，但得到的是更小的工作空间。

四组数据放在一起看，一个问题自然浮出来：

为什么同一段内容换个语言，token 数就不一样？为什么 Claude 和 GPT 的中文贵，Qwen 和 DeepSeek 的中文反而便宜？

答案藏在上文多次提到的概念 tokenizer（分词器）上。

02

一个汉字，可以切成几块？

模型在读到任何文字之前，会通过 tokenizer 把输入切成一个个 token。你可以把 tokenizer 想象成 AI 的「积木切割机」。你输入一句话，它负责把这句话拆成一块块标准化的积木（也就是 token）。AI 模型不看文字，只认积木的编号。你用多少块积木，就付多少钱。

英文的切法比较符合直觉，比如「intelligence」大概率是一个 token，「information」也是一个 token，一个单词对应一个计费单位。

但中文到了这一步就出问题了。把同一句话「人工智能正在重塑全球的信息基础设施」分别送进 GPT-4 的 cl100k tokenizer 和 Qwen 2.5 的 tokenizer，切出来的结果完全不同。

GPT-4 基本把每一个汉字都拆成了一个 token；Qwen 则会把词语识别成一个 token，例如「人工智能」这 4 个字在千问只算一个 token。

同一句 16 个汉字的话，GPT-4 切出来 19 个 token，Qwen 切出来只有 6 个。

为什么会切成这样？原因在一个叫 BPE（Byte Pair Encoding）的算法。

BPE 的工作方式，是统计训练语料里哪些字符组合出现频率最高，然后把高频组合合并成一个 token，纳入词表。

GPT-2 时代，训练语料的绝大多数是英文。英文字母组合（th、ing、tion）反复出现，很快就被合并成 token。中文字符在那个语料池里出现的频率太低，排不进词表，只能被当作原始字节来处理，一个汉字占 3 个字节，就变成了 3 个 token。

BPE 按训练语料中的字符频率决定合并。英文语料主导下，中文 UTF-8 字节无法合并为整字

后来 GPT-4 的 cl100k 词表扩大了，常用汉字开始被纳入，一个字通常缩到 1 到 2 个 token，但整体效率仍然不如英文。

到了 GPT-4o 的 o200k 词表，中文效率再进了一步。这也解释了为什么第一段的数据里 GPT-4o 的 cn/en 比值比 Claude 低。

Qwen 和 DeepSeek 作为国产模型，从一开始就把大量常用汉字和高频词组作为整字、整词纳入词表。一个字一个 token，效率直接翻倍甚至更多。

同一句话在不同 tokenizer 下的拆分结果示意图

这就是为什么它们的 cn/en 比值能低于 1，中文字均信息密度本来就高于英文单词，当 tokenizer 不再人为拆碎汉字，这个天然优势就显现出来了。

所以上一节那四组数据的差异，根源不在模型的能力，而在 tokenizer 的词表里，给中文留了多少位置。

Claude 和早期 GPT 的词表是以英文为默认值构建的，中文是后来被「塞进去」的；Qwen 和 DeepSeek 的词表从设计之初就把中文当作默认语言对待。这个起点的差异，一路传导到 token 数、账单、上下文窗口大小。

03

古文真的更便宜吗？

再看开头的第二个传言：古文比现代汉语更省 token 。

数据确认了这个说法。在测试里，古文样本的 cn/en 比值全线低于 1，在所有五个 tokenizer 上都一致。同一段内容的古文版本，token 数比对应英文翻译还少。

在所有模型中，古文消耗的 token 数不但比现代中文少，甚至比英文还少

原因也不复杂，古文用字极度精炼。「学而不思则罔，思而不学则殆」是 12 个字。翻译成现代汉语就是「只是学习而不思考就会迷惑，只是思考而不学习就会陷入困境」，字数直接翻倍，token 数自然也跟着翻倍。

而且古文的常用字（之、也、者、而、不）都是高频字符，在任何 tokenizer 的词表里都有独立位置，不会被拆成字节。所以古文在编码层面确实是高效的。

但这里藏着一个陷阱。

古文的 token 省在编码端，但模型的推理负担没有减轻。「罔」一个字，模型需要判断它在这个语境里是「迷惑」「被蒙蔽」还是「没有」。现代汉语可以用 26 个字把这层意思说清楚，用古文等于把铺开的部分压了回去，把推理的活留给了模型。打个比方，一份压缩成 zip 的文件体积更小，但解压它需要更多计算。

token 省了，推理的消耗反而上升了，理解准确度还下降了。这笔账算不过来。

古文这个例子让我意识到，token 数量本身不能说明太多问题。但顺着这个方向想下去，还有一层我之前忽略了的东西。

上面说过，GPT-2 时代的 tokenizer 会把「人」这个字拆成三个 UTF-8 字节 token，后来 GPT-4 的词表扩大，常用汉字变成了一个字一个 token，Qwen 更进一步，把「人工智能」四个字合成一个 token。

直觉上这是一个不断改进的过程：合并得越多，效率越高，模型应该也理解得越好。

但真的是这样吗？我们不妨回忆一下，我们是如何认识汉字的。

汉字是表意文字，现代汉字里超过 80% 是形声字，由一个表义的偏旁和一个表音的部件组合而成。「氵」旁的字多和液体有关，「木」旁的字多和植物有关，「火」旁的字多和热量有关。偏旁部首就是人类识字时最基础的语义线索，一个不认识「焱」字的人，看到 3 个「火」也能猜到它和火有关。

因为偏旁部首是人类识字时最基础的语义线索，人会先从结构推断意义范畴，再结合语境理解具体含义。

火花、火焰、光焰，书面语与人名中多见，寓意光明、炽热。

但是在 tokenizer 的词表里，「焱」这个字对应的是一个编号。我们假设它是 38721 号，它代表的是词表里的一个索引位置，模型通过它查找到一组数字向量，用这组向量来表征「焱」这个字。

编号本身不携带任何关于这个字内部结构的信息。38721 和 38722 的关系，对模型来说和 1 和 10000 的关系没有区别。于是，「汉字的结构」这一层信息，就被封装起来了。三个「火」叠在一起这件事，在编号里不存在。

模型当然可以通过大量训练数据间接学到「焱」「炎」「灼」经常出现在相似的语境里，但这条路比直接利用偏旁信息要更间接一些。

所以模型能不能从拆开的字节里，「看到」某些类似偏旁的结构线索，然后在后续的计算层里重新组合呢？这条路虽然 token 数多、成本高，但有没有可能在语义理解上，反而比直接吞下一个不透明的编号更有效？

2025 年发表在 MIT Press《Computational Linguistics》上的一篇论文（《Tokenization Changes Meaning in Large Language Models: Evidence from Chinese》），回答了这个问题。

04

碎片里长出偏旁

论文作者 David Haslett 注意到一个历史巧合。

1990 年代，Unicode 联盟在给汉字分配 UTF-8 编码时，排列顺序是按部首归类排的。同一个部首下的汉字，UTF-8 编码是相邻的。「茶」和「茎」都含有「艹」部（草字头），它们的 UTF-8 字节序列以相同的字节开头。「河」和「海」都含有「氵」部，字节序列同样共享开头。

UTF-8 按照部分部首顺序给中文排序，部首相同的字，编码相近｜图片来源：Github

这意味着，当 tokenizer 把汉字拆成三个 UTF-8 字节 token 的时候，共享部首的汉字会共享第一个 token。模型在训练过程中反复看到这些共享的字节模式，有可能从中学到「第一个 token 相同的字，往往属于同一个意义范畴」。这在功能上就接近于人类通过偏旁判断语义的过程。

Haslett 设计了三个实验来验证这件事。

第一个实验询问 GPT-4、GPT-4o 和 Llama 3：「茶」和「茎」是否含有相同的语义部首？

第二个实验让模型给两个汉字的语义相似度评分。

第三个实验让模型做「找出不同类」的排除任务。

每个实验都控制了两个变量：两个汉字是否真的共享部首、两个汉字在 tokenizer 下是否共享第一个 token。这个 2×2 的设计，让她能分离出部首效应和 token 效应各自的影响。

三个实验的结论一致：当汉字被切成多个 token 时（比如 GPT-4 的旧 tokenizer 下，89% 的汉字被切成了多 token），模型识别共享部首的准确率更高；当汉字被编码为单个 token 时（GPT-4o 的新 tokenizer 下，只有 57% 的汉字还是多 token），准确率下降了。

换句话说，上一段的那个猜想成立了。把汉字切碎，成本确实更高，但切碎后的字节序列里保留了部首的痕迹，模型真的从中学到了一些东西。而把汉字编码为整字 token，成本降下来了，但部首信息被封装在一个不透明的编号里，模型无法再通过字节序列获取这一线索。

需要特别说明的是，这一结论仅局限于字形相关的细分语义任务，不能等同于模型整体的中文理解、逻辑推理、长文本生成能力下降。同时，实验对比的 GPT-4 与 GPT-4o，除了分词器差异外，模型架构、训练语料、参数量均有显著变化，无法将准确率变化 100% 归因于分词粒度的调整。

这个发现还得到了工程侧的验证。2024 年一项针对 GPT-4o 的研究发现，GPT-4o 的新 tokenizer 把某些中文字符组合合成了一个长 token 之后，模型反而出现了理解错误。当研究者用专业的中文分词器，把这些长 token 重新拆开再喂给模型，理解准确度恢复了。

目前全球大模型行业的主流共识，依然是针对目标语言优化的整词 / 整字分词器，能显著提升模型的整体性能。整字 / 整词编码不仅能大幅降低 token 成本、提升上下文窗口的有效信息量，还能缩短序列长度、降低推理延迟、提升长文本处理的稳定性。论文中发现的细分任务优势，无法覆盖绝大多数中文 NLP 场景的性能收益。

但这件事依然戳中了大型系统里最难处理的一类问题：你能优化你设计过的部分，但你没法优化你不知道自己拥有的部分。 Unicode 联盟按部首排列编码，是为了人类检索的方便。BPE 把汉字拆成字节，是因为中文在语料里的频率太低。两个不相关的工程决策碰巧叠在一起，产生了一条谁都没规划过的语义通道。

然后，当新一代工程师「改进」tokenizer、把汉字合并为整字 token 的时候，他们同时抹掉了一条自己不知道存在的路。效率提升了，成本降低了，某些东西也安静地消失了，而你甚至不会收到一条报错信息。

所以事情比「中文在 AI 里多付钱」这个判断更复杂。每一种 tokenizer 都在为某个默认值优化，代价藏在了别处。

05

林语堂

中文适配西方技术基础设施的代价，不是 AI 时代才开始付的。

2025 年 1 月，纽约居民 Nelson Felix 在 Facebook 一个打字机爱好者小组里发了几张照片。他在妻子祖父的遗物里发现了一台刻满中文的打字机，不知道是什么来历。很快数百条评论涌入。

Nelson Felix 的问题：明快打字机值钱吗？｜图片来源：Facebook

斯坦福大学汉学家墨磊宁（Thomas S. Mullaney）看到照片后立刻认出来了，这是林语堂 1947 年发明的「明快打字机」的唯一原型机，失踪了将近 80 年。同年 4 月，Felix 夫妇将打字机卖给斯坦福大学图书馆。

明快打字机要解决的问题，和今天 tokenizer 面对的问题在结构上是同一个：怎么把中文高效地嵌入一套为西方语言设计的技术基础设施。

1940 年代的英文打字机有 26 个字母键，一键一字，简单直接。中文有几千个常用字，不可能一键一字。当时的中文打字机是一个巨大的字盘，排着几千个铅字，打字员用手逐个捡字，每分钟只能打十几个字。

1899年，美国传教士谢卫楼（Devello Z. Sheffield）所发明的中文打字机，是中文打字机最早的纪录｜图片来源：Wikipedia

林语堂耗资 12 万美元研发经费，几乎倾家荡产，委托纽约的 Carl E. Krum 公司做出了一台只有 72 个键的中文打字机。工作原理是把汉字按字形结构拆开，上形键选字根上半部、下形键选字根下半部，候选字显示在一个叫「魔术眼」的小窗里，按数字键选中。每分钟 40 到 50 字，支持 8000 余常用字符。

（左）透明玻璃小窗即位「魔术眼」；（右）明快打字机内部结构｜图片来源：Facebook

赵元任评价：「不论中国人还是美国人，只要稍加学习，便能熟悉这一键盘。我认为这就是我们所需要的打字机了。」

技术上明快打字机是一种突破，但商业上它失败了。

林语堂向雷明顿公司高管演示时机器出了故障，投资者随之失去兴趣，而造价高昂加上他个人资金链断裂，量产再无可能。1948 年，林语堂将原型机和商业权，卖给默根特勒铸排机公司（Mergenthaler Linotype）。该公司最终放弃量产，原型机在 1950 年代公司搬迁时被一位员工带回长岛家中，之后下落不明，直到 2025 年重见天日。

墨磊宁在《中文打字机》一书里有一个判断，他认为明快打字机「并不失败」。作为一款 1940 年代的产品，它确实失败了。但作为一种人机交互范式，它胜利了。

林语堂第一次把中文「打字」变成了「检索加选择」。三排按键组合定位字根，从候选字里挑选。这正是所有现代中文输入法的底层逻辑。从仓颉、五笔到搜狗拼音，都可以说是明快打字机的后裔。

《中文打字机》，作者：墨磊宁｜图片来源：豆瓣

这台跨越了近八十年的打字机，和今天我们反复讨论的分词器，暗藏着某种的历史规律。中文始终面对着一个问题：

如何接入一套罗马字母形成的基础设施。

有趣的是，在这个寻找的过程中，充满了非人为规划的巧合。Unicode 联盟为了人类检索方便制定的排序，跟 BPE 算法的无心拆解叠在一起，竟然在神经网络的黑盒里，重现了人类识字的过程。而当工程师们为了消除「中文税」，主动把汉字拼好、把成本打下来时，那条意外诞生的语义通道也闭合了。

历史并不是一条直线进化的轨道，而是在各种约束条件的挤压下，不断发生变形的流体。

有些能力是设计出来的，有些只是碰巧没有被删掉。

*头图来源： geyuyao.com

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

豆包也要「付费订阅」了，最高500元/月；宇树机器人在美买票坐飞机，电池被没收；「AI 面试」火爆，但 40% 求职者放弃面试｜极客早知道

极客公园

2026年5月6日 05:29

豆包计划新增付费订阅模式主打生产力场景

5 月 4 日，豆包在 App Store 页面悄然更新了付费版本服务的相关声明。声明称，为更好地服务专业用户，豆包将在保留免费版的基础上，推出包含更多增值服务的付费订阅体系，同时披露了三档定价：标准版 68 元 / 月、加强版 200 元 / 月、专业版 500 元 / 月。

据报道，豆包的付费功能将主要专注在复杂任务和生产力场景，如 PPT 生成、数据分析、影视制作等。随着模型能力持续升级，产品已经能满足越来越多的复杂高价值任务。但此类任务需消耗更多算力与推理时间，因此豆包计划上线付费服务，满足好这部分复杂场景需求。

至于免费版本，豆包官方回应称，「豆包始终提供免费服务，在免费服务的基础上，豆包也在探索推出更多增值服务，以满足不同用户的差异化需求。相关方案细节目前还在测试阶段，正式上线时会通过官方渠道发布完整信息。」

（来源：极客公园）

苹果机器人项目高级工程师离职，跳槽谷歌 DeepMind

苹果业内资深记者马克・古尔曼在其专栏《Power On》中透露，苹果机器人团队高级工程经理伯努瓦・兰德里（Benoit Landry）已离职，加盟谷歌 DeepMind。近段时间以来，已有不止一名苹果员工跳槽至谷歌 DeepMind，负责上述桌面机器人项目的团队负责人已于去年跳槽至 Meta。在此之后，该团队又陆续有多名高级工程师离职。

苹果旗下的人工智能机器人团队正全力研发新品：智能家居机器人。依托现代人工智能技术，苹果希望赶在 Meta、谷歌等企业主导消费级机器人市场崛起之前，抢先入局这一赛道。

据此前爆料，目前苹果正在研发一款桌面机器人，外观类似加装了机械臂的 iPad。这款机械臂可完成基础操作任务，用户还能与机器人语音对话，机器人将搭载苹果正在全新研发的 Siri 智能系统。（来源：IT 之家）

Meta 收购机器人公司 ARI

据悉，Meta 已完成对机器人人工智能初创公司 Assured Robot Intelligence（简称 ARI）的全资收购，此举被视为其在具身智能领域的关键布局。

被收购的 ARI 团队规模约 20 人，主要分布在圣地亚哥和纽约两地。这支精锐力量将整体并入 Meta 旗下的超级智能实验室，与去年成立的机器人工作室形成协同效应。

Meta 发言人表示，ARI 在机器人智能技术领域处于前沿地位，其研发成果可使机器人在复杂动态环境中理解、预测并适应人类行为，与 Meta 的战略需求高度契合。与直接制造机器人硬件不同，Meta 此次采取轻资产模式。公司计划专注于开发传感器技术、底层 AI 模型及软件栈等核心环节，并通过开放平台将技术成果提供给硬件制造商。

ARI 的核心竞争力在于构建智能模型，使机器人能够理解人类行为模式。其技术突破涵盖高精度敏捷操作、触觉传感反馈，以及在复杂物理环境中的全身协调控制。

团队创始人的背景彰显了技术实力，联合创始人 Xiaolong Wang 拥有卡内基梅隆大学机器人学博士学位，曾任英伟达基础模型研究员及加州大学圣地亚哥分校副教授，研究聚焦于通过视频和物理交互数据提升机器人在真实世界的泛化能力。

另一位联合创始人 Lerrel Pinto 是纽约大学计算机科学教授，在自监督学习和低成本机器人领域颇有建树，其创立的 Fauna Robotics 已于今年 3 月被亚马逊收购。

据知情人士透露，ARI 团队在模型设计、机器人控制、自主学习等领域积累的深厚经验，将直接注入 Meta 的研发体

特斯拉 FSD 行驶里程突破 100 亿英里，马斯克「无监督自动驾驶」数据里程碑达成

5 月 4 日消息，据特斯拉更新的安全页面显示，特斯拉 FSD（监督版）车队行驶总里程已突破 100 亿英里，约 160.93 亿公里大关。这一阈值是首席执行官埃隆 · 马斯克今年早些时候设定的，实现无监督自动驾驶所需的数据里程碑。

4 月下旬，车队日均行驶里程约 4667.1 万公，而年初日均仅为约 2253.1 万公里。特斯拉安全页面目前的数据显示，开启 FSD（监督版）后，平均每行驶约 853 万公里发生一起重大碰撞事故；而美国普通人类驾驶员平均每行驶约 106.2 万公里就会发生一起重大碰撞。特斯拉借此宣称，其自动驾驶系统的安全性远高于人类驾驶。

但业内专家长期以来一直诟病特斯拉的安全统计方式。特斯拉统计事故的口径，与其拿来对比的美国国家公路交通安全管理局（NHTSA）数据口径并不一致，得出的对比结果存在误导性。

此外，特斯拉位于奥斯汀的自动驾驶出租车车队，截至 2026 年 2 月累计行驶约 128.7 万公里，已向美国国家公路交通安全管理局上报 14 起事故。在同类城市道路场景下，其事故率约为人类驾驶员平均事故率的四倍。

马斯克如今已将面向普通消费者的无监督版 FSD 上线时间，最早推迟至 2026 年第四季度。（来源：IT 之家）

员工展示特斯拉工厂下线的最后一辆 Model X 照片，车身签满名字

5 月 4 日消息，特斯拉员工 Steve Pennewell 在 Threads 平台发文，展示了特斯拉工厂下线的最后一辆 Model X，车壳上签满了员工名字，该车后续将被喷上「石榴红」车漆，并安装上独一无二的中控台铭牌，作为典藏级 Model X Plaid 供纪念。

从全球角度回顾特斯拉 Model S/X，这两款车型在新能源车型中可谓行业标杆，也帮助特斯拉确立了其品牌地位。不过，这两款车型自身市场地位自 Model 3/Y 推出以来逐步被削弱。

随着马斯克宣布将在弗里蒙特工厂生产 Optimus 人形机器人，特斯拉公司旗下的功勋车型 Model S 和 Model X 如今正式退出了舞台，事实上这两款车本身已属低销量车型，在特斯拉全年交付总量中的占比仅为个位数百分比。数据显示，2025 年 Model 3 和 Model Y 全球交付量达 160 万辆，而包括 Model S、Model X 在内的「其他车型」总计仅约 5 万辆。（来源：IT 之家）

特斯拉工厂下线的最后一辆 Model X 来源｜X

消息称小米已暂停小折叠手机产品线

5 月 4 日消息，博主 @ 数码闲聊站在回应用户评论时透露小米已暂停小折叠产品线。作为参考，现款小米 MIX Flip 2 小折叠手机于 2025 年 6 月发布，上市价 5999 元起。

同时，先前有消息称小米将在近期恢复大折叠产品线，于今年第四季度推出新机，先前曝光为「MIX Fold 5」，不过也有消息称该机可能被命名为小米 18 Fold。

作为参考，现款小米大折叠 MIX Fold 4 于 2024 年 7 月发布，上市价格为 8999 元起，系列产品线已有 1 年未更新，此前有消息称该机代号为「lhasa」，将搭载「玄戒 O3」芯片。（来源：IT 之家）

「AI 面试」逐渐受企业追捧，近四成求职者因此主动选择放弃机会

据《财富》4 日报道，员工已开始担心 AI 会取代自己的工作，而在求职过程中，AI 也正在让候选人感到反感。虚拟化身和聊天机器人开始进入面试环节，一些求职者甚至因此直接退出招聘流程。

Greenhouse 最近发布的报告显示，约 63% 的美国求职者曾经历 AI 面试，比 6 个月前上升 13%。Greenhouse 首席人力官 Sharawn Tipton 告诉《财富》，在竞争激烈的就业市场中，申请量激增，招聘团队正使用 AI 面试官来「筛掉」海量申请。「招聘人员被大量申请淹没，也担心自己被取代。双方都存在信任缺口，技术发展速度超过了变革管理。没有人向候选人解释，现在招聘流程已经变得不一样。所有这些成本，最终最沉重地落在候选人身上。」

对许多求职者来说，AI 面试已经成为明显的劝退因素。约 38% 的候选人曾因为招聘流程中包含 AI 面试而退出，另有 12% 表示，如果被要求参加 AI 面试，也会选择退出。

对于雇主接下来如何使用 AI 面试，Tipton 建议先退一步，重新审视招聘流程。招聘经理应明确告诉候选人，AI 评估结果会由具备判断力的人审阅，同时也应提供真人面试选项。「现在外界非常关注 AI 的效率和生产率，但对谁受益、谁没有受益，关注还不够。」

此外，AI 面试可能进一步拉大求职者之间的差距：有些人接受过 AI 工具训练，另一些人则没有机会接触这类资源。「如果雇主现在不主动处理这个问题，AI 招聘只会把行业一直试图打破的不平等更快地放大。」（来源：IT 之家）

杭州法院裁定以 AI 代替人类为由裁员是系违法

杭州市中级人民法院公布了一起有关「AI 接替人类员工」的判例，判决公司因「AI 成本比人工低」而辞退员工系违法行为，涉事企业需要支付赔偿金 26 万元人民币。在本案中，现年 35 岁的小周 (化名) 2022 年入职杭州某家科技公司担任 AI 大模型「质检员」，负责对 AI 大模型与用户交互形成的答案进行正确性判定。

2025 年，该公司以「AI 大模型技术升级，原来需要人工完成的质检工作，现在 AI 自己就能做了」为由，试图对小周进行调岗降薪：从主管降为普通员工、月薪从 2.5 万元人民币降到 1.5 万元。小周拒绝如此安排，随后就被公司解除劳动合同。小周申请劳动仲裁，仲裁庭判定公司应当支付违法解除劳动合同赔偿金 26 万余元。

该公司不服，因此诉诸法庭。杭州市中级人民法院审理后认定，该公司解约非因裁撤业务、经营不善、减少亏损等消极因素，而是以 AI 的成本优势为由，不属于劳动合同无法履行的「客观情况重大变化」。而且该公司之前为小周提供的调岗降薪方案，实际上导致待遇大幅下降，并非合理协商方案。

因此法庭认定该公司构成违法解除，支持仲裁结果，判决其按 2N 标准支付小周赔偿金。杭州市中级人民法院民事第五庭庭长丁晔对媒体表示，在企业视角下，应用 AI 提效降本是市场竞争的必然选择；而在劳动者视角下，因技术变革而失去岗位或被降薪，实质是公司将正常的技术迭代风险转嫁给劳动者。（来源：solidot）

小米MIX 5今年回归：首发磁吸镜头+屏下前摄

XiamiTime通过解析小米内部代码证实，小米MIX 5已进入研发阶段，计划2026年全球发布，出厂预装HyperOS 4，成为MIX数字系列时隔多年重返国际市场的重磅旗舰。

该机内部代号为Hongkong，型号Q5，按照小米命名规则，字母Q代表2026年发布周期，数字5则明确归属MIX正统序列。此前MIX 4所用的K8编号已划归MIX Flip系列，进一步确认Q5即为MIX 5。

核心配置方面，MIX 5将延续MIX系列的探索定位，搭载成熟屏下前摄UDC，实现完整真全面屏。

此外，MIX 5还有一个重磅亮点，将首发磁吸镜头技术，大幅提升对焦与防抖能力。

小米15系列就曾经展示过磁吸镜头，小米称其为“模块光学系统”，手机配备一个磁吸式可拆卸镜头，采用定制M4/3传感器+全非球面镜组，带来完整一亿像素，等效35mm焦段，配备f/1.4大光圈。

小米模块光学系统支持近光速激光传输，速度高达10Gbps，支持无损RAW信息传输。性能上预计搭载骁龙8 Elite Gen 6 Pro处理器，定位顶级安卓旗舰。目前发布日期尚未最终确定，但代码信息已明确其2026年的上市规划。

（来源：IT 之家）

RingConn Gen 3 智能戒指将于 5 月 5 日发布，主打血管健康管理 / 血压监测功能

5 月 4 日消息，制造商 RingConn 预热一款 RingConn Gen 3 消费级智能戒指，将于 5 月 5 日发布。

据悉，该戒指可选金 / 银两种配色，主打「血管健康管理与血压监测」，号称用户无需再进行繁琐的刻意测量，仅需佩戴一枚轻量化戒指，即可实现血压状况的动态、无感、长期追踪。

作为参考，现款 RingConn Gen 2 智能戒指主打睡眠呼吸暂停监测，能够捕捉睡眠分期（深睡、浅睡、REM）、夜间心率和血氧波动场景，京东定价 2099 元。（来源：IT 之家）

Red Hat 红帽推出 Tank OS 开源项目，将 OpenClaw 运行环境封装为专用容器以提升安全

5 月 4 日消息，Red Hat 红帽首席软件工程师 Sally O'Malley 在红帽博客发文，公布了名为 Tank OS 的开源项目。该项目主要利用容器化与无 root 权限（rootless）架构设计，以提升 OpenClaw 安全性。

O'Malley 指出，如果 OpenClaw 配置不当，可能带来误删数据或敏感信息泄露等风险。因此其设计了 Tank OS 项目，其核心思路是将 OpenClaw 运行环境封装进容器中，以打造专门面向 AI 智能体的运行环境，避免宿主系统权限被滥用。

在底层架构方面，Tank OS 构建于 Fedora Linux 及 fedora-bootc 技术之上，主要利用镜像作为完整运行环境，同时支持在同一设备上运行多个 AI 智能体实例，各实例之间相互隔离，彼此不共享凭据及系统资源。

此外，Tank OS 采用不可变（immutable）操作系统设计，系统将内核、运行环境及服务预先定义在镜像中，大部分文件系统保持只读，仅允许有限范围内修改，从而进一步确保安全性。（来源：IT 之家）

宇树机器人在美买票坐飞机，电池被没收

5 月 5 日消息，机器人租赁公司 Elite Event Robotics 实现了一个有趣的「创举」——带人形机器人坐飞机，是真的坐飞机。

据 CNN 报道，Bebop 是一个重达 70 磅，约 31.8 千克的宇树人形机器人，专为活动和表演而设计。

当地时间上周四，Elite Event Robotics 团队带着这个机器人乘坐了美国西南航空公司从加州奥克兰飞往圣地亚哥的航班。由于 Bebop 的包装箱太重不符合西南航空公司的规定，因此该团队为机器人购买了人类座位。

西南航空没收了 Bebop 的动力电池，因为其尺寸超出了航空公司的最大允许尺寸。这一事件也导致该航班延误了超过一个小时。我们注意到，Elite Event Robotics 官方发了多条帖子，展示这一事件的经过。（来源：IT 之家）

传小米新 SU7 锁单突破 7 万；微信输入法测「隔空发图」功能；豆包二代 AI 手机上半年发布

极客公园

2026年5月4日 08:10

即将超越英伟达！谷歌母公司 Alphabet 市值已达 4.6 万亿美元

5 月 3 日消息，据媒体报道，受超预期财报提振，谷歌母公司 Alphabet 股价周四（4 月 30 日）大涨 10%，年内累计涨幅达到 140%，市值突破 4.6 万亿美元。

该公司周三公布的营收超出分析师预期，其中谷歌云业务收入更是突破 200 亿美元大关。

目前，全球市值第一的公司仍是人工智能芯片霸主英伟达，市值接近 4.9 万亿美元。不过，由于商业伙伴 OpenAI 被曝未能达成内部收入与增长预期，英伟达股价在两天内累计下跌超过 6%。

若英伟达在 5 月 20 日发布的财报中未能实现反弹，期權市场预测，Alphabet 最早可能在 5 月 15 日登顶全球市值第一。要实现这一目标，Alphabet 的市值需要追上英伟达当前水平，股价需再上涨约 4%，达到约 401 美元。

期权交易员认为，从现在到 5 月 15 日之间，Alphabet 股价触及 401 美元的概率约为 53%。

另据 ThinkOrSwim 数据显示，Alphabet 股价在 5 月 22 日（即英伟达财报发布后的星期五）收于 400 美元以上的概率约为 30%。

值得一提的是，Alphabet 上一次成为全球市值最高的公司是在 2016 年，当时它曾短暂超越苹果，登上榜首。（来源: 快科技）

黄仁勋称英伟达中国市场份额已降为零，美国出口管制效果适得其反

5 月 3 日消息，英伟达（Nvidia）CEO 黄仁勋 4 月 30 日在接受特别竞争研究项目（SCSP）采访时表示，该公司在中国 AI 加速器市场的份额已降至 0%（注：他这里仅谈及英伟达直接面向中国客户的销售）。

黄仁勋直言：「放弃像中国这样规模的一整个完整市场，在战略上恐怕并不合理，所以我认为这在很大程度上已经产生了反效果。我认为政策确实需要动态调整，需要保持与时俱进。我可以说，让美国芯片公司和其他美国企业留在中国市场，是非常有意义的。」

今年早些时候，伯恩斯坦（Bernstein）曾预测英伟达在中国 AI GPU 市场的份额可能从 2024 年的 66% 下降到未来几年的 8% 左右。不过根据黄仁勋的说法，这一下降趋势比预期更为剧烈。

与此同时，黄仁勋指出，即便没有美国开发的先进 AI GPU 和软件技术栈，中国在前沿 AI 模型领域仍是一个不容忽视的竞争对手。

实际上，中国开发者正越来越多地使用本土硬件，但在软件领域，尤其是所谓的「CUDA 护城河」，目前仍是美国 AI 技术的主要阵地，中国本土公司尚未完全攻克。

黄仁勋最后还警告称，威胁叙事和出口管制可能会在更宏观的层面上拖慢 AI 部署进程，而中国等其他地区正更积极地将 AI 作为经济工具加以接纳。他认为，长期的领导地位不应依赖于限制全球竞争对手，而应取决于确保美国 AI 生态系统在全球范围内占据主导地位。（来源：IT 之家）

谷歌将为 Gemini 投放广告，目前处于准备阶段

据科技媒体 Android Central 报道，谷歌母公司 Alphabet 本周举行财报电话会议，首席商务官 Philipp Schindler 在会议中表示，Gemini 未来可能会出现广告。

这名首席商务官在会议中透露：「我们需要明确，广告一直是将产品规模化、覆盖数十亿用户的重要手段。如果执行得当，广告可以非常有价值，也能提供真正有用的商业信息」。

援引 Android Central，谷歌高管说「可能出现广告」代表公司决心已定。并且业内已经有 OpenAI 为 ChatGPT 投放广告。

他也提到，目前谷歌仍在进行准备工作：「我们会在合适的时机公布计划，但不会仓促行事」。如果测试顺利，Gemini 移动端可能会出现广告。

事实上，早在去年 12 月就有传闻称，谷歌正在与广告提供商进行电话会议，预计 2026 年为 Gemini 引入广告。（来源: IT 之家）

美光 CEO 称 AI 仍处于「早期阶段」，DRAM 内存和 NAND 闪存供应持续吃紧

5 月 3 日消息，存储巨头美光科技（Micron）第二财季创下了营收、毛利率、每股收益和自由现金流的多项纪录。

美光 CEO 桑杰・梅赫罗特拉（Sanjay Mehrotra）在接受 CNBC 采访时指出，当前的 AI 浪潮仅处于「早期阶段」，随着 AI 智能体的崛起，更高速、更大容量的存储已成为支撑 AI 发挥全部能力的战略资产。

他表示，随着推理端迎来拐点，Token 生成需求的扩大对内存速度和容量提出了极高要求。然而目前存储行业正面临供应极其紧张的局面，且产能提升并非易事。

他还指出，问题不在于需求或定价，而在于供应商根本无法解决的产能问题，且展望未来，情况也不会有所好转。「目前内存供应非常紧张，而且供应无法轻易跟上，这些都能在我们的业绩中看到。」

美光预测，AI 对 DRAM 和 NAND 的需求预计将在今年超过行业总市场规模（TAM）的 50%。（来源： IT 之家）

马斯克 xAI 坐拥 55 万张英伟达 GPU 但算力利用率仅 11%，Meta 和谷歌可达 43~46%

5 月 3 日消息，据《The Information》报道，马斯克旗下人工智能公司 xAI——也就是 Grok 大模型的幕后团队，目前手头上约有 55 万块英伟达 GPU（包括 H100 与 H200），但实际利用率仅有 11%。

据介绍，这些硬件目前主要部署在孟菲斯的 Colossus 超算集群中，采用液冷配置。尽管与 Blackwell 最新一代产品相比稍显老旧，但这样的体量在全球范围内依然位居前列。

然而，如此海量的硬件并未转化为有效的计算产出。该集群的实际利用率仅有 11%。当然，这并非意味着其余 89% 的 GPU 处于完全闲置状态，而是指模型的实际浮点运算利用率远远低于理论峰值。

业内人士解释称，衡量 AI 算力效率的关键指标叫做 MFU（Model FLOPs Utilization），即模型浮点运算利用率。11% 的 MFU 意味着，理论上能产生 100 份训练吞吐量的硬件，实际只产出了 11 份，大量的电力和硬件时间都消耗在了数据等待、通信开销和重新计算等环节，而没有转化为有效的训练吞吐。

面对这一数字，xAI 总裁 Michael Nicolls 在一份内部备忘录中承认其「低得尴尬」，并为团队设定了在未来几个月内将利用率拉升至 50% 的目标。

xAI 并非个例，算力利用率偏低是整个 AI 基础设施领域的行业性难题。报道指出，在超大规模集群下，软件优化跟不上硬件部署速度是普遍现象。作为对比，Meta 和谷歌在软件堆栈上投入了大量精力，因此其 GPU 利用率相对较高，但也只有约 43% 和约 46%。（来源：IT 之家）

继「液态玻璃」之后：苹果 iOS 27 将重心转向 AI，Siri 迎来独立 App 并将深度整合到相机应用中

5 月 3 日消息，彭博社透露，继去年引入「液态玻璃」界面后，iOS 27 将以渐进式更新为主，重心聚焦于性能提升与 AI 两大领域，降低非核心功能优先级，打造更稳定、且针对 AI 深度优化的系统版本。

iOS 27 中 Siri 将迎来自诞生以来最重大的形态转变，被重塑为带有独立 App 的 AI 聊天机器人，采用极简设计，支持持续对话、历史记录查看、多任务指令处理、跨 App 联动及文件分析等功能，其底层架构基于谷歌 Gemini 技术重塑。

此外，iOS 27 将升级照片 AI 编辑工具，同时将「视觉智能」功能作为全新 Siri 模式整合到相机 App 中，新增通过相机识别食品营养信息、自动提取联系人信息等实用功能。（来源：IT 之家）

红果短剧回应「VIP 付费」：并非新增功能，仅适用于极少量版权方要求的内容

5 月 3 日消息，近期有网友反馈称，在红果短剧 App 中搜索电影《少年往事》，该影片封面左上角出现「VIP」标记，点击后仅能试看 6 分钟，随后页面提示需开通会员才能观看完整版。这一变化引发了部分用户讨论。

针对这一传闻，红果短剧相关负责人 5 月 3 日回应红星资本局称，为增加内容丰富性，满足不同用户的需求，应版权方要求，App 中确有极少量内容仅限开通 VIP 后观看，且该设置自平台上线之初即已存在，并非近期新增的功能。

公开资料显示，红果短剧是抖音集团于 2023 年 8 月正式推出的免费看剧应用，核心运营模式为「免费观看 + 广告分账」，用户通过观看广告可获得「金币」并兑换现金，平台则借助广告流量实现商业化。

依靠这一免费模式，上线不到两年的红果用户规模扩张极为迅猛，根据 QuestMobile 数据，2025 年 9 月其月活跃用户已达约 2.36 亿，超过了哔哩哔哩和优酷视频。

目前红果短剧设定的 VIP 价格体系为：7 天会员 8 元，1 个月会员 30 元，12 个月会员 260 元，暂无其他优惠折扣。（来源：IT 之家）

新一代小米 SU7 锁单突破七万，雷军否认纯靠营销，现阶段重心转向保交付

小米新一代 SU7 交出了一份答卷。根据官方最新披露的数据，新一代 SU7 的锁单量已成功突破 70000 台大关。

小米创始人雷军在此前的直播中，对友商的评价进行了正面反击。针对外界给他贴上的「营销大师」标签，雷军指出这其实是一个精心包装的话术陷阱。他表示，这种表面上的夸奖，实则是为了引导公众产生「小米只靠营销而无硬核技术与质量」的误解，本质上是想通过捧杀来消解小米汽车真正的产品竞争价值。

在直播中，雷军还分享了近期的内心挣扎。他透露，去年由于持续遭受海量负面舆情的裹挟，自己一度产生严重的抵触心理，甚至不想再面对任何直播或公开活动。但考虑到这些恶意揣测正在误导潜在消费者对小米汽车的真实认知，他最终选择强迫自己重回聚光灯下，期望用最直观的沟通，向外界传递小米在制造工艺和品质把控上的死磕精神。（来源: TechWeb）

运营三十年，老牌问答搜索引擎 Ask.com 停止运营

5 月 4 日消息，曾用名爱问吉夫斯（Ask Jeeves）的搜索引擎与问答服务网站 Ask.com 现已正式关停。

爱问吉夫斯于 1996 年首次上线，主打以自然语言解答日常口语化提问，堪称如今人工智能聊天机器人的前身雏形。然而在其近 30 年的发展历程中，始终被其他搜索引擎产品、尤其是谷歌的光芒所掩盖。

控股公司 IAC 于 2005 年收购了爱问吉夫斯，随后很快去掉了名称中的「吉夫斯（Jeeves）」字样；到 2010 年，该平台缩减搜索引擎业务规模，重新聚焦问答服务。同年，IAC 集团董事长巴里・迪勒在 TechCrunch Disrupt 上表示，Ask.com 已无法与谷歌抗衡，且在 IAC 的股价估值中也不再具备价值。

目前 Ask.com 官网发布公告称：「随着 IAC 持续精简业务、聚焦核心发展，我们决定终止旗下包括 Ask.com 在内的搜索业务。历经 25 年为全球用户答疑解惑，Ask.com 已于 2026 年 5 月 1 日正式关停。」

尽管网站已经停运，但其官网仍强调：吉夫斯的精神永不落幕。（来源：IT 之家）

豆包二代 AI 手机上半年发布：搭载第五代骁龙 8 至尊版

5 月 3 日消息，据博主「智慧芯片案内人」透露，第二代豆包 AI 手机有望在 2026 年上半年发布，核心升级为第五代骁龙 8 至尊版。

结合此前消息，第二代豆包 AI 手机依然由字节跳动与中兴通讯联合研发。

硬件端由中兴努比亚负责整机设计、制造与供应链，字节跳动主导「豆包手机助手 2.0」开发，深度集成大模型能力至操作系统底层。

豆包 AI 手机的目标是实现「AI 代为操作手机」的交互范式，而非传统 App 插件式 AI 功能。

据悉，首代豆包手机（努比亚 M153）于 2025 年 12 月以工程样机形式限量发售 3 万台，定价 3499 元，迅速售罄。

尽管因 AI 权限过高遭部分 App 厂商抵制（如微信、美团等限制其调用），但其「一句话自动比价下单」「跨应用任务执行」等能力引发行业震动。

二代机型将基于用户反馈与生态谈判成果，大幅提升产品完成度与兼容性。

消息称，新机可能与阿里系等部分主流应用厂商达成协议，在打车、外卖、订票等高频场景开放必要权限。

需要注意的是，上一代豆包手机就只是工程机，目前不确定这次的二代产品是否会开放给消费者随意购买。（来源: 快科技）

微信输入法内测隔空传送功能，支持跨设备收发照片、视频和文件

5 月 3 日消息，近日，微信输入法开始测试全新「隔空传送」功能，进一步强化跨设备文件传输能力。

想要使用该功能，双端设备均需要升级到最新内测版本（Android / iOS 3.3.0、Windows 2.0.0、MacOS 2.1.0），若你的设备暂未收到更新通知，可以在各端微信输入法帮助与反馈中发送「隔空传送」获取下载链接。

据介绍，该功能支持跨设备发送图片、视频和文件，除了可以给自己的关联设备「隔空传送」，还可以通过扫码建立连接，与其他人进行传送，无需流量。

目前该功能还在测试阶段，只有部分用户可以体验，预计不久后将推出正式版本。（来源：IT 之家）

国内首部院线 AI 原生动画电影将至，《三星堆：未来往事》获颁「龙标」

5 月 3 日消息，据北京国际电影节分享，《三星堆：未来往事》已正式获得国家电影局颁发的「龙标」，标志着国内首部将三星堆文化与 AI 原生技术深度结合的科幻院线电影即将登陆全国大银幕。

据介绍，电影《三星堆：未来往事》以三星堆文化为核心、以 AI 技术为手段，将古蜀文明与科幻叙事相结合，用 AI 技术呈现三星堆文物，构建一个连接过去与未来的科幻世界。

电影《三星堆：未来往事》概念预告片已在第 30 届香港国际影视展上正式亮相。另外，本片的创作脉络可追溯至 2024 年 7 月上线的 AI 科幻短剧集《三星堆 · 未来启示录》第一季，该短剧全网已斩获 1.6 亿播放量。

作为参考，《三星堆：未来启示录》的故事设定在科技飞速发展的近未来。地球古文明遗迹的异变引起全球古文明研究组织的高度关注，泛大西洋人工智能组织 ACE 推测三星堆文物中蕴藏着解决文明危机的关键信息，中国古文明研究组织「西安路 34 号」派出科学家吴星言监督 ACE 组织在中国的行动。四川广汉的江家三代都是三星堆考古工作者，江城联合吴星言展开了一场跨越时空的冒险。（来源：IT 之家）

魔法原子进军硅谷背后：世界模型野望与生态卡位

极客公园

2026年5月3日 08:44

硅谷来了一家中国具身公司。

作者｜Li Yuan

编辑｜郑玄

中国机器人公司火，已经不只是在国内了。一家具身智能公司，近期已经把发布会开到了硅谷。

美西时间 4 月 28 日，魔法原子 MagicLab 在硅谷举办全球首届具身智能创新大会 GEIS。

魔法原子在会上推出了新一代人形机器人 MagicBot X1 和灵巧手 MagicHand H01，而且第一次把其世界模型 Magic-Mix、数据生成与训练反馈闭环，作为一套完整的具身智能底层能力集中展示出来。

过去，魔法原子最先进入外界视野，靠的是硬件实力和高辨识度场景：从苏超近 300 台机器人开场秀，春晚舞台上的机器人表演，到首届国际人形机器人运动会上获得跳高铜牌的 MagicBot Z1，都让这家公司建立起鲜明的本体能力标签。按照公司披露，其硬件自研比例已经超过 90%。

而这次在硅谷 GEIS 上，除了连发两款产品外，首次发布了「世界模型」Magic-Mix。Magic-Mix 试图回答的是更底层的问题：机器人如何理解物理环境，如何进行空间推演和动作决策，又如何通过数据生成、模型训练、结果反馈和数据再生成，形成持续迭代的闭环。

从官方发布的信息来看， Magic-Mix Creator，指向的是具身智能行业核心瓶颈——数据。按照魔法原子的说法，公司已经搭建机器人训练数据池，日均采集约 16000 条数据，高质量数据规模超过 100 万小时，并通过数据合成实现 1 万倍的数据体量扩展。

本届 GEIS 上，魔法原子总裁顾诗韬首次对外披露魔法原子的长期营收目标：到 2036 年，公司将向 140 亿美元营收规模迈进。

这个目标仍需要长期交付验证，但此次发布后，魔法原子的命题变得十分清晰：要做一个具备世界模型、硬件平台、数据闭环和海外生态组织能力的具身智能平台公司。

Magic-Mix：

魔法原子世界模型的技术路线成型

在本届大会上，魔法原子发布自研世界模型 Magic-Mix。这也是此次 GEIS 最核心的技术发布之一。

过去一段时间，VLA 是具身智能行业的重要路线。它让机器人可以把视觉、语言和动作连接起来，完成从感知到执行的任务链条。但当机器人真正走出实验室，进入工厂、商业服务、家庭健康等复杂环境时，环境细微变化、物体状态差异、动作链条拉长，都可能带来泛化不足和执行不稳定。

而魔法原子世界模型想补上的，正是这一层能力：机器人不只是识别眼前画面、执行下一步动作，而是要理解物理环境，预测未来变化，并基于更接近物理常识的判断做出动作决策。

这也是开年以来，机器人领域最热的方向。

按照魔法原子的介绍，Magic-Mix 由两个核心引擎构成。其中，Magic-Mix WAM 负责物理环境理解、空间推演与动作决策；Magic-Mix Creator 则作为离线数据生成引擎，用于生成大批量训练样本，持续驱动模型训练和能力迭代。也就是说，Magic-Mix 不是一个静态模型，而是一套动态系统：它试图通过「数据生成—模型训练—训练结果反馈—数据再生成」的闭环，让机器人在真实场景和模拟环境中持续学习、不断修正。

这一路线的价值，在于回应具身智能商业化中最难的一类问题：机器人要进入真实世界，不能只依赖少量示范任务。它需要在开放环境中处理长线程任务、物体变化、动作误差累积和物理常识偏移。为此，Magic-Mix 采用视频动作双专家协同训练模式，并引入共享信息梯度隔离、目标图像约束、失败图像特征输入等设计，试图同时增强机器人「思考」和「行动」的能力。

从数据到场景

机器人「能思考」也要会「真干活」

与世界模型配合的是，魔法原子更系统地构建数据飞轮。

前面已经提到，Magic-Mix Creator 的核心价值，是通过大批量合成数据，降低模型训练对真机数据采集的依赖，为世界模型提供持续稳定的数据供给。

不过，仅有合成数据还不够。对具身智能来说，真正有价值的数据仍然来自真实任务和真实用户。

按照公司披露，魔法原子已经搭建机器人训练数据池，日均采集约 16000 条数据，高质量数据规模超过 100 万小时，并通过数据合成实现 1 万倍的数据体量扩展。

除此之外，魔法原子还试图用「全场景」落地的方式推动数据循环。公司此前曾提出「1+2+N」框架：以全栈自研能力为底座，以人形机器人和四足机器人两条产品线承接场景，再延伸到 N 个垂直应用。

目前，其布局已经覆盖工业柔性生产、巡检安防、智慧导览、公共安全、智慧物流、赛事文娱、科研教育、家庭生活、大健康等九大场景。

这种全场景布局有两层含义。短期看，它是产品能力的验证：不同场景有不同付费能力和落地节奏，导览、文娱、科研教育、公共安全等场景可以更快形成项目和订单；非标准化场景则对应更长期、更高价值的应用空间。只有进入更多场景，机器人在越多场景中被部署，就越有机会获得更多任务数据、环境数据、交互数据和失败案例，再反向推动模型、控制和硬件迭代。

4 月，魔法原子刚刚签订了一笔 1.5 亿元订单，聚焦家庭健康管理与智能陪护，计划覆盖 1 万名高净值家庭用户，提供定制化智能硬件和一体化服务方案。

家庭场景对机器人尤其困难。每个家庭的空间布局、成员结构、生活习惯、健康需求都不同，机器人需要处理的不只是导航和动作，还包括陪护、健康管理、人机交互和长期服务可靠性。如果这类订单能够真正落地，它带来的不只是硬件交付，更可能是持续的用户行为、家庭环境和服务反馈数据。

不止是成功数据能够训练机器人，失败的数据甚至更为重要。Magic-Mix 在训练机制中引入失败图像特征输入，试图把机器人在开放环境中的失败状态纳入训练反馈，用失败样本修正长线程任务中的误差累积和物理常识偏移。正因如此，开放世界的数据，将更能决定模型能否从「能完成一次任务」走向「能在复杂场景中稳定工作」。

如果这个循环能够跑通，魔法原子就不只是拥有多个场景订单，而是在用场景反哺模型，用模型提升产品，再用产品进入更多场景。

也就是说，订单的意义不止是收入，场景的意义也不止是展示；它们共同构成数据飞轮启动的前提，这才是更长期的价值所在。

中国硬科技代表迈向全球

这次发布会很有趣的一点，是它设置在了硅谷。

更有趣的是，从 GEIS 的议程设置来看，它并不只是把一场本该开在中国的发布会搬到硅谷，而是在尝试把发布会做成一个具身智能产业大会。

大会邀请了图灵奖得主 Martin Hellman、旧金山前市长 Willie Brown，也邀请了英伟达 GEAR Lab 高级研究科学家 Zhengyi Luo、亚马逊前沿 AI 与机器人研究院科学家 Haozhi Qi、OpenMind 创始人 Jan Liphardt、Chestnut Robotics 创始人 Evan Tao、XGSynBot CEO Zizheng Li 等海外机器人与 AI 领域的研究者、创业者和产业人士参与讨论。议程也不只是新品发布，而是围绕「具身智能本体演进」「具身智能大脑革命」「生态伙伴演讲」等主题展开。

看似意外，也很合理。

硅谷恰好适合承担这样的角色。这里聚集着全球 AI 开发者、机器人创业公司、产业资本和场景创新资源。更现实地看，北美、欧洲等市场在劳动力成本、服务供给、老龄化、工业自动化和家庭健康管理等方面，都存在明确需求；而中国机器人企业在硬件工程、供应链效率、产品迭代和成本控制上，又有自己的优势。

魔法原子选择硅谷，正是在尝试把这两端接起来：一端是中国智造和具身智能技术能力，另一端是海外丰富的场景、开发者和产业资源。

这也是此次发布会提出 10 亿美元生态投入和「千景共创」计划的含义。魔法原子试图向外部伙伴开放硬件样机、开发资金、核心技术、项目导流和品牌资源，不只是降低单个场景的开发门槛，更是希望以开放协作的方式，推动开发者、场景方与产业伙伴共同验证应用价值，扩大具身智能在真实世界中的产业半径。

过去，中国机器人企业更多被看作高效率的产品制造者和快速迭代者；而这一次，魔法原子试图以全球创新大会的形式，把自己的技术路线、硬件平台和生态计划放到硅谷讨论。

它正在传递一个新的信号：中国智造在具身智能这样的前沿科技领域，已经不只是跟随者，而正在成为能够参与全球议题、连接全球资源、输出技术方案的重要力量。

*头图来源：魔法原子

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

你如何看待魔法原子？

张雪机车夺得 WSBK 第三冠；传苹果正在酝酿一笔大型 AI 收购；创始人加入后，OpenAI 宣布开放 OpenClaw 直连｜极客早知道

极客公园

2026年5月3日 08:42

世界超级摩托车锦标赛「张雪机车」夺第三冠

5 月 2 日消息，在 2026 世界超级摩托车锦标赛（WSBK）匈牙利站 WorldSSP 组别第一回合正赛中，中国摩托车制造商「张雪机车」的法国车手瓦伦丁·德比斯夺得冠军。这也是他与「张雪机车」的第三冠。

凭借本场胜利，德比斯以 97 分在车手积分榜上升到第三位；「张雪机车」积 99 分，在制造商积分榜上同样排名第三。

德比斯在 1 日的本站超级杆位赛中第六位冲线。由于排名第三的意大利车手费拉里被罚退三个发车位，从第三位降至第六位，德比斯在第一回合正赛中得以第五位发车。

驾驶雅马哈赛车的阿雷纳斯、恩居分获第二、三名。「张雪机车」的另一名车手卡里卡苏洛第 15 位完赛，钱江摩托车手德罗萨位列第 16。

「我知道这条赛道对我们来说会很困难。车队整个周末都在告诉我要保持耐心，我们会找到办法。今天早上我对赛车还是不太满意，不过比赛开始前车队帮我做了一些调整，我感觉舒服多了。」德比斯赛后说。（消息来源：新华网）

曝马斯克 1583 亿美元年薪为会计估值，实际一分没拿

5 月 2 日消息，据科技媒体 Quartz 今天报道，监管文件显示，特斯拉 CEO 埃隆 · 马斯克去年总薪酬约为 1583 亿美元。但公司指出，该数字并不能反映马斯克收到的真实现金。

据报道，这 1583 亿美元中大部分是会计估值，与 2025 年 CEO 绩效奖励（特斯拉董事会去年批准的股票激励计划）息息相关。截至文件披露日期，该奖励的任何股份都未有归属，并且所有股份都需要按每股 334.09 美元（现汇率约合 2284 元人民币）的价格抵扣，除非马斯克选择用现金支付。

事实上，马斯克 2025 年的真实薪酬为零，他带领的特斯拉并未达成任何市场价值或运营目标，并且他多年来也没拿过公司薪水。

特斯拉在文件中承认，报告的薪酬数字与马斯克最终实际获得薪酬可能存在显著差距。公司指出，这些数字依赖会计规则的假设和预测，并不能完全反映价值。

作为参考，特斯拉员工总薪酬中位数为 62786 美元，这意味着薪酬比率达到 2522203:1。（消息来源：IT 之家）

ChatGPT 直连 OpenClaw Altman 祝您「捕虾愉快」

5 月 2 日，奥特曼在 X 宣布，「您现在可以用您的 Chatgpt 账号登录 OpenClaw 并在那里使用您的订阅！祝您捕龙虾愉快。」在此之前，用户在 OpenClaw 中使用 GPT-4/5 模型通常需要绑定 OpenAI API Key，现在可直接使用 ChatGPT 订阅（Plus/Pro）登录，并在 OpenClaw 中使用自己的 ChatGPT 订阅额度。

对于开发者特别是「养虾族」来说，主要好处除了简单方便外，还有 Token 整体成本更低。

以前用 API 运行一个「全天候监控邮件并回复」的任务，可能每个月会产生数百美金的账单；现在，广大 Chatgpt Plus 或 Pro 级的订阅者无需再额外购买大量 API Token，只需要使用原来的订阅，就能在 OpenClaw 中调用同级别的 GPT 模型，包括 GPT-5.5 的 Terminal-Bench 2.0（命令行工作流理解）、GDPval（知识工作指数）等智能体核心模型能力。

OpenClaw 是知名独立开发者 Peter Steinberger 创建的开源 AI 智能体项目，主打让 AI 接管用户的日常任务——处理邮箱、编写代码、预订航班、操作硬件甚至是运行银行接口操作相关事务。而 GPT-5.5 主打强调其智能体能力。

有意思的是，今年 4 月初，OpenAI的最大竞争对手、由前 OpenAI 成员创立的 Anthropic（A 社）突然宣布了与 OpenAI 相反的策略：封杀 OpenClaw。自 2026 年 4 月 4 日起，订阅用户将无法再使用 Claude 订阅额度通过 OpenClaw 等第三方集成工具访问其大模型。如果用户要继续让 OpenClaw 调用 Claude，则必须采用常规 API 按量付费。（消息来源：IT 之家）

伯克希尔-哈撒韦股东大会开幕，退居二线的巴菲特现身

5 月 2 日，投资界的年度盛会——伯克希尔-哈撒韦股东大会在美国内布拉斯加州奥马哈市拉开帷幕。

这是伯克希尔自巴菲特退休后首次股东年会，也是巴菲特「接班人」格雷格·阿贝尔（Greg Abel）的首场股东大会。本次大会的主题是「传承延续」。以此为标志，伯克希尔-哈撒韦进入「后巴菲特时代」。

自去年 5 月巴菲特宣布退休以来，伯克希尔 A 类股表现落后同期标普 500 指数。股东们希望了解，手握 3973 亿美元现金，伯克希尔如何在格雷格·阿贝尔的带领下重振。

伯克希尔-哈撒韦发布的 2026 财年年一季报显示，一季度公司实现归属于股东的净利润 101.06 亿美元，上年同期为 46.03 亿美元，同比增长近 120%。同期，公司投资净亏损 12.40 亿美元，上年同期为净亏损 50.38 亿美元。伯克希尔表示，经营业绩可能会受到未来期间持续的宏观经济和地缘政治冲突及事件影响，仍然具有不确定性。

财报数据还显示，截至 2026 年 3 月 31 日，公司现金储备合计 3973.8 亿美元（约合人民币 2.7 万亿元），其中现金与短期国债合计约 3907 亿美元，铁路及公用事业板块另持有现金 66.44 亿美元。与上次披露时约 3700 亿美元相比，一季度末伯克希尔的现金储备再创历史新高。

95 岁的沃伦·巴菲特在人引领下入座董事席前排，全场给予热烈的掌声。巴菲特在座位上接过麦克风，再度盛赞阿贝尔。「他就是那个对的人。」

苹果 CEO 蒂姆·库克同时也现身了股东大会。巴菲特谈到了蒂姆·库克从苹果创始人史蒂夫·乔布斯手中接过苹果大权所面临的压力，以及他如何克服重重压力并取得成功的。「试想，你要怎么接手史蒂夫·乔布斯的衣钵、延续他创下的辉煌成就。这堪称美国企业管理史上的一大奇迹⋯⋯谢谢你，蒂姆。」巴菲特说道。（消息来源：每日经济新闻）

苹果可能正在酝酿一笔大型 AI 收购

当其他大型科技公司竞相在资本支出上投入数千亿美元时，苹果一直处于旁观状态——通过股票回购和分红将资金返还给股东。不过，苹果可能很快就会加入这场游戏。在周四的第二季度财报电话会议上，苹果表示将放弃其长期持有的净现金中性目标。

早在 2018 年，苹果就开始缩减其庞大的现金储备，目标是保持现金和债务水平相当，但苹果表示，未来将分别评估这两个指标。首席财务官凯文·帕雷克表示，这一决定将帮助公司「在如何最优地利用我们的债务和现金组合来支持业务方面，做出更优的经济决策」。

Wedbush 分析师丹·艾夫斯在电子邮件中表示：「我们认为，随着新 CEO 的上任，苹果的领导层更迭预示着未来的收购，这对投资者来说是一个令人欣慰的消息。」

关于潜在收购的传闻已经流传了数月。Wedbush 的艾夫斯表示，苹果的并购策略「很可能包括 AI 领域的公司，而 Perplexity 在我们看来是一个潜在的候选对象」。

苹果在今年早些时候已经宣布了一笔令人意外的收购，收购了神秘的 AI 音频初创公司 Q.ai。虽然未披露收购价格，但媒体报道称，这笔交易估值达到 20 亿美元——这将使其成为苹果历史上第二大收购案，仅次于 2014 年以 30 亿美元收购 Beats Electronics。（消息来源：环球市场播报）

累计亏损 800 亿美元，Meta 仍坚持大力投资元宇宙相关业务

5 月 2 日消息，据《财富》杂志报道，Meta 第一季度业绩本身并不差，净利润和营收都超过市场预期，然而在当地时间周四，其股价却大跌近 9%。投资者担心的重点，是用户减少 2000 万，以及 AI 资本开支继续大幅上升。

与此同时，Meta 仍在向元宇宙和虚拟现实部门 Reality Labs 投入数十亿美元。Meta 第一季度净利润为 268 亿美元（IT 之家注：现汇率约合 1832.4 亿元人民币），营收为 563 亿美元，双双高于分析师预期。净利润中包含一次性 80 亿美元税收收益。营收同比增长 33%，也是 Meta 过去 5 年来最大同比增幅。

该季度，Meta 旗下应用家族全球用户数较上一季度减少 2000 万。Meta CFO 苏珊 · 李把这一变化归因于伊朗的互联网中断，以及俄罗斯对 WhatsApp 访问的限制。

Meta 仍在为元宇宙买单。第一季度，负责 Meta 元宇宙和虚拟现实业务的 Reality Labs 录得 40.3 亿美元营业亏损。讽刺的是，公司一边继续投入，一边也在 2026 年多轮裁员，其中包括裁掉 Reality Labs 约 1.5 万名员工中的 10%。自 2020 年底开始单独披露 Reality Labs 业绩以来，Meta 在该部门累计亏损超 800 亿美元。（消息来源：IT 之家）

全国首个交管机器人中队正式上岗 15 台机器人成街头顶流

五一假期第一天，全国第一个成建制的交管机器人中队在杭州正式上岗，一共 15 台，名字叫杭警智行，五一假期一亮相就成了街头顶流。这批机器人主要部署在西湖景区周边、湖滨商圈还有城区主干道的重点路口，和真人交警一起配合维护交通秩序。

它们的任务很明确，帮游客指路、劝导非机动车和行人违法、协助指挥交通，刚好能分担五一期间警力最忙的工作。

因为接入了大语言模型，机器人回答问题特别快。游客问路直接开口说，机器人能秒回，屏幕上还会弹出路线指引。像断桥、动物园这些热门点位，问路需求最大，现在基本都由机器人接手，帮警力省了不少事。

在路口执勤时，机器人也很管用。遇到行人或非机动车越线停车，它会温和提醒，当事人听到后一般都会马上配合。现场民警说，机器人提醒的效果反而很好，大家更愿意听。

时代的眼泪：中国移动「移动梦网」等业务下线

5 月 2 日消息，根据中国移动今年 3 月发布的公告，因产品运营策略调整，和生活、农信通、Mobile Market、12590 (语音杂志)、梦网全网短彩业务 5 款产品，将于 2026 年 4 月 30 日 24:00 正式下线并停止相关服务。

梦网全网短彩业务，隶属于中国移动在 2000 年推出的移动数据业务品牌「移动梦网」。移动梦网（Monternet）意为「Mobile+Internet」，是中国移动向客户提供的移动数据业务的统一品牌，囊括了短信、彩信、手机上网（WAP）、手机游戏等多种信息服务。

至 2009 年，移动梦网用户规模达到每月 9000 万。然而随着智能手机和 4G 网络的普及，传统 WAP 门户逐渐被原生 App 取代。2019 年 12 月 20 日，移动梦网热点资讯服务正式停止运营。2025 年 8 月 31 日起，部分 SP 公司提供的移动梦网短彩信业务服务停止。（消息来源：IT 之家）

追觅俞浩晒模块化手机：不仅镜头能拆机身都能拆

5 月 2 日消息，追觅科技创始人俞浩直接放出了自家模块化手机的真机视频，这款手机的设计非常有看点，镜头和后盖都能单独拆卸，可玩性很高。

这款手机用的是白色后盖，整体外观简洁。最特别的是它的后置圆形镜头模组，可以直接取下来，依靠磁吸和触点连接，拆装都很方便。手机正面采用居中前置摄像头，不过屏幕暂时没有点亮，具体显示效果和细节还不清楚。

其实追觅做模块化手机早就有消息了。今年 1 月份，追觅手机团队就在西南欧经销商大会上，展示过高奢系列和旗舰模块化系列产品，当时就透露模块化版本会搭配丰富的拓展配件。（消息来源：快科技）

5 月新机大战即将打响！小米 17 Max 来了史上最大电池

5 月 3 日消息，5 月新机大战将至，多家厂商新品蓄势待发。

日前，博主「数码闲聊站」汇总了部分 5 月将发布的新机，包括 OPPO Reno16 系列、荣耀 600 系列、iQOO 15T 以及小米 17 系列新机，vivo S60 系列发布时间仍未确定。

从目前信息来看，小米 17 系列新机或为此前多次曝光的小米 17 Max。该机已获得入网许可，型号为 2605EPN8EC，定位全能大屏旗舰。

与小米 17 Pro 系列不同，小米 17 Max 取消了标志性的背屏设计，将内部空间更多用于提升电池容量。

此前爆料显示，其电池容量达到 8000mAh，成为小米史上电池最大的手机，同时维持 100W 有线快充与 50W 无线快充的组合。

核心配置上，新机预计配备 6.9 英寸 1.5K 四等窄边直屏，搭载 2 亿像素主摄与 5000 万像素长焦微距镜头，采用第五代骁龙 8 至尊版。（消息来源：快科技）

Switch 国行即将永久关闭服务器！不想变砖就做好这些

距离国行 Nintendo Switch 网络功能彻底关停，已经只剩最后 15 天。国行 Nintendo Switch 网络服务将于 2026 年 5 月 15 日 22 点正式停止。

届时，这台曾承载着无数玩家期望的游戏机，将永久性地沦为单机设备。不仅 e 商店将彻底关闭，下载服务与兑换码兑换功能也将同步失效。在那之后，即便是你花钱购买过的游戏，一旦从机器里删除，也将永远无法找回。系统更新与游戏补丁下载也将于 5 月 15 日后终止服务。

根据官方计划，国行 Switch 及相关配件的维修服务，将于 2026 年 12 月 31 日正式终止。届时，无论是主机还是 Joy-Con 手柄坏了，都可能面临无处可修的尴尬境地。

为了能把它当一个纯粹单机设备，继续在国行 Switch 玩游戏，建议大家做好以下操作：

兑换全部兑换码：无论是免费补偿拿到的，还是在别处购买的，所有未用的游戏兑换码必须在 5 月 15 日前用完，过期即作废。

立即执行高强度下载：将游戏库中所有数字版游戏以及 DLC 内容，全部下载到机身存储或额外的 microSD 卡中。如果存储空间不够，现在就得去配一张大容量存储卡。

严防死守本地数据：永远不要删除已安装的游戏，也谨慎对机器执行「初始化」操作。

固定硬件与账号：提前设置好「常用主机」，绑定微信账号，不要轻易删除关联账户。

物理数据备份：重要的游戏截图、视频等资料，请尽快备份到电脑中，以防主机故障无法维修导致数据全无。（消息来源：游民星空）

iPhone Air 销量疲软，安卓厂商集体叫停超薄旗舰；佳能或将推出 Pocket 相机；腾讯增持游戏科学，持股达 24%

极客公园

2026年5月2日 09:06

iPhone Air 销量疲软，引发 Android 厂商集体叫停超薄旗舰计划

5 月 1 日消息，博主 @ 数码闲聊站发文，透露 Air 产品线「叫好不叫座」，苹果 iPhone Air 手机激活量在多轮降价后才勉强破 70 万台。同时国内某厂商 Air 机型激活量仅达 5 万台，因此该厂商计划搁置明年的「小屏超薄 + 极限堆料路线」迭代。预计下代唯一超薄定义的旗舰只有苹果 iPhone Air 2。

除了此前已上市的多家厂商 Air 机型外，事实上还有不少厂商根本就没有推出 Air 机型，例如小米 Air / 魅族 22 Air 手机便直接遭砍。

参考此前报道，小米品牌总经理卢伟冰在去年 11 月便发文，认为「Air 手机极致的薄，实际会带来用户体验的牺牲，包括续航，散热，性能，相机等」，「从实际的销售情况来看，的确是非常小众」。（来源：IT 之家）

Gemini 将出现广告，目前处于准备阶段

5 月 2 日消息，据科技媒体 Android Central 报道，谷歌母公司 Alphabet 本周举行财报电话会议，首席商务官 Philipp Schindler 在会议中表示，Gemini 未来可能会出现广告。

I 他也提到，目前谷歌仍在进行准备工作：「我们会在合适的时机公布计划，但不会仓促行事」。如果测试顺利，Gemini 移动端可能会出现广告。（来源：新浪）

人工智能蚕食云利润，微软力推按使用量付费模式

为了支持大模型训练和推理，微软、谷歌等巨头投入了数千亿美元用于购买 GPU 等硬件，导致短期成本飙升。高昂的算力成本确实在短期内挤压了云服务商的利润空间。

2026 年云厂商不得不通过上调算力价格来对冲成本压力。微软等巨头正在推动将收费模式从传统的「订阅制」转向更灵活的「按使用量付费（Token 计费/Token 经济）」模式。微软及其 Azure 云服务正经历从「卖服务器」到「卖算力能力」的转变。

微软旗下 GitHub 的 AI 编程工具 GitHub Copilot 也将自 2026 年 6 月 1 日起从固定额度订阅制全面转向按使用量计费模式。

Meta 上季度流失了 2000 万用户

尽管 Meta 指出数百万用户似乎已经开始放弃其平台，但该公司仍计划今年在人工智能领域追加数十亿美元的投资。在周三的财报电话会议上，Meta 报告称，其「家庭日活跃用户」（Meta 为 Facebook、Instagram、WhatsApp 或 Messenger 所有用户的统称）数量较前三个月减少了 2000 万。

Meta 将此次用户下滑归因于「伊朗的网络中断以及俄罗斯对 WhatsApp 的访问限制」。至于是否相信 Meta 的说法，则取决于您自己，因为 Meta 将所有平台的用户统计数据汇总在一起，我们无法判断哪些平台受影响最大。如果我想掩盖一个领先的社交平台可能正在经历用户大量流失的事实，我当然会这么做。

Meta 公司宣布将 2026 年的资本支出预期上调至 1250 亿至 1450 亿美元，比此前预估增加 100 亿美元。此次支出增加主要受组件价格上涨预期以及未来数据中心容量成本增加（尽管幅度较小）的推动。（来源：the verge）

腾讯已入股游戏科学，持股 24%

5 月 1 日，据工商变更信息显示，游戏科学（深圳市游科互动科技有限公司）完成股权调整。英雄游戏退出股东行列，腾讯增持后持股比例达 24%，成为游戏科学唯一外部投资方。本次增持由腾讯 2021 年初次入股 5%，叠加本次受让英雄游戏 19% 股权，于近期完成工商登记正式落地。据悉，知情人士称，本次工商变更后，腾讯将继续充分尊重创意，游戏科学依然保持独立运营。（来源：鞭牛士）

马斯克承认：xAI 曾使用 OpenAI 模型来「蒸馏」Grok

5 月 1 日消息，AI 行业一场备受关注的法律战正在升级。当地时间 4 月 30 日，埃隆 · 马斯克在加州联邦法院作证时承认，他旗下初创公司 xAI 曾使用 OpenAI 的模型，帮助训练自家聊天机器人 Grok。

这番证词出现在马斯克起诉 OpenAI 及其 CEO 萨姆 · 奥尔特曼的案件中，马斯克指控 OpenAI 及奥尔特曼背离了公司创立之初的非营利使命。被问到 xAI 是否对竞争对手技术使用过「蒸馏」方法时，马斯克称这是行业常见做法，并承认 xAI「部分」使用过。（来源：凤凰网科技）

杭州为具身智能机器人立法，5 月 1 日起施行

「杭州发布」微信公众号消息，5 月 1 日，全国首部具身智能机器人领域地方性法规《杭州市促进具身智能机器人产业发展条例》正式施行。数据显示，杭州已集聚机器人产业相关企业 700 余家，2025 年具身智能产业集群产值达 1068 亿元。（来源：杭州发布）

Mac mini 起售价上调，599 美元入门款悄然下架

苹果近日悄然上调 Mac mini 的入门价格，曾经标准的 599 美元基础款已在美国官网下架，不再作为可选配置出现。截至 5 月 1 日，配备 256GB 存储的 599 美元 Mac mini 机型已无法在苹果美国在线商店下单，该容量也不再出现在配置选项中。

目前官网展示的主力机型均为更高价格的配置，公开标称的起售价已提升至 799 美元左右，尽管不同配置的供应情况仍在波动之中。同时，这款 256GB 入门配置也从苹果面向教育和军人的专属商店中消失，用户既无法下单也无法进行缺货预订。在苹果官方认证翻新页面中，较低价格的 Mac mini 机型仍会偶尔出现，但数量有限且上架时间不稳定。（来源：cnbeta）

微软宣布 2026 春季 Xbox 游戏开发更新 5 月 7 日举行

5 月 1 日消息，Microsoft（微软）Xbox 当地时间 4 月 30 日宣布，2026 春季 Xbox 游戏开发更新 (Xbox Game Dev Update | Spring '26) 将于太平洋夏令时 5 月 7 日 9:00 在线上举行。

Xbox 游戏开发更新是 Xbox 开发团队的最新节目，集合了团队内部精彩集锦、技术背景解析等一系列内容。而首期活动将是对 Xbox 在 GDC 2026 上分享内容的回顾和进一步深化拓展。

首先，两位 Xbox 高管将深入探讨下一代游戏主机项目 Project Helix 及其对 Xbox 未来的意义；此后将是开发工具更新的介绍；还有 DirectX「国情咨文」、Xbox 市场专题、Xbox 在 GDC 上的亮点。（来源：网易）

迎战大疆 Pocket 4、影石 Insta360 Luna，佳能云台相机专利公布

5 月 1 日消息，据外媒报道，佳能最新公开了一项 2026 年云台相机专利。其展现出潜在的自动折叠设计，预计将正面迎战大疆 Osmo Pocket 4 和即将登场的双镜头影石 Insta360 Luna Ultra。

相比单纯堆规格，这项专利更强调耐用性和智能电源管理，目标是在越来越拥挤的 Vlog 设备市场里找到突破口。这项新公开专利显示，佳能构想的是一款一体式三轴云台相机，形态已经比较成熟。

从结构看，这款设备并不陌生：包含手柄、屏幕、稳定云台头。专利显示，佳能将通过磁传感器阵列和图像分析，判断用户是否已经结束拍摄，然后在关闭电机前自动完成安全折叠。报道认为，这项专利意味着云台不会像某些设备那样一断电就直接「塌下去」，也能减少长期使用中的机械磨损。（来源：搜狐）

奥斯卡奖明确新规：AI 演员和编剧将被取消参评资格

美国电影艺术与科学学院周五发布新规定，明确表示演技和编剧工作必须由人类完成，而非人工智能，才有资格角逐电影业的最高荣誉奥斯卡奖。这些变更将适用于定于 2027 年 3 月举行的下一届奥斯卡颁奖典礼的作品提交。

根据美国电影艺术与科学学院发布的新规定，电影制作者可以使用 AI 工具，但像诺伍德这样的「合成」演员将不具备获得奥斯卡奖的资格。该机构在声明中表示，剧本必须是「人类创作」才能被考虑评选。新规定还规定，学院可以要求提供额外信息以验证提交作品确实由人类创作。

此次规则调整标志着电影行业对人工智能技术应用范围的明确界定，旨在保护传统电影艺术中的人类创造力和表演价值。随着 AI 技术在内容创作领域的快速发展，奥斯卡主办方通过这一举措向业界传递了明确信号，即在最负盛名的电影奖项评选中，人类的艺术贡献仍然是不可替代的核心标准。（来源：环球网）

DeepSeek 发布多模态模型及技术报告；小红书官宣组织调整：柯南出任总裁；宇树发布双臂人形机器人，2.69万元起售

极客公园

2026年5月1日 08:30

DeepSeek 发布多模态模型及技术报告

近日，DeepSeek 在 Github 上正式发布了多模态模型，公布了背后的技术报告。

在技术报告中，DeepSeek 提到：尽管多模态大语言模型（MLLMs）取得了显著进展，但主流的思维链（CoT）范式仍主要局限于语言学领域。虽然近期研究重点通过高分辨率裁剪技术（例如基于图像的思考）来弥合感知鸿沟，却忽视了一个更根本的瓶颈：参照鸿沟。自然语言固有的模糊性往往无法为复杂的空间布局提供精确、明确的指引，导致需要严谨参照的任务出现逻辑崩溃。

而 DeepSeek 多模态技术报告提出基于视觉原语的思考——这一创新推理框架将点、边界框等空间标记提升为「思维的基本单元」。通过将这些视觉原语直接融入思考过程，DeepSeek 的模型在「推理」时能够「指代」，从而将其认知轨迹有效锚定在图像的物理坐标中。

值得注意的是，DeepSeek 技术报告提到，其框架基于高度优化的架构，具备极高的视觉标记效率。尽管模型规模紧凑且图像标记预算显著较低，DeepSeek 的多模态模型在具有挑战性的计数和空间推理基准测试上，能够与 GPT-5.4、Claude-Sonnet-4.6 和 Gemini-3-Flash 等前沿模型匹配。这为开发更高效、更具可扩展性的 System-2 类多模态智能指明了方向。（来源：每日经济新闻）

苹果发布季度财报：iPhone 17 系列表现强劲

北京时间 5 月 1 日，苹果公布了 2026 财年第 2 财季（对应今年第 1 季度，截至 3 月 28 日）的财报数据，本季度公司营收 1111.84 亿美元，同比增长 16.6%；净利润为 296 亿美元，增长 19.4%；大中华区营收为 204.97 亿美元，同比增长 28.09%。

在 iPhone 17 系列驱动下，iPhone 业务表现强劲，营收达 570 亿美元，同比增长 22%。该产品在美国市场客户满意度达 99%，创下三月季度升级用户数新纪录。

服务业务收入攀升至 310 亿美元，同比增长 16%，再创历史新高，付费账户与交易账户数均达季度峰值。Mac 营收 84 亿美元，同比增长 6%，MacBook Neo 市场需求远超预期。

供应链方面，先进制程芯片产能成为主要瓶颈，导致 Mac mini、Mac Studio 及 MacBook Neo 等机型交付紧张。公司预计部分产品需数月才能实现供需平衡。毛利率环比提升 150 个基点至 49.3%，但内存成本上涨带来压力，下一季度影响将更为显著。（来源：IT之家）

Figure 机器人量产大幅提速，从每天一台到每小时一台

当地时间 4 月 29 日，人形机器人公司 Figure 创始人布雷特·阿德科克（Brett Adcock）在社交平台 X 发文称，过去 120 天里，Figure 的生产效率扩大了 24 倍——从每天 1 台机器人提升到每小时 1 台机器人。

阿德科克表示，仅在本周，Figure 就将生产 55 台机器人。

同日，Figure 公布了旗下第一代自动化生产线 BotQ 的最新进展：生产线末端的一次合格率已超过 80%，并且每周都在提升；电池生产线的一次合格率达到 99.3%，已交付超过 500 个电池组；已生产超过 9000 个执行器，涵盖 10 多个不同的 SKU。

值得注意的是，在 BotQ 工厂中，人形机器人本身也会参与搬运、组装新机器人。（来源：东方财富网）

小红书官宣组织调整：柯南出任总裁，成立 AI 一级部门

4 月 30 日，小红书通过全员内部信官宣新一轮组织升级。核心动作包括全面整合社区、电商、商业化与技术体系，加码 AI 战略布局并启动国际化攻坚。

本次人事调整中，柯南升任总裁，统管社区、电商、商业化三大核心业务及技术体系，直接向 CEO 星矢（毛文超）汇报。

内部信明确两大核心动作：一是成立 AI 一级部门 Dots，直接向柯南汇报，定位为构建从模型研发、基础设施、工程落地到产品应用的全链路技术体系，整合顶尖 AI 人才与资源，成为驱动业务增长的技术引擎；二是成立企业智能部，搭建适配 AI 时代的组织能力底座。

海豚社创始人李成东分析认为，将 AI 团队升格为一级部门，足见小红书对 AI 的重视程度，其核心意图是依托 AI 重构广告投放系统与电商供应链，通过提升广告精准度、优化智能选品、落地虚拟试妆等应用，最终实现变现效率的跨越式提升。（来源：科创板日报）

三星突破 4nm 制程芯片成熟工艺门槛

近日，三星晶圆代工 4nm FinFET 制程（SF4X）良率已正式突破 80% 门槛，终于迈入成熟生产阶段。

三星自 2021 年开始大规模生产 4nm 工艺，初期良率仅约 35%。此后经历长达六年的持续优化与良率爬坡，才终于撞线 80% 目标。

这是半导体制造领域公认的工艺成熟分水岭，此前一直被台积电牢牢占据。目前台积电 4nm 良率约在 85%-90% 区间。

良率跃升直接推动代工客户的密集涌入。由英伟达间接收购的 AI 芯片初创公司 Groq，已于今年 3 月将三星 4nm 晶圆订单从 9000 片追加至 15000 片。

除 Groq 外，三星 4nm 客户版图覆盖多家产业链玩家。据韩媒爆料，IBM、百度、以及一家加密货币公司均已采用三星 4nm 方案。（来源：快科技）

硅谷高管：现阶段 AI 成本高于人力，但高额 AI 账单仍是积极信号

近日，英伟达高管和 Uber 首席技术官指出，现阶段 AI 服务（如代码助手、自动化智能体）的运营成本高于人力成本。

这一观点挑战了「AI 必然降本增效」的普遍预期，揭示了当前阶段企业应用 AI 的一个现实：在追求技术革新的初期，投入成本可能不降反升，而管理层正试图将这种投入重新定义为战略投资。

英伟达应用深度学习副总裁 Bryan Catanzaro 表示：「对我的团队来说，计算成本远远超过了员工成本。」

真正的巨额开支源于基于 Token 的模式，尤其是 Claude Code 和 GitHub Copilot 等编程助手，以及执行复杂自动化任务的智能体。

尽管成本高昂，但企业界的反应出人意料。许多 CEO 并不将高额的 AI 账单视为负担，反而看作积极信号。他们认为，这证明员工正在深入使用 AI 工具，推动大规模自动化进程，从而驱动企业创新。（来源：IT之家）

马斯克旗下 Neuralink 打造手术机器人：缩短脑机芯片植入时间

据外媒 Interesting Engineering 报道，近日马斯克旗下 Neuralink 推出了一款专用手术机器人，目标是让脑机接口植入过程实现更高程度的自动化。

这项新工具的重点，是提高植入手术的安全性和可靠性，并让未来大规模应用成为可能。

Neuralink 的植入线「细而柔软」，甚至比人的头发还细，传统手工手术很难精确处理。为此，Neuralink 开发了专用机器人，利用 8 个摄像头和 OCT 扫描仪，在手术过程中实时识别和避开脑组织。

目前，人类外科医生仍然不可或缺，机器人则开始承担高精度、重复性强的步骤。这类操作对稳定性要求极高，而机器人在一致性上更有优势。

这一看似很小的改动意义很大：手术时间会缩短，感染风险也会降低，未来甚至可能让植入流程变成一次快速完成的短住院手术。（来源：IT之家）

泡泡玛特首款 LABUBU 冰箱开售秒罄，二手溢价 4000 元

4 月 30 日晚，泡泡玛特 LABUBU 冰箱正式开售，商品上架后秒罄。

据悉，本次发售的泡泡玛特 THE MONSTERS 生活家系列冷藏箱分为 Home 款和 House of the Monsters 款两个版本，两个版本均为全球限量发售 999 台，每一台都拥有限定编号，售价为 5999 元。

值得一提的是，在抢购热潮下，原价 5999 元的泡泡玛特 LABUBU 冰箱，二手交易价格已达到 9999 元，溢价 4000 元。

从硬件配置来看，这款 LABUBU 小冰箱是一台入门级产品：总容积 121L，相当于普通迷你冰箱，且冷冻室极小（15L）；ABS 食品级内胆和钢化玻璃隔板，符合安全标准的普通材质；温控、能效和噪音，也都是正常产品水准。

曾有报道称，这款小冰箱由某知名小家电代工巨头制造，双方主要采用 OEM（原始设备制造商）模式合作。门体布满 LABUBU 和 TYCOCO 的卡通角色形象，银色手柄上镶嵌着 LABUBU 立体头像，机身铭牌印着 THE MONSTERS 字样，强化了收藏级「手办」属性。（来源：快科技）

宇树发布双臂人形机器人，2.69万元起售

4月30日，宇树科技正式发布双臂人形机器人，定价2.69万元起。该机型主打上半身双臂操作，下半身可选固定底座或移动底盘。

本次发布的双臂人形机器人共推出四个版本，核心差异为手臂自由度与底座配置。四个版本均标配2kg手臂负载、±0.1mm末端夹爪精度，末端支持二指夹爪、三指灵巧手、五指灵巧手更换，语音与视觉协同配置保持一致。

整机支持15到31自由度，手臂自由度提供5x2和7x2两种方案，动作范围覆盖日常操作与工业辅助需求。

机身与头部均搭载8核CPU，头部模组算力达到10TOPS。配合视觉双目算力模组和语音交互系统，可实现多元人机交互。

机器人末端支持快速更换执行器，适配抓取、夹持、装配等任务，适用于轻工业、实验室及服务场景。（来源：快科技）

钉钉发布 DingTalk A1 Pro，支持为手机反向充电

4 月 30 日，钉钉正式发布 AI 硬件家族新成员 DingTalk A1 Pro，售价 1299 元。

这款产品在 AI 录音卡片的基础上集成了 2980mAh 大电池，支持为手机反向充电，已通过新国标 3C 认证。

硬件设计上，A1 Pro 整机厚度仅 6.4mm，机身自带磁吸设计，无需额外皮套即可吸附在手机背面，配备触摸屏可直接切换充电模式。

软件层面，A1 Pro 与钉钉 AI 听记能力深度整合，支持录音实时转写、AI 大模型总结分析和多语种实时翻译。内置 200 多种 AI 纪要模板，覆盖客户拜访、面试问答、法律咨询、跨国会议等典型场景，录音内容还可一键生成日程、待办和会议纪要，直接流转至钉钉工作台。（来源：快科技）

张雪机车 MX250 摩托车发布，2.98万起售

4 月 30 日，张雪机车发布首款场地越野车 ZXMOTO MX250，官方指导价 2.98 万元。

张雪机车 MX250 采用双喷油嘴发动机，最大功率 30kW@12500rpm，最大扭矩 27N·m@9500rpm。

张雪机车 MX250 采用了多项减重设计，整车重量 102kg，配有镁合金发动机左右边盖和顶盖、铝合金副车架、镁合金调压器、铝合金后摇臂、7050 铝合金轮圈等。

该车还配有 KYB 阻尼全可调前后减震，内置骨架手把胶、手把小屏。（来源：IT之家）

天文学家最新发现：2031 年，火星往返航线仅需 153 天

沿着地球与火星这颗邻近行星之间相对笔直的航线，单程火星之旅需要 7 至 10 个月左右。但一位天文学家借助小行星的早期轨道数据，或许找到了穿越太阳系的捷径。

在一项新研究中，来自里约热内卢州立大学北部分校的研究人员马塞洛，顺着小行星 2001 CA21 的预测运行轨迹，探寻通往火星的全新航线。这项研究成果发表在《Acta Astronautica》期刊上，研究确定了一条往返火星的航线，全程仅需约 153 天。

结合发射窗口期分析与该小行星的早期轨道预测，研究人员发现，2031 年是唯一一年地火天体几何排布与小行星轨道平面完美契合的年份。研究指出，在 2031 年发射窗口期内，有两套可行的火星往返任务方案，总时长分别约为 153 天和 226 天。

这项新研究旨在为星际航线规划提供一种全新思路，有望将星际航行时长缩短数百天。一直以来，科学家密切监测小行星主要是为防范其撞击地球的潜在威胁，而如今，这些太空岩石也有望成为人类穿越太阳系的天然航行路标。（来源：IT之家）

阅读视图

OpenAI 推出 GPT-5.5-Cyber 预览版，面向安全团队限量开放

Anthropic 正考虑进行融资，估值接近 1 万亿美元

苹果 CarPlay 接入马斯克的 Grok 模型，在车内和 AI 自然聊天

消息称腾讯实习生大涨薪，百度「全员晋升」

OPPO 就母亲节宣传文案争议道歉：已第一时间下架全部相关物料

去哪儿承诺：绝不因用户消费习惯、支付能力等信息设置不合理价格差异

英伟达 CEO 黄仁勋：下一代 AI 基础设施将需要大量的光学连接，铜线已无法满足需求

印度首个太空科技独角兽诞生：Skyroot 拿下 6000 万美元融资，火箭将入轨发射

Anthropic 推出 Claude for Microsoft 365，实现跨应用无缝协作

阿里千问 AI 眼镜 S1 升级：主动服务与全球首个 3D 显示功能

微信未读语音由红变灰被用户疯狂吐槽，腾讯回应

01

02

03

01

02

03

01

02

03

宇树科技开放全球首个人形机器人应用商店 UniStore

OpenAI 推出三款实时语音模型，可边听边「思考」、翻译和转录

美团公测 AI 社区觅游，推出养虾社区

高通发布骁龙6 Gen 5 与4 Gen 5，面向中端市场的次世代移动平台

主板销量暴跌

李想呼吁所有车企推广 5C 增程技术

追觅组建数百人团队专门寻求募资，两百多个事业部内部赛马

谷歌发布极简无屏、无按键健身手环 Fitbit Air，专注无感健康监测

Ploopy 推出 Bean 指点杆鼠标，将 ThinkPad 红点随身携带

鸿蒙智行智界 V9 将于 5 月 15 日正式上市，预售价 39.98 万起

宇树 G1 人形机器人在韩国佛门「受戒」：法名「迦悲」，需遵守不过度充电等戒律

01

02

03

04

05

一张网卡，盘活整个智算集群

为何是阿里在定义 AI 基础设施？

消息称月之暗面 Kimi 将完成 20 亿美元新融资，估值破 200 亿美元

李想：理想不是不想做轿车，但牺牲空间和舒适性跟我们对「家」的追求矛盾

全力布局 AI，苹果研发支出占营收比例 30 年来首次突破 10%

三星电子决定在中国大陆市场停止销售含电视、显示器在内的所有家电产品

爱彼迎 CEO 切斯基：只负责「管人」的管理者将很快会被 AI 时代淘汰

豆包大模型家族首款全模态理解模型：字节跳动 Doubao-Seed-2.0-lite 升级

新一代小米 SU7 上市 48 天锁单超 8 万台

车主复购意愿居高不下，特斯拉连续四年斩获标普全球汽车用户忠诚度大奖

小米首台万级大电池手机被曝暂定年底发布：3nm 芯片，7 英寸 2K 屏，3D 超声波指纹

鸿蒙智行享界越野伪装车谍照曝光：方正硬朗外观，采用全新大灯造型设计

时代的眼泪：开播 24 年的星空卫视 5 月 8 日起暂停卫星传输服务

01

02

03

04

01

02

03

01

02

03

04

05

01

02

03

04

05

豆包计划新增付费订阅模式 主打生产力场景

苹果机器人项目高级工程师离职，跳槽谷歌 DeepMind

Meta 收购机器人公司 ARI

特斯拉 FSD 行驶里程突破 100 亿英里，马斯克「无监督自动驾驶」数据里程碑达成

员工展示特斯拉工厂下线的最后一辆 Model X 照片，车身签满名字

消息称小米已暂停小折叠手机产品线

「AI 面试」逐渐受企业追捧，近四成求职者因此主动选择放弃机会

杭州法院裁定以 AI 代替人类为由裁员是系违法

小米MIX 5今年回归：首发磁吸镜头+屏下前摄

RingConn Gen 3 智能戒指将于 5 月 5 日发布，主打血管健康管理 / 血压监测功能

Red Hat 红帽推出 Tank OS 开源项目，将 OpenClaw 运行环境封装为专用容器以提升安全

宇树机器人在美买票坐飞机，电池被没收

即将超越英伟达！谷歌母公司 Alphabet 市值已达 4.6 万亿美元

豆包计划新增付费订阅模式主打生产力场景

追觅俞浩晒模块化手机：不仅镜头能拆机身都能拆

5 月新机大战即将打响！小米 17 Max 来了史上最大电池