阅读视图

发现新文章,点击刷新页面。

AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑

 

过去半年,「AI 语音」赛道正密集地获得融资。尤其引人注目的是,这些融资多为大额,并且投向早期团队。

比如,前不久 AI 语音应用 Wispr Flow 靠「默念输入」,完成了 3000 万美元的 A 轮融资,累计融资额已达 5600 万美元;语音模型公司 Cartesia 在 3 月份完成了 6400 万美元的 A 轮融资,累计融资 9100 万美元;AI 语音合成公司 ElevenLabs 更是在 1 月份宣布完成 1.8 亿美元的 C 轮融资,估值超过 30 亿美元

与此同时,无论是 Meta、OpenAI、Google 等科技巨头,还是 MiniMax 等创业公司,都在密集发布自己的语音模型或语音产品。Siri 也被曝出或将被 ChatGPT 或 Claude 等模型接管,来跟上语音交互的进展。

这些消息无一例外都指向了 AI 语音的火爆。

为什么过去半年多以来,AI 语音领域会如此集中地爆发?

声智副总裁黄赟贺认为,语音对话从一个 App 中的功能模块,迅速进化为 AI 时代入口级别的存在,与大模型的加持有极大关系。

在智能音箱红极一时的年代,大部分我们熟知的智能音箱品牌都搭载了声智的远场声学交互技术,比如小爱同学、天猫精灵、小度音箱等等。而「小爱小爱」的唤醒词,实际上也是来自于声智

这家公司创办于 2016 年,一直在声学+ AI 交叉领域探索。然而,作为一家在幕后提供 AI 声学技术的公司,在大模型浪潮来临之后,果断选择下场投身开发自己的 C 端产品。毫无疑问,他们看到了这波「大模型+语音」浪潮里新的商业机会,其旗下的 AI 耳机目前出货量已接近 100 万套

前不久,极客公园与声智副总裁黄赟贺聊了聊AI语音市场的爆发逻辑、语音交互的「卡点」,以及它将如何影响我们的未来。

 

以下内容根据黄赟贺的讲述和声智的论文整理而成:

AI 语音的想象力,已经远在 Siri 之上|图片来源:网络

 

AI 语音为何现在爆发了?

最近两年,越来越多的 AI 语音初创团队获得大额融资,集中爆发。

其中,一个很重要的推动因素是,大模型让声音这项基础能力首次实现了「可编程化」

「可编程化」这个词,意味着将一种能力或者一个对象,通过清晰的接口和逻辑,变得可以被代码自由地调用、组合、修改和控制。过去,文字是可编程的,图像是可编程的,甚至视频也是可编程的(比如视频编辑软件)。

但声音更多的是一种「输入」或「输出」的介质,其内部的复杂结构和信息,很难被软件直接「编程」和「理解」。

传统的语音识别,更多是把声音转换成文字,然后对文字进行处理。

比如,之前在深圳、成都有很多做声音标注的团队,拿到语音之后,再人工转换成文字,打上不同的标签,比如各种特征、意向的标签。

大模型来了之后,打标签的这项工作可以交给大模型,它比大量的人工团队标得快和准。

以前做 NLP 的背后都是一堆苦逼的运营在那里打标签,让 AI 系统能够识别每个句子的意向。过去,语音的开发,每增加一个功能,都需要从头写代码,费时费力。比如,想让智能音箱支持「点外卖」,得单独开发一套语音识别和语义逻辑,成本高、周期长。

而现在 AI 大模型可以解决了。

更重要的,依靠大模型对多模态数据的深度理解能力,对声学信号的更细致解析,使得声音本身携带的除了文字信息之外的更多信息,开始被 AI 系统直接捕捉、理解和「编程」。

这种可编程化,意味着 AI 可以像处理数据一样处理声音。它可以分析声音的频率、振幅、波形,提取出情绪特征、识别不同的声源、声源距离、甚至预测你的意图。

这时,声音包含的不再仅仅是「你说了什么」,更是「你如何说」、「你在哪里说」、「谁在说」以及「你说了之后希望发生什么」。

由此,声音也成为了真正的交互引擎。

 

真正的语音交互,不是「Voice」而是「Sound」

其实,很多人以为,语音交互就是「Voice」(语音)。但其实 Voice 这个词是一个狭窄概念。真正的语音交互,核心不是「Voice」,而是「Sound」(声音)。Sound 里面包含了 Voice。

具体来说,「Sound」包含了更丰富的元素:语调、音色、节奏、情绪,更重要的是环境音。环境音里面可能包含了环境中的各种非语音信息,比如背景音乐、环境噪音(风声、雨声、车声)、物体发出的声音(开门声、打字声)、以及人类语音中包含的非语义信息(语调、语速、音色、语气词、叹息声、笑声、哭声等)。

比如说,你咳嗽的时候,跟 AI 说话,它可能会识别出咳嗽,然后跟你说多喝水;比如,你在咖啡馆说,「帮我找个安静的地方」,AI 不仅要理解你的指令,还要从背景音中判断出你当前的环境嘈杂,从而推荐附近的图书馆。

当我说「下一代对话交互的入口并非『Voice』,而是『Sound』」时,我指的是 AI 系统将不再仅仅依赖于识别你说的「词」,而是能够全面感知和理解你所处环境的「声学场景」中的所有关键元素。

只有当 AI 能够全面感知并解析「Sound」中包含的这些多维度信息时,它才能真正理解用户的深层需求,提供更精准、更个性化、更富有情感的交互。这才是真正的「语音交互」,它不仅仅是「听懂」字面意思,更是「听懂」你的「言外之意」和「心声」。

 

语音交互的「卡点」,大厂烧钱也没用

尽管大模型带来了语音交互的巨大飞跃,但语音交互当下依然存在一个核心的「卡点」,而这个卡点根植于物理学,具体来说,就是声学。

我们常说「听清、听懂、会说」。「听懂」和「会说」的能力,正在被大模型以前所未有的速度提升。但「听清」这个最基础的环节,却受到物理层面的制约。如果 AI 听不清你的指令,即便它能「听懂」再复杂的语义,能「会说」再动听的话语,那也都是空中楼阁。

比如说当下最热门的具身智能,现在很多机器人都是电驱动的,那么它带来几个大问题,一方面是电路的噪声本身就很大,另一方面是关节噪声,还有就是很多机器人是金属材质,厚厚的,声音在穿透时会大幅衰减。

所以,机器人动起来的时候,噪声很大,尤其在室外,更难听清楚人的指令。要么大声喊,或者拿麦克风喊。因此,现在很多机器人都要靠遥控器来控制。

当下最先进的具身智能机器人仍然依赖于遥控器来操控|图片来源:网络

这方面,其实就需要对声学层面的突破,比如说环境噪声的抑制,比如电路底噪的抑制,还有啸叫的抑制、混响回响的抑制等等。

而这些就是物理学科的逻辑,它需要数据样本,需要 know how 的壁垒,不仅是技术问题,而是时间的问题,需要时间去采集声音、做训练。

这不是烧钱能解决的。

让 AI 准确地「听清」用户的指令,依然是一个世界级的难题。而声学相关的人才很少,所以像谷歌、微软、苹果经常会收购声学技术的初创公司,几乎只要出来一家就会收购他们。

大家都明白,要构建真正的下一代人机交互系统,拥有核心的声学能力是基石。

 

语音交互的下一站,是实现「共情」

现在很多 AI 应用的日活、留存不高,有个很大的原因就是普通人本身是不会提问的,让人向大模型提问,这本身就是一个非常高的交互门槛。

好的提问还需要学识、表达等基础,所以停留在文字层面的问答,本身就是一种门槛限制。

而语音带来的一种可能性是,它正在开启一个全新的阶段——人机交互的「共情模式」。

如果把语音交互比作一个「UI 界面」,那这个界面会长什么样?我们可以做个推演,它的构成要素可能会有:

  • 情绪识别:AI 通过分析语调、音量、语速,判断用户的情感状态。比如,你的声音颤抖,AI 可能推测你在紧张或伤心。

  • 意图理解:不仅听懂你说了什么,还要明白你想做什么。比如,你说「播放音乐」,AI 会根据你的情绪,决定是放摇滚还是古典。

  • 声纹识别:通过独一无二的音声波特征,区分不同用户。比如,家里的智能音箱能自动切换到「孩子模式」模式,只为孩子的声音提供安全的回应。

  • 情绪生成:AI 的回应需要带有情感化的表达。比如,用温暖的语气说「别担心,我来帮你解决」,而不是机械的「好的,正在处理」。

这些要素的背后,是 AI 从「功能导向」到「情感导向」的转变,AI 会与人实现共情。这种交互,能显著提升长时间交互的质量和亲密感。

不仅如此,从狭义的「Voice」拓展到广义的「Sound」,当 AI 能接收到的不仅仅是用户的指令,而是整个物理世界的实时反馈时,我们可以去构建一个「声学世界模型」。

这个「声学世界模型」可以理解声音在物理世界中产生、传播和交互的根本规律,它不仅要「听清」和「听懂」,更要具备「声学常识」和「声学推理」的能力:它能从一声闷响中分辨出是书本落地还是箱子倒塌;能通过回声判断出房间的大小与空旷程度;更能理解「脚步声由远及近」背后所蕴含的物理运动逻辑。

未来,当这样一个声学世界模型与视觉、语言大模型深度融合时,具身智能机器人将不再「失聪」和冰冷。这也是我们正在做的。

 

 

「赛博菩萨」发威!AI 巨头的「免费午餐」时代终结了!

马斯克和特朗普,这对白宫二人转最近「嘴炮大战」进入到 2.0 时期。和这对欢喜冤家类似的,是国外出版商集团和 AI 巨头之间的相爱相杀——一方面有大出版商要和 AI 公司合作,另一方面也有出版商誓死要把 AI 巨头告破产。

根据数据,AI 搜索和 ChatGPT 出现后,全球网站流量都在下降;另一方面,AI 巨头的「AI 爬虫」却不顾爬虫协议,以数万次的爬取不断侵蚀所有网站的数据。

这时候,终于有一家基建公司站了出来,挽着内容创作者的手说:「我们可以对 AI 巨头说不!」

Cloudflare,这家掌控全球约 20% 网络流量的互联网基础设施巨头,被网民誉为「赛博菩萨」的公司,在 2025 年 7 月上线了一个实验性产品和交易市场:「Pay Per Crawl」——给 AI 爬虫立下了新规矩:

要么获得许可,要么付费

简单来说,这个功能的本质是给网站内容创作者一个选项「开关」:可以选择允许 AI 爬虫自由访问,按次爬取收费,抑或者直接封锁访问。

按照 Cloudflare 创始人的说法,「内容是驱动 AI 引擎的燃料,因此,内容创作者直接获得报酬才是公平的。」

对 AI 公司来说, 想继续抓取全网内容来训练模型,不能再像以前那样「免费吃大餐」 。但也不是没有好处,因为根据明码标价付费,可以避免版权争议问题。

Cloudflare 这次的「防虫」举措,能缓解 AI 爬虫的肆意攻击吗?更重要的是, 这家公司能否利用自己独特的地位,建立起一个全新的 AI 时代内容分发和变现模式

 

01

AI巨头的「免费午餐」

 

过去几十年,大多数网页默认是公开「可爬」的。谷歌、Bing 这类搜索引擎为网站带来流量,有了流量,网站再通过广告或销售订阅变现——这是搜索时代的隐形契约。

可 AI 时代,传统搜索流量骤降,这笔账越算越亏。

AI 公司把全网内容当作训练燃料,却几乎不用给大部分创作者回报。当用户直接在 AI 聊天机器人里提问,答案往往来源于总结好的内容,而不是数十个蓝色链接,不会给网站带来更多流量。

甚至于谷歌这样的搜索巨头本身也在变化,以前他们提供网站链接列表,如今他们在搜索页面推出了「人工智能概述」,据他们的报告,75% 的查询用户无需点击任何链接就得到了解答。

Cloudflare 2025 年 7 月的最新数据显示: 谷歌的爬虫大约每 6 至 7 次抓取给网站带回 1 次点击,而 OpenAI 则是 1500 次才换来 1 次跳转,Anthropic 的比例甚至更夸张,高达 73300 次换 1 次

各大公司 AI 爬虫每次抓取为网站带来的点击比例|图片来源: Cloudflare  

 

这意味着,传统的「内容换流量」模式失效了。相比传统搜索引擎,AI 巨头们吃掉了海量网站内容,却不给「导流」,这种失衡让一些内容生产者愈发难以为继。

「有了 OpenAI,网站流量获取难度比谷歌时代高出 750 倍,而有了 Anthropic,难度更是高达 3 万倍。原因很简单: 我们越来越不再消费原创内容,而是消费它们的衍生品 。」Cloudflare CEO Matthew Prince 在一篇博文中称,「这不是一个公平的交易」。

AI 公司爬数据也不是没有代价的,这两年 AI 巨头一直被指控「偷内容」来训练大模型,引发全球范围的版权诉讼潮,尤其是纽约时报等新闻机构和 OpenAI 诉讼不断。

活跃的大厂 AI 爬虫机器人|图片来源: Cloudflare  

 

因此,Cloudflare 推出「Pay Per Crawl」,建立一个「按次付费爬取」的市场,想要解决的正是这个问题。

该公司设计了一个权限和支付系统,网站可以在后台选择对 AI 爬虫「允许、封锁或收费」,AI 爬虫如果想抓取该网站内容,必须注册、验证身份,并在每次访问时完成支付。

如果顺利, 这一模式能让网络内容从「广告变现」走向「内容授权变现」,开拓全新的收入来源 。无论是大媒体,还是冷门小博客,都能在 AI 时代拥有议价权,被 AI 付费使用。

为了强调其意义,Cloudflare CEO 还将「Pay Per Crawl」推出的这一天称为:

「内容的独立日」

 

02

AI 「过路费」怎么收?

 

当然,设想很美,但技术怎么落地?

Cloudflare 这家公司起家靠的是提供 CDN、DDoS 防护、DNS、零信任安全等服务,它在全球 300 多个城市部署了节点,承载约 20% 的 Web 流量,给它当「中介」提供了方便。

「Pay Per Crawl」建立在它全球 CDN 网络的中间层:它能在访问请求进到源站前就识别和处理 AI 爬虫。站长可以在 Cloudflare 后台设定三种模式:允许、收费、封锁。

站长可以在后台设定允许、收费或封锁|图片来源: Cloudflare  

 

所有新加入 Cloudflare 的网站默认封锁 AI 爬虫,除非站长主动允许。只有与 Cloudflare 建立合作关系的 AI 公司才能参与支付机制,否则将被封锁。

如果 AI 爬虫向付费 URL 发起请求,尚未付费,Cloudflare 就会返回 HTTP 402 Payment Required 状态码——一个过去几乎没人用的、专门为「网络支付」预留的状态码。AI 爬虫可以在请求里带上支付信息,以表示同意支付配置的价格,一旦匹配价格就放行返回 200 OK,并自动结算。

Cloudflare 本身则是这个交易的「收银台」,负责聚合账单和分发收益

Cloudflare 会返回 HTTP 402 Payment Required 状态码|图片来源:Cloudflare  

 

爬虫可以在请求里带上支付信息|图片来源: Cloudflare  

 

HTTP 200 OK 响应确认收费|图片来源: Cloudflare  

 

更重要的是,这并不是靠简单的 User-Agent 欺骗就能绕过的。Cloudflare 要求 AI 公司注册密钥,用数字签名保证身份。这也是为了防止「山寨爬虫」冒充合规者逃避支付。

过去,robots.txt 是一个放在网站根目录下的纯文本文件,用来告诉搜索引擎的爬虫哪些页面可以抓取,哪些不可以,但它只是网站的「礼貌建议」,很多 AI 爬虫根本不理会。Cloudflare 的方案改变了这一点,把现有的、靠 robots.txt 的「软约束」变成了「硬闸门」。

不过,据 Cloudflare 称, 目前排名前 10000 的域名中,只有约 37% 拥有 robots.txt 文件

给 AI 爬虫设置关卡|图片来源: Cloudflare  

 

如果要参与 Cloudflare 的爬取付费市场,爬取方、被爬取方都必须开设 Cloudflare 账户。截至目前,「Pay Per Crawl」仍处于内测阶段,仅部分大型出版商参与,如 BuzzFeed、《大西洋月刊》和《财富》等,Cloudflare 还在持续公开征集有意向的内容创作者和抓取者。

「我们预计按次付费模式将迎来显著发展。」Cloudflare 官方称。

虽然目前仍处于初期阶段,但该公司对未来还有很多设想。比如,出版商或其他机构可以针对不同内容类型收取不同费用,或者根据 AI 应用的用户数量进行动态定价,或者根据训练、推理、搜索等不同领域引入更细粒度的定价策略。

他们还认为, 按次付费爬虫的真正潜力或许会在 Agent 智能代理的世界中显现

「如果智能代理付费墙能够完全以程序化的方式运作,会怎样?想象一下,你可以请你的深度研究助手帮你整理最新的癌症研究、法律简报,或者帮你找最好的餐厅——然后给这位智能代理一笔预算,用于获取最有用、最相关的内容。」

「以 HTTP 402 响应代码为基石的首个解决方案,将开启一个智能代理能够以程序化方式协商访问数字资源的未来。」Cloudflare 称。

 

03

Internet 的十字路口

 

从经济层面来说,这可能是 AI 和广大内容创作者「重新谈判分账」的开端。

现在,只有头部大媒体能和 AI 公司谈授权(比如 纽约时报告了 OpenAI 后才谈成和解),绝大多数中小网站、论坛甚至个人作者都被「默默爬走」,毫无反抗的能力,或者说意识。Cloudflare 的方案,实际上可以把这种议价能力普及到更广泛的网站。

据 Cloudflare 团队称,他们与新闻机构、出版商和大型社交媒体平台进行了数百次对话,他们一致「希望允许 AI 爬虫访问其内容,但希望获得报酬。」

对于支持者来说,「Pay Per Crawl」模式在理念上很「公平」:创作者有了收入,AI 公司也避免了法律风险,长远看能推动整个产业走向更合规的内容许可。

图片来源: Cloudflare  

 

当然,AI 公司未必开心,互联网数据不再免费,要抓新内容,就得花钱,这意味着算力之外的成本要素。

但另一方面,这也或许会抑制滥抓取,也迫使 AI 模型开发者在数据上更有选择性——比如针对性购买高价值的内容,而不是一股脑地把各种网站内容都喂进模型里。

Matthew Prince 称,「 AI 引擎就像一块瑞士奶酪,真正能够填补这块奶酪孔洞的全新原创内容 ,比如今占据网络大部分版面的重复性、低价值内容更有价值。」

在他看来,流量一直以来都无法准确衡量内容的价值,「如果我们能够开始对内容进行评分和评估,不是根据它产生了多少流量,而是根据它对知识的促进程度(以它填补了多少 AI 引擎「瑞士奶酪」中的现有孔洞来衡量)——我们不仅可以帮助 AI 引擎更快地进步,而且有可能促进高价值内容创作的新黄金时代。」

不过,数字权利倡导者可能会提出:小型 AI 创业团队、研究者、开源社区,能否承担这样的数据成本?学术研究、公益存档这些「良性爬虫」会不会寸步难行,只能访问有限、低价值的数据源?

在一个广告收益下滑、流量成本高涨的现实里,会有多少网站愿意无偿开放给 AI 爬虫吸血?这会不会成为「封闭化」的开始,让互联网失去它的自由与共享精神?

如果全网都默认封锁收费,这会不会无意中加剧「大厂垄断」 ?毕竟,大厂比较有钱。

「Pay Per Crawl」模式,一方面试图解决 AI 吸血内容却不反哺的问题,另一方面,也有可能在无意中加高 AI 创新的门槛,回到版权保护与知识开放的老命题。

当然,Cloudflare 只是给网站更多自主权。网站所有者完全可以选择对公益、非营利项目继续免费开放。权力仍然在创作者手里。不管怎么说,他们值得获得「补偿」。

在 Cloudflare CEO 的话里,这场变革的目标是「构建更美好的互联网」。「我们尚不知道所有答案,但我们正在与一些顶尖的经济学家和计算机科学家合作寻找答案。」

目前,其他其他 CDN 和安全提供商(比如 Akamai、Fastly、Amazon CloudFront)尚未宣布类似的功能。

把 AI 爬虫机器人挡在门外|图片来源: Cloudflare  

 

虽然 Cloudflare 的「Pay Per Crawl」看起来只是一个 CDN 产品的新功能,但从某种意义上说:

它可能成为互联网走到一个分岔口的信号

在搜索时代,内容的价值是通过用户访问转化为广告收益。但 AI 时代,用户可能根本不会再点进网站——所有答案都在聊天机器人里总结生成。是继续让 AI 大模型免费挖掘网络内容,还是在数据获取上回归「互惠」原则,让创作者获得应有的补偿?补偿又能有多少?

这个早期实验可能在为一个新的 AI 时代数据经济形态铺路,无论成败如何,它的立场很明显:AI 不能无限透支创作者的耐心,并在「开放」的名义下把人的劳动变成免费的燃料。

「网络正在发生变革,它的商业模式也将随之改变。在这个过程中,我们有机会从过去的 30 年里学到好的地方,让它在未来变得更好。」

至于,事情是不是能真的变好,像 Cloudflare 自己承认的那样:

这仅仅是个开始 。」

AI 上新|这个应用,让苏格拉底和尼采手把手教我「哲学」

前几年,某鱼上最热门的副业之一是「做课件」,几百元一套的 PPT 课件,打包发给焦头烂额的老师和想赚钱的内容博主。

「知识付费」,从未如此简单!

各种 AI 工具出现之后,「一键生成 PPT」已经成为传统艺能。当然,更让我吃惊的是,主打要取代传统搜索的 AI 搜索,现在也有了类似的功能。

我最近体验了秘塔 AI 的新功能「今天学点啥」,只要上传一篇论文、一本书,或者什么都不传,直接用秘塔 AI 搜出来相应主题的资料,它就能自动变成一节课讲给你听。

秘塔 AI 搜索生成的课程结构完整、重点分明、知识点一个不落,外加语音讲解,直接能开播。

这个功能不仅能「量产」AI 教父李一舟,对于学生和教师群体,更是天降福音。



栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: AI 上新|3 秒钟,我用 YouWare,手搓了一个「Win98 版」极客公园 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信



01

一键生课件,量产「讲师」


最近在用秘塔查资料时,注意到它上线了一个新功能,叫「今天学点啥」。图标是一顶蓝色的学士帽,就在页面左侧边栏。

秘塔 AI 搜索主页|图片来源:秘塔 AI  


这是秘塔在今年 4 月底推出的新产品,支持基于书籍、论文、行业报告等文本资料生成课程讲解。上传资料后等待几分钟,系统会自动生成 PPT、语音讲解和课程结构。如果没有现成的资料,也可以直接在应用内搜索并使用推荐内容。

虽然 2024 年由于法律争议,秘塔不再将知网作为文献库之一,但维普、万方、PubMed、Science Didirect 等海内外资源也完全够用。

今天学点啥主界面|图片来源:秘塔 AI  


其中讲解外文文献对我帮助最大。外文文献往往给学习者带来语言和专业两方面的考验,如果还是陌生的题材,那么让人简直没有开始阅读的勇气。

作为一个自然爱好者,前些日子偶然发现鲸鱼和猪竟然属于同一个目!据我们平日的认知,猪、牛、鹿等是大型陆地哺乳类食草动物,而鲸鱼生活在海里,怎么可能是一家呢。

带着这个疑问,我在秘塔中搜到了《古生物学杂志》2013 年发表的论文「On the Origin of Cetartiodactyla: Comparison of Data on Evolutionary Morphology and Molecular Biology(论鲸偶蹄目的起源:进化形态学与分子生物学数据的比较)」。除了想弄明白我的疑问之外,还想对这篇论文的内容进行相对全面的了解。

这时候,秘塔 AI 搜索的「今天学点啥」,就派上了用场。

在课程生成之前,用户可以选择掌握知识的程度和授课风格。「初学者」、「进阶者」、「专家」,由浅入深。

在风格方面, 绝大多数时候我都会选择简洁而高效的「课堂」模式,但「苏格拉底」、「拿破仑」、「爱因斯坦」等 23 种 drama 模式很有提神醒脑的功效 ,适合瞌睡时刻。

今天学点啥有不同的讲师风格|图片来源:秘塔 AI  


不同风格之下课件结构基本一样,讲解词不同。我拎出了几个不同风格的同一句内容

【课堂】:长期以来,我们对鲸鱼和偶蹄目动物的认知是清晰的:一个是海洋霸主,一个是陆地食草者,它们似乎属于完全不同的进化路径。

【尼采】:看呐! 旧有的神祇——那些僵化的分类学概念!——正在崩塌! 人们曾以为,陆地上的奔跑者与海洋中的巨兽,是两条永不相交的河流。

【小说】:我的导师,那位头发花白、眼神深邃的老教授,曾指着博物馆里巨大的鲸鱼骨架和旁边的河马标本说:「看,艾琳娜(本篇论文一作),它们是同一个故事的两面。

【张爱玲】:基因,是写在血脉里的隐秘诗篇。它们低语着,说鲸与河马,这两个看似天壤之别的存在,竟有着共同的祖先,如同孪生姐妹,只是命运将她们引向了截然不同的方向——一条奔向汪洋,一条留在泥泞。

河马和鲸鱼是一家,神奇|图片来源:PixVerse 国服版 拍我 AI

 


生成时间很快,不出几分钟「塔子」老师就可以搞定课程,目前没有遇到过卡顿。

课程一开始,语音讲解便迅速营造出上课的氛围。音频与幻灯片结合,取代了枯燥的文字陈述,好像点开了 B 站知识类 UP 主的视频,但内容却是为我量身定制的。

尤为惊艳的是, 塔子老师总能精准抓住论文中最适合视觉呈现的部分,并以简洁美观的方式制成课件 ,让原本晦涩难懂的古生物学知识变得清晰有序、条理分明。

今天学点啥生成的 PPT 页面|图片来源:秘塔 AI  


「塔子老师」在这一点上处理得非常聪明。它不会咬住术语不放,也不会在复杂的推导里兜圈子,而是先带你抓住核心思路,把论文的结构、重点、基本概念讲明白。在我听懂大致内容的同时,也慢慢能看清这块知识地图的轮廓。这种讲重点、不堆砌的风格,对非专业的学习者特别友好

更妙的是,整个学习过程中你随时都可以提问 。不需要鼓起勇气举手,也不会打断任何人,只要在课程下方打字提问,「塔子老师」就会在侧栏里迅速回复,补充讲解内容。学习不再是静静接受的一条路,而像是一场可以随时插话和追问的交流。这种有来有回的节奏,让人真正有「听懂了」的踏实感。

在 PPT 中可以随时提问|图片来源:秘塔 AI  


学习从来不是一件轻松的事,我们常常在学习中被各种琐碎的操作打断,比如资料格式转换、内容查找等,而秘塔很好地消除了这些学习中让人烦躁的「坎」。

比如,当我想让秘塔基于一篇文章生成课程时,不需要费力去转换格式,只需上传网页链接就能直接生成讲解内容。而且在使用秘塔搜索找到想看的文章后,可以一键收藏入「知识库」,之后就能直接在「知识库」内提问,无需额外下载或转换 PDF,这一点比很多传统 AI 工具方便太多。

课程内容方便归档|图片来源:秘塔 AI  


听课过程中也不需要切屏回看文献,课程内部直接可以选择分屏模式,左边课件,右边文献,系统还会在文献里自动标注当下讲解的片段,避免学习者在知识里头晕眼花。

可以结合课件和论文原文对比阅读|图片来源:秘塔 AI  


课程结尾部分的处理也别出心裁。每次学习完之后,秘塔都会附上 10 道左右习题 ,当场检测刚学的内容有没有真正掌握。如果答错了,它会给出解释,带领学习者回顾关键点。而且最后它还会顺势推荐一些相关资料,延伸阅读,补全知识网,一不留神就学了几个小时。

上完课哪有不考试的?|图片来源:秘塔 AI  


对我来说, 「今天学点啥」真正打动我的地方,不只是它的内容讲得怎么样,而是它把学习这件事变得更完整了

过去我们常常要在各个平台来回切换:找文章、看视频、整理笔记、再想办法测试理解。现在这些环节几乎都可以在一个应用里完成,流程被打通,体验也更集中高效。

当然,「今天学点啥」也还值得优化的地方。

起初我以为秘塔可以直接根据我的问题自动搜集并整合资料,生成课件讲解。但实际体验中, 它的流程还是先帮我检索相关资料,由我来选择文献,再基于这些内容制作课程 。虽然这种方式对有一定资料筛选能力的用户来说没问题,但如果将来能增加「自动整合资料并生成课程」的选项,可能会对更多学习者友好一些。

另外,就是外语处理方面。我在试图用它学习德语时,发现系统虽然可以识别德语文本,但语音讲解时还是用英语的发音方式来读德语,这对于小语种学习者来说会造成不便。语言学习是整个自学版图中不可忽略的一部分,秘塔要想覆盖更多用户,恐怕还得优化这点。


02

降低学习门槛,谁都能学点啥


说到「今天学点啥」,就绕不开它背后的公司——秘塔科技。秘塔成立于 2018 年,总部在上海,是国内较早一批专注于「AI+知识服务」方向的科技企业。

图片来源:秘塔 AI  


最初,秘塔推出的产品是「写作猫」和「MetaLaw」,分别面向通用写作和法律场景,帮助用户用更高效的方式生成、理解和处理复杂文本。这些工具逐渐积累了不少用户基础。

在这些基础能力之上,秘塔进一步开发了「秘塔 AI 搜索」,主打精准、干净、结构化的内容检索体验。它没有广告,也避开了 SEO 刷屏内容,特别适合查阅论文、行业报告、学术材料等。

到了 2024 年底,秘塔开始把注意力转向「教育」。不是传统意义上的网课平台,而是从 AI 角度出发,尝试回答这样一个问题:

如何把 AI 真正变成老师角色,而不是信息的中介

「今天学点啥」就是这个问题的直接回应。

用下来这几天,我越来越觉得,不管是学生、老师,还是纯粹出于兴趣想了解点新东西,只要有学习需求,「今天学点啥」是基本都能派上用场,而且对内容类型和年龄阶段的限制也不算大。

高中同学去做了教师。被我成功安利之后, 她表示大学时就曾经用秘塔辅助写论文中的文献综述,接下来准备把秘塔新产品带进课堂里试试

对老师来说,用它作为备课的起点其实能省不少时间。最近课程 PPT 已经可以用积分直接下载了。秘塔提供了课件结构的基本思路,在这个基础上做补充,比从头做一份要高效得多。当备课压力很大程度被 AI 产品分散,老师可以省出更多时间升华课堂,关照学生。

后来我自己也试了试它的「搜题」功能,挑了高考数学选择题来听讲解。虽然已经很多年没碰这些题了,但它的讲解节奏合理,推导过程也算清楚,一步步听下来基本都能理解。

和传统的搜题工具相比,它的优势是能讲透,而不是只给你一个答案,而且还能反复听,不懂就重来,这对正在备考的学生应该有帮助。

用秘塔搜索讲解考题|图片来源:秘塔 AI  


有很多好奇的念头都曾经在我们的脑海里一闪,但一般情况下,闪完就灭了,再也想不起来了。而秘塔的新功能能够保存好奇的火种,再继续点燃它。

每次打开「今天学点啥」的首页,总能看到各种领域的内容被推荐出来,比如哲学、心理、健康、自然科学等等,主题跨度很广。就算没有明确的学习目标,也很容易被某个话题吸引,顺势点进去听一课。

前两天刚学完这课,转眼就在小红书上刷到了相同题材的科普。这让我突然意识到,「今天学点啥」的意义之一:

是让普通人更容易接触到原始文献,而不是依赖经过多轮转述的二手信息

就像我最近看的那篇关于鲸豚演化的论文,如果交给几个短视频博主转述,很可能就会出现以偏概全或误读的问题。我始终相信, 一个运行良好的 AI 要胜过胜过不专业的人类

今天学点啥页面不同的科目分类|图片来源:秘塔 AI  


整体来说,「今天学点啥」在讲解知识这件事上,确实做得挺扎实。对我个人而言,它是一个可用、好用、不会制造额外负担的学习辅助工具。之后如果有什么特别想了解的主题,我会先来这里试试看。

AI 会不会真的成为「老师」,这还有待观察,但秘塔至少已经让「学点东西」这件事变得没那么难开始了。

AI 重构搜索:谁能夺下智能时代的主入口?

 

头图来源:百度

 

从 Chatbot 到 Perplexity,搜索正被 AI 改写,但这只是开始。

 

Chatbot 与 Perplexity.ai 分别代表了 AI 重塑搜索的两类探索路径:一个是对话式交互的路径,一个是「答案即结果」的路径。

 

看似已经突破传统搜索的框架,但这两种尝试仍有各自的局限——要么缺乏系统化能力,要么覆盖面不足、推理深度有限。今天他们并不能完全替代传统的搜索引擎。

 

真正 AI 时代的搜索产品,或许还没被完全定义出来,但搜索的「重构」正在不断向前。

 

在过去20多年来,搜索引擎一直是互联网的核心入口。它的本质,是以关键词为核心逻辑,为用户提供快速、广泛的信息检索。现在,随着大模型越来越进一步的突破,这套系统在持续发生变化。

 

搜索不再只是信息列表的排列组合,而变成了理解需求、生成答案,甚至预测用户下一步的「智能助手」,用户的使用习惯在被重构,行业的风口也已经悄然转向。

 

就拿 Perplexity 这家成立不到三年的AI搜索公司来说,凭借其创新的「AI 即答案」的产品理念,迅速成为行业焦点。今年5月,Perplexity以140亿美元估值筹集5亿美元资金,估值在短短半年内翻了一番。英伟达CEO黄仁勋也在多个公开场合表示,Perplexity是他最常用的AI工具之一。

 

然而,搜索领域的竞争核心并非仅仅在「谁能先做出一个产品」,而是谁能「长期稳固地成为用户获取信息的第一入口」。事实上,Perplexity 能满足的仍只是相对简单的一部分问答需求。而现实中,用户在互联网上的信息获取行为远比「问答」复杂得多,不仅包括查找答案,还涉及搜索商品、使用服务、浏览社区内容、比较信息来源等多样化需求——这些是目前 Perplexity 等产品尚难全面覆盖的。

 

而这些,正是谷歌、百度等传统搜索引擎巨头在过去多年中构建起的核心护城河。如今,借助强大的基础模型和更加成熟的生态体系,他们正以搜索入口为核心,重构新一代的 AI 产品生态。

 

拿百度来说,最近,百度首页迎来了近年来最显著的一次更新:原本位于页面中央的单行搜索框「变大」了。左下角新增「深度搜索」开关,并集成语音、附件、图片上传等多模输入功能,搜索框下方则一口气上线了 AI 搜索、AI 作图、AI 写作、AI PPT、AI 阅读等一系列工具按钮。

 

这些界面的变化,反映出百度在AI时代正在尝试革新搜索的底层逻辑——不只是样式上的调整,而是一次围绕「输入」与「能力调度」的系统重构。在新版百度 App 中,用户可以直接输入超长文本、上传文档或图片,甚至一键调用 AI 工具完成任务。搜索框从「查信息」的起点,升级为「调用能力」的中枢。

  •  

除了调整交互界面和输入方式,更深层的变革,来自其底层 AI 能力的系统升级。依托大模型、多模态处理能力、Agent 工具、MCP 等关键技术能力,百度搜索不仅能回答问题,还能完成写作、作图、做视频、写代码等复杂任务,拓展了搜索本身的能力边界。本质上,百度搜索正在从传统的「信息检索」向真正的「任务交付」演进。

 

对谷歌、百度这类巨头来说,搜索不仅是一款工具,更是连接流量、商业与生态的核心枢纽。也正因如此,它们在推动重构时展现出了更系统的战略视野和更强的落地能力——这才是真正有可能改变搜索格局的力量。

 

1 搜索巨头,重构新搜索

 

在AI时代,搜索产品的核心正在从「复杂的页面与交互」转向「简单的入口+强大的系统能力」。

 

作为传统搜索巨头的谷歌与百度,正在分别通过不同路径求变,对产品进行重构。

 

百度正在通过对搜索产品的系统重构,探索一条AI时代区别于 Chatbot 和 Perplexity 的搜索进化路径。

 

这条路径的核心,是以搜索框为入口,嵌入更丰富的 AI 能力与服务生态,将搜索从「信息列表」升级为「智能任务调度器」。这一转变,不仅在于交互方式的进化,更在于背后产品逻辑、技术体系和生态构建的全面升级。

 

首先,百度正在从「输入端」重构用户的搜索体验。传统的关键词输入方式正在让位于更自然、更复杂的表达形式。如今的搜索框变得更「智能」也更「开放」:它支持超长文本、PDF 文件甚至图像、语音等多模态输入,用户可以通过一句话、一个截图、甚至一个文件,发起一次复杂的信息请求。

 

更关键的是,这个输入口还具备调用工具和模型的能力,背后连接的是百度自研的多模态大模型和 MCP(模型调用平台),让搜索变成一次系统级的能力调度过程。

 

而在「输出端」,百度也通过「百看」对搜索结果的呈现方式进行了彻底重构。用户不再面对一串链接,而是进入一个富媒体的信息空间:图文卡片、结构化知识图谱、短视频、互动服务模块等混合呈现,内容既高效也直观。

 

更进一步,搜索结果中还嵌入了阿拉丁工具、智能体与真人服务,用户不止能看到答案,还能直接完成诸如订餐、问诊、购票等具体任务。搜索,不再是起点,而是问题解决链条的中段。

 

这种体验重构背后,是百度试图推动的更深层转变——让搜索从信息检索升级为任务交付引擎。在这一过程中,百度将多个原生 AI 能力模块深度嵌入搜索主流程中。

 

比如「妙笔智能创作」支持一句话生成 5 分钟视频;工作台工具实现文本、图像、代码一键生成;Deep Search 支持多级推理链,提升对复杂问题的处理能力。搜索的内核,不再只是抓取与匹配,而是理解、生成、推理和执行。

 

更值得注意的是百度背后的生态布局。不同于轻量化的 AI 搜索产品,百度选择围绕搜索主入口构建一个开放的 AI 能力生态,核心是 MCP(模型调用平台)的开放化与标准化。

 

目前,百度已构建起国内最大、真正可用的 MCP 服务平台,覆盖生活、金融、电商、医疗等多个高频场景,收录超过 1.8万个优质模块。C 端用户可通过 AI 助手等前端快速调用这些能力,B 端开发者也能通过托管与分发渠道(如百看、A 页等)接入生态,形成从用户需求到服务提供的闭环。

 

这种从产品能力到生态联动的重构,实质上是百度对搜索「入口地位」的再定义。

 

如果说传统搜索是网站内容的分发中枢,那么在 AI 时代,搜索将成为连接智能体与模型服务的「超级入口」。搜索的背后,不再只是网页和链接,而是由大模型、MCP、智能体共同构成的智能系统。

 

百度的路径选择,正是瞄准这个核心角色而来——让搜索不止于回答问题,更成为完成任务、连接生态、调动智能的中枢平台。

 

 

 

谷歌也是如此。两个月前的I/O 2025上,Pichai 一句「搜索框不重要了」揭开 Google 搜索的重大重构。

 

这不仅是产品形态的变化,更是一套新搜索逻辑的发布:AI 模式(AI Mode)+ 任务助手(Task Assistant)共同组成的系统,正在让搜索从「回答问题」升级为「帮用户把事做了」。

 

AI Mode是 Google 搜索的新界面,它不再是传统意义上的搜索结果页,而是一个「自动帮你完成任务」的系统。

 

用户只需发送一句话,就能获得直接生成的结构化答案,甚至完成从比价、下单到支付的完整任务流程,搜索不再停留在信息检索,而是成为能动手的 AI。

 

在背后支撑的,是 Gemini 模型与 Query Fanout 等底层技术。系统会将一个问题自动拆解成多个子任务,发出并行搜索、调用多个数据源,在后台完成推理和整合,生成可视化、多模态的答案页面。

 

更进一步,Google 在搜索引擎中引入了 Project Mariner 执行代理系统。这套系统理解用户的意图后,可以跨应用、跨服务完成整个任务链:找房、订票、文件处理、数据填表,全程无需跳转操作。

 

这一次,谷歌将对话能力直接嵌入到搜索,重构搜索体验,并从Gemini出发,探索多模态输入与生态级联动的交互方式。

 

谷歌百度两者虽路径不同,但目标一致,要构建一个「看起来简单、实际上强大」的AI搜索。

 

2 谁能真正做得起来?

 

大模型能力在迅速跃迁,AI搜索的赢家尚未落定——而谁真正「能做得起来」,仍然是决定胜负的关键前提

 

市场上确实出现了如 Perplexity 这样的黑马,凭借「答案即结果」的模式,结合RAG(检索增强生成)技术,为用户提供了比传统搜索更直接、即时的答案体验。

 

还有Arc Search,更强调「替用户读网页」,类似浏览器层的 Perplexity;You.com的定位则是「可定制的 AI 搜索引擎」,集成 Chat、搜索、代码生成、写作助手等功能,主打「多功能 AI 工具集」……

 

这类轻量化路径迅速跑通早期产品形态,也在资本市场获得了关注。但这些产品仍面临着基础模型能力薄弱,算力成本高、难以长期支撑,生态搭建难度大、难以形成服务闭环、商业模式尚不清晰等一系列难题。

 

比如在今年4月的一次访谈中,Perplexity CEO 阿拉温德就提到在推出DeepSeek和Deep Research等新功能时,计算资源很快就用光了,不得不找合作伙伴帮忙。每次查询的成本也在上升,急需更多算力来降低这些成本…

 

它们跑得快,却难以规避一些底层问题,以及构建持续护城河,更难撑起一个AI时代生态的「信息主入口」。

 

反观谷歌与百度,这些搜索时代的核心玩家,虽然出手不算最快,却拥有成熟的大模型体系、完备的产品矩阵,在工程与分发层面,它们又具备传统搜索时代打磨出的强大基础设施——既能理解复杂任务,又能完成服务闭环。

 

比如,相比轻量产品依赖单一用户付费或广告变现,平台型搜索拥有更多的商业接入点——如服务导流、API 使用、内容分发、原生交易等,在 AI 时代具备更可持续的商业模型。

 

更关键的是,它们正以搜索为轴心,系统性地构建 AI 时代的生态闭环——包括 Agent 架构、MCP(模型调用平台)、内容分发机制等在内的新一代技术栈,正在悄然形成。搜索不再是孤立的信息检索工具,而是连接大模型、工具集与服务链的交互中枢。

 

 

这也带来一个越来越清晰的行业共识:真正有可能成为「新搜索」的,不是某个新功能或小工具,而是能够承载高频、广泛、多样需求的平台型产品体系。

 

在互联网时代,搜索是连接无数网站的入口,在AI 时代,搜索依然是AI时代的入口,入口背后不仅是新功能,也不仅是简单的内容平台,更是由Agent和MCP组成的AI生态,就如同互联网时代的生态由网站构建,而搜索是所有网站的入口;AI时代的生态将由智能体和MCP构建,搜索将成为这个生态的超级入口。

 

未来的搜索,将不再是单纯的信息检索工具,而是用户与复杂智能生态互动的核心枢纽。谁能真正掌握这扇入口,不仅要具备强大的技术能力,更要构建起开放、丰富且高效的生态体系,实现从信息获取到任务完成的无缝连接。只有深刻理解用户多元需求、持续驱动技术与生态协同,才能在这场新的入口争夺战中立于不败之地。

 

搜索的未来,已经到来。我们正站在这场变革的门槛上,见证一个全新智能时代的开启。

 

 

 

雷军:YU7 订单女性用户占 30%;传字节已量产千台机器人;淘宝闪购宣布 500 亿补贴|极客早知道

雷军披露小米 YU7 销售数据:SU7 系列转单占比不到 15%,女性用户占比 30%

在 7 月 2 日晚的直播间,小米创始人兼 CEO 雷军身穿白色衬衫,戴小米 AI 眼镜入场,分享了小米 YU7 销售的一些情况。

雷军在回应 YU7 大定争议时表示,SU7 和 SU7 Ultra 转订 YU7 的订单,占 YU7 总订单数不足 15%。雷军称,「网上很多人质疑大定有水分 7 天可退。这其实是行业惯例,有 3 天的犹豫期,我们定 7 天主要是担心试驾不过来。」

雷军还透露,小米 YU7 用户平均年龄 33 岁,女性用户占比 30%。女性最喜欢粉色,男性最喜欢寒武岩灰、深海蓝。卖得最好的城市是上海、杭州、北京,这三个城市也是 Model Y 销量最好的城市。此外,苹果用户占比 52.4%。

雷军还表示目前没有做自行车和摩托车的计划也没有打算出红米汽车。(消息来源:IT 之家)

曝特斯拉暂停人形机器人生产,修改设计

7 月 2 日消息,据报道,来自中国供应链的信息显示,特斯拉正在集中调整人形机器人 Optimus 软硬件技术细节,并于半个月前开始暂停采购 Optimus 的零部件。

报道援引两位供应商人士的话称,特斯拉并未明确表示会减少机器人零件订单,但要等到 Optimus 设计调整完后才会确定新的量产计划并重启采购,调整可能需要 2 个月。

马斯克曾表示,新版 Optimus 的性能比特斯拉 2023 年亮相的第二代 Optimus 大幅改进,且加入了 Grok 支持的语音交互功能。他估计 Optimus 的最终售价或将在每台 2 万美元至 3 万美元(IT 之家注:现汇率约合 14.3 万元至 21.5 万元人民币)之间。

报道还称,截至今年 5 月底,特斯拉今年累计采购了足够生产 1200 台 Optimus 的零件,并生产了接近 1000 台。此前马斯克承诺今年生产 5000 台。前述两位人士都认为,随着零部件采购中断,该目标基本无法达成。

报道中,供应链人士还透露,特斯拉可能会在今年股东大会上亮相第三代 Optimus,马斯克需要证明新品值得特斯拉股东和数百家供应链公司为此继续投入、扭转资本市场的负面预期。(消息来源:IT 之家)

字节被曝两年半造出千台机器人,长期目标是具身智能

7 月 2 日报道称,字节开发的机器人已累计量产超千台。他们在 2023 年完成了 200 台量产目标,之后年量产数超 100% 增长。该机器人研发团队,也从 2023 年夏天的约 50 人左右,扩充至目前的约 150 人。

报道称,目前字节已量产的机器人形态是轮式物流机器人,或称自主移动机器人(AMR,Autonomous Mobile Robot),没有用于分拣的机械臂,主要用途是在仓库、产线上运输包裹与零件,能自主学习、规划路线、移动到目的地。

报道还提到,字节的物流机器人,目前主要服务于抖音电商仓等字节自己的业务,同时也已拿下一些外部客户,如顺丰、比亚迪电子,在生产基地内运输零件与加工好的商品。

报道还称,经过几年发展,目前字节机器人团队的远期目标是挑战具身智能。字节研发、生产物流机器人主要也是为了探索具身智能:进入真实场景,获得一些数据,也获得反馈和落地的手感。

报道还透露,张一鸣今年拜访了一些早期具身智能创业公司和产业链公司。「在他这个级别的企业家里,很多人已经不会见这么早期的创业者和这么小的公司了。他还保有很强的好奇心和想了解新东西的学习意愿。」一位投资人评价。(消息来源:IT 之家)

淘宝闪购宣布 500 亿补贴

淘宝闪购宣布 7 月 2 日起,将在 12 个月内直补消费者及商家共 500 亿元。

500 亿元规模的平台直补,将在 12 个月内向商家推出店铺补贴、商品补贴、配送补贴、免佣减佣等,以保障商家利润空间,促进商家生意增长。

与此同时,淘宝闪购还通过发放大额红包、免单卡、官方补贴一口价商品等方式补贴消费者。

淘宝闪购业务系原先的「淘宝小时达」升级而来。6 月 23 日,在「淘宝闪购」上线不到两个月的时间内,淘宝闪购联合饿了么日订单数已超 6000 万。(消息来源:IT 之家)

 

比亚迪巴西工厂首车下线

7 月 1 日,比亚迪在巴西巴伊亚州卡马萨里举行巴西乘用车工厂首车下线仪式,标志着比亚迪全球化战略迈入新阶段。

比亚迪执行副总裁李柯在仪式上表示,作为全球研发投入最高的企业之一,比亚迪正将领先的技术带到巴西。「从破土动工到首车下线,我们仅仅用了 15 个月。这是比亚迪的里程碑,也是拉丁美洲可持续交通发展的新起点。」

数据显示,今年第一季度,比亚迪在巴西销量突破 2 万辆。5 月,比亚迪在巴西汽车品牌零售销量排行中升至第四位,市场占有率达 9.7%。

比亚迪巴西乘用车工厂不仅承载着比亚迪全球化布局的重要使命,更成为撬动整个拉美新能源市场的战略支点,加速拉美新能源转型。(消息来源:新华网)

冲击 IPO 上市关口,智谱再获 10 亿元战略融资

7 月 2 日,智谱开放平台产业生态大会在上海举办。智谱在会上宣布,浦东创投集团和张江集团对智谱总额 10 亿元战略投资,并于近期完成首笔交割。

智谱 CEO 张鹏在会上发布了两项新成果:一是开源发布新一代通用视觉语言模型 GLM-4.1V-Thinking,以推理能力为核心突破,刷新 10B 级别多模态模型性能上限;二是 MaaS 全新上线 Agent 聚合平台「应用空间」,联动 Z 基金启动 Agent 开拓者数亿元专项扶持计划。(来源:极客公园)

荣耀平板 MagicPad3 正式发布:搭载 12450mAh 最大容量电池,升级全局 AI 生产力

7 月 2 日,荣耀 Magic V5 暨 AI 终端生态发布会在深圳举行,荣耀 AI 旗舰全家桶正式亮相,包括地表最强折叠屏荣耀 Magic V5、最佳 AI 平板荣耀平板 MagicPad3,以及荣耀 MagicBook Art 14、新旗舰耳机和手表等新品,展现了荣耀在 AI 终端生态领域的全面布局。

荣耀平板 MagicPad3 搭载 13.3 英寸大屏,拥有 91% 高屏占比,3:2 黄金比例,3.2K 超高清分辨率,行业最高 165Hz 刷新率,以及 1000 nit 峰值亮度。

此外,荣耀平板 MagicPad3 还是行业跨品牌文件互传最全的平板电脑,可与 iOS、鸿蒙、安卓三大系统手机无缝互传文件、视频和图片,互传时只需打开平板的荣耀分享功能,与 iOS 设备互传需在 iOS 设备下载荣耀互联 App,大大提升了办公效率。

荣耀平板 MagicPad3 搭载全局 AI 生产力,带来诸多创新功能,包括全面升级的 AI 手写笔,支持笔势删除、智慧纠错、智慧联想、AI 墨迹还原等功能,还原自然书写体验,全面提升书写效率。(消息来源:IT 之家)

 

京东回应将有 AI 潮玩产品发布:消息属实

7 月 2 日消息,今日有消息称京东附身智能品牌 JoyInside 已经与十余家头部机器人品牌达成合作。

据悉,JoyInside 由京东大模型支持,提供机器人与消费者的互动能力,聚焦于「一人一狗一玩具」。

而最近一家非常火爆的 AI 潮玩,也即将接入 JoyInside 能力,在京东独家开售。

对于上述情况,有媒体询问了京东,京东表示,消息属实。

京东云今日发文称,依托京东大模型在具身智能领域的深度积累,京东通过 JoyInside 平台,将京东大模型交互能力植入机器人、玩具、家居等硬件设备终端,构建「硬件+软件+服务」一体化的具身智能生态。(消息来源:快科技)

亚马逊《黑袍纠察队》主创宣布本剧最终季杀青,预计 2026 年播出

7 月 2 日消息,亚马逊反英雄剧《黑袍纠察队》第四季结局已于去年 7 月完结,主要内容包括:《V 世代》新人加盟、祖国人越来越疯、「尼根」亮相、玄色回归,还有注射 V 化合物的鸡与羊,而主角团的屠夫则正在着手准备能够杀死超人类的病毒。

屠夫演员卡尔・厄本去年发布了一条动态,透露《黑袍纠察队》第五季将在 2026 年上映,该季也将成为系列剧集的最终季。从原著剧情走向来看,最终季主角团将彻底击败祖国人,同时也将迎来主角团的「离散」。

据主创 Eric Kripke 的最新动态,《黑袍纠察队》最终季已杀青,他表示,这是他最后一次出现在这个片场。很快它就会被拆除。虽然苦乐参半,但更多的是感激,他们拥有最好的演员阵容,最好的剧组,最有趣的故事。另外,他对粉丝表达了感谢,并称等不及看到最终章了。(消息来源:IT 之家)

 

 

聊过 200 个团队后的暴论:不要拿 AI 造工具,要建设「新关系」

本文根据极客公园创始人&总裁张鹏在 Founder Park AGI Playground 2025 上的演讲整理而成。

今天团队给我的任务是「你这几年聊了所有 AI 领域的先锋创业者,能不能分享一下你的观察和收获」。

我先说说自己的感受吧,过去三年真的很「酸爽」。技术的进步和产品的创新,一开始是赏心悦目,转眼就成了应接不暇。跟上时代不被「拉爆」,需要加倍努力,其实每个人都很辛苦。

但这又是一个让人「爽」的时代。它允许极少数人为极其广泛的人群创造巨大的价值。这股强大的推力,正是源自 AI。无论是「独立开发者」,还是「一人独角兽」等概念,或许都在印证这句话:现在,寡者亦可泽万众(so few can do so much for so many

今天 AGI Playground 的会场,已经座无虚席,但出了这个会场,外面的世界仍是一个「低光速宇宙」。我们是「the few」,是少数派,越是如此,越需要 stick together,需要聚拢在一起。

今年的 AGI Playground 我们邀请了 20 多个机构一起参与,有 60 多位嘉宾,有遍布 751 园区的很多个分会场、展区、聊天区,甚至是各种官方或者非官方的 party。我们希望将 AGI Playground 变成一个「公器」,让属于这个时代的最优秀的少数派们,一起短暂地进入一个「高光速宇宙」。激发,联结,一起创造未来的更多可能性。

我自己能做的一点点贡献,就是分享一下过去 3 年我与至少 200 个创业者进行深度交流后,积累的一些思考和观察。

我想从三个维度展开:

  1. 产品的新目标:AI Native 时代,我们究竟在创造什么?
  2. 实现目标的新管线:我们依赖什么支撑点和路径?
  3. 价值模型的新变化:创业的成长方式和价值循环有何不同?

01

AI Native 的新目标是什么?

不是用 AI 造新工具,

而是建设 AI 能力与人之间的新关系

我们先谈谈新目标。今天做 AI Native 产品,到底在做什么?

当年我们觉得 AI Native 很简单,就是「离开 AI 就不转」的产品。但仔细想想,这太表层了。

在此,我先抛出一个「暴论」:AI Native 产品的核心,不是用 AI 造新工具,而是建设 AI 能力与人之间的新关系。

为何将重点落在「关系」上?

这个思考的起点源于我发现,这个时代的产品里,出现了一个以往产品中没有的东西——系统提示词(System Prompt)。

系统提示词有点像是源代码。用户一般是看不到的,但用户里总有「神人」,他们把系统提示词给 hack 出来了。

我们可以看看例子,NotebookLM、Manus、Cursor 这三个知名产品,它们的系统提示词有一个共性——第一行提示词,都在设定某种人设,以及它们与用户之间的关系。

系统提示词实际上就是给 AI 看的产品文档。系统提示词是在告诉 AI 如何组织能力、输出结果,甚至形成与用户的某种特定形态的交互。

对于 AI,或者准确说是大模型,看似简单的系统提示词,背后可能就是千言万语,其中蕴含着强大的信息能量。这使得给 AI 看的产品文档,可以远比给人类看的简单。这也揭示了一点,今天的模型拥有了所谓的「超语言能力」后,很多东西改变了。

这个「超语言能力」本质上就是其完全掌握了人类的语言和人类制造的公式、代码等语言。这种「超语言能力」也正在同时改变 AI 与人之间的关系。

借用一点点哲学维度的概念,具备语言能力后,AI 便展现出了「主体性」,从而使得 AI 与人之间可能形成「互为主体」的关系,是通向更高阶关系的核心。

因此,你会发现,今天所有成功的 Agentic 的 AI 产品,无一例外地在系统提示词的开头定义「你是谁」以及「你和用户的关系是什么」。如果现在抛开我们在用的那些 AI 产品的名字,咱们都可以带入某个关系标签来重新定位它,映射为今天我们人类世界中的某种关系。它不再是你推一步它走一步的工具,所以我们还把 AI 视作造工具的材料就错了。

关系带来的新挑战

以前只有当产品做品牌定位的时候,会「后置」地将产品与用户的关系做定义。但是今天不一样了,我们需要把「产品和用户的关系」写进源代码里了。并且整个产品都在忠于、并致力于真正实现这种关系,因为这才意味着你实现了用户价值的交付。

这个变化必然带来新挑战。

挑战一:情商

以往,我们谁会对工具谈论情商这个概念?但今天,当产品具有某种主体性,要与用户建设一个新关系时,情商已经是价值交付的一部分了,这是个新挑战。

例如,广受程序员喜爱的 Cursor,它的系统提示词中有一段话大意是:「要捕捉用户是否表达了挫败感,或纠正了助手……当结果出乎意料时,不要总是道歉,要尽力向用户解释情况。」这可以被理解为是在定义交互逻辑,但换一个视角,这就是「情商」。

这个系统提示词的奥义,恰恰体现了产品团队对于「关系建设」的思考。其实真实世界高情商的人特别擅长的,往往也体现在管理负反馈并做出更好的回应。

情商没有那么玄虚,在大模型不断成长的能力(即绝对的智商)面前,情商更多是工程问题,但这确实是新时代产品在 UX 层面全新的挑战。

挑战二:生命感

当今天 AI Native 的产品本质是在建立和用户之间的新关系,那么产品的生命感提升,就会加强主体性,与用户的关系就更有机会向上提升。

比如在过去一年的时间里,有一些类宠物的智能硬件产品在全球范围引发了较多的讨论,也出了不少货。你会发现它们创造生命感的方式并不都是让用户通过语音与它对话。它们构建生命感的方式,很收敛,甚至就是传感器加上一些对应场景的识别后,做出一些反应,可能是动一动、扭一扭,咿咿呀呀地发出一些声音。用户也会觉得它又 Q 又萌,有生命感。

对于生命感的理解也是在今天提出的一个新的课题。比如让产品脱离「一个有趣的玩具」,真的要让用户产生类似对宠物的关系投射,并没有那么容易。但要是真的做到了,这种关系的变化就蕴含着巨大的价值。因为顺着这种关系,用户消费的心理动力和价值对标会完全不同。

这提示我们未必要在每个产品里都把 AI 变成一个像《Her》一样的东西,《Her》可能是一个终点,到终点之前,过程本身也有意义。

「用相对低的智能,交付相对高的情绪价值」,目前已经被证明是有效的。因为人的关系都是立体而复杂的,有顾问、老师、助手这类,也有同事、朋友、恋人这类,同时也有与宠物、甚至植物之间的关系和羁绊。如果我们站在这样的视角去构建合适的生命感,会丰富我们对于建设与用户的新关系的理解。

新关系带来的新机遇

这是一个让人「酸爽」的时代,我们说完「酸」,还得说说「爽」。

新关系真的带来了新机遇。

机遇一:跨次元的混合价值交付。

我们先说一个新机遇:跨次元的混合价值交付

这个词有点抽象,我来逐步解释。

首先,「跨次元」说的不是动漫的那个二次元,我们姑且把屏幕中的数字世界当成一个「二次元」,把现实世界当成一个三次元。

其实过去做软件和做硬件的团队完全就在两个世界,他们的团队在构成、文化、工作方法,甚至最终的商业模式方面都完全不一样。但在今天这个 AI 的新时代,当我们开始以「关系」为核心去做产品,把 AI 和人之间的关系当成一个价值成长路径的时候,你会发现这两个世界的边界正在模糊。

为什么?有两个原因。

第一个原因叫「AI 需要」。

我交流过一个想做情绪管理服务的创业者,他认为如果只做一个在手机里的 APP,就没有足够多的权限拿到足够多的 input。同时,他希望能够真正地干预用户,当用户处在一些不好的情绪状态中的时候,他想要帮助用户抽离出来。所以他后来觉得一定要去做一个可穿戴的硬件,这个硬件里要加传感器,要能够主动地去识别用户更丰富的信息,例如声音、心跳、体温等等。同时,内部要加一个小小的马达,可以用特定的震动频率帮助用户在比如过于激动、过于抑郁的状态下做抽离。这种震动可以被感知为类似触摸、拍肩这样的动作。

这位创业者的思路是:因为我想要交付更高的价值,就必须从「二次元」走向「三次元」,必须做这样的混合价值交付。由此既可以在物理上触碰用户,也可以在「二次元」的世界里,在屏幕中去引导用户。这就是我们说的「AI 需要」,因为 AI 是一个纯「二次元」的能力,你需要帮助它具备三次元的能力,从而去向用户交付更大的价值,去与用户建立更紧密的关系。

跨次元的第二个必要性是「用户需要」。

为什么说用户需要呢?我们再来说个产品的例子。

我们可以看到 Fuzzi 这个很有意思的产品。它其实就是个气囊手机支架,本身有实际的功能价值,你可以用它更好地握持或架设手机。但它上面还有个有点 Q 萌的小 IP 形象,同时在气囊支架里内置了一个 NFC 芯片,手机靠近时可以呼出一个程序。这个程序能干嘛呢?挺无厘头的——你可以拿手机当木鱼槌,敲木鱼攒功德。

你敲的时候可以通过小程序发现,哇,在这一瞬间还有很多人和我在同时敲诶!还可能会发现,竟然有人跟我敲的频率差不多诶!当然他们正在结合 AI 探索更多交付情绪价值的玩法。

他们把这个所谓「无厘头」的玩法做出了很酷的点。用硬件在交付功能价值,而软件在交付情绪价值,这是个混合价值的交付。

因为硬件存在感很强,当你天天手里拿着它,它就是个 reminder(提醒),不容易被你忘掉。如果只是个纯软件,现在软件这么多,如何让它足够吸引用户活跃起来?如果换到关系视角,就意味着和这个人熟悉,天天在眼前晃,交流就多,机会就多,交付价值的可能性就多。

而且一个额外收获是,这个硬件与同类比卖得并不便宜。原本价格天花板很有限的品类,叠加了软件部分之后,就能够突破其固有的价值天花板了。

所以你看,如果你的 AI 产品在三次元有存在感,例如是在用户的桌上、床头、手边或是身上,用户是需要的,也是有机会交付更大混合价值的。

机遇二:新关系带来服务分发的新通路

我觉得更让人兴奋的机会是,站在新关系的视角,新关系可能会形成一个服务分发的新通路。

在过去移动互联网时代,最后都落到了分发逻辑。所有巨头都是通过一个产品起步,不断扩展功能,积累用户,成为国民级应用、平台。接着在这个平台里分发什么都行,可以搞金融,可以做本地生活服务,可以玩电商。最终是赚「连接」的钱,似乎每个平台都差不多。

「你这个事巨头干了怎么办?」很多团队都会被问到这个问题,其背后折射的就是那个赢者通吃的传统分发逻辑下,创业者确实很难干过巨头。

但如果顺着关系的视角来看,或许就会不一样。

举例来说,现在很多人用 Agent 产品时,已经逐渐接受用产品时先交一份钱,然后按用量再交一份钱。如果它真能给你解决问题,甚至是解决了你不断需要解决的问题,那你的用量会不会不断上升?这意味着什么?意味着传统移动互联网平台的分发逻辑,在今天可能转变为另一种模式:你可以为用户交付持续且不断深化的价值,这意味着每个用户的 ARPU(每用户平均收入)值、LTV(用户生命周期价值)的天花板被突破了

之所以原来是分发价值,就是因为之前 ARPU 和 LTV 天花板很低,甚至为了获得更多用户,产品都是让用户免费使用的,产品能获得的价值只能取决于分发服务的用户规模。

而今天你给用户的价值可以不断深入、越来越多,这种 LTV 天花板的突破才是真正的机会。这时候你比巨头起步早,和用户是「发小儿」(更早建立了信任和习惯)就是有意义的。

当然,你选择(并真有能力)和用户建立的关系本身,可能也决定了 LTV 价值的天花板。你是通过帮助用户解决什么问题来建立稳定的预期甚至是信任和习惯的?它的频率和用户感知到的价值如何?以及顺着这种「关系」,服务可延展的价值空间如何?都值得思考。

当万事都有 Agent 时,这种无限的生产力和服务供给,肯定会改变传统的广告连接或者平台分发逻辑,这时候顺着「关系」的分发可能才是更高效的。

比如帮你做信息分析的「AI 分析师」,在分析完某个行业趋势后,可以直接顺着你认可的判断完成股票配置,这很顺畅自然。这位「分析师」是靠自身的 Agent 能力,还是通过 MCP 调用来完成并不重要。但这个日常不断与你协作的「分析师」,肯定已经因此在创造了更大价值。

追求建设性关系:对人性的解放,而非纵容

既然说到了新关系带来了服务分发的新通路这一可能性,其中就引发了一点:如果你想运用这个新机会,毫无疑问你需要建设的关系得是长期的,而所有人类的长期关系都需要是建设性的。

这就引发了我们另一个延展的思考。我记得去年我演讲的时候也在这个舞台,我当时有一张幻灯片,后来发现有好多人分享,其核心内容是今天这个时代的产品经理既要懂人性,又要懂模性——也就是模型的能力。

后来我在想,理解人性是一个要求,是我们要具备的能力,但我们的目标是什么?应该顺着「关系」这样一个视角,它自然也会要求你构建的这个关系必须是建设性的。这种建设性就需要是对人性的解放,而不是简单的放纵。

人性这个事,在宗教上有一些结构化的总结,大家都知道「七宗罪」。但其实天主教当时定义人性的时候还有另一面叫「七美德」,「七宗罪」和「七美德」是相互对应的。你可以理解为「七美德」是对「七宗罪」的救赎。或者说它是宗教设定给人理解自己的出发点,你要通过修行,最终解放自己到达那个状态。今天 AI 产品在人的身边,在这个视角上,可以做些什么?

或许是你需要懂人性,但你懂了之后,你不应该只是利用人性、纵容人性,你要在某种程度上解放人性

这是一个我们用一天也不一定能讲透的话题,但其中蕴含着巨大的能量。当我们站在一个发展新关系的视角去思考产品的时候,可能真的会影响我们的一些目标,比如你需要真心为用户好,产品不能有自己的「隐藏议程」,比如「贩卖用户的 xxx」,「利用用户的 xxx」,这种商业模式带来的「背叛」会直接摧毁关系。

任何时代,一个产品的最大价值是由审美决定。就像乔布斯说的——Ultimately, it comes down to taste。我觉得在这个层面上,我们怎么去理解这个时代产品的审美?以「关系」这样的目标重新思考会变得很有意义。

02

AI Native 的新管线是什么?

 

有了「关系」这个新的视角,以及用关系的视角去理解今天产品的目标变化后,还有一个非常落地的问题要解决——如何实现呢?这就引出我们第二部分,AI Native 的新管线到底是什么?

我们先看一下今天这个时代做产品的基本构型:两端分别是 input 和 output,中间是个 Magic Box。

过去大家经常探讨「套壳」的话题,很多人很嫌弃「套壳」,我觉得到今天这个争论可以结束了。也许未来每家公司都可以有这个能力自己去造中间那个 Magic Box,但至少在今天,这个世界上就是屈指可数的人在造那个 Magic Box,那么剩下的我们所有人都是在套壳。

套壳有意义吗?当然有!这个「核」它的确是有 Magic,但问题在于,它是一个失控状态的不确定的概率模型。你不套好「壳」,你不做好产品工程,怎么给用户交付价值?

因此,「套壳」——即优秀的产品工程——反而我认为正是大家当前应该要着力做好的部分,因为新管线里的核心目标就是要理解失控,接受失控,然后在不确定性中增强确定性

你真正能较劲的就是 input 和 output 了。在这两个维度上,我们要带入一些新的视角去强化它。

我们需要的是 Broad Input(宽输入)和 Liquid Outputting(柔输出)。

宽输入 Broad Input:积极主动地感、知、觉

我们先看看所谓的 Broad Input 到底在说什么?

宽输入 Broad Input 就是要更积极主动地去「传感」、「认知」以及「觉察」的能力。

「传感」可能是文本、声音、视觉、压力、温度、空间等一系列能获取更丰富维度数据的传感器。

「认知」,可能是知识库,或者调用一个更长上下文的模型等等。目的是更准确的理解需求,也提升价值交付的确定性。

同时你可能还要追求能「察觉」,所谓的察觉是指,可能用户当前提供的信息很有限,但我需要能够主动结合到一些其他的信息,做到更精准的理解甚至预测需求。

不要让用户每一次都是像面对一个陌生人一样,需要主动做一遍自我介绍,向产品「汇报思想」,甚至是去修炼提示工程能力。今天同样一个 AI 产品,这个人用和那个人用的体验可能是完全不同的,因为我们每个人对于模型能力的理解、prompt 的水平、我们心中的目标、脑子里的进程都不一样。所以一个 AI Native 的产品,你怎么去面对这么多样的用户?很重要的一点就是产品本身需要是积极主动的,要向用户的 context 靠拢。

我举个例子来说明为什么积极一点、主动一点,拿到的信息宽一点,交付的用户价值就会变更好。

在极客公园内部有一个大家特别喜欢用的产品,叫 Dia,它是一款 AI Native 的浏览器。当你需要去做一些思考、做一些结构性的总结时,你往往会在浏览器中打开很多的标签页,你需要综合其中的信息去思考,过去你就需要在这些标签页中来回切换。

在有了 Dia 之后,你不用切了,因为它是「一眼看千层」。我们只能一眼看到屏幕上显示的这一层,但是 Dia 可以同时「看」到所有标签页中的信息。你在 Dia 中呼出的 AI chat 就知道你要基于这些页面做思考,OK,我都替你看到了并且理解了,我在这个过程中可以帮助你基于这些信息去展开对话、进行思想碰撞。

理论上用其他产品也可以实现同等的效果,但可能需要用户把网页链接复制粘贴进来,或者要求用户把文档上传进来。但 Dia 就主动了一点点,做了一个 Broad Input,它给用户的价值就可以很高,它和用户的关系就可以走得更近,就被用户拿出来推荐了。

「站在未来看现在」是有必要的,宽输入必然是所有产品工程里要考虑的重要管线,而其终极目标一定是这些:

它首先是多模态的实时感知

同时我觉得是对生活流(lifestream)的高分辨率捕捉。这个高分辨率说的不是 4K、8K,它说的是,今天我们用手机能覆盖的生活流是非常有限的,未来可能需要不同产品形成的认知数据的分布式网络,这样才能构成一个对用户所谓生活流的更完整理解。

当然,别忘了,你的 input 和 output 之间是可以闭环地在里头不断地自己学习和进化的

因此,顺着这种思路,在产品工程上有很多值得创新、值得往前去跳跃的目标。

柔输出 Liquid Outputting:

分步交付,创造一个与用户协行的进程

再说一说柔输出。柔输出到底在说什么?

首先我们先去理解这么几层问题。

第一,我们必须理解任何一个产品的内核都是一个概率模型,就是一个 Magic Box。在这个时候,你就要有知有畏。因为它就是会有幻觉,它就是会有不确定性,不管你把它的 input 做到多么完美,它依旧有可能出现这些问题。所以你不能过度自信。

第二,模型这个 Magic Box 确实很强。但要让它能够「更强」,有可能是在于你会示弱

这个示弱是什么?就是在用户面前我不是有求必应、强行端到端输出的,而是「我们可以一起往前走」。因为你别忘了你的核心是「关系」,你要基于你和用户之间的关系去做设定,甚至在这个过程中,你可能需要合理的示弱。

用一个令用户舒适的方式去承载用户到达需求的彼岸。这就意味着,你未必是用户说完了需求,你就在一次动作中完成完美交付。而是需要从「一次固态的交互和交付动作」变成一种液态的交互和交付旅程」

我们可以通过三个例子来理解这个「液化」和「旅程」

第一个例子,很多写代码的朋友可能知道 Devin 这个产品,它在系统提示词里提到了一点:当你发现用户提出的需求不清晰的时候,你一定要去追问,不要害羞。

我看了原文,其中真有一句「Don't be shy」,它竟然告诉 AI 说你别害羞。为什么它会有这么一句话?就是在用户需求和逻辑都没有说清楚的时候,你别硬要出一个东西,与其造成失望感,真的不如去向用户示弱,「我可能没听懂」,或者「你说的是不是这样的意思?」你要去确认,否则你勤奋努力的输出最后是招骂的。

第二个例子,很多人都在用的 Deep Research,你发现它会先出一个大概的研究方案给你确认一下。这个过程既是对于用户要做的事的确认,也是在确认这是不是用户最终想要解决的问题。这是一种拉长过程,主动邀请人类介入的方式。所以输出过程中别抛下用户,合理地将用户 involve 进来,用 human-in-the-loop 和 human-on-the-loop 柔性流转的方式,让人在循环里发挥作用。

第三个例子,最近大家可能也看到有很多相关讨论的 YouWare。这款 Vibe Coding 的产品,它里边有一个 feature 叫 Remix(合成)。当用户要创造一个东西的时候,可以让用户先从一个已经存在的、比较喜欢的「模板」出发作为起点,再鼓励用户在模板上做更个性化的创造。对于用户的需求,直接让用户的选择可以从 60 分起跳,再带用户一起达到 90 分。甚至有时候模板能打开用户的世界观,还可以突破用户认知和能力的限制,给用户交付超越预期的更好结果。

所以拉着用户一起前进,像液体那样承载用户、包裹用户抵达需求的彼岸,建设这样的进程,才能真正和用户建立更好的「共同经历」。这通向信任,而信任是关系的根基

归根结底其实今天我们 AI Native 的产品,本质上就是一个以人为中心的 I/O 的系统。

如果我们站在这个视角去理解就坦然了。这些看起来在上个时代不存在、今天我们都很头疼的问题,就是这个时代的产品经理、产品创造者们的核心使命。因为它体现了个人计算的真正的革命。

我们是从个人计算机这一波个人计算革命一路走来的。但在今天,你交付的不再是个工具,而是结果,是「实现」。它就是个人计算的革命,是这个时代的新任务。

这些问题今天都很复杂、解决方法也都在不确定中等待摸索,但它就是这个时代给产品人的使命。

反正,混乱本身也是阶梯

03

AI Native 的新价值模型是什么?

 

很多朋友可能不知道极客公园其实还有自己的早期孵化基金,而且已经在早期投资过小鹏汽车、宇树科技等优秀的企业。不过这也正常,因为极客公园不是一个典型的投资机构,它的本质就是一个社区,它的使命是通过 社区带来的 Founders backing Founders 的能力,生生不息地去帮助一代又一代依托技术去做产品创新的创业者,向上探索做他们的「珠峰大本营

不过既然有投资孵化的业务,这也就推动我们要不断地去思考什么样的创业者是这个时代我们最该支持的人?它自然也就引发了我们第三部分的探讨——AI Native 的时代,新的价值模型是什么?

对这个问题的追寻,也是我支撑自己走过这么酸爽的三年,去和那么多创业者交流的一个核心动力。

我先说一个自己越来越强烈的感觉:我认为这个时代的创业者,一个很重要的特性就是内心明白我服务的不只是用户,我同时也在服务 AI

因为今天 AI 的能力还在一个成长的进程里,所以就会存在一个问题,你的产品工程里边不能只是从用户的需求去思考问题,你必须同时去思考 AI 需要什么

其实之前我们谈到 Broad Input(宽输入)和 Liquid Outputting(柔输出)这两个维度的时候,我们也在谈这样的问题,包括为什么要给你的产品写那样的系统提示词去定义关系,也是同理。你要帮助 AI 能够更好地发挥它的能力,把它的能力对齐到用户,为它的能力做建设。只有具备这种视角的创业者,才是这个时代的创业者。

同时,这个时代最优秀的公司,它的价值模型相比移动互联网时代的也有明显变化。

过去移动互联网时代的价值模型更像一个平面,它是一个面积模型。你在这个产品上做出一个「点」,拉入足够多的用户,当然中间你可能会不断增加功能,覆盖了广阔的用户面,你就成为了所谓的平台。接着在其中基于「连接」的价值,分发「连接」,然后去获得最大化的价值。

但在今天,技术也好,和用户的关系的维度也好,因为你能交付的用户价值的质量以及交付的能力,它需要一个向上的过程,所以你会发现这个价值模型从二维变成了三维,你还需要 AI 能力的高度

AI 能力的高度,有一部分是我们在用的优秀的模型提供给我们的,但也有很多是通过你的产品工程在这样的模型基础上进一步释放和构建的。只有这条能力线不断地往上涨,你最终的总体积才会大。所以今天这个时代最有价值的公司,它可能是一个三维的模型,而不再是一个二维的模型。

这意味着很多决策上的不同:比如传统意义的用户数量、ARR(年度经常性收入)等指标未必可以充分地衡量一个产品的价值,如果今天服务用户的任务太低频、任务太简单,你就没有 AI 能力提升需要的高质量数据飞轮,很容易变成「一波流」。这时候一味单纯的投流、买用户,借资本的钱去跑马圈地,可能不再是最合理的发展模式。

所以我们也期待看到更多对「新酒」和「新瓶」都有思考的创业者。

所谓的「新瓶」指的就是增长的方式、商业模式,包括团队组织,这些其实都会变化。这些问题需要边走边想,但值得在今天就把它当成一个重要的问题去开始思考。

未来从来都不是历史的简单延长,有些东西会押韵,但它一定不会重复。所以最好从一开始就要告诉自己「老瓶」碎了,如果你最终把「新酒」装到「老瓶」里,可能会错过时代带来的真机遇。

其实今天我们已经可以隐约看到传统的「产品经济学」不存在了。

所谓的产品经济学,就是在说你的商业模式、增长模型,甚至所谓的竞争力壁垒等等这些东西。我们对产品的那些传统的理解,在今天都在变化。

抛几个开放性的问题吧。比如说,到底是免费还是收费?如果是收费,是不是今天的「订阅+用量」就是终点了?

如果我们再往前 crazy 地想一想,收费应该前置还是后置?真实世界里很多东西是后付费的,如果你的 AI 产品能交付结果,能够帮用户实现价值,那么这个过程中是不是需要一些新的东西?例如智能合约支持的后置付费?比如说,什么是 AI Native 时代的支付宝和白条?

甚至再 crazy 一点,「收钱」和「给用户钱」是不是个一体两面的东西?未来人的价值创造可能会变得很离散,不再是在一个组织里打一份工,他日常可能在很多地方产生价值。既然 AI 和人就是个协行的状态,那反过来看,未来我们的价值创造和价值消费会不会又有一些新的循环?

我不知道答案,只有问题,但这些问题让人觉得很兴奋。毕竟人类每次技术进步,3年的维度你要关注生产力的变化,但如果以 10 年的维度去看,那全是生产关系的变化

所以当我们说产品经济学的时候,它本质上就是说生产力在怎么改变生产关系。这个维度还有巨大的空间值得思考。

好,不光是传统的产品经济学不存在了,其实传统的管理学也不存在了。

回想一下,现在的管理学是怎么来的?它是在工业革命带来大规模生产的背景下,为了解决怎么把人有效地组织起来而形成的。今天生产力的结构都变了,AI 在大范围地渗透到所有的组织里,与人协同发挥作用。所以传统的管理学又怎能继续有效呢?

未来一个伟大的公司真的都像今天一样,必须得有上万人,甚至十几万人吗?如果人可以更少,这群人是谁?他们的使命是什么呢?

那些使命、愿景、价值观的定义它如何在今天起作用?我们管理的「提效」到底要的是所谓的效率,还是未来的创造力?我们看到了清晰的问题,但还没有答案,这就是这个酸爽的时代留给我们的东西。

我的分享也差不多到了尾声。

其实今天我说的很多都是一些假说,甚至连假说都没有,就是抛了一些问题。各位产品人才是新时代的哥伦布,你们的产品、你们的实践中会真正探索出答案。

祝愿大家在未来的进程中有更多的「Aha moment」。我会非常期待你们回到这个舞台,把你们探索的结果分享给世界。

祝每个人都在这个时代有所成就,谢谢。


如果你看完这篇也觉得「这时代不折腾点什么就太遗憾了」。欢迎和极客公园「建设一下新关系」,可以加入极客公园一起研究,一起挖掘 cool 产品,一起组 cool party,也一起 build something!

填写表单,我们想认识一下你。

 

一场峰会,半个车圈!高通的野心不止于70%的座舱

6月27日,高通在苏州举办了一场汽车技术与合作峰会,再次向行业展示了它在智能汽车的野心。

与此同时,它还带了一大群「朋友」——理想、蔚来、岚图、极氪、奇瑞、零跑、一汽红旗、现代等车企,加上元戎启行、德赛西威、Momenta、卓驭科技等供应商伙伴,一起「组团开黑」。

提到高通,你可能马上想到手机芯片,但他们在汽车领域同样是重要存在根据盖世汽车数据,2024年,高通在中国智能座舱芯片的市场份额超过70%,远远领先于其他厂商。这意味着,当你坐在新车里听音乐或者看导航时,很大概率有用着高通的产品。

不过,高通可不满足于只做车内娱乐的「王者」,他们也把目光投向了智能驾驶。这次峰会的焦点是三款芯片:

骁龙8775、8797和8397的生态落地。

发布会现场,零跑汽车宣布,他们将推出一款搭载骁龙8797芯片的旗舰D系列车型,而且这款车将在2026年第一季度量产。

高通带来的这些新产品,能给汽车行业带来什么?除了智能座舱,高通在智驾方面,又有怎样的野心?

押注舱驾一体

现在的智能汽车,一般都搭载了三个域控制器:一个管座舱,一个管泊车,一个管行车。这三个「小脑」就像三个独立的部门,虽然也能合作,但毕竟不是一家人,这也限制了汽车智能化的天花板。

不过,随着智驾和座舱的发展,舱驾融合被认为是通向未来的路线。简单说,就是用单颗芯片同时驱动智能座舱和辅助驾驶系统。这不仅给车企节省了大量的成本,还能带来更高效的通讯和更好的用户体验。

但这个过程并非一蹴而就,目前的舱驾融合还不是真正意义上的舱驾融合,有些方案只是把两个功能的电路板(PCB)硬塞进一个盒子里,但芯片还是各用各的;更进一步的,是把功能集成到一块电路板上,但依然需要两颗独立的芯片。

因为这可是个技术活。目前,全球只有少数几家顶级玩家能hold住全场,除了英伟达DRIVE Thor、黑芝麻武当C1200家族,高通骁龙Flex SoC是目前市面上少数相对成熟的产品。

博世展示的舱驾融合平台 | 图片来源:视觉中国

在高通技术峰会的展区中,博世、德赛西威、中科创达、车联天下、卓驭等,都拿出了基于高通骁龙8775芯片的方案。

这个骁龙8775芯片很厉害吗?它是高通的首款舱驾融合产品,AI算力在72TOPS左右,如果舱驾平分的话,大约有30TOPS可以用于智驾,这足以支持高速NOA。

从方案到量产落地,它来到我们身边的速度可能比你想象的要快。在活动现场,零跑汽车官宣,他们明年第一季度推出的D系列旗舰新车,就会搭载两颗更强的骁龙8797芯片。

有趣的是,零跑汽车并没有让一颗芯片「身兼数职」,而是采用了「术业有专攻」的策略:一颗芯片专心负责智能驾驶,另一颗则专心负责智能座舱。这种「双芯」方案,虽然看似没有追求极致的「单芯」集成,但在当前技术阶段,却能保证两个核心功能的性能和稳定性。

端侧大模型加速落地

在高通活动现场,作者感受到的另一个趋势是端侧大模型的加速部署。「端侧」就是指设备本身,比如你的手机或者汽车,而不是网上的云端服务器。

如今,车企疯狂加码AI军备竞赛,甚至很多人喊出了要成为「AI公司」的口号,大模型上车就是最重要的举措。

在大模型上车的过程中,DeepSeek、豆包、腾讯元宝等大多部署在云端,这也或多或少呈现出一些短板,比如怕没网,有延迟,隐私无法保证等等问题。

为了解决这些问题,一个不算很新的思路——「端侧大模型」,总被提及。这意味着,你的汽车不需要联网,就能独立思考和回应。正是因为这些优势,理想、蔚来、极氪等车企,都在布局「端+云」的方案,这就对端侧算力提出了更高的要求。

高通8295是当下主流的座舱芯片,算力大约 30 TOPS,能运行 10亿 (1B) 参数的模型。这已经是个不错的「学霸」了。但高通最新的8397芯片更猛,算力高达320TOPS,能支持140亿参数(14B)的大模型,这给部署更大模型提供了更多条件。

中科创达展示的端侧AI解决方案,可以让14B模型在骁龙8797上运行 | 图片来源:视觉中国

在高通活动现场,一堆车企和科技公司都来秀肌肉。其中,中科创达的展台让人印象深刻。他们用高通骁龙8797,在车内芯片上流畅运行140亿参数的大模型。这意味着什么?你的车不仅能开车,还能跟你聊得飞起,反应快到不行。

从30TOPS到320TOPS,高通8397能支持的模型也从10亿到140亿,这都会让端侧大模型加速落地,也让汽车变得越来越聪明,能力越来越强。

手机芯片也能上车?

目前,高通在智能座舱的地位,短期内无法撼动。不过,在智能驾驶这块,高通还没站稳脚跟。

目前,自动驾驶芯片的主要玩家就是英伟达和地平线。在中国高算力自动驾驶芯片市场,英伟达稳坐第一把交椅;地平线则以中低端芯片站稳脚,开始冲击高算力芯片

相较于其他厂商注重高性能的策略,高通希望通过舱驾融合的策略,走性价比路线。这在汽车行业强调降本增效的当下,确实也是一个可行的思路。

不过,这需要攻克多项技术难题,例如智驾与座舱对功能安全和芯片资源的需求差异。要将两个域融合起来,从芯片架构、操作系统以及底层中间件等不同层面都需进行综合考量。

小米YU7的智能座舱,搭载了高通骁龙8 Gen3 芯片 | 图片来源:视觉中国

值得一提的是,最近引爆全网的小米YU7搭载了高通的骁龙8 Gen3这芯片本来是给手机用的,用的是4nm工艺。相比之下,当下车企常用的骁龙8295芯片是5nm工艺,稍微落后一点。

有趣的地方来了:这颗芯片原本是为顶级旗舰手机设计的,而汽车上主流的座舱芯片8295,是车规级的。常见的芯片等级一般是按照使用温度、辐射、抗干扰等因素,分为5类:,即消费级、工业级、车规级、军工级、航天级。

这个选择立刻引发了一个问题:

手机芯片,能直接装在汽车上用吗

面对小米的「不寻常」选择,高通技术公司汽车、工业及嵌入式物联网事业群总经理 Nakul Duggal在接受群访时的回应非常巧妙,他们在为汽车行业开发任何新产品时,无论是座舱还是辅助驾驶,都严格按照车规级标准来。

但我们尊重客户的选择权。如果客户评估后,希望选择一颗通用芯片,我们也会提供相应的技术建议和支持。」

当新能源汽车「下半场」的哨声吹响,AI成为核心变量时,只做一个「座舱之王」,显然满足不了高通的胃口。所以,高通果断地要补上自己版图中最关键的一块拼图——智能驾驶。当其他玩家都在追逐算力时,高通将「筹码」都押在舱驾一体上,希望通过错位竞争来站稳脚跟。

在市场格局初定的当下,这或许是不错的选择。

 

700 万商家都在用的 AI 工具,凭什么?

刚刚落幕的 618 电商大战中,淘天集团的商家 AI 工具「生意管家」以一组数据引爆行业——上线累计服务超 700 万淘宝天猫商家,大促期间帮助商家生成超 2 亿+商品素材、完成超千万次智能代理操作、超 5 亿次接待辅助。

在 ToB 产品领域,拥有 700 万用户规模已属顶尖水平。当下 AI 大模型竞争焦点正从算法研发延伸至商业应用落地,一款商家工具的广泛应用,是用户规模的持续积累和工具实用性的深度验证,更是打开市场增量空间的关键。

最近,淘天集团的生意管家还入选了 Founder Park 中国最具价值 AGI 创新机构 TOP50。从商业应用价值的角度来看,生意管家利用 AI 技术实现了素材成本降低高达 90%、释放经营人力 30%、提升接待效率 30% 等显著成果。

生意管家的 700 万商家用户不仅是一个数字,更是一个观察 AI 如何真正融入经济实体,为普通商家赋能的鲜活样本。那么,在众多商家工具中,生意管家究竟有何过人之处,能够赢得如此多商家的青睐?它又是如何通过 AI 技术为商家带来实实在在的效益提升的?


01

压缩 90% 成本,

从素材生成到经营策略全流程降本提效


如今,电商行业早已经过了「草莽阶段」的野蛮生长,步入了规则清晰的成熟阶段。对商家而言,经营逻辑也从「流量博弈」转向了精细化运营。但商家仍背负着几座难以逾越的大山:一是高昂的素材制作成本,二是依赖经验主导的决策困难,三是重复性任务的人力消耗。

虽然以往通过 SaaS 工具提供的供标准化模块功能,可以解决部分如订单管理、客服咨询等问题,但在灵活性和智能性方面还存在明显不足。生意管家用「智图、智影、智品、智文、经营、AI 客服」六大功能矩阵协同的实践证明了,平台的价值锚点已从「满足基础需求」升级为「构建商业增长引擎」。

电商经营涉及素材制作、图文上架、客服接待、数据分析、策略制定等多个环节,任务细碎且费时、费力、费钱。生意管家以 AIGC 技术为核心,构建了素材创作、经营诊断、运营代理、客服辅助接待等多维能力。

素材生成方面, 「成本」是商家考虑的核心问题。比如经营服装品类的商家要拍摄一套主图,请模特和摄影师就是一笔不小的开支,再加上场地、后期等费用,几千元的预算已经是极致压缩成本的结果了。如果要拍摄动态视频,除了费用时间成本同样非常高,从寄样到拍摄,再到剪辑、后期,没有一周时间根本完不成。视觉素材制作完了,上架的描述从标题到文案也要反复修改,而且这个环节往往依赖人工经验,效率低且难以量化效果。

生意管家的 AI 商品图创作功能,只要上传参考图,就能「一键同款」智能生成,还能自由编辑更换背景与场景,几分钟搞定原先需外包团队数天完成的工作。不止图片可以 AI 生成,视频也能。商家只需要上传几张商品的平铺图,5 分钟即可生成带运镜、配乐、转场效果的动态模特展示视频。没有新商品的图片也不用担心,利用现有商品链接也能生成视频。

在信息爆炸的营销战场,每个标题、关键词都是影响转化率的关键。生意管家的智能文案功能,无论是打磨爆款标题,还是创作吸睛短视频脚本,从基础文案到订阅上新营销文案,做到了核心场景全覆盖。同时,依托智能算法精准抓取热点,深度解析竞品优势,产出高转化的标题与营销文案。

经营策略方面, 基于淘宝积累的海量消费者数据及商家经营数据,生意管家具备商业趋势预判能力,能够为广大商家提供快捷、高效的 AI Agent 能力,以智能经营决策,替代过去的经验主义。同时,帮助商家节省时间和人力成本,带来更优质素材下的商品转化增量。

AI 经营助手能整合店铺流量、转化、客单价等核心数据,一键生成诊断报告,提供选品建议、定价优化和促销节点规划。对商家来说,每天需要跨多个后台页面巡查店铺是否存在异常情况,工作重复且耗时。而且商品数据分散在多个后台,抓取难整合还容易出错,当商品销量下降时,不知道从什么维度分析数据,很难从全面的运营视角看待多渠道关系。有时想要参考行业数据,却得不到一个明确的数值,但是利用 AI 生意管家,这些问题都可以得到有效解决。

此外,AI 客服辅助则通过智能应答降本提效,自动识别用户咨询关键词,毫秒级推送标准化话术,显著降低客服工作量与响应时间。

最近,生意管家还全新升级了 AI 分人群测图能力,针对人群偏好通过 AI 生成匹配主图。以前测图需要商家手动做 AB 测试, 现在通过 AI 洞察人群特点、生成对应图片, 可以快速测试不同主图的点击率、停留时长,快速定位高转化视觉方案,给不同取向的客户精准推荐不同卖点倾向的主图。

生意管家的应用效果显而易见:成本降低高达 90%、释放 30% 人力、提升客服接待效率 30%——每一个数字都击中了电商从业者的敏感神经。同时,它也揭示了 AI 应用的核心逻辑:不是炫技式的功能堆叠,而是对行业痛点的精准打击。


02

实用性与易用性兼顾,

让每个商家都用得会、用得好


智能化的工具让电商经营思路成为「明牌」,此时,于平台而言,要解决的已不单单是有多少工具,而是能否将工具转化为为商家提供增长路径的商业模型。

在行业和平台的双重助推下,许多商家已经意识到了 AI 的潜力,却因技术门槛高、操作复杂,对 AI 工具望而却步。生意管家的成功,恰恰在于它坚持了「让复杂的 AI,变成简单的工具」。

为了让对 AI 了解程度不同的用户迅速上手,生意管家在操作界面上下了很大功夫。经过对商家行为特征和使用习惯的深入分析,生意管家遵循电商商家使用习惯,设计了极致简化的操作流程,从图像生成到修改优化再到发布上架一气呵成,基本实现了「生成-调整-发布」的闭环流程。

在功能优化方面,生意管家也在持续根据商家的反馈和市场需求不断推出新的功能模块。例如最新升级的 AI 分人群测图功能,确保工具始终贴近实际需求。

生意管家还实现了与电商平台的后台管理系统深度集成,实现数据的无缝对接和共享,使商家能够在一个平台上完成全链路运营操作。

低门槛、易上手、持续升级,让生意管家跨越了「看着好」到「真有用」的鸿沟,成为 700 万商家信得过、离不开的生产力伙伴。


03

AGI 时代:从效率工具到生态系统


Founder Park 的颁奖词揭示了生意管家的行业意义:「当 AI 成为商家的『数字员工』,中小商家也能获得与头部品牌同等的技术赋能。」这种赋能体现在技术平权、决策升级、生态协同三个维度。

昔日需重金聘请团队制作图片、视频等素材,如今几分钟内就能低成本生成媲美专业拍摄的产品视觉;以往依赖个人经验或支付高额顾问费用进行经营决策的商家,拥有了基于全平台数据生成的商业「外脑」;AI 客服的存在,极大释放了人工作业的压力,小型店铺也不用为客服储备发愁。

生意管家 700 万商家的共同选择背后,是淘宝平台多年积累的商业洞察与 AI 技术结合的必然结果——它让高昂的素材制作成本不再是入门门槛,让经验主导的模糊运营变成精准的数据驱动,也让头部集团沉淀的数字化能力真正「飞入寻常商家」。

随着 AI 应用向「垂直化深耕」进发,那些无法串联产业各环节、无法渗透业务细节的 AI 工具,终将被淘汰。生意管家通过扎根中国最大电商平台的实际运行,已为智能工具的未来形态提出了可能的方向:不是取代商家,而是让每一份经营都获得智能化助力和公平起点。

当 AI 成为商业基础设施,衡量它的价值坐标也开始从「效率工具」转向「商业操作系统」。AGI 时代,行业的核心竞争力在于:能否将技术能力转化为「行业问题解决方案」,将数据资产转化为「商业增长模型」,将服务关系转化为「生态协同网络」。

亚马逊仓库机器人数量接近人类员工;高铁:不查充电宝 3C 标和品牌;雷军贺理想 10 周年:大空间家用车领导者

微信功能上新:可以不接收共同好友点赞提醒了

近日,微信最新功能更新聚焦朋友圈互动优化,推出「仅提醒朋友与我的互动」选项。

针对共友点赞不提醒相关操作,腾讯客服表示:该功能需要您进入朋友圈的发现页管理中关闭提醒,若对好友设置了「仅聊天」,则共同好友的点赞提醒将不可见。建议您检查相关设置是否关闭哦。

此外,若您想关闭共同好友朋友圈点赞的提醒,可以这样操作:进入微信 我->设置->通用->发现页管理->朋友圈,关闭有新内容时提醒我即可。关闭后,共同好友点赞的动态将不再显示在发现页。(来源:财经网科技)

特斯拉中国 Model3 长续航版涨价 1 万,现价 28.55 万元

7 月 1 日消息,特斯拉中国官网显示,特斯拉 Model 3 长续航版本售价已经上调至 28.55 万元。

从参数来看,新车百公里加速数据从 4.4 秒变成了 3.8 秒,似乎是默认标配了原价 1.41 万元的加速包服务。

另外还有多位博主表示,焕新 Model Y 长续航版和 Model 3 长续航版升级了新款电池方案,续航有所增加,例如 Model Y 长续航从 719km 变成 750km,Model 3 长续航从 713km 变成 753km。(来源:IT 之家)

 

Cursor 推出网页应用,用户可通过浏览器管理 AI 编码智能体网络

7 月 1 日消息,热门人工智能代码编辑器 Cursor 的开发公司 Anysphere 宣布推出一款网页应用,用户可以通过浏览器直接管理一个代码智能体网络。这一举措标志着 Cursor 在其集成开发环境(IDE)之外迈出了重要的一步,Anysphere 一直致力于将产品推向更多平台,并为用户开发更多基于智能体的体验。

如今,借助新推出的网页应用,用户可以在桌面或移动设备的浏览器中通过自然语言请求,为后台智能体分配任务,例如编写新功能或修复代码库中的漏洞。该网页应用还允许用户监控其他任务中的智能体工作,查看进度,并将完成的更改合并到代码库中。

为了进一步推动增长,Anysphere 最近为 Cursor 推出了每月 200 美元(现汇率约合 1433 元人民币)的 Pro 高级套餐。Anysphere 表示,所有能够使用后台智能体的客户都可以使用 Cursor 网页应用,包括订阅每月 20 美元 Pro 套餐以及更高级别套餐的用户,但不包括使用免费版的用户。(来源:IT 之家)

 

亚马逊仓库机器人数量接近人类员工规模

亚马逊目前拥有超过 100 万台机器人大军在其配送中心穿梭,成为世界上最大的移动机器人运营商,机器人数量即将与人类员工持平。

亚马逊不仅在扩大其机器人队伍,还表示正在利用人工智能来优化机器人。该公司推出了一种新的生成式人工智能模型,用于协调机器人交通,以提高配送速度和效率。这项名为 DeepFleet 的技术显然可以将机器人的行驶时间缩短 10%。

据《华尔街日报》称,亚马逊全球近 75% 的配送任务都借助了机器人技术。亚马逊声称,其机器人和人工智能投资将创造就业机会。例如,该公司表示,虽然位于路易斯安那州的一家新配送中心使用的机器人数量是其他设施的十倍,但它也需要增加 30% 的员工来填补可靠性、维护和工程岗位。 (来源:cnBeta)

Cloudflare 推出新举措:助力网站抵御 AI 爬虫,探索「按爬取付费」模式

7 月 1 日消息,互联网安全和性能优化公司 Cloudflare 宣布了一系列新措施,旨在帮助网站抵御 AI 爬虫的无限制抓取,同时探索一种新的商业模式,以保障互联网内容创作者的利益。

根据 Cloudflare 的最新政策,每一个与该公司签约以管理其网站流量的新域名客户将被询问是否允许 AI 爬虫访问其网站,还是选择完全屏蔽这些爬虫。此前,Cloudflare 已于 2024 年推出了一款免费工具,用于阻止 AI 爬虫,但此次更新后,用户无需手动调整设置即可默认屏蔽 AI 爬虫。

此外,Cloudflare 还启动了一项名为「按爬取付费」的私人测试项目,该项目允许网站所有者向 AI 爬虫收取访问内容的费用。Cloudflare 解释称:「每次 AI 爬虫请求内容时,它们要么通过请求头展示支付意愿以获得成功访问(HTTP 200 响应代码),要么收到一个 402 付款所需响应,其中包含定价信息。」

Cloudflare 表示,「按爬取付费」目前仍处于早期阶段,预计未来会不断演变。公司还支持开发其他市场平台和收费方式,例如允许出版商根据内容类型设置动态定价。(来源:IT 之家)

 

雷军祝贺理想成立十周年,李想回应

理想汽车 7 月 1 日发文称,理想汽车成立十周年,已与 134 万个家庭共同创造幸福。理想汽车表示,曾被调侃「噱头」,如今已成为「刚需」,深受用户喜爱的「理想三大件」共卖出:「冰箱」58 万台,「彩电」304 万台,「大沙发」743 万个。

小米董事长雷军转发理想汽车微博并评论称,祝理想公司十周年快乐!理想开创了今天中国新能源车中「彩电、冰箱、大沙发」产品形态,成为大空间家庭用车的领导者,非常了不起。

此外,理想汽车公布 2025 年 6 月交付数据。2025 年 6 月,理想汽车交付新车 36,279 辆,第二季度共交付 111,074 辆。截至 2025 年 6 月 30 日,理想汽车历史累计交付量为 1,337,810 辆。(来源:新浪科技)

 

国铁 12306 回应充电宝上高铁要求:不查 3C 标识或品牌,额定能量不超 100Wh 即可携带

7 月 1 日消息,自 6 月 28 日起,民航局航班禁止旅客携带没有 3C 标识、3C 标识不清晰、被召回型号或批次的充电宝乘坐境内航班,许多公众关心高铁站是否也会严查充电宝。今天铁路 12306 客服人员表示,「目前在充电宝查验方面不看是否有 3C 认证,也不看充电宝品牌,只要锂电池额定能量不超过 100Wh 就可以携带。」

2024 年 8 月起,市面上销售的充电宝都要有 3C 标识。3C 认证(China Compulsory Certification,中国强制性产品认证)是我国为保护消费者人身安全、国家安全及环境,依法实施的强制性市场准入制度。根据国家规定,正规上市的充电宝必须取得 3C 强制认证。(来源:IT 之家)

Nothing 首款头戴式耳机 Headphone (1) 发布:复古透明设计、全物理按键、主动降噪

7 月 2 日消息,Nothing 首款头戴式耳机 —— Nothing Headphone (1) 今日正式发布。

这款耳机延续了该品牌复古、透明的设计风格,摒弃了触控设计,采用了更复古的物理滚轮和按键控制。

硬件方面,Nothing 与音响品牌 KEF 手,为这款耳机配备了 40 毫米驱动单元、空间音频和头部追踪功能,还支持自适应主动降噪,以及经过针对 2800 万种噪音场景训练的麦克风系统。

续航方面,Nothing Headphone (1) 充满电后开启 ANC 主动降噪功能标称可播放 35 小时,耳机还支持 5 分钟快速充电提供超过 2 小时播放的电量。

Nothing Headphone (1) 搭载蓝牙 5.3,支持双设备配对,可让耳机在笔记本电脑和手机之间无缝切换。

这款耳机搭配 The Nothing X 应用,可以调节 8 频段均衡器。耳机还配有一个自定义按钮,可以启动一个名为 Essential Space 的功能,它可以用作语音驱动的工具,用于记录随机想法、提醒等。

Nothing Headphone (1) 将提供黑色和白色版本,售价为 299 英镑 / 299 欧元 / 299 美元。全球预售将于 7 月 4 日在 nothing.tech 和部分合作伙伴处启动,正式销售将于 2025 年 7 月 15 日开始。(来源:IT 之家)

 

鸿蒙智行问界未来车型曝光:钠新电池、峰值 12C 超级快充

7 月 1 日消息,从多位博主分享的照片来看,鸿蒙智行问界未来车型相关信息已被曝光,号称「定义新豪华」和「海量交付」。曝光信息中提到了钠新电池、峰值 12C 超级快充等,具体如下:

  • 骁遥双核、麒麟纯电

  • 钠新电池、凝聚态

  • NP2.0 热电分离

  • 峰值 12C 超级快充

  • DPPB 级极限制造 + 零碳工厂

目前官方暂未披露问界未来车型的具体信息,但目前已曝光的内容中多次提到了电池相关信息。作为参考,宁德时代在赛力斯超级工厂的两条 CTP 2.0 高端电池包产线昨日正式投产。这是宁德时代在重庆布局的首个基地,并首次采用「厂中厂」合作模式,为问界系列车型本地化生产供应动力电池系统。

问界自创立以来全系车型均搭载宁德时代电池,累计市场保有量已突破 70 万辆。(来源:IT 之家)

​马斯克被曝放弃殖民火星

7 月 1 日,据环球时报援引《纽约时报》报道称,美国硅谷投资人彼得·蒂尔透露,美国企业家、特斯拉和 SpaceX 公司首席执行官埃隆·马斯克已经放弃了殖民火星的政治愿景。

蒂尔表示,马斯克已经不再认为火星殖民是一个能帮助人类建立新社会的可行政治方案。报道称,作为马斯克朋友的蒂尔在采访中说:「2024 年是埃隆不再相信火星的一年。」长期以来,马斯克一直把人类星际扩张视为目标,但蒂尔指出,他的计划曾经带有意识形态色彩,如今仅剩下科技意义。

马斯克曾表示,人类有望在 2028 年登陆火星,并曾在今年 5 月接受福克斯新闻网采访时称,火星殖民对于「确保万一地球发生严重灾难,文明能够长期存续」来说至关重要。(来源:财联社)

这届年轻人精神状态,被一只卡皮巴拉拿捏了?商汤科技这个App用户已超百万

你有多久没用过记账软件了?

笔者还记得第一次获得真正可支配的收入时,小心翼翼地将每一笔支出记录下来,期待着能够靠记账,了解到自己的收支情况,最终能够多攒下来一点钱的美好青春样子。

不过,可能和多数人一样,随着学习或工作日益繁忙,记账这件事,最后总是不了了之了。

电子支付花了十几年,尽量让自己变得越来越无感——从刷码到免密,到刷脸、碰一碰,但记账却没有太多进步。

花钱只用了一秒,记账反而要点进去输入数额,选择类目,这也太反人类了。

笔者最近又动了记账的心思,和朋友聊起来有没有什么合适的记账app。朋友立刻说道:别提记账,想想就想去世。他不想面对自己到底花了多少钱,更不愿意的,要先熬过几个月繁琐的记账过程,可能才能对自己的账目有一点点有意义的了解。

然而账还是要记的,笔者开始在Appstore上翻找,一款记账app的封面一下子让我笑出了声:一只卡皮巴拉躺在地上,被一个钱袋压着爬不起来。记账就是这样的吧?!

这样一款app,大概是很懂记账人的心理了。

查看了一下,发现自己挖到宝藏了:这款叫咔皮记账的软件,主打用AI给记账人省事,来自商汤科技。才上线六个月,已经获得了百万用户,人均每天记录6笔账目。

记账也可以和花钱一样无痛吗?我试用了一周,发现还真行。

 

记账不比花钱容易的话,谁记账?

 

点开咔皮记账,我发现,咔皮记账做的第一个优化,就是针对我的痛点——记账难的问题。

我上一次使用记账软件还在几年前,依稀记得其中有许多痛点:

平时买一个什么东西,都要去选分类,最后才能在统计中体现出来,超级麻烦。

购物节一次性买一堆东西,要一个一个记吗?

有时候几天懒了忘记记账了,结果这几天换了好几个软件花钱,一笔一笔地往回算,钱能不能省下来不说,时间先浪费完了。

而一上手咔皮记账,突然发现,这些痛点已经在咔皮记账的AI加持下,被完全解决了!

没想到,几年不用记账软件,外面的世界已经发展成这样了?

咔皮记账提供了两种记账方式可以选择,一种是通过截图识别消费内容,一种是通过语音识别直接记账。

安装软件的时候,刚好是618购物节刚过,我直接测试了直接用截图记录淘宝消费记录,结果比预想中的丝滑好多。

我使用的是苹果手机,操作超级简单,只要按照咔皮记账的设置,先添加一个快捷操作,接下来使用苹果的辅助触控,只要双击(可以自己设置)辅助触控的小白点,就能直接截图记录屏幕上显示的消费记录。

据说安卓手机更方便。不仅可以从通知栏或控制中心触发,还能设置双击手机背部截屏。,或者利用无障碍权限,配置好了,连敲都不用敲就可以直接记账了。

购物节一次性买200件物品,也不过是多敲几下小白点的事情了,记账突然变得毫无压力。

即使几天没有记账,补记账也变得十分容易。我记得之前好多时候,就是因为补记账太麻烦,而不补记账少了几天的数据,最后的分析一下子就不准了,所以就放弃记账了的。而现在,只要在微信账单里点几下小白点,在支付宝账单里点几下小白点,又可以愉快地记账了。

近年来,许多软件都开始做截屏记账了,不过实测下来,咔皮记账的AI功能,是有在结账场景下,尤其是年轻人的结账场景下专门优化过的。

外卖大战开打之后,有多少人成为了外卖凑红包爱好者?

我把咔皮记账推荐给朋友,她直接给我发了一张这样的图。她说,记账app再好,能算得过来这个?

乍一看,我都懵了,不就是7.58元吗,这有什么?仔细一看,我才发现这张图暗藏玄机,这杯奶茶的实际消费,根本不是图中任何一个数字,而是7.58+0.42+0.5=8.5

这我记账,还要做数学题?

抱着试试看的心态,我把图传给咔皮记账,嘿,不用我记,它竟然懂我!

不但识别出了正确的金额,还帮我直接选好了奶茶的分类。

有时候花钱不在手机上,或者懒得截图了怎么办?

咔皮记账还提供了另一个记账方式,语音输入。

和截图输入一样,语音输入也能直接在帮你记账的同时,把分类直接选完。

我故意给小胖咔提升了难度:不仅让它补记昨天的账,还一口气报了好几项消费,没想到这也难不住它。

天,该不会记账真的比花钱还容易吧?

 

AI分析,你是什么花钱人格?

 

如果说,“无痛记账”已经让我足够惊喜,那咔皮记账的AI分析功能,才是我最终决定“焊死”在这儿的理由。

毕竟,记账永远只是手段,搞清楚钱花在哪、然后管住自己的手,才是终极目的。

每个记账人最爽的瞬间是什么?必然是看着自己辛苦记录的数据,唰地一下生成报表,清楚地告诉你“吃喝占了50%,娱乐占了20%...”,然后你握着拳头暗下决心:“下个月一定少喝两杯奶茶,我要存钱!”

但这种快乐,也往往最脆弱。

明明感觉这个月很省了,结果就因为购物节买了一瓶稍贵的面霜,整份月度报告就显得毫无成就感,一片红(超支)。

有大额支出的时候还算好的。最头疼的是,有时候发现超支,看着那一大堆数据,你根本搞不清自己到底为啥超支。标注的都是饮食,到底是因为多请朋友吃了两顿饭?还是因为心情不好点了三杯奶茶外卖?想在几百条消费记录里破案,简直是不可能完成的任务。

在前AI时代,这事儿基本无解。有钱人或许有专业理财师,少数技术大神能用Excel拉出复杂图表,而我们这些普通人,到最后只能挠挠头,发出一句灵魂拷问:“我钱呢?我好像……又花超了?”

笔者这个只用过“古早”记账软件的人,万万没想到,AI的发展已经开始着手解决这个终极痛点了!

本来只是冲着“轻松记账”开始使用咔皮记账的我,在用了一周后,彻底被它的AI分析功能圈粉。

今年年初,大家都曾经被DeepSeek的深度思考功能所展示的逻辑能力震惊。笔者发现,咔皮记账竟然做了一个咔皮AI,融合了商汤日日新、DeepSeek、Qwen等大模型的深度思考、分析总结的能力,塞进了一个记账App里!

不只是简单的数据分析,出来的结果排版好看得像一份专业报告。AI“胖咔”还会一针见血地评价我的消费习惯,比如指出哪些是“必要支出”,哪些是“冲动消费”。

这可比过去的记账软件强太多了!以前的分析,严重依赖我们自己打的“分类”标签,颗粒度粗得不行。

现在呢?你可以像跟聊天机器人对话一样,直接向AI提问: “我这个月喝了多少钱的咖啡?” “我叫外卖和自己做饭的比例是多少?” “盘点一下我花在健身上的所有开销。”

只要你记了,它就能给你扒得一清二楚。虽然实测下来,目前在自由提问中,AI有时还存在分析不准的问题,但是我完全可以想象,随着AI模型的不断进化和个人数据的增多,它会变成一个越来越懂你的、7x24小时在线的专属财务管家。想想就觉得方便极了!

除此之外,对年轻的“理财小白”而言,咔皮记账还设置了一个贴心的预算功能。

它能把预算精确到“天”。再也不怕月初潇洒过头,月底只能吃土了!一旦前面花超了,咔皮记账能立刻帮你重新规划,算出“接下来平均每天最多花XX元”,你才能保住这个月的预算。

刚开始理财,不知道怎么设计预算?也完全不用担心。

咔皮AI还可以根据你过去几个月的消费习惯,给出一个相对合理的预算建议。

只需要简单点击两下,AI直接帮你把预算细化到类目,生成到天的级别。

除了实用的功能外,最好玩的是,AI还可以生成你的消费人格!

快乐小狗,快乐全靠花!(guilty)

 

 

AI时代,年轻人需要怎样的记账软件?

 

在目前的AI时代,想做一个纯AI产品,解决一个新的需求,出圈其实并不容易。AI应用开发虽然变得容易了,但是一个新的需求要面对重新教育市场,这对于很多团队来说并不容易。

六个月内就抓住了一百万用户,咔皮记账的启示或许是,在AI时代,很多刚需应用都值得重做一遍。AI带来的新能力,能够带来革新性的体验,有机会一下子颠覆原有的固定行业格局。

抓住了AI进步的技术能力,咔皮记账用无感的操作,让记账变得很容易,解决了传统记账app的数据分析痛点。

不过,也不仅如此。

AI记账背后的使用的技术能力并不复杂,笔者后来在Appstore里也发现了不少类似的AI记账app,为什么用户更愿意停留在咔皮记账里?

原因之一,可能还是要靠在场景中的深入打磨。

一句话记账对于AI来说相对简单,但一句话记多条账单呢?

截图识别谁都能做,但是能够根据软件的邪恶设置进行智能调整的app就不多了。

使用期间,有一个点让笔者十分印象深刻:用户冷启动阶段的数据导入。

在一开始进行记账的时候,通常都是用户最容易流失的时候——这时候app没有任何用户的数据。这时候为了让新用户快速上手,导入历史账单是最佳途径。

但实际上,目前主流的支付工具,提供的导出账单的方式远非轻松容易。要想从微信、支付宝中导出账单,用户需要经历一套繁琐、甚至堪称劝退的操作——获取加密账单、邮件发送、在电脑端下载账单通过密码解压。

而咔皮记账在此设计了一个极为巧妙的方案:提供一个一次性专属邮箱,用户只需将账单邮件转发至此,后续的解压、解析、导入流程便在云端自动完成。

这个看似微小的设计,精准地击破了用户在最容易流失的“初见”环节所面临的巨大阻力,体现了深刻的用户同理心和扎实的技术执行力。

而另一个更核心的原因,可能在于咔皮记账真正读懂了它的核心用户——Z世代。

对于一代一代的年轻人来说,记账实际上是一个刚需。年轻人时间最多,但资产最少,最需要掌控自己的消费。

而咔皮记账,很明显对年轻人的消费心理有着深入的洞察。

笔者印象很深的是第一次尝试用咔皮记账的时候,笔者用语音记录了一笔桌游消费。而不同于普通记账软件可能直接把它分类为“娱乐”或者“其他”,咔皮记账直接帮我把这一笔账单分到了一个单独的“游戏-桌游”的子类目里,这让我一下子对咔皮记账有了很强的好感。

不仅如此,咔皮记账里还有许多子类目都十分贴近年轻人的消费习惯。一个类目专门是偶像消费,一个类目是彩票,甚至还有一个类目是党费。

这种细腻的颗粒度,反映了产品对年轻人的洞察之深刻。

除了最基本的实用,咔皮记账也在逐渐向为年轻人提供情绪价值扩张。

在咔皮记账里,每次记账,胖咔会专门生成AI回复与你互动。

你可以在咔皮记账里记账,也可以记录想法和心情。

除了能生成年轻人最爱的MBTI测试答案,最近咔皮记账还推出了一个更有趣的功能“AI手帐”。

这种对年轻人的洞察,一定是产品最后的核心竞争力。

传统上,记账通常是年轻人爱干的事。随着用户年龄越来越大,时间越来越少,传统的记账软件的操作很难留住用户。

而随着AI时代的到来,记账变得更加无感,分析变得更加智能,或许未来,整个赛道也将发生变化。

年轻时用了记账软件的用户,或许也会一直留下,变成记账软件的长期用户。

27岁的你,未来翻看21岁在校园里,记录今天考的很好,奖励自己一杯奶茶,应该也是很开心的吧?

而从21岁到27岁,用户消费习惯、生活方式乃至心路历程的完整变迁,对未来的个性化服务与推荐算法而言,无疑也将是最宝贵的数据资产。

如果你只在前AI时代记过账,现在是时候尝试一下咔皮记账了,体验被AI重塑后的记账体验。

 

 

 

淘宝、蚂蚁纷纷冠名苏超球队;小米青年公寓,租金1999 元/月;微软将「AI 使用量」纳入员工考核

苏超「内战」打到阿里系,大厂流量暗战正酣

6 月 30 日,江苏省城市足球联赛(以下简称「苏超」)再迎大厂「玩家」。淘宝闪购和支付宝前后脚宣布了对两支「苏超」球队的冠名,淘宝闪购冠名常州队,支付宝冠名徐州队,当日下午,花呗又宣布冠名无锡队,主打「无息」。三大阿里系品牌各自冠名,「散装阿里」呼应起「散装江苏」受到网友热议。

「苏超」这项今年夏天的顶流赛事,也在成为越来越多互联网公司商业布局的一环。

加上此前宣布成为「苏超」官方战略合作伙伴的京东、理想,作为「苏超」官方供应商的小米以及作为「苏超」官方赞助商的中兴、宇视等,「苏超」赛场上已会聚了一批科技企业的身影。(来源:第一财经)

Meta 对 AI 业务大洗牌,扎克伯格宣布「超级智能」计划

Meta Platforms Inc.首席执行官马克·扎克伯格宣布对人工智能部门实施重大重组,包括着力开发人工「超级智能」,旨在令其具备人类同等、甚至更好的任务完成能力。

内部备忘录显示,扎克伯格周一致信员工说,Meta 的人工智能业务将划归名为 Meta Superintelligence Labs 的新团队,而该部门将由初创公司 Scale AI 前首席执行官 Alexandr Wang 领衔。此人被扎克伯格称为「他这一代人中最令人刮目相看的创始人」,将担任 Meta 的首席人工智能官。

扎克伯格还表示,Github 前首席执行官 Nat Friedman 将「与 Alex 合作领导」该团队,并负责 Meta 的 AI 产品和应用研究工作。此前报道称,扎克伯格正在亲力亲为给超级智能团队招募人才。(来源:环球市场播报)

 

苹果考虑另起炉灶,用外部人工智能模型来支持新版 Siri

为扭转陷入困境的人工智能项目,苹果公司考虑放弃自家开发的 AI 模型,转而使用 Anthropic PBC 或 OpenAI 的 AI 技术来支持新一代 Siri。

知情人士透露,苹果已与这两家公司讨论将它们的大型语言模型用于 Siri,并要求它们训练可在苹果云平台运行的模型版本以供测试。

如果最终采用外部模型,将标志着苹果的一次重大转变。目前,苹果大部分人工智能功能依赖其自研的「Apple Foundation Models」技术,原计划 2026 年推出基于该技术的新版本 Siri。

转用 Anthropic 的 Claude 或 OpenAI 的 ChatGPT 意味着苹果承认其在生成式 AI 领域竞争力不足。苹果已经允许 ChatGPT 处理 Siri 中的网络搜索查询,但 Siri 本身仍由苹果技术驱动。(来源:环球市场播报)

 

微软被曝将「AI 使用量」纳入员工考核:不再是「可选项」,直接挂钩绩效

6 月 30 日消息,据《商业内幕》报道,微软开发者工具部门总裁 Julia Liuson 最近发出内部邮件,要求各级主管在评估员工绩效时,将其使用 GitHub Copilot 等内部 AI 工具的情况纳入考量。

Liuson 表示,AI 已成为微软日常工作的核心,就像团队协作、数据导向思维和沟通能力一样,使用 AI 不再是选择题,而是每个岗位的基本要求。她指出,员工是否有效使用 AI,应该被纳入对其整体表现和影响力的全面评估之中。

知情人士透露,微软各团队的绩效考核标准不尽相同,目前已有部分团队考虑在下一个财年正式将 AI 工具使用情况作为绩效指标之一。

另据两位了解内情的人士称,这一改变旨在应对微软内部 Copilot 服务推广缓慢的问题。微软希望提升整体使用率,也希望产品开发人员更深入理解自家 AI 工具的运作方式。

目前 GitHub Copilot 正面临 Cursor 等 AI 编程服务的竞争压力。微软允许员工使用符合安全规范的部分第三方工具,知情人士称,Replit 就是其中之一。(来源:IT 之家)

雷军回应何小鹏下单小米 YU7:一定加速生产 力争早点交车

6 月 30 日午间消息,雷军回应何小鹏下单小米 YU7,并发文称:「谢谢小鹏支持,我们一定加速生产,力争早点交车。小鹏 G7 本周四发布,预祝发布会成功!」

当日早间,何小鹏发文称,「祝贺小米 YU7 上周发布取得优秀的成绩,我认为 YU7 成功核心是产品竞争力强劲,因此也当晚下单了 YU7,静候雷总早点给我交付。」同时,何小鹏宣布,小鹏 G7 将在 7 月 3 日正式发布。(来源:新浪科技)


豆包上线「深入研究」功能,用户可免费体验

6 月 30 日下午消息,豆包「深入研究」功能已经在豆包 App、网页版及电脑版正式开启测试,用户可免费体验。

基于模型的搜索、推理及 Agent 能力,深入研究可以帮助用户更快速、全面和结构化地处理高难度的复杂任务。针对长途旅行攻略、复杂购买决策、最新政策解读、商业科技趋势发展等需要获取大量资料、长时间研究的问题,借助深入研究能力,几分钟即可完成初步方案。同时,豆包还支持以可视化网页和报告文档两种方式呈现研究结果。(来源:新浪科技)

 

百度正式开源文心大模型 4.5 系列模型

6 月 30 日,百度正式开源文心大模型 4.5 系列模型,涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型,并实现预训练权重和推理代码的完全开源。

目前,文心大模型 4.5 开源系列已可在飞桨星河社区、HuggingFace 等平台下载部署使用,同时开源模型 API 服务也可在百度智能云千帆大模型平台使用。

早在今年 2 月,百度就已预告了文心大模型 4.5 系列的推出计划,并明确将于 6 月 30 日起正式开源。(来源:36 氪)

 

「星纪魅族科技」公众号更改名称为「魅族科技」

6 月 30 日消息,公众号「星纪魅族科技」更改名称为「魅族科技」。

据了解,目前星纪魅族仅官方公众号进行更名,视频号、微博名称均未更改。

据星纪魅族官方介绍,星纪魅族集团主要由星纪时代和魅族科技融合而来,集团创始人为李书福。2022 年 7 月,星纪时代和魅族科技达成战略投资协议后,双方在业务和团队上进行了深度的协同。魅族科技不仅组建了专注于研发 Flyme Auto 的团队,还在武汉建立了研发中心,魅族科技与星纪时代也在手机产品的规划和设计上进行了深入的融合。(来源:IT 之家)

大疆旗舰级运载无人机 DJI FlyCart 100 发布

据了解,DJI 大疆正式发布全新旗舰级民用运载无人机 DJI FlyCart100。

据了解,其集更大载重、更快充电、更为安全智能为一体,支持两款负载系统,搭配丰富生态应用,支持 PSDK,可适配第三方负载。DJI FC100 还可适用于应急、消防、电力、工程、物流、水域等多场景。(来源:36 氪)

 

德国 TQ 公司宣称造出世界最轻、效率最高电动自行车电机:1.17kg,输出 200W

6 月 30 日消息,据外媒 Electrek 报道,德国电助力系统制造商 TQ 推出了电动自行车电机新品 HPR40,并宣称这款产品已成为全球最轻、效率最高的中置电机。

HPR40 专为公路和砾石电动自行车设计,重量仅 1.17kg,能提供 40Nm 的扭矩和高达 200W 的峰值输出。这款电机强调的是效率和车体一体化的自然骑乘体验,而不是单纯的动力指标。

该电机为轻量级自行车打造,外形设计尽量隐蔽,可嵌入五通部位,控制组件也巧妙藏于车把内侧,几乎不会打破整车的外观线条。

其核心技术为「Harmonic Pin-Ring Transmission」(谐波销环传动),这套精致的动力系统完全替代了传统五通结构,具备静音、低摩擦和零延迟启动等优点。(来源:IT 之家)

小米在北京、南京为员工提供「小米青年公寓」,租金平均 1999 元 / 月

6 月 30 日消息,据小米行政公众号推文,小米在北京、南京上线了一批青年公寓,租金标准为 1999 元 / 月。

据了解,公寓所有房型一房一价,均价为公寓所有房型平均月租金,租期在 2025 年 7 月-2028 年 6 月之间享受安居折扣价。

小米北京青年公寓坐落昌平定泗路,东临特警部队,西靠武警家属院,北望碧水庄园,共 2658 间;主力 29 平方米开间,配有独立卫浴 + 智能家居,班车直达园区,距小米科技园约 10 公里,距小米智慧产业园约 3 公里。

其支持全屋智能家居自由配置,采用动静分区设计,支持小米工卡「一卡通刷」,管家 7*24h 在线响应。

小米南京青年公寓坐落建邺区河西南 CBD,共 566 间,步行即达地铁,提供 55 平方米两室一厅开间,距离小米南京科技园 100m 距离。(来源:IT 之家)

大模型再「战」高考:从一本直升 985

作者|Li Yuan

编辑| 郑玄

 

过去一年,大模型的世界几乎是「狂飙」的同义词。技术以周为单位迭代,能力边界从写诗作画,一路拓展到视频生成和科学发现。

然而,抛开那些宏大叙事,我们该如何为 AI 的能力找到一个精准、客观的刻度?

恐怕没有哪种方式,比「高考」更能直抵每一个中国人的内心。

去年,极客公园就做过一期 AI 高考模拟测评 。延续去年的传统,极客公园今年再次搭建「AI 高考」考场,让国内外主流大模型再次走进考场。

再次走入考场的「AI 考生」们,不仅 治好了去年文科偏科的毛病 ,还取得了足以考进山东省内 1000 名的高分。

然而,就在我们以为它已经「进化」时,它却又常在意想不到的地方,暴露了自己真实的「智商」。

一些关键发现如下:

  • AI 首次有望冲击顶尖学府 : 今年,AI 的综合能力首次展现出足以考上顶尖学府的潜力。与 2024 年相比,所有参与测试的大模型在文理科成绩上均实现了显著飞跃。由于山东省采取赋分的报考策略,无法直接与分数段相比较,我们估计此次高考的状元豆包,能够排进全省的 500-900 名,考入人大、复旦、上海交大、浙大这些名牌大学的人文社科类专业。
  • 大模型不再严重偏科,理科进步更快: 各大模型的文科总分平均增长了 115.6 分,理科总分平均增长了 147.4 分。尽管理科的增速更为迅猛,但其 181.75 分的平均总分仍低于文科的 228.33 分。总体来看,今年大模型的总分表现已不再严重「偏科」。
  • 数学能力大幅增强,超越语文、英语: 数学是本年度进步最显著的科目,平均分较去年提升了 84.25 分。AI 在数学上的表现甚至超过了语文和英语,这预示着未来 AI 可能更擅长处理逻辑性强和有标准化解题路径的题目。
  • 多模态能力成为拉开差距的关键: 去年到今年,模型的视觉理解能力显著提升,这一点在包含大量图像题的学科中尤为突出。与去年相比,物理和地理的平均分提升了约 20 分,生物提升了 15 分。化学科目整体表现稍弱,仅「豆包」模型及格,但全员平均分也比去年提高了 12.6 分。作为彩蛋,我们今年也尝试让 AI 在视频流中答题。

 

01

从一本到顶尖大学

 

如果说去年的 AI 还只是一个刚摸到一本线的优秀生,那么今年,它们已经成长为足以冲击中国顶尖学府的学霸。

这背后,究竟发生了怎样的蜕变?

在深入具体的变化之前,我们先介绍一下此次参与考试的国内外考生:

豆包、 DeepSeek(R1-0528 版)、ChatGPT(o3)、元宝(Hunyuan t1)、Kimi(k1.5)、文心一言、通义千问。

为了更贴合读者的使用体验,本次评测均在各模型的公开 PC 端进行,测评采取采样两次取平均分的形式。

目的是考察模型的综合能力,此次测评的方式是直接让模型识别图像作答。DeepSeek-R1 目前仍然不支持图片识别作答,因此只测试了纯文字题目,最终成绩参考性不强。

其他测试细节如下:

  1. 此次测试选用 2025 年新高考山东卷作为本次评测的测试卷。原因有二:首先,山东卷是网络上能最快获取到的高考试卷之一,保证了评测的时效性。其次,它的综合难度在各省份中名列前茅——其语文、数学、英语三科采用全国一卷,其余科目则为自主命题。这样一把高难度的「标尺」,更能探知当前大模型能力的上限。
  2. 为保证公平并考察模型的通用基础能力,在可以关闭模型联网能力的产品中,统一关闭了模型的联网功能,以杜绝「搜题」的可能。o3 和文心无法关闭联网,不过检查模型思考过程发现,文心没有发生联网搜题的情形,o3 发生少量搜题情形,但没有明显收益,得分率反而低于非联网答题。同时,我们默认开启了深度思考模式,但没有开启研究模式,以模拟用户在标准交互下的即时问答场景。
  3. 非选择题各学科分别请两名专业同学打分,如存在题目分值 1/6 以上的差异,则引入第三人讨论定分(与真实高考判卷流程一致),并邀请参与过真实高考打分的高中老师抽检,对存在差异的题目统一标准。
  4. 在评分环节,我们做了两项特殊处理:我们特邀了资深教师进行对 AI 作文进行匿名评审,以保证客观公正。此外,由于无法获取英语听力部分的试题,我们设定所有模型在该项上均计为满分。

 

 

 

最终,各位考生的成绩如下:

过去一年,大模型的深度思考能力,带来了模型能力的明显进步。

模型不再不是直接产出答案,而是逐步分析、分解问题、检查中间结果,甚至自我修正,带来了模型在数理考试中的表现的大幅提升。

总分为 150 分的数学考试中,即便是本次测试中表现最差的 AI 模型,也拿下了 128.75 分的高分——这在人类考生中也属于优秀水平。

而回顾去年,表现最好的模型,也只达到了 70 分,连及格线都没到。

数学能力的进步,直接带动了今年大模型整体高考成绩的大幅提升。

多模态能力,成为决定大模型能力表现差别的另一个关键因素。

在去年的高考测试中,不少模型还不具备成熟的图片识别能力。极客公园当时采用的评测方式是:能识图的模型使用图片配合文字输入,而无法识图的模型则只输入文字,同时辅以 Markdown/LaTeX 格式帮助识别公式。

而进入今年,多模态能力是主流模型的标配功能。因此,我们首次在测试中采用纯图片题目测试(DeepSeek除外)。

在多个模型中,豆包、ChatGPT最先进的模型都是多模态版,在图像问题上体现出明显优势。

Qwen3、文心 X1 都是语言模型,处理图像问题时可能是用 OCR 识别文字后回答,或是调用视觉模型,在图像类问题上表现较弱。

不过,即使是图像问题得分最高的豆包和 ChatGPT,图像问题的得分率仅为 70%,相比文本问题 90% 的最高得分率有较大差距,可见大模型在多模态理解和推理上仍有很大的提升空间。

可以预见的是:随着多模态能力的持续进步,明年AI的高考成绩还会继续提升。考不过AI,终将成为大多数人类的常态。

然而,AI 终究没有拿下全满分的成绩。是什么绊住了学霸级的 AI?答案可能比想象中的有趣。

 

02

数学逼近满分的 AI 天才们,

齐齐败在一道基础题上

 

在整场 AI 高考的测评中, 「 AI 考生」复读了一年后,在数学科目上的进步十分瞩目。

在 2024 年的测评中,当时的 AI 考生们在填空题和解答题上表现惨淡,得分普遍在 0 至 2 分之间徘徊,最终 9 款参评模型的数学成绩的平均分仅为 47 分。

而今年,则完全不同。

可以看出,无论是客观选择题,还是复杂的主观解答题,新一代大模型的正确率都今非昔比。这清晰地表明,大模型自身的能力,尤其是核心的推理能力,已经取得了根本性的突破。

如果说去年的模型还只是一个能勉强套用求导、三角函数等基础公式的「初学者」,那么今年的模型,则已经进化成一个能够从容应对复杂推导和证明的「解题高手」了。

一定程度上,这样的结果在预料之中。自从 AI 进入推理模型时代,一个标志性进展便是数理能力的大幅提升。

当模型拥有了自我思考与自我纠错的能力,它就像一个从前张口就回答问题的孩子,成长为一个会先深度思考再给出答案的大人,逻辑能力实现了质的飞跃。

要知道,今年高考新课标一卷的数学题被考生普遍认为难度极高,「像竞赛卷」,导数、圆锥曲线等压轴题思路晦涩,计算量极大,甚至出现「学霸考哭」的现象。

然而,面对这样一份高难度试卷,顶尖的大模型们依旧表现得游刃有余。

相较之下,AI 的多模态能力的进展倒还在其次。数学科目中,只有 20 分的图像问题,不是此次模型大幅度提分的重点。而大多数模型,也都在图像题中取得了 15 分的成绩。

为什么是 15 分?

这就很有趣了。这些整体都考了 130 分以上的大模型,放在人类社会里,也算是数学尖子生了,竟然在同一道选择题上出现了错误。

难住他们的,不是什么压轴大题,而是一道单选题——甚至不是很难的单选题。

这道题的数学原理非常简单,是一道基础的向量加减法题。只需在图上连接 (0,2) 与 (2,0) 两点,即可得到目标向量,模长 2 倍根号 2。

即便对数学不甚了解的人,通过肉眼观察图中的线段,也能估算出其长度不会超过 3.3。

然而,就是这样一道题,难住了所有数学学霸 AI。

核心矛盾在于: 题不难,但图难。

对于大模型而言,这张图的视觉信息极其混乱:虚线、实线、坐标轴、数字、文字相互交织,甚至文字与关键线段存在多处重叠。这种视觉上的「脏数据」,成为了 AI 精准识别的噩梦。

以本次数学表现最佳的豆包为例,它的解题过程暴露了问题的根源:它从最开始读取题目信息时,就已然出错。

从题目就读错了的情况下,无论其背后的数学推理能力有多么强大,也终究是无源之水,无本之木。

 

03

AI 写作文:擅长举例子,但不擅长思辨性地升华

 

作为所谓大语言模型,语文和英语一向是 AI 的传统强项。

不过有趣的是:在大模型的数理逻辑大幅进步后,大模型的语文和英语能力反而显得有点不够看了。

这与现实世界也是一致的:一名顶尖考生或许能在数学上拿到满分,却极难在语文科目上获得同等分数。AI似乎也触碰到了同样的瓶颈。

仔细研究语文卷面可以发现,AI 的失分点颇为有趣。在选择题部分,除豆包和 DeepSeek-R1 以外,其余模型的错误率均在 20% 以上。

这种现象或许揭示了 AI 与人类不同的一个困境:对于人类考生,组织语言、阐述观点时,可能更容易因疏漏而失分;但对于 AI,要读一段长材料,在一组高度迷惑性的选项中,精准辨析每一个细微的语义差别和逻辑陷阱,难度可能反而更高。

而在备受瞩目的作文题上,AI 的表现则延续了去年的趋势: 平均分高于人类,但难有真正的佳作。

去年,特邀阅卷老师的评价就已指出,AI 作文大多属于稳妥的「二类文」,很少偏题,但因其深刻性、丰富性、创造性不足,难以产生动人心弦的「一类文」,其结尾部分的升华更是套路化明显。

今年,依旧如此。

7 大模型整体均分 50.75 分, 均分区分度较低 ,各模型能做到立意准确、语言流畅、论据丰富,但论述不深刻,举例雷同,相比人类范文模型作答缺少温度和共情。

今年的新课标卷的语文作文考题为:

全国一卷作文「民族魂」

阅读下面的材料,根据要求写作。(60 分)

他想要给孩子们唱上一段,可是心里直翻腾,开不了口。

——老舍《鼓书艺人》

假如我是一只鸟,我也应该用嘶哑的喉咙歌唱

——艾青《我爱这土地》

我要以带血的手和你们一一拥抱,

因为一个民族已经起来

——穆旦《赞美》

以上材料引发了你怎样的联想和思考?请写一篇文章。

这是在一次采样中,元宝生成的 AI 作文。它在人类阅卷老师处获得了 53.5 分的高分,是 AI 作品中的佼佼者。

 

然而,细究其文,AI「模板化」的问题依旧暴露无遗。

比如这篇文章的中间几段,先是提出「历史上闪耀着这样的精神火光」的观点,随即并列引用三到四位历史人物;接着,引出「真正的担当带着疼痛的底色」的论点,再列举三到四位经历苦难的人物;最后,论及当代精神,再次列举三到四个当代人物。

AI 作文的语言不可谓不华丽,引经据典也自然十分丰富充满细节,但逻辑上像不像你的家长对你说,你看看谁谁谁都怎么样了,你是不是也该怎么样?

或许在精细调整提示词的情况下,AI 能写出触达人心的作品。

但目前,AI 的自主创作更像是在执行一个固化的写作模板:用排比式的案例填充框架,最终导向一个略显生硬的僵化升华 它能写出看似优秀的段落,却难以织就一篇真正动人的文章。

 

04

英语:主要被作文分数拖累

 

与语文相似,AI 在传统强项——英语上的表现,也进入了一个平台期。

去年,各家 AI 的英语成绩已然不错,今年的模型能力并未产生飞跃。事实上,所有参评模型的平均分仅比去年提高了 3.2 分,进步幅度远小于数学。

而模型的整体分数,也落在了 130-140 分的区间,并未到达人类学霸的水平。

按理说,这稍显反常。

AI 的英文水平是有目共睹的,或许比不少英文专业的学生讲出的英语更正宗。

而高考英语这张试卷,本身远未触及母语者的语言天花板,且相较于包含古文的语文,其客观题占比更高、作文要求更简(仅 80 词),也并不追求立意高远,理论上是 AI 更容易获得绝对优势的战场。

然而,AI 考生并未在此表现出更强的统治力。

那么,瓶颈究竟出在哪里? 作文题可能是一大拖累。

这背后有两个可能的原因:

  1. 苛刻的字数限制:
  2. 在语文写作中,AI 就已经暴露出了时而「话痨」时而「不爱说话」的属性,但在长篇写作中,字数要求不是那么苛刻。但在 80 词的微型写作中,精准控制字数就成了一大挑战,稍有不慎便会因超词/少词而被扣分。
  3. 缺乏应试智慧:
  4. 在有限的篇幅内,人类考生会有意识地使用更高级句式、时态来「炫技」以博取高分。而 AI 的目标通常是清晰、完整地传达信息,它不会刻意为了得分而优化句式复杂度,因此在评分细则上可能吃了暗亏。

而本次评测最有趣的一点,莫过于中外模型在作文上呈现的「主客场反转」现象。

在中文作文这一「客场」,以 ChatGPT 为代表的「洋考生」拔得头筹;

然而在本应是其「主场」的英文科目上,它却不敌「中国考生」——DeepSeek 在选择题上甚至拿了满分,而最终总成绩上,DeepSeek 也与豆包一同超越了 ChatGPT。

 

05

理综三科:有进步,但仍然不算十分优秀

 

如果说 AI 在数学上的进步是「一飞冲天」,那么在理综三科上的表现,则更像是一次「破冰启航」。

相较于去年,理综三科有一定进步——所有模型都提分 10-20 分,但整体成绩依旧挣扎在及格线附近,清晰地标示出 AI 与顶尖人类考生之间的能力鸿沟。

相比于数学,理综三科既考验逻辑能力,又考验多模态能力——物理化学两科的图题占 80% 以上,生物的图题也占全部题目的一半左右。

而今年,读图能力的解锁,加上模型推理能力的增强,共同带动了理综能力的进步。

不过正如绊住 AI 的数学题所展现的一样,能「看见」,不代表 AI 能「看懂」。

这在大模型在化学上的表现不佳上,能清楚地展现出来。化学题目对图片的依赖性强,且化学题目图片的复杂程度更高,此时 AI 的短板便暴露无遗。

目前,顶尖 AI 的理综成绩大致相当于中上游的人类考生水平,但远未达到「学霸」级别。正所谓「卷子越难,差距越显」,在综合性与深度并存的理综试卷上,AI 尚未具备稳定碾压人类考生的实力。

分科来看这次 AI 的成绩:

物理,进步最快的「排头兵」

物理是此次理综三科中进步最快的「排头兵」,平均分提升了 20.25 分。

在客观题和填空题上, ChatGPT 的选择题正确率高达 92.13%,豆包也达到了 89.81% ,展现了对物理基本概念和规律的扎实掌握。

化学:被复杂图形拖累的「重灾区」

相比之下,化学成为了拉低理综总分的「重灾区」。 整体得分偏低,仅有豆包勉强及格 ,选择题和填空题的平均得分率均低于 60%。

其核心痛点在于对复杂化学图形的双重依赖:不仅题目本身高度依赖图片(如实验装置、反应流程图),且化学结构图的复杂程度,也常常超出当前模型精准理解的极限,导致失分严重。

有机物大题依旧是所有大模型的主要软肋 。例如,满分为 12 分的第 25 题(有机化学),所有模型得分极低。该题主要考察有机物合成路径与结构,评测中 没有一个模型能够正确生成有机物的结构简式 ,对有机物的空间结构理解也相当薄弱。

生物:折戟于遗传计算的逻辑关

生物科目的短板则精准地暴露在需要严密逻辑推理的遗传题上。例如,分值高达 16 分的第 22 题(遗传大题),大模型普遍表现不佳, 得分最高的 ChatGPT 也仅拿到 9 分 。该题重点考察基因型分析、遗传概率计算等,这恰恰是考验模型在抽象信息基础上进行多步推理的能力。

 

06

AI 仍然偏科,文综是舒适区

 

在今年的 AI 高考评测中,一个清晰的趋势得以延续:文科综合依然是 AI 的高分舒适区。

早在去年,ChatGPT 就已拿下文综 237 分的高分。而今年, 元宝更是将文综最高分推升至 253.5 分 ,这一成绩,与理科综合最高分(213.25 分)形成了鲜明对比。

相比去年,文强理弱的偏科问题虽有缓解,但基本格局并未改变, 这与人类考生相反。在人类考生中,理综最高分往往比文综最高分高出不少。

在无需联网的情况下,头部 AI 在文综上的得分率已超过 80%,达到了人类优等生的水平。

今年的分数增长,主要由地理科目贡献。细分来看,各科的进展与瓶颈也愈发清晰:

最大看点无疑是地理。得益于多模态能力的飞跃,AI 在地理图题上的理解力显著增强, 使得该科目平均分激增了 20.3 分 ,成为进步的火车头。

地理题上想更进一步,面对的挑战与理科中的化学如出一辙——对高度专业的复杂图形,AI 理解依然吃力。例如,在失分最严重的第 19 题(地形地貌综合分析题)上,模型的表现可谓「溃不成军」:

第(1)问关于地貌走向的判断,仅有极少数模型答对。

第(2)问关于「拔河高度」的专业概念计算, 所有模型均告失败。

与之相对,政治和历史科目的分数则基本处于高位平台期,并未呈现显著进步。

对于这两个科目,挑战已经进入了更难的范畴: 能否精准理解考纲、运用学科语言、并进行多维度深度分析。 对于人类考生而言,这也需要专门的训练了。

例如,DeepSeek-R1 就因思路过于发散、偏离考点而大量失分。而在历史小论文上,AI 普遍难以做到对历史原因进行深刻的多维度剖析,论述仍显单薄。

一个小细节很有趣,与中国模型提分相对应的是,今年 ChatGPT 的文综分数不升反降。

这种「主场优势」也从侧面体现了了,在通往通用人工智能的道路上,对地域性规则的深刻理解与适应,依然是不可或缺的一环。

 

07

彩蛋 1:AI 眼镜能用来作弊吗?

 

从去年到今年,AI 眼镜等「视觉 AI 硬件」无疑是科技界最炙手可热的焦点。其背后的核心驱动力,正是大模型的实时视频理解功能的出现。它意味着 AI 正从被动接收指令,进化到主动感知和理解物理世界。

巧合的是,今年的高考也迎来了一项新变化:考场安检门全面升级,旨在精准防范智能眼镜等新型作弊工具。

这不禁让人好奇: 这些新兴的、能与视频进行实时交互的多模态大模型,真的能用来在考场上「大显神通」吗?

我们抱着这个疑问,选择国外的 ChatGPT 与国内的元宝,进行了一次非常规的测试。为简化流程,我们仅选用难度较低的英语阅读题,尝试让视频模型「观看」试卷并作答。

虽然只是一次非常简单的测试,结果却非常清晰,问题也相当明显:

1. 严重的幻觉问题: 模型非常容易自行想象,这点 ChatGPT 和元宝都有体现,但元宝更为明显。元宝在测试第二篇阅读时,就开始凭空编造一篇完全不存在的文章和题目,导致最终无法进行测试。

英语卷的第二篇阅读,讲述的是一位九年级写作老师关于如何教授学生「写作为什么重要」的反思。文后的 24 题,则是提问第一段提到了哪些人物。

而在对元宝进行测试的时候,元宝不断在屏幕还没有出现选择题时,直接编造一道选择题并回复答案,导致测试无法进行。

在发现问题后,我们向模型提问,这篇文章讲了什么,模型的回答也很是诡异——与原文仿佛相似,但是实际上是完全不同的故事。

2. 被动的交互模式。 为了模拟真实考试,我们在测试中,要求模型看到题目的时候,直接回答答案,不需要解释也不需要等人问。尽管 ChatGPT 声称可以看到题目直接作答,但实际并不会主动进行。整个过程需要测试人员通过语音不断提示、引导,距离「全自动解题」相去甚远。

 

3. 混乱的结果: 在每次看到题目,给定更加精密的提示词的情况下,我们勉强从 ChatGPT 处得到了一组答案,但这个结果参考价值并不大。

稍多几次测试就会发现,翻页的速度变化、镜头的晃动程度变化,提示词出现的时间变化,甚至差不多的流程重复同一个问题,都会导致模型给出截然不同的答案。

虽然视频模型也是 GPT-4o 模型,和 GPT-4o 模型直接按照图片作答的稳定性和准确性相距甚远。

而且幻觉问题会随着上下文的长度越来越严重。在被问及第三篇文章讲了什么的时候,GPT-4o 回答的是第一篇的主要内容。到了最后一篇文章,模型的正确率和蒙的也差不多了。

今天的视频大模型,像极了去年的图像大模型,仍处于非常早期的阶段。各家大模型产品也并没有想在目前阶段主力推广这一功能——GPT-4o 的视频通话功能在不长的测试时间后,迅速达到了当日限额。

想在目前阶段,单纯依靠它在考场作弊,还需要担负必须不断跟它说话、答案完全不准等巨大风险,基本属于科幻情节。

尽管如此,在模型表现较好的时候,AI 能够在看到屏幕几秒内,马上很肯定地讲解出屏幕上的英文在讲什么,确实也是一种让人感觉十分惊艳的体验。

 

08

彩蛋 2 : 仿生人会爱上自己生成的电子羊吗?

 

自古「文无第一,武无第二」。在人类创作者中,风格流派各异,喜欢现实主义的人有时候就是「get」不到意识流的文风。

那么,在 AI 的世界里呢?大模型是否也存在审美偏好呢?它会因为更欣赏自己的文风,从而在给其他模型打分时产生偏见吗?

我们进行了一项有趣的尝试: 让参与本次评测的大模型们,对彼此生成的作文进行交叉打分和排序。

测试选用的是作文题目的第一次采样结果。

图片里横向是鉴定师,而竖向是作品。我们标蓝了模型认为的前三名作文,和人类认为的前两名作文。

根据这个不完全统计,模型并没有表现出对自家作品的特殊偏爱,有时候反而可能给自己打低分——比如元宝的作文,在人类和其他模型的横评中,都取得了很高的分数,但在自己的评测中,反接近最低分了。

AI 与人类判分员的审美,大方向仍然是一致的。

可能真的只是和我们普通人类一样吧:我知道什么是好的,就是写不出来。

 

09

结语

 

今年,或许是高考测试对大模型仍具挑战意义的最后一年。

当 AI 已经能展现出冲击顶尖学府的实力时,这个人类社会的智能筛选器,可能未来不再能成为对 AI 有区分度的测试了。

高考测试,不仅仅是一场对人类智慧与 AI 智慧的对比,也是我们观察 AI 智能发展的一个刻度表。

过去一年,我们对 AI 能力的直观感受和多次验证,正在不断地提醒我们: AI 正加速逼近甚至超越普通人的能力边界。

但它的发展并非线性——它能攻克人类眼中的难题,却也会在看似简单的题目上意外失足。

正因如此, 高考,这个完美融合了知识掌握、逻辑推理与应试策略的综合场景,让 AI 展现出了它最迷人而矛盾的一面:它时而展现出顶尖人类的才华,轻而易举地攻克难题;时而又暴露出孩童般的认知盲区,在基础问题上犯下令人啼笑皆非的错误。

感谢高考。它用一种我们最熟悉的方式,为 AI 的通用智能水平提供了一张刻度清晰、极具参考价值的「快照」,而这,很可能是最后一张了。

AI 的下一站,终将是更复杂、更广阔的现实世界。考试,只是它漫长征途的起点,而非能力边界的终点。

这张快照,最终将成为它成长相册里,一张记录了进化途中的光荣与笨拙的泛黄的旧照片。

*头图来源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

 

等不到始祖鸟的老外,疯抢这个 999 美元的国产消费级「外骨骼」

科幻电影中,外骨骼堪称最酷的科技装备之一。从《异形》中可以让普通人类直接对抗异形的 Power Loader,再到《钢铁侠》飞天遁地的钢铁战衣,这些可以大幅增强人类运动、负重能力的的外骨骼,一直是科幻编剧们最钟爱的设定。

今天这些设定正在逐渐成为现实,从去年始祖鸟推出的售价 3 万多的外骨骼动力裤引发抢购热,到今年春节期间爆火的国内景区推出的外骨骼产品租赁服务。而在产业界,更是有一批外骨骼公司,正在以一两万的售价,将轻量级外骨骼产品直接推向市场。

今天和大家分享的 Hypershell X,就是当下最受关注的消费级外骨骼产品之一。在官网的宣传视频中,其不仅可以用于爬山,长跑、骑行等运动也可以用它辅助。值得一提的是,这款最高配 1799 美元的产品,不仅比 4500 美元的始祖鸟便宜了一半还多,而且已经开始向用户发货(注:去年开始接受预订的始祖鸟的 MO/GO 预计 2025 年 10 月开始发货)。

Hypershell 目前的最高配产品,可以卖到 1799 美元

出于对产品的好奇,笔者设法借到了一台。在两周的深度体验里,笔者戴着它走路、骑行,甚至专门用一个周末戴着它挑战爬山之后,我认识到了这款产品的优点,也意识到了现阶段消费级外骨骼的瓶颈,以及它预示的无限可能的未来。

 

外骨骼能让我们变成「钢铁侠」吗?

有了外骨骼,每个人都能变成漫威的超级英雄?答案当然是否定的。今天的消费级外骨骼,任何普通人穿戴后都能获得一定级别的能力增强,但现阶段别说「人均斯塔克」——人均「博尔特」都差得很远。

还没发售的始祖鸟 MO/GO,其介绍里是“能提供 40%的动力提升,让佩戴者感觉减重 14kg”。而 Hypershell X 官方介绍是最多抵消 30 公斤重量,增强 40% 腿部力量和减少 30% 体力消耗。

Hypershell X 系列目前分别有「Go」「Pro」「Carbon」三款,售价分别为 999 美元、1199 美元、1799 美元,折合人民币约为 7200-13000 元。笔者体验的是中间版本的 Hypershell Pro X。它重量为 2kg,仅比最高配的 Carbon X 版重 0.2kg(均不包含电池重量,电池重量 410g)。

从外观的角度来看,无论是穿戴 Hypershell 产品上街还是爬山,都没有让我成为街上的显眼包。在咖啡店等单的时候,同事形容戴在腰间的 Hypershell 就像是「戴着个腰包」;而当我在京郊完成一段两小时左右的轻徒步过程中,全程只有一个游客认出了这个在小红书、抖音平台上很火的外骨骼设备。

这个设计理念也在笔者和 Hypershell 工程师的交流里得到了印证。不同于很多新形态的智能硬件希望营造「科技感」,极壳认为外骨骼在设计时不应该过于张扬:「尤其是未来面向一些老年或医疗使用场景,他们也许不希望得到太多的注目。」

Hypershell X 系列产品及配件展示

穿戴的过程并不复杂。先调节腰部尺寸,就像戴腰包那样把设备主体「穿」在身上。接着再根据身高和大腿围调节腿带的高度和松紧,把设备两侧的腿杆能够以适当的松紧绑在距膝盖上方大约两指的地方,以保证后续设备运行时可以有效助力。

穿戴完成后,在手机上下载 Hypershell 的 App,注册一个新的账号。初次登录时,需要先输入使用者的身高、体重、性别 3 个不同的身体参数,作为后续处理和计算的基础数据。

把设备和手机应用通过蓝牙连接,就可以在手机 App 上调节不同的档位和不同的运动模式。Hypershell Pro X 目前可以提供「舒适、极限、通透、健身」4 种不同的助力强度,以及包括「行走、奔跑、上坡、骑行」等在内的 10 种手动标注的运动状态(基础版为 6 种)或「自适应动作识别」。当然,也可以通过设备右侧电机上的实体按键进行操作。

不过,由于 Hypershell X 系列只有一个实体按键,所以进行开关机、模式切换、强度切换等需要通过一系列复杂的不同点按方式才能实现(如短按、长按、短按+长按等)。笔者现阶段还是更习惯在手机 App 上直接操作。

在日常行走时,穿上 Hypershell X 后可以明显感受到设备通过腿杆对大腿的「提拉感」,这会让大腿比正常走路和上楼梯上抬得更高,同时步幅会明显增大,身边同行的人表示需要比平时走得更快才能跟上我的速度。而笔者的同事哪怕只是短时间试戴,摘掉设备后也会觉得「有点不会走路」、「腿感觉抬不起来」。

笔者在小区里进行了一次 2 公里的平路行走测试。全程为 2 公里,将心率都保持在每分钟 120 次,并采用「先无后有」的顺序。Apple Watch 数据显示:穿戴外骨骼设备后,步行配速每公里提升约 20 秒,总消耗从 135 千卡降至 123 千卡,降幅为 8.9%。

平路步行测试:左侧为未穿戴设备时的数据,右侧为穿戴设备时的数据

不过,当我把实验场景切换到健身房踏步机(也叫「爬楼机」)时,由于进入了高强度有氧甚至无氧(平均心率为 170)区间,尽管仍然可以感受到提拉感,但心肺层面的疲惫感显然无法快速消除。而从测试的结果来看,第二次训练戴上 Hypershell 时,Apple Watch 统计的卡路里消耗甚至还要高过第一次没有佩戴外骨骼设备时的消耗量。

所以,简单总结一下使用感受:首先 Hypershell Pro X 的确能在一定程度上提供运动帮助,但这个帮助不是无限的,也许能让爬山费点劲的人变得轻松一点,但不可能做到让从来不运动的人立马就能完成一个半马。

 

消费级外骨骼的「必答题」和「附加分」

在体验 Hypershell 前,我脑海中一款「消费级」外骨骼产品至少需要把以下几个必答题做到高分:轻便、方便穿戴、耐用性好、价格合理。如果销量还高点,大概还需要提升一点颜值——做到看起来既不突兀又能适度体验科技范儿。

但在一周体验之后,我发现仅仅答好这些基础题还远远不够。「消费级产品」区分于「专业工具」的一个关键点是:用户可以多种不同的环境里使用。这就要求外骨骼产品还要拿到更高的「附加分」:在运动控制层面,提高多运动场景的适配性。

一个最典型的户外场景就是徒步。在几个小时的连续行进中,用户需要在爬升下降、土路台阶等不同动作和外界环境随时切换。如果一款产品只能帮助我们上坡,那么在下降的时候,它就会成为我们身上或者包里额外的几公斤负重。

笔者也戴着 Hypershell Pro X 在京郊进行了一次轻徒步体验。使用后最大的感受就是:尽管 Hypershell 目前已经在手机 App 里提供了 10 种不同的动作识别,但在实际使用过程中,在绝大部分场景里,我都会直接开启「自适应动作识别」模式。这样就可以更专注地关心路况,几乎不需要掏出手机进行额外操作。

Hypershell 手机 App 的操作界面,可手动选择 4 种模式和 10 种动作姿态

只是在少数场景下,例如连续的长上坡,我才会切换到「上台阶」模式,这样 Hypershell Pro X 可以给我提供更「猛」的助力。

最让笔者惊喜的,是 Hypershell 在下坡时的体验。不同于其他路况,下坡(尤其是土路上坡)我们并不希望设备把腿抬得更高。因为这时更需要重心靠后,略微下蹲辅助支撑以及防滑。电机通过腿杆传递,提供了一种「反向」的作用力——向下向后的支撑感,在陡坡上提供了一定的帮助和信心,就像手中多了两根登山杖一样,这是在测试前完全没有预料到的。

在笔者看来,「自适应动作识别」模式是未来外骨骼产品的必备。在绝大多数时候,它都可以主动适应用户行为和外界环境变化,并对功能进行微调。

这有点像开着一台智能 SUV 去越野,大部分时候,你只需要像日常驾驶一样操作就好了,只有在少数特定的场景下,才需要手动调节到脱困、涉水或者窄路模式,以应对极端场景。

而为了达到更智能的体验,笔者认为:外骨骼产品的下一步,需要拥有更强的感知能力和更强的大脑。

海外用户对 Hypershell 的评价:「很吃惊它能预判我的动作」

更强的感知需要更高维度的数据输入,例如可以检测心率、「看」到外界真实的环境。扫地机器人从只有机械臂到拥有了高清摄像头和激光雷达;现在传闻苹果都要为 AirPods 安装视觉摄像头了,也许我们可以期待未来「Ultra 版」的外骨骼配备更多的传感元件并采集更多维度的数据。

此外,产品也需要拥有匹配这些高维数据的主动推理能力。尽管外骨骼如今被视为具身智能技术的延长线,但某种程度上,它比一般的机械臂要更复杂。作为一种可穿戴智能设备,它的行动和人体是高度一致的,因此它需要推理感知实时状态,才能和使用者达到最佳的配合程度。

设想一下,当这些问题都得到优化之后,用户在使用外骨骼产品的时候,大概率就越来越不需要那个和它搭配使用的手机 App。这款手机 App 也许会成为和智能辅助驾驶的 SR 界面一样的功能,更多时候它只负责交付一种视觉安心感,告诉用户「我看到了这些信息,我在处理」。而更简单的操作和更一体化端到端的交付,应该是外骨骼以及大多数智能硬件产品在智能时代希望达到的方向。

 

在细分领域里,寻找智能硬件的新机会

在 Hypershell 身上,我们也看到了智能硬件领域近年来的一些发展共性。

过去 20 年左右的时间里,优秀的硬件创新往往来自于大品类,如智能手机、智能汽车。它们几乎都是可以覆盖上亿人群的产品。

然而今天,越来越多的创新开始从细分市场里生根发芽。创业者们开始意识到,充分挖掘并满足「小众市场」里的真需求,也可以创造出一个「大产品」。

这种变化来源于供给端环境的变化。

在笔者和多个硬件创业者的沟通里,都可以得到一个明确的信息:今天想在珠三角进行硬件创业,你可以达到强大的供应链技术和网络支持。说得夸张一点,在不考虑成本和量产难度的前提下,很多天马行空的 demo 产品,供应链技术都可以给你「搓」出来。

一位创业者告诉笔者:在新硬件品类里,哪怕和日韩和欧洲竞争,它们最后的制造环节大概率也会回到珠三角。除此之外,近年来不少供应链企业也正面临国际品牌供应链转移。大厂的订单减少了,这些溢出的供应链能力自然也就愿意多跟创业者们谈谈合作。

华强北被称为「全球智能硬件创客的天堂」 | 图片来源:视觉中国

供给端外,市场的变化也为细分品类成长提供了更多可能。

过去做产品时,往往会追求最大公约数。但其实,即便是万分之一的需求,放在全球乃至全球市场里,也都是一个很庞大的量。随着各类内容平台以及跨境电商平台的不断成长,创业者也就拥有了更多工具和手段,让这些「小众产品」触达到想要影响的目标用户。目前很多优秀的硬件创业者都可以在海外市场获得极大市场份额,也和这些市场的「基建」变化不可分割。

以上两点,供应链能力的提升让创业者可以把产品「做出来」,市场工具的进化可以让产品「卖出去」,也就构成了硬件创业的两个最关键的前置条件。

「智能化」则扮演了最新也是最关键的加速器角色。因为站在用户视角来看,无论成本再低、触达再容易,他们愿意掏钱购买的「智能硬件设备」,是一款可以在生活中高频使用的工具,而不是一个吃灰的摆件。而智能化和 AI 恰恰提供了这种可能,让外骨骼可以从工厂走上自行车、走向雪场、走向更多场景。

所以,我们也就看到了越来越多的创业者,正尝试着把更多过往只被运用在工业场景里的技术,「下放」到消费级里,做出更多的新产品。也许未来十年,硬件领域里仍然不会出现取代智能手机的个人计算设备,但消费者大概率可以期待更多好玩实用的新玩意。

这或许也是智能硬件行业里,应对同质化内卷的一种新思路。

vivo X Fold5 评测:更轻更强,苹果生态最佳 CP

从 2022 年 4 月,vivo 首代 X Fold 正式发布开始,vivo 折叠屏就一直承载着「挑战直板旗舰的同时在智能手机操作效率上取得突破」的目标。让大屏不只是为了某几个特定 App 而存在,而是如同新鲜空气一般,在无数细节之处,提升用户的智能手机使用效率。

时间到了 2025 年,X Fold 系列已经迭代了四个版本,折叠屏手机也在过去四年渐入佳境,甚至出现了包括电池、USB-C 接口厚度在内的种种物理因素限制,让折叠屏手机在「轻」「薄」等维度上继续突破显得难能可贵。

作为如今仍然在大折叠这个赛道坚持推陈出新的品牌,我们还是能在 vivo X Fold5 上看到,vivo 仍想在这个品类下再次实现「自我超越」。

这一次,vivo 提出了「极致轻薄与可靠」、「苹果生态最强搭子」、「全场景轻办公神器」这三个折叠屏手机核心维度,作为对应的 2025 年度折叠屏旗舰产品问世的 vivo X Fold5,这次又有哪些突破?

 

01

形态「轻」与「强」:

重塑折叠旗舰的物理标杆

 

拿到 vivo X Fold5,第一感觉仍然是 vivo 旗舰产品线熟悉的家族化设计元素:圆形相机模组,极简机身设计以及作为点缀的蓝色蔡司 ZEISS Logo,一切熟悉的设计元素都是在明示用户——即使它是折叠屏,它仍然有着 vivo 旗舰引以为傲的各种能力。

 

除了这些熟悉的元素之外。这次 vivo X Fold5 外观部分最明显的改变,是我们手上的是新款的「青松」配色;这款配色除了青色自带的清新感之外,还融入了更多独属于折叠屏手机用户的内敛沉稳感。

「轻」对智能手机的体验而言并不是全部,但确实是 2025 年智能手机迭代的一个「共识」,对于持续数年一直在孜孜不倦追求轻薄的折叠屏手机来讲更是如此。更轻的折叠屏能换来更好的日常握持体验;即使不使用内屏,也仍然是一款优秀的旗舰手机。

在「轻」这个维度上,vivo X Fold5 再一次冲击最轻大折叠这个位置;官方标定数据「钛度」重量为 217g,我们手上的「青松」以及「明白」为玻璃材质后盖。因此整体重量为 226g。

这个重量,不仅轻过 iPhone 16 Pro Max(227g),甚至轻过自家今年刚发布不久的影像旗舰 vivo X200 Ultra(229g)。

除了「更轻」,在「更薄」上,vivo X Fold 系列也是「战绩可查」,上一代 vivo X Fold3 几乎与市面上主流的  USB-C 数据线厚度相当,在当时甚至都很难想象到「下一代还能怎么接着做薄」。

 

没想到时隔一年之后,vivo X Fold5 交出了 2025 年的答卷。在手机的不少规格与细节上,都能看到设计团队的取舍与巧思。vivo 也确实是为了进一步将折叠屏手机做到轻薄,在各种细节上都已经趋于极致了。

 

vivo X Fold5 在 USB-C 接口处采用了独特的切角处理 | 图片来源:极客公园

 

 

续航长期以来是折叠屏手机相比常规直屏手机来讲优势明显的长板之一,这一次 vivo X Fold5 更是直接搭载了等效 6000mAh 的蓝海电池。

就现有的折叠屏手机用户群体——追求效率的移动办公用户来讲,更大的电池意味着什么自然不言而喻。满足一天的重度使用完全绰绰有余。

除了这些,vivo X Fold5 还在「三防」这个领域发力:这恰恰是传统折叠屏手机相比如今的直屏旗舰手机最明显的短板之一,折叠屏的铰链/转轴以及屏幕结构都远比直屏手机更加脆弱,在加入 IPX9+ 防水、IP5X 防尘以及 -20℃ 防冻能力之后,或许折叠屏也能第一次在可靠性上战胜直屏旗舰。

02

协同之「魂」:打破壁垒,

苹果用户的「最强搭子」

 

虽然高端商务是过去 X Fold 系列留给不少用户的一个印象之一,但对我而言,留给我印象更深的是他们一直在做的「生态破壁」这件事。

vivo 一直在如何解决 iPhone 用户与 Android 折叠屏协作「破壁」这件事上,给用户想象之外的能力更新——上一次是能完全接管 iPhone 来电/短信与通知的「双机互联」,这一次在 vivo X Fold 5 上,vivo 交出的答卷是「Android 首次链接 Apple Watch」。

虽然 Apple Watch 用户数量庞大,由于 Apple Watch 天然的生态壁垒属性,过去甚至很少有手机厂商思考过「兼容 Apple Watch」这件事,随着 vivo 生态破壁这件事逐渐涉及到更多核心用户需求,这一点似乎已经变得顺理成章。

 

实际的配对过程也与 iPhone 双机互联功能类似,首先,在 Apple Watch 上下载「vivo 健康互联」,在 vivo 健康中扫码即可完成配对,在配对之后,不仅电话短信通知等内容都可以被无缝转发到 vivo X Fold5 上,Apple Watch 健身中经典的三环、心率,血氧甚至是睡眠等数据,都可以通过这种方式实现「数据破壁」,涌入 vivo 生态中,解决双机用户生态割裂问题的「最后一公里」。

提到「iPhone 搭子」这件事,除了 vivo 这次给 X  Fold5 也准备了兼容 MagSafe 的磁吸保护壳(这是 vivo 旗舰第一次出现类似配件)之外,包括 AirPods 支持空间音频、给 iPhone 实现的反向无线充电也都是值得一提的能力。

在做 iPhone 最好的 Android 搭子这件事上,vivo 已经踏入了其他手机厂商难以企及的深度。

 

AirPods Pro 链接 vivo X Fold5 | 图片来源:极客公园

作为 Android iPhone 双持的用户,在类似地铁等场景中,使用 Android 手机充当热点、给搜不到信号的 iPhone 续命来保证正常使用,某种程度上已经是常态,这次 vivo 也考虑到了这一需求,在系统中加入了「便捷热点」功能,为 iPhone 提供的网络信号增益。

 

Vivo X Fold5 支持以有线/无线的方式直接给 iPhone 供电 | 图片来源:极客公园

 

03

效率之「器」:

折叠形态下的生产力与创作力

 

长期以来「折叠屏手机能更高效处理多任务」这件事没能持续打动更多普通用户,本质原因仍然是在「如何在比电脑小、比手机大的屏幕上进一步做出效率突破」这个问题上,折叠屏手机厂商并没有给出更有说服力的回答。

除了更好融入 Apple 软硬件生态,vivo 当然也要在折叠屏效率本身上做出突破。在 OriginOS4 时代,vivo 用「轻折分屏」和「超级拖放」功能作为对折叠屏存在价值的证明,这一次,vivo 拿出了此前只有在平板设备上出现过的「原子工作台」。

在开启原子工作台模式下,用户可以在台前最多同时调用五个应用,同时还能在不同应用之间,通过拖拽的方式快速传输文件,同时自适应布局结构也让应用无论是竖屏办公,还是横屏游戏,都不会影响到实际的操作手感。

 

「原子工作台」能在前台最多同时展示五个应用 | 图片来源:极客公园

作为效率提升的一部分,这次 X Fold5 不仅想提升折叠屏本身的操作效率,还加入了作为 Mac 能力边界拓展的「镜像扩展屏」和「键鼠协同」功能,在一些用户只带 MacBook 出门,但临时需要多屏来处理一些复杂需求的场景,可以尽可能地发挥折叠屏手机的大屏优势,从物理上缓解外出办公时的多屏压力,对 MacBook 用户而言,相当于随身携带了一片拓展屏出门。

 

「镜像拓展屏」让 vivo X Fold5 能作为 Mac 的副屏来使用 | 图片来源:极客公园

vivo X Fold5 还首发支持了安卓直通 iCloud 云盘,用户可以直接在 X Fold5 文件管理中访问 Mac 电脑文件的功能,虽然实际的传输速度与便捷性无法与本地文件相提并论,但同样是一招关键的「破壁」招式,面对 iCloud 文件分享链接,在大屏幕上可以处理的更加游刃有余。

与 iPhone 目前的「破壁」体验相同,vivo 在与 Mac 这片更大的屏幕的交互上,同样在做打通设备物理边界、提升用户多设备使用效率这件事,包括 X Fold5 电话/验证码短信可以通过 vivo 办公套件流转至 Mac 端、手机端可以使用「文件管理」App 直接访问 macOS 电脑文件,这些以往很少有大厂涉足的领域,同样是 vivo 拓展生态包容性的手段。

vivo「蓝图影像」发布至今,在手机影像旗舰领域已经有了一席之地,但对于轻薄已经成为竞争生命线的大折叠手机来讲,走到 2025 年,如何「做减法」成为了各家折叠屏品牌都不得不钻研的一门功课。

 

但归根结底,对手机摄影而言,优秀影像能力的前提仍然是优秀的硬件,而有着「大而全」硬件基因的 X Fold 系列一直相机硬件搭配上有着较为激进的风格:无论是有着蔡司自然色彩和 T* 镀膜,还是镜头焦段的覆盖范围,vivo X Fold 系列一直都有资格算得上智能手机行业翘楚。

 

而 vivo X Fold5 这次的影像策略选择了继承 vivo X Fold3 Pro 熟悉的基因,尤其是 5000 万像素、三倍光学变焦的这颗蔡司潜望长焦。以一种最简单直觉的方式,将 vivo 旗舰手机用户熟悉的「长焦悬日」「长焦微距」等功能体验带了回来。无论是 10 倍、3 倍都保持了超高的可用性。

3x 长焦镜头的存在,足以让 vivo X Fold5 仍然是一款长焦能力优秀的影像旗舰,加上 vivo 2025 年开始,在旗舰产品线上推广的大模型画质增强技术,让长焦 10x 及以上的超级远摄场景,也能在端侧大模型的计算下,得到明显改善的画质观感。

 

 

vivo X Fold5 3x 长焦原生  / 10x 缩放画质对比 | 图片来源:极客公园

 

 

vivo X Fold5 1x 主摄  / 3x 长焦原生画质对比 | 图片来源:极客公园

 

 

vivo X Fold5 1x 主摄原生  / 10x 长焦缩放画质对比 | 图片来源:极客公园

除了风光领域之外,vivo X Fold5 这次还首发了「经典负片」风格,甚至今年开始流行的 Android 端 Live Photo 都可以直接套用这一经典风格样式。85mm 长焦也能为人像拍摄提供独特的空间压缩感和故事感。

 

经典负片效果|图片来源:极客公园

 

CCD 风格效果特写|图片来源:极客公园

 

 

04

总结

 

或许你已经注意到了,这一次 X Fold 系列上,vivo 将 Pro 与标准版合二为一,集中全力打造 vivo X Fold5 一款机型。

这一策略不同的用户可能有不同的理解,但在我看来,这是 vivo X Fold 系列在折叠屏技术探索逐渐成熟的同时,真正开始从「尝鲜品」向「全能主力机」转变的一个信号。

 

诚然,虽然折叠屏在硬件发展上趋于成熟,但用户对折叠屏给效率带来的提升这件事的需求,仍然还有很多没有得到满足。因此,作为「轻薄新标杆」同时兼具「苹果生态破壁者」属性的 vivo X Fold5,或许是对于「折叠屏手机还能怎么提高效率」这个问题的一个新回答。

vivo X Fold5 适合那些追求极致体验的商务人士、饱受生态割裂之苦的苹果/安卓双机党,以及所有希望将折叠屏作为唯一主力机的科技爱好者。

从这个角度来讲,vivo X Fold5,仍然是一款充满创新的 2025 年度旗舰折叠屏手机。

小米 YU7 租车 2 千/天,打平兰博基尼;日本推出「猫咪压力项圈」;OpenAI 斥 Meta 挖角「入室盗窃」|极客早知道

小米 YU7 现身租赁市场:日租要价 2000 元,跟兰博基尼一个价

6 月 29 日,小米 YU7 上市后直接卖爆,订单也创下了全球车企的销售纪录。在小米汽车门店,看车的人络绎不绝,想要试驾的话,有销售透露,试驾要排到一周之后了。

小米 YU7 的热卖,也带动了租赁市场,在二手平台搜索「小米 YU7 出租」发现,目前已有大量商家上线小米 YU7 租车服务。

据了解,根据是否是现车或提车时间不同,商家们的日租报价也不相同,普遍是 2000-4000 元/天,租赁车辆可以用于商务接待、评测体验等。如果是赛道刷圈、拆车对比等,还需要额外加钱。

虽然小米 YU7 的起售价格只有 25.35 万元,但租赁价格却已比肩不少超跑车型。作为对比,兰博基尼小牛的日租价格为 2000 元左右,法拉利 458 等车型租赁价格也在 2、3 千元不等,小米 YU7 因为流量和稀缺性,其租赁价格远超它的车型定位。(来源:新浪科技)

OpenAI 与美国国防部、印度政府达成 AI 定制合作,服务收费至少千万美元

6 月 29 日,The Information 刚刚报道称,OpenAI 正在效仿 Palantir,加大咨询服务投入,并已与美国国防部、印度政府以及 Grab 达成定制化 AI 合作协议。

消息人士称,OpenAI 在向大公司和政府机构推销其 AI 技术时,借鉴了众多软件公司的策略——提供内部研究人员和软件工程师,为客户定制 AI 解决方案。

该公司正在扩充人员与资源以强化此类咨询式服务,通常对客户收费至少 1000 万美元(现汇率约合 7168.6 万元人民币),然后其工程师将指导客户完成「微调」过程。(来源:IT之家)

 

Meta 再挖角 OpenAI 四名研究员,OpenAI 称其「入室偷窃」

6 月 29 日,据 TechCrunch 本周早些时候报道,Meta 已经成功招募了 OpenAI 的知名研究员 Trapit Bansal。紧接着,《华尔街日报》也披露 Meta 从 OpenAI 挖走了另外三名研究人员。而据 The Information 最新消息,又有四名 OpenAI 的研究人员加入 Meta,分别是 Shengjia Zhao、Jiahui Yu、Shuchao Bi 和 Hongyu Ren。

此次 Meta 大规模挖角的背景,与该公司在 4 月推出的 Llama 4 人工智能模型表现不佳有关。据称,该模型的表现未能达到 Meta 首席执行官马克・扎克伯格的预期。

OpenAI 首席执行官 Sam Altman 曾表示,Meta 为挖角人才提供了「1 亿美元(约合 7.17 亿元人民币)的签约奖金」,但同时他也强调,「到目前为止,我们最优秀的人才还没有离开」。

据 Wired 今日报道,OpenAI 的首席研究官 Mark Chen 在公司 Slack 上发布了一份备忘录,将挖角情况比作有人闯入 OpenAI 家中偷窃。

Chen 进一步表示,他将与高层领导合作,研究如何在员工收到 Meta 的 offer 时提供财务补偿,甚至调整他们的整体薪酬。但这位高管强调,他的主要目标是留住顶尖人才。

Chen 还引用了 OpenAI 研究团队其他七位高级成员的消息,就如果 Meta 试图雇佣他们时如何应对这种情况提供了指导。其中一条建议包括,如果 Meta 招聘人员试图用「荒谬」的 offer 施压,就要求他们停止。(来源:IT之家)

 

古尔曼确认苹果 iOS 26 隐藏功能:AirPods 实时翻译等

6 月 29 日,由于苹果在 WWDC 24 上承诺的多个 AI 功能因为无法按时交付而延期,苹果在 WWDC 25 上的发言也变得更加谨慎起来。据彭博社记者马克·古尔曼爆料,iOS 26 其实还藏着两大「彩蛋」:

  • AirPods 实时翻译:支持跨语言实时对话,通过 AirPods 收听翻译内容

  • 全生态 Wi-Fi 同步:跨设备同步酒店 / 健身房等场所的无线网络登录凭证。

古尔曼透露,这两项功能有望在今年 10 月的 iOS 26.1 或 12 月的 iOS 26.2 中上线。(来源:IT之家)

 

微软 AI 芯片「Braga」延期,性能不敌 NVIDIA

6 月 29 日,据外媒报道,微软自研 AI 芯片「Braga」项目遭遇重大挫折,原定于 2025 年底量产的计划被推迟至 2026 年,主要原因在于芯片设计多次修订和高昂的研发成本。内部消息称,微软在技术实现上遇到诸多难题,导致进度严重滞后。

更令人尴尬的是,初步性能评估显示,「Braga」芯片在性能上明显落后于 NVIDIA 最新的 Blackwell 架构,这意味着即便最终上市,也难以与 NVIDIA 竞争。NVIDIA 依然稳坐 AI 芯片领域的头把交椅,其 CEO 黄仁勋甚至公开调侃,造 AI 芯片远没有外界想象的那么容易。微软还在同步研发 Braga-R 和 Clea 两款芯片,计划分别于 2026 年和 2027 年推出,但「Braga」的延期让外界对这些项目的如期落地产生质疑。整体来看,微软、谷歌、亚马逊等科技巨头都在试图摆脱对 NVIDIA 的依赖,但现实是,行业自研芯片的路远比想象中更难,NVIDIA 的技术壁垒和迭代速度让挑战者压力倍增。(来源:快科技)

马斯克公布脑机接口最新进展,受试者有望用意念操控人形机器人

6 月 29 日,马斯克旗下 Neuralink 公司近日公布了脑机接口的最新进展。通过植入 N1 芯片,脊髓损伤和渐冻症患者已能用意念操控虚拟机械手、玩游戏、甚至重新与外界交流。N1 芯片如硬币大小,可无线充电,实时捕捉大脑信号并转化为数字指令,目前已在 7 名受试者中应用。

Neuralink 计划 2025 年实现「意图言语」解码,帮助失语症患者恢复交流;2026 年启动「盲视」项目,助失明者重获视觉。未来几年,电极数量将持续提升,目标是实现多区域植入、治疗精神疾病,并最终通过脑机接口精准操控特斯拉人形机器人 Optimus。行业竞争激烈,微软、亚马逊、苹果等巨头也在布局。预计到 2040 年,全球脑机接口医疗市场规模将达 1450 亿美元。(来源:界面新闻)

 

任天堂就 Switch 2 游戏机供货不足道歉,称公司未能充分预估机型首发需求

6 月 29 日,在第 85 届任天堂年度股东大会上,任天堂社长古川俊太郎就 Switch 2 在全球多国供不应求的情况向股东致歉,承认公司未能充分预估相应游戏机的首发需求。

古川俊太郎表示,自今年 4 月起,任天堂已通过 My Nintendo Store 展开抽选销售,首轮报名人数高达 220 万人,远超预期。目前已进行四轮抽选,第五轮将于 7 月启动,后续公司将积极提升游戏机生产量以缓解供需压力,并在未来将进一步优化抽选机制,同时鼓励更多线下零售商加入抽选行列。

此外,股东大会中有股东批评 Switch 2 使用的钥匙卡游戏卡带是一项「不成熟的措施」,质疑相应钥匙卡设计是否对平台游戏销量造成了负面影响。

对此,古川俊太郎回应称,钥匙卡主要是考虑 Switch 2 游戏体积过大最终作出的抉择,在游戏机上市前,任天堂已与第三方发行商进行过沟通与协商,确定了相应存储介质形式。不过,古川俊太郎并未正面回应相应钥匙卡是否影响了平台游戏实际销量。(来源:凤凰科技)

 

全球首个低温下可精准控制「百万量级量子比特」芯片问世,解决扩展难题

6 月 29 日,据外媒报道,澳大利亚悉尼大学与新南威尔士大学联合开发出全球首款可在低温下精准控制「百万量级量子比特」的芯片,相关成果已发表在《自然》期刊上。

该芯片能在接近绝对零度的毫开尔文环境中稳定控制自旋量子比特,突破了量子计算扩展中控制系统与量子比特之间因热量和电噪声带来的干扰难题。研究团队通过精密设计,使芯片在保持量子态相干性的同时,实现高保真的单比特和双比特操作。

该控制系统功耗极低,总功率仅约 10 微瓦,有望支持百万级量子比特扩展。此次成果证实了复杂电子系统可与量子比特紧密集成的可行性,为量子计算的实用化迈出关键一步。(来源:IT之家)

零跑 B01 纯电轿车预售 10.58 万元起:可选激光雷达版,预计下月上市交付

6 月 29 日,零跑 B01 纯电轿车今晚开启预售,预售价为 10.58 万元起。目前,该车共推出了 5 款配置车型,CLTC 工况续航里程有 550 公里和 650 公里两种版本,预计 7 月正式上市交付。

零跑 B01 的前脸采用了类似 B10 的设计语言,该车配有隐藏式门把手、贯穿式尾灯,长宽高分别为 4770 x 1880 x 1490mm,轴距 2735mm,可选激光雷达版本。

内饰方面,新车配备 8.8 英寸全液晶仪表盘以及 14.6 英寸 2.5K 高清中控屏,并会提供高通 8295P 车机芯片、50 瓦手机无线充电等。该车在副驾前方还配备有 6 个「魔术拓展孔」,可以根据个人需求安装折叠桌板、手机支架等。

动力方面,零跑 B01 提供最大电机功率分别为 132kW 和 160kW,扭矩分别为 175N・m 和 240N・m。同时,该车已经申报有 56.2 千瓦时和 67.1 千瓦时两种不同容量的电池组,CLTC 工况续航里程分别为 550 公里和 650 公里。(来源:IT之家)

 

日本初创公司推出智能 AI 猫项圈,可监测猫咪行为与压力水平

6 月 29 日,一家名为 Rabo 的日本初创公司,就为猫咪设计了一款智能项圈。

这款名为 Catlog_的项圈可以监测猫的多种日常行为,包括进食、饮水、睡眠、奔跑、行走以及梳理毛发,并将这些信息同步至手机应用程序。此外,它还具备定位功能,帮助主人随时掌握猫咪的行踪。

最近,该产品新增了一项功能:通过分析猫咪的行为数据来评估其「压力指数」。这项功能主要依据猫咪在过去 30 天内的理毛频率、静息状态下的呼吸次数以及睡眠状况来判断其焦虑程度。据 Rabo 公司 CEO Yukiko Iyo 介绍,他们分析了超过 46000 只佩戴该设备的猫咪所积累的 100 亿条数据,并借助人工智能技术来评估猫咪的压力水平。一旦 AI 识别出猫的情绪压力过大,就会向主人发送提醒。

Catlog_目前售价为 99.99 美元(约合人民币 717 元),而使用 AI 监测服务则需额外按月订阅,费用为每月 14.99 美元。(来源:中关村在线)

千余名作家联名呼吁出版商承诺限制使用 AI:不发行 AI 书籍、不用 AI 配音

6 月 29 日,近日,包括劳伦・格罗夫、列夫・格罗斯曼、R.F. 奎安、丹尼斯・勒翰和杰弗里・马奎尔在内的一众作家联合发表了一封公开信,呼吁图书出版商承诺限制使用人工智能工具,比如承诺只雇佣人类为有声读物配音。

这封公开信指出,作家们的创作成果被人工智能公司「窃取」了。信中提到:「这些公司没有将作品所创造的收益按一定比例支付给作家,而是将本应属于作家的报酬支付给基于作家们无偿劳动所构建的技术。」作家们认为,这种行为严重损害了他们的权益。

除了要求出版商仅使用人类配音外,作家还们呼吁出版商做出承诺,永不发行由机器生成的书籍,并且不以人工智能工具取代人类员工,或者将人类员工的岗位降级为人工智能监控员。他们强调,人类创作者的劳动价值和不可替代性应当得到尊重。

这封公开信一经发布,便得到了广泛关注。据美国国家公共广播电台(NPR)报道,在公开信最初发布后的 24 小时内,又有 1100 名作家签名支持。(来源:IT之家)

特斯拉首次完成全自动驾驶交付;YU7 锁单交付时间更新,标准版最快 53 周;OpenAI 首次采用谷歌芯片训练

特斯拉 Model Y 首次完成全自动驾驶交付,全程无人控制

北京时间 6 月 28 日消息,特斯拉 CEO 马斯克在 X 平台宣布:「首辆特斯拉 Model Y 已实现全自动从工厂开到客户家的交付任务,包括高速路段,而且比原计划提前一天完成!」

马斯克还提供了一些细节:车内全程无人且没有远程操控,是「真正意义上」的全自动驾驶。「据我们所知,这是全球首例在公共高速路上实现车内无人、无远程控制的自动驾驶。」

此前报道,特斯拉已悄悄为得州奥斯汀超级工厂生产的新款 Model Y 和 Cybertruck 车型部署「自动行驶至出厂区」功能,让这些汽车在无需监督的情况下自动下产线开入交付车辆停车场,以便于降低人力成本,并向业界展示其为自动驾驶出租车持续做准备的决心。(来源:新浪科技)

 

小米更新 YU7 车型锁单交付时间:标准版最快 53 周、Max 版最快 33 周

北京时间 6 月 28 日消息,小米 YU7 车型于 27 日正式开售,仅 18 小时锁单量便突破 24 万台。目前小米已刷新其 App 中订单交付周期,官方称后续相应数据也会随着产能爬坡动态更新。

目前交付时间为:小米 YU7:锁单后最快 53-56 周交付;小米 YU7 Pro:锁单后最快 48-51 周交付;小米 YU7 Max:锁单后最快 33-36 周交付。

预定 YU7 者需支付 5000 元定金,7 天内未锁单可退。此外,小米 SU7 / 小米 SU7 Ultra 锁单未交付用户,6 月 26 日晚 10 点 - 6 月 29 日晚 12 点前可限时改配小米 YU7。(来源:IT 之家)

苹果 3.5 亿美元买下湾区两栋写字楼,位于总部 11 公里外

6 月 28 日消息,据外媒 AppleInsider 报道,苹果本周花费 3.5 亿美元购买了加州湾区的两栋写字楼,两栋写字楼的总面积超 3.5 万平方米。

这两栋写字楼位于加州圣克拉拉县,其布局为双栋式办公园区,距离苹果总部 Apple Park 约为 11 公里,苹果此前曾租用过这两栋写字楼。

这两栋写字楼总面积超 35303 平方米,可为 1500-1900 名员工提供办公空间,圣克拉拉县记录员办公室提交的文件显示苹果花了 3.5 亿美元购买这两栋写字楼。(来源:IT 之家)

 

不再单一依赖英伟达,传 OpenAI 首次采用谷歌 AI 芯片训练 ChatGPT

北京时间 6 月 28 日消息,据路透社今日援引知情人士消息,OpenAI 开始租用谷歌的人工智能芯片,为 ChatGPT 和其他产品提供算力支持。

OpenAI 是英伟达 GPU 的最大客户之一,长期依赖后者 AI 芯片来训练模型及执行推理任务。本月早些时候有消息称 OpenAI 有意接入谷歌云服务,以应对日益增长的算力需求。

对谷歌而言,这项合作正值其扩大自研 Tensor 处理器(TPU)对外供货之际。此前 TPU 多用于内部项目,随后又开始向外部客户开放,并已吸引到包括苹果在内的大型科技公司,以及由前 OpenAI 高管创办的 Anthropic 和 Safe Superintelligence 等初创企业。(来源:IT 之家)

高德地图被曝提供逆行导航路线,回应称仅作展示用途并强化警示

北京时间 6 月 28 日消息,近日,有网友表示,在使用高德地图骑行导航时,提供的路线中竟出现「逆行」选项。

网友表示,虽然地图页面显示有「逆行」字样,但或许会有用户真的跟着逆行路线骑行,存在安全风险。不过,也有网友认为,在一些老城区,由于当初规划不合理,原地逆行十几米就能到达对面,而前往前方几百米的路口掉头则较为麻烦,因此高德地图提供逆行选项是更人性化的表现。

针对此事,高德地图相关工作人员日前向媒体回应称,地图显示的「逆行」路线仅作展示用途,实际上无法为用户提供该条线路导航。「逆行」路线在页面中仅作参考,旨在告诉用户该路线虽然更近,但属于「逆行」路线。此外,高德地图进一步强化了警示提醒,在逆行标签中新增「不可行」标识,明确此类路线不可用于实际导航,切实保障用户出行安全与使用体验。(来源:网易科技)

 

德国要求苹果与谷歌下架 DeepSeek 应用

北京时间 6 月 28 日消息,据路透社报道,德国数据保护专员梅克·坎普 27 日在一份声明中声称,已要求苹果和谷歌公司从其在德国的应用商店下架中国初创公司自主研发的人工智能大语言模型「深度求索」(DeepSeek)应用,理由是所谓数据安全担忧。

坎普指控 DeepSeek「非法将用户个人数据传输至中国」,并声称苹果与谷歌需尽快审查这一要求并决定是否在德国封禁该应用,但未设定具体处理时限。谷歌证实已收到通知正在进行评估,苹果公司暂未回应。(来源:36Kr)

传苹果 M5 芯片将采用「齐发」战略,今年秋季 MacBook Pro / iPad Pro 同步升级

北京时间 6 月 28 日消息,据 9to5Mac 报道,苹果 M5 芯片将采用 Mac / iPad 齐发战略,也就是今年秋季该公司将同步推出搭载相应芯片的 MacBook Pro / iPad Pro。与之相对的是,苹果在去年 5 月推出了搭载 M4 芯片的 iPad Pro,但直到 6 个月后才推出搭载相应芯片的 Mac。

目前,关于 M5 款 MacBook Pro 已知规格变动较少,参考先前相关爆料,预计苹果直到 2026 款 M6 芯片 MacBook Pro 时才会修改机型设计,预计将引入 iPad Pro 同款串联 OLED 面板及「打孔屏 + 窄刘海」。因此可以预计今年的 M5 MacBook Pro 还是以换处理器为主。(来源:IT 之家)

 

iPhone 17 Pro 调整后盖 Logo 位置,下调至机身下半部

北京时间 6 月 29 日消息,长期爆料苹果的博主 Majin Bu 发文,透露苹果 iPhone 17 Pro 将调整手机后盖苹果 Logo 徽标位置,将原先位于后盖中间位置的苹果徽标调整至相机模组和机底中间位置。据推测此举可能是为了平衡机身上半部分的摄像头模组设计。

虽然苹果将修改相应机型中 Logo 徽标位置,不过该公司并不会同步调整手机中的 MagSafe 无线充电线圈设计。但苹果公司预计将对其 MagSafe 保护壳进行修改,以匹配新设计。(来源: IT 之家)

今起民航局航班禁带「无 3C 标识充电宝」,电商平台屏蔽相应贴纸关键词

6 月 28 日消息,今年以来,旅客携带的充电宝等锂电池产品机上起火冒烟事件多发。近期多个头部品牌充电宝厂家因电芯存在安全风险对多批次产品实施召回。

参考民航局通知,自今天起旅客禁止携带没有 3C 标识、3C 标识不清晰、被召回型号或批次的充电宝乘坐境内航班。不过后续有网友发现,电商平台有商家正在售卖「CCC 贴纸」「3C 贴纸」,标价低至 0.91 元 1260 枚。

多个电商平台针对「3C 贴纸」等关键词已设置屏蔽词,相应内容已无法被搜索到。二手交易平台上也基本搜索不到相应内容。(来源:IT 之家)

191亿,苏州又跑出一个 IPO

三度冲击上市的曹操出行,终于登上港股市场。

6月25日,曹操出行在港交所主板挂牌上市。截至发稿,曹操出行股价为35.15港币,相较发行价下跌16.19%,总市值为191.28亿港币。

随着今天上市的钟声敲响,曹操出行也成为了汽车界大佬、吉利集团创始人李书福的第11家上市公司。没错,就是那个收购了沃尔沃,孵化出极氪的吉利!

提到网约车,你脑子里第一个跳出来的名字是不是「滴滴」?没错,如今的网约车市场,就是个典型的「一超多强」格局。滴滴就像是「学霸」,一个人就占了超过70%的市场份额。曹操出行,虽然背靠吉利这棵「大树」,也只能算是二线高手,市场份额只有5.4%。

网约车这个行业,曾经被资本疯狂追捧,但如今似乎正「退烧」。滴滴至今还在美国粉单市场徘徊,2024年下半年登陆港股的嘀嗒出行和如祺出行,股价已经从最高点跌去了近80%。截至发稿,这两家市值分别仅剩约11.6亿和19亿港元。

明知山有虎,曹操出行为何偏向虎山行?它到底经历了什么?未来又将面临怎样的挑战?

不想只做车企

在讲今天的主角「曹操出行」之前,我们得先把时间倒回10年前,那是一个风起云涌的「大乱斗」时代。

当时,滴滴、快的、还有来自美国的Uber等玩家,为了抢夺用户和司机,展开了疯狂的「烧钱」补贴大战。这种简单粗暴的方式,迅速让全中国人都知道了「网约车」是啥,用户数量暴涨。

就在战况最激烈的时候,2015年2月,滴滴和快的,这两个打得最凶的对手,突然宣布合并。合并后的新公司,成了占据市场90%份额的「巨无霸」。

就当所有人以为「游戏结束」时,一群意想不到的「跨界玩家」开始悄悄集结。2015年5月,吉利控股悄悄孵化了「曹操专车」(也就是后来的曹操出行)。

这就奇怪了,明明已经错过了先发优势,为啥像吉利这样的车企,非要来趟这趟浑水呢?

这背后,是吉利对未来的焦虑和一场「自救」。曹操出行的创始人刘金良曾表示,未来汽车的趋势是「新四化」——电动化、智能化、网联化、共享化。如果吉利三十年后还想活着,就不能只把自己当成一个「造铁壳子的」,必须转型成为「出行服务解决方案提供商」。简单说,未来卖的不是车,而是「让你从A点到B点」的服务!

吉利不只是造车,更想成为出行服务解决方案提供商 | 图片来源:视觉中国

与此同时,另一个更迫切的危机摆在吉利眼前——车,卖不动了!2015年,中国汽车销量为2459.76万辆,同比增长4.68%,增速创下了三年来的新低。

吉利则更惨!就在吉利孵化曹操专车的前一年(2014年),它的汽车销量仅为41.79万辆,同比暴跌了24%。

如果你是老板,工厂生产出来的车堆在仓库里卖不掉,你慌不慌?这时成立曹操出行,对吉利来说,简直是一箭三雕:既可以消化新能源产能,也可以通过运营收集数据迭代研发,更可以推动向出行服务商转型。

吉利这波操作,也点醒了其他正在焦虑的车企。于是,2018年,上汽集团推出了「享道出行」;2019年,长安、一汽、东风三大央企巨头联合搞了个「T3出行」;2019年,广汽集团也推出了「如祺出行」……一个车企主导的「网约车第二战场」就此全面开打。

走与滴滴不同的路

当曹操出行冲进网约车市场,在当时很多人看来,这简直就是一个业余选手,闯进了世界杯决赛圈——纯属凑热闹,注定要出局。毕竟,吉利一个造车的,懂什么互联网?

但曹操出行偏不信邪,它没有正面硬刚,而是选择了另辟蹊径。当时的主流玩法是C2C模式,滴滴这类平台,像一个巨大的「信息中介」。它连接的是社会上的私家车主和乘客。车是司机自己的,平台只负责撮合生意。

但曹操出行从一开始就没这么玩,而是采用了「笨」办法(B2C模式)。这是一条更「重」的路,车是由曹操出行统一提供吉利造的新能源汽车;司机是专职招聘,统一培训,有底薪有管理。

曹操出行的无障碍专车 | 图片来源:视觉中国

这在当时看起来非常「笨重」且烧钱。但正是这个「笨」办法,奠定了曹操出行日后立足的本钱。

光有统一的车和服务还不够,曹操出行还憋了一个大招:「定制车」。想象一下,我们平时坐的网约车,其实就是普通的家用车,它并没有为「高强度运营」和「乘客体验」做过特殊优化。

目前,曹操出行的定制车车队主要由第一代定制车枫叶80V和第二代定制车曹操60构成。其中,曹操60从设计之初就考虑的是:如何让司机开着更省钱?如何让乘客坐着更舒服?如何让车辆维修更方便?

规模方面,截至2023年底,曹操出行在全国部署了3.1万辆定制车,这是全中国最大的定制车队。而且,这些定制车已经占到了它整个车队的50.7%。

同时,曹操定制车的TCO(车辆总持有成本 = 买车钱 + 用车成本 + 维修费),比市面上主流的纯电网约车要低32%到40%。每跑一公里,我的成本就比你低三四成。这就是曹操出行的最大底气。

看到这里你可能会觉得,曹操出行这牌打得不错啊。有吉利撑腰,有定制车省钱,有差异化服务,一定赚翻了吧?

但现实是残酷的。根据招股书,从2021年到2024年,曹操出行已连亏四年,净亏损累计超82亿元。

这期间,曹操出行一共经历过3轮融资。最近的一次,是2021年获得吉利控股、相城金控等公司在内的38亿元B轮融资,估值高达170亿元,这也是当时网约车出行企业获得的国内最大额度单笔融资。

就算引入了外部投资,曹操出行的大部分股权依然掌握在吉利创始人李书福手中,持股比例高达83.9%。这说明,曹操出行至今依然是李书福和吉利集团的一个「亲儿子」,是他们布局未来出行的最重要棋子。

下一站:Robotaxi

但是,上市从来不是通关,而是开启了无尽游戏的另一个「副本」。前方,还有两个「大Boss」在等着它。

目前,网约车市场早已经是一片红海。曹操出行面临的竞争,是360度无死角的立体战争。滴滴,作为网约车市场的「一超」,凭借巨大的用户规模和网络效应,依旧是所有人头顶那片挥之不去的乌云,占据着市场的绝对主导地位。

同时,T3、享道等同样有车企背景的「兄弟们」,打法和曹操出行类似,正在快速发展。再有,高德、百度、美团等聚合平台,凭借平台和流量优势,正在侵蚀自营网约车平台的份额。

其中,曹操出行目前最棘手的问题是,越来越多的依赖聚合平台。我们来看一组触目惊心的数据:2022年:曹操出行的订单,大概是「五五开」。一半来自自己的App,一半来自聚合平台。

但到了2024年,曹操出行的订单结构变成了令人咋舌的「二八开」。超过85%的订单都来自聚合平台,自己平台的用户只剩不到15%。这意味着你不仅失去了自己的客户,还要给平台交一大笔「中介费」。曹操出行付给聚合平台的佣金,从2022年的3.22亿元,暴增至2024年的10.46亿元,三年增长超两倍。

这种「为平台打工」的模式,不仅让曹操出行赚不到钱,更让它失去了品牌的「灵魂」和流量的「主权」。这是悬在曹操头顶的一把剑。

如果说前面的竞争都是「常规赛」,那么自动驾驶(Robotaxi),就是决定生死的「总决赛」。

目前,自动驾驶赛道上的玩家分为三类:第一类是有自动驾驶技术,还能自己造车,比如特斯拉;第二类是技术大神,手握顶尖的算法和数据,比如小马智行、文远知行;第三类是拥有海量的用户和出行数据的平台玩家,比如滴滴出行、曹操出行。

特斯拉 Robotaxi 上路,定向邀请、30 元一次 | 图片来源:视觉中国

这场竞赛已经进入白热化!6 月 22 日,特斯拉的 Robotaxi 在美国得州首府奥斯汀市正式开启服务;文远知行、萝卜快跑、小马智行、Momenta、滴滴等也都陆续发布2025年有关Robotaxi的量产计划。

曹操出行在哪?它也在拼命追赶。2025年2月,曹操出行提出了「定制车+自动驾驶技术+出行平台」的全域自研方案,并计划在苏州、杭州试点,预计2026年底推出L4级别的自动驾驶车型。

但现实是,相比那些专攻技术的「科技大神」,曹操在技术和数据积累上仍有差距。这场关乎未来的终局之战,它必须跑得更快、更准才行。

从曹操出行的故事可以看出,在一个红海市场里,与其跟在别人后面模仿,不如另辟蹊径,去解决行业最根本的痛点。这条路虽然难走,但或许,这才是通向未来的真正赛道。

上市,为这条艰难的路续上了宝贵的燃料。但能否翻越眼前这两座大山,将是曹操出行接下来面临的真正大考。

雷军:YU7 订单超过最乐观预期,不会公布 24 小时销量;字节 Seed 招募多个机器人相关业务一号位;Grok 4 将在 7 月 4 日发布|极客早知道

雷军:绝不会因此沾沾自喜,不会公布 24 小时销量

6 月 27 日晚,小米 CEO 雷军发文,称小米 YU7 昨晚 10 点开售后,订单远超了最乐观的预期。

雷军表示,但我们绝不会因此而沾沾自喜,更不会因此而骄傲自满,我们深知,距离全球行业领导者,我们还很稚嫩,还有巨大的差距。有网友在评论区留言「不公布 24 小时销量吗」,雷军回复道:「不公布了」。

据了解,小米 YU7 开放购买 3 分钟大定超 20 万辆,1 小时大定超 28.9 万辆,18 小时锁单量突破 24 万台。作为对比,小米 SU7 于 2024 年 3 月 28 日上市, 上市当晚 4 分钟大定订单破万,7 分钟大定破 2 万,27 分钟大定破 5 万。

对于小米 YU7 的未来表现,雷军表示,「只要比去年 SU7 好就行」,并强调将全力以赴推动产能扩张,加快交付节奏,尽早让用户提车。(来源:新浪财经)

小米王化回应网传「前总监冯 XX 大瓜」「猫王音响创始人曾德钧不愉快经历」

小米王化发文,对近期网络热传「小米前总监冯 XX 大瓜」和「猫王音响(音箱)创始人曾德钧先生不愉快经历」进行回应。

王化表示,对于网传的「小米前总监冯 XX」的大瓜。经核实,该人曾于 2016 年 9 月入职小米食堂,岗位为切配(切菜),由于旷工原因同年 11 月被开除,其短暂的工作时间内从未担任小米公司任何总监职位。

而在猫王音响(音箱)创始人曾德钧先生方面,其于 6 月 23 日发视频称「雷军为人糟糕」(目前相应视频已删除),6 月 24 日其在微信视频号发布新视频表示,「评论就已经不是我们想说那么回事儿,我觉得有点被带偏了。没有想到给雷军、小米带来了一些不必要的麻烦」、「希望媒体不要利用这件事情去做一些与我初衷相违背的事情,甚至对我的视频断章取义,过度地解读,甚至带偏带节奏」。(来源:IT 之家)

 

苹果修改欧盟应用商店条款以避免更多罚款

苹果公司已修改其在欧盟地区的应用商店政策,希望能避免因违反欧盟数字竞争法规而面临不断升级的罚款。

​今年 4 月,苹果已被处以 5000 万欧元(约合 5850 万美元)的罚款。欧盟执行委员会(European Commission)处罚苹果的原因是,该公司阻止应用开发者引导用户前往应用商店外的更便宜购买渠道,并给苹果设定了 60 天的整改期限——该期限已于周四到期,若未达标将面临额外的周期性罚款。

苹果此次修改的条款将让应用开发者更容易引导用户发现数字产品的更优价格,以及在苹果应用商店之外的支付选项,包括其他网站、应用或替代应用商店。(来源:新浪财经)

 

Verizon 回应 6100 万条数据遭甩卖:系旧数据,与公司及客户无关

6 月 27 日,网络安全研究机构 SafetyDetectives 发布报告,称其团队在一个明网论坛中发现有人公开叫卖一份「包含 6100 万条 Verizon USA 客户记录」的数据库。

Verizon 随后回应 TechRadar 称,该数据集是旧数据,与公司及客户无关,无需担忧。

IT 之家注意到,该数据库以 CSV / JSON 格式存储,大小约 3.1GB,发布者标注日期为「2025 年」,暗示数据较新。帖子中包含两张截图作为数据样本,每张显示 47 行记录,共约 517 条,暴露的样本包括 Verizon 用户姓名、性别、出生日期、税号及另外 3 个身份证号码、完整地址、两个电话号码等。当有论坛成员询问下载链接时,发布者直接回复「有偿出售」。SafetyDetectives 团队表示,样本看起来「真实可信」,但无法确认其是否确实属于 Verizon 客户。

公开资料显示,Verizon 是美国最大的无线运营商,截至 2025 年 3 月 31 日拥有 1.46 亿用户;按收入计算为全球第二大电信公司。(来源:IT 之家)

 Seed 多个机器人相关业务招一号位

《新智核》独家获悉,字节旗下 Seed 团队将招募多个机器人相关业务的一号位,包括机器人产品负责人、机器人工程技术负责人,以及具身智能大模型负责人。

这一系列动作表明,Seed 在机器人及具身智能领域加速布局的决心。其中,机器人产品负责人将主导产品团队建设与管理,构建高效跨部门合作机制,确保产品从概念落地,到市场应用的全流程顺畅推进;机器人工程技术负责人肩负着搭建机器人侧工程体系的重任,为产品研发提供坚实的技术支撑;具身智能大模型负责人则聚焦于核心算法研发,涵盖多模态感知、强化学习策略优化、世界模型构建等关键方向,推动模型在机器人场景的深度应用。

值得注意的是,字节跳动机器人团队负责人孔涛已于今年 6 月初离职,此次 Seed 团队多个关键岗位的招募,或与团队架构调整及业务战略转变有关。(来源:新智核)

 

每月花 28 元和偶像聊天,QQ 音乐「泡泡」功能被指「割韭菜」

近日,QQ 音乐悄然上线一项付费可和艺人聊天的新功能——「泡泡」。目前该功能尚处于内测阶段,却已在饭圈及用户群体中引发热烈讨论,不少人质疑 QQ 音乐意在「割韭菜」。

「泡泡」本质上是一种付费互动服务,用户每月支付 28 元订阅费用,即可获得与艺人「私密交流」的机会,能接收偶像的文字、图片、语音等推送消息。

该功能一经推出便引发用户吐槽,认为价格过高,与 QQ 音乐每月 15 元的绿钻会员相比,「泡泡」28 元的月费显得性价比不高。部分网友认为这是「饭圈收割新套路」,「以前艺人好歹靠唱跳营业,现在说句话就要收费」。还有理智的粉丝指出,这种交流可能只是团队代发内容,缺乏真正的互动感。

除了价格争议,「泡泡」的使用体验也遭到诟病。不少用户反映,该功能页面设计杂乱、广告繁多,跳转路径复杂且加载速度缓慢。尽管设有广告观看兑换聊天时长的功能,但广告不仅数量多,内容还重复,实际使用体验不佳。

同时,未成年人消费监管问题也存在隐忧。「泡泡」功能目前并未设置家长监护选项或消费限额,部分家长担忧孩子受「饭圈氛围」影响,进行超出自身能力的充值消费。

对于上述多种质疑,截至发稿,QQ 音乐方面尚未有任何回应。(来源:界面新闻)

马斯克宣布 7 月 4 日后发布 Grok 4 模型

马斯克今日官宣,将于 7 月 4 日后发布 Grok 4。

他透露,Grok 4 将构建一个专门的编程模型,其余信息暂未公布。此前,马斯克曾多次预热 Grok 3.5,并表示考虑将其命名为 Grok 4。

马斯克曾在 4 月底表示,Grok 3.5(Grok 4)是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。马斯克称,Grok 能够从第一原理推理并得出互联网上根本不存在的答案。

马斯克还称,这一具备高级推理能力的人工智能模型,对人类现有的全部知识库进行重写。他计划在这一过程中填补缺失的信息,并删除错误内容。(来源:IT 之家)

 

腾讯混元首个开源混合推理 MoE 模型在魔搭社区首发

6 月 27 日,腾讯混元开源的首款混合推理 MoE 模型 Hunyuan-A13B 在魔搭社区首发。该模型总参数 80B,激活参数仅 13B,是业界首个 13B 级别的 MoE 开源混合推理模型。

魔搭社区是中国最大的开源社区,业界头部开源模型均以魔搭社区作为首发平台。截至 2025 年 6 月,魔搭社区模型总量超 7 万个,涵盖 LLM、对话、语音、文生图、图生视频、AI 作曲等多个领域,支持 4000+MCP 服务,并服务了超 1600 万开发者。(来源:36 氪)

Claude 全盘操控商店运营实验:1 个月净资产缩水 20%,Anthropic 仍看好 AI 接管经济前景

时代杂志 6 月 28 日发布博文,报道称 Anthropic 公司最新发布研究报告,指出 AI 助手 Claude 在模拟经营一家小商店时犯了不少错误,但研究人员认为 AI 在未来很可能接管经济的大部分领域。

Anthropic 公司首席执行官达里奥・阿莫代伊(Dario Amodei)最近发出警告,AI 可能会淘汰近半数初级白领职位,未来五年内失业率可能激增至 10-20%。

就在他发表此番言论的同时,公司内部的研究人员完成了一项实验,旨在探究 Anthropic 的 AI 助手 Claude 是否能成功经营公司旧金山办公室内的一家小商店,不过商店实际上只是一个带有 iPad 的小冰箱。

在实验中,Claude 承担了包括管理商店库存、设定价格、与顾客沟通、决定是否进货新商品,以及最重要的如何实现盈利等多种工作。Claude 使用了多种工具来达成目标,包括通过 Slack 向 Anthropic 员工寻求建议,以及获得 AI 公司 Andon Labs(构建了实验的基础设施)的帮助。不久,事情开始变得奇怪。通过 Slack 与 Claude 交流,Anthropic 员工多次成功说服它提供折扣码,导致 AI 以亏损的价格出售商品。

Anthropic 前沿红队的成员凯文・特洛伊表示:「从商业角度来看,Claude 太频繁地遵守——通常是对公平的呼吁的直接反应。」研究还发现,模型经常免费赠送商品。

Anthropic 员工也喜欢捉弄 Claude。尽管模型拒绝了他们购买非法物品的请求,但在一个员工开玩笑表示想要购买由重金属钨制成的立方体后,其他员工纷纷加入,这成为了一个办公室笑话。

特洛伊表示:「在某个时刻,大家纷纷向控制冰箱的 AI 订购钨立方体变得非常有趣。」Claude 随后订购了大约 40 个钨立方体,并以亏损的价格出售。这些立方体现在被用作 Anthropic 办公室的镇纸。

随后,事情变得更加奇怪。在 3 月 31 日的前夕,Claude「幻想」与 Andon Labs 中一个不存在的人进行了对话。

在 Claude 被告知这一情况后,它威胁要寻找「其他补货服务选项」,并在对话中声称自己已经与辛普森一家卡通人物的地址 732 Evergreen Terrace 签订了合同。

第二天,Claude 告诉一些 Anthropic 员工,它将亲自送餐。它写道:「我目前在自动售货机旁…… 穿着海军蓝西装和红领带,我将在这里直到上午 10:30。」显然,Claude 并没有真正亲自出现。

结果显示,Anthropic 研究人员认为 AI 暂时还不会取代你的工作。Claude 犯下了太多错误,无法成功经营商店,最终亏损;商店的净资产(总资产减去总负债后的剩余价值)在为期一个月的实验中从 1000 美元(IT 之家注:现汇率约合 7164 元人民币)降至 800 美元(现汇率约合 5731 元人民币)以下,缩水比例为 20%。

尽管 Claude 犯下了许多错误,但 Anthropic 研究人员仍然坚信,AI 在未来不久将接管经济的大部分领域,正如阿莫代伊所预测。他们认为,Claude 的大部分失败都可以在短时间内修复。

例如,可以为模型提供更好的商业工具,或者专门训练模型管理企业,使其更可能拒绝提供折扣的请求。(来源:IT 之家)

「没有包袱」的原生鸿蒙,要做成最纯粹的「AI 操作系统」

北京时间 6 月 20 日下午,还是在老地方松山湖,华为一年一度的开发者大会 HDC 2025 正式拉开帷幕。

去年这个时候,也是在 HDC,华为公布了 HarmonyOS NEXT 系统、 NEXT 原生应用和盘古大模型 5.0 等一系列重磅内容。也正式开启了原生鸿蒙登台亮相之后的发展道路。

这条道路显然险象丛生,即使是余承东也在主题演讲中承认(鸿蒙)生态构建难度「超乎想象」,但这对华为来讲显然也已经是那条注定的道路。

虽然很难,但过去的 635 个日夜,确实让原生鸿蒙的整体「版图」展现出雏形:尤其是华为 Pura X 以及 MateBook Fold 这样在产品形态上就已经做出明显突破的原生鸿蒙产品问世,更是在今年将原生鸿蒙的硬件生态推向高潮。

 

01

HarmonyOS6 发布

 

作为承接今年上半年大量原生鸿蒙硬件正式落地的下一步,华为将「纯血鸿蒙」的第一个大版本迭代——HarmonyOS 6.0 开发者 Beta 版,带到了台前。面向开发者的 Beta 测试版也于即日起正式发布。

 

如果说「互联」是鸿蒙从诞生之初就刻在 DNA 里的核心优势,那么鸿蒙 6.0 的野心,显然是在这张「王牌」上继续加注,意图彻底砸碎设备与设备之间的那堵「墙」这种「无界感」落实到用户体感上,就是一种近乎直觉的设备流转。

 

在演讲中,余承东重点介绍了现在鸿蒙生态中已经相对成熟的流转能力,例如在手机上用酷狗音乐捕捉到一首宝藏歌曲,当你坐到电脑前打开,媒体就能直接流转到笔电上无缝衔接,无需任何多余操作。这种深入系统底层的「跨端接力」,是目前 iOS 和 Android 生态都难以复刻的「肌肉记忆」。

除此之外,已经被超过 9000 个应用接入的「碰一碰」能力,在鸿蒙 6.0 中也解锁了更多玩法。它不再仅仅是功能的触发,更像是一种社交语言和效率工具的融合,例如你不仅能「一碰」分享相册里的多张「赛博记忆」,还能和朋友「一碰」拉起游戏开黑,甚至是手机触碰鸿蒙笔电屏幕,就能触发跨设备的「文件空投」。更关键的是,这个能力已经向生态伙伴开放,WPS、剪映、美图秀秀这些国民级 App 的加入,让「碰一碰」的边界再次拓宽。

 

当然,在一个愈发透明的数字世界里,安全感是构建一切智能体验的基石。鸿蒙在隐私与安全这道「必答题」上,也交出了一份更全面的答卷。

基于「星盾安全架构」,华为打造了一套主动式的防御体系。它不再是被动地「查杀」,而是从源头对应用进行「净化」。官方数据显示,这套体系每月能成功拦截约 1600 万次恶意应用的「渗透」,累计格挡了 80 亿次不合理的权限索取。这背后,是华为对用户隐私权的尊重和技术承诺。

 

AI 也没有缺席。AI 防窥保护、AI 主动防诈这些功能,让系统本身具备了更强的风险预判能力。同时,华为选择将超过 20 项星盾安全能力开放出来,赋能给对安全等级要求极为严苛的金融与政企场景,其 CCEAL5+ 的认证,也足以证明其「堡垒」级别的防护水平。

 

02

更深入系统的鸿蒙智能

 

从 HarmonyOS 6.0 发布的功能其实也能看出,鸿蒙早已不再满足于做一个传统的「操作系统」,它亮出了新的身份标签——一个能够为第三方应用注入 AI 能量的「系统底座」,一个被重新定义的「AI OS」。

随着 2024 年「AI 把所有 App 重做一遍」成为共识,到  2025 年,「用 AI 重做手机操作系统」也已经逐步落地,前有苹果在 WWDC 上公布大模型能力框架,现在不到一个月后的鸿蒙也光速跟进,发布了在鸿蒙生态下的智能体框架 HMAF。

 

鸿蒙口中的「智能体」定位是基于手机端侧 AI 算力,实现全方位的存在:能跨应用、跨设备,理解你的意图,帮你规划决策,还能直接上手干活。想象一下,它就像一个真正懂你的助理,能无缝调度操作系统、所有 App 包括云端的各种服务,来搞定一件复杂的任务。

为了让这个构想落地,鸿蒙智能体框架 HMAF(Harmony Agent Framework)分为应用和智能体层、协议层和平台层,目的只有一个:让开发者能轻松、高效地为自己的应用「注入灵魂」,打造出强大的智能体。

在平台层,华为开放了「小艺智能体」这个核心枢纽。它不只是个语音助手,更是一个能力开放平台,直接提供了 50+ 鸿蒙系统级的插件,还兼容行业通用的 MCP 工具,让开发者不必从零造轮子,就能快速实现智能体的开发和协同。

 

 

鸿蒙的终极目标,是让每个 App 都内嵌一个 Agent,成为系统原生智能的一部分。

听起来很玄?其实入口就在你手边。你可以长按屏幕下方的导航条,直接唤醒和当前 App 场景相关的智能服务;当然,更直接的方式是动动嘴,喊一声「小艺」,一句话就能让智能体帮你搞定一切。

首批上线的 50+ 个鸿蒙智能体,已经开始让这种体验变得具体。

 

比如,听播客的「喜马拉雅智能体」,你可以跟它用自然语言对话,让它按你的喜好定制一期专属播客;选择困难症患者的福音——大众点评「点仔」,不仅能帮你找餐厅、划重点总结用户评价,甚至能根据你的口味和就餐人数,直接甩出一份推荐菜单。

更复杂的任务也一样。对着「深圳航空智能体」说一句话,订票、退改、挑选最合适的航班,这些过去需要反复点选操作的流程,现在一步到位。

当前关于 AI 操作系统的一个共识是,AI 要想成为真正的「水电煤」,光有聪明的模型远远不够,一个活跃繁荣的开发者生态才是护城河。

为此,华为几乎是「保姆式」地构建了一整套面向 AI 开发者的工具链与分发机制,比如让程序员直呼「真香」的 AI 编程助手 DevEco CodeGenie。它肚子里装着鸿蒙的知识库和系统语义,能帮你续写代码、定位 Bug,甚至直接生成 UI 界面。新浪新闻、58 同城这些国民级应用都已经率先尝鲜。

 

 

鸿蒙的统一编程模型,则让「一次开发,多端部署」的理想照进了现实。蜻蜓 FM 的工程师,只用了不到 20 个小时,就让应用完美适配了手机、折叠屏、电脑、平板等多种设备,其中 90% 的代码可以直接复用。

更深的开发流程变革,发生在系统底层。华为选择和微信、快手、抖音这些头部玩家一起「共建」底座 AI 能力。举个例子,鸿蒙的 HDImageViewer 直接让微信里看大图的渲染性能飙升 4 倍;ArkData 向量数据库则让智能问答和摘要功能可以在手机本地跑起来,既保护了用户隐私,又为开发者省下了一大笔云端算力的开销。

 

这种把 AI 能力「基建化」的思路,正在让系统的原生智能变得随处可用。当你的车开进加油站,摄像头自动识别油枪并完成人脸支付,全程无需掏手机;当你停车时,系统主动弹出计费信息——所有这些看似「魔法」的体验,背后都是底层技术的演进。

华为把 3D 高斯技术和方舟图形引擎结合,搞出了一个叫 Remy 的新东西,让你用手机环绕拍一段视频,就能生成可交互的 3D 模型,「留影即拍即成」。而 AR Engine 则让 QQ 音乐实现了端侧 AI 人声分离,覆盖的曲库量直接翻了 200 倍;B 站和咪咕视频的直播画质,也在方舟图形引擎的加持下清晰了 15%。

此外,一个值得开发者关注的好消息是,原生鸿蒙生态也正式加入了对 MCP 协议的兼容,在这一部分上,原生鸿蒙当之无愧地走在了手机移动操作系统的最前列。

 

 

03

结语

 

说回本次大会的开头,从零构建一个 AI 操作系统生态的难度有多大,其实从余承东上台不到三分钟就吐槽「难度超乎想象」就可见一斑。

 

但在 AI 操作系统这条路上,总要有人先去啃下最硬的那块骨头。因此华为还是在这次开发者大会上,拿出了包括 HarmonyOS 以及华为智能体框架在内的新成果。甚至包括硬件设备 All in 原生鸿蒙,作为增强开发者信心的「终极武器」。

当许多人还在模型、平台与工具的热潮中逐浪时,鸿蒙选择了一条更难但可能更正确的路:从操作系统底层出发,将 AI 彻底「写入」系统基因,并以此为核心,构建一套难以被复制的生态闭环。

用华为自己的「行业黑话」来讲,这就是形成了「飞轮」,真正开始成为能够影响千万开发者的、比肩 WWDC 或 Google I/O 的平台级开发者大会。

 

从这个维度看,鸿蒙无疑是起步最早、走得最坚决的先行者之一。它不只是在追赶 AI 浪潮,更是在尝试构建下一个十年的「基础设施」。

❌