普通视图

发现新文章,点击刷新页面。
今天 — 2025年5月23日极客公园

最强编程模型 Claude 4 发布;雷军:小米 YU7 不可能 19.9 万;微信员工澄清朋友圈广告评论|极客早知道

2025年5月23日 08:41

Claude 4 系列发布,自动写代码 7 小时刷新世界纪录

北京时间 5 月 23 日消息,Anthropic 公司推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,在结构化推理、软件工程和自主代理行为等领域实现重大进步。

Claude Opus 4 被定位为 Anthropic 迄今最强大的模型,专为处理复杂的推理流程和软件开发场景设计。Opus 4 在软件环境中展现出强大的自主行为,得益于改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制,据 Rakuten 测试数据,可连续进行近 7 小时的代码生成和任务执行,刷新 AI 世界纪录,远超前代 Claude 3 Opus。

Claude 4 目前已上线 Amazon Bedrock,开发者能通过完全托管、无服务器的 Amazon Bedrock 服务,使用最新的 Claude 4 模型。(来源:IT 之家)

 

小米 YU7 预发布:全系 800V,7 月上市,「不可能」19.9 万元

5 月 22 日消息,小米首款 SUV 车型 YU7 在小米 15 周年发布会上预发布,7 月正式上市。发布会现场,雷军表示该车价格不可能是 19.9 万元,也未开启小订。

小米 YU7 长宽高分别为 4999/1996/1608 mm,轴距 3000mm,属于中大型 SUV。配色有宝石绿、钛金属、熔岩橙配色,加上此前发布的寒武岩灰,小米 YU7 目前已经公布了 4 种外观配色。雷军表示,「还有 5 个配色」等着大家。

内饰方面,最大的亮点在于小米天际屏全景显示 HyperVision。它的显示效果类似于 HUD(抬头显示技术),但又不完全相同。最核心的区别就是可以在前风挡最底部形成一个贯穿的 1.1 米超宽、超视网膜级高清显示,是智能电动汽车在「彩电」(显示)领域的一种全新产品形态。(来源:极客公园)

美国 FTC 正式撤销对微软 687 亿美元收购动视暴雪的反垄断诉讼

5 月 23 日消息,美国联邦贸易委员会(FTC)已正式撤销对微软 687 亿美元收购动视暴雪的反垄断诉讼。

该决定发生在 FTC 针对该收购案的上诉请求遭联邦法院驳回三天后,标志着这场持续近两年的法律争议正式落幕。

微软副董事长布拉德·史密斯对此回应称:「今天的决定是全美玩家和华盛顿理性决策的胜利。我们感谢 FTC 的最终决定。」(来源:IT 之家)

 

马斯克:特斯拉愿意授权智能辅助驾驶技术给其他车企

北京时间 5 月 22 日消息,特斯拉创始人 CEO 伊隆·马斯克在最新的采访中表示,「愿意授权特斯拉智能辅助驾驶系统给其他车企。」

马斯克表示,有许多与我们讨论过授权自动驾驶技术的汽车制造商,我们对此非常开放,「我们展示自动驾驶能力的次数越多,他们就越想获得技术授权。」

此前马斯克也曾公开表示,特斯拉正在允许其他公司使用其超级充电网络,也乐意授权 Autopilot、FSD 或其他特斯拉技术。(来源:新浪科技)

罗永浩入驻百度优选,为还债开辟带货新战场

北京时间 5 月 22 日消息,罗永浩正式宣布与百度优选达成战略合作,将于 5 月 23 日晚 8 点在该平台开启首场直播,这是继抖音、淘宝、京东后,罗永浩第四次开辟直播电商新战场。

此前据传,5 月 18 日,罗永浩就出现在了百度杭州分公司,引发外界猜测,认为罗永浩的 AI 创业项目将与百度进行合作。现在看来,双方合作的重心依然聚焦于电商直播领域。

罗永浩的「真还传」已上演到第二季,债务总额也从 6 亿膨胀至 13 亿。目前,罗永浩已偿还 8.24 亿元,剩余约 5 亿元债务仍在处理中。‌(来源:网易科技)

 

传理想汽车下调今年销量目标至 64 万辆,目标卖更多纯电产品

北京时间 5 月 22 日消息,理想汽车内部将今年全年排产目标调整至 64 万辆,其中增程 L 系列目标 52 万辆、纯电产品(包含 MEGA)目标 12 万辆。

按照新势力「以销定产」的规律,这意味着理想汽车今年的销量目标将锁定在 64 万辆。此前信息显示,理想汽车年初定下的销量目标是 70 万辆。此轮调整的变化主要是调整了全年、增程 L 系列的销量目标,但要卖更多的纯电动产品。

而在调整销量预期后,理想汽车内部还将进行「适度的」成本控制。知情人士表示,当全年的销量目标调整、全年成本预算缩减,研发成本、管理成本也需要进行相应的缩减。(来源:凤凰科技)

小米 15S Pro 手机发布:搭载玄戒 O1 旗舰处理器,5499 元起

5 月 22 日消息,在今晚的小米 15 周年战略新品发布会上,小米 15S Pro 手机正式发布,该机搭载了小米在此次发布会上刚刚发布的玄戒 O1 旗舰移动处理器,售价 5499 元起。

小米 15S Pro 搭载的玄戒 O1 旗舰处理器,采用 3nm 制程技术,拥有 190 亿晶体管,十核四丛集 CPU 架构,确保了强大的计算能力,而 16 核 Immortalis-G925 架构 GPU 则为用户带来了流畅的图形处理体验。此外,翼型环形冷泵 Pro 散热系统进一步提升了手机的散热效果。

小米 15S Pro 搭载 6.73 英寸 3200×1440 OLED 等深四曲屏,支持超声波指纹识别,小米龙晶玻璃 2.0 盖板。影像方面搭载玄戒 O1 的 ISP v4 影像处理器,每秒最高可以处理 87 亿像素,支持全焦段 4K 夜景视频。(来源:IT 之家)

 

小米发布玄戒 T1 手表芯片,自研基带,支持 4G eSIM 独立通信

5 月 22 日消息,在小米 15 周年战略新品发布会中,小米公布了适用于小米手表的玄戒 T1 芯片,该芯片将搭载于 Xiaomi Watch S4 智能手表。官方透露该芯片拥有「小米 4G 基带」,该芯片系蜂窝通信全链路自主设计,支持 4G eSIM 独立通信。

小米表示,该基带研发号称通过了复杂了实验室验证,完整覆盖 4G-LTE 各层协议,700+ 测试用例,具有海量的现网适配,覆盖 100+ 城市。

具体功耗方面,搭载相应芯片的 Xiaomi Watch S4 eSIM 手表具有 9 天典型续航。(来源:IT 之家)

微信员工:微信没有能力「盗用」好友头像昵称给朋友圈广告评论

5 月 22 日消息,微信员工 @ 客村小蒋 在微博上就朋友圈广告的「都市传说」进行了澄清解释。此前有传闻称微信会「盗用」好友头像昵称给广告评论。客村小蒋表示,「微信没有这样的能力,也绝不会这么干,这中间还是有很大的误会。」

客村小蒋表示,微信朋友圈广告下面的评论实际都是用户自己评论的,只是有时候时间过得久忘记了;虽然是同一个游戏,但它投放了一系列广告,就可能产生误会,微信绝不会干所谓「盗用」好友去互动的事。(来源:IT 之家)

 

谷歌发布 1800 元/月的 AI 订阅,还把「通用 AI」塞进了生态每个角落

2025年5月23日 02:04

首先是一个冷知识:ChatGPT 中的「T」代表「Transformer」,这个概念是谷歌的一群工程师在 2017 年提出的,并发表在一篇现在已成经典的论文《Attention Is All You Need》中。

这个小细节,很大程度上能说明谷歌在 AI 领域并不是一个花架子团队,而是由一群 AI 产品业内经验最丰富的老兵组成的团队,从 Gemini 2.5 发布之后,Google 在 AI 领域的优势已经颇有点「渐入佳境」的感觉:基础模型能力的大幅提升,加上 Gemini 在谷歌软件生态内的逐渐深入,让全球数以十亿计的用户都在这个过程中,逐渐被「转化」成谷歌 AI 产品的用户。

如何「转化普通用户变成 AI 产品用户」,是这个时代几乎所有 2C AI 产品都需要回答的问题,显而易见,在这个问题上,Google 已经凭借着巨大的存量用户优势,甩开了所有竞争对手——但谷歌同样需要奔跑不停,才能在 Perplexity、OpenAI 以及微软等强大竞争对手的围剿中,留住用户的心。

Google 显然最清楚在端侧 AI 爆发的时代,谷歌的实际优势在哪里,用户同样知道谷歌知道他们想要哪些 AI 能力,出现在自己最常用的日常应用中。

这就是今年谷歌 I/O  2025 大家的共识,Google 也确实在主题演讲中,几乎全程都在介绍谷歌在这些领域中的潜力,以及向世界展示,AI 能给这些用户原本已经熟悉的使用体验带来哪些改变。

 

01

Google 搜索引擎 AI Mode 深入

 

作为目前巨头中 AI 落地成效最显著的选手,Google 毫不掩饰自己在 AI 产品商业化用户规模上的领先,上来就展示了大量 AI 能力在谷歌产品中的实际应用成果。

Google CEO 桑达尔-皮查伊 介绍,基于 Gemini 能力的 AI 总结功能现在已覆盖全球超过 15 亿用户,AI 总结功能在全球的调用次数增长已经超过 10%,而且这种增长还在持续。多模态识别能力的谷歌Lens 现在同样已经有超过 15 亿的月活用户。

桑达尔-皮查伊将其称为「搜索引擎过去十年内最成功的革命」| 图片来源:极客公园

但 AI 显然不只是能在搜索引擎上起到作用,比如谷歌同时就宣布了新的「虚拟试穿」功能,谷歌会要求你提供一张全身照片,通过大模型「理解人体和服装的细微差别,不同材料在不同身体上折叠、拉伸和垂坠。然后使用这张照片,生成你穿着你正在选购的衣服的图像。

一直传闻中的谷歌想要借助 Chrome 入局 AI 浏览器,本次 IO 中也终于崭露头角,除了 Chrome 浏览器本身更深度的整合 Gemini 接口、识别网页内容以外,谷歌还为搜索引擎调添加了全新的「AI 模式」。这个模式把类似 Gemini 或 ChatGPT 的聊天机器人功能直接带入了用户的网页搜索体验。你可以用它来找链接,但也能更快地获取信息、追问问题,让 Gemini 以平时在普通网页上找不到的方式来整合信息。

谷歌搜索的负责人甚至放出豪言:如果你想知道互联网上最重要的搜索引擎未来会变成什么样,那你就去点开「AI 模式」看看。

「AI 模式」同时也支持深度研究功能,会自动将用户的提示词转化为海量的搜索,并自动查找和整合信息,同时在这个模式下,AI 搜索还可以访问你之前的搜索记录,你也可以手动开启权限,让它可以访问你的电子邮件,以便 AI能更了解「你是谁」以及你关心什么。

把所有这些功能加起来,你就会得到一个更加灵活和个性化的 AI 搜索,无论是针对用户本身还是当前的具体查询,显然都能根据用户信息给出更加精准的回答。

Gemini 2.5 家族也同时加入了支持深度思考的版本 —— Gemini 2.5 Pro Deep Think,在 2025 年美国数学奥林匹克竞赛 (USAMO) 中取得了 40.4% 的高分,要知道这可是最难的数学基准测试之一,比之前的 2.5 Pro 版本足足提升了 10 多个百分点。同时在 LiveCodeBench 竞赛级编程难题中,它的得分更是高达 80.4%。同时,在多模态推理 MMMU 测试中,也取得了 84.0% 的成绩。

Gemini Live  的摄像头共享功能于去年在谷歌I/O 大会上首次亮相,当时它的名字还叫 Project Astra,随后作为 Gemini Live 在 Android 上正式推出。它允许谷歌Gemini「看到」您摄像头中的一切,因此您可以就周围的世界进行持续对话——例如,根据冰箱中的食材询问食谱建议。

随着谷歌在用户场景中逐渐深入,现在这一功能被直接引入搜索的 AI 模式中,通过点击「Live」图标,用户将能够与搜索共享他们的摄像头画面,并直接询问眼前的事物,例如自行车应该如何组装。并且可以自动根据上下文对你们的情况进行同步更新回答。

在现场的演示中,最令笔者印象深刻的新功能,是其新获得的主动性。可以根据它观察到的事件选择何时开口,像一个真人一样,对你的操作进行建议,例如在用户做作业时进行观察,它可能会注意到您犯了一个错误,并直接指出用户哪里错了,而不是反过来等着用户要求 AI 去执行任务。

据 DeepMind CEO Demis Hassabis 表示,教 AI 自主行动一直是计划的一部分。这些「察言观色」的技巧,是人类相对擅长但难以量化或研究的事情。

02

Android XR

 

明眼人看到这里已经能反映过来了:比起手机摄像头,这个如此深入现实世界的多模态 AI 功能,似乎更适合的载体是在眼镜上。

Google 显然同样想到了这一点,随即趁热打铁,宣布了 Android XR 的新进展,同时在现场展示了谷歌XR 眼镜的原型机。

在演示中,Google 强调它们是使用 Gemini 的「最佳硬件」:Google的、 展示的原型眼镜搭载有相机,麦克风和扬声器,Gemini 可以调用这些硬件,帮用户理解周围的世界。同时在显示屏上显示类似地图导航等更多信息。

目前,谷歌正通过与三星、XREAL 的合作,来研发首批搭载 Android XR 操作系统的眼镜硬件。谷歌 XR 副总裁 Shahram Izadi 表示,第一款硬件设备是三星的 Project Moohan,但那是一款更接近 Apple Vision Pro 的 XR 头显。第二款 Project Aura 属于 XREAL。定位是一款 AR 眼镜。

除了三星、XREAL 这样的硬件厂商,Google 显然也是从 Meta Ray-Ban 的大获成功中吸取到了经验,同时也宣布了与包括 Gentle Monster 在内的两家时尚眼镜巨头合作,一同将 AI 眼镜打造的更加时尚。

 

03

AI 创作全家桶

 

除了直接面向最多普通用户的 Gemini,Google 同时还针对创作者的一系列 AI 创作工具,进行了更新换代 —— 其中不仅有直接与 Sora 竞争的 Veo3、图像生成工具 image4,Lyria 2 音乐生成模型,还有全新视频创作工具 FLOW。

Veo 3 相比前代,最大的升级是它可以生成包含音效、背景噪音,甚至对话的视频。

谷歌现场演示了一段 CGI 级别的生成动画,其中动物在森林里说话。声音和视频完美同步:有声音的视频显然大大提升了 AI 生成视频的实用性。谷歌 DeepMind 首席执行官 Demis Hassabis 也表示:「我们正在走出视频生成的‘无声时代’。」

Google 同步宣布了「大杯」和「超大杯」订阅服务,AI Pro 与 AI Ultra,其中顶配的谷歌AI Ultra  要价每月 249  美元,但同时也确实提供了物超所值的服务 —— 例如几乎无限制的各项服务使用额度,以及 30TB 的谷歌Cloud 云端存储容量。

AI Ultra 计划允许用户试用 Gemini 2.5 Pro 全新的增强推理模式 Deep Think,据谷歌介绍,该模式专为「高度复杂」的数学和编程问题设计。它还提供 Chrome 中 Gemini 的早期访问权限,允许订阅者直接在浏览器中使用 AI 完成任务和总结信息。

除了这些之外,订阅用户还可以试用谷歌的 AI Agent 原型 —— Project Mariner,可以同时自动化多达 10 项任务,例如查找信息、预订和购买产品。

通过将 Gemini  能力深度融入搜索引擎、Chrome浏览器、虚拟试穿、乃至全新的Android XR生态和AI眼镜,Google不仅在提升现有产品的用户体验,同时也是在潜移默化地定义「下一代 AI 产品」怎么做。

显然,在端侧 AI 产品如何做这件事上,Google I/O 展示出的「软件硬件双管齐下」,已经足以让谷歌再次成为 AI 产品生态中最让人忌惮的选手。

昨天 — 2025年5月22日极客公园

市值一夜暴涨 175 亿元,小鹏汽车「支棱」起来了

2025年5月22日 14:36

小鹏汽车再次突破,拿出了史上最强财报。

5月21日,小鹏汽车公布截至2025年第一季度财报。财报显示,小鹏汽车一季度的营收为158.1亿元,较2024年同期上升141%;交付 9.4 万辆新车,较上年同期交付2.18万辆车增长330%;净亏损大幅收窄至6.6亿元,相较于2024年同期的13.7亿元,减亏幅度高达51.8%;整体毛利率达到15.6%。

这份财报也点燃了资本市场的热情。财报发布后,小鹏汽车美股周三股价应声大涨13%,收于22.25美元,最新总市值达到211.42亿美元。一夜之间,小鹏市值增加24.32亿美元(约合175亿元)。

在行业价格战愈演愈烈、竞争格局加速重塑的当下,小鹏是如何实现这轮逆势上扬的?营收增长、交付激增、毛利回升的背后,又有哪些关键变量在起作用?接下来,我们拆解这份亮眼财报,寻找小鹏逆风翻盘的关键所在。

亏损收窄5成

由于小鹏一季度的销量已经是「明牌」,外界更关注的是单车售价、毛利率等关键指标。

小鹏汽车2025年Q1主要财务数据 | 图片来源:小鹏汽车财报

财报显示,小鹏汽车2025年一季度总收入达158.1亿元,同比飙升141.5%(2024年同期65.5亿元),主要得益于交付量的同比激增331%。然而,环比2024年第四季度的161.1亿元则微降1.8%。

细分至核心的汽车销售收入,一季度录得143.7亿元,同比增长159.2%(2024年同期55.4亿元),但环比2024年第四季度的146.7亿元,亦下滑2.1%。

一季度销量环比增长,但营收却环比小幅下跌,主要是因为单车平均售价(ASP)的下降和销量结构的变化。数据显示,一季度小鹏的单车平均售价约为15.3万元,较上一季度环比下滑了0.7万元。

这主要是因为一季度通常是汽车销售的传统淡季,行业整体需求回落。同时,小鹏为优化库存结构,对老款车型进行的促销折扣,无疑进一步拉低了平均售价。

在销量结构上,MONA M03与P7+这两款车型的大卖,虽力撑销量大盘,但也因其定价策略,对整体ASP形成了结构性下拉。根据易车网数据,一季度期间,价格亲民的MONA M03与P7+合计贡献了销量的75%。

小鹏MONA M03将智能化带到10-15万细分市场 | 图片来源:小鹏汽车

除了营收,毛利率不仅是衡量车企盈利能力和成本控制的重要指标,也是能否穿越周期的关键。

2025年第一季度,小鹏汽车整体毛利高达24.59亿元,推动毛利率攀升至15.6%。这一数字不仅优于2024年同期的12.9%,也高于2024年四季度的14.4%。

聚焦核心的汽车销售业务,其毛利率也达到了10.5%,相较于2024年同期的5.5%实现了近乎翻倍的增长,且高于2024年第四季度的10%。在汽车行业「价格战」的白热化竞争中,小鹏的单车盈利能力仍在改善通道。

细心的投资者会发现,小鹏一季度整体毛利率(15.6%)与其汽车业务毛利率(10.5%)之间,有大约5.1个百分点的差距。这并非统计误差,而是服务及其他业务的原因,这里面主要是向大众汽车集团提供的技术服务费。

财报数据显示,小鹏一季度的「服务及其他业务」收入高达14.4亿元,已连续五个季度稳稳站在10亿元大关之上。

更为关键的是,这部分业务的毛利率达到了惊人的66.4%,环比四季度再次提升6.8个百分点,创下历史新高。

这也让小鹏汽车,成为继比亚迪、理想汽车、赛力斯、零跑之后,第五个接近盈利的新能源车企。财报显示,2025年第一季度,小鹏汽车净亏损为6.6亿元。这相较于2024年同期的13.7亿元净亏损,以及2024年第四季度的13.3亿元净亏损,均实现了同比、环比锐减超五成的成绩。

虽然净亏损数据已足够亮眼,但更深入分析Non-GAAP(非美国通用会计准则)数据,则能发现一些值得关注的细节:本季度,小鹏汽车Non-GAAP下的经营亏损为8亿元,这一数字远优于市场先前预估的18亿元亏损水平。

这一「超预期」表现,并非完全源于核心业务的超常发挥,而是「其他收入」成关键助推手。财报显示,本季度一项高达5.4亿元人民币的「其他收入」(主要由政府相关补贴构成),对Non-GAAP经营数据和净利润的超预期贡献起到了决定性作用。

小鹏的三部曲

对于资本市场而言,已然尘埃落定的一季度业绩固然重要,但二季度的指引以及未来战略蓝图,才是市场关心的「重头戏」。

小鹏汽车预计,二季度的交付量将在10.2万辆至10.8万辆之间。这一数字不仅环比一季度的9.4万辆稳中有升,也是小鹏季度交付的历史新高。与交付量相对应,二季度营收预计将达到175亿元至187亿元,同比增幅高达115.7%至130.5%。

在5月21日晚的财报电话会议上,何小鹏立下三大「军令状」:全年销量目标同比翻倍、第四季度实现盈利、全年实现规模化自由现金流转正。

同时,何小鹏阐述了小鹏汽车未来增长的「三曲线」战略:小鹏的核心曲线是AI汽车,从中国走向全球市场是小鹏汽车的第二增长曲线;人形机器人作为矩阵智能的形式之一,会成为小鹏汽车的第三曲线。

即将上市的小鹏P7 | 图片来源:小鹏汽车

首先,来看看小鹏目前的主业——汽车。据了解,全新SUV车型小鹏G7将于6月上市,目标价格带为25万级;新一代轿跑车型小鹏P7也将在第三季度上市,目标价格带为30万级。这两款重磅车型的推出,将提升小鹏汽车在20万以上价格区间的市场号召力,打响「均价保卫战」。

此外,何小鹏预计,鲲鹏超电产品在Q4发布后将进一步提升小鹏的总体交付量。

与此同时,在财报电话会议上,何小鹏花了大量篇幅,介绍小鹏在AI转型方面的进展。目前,小鹏汽车已搭建了全栈自研体系,涵盖了鹰眼纯视觉方案、图灵大算力自研芯片、云端超大规模基座模型、全本地部署的VLA模型,以及整车EEA架构,物理仿真体系等。下一步,小鹏汽车将会从L2+辅助驾驶的研发开始向L3和L4级别自动驾驶技术快速发展。

在芯片方面,何小鹏表示,小鹏图灵芯片在2024年一次流片成功,算力是当前主流车端 AI 芯片的3-7倍,目前进展顺利。二季度将有部分车进入生产环节,三季度图灵芯片车型将会有更大范围放量。下一步,图灵芯片将会部署在第五代机器人上,大幅提高机器人的端侧算力。

作为第二曲线的海外市场,何小鹏预计未来三年将会高速扩张。2025年第一季度,小鹏的海外销量同比增长超过370%,渠道新增了超过40家海外的门店,开拓了数个关键市场,包括欧洲的代表性市场英国,也包括东南亚的最大市场印尼。

在「三条增长曲线」中备受关注的机器人领域,何小鹏描绘了汽车与机器人之间深度的技术同源性:机器人EEA架构由汽车EEA架构而来;关节来自汽车的三电、动力团队;大小脑脊椎来自于机器人、智驾和智舱团队。汽车和机器人在组织等多个方面实现了七成同源,这种深度融合极大提升了研发效率和协同效应。

更令人振奋的是,小鹏计划在2026年内推出面向工业和商业场景的人形机器人,并通过量产场景的数据驱动,实现机器人的快速进化。

近期,随着MONA M03和P7+这两款车型的大卖,外界对小鹏汽车的信心实现了触底反弹。然而,市场对小鹏的期待远不止于此——小鹏需要持续证明,这些成功绝不仅仅是靠运气,而是已经掌握了打造「爆款」的法则。

同时,中国汽车市场正经历着一场重组与整合浪潮,竞争态势已从过去的游击战演变为「大兵团作战」。这意味着,行业已进入「决赛圈」的白热化阶段。在这样的背景下,小鹏汽车面临着更大的挑战,它必须持续保持高速增长,在最终的战役中占据一席之地。

微信开展短视频恶意营销专项整治;卢伟冰爆料玄戒芯片不止一款;阿里大文娱更名虎鲸文娱

2025年5月22日 09:05

小米 15 周年战略新品发布会今晚开幕,卢伟冰爆料玄戒芯片不止一款

5 月 21 日晚,卢伟冰发微博透露,玄戒芯片不止 O1 一款。小米 15 周年战略新品发布会将于 5 月 22 日举行,其中小米时隔多年公布的自研芯片玄戒 O1 成为关注重点。玄戒 O1 芯片将由小米 15S Pro 和小米平板 7 Ultra 首发搭载,是小米自主研发的全新旗舰芯片。 ​​​(来源:快科技)

百度 2025 年第一季度营收 325 亿元超预期,智能云同比增速达 42%

百度发布 2025 年第一季度财报。财报显示,一季度百度总营收达 325 亿元,其中核心营收 255 亿元,同比增长 7%,均超市场预期。

一季度,百度核心净利润同比增长 48% 至 76.3 亿元,智能云持续强劲增长,同比增速达 42%。财报显示,3 月,百度 App 月活用户达 7.24 亿,同比增长 7%。无人驾驶方面,截至 2025 年 5 月,萝卜快跑在全球累计提供超 1100 万次的出行服务。今年一季度,萝卜快跑在全球提供超 140 万次出行服务,同比增长 75%。(来源:36 氪)

 

​小米官宣与高通签署全新多年协议

小米和高通庆祝双方长达 15 年的合作,并达成了全新的多年协议。

与往年一样,小米今年将再次成为首批采用下一代旗舰骁龙 8 系列芯片的厂商之一,用于其高端智能手机 —— 不仅针对中国市场,也针对全球市场。

展望未来,双方计划继续携手,在包括智能手机、汽车、AR/VR 眼镜、可穿戴设备、平板电脑等在内的各类边缘侧设备领域,持续推动技术进步。

小米集团 CEO 雷军表示:「小米一路从初创公司发展成为全球科技领军企业,高通技术公司始终是我们最值得信赖、最重要的合作伙伴之一。我们期待下一个 15 年继续携手合作,利用高通技术公司先进的骁龙平台和技术,为全球用户提供更具创新性的高品质产品。」

高通公司总裁兼 CEO 安蒙表示:「高通和小米一直携手并进,持续打造备受全球消费者青睐的非凡产品。我们非常珍视这一合作伙伴关系,庆祝双方 15 年的合作历程,也非常期待未来继续携手同行。通过骁龙平台,我们将持续赋能小米的旗舰智能手机,并期待进一步扩展合作领域,涵盖汽车、智能家居、可穿戴设备、AR/VR 眼镜、平板电脑等。」(来源:新浪科技)

 

阿里大文娱改名虎鲸文娱,以优酷和大麦娱乐为核心

5 月 21 日,阿里大文娱宣布改名虎鲸文娱集团。此外阿里影业拟更名为大麦娱乐。未来,虎鲸文娱将继续作为阿里巴巴旗下的文化娱乐集团以优酷和大麦娱乐为核心业务引擎,为用户创造快乐。

为什么选择「虎鲸」?,官方解释称,虎鲸身型庞大但灵活聪明,能适应各种复杂环境;典型的群居动物,通过协作维系海洋生态的平衡;拥有丰沛的情感,对人非常友好。这些特质非常契合我们追求的理念:数智、共生、快乐。(来源:凤凰网科技)

 

微信开展短视频恶意营销专项整治,公布恶意虚假摆拍、低俗诱导互动等违规案例

5 月 21 日消息,今日,微信珊瑚安全公众号发布关于治理恶意营销短视频内容的公告。

公告全文如下:

微信一直致力于打造安全、健康、绿色的平台生态环境,为进一步深化短视频恶意营销问题治理,微信积极响应中央网信办 2025 年「清朗・整治短视频领域恶意营销乱象」专项行动要求,开展为期三个月的专项整治,从严打击恶意虚假摆拍、散布虚假信息、违背公序良俗、违规引流营销等恶意营销行为,4 月 15 日-5 月 15 日,共清理有害信息 45759 条,处置违规账号 6845 个。

近期典型违规案例:

一、恶意虚假摆拍。

二、散布虚假消息博取眼球。

三、低俗诱导互动。

四、违规引流营销。(来源:IT 之家)

小米 YU7 汽车全新配色「宝石绿」亮相,雷军称其有着不可替代的独特魅力

5 月 21 日消息,小米 YU7 汽车全新配色「宝石绿」今日首发亮相,新配色采用双层色漆工艺,官方称灵感来自哥伦比亚绿宝石。

小米创办人,董事长兼 CEO 雷军表示:YU7 有着不可替代的独特魅力,新车定位豪华高性能 SUV,和 SU7 有着一脉相承的家族设计语言。

工信部信息显示,小米 YU7 长宽高分别为 4999/1996/1608(1600)mm,轴距达到 3000mm,属于中大型 SUV。

动力配置上,小米 YU7 采用纯电驱动,提供单 / 双电机可选。其中,双电机四驱版车型的前后电机最大功率分别为 220kW 和 288kW,综合功率达到 508kW(691 马力),最高车速可达 253km/h,并配备三元锂电池;单电机后驱车型的最大功率为 235kW,最高车速为 240km/h,搭配磷酸铁锂电池。(来源:IT 之家)

 

美团外卖「神抢手」日订单量突破 1000 万单,近期已提高准入门槛

5 月 21 日下午消息,新浪科技从接近美团人士处了解到,美团外卖「神抢手」日订单量已突破 1000 万单。「神抢手」是美团外卖帮助餐饮品牌孵化爆品的产品。

今年以来,美团「神抢手」投入了大量资源帮助商户创新产品,连接用户需求,重点对连锁餐饮品牌、优质中小商家进行扶持,通过设立独立商品展示专区、提供固定优质曝光位以及实施流量倾斜策略等方式,提升高品质商品的曝光度与市场触达率。近期,「神抢手」还宣布对品质检控体系进行升级,提高了准入门槛,卫生环境、产品品质一般的商家,将无法提报进入「神抢手」。

行业人士表示,单日峰值突破千万单,意味着「神抢手」已经成为美团外卖辅助商户创新的强有力工具。外卖行业的竞争,从单纯「卷价格」转变为帮助餐饮商家敏锐洞察市场需求、提升商品品质和创新上。(来源:新浪科技)

 

苹果 Apple Store 零售店支持微信支付

5 月 21 日有多个博主和网友发帖称,中国内地的苹果 Apple Store 即日起支持微信支付。

Apple Store 线下零售店自 2018 年 2 月 7 日起便已支持支付宝(线上更早)、2019 年香港 & 澳门 Apple Store 也已支持 AliPay HK。

中国内地 Apple Store 零售店目前接受银联卡、支付宝与微信支付,以及 Visa、Mastercard、JCB、American Express 支付卡。(来源:IT 之家)

 

智元 Q2 将发布四足机器人

5 月 21 日举办的灵犀 X2 媒体沟通会上,智元机器人灵犀业务部总裁魏强透露,公司将在今年 Q2 发布一款四足机器人产品。据悉,该款产品将主要面向家庭或其他 C 端场景。

沟通会上,智元方面还透露,智元机器人灵犀 X2 即将开启线上渠道预定,该机器人具有灵动、亲和、智能等多方面特色,是一款全智能灵动机器人。(来源:新浪科技)

 

腾讯推出智能体开发平台,并计划开源多个模型

5 月 21 日消息,在今日举行的「2025 腾讯云 AI 产业应用峰会」上,腾讯云宣布其大模型知识引擎全面升级为腾讯云智能体开发平台(TCADP),并正式对外发布。

腾讯云智能体开发平台接入 DeepSeek- R1、V3 模型和联网搜索。此外,腾讯还计划近日推出世界模型混元 3D 场景模型,并开源企业级混合推理模型、端侧混合推理模型、多模态基础模型。

腾讯大模型产品近日批量更新,已推出视觉深度推理模型混元 T1 Vision、端到端语音通话模型混元 Voice、混元图像 2.0 模型等。(来源:IT 之家)

 

小鹏汽车新品规划:G7 下个月、新 P7 三季度、增程大型 SUV 四季度发布

5 月 21 日消息,小鹏汽车董事长何小鹏公布了后续的新品规划:6 月启动 G7 的预热发布、今年第三季度发布 30 万元级豪华运动轿跑全新一代 P7、今年四季度推出鲲鹏超级电混大型 SUV(G01)。

IT 之家汇总具体车型目前已知信息如下:

小鹏全新 P7 定位科技时尚豪华轿跑,号称「经历五年的打磨,我们继续以「原创」交出答卷」。何小鹏表示:「全新的小鹏 P7 可能是我们有史以来情感投入最大的一个项目,我们的中外设计团队用非凡的想象力,原创的时尚美学设计语言,打破枯燥相似的设计思维,引领新的潮流。」

其外观更加运动化,相比现有车型更具动感。新车的前后设计与 2024 年发布的 P7+ 相似,加入了尾翼以提升空气动力学性能。(来源:IT 之家)

 

三星 Galaxy Watch 8 Classic 智能手表抢先看:方圆设计、1.5 英寸屏幕、450mAh 电池

5 月 22 日消息,科技媒体 sammyguru 昨日(5 月 21 日)发布博文,分享了一组高清渲染图和 360 度渲染视频,展示了三星 Galaxy Watch 8 Classic 智能手表。

尺寸方面,Galaxy Watch 8 Classic 可能仅提供 47mm 单一尺寸,配备 1.5 英寸屏幕,尺寸为 46 x 46.5 x 14.2mm。

电池方面,监管文件显示该手表额定电池容量为 435mAh,通常对应典型容量 450mAh,相较于 Galaxy Watch 6 Classic 的 425mAh 略有提升,但仍低于 Watch 5 Pro 和 Watch Ultra 的电池容量。(来源:IT 之家)

Google 联合创始人谢尔盖·布林承认「在 Google 眼镜上犯了很多错误」

Google 联合创始人谢尔盖·布林周二在 Google I/O 2025 开发者大会的台上接受采访时表示,他「在 Google 眼镜上犯了很多错误」。在「科技大咖播客」主持人亚历克斯·坎特罗维茨对 Google DeepMind 首席执行官德米斯·哈萨比斯的采访中,布林意外地被邀请出席。

布林接着表示,他「对消费电子供应链一无所知」,也不知道以合理的价格打造智能眼镜有多难。这位 Google 联合创始人指出,他非常看重智能眼镜的外形设计,并表示很高兴公司再次探索这一领域,而且这次「有优秀的合作伙伴帮助我们打造它」。(来源:cnBeta)

昨天以前极客公园

中国车市大变局:游击战已死,大兵团作战开始

2025年5月21日 22:36

中国汽车市场,正在经历一场剧变。

就在前几年,新势力、主流车企纷纷「撒豆成兵」,孵化出多个子品牌,覆盖了从低端到高端,从家用到个性等细分市场。

然而,仅仅几年过去,这股潮水似乎正在退去,甚至逆转。

5月7日,吉利汽车发布公告称,已向极氪提交非约束性报价函,计划以每股2.57美元或每股美国存托股票25.66美元的价格,收购其全部已发行股份。 目前吉利汽车已持有极氪约65.7%的股份,交易完成后,极氪将成为吉利汽车全资子公司,并从纽交所退市。

无独有偶,5月9日下午,蔚来内部发布公告,旗下两个子品牌乐道、萤火虫多项组织部门架构迎来调整,整合进入蔚来体系,涉及乐道品牌产品研发、用户服务、车型营销等部门,以及萤火虫事业部。

为什么仅仅几年时间,中国汽车市场的「玩法」就发生了反转?这样的变化,又表明了中国汽车市场怎样的发展方向?

从「游击战」到「大兵团作战」

如果把时间往前拨几年, 2018年至2024年间,中国汽车行业的主旋律还是扩张。

自2020年,中国新能源汽车渗透率突破5%的临界点以来,普及速度按下加速键。中国汽车协会的数据显示,2020年底,新能源的渗透率只有5.4%,2021年年底就上升到14.8%,如今更是达到了50%左右,销量也从100万辆跃升至超过1000万辆。

新能源汽车的崛起,也带来了资本市场的狂欢。

特斯拉一家的市值(截至发稿1.1万亿美元),超过了10家传统头部车企的总和;成立10年的蔚来,总市值一度超过千亿美元,超过了奔驰的母公司戴姆勒、宝马、福特、大众等

阿维塔12背后,站着长安、华为和宁德时代|图片来源:阿维塔

看到新势力品牌的攻城拔寨,主流汽车品牌分外眼红。同时,在燃油车时代中国车企难以触及的高端市场,新能源提供了「换道超车」的机会。于是,很多主流车企都打造出了自己的「新势力」品牌,极氪、岚图、极狐、智己、深蓝、阿维塔等品牌应运而生。

即便是像蔚来、小鹏这样的新势力,也开始拆分或孵化子系列(如蔚来的乐道、小鹏的MONA系列)。

不过,就在「扩张」主流风行几年后,车企的发展策略又向「紧缩」发展,同样也是来自市场的需求。

明面上,是政策导向推动重组。国务院国资委在2025年明确提出,对整车央企进行战略性重组,目标是打造具有全球竞争力的智能网联汽车集团。最新的案例是,2025年2月,有消息称,东风集团和长安汽车,以及中国兵器装备集团(长安汽车间接控股股东)旗下其他汽车业务将重组,合并成一个全新汽车集团。

在明面之下,是新能源市场已经从「蓝海」变成「血海」:除了特斯拉和新势力,自主品牌、合资品牌、跨界科技品牌各路玩家悉数登场;同时,技术路线和产品形态多元,燃油车、纯电、增程、混动的份额之争仍在进行中,产品覆盖轿车、SUV、MPV等多个细分领域;竞争也从技术比拼、品类创新,延伸到激烈的价格战,甚至是各种鱼龙混杂的营销战……

同时,多品牌的劣势开始显现。很多子品牌在供应链、研发,甚至市场定位上存在重叠。在战略决战阶段,效率就是生命。将分散的资源集中到核心品牌和优势技术上,是提升竞争力的必然选择。

2025年上海车展,极氪汽车展台展示极氪9X|图片来源:视觉中国

据了解,极氪与吉利汽车实现完全合并后,在技术层面,极氪将与吉利共享技术体系。同时,吉利在杭州、宁波等地拥有年产能超120万辆的新能源工厂,整合后极氪可优先利用吉利的产能,预计2025年极氪产能将提升至70万辆,资本开支可减少50亿元。

「幸存者」画像

放眼全球汽车工业史,类似的整合与洗牌并非首次出现。历史上,美国曾有超过1000家车企,经过多轮的市场洗礼和产业整合,最终只剩下福特、通用、克莱斯勒(现为Stellantis一部分)、特斯拉等少数车企

中国汽车市场,也正在走类似的路。

那谁能活下来并成为最终的赢家?具备以下「画像」的企业,更可能穿越周期:

年销超100万辆是基础。

在汽车行业,规模效应至关重要。年销达到50万辆通常被认为是盈利的基础门槛,而要参与全球化竞争,年销量突破100万辆几乎是必要条件。

2025年上海车展蔚来展台|图片来源:视觉中国

同济大学汽车学院朱西产甚至更悲观,认为3年内(蔚小理)一家都剩不下,最后能够独立存在的概率等于0

「年产量干不到200万辆的,我估计都活不下去,体量太小,研发费用过高。需要用各种方式去合作合资。因为研发投入小了,技术进步就停止了,这么高的研发投入这么小的产量,你就(只能)等死」。

随着中国汽车市场从「游击战」转向「大兵团作战」,也意味着不会再有「银子弹」或者「一招鲜」,而是体系化能力和战略执行力的比拼。

在这场新战役中,首先比拼的是体系化的规模效率与成本控制。当前,价格战已是无法回避的现实,且预计将持续数年。要在白热化的价格竞争中取得优势,不能仅仅依靠规模提升议价能力,还包括研发、供应链、制造、销售的成本优化。例如,通过平台化、模块化设计,提高零部件的通用率和研发成本。

除了规模效应的比拼,汽车行业的另一个至关重要的逻辑是:以快打慢。尤其是在技术迭代飞快的当下,能否构建一个可持续进化的技术体系,高效地将技术转化为能满足市场需求的产品,成为决定胜负的关键。

比如,2011年-2024年的14年间,比亚迪有13年的研发投入超过当年净利润。其中,2024年比亚迪在研发投入达542亿元,同比增长36%。这些提前布局和超强的研发投入,让比亚迪拥有了自主可控的核心科技。这使得比亚迪能够在新能源汽车浪潮全面爆发时,最大化地抓住时代红利。

此外,在这场「大兵团作战」中,全球化布局与本地化能力的重要性日益凸显。2024年,中国汽车出口量达到了641万辆,同比增长23%。上汽、奇瑞、比亚迪等车企,已经成为中国车企出海的先行者。

不过,成功出海不仅是卖车,更需要在当地建立体系。整车出口、散件出口、品牌收并购及零基础投资是典型的出海模式。在逆全球化背景下,中国汽车出海正从「出口」向价值链「出海」转型。

其实,丰田公司的全球化历程,给中国车企出海提供了一个经典的范本。丰田经历了从早期的整车出口,到大规模海外制造,再到最终实现技术和产业链的全球布局。支撑它完成全球布局的是,性价比和新技术。

当前,中国车企正在「摸着丰田过河」,一方面通过极具竞争力的质价比,快速获取海外市场份额;另一方面,面对海外市场纯电市场增速放缓,中国车企将插电混动和增程技术作为突破口,开辟新的出海路径。

中国汽车市场的潮水正在转向,从「游击战」到「大兵团作战」。在这场决定未来的决战中,胜负手是车企的综合实力和体系化能力。它不仅是技术和产品的比拼,还是组织、管理、品牌等全方位的竞争。就像打游戏到了后期,不再是靠一些小技巧就能赢,而是要靠整体的经济实力、科技实力和组织能力。

无法完成这个转型的企业,即便在「游击战」时取得不错的成绩,也很难在「大兵团作战」中存活下来

中国汽车,此刻正站在决定未来格局的十字路口。

飞书知识问答,给企业如何用好 AI 打了个小样

2025年5月21日 22:15

今天,越来越多人在工作中使用 AI:写文案、画图、做总结。但它们仍然是「工具」进步,而非「范式」变革——我们像是多了一个智能的助手,但自身的工作模式并没有本质的改变。但我总觉得,在 AI 时代,企业组织的工作范式,一定会因为 AI 的介入,而迎来一次真正意义上的变革。

最近我接触到飞书最新上线的「知识问答」产品,突然让我看到了一些新的可能性: AI 不只是帮你更快完成一项任务,而是可能改变「我们如何工作」这件事的底层逻辑。

客观的说,这个产品依然很早期,有些功能还显得稚嫩。但它代表了一种可能性——AI 第一次作为企业知识的一部分,被有机地融入到工作流中,从而实现一种全新的组织智能模式。就像办公软件开启了数字办公时代,SaaS 开启了协同办公时代,而 AI 知识问答,或许正是开启 AI 原生办公时代的钥匙。

接下来讲讲一些我的不成熟思考。

 

01

从软件到云,再到问答:

一种全新办公范式的新可能

 

大概一个月前,极客公园获得了飞书知识问答的试用资格,我自己也体验了一段时间。

根据飞书团队的介绍,这是一款基于企业知识构建的专属 AI 问答工具。在日常工作中,当你遇到问题时,可以随时向它提问,它能够根据你在飞书中有权限访问的消息、文档、知识库、文件等信息,直接提供精准的答案。不仅如此,它还可以基于企业知识协助内容创作,帮助你获取更深入的业务洞察。

 飞书知识问答丨来自:极客公园

第一次打开知识问答的界面时,乍一看像是 ChatGPT 或 DeepSeek 这样的聊天机器人,所以一开始我也尝试用它来整理新闻、转写录音——但很快我意识到,飞书知识问答并不是一个通用 AI 对话工具,而是一款定位明确、用途专业的企业助手。

如今,极客公园的大部分办公场景都已经迁移到飞书上,飞书中沉淀了我们绝大多数的工作资料——从财务、人事等管理信息,到我们日常创作的文章、运营数据等业务资料,甚至包括会议纪要、聊天记录这些日常沟通内容。

知识问答可以访问我有权限查看的全部文件,并基于这些内容回答我的各种问题,就像是一位专属的智能秘书。作为管理者,虽然我有权限查看公司所有的数据,但我不可能记住所有的信息。以往在需要的时候,我通常要翻查文档,或者去询问助理和业务负责人,而现在,知识问答成了一个非常有效的替代方案。

当我开始把知识问答当成一个专属助理使用时,才真正解锁了这个工具的「使用密码」。经过一段时间的使用,我也逐渐总结出了一些体验和感受。

整体来看,就像助理也有实习生、初级助理和高级助理之分,知识问答的能力也可以划分为不同的层级。当前,它在不同层级的表现也各有优劣。

1, 实习生水准:主要负责帮我找一些文件和资料。比如让它查找我与某位创业者最近的沟通录音,或者找出两年前 IF 大会期间,我与柯南和 Robin 的访谈文档。实际上,在这些事情上,这位「AI 助理」已经表现得非常不错。考虑到我在飞书上有几百个群聊,每周同事们还会新建数百个文档,知识问答已经能帮我高效完成一些非常实际的工作。

 飞书知识问答告诉我今年极客公园数据最好的播客和直播丨来自:极客公园

2,初级助理的水平: 能够基于文档、会议纪要等信息,回答我一些具体问题。比如前段时间我和媒体朋友聊到我们今年在播客和直播上的发力,希望分享几个成效显著的案例。我大致记得有几场数据不错,但具体是哪些场次、具体数据是多少,记忆已经模糊。这时候,只需要问一声飞书知识问答,它就能快速从文档和会议纪要中提取出这些内容,直接给出答案。

3,工作伙伴水平: 是在回答问题的基础上,进一步具备生成内容的能力。比如我曾尝试让飞书知识问答,基于我和创业者或同事们的沟通记录,再结合一些外部资料,自动生成一份创业者在线访谈的前采准备文档。在飞书的产品发布会上,我也看到飞书 CEO 谢欣演示了一个场景:让知识问答生成一份结项报告——这个功能的未来潜力非常可观。

整体来看,在后两个层级上,知识问答的表现仍有进步空间。我自己的观察是,这主要取决于两个方面:一是企业自身数据的有序程度。如果项目文档或运营数据整理得越清晰,知识问答的回答和生成效果就越好;二是业务复杂度的不同,特别是在一些需要复杂推理和判断的任务中,知识问答还显得有些力不从心,像是一个尚未「毕业」的实习助理。

但对于一个产品的早期阶段来说,「不完美」才是正常状态。而真正打动我的,是它背后所代表的趋势——我们可能正站在办公范式转变的起点。这不仅仅是一个更强大的知识检索工具,更像是一个 AI 原生办公系统的雏形,甚至会改变企业生产力构成和新的组织形态。

或许在不久的将来,它不会只是某个应用插件,而是嵌入到我们每一个工作流程的核心,为团队的每个人都增强了一个「团队」,人机混合的生产力让业务中的「大脑」变多,增效而不只是降本。

 

02

不是让企业适应 AI,而是让 AI 适应企业

 

过去几年,飞书一直在强调企业要「AI Ready」——这是 AI 真正进入企业场景的前提。企业必须首先实现高度数字化,打通各类系统,实现数据的有效沉淀,才能为 AI 提供可被调用的「粮食」。

但「AI Ready」只是基础设施的搭建,真正的挑战在于,如何将 AI 真正融入企业的实际运营之中。 而这一次「知识问答」的推出,标志着飞书从「准备阶段」正式迈入「交付阶段」的关键一步。

这背后依托的是飞书长期构建的一体化系统:包括文档、群聊、多维表格、知识库等在内的信息生态。这让知识问答不再只是依赖公域知识的「聪明大脑」,而是基于你所在企业内部的真实数据——你参与的群聊、你撰写的文档、你开过的会议,所有这些,都成为它的「原材料」。

也就是说,你只要真正好好用了飞书,你就完成了 AI ready,而不需要再回到过去我们对 AI ready 的标准动作上搞一堆内部工程了。

通用大模型与飞书知识问答对比丨来自:飞书

而且相比自己接通用大模型搞部署,飞书知识问答能够更精准地聚焦企业员工和管理者在实际工作中真正需要解决的问题。

另一个关键好处,则是它天然具备解决信息安全的能力,这是企业在接入 AI 产品时最关心的问题之一。

在 飞书发布的知识问答介绍上,谢欣演示了一个非常有意思的场景:他和下属同时向知识问答提问,「2024 年飞书的机场广告一共做了多少投放?」结果两人收到的答案完全不同——谢欣得到了具体的投放数据,而下属则没有权限查看该信息,因此系统无法给出明确答案。

千人千面的回答丨来自:飞书

 

这是因为知识问答会基于组织中每个人的权限,只展示你「能知道」的内容,并据此生成你「该知道」的答案。这不仅保障了信息的个性化和精准匹配,也从源头上确保了企业的数据安全不被泄露。

从这个角度来看,飞书并不是让企业去适应 AI 的使用逻辑,而是让 AI 主动适应企业的运行方式。技术从来不是目的,而是为场景服务的工具。飞书正在做的,就是让 AI 自然而然地嵌入到组织的每一个细节中,让每一位员工都能轻松上手、真正用得起来、用得放心。

 

03

超越抄作业时代——飞书赋能的能力在进步

 

作为长期关注飞书团队节奏的人,我知道他们一向是「技术冒进者,产品保守派」,所以最早体验知识问答的时候,预期可能是个比较保守的产品交付。

不过认真体验和观察后我意识到,企业知识问答这个场景,本质上就是一个「千行百业、千人千面」的复杂问题:不同行业、岗位、管理层级,提出的问题不同、期望的答案不同、理想的输出格式也各不相同。换句话说,飞书的产品经理们无法在会议室里「闭门造车」设计出所有行业的知识问答逻辑, 它必须走向真实的市场环境,依靠用户的真实反馈与使用场景,与各行各业共创,才能打磨出一个真正有价值的产品。

这背后,其实反映了飞书这几年在产品观念上的一次重要变化:过去,飞书更像是字节跳动「先进管理经验」的对外窗口,让其他企业通过它来「抄作业」。但现在,他们显然认识到,这种方式存在天花板。每家企业都有独特的流程、文化与知识体系,光靠复制「最佳实践」是远远不够的。

曾经有一段时间,飞书似乎被不少客户理解为了对于「字节方法论」的「抄作业」方式。但这次知识问答上很显然彻底改变了这个惯性。

很显然它开始能帮助每个企业怎么做好「自己的作业」。这也是飞书知识问答的真正价值所在——它不是一个单纯回答问题的工具,它有机会一个激发组织知识、流程与创新潜能的共创平台。

在 AI 这波波澜壮阔的浪潮里,很多公司都在追逐「最新、最强」的大模型,但我觉得飞书提供了另一条路径——把 AI 的能力真正落在组织的日常运行中。

 AI+知识获取丨来自:飞书

我觉得知识问答不是终点,它只是开始。未来,它或许会成为企业真正的「操作系统」——一个让我们可以自然地向 AI 提问、获取反馈、做出判断并高效执行决策的核心接口。

我始终相信,AI 的最终目标不是简单的提效,甚至简单的去取代人,而是重塑组织。我们今天看到的每一次微小的技术进化,其实都在为构建一个全新的组织范式打下基础。

门的另一侧,将不再是「翻资料、找记录、层层汇报」的低效模式,而是「开口即问、问即得答、答即可用」的智能协作新世界。这样的未来,我很期待。

谷歌IO开幕,再发AI全家桶;马斯克:五年内继续担任特斯拉CEO,除非我死;阿里2.5亿美元战略投资美图|极客早知道

2025年5月21日 08:36

谷歌搜索全新 AI 模式亮相:Gemini 2.5、个性化回答、深度搜索等

5 月 21 日,谷歌官宣,谷歌搜索正式迎来 AI 模式,该功能从今日起逐步在美国市场推出。

除了 Chrome 浏览器本身更深度的整合 Gemini 接口、识别网页内容以外,谷歌还为搜索引擎调添加了全新的「AI 模式」。这个模式把类似 Gemini 或 ChatGPT 的聊天机器人功能直接带入了用户的网页搜索体验。你可以用它来找链接,但也能更快地获取信息、追问问题,让 Gemini 以平时在普通网页上找不到的方式来整合信息。

「AI 模式」同时也支持深度研究功能,会自动将用户的提示词转化为海量的搜索,并自动查找和整合信息,同时在这个模式下,AI 搜索还可以访问你之前的搜索记录,你也可以手动开启权限,让它可以访问你的电子邮件,以便 AI 能更了解「你是谁」以及你关心什么。

把所有这些功能加起来,你就会得到一个更加灵活和个性化的 AI 搜索,无论是针对用户本身还是当前的具体查询,显然都能根据用户信息给出更加精准的回答。(来源:极客公园)

苹果公布 WWDC25 时间表,开幕主题演讲将于 6 月 10 日凌晨 1 点举行

5 月 20 日,苹果公司正式宣布,2025 年全球开发者大会(WWDC 2025)将于太平洋时间 6 月 9 日至 13 日(北京时间 6 月 10 日至 14 日)举行。本届大会将继续以线上形式为主,并在加州库比蒂诺的 Apple Park 举办线下特别活动。

其中,大会首日的开幕主题演讲(Keynote)定于太平洋时间 6 月 9 日上午 10 点(北京时间 6 月 10 日凌晨 1 点)举行,届时将发布包括 iOS 19、iPadOS 19、macOS 16、tvOS 19、watchOS 12 以及 visionOS 3 在内的新一代操作系统。

iOS 19 据称带来自 iOS 7 以来最大规模的界面与功能革新,包括引入 visionOS 风格的半透明毛玻璃效果等设计元素。

主题演讲结束后,苹果将于太平洋时间 6 月 9 日下午 1 点(北京时间 6 月 10 日凌晨 4 点)举行 Platforms State of the Union 环节,深入介绍各平台的最新开发工具和框架,为开发者提供技术支持。(来源:IT之家)

 

英伟达证实上海设立新办公空间,但会遵守美国出口管制政策

5 月 20 日,之前有消息称,英伟达计划在上海设立研发中心,力图在其中国市场销售受挫的背景下维持在 AI 芯片领域的领先地位。

对此,英伟达回应称,他们正在为现有员工租用一个新的办公空间,这是其在中国持续深耕的努力。

「但我们遵守当前的出口管制,不会将任何 GPU 设计或核心 IP 发送到中国进行修改。」

在这之前,英伟达就已经表示,公司不会向中国提供任何图形处理器 (GPU) 设计图,也不会在当地修改产品设计以符合美国出口限制。

英伟达发言人表示:「我们并未向中国提供任何 GPU 设计图,也不会将设计交由当地修改以符合出口管制要求。」(来源:快科技)

 

马斯克:仍致力于在五年内继续担任特斯拉 CEO,除非我死了

5 月 20 日,特斯拉首席执行官马斯克在多哈经济论坛上发表讲话表示,他仍将在 5 年内担任特斯拉首席执行官,除非他死亡。马斯克还表示,特斯拉销售未出现需求问题,欧洲市场最弱,其他地方都很强劲。

市场方面,该消息出来后,特斯拉股价一度大涨超 3%,然而没过多久股价就回落,截至发稿,特斯拉股价涨 0.7%,报 344.48 美元。

《华尔街日报》4 月 30 日援引知情人士消息报道,由于特斯拉公司股价下跌以及一些投资者对马斯克关注白宫的举动感到不满,特斯拉董事会开始认真考虑寻找马斯克的继任者。据知情人士透露,董事会成员联系了多家猎头公司,试图寻找特斯拉下一任首席执行官。特斯拉董事长罗宾·丹霍姆在该消息传出后表示,今天早些时候,有媒体错误报道称,特斯拉董事会已联系猎头公司开始寻找首席执行官人选,这「完全不属实」。(来源:新浪科技)

 

谷歌宣布 AI 模型最新进展:Gemini 2.5 Flash 轻量级版本将于 6 月推出

5 月 21 日,在 Google I/O 2025 开发者大会上,谷歌宣布最新一代人工智能模型 Gemini 2.5 系列的最新进展,这一系列包括两款重要模型:Gemini 2.5 Flash 和 Gemini 2.5 Pro。其中,Gemini 2.5 Flash 作为轻量级版本将于 6 月初正式推出,而更强大的 Gemini 2.5 Pro 则计划稍后发布。

Gemini 2.5 Pro Deep Think,在 2025 年美国数学奥林匹克竞赛 (USAMO) 中取得了 40.4% 的高分,要知道这可是最难的数学基准测试之一,比之前的 2.5 Pro 版本足足提升了 10 多个百分点。同时在 LiveCodeBench 竞赛级编程难题中,它的得分更是高达 80.4%。同时,在多模态推理 MMMU 测试中,也取得了 84.0% 的成绩。

与此同时,Gemini 2.5 Flash 则是一款注重效率和成本优化的轻量级模型,将在 6 月初提供常规可用版本。这款模型在性能、能耗和透明度方面均有显著提升,例如其效率比前代提高了 22%,并且能够显示「思考过程」,让用户了解其如何得出答案和处理查询。(来源:极客公园)

 

快手推出「破茧」功能,助力用户跳出个性化推荐「茧房」

5 月 20 日,快手平台推出了一系列旨在优化用户个性化推荐体验的新功能,包括「信息茧房」自我评估与「一键破茧」两大工具,旨在帮助用户更好地掌握和调节自己在平台上的内容偏好。

具体而言,「信息茧房」自我评估功能以直观的可视化形式,向用户展示了其推荐页内容的分布情况,包括内容类型、偏好以及推荐强度。这一功能的设计初衷是让用户对自己的内容消费习惯有更清晰的认识,从而做出更加自主的选择。

在此基础上,快手还推出了「一键破茧」功能,该功能能够基于用户的偏好和使用特征,智能优化推荐内容类型、兴趣标签以及推送强度,有效避免用户陷入「信息茧房」的困境。用户可以根据自己的需求,多维度地评估并自主选择是否启用该功能。(来源:ITBears)

B 站第一季度总营收同比增长 24%,调整后净利润 3.6 亿元

5 月 20 日,哔哩哔哩公布了截至 2025 年 3 月 31 日的第一季度财务报告。财报显示,2025 年一季度 B 站营收达 70.0 亿元人民币,同比增长 24%。

其中,广告业务收入为 20.0 亿元,同比增长 20%;游戏业务收入为 17.3 亿元,同比增长 76%。公司调整后净利润达 3.6 亿元,实现持续盈利。哔哩哔哩美股盘前涨近 6%。(来源:钛媒体)

 

美图获阿里 2.5 亿美元战略投资,将在 AI 与电商领域深度合作

5 月 20 日,美图公司发布公告,宣布与阿里巴巴签署 2.5 亿美元(IT 之家注:现汇率约合 18.04 亿元人民币)可转债协议,同时双方还将在电商平台、AI 技术、云计算等领域展开战略合作。

公告显示,阿里巴巴以可转债的形式投资美图,本金总额为 2.5 亿美元(净筹资约 2.496 亿美元),为期 3 年,年利率为 1%。阿里巴巴可在发行日起至到期日前 5 个工作日行使转换权,按每股 6.00 港元的价格转换为美图公司股票。

阿里巴巴将为美图公司核心业务提供技术支持,满足美图公司旗下 AI 产品推理、训练等算力需求。美图公司承诺未来三年向战略投资者阿里巴巴采购不低于 5.6 亿元的云服务。(来源:IT之家)

 

马斯克:正推进对 OpenAI 的诉讼

5 月 20 日,马斯克表示,正推进对 OpenAI 的诉讼,美国应该有一些人工智能监管,但不是说这个行业不应该被过度监管,星链未来有可能上市,不认为 SpaceX 会涉足武器业务。(来源:财联社)

 

Uber 将与 Waymo 合作在亚特兰大推出自动驾驶共乘服务

5 月 20 日,Uber 公布,将与 Alphabet 旗下自动驾驶汽车部门 Waymo 合作,在美国亚特兰大推出自动驾驶共乘服务。公司指,当服务推出后,部分使用 Uber 应用程序的乘客将可以选择与 Waymo 全自动全电动捷豹 I-PACE 汽车配对。(来源:格隆汇)

英伟达推出 AI 驱动的 DGX 个人计算系统,开启桌面级超级计算新时代

5 月 20 日,英伟达宣布与将推出 DGX Spark 和 DGX Station 个人 AI 超级计算系统。这一系列新产品旨在为全球开发者、数据科学家和研究人员提供前所未有的性能和效率,满足他们在人工智能领域日益增长的需求。

DGX Spark 配备了 Nvidia 的 GB10Grace Blackwell 超芯片和第五代 Tensor 核心,能够提供高达 1Petaflop 的 AI 计算能力和 128GB 的统一内存,适合加速各行业的生成式 AI 工作负载。

与此同时,DGX Station 则专为最苛刻的 AI 工作负载设计,搭载了英伟达的 GB300Grace Blackwell Ultra 桌面超芯片,提供高达 20Petaflops 的 AI 性能和 784GB 的统一系统内存。此外,DGX Station 支持英伟达的多实例 GPU 技术,可以分割为多达七个独立实例,为数据科学和 AI 开发团队提供个人云服务。(来源:AIBase)

 

英伟达推出人形机器人基础模型 N1.5:开发周期从三个月缩短至 36 小时

5 月 20 日,据媒体报道,在 2025 台北国际电脑展上,英伟达 CEO 黄仁勋宣布升级机器人开发基础设施,推出新一代人形机器人基础模型 Isaac GR00T N1.5。

该模型被业界视为「下一代工业革命的核心构建模块」,其突破性在于通过合成数据技术大幅缩短开发周期——传统 3 个月的训练流程被压缩至 36 小时,显著解决了机器人学习的数据瓶颈问题。

GR00T-Dreams 工具基于 Cosmos Predict 世界模型的微调能力,仅需单张图像即可生成多环境任务演示视频,并提取「动作 tokens」用于训练,实现「以 AI 生成 AI 数据」的闭环。

实测表明,N1.5 模型在新环境适应、工作空间配置及复杂指令识别等场景的响应速度提升 40% 以上,尤其适合动态工业场景。

英伟达同步推出 Cosmos Reason 世界模型、开源仿真工具 Isaac Sim 5.0 及 RTX PRO 6000 工作站,形成从数据生成到部署的全链条支持。

目前波士顿动力、富士康等企业已接入该平台,加速人形机器人在制造、物流等领域的落地应用。(来源:快科技)

 

消息称任天堂 Switch 2 主芯片采用三星 8 纳米工艺,升级版有望采用 OLED 屏

5 月 20 日,据彭博社报道,知情人士透露,日本游戏巨头任天堂公司已与三星电子达成合作,委托其生产 Switch 2 游戏主机的主芯片。这一举措有助于任天堂提高这款游戏机的产量,使其在 2026 年 3 月前销量超过其预期的 2000 万台。

消息人士称,三星目前正利用其 8 纳米工艺技术,为 Switch 2 生产由英伟达设计的定制芯片。这一生产速度将足以支持任天堂在明年 3 月前出货超过 2000 万台主机,若需求进一步增加,三星也有能力继续扩大产能,不过这将取决于包括鸿海科技集团在内的硬件组装商的产能情况。

三星一直是任天堂的重要供应商,为其提供 NAND 闪存芯片和 OLED 屏幕。另一位知情人士透露,三星还推动任天堂在未来更新 Switch 2 时采用 OLED 面板。这位知情人士称,任天堂 2017 年推出的 Switch 游戏机芯片组由台积电采用其更为成熟的制程技术制造。但任天堂正转向三星,因为新设备采用的英伟达定制芯片组是针对三星的制造系统进行优化的。

另据外媒 Wccftech 援引一位熟悉三星的消息人士的话称,若未来 Switch 2 推出升级版,三星可能会从 8 纳米升级到 5 纳米工艺。(来源:IT之家)

《堡垒之夜》重返美国 App Store

5 月 21 日,热门游戏《堡垒之夜》回归美国App Store,这意味着在法庭的强大压力下,苹果终于批准了Epic Games的应用提交。这是《堡垒之夜》自 2020 年以来首次回归 iOS App Store。苹果最初并未计划允许《堡垒之夜》重返 App Store,但昨天负责监督两家公司之间持续法律纠纷的法官要求苹果和 Epic Games 应协商解决,否则将面临更多庭审。

《堡垒之夜》现在可在美国 iOS App Store 下载,也可在欧盟的 Epic Games Store 等应用商店下载。其他国家/地区的 App Store 暂不支持下载。美版《堡垒之夜》允许玩家通过 Epic Games 网站购买应用内货币,无需进行任何应用内购买。(来源:cnBeta)

赴港上市,「宁王」剑指欧洲

2025年5月20日 14:27

5 月 20 日,宁德时代正式在港交所挂牌交易,发行约 1.18 亿股 H 股,定价为每股 263 港元。对这家电池巨头而言,上市是进入下一轮全球产业布局的起点。

早年,工程师出身的曾毓群在 ATL 担任技术负责人,参与解决聚合物锂电池膨胀等关键问题。2011 年,他创立宁德时代,推动公司从消费类电池转向动力电池业务,专注于能量密度更高的电池技术路径。十四年间,宁德时代率先建立起面向整车厂的大规模定制能力和产业链协同机制,并逐步在技术、产能和成本控制上形成综合优势,成为全球新能源汽车产业链中最重要的电池供应商之一。

如今,这家以他家乡命名的中国企业已连续八年位居全球动力电池出货量第一,全球市占率达到 37.9%,也就是说,全球每三辆电动车中,就有一辆搭载宁德时代的电池。

这次赴港上市,既是宁德时代面向海外市场、强化产业链布局的战略步骤,也是其在全球新能源竞争格局中,寻求资本弹性与长期增长支撑的关键节点。

曾毓群在 2024 世界新能源汽车大会上发言丨图源:宁德时代

 

01

「宁王」赴港,募资超过 230 亿港元

 

这不是宁德时代的首次上市。2018 年 6 月,宁德时代以 25.14 元/股登陆深圳创业板,首日股价大涨近 44%,市值此后一路上扬,不到三年时间突破 1.6 万亿元,成为 A 股市场中新能源板块的代表性企业。

但在 A 股之外,宁德时代显然有更长远的布局。本次赴港上市,被外界视为其全球战略的延续与调整。相比人民币主导的 A 股融资体系,港股具备更强的国际资本通道功能,有助于支持其在欧洲等区域的本地化投资与资源配置。据《每日经济新闻》报道,宁德时代表示,此次募集资金将重点用于海外产能扩张、国际业务拓展及境外营运资金补充。

根据招股书披露,宁德时代拟发行约 1.18 亿股 H 股,发售价为每股 263 港元,募资总额约 310 亿港元。其中公开发售部分占比 7.5%,认购反应热烈,截至 5 月 17 日,公开认购金额已超过 2800 亿港元,超额认购达 120 倍。

除了公开发售部分,本次 IPO 还引入 23 家基石投资者,认购超过 7700 万股,覆盖传统能源、金融投资与主权基金等多个背景。其中,中石化(香港)与科威特投资局分别认购 1473.68 万股,各占基石认购总额的 12.5%。

近年来,中东资本对新能源领域的兴趣持续升温。根据普华永道《2024 中东投资并购趋势报告》,在「去碳化」与「经济多元化」背景下,清洁能源、储能和电动汽车正成为主权财富基金的新重点。科威特投资局作为全球最早成立的主权基金之一,此次对宁德时代的认购,也被外界视作其能源转型方向的体现。

宁德时代福建宁德基地丨图源:宁德时代  

 

02

90% 融资将投向匈牙利超级电池工厂

 

根据招股文件,宁德时代计划将本次港股募资所得的约 90% 资金用于建设位于匈牙利德布勒森(Debrecen)的电池制造基地。

欧洲 48 国,电池巨厂为何花落匈牙利?德布勒森地处匈牙利东部,是宝马新工厂所在地,奔驰与斯特兰蒂斯也在周边设有整车产线,具备一定的产业集聚基础。相比西欧国家,匈牙利具备较低的综合运营成本,且作为中东欧交通节点,可实现对德国、奥地利、斯洛伐克等制造中心的陆路高效联通。

匈牙利项目总规划产能为 100 吉瓦时,投资额约为 73 亿欧元,占地 105 余公顷,是宁德时代在海外最大规模的投资项目。

按照规划,该工厂将分三期建设,一期项目计划达到 34 吉瓦时产能,投资总额约为 27 亿欧元,预期将于 2025 年完成厂房建设及产线投产。二期工程规划产能为 38 吉瓦时,投资金额约为 21 亿欧元,目前处于前期筹建阶段,预期将于 2025 年开始建设。三期产能尚未披露细节。

宁德时代披露,该项目是公司全球化战略的核心工程,主要面向欧洲主流汽车客户提供动力电池产品,支持其电动车本地化生产计划。此外,工厂将采用宁德时代自研的智能制造系统,并针对欧洲主流车型调整电芯结构和电压平台。

匈牙利电池厂的部署,正处于欧盟推动清洁技术本地化的大背景之下。2024 年 5 月,《净零工业法案》(Net-Zero Industry Act)正式通过。该法案提出,到 2030 年,欧盟希望至少 40% 的关键清洁技术产品能在本地完成生产,以降低对外依赖。尽管这一目标不具强制约束,但为电池等核心产业的本地产能建设提供了政策指引。法案中将电池列为重点支持领域,鼓励企业在欧盟内设厂、开展合资合作与技术转移,以提升产业自主能力。

除了匈牙利项目外,宁德时代已在德国图林根建有电池工厂,未来也将在西班牙等地推进区域业务合作。

宁德时代匈牙利德布勒森基地丨图源:宁德时代

 

03

国际化背后:「宁王」的扩张挑战

 

据 IEA 数据,2024 年全球电动汽车销量同比增长 25% 至 1700 万辆,动力电池年需求首次突破 1 太瓦时(TWh)。同时,全球储能装机规模也在迅猛攀升,2024 年新增储能装机量达 205 GWh,同比增长 53%。这一系列数据表明,无论是电动车动力电池还是储能电池,市场对电池的需求正持续高速增长。作为行业龙头,宁德时代深度受益于此趋势。

此外,宁德时代在产品技术方面具有优势。一方面,「麒麟电池」等拳头产品体现了其在电池集成和能量密度上的领先地位;另一方面,公司不断推陈出新,2023 年发布的「神行」超充电池、25 年发布「Naxtra 钠离子」电池品牌。这些产品与技术创新,不仅巩固了宁德时代在高端动力电池领域的口碑,也为其打开新的市场空间。

尽管市场空间广阔,宁德时代的盈利模式正受到价格战的挑战。近年来电池行业竞争白热化,主机厂压价趋势明显。2024 年在新能源汽车终端大打价格战的背景下,宁德时代动力电池和储能电池销量分别增长 18.85% 和 34.32%,但对应营业收入却同比下滑 11.3% 和 4.4%——这意味着单位电池价格显著下降。

激烈竞争中,宁德时代甚至在 2023 年第三季度对车企客户提供了返利支持,以帮助下游降本。所幸受益于锂矿价格暴跌和成本管控加强,公司毛利率未出现大幅下降。

但不可忽视的是,一旦原材料价格回升或竞争进一步加剧,电池业务「高投入、低回报」的风险便会凸显。总体而言,电池行业的价格内卷正在侵蚀利润空间,宁德时代的盈利模式面临的潜在风险需要持续通过技术升级和成本优化来抵御价格战的冲击。

图片来源:unsplash  

宁德时代的客户生态也在发生变化。众多头部整车厂正尝试打造自有电池供应链,以降低对宁德时代的依赖。这一「去宁化」趋势已初见端倪:特斯拉的 4680 电池开始量产,蔚来也投入自研高性能电池,宝马、大众等欧美车企则扶持 Northvolt 等本土电池企业崛起。目前,宁德时代前五大客户的营收占比已从过去的 60% 降至 50%,客户更加多元分散。当整车厂有了替代选择,宁德时代在合同谈判中的地位难免下滑,被迫以更具竞争力的价格和服务来留住订单。

国际化扩张是宁德时代应对这些挑战的重要一步,而本次 H 股上市正是宁德时代欧洲战略的一部分,但在国际化扩张道路上,公司同样面临诸多外部不确定性。

一方面,全球贸易保护和地缘政治博弈加剧,随着欧美出台《通胀削减法案》《新电池法案》,对电池产品的产地、原材料来源设限,中国企业面临更高的准入门槛和合规成本,迫使宁德时代加快推动本地化生产以满足监管要求。地缘政治的不稳定性令一些合作蒙上阴影。此前宁德时代与福特拟在美合建电池工厂,就因政策原因而改为技术授权输出,在美直接投资受挫。

尽管宁德时代努力通过「技术换市场」等策略来融入本地产业链,以专利和合作绑定海外伙伴从而降低贸易摩擦风险,但总体而言,国际市场的政策多变和地缘博弈成为横亘在宁德时代继续高速扩张道路上的一大变量。

曾毓群曾提出,宁德时代「不希望被定义为电池制造商,而要成为新能源产业的开拓者」。这句话的背后隐含着对单一制造盈利模式可持续性的警觉。展望未来,宁德时代的扩张逻辑能否持续,一大关键在于其利润获取能力能否与庞大的产业体量相匹配。

在机遇与挑战并存的当下,这家电池巨头能否在体量和利润之间找到新的平衡点,仍有待时间检验。

图片来源:unsplash

为什么 Qwen3,让我看到了 AI 应用落地的重大利好

2025年5月20日 13:41

各位有没有发现,最近大家对大模型已经有些看麻了?反正我是看到相关话题的文章流量、社交平台上的热度,对模型的关注度明显有点降下来了。

比如最近 Qwen3、Gemini2.5、GPT-4.1 和 Grok-3 等这么密集的有明显新进展的优秀模型发布,要是放到 2 年前,铁定是个炸裂的一个月。

不过当我在开发者群体里问了一圈后,发现大家实际的情况倒不是「麻了」,而是把「旁观的兴奋」变成了「行动上的提速」,开发者们对模型开始从「看」到「干」,已经转变了关注视角——模型的能力进步之外,是不是一个可以对自己所做的事情带来能力明显提升,或者说这个模型和开发者的「对齐」到底怎么样,开始整了一个重要视角。

比如 Qwen3 发之前身边的很多创业者和开发者就都知道 Qwen 团队在憋大招,不仅提早一个多月就在「蹲守」,而且也在第一时间就把他们手中正在开发的 AI 应用背后的模型切到了 Qwen3。最近跟他们聊起模型层面的新变化,发现 Qwen3 被提及的越来越多。

在他们看来,像过去两年那样只是看模型跑分来评价模型性能已经没有太大意义,因为随着模型能力的继续提升有了明确路径——预训练+后训练+强化学习,很多评测基准评估的比如像代码、写作等单项能力各家都会拉平,更重要的是它已经不能反映现实环境中实际使用模型的场景,尤其是今年按下了 AI Agent 应用的加速键后。

从这个角度看,Qwen3 在模型基础能力的提升之外,其实是向开发者层面的真实需求和场景做了大量「对齐」,可以说是专为开发者和企业易于采用来设计和打磨的。

举个例子,Qwen3 整体的一个优化目标就是以更低的成本实现强劲的性能,让开发者更容易能用起来、用得好,在这背后 Qwen3 其实做了大量目标拆解和技术实现,比如之前最受企业欢迎的 Qwen 模型尺寸其实是 72B,但在收到开发者反馈,说 72B 需要两张 H800 才能跑、不方便时,Qwen 团队探索了现在更高效的 32B,开发者也用得更好了。

Qwen3 的这条路径其实很有启发意义,通过在实际场景里向开发者做「对齐」来持续优化,Qwen3 也正在成为企业和开发者的「AI 应用落地最优解」。有了这样的预期,顺着模型的持续、全面迭代,水涨船高地做 AI 应用也成为开发者和企业在今年最确定的事。

 

01

 

如何向开发者「对齐」

其实最近 OpenAI 研究员姚顺雨(Deep Research、Operator 核心作者)在「AI 的下半场」一文中完整地聊过模型层面的变化,在创业者和开发者圈层也引起了可以说今年以来最广泛的共鸣。

在他看来,随着强化学习终于找到了可以泛化的路径,不再只是在特定领域奏效,比如打败人类棋手的 AlphaGo,而是可以做到在软件工程、创意写作、IMO 级别的数学、鼠标和键盘操作等等各方面都做到接近人类竞赛的水平。

这种情况下,比拼榜单分数、在更复杂的榜单上得更高的分数会更容易。换言之,这种评价方式已经过时了,现在比拼的是定义问题的能力。

从这个角度看模型,也才是 Qwen3 真正的含金量。因为基准评测里模型能力都很强,但一个评测基准里名列前茅的模型,对开发者来说却不一定是最优。

在这种情况下,开发者在实际场景中对模型更看重的东西是什么?

大的维度上,大概是模型性能、成本、易部署等几个角度。但在具体的场景里,就是不同的模型及其工具的技术实现方式了。这也是为什么 Qwen 一直采取全尺寸、全模态的智能上限探索,也会发布不同量化精度的模型版本让开发者在选择上有更大的自由度。

一位开发者帮我拆解了下,他说 Qwen3 系列有 8 个模型,包括两款 MoE(混合专家)模型和六个稠密模型,可以服务不同场景的不同需求。

在稠密模型当中,0.6B 和 1.7B 模型特别适合研究人员使用,它甚至可以在没有 GPU、没有独立显卡的情况下就可以跑起来验证一些数据集,做一些数据配比工作。

4B 和 8B 的模型则适合消费电子和汽车行业,因为这两个模型适合入端;4B 模型适合手机,8B 模型可以放在 AIPC 和智能座舱里面。

32B 的模型则在企业大规模部署上广受欢迎。另外对于 MoE 的两个模型,可以直接通过服务器做规模化部署,提高利用效率的同时、可以应用在更大规模的场景。

他觉得这么做是对的,因为只有像这样考虑到最多的细分需求组合,才能争取让各个场景里做不同产品的开发者都能有一个拿来就用的最佳实践模型,哪怕后续还需要开发者自己 DIY。

这次 Qwen3 在这个方向也作了进一步延伸,作为国内首个混合推理模型,将快速、简洁响应的快思考和更深层思维链推理能力整合于单一模型中,实现了推理模型和非推理模型的统一,开发者甚至可以自选「思考预算」来适配多样化任务需求。

企业场景里,基本上都会基于开源模型,结合自己的数据做一些微调。就像 Qwen3 这次的模型升级支持了 119 种语言,在日本市场虽然 Qwen3 才发布半个月,但已经比 Claude、GPT-4o 等模型还要更受欢迎,因为企业在开源的 Qwen3 基础上灌一些日语场景数据,这个效果就比单纯支持日语的闭源模型更灵活,可以实现四两拨千斤的效果。

当然这些之外,开发者对 Qwen 的态度,很大程度上还是来自于他们说的最多的一点——底模好。

底模好,意味着在基座模型上做蒸馏、微调后训练、强化学习等等都会有更好的效果。尤其是强化学习的 Scaling Law 更需要有一个优质的预训练模型,这是模型能够泛化的决定性因素之一。印象里,就连 DeepSeek-R1 那篇论文里展示的蒸馏小模型,也选了 Qwen 作为底模,通过利用 DeepSeek-R1 生成的推理数据,对 Qwen-7B 基础模型进行微调,将 DeepSeek-R1 的推理能力通过知识蒸馏的方式传递给 Qwen-7B,模型性能很好。

极客公园团队的同学和阿里云通义大模型业务总经理徐栋专门探讨过开发者体感上的底模好,到底意味着什么?怎么做到的?

徐栋认为每次模型能力的提升一定会体现在两点上,知识密度和指令遵循上。这使得过去的一些做不到、或者成功率低、需要抽卡的 AI 应用场景里,模型更「听话」了。Qwen3 就通过数据工程和算法迭代,进一步提升了在知识密度和指令遵循上的表现。

现在 Qwen3 可以在数据挖掘的任务上,依赖模型强大的知识密度与 SFT 阶段精细化训练,从 600 页招投标文档中精准抽取 88 个字段;在舆情监测场景,Qwen3 可以将消费者评价抽象为「小型车辆」「轿车」等标准化标签,避免过度拟合或笼统概括;在更常见的智能客服场景,Qwen3 可以精准捕捉用户需求、引导商品推荐时机,降低客户流失率。

随着今年整个行业开始跑步进入 Agent 领域,Qwen3 这次也非常及时地提高了 Agent 场景对模型提出的能力需求,优化了 Agent 工具调用和代码能力,同时也加强了对 MCP 的支持。结合封装了工具调用模板和工具调用解析器的 Qwen-Agent 框架,大大降低了编码复杂性,手机及电脑 Agent 操作等任务都开始变得更可行了。

这个优化还在继续,上周在 QwenChat 的官方网页上,我们还看到了 Deep Research(深度研究)和 WebDev(生成网页)这两个功能上线。这些是基于 Qwen 的 Agent 框架实现的。Qwen3 支持 agent 调用工具、也原生支持 MCP 协议,在对工具调用能力的 BFCL 评测中是顶尖模型里表现最好的。

Qwen3 的 Agent 增强能力,也在各行各业的客户场景中发挥作用。比如联想百应智能体平台在 Qwen3 发布后,马上就把他们平台背后的大模型引擎切过去。作为 IT 解决方案,百应平台利用 Qwen3 开源和对 agent 工具调用、MCP 支持的特点,再加上更强的推理能力,升级了 IT 运维(AI 服务)、AI 办公、AI 营销等场景方案,让中小企业在 AI 时代可以自己 DIY 垂直场景中的各种 Agent,实现了从提供生产工具到直接输送「数字员工」生产力的跃迁,进一步实现降本增效。

围绕开发者场景做模型的进一步迭代,向开发者做对齐,其实也是最近大模型厂商需要进行的集体转向。

前段时间 OpenAI GPT-4.1 核心研究员 Michelle Pokrass 也指出,有时候为了优化基准测试而调整模型,结果看起来不错,实际使用却发现一些问题,比如模型不遵循指令、格式怪异,或者上下文太短。这些反馈才确定了哪些评估指标是客户真正需要重点优化的。在她看来,GPT 4.1 的目标是让开发者在使用时感到愉快。GPT-5 现在的优化目标是让模型自己能分清楚什么时候开启聊天、什么时候开启深度思考,减少 OpenAI 模型供给带给开发者的复杂和浪费问题。

中美优秀模型开始有这样的共识,开始有意识地有了向开发者「对齐」,所以接下来的 AI 价值落地绝对是个利好。

 

02

 

「无脑入」之前破解下阿里的 COT(思维链)

跟用 Qwen 的开发者逐渐交流的过程,你会发现 Qwen 竟然开始有了粉丝效应一样的信任。这个信任其实根本上是来自于长期「情绪稳定」的成长。

你会发现 Qwen 一个月一更新,甚至 Qwen3 发布半个月,Qwen 家族就又更新了好几个模型了,这比 Llama 开起来「更勤奋」。

我记得 Hugging Face 中国区负责人王铁震总结他在 Hugging Face 开源社区上看到的 Qwen 为什么受欢迎的原因是,「量大管饱、更新快、底模好」,这份确定性让开发者确信持续会有最新最好最快的模型在手。

这个现象还挺有意思,AI 应用至少是下一个十年里相对长期和复杂的建设,确信有一个持续投入的模型,这件事太重要了。我们都说要水涨船高地做 AI 应用,AI 应用的开发者一定会希望水流量大、水涨得快、水源源不断,才能更安心地做应用。

想必这也是为什么 Qwen 会成为全球拥有最多衍生模型的开源模型,建立了自己的全球影响力。估计也是看到了 Llama 虽然坚持开源,但更新速度和性能距离同时期的闭源模型有差距。Qwen 如果可以一直坚持持续、快速给大家发最好的「枪」,持续开源全模态、全尺寸的 SOTA 模型,那这个开源旗帜就应该是 Qwen 扛起来。

所有的「如果」背后都必须有逻辑链的支撑。那么,阿里是不是会支持 Qwen 坚决地持续、全面开源 SOTA 模型这件事,就必须看一下阿里自己的 COT 是否和这个期待是相符的。

此前我写的分析阿里 AI 战略的文章梳理过,出于阿里巴巴自身的场景,一定会持续探索智能的上限。AI 时代,阿里「让天下没有难做的生意」的延长线,必然还是要为千行百业的 AI 创新和转型提供基础设施。这意味着,从算力到模型再到应用的每一层平台型机会——阿里云、Qwen 模型家族及其开源生态、应用平台都需要持续进化。其中最主要的目标,一定是追求 AGI 的实现,以此来突破现有业务的 AI 转型升级和 AI 原生应用。

而且,不同于比如背靠 Meta 的 Llama,阿里即便把研发成本高昂的 SOTA 模型开源,也可以通过阿里云实现业务闭环,作为亚太最大的云厂商,这是阿里坚决开源的底气。极客公园社区的很多创业者和开发者都跟我分享,别看开源模型好像不赚钱,只图技术品牌,但其实,Qwen 系列开源模型给阿里云带来了实实在在的收入增长,可以说是过去一年多阿里云最好的销售。选择了 Qwen 开源模型,一个很自然的选择就是购买阿里云,因为使用整个通义以及通义的衍生模型,在阿里云上面运行效率最好。

「阿里云是全世界唯一一家积极研发基础大模型并全方位开源、全方位贡献的云计算厂商」这句话阿里云说的其实体现了他们的目标。

因为 MaaS 已经成为阿里云的商业模式中非常重要的组成部分。从阿里云过往 7 个季度的增长看,使用通义 API 的客户,会带动相当多其他云产品的使用,这是非常明显的客户关联销售的效果。对阿里而言,无论未来模型能力和 AI 应用如何演进,AI 和云计算基础设施都有非常明确的商业模式——云计算网络。

Qwen 持续开源 SOTA,不仅和开发者、客户的利益是一致的,与生态上下游的利益也是一致的。这也是为什么 Qwen3 发布的第一天,非常多的终端和芯片企业宣布支持了 Qwen3 的模型,包括像英伟达,联发科和 AMD。某种程度上,开源的最大的朋友就是英伟达和服务器厂商,有了最好的开源模型,他们可以卖一体机、卖更多的 GPU。

可见只有促进了所有的生态上下游的繁荣,Qwen 本身的价值才可以在阿里更大的业务闭环里得到价值闭环。这个逻辑下,Qwen 必然「不用扬鞭自奋蹄」要扛起开源 SOTA 大旗,这是个让人看起来更安心的逻辑链。

终于有了让开发者「无脑入」、无风险、「薅羊毛」无压力,让开源模型可以成为商业世界可以稳定预期的一种技术基础,这非常重要。也是 AI 应用价值落地开始提速的重大利好。

罗永浩合作百度电商,523 正式开播;华为发布 23999 折叠屏鸿蒙电脑;小米 SUV 后天亮相

2025年5月20日 08:48

微软开发者大会开幕,AI Agent 成最大焦点

当地时间 5 月 19 日,微软一年一度的 Build 2025 开发者大会在西雅图拉开帷幕,「Agent」几乎贯穿每一项发布。

在去年的大会上,微软曾经打出 Copilot 副驾驶「无处不在」的概念——在操作系统、Office 应用、开发者工作流程等中集成 AI 助手。如今,GitHub Copilot 从曾经的代码助手变成 Agent 伙伴,从「结对编程」演变为「同伴编程」,开发者可以将问题分配给 Copilot 进行错误修复、新功能开发或代码维护,它将自主完成这些任务。

在 Windows 平台,微软推出了 Windows AI Foundry ,借助用简单模型 API,开发者可以通过 Foundry Local 管理和运行开源 LLM,或将专有模型迁移到客户端和云端进行转换、微调和部署。

此外,微软还推出了 Microsoft 365 Copilot Tuning,用户可利用自身企业数据、工作流程和业务逻辑,以简洁的低代码方式轻松训练模型并创建智能体。(来源:极客公园)

美国将审查 Apple 与阿里的 AI 合作

今日,根据《纽约时报》报道,美国白宫及国会官员在过去数个月来一直审查苹果与阿里巴巴的 AI 合作计划,因苹果希望将人工智能 Apple Intelligence 引入中国,而阿里巴巴是合作伙伴之一。

报道称,美国当局担心此次合作会协助中国公司提升 AI 能力,扩大中国聊天机械人的影响力,并加深苹果在北京审查及数据共享上的法律风险敞口。白宫及众议院中国问题特别委员会已经直接向苹果高层提出对今次合作的关注,并查问合作的条款、苹果将与阿里巴巴分享哪些数据,以及是否会与中国监管机构签署任何法律承诺。

消息人士称,美国政府已经在讨论是否应将阿里巴巴及其他中国 AI 公司列入禁止与美国公司开展业务的名单当中。(来源:新浪财经)

 

英伟达新总部落地中国台湾,计划 7 月开源物理引擎「牛顿」

5 月 19 日,在台北电脑展开幕的演讲中,英伟达 CEO 黄仁勋宣布了一条重磅消息:将在中国台湾省的台北市,建设一座新的公司总部!黄仁勋将这个新的总部命名为「NVIDIA Constellation」,也就是星座的意思。

从效果图上看,建筑风格和 NVIDIA 全球总部如出一辙,充满了科技感和科幻色彩。不过,黄仁勋并未披露它的建筑规模、入驻员工数、建成时间等。

此外,黄仁勋在演讲中提到,在物理世界中制造机器人「不切实际」,必须在遵循物理定律的虚拟世界中训练它们。他表示,英伟达与 DeepMind 和 Disney Research 研究合作开发了「全球最先进的物理引擎 Newton」,并计划于七月开源。

Newton 完全支持 GPU 加速,具有高度可微性和超实时操作能力,能够通过经验实现有效学习。其正在将该物理引擎整合进 Nvidia 的 ISAAC 模拟器,这一整合能够以真实的方式让这些机器人「活」起来。(来源:快科技、财联社)

 

小米首款 SUV 本周将亮相

5 月 19 日,小米创始人雷军在社交账号上官宣,小米 15 周年战略新品发布会定档 5 月 22 日晚 7 点。

这次重磅新品很多,包括手机 SoC 芯片小米玄戒 O1、小米 15S Pro、小米平板 7 Ultra、小米首款 SUV 小米 YU7 等。

目前小米 15S Pro 的跑分已经被曝光,首发搭载小米玄戒 O1。从目前的跑分成绩看(单核 3119 分,多核 9673 分,OpenCL 最高 22141 分),小米玄戒 O1 这次的新起点非常高,直接与天玑 9400 和骁龙 8 至尊版几乎同一起跑线。

小米平板 7 Ultra 则是一款 14 英寸的大尺寸平板电脑,有望同步首发搭载玄戒 O1,支持 120W 有线闪充。

小米 YU7 作为小米第一款 SUV 车型,早在去年就已现身工信部,小米曾预告 YU7 会在今年 6-7 月正式上市。(来源:快科技)

 

零跑 Q1 财报:营收上百亿,毛利率 14.9% 创新高

5 月 19 日晚间,零跑汽车发布 2025 年一季度财报。

报告期内,零跑汽车销量为 87552 辆,同比增长达 162%;营收达 100.2 亿元,同比增长 187.1%;毛利率达 14.9%,创历史新高。从净利润看,一季度亏损 1.3 亿元,较上年同期亏损 11.3 亿元大幅收窄;环比则由盈转亏。

零跑汽车称,一季度毛利同比改善主要由于销量上升带来的规模效应,持续进行的成本管理工作和产品组合的优化;环比改善的主要原因系战略合作带来的毛利增长。截至今年 4 月 9 日,零跑汽车已经达成累计交付超 70 万辆的里程碑。此外,公司称环比亏损增加的主要原因是毛利总额的下降大于费用开支的下降。

Wind 数据显示,今年以来零跑汽车股价涨幅已达 91.90%,公司总市值 832 亿港元。(来源:第一财经)

传英伟达计划投资量子计算独角兽

据科技媒体 Information 周日报道,英伟达正处于与量子计算初创公司 PsiQuantum 的高级投资谈判阶段。据参与此次交易的四位人士透露,此次谈判正值 PsiQuantum 在一轮融资中筹集至少 7.5 亿美元之际。

另据此前报道,PsiQuantum 正寻求以 60 亿美元的投前估值筹集资金,贝莱德预计将领投这轮融资。英伟达的参与此前并未被披露。

这一动作与英伟达 CEO 黄仁勋今年早些时候对量子计算前景的谨慎表态形成鲜明对比。今年 1 月,黄仁勋曾表示量子计算可能需要 20 年才能成为实用技术,但此后明显调整了立场。有媒体把英伟达对量子计算的关注形容为正在「押注下一个技术浪潮」。(来源:华尔街见闻)

 

零一万物确认联合创始人谷雪梅离职

5 月 19 日,零一万物确认联合创始人谷雪梅已于数月前离职,正在筹备创业。谷雪梅在零一万物期间主要负责模型预训练和 C 端产品。

零一万物自去年第四季度起调整业务,战略重心转向轻量化模型训练、微调和落地。公司 COO 黄蕙雯曾表示,不再做超大参数规模基座模型,而是关注 AI 的市场应用。

2025 年开年至今,零一万物的整体收入已超去年全年。(来源:每经网)

 

罗永浩宣布与百度电商战略合作,5 月 23 日晚首播

5 月 19 日晚间,罗永浩宣布与百度优选开启战略合作,将于 5 月 23 日晚 8 点开启首场直播。这是其继抖音、淘宝后,首次选择以 AI 技术为核心的新兴电商平台。据罗永浩所属机构「交个朋友」透露,此次合作源于双方对 AI 技术驱动电商变革的共识。

百度电商方面表示,双方将以 AI 技术为纽带,一方面通过罗永浩的选品能力为用户带来优质供给,另一方面借助百度的智能电商布局更多商家,推动直播电商向智能化、高效化升级。(来源:新浪科技)

鸿蒙电脑开售:7999 起,折叠屏 23999 元

5 月 19 日,华为正式发布两款鸿蒙电脑:售价 7999 元起的 HUAWEI MateBook Pro,以及首款鸿蒙折叠电脑、售价 23999 元起的 HUAWEI MateBook Fold 非凡大师,两款产品均搭载 HarmonyOS 5 系统,而非 Windows。

HUAWEI MateBook Fold 非凡大师是目前屏幕尺寸最大的商用折叠电脑,达到 18 英寸,整机重量 1.16kg,折叠后小于 13 英寸。屏幕全面展开时,可进行沉浸式文档处理或观看高清视频。屏幕折叠时则为传统笔记本形态,可通过配套键盘或虚拟键盘进行输入。

HUAWEI MateBook Pro 的定位则更偏向大众市场。整机重量为 970 克,厚度 13.5 毫米,被称为是华为史上续航时间最长的 PC(个人电脑)产品,官方称连续使用时长可达 10.2 小时。

余承东介绍,鸿蒙电脑实现了 AI 能力与底层硬件、操作系统、软件应用的融合,支持一句话完成 PPT 创作、从全盘文档中摘取信息并总结、自动生成会议纪要、一键进行电脑设置等 AI 功能。(来源:界面新闻)

 

新款蔚来 ET5T 内饰曝光:横向中控屏+配置 HUD

日前,新款蔚来 ET5T 的内饰实车图在网上曝光,新车将于 5 月 25 日正式上市。

从曝光的图片来看,最显著的变化是中控屏幕由竖屏改为 15.6 英寸的横向布局,这一改动与新款蔚来 ES6 保持一致。同时,新车还配备了全新样式的三辐式平底方向盘,其多功能按键布局和控制方式经过重新设计。并引入了怀挡式换挡机。

在副仪表台的设计上,新款蔚来 ET5T 也进行了调整。上层新增了双手机无线充电面板,并配备了 3 个物理按键。杯架布局也由纵置改为横置隐藏式设计,整体空间利用更为合理。

配置方面,新款蔚来 ET5T 将搭载与蔚来 ET9 相同的 NT.Cedar 雪松车机系统以及 NOMI 3.0 智能语音助手,并配备 W-HUD 抬头显示系统。此外,车辆还将搭载蔚来自研的神玑 NX9031 驾驶辅助芯片。(来源:IT 之家)

苹果考虑将 Apple Intelligence 品牌和 Siri 分离

近日,知名科技记者古尔曼发文揭示了苹果公司在 AI 领域落后的种种原因以及面临的多重挑战。

据古尔曼报道,预计在即将举行的苹果 2025 年全球开发者大会(WWDC 2025)上,苹果不会重点介绍 Siri 的重大升级。包括去年承诺但已延期的功能,可能仍需数月时间才能发布。

为了避免 AI 给其智能手机「拖后腿」,苹果也在不断进行内部调整,包括解散集中式 AI 团队,将 AI 人才分散到不同部门,以促进 AI 技术在各产品线的整合;加强 AI 隐私保护:通过「私有云计算」平台,确保 AI 模型的运行符合用户隐私和数据安全的要求。

同时,苹果计划在其他应用中添加更多的 Apple Intelligence 功能,例如添加一个由 AI 驱动的电池优化工具,推出虚拟健康教练 Project Mulberry 等。

有苹果消息人士表示,尽管对 LLM Siri 充满希望,但该公司也在准备将 Apple Intelligence 品牌与 Siri 分离开来。这也意味着,苹果不希望 Siri 的糟糕表现影响到 Apple Intelligence 的口碑。(来源:界面新闻)

微软大会拉来 Altman、马斯克,纳德拉的 AI Agent 野心藏不住了

2025年5月20日 07:21

微软的 AI 叙事,今年全面走向 AI Agent。

当地时间 5 月 19 日,微软一年一度的 Build 2025 开发者大会在西雅图拉开帷幕,「Agent」简直成了焦点,几乎贯穿每一项发布。

微软 CEO 纳德拉站在会场中心,还提出了一个变革性愿景:让更多的应用程序由智能体驱动,打造一个「Open Agentic Web(开放智能体网络)」

与此同时值得玩味的是,近年彼此有龃龉的 Sam Altman 和伊隆・马斯克都出现在大会连线屏幕上,与微软 CEO 纳德拉各自单独对话。与前两年不同,Sam Altman 今年并没有现场出席,甚至没有什么笑容,坊间不少传言称微软与 OpenAI 之间存在算力、模型访问等问题分歧。

微软已经官宣,除了 OpenAI 的模型,微软的 Azure AI Foundry 平台也将托管马斯克旗下 xAI 公司开发的 Grok AI 模型。

从云服务到生产力软件,再到搜索,甚至游戏,微软已经将 AI 融入几乎所有产品,根据公司最新季度财报,微软旗下 Azure 的积压订单有数千亿美元,包括与 OpenAI 本身签订的多年期云容量合同,预示着未来 AI 密集型交易的收入。

而 AI Agent,甚至是一个庞大的 Agent 智能体网络只会继续增强微软的 AI 叙事。

 

01

支持 MCP,更强的编程 AI Agent

 

在去年的大会上,微软曾经打出 Copilot 副驾驶「无处不在」的概念——在操作系统、Office 应用、开发者工作流程等中集成 AI 助手。

如今,连开发者工作流程里的 GitHub Copilot 也将要变得更加「Agentic(智能体化)」,不再仅仅只是个「副驾驶」。

微软曾在 2018 年以 75 亿美元收购 GitHub,此后 GitHub 继续以独立实体形式运营。在 GitHub 的 1.5 亿开发者里,根据纳德拉的说法,目前已经有超过 1500 万开发者在用 GitHub Copilot。

纳德拉在大会上演示,GitHub Copilot 从曾经的代码助手变成 Agent 伙伴,可以直接帮开发者修 Bug。

纳德拉现场用 Coding agent debug|图片来源:微软

根据纳德拉的说法,这意味,GitHub Copilot 正从「结对编程」演变为「同伴编程」,开发者可以将问题分配给 Copilot 进行错误修复、新功能开发或代码维护,它将自主完成这些任务。

例如,大会一个演示展示了 Copilot 拾取问题以向微软的某个网站页面添加过滤器、创建分支、设置 GitHub Actions,以及提交草稿,拉取请求等,Agent 在其自己的分支中工作并遵守安全措施。这使得开发者能够有效地委派软件工程开发任务。

微软正在提供对模型上下文协议(MCP)的全面支持,微软和 GitHub 方面已经加入了 MCP 相关委员会,以帮助推进 MCP 的大规模采用

另外,微软正在推出一个名为 NLWeb 的开放项目,称其「在智能体网络中可以发挥与 HTML 类似的作用」,使网站能够轻松地为用户提供对话界面,并根据用户选择的模型和自身数据,让用户能够以各种语义方式直接与网页内容交互。每个 NLWeb 端点同时也是一个 MCP 服务器,因此网站可以选择是否让它的内容更易于被 AI 智能体发现和访问。

 

02

微软的 Agent 大工厂

 

微软做 Agent 的野心当然不只是 GitHub 上的一个 Coding Agent,该巨头正在跨平台提供开发 AI Agent 的能力。

在 Windows 平台,微软推出了 Windows AI Foundry ,借助用简单模型 API,开发者可以通过 Foundry Local 管理和运行开源 LLM,或将专有模型迁移到客户端和云端进行转换、微调和部署。

Windows AI Foundry 支持跨各种硬件(包括 CPU、GPU 和 NPU)的开发,使应用程序能够在不同的芯片上运行。Windows 也添加了对 MCP 的原生支持。

Windows 也添加了对 MCP 的支持|图片来源:微软

大会上的一个演示展示了 VS Code 中的 Agent 如何利用 MCP 和 WSL 设置 Linux 环境,并仅用几句话就基于 Figma 设计构建/更新网站项目。此外,应社区的长期要求,Windows Subsystem for Linux(WSL)将完全开源。

通过 VS Code、GitHub Copilot 和 WSL,纳德拉直言要将 Windows 增强为「Agentic Web 开发的首要平台」。

与此同时,在 Azure 云,微软的统一平台 Azure AI Foundry 目前加入了更多模型,并且发布了 Foundry 智能体服务(Agent Service),开发者可以在上面设计、定制和管理 AI 应用程序和 Agent。

纳德拉介绍 Azure AI Foundry|图片来源:微软

随着 Azure AI Foundry 智能体服务的正式发布,开发者能够协调多个专用 Agent 来处理复杂任务,包括将 Semantic Kernel 和 AutoGen 集成到一个面向开发者的 SDK 中,并支持 A2A 协议和模型上下文协议(MCP)。

当然,开发者社区仍弥漫着谨慎的气息。为了推 AI agent,微软团队做了一个「可观察性」功能,通过统一仪表板集成、观测并追踪性能、质量、成本和安全等关键指标。

在 Agent 安全方面,微软宣布推出「Entra Agent ID」,这是一种身份管理系统,赋予每个 Agent 专属的身份、权限、策略和访问控制,开发者创建的 Agent 将自动在 Entra 目录中分配唯一标识,确保 AI agent 仅访问授权数据,避免因「智能体泛滥」而导致的盲区风险。

在模型支持方面,纳德拉在大会上官宣了将马斯克 xAI 的 Grok 系列模型引入微软的生态系统,截止目前,微软有 1900 多个合作伙伴托管和微软托管的 AI 模型。纳德拉还强调,微软已经建立了与 AI 模型开源社区 Hugging Face 的合作。

纳德拉与马斯克对话|图片来源:微软

另外,微软设了个模型排行榜,主要对不同类别和任务中表现最佳的 AI 模型进行排名;以及模型路由器(Model Router),实时为特定查询或任务选择最佳模型。

 

03

一键创建 AI Agent

 

除了给开发者提供利用、开发 AI Agent 的能力,微软在企业、消费者生产软件上也在加码「Agentic(智能体化)」。

此前,微软已经在其许多软件产品中推出 AI Copilot,旗舰产品就是 Microsoft 365 Copilot,多个 Office 应用程序(如 Word、Excel、PowerPoint、Outlook、Teams)都集成了 Copilot。

在 Build 2025 大会上,微软推出了 Microsoft 365 Copilot Tuning,简单来说,就是用户可利用自身企业数据、工作流程和业务逻辑,以简洁的低代码方式轻松训练模型并创建智能体。

这些 Agent 可以在 Microsoft 365 服务边界内执行特定领域的任务。例如,律师事务所可以创建一个 Agent,生成符合其专业特性和风格的文书。

Microsoft 365 内可创建 AI Agent|图片来源:微软

更进一步地,微软还在 Copilot Studio 中增加了「multi-agent orchestration(多智能体编排功能)」,可以连接多个 Agent,使他们能够整合技能,处理更广泛、更复杂的任务。

在前不久的季度财报会议上,微软称,有 20 多万个组织在用 Copilot Studio 开发定制 AI 应用程序,本季度创建了超过 100 万个定制 Copilot/智能体,据称这仅是产品预览阶段的数据。

另外,不管是微软还是谷歌,科学研究是科技巨头关注的重要 AI 应用场景。在 Build 大会上,微软宣布推出 Microsoft Discovery,它建立在基于图形的知识引擎 Graph RAG 之上,主要让科研人员能利用 AI agent 推进发现流程。Discovery 支持三步流程:基于知识的推理、生成假设和运行实验,所有这些都以迭代循环的方式进行。

微软推出 Microsoft Discovery|图片来源:微软

据称,斯坦福医疗中心(Stanford Health Care)正在使用微软的医疗智能体协调器开发测试 AI Agent,以减轻行政负担和加快肿瘤委员会会议的准备流程。

 

04

驶向「Agentic Web」

 

微软 CEO 纳德拉将当下视为重大平台变革的「中期阶段」,并让他联想到类似于 Windows 32、Web 堆栈以及云计算和移动革命带来的变革,而这一次,开放的 Agentic Web 可能就是下一个互联网的未来。

「2025 年,我们将大规模构建这个 Open Agentic Web(开放智能体网络)。我们将从几个垂直集成堆栈的应用程序,发展成为一个能够支持这个开放可扩展智能体网络的平台。」纳德拉在会上称。

纳德拉介绍开放智能体网络的愿景|图片来源:微软

根据其说法,开发者仍将是核心,微软的角色是为他们提供构建下一代 AI 应用程序和 Agent 所需的工具、平台和基础设施。平台转型的成功最终取决于开发者社区的创造力。

「赢家将是像你们一样构建应用程序的人,而不仅仅是像我们一样创建平台的人。」纳德拉声称。

当然,最终结果如何,还得看纳德拉演讲后的现实。一些已发布的功能可能会以预览版或测试版的形式发布,这些功能的实际效果也值得商榷。

一半海水一半火焰,全面 Agent 化也会对个人隐私、就业等产生影响。尽管微软最新季度财报业绩好于预期,甚至对未来有乐观预测,微软最近还是裁员 6000 人,其中不乏程序员。

今年 4 月,微软 CEO 纳德拉在与 Meta CEO 扎克伯克的对话中曾经透露,微软公司代码库里 20% 至 30% 的代码是由 AI 写的。微软 CTO Kevin Scott 此前还预计,到 2030 年 95% 的代码将由 AI 生成。另一边,谷歌 CEO Sundar Pichai 也曾称,AI 生成了谷歌超过 30% 的代码。

然而无论赢家到底是谁,微软对 AI 的投入是确定的。该巨头正在大力投资数据中心,过去三个月,就在各个国家和大洲开设了 10 个数据中心,并计划在 2025 财年继续投入 800 亿美元来扩展云基础设施。

一个庞大的「Agentic Web」,无疑能让微软的 AI 叙事更具诱惑力。

 

*头图来源:微软
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

中国 AI 大厂,被 Deepseek 掀了牌桌之后

2025年5月19日 19:47

 

过去几个月,尤其是2025年一季度,国内大厂在AI大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少了许多。对比去年同期,大厂几乎是轮番上阵、接连发布新成果,而今年则低调了不少,声音变得谨慎,动作也更克制。

这种转变,多少跟DeepSeek-R1在春节期间的发布有关,这个模型以开源、低价、高性能的组合,打破了“大模型=高投入、高门槛”的行业共识,也撬动了模型产业的权力结构。

它不仅刷新了开发者对开源模型的认知,也动摇了此前被大厂视为护城河的“重资产”范式。一时间,硅谷科技股应声回调,千亿美元研发投入的必要性也被重新审视。

而在国内,这场“技术地震”最先震动的,其实正是那些原本被认为应该在AI战役中冲在最前的大厂们。一边是像 DeepSeek、Manus 这样的新玩家用“小而强”“快而灵”的策略不断迭代突破,另一边却是大厂在产品落地、组织架构、技术方向上的多次调整与迟疑。

新玩家冲击的,不只是模型性能或训练成本,更是许多建立在历史经验基础上的路径依赖——比如“只有闭环才有护城河”“只有高预算才能出好模型”“只有通用大一统才是正确方向”。

越来越多的事实正在指向同一个结论:在 AI 快速演进的浪潮中,任何僵化的范式认知,都可能成为创新的绊脚石。

今天的大厂,正在面临一次理念上的转向:不再追求“我的模型服务我的应用”的闭环逻辑,而是回到“用最合适的模型,构建最好的产品”这一产品主义原点。

一系列深层次的战略重构,正在中国互联网大厂里悄然发生。

 

1 Deepseek-R1出现前,大厂鏖战大模型赛道,各自押注不同

 

回头看 2023 年,国产大模型赛道迅速升温,几乎所有有技术储备或生态优势的公司都在投入资源,试图在百模大战中找到自己的突破口。

 

彼时,百度、字节、腾讯等大厂纷纷亮出自研模型,“自研闭环”几乎成为主流打法(阿里则探索开源较早),强调的是“模型要自主可控,生态要自给自足”,从底层模型到应用产品都要打通。

 

在这样的背景下,百度主打“模型+搜索”路径,字节力推豆包,阿里对通义千问团队进行拆分以优化资源配置,腾讯则相对谨慎地投入“混元”大模型,整体更强调“应用场景驱动”,小厂中也出现了面壁、智谱、百川、月之暗面等一批专注通用大模型训练的“AI 六小龙”,试图在技术路线或创新方向上突围。

图片来源:视觉中国

 

彼时大家的竞争逻辑还建立在几个假设之上:1)自研能力越强越有护城河;2)参数量和能力相关,性能靠堆大模型赢;3)需要构建一个“自我可控”的模型+应用闭环。

 

但这些共识在 DeepSeek-R1发布之后被彻底打破。2025 年 1 月 DeepSeek-R1 的亮相,被行业视为一个“临界点”事件——一方面,它以极低的成本训练出了对标 GPT-4 的能力,公开技术细节并放出权重;另一方面,它代表着一种更彻底的“开源范式”:不是简单开放一个模型,而是直接让下游开发者“拿来即用”,训练思路、数据比例、推理效率都一目了然。

 

这直接打在了原来那种“闭环型自研”的路线要害上。很多大厂花大钱训练的模型,在DeepSeek-R1 面前变得毫无优势——不是能力不行,而是“性价比不行”:你没法再说“自研比别人更强”,因为别人把过程全开了,而且你追上也要几个月;你也没法说“闭环护城河更高”,因为别人三两天就能基于 DeepSeek-R1 搭个 demo,甚至用它打磨出产品。

 

这种“开源即能力平权”的冲击,不只打到了大厂,也打乱了 AI 小龙们的节奏。以面壁、百川为代表的“小模型派”,原本还希望在训练效率和推理速度上做文章,现在发现DeepSeek直接掀了桌子,把效率和能力统统平衡好了,而且是白送的——这让“闭源商业化”变得更加困难。

 

行业由此进入了一段显著的“战略迷茫期”:

  • 大厂开始重新评估自研的价值:是否还值得烧钱去追一个很可能被开源赶超的模型?是否应该把精力转向“拼装模型能力+打造 AI 原生应用”的组合打法?
  • AI 小龙们则面临最直接的生存压力:原来讲闭源、讲技术栈的优势正在消失;大厂又开始加速从开源模型中“拿货”,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找“差异化垂直场景”。
  • 投资人也在重新审视项目价值:一个大模型初创公司如果没有特别的创新机制或生态合作资源,其估值逻辑就会受到挑战。

 

总之,DeepSeek 不是推出了一个强模型这么简单,它更像是一次“范式洗牌”:用极致透明和开源方式打破旧有路径依赖,把“自研大模型闭环”从主流选项变成了一个“代价极高”的冒险。这个时刻之后,谁能快速认清现实,找到新生态位,谁才有可能留在下一轮的牌桌上。

 

2 震荡之后,大厂摸索新方向

 

DeepSeek带来的冲击在持续发酵时,整个行业一开始是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但具体要怎么应对、往哪儿走,其实那时候没有明确答案。

 

但从2月下旬开始,情况慢慢变了。大厂开始陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调“应用先行”“超级App”的落地路线,重新回到了“AGI优先”的轨道上。

 

这轮转向有几个关键的变化。

 

第一个变化是目标清晰了。过去讲AI应用的时候,很多公司都停留在“做一个超级 App”的层面,比如搞一个AI助手、一个AI搜索或者AI办公工具。

 

但现在,在字节与阿里最新的对外表达中,都明确把“冲刺AGI”作为最核心的目标。

 

在2月的全员会上,字节CEO梁汝波曾表示:「智能水平是最重要的,要把提高智能本身当成最重要的目标,而不是某个产品的DAU。」

 

3 月 ,豆包大模型部门召开全员会,明确部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。

 

“Seed Edge”是字节豆包大模型团队在年初组建的AGI长期研究团队,鼓励探索更长周期的AGI研究课题,如推理能力、感知能力、软硬一体化等。

 

这个项目强调“宽松的研究环境”和“长周期考核”,为入选课题提供独立算力支持,体现了字节对AGI的长期布局。

 

Seed Edge的目标是探索AGI的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。

 

可以看出,字节正在为通向AGI的下一阶段做技术储备。

 

2025财年财报后的电话会上,阿里 CEO 吴泳铭首次明确提出AGI是阿里AI战略的核心目标,甚至用了“AI将影响全球50% GDP结构”这样激进的表述。

 

这也意味着,阿里正在从强调“云+模型”服务能力,逐步走向更高层次的通用智能探索。

 

第二个变化,是对“开源”和“模型选择”的态度发生了实质变化。过去讲模型、做应用时,往往强调“全链路自主可控”,什么都要自己来。但现在,尤其是腾讯和百度,看起来越来越强调实用主义导向:谁的模型能力强就接谁的模型,应用产品的目标是用户满意、场景落地,而不是一定要套用自家大模型。

 

这背后,其实是每家公司在重新厘清自己的生态位——它在AI时代扮演什么角色,它的核心竞争力到底在哪里。

 

阿里的反应看起来“稳”一些,或者可以说是延续之前的节奏。

 

因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问(Qwen)系列在海外和开源社区持续表现强劲,Qwen2.5-Max一度号称性能超越DeepSeek-V3,而4月底刚开源的Qwen3,不仅成本显著降低,性能更是反超DeepSeek-R1和OpenAI-o1,登上开源模型榜首。阿里的打法很明确:先用模型性能证明自己,再用开源吸引全球开发者,把生态“引进来”。

 

不过,阿里的路径也并非一帆风顺。过去一段时间,由于组织架构频繁调整,大模型和AI业务一度陷入“各自为战”的割裂状态。但随着2024年阿里云重新整合、AI团队在马云回归后重新聚拢,阿里开始回到“集中力量办大事”的主模式。阿里云的回暖也证明了整合效果:在最新一个季度重新恢复双位数增长,再次稳坐国内市场头把交椅。

 

可以说,相比强调C端产品或Agent体验的打法,阿里正在重新确认自己在AI时代的角色——不是冲在最前的应用先锋,而是一个全球级的模型平台和技术基础设施提供者。

 

百度的选择,是比较务实的。一方面它有自己的文心模型体系,但另一方面它也明白,真正能打动用户的,是像百度文库、百度网盘这样的具体应用能不能变得更智能。所以在实际落地中,百度强调“谁好用就用谁”,哪怕不是自家的模型也没关系,只要能让文库变得更好用,就可以接入。

 

这种态度其实是经历过一次反思的。之前极客公园就曾经了解到,2024年百度内部其实是为了推动模型在各应用场景落地,分散了大量精力,导致文心团队反而没能集中精力把模型本身推上一个更高的台阶。新的调整,就是不再强求“模型服务所有应用”,而是让每个业务线根据场景灵活选择,把用户体验拉起来才是第一位。

 

而关于开源闭源之争,此前作为大模型闭源路线的坚定支持者,李彦宏此前曾多次公开表示,"闭源才能保证技术可控性、才有商业模式,开源其实是一种智商税"。

 

李彦宏在Create2025百度AI开发者大会|图片来源:百度

 

直到今年2月,百度选择了顺应开源的大趋势,宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。

 

腾讯的路径更清晰,也更符合它一贯的产品哲学。无论是微信、QQ还是游戏体系,腾讯最核心的资源就是这些连接用户的高频产品。对它来说,自研大模型不是必须的,关键是能不能把AI能力快速嵌入到这些产品里,提升效率和体验。

 

所以,当DeepSeek-R1新模型出现之后,腾讯是第一时间接入的公司之一,没有太多顾虑。毕竟据晚点报道,腾讯董事局主席兼 CEO 马化腾跟一些 AI 团队说过,“要好好与外部合作,不要想着什么都自己做”,以及“要清醒地认识到实际情况,不要过高估计自己的能力。”

 

2月13日,腾讯率先官宣接入“满血版”DeepSeek-R1,并迅速在全平台展开推广攻势。从微信、小红书到B站、知乎,元宝产品的广告铺天盖地,引发了用户对腾讯AI助手的集中关注。与此同时,腾讯内部也紧急协调,加速推动微信与DeepSeek的融合。

 

「元宝」入驻微信|图片来源:极客公园

 

相应地,腾讯也在组织架构上进行了一系列调整。继腾讯元宝从 TEG(技术工程事业群)并入 CSIG(腾讯云与产业事业群)之后,QQ 浏览器、搜狗输入法、ima 等更多产品也陆续划归 CSIG,组成腾讯在大模型时代面向 C 端的新产品阵列。同时,这些产品原本隶属的团队和组织也将从 PCG(平台与内容事业群)整体调整至 CSIG,以更集中地推进 AI 战略下的产品布局与升级。

 

这一系列快速动作,其实体现了腾讯对“AI是能力,不是目的”的判断。更强的模型、更开放的生态,只要能赋能微信和游戏,那就应该立刻用起来。这一波,它反而成了最快适应变局的一家公司——甚至可以说,这次AI开放生态的发展节奏,刚好踩中了腾讯最擅长的能力嵌套逻辑。

 

字节跳动则是四家里最复杂、或许也可以说是最纠结的那个。它一方面拥有豆包大模型体系,另一方面又掌握了抖音、今日头条、番茄小说等超大规模应用场景。既想做AGI技术的引领者,又不愿放弃在应用层面的优势闭环。

 

但这就带来了两头要抓的压力——模型要领先,产品也要突出,生态既要自洽又要开放。在DeepSeek-R1爆火之后,字节一方面开始重申“AGI是核心目标”,加强对豆包的投入,也在开源方面更多动作;另一方面在应用层也出现了新的挑战:到底是坚持“豆包+字节应用”的闭环路线,还是打破内外壁垒,接入更强的外部模型去赛马?

 

据晚点报道,字节跳动最初对是否将DeepSeek接入旗下产品持观望态度,内部普遍认为“随时可以接入,不急”。然而,时机稍纵即逝,春节过后,字节开始紧急调动团队加班开发,加速整合DeepSeek。

 

目前看,字节的策略还在过渡期。一方面,它在对外表达中强调开源、强调开放生态价值;另一方面,在内部系统上,豆包仍然是很多应用场景的默认选择,只在少许应用上开放对DeepSeek模型的接入。但未来会不会像腾讯一样,开始在更广泛的层面接入第三方模型,或者在某些应用上放开“自家模型优先”的原则,现在还没有完全看清楚。

 

过去几个月是AI大厂们重新定位自己的生态角色、重新判断技术路径的关键窗口期。经历了DeepSeek-R1带来的“能力维度重构”之后,各家公司几乎都开始重新聚焦AGI这个长期目标,同时也在技术和生态层面更加现实与开放。

 

不过,即便目标一致,路径选择依然千差万别。这背后,是每家公司对自身优势的认知差异,也是它们对“AI时代应该怎么跑”的不同下注。

 

3 技术颠覆面前,没有永远的「历史赢家」

 

AI 行业不会因为某一个产品突然“杀出重围”而终结对抗,它注定是一场持续上演的生态重构游戏——生态位置、能力分工将反复洗牌,而每一次冲击,都会逼迫玩家重新思考“我是谁、我该怎么做”。

 

在 DeepSeek-R1 的冲击下,大厂开始重新审视自己与 AI 的关系。这场变化不会停止:在AI这个快速演进的技术浪潮中,任何人其实都没有资格背负历史包袱。

 

历史包袱,不只是落后的产线、沉重的组织、冗余的团队,更是一种路径依赖式的认知惯性。

 

过去几年,整个AI行业积累了太多“默认共识”:比如做大模型一定要砸上亿美金、做AI应用一定要追求闭环、只有To B业务才能形成收入闭环、AI不是消费品只能是工具型软件……这些“理性判断”在过去的技术范式下看似正确,但在新路径被打通之后,很多“理性”就变成了限制想象力的牢笼。

 

技术革命的残酷性就在于,它并不会给巨头太多“吃老本”的机会。AI 的快速迭代,正不断吞噬那些依赖过往成功经验的惯性组织。于是我们看到:百度转向开源,腾讯放下身段借势引流,字节加速重构算力体系……这些动作背后,藏着大厂对现实的一种「觉醒」:在 AI 的无限游戏中,唯一的生存法则,是保持战略弹性——既要摒弃对历史经验的盲目依赖,也要以开放姿态,拥抱技术普惠的新趋势。

 

旧范式困住了谁?

 

回顾国内过去两三年内大厂与头部创业公司的发展路径,几乎都踩在一套“经典剧本”上:

  • 先围绕一个目标设定OKR;
  • 再从模型能力、数据体系、应用矩阵做完整闭环;
  • 最终希望通过模型降本、产品增长、生态协同走通商业路径。

 

这个逻辑没错,但问题是它太像过去互联网时代的打法了——它默认“资源越多,路径越清晰”;但AI的突变恰恰是在路径模糊中爆发的。

 

比如,之前很多团队一边追求“闭环场景”,一边困于“能力不足”;一边想讲“自主模型”的故事,一边又拿不到基础设施层的调优能力。很多战略决策是“既定假设+组织惯性”的结果——看起来合理,但没人停下来问:如果这些假设本身就错了呢?

 

反观这轮跑出来的新玩家,无论是DeepSeek、Manus,他们有个共同点:思维轻盈,没有历史负担,也没有路线执念,这反而让他们成了这轮范式跃迁的开拓者。

 

如果回过头去看,DeepSeek和Manus做的那些事,其实都没有多么玄学,甚至可以说都站得住工程逻辑。但为什么几乎没有大厂走这条路?因为它们过于理性、过于系统化,也就过于保守。

 

比如大厂可能会问:做MoE到底能不能规模化?极限调优是不是浪费时间?——这些问题本身没错,但当还没验证过路径,就先否定它,那可能永远不会发现新大陆。

 

这也是为什么,越来越多投资人、开发者、行业观察者开始重新审视AI创业的价值判断:不是谁能讲出最全的闭环,不是谁能招来最多的模型科学家,而是——谁能打破“历史正确性”,走出一条技术与产品都能快速验证的新路线。

 

在AI这条超高速前进的技术公路上,最危险的不是落后一步,而是还相信旧的红绿灯规则。真正的变化总是发生在“不合理”与“不被看好”之间。

头图来源:视觉中国

「AI 黑客」来袭,Agentic AI 如何成为新守护者?

2025年5月19日 14:44

01

AI 崛起:技术双刃剑下的安全暗战

随着 AI 技术的快速发展,网络安全面临的威胁日益复杂化,攻击手段不仅更高效、隐蔽,还催生了新型的「AI 黑客」形态,因此引发了各类新型网络安全危机。

首先是生成式 AI 正重塑网络诈骗的「精准度」。

简单而言,就是将传统的钓鱼攻击智能化,比如在更精准的场景中,攻击者会利用公开社交数据训练 AI 模型,批量生成个性化钓鱼邮件,模仿特定用户的写作风格或语言习惯,实施「定制化」诈骗,绕过传统垃圾邮件过滤器,大幅提升攻击成功率。

接着是最为大众所熟知的深度伪造(Deepfake)与身份冒用。在 AI 技术成熟之前,传统的「变脸诈骗攻击」,即 BEC 诈骗,全称为「Business Email Compromise」,具体为攻击者通过将邮件发件人伪装成你的领导、同事或商业伙伴,以此骗取商业信息或钱财、或者获取其他重要资料。

如今,「变脸」真的发生了。AI 生成的换脸、变声技术可伪造公众人物或亲友身份,用于诈骗、舆论操控甚至政治干预。就在两个月前,上海某企业财务总监接到来自「董事长」的视频会议邀请,对方通过 AI 换脸仿声称需紧急支付「境外合作保证金」,该总监依指示转 380 万元至指定账户,后识破系境外诈骗团伙利用深度伪造技术作案。

第三则是自动化攻击与漏洞利用。AI 技术的进步让大量场景向智能化、自动化演进,网络攻击自然也是如此。攻击者可借助 AI 自动扫描系统漏洞、生成动态攻击代码,并对目标实施无差别快速攻击,比如 AI 驱动的「零日攻击」在发现漏洞后会立即编写并执行恶意程序,传统防御系统难以实时响应。

就在今年春节,DeepSeek 官网遭遇 3.2Tbps 超大规模 DDoS 攻击,黑客同步通过 API 渗透注入对抗样本,篡改模型权重导致核心服务瘫痪 48 小时,直接经济损失超数千万美元,事后溯源发现美国 NSA 长期潜伏的渗透痕迹。

数据污染和模型漏洞同样也是一种新威胁。攻击者通过在 AI 训练数据中植入虚假信息(即数据投毒),或利用模型自身缺陷,诱导 AI 输出错误结果——这会对关键领域造成直接的安全威胁,甚至可能引发连锁灾难性后果,例如自动驾驶系统因对抗样本误判「禁止通行」为「限速标志」,或医疗 AI 将良性肿瘤误判为恶性。

02

AI 还需 AI 治

面对 AI 驱动的网络安全新威胁,传统防护模式已显乏力。那么,我们又有哪些应对之策呢?

不难发现,目前的业内共识已指向「以 AI 对抗 AI」——这不仅是技术手段的升级,更是安全范式的转变。

现有的尝试大致分为三大类,分别是 AI 模型的安全防护技术、行业级的防御应用以及更宏观层面的政府与国际协作。

AI 模型安全防护技术的关键在于模型的内生安全加固。

以大型语言模型(LLM)的「越狱」漏洞为例,其安全防护机制常因通用型越狱提示策略失效——攻击者通过系统性绕过模型内置保护层,诱导 AI 生成暴力、歧视或违法内容。为防止 LLM 的「越狱」,各家模型公司都做出了尝试,比如 Anthropic 就于今年二月发布了「宪法分类器」。

此处的「宪法」指的是不可违背的自然语言规则,作为一种在合成数据上训练的保障措施,通过规定允许和限制的内容,实时监测输入输出内容,在基准条件的测试中,其 Claude3.5 模型在分类器保护下,对高级越狱尝试的成功阻止率从 14% 提升至 95%,显著降低了 AI 的「越狱」风险。

而除了基于模型、更通用的防御手段外,行业级的防御应用同样值得关注,其垂直领域的场景化防护正成为关键突破点:金融行业通过 AI 风控模型与多模态数据分析构建反欺诈壁垒,开源生态借助智能化漏洞猎捕技术实现零日威胁的快速响应,而企业敏感信息保护则依托 AI 驱动的动态管控体系。

例如,思科在新加坡国际网络周展示的方案,可实时拦截员工向 ChatGPT 提交的敏感数据查询请求,并自动生成合规审计报告优化管理闭环。

在宏观层面上,政府与国际的跨区域协作也正加速推进。新加坡网络安全局发布《人工智能系统安全指南》,通过强制本地化部署与数据加密机制约束生成式 AI 滥用,特别针对钓鱼攻击中 AI 伪造身份的识别建立防护标准;美英加三国同步启动「AI 网络代理计划」,聚焦可信系统研发与 APT 攻击的实时评估,通过联合安全认证体系强化集体防御能力。

那么,哪些方法能最大限度地用 AI 来应对 AI 时代的网络安全挑战呢?

「未来需要 AI 安全智能中枢并围绕中枢构建新体系。」在第二届武汉网络安全创新论坛上,青藤云安全创始人张福曾在分享中强调以 AI 对抗 AI 方为未来网络安全防御体系的核心,「3 年内,AI 将会颠覆现有的安全行业,和所有的 2B 行业。产品将会重新构建,实现前所有未有的效率和能力的提升。未来产品是给 AI 用的,而不是给人用的。」

在一众方案中,Security Copilot 的模式显然对「未来产品是给 AI 用的」提供了很好的示范:一年前,微软推出了智能 Microsoft Security Copilot 副驾驶来帮助安全团队迅速准确地检测、调查和响应安全事件;一个月前,又再次发布了用于在钓鱼攻击、数据安全和身份管理等关键领域自动协助的 AI 智能体。

微软新增六个自研 AI 智能体以扩展 Security Copilot 功能。其中三个用于辅助网络安全人员筛选警报:钓鱼分类智能体审查钓鱼警报、过滤误报;另两个分析 Purview 通知,检测员工未经授权使用业务数据的情况。

条件访问优化智能体与 Microsoft Entra 协作,指出不安全的用户访问规则,并生成一键修复方案供管理员执行。漏洞修复智能体和设备管理工具 Intune 集成,助力快速定位易受攻击的终端,应用操作系统补丁。威胁情报简报智能体生成可能威胁组织系统的网络安全威胁报告。

03

无相:L4 级高阶智能体的保驾护航

无独有偶,在国内,为了实现真正意义上「自动驾驶」级别的安全防护,青藤云安全推出了 全栈式安全智能体「无相」。作为全球首个实现从「辅助型 AI」向「自主智能体」(Autopilot)跨越的安全 AI 产品,其核心突破在于颠覆传统工具的「被动响应」模式,使其自主、自动且智能。

通过融合机器学习、知识图谱与自动化决策技术,「无相」可独立完成威胁检测、影响评估到响应处置的全流程闭环,实现真正意义上的自主决策与目标驱动。其「Agentic AI 架构」设计模拟人类安全团队的协作逻辑:以「大脑」整合网络安全知识库支撑规划能力,「眼睛」细粒度感知网络环境动态,「手脚」灵活调用多样化的安全工具链,并通过多智能体协作形成信息共享的高效研判网络,分工合作、共享信息。

在技术实现上,「无相」采用「ReAct 模式」(Act-Observe-Think-Act 循环)与「Plan AI + Action AI 双引擎架构」,确保复杂任务中的动态纠偏能力。当工具调用异常时,系统可自主切换备用方案而非中断流程,例如在 APT 攻击分析中,Plan AI 作为「组织者」拆解任务目标,Action AI 作为「调查专家」执行日志解析与威胁建模,二者基于实时共享的知识图谱实现并行推进。

功能模块层面,「无相」构建了完整的自主决策生态: 智能体人设模拟安全分析师的反思迭代思维,动态优化决策路径; 工具调用整合主机安全日志查询、网络威胁情报检索及 LLM 驱动的恶意代码分析; 环境感知实时捕获主机资产与网络信息;知识图谱动态存储实体关联,辅助决策;多智能体协作通过任务分拆与信息共享,并行执行任务。

目前「无相」在告警研判、溯源分析以及输出安全报告这三大核心应用场景中的表现最为出色。

传统安全运营中,海量告警的真伪甄别耗时费力。以一次本地提权告警为例:无相的告警研判智能体自动解析威胁特征,调用进程权限分析、父进程溯源、程序签名验证等工具链,最终判定为误报——全程无需人工介入。在青藤现有告警测试中,该系统已实现 100% 告警覆盖率与 99.99% 研判准确率,并将人工工作量削减超 95%。

面对真实威胁如 Webshell 攻击,智能体通过代码特征提取、文件权限分析等跨维度关联,秒级确认攻击有效性。传统需多部门协作、耗时数日的深度溯源(如上传播径还原、横向影响评估),现由系统自动串联主机日志、网络流量、行为基线等数据流,生成完整攻击链报告,将响应周期从「天」压缩至「分钟」。

「我们的核心是将 AI 和人的合作关系扭转了,可以把 AI 作为一个人来合作,实现从 L2 到 L4 的跨越,即从辅助驾驶向高阶自动驾驶跨越。」青藤联创兼产品副总裁胡俊分享道,「随着 AI 能适配的场景更多,决策的成功率更高,逐渐能够承担更多的责任,这样人和 AI 之间的责任分工就会有变化。」

在溯源分析这个场景中,首先是 Webshell 告警触发「无相 AI」驱动的多智能体安全团队协同溯源:「研判专家」基于告警定位 one.jsp 文件,生成文件内容分析、作者溯源、同目录排查及进程追踪等并行任务,由「安全调查员」智能体调用文件日志工具,快速锁定 java(12606)进程为写入源,该进程及关联主机 10.108.108.23(通过访问日志发现高频交互)相继纳入调查。

智能体通过威胁图谱动态扩展线索,从单一文件逐层深挖至进程、主机,研判专家汇总任务结果综合判定风险。此过程将人工需数小时至数天的排查压缩至几十分钟,以超越人类高级安全专家的精准度还原攻击全链路,无死角追踪横向移动路径,红队评估也显示难以规避其地毯式调查。

「大模型比人工好是因为它能彻查边边角角,而非凭经验排除可能性低的情况。」胡俊解释道,「这样相当于广度和深度都更好。」

在完成复杂攻击场景的调查后,整理告警与调查线索并生成报告往往耗时费力。而 AI 可实现一键式总结,以可视化时间线的形式清晰呈现攻击过程,如同电影般连贯展示关键节点——系统会自动梳理关键证据生成攻击链的关键帧,并结合环境上下文信息,最终生成动态的攻击链路图谱,让整个攻击轨迹以直观、立体的方式呈现。

04

结语

很显然,AI 技术的发展为网络安全带来双重挑战。

一方面,攻击者利用 AI 实现攻击的自动化、个性化和隐蔽化;另一方面,防御方需加速技术创新,通过 AI 增强检测与响应能力。未来,攻防双方的 AI 技术竞赛将决定网络安全的整体态势,而安全智能体的完善将是平衡风险与发展的关键。

而安全智能体「无相」在安全架构与认知层面都带来了新的变化。

「无相」本质上是改变了对 AI 的使用方式,其突破性在于将多维数据感知、防护策略生成与决策可解释性熔铸为有机整体——从过往将 AI 作为工具使用的模式转变为给 AI 赋能使其能自主且自动地工作。

通过关联分析日志、文本、流量等异构数据,系统能在攻击者构建完整攻击链前捕捉 APT 活动的蛛丝马迹。更关键的是,其决策过程的可视化推理解释,让传统工具「知其然不知其所以然」的黑盒告警成为历史——安全团队不仅能看见威胁,更能理解威胁的演化逻辑。

这个革新的本质是安全思维从「亡羊补牢」到「未雨绸缪」的范式跃迁,是对攻防博弈规则的重新定义。

「无相」如同拥有数字直觉的猎手:通过实时建模内存操作等微观行为特征,它能从海量噪声中揪出潜伏的自定义木马;动态攻击面管理引擎持续评估资产风险权重,确保防护资源精准投向关键系统;而威胁情报的智能消化机制,则将日均万条告警转化为可行动的防御指令,甚至预测攻击变种的演化方向——当传统方案还在疲于应对已发生的入侵时,「无相」已在对攻击者的下一步落子进行预判封堵。

「AI 智能中枢系统(高阶安全智能体)的诞生,将会彻底重塑网络安全的格局。而我们唯一需要做的,就是彻底抓住这个机会。」张福道。

小米玄戒芯片跑分泄露,略低于高通骁龙 8;罗永浩现身百度杭州公司;谷歌 CEO 爆料,差点收购 Netflix

2025年5月19日 08:38

 

罗永浩被曝现身百度杭州分公司

5 月 18 日消息,昨晚有多位网友在网上晒图,称罗永浩现身百度。例如其中一位网友发图并配文「上厕所这是碰到了老罗?」

罗永浩一袭黑衣走在工作人员身后,背后墙面上挂着百度的 logo,而发帖人定位则是百度(杭州)分公司。

罗永浩此前投身 AI 创业新项目,其首款 AI 硬件产品 JARVIS ONE 此前已经曝光,由电池、指纹识别、Wi-Fi、麦克风和蓝牙模块组成,用户只需触摸并按住指纹识别区域即可激活语音命令。

此外,其初创项目 Jarvis 已于今年 1 月悄悄在海外上线,但在拥有众多粉丝基础的国内却一直没有动作。(来源:IT 之家)

小米 XRING 01 在基准测试中对决骁龙 8 Elite,10 核 CPU 集群多核得分仅低 7%

近日,小米正式公布了自主处理器芯片 XRING 01,而这款自行研发的芯片仅在几天后就出现在了新的基准测试泄露中。测试结果显示,尽管骁龙 8 Elite 比它的速度更快,但优势并不大,这表明这家中国公司十年的研发投入终于结出了硕果,并对高通和联发科等公司构成了真正的威胁。

Geekbench 6 的跑分信息由爆料人 @Jukanlosreve 上传,这款设备是小米 25042PN24C,采用「2+4+2+2」架构,其中最快的大核心可能是 ARM 的 Cortex-X925,主频为 3.90GHz。此前,有传言称 XRING 01 将采用这家英国芯片设计公司的当前一代设计,而非自主研发的内核,但该传言中提到 Cortex-X925 的主频为 3.20GHz。

这次,频率提升至 3.90GHz,暗示 XRING 01 是采用台积电 3nm 工艺而非较老的 4nm 节点量产的,因为只有这种光刻技术才能让 SoC 维持这样的时钟速度并在可接受的温度下运行。接下来,我们有四个核心运行在 3.40GHz 的频率下,我们再次怀疑是 Cortex-X925。至于其余的,它们可能属于 Cortex-A725。

为了帮助 XRING 01 与骁龙 8 Elite 和天玑 9400+ 等处理器竞争,并将其单核和多核得分提升至 2709 分和 8125 分,小米可能增加了核心数量,尽管这可能会降低其效率。相比之下,小米 15 Pro 的单核和多核得分分别为 2919 分和 8699 分,这使得 XRING 01 在多线程方面仅慢了 7%。(来源:cnbeta)

 

苹果将允许欧盟 iPhone 用户放弃默认使用 Siri

据彭博社报道,苹果计划让欧盟用户能够设置除 Siri 之外的默认语音助手。

苹果计划在多个软件平台上引入这一变化,这可能至少意味着 iPhone、iPad 和 Mac。

据推测,这意味着欧盟用户将能够将 Amazon Alexa 或 Google Assistant 等选项设置为苹果设备上的默认语音助手。

报道称,苹果公司正在为应对欧盟不断扩大的监管规定而做出这一改变。

苹果已经允许欧盟的 iPhone 用户将第三方应用程序设置为浏览和消息传递、导航等功能的默认选项。(来源:网易)

 

宁德时代推出 75# 标准化换电块,将建设「八横十纵」换电绿网

5 月 18 日,由中国交通运输协会与宁德时代联合主办的「新一代重卡换电生态发布活动」在山西大同举行。活动上,宁德时代正式发布 75# 标准化换电块及全场景底盘换电解决方案,并宣布将在 2030 年建成覆盖全国 80% 干线运力的「八横十纵」换电绿网目标,以及三年内推动重卡电动化跨越 50% 的市场渗透率目标。

宁德时代董事长兼 CEO 曾毓群表示,在零碳转型和物流降本的双重挑战和机遇下,未来 3 年重卡行业将迎爆发式增长,实现 50% 的电动化率。

宁德时代还将投入资源建设换电干线组网。根据规划,2025 年将在京津冀、长三角、大湾区等 13 个核心区域建成 300 座换电站,贯通沧榆线、京沪线 (G2)、沪广线、沪蓉线等 11 条干线。到 2030 年之前,将建设一张「八横十纵」的全国换电绿网,组成 16 大城市群换电网,这全长 15 万公里的高速及国省道干线,将覆盖 80% 的干线运力。(来源:央广网)

谷歌 CEO 爆料:曾认真考虑过收购 Netflix,差点就成了

5 月 17 日,据《商业内幕》报道,谷歌公司 CEO 桑达尔·皮查伊 (Sundar Pichai) 在接受采访时爆料称,谷歌曾经「非常认真」地考虑收购流媒体视频公司 Netflix。

他表示,像 Netflix 这样的收购案曾在公司内部「被激烈讨论过」,而且谷歌当时「差点」就达成了这笔交易。不过他随后澄清说,放弃收购的决定并不算是一个「遗憾」。

自 2016 年启动全球扩张以来,Netflix 一直引领娱乐行业发展,订阅用户已突破 3 亿。尽管谷歌通过其智能电视平台 Google TV 以及互联网直播服务 YouTube TV 进入了电视领域,但它从未像 Netflix 那样成功打入传统流媒体市场。

长期以来,谷歌一直喜欢通过高调收购交易来吞并竞争对手,但 Netflix 是该科技巨头公开承认曾考虑收购的最大牌公司之一。多年来,谷歌成功收购了多家如今已成为其核心产品线一部分的公司,包括 Waze、Wiz、Nest、Fitbit、Android 以及 YouTube。(来源:凤凰网科技)

 

公务用车集中采购要求选用国产车,优先选用新能源汽车

5 月 18 日消息,中共中央、国务院印发了修订后的《党政机关厉行节约反对浪费条例》(以下简称《条例》),并发出通知,要求各地区各部门认真遵照执行。

《条例》指出,完善政府采购管理交易系统,推进电子化政府采购。

《条例》提到,公务用车实行政府集中采购,应当选用国产汽车,优先选用新能源汽车。

《条例》还称,党政机关政务信息系统建设应当统筹规划,统一组织实施,防止分散重复建设和频繁升级。建立共享共用机制,加强资源整合,推动重要政务信息系统互联互通、信息共享和业务协同,降低软件开发、系统维护和升级等方面费用,防止资源浪费。(来源:新华社)

 

Manus 生图功能登场,从设计到搭建网站一站式搞定

Manus 推出图像生成功能,除单纯生图外,还能理解用户意图、规划解决方案,并知道如何调用各种工具完成任务。

该工具通过智能体工作流实现从品牌设计到网站部署的一站式服务,新用户可获赠 1000 积分免费体验。实测显示图像生成效果不错,但网站部署等复杂任务运行速度较慢,需等待数分钟至十几分钟不等。(来源:机器之心)

联想拯救者 Y7000 2025 新品预热:重约 2Kg,双烤性能释放 170W

5 月 18 日消息,联想 15.3 英寸的拯救者 7000 系列新品将于 5 月 20 日揭晓。

根据预热信息可知,这款新机升级「乾坤散热 2.0」,双满功耗性能释放高达 170W,兼具 15.3 寸轻巧机身,重量约 2Kg。

作为参考,已经公布的拯救者 Y7000P、R7000P 2025 也采用了「乾坤散热 2.0」,内置 3D Blade 猎鹰风扇 2.0,性能释放可达 195~200W。

联想拯救者 Y7000 2025 搭载 i7-14650HX 处理器、RTX 5060 显卡、16GB DDR5 5600 内存以及 512GB 固态硬盘(IT 之家注:双盘位),采用 15.3 英寸 LCD 屏(2.5K 分辨率 180Hz 刷新率、400nits 亮度、3ms 响应、X-Rite 色彩管理)。(来源:新浪)

 

魅族推出 PANDAER 超轻量合金电竞鼠标:PAW3395 + 星闪 Nearlink,499 元

5 月 18 日消息,魅族现已在自家商城上架一款 PANDAER 超轻量合金电竞鼠标,该鼠标支持星闪 Nearlink 连接、58 克重量、PAW3395 传感器、凯华微动,定价为 499 元。

据介绍,相应电竞鼠标外观方面采用镁铝合金 CNC 工艺,支持更换背部组件(可换为金属镂空背板 / 黑透背板),采用星闪 Nearlink 方案,延迟最低 0.125ms,鼠标同时搭载 PAW3395 传感器 + 海思 BS25 主控,提供 26000 DPI 灵敏度。(来源:IT 之家)

深圳交警引入新款大疆警用无人机,可抓拍司机开车玩手机违法行为

5 月 18 日消息,据深圳交警官方微博,深圳交警近日为高速引入一台新款 DJI 大疆警用无人机,可对分心驾驶和开车玩手机等行为进行抓拍。

深圳交警在视频中强调了这款无人机具备的防风、防水特性,透露相应无人机可在阴天微雨天使用,能够准确锁定不文明的驾驶行为。

交警展示的画面中,一位货车司机边开车边玩手机,无人机摄像头牢牢锁定货车,并进行高清抓拍,抓拍后还会有语音提示。

目前,深圳交警对开车玩手机行为处罚较为严格,查证后将会对驾驶员处以 300 元及 2-3 分处罚。(来源:腾讯新闻)

 

ChatGPT 或将支持 MCP;字节跳动调整福利政策;洛杉矶奥运会将引入「空中出租车」

2025年5月18日 08:35

OpenAI 计划在阿布扎比建设的数据中心将比摩纳哥更大

据彭博社报道,OpenAI 准备帮助在阿布扎比开发一个容量高达 5 千兆瓦的数据中心园区,该公司将成为该项目的主要租户,该园区可能成为全球最大的人工智能基础设施项目之一。

据报道,该设施占地面积高达 10 平方英里,耗电量相当于五座核反应堆,远超 OpenAI 及其竞争对手宣布的任何现有 AI 基础设施。

OpenAI 在美国的第一座星际之门园区(已在德克萨斯州阿比林开发)预计将达到 1.2 千兆瓦,而这家位于中东的园区的容量将是该园区的四倍以上。(来源:cnBeta)

比亚迪加速内部整合,消息称腾势、方程豹品牌公关部回归集团

5 月 17 日消息,「每人 Auto」今日发布消息称,比亚迪于 4 月底发布公告,将旗下两大高端品牌腾势、方程豹的品牌公关部进行了调整。

此前,腾势、方程豹品牌公关的团队分别隶属于腾势销售事业部、方程豹销售事业部,调整后,上述两个品牌的公关团队平级移至比亚迪集团品牌及公关处,为其二级部门,最高负责人为比亚迪集团品牌及公关处总经理李云飞。

报道援引比亚迪员工的说法,集团内部汽车业务主要由汽车工程研究院、新技术研究院负责车型研发设计,产品交由王朝网、海洋网、腾势、方程豹、仰望销售事业部来负责营销。

而此次调整,则意味着集团将给予两大品牌更多的资源支持,希望打造更强的品牌力。(来源:IT 之家)

 

奇瑞再被曝将在英国建汽车厂,目前在当地已有 70 余家经销商

5 月 17 日消息,据外媒 AutoCAR 报道,奇瑞汽车英国公司负责人 Victor Zhang 透露,未来将在英国设立工厂,以及包含上下游产业链的制造基地,另一位奇瑞英国高管则表示,英国生产是奇瑞在英国的「最终目的地」。

报道称,目前奇瑞在英国已经拥有 70 余家经销商,该公司计划在 2026 年(明年)将这一数字翻番。

据悉,早在 2023 年 6 月,就有英国当地媒体披露,包括奇瑞在内的中国汽车制造商已与英国方面进行会谈,讨论在当地制造汽车。不过目前奇瑞在英国生产事宜还未最终确定。(来源:IT 之家)

 

OpenAI ChatGPT 被曝将支持 MCP 协议,可接入第三方 AI 服务

科技媒体 bleepingcomputer 在 5 月 16 日发布博文,报道称 OpenAI ChatGPT 正测试整合 MCP 协议,扩展该 AI 聊天机器人的第三方服务。

MCP 可以比喻成 AI 应用的「USB-C 接口」,AI 助手通过受控接口访问数据,例如列出表格、读取数据或执行 SQL 查询,从而实现数据库探索和分析等任务。

虽然 MCP 对普通消费者的直接用途可能有限,但对企业而言,它可能带来颠覆性改变。企业能够通过 MCP 将内部工具与 ChatGPT 连接,按需共享数据,优化工作流程。

据社交平台 X 用户 Tibor 爆料,ChatGPT 正在测试一项「连接器设置」(Connectors settings)功能。用户可点击「自定义」(Custom)选项,添加新工具,并填写工具名称、URL 和描述等信息。

该功能让 ChatGPT 能无缝对接用户自有应用或 API 实现,对 MCP 支持目前仍在内部测试阶段,OpenAI 预计将在未来几天或几周内正式公布这一功能。(来源:IT 之家)

刘强东给母校中国人民大学捐赠的教学楼「京东群学楼」今日投用

据「京东黑板报」,中国人民大学社会学院楼「京东群学楼」昨日在通州校区正式启用。

「群学」,为社会学的旧译名,亦指学派交汇,融会贯通。京东群学楼为人大校友、京东集团创始人、董事会主席刘强东捐赠冠名建设项目,总建筑面积约 3.1 万平方米。

2017 年在人大 80 周年校庆之际,刘强东向母校捐赠 3 亿元,并设立人大京东基金,创人大建校以来的最高社会捐赠记录。

据悉,人大京东基金主要用于支持人大的通州新校区建设、社会学学科发展以及在法学、新闻、互联网、人工智能、金融等领域的相关学科建设、理论与技术研究,并通过大幅提升助学金、奖学金、奖教金的方式来支持激励、培养更多优秀教师和青年学子,帮助杰出人才和贫困学生的成长。

当天,京东物流与人大联合打造的智慧快递服务中心也正式落地人大通州校区。这是北京首家校企共建的智慧快递服务中心,还投放了第六代智能配送无人车及京东服务 + 等服务(来源:IT 之家)

 

美国官员对苹果在中国的人工智能合作计划表示担忧

苹果公司可能计划与阿里巴巴合作,将 Apple Intelligence 引入其在中国的产品中,这一计划引起了华盛顿的关注。

美国国会和白宫官员都对苹果与中国电商巨头阿里巴巴合作将 Apple Intelligence 引入中国的计划表示担忧。苹果公司则认为,此类交易对于保持其在中国的竞争力至关重要。

《纽约时报》的一篇报道指出,中国市场约占苹果总销售额的 20%。为了与中国本土的智能手机公司竞争,苹果需要与中国的人工智能供应商合作。

美国官员担心,这样的协议将使中国在与美国人工智能公司的竞争中更具竞争力。任何协议都可能迫使苹果进一步遵守中国法律,这些法律旨在促进审查制度并与中国政府共享用户数据。

据报道,白宫和众议院的官员已联系苹果高管,要求提供有关该交易的更多信息。他们显然被问及,这笔交易是否会让中国公司获取用户数据或先进的人工智能模型。

美国官员还考虑将包括阿里巴巴在内的中国人工智能公司列入不允许与美国公司合作的受限公司名单。

据称,苹果还在考虑与其他中国人工智能公司达成交易,包括腾讯、DeepSeek 和百度。(来源:cnBeta)

 

入侵美国 SEC 社媒账户导致比特币价格暴涨的黑客被判入狱

26 岁的埃里克·康瑟尔 (Eric Council Jr.) 因参与入侵美国证券交易委员会官方 X 账户,于周五被判处 14 个月监禁和 3 年监督释放。美国司法部在一份新闻稿中宣布了这一判决。

Council 和其他黑客于 2024 年接管了 SEC 的 X 账户,并错误地宣布该机构已批准比特币交易所交易基金 (ETF),这导致加密货币价格飙升,随后又下跌。

据美国司法部称,Council 及其同伙对一名有权访问 SEC X 账户的人员的手机账户进行了 SIM 卡交换攻击,从而使黑客控制了该人员的电话号码。之后,黑客重置了 SEC X 账户的密码,从而获得了该账户的控制权。(来源:cnBeta)

 

微软 CEO 萨蒂亚·纳德拉开始用 AI 聊天机器人取代收听播客

为了说明他在日常生活中使用公司 Copilot 人工智能助手的频率,微软首席执行官萨蒂亚·纳德拉表示,他现在不再收听播客,而是将文字记录上传到 Copilot,然后在开车去办公室的路上与 Copilot 讨论内容。

此外,纳德拉曾开玩笑地将自己的工作描述为「电子邮件打字员」,他表示,他依靠 Copilot Studio 开发的至少 10 个定制代理来汇总电子邮件和消息、准备会议以及执行办公室的其他任务。

人工智能似乎已经在以更实质性的方式改变微软,据报道,在纳德拉宣布公司 30% 的代码是由人工智能编写后不久,程序员在公司最近的裁员中受到的打击最为严重。(来源:cnBeta)

 

字节跳动被曝福利调整:多地禁止打包餐食回家,午休禁止关灯

据媒体报道,近日,字节跳动在多地工区推行了一系列新的管理规定,涵盖餐食外带与午休政策,引发广泛关注。

在餐食管理方面,有内部员工透露,公司已发布内部通知,明确规定职场提供的三餐、随餐饮品、水果以及茶水间零食等福利,员工需现场即取即用,严禁带离职场。

通知强调,餐食外带行为违反了公司的餐饮管理规定,对于情节严重的侵占情况,违规者将面临退赔、警告甚至辞退等不同程度的处罚。

与此同时,午休政策也做出了相应调整。以往深圳工区作为唯一允许关灯午休的办公区域,如今也宣布午睡时不得关灯。

针对这些调整,字节跳动一位内部知情人士解释称:「餐食方面的调整,主要是为了治理多拿多占现象,比如个人外带大量餐食;职场内用餐不受任何影响。而午休方面,不存在不让午休的说法,员工可以根据个人需求在工位午休;主要是避免个人物品占用消防安全通道、公共区域。」(来源:快科技)

吉利银河伪装车曝光,号称「全球最低油耗、2100km+ 综合续航」

 5 月 17 日消息,吉利银河旗下全新轿车谍照今日在社交平台曝光,车身写有「全球最低油耗」「2L 级亏电油耗」「2100km+ 综合续航」等标语。

目前尚不清楚这款新车的具体型号。在 5 月 15 日吉利汽车 2025 年一季度业绩会暨「一个吉利」战略整合计划说明会上,吉利透露:在二季度末以及三季度初,吉利银河还将会有两个产品投放市场,下一周,银河有一款大型旗舰 6 座 SUV 将会在意大利米兰首秀。(来源:IT 之家)

 

iPhone Fold 屏下摄像头据称正在测试中

苹果首款可折叠 iPhone 预计将于 2026 年末 或 2027 年首次亮相,今天来自韩国的一则新传闻泄露了工程原型的当前状态。根据知情人士基于工程测试设备的数据,iPhone Fold 的屏幕尺寸比之前的原型略小,但分辨率和长宽比相同。

据称 iPhone Fold 的正面显示屏上会有一个打孔摄像头,内部折叠屏幕则首次配备屏下摄像头,这样一来它将类似于三星的 Galaxy Z Fold 系列。

苹果仍有大量时间来确定 iPhone Fold 的具体规格,因此很多方面未来都可能(而且很可能会)发生变化,无论如何,苹果选择屏下摄像头路线仍然值得关注。

此前有传言称,苹果正致力于最大限度地减少折叠屏幕的折痕,并为 iPhone Fold 配备比任何竞争对手都要高品质的铰链。(来源:cnBeta)

2028 洛杉矶奥运会将首次引入「空中出租车」,带来全新观赛、往返体验

据美联社 16 日报道,2028 年洛杉矶奥运会期间,观众和贵宾们将首次体验乘坐空中出租车前往比赛场馆。

阿切尔航空公司推出的电动空中出租车「午夜」号将从多个场馆附近的垂直起降点出发,最多可载四名乘客,飞行时间为 10 至 20 分钟,目的地遍布洛杉矶交通网中的各大区域。

这张空中出行网络将包括英格尔伍德的 SoFi 体育场和市区南部的洛杉矶纪念体育场,两个场馆将共同承办奥运会的开闭幕式。此外,洛杉矶国际机场、好莱坞、圣莫尼卡和橙县也将成为空中出租车的停靠点。

阿切尔表示,这款空中出租车的噪音和排放比传统直升机低。该款 eVTOL 飞机配备了冗余的容错系统,拥有 12 个发动机和螺旋桨,因此能够达到与商业航班相似的安全标准,预计将获得美国联邦航空局的认证。这些空中出租车将在阿切尔位于加利福尼亚圣荷西和乔治亚州科温顿的工厂制造。

作为 2028 年洛杉矶奥运会、残奥会及美国队的官方服务商,阿切尔还将利用空中出租车为紧急服务和安保提供支持。(来源:IT 之家)

 

雷军最新内部演讲曝光;美团外卖推出堂食店标签;英伟达计划在上海设立研发中心

2025年5月17日 08:58

雷军最新内部演讲曝光:小米不再是行业新人,公众的期待和要求远超想象

5 月 16 日消息,一份雷军在小米价值观大赛后对内部员工发表演讲的视频曝光,罕见谈及了近期小米遭遇的舆论危机。

雷军表示,三月底的一场突如其来的交通事故,给小米带来了狂风暴雨般的质疑、批评和指责。我和同事们一样,一下子都懵了,一位熟悉汽车行业的朋友告诉我:造车,遭遇交通事故在所难免。』但是谁也没有想到,这一场事故的影响如此之大,对我们小米的打击也如此之大。

雷军称,四年前决定造车的时候,一直特别担心安全问题,所以对汽车的质量和安全无比的重视。经过汽车团队这么多同事们三、四年的努力,我们 SU7 在上市的一年多的时间里面,质量一直是我们引以为傲的东西,在参与的所有权威机构的评测里面都拿到了最高分,但万万没有想到,这场交通事故,让我们意识到,公众对我们的期待和要求远超了想象。

他表示,我们一直觉得我们是汽车行业的新人,我们是一家创业的公司。但这一次的事件让我深深的理解,小米今天的规模、影响力、社会关注度都到了非常高的地方,社会和公众要求我们去承担一家真正的大公司行业领导者的责任。我们深刻的意识到,这是 15 年的小米无可回避的责任。15 岁的小米,不再是行业的新人,我们在任何一个产业里面都没有了新手保护期,我们要有更高的标准和目标。(来源: TechWeb)

马斯克 4000 亿薪酬被推翻,特斯拉修改公司章程打压股东诉讼

5 月 17 日,据彭博社报道,在埃隆・马斯克 (Elon Musk) 的天价薪酬被股东诉讼推翻后,特斯拉公司正采取措施防止未来再次出现此类情况。特斯拉在周五晚间披露,已修改公司章程,规定股东必须持有至少 3% 的公司股份,才能「发起或维持一项衍生诉讼」。衍生诉讼指的是股东代表公司对相关责任人发起的诉讼。根据监管文件,特斯拉是在 5 月 15 日修改的章程。

就在几天前,得州州长格雷格・阿博特 (Greg Abbott) 签署立法对该州公司法进行一系列修改,包括允许公司设定股东发起衍生诉讼所需的持股门槛。阿博特以及该州其他共和党领导人宣称,此举旨在吸引更多企业在得州注册成立。

正是股东诉讼导致马斯克的天价薪酬泡汤。特斯拉授予马斯克的薪酬协议在 2018 年获得股东批准,最初价值为 26 亿美元,但是在 2024 年初被裁定无效时已飙升至 560 亿美元 (约合 4036 亿元人民币)。在特斯拉股价飙涨时,其价值一度超过 1000 亿美元。然而,该薪酬方案遭到了一位股东的质疑。

在马斯克薪酬被推翻后,特斯拉把注册地从特拉华州迁至得州。目前,特斯拉已就该裁决向特拉华州最高法院提起上诉,这一过程可能耗时数月时间。

截至发稿,特斯拉尚未就此置评。(来源:凤凰科技)

 

消息称英伟达计划在上海设立研发中心

5 月 16 日消息,英国《金融时报》援引两位知情人士消息称,英伟达计划在上海设立研发中心,力图在其中国市场销售受挫的背景下维持在 AI 芯片领域的领先地位。

知情人士透露,英伟达 CEO 黄仁勋上月与上海市长龚正会面时提出了这一设想。公司目前正租用新的办公场地,以安置现有员工并为后续扩编预留空间。

知情人士表示,新设立的研发中心将专注于满足中国客户的特定需求。上海团队将参与全球研发工作,包括芯片设计验证、产品优化,以及自动驾驶等特定领域的研究。

黄仁勋希望吸引中国本土顶尖 AI 人才。目前,英伟达正为上海团队招聘多个岗位,包括开发下一代深度学习软硬件的工程师,以及设计和优化面向全球市场的 ASIC 芯片开发者。

有知情人士透露,上海市已对上述规划表达初步支持。(来源: IT 之家)

 

Meta 推迟发布旗舰 AI 模型 Behemoth,因能力提升遇到困难

5 月 16 日消息,据外媒报道,知情人士称,Meta 工程师难以大幅提升旗舰 AI 模型「Behemoth」(巨头)的能力,将推迟发布模型。

Meta 在 4 月发布了 Llama 4 模型系列中的两个小型模型 Scout 和 Maverick,但更大的 Behemoth 版本发布被推迟至 6 月。

现在,据报道,Behemoth 模型发布时间又被推迟到秋季甚至更晚,因能力提升并不明显。这也引发了公司内部对耗费巨资打造 AI 这一投资方向的担忧。

不过,外媒也提到,其他试图发布下一代重磅模型的顶尖 AI 公司也纷纷遇挫,比如说 OpenAI。去年 12 月,就有外媒报道,OpenAI 开发其下一个主要模型 GPT-5 的努力正落后于计划,其结果还不能证明巨大的成本是合理的。

值得一提的是,Llama 4 发布后,还因作弊刷榜、代码能力拉垮、伪开源等备受争议。(来源: TechWeb)

OpenAI 的 AI 程序员上线,人类仅需点按钮

5 月 17 日报道,昨夜,OpenAI 推出一款基于云的软件工程 Agent(智能体)——Codex的预览版。

Codex 可并行处理多项任务,例如编程、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,在云上运行并预加载用户代码库。

Codex 由codex-1 模型提供支持。codex-1 是 OpenAI o3 针对软件工程优化后的版本。目前,Codex 已面向 ChatGPT Pro、Team 和 Enterprise 用户上线,即将面向 Plus 用户上线。

OpenAI 同步推出 codex-1 的精简版本,基于 o4-mini 专为轻量级开源编码 Agent「Codex CLI」而打造,API 定价为1.5 美元/100 万 tokens 输入,6 美元/100 万 tokens 输出,即时缓存打七五折。(来源:智东西)

 

美团外卖推出「堂食店」标签:是否堂食并非检验品质的唯一标准

5 月 16 日消息,美团外卖官宣,为更好地帮助商家还原真实经营场景,面向消费者提供更加多元可信的参考信息,美团外卖近期对「明厨计划」进行了全面升级,推出「堂食店」标签功能,开放商家认证流程,并将在首页推荐位、专属标签等多个核心位置展示。

同时,自 4 月以来,美团外卖加大对「明厨亮灶」的补贴力度,面向夫妻店、社区小店等中小餐饮商户提供覆盖硬件设备购置、安装等费用的全额补贴,首期补贴总额达 5000 万元。

IT 之家注意到,美团外卖还称:「是否堂食并非检验品质的唯一标准,消费者更需要看得见的食品安全。我们期望,让每一份外卖都承载着安心与诚意,让每一家规范经营的商家都获得更多关注。」(来源:IT 之家)

 

腾讯混元图像 2.0 模型发布:毫秒级响应,一边打字一边出图

5 月 16 日消息,腾讯混元图像 2.0 模型(Hunyuan Image2.0)正式发布,在腾讯混元官方网站上线,并对外开放注册体验。

腾讯混元图像 2.0 模型主要有两大特点:实时生图、超写实画质。

相比前代模型,腾讯混元图像 2.0 模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度「显著快于行业领先模型」,在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元号称可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统「抽卡—等待—抽卡」的方式。

除了速度快以外,腾讯混元图像 2.0 模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像号称可避免 AIGC 图像中的「AI 味」。(来源:IT 之家)

 

魔法原子再获数亿融资,推动千行百业落地

近日,具身智能机器人公司魔法原子宣布完成数亿元新一轮战略融资。本轮投资方包括战略产业资本禾创致远、芯联资本,财务投资人华映资本、晓池资本、元禾厚望,老股东追创创投和翼朴基金持续追加投资,新资金将用于具身智能核心技术迭代研发,VLA 模型搭建,加速推动机器人在工业、商业场景落地。

短短半年内,魔法原子连续完成了两轮超亿元级融资。在此期间,魔法原子已逐步完成「全栈自研技术+全链路布局+场景化应用」闭环生态的搭建,为商业化进程提供根本保障。

魔法原子成立于 2024 年 1 月,专注于通用机器人和具身智能技术研发与落地应用,产品涵盖通用人形机器人与四足机器人,覆盖工业、商业及家庭等多元场景。(来源:极客公园)

三星首秀 Sensor OLED 技术:全屏识别指纹,支持心率检测

5 月 16 日消息,科技媒体 SamMobile 发布博文,报道称在 2025 年 SID Display Week 博览会上,三星显示(Samsung Display)公司展示 Sensor OLED 技术,内置传感器,能在屏幕任意位置检测指纹,甚至还能测量心率、血压和压力水平。

在传统 OLED 屏幕上,屏下指纹传感器只能在特定区域识别指纹;而 Sensor OLED 技术直接在制造过程中嵌入了有机光电二极管(OPD)层,实现全屏检测用户指纹。

更值得关注的是,Sensor OLED 技术不仅支持全屏识别指纹,还能像智能手表和健身追踪器一样,检测心率、血压和压力水平。其原理是利用 OLED 光线根据血管收缩和扩张的不同反射特性,通过 OPD 层将数据转化为健康信息。(来源:IT 之家)

 

荣耀 400 Pro 真机首曝:首发流光织锦工艺,最美荣耀手机

日前荣耀官方宣布,将在本月推出全新的荣耀 400 系列,包含荣耀 400 和荣耀 400 Pro 两款机型,目前该系列已在各大平台上架开启预约,受到了不少用户的关注。现在有最新消息,近日有数码博主进一步晒出了其中荣耀 400 Pro 的真机谍照。

据知名数码博主 @ 旺仔百事通 最新晒出的真机照显示,与此前曝光的消息基本一致,全新的荣耀 400 Pro 将至少提供幻夜黑、揽月银和海风蓝两款配色,其中海风蓝配色首发流光织锦工艺,将真丝感纤维与贝母珠粉等材料,在真空环境中层层压制融合,让每一块背板设计都与众不同,就像每一缕海风、每一捧流沙,都是独一无二,堪称是最美荣耀手机。除此之外,该机的后置相机模组将采用全新的「旷野舷窗」设计,通过背板至镜头的流畅过渡展现出与众不同的美感。

据悉,全新的荣耀 400 Pro 将在本月正式发布,由肖战代言。(来源: TechWeb)

全球首部全程 IMAX 胶片拍摄电影:诺兰新片《奥德赛》明年夏季上映

5 月 16 日消息,据外媒《好莱坞报道者》报道,克里斯托弗・诺兰执导的新片《奥德赛》将在明年夏季上映,这部改编自希腊史诗的作品不仅内容宏大,其制作方式也将开创历史:全球首部全程使用 IMAX 胶片拍摄的电影。

此前,《复仇者联盟 3:无限战争》就已经使用 IMAX 设备完成全片拍摄。但与前者不同,《奥德赛》则是首部全程采用 IMAX 胶片拍摄的电影,而非数字设备。IMAX CEO 里奇・盖尔方德在戛纳电影节期间的一场媒体午宴上宣布了这一消息,并透露这是诺兰率先提出的挑战。

据悉,升级后的摄影机更轻便、运作时的噪音也降低了三成。IMAX 还开发出全新的胶片扫描与处理技术,让拍摄时可以更快速地回看素材。当前这些摄影机仅供诺兰使用,《奥德赛》制作完毕后才会对其他导演开放。

自 2008 年《黑暗骑士》以来,诺兰就一直是 IMAX 技术的坚定拥护者,当时他首次用 IMAX 摄影机拍摄动作戏。从那以后,他的每部作品都采用 IMAX 拍摄。(来源:IT 之家)

 

56 年无人解开的数学难题,被谷歌的新 AI 突破了

2025年5月16日 16:31

去年,AI 能解出博士级别的数学题,已是轰动一时的大新闻;而今年,能攻克「未解之谜」级别的数学难题的 AI 已经来了。

5 月 15 日,Google DeepMind 发布了全新编程智能体 AlphaEvolve。

不同于传统的编程 Agent,它专注于通用算法的自动发现与持续优化。顾名思义,AlphaEvolve 擅长在「进化」中寻找更优解,它模拟自然选择机制,能在代码中不断迭代、演化出创新算法。

只要问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法。Google 表示,在组合数学、几何学、数论等超过 50 个未解问题中应用后,AlphaEvolve 在约 20% 的问题上超越了人类现有解法。

DeepMind 研究员 Matej Balog 表示:「AlphaEvolve 在十多个公开的数学问题上取得了突破。但最让我激动的是:它找到了 56 年以来,4x4 复数矩阵乘法算法的首次改进。这个结果,来自它自创的一种复杂搜索算法。」

AlphaEvolve 的价值不仅在数学,它展现出的是一种通用的「算法发现能力」。Balog 表示:「我们对 AlphaEvolve 的应用,还只是触及表层。」

问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法

Google DeepMind 表示,AlphaEvolve 能够在多个复杂问题中取得突破,关键在于其背后运作的是一整套自动进化机制,能持续优化算法并提升性能。

从本质上看,AlphaEvolve 解决的是一个通用的黑盒优化问题:maximize h(f)。其中,f 是由大型语言模型生成的程序,h 是衡量该程序质量的评估函数。

在实际流程中,AlphaEvolve 首先通过提示采样器(prompt sampler)组装提示词,引导语言模型生成代码。DeepMind 使用了两个不同的 Gemini 模型协同工作:Gemini Flash 以更高速度生成大量候选方案,扩展思路的广度;Gemini Pro 则提供更深入的结构性建议。二者结合,使模型能产出具备实际可行性和算法深度的程序。

生成的程序会被送入自动评估系统,经过验证、运行和打分后,写入程序数据库。数据库中运行着一套进化算法,会从已有程序中挑选表现最好的方案,为下一轮提示提供方向,不断迭代出更优解。

AlphaEvovle 的一个核心点就是这套自动评估指标。它能对生成程序进行验证、运行和评分。每一个程序都会被 h 函数衡量其准确性、运行效率、代码质量等维度。这些评分标准是客观、量化的,使 AlphaEvolve 能够在无需人类直接干预的前提下持续优化。

不过,这里的 h 函数依然由人类研究人员定义,可以是准确率、运行时间,甚至代码可读性等维度的组合。AlphaEvolve 负责的只是在给定 h 的前提下去寻找最优的 f。对于一些数学问题或研究任务,Google 也可能预设 h。

这也说明了 AlphaEvolve 当前的边界:它适用于那些「成果是否优秀」可以自动量化判断的问题。但如何定义「优秀」,仍需人来给出。在需要人类实验才能确定是否优秀的问题上,AlphaEvolve 就无法评估了。

以 DeepMind 研究员提到的 4×4 复数矩阵乘法为例,研究人员设置了一组任务目标,包括达到的最低乘法次数(即张量分解的秩)以及达到该结果的随机种子比例。这些信号构成了 AlphaEvolve 的优化目标,引导它在复杂的搜索空间中稳步「爬山」。

AlphaEvolve 从问题定义出发,基于标准的梯度优化流程(包括初始化器、重建损失函数、Adam 优化器等),演化出了一系列高质量的张量分解算法。最终,它在 14 个矩阵乘法结构上超越了已知最优结果。其中最引人注目的,是它提出了历史上第一个能用 48 次乘法完成 4×4 复数矩阵乘法的算法——打破了 56 年未被突破的记录。

AlphaEvolve 的技术路线可追溯到 DeepMind 早期提出的 FunSearch 系统。FunSearch 同样利用语言模型引导程序进化,曾被用于发现数学结构或在线算法策略。但与之相比,AlphaEvolve 的扩展性显著提升:它可以修改完整程序,处理多个函数、组件、甚至跨语言结构协同优化,而不仅限于 Python 中的单一函数。

这种更高的通用性,使 AlphaEvolve 不再只是一个「智能改函数」的工具,而像是一个可以自主演化大型算法系统的「程序设计伙伴」。

据 DeepMind 披露,AlphaEvolve 已被应用于 50 多个数学难题,涵盖数学分析、几何学、组合数学与数论等领域。大多数实验都能在数小时内完成部署。

在约 75% 的问题中,它成功重新发现了当前的最优解。更令人惊喜的是,在约 20% 的问题中,它给出了比已知方法更好的解法。比如在数学界研究了 300 多年的「接吻数问题」中,AlphaEvolve 构造出由 593 个球体组成的新结构,在 11 维空间中刷新了下界。

除了数学,AlphaEvolve 也已在 Google 内部实际落地应用,解决了计算栈中多个层面的工程问题,包括:为 Borg 系统设计新的调度启发式;优化大语言模型训练时使用的矩阵乘法内核;改写 TPU 芯片中的算术电路;加速 Transformer 注意力机制的执行速度。

这些任务之间跨度极大,但都具备一个共性:问题能用程序表达、结果能用函数评估。只要这两点成立,AlphaEvolve 就可以发挥作用。

更多的智能供给,带来无限的游戏

此次发布来自 Google DeepMind,这一团队曾推出 AlphaGo、AlphaFold 等具有里程碑意义的 AI 系统,在博弈智能与科学发现领域显著扩展了人工智能的能力边界。

AlphaEvolve,与依赖强化学习和自我博弈(如 AlphaGo)的系统不同,是通过语言模型生成大量程序候选,结合自动评估与进化机制,筛选出更优的算法方案。它更像是一种可编排、可扩展的算法构造与发现框架。

相比 AlphaGo 展示的是人工智能如何在规则明确定义的博弈中超越人类,AlphaEvolve 的意义可能更在于:它为研究者提供了一种持续、可扩展的算法生成与优化能力。

算法设计与调优历来是一种高度稀缺的技术能力。算法工程师在就业市场上普遍享有更高的薪酬与职位门槛,足以反映其复杂性与稀缺性。

而现在,只要设定明确的评估方式,AlphaEvolve 就有可能以接近无限的算力和耐心,自动探索并优化算法解法。这意味着,「发现并改进算法」这项曾依赖个体经验的能力,开始从稀缺、手工、不可复制,变为可自动化、可规模化的智能供给。

尤瓦尔·赫拉利曾经有一个比喻,形容 AlphaGo 为人类带来的冲击。

人类一直在围棋星球上探索如何下围棋,不断有人画出路线图,探索围棋星球的样貌。直到 AI 出现,人类才惊觉,自己不过是在围棋星球的一座小岛上原地打转,而真正的星球辽阔无边,未曾涉足的区域远超想象。

而去年到今年,在科研领域,我们也不断地看到 AI 正在做同样的事情。2024 年,AI 相关成果首次同时获得诺贝尔物理学奖与化学奖,而这很有可能成为未来的科研常态。

从某种程度上说,AlphaEvolve 所做的,是以前所未有的速度加快这张科研的「未知地图」的展开。以无限的智能供给,让每个领域都有可能被再探索一遍。

当「能被发现的算法」不再稀缺,人类对知识的征途,或许才刚刚开始。

 

 

雷军曝小米自研手机芯片,即将发布;5499,iPhone 16 Pro 卖爆;梁文锋署名论文,公开大模型降本方法

2025年5月16日 08:27

雷军官宣小米自研手机 SoC「玄戒 O1」

5 月 16 日消息,小米自研手机 SoC 芯片已经正式官宣,命名「玄戒 O1」,将于 5 月下旬发布。

这款突然出现的自研芯片让很多人非常意外,而且雷军还专门强调,这款芯片是小米自主研发设计。

小米这次保密工作非常好,目前为止没有透露出半点具体信息,大家都在猜测这款芯片的详细参数,尤其是制程工艺。据数码闲聊站爆料,这款芯片采用了最新先进工艺,填补了国内 5nm 以内先进设计的经验空白。(来源:快科技)

阿里巴巴集团 CEO 吴泳铭:AI 是历史性机遇,塑造以科技为核心动力的第二增长曲线 

5 月 15 日,阿里巴巴集团发布 2025 年 3 月份季度及 2025 财年全年业绩。阿里巴巴集团首席执行官吴泳铭表示:「本季度和整个财年的业绩显示,我们的『用户为先、AI 驱动』战略持续见效,核心业务增长继续加速。

在 AI 需求的强劲推动下,云智能集团季度收入增长加速至 18%,其中 AI 相关产品收入连续七个季度实现三位数增长。本季度,淘天集团客户管理收入同比增长 12%,反映了对用户体验的投入和商业化举措持续见效。

图片来源:视觉中国

在财报分析师电话会上,吴泳铭分享了 AI 领域的两大最新趋势:一是在大中型企业,AI 应用开始从内部系统向用户侧场景渗透;二是积极使用 AI 产品的客户,从大中型企业延展到大量中小企业,「2026 财年,我们将继续聚焦电商、AI+云的核心业务增长,面向中长期,塑造以科技为核心动力的第二增长曲线。」吴泳铭说。(来源:澎湃新闻)

 

特朗普:希望苹果停止将 iPhone 产业转移到印度 

美国总统特朗普表示,他已经要求苹果公司首席执行官蒂姆·库克停止在印度建厂。特朗普在卡塔尔国事访问期间谈及他与苹果 CEO 的对话时称:「我昨天和库克之间有点小摩擦,他正在印度各地建厂。而我不希望他们在印度建厂。」

特朗普表示,在这次交流之后,苹果将「增加在美国的生产」。特朗普还指出,印度是全球关税壁垒最高的国家之一,美国产品在该国销售「非常困难」。不过他补充说,印度方面已提出降低美国产品关税的建议,试图就进口税达成协议。(来源:格隆汇)

 

星纪魅族:从未计划砍掉手机业务

36 氪获悉,据星纪魅族官微,「近日,我们注意到微博平台有多名用户发表关于星纪魅族商业经营及魅族产品的不实言论,对星纪魅族的商誉、品牌价值及社会评价造成负面影响。」星纪魅族表示从未计划砍掉手机业务,并敦促相关用户删除不实言论并公开赔礼道歉,同时保留诉诸法律的权利。(来源:36 氪)

iPhone 16 Pro 成京东 618 手机销量王!128GB 照样被国人买爆 

5 月 15 日消息,日前,一年一度的 618 年中大促正式开启,厂商优惠叠加国补,对打算换新手机的消费者来说,是一个入手的好时间。

京东手机 618 竞速榜显示,榜单前三名全部被苹果手机包揽,分别是 iPhone 16 Pro、iPhone 16 和 iPhone 16 Pro Max。

降价+国补,iPhone 16 Pro 毫无悬念成为京东 618 手机销量王,128GB 版本补贴后售价 5499 元,如此空前的降价力度引发国人抢购,部分配色显示无货。(来源:快科技)

 

梁文锋署名 DeepSeek 新论文:公开 V3 大模型降本方法 

梁文锋亲自参与的 DeepSeek 最新论文来了。这一次,团队把 DeepSeek-V3 在训练和推理过程中,如何解决「硬件瓶颈」的方法公布了出来。

具体而言,DeepSeek-V3 之所以可以只用 2048 块 H800,就能达到超大规模集群(如数万块 GPU)相当的训练效果,核心在于四项创新技术:内存优化, 计算优化, 通信优化, 推理加速。

 

YouTube 新推「峰值时刻」广告,AI 助力精准投放提升观看体验?

YouTube 在本周三宣布了一项创新性的广告工具,该工具利用谷歌的 Gemini AI 模型,帮助广告商在观众观看视频最为投入的时刻投放广告。这一举措标志着 YouTube 在广告精准投放领域迈出了重要的一步。

该工具名为「峰值时刻」,其核心功能在于通过 AI 技术识别视频中观众注意力最为集中的时段,并在这些时段之后精准插入广告。YouTube 表示,这一功能的推出旨在提升广告的曝光效果,并有望显著提高广告的点击率,这对于创作者在视频平台上的收入来说是一个重要的衡量指标。(来源:ITBEAR)

 

王化回应小米汽车销量内容:无视周期的主观臆断 

快科技 5 月 15 日消息,小米集团公关部王化发文回应了近期有人扩散小米汽车销量内容的情况。他指出,这种行为是无视周期的主观臆断,非常不专业。

王化提到,假期前后消费重心通常会向旅游、休闲等领域倾斜,这是正常的市场现象。(来源:快科技)

苹果新一代 CarPlay Ultra 正式发布:深度整合车辆控制功能,阿斯顿・马丁车主率先用上 

5 月 15 日消息,在经历数月的延迟之后,苹果公司终于正式宣布推出新一代 CarPlay,并将其命名为「CarPlay Ultra」。从今日起,美国和加拿大的消费者在订购阿斯顿・马丁新车时,即可用上 CarPlay Ultra。此外,苹果还将通过软件更新的方式,将 CarPlay Ultra 引入现有的车辆中。

据苹果介绍,CarPlay Ultra 通过将车辆控制功能与 CarPlay 体验深度整合,实现了对车辆仪表盘和仪表的显示接管,包括空调、驾驶辅助系统等的开关控制,以及更高级的媒体控制功能。该系统不仅服务于车辆的主信息娱乐显示屏,而是车内的所有屏幕,例如数字仪表盘中的速度表、转速表、燃油表等。此外,CarPlay Ultra 的媒体和导航应用也能够无缝集成到仪表盘中。(来源:IT 之家)

 

索尼发布 WH-1000XM6 无线降噪耳机 索尼发布 WH-1000XM6 无线降噪耳机

索尼发布了 WH-1000XM6,这是该公司广受欢迎的无线降噪耳机系列的最新旗舰产品。XM6 几乎在各个方面都比前代产品有所改进,但价格也更高。(来源:ugmbbc)

新型 AI 芯片将大语言模型能耗减半 新型 AI 芯片将大语言模型能耗减半

美国俄勒冈州立大学科研团队研发出一种新型 AI 芯片,成功将大语言模型的能耗降低 50%。这项成果于近期在波士顿举行的 IEEE 定制集成电路会议上发布,是半导体领域的重大突破,有望成为解决大语言模型高能耗问题的「绿色钥匙」。

研究团队指出,问题的关键在于数据中心铜基通信链路的数据传输。高速数据交换不仅会产生误差,更会带来巨大的能源浪费。传统均衡器虽能纠错,但其自身就是「电老虎」。一种解决方案是开发更高效的有线通信芯片。

他们开发的新芯片能够借助 AI 技术,通过训练其上的分类器识别并纠正错误,以更智能高效的方式恢复数据,从而降低能耗。与传统设计相比,新芯片能使大语言模型消耗的能源减半。(来源:中国科技网)

微软叫板苹果:Windows 11 AI+ PC 性能比 M3 MacBook Air 快 58% 

5 月 16 日消息,微软官方账号「Windows」昨日(5 月 15 日)在其 YouTube 频道,分享了一段宣传视频,宣传口号为「我们比 Mac 快多了」,强势挑战苹果 MacBook Air。

微软在宣传视频中,明确表示在 Cinebench 2024 多核 CPU 基准测试中,相比较搭载 M3 芯片的苹果 MacBook Air 产品,Windows 11 AI+ PC 设备性能最多能高出 58%。(来源:IT 之家)

 

腾讯,开始新一轮「谨慎扩张」

2025年5月15日 13:05

 

头图来源:腾讯

 

5月14日,腾讯发布2025年第一季度财报。一季度,腾讯实现营收1800.2亿元同比增长13%,毛利1004.9亿元同比增长20%,经营利润(Non-IFRS)693亿元同比增长18%;微信及WeChat合并月活跃账户数增至14.02亿。

 

毛利与利润增速双双跑赢营收,已是连续第十个季度,反映出腾讯在提质增效方面的长期定力和短期成效。

 

不仅如此,腾讯在AI基础设施和应用生态上的投入也显著提速:一季度资本开支同比激增91%至274.8亿元,研发投入达189.1亿元,同比增长21%。AI正成为撬动公司全业务系统进化的核心杠杆。

 

管理层在财报电话会上大篇幅谈及「Agent AI」,明确释放出公司在下一代AI形态上的战略意图:不仅要构建通用型智能助手,更要打造深度融合微信生态的「特有型Agent」,将社交关系、小程序体系与AI连接,形成腾讯独有的产品体验。

 

1 AI布局走向深水区,Agent战略初露端倪

腾讯的AI战略进入深水区,从模型训练和通用问答的底层能力构建,逐步向产品与生态的深度融合迈进。

尽管财报未披露AI业务的具体营收数据,但管理层在电话会上大篇幅谈及Agent AI(代理式人工智能),释放出明确信号:腾讯正在推进一套更具长期想象力的AI路径。

腾讯董事会主席兼首席执行官马化腾在电话会上指出,目前AI Agent大致可以分为两类:一类是通用型Agent,另一类则是深度绑定微信生态的「特有型Agent」。

元宝已入驻微信|图片来源:腾讯财报

 

通用型Agent已开始在「元宝」「ima」等AI原生产品中落地,并正从简单问答逐步演进为具备复杂任务执行能力的助手——它们能够与其他程序或外部API打通,帮助用户完成实际操作。这一模式与行业内其他公司的Agent形态基本类似。

「特有型Agent」则依托微信的社交关系链、小程序体系和内容生态。马化腾谈到,「在微信生态系统中,我们有机会创建一个非常独特的Agent AI。它可以连接微信生态系统以及数百万个小程序。这些小程序涵盖了各种信息以及跨多个应用领域的交易和操作能力。因此,与更通用的Agent AI相比,这将是非常独特的,属于腾讯的一种差异化产品。」

目前,AI应用的发展重心目前仍集中在聊天交互,但未来形态正在悄然发生变化。腾讯总裁刘炽平表示,随着更多功能的上线,用户界面和交互方式将不再局限于传统的简单对话框。

「当我们尝试帮助用户完成更复杂的任务时,单纯的聊天界面已经难以满足需求,用户需要更长时间的深度参与,这就要求我们针对不同功能设计专属的使用场景和体验。」他强调。

目前,腾讯的元宝AI正处于扩展用户规模和提升用户活跃度的关键期。过去已证明,元宝能够留住用户,带给他们足够优质的体验,促使用户反复回访。下一步,将通过增加更多实用功能,激活现有用户的使用频次,同时吸引新用户加入。

更重要的是,腾讯将依托独特的社交、内容、小程序生态,尝试打造与传统AI聊天机器人截然不同的综合体验。与此同时,腾讯持续强化「混元」双模型架构,不断提升底层AI能力,为未来的多样化应用场景提供技术支撑。

这意味着,腾讯未来的AI不仅是「聊天工具」,而是一个多场景、多功能的智能助手,能够在社交、创作、工作等多领域实现无缝连接和高效支持。

与此同时,在底层资源层面,腾讯在芯片和算力方面也展现出更强的战略主动性。刘炽平透露,公司已提前储备大量高性能芯片,优先用于广告、内容推荐等具备短期ROI的应用场景,同时训练大模型仍是第二优先级。

刘炽平提到在过去几个月里,「我们摆脱了美国科技公司所谓的「扩展定律」,不再依赖不断扩展训练集群。现在我们发现,即使使用较小的集群,也能取得非常好的训练效果。训练后的优化潜力巨大,不一定需要非常大的集群。这让我们有信心,现有的高端芯片库存足以支持我们未来几代模型的训练。」

在推理阶段,腾讯也在通过软件优化、自研小模型、使用合规国产芯片等方式降低成本、扩展能力,这意味着腾讯的AI战略正在从「能力准备」向「规模化部署」过渡。

整体来看,腾讯的AI战略正在从「能力准备期」过渡到「部署执行期」,从通用AI走向更贴近实际需求的生态型AI。

2「双轨并行」,AI 已开始在财务数据中「显形」

在C端市场,AI已全面渗透腾讯用户场景,呈现出「双轨并行」的态势。

原生AI产品元宝借助混元+DeepSeek双引擎驱动,用户规模显著增长;同时,腾讯的核心产品也纷纷借助AI技术升级,微信、QQ、腾讯文档、QQ浏览器、腾讯会议、理财通等产品已通过AI能力深度整合,智能化体验持续升级。

在微信生态内,AI应用正加速落地。搜索场景不再局限于关键词匹配,而是向「理解用户意图+生成深度内容」的复合型搜索体验演进;公众号与小程序引入 AI 助力,提高内容创作与服务开发效率;视频号算法不断优化,分发更精准、用户粘性更强,同时始终扎根在微信「熟人社交」土壤之上。

而在产业端,腾讯也正将 AI 能力系统化输出。腾讯将混元模型与自研算力、知识引擎打包为API和SDK向外输出,覆盖从零售、汽车到医疗等多个行业。典型案例如一汽丰田通过AI客服提升解决率至84%,大参林构建医药行业首个AI知识库,已经体现出大模型在企业端的实际应用价值。

从底层能力来看,腾讯 AI 也在持续进化。今年推出的深度思考模型T1和快思考基座模型Turbo S,在多项国际基准测试中取得优异成绩。同时,腾讯混元在生成式AI领域持续创新,图片、视频及3D生成模型迭代升级,最新版本 3D 模型在几何表现与建模精度上提升超过 10 倍。

而AI技术也为腾讯自身带来了实实在在的业绩回报。在广告业务中,腾讯基于AI优化的投放系统,让广告主与用户之间的匹配更精准,多个垂类行业(如电商、本地生活、互联网服务)投放意愿明显上升,推动一季度网络广告收入同比增长26%至265亿元。

图片来源:腾讯财报

 

马化腾在财报中强调,「一季度,AI能力已经对效果广告与长青游戏等业务产生了实质性的贡献。我们正在加大对元宝与微信内 AI 功能的投入,相信高质量收入所形成的经营杠杆,有助于消化这些AI相关投入产生的额外成本,保持财务稳健。我们预期,这些战略性的AI投入将为用户与社会创造价值,并为我们产生长期、可观的增量回报。」

3 游戏稳步推进,探索长期护城河

在大盘稳定、AI布局深化的同时,腾讯也没有放松对游戏这一长期业务线的打磨。

腾讯游戏业务在2025年一季度延续强劲势头,收入595亿元,同比增长24%,成为营收增长的重要支柱。

其中,本土市场收入429亿元,同比增长24%,国际市场收入同比增长23%至166亿元,连续三季度创历史新高。得益于「长青战略」深化和国际化布局提速,腾讯在全球游戏市场展现出强劲竞争力。

腾讯的「长青战略」在一季度再显威力。《王者荣耀》《和平精英》《穿越火线:枪战王者》等旗舰产品不仅稳住基本盘,还创下流水新高。以《王者荣耀》为例,春节期间推出的新版本内容引发热潮,Sensor Tower数据显示,1月收入同比增长94%,创近42个月最高纪录。《和平精英》则通过引入DeepSeek大模型,推出AI助手与队友功能,为玩家提供个性化指导和对局陪伴,QuestMobile统计显示其3月用户时长同比增长16%。

图片来源:《三角洲行动》官网

 

新游《三角洲行动》成为一季度黑马,平均日活跃账户数位列本土市场第六,是近三年国内游戏中DAU最高的新作。

FPS品类的崛起是背后推手,刘炽平在财报电话会上指出,中国玩家对FPS游戏的偏好已从过去的10%-20%市场占比跃升至与全球接轨的40%-50%。新模式「提取射击」在《三角洲行动》和《和平精英》中大获成功,吸引了大量年轻玩家,显著扩大了市场边界。

端游《无畏契约》同样火爆,一季度网吧热度排行射击品类第一,4月在线人数峰值突破200万,6月还将推出手游版《无畏契约:源能行动》,进一步拓宽用户群体。

国际市场方面,《PUBG MOBILE》《荒野乱斗》《部落冲突:皇室战争》表现抢眼,驱动收入增长提速。166亿元的国际收入已接近本土市场四成,显示出腾讯全球化布局的深远成效。储备新作如《异人之下》《沙丘:觉醒》蓄势待发,预示着国际市场的更大潜力。

生成式AI也在逐步介入游戏内容创作。腾讯正在尝试用AI提升内容型游戏的制作效率,探索中长期下的用户生成内容(UGC)潜力。

刘炽平坦言,AI在竞技游戏的应用尚处早期,但潜力巨大,未来可能实现动态内容生成,让游戏体验随玩家选择而变。这种前瞻性尝试,正为腾讯的长青战略注入新的生命力。

 

4 新一轮「谨慎扩张」开始

 

一季度,腾讯资本开支达274.8亿元,同比增长91%,占营收15%;一般及行政开支同比增长36%至336亿元,此增长主要由于一笔40亿元的海外收购,以及为支持AI相关业务而增加的研发开支。

 

此外,腾讯在一季度加大了对元宝的推广,在部分营销投入增长被新游戏发布的广告开支减少所抵消的情况下,整体销售及市场开支增长4%至79亿元,占收入的百分比从去年同期的5%下降至4%。

 

回顾去年,腾讯全年资本开支达到了历史最高的767亿元。今年3月的财报电话会上,腾讯总裁刘炽平宣布将在2025年进一步增加资本支出,研发方面将继续投资于自研模型,并加速各业务集团AI应用的开发,同时也将加大市场营销投入,推动「元宝」的用户认知与使用转化。

图片来源:视觉中国

 

资本开支上升的另一面,是AI人才战略的持续升级。数据显示,截至一季度末,腾讯员工总数同比增长4627人,总人数达到109,414人,其中大部分增量来自技术岗位的扩张。

 

值得注意的是,在财报发布的前一天,微软WizardLM项目创建者徐灿在 X 平台上发文表示已经和团队离开微软,加入了腾讯混元(Hunyuan)大模型团队,「我们将继续我们的使命,推动大模型技术的发展,构建更强大的AI模型。」

 

这一消息在科技圈引发了广泛关注——WizardLM项目自成立以来,一直致力于高级大模型的研发,在自然语言处理(NLP)领域表现尤为亮眼。徐灿及其团队在微软期间,参与了多个AI项目,积累了丰富的实战经验和技术储备,这次转投腾讯,或许将为混元大模型注入新的活力。

 

而在更广阔的人才布局上,腾讯也在同步提速。此前在4月17日,腾讯宣布启动史上最大就业计划,三年内将新增 2.8万个实习岗位并加大转化录用,其中仅 2025年,就将迎来1万名校招实习生,其中约60%为技术岗位。

 

腾讯方面表示,随着大模型快速推进,腾讯加大了人工智能、大数据、云计算、游戏引擎、数字内容等技术类岗位的招聘力度,技术类岗位更是「扩招」力度空前。

 

 

❌
❌