普通视图

发现新文章,点击刷新页面。
今天 — 2025年5月20日极客公园

赴港上市,「宁王」剑指欧洲

2025年5月20日 14:27

5 月 20 日,宁德时代正式在港交所挂牌交易,发行约 1.18 亿股 H 股,定价为每股 263 港元。对这家电池巨头而言,上市是进入下一轮全球产业布局的起点。

早年,工程师出身的曾毓群在 ATL 担任技术负责人,参与解决聚合物锂电池膨胀等关键问题。2011 年,他创立宁德时代,推动公司从消费类电池转向动力电池业务,专注于能量密度更高的电池技术路径。十四年间,宁德时代率先建立起面向整车厂的大规模定制能力和产业链协同机制,并逐步在技术、产能和成本控制上形成综合优势,成为全球新能源汽车产业链中最重要的电池供应商之一。

如今,这家以他家乡命名的中国企业已连续八年位居全球动力电池出货量第一,全球市占率达到 37.9%,也就是说,全球每三辆电动车中,就有一辆搭载宁德时代的电池。

这次赴港上市,既是宁德时代面向海外市场、强化产业链布局的战略步骤,也是其在全球新能源竞争格局中,寻求资本弹性与长期增长支撑的关键节点。

曾毓群在 2024 世界新能源汽车大会上发言丨图源:宁德时代

 

01

「宁王」赴港,募资超过 230 亿港元

 

这不是宁德时代的首次上市。2018 年 6 月,宁德时代以 25.14 元/股登陆深圳创业板,首日股价大涨近 44%,市值此后一路上扬,不到三年时间突破 1.6 万亿元,成为 A 股市场中新能源板块的代表性企业。

但在 A 股之外,宁德时代显然有更长远的布局。本次赴港上市,被外界视为其全球战略的延续与调整。相比人民币主导的 A 股融资体系,港股具备更强的国际资本通道功能,有助于支持其在欧洲等区域的本地化投资与资源配置。据《每日经济新闻》报道,宁德时代表示,此次募集资金将重点用于海外产能扩张、国际业务拓展及境外营运资金补充。

根据招股书披露,宁德时代拟发行约 1.18 亿股 H 股,发售价为每股 263 港元,募资总额约 310 亿港元。其中公开发售部分占比 7.5%,认购反应热烈,截至 5 月 17 日,公开认购金额已超过 2800 亿港元,超额认购达 120 倍。

除了公开发售部分,本次 IPO 还引入 23 家基石投资者,认购超过 7700 万股,覆盖传统能源、金融投资与主权基金等多个背景。其中,中石化(香港)与科威特投资局分别认购 1473.68 万股,各占基石认购总额的 12.5%。

近年来,中东资本对新能源领域的兴趣持续升温。根据普华永道《2024 中东投资并购趋势报告》,在「去碳化」与「经济多元化」背景下,清洁能源、储能和电动汽车正成为主权财富基金的新重点。科威特投资局作为全球最早成立的主权基金之一,此次对宁德时代的认购,也被外界视作其能源转型方向的体现。

宁德时代福建宁德基地丨图源:宁德时代  

 

02

90% 融资将投向匈牙利超级电池工厂

 

根据招股文件,宁德时代计划将本次港股募资所得的约 90% 资金用于建设位于匈牙利德布勒森(Debrecen)的电池制造基地。

欧洲 48 国,电池巨厂为何花落匈牙利?德布勒森地处匈牙利东部,是宝马新工厂所在地,奔驰与斯特兰蒂斯也在周边设有整车产线,具备一定的产业集聚基础。相比西欧国家,匈牙利具备较低的综合运营成本,且作为中东欧交通节点,可实现对德国、奥地利、斯洛伐克等制造中心的陆路高效联通。

匈牙利项目总规划产能为 100 吉瓦时,投资额约为 73 亿欧元,占地 105 余公顷,是宁德时代在海外最大规模的投资项目。

按照规划,该工厂将分三期建设,一期项目计划达到 34 吉瓦时产能,投资总额约为 27 亿欧元,预期将于 2025 年完成厂房建设及产线投产。二期工程规划产能为 38 吉瓦时,投资金额约为 21 亿欧元,目前处于前期筹建阶段,预期将于 2025 年开始建设。三期产能尚未披露细节。

宁德时代披露,该项目是公司全球化战略的核心工程,主要面向欧洲主流汽车客户提供动力电池产品,支持其电动车本地化生产计划。此外,工厂将采用宁德时代自研的智能制造系统,并针对欧洲主流车型调整电芯结构和电压平台。

匈牙利电池厂的部署,正处于欧盟推动清洁技术本地化的大背景之下。2024 年 5 月,《净零工业法案》(Net-Zero Industry Act)正式通过。该法案提出,到 2030 年,欧盟希望至少 40% 的关键清洁技术产品能在本地完成生产,以降低对外依赖。尽管这一目标不具强制约束,但为电池等核心产业的本地产能建设提供了政策指引。法案中将电池列为重点支持领域,鼓励企业在欧盟内设厂、开展合资合作与技术转移,以提升产业自主能力。

除了匈牙利项目外,宁德时代已在德国图林根建有电池工厂,未来也将在西班牙等地推进区域业务合作。

宁德时代匈牙利德布勒森基地丨图源:宁德时代

 

03

国际化背后:「宁王」的扩张挑战

 

据 IEA 数据,2024 年全球电动汽车销量同比增长 25% 至 1700 万辆,动力电池年需求首次突破 1 太瓦时(TWh)。同时,全球储能装机规模也在迅猛攀升,2024 年新增储能装机量达 205 GWh,同比增长 53%。这一系列数据表明,无论是电动车动力电池还是储能电池,市场对电池的需求正持续高速增长。作为行业龙头,宁德时代深度受益于此趋势。

此外,宁德时代在产品技术方面具有优势。一方面,「麒麟电池」等拳头产品体现了其在电池集成和能量密度上的领先地位;另一方面,公司不断推陈出新,2023 年发布的「神行」超充电池、25 年发布「Naxtra 钠离子」电池品牌。这些产品与技术创新,不仅巩固了宁德时代在高端动力电池领域的口碑,也为其打开新的市场空间。

尽管市场空间广阔,宁德时代的盈利模式正受到价格战的挑战。近年来电池行业竞争白热化,主机厂压价趋势明显。2024 年在新能源汽车终端大打价格战的背景下,宁德时代动力电池和储能电池销量分别增长 18.85% 和 34.32%,但对应营业收入却同比下滑 11.3% 和 4.4%——这意味着单位电池价格显著下降。

激烈竞争中,宁德时代甚至在 2023 年第三季度对车企客户提供了返利支持,以帮助下游降本。所幸受益于锂矿价格暴跌和成本管控加强,公司毛利率未出现大幅下降。

但不可忽视的是,一旦原材料价格回升或竞争进一步加剧,电池业务「高投入、低回报」的风险便会凸显。总体而言,电池行业的价格内卷正在侵蚀利润空间,宁德时代的盈利模式面临的潜在风险需要持续通过技术升级和成本优化来抵御价格战的冲击。

图片来源:unsplash  

宁德时代的客户生态也在发生变化。众多头部整车厂正尝试打造自有电池供应链,以降低对宁德时代的依赖。这一「去宁化」趋势已初见端倪:特斯拉的 4680 电池开始量产,蔚来也投入自研高性能电池,宝马、大众等欧美车企则扶持 Northvolt 等本土电池企业崛起。目前,宁德时代前五大客户的营收占比已从过去的 60% 降至 50%,客户更加多元分散。当整车厂有了替代选择,宁德时代在合同谈判中的地位难免下滑,被迫以更具竞争力的价格和服务来留住订单。

国际化扩张是宁德时代应对这些挑战的重要一步,而本次 H 股上市正是宁德时代欧洲战略的一部分,但在国际化扩张道路上,公司同样面临诸多外部不确定性。

一方面,全球贸易保护和地缘政治博弈加剧,随着欧美出台《通胀削减法案》《新电池法案》,对电池产品的产地、原材料来源设限,中国企业面临更高的准入门槛和合规成本,迫使宁德时代加快推动本地化生产以满足监管要求。地缘政治的不稳定性令一些合作蒙上阴影。此前宁德时代与福特拟在美合建电池工厂,就因政策原因而改为技术授权输出,在美直接投资受挫。

尽管宁德时代努力通过「技术换市场」等策略来融入本地产业链,以专利和合作绑定海外伙伴从而降低贸易摩擦风险,但总体而言,国际市场的政策多变和地缘博弈成为横亘在宁德时代继续高速扩张道路上的一大变量。

曾毓群曾提出,宁德时代「不希望被定义为电池制造商,而要成为新能源产业的开拓者」。这句话的背后隐含着对单一制造盈利模式可持续性的警觉。展望未来,宁德时代的扩张逻辑能否持续,一大关键在于其利润获取能力能否与庞大的产业体量相匹配。

在机遇与挑战并存的当下,这家电池巨头能否在体量和利润之间找到新的平衡点,仍有待时间检验。

图片来源:unsplash

为什么 Qwen3,让我看到了 AI 应用落地的重大利好

2025年5月20日 13:41

各位有没有发现,最近大家对大模型已经有些看麻了?反正我是看到相关话题的文章流量、社交平台上的热度,对模型的关注度明显有点降下来了。

比如最近 Qwen3、Gemini2.5、GPT-4.1 和 Grok-3 等这么密集的有明显新进展的优秀模型发布,要是放到 2 年前,铁定是个炸裂的一个月。

不过当我在开发者群体里问了一圈后,发现大家实际的情况倒不是「麻了」,而是把「旁观的兴奋」变成了「行动上的提速」,开发者们对模型开始从「看」到「干」,已经转变了关注视角——模型的能力进步之外,是不是一个可以对自己所做的事情带来能力明显提升,或者说这个模型和开发者的「对齐」到底怎么样,开始整了一个重要视角。

比如 Qwen3 发之前身边的很多创业者和开发者就都知道 Qwen 团队在憋大招,不仅提早一个多月就在「蹲守」,而且也在第一时间就把他们手中正在开发的 AI 应用背后的模型切到了 Qwen3。最近跟他们聊起模型层面的新变化,发现 Qwen3 被提及的越来越多。

在他们看来,像过去两年那样只是看模型跑分来评价模型性能已经没有太大意义,因为随着模型能力的继续提升有了明确路径——预训练+后训练+强化学习,很多评测基准评估的比如像代码、写作等单项能力各家都会拉平,更重要的是它已经不能反映现实环境中实际使用模型的场景,尤其是今年按下了 AI Agent 应用的加速键后。

从这个角度看,Qwen3 在模型基础能力的提升之外,其实是向开发者层面的真实需求和场景做了大量「对齐」,可以说是专为开发者和企业易于采用来设计和打磨的。

举个例子,Qwen3 整体的一个优化目标就是以更低的成本实现强劲的性能,让开发者更容易能用起来、用得好,在这背后 Qwen3 其实做了大量目标拆解和技术实现,比如之前最受企业欢迎的 Qwen 模型尺寸其实是 72B,但在收到开发者反馈,说 72B 需要两张 H800 才能跑、不方便时,Qwen 团队探索了现在更高效的 32B,开发者也用得更好了。

Qwen3 的这条路径其实很有启发意义,通过在实际场景里向开发者做「对齐」来持续优化,Qwen3 也正在成为企业和开发者的「AI 应用落地最优解」。有了这样的预期,顺着模型的持续、全面迭代,水涨船高地做 AI 应用也成为开发者和企业在今年最确定的事。

 

01

 

如何向开发者「对齐」

其实最近 OpenAI 研究员姚顺雨(Deep Research、Operator 核心作者)在「AI 的下半场」一文中完整地聊过模型层面的变化,在创业者和开发者圈层也引起了可以说今年以来最广泛的共鸣。

在他看来,随着强化学习终于找到了可以泛化的路径,不再只是在特定领域奏效,比如打败人类棋手的 AlphaGo,而是可以做到在软件工程、创意写作、IMO 级别的数学、鼠标和键盘操作等等各方面都做到接近人类竞赛的水平。

这种情况下,比拼榜单分数、在更复杂的榜单上得更高的分数会更容易。换言之,这种评价方式已经过时了,现在比拼的是定义问题的能力。

从这个角度看模型,也才是 Qwen3 真正的含金量。因为基准评测里模型能力都很强,但一个评测基准里名列前茅的模型,对开发者来说却不一定是最优。

在这种情况下,开发者在实际场景中对模型更看重的东西是什么?

大的维度上,大概是模型性能、成本、易部署等几个角度。但在具体的场景里,就是不同的模型及其工具的技术实现方式了。这也是为什么 Qwen 一直采取全尺寸、全模态的智能上限探索,也会发布不同量化精度的模型版本让开发者在选择上有更大的自由度。

一位开发者帮我拆解了下,他说 Qwen3 系列有 8 个模型,包括两款 MoE(混合专家)模型和六个稠密模型,可以服务不同场景的不同需求。

在稠密模型当中,0.6B 和 1.7B 模型特别适合研究人员使用,它甚至可以在没有 GPU、没有独立显卡的情况下就可以跑起来验证一些数据集,做一些数据配比工作。

4B 和 8B 的模型则适合消费电子和汽车行业,因为这两个模型适合入端;4B 模型适合手机,8B 模型可以放在 AIPC 和智能座舱里面。

32B 的模型则在企业大规模部署上广受欢迎。另外对于 MoE 的两个模型,可以直接通过服务器做规模化部署,提高利用效率的同时、可以应用在更大规模的场景。

他觉得这么做是对的,因为只有像这样考虑到最多的细分需求组合,才能争取让各个场景里做不同产品的开发者都能有一个拿来就用的最佳实践模型,哪怕后续还需要开发者自己 DIY。

这次 Qwen3 在这个方向也作了进一步延伸,作为国内首个混合推理模型,将快速、简洁响应的快思考和更深层思维链推理能力整合于单一模型中,实现了推理模型和非推理模型的统一,开发者甚至可以自选「思考预算」来适配多样化任务需求。

企业场景里,基本上都会基于开源模型,结合自己的数据做一些微调。就像 Qwen3 这次的模型升级支持了 119 种语言,在日本市场虽然 Qwen3 才发布半个月,但已经比 Claude、GPT-4o 等模型还要更受欢迎,因为企业在开源的 Qwen3 基础上灌一些日语场景数据,这个效果就比单纯支持日语的闭源模型更灵活,可以实现四两拨千斤的效果。

当然这些之外,开发者对 Qwen 的态度,很大程度上还是来自于他们说的最多的一点——底模好。

底模好,意味着在基座模型上做蒸馏、微调后训练、强化学习等等都会有更好的效果。尤其是强化学习的 Scaling Law 更需要有一个优质的预训练模型,这是模型能够泛化的决定性因素之一。印象里,就连 DeepSeek-R1 那篇论文里展示的蒸馏小模型,也选了 Qwen 作为底模,通过利用 DeepSeek-R1 生成的推理数据,对 Qwen-7B 基础模型进行微调,将 DeepSeek-R1 的推理能力通过知识蒸馏的方式传递给 Qwen-7B,模型性能很好。

极客公园团队的同学和阿里云通义大模型业务总经理徐栋专门探讨过开发者体感上的底模好,到底意味着什么?怎么做到的?

徐栋认为每次模型能力的提升一定会体现在两点上,知识密度和指令遵循上。这使得过去的一些做不到、或者成功率低、需要抽卡的 AI 应用场景里,模型更「听话」了。Qwen3 就通过数据工程和算法迭代,进一步提升了在知识密度和指令遵循上的表现。

现在 Qwen3 可以在数据挖掘的任务上,依赖模型强大的知识密度与 SFT 阶段精细化训练,从 600 页招投标文档中精准抽取 88 个字段;在舆情监测场景,Qwen3 可以将消费者评价抽象为「小型车辆」「轿车」等标准化标签,避免过度拟合或笼统概括;在更常见的智能客服场景,Qwen3 可以精准捕捉用户需求、引导商品推荐时机,降低客户流失率。

随着今年整个行业开始跑步进入 Agent 领域,Qwen3 这次也非常及时地提高了 Agent 场景对模型提出的能力需求,优化了 Agent 工具调用和代码能力,同时也加强了对 MCP 的支持。结合封装了工具调用模板和工具调用解析器的 Qwen-Agent 框架,大大降低了编码复杂性,手机及电脑 Agent 操作等任务都开始变得更可行了。

这个优化还在继续,上周在 QwenChat 的官方网页上,我们还看到了 Deep Research(深度研究)和 WebDev(生成网页)这两个功能上线。这些是基于 Qwen 的 Agent 框架实现的。Qwen3 支持 agent 调用工具、也原生支持 MCP 协议,在对工具调用能力的 BFCL 评测中是顶尖模型里表现最好的。

Qwen3 的 Agent 增强能力,也在各行各业的客户场景中发挥作用。比如联想百应智能体平台在 Qwen3 发布后,马上就把他们平台背后的大模型引擎切过去。作为 IT 解决方案,百应平台利用 Qwen3 开源和对 agent 工具调用、MCP 支持的特点,再加上更强的推理能力,升级了 IT 运维(AI 服务)、AI 办公、AI 营销等场景方案,让中小企业在 AI 时代可以自己 DIY 垂直场景中的各种 Agent,实现了从提供生产工具到直接输送「数字员工」生产力的跃迁,进一步实现降本增效。

围绕开发者场景做模型的进一步迭代,向开发者做对齐,其实也是最近大模型厂商需要进行的集体转向。

前段时间 OpenAI GPT-4.1 核心研究员 Michelle Pokrass 也指出,有时候为了优化基准测试而调整模型,结果看起来不错,实际使用却发现一些问题,比如模型不遵循指令、格式怪异,或者上下文太短。这些反馈才确定了哪些评估指标是客户真正需要重点优化的。在她看来,GPT 4.1 的目标是让开发者在使用时感到愉快。GPT-5 现在的优化目标是让模型自己能分清楚什么时候开启聊天、什么时候开启深度思考,减少 OpenAI 模型供给带给开发者的复杂和浪费问题。

中美优秀模型开始有这样的共识,开始有意识地有了向开发者「对齐」,所以接下来的 AI 价值落地绝对是个利好。

 

02

 

「无脑入」之前破解下阿里的 COT(思维链)

跟用 Qwen 的开发者逐渐交流的过程,你会发现 Qwen 竟然开始有了粉丝效应一样的信任。这个信任其实根本上是来自于长期「情绪稳定」的成长。

你会发现 Qwen 一个月一更新,甚至 Qwen3 发布半个月,Qwen 家族就又更新了好几个模型了,这比 Llama 开起来「更勤奋」。

我记得 Hugging Face 中国区负责人王铁震总结他在 Hugging Face 开源社区上看到的 Qwen 为什么受欢迎的原因是,「量大管饱、更新快、底模好」,这份确定性让开发者确信持续会有最新最好最快的模型在手。

这个现象还挺有意思,AI 应用至少是下一个十年里相对长期和复杂的建设,确信有一个持续投入的模型,这件事太重要了。我们都说要水涨船高地做 AI 应用,AI 应用的开发者一定会希望水流量大、水涨得快、水源源不断,才能更安心地做应用。

想必这也是为什么 Qwen 会成为全球拥有最多衍生模型的开源模型,建立了自己的全球影响力。估计也是看到了 Llama 虽然坚持开源,但更新速度和性能距离同时期的闭源模型有差距。Qwen 如果可以一直坚持持续、快速给大家发最好的「枪」,持续开源全模态、全尺寸的 SOTA 模型,那这个开源旗帜就应该是 Qwen 扛起来。

所有的「如果」背后都必须有逻辑链的支撑。那么,阿里是不是会支持 Qwen 坚决地持续、全面开源 SOTA 模型这件事,就必须看一下阿里自己的 COT 是否和这个期待是相符的。

此前我写的分析阿里 AI 战略的文章梳理过,出于阿里巴巴自身的场景,一定会持续探索智能的上限。AI 时代,阿里「让天下没有难做的生意」的延长线,必然还是要为千行百业的 AI 创新和转型提供基础设施。这意味着,从算力到模型再到应用的每一层平台型机会——阿里云、Qwen 模型家族及其开源生态、应用平台都需要持续进化。其中最主要的目标,一定是追求 AGI 的实现,以此来突破现有业务的 AI 转型升级和 AI 原生应用。

而且,不同于比如背靠 Meta 的 Llama,阿里即便把研发成本高昂的 SOTA 模型开源,也可以通过阿里云实现业务闭环,作为亚太最大的云厂商,这是阿里坚决开源的底气。极客公园社区的很多创业者和开发者都跟我分享,别看开源模型好像不赚钱,只图技术品牌,但其实,Qwen 系列开源模型给阿里云带来了实实在在的收入增长,可以说是过去一年多阿里云最好的销售。选择了 Qwen 开源模型,一个很自然的选择就是购买阿里云,因为使用整个通义以及通义的衍生模型,在阿里云上面运行效率最好。

「阿里云是全世界唯一一家积极研发基础大模型并全方位开源、全方位贡献的云计算厂商」这句话阿里云说的其实体现了他们的目标。

因为 MaaS 已经成为阿里云的商业模式中非常重要的组成部分。从阿里云过往 7 个季度的增长看,使用通义 API 的客户,会带动相当多其他云产品的使用,这是非常明显的客户关联销售的效果。对阿里而言,无论未来模型能力和 AI 应用如何演进,AI 和云计算基础设施都有非常明确的商业模式——云计算网络。

Qwen 持续开源 SOTA,不仅和开发者、客户的利益是一致的,与生态上下游的利益也是一致的。这也是为什么 Qwen3 发布的第一天,非常多的终端和芯片企业宣布支持了 Qwen3 的模型,包括像英伟达,联发科和 AMD。某种程度上,开源的最大的朋友就是英伟达和服务器厂商,有了最好的开源模型,他们可以卖一体机、卖更多的 GPU。

可见只有促进了所有的生态上下游的繁荣,Qwen 本身的价值才可以在阿里更大的业务闭环里得到价值闭环。这个逻辑下,Qwen 必然「不用扬鞭自奋蹄」要扛起开源 SOTA 大旗,这是个让人看起来更安心的逻辑链。

终于有了让开发者「无脑入」、无风险、「薅羊毛」无压力,让开源模型可以成为商业世界可以稳定预期的一种技术基础,这非常重要。也是 AI 应用价值落地开始提速的重大利好。

罗永浩合作百度电商,523 正式开播;华为发布 23999 折叠屏鸿蒙电脑;小米 SUV 后天亮相

2025年5月20日 08:48

微软开发者大会开幕,AI Agent 成最大焦点

当地时间 5 月 19 日,微软一年一度的 Build 2025 开发者大会在西雅图拉开帷幕,「Agent」几乎贯穿每一项发布。

在去年的大会上,微软曾经打出 Copilot 副驾驶「无处不在」的概念——在操作系统、Office 应用、开发者工作流程等中集成 AI 助手。如今,GitHub Copilot 从曾经的代码助手变成 Agent 伙伴,从「结对编程」演变为「同伴编程」,开发者可以将问题分配给 Copilot 进行错误修复、新功能开发或代码维护,它将自主完成这些任务。

在 Windows 平台,微软推出了 Windows AI Foundry ,借助用简单模型 API,开发者可以通过 Foundry Local 管理和运行开源 LLM,或将专有模型迁移到客户端和云端进行转换、微调和部署。

此外,微软还推出了 Microsoft 365 Copilot Tuning,用户可利用自身企业数据、工作流程和业务逻辑,以简洁的低代码方式轻松训练模型并创建智能体。(来源:极客公园)

美国将审查 Apple 与阿里的 AI 合作

今日,根据《纽约时报》报道,美国白宫及国会官员在过去数个月来一直审查苹果与阿里巴巴的 AI 合作计划,因苹果希望将人工智能 Apple Intelligence 引入中国,而阿里巴巴是合作伙伴之一。

报道称,美国当局担心此次合作会协助中国公司提升 AI 能力,扩大中国聊天机械人的影响力,并加深苹果在北京审查及数据共享上的法律风险敞口。白宫及众议院中国问题特别委员会已经直接向苹果高层提出对今次合作的关注,并查问合作的条款、苹果将与阿里巴巴分享哪些数据,以及是否会与中国监管机构签署任何法律承诺。

消息人士称,美国政府已经在讨论是否应将阿里巴巴及其他中国 AI 公司列入禁止与美国公司开展业务的名单当中。(来源:新浪财经)

 

英伟达新总部落地中国台湾,计划 7 月开源物理引擎「牛顿」

5 月 19 日,在台北电脑展开幕的演讲中,英伟达 CEO 黄仁勋宣布了一条重磅消息:将在中国台湾省的台北市,建设一座新的公司总部!黄仁勋将这个新的总部命名为「NVIDIA Constellation」,也就是星座的意思。

从效果图上看,建筑风格和 NVIDIA 全球总部如出一辙,充满了科技感和科幻色彩。不过,黄仁勋并未披露它的建筑规模、入驻员工数、建成时间等。

此外,黄仁勋在演讲中提到,在物理世界中制造机器人「不切实际」,必须在遵循物理定律的虚拟世界中训练它们。他表示,英伟达与 DeepMind 和 Disney Research 研究合作开发了「全球最先进的物理引擎 Newton」,并计划于七月开源。

Newton 完全支持 GPU 加速,具有高度可微性和超实时操作能力,能够通过经验实现有效学习。其正在将该物理引擎整合进 Nvidia 的 ISAAC 模拟器,这一整合能够以真实的方式让这些机器人「活」起来。(来源:快科技、财联社)

 

小米首款 SUV 本周将亮相

5 月 19 日,小米创始人雷军在社交账号上官宣,小米 15 周年战略新品发布会定档 5 月 22 日晚 7 点。

这次重磅新品很多,包括手机 SoC 芯片小米玄戒 O1、小米 15S Pro、小米平板 7 Ultra、小米首款 SUV 小米 YU7 等。

目前小米 15S Pro 的跑分已经被曝光,首发搭载小米玄戒 O1。从目前的跑分成绩看(单核 3119 分,多核 9673 分,OpenCL 最高 22141 分),小米玄戒 O1 这次的新起点非常高,直接与天玑 9400 和骁龙 8 至尊版几乎同一起跑线。

小米平板 7 Ultra 则是一款 14 英寸的大尺寸平板电脑,有望同步首发搭载玄戒 O1,支持 120W 有线闪充。

小米 YU7 作为小米第一款 SUV 车型,早在去年就已现身工信部,小米曾预告 YU7 会在今年 6-7 月正式上市。(来源:快科技)

 

零跑 Q1 财报:营收上百亿,毛利率 14.9% 创新高

5 月 19 日晚间,零跑汽车发布 2025 年一季度财报。

报告期内,零跑汽车销量为 87552 辆,同比增长达 162%;营收达 100.2 亿元,同比增长 187.1%;毛利率达 14.9%,创历史新高。从净利润看,一季度亏损 1.3 亿元,较上年同期亏损 11.3 亿元大幅收窄;环比则由盈转亏。

零跑汽车称,一季度毛利同比改善主要由于销量上升带来的规模效应,持续进行的成本管理工作和产品组合的优化;环比改善的主要原因系战略合作带来的毛利增长。截至今年 4 月 9 日,零跑汽车已经达成累计交付超 70 万辆的里程碑。此外,公司称环比亏损增加的主要原因是毛利总额的下降大于费用开支的下降。

Wind 数据显示,今年以来零跑汽车股价涨幅已达 91.90%,公司总市值 832 亿港元。(来源:第一财经)

传英伟达计划投资量子计算独角兽

据科技媒体 Information 周日报道,英伟达正处于与量子计算初创公司 PsiQuantum 的高级投资谈判阶段。据参与此次交易的四位人士透露,此次谈判正值 PsiQuantum 在一轮融资中筹集至少 7.5 亿美元之际。

另据此前报道,PsiQuantum 正寻求以 60 亿美元的投前估值筹集资金,贝莱德预计将领投这轮融资。英伟达的参与此前并未被披露。

这一动作与英伟达 CEO 黄仁勋今年早些时候对量子计算前景的谨慎表态形成鲜明对比。今年 1 月,黄仁勋曾表示量子计算可能需要 20 年才能成为实用技术,但此后明显调整了立场。有媒体把英伟达对量子计算的关注形容为正在「押注下一个技术浪潮」。(来源:华尔街见闻)

 

零一万物确认联合创始人谷雪梅离职

5 月 19 日,零一万物确认联合创始人谷雪梅已于数月前离职,正在筹备创业。谷雪梅在零一万物期间主要负责模型预训练和 C 端产品。

零一万物自去年第四季度起调整业务,战略重心转向轻量化模型训练、微调和落地。公司 COO 黄蕙雯曾表示,不再做超大参数规模基座模型,而是关注 AI 的市场应用。

2025 年开年至今,零一万物的整体收入已超去年全年。(来源:每经网)

 

罗永浩宣布与百度电商战略合作,5 月 23 日晚首播

5 月 19 日晚间,罗永浩宣布与百度优选开启战略合作,将于 5 月 23 日晚 8 点开启首场直播。这是其继抖音、淘宝后,首次选择以 AI 技术为核心的新兴电商平台。据罗永浩所属机构「交个朋友」透露,此次合作源于双方对 AI 技术驱动电商变革的共识。

百度电商方面表示,双方将以 AI 技术为纽带,一方面通过罗永浩的选品能力为用户带来优质供给,另一方面借助百度的智能电商布局更多商家,推动直播电商向智能化、高效化升级。(来源:新浪科技)

鸿蒙电脑开售:7999 起,折叠屏 23999 元

5 月 19 日,华为正式发布两款鸿蒙电脑:售价 7999 元起的 HUAWEI MateBook Pro,以及首款鸿蒙折叠电脑、售价 23999 元起的 HUAWEI MateBook Fold 非凡大师,两款产品均搭载 HarmonyOS 5 系统,而非 Windows。

HUAWEI MateBook Fold 非凡大师是目前屏幕尺寸最大的商用折叠电脑,达到 18 英寸,整机重量 1.16kg,折叠后小于 13 英寸。屏幕全面展开时,可进行沉浸式文档处理或观看高清视频。屏幕折叠时则为传统笔记本形态,可通过配套键盘或虚拟键盘进行输入。

HUAWEI MateBook Pro 的定位则更偏向大众市场。整机重量为 970 克,厚度 13.5 毫米,被称为是华为史上续航时间最长的 PC(个人电脑)产品,官方称连续使用时长可达 10.2 小时。

余承东介绍,鸿蒙电脑实现了 AI 能力与底层硬件、操作系统、软件应用的融合,支持一句话完成 PPT 创作、从全盘文档中摘取信息并总结、自动生成会议纪要、一键进行电脑设置等 AI 功能。(来源:界面新闻)

 

新款蔚来 ET5T 内饰曝光:横向中控屏+配置 HUD

日前,新款蔚来 ET5T 的内饰实车图在网上曝光,新车将于 5 月 25 日正式上市。

从曝光的图片来看,最显著的变化是中控屏幕由竖屏改为 15.6 英寸的横向布局,这一改动与新款蔚来 ES6 保持一致。同时,新车还配备了全新样式的三辐式平底方向盘,其多功能按键布局和控制方式经过重新设计。并引入了怀挡式换挡机。

在副仪表台的设计上,新款蔚来 ET5T 也进行了调整。上层新增了双手机无线充电面板,并配备了 3 个物理按键。杯架布局也由纵置改为横置隐藏式设计,整体空间利用更为合理。

配置方面,新款蔚来 ET5T 将搭载与蔚来 ET9 相同的 NT.Cedar 雪松车机系统以及 NOMI 3.0 智能语音助手,并配备 W-HUD 抬头显示系统。此外,车辆还将搭载蔚来自研的神玑 NX9031 驾驶辅助芯片。(来源:IT 之家)

苹果考虑将 Apple Intelligence 品牌和 Siri 分离

近日,知名科技记者古尔曼发文揭示了苹果公司在 AI 领域落后的种种原因以及面临的多重挑战。

据古尔曼报道,预计在即将举行的苹果 2025 年全球开发者大会(WWDC 2025)上,苹果不会重点介绍 Siri 的重大升级。包括去年承诺但已延期的功能,可能仍需数月时间才能发布。

为了避免 AI 给其智能手机「拖后腿」,苹果也在不断进行内部调整,包括解散集中式 AI 团队,将 AI 人才分散到不同部门,以促进 AI 技术在各产品线的整合;加强 AI 隐私保护:通过「私有云计算」平台,确保 AI 模型的运行符合用户隐私和数据安全的要求。

同时,苹果计划在其他应用中添加更多的 Apple Intelligence 功能,例如添加一个由 AI 驱动的电池优化工具,推出虚拟健康教练 Project Mulberry 等。

有苹果消息人士表示,尽管对 LLM Siri 充满希望,但该公司也在准备将 Apple Intelligence 品牌与 Siri 分离开来。这也意味着,苹果不希望 Siri 的糟糕表现影响到 Apple Intelligence 的口碑。(来源:界面新闻)

微软大会拉来 Altman、马斯克,纳德拉的 AI Agent 野心藏不住了

2025年5月20日 07:21

微软的 AI 叙事,今年全面走向 AI Agent。

当地时间 5 月 19 日,微软一年一度的 Build 2025 开发者大会在西雅图拉开帷幕,「Agent」简直成了焦点,几乎贯穿每一项发布。

微软 CEO 纳德拉站在会场中心,还提出了一个变革性愿景:让更多的应用程序由智能体驱动,打造一个「Open Agentic Web(开放智能体网络)」

与此同时值得玩味的是,近年彼此有龃龉的 Sam Altman 和伊隆・马斯克都出现在大会连线屏幕上,与微软 CEO 纳德拉各自单独对话。与前两年不同,Sam Altman 今年并没有现场出席,甚至没有什么笑容,坊间不少传言称微软与 OpenAI 之间存在算力、模型访问等问题分歧。

微软已经官宣,除了 OpenAI 的模型,微软的 Azure AI Foundry 平台也将托管马斯克旗下 xAI 公司开发的 Grok AI 模型。

从云服务到生产力软件,再到搜索,甚至游戏,微软已经将 AI 融入几乎所有产品,根据公司最新季度财报,微软旗下 Azure 的积压订单有数千亿美元,包括与 OpenAI 本身签订的多年期云容量合同,预示着未来 AI 密集型交易的收入。

而 AI Agent,甚至是一个庞大的 Agent 智能体网络只会继续增强微软的 AI 叙事。

 

01

支持 MCP,更强的编程 AI Agent

 

在去年的大会上,微软曾经打出 Copilot 副驾驶「无处不在」的概念——在操作系统、Office 应用、开发者工作流程等中集成 AI 助手。

如今,连开发者工作流程里的 GitHub Copilot 也将要变得更加「Agentic(智能体化)」,不再仅仅只是个「副驾驶」。

微软曾在 2018 年以 75 亿美元收购 GitHub,此后 GitHub 继续以独立实体形式运营。在 GitHub 的 1.5 亿开发者里,根据纳德拉的说法,目前已经有超过 1500 万开发者在用 GitHub Copilot。

纳德拉在大会上演示,GitHub Copilot 从曾经的代码助手变成 Agent 伙伴,可以直接帮开发者修 Bug。

纳德拉现场用 Coding agent debug|图片来源:微软

根据纳德拉的说法,这意味,GitHub Copilot 正从「结对编程」演变为「同伴编程」,开发者可以将问题分配给 Copilot 进行错误修复、新功能开发或代码维护,它将自主完成这些任务。

例如,大会一个演示展示了 Copilot 拾取问题以向微软的某个网站页面添加过滤器、创建分支、设置 GitHub Actions,以及提交草稿,拉取请求等,Agent 在其自己的分支中工作并遵守安全措施。这使得开发者能够有效地委派软件工程开发任务。

微软正在提供对模型上下文协议(MCP)的全面支持,微软和 GitHub 方面已经加入了 MCP 相关委员会,以帮助推进 MCP 的大规模采用

另外,微软正在推出一个名为 NLWeb 的开放项目,称其「在智能体网络中可以发挥与 HTML 类似的作用」,使网站能够轻松地为用户提供对话界面,并根据用户选择的模型和自身数据,让用户能够以各种语义方式直接与网页内容交互。每个 NLWeb 端点同时也是一个 MCP 服务器,因此网站可以选择是否让它的内容更易于被 AI 智能体发现和访问。

 

02

微软的 Agent 大工厂

 

微软做 Agent 的野心当然不只是 GitHub 上的一个 Coding Agent,该巨头正在跨平台提供开发 AI Agent 的能力。

在 Windows 平台,微软推出了 Windows AI Foundry ,借助用简单模型 API,开发者可以通过 Foundry Local 管理和运行开源 LLM,或将专有模型迁移到客户端和云端进行转换、微调和部署。

Windows AI Foundry 支持跨各种硬件(包括 CPU、GPU 和 NPU)的开发,使应用程序能够在不同的芯片上运行。Windows 也添加了对 MCP 的原生支持。

Windows 也添加了对 MCP 的支持|图片来源:微软

大会上的一个演示展示了 VS Code 中的 Agent 如何利用 MCP 和 WSL 设置 Linux 环境,并仅用几句话就基于 Figma 设计构建/更新网站项目。此外,应社区的长期要求,Windows Subsystem for Linux(WSL)将完全开源。

通过 VS Code、GitHub Copilot 和 WSL,纳德拉直言要将 Windows 增强为「Agentic Web 开发的首要平台」。

与此同时,在 Azure 云,微软的统一平台 Azure AI Foundry 目前加入了更多模型,并且发布了 Foundry 智能体服务(Agent Service),开发者可以在上面设计、定制和管理 AI 应用程序和 Agent。

纳德拉介绍 Azure AI Foundry|图片来源:微软

随着 Azure AI Foundry 智能体服务的正式发布,开发者能够协调多个专用 Agent 来处理复杂任务,包括将 Semantic Kernel 和 AutoGen 集成到一个面向开发者的 SDK 中,并支持 A2A 协议和模型上下文协议(MCP)。

当然,开发者社区仍弥漫着谨慎的气息。为了推 AI agent,微软团队做了一个「可观察性」功能,通过统一仪表板集成、观测并追踪性能、质量、成本和安全等关键指标。

在 Agent 安全方面,微软宣布推出「Entra Agent ID」,这是一种身份管理系统,赋予每个 Agent 专属的身份、权限、策略和访问控制,开发者创建的 Agent 将自动在 Entra 目录中分配唯一标识,确保 AI agent 仅访问授权数据,避免因「智能体泛滥」而导致的盲区风险。

在模型支持方面,纳德拉在大会上官宣了将马斯克 xAI 的 Grok 系列模型引入微软的生态系统,截止目前,微软有 1900 多个合作伙伴托管和微软托管的 AI 模型。纳德拉还强调,微软已经建立了与 AI 模型开源社区 Hugging Face 的合作。

纳德拉与马斯克对话|图片来源:微软

另外,微软设了个模型排行榜,主要对不同类别和任务中表现最佳的 AI 模型进行排名;以及模型路由器(Model Router),实时为特定查询或任务选择最佳模型。

 

03

一键创建 AI Agent

 

除了给开发者提供利用、开发 AI Agent 的能力,微软在企业、消费者生产软件上也在加码「Agentic(智能体化)」。

此前,微软已经在其许多软件产品中推出 AI Copilot,旗舰产品就是 Microsoft 365 Copilot,多个 Office 应用程序(如 Word、Excel、PowerPoint、Outlook、Teams)都集成了 Copilot。

在 Build 2025 大会上,微软推出了 Microsoft 365 Copilot Tuning,简单来说,就是用户可利用自身企业数据、工作流程和业务逻辑,以简洁的低代码方式轻松训练模型并创建智能体。

这些 Agent 可以在 Microsoft 365 服务边界内执行特定领域的任务。例如,律师事务所可以创建一个 Agent,生成符合其专业特性和风格的文书。

Microsoft 365 内可创建 AI Agent|图片来源:微软

更进一步地,微软还在 Copilot Studio 中增加了「multi-agent orchestration(多智能体编排功能)」,可以连接多个 Agent,使他们能够整合技能,处理更广泛、更复杂的任务。

在前不久的季度财报会议上,微软称,有 20 多万个组织在用 Copilot Studio 开发定制 AI 应用程序,本季度创建了超过 100 万个定制 Copilot/智能体,据称这仅是产品预览阶段的数据。

另外,不管是微软还是谷歌,科学研究是科技巨头关注的重要 AI 应用场景。在 Build 大会上,微软宣布推出 Microsoft Discovery,它建立在基于图形的知识引擎 Graph RAG 之上,主要让科研人员能利用 AI agent 推进发现流程。Discovery 支持三步流程:基于知识的推理、生成假设和运行实验,所有这些都以迭代循环的方式进行。

微软推出 Microsoft Discovery|图片来源:微软

据称,斯坦福医疗中心(Stanford Health Care)正在使用微软的医疗智能体协调器开发测试 AI Agent,以减轻行政负担和加快肿瘤委员会会议的准备流程。

 

04

驶向「Agentic Web」

 

微软 CEO 纳德拉将当下视为重大平台变革的「中期阶段」,并让他联想到类似于 Windows 32、Web 堆栈以及云计算和移动革命带来的变革,而这一次,开放的 Agentic Web 可能就是下一个互联网的未来。

「2025 年,我们将大规模构建这个 Open Agentic Web(开放智能体网络)。我们将从几个垂直集成堆栈的应用程序,发展成为一个能够支持这个开放可扩展智能体网络的平台。」纳德拉在会上称。

纳德拉介绍开放智能体网络的愿景|图片来源:微软

根据其说法,开发者仍将是核心,微软的角色是为他们提供构建下一代 AI 应用程序和 Agent 所需的工具、平台和基础设施。平台转型的成功最终取决于开发者社区的创造力。

「赢家将是像你们一样构建应用程序的人,而不仅仅是像我们一样创建平台的人。」纳德拉声称。

当然,最终结果如何,还得看纳德拉演讲后的现实。一些已发布的功能可能会以预览版或测试版的形式发布,这些功能的实际效果也值得商榷。

一半海水一半火焰,全面 Agent 化也会对个人隐私、就业等产生影响。尽管微软最新季度财报业绩好于预期,甚至对未来有乐观预测,微软最近还是裁员 6000 人,其中不乏程序员。

今年 4 月,微软 CEO 纳德拉在与 Meta CEO 扎克伯克的对话中曾经透露,微软公司代码库里 20% 至 30% 的代码是由 AI 写的。微软 CTO Kevin Scott 此前还预计,到 2030 年 95% 的代码将由 AI 生成。另一边,谷歌 CEO Sundar Pichai 也曾称,AI 生成了谷歌超过 30% 的代码。

然而无论赢家到底是谁,微软对 AI 的投入是确定的。该巨头正在大力投资数据中心,过去三个月,就在各个国家和大洲开设了 10 个数据中心,并计划在 2025 财年继续投入 800 亿美元来扩展云基础设施。

一个庞大的「Agentic Web」,无疑能让微软的 AI 叙事更具诱惑力。

 

*头图来源:微软
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
昨天 — 2025年5月19日极客公园

中国 AI 大厂,被 Deepseek 掀了牌桌之后

2025年5月19日 19:47

 

过去几个月,尤其是2025年一季度,国内大厂在AI大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少了许多。对比去年同期,大厂几乎是轮番上阵、接连发布新成果,而今年则低调了不少,声音变得谨慎,动作也更克制。

这种转变,多少跟DeepSeek-R1在春节期间的发布有关,这个模型以开源、低价、高性能的组合,打破了“大模型=高投入、高门槛”的行业共识,也撬动了模型产业的权力结构。

它不仅刷新了开发者对开源模型的认知,也动摇了此前被大厂视为护城河的“重资产”范式。一时间,硅谷科技股应声回调,千亿美元研发投入的必要性也被重新审视。

而在国内,这场“技术地震”最先震动的,其实正是那些原本被认为应该在AI战役中冲在最前的大厂们。一边是像 DeepSeek、Manus 这样的新玩家用“小而强”“快而灵”的策略不断迭代突破,另一边却是大厂在产品落地、组织架构、技术方向上的多次调整与迟疑。

新玩家冲击的,不只是模型性能或训练成本,更是许多建立在历史经验基础上的路径依赖——比如“只有闭环才有护城河”“只有高预算才能出好模型”“只有通用大一统才是正确方向”。

越来越多的事实正在指向同一个结论:在 AI 快速演进的浪潮中,任何僵化的范式认知,都可能成为创新的绊脚石。

今天的大厂,正在面临一次理念上的转向:不再追求“我的模型服务我的应用”的闭环逻辑,而是回到“用最合适的模型,构建最好的产品”这一产品主义原点。

一系列深层次的战略重构,正在中国互联网大厂里悄然发生。

 

1 Deepseek-R1出现前,大厂鏖战大模型赛道,各自押注不同

 

回头看 2023 年,国产大模型赛道迅速升温,几乎所有有技术储备或生态优势的公司都在投入资源,试图在百模大战中找到自己的突破口。

 

彼时,百度、字节、腾讯等大厂纷纷亮出自研模型,“自研闭环”几乎成为主流打法(阿里则探索开源较早),强调的是“模型要自主可控,生态要自给自足”,从底层模型到应用产品都要打通。

 

在这样的背景下,百度主打“模型+搜索”路径,字节力推豆包,阿里对通义千问团队进行拆分以优化资源配置,腾讯则相对谨慎地投入“混元”大模型,整体更强调“应用场景驱动”,小厂中也出现了面壁、智谱、百川、月之暗面等一批专注通用大模型训练的“AI 六小龙”,试图在技术路线或创新方向上突围。

图片来源:视觉中国

 

彼时大家的竞争逻辑还建立在几个假设之上:1)自研能力越强越有护城河;2)参数量和能力相关,性能靠堆大模型赢;3)需要构建一个“自我可控”的模型+应用闭环。

 

但这些共识在 DeepSeek-R1发布之后被彻底打破。2025 年 1 月 DeepSeek-R1 的亮相,被行业视为一个“临界点”事件——一方面,它以极低的成本训练出了对标 GPT-4 的能力,公开技术细节并放出权重;另一方面,它代表着一种更彻底的“开源范式”:不是简单开放一个模型,而是直接让下游开发者“拿来即用”,训练思路、数据比例、推理效率都一目了然。

 

这直接打在了原来那种“闭环型自研”的路线要害上。很多大厂花大钱训练的模型,在DeepSeek-R1 面前变得毫无优势——不是能力不行,而是“性价比不行”:你没法再说“自研比别人更强”,因为别人把过程全开了,而且你追上也要几个月;你也没法说“闭环护城河更高”,因为别人三两天就能基于 DeepSeek-R1 搭个 demo,甚至用它打磨出产品。

 

这种“开源即能力平权”的冲击,不只打到了大厂,也打乱了 AI 小龙们的节奏。以面壁、百川为代表的“小模型派”,原本还希望在训练效率和推理速度上做文章,现在发现DeepSeek直接掀了桌子,把效率和能力统统平衡好了,而且是白送的——这让“闭源商业化”变得更加困难。

 

行业由此进入了一段显著的“战略迷茫期”:

  • 大厂开始重新评估自研的价值:是否还值得烧钱去追一个很可能被开源赶超的模型?是否应该把精力转向“拼装模型能力+打造 AI 原生应用”的组合打法?
  • AI 小龙们则面临最直接的生存压力:原来讲闭源、讲技术栈的优势正在消失;大厂又开始加速从开源模型中“拿货”,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找“差异化垂直场景”。
  • 投资人也在重新审视项目价值:一个大模型初创公司如果没有特别的创新机制或生态合作资源,其估值逻辑就会受到挑战。

 

总之,DeepSeek 不是推出了一个强模型这么简单,它更像是一次“范式洗牌”:用极致透明和开源方式打破旧有路径依赖,把“自研大模型闭环”从主流选项变成了一个“代价极高”的冒险。这个时刻之后,谁能快速认清现实,找到新生态位,谁才有可能留在下一轮的牌桌上。

 

2 震荡之后,大厂摸索新方向

 

DeepSeek带来的冲击在持续发酵时,整个行业一开始是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但具体要怎么应对、往哪儿走,其实那时候没有明确答案。

 

但从2月下旬开始,情况慢慢变了。大厂开始陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调“应用先行”“超级App”的落地路线,重新回到了“AGI优先”的轨道上。

 

这轮转向有几个关键的变化。

 

第一个变化是目标清晰了。过去讲AI应用的时候,很多公司都停留在“做一个超级 App”的层面,比如搞一个AI助手、一个AI搜索或者AI办公工具。

 

但现在,在字节与阿里最新的对外表达中,都明确把“冲刺AGI”作为最核心的目标。

 

在2月的全员会上,字节CEO梁汝波曾表示:「智能水平是最重要的,要把提高智能本身当成最重要的目标,而不是某个产品的DAU。」

 

3 月 ,豆包大模型部门召开全员会,明确部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。

 

“Seed Edge”是字节豆包大模型团队在年初组建的AGI长期研究团队,鼓励探索更长周期的AGI研究课题,如推理能力、感知能力、软硬一体化等。

 

这个项目强调“宽松的研究环境”和“长周期考核”,为入选课题提供独立算力支持,体现了字节对AGI的长期布局。

 

Seed Edge的目标是探索AGI的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。

 

可以看出,字节正在为通向AGI的下一阶段做技术储备。

 

2025财年财报后的电话会上,阿里 CEO 吴泳铭首次明确提出AGI是阿里AI战略的核心目标,甚至用了“AI将影响全球50% GDP结构”这样激进的表述。

 

这也意味着,阿里正在从强调“云+模型”服务能力,逐步走向更高层次的通用智能探索。

 

第二个变化,是对“开源”和“模型选择”的态度发生了实质变化。过去讲模型、做应用时,往往强调“全链路自主可控”,什么都要自己来。但现在,尤其是腾讯和百度,看起来越来越强调实用主义导向:谁的模型能力强就接谁的模型,应用产品的目标是用户满意、场景落地,而不是一定要套用自家大模型。

 

这背后,其实是每家公司在重新厘清自己的生态位——它在AI时代扮演什么角色,它的核心竞争力到底在哪里。

 

阿里的反应看起来“稳”一些,或者可以说是延续之前的节奏。

 

因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问(Qwen)系列在海外和开源社区持续表现强劲,Qwen2.5-Max一度号称性能超越DeepSeek-V3,而4月底刚开源的Qwen3,不仅成本显著降低,性能更是反超DeepSeek-R1和OpenAI-o1,登上开源模型榜首。阿里的打法很明确:先用模型性能证明自己,再用开源吸引全球开发者,把生态“引进来”。

 

不过,阿里的路径也并非一帆风顺。过去一段时间,由于组织架构频繁调整,大模型和AI业务一度陷入“各自为战”的割裂状态。但随着2024年阿里云重新整合、AI团队在马云回归后重新聚拢,阿里开始回到“集中力量办大事”的主模式。阿里云的回暖也证明了整合效果:在最新一个季度重新恢复双位数增长,再次稳坐国内市场头把交椅。

 

可以说,相比强调C端产品或Agent体验的打法,阿里正在重新确认自己在AI时代的角色——不是冲在最前的应用先锋,而是一个全球级的模型平台和技术基础设施提供者。

 

百度的选择,是比较务实的。一方面它有自己的文心模型体系,但另一方面它也明白,真正能打动用户的,是像百度文库、百度网盘这样的具体应用能不能变得更智能。所以在实际落地中,百度强调“谁好用就用谁”,哪怕不是自家的模型也没关系,只要能让文库变得更好用,就可以接入。

 

这种态度其实是经历过一次反思的。之前极客公园就曾经了解到,2024年百度内部其实是为了推动模型在各应用场景落地,分散了大量精力,导致文心团队反而没能集中精力把模型本身推上一个更高的台阶。新的调整,就是不再强求“模型服务所有应用”,而是让每个业务线根据场景灵活选择,把用户体验拉起来才是第一位。

 

而关于开源闭源之争,此前作为大模型闭源路线的坚定支持者,李彦宏此前曾多次公开表示,"闭源才能保证技术可控性、才有商业模式,开源其实是一种智商税"。

 

李彦宏在Create2025百度AI开发者大会|图片来源:百度

 

直到今年2月,百度选择了顺应开源的大趋势,宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。

 

腾讯的路径更清晰,也更符合它一贯的产品哲学。无论是微信、QQ还是游戏体系,腾讯最核心的资源就是这些连接用户的高频产品。对它来说,自研大模型不是必须的,关键是能不能把AI能力快速嵌入到这些产品里,提升效率和体验。

 

所以,当DeepSeek-R1新模型出现之后,腾讯是第一时间接入的公司之一,没有太多顾虑。毕竟据晚点报道,腾讯董事局主席兼 CEO 马化腾跟一些 AI 团队说过,“要好好与外部合作,不要想着什么都自己做”,以及“要清醒地认识到实际情况,不要过高估计自己的能力。”

 

2月13日,腾讯率先官宣接入“满血版”DeepSeek-R1,并迅速在全平台展开推广攻势。从微信、小红书到B站、知乎,元宝产品的广告铺天盖地,引发了用户对腾讯AI助手的集中关注。与此同时,腾讯内部也紧急协调,加速推动微信与DeepSeek的融合。

 

「元宝」入驻微信|图片来源:极客公园

 

相应地,腾讯也在组织架构上进行了一系列调整。继腾讯元宝从 TEG(技术工程事业群)并入 CSIG(腾讯云与产业事业群)之后,QQ 浏览器、搜狗输入法、ima 等更多产品也陆续划归 CSIG,组成腾讯在大模型时代面向 C 端的新产品阵列。同时,这些产品原本隶属的团队和组织也将从 PCG(平台与内容事业群)整体调整至 CSIG,以更集中地推进 AI 战略下的产品布局与升级。

 

这一系列快速动作,其实体现了腾讯对“AI是能力,不是目的”的判断。更强的模型、更开放的生态,只要能赋能微信和游戏,那就应该立刻用起来。这一波,它反而成了最快适应变局的一家公司——甚至可以说,这次AI开放生态的发展节奏,刚好踩中了腾讯最擅长的能力嵌套逻辑。

 

字节跳动则是四家里最复杂、或许也可以说是最纠结的那个。它一方面拥有豆包大模型体系,另一方面又掌握了抖音、今日头条、番茄小说等超大规模应用场景。既想做AGI技术的引领者,又不愿放弃在应用层面的优势闭环。

 

但这就带来了两头要抓的压力——模型要领先,产品也要突出,生态既要自洽又要开放。在DeepSeek-R1爆火之后,字节一方面开始重申“AGI是核心目标”,加强对豆包的投入,也在开源方面更多动作;另一方面在应用层也出现了新的挑战:到底是坚持“豆包+字节应用”的闭环路线,还是打破内外壁垒,接入更强的外部模型去赛马?

 

据晚点报道,字节跳动最初对是否将DeepSeek接入旗下产品持观望态度,内部普遍认为“随时可以接入,不急”。然而,时机稍纵即逝,春节过后,字节开始紧急调动团队加班开发,加速整合DeepSeek。

 

目前看,字节的策略还在过渡期。一方面,它在对外表达中强调开源、强调开放生态价值;另一方面,在内部系统上,豆包仍然是很多应用场景的默认选择,只在少许应用上开放对DeepSeek模型的接入。但未来会不会像腾讯一样,开始在更广泛的层面接入第三方模型,或者在某些应用上放开“自家模型优先”的原则,现在还没有完全看清楚。

 

过去几个月是AI大厂们重新定位自己的生态角色、重新判断技术路径的关键窗口期。经历了DeepSeek-R1带来的“能力维度重构”之后,各家公司几乎都开始重新聚焦AGI这个长期目标,同时也在技术和生态层面更加现实与开放。

 

不过,即便目标一致,路径选择依然千差万别。这背后,是每家公司对自身优势的认知差异,也是它们对“AI时代应该怎么跑”的不同下注。

 

3 技术颠覆面前,没有永远的「历史赢家」

 

AI 行业不会因为某一个产品突然“杀出重围”而终结对抗,它注定是一场持续上演的生态重构游戏——生态位置、能力分工将反复洗牌,而每一次冲击,都会逼迫玩家重新思考“我是谁、我该怎么做”。

 

在 DeepSeek-R1 的冲击下,大厂开始重新审视自己与 AI 的关系。这场变化不会停止:在AI这个快速演进的技术浪潮中,任何人其实都没有资格背负历史包袱。

 

历史包袱,不只是落后的产线、沉重的组织、冗余的团队,更是一种路径依赖式的认知惯性。

 

过去几年,整个AI行业积累了太多“默认共识”:比如做大模型一定要砸上亿美金、做AI应用一定要追求闭环、只有To B业务才能形成收入闭环、AI不是消费品只能是工具型软件……这些“理性判断”在过去的技术范式下看似正确,但在新路径被打通之后,很多“理性”就变成了限制想象力的牢笼。

 

技术革命的残酷性就在于,它并不会给巨头太多“吃老本”的机会。AI 的快速迭代,正不断吞噬那些依赖过往成功经验的惯性组织。于是我们看到:百度转向开源,腾讯放下身段借势引流,字节加速重构算力体系……这些动作背后,藏着大厂对现实的一种「觉醒」:在 AI 的无限游戏中,唯一的生存法则,是保持战略弹性——既要摒弃对历史经验的盲目依赖,也要以开放姿态,拥抱技术普惠的新趋势。

 

旧范式困住了谁?

 

回顾国内过去两三年内大厂与头部创业公司的发展路径,几乎都踩在一套“经典剧本”上:

  • 先围绕一个目标设定OKR;
  • 再从模型能力、数据体系、应用矩阵做完整闭环;
  • 最终希望通过模型降本、产品增长、生态协同走通商业路径。

 

这个逻辑没错,但问题是它太像过去互联网时代的打法了——它默认“资源越多,路径越清晰”;但AI的突变恰恰是在路径模糊中爆发的。

 

比如,之前很多团队一边追求“闭环场景”,一边困于“能力不足”;一边想讲“自主模型”的故事,一边又拿不到基础设施层的调优能力。很多战略决策是“既定假设+组织惯性”的结果——看起来合理,但没人停下来问:如果这些假设本身就错了呢?

 

反观这轮跑出来的新玩家,无论是DeepSeek、Manus,他们有个共同点:思维轻盈,没有历史负担,也没有路线执念,这反而让他们成了这轮范式跃迁的开拓者。

 

如果回过头去看,DeepSeek和Manus做的那些事,其实都没有多么玄学,甚至可以说都站得住工程逻辑。但为什么几乎没有大厂走这条路?因为它们过于理性、过于系统化,也就过于保守。

 

比如大厂可能会问:做MoE到底能不能规模化?极限调优是不是浪费时间?——这些问题本身没错,但当还没验证过路径,就先否定它,那可能永远不会发现新大陆。

 

这也是为什么,越来越多投资人、开发者、行业观察者开始重新审视AI创业的价值判断:不是谁能讲出最全的闭环,不是谁能招来最多的模型科学家,而是——谁能打破“历史正确性”,走出一条技术与产品都能快速验证的新路线。

 

在AI这条超高速前进的技术公路上,最危险的不是落后一步,而是还相信旧的红绿灯规则。真正的变化总是发生在“不合理”与“不被看好”之间。

头图来源:视觉中国

「AI 黑客」来袭,Agentic AI 如何成为新守护者?

2025年5月19日 14:44

01

AI 崛起:技术双刃剑下的安全暗战

随着 AI 技术的快速发展,网络安全面临的威胁日益复杂化,攻击手段不仅更高效、隐蔽,还催生了新型的「AI 黑客」形态,因此引发了各类新型网络安全危机。

首先是生成式 AI 正重塑网络诈骗的「精准度」。

简单而言,就是将传统的钓鱼攻击智能化,比如在更精准的场景中,攻击者会利用公开社交数据训练 AI 模型,批量生成个性化钓鱼邮件,模仿特定用户的写作风格或语言习惯,实施「定制化」诈骗,绕过传统垃圾邮件过滤器,大幅提升攻击成功率。

接着是最为大众所熟知的深度伪造(Deepfake)与身份冒用。在 AI 技术成熟之前,传统的「变脸诈骗攻击」,即 BEC 诈骗,全称为「Business Email Compromise」,具体为攻击者通过将邮件发件人伪装成你的领导、同事或商业伙伴,以此骗取商业信息或钱财、或者获取其他重要资料。

如今,「变脸」真的发生了。AI 生成的换脸、变声技术可伪造公众人物或亲友身份,用于诈骗、舆论操控甚至政治干预。就在两个月前,上海某企业财务总监接到来自「董事长」的视频会议邀请,对方通过 AI 换脸仿声称需紧急支付「境外合作保证金」,该总监依指示转 380 万元至指定账户,后识破系境外诈骗团伙利用深度伪造技术作案。

第三则是自动化攻击与漏洞利用。AI 技术的进步让大量场景向智能化、自动化演进,网络攻击自然也是如此。攻击者可借助 AI 自动扫描系统漏洞、生成动态攻击代码,并对目标实施无差别快速攻击,比如 AI 驱动的「零日攻击」在发现漏洞后会立即编写并执行恶意程序,传统防御系统难以实时响应。

就在今年春节,DeepSeek 官网遭遇 3.2Tbps 超大规模 DDoS 攻击,黑客同步通过 API 渗透注入对抗样本,篡改模型权重导致核心服务瘫痪 48 小时,直接经济损失超数千万美元,事后溯源发现美国 NSA 长期潜伏的渗透痕迹。

数据污染和模型漏洞同样也是一种新威胁。攻击者通过在 AI 训练数据中植入虚假信息(即数据投毒),或利用模型自身缺陷,诱导 AI 输出错误结果——这会对关键领域造成直接的安全威胁,甚至可能引发连锁灾难性后果,例如自动驾驶系统因对抗样本误判「禁止通行」为「限速标志」,或医疗 AI 将良性肿瘤误判为恶性。

02

AI 还需 AI 治

面对 AI 驱动的网络安全新威胁,传统防护模式已显乏力。那么,我们又有哪些应对之策呢?

不难发现,目前的业内共识已指向「以 AI 对抗 AI」——这不仅是技术手段的升级,更是安全范式的转变。

现有的尝试大致分为三大类,分别是 AI 模型的安全防护技术、行业级的防御应用以及更宏观层面的政府与国际协作。

AI 模型安全防护技术的关键在于模型的内生安全加固。

以大型语言模型(LLM)的「越狱」漏洞为例,其安全防护机制常因通用型越狱提示策略失效——攻击者通过系统性绕过模型内置保护层,诱导 AI 生成暴力、歧视或违法内容。为防止 LLM 的「越狱」,各家模型公司都做出了尝试,比如 Anthropic 就于今年二月发布了「宪法分类器」。

此处的「宪法」指的是不可违背的自然语言规则,作为一种在合成数据上训练的保障措施,通过规定允许和限制的内容,实时监测输入输出内容,在基准条件的测试中,其 Claude3.5 模型在分类器保护下,对高级越狱尝试的成功阻止率从 14% 提升至 95%,显著降低了 AI 的「越狱」风险。

而除了基于模型、更通用的防御手段外,行业级的防御应用同样值得关注,其垂直领域的场景化防护正成为关键突破点:金融行业通过 AI 风控模型与多模态数据分析构建反欺诈壁垒,开源生态借助智能化漏洞猎捕技术实现零日威胁的快速响应,而企业敏感信息保护则依托 AI 驱动的动态管控体系。

例如,思科在新加坡国际网络周展示的方案,可实时拦截员工向 ChatGPT 提交的敏感数据查询请求,并自动生成合规审计报告优化管理闭环。

在宏观层面上,政府与国际的跨区域协作也正加速推进。新加坡网络安全局发布《人工智能系统安全指南》,通过强制本地化部署与数据加密机制约束生成式 AI 滥用,特别针对钓鱼攻击中 AI 伪造身份的识别建立防护标准;美英加三国同步启动「AI 网络代理计划」,聚焦可信系统研发与 APT 攻击的实时评估,通过联合安全认证体系强化集体防御能力。

那么,哪些方法能最大限度地用 AI 来应对 AI 时代的网络安全挑战呢?

「未来需要 AI 安全智能中枢并围绕中枢构建新体系。」在第二届武汉网络安全创新论坛上,青藤云安全创始人张福曾在分享中强调以 AI 对抗 AI 方为未来网络安全防御体系的核心,「3 年内,AI 将会颠覆现有的安全行业,和所有的 2B 行业。产品将会重新构建,实现前所有未有的效率和能力的提升。未来产品是给 AI 用的,而不是给人用的。」

在一众方案中,Security Copilot 的模式显然对「未来产品是给 AI 用的」提供了很好的示范:一年前,微软推出了智能 Microsoft Security Copilot 副驾驶来帮助安全团队迅速准确地检测、调查和响应安全事件;一个月前,又再次发布了用于在钓鱼攻击、数据安全和身份管理等关键领域自动协助的 AI 智能体。

微软新增六个自研 AI 智能体以扩展 Security Copilot 功能。其中三个用于辅助网络安全人员筛选警报:钓鱼分类智能体审查钓鱼警报、过滤误报;另两个分析 Purview 通知,检测员工未经授权使用业务数据的情况。

条件访问优化智能体与 Microsoft Entra 协作,指出不安全的用户访问规则,并生成一键修复方案供管理员执行。漏洞修复智能体和设备管理工具 Intune 集成,助力快速定位易受攻击的终端,应用操作系统补丁。威胁情报简报智能体生成可能威胁组织系统的网络安全威胁报告。

03

无相:L4 级高阶智能体的保驾护航

无独有偶,在国内,为了实现真正意义上「自动驾驶」级别的安全防护,青藤云安全推出了 全栈式安全智能体「无相」。作为全球首个实现从「辅助型 AI」向「自主智能体」(Autopilot)跨越的安全 AI 产品,其核心突破在于颠覆传统工具的「被动响应」模式,使其自主、自动且智能。

通过融合机器学习、知识图谱与自动化决策技术,「无相」可独立完成威胁检测、影响评估到响应处置的全流程闭环,实现真正意义上的自主决策与目标驱动。其「Agentic AI 架构」设计模拟人类安全团队的协作逻辑:以「大脑」整合网络安全知识库支撑规划能力,「眼睛」细粒度感知网络环境动态,「手脚」灵活调用多样化的安全工具链,并通过多智能体协作形成信息共享的高效研判网络,分工合作、共享信息。

在技术实现上,「无相」采用「ReAct 模式」(Act-Observe-Think-Act 循环)与「Plan AI + Action AI 双引擎架构」,确保复杂任务中的动态纠偏能力。当工具调用异常时,系统可自主切换备用方案而非中断流程,例如在 APT 攻击分析中,Plan AI 作为「组织者」拆解任务目标,Action AI 作为「调查专家」执行日志解析与威胁建模,二者基于实时共享的知识图谱实现并行推进。

功能模块层面,「无相」构建了完整的自主决策生态: 智能体人设模拟安全分析师的反思迭代思维,动态优化决策路径; 工具调用整合主机安全日志查询、网络威胁情报检索及 LLM 驱动的恶意代码分析; 环境感知实时捕获主机资产与网络信息;知识图谱动态存储实体关联,辅助决策;多智能体协作通过任务分拆与信息共享,并行执行任务。

目前「无相」在告警研判、溯源分析以及输出安全报告这三大核心应用场景中的表现最为出色。

传统安全运营中,海量告警的真伪甄别耗时费力。以一次本地提权告警为例:无相的告警研判智能体自动解析威胁特征,调用进程权限分析、父进程溯源、程序签名验证等工具链,最终判定为误报——全程无需人工介入。在青藤现有告警测试中,该系统已实现 100% 告警覆盖率与 99.99% 研判准确率,并将人工工作量削减超 95%。

面对真实威胁如 Webshell 攻击,智能体通过代码特征提取、文件权限分析等跨维度关联,秒级确认攻击有效性。传统需多部门协作、耗时数日的深度溯源(如上传播径还原、横向影响评估),现由系统自动串联主机日志、网络流量、行为基线等数据流,生成完整攻击链报告,将响应周期从「天」压缩至「分钟」。

「我们的核心是将 AI 和人的合作关系扭转了,可以把 AI 作为一个人来合作,实现从 L2 到 L4 的跨越,即从辅助驾驶向高阶自动驾驶跨越。」青藤联创兼产品副总裁胡俊分享道,「随着 AI 能适配的场景更多,决策的成功率更高,逐渐能够承担更多的责任,这样人和 AI 之间的责任分工就会有变化。」

在溯源分析这个场景中,首先是 Webshell 告警触发「无相 AI」驱动的多智能体安全团队协同溯源:「研判专家」基于告警定位 one.jsp 文件,生成文件内容分析、作者溯源、同目录排查及进程追踪等并行任务,由「安全调查员」智能体调用文件日志工具,快速锁定 java(12606)进程为写入源,该进程及关联主机 10.108.108.23(通过访问日志发现高频交互)相继纳入调查。

智能体通过威胁图谱动态扩展线索,从单一文件逐层深挖至进程、主机,研判专家汇总任务结果综合判定风险。此过程将人工需数小时至数天的排查压缩至几十分钟,以超越人类高级安全专家的精准度还原攻击全链路,无死角追踪横向移动路径,红队评估也显示难以规避其地毯式调查。

「大模型比人工好是因为它能彻查边边角角,而非凭经验排除可能性低的情况。」胡俊解释道,「这样相当于广度和深度都更好。」

在完成复杂攻击场景的调查后,整理告警与调查线索并生成报告往往耗时费力。而 AI 可实现一键式总结,以可视化时间线的形式清晰呈现攻击过程,如同电影般连贯展示关键节点——系统会自动梳理关键证据生成攻击链的关键帧,并结合环境上下文信息,最终生成动态的攻击链路图谱,让整个攻击轨迹以直观、立体的方式呈现。

04

结语

很显然,AI 技术的发展为网络安全带来双重挑战。

一方面,攻击者利用 AI 实现攻击的自动化、个性化和隐蔽化;另一方面,防御方需加速技术创新,通过 AI 增强检测与响应能力。未来,攻防双方的 AI 技术竞赛将决定网络安全的整体态势,而安全智能体的完善将是平衡风险与发展的关键。

而安全智能体「无相」在安全架构与认知层面都带来了新的变化。

「无相」本质上是改变了对 AI 的使用方式,其突破性在于将多维数据感知、防护策略生成与决策可解释性熔铸为有机整体——从过往将 AI 作为工具使用的模式转变为给 AI 赋能使其能自主且自动地工作。

通过关联分析日志、文本、流量等异构数据,系统能在攻击者构建完整攻击链前捕捉 APT 活动的蛛丝马迹。更关键的是,其决策过程的可视化推理解释,让传统工具「知其然不知其所以然」的黑盒告警成为历史——安全团队不仅能看见威胁,更能理解威胁的演化逻辑。

这个革新的本质是安全思维从「亡羊补牢」到「未雨绸缪」的范式跃迁,是对攻防博弈规则的重新定义。

「无相」如同拥有数字直觉的猎手:通过实时建模内存操作等微观行为特征,它能从海量噪声中揪出潜伏的自定义木马;动态攻击面管理引擎持续评估资产风险权重,确保防护资源精准投向关键系统;而威胁情报的智能消化机制,则将日均万条告警转化为可行动的防御指令,甚至预测攻击变种的演化方向——当传统方案还在疲于应对已发生的入侵时,「无相」已在对攻击者的下一步落子进行预判封堵。

「AI 智能中枢系统(高阶安全智能体)的诞生,将会彻底重塑网络安全的格局。而我们唯一需要做的,就是彻底抓住这个机会。」张福道。

小米玄戒芯片跑分泄露,略低于高通骁龙 8;罗永浩现身百度杭州公司;谷歌 CEO 爆料,差点收购 Netflix

2025年5月19日 08:38

 

罗永浩被曝现身百度杭州分公司

5 月 18 日消息,昨晚有多位网友在网上晒图,称罗永浩现身百度。例如其中一位网友发图并配文「上厕所这是碰到了老罗?」

罗永浩一袭黑衣走在工作人员身后,背后墙面上挂着百度的 logo,而发帖人定位则是百度(杭州)分公司。

罗永浩此前投身 AI 创业新项目,其首款 AI 硬件产品 JARVIS ONE 此前已经曝光,由电池、指纹识别、Wi-Fi、麦克风和蓝牙模块组成,用户只需触摸并按住指纹识别区域即可激活语音命令。

此外,其初创项目 Jarvis 已于今年 1 月悄悄在海外上线,但在拥有众多粉丝基础的国内却一直没有动作。(来源:IT 之家)

小米 XRING 01 在基准测试中对决骁龙 8 Elite,10 核 CPU 集群多核得分仅低 7%

近日,小米正式公布了自主处理器芯片 XRING 01,而这款自行研发的芯片仅在几天后就出现在了新的基准测试泄露中。测试结果显示,尽管骁龙 8 Elite 比它的速度更快,但优势并不大,这表明这家中国公司十年的研发投入终于结出了硕果,并对高通和联发科等公司构成了真正的威胁。

Geekbench 6 的跑分信息由爆料人 @Jukanlosreve 上传,这款设备是小米 25042PN24C,采用「2+4+2+2」架构,其中最快的大核心可能是 ARM 的 Cortex-X925,主频为 3.90GHz。此前,有传言称 XRING 01 将采用这家英国芯片设计公司的当前一代设计,而非自主研发的内核,但该传言中提到 Cortex-X925 的主频为 3.20GHz。

这次,频率提升至 3.90GHz,暗示 XRING 01 是采用台积电 3nm 工艺而非较老的 4nm 节点量产的,因为只有这种光刻技术才能让 SoC 维持这样的时钟速度并在可接受的温度下运行。接下来,我们有四个核心运行在 3.40GHz 的频率下,我们再次怀疑是 Cortex-X925。至于其余的,它们可能属于 Cortex-A725。

为了帮助 XRING 01 与骁龙 8 Elite 和天玑 9400+ 等处理器竞争,并将其单核和多核得分提升至 2709 分和 8125 分,小米可能增加了核心数量,尽管这可能会降低其效率。相比之下,小米 15 Pro 的单核和多核得分分别为 2919 分和 8699 分,这使得 XRING 01 在多线程方面仅慢了 7%。(来源:cnbeta)

 

苹果将允许欧盟 iPhone 用户放弃默认使用 Siri

据彭博社报道,苹果计划让欧盟用户能够设置除 Siri 之外的默认语音助手。

苹果计划在多个软件平台上引入这一变化,这可能至少意味着 iPhone、iPad 和 Mac。

据推测,这意味着欧盟用户将能够将 Amazon Alexa 或 Google Assistant 等选项设置为苹果设备上的默认语音助手。

报道称,苹果公司正在为应对欧盟不断扩大的监管规定而做出这一改变。

苹果已经允许欧盟的 iPhone 用户将第三方应用程序设置为浏览和消息传递、导航等功能的默认选项。(来源:网易)

 

宁德时代推出 75# 标准化换电块,将建设「八横十纵」换电绿网

5 月 18 日,由中国交通运输协会与宁德时代联合主办的「新一代重卡换电生态发布活动」在山西大同举行。活动上,宁德时代正式发布 75# 标准化换电块及全场景底盘换电解决方案,并宣布将在 2030 年建成覆盖全国 80% 干线运力的「八横十纵」换电绿网目标,以及三年内推动重卡电动化跨越 50% 的市场渗透率目标。

宁德时代董事长兼 CEO 曾毓群表示,在零碳转型和物流降本的双重挑战和机遇下,未来 3 年重卡行业将迎爆发式增长,实现 50% 的电动化率。

宁德时代还将投入资源建设换电干线组网。根据规划,2025 年将在京津冀、长三角、大湾区等 13 个核心区域建成 300 座换电站,贯通沧榆线、京沪线 (G2)、沪广线、沪蓉线等 11 条干线。到 2030 年之前,将建设一张「八横十纵」的全国换电绿网,组成 16 大城市群换电网,这全长 15 万公里的高速及国省道干线,将覆盖 80% 的干线运力。(来源:央广网)

谷歌 CEO 爆料:曾认真考虑过收购 Netflix,差点就成了

5 月 17 日,据《商业内幕》报道,谷歌公司 CEO 桑达尔·皮查伊 (Sundar Pichai) 在接受采访时爆料称,谷歌曾经「非常认真」地考虑收购流媒体视频公司 Netflix。

他表示,像 Netflix 这样的收购案曾在公司内部「被激烈讨论过」,而且谷歌当时「差点」就达成了这笔交易。不过他随后澄清说,放弃收购的决定并不算是一个「遗憾」。

自 2016 年启动全球扩张以来,Netflix 一直引领娱乐行业发展,订阅用户已突破 3 亿。尽管谷歌通过其智能电视平台 Google TV 以及互联网直播服务 YouTube TV 进入了电视领域,但它从未像 Netflix 那样成功打入传统流媒体市场。

长期以来,谷歌一直喜欢通过高调收购交易来吞并竞争对手,但 Netflix 是该科技巨头公开承认曾考虑收购的最大牌公司之一。多年来,谷歌成功收购了多家如今已成为其核心产品线一部分的公司,包括 Waze、Wiz、Nest、Fitbit、Android 以及 YouTube。(来源:凤凰网科技)

 

公务用车集中采购要求选用国产车,优先选用新能源汽车

5 月 18 日消息,中共中央、国务院印发了修订后的《党政机关厉行节约反对浪费条例》(以下简称《条例》),并发出通知,要求各地区各部门认真遵照执行。

《条例》指出,完善政府采购管理交易系统,推进电子化政府采购。

《条例》提到,公务用车实行政府集中采购,应当选用国产汽车,优先选用新能源汽车。

《条例》还称,党政机关政务信息系统建设应当统筹规划,统一组织实施,防止分散重复建设和频繁升级。建立共享共用机制,加强资源整合,推动重要政务信息系统互联互通、信息共享和业务协同,降低软件开发、系统维护和升级等方面费用,防止资源浪费。(来源:新华社)

 

Manus 生图功能登场,从设计到搭建网站一站式搞定

Manus 推出图像生成功能,除单纯生图外,还能理解用户意图、规划解决方案,并知道如何调用各种工具完成任务。

该工具通过智能体工作流实现从品牌设计到网站部署的一站式服务,新用户可获赠 1000 积分免费体验。实测显示图像生成效果不错,但网站部署等复杂任务运行速度较慢,需等待数分钟至十几分钟不等。(来源:机器之心)

联想拯救者 Y7000 2025 新品预热:重约 2Kg,双烤性能释放 170W

5 月 18 日消息,联想 15.3 英寸的拯救者 7000 系列新品将于 5 月 20 日揭晓。

根据预热信息可知,这款新机升级「乾坤散热 2.0」,双满功耗性能释放高达 170W,兼具 15.3 寸轻巧机身,重量约 2Kg。

作为参考,已经公布的拯救者 Y7000P、R7000P 2025 也采用了「乾坤散热 2.0」,内置 3D Blade 猎鹰风扇 2.0,性能释放可达 195~200W。

联想拯救者 Y7000 2025 搭载 i7-14650HX 处理器、RTX 5060 显卡、16GB DDR5 5600 内存以及 512GB 固态硬盘(IT 之家注:双盘位),采用 15.3 英寸 LCD 屏(2.5K 分辨率 180Hz 刷新率、400nits 亮度、3ms 响应、X-Rite 色彩管理)。(来源:新浪)

 

魅族推出 PANDAER 超轻量合金电竞鼠标:PAW3395 + 星闪 Nearlink,499 元

5 月 18 日消息,魅族现已在自家商城上架一款 PANDAER 超轻量合金电竞鼠标,该鼠标支持星闪 Nearlink 连接、58 克重量、PAW3395 传感器、凯华微动,定价为 499 元。

据介绍,相应电竞鼠标外观方面采用镁铝合金 CNC 工艺,支持更换背部组件(可换为金属镂空背板 / 黑透背板),采用星闪 Nearlink 方案,延迟最低 0.125ms,鼠标同时搭载 PAW3395 传感器 + 海思 BS25 主控,提供 26000 DPI 灵敏度。(来源:IT 之家)

深圳交警引入新款大疆警用无人机,可抓拍司机开车玩手机违法行为

5 月 18 日消息,据深圳交警官方微博,深圳交警近日为高速引入一台新款 DJI 大疆警用无人机,可对分心驾驶和开车玩手机等行为进行抓拍。

深圳交警在视频中强调了这款无人机具备的防风、防水特性,透露相应无人机可在阴天微雨天使用,能够准确锁定不文明的驾驶行为。

交警展示的画面中,一位货车司机边开车边玩手机,无人机摄像头牢牢锁定货车,并进行高清抓拍,抓拍后还会有语音提示。

目前,深圳交警对开车玩手机行为处罚较为严格,查证后将会对驾驶员处以 300 元及 2-3 分处罚。(来源:腾讯新闻)

 

昨天以前极客公园

ChatGPT 或将支持 MCP;字节跳动调整福利政策;洛杉矶奥运会将引入「空中出租车」

2025年5月18日 08:35

OpenAI 计划在阿布扎比建设的数据中心将比摩纳哥更大

据彭博社报道,OpenAI 准备帮助在阿布扎比开发一个容量高达 5 千兆瓦的数据中心园区,该公司将成为该项目的主要租户,该园区可能成为全球最大的人工智能基础设施项目之一。

据报道,该设施占地面积高达 10 平方英里,耗电量相当于五座核反应堆,远超 OpenAI 及其竞争对手宣布的任何现有 AI 基础设施。

OpenAI 在美国的第一座星际之门园区(已在德克萨斯州阿比林开发)预计将达到 1.2 千兆瓦,而这家位于中东的园区的容量将是该园区的四倍以上。(来源:cnBeta)

比亚迪加速内部整合,消息称腾势、方程豹品牌公关部回归集团

5 月 17 日消息,「每人 Auto」今日发布消息称,比亚迪于 4 月底发布公告,将旗下两大高端品牌腾势、方程豹的品牌公关部进行了调整。

此前,腾势、方程豹品牌公关的团队分别隶属于腾势销售事业部、方程豹销售事业部,调整后,上述两个品牌的公关团队平级移至比亚迪集团品牌及公关处,为其二级部门,最高负责人为比亚迪集团品牌及公关处总经理李云飞。

报道援引比亚迪员工的说法,集团内部汽车业务主要由汽车工程研究院、新技术研究院负责车型研发设计,产品交由王朝网、海洋网、腾势、方程豹、仰望销售事业部来负责营销。

而此次调整,则意味着集团将给予两大品牌更多的资源支持,希望打造更强的品牌力。(来源:IT 之家)

 

奇瑞再被曝将在英国建汽车厂,目前在当地已有 70 余家经销商

5 月 17 日消息,据外媒 AutoCAR 报道,奇瑞汽车英国公司负责人 Victor Zhang 透露,未来将在英国设立工厂,以及包含上下游产业链的制造基地,另一位奇瑞英国高管则表示,英国生产是奇瑞在英国的「最终目的地」。

报道称,目前奇瑞在英国已经拥有 70 余家经销商,该公司计划在 2026 年(明年)将这一数字翻番。

据悉,早在 2023 年 6 月,就有英国当地媒体披露,包括奇瑞在内的中国汽车制造商已与英国方面进行会谈,讨论在当地制造汽车。不过目前奇瑞在英国生产事宜还未最终确定。(来源:IT 之家)

 

OpenAI ChatGPT 被曝将支持 MCP 协议,可接入第三方 AI 服务

科技媒体 bleepingcomputer 在 5 月 16 日发布博文,报道称 OpenAI ChatGPT 正测试整合 MCP 协议,扩展该 AI 聊天机器人的第三方服务。

MCP 可以比喻成 AI 应用的「USB-C 接口」,AI 助手通过受控接口访问数据,例如列出表格、读取数据或执行 SQL 查询,从而实现数据库探索和分析等任务。

虽然 MCP 对普通消费者的直接用途可能有限,但对企业而言,它可能带来颠覆性改变。企业能够通过 MCP 将内部工具与 ChatGPT 连接,按需共享数据,优化工作流程。

据社交平台 X 用户 Tibor 爆料,ChatGPT 正在测试一项「连接器设置」(Connectors settings)功能。用户可点击「自定义」(Custom)选项,添加新工具,并填写工具名称、URL 和描述等信息。

该功能让 ChatGPT 能无缝对接用户自有应用或 API 实现,对 MCP 支持目前仍在内部测试阶段,OpenAI 预计将在未来几天或几周内正式公布这一功能。(来源:IT 之家)

刘强东给母校中国人民大学捐赠的教学楼「京东群学楼」今日投用

据「京东黑板报」,中国人民大学社会学院楼「京东群学楼」昨日在通州校区正式启用。

「群学」,为社会学的旧译名,亦指学派交汇,融会贯通。京东群学楼为人大校友、京东集团创始人、董事会主席刘强东捐赠冠名建设项目,总建筑面积约 3.1 万平方米。

2017 年在人大 80 周年校庆之际,刘强东向母校捐赠 3 亿元,并设立人大京东基金,创人大建校以来的最高社会捐赠记录。

据悉,人大京东基金主要用于支持人大的通州新校区建设、社会学学科发展以及在法学、新闻、互联网、人工智能、金融等领域的相关学科建设、理论与技术研究,并通过大幅提升助学金、奖学金、奖教金的方式来支持激励、培养更多优秀教师和青年学子,帮助杰出人才和贫困学生的成长。

当天,京东物流与人大联合打造的智慧快递服务中心也正式落地人大通州校区。这是北京首家校企共建的智慧快递服务中心,还投放了第六代智能配送无人车及京东服务 + 等服务(来源:IT 之家)

 

美国官员对苹果在中国的人工智能合作计划表示担忧

苹果公司可能计划与阿里巴巴合作,将 Apple Intelligence 引入其在中国的产品中,这一计划引起了华盛顿的关注。

美国国会和白宫官员都对苹果与中国电商巨头阿里巴巴合作将 Apple Intelligence 引入中国的计划表示担忧。苹果公司则认为,此类交易对于保持其在中国的竞争力至关重要。

《纽约时报》的一篇报道指出,中国市场约占苹果总销售额的 20%。为了与中国本土的智能手机公司竞争,苹果需要与中国的人工智能供应商合作。

美国官员担心,这样的协议将使中国在与美国人工智能公司的竞争中更具竞争力。任何协议都可能迫使苹果进一步遵守中国法律,这些法律旨在促进审查制度并与中国政府共享用户数据。

据报道,白宫和众议院的官员已联系苹果高管,要求提供有关该交易的更多信息。他们显然被问及,这笔交易是否会让中国公司获取用户数据或先进的人工智能模型。

美国官员还考虑将包括阿里巴巴在内的中国人工智能公司列入不允许与美国公司合作的受限公司名单。

据称,苹果还在考虑与其他中国人工智能公司达成交易,包括腾讯、DeepSeek 和百度。(来源:cnBeta)

 

入侵美国 SEC 社媒账户导致比特币价格暴涨的黑客被判入狱

26 岁的埃里克·康瑟尔 (Eric Council Jr.) 因参与入侵美国证券交易委员会官方 X 账户,于周五被判处 14 个月监禁和 3 年监督释放。美国司法部在一份新闻稿中宣布了这一判决。

Council 和其他黑客于 2024 年接管了 SEC 的 X 账户,并错误地宣布该机构已批准比特币交易所交易基金 (ETF),这导致加密货币价格飙升,随后又下跌。

据美国司法部称,Council 及其同伙对一名有权访问 SEC X 账户的人员的手机账户进行了 SIM 卡交换攻击,从而使黑客控制了该人员的电话号码。之后,黑客重置了 SEC X 账户的密码,从而获得了该账户的控制权。(来源:cnBeta)

 

微软 CEO 萨蒂亚·纳德拉开始用 AI 聊天机器人取代收听播客

为了说明他在日常生活中使用公司 Copilot 人工智能助手的频率,微软首席执行官萨蒂亚·纳德拉表示,他现在不再收听播客,而是将文字记录上传到 Copilot,然后在开车去办公室的路上与 Copilot 讨论内容。

此外,纳德拉曾开玩笑地将自己的工作描述为「电子邮件打字员」,他表示,他依靠 Copilot Studio 开发的至少 10 个定制代理来汇总电子邮件和消息、准备会议以及执行办公室的其他任务。

人工智能似乎已经在以更实质性的方式改变微软,据报道,在纳德拉宣布公司 30% 的代码是由人工智能编写后不久,程序员在公司最近的裁员中受到的打击最为严重。(来源:cnBeta)

 

字节跳动被曝福利调整:多地禁止打包餐食回家,午休禁止关灯

据媒体报道,近日,字节跳动在多地工区推行了一系列新的管理规定,涵盖餐食外带与午休政策,引发广泛关注。

在餐食管理方面,有内部员工透露,公司已发布内部通知,明确规定职场提供的三餐、随餐饮品、水果以及茶水间零食等福利,员工需现场即取即用,严禁带离职场。

通知强调,餐食外带行为违反了公司的餐饮管理规定,对于情节严重的侵占情况,违规者将面临退赔、警告甚至辞退等不同程度的处罚。

与此同时,午休政策也做出了相应调整。以往深圳工区作为唯一允许关灯午休的办公区域,如今也宣布午睡时不得关灯。

针对这些调整,字节跳动一位内部知情人士解释称:「餐食方面的调整,主要是为了治理多拿多占现象,比如个人外带大量餐食;职场内用餐不受任何影响。而午休方面,不存在不让午休的说法,员工可以根据个人需求在工位午休;主要是避免个人物品占用消防安全通道、公共区域。」(来源:快科技)

吉利银河伪装车曝光,号称「全球最低油耗、2100km+ 综合续航」

 5 月 17 日消息,吉利银河旗下全新轿车谍照今日在社交平台曝光,车身写有「全球最低油耗」「2L 级亏电油耗」「2100km+ 综合续航」等标语。

目前尚不清楚这款新车的具体型号。在 5 月 15 日吉利汽车 2025 年一季度业绩会暨「一个吉利」战略整合计划说明会上,吉利透露:在二季度末以及三季度初,吉利银河还将会有两个产品投放市场,下一周,银河有一款大型旗舰 6 座 SUV 将会在意大利米兰首秀。(来源:IT 之家)

 

iPhone Fold 屏下摄像头据称正在测试中

苹果首款可折叠 iPhone 预计将于 2026 年末 或 2027 年首次亮相,今天来自韩国的一则新传闻泄露了工程原型的当前状态。根据知情人士基于工程测试设备的数据,iPhone Fold 的屏幕尺寸比之前的原型略小,但分辨率和长宽比相同。

据称 iPhone Fold 的正面显示屏上会有一个打孔摄像头,内部折叠屏幕则首次配备屏下摄像头,这样一来它将类似于三星的 Galaxy Z Fold 系列。

苹果仍有大量时间来确定 iPhone Fold 的具体规格,因此很多方面未来都可能(而且很可能会)发生变化,无论如何,苹果选择屏下摄像头路线仍然值得关注。

此前有传言称,苹果正致力于最大限度地减少折叠屏幕的折痕,并为 iPhone Fold 配备比任何竞争对手都要高品质的铰链。(来源:cnBeta)

2028 洛杉矶奥运会将首次引入「空中出租车」,带来全新观赛、往返体验

据美联社 16 日报道,2028 年洛杉矶奥运会期间,观众和贵宾们将首次体验乘坐空中出租车前往比赛场馆。

阿切尔航空公司推出的电动空中出租车「午夜」号将从多个场馆附近的垂直起降点出发,最多可载四名乘客,飞行时间为 10 至 20 分钟,目的地遍布洛杉矶交通网中的各大区域。

这张空中出行网络将包括英格尔伍德的 SoFi 体育场和市区南部的洛杉矶纪念体育场,两个场馆将共同承办奥运会的开闭幕式。此外,洛杉矶国际机场、好莱坞、圣莫尼卡和橙县也将成为空中出租车的停靠点。

阿切尔表示,这款空中出租车的噪音和排放比传统直升机低。该款 eVTOL 飞机配备了冗余的容错系统,拥有 12 个发动机和螺旋桨,因此能够达到与商业航班相似的安全标准,预计将获得美国联邦航空局的认证。这些空中出租车将在阿切尔位于加利福尼亚圣荷西和乔治亚州科温顿的工厂制造。

作为 2028 年洛杉矶奥运会、残奥会及美国队的官方服务商,阿切尔还将利用空中出租车为紧急服务和安保提供支持。(来源:IT 之家)

 

雷军最新内部演讲曝光;美团外卖推出堂食店标签;英伟达计划在上海设立研发中心

2025年5月17日 08:58

雷军最新内部演讲曝光:小米不再是行业新人,公众的期待和要求远超想象

5 月 16 日消息,一份雷军在小米价值观大赛后对内部员工发表演讲的视频曝光,罕见谈及了近期小米遭遇的舆论危机。

雷军表示,三月底的一场突如其来的交通事故,给小米带来了狂风暴雨般的质疑、批评和指责。我和同事们一样,一下子都懵了,一位熟悉汽车行业的朋友告诉我:造车,遭遇交通事故在所难免。』但是谁也没有想到,这一场事故的影响如此之大,对我们小米的打击也如此之大。

雷军称,四年前决定造车的时候,一直特别担心安全问题,所以对汽车的质量和安全无比的重视。经过汽车团队这么多同事们三、四年的努力,我们 SU7 在上市的一年多的时间里面,质量一直是我们引以为傲的东西,在参与的所有权威机构的评测里面都拿到了最高分,但万万没有想到,这场交通事故,让我们意识到,公众对我们的期待和要求远超了想象。

他表示,我们一直觉得我们是汽车行业的新人,我们是一家创业的公司。但这一次的事件让我深深的理解,小米今天的规模、影响力、社会关注度都到了非常高的地方,社会和公众要求我们去承担一家真正的大公司行业领导者的责任。我们深刻的意识到,这是 15 年的小米无可回避的责任。15 岁的小米,不再是行业的新人,我们在任何一个产业里面都没有了新手保护期,我们要有更高的标准和目标。(来源: TechWeb)

马斯克 4000 亿薪酬被推翻,特斯拉修改公司章程打压股东诉讼

5 月 17 日,据彭博社报道,在埃隆・马斯克 (Elon Musk) 的天价薪酬被股东诉讼推翻后,特斯拉公司正采取措施防止未来再次出现此类情况。特斯拉在周五晚间披露,已修改公司章程,规定股东必须持有至少 3% 的公司股份,才能「发起或维持一项衍生诉讼」。衍生诉讼指的是股东代表公司对相关责任人发起的诉讼。根据监管文件,特斯拉是在 5 月 15 日修改的章程。

就在几天前,得州州长格雷格・阿博特 (Greg Abbott) 签署立法对该州公司法进行一系列修改,包括允许公司设定股东发起衍生诉讼所需的持股门槛。阿博特以及该州其他共和党领导人宣称,此举旨在吸引更多企业在得州注册成立。

正是股东诉讼导致马斯克的天价薪酬泡汤。特斯拉授予马斯克的薪酬协议在 2018 年获得股东批准,最初价值为 26 亿美元,但是在 2024 年初被裁定无效时已飙升至 560 亿美元 (约合 4036 亿元人民币)。在特斯拉股价飙涨时,其价值一度超过 1000 亿美元。然而,该薪酬方案遭到了一位股东的质疑。

在马斯克薪酬被推翻后,特斯拉把注册地从特拉华州迁至得州。目前,特斯拉已就该裁决向特拉华州最高法院提起上诉,这一过程可能耗时数月时间。

截至发稿,特斯拉尚未就此置评。(来源:凤凰科技)

 

消息称英伟达计划在上海设立研发中心

5 月 16 日消息,英国《金融时报》援引两位知情人士消息称,英伟达计划在上海设立研发中心,力图在其中国市场销售受挫的背景下维持在 AI 芯片领域的领先地位。

知情人士透露,英伟达 CEO 黄仁勋上月与上海市长龚正会面时提出了这一设想。公司目前正租用新的办公场地,以安置现有员工并为后续扩编预留空间。

知情人士表示,新设立的研发中心将专注于满足中国客户的特定需求。上海团队将参与全球研发工作,包括芯片设计验证、产品优化,以及自动驾驶等特定领域的研究。

黄仁勋希望吸引中国本土顶尖 AI 人才。目前,英伟达正为上海团队招聘多个岗位,包括开发下一代深度学习软硬件的工程师,以及设计和优化面向全球市场的 ASIC 芯片开发者。

有知情人士透露,上海市已对上述规划表达初步支持。(来源: IT 之家)

 

Meta 推迟发布旗舰 AI 模型 Behemoth,因能力提升遇到困难

5 月 16 日消息,据外媒报道,知情人士称,Meta 工程师难以大幅提升旗舰 AI 模型「Behemoth」(巨头)的能力,将推迟发布模型。

Meta 在 4 月发布了 Llama 4 模型系列中的两个小型模型 Scout 和 Maverick,但更大的 Behemoth 版本发布被推迟至 6 月。

现在,据报道,Behemoth 模型发布时间又被推迟到秋季甚至更晚,因能力提升并不明显。这也引发了公司内部对耗费巨资打造 AI 这一投资方向的担忧。

不过,外媒也提到,其他试图发布下一代重磅模型的顶尖 AI 公司也纷纷遇挫,比如说 OpenAI。去年 12 月,就有外媒报道,OpenAI 开发其下一个主要模型 GPT-5 的努力正落后于计划,其结果还不能证明巨大的成本是合理的。

值得一提的是,Llama 4 发布后,还因作弊刷榜、代码能力拉垮、伪开源等备受争议。(来源: TechWeb)

OpenAI 的 AI 程序员上线,人类仅需点按钮

5 月 17 日报道,昨夜,OpenAI 推出一款基于云的软件工程 Agent(智能体)——Codex的预览版。

Codex 可并行处理多项任务,例如编程、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,在云上运行并预加载用户代码库。

Codex 由codex-1 模型提供支持。codex-1 是 OpenAI o3 针对软件工程优化后的版本。目前,Codex 已面向 ChatGPT Pro、Team 和 Enterprise 用户上线,即将面向 Plus 用户上线。

OpenAI 同步推出 codex-1 的精简版本,基于 o4-mini 专为轻量级开源编码 Agent「Codex CLI」而打造,API 定价为1.5 美元/100 万 tokens 输入,6 美元/100 万 tokens 输出,即时缓存打七五折。(来源:智东西)

 

美团外卖推出「堂食店」标签:是否堂食并非检验品质的唯一标准

5 月 16 日消息,美团外卖官宣,为更好地帮助商家还原真实经营场景,面向消费者提供更加多元可信的参考信息,美团外卖近期对「明厨计划」进行了全面升级,推出「堂食店」标签功能,开放商家认证流程,并将在首页推荐位、专属标签等多个核心位置展示。

同时,自 4 月以来,美团外卖加大对「明厨亮灶」的补贴力度,面向夫妻店、社区小店等中小餐饮商户提供覆盖硬件设备购置、安装等费用的全额补贴,首期补贴总额达 5000 万元。

IT 之家注意到,美团外卖还称:「是否堂食并非检验品质的唯一标准,消费者更需要看得见的食品安全。我们期望,让每一份外卖都承载着安心与诚意,让每一家规范经营的商家都获得更多关注。」(来源:IT 之家)

 

腾讯混元图像 2.0 模型发布:毫秒级响应,一边打字一边出图

5 月 16 日消息,腾讯混元图像 2.0 模型(Hunyuan Image2.0)正式发布,在腾讯混元官方网站上线,并对外开放注册体验。

腾讯混元图像 2.0 模型主要有两大特点:实时生图、超写实画质。

相比前代模型,腾讯混元图像 2.0 模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度「显著快于行业领先模型」,在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元号称可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统「抽卡—等待—抽卡」的方式。

除了速度快以外,腾讯混元图像 2.0 模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像号称可避免 AIGC 图像中的「AI 味」。(来源:IT 之家)

 

魔法原子再获数亿融资,推动千行百业落地

近日,具身智能机器人公司魔法原子宣布完成数亿元新一轮战略融资。本轮投资方包括战略产业资本禾创致远、芯联资本,财务投资人华映资本、晓池资本、元禾厚望,老股东追创创投和翼朴基金持续追加投资,新资金将用于具身智能核心技术迭代研发,VLA 模型搭建,加速推动机器人在工业、商业场景落地。

短短半年内,魔法原子连续完成了两轮超亿元级融资。在此期间,魔法原子已逐步完成「全栈自研技术+全链路布局+场景化应用」闭环生态的搭建,为商业化进程提供根本保障。

魔法原子成立于 2024 年 1 月,专注于通用机器人和具身智能技术研发与落地应用,产品涵盖通用人形机器人与四足机器人,覆盖工业、商业及家庭等多元场景。(来源:极客公园)

三星首秀 Sensor OLED 技术:全屏识别指纹,支持心率检测

5 月 16 日消息,科技媒体 SamMobile 发布博文,报道称在 2025 年 SID Display Week 博览会上,三星显示(Samsung Display)公司展示 Sensor OLED 技术,内置传感器,能在屏幕任意位置检测指纹,甚至还能测量心率、血压和压力水平。

在传统 OLED 屏幕上,屏下指纹传感器只能在特定区域识别指纹;而 Sensor OLED 技术直接在制造过程中嵌入了有机光电二极管(OPD)层,实现全屏检测用户指纹。

更值得关注的是,Sensor OLED 技术不仅支持全屏识别指纹,还能像智能手表和健身追踪器一样,检测心率、血压和压力水平。其原理是利用 OLED 光线根据血管收缩和扩张的不同反射特性,通过 OPD 层将数据转化为健康信息。(来源:IT 之家)

 

荣耀 400 Pro 真机首曝:首发流光织锦工艺,最美荣耀手机

日前荣耀官方宣布,将在本月推出全新的荣耀 400 系列,包含荣耀 400 和荣耀 400 Pro 两款机型,目前该系列已在各大平台上架开启预约,受到了不少用户的关注。现在有最新消息,近日有数码博主进一步晒出了其中荣耀 400 Pro 的真机谍照。

据知名数码博主 @ 旺仔百事通 最新晒出的真机照显示,与此前曝光的消息基本一致,全新的荣耀 400 Pro 将至少提供幻夜黑、揽月银和海风蓝两款配色,其中海风蓝配色首发流光织锦工艺,将真丝感纤维与贝母珠粉等材料,在真空环境中层层压制融合,让每一块背板设计都与众不同,就像每一缕海风、每一捧流沙,都是独一无二,堪称是最美荣耀手机。除此之外,该机的后置相机模组将采用全新的「旷野舷窗」设计,通过背板至镜头的流畅过渡展现出与众不同的美感。

据悉,全新的荣耀 400 Pro 将在本月正式发布,由肖战代言。(来源: TechWeb)

全球首部全程 IMAX 胶片拍摄电影:诺兰新片《奥德赛》明年夏季上映

5 月 16 日消息,据外媒《好莱坞报道者》报道,克里斯托弗・诺兰执导的新片《奥德赛》将在明年夏季上映,这部改编自希腊史诗的作品不仅内容宏大,其制作方式也将开创历史:全球首部全程使用 IMAX 胶片拍摄的电影。

此前,《复仇者联盟 3:无限战争》就已经使用 IMAX 设备完成全片拍摄。但与前者不同,《奥德赛》则是首部全程采用 IMAX 胶片拍摄的电影,而非数字设备。IMAX CEO 里奇・盖尔方德在戛纳电影节期间的一场媒体午宴上宣布了这一消息,并透露这是诺兰率先提出的挑战。

据悉,升级后的摄影机更轻便、运作时的噪音也降低了三成。IMAX 还开发出全新的胶片扫描与处理技术,让拍摄时可以更快速地回看素材。当前这些摄影机仅供诺兰使用,《奥德赛》制作完毕后才会对其他导演开放。

自 2008 年《黑暗骑士》以来,诺兰就一直是 IMAX 技术的坚定拥护者,当时他首次用 IMAX 摄影机拍摄动作戏。从那以后,他的每部作品都采用 IMAX 拍摄。(来源:IT 之家)

 

56 年无人解开的数学难题,被谷歌的新 AI 突破了

2025年5月16日 16:31

去年,AI 能解出博士级别的数学题,已是轰动一时的大新闻;而今年,能攻克「未解之谜」级别的数学难题的 AI 已经来了。

5 月 15 日,Google DeepMind 发布了全新编程智能体 AlphaEvolve。

不同于传统的编程 Agent,它专注于通用算法的自动发现与持续优化。顾名思义,AlphaEvolve 擅长在「进化」中寻找更优解,它模拟自然选择机制,能在代码中不断迭代、演化出创新算法。

只要问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法。Google 表示,在组合数学、几何学、数论等超过 50 个未解问题中应用后,AlphaEvolve 在约 20% 的问题上超越了人类现有解法。

DeepMind 研究员 Matej Balog 表示:「AlphaEvolve 在十多个公开的数学问题上取得了突破。但最让我激动的是:它找到了 56 年以来,4x4 复数矩阵乘法算法的首次改进。这个结果,来自它自创的一种复杂搜索算法。」

AlphaEvolve 的价值不仅在数学,它展现出的是一种通用的「算法发现能力」。Balog 表示:「我们对 AlphaEvolve 的应用,还只是触及表层。」

问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法

Google DeepMind 表示,AlphaEvolve 能够在多个复杂问题中取得突破,关键在于其背后运作的是一整套自动进化机制,能持续优化算法并提升性能。

从本质上看,AlphaEvolve 解决的是一个通用的黑盒优化问题:maximize h(f)。其中,f 是由大型语言模型生成的程序,h 是衡量该程序质量的评估函数。

在实际流程中,AlphaEvolve 首先通过提示采样器(prompt sampler)组装提示词,引导语言模型生成代码。DeepMind 使用了两个不同的 Gemini 模型协同工作:Gemini Flash 以更高速度生成大量候选方案,扩展思路的广度;Gemini Pro 则提供更深入的结构性建议。二者结合,使模型能产出具备实际可行性和算法深度的程序。

生成的程序会被送入自动评估系统,经过验证、运行和打分后,写入程序数据库。数据库中运行着一套进化算法,会从已有程序中挑选表现最好的方案,为下一轮提示提供方向,不断迭代出更优解。

AlphaEvovle 的一个核心点就是这套自动评估指标。它能对生成程序进行验证、运行和评分。每一个程序都会被 h 函数衡量其准确性、运行效率、代码质量等维度。这些评分标准是客观、量化的,使 AlphaEvolve 能够在无需人类直接干预的前提下持续优化。

不过,这里的 h 函数依然由人类研究人员定义,可以是准确率、运行时间,甚至代码可读性等维度的组合。AlphaEvolve 负责的只是在给定 h 的前提下去寻找最优的 f。对于一些数学问题或研究任务,Google 也可能预设 h。

这也说明了 AlphaEvolve 当前的边界:它适用于那些「成果是否优秀」可以自动量化判断的问题。但如何定义「优秀」,仍需人来给出。在需要人类实验才能确定是否优秀的问题上,AlphaEvolve 就无法评估了。

以 DeepMind 研究员提到的 4×4 复数矩阵乘法为例,研究人员设置了一组任务目标,包括达到的最低乘法次数(即张量分解的秩)以及达到该结果的随机种子比例。这些信号构成了 AlphaEvolve 的优化目标,引导它在复杂的搜索空间中稳步「爬山」。

AlphaEvolve 从问题定义出发,基于标准的梯度优化流程(包括初始化器、重建损失函数、Adam 优化器等),演化出了一系列高质量的张量分解算法。最终,它在 14 个矩阵乘法结构上超越了已知最优结果。其中最引人注目的,是它提出了历史上第一个能用 48 次乘法完成 4×4 复数矩阵乘法的算法——打破了 56 年未被突破的记录。

AlphaEvolve 的技术路线可追溯到 DeepMind 早期提出的 FunSearch 系统。FunSearch 同样利用语言模型引导程序进化,曾被用于发现数学结构或在线算法策略。但与之相比,AlphaEvolve 的扩展性显著提升:它可以修改完整程序,处理多个函数、组件、甚至跨语言结构协同优化,而不仅限于 Python 中的单一函数。

这种更高的通用性,使 AlphaEvolve 不再只是一个「智能改函数」的工具,而像是一个可以自主演化大型算法系统的「程序设计伙伴」。

据 DeepMind 披露,AlphaEvolve 已被应用于 50 多个数学难题,涵盖数学分析、几何学、组合数学与数论等领域。大多数实验都能在数小时内完成部署。

在约 75% 的问题中,它成功重新发现了当前的最优解。更令人惊喜的是,在约 20% 的问题中,它给出了比已知方法更好的解法。比如在数学界研究了 300 多年的「接吻数问题」中,AlphaEvolve 构造出由 593 个球体组成的新结构,在 11 维空间中刷新了下界。

除了数学,AlphaEvolve 也已在 Google 内部实际落地应用,解决了计算栈中多个层面的工程问题,包括:为 Borg 系统设计新的调度启发式;优化大语言模型训练时使用的矩阵乘法内核;改写 TPU 芯片中的算术电路;加速 Transformer 注意力机制的执行速度。

这些任务之间跨度极大,但都具备一个共性:问题能用程序表达、结果能用函数评估。只要这两点成立,AlphaEvolve 就可以发挥作用。

更多的智能供给,带来无限的游戏

此次发布来自 Google DeepMind,这一团队曾推出 AlphaGo、AlphaFold 等具有里程碑意义的 AI 系统,在博弈智能与科学发现领域显著扩展了人工智能的能力边界。

AlphaEvolve,与依赖强化学习和自我博弈(如 AlphaGo)的系统不同,是通过语言模型生成大量程序候选,结合自动评估与进化机制,筛选出更优的算法方案。它更像是一种可编排、可扩展的算法构造与发现框架。

相比 AlphaGo 展示的是人工智能如何在规则明确定义的博弈中超越人类,AlphaEvolve 的意义可能更在于:它为研究者提供了一种持续、可扩展的算法生成与优化能力。

算法设计与调优历来是一种高度稀缺的技术能力。算法工程师在就业市场上普遍享有更高的薪酬与职位门槛,足以反映其复杂性与稀缺性。

而现在,只要设定明确的评估方式,AlphaEvolve 就有可能以接近无限的算力和耐心,自动探索并优化算法解法。这意味着,「发现并改进算法」这项曾依赖个体经验的能力,开始从稀缺、手工、不可复制,变为可自动化、可规模化的智能供给。

尤瓦尔·赫拉利曾经有一个比喻,形容 AlphaGo 为人类带来的冲击。

人类一直在围棋星球上探索如何下围棋,不断有人画出路线图,探索围棋星球的样貌。直到 AI 出现,人类才惊觉,自己不过是在围棋星球的一座小岛上原地打转,而真正的星球辽阔无边,未曾涉足的区域远超想象。

而去年到今年,在科研领域,我们也不断地看到 AI 正在做同样的事情。2024 年,AI 相关成果首次同时获得诺贝尔物理学奖与化学奖,而这很有可能成为未来的科研常态。

从某种程度上说,AlphaEvolve 所做的,是以前所未有的速度加快这张科研的「未知地图」的展开。以无限的智能供给,让每个领域都有可能被再探索一遍。

当「能被发现的算法」不再稀缺,人类对知识的征途,或许才刚刚开始。

 

 

❌
❌