普通视图

发现新文章,点击刷新页面。
昨天 — 2025年5月18日极客公园

ChatGPT 或将支持 MCP;字节跳动调整福利政策;洛杉矶奥运会将引入「空中出租车」

2025年5月18日 08:35

OpenAI 计划在阿布扎比建设的数据中心将比摩纳哥更大

据彭博社报道,OpenAI 准备帮助在阿布扎比开发一个容量高达 5 千兆瓦的数据中心园区,该公司将成为该项目的主要租户,该园区可能成为全球最大的人工智能基础设施项目之一。

据报道,该设施占地面积高达 10 平方英里,耗电量相当于五座核反应堆,远超 OpenAI 及其竞争对手宣布的任何现有 AI 基础设施。

OpenAI 在美国的第一座星际之门园区(已在德克萨斯州阿比林开发)预计将达到 1.2 千兆瓦,而这家位于中东的园区的容量将是该园区的四倍以上。(来源:cnBeta)

比亚迪加速内部整合,消息称腾势、方程豹品牌公关部回归集团

5 月 17 日消息,「每人 Auto」今日发布消息称,比亚迪于 4 月底发布公告,将旗下两大高端品牌腾势、方程豹的品牌公关部进行了调整。

此前,腾势、方程豹品牌公关的团队分别隶属于腾势销售事业部、方程豹销售事业部,调整后,上述两个品牌的公关团队平级移至比亚迪集团品牌及公关处,为其二级部门,最高负责人为比亚迪集团品牌及公关处总经理李云飞。

报道援引比亚迪员工的说法,集团内部汽车业务主要由汽车工程研究院、新技术研究院负责车型研发设计,产品交由王朝网、海洋网、腾势、方程豹、仰望销售事业部来负责营销。

而此次调整,则意味着集团将给予两大品牌更多的资源支持,希望打造更强的品牌力。(来源:IT 之家)

 

奇瑞再被曝将在英国建汽车厂,目前在当地已有 70 余家经销商

5 月 17 日消息,据外媒 AutoCAR 报道,奇瑞汽车英国公司负责人 Victor Zhang 透露,未来将在英国设立工厂,以及包含上下游产业链的制造基地,另一位奇瑞英国高管则表示,英国生产是奇瑞在英国的「最终目的地」。

报道称,目前奇瑞在英国已经拥有 70 余家经销商,该公司计划在 2026 年(明年)将这一数字翻番。

据悉,早在 2023 年 6 月,就有英国当地媒体披露,包括奇瑞在内的中国汽车制造商已与英国方面进行会谈,讨论在当地制造汽车。不过目前奇瑞在英国生产事宜还未最终确定。(来源:IT 之家)

 

OpenAI ChatGPT 被曝将支持 MCP 协议,可接入第三方 AI 服务

科技媒体 bleepingcomputer 在 5 月 16 日发布博文,报道称 OpenAI ChatGPT 正测试整合 MCP 协议,扩展该 AI 聊天机器人的第三方服务。

MCP 可以比喻成 AI 应用的「USB-C 接口」,AI 助手通过受控接口访问数据,例如列出表格、读取数据或执行 SQL 查询,从而实现数据库探索和分析等任务。

虽然 MCP 对普通消费者的直接用途可能有限,但对企业而言,它可能带来颠覆性改变。企业能够通过 MCP 将内部工具与 ChatGPT 连接,按需共享数据,优化工作流程。

据社交平台 X 用户 Tibor 爆料,ChatGPT 正在测试一项「连接器设置」(Connectors settings)功能。用户可点击「自定义」(Custom)选项,添加新工具,并填写工具名称、URL 和描述等信息。

该功能让 ChatGPT 能无缝对接用户自有应用或 API 实现,对 MCP 支持目前仍在内部测试阶段,OpenAI 预计将在未来几天或几周内正式公布这一功能。(来源:IT 之家)

刘强东给母校中国人民大学捐赠的教学楼「京东群学楼」今日投用

据「京东黑板报」,中国人民大学社会学院楼「京东群学楼」昨日在通州校区正式启用。

「群学」,为社会学的旧译名,亦指学派交汇,融会贯通。京东群学楼为人大校友、京东集团创始人、董事会主席刘强东捐赠冠名建设项目,总建筑面积约 3.1 万平方米。

2017 年在人大 80 周年校庆之际,刘强东向母校捐赠 3 亿元,并设立人大京东基金,创人大建校以来的最高社会捐赠记录。

据悉,人大京东基金主要用于支持人大的通州新校区建设、社会学学科发展以及在法学、新闻、互联网、人工智能、金融等领域的相关学科建设、理论与技术研究,并通过大幅提升助学金、奖学金、奖教金的方式来支持激励、培养更多优秀教师和青年学子,帮助杰出人才和贫困学生的成长。

当天,京东物流与人大联合打造的智慧快递服务中心也正式落地人大通州校区。这是北京首家校企共建的智慧快递服务中心,还投放了第六代智能配送无人车及京东服务 + 等服务(来源:IT 之家)

 

美国官员对苹果在中国的人工智能合作计划表示担忧

苹果公司可能计划与阿里巴巴合作,将 Apple Intelligence 引入其在中国的产品中,这一计划引起了华盛顿的关注。

美国国会和白宫官员都对苹果与中国电商巨头阿里巴巴合作将 Apple Intelligence 引入中国的计划表示担忧。苹果公司则认为,此类交易对于保持其在中国的竞争力至关重要。

《纽约时报》的一篇报道指出,中国市场约占苹果总销售额的 20%。为了与中国本土的智能手机公司竞争,苹果需要与中国的人工智能供应商合作。

美国官员担心,这样的协议将使中国在与美国人工智能公司的竞争中更具竞争力。任何协议都可能迫使苹果进一步遵守中国法律,这些法律旨在促进审查制度并与中国政府共享用户数据。

据报道,白宫和众议院的官员已联系苹果高管,要求提供有关该交易的更多信息。他们显然被问及,这笔交易是否会让中国公司获取用户数据或先进的人工智能模型。

美国官员还考虑将包括阿里巴巴在内的中国人工智能公司列入不允许与美国公司合作的受限公司名单。

据称,苹果还在考虑与其他中国人工智能公司达成交易,包括腾讯、DeepSeek 和百度。(来源:cnBeta)

 

入侵美国 SEC 社媒账户导致比特币价格暴涨的黑客被判入狱

26 岁的埃里克·康瑟尔 (Eric Council Jr.) 因参与入侵美国证券交易委员会官方 X 账户,于周五被判处 14 个月监禁和 3 年监督释放。美国司法部在一份新闻稿中宣布了这一判决。

Council 和其他黑客于 2024 年接管了 SEC 的 X 账户,并错误地宣布该机构已批准比特币交易所交易基金 (ETF),这导致加密货币价格飙升,随后又下跌。

据美国司法部称,Council 及其同伙对一名有权访问 SEC X 账户的人员的手机账户进行了 SIM 卡交换攻击,从而使黑客控制了该人员的电话号码。之后,黑客重置了 SEC X 账户的密码,从而获得了该账户的控制权。(来源:cnBeta)

 

微软 CEO 萨蒂亚·纳德拉开始用 AI 聊天机器人取代收听播客

为了说明他在日常生活中使用公司 Copilot 人工智能助手的频率,微软首席执行官萨蒂亚·纳德拉表示,他现在不再收听播客,而是将文字记录上传到 Copilot,然后在开车去办公室的路上与 Copilot 讨论内容。

此外,纳德拉曾开玩笑地将自己的工作描述为「电子邮件打字员」,他表示,他依靠 Copilot Studio 开发的至少 10 个定制代理来汇总电子邮件和消息、准备会议以及执行办公室的其他任务。

人工智能似乎已经在以更实质性的方式改变微软,据报道,在纳德拉宣布公司 30% 的代码是由人工智能编写后不久,程序员在公司最近的裁员中受到的打击最为严重。(来源:cnBeta)

 

字节跳动被曝福利调整:多地禁止打包餐食回家,午休禁止关灯

据媒体报道,近日,字节跳动在多地工区推行了一系列新的管理规定,涵盖餐食外带与午休政策,引发广泛关注。

在餐食管理方面,有内部员工透露,公司已发布内部通知,明确规定职场提供的三餐、随餐饮品、水果以及茶水间零食等福利,员工需现场即取即用,严禁带离职场。

通知强调,餐食外带行为违反了公司的餐饮管理规定,对于情节严重的侵占情况,违规者将面临退赔、警告甚至辞退等不同程度的处罚。

与此同时,午休政策也做出了相应调整。以往深圳工区作为唯一允许关灯午休的办公区域,如今也宣布午睡时不得关灯。

针对这些调整,字节跳动一位内部知情人士解释称:「餐食方面的调整,主要是为了治理多拿多占现象,比如个人外带大量餐食;职场内用餐不受任何影响。而午休方面,不存在不让午休的说法,员工可以根据个人需求在工位午休;主要是避免个人物品占用消防安全通道、公共区域。」(来源:快科技)

吉利银河伪装车曝光,号称「全球最低油耗、2100km+ 综合续航」

 5 月 17 日消息,吉利银河旗下全新轿车谍照今日在社交平台曝光,车身写有「全球最低油耗」「2L 级亏电油耗」「2100km+ 综合续航」等标语。

目前尚不清楚这款新车的具体型号。在 5 月 15 日吉利汽车 2025 年一季度业绩会暨「一个吉利」战略整合计划说明会上,吉利透露:在二季度末以及三季度初,吉利银河还将会有两个产品投放市场,下一周,银河有一款大型旗舰 6 座 SUV 将会在意大利米兰首秀。(来源:IT 之家)

 

iPhone Fold 屏下摄像头据称正在测试中

苹果首款可折叠 iPhone 预计将于 2026 年末 或 2027 年首次亮相,今天来自韩国的一则新传闻泄露了工程原型的当前状态。根据知情人士基于工程测试设备的数据,iPhone Fold 的屏幕尺寸比之前的原型略小,但分辨率和长宽比相同。

据称 iPhone Fold 的正面显示屏上会有一个打孔摄像头,内部折叠屏幕则首次配备屏下摄像头,这样一来它将类似于三星的 Galaxy Z Fold 系列。

苹果仍有大量时间来确定 iPhone Fold 的具体规格,因此很多方面未来都可能(而且很可能会)发生变化,无论如何,苹果选择屏下摄像头路线仍然值得关注。

此前有传言称,苹果正致力于最大限度地减少折叠屏幕的折痕,并为 iPhone Fold 配备比任何竞争对手都要高品质的铰链。(来源:cnBeta)

2028 洛杉矶奥运会将首次引入「空中出租车」,带来全新观赛、往返体验

据美联社 16 日报道,2028 年洛杉矶奥运会期间,观众和贵宾们将首次体验乘坐空中出租车前往比赛场馆。

阿切尔航空公司推出的电动空中出租车「午夜」号将从多个场馆附近的垂直起降点出发,最多可载四名乘客,飞行时间为 10 至 20 分钟,目的地遍布洛杉矶交通网中的各大区域。

这张空中出行网络将包括英格尔伍德的 SoFi 体育场和市区南部的洛杉矶纪念体育场,两个场馆将共同承办奥运会的开闭幕式。此外,洛杉矶国际机场、好莱坞、圣莫尼卡和橙县也将成为空中出租车的停靠点。

阿切尔表示,这款空中出租车的噪音和排放比传统直升机低。该款 eVTOL 飞机配备了冗余的容错系统,拥有 12 个发动机和螺旋桨,因此能够达到与商业航班相似的安全标准,预计将获得美国联邦航空局的认证。这些空中出租车将在阿切尔位于加利福尼亚圣荷西和乔治亚州科温顿的工厂制造。

作为 2028 年洛杉矶奥运会、残奥会及美国队的官方服务商,阿切尔还将利用空中出租车为紧急服务和安保提供支持。(来源:IT 之家)

 

昨天以前极客公园

雷军最新内部演讲曝光;美团外卖推出堂食店标签;英伟达计划在上海设立研发中心

2025年5月17日 08:58

雷军最新内部演讲曝光:小米不再是行业新人,公众的期待和要求远超想象

5 月 16 日消息,一份雷军在小米价值观大赛后对内部员工发表演讲的视频曝光,罕见谈及了近期小米遭遇的舆论危机。

雷军表示,三月底的一场突如其来的交通事故,给小米带来了狂风暴雨般的质疑、批评和指责。我和同事们一样,一下子都懵了,一位熟悉汽车行业的朋友告诉我:造车,遭遇交通事故在所难免。』但是谁也没有想到,这一场事故的影响如此之大,对我们小米的打击也如此之大。

雷军称,四年前决定造车的时候,一直特别担心安全问题,所以对汽车的质量和安全无比的重视。经过汽车团队这么多同事们三、四年的努力,我们 SU7 在上市的一年多的时间里面,质量一直是我们引以为傲的东西,在参与的所有权威机构的评测里面都拿到了最高分,但万万没有想到,这场交通事故,让我们意识到,公众对我们的期待和要求远超了想象。

他表示,我们一直觉得我们是汽车行业的新人,我们是一家创业的公司。但这一次的事件让我深深的理解,小米今天的规模、影响力、社会关注度都到了非常高的地方,社会和公众要求我们去承担一家真正的大公司行业领导者的责任。我们深刻的意识到,这是 15 年的小米无可回避的责任。15 岁的小米,不再是行业的新人,我们在任何一个产业里面都没有了新手保护期,我们要有更高的标准和目标。(来源: TechWeb)

马斯克 4000 亿薪酬被推翻,特斯拉修改公司章程打压股东诉讼

5 月 17 日,据彭博社报道,在埃隆・马斯克 (Elon Musk) 的天价薪酬被股东诉讼推翻后,特斯拉公司正采取措施防止未来再次出现此类情况。特斯拉在周五晚间披露,已修改公司章程,规定股东必须持有至少 3% 的公司股份,才能「发起或维持一项衍生诉讼」。衍生诉讼指的是股东代表公司对相关责任人发起的诉讼。根据监管文件,特斯拉是在 5 月 15 日修改的章程。

就在几天前,得州州长格雷格・阿博特 (Greg Abbott) 签署立法对该州公司法进行一系列修改,包括允许公司设定股东发起衍生诉讼所需的持股门槛。阿博特以及该州其他共和党领导人宣称,此举旨在吸引更多企业在得州注册成立。

正是股东诉讼导致马斯克的天价薪酬泡汤。特斯拉授予马斯克的薪酬协议在 2018 年获得股东批准,最初价值为 26 亿美元,但是在 2024 年初被裁定无效时已飙升至 560 亿美元 (约合 4036 亿元人民币)。在特斯拉股价飙涨时,其价值一度超过 1000 亿美元。然而,该薪酬方案遭到了一位股东的质疑。

在马斯克薪酬被推翻后,特斯拉把注册地从特拉华州迁至得州。目前,特斯拉已就该裁决向特拉华州最高法院提起上诉,这一过程可能耗时数月时间。

截至发稿,特斯拉尚未就此置评。(来源:凤凰科技)

 

消息称英伟达计划在上海设立研发中心

5 月 16 日消息,英国《金融时报》援引两位知情人士消息称,英伟达计划在上海设立研发中心,力图在其中国市场销售受挫的背景下维持在 AI 芯片领域的领先地位。

知情人士透露,英伟达 CEO 黄仁勋上月与上海市长龚正会面时提出了这一设想。公司目前正租用新的办公场地,以安置现有员工并为后续扩编预留空间。

知情人士表示,新设立的研发中心将专注于满足中国客户的特定需求。上海团队将参与全球研发工作,包括芯片设计验证、产品优化,以及自动驾驶等特定领域的研究。

黄仁勋希望吸引中国本土顶尖 AI 人才。目前,英伟达正为上海团队招聘多个岗位,包括开发下一代深度学习软硬件的工程师,以及设计和优化面向全球市场的 ASIC 芯片开发者。

有知情人士透露,上海市已对上述规划表达初步支持。(来源: IT 之家)

 

Meta 推迟发布旗舰 AI 模型 Behemoth,因能力提升遇到困难

5 月 16 日消息,据外媒报道,知情人士称,Meta 工程师难以大幅提升旗舰 AI 模型「Behemoth」(巨头)的能力,将推迟发布模型。

Meta 在 4 月发布了 Llama 4 模型系列中的两个小型模型 Scout 和 Maverick,但更大的 Behemoth 版本发布被推迟至 6 月。

现在,据报道,Behemoth 模型发布时间又被推迟到秋季甚至更晚,因能力提升并不明显。这也引发了公司内部对耗费巨资打造 AI 这一投资方向的担忧。

不过,外媒也提到,其他试图发布下一代重磅模型的顶尖 AI 公司也纷纷遇挫,比如说 OpenAI。去年 12 月,就有外媒报道,OpenAI 开发其下一个主要模型 GPT-5 的努力正落后于计划,其结果还不能证明巨大的成本是合理的。

值得一提的是,Llama 4 发布后,还因作弊刷榜、代码能力拉垮、伪开源等备受争议。(来源: TechWeb)

OpenAI 的 AI 程序员上线,人类仅需点按钮

5 月 17 日报道,昨夜,OpenAI 推出一款基于云的软件工程 Agent(智能体)——Codex的预览版。

Codex 可并行处理多项任务,例如编程、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,在云上运行并预加载用户代码库。

Codex 由codex-1 模型提供支持。codex-1 是 OpenAI o3 针对软件工程优化后的版本。目前,Codex 已面向 ChatGPT Pro、Team 和 Enterprise 用户上线,即将面向 Plus 用户上线。

OpenAI 同步推出 codex-1 的精简版本,基于 o4-mini 专为轻量级开源编码 Agent「Codex CLI」而打造,API 定价为1.5 美元/100 万 tokens 输入,6 美元/100 万 tokens 输出,即时缓存打七五折。(来源:智东西)

 

美团外卖推出「堂食店」标签:是否堂食并非检验品质的唯一标准

5 月 16 日消息,美团外卖官宣,为更好地帮助商家还原真实经营场景,面向消费者提供更加多元可信的参考信息,美团外卖近期对「明厨计划」进行了全面升级,推出「堂食店」标签功能,开放商家认证流程,并将在首页推荐位、专属标签等多个核心位置展示。

同时,自 4 月以来,美团外卖加大对「明厨亮灶」的补贴力度,面向夫妻店、社区小店等中小餐饮商户提供覆盖硬件设备购置、安装等费用的全额补贴,首期补贴总额达 5000 万元。

IT 之家注意到,美团外卖还称:「是否堂食并非检验品质的唯一标准,消费者更需要看得见的食品安全。我们期望,让每一份外卖都承载着安心与诚意,让每一家规范经营的商家都获得更多关注。」(来源:IT 之家)

 

腾讯混元图像 2.0 模型发布:毫秒级响应,一边打字一边出图

5 月 16 日消息,腾讯混元图像 2.0 模型(Hunyuan Image2.0)正式发布,在腾讯混元官方网站上线,并对外开放注册体验。

腾讯混元图像 2.0 模型主要有两大特点:实时生图、超写实画质。

相比前代模型,腾讯混元图像 2.0 模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度「显著快于行业领先模型」,在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元号称可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统「抽卡—等待—抽卡」的方式。

除了速度快以外,腾讯混元图像 2.0 模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像号称可避免 AIGC 图像中的「AI 味」。(来源:IT 之家)

 

魔法原子再获数亿融资,推动千行百业落地

近日,具身智能机器人公司魔法原子宣布完成数亿元新一轮战略融资。本轮投资方包括战略产业资本禾创致远、芯联资本,财务投资人华映资本、晓池资本、元禾厚望,老股东追创创投和翼朴基金持续追加投资,新资金将用于具身智能核心技术迭代研发,VLA 模型搭建,加速推动机器人在工业、商业场景落地。

短短半年内,魔法原子连续完成了两轮超亿元级融资。在此期间,魔法原子已逐步完成「全栈自研技术+全链路布局+场景化应用」闭环生态的搭建,为商业化进程提供根本保障。

魔法原子成立于 2024 年 1 月,专注于通用机器人和具身智能技术研发与落地应用,产品涵盖通用人形机器人与四足机器人,覆盖工业、商业及家庭等多元场景。(来源:极客公园)

三星首秀 Sensor OLED 技术:全屏识别指纹,支持心率检测

5 月 16 日消息,科技媒体 SamMobile 发布博文,报道称在 2025 年 SID Display Week 博览会上,三星显示(Samsung Display)公司展示 Sensor OLED 技术,内置传感器,能在屏幕任意位置检测指纹,甚至还能测量心率、血压和压力水平。

在传统 OLED 屏幕上,屏下指纹传感器只能在特定区域识别指纹;而 Sensor OLED 技术直接在制造过程中嵌入了有机光电二极管(OPD)层,实现全屏检测用户指纹。

更值得关注的是,Sensor OLED 技术不仅支持全屏识别指纹,还能像智能手表和健身追踪器一样,检测心率、血压和压力水平。其原理是利用 OLED 光线根据血管收缩和扩张的不同反射特性,通过 OPD 层将数据转化为健康信息。(来源:IT 之家)

 

荣耀 400 Pro 真机首曝:首发流光织锦工艺,最美荣耀手机

日前荣耀官方宣布,将在本月推出全新的荣耀 400 系列,包含荣耀 400 和荣耀 400 Pro 两款机型,目前该系列已在各大平台上架开启预约,受到了不少用户的关注。现在有最新消息,近日有数码博主进一步晒出了其中荣耀 400 Pro 的真机谍照。

据知名数码博主 @ 旺仔百事通 最新晒出的真机照显示,与此前曝光的消息基本一致,全新的荣耀 400 Pro 将至少提供幻夜黑、揽月银和海风蓝两款配色,其中海风蓝配色首发流光织锦工艺,将真丝感纤维与贝母珠粉等材料,在真空环境中层层压制融合,让每一块背板设计都与众不同,就像每一缕海风、每一捧流沙,都是独一无二,堪称是最美荣耀手机。除此之外,该机的后置相机模组将采用全新的「旷野舷窗」设计,通过背板至镜头的流畅过渡展现出与众不同的美感。

据悉,全新的荣耀 400 Pro 将在本月正式发布,由肖战代言。(来源: TechWeb)

全球首部全程 IMAX 胶片拍摄电影:诺兰新片《奥德赛》明年夏季上映

5 月 16 日消息,据外媒《好莱坞报道者》报道,克里斯托弗・诺兰执导的新片《奥德赛》将在明年夏季上映,这部改编自希腊史诗的作品不仅内容宏大,其制作方式也将开创历史:全球首部全程使用 IMAX 胶片拍摄的电影。

此前,《复仇者联盟 3:无限战争》就已经使用 IMAX 设备完成全片拍摄。但与前者不同,《奥德赛》则是首部全程采用 IMAX 胶片拍摄的电影,而非数字设备。IMAX CEO 里奇・盖尔方德在戛纳电影节期间的一场媒体午宴上宣布了这一消息,并透露这是诺兰率先提出的挑战。

据悉,升级后的摄影机更轻便、运作时的噪音也降低了三成。IMAX 还开发出全新的胶片扫描与处理技术,让拍摄时可以更快速地回看素材。当前这些摄影机仅供诺兰使用,《奥德赛》制作完毕后才会对其他导演开放。

自 2008 年《黑暗骑士》以来,诺兰就一直是 IMAX 技术的坚定拥护者,当时他首次用 IMAX 摄影机拍摄动作戏。从那以后,他的每部作品都采用 IMAX 拍摄。(来源:IT 之家)

 

56 年无人解开的数学难题,被谷歌的新 AI 突破了

2025年5月16日 16:31

去年,AI 能解出博士级别的数学题,已是轰动一时的大新闻;而今年,能攻克「未解之谜」级别的数学难题的 AI 已经来了。

5 月 15 日,Google DeepMind 发布了全新编程智能体 AlphaEvolve。

不同于传统的编程 Agent,它专注于通用算法的自动发现与持续优化。顾名思义,AlphaEvolve 擅长在「进化」中寻找更优解,它模拟自然选择机制,能在代码中不断迭代、演化出创新算法。

只要问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法。Google 表示,在组合数学、几何学、数论等超过 50 个未解问题中应用后,AlphaEvolve 在约 20% 的问题上超越了人类现有解法。

DeepMind 研究员 Matej Balog 表示:「AlphaEvolve 在十多个公开的数学问题上取得了突破。但最让我激动的是:它找到了 56 年以来,4x4 复数矩阵乘法算法的首次改进。这个结果,来自它自创的一种复杂搜索算法。」

AlphaEvolve 的价值不仅在数学,它展现出的是一种通用的「算法发现能力」。Balog 表示:「我们对 AlphaEvolve 的应用,还只是触及表层。」

问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法

Google DeepMind 表示,AlphaEvolve 能够在多个复杂问题中取得突破,关键在于其背后运作的是一整套自动进化机制,能持续优化算法并提升性能。

从本质上看,AlphaEvolve 解决的是一个通用的黑盒优化问题:maximize h(f)。其中,f 是由大型语言模型生成的程序,h 是衡量该程序质量的评估函数。

在实际流程中,AlphaEvolve 首先通过提示采样器(prompt sampler)组装提示词,引导语言模型生成代码。DeepMind 使用了两个不同的 Gemini 模型协同工作:Gemini Flash 以更高速度生成大量候选方案,扩展思路的广度;Gemini Pro 则提供更深入的结构性建议。二者结合,使模型能产出具备实际可行性和算法深度的程序。

生成的程序会被送入自动评估系统,经过验证、运行和打分后,写入程序数据库。数据库中运行着一套进化算法,会从已有程序中挑选表现最好的方案,为下一轮提示提供方向,不断迭代出更优解。

AlphaEvovle 的一个核心点就是这套自动评估指标。它能对生成程序进行验证、运行和评分。每一个程序都会被 h 函数衡量其准确性、运行效率、代码质量等维度。这些评分标准是客观、量化的,使 AlphaEvolve 能够在无需人类直接干预的前提下持续优化。

不过,这里的 h 函数依然由人类研究人员定义,可以是准确率、运行时间,甚至代码可读性等维度的组合。AlphaEvolve 负责的只是在给定 h 的前提下去寻找最优的 f。对于一些数学问题或研究任务,Google 也可能预设 h。

这也说明了 AlphaEvolve 当前的边界:它适用于那些「成果是否优秀」可以自动量化判断的问题。但如何定义「优秀」,仍需人来给出。在需要人类实验才能确定是否优秀的问题上,AlphaEvolve 就无法评估了。

以 DeepMind 研究员提到的 4×4 复数矩阵乘法为例,研究人员设置了一组任务目标,包括达到的最低乘法次数(即张量分解的秩)以及达到该结果的随机种子比例。这些信号构成了 AlphaEvolve 的优化目标,引导它在复杂的搜索空间中稳步「爬山」。

AlphaEvolve 从问题定义出发,基于标准的梯度优化流程(包括初始化器、重建损失函数、Adam 优化器等),演化出了一系列高质量的张量分解算法。最终,它在 14 个矩阵乘法结构上超越了已知最优结果。其中最引人注目的,是它提出了历史上第一个能用 48 次乘法完成 4×4 复数矩阵乘法的算法——打破了 56 年未被突破的记录。

AlphaEvolve 的技术路线可追溯到 DeepMind 早期提出的 FunSearch 系统。FunSearch 同样利用语言模型引导程序进化,曾被用于发现数学结构或在线算法策略。但与之相比,AlphaEvolve 的扩展性显著提升:它可以修改完整程序,处理多个函数、组件、甚至跨语言结构协同优化,而不仅限于 Python 中的单一函数。

这种更高的通用性,使 AlphaEvolve 不再只是一个「智能改函数」的工具,而像是一个可以自主演化大型算法系统的「程序设计伙伴」。

据 DeepMind 披露,AlphaEvolve 已被应用于 50 多个数学难题,涵盖数学分析、几何学、组合数学与数论等领域。大多数实验都能在数小时内完成部署。

在约 75% 的问题中,它成功重新发现了当前的最优解。更令人惊喜的是,在约 20% 的问题中,它给出了比已知方法更好的解法。比如在数学界研究了 300 多年的「接吻数问题」中,AlphaEvolve 构造出由 593 个球体组成的新结构,在 11 维空间中刷新了下界。

除了数学,AlphaEvolve 也已在 Google 内部实际落地应用,解决了计算栈中多个层面的工程问题,包括:为 Borg 系统设计新的调度启发式;优化大语言模型训练时使用的矩阵乘法内核;改写 TPU 芯片中的算术电路;加速 Transformer 注意力机制的执行速度。

这些任务之间跨度极大,但都具备一个共性:问题能用程序表达、结果能用函数评估。只要这两点成立,AlphaEvolve 就可以发挥作用。

更多的智能供给,带来无限的游戏

此次发布来自 Google DeepMind,这一团队曾推出 AlphaGo、AlphaFold 等具有里程碑意义的 AI 系统,在博弈智能与科学发现领域显著扩展了人工智能的能力边界。

AlphaEvolve,与依赖强化学习和自我博弈(如 AlphaGo)的系统不同,是通过语言模型生成大量程序候选,结合自动评估与进化机制,筛选出更优的算法方案。它更像是一种可编排、可扩展的算法构造与发现框架。

相比 AlphaGo 展示的是人工智能如何在规则明确定义的博弈中超越人类,AlphaEvolve 的意义可能更在于:它为研究者提供了一种持续、可扩展的算法生成与优化能力。

算法设计与调优历来是一种高度稀缺的技术能力。算法工程师在就业市场上普遍享有更高的薪酬与职位门槛,足以反映其复杂性与稀缺性。

而现在,只要设定明确的评估方式,AlphaEvolve 就有可能以接近无限的算力和耐心,自动探索并优化算法解法。这意味着,「发现并改进算法」这项曾依赖个体经验的能力,开始从稀缺、手工、不可复制,变为可自动化、可规模化的智能供给。

尤瓦尔·赫拉利曾经有一个比喻,形容 AlphaGo 为人类带来的冲击。

人类一直在围棋星球上探索如何下围棋,不断有人画出路线图,探索围棋星球的样貌。直到 AI 出现,人类才惊觉,自己不过是在围棋星球的一座小岛上原地打转,而真正的星球辽阔无边,未曾涉足的区域远超想象。

而去年到今年,在科研领域,我们也不断地看到 AI 正在做同样的事情。2024 年,AI 相关成果首次同时获得诺贝尔物理学奖与化学奖,而这很有可能成为未来的科研常态。

从某种程度上说,AlphaEvolve 所做的,是以前所未有的速度加快这张科研的「未知地图」的展开。以无限的智能供给,让每个领域都有可能被再探索一遍。

当「能被发现的算法」不再稀缺,人类对知识的征途,或许才刚刚开始。

 

 

❌
❌