普通视图

发现新文章,点击刷新页面。
今天 — 2025年5月17日极客公园

雷军最新内部演讲曝光;美团外卖推出堂食店标签;英伟达计划在上海设立研发中心

2025年5月17日 08:58

雷军最新内部演讲曝光:小米不再是行业新人,公众的期待和要求远超想象

5 月 16 日消息,一份雷军在小米价值观大赛后对内部员工发表演讲的视频曝光,罕见谈及了近期小米遭遇的舆论危机。

雷军表示,三月底的一场突如其来的交通事故,给小米带来了狂风暴雨般的质疑、批评和指责。我和同事们一样,一下子都懵了,一位熟悉汽车行业的朋友告诉我:造车,遭遇交通事故在所难免。』但是谁也没有想到,这一场事故的影响如此之大,对我们小米的打击也如此之大。

雷军称,四年前决定造车的时候,一直特别担心安全问题,所以对汽车的质量和安全无比的重视。经过汽车团队这么多同事们三、四年的努力,我们 SU7 在上市的一年多的时间里面,质量一直是我们引以为傲的东西,在参与的所有权威机构的评测里面都拿到了最高分,但万万没有想到,这场交通事故,让我们意识到,公众对我们的期待和要求远超了想象。

他表示,我们一直觉得我们是汽车行业的新人,我们是一家创业的公司。但这一次的事件让我深深的理解,小米今天的规模、影响力、社会关注度都到了非常高的地方,社会和公众要求我们去承担一家真正的大公司行业领导者的责任。我们深刻的意识到,这是 15 年的小米无可回避的责任。15 岁的小米,不再是行业的新人,我们在任何一个产业里面都没有了新手保护期,我们要有更高的标准和目标。(来源: TechWeb)

马斯克 4000 亿薪酬被推翻,特斯拉修改公司章程打压股东诉讼

5 月 17 日,据彭博社报道,在埃隆・马斯克 (Elon Musk) 的天价薪酬被股东诉讼推翻后,特斯拉公司正采取措施防止未来再次出现此类情况。特斯拉在周五晚间披露,已修改公司章程,规定股东必须持有至少 3% 的公司股份,才能「发起或维持一项衍生诉讼」。衍生诉讼指的是股东代表公司对相关责任人发起的诉讼。根据监管文件,特斯拉是在 5 月 15 日修改的章程。

就在几天前,得州州长格雷格・阿博特 (Greg Abbott) 签署立法对该州公司法进行一系列修改,包括允许公司设定股东发起衍生诉讼所需的持股门槛。阿博特以及该州其他共和党领导人宣称,此举旨在吸引更多企业在得州注册成立。

正是股东诉讼导致马斯克的天价薪酬泡汤。特斯拉授予马斯克的薪酬协议在 2018 年获得股东批准,最初价值为 26 亿美元,但是在 2024 年初被裁定无效时已飙升至 560 亿美元 (约合 4036 亿元人民币)。在特斯拉股价飙涨时,其价值一度超过 1000 亿美元。然而,该薪酬方案遭到了一位股东的质疑。

在马斯克薪酬被推翻后,特斯拉把注册地从特拉华州迁至得州。目前,特斯拉已就该裁决向特拉华州最高法院提起上诉,这一过程可能耗时数月时间。

截至发稿,特斯拉尚未就此置评。(来源:凤凰科技)

 

消息称英伟达计划在上海设立研发中心

5 月 16 日消息,英国《金融时报》援引两位知情人士消息称,英伟达计划在上海设立研发中心,力图在其中国市场销售受挫的背景下维持在 AI 芯片领域的领先地位。

知情人士透露,英伟达 CEO 黄仁勋上月与上海市长龚正会面时提出了这一设想。公司目前正租用新的办公场地,以安置现有员工并为后续扩编预留空间。

知情人士表示,新设立的研发中心将专注于满足中国客户的特定需求。上海团队将参与全球研发工作,包括芯片设计验证、产品优化,以及自动驾驶等特定领域的研究。

黄仁勋希望吸引中国本土顶尖 AI 人才。目前,英伟达正为上海团队招聘多个岗位,包括开发下一代深度学习软硬件的工程师,以及设计和优化面向全球市场的 ASIC 芯片开发者。

有知情人士透露,上海市已对上述规划表达初步支持。(来源: IT 之家)

 

Meta 推迟发布旗舰 AI 模型 Behemoth,因能力提升遇到困难

5 月 16 日消息,据外媒报道,知情人士称,Meta 工程师难以大幅提升旗舰 AI 模型「Behemoth」(巨头)的能力,将推迟发布模型。

Meta 在 4 月发布了 Llama 4 模型系列中的两个小型模型 Scout 和 Maverick,但更大的 Behemoth 版本发布被推迟至 6 月。

现在,据报道,Behemoth 模型发布时间又被推迟到秋季甚至更晚,因能力提升并不明显。这也引发了公司内部对耗费巨资打造 AI 这一投资方向的担忧。

不过,外媒也提到,其他试图发布下一代重磅模型的顶尖 AI 公司也纷纷遇挫,比如说 OpenAI。去年 12 月,就有外媒报道,OpenAI 开发其下一个主要模型 GPT-5 的努力正落后于计划,其结果还不能证明巨大的成本是合理的。

值得一提的是,Llama 4 发布后,还因作弊刷榜、代码能力拉垮、伪开源等备受争议。(来源: TechWeb)

OpenAI 的 AI 程序员上线,人类仅需点按钮

5 月 17 日报道,昨夜,OpenAI 推出一款基于云的软件工程 Agent(智能体)——Codex的预览版。

Codex 可并行处理多项任务,例如编程、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,在云上运行并预加载用户代码库。

Codex 由codex-1 模型提供支持。codex-1 是 OpenAI o3 针对软件工程优化后的版本。目前,Codex 已面向 ChatGPT Pro、Team 和 Enterprise 用户上线,即将面向 Plus 用户上线。

OpenAI 同步推出 codex-1 的精简版本,基于 o4-mini 专为轻量级开源编码 Agent「Codex CLI」而打造,API 定价为1.5 美元/100 万 tokens 输入,6 美元/100 万 tokens 输出,即时缓存打七五折。(来源:智东西)

 

美团外卖推出「堂食店」标签:是否堂食并非检验品质的唯一标准

5 月 16 日消息,美团外卖官宣,为更好地帮助商家还原真实经营场景,面向消费者提供更加多元可信的参考信息,美团外卖近期对「明厨计划」进行了全面升级,推出「堂食店」标签功能,开放商家认证流程,并将在首页推荐位、专属标签等多个核心位置展示。

同时,自 4 月以来,美团外卖加大对「明厨亮灶」的补贴力度,面向夫妻店、社区小店等中小餐饮商户提供覆盖硬件设备购置、安装等费用的全额补贴,首期补贴总额达 5000 万元。

IT 之家注意到,美团外卖还称:「是否堂食并非检验品质的唯一标准,消费者更需要看得见的食品安全。我们期望,让每一份外卖都承载着安心与诚意,让每一家规范经营的商家都获得更多关注。」(来源:IT 之家)

 

腾讯混元图像 2.0 模型发布:毫秒级响应,一边打字一边出图

5 月 16 日消息,腾讯混元图像 2.0 模型(Hunyuan Image2.0)正式发布,在腾讯混元官方网站上线,并对外开放注册体验。

腾讯混元图像 2.0 模型主要有两大特点:实时生图、超写实画质。

相比前代模型,腾讯混元图像 2.0 模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度「显著快于行业领先模型」,在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元号称可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统「抽卡—等待—抽卡」的方式。

除了速度快以外,腾讯混元图像 2.0 模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像号称可避免 AIGC 图像中的「AI 味」。(来源:IT 之家)

 

魔法原子再获数亿融资,推动千行百业落地

近日,具身智能机器人公司魔法原子宣布完成数亿元新一轮战略融资。本轮投资方包括战略产业资本禾创致远、芯联资本,财务投资人华映资本、晓池资本、元禾厚望,老股东追创创投和翼朴基金持续追加投资,新资金将用于具身智能核心技术迭代研发,VLA 模型搭建,加速推动机器人在工业、商业场景落地。

短短半年内,魔法原子连续完成了两轮超亿元级融资。在此期间,魔法原子已逐步完成「全栈自研技术+全链路布局+场景化应用」闭环生态的搭建,为商业化进程提供根本保障。

魔法原子成立于 2024 年 1 月,专注于通用机器人和具身智能技术研发与落地应用,产品涵盖通用人形机器人与四足机器人,覆盖工业、商业及家庭等多元场景。(来源:极客公园)

三星首秀 Sensor OLED 技术:全屏识别指纹,支持心率检测

5 月 16 日消息,科技媒体 SamMobile 发布博文,报道称在 2025 年 SID Display Week 博览会上,三星显示(Samsung Display)公司展示 Sensor OLED 技术,内置传感器,能在屏幕任意位置检测指纹,甚至还能测量心率、血压和压力水平。

在传统 OLED 屏幕上,屏下指纹传感器只能在特定区域识别指纹;而 Sensor OLED 技术直接在制造过程中嵌入了有机光电二极管(OPD)层,实现全屏检测用户指纹。

更值得关注的是,Sensor OLED 技术不仅支持全屏识别指纹,还能像智能手表和健身追踪器一样,检测心率、血压和压力水平。其原理是利用 OLED 光线根据血管收缩和扩张的不同反射特性,通过 OPD 层将数据转化为健康信息。(来源:IT 之家)

 

荣耀 400 Pro 真机首曝:首发流光织锦工艺,最美荣耀手机

日前荣耀官方宣布,将在本月推出全新的荣耀 400 系列,包含荣耀 400 和荣耀 400 Pro 两款机型,目前该系列已在各大平台上架开启预约,受到了不少用户的关注。现在有最新消息,近日有数码博主进一步晒出了其中荣耀 400 Pro 的真机谍照。

据知名数码博主 @ 旺仔百事通 最新晒出的真机照显示,与此前曝光的消息基本一致,全新的荣耀 400 Pro 将至少提供幻夜黑、揽月银和海风蓝两款配色,其中海风蓝配色首发流光织锦工艺,将真丝感纤维与贝母珠粉等材料,在真空环境中层层压制融合,让每一块背板设计都与众不同,就像每一缕海风、每一捧流沙,都是独一无二,堪称是最美荣耀手机。除此之外,该机的后置相机模组将采用全新的「旷野舷窗」设计,通过背板至镜头的流畅过渡展现出与众不同的美感。

据悉,全新的荣耀 400 Pro 将在本月正式发布,由肖战代言。(来源: TechWeb)

全球首部全程 IMAX 胶片拍摄电影:诺兰新片《奥德赛》明年夏季上映

5 月 16 日消息,据外媒《好莱坞报道者》报道,克里斯托弗・诺兰执导的新片《奥德赛》将在明年夏季上映,这部改编自希腊史诗的作品不仅内容宏大,其制作方式也将开创历史:全球首部全程使用 IMAX 胶片拍摄的电影。

此前,《复仇者联盟 3:无限战争》就已经使用 IMAX 设备完成全片拍摄。但与前者不同,《奥德赛》则是首部全程采用 IMAX 胶片拍摄的电影,而非数字设备。IMAX CEO 里奇・盖尔方德在戛纳电影节期间的一场媒体午宴上宣布了这一消息,并透露这是诺兰率先提出的挑战。

据悉,升级后的摄影机更轻便、运作时的噪音也降低了三成。IMAX 还开发出全新的胶片扫描与处理技术,让拍摄时可以更快速地回看素材。当前这些摄影机仅供诺兰使用,《奥德赛》制作完毕后才会对其他导演开放。

自 2008 年《黑暗骑士》以来,诺兰就一直是 IMAX 技术的坚定拥护者,当时他首次用 IMAX 摄影机拍摄动作戏。从那以后,他的每部作品都采用 IMAX 拍摄。(来源:IT 之家)

 

昨天 — 2025年5月16日极客公园

56 年无人解开的数学难题,被谷歌的新 AI 突破了

2025年5月16日 16:31

去年,AI 能解出博士级别的数学题,已是轰动一时的大新闻;而今年,能攻克「未解之谜」级别的数学难题的 AI 已经来了。

5 月 15 日,Google DeepMind 发布了全新编程智能体 AlphaEvolve。

不同于传统的编程 Agent,它专注于通用算法的自动发现与持续优化。顾名思义,AlphaEvolve 擅长在「进化」中寻找更优解,它模拟自然选择机制,能在代码中不断迭代、演化出创新算法。

只要问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法。Google 表示,在组合数学、几何学、数论等超过 50 个未解问题中应用后,AlphaEvolve 在约 20% 的问题上超越了人类现有解法。

DeepMind 研究员 Matej Balog 表示:「AlphaEvolve 在十多个公开的数学问题上取得了突破。但最让我激动的是:它找到了 56 年以来,4x4 复数矩阵乘法算法的首次改进。这个结果,来自它自创的一种复杂搜索算法。」

AlphaEvolve 的价值不仅在数学,它展现出的是一种通用的「算法发现能力」。Balog 表示:「我们对 AlphaEvolve 的应用,还只是触及表层。」

问题能用程序表达、结果能用函数评估,AlphaEvolve 就能迭代算法

Google DeepMind 表示,AlphaEvolve 能够在多个复杂问题中取得突破,关键在于其背后运作的是一整套自动进化机制,能持续优化算法并提升性能。

从本质上看,AlphaEvolve 解决的是一个通用的黑盒优化问题:maximize h(f)。其中,f 是由大型语言模型生成的程序,h 是衡量该程序质量的评估函数。

在实际流程中,AlphaEvolve 首先通过提示采样器(prompt sampler)组装提示词,引导语言模型生成代码。DeepMind 使用了两个不同的 Gemini 模型协同工作:Gemini Flash 以更高速度生成大量候选方案,扩展思路的广度;Gemini Pro 则提供更深入的结构性建议。二者结合,使模型能产出具备实际可行性和算法深度的程序。

生成的程序会被送入自动评估系统,经过验证、运行和打分后,写入程序数据库。数据库中运行着一套进化算法,会从已有程序中挑选表现最好的方案,为下一轮提示提供方向,不断迭代出更优解。

AlphaEvovle 的一个核心点就是这套自动评估指标。它能对生成程序进行验证、运行和评分。每一个程序都会被 h 函数衡量其准确性、运行效率、代码质量等维度。这些评分标准是客观、量化的,使 AlphaEvolve 能够在无需人类直接干预的前提下持续优化。

不过,这里的 h 函数依然由人类研究人员定义,可以是准确率、运行时间,甚至代码可读性等维度的组合。AlphaEvolve 负责的只是在给定 h 的前提下去寻找最优的 f。对于一些数学问题或研究任务,Google 也可能预设 h。

这也说明了 AlphaEvolve 当前的边界:它适用于那些「成果是否优秀」可以自动量化判断的问题。但如何定义「优秀」,仍需人来给出。在需要人类实验才能确定是否优秀的问题上,AlphaEvolve 就无法评估了。

以 DeepMind 研究员提到的 4×4 复数矩阵乘法为例,研究人员设置了一组任务目标,包括达到的最低乘法次数(即张量分解的秩)以及达到该结果的随机种子比例。这些信号构成了 AlphaEvolve 的优化目标,引导它在复杂的搜索空间中稳步「爬山」。

AlphaEvolve 从问题定义出发,基于标准的梯度优化流程(包括初始化器、重建损失函数、Adam 优化器等),演化出了一系列高质量的张量分解算法。最终,它在 14 个矩阵乘法结构上超越了已知最优结果。其中最引人注目的,是它提出了历史上第一个能用 48 次乘法完成 4×4 复数矩阵乘法的算法——打破了 56 年未被突破的记录。

AlphaEvolve 的技术路线可追溯到 DeepMind 早期提出的 FunSearch 系统。FunSearch 同样利用语言模型引导程序进化,曾被用于发现数学结构或在线算法策略。但与之相比,AlphaEvolve 的扩展性显著提升:它可以修改完整程序,处理多个函数、组件、甚至跨语言结构协同优化,而不仅限于 Python 中的单一函数。

这种更高的通用性,使 AlphaEvolve 不再只是一个「智能改函数」的工具,而像是一个可以自主演化大型算法系统的「程序设计伙伴」。

据 DeepMind 披露,AlphaEvolve 已被应用于 50 多个数学难题,涵盖数学分析、几何学、组合数学与数论等领域。大多数实验都能在数小时内完成部署。

在约 75% 的问题中,它成功重新发现了当前的最优解。更令人惊喜的是,在约 20% 的问题中,它给出了比已知方法更好的解法。比如在数学界研究了 300 多年的「接吻数问题」中,AlphaEvolve 构造出由 593 个球体组成的新结构,在 11 维空间中刷新了下界。

除了数学,AlphaEvolve 也已在 Google 内部实际落地应用,解决了计算栈中多个层面的工程问题,包括:为 Borg 系统设计新的调度启发式;优化大语言模型训练时使用的矩阵乘法内核;改写 TPU 芯片中的算术电路;加速 Transformer 注意力机制的执行速度。

这些任务之间跨度极大,但都具备一个共性:问题能用程序表达、结果能用函数评估。只要这两点成立,AlphaEvolve 就可以发挥作用。

更多的智能供给,带来无限的游戏

此次发布来自 Google DeepMind,这一团队曾推出 AlphaGo、AlphaFold 等具有里程碑意义的 AI 系统,在博弈智能与科学发现领域显著扩展了人工智能的能力边界。

AlphaEvolve,与依赖强化学习和自我博弈(如 AlphaGo)的系统不同,是通过语言模型生成大量程序候选,结合自动评估与进化机制,筛选出更优的算法方案。它更像是一种可编排、可扩展的算法构造与发现框架。

相比 AlphaGo 展示的是人工智能如何在规则明确定义的博弈中超越人类,AlphaEvolve 的意义可能更在于:它为研究者提供了一种持续、可扩展的算法生成与优化能力。

算法设计与调优历来是一种高度稀缺的技术能力。算法工程师在就业市场上普遍享有更高的薪酬与职位门槛,足以反映其复杂性与稀缺性。

而现在,只要设定明确的评估方式,AlphaEvolve 就有可能以接近无限的算力和耐心,自动探索并优化算法解法。这意味着,「发现并改进算法」这项曾依赖个体经验的能力,开始从稀缺、手工、不可复制,变为可自动化、可规模化的智能供给。

尤瓦尔·赫拉利曾经有一个比喻,形容 AlphaGo 为人类带来的冲击。

人类一直在围棋星球上探索如何下围棋,不断有人画出路线图,探索围棋星球的样貌。直到 AI 出现,人类才惊觉,自己不过是在围棋星球的一座小岛上原地打转,而真正的星球辽阔无边,未曾涉足的区域远超想象。

而去年到今年,在科研领域,我们也不断地看到 AI 正在做同样的事情。2024 年,AI 相关成果首次同时获得诺贝尔物理学奖与化学奖,而这很有可能成为未来的科研常态。

从某种程度上说,AlphaEvolve 所做的,是以前所未有的速度加快这张科研的「未知地图」的展开。以无限的智能供给,让每个领域都有可能被再探索一遍。

当「能被发现的算法」不再稀缺,人类对知识的征途,或许才刚刚开始。

 

 

❌
❌