普通视图

发现新文章,点击刷新页面。
昨天 — 2025年4月13日极客公园

美国对电脑、手机等豁免征收「对等关税」;Ilya 新公司估值达到 2000 亿元;刘强东回应美团高管看衰京东外卖 | 极客早知道

2025年4月13日 08:47

美国宣布对笔记本电脑、智能手机、集成电路等豁免征收「对等关税」

4 月 12 日消息,根据美国海关的最新指南,智能手机和电脑将不受特朗普政府的「对等关税」政策的影响。

新的关税指南还包括对其他电子设备和零部件的豁免,包括半导体、太阳能电池、平板电视显示器、闪存驱动器、存储卡以及用于存储数据的固态硬盘等。

CNBC 提到,苹果的 iPhone 手机等许多电子产品都在中国生产,但报道没有提到中国产电子产品是否在免除范围内。科技网站 wccftech 则称,「根据我们对文件的解读,豁免条款中没有提及针对中国的条款,这意味着来自该地区的智能手机和个人电脑产品不会被征收 145% 的关税。这是一个重大进展。」 (来源:环球时报)

 

蚂蚁集团副总裁、前基础大模型负责人徐鹏离职

4 月 12 日消息,蚂蚁集团副总裁、前基础大模型负责人徐鹏已离职。徐鹏一直从事人工智能领域技术研究,曾在谷歌工作 11 年,负责和领导了谷歌翻译的核心技术研发,并参与了谷歌显示广告系统的算法研发。此前蚂蚁成立 AI 创新研发与应用部门 NextEvo,由徐鹏担任负责人,承担了蚂蚁 AI 的所有核心技术研发,包括蚂蚁百灵大模型的所有研发工作。(来源:财联社)

 

谷歌、英伟达投资前 OpenAI 科学家 Ilya 创立的新 AI 公司

4 月 12 日消息,谷歌、英伟达投资由前 OpenAI 科学家伊利亚·苏茨克沃(Ilya Sutskever)创立的 Safe Superintelligence(SSI)。消息人士称,SSI 最近完成一轮 20 亿美元的融资,由绿橡树资本(Greenoaks)领投,估值达到 320 亿美元。目前,该轮投资具体条款暂无法确定,三家公司发言人拒绝置评。(来源:钛媒体)

 

巴菲特发行 900 亿日元债券,有分析称:可能是逆势抄底信号

4 月 12 日消息,「股神」巴菲特旗下的伯克希尔·哈撒韦公司近日发行了一笔总额 900 亿日元(约合人民币 46 亿元)债券。彭博汇编的数据显示,这是巴菲特的公司自 2019 年进入日本市场以来规模最小的日元交易。

在市场动荡的背景下,此次债券发售受到市场的高度关注,因为伯克希尔筹集的资金可能被用于增持日本公司的股份。有分析称,随着股价下挫,五大商社的估值都有所回落,按照巴菲特「别人恐惧我贪婪,别人贪婪我恐惧」的投资风格,此次发行日元债券可能是逆势抄底的信号,伯克希尔未来大概率将继续增持五大商社股份。(来源:券商中国)

 

苹果手机 9 天涨价 500 元?经销商:有价无市,没人敢收

4 月 12 日消息,在美国新一轮关税的影响下,iPhone 手机也面临涨价的情况。

近日有经销商表示,iPhone 在中国市场的价格迎来了涨价,最近这 9 天涨幅达到了 500 元,这引发了网友的围观。

位于杭州西湖边的苹果直营店店员表示,在售的 iPhone16 等机型按照上市时的价格保持不变。至于新一代的 iPhone17 未来是什么价格、会不会调价,现阶段暂未可知,以届时上新公布的价格为准。(来源:每经)

 

刘强东回应美团高管王莆中:不打口水仗,产生不了社会价值

4 月 12 日消息,今日早间,美团核心本地商业 CEO 王莆中在社交媒体上言词激烈,火药味十足地发文炮轰京东,其称京东不是第一家想做外卖的公司,也可能不是最后一家,「阿里、滴滴、字节不是都做过,滴滴目前在海外也还在做呢。」

今日下午,京东集团新闻发言人齐珊珊在朋友圈发布了与京东集团创始人刘强东的内网对话,并表示:「又上了一课,踏实做事,努力创造社会价值。」

据其朋友圈截图显示,刘强东本人得知今日早间王莆中的言论回应称:要是有空就赶紧去加入「小哥应急小组」,看看有没有外卖或者快递兄弟在大风中遇到困难的!或者去参与出口受阻企业的采购小组工作,尽快给他们提供帮助。

此外,刘强东还表示,「不要和人打口仗,不能产生社会价值。」(来源:新浪科技)

 

美关税系统突发故障,持续超 10 小时方才恢复

当地时间 4 月 11 日,美国海关和边境保护局发布警报,称该部门一个涉及关税豁免的代码出现故障。海关与边境保护局表示,这一故障在持续了超过 10 个小时后被修复。

据悉,出现故障的代码可以豁免本周所有不应受到特朗普政府关税新政策影响的在途货物。故障发生时,美国海关的「自动商业环境」系统无法对在 4 月 9 日以后提交申请的、符合在途条件的货物适用较低的 10% 税率。

美国多位进口商表示,很多进口商难以「弄清楚新关税何时实施」并制定相应计划。

在关税政策引发不确定性和担忧的大背景下,此事是对美国货主和供应链的最新打击。外界也由此质疑美国海关是否有能力落实特朗普的关税新政。(来源:央视新闻)

 

4600 万次下载:ChatGPT 成 3 月全球最受欢迎非游戏类应用

4 月 12 日消息,市场调查机构 App Figures 发布博文,报告 2025 年 3 月全球非游戏应用下载量,ChatGPT 以 4600 万次力压 Instagram 和 TikTok,成为全球下载量最高(仅统计苹果 App Store 和谷歌 Play Store 两大官方应用商店)的非游戏应用。

Appfigures 数据显示,2025 年 3 月,ChatGPT 以 4600 万次下载成为全球最受欢迎的非游戏类应用,超越 Instagram(4600 万次)和 TikTok(4500 万次)。

这一成绩得益于其在 iOS 平台的强劲表现,下载量达 1300 万次,远超 TikTok(800 万次)和 Instagram(500 万次)。ChatGPT 成功登顶苹果应用商店,而 TikTok 仅排第六,Instagram 甚至未进前十。(来源:IT 之家) 

 

史无前例!苹果 18.8 英寸巨型折叠屏来了:明年量产

分析师 Jeff Pu 在报告中表示,苹果两款折叠屏设备的研发工作取得新进展,新品将于明年年底量产,上市时间预计是 2026 年底或 2027 年上半年。

据悉,苹果折叠屏新品有一款是手机,屏幕尺寸是 7.8 英寸,另一款折叠屏尺寸是 18.8 英寸,其定位目前还有争议,Jeff Pu 认为是 MacBook 和 iPad 的混合体,搭载 macOS,支持触控;Mark Gurman 认为是折叠屏 iPad,分析师郭明錤则认为是 MacBook。

目前来看,这款 18.8 英寸折叠屏设备的定位取决于它搭载的系统,如果是运行 iPadOS,它就是折叠屏 iPad,如果运行 macOS,它就是折叠屏 MacBook。(来源:快科技)

 

一加 13T 真机曝光:小直屏设计 + 超 6000mAh 电池,本月发售

4 月 12 日消息,今日,网络上曝光了一加首款小屏旗舰一加 13T 的真机谍照,新机采用直屏设计以及金属直边中框,整机方正硬朗且特别小巧。

据悉,一加 13T 采用 6.3 英寸 1.5K 中置挖孔直屏,边框控制出色,正面 R 角弧度与 iPhone 16 Pro 接近,视觉观感舒适。

一加中国区总裁李杰介绍,一加 13T 定位「小屏大魔王」,在配色上,所有版本都会采用低饱和度设计,呈现出精致且耐看的视觉效果。(来源:快科技)

 

vivo X200 Ultra 手机核心配置公布:6000mAh 蓝海电池、8.69mm 机身

 4 月 12 日消息,vivo 官方今日发文公布了 X200 Ultra 手机核心配置,新机将搭载骁龙 8 至尊版处理器,内置 6000mAh 蓝海电池,支持 90W 有线 + 40W 无线闪充、直驱供电。

vivo X200 Ultra 还将配备超声波 3D 指纹、2K 蔡司大师色彩屏、圆偏振光护眼技术、铠甲玻璃等。另外,新机的机身厚度约 8.69mm。(来源:IT 之家)

 

调查显示当手机电量降至 38% 时 大多数人都会感到恐慌

电池续航时间仍然是智能手机和便携式设备用户最关心的问题。尽管研究人员正在积极探索锂离子电池的替代品,但制造商通常依赖基于软件的解决方案来提高效率。最近的一项研究表明,对电池剩余续航时间的焦虑出乎意料地早早出现,尤其是在年轻用户中。

Talker Research 的一项在线调查发现,美国人平均在手机电量达到 38% 时就开始担心电池续航。有些人可能认为这个阈值比较保守,因为它只反映了剩余电量的三分之一以上。例如,iPhone 通常只有在电量低于 20% 时才会发出警告。

在 2000 名美国受访者中,大多数人表示早在苹果发出 20% 的警告之前就感到恐慌。34% 的用户认为这个弹出窗口会建议启用低电量模式。最不焦虑的群体(13%)直到电池电量低于 10% 才会考虑寻找充电器。与此同时,24% 的受访者在电量达到一半之前就感到不安。(来源:今日头条)

昨天以前极客公园

继续反制,中国对美所有商品加征 125% 关税;小米汽车回应 SU7 湛江事故;GPT-4 将退役

2025年4月12日 08:58

继续反制,中国对美所有商品加征 125% 关税

4 月 11 日消息,国务院关税税则委员会发布公告,2025 年 4 月 10 日,美国政府宣布对中国输美商品征收「对等关税」的税率进一步提高至 125%。美方对华加征畸高关税,严重违反国际经贸规则,也违背基本的经济规律和常识,完全是单边霸凌胁迫做法。

根据《中华人民共和国关税法》、《中华人民共和国海关法》、《中华人民共和国对外贸易法》等法律法规和国际法基本原则,经国务院批准,自 2025 年 4 月 12 日起,调整对原产于美国的进口商品加征关税措施。有关事项如下:

一、调整《国务院关税税则委员会关于调整对原产于美国的进口商品加征关税措施的公告》(税委会公告 2025 年第 5 号)规定的加征关税税率,由 84% 提高至 125%。鉴于在目前关税水平下,美国输华商品已无市场接受可能性,如果美方后续对中国输美商品继续加征关税,中方将不予理会。

二、其他事项按照《国务院关税税则委员会关于对原产于美国的进口商品加征关税的公告》(税委会公告 2025 年第 4 号)执行。(来源:央视网)

传字节跳动正在开发 AI 智能眼镜

据 the information 报道,公司字节跳动正计划推出一款人工智能智能眼镜。

目前尚不清楚字节跳动何时发布这款智能眼镜以及销售范围。据知情人士透露,字节跳动正在与供应商讨论产品的功能、技术规格、成本以及发布时间,但公司发言人尚未对此回应。

据透露,字节跳动从去年开始着手开发 AI 眼镜项目,一些新招聘的硬件设计工程师也参与其中。工程师们正在解决诸如如何在不牺牲太多电池寿命的情况下,确保眼镜能够录制高质量图像和视频等技术挑战。(来源:the information)

 

OpenAI:现在只需 5~10 人即可从头重建 GPT-4;GPT-4 将退役

4 月 11 日消息,OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在公司内部播客中披露,得益于 GPT-4.5 的技术突破,重建 GPT-4 大模型所需团队规模已从数百人缩减至 5-10 人。

这一结论也获得了 GPT-4.5 预训练负责人亚历克斯・佩诺(Alex Paino)、数据效率研究员丹尼尔・塞尔萨姆(Daniel Selsam)等核心成员证实。

佩诺表示,GPT-4.5 的设计目标是比 2023 年 3 月发布的 GPT-4"智能 10 倍",他还补充道,"通过这种 GPT 预训练流程的优化,我们的规模也较之前拓展了 10 倍。"

OpenAI 认为,技术瓶颈已从算力转向数据效率领域(可能是指算力的边际效用递减,所以需要从算法方面寻求突破)。丹尼尔指出,当前 GPT 系列模型数据利用率存在 "洞察深度天然上限"。

另外,OpenAI 宣布将于 4 月 30 日停止在 ChatGPT 中使用其 2023 年 3 月发布的 GPT-4 模型,并将其完全替换为当前默认模型 GPT-4o。(来源:IT 之家)

 

消息称 Shein 伦敦上市获英国 FCA 批准,最新估值约 500 亿美元

4 月 11 日消息,有外媒报道称,跨境电商平台 Shein 已获得英国金融行为监管局(FCA)审批许可,待中国监管机构批准后即可赴伦敦进行首次公开募股(IPO)。

报道称,该企业于 2024 年 6 月向英国监管机构秘密递交上市申请文件,其 IPO 估值约为 500 亿美元(现汇率约合 3661.1 亿元人民币)左右。

Shein 是一家总部设在新加坡的中国在线快时尚零售商,前身是由许仰天于 2008 年在南京创立的跨境婚纱电商平台 SheInside,目前已经成为海外最大的电商平台之一。

Shein 没有自己的工厂,目前主要依托中国境内约 5800 家合作商完成商品生产,例如在 150 多个国家和地区销售 10 美元的连衣裙和 12 美元的牛仔裤。(来源:IT 之家)

特斯拉中国停止提供 Model X 和 Model S 新车订购选项

4 月 11 日消息,特斯拉中国官网显示,目前 Model X 和 Model S 车型已不再提供单独的订购新车选项,相应车型页面中仅显示有「查看现车」按钮。而 Model Y 和 Model 3 车型则继续显示「立即订购」选项。

特斯拉官网显示,北京地区一辆 Model S 全轮驱动版「即刻交付」的现车价格为 75.99 万元。

Model S 和 Model X 交付量在特斯拉总量中占比很小。今年一季度,特斯拉交付总量为 336681 辆。其中,包括 Cybertruck、Model S 和 Model X 在内的其他车型,合计交付量仅为 12881 辆,约为特斯拉总交付的 3.83%;Model 3/Y 交付量为 323800 辆,占比 96.17%。

据 IT 之家报道,今年早些时候,特斯拉汽车工程副总裁拉尔斯・莫拉维表示,目前公司并无计划将 Model S 和 Model X 从产品线中移除,今年晚些时候,会再次关注它们,确保它们也能获得一些公司为 Model 3 和 Model Y 所投入的技术升级。(来源: TechWeb)

 

小米汽车回应 SU7 湛江事故:相关火情是碰撞后电动二轮车锂电池严重挤压和变形起火,再引燃事故车辆

4 月 11 日消息,小米汽车发布《关于大家关心问题的回答》,解释了「湛江发生的事故是怎么回事?」以及「事故中汽车为什么会被引燃?」。

公告原文如下:

附警情通报:

2025 年 4 月 5 日 5 时许,陈某(男,25 岁)驾驶小汽车途经徐闻县曲界镇华海农场十四队路段时,与对向车道一辆两轮电动车发生碰撞,造成两轮电动车两名驾乘人员当场死亡,小汽车起火燃烧。事故发生后,陈某逃离现场,后迫于公安机关的追捕压力投案。

目前,犯罪嫌疑人陈某涉嫌交通肇事罪已被执行逮捕。案件侦办工作正在进一步进行中。(来源:IT 之家)

 

消息称 iPhone 若在美国组装 成本将上涨 90% 甚至更多

4 月 11 日消息,据外媒报道,近一段时间,有关苹果在美国市场销售的 iPhone 是否会因关税压力而涨价,后续是否会在美国生产备受关注。

在最新的报道中,有外媒提到,有银行的分析师在给客户的报告中表示,苹果将 iPhone 的组装转向美国在技术上是可行的,但成本会因此而大幅上涨。

分析师在报告中表示,即使苹果能在美国找到最终组装的工人,仅人力成本一项就将上涨 25%。而同进口组装好的产品相比,进口零部件在美国组装,还会带来更为复杂的物流问题。

此外,分析师在报告中也提到,如果是进口零部件并在美国完成 iPhone 的最终组装,零部件也面临高额的关税,最终的制造成本将上升 90% 或更多。(来源: TechWeb)

 

傅利叶发布首款开源人形机器人 Fourier N1:高 1.3m + 重 38kg + 续航 2 小时

4 月 11 日消息,通用机器人公司傅利叶正式发布首款开源人形机器人 Fourier N1,并同步开放涵盖物料清单、设计图纸、装配指南、基础操作软件在内的完整本体资源包。

官方表示,作为傅利叶「Nexus 开源生态矩阵」的首个落地项目(「N1」即「Nexus-01」),N1 将为全球机器人和具身智能开发者提供一个开放创新的技术基座,加速高泛用性运动控制器、多模态模型结合以及具身载体的未来形态推演等前沿研究开发工作的验证落地。

该机器人主要信息如下:

Fourier N1 采用紧凑型硬件架构设计,身高 1.3 米,体重 38 公斤,全身拥有 23 个自由度。整机结构采用铝合金与工程塑料复合构成,保证本体强度的同时兼顾关节灵活性。电池采用背部插拔式设计,单次连续运动续航可达 2 小时以上,满足高频测试与便捷部署需求。

其动力系统搭载傅利叶自研的 FSA 2.0 一体化执行器,结合自研控制系统,在提升运动稳定性与抗冲击能力的同时,实现更高精度的位姿控制。实测最高稳定奔跑速度可达 3.5 米 / 秒。(来源:IT 之家)

荣耀 Power 手机参数曝光:骁龙 7 Gen3 处理器,支持北斗卫星短信

4 月 11 日消息,荣耀 Power 手机将于 4 月 15 日发布,博主 @ 数码闲聊站 今日曝光了这款新机的主要参数。

  • 6.78"1.5K LTPS OLED 居中双孔曲屏,超高频 PWM 调光
  • 骁龙 7 Gen3 处理器
  • 8000mAh 电池,66W 快充 / 80W 快充头
  • C1 + 通信芯片,支持北斗卫星短信

荣耀旗下拥有 Magic 系列、数字系列、GT 系列、V 系列(V Purse 外折)、X 系列以及 Play 系列这六条产品线的手机产品。而此次曝光的这款 Power 新机是荣耀在战略转型后推出的首款新系列手机。(来源:IT 之家)

 

富士新机实拍图泄露:被曝采用光学取景器,顶部单曝光补偿拨盘设计

4 月 11 日消息,根据 FujiRumors 报道,一位匿名人士泄露了富士未发布新机的实拍图,该机顶部搭载单曝光补偿拨盘,疑似采用光学取景器。

▲ 泄露图

根据泄露图,该机外观类似徕卡 M 系列,造型复古;不同于富士以往相机通常顶部有两个或以上拨盘的设计,图中显示其顶部仅有一个拨盘,控制曝光补偿,但该拨盘旁的拨杆功能尚不明确。

同时该媒体据泄露图称,该机的取景器为光学取景器,与此前采用 EVF 取景器的说法有冲突;但尚不明确该机是采用光电混合取景器还是采用纯光学取景器。

同时泄露者声称,富士有望于 2025 年底或 2026 年推出该机,定价预计低于 1000 美元(现汇率约合 7322 元人民币),主打街拍、摄影师备用相机市场。(来源:IT 之家)

中国电子产品公司 Anker 开始在亚马逊上提高商品价格

中国 Anker 是亚马逊最大的卖家之一,其产品从移动电源到手机壳,应有尽有。自周四以来,该公司已在其美国平台上提高了五分之一的产品价格,这一迹象表明,对中国商品征收的关税正在转嫁给美国购物者。

电子商务服务提供商 SmartScout 的数据显示,自上周四以来,中国产品价格平均上涨了 18%,其中大部分涨幅发生在 4 月 7 日星期一美国总统唐纳德·特朗普对中国商品加征 50% 的进口关税之后。

美国对中国产品的进口关税目前已达 145%。随着世界两大经济体之间的贸易战愈演愈烈,北京周五同样宣布对美国商品的关税提高至 125%。

此前,中国最大的跨境电子商务协会发出警告称,由于关税,许多在亚马逊上销售产品的中国公司正准备提高美国产品价格或退出市场。

Anker 拥有 5000 名员工,年收入达 221.7 亿元人民币(30 亿美元),自 2011 年由前 Google 软件工程师创立以来,已成为亚马逊的主要卖家。(来源:cnBeta)

Gemini 大模型逆袭,给了 Google Cloud「AI 基建」的勇气

2025年4月11日 17:51

北京时间 4 月 10 日凌晨,Google Cloud Next 2025 正式揭开序幕。

 

如果用「AI 届的苹果发布会」来形容每年的英伟达硬件发布会,那「AI 届的 CES」或许更适合用来形容今年的 Google Cloud Next;虽然同样令人兴奋,但每一个来到现场的人都带着自己的问题,现场随处可见各种务实的交流。

络绎不绝的观众前往 Google Cloud Next 25 主题演讲 | 图片来源:极客公园

三个月前,同样是拉斯维加斯,这个场馆这个舞台上,黄仁勋同样以 AI 为主题的演讲,揭开了 CES2025 的序幕。

但即使是老黄的主题演讲,都不及今天的 Google Cloud Next 开幕主题演讲座无虚席;即使场内已经人满为患,仍然有大量的人在门口排队,等待有空缺位置时第一时间入场。

主题演讲现场,人数甚至比老黄演讲更多 | 图片来源:极客公园

之所以没有老黄的个人魅力,Google 的动作仍然能被如此多的业界人士关注,显然是因为 Google 如今在 AI 模型应用部署领域的统治地位。有了 Gemini 2.5 Pro 的打底,Google 今年在 AI 领域的影响力已经处于第一梯队,但对于 Google Cloud 来讲,如何将这部分能力,转化给全世界的用户的实际使用中,才是这届 Next25 最需要给全球用户解答的问题。

不仅有针对推理模型优化的第一代 Google Tensor TPU 芯片,还有 Gemini 能力在 Google Workspace 生态中的进一步「植入」,甚至祭出了「本地部署 Gemini」这样的大招。以及让不少业内人士感到兴奋的「Agent2Agent」沟通协议。

网友对 Google Cloud Next 发布产品的评价 | 来源:X

仅仅是首日的主题演讲,Google 就已经展现出几乎是在 AI 应用领域「全方位出击」的产品规划,并且在几乎每一个领域都拿出了业内最前沿的思考与解决方案。

难怪有不少网友,在看完 Google Cloud Next 25 的主题演讲全部内容后,直呼「Google 真的是目前大模型厂商中开启了「上帝模式」的选手」。

 

01

 

新模型

 

作为 Google CEO 皮查伊上台亲自发布的产品,Gemini 2.5 Flash 与它的前辈 Gemini 2.5 Pro 不同,这是一款「提供强大性能的同时注重效率」的推理模型。

Gemini 2.5 Flash 作为新模型发布 | 图片来源:极客公园

据皮查伊介绍,Gemini 2.5 Flash 主打卖点是提供「动态且可控的」计算能力,允许开发者根据查询的复杂性,手动调整处理时间。「你可以根据具体需求调整速度、准确性和成本之间的平衡。这种灵活性对于在高流量、成本敏感的应用中优化模型的性能至关重要」。

根据在现场与 Google 工程师的交谈,他指出 2.5 Pro 在处理一些简单的问题时,仍容易出现「过度思考」导致其响应速度大幅降低的问题。这也是 2.5 Flash 在体验中力求解决的难点。但最终他们的目标,还是进一步改善模型的动态思考能力,并将更多控制权开放给用户。

作为打响大模型性价比大战第一枪的选手,Google 还特别提到了与 DeepSeek R1 这样「价格较低但性能良好的模型」的对比,表示 2.5 Flash 非常适合在「高流量」和「实时」应用的商用场景——例如客户服务和文档解析。

除了新模型,Google 还放出了将最新模型「本地部署」这样的策略,来让已经有自己数据中心、或是有着更高数据管理要求的客户,能够使用现有的硬件设施,快速在自己的服务中部署 Gemini 2.5 Flash 的能力。

Google 计划从第三季度开始,将 2.5 Flash 这样的 Gemini 模型引入本地部署环境。该公司的 Gemini 模型将可在 Google Distributed Cloud (GDC) 上使用,同时表示 Google 也正在与英伟达合作,将 Gemini 模型引入符合 GDC 规范的 Nvidia Blackwell 系统。

这样的服务分量也吸引到老黄来站台| 图片来源:极客公园

 

02

 

新工具

 

作为 Google Cloud 托管的 AI 工具部署平台,Vertex AI 也在今天得到了几乎是「全模态」的更新,新的视频、图像、语音和音乐生成 AI 工具都将登陆 Vertex AI。

其中最值得关注的,就是视频生成模型 Veo 2 的更新,新增的编辑和相机控制功能,除了可以自动「从视频中移除不需要的背景图像、徽标或干扰物」。还能将原始视频的画面扩展,进一步填充原本的空白内容。这个工具会用 AI 生成的、能与原始片段融合的视频素材来填充新的空间。

Veo 2 的视频内容拓展效果 | 图片来源:Google

此次更新还允许 Veo 2 用户在生成素材时,除了文本描述外,还可以选择电影技巧预设,用于指导最终结果中的镜头构图、摄像机角度和节奏。包括延时摄影效果、无人机风格的第一人称视角(POV)以及模拟不同方向的摄像机平移。

此外,本次更新还增加了一个新的插值(Interpolation)功能,可以在两个静态图像之间创建视频过渡,用新的帧填充开头和结尾序列。

只需给出一个起始帧和最终帧,Veo 2 就会生成连接两者的视频。

只需两张照片,Veo 2 就能自动生成一段中间视频 | 图片来源:Google

文本转图像模型 Imagen 3 的编辑功能也得到了更新,Google 表示本次更新「显著」改进了自动对象移除时的自然效果。

Imagen 3 能获得更自然的内容移除效果 | 图片来源:Google

据现场相关业务负责人介绍,Veo 2 和 Imagen 3 已经被欧莱雅等公司用于设计营销内容。负责人 Justin Thomas 表示,过去「需要八周才能完成的图像处理任务,现在只需八小时」。

这些更新发布之后,使 Vertex AI 成为目前市面上唯一一个覆盖了视频、图像、语音和音乐的内容生成模型的平台。

除了面向当下需求的新工具,Google 还公布了一项新的开放协议——Agent2Agent (A2A),旨在连接不同生态系统中的 AI Agents。

这个概念听起来似乎与时下非常流行的 MCP 协议有些相似之处,但不同之处在于,MCP 是为了解决 LLM 与工具之间的沟通,而 A2A 则是 Agent 与 Agent 之间的对话,就像是属于 AI 的全新语言。

A2A 协议应用场景演示 | 图片来源:Google

Google 表示,A2A 协议将使企业能够更便捷地部署 AI Agent 产品,因为它解决了构建在不同供应商生态系统上的代理无法相互通信的挑战。

在现场,还演示了一个具体的案例:例如在同一个 UI 界面下,系统可以使用一个 Agent 来根据位置与技能,在面试中筛选候选人,在筛选完成、并且完成初步的面试后,系统可以自动将生成的信息快速传输给另一个设计用于候选人背景审查的 AI Agent 工具,在这个过程中,大幅降低 AI 与 AI 之间的信息损耗。

这套系统显然在未来越来越多 AI Agent 投入应用的时代,有着很强的需求。根据代理式数字工作平台 DoozerAI 的联合创始人 Paul Chada 的说法,A2A 协议提供的互操作性将使企业能够自动化跨越多个系统的复杂工作流程,从而可能在降低集成成本的同时提高生产力。

Google 同时还介绍,A2A 协议建立在现有流行的标准之上,包括 HTTP、SSE 和 JSON-RPC;其中 HTTP 是网络通信的基础,而 SEE 和 JSON-RPC 分别是向客户端服务器发送更新的基础协议,以及应用程序使用 JSON 消息进行远程相互通信的基础协议。

尽可能多的利用现有的协议,目标是能够尽可能降低这个全新的协议,在现有服务中部署的难度,使其更容易与企业已在使用的现有 IT 堆栈集成。即使这仍然是一个短期内充满挑战的事,但仍然让现场的不少开发者感到兴奋,随处可以听到关于这个「Agent 之间的新语言」的讨论。

 

03

 

新硬件

 

对于 Google 来讲,在 AI 领域的统治级地位,除了提供完善的软件能力,在硬件领域多年的投入带来的成果如同左右手一般必不可少,因此今天除了一系列软件服务更新,Google 今天还发布了最新的第七代 Tensor 处理单元(TPU)Ironwood。

Ironwood TPU | 图片来源:Google

据 Google 介绍,Ironwood TPU 是 Google「迄今为止性能最强、可扩展性最高且能效最高的定制 AI 加速器」,并且是「首款专为推理设计」的 TPU。

Ironwood 每个独立芯片提供 4614 TFLOPs 的峰值计算能力。而包括 9216 颗 TPU 的集群总共拥有 42.5 Exaflops 的计算能力,是世界上目前最大的超级计算机 El Capitan(每个集群提供 1.7 Exaflops)计算能力的 24 倍以上。

如果这还不足以直观的体现 Ironwood 性能的蒙正,作为云计算 TPU 硬件领域的大厂,Google 还回顾了从 2018 年到 2025 年的研发历程 ——TPU 的性能增长了 3600 倍。

第七代 TPU Ironwood 有着巨大的性能提升 | 图片来源:Google

据 Google 介绍,性能巨幅提升的 Ironwood,旨在针对性满足思维模型所要求的不同计算需求,这些模型「包括大型语言模型(LLM)、混合专家模型(MoE)和需要「大规模」并行处理和高效的内存访问的高级推理任务」。

在前沿领域,思维模型的计算需求远远超出了任何单个芯片的能力。因此我们设计的 Ironwood TPU 具有低延迟、高带宽的 ICI 网络,以支持在整个 TPU 单元级规模上进行协调、同步的通信。

 

04

 

结语

 

当你看到这篇文章时,Google Cloud Next 25 的主题演讲已经结束,但正式的会议日程才刚刚开始。

就像本次 Next 25 的口号一样,来这里的每个人都想知道「AI for what's next?」的答案,主题演讲中发布的一系列工具,只是 Google Cloud 对此的回答。

每个来到这里的人,都在试图找到「AI for what's next」这个问题的答案 | 图片来源:极客公园

作为当下最大的「AI 基础设施」供应商,Google Cloud 不仅需要提供更多现有的工具:更好的模型能力,更丰富的平台、更适合的算力硬件。

在市面上,你几乎再也难以找到像 Google Cloud 这样,给用户提供了「一站式解决方案」的厂商,因此在现场的沟通中,「One and only」是现场很多开发者的声音。

「一站式解决方案」|图片来源:极客公园

Google 在 AI 领域的地位,也让 Google Cloud Next 作为沟通平台的价值急剧提升,在前沿技术的土壤中,作为「AI 时代的基础设施」,帮助更多用户,建立起更多满足新时代需求的 AI 生态,或许才是 Google Cloud 未来的「核心价值」。

❌
❌