阅读视图

发现新文章,点击刷新页面。

对话猿辅导集团副总裁王向东:DeepSeek 之后,AI 学习机应该怎么做?

作者|张鹏 

编辑|Li Yuan 郑玄

2024 年,是学习平板这个品类集中爆发的一年。

这个曾被视作「平板替代品」的品类,终于在逐渐脱离「和 iPad 有什么区别」的质疑,随着 AI 技术的持续进展,一步步朝着「1v1 数字老师」演进。

而在这一轮热潮中,小猿学练机的成长格外抢眼:小猿学练机在 2024 年 12 月销量突破百万台,登顶单品销量行业第一,成为中国学习平板中增长最快的产品。

2025 年年初 DeepSeek 的火爆,重塑了教育行业。 2025 年 4 月,猿辅导集团也发布了他们的新一代产品,深度融合了猿辅导集团自研「猿力大模型」和 DeepSeek 的小猿 AI 学习机。

猿辅导集团表示,这一代的 AI 学习机基于更强的推理能力,能够基于孩子在学校的试卷内、学习机的练习题上、和 AI 的对话等多触点,综合判断孩子的学习情况,给出更好的学习建议,不再是传统依赖知识图谱的刷题机器。

AI,会是教育最先闪光的地方吗?

「因材施教」是从孔子时代就被提出的理想,但直到今天,我们才真正拥有了让每个孩子匹配「一对一老师」的技术可能。这不仅是一次产品革新,更是教育模式的重构。

在这一轮变革中,先行者们要如何定义 AI 教育产品的形态?猿辅导集团又如何看待 AI 技术为教育带来的底层重构?DeepSeek 推理模型的引入,又会如何改变 AI 教育的进化路径?

我们找到了猿辅导集团副总裁王向东,与他聊了聊这一切。

 

01

教育的本质没有变化,

我们只是离一对一越来越近了

 

张鹏:2023 年 5 月,猿辅导第一次推出了小猿学练机这款学习硬件,主打墨水屏和学练一体化,当时怎么想到要做这样一款产品?

王向东: 我们业务线最初主要做软件。旗下有小猿口算,小猿搜题,猿题库等一系列软件,之前并没有太多硬件的涉猎。软件当时其实已经做到很大用户量了,也已经可以在手机上给用户提供很便捷的学习方式。但其实用户原有的学习的模式和交互的方式并未改变,还是学校所有的课本、教辅、练习册、试卷的基础上,依赖于识别、语音理解,最终给用户内容,内容是各大公司用自己的资源、人力加进去堆出来的。

我们看到市面上也有各种各样的学习产品诞生,但是这些东西都是很辅助性的。比如词典笔,它更多是扫一个词,查一个词的意思,这些产品只是解决了学习过程中一些非常局部的小问题。

我们觉得,学习产品仍然有成体系化思考的空间,有不只是简单地在原有体系中打补丁的空间。

当时学练机诞生的初心,就是在探索未来会不会存在一种更数字化的学习方式,这种数字化学习方式它其实跳脱了纸和笔,能够有数字化的学习内容、数字化的学习行为和数字化的学习数据,不再依赖于要用一个手机去拍什么东西,直接通过数字化的方式去学习,就能完成整个学习闭环。

它的大出发点是基于这个逻辑,我们当时就考虑到,可能一年不行,两年不行,甚至三年不行。但 5 到 10 年,我们认为这是一个有可能成型的,基于教育学习上对现有的学习方式有变革、有革新的一个东西。

一方面基于趋势性去考虑,另一方面,我们原有的内容资源的构建和累积上,其实是有基础能够转向数字化的。当时我们的软件背后,都是数字化的、模块化的和基于知识有能力突破的数据。只在手机上,其实呈现的并不多。

走向未来,我们认为它应该能有一个设备,作为更好的载体,把我们的综合能力系统性地呈现给用户,能够包括各种各样数字版权的内容,各种各样的工具软件,综合地提供给用户一个解决的方案。我们的学练机是我们最早的产品,刚开始把这些综合的部分整合一部分进去。

张鹏:上一代产品的产品名是学练机,为什么是学练机而不是学习机?当时是怎么思考的?

王向东: 我们拆分了孩子日常学习的三大环节,学练测。

在上课的环节全部都是学,老师不断输入。课后会布置作业,或者在课上会给很多作业,完成练习。测是在学校里有一次考试,总结整体学习的过程是否达到了我想要的结果。

在这三个步骤中,我们发现,在学校的学习过程中,每个孩子面对老师的时间是相同的,学习内容也是相同的,为什么后面大家水平有高有低?除了超前学习的情况,其实最大的差异在于「练」。

「练」的环节,也是原有的教育环节中,做的并不高效的一个环节:第一,所有人的练习内容是统一的,因为在学校的练习,几乎不存在个性化。第二,家长在「练」这个事情上,其实是没有什么太多的可介入空间,因为他也不知道给孩子练习什么才符合孩子的学习。即使是在线下报个小班课,小班课的作业,可能也是针对这个班型的进度布置的作业。

「练」这个解决方案其实一直解决的不好,而且家长会把市场上所有的教辅都买一遍,但是一个学期下来,真正写的就是这两本,剩下的都在那儿堆着,并不是一个对孩子真正高效的练习逻辑。

同时练习本身又是一个非常高频并且刚需,具备非常强的可复制化的场景。它应该是一个完全千人千面,让大家在不同的时间点解决自己需求的一个产品。

所以,一个是未来的趋势,一个是高频的场景,这两者结合,我们选硬件、选产品和软件的形态,诞生了学练机这样一个产品。

张鹏:这一代我们推出的是 AI 学习机,不再是学练机。这一代产品的出发点是不是有些不同?

王向东: 我们一直想提供一个综合的一体化的学习产品。 我们一直觉得教育是有一个终极形态的。这个终极形态大概率会是类真人的一对一。 一对一是因材施教,我随时对你的学情有关注有了解,我给你接下来的学习进行规划,这是最高效的。

我们最早是 2022 年思考这个问题,在当时那个基础条件下——ChatGPT 2022 年年底才有一些水花,如果想做成我们想要的一体化学习方案,当时 AIGC 的内容不够强。想做一个真正的学习机,需要的内容太海量了。你的科目、学段、学习知识点能力同步这些东西,每一个都是非常细小的,加在一起却是一个非常庞大的数据集。这个庞大数据集完全靠自己去构建,用那种传统的 AI 标注的方式是实现不了的。所以在那个时间点,我们就先以一种比较简单的,就基于你的知识模块的方式先定义到学练机上。

而过去一年,大模型有了巨大的变化,2023 年大模型和现在的大模型相比,成本大概是降了八九百倍,性能每一年大概会相对前一年提升 40%、50%。从去年的下半年到年底,DeepSeek 出来以后,大模型的技术的确进入到了一个可实用,并且成本可接受的一个价值创新点的阶段。

我们意识到,成套的一体化学习方案在成本和内容质量上都已具备可行性,我们才开始选择做一个 AI 学习机。在我们的学习机里面,我们强调一体化的诊学练,我们不会说一开始就让你做题或者看视频,我们会先分析你的学习状况。

就好像你看到了没有一个英语老师上来说,「孩子我们明天上什么课?」,你的英语老师一定是说「你把你学校的试卷给我看一下,把你们的进度告诉我一下,把你们的练习题告诉我一下」,他会根据这些内容,判断你当前的能力水平和学习阶段,再去给你确定应该做什么题,学习什么内容,我要让你跟着我的每一个课程节奏一起去往下走。所以我们期望我们的学习机,这套诊学练的闭环,完全参照一个一对一的老师能够实现的逻辑去提供给孩子这样的服务。

张鹏:这一代的产品形态也发生了变化,是一个平板加上打印机的形态。这样的产品形态是怎么设计出来的?

王向东: 其实它不仅是打印机,更是一个智能基座。 硬件的形态定义要更早于 DeepSeek 大模型出来这一波。2023 年我们就确定了要做这个形态的虚拟老师。

我们会思考一对一的老师,到底应该具有哪些能力。一个真正的一对一老师,要通过他的眼睛、耳朵和嘴巴,来观察这个孩子的学习状况。

眼睛,能够看出来孩子是否分心了,他在这个时间点有否犹豫,对这个知识的掌握程度是真的懂了,还是假装懂,这些东西通过观察是可以观察出来的。耳朵,可以在听孩子给他反馈的时候,感受到孩子是不是自信,这个东西是不是表达得清楚。一对一老师可能还通过他的手势,给孩子鼓励,通过言语,把成体系的知识展现给孩子。

这些就要通过传统的平板形态来做出来。

一个好的一对一老师,最终一定会问,我们讲解了这么多,我要来确认一下你到底有没有学会。那怎么实现呢?一般就是找几道题,看你会不会做。

其实对于线下的一对一老师来说,找几道题是很复杂的事情。而对于数字化的一对一老师来说,个性化的一对一找题反而是特别方便的。

所以我们做了目前的智能基座的 1.0 形态。一对一的老师定位好了孩子的学情之后,不需要靠家长或者孩子再去搜题,再去编辑,再去打印,直接可以将题打印出来,直接可以通过摄像头,来判断孩子做的准不准确。这个过程,既护眼,又高效。

 

02

教育 AI 技术底座,

让一对一的大规模供给成为可能

 

张鹏:AI 学习机这个概念,在 2020 年开始就有了。从那时候到现在,AI 学习机有过什么变化?

王向东: 学习机最早出现的时候,其实就是内容的堆砌。用一个平板的形态,去加入一些教育内容。

到 2020 年左右,行业开始强调差异化,出现了早期的「AI 学习机」。这类产品基于知识图谱,将题目分层,学生答题后可自动进入下一级练习,通过识别知识漏洞推送视频和习题,实现单点能力的查漏补缺。

之后,学习机开始引入一些基础的 AI 功能,比如拍照搜题。虽然厂商在 2020、2021 年就纷纷打出「AI 学习机」的口号,但在用户端并未真正建立起认知。

我们线下调研发现,家长关注的核心还是课程本身:内容是否齐全、质量是否高、是否覆盖所在地区的教学版本。其次才是工具层面的功能,比如是否能批改作业、帮助解决孩子不会的题目。

这个阶段的「AI 学习机」,更多是课程系统叠加工具软件,难以实现真正的一体化智能服务。只有当 AI 拥有推理能力,能真正理解学习过程、做出个性化引导时,才算真正迈入「名副其实」的 AI 学习机时代。

张鹏:推理模型核心解决了什么问题?

王向东:在推理模型出现之前,我们对 AI 的理解更多停留在「解题工具」的层面,例如通过大模型在后端异步处理题库中无法覆盖的题目。

但随着像 DeepSeek 这样的推理模型诞生,我们发现 AI 真正具备了接近一对一教师的能力。

推理模型可以结合你的学情数据,给出一个非常专业的学情分析:虽然我也不知道我为什么解不出这个问题,我把我的数据给你,AI 可以分析出我的问题。

原来要找到学生不会哪个知识点,需要靠学生做题,人为为题目打上标签,不会这道题,那就是这几个知识点不会,这样的对孩子的情况分析是很生硬的。而现在大模型甚至可以去更高的维度,分析孩子是可能是不擅长某种思维还是读题有问题,很多时候真的已经可以达到我们预期的教研老师能够提供的方案。

整个学习的核心模式发生了变化。 原有的学习机的核心学习模式是说我的路径和我的目标规划好了,人配合它往前走。而现在转变为「在持续交互中,根据不断输入的数据,动态调整学习路径和目标」。

张鹏:哪些产品细节在体现了这样的变化呢?

王向东: 在现在的 AI 学习机里,我们对孩子的学情诊断,这个「诊」不是只出现一次,一直在对孩子做最新的诊断。孩子学习的环境是发生各种各样变化的,你可能在学校里每天有考试卷子,可能在线下还报了辅导班,甚至参加了什么竞赛,在孩子与学习机的每次交互中,系统都能对其能力进行重新判断,然后再去重新调整学习的方向。

我们底层的数据是完全打通的,学习机本来它也有课程,也有诊断,也有一些练习。比如上课的时候有一个互动题,你在互动的时候你选错了,这个错题它也会成为一个底层的输入。现在我们输入的触点非常多。包括跟 AI 交流对话的时候,你可能提到了什么样的讯息,这个讯息很重要,它也会成为一个输入,成为下一步给你做推荐的出发点。它不仅仅是来自于一次性考试的诊断,而是来自于你在日常跟机器交互的过程中,所有的数据都会成为你学情诊断的来源。它不再是一个单一的今天你做这一套卷子,我只是基于这一套卷子给你推理,系统会综合分析你从其他触点产生的所有数据。

张鹏:这中间的一个拐点,是不是 DeepSeek 出现了?

王向东: 是的。

我们一直在不断评测国内外的不同基础大模型。在很长一段时间,我们发现基础大模型通用大模型的能力的变化提升是很微弱的。当然你说 GPT-4o 到 o1,是不是也有很大的提升?是,但是基于 GPT 的成本,这个提升几乎对我们来说完全是不可用的状态。

DeepSeek 的报价,还有实质性的产品体验结果出来后,我们当时发现它在我们现有评测的所有模型中已经完全领先了,是当时在用的基础大模型的 1/4 甚至 1/5 的价格了,同时性能更好,可以更快应用。

春节回来我们立刻把这个服务补上。测试结果上,我们发现很多的功能点,尤其基于多学科交叉,并且还有错因分析,基于更多的输入数据,能够输出什么样的结果,都有了更好的表现。

我们马上对模型进行了切换。因为实际上教育的场景和方式和数据,我们都已经具备,关键在于这些内容该分配给谁、以何种方式呈现、在何时生成。切换新模型是要经历磨合和最开始的提示词的调整过程,不过最终切换起来还是很快的。

张鹏:猿辅导其实也有自己的模型,现在猿辅导自己的模型跟 DeepSeek 之间是怎么配合的?在目前的技术管线中,你们自己的模型还会在里面发挥作用吗?

王向东: 是的,我们也有自己的大模型,而且它也仍然是我们的技术核心。

自有模型和 DeepSeek 各自负责自己更擅长的事情。比如错因分析,DeepSeek 更擅长,但是以适合孩子的方式讲解给孩子,则是我们的模型比较擅长。

在针对我们特殊的需求场景下,我们会对通用模型或者针对一些开源的模型去做微调,看看在这个场景下是否我们可以比那个模型表现得更好,如果表现得更好,我们大概率会用我们自己的模型来解决我们的问题。比如在一些图像题上,所有模型的都很难解好一个完全新的图形题,其实我们的模型经过了一些自有数据训练,表现比市面上的大模型会好一点。

猿辅导集团自研「猿力大模型」和 DeepSeek 进行深度融合,共同构建了我们这一代产品中的技术基座:小猿 AI。

DeepSeek 推动大模型自我进化,实现深度思考讲解,推动 AI 能力全面进化;猿力大模型保障技术回归教育本质,进行信息安全过滤,保障实时认知对齐。

DeepSeek 让 AI 更聪明,能讲得更清楚、想得更深;猿力大模型则保证 AI 讲得靠谱、对孩子安全,让它真正服务教育,而不是跑偏。

两个模型间还会相互进行训练和优化,提升各自的能力。我们让两个模型相互切磋、共同成长。DeepSeek 提供先进的推理能力,猿力大模型专注教育适配与安全守护。它们在实战中交互训练,相互优化,在各自擅长的领域持续进化,打造更强、更稳、更懂教育的 AI 教学系统。

 

03

这一代孩子,将是被 AI 陪伴成长的一代人

 

张鹏:目前这代学习机,主要覆盖哪些人群?从幼儿园一直陪到高中毕业,在目前的产品设计上,真的可能吗?

王向东: 学练机和学习机,我们最初的期望都覆盖整个 K12 阶段的孩子。

我们也会加入一些针对学龄前儿童的功能,但他们不会是我们的主流的用户人群。这本质上,也是关于家长是不是认为孩子在这个时段就要接受教育有关。比如说他如果觉得在幼儿阶段就需要接受更多的绘本,接受更多的拼音教育,那他一定程度上也会是我们的目标人群。

至于产品设计,我们已经现在投入使用的软件和硬件,都已经做好了服务用户长期使用的数据与记忆架构。 从设计之初我们就在想,作为一个工具软件,我们不希望用户只用一个月。我们都是希望他们从 1 年级用到 12 年级。

唯一不太可确定是,硬件的形态到底在未来的几年内会不会发生大的变化。如果能出现一个更具备可交互能力和被用户接受的硬件形态,你非要说你的硬件具备更长的陪伴价值,我觉得本身是不合理的。

张鹏:平板加上打印机,是你理想中一个比较收敛的学习机的硬件形态吗?

王向东: 这是我们现阶段认为比较合适的形态。

硬件形态上,我想要做一个有用的学习设备,首先得具有几个特性:

一、它应该是一个孩子专属的设备,不应该是家长和孩子共用的设备,才能完成 24 小时一对一的任务。

二、它需要眼睛、耳朵和嘴巴,也就是得有摄像头,得有麦克风,能有输入,有输出。

三、它要在一定程度上真实的,可互动,不能是一个冷冰冰的平板电脑往那一放。

我觉得技术发展的在若干年内,可能一个简单的大屏还会是主流。

我们加入了一个打印机,这个打印机我们更倾向于把它定义成一个智能基座。它增加了输入输出的形态,同时可动。未来我希望它能随便扭头,或者甚至能跑来跑去,不过在现阶段我们能够匹配到的可实现的硬件形态只能做到这一步。

我们也设想过,未来如果人形机器人成熟,是否能直接化身为陪伴式的学习终端:有一个满屋跑的人形机器人,在孩子要学习的时候变形一下,露出一个屏幕,坐在孩子桌子上,学习完了跳下去干别的活了,如果到了那个时候,那学习机可能就不是最好的形态,不过这离我们现在能实现的技术还是稍微有点遥远。

张鹏:我们希望学习机能够在成长中一直陪伴孩子,而另一个问题是,目前我们观察到学习机每天能够陪伴孩子多久?

王向东: 在 2022 年以前,我们大概做过一些调研,当时得到的结果是,学习平板这一设备,在当时仍然有很大的提升空间。

因为当时我们发现,当时的学习设备,在半年后,平均留存时长就只剩下 50% 了,也就是说半年以后 50% 的用户就闲置了。而且进一步分析后发现,很多真正的留存实际上也不是基于学习功能,而是孩子在学习机上使用微信、抖音这样的半娱乐化应用。我们觉得这个事情其实非常不健康,它不足以形成口碑和复购。

在做我们的学习机时,我们重点关注两类数据:一是 用户留存率 ,代表孩子是否每天使用设备进行学习。我们是封闭系统,无法安装娱乐应用,留存下来的用户是真正用于学习的,数据显示我们的留存率行业领先。二是 功能满意度 ,我们通过用户反馈和客服数据持续优化体验。相比用户时长,我们更关注是否 高效学习

早期做工具软件的经验让我们明白,靠堆社区、堆视频化的内容,堆再多的时长对孩子的学习也没有意义。对我们来说,一个好产品的价值,在于它是否真正帮助孩子持续、高效地学习。

张鹏:我们说 AI 学习机是一对一的老师,也有人觉得是一种陪伴的朋友关系,你怎么看?

王向东: 从过往经验看,真正优秀的一对一老师往往是「亦师亦友」的角色。线下辅导中,老师若想获得良好的互动效果,首先需要与孩子建立朋友般的关系。因此,「老师」和「陪伴者」的角色并不冲突。

在产品设计上,我们也努力打造这种「陪伴式」的学习体验。首先,交互必须对孩子友好。例如语音识别,不能家长说得准,孩子说得不准;界面也必须符合孩子的审美和认知特点。其次,我们加入了大量游戏化设计,比如在答题中融入保龄球、愤怒的小鸟等元素,让孩子在游戏中获得正反馈,哪怕答错题也能感受到鼓励,从而持续激发学习动力。

我们认为,未来学习设备将不仅是工具,更是孩子成长过程中的陪伴者。从学习到心理健康,这类设备将像真人老师一样,在孩子情绪低落时给予支持和引导,帮助他们以更好的状态投入学习,AI 正是在这一点上具备巨大潜力。

张鹏:Agent 技术今年很火。你怎么看 Agent 技术在教育领域,包括在学习机领域里面的应用?

王向东: Agent 在教师工作中确实有很大潜力,但在学生端的应用目前还难以普及。原因在于,Agent 擅长处理有明确结果的任务,比如直接给出结论或方案;而学生的学习过程需要的是持续的交互、反馈和闭环。

学习不是单一任务,而是不断迭代的过程。例如我们根据学生数据进行学情分析,再生成学习方案,但这套方案必须在使用后持续调整,才能真正有效,不是一次性完成一个任务就结束了。所以我觉得这个概念虽然很有想象力,但是不一定在教育这个领域里适用。

张鹏:这一波的 AI,是否有机会对中国的教育带来一些更有意义的改变?

王向东: 我们非常认同一句话:「教育不是注满一桶水,而是点燃一把火。」教育的本质是启发与唤醒。最终我们希望培养出具备批判性与创造性思维的孩子。

但传统教育体系和资源难以实现这一目标。中国当然不缺有创造力的孩子,但他们往往集中在少数拥有优质教育资源和家庭环境的群体中,绝大多数孩子难以获得这样的支持。

AI 的出现带来了普惠的可能性。它可以以低成本提供高质量的一对一教育体验,帮助孩子发展更深层次的思维能力,而不是仅仅机械复述知识。我们希望孩子能提出问题、质疑答案,甚至基于已有知识得出全新的结论。

这正是 AI 在教育中的最大价值:提供无限供给的高质量教育资源,打破原有壁垒。对我们来说,这种变革的可能性,正是投身教育的初心与使命。

*头图来源:猿辅导

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

可灵 AI 开启视频生成 2.0 时代!全球用户数已突破 2200 万

4 月 15 日,可灵 AI 在北京中关村国际创新中心举行「灵感成真」2.0 模型发布会,宣布基座模型再次升级,面向全球正式发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型。

数据显示,自去年 6 月发布以来,可灵 AI 已累计完成超 20 次迭代,截至目前,全球用户规模突破 2200 万。来自世界各地的超 1.5 万开发者和企业客户,将可灵的 API 应用于不同的行业场景中。

一直以来,可灵 AI 致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。快手高级副总裁、社区科学线负责人盖坤表示,可灵希望让每个人都能用 AI 讲出好故事,实现更加精准的复杂创意表达。

 

01

 

可灵 AI 全系模型进入 2.0 时代,

定义人和 AI 交互的全新方式

 

4 月 15 日,可灵大模型 2.0 版本及可图大模型 2.0 版本正式面向全球发布。据悉,可灵 2.0 模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图 2.0 模型在指令遵循、电影质感及艺术风格表现等方面显著提升。

盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵 2.0 对比谷歌 Veo2 的胜负比为 205%,对比 Sora 的胜负比达 367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。

自去年 6 月发布以来,可灵 AI 已累计完成超 20 次迭代。3 月 27 日,全球知名 AI 基准测试机构 Artificial Analysis 发布了最新的全球视频生成大模型榜单,快手可灵 1.6pro(高品质模式)以 1000 分的 Arena ELO 基准测试评分登陆图生视频(Image to Video)赛道榜首。

作为全球首个用户可用的 DiT 视频生成模型,截至目前,可灵 AI 全球用户规模已突破 2200 万,累计生成 1.68 亿个视频及 3.44 亿张图片素材。自去年 6 月上线至今的 10 个月时间里,可灵 AI 的月活用户数量增长 25 倍。

 

快手高级副总裁、社区科学线负责人盖坤|图片来源:快手

盖坤认为,AI 在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在 AI 生成内容的稳定性、以及用户复杂创意的精确传达上仍有「很多挑战」。也因此,要真正实现「用 AI 讲好每一个故事」的愿景,必须对基模型能力进行全方位提升,定义人和 AI 交互的「全新语言」。

一直以来,可灵 AI 致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次 2.0 模型的迭代中,可灵 AI 正式发布 AI 视频生成的全新交互理念 Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给 AI。

「大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。」盖坤指出,MVL 由 TXT(Pure Text,语义骨架)和 MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现 AI 创作者们的创意表达。

基于 MVL 理念,可灵 AI 正式推出多模态编辑功能。「从今天起,大家可以在可灵 AI 的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。」盖坤介绍,MMW(多模态描述子)将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

 

「灵感成真」可灵 AI2.0 发布会现场|图片来源:快手

 

02

 

可灵 2.0 大师版正式发布,

全新上线多模态视频编辑功能

 

基于 MVL 这一全新交互方式,发布会现场,快手副总裁、可灵 AI 负责人张迪发布了全新的可灵 2.0 大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。

「可灵 2.0 大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。」张迪介绍,可灵 2.0 大师版实现了技术、体验、美学的三重突破。

 

快手副总裁、可灵 AI 负责人张迪|图片来源:快手

值得一提的是,可灵 2.0 大师版全面升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。

 

可灵 2.0 大师版操作界面|图片来源:快手

张迪披露,当前,图生视频约占到可灵 AI 视频创作量的 85%,图片质量也对视频的生成效果产生重要作用。

在图像生成大模型领域,快手的可图 2.0 处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于 Midjourney V7、FLUX1.1 [pro] 以及 Reve 等行业领先的图像模型,均保持明显优势。

张迪介绍,可图 2.0 文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图 2.0 可支持 60 多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。

同时,可图 2.0 也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图 2.0 还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。

 

03

 

AIGC 技术迅猛发展,

为全行业发展注入全新活力

 

除了 C 端订阅用户,可灵 AI 也面向 B 端商家提供 API 接入等服务。目前,可灵 AI 已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。

盖坤披露,来自世界各地的超 1.5 万开发者,已将可灵的 API 应用于不同的行业场景中,累计生成的图像数量约 1200 万个,生成的视频素材超过 4000 万个。

如今,可灵正在成为 AI 时代视频创作的新基础设施。AIGC 技术的迅猛发展,也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。

以二次元 AI 创作社区产品狸谱为例,其产品负责人一休介绍,可灵 AI 为狸谱带来了创新突破。其 1.6 版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入「动态 LIVE」和「新春萌偶摇」两大功能。前者实现「图 - 影 - 音」快速创作,后者在春节期间引发 60 万用户转播。未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动 AI 成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态,携手开启二次元内容产业的新篇章。

「可灵 AI 可全面融入剧集级创作流程」。可灵 AI 超级创作者、《新世界加载中》总导演、异类 Outliers 创始人陈翔宇在分享中介绍,AIGC 相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。

从剧本创作到内容发行,异类 Outliers 团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。「我们实践之后发现,可灵 AI 是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。」陈翔宇认为,在 AI 的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,「AIGC 也许是下一代内容结构的雏形」。

 

可灵 AI 超级创作者、《新世界加载中》总导演、异类 Outliers 创始人陈翔宇|图片来源:快手

为了进一步激发 AI 爱好者们的创作热情,快手副总裁、可灵 AI 负责人张迪还在发布会现场正式发起「可灵 AI NextGen 新影像创投计划」。该计划将加大对于 AIGC 创作者的扶持力度,通过千万资金投入、全球宣发、IP 打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让 AI 好故事走向世界。同时,可灵 AI 面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创 AI 创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。

面向未来,盖坤表示,可灵 AI 将持续大力推动技术创新,用人与 AI 交互的全新语言,帮助用户实现复杂创意的精确表达,「我们的初心,是让每个人都能用 AI 讲出好的故事,我们也真切地希望这一天更快到来」。

CTO 详解理想「系统开源」:希望成为汽车圈的「DeepSeek」

理想为什么敢做「第一个吃螃蟹的人」?

2025年3月27日,理想汽车董事长兼首席执行官李想宣布,从今年4月底起,将把汽车操作系统「理想星环OS」逐步开源,邀请全球开发者优化与共建生态,这也是全球首家开源汽车操作系统的车企。

李想也解释了这个决策背后的考量。他认为,智能汽车需要专用的操作系统,但每个企业都进行闭源开发会导致资源浪费,延缓行业发展。同时,他表示,开源生态有助于车企节约研发成本,最终普惠终端消费者。

其实,提到操作系统,人们常想到的是,PC互联网时代的Windows,移动互联网时代的iOS、安卓、鸿蒙等。在汽车领域,人们讨论更多的是车机系统,但与李想提到的「汽车操作系统」,似乎又有不同。

李想宣布开源操作系统的决定,引发了业内广泛的关注和讨论。但由于缺乏足够的细节,许多疑问和猜测也随之而来:这个汽车操作系统是不是安卓套壳?开源是否等于免费?用什么开源协议?其他车企采用开源后,会不会被理想「卡脖子」

操作系统扮演着「中央指挥官」和「资源总调度」的角色|图片来源:理想汽车

最近,理想CTO谢炎在位于顺义的理想汽车研发总部,接受包括极客公园在内多家媒体的采访,对业内对其开源操作系统的疑问做出了回应。

在讲解刚开始,谢炎首先用「不是什么,而是什么」来概括了这次开源的星环OS。他表示,星环OS既不是车机系统,也不是安卓「套壳」;它是面向驾驶更底层的OS系统,并不直接服务于用户。星环OS由四个部分组成,覆盖智能驾驶基础平台、车控、通信中间件和信息安全的整车操作系统,就类似于人的大脑、小脑、神经系统和免疫系统。

看到这里可能很多人好奇,操作系统里面也包含了智驾平台,那和车企都在宣传的智驾有什么差别呢?谢炎解释说,智驾和汽车操作系统是两个不同的概念,智驾本身相当于汽车操作系统上的应用,类似于App,是一种具体的应用。所以他们跟智驾方案供应商,并不是竞争关系。

 

4月15日,李想在微博发布了《理想星环OS技术白皮书》|来源:李想微博截图

据谢炎介绍,理想的开源计划将于4月23日启动,整个过程将分为三个阶段进行。最近,李想在微博表示,他们已经发布了《理想星环OS技术白皮书》,这是星环OS开源过程的第一步。理想的最终目标是构建一个活跃的星环OS开源社区,推动技术共享与合作。

不得不说,理想汽车开源星环OS是非常突破性的一次尝试。在理想宣布开源之前,汽车行业的操作系统要么使用供应商方案,要么自研。理想希望通过星环OS的开源,推动全球汽车产业的智能化,就像特斯拉推动了全球汽车产业的电动化,DeepSeek推动中国「ChatGPT」时刻的到来

不过,作为一家车企,理想的开源的操作系统能否被友商信任并大规模采用,存在很大的挑战。这背后可能不仅仅是技术问题,也涉及商业策略和竞合关系。比如用户使用时有没有自主权?在商业上会不会有一些掣肘?

据谢炎介绍,理想这次会采用宽松型的Apache License。这是一种商业友好的宽松许可证,允许使用者自由修改、分发和商业化使用,且不强制要求回馈代码,尽可能避免「控制」或知识产权纠纷的问题。

对于理想星环OS的商业模式,很多人可能会联想到安卓,是否会收费。对此,谢炎表示,他们和谷歌安卓不一样,因为谷歌是一个服务商,它开源后要求安卓商搭载他的服务,并从中获得商业回报。但理想并不通过开源直接获得回报,他们既不卖汽车操作系统,也不干涉使用者如何使用。理想只是希望更快、更好地和供应商、友商一起实现自己的愿景。

在AI正在重塑整个汽车生态的关键时刻,理想直接开源「星环OS」,确实是一次值得关注的探索。它打破了之前相对封闭的研发模式,通过开放协作,加速整个汽车行业的智能化转型、降低重复投入。同时,面对AI时代的巨大不确定性,理想通过开源也为汽车行业提供了一个应对AI时代的地图。

不过,对于采用全新、尤其是一家车企主导的开源OS,需要克服很大的信任和迁移成本。星环OS最终能否成为像安卓、DeepSeek这样成功的开源社区,将取决于理想的开源社区能否被更多供应商和车企接受。这也是理想着力想解决的问题。从目前来看,理想已经开了一个好头。

以下为理想汽车CTO谢炎与媒体的对话内容(部分有节选)

理想汽车CTO谢炎|图片来源:理想汽车

星环OS和安卓不是一类

Q:理想宣布开源之后,有没有其他的企业联系,行业接受度如何?

谢炎:现在行业要么使用供应商方案,要么自研,所以有几家自研汽车操作系统的企业。我们宣布开源之后,行业关注度很高,但是没有宣布细节,很多人想知道细节。随着我们把白皮书和代码放出来,大家看到实际的系统和说明后,会真正开发和使用起来,那时候才能知道行业接受度。

同时大家也关心开源的方式,使用理想星环OS会不会被控制等问题。我们会用宽松型的Apache License(注:由Apache软件基金会发布的自由软件许可证),作为行业贡献者,理想会把代码和技术文档开源,不通过开源收取费用,不干涉代码的使用方式,也不控制使用者的数据DeepSeek是一个很好的例子,他们开放出来权重,使用者去部署服务,不需要交任何费用,也不干涉和控制使用者,我们也会一样。

Q:理想什么时候决定开源?

谢炎:我们从第一天做理想星环OS的时候就在讨论,如果做得好是不是能够开源。对于工程师来说,做得好的东西就会希望获得更多认可,当然,这是技术层面的想法,无关商业。这一早期粗略的想法,只是停留在嘴边,但后来我们越来越知道汽车操作系统的下一阶段应该是什么样,也觉得行业需要这样的操作系统。因此我们开源了理想星环OS,一方面希望获得大家的认可,一方面希望帮助行业,让大家共同看到并实现下一阶段的愿景。

Q:理想今年7月之后,就要开源智驾平台,现在很多车企和供应商都在研发智驾,理想开源的意义是什么?

谢炎:智驾和汽车操作系统是两个不同的概念,智驾本身相当于汽车操作系统上的应用,类似于App。行业普遍提到的智驾主要是指智驾算法,包含了端到端、VLM、VLA等。这些智驾算法各家都会根据自己业务需求做开发,通常不会开放,具有定制化属性。理想的智能驾驶也没有开放。

汽车操作系统是底层平台化系统基础软件,可以支持各家不同的智驾。对于提供智驾方案的供应商来说,我们不是竞争关系。

Q:星环OS最终要做一个超级AI agent吗?如何把便利性和安全性做到一个平衡?

谢炎:要说明一下,我们看到的是汽车里面有很多agent(智能体)。智能会变得更为主导,但是理想星环OS并不是agent,而是服务这些agent,这些agent运行在理想星环OS上。

关于便利性和安全性的平衡,一方面是应用层要解决的,也就是agent本身。比如自动驾驶是个agent,像一个驾驶员一样,安全的问题自动驾驶要解决,底层系统也是要去解决的。比如端到端的安全、实时性,即使自动驾驶系统已经做出了一个正确的决策,但是从它做出决策到做出转向、刹车或者某种动作之间,如果时延很长或不确定的,也会造成安全问题,这方面我们是希望通过操作系统去解决的,希望让这些任务的衔接、调度和通讯的时延是能够更确定的、更短的,所以操作系统不是agent本身。

星环OS的发展经历了三个阶段|图片来源:理想汽车

Q:对于「星环OS」,是否能用简单几句话精炼概括一下? 

谢炎:很多人会用「星环OS」类比安卓,首先它不是安卓(这样的用户操作系统),而是一套智慧系统,它可以运行智驾、车控、底盘等很多应用。星环OS是什么会由它上面运行什么「应用」来决定,指的不是互联网行业说的应用程序,而是汽车领域相关的应用,如智能驾驶等。

Q:理想星环OS后续上车的节奏是什么?

谢炎:我们接下来发布的车型都会搭载理想星环OS,有一些组件在之前的车型上已经得到使用。因为理想星环OS不只涉及单个硬件,作为一套系统,它涉及到很多控制器,所以有些技术是可以被单独使用的。

Q:这个操作系统可以拓展到其他形态的机器人上面吗?

谢炎:目前我们还没有直接针对机器人做(操作系统),但我认为需要解决的问题有很多共通性,比如机器人和汽车都需要大脑、小脑、神经系统高效协同,实时和确定性地完成任务。

至于现有的理想星环OS是不是直接能拿来做机器人操作系统,这可能要看使用者自己的偏好和能力。

星环OS的系统架构|图片来源:理想汽车

底层技术很难长期领先

Q:现有的开源操作系统没有被行业广泛使用,您觉得原因是什么?理想如何避免这个问题?

谢炎:现在行业中没有理想星环OS这样能覆盖车控、智驾的完整汽车操作系统。

Q:其他行业也有开源操作系统,但大家不怎么使用。

谢炎:因为其他行业的系统并不一定适合智能汽车,直接拿来并不一定就是好用的。有两个原因。第一,系统本身没有解决核心问题,有的开源项目只是重复造轮子,没有解决太多问题,没有创造价值。第二,系统可能已经过时了,没有去面向未来地解决问题。我们在解决自己的问题的同时,看到了一些未来的问题。

操作系统开源不是一锤子买卖,开源只是起点,我们希望能和行业共同解决很多问题,一起走得更快更远。

Q:Open Harmony OS属于是不好用还是过时?

谢炎:这个我不太好评价。不过两者并非相同领域的系统,所以也无法比较。

Q:从您的角度看AUTOSAR的问题出在哪?

谢炎:AUTOSAR是在上一个时代构建的系统,它非常匹配上一个时代需要的汽车技术,但现在软硬件迭代速度很快,需要它更高性能、更灵活高效,AUTOSAR在这方面做得不够。

我们不是为了自研而自研,其实决定自研是因为我们发现一些问题,且行业内没有方案能够直接解决,所以我们选择自己来做。如果行业有好用的方案,在价格合适的情况下,我们也愿意使用。

Q:如果理想去选择一个开源的汽车操作系统,会看哪些东西?

谢炎:我觉得主要会考虑三个因素:

第一,它能够解决我们要解决的问题,我们能够看到同样的愿景或者未来,这是第一源动力。

第二,有没有自主权。假如说我们使用别的汽车操作系统是黑盒交付的,我们看不到任何代码,那就无法修改。即使我们不一定需要修改,但代码和解决方案也必须是开放的、透明的。

第三,考虑商业使用是否会有掣肘。比如有一些开源项目仅可以作为学习使用,如果用于商业、必须付费,我觉得这不是真的开源。所以我们从这三个方面做了考虑,我们不希望收费,也不希望限制任何人使用。

Q:我理解开源这个事,好比班里有好学生和差学生,好学生把自己的作业给差学生抄。为什么让其他人来抄?

谢炎:汽车操作系统是个很复杂的概念,包含车控、智能驾驶、整车通信系统,并且系统上面连接各种各样的应用,系统下面的硬件连接各种供应商,靠理想一家企业做起来很慢。如果行业要迈向下一个时代,实现从Smart System(智能系统)到Intelligent System(智慧系统)的跨越,实现未来的蓝图,就需要把系统开源,让更多人加入,我们才可能走得更好、更稳、更快。

我个人认为底层技术没有绝对的领先,没有绝对的护城河,所以只有不断地往前跑。我们希望能够跟志同道合的人更快速地往前跑,跑得越快越有价值。

Q:「理想星环OS」对于商业模式层面有什么思考?是否考虑过回报率?

谢炎:我们不希望通过开源直接获得回报,我们既不卖汽车操作系统,也不干涉使用者如何使用。我们只是希望更快、更好地和供应商、友商一起实现我们打造Intelligent智慧系统的愿景。

理想星环OS的商业模式和谷歌不一样,因为谷歌是一个服务商,他开源后要求安卓商搭载他的服务,并从中获得商业回报。

Q:开源是企业的选择,但对于用户来讲,受益在哪?

谢炎:星环OS是一套底层的系统,并不直接服务于用户,可能和安卓类比不合适,因为安卓、Windows是用户操作系统。如果我们把汽车比喻成一个机器人,那么星环OS这套系统相当于一个机器人内部的一套底层大脑、小脑和神经网络系统。它不直接对你做出服务贡献,而是服务那些底层所支撑的能力。

星环OS的开源内容和计划|图片来源:理想汽车

不期待通过开源获得回报

Q:李想提到,星环OS将帮助汽车行业每年节省100到200亿的重复投入,这是怎样计算出来的?怎样才能够给其它厂商带来一个吸引人的降本预期?

谢炎:不同厂商的视角和需求也不一样。我们的操作系统具有多重优势:首先,面对一些行业普遍存在的技术难题,有些厂商往往需要投入上百人、用很多年时间来解决,这占据了它们大量的研发费用和资源。

其次,我们的系统经过了整体的优化,现在可以实现百亿级的成本控制,这主要是因为我们在减少「重复造轮子」的工作,这就能够节省大量的研发成本,并显著提高研发效率。

此外,开源能够减少对研发资源的占用,因为适配的硬件更多了,就有了更大的选择余地,从这个层面上来说也可以降低成本。所以成本的优化是综合的结果,而不只是由于单一的某个点。

Q:所以要争取更多的供应商加入?

谢炎:供应商还有车企。使用理想星环OS的车企越多,供应商越会积极拥抱。在手机行业,这个故事就在上演,比如说安卓发布以后,很多手机厂商在使用,那么包括高通在内的硬件厂商就在积极拥抱,这就是同频共振了。操作系统就像一个协议,就像大家遵从世贸协议进行交易,越多的人加入,(操作系统)发展得越快。

大家可以在这套协议上看到未来的前进方向,就像是看着一张共同的蓝图在向前走。

Q:理想最希望的是哪个领域、哪些角色的人加入进来?

谢炎:欢迎所有的汽车厂商和供应商一起来使用,一起来添砖加瓦,没有具体的优先级。(行业里)有些我们共同要解决的问题,比如说实时性、安全性。理想星环OS用的人越多,成本越低,所以没有排名,甚至欢迎非汽车领域的企业来使用。

Q:如果一家车企把理想星环OS导入他们的平台和车型,他们都需要做什么?理想能不能给出一些具体的指导?

谢炎:这是我们要做好的。第一,我们会有白皮书,有技术文档;第二,我们在推出理想星环OS的时候,会和比较积极的芯片公司合作,它们的硬件能够直接适配理想星环OS,将操作系统下载到某一块开发板上并且可以使用。

Q:安卓系统开放后,大家认为所有不好的使用体验都来自于安卓。如果星环OS成功普及,但厂商添加了很多自己的功能和服务,做的不好的时候,用户会不会说星环OS卡、蠢、笨。有没有跟其他厂商去签某种有限的协议?

谢炎:我们不会阻止使用者做任何修改。就像DeepSeek,也没有限制任何的修改。往前走的空间很大,我们做产品要实事求是,如果做得不好且是我们的问题,那我们就要改,如果不是我们的问题,慢慢的也会被澄清。

Q:星环OS开源之后的运行数据所有权是归属用户、理想,还是其他使用的企业?以及后续星环OS更新的时候,其他企业会不会参与到更新过程当中?

谢炎:开源后的用户数据跟我们没有关系。这是一套大家可以用的系统,类似Linux或AOSP,使用者具体怎么用其实是不被关心的,所以这个数据我们是不可能掌握的,我们也不想掌握。

另外,我们希望构建操作系统的社区,大家可以一起协商后续的版本,比如是否要加入什么新特性,或者要去满足哪些功能的需要。理想星环OS的开源社区跟其他开源社区的运作方式非常类似,贡献的越多,可能越有讨论、决定理想星环OS未来发展方向的权利。

Q:开源在汽车行业并不常见,通常行业组织如OSEK、AUTOSAR等会根据车企需求制定共同规范,由Tier 1或车企进行自研。理想汽车是首次以车企身份,开源了一款高完成度的操作系统。但是缺乏能力的厂商,难以在此基础上进行开发,而能力强的友商则可能不直接使用。那这套系统到底会被谁使用?

谢炎:这是一个很好的问题,这确实不是一件容易的事情,以前也没有人做过。首先我觉得,做成一件事情需要「天时地利人和」。之前「天时」没到,在上一个阶段大家都是碎片化的、分离式的,没有这些需求,如果要做一个功能只需要找个地方加上去就可以了。

但是随着汽车从Smart变成Intelligent系统后,它更需要系统的集中化,无论是硬件还是软件都需要解决这些问题。如果今天没有好的方案,大家就自行解决,但是现在有了更好的方案,大家就都可以用。以前没有统一的共识,但我认为再往下走可能会出现一些共识,也就是我们说的大家看到同一张图。

对于有能力的友商,能够参考这个系统也是价值。可能在这个过程中,行业共识将逐渐形成,慢慢聚焦。

我们并不是希望开源第一天就会被全盘使用,虽然这是我们的最高目标。如果只是部分的使用,我认为也是很有价值的,这是一张蓝图。

OpenAI 布局社交平台,对标马斯克的 X;特斯拉或即将曝 Model Q 细节;苹果将分析用户数据提升 AI 能力

OpenAI 布局社交网络:对标马斯克的 X 平台

据一位熟悉相关计划的消息人士证实,OpenAI 正在考虑打造一个社交媒体网络,以与伊隆・马斯克的 X 和 Meta 公司的 Instagram 竞争。

图片来源:视觉中国

该人士表示,由于保密原因要求匿名,该项目仍处于早期阶段。它是基于 OpenAI 最新图像生成功能的受欢迎程度而提出的,该功能已导致公司服务器过载。

OpenAI 拒绝置评。(来源:金融界)

Anthropic 的 Claude 现在可以阅读你的 Gmail

Anthropic 周二宣布,其 AI 聊天机器人 Claude 现已与 Google Workspace 集成,允许其搜索和引用 Gmail 中的电子邮件、Google 日历中的预定事件以及 Google Docs 中的文档。

该集成功能将首先面向 Anthropic 的 Max、Team、Enterprise 和 Pro 计划的订阅用户推出 Beta 版。据 Anthropic 称,管理多用户帐户的管理员必须在其终端启用该集成功能,用户才能连接他们的 Google Workspace 和 Claude 帐户。

Google DeepMind 的 Gemini 聊天机器人也可以与 Workspace 集成,OpenAI 的 ChatGPT 可以与 Google Drive 集成。然而,Anthropic 是首批提供与 Google 生产力套件紧密连接方式的第三方 AI 公司之一。

Anthropic 与 Google 的合作旨在为 Claude 提供更加个性化的回复,而无需用户重复上传文件或编写详细的提示。OpenAI 和 Google 尝试通过不同的方法实现同样的效果,例如添加记忆功能,让聊天机器人在回复中引用过去的对话。(来源:cnBeta)

 

王化回应小米成立芯片平台部:一直存在 秦牧云已加入数年

4 月 15 日,有报道称,小米最新在手机部产品部组织架构下成立芯片平台部,任命秦牧云担任芯片平台部负责人,向产品部总经理李俊汇报。

对此,小米集团公关部总经理王化发文回应称,手机产品部的芯片平台部一直存在,其部门工作主要是负责手机产品的芯片平台选型评估和深度定制。而负责人秦牧云加入公司都有好几年了,至少 2021 年就有小米办公的工作聊天记录了。

据悉,秦牧云此前曾在高通任职,担任高通产品市场高级总监,后加入小米。

不过,虽然新成立部门的消息有误,但自研芯片的布局却是小米一直在坚持的。(来源:快科技)

 

「大模型六小龙」第一家,智谱启动 IPO 流程

4 月 15 日,中国证监会网上办事服务平台公开发行辅导公示显示,北京智谱华章科技股份有限公司(以下简称「智谱」)2025 年 4 月 14 日在北京证监局办理辅导备案,由中国国际金融股份有限公司(以下简称「中金」)担任辅导机构。时间表显示,智谱将在今年 8 月-10 月完成 IPO 辅导计划。

辅导备案报告显示,智谱无控股股东。实际控制人为唐杰、刘德兵。唐杰直接持有智谱 7.4081% 股权。刘德兵直接持有智谱华章 0.2554% 股权,并通过持股平台合计控制智谱 17.3966% 表决权。唐杰、刘德兵通过一致行动人李涓子、 许斌、张鹏、宁波慧惠企业管理合伙企业(有限合伙)合计持有智谱 12.1600% 表决权。综上,唐杰、刘德兵合计控制智谱 36.9647% 表决权,系智谱实际控制人。

智谱率先启动 IPO,标志着其在国内 AI 大模型领域取得了一定的阶段性成果,也反映了其在商业化路径和资金筹集方面的积极探索。(来源:极客公园)

 

曝特斯拉 4 月 22 日公布 Model Q 新细节

据报道,特斯拉或将在 4 月 22 日公布一季度财报后披露全新入门车型的详细信息。而当前,这款被称为「Model Q」最便宜的特斯拉车型假想图已流出,车辆采用 Model Y 同款贯穿灯,车身更为圆润,车身长度也有所缩短。

此前报道显示,特斯拉首席财务官 Vaibhav Taneja 今年 1 月 29 日明确表示,这款经济型电动车仍按计划推进,预计 2025 年上半年正式推向市场,有媒体猜测发布时间是在 6 月份。

特斯拉此前还曾表示,「Model Q」补贴后价格低于 30,000 美元,长度约为 3988 毫米,比 Model 3 小 15%,轻约 30%。新车将采用容量为 53kWh 和 75kWh 的磷酸铁锂电池,提供单电机和双电机选项,预计续航里程为 500 公里。

Model Q 的海外起售价约为 25,000 美元,特斯拉上海工厂生产的车型,价格可能会降至 140,000 元人民币。(来源:快科技)

AMD 确认 EPYC Venice「Zen 6」首次采用台积电 2nm「N2」工艺制造 

AMD 与台积电合作:基于 N2「2nm」工艺节点的第六代 EPYC Venice「Zen 6」CPU 和第五代 EPYC CPU 在台积电亚利桑那工厂得到验证。

AMD 在一份突破性的声明中宣布与台积电建立长期合作伙伴关系,采用最新的制造技术和工艺节点制造其下一代 EPYC CPU。(来源:ugmbbc)

 

跨境电商应用敦煌网,在美爆火

中国跨境电商应用敦煌网(DHgate)热度升温。截至 4 月 15 日中午,敦煌网已成为美区 App Store 排名第二的免费 iPhone 应用程序,仅次于 ChatGPT。

记者浏览敦煌网发现,用户可以在网站上买到各种饰品、鞋类、箱包、手机、美妆、服装等商品。

公开资料显示,敦煌网成立于 2004 年,是国内最早开设的跨境电子商务交易平台之一,主要业务是利用平台帮助国内中小企业与全世界的中小批发商及零售商开展跨境贸易。(来源:中国证券报)

 

美团即时零售品牌「美团闪购」正式发布

4 月 15 日消息,美团今日正式发布即时零售品牌「美团闪购」。该品牌定位为「24 小时陪伴消费者的新一代购物平台」,联合全国近 3000 个县市区旗的零售商、品牌商与本地中小商家,将服务全国 10 亿消费者的日常购物需求,为消费者创造「闪购一下,30 分钟好货到手」的极致购物体验。(来源:电商派)

 

猿辅导集团推「小猿 AI」

4 月 15 日,猿辅导集团正式推出首个教育 AI 范式——「小猿 AI」,并发布覆盖家校两端的「软件应用+智能终端+通识课程」三位一体解决方案,涵盖小猿 AI App、小猿 AI 学习机及飞象星球人工智能通识课。

小猿 AI APP 是专为中小学生打造的全场景学习解决方案,覆盖 100 多个关键学习场景,实现类真人老师的个性化 1V1 讲解,推动教育 AI 应用从辅助工具向成长伙伴跃升。

小猿新一代 AI 学习机搭配智能基座,以平板为眼、耳,智能基座为手,通过伴学机器人形态,提供涵盖每日学习计划、学情诊断、知识图谱、课程学习、每日一练等学习全流程的辅导方案,推动个性化学习再进一步。(来源:极客公园)

三星推出整合谷歌 Gemini 的 AI 家庭伴侣机器人 Ballie,今年夏天在韩国美国上市 

4 月 15 日消息,三星上周宣布与谷歌云扩大合作,将其生成式 AI 技术 Gemini 引入三星全新的家用 AI 家庭伴侣机器人——Ballie。

三星表示,Ballie 将于今年夏季在韩国和美国市场正式上市。这款机器人具备自然对话交互能力,可协助用户管理家居环境,包括灯光调节、迎宾接待、日程定制及提醒设置等功能。(来源:IT 之家)

 

可灵 AI 发布 2.0 版基座模型,千万资金扶持 AIGC 创作者 

4 月 15 日,可灵 AI 宣布基座模型升级,面向全球正式发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型。

可灵是全球首个用户可用的 DiT(Diffusion Transformer)视频生成模型,其 2.0 版本的模型在动态质量、语义响应和画面美学做了相应提升,而可图 2.0 模型主要集中在指令遵循、电影质感及艺术风格表现等方面。(来源:IT 之家)

 

35.98 万元起,2025 款小鹏 X9 大七座 MPV 车型上市 

4 月 15 日消息,2025 款小鹏 X9 MPV 车型今晚正式上市,定价 35.98 万元起。

外观方面,该车风阻系数 0.227Cd,共有星舰灰、星云紫、星系蓝、新月银、暗夜黑、星云白 6 种不同风格的车色。可选 20 英寸星耀轮毂(配备动态定轴悬浮技术,即车轮转动中央 Logo 悬浮不动)。此外,该车还标配 AI 智驾小蓝灯。

座舱方面,该车标配高阶智驾,前排配备 10.25 英寸液晶仪表盘和悬浮式 17.3 英寸中控,后排配备 21.4 英寸 3K 分辨率娱乐屏,支持 0-75 度悬停,通过德国莱茵护眼认证,覆盖 100% DCI-P3 色域。

同时,该车辆升级五门电吸,一排标配靠背及坐垫通风加热,及行业首创智能指压按摩,第二排支持行业最大座椅按摩力度、6 大智能场景按摩模式、14 向电动调节。(来源:IT 之家)

上海交通大学智能传感新硬件:用可穿戴 AI 系统为盲人导航

财联社 4 月 15 日电,国际学术期刊《自然-机器智能》4 月 14 日 23 时许在线发表论文报告了一款可以为盲人和部分视力障碍人士提供导航辅助功能的可穿戴系统。

该系统以 AI 算法为智能核心,通过摄像头拍照来获得图像等视觉信息,然后基于 AI 算法进行识别、判断和输出,为使用者选择一条无障碍路线,最后在导航提示中,综合提供听觉和左右手部皮肤的触觉等信号,比如骨传导耳机传递简要的声音信号,以及能戴在手腕上的可伸展人造皮肤,能将振动信号传给使用者,以指导移动方向,避开两侧的物体,从而辅助视力障碍人士穿过迷宫,避开障碍物,以及抓取某个物体。(来源:财联社)

苹果将分析用户数据,以增强其陷入困境的 AI 功能

苹果公司将分析用户设备上的数据以改进其人工智能(AI)平台,同时确保用户数据保留在设备上,不会直接用于训练 AI 模型。

这项新方法将通过使用实际电子邮件来检查合成数据并改进其 Apple Intelligence 平台中的文本相关功能,帮助苹果赶超 AI 竞争对手。该公司将在即将推出的 iOS、iPadOS 18.5 和 macOS 15.5 测试版中推出新系统,同时还将引入以隐私为中心的方法来改进 Apple Intelligence 的其他功能。(来源:华尔街见闻)

 

大模型六小龙,第一个 IPO 要来了

国内大模型赛道出现了第一家启动 IPO 的创业公司。

 

4 月 15 日,中国证监会网上办事服务平台公开发行辅导公示显示,北京智谱华章科技股份有限公司(以下简称「智谱」)2025 年 4 月 14 日在北京证监局办理辅导备案,由中国国际金融股份有限公司(以下简称「中金」)担任辅导机构。时间表显示,智谱将在今年 8 月-10 月完成 IPO 辅导计划。

辅导备案报告显示,智谱无控股股东。实际控制人为唐杰、刘德兵。唐杰直接持有智谱 7.4081% 股权。刘德兵直接持有智谱华章 0.2554% 股权,并通过持股平台合计控制智谱 17.3966% 表决权。唐杰、刘德兵通过一致行动人李涓子、 许斌、张鹏、宁波慧惠企业管理合伙企业(有限合伙)合计持有智谱 12.1600% 表决权。综上,唐杰、刘德兵合计控制智谱 36.9647% 表决权,系智谱实际控制人。

图片来源:中国证监会网上办事服务平台

大模型「六小龙」在过去一年经历了多重波折与战略调整,受 DeepSeek 开源高性能模型冲击,被迫缩减预训练投入,有公司放弃通用大模型研发,分别转向医疗 AI 与行业垂直场景;也有公司收缩 To B 业务,聚焦海外 C 端市场……

智谱率先启动 IPO,标志着其在国内 AI 大模型领域取得了一定的阶段性成果,也反映了其在商业化路径和资金筹集方面的积极探索,为同行提供了参考。

 

01

 

清华孵化的「资本宠儿」

 

智谱的起源可以追溯到 2006 年,当时清华教授唐杰领导的团队发布了一款名为 AMiner 的科研情报挖掘产品,为国内最早研发的研究者社会网络分析与挖掘系统,这一产品为智谱的后续发展奠定了基础。

2019 年,智谱正式脱胎于清华,由清华教授唐杰带领团队孵化。智谱 CEO 张鹏本科毕业于清华大学计算机系,博士在清华大学计算机系的研究方向为知识图谱。董事长刘德兵师从高文院士,是曾任清华数据科学研究院科技大数据研究中心副主任,总裁王绍兰为清华创新领军博士。

智谱就此开启了打造新一代认知智能通用模型的征程。

 

智谱自 2019 年成立以来,累计完成超 150 亿元融资,在今年 2 月的最新估值为 300 亿元:

 

2019 年,天使轮融资,投资方包括清华大学计算机系知识工程实验室技术成果转化团队主导,早期支持方包括中科创星、华控汇金等;

2021 年 9 月,A 轮融资过亿元人民币,达晨财智、华控基金、将门创投、图灵创投等十余家机构联合投资;

2022 年 9 月,B 轮融资数亿元人民币君联资本、启明创投联合领投;2023 年全年分多阶段完成 B 轮系列融资,超 25 亿元人民币,战略投资方为美团(3 亿元 B+轮)、社保基金中关村自主创新基金(君联资本管理),跟投方包括蚂蚁集团、阿里、腾讯、小米、红杉、高瓴等;

2024 年 6 月,C 轮 4 亿美元(约 28.8 亿元人民币),领投方为沙特阿美旗下 Prosperity7 Venture,此时估值达到 30 亿美元(约 210 亿元人民币);

2024 年 8 月,C+轮融资超 10 亿元人民币,领投方为君联资本,跟投方包括顺为资本、红杉中国、腾讯等;

2024 年 12 月,D 轮融资 30 亿元人民币,领投方为中关村科学城公司,估值 260 亿元人民币(约 46.15 亿美元)。

 

今年 3 月,智谱密集完成三轮融资,加速 IPO 前资本储备——3 月 3 日,智谱完成一笔金额超 10 亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等;3 月 13 日,智谱完成一笔金额 5 亿元人民币的战略融资,投资方为珠海华发集团;3 月 19 日,成都高新区宣布向智谱注资 3 亿元人民币。

智谱接连拿下三地国资的同时,也已经与北京、杭州、上海、成都、珠海等城市达成战略伙伴关系,携手当地龙头企业,推动区域大模型应用生态的繁荣。

据了解,智谱已在杭州成立了浙江智谱新篇科技有限公司,依托前沿人工智能和大模型技术,以更好服务浙江省和长三角地区的经济实体;并将与成都高新区共同打造四川省基座大模型「智谱 AI 诸葛」,建设三位一体的 AI 基础设施,目标在 5 年内支持超 1000 家企业 AI 转型,孵化 20 家生态企业。

 

02

 

「六年磨一剑」进阶之路

 

智谱即将成为国内大模型赛道首家 IPO 的创业公司,这背后是技术、商业与时机的多重合力。

作为一家从清华大学孵化而出的大模型独角兽,智谱用六年时间打造了一张全面的大模型版图,涵盖千亿基座模型、对话、代码、多模态与智能体。

智谱不仅在大模型的基础研究上取得了突破,还在多个关键节点上推动了原创性进展。其 GLM 架构及多个阶段的模型如 GLM-10B、悟道(MoE 架构的万亿模型)、GLM-130B 等,展现了其在大规模预训练模型方面的独立研发能力。

智谱成立于 2019 年,从清华大学计算机系知识工程实验室技术成果转化而来,此后一路推进:

2021 年提出 GLM 模型算法并发布百亿模型 GLM - 10B,同年训出 MOE 架构的万亿模型悟道;2022 年加大投入,训出国内第一个千亿开源模型 GLM - 130B;2023 年推出线上可用的中国 ChatGPT(ChatGLM),引领中国大模型发展和商业化;2024 年,智谱 GLM 的原创算法得到 Nature 报道,从基座模型能力延展至多模态和 Agent;2025 年,智谱宣布将发布全新大模型并开源,将为国产大模型生态注入新的活力。

作为国内唯一全面对标美国 OpenAI 的大模型企业,智谱 GLM 系列大模型在千亿基座模型、对话模型、代码模型、多模态模型、推理模型和 Agent 等方面布局完整,原创架构全面对标 GPT。

智谱 AI 此前公开的对标 OpenAI 全模型产品线|图片来源:智谱

2024 年下半年,智谱推出的基座模型 GLM - 4 - Plus、Agent 模型 AutoGLM、推理模型 GLM - Zero 等,都展现了比肩 OpenAI 的实力。GLM 预训练架构更是实现了从预训练理论、技术到预训练工具等全方位的全栈自主创新,推动形成了自主的超大规模智能模型技术创新体系。

在技术趋势的把握上,智谱也展现出了洞察力。继长推理模型之后,智谱看到了 Agent 技术的潜力,先于 OpenAI 提出 Phone Use 概念,推出能模拟用户进行计算机、手机等跨应用自主操作的 AutoGLM 和 GLM - PC,并基于 Agentic GLM 与三星手机展开合作,在国内外大模型中处于领先地位。

今年 3 月底,智谱发布了智能体 AutoGLM 沉思,不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator),推动 AI Agent 进入「边想边干」的阶段。

AutoGLM 沉思的技术演进路径包括:GLM-4 基座模型 → GLM-Z1 推理模型 → GLM-Z1-Rumination 沉思模型 → AutoGLM 模型。

开源是智谱的另一张牌。作为国内最早开源大模型的人工智能公司,智谱在 2022 年就开源了自主研发的高精度双语千亿模型 GLM-130B,此后又先后在 2023 年开源 ChatGLM3-6B 和多模态模型 CogAgent-18B,2024 年发布第四代 GLM-4 系列开源模型,包括 GLM-4-9B 等。这种开放策略吸引了百万开发者,构建了强大的生态壁垒。

2025 年也是智谱的开源年。4 月 15 日,智谱宣布将开源 32B/9B 系列 GLM 模型,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。目前系列所有模型可以通过「z.ai」访问体验。新版基座模型和推理模型已同步上线智谱 MaaS 平台,目前该平台整合了 32B 基座、推理、沉思三类 GLM 模型,后续将作为智谱最新模型的交互体验入口。

其中,推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等顶尖模型,推理速度可达 200 Tokens/秒(MaaS 平台 bigmodel.cn),目前国内商业模型中速度最快。此外,其价格仅为 DeepSeek-R1 的 1/30。

Z.ai 作为智谱最新模型交互体验入口,将正式启用|图片来源:智谱

在商业化上,智谱采取了灵活的服务模式,包括 MaaS(模型即服务)、私有化部署及智能体平台等。其 MaaS 平台已经支持超过 70 万家企业和开发者,API 年收入同比增长超过 30 倍;私有化部署覆盖 20 多个行业,触达万余家单位;C 端产品「智谱清言」2024 年 3 季度上线付费功能,预计年收入将超过千万。

商业化之外,智谱的合作版图同样亮眼,其已与中国三星联手,将智能体技术植入 Galaxy S25 系列,走向国际化;与珠海高新区及华发集团的合作,则催生了国内首个城市级 GLM 大模型空间。

2025 年,大模型赛道进入技术与应用并重的阶段。智谱率先启动 IPO,验证了自身从实验室到市场跨越的同时,也标志着中国大模型从实验室走向资本市场的里程碑。

「豁免」无效,关税「横跳」,苹果和英伟达悬着的心,怎么落下来?

上周五,美国海关发布了更新税则,豁免了包括电脑、智能手机、半导体等部分产品的「对等关税」。

 

一大批消费电子、芯片公司顿时松了口气,尤其是苹果、戴尔、惠普、三星、联想、AMD、英伟达等厂商,以及相关供应链企业,似乎一夜之间「脱险」了。

然而,美国总统特朗普周末在社交媒体发文称,豁免的电子产品只是被「挪到了另一个关税桶里」,痛斥各家媒体对关税豁免的形容是「Fake News」

美国商务部长也称一些电子产品可能单独征收关税。特朗普可能将于美国时间周一更新其政府对半导体等产品的关税态度。

关税政策反复横跳之下,对于硅谷、乃至全球的科技公司的影响是什么?而在「关税闹剧」背后,美监管层又隐藏着哪些「私心」?

 

01

 

苹果逃过一劫了吗?

 

4 月初特朗普抛出关税炸弹以来,科技公司的股价坐了一趟过山车。

其中,苹果的待遇最为显著。其股价自 4 月 2 日起在四个交易日内大跌 23%,市值蒸发超过 7700 亿美元,创下自 2000 年以来最严重的四日跌幅。巴菲特去年减持苹果的操作,也被人们翻出来感叹真有「先见之明」。

之后,美国关税政策再次横跳,包括部分国家暂缓 90 天实施,苹果股价随大盘在 4 月 9 日大幅反弹 15.3%。然而,随着市场意识到这些豁免可能是暂时的,苹果股价在随后的交易日再次下跌。

截至近日,苹果市值蒸发了约五分之一

特朗普政府对外声称「关税政策」的明确意图,是让制造业务回流美国。白宫发言人在一份声明中称,美国不能依赖外国制造半导体、芯片、智能手机和笔记本电脑等关键技术产品,特朗普已从苹果和英伟达等公司争取到数万亿美元的美国投资。

但市场普遍认为,尽管苹果在内的公司努力将部分生产转移至其他地区,但短期内想要摆脱对中国供应链的依赖难度极大。

蒂姆·库克曾经提到,中国拥有大量熟练的技术工人和先进的制造能力,这是其他国家难以匹敌的。他举了这么一个例子:在美国,要是想找一屋子搞模具的工程师开会,可能人都找不齐,但在中国,这样的人「能装满好几个足球场」。

在他看来,中国的制造生态系统经过数十年的发展,形成了一个高效且规模庞大的供应链网络,这个网络「非常非常深」。

尽管苹果正在将部分生产转移到印度和越南等国家,以分散风险,但完全替代中国的制造能力在短期内几乎是不可能的。要在其他国家复制中国的制造生态系统,至少需要几十年的时间。

美国金融机构韦德布什证券分析师 Dan Ives 估计,即使仅仅将 10% 的供应链从亚洲转移到美国,也需要三年时间和 300 亿美元,而且整个过程会受到严重干扰。

与此同时,在制造业无法立即回流的情况下,更高的成本只能转嫁给消费者。目前,市场也普遍将豁免的动机解读为避免热门电子产品出现价格飙升。例如,有预测警告称,绝大部分 iPhone 都在中国组装,在全面征收关税的情况下,iPhone 的价格可能上涨 50% 至 80%,这意味着,每部手机的零售价在美国可能会增加 500 美元以上

在关税豁免通知前,为了节省关税成本,苹果曾紧急从印度工厂空运 iPhone 回美国,自 3 月份以来,该公司已向美国空运了 600 吨 iPhone(约 150 万部)。

与此同时,包括惠普、戴尔在内的厂商决定暂停对美发货,任天堂推迟了 Switch 2 在美国的新品上线。

可以说,如果不考虑特朗普自身的性格与动机,美国政府官员的内部斗争、科技巨头们的游说施压、短期供应链中断警告、制造业回流的现实困境、通胀压力,加上眼前金融市场的各种危机,都在推动关税豁免。

 

02

 

英伟达松了一口气

 

半导体领域方面,如果真有持续的关税豁免,英伟达,高通、AMD 等也从中受益,因为他们在中国台湾或韩国生产的芯片可能在美国进口时豁免关税。

根据半导体行业协会(SIA)数据,全球半导体制造能力的约 75% 集中在中国和东亚地区。其中,世界上最先进的(10 纳米以下)半导体制造能力 100% 位于中国台湾(92%)和韩国(8%)。如果美国加征关税,短期内只能损人不利己。

「一种假设性的替代方案,即在每个地区建立完全自给自足的本地供应链,将需要至少 1 万亿美元的额外前期投资,并导致半导体价格整体上涨 35% 至 65%,最终使电子设备的消费者成本上升。」SIA 的一份报告分析称。

半导体行业协会(SIA)报告|图片来源:SIA

英特尔可能也会松口气,该公司正在美国亚利桑那州和俄亥俄州建设新的制造厂,如果一些进口工具(比如荷兰 ASML 的光刻机等)被征收更高的关税,英特尔雄心勃勃的晶圆厂扩建计划(已耗资数百亿美元)将付出更加昂贵的代价。

根据 ASML 的年度报告,2024 年,该公司约 16% 的销售额来自美国市场。该公司首席执行官 Christophe Fouquet 最近在荷兰一次行业活动中称,日益加剧的地缘政治紧张局势不利于行业合作。

位于华盛顿的半导体行业协会也指出,特朗普政府对半导体征收广泛的关税将适得其反,因为它会增加美国新建晶圆厂和开展研究的成本。

但对英特尔来说,目前鱼与熊掌可能不可兼得,因为真正的「美国制造」的芯片,意味着如果想进入中国市场,也要面临挑战。

 

03

 

喘息只是暂时的?

 

对席卷而来的部分产品关税豁免消息,资本市场大部分人持欢呼态度,并将此视为经济竞争稍微降级的信号。有些人甚至认为,如果没有豁免,一些大型科技公司将迎来「末日」。

但美国兰德智库机构人员 Gerard DiPippo 在社交平台中评论称,关税豁免主要是为了减轻对电子产品和消费者的影响。他认为这并非停火的信号。

兰德智库人员认为关税豁免主要为了减轻对消费者的影响|图片来源:X

而且,就在科技公司和相关投资者以为脱险时,事情在周末又发生了一些变化。

特朗普周末对媒体称,对智能手机和电脑的关税豁免只是「暂时的」,他将于周一更新其政府对半导体关税的态度。

「周五并没有宣布什么关税『豁免』」「这些电子产品只是被归类到了另一个关税分类『桶』里」「假新闻媒体明知道这一点,却拒绝报道真相。」特朗普在社交媒体周末发文如此怒斥道。

特朗普称关税「豁免」是假新闻|图片来源:特朗普社交媒体

「我们正在对半导体以及整个电子供应链展开即将启动的国家安全关税调查。」特朗普称,「我们必须在美国本土制造产品」。

美国商务部长卢特尼克也在周末称,特朗普将在一到两个月内对智能手机、电脑及其他电子产品实施「特别定向」的关税,同时针对半导体行业实施行业性关税。这些新关税将不属于特朗普此前提出的「对等关税」体系。

由于关税政策反复横跳,美国一金融机构创始人发文吐槽,「今年最大的反弹将在卢特尼克被解雇的那天到来。我建议政府弄清楚谁在控制信息,无论是什么,因为政策每天都在变化。美国企业无法在这种不断的反复中规划或投资。」

美国关税反对声|图片来源:X

目前,部分产品「关税豁免」避免了一场迫在眉睫的危机,苹果、果链相关企业、消费电子公司、半导体公司估值获得部分修复,但这是否标志着关税大战的开始,还是仅仅是暂时的休息,还有待观察。

从智能手机、电脑到芯片,全球供应链上的相关企业正借此喘息,有人将此视为补充公司库存、调整策略的窗口。但如果豁免无法维持,或者关税战无法降温,行业可能还将迎来更多动荡。不论是美国大型科技公司,还是亚洲工厂生产线上的员工,还是全球消费者,都可能承担代价。

科技公司们短期内只能期待,如果关税不可避免,至少接下来幅度小一些。

小米 YU7 内饰曝光;OpenAI 发布 GPT-4.1 新模型;传蔚来单周增 9000 订单

华为云上线「核弹级产品」,或将终结算力焦虑

近日,华为公布了 AI 基础设施架构的新进展,推出 CloudMatrix 384 超节点,并已在芜湖数据中心规模上线。《科创板日报》独家了解到,华为云 CloudMatrix384 超节点今年上半年将有数万规模的上线。华为内部人士称其为核弹级的产品,或将彻底终结算力焦虑。未来,CloudMatrix 超节点可以构建超过万片的大集群来提供算力。

2024 年 3 月,英伟达率先发布了 NVL72 超节点,可以把 72 张训练卡组成一个超节点,为万亿参数的大型语言模型推理提供了 30 倍实时速度提升。而这次发布的华为 CloudMatrix 384 更进一步,以 384 张昇腾算力卡组成一个超节点,在目前已商用的超节点中单体规模最大。

华为公布的数据显示,CloudMatrix 384 实现算力规模达 300PFlops,相比英伟达 NVL72 的 180PFlops 提升 67%。

不过,在单位算力功耗方面,国产芯片仍比英伟达高得多。更高的功耗对于服务器散热要求也更高,机房规模会更大,导致整体成本上升。(来源:财联社)

OpenAI 深夜发布 GPT-4.1 系列模型,支持百万 Token 上下文编程

北京时间 4 月 15 日凌晨,OpenAI 正式在 API 中推出全新的 GPT-4.1 系列模型。此次发布包括三款新模型,分别是 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三个新成员。其中,OpenAI 声称 GPT-4.1 nano 是其迄今「最快、最便宜」的模型。

这些模型在各项指标上全面优于 GPT-4o 和 GPT-4o mini,特别是在编程、指令遵循以及上下文理解方面表现突出。

它们还支持更长的上下文窗口,最大可达 100 万个 Token,知识更新日期为 2024 年 6 月。(来源:腾讯科技)

 

宁德时代公布最新财报:营收 847 亿元,净利润增长超三成

4 月 14 日,宁德时代发布了 2025 年第一季度财报。本季度,宁德时代总营收达 847 亿元人民币,净利润突破 139 亿元大关,同比增幅超三成,毛利率环比持续攀升。

财报显示,公司一季度归属母公司净利润达 139.6 亿元,同比大幅增长 32.9%,综合毛利率提升至 24.4%,较上季度和去年同期均有增长。值得注意的是,宁德时代研发投入力度不减,一季度研发支出突破 48 亿元,显示出其在技术创新方面的持续投入。

换电业务成为宁德时代新的战略增长点。公司近期与中国石化集团达成合作,双方计划 2025 年共建不少于 500 座换电站,长期目标扩展至 10000 座。此外,宁德时代还与蔚来达成战略合作,蔚来旗下萤火虫品牌新车型将适时导入宁德时代的巧克力换电标准和网络,双方换电网络将采用「双网并行」模式,共同推动换电技术标准化建设。

SNE 数据显示,继 2017 至 2024 年连续 8 年动力电池使用量排名全球第一后,2025 年 1-2 月宁德时代全球市占率达 38%,其中欧洲市场份额高达 43%,同比提升 8 个百分点,领先第二名 13 个百分点。(来源:凤凰网科技)

 

英伟达宣布组建美国本土 AI 服务器产业链

本周一,英伟达宣布,公司正与制造合作伙伴携手合作,设计并建造工厂。这些工厂将首次完全在美国本土生产英伟达的人工智能超级计算机。

在官方新闻稿中,该公司表示,已经与制造合作伙伴一道启用了超过 100 万平方英尺的生产空间,用于在亚利桑那州制造和测试英伟达的 Blackwell 芯片,并在得克萨斯州生产人工智能超级计算机。

英伟达的 Blackwell 芯片已在亚利桑那州凤凰城的台积电(TSMC)芯片工厂开始生产。英伟达正在得克萨斯州建造超级计算机制造工厂,分别与位于休斯敦的富士康(Foxconn)和位于达拉斯的纬创(Wistron)合作。预计这两家工厂的大规模生产将在未来 12 至 15 个月内逐步扩大。

公告称,人工智能芯片和超级计算机的供应链十分复杂,需要最先进的制造、封装、组装和测试技术。英伟达正与安靠(Amkor)和矽品(SPIL)合作,在亚利桑那州开展封装和测试业务。

英伟达预计将在未来几十年内创造数十万个就业岗位,并推动数万亿美元的经济安全。(来源:IT 之家)

 

英特尔向银湖资本出售 Altera 51% 股份

北京时间 4 月 14 日晚,英特尔正式宣布同私募股权企业 Silver Lake 银湖资本达成 FPGA 子公司 Altera 股份出售协议。Silver Lake 将以 87.5 亿美元的估值买下 Altera 51% 的股份,英特尔继续持有剩余 49% 股份。

这笔交易预计将于 2025 年下半年完成,但须符合惯例成交条件。在交易完成后 Altera 将正式成为最大的独立 FPGA 半导体解决方案公司。

英特尔还宣布,现任 Marvell 美满产品与技术总裁 Raghib Hussain 将接替 Sandra Rivera 担任 Altera 首席执行官,这一任命将于 2025 年 5 月 5 日生效。(来源:IT 之家)

 

苹果调整美版 iPhone 17 生产策略,印度工厂产能已达极限

据媒体报道,苹果利用美国关税的 90 天宽限期,正加紧在印度和越南生产其包括 iPhone 17、MacBook 和 iPad 在内的关键产品。

知情人士透露,苹果今年早些时候已要求主要供应商加大在印度的 iPhone 生产力度,然而由于印度当地工厂产能已达极限,进一步增加产能面临困难。

为此,苹果已协助供应商采购设备,预计此举将使印度的 iPhone 产量增加数百万部。

苹果计划今年在印度生产至少 5000 万部 iPhone,并希望将面向美国市场的大多数新款 iPhone 机型的生产转移到印度。同时,苹果还要求供应商将面向美国市场的大部分 MacBook 和 iPad 的生产转移到越南,苹果还指示供应商将尽可能多的零部件从中国运往东南亚和印度,以增产面向美国市场的各类产品。(来源:快科技)

蔚来单周新增订单突破 9000

据汽车领域博主 @ 孙少军 09 发文,蔚来上周新增大定突破 9000 台,同时声称「本周开始,交付应该就会开始起来了」。作为比较,蔚来 3 月份累计销量为 15039 台(其中蔚来品牌 10219 台;乐道品牌 4820 台)。

本月,蔚来推出购车优惠政策,2025 年 4 月 3 日至 4 月 30 日期间,支付定金购买蔚来 2024 款 ET5、ET5T、ES6、EC6、ET7、EC7、ES8,即可享受 240 张免费换电券、5 年 0 息金融优惠等购车礼遇。

此外,蔚来李斌今天宣布该公司在上海迎来第 10 万台量产车交付,目前蔚来在江苏、浙江、上海三地累计交付量已突破 30 万台。(来源:IT 之家)

 

索尼上调多地 PS5 售价

近日,索尼在 PlayStation 官方博客宣布,其旗舰游戏机主机 PlayStation 5 在多国上调售价,因「经济环境充满挑战」。

在欧洲市场,PS5 数字版的价格从原先的 449.99 欧元上涨至 499.99 欧元,涨幅超 11%;英国的建议零售价从 389.99 英镑上涨至 429.99 英镑,涨幅超过 10%。

东京游戏咨询公司 Kantan Games 首席执行官 Serkan Toto 告诉媒体,索尼很可能也会在美国上调 PS5 价格,「如果索尼能在美国维持当前价格,我会感到非常惊讶。」上周,有分析师将美国游戏机价格上涨 30% 作为基本预期,并预计此举将引发全球游戏机价格重新定价。

两周前,任天堂正式发布了 Switch 2。最具争议的是,Switch 2 的「日本特供款」定价为 49980 日元,多语言版本的定价则为 69980 日元,高出了 40%。(来源:财联社)

小米 YU7 内饰谍照再更新,环视投影屏日间效果首次曝光

近日,网络上再次曝光了小米 YU7 的内饰谍照,这次的图片不仅展示了车辆的细节,还首次展示了环视投影屏在日间的显示效果。从谍照来看,新车的内饰设计延续了小米一贯的科技感和简洁风格,方向盘采用普通皮质双色配色,与此前曝光的碳纤维+翻毛皮版本有所不同。

方向盘上的按键布局与之前版本基本一致,左右侧为滚轮按键,下部两侧为辅助驾驶模式和驾驶模式切换按键,三幅式设计上部还带有方向盘回正标记。

此次曝光的谍照中,环视投影屏的显示效果尤为引人注目。

该投影的类似于 HUD 抬头显示,该屏幕能够清晰地展示速度、挡位、多媒体信息和导航等,信息全面且直观。中控台配备了一个方形屏幕,下方是两个无线充电面板,后部是杯架和中央扶手箱,底部还设计了巨大的储物空间,整体布局与大多数新势力车型相似。(来源:快科技)

 

全新一代电动MINI JCW上市

4 月 14 日,MINI 旗下全新电动 MINI JOHN COOPER WORKS 和全新电动 MINI JOHN COOPER WORKS ACEMAN 正式上市,两款新车均搭载纯电动力。

车身尺寸方面,纯电 MINI JCW 长宽高分别为 3863/1756/1458mm,轴距为 2526mm;纯电 MINI JCW ACEMAN 长宽高分别为 4094/1754/1515mm,轴距为 2606mm。

续航方面,纯电 MINI JCW 配备 51.497kWh 三元锂电池,CLTC 工况下续航里程达 412 公里;纯电 MINI JCW ACEMAN 的续航里程则达到 450 公里。

纯电 MINI JCW 限时礼遇价 22.48 万元起,纯电 MINI JCW ACEMAN 限时礼遇价 23.99 万元起,并享受价值 15,000 元选装包赠送金限时礼遇。(来源:太平洋汽车)

世界上首个能爬的无线仿生手诞生

英国一家初创公司 Open Bionics 在本月推出了世界上第一款无线仿生手,该手在脱离穿戴者后仍能工作。

Open Bionics 公司花费了四年时间研发其最新的 Hero 仿生手,声称这是世界上最先进的仿生肢体。

Open Bionics 的联合创始人兼首席执行官 Samantha Payne 介绍称:「这是目前最先进的仿生手,速度和强度是同类产品的两倍,同时也是市面上最轻便的手,还是首个完全防水和无线的手。」

该设备使用无线肌电图电极 MyoPods 控制,这些电极位于截肢者的手臂上,读取他们的肌肉信号,然后这些信号被用来控制仿生手指的运动。此外,用户可以摘下自己的仿生手,让它在地上爬过去再爬回来,并通过无线传感器来控制它。

Hero 仿生手最新产品包括 Hero RGD 和 Hero PRO 两款,主要功能包括 35 公斤的举重能力、360 度手腕旋转,以及无线 MyoPod 传感器。这些设备还提供可更换的磁性外壳,搭配仿生机械臂还具有官方漫威、星球大战和迪士尼主题设计版本。(来源:IT 之家)

华为 Pura X 的这块屏幕,改变了什么?

如果你还对以黑莓、诺基亚为代表的早期智能手机有印象的话,那时智能手机屏幕多采用 3:2 或 4:3 的比例,后来才是 16:9 逐渐成为主流。

随着屏幕技术、乃至全面屏概念的进步,屏幕比例不断突破,18:9、19:9 甚至更高的比例接连涌现。如今,市场上的主流设计以 18.5:9、20:9 乃至 21:9 为主,而新发布的华为 Pura X 又是其中的另类:凭借其独特的 16:10 可折叠屏幕,为用户带来了与众不同的体验。

除此之外,华为 Pura X 还拥有上下对折的形态、全新的外屏设计,以及首次搭载的鸿蒙 5 系统和升级后的小艺 AI 功能等亮点。这些特性叠加在一起,让人对这款产品充满好奇。通过实际测试真机,可以明显感受到它的诸多独特之处。其中,最令人印象深刻的便是那块 6.3 英寸、16:10 比例的屏幕,这一比例既适合娱乐内容消费,又能满足生产力需求。

华为 Pura X 外屏 | 图片来源:极客公园

尽管 Pura X 的屏幕对角线尺寸与普通手机相近,但其显示面积却得到了显著提升。无论是观看视频、浏览图文、阅读电子书,还是享受游戏体验,它都能带来更强的沉浸感。同时,这款设备兼具便携性与接近传统手机的重量,完全可以作为一台小型平板使用。

与普通直板手机相比,华为 Pura X 的优势在于其「又大又小」的设计理念。这种看似矛盾的特点,恰恰是折叠屏设备的理想形态——它不像大屏折叠机那样显得笨重,同时又比小屏折叠机更适合内容消费与创作,真正实现了「既轻便又高效」的目标。

当然,华为 Pura X 的魅力远不止一块 16:10 屏幕。

 

01

作为第三种选择的「阔屏」
在探讨华为 Pura 这款 16:10 的阔型屏之前,我们不妨先思考一个问题:为什么如今手机屏幕的显示比例大多集中在 19:9 或 20:9 左右?
这个问题其实并不难解答。手机作为一款「手」机,始终需要在便携性与屏幕尺寸之间寻找平衡。由于它是单手握持的设备,手机的横向宽度早已被人类手掌的最大握持范围所限制,大约在 70-75 毫米之间。为了满足用户对更大屏幕的需求,传统手机只能通过纵向拉长屏幕来实现。经过多年的实践,19:9 左右的屏幕比例逐渐成为直板手机的普遍共识。
因为手机尺寸是按照对角线计算的,所以事实的确如此。正是由于这种独特的屏幕比例,使得 Pura X 这部 6.3 英寸手机拥有了与 6.9 英寸的 iPhone 16 Pro Max 相差无几的屏幕面积,前者为 114.89cm²,后者为 115.47cm²,若与同尺寸的 iPhone 16(96.26cm²)相比,屏幕面积更是大了许多。

华为 Pura X 内屏尺寸对比 iPhone16 | 图片来源:极客公园

从这个角度看,许多人眼中的「黄金比例」实际上是一种妥协,而非绝对的最佳答案。尤其是在折叠屏技术日臻成熟的今天,固守 19:9 的比例显得有些因循守旧。

华为 Pura X 外屏尺寸对比 iPhone16 | 图片来源:极客公园

小折叠屏手机可以看作是将传统直板机纵向折叠,以追求极致的便携性。然而在屏幕显示尺寸上,它与传统直板机相比并无明显优势;在显示效率和交互体验上,除了可折叠的形态和额外的外屏外,与直板机也没有本质差别。
而像华为 Mate X6 这样的大折叠屏,则是将两块直板机屏幕横向「拼接」,形成接近 1:1 的内屏比例。在需要单手握持或更适合纵向显示的场景中,它还配备了一个常规比例的外屏供使用。
由此可见,无论是大折叠还是小折叠,当前的折叠屏产品形态依然是以传统手机屏幕比例为基础设计的。

华为 Pura X 即使展开状态下,也是一个会让人立即感受到区别的尺寸 | 图片来源:极客公园

华为 Pura X 显然提供了一种全新的第三种选择。通过突破传统手机屏幕比例的束缚,借助折叠设计,既保留了类似小折叠屏的便携性,又实现了普通直板机和小折叠屏难以企及的更大显示面积。余承东曾表示,华为 Pura X 是一款「别人想不到的产品」。
的确,这需要产品团队具备打破常规的创新思维。
华为 Pura X 这块 16:10 的「阔型屏」究竟有哪些优势?
首先,最直观的感受自然是屏幕变大了。别被 Pura X 6.3 英寸的内屏尺寸误导,以为它只是一款小屏手机。由于比例的变化,这块 6.3 英寸屏幕的实际显示面积甚至超过了许多 6.7 英寸的直板手机。更大、更宽的屏幕带来的视觉冲击力,远超普通直板机。

华为 Pura X 针对外屏使用体验做了众多优化 | 图片来源:极客公园

不仅绝对显示尺寸有所提升,华为 Pura X 的有效显示面积也得到了优化。以观看影视剧为例,大折叠屏接近 1:1 的内屏比例在播放长短视频时,往往因「公摊面积」过大而浪费空间。这是因为当前的影视剧和短视频大多采用接近 16:9 的比例制作,在 1:1 的屏幕上显示时,上下或左右的黑边不可避免。而 16:10 的屏幕在呈现相同内容时,画面能尽量填满整个屏幕,减少浪费。
因此,华为 Pura X 选择 16:10 的比例并非一时兴起,而是深思熟虑的结果。这一比例在「显示效率」和「人眼舒适度」之间找到了平衡,特别适合需要纵向信息密度和横向协作空间的场景。它的优势或许不会立即显现,但长时间使用后,用户会逐渐感受到操作步骤的减少和视觉疲劳的降低,最终形成「用了就回不去」的体验依赖。
华为 Pura X 的另一个常见用途是阅读,其屏幕比例与传统书籍更加相近,因此阅读电子书时会感觉更舒适。与同尺寸手机相比,Pura X 每行能显示更多文字,带来更强的沉浸感。此外,华为还为其引入了 AI 眼动翻页功能,实际体验确实便利,当用户视线移到页尾后再看向顶部时,AI 会自动翻页,免去了手动操作的麻烦。

华为 Pura X 外屏 | 图片来源:极客公园

你会发现,在华为 Pura X 上追剧的实际显示面积与 Mate X6 这样的大折叠屏非常接近。即使播放一些传统 4:3 比例的经典影视剧,Pura X 的 16:10 屏幕相比普通手机或大折叠屏,黑边也明显更少。
不仅是视频,图片显示也有类似优势。手机拍摄的照片默认比例通常为 4:3,这更接近传感器原生比例,能最大限度提升传感器利用率,减少画质损失。然而,在 19:9、20:9 的普通手机或大折叠屏上显示 4:3 照片时,黑边问题普遍存在。而在 Pura X 上,4:3 的照片能被最大化呈现。如果你习惯修图,这种铺满屏幕的显示效果还能减少放大和移动的操作,直接提升使用便利性。
屏幕比例的优势不仅体现在显示效率上,还能助力生产力提升。
日常使用的 Word 文档和 PDF 文件通常遵循 A4 纸的规格,即 1.414:1 的显示比例。在普通手机上查看这类文档时,即便 WPS 等软件能自适应屏幕显示,字体和图片往往会被压缩或拉伸,体验欠佳。而 Pura X 的 16:10 屏幕比例约为 1.6:1,非常接近 A4 纸的原生比例,既避免了屏幕空间浪费,又能以舒适的比例完整呈现文档内容。
双手握持着手机打字,才是一个最直觉的姿态。

华为 Pura X 内屏尺寸很适合双手握持全键盘输入 | 图片来源:极客公园

除了我自己的使用,同事们对这台手机的主要好奇点,也聚焦在它的拍照能力上。
在过去几年中,折叠屏与出色影像似乎总是难以兼得,但华为持续创新,为行业树立标杆,在 Mate X6 系列上,几乎实现了折叠屏手机的顶尖影像体验。可变光圈+潜望式长焦+RYYB 超感光传感器+红枫原色摄像头一应俱全,可谓折叠屏手机的影像巅峰。

华为 Pura X 外屏自拍体验相对更加完善 | 图片来源:极客公园

而华为 Pura X 同样表现不俗,为用户带来了优秀的影像配置,配备 5000 万像素 F1.6 光圈 RYYB 传感器主摄+4000 万像素 RYYB 超广角微距镜头+800 万像素长焦镜头+红枫原色摄像头,样样齐全。

华为 Pura X 内屏拍照体验 | 图片来源:极客公园

02

到底贵不贵?
写到最后。另一个备受关注的问题是:起售价 7499 元的华为 Pura X 到底贵不贵?
虽然 Pura X 与 Pocket 2 分属华为不同产品系列,并非直接的继承关系,但两者在产品形态、用户体验及目标人群上确有一定相似之处。凭借全新的 16:10 屏幕比例,Pura X 在传统竖折叠和大折叠之外,开辟出了一种新的「阔折叠」形态。相比 Pocket 2 这样的竖折叠产品,Pura X 增添了更多轻生产力属性。

外屏也有「生产力」| 图片来源:极客公园

回顾 Pocket 2 的起售价也是 7499 元,而 Pura X 在屏幕、相机、性能、电池和网络等方面都进行了大幅升级,却保持了与前者相同的价格。从这个角度看,Pura X 的性价比相当突出。市面上竖折叠屏能提供的体验,Pura X 基本都能覆盖,甚至表现更优,堪称典型的加量不加价。
在这场鸿蒙生态蓬勃发展的大潮中,华为以 Pura X 为范例,从内容与场景入手,向用户展现了鸿蒙 5 的独特魅力,同时向更多生态合作伙伴敞开合作之门,共同开拓鸿蒙生态的新蓝海。

华为 Pura X | 图片来源:极客公园

对用户来说,通过 Pura X 这一高度适配的内容窗口,能够更深入地体验鸿蒙 5 的终极形态是什么样子,也更能体会到华为 Pura X 相较于市场上其他折叠屏产品的独特优势。
可以预见,随着新形态 Pura X 的上市,再加上 5 月鸿蒙电脑的发布,华为以鸿蒙为核心的 1+8+N 生态将实现全面闭环,华为终端与鸿蒙生态都将迈入全新的发展时代。

为了测试 OPPO Find X8 Ultra,我们租了一架直升飞机

「不分昼夜无论远近」
这是 OPPO 在 Find X6 Pro 时期,关于手机影像能力部分,提出的一句 Slogan。
虽然是一句宣传语,但在当时,更像是一种愿望。虽然仅仅短短八个字,但对于智能手机的影像系统来讲,却代表着数个艰难的挑战——其中最艰难的领域,当属夜间的长焦表现。
而对于 OPPO Find X8 系列而言,在凭借着「OPhone」的综合体验,赢得商业上的成功之后,对于有着一脉相承设计的 OPPO Find X8 Ultra,借此奠定「OPhone Pro Max」在移动影像领域的地位,似乎已经是水到渠成的事。

「OPhone 属于自己的 Pro Max」| 图片来源:极客公园

随着 OPPO Find X8 Ultra 已经在北京时间 4 月 10 日晚上发布,如果是已经在关注这款手机的读者,相比已经看到了不少关于这台手机的夜景人像能力。
但人像显然不是一台力求在摄影领域取得突破的手机的全部。为了验证 OPPO Find X8 Ultra 这次是否真的如 OPPO 宣传的那样,是一次「令人血脉贲张的光学升级」,我决定拿着 Find X8 Ultra,带着它飞上天空,以及去拍各种夜景内容——就和我以往使用相机拍照的场景一模一样。

01

影像能力,带你飞!
 
与前代相比,Find X8 Ultra 这套影像系统,新加入了一颗全新的「丹霞原彩镜头」,实现多模态的色温信息感知,用于实现自然的人像肤色还原——当然也能用于夜景的夜色还原。

OPPO Find X8 Ultra 第一次来到五摄系统 | 图片来源:极客公园

Find X8 Ultra 在模组没变的更厚的前提下,主摄采用了 1 英寸传感器,同时 3 倍潜望支持长焦微距,而 6 倍潜望传感器尺寸和光圈都变大了不少。让夜景长焦拍摄的体验变得更加「顺手」。
除了第一次做到「五摄系统」,Find X8 Ultra 还第一次为影像管家引入「AI 调色师」。可以自主识别拍摄场景的亮度与色彩分析特点,并执行最合适的色调映射与影调映射方案,独立分区调整肤色、夜色、天空色等等,让每一张拍出的色彩,都已经是「专业调色」后的结果。
在这一场景中,我带着 Find X8 Ultra,对拉斯维加斯的夜景进行了一次空中拍摄,以下照片均为 OPPO Find X8 Ultra 原片直出。
长焦除了风光照片,另外一个重要的使用场景就是演唱会舞台拍摄,在超长焦 135mm 焦段下,OPPO Find X8 Ultra 仍然能传统演唱会现场的各种光影和雾气,提供如同望远镜一般的成像细节。

02

不止影像,还有 AI
 
虽然本次内容我想分享的主要是影像体验,但作为持续关注 AI 硬件的从业者,也还是忍不住讲点 OPPO 关于 AI 手机硬件的设计思路——这次最明显的部分,显然是 OPPO 选择用一颗物理实体按键,取代掉原本经典的三段式按键

OPPO Find X8 Ultra 用一颗物理按键取代了三段式按键  | 图片来源:极客公园

与 iPhone 上那颗相同位置的按键一样,OPPO Find X8 Ultra 上的这颗按键同样支持自定义,但它的主打功能却与 AI 有关,它默认提供了名为「AI 一键闪记」的功能。

「AI 闪记」记录屏幕内容的效果  | 图片来源:极客公园

第一次看到类似的功能,还是在同样刚发布不到一个月的 Nothing Phone 3a 系列之上,但类似的应用场景其实我们已经见到不少,就是通过硬件的方式跨越生态上的围栏,快速识别当前屏幕中的内容并专门总结,充当你的第二记忆。
这也从另一个角度解释了 OPPO 在相机控制按键功能上的克制,苹果在 iPhone 16 系列的相机控制按键上,都增加了「视觉智能」这一选项,而 OPPO 反而在相机控制按键的功能上做的非常克制,只提供与摄影相关的功能,并未开放更多的能力给第三方应用。

03

影像超大杯,当之无愧
 
今年是手机影像摆脱「内卷」,真正开始「百家争鸣」的一年:除了已经发布的小米 15 Ultra、OPPO Find X8 Ultra,以及 vivo 即将到来的影像旗舰—— vivo X200 Ultra 这会也已经在网上曝光,分别选择了各自三种不同调性的「差异化」路线,作为在这个市场中突围的方式。
虽然我同样很期待 vivo X200 Ultra 的体验,并且也希望届时能第一时间给大家带来体验,但至少目前,从影像能力来看,OPPO Find X8 Ultra 这台手机,就是当之无愧的超大杯影像旗舰。
虽然这篇简短的体验,目的并不是试图说服你去购买这款 OPPO Find X8 Ultra,但我确实在一周的使用体验中,重新燃起了我对手机摄影的关注、并在这个过程中,越来越多的替代掉我手上相机。
凭借着前沿硬件 + AI 能力在手机影像领域的不断深入,OPPO Find X8 Ultra,真的有在提供接近专业相机、甚至在某些场景中超过专业相机的摄影体验。
如果「不分昼夜、无论远近」这句曾经只是 OPPO 的一句口号,在提出的当时并没有被实现,那现在,在 OPPO Find X8 Ultra 发布后,按照我的标准来评判,Find X8 Ultra 做到了。

在我的日常使用中,OPPO Find X8 Ultra 正在越来越多取代专业相机的地位| 图片来源:极客公园

相信看完样张之后,你也能得到一个属于你的答案。

解秘阿里 AI 战略:从未发布,但已开始狂奔

2025 年春节,整个中国科技圈估计都没过踏实。DeepSeek 以所有人意想不到的方式,掀翻了大模型产业的桌子。

 

虽然这已经是几个月前的事情了,但这件事的连锁反应影响深远。公众和媒体更多在关注创业公司,比如「AI 几小龙」们的变化,但其实给国内「大厂」们带来的冲击同样巨大。

比如百度开始悄悄调整为开源模型的策略、取消文心的订阅费,集成 DeepSeek-R1 进一步发力「搜索」这个根基业务;比如腾讯一反佛系和谨慎,第一时间在包括微信的应用全家桶里深度集成 DeepSeek-R1;再比如据说字节开启了深度反思,在已经有了足够决心「All in 大模型」后,怎么才能在技术提升的效率,和对业务需求的支持中有效做好平衡。

过去两年来,AI 领域动不动就变天已经是行业日常了。我想起了今年初在北京举办的英伟达答谢宴上,Manus 首席科学家季逸超(Peak)问黄仁勋,AI 领域接下来发生什么事情会让他觉得意外和惊讶。老黄的答案是「nothing」——这就是个不可预料的产业阶段。

小公司都是拼敏捷和速度的,这波冲击的影响其实还好。但是对大厂来说,我觉得挑战可能更大些,因为管你是不是有个庞大的「战略部」,怎么在不可预料的产业发展阶段,为一个庞大的组织定战略,必定是个很「酸爽」的挑战。

过去几个月,在财报会等这样的场合,国内大厂逐步对外放出自己的 AI 战略,但大多比较碎片。我最近集中研究了一下阿里,发现它的这些战略碎片已经能有效「拼图」成一个比较明确的画面,一些战略意图正在「水落石出」。

客观说,阿里没有真正「发布」过自己的 AI 战略。但我觉得,阿里可能是国内第一个形成明确的 AI 3 年计划和 10 年目标的巨头。更重要的是,似乎阿里内部已经悄悄全体系地对齐完目标和任务,开始大军团的行军。

这个「大厂」在 AI 时代的目标和行动,必然对产业带来影响,今天不妨就这个我拼图拼出来的「阿里战略」,拿出来大家一起讨论讨论。

先说个简单纲要。如果套用「使命、愿景、价值观」这个行话,来定义下阿里巴巴在 AI 时代的「目标,结果和方法」,它大概是:

 

  1. AGI 必须是阿里巴巴追求的首要目标

  2. 阿里巴巴一定要成为亚洲最大的 AI 时代基础设施和最佳 AI 实践

  3. 开源!开源!开源!

 

01

 

AGI,为什么必须是阿里

在 AI 时代最重要的战略目标

 

估计很多人都看到了阿里在今年开年的财报季上重回高增长。阿里云的 AI 相关产品更是连续六个季度保持三位数百分比的增速。在这个财报会上,CEO 吴泳铭第一次系统讲了,AI 时代阿里要基于自身的能力优势和禀赋,抓住哪些机会。

先来看下阿里目前在 AI 产业的实际状况:眼下,阿里云、Qwen 模型家族及其开源生态、再加上淘天和夸克等诸多 ToC 应用场景,让阿里至少是亚洲市场上最不可小觑的 AI 领域的玩家。这必然是阿里在当下判断自身 AI 机会的起点,也是未来三年乃至十年的机会。

另一方面,阿里「让天下没有难做的生意」在 AI 时代的延长线,必然还是要为千行百业的 AI 创新和转型提供基础设施。这意味着,从算力到模型再到应用的每一层平台型机会——阿里云、Qwen 模型家族及其开源生态、应用平台都需要持续进化。

而这次财报会上,吴泳铭明确了在手里的牌和未来的产业目标之间,最重要的那个任务——他的原话是:「第一个目标,必须以追求 AGI 的实现,不断追求突破模型的智能能力的边界」。

阿里这个级别的大厂说会「努力追求 AGI」,这不新鲜,也确实有资格说。但阿里说这句话到底有多认真,可能还是要看下这件事对阿里巴巴实际的意义。

其实这波 AI 浪潮出现后,这个技术变量对国内大厂们的心理投射可能是不同的。今天先不说字节和腾讯的「心理状态」是什么样的,反正我觉得对阿里来说,AGI 是阿里业务「转守为攻」的关键方向,这是它必须坚决以 AGI 为第一目标的原因,甚至没有退路。

多年来,随着拼多多和抖音电商的崛起,阿里电商领域的阵地都是在被「进攻」,是明显的守势。而另一个重要业务云计算也类似,阿里云同样走过弯路,之前一段增速常年维持在个位数,这也给了火山引擎、百度智能云等更多力量「小刀割肉」的空间。

「守」意味着什么?「小刀割肉」意味着什么?估计没有人比阿里更知道这种被动的无奈滋味。2023 年 11 月 29 日,阿里市值即将被拼多多反超时,阿里内网上流动的一条条帖子,写满了一个个曾经的骄傲少年落寞、无奈与不甘的样子。也是在那个晚上,阿里的创始人马云罕见发声「坚信阿里会变,阿里会改」。

而他的下一句话是 AI 电商时代刚刚开始,对谁都是机会,也是挑战。

守是守不住的,那么怎样攻出去?就在这个时间点,时代给了阿里一个新的变量——AGI。说的更明确点,通用人工智能就是一次根本性的生产力升级。一切业务竞争、产业格局、利润和商业模式,归根结底都是「生产关系」,而生产力的根本性变化,才是改变原有态势的最重要突破口。

很多人应该都记得阿里巴巴联合创始人、董事会主席蔡崇信提过内部对「过去几年阿里落后了」的反思,他提到本质是忘记了真正的客户是谁,比如没有给使用 App 进行购物的用户提供最好的体验,没有真正关注给用户创造价值。

而所谓「忘记了」,其实就是在对应目标上「资源投入不足」。商业世界的真相是,一个组织能与时俱进地不断创新,保持引领时代,较少来自于「高瞻远瞩」的某个神级决策,更多是长期在正确的方向上,有持续的足够资源投入,甚至是「有意义的浪费」。

任何公司都是有限资源,在被越来越多力量「小刀割肉」的环境下,寸土必争地死守阵地,被动的应对和条件反射型的追赶,是不能逆转局面的,这是被分割包围的死局。今天阿里巴巴需要集体突围,恰恰需要回到当年创立时候的能量场——就像那时候用互联网这样的先进生产力获得「无限资源」,未来无论是交付更好的用户体验、带来更高的运营效率、还是让用户、商家和平台,这个商业系统里的每一方都获得更大收益,都需要新的生产力增量,那么就只有提升生产力才能真正解决问题。

说到底,「追求 AGI」之所以必须是阿里巴巴在这个时代的第一个目标,就是阿里巴巴意识到当年他开启的革命,还远远没有胜利。必须要抖擞精神,回到阿里巴巴的原点,继续用「先进生产力」把革命进行到底。

因为唯有一直做革命者,才不会被革命。

 

02

 

三年 AI 基建期,要实现什么目标?

 

大逻辑梳理完,我们不妨看看阿里有什么可以看到的明确目标。目前看,未来三年将会是阿里巴巴重要的 AI 基建期。

结合阿里的业务特征和 AI 战略,吴泳铭也在今年 2 月的财报会上给出了更进一步的战略地图。其中最明确的是未来三年,阿里将在三大领域加大投资力度:

  • AI 和云计算的基础设施建设;

  • AI 基础模型平台以及 AI 原生应用;

  • 现有业务的 AI 转型升级。

 

在这之中,AI 基础设施是当下最确定的机会,吴泳铭给出了明确的投入预期——未来三年,是阿里集团历史上云计算和 AI 基础设施建设周期最大、最集中的三年,将投入超过 3800 亿元,用于建设云和 AI 硬件基础设施,总额超过去十年的总和。

这笔明确的投入预期,源于阿里云 AI 相关产品收入连续六个季度三位数同比增长背后看到的行业信号,客户需求持续增长,而且增速超越原先判断。尤其今年春节后,DeepSeek-R1 带动了整个行业 AI 推理需求的激增。阿里云新增的客户需求中 60%-70% 以上都是用在推理上。

其实拉远看,当 AI 从训练扩大到推理阶段,AI 云计算的需求空间和机会才刚刚开始。

过去两年半,从 ChatGPT 带来的生成式 AI 计算,到 Deep Research、Manus 所代表的 agent 计算,再到未来 AI 改变物理世界的具身智能和自动驾驶,每一次 AI 技术迁移和成熟,都会使得计算量指数级增长、再增长。

不说远的,现在问一次 ChatGPT 推理成本几乎为 0,但问一次 Manus 需要 2 美金,因为后者会不断把上一个 token 作为下一个 token 生成时输入的上下文,进行感知、规划、行动一步步推理出来,一次提问背后是数十上百次推理模型的调用和计算。

AI 推理带来的新机会和空间,也意味着眼下正是 AI 云计算巨变的窗口期,推动供给侧 Infra 层计算架构的优化和升级。换句话说,上一个时代既有的计算解决方案,未必就是新时代里最好的选择,创新空间巨大。

比如 DeepSeek 在 Infra 上取得的成效,意义不亚于 DeepSeek-R1 的发布。DeepSeek 的做法提出了 AI 时代 Infra 优化的目标:通过软硬一体优化,而非买最昂贵的硬件,AI 计算能够做到什么程度的极致利用率,来提高单位时间的 token 吞吐量、降低计算时延。这也决定了推理成本的降低以及 AI 应用的进一步渗透。

两年前,我去硅谷拜访 SambaNova 时,听创始人&CEO Rodrigo Liang 讲要从软硬一体的整体设计来满足 AI 时代的计算需求时,推理计算的优化还没有现在这么刚需。现在 SambaNova、包括其他云厂商、芯片公司、推理算法公司、模型公司都发力 AI Infra,风起云涌中也有一批新公司像 Fireworks、Groq、Cerabras 等正在赢得越来越多 AI 应用开发者的采用。

国内也是这样,AI Infra 公司是过去两年最热门的创业项目,芯片、互联、推理算法、异构计算集群等等都在 AI 新技术下,迎来升级的新机会。

阿里这样的巨头,在 AI Infra 风起云涌的巨变时刻,未必能做到创业公司的机敏,那么就应该做好大公司的份内事——在一切未知、一切未定之时,投入就是最确定的事。而亚洲最大云厂商的 ToB 基因,也会让阿里在探索 AI 时代云计算时有更多优势。在我看来,这才是阿里三年投入 3800 亿的战略坚决背后的逻辑。

当然,对于未来三年集中建设周期的这笔投入,阿里大概率是看到了明确的路径来同时转化和促进业务。

第一:让 Agent 能力「钉」进产业。

对于阿里云服务的 SaaS 和企业内部软件客户来说,他们正在经历从提供工具到提供生产力的转型期,AI Agent 让这群软件公司可以直接交付可靠的结果。在可见的未来,很多企业内部的系统都会逐渐变成由相当多的 AI Agent 互相连接、互相调用,来帮助企业提效,甚至能够帮助企业完成一些非常重要的决策工作。这里面有相当多 SaaS 软件以及背后的 PaaS 各方面升级的机会。

同时,AI 时代,钉钉在整个企业软件市场以及企业协同市场,可以成为新的入口和界面、形成与其他软件生态或者说 AI Agent 的有效协作,这会进一步增加对云计算的需求。当然这个的前提,是钉钉需要更加锐利地推动「从提供工具到输出生产力」的产品变革。

可以预料,未来一段时间,钉钉需要重新聚焦到产品,带动云的价值不是目标,而是把产品做好的结果。

第二,通过加速模型技术、建立开源领导力,寻求生态和云能力的价值。

其实这个增长路径在过去阿里云的表现上被验证了,极客公园社区的很多创业者和开发者都跟我分享,别看开源模型好像不赚钱,只图技术品牌,但其实,Qwen 系列开源模型给阿里云带来了实实在在的收入增长,可以说是过去一年多阿里云最好的销售。

Qwen 开源模型家族的采用率其实很高。因为相比于一个通用的模型 API,大部分企业会基于开源模型结合自己的场景数据做进一步开发,高效、优质的 Qwen 开源模型几乎是最受企业和开发者欢迎的模型。根据全球最大 AI 开源社区 Hugging Face 的数据,截至 2025 年 2 月,阿里云通义千问(Qwen)开源大模型的衍生模型数量已突破 10 万,稳居全球最大开源模型榜首。

选择了 Qwen 开源模型,部署在哪朵云上?一个很自然的选择就是购买阿里云,因为使用整个通义以及通义的衍生模型,在阿里云上面运行效率最好。

同时,在后训练这个阶段,对于模型定制化以及能够适应各个不同行业,甚至不同的私有化数据,会有非常大的市场空间,这上面会产生非常多的创造价值的空间。未来也会有非常多的专业模型或垂直模型托管在云上,这是 Qwen 开源生态繁荣的另一个好处。

现在,随着开源模型的迭代速度,基座大模型上大家的差异其实在慢慢变小,开源模型变得越来越可用。再加上基于 OpenAI o1 或者 DeepSeek-R1、QwQ-32B 这样的推理模型成为主流,所需要的云计算只会越来越多。因为无论开源还是闭源,最终大部分模型都要托管在云上。因为这么巨大的模型所计算的量,只有在云计算网络上才会具备最高的效率。通过遍布全球的数据中心,才能以更快速的方式输送给全球的应用开发者。

第三,MaaS 会成为云的商业模式中非常重要的组成部分。

尽管大部分企业客户会基于 Qwen 开源模型做后训练和二次开发,但也有不少开发者会选择「模型即服务」,通义 API。从阿里云过往 6 个季度的增长看,使用通义 API 的客户,会带动相当多其他云产品的使用,这是非常明显的客户关联销售的效果。所以某种程度上,通义虽并不见得直接带来非常大的收入,但对于云的商业模式来说是非常重要的组成部分。随着模型能力的持续提升,以及未来客户需求的提升,API 收费也还是会作为模型最基础的变现方式存在。

所以对阿里而言,无论未来模型能力和 AI 应用如何演进,AI 和云计算基础设施都有非常明确的商业模式,那就是云计算网络。如果人工智能是未来最大的商品,类比电的话,那么云计算网络就类比于现在的电网。

同时,AI 时代,云计算仍是比拼规模效应和网络效应的生意。尤其现阶段规模效应非常重要。上述三种明确路径带动阿里云持续做大规模,一方面会带来更多客户或者客户使用场景,另一方面也会改善整体投入成本。

 

03

 

要改变世界,先改变自己:

阿里需要在 AI 时代成为榜样

 

AI 基础大模型和原生应用是阿里在 AI 时代的第一战略目标,AI 基础设施是确定性的机会和投入。眼下,阿里还有自己的「修炼」——阿里电商和其他互联网平台业务,需要在 AI 时代的新机会面前,依旧闪耀成榜样。

眼下,AI 技术升级,为阿里众多的互联网平台业务带来了大幅提升用户价值的机会。从这个角度出发,阿里也将持续提升 AI 应用的研发投入以及算力投入,运用 AI 技术深度改造升级各业务,把握 AI 时代的新发展机遇。

其实在阿里生态系统内,+AI 的动作一直很积极,即便去年 OpenAI o1 出现之前,行业在怀疑「预训练放缓、AI 的能力上限是不是就这样了的」那段时间,各个应用也没有放缓+AI 的脚步,而是从业务本身服务好用户的角度持续渗透 AI。就拿钉钉来说,从 2023 年的智能助手「斜杠」到今年企业内的 AI 搜索和 Agent 能力,明显能帮我更顺手地完成很多工作了。

结合目前 AI 技术能实现的能力,目前,阿里对于 AI 应用突破大概有三个明确的方向:

首先是生活消费的入口,这也是阿里的根基。

今年 2 月,阿里巴巴电商事业群 CEO 蒋凡在财报会上表述国内电商要提升用户体验和粘性、提升营商效率,中长期目标是健康的稳定市场份额。

在这些目标上,据阿里内部消息说,AI 正在开始发挥作用。最近在 AI 技术的改造下,淘宝在加强与消费者的互动和促进交易效率方面都有相当大的提升,淘宝内部也有很多在研发的项目,预计 2025 年会逐渐推出。总体的方向是,阿里判断 AI 技术在购物决策相关的很多消费领域的应用上,对于淘宝的用户的价值提升有非常大的空间。

第二个阿里的「突出部」,是很多人还没有真正认真观察的夸克,这个产品可以说是阿里集团内部第一波冲到大众面前的 AI 产品。过去一年半,夸克围绕几千万互联网最年轻的一群用户加速迭代,产品的目标很可能已经是「用 AI 能力把自己升级为国民级工具」。

目前阿里集团内部定义的 AI to C 产品,主要是夸克和通义两个 App。夸克事业部成立于 2021 年,是当时的智能信息事业群中最被重视的业务之一。2023 年,在 AI 驱动的战略下,夸克也被提升为阿里第一批战略级创新业务。

现在夸克在 AI 搜索领域应该已经是中国用户量最高的了。这里面 AI 大模型的应用对于用户搜索、生产力创作、工作提效,都有非常大的提升空间。比如最近夸克最新拿出来的「AI 超级框」,让用户看到了夸克作为超级生产力工具和 agent 的雏形,因为已经可以看到通过整合记忆功能和各种工具能力,提供了个性化服务。

随着夸克的业务机会进一步明晰,夸克明显也从集团创新业务,逐步上升为战略产品。证据就是在今年 3 月的最新组织调整后,阿里集团智能信息部总裁兼夸克 CEO 吴嘉,开始直接向阿里集团 CEO 吴泳铭汇报,强化夸克作为阿里 AI 旗舰应用的定位。

而阿里巴巴第三个 AI ToC 应用大概率就是高德,目的应该是探索用 AI 建立生活服务的新生活方式。

作为拥有 1.7 亿以上 DAU 的产品,高德对用户现在更多是导航工具,但未来肯定希望通过 AI 技术的应用,成为生活服务的入口。

就拿最近大火的 MCP(Model Context Protocol,模型上下文协议)来说,这是由 Anthropic 于 2024 年推出的协议,它如同模型界的 Type C,为 AI 模型与各种外部数据源和工具之间搭建了桥梁,能让不同 AI 模型、软件工具和数据源实时理解彼此意图,自动组建任务协作网络。

很多人不知道,其实高德 API 是国内最早全面兼容 MCP 协议、推出 MCP Server 的。借助这一协议,高德将自身的地图服务与智能算法进行整合,以简单易用的地图服务接口。在这之后,很多企业和开发者在各种 AI Agent 应用中通过 MCP Server 直接调用了高德基于位置的各种服务。

当然,淘宝、夸克、高德这些只是阿里内第一批看到 AI 时代互联网平台产品的机会。随着 AI 大模型具备越来越强的智能能力,阿里的 ToC 平台机会估计还可能有很大不同。但毫无疑问,ToC 平台,也是阿里在 AI 新时代需要持续保持优势的战略重心。

而这里面除了阿里自己的探索,我觉得不排除也会开启投资——收购的外部通路。这会和目前国内比较积极的字节跳动,形成产业内两个「新动力」,对中国的 AI 创业者们可能也是好事。

至此,阿里巴巴在 AI 时代第一版本的「未发布,但正执行」的整体战略,大概已经完整呈现出来。客观的说,这个战略其实也没有太多出人意料的地方,大多是符合逻辑推理的必然。

但对阿里巴巴来说,一个从「被动应对」到「主动建设」的业务态势正在形成,让一个庞大的体系尽早完成「统一思想向前看」,这可能是迎接一个新时代最好的姿势吧。

OpenAI 用户或达 8 亿,本周曝新模型;欧盟或取消中国电动汽车关税;人类一生所学不过4GB,比 U 盘更小

Sam Altman:OpenAI 本周将发布「很多」精彩的产品

4 月 14 日消息,北京时间今天凌晨,OpenAI 创始人兼首席执行官 Sam Altman 在社交平台 X 上发文宣布:接下来的这一周,将发布很多精彩的产品,从北京时间周二开始。

就在本月初,Sam Altman 曾透露可能在数周内发布 o3 和 o4-mini,未来几月内发布 GPT-5。

Sam Altman 称,这是为了能够使 GPT-5 比最初设想的更好。团队还发现,顺利整合所有内容比想象的要困难,希望有足够的产能来支持预期的需求。目前 ChatGPT 周活跃用户数已经突破 4 亿,Sam Altman 表示,全球有 10% 的人使用 OpenAI 的产品,这意味着其用户数量接近 8 亿。(来源:IT 之家)

苹果在印度生产了价值 220 亿美元的 iPhone

在截至 3 月的 12 个月里,苹果公司在印度组装了价值 220 亿美元的 iPhone 手机,产量比上一年增加了近 60%。知情人士称,这家总部位于加利福尼亚州库比蒂诺的公司目前在南亚国家生产 20% 的 iPhone,即五分之一。(来源:财联社)

 

苹果因 Siri 功能延迟在美国和加拿大面临更多集体诉讼

据称在 Apple Intelligence 的生成式 AI 功能的支持下,Siri 即将推出一个经过高度改进的全新版本。不幸的是,这些功能将推迟到明年。

AI 遇挫之后,苹果公司遭遇了一场诉讼,但这远非法律后果的结束,因为苹果公司在美国和加拿大又遭遇了两起集体诉讼。

在一项集体诉讼中,原告表示,如果苹果没有利用围绕改进的 Siri 功能的虚假营销宣传,他们就不会考虑升级到新的 iPhone 16 系列。

由于 Siri 新功能的推迟发布,苹果公司还被迫撤下了 由贝拉·拉姆齐主演的广告,该广告展示了升级版语音助手的实际效果。两名原告本周向加州联邦法院提起集体诉讼,指控这家加州巨头通过营销尚未推出的功能,违反了虚假广告和不正当竞争法。同样,上周在加拿大也发生了一起针对苹果的集体诉讼。

假设法官认定苹果公司违法,他们可能会强制该公司向所有购买 iPhone 16 并希望体验新 Siri 功能的诉讼成员进行赔偿。(来源:科普中国)

杰克·多西和伊隆·马斯克希望「废除所有知识产权法」

Twitter(现为 X)和 Square(现为 Block)的联合创始人杰克·多西 (Jack Dorsey) 发表了一篇简短的帖子,宣称应「废除所有知识产权法」,引发了整个周末有关知识产权、专利和版权的争论。X 现任所有者埃隆·马斯克很快回复道:「我同意。」

这些评论发表之际,包括 OpenAI 在内的人工智能公司正面临多起诉讼,指控他们侵犯了版权来训练他们的模型。

埃德·牛顿-雷克斯(Ed Newton-Rex,其创办的非营利组织 Fairly Trained 为尊重创作者权利的人工智能训练实践提供认证)将多西与马斯克的对话描述为「科技高管向那些不希望自己毕生心血被掠夺牟利的创作者宣战」。

作家林肯·米歇尔 (Lincoln Michel) 写道:「如果没有知识产权法,杰克和埃隆的公司就不会存在」,并补充道:「他们就是讨厌艺术家。」

多西在随后的回复中详细阐述了他的立场,他写道,有「更好的模式来支付创作者的费用」,同时声称「目前的模式从创作者身上榨取了太多,而且只会寻租」。(来源:cnbeta)

 

滴滴宣布投入 20 亿稳就业促消费 积极应对外部挑战

4 月 12 日,滴滴宣布将追加投入 20 亿元专项资金,聚焦「稳就业促消费」以及助力制造业「走出去」,发挥平台企业责任,积极应对外部不确定性带来的挑战。滴滴表示:

一、2024 年已有数百万网约车司机通过滴滴获得收入。2025 年滴滴将追加投入 10 亿元,通过增加补贴、优化收入和权益保障等举措,帮助出口重点区域的新增司机群体实现顺利过渡,继续发挥平台就业「蓄水池」和「稳定器」功能。

二、出行消费作为服务消费的重要组成部分,具备显著乘数效应。为进一步激发出行活力,滴滴将在 2025 年追加投入 10 亿元用于乘客补贴,稳定司机收入水平的同时,提升用户出行频率,有效带动关联消费活力。

三、滴滴计划于 2030 年前在墨西哥市场引入 10 万辆国产电动车;同时依托滴滴巴西旗下「99 出行」,协同建设 1 万个国产公共充电桩,助力中国新能源产业走向全球。

滴滴表示将发挥平台优势,通过务实举措稳就业、促消费、拓市场,与社会各界携手应对好外部挑战。(来源:极客公园)

 

欧盟或取消对华电动车关税,中国车企入欧加速破局

欧盟对中国电动车征收高关税出现了反转迹象,或重塑中欧汽车业的竞争格局。中欧双方团队就电动车谈判开始接触。

据路透社报道,当地时间本周四(4 月 10 日),欧盟委员会发言人罗夫斯基斯表示,欧盟和中国已同意研究为中国制造的电动汽车设定最低价格,取代欧盟 2024 年对中国电动车加征关税的方案。

4 月 8 日下午,中国商务部部长王文涛与欧盟委员会贸易和经济安全委员谢夫乔维奇举行视频会谈。据商务部发布的消息,双方同意尽快启动磋商,深入讨论市场准入相关问题,为企业创造更有利的营商环境,并立即开展电动汽车价格承诺谈判,以及讨论中欧汽车产业投资合作问题。

「相比于强行征收关税,为电动车设定最低价格是双方自愿的协议,两者不是一个层级的东西。对于企业来说,征收高关税需要牺牲自己的利润,而设定最低价格对车企产品利润率的保持是有好处的。」格罗伯达亚太汽车市场预测总监曾志凌对第一财经记者表示。

燃油车时代,欧洲市场门槛较高,中国车企难以进入。随着电动化时代来临,中国汽车出口到欧洲市场的数量开始增多。今年 3 月份,小鹏汽车宣布成功进入波兰、瑞士、捷克、斯洛伐克市场,旗下小鹏 P7、小鹏 G9、小鹏 G6 计划于 2025 年第二季度开启销售。而比亚迪已经在欧洲匈牙利建立了工厂,长期目标是通过在匈牙利生产其整个欧洲产品阵容以免于受到进口关税的影响。(来源:第一财经)

电动摩托车续航最长吉尼斯世界纪录诞生:Verge TS Pro 一次跑出 310.6 公里

4 月 13 日消息,据外媒 Carscoops 报道,Verge 品牌的 TS Pro 纯电动摩托车创下了吉尼斯世界纪录,成为电动摩托车行驶最远距离的纪录保持者。它在 16 个小时内环绕伦敦行驶了 310.6 公里,结束时电池仍剩余 7% 的电量。

电动摩托车的普及速度远逊色于电动汽车,部分原因在于电池组重量较重,而在两轮车上,重量是关键限制因素。TS Pro 配备了后轮的「无轮毂」电机(hub-less electric motor),功率为 137 马力,扭矩达到 1000N・m。仅需 3.5 秒便可加速至 100km/h,表现足以与某些高性能跑车媲美。其重量为 245kg,在同类尺寸的摩托车中算是偏重,但依然在可接受范围内,官方续航为 350km。

为了验证 TS Pro 在现实中的表现,Verge 邀请了两位摩托车网红,带着他们在伦敦市区以平均时速 19km 的速度骑行 16 小时。最终,他们成功骑行了 311 公里,创下了新纪录。(来源:凤凰网科技)

 

星纪魅族 StarV Air2 智能眼镜海外版新增阿拉伯语翻译功能,4 月底正式发布

4 月 13 日消息,据星纪魅族官方消息,StarV Air2 海外版新增阿拉伯语翻译功能,将于 4 月底正式发布,该产品已支持 14 种语言实时翻译。

星纪魅族 StarV Air2 智能眼镜于去年 9 月在国内发布,新品首发价 2799 元起。该产品采用光波导显示方案,整机重量仅 44 克,采用一体式近视镜设计,提供官方配镜服务,有棕黄两色可选。

StarV Air2 使用了星纪魅族自研的 StarVision 显像系统,超小体积单绿光引擎,支持 2000nit 高亮显示,采用滚轮交互,功能方面支持实时翻译、闪念速记、会议助手、AR 导航等。(来源:网易)

人类一生所学不过 4GB,加州理工顶刊新研究引热议

24 小时不间断学习且不遗忘,一辈子也只有 4GB 的「知识储量」?

一项来自加州理工学院在《Neuron》杂志上发表的研究,它提出了一个发人深省的悖论:

人类信息处理速度仅为每秒 10bit,而我们的感官系统却能以每秒 10 亿 bit 的速率收集数据。

假设一个人活到 100 岁,并且每天 24 小时不间断学习且不遗忘,按照每秒 10 比特的处理速度计算,人类一生所能学习的知识总量大约为 4GB。

研究将人类的学习能力与机器学习进行了对比,指出大语言模型每个参数能存储 2 比特的知识,一个拥有 70 亿参数的模型可以存储 140 亿比特的知识,远超人类的学习能力。

人类的感官系统能够以非常高的速率收集数据,但大脑的处理速度却相对较慢。这种矛盾可能源于大脑的串行处理方式以及注意力的限制。

研究提到,马斯克的脑机接口研究可能过于理想化,因为人类大脑的信息处理速度受限于其基本结构,外部设备难以突破这一限制。(来源:量子位)

 

美国对电脑、手机等豁免征收「对等关税」;Ilya 新公司估值达到 2000 亿元;刘强东回应美团高管看衰京东外卖 | 极客早知道

美国宣布对笔记本电脑、智能手机、集成电路等豁免征收「对等关税」

4 月 12 日消息,根据美国海关的最新指南,智能手机和电脑将不受特朗普政府的「对等关税」政策的影响。

新的关税指南还包括对其他电子设备和零部件的豁免,包括半导体、太阳能电池、平板电视显示器、闪存驱动器、存储卡以及用于存储数据的固态硬盘等。

CNBC 提到,苹果的 iPhone 手机等许多电子产品都在中国生产,但报道没有提到中国产电子产品是否在免除范围内。科技网站 wccftech 则称,「根据我们对文件的解读,豁免条款中没有提及针对中国的条款,这意味着来自该地区的智能手机和个人电脑产品不会被征收 145% 的关税。这是一个重大进展。」 (来源:环球时报)

 

蚂蚁集团副总裁、前基础大模型负责人徐鹏离职

4 月 12 日消息,蚂蚁集团副总裁、前基础大模型负责人徐鹏已离职。徐鹏一直从事人工智能领域技术研究,曾在谷歌工作 11 年,负责和领导了谷歌翻译的核心技术研发,并参与了谷歌显示广告系统的算法研发。此前蚂蚁成立 AI 创新研发与应用部门 NextEvo,由徐鹏担任负责人,承担了蚂蚁 AI 的所有核心技术研发,包括蚂蚁百灵大模型的所有研发工作。(来源:财联社)

 

谷歌、英伟达投资前 OpenAI 科学家 Ilya 创立的新 AI 公司

4 月 12 日消息,谷歌、英伟达投资由前 OpenAI 科学家伊利亚·苏茨克沃(Ilya Sutskever)创立的 Safe Superintelligence(SSI)。消息人士称,SSI 最近完成一轮 20 亿美元的融资,由绿橡树资本(Greenoaks)领投,估值达到 320 亿美元。目前,该轮投资具体条款暂无法确定,三家公司发言人拒绝置评。(来源:钛媒体)

 

巴菲特发行 900 亿日元债券,有分析称:可能是逆势抄底信号

4 月 12 日消息,「股神」巴菲特旗下的伯克希尔·哈撒韦公司近日发行了一笔总额 900 亿日元(约合人民币 46 亿元)债券。彭博汇编的数据显示,这是巴菲特的公司自 2019 年进入日本市场以来规模最小的日元交易。

在市场动荡的背景下,此次债券发售受到市场的高度关注,因为伯克希尔筹集的资金可能被用于增持日本公司的股份。有分析称,随着股价下挫,五大商社的估值都有所回落,按照巴菲特「别人恐惧我贪婪,别人贪婪我恐惧」的投资风格,此次发行日元债券可能是逆势抄底的信号,伯克希尔未来大概率将继续增持五大商社股份。(来源:券商中国)

 

苹果手机 9 天涨价 500 元?经销商:有价无市,没人敢收

4 月 12 日消息,在美国新一轮关税的影响下,iPhone 手机也面临涨价的情况。

近日有经销商表示,iPhone 在中国市场的价格迎来了涨价,最近这 9 天涨幅达到了 500 元,这引发了网友的围观。

位于杭州西湖边的苹果直营店店员表示,在售的 iPhone16 等机型按照上市时的价格保持不变。至于新一代的 iPhone17 未来是什么价格、会不会调价,现阶段暂未可知,以届时上新公布的价格为准。(来源:每经)

 

刘强东回应美团高管王莆中:不打口水仗,产生不了社会价值

4 月 12 日消息,今日早间,美团核心本地商业 CEO 王莆中在社交媒体上言词激烈,火药味十足地发文炮轰京东,其称京东不是第一家想做外卖的公司,也可能不是最后一家,「阿里、滴滴、字节不是都做过,滴滴目前在海外也还在做呢。」

今日下午,京东集团新闻发言人齐珊珊在朋友圈发布了与京东集团创始人刘强东的内网对话,并表示:「又上了一课,踏实做事,努力创造社会价值。」

据其朋友圈截图显示,刘强东本人得知今日早间王莆中的言论回应称:要是有空就赶紧去加入「小哥应急小组」,看看有没有外卖或者快递兄弟在大风中遇到困难的!或者去参与出口受阻企业的采购小组工作,尽快给他们提供帮助。

此外,刘强东还表示,「不要和人打口仗,不能产生社会价值。」(来源:新浪科技)

 

美关税系统突发故障,持续超 10 小时方才恢复

当地时间 4 月 11 日,美国海关和边境保护局发布警报,称该部门一个涉及关税豁免的代码出现故障。海关与边境保护局表示,这一故障在持续了超过 10 个小时后被修复。

据悉,出现故障的代码可以豁免本周所有不应受到特朗普政府关税新政策影响的在途货物。故障发生时,美国海关的「自动商业环境」系统无法对在 4 月 9 日以后提交申请的、符合在途条件的货物适用较低的 10% 税率。

美国多位进口商表示,很多进口商难以「弄清楚新关税何时实施」并制定相应计划。

在关税政策引发不确定性和担忧的大背景下,此事是对美国货主和供应链的最新打击。外界也由此质疑美国海关是否有能力落实特朗普的关税新政。(来源:央视新闻)

 

4600 万次下载:ChatGPT 成 3 月全球最受欢迎非游戏类应用

4 月 12 日消息,市场调查机构 App Figures 发布博文,报告 2025 年 3 月全球非游戏应用下载量,ChatGPT 以 4600 万次力压 Instagram 和 TikTok,成为全球下载量最高(仅统计苹果 App Store 和谷歌 Play Store 两大官方应用商店)的非游戏应用。

Appfigures 数据显示,2025 年 3 月,ChatGPT 以 4600 万次下载成为全球最受欢迎的非游戏类应用,超越 Instagram(4600 万次)和 TikTok(4500 万次)。

这一成绩得益于其在 iOS 平台的强劲表现,下载量达 1300 万次,远超 TikTok(800 万次)和 Instagram(500 万次)。ChatGPT 成功登顶苹果应用商店,而 TikTok 仅排第六,Instagram 甚至未进前十。(来源:IT 之家) 

 

史无前例!苹果 18.8 英寸巨型折叠屏来了:明年量产

分析师 Jeff Pu 在报告中表示,苹果两款折叠屏设备的研发工作取得新进展,新品将于明年年底量产,上市时间预计是 2026 年底或 2027 年上半年。

据悉,苹果折叠屏新品有一款是手机,屏幕尺寸是 7.8 英寸,另一款折叠屏尺寸是 18.8 英寸,其定位目前还有争议,Jeff Pu 认为是 MacBook 和 iPad 的混合体,搭载 macOS,支持触控;Mark Gurman 认为是折叠屏 iPad,分析师郭明錤则认为是 MacBook。

目前来看,这款 18.8 英寸折叠屏设备的定位取决于它搭载的系统,如果是运行 iPadOS,它就是折叠屏 iPad,如果运行 macOS,它就是折叠屏 MacBook。(来源:快科技)

 

一加 13T 真机曝光:小直屏设计 + 超 6000mAh 电池,本月发售

4 月 12 日消息,今日,网络上曝光了一加首款小屏旗舰一加 13T 的真机谍照,新机采用直屏设计以及金属直边中框,整机方正硬朗且特别小巧。

据悉,一加 13T 采用 6.3 英寸 1.5K 中置挖孔直屏,边框控制出色,正面 R 角弧度与 iPhone 16 Pro 接近,视觉观感舒适。

一加中国区总裁李杰介绍,一加 13T 定位「小屏大魔王」,在配色上,所有版本都会采用低饱和度设计,呈现出精致且耐看的视觉效果。(来源:快科技)

 

vivo X200 Ultra 手机核心配置公布:6000mAh 蓝海电池、8.69mm 机身

 4 月 12 日消息,vivo 官方今日发文公布了 X200 Ultra 手机核心配置,新机将搭载骁龙 8 至尊版处理器,内置 6000mAh 蓝海电池,支持 90W 有线 + 40W 无线闪充、直驱供电。

vivo X200 Ultra 还将配备超声波 3D 指纹、2K 蔡司大师色彩屏、圆偏振光护眼技术、铠甲玻璃等。另外,新机的机身厚度约 8.69mm。(来源:IT 之家)

 

调查显示当手机电量降至 38% 时 大多数人都会感到恐慌

电池续航时间仍然是智能手机和便携式设备用户最关心的问题。尽管研究人员正在积极探索锂离子电池的替代品,但制造商通常依赖基于软件的解决方案来提高效率。最近的一项研究表明,对电池剩余续航时间的焦虑出乎意料地早早出现,尤其是在年轻用户中。

Talker Research 的一项在线调查发现,美国人平均在手机电量达到 38% 时就开始担心电池续航。有些人可能认为这个阈值比较保守,因为它只反映了剩余电量的三分之一以上。例如,iPhone 通常只有在电量低于 20% 时才会发出警告。

在 2000 名美国受访者中,大多数人表示早在苹果发出 20% 的警告之前就感到恐慌。34% 的用户认为这个弹出窗口会建议启用低电量模式。最不焦虑的群体(13%)直到电池电量低于 10% 才会考虑寻找充电器。与此同时,24% 的受访者在电量达到一半之前就感到不安。(来源:今日头条)

继续反制,中国对美所有商品加征 125% 关税;小米汽车回应 SU7 湛江事故;GPT-4 将退役

继续反制,中国对美所有商品加征 125% 关税

4 月 11 日消息,国务院关税税则委员会发布公告,2025 年 4 月 10 日,美国政府宣布对中国输美商品征收「对等关税」的税率进一步提高至 125%。美方对华加征畸高关税,严重违反国际经贸规则,也违背基本的经济规律和常识,完全是单边霸凌胁迫做法。

根据《中华人民共和国关税法》、《中华人民共和国海关法》、《中华人民共和国对外贸易法》等法律法规和国际法基本原则,经国务院批准,自 2025 年 4 月 12 日起,调整对原产于美国的进口商品加征关税措施。有关事项如下:

一、调整《国务院关税税则委员会关于调整对原产于美国的进口商品加征关税措施的公告》(税委会公告 2025 年第 5 号)规定的加征关税税率,由 84% 提高至 125%。鉴于在目前关税水平下,美国输华商品已无市场接受可能性,如果美方后续对中国输美商品继续加征关税,中方将不予理会。

二、其他事项按照《国务院关税税则委员会关于对原产于美国的进口商品加征关税的公告》(税委会公告 2025 年第 4 号)执行。(来源:央视网)

传字节跳动正在开发 AI 智能眼镜

据 the information 报道,公司字节跳动正计划推出一款人工智能智能眼镜。

目前尚不清楚字节跳动何时发布这款智能眼镜以及销售范围。据知情人士透露,字节跳动正在与供应商讨论产品的功能、技术规格、成本以及发布时间,但公司发言人尚未对此回应。

据透露,字节跳动从去年开始着手开发 AI 眼镜项目,一些新招聘的硬件设计工程师也参与其中。工程师们正在解决诸如如何在不牺牲太多电池寿命的情况下,确保眼镜能够录制高质量图像和视频等技术挑战。(来源:the information)

 

OpenAI:现在只需 5~10 人即可从头重建 GPT-4;GPT-4 将退役

4 月 11 日消息,OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在公司内部播客中披露,得益于 GPT-4.5 的技术突破,重建 GPT-4 大模型所需团队规模已从数百人缩减至 5-10 人。

这一结论也获得了 GPT-4.5 预训练负责人亚历克斯・佩诺(Alex Paino)、数据效率研究员丹尼尔・塞尔萨姆(Daniel Selsam)等核心成员证实。

佩诺表示,GPT-4.5 的设计目标是比 2023 年 3 月发布的 GPT-4"智能 10 倍",他还补充道,"通过这种 GPT 预训练流程的优化,我们的规模也较之前拓展了 10 倍。"

OpenAI 认为,技术瓶颈已从算力转向数据效率领域(可能是指算力的边际效用递减,所以需要从算法方面寻求突破)。丹尼尔指出,当前 GPT 系列模型数据利用率存在 "洞察深度天然上限"。

另外,OpenAI 宣布将于 4 月 30 日停止在 ChatGPT 中使用其 2023 年 3 月发布的 GPT-4 模型,并将其完全替换为当前默认模型 GPT-4o。(来源:IT 之家)

 

消息称 Shein 伦敦上市获英国 FCA 批准,最新估值约 500 亿美元

4 月 11 日消息,有外媒报道称,跨境电商平台 Shein 已获得英国金融行为监管局(FCA)审批许可,待中国监管机构批准后即可赴伦敦进行首次公开募股(IPO)。

报道称,该企业于 2024 年 6 月向英国监管机构秘密递交上市申请文件,其 IPO 估值约为 500 亿美元(现汇率约合 3661.1 亿元人民币)左右。

Shein 是一家总部设在新加坡的中国在线快时尚零售商,前身是由许仰天于 2008 年在南京创立的跨境婚纱电商平台 SheInside,目前已经成为海外最大的电商平台之一。

Shein 没有自己的工厂,目前主要依托中国境内约 5800 家合作商完成商品生产,例如在 150 多个国家和地区销售 10 美元的连衣裙和 12 美元的牛仔裤。(来源:IT 之家)

特斯拉中国停止提供 Model X 和 Model S 新车订购选项

4 月 11 日消息,特斯拉中国官网显示,目前 Model X 和 Model S 车型已不再提供单独的订购新车选项,相应车型页面中仅显示有「查看现车」按钮。而 Model Y 和 Model 3 车型则继续显示「立即订购」选项。

特斯拉官网显示,北京地区一辆 Model S 全轮驱动版「即刻交付」的现车价格为 75.99 万元。

Model S 和 Model X 交付量在特斯拉总量中占比很小。今年一季度,特斯拉交付总量为 336681 辆。其中,包括 Cybertruck、Model S 和 Model X 在内的其他车型,合计交付量仅为 12881 辆,约为特斯拉总交付的 3.83%;Model 3/Y 交付量为 323800 辆,占比 96.17%。

据 IT 之家报道,今年早些时候,特斯拉汽车工程副总裁拉尔斯・莫拉维表示,目前公司并无计划将 Model S 和 Model X 从产品线中移除,今年晚些时候,会再次关注它们,确保它们也能获得一些公司为 Model 3 和 Model Y 所投入的技术升级。(来源: TechWeb)

 

小米汽车回应 SU7 湛江事故:相关火情是碰撞后电动二轮车锂电池严重挤压和变形起火,再引燃事故车辆

4 月 11 日消息,小米汽车发布《关于大家关心问题的回答》,解释了「湛江发生的事故是怎么回事?」以及「事故中汽车为什么会被引燃?」。

公告原文如下:

附警情通报:

2025 年 4 月 5 日 5 时许,陈某(男,25 岁)驾驶小汽车途经徐闻县曲界镇华海农场十四队路段时,与对向车道一辆两轮电动车发生碰撞,造成两轮电动车两名驾乘人员当场死亡,小汽车起火燃烧。事故发生后,陈某逃离现场,后迫于公安机关的追捕压力投案。

目前,犯罪嫌疑人陈某涉嫌交通肇事罪已被执行逮捕。案件侦办工作正在进一步进行中。(来源:IT 之家)

 

消息称 iPhone 若在美国组装 成本将上涨 90% 甚至更多

4 月 11 日消息,据外媒报道,近一段时间,有关苹果在美国市场销售的 iPhone 是否会因关税压力而涨价,后续是否会在美国生产备受关注。

在最新的报道中,有外媒提到,有银行的分析师在给客户的报告中表示,苹果将 iPhone 的组装转向美国在技术上是可行的,但成本会因此而大幅上涨。

分析师在报告中表示,即使苹果能在美国找到最终组装的工人,仅人力成本一项就将上涨 25%。而同进口组装好的产品相比,进口零部件在美国组装,还会带来更为复杂的物流问题。

此外,分析师在报告中也提到,如果是进口零部件并在美国完成 iPhone 的最终组装,零部件也面临高额的关税,最终的制造成本将上升 90% 或更多。(来源: TechWeb)

 

傅利叶发布首款开源人形机器人 Fourier N1:高 1.3m + 重 38kg + 续航 2 小时

4 月 11 日消息,通用机器人公司傅利叶正式发布首款开源人形机器人 Fourier N1,并同步开放涵盖物料清单、设计图纸、装配指南、基础操作软件在内的完整本体资源包。

官方表示,作为傅利叶「Nexus 开源生态矩阵」的首个落地项目(「N1」即「Nexus-01」),N1 将为全球机器人和具身智能开发者提供一个开放创新的技术基座,加速高泛用性运动控制器、多模态模型结合以及具身载体的未来形态推演等前沿研究开发工作的验证落地。

该机器人主要信息如下:

Fourier N1 采用紧凑型硬件架构设计,身高 1.3 米,体重 38 公斤,全身拥有 23 个自由度。整机结构采用铝合金与工程塑料复合构成,保证本体强度的同时兼顾关节灵活性。电池采用背部插拔式设计,单次连续运动续航可达 2 小时以上,满足高频测试与便捷部署需求。

其动力系统搭载傅利叶自研的 FSA 2.0 一体化执行器,结合自研控制系统,在提升运动稳定性与抗冲击能力的同时,实现更高精度的位姿控制。实测最高稳定奔跑速度可达 3.5 米 / 秒。(来源:IT 之家)

荣耀 Power 手机参数曝光:骁龙 7 Gen3 处理器,支持北斗卫星短信

4 月 11 日消息,荣耀 Power 手机将于 4 月 15 日发布,博主 @ 数码闲聊站 今日曝光了这款新机的主要参数。

  • 6.78"1.5K LTPS OLED 居中双孔曲屏,超高频 PWM 调光
  • 骁龙 7 Gen3 处理器
  • 8000mAh 电池,66W 快充 / 80W 快充头
  • C1 + 通信芯片,支持北斗卫星短信

荣耀旗下拥有 Magic 系列、数字系列、GT 系列、V 系列(V Purse 外折)、X 系列以及 Play 系列这六条产品线的手机产品。而此次曝光的这款 Power 新机是荣耀在战略转型后推出的首款新系列手机。(来源:IT 之家)

 

富士新机实拍图泄露:被曝采用光学取景器,顶部单曝光补偿拨盘设计

4 月 11 日消息,根据 FujiRumors 报道,一位匿名人士泄露了富士未发布新机的实拍图,该机顶部搭载单曝光补偿拨盘,疑似采用光学取景器。

▲ 泄露图

根据泄露图,该机外观类似徕卡 M 系列,造型复古;不同于富士以往相机通常顶部有两个或以上拨盘的设计,图中显示其顶部仅有一个拨盘,控制曝光补偿,但该拨盘旁的拨杆功能尚不明确。

同时该媒体据泄露图称,该机的取景器为光学取景器,与此前采用 EVF 取景器的说法有冲突;但尚不明确该机是采用光电混合取景器还是采用纯光学取景器。

同时泄露者声称,富士有望于 2025 年底或 2026 年推出该机,定价预计低于 1000 美元(现汇率约合 7322 元人民币),主打街拍、摄影师备用相机市场。(来源:IT 之家)

中国电子产品公司 Anker 开始在亚马逊上提高商品价格

中国 Anker 是亚马逊最大的卖家之一,其产品从移动电源到手机壳,应有尽有。自周四以来,该公司已在其美国平台上提高了五分之一的产品价格,这一迹象表明,对中国商品征收的关税正在转嫁给美国购物者。

电子商务服务提供商 SmartScout 的数据显示,自上周四以来,中国产品价格平均上涨了 18%,其中大部分涨幅发生在 4 月 7 日星期一美国总统唐纳德·特朗普对中国商品加征 50% 的进口关税之后。

美国对中国产品的进口关税目前已达 145%。随着世界两大经济体之间的贸易战愈演愈烈,北京周五同样宣布对美国商品的关税提高至 125%。

此前,中国最大的跨境电子商务协会发出警告称,由于关税,许多在亚马逊上销售产品的中国公司正准备提高美国产品价格或退出市场。

Anker 拥有 5000 名员工,年收入达 221.7 亿元人民币(30 亿美元),自 2011 年由前 Google 软件工程师创立以来,已成为亚马逊的主要卖家。(来源:cnBeta)

Gemini 大模型逆袭,给了 Google Cloud「AI 基建」的勇气

北京时间 4 月 10 日凌晨,Google Cloud Next 2025 正式揭开序幕。

 

如果用「AI 届的苹果发布会」来形容每年的英伟达硬件发布会,那「AI 届的 CES」或许更适合用来形容今年的 Google Cloud Next;虽然同样令人兴奋,但每一个来到现场的人都带着自己的问题,现场随处可见各种务实的交流。

络绎不绝的观众前往 Google Cloud Next 25 主题演讲 | 图片来源:极客公园

三个月前,同样是拉斯维加斯,这个场馆这个舞台上,黄仁勋同样以 AI 为主题的演讲,揭开了 CES2025 的序幕。

但即使是老黄的主题演讲,都不及今天的 Google Cloud Next 开幕主题演讲座无虚席;即使场内已经人满为患,仍然有大量的人在门口排队,等待有空缺位置时第一时间入场。

主题演讲现场,人数甚至比老黄演讲更多 | 图片来源:极客公园

之所以没有老黄的个人魅力,Google 的动作仍然能被如此多的业界人士关注,显然是因为 Google 如今在 AI 模型应用部署领域的统治地位。有了 Gemini 2.5 Pro 的打底,Google 今年在 AI 领域的影响力已经处于第一梯队,但对于 Google Cloud 来讲,如何将这部分能力,转化给全世界的用户的实际使用中,才是这届 Next25 最需要给全球用户解答的问题。

不仅有针对推理模型优化的第一代 Google Tensor TPU 芯片,还有 Gemini 能力在 Google Workspace 生态中的进一步「植入」,甚至祭出了「本地部署 Gemini」这样的大招。以及让不少业内人士感到兴奋的「Agent2Agent」沟通协议。

网友对 Google Cloud Next 发布产品的评价 | 来源:X

仅仅是首日的主题演讲,Google 就已经展现出几乎是在 AI 应用领域「全方位出击」的产品规划,并且在几乎每一个领域都拿出了业内最前沿的思考与解决方案。

难怪有不少网友,在看完 Google Cloud Next 25 的主题演讲全部内容后,直呼「Google 真的是目前大模型厂商中开启了「上帝模式」的选手」。

 

01

 

新模型

 

作为 Google CEO 皮查伊上台亲自发布的产品,Gemini 2.5 Flash 与它的前辈 Gemini 2.5 Pro 不同,这是一款「提供强大性能的同时注重效率」的推理模型。

Gemini 2.5 Flash 作为新模型发布 | 图片来源:极客公园

据皮查伊介绍,Gemini 2.5 Flash 主打卖点是提供「动态且可控的」计算能力,允许开发者根据查询的复杂性,手动调整处理时间。「你可以根据具体需求调整速度、准确性和成本之间的平衡。这种灵活性对于在高流量、成本敏感的应用中优化模型的性能至关重要」。

根据在现场与 Google 工程师的交谈,他指出 2.5 Pro 在处理一些简单的问题时,仍容易出现「过度思考」导致其响应速度大幅降低的问题。这也是 2.5 Flash 在体验中力求解决的难点。但最终他们的目标,还是进一步改善模型的动态思考能力,并将更多控制权开放给用户。

作为打响大模型性价比大战第一枪的选手,Google 还特别提到了与 DeepSeek R1 这样「价格较低但性能良好的模型」的对比,表示 2.5 Flash 非常适合在「高流量」和「实时」应用的商用场景——例如客户服务和文档解析。

除了新模型,Google 还放出了将最新模型「本地部署」这样的策略,来让已经有自己数据中心、或是有着更高数据管理要求的客户,能够使用现有的硬件设施,快速在自己的服务中部署 Gemini 2.5 Flash 的能力。

Google 计划从第三季度开始,将 2.5 Flash 这样的 Gemini 模型引入本地部署环境。该公司的 Gemini 模型将可在 Google Distributed Cloud (GDC) 上使用,同时表示 Google 也正在与英伟达合作,将 Gemini 模型引入符合 GDC 规范的 Nvidia Blackwell 系统。

这样的服务分量也吸引到老黄来站台| 图片来源:极客公园

 

02

 

新工具

 

作为 Google Cloud 托管的 AI 工具部署平台,Vertex AI 也在今天得到了几乎是「全模态」的更新,新的视频、图像、语音和音乐生成 AI 工具都将登陆 Vertex AI。

其中最值得关注的,就是视频生成模型 Veo 2 的更新,新增的编辑和相机控制功能,除了可以自动「从视频中移除不需要的背景图像、徽标或干扰物」。还能将原始视频的画面扩展,进一步填充原本的空白内容。这个工具会用 AI 生成的、能与原始片段融合的视频素材来填充新的空间。

Veo 2 的视频内容拓展效果 | 图片来源:Google

此次更新还允许 Veo 2 用户在生成素材时,除了文本描述外,还可以选择电影技巧预设,用于指导最终结果中的镜头构图、摄像机角度和节奏。包括延时摄影效果、无人机风格的第一人称视角(POV)以及模拟不同方向的摄像机平移。

此外,本次更新还增加了一个新的插值(Interpolation)功能,可以在两个静态图像之间创建视频过渡,用新的帧填充开头和结尾序列。

只需给出一个起始帧和最终帧,Veo 2 就会生成连接两者的视频。

只需两张照片,Veo 2 就能自动生成一段中间视频 | 图片来源:Google

文本转图像模型 Imagen 3 的编辑功能也得到了更新,Google 表示本次更新「显著」改进了自动对象移除时的自然效果。

Imagen 3 能获得更自然的内容移除效果 | 图片来源:Google

据现场相关业务负责人介绍,Veo 2 和 Imagen 3 已经被欧莱雅等公司用于设计营销内容。负责人 Justin Thomas 表示,过去「需要八周才能完成的图像处理任务,现在只需八小时」。

这些更新发布之后,使 Vertex AI 成为目前市面上唯一一个覆盖了视频、图像、语音和音乐的内容生成模型的平台。

除了面向当下需求的新工具,Google 还公布了一项新的开放协议——Agent2Agent (A2A),旨在连接不同生态系统中的 AI Agents。

这个概念听起来似乎与时下非常流行的 MCP 协议有些相似之处,但不同之处在于,MCP 是为了解决 LLM 与工具之间的沟通,而 A2A 则是 Agent 与 Agent 之间的对话,就像是属于 AI 的全新语言。

A2A 协议应用场景演示 | 图片来源:Google

Google 表示,A2A 协议将使企业能够更便捷地部署 AI Agent 产品,因为它解决了构建在不同供应商生态系统上的代理无法相互通信的挑战。

在现场,还演示了一个具体的案例:例如在同一个 UI 界面下,系统可以使用一个 Agent 来根据位置与技能,在面试中筛选候选人,在筛选完成、并且完成初步的面试后,系统可以自动将生成的信息快速传输给另一个设计用于候选人背景审查的 AI Agent 工具,在这个过程中,大幅降低 AI 与 AI 之间的信息损耗。

这套系统显然在未来越来越多 AI Agent 投入应用的时代,有着很强的需求。根据代理式数字工作平台 DoozerAI 的联合创始人 Paul Chada 的说法,A2A 协议提供的互操作性将使企业能够自动化跨越多个系统的复杂工作流程,从而可能在降低集成成本的同时提高生产力。

Google 同时还介绍,A2A 协议建立在现有流行的标准之上,包括 HTTP、SSE 和 JSON-RPC;其中 HTTP 是网络通信的基础,而 SEE 和 JSON-RPC 分别是向客户端服务器发送更新的基础协议,以及应用程序使用 JSON 消息进行远程相互通信的基础协议。

尽可能多的利用现有的协议,目标是能够尽可能降低这个全新的协议,在现有服务中部署的难度,使其更容易与企业已在使用的现有 IT 堆栈集成。即使这仍然是一个短期内充满挑战的事,但仍然让现场的不少开发者感到兴奋,随处可以听到关于这个「Agent 之间的新语言」的讨论。

 

03

 

新硬件

 

对于 Google 来讲,在 AI 领域的统治级地位,除了提供完善的软件能力,在硬件领域多年的投入带来的成果如同左右手一般必不可少,因此今天除了一系列软件服务更新,Google 今天还发布了最新的第七代 Tensor 处理单元(TPU)Ironwood。

Ironwood TPU | 图片来源:Google

据 Google 介绍,Ironwood TPU 是 Google「迄今为止性能最强、可扩展性最高且能效最高的定制 AI 加速器」,并且是「首款专为推理设计」的 TPU。

Ironwood 每个独立芯片提供 4614 TFLOPs 的峰值计算能力。而包括 9216 颗 TPU 的集群总共拥有 42.5 Exaflops 的计算能力,是世界上目前最大的超级计算机 El Capitan(每个集群提供 1.7 Exaflops)计算能力的 24 倍以上。

如果这还不足以直观的体现 Ironwood 性能的蒙正,作为云计算 TPU 硬件领域的大厂,Google 还回顾了从 2018 年到 2025 年的研发历程 ——TPU 的性能增长了 3600 倍。

第七代 TPU Ironwood 有着巨大的性能提升 | 图片来源:Google

据 Google 介绍,性能巨幅提升的 Ironwood,旨在针对性满足思维模型所要求的不同计算需求,这些模型「包括大型语言模型(LLM)、混合专家模型(MoE)和需要「大规模」并行处理和高效的内存访问的高级推理任务」。

在前沿领域,思维模型的计算需求远远超出了任何单个芯片的能力。因此我们设计的 Ironwood TPU 具有低延迟、高带宽的 ICI 网络,以支持在整个 TPU 单元级规模上进行协调、同步的通信。

 

04

 

结语

 

当你看到这篇文章时,Google Cloud Next 25 的主题演讲已经结束,但正式的会议日程才刚刚开始。

就像本次 Next 25 的口号一样,来这里的每个人都想知道「AI for what's next?」的答案,主题演讲中发布的一系列工具,只是 Google Cloud 对此的回答。

每个来到这里的人,都在试图找到「AI for what's next」这个问题的答案 | 图片来源:极客公园

作为当下最大的「AI 基础设施」供应商,Google Cloud 不仅需要提供更多现有的工具:更好的模型能力,更丰富的平台、更适合的算力硬件。

在市面上,你几乎再也难以找到像 Google Cloud 这样,给用户提供了「一站式解决方案」的厂商,因此在现场的沟通中,「One and only」是现场很多开发者的声音。

「一站式解决方案」|图片来源:极客公园

Google 在 AI 领域的地位,也让 Google Cloud Next 作为沟通平台的价值急剧提升,在前沿技术的土壤中,作为「AI 时代的基础设施」,帮助更多用户,建立起更多满足新时代需求的 AI 生态,或许才是 Google Cloud 未来的「核心价值」。

❌