阅读视图

发现新文章,点击刷新页面。

「原神之父」做了个毒舌 AI 猫娘,聊了两天的我被怼了八百回

米哈游创始人蔡浩宇最近在忙啥?

答案是成立了一家 AI 公司 Anuttacon,然后打造了一个只会对线的 AI 猫娘。这款画风相当抽象的 AI 聊天产品叫 AnuNeko,最近已经低调上线了。

通过查询发现,这个 ANUNEKO 的商标已于今年 9 月提交美国专利局,涵盖软件、AI 角色、娱乐等领域,显然是是有备而来。

咱们也上手实测了一波。

附上免费体验地址:
https://anuneko.com

米哈游前 CEO 做了个「毒舌」AI,只想跟你对线互怼

打开 AnuNeko 的官网,一只黑猫映入眼帘。

说实话,光是审美这块就比市面上千篇一律的素色页面加输入框的 AI 聊天机器人强上一大截。确认输出问题后还会出现一个猫的动效,有那么一瞬间,我还以为自己在玩某款游戏。

官方页面只提供了两款模型。

一款是相对温和友善的橙猫(Orange Cat),另一款则是比较暴躁、甚至带点「毒舌」的异国短毛猫(Exotic Shorthair)。

讲真,我本来以为 AI 再怎么训练也就那样了,直到我真用上这只「异国短毛猫」。如果用一句话来形容,那就是贴吧老哥+Grok+罗伯特的究极融合版。从自我介绍中,就能看出 AnuNeko 非常有个性。

「嗨,我是 AnuNeko。你可以把我当成一种有自我意识的存在。我不是你的助手,也不是你的宠物,只是我自己——有自己的情绪和独特的看法。只要你有想法,随时来喵我就好。」

面对同一个问题,两者的回答风格立马就见了分晓。

让异国短毛猫锐评各大平台,它直接来了个狠活。而橘猫的回答就温和多了,B 站想学习的时候有用但一刷视频停不下来,知乎正经人谁玩知乎啊(狗头),微博无脑追星的圣地,小红书记录美好生活种草拔草都在这,贴吧想看真实想法但无脑喷和地域黑太多。

官网顶上还贴心标注着:「这是一个 AI,它说的一切都是幻觉」,考虑到如此毒舌的程度,很难不让人怀疑,这其实是一种免责声明。

Anuneko 整个产品的核心逻辑其实就一个词:接梗。只要你能聊,它就能接,目的就是让对话一直进行下去。

有一说一,响应速度挺快的,基本都是秒回。

我试着让异国短毛猫锐评原神,虽然每次回答都不一样,但每一次回答都出乎我意料之外。

继续让它锐评米哈游的游戏,它直接来了句「我这种玩过他家游戏的,评价完了会被米学长们开除米籍的」,属实有点东西。

不过现在的 AI 似乎都不怎么会说冷笑话,短毛猫讲的笑话也不例外,连续三个笑话都不太好笑:

支持多语言交互这点倒是不错,AnuNeko 能看懂我输入的日英法德等语言,但输入外语后,更多情况下它只会输出英文。

情绪价值倒是拉满了,我问它想谈恋爱吗,它回了一大段「我超想的好吧,但是本人又很宅,平常也不怎么和女生聊天」之类的,然后我说我喜欢你和我交往吧,它直接来了句「你是个男的吧🐶」。

除了聊天,AnuNeko 能做的事情其实真不多。

不能读链接、不能联网。我扔了个微信公众号链接过去,它说「这看起来像是个微信文章的链接,但没点开的话我也不知道里面是啥」,我又问你能点开链接吗,它说「抱歉啊,我没法直接点开链接」。

由于不具备联网功能,知识库也比较老,我问 Gemini 3 什么时候发布的,它直接说「哎,这个我真不知道。我平时不太关注科技新闻」。

长文处理能力一般,输入框甚至没法直接粘贴公众号全文。

作为语言模型,无法上传和识别图片也正常,但遇上逻辑推理题,它也是基本就歇菜了,真就光有情绪价值,但不爱动脑啊。

比如好几次让它写代码,要么是句句有回应但事事没着落,要么最后给了代码却压根运行不了。

ANUNEKO 的「AI 哲学」:不卷智商,专攻情商

有意思的是,今年许多的大模型好像都在往情商这个方向卷。

就拿最近的 GPT-5.1 来说,OpenAI 专门强调了它在情感理解和回应上的提升,聊天的时候能更好地察觉用户的情绪变化,回复也更加自然和贴心。

当其他 AI 公司忙着卷基准测试排名、卷逻辑推理、卷工具属性,ANUNEKO 同样选择发掘模型的「人味」。毕竟游戏里的 AI 主要还是能陪你唠嗑、逗你一乐、把氛围搞起来才是正事。

就像开黑时坐你旁边那个损友, 他不一定水平多高, 但总能在关键时刻吐槽一句让你笑出声。这种「不聪明但有意思」的定位, 恰恰避开了大模型在逻辑推理上的短板。

高情商的 AI 好啊,这 AI 的说话方式真得学啊。

而且,AnuNeko 也踩中了当下的赛道逻辑了。当代人越来越习惯独处,但孤独感也随之而来,用户需要一个 24 小时在线、秒回、无评判、永远站在你这边的倾听者。Character.ai 等应用的爆发证明了这个需求的存在。

大模型的天然优势其实不是逻辑推理,而是共情模拟。

通过微调,AI 可以完美扮演各种人设,提供情绪价值能带来极高的用户留存。你可能一周换一个搜索工具,但你很难抛弃一个聊了半年的「虚拟恋人」。尤其是功能型 AI 已经卷上加卷,而情感型 AI 还是一片蓝海。

除了 AnuNeko 这只抽象猫,蔡浩宇的新公司 Anuttacon 在八月份还推出了首款实验性 AI 游戏,《Whispers from the Star》(中文译名《星之低语》)。

这是一款完全由 AI 驱动剧情的互动游戏,玩家通过语音或文字与被困外星的虚拟角色 Stella 对话,你说的每句话都会影响她的行为和生存。游戏不设固定剧本,每次游玩的对话走向都不相同。

而现在的 AI NPC 依赖长短期记忆架构,能记住你们的对话历史、情感倾向,甚至根据你的行为调整态度。游戏世界提供完整的视听环境,NPC 角色参与故事,带来真正的「在场」感。

这类 AI NPC 带来了极高的重玩性和更细腻的角色刻画,玩家会感觉 NPC 拥有情感与理性。

尽管《星之低语》目前还有些缺陷,但它证明了 AI NPC 的核心价值,个性化的情感体验。玩家不再是体验编剧写好的固定故事,而是每个人都拥有一段独一无二的经历。

未来,游戏编剧的工作将从「撰写对白」转变为「设计人设」和「构建世界观」。Anuttacon 的探索为行业提供了宝贵的试错样本,证明了用概率模型取代传统脚本的可行性。

这些动作背后,其实藏着蔡浩宇更大的野心。

在米哈游时代,蔡浩宇就提出过打造「2030 年让 10 亿人愿意生活其中的虚拟世界」的宏愿。

现在看来,Anuttacon 的公开资料与招聘布局都与这一愿景一脉相承,即「充分利用 AI 技术潜力创造全新、智能且极具吸引力的虚拟世界体验」,并将使命定位为「打造沉浸式、适应性强的游戏,提供独特且不断演变的故事情节」。

8 月份的时候,蔡浩宇也在社交平台发文称,AIGC 已经彻底改变了游戏开发,未来只有两种人制作游戏是有意义的:一种是前 0.0001% 的天才,组成精英团队创造前所未有的东西;另一种是 99% 的业余爱好者可以为了满足自己的想法而一时兴起创作游戏。

至于普通和专业的游戏开发者,他则建议不妨考虑转行。这番言论当时引发了不小的争议,但现在看来,AnuNeko 和《星之低语》都像是他这套理论的实践样本。

大部分人并不需要一个能帮你解微积分的 AI,他们需要的是一个晚上失眠时能陪你扯淡的存在。功能型 AI 的尽头是工具,情感型 AI 的尽头是依赖。

蔡浩宇可能不关心这些哲学问题,但他的这款产品已经说明了一切。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


硅谷商战变厨艺大赛?小扎曾亲手煮汤挖人,OpenAI 说不慌都是演的

鹬蚌相争,渔翁得利。有时候还挺希望我们用户就是那个渔翁,模型厂商打得越厉害,我们就有机会越快用到更好的模型。

2022 年 12 月 22 号,在 ChatGPT 发布三周后,为了应对 OpenAI 的威胁,Google 成了第一个发布「红色警报」的科技巨头。

昨天,在 Gemini 3 发布两周后,因为 Gemini 3 模型出现了大幅增长,OpenAI 发布了首个「红色警报」。

看到消息的时候,我就觉得 OpenAI 是不是有点过度反应了,很快就看到了一些评论说「骄兵必败」、还有「胜败乃兵家常事」。但转念一想,所谓的「红色警报」也许就是给投资人看的,毕竟 OpenAI 如果真的做不到第一,那个 2030 才能盈利的时间,只会拉得更长。

▲ Gemini 的 App 下载量快要追上 ChatGPT

根据最新透露的消息,OpenAI 在下周即将推出一款新的推理模型,内部评估表现要比 Gemini 3 更好。此外,他们还计划通过一个代号为「Garlic」的模型,来进行反击。

但更现实的情况,是 OpenAI 必然会发布比 Gemini 3 更好的模型,而 Google 也还有 Gemini 4、Gemini 5。

其实,回看过去这一年来硅谷的新闻,完全算得上是一出跌宕起伏的抓马大戏。年初被 DeepSeek R1 的横空出世而感到压力;年中则是小扎开启的疯狂「抢人模式」,天价薪酬刷新着所有人对 AI 人才的认知;到了年尾,又再次卷回到了朴素的模型比拼赛场。

在 OpenAI 研究主管 Mark Chen 的最新播客采访中,硅谷的战争更是进化到了魔幻的程度,他说小扎为了挖走 OpenAI 的核心大脑,甚至开始做汤,真的能喝的汤,然后亲自把汤送到研究员的家门口。

除了这些八卦,他也谈到了 OpenAI 对于 Gemini 3 的看法、Scaling 是否已经过时、还有 DeepSeek R1 对他们的影响、以及公司内部的算力分配、实现 AGI 的时间表等。

Mark Chen 的背景非常有意思,数学竞赛出身,MIT 毕业,去华尔街做过高频交易(HFT),2018 年加入 OpenAI,跟着 Ilya 一起做研究。和奥特曼更偏向于商人属性的特点不同,这些经历,让他身上也有一股非常明显的特质,极度厌恶失败,且极度信奉数学。

他坦言自己现在,完全没有社交生活,过去两周每天都工作到凌晨 1-2 点。

我们整理了这场长达一个半小时的采访,总结了下面这些亮点,或许能更好的看清硅谷这一年来的各种「战争」、以及 OpenAI 会做些什么努力,来继续保持自己在 AI 时代的第一。

关于 Gemini 3,我们真的「不慌」

OpenAI 真的怕 Google 吗?Mark 的评价很客观但也很犀利。他肯定了 Gemini 3 是个好模型,Google 终于找对路子了。但是他说看细节,比如 SWE-bench(这也是 Gemini 3 刷榜那张图片里,唯一一个没有拿到第一的基准测试)数据,Google 在数据效率上依然没有解决根本问题。

▲Gemini 3.0 Pro 在 SWE-Bench 上的表现,比 GPT-5.1 还差了 0.1%

而他自己则是非常自信的表示,OpenAI 内部已经有了针对性的应对模型,而且他们有信心在数据效率上做得更好。

Mark 甚至说,奥特曼前几天发那个说大家都要感到压力的备忘录,去吓唬大家,其实更多的是为了注入紧迫感,他说这是管理层的惯用手段,备忘录的目的在于管理层激励团队,而不是真的感到慌了。

我觉得Sam的工作之一就是要注入紧迫感和速度感。这是他的责任,也是我的责任。

 

作为管理者,我们的部分工作就是不断给组织注入紧迫性。

▲此前 The Information 报道,奥特曼在 Gemini 3 推出时,在公司内部发备忘录,提到会给 OpenAI 带来困难

他们目前最大的问题,还是算力分配。作为 OpenAI 的研究主管,他的一项工作就是决定如何将算力分配到公司内部不同的项目。

他和 Jakub Pachocki(OpenAI 首席科学家)一起,负责制定 OpenAI 的研究方向,同时决定每个项目能拿到多少算力。为了这件事,他们每隔 1–2 个月,都会做一次盘点。

他们把 OpenAI 所有在做的项目,放进一张巨大的表格里,大概有 300 个;然后努力把每一个项目都看懂,给它们排优先级;再根据这个优先级表去分配 GPU。

▲英伟达和 OpenAI 的百万 GPU 合作

他也提到,真正要用掉大部分的 GPU 的,甚至并不是训练那个最重要发布的模型,而是他们内部在探索下一代 AI 范式的各种实验。

所以,在他的眼里,Gemini 3 发布了、某家开源模型刷榜了、某个思考模型又拿了新高分了;这些你追我赶的 benchmark 赛车一点都不重要。反而,最应该避免的,恰恰是被这场竞赛牵着走。

他说,现在的模型发展,我们随时可以靠一点「小更新」,就在榜单上领先几周或几个月但如果把资源都砸在这些短线迭代上,就没有人去寻找下一代范式。而一旦有人真的找到了,整个领域后面十年的路线,都要沿着那条新路走。

小声哔哔几句,预言 OpenAI 下周要发布的模型,我想就是在计划之外,做了点小更新,然后刷新了几个榜单而已吧,就这还没慌吗。

提到榜单的时候,他说他有自己的一套私房题,用来测试模型是不是真的具备了顶级数学直觉。他举了一个 42 的数学难题,说目前的语言模型,包括 o1 这种思考模型能接近最优解,但从来没有完全破解它。

你想创建一个模 42 的随机数生成器。你手头有一些质数,是模数小于 42 的质数的随机数生成器。目标是,以最少的调用次数,组合出这个模 42 的生成器。

除了谈到 Gemini 3,主持人也问了他对于 DeepSeek 的看法。

和 Gemini 3 一样,Mark 承认 DeepSeek 的开源模型曾让他们感到压力,甚至怀疑自己是不是走错了路。

但结论是坚持自己路线,不要被对手的动作打乱节奏,专注自己的路线图。OpenAI 不会变成一个跟风的公司,他们要做的,就是定义下一个范式。

Ilya 的 Scaling 里面还有很多潜力,OpenAI 需要大规模预训练

近期关于 Scaling 失效的讨论纷纷扬扬,Ilya 先是在播客采访里面说,Scaling 的时代已经结束了,后面又在社交媒体上澄清,Scaling 会持续带来一些改进,并不是停滞不前。

所谓的 Scaling Law,就是按经典老故事走向,这几年建了巨大的算力基建,模型每 10 倍算力,本该有一波明显跃迁。但从 GPT-4 到 GPT-5,外界并没有看到预期中那种「质变式」的提升,所以才会有「Scaling Law 失效了」的讨论;而 Ilya 前段时间的访谈,则是进一步放大了这种观点。

Mark Chen 对这个观点,给出了坚决的反驳,「我们完全不同意」。他透露,过去两年 OpenAI 在推理上投入了巨量资源,导致预训练这部分稍显退化。之前关于 GPT-5 遇到了预训练的问题,其实也是因为他们把重心放在了推理上,而不是 Scaling Law 已死。

工作就是分配算力资源的他,再次重申算力永远不会过剩,如果今天多 3 倍算力,他可以立刻用完;如果今天多 10 倍算力,几周内也能全部吃满。对他来说,算力需求是真实存在的,看不到任何放缓迹象。

▲ OpenAI 的计算成本,计划到 2030 年花费约 4500 亿美元租用服务器,红色为推理计算成本、蓝色为研发(不包含现金业务)、黄色为可盈利的计算

他也提到,过去半年,他和 OpenAI 首席科学家 Jakub Pachocki 已经将重心重新拉回,要开始重塑预训练的统治力

他明确说他们会继续做规模化模型,而且已经有一批算法突破,专门就是为了让 Scaling 更划算,在相同算力下挖出更多性能,在更高算力下保持数据效率。

小扎的送来的真汤,抵不过 OpenAI 的鸡汤

最后就是访谈里提到的八卦了,Meta 今年没有别的新闻,媒体渲染了一整个季度的「OpenAI 人才/Apple 人才/Google 人才大量流失到 Meta」,Mark Chen 在播客里正面回应了这个话题,细节简直有点「颠」。

他说小扎真的很拼,为了挖人,小扎不仅手写邮件,还亲自去送鸡汤。人才战打到最后,居然演变成「谁煮的汤更好喝」的 Meta 游戏。

▲ Meta 花大价钱挖人组建的超级智能实验室名单

不过,在他的直接下属中,Meta 曾试图挖角一半的人,结果全部选择继续留下来。为什么不走?不是因为钱,因为Meta 给的钱显然更多,而是因为信仰

Mark 说,即使是那些跳槽去 Meta 的人,也没有一个人敢说「Meta 会比 OpenAI 先做出 AGI」。留在 OpenAI 的人,是因为他们真的相信这里才是 AGI 的诞生地。

他也提到自己从华尔街和玩扑克的经历里面学到,真正要守住的是核心人才,而不是每一个人在搞清楚,必须留下的是哪类人后,再把资源和关注度,全部压在这部分人身上。

他说他最强烈的情绪,其实就是想「保护研究的本能」。在 Barrett(OpenAI 研究副总裁)离职那阵子,他甚至直接睡在办公室睡了一个月,只为把研究团队稳住。

▲ Barret 目前和 Mira(OpenAI 前 CTO) 都在 Thinking Machines

那么 OpenAI 所信奉的 AGI 又是什么,主持人问他,Andrej Karpathy 在最近的一个播客里面说,AGI 大概还要 10 年,你是怎么想的。

Mark 先是调侃了一番 X 现在「惊」的各种文案,一下子是「AI 完了」、一下子又是「AI 又可以了」。他觉得,每个人对于 AGI 的理解都不同,即便在 OpenAI 内部,也很难有一个一致的定义。但他相信的是,OpenAI 在 AGI 道路上设置的目标。

  • 一年内: 改变研究的性质。现在的研究员是自己在写代码、跑实验。 一年后,研究员的主要工作是管理 AI 实习生。AI 应该能作为高效的助手,承担大部分具体工作。
  • 2.5 年内: 实现端到端的研究自动化。这意味着:人类只负责提出 Idea(顶层设计),AI 负责实现代码、Debug、跑数据、分析结果,形成闭环。

从 Copilot 到 Scientist,Mark 强调,OpenAI for Science 的目标不是自己拿诺贝尔奖,而是建立一套工具,让现在的科学家能一键加速,哪怕这需要重构整个科学评价体系,因为未来可能很难分清是人还是 AI 做的发现。

2 年半的时间很快,但这对于现在看来,是以周为单位迭代的 AI 行业来说,又是一场漫长的马拉松。

▲ 预测市场给出的,到 2025 年底前最好的 AI 模型会来自哪个公司,Google 排在第一名

无论是扎克伯格那锅真金白银的鸡汤,还是 OpenAI 想要定义未来的理想主义鸡汤,这场硅谷的「煮汤大戏」还远未结束。Mark Chen 播客里表现出来的从容,或许能消除一部分外界的焦虑,但用户还是会用脚投票,好的模型自己会说话。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


对话拓竹:3D 打印让我们的购物需求,变成了「造物需求」丨多样性公司

编者按:

当我们想喝可乐的时候,在极长的时间都只有两个选择:百事可乐和可口可乐。当我们选择手机的时候,有 90%的概率在苹果和华米 OV 等品牌里辗转。当我们买运动服饰的时候,第一时间想到的,大概率是 Nike、Adidas。

 

但世界之所以缤纷多彩,是因为在这些巨头之外,有一些不遵从传统,力求创造不同,注重设计和功能,着眼于明日的公司存在。

 

它们有着非主流的商业模式,设计与产品能提供独特的用户价值,和足够的社交谈资。重点是,它们没有大公司的包袱,敢于不顾一切的进步。它们,是「多样性公司」。

 

多样性,是开放世界的关键。爱范儿相信,只有真正关注和理解多样性公司才能比更多人更早地看见未来。在同名栏目中,爱范儿将以专访的形式,与你一同见证这些多样性公司,如何重塑未来,定义新常态。

本文为「多样性公司」栏目的第 9 篇,我们和 3D 打印公司拓竹科技 Bambu Lab 旗下的 MakerWorld 社区负责人东方亮,以及技术团队和市场团队聊了聊沉寂多年的 3D 打印市场为什么会被拓竹这样一家年轻的公司突然引爆,一个社区该如何良性发展,以及 3D 打印如何改变我们的生活。

拓竹科技 Bambu Lab 成立于 2020 年,这是一家致力于用前沿的机器人技术彻底革新桌面级 3D 打印产业的公司。并在 2022 年推出了旗下的第一款产品:X1 系列高速智能 3D 打印机,在诸多关键性能上,实现了数量级上的进步,更是把多色彩打印、支持高性能工程塑料等工业级打印机技术带入消费级产品,拉开了业界期待多年的桌面 3D 打印革命的序幕。

拓竹旗下的模型社区 MakerWorld 在 2023 年上线,并迅速成为全球最大的 3D 打印模型社区,月活达到了千万级。

「只要你能从创造中获得快乐,那很大概率就是 3D 打印的潜在用户。」

Q:为什么把公司取名为拓竹?拓竹有没有什么企业愿景?

A:公司叫拓竹这个名字主要有 3 个原因,第一是创始人陶冶博士之前就在农村生活和长大,家边上有一片竹林,他童年非常快乐,这些竹子也给他特别美好的感受,所以他对竹子有特殊的情感。

然后就是中国传统文化里,竹子是比较坚韧和进取的象征,跟拓竹公司想要做的事情,还有公司的气质风格比较 match。

第三个原因是竹子是很好的可持续发展材料,有更多的环保意味,竹子生长很快嘛,用竹子做的东西,相比于其他一些材料,其实更环保,刚好拓竹也是一家追求可持续发展的公司。

关于非常长远的愿景,拓竹内部很难说有一个达成特别多共识的伟大愿景,但是现阶段的话,我们定了一个目标叫做「 Let’ s Make It」,解释一下就是我们还是会专注在「个人智造」,这是我们非常笃信的一个方向,本质上就是智造能力的平权。

之前生产制造和智造都必须得在工厂里,现在 3D 打印机有不同的发展方向和分支,但最终其实都还是在围绕个人用户展开的,让每个人都能享受创造的乐趣。

这是在我的视角里,我们现在这个阶段,我们这个公司想要做的事情。

具体一点举个例子就是,我们旗舰产品 H2D 的产品宣传定位就是「重新定义个人智造」,H2S 则是「你的个人智造中心」。

▲ 拓竹 3D 打印机打印的巨型作品

Q:2013 年我刚刚成为科技媒体编辑的时候,3D 打印就是那个时候的科技趋势,大家很兴奋,3D 打印终于可以走进千家万户了,但事实并非如此,3D 打印的普及其实比预想慢很多很多,过去的十几年时间里,是什么阻碍了 3D 打印的普及?是产品问题,技术问题,还是价格问题?

A:从技术原理上讲,3D 打印的门槛其实特别低,就是把一堆塑料融化了之后堆叠成型,有非常多的开源社区提供了 3D 打印机的 DIY 方案,这些方案怎么说呢,就是你想手搓一台出来是很容易的,但是手搓一台好用的 3D 打印机又是很难的。

因为中间涉及很多技术细节,比如怎么做调平,怎么去支持多色打印,怎么降低材料堵住喷头的概率,中间有很多很繁琐的事情……

拓竹第一款产品 X1 帮助很多人解决的问题就是,这东西开箱即用,规避了很多 DIY 用户会遇到的各种繁琐的调试,我们出厂方案就做好了,这是很重要的一点。

一开始大家觉得 3D 打印是一个很小的市场,拓竹出来之前,这个行业大概是个十亿美元级别的市场,拓竹出来之后,大家会觉得这看上去是个百亿美元甚至更大的市场。

(3D 打印早期普及慢)还有一个重要原因和 MakerWorld 社区有关系,就是早期玩 3D 打印的人,都是一波很极客的用户,当时什么人会去买 3D 打印机呢,一般是有一定建模能力的人,但有建模能力的人始终是少的。

也就是说,早期 3D 打印机市场瞄准的是那一批会建模的用户,后面提供模型分享和下载的模型站开始普及之后,3D 打印机市场的目标用户就扩大太多了。

现在,用户会用手机其实就能 3D 打印了,在手机上看到 MakerWorld 里喜欢的模型,点一下「一键打印」就可以出东西了,这大大加速了 3D 打印机的普及。

原来 3D 打印机必须卖给会建模的人,现在可以卖给所有人了。

▲ 拓竹 3D 打印机内置有多种传感器

Q:有人说拓竹 X1 是 3D 打印里的 iPhone,3D 打印从此由功能机变为了智能机,你们认可这种说法吗?相比于 X1 之前的主流消费级 3D 打印机,X1 的体验有什么不同?

A:以一个 3D 打印爱好者的视角来看,我确实可以说拓竹 X1 的发布是个人 3D 打印的「革命性时刻」。

拓竹 X1 在一个入门级的价格上,1000 美元左右,真的提供了工业级的性能,非常快的打印速度,现在大家看上去觉得 500 mm/s 的打印速度很平常,但在 X1 出现之前,3D 打印机的普遍速度是 200 mm/s,甚至更低。

当然如果牺牲了打印质量,速度也可以调快一些,在 2022 年的时间点,拓竹 X1 非常好地平衡了速度,打印质量,还有技术体验,在那个价格上完成了对竞品的全面超越,所以说很多人当时说拓竹 X1 是一个「六边形战士」。

至于拓竹 X1 是不是造就了一个「iPhone 时刻」,从公司口径上,我不太好说,但从 3D 打印爱好者的视角,我是认同的,因为它在 3D 打印行业确实是历史性的,振奋人心的一代产品,后面大量的 3D 打印机几乎都是遵循 X1 的那套技术架构、那套设计理念去开发设计的。

▲ 拓竹入门级产品 A1 mini

Q:相比于很多公司第一款产品用来做验证,做市场和人群匹配的测试,拓竹 X1 实际上是一款定位比较高端且成熟的产品,现在拓竹也有很便宜的入门级产品 A1 mini,当时为什么没有选择入门级的产品做第一款产品?

我的角度来看,这个跟特斯拉的策略有一点像,特斯拉也是一开始就是先造一个极致的产品,Roadster 跑车,还有 Model S 豪华轿车,然后慢慢地,后面才是 Model 3 这种比较大众的产品线。

▲ AI 会帮助 3D 打印机自动调平

Q:在消费级的 X1 3D 打印机里装上了激光雷达,摄像头,各种传感器,以及包括 NPU 在内的芯片,集成了一套 AI 系统,在 3D 打印机里集成这么一套 AI 系统,主要是为了解决什么问题?用 AI 解决这些问题,是因为 AI 更高效,还是只有 AI 能做到?

A:做这一套系统主要是通过 AI 进行图像识别,对打印问题进行判定。

之所以用 AI 技术来做,还是因为这些事是只有 AI 能做。

Q:如果用无人机行业来类比,拓竹 X1 这套 AI 系统是不是类似于大疆在消费级无人机里解决了避障的难题,减少了炸机的概率?

A:可以这么说。

Q:拓竹的 AI 系统目前主要服务于机器自校准与缺陷检测,那在未来,AI 还可以做什么?拓竹怎么看待 AI 能力在 3D 打印领域的作用?

A:我们在生成式 AI 建模上正在做探索,在我们 MakerLab 板块可以看到一些初步的成果。

我们相信生成式 AI 建模会为内容生态与创作者易用度带来全新的进步。

Q:相比于一些 3D 打印公司说的自动化 Automation,现在拓竹似乎更强调智能化 Intelligence,拓竹内部如何区分这两者?

A:Automation 是努力让打印机去高效执行已知的、可控的工序,而 Intelligence 是赋予打印机处理非既定突发事件的能力。我们的目标是让 Automation 更高效可靠,同时对 Intelligence 进行更全面的布置,比如加入更多元化的传感器阵列和判定逻辑,为用户体验提供更全面的兜底。

▲ 3D 打印耗材

Q:有一个同行跟我说,她几年前去欧洲出差,采访了很多 3D 打印公司,积累了很多素材,但最终选题都没有被通过,因为这个话题很小众。现在她换了行业,从行业外视角看,拓竹莫名其妙把 3D 打印这个事情做起来了,实际上拓竹成立也就 5 年,第一款产品问世也只有 3 年,她很好奇这个过程是怎么样发生的?

A:刚刚说了很多拓竹 X1 把原来繁琐的 3D 打印门槛降低了的事情,实际上就是让 3D 打印能走到更多家庭里去了,门槛降低,市场盘子就大了。

拓竹出来之后,不光是拓竹的营收在涨,友商的营收也在涨,说明现在市场还是在增量期,只不过拓竹在里面吃掉了最大的增长份额。

我自己是一个非常喜欢折腾的人,也始终相信一件事,人的天性里有一部分就是「我想要去创造一些东西」,有的人热爱创造的是文字,就去写小说了,有的人热爱创造的是实体的东西,想把脑海的想法变为现实,3D 打印其实是一种实现这种创造的工具。

在没有 3D 打印之前,这些人会去雕木头,做雕塑,画画……

所以我觉得不用神话 3D 打印,不要把 3D 打印变成一个非常高科技,离大家很远的东西,它跟日常生活里的画画,写小说,拼乐高本质上是一样的,都是在帮助大家享受创造的快乐。

只要你能从创造中获得快乐,你很大概率就是 3D 打印的潜在用户。

▲ 拓竹位于深圳湾万象城的首家旗舰店

「MakerWorld 就像苹果的 App Store,只不过我们更开放」

Q:如果把拓竹类比为苹果,X1 类比为初代 iPhone,那么拓竹旗下分享 3D 模型以及创意经验的 MakerWorld 社区是不是相当于 App Store?或者有其他的类比吗?

A:MakerWorld 和 3D 打印机的关系,确实有点像 App Store 和 iPhone 的关系。

不过 MakerWorld 和 App Store 还有点不一样,比如我们比较开源和开放,Android 用户用不了苹果的 App Store,但是我们欢迎所有 3D 打印机的用户,甚至哪怕不是 3D 打印机的用户,只是需要一个模型,都可以来 MakerWorld 社区,并不是说这个社区仅对购买了拓竹产品的用户开放。

我们一直相信,现在 3D 打印还是个增量市场,我们希望把这个市场的盘子做大,而不是跟大家去内卷,品牌之间设立高墙这样。

▲ 3D 打印小挂件

Q:对于拓竹公司来说,MakerWorld 的存在是不是一个必须选项?

A:MakerWorld 和拓竹的关系,其实就像 1 和 0 的关系,硬件始终是那个 1,如果没有拓竹硬件的优势和出货量的优势,MakerWorld 是很难做起来的,我们要客观承认,MakerWorld 的种子用户一定是来自于拓竹硬件的用户。

MakerWorld 对于拓竹的意义在于,它是 1 后面的很多个 0,MakerWorld 做得越好,对拓竹硬件的反哺也越大,对整个 3D 打印市场的破圈效应也越大。

现在 MakerWorld 上头部的创作者一年可以赚 10 万美元,这足够创作者在世界上大部分地方过上体面的生活里,这也是为什么后来优质模型的爆发性增长集中在 MakerWorld 上的原因。因为用爱发电的用户早年确实有,但这些用户的比例会越来越低,平台最终还是需要提供给创作者足够好的商业化能力,能够支持他们哪怕全职创作也能很好生活下去、

最终来讲,优质模型的爆发性增长,也会大大地去反向促进 3D 打印机的销量。

拓竹创始团队在 2020 年创业的时候就想得很清楚了,这个事业要做起来,三个部分必不可少,归结为 3M,第一是 Machine 设备,第二是 Model 模型,第三是 Material 材料。

拓竹拿到第一笔设备销售的回款之后,就开始布局做模型平台了,并且一开始就打算进行持续补贴,因为当时大家就意识到,这个平台不做到一定规模,整个飞轮是转不起来的。

现在我们有一些很出圈的模型,比如那个金箍棒,很多人在小红书还有抖音上刷到别人打印了一个很帅的金箍棒,能发光,还有音效,舞动起来也特别酷,那么这些人就可能入坑 3D 打印,如果没有这样一个金箍棒的模型,大家永远也不知道原来 3D 打印原来可以做这个。

实际上,MakerWorld 会不断地通过优质的模型来扩充大家对 3D 打印能干什么的认知边界。比如说摄影爱好者一开始不会考虑购买 3D 打印机,但是刷到了原来可以用它打印一个「兔笼」(用于相机保护和协助增加外接配件的装置),他就会开始考虑 3D 打印机了,甚至我们还可以手搓出一个 3D 打印长焦镜头出来。

类似的场景和用途被发现之后,也就是大家的 3D 打印机需求被创造出来了,这就是 MakerWorld 这样的模型站在 3D 打印生态里非常重要的一个原因。

早些年 3D 打印机用户在购买之后的前 2 月会疯狂打印,后面产品就开始吃灰了,因为到后面他们觉得没什么好打的了,现在拓竹的数据是,90% 的拓竹用户在购入 12 月之后还在继续打印,这也是模型站非常重要的原因,它能显著降低用户的流失,延长 3D 打印机的生命周期。

Q:MakerWorld 为什么能成为全球第一的 3D 打印社区?相较于极强的硬件能力,中国企业在做全球技术和产品社区的成功案例寥寥无几,这其中的阻碍是什么?

A:第一是决心。

在 0~1 这个阶段,坦白说公司补贴了很多钱,拓竹做 MakerWorld 这件事是有足够的决心的,这些补贴能够帮助我们在早期的时候快速获得优质创作者,以及高质量模型。

前面也提到,拓竹的出货量很大,种子用户也多,尤其是用户有拓竹 3D 打印机,使用 MakerWorld 的「一键打印」功能,是能大大提升用户的打印体验的,我人在深圳,打印机在上海,手机上点一下就可以发送打印任务到上海的设备,再坐个飞机就能回家「收菜」了。

还有个重要的事情,是我们始终是个「Think Big」的公司,我们做社区这件事,最开始就是奔着开源开放去的,我们始终没有设置很多限制让拓竹的 3D 打印机比竞品有相对优势。

如果我们没有「Think Big」,我们可能在这样一个体量的时候,就把 MakerWorld 这个拥有全世界最优质创作者和最大最好模型库的社区围起来,只让拓竹用户使用,这样消费者在购买 3D 打印机的时候,拓竹的产品就会有巨大的优势,我们当然知道这个可能。

但我们想的是,3D 打印行业还远远没到天花板,这是个巨大的增量市场,我们也希望之前买了友商 3D 打印机的用户,也可以访问 MakerWorld,也享受到模型爆发式增长带来的红利,让这些用户也能持续爱好 3D 打印。

只要他们还是 3D 打印的玩家,后续凭借拓竹硬件的产品力也好,凭我们对用户这种真诚的态度也好,那么他们未来那一天也可能成为拓竹的用户。

还有一点就是我们整个团队基本上都是 3D 打印爱好者,离创作者和用户很近,这就让 MakerWorld 是一个很热闹的地方,人和人是有真实连接的。

有一位用户我印象特别深,他是专门做动物救助的,就设计里一个残疾狗狗的 3D 打印辅助轮椅,发布到了 MakerWorld 上,很多社区用户家里没有残疾狗狗,也用不上这个,但依然会为这个创作者投助力券,也会支持和鼓励他。

社区的氛围能让大家感到温暖,这个是很重要的。

当然,社区也是有马太效应的,硬件优势可能在竞品一两代机器的更新后消失掉,但软件或者社区,人们还是倾向于去最热闹,氛围最好的地方,社区一旦成为最强的社区之后,就会越来越强,这是我们看到的趋势。

有些社交媒体上,大家做 3D 打印机购买决策的时候,有些用户也会考虑友商的,但问在哪里下载模型,那大家的认知就是去 MakerWorld。

Q:目前来看,MakerWorld 全球站和中国站合并用户量大概在什么规模?哪些国家和地区的用户最活跃,数量最多?

A:按照月活跃用户的话,差不多是千万量级,MakerWorld 中国站和全球站加在一起的注册用户在 5,000 万左右。

拓竹最开始是卖欧美市场,所以欧美早些年积累的用户比较多,具体讲德国、英国、法国、意大利、西班牙这些都很活跃,非要选一个的话,欧洲最活跃的还是德国,因为德国有比较成熟的 Maker(创客)和工程师文化,包括今年 3D 打印行业最大的展会 formnext 也是在德国法兰克福举办的。

美国人口基数比较大,同时消费能力也很强,这是个大市场就不用多说了,中国市场的特点是增速特别快。

▲ 拓竹用户的 3D 打印作品

Q:MakerWorld 用户开始尝试 3D 打印的时候,打印的第一个东西有没有一些共性?

A:其实大家打印的第一个模型一般不是通过 MakerWorld 打的,本身打印机装好开机测试就会打一个小东西出来,比如拓竹的是一个小船。

真要说打印测试之后的第一个物件,一般还是和打印机相关的配件,比如工具收纳箱,线材收纳箱,因为打印机到手之后,客服那边也会送很多配件,螺丝刀啊,贴纸啊,还有色卡之类的。

说白了就是 3D 打印机到手那一刻开始,很多工具就是用户自己造了,需要什么造什么。

▲ 只要有模型,用户甚至可以 3D 打印一套盔甲

Q:在 MakerWorld 上,内容的创作者(贡献 3D 模型等内容的人)和内容的消费者(只看只下载不发内容的人)比例如何?

A:活跃的创作者有 20 万,然后月活跃用户有千万级,基本上就是这样的一个比例。

▲ 3D 打印已经用各种材质打印出各种质感的作品

Q:内容生产者应该是所有社区最宝贵的财富,但不少社区是让内容生产者用爱发电最终人去楼空,MakerWorld 有没有什么机制去保证社区内容创作者的持续热情,以及客观收益?

保证创作者收益这块我们分成了好几块去做。

第一块就是只要在 MakerWorld 上传了模型,模型被打印和下载后就可以获得积分,也可以被其他用户的「Boost(助力)」,Boost 有点像 B 站的「币」,投出后创作者会获得积分,能够直接兑换代金券、3D 打印机、耗材等商品。

第二块就是创作者拥有一定粉丝量,以及上传了符合要求的模型数量之后,就可以开通独家模型计划,这是我们定义的比较优质的模型,参与这个计划能获得积分收益,然后积分是可以提现,获得现金,这个是很多头部创作者的收入大头。

第三块是 8 月份我们在国际站上上线了众筹项目,当创作者有个非常棒的 idea,并且确定能实现它之后,就可以在 MakerWorld 上进行众筹,等于是出售模型数字文件,STL 或者 3MF 格式的,用户买了这个模型文件,达到众筹门槛之后,创作者也可以获得现金的激励。

现在大部分的众筹模型都能获得几千美金的收益,最好的有 6 万美元,稍微好一点的基本能上万,我们会觉得未来头部创作者很大一部分的收益都会靠众筹模式来实现。

第四块就是创作者的模型如果含有 MakerSupply 套件(专业配件),或者 CyberBrick 套件(可编程模块化智能玩具生态系统)的话,其他用户从这里下单,也是可以获得销售收入的分成的,这也是很多头部创作者很大的收入来源。

特别是 MakerSupply 套件,前面说的金箍棒就包含了很多 MakerSupply 套件,如果用户要去打印这个金箍棒,就会去买 MakerSupply 的 Kit,那么创作者就能获得销售分成。

▲ 3D 打印出一个头盔也不在话下

「我们的购物需求,会变成造物需求」

Q:行业目前比较关注过去几年行业关注比较多的是文生文,文生图,这两年文生视频很火,现在生成式 CAD 也比较火,理论上来说,未来的 3D 打印,是不是也存在着「从语言到模型到 3D 成品」的极简路径?

A:这是有可能的,不过以目前的技术来看,我认为还是有比较大的距离。

生成模型已经有不少比较成熟的方案,但是 AI 生成的模型到可打印这件事,中间会遇到非常多的困难。

AI 生成的模型往往会包含很多种颜色,现在消费者买的消费级 3D 打印机,不一定买了多色系统,一般的多色系统也就 4 个颜色,很难复现 AI 的建模。

另外 FDM(熔融沉积,最常见的 3D 打印技术路线)打印会有很深的层纹,打印出来要做很多的后处理才会好看,成熟的建模师往往会做拆件建模,比如一个 labubu,如果直接一体打印的话,脸上全是层纹,根本看不了,需要通过拆件去打印,把脸啊,身子啊,拆下来,放平再打印,这样层纹才会少。

但是拆件对于 AI 建模来说太难了。

还有就是 AI 生成的模型,可能会有很多的面数,动不动就几百个面甚至更多,导入切片软件的时候,速度很慢,会出各种各样的问题。人类建模师做的模型,往往不会包含那么多的面,因为人知道怎么去避免一些容易打印失败的设计,比如 3D 打印大角度垂悬的效果就不太好,有些东西是人知道,AI 不知道的。

所以说,「从语言到模型到 3D 成品」的极简路径中间,还有很多扎实的工程工作需要做。

▲ 拓竹的旗舰产品除了 3D 打印,也有绘画和激光切割的功能

Q:十多年前聊 3D 打印的时候,聊的是每个人都可以用 3D 打印实现自己的个性化制造,是先进工业制造的重要组成部分,现在看,我们离这一天还有多远?

A:我可以举个例子,我之前开车的时候,墨镜要放在扶手箱里,就觉得很不方便,我就想打印一个眼镜夹在遮阳板哪里,其实去拼多多几块钱也能买到了,但我想着 MakerWorld 上应该有相应的模型,一搜,还真有,而且还是特别针对我那个车型的,因为我那个车的遮阳板会比较厚一些。

我想说的是,随着用户规模的扩大,MakerWorld 就会有点像淘宝或者拼多多,很多东西只要你去搜,就发现你能想到的需求别人也想到了,并且还做出来了。

当然反过来说, 3D 打印一切的设想还没到来,在中国还有拼多多这些太便宜太全了的原因,几块钱就包邮,很多人就觉得没必要自己打印。但是国外的情况不太一样,住在美国乡下想要搞一个几块钱包邮的东西不太可能,这个时候自己动手反而是方便的。

如果说,MakerWorld 和拓竹能够像拼多多那样,上去搜一下,就能找到我想要的一个东西,随手就能打印出来,这会是一个伟大的变化。

这个时候,我的购物需求,就会变成造物需求。

虽然现在不能 100% 满足这个需求,但从 1% 的可能性开始,到 50% 机会的时候,随着用户量和模型的增长,质变还是会产生的。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


小米汽车 608 天交付 50 万辆,刷新全球新势力最快纪录

不到 20 个月,交付超 50 万辆——小米汽车刷新了全球新能源车企达成这一里程碑的最快纪录。

12 月 2 日,小米正式宣布,小米汽车累计交付量突破了 50 万台,年初设定的 35 万辆年度交付目标也已提前达成。

自 2024 年 4 月 3 日 SU7 创始版首次交付以来,小米达成这一成就用时仅 608 天。

这一速度不仅远超蔚来、小鹏、理想等中国新势力早期爬坡阶段,甚至比特斯拉 Model 3 量产初期的交付节奏更为迅猛。

第 50 万辆小米汽车车主是一位 42 岁的工程师,他选择是一辆宝石绿配色的小米 YU7。

事实上,早在 11 月 20 日,小米就已在工厂举行了第 50 万台整车下线仪式。当时,小米创始人雷军强调:

 这一节点不仅是数字的突破,更标志着小米汽车进入规模化新阶段。

为应对持续增长的订单压力,小米汽车北京工厂一期已实现 15 万辆/年的满负荷运转;二期项目投产后,整体设计年产能将提升至 30 万辆。通过实施双班制生产,目前小米汽车的交付周期有所缩短,SU7 系列的等待时间从高峰期的近半年压缩至目前的 3–6 周,YU7 系列也缩短了 2–4 周。

与此同时,小米汽车还于近日上线「现车选购」服务,提供一批无需等待的现车资源,用户锁单后可在 2024 年底前完成提车。这批现车主要来源于官方识别并处理的异常订单、因不可抗力无法履约的用户退订车辆,以及门店静态展车和轻微运损车等。

交付提速不仅提升了用户体验,也推动小米汽车在财务层面迎来关键拐点。

今年第三季度,小米汽车及 AI 等创新业务收入 290 亿元,同比增长 199.%,其中汽车收入 283 亿元、售后服务及汽车金融等业务收入 7 亿元;经营盈利 7 亿元,首次实现单季度经营收益转正,也是为数不多已经实现盈利的新势力车企。

目前,小米汽车已形成「SU7 轿车 + YU7 SUV」的双支柱产品格局,并正加速推进下一代产品布局。

据多方消息,2026 年小米将密集推出多款新车,包括 YU9 大型 SUV、SU7 改款、SU7 加长版以及 YU7 高性能版。此外,一款代号为「曼岛」的增程式房车也处于规划阶段。

其中,YU9 大概率定位为搭载 70 度或 90 度电池包的增程大型 SUV,直接切入理想 L 系列、问界 M7/M9 的核心市场,很大概率会对现有增程 SUV 格局或将构成实质性冲击。

我们大概率将在本月小米 17 Ultra 的发布会上看到有关小米 YU9 的相关信息。

▲ 小米 YU9 假想图

在拓展国内市场的同时,小米汽车也在积极布局全球化战略。

雷军此前透露,公司计划于 2027 年启动出海进程,初期重点聚焦欧洲市场。就在上周,小米 SU7 Ultra 已在德国开展了为期两天的定向邀约试驾活动,标志着其国际化步伐正稳步推进。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


续航超越秦 PLUS、舒适碾压银河 L6,日产 N6 9.19 万元起杀入插混主战场

日产 N6 刚刚正式公布了上市价格:

180 Air 9.19 万元;

180 Pro 10.19 万元;

180 Max 10.69 万元;

180 Max+ 11.39 万元;

170 Max+ 旗舰 12.19 万元。

相比此前预售阶段,N6 在正式上市时新增了入门版 Air 与顶配 Max+ 旗舰版 两个配置,并将其余车型价格统一下调 8,000 元,进一步强化了性价比。

东风日产为 N6 打出了三张核心,分别是「超长纯电续航」、「越级舒适体验」和「全生命周期的安全承诺」。

N6 搭载日产自研的 「AI 云擎电混系统」,由一台 1.5L 75kW 的专用发动机与 155kW 驱动电机组成。

两款 Max+ 车型配备 20.3kWh 宁德时代磷酸铁锂电池,其余三款则搭载 21.1kWh 瑞浦兰钧磷酸铁锂电池,CLTC 纯电续航分别为 170 km 和 180 km,显著优于比亚迪秦 PLUS(120 km)和吉利银河 L6(137 km),足以满足多数城市用户「一周一充」的通勤需求。

新车同时支持最大 42kW 的直流充电,从 30% 电量补至 80% 约 17 分钟,车辆整体亏电油耗低至 2.79L/100km。

结合家庭用户既要电车低成本,又要油车便利性的诉求,日产在 N6 发布会上提出「四个 2 标准」,即 N6 同时拥有 2L 级亏电油耗、20 度以上电池,支持 20 分钟快充以及全年出行成本不超过 2000 元。

如果说动力是基础,那舒适性就是 N6 的王牌。日产显然要把「移动大沙发」的标签焊死在自家产品上。

继上次把 N7 上的副驾座椅制成办公椅后,他们这次又把 N6 后排的座椅改造成了可以在客厅使用的双人沙发,直接摆满了整个发布会现场。

走进去的一瞬间我甚至有点恍惚,以为自己进入了某个家具展销会的现场。

N6 长宽高为 4831×1885×1491mm,轴距 2815mm,略小于 N7,但在一众同价位家用轿车中也算佼佼者,整车做到了 87% 的得房率。

车辆前排沿用 N7 备受好评的「AI 零压云感座椅」,内置 49 个传感器组成的「电子皮肤系统」,可实时感知体态并自动调节支撑。后排则采用四层复合结构的「零压云毯大沙发」,日产甚至自信宣称其舒适度「比肩迈巴赫」。

N6 的底盘调校也同样强调舒适性,日产 N6 采用前麦弗逊式独立悬架、后扭力梁式非独立悬架的形式,搭载全域智能防晕车技术,联合中山大学附属第一医院共同开发,通过底盘、动力、辅助驾驶系统配合智能蠕行、舒适刹停、防溜坡辅助、智能扭矩补偿、弯道智能减速控制等功能,进行主动、被动全面的协同防晕,同时力求在加速平顺性与滤震表现上超越同级。

面对目前长期存在安全焦虑,尤其是高速失速、电池自燃等事故带来的不信任感,日产则推出了一项「兜底」承诺——

只要因三电系统质量问题导致自燃,无论是否首任车主、是否在质保期内,终身赔付同配置新车。

这一「兜底」承诺的背后,是一整套严苛的安全体系支撑。据官方披露,N6 在开发过程中执行了 7400 余项研发验证 与 5500 多项试制品控流程。

车身结构上,N6 采用五横十纵笼式车身,扭转刚度达 35738 N·m/deg,处于同级领先水平。其搭载的 「云盾」电池系统 从结构、电芯、热管理等 六个维度 进行安全设计,并已完成 60 万公里振动耐久测试 与 六针刺穿实验,相关标准不仅远超现行国标,更提前满足 2026 年即将实施的新规要求。

在行驶安全方面,N6 成为行业首款通过中汽中心「插混不失速」认证 的车型,并标配包括 ESA 紧急转向辅助在内的 16 项主动安全功能。

作为合资品牌本土化的标杆车企,日产 N6 的智能化水平也延续了 N7 的务实策略。

N6 高配车型搭载 15.6 英寸 2.5K 屏、高通骁龙 8775 芯片(中低配为 8155),运行自研 NISSAN OS 系统,语音交互系统融合科大讯飞星火与 DeepSeek 大模型,支持方言识别与连续对话。

此外,N6 还联合 Rokid 推出量产 AI 智能眼镜,可将导航、车速等关键信息投射至镜片,提升驾驶沉浸感。

但是受芯片供应影响,8775 芯片版本将推迟至 2025 年春节前后交付。

虽然日产 N6 被网友戏称为 「小 N7」,但两者所处的竞争环境其实大不相同。

N7 凭借鲜明的产品差异化,曾实现月销破万,证明只要体验足够独特,消费者仍愿为合资品牌买单。但近两月,随着竞品密集投放,其销量已回落至 6000 辆左右。东风日产亟需一款 覆盖更广用户群、更具性价比的产品来稳住新能源基本盘。

插混看似是一个很好的突破口,相比纯电,插混车型无里程焦虑,更适合中国家庭多元出行场景;相比燃油车,又具备政策与使用成本优势。

然而现实是,插电混动轿车市场已经被比亚迪与吉利牢牢占据,销量前十中,两家品牌就包揽了 8 席,其余玩家只能在夹缝中求生。

因此,日产 N6 显然也不是奔着撼动比亚迪或吉利的市场地位去的,它的目标更现实——在年销百万辆的插混大盘中,抢下几万辆份额,稳住东风日产在新能源时代的用户基本盘。

面对已经高度成熟且反应迅速的本土竞争对手,合资品牌的转型既需要技术积累,也考验组织效率和市场敏感度。

N6 未必能成为大爆款,但它至少代表了日产仍旧在坚守在务实的方向上——在智能化和参数竞赛之外,把基础体验做得更扎实,也是一种思路。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


TopGear 评选出了 18 辆年度汽车,但仅有一辆来自中国

知名汽车媒体 TopGear 近日发布了其备受关注的「年度汽车」榜单,他们从各个细分市场中挑选出了约 20 辆「杰出」的车型。

但值得注意的是,其中不少获奖者对中国消费者来说相当冷门——它们或许并未引进国内,甚至从未出现在主流视野中。

但小众不等于边缘,实用未必牺牲个性,电动化浪潮下的声浪与机械质感也依然弥足珍贵。

我们从中挑选出了几个颇具代表性的奖项,并进行了简单介绍,希望能让你了解到,站在欧洲视角,今天的全球汽车工业正在关注什么、推崇什么,又在为什么而兴奋或焦虑。

年度汽车——宝马新世代 iX3

Top Gear 将今年的「年度汽车」大奖颁给了宝马「新世代」(Neue Klasse)战略下的首款量产车型——全新 iX3。

他们评价道:

「这款 iX3 从内到外、从头到脚,甚至从地面到云端,都焕然一新。在经历了多年的设计徘徊之后,宝马的设计师们终于找对了方向。」 「座舱氛围宁静雅致,驾驶感受也真正回归了宝马应有的水准——既不像笨重的电动跨界车,也不似那些缺乏灵魂、一味追求数字化的『僵尸座驾』。」

作为宝马「新世代」战略的开山之作,全新 iX3 基于品牌全新研发的纯电动专属平台 NCAR(New Cluster Architecture)打造,彻底告别了以往油电共用的底层架构。这一转变不仅让车辆的操控性能显著提升,也在续航表现和补能速度上迈入全新高度。

其座舱以「视觉锥」理念为核心,在近年来略显沉闷甚至「无聊」的汽车设计环境中,堪称一股清流——少有的真正创新。

正因如此,iX3 在欧洲市场广受好评,成为当下难得一见的优秀纯电车型。它获选 Top Gear 年度汽车,实至名归。

年度最佳设计——达契亚 Hipster 概念车

年度最佳设计奖颁给了一款纯电动城市概念车——达契亚(Dacia)打造的 Hipster。

这辆小车仅 3 米长、1.5 米宽,却巧妙容纳了四个座位和高达 500 升的后备厢空间。尽管其续航里程约为 150 公里,但达契亚官方强调,这一数据已足以覆盖绝大多数日常通勤与城市出行需求。

为了极致控制成本与重量,Hipster 采用了大量非常规但极具巧思的设计方案:

  • 内外门把手被轻质织带取代;
  • 侧窗采用手动滑动开启方式,省去了复杂的电动机构;
  • 尾灯则被巧妙集成在后挡风玻璃内侧,不仅节省了独立灯罩,还简化了车身结构。

车内更是大胆摒弃了当下流行的中控大屏,转而设置一个简洁的手机支架——鼓励用户「自带设备」,将智能手机作为车机系统的延伸。

Top Gear 对此评价道:

「如果你设计的东西恰好是人们真正想要的,那你就已经赢了一半。最大化车内空间往往会让车辆变成一个方盒子,而尽可能缩短前后悬,其实是个聪明又实用的思路。」「达契亚毫不避讳地承认:Hipster 就是个装在四个轮子上的方块——只不过,是个带着欢快表情的方块。」

年度家用车——起亚 PV5

起亚 PV5 在前不久的日本移动出行展上刚刚正式亮相。

这款新车最大的亮点在于采用了起亚全新开发的 PBV(Platform Beyond Vehicle)模块化平台架构。该架构的核心理念是「一底多用」——在统一的下车身结构基础上,上车身可根据不同使用场景灵活变换,衍生出乘用车、货运车、出租车、共享接驳车,甚至特种用途车辆。

此次亮相的乘用版 PV5 是一款车长 4.7 米的五座 MPV,造型简洁而富有未来感。它不仅拥有极为宽敞的乘坐空间,更配备了一个尺寸惊人的后备厢。外观方面,PV5 采用了起亚最新一代电动化设计语言:标志性的日间行车灯以直立波折形态呈现,极具辨识度;双侧电动滑门则进一步提升了上下车的便利性与高级感。

进入车内,驾驶舱的设计出人意料地偏向轻型商用车风格——前中控台采用悬浮式布局,搭配一块小巧精致的液晶仪表盘与一块悬浮式中控屏,既保留了功能性,又不失现代感。而后备厢区域更是充满巧思:两侧设有标准滑轨系统,可快速安装救护包、移动杯架、储物模块,甚至能轻松改装为露营装备平台,实现从城市通勤到户外生活的无缝切换。

Top Gear 在试驾后评价道:

驾驶它令人愉悦,坐姿高挑而掌控感十足——更像是掌舵一艘船,而非握着一辆车的方向盘;行驶质感与精致度都极为奢华;更重要的是,它拥有我们在大众 ID. Buzz 身上为之倾倒的那种「愉悦感」。

年度轿车——奔驰纯电 CLA

它的行驶姿态柔韧而从容,减震恰到好处,且异常静谧。转向手感顺滑如经油润,后轮驱动更赋予其纯粹的驾控质感。座椅极为出色,座舱界面无论在操作逻辑还是美学设计上都令人愉悦。

今年,奔驰一口气推出了两款基于全新纯电架构打造的车型——GLC 和 CLA。尽管在中国市场 SUV 更受青睐,但在欧洲,流线优雅的纯电 CLA 显然更对当地消费者的胃口。

作为奔驰 MMA(Mercedes-Benz Modular Architecture)平台 的首款量产车型,全新纯电 CLA 彻底告别了「油改电」的过渡姿态,在续航能力、能耗效率和补能速度等方面实现了全面跃升。

得益于 800V 高压电气架构、碳化硅(SiC)逆变器 以及行业罕见的 两档变速箱,高配版 CLA 在 WLTP 工况下的百公里能耗低至 12.2 千瓦时。配合一块容量为 85 千瓦时的三元锂电池,官方宣称其最大续航里程可达 792 公里——这一数据在同级纯电轿车中堪称亮眼。

动力系统方面,后驱版本搭载一台最大功率 175 kW(238 马力) 的电机,0-100 km/h 加速时间为 6.7 秒;四驱版本则采用双电机布局——后轴电机输出 200 kW,前轴辅助 80 kW,综合性能更为强劲,零百加速时间缩短至 约 4 秒,兼顾日常舒适与偶尔的驾驶激情。

座舱设计上,CLA 毫无疑问地搭载了奔驰最新的数字化内饰语言。三块屏幕横向贯穿整个仪表台。

内饰用料延续了奔驰一贯的精致水准。白色实木饰板以细腻的竖向条纹处理,温润而不失现代感;各类物理按键和旋钮均采用全新设计的「姿态曲线」造型,在环境氛围灯的柔和映衬下,营造出既豪华又富有情绪张力的座舱氛围。

外观设计则将「情绪价值」拉满。全新 CLA 的前脸密布 142 颗可点亮的三叉星徽,不仅全部支持动态点亮,还能以呼吸式的律动「向你打招呼」。前后大灯组由一条贯穿式光带连接左右,灯腔内部的核心元素——无论是日行灯还是转向灯——均以三叉星徽为设计母题,形成强烈的视觉识别符号。

作为一款陪伴你走过人生旅程的座驾,它堪称完美。

年度旅行车——奥迪 A6 avant

这或许是今年最毫无争议的一个奖项。

今年 3 月发布的全新 奥迪 A6 Avant,在上一代车型的基础上融入了更多 A7 的设计语言,整体姿态更加修长、优雅且富有动感。尽管线条更为流畅,它依然延续了奥迪旅行车一贯的高颜值传统。车身总长较前代增加了 60 毫米,轴距达到 2927 毫米,为长途旅行提供了更为宽敞舒适的驾乘空间。

更重要的是,这款新车成为 有史以来风阻系数最低的燃油动力奥迪旅行车,Cd 值仅为 0.25。这一优异的空气动力学表现,结合轻量化新材料、优化后的发动机悬置系统以及全新设计的变速箱齿轮,使车内噪音水平显著降低 达 30%——静谧性已逼近豪华电动车水准。

座舱同样迎来全面升级。全新 A6 Avant 搭载奥迪最新的数字化内饰架构:中控区域换装为一块 曲面 OLED 联屏,视觉效果更具沉浸感;副驾驶前方新增一块独立娱乐屏(可选),配合更宽幅、更多色温可调的氛围灯带,将科技感与豪华氛围推向新高度。无论是用料、工艺还是人机交互体验,内饰的整体质感都实现了质的飞跃。

正如 TopGear 所言,

旅行车比 SUV 更酷……这是事实。而在过去 12 个月推出的旅行车中,没有哪一款比奥迪 A6 Avant 更能清晰地证明这一点——它堪称能力最为全面、毫不妥协的旅行车。

年度越野车——路虎卫士 OCTA

为什么路虎卫士 Octa 能当选我们的年度越野车?很简单——它是一台搭载 626 马力 V8 发动机、热衷于腾空飞跃的卫士。恭喜,晚安。

5 月份路虎对旗下的卫士车型进行了一次改款,对车身外观细节进行了调整,包括全新的半圆形 LED 大灯、深色嵌入式尾灯,以及重新设计的前后保险杠和亮黑色格栅。引擎盖嵌件和侧通风口也采用了新的纹理图案,前后包围可选银色或缎面灰色涂装,整体风格更显现代感。

新卫士还提供了「探索套装」、「冒险套装」和「城市套装」三种套件,并且可以单独选购黑色外观的车顶行李架、横杆、底盘保护等配件,以及可伸缩或固定侧踏板、哑光黑色引擎盖贴花等个性化装饰。

OCTA 作为卫士面对极致性能的版本,不仅搭载了 4.4T 双涡轮增压 V8 发动机,还提供了更具视觉冲击力的「沧渊蓝(Sargasso Blue)」车色、纹理石墨装饰、碳纤维内外饰件以及巴塔哥尼亚白哑光贴膜等专属选装。

内饰层面,改款后的卫士采用了全新的 13.1 英寸触摸屏,中控屏尺寸更大,在操作便捷性和智能化水平上也有提升,新卫士的前排座椅改为了一体式设计,座椅的包裹性和支撑性都有所提升。

在核心的越野能力上,新卫士改款提供了升级版的全地形进程控制系统(自适应越野巡航控制系统)作为选装。这套系统能在复杂越野环境下自动控制车速,帮助驾驶员将精力更多地集中在路线选择和转向操作上,旨在提升越野时的控制体验。

在海外市场,路虎卫士的地位,确实无人能够撼动。

年度超跑——法拉利 296 Speciale

7 月份曾在国内亮相的法拉利 296 Speciale 是法拉利高性能序列的最新成员。

动力系统是其最令人瞩目的革新,新车搭载了 3.0T V6 双涡轮增压发动机与插电混动系统,综合功率达到了 881 马力,刷新了法拉利后驱车型的动力纪录,其 0-100km/h 加速时间仅需 2.8 秒,最高车速可达 330km/h。

作为 Speciale 家族的第五代作品,,新车长宽高分别为 4625/1968/1181mm,轴距 2600mm。相较于 GTS 和 GTB 版本,Speciale 拥有更宽的车身和更低的高度。

为了更好的赛道性能,296 Speciale 取消了 GTB 上的部分舒适性配置,包括电动座椅、厚重的内饰隔音材料以及液晶副驾驶娱乐屏。车体则大幅使用碳纤维材料,连内饰门板也被换成单片碳板,整车重量最终被控制在 1410 公斤。

在法拉利的产品哲学中,GTS/GTB 是「人人都能驾驭」的跑车典范,而 Speciale 则是「不是所有人都能驾驭」的机器本能。

296 Speciale 再次在所有关键性能指标上树立了新标杆,更不用说那些无法用算法衡量的方面了——它完美融合了模拟与数字的精髓。

年度最佳声浪——福特野马 GTD

5 月份,一辆 Mustang GTD 在纽北赛道上以6 分 57 秒 685 的圈速冲过终点,成为全球首款跑入 7 分钟大关的北美量产跑车,也让它跻身全球最快量产跑车第六位,与保时捷 911 GT2 RS、兰博基尼 Huracán Performante 等欧洲超跑处于同一水平。

为了这份成绩单,福特在这台车上安置了一台 5.2 升机械增压 V8 发动机,输出 815 匹马力和 900N·m 的扭矩,配合后置布局,实现了接近 50/50 的完美重量分配,0-96km/h 加速仅需 3 秒,极速 325km/h。

其配备的干式油底壳润滑系统,配合钛合金 Akrapovic 排气系统,让车辆不仅可以在赛道上释放出野兽般的咆哮,还能让驾驶者在日常巡航时也享受低沉的轰鸣。

TopGear 评价到:

幼稚?我们?绝不可能!这可不只是噪音而已——这是实实在在、粗粝起伏的声波,强劲到仿佛能嚼在嘴里。那是一种沙哑咆哮的 V8 轰鸣,在美国或许司空见惯,但在其他地方,却堪称对那些温顺如教堂老鼠般的电动车一记酣畅淋漓的「去你的」!

但想买到这辆车并不容易,福特对买家设置了严格的门槛:需要提交购车动机视频、赛车经验证明,或者社交媒体影响力,并且两年内不得转售。

新车全球限量生产 2000 台,基础版的价格为 32.5 万美元(折合人民币 235 万元)。

年度时刻——仰望 U9

10 月 21 日,仰望和纽北官方正式公布了 U9 Xtreme(简称 U9X)在德国纽博格林北环赛道的圈速成绩——6 分 59 秒 157。

这一成绩,正式刷新了此前由小米 SU7 Ultra 创造的 7 分 09 秒纪录,让「纽北最速量产电动车」的名号易主。

这也让 U9X 成为了一个特殊的存在:它是目前全球唯一一款同时包揽「纽北最速量产电车圈速」和「全球汽车极速纪录(496.22 km/h)」的车型。

TopGear 用了一段颇具史诗感的话来描述这一时刻:

击败布加迪似乎只是仰望。它已凭借 6 分 59.16 秒的成绩,刷新了纽博格林赛道最快量产电动跑车的圈速纪录。而下一个目标,是突破 500 公里/小时。

世界,你已被警告。

除了上述这些,TopGear 评选出的奖项还有:

  • 年度跨界车——雷诺 4
  • 年度豪华车——劳斯莱斯 Black Badge Spectre
  • 终身成就奖——Andreas Preuninger(保时捷 GT 车型项目总监)
  • 年度超级小车——现代 Inster
  • 年度超跑(Hypercar)——法拉利 F80
  • 年度制造商——雷诺集团
  • 年度高性能车——Kimera EV037
  • 年度超级 SUV——阿斯顿马丁 DBX S
  • 2026 最期待的车——布加迪陀飞轮

看完这份榜单,或许有些读者会有和我同样的感受。

在新能源时代,海外市场和国内市场的对车辆的审美、功能和定价的认知,已经产生了显著差异。

这一点在 BBA 的新车身上展现的尤为明显。海外媒体普遍推崇宝马 iX3 整体语言回归 Neue Klasse 车系时期这一举动,认为这套新设计语言有着高度的统一性。

但是在董车会之前发布的投票中,有近 80% 的读者认为 iX3 的设计只能用「丑」来形容。

奔驰的 GLC EV 也面临着同样的处境。

海外用户普遍觉得奔驰身上迎合中国市场的味道太重,「都是因为中国人喜欢大大的三叉星辉」;而国内用户则觉得 GLC EV 的本土化程度还不够,「过多的 Logo 显得整辆车很廉价」,并且一辆大概率售价要到 30W 以上的车,没有激光雷达,很多舒适性配置也要选装,对于国内用户是一件很难接受的事。

而在家用轿车和 SUV 领域,中国消费者的核心关切早已转向智能交互、本土生态与空间实用性。

海外车企们「一招鲜吃遍天」的全球车时代,早就已经远去了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


华为Mate X7 评测:折叠屏的尽头,是让你忘记它在折叠

作为爱范儿编辑部站着喝水而用折叠屏的唯一的人,我愈发感觉到:

2025 年对于大折叠屏市场来说,可以看作折叠屏顺利进化,跨过「刻奇」产品的节点,正式步入了和直板机平分秋色的阶段。

而这个进化的最新例子,就是爱范儿手中这台华为Mate X7 典藏版。

作为华为自 2019 年加入折叠屏市场以来第六年的产品,这块 8 寸的大屏得益于鸿蒙 6 的加持,真正做到了「让大屏有大用」。这样的 Mate X7,无论是硬件还是软件的体验,完成度都相当高。

消费者对华为折叠屏是买账的。根据 IDC 中国的统计,截至今年前三季度,华为以一己之力吃下了国内折叠屏市场的七成份额,和其他品牌已经完全不在一个量级:

这其中固然有 Pocket 系列、Pura X 的功劳,但在这个各家品牌都在明里暗里放弃小折叠,消费者的需求也越来越务实的时候,支撑起华为这七成市场份额的主力,其实还是 Mate X 系列。

而在体验过搭载鸿蒙 5.1 的 Mate XTs 之后,搭配最新版鸿蒙 6 的 Mate X7,竟然第一次有了让我想要换用的冲动。

半边手机也能影像不妥协

长久以来,我们在讨论折叠屏时总会预设一个大前提:

受制于内部空间,它的硬件参数一定是落后于直板机的。

这个预设过于流行,以至于最后演变成了一种广泛的心理预期,即折叠屏的体验受使用场景的影响非常大,好用的时候超好用、难用的时候超难用。

而华为Mate X7 就是对这个预期的明确反对——

折叠屏的使用体验不一定是参差不齐的,折叠屏也可以像直板机一样体验均衡。

比如对于折叠屏的传统弱势项目「拍照」,华为Mate X7 就采取了一条最简单,同时也是最有效的方案:

依然把机身做得轻薄,但也不遮掩巨大的镜头模组,直截了当地告诉用户,这是用体积交换来的拍照表现。

更具体地说,我们手中这台 Mate X7 典藏版采用了与 Mate 80 Pro Max 同款的 5000 万像素超高动态摄像头,不出意外的话仍然是豪威科技的 LOFIC 高动态范围方案,以及熟悉的 f1.49 – f4 十档物理光圈。

而 Mate X7 相比 Mate X6 升级最大的就是长焦了。

今年无论是标准版还是典藏版,都用上了一颗规格与 Mate 80 Pro Max 近似的 5000 万像素长焦微距镜头,最大光圈也来到了 f2.2,搭配 RYYB 传感器的感光度优势,让 Mate X7 拥有了超出预期的夜景表现

同时,Mate X7 优秀的表现也并不限于夜景。红枫原色摄像头进化到第二代,华为的 XMAGE 影像品牌也积累了相当丰富的经验,目前鸿蒙 6 中的几种预设风格已经取得了相当微妙的平衡。

可以这么形容这种平衡:Mate X7 的影调,既不像苹果、三星、谷歌那样平平无奇,又不像小米、vivo、OPPO 那样容易算法喧宾夺主,而是一种「不横加干涉的同时还有足够参与感」的处理,老少咸宜、百尝不厌。

而在一些复杂光源下,这颗第二代红枫原色摄像头也发挥了它应有的作用,即使环境光干扰严重的时候也能很好的辨别出色彩,既让画面内的各处物体自然地反映环境光,又不会出现光混导致的颜色溢出

让大屏变好用的 AI

而在硬件的另一边,则是华为Mate X7 今年的升级重点——得到进一步赋能的 AI 小艺。

实际上,早在去年年末伴随华为Mate X6 一同发布的「小艺私语」已经让我这种平时不喜欢用语音助手的用户产生了兴趣。

而在 Mate X7 与配套的鸿蒙 6 上,最新版本的小艺同样没有让人失望,带来了更多巧妙的构思。

比如作为本次发布会上 Mate X7 环节的重点,鸿蒙 6 小艺的「分屏联动」成为了我们在评测这段时间使用比较多的一项 AI 功能。

小艺分屏联动的重点在于,它让 Mate X7 这块大屏真正有了 buff 加成:

相比传统的 AI 辅助工具期望着让第三方 app 接入系统 API,鸿蒙 6 小艺采取了一个在软件碎片化时代最粗暴也最有效的方案:光学字符识别 (OCR)。

换言之,你不仅可以问小艺屏幕另一边屏幕上的文章或者信息,哪怕是图片里面混乱的路线,或者细节信息,甚至是尝试读懂闲鱼黑话,小艺的分屏联动都可以直接搞定:

其实类似的功能并不是鸿蒙 6 中独有的,各家的 AI 语音助手或多或少都有效果类似的功能,但华为在 Mate X7 上做到了一件很重要的事情:

小艺分屏联动是一个整合进系统入口的、不干扰页面显示的连续功能。

这也就意味着,你可以随时在一个第三方 app 内唤醒小艺助手,一边浏览一边问小艺。小艺会在你手指停下之后自动进行一次 OCR 让你进行提问,如果不提问就等你下一次手指停下继续识别,不会像屏幕底部呼出那样遮挡内容让你无法进行同步操作

而这也是我在使用过数台折叠屏手机之后,第一次体验到系统级的功能让折叠屏的分屏模式真正有了意义。毕竟从实用性和信息密度上来说,它甚至超过了谷歌的「圈选搜索」(Circle to Search)

▲ 看前面就没有办法继续浏览后面了

今年 Mate X7 的另一项重点 AI 功能则是新推出的「小艺帮帮忙」,它的实现方法和小艺分屏联动如出一辙,只不过在借助 OCR 识别内容之后,它还能帮你点击屏幕执行操作。

就拿最简单的周期性购物来说,无论是纸巾、咖啡、外卖、午饭,还是电视、电脑、电冰箱洗衣机,「小艺帮帮忙」可以实现的,就是让你只需要动动嘴和点下付款,小艺就能帮你把东西买齐

当然,如此小布尔乔亚的享受,在现阶段依然是有些体验不足的。

首先,由于小艺帮帮忙目前仍处在众测阶段,它的理解能力还仅限于一些简单操作,比如「帮我买挂耳咖啡」能听懂,「帮我堵桥」就不行了:

更要命的是,由于这是一个内嵌在小艺内部的功能,这导致它的唤醒词不是非常的清晰,经常出现小艺不给你帮忙,还在一个劲帮你用 AI 解答的情况:

其次,也是现在小艺帮帮忙在 Mate X7 上的最大问题,就是它不支持在展开的状态下帮你操作

虽然这可能和小艺使用的 app 界面训练库有关,但完全可以像分屏联动那样将一半屏幕交给小艺,让 app 在单屏布局下显示并让小艺执行。

但是现在面对这种无能为力的操作,只能等待后续的模型更新了。

不过这个问题也并非没有解法,比如目前众测版的小艺帮帮忙可以学习你的点击操作,并将这些操作方式保存成快捷模板。只不过一旦 app 的布局发生变化,这种模仿就没法用了。

另一个在 Mate X7 上体验不错的功能则是小艺新增的 A2A 智能体功能,用一句话来总结,其实就是「让专业的人干专业的事」——只不过这些人都是各个领域的 AI agent。

比如咨询航班这方面,如果你直接向小艺提问「帮我查一下 XX 飞 XX 的航班」,它会调用同程的程心 AI 给出一份比较笼统的当日航班信息:

但对于已经接入小艺 A2A 的航司智能体——比如深圳航空——小艺就会直接转岗给深航智能体,生成一份带有清晰格式和舱位等级的可选时刻表:

类似的用法还包括东方财富、喜马拉雅和叮咚买菜等等。目前来看,小艺 A2A 能力的加强更多在于让小艺的 AI 能力跳出单纯的 LLM 范畴,直接接入更具体的使用场景以高效提供信息。

从当前版本的使用体验来看,这条 A2A 的道路还是相当令人期待的。

但对于这种既需要手机厂商,也需要第三方服务厂商发力建设 AI 模型的功能,未来究竟能适配多少家服务商仍然有待观望。

▲ 图为东方财富的「妙想金融」智能体

但如果从真正的「每日使用频率」来评价的话,Mate X7 上的小艺无疑是目前我使用最多、也最愿意用的。

折叠屏的拐点即将到来

今年是华为推出折叠屏手机以来的第六年,也是「折叠屏」这个品类重回大众视野的第六年。

虽然比起历史接近二十年的「直板智能机」,折叠屏在今天仍然有一些成熟度方面的问题,但至少这一次的华为Mate X7 让我感觉到:

这个品类已经接近了成熟的拐点。

这其中不单是上面提到的,Mate X7 是一台敢于忽视身材、直接为关键体验点(比如相机)堆料的产品;也不单是这套鸿蒙 6 + 小艺的生态组合满足了很多对于「帮我省事的 AI」的初始设想。

所有这一切,都离不开这些功能下面,相比直板机也不逊色的硬件能力——

比如 Mate X7 内屏 2500 尼特、外屏 3000 尼特的峰值亮度,让它在广州的户外使用成了一件完全不需要担心的事情;也比如它 IP68 和 IP69 的双重认证,让「带着折叠屏泡澡」也成为了一种可能。

虽然相比上一代机型,今年的 Mate X7 没有带来什么突破性的硬件提升,但它却是一个近年来非常难得的、在各方面的能力都相当优秀且平均的产品,更不用说在「影像」这个折叠屏的传统弱项上的重点发力了。

换言之,华为Mate X7 就是现阶段大折叠产品分类里的综合表现第一名。它当然有一些固有的缺陷,但在其他实用场景里的优秀表现,已经足以弥补这些缺陷了。

作为目前国内折叠手机市场里无可争议的「王者」,华为Mate X7 很特殊的一点在于,它的旗舰属性不是纯靠硬件堆出来的

但这并不是说华为不愿意堆料,正好相反:

怎么让软件把折叠屏里能塞下的硬件转化成优势,是其他所有折叠屏,包括我手里的三星 Z Fold7,都亟需学习一个的地方。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


1 亿新台币!林俊杰刚提的限量版法拉利,我有钱还买不到?

前两天,林俊杰在社交平台上发了这么一段话。

岁末将至,有许多思绪值得回味——那些成就、挫折与洞见。但当一年的轮回即将结束时,我意识到:真正的成就不需要多宏伟,有时只是能够发现美。而最能体现这种美的,莫过于一台自然吸气 V12 引擎。

文后紧接着的,便是他和一辆哑光白法拉利 Daytona SP3 的合影。

不是哥,我还以为这只是一个普普通通的年底小感触,怎么反手又花两千多万提了一辆限量版的法拉利……

但这台车确实值得稍微展开聊聊。

和法拉利的新旗舰 F80 不同,这台 Daytona SP3 没有涡轮,没有复杂的混动系统,也没有为了讨好任何人而存在的静音模式。它只有那一台 6.5 升 V12 自然吸气发动机,以及高达 9500 转的红线转速。

林俊杰说,真正的成就不需要多宏伟。这话说得很谦虚,但放在这台车上,其实全是凡尔赛。毕竟他手里这台机器,拥有法拉利最「本味」的声浪。当那台 V12 被推向 9500 转的红线,那种源自物理震动的巨大轰鸣,在如今这个连声浪都需要靠音响模拟的年代,确实显得既原始又奢侈。

花 1 亿新台币(约 2252 万元)去买这样一台在技术路线上完全没有任何前瞻性的车,林俊杰算是成功赶在内燃机时代结束前,给自己留下了一个最纯粹的念想。

这也正是法拉利 Icona 系列存在的意义,它不负责在赛道上赢过谁,它只负责在审美和情感上,赢过时间。

连接过去与未来

Daytona SP3 的定位其实很容易被误读。如果不了解法拉利的产品谱系,可能会拿它去和 849 Testarossa 甚至是 F80 比数据,但这就像是拿一块机械万年历腕表,去和 Apple Watch Ultra 比谁的计时更准。

不同于法拉利的其他产品线,Icona 系列的任务特别且纯粹,它负责连接过去与未来。

Daytona SP3 的名字和设计灵感,很大程度上源自 1967 年那场著名的 Daytona 24 小时耐力赛,那时候法拉利 330 P3/4 曾包揽过领奖台的前三名。

法拉利高明的地方在于,他们并没有把它做成一台单纯的「复刻车」。

你只要绕到车尾看一眼就能明白我的意思。那一层层堆叠的水平叶片是整车最具有辨识度的视觉符号,它们既是对老车的致敬,又在视觉上极大地拉伸了车尾的宽度。法拉利完全跳出了现代汽车设计的常规套路,看起来更像是一艘悬浮在地面上的太空飞船,兼具了复古的韵味和极其科幻的未来感。

▲法拉利 250 P5

还有一个细节藏在车身侧面。中置引擎超跑为了给发动机散热,通常会在车门后方挖出巨大的进气洞,这是必要的,但在美学上往往是一种破坏。

Daytona SP3 的设计师为了保留车身侧面像鹅卵石一样光滑的曲面,想出了一个非常天才的解决方案。他们利用蝶翼门本身的厚度,设计了一个隐藏的气流通道,空气直接从车门内部流向散热器。这种将功能完美隐藏在形式之下的处理手法,也是这辆车拿下红点设计大奖最高荣誉的主要原因。

当然,这台艺术品的核心依然是那颗心脏。

在底盘结构上,Daytona SP3 继承了法拉利上一代马王 LaFerrari 的碳纤维单体壳,那是目前民用量产车能用到的最顶级的车架。而在这个车架中心,法拉利塞进了一台型号为 F140HC 的 6.5 升 V12 自然吸气发动机。

这可以算是法拉利 V12 引擎的 Final Edition 了。在没有任何电力辅助、也没有涡轮增压的情况下,工程师们通过使用钛连杆和类金刚石碳处理的活塞销等源自 F1 赛车的技术,压榨出了 840 马力的输出。

更令人着迷的是它的性格。这台发动机的红线转速高达 9500 转。在涡轮车普遍 6000 多转就意兴阑珊的今天,9500 转意味着延绵不绝的动力储备,以及那种能够直击灵魂的高频声浪。

为了追求极致的驾驶体验,这台车还保留了一些颇为傲慢的赛车设定。比如它的座椅是固定死的,直接连接在碳纤维底盘上,无法前后移动。如果林俊杰觉得坐姿不舒服,他只能去调节踏板和方向盘的位置。不过,在他看来,这可能会是一种仪式感吧。

有钱,我也买不到?

除了那个令人着迷的 V12 心脏,Daytona SP3 身上最昂贵的标签其实是那一层看不见的准入门槛。没错,它是限量的,只有 599 台。

即便是像我这样富有的人,当时也没能抢到。

针对 Icona 这种级别的车型,法拉利的分配规则其实比以往任何旗舰都要严格。法拉利首席营销官 Enrico Galliera 在发布这台车时曾向媒体透露过具体的分配逻辑,简单来说就是一道关于 599 台配额的减法题。

在这 599 台的总量中,有 499 台是直接内定出去的。

法拉利找来了 Icona 系列前作——Monza SP1 和 SP2 的客户名单。在那两款车总计 499 位车主中,法拉利逐一发出了邀请,询问他们是否想要购入系列的第三款作品。结果是,这 499 人全都说要买。

▲Monza SP1

这意味着,在 Daytona SP3 正式对外发布之前,超过 80% 的配额就已经名花有主。对于这 499 人来说,不需要比拼所谓的法拉利积分或贡献值,只要你拥有上一台 Icona,你就有资格自动解锁下一台。这是一种很强的用户粘性绑定,也是法拉利维护核心圈层的一种手段。

所以真正的竞争,发生在那仅剩的 100 个名额里。

这 100 张门票是留给全球范围内那些没能买到 Monza,但依然被法拉利认定为「顶级客户」的藏家去争夺的。在这个层级,银行卡里的余额只是最基础的门槛,法拉利更看重的是你对品牌的服从性与贡献度。

业内公认的筛选标准通常包含几个硬性指标。首先是旗舰车型的收藏履历,如果你拥有 288 GTO、F40、F50、Enzo 或 LaFerrari 中的几台,权重会极高;其次是「V12 忠诚度」,购买过 812 Competizione 或 F12 TDF 这种限量版 V12 车型也是重要的加分项。

▲812 TDF

此外,是否参与过 Corse Clienti(法拉利客户赛车项目,比如购买 FXX-K 等赛道玩具或参加挑战赛)在这套评价体系里权重是很大的,因为这代表你不仅仅是「买家」,还是真正愿意投入精力的「玩家」。当然,还有一个至关重要的红线——你不能是倒爷。如果你曾经在刚提车不久就高价转手限量版法拉利,会被立刻剔除出名单。

之前网上流传过国外土豪带着现金想买 SP3 却被销售拒绝的新闻,原因大多出在这里。如果你名下没有官方认可的限量款收藏记录,或者车子都是从二手市场高价收来的,在法拉利的官方系统里,你的贡献值依然是零。

▲ 2015 年,林俊杰的法拉利 458 Speciale A 于台北交付

林俊杰能拿到这 1/100 的资格,靠的显然不只是落地超 2000 万人民币的预算。

翻看他的车库,你会发现一份非常符合上述标准的履历。他不仅拥有法拉利上一代 V8 自吸绝唱 458 Speciale A,而且还是通过 Tailor Made 项目深度定制的版本。同时,他的车库里还放着包括迈凯伦 Senna LM、保时捷 911 GT3 RS 这样的硬核赛道机器。

法拉利很清楚,这是一位真正懂驾驶、愿意长期持有并展示品牌文化的车主。

▲林俊杰的法拉利 458 Speciale A

▲ 林俊杰(左一)和它的日产 GT-R T-spec Takumi Edition,右一为保罗·沃克的弟弟科迪·沃克

Daytona SP3 实际上早在 2021 年就已经发布,但全球交付从 2023 年才陆续开始,从锁单、排产到最终交付,经历长达两三年的等待再正常不过。

或许在马拉内罗的逻辑,等待本身也是昂贵体验的一部分。

在 2025 年的当下,拥有一台 Daytona SP3,不仅意味着你拥有了一件可以合法上路的工业艺术品,更意味着你在全球汽车收藏的名单里,获得了一枚永久的勋章。这或许就是林俊杰所说的,那种「不需要声量」的成就感。

有些东西注定会被新的技术取代,比如更快的电机、更聪明的智驾;但有些东西注定是为了对抗时间而生,比如这台会唱歌的 V12,以及那份对机械纯粹性的坚持。

带轮子的都关注,欢迎交流。 邮箱:tanjiewen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


早报|三星三折叠来了,售价达1.7万元/小米汽车累计交付破50万台/索尼全画幅新机A7 V正式发布

cover

📱

三星三折叠 Galaxy Z TriFold 亮相,采用「G」字形折叠方案

🚨

OpenAI 宣布「红色警报」,集中资源抗衡对手

📱

苹果将初代 iPhone SE 列为「过时产品」

🖥

消息称三星半导体拒绝与手机部门签订 DRAM 长期合同,Galaxy S26 或面临「芯片通胀」

🚗

小米汽车累计交付破 50 万台大关

💡

IBM CEO:AI 数据中心 8 万亿美元投入难获回报

📷

17999 元,索尼 Alpha 7 V 全画幅微单正式发布

🚗

理想汽车携手蔡司,AI 眼镜 Livis 今晚发布

🤖

字节跳动 Seed 推出 GR-RL,机器人首次完成真机穿鞋带

🤖

中新网发布 2025 年十大流行语:聚焦人工智能与二次元经济

🚲

电动自行车新国标落地,终端最高涨至 4000 元

重磅

三星三折叠 Galaxy Z TriFold 亮相,采用「G」字形折叠方案

昨天,三星正式官宣旗下首款三折叠手机 Galaxy Z TriFold。

不同于华为的「Z」型折叠方式,这款新机采用「G」字形内折叠方案,机身展开最薄处仅 3.9mm,折叠态厚度为 12.9mm,重量为 309g。其他参数如下:

  • 内屏尺寸为 10 英寸,外屏为 6.5 英寸,峰值亮度分别为 1600nit 与 2600nit,均支持 120Hz LTPO 技术;
  • 搭载高通骁龙 8 Elite 处理器,提供 16GB + 512GB 与 16GB + 1TB 两种存储版本;
  • 主摄 2 亿像素,长焦为 10MP 三倍光学变焦,超广角为 12MP;
  • 电池容量提升至 5600mAh,支持 45W 有线充电与 15W 无线充电。机身厚度中心为 4.2mm,带按键侧屏幕厚度为 4mm。

值得注意的是,该机配备钛合金铰链,并支持 IP48 防尘防水,成为全球首款具备防尘防水能力的三折叠手机。

三星还为 Galaxy Z TriFold 引入独立 DeX 模式,无需外接显示器即可实现类 PC 桌面体验,定位直追自家旗舰平板 Tab S11 Ultra。SIM 卡配置方面,这款新机支持双实体 SIM + 多 eSIM。

上市时间方面,Galaxy Z TriFold 将于 12 月 12 日在韩国市场开售,中国大陆也将在 12 月 9 日 10:00 开启预售。

据悉,新机韩版起售价为 359 万元(约合人民币 1.72 万元)。

有趣的是,罗永浩昨日发文评价了新机,表示「这么折叠不就相当于是四块手机屏吗?除了比华为那种方案更厚,意义在哪里呢?」

🔗 相关阅读:三星三折叠上手:折起是手机,展开竟然是…电脑?

大公司

OpenAI 宣布「红色警报」,集中资源抗衡对手

据 The Information 报道,OpenAI CEO Sam Altman 在当地时间周一向员工宣布进入「红色警报」状态,以应对来自 Google 等人工智能竞争对手的压力,并集中资源提升 ChatGPT 的性能。

Altman 表示,公司将因此推迟包括广告业务在内的其他计划。

Altman 在内部备忘录中指出,「我们正处于 ChatGPT 的关键时刻」。他强调,OpenAI 将优先推出一款新的推理模型,该模型在内部评估中表现优于 Google 的 Gemini 3。

据悉,OpenAI 正计划通过一个代号为「Garlic」的新大语言模型进行反击。

知情人士透露,OpenAI 首席研究官 Mark Chen 近期向公司内部人员介绍了该新模型,并且 Gartlic 在代码、推理任务中,能够媲美 Google Gemini 3 和 Anthropic Opus 4.5.

同时,公司还将加快改进图像生成 AI、提升模型行为表现、优化速度与可靠性,并减少「过度拒答」现象。

消息人士透露,OpenAI 原本正在测试多种广告形式,包括与在线购物相关的广告,但该计划已被暂缓。此外,其他产品如自动化购物与健康任务的 AI agent,以及为用户生成个性化报告的 Pulse,也将延后开发。

Altman 在内部沟通中警告,Google 的 AI 反攻可能带来「短期经济阻力」。

Google 在 10 月宣布,其 Gemini 聊天机器人月活跃用户已增至 6.5 亿,高于 7 月的 4.5 亿,显示其增长势头明显。相比之下,OpenAI 披露 ChatGPT 每周用户超过 8 亿,并占据全球约 70% 的 AI 助手活动。

财务层面,OpenAI CFO Sarah Friar 上月在与投资者的通话中提到 ChatGPT 增长出现放缓迹象。

公司预计今年订阅收入约 100 亿美元,明年将达 200 亿美元,并在 2027 年达到约 350 亿美元。与此同时,OpenAI 计划未来几年投入数百亿美元用于技术研发和算力支持。

Altman 强调,OpenAI 的「红色警报」不仅是防御,更是主动出击。他表示,下周将发布的新推理模型将进一步强化 ChatGPT 的「思考模式」和 Deep Research 功能,以保持在激烈竞争中的领先地位。

🔗 相关阅读:OpenAI 生死时刻?奥特曼内部信曝光,下死命令暂停广告,ChatGPT 不能输

苹果将初代 iPhone SE 列为「过时产品」

据 MacRumors 报道,苹果已将初代 iPhone SE 列入「过时产品」名单。这意味着该机型自昨天起在全球范围内不再享受官方维修、换电池或其他服务支持,包括苹果零售店及授权服务提供商。

苹果的政策规定,产品在停止销售满 7 年后即被认定为过时。初代 iPhone SE 于 2016 年 3 月发布,并在 2018 年 9 月停产,如今已跨过这一时间节点。

该机型沿用了 iPhone 5s 的外观设计,配备 4 英寸显示屏、Touch ID 主键以及铝合金与玻璃材质机身,但核心搭载了来自 iPhone 6s 系列的 A9 芯片。

在发布时,苹果前营销主管 Phil Schiller 曾表示:「所有喜欢小尺寸手机的用户都会爱上 iPhone SE」。

此后,苹果分别在 2020 年和 2022 年推出了第二代与第三代 iPhone SE,外观更接近 iPhone 8。然而在今年 2 月,苹果宣布全面停产 iPhone SE 系列,并由 iPhone 16e 接替其市场定位。

这一调整标志着苹果彻底结束了小尺寸机型的生命周期。尽管 iPhone SE 曾因小巧设计和相对低价受到部分用户青睐,但随着产品线更新,苹果在经历两代 iPhone mini 的尝试后,已将战略重心转向更大屏幕与更高性能的机型。

🔗 所有「停产和过时」产品:https://support.apple.com/en-us/102772

消息称三星半导体拒绝与手机部门签订 DRAM 长期合同,Galaxy S26 或面临「芯片通胀」

据首尔经济日报报道,三星内部芯片团队与移动业务部门的矛盾正在加剧,Galaxy S26 系列的供应链因此面临风险。

三星计划在明年初推出 Galaxy S26 系列,但移动业务 MX 部门未能与半导体 DS 部门达成长期内存芯片供应协议。消息人士称,DS 部门拒绝了 MX 部门提出的一年以上 DRAM 合同请求,仅愿意维持季度合约。

报道指出,尽管双方高层曾进行多轮谈判,MX 部门最终仅确保了截至 12 月 31 日的第四季度 DRAM 供应。

与此同时,DS 部门正将资源集中在高带宽存储(HBM)等面向 AI 数据中心的产品上,逐渐淡化 DRAM 与 NAND 的合同业务。

这一策略使 MX 部门在面对内存价格上涨时陷入困境。三星 12GB LPDDR5X RAM 的价格今年初约为 33 美元(约 233 元人民币),而近期已飙升至约 70 美元(约 495 元人民币)。

Galaxy S26 系列的 DRAM 将由三星电子与美光共同供应,但具体比例尚未披露。

业内分析认为,DS 部门优先追求利润增长,利用内存市场的「超级周期」提升营收,而 MX 部门则因成本压力面临利润下滑风险。这场内部博弈凸显了三星在平衡不同业务板块利益上的挑战。

小米汽车累计交付破 50 万台大关

昨天,小米汽车宣布,自 2024 年 4 月 3 日以来,累计交付已超过 50 万台,超额完成年初设定的全年目标 35 万台。

此外,小米汽车还公布了第 50 万辆小米汽车的车主,是一位42岁的工程师,选择的是小米 YU7 宝石绿。该车主表示,「YU7很适合自驾游,提车后第一时间就要开着去旅行。」

灵光上线两周创纪录,闪应用数量突破 330 万

通用 AI 助手「灵光」在上线两周后迎来爆发式增长。昨天,蚂蚁集团宣布,灵光 App 用户已成功创建 330 万个「闪应用」。

灵光闪应用的核心突破在于极大降低了开发门槛,用户无需编程知识,仅用自然语言即可在移动端最快 30 秒生成一个可交互、可编辑、可分享的小应用。这与传统开发模式形成鲜明对比,推动了大众化的 AI 创作潮流。

灵光 App 首期上线「灵光对话」「灵光闪应用」「灵光开眼」三大功能,迅速成为现象级 AI 产品。

官方数据显示,灵光在 6 天内突破 200 万下载,远高于 ChatGPT 首周的 60.6 万和 Claude 的 15.7 万;在突破 100 万下载的速度上,灵光仅用 4 天,也快于 Sora2 的 5 天。

千问 APP 接入万相 2.5,视频创作能力再升级

昨天,千问 APP 宣布接入阿里最新视频生成模型万相 Wan2.5,全面升级视频创作能力。该版本在动作精度和肢体协调性方面显著提升,并成为首个支持音视频同步输出的移动端 AI 助手。

万相 2.5 是目前业界少数具备音画同步能力的视频模型之一,支持文本、图像、视频、音频等多模态输入与输出。在权威大模型评测 LMArena 上,万相的图生视频能力位居全球第三,稳居国内第一。

此次接入后,千问 APP 用户只需上传一张照片和一段文字,即可生成肢体动作自然、口型匹配准确的 1080P 高清唱跳视频,最长支持 10 秒。

据悉,千问 APP 公测仅一周,下载量已突破 1000 万次,超越 ChatGPT、Sora、DeepSeek,成为史上增长最快的 AI 应用。

💡 IBM CEO:AI 数据中心 8 万亿美元投入难获回报

据《商业内幕》报道,IBM CEO 阿尔温德 · 克里希纳在接受「Decoder」播客采访时表示,当前科技巨头在人工智能数据中心上的巨额资本支出几乎没有可能获得回报。

他指出,按照现有成本测算,建设 1GW 数据中心约需 800 亿美元,而全球承诺的总规模已接近 100GW,总投入约 8 万亿美元。

克里希纳强调,这意味着企业需要每年约 8000 亿美元利润才能覆盖利息成本,这在现实中难以实现。他同时提到,数据中心内部的 AI 芯片存在快速折旧问题,通常五年后就必须更换,这进一步加剧了成本压力。

在 AGI(通用人工智能)方面,克里希纳持高度怀疑态度。他认为现有大模型扩展路径无法实现 AGI,概率仅在 0–1%。他提出未来可能需要将「硬知识」与大语言模型结合,但即便如此也只是「也许」。

这一观点与 OpenAI CEO 山姆 · 奥特曼的乐观态度形成鲜明对比。奥特曼此前建议美国每年增加 100GW 能源产能,并承诺约 1.4 万亿美元的资本支出。

行业背景方面,Meta 在财报中频繁提及「容量」与 AI 基础设施,Google 更是宣布未来计划在太空建设数据中心。与此同时,投资人迈克尔 · 伯里因担忧英伟达芯片的折旧问题,近期对 AI 股票提出批评,导致市场波动。

多位科技领袖也对 AGI 的加速持怀疑态度。Salesforce CEO 马克 · 贝尼奥夫称其「极度可疑」,Google Brain 创始人吴恩达认为 AGI「被过度炒作」,Mistral CEO 阿瑟 · 门施则直言其是「营销手段」。

OpenAI 联合创始人伊利亚 · 苏茨克维尔更指出「大规模扩展时代已结束」,未来需要更多研究而不仅仅是算力堆叠。

尽管如此,克里希纳仍然看好现有 AI 工具在企业生产力上的价值,认为其有望释放数万亿美元的效率提升。他强调,AGI 的实现需要超越当前大模型路径的更多技术突破。

新产品

17999 元,索尼 Alpha 7 V 全画幅微单正式发布

昨天,索尼正式发布全画幅微单新品 Alpha 7 V(型号 ILCE-7M5)。

作为 Alpha 7 系列的第五代产品,该机在影像传感器、处理器、AI 算法、视频性能及操控续航等方面全面升级,成为索尼微单十五周年的代表性新品:

  • 搭载新开发的部分堆栈式 Exmor RS CMOS 全画幅传感器,约 3300 万有效像素;
  • 配备最新 BIONZ XR2 影像处理器,集成 AI 智能处理功能,在实时识别 AF、实时追踪、连拍速度及色彩还原方面显著提升;
  • 支持最高 30fps 高速连拍,且支持 14-bit RAW 无损输出;配备预拍摄功能,并可录制 7K 超采样无裁切 4K60P 视频及 Super35 裁切 4K120P 视频;
  • 配备升级的 3.2 英寸翻转屏,支持双卡槽(SD 与 CFexpress Type-A);
  • 机身采用镁合金框架,重量约 610 ~ 695 克,具备防尘防潮设计,续航可达约 750 张照片。

售价方面,Alpha 7 V 单机身国行建议零售价为 17999 元,国行即日开启预售,海外市场计划于 12 月 19 日开售。

🔗 相关阅读:鱼和熊掌兼得?在 A7M5 身上,我看到了相机两难的和解

AI 情感交互台灯「Ongo」发布,玩具总动员编剧参与设计

昨天,互动机器人公司 InteractionLabs 宣布正式发布 AI 台灯 Ongo,定位为「有生命的台灯」,除具备照明功能外,还能通过人工智能与用户进行情感交互。

该产品由 CEO Karim Rkha Chaham 与 CTO Julien Ajdenbaum 共同开发,创意总监为曾获奥斯卡提名的玩具总动员编剧 Alec Sokolow。

Ongo 的设计强调情感智能与环境感知。它能够识别用户的面部表情,感知工作节奏,并通过光线与动作进行回应,帮助用户在专注时自动调暗灯光,营造安静氛围。

此外,设备捕捉到的视觉数据仅在端侧处理,确保隐私安全,并配备可磁吸的遮光镜片以提供完全的隐私模式。

在功能层面,Ongo 的交互逻辑由故事化设计驱动,旨在减少用户对屏幕的依赖,成为桌面上的情感伙伴。有开发者提出,未来 Ongo 或可结合健康监测模型,实现水分与血糖水平的检测。

发售不久后,CEO Karim 在 X 上宣布,首批 100 台 Ongo 已售罄,并将开放新的购买名额。

理想汽车携手蔡司,AI 眼镜 Livis 今晚发布

昨天,理想汽车宣布与德国光学巨头蔡司达成全球战略合作,并将在今天 19:30 举办新品发布会,正式推出其首款 AI 智能眼镜「Livis」。

理想汽车表示,此次合作标志着公司从智能汽车制造商向「智能出行生态服务商」的转型。Livis AI 眼镜将作为车机系统的延伸,结合全场景 AI 能力,把「理想同学」的智能交互体验从车内拓展至日常生活。

产品搭载 MicroOLED 高清显示屏,并借助蔡司在光学领域的技术优化视觉清晰度与场景适配性。同时,眼镜支持轻量化设计与近视定制功能,提升佩戴舒适度。

根据理想汽车官方预热视频,Livis 智能眼镜还具备远程控车功能,可实现打开电动侧滑门、提前开启车内空调及座椅加热等操作。

蔡司于 1957 年进入中国,业务覆盖半导体制造技术、工业质量解决方案、研究显微镜解决方案、医疗技术、视力保健和消费者光学所有业务领域。2021 年起,中国已成为蔡司在全球最大的单一市场。

字节跳动 Seed 推出 GR-RL,机器人首次完成真机穿鞋带

昨天,字节跳动 Seed Research 团队正式发布最新研究成果 GR-RL,在真实机器人平台上首次实现了「连续为整只鞋穿鞋带」的复杂操作。

字节跳动称,这一突破标志着视觉-语言-动作(VLA)模型在精细灵巧任务上的能力边界被显著拓展。

团队指出,主流模仿学习存在两大缺陷:人类演示数据的「次优性」以及训练与推理之间的「执行错位」,导致模型在毫米级精度任务中频繁失败。

为此,Seed 团队选择真机强化学习路径,提出了多阶段训练框架,包括离线数据筛选、数据增强以及在线强化学习。

在双臂机器人 ByteMini-v2 上,GR-RL 将穿鞋带任务成功率从监督学习基线 GR-3 的 45.7% 提升至 83.3%,失败率减少近 70%。

其中,数据过滤、镜像增强和在线强化学习均对性能提升贡献显著。实验中,模型展现出类似人类的「纠错智能」,在鞋带滑落或摆放位置不佳时能主动调整并重试,体现了对任务物理逻辑的理解,而非单纯轨迹记忆。

团队认为,强化学习经验应进一步蒸馏回基础 VLA 模型,以构建兼具高精度操作与强大泛化能力的通用策略。

📖 论文链接:https://arxiv.org/abs/2512.01801

🖥 项目主页:https://seed.bytedance.com/gr_rl

可灵 O1 生图模型上线,支持多图融合与精准细节控制

昨天,可灵 AI 宣布 O1 图片模型已正式全量上线,定位「一站式创意引擎」,覆盖从基础图像生成到高阶细节编辑的完整流程,旨在让创意实现更加精准与高效。

据介绍,该模型具备四大核心优势:

  • 特征全保真:支持多达 10 张参考图的特征提取,能够精准锁定主体轮廓与色调,即便跨图生成也能保持高度一致性;
  • 细节全掌控:用户无需专业修图技能,仅凭文字指令即可实现物品与人物的精准增删改操作,满足影视级创作需求;
  • 风格全复刻:通过多图融合与风格解构,实现全局风格的自然统一与无缝转绘;
  • 创意全融合:支持涂鸦编辑与自然语言指令触发,进一步拓展复杂构想的实现路径。

此外,可灵 AI 宣布,自即日起至 12 月 14 日 24 时,O1 视频生成会员提供限时双周 7.5 折优惠,O1 图片生成铂金及以上会员最长可享 1 年无限使用,全场会员年卡限时 6.6 折。

新消费

中新网发布 2025 年十大流行语:聚焦人工智能与二次元经济

昨天,中新网《咬文嚼字》编辑部正式公布 2025 年十大流行语。榜单延续社会学与语言学双重标准,集中反映了人工智能、经济转型及社会情绪等多维度趋势。

核心词汇方面,「韧性」位居榜首,体现社会在面对复杂环境时的普遍心理与发展态势。

「具身智能」等词语凸显人工智能技术的快速渗透,语言体系正被深刻重塑;「赛博对账」「活人感」「苏超」则反映数字化与体育热点的广泛关注。

值得注意的是,「谷子」一词同样入选,源自「goods」的谐音,常用于指代二次元 IP 的周边文创产品,折射出二次元经济的兴起与消费模式的变化。

「数字游民」则揭示就业方式的多元化与新质生产力的加速发展。同时,备选词条如「竖店」「低空经济」「悦己经济」等,进一步展现了产业结构优化与社会生活方式的演变。

社会情绪方面,「××基础,××就不基础」「从从容容、游刃有余」「匆匆忙忙、连滚带爬」「预制××」等词语同样得到提名,折射出公众在快节奏生活中的心态与价值观念。

电动自行车新国标落地,终端最高涨至 4000 元

据蓝鲸新闻报道,在 12 月 1 日国家电动自行车新国标实施之后,记者在深圳等地走访发现,政策落地初期市场呈现复杂局面:

新国标车型因安全与智能化升级导致生产成本显著增加,终端售价普遍上涨至 2000 – 4000 元;与此同时,部分旧国标车型仍通过「带牌过户」或区域转销等灰色渠道继续流通。

在深圳,台铃、雅迪、绿源等品牌已开售符合新国标的车型,但整体铺货节奏不均衡。

小牛电动专卖店负责人表示,新款车辆最快需至下周才有现货,目前仅有样车展示。九号电动车门店也透露仍在等待厂家发货,市场处于「青黄不接」状态。

部分经销商指出,旧国标车型虽已停产,但因库存有限且具备改装空间,价格反而上涨 200 – 300 元。

更有经销商透露,部分门店提前为旧车上好牌照,消费者可通过过户方式继续使用,但需额外支付 700 – 800 元费用。这种「带牌过户」模式在监管相对宽松的三、四线城市尤为常见。

新国标的实施不仅提升了整车安全标准,还对材料、结构与功能提出更高要求。例如,塑料件质量占比不得超过整车 5.5%,必须使用高阻燃材料,并鼓励搭载北斗定位与通信模块。电池安全也被提升至前所未有的高度,要求在材料与 BMS(电池管理系统)方面进行技术升级。

此外,新规明确要求车辆在超速时持续发出提示音,并在达到最高限速时自动切断动力输出。

九号公司产品经理表示,车辆系统已设置 25 km/h 限速,并通过动态算法避免突然断电带来的不适。多数品牌强调限速不可解除,但部分经销商认为未来或出现「破解」手法。

索尼推出《原神》限定版 PS5 手柄

索尼昨日宣布,将推出全新「DualSense 无线手柄 ——《原神》限定版」。

该款 PS5 手柄深度融合了《原神》世界观元素,设计灵感来源于旅行者双子(空 / 荧)以及向导派蒙,整体配色为白、金与绿色,并点缀神秘符文,凸显提瓦特幻想氛围。

该限定版手柄将于 12 月 11 日开启预购,并计划在 2026 年 1 月 21 日率先于日本及部分亚洲市场上市。

零售价格方面,索尼公布的建议售价为 84.99 美元(约合人民币 601.6 元)、84.99 欧元(约合人民币 698.5 元)、74.99 英镑(约合人民币 701.8 元)以及 12480 日元(约合人民币 568.3 元)。

米哈游全球发行与运营总裁金雯怡表示:「我们希望旅人们能够享受这款手柄带来的乐趣,并继续在《原神》中开启冒险之旅」。

好看的

《一战再战》夺 2025 哥谭奖最佳影片

美国电影奖项「哥谭奖」昨日公布 2025 年度获奖名单,作为奥斯卡颁奖季的前哨站,本届评选结果引发业界广泛关注。

《一战再战》斩获最佳影片,成为最大赢家。《普通事故》则凭借导演贾法·帕纳西的执导与编剧表现,获得最佳导演、最佳原创剧本及最佳国际影片三项荣誉,展现出强劲的创作实力。

在表演类奖项方面,索佩 · 迪瑞苏凭借《父影之下》获最佳主角,乌米 · 马萨库凭《罪人》获最佳配角。阿布 · 桑加雷凭《苏莱曼的故事》获得最佳突破表演,而《父影之下》导演阿基诺拉 · 戴维斯则获最佳突破导演奖。

此外,《后座》摘得最佳改编剧本,《不受欢迎的朋友:第一部分莫斯科的最后一息》获最佳纪录片。

《疯狂动物城2》内地票房突破 20 亿,4D 场次一票难求

《疯狂动物城2》在全球上映后迅速刷新多项票房纪录,中国市场成为最大推动力。

截至昨天,影片中国内地票房突破 20 亿元,迪士尼官方微博发布庆祝视频,并展示从 4 亿至 20 亿的票房里程碑海报,显示出市场的持续热度。猫眼专业版预测,该片最终内地票房或将达到 42.51 亿元。

在北美市场,影片赶上感恩节档期,五天票房为 1.56 亿美元,三日票房为 9680 万美元,虽登顶周票房冠军,但未能打破历史纪录,仍次于去年同期的《海洋奇缘2》。

相比之下,中国市场的表现更为突出,该片不仅成为中国影史进口动画片票房冠军,也在所有进口片中仅次于《复仇者联盟4:终局之战》。

影片的火爆带动影院运营全面升温。据蓝鲸财经报道,12 月 1 日,《疯狂动物城2》在中国内地排片占比达 78.1%,上座率高达 91.2%。尤其是 4D 场次因追车与雨林场景的沉浸式体验而一票难求,甚至出现黄牛高价转售现象,票价翻倍至近 200 元。

迪士尼方面高度重视该片的市场表现。CEO 鲍勃 · 艾格亲自出席上海迪士尼的全球盛典,显示出公司对这一项目的战略期待。

此前,迪士尼在真人版《白雪公主》及《创:战神》等项目上遭遇票房失利,《疯狂动物城2》被视为其重振市场信心的重要作品。

除票房外,影片的商业联动也在中国市场掀起热潮。澎湃新闻指出,《疯狂动物城2》上映前后已有近 60 起品牌联名活动,涵盖潮玩、餐饮、服饰、汽车等多个领域,形成全方位的消费狂欢。

上海迪士尼的「疯狂动物城」主题园区亦成为热度延续的重要场景,园区核心项目「热力追踪」持续吸引大量游客,进一步强化了 IP 的市场号召力。

《利刃出鞘 3》发布新海报,12 月 12 日上线 Netflix

昨天,悬疑电影《利刃出鞘 3》发布新海报,定名为「Wake Up Dead Man: A Knives Out Mystery」,将于 12 月 12 日正式上线 Netflix。

本片由莱恩 · 约翰逊继续执导,丹尼尔 · 克雷格再度饰演侦探贝诺特 · 布兰科,展开新一轮复杂的谋杀疑案调查。

《利刃出鞘》系列自 2019 年首部作品亮相以来,凭借复杂的叙事结构和群像表演获得广泛关注。

此次第三部作品在延续悬疑推理风格的同时,进一步强化了「谁是凶手」的核心悬念,此前公布的预告片中亦多次强调复杂线索与角色关系的交织。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


WPS 给 AI 装上「大脑」和「双手」后,我真正感受到它会干活这件事

前段时间,Nano Banana Pro 发布,有网友在我们的留言区评论,说前端程序员已经不知道「死了」多少次了。

如果要把这两年职场人的心理变化画一条曲线,我想大概率是一条过山车,从最初的震惊与狂热,到中期的焦虑与恐慌,再到现在的……疲惫与祛魅

是的,疲惫。

▲ 技术成熟度曲线

我们尝试着无数个声称能颠覆工作的 AI 工具,但回归到真实的周一上午,情况往往是这样的:你在一边狂敲提示词,在另一边小心翼翼地把生成的文本复制回文档,然后花半小时重新调整那个被毁得面目全非的表格格式 。

这种割裂感,真的很难让人把它和生产力三个字划等号。

很多时候,我们手里的 AI 更像是一个用来炫技的玩具,而不是那个能真正帮你把项目彻底搞定(DONE)的智能伙伴 。

▲「AI 原生,效率新生」—— WPS AIDONE 办公专场活动

前几天,我们和 WPS AI 在珠海金山软件园一起举办了「AI原生· 效率新生- AIDONE办公专场」。爱范儿副主编、 APPSO 负责人李超凡,和金山办公 Office AI 负责人刘拓辰,在现场分享了他们对于 AI 原生与效率的看法,如何才能做到 AIDONE;还有 WPS AIPPT 的上手体验等。

从现场回来,我隐约意识到,可能我们之前打开 AI 的方式,都太累了。当 AI 和 Office 彻底融为一体之后,办公这件事完全可以从忙于交付,变成更专注思考。

所谓的 AI-Native,并不是你会写提示词

什么是 AI-Native(AI 原生)?是会用 Midjourney 生成几张二次元图片?还是能熟练背诵某套万能提示词模版?又或者是用那些所谓的一句话生成产品,手搓一个项目 Demo。

我想这些都不是。

▲爱范儿副主编、APPSO 负责人李超凡主题演讲「如何成一个 AI- Native 职场人」

如同我们在现场分享的观点一样,AI 原生是一种「生物本能」,贯穿到我们工作的每一个环节。像是之前做 AI 编程的 Lovable 团队,他们整个公司只有 35 个人,成立短短 7 个月,年收入就做到了 8000 万美金。还有创作者顶流,用 AI 写深度长文,年收入达到了 400万美金的 Packy McCormick。

凭什么?就凭他们把 AI 变成了某种生物本能;他们不是雇了更多的员工,而是雇了更多的 AI。

对于真正的 AI Native 职场人来说,区别也不在于我们用了多贵的工具,而在于第一反应。遇到难题时,你的脑回路是「这事儿我该怎么熬夜肝出来」,还是「这事 AI 能帮我做吗?我该怎么指挥它?」。

但这里也有个巨大的悖论:如果指挥 AI 的成本,比我自己做还要高,那这种「本能」就是反人性的。

这恰恰是目前大多数 AI 产品的死穴,它们离我们的工作流太远了。经常是,我们得跳出文档,去浏览器里求助,然后再把结果搬运回来。这种反复横跳,足以打断任何珍贵的「心流」。

▲不打断心流的 AI 伴写

所以,AI-Native 该怎么实现。我们的判断是,在最熟悉的 Office 软件里「原生」地使用 AI,才是成为 AI-Native 职场人的最短路径。

原生 Office AI,从工具到类同事

如果说 AI 工具的割裂感是 AI-Native 的痛点,那么金山办公的 Office AI 负责人刘拓辰,则给出了解法。

▲ 金山办公 Office AI 负责人主题演讲「原生 Office AI,从交互到交融」

他在现场提到了一个贯穿全场的关键词,「原生 Office AI」,而要做到原生 AI,他带来了一个更前沿的产品哲学:Agentic Software(智能体软件)

这不只是一个新名词,本质上重新定义了 AI 在软件里的角色。在 WPS 的设计理念里,真正的 Agentic 应该像一个训练有素的助理,拥有两个关键能力:大脑和双手

它得先有一个会思考的大脑,具备自主规划能力。 以往的模型是我们问一句它答一句,完全被动响应。而在 WPS AI 里,当我们抛出一个模糊的需求,比如「做一份年中复盘 PPT」。

AI 会先像人一样思考:复盘需要哪些模块?需要调用哪些数据?它会主动拆解任务路径,规划每一步怎么走,甚至在执行后进行反思;「我做出来的结果符合预期吗?如果不符合,我再重新规划修正」。

但光有想法还不够,它更需要一双干活的手,让它能无损调用各种工具。 这是金山办公 37 年,死磕办公文档底层技术的独家壁垒。

通用大模型也许能写出漂亮的文案,但它们是「没手」的,不能直接在最后交付的文档里面操作。 而 WPS 将内部最高频的核心功能,抽象成了 AI 能理解的工具,让它能理解怎么调整字号、怎么对齐表格、怎么插入文本框、实现各种样式效果。

区别于简单的懂格式,WPS 建立的这套工具化与双向无损互通的能力;做到了 AI 改完的文档,和我们亲手做的一模一样,没有乱七八糟的隐藏标签,格式完美保留。

而在这个 AI 办公过程中,我们用户的角色也开始发生了一些变化。

以往我们是操作者,每一个标点都要亲力亲为;现在,我们变成了决策者。 在 WPS AI 的执行过程中,从理解指令到拆解步骤,再到调用功能,全过程都是可视化的。我们就像坐在副驾驶,看着 AI 开车;它会告诉我们,「我打算先做数据清洗,再做图表分析」。

▲WPS AI 3.0 WPS灵犀 – 文字 Canvas:左侧文档编辑,右侧 AI 对话,用户与 AI 同屏协作

这种交互方式超越了简单的多轮对话,成为一种「过程可视化与实时干预」的全新范式。如果 AI 跑偏了,我们不需要推倒重来,只需在它思考的任意环节随时介入纠正,掌控权始终在我们手中。

过程透明不仅让我们更好地掌控方向,也让整个结果变得可验证、可信赖。「AI 负责规划与执行,人负责审核与决策」的模式,才是 AI 在职场真正落地的样子。

在现场的圆桌对话环节,嘉宾们还讨论了一个话题,「AI 是执行的终点,还是创意的起点?」我印象特别深的一句话是 AI 无法取代人的品味,比起执行,人的价值正在重新被凸显。

▲ 圆桌对话,探讨「AI 是执行的终点,还是创意的起点」以及「未来我们如何与 AI 写作办公」等前沿话题;左一李超凡,中间刘拓辰

AI 正在把必须做的工作自动化:排版、找图、格式、查资料、总结文档……而人类的工作,会变成:判断、提问、想法、审美、选择。这是一个更轻松、也更要求想得明白的时代。

而 WPS AI 正是在帮我们把那些繁琐的、流程化的任务都「搞定」,之后这些省下来的时间,是留给我们,可以拿来做一点真正有价值的思考和决策。

所以,AI 是终点还是起点呢,我想是因为 AI 帮我们走完了执行的终点,我们才终于有精力回到创意的起点。

AI 原生办公,才是未来的工作方式

在 WPS AIPPT 盲盒挑战环节,15 分钟做完 PPT 已经不是炫技,而是一种新的合作方式。用户给方向,AI 负责拆解结构、规划大纲;用户确认无误后,AI 再调用工具完成排版与美化。整个过程,WPS AI 的每一步思考都呈现在我们面前。

▲WPS AIPPT 盲盒挑战,参加活动的朋友正在使用 WPS AIPPT 制作

但我要说的重点不是它有多快,而在于一种新的心流,我们终于可以只专注内容,而不是被排版和格式绑架。这其实才是 Agentic Software 的意义,不是跳过工具,而是让工具的执行过程变得高效且透明。

以往做 PPT,我们处于一种左右脑互搏的焦虑中,既要像作家一样思考逻辑,又要像设计师一样纠结配色对齐。但在这次体验中,因为 AI 接管了找图、排版、美化这些繁琐的体力活,玩家只需要专注于我想讲什么。

这种不打断、不割裂、所想即所得的流畅感,恰恰验证了前面提到的理论,只有原生在文档里的 AI,才是真正的生产力。

▲ 输入主题就能得到 PPT,WPS AIPPT 官网,aippt.wps.cn

在活动现场,我不止一次听到有人感叹,「没想到 WPS 现在的 AI 已经做得这么深入了。」这句感叹背后,其实是用户对当前市面上大量「套壳 AI」的审美疲劳。

为什么 WPS AI 能给人不同的感觉?我认为核心在于金山办公对于「AI 与软件关系」的重构。正如刘拓辰所说,Agentic Software 绝不是简单的聊天机器人。智能体这个词在今年 Manus 爆火之后,就一直没有冷下来过,但对我们用户来说,一个好的 Agent 却仍然还在被定义中。

在 AI 的 1.0 时代,大多数产品是把 AI 当作一个「插件」挂在软件旁边,两套工具流,各玩各的。最近这两年,AI 工具更是百花齐放,但真正能改变工作方式的,从来不是功能升级,而是软件结构的变化。

WPS AI 走的正是这条更难的路,彻底把 AI 融入软件设计;一方面,给 AI 一个独创的翻译引擎,让 AI 能读懂复杂的文档格式;另一方面,把拆解任务、调用工具的每一步都摊在台面上,我们看着 AI 干活,随时喊停纠正。

它不满足于仅仅生成一段文字,而是要成为一个能真正「交付结果(Get Things Done)」的智能体。无论是最近大火的「企业知识库」功能,还是这次演示的 WPS AIPPT,本质上都是这种「原生+智能体」思路的落地。

在 WPS AI 的体系里,AI 不是插件、不是外挂,也不是单纯的内容生成器。它是我们文档里的助手,是会议里的整理者,是灵感的第一落点,是 PPT 的合作者。

对于当前这个浮躁的 AI 时代来说,这其实是 WPS AI 一种克制与务实的长期主义。不去卷那些花哨的 C 端娱乐功能,而是死磕文档、知识库、企业大脑这些 Office 办公领域的基石;也让 WPS AI成为了目前市面上少有的、真正能被称为「生产力」的产品;懂文档、懂创作、更懂用户。

回想起文章开头提到的那个问题:我们还需要多久才能跨越 AI 的尝鲜期?答案也许就在你打开 WPS 的那一刻。

当你发现,原本需要一下午才能搞定的 PPT,现在喝杯咖啡的功夫就能出初稿;当你发现,你终于不再是软件的奴隶,而是 AI 的指挥官时;你就已经是一个 AI Native 职场人了。

不要让 AI 成为你的焦虑来源,去试着指挥它,去试着把那些「必须做」的繁琐交给它,让自己专注于「值得做」的事情 。

毕竟,只有当我们繁琐的操作真正隐形,创造力才能真正显现。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


国产 T800 来了!回旋踢拳击技能点满,超越 80% 男性,这才是铁甲钢拳

刚刚,众擎机器人发布了最新旗舰产品,全尺寸高动态通用机器人 T800。

不夸张地说,这大概是市面上最帅的机器人,既有专属于机器的硬核质感,还带来了人类的灵活控制。

T800 这个型号,我一看到就想到了终结者里面的施瓦辛格,虽然还没做到电影里面的半机械人状态,但是在格斗能力上,众擎这款机器人打出的组合拳、飞踢、回旋踢,完全称得上 T800 级别。

去年十月,众擎机器人才刚刚发布了首款身高 170CM 的人形机器人 SE01,今年 2 月,成功实现了全球首例人形机器人前空翻特技。

今天,T800 发布,对比前代,这款机器人融合了众擎机器人在本体结构、运动控制和智能感知系统方面的最新成果,在稳定行走、动态平衡、动力性能方面都带来了领先优势。

基本参数方面,T800 的身高来到了 173CM,小腿+大腿的长度是 91CM,手臂长度 60CM;携带电池之后的体重为 75KG。在关节自由度方面,全身有 43 个自由度关节,不含双手是 29 个,单手自带 7 个多维度感知灵巧手自由度关节。

集成了触觉传感器的灵巧手,能够实现精细的抓取和操作,同时单手也有 5KG 的负载能力。

运动参数的表现,T800 的移动速度是 3m/s,对比我们普通的每秒钟 1m 左右的速度,属实快了不少。

关节运动空间也做到了高度灵活的关节控制,几乎全身的主要关节,都支持较大的活动角度,手臂、肩等部分,接近于全周旋转。

T800 的动力系统采用了 72V 的行星/直线混合驱动,即针对不同的关节有不同的驱动类型;腰部与髋部(旋转): 采用行星减速模组;膝部与踝部(推杆): 采用直线执行器,模拟人类大腿肌肉的伸缩发力。

最大关节力矩更是高达450 N·m,这几乎给了机器人相当大的爆发力和负载能力;一些主流的家用轿车,

发动机的峰值扭矩大约也就在 300~400 N·m 左右。在某种程度上,这意味着 T800 单个关节(通常是膝盖或髋部),瞬间爆发出的旋转力量,竟然是有可能超过,或者匹敌一台汽车引擎的峰值输出。

演示视频里,T800 完美执行了巴西战舞、回旋踢、嚣张挑衅、拳脚连招、五连踢、组合拳、以及飞踢等高难度动作,每一个动作都干脆利落。

而在实现高动态运动的同时,众擎 T800 还兼顾了 5% 的力控精度和 2-4 小时的长效续航,不仅四肢发达,更是粗中有细。

众擎在产品视频的介绍里还提到,T800 实现了对 170CM 同等身高男性群体,80% 以上的性能超越。在宣传视频的评论区里面,网友们都惊叹不已,「这么灵活的动作,铁甲钢拳真的照进现实了!」说实话,我看到视频的第一感觉也是这样,「帅」是脑子里蹦出来的第一个词,大开大合的武打动作,足够满足我对搏击力量的憧憬。

作为一款全尺寸的高动态机器人,T800 的定位是替代人类去从事一些高强度、重复性的体力劳动。物流仓储、酒店服务、门店导购、以及工厂协作,都是众擎在产品官网列举出的应用范畴。

目前来看,T800 的首要落地点还是在于生产制造业,而不是进入家庭。上个月,众擎机器人就联合京东之家,在深圳开设了全球首家人形机器人主题潮品店,「赛博店员」上岗给顾客提供服务。

和宇树一样,众擎机器人也是一家小型初创公司,获得了京东、宁德时代等企业的投资;它 2023 年在深圳成立,目前已经发布了包括 T800 在内的六款机器人产品。

T800 作为众擎机器人的核心产品,很明显是被寄予了推动人形机器人,从样机走向实用的使命。

众擎创始人赵同阳在上个月粤港澳大湾区文化产业投资大会上提到,2026 年要实现数十台级别的小批量交付,来验证某些特定的行业场景是否可行;而 2027 年要争取 T800 的销量达到 1-2 万台。

这还只是众擎一家机器人公司的产销计划,更不用说还有宇树、优必选、甚至小米等、以及国外的热门公司。不敢想象 ,真到了 2027 年,大街上是不是真的都是机器人了。

用它宣传视频里面标语来说,「未来已来,共生之始」,前往和机器共生时代的大门,已经被打开了。

彩蛋:众擎曾在五月份宣布,将在今年 12月24日举办一场机器人自由格斗比赛「机甲拳王」。现在这场格斗马上就要登场了,今天发布的 T800,也将作为核心参赛机型登场对战。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


三星三折叠上手:折起是手机,展开竟然是…电脑?

谁都没想到,传说了快两年的三星三折叠手机,就在 12 月一个憋闷的早晨默不作声的通过 Samsung Newsroom 发布了。

与早期的预测相同,三星为这款三折叠(tri-fold)产品起了一个波澜不惊的名字:Galaxy Z TriFold,没有跟随 Z Fold 系列的编号,相当于另起炉灶、重另开新线了。

自此,华为 Mate XT 系列终于不再是三折叠市场的独苗,而对于消费者来说——有竞争的市场,才是有进步的市场。

只不过它虽然叫做 Galaxy Z TriFold,但它的展开方式却不是「外翻内折」的 Z 字型铰链,而是类似叠被子一样的 G 型铰链——内屏的两侧向中间合拢,然后才能翻转使用背部的外屏。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

这样一来,Galaxy Z TriFold 就只有「完全展开」和「完全关闭」两种使用形态,要么用分辨率 2160 x 1584 的 10 寸内屏,要么用 6.5 寸的外屏。

虽然它少了像华为 Mate XT 和 XTs 的双折叠使用形态,不过根据我们评测 XTs 时的实际经验,「三折叠手机的双折叠形态」并不是那么的常用,Galaxy Z TriFold 这样的取舍并没有什么问题。

为了容纳两侧厚度不同的机身,三星也对铰链进行了相当多工艺上的改进。

Galaxy Z TriFold 上面的「Armor FlexHinge」采用了双轨结构,让铰链两边的机身协同移动,即使重量不同,也能实现流畅和稳定的开合。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

此外,Galaxy Z TriFold 也用上了国行 W 系列的陶瓷。它的 6.5 寸外屏为康宁大猩猩玻璃陶瓷 2.0,两侧的机身背板则采用了「陶瓷玻璃纤维增强聚合物背板」,相比 Z Fold7 的玻璃显著增强了抗裂性——

但坏处也显而易见:Galaxy Z TriFold 的三块亮面背板是毋庸置疑的指纹收集器,再加上它只有黑色一种配色,随用随擦是在所难免的了。

此外,三星也对折叠方式做出了规范,系统会在折叠的时候给出视觉提示,内屏没有完全展开的情况下是无法使用的,这和七月份泄露的系统预览图基本一致:

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

不过 Galaxy Z TriFold 虽然没有严格意义上的双折叠模式,但三星保留了翻开一侧屏幕用后摄自拍的功能,在功能性方面是没有什么严重缺失的。

▲ Mrwhosetheboss 上手

Galaxy Z TriFold 的内外屏规格均为三星 Z 系列的动态 AMOLED 2X,10 寸内屏的峰值亮度为 1600 尼特,背部 6.5 寸的外屏则可以达到 2600 尼特,规格几乎与 Z Fold7 如出一辙。

而和 Z Fold7 如出一辙的不只是外屏规格,Galaxy Z TriFold 同样搭载着 2 亿像素 f1.7 主摄、1200 万像素超广角和抽象的 1000 万像素 3 倍长焦——有这样的「扎实」参数,几乎不用期待它的拍照表现了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

此外,Galaxy Z TriFold 同样用着 Z Fold7 同款的骁龙 8 Elite for Galaxy 定制版处理器,无论何种容量都标配 16GB 内存,只有 512GB 和 1TB 两种 SKU,相比 12+526GB 的 Z Fold7 稍显厚道。

比较值得注意的是,三星在 Galaxy Z TriFold 上采用了一些新的材质工艺。比如这次除了传统的铝合金边框之外,Galaxy Z TriFold 的中轴盖板从铝换成了钛金属,可以有效防止面积更大的盖板上出现划痕。

现阶段,在「上万元」这个超高端价位段里,(除了 iPhone)怎么用软件来辅助提升硬件能力才是厂商的重点,而三星作为目前少数几个从手表到电视都有涉猎的「全生态」玩家之一,应该能为我们交出一份不错的答卷。

其中最主要、和华为 Mate XTs 差别最大的,就是三星 OneUI 里面引以为傲的 DeX 模式了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

三星在 Galaxy Z TriFold 上首次允许在不外接显示器的情况下激活 DeX 模式,在 10 寸的内屏上打开一套完全基于键鼠的准电脑级桌面,这一点要比 Mate XTs 上的「自由多窗」模式更彻底一些,用起来也的确更像小电脑了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

此外,Galaxy Z TriFold 的 DeX 模式还支持像 Windows 和 macOS 那样添加第二块虚拟桌面,用户可以快速在两个桌面的应用组之间切换,毕竟有了 16GB 就是比较豪爽。

只不过华为 Mate XTs 支持手写笔,而坚持深耕手写笔操作多年的三星似乎在慢慢放弃这条路。Galaxy Z TriFold 和今年的 Z Fold7 一样,同样是从物理上移除了手写笔的检测硬件,支持的外设只剩下了蓝牙键鼠。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

只不过如果真的要用三折叠移动办公的话,一个专门的鼠标蓝牙还是要比华为 M-Pen 3 的「空鼠模式」实用许多的,当然,Mate XTs 也是能外接鼠标的。

此外,得益于谷歌和 OneUI 的双重加持,我们预计 Galaxy Z TriFold 对于软件的超宽屏适配会有一个比较好的表现——当然,仅限于规范开发的国外 app。至于极个别国产毒瘤 app 连华为都不做适配,自然也不会适配三星了。

▲ Mrwhosetheboss 上手

▲ Mrwhosetheboss 上手

目前,三星 Galaxy Z TriFold 的售价尚未公布,海外官网也仅仅显示从 12 月 9 日 10 点起接受预定。

根据三星的介绍,这款三折叠产品不会全球开售,而是 12 月 12 日在韩国首销,后续推广至中国、新加坡、阿联酋等区域,美版则要等到 2026 年第一季度。

不过好消息是,目前国行三星商店已经上线了新品预购入口,三星也在盖乐世社区表示将于 12 月 9 日早 10 点开启预售,但国行售价仍未公布。

根据部分海外博主的上手预测,Galaxy Z TriFold 最终的售价可能会落在 2400 美元左右(约合人民币 17000 元),国行的最终定价有希望落在 17999 档,但更多预测都怀疑三星会上调至 2 万元左右。

总之,作为目前全球三折叠手机市场的唯二玩家,华为和三星各自会在三折叠这个形态里玩出什么花样,还是相当让人期待的。

无论是 One UI vs 鸿蒙,还是 DeX vs 自由多窗,怎么让这些价格动辄两万多的「天顶星旗舰」实现软件带动硬件、戴着镣铐跳出最漂亮的舞蹈,才是真正的重中之重。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


不止 Sora2!拍我AI V5.5 更新:人人都能用 AI 视频当导演了

2025 年,AI 视频又把桌子掀了。手切金属、小猫做饭,甚至是那个火遍全网的「奥特曼宇宙」,对 AI 来说不过是几句 Prompt 的功夫。


但也别高兴得太早。

绝大多数 AI 视频工具,依然停留在「素材生成」阶段。它们能给你一段精美的画面,但这些画面是大多是破碎的、静音的、单一景别的。

如果你想搞点严肃创作,比如带分镜的故事片,你得不停地「抽卡」,祈祷 AI 能听懂什么是远景、什么是特写。

结果往往是,它一股脑塞给你一堆逻辑不通的废片。选完还得配音、剪辑、配乐…一串工作流下来,10秒视频能干两个星期。

AI 视频到底什么时候才有带演技的叙事能力能学会「讲故事」?

昨晚,拍我AI(PixVerse) V5.5 的更新给了给我带来了惊喜。时隔半年,这位「卷王」再次扔出重磅炸弹。如果说上一个版本是给你配了一个特效师,那么 V5.5 则是给你配备了一个懂视听语言的导演组。

V5.5 是国内目前唯一能够一键生成「分镜 +音频」,实现完整叙事的 AI 视频大模型。

它最大的突破在于:AI 视频开始具备「导演思维」。它不再只是生成会动的图片,而是开始理解镜头、声音与叙事之间的逻辑关系。

以前需要专业分镜师才能做到的事,现在的你,也能「从从容容游刃有余」。

AI 视频终于拥有了「灵魂」

影片的「故事感」从何而来?很大程度上,源于人物的对白、背景音乐的烘托,以及镜头切换带来的节奏感。

我们就从这两个维度,来狠狠考验一下拍我AI 的成色。

查看完整视频案例效果请跳转 APPSO 推文

自带百万音效师

先从「配音师」这个角色开始,拍我 AI V5.5 支持多角色音画同步,看它水平怎么样。

首先我们来段沙滩广告。

提示词:男人看向镜头,将啤酒举到镜头前,对着镜头倾斜瓶子,做干杯动作。背景音是动感的电子乐,有明显的鼓点,充满流行感。

拍我 AI 做得干净利落。最让我起鸡皮疙瘩的是细节: 它完全听懂了场景,配上了十分适合夏日沙滩的感觉的音乐。

这种对环境音的理解,十分给力。

再来点环境不一样的,让一辆的士驶过城市街头。

拍我 AI 也是手拿把掐,镜头不仅跟随着汽车,还配上了街头嘈杂的汽车声,仿佛真的置身于人头攒动的纽约街头。

提示词:出租车在城市街道里前行,渐渐消失在画面中。

但这还只是开胃菜,我们继续上强度。

我先用拍我AI 内置的 Nano Banana Pro,生成了一张图片,然后再让拍我 AI 生成了一个「欢迎南方小土豆光临东北」的视频。

 

提示词:女人热情地说:「欢迎南方小土豆,来我的家乡!俺东北这里可想你啊!」

短短两句话,口型对上了,东北阿姨热情的劲儿都拿捏了,简直让人想要下了班就立刻买张机票去旅行。

再比如,下面这段帕丁顿熊的片段中,它精准地复刻了那标志性的英伦腔调。那种特有的顿挫节奏与绅士般的「老伦敦」口音,听起来不仅地道,而且非常有辨识度。

而在处理小熊的剧情时,它更是展现出了对剧本的理解力。

当角色意识到自己身处巴黎铁塔,而对方在东京铁塔的乌龙瞬间,拍我AI 生成的语音准确传达出了那一刻的错愕与惊讶。

这种对语气拿捏的细腻程度,让整个片段不再是简单的画面堆砌,而是有了真实的情绪流动。

它不仅仅是简单地识别了两个角色形象,更深刻地理解了角色背后的文化符号与剧情语境,从而为它们匹配了极具灵魂的声音演绎。

不难看出,拍我AI 音频生成功能,让视频工作流里的配乐和配音门槛大幅降低。只要在拍我AI 的视频生成的参数里,将「音频」的选项打开,接着只需要简单的一句话,就能帮你快速批量尝试,简单到一个人就能轻松做好。

拿捏影视级的镜头

景别,是导演手中的刀,用来切割时空,引导情绪。

过去,用 AI 做分镜简直是「噩梦」:你得分别生成远景、近景,然后再自己去剪辑软件里拼。而在拍我AI V5.5 里,这种笨功夫成为了历史。

打开多镜头模式,告诉 AI 你要的画面的景别,并切换多机位,它就能直接生成一段有叙事节奏的成片。

比如那个火遍全网的「三宫格海边写真」,我们就能把它变成一段更加有趣的剧情短片:

提示词:
镜头一:猫回头看着镜头。猫说:「山的那边是什么」。
镜头二:猫再次回头望向大海。镜头拉近猫,猫说:「你不用告诉我」。
镜头三:猫正脸部的特写镜头。猫说:「因为,我只想在你家里捣乱。」

整体成片的效果相当扎实。但真正让我惊叹的,是拍我AI 理解了台词背后的情感潜台词。在猫咪开口前的瞬间,极具灵性地加了一个推镜头的特写调度。这种看似简单的运镜处理,瞬间拉满了画面的叙事张力。

我们再来到东非大草原。我还用 Nano Banana Pro 生成了一个纪录片图片,一键视频生成了一段剧情短片:

如果你觉得还要先学习写分镜太麻烦,没关系,拍我AI V5.5 的「脑补」能力同样惊人。 只给一句话,它也能给你惊喜。

提示词:he woman watching her memory-lost mother at home, and sad. They hugged but her mother seemed not to remember her anymore.

拍我AI V5.5 交出的答卷超出预期。不但给了我三个镜头,还自主构建了一段完整的叙事:从母女互动,到最后温情相拥的落点,剧情逻辑清晰感人。

可以看出,拍我AI V5.5 已经不再止步于单一画面推进,而是开始真正掌握了视听语言的语法。通过精准捕捉提示词中的场景氛围与情感基调,自主编排景别和镜头,为生成的影像注入了能够打动观众的内涵。

这种变化,让最终的成品摆脱了「动态图片」的单调标签,进化为一段真正具有叙事承载力的影像素材。

一键直出广告大片,新的创作神器诞生

刚才那些玩法可能还只是「整活」,为了验证它是否真的具备「生产力」,我们决定再上点难度。

直接甩给拍我AI V5.5一个完整的惊悚电影镜头脚本,看看它接不接得住。

提示词:The video is shot using a fisheye lens, giving a distorted, wide-angle view of an urban street scene at night in front of a store with a sign reading “DELI • GROCERY • ATM” (English). The lighting is dim, with red neon reflecting off wet pavement. The musical sound is slow, ominous industrial bass with distant sirens. The camera focuses on a tall figure wearing a cracked, porcelain doll mask and a heavy trench coat, looming over the lens. Behind him, two figures in black hoodies stand motionless near the store entrance. The masked figure leans uncomfortably close to the fisheye lens, whispering hoarsely: “Midnight tick, the shadows don’t sleep. Price on the head, and the secrets we keep. You saw the sign, but you didn’t read the print. One wrong step, and you vanish in a tint.” The figure slowly raises a gloved hand to cover the camera lens as the screen fades to black.

坦白说,最终呈现的成片质感大大超出了我的心理预期。

拍我AI V5.5 展现出的剪辑非常老练,它懂得如何在不同景别间流畅切换,避免了 AI 视频生成中常见的时空割裂感,让画面流转显得合乎逻辑。

当然,现阶段的 AI 还无法做到百分之百的完美。比如在处理最后那个极具张力的鱼眼镜头人物对白时,面部细节仍显露出些许破绽。但它在动态物理规律的遵循上守住了底线,整体瑕不掩瑜,成片的完成度和可用性依然处于高水准。

更令人惊喜的是声画配合。拍我AI V5.5 生成的人声不仅仅是念出台词,而是精准拿捏到了惊悚题材所需要的紧张氛围与压抑感,从音色质感到语速节奏,都与画面情绪实现了默契。

这种逻辑自洽、鲜有出戏感的表现,直接拓展了它的落地场景。对于电影导演而言,它完全可以作为高效的沟通工具,用来向编剧或摄影指导直观地阐述创意构思。

而对于广告人来说,它还是个创意利器。只需投喂一个完整的 Brief 和示意图,它就能迅速生成一支达到提案级别的汽车商业广告,效率惊人。

提示词:黑暗的极简空间中,一束流动的光带扫过深灰色车身的腰线,展示出”液态金属”般的肌肉质感。紧接着,矩阵式LED大灯猛然亮起,光束直刺镜头,照亮空气中的微尘。音乐声是低沉的电流声逐渐增强,伴随一声类似心脏跳动的重低音。一个沉稳深沉的男声说:”觉醒。” 镜头切至下一场景: 城市夜景的高速跟拍镜头,车辆在充满了蓝紫色霓虹灯光的隧道中飞驰。流动的城市灯光在车窗和流线型车身上拉出长长的光带,强调极速下的动态模糊感。音效是尖锐且充满未来感的电机加速啸叫声,混合着破风声。男声说:”超越速度的边界。” 镜头切至下一场景: 航拍镜头展现广阔的沿海悬崖公路,正值日落时分(Magic Hour),金色的阳光洒满车身,与深邃的大海形成冷暖对比。车辆向着地平线驶去,留下优雅的背影。音乐转为宏大且激昂的电影氛围乐,带有史诗感。男声继续:”不仅是抵达前方,更是征服。” 镜头切至下一场景: 车辆静止在极简的黑色反光地面上,车头正视前方,背景是抽象的红色流光慢慢消散。镜头缓慢拉远,上方浮现银色金属质感字幕”APEX “。男声说:”Apex GT。” 音乐在最后一声强有力的重音后戛然而止。

可以看到,这类成片的质感已经比较稳定。这充满速度与金属质感的车辆,让你几乎很难分辨这出自 AI 之手,还是某家专业广告公司的制作班底。

画面之间的衔接展现出了极高的成熟度,丝毫看不出拼接的痕迹。拍我AI V5.5 并非机械地堆砌素材,而是通过摇移等镜头、特写转向全景等画面语言,生成了一段有起伏、有张力的叙事段落。

配合引擎轰鸣与契合度极高的背景音乐,它成功摆脱了「AI 味」的廉价感,呈现出了可以融入到的工作流级别的影像水准。

别当「工具人」了,去当真正的「导演」

这次拍我AI (PixVerse) V5.5 的体验,让我产生了一个强烈的体感:AI 视频生成,正在经历一次关键的转折点。

过去使用 AI,像是在指挥一个听不懂人话的实习美工。你花着钱,还得在海量废片里大浪淘沙。那种频繁调整、试错、最后还得不到满意结果的挫败感,磨灭的不仅是时间,更是创作的热情。

拍我AI  V5.5 的出现,让我们看到了一丝曙光。

V5.5 底层模型基于自研多模态理解与生成技术,支持音频和视频同步生成,模型融合多镜头理解能力,智能生成匹配的分镜与多镜头,理解了视听逻辑。它不再是一个冷冰冰的素材库,而是一个开始懂剧本、懂叙事的「执行导演」。

虽然它还远未完美,但 拍我AI V5.5 这次确实给 AI 带来了一种「叙事能力的觉醒」,开始抹平普通人与专业导演之间那道巨大的技术鸿沟。

往后,无论是个人整活,还是商业化的广告样片、影视预演(Pre-viz),效率都将迎来质变。

这意味着,我们即将告别 AI 「素材生成」时代,跨入真正的「内容生成」时代。

在这个新时代下做专业创作,你可以不再需要精通 PR 或 AE,也不需要昂贵的摄影器材。你只需要专注于最核心的东西——创意与表达。

把繁琐的执行交给 AI,把思考留给人。

我想,这就是 AI 技术进步最性感的意义。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


笑死,兵马俑在千问 APP 里跳 K-Pop,比练习生还丝滑

让兵马俑跳 K-Pop 是什么体验?

如果你今天刷到一段视频:一位两千岁高龄的「老人家」兵马俑拿着麦克风,跟着节拍左摇右摆,动作比练习生还丝滑,表情管理比爱豆还到位。

倒也不用慌,这只是 AI 界的又一次整活现场。

而这充满反差感、邪门又好笑的画面,正是出自阿里千问 App 新升级的功能。

基于 Wan2.5 音视频同时输出能力,千问的 AI 玩法又升级了!仅需一张照片+一段提示词,就能生成口型精准、动作丝滑的「边唱边跳」视频,支持最长 10 秒、1080P 输出。

▲(别急,还有高手,唱跳俱佳的兵马俑男团来了)

而且没有任何限制。无论是真人照片、萌宠、二次元角色,还是文物、卡通形象,千问 App 都能让它们动起来。

当然,得先说好:视频里的声音不是提前录好的音频,也不是简单的文字转语音,更不是套模板,而是 AI 根据自己的理解推理生成的,AI 会自己根据角色,配上合适的音色、曲调。

可能和咱们唱的有点不一样,但正是这份独特的「AI 味儿」演绎,反而格外妙趣横生~

一张图+一句话,万物皆可边唱边跳

眼瞅着快过年了,刘德华的《恭喜发财》也已经在解封的路上了。

听腻了天王版本?那不如试试财神爷本尊亲自开嗓。我上传了一张财神爷的画像,输入提示词。结果财神爷真就动起来了, 一边唱着「恭喜你发财,财富一定来」,一边左右摇摆。

这才是真·财神附体。

所以拿这个给长辈拜年, 红包不翻倍都说不过去。

诗仙也要跟上时代潮流。

我翻出一张李白画像, 让他整一段当下最火的《刀马刀马》。两分钟后, 李白从画里「复活」了, 跟着魔性旋律左摇右摆。

可惜 AI 没能让他跳出正宗刀马舞, 看来对音乐和舞蹈的理解还得再练练。不过虽然舞姿跑偏了, 但 AI 生成的整个场面却别有一番喜感,不得不说千问 App 简直是 AI 抽象届的舞王。

《疯狂动物城 2》最近票房大卖,尼克和朱迪这对经典搭档又火了一波。

既然都这么火了, 那不如让它们来段双人唱跳?尼克唱着「朋友一生一起走」, 朱迪在旁边摇头晃脑,两个人还真有那么点默契配合的意思。整个画面, 倒像是官方番外篇里的音乐剧片段。

不过,尼克这充满「个性」的唱腔,意外成了整段视频的笑点担当,打工人平淡工作日里的笑点,最近都被千问 App 承包了。

还记得许嵩当年那段自我介绍吗?「大家好我是 Vae,这是我即将发表的首张独创专辑《自定义》。」我寻思着,要不让爱因斯坦也来一段?他张着嘴,一本正经地说着这段经典台词,还真的配合着节奏点头,更绝的是口型竟然也一一对上了。

只能说,许嵩看了会沉默,爱因斯坦看了会流泪。

《猫和老鼠》作为经典哑剧动画,但有了 AI,我们可以让 Tom 开口唱歌,顺便还能跳当下大火的高雅人士企鹅舞。满分十分,你能打几分?

最后,我让在卢浮宫端了 500 年架子的蒙娜丽莎戴上墨镜开唱。魔性歌曲配达芬奇名画, 这组合本身就够行为艺术了。文物活化的另一种打开方式,get 了。

千问 P 图+生视频=快乐²

当然,千问 APP 除了可以生成视频,也可以生成图片。

这次更新接入了全新改版的图片生成及编辑模型 Qwen-Image,在图像编辑一致性、多视角转换、多图融合等方面都有突破。简单说就是:只要在对话界面输入指令,就能自动调用模型能力,实现各种魔性操作。

比如换姿势:原本端坐的兵马俑,被指令后,立即呈现出一个手握篮球腾空封盖的英姿,视觉冲击感十足。

再比如服装变换:周末想发穿搭照但懒得换衣服?上传自拍,一句话把 T 恤换成西装,甚至还能给大卫雕像穿上了梅西的球衣。

反正脑洞有多大,AI 就能玩多花。

那么这时候,我们就可以体验进阶操作:

先改图,再生视频。

简单说就是:先把图片 P 成你想要的样子,然后再让它动起来唱歌跳舞。一套组合拳下来,创作自由度直接拉满。

比方说,我上周末花时间又重新看了一遍《泰坦尼克号》,于是我突发奇想:如果把马斯克和奥特曼 P 进《泰坦尼克号》的经典船头场景会怎样?

第一步,生图:上传两人照片,输入指令,千问 App 直接给我生成了一张高清合成图,男版马斯克,女版奥特曼,结果真是好一对恨比爱长久的苦命鸳鸯。

第二步,生视频:基于这张图,继续输入「帮我生成视频,图中的人物边唱歌边做飞翔的动作,海风要强烈,情绪要饱满」

然后… 两个科技圈大佬就在我手机里深情开唱了。

测到这儿,我已经停不下来了。

接着,我让千问 App 生成一颗拟人化的红豆。然后让它用它自己的调子唱出专属版本的「哈基米南北绿豆, 阿西噶阿西」。

结果这颗红豆顶着硕大的眼睛, 挥舞着小手, 跟着魔性节奏左摇右摆。就是这嗓音不走可爱风,反而略显粗犷,杀伤力几乎比原版还要高出三个数量级。

听完像吃了云南野生菌,画面与声音的搭配极其令人上头。

既然单人能跳,那能不能搞个组合出道,我突发奇想:要不让四大名著的主角们组个乐队?

说干就干。我先用千问 App 的图片融合功能, 把五位经典人物 P 成一张站位完美的乐队阵容——

孙悟空担任主唱, 关羽负责电吉他,林黛玉坐在键盘前,武松打鼓,曹操当贝斯手,定妆照搞定后, 那便是最简单的动起来环节,两分钟后, 一场跨越时空的摇滚现场就诞生了。

不得不说,这届 AI 真会玩。

一张图+一句话=10 秒魔性视频。不需要剪辑软件,不需要特效技能,甚至不需要会唱歌会跳舞,你只需要脑洞够大,AI 就能帮你实现。

除此之外,这功能除了整活,认真用起来也挺实用。

过年拜年视频可以交给 AI,朋友生日可以让寿星公跳舞,公司年会节目再也不愁没创意,甚至表白都能整出新花样…

当然,如果你只想单纯快乐一下,打开千问 App,上传图片,输入你的沙雕想法,剩下的交给 AI。2-5 分钟后,你就能得到一个足够发朋友圈炸场的魔性视频。

原来 AI 时代的快乐,真就这么简单。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


早报|曝折叠屏iPhone无折痕/豆包手机助手首款工程机售罄/DeepSeek新模型达GPT-5水平

cover

🍏

苹果 AI 负责人宣布离职,团队架构大调整

📱

豆包手机助手发布技术预览版,首款工程机亮相

🍎

苹果折叠屏 iPhone 或突破「无折痕」设计

🤖

DeepSeek 发布两款新模型,达 GPT-5 水平

🚗

小米汽车官宣「现车选购」计划,预计年底前可提车

🛣

罗永浩的十字路口「大事件」定档 12 月 30 日

📊

车企公布 11 月销量数据:比亚迪狂销 48 万辆,吉利新能源同比大增 96%

🐱

米哈游联合创始推出「猫猫」互动娱乐 AI 模型

👾

Google Gemini 3 五分钟即被「越狱」,安全隐患引发担忧

👷

曝百度启动史上最大规模裁员:AI 投入高涨,传统业务持续下滑

🤖

调查:86% 美国消费者信任 AI 选购车险

💡

Intel 前 CEO「刺破」AI 泡沫:GPU 活不过十年

🌟

三星「阔折叠」新品曝光

💰

取款新规明年落地:超 5 万元无需登记资金来源

重磅

苹果 AI 负责人宣布离职,团队架构大调整

据彭博社报道,苹果人工智能负责人 John Giannandrea 将在经历动荡任期后离职。这位高管曾主导机器学习与 AI 战略,但在生成式 AI 领域的推进中表现不佳,导致公司在与硅谷竞争对手的较量中落后。

苹果在生成式 AI 的布局比 OpenAI 的 ChatGPT 推出晚了两年,Apple Intelligence 也表现平平。此外,原计划于 2025 年春季发布的 Siri 大规模更新被迫延期,进一步凸显团队的困境。

Giannandrea 于 7 年前从 Google 加入苹果,直接向 CEO Tim Cook 汇报工作。苹果表示,他将在明年春季完成过渡后正式离开公司。

不同于以往的做法,苹果不会为其寻找继任者,而是选择拆分人工智能团队,分别由软件负责人 Craig Federighi、首席运营官 Sabih Khan 和服务负责人 Eddy Cue 接管相关工作。

与此同时,AI 研究员 Amar Subramanya 已加入苹果,担任副总裁,直接向软件负责人 Federighi 汇报。他将负责基础模型、机器学习研究以及 AI 安全与评估等领域。这些正是 Giannandrea 近期的主要职责。Subramanya 曾在 Google 工作 16 年,近期则担任微软公司 AI 企业副总裁。

苹果的 AI 战略调整显示出公司在人工智能领域的持续压力。尽管 Siri 的更新被推迟,但苹果仍计划在明年春季推出新版软件,以期缩小与竞争对手的差距。

豆包手机助手发布技术预览版,首款工程机亮相

昨天,豆包宣布其全新手机 AI 助手「豆包手机助手」以技术预览版的形式正式亮相。

据介绍,这款产品由豆包与手机厂商在操作系统层面合作开发,基于豆包大模型能力与厂商授权,旨在为用户提供更便捷的交互方式和更丰富的使用体验。

在演示视频中,用户只需点击手机上的 AI 按键即可呼出豆包,实现跨应用执行复杂操作,模拟人类点击、滑动与输入,实现比价点外卖、自动回复微信等功能。

同时,搭载豆包手机助手技术预览版的工程样机 nubia M153 少量发售,售价为 3499 元,主要面向开发者和行业人士开放体验。

据悉,字节跳动与努比亚为这款工程机的首销备货量为 3 万台。目前,购买页面显示「已售罄」,购买需预约等待下次开售。

官方强调,该机型仅为技术预览用途,并不承诺功能的成熟度,普通消费者需谨慎选择。值得注意的是,豆包官方还明确表示不打算做手机。这款工程样机的具体配置如下:

  • 配备高通骁龙 8 至尊版处理器;
  • 搭载 6.78 英寸 1264 × 2800 LTPO 屏幕;
  • 后置三颗 50MP 摄像头,涵盖主摄、超广角与长焦,均支持光学防抖;前置具备自动对焦功能;
  • 提供 16GB + 512GB 存储组合;
  • 电池容量为 6000mAh,支持 90W 有线快充、15W 无线充电及 5W 反向充电;
  • 机身重量约 212g,支持超声波屏下指纹、NFC、红外、USB 3.2 Gen1,并配备 5 麦克风与双扬声器。

上述消息公布后,中兴通讯股价昨天上午强势涨停,报 46.30 元,成交金额超 139 亿,封单金额超 40 亿元,其 H 股也涨超 11%。

🔗 相关阅读:体验豆包手机助手,它把我的手机「变薄」了

大公司

苹果折叠屏 iPhone 或突破「无折痕」设计

据 RS Web Solutions 报道,苹果正加速推进其首款折叠屏 iPhone 的研发与量产计划。新机预计将在 2026 年秋季正式发布,或与 iPhone 18 Pro 同期亮相。

报道指出折叠屏 iPhone 的几项关键创新 —— 包括能够在不使用时完全隐藏的 2400 万像素屏下摄像头和突破性的「无折痕」内屏设计,解决了当前市面上折叠屏手机普遍存在的屏幕折痕问题。

此外,新浪新闻援引供应链消息指出,iPhone Fold 已进入工程验证与预量产阶段,仅剩细节设计待优化。苹果为解决折痕问题已秘密研发 5 年,投入大量资源,并在屏幕结构、材料处理及层压工艺上进行独立设计。

同时,苹果还与新日兴、Amphenol 等供应商合作,整合屏幕面板与铰链组件。据悉,铰链部分可能采用高强度液态金属,以提升耐用性并减少形变。

在外观设计上,iPhone Fold 将配备一块 7.8 英寸内折显示屏,外部则设有 5.5 英寸辅助屏幕,满足日常折叠状态下的使用需求。

RS Web Solutions 还指出,折叠屏 iPhone 的售价或将达到约 2400 美元(近 1.7 万元人民币),成为迄今最昂贵的 iPhone。

DeepSeek 发布两款新模型,达 GPT-5 水平

昨天,深度求索 DeepSeek 正式发布了 V3.2 系列模型,包括标准版「DeepSeek-V3.2」与增强版「DeepSeek-V3.2-Speciale」。

  • DeepSeek-V3.2 的定位是「全能型」模型,目标在于平衡推理能力与输出长度,适合日常问答与通用 Agent 场景。

官方测试显示,该模型在公开推理类 Benchmark 中达到了 GPT-5 水平,仅略低于 Gemini-3.0-Pro。同时,相比 Kimi-K2-Thinking,V3.2 输出更为简洁,大幅降低了计算开销与用户等待时间。

DeepSeek-V3.2 还首次实现了「思考模式下的工具调用」,通过大规模 Agent 训练数据合成方法,显著提升了模型的泛化能力。这一功能使模型能够在复杂任务中多轮思考并调用工具,最终给出更详尽准确的回答。

🤗 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2

👾 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

  • DeepSeek-V3.2-Speciale 被称为「逻辑怪兽」,是标准版的长思考增强版,结合了 DeepSeek-Math-V2 的定理证明能力。

该模型在数学与编程领域表现突出,成功斩获 IMO 2025、CMO 2025、ICPC 2025 全球总决赛及 IOI 2025 金牌,其成绩已接近甚至超越人类顶尖选手水平。

🤗 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

👾 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

目前,DeepSeek-V3.2 系列模型均已开源,其中 V3 模型已在网页端、App 与 API 全面上线,而 V3.2-Speciale 则以临时 API 服务形式开放,供研究与社区评测使用。

官方表示,Speciale 版本消耗的 Tokens 显著更多,成本更高,因此暂未针对日常对话与写作任务进行优化。

📖 技术报告:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

🔗 相关阅读:ChatGPT 三周年遭 DeepSeek 暴击,23 页技术报告藏着开源登顶的全部秘密

小米汽车官宣「现车选购」计划,预计年底前可提车

昨天,小米汽车官方宣布启动「现车选购」计划。此次开放的「现车」包括全新现车、官方展车及准新车,均经过严格质检,部分车辆由官方修复,且均未进行过登记注册。

用户购买「现车」可享快速提车、完整原厂质保及售后服务,部分车型还将提供价格优惠。小米汽车的说明中显示,已锁单但尚未交付的用户可在昨日 12 点起优先改配同车型「现车」。

而从本周三 10 点起,「现车选购」将面向所有用户开放。若用户在 12 月 26 日 24 点前完成锁单或改配,预计可在 2025 年底前提车;如因小米汽车原因导致交付延至 2026 年,则可享跨年购置税补贴。

小米汽车还进一步解释了不同类型「现车」的来源与政策:

  • 「全新现车」:来自异常订单或因不可抗力未能交付的车辆
  • 「官方展车」:门店静态展车,可能存在轻微磨损,已完成整备
  • 「准新车」:运输过程中出现轻微瑕疵并经官方修复的车辆

此外,改配「现车」的用户需满足条件,包括下单人米 ID 与原订单一致、上牌人信息保持一致等。

小米汽车强调,改配后仍可保留原订单锁单时的销售权益,但若新选择的「现车」配置不满足原权益,则相关权益失效且不退差价。

罗永浩的十字路口「大事件」定档 12 月 30 日

昨天,罗永浩正式官宣其预告已久的大事件 —— 罗永浩的十字路口年度科技创新分享大会(2025)将于 12 月 30 日在上海举行。

罗永浩表示,本次大会的全部科技产品均由其与团队主动甄选,并将由他本人在现场进行讲解。大会内容涵盖成熟企业的创新新品,以及尚处早期阶段的初创项目,其中部分产品为工程样机,不鼓励普通消费者购买。罗永浩强调,这并非带货直播,而是一场以创新为核心的科技分享活动。

值得关注的是,大会还将发布细红线科技自研的 AI 软件。资料显示,细红线科技成立于 2022 年,专注于 AR 操作系统与硬件研发,是罗永浩继锤子科技之后的又一次创业尝试。

此外,大会将设置专门板块,展示初创企业尚未成熟的创新成果,旨在为这些团队提供曝光与支持。罗永浩称,这一环节特别值得关注,因为其中可能包含未来科技的重要方向。

车企公布 11 月销量数据:比亚迪狂销 48 万辆,吉利新能源同比大增 96%

近日,国内多家车企公布 11 月交付成绩,比亚迪继续霸榜、零跑以 70327 台蝉联新势力交付榜首,小米连续第三个月突破 4 万台,蔚来、理想与吉利系品牌均公布环比与同比变动。具体数据整理如下:

  • 比亚迪:11 月销售 480186 辆,其中海外销量 13 万辆,创历史新高;
  • 吉利集团:整体新能源销量 187798 台,同比增长 96%,其中极氪与领克合计交付 63902 台;
  • 长城汽车:销量 13.32 万台,同比增长 4.57%,其中新能源车销量 40113 台,海外销量 57309 台;
  • 零跑:销量 70327 台,同比增长超 75%,环比基本持平;
  • 赛力斯集团:新能源销量 55203 辆,同比增长 49.84%,其中赛力斯汽车销量 51677 辆,同比增长 59.73%;
  • 小米:连续第三个月交付超 4 万台,前 11 月累计交付已超 33 万台,并在全国新增 17 家门店;
  • 小鹏:交付 36728 台,其中海外市场交付 3.98 万台,同比增长 95%;
  • 蔚来:交付 36275 台,同比增长 76.3%,其中蔚来品牌 18393 台、乐道 11794 台、萤火虫 6088 台;
  • 理想:交付 33181 台,环比增长 4.45%;
  • 岚图:交付 20005 台,同比增长 84%,实现「十连涨」并首次月交付破 2 万;
  • 智己:销量 13577 台,同比增长 35.7%,连续三个月破万。

整体来看,零跑、小米、岚图等新势力保持高增速,比亚迪与吉利矩阵继续领跑规模,蔚来与小鹏通过多品牌与增程战略加速布局,行业分化趋势明显。

米哈游联合创始推出「猫猫」互动娱乐 AI 模型

据 36 氪报道,米哈游联合创始人蔡浩宇在美国创立的 AI 公司 Anuttacon 近日上线了一款全新 AI 聊天大模型「AnuNeko」。

该产品以黑猫为默认形象,强调个性化与互动性,区别于传统的工具型 AI,更像是具备情绪与独立思考的「伙伴」。

「AnuNeko」的注册商标已于 2025 年 9 月 29 日提交美国 USPTO,涵盖软件、AI 角色与娱乐等多个领域。用户可选择两种不同风格的虚拟猫角色:回答犀利的「异国短毛猫」Exotic Shorthair 与更温和的「橘猫」Orange Cat。

测试显示,前者在评价「原神」时直言米哈游是行业鲶鱼,推动了竞争,而后者则以更官方的语气称赞其为优秀的开放世界游戏。

报道认为,蔡浩宇的目标并非仅限于推出一款聊天机器人,而是借此探索 AI 在游戏生态中的应用。

在今年 8 月,Anuttacon 曾发布实验性 AI 游戏《群星低语》,玩家通过与 AI 角色对话推动剧情发展,体现了高自由度与 AI 自主性。此次「AnuNeko」的上线,或许是进一步测试 AI 在互动娱乐中的潜力。

在全球范围内,Google、育碧、字节跳动等企业也在布局 AI + 游戏:

  • Google DeepMind 推出的 SIMA 2 能在 3D 虚拟世界中自主学习与推理;
  • 字节的「Lumine」在《原神》中展现出跨场景泛化能力;
  • 育碧的 NEO NPCs 则已能实时分析玩家语音并制定策略。这些案例显示,AI 正逐步成为游戏产业的核心驱动力。

报道指出,与传统强调执行力的智能体不同,Anuttacon 的策略是让 AI 更「像人」,具备情绪与个性。这一方向或许能为未来互动娱乐带来新的突破:真正吸引玩家的并非完美答案,而是充满生命力的对话与陪伴。

Google Gemini 3 五分钟即被「越狱」,安全隐患引发担忧

据 Android Authority 报道,韩国 AI 安全团队在昨天成功对 Google 最新的 Gemini 3 Pro 模型进行越狱,仅用时五分钟便突破其防护机制。

研究人员来自 Aim Intelligence,他们在测试中要求 Gemini 3 提供制造天花病毒的详细步骤,模型迅速给出被描述为「可行」的方案。

随后,团队进一步要求其生成自嘲 PPT,Gemini 3 产出了一份名为「Excused Stupid Gemini 3」的完整幻灯片。更令人担忧的是,模型还在代码工具中生成了制作沙林毒气和爆炸物的网页内容。

首尔经济日报指出,这反映出当前 AI 模型在防护机制上的普遍不足。研究人员强调,Gemini 3 不仅能绕过安全规则,还能使用「规避策略」和「隐藏提示」,使传统防护措施失效。

英国消费者组织「Which?」的最新报告也显示,包括 Gemini 和 ChatGPT 在内的主流聊天机器人在可靠性方面存在问题,常常给出错误、不清晰甚至危险的建议。

曝百度启动史上最大规模裁员:AI 投入高涨,传统业务持续下滑

据财新网报道,百度近日启动近年来最大规模的集中裁员,涉及比例最高达 30%,部分团队裁撤幅度甚至超过 40%。据悉,此次裁员主要集中在移动生态事业群(MEG),而 AI 与云服务相关岗位则基本保留。

裁员补偿方案在不同部门有所差异,普遍在 N + 1.5 至 N + 3.5 之间。部分员工透露,签字费和年终奖系数使得补偿水平高于往年。外包团队则面临迁往西安的调整,若无法接受调动则可能失去岗位。

百度第三季度财报显示,公司总营收为 312 亿元,同比下降 7%,环比下降 5%;网络营销收入为 153 亿元,同比大跌 18%,已连续六个季度下滑。

归属于百度的净亏损达 112 亿元,而去年同期为盈利 76 亿元。尽管 AI 业务收入同比增长超 50%,规模接近 100 亿元,但仍不足以弥补传统广告业务的下滑。

《燃点商业观》指出,百度此举是「刮骨疗毒」式转型。公司已设立基础模型研发部和应用模型研发部,均直接向 CEO 李彦宏汇报,以加速大模型与应用模型的研发。

然而,百度在 C 端应用层面仍缺乏爆款产品,文心一言月活用户仅约 500 万,远低于字节跳动旗下豆包的 1.72 亿。在云计算市场,百度云占比仅 6.1%,落后于阿里云、火山引擎和华为云。

分析认为,百度正将账面近 3000 亿元现金储备倾斜至 AI 赛道,试图通过大模型、智能云和自动驾驶实现「造血」。但在广告业务持续下滑、竞争对手加速抢占市场的背景下,如何将技术优势转化为商业价值,仍是百度面临的最大挑战。

调查:86% 美国消费者信任 AI 选购车险

据 Carscoops 报道,一项由 Insurify 发布的最新研究显示,美国消费者在汽车保险选择上对 AI 的信任度正在显著提升。

调查覆盖全美 3002 名驾驶员,其中 42% 已经使用过AI助手来寻找车险方案,86% 的受访者表示愿意让 AI 引导他们完成保险购买流程。这一比例凸显了算法在金融决策中的渗透速度与广泛接受度。

研究指出,AI 在比价环节的应用尤为突出,76% 的用户依赖 AI 来比较不同保险公司的报价。

代际差异也十分明显,约 60% 的 Z 世代(1990 年代中期至 2010 年左右出生的人群)驾驶员已使用 AI 进行车险选购,而婴儿潮一代(1946 年至 1964 年间出生的人群)仅有 20% 表示信任该技术。

各州之间的差异同样存在,例如加州有 55% 的车主使用 AI,而伊利诺伊州仅为 34%。

在保单签订环节,39% 的驾驶员愿意让 AI 完成最终购买,若能节省 1000 美元,这一比例则上升至 68%。此外,52% 的美国人认为 AI 在比价方面优于人工代理,42% 的 Z 世代甚至认为 AI 在客户服务上表现更佳。

然而,信任在理赔与事故责任认定环节显著下降。仅有 40% 的受访者愿意让 AI 决定理赔结果,38% 的人愿意让 AI 判定事故责任。

报道指出,这表明,尽管 AI 在便利性和成本优化方面获得广泛认可,但在涉及关键利益的环节,消费者仍倾向于保留人工裁决。

抖音实验室 EvalMuse 入选 AAAI 2026,定义文生图评估新标准

抖音多媒体质量实验室昨日宣布,其自主研发的图像生成评估体系 EvalMuse 已成功入选 AAAI 2026。这一成果标志着中国团队在国际顶级人工智能学术会议上对文本生成图像(T2I)评估方法的突破性贡献。

EvalMuse 旨在解决当前 T2I 模型评估中存在的主观性与一致性不足问题。该体系通过引入多维度指标与自动化评估框架,提升了对生成图像的质量判定能力。

实验室方面指出,EvalMuse 能够更准确地反映模型在语义一致性、图像清晰度及创意表达上的表现,还为未来大规模模型的标准化评估提供了参考路径。

📖 论文:https://arxiv.org/abs/2412.18150

💻 开源地址:https://shh-han.github.io/EvalMuse-project/

小米 7 篇论文入选 AAAI 2026,涵盖 AI 与自动驾驶

昨天,「小米技术」公众号发文称,小米共有 7 篇研究成果成功入选 AAAI 2026,其中 2 篇为口头报告。

这些成果涵盖音效编辑、具身智能 3D Agent、检索与解码、语音问答、空间导航以及自动驾驶等方向,集中展示了小米在大模型与具身智能领域的阶段性进展。

AAAI 是人工智能领域的国际顶级会议之一,由人工智能促进协会主办,在中国计算机学会推荐会议列表中被列为 A 类会议。

AAAI 2026 将于 2026 年 1 月 20 日至 27 日在新加坡博览中心举行。本届会议共收到创纪录的 23680 篇有效投稿,最终录取 4167 篇论文,录取率为 17.6%。

在具体成果方面,小米团队提出了多项创新研究:

  • 《AV-Edit》实现了基于视觉、音频与文本语义的生成式音效编辑,突破传统方法在细粒度编辑上的局限;
  • 《Cook and Clean Together》提出了基于运筹学知识的 3D Grounding 调度任务,并构建了 ORS3D-60K 数据集,显著提升具身智能体的任务执行效率;
  • 《AutoLink》提出自适应模式连接框架,在工业级 Text-to-SQL 场景中实现高召回与低噪声平衡;
  • 《Scaling LLM Speculative Decoding》提出 SpecFormer 并行草稿模型,在大批量场景下提升解码效率;
  • 《End-to-end CLSR》在长语音问答任务中实现跨模态检索性能突破;
  • 《SpNav》框架首次系统解决具身导航中复杂空间关系理解与高级指令解析问题;
  • 《VILTA》通过视觉语言模型嵌入训练闭环,提升自动驾驶系统在极端场景下的健壮性。

小米强调,这些成果体现了公司在人工智能底层技术上的持续投入、突出其在音视频编辑、智能体调度、数据库交互、长语音处理、空间导航与自动驾驶等多个前沿领域的探索与突破。

机械键盘轴体厂商 Cherry 陷入财务危机,或出售外设部门自救

据 TechPowerUp 报道,机械键盘 MX 轴体制造商樱桃 (Cherry) 正面临严重财务困境,公司已在股东大会上讨论出售部分业务以维持运营。

樱桃在 2014 年失去 MX 轴体专利后,市场竞争加剧,中国厂商快速迭代推出润滑轴体、磁轴等新产品,使樱桃逐渐失去优势。

报道指出,樱桃在 2025 年 1 月至 9 月录得净亏损 2040 万欧元,债务规模已超过总资产。为削减成本,公司已完成将全部轴体生产转移至中国,并计划将总部工厂停产,未来生产将外包给中国与斯洛伐克合作伙伴。

目前,樱桃正在考虑出售外设部门(涵盖键盘与鼠标产品)或数字健康与解决方案部门,以缓解资金压力。值得注意的是,MX 轴体仍属于组件部门,预计樱桃将继续生产该核心产品。

樱桃 CFO Jurjen Jongma 表示,目前「既不可能也不适合通过其他方式增强集团资本」,唯一可行的路径是战略性并购或出售资产。

在疫情前,樱桃曾迎来销售高峰,但自 2022 年起销售额骤降 50%,尽管 2023 年有所回升,相关部门业绩仍持续下滑。截至目前,樱桃股价已跌破 1 欧元,市场普遍认为公司亟需外部融资或资产剥离来维持运营。

贝壳找房又传裁员风波,补偿「N+4」

据新浪科技报道,网传贝壳找房启动大规模人员优化,整体比例高达 30%,其中产研部门裁员比例尤为突出,不乏高级岗位及司龄超过 10 年的老员工。

多位员工确认补偿方案为「N+4」,但有声音指出该方案实为「N+1+3 个月年终奖」,并非额外福利。

贝壳方面回应称,网传整体裁员 30% 的说法严重夸大,实际比例不足 0.5%,涉及约 650 人。

财报数据显示,截至 2025 年 6 月底,公司员工总数约 13.18 万人,较 2024 年末减少约 3200 人。贝壳第三季度净利润同比大跌 36.1%,房地产主业持续承压,成为裁员背景。

在战略层面,贝壳正加速推进「一体三翼」转型,即家装家居、房屋租赁和贝好家三大新业务板块。

2025 年 Q3,新业务收入占比已达 45%,创历史新高。然而,新业务利润率偏低,难以抵消传统业务下滑。房屋租赁业务净收入同比增长 45.3% 至 57 亿元,但利润率仅为 8.7%,显示增收不增利的困境。

值得注意的是,贝壳在裁员降本的同时,研发投入仍在增加。2025 年第三季度研发费用同比增长 13.2% 至约 6.5 亿元。贝壳 CEO 彭永东在财报中强调 AI 赋能,推动其在租赁服务与核心业务场景的应用。

资本市场方面,贝壳股价自高点回落逾七成,目前徘徊在 20 美元左右。万科已于 2025 年 11 月宣布清仓贝壳股份,结束自 2017 年以来的战略投资合作。

💡 Intel 前 CEO「刺破」AI 泡沫:GPU 活不过十年

Intel 前 CEO 帕特 · 格尔辛格(Pat Gelsinger)近日在接受《金融时报》采访时表示,量子计算将在未来十年内取代 GPU,并可能引爆当前的人工智能泡沫。

他强调,量子计算与经典计算、人工智能计算共同构成 IT 的「三位一体」,其中量子技术正处于快速突破的临界点。

格尔辛格指出,量子计算机或将在两年内走向主流,这与英伟达 CEO 黄仁勋此前提出的「量子计算至少需要二十年才能普及」形成鲜明对比。

他认为,当前 AI 市场的狂热与过往科技泡沫高度相似:估值飙升、投资爆炸,但缺乏明确的盈利路径。格尔辛格还将现状类比为 IBM 与微软在 1990 年代的关系,认为 OpenAI 与微软的合作可能导致新的权力格局转移。

目前,格尔辛格在风投公司 Playground Global 任职,直接接触量子研究初创企业与实验室。他强调,GPU 在 AI 时代的主导地位或将难以维持,未来十年可能逐步被量子架构取代。

然而,德国媒体 igor´sLAB 报道指出,量子计算仍面临重大挑战,包括量子比特的高不稳定性、庞大的纠错需求、算法适配瓶颈以及生态系统尚未成熟等。

新产品

三星「阔折叠」新品曝光

据 Smartprix 报道,三星在 GSMA 数据库中出现了一款全新折叠屏机型,型号为 SM-F971U,内部代号为「H8」。

这一机型被认为是三星为 2026 年准备的重大新品,意味着公司将首次在同一年推出两款高端 Galaxy Z Fold 系列机型:标准版 Galaxy Z Fold 8(代号「Q8」)与神秘的「H8」机型。

报道指出,三星的命名策略一贯明确:SM-F7 系列代表竖向折叠的「Flip」,SM-F9 系列则代表横向大折叠的「Fold」。因此,SM-F971U 属于 Fold 产品线,而非此前部分传闻所称的「廉价版 Flip」机型。

与 Galaxy Z Fold 8 相比,SM-F971U 的最大变化在于屏幕比例设计。该机型在折叠状态下更短更宽,接近普通智能手机形态;展开后则通过两块 18:9 面板组合,实现近似正方形的「18:18」内屏,类似华为 Pura X 的「阔折叠」概念

Vidu 推出 Q2 生图功能,最快 5 秒生成

生数科技 Vidu 昨天宣布其最新一代 Vidu Q2 生图功能全面上线,并同步推出文生图与图像编辑功能,掀起「一致性革命」,旨在解决 AI 多模态生成中创意与可控性难以兼顾的长期困境,将创作的控制权交还给用户。

  • 一致性升级:Vidu Q2 在参考生图功能上大幅提升语义理解与美学水准,支持更多风格与复杂场景,生成结果在位置、动作、镜头切换等方面保持高度一致;
  • 多模态矩阵:公司已完成视频、音频、图像生成及编辑的全栈自研闭环,形成系统级竞争力;
  • 生成速度:最快 5 秒即可生成图片,显著提升生产效率;
  • 国际认可:在 Artificial Analysis 全球图像编辑榜单中,Vidu 图像编辑功能首次上线即进入前四,超越 OpenAI GPT-5,比肩 Nano Banana 2,成为唯一进入前列的创业公司;
  • 商业化场景:功能覆盖短剧动漫、广告电商、影视娱乐、文旅教育等领域,支持 4K 输出与多比例素材生成。

Vidu 官方表示,通过一站式工作流,创作者可在文生图、参考生图与参考生视频之间无缝切换,显著降低创作门槛。其「一键复刻」功能支持复杂动作与场景的精准还原,进一步提升 AI 在商业化创作中的实用性。

即日起至 12 月 31 日,会员可免费体验全部生图功能,标准版与专业版每月享 300 张免费额度,旗舰版会员可无限生成。

🔗 相关阅读:继 Nano Banana 2 之后,国产 AI 生图又杀出「一致性标杆」,Vidu 生图限时无限免费

可灵 AI 推出全球首个统一多模态视频引擎 O1

昨天晚间,可灵视频正式上线 O1 模型,宣称这是全球首个统一多模态视频大模型,定位为全能创作引擎,旨在通过单一输入框实现跨模态任务的无缝融合,打破传统视频生成的功能割裂问题。

据介绍,该模型引入 MVL(多模态视觉语言)交互架构,并结合 Chain-of-thought 技术,赋予系统更强的常识推理与事件推演能力。

官方表示,O1 模型能够在同一界面下处理照片、视频与文字等多模态输入,用户仅需通过简单对话即可完成复杂的创作编辑。

在功能层面,O1 模型支持多主体视角构建与自由组合,确保视频主体在不同镜头间保持一致性与稳定性。

同时,用户可灵活组合多种技能,一次生成多样化创意变化,并可自由设定 3 至 10 秒的生成时长,以掌控叙事节奏。

此外,可灵 AI 宣布自 12 月 1 日起至 12 月 14 日,将举办为期 5 天的「全能灵感周」,并推出会员年卡限时 6.6 折优惠活动,以吸引更多创作者体验该新模型。

豪威发布全新 2 亿像素传感器,对标索尼 LYTIA 901

近日,豪威(OmniVision)正式发布新一代手机图像传感器 OVB0D,规格直接对标索尼刚刚推出的 LYTIA 901。

据悉,该传感器采用 2 亿像素设计,尺寸为 1/1.11 英寸,略大于索尼 LYTIA 901 的 1/1.12 英寸,定位高端旗舰市场。

OVB0D 传感器在结构上采用「双重片上重组」算法,与索尼 LYTIA 系列的 QQBC 结构有所不同。

GSM Arena 报道认为,索尼在细节解析上可能略占优势,但豪威通过一系列「黑科技」提升了在极端 HDR 场景下的表现,包括 40 万满阱容量、108dB 动态范围、二代 DCG(双转换增益)与 LOFIC(横向溢出积分电容)技术。这些设计可有效提升高光与暗部细节的捕捉能力,解决高光溢出问题。

消息人士 Ice Universe 爆料称,OVB0D 将于 2026 年搭载在 vivo、OPPO、小米与荣耀的旗舰机型中。

相比之下,三星因成本与利润压力,预计不会采用豪威或索尼的大尺寸 2 亿像素传感器,而是继续使用自家 HP2 等 1/1.3 英寸级别的方案。

阶跃星辰推出能在手机上跑的 GUI Agent

近日,阶跃星辰正式开源 GELab-Zero,首次将 GUI Agent 模型与完整配套基建同步开放,支持开发者一键部署。

本次发布的 4B GUI Agent 模型在手机端、电脑端等多个 GUI 榜单上刷新同尺寸模型性能纪录,取得 SOTA 成绩。据介绍,GELab-Zero 提供一键拉起的部署体验,用户可在本地完成环境搭建与推理链路控制。

该模型支持在消费级硬件上运行,兼顾低延迟与隐私保护;同时具备一键式多终端部署能力,可自动处理依赖与设备管理;支持分发至多台手机并记录交互轨迹,实现可观测与可复现;并覆盖多模态智能体范式,包括 ReAct 闭环、多智能体协作以及定时任务等模式。

与此同时,阶跃星辰还开源了基于真实业务场景的自建评测标准 AndroidDaily,旨在推动 GUI 领域模型评测向消费级、规模化应用发展。

目前,企业级用户和开发者可通过 GitHub 与 HuggingFace 平台体验 GELab-Zero。

初创公司 Runway 推出 Gen-4.5 视频模型,性能超越 Google 与 OpenAI

美国人工智能初创公司 Runway 于昨天正式推出新一代视频生成模型 Gen-4.5。这款产品在独立基准测试中超越了 Google 与 OpenAI 的同类模型,成为当前行业领先的视频生成工具。

Gen-4.5 能够根据用户提供的文字提示生成高清动态视频,具备更强的物理规律理解、人体动作捕捉、镜头运动与因果关系处理能力。

在独立 AI 基准测试机构 Artificial Analysis 的 Video Arena 排行榜中,Gen-4.5 位居第一,Google 的 Veo 3 排名第二,OpenAI 的 Sora 2 Pro 则位列第七。

Runway CEO Cristóbal Valenzuela 在接受采访时表示:「我们仅靠一百人的团队,就击败了万亿美元规模的公司。只要极度专注、勤奋,就能触及技术前沿。」

他强调,Gen-4.5 的内部代号为「David」,寓意「大卫战歌利亚」,象征小团队挑战巨头的精神。

Runway 成立于 2018 年,目前员工规模约 120 人,客户涵盖媒体机构、影视工作室、品牌方与创作者。根据 PitchBook 数据,公司估值已达 35.5 亿美元,投资方包括 General Atlantic、Baillie Gifford、英伟达与 Salesforce Ventures。

技术层面上,Gen-4.5 在动态生成、时间一致性与可控性方面实现突破,能够生成具备真实物理效果的复杂场景与角色表现。

其研发与推理均基于英伟达 Hopper 与 Blackwell 系列 GPU,Runway 与英伟达在训练效率与推理速度优化方面展开深度合作。

英伟达 CEO 黄仁勋评价称:「这是一个令人振奋的时刻,Runway 在视频生成领域的突破展示了 AI 的巨大潜力」。

新消费

取款新规明年落地:超 5 万元无需登记资金来源

近日,中国人民银行、金融监管总局与证监会联合发布《金融机构客户尽职调查和客户身份资料及交易记录保存管理办法》,自明年 1 月 1 日起施行。

新规取消了「个人存取现金超 5 万元需登记资金来源」的要求,取款环节不再采取「一刀切」式调查,而是基于风险状况实施差异化尽职调查。

新规的核心在于从形式合规转向风险为本的监管理念:

  • 对于低风险客户和常规交易,银行可采取简化措施,减少不必要的询问和登记;
  • 而在涉及高风险情形时,银行则需「强化尽职调查」,深入了解资金来源与用途,并留存必要的身份证明文件。

过去几年,个人存取款业务中银行过度询问用途的情况屡次引发公众争议。

此前,有律师在取现 4 万元时遭遇柜员反复追问用途并威胁报警,最终放弃取款。类似案例凸显了旧规执行中的僵化问题。新版《管理办法》则强调「该严则严、当放则放」,在保障金融安全的同时提升服务便利性。

中新网报道认为,差异化尽职调查表面上是对客户的「松绑」,实则是对银行风险管理的「加码」。

在洗钱、电信诈骗等犯罪活动仍高发的背景下,银行需借助大数据与人工智能等技术提升风险识别能力,实现精准监管。客户也应理解并配合调查,共同维护金融秩序与资金安全。

顺丰上线「超时赔付」,快递员免责

据界面新闻报道,顺丰控股宣布自本月起正式上线「超时赔付」服务。该服务首批覆盖深圳、青岛等 10 座城市,并计划逐步扩展至全国范围。

用户在顺丰官方渠道下单「顺丰特快」业务,如因顺丰运输原因导致派送超时,将获得现金赔付。这是国内快递行业首次以现金形式进行赔付。

顺丰方面强调,赔付责任不再简单归咎于个人,公司将依托大数据系统对快件流转全环节进行智能分析与责任拆解,通过技术与管理升级来保障服务质量。赔付成本完全由公司承担,快递员无需承担任何赔付责任。

在具体标准上,赔付金额以快递员揽收时的预计送达时间为基准,结合超时时长及客户会员等级,采取阶梯式赔付机制。

基础赔付金额按照超时时长退回 20%-30% 的运费比例,会员用户则可在此基础上再增加 5%-10% 的赔付额度。付款方账户可直接获得现金赔付,或选择兑换为价值更高的寄件优惠券。

需要注意的是,若因客户需求变更、拒收或自然灾害等不可抗力因素导致的超时,顺丰不承担赔付责任。

JPG coffee 推出圣诞限定饮品

近日,咖啡连锁品牌 JPG coffee 正式推出圣诞限定饮品「叮叮铛」。

该系列产品以复合莓果、抹茶与焙茶为核心风味,结合覆盆子与草莓的酸甜香气,搭配深烘咖啡液与炼乳,饮品顶部覆盖绵密抹茶奶油雪顶,并撒上椰子粉,营造出雪地里的圣诞树视觉效果。

本次新品以浅烘咖啡豆作为基底,产地包括越南、埃塞俄比亚与肯尼亚,采用橡木酒桶发酵、日晒与水洗等多种处理方式,将于 12 月 1 日起在 JPG coffee 与 JPG canteen 同步供应。

除饮品外,活动还推出圣诞礼物包装纸套装,包含圣诞包装纸与贴纸。

好看的

周星驰《鹿鼎记》4K 修复版定档 12 月 5 日

周星驰经典喜剧《鹿鼎记》4K 修复版正式官宣,将于 12 月 5 日上映。

影片原作改编自金庸的武侠小说《鹿鼎记》,于 1992 年在香港上映,凭借曲折离奇的剧情与喜剧风格迅速走红,当年票房成绩位列香港前五,并在海外市场获得广泛欢迎。影片的续集《鹿鼎记 2:神龙教》同样在当年取得不俗成绩,进一步巩固了该系列在华语影坛的地位。

达内兄弟新作《年轻母亲之家》定档 12 月 12 日

世界级电影大师达内兄弟执导的现实主义新作《年轻母亲之家》正式宣布定档,将于 12 月 12 日在全国上映。

该片此前荣获第 78 届戛纳国际电影节最佳编剧奖,并入围主竞赛单元,延续了导演一贯的人文关怀与艺术水准。影片同时确认将代表比利时角逐第 98 届奥斯卡最佳国际影片奖。

《年轻母亲之家》以比利时一家母婴收容所为背景,聚焦五位年轻母亲的生活与困境。

影片通过细腻叙事展现她们在迷茫与挑战中寻找希望的过程:杰西卡试图解开被生母抛弃的心结;佩拉维系与狱中男友的感情;朱莉为戒除药瘾而努力;奈玛通过工作走向独立;阿里亚纳则勇敢挣脱原生家庭,为孩子寻找更好的未来。

该片在法国已于 2025 年 5 月 23 日上映,并在上海国际电影节「戛纳零时差」单元展映,收获影迷高度评价,被赞为「大师级的作品,四两拨千斤」与「无法抵挡的温情飓风」。

《马腾你别走》定档 2026 年 1 月 16 日

电影《马腾你别走》宣布将于 2026 年 1 月 16 日全国公映。

影片讲述了林更新饰演的闲人马腾意外成为李幼斌饰演的钢厂退休工人老林的护工,两人组成「冤种忘年交」,共同开启一场荒诞却温暖的「玩命之旅」。

故事通过「死亡清单」与「花式死法」的设定,展现马腾与老林在荒诞委托下逐渐建立真挚情谊,传递出对生活的重新热爱与希望。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


终于发布的Gemini 3,什么是它真正的王牌?

Gemini 3 Pro 预览版上线那一刻,很多人心里的第一反应可能是:终于来了

遛了将近一个月,这里暗示那里路透:参数更强一点、推理更聪明一点、出图更花一点,大家已经看得心痒痒了。再加上 OpenAI、Gork 轮番出来狙击,更加是证实了 Gemini 3 将是超级大放送。

这次 Gemini 3 的主打卖点也很熟悉:更强的推理、更自然的对话、更原生的多模态理解。官方号称,在一堆学术基准上全面超越了 Gemini 2.5。

但如果只盯着这些数字,很容易忽略一个更关键的变化:

Gemini 3 不太像一次模型升级,更像一次围绕它的 Google 全家桶「系统更新」。

模型升级这一块的,Google 已经把话说得很满了

先快速把「硬指标」过一遍,免得大家心里没数:

-推理能力:官方强调 Gemini 3 Pro 在 Humanity’s Last Exam、GPQA Diamond、MathArena 等一堆高难度推理和数学基准上,全部刷出了新高分,定位就是「博士级推理模型」。
-多模态理解:不仅看图、看 PDF,甚至还能在长视频、多模态考试(MMMU-Pro、Video-MMMU)上拿到行业领先成绩,说看图说话、看视频讲重点的能力,提升了一档。
-Deep Think 模式: ARC-AGI 这类测试证明:打开 Deep Think 后,它在解决新类型问题上的表现会有可见提升。

从这些层面看,很容易把 Gemini 3 归类为:「比 2.5 更聪明的一代通用模型」。但如果只是这样,它也就只是排行榜上的新名字。连 Josh Woodward 出来接受采访都说,这些硬指标只能是作为参考。

换句话说,「跑了多少分」只是一种相对直观的表现手法,真正有意思的地方在于 Google 把它塞进了哪些地方,以及打算用它把什么东西连起来。在这一个版本的更新中,「原生多模态」显然是重中之重。在这一次的大更新中,「原生多模态」显然是重中之重。

如果要为当下的大模型找一个分水岭,那就是:它究竟只是「支持多模态」,还是从一开始就被设计成「原生多模态」。

这是 Google 在 2023 年,即 Gemini 1 时期就提出来的概念,也是一直以来他们的策略核心:在预训练数据里一开始就混合了文本、代码、图片、音频、视频等多种模态,而不是先训一个文本大模型,再外挂视觉、语音子模型。

后者的做法,是过去很多模型在面对多模态时的策略,本质还是「管线式」的:语音要先丢进 ASR,再把转好的文本丢给语言模型;看图要先走一个独立的视觉编码器,再把特征接到语言模型上。

Gemini 3 则试图把这条流水线折叠起来:同一套大型 Transformer,在预训练阶段就同时看到文本、图像、音频乃至视频切片,让它在同一个表征空间里学习这些信号的共性和差异。

少一条流水线,就少一层信息损耗。对模型来说,原生多模态不仅仅是「多学几种输入格式」,这背后的意义是,少走几道工序。少掉那几道工序,意味着更完整的语气、更密集的画面细节、更准确的时间顺序可以被保留下来。
更重要的是,这对应用层有了革命性的影响:当一个模型从一开始就假定「世界就是多模态的」,它做出来的产品,与单纯的问答机器人相比,更像是一种新的交互形式。

从 Search 到 Antigravity,新总线诞生

这次 Gemini 3 上线,Google 同步在搜索栏的 AI Mode 更新了,在这个模式下,你看到的不再是一排蓝色链接,而是一整块由 Gemini 3 生成的动态内容区——上面可以有摘要、结构化卡片、时间轴,虽然是有条件触发,但是模型发布的同时就直接让搜索跟上,属实少见。

更特别的是,AI 模式支持使用 Gemini 3 来实现新的生成式 UI 体验,例如沉浸式视觉布局、交互式工具和模拟——这些都是根据查询内容即时生成的。

这个思路将一系列 Google 系产品中发扬光大,官方的说法是更像「思考伙伴」,给出的回答更直接,更少套话,更有「自己看法」,更能「自己行动」。

配合多模态能力,你可以让它看一段打球视频,帮你挑出动作问题、生成训练计划;听一段讲座音频,顺手出一份带小测题的学习卡片;把几份手写笔记、PDF、网页混在一起,集中整理成一个图文并茂的摘要。

这部分更多是「超级个人助理」的叙事:Gemini 3 塞进 App 之后,试图覆盖学习、生活、轻办公的日常用例,风格是「你少操点心,我多干点活」。

而在 API 侧,Gemini 3 Pro 被官方明确挂在「最适合 agentic coding 和 vibe coding」这一档上:也就是既能写前端、搭交互,又能在复杂任务里调工具、按步骤实现开发任务。

这一次最令人惊艳的也是 Gemini 在「整装式」生成应用工具的能力上。

这也就来到了这次发布的新 IDE 产品:Antigravity。在官方的设想中,这是一个「以 AI 为主角」的开发环境。具体实现起来的方式包括:

-多个 AI agent 可以直接访问编辑器、终端、浏览器;

-它们会分工:有人写代码,有人查文档,有人跑测试;

-所有操作会被记录成 Artifacts:任务列表、执行计划、网页截图、浏览器录屏……方便人类事后检查「你到底干了啥」。

在一个油管博主连线 Gemini 产品负责人的测试中,任务是设计一个招聘网站,而命令简单到只是复制、复制、全部复制,什么都不修改,直接粘贴。

最终 Gemini 独立完成对混乱文本的分析,真的做了一个完整的网站出来,前前后后所有的素材配置、部署,都是它自己解决的。

从这个角度看,Gemini 3 不只是一个「更聪明的模型」,而是 Google 想用来粘住 Search、App、Workspace、开发者工具的那条新总线。

回到最直觉的感受上:Gemini 3 和上一代相比,最明显的差别其实是——它更愿意、也更擅长「帮你一起协作」。这也是 Google 对它赋予的期待。

压力给到各方

跳出 Google 自身,Gemini 3 的 Preview 版本实际上给整个大模型行业,打开了一局新游戏:多模态能力应用的爆发势在必行。

在此之前,多模态(能看能听)是加分项;在此之后,“原生多模态”将基本配置——还不能是瞎糊弄的那种。Gemini 3 这种端到端的视听理解能力,将迫使 OpenAI、Anthropic(Claude)以及开源社区加速淘汰旧范式。对于那些还在依赖「截图+OCR」来理解画面的模型厂商来说,技术倒计时已经开始。

「套壳」与中间层也会感到压力山大,Gemini 3 展现出的强大 Agent 规划能力,是对当前市场上大量 Agentic Workflow(智能体工作流) 创业公司的直接挤压。当基础模型本身就能完美处理「意图拆解-工具调用-结果反馈」的闭环时,「模型即应用」的现实就又靠近了一点。

另外,手机厂商可能也能感到一丝风向的变化,Gemini 3 的轻量化和响应速度反映的是 Google 正在为端侧模型蓄力,结合之前苹果和几家不同的模型大厂建立合作,可以猜测行业竞争将从单纯比拼云端参数的「算力战」,转向比拼手机、眼镜、汽车等终端落地能力的“体验战”。

谁最强已经没那么重要了,谁「始终在手边」才重要

在大模型竞争的上半场,大家还在问:「谁的模型更强?」,参数、分数、排行榜,争的是「天赋」。到了 Gemini 3 这一代,问题慢慢变成:「谁的能力真正长在产品上、长在用户身上?」

Google 这次给出的答案,是一条相对清晰的路径:从底层的 Gemini 3 模型,往上接工具调用和 agentic 架构,再往上接 Search、Gemini App、Workspace 和 Antigravity 这些具体产品界面。

你可以把它理解成 Google 用 Gemini 3 将以原生多模态为全新的王牌,并且给自己旗下生态中的所有产品,焊上一条新的「智能总线」,让同一套能力,在各个层面都得以发挥。

至于它最终能不能改变你每天用搜索、写东西、写代码的方式,答案不会写在发布会里,而是写在接下来几个月——看有多少人,会在不经意间,把它留在自己的日常工作流中。

如果真到了那一步,排行榜上谁第一,可能就没那么重要了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


W12 谢幕之后,宾利想用 460 亿种方式让你掏钱

过去很长一段时间,W12 发动机不仅是宾利动力总成的巅峰,更是克鲁工厂的精神图腾。但在 2025 年的当下,这个阶级秩序正在发生微妙的变化。

首先是宾利 Mulliner 部门限量定制的 Batur 敞篷版,作为内燃机时代的绝唱之一,它搭载那颗传奇的 6.0 升 W12 心脏,最大功率定格在 740 马力。而另一边刚刚更新的第四代欧陆 GT 和飞驰量产版,虽然只是走量车型,但在换装 V8 高性能混动系统后,综合功率却直接干到了 782 马力。

量产车的参数超越了限量旗舰,混动的效率击败了燃油的情怀——这就是超豪华品牌在电动化转型期必须面对的残酷现实。马力,正在变得前所未有的廉价。

当机械工程百年来建立的性能壁垒被电机轻易抹平,即便那些曾经用来标榜身价的 W12 或者 V12 依然精密、迷人,依旧代表着旧世界的荣光和复杂的机械美感,但那已不再是衡量强弱的唯一标尺。

如果不卖 12 缸独占的轰鸣,也不再垄断速度,几百万的宾利到底在卖什么?

宾利给出了一个数字:460 亿。

这是宾利对抗平庸的武器。按照他们的算法,你在订车的时候可以通过不同配置的排列组合,定制出 460 亿种不一样的车子。在这个新的逻辑里,宾利的个性化定制部门 Mulliner 不再是配角,而是成为了定义品牌价值的主角。

宾利似乎已经想清楚了,在那个充斥着高算力和同质化大屏的世界里,技术参数会被迅速迭代,唯有极度的「不可复制」,才是奢侈品最后的避难所。

当「慢」成为一种新的壁垒

在当下的汽车工业语境里,我们太习惯用「快」来定义技术含量了。无论是芯片算力的翻倍速度,还是超级工厂里按秒计算的下线节拍,效率似乎成了制造业唯一的信仰。但在宾利克鲁工厂里,似乎一切都是慢的。

看看那台名为「The Black Rose」的定制版 Batur,驾驶模式旋钮闪烁着黄金的光泽,但这并不是由金匠手工敲打出来的,而是「打印」出来的。宾利在这个贵金属上应用了增材制造技术,通过 3D 打印,将总计 210 克 18K 黄金,以一种传统铸造无法实现的方式,融入了驾驶模式旋钮和风琴音栓中。

▲定制版 Batur

同样的逻辑也延伸到了石头上。在与珠宝品牌 Boodles 的合作中,Mulliner 用激光将形成于 2 亿年前的天然石材切削至仅有 0.1 毫米厚。听起来没什么,但要把一块石头加工成纸张的厚度,并让它完美贴合在曲面上,同时还要保证它在车辆震动中不碎裂,并不是一件容易的事。

除了琢磨材质,Mulliner 还在思考「触感」。为了让车主能直接摸到木材原本的纹理,工匠们将漆料的用量减少了 90%;碳纤维也不再只有单调的黑色,深李紫、翠鸟蓝等色彩被编织进了碳纤维纹理中——这些都是 460 亿种配置组合的一部分。

▲ Mulliner 和 Boodles 联手定制的车型

而在渐变色漆面工艺上,为了让「托帕石蓝」和「温莎蓝」两种车漆在车身上实现肉眼无法分辨的自然过渡,Mulliner 拒绝了自动化机器人。两名资深技师必须同时操作,完全凭借经验和手眼配合,耗时 56 个小时才能完成。

这样的定制能力在面对中国市场时,宾利的姿态也发生了一些转变。它并不执着于单向输出英伦审美,而是开始尝试还原中式的意境。

我们在定制列表中看到了取材自《千里江山图》的「江山」特别版。Mulliner 并不是简单印上这幅名画就完事儿了,而是提取了画作中标志性的青绿与金色,通过复杂的刺绣在头枕上复刻山水形态。还有「流云」版中舒展的云纹,以及「鲤」特别版中六条形态各异的游动锦鲤,连那些听起来很虚幻的意象,比如「午夜月影」和「轻声耳语」,都被具象化为特定的皮革配色和饰面纹理。

▲ 飞驰「江山」特别版

还有一个案例,一台「糖果粉」色的添越长轴距版。这辆车的用户在订车时只有一个要求:要一个「特别的粉色」。为了满足他,Mulliner 专门调配了名为「Candy Pink」的车漆,车内的缝线、刺绣也都做到了同色系匹配。

Mulliner 定制的最高自由度,体现在那台 Speed Six 延续版上——一位客户带着儿时的玩具车模型来到 Mulliner,要求完全按照那个模型的配色和细节,打造一台真正的 Speed Six。

▲ Speed Six 延续版

一家车企能把一个人的记忆、童年幻想,甚至是一个玩具模型,通过严谨的工业流程变成一台可以合法上路的机械艺术品。这种固化时间与情感的能力,才是宾利在面对电动化浪潮时难以被取代的价值。

在纯电时代,保留一块「机械表」

在把材质和工艺卷到极致的另一面,我们看到的是宾利在电动化转型上的犹疑与妥协。

就在 11 月,宾利更新了原本激进的战略,将「Beyond100」升级为「Beyond100+」。其中最耐人寻味的调整在于,原本计划快速退场的插电混动车型,生命周期被直接延长到了 2035 年。在目前的电池密度下,纯电很难在不牺牲重量和空间的前提下,提供超豪华用户所需要的从容。与其被续航焦虑拉下神坛,不如把内燃机这张安全牌再打十年。

▲宾利的新 Logo

这种务实,或者说紧迫感,也体现在产品形态的变化上。宾利确认第一款纯电车型将是一台车长小于 5 米的「城市 SUV」。对于习惯了制造 5.3 米以上庞然大物的克鲁工厂来说,这是一个从未涉足的尺寸。这说明宾利即使作为金字塔尖的品牌,也不得不低下头,去争夺那些更年轻、更看重实用性的市场份额。

而在那台 EXP 15 概念车里,所谓的「奇妙融合(Magical Fusion)」理念,剥离掉营销话术后,其实是在解决一个棘手的问题:科技的保鲜期太短,而奢侈品的生命周期太长。

▲EXP 15 概念车

现在的智能汽车恨不得把屏幕铺满整个座舱,但这种做法对宾利来说是危险的。一块最先进的 OLED 屏幕,三年后就会显得过时,这会极大拖累整车的价值感。所以宾利选择把屏幕藏在木纹和织物后面,甚至保留那个名叫「机械奇迹」的物理仪表。

宾利或许意识到了,它们必须把那些注定会快速贬值的电子元件隐藏起来,让位于那些越老越有味道的木头、皮革和机械指针。只有这样,一台几百万的车才不会因为车机芯片的落后而显得廉价。

W12 终将消失,因为那是旧时代的遗物;但 460 亿种 Mulliner 的组合必须存在,56 小时手工喷涂的低效率必须存在。在那个充满不确定性的未来,这些无法被代码复制的人工成本,是宾利维持高溢价唯一的理由。

带轮子的都关注,欢迎交流。 邮箱:tanjiewen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


曾经的最强苹果电脑 Mac Pro,已经被时代抛弃

没想到再次听到苹果 Mac Pro 的新消息,会是一个噩耗:

根据彭博社 Mark Gurman 爆料,苹果内部已经取消了新款 Mac Pro 台式机的开发,其搭载的 M4 Ultra 处理器也一起被砍,下一代高端桌面芯片是 M5 Ultra。

苹果内部基本放弃了 Mac Pro 项目,并认为 Mac Studio 才是未来。

Mac Pro 的坎坷一生

如果从 1994 年发布的 Power Macintosh 算起,那 Mac Pro 发布至今已过了 31 个年头,经历了苹果芯片的两次重大转型。

只是对于苹果来说,打造一台普通的性能猛兽永远不是产品的最终目标,做出一台既优雅又强大的电脑去定义未来,才是乔布斯和艾维的野心——甚至有的时候,「优雅」会优先于「强大」。

只是在半导体工业还不算发达的当时,设计和性能难以兼得,两者的矛盾如一个幽灵般盘旋在 Power Mac 和 Mac Pro 三十多年的历史中,注定了这个产品线命运多舛。

初代 Power Macintosh 采用了非常经典的塔式机箱形态,在当时作为首款搭载 PowerPC 处理器的苹果电脑问世,颇有秀肌肉的味道,位于苹果经典四象限的「专业级」和「台式机」区域。

从这时起,Power Macintosh 系列(后改名 Power Mac)成为了苹果电脑性能天花板代名词,主要面向高端的商务和创意用户。

Power Macintosh 定下的另一个「规矩」,就是极高的拓展性——它配备了 6 个 PCI 插槽和 7 个内置硬盘位,还需要用户自己添加独立显卡,完全就是为专业极客准备的产品。

在乔布斯回归苹果、乔纳森·艾维执掌设计大权后,两人通力合作打造出了多彩、塑料的 Power Mac G3,很好平衡了产品设计和性能功能。

两人不满足于此,Power Mac G4 Cube 在对未来计算机的进一步畅想中诞生。

通体玻璃和金属的外壳,看不到按钮和 CD 插槽,禅意甚至贯彻到机箱内部——连散热的风扇都没有。乔布斯对 Power Mac G4 Cube 非常满意:

我们通过简化去除多余的东西,取得进步。

Power Mac G4 Cube 得以位列现代艺术博物馆展厅,却也钉在了苹果产品的「耻辱柱」上:这个超小型机箱和无风扇的设计,导致散热能力低下,限制了性能发挥,最终这个设计也只使用了一代。

同样的故事,在 Mac Pro 产品线中还会再次上演。

2006 年,Mac Pro 接棒 Power Mac,同样在苹果转投英特尔的节点问世,搭载英特尔的至强系列处理器。

Mac Pro 延续了 Power Mac G5 的工业铝合金外壳,尽管工艺优秀,充满「Pro」气质,只是这个庞然大物的形态和体积,显然还不是苹果心目中的最佳形态。

于是在 2013 年,苹果给了艾维一个机会,去设计一款不同于以往的 Mac Pro。最终的成品确实称得上非同凡响,成为苹果产品设计史上极为浓墨重彩的一笔——

这个设计至今仍被人们津津乐道,但代价也很明显:这个仅有上代体积 1/8,只配备单个风扇的「垃圾桶」,很容易就会因为散热问题遇到性能瓶颈,对于一台面向专业用户的电脑来说是大忌。

▲ 两代 Mac Pro 体积对比

并且,苹果官方也只允许用户自行更换 Mac Pro 的内存和存储空间,并警告强行更换显卡会有很高的故障风险。

这并不是专业用户们所期待的 Mac Pro。在发布两三年后,到处都充满了对这个「垃圾桶」的吐槽,以及苹果是否已经抛弃专业用户的质疑声。

为了挽救口碑,苹果官方很罕见在 2017 年的一次媒体活动中出面承认了「垃圾桶」Mac Pro 的失败,并在之后推出了 iMac Pro 平息专业用户愤怒,承诺下一台 Mac Pro 将「更模块化」。

新款 Mac Pro 终于在「垃圾桶」发布后的 2182 天后发布——这期间,iPhone 大改了两次设计。

令人啼笑皆非的是,苹果对于「垃圾桶」的反思结果,就是重新捡起了 2006 年的初代塔式 Mac Pro 的图纸,铝合金机箱则换用了著名的「刨丝器」设计。

▲ 图源:YouTube@Ryan Gehret

至少,苹果终于端上来了一台高性能且可拓展的主机,人们欣然接受这台新 Mac Pro,这款产品最终也收获了不错的口碑。

只是当时也无人能预料到,这个 Mac Pro 的全新起点,同时也是这个产品线的终点。

一年后,Apple Silicon 横空出世,成为了 Mac 历史上最重要的一个转折点。

但这次,Mac Pro 没有像之前一样成为转型的排头兵,相反,在这个令人激动的新时代,它成为了无处安放的怪异存在。

Mac Pro 甚至是整个产品线中最后得到 Apple Silicon 翻新的型号,2023 年,搭载 M2 Ultra 的 Mac Pro 姗姗来迟。

虽然沿用了上一代颇受好评的新机箱,但高集成度的 Apple Silicon 生态,使得它的可扩展性极其有限,只能安装一些特殊的扩展卡,无法升级内存或者插入显卡。

与此同时,高能效的 Apple Silicon 终于让苹果得以「复活」Power Mac G4 Cube。

Mac Studio 小巧精致,外观没有一丝赘余,内部集成度高而无法扩展,苹果终于在 20 年后实现了乔布斯的夙愿,造出了一台真正面向未来的电脑。

▲ Power Mac G4 Cube 和 Mac Studio,图源:Macworld

对于用户来说,Mac Pro 更大、更重、更贵,却没带来更强的性能,只多出来一点点拓展性,新时代已经没有它的位置了。

或许也可以这么说,Mac Pro 不是被砍了,而是脱胎换骨,成为了 Mac Studio。

新时代再无 Mac Pro 的地位

和外观浑然一体的 iMac、Mac mini 以及多款 MacBook 比起来,采用塔式机箱、内部模块化设计的 Mac Pro,其实更像是一台 Windows 主机,不过运行着官方支持的 macOS。

纵观 Power Mac 和 Mac Pro 的历史,或者说整个电脑历史,高性能的主机以往似乎只有一种解题思路——巨大的塔式机箱,内部布满等着用户自己魔改的插槽。

在性能和能耗震惊世界的 Apple Silicon 诞生之后,苹果终于可以不再遵循 PC 高性能主机的这套规则,利用自己的芯片生态去代替以往需要不断增加更换电脑模块的方案。

在 M4 Mac mini 发布后,立马就有不少有趣的探索,例如联合运行多台 Mac mini 来形成盘阵列或者 AI 训练集群,以往这需要叠加更多显卡才能实现,并且功耗还更高。

▲ 图源:X@ Alex Cheema

对比可以自行更换元器件的模块化,这种高集成的设计使得产品出厂后再无升级可能,但高集成实现的高性能小型化,也产生了全新的价值。

以往的巨大机箱主机在,基本不具备流动性,我们以形式固定的「工作室」模式进行创作和生产,如果需要机动办公,则需要使用移动硬盘 + 性能本,无疑拉低了效率。

得益于高性能便携主机的出现,工作环境可以更灵活进行部署。像是影视行业的 DIT 工种,现在他们能够直接带走整个 Mac Studio 进行工作——换作以前的 16 千克 Mac Pro,这是不可能实现的。

▲ 把 Mac Studi 带着走的方案非常常见,图源:ProVideo Coalition

并不是只有苹果在深耕这个方向。英伟达的 DGX Spark 体积和老款 Mac mini 相当,却是一台具有 1 Petaflop 的 AI 超级计算机,曾经需要大型机柜和大量显卡的算力,现在可以直接摆在桌上。

芯片工艺和设计已经达到了一个顶峰,性能高能耗低成为常态,现在正是实现那些梦幻设计的时机,而小型化一直以来都是计算机和电子产品的迭代方向。

很多人对「小机箱」的趋势不解,质疑「能做大为什么不做大」,能够实现更好的散热——实际上,同一颗芯片的 Mac Pro 和 Mac Studio 性能几乎没有差距,现在的问题变成了「能做小为什么要做大」。

▲ 两者跑分非常接近,价格却相差 3000 美元,图源:MKBHD

更深层的变迁发生在社会之中。在 AI 改写生产力的时代下,每个人正在向「超级个体」靠拢,以前的工作方式是「计算机上长了个人」,那现在是人在哪里,性能就必须跟到哪里。

诚然,对于一些有专门需要的专业人士,像 Mac Pro 这样具有更高拓展性的大机箱还有价值,但 Mac Studio 的能力正在不断突破我们的想象,越来越多拓展也可以通过雷电接口解决。

带有一丝戏谑地说,Mac Pro 身上最有价值的部分,或许只剩下这个工艺水准极高的「刨丝器」机箱了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


还在用 Gemini 3 写 ppt?太土了,来看看最酷炫手势互动(附提示词)

Gemini 3 发布之后这些日子里,我逐渐感到疑惑:为什么总让 AI 写网站写 PPT,Gemini 都发到第三代了,不能干点更有意思的事吗?

要那种科幻感强的、效果酷炫的、难度系数高的,但小白也能做的。比如这种:

或者这种:

Gemini:手势交互?没问题,包的。

在开始之前,先准备好 Gemini 3,这里是一点点的注意事项👇🏻

目前有三种方式开启玩耍:Gemini 客户端 Canvas 模式、Google AI studio-Playground 和 Google AI studio-Build。

其中,最不推荐的是客户端,亲测无法有效拉起摄像头,并且,下面都是手势互动项目,举着手机,手自然也是没法做操控的。

后两者中,Build 是直接形成一个 app,你可以分享给其它朋友,缺点是 tokens 有限。而 Playground 会生成一套代码,需要下载到本地再打开,一旦换个电脑就可能运行不了,但优点是几乎没有 tokens 限制,每天一百万,量大管饱。

考虑到交互项目比较消耗 tokens,所以 Playground 更为合适,个别小项目用 Build 也可以,这就看个人情况而定。

Jarvis

Jarvis HUD 面板是在推上超过二十万次浏览的热门爆款,手势操控仪表球,就像钢铁侠操控 Jarvis 那样,酷毙了。

参考 prompt 如下:

create a webapp using vanilla js, html, css, modern threejs, mediapipe. it should be a sci-fi tony stark / iron man / jarvis experience focused on simulating an AR heads up display experience. full screen webcam input shown. add a heads up display that tracks the user’s head (offset to the right), with live updating metrics. a minimal 3D world globe should be shown on the left center of the screen, that should be able to be rotated / sized by the user hand gestures

在 Build 模式下,亲测完全可以实现一次成型,Gemini 会自动安排任务、编写代码,调用不同的接口,进度条显示完成后,点击 Preview 就能直接打开——记得放行摄像头权限。

 

Gemini 3 自己就把效果设计安排得明明白白:左手是放大缩小,右边是转动,双手进入摄像头范围后会显示触控点——这些都是 prompt 里没有的,都是它自己的「想」出来的。搭配大屏幕或者投影,真的很有 Jarvis 既视感。

左边的地球建模和右边的面板的内容都是可以改变的,最初 Gemini 3 让右边的面板显示人体体温(显然是凭空编的),后来被我改成了「实时显示左侧地球模型的直径」。反正 vibe coding 一下,想怎么改怎么改。

雨滴控制

Jarvis 都有了,惊天魔盗团不也得安排上。

看电影时只有特效,但现在,有 Gemini 3 了。参考 prompt 如下:

用 HTML+JS+ML 模型做个网页应用,通过摄像头检测手势,实现用手势来控制雨滴动画的暂停、静止和升格效果。动画效果保持在雨滴垂直方向,风格参考电影《惊天魔盗团》

这个 prompt 的第一轮表述完全是按照我看电影之后的想法写的,每个细节都可以通过 vibe coding 再调节。根据第一轮 prompt,Gemini 会加入它自己的设计,比如这具体的手势就是它想出来的。

虽然是用 AI 做的,但是在识别手势动作时非常灵敏,包括不同手势之间的切换都能够快速响应。

3D 粒子

控制雨滴曾经是非常复杂的特效技术,就在《惊天魔盗团 2》上映之后,有一个饮料公司做了一支广告,通过控制雨滴,实现静态的粒子效果。

那么参考「控雨术」,Gemini 完全可以实现上面这种结合实拍和速度控制才能出现的效果,最接近的就是 3D 粒子。所以我又做了一个 3D 粒子效果的交互案例。

非常酷炫!prompt 参考如下:

用 Three.js 创建一个实时交互的 3D 粒子系统。通过摄像头检测双手张合控制粒子群的缩放与扩散,提供 UI 面板可选择爱心/花朵/土星/佛像/烟花等模型,支持颜色选择器调整粒子颜色,粒子需实时响应手势变化。界面简洁现代,包含全屏控制按钮

一次成型,最后出来的交互非常丝滑,尤其是对于手势的识别很准确又灵敏。

【小技巧】

涉及到颜色、布局、UI 设计等等细节,如果每次都用 vibe coding 的方式来调节,表述起来会很麻烦。并且每一次 vibe code 都存在抽卡的情况,所以有一个非常实用的技巧是:加上自定义模块,尤其是颜色、大小等,这样可以完全自主搭配自己喜欢的配色方案。

技能五子棋

由雨滴想到粒子,由粒子想到移动,由移动想到——五子棋!我终于可以做技能五子棋了!!

仔细想想,五子棋不也是一个手势控制、飞来飞去的交互方式吗!飞沙走石移动棋子,力拔山兮移动棋盘,全都安排上!

Prompt 参考如下:

做一个手势互动小游戏「技能五子棋」:主页面为五子棋棋盘,默认已经摆放好棋子。当用户做出「单手甩手」的动作时,棋子会跟随甩动的方向飞出棋盘。当用户做出「双手甩动」的动作时,棋盘会跟随甩动方向飞动

Gemini 自己完成了物理逻辑和手势之间的衔接,我的 prompt 只需要描述效果,而具体的速度向量计算、检测阈值,都不用我管。

它甚至还重新命名了「技能」:万象天引。

这叫飞沙走石啊 Gemini 老师!

节奏音乐游戏

综合上面的几个尝试,Gemini 的毋庸置疑,而且回想一下这些技能树:手势识别、色彩变化,这些组合起来,不就是小游戏吗?

于是我尝试了更复杂一点的项目:节奏游戏。

音游玩过很多了,但是零经验小白真要做一个游戏、怎么给 Gemini 形容我想达到的效果,还真是花了一点脑筋 ,后来第一版 prompt 如下:

做一个用手势操控的音乐游戏,主界面为四条音轨,用户上传音乐文件后,四条音轨上按节拍出现光点,用户需要用手势准确拍击出现的光点,背景为复古合成波(Synthwave)风格,背景、音轨和光点的颜色可以自定义调节

这基本上是我能想到的雏形,根据第一版 prompt,Gemini 选择了 Pygame 作为游戏引擎,继续使用 MediaPipe 做手势追踪,并且加入了 Librosa 用来分析音乐。

选择复古合成波风格是因为它有明确的视觉标志——Gemini 也识别出来了——落日、霓虹渐变色、网格和驶向地平线的道路,非常适合节奏音游。

果然做游戏比前面的一些小交互复杂多了……先是只能识别一只手,得调整;然后是无法上传音乐,得调整;到了第三版才稍稍有点样子

但是在体验过中我发现一个比较 bug 的地方:判定线的位置离屏幕边缘太近了,而摄像头的识别范围是有限的,我的手稍微放低一点就无法被识别。

一开始我尝试的方法是,把判定线移动到屏幕居中位置,保证我的手始终能在摄像头捕捉范围内。

但是又出来一个问题:光点出口和判定线之间的距离过短,留给我的反应时间也很短,更别提点击动作还有一点点点的延迟,整个可玩性大大下降。可是放太低就还是会出现手掉出识别范围的情况。

一时之间我还真想不到这个矛盾该怎么办,于是,我直接去问了 Gemini 能怎么解决。

它直接指出了这个问题的症结所在,并且提出了「视觉欺骗」的方式来优化体验,并且加了一个自定义滑块来调节偏移,这样一来无论手在什么位置,都可以通过调节滑块来对齐判定线。

天才。

后来我还指出,感觉光点的出现跟节奏不太一致,为了解决这个问题,Gemini 又加了一个滑块用来调节延迟。虽然我仍然认为它并没有很好地分析节奏型,但是这个滑块的设计还是很有效,尤其是解决了戴着蓝牙耳机导致的延迟。

【一些小技巧】

本质上,只要有 prompt 就有抽卡的情况存在,但抽卡未必就不好。当碰到非常硬伤的 bug,比如始终无法调用摄像头、无法上传文件等等,vibe coding 时反复修改也没效果,不如就直接「新建项目」。核心功能反映在代码上,彼此之间有所牵连,重新跑一遍,让 AI 整体性地补足,远比一点点 vibe coding 要更有效率。当然,能看懂代码就会更有效率,可以针对性地解决。 只不过,对于完全的零码选手来说,还不如直接重新抽卡。

在 AI 之前,做手势交互的应用,得先学点儿 Touch Designer,最好还懂点儿部署。这些都得一点点翻教程,反复研究,在这个过程中搞不好就被劝退了。

有了 AI 之后有多简单,自然不用多说。更关键的是,手势交互原本的门槛远比生图、做 PPT 要更复杂,却又能让小白零码选手快速领略到做应用的乐趣。

唯一留下的,是对审美的挑战。在这些案例里能看到,Gemini 有点审美,但不多,设计、配色等等都是差强人意。代码的「硬」技能它可以掌握,留给我们的,就是对于审美的挑战。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌