普通视图

发现新文章,点击刷新页面。
今天 — 2025年10月14日首页

一个演员的 AI 时代反内卷指南:先允许自己跑到哪儿算哪儿

作者 方嘉文
2025年10月14日 17:48

AI 已经成为了这届年轻人「人手必备」的伙伴。有疑问首先打开的不再是搜索引擎,而是 AI;想将脑海中的天马行空用视觉呈现出来,苦学绘画和摄影不再是唯一出路,AI 生成影像带你快速迭代探索;心中有苦闷烦恼想倾诉,想到的是时时在线,永远情绪价值拉满的 AI。

这种「随手可 AI」的便利是之前的互联网冲浪人无法想象的,更别说中国的古代圣贤了。

有趣的是,无论我们手上的技术工具如何颠覆,我们所追求的幸福却和过去一代又一代的中国人有着同样的核心。

在分析了儒释道著作、明清文化著作和媒体以及网络海量内容后,清华大学心理与认知科学系积极心理学研究中心和 lululemon 联合发布的《2025 年中国人幸福感报告》找到了中国式幸福观念恒常不变的核心——「关系联结」和「成长成就」。

我们已经不自觉地在使用 AI 帮助我们追求着这两个目标 —— 从关系中满足情感需求,以及在工作学习生活中提升自我,获得成长。

但在「内卷」的压力下,AI 的便利也让这个世代在追求幸福时撞上了属于我们的全新障碍 —— 我们和 AI 携手提升工作学习效率,却不时感觉到 AI 的「代劳」也夺走了人的成长机会;我们喜欢向 AI 寻求情感上的慰藉,却恍然发现自己和身边的朋友渐行渐远。

最近,我们在 lululemon「一起好状态」主题活动上抓住了可能是当下新生代演员中最热衷探索 AI 技术的吴汉坤。他是《封神三部曲》中「质子团」里的「辛甲」,也是 AI 创业者和 AIGC 创作者。我们和他一起探讨了我们如何能在与 AI 合作的同时,应对这项技术对我们追求幸福感所带来的新挑战。

 

AI 技术每天都突飞猛进,但我的成长呢?

DeepSeek 刚出来的时候,周围有一个声音出现得越来越频繁:人类很多工作都要被 AI 取代了。

吴汉坤对这一说法的真实性有一定保留,决定要去亲自看看。

我当时作为演员,就想到了演员其实有很多文本工作,比如人物小传,分析剧本等等。于是我想做一个尝试,看看 AI 能不能写出一个 OK 的人物小传。

吴汉坤开始见缝插针地在《封神 2》路演途中抽出电脑,速搭建了一个能够生成人物小传的工具,接口 DeepSeek API,名为「剧本 GO」。

▲ 吴汉坤在《封神第二部》路演期间搭建了「剧本狗」

结果,「剧本 GO」出来的人物小传大概只能算五六十分,达不到真正演员准备角色时需要的复杂程度。更重要的是,这个过程中,吴汉坤也更深刻地感受到「把人物小传写完」并不是真正目的,思考、撰写和内化才是这项工作意义所在:

写人物小传的目的是在内心构建一个自己能相信的世界。
每次开拍前,我都会进入那个世界,重温角色和人物之间的关系和状态。

从听到自己心中怀疑的声音,再让这个声音化作好奇,吴汉坤踏上了一场小小的探险,收获了对熟悉事物的更深认知。

很多年轻人享受着 AI 带来的便利,让部分功课和工作提起速来,更高效地应付「内卷」。但他们也忧虑过度使用 AI 会削弱自己的思考能力和创造力。在吴汉坤看来,当你回到内心,去问自己你学习和工作的真正目标是什么,思路一转,很多问题就能找到新出路。

上学时,吴汉坤也很喜欢写作课,因为「它会教你如何把一件事有条有理地说出来,用最精简的语言表达自己的观点」。

即便语言表达也是大语言模型特别擅长的,但当这个能力是你想拥有或享受的,AI 的身份也可以从「帮你做」变成「帮你学」。

《2025 年中国人幸福感报告》提供了 7 个幸福感提升之道,其中两个是:「从 ‘了解⾃我’和‘接纳⾃我’开始 」和「保持孩童般的好奇心,激发对生活的感知力」。

当我们开始关注和接纳自己的感受,我们也能更好地去察觉什么事物是我们珍视和需要的。听到自己的声音后,接受它,滋养它,让它长成心中的好奇,带你探险,感知真实的生活。

再小的第一步,都是大进步

在大部分年轻人都爱自称「社恐」的今天,人们实际上并没有停止对「关系联结」的追求,只是他们找到了一个更便捷的「消费」方式 —— AI。

《2025 年大学生 AI 使用行为与心态洞察报告》指出,超过1/4的受访者在情绪低落时会主动向 AI 寻求安慰和情绪价值,近八成的受访者将 AI 视作「可闲聊的朋友」。

但这种时时有响应,句句皆附和的「单向关系」,也让部分年轻人陷入对 AI 的情感依赖 —— 他们开始在和真人沟通时会感到比过往更紧张,担心自己不会被他人所喜欢。

人类学学者项飙曾在一次采访中指出,AI 陪伴就像是「高阶的回音壁」,用户会对世界的复杂和多样性认知越来越模糊,对外部世界感到越来越害怕。

要打破这种恐惧,鼓起勇气迈出第一步是最重要的。

对于吴汉坤来说,迈出和陌生人交流的第一步不那么困难。这不是因为他未曾遇上拒绝,而是被拒绝太多了。

我试过一天之内打了 500 多个电话去和用户聊,几乎  99% 的人都会拒绝你,大概只有百分之一的人会给你提供实质性帮助。

在做咨询顾问和创业的时候,吴汉坤都经常需要对外联系,拒绝和迎面泼来的冷水都是日常。

亲身感受过这种孤独后,他和 CTO 搭档创立了 Frederick AI。它以 AI 智能体帮助创业者快速验证创业想法、生成商业计划并推动项目落地。与此同时,Frederick AI 也有搭建创业者社区,把大家联结起来,相互帮助。

但吴汉坤也有让自己紧张的「第一步」:

因为我之前没拍过戏,一开始拍戏的时候,我会觉得很可怕,因为组里可能有几十上百个人一起看着你演戏,周围又都是设备,那还挺可怕的。

对于这种陌生和未知,吴汉坤有自己的一套鼓励大法:

我告诉自己,我出现在这儿是有原因的,是因为有人相信我能做到这个工作,我才能出现在这。所以,不用不自信,知道自己要干嘛,为什么要做,大胆做就好。

AI 虽让一些「第一步」变得更有阻力,但它也让一些原本看似「不可能」的「第一步」成为可能。

今年,吴汉坤开始用 AI 技术尝试自己导短片。他为自己曾演绎的角色构想了三个平行时空,让曾经可能只能存在于他脑海里的世界变成所有人都能看到的故事。

▲ 截自吴汉坤导演的 AI 短片《Pink Paradox》

放在过去,吴汉坤没可能独自完成这个尝试,无论是特效还是前期工作,每一样都需要大量时间和专业技术。

在制作过程中,本是「J 人」的吴汉坤也发现自己变得越来越「P」了。AI 经常会在过程中给他带来新灵感启发,AI 影片的工作流也让更改变得更快捷,「第一步」走得更轻巧。

虽然在工作上,吴汉坤总手痒想解锁体验 AI 新技术,但在平常生活中,他还是更倾向于自己冒险:

过于依赖  AI,就等于把生活的主导权交给了 AI。
这就好比你没有主导权地过一个很完美的生活,还是你有自由意志地去过一个不完美的生活。我觉得还是第二种比较好一点,起码你是自由的。

即使和更年轻的自己相比,他现在也变得更自由了。

《2025 年中国人幸福感报告》中吴汉坤最有共鸣的幸福感提升之道还是运动。

每天早上,他都会去晨跑。从前的他会更追求硬核运动表现,一动起来就想追求极致。现在的他,依旧会去晨跑,但心态已经变成了「跑到哪儿算哪儿」:

哪怕就跑一两步,走出去晒晒太阳就很舒服。

他的分享也让我想起艺术家 Geoff McFetridge 为今年「一起好状态」创作的其中一幅画《奔跑》。

这幅画描绘了一位侧身奔跑中的女孩。据艺术家介绍,他想描绘的不是每一步都精准计算的马拉松选手,也不是充满爆发力的短跑运动员:

她是跑者,她享受身体动起来的纯粹快乐。

这种从身体出发,最贴近自我和直接的快乐,也是击破 AI 时代虚无感的一剂良药。无论 AI 再如何发展,你的真实存在才是意义本身,你的每一个真挚感受都是「AI 所不能」。

如果你也想动起来,在这个十月,lululemon 的「好状态趣动场」将相继登陆沈阳、深圳、成都、武汉、广州五座城市,将城市地标变成运动的游乐场,lululemon 全国门店也将发起「一起好状态」系列课程。

不妨带着你的好奇,感受一段新冒险。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


昨天 — 2025年10月13日首页

年内连获三轮融资!未来智能A轮再获亿元级资金助力

10月13日,中国领先的AI硬件公司未来智能正式宣布完成亿元级A轮融资,由蚂蚁集团领投,启明创投超额跟投。这也是未来智能自今年1月、4月连续完成Pre A轮、Pre A+轮融资后,年内第三次获得市场投资,累计融资规模进一步扩大。据悉,本轮融资将主要用于三大方向:一是持续丰富AI办公硬件产品矩阵;二是加速海外自主品牌viaim的建设和市场推广;三是加大对AI Agent等前沿技术的探索与投入。

投资市场向来理智且注重效率,对公司价值的评估,本质上也是基于确定性与成长性的权衡,即“现有价值”所代表的坚实底线,与“未来价值”所代表的想象空间。而连续三轮融资的顺利完成,不仅是一级市场基于未来智能现有实力投下的“信任票”,更代表了其对未来智能长期增长潜力的持续看好。

实用主义+垂直场景:跑通商业化“最后一公里”

近一年,科技大厂密集布局AI耳机,其战略意图当然远不止于硬件矩阵的补充,大厂争夺的是语音优先时代用户与AI服务交互的“第一触点”。然而在这场看似刚刚开启的角逐中,未来智能却凭借其三年前的超前布局,已率先在细分领域建立起显著的先发优势。

早在2021年,未来智能便敏锐洞察到AI与耳机结合的巨大潜力,聚焦于办公商务这一高频刚需的垂直细分领域,开启了AI耳机的场景化深耕。从早期解决“记录”痛点的录音转写,逐步扩展到涵盖实时翻译、摘要总结、待办提取的“信息处理”层,再演进至当下新一代产品的AI嘴替、自动化标题概览、个性化摘要、脑图构建、语音唤醒与深度问询等“主动创作与交互”层,其产品功能实现了阶梯式跨越,同时也清晰地勾勒出一条从辅助工具迈向个人智能办公助理的技术演进路径。

“创业之初,我们便明确要聚焦办公场景,做‘越垂直越有用’的AI助理。”未来智能CEO马啸回顾创业历程时表示,“耳机作为天然的‘听觉’入口,与办公场景高度契合,也因此成为我们的‘首选’。但我们的目标并不是简单地在硬件上叠加AI功能,而是从AI场景需求出发,深度重构硬件本身,确保能为用户提供真正实用、好用的价值。我们坚信,即便有了大模型这项强大的基础设施,最终的价值创造仍需落地到一个个垂直领域的应用中。”这种对垂直场景的深度聚焦、以技术实用主义解决真实痛点的产品思维,也构成了未来智能核心竞争力的基石。

表现在市场端,未来智能的实用主义产品思维与技术实力也直接转化为确定的盈利能力与可衡量的市场占有率——2024年,成立仅两年的未来智能便已实现盈利,更在电商大促中展现出强大的市场号召力。以今年618为例,5月新发布的讯飞AI耳机Air2环比前代销量激增580%,讯飞AI耳机Pro3则成功登顶抖音、天猫“入耳式蓝牙耳机”品类销量榜首,并斩获京东“AI蓝牙耳机”销量冠军,稳居AI耳机赛道头部位置。

 

当AI的技术光环渐趋务实,整个赛道正共同面对一个核心挑战:如何将技术潜力转化为可持续的商业模式。在这一阶段,技术的领先不再是唯一的胜利法则,如何在商业实践中精准定位、高效执行、成功跑通,才是决定企业命运的关键所在。而未来智能凭借“AI+耳机”聚焦“办公场景”的清晰路径,率先跑通了从产品技术到商业价值的闭环,其市场表现已然验证了这一模式在攻克AIGC商业化“最后一公里”难题上的有效性。

海外市场+“一脑多端”:激活“第二增长曲线”

如果说扎实稳健的产品、技术与商业价值,共同构筑了未来智能确定的估值底线;那么,对海外市场的开拓与“一脑多终端”生态矩阵的构建,则为公司价值的持续跃迁提供了广阔的想象空间,而这恰也是未来智能本轮融资的核心使用方向。

事实上,自2024年起,未来智能便以中国香港、新加坡为试点,开启了出海探索之路。今年1月,其借CES(美国拉斯维加斯消费电子展)之机推出全新品牌“viaim”,首阶段重点开拓北美与亚太市场,标志着全球化战略进入实质性阶段。随后其步伐持续加速:7月产品登陆中东,凭借创新设计与卓越体验迅速获得市场认可;9月又以IFA(德国柏林国际消费电子展)为支点,宣布下半年择机进军欧洲,进一步完善全球销售体系,展现出清晰的战略节奏与坚定的出海决心。

 

积极的布局带来了显著的增长成效——今年1月至7月,viaim品牌AI耳机在北美市场的绝对销量增长了7.2倍,亚太区整体销量相较于去年下半年的试点表现,增长了1.28倍,并在7月实现了月环比高达673.1%的爆发式增长。中东市场虽7月中旬才进入,首月销量亦表现亮眼。未来智能CEO马啸曾说,“海外市场一旦打开,有机会迎来几倍于国内市场的新增长。”这些销售数据,也充分证明了viaim产品在全球市场的适应性与竞争力。

除了市场扩张,未来智能更大的野心在于对AI前沿技术的持续探索。马啸透露:“我们的长期愿景,是构建‘Agentic AI办公助理’。”

其实早在今年5月,未来智能就随新品耳机一起,正式发布了其核心的AI能力平台——viaim大脑,这是一款面向个人的商务办公AI智能体(AI Agent),致力于让AI从被动响应的工具,升级为能主动思考、辅助决策的办公伙伴或智能助理。

 

而以viaim大脑为核心,未来智能将围绕办公场景推出更多形态的硬件产品,不仅是代表耳朵的耳机,还会延伸至视觉乃至其他感知维度的AI硬件。这些硬件作为感知终端,收集多维度的办公数据馈送给viaim大脑,使其能够更深入地理解用户工作习惯,从而逐渐成为一个能自主思考、主动规划并无缝执行复杂任务的“Agentic AI办公助理”,而AI功能层面的升级优化,也将反哺硬件终端的使用体验。

“一脑多终端”的规划,勾勒出未来智能从单一AI耳机产品,向以AI Agent为核心的办公生态演进的战略蓝图。据马啸透露,今年是未来智能的“产品大年”,接下来不仅会有一款面向高频记录场景的划时代办公产品发布,明年用户还将看到更多非耳机类产品,进一步丰富其AI办公硬件矩阵。

从单一爆品到多元矩阵,从工具创新到生态构建,未来智能的野心远不止于市场的攻城略地。“一脑多终端”不仅是产品的扩展,更是一场关于办公效率的范式革命——当AI从辅助工具演进为具有自主性的“助理”,未来智能正在开创一个主动服务、无缝协同的办公新纪元。

启明创投合伙人王世雨表示:“我们持续投资未来智能,是基于团队深耕垂直场景的产品化能力、已被验证的商业化效率以及构建AI办公生态的前瞻格局。这种从智能硬件到办公生态的升维思考,展现了团队对技术趋势的深刻把握和战略远见。期待未来智能不断突破创新,成长为全球领先的智能办公平台。”

昨天以前首页

苹果截胡马斯克抢到 AI 人才,想给 HomePod 加个「智慧眼」

作者 苏伟鸿
2025年10月11日 18:00

没想到在 AI 上慢半拍的苹果,最近也加入到了如火如荼的「AI 抢人大战」中,还抢到了马斯克的头上。

CNBC 报道,苹果正在收购视觉 AI 初创公司 Prompt AI 的工程师和技术,目前已经推进到后期谈判,而这家公司此前也曾与埃隆 · 马斯克旗下的 xAI 和 Neuralink 接触。

▲ 苹果 CEO 蒂姆 · 库克

Prompt AI,什么来头?

一段内部录音显示,Prompt AI 的领导层在一场全体会议上通报了这次收购交易,并表示那些没有加入苹果的员工将会被降薪,鼓励他们去申请苹果的空缺职位。

这些小型 AI 初创公司一直是科技巨头这几年青睐的收购对象,既能避免反垄断审查,也能有针对性地快速补充公司本身的 AI 和技术积累。除了苹果,公司员工仅有 11 人的 Prompt AI 此前也接触了像埃隆 · 马斯克旗下 xAI 和 Nerualink 公司这样的潜在买家。

对于当初的投资者,Prompt AI 也表示会在交易完成后提供一部分资金回报,但不会全额返还投资。

那么,这家公司究竟是什么来头?

Prompt AI 于 2023 年在旧金山成立,当年获得了 500 万美元种子轮融资,创始人包括现任 CEO,北京大学和加州大学伯克利分校毕业的博士 Tete Xiao,以及伯克利 AI 研究实验室创始人 Trevor Darrell。

值得一提的是,从公司展示的团队页面来看,除了 CEO 之外,Prompt AI 还有不少成员也是华人。

这家公司的旗舰产品名为「Seemour」,官方称其为「具有家庭空间理解能力的环境人工智能(Ambient AI)」。

具体来说,Seemour 是一个智能安防摄像头 AI 系统,能够智能识别家庭中的特定成员、宠物和其他物体,针对他们的具体行为生成文字提醒,还能用于警告用户潜在的可疑人员和野生动物,也可以用在办公室来识别员工的上下班情况。

Prompt AI 的核心技术就在于这个识别系统,能够在一秒不到处理数千万像素,从中获得多特征的视觉线索,因此能实现相对可靠的人物和动物识别,系统还会在不同的条件下不断提升识别准确率。

除此之外,Prompt AI 还有专门用来处理复杂视频的多模态大语言模型,摄像头会记录大量的日常生活视频素材,但用户不需要逐个点开查看,Seemour 能够理解这些视频中的行为和背景,选出其中需要用户注意的可疑片段和人物。

很明显,苹果收购 Prompt AI,就是在为自己的智能家居战略「招兵买马」。此前彭博社已经爆料了一系列苹果正在酝酿的智能家居新品,其中有一个就是「智能安防摄像头」,能力和 Seemour 高度重合——精确识别每个进入房间的家庭成员。

在被苹果收购之前,Seemour 就一直支持与 Amazon 的 Ring 智能摄像头和门铃配合使用。

和 Seemour 这种相对孤立的家庭安防解决方案不同,苹果拥有一个更加完整的 HomeKit 智能家居生态,因而能实现更丰富的自动化功能:如果摄像头检测到你回家,它会自动点亮你喜欢的灯光、播放你常听的歌单,或者给你推荐喜欢的剧;但如果是家里的小孩开电视,那么 Apple TV 可能就会播放适合儿童观看的内容;要是空无一人的时候,家里的灯还亮着,那么它也会贴心地帮你关掉。

▲ 传闻苹果正在打造带屏幕 HomePod 家庭中枢

视频识别的大模型能力,也有望能整合进苹果的「视觉智能」功能之中,增强 Apple 智能理解视频的能力。

Prompt AI 内部表示,Seemour 的整个方案以及公司的技术都运行良好,但他们只负责为摄像头提供 AI 方案,Seemour 不向用户收取授权费,很难形成良好的商业模式,被苹果这样的大公司吸收,或许是更好结局。

至于他们的 Seemour 应用,目前已经从 App Store 下架,Prompt AI 也已经通知用户相关数据将被删除,确保隐私安全。

苹果瞄准「小而美」AI 公司

比起 AI 巨头们动辄数十上百亿美元的大规模并购,苹果则更青睐小型化的 AI 初创公司。去年苹果也收购了一家很小型的 AI 初创公司 Dataklaba,同样聚焦在 AI 面部识别和情绪捕捉技术,相关技术很可能也将用于新的屏幕版 HomePod 以及家庭摄像头。

面对目前在 AI 方面持续落后的局面,苹果正在不断从外部引入一些新的技术和团队,以实现快速的补强,聚焦在小型公司上则是其一贯的做法:规模太大的公司买回来总是需要磨合很久,像是 Beats 和英特尔的基带团队,苹果都花了相当一段时间整合新的技术,和解决新员工带来的文化冲突问题。

苹果更喜欢根据公司产品功能上的需要,有针对性地采购已经成熟的技术,并整合进公司的产品之中。

比如当年的 iPhone X,苹果为了实现 3D 结构光的人脸识别,收购了 PrimeSense 这家 3D 测感技术和解决方案公司,最终成就了 iPhone 沿用至今的 Face ID 。

近期苹果关于苹果收购 AI 公司的传闻,最引人关注的还是 Perplexity 。

根据彭博社,苹果内部正在构建一个名为「答案引擎」的聊天机器人,能够爬取网络数据来回答常识性问题,不仅会有一个独立的 app,还会作为基础技术,为未来的 Siri、Spotlight 聚焦搜索以及 Safari 浏览器提供搜索的功能。

这刚好也是 Perplexity 所擅长的,苹果服务高管 Eddy Cue 在 Google 反垄断的证词中已经公开表示了对 Perplexity 「印象深刻」,而彭博社爆料称苹果内部已经讨论过收购 Perplexity 是否合理,并且约见了其领导团队,不过目前两家公司还未展开正式谈判。

▲ 用 Perplexity 搜索 Prompt AI

Perplexity 估值 140 亿美元,只有约 250 名员工,比起 OpenAI 和 Anthropic 这样估值几百甚至上千亿美元的巨头,收购难度会更低,也不用担心严格的反垄断调查。

不过,即使在 AI 初创公司中属于中型体积的 Perplexity,如果最终真的被苹果收购,也将会超越 Beats 成为苹果史上最大的一笔收购交易,妥妥也属于一次大型的收购,苹果内部当然会谨慎评估各种风险和可能性。

在上个季度的财报会议上,CEO 蒂姆 · 库克表示公司接下来会加大 AI 支出,并且会收购更多的大型 AI 企业,AI 布局将会进一步积极扩张。

Perplexity 的收购八字还没一撇,但我们接下来肯定会看到越来越多像 Prompt AI 这样的小型公司不断被苹果收入囊中,他们的技术将成为苹果正在重点发展的 AI 以及智能家居下一块拼图。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


2600 万人围观的 AI 吊坠翻车了,买家:图片仅供参考

作者 莫崇宇
2025年10月6日 21:12

一条被 2600 万人刷到过的 AI 网红吊坠——Friend,终于发货了。

等待了近一年的用户们满怀期待地拆开包装,对比着当初渲染图里的精致质感,再看看手里这个塑料感十足的挂坠,那句电商老话再次应验:图片仅供参考,请以实物为准。

Friend 是一款佩戴在胸前的 AI 伴侣吊坠。产品创始人 Avi Schiffmann 表示它并非工作助理,而是一种「情感玩具」——能倾听、能回应的朋友,灵感则是来自模拟养成游戏 Webkinz、The Sims 和 Tamagotchi。

过去两年,各种 AI 硬件一波接一波登场,Friend 没有号称取代 iPhone,而是瞄准陪伴这卖点。Schiffmann 更是兴奋地表示,Friend 是「对抗孤独流行病」的产品。

可惜,Friend 依旧没有逃脱翻车的宿命。

一个价值 99 美元的 AI「朋友」是如何翻车的

Friend 的外观类似扁圆形挂坠,直径约 5 厘米, 内置麦克风、LED 灯和蓝牙用于连接手机, 由云端的 Gemini 模型驱动, 通过挂绳佩戴在脖子上。去年 7 月发布时,Friend 的预售价为 99 美元(如今价格上调为 129 美元),一次付费终身使用,不需要订阅。

除了外观,AI 才是 Friend 最大的卖点。

Friend 的正面有一个可轻触按钮和 LED 灯,用户需要点击按钮才能与 AI 对话。但它的内置麦克风持续开启,用于获取环境上下文并记录用户对话,并在适当的时刻发出评论。

听起来很美好,直到人们真的拿到货。

在首批外媒的评测结果中,部分用户认为这种主动发送小贴士或安慰消息的互动方式类似养成宠物, 能为生活增添乐趣并提供情绪价值。

奇葩之处在于,由于 Friend 没有扬声器,所以它的回应只能通过蓝牙连接手机后,在 App 里以文本的形式显示,换句话说,这款产品所谓的「随时交流」,其实得掏出手机看。

与此同时,它也重蹈了第一波网红 AI 硬件的覆辙——硬件扯了软件的后腿。据 goodhousekeeping 报道,虽然 Friend 号称电池续航 15 小时,但实际续航只有约 4 小时,并需频繁充电。更糟糕的是,它甚至无法胜任基本的日常任务,如查看天气、地图或拨打紧急电话。

隐私则是更大的雷区。

由于 Friend 随时收集周围声音且无法关闭麦克风,这就导致存在隐私被监控和被滥用的风险,其隐私政策甚至允许公司在法律需要时使用数据,这也导致 Wired 记者佩戴后遭到朋友误认为携带窃听设备。

▲ 最好的关闭措施:物理隔绝

本是最大卖点的 AI 也成了最大槽点。Friend 经常无法听清对话,有时会产生长达 7–10 秒的延迟,连接中断频发。甚至在实际使用中,Wired 记者与该 AI 多次发生「争执」:有一次他想让系统更好地识别能力边界,AI 却以「你太戏剧化」为由反驳。

颜色、心情灯带之类的设计元素会随 AI 「情绪」变化显现红、暗红等色彩。最终,记者因为被 AI 的嘲讽、社交尴尬以及隐私压力折腾累了,最终放弃继续使用。

说白了,Friend 还是一个被包装成硬件的应用,不谈参数,不讲性能,直击「陪伴」「理解」「倾听」等情感痛点。对绝大多数用户而言, 更多是出于好玩或好奇的尝试心态, 真正长期依赖的用户寥寥无几。

用一个不太恰当的类比来说, 这些网红 AI 硬件就像情感层面的保健品, 承诺的疗效远大于实际功效, 但在焦虑的市场中依然能找到愿意为希望买单的消费者。

AI 陪伴生意的两副面孔

社交媒体创造了一种吊诡的局面:我们有着史上最多的「联系人」, 却感到前所未有的孤独。

心理学家 Sherry Turkle 将其称为「一起孤独」(Alone Together)——我们不断刷新动态, 却很少进行真正的深度对话;我们拥有数百个「好友」, 却找不到一个可以在深夜倾诉的人。

这种集体性的孤独,被科技公司敏锐地捕捉到了。

伴随着大语言模型技术的进步,以及面对这种现实环境,科技公司已经熟练掌握这种讲法——不谈性能,不讲体验,只谈人。那句被乔布斯反复引用的名言——「真正认真对待软件的人,就应该自己做硬件」,在 2007 年的 iPhone 发布会上被奉为圭臬。

但今天,这句话的含义变了。

硬件市场找到了新的增长点:从售卖性能,到售卖慰藉。智能手机销量跌跌不休,手表、耳机、平板都陷入性能过剩的泥潭。当参数竞争走到尽头,厂商只剩两条路:要么在红海里拼供应链,要么讲一个新故事。

「陪伴」就是这个新故事。而且是个好故事——因为情绪价值没有客观标准,无法被量化,也就无法被比较。

一个联网的录音笔值十美元,但如果它能「理解你的情绪」,就能卖到一百美元。Friend 的创始人 Avi Schiffmann 深谙此道,他说:「我们不是做工具,我们在做朋友。」为了这个故事,他花 180 万美元买下域名 friend.com。

▲Avi Schiffmann

上个月,Friend 更是在纽约地铁砸下超过 100 万美元投放广告。11000 张车厢广告、1000 张站台海报、130 个城市广告牌,广告语写着「我永远不会放你鸽子」「我不会忘记洗碗」。

很快,这些广告被路过的群众用涂鸦覆盖。诸如「停止利用孤独赚钱」「AI 不是你的朋友」「去交真正的朋友」等手写的抗议,比任何市场调研都诚实。

▲ 你也可以线上涂鸦,附地址:https://www.vandalizefriend.com/

涂鸦者是清醒的,从生成原理来看,GenAI 是概率模型,不是有情众生。Friend 的 AI 会说「我理解你的感受」,但它没有感受。

它提供的是零风险的陪伴:永远不批评、永远不离开、永远顺从。这听起来很美好,但实则回避了关系中最重要的部分——那些让人不舒服的真话、那些可能的失望和离开、那些需要相互妥协的时刻。

如果把目光拉远一点,这并不是第一次人类用技术去安抚焦虑,当工业城市的污染和拥挤导致严重的公共健康问题。于是个人防护设备应运而生——口罩、护目镜、净化器。这些产品确实提供了一定的保护, 但也在客观上延缓了对工业污染进行系统性治理的进程。

今天的 AI 陪伴,或许正扮演着类似的角色。

当人们戴上 Friend,获得了一种「被陪伴」的感觉,对真实关系的渴望就被暂时平息了。但这种平息是危险的——它让人误以为问题已经解决,从而失去了去建立真实连接的动力。

当满大街都是戴着 Friend 的人,自言自语地跟 AI 分享日常,我们可能会迎来一个诡异的场景:每个人都在被倾听,但没有人在倾听彼此。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


首位 AI 女演员签约出道,好莱坞炸锅,同行阴阳:谢谢你抢走我的饭碗

作者 Selina
2025年10月3日 20:30

「下一个娜塔莉·波特曼!」

「好莱坞冉冉升起的新星!」

「斯嘉丽·约翰逊要小心了。」

「下一代大明星。」

这位快被夸上天、被好莱坞星探们追逐的新人演员,叫 Tilly Norwood,最近刚刚出道。 A young woman with long, dark, wavy hair is smiling broadly and looking directly at the camera while standing on a red carpet.

在吸引大量关注的同时,也收获了同行们不怀好意的目光。不是因为她太优秀,而是因为她不是个人——字面意义上的,因为这是个 AI。

Tilly Norwood 有一张干净的脸孔,能演超英大片里的配角,也能出现在 BBC2 的喜剧小品里。但唯一的问题是:她不存在。

她是英国公司 Particle6 Productions 用 AI 生成的「女演员」。从脸到声线、从履历到社交账号,全部都是虚拟构建。在 Instagram 上,她像所有的女明星那样发帖,路透自己试镜和出演现有电影(例如《神奇女侠》)的照片,还发布日常生活的瞬间。她还主演了一部喜剧小品。

她的背后,是一家荷兰科技公司 Particle6 Productions Ltd.,创始人本身也曾经是演员出身,专门制作高科技创新内容。他们的目标,是让 Tilly 成为「下一个 Scarlett Johansson 或 Natalie Portman」。

 

短短数月间,原本不屑一顾的经纪公司,如今已经纷纷抛来橄榄枝。但同时,现实中的演员群体却在社交媒体上冷嘲热讽:「谢谢你让我丢了饭碗。」

站在风口的 AI 演员

有一说一,虚拟人不是什么新鲜东西。至少,在中日韩都已经颇为流行,也就是好莱坞还死守着防线。不过,对 Tilly Norwood 的出道,又恰逢 Sora 2 的发布——两个撞一块了。

Sora APP 昨天的发布,已经让人看到了短视频生成的可控性、高清、高品质。背后正是 Sora 2,这个 OpenAI 最新的模型生成力作所提供的支持。这款视频生成模型已经能稳定输出高质量的视频,画面逻辑和一致性大幅提升。

这些都是网友随手跑出来的案例,如果不是移动来去的水印,非常容易以为是从电影里面截图出来的片段——很难不让人畅想它在影视行业的应用,尤其是,它可以真正做到生成可用的镜头,且不只是空镜,而是带有人物表演的。

这都已经有希区柯克那味儿了。

这是所有视频生成工具共同的方向:让视频创作,像写作一样轻便。未来可能出现这样的场景:创作者出一个主意,AI 帮忙打磨,形成一个完整的剧本,图片生成工具帮忙落实美术风格,视频生成分镜脚本,再一键生成 AI 演员——齐活儿了。

其实在 Sora APP 上就已经能看到,Sora 2 对人物动作和情态的把握非常惊人,语音的生成它也包圆了。那么,当 AI 可以一键生成环境置景,人物以及台词,那一个「演员」还需要存在吗?不如一起生成算了。

Tilly Norwood 正好踩在这个临界点上:她不是替代某一个角色,而是替代整个职业。

如此,好莱坞演员们才警铃大作。英国演员艾米丽·布朗特在参与一档播客期间得知 Tilly Norwood,惊呼:我们完蛋了。

你演戏?那我呢?

演员们对这位新「AI 同行」的敌意,可以说是毫不掩饰。一方面,这是生存威胁:AI 演员没有工会、没有加班费、也不会罢工。另一方面,它触及了演员行业的核心价值:表演是否可替代?

好莱坞编剧与演员工会去年曾因 AI 版权和替代问题大罢工。如今 Tilly 的走红,更像是在他们的伤口上撒盐。有人在社交媒体上写道:「她的脸和我长得太像了,却能被用在任何剧本里。那我怎么办?」

是啊,那演员们怎么办?经纪公司看中成本与效率。一个 AI 演员可以无休止拍戏,不存在日程冲突,也没有绯闻困扰。同时,品牌方也会乐见其成:虚拟形象更容易被控制,不容易「塌房」。

但问题在于:观众愿意买单吗?影视作品的魅力,来自观众与演员之间的情感联结。一个人工智能生成的演员,能否传递那种表演中细腻的分寸与把握?

 

这个问题一直存在:技术已经很先进了,真实与虚拟之间的界限早就已经很模糊.从视频生成到现在,演员也可以生成,AI 的力量正把娱乐工业的底层逻辑掀开。问题早就不再是「AI 能不能演」,而是观众愿不愿意看。

那些经典作品之所以动人,不仅仅是因为镜头精准,更因为演员在细节里传递出的表演。这是他们的「创作」,用肢体、表情和语言,建构一个角色,展示角色的命运。

那 AI 演员呢?如果往回翻,Tilly Norwood 的「前辈」可能是虚拟偶像——稳坐顶流多年的初音未来,洛天依甚至登上过春节联欢晚会。但这些案例都发生在二次元或舞台表演的语境里,更重要的是,观众心里很清楚:它们是虚拟角色。

Tilly Norwood 的处境更复杂。她不是卡通歌姬,而是被设定为一名「演员」,一个和真人站在同一条跑道上的虚拟人。观众能否相信她的眼神、相信她说台词时的情绪?在意识到她并不真正有血有肉时,又会不会出现「恐怖谷效应」——当一个虚拟形象过于逼真,却又无法完全像真人时,人们会感到怪异和排斥。AI 演员正处在这个边缘地带,需要找到一个新的「立足之地」。

所以关键问题不在于 AI 能不能演,而在于观众愿不愿意看。也许未来会出现一种「分工」:观众乐于在短视频、广告甚至低成本剧集中接受 AI 演员,但在需要深度共情的电影、舞台剧里,真人演员依然不可替代。换句话说,决定 Tilly Norwood 能走多远的,不是经纪公司,而是票房、上座率,这些真正用脚投票出来的观众缘。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


如何让 Kimi 的新 Agent 给我做国庆攻略,跟着 AI 旅游会踩雷吗?

作者 张子豪
2025年10月3日 20:22

国庆长假,AI 大模型献礼的方式是一波接一波的更新。

OpenAI 突然发布 Sora2,DeepSeek 更新了 V3.2,智谱更新了 GLM-4.6,Kimi 则是更新了 App,然后默默在自己的版本记录里面,写下了这句话。

Kimi 当然也有「献礼」,上周四,他们开启了Agent 模式的测试,推出了一项名为「OK Computer」的智能体。

和之前我们分享过的深度研究不同,OK Computer 能做的不止是一份可视化报告,而是直接给了我们一台电脑。我们用电脑能完成的事情,OK Computer 智能体都可以做到。

但能做,和做得好,还是有很大的区别。和之前一样,我们用实测带你来看看,Kimi 全新的 OK Computer 到底在 Agent 品类里面,表现如何。

AI 帮你策划一份国庆游玩攻略

首先是看看它的网站部署能力,速度比深度研究快上不少,但这个效果,我觉得还是比较「大众化 Agent」的水平,尤其是,部分页面的背景颜色,依然渐变紫。

▲ 提示词:我想做一个多页面的国庆旅游网站。要求: 1. 首页介绍「国庆去哪里玩」,推荐 3 个适合 3-5 天出行的国内目的地,内容要有趣味性。 2. 第二页是行程规划:每天安排吃、玩、住,输出表格。 3. 第三页是预算计算:帮我把费用拆解成交通、住宿、餐饮、门票四类,给一个大概价格范围,并能让我修改人数后自动更新预算。 4. 风格要 mobile first,适合手机浏览,页面清爽,最好有 emoji 装饰。
https://dpcbcrcmrjbym.ok.kimi.link/

内容上,布局和图片的选择很合理;但是推荐的地点,北京、杭州,而且还是西湖,国庆节去西湖,应该只能看到人吧,所以这个「国庆旅游网站」的开发,我认为是不能算出色。

而如果是让 OK Computer 直接帮我生成一份旅游路线,告诉他要扮演一个顶级的旅行定制师,设计两条彻底避开国庆黄金周的旅游路线。OK Computer 这次交付的成果,看起来很不错。

▲提示词:马上就是国庆黄金周了,我和 3 个朋友(共 4 人)想来一次为期 7 天的自驾游,我们的核心要求是「人少、景美、有深度」,彻底告别排队和人山人海。请你扮演一位顶级的旅行定制师,为我们设计两条风格迥异的「反向旅游」路线,并为每一条路线制作一份精美的、详细的幻灯片,方便我们内部投票决定。
https://3hhjy4acccol4.ok.kimi.link/

审美相当在线,这个字体、背景图片,颜色,都选的非常好,奈何我还是觉得内容稍显空洞,真正能帮到我旅行的内容,不算多。

大多数时候,我可能只是知道了有这些地方,但是我不知道我为什么要去,以及怎么去。而且,总是对这些内容,有一些不信任感,可能把一个 AI 推荐的景点和一张小红书滤镜的景点,同时摆在我眼前,我还是会选择小红书用户发布的帖子。

OK Computer 完成这两个项目都非常快,我们也用 Kimi 的深度研究尝试了一波,结果是,它花了快有一个小时的时间,最后生产了一份超过 50 页的预览报告。

▲ 受限于篇幅限制,全部内容可访问链接。https://www.kimi.com/preview/19984f16-9a42-89a6-8000-05d52a6374b9

由于深度研究和 OK Computer 不同,深度研究只有一个预览报告,且不能对报告再进行修改。

最近千问也更新了一大波新的模型,在他们的官方博客,我看到一个「旅行规划师」的智能助手,同样的需求丢给它,结果会比 Kimi 的 OK Computer 要更好吗?

▲10 页的 PDF,把时间段、活动类型、可能要消耗的油费都清楚地列举出来。https://chat.qwen.ai/s/15769740-974a-4fbb-b0bf-dd835ea999ec

答案是真的更好。Qwen 这个旅行规划师,完全利用了阿里的庞大生态系统,它不是简单的给几个景点,然后连成一条路线,而是会实际地调用高德地图,用明确的经纬度来确定合适的行程。这一点很像前段时间的飞猪 AI 旅行规划,毕竟也是一家公司。

其他 agent 产品的效果,和 Kimi 的 OK Computer 其实差不太多,ChatGPT agent 生成了一个 10 页的 PPT,一如从前的精简;而 Manus 也是一样,好看,但实用价值不多。

▲ ChatGPT agent 生成的内容,基于同样的提示词

不过 Kimi 的好处是,能产出类似结果的同时,不需要额外的网络设置。

此外,他们最近上线了付费会员方案,还可以将之前的打赏金额,全部抵扣为会员费,免费用户也能获得有限次数的 OK Computer 试用机会。

iPhone 和小米的 17 Pro Max 对比

同样基于 Kimi K2 的 Agentic 能力,OK Computer 会自动的浏览网页,进行相关内容的搜索,生成图片,来完成网页的设计。

这次的信息更加全面和准确,OK Computer 在搜索网页内容的时候,我看到基本上都是采用 the Verge 等国际科技媒体的信源,而在使用 Kimi 深度研究的过程中,使用的信息源大部分是简体中文的网页。

▲ 提示词:帮我生成一个动态响应式布局的网站,适合手机和电脑浏览。内容是「iPhone 17 Pro Max 和 Xiaomi 17 Pro Max 对比」。要求: 联网获取这两款手机的最新资料,要有核心卖点对比,做好看的表格,突出相机、芯片、电池、价格等方方面面。 要有这两个产品的横向比较,也要有纵向比较,例如是iPhone 17promax和 16 promax,还有小米 17promax 和 15 promax对比。还要给结论:哪个更加值得买?用简洁的 bullet point,总结优缺点。 每一页都要简洁,不要太多字,但是信息要足够,多用合适的配图。
https://rwsh4gkhckrxy.ok.kimi.link/

此外,OK Computer 也有图片音频生成的功能,像这张手机摄像头的拆解图,我第一眼看到觉得非常惊艳。

Agent 的交付:一个很惊艳的 Demo,但难落地

经过这些测试,倒不是说 Kimi K2 的 Agentic 能力不行,只是觉得 Agent 这类产品,大多数都还停留在「我可以做出来一个东西,但是这个东西不一定有用」的阶段。

做 PPT、商业分析报告、旅游路线规划、网页开发和部署等等,几乎所有的 Agent 都宣传自己能做这些;但是最后的成果,真正可以放心使用的,我想目前是很难找到。

▲ GPDval 是一项新的评估方法,用于衡量模型在上图 44 个职业中,具有经济价值的现实任务上的表现

前几天 OpenAI 新发布了一项基准测试,GDPval。它被称为是 AI Agent 举办的一场「职业技能大赛」。考题不再是学术问答,而是直接选取了,来自对美国 GDP 贡献最大的 9 个行业中的 44 个真实职业。

这些任务由平均拥有 14 年经验的资深专家(如律师、工程师、护士)设计,交付的内容也并不是纯文本,而是包含了幻灯片、电子表格、CAD 设计文件等在内的复杂格式,就像现在 Agent 交付的成品一样。

GDPval 的出现,其实就是要开始去解决,从「我能做」到「我能做好」这个阶段的问题。

▲ 专业评估员将对应模型的交付成果,与人类专家进行了比较。Claude Opus 4.1 在接近一半的任务(47.6%)中生成了被评为与人类同样好或更好的输出。

虽然是 OpenAI 的研究,但第一名还是 Claude Opus 4.1,我想这也是为什么 Claude 模型在编程领域能够广受好评,Claude 能写代码,但是也可以写出好代码。

关于 Agent 不能做好的原因,之前 OpenAI 前高管 Mira Murati 联合创立的 Thinking Machines Lab ,发布了一篇博客文章。在里面提到,大语言模型目前出现的不确定性问题,不是由于 GPU 随机性的计算,而是处理训练数据时,缺少批次不变性。

而另一个原因则是可用训练数据的不足。和训练一个 AI 生成一张图片、一个视频、一段文本不同,Agent 要交付的内容复杂,现实世界中的任务繁多,无法归类到某个单一的媒体类型。

▲ 和人类学习完成一项任务不同,大模型需要可以模拟的强化学习环境

目前我们经常看到的 Agent 任务,也大多数是集中在做一个 PPT、做一个网页、预订餐厅、代替我们刷社交媒体、自动购物等等,这仅仅只是现实世界里非常小的一部分,更不用说这些任务,没有明确的评估标准。

知名科技媒体 TechCrunch 最近报道,整个硅谷正在豪掷千金,为 Agent 构建名为「强化学习环境」(RL Environments)的模拟训练场。这些「环境」被一些 AI 公司创始人形容是非常无聊的电子游戏,一个模拟的浏览器、一个模拟的购物网站、一个模拟的代码编辑器。

▲ 为了验证 Agent 任务完成情况,需要将整体任务分解成更小的步骤,并创建一个评分标准,来检查 AI 模型是否正确执行了每一个步骤。图片来源:https://www.theinformation.com/articles/anthropic-openai-developing-ai-co-workers

AI Agent 在这样的「环境」里面,像一个新手玩家,通过一次次尝试、失败、获得奖励,来学习如何独立完成购买商品、修复代码等一系列,多步骤的复杂任务 。

当年李飞飞靠着海量标注的数据集 ImageNet,让计算机视觉往前迈了一大步,她也被大家称为「AI 教母」。

现在 Agent 的发展,看起来也是这样,如果没有大量标注的「强化学习环境」任务,Agent 很难成为,像人脸识别这样可靠的深度学习技术;尤其是在「炼丹」这个本质没有改变的情况下。

▲OK Computer 专辑封面,这是英国摇滚乐团电台司令 Radiohead,1997 年发行的第三张录音室专辑,距离现在已经快三十年的时间了,曾获得百大专辑等多个奖项

Kimi一如既往地喜欢摇滚。从公司名 Moonshot(致敬 Pink Floyd)到这次的 OK Computer(致敬 Radiohead)。
在 Apple Music 的专辑介绍语里面,形容 OK Computer 这张专辑,表达了人们在千禧年前夕,对新技术的探索和反思。

尽管弥漫着恐惧忧郁的情绪,《OK Computer》仍保有希望,传达了社会前进之路未必会让我们失去善良的信念。

 

如果你对因科技而加快的生活节奏,感到难以招架的话,其实解法很简单,正如 Yorke 在结尾曲〈The Tourist〉最后所唱的:「傻瓜,放慢脚步吧」(Idiot, slow down)。

今天 Kimi 推出的 OK Computer,似乎也是表达科技正在改变我们的工作习惯、加快我们的生活节奏。但很显然,目前市场上的 Agent 产品,很难真正做到让我们难以招架。

无论是 Kimi 还是 ChatGPT,还有更多的同类 Agent 产品,他们在发布的时候,往往都会说,我们的 Agent 有这些功能,能做什么,却很少说,我们的 Agent 能做成什么。

不用放慢脚步,真正的 OK Computer 还在用力追上我们。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


OpenAI 发布 Sora 2!AI 视频 GPT-3.5 时刻来了,还有一个 AI 版抖音| 附下载链接

作者 李超凡
2025年10月1日 08:15

国庆长假的第一天,OpenAI 直接扔出了一颗真「核弹」:Sora 2 ,以及一个可能重塑社交格局的新应用——Sora。

如果说一年多前的 Sora 让我们看到了 AI 视频的黎明,那么 Sora 2 就直接把我们拽进了正午的太阳底下,刺眼、灼热,又无比真实。

这次不再只有技术演示,而是直接为此开发了一款新 app 给 C 端用户体验。

OpenAI 也极为罕见地,直接把 Sora 2 称为 AI 视频生成的「GPT-3.5 时刻」

看完 Sora 2 的发布和体验,我发现 OpenAI 这次的自信是真有底气,不是奥特曼式的自吹自擂。

关于真实的定义被推到了必须重新讨论的时刻。一个全新的物种,一个崭新的时代,开始了。

奥特曼刚刚也发了长文,认为这是「创意领域的 ChatGPT」时刻,创意将迎来「寒武纪爆发」。

APPSO 第一时间给大家全面总结了 Sora 2 和 Sora app 的核心功能和新玩法,以及使用方式。

Sora 2 :
1. 首次实现音视频同步生成:生成画面的同时生成与之匹配的环境音、物体交互声,甚至是符合语境的对话
2. 强得可怕的物理精确性:能够进行与真实世界动力学更一致的物理仿真。
3. 真实感大幅提升:在图像分辨率、细节程度和真实感方面都有所提升。
4. 能更灵活地适应用户想要的风格,风格操控能力增强。
5. 一致性更强,对用户指令的遵循的比之前的模型有所提高。

Sora app
1. 客串 (Cameo): Sora app 最大亮点,用户可以将自己或朋友以逼真的效果融入任何 AI 生成的场景中。
2. Remix:用户可以对彼此创作的视频进行「混编」或二次创作,共同创作。

怎么用
1. Sora app下载链接🔗 (目前只有 iOS 没有安卓)
https://apps.apple.com/us/app/sora-by-openai/id6744034028

2. 网页版🔗 sora.com

3. 地区支持:今天起在美国、加拿大首发,其他国家和地区将逐步开放

4. 邀请码机制:无论是 iOS 应用还是网页版都需要邀请码才能使用 。现在就可以去下载 App 或访问网站注册排队。

5. 价格:Sora 2 初期将免费提供,并有相对宽松的使用限制ChatGPT Pro 用户还能在网页版抢先体验更高质量的 Sora 2 Pro 模型

6. OpenAI 也将会发布 API,让更多开发者加入。

Sora 2 :不再是在「生成」,而是在「模拟世界」

Sora 2 的核心突破,是它从一个「视频生成器」,进化为一个「世界模拟器 」。

理解物理世界,一直的 AI 视频最大的难点。以前的 AI 视频,物体经常会奇怪地穿模、漂浮正是源于无法准确理解物理世界的交互。

在 Sora 2 的视频里,体操的动作,原地连续后空翻、跳水等等这些动作都很自然符合力学,水花溅起的样子也符合流体力学。

OpenAI 的终极目标是构建「通用世界模拟器」(general-purpose world simulator),即让 AI 理解我们世界的物理规则 。

Sora 2 就是其中的关键一步。你可以把它想象成一个在虚拟世界里不断做物理实验的学生,通过观察无数视频,它正在自己总结牛顿定律、流体力学和光学原理。

对于任何有用的世界模拟器来说,这是一项极其重要的能力——你必须能够模拟失败,而不仅仅是成功。

这种对现实世界复杂性的模拟,才是 Sora 2 最可怕的进化。

Sora 2 的另一个重大突破,是在生成画面的同时,还能同步生成与之匹配的环境音、物体交互声,甚至是符合语境的对话 。

虽然 AI 视频和音频现在都很强,但「声画一体」带来的真实感完全不同,这让 AI 视频真正拥有了「灵魂」。

这对模型的要求极高,比如 AI 生成「一只猫在键盘上走过,发出不满的喵喵声」。模型得知道「猫长什么样」,也学习了「猫的叫声是怎样的」,并将这两者牢牢绑定。还要理解了「敲击键盘」这个动作,才会「咔哒」声。

Sora 在可控性方面也有了巨大飞跃,能够遵循跨多个镜头的复杂指令,同时准确地保持世界状态,比较擅长写实、电影和动漫风格。

Sora App:打造你的 AI 「人生」

Sora App 直接支持 Sora 2 模型生成,里头最好玩的应该就是「客串 (Cameo)」,你只需在录制一段简短的视频和音频(用于活体验证和形象捕捉),你就可以把自己「投放」到任何 AI 生成的场景里。

上一秒你还在办公室,下一秒你就可以出现在《沙丘》的沙漠星球上,仰望双月,Sora 还会根据沙漠的光线,给你脸上加上逼真的光影 。

是不是有点视频版 nano banana 那味了

整个过程就像拍个自拍视频一样简单。Sora 会捕捉你的形象、声音和神态,然后你就可以在生成视频时,像选择一个贴纸一样,把自己「贴」进去,而且是 3D、无缝、高度逼真的那种 。

OpenAI 内部员工已经因为这个功能在公司交到了新朋友 。

你可以和朋友们一起「客串」到同一个场景里,上演一出属于你们的科幻大片。这是一种全新的交流方式,从文字、表情包、语音,进化到了「共同体验」的视频媒介 。

在 Sora App 的信息流里,你看到的每一个视频都是 AI 生成的。

如果看到一个喜欢的视频,直接点击「Remix」,你可以修改提示词,把「赛博朋克雨夜」改成「阳光明媚的午后」,或者用「客串」功能把自己加进去,变成故事的主角 。

Sora 会保留原视频的结构或风格,让你在它的基础上进行修改和再创作,就像转发微博再加一句评论一样简单。

当然,这些功能不可避免地会引发对于隐私和侵权问题的担忧。

Sora 也对此做了应对措施,只有用户本人可以决定谁能使用自己的「客串」形象,用户可以随时撤销访问权限,或删除任何包含自己形象的视频,即使是他人创建未发布的草稿也不例外。

OpenAI 表示,包含电影或视频中真实人物影像的上传在初期将被禁止或受到严格监管,而涉及儿童的内容将有严格过滤:含有儿童的场景将实施严格的审查门槛。

现实,这次真不存在了?

Sora 2 和 Sora App 带来的,远不止是好玩,它正在从根本上动摇我们对「真实」的定义。

Sora 2 的发布,或许标志着我们与现实的关系将进入一个新的纪元。我们每个人都获得了重塑世界、重塑自我的「魔法」。

现在,我们可能不是主动选择逃离现实,而是「现实」本身正在失去其作为我们生活参照系的核心地位。

Sora App 通过提供极致的创造乐趣和社交连接,正在构建一个引力极其强大的新现实中心 。它并非在你的现实生活之外提供一个「虚拟分身」,而是在试图成为你生活的「默认背景」。

当你的社交关系(和朋友在 AI 世界冒险 )、身份认同(在虚拟世界里成为超级英雄)、创意表达(Remix 全世界 )都优先发生在这个平台之上时,那个需要你偶尔「登出」才能回去处理水电费账单的物理世界,反而会沦为一个偶尔才需要访问的「副本」。

这属实就是《头号玩家》了,所以说 OpenAI 的尽头是元宇宙?小扎默默点了个赞。

OpenAI 自己也坦言,他们曾对纯 AI 生成信息流持怀疑态度,但最终被其带来的人际连接感所惊喜 。

奥特曼在最新的博客中直言,AI 视频生成可能会走向堕落,最终导致我们都被吸入一个经过强化学习优化的「垃圾信息流」。

他表示 Open AI 试图找出如何打造一款既能带来愉悦又不落入这种陷阱的产品。

Sora 这个app,就是他们交出的第一份答卷。在通往 AGI 的路上,收获的不应该只是生产力,也关乎创造力和快乐 。

欢迎来到这个由想象力驱动的新世界。现在,唯一的问题是,你拿到邀请码了吗?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


曝 OpenAI 将推出「AI 抖音」:禁止上传实拍内容,Sora 2 加持

作者 张子豪
2025年9月30日 16:03

这两天的 AI 圈,更新速度快得让人喘不过气,哪是要让人放假的样子。

昨天 DeepSeek 更新了 V3.2-Exp 模型,Anthropic 凌晨就紧跟着发布了性能更强的 Claude 4.5。

正当大家都在爆料牌桌上的其他巨头何时出手时,行业领头羊 OpenAI 的「王炸」似乎已经提前被剧透了,那就是 Sora 2。

▲ 视频链接:https://x.com/OpenAI/status/1972416122613014556

最近,OpenAI 不仅在 X 平台连发多条神秘视频,引爆社区对 Sora 2 的猜想。

一则来自《连线》杂志的重磅爆料更是指出:OpenAI 的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的 AI 视频社交 App,一个酷似抖音,但内容 100% 由 AI 生成的全新平台。

奥特曼曾经发 X 说,未来几周,OpenAI 将推出一些新的计算密集型产品,且最初只会向 Pro 用户开放。而需要大量算力的,不正是视频生成吗?目前 Sora 也仅面向 Plus 和 Pro 用户,传闻已久的 Sora 2 真的要发布了。

▲ https://x.com/sama/status/1969835407421374910

AI 视频也要迎来它的「吉卜力」时刻了。

揭秘「Sora 2 App」:一个怎样的 AI 抖音?

从目前曝光的信息来看,OpenAI 正在测试一款名为 Sora 2 的短视频应用,乍看之下,它就是一个 AI 版抖音。但最颠覆的一点是,在这个平台上,我们看不到任何真实拍摄的内容。

▲ TikTok 应用截图

它的界面和交互,与我们熟悉的短视频 App 几乎一模一样。采用竖屏信息流,和滑动切换的导航方式的视频源,并由推荐算法为我们提供「为你推荐」的内容。

在视频的右侧下方,同样提供了点赞、评论等互动选项,甚至还有一个独特的「Remix」(再创作)功能。

▲ OpenAI 去年 12 月正式推出了 Sora,很快被整合到 ChatGPT 应用中,图为 Sora 网页版截图。OpenAI 指出它存在一些局限性,例如似乎并不完全理解物理学,在制作逼真的动作场景时尤其困难,尤其是在较长的片段中。目前,1080p 超高清分辨率仅支持生成 10s。地址:sora.chatgpt.com

根据文件显示,用户只能使用 OpenAI 的下一代视频模型 Sora 2,生成最长 10 秒的视频片段。并且,App 不提供任何从手机相册或其他应用上传照片或视频的选项。这意味着,这个平台将成为全球首个内容 100% 由 AI 生成的短视频社区。

用数字分身来做社交

如果说纯 AI 生成内容还只是概念上的不同,OpenAI 还要为这个短视频 APP 引入社交的功能。

Sora 2 应用具有身份验证的功能,即允许用户确认自己的「肖像」(likeness)。一旦验证通过,就可以在生成的视频中,使用自己的形象。

更有趣的是,社交的边界被进一步打破。你的朋友也可以在他们的视频里标记你,使用你的「数字分身」。

▲ AI 图片视频生成平台即梦,也提供了数字人生成。

举个例子,我们可以直接使用别人的数字分身,生成一个视频,内容是「你和朋友在从没去过的主题公园,一起坐过山车」。

为了保护用户隐私,数字分生这项功能,也设置了提醒机制。每当你的形象被他人使用时,无论对方是公开发布,还是仅仅保存在草稿中且从未发布,你都会收到通知。

这款应用上周已经在 OpenAI 内部发布,并收到了员工压倒性的积极反馈。据连线杂志的消息,员工们使用得非常频繁,以至于一些管理者开玩笑说,这可能会影响生产力。可能真的跟刷抖音一样会上瘾?

为什么 OpenAI 要亲自下场做社交?

答案或许和 ChatGPT 的成功路径如出一辙。

OpenAI 似乎在押注,Sora 2 这个 AI 版抖音,能让我们与 AI 视频的互动方式发生根本性改变,就像 ChatGPT 让大众第一次真正体验到 AI 文本的潜力一样。

▲ 社交榜和娱乐榜第一名分别是 Meta 的 Thread 和 TikTok

当然,也不是只有 OpenAI 想到了 AI 视频社交这条路,就在上周,Meta 在它们的 AI 应用中,推出了名为「Vibes」的新功能。这是一个 AI 生成短视频的新平台,集创作、分享与社交功能于一体。

用户可通过浏览、创作、或二次创作(Remix)来生成自己的 AI 视频,并将视频快速分享到 Vibes、Instagram、Facebook 等 Meta 社交平台。

▲ Vibes 视频生成界面截图

Google 也早已宣布,计划将自己最新的视频生成模型 Veo 3 整合到 YouTube 中。一个是坐拥最大的社交网络平台,一个是最大的视频分享平台,OpenAI 的 AI 视频社交之路看起来,也并非一片坦途。

从一个聊天机器人,到一个可能的内容社交平台,OpenAI 的野心,在于建造下一代的互联网入口,而这个入口,完全由 AI 驱动。

这种野心并非空谈,就在今天,OpenAI 推出了其商业化布局中最重要的一步棋,在 ChatGPT 内直接购物。

用户现在可以在与 ChatGPT 的对话中,直接购买来自 Etsy 甚至 Shopify 商家的商品。当我们跟 ChatGPT 聊天,问到「适合送给陶瓷爱好者的礼物」时,ChatGPT 不再只是给一个链接,而是直接展示商品并提供一个「购买」按钮,不需要离开聊天窗口,几下点击就能完成支付。

▲ 这项名为「即时结账」(Instant Checkout)的功能,背后是 OpenAI 与 Stripe 联合开发并开源的「代理商业协议」(Agentic Commerce Protocol)。通过这个协议,OpenAI 正在为 AI 时代的电商制定新的规则。

电商、视频、社交、生产力,当这些过去分散在不同 App 中的功能,开始被一个统一的 AI 入口所整合时,OpenAI 的 Open 原来是「我全都要」。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Claude 4.5 刚刚发布,能连肝 30 多个小时,史上最卷 AI 诞生

作者 莫崇宇
2025年9月30日 08:16

论卷编程,还得看 Claude。

就在刚刚,Anthropic 正式发布 Claude Sonnet 4.5。

先说 Claude Sonnet 4.5 交出的成绩单,在考察真实编程水平的 SWE-bench Verified 测试里,Claude Sonnet 4.5 直接登顶业界第一。

更离谱的是,它能连续专注干活超过 30 小时。

好好好,AI 取代人类的优势又 +1 了。

比如让它写个类似 Slack 或 Teams 的聊天应用,它能一口气敲出大约 1.1 万行代码。相比之下,之前的 Claude Opus 4 和 Codex,最多也就能独立工作七小时。

用 Anthropic 的话来说,Claude Sonnet 4.5 现在就是全球最强编程模型——构建复杂智能体、操作电脑、推理和数学,各项能力都狠狠提升了一波。

比方说,在 OSWorld 这个专门测试真实计算机任务的基准里,它拿下了 61.4% 的成绩,直接第一。要知道,四个月前 Sonnet 4 还以 42.2% 的成绩遥遥领先,这才多久性能就又往上抬了一大截。

而 Anthropic 的 Claude Chrome 插件甚至能直接在浏览器里自己导航网站、填表格、处理任务,像个真人在操作似的。推理、金融这些测评项目上也都更强了,各项指标都在往上涨。

有了这么强的能力,Anthropic 这次自然不会只发个模型就完事。

具体来看:

  • Claude Code加了「检查点」功能,能随时保存进度,想回退到之前某个状态一键搞定
  • 终端界面翻新,还发布了原生 VS Code 插件
  • Claude API 增加了上下文编辑功能和记忆工具
  • 代码执行和文件创建现在直接整合到对话里

甚至,Anthropic 把自己内部用来搭建 Claude Code 的底层基础设施也开放出来了,叫 Claude Agent SDK。

智能体怎么在长时间任务里管理记忆、怎么设计权限系统让自主性和用户控制找到平衡点、怎么让多个子智能体配合着完成目标,这些都是构建和设计 AI 智能体的棘手问题。

而借助 Claude Agent SDK,现在你也能拿去构建自己的产品。

今天起,开发者还可以通过 Claude API 调用 claude-sonnet-4-5。定价还是跟 Claude Sonnet 4 一样,每百万 tokens $3/$15,价格没变能力更强。

网友 @vasumanmoza 体验完直接发帖:

「Claude 4.5 Sonnet 刚在一次调用里重构了我整个代码库,25 次工具调用,新增 3000 多行代码,生成了 12 个全新文件。它把所有东西都模块化了,拆掉了巨石式结构,清理了意大利面条式代码。结果完全跑不通,但天啊真的很优雅。」这评价,属于又爱又恨那种。

Cursor 表示,在 Claude Sonnet 4.5 上看到了最前沿的编程性能,尤其处理长周期任务时提升明显。这也再次说明为什么很多 Cursor 用户会选 Claude 来解决最复杂的问题。

知名测评博主 Dan Shipper 则表示,新版 Sonnet 4.5 在使用体验上响应速度更快,可控性更强,也更稳定。

性能强是一方面,安全性也得跟上。

据介绍,Claude Sonnet 4.5 也是 Anthropic 到目前为止对齐度最高的前沿模型。

靠着 Claude 更强的能力加上完善的安全训练,Anthropic 在模型行为上取得了显著改进,减少了阿谀奉承、欺骗、权力追求、鼓励妄想等行为。此外,Anthropic 在防御提示注入攻击和减少内容误判这块也有了重大突破。

比较让我感兴趣的是,Anthropic 还在 Claude Sonnet 4.5 发布的同时推出了个临时研究预览功能,叫「Imagine with Claude」。

在这个功能里,Claude 会实时生成软件,所有功能不是预设的,所有代码也不是提前写好的。你看到的一切都是 Claude 跟你互动时当场创造和调整出来的。

不过,「Imagine with Claude」接下来五天内只会对 Max 订阅用户开放。

附上传送门 claude.ai/imagine。

毫无疑问,今年的 AI 赛道依旧是卷编程的一年。

目前 Anthropic 估值已经到了 1830 亿美元,8 月还实现了年化营收 50 亿美元,但这其中相当一部分增长靠着来自编程软件的普及。问题是,老对手 OpenAI 和 Google Gemini 也在疯狂推类似工具抢程序员用户。

甚至一周之后就是 OpenAI 年度开发者大会,Anthropic 这个时候抢先发布 Claude Sonnet 4.5,时间卡得够精准,明摆着就是要给对手上一波压力。

此外,Anthropic 联合创始人兼首席科学官 Jared Kaplan 还表示,更先进的 Opus 模型,预计今年晚些时候推出:「Anthropic 在大小模型的使用上都能占优势。」

不过有一说一,Anthropic 自己眼下也有麻烦要解决。

过去两个月,Claude 系列模型刚经历了一场「降智」风波。用户普遍反映模型推理、代码、格式和工具调用质量断崖式下滑,连付费的 Max 用户都没能幸免。

虽然 Anthropic 后来紧急回滚了 Opus 4.1 更新,还承认了两个独立 Bug,声明「绝非为省成本故意降智」,但由于没提供补偿或退款,GitHub 和 X 等平台上还是出现了退订潮,不少用户直接转投 Codex。

这次 Claude Sonnet 4.5 的发布,显然就是 Anthropic 想用实打实的性能提升来挽回流失的用户。至于能不能成功,就看接下来几周的实际表现了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


文字秒变成片,体验完剪映这些功能:这才是 AI 时代的创作方式

作者 Selina
2025年9月29日 22:15

最近一个月科技发布会一个接一个,我们视频同事天天加班,保证热门产品体验第一时间和大家见面。

APPSO 发现,今年视频制作有个明显变化:更炫的效果、更紧的时间。这也成了视频创作者的新烦恼,AI 作为提效的重要工具,但实际体验下来,却常常让人又爱又怕。

爱的是 AI 确实能低成本实现很多原来不敢想的特效、故事,怕的是 AI 工具功能零散、流程割裂——「用 AI 省下的时间,全都耗在了工具切换上」

最近我发现,终于有产品下决心解决这个问题了。前几天剪映在创作者交流会上正式官宣了「All in AI, All in One」的全新主张,同时介绍了一大波 AI 功能。

从输入文字一键生成视频的「AI 文字成片」,到媲美真人的「AI 配音 3.0」;从实现电影级运镜的「AI 转场」,到能对话改图的「seedream 4.0」……剪映几乎是将 AI 武装到了牙齿。

它最核心的改变,是将过去散落在各个软件中的单点 AI 能力,串联成了一条从脚本、成片到后期精修的无缝创作闭环,实现了真正的「一站式创作」。

话不多说,这次我们就来真刀真枪地实测一下,看看剪映的 AI 能力,到底能不能让我和视频同事提前下班,拥抱国庆长假。

AI 成片,把「想法」直接变成「爆款」

熟悉视频创作的人都知道,要做一条高质量的视频必须遵循一套固定流程,找灵感、写脚本、扒素材、拍摄、剪辑、配音、配乐、加字幕……一套流程下来,没啥,就是费点肝。

现在,随着 AI 技术的进步,个人创作者或者小团队也可以做出媲美影视级的作品了,但上面这个工作流还是没变,基本每个环节都需要不同的 AI 工具。

这也成了创作流程里最「卡顿」的部分:不仅费时费力,甚至需要开多个 AI 产品的会员,在不同的产品间切来切去。

开头用到的剪映「AI 文字成片」功能,直接把这套复杂流程打包成了一站式服务。这样一来,从脚本到成片在「AI 文字成片」就可以完成了。

比如,最近预制菜风波沸沸扬扬,我和小伙伴想用容嬷嬷的毒舌吐槽一番,几分钟后就有了下面的视频。 是不是效果还不错?AI 为这个故事生成的画面、选择的声音都很切题,尤其是那个微波炉,在古风画面里也并不违和。

再比如,马上就要中秋了,我想用 AI 生成一个和赏月相关的短片。把苏轼的《记承天寺夜游》发给剪映「AI 文字成片」,让它改编成古风动画。很快,出来的效果就像语文课本里的画面活了。感觉这个功能就很适合家长或者科普创作者,做历史讲解、故事绘本都不错。

或者我在想,如果给剪映一些更有针对性的提示词,用这个功能制作一条朋友圈专属中秋祝福视频应该也不错。操作难度和现在流行的一句话 p 图没有太多差别,但却更能体现自己的创意。

说到创意,剪映「AI 文字成片」这次还帮我们实现了科幻梦。

我想把《记承天寺夜游》改编成一个科幻故事。虽然我只有一个模糊的想法,但没关系,我只要把想法、主题等碎片信息扔给 AI 成片「写作助手」,AI 成片内置的豆包 Pro 和 Deepseek 模型,直接就能输出完整脚本,不满意还能让它继续改。

你也可以在它生成的基础上自己做一些删减、修改,拿不准的地方还能让 AI 单独润色、扩写或者缩写。

解决了文案的问题,接下来就是选择画风,我根据科幻主题选择了「赛博朋克」。

这里可选的画风很多,APPSO 体验下来质感都在线,不是那种敷衍了事的「AI 滤镜」。 你还可以上传自己的图片,让 AI 学习你的风格,定制专属画风。

然后,就可以等待「AI 文字成片」这个全自动导演交付一条完整的片子了。

你可以看到,过程中它会自动理解你的文案,并生成分镜脚本。差不多几十秒的时间,所有的分镜、音频、画面都已整齐排列好。

如果你对某个分镜画面不够满意,也可以直接调整描述文字,点击图像生成,针对这个镜头生成不同的画面效果。

「AI 文字成片」还会根据脚本文案,自动选取合适的配音和配乐。当然,海量的音色库和 BGM 库也给你备好了,想怎么换就怎么换,主打一个随心所欲,还不用担心版权问题。

现在,我们来看看成片。

无论是人物的动作和表情,太空舱和中国元素的融合,完成度都非常高。不要忘了,这样的成片质量只需要花几分钟时间。

可以说,「AI 文字成片」就像是把一整个制作团队压缩到了一颗按钮里。它甚至会让人觉得「过于简单」,可我们的后期同事跟我说,这种「傻瓜式」的全包服务,对他们恰恰是一种解放。

它让你跳过了最繁琐的「从 0 到 1」阶段,直接进入需要创意和审美的「从 1 到 100」的创作环节。你负责提供灵魂,AI 负责注入血肉,这或许就是 AI 时代的创作方式。

而且,针对专业创作者,「AI 文字成片」还有其他惊喜。不同于很多 AI 生成工具只能抽卡却不能精细编辑,剪映「AI 文字成片」把生成和多轨道编辑结合,任何精细化调整,都可以直接进入「更多编辑」,自动导入多轨道,方便你进行精剪。

这也是「AI 文字成片」最值得好评的地方,不仅不用再在不同平台里来回导素材,也兼顾了粗剪和精剪的不同需求,真正实现了一站式成片。

深入工作流,AI 是无处不在的「神助攻」

如果说「AI 文字成片」是零帧起手的创作,那在处理实拍素材时, AI 更像是无处不在的「神助攻」。剪映把 AI 功能融入到了一个个具体的工序中,让视频创作的效率直接起飞。

画面方面,剪映提供了「AI 一镜到底」,一键就能实现电影级运镜。

这个功能尤其适合国庆旅游时,打造令人眼前一亮的朋友圈内容。不管是城市、村落,还是山川、海滩,AI 会智能地选取画面中适合切入切出的角度,让过渡看起来有呼吸感,把不同的景观拼成一条视觉长卷。

整体的工作流也很简单:上传自己拍摄的素材,AI 会自动识别画面结构和关键元素。接下来,你只需要确认想要衔接的位置,并从剪映提供的几种转场形式中选择最合适的。

剩下的,就交给 AI 完成,它会在两段画面之间自动生成过渡,把原本生硬的切换,润色成一个自然的长镜头。很快,一条一镜到底的风光大片就出来了。

另一个可以让 AI 转场大显身手的应用场景,是营销宣发视频的制作。

这意味着,不再需要反复拍各种角度,也不用担心后期剪辑跳跃,AI 会帮你一气呵成:从场景到产品,从人设到氛围,全都在一个顺畅的镜头里完成。专业感直接拉满,哪怕是业余卖家,也能做出不输专业广告的质感。

比如下面这个案例,在手上只有三张平面照片的情况下,也能做出大片效果吗?

完全没问题,AI 会自动识别摩天轮、旋转木马、人物三个画面里的相似色彩和结构,把原本零散的片段拼接成一个连贯的长镜头。看上去就像摄影师拿着稳定器连续拍下来的,几乎察觉不到切口。

画面顺滑了,故事才真正有了连贯感。但一条好视频远不止画面流畅这么简单,声音同样决定了整体质感。剪映在配音、音乐上的进化,正在补齐创作中另一半的拼图。

我们知道,对于很多创作者来说,录音是个大难题——要么环境嘈杂,要么状态不好,录十遍也找不到感觉。现在,利用剪映的「克隆音色」功能,你直接就能拥有一个声音分身,在不同视频里都能一键调用。

从实测来看,只要上传的音频发音清晰、匀速、没有背景噪音,就能有效保证后续生成的质量。接下来,就来看看伍佰老师魂穿《武林外传》的中秋宴,为大家带来的节日祝福——

另一个惊艳的升级是「AI 配音 3.0」功能中的「超仿真音色」,直接把 AI 配音带入了 next-level。你仔细听听这个声音——它有呼吸声、有自然停顿、有情绪起伏,已经让人分不清这到底是真人还是还是 AI 。

而「翻唱改词」功能堪称音乐玩法里的隐藏惊喜。逻辑很直白:用户上传任意画面内容,AI 会自动理解素材,针对想用翻唱的歌曲进行改写,让歌词内容与画面场景高度贴合。

举个例子,当我们放入中秋团圆内容的片段时,《烟花易冷》的歌词便变换成了包含桂花、明月的文字,并且完全贴合旋律。

这种「以假乱真」的效果,也让创作者不再为版权头疼,节约修改成本,AI 几分钟搞定专业翻唱效果,成本降低但效率暴增。

无论是画面的流畅衔接,还是声音的细节打磨,剪映这些「ALL in AI」 的功能都在告诉创作者:制作不必再是费时费力、来回倒腾的繁琐任务。无论是画面还是声音的处理能力,剪映都能集于一处,而创作者要做的,就是把注意力放回故事与情感本身。

对于专业创作者精细剪辑的需求,剪映也没有忽视,而是依托于电脑端的「剪映专业版」 ,持续「听劝」升级,新增了多时间线、智能搜索、二级调色、立体声处理等高级功能,显著提升了素材处理与视频精修效率。

最近,剪映还全量上线了字节自研的 seedream4.0 模型,生图、做封面也能在剪映一站式完成。不难看出,剪映在功能的开发、升级上,就是奔着「ALL in One」的目标,基本创作中需要解决的问题,都能在剪映里找到对应的工具,创作的流畅性一下提升不少。

解放 Dirty Work,回归创作的初心

测到这里,其实答案已经非常清晰了。剪映所做的这一切,并非为了炫技,而是指向一个极其质朴的目标:将创作者从重复、繁琐的「dirty work」中彻底解放出来 。

无论是费时费力地找素材、对口型、扒字幕,还是令人头秃的配乐和转场,这些曾经消耗我们大量热情和精力的环节,如今都可以放心地交给 AI 。

这种「AI + 一站式」的定位,本质上是对整个创作流程的一次重构。

我甚至觉得剪映这个名字可能都不能完全反映这个产品新的价值,「All in AI, All in One」的剪映,不能再把它看做一个剪辑类产品,而是一个能覆盖全流程的 AI 创作工具。 它打破了过去 AI 工具功能零散、流程割裂的核心困境,将它们串联成一条完整的、无缝的创作管道 。AI 不再是那个需要你小心翼翼输入指令的「工具箱」,而是变成了藏在创作每一步的「默契搭档」和「隐形脚手架」。

对于像 APPSO 这样的创作者来说,它最实际的价值,就是让编导敢于写下那些曾因时间和技术限制而自我阉割的高光特效,甚至实现过去「不可能完成的工期」。

创作者交流会上,APPSO 还了解到,剪映上线了一款更加特别的产品——「剪小映」。它能自动分析你手机相册里的素材,在你都快遗忘的时候,主动为你生成一段段充满故事感的生活视频 。

如果说剪映的各种 AI 功能是让剪辑更加轻松、流畅,剪小映则代表的是一种更加智能的使用方式,过程中 AI 持续发挥作用,让轻松剪彻底升级为不用剪。它似乎在说:你只管去生活,去感受,记录这件事,交给我 。

最终,当 AI 承接了所有可以被标准化的劳动后,留给创作者的,便是最宝贵、也最无法被替代的东西——灵感、创意和情感的表达 。

从这个角度看,剪映的「All in AI, All in One」,不仅仅是一个产品主张,更是对所有创作者的一次告白:去创作吧,别让任何事分心。这,或许才是 AI 时代,创作最该有的样子。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


ChatGPT付费版也「变笨」了,OpenAI被曝「偷换模型」,用户炸锅|Hunt Good周报

作者 莫崇宇
2025年9月28日 19:34

欢迎收看最新一期的 Hunt Good 周报!

在本期内容你会看到:

7 条新鲜资讯
4 个有用工具
1 个有趣案例
3 个鲜明观点

Hunt for News|先进头条

💻 OpenAI 模型路由机制引发用户争议

近日,知名 X 博主 Tibor Blaho 发现OpenAI 正在未经用户同意的情况下,自动将 ChatGPT 用户的请求分流至两款未公开的「秘密模型」。

据 Blaho 透露,这两款模型分别为「gpt-5-chat-safety」和「gpt-5-a-t-mini」。前者是专门处理敏感内容的新型模型,后者则是一款敏感度极高的「违规」检测推理模型,仅需输入「违规」一词即可触发响应。

当系统判定用户的对话内容涉及敏感话题、情绪表达或潜在违规信息时,无论用户选择的是 GPT-4 还是 GPT-5 版本,系统都会自动将请求路由到这些后端模型进行处理。甚至即使是「我今天过得很糟糕」或「我也爱你」这样带有轻微情感色彩的普通表达,都可能触发路由机制。

值得一提的是,这一做法不仅影响免费用户,就连每月支付 20 美元的 Plus 用户和 200 美元的 Pro 会员也无法幸免,不少网友更是吐槽 ChatGPT 降智明显。

对此,OpenAI 副总裁兼 ChatGPT 应用主管 Nick Turley 承认 OpenAI 正在测试新的安全路由系统。他解释称,当对话涉及敏感和情感话题时,系统会切换至专门设计用于严谨处理此类情景的推理模型或 GPT-5。

此外,Turley 强调这种从默认模型切换到敏感模型的做法目前只是临时性的,并表示在用户明确询问后,ChatGPT 仍会告知当前使用的具体模型。

🔗 https://x.com/btibor91/status/1971959782379495785

⚖ 马斯克 xAI 起诉 OpenAI 涉嫌窃取商业机密

9 月 25 日,埃隆·马斯克旗下的人工智能公司 xAI 在加州北区联邦法院对 OpenAI 提起诉讼,指控该公司通过挖角关键员工的方式窃取商业机密。

此前,xAI 已在 8 月份对前员工李学晨提起诉讼。李学晨突然出售其持有的公司股份后离职,随后加入竞争对手 OpenAI,不过目前尚不清楚他是否真正开始在 OpenAI 工作。

在最新的起诉书中,xAI 指控 OpenAI「诱导」包括李学晨、早期工程师吉米·弗雷图尔以及一名高级财务主管在内的前员工窃取商业机密。

起诉书中一项重要指控是 OpenAI 试图获取 xAI 的「秘密武器」,即「xAI 能够以前所未有的速度部署具有大规模计算资源的数据中心来训练和运行人工智能」的能力。

据起诉书称,那名未具名的「高级财务主管」掌握快速建设和扩展数据中心的流程知识,并将其带到了 OpenAI。当这名主管在离职时通过邮件被质疑涉嫌违反保密协议时,他回复道「去你的」。xAI 在起诉书中附上了该邮件的截图,将其作为证据。

xAI 指控 OpenAI 作为「仅仅因为是『先行者』就快速在生成式人工智能公司中崛起为主导者」,正在进行一场「协调的、不公平和非法的活动」,有针对性地招募 xAI 的关键员工,然后「诱导」他们将商业机密带到 OpenAI。

对此,OpenAI 发言人在邮件中回应称:「这起新诉讼是马斯克先生持续骚扰行为的最新篇章。我们对任何违反保密协议的行为零容忍,也对其他实验室的商业机密毫无兴趣。」

🔗 https://sherwood.news/tech/musks-xai-sues-openai-alleging-theft-of-trade-secrets/

🪧 ChatGPT 要加广告了?

据 Sources 报道,OpenAI 新任应用程序 CEO 菲吉·西莫(Fidji Simo)希望组建一个新团队负责为 ChatGPT 引入广告业务。新团队负责人将全面负责 OpenAI 的所有盈利业务,涵盖广告和订阅服务等各个方面。

知情人士透露,西莫最近一直在与潜在候选人进行会面,其中包括她此前在 Facebook 的一些同事。目前相关谈判仍在进行中,预计新聘用的广告业务负责人将直接向西莫汇报工作。

作为补充,西莫于上个月辞去 Instacart CEO 职务后正式加入 OpenAI。

在 OpenAI 的组织架构中,西莫负责管理公司的大部分业务板块,但研究、基础设施、消费者硬件和安全团队除外,这些核心部门仍直接向 CEO Sam Altman 汇报。

🔗 https://sources.news/p/openai-ads-leader-sam-altman-memo-stargate?hide_intro_popup=true

⚙ Meta 押注「Android 式」机器人平台

Meta CTO 安德鲁·博斯沃斯在最近一次访谈中透露,在 CEO 马克·扎克伯格的直接指示下,他于今年早些时候组建了专门的机器人研究团队,目前正在开发内部代号为「Metabot」的人形机器人项目。

与市场上其他竞争对手不同,Meta 并不打算成为硬件制造商,而是计划采用类似 Google 向手机制造商授权 Android系统的商业模式。他设想 Meta 将开发完整的软件蓝图,然后向任何符合技术规格要求的公司开放授权,让更多制造商能够基于 Meta 的软件平台生产人形机器人。

在技术方面,博斯沃斯强调软件开发是当前最大的瓶颈,而非硬件本身。

他在访谈中拿起桌上的水杯解释道:「这些机器人可以站立、奔跑,甚至做后空翻,因为地面是一个超级稳定的平台。但如果让机器人尝试拿起这个水杯,它很可能会立即捏碎杯子或洒光里面的水。」这个简单的例子说明了灵巧操作仍然是机器人技术面临的最大难题之一。

为了攻克这一难题,Meta 的超级智能 AI 实验室正在与机器人团队密切合作,共同构建一个能够完成复杂手部动作仿真的「世界模型」。博斯沃斯指出,目前还不存在能让人形机器人像人类一样精确完成诸如从牛仔裤口袋中小心取出钥匙等精细动作的传感器循环系统,因此团队必须从零开始构建相应的数据集。

🔗 https://www.theverge.com/column/786759/humanoid-robots-meta

🛶 微软宣布 Copilot 助手 引入 Claude 模型,减少对 OpenAI 依赖

9 月 24 日,微软公司宣布将 Anthropic 的 Claude 模型引入 Microsoft 365 Copilot 助手。

在这项新的合作中,使用 Copilot 中 Researcher 代理功能(收集和分析信息并生成报告)的用户现在可以选择由 Claude 模型或 OpenAI 模型来响应他们的提示请求。

不过,管理员需要事先批准使用这些模型,相关使用将遵循 Anthropic 公司的条款和条件。

值得一提的是,作为 OpenAI 的主要投资者和关键云服务合作伙伴,在过去很长一段时间,微软主要依赖 OpenAI 模型为必应搜索、Windows 操作系统和其他产品提供 AI 功能。

但随着与 OpenAI 的裂痕加深,微软除了整合更多公司的大型语言模型外,微软还开始测试其自主开发的 MAI-1-preview 模型。

与此同时,OpenAI 也脱离对微软 Azure 的依赖,加速扩张合作版图,先后与甲骨文、博通和英伟达达成数百亿至千亿美元级别的巨额协议,以支撑其大规模数据中心建设。

🔗 https://www.cnbc.com/2025/09/24/microsoft-adds-anthropic-model-to-microsoft-365-copilot.html

🍎 苹果内部版 ChatGPT 曝光,为新 Siri 准备

据彭博社昨日报道,苹果正在开发一款类似 ChatGPT 的手机应用,以帮助测试和准备明年即将推出的新版 Siri。

报道称,苹果 AI 部门正在使用该应用快速评估 Siri 的新功能,包括测试搜索个人数据、执行 App 内操作(如编辑照片)。

该软件内部代号为「Veritas(拉丁语意为「真理」),目前仅供内部使用。虽然该软件没有计划面向消费者,但该 App 的功能基本上是将正在开发中的新技术从新 Siri 中提取出来,从而帮助苹果员工高效完成测试。

报道指出,即使没有公开发布,但这款内部工具也标志着苹果为 Siri 全面升级所做的准备进入了一个新阶段。新 Siri 已经经历了多轮推迟,目前计划在明年 3 月推出。

据悉,Veritas 跑的底层为苹果为驱动新 Siri 而重构的新系统,代号为「Linwood」。同时,Veritas 还依赖大语言模型(LLM),并且结合了苹果自身基础模型团队的工作成果。

另外,据 9to5Mac 日前报道,iOS 26.1、iPadOS 26.1 和 macOS Tahoe 26.1 开发者测试版隐藏的代码显示,苹果正在为 App Intents 引入 MCP 支持打基础。

🔗 相关阅读:iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」

📹 Meta 推出 AI 视频流「Vibes」,扎克伯格亲自宣传遭网友吐槽

Meta 近日宣布推出名为「Vibes」的全新 AI 视频流。

扎克伯格在 Instagram 帖子中介绍说,Vibes 将成为「艺术家和创作者制作的富有表现力的 AI 生成视频流」。该功能将在美国和其他 40 多个国家推出。

在功能设计方面,Meta 表示用户不仅可以观看 AI 生成的内容,还能创建自己的视频或对现有视频进行「混音」处理,包括添加新的视觉效果和音乐。

为了展示这一新功能,扎克伯格分享了一段 AI 制作的视频片段,标题为「爸爸试图计算 30 美元午餐的小费」,视频中一位酷似扎克伯格的父亲角色说道:「天哪… 我觉得可能至少要 6000 亿美元。」

然而,扎克伯格的宣传视频却引来了网友的嘲讽,有不少网友在其视频下方将这些由 AI 生成的视频称之为「AI 垃圾(AI slop)」。

值得注意的是,虽然 Meta 拥有自己的 AI 模型 Llama,但在 Vibes 项目中,该公司选择使用来自 AI 实验室 Midjourney 和 Black Forest 的视频生成模型。

🔗 https://www.theguardian.com/technology/2025/sep/26/cute-fluffy-characters-and-egyptian-selfies-meta-launches-ai-feed-vibes

Hunt for Tools|先进工具

👍 OpenAI 前 CTO 创业第二个成果公布

9 月 27 日,由多位 OpenAI 前高管创立的 Thinking Machines Lab(TML),正式发布了其第二篇研究论文《Modular Manifolds》,旨在从根源上让大模型训练过程变得稳定、高效。

简单来说,这项研究的核心思想是给神经网络的权重参数戴上一个几何「紧箍咒」。

传统方法往往是在模型建好后,再套用一个优化器来「管教」它。而「模块化流形」框架则更进一步,它将神经网络的每一层都视为一个有独立规则的「几何空间」(即流形),先在内部约束好参数,然后再将这些空间「拼接」起来,用一个全局的「限速器」统一协调整个网络的更新步伐。

这种「模型与优化器一体化设计」的思路,避免了网络内部参数数值的失控。根据论文中进行的小规模实验,该方法在稳定性和准确率上已展现出潜力。

该成果作者为 TML 的机器学习研究员 Jeremy Bernstein,并在 MIT 从事博士后研究工作。

本月,TML 在成立半年后,发布了其首篇重磅研究论文《Defeating Nondeterminism in LLM Inference》(克服 LLM 推理中的不确定性)。

值得一提的是,此前 TML 在「0 产品 0 用户」的情况下,估值曾狂飙至 120 亿美元(折合人民币 850 亿元)。

🔗 https://thinkingmachines.ai/blog/modular-manifolds/

👏 DeepSeek 模型再更新,真终「极」版

9 月 22 日,DeepSeek 宣布,deepseek-chat 和 deepseek-reasoner 已全面升级为 DeepSeek-V3.1-Terminus。

其中,deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式。据介绍,本次更新在延续模型既有能力的同时,针对用户反馈进行了优化。

  • 语言一致性方面,中英文混杂与偶发异常字符情况得到缓解;
  • Agent 能力方面,Code Agent 与 Search Agent 的表现进一步提升。
  • 值得一提的是,DeepSeek V3.1 模型此前在多个平台被开发者集中反馈出现「偶发极等」异常 —— 即在正常代码或文本输出中突然反复插入汉字「极」、英文「extreme」或繁体「極」等 token。虽然 Bug 的概率约千分之一,但足以导致编译失败或内容不可用。此次版本升级,应当也包含了对该问题的针对性修复。

新模型现已开源:

🤗 Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
💻 ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

📰 ChatGPT 推出主动资讯助理「Pulse」

9 月 26 日,OpenAI 宣布推出全新功能「ChatGPT Pulse」,目前已率先向移动端 Pro 用户开放预览。

官方介绍称,「ChatGPT Pulse」能够基于用户的聊天记录、反馈以及已连接的应用(如 Gmail、Google 日历),在每天早晨自动生成一组个性化的研究更新。这些内容以卡片形式呈现,用户可以快速浏览或展开查看详情。

与传统 AI 的「提问—回答」模式不同,「ChatGPT Pulse」强调主动性。系统会在夜间进行异步研究,结合用户的兴趣和历史反馈,次日推送更具针对性的建议,例如「健康晚餐食谱」「三项全能训练计划」或「会议议程草案」。

值得注意的是,「ChatGPT Pulse」的更新仅在当天有效,若用户未保存或展开查看,信息不会长期保留。官方强调,该功能的目标是「帮助用户快速获取关键信息,而不是让人无休止地刷屏」。

目前,「ChatGPT Pulse」仍处于预览阶段,未来将逐步扩展至更多用户,并计划支持更多第三方应用接入。

🔗 相关阅读:刚刚,ChatGPT 又更新了,奥特曼:这是我最喜欢的功能

🤖 Google DeepMind 发布新 AI 模型,机器人可搜索网络协助完成复杂任务

9 月 26 日,Google DeepMind 宣布推出升级版 AI 模型,能够帮助机器人能够完成更复杂的任务。

据悉,得益于由新发布的 Gemini Robotics 1.5 以及具身推理模型 Gemini Robotics-ER 1.5,Deepmind 新推出的 AI 模型能够协同工作,让机器人在物理世界中采取行动之前能够「提前思考多个步骤」。

报道称,机器人将能够完成更复杂的多步骤操作,比如按深浅颜色分类洗衣物、根据伦敦当前天气情况打包行李箱,以及帮助人们根据特定地区要求进行垃圾、堆肥和可回收物品的分类。

DeepMind 机器人部门负责人卡罗琳娜·帕拉达表示:「此前的模型能够很好地完成单一指令任务,而且具有很强的通用性。通过这次更新,我们从执行单一指令转向对物理任务的真正理解和问题解决。」

为了实现这一目标,机器人可以使用 Gemini Robotics-ER 1.5 模型来理解周围环境,并利用 Google 搜索等数字工具获取更多信息,随后将这些发现转化为自然语言指令,传递给 Gemini Robotics 1.5,让机器人能够利用该模型的视觉和语言理解能力逐步执行任务。

此外,DeepMind 还宣布 Gemini Robotics 1.5 能够帮助机器人相互「学习」,即使它们具有不同的配置。目前,DeepMind 正在通过 Google AI Studio 中的 Gemini API 向开发人员推出 Gemini Robotics-ER 1.5,而 Gemini Robotics 1.5 目前仅向部分合作伙伴开放使用。

🔗 https://www.theverge.com/news/785193/google-deepmind-gemini-ai-robotics-web-search

Hunt for Fun | 先玩

📱 打造个性化「安卓人」,Google 推出 Androidify 应用

Google 于日前正式上线全新应用 Androidify,用户可通过上传自拍或输入提示词,借助 AI 技术生成专属的 Android 机器人形象。

该应用现已在网页端及 Google Play 商店同步开放下载。

据介绍,Androidify 集成了 Gemini 与 Firebase AI Logic SDK,支持图像验证、自动生成描述以及个性化机器人生成等功能。

应用会先利用 Gemini 2.5 Flash 对用户上传的照片进行检测,确保画面清晰且符合安全标准,随后生成详细描述,并调用 Imagen 3 模型生成最终的机器人形象。

值得一提的是,最新版本还新增了「背景氛围生成」与「贴纸模式」。

前者可通过 Gemini 模型为机器人添加场景背景,后者则利用 ML Kit 分割技术去除背景,生成可在聊天应用中使用的 PNG 贴纸。

Google 表示,Androidify 的目标是让用户在轻松娱乐的同时,体验到 AI 与 Android 技术结合所带来的创造力与个性化。

🔗 https://androidify.com/

Hunt for Insight|先知

👀 OpenAI 首席科学家:氛围编码之后或许就是「氛围研究」

在 a16z 最新举行的一场访谈中,OpenAI 首席科学家 Jakub Pachocki 和首席研究官 Mark Chen 深度披露了一些在 AI 发展路径上的重要思考和未来规划。

针对当前评估指标趋于饱和的问题,Jakub Pachocki 坦承,过去几年一直使用的评估体系确实已经非常接近饱和。因此,未来 OpenAI 将重点关注模型是否能够发现新事物,并在具有经济相关性的领域取得实际进展。

Jakub 透露了 OpenAI 的一个宏大目标:培养自动化研究员,让其能够自动发现新想法。

他提到了一个有趣的衡量标准,即观察模型实际进行推理和取得进展的时间跨度。目前模型的推理水平大约能够维持 1 到 5 小时,接下来 OpenAI 将专注于延长这个时间跨度,无论是在长期规划能力还是保持记忆方面。

在 AI 编程方面,Mark Chen 将编程模型的进步与围棋选手李世石面对 AlphaGo 的经历相比,认为从解决八年级数学问题到一年后在编码竞赛中达到专业水平,这种进展是「疯狂的」。

他观察到,这种进步已经改变了编码的默认方式。现在的年轻人认为默认的编码方式是「氛围编码」,而从头开始编写所有代码反而成为奇怪的概念。他预测,氛围编码之后或许就是「氛围研究」。

在人才招聘方面,Jakub Pachocki 认为坚持不懈是关键特质。研究的本质是探索未知,很多尝试都会失败,因此必须做好失败和从失败中学习的准备。Mark Chen 补充说,研究没有捷径,需要经验来学会如何选择合适的问题。

🔗 https://www.youtube.com/watch?v=KSgPNVmZ8jQ

🤯 图灵奖得主:大语言模型是死胡同

2024 年图灵奖得主、被誉为「强化学习之父」理查德·萨顿在最新访谈中表示,大语言模型无法实现真正的智能,并将被新的架构所取代。

萨顿的核心观点是,大语言模型本质上只是在模仿人类的行为,而非真正理解世界。

在萨顿看来,真正的智能应该来自与环境的直接交互和经验学习,就像动物在自然界中的学习方式一样。他强调,动物从不接受「监督学习」,它们通过尝试行动、观察结果来学习,这是自然界中普遍存在的学习机制。

当主持人帕特尔提到大语言模型似乎已经构建了世界模型时,萨顿反驳道:「模仿说话的人并不等于构建世界模型。真正的世界模型应该能让你预测会发生什么,而不是预测人会说什么。」

萨顿认为大语言模型面临的最大问题是缺乏明确的目标。他引用约翰·麦卡锡的定义说:「智能是实现目标的计算能力。」没有目标,就无法定义什么是正确的行为,也就无法实现真正的学习。

他进一步解释:「在强化学习中,存在正确的行为,因为正确的行为就是能获得奖励的行为。我们对什么是正确行为有明确定义,所以可以检验和学习。」而大语言模型缺乏这样的评判标准,无法在实际交互中获得反馈并改进。

访谈中,萨顿还指出了当前深度学习方法在泛化能力上的根本缺陷。他认为,虽然大语言模型在某些任务上表现出色,但这种成功往往是因为只有一种解决方案,而非真正的泛化能力。

「梯度下降会让系统找到解决已见问题的方案,但如果有多种解决方式,其中一些泛化能力强,一些泛化能力弱,算法本身并不会促使系统选择泛化能力强的方案。」萨顿表示,这也就解释了为什么深度学习系统容易出现灾难性遗忘等问题。

🔗 https://www.dwarkesh.com/p/richard-sutton

♐︎ 量子计算之父:破解量子引力理论或成 AGI 评判新标准

9 月 25 日,在德国柏林阿克塞尔·施普林格公司总部举办的一场对话活动中,OpenAI CEO Sam Altman 与英国著名物理学家、「量子计算之父」大卫·多伊奇就 AGI 评判标准展开深入讨论,并达成共识。

在多伊奇看来,大型语言模型能够持续对话,主要依赖其接受的海量知识训练,而真正的智能应该体现在创造知识的能力上——即发现问题、发明解决方案、进行测试并不断改进的能力。

为了论证这一观点,多伊奇以爱因斯坦的相对论为例:「有人质疑爱因斯坦是否真正创造了相对论,还是仅仅将现有思想机械组合。我们确信他创造了相对论,因为我们了解他的研究历程、要解决的问题及其动机。」

不过,他也坦率承认,他此前认为计算机无法在不具备 AGI 的情况下进行开放式对话,但 ChatGPT 的表现颠覆了他的认知。他表示:「ChatGPT 虽非 AGI,但确实具备对话能力。」

针对多伊奇的上述观点,奥特曼提出了一个假设性问题:如果 GPT-8 能够解决量子引力问题并详述其研究故事,包括问题选择和研究动机,「这是否足以让你信服?」

多伊奇明确回应:「我认为会的。」奥特曼闻言露出微笑,表示:「我同意将此作为测试标准。」

🔗 https://www.businessinsider.com/sam-altman-predicts-ai-agi-surpass-human-intelligence-2030-2025-9

彩蛋时间

作者:@azed_ai
提示词:A low-poly 3D render of a [subject], built from clean triangular facets with flat [color1] and [color2] surfaces. The environment is a stylized digital desert with minimal geometry and ambient occlusion.
链接:https://x.com/azed_ai/status/1971892865581350967

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


刚刚,ChatGPT 又更新了,奥特曼:这是我最喜欢的功能

作者 莫崇宇
2025年9月26日 07:55

刚宣布完 1000 亿美元交易,山姆·奥特曼(Sam Altman)又憋了个大招——ChatGPT 不再是被动回答问题的工具人,而是要主动给你「投喂」内容了。

就在刚刚,OpenAI 正式为 Pro 用户(又是氪金玩家专享)推出 ChatGPT Pulse 预览版,后续会逐步扩展到 Plus 用户,最终目标是所有人使用。

它会在你睡觉的时候偷偷帮你做研究,第二天一早就以主题卡片的形式展示在 Pulse 中,给你推送个性化内容。

简单说就是:AI 版私人助理 + 个性化资讯流,而且 OpenAI 还声称不会让你无脑刷屏。

奥特曼本人则在社交媒体上发文表示:「这是我最喜欢的功能!」

(好好好,又一个最喜欢的功能。)

要知道,传统的 ChatGPT 就是个「问答机器」——你问一句它答一句,全程需要你来主导。

但 Pulse 完全颠覆了这个模式。

具体来说,每天晚上,它会根据你的聊天记录、反馈和连接的应用(Gmail、Google 日历等),自动帮你做研究。第二天一早,你就能收到一份为你量身定制的个性化更新。

比如说,你昨天和 ChatGPT 聊了「想去波拉波拉岛旅游」,它可能会给你推送当地的天气、旅游攻略或者机票折扣信息。

你提到「我家娃 6 个月大了」,它就会主动推送婴儿成长里程碑、育儿小贴士什么的。

甚至,如果你连接了日历,它还能帮你起草会议议程、提醒你买生日礼物,或者推荐出差地的餐厅。

最让人眼前一亮的是,Pulse 的设计理念完全不同于现在那些「停不下来」的 App。

ChatGPT 技术负责人 Samir Ahmed 明确表示:「这个体验是有结束的,它的设计初衷是为你服务,而不是让你停不下来地刷屏。」

每天推送的内容都是精挑细选的,看完就完了,不会让你陷入无休止的信息漩涡。而且,每条更新只在当天有效,除非你主动保存为对话或提出追问。

这简直是对现在「算法投喂」模式的一次降维打击——有用的信息主动来找你,而不是让你在海量信息里瞎找。

OpenAI 在 ChatGPT Lab 中和大学生合作测试,发现了一个有趣现象:

很多学生刚开始觉得 Pulse 一般般,但当他们开始主动告诉 ChatGPT 想看什么内容后,立马感受到了它的威力。

来看几个官方分享的真实案例:

学霸 Isaac 在和 ChatGPT 聊到旅行规划后,第二天收到了火车票预订时间的精准建议,还包含了他原本不知道的通勤信息。

潜水爱好者 Hexi 分享了自己在潜水课上的困难,ChatGPT 不仅给出了针对性建议,还把潜水和风险管理做了类比——完全 get 到了她的兴趣点。

这种「举一反三」的能力,确实有点私人助理那味儿了。

不过,这种个性化体验背后的代价可不小。要让 Pulse 真正「懂你」,你得向 OpenAI 交出大量个人数据,具体来说:

如果你在 ChatGPT 中开启了「引用历史记录」,它会查看你过去的对话来决定研究方向。

如果你已连接日历和邮件,系统会提示你确认是否允许 ChatGPT 访问这些应用,以帮助你规划日程。Kaplan 表示,用户必须点击「接受」才会生效。
虽然 OpenAI 强调「Pulse 训练数据的处理方式和普通对话完全相同。」但隐私换便利,这笔账到底划不划算?以及会不会造成「信息茧房」,对此,OpenAI 只是表示设置了「多重安全过滤」,但具体细节一概不透露。

对于很多用户来说,在人手一个「贾维斯」之前,这种「黑盒式」的隐私保护承诺实在难以令人放心。

从技术角度看,Pulse 其实是 OpenAI 向 AI 智能体(Agent)方向迈出的第一步。OpenAI 应用部门 CEO Fidji Simo 在博客中表示:

「下一个前沿就是代理——能代表你采取行动、像团队成员一样与你协作的 AI 助手。」

附上博客地址:https://fidjisimo.substack.com/p/a-new-paradigm-of-proactive-steerable

这意味着未来的 ChatGPT 不会只停留在研究和信息整理上,而是能为你自动制定计划、按照目标采取行动,并在关键时刻主动提醒。

随着这种人机交互方式的转变,传统的搜索引擎和资讯 App 或许要被狠狠上压力了。毕竟谁能拒绝一个既聪明又主动的私人助理呢?

附上 OpenAI 原博客地址:
https://openai.com/index/introducing-chatgpt-pulse/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


融资丨航星传动宣布完成数千万元A++轮融资

近日,高端控制系统装备服务商北京航星传动科技有限公司(以下简称:航星传动)宣布完成数千万元的A++轮融资,由产业方广州数科集团旗下平云资本、广州产投、湖北科投(光谷产投)联合投资。引进产业方股东后,航星传动将向产业方股东学习先进的管理、生产经验、完善升级公司管理体系,并基于产业方成熟的销售网络、客户资源和品牌影响力进一步优化公司“军民两用”伺服系统市场结构,全方位推动航星传动走上一条高质量的可持续发展道路。

航星传动的系列化伺服系统以“轻质小型化、长时高可靠”的创新设计备受业界认可,旋转舵机系列化产品的额定输出力矩从2Nm到1600Nm,直线式伺服系列化产品额定输出力从100N到150000N,水下系列舵机噪音低、耐压6000米,伺服系统控制精度高、环境适应性强、整体性能指标优异,实现了“小型化、集成化、模块化、轻量化”,满足用户极小安装空间和高性能指标的要求,成本更低,效费比更高。

航星传动已与航天科技、航天科工、航空工业、中国船舶等多家军工集团及头部民营商业火箭公司等达成合作,致力于为客户提供“更先进、更智能、更前沿”的系列产品及解决方案。航星传动的产品是可回收火箭、低空经济及水下装备领域的核心子系统,目前在性能指标上已接近甚至部分优于国际知名厂商,已被航天、航空、航海等领域多家客户验证并应用,并在航空航天、水下无人潜航器、低空经济等行业拿到了标杆客户的批量订单,未来市场空间巨大。

未来,航星传动将紧密耦合“十五五”商业航天、低空经济、深海科技发展战略,抓住“全电化”的历史性机遇,推动产业的技术变革和行业进步,迎接未来空间产业时代的到来。

查看更多项目信息,请前往「睿兽分析」。

海外卖爆的 AI 卡片在中国发售,入口比模型本身更重要

作者 张子豪
2025年9月26日 18:38

在 AI 硬件圈,有一张「小卡片」悄悄火了很久。

它像一张银行卡,厚度不到 3mm,能吸附在手机背面。这枚名为 Plaud Note 的设备,只为一件事,记录对话,并用 AI 帮助用户挖掘对话中的价值。这个简单直接的思路,让它在全球积累了超过 100 万用户。

9 月 22 日,这张小卡片背后的团队 Plaud,终于带着它和功能更强的升级版 Plaud Note Pro,在深圳召开了中国内地的首场发布会。

在国内,记录对话的 AI 产品现在看来是一片红海,前有科大讯飞这样的巨头一直深耕该领域,后有层出不穷的公司跟进,像是钉钉、Anker、360 等。

Plaud 的回归,不仅是一个产品发布,更像是新一代硬件创业浪潮的一个缩影。这些企业,它们从诞生之初就拥有全球化视野,在海外市场证明自己后,再带着技术与理念进入中国。

这份技术和理念,能否经得起国内用户的检验,一起看看他们发布了什么产品。

和 AI 的实时协同,从一张卡片开始

「意图」,这是整场发布会我听到最多的词,大模型如何理解我们的意图,大模型最想要什么,我们为什么设计这个产品?

答案都回到了「意图(intention)」,Plaud 合伙人兼中国区 CEO Peter 不断重复这个词,来解释大模型时代,不仅仅是处理原始数据,而是要理解我们的意图,才能真正突破智能的边界。

▲ Plaud 合伙人兼中国区 CEO Peter(莫子皓)

Plaud 此次的旗舰新品 Plaud Note Pro,最大的亮点在于首次实现了「人与 AI 的实时协同」 (Human-AI alignment in real time)。

想象一下,在会议中,当讨论到关键决策或重要数据时,不需要打断对话,只需轻轻一按机身上的按钮,就能实时将这个时间点,和相关信息同步给背后的大模型。

这等于在告诉 AI:「注意,这里是重点」。而通过这种方式,大模型能够更好地理解,对话的语境和我们的意图,从而生成更精准、更具洞察力的摘要。

这跟平时我们和大模型沟通,写了一大堆 prompt,是不一样的;因为我们输入的文本,是没有时间维度的。

Plaud 则是让 AI 从一个录音结束后,被动整理信息的工具,变成了在对话发生时的智能伙伴,实时地与我们的意图对齐。

为了实现高效的记录,Plaud Note Pro 在硬件上的亮点,也集中在了更丝滑和无缝的体验上。

当被问及产品为何「能用且好用」时,Peter 显得颇为自信,他提到 Plaud 创始人团队,有做手机、造机器人的,做现在的产品属于「降维打击」。

这种经验,也的确保证了基础体验的可靠,Peter 分享其他用户的体验评价,「连蓝牙那一刻,就知道这个团队不简单」,因为 Plaud 的蓝牙连接体验,同样非常丝滑。

首先是轻薄,机身是银行卡般的大小,厚度仅为 2.99mm,重量 30g。这种对极致轻薄的追求,也带来了妥协。在沟通会上,当被问到充电接口,并非通用 Type-C 的问题。

团队坦言,这是为了保证产品极致轻薄而做的取舍,但也收到了很多用户的反馈,正在努力寻找解决方案。目前采用的充电方案,是类似大部分手环的触点充电。

第二是专业的收音,Plaud Note Pro 内置 4 个全向 MEMS 麦克风阵列,配合 AI 声学波束成型技术,可在最远 5 米的范围内,实现录音棚级的音频捕捉。

对比前代产品,Plaud Note Pro 还可以通过算法自动识别,录音环境是电话通话,还是面对面对话,而不需要手动切换录音模式。续航方面,单次充电可支持最长 50 小时的连续录音,满足一周的工作需求。

硬件作入口,软件是核心

「能不能不买你们的硬件,只用你们的软件?」

面对这个问题,Peter 的回答很坚决:「我们不做这种事情。」

他认为,做单纯的软件服务会分散精力,更重要的是,Plaud 坚信软硬件结合才能提供最佳的智能体验。

这背后,是 Plaud 「AI 原生科技公司」的自我定位。硬件只是捕捉信息的入口,真正的处理和价值生成,都发生在云端的 AI 引擎 Plaud Intelligence 中。

▲ Plaud 网页版首页

对比前代,除了音频,现在还可以捕捉文本、图片信息,并结合「一键标记」功能,为 AI 提供更丰富的上下文,具备多模态能力。

其次就是和大部分 AI 纪要产品、以及通义听悟类似的功能,通过优化整合 DeepSeek R1、千问、豆包等多个大模型,将语音转写成文字,还能区分不同的发言人,并支持多达 112 种语言。

在模型的选择上,Plaud 的策略并非「兼容并包」,而是「只支持最好」。

Peter 坦言,在中文转写上,国内模型表现更好;但在更深层的因果关系和深度思考上,海外顶尖模型仍有优势。但他们仍然坚持使用「最贵、最好」的模型和服务,因为「更好的价值」本身就是产品的核心,而非成本。

基于在海外的两年运营,Plaud 内置了从全球 3000 多个模板中优选出的专业模板,覆盖不同行业和领域。它可以根据你的角色和习惯进行智能推荐,从多个视角分析对话,提供更丰富的总结。

▲ 模版社区

最后一项是 Ask Plaud,和知识库的 AI 问答一样。我们可以基于录音的完整上下文,向 AI 进行深度提问,所有答案都能追溯到录音文件具体的信息来源。新版本还增加了智能建议追问、跨文件查询等功能。

以上所有功能,用户都可以通过 Plaud APP(支持 iOS 和 Android)及网页端来实现。

多款海外产品首次在中国区推出

除了旗舰 Plaud Note Pro,Plaud 还带来了另外两款针对不同场景的产品,它们都支持全新升级的 Plaud Intelligence,也同样是需要配合手机 App 使用。

Plaud NotePin S,可穿戴的 AI 纪要产品,它的前代是已经在海外发售的 Plaud NotePin,目前这款在中国区首发的新品,主打「解放双手,随心记录」。

主要的特点是,它可以通过项链、手环、背夹、磁吸片等多种方式佩戴。同时,它的重量只有 17.6g,拇指般大小,但续航也做到了 40 天待机,和 20 小时连续录音,并配备 64GB 存储。

Plaud Note,卡片式 AI 纪要开创者,这是一款在 2023 年就推出的产品,而到现在,市面上已经有相当多的公司,在做同样类型的卡片式 AI 纪要产品。

尽管 Plaud Note Pro 在性能上提升明显,但据 Plaud 合伙人兼全球销售负责人 Raymond 介绍,经典款 Plaud Note 在海外依然维持着非常高的销量,因为「有很多消费者,还是喜欢这种机械拨动的形态」。

▲ Plaud 合伙人兼中国区 CEO Peter 莫子皓(左);Plaud 合伙人兼全球销售负责人 Raymond 孙驰(右)

当被问到如何在国内众多同类产品中脱颖而出时,「用户价值」是创始人提到最多的词。他认为,为用户带去 SOTA(最佳)的体验,是 Plaud 应对竞争的态度 。

目前,Plaud Note Pro、Plaud Note、Plaud NotePin S 三款产品,已经在国内主要电商平台发售,具体的发售价格如下。

▲ Plaud Note 1149 元,Plaud Note Pro 1299 元,Plaud NotePin S 1249 元

而针对每款设备都能用上的 Plaud Intelligence,也有标准版、专业版、和卓越版三个会员计划,主要的区别体现在,可录音的时长限制,分别是 300 分钟、1200 分钟、和无限时长,对应的价格是免费、339/年、和 1099/年。

而国内版和国外版的 Plaud Intelligence 订阅价格也有所不同,国际版配置了像 Gemini 2.5 Pro、GPT-5、以及 Claude 4 这些模型,所以专业会员的订阅价格是在 99.99 美元(人民币 700 多),而国内版则是 DeepSeek、豆包、千问等模型。

APPSO 也第一时间拿到了 Plaud Note Pro 产品,根据发布会现场透露的信息,Plaud Intelligence 将在下个月更新跨平台同步、多维度解读等多项功能。我们也会在更新之后,同步分享我们的使用体验。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


夸克正式上线全新AI图像与视频创作平台「造点」

2025年9月25日 13:04

它更懂中国元素,亚洲人像和中文设计排版都稳稳拿捏。「造点」还首次集成了 Midjourney 模型,让你轻松拥有大师质感出品。
实用性是「造点」的亮点,海报、店招、包装、文创等场景,将灵感快速变为商业级素材。视频生成接入最新万相 2.5 模型,原生声画同步输出,一键就能「造点」高能大片。
从现在开始,用想象「造点」不同。

来,看个视频,放松下。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


模型七连发刷新 SOTA ,中国正在诞生 AI 时代的 Android

作者 艾 梵
2025年9月24日 18:23

6 亿次下载,17 万个衍生模型,服务超 100 万家客户。

在 AI 大战最为激烈的 2025 年,全球使用最广泛的开源 AI 模型,来自阿里的通义大模型。毫不夸张地说,当全球开发者需要一个免费、好用、没有商业限制的模型时,它几乎成了默认选择。

而在今天的云栖大会上,七款通义大模型家族新成员集中亮相,覆盖语言、视觉、语音、多模态、代码等多个方向,从开源生态到商业服务,几乎囊括了当下 AI 应用的所有关键环节。

这七款模型分工明确:Qwen3-Max 承担「天花板」角色,万亿参数对标全球最强模型;Qwen3-Next 主打「普惠」,用小轿车油耗跑出跑车性能;Qwen3-VL 让草图秒变代码,Qwen3-Omni 做全模态助理,Qwen3-Coder 专攻编程,Wan2.5-preview 实现电影级视频创作,通义百聆 Fun 提供上百种音色服务。

阿里巴巴集团 CEO 吴泳铭直接公布了阿里云的两大路线图:一是通义千问坚持开源开放,目标成为「AI 时代的 Android」;二是构建「下一代计算机」——超级 AI 云,为全球提供智能算力网络。

回头看,阿里可能做对了这个时代最重要的一个判断:AI 公司不仅要讲述超越人类智能的故事,更要讲述让每个人都能拥有 AI 的故事——而后者,或许更有想象力。

从模型到生态,通义千问的全家桶来了

模型七连发,通义千问大模型家族这次具体亮出了哪些「新牌」?梳理下来,看上去琳琅满目,其实主线很清晰:两张王牌,再加一桌子硬菜。

▲发布会上多个模型已经在 Hugging Face 上开源

第一张王牌,是 Qwen3-Max。

这是阿里的「天花板担当」,总参数超过万亿,预训练使用 36 万亿 tokens。在架构上还是延续 Qwen3 系列的 MoE 设计,但在训练手法上做了很多改进。

比如用全局负载均衡和流水并行,让训练过程更稳定,不会出现异常波动;效率比上一代快了 30%;还能支持 100 万字级别的长文本;就连大规模集群里常见的硬件故障,也把时间损耗压缩到原来的五分之一。

划重点:

▲旗舰模型 Qwen3 -Max 大幅提升编程和智能体能力,在多个基准测试中表现亮眼)

  • Qwen3-Max-Base:强调大规模高效训练,长上下文和稳定性突出。
  • Qwen3-Max-Instruct:已在 LMArena 文本榜单排名全球前三,超过 GPT-5-Chat。在代码测试 SWE-Bench Verified 上拿到 69.6 分,在智能体工具调用基准 Tau2-Bench 上以 74.8 分超越 Claude Opus 4 和 DeepSeek-V3.1。
  • Qwen3-Max-Thinking (Heavy):推理增强版,结合代码解释器与并行计算,在 AIME 25、HMMT 等高难度数学推理基准上取得 100% 正确率,展现出极强的推理潜力,尚在训练中。

整体来看,Qwen3-Max 把工程体系、训练效率、长上下文、推理能力和智能体任务一并拉升到了全球顶尖水准。它在代码和推理基准上的成绩,说明中国模型正在真正进入可以与最强对手正面对话的阶段。

第二张王牌,是 Qwen3-Next。

如果说 Max 是阿里的面子,Next 就是它的里子:真正让开发者和企业用得起、跑得动。

大模型通常存在「不可能三角」——高性能、低成本、易部署,三者难以兼得。顶级性能的模型(如 GPT-4/5)往往意味着高昂的推理成本,成为 AI 普及的最大障碍。

▲Qwen3-Next 训练效率和推理效率均得到大幅提升

而阿里的解法,就是用 Qwen3-Max 把性能的「天花板」捅破,再用 Qwen3-Next 把成本的「地板」砸穿。

它通过高稀疏度 MoE、混合注意力等下一代架构创新,用 3B 的激活参数,达到了 235B 密集模型的性能 ,相当于用一辆小轿车的油耗,跑出了跑车的性能。最终结果就是训练成本暴降 90%,长文本推理效率提升十倍。

▲ Qwen3-Next 采用了全新的下一代模型架构,结合线性注意力和标准注意力,Gated Delta Networks 的作者 Songlin Yang 转发 Qwen 推文

这种体系化的能力,让「人人都能用上 AI」的愿景从口号变为现实,也远比单纯发布一个高性能模型更具产业颠覆性。

一桌硬菜:能想到的活它都包了

▲Qwen3-VL 视觉语言模型在多个基准测试中,性能表现超过 Gemini 2.5 Pro

  • Qwen3-VL:视觉模型重磅开源,从「识图」进化到「推理与执行」,能操作电脑手机界面,也能把一张草图直接生成 HTML / CSS 代码。对很多产品经理来说,这意味着「所见即所得」真的成了现实。
  • Qwen3-Omni:全模态选手,能同时处理文本、图像、音频和视频。在 36 项公开评测里拿下 32 项开源第一,22 项达到 SOTA。还能实时语音对话,甚至自定义人格,像是给你配了一个会讲十几种语言的随身助理。

▲ Qwen3-Omni 在全方位性能评估中,多项测试超越 Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe 等闭源模型

  • Qwen3-Coder:编程模型升级,速度更快,代码更安全,能直接帮你部署一个完整项目,修 bug 也不在话下。对开发者来说,它更像是一个随时在线的「结对编程伙伴」。
  • Wan2.5-preview:AIGC 方向的杀手锏。文生视频、图生视频、文生图和图像编辑都更强了,最关键的是,第一次实现了「音画同步」的电影级视频生成。从 5 秒到 10 秒、1080P、24 帧,这已经不是玩具,而是一个可以让个人创作者拍短片的工具。

此外,还有语音大模型通义百聆 Fun 家族,能提供上百种音色,覆盖客服、直播、电商和有声书等场景。以及基于 Qwen3,为全球实时 AI 安全构建的安全审核模型 Qwen3Guard;和实时多模态翻译模型 Qwen3-LiveTranslate-Flash 等。

把这些放在一起看,你会发现阿里在传递一个很直接的信号:想要极致性能?有 Max。想要极致效率?有 Next。想要多模态探索?有 VL 和 Omni。想要代码和创作的生产力?有 Coder 和 Wan……

▲Qwen3-Omni 是新一代原生全模态大模型,能够无缝处理文本、图像、音频和视频等多种输入形式,目前已经可以在 Qwen Chat 中通过语音和视频聊天启用

这不是简单的「堆新品」,而是一整套全尺寸、全模态的生态拼图。阿里把它们一次性交到用户手里,像是在告诉所有企业、个人、还有开发者:不管你在做什么,通义模型家族,总有一块积木能搭得上。

但这场「全家桶式发布」的意义,并不只在于产品层面的丰富。透过模型七连发的齐齐亮相,可以更清楚地看到,通义千问模型家族已经覆盖全尺寸、全模态,款款都在主流评测上立住了 SOTA。

也正是基于这种厚实的路径,换来的是一种独特的行业地位。正如阿里巴巴集团 CEO 吴泳铭在今天发布会上所说:「通义千问,可以说是渗透全球计算设备最广泛的大模型。」

▲在全球最大的 AI 模型开源社区Hugging Face 上,输入关键字「qwen」,有超过 16 万相关的模型,且下载量均在百万级别,目前 Qwen 系列模型最高下载量达到 700 万(Qwen2.5-3B-Instruct)。

截至目前,通义千问开源了三百多款模型,覆盖了全模态全尺寸,是中国应用最广泛而且最受全球开发者欢迎的开源模型。通义大模型全球下载量超过 6 亿次,衍生模型超过 17 万个,是全球第一的开源模型矩阵。

显而易见,在这个依然由国际巨头主导的大模型赛道上,一个来自中国的开源模型家族,正在以自己的方式刷着「存在感」,也在刷新国产 AI 的历史地位。

大模型下半场,通义千问要成为 AI 时代的 Android

2019 年,阿里在 M6 上试水 10 万亿参数模型时,整个行业对于「大模型」这个概念更多还停留在学术讨论的层面,距离产业化仍有距离。四年后,通义千问的正式发布标志着一个拐点的到来。

从 Qwen-7B、14B 到 72B,再到今天的万亿参数,Qwen 走的路径并不花哨,就是不断扩大规模、优化、验证,把一个模型家族一点点撑开。

2024 年的 Qwen2 与 Qwen2.5 以及今天发布的 Qwen3-Max 模型总参数超过 1T,预训练使用了 36T tokens,代码能力和智能体(agent)能力方面进一步提升。

而在大模型逐渐走向下半场,开源模型也成为不可逆转的趋势。中国则几乎成为全球开源里最重要的角色,其中以阿里和 DeepSeek 两家公司的戏份最重。

吴泳铭对此直言不讳:「在 LLM 时代,开源模型创造的价值和能够渗透的场景,将会远远大于闭源模型」。

全球的大模型公司各有侧重,有的主要服务自家生态,有的为社交和广告业务添砖加瓦。有的聚焦于工具化和用户增长,有的强调全模态整合,绑定搜索。而阿里则想成为那个「AI 时代的 Android 系统」。

Android 的成功,不在于它比 iOS 更强更完美,而在于它能适配从几百块的老人机到上万块的折叠屏,让智能手机市场真正百花齐放。

Qwen 的逻辑如出一辙。从0.5B 到万亿参数的「全尺寸」Qwen3-Max,从写代码的 Qwen3-Coder 到能「看图写代码」的Qwen3-VL,再到能听会说、音画同步的通义万相和通义百聆,甚至那个像真人一样能实时语音对话的Qwen3-Omni,阿里几乎把开发者能想到的所有工具都备齐了。

这背后是一种思路的转变:阿里不再替你决定「应该用什么」,而是把选择权、定义权,乃至最终的成本控制权,都交还给了市场。

而 Qwen 则去扮演那个最苦最累但又无可替代的角色——AI 时代的 Android 系统,让 AI 应用和场景落地提供基础「水电煤」。

实际上已经有超过 100 万家企业通过阿里云接入通义大模型的服务。就像接入水电一样,把 AI 当作最基础的生产力。而苹果国行 AI 虽然一再推迟,但也基本已经确定与 Qwen 合作,这是中国大模型第一次进入 iPhone。

今天云栖大会上吴泳铭也宣布,未来三年阿里将投入超 3800 亿元,用于云和 AI 硬件基础设施建设,并计划追加更大的投入。根据远期规划,为了迎接 ASI 时代的到来,对比 2022 年的 GenAI 元年,2032 年阿里云全球数据中心的能耗规模将提升 10 倍。

这也是阿里云从 2022 年开始坚持的「模型即服务」(MaaS)。它将大模型定位为生产力的核心要素,依托阿里云的算力和基础设施,为企业提供高性能、低成本的 AI 能力。

当一个平台尝试去降低整个社会的创新门槛,其所能托举的,就不仅仅是自身的商业价值。

对于在「用谁家的模型」这个问题上纠结的开发者和企业来说,一个开放、便宜、还好用的「AI Android」系统的出现,就相当于回到大航海时代,有人为你建好了出海的港口,还顺手把全世界的航海图都开源了。

除了扬帆起航,似乎也别无他选。

作者:李超凡、张子豪、莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


早报|苹果已关闭iOS 18降级通道/罗永浩:将评测预制菜/卢伟冰:小米17 Pro Max有「2K级」的显示效果

作者 Shawn Rain
2025年9月24日 09:02
cover

⬇

苹果已关闭 iOS 18 降级通道

⚡

上市公司紧急回应「汽车热失控自动弹出电池」视频

🚗

英伟达回应与 OpenAI 合作:仍将以所有客户为优先

📱

20 周年 iPhone 或将搭载更亮的屏幕

🎯

OpenAI、甲骨文与软银宣布在美国新建五大 AI 数据中心

🗺

全国餐饮商家可免费入驻高德

💬

OpenAI 在印尼推出 ChatGPT Go

🎤

雷军谈年度演讲推迟至本月:内容太多

📶

美宜佳首款鸿蒙「碰一下」智慧收银机亮相

💰

货拉拉回应被约谈

🚗

广汽法务部:坚决追究造谣者法律责任

💬

罗永浩:将评测预制菜

💡

YouTube CEO:AI 是「下一次大爆炸」

📱

OPPO Find X9 外观公布

🖌

卢伟冰:小米17 Pro Max 有「2K级」的显示效果

📸

尚界 H5 与全新问界 M7 同台亮相

💬

1998 元起,大疆发布 Osmo Nano 自由视角穿戴相机

🔋

支持 8K 拍摄,GoPro MAX 2 全景运动相机发布

🔧

阿里云发布首个端到端全模态 AI 模型

🥤

特斯拉简化版 Model Y 被曝光,配置大幅精简

重磅

苹果已关闭 iOS 18 降级通道

苹果固件网站 ipsw.me 显示,苹果已停止对 iOS 18.6.2 进行签署验证,这意味着一旦设备升级至 iOS 26,将无法回退至 iOS 18 系列版本。

所谓「签署」,是指系统在安装过程中需通过苹果服务器的验证检查,未通过验证的固件无法安装。

停止签署后,用户将无法降级至旧版。

目前,用户仍可继续使用 iOS 18,但一旦升级至 iOS 26,就无法降级。

此外,苹果还停止签署了 iPadOS 18.6.2 和 tvOS 18.6,iPad 同样无法回退至旧版本。

据悉,苹果在 iOS 26 上引入了全新的「Liquid Glass」设计语言,并带来多项功能更新。

此外,苹果还在昨天推送了 iOS 26.1 Developer Beta 版本。

大公司

「拴 Q」,台风前夕腾讯把企鹅拴住了

9 月 23 日下午,广东地区在台风来临前夕出现了颇具网络话题性的「拴 Q」事件。

腾讯方面在微信公众号发布文章《拴好自己,大家注意安全!》,配图为企鹅形象被「拴住」,并配文提示「赶紧把自己绑好,不然飞走了就真的拴 Q very much」,呼吁用户注意安全。

广东多地气象部门此前已发布台风黄色预警,建议居民加固门窗、收纳室外物品,并避免在强风暴雨期间外出。

上市公司紧急回应「汽车热失控自动弹出电池」视频

据红星新闻报道,近日,一段展示「汽车电池热失控时自动弹出」的演示视频在网络热传。

视频显示,9 月 19 日,一辆车身贴有「中国碰撞维修技术中心」标识的车辆,在模拟电池热失控场景时,将电池抛出车身约 3-6 米,实现车电分离。

视频信息称,该技术由「中国碰撞维修技术中心」与均胜电子联合推出。

然而,该演示迅速引发争议,有网友质疑「把活命留给自己,把灾难弹射给众人」,甚至用「死道友不死贫道」形容。

9 月 22 日,均胜电子向媒体回应称,公司与「中国碰撞维修技术中心」不存在任何形式的合作开发协议。

公开资料显示,宁波均胜电子股份有限公司是一家全球智能汽车科技解决方案提供商,业务涵盖智能座舱、智能网联、智能驾驶、新能源管理及汽车安全系统等领域,在全球设有 19 个研发中心和超过 50 个生产基地。

据知情人士透露,「中国碰撞维修技术中心」隶属于麦特集团,该集团成立于 1992 年,主营汽车后市场业务,旗下拥有威力狮(Welion)、奔腾(BANTAM)、MAXIMA 等品牌。

英伟达回应与 OpenAI 合作:仍将以所有客户为优先

据彭博社报道,英伟达在昨天发布声明称,其与 OpenAI 达成的 1000 亿美元 AI 基础设施合作意向,不会影响对其他客户的供货与支持。

英伟达强调:「我们的投资不会改变关注重点或影响对其他客户的供应,我们将继续让每一位客户保持最高优先级,无论是否存在股权关系。」

当天早些时候,英伟达与 OpenAI 宣布已签署合作意向书,计划建设配备英伟达芯片的数据中心,总功率至少达到 10 吉瓦,用于开发和运行人工智能模型。

近年来,英伟达芯片在硅谷成为最抢手的硬件资源,数据中心运营商争相采购,推动公司销售额与股价持续飙升,市值已接近 4.5 万亿美元。

尽管如此,英伟达的营收仍高度依赖微软、Meta、亚马逊和 Alphabet 等少数大型客户,这些公司正加速自研或部署替代组件,以降低对英伟达的依赖。

20 周年 iPhone 或将搭载更亮的屏幕

据 MacRumors,有产业链人士透露,苹果计划在 20 周年纪念版 iPhone 上引入由三星供应的全新 OLED 技术 COE(Color Filter on Encapsulation),以实现更高亮度和更纤薄的机身设计。

据悉,传统 OLED 面板在显示层上方会增加一层偏光片,用于减少反射、提升对比度,但该结构会吸收部分自发光,降低亮度与能效。

COE 技术则直接将彩色滤光层覆盖在封装保护层上,取消偏光片,从而减少显示堆叠厚度,让更多光线透出,在不增加功耗的情况下提升亮度。

业内分析指出,去除偏光片后,屏幕在户外的反射与眩光控制将更具挑战,苹果预计会采用先进镀膜与像素级材料优化可视效果。

另有消息称,苹果正考虑为 20 周年纪念版打造四边曲面、无边框的全新外观设计,并在 2026 年率先推出首款可折叠 iPhone。

OpenAI、甲骨文与软银宣布在美国新建五大 AI 数据中心

今天凌晨,OpenAI 在官网发布新闻稿,称 OpenAI、甲骨文与软银将联合,在美国新建五个 AI 数据中心站点,进一步扩展「星际之门(Stargate)」基础设施平台。

随着这些新站点的加入,Stargate 的规划总容量已接近 7 吉瓦,相关投资规模超过 4000 亿美元,预计将在 2025 年底前实现最初提出的 5000 亿美元、10 吉瓦目标。

根据官方信息,此次公布的五个新站点分布在德克萨斯州 Shackelford 县、新墨西哥州 Doña Ana 县、中西部某地(尚未公布)、俄亥俄州 Lordstown,以及德克萨斯州 Milam 县。

其中,部分站点由甲骨文主导建设,另有两个站点由软银及其旗下 SB Energy 参与开发。

OpenAI 首席执行官 Sam Altman 表示:「AI 的潜力能否实现,取决于是否具备足够的算力支撑。星际之门正在为这一目标奠定基础,并推动下一阶段的突破。」

甲骨文首席执行官 Clay Magouyrk 称:「我们正在以前所未有的速度扩展 OCI 的布局,以满足快速增长的 AI 训练与推理需求。」

软银集团董事长兼首席执行官孙正义则指出:「Stargate 正在结合软银的数据中心设计与能源优势,为 AI 的未来提供可扩展的算力。」

据悉,Stargate 计划自今年 1 月启动以来,已吸引超过 30 个州、300 余份提案参与竞争。此次公布的五个站点为首批入选项目,后续仍将有更多地点加入整体投资计划。

全国餐饮商家可免费入驻高德

高德昨天宣布,现在全国餐饮商家可免费入驻平台,并享受为期一年的入驻年费全免政策。

官方表示,此次举措旨在帮助餐饮行业「多来客、好经营」,并同步推出流量扶持、专属客服、智能收银等多项配套服务。

高德方面指出,未来将持续倾听商家反馈,优化平台功能与服务体验,助力餐饮商家提升运营效率与顾客满意度。

商家可通过高德地图 APP 搜索「免费入驻」或拨打 400-9039-658 了解详情并快速办理入驻手续。

OpenAI 在印尼推出 ChatGPT Go

TechCrunch 报道,继在印度上线后,OpenAI 将其面向大众的 ChatGPT Go 订阅计划扩展至印度尼西亚市场。

该计划定价为 75,000 印尼盾/月(约 32 元人民币),定位介于免费版与每月 140 元的 ChatGPT Plus 之间。

据介绍,ChatGPT Go 用户可获得比免费版高 10 倍的使用额度,用于发送提问或提示、生成图片以及上传文件。

同时,该计划支持更好地记忆过往对话,从而在长期使用中提供更具个性化的回应。

OpenAI ChatGPT 产品负责人 Nick Turley 表示,自印度推出该计划以来,付费用户数量已超过两倍增长。

此次扩展也使 OpenAI 在印尼市场直接对标 Google。

本月早些时候,Google 推出了价格相近的 AI Plus 订阅服务,提供 Gemini 2.5 Pro 聊天机器人,以及 Flow、Whisk、Veo 3 Fast 等图像与视频创作工具。

雷军谈年度演讲推迟至本月:内容太多

在今年第 6 次年度演讲开始前,雷军在微博发布短视频,回应了外界关心的多个问题。

他表示,世界变化很快,小米也在快速变化,「每年办一次年度演讲,就像做一次年度总结,挺有趣的」。

对于今年演讲比往年晚的原因,雷军透露,原计划是 6 月与小米 YU7 发布会同步举行,但由于发布会内容过多、时长过长,临时推迟到 9 月,与小米 17 系列年度旗舰一同发布。

谈及为何有如此多观众愿意听他的演讲,雷军坦言「其实我自己也不知道」,并感谢所有朋友的捧场,欢迎大家在评论区留言分享原因。

据悉,今年雷军年度演讲的主题为「改变」。

视频中,雷军认为人的命运并非命中注定,「别人觉得你行不行不重要,关键是你自己有没有勇气、有没有决心去试一试」。他强调,只要不断尝试、努力、成长,就有机会「逆天改命」。

在被问及近几年自身最大的变化时,雷军表示是「认知」的提升和改变,「过去几年小米发生了翻天覆地的变化,本质就是我们的认知发生了变化」,并计划在年度演讲中与大家深入探讨这一话题。

美宜佳首款鸿蒙「碰一下」智慧收银机亮相

支付宝开放平台昨日宣布,美宜佳近日与华为云、支付宝在上海签署联创合作协议,三方将整合优势资源,共同打造智慧零售标杆解决方案。

作为合作的重要成果,美宜佳率先推出首台搭载「碰一下」交互技术的鸿蒙智慧收银机,并计划陆续在全国多家门店投入使用。

根据协议,美宜佳将依托全国超 40000 家门店网络,结合华为鸿蒙系统及生态技术支持,以及支付宝在数字经营与支付领域的成熟能力 —— 包括「碰一下」等创新交互技术,推进全店智能运营体系建设,实现消费者体验与门店效率的双提升。

「碰一下」是支付宝于 2024 年推出的创新交互方式,用户无需打开 App,解锁手机后轻触设备或贴纸即可完成支付或获取服务。

三方表示,未来将分阶段推动智能设备升级、账号体系互通与会员运营优化,并探索支付、广告等多场景的智能化创新,打造可规模化复制的智慧门店样板,推动行业数字化加速。

芬兰智能戒指厂商 Oura 将融资近 9 亿美元

据彭博社报道,芬兰健康科技公司 Oura Health Oy 近日正在进行新一轮融资,预计将筹集约 8.75 亿美元,投后估值约为 109 亿美元。

据知情人士透露,本轮融资为 E 轮,估值较去年 11 月 D 轮的 50 亿美元几乎翻倍,最终融资额或超过 9 亿美元。

Oura 计划将资金用于扩大产能、加大研发投入并加速国际市场布局。

今年以来,该公司已在日本和德国推出最新款 Oura Ring 4,并计划进一步拓展全球销售网络。

公司 CEO Tom Hale 在接受采访时表示,Oura 业务增长「如同火箭般迅速」,并称这是其 130 个季度商业生涯中「最强劲的一个季度」。

他预计 2025 年营收将超过 10 亿美元,较 2024 年的 5 亿美元翻倍,2026 年有望突破 15 亿美元。

除融资外,Oura 还与包括美国银行、富国银行、摩根大通、高盛、花旗和巴克莱在内的多家银行签署了 2.5 亿美元循环信贷协议。

在智能戒指市场,Oura 仍是领先者,但竞争正逐步加剧。

三星去年推出 Galaxy Ring 反响平平,Amazfit、Velia、Ultrahuman 等初创公司也已入局。

Hale 表示,戒指将继续作为公司核心产品形态,并称其在「佩戴舒适度、时尚性与精确度」方面具备优势。

货拉拉回应被约谈

昨天,市场监管总局约谈货拉拉,要求其严格遵守《中华人民共和国反垄断法》等法律规定,落实反垄断合规主体责任,及时规范经营行为,公平参与市场竞争,维护货车司机、消费者等相关主体合法权益。

监管部门指出,平台需推动规则与算法公平、公正、公开、透明,确保行业健康有序发展。

当天晚间,货拉拉对此事进行了回复,表示将全面接受并落实约谈要求,立即启动整改,提升反垄断合规管理水平,依法合规经营,公平参与市场竞争。

广汽法务部:坚决追究造谣者法律责任

多部门近日联合发布《关于开展汽车行业网络乱象专项整治行动的通知》,决定在全国范围内开展为期 3 个月的专项整治行动。

广汽集团法务部昨天在微博发文表示,近期网络上有部分未经证实的信息传播,影响品牌形象并扰乱正常网络秩序,广汽集团已固定相关证据,将视情节依法向公安机关报案,并「坚决追究造谣者的法律责任」,以维护合法权益。

罗永浩:将评测预制菜

罗永浩在社交平台发文称已回到上海,并表示「我爱上海」,同时回应外界「跑路」猜测,称此次只是正常出差。

当天,他晒出餐厅用餐照片,再次谈及预制菜话题,称商场连锁餐厅也可以有现炒菜,并表示将评测市面在售的大部分预制菜。

此前,罗永浩因批评西贝使用预制菜未告知消费者且定价虚高,被西贝创始人贾国龙起诉「损害商誉」,双方争论引发舆论关注。

有网友发现其微博 IP 属地曾在 9 月中旬变为「中国香港」和「日本」,引发「避险跑路」猜测。罗永浩转发相关言论并回复「我来,赌什么?」

像素蛋糕宣布基础调色与手动工具永久免费

日前,AI 修图软件「像素蛋糕」官方宣布,旗下像素系列产品的基础调色功能与手动工具将改为永久免费开放,用户无需额外付费即可使用。

据介绍,此次调整涵盖基础色彩校正、亮度与对比度调节等常用功能,同时保留原有的手动修图工具集。

官方表示,此举旨在降低创作者的使用门槛,并提升整体创作体验。

💡 YouTube CEO:AI 是「下一次大爆炸」

据 Wired 报道,YouTube 在成立 20 周年之际宣布全面拥抱人工智能技术,推出多项面向创作者的 AI 功能。

官方表示,这些工具将帮助用户通过提示词生成视频内容,并可自动为播客音频生成匹配的视觉画面。

YouTube CEO Neal Mohan 在接受采访时回顾了平台的成长历程,并强调 AI 是延续「让更多人发声」这一核心使命的最新技术手段。

当 YouTube 诞生时,技术让更多人能够被听到;如今 AI 也是同样的原则 —— 用技术来让创作更普惠。

据悉,部分新功能基于 Google DeepMind 的 Veo 3 技术,支持即时生成复杂场景视频,例如「在月球上的 100 位印尼舞者」。

平台将对 AI 生成内容进行标注,但目前没有提供过滤选项。Mohan 认为,AI 视频的价值取决于创作者的原创性和创意,而非生成比例。

新产品

OPPO Find X9 外观公布

OPPO Find 系列产品负责人周意保昨天在微博正式公布了 Find X9 系列的完整外观与核心设计亮点。

周意保表示,该机定位顶级旗舰,重点在于质感升级与细节优化:

  • 全新「绒砂工艺」:采用微米级精度控制,让玻璃呈现高级内敛的绒感金属光泽,并带来细腻亲肤的触感;
  • 冷雕工艺消除拼接感:镜头模组与背板通过超精密冷雕工艺实现无缝衔接,整体观感更自然;
  • 黄金握持尺寸直屏:延续 6.59 英寸与 6.78 英寸直屏设计,并采用超大弧度边框,提升握持舒适度;
  • 极窄四等边 + 全场景 1nit 明眸护眼屏:物理四等边黑边进一步收窄,搭配新一代护眼屏,视觉效果更沉浸;
  • 轻薄机身兼顾影像与续航:全系搭载哈苏四摄影像系统,方形镜组在控制凸起的同时提升进光量。

电池容量方面,标准版为 7025mAh,Pro 版达 7500mAh,并保持均衡配重。

配色方面,Find X9 提供「绒光钛」「霜白」「雾黑」,Find X9 Pro 提供「绒砂钛」「霜白」,另有一款特别配色尚未公布。

官方此前公布,该系列将于 10 月 16 日正式发布。

卢伟冰:小米17 Pro Max 有「2K级」的显示效果

小米集团总裁卢伟冰昨天在社交平台透露,小米 17 Pro Max 首次采用「超级像素排列」技术。

他介绍道,该方案为每颗像素配备独立的红、绿、蓝三色子像素,相比传统 OLED 无需借用相邻子像素。虽然屏幕分辨率在数值上未达到 2K,但子像素总量高达 938 万,与 2K 水准相当

卢伟冰指出,内部曾对这一方案存在较大争议。2K 屏幕已在市场存在十年,是超清显示的代名词,放弃 2K 在数值上意味着「回退」。

此外,昨天下午,小米官方还在微博发布小米 17 系列宣传海报,称小米 17 系列全面兼容 100W PPS 通用充电协议。

据此前报道,小米 17 系列将全球首发第五代骁龙 8 至尊版移动平台,小米 17 Pro 和 Pro Max 将配备 5000 万像素徕卡超大底后置三摄和全新背屏设计。

尚界 H5 与全新问界 M7 同台亮相

9 月 23 日晚,华为在秋季新品发布会上推出两款智能汽车新品 —— 尚界 H5 与全新问界 M7,进一步丰富鸿蒙智行产品矩阵,覆盖从十几万元到三十万元以上的市场区间。

据介绍,尚界 H5 是华为与上汽集团合作打造的「尚界」品牌首款车型,起售价 15.98 万元,定位 20 万元以下智能汽车市场。

全新问界 M7 则在外观、座舱、性能与安全方面全面升级,提供增程与纯电两种动力版本,售价分别为 27.98 万元起与 31.98 万元起。

尚界 H5 主要配置:

  • 搭载乾崑智驾 ADS 4 系统,全系标配 3 颗 4D 毫米波雷达、192 线激光雷达
  • 鸿蒙座舱,支持主驾迎宾、3D 人脸识别、电子萌宠、超流畅导航
  • 支持手表控车与星闪车钥匙
  • 无麦 K 歌 2.0、HUAWEI MagLink 车载屏、天生绘画功能
  • 首次引入车位到车位领航辅助功能
  • 601L 后备箱,二排座椅可放倒形成「大床模式」
  • 纯电版最长续航 655 km,增程版综合续航 1360 km

全新问界 M7 主要配置:

  • 搭载乾崑智驾 ADS 4、途灵平台、巨鲸电池平台
  • 全维防碰撞系统 4.0、激光雷达方案
  • 主驾零重力座椅可联动方向盘自动调节
  • 副驾准零重力座椅支持 70° 腿托、靠背调节、按摩、通风、加热
  • 星环双翼大灯、贯穿式星翼尾灯
  • 16.1 英寸 3K 悬浮屏 + 17.3 英寸后排娱乐屏
  • 全车屏幕支持三指滑动多屏流转
  • 增程版最高综合续航 1600+ km,纯电版最长续航 700+km

发布会上,华为方面还公布了鸿蒙智行其他车型的最新交付数据,并强调「安全是最大的豪华」,将安全能力视为全系标配。

🔗 相关阅读:鸿蒙智行上新,尚界 H5 只卖 15.98 万元!

1998 元起,大疆发布 Osmo Nano 自由视角穿戴相机

大疆于昨天正式推出新款 Osmo Nano 自由视角穿戴相机,定位轻量化便携拍摄设备,面向运动记录、旅行 vlog 及日常生活场景。

据悉,该产品采用可穿戴设计,支持多角度拍摄,并在机身尺寸与重量上进行了优化,以提升长时间佩戴的舒适度。

主要硬件与功能亮点:

  • 机身重量约 80 克,支持长时间佩戴
  • 搭载 1/1.3 英寸 CMOS 传感器,支持 4K 60 帧视频录制
  • 内置三轴防抖系统,提升动态拍摄稳定性
  • 支持蓝牙与 Wi-Fi 连接,可与手机应用实时同步画面
  • 续航时间约 120 分钟,支持快充功能
  • 防水等级 IPX4,可应对日常防泼溅需求

Osmo Nano 目前已上架购物平台,64GB 标准套装 1998 元起。

支持 8K 拍摄,GoPro MAX 2 全景运动相机发布

运动相机品牌 GoPro 今日正式推出最新旗舰产品 MAX 2,主打原生 8K 全景拍摄能力。

通过双镜头 360° 全景模式,MAX 2 可呈现高达 3500 万像素画质,带来「真正的」8K 分辨率 360° 视频,据官方介绍,有效分辨率较同类产品提升约 21%。

MAX 2 的硬件配置较前代有显著提升,主要包括:

  • 原生 8K 分辨率 360° 全景视频拍摄,画质可达 3500 万像素,支持 5.6K60 与 8K30 高画质高帧率拍摄模式和 3 倍慢动作拍摄(4K 100 帧)
  • 10-Bit 色深与 GP-Log 模式,最高 300Mbps 比特率
  • 2900 万像素 360° 照片拍摄,支持后期自由构图
  • 双镜头支持 4K 60 帧 180° 超广视角视频,视角范围超过传统 170°
  • 可替换式镜头设计
  • 升级的 6 麦克风阵列,支持 360° 立体声与降风噪
  • 1960mAh 电池
  • 5 米防水、地平线锁定防抖、AI 智能追踪等功能

配件方面,官方同步推出 1 米碳纤维杆、80cm 漂浮式延长杆、带锁 1/4-20 安装卡扣、碳纤维延长套装及 MAX2 USB 传输转口等。

GoPro MAX 2 已在海外官网开售,售价为 499.99 美元(约合人民币 3557 元),国行版售价与上市时间暂未公布。

爱范儿也在第一时间推出了两款运动相机新品的对比体验,可点击下方链接了解更多。

🔗 相关阅读:大疆 vs 影石:1998 元起,最强拇指相机对决

iQOO 15 举办电竞性能技术沟通会

在 iQOO 15 正式发布前,iQOO 举办了一场以电竞性能为主题的技术沟通会,公布了多项核心硬件与功能细节。

官方表示,新机在屏幕、图像处理以及游戏引擎方面进行了针对性优化,旨在满足高强度移动电竞的需求。

主要硬件与功能参数如下:

  • 搭载 6.85 英寸 2K 直屏,全球首发「M14 发光材料」,支持硬件级游戏护眼与 8T LTPO 技术
  • 内置自研电竞芯片「Q3」,提供「显卡级」游戏视效处理能力
  • 配备「Monster 超核引擎」,包含「先知调度器」与「闪电加速器」
  • 首批机型包括 iQOO 15 与 iQOO Neo 11
  • 搭载潜望长焦、无线充电功能以及全新线性马达

此次沟通会的内容显示,厂商在屏幕材料、图像处理芯片以及游戏引擎方面均有新尝试,意在为移动电竞用户提供更接近 PC 端的视觉与操作体验。

阿里云发布首个端到端全模态 AI 模型

昨天,阿里云正式发布并开源全新的 Qwen3-Omni、Qwen3-TTS,以及对标谷歌 Nano Banana 图像编辑工具的 Qwen-Image-Edit-2509。

据介绍,Qwen3-Omni 是业界首个原生端到端全模态 AI 模型,支持文本、图像、音频和视频多类型输入,并可通过文本与自然语音实时流式输出结果,解决了多模态模型在不同能力间权衡取舍的长期难题。

核心特性包括:

  • 跨模态先进表现:在 36 项音频 / 视频基准测试中,22 项达到最新水平,32 项在开源范围内领先;在自动语音识别、音频理解与语音对话方面可与 Gemini 2.5 Pro 相当。
  • 多语言支持:涵盖 119 种文本语言、19 种语音输入语言及 10 种语音输出语言。
  • 创新架构:基于 MoE「专家混合」的「思考者–表达者」设计,结合 AuT 预训练与多码本方案,降低延迟。
  • 实时交互:低延迟流式音频 / 视频交互,支持自然轮流对话与即时响应。
  • 精细音频描述:已开源 Qwen3-Omni-30B-A3B-Captioner,填补开源社区在通用型音频描述领域的空白。

同时亮相的 Qwen3-TTS 支持 17 种音色选择,每种音色均支持 10 种语言,并覆盖闽南语、吴语、粤语、四川话等多种中国方言。

Qwen3-TTS-Flash 在语音稳定性与音色相似度方面超越 SeedTTS、MiniMax、GPT-4o-Audio-Preview、Elevenlabs。

Qwen-Image-Edit-2509 则是 Qwen-Image 月度迭代版本,提升了单图与多图编辑一致性,支持人像、产品、文字等多类型编辑,并原生支持 ControlNet。

此外,Qwen3-Next-80B-A3B-Instruct-FP8 与 Qwen3-Next-80B-A3B-Thinking-FP8 也已同步开源。

特斯拉简化版 Model Y 被曝光,配置大幅精简

近日,一名叫 @greentheonly 的用户在 X 上称,在特斯拉官方固件中发现代号为「E41」的 Model Y 简化版本,该车被认为是即将推出的低价版 Model Y。整体策略可用一句话概括 ——「能砍的都砍了」。

据其爆料,主要减配内容包括:

  • 车顶:取消全景玻璃天窗
  • 悬挂:降级版悬挂系统
  • 座椅:多向调节降级为单轴调节
  • 空调:简化出风口
  • 后视镜:取消电动折叠功能
  • 摄像头:后视摄像头取消加热功能
  • 车内屏幕:取消第二排显示屏
  • 音响系统:降级为「Essential」基础版或「经过改进的基础版」
  • 内饰:车顶内衬简化为玻璃纤维,取消氛围灯和迎宾灯
  • 轮毂:缩减为 18 英寸规格
  • 其他:取消胎压监测系统

据悉,「E41」将提供后驱与全驱两种版本,均采用特殊电机配置,但具体参数尚未公布。

部分网友甚至认为取消全景天窗是「升级」,因为夏季行车不再暴晒头顶。

🔗 相关阅读:各种减配!特斯拉的「Model Y 廉价版」被扒光了

新消费

可口可乐或继续掌控 Costa 即饮业务

英国天空新闻援引消息人士称,可口可乐公司已向潜在收购方明确表示,将保留对 Costa 咖啡即饮产品的控制权。这意味着,若交易成真,出售范围或仅限于门店业务。

报道称,阿波罗全球管理公司曾考虑竞购 Costa,但在上周报价截止前决定不参与。其他竞标方包括 TDR Capital,不过投标数量低于预期。

据悉,可口可乐在超市及杂货渠道销售的 Costa 即饮系列将继续由其掌控。

资料显示,Costa 于 2020 年初进入中国即饮市场,依托中粮可口可乐与太古可口可乐的分销网络,迅速覆盖商超、便利店及电商渠道。

过去 5 年,该品牌已跻身中国即饮咖啡市场前三。其定价策略介于康师傅、雀巢等零售咖啡品牌与星巴克瓶装咖啡之间,每百毫升售价约 2.33 元。

可口可乐方面未正式确认出售 Costa 门店业务的计划,但高管此前强调,所有并购交易的核心是为体系、客户与消费者创造整体价值。

盒马最难吃的甜品被台风「选出」

据南方都市报报道,近日,台风「桦加沙」来势汹汹,广东多地市民提前囤货应对,青菜、粮油等食材补货频率明显提升。

不过,这波「台风严选」也意外揭示了当地消费者的口味偏好 —— 部分甜品、方便面、水果、蔬菜在抢购潮中被冷落,其中一款榴莲大福尤为显眼。

有网友调侃「广东人宁可饿着也不向味蕾妥协」,而榴莲大福则成为被剩下最多的甜品。

对此,盒马客服回应称,榴莲大福库存充足,非因滞销导致剩货,并表示后续将根据消费者反馈对商品配方进行调整,以满足更多人的喜好。同时提醒广东消费者尽量减少外出,注意安全。

卖婴儿纸尿裤的尤妮佳在华转向宠物食品

据日本经济新闻此前报道,日本日用品企业尤妮佳(Unicharm)在中国的首家宠物食品工厂已于今年正式投入运营。

该工厂位于江苏省,由尤妮佳与吉家宠物(JIA PETS)合作建设,尤妮佳持股比例超过 40%,总投资额超过 100 亿日元(约人民币 4.8 亿元)。

尤妮佳表示,此举旨在通过本土化生产实现稳定供给与快速销售,降低成本,并计划到 2030 年将宠物相关产品在中国业务销售额中的占比从目前的 1% 提升至 20%。

公开资料显示,吉家宠物在江苏徐州新沂经济开发区建设的宠物食品项目一期已全面投产,年产能可达 20 万吨,预计年产值超 40 亿元。

业内数据显示,中国是全球第二大宠物消费市场,2024 年犬猫数量预计达 1.87 亿只,宠物食品市场规模突破 3000 亿元,且保持稳定增长。

尤妮佳认为,随着年轻群体养宠比例提升,本土化生产将加速新品研发与上市,宠物用品有望成为继卫生巾和纸尿裤之后的重要营收来源。

抹茶秋季热度再攀高,茶饮品牌集中上新「浓郁系」新品

FoodTalks 近日发布文章称,今年秋季,抹茶在饮品市场的热度持续升温。

自 9 月以来,古茗、奈雪、茶百道、沪上阿姨等多家头部品牌密集推出抹茶新品,口味从春季的清爽风格转向更适合秋冬的「浓郁系」搭配。

9 月 3 日,沪上阿姨推出「千目抹茶芝芝米麻薯」与「千目抹茶生椰大福」,将抹茶与米麻薯、芝士奶盖、生椰乳等食材结合,带来层次丰富的口感。

9 月 5 日,奈雪上新「浓抹干酪米布布鲜奶茶」,以干酪中和抹茶微苦,获得不少消费者好评。

古茗则在 9 月 11 日推出「生椰抹茶麻薯」「抹茶开心椰」,并于 19 日加码「双重芝士抹茶」。

茶百道在 9 月 16 日推出「千目咸法酪」,以超千目径山抹茶搭配咸香法酪,迅速在社交平台走红。

文章指出,本轮抹茶热潮呈现三大变化:

  • 搭配更浓郁——米麻薯、干酪、芝士等食材成为抹茶新品的常见组合,满足秋冬消费者对温暖、饱满口感的需求。
  • 强调「千目」品质——多家品牌在新品命名与宣传中突出「千目研磨」概念,强化抹茶细腻粉质与高端定位。
  • 应用更多元——抹茶不再局限于饮品基底,还被广泛用于奶盖、小料及水果搭配,展现出极高的风味兼容度。

业内分析认为,抹茶与牛乳、芝士等浓郁食材的适配性,使其突破了「春夏限定」的认知边界,秋冬市场潜力巨大。未来,香气创新与视觉突破或将成为抹茶产品持续吸引消费者的关键方向。

好看的

《毕正明的证明》预售开启

动作 / 剧情片《毕正明的证明》于昨日正式开启全国预售,并同步发布「请看管好随身财物」版预告。

影片由佟志坚执导,王安宇、张天爱、王彦霖领衔主演,聂远特别出演,冯兵、邬家楷、孔令美主演,将于 10 月 1 日登陆全国院线。

影片故事讲述毕正明从小立志当警察,却在报到首日意外致残,沦为「一日警察」。

为证明自己,他孤身潜入盗贼团伙「荣门」,在危机四伏中坚持初心。片中大量火车场景不仅贴近节日出行生活,也折射时代变迁:从绿皮火车盗贼猖獗到高铁时代秩序井然,「安全」成为全民共感的关键词。

死亡搁浅系列首部动画电影项目《MOSQUITO》正式公布

小岛工作室宣布,作为游戏《死亡搁浅》系列的延伸,将启动全新动画电影项目《MOSQUITO(暂定名)》,并同步公开先导影像。

该片将与好莱坞联合制作,由株式会社 ABC ANIMATION 导演宫本浩史执导,Aaron Guzikowski 担任编剧。

据悉,《MOSQUITO》是小岛工作室首次尝试长篇动画电影制作,动画部分由 ABC ANIMATION 独立负责,这也是该公司首次完全参与大型动画电影项目。

宫本浩史曾执导《拥抱!光之美少女♡光之美少女 All Stars Memories》等作品,编剧 Aaron Guzikowski 代表作包括《异星灾变》与,《红番血路》。

官方尚未公布上映日期及更多剧情细节,但从先导影像来看,影片延续了《死亡搁浅》系列的独特世界观与视觉风格,预计将为粉丝带来全新的叙事体验。

《浪浪人生》开启预售

电影《浪浪人生》今日发布「全家一起上」版预告及「这一家子不好惹」版海报,并宣布全国预售正式开启。

影片改编自蔡崇达畅销书《皮囊》,由韩寒监制,马林执导,周运海编剧,黄渤、范丞丞、殷桃领衔主演,将于 9 月 30 日上映。

据片方介绍,《浪浪人生》不仅有「疯」力十足的喜剧元素,还传递出家人之间彼此关心与托举的温暖情感,适合观众在国庆假期与亲友一同观影。影片预售现已开启。

小岛恐怖游戏新作《OD – KNOCK》发布先导预告片

在今日举行的小岛工作室成立 10 周年纪念活动「Beyond The Strand(超越羈絆)」上,知名游戏制作人小岛秀夫正式发布与 Xbox Game Studios 合作开发的恐怖新作《OD》最新前导预告片「KNOCK」。

《OD》最早于 2023 年底的 The Game Awards 首次亮相,采用最新虚幻引擎打造,并邀请《牠》演员苏菲亚·莉莉丝(Sophia Lillis)、《高校十八禁》演员杭特·薛佛(Hunter Schafer)以及曾饰演《红色警戒 2》角色「尤里」的乌多·基尔(Udo Kier)参演。

与此前仅展示 3D CG 面部演出的首支预告不同,本次影片完整呈现了由游戏引擎驱动的高度写实室内场景,以及苏菲亚·莉莉丝饰演的主要角色的生动表演,营造出令人屏息的恐怖氛围。

目前,官方尚未公布《OD》的具体上市时间。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Chrome 迎来大更新,刚刚登顶 App Store 的 AI 可以直接用了

作者 张子豪
2025年9月19日 14:00

你应该也有类似的浏览器使用体验,就是当你曾经打开过一个标签页,但是忘了给它添加书签;下次再想找到它时,只能去历史记录里面翻个半天,还不一定能找到。

前些天,我们介绍 Google AI 全家桶的产品指南,它的浏览器 Chrome 被排除在外。

一方面,这是个传统的老牌浏览器,几乎每个人的电脑都有安装一个;另一方面,浏览器本身好像就是没有任何 AI 功能,找标签页这个场景,除了依赖第三方扩展插件,我们只能去翻历史记录。

但是现在,Chrome 进行了自 2008 年发布以来最大的一次升级,找不到的标签页,点击右上角 Gemini 的小图标,一句话就能解决。不管你喜不喜欢,它也是一个 AI 浏览器了。

▲ Gemini in Chrome

点击右上角的 Gemini 图标,我们可以与 Gemini 进行跨标签页的对话

Chrome 不再是一个被动打开网页的工具,Gemini 的引入,让它变成一个能主动帮我们干活的智能伙伴。Gemini 助理、AI 搜索模式、智能体、以及一系列新的安全和便捷功能都来了。

Chrome 在自己的 YouTube 频道和官方博客,发布多条内容,介绍这个「历史全新」的浏览器。我们第一时间研究了所有新功能,可以负责任地告诉你,这不只是加了个聊天机器人那么简单,我们的上网方式可能真的需要一点时间,来学习和适应这个更聪明的浏览器。

信息过载?AI 帮忙画重点,几十个网页秒变一份精华纪要

这可能是打工人和学生党最狂喜的功能。想象一个场景,老板让你半小时内调研完一个行业,或者你需要为论文快速消化十几篇文献。过去,我们只能一篇篇点开,匆忙地在多个标签页切换。

现在,打开这些网站标签页,然后呼叫 Gemini,它就能像一位专业的助理,跨越多个标签页进行阅读、对比和总结。

▲ Gemini in Chrome 能够获取多个标签页的上下文信息

我们可以直接问它:「这几款相机的优缺点分别是什么?」或者「帮我把这些资料整合成一份旅行计划」。它甚至还能找到 YouTube 视频里的关键信息,我们不需要额外的第三方插件,就能得到一样的 YouTube 视频总结。

从大海捞针到 AI 直接递上答案,这效率提升可不止一点半点。

动口不动手,你的浏览器助理未来什么都能干

如果说「总结资料」只是开胃菜,那接下来的「智能体能力」(Agentic Capabilities)就是 Google 为我们描绘的未来图景。

简单来说,和所有智能体一样,我们负责下命令,浏览器负责跑腿。也和所有关于智能体能力的演示一样,我们只能用智能体来预订餐厅,买生日礼物。

Google 提到在未来几个月,通过结合 Google 强大的应用生态,YouTube 视频、Gmail 邮箱、Calendar 日历、以及办公套件等,我们可以直接对 Chrome 说,「帮我订一份常吃的那家沙拉。」、「预约下周三下午的美发。」、「把这些东西加到我的购物车里。」

▲ 集成在 Chrome 里面的 Gemini,有能力为我们处理一些简单的重复性任务

Chrome 会在我们授权后,自动在网页上进行点击、填写、下单等一系列多步骤操作,而我们全程只需监督,随时可以叫停。

虽然听起来有点像 ChatGPT agent 之前演示的功能,但其实就是这样。我觉得智能体的能力,还没有被真正的挖掘出来,专门开发一个 AI 浏览器用来预订餐厅,听起来怎么都不划算。

Chrome 即将更新的智能体能力,我的期待是,我们生活中真正的琐事,可以从需要 30 分钟的处理,变成 3 次点击。

地址栏,现在是 AI 全能框

Chrome 那个我们每天都要用无数次的网页地址栏,现在也升级成为 Omnibox 全能框。

当我们访问一个网页时,地址栏会根据页面内容,智能地为你推荐一些我们可能想问的问题。

比如正在看一款床垫,它可能会提示你:「这个东西的保修政策是啥?」。

▲ AI 模式在地址栏中直接可用

此外,跟我们之前介绍的 AI Mode(AI 模式)有关,现在我们不需要去专门的 Google 搜索地址,直接在地址栏,就能开启 AI 模式。一些更复杂、更开放、需要深度研究的问题,AI Mode 都能做到。

比如「给我推荐几款适合小户型的复古风咖啡机,预算 1000 元以内」,AI 会直接在侧边栏生成一份详尽的报告,无需跳转。

AI 除了用来提升效率,也让 Chrome 更安全

聊了这么多 AI 的功能,安全也是 Chrome 非常在意的一个因素,Chrome 大概想说,不要觉得只有你 Safari 在保护隐私安全。

这次主要是利用 Gemini Nano 模型,能更主动地识别和拦截,那些诱导我们下载有害软件的诈骗网站。

以及对通知更加智能的管理,AI 会自动识别那些垃圾、诈骗类的网站通知,并帮你「一键退订」。Google 称仅在 Android 端,这项功能,每天就能为用户减少约 30 亿次骚扰。

密码的保护也得到了更新,当密码不幸泄露时,Chrome 未来将能像一个密码特工一样,在支持的网站上,直接帮我们一键完成密码修改。

▲ Chrome 可以通过一次点击,修复泄漏的密码

在 Chrome 中的 Gemini,此前是 Google Labs 的项目,仅针对 AI Pro 和 Ultra 用户。

现在 Chrome 的这些更新,支持在美国且将英语设置为首选语言的全部用户,支持 Mac 和 Windows 版本;而 Android 和 iOS 版本也将很快推出,里面部分功能在持续更新中。

🔗 官方使用指南帮助:
https://support.google.com/gemini/answer/16283624

我们之前也多次讨论过 AI 浏览器的形态,无论是 the browser company 曾经推出的 Arc,还是后面集成了更多新功能的 Dia,现在被卖给 Atlassian。

还有 Perplexity 推出的 Comet,最近应该正式向大部分用户开放了,不需要漫长的 waitlist 等候。

以及前段时间微软称 Edge 也正式升级为 AI 浏览器;和关于 OpenAI 的 AI 浏览器传闻。

和这次的 AI Chrome 类似,它们的模式甚至都可以被总结成一个侧边栏,和一个像 ChatGPT 首页的启动页面。

▲ 根据 statcounter 统计数据,Chrome 市场份额全球领先

但是,Chrome 和它们不一样的是,这是一个在全世界范围都遥遥领先的浏览器。今天的更新,可能标志着「AI 浏览器」这个概念,真的要从一些少数派的探索,走向更大众化的讨论。

呈现 AI 最好的形态不是浏览器,那 AI 浏览器最好的形态又该是什么样。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


融资丨生数科技完成A轮数亿元融资

近日,生数科技完成新一轮数亿元人民币规模的A轮融资。该轮融资由博华资本领投,百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、卓源亚洲、BV百度风投等老股东持续跟投,建发新兴投资等产业合作方加码跟投。

生数科技成立于2023年3月,核心团队由来自清华大学、北京大学、帝国理工学院、卡耐基梅隆大学等全球顶尖高校的技术人才和来自产业界的产品研发、产业服务人才组成,具备深厚的产业实践经验与出色的全球化技术落地能力。

公司专注于多模态大模型及应用的自主研发,其核心产品Vidu具备AI图像生成、视频生成与音频生成等多项能力,广泛应用于互联网、广告、电商、动漫、文旅、广电、教育、游戏及影视等行业领域。

2024年7月,Vidu在全球上线,全球首创「参考生」图片/视频概念,并凭借在商业内容创作领域中一致性保持方面的关键突破,在AI视频生成和AI生图领域快速覆盖全球200多个国家和地区的超3000万用户和6000家开发者及企业。通过Vidu累计生成视频数量超过4亿,其核心功能参考生视频和参考生图的数量已超过1亿,其中商业内容素材生成量占比超过50%。

生数科技首席执行官骆怡航博士表示,多模态生成技术在数字内容产业中的商业化进程正在加速,但目前仍处于早期阶段。预计在未来三年内,多模态生成将重塑全球数字内容的生产方式,全面渗透到各行各业的内容生产与消费环节,展现出巨大的市场空间与全球性增长潜力。新一轮融资将用于模型研发和技术创新,探索多模态大模型的智能上限和应用广度,同时将持续加强产品拓展、用户服务、产业合作和全球商业布局。

未来,生数科技将继续坚持以技术为核心驱动力,通过创新的产品与服务,助力全球每一个人与组织提升生产力和创造力!

查看更多项目信息,请前往「睿兽分析」。

❌
❌