阅读视图

发现新文章，点击刷新页面。

OpenAI 发布 Sora 2！AI 视频 GPT-3.5 时刻来了，还有一个 AI 版抖音| 附下载链接

爱范儿

李超凡

2025年10月1日 08:15

国庆长假的第一天，OpenAI 直接扔出了一颗真「核弹」：Sora 2 ，以及一个可能重塑社交格局的新应用——Sora。

如果说一年多前的 Sora 让我们看到了 AI 视频的黎明，那么 Sora 2 就直接把我们拽进了正午的太阳底下，刺眼、灼热，又无比真实。

这次不再只有技术演示，而是直接为此开发了一款新 app 给 C 端用户体验。

OpenAI 也极为罕见地，直接把 Sora 2 称为 AI 视频生成的「GPT-3.5 时刻」。

看完 Sora 2 的发布和体验，我发现 OpenAI 这次的自信是真有底气，不是奥特曼式的自吹自擂。

关于真实的定义被推到了必须重新讨论的时刻。一个全新的物种，一个崭新的时代，开始了。

奥特曼刚刚也发了长文，认为这是「创意领域的 ChatGPT」时刻，创意将迎来「寒武纪爆发」。

APPSO 第一时间给大家全面总结了 Sora 2 和 Sora app 的核心功能和新玩法，以及使用方式。

Sora 2 ：
1. 首次实现音视频同步生成：生成画面的同时生成与之匹配的环境音、物体交互声，甚至是符合语境的对话
2. 强得可怕的物理精确性：能够进行与真实世界动力学更一致的物理仿真。
3. 真实感大幅提升：在图像分辨率、细节程度和真实感方面都有所提升。
4. 能更灵活地适应用户想要的风格，风格操控能力增强。
5. 一致性更强，对用户指令的遵循的比之前的模型有所提高。

Sora app
1. 客串 (Cameo)： Sora app 最大亮点，用户可以将自己或朋友以逼真的效果融入任何 AI 生成的场景中。
2. Remix：用户可以对彼此创作的视频进行「混编」或二次创作，共同创作。

怎么用
1. Sora app下载链接（目前只有 iOS 没有安卓）
https://apps.apple.com/us/app/sora-by-openai/id6744034028

2. 网页版 sora.com

3. 地区支持：今天起在美国、加拿大首发，其他国家和地区将逐步开放

4. 邀请码机制：无论是 iOS 应用还是网页版都需要邀请码才能使用。现在就可以去下载 App 或访问网站注册排队。

5. 价格：Sora 2 初期将免费提供，并有相对宽松的使用限制ChatGPT Pro 用户还能在网页版抢先体验更高质量的 Sora 2 Pro 模型

6. OpenAI 也将会发布 API，让更多开发者加入。

Sora 2 ：不再是在「生成」，而是在「模拟世界」

Sora 2 的核心突破，是它从一个「视频生成器」，进化为一个「世界模拟器」。

理解物理世界，一直的 AI 视频最大的难点。以前的 AI 视频，物体经常会奇怪地穿模、漂浮正是源于无法准确理解物理世界的交互。

在 Sora 2 的视频里，体操的动作，原地连续后空翻、跳水等等这些动作都很自然符合力学，水花溅起的样子也符合流体力学。

OpenAI 的终极目标是构建「通用世界模拟器」(general-purpose world simulator)，即让 AI 理解我们世界的物理规则。

Sora 2 就是其中的关键一步。你可以把它想象成一个在虚拟世界里不断做物理实验的学生，通过观察无数视频，它正在自己总结牛顿定律、流体力学和光学原理。

对于任何有用的世界模拟器来说，这是一项极其重要的能力——你必须能够模拟失败，而不仅仅是成功。

这种对现实世界复杂性的模拟，才是 Sora 2 最可怕的进化。

Sora 2 的另一个重大突破，是在生成画面的同时，还能同步生成与之匹配的环境音、物体交互声，甚至是符合语境的对话。

虽然 AI 视频和音频现在都很强，但「声画一体」带来的真实感完全不同，这让 AI 视频真正拥有了「灵魂」。

这对模型的要求极高，比如 AI 生成「一只猫在键盘上走过，发出不满的喵喵声」。模型得知道「猫长什么样」，也学习了「猫的叫声是怎样的」，并将这两者牢牢绑定。还要理解了「敲击键盘」这个动作，才会「咔哒」声。

Sora 在可控性方面也有了巨大飞跃，能够遵循跨多个镜头的复杂指令，同时准确地保持世界状态，比较擅长写实、电影和动漫风格。

Sora App：打造你的 AI 「人生」

Sora App 直接支持 Sora 2 模型生成，里头最好玩的应该就是「客串 (Cameo)」，你只需在录制一段简短的视频和音频（用于活体验证和形象捕捉），你就可以把自己「投放」到任何 AI 生成的场景里。

上一秒你还在办公室，下一秒你就可以出现在《沙丘》的沙漠星球上，仰望双月，Sora 还会根据沙漠的光线，给你脸上加上逼真的光影。

是不是有点视频版 nano banana 那味了

整个过程就像拍个自拍视频一样简单。Sora 会捕捉你的形象、声音和神态，然后你就可以在生成视频时，像选择一个贴纸一样，把自己「贴」进去，而且是 3D、无缝、高度逼真的那种。

OpenAI 内部员工已经因为这个功能在公司交到了新朋友。

你可以和朋友们一起「客串」到同一个场景里，上演一出属于你们的科幻大片。这是一种全新的交流方式，从文字、表情包、语音，进化到了「共同体验」的视频媒介。

在 Sora App 的信息流里，你看到的每一个视频都是 AI 生成的。

如果看到一个喜欢的视频，直接点击「Remix」，你可以修改提示词，把「赛博朋克雨夜」改成「阳光明媚的午后」，或者用「客串」功能把自己加进去，变成故事的主角。

Sora 会保留原视频的结构或风格，让你在它的基础上进行修改和再创作，就像转发微博再加一句评论一样简单。

当然，这些功能不可避免地会引发对于隐私和侵权问题的担忧。

Sora 也对此做了应对措施，只有用户本人可以决定谁能使用自己的「客串」形象，用户可以随时撤销访问权限，或删除任何包含自己形象的视频，即使是他人创建未发布的草稿也不例外。

OpenAI 表示，包含电影或视频中真实人物影像的上传在初期将被禁止或受到严格监管，而涉及儿童的内容将有严格过滤：含有儿童的场景将实施严格的审查门槛。

现实，这次真不存在了？

Sora 2 和 Sora App 带来的，远不止是好玩，它正在从根本上动摇我们对「真实」的定义。

Sora 2 的发布，或许标志着我们与现实的关系将进入一个新的纪元。我们每个人都获得了重塑世界、重塑自我的「魔法」。

现在，我们可能不是主动选择逃离现实，而是「现实」本身正在失去其作为我们生活参照系的核心地位。

Sora App 通过提供极致的创造乐趣和社交连接，正在构建一个引力极其强大的新现实中心。它并非在你的现实生活之外提供一个「虚拟分身」，而是在试图成为你生活的「默认背景」。

当你的社交关系（和朋友在 AI 世界冒险）、身份认同（在虚拟世界里成为超级英雄）、创意表达（Remix 全世界）都优先发生在这个平台之上时，那个需要你偶尔「登出」才能回去处理水电费账单的物理世界，反而会沦为一个偶尔才需要访问的「副本」。

这属实就是《头号玩家》了，所以说 OpenAI 的尽头是元宇宙？小扎默默点了个赞。

OpenAI 自己也坦言，他们曾对纯 AI 生成信息流持怀疑态度，但最终被其带来的人际连接感所惊喜。

奥特曼在最新的博客中直言，AI 视频生成可能会走向堕落，最终导致我们都被吸入一个经过强化学习优化的「垃圾信息流」。

他表示 Open AI 试图找出如何打造一款既能带来愉悦又不落入这种陷阱的产品。

Sora 这个app，就是他们交出的第一份答卷。在通往 AGI 的路上，收获的不应该只是生产力，也关乎创造力和快乐。

欢迎来到这个由想象力驱动的新世界。现在，唯一的问题是，你拿到邀请码了吗？

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博

百度电商MultiAgent视频生成系统

掘金专栏-百度Geek说

百度Geek说

2025年9月30日 16:57

导读

随着人工智能技术的迅猛发展，AIGC（AI-Generated Content，人工智能生成内容）正逐步重塑内容创作行业的格局。尤其在视频内容领域，传统制作流程周期长、成本高、依赖人工创作，已难以满足日益增长的内容消费需求。AIGC技术的引入，为视频创作带来了前所未有的效率与可能性。AIGC工具在短视频应用率从22 年不足5%跃升到25年35%。电商场景下，越来越多的平台帮助商家进行AIGC商品视频的创作，帮助其提高商品转化率。基于上述两点，电商搜索在今年开始探索AIGC视频自动化生产方案，尝试基于视频自动化混剪，来满足搜索场景下日益增长的内容需求。

01 早期项目演进与问题

项目早期我们整体视频创作中基于大模型完成分镜脚本生成 + 分镜图片素材检索，其他视频元素（脚本脉络/视频标题/布局/音效/特效等）全部通过规则进行选择和生成。但整体后验效果不佳，通过后验分析我们发现了两个很大的问题：

规则式方案导致视频整体模板化、同质性严重。
整体视频素材大部分由口播加静态图片素材组成，比较死板，吸引力弱。

为解决上述2类问题，我们进行了新一版迭代。主要升级点：

规则式视频生成方案升级成 MultiAgent协同视频生成系统，最大化视频先后验指标为目标，动态调度视频元素。
素材供给和类型更丰富（视频素材、泛图表），增加视频素材多维度优选能力，大幅提升高清视频素材的时长占比，显著增强视频吸引力。

02 MultiAgent视频生成系统

通过搭建MultiAgent协同视频生成系统，基于视频内容高效满足和视频画面丰富多样为优化目标，模拟人类视频制作流程，完成分镜脚本生成>多类型素材生成->大模型剪辑成片多轮推理。

2.1 分镜脚本生成Agent

分镜脚本生成在项目初期面临两大问题：

问题1：如何提升脚本准确率?

电商场景下品牌/品类/商品信息需要大量准确数据支撑 => 直接根据互联网语料生成准确率不到80%。

解法：脚本生成信息来源以电商高精知识图谱为主，第三方优质视频文案（B站视频等）为辅，保证核心主体信息准确的同时丰富故事细节，脚本可用率大大提升。如下是一个Case：

西门子是什么品牌

提到西门子，很多人第一反应是家里那台带液晶屏的冰箱，或是洗衣机上那个会发光的LOGO。

但你可能不知道，这个看似普通的家电品牌，背后藏着足以改变人类工业史的惊人故事。

1847年，当维尔纳·冯·西门子在柏林一间小作坊里敲打出第一台电报机时，没人能想到这家公司会成为工业界的隐形冠军。

最让人震撼的是西门子的重生能力。

二战期间80%工厂被炸毁，这个德国品牌却用短短五年就杀回巅峰。

就像他们1910年卖给中国石龙坝水电站的发电机——这台百岁高龄的工业活化石，至今还在云南吭哧吭哧运转。

这种近乎变态的耐久度，解释了为什么全球70%的高端燃气轮机市场都被西门子垄断。

但西门子真正的可怕之处在于无处不在。

你手机摄像头里的光学系统，医院CT机的核心部件，甚至造芯片用的UV光刻机，背后都是西门子的技术。

更夸张的是，历史上32位诺贝尔奖得主都依赖西门子显微镜做研究。

这种渗透到科技毛细血管的能力，让它在工业4.0时代依然稳坐神坛。

2024年最新财报暴露了这家老牌巨头的野心：单季度新订单223亿欧元，折合人民币超1700亿元。

更惊人的是研发投入——63亿欧元相当于每天烧掉1.7亿人民币搞创新。

从1872年进入中国交付首台电报机，到如今智能工厂解决方案遍布长三角，西门子用152年时间证明：真正的工业王者，从来都是闷声改变世界。

下次当你打开西门子冰箱取饮料时，不妨多看一眼那个蓝色LOGO。

它不仅是德国制造的品质象征，更是一台持续运转178年的超级印钞机——平均每1.5小时就能创造1个诺贝尔奖级别的技术突破，这样的品牌基因，恐怕连特斯拉都要喊声老师。

问题2：如何提升脚本吸引力？

通用大模型生成脚本冗长拖沓且AI感强 => 无法快速满足用户需求以及脚本吸引力不足。

问题2解法：构建优秀脚本脉络及风格集合，针对不同Query动态选择脚本脉络、风格，提高脚本吸引力。

风格2：历史叙事类风格

开头：

1.通过悬念钩子式开场，把观众带入好奇与期待的情绪，通过颠覆认知的事实陈述，带给观众强烈的入门吸引力。

主体文案

1．通过时间锚点与关键事件叙事，把观众带入到故事中，通过细节化描述，带给观众身临其境的代入感。

2. 通过数据具象化与生活类比，把观众带入真实可感的认知场景，通过技术术语降维解读，带给观众易懂的专业洞察。

3. 通过对比与隐喻强化冲突，把观众带入情感共鸣的高潮，通过辉煌与危机并行的结构，带给观众深度反思的平衡视角。

4．通过转折点戏剧化呈现，把观众带入叙事节奏的起伏中，通过第三方视角引用，带给观众客观可信的品牌背书。

5．通过金句收尾与主题升华，把观众带入余韵悠长的结尾氛围，通过历史寓言或隐喻，带给观众启发性的价值总结。

6. 通过语言节奏控制，把观众带入流畅紧凑的阅读体验，通过文化元素融合，带给观众多元化的审美共鸣。

结尾：添加和用户的互动

效果示例如下：

谁能想到，如今遍布全球的西门子帝国，最初竟诞生在德国柏林一家熟肉店的后院！（开头直接回答用户问题）

1847年，当维尔纳·冯·西门子脱下普鲁士军装，租下那间飘着烤猪肘香味的作坊时，连隔壁面包师傅都嘲笑这个整天摆弄电线的年轻人。

可就是这个被当作怪人的前炮兵军官，用一根电报线撬动了整个工业革命。

故事要从德国北部的小村庄伦特说起。1816年出生的维尔纳从小就有种特殊天赋——他能把拆散的怀表重新组装成会转动的钟，还能用勺子电解出银层给朋友做生日礼物。（通过细节化描述，带给观众身临其境的代入感）

这种对电的痴迷，最终让他在1847年创立了西门子-哈尔斯克公司。

注意，这家公司的第一个爆款产品不是冰箱也不是发电机，而是指针式电报机！

当时的欧洲正处在通信革命前夜。柏林至法兰克福的电报线路项目，让西门子赚到第一桶金。

但真正让公司腾飞的，是维尔纳三兄弟的全球布局战略：大哥坐镇柏林搞研发，二弟威廉攻克英国市场，三弟卡尔甚至把电线铺到了沙皇的冬宫。

到1879年柏林工业博览会上，西门子已经能骄傲地展示世界首辆电力列车——比爱迪生发明电灯还早两年！

如今178年过去，这个德国品牌早已超越国界。2024财年第一季度，西门子新订单额飙升至223亿欧元，在190个国家拥有32万员工。

从你家冰箱里的PT净味技术，到医院的核磁共振设备，甚至太空站的供电系统，那个曾在肉店后院闻着香味饿肚子的发明家，真的让全人类都通上了他的电。

不过最讽刺的是，当年维尔纳为省钱发明的电镀术，如今却成了西门子高端家电的标配工艺。

下次当你打开那台标着SIEMENS的冰箱时，别忘了里面藏着个德国工业史上最美味的创业故事——毕竟没有哪家世界500强，是从闻着烤猪肘香味开始的。

2.2 多类型素材生成

目前AIGC视频中，电商视频素材相比于通用场景素材，存在两点挑战：

视频素材少

原始视频少：业界通用视频素材对于电商信息，特别是长尾商品信息覆盖较少。

可用视频少：在电商类视频中，对品牌商品等实体一致性要求极高，进一步加剧视频供给问题。

传统视频检索准确率低：电商场景下对于品牌/商品实体一致性要求极高，传统通用视频检索系统在电商场域下实体理解效果差，检索准确率低，导致视频不可用。

针对上述两个挑战，我们提出了两步解决方案：

泛图表生成，进一步增加差异化供给：基于大模型代码生成能力，自动化构建30+个泛图表模板，并通过MCP形式对外开放；通过大模型规划能力，根据脚本选择最优图表模板并生成泛图表内容，端到端图表生成可用率达92%。

图表效果如下：

整体流程如下：

素材多维度优选：基于多模态视频理解大模型，从电商实体一致性，视频清晰度等多维度构建端到端优选能力，提升视频素材质量，视频粒度准确率大大提升。

实体一致：基于Qwen2.5-VL-32B模型，对视频中实体细节进行多维度理解推理，尤其注重商品实体一致性。

清晰度高：通过自研模型对视频清晰度划分清晰/普通/模糊三档，对模糊类视频进行过滤。

2.3 大模型剪辑成片

通过大模型多轮规划推理，进行素材/布局/动效/音效等多视频元素全局优选，完成最终视频剪辑并成片。整体流程如下：

03 后续方向演进

端到端剧本生成：

现有问题：现有的2.0框架本质上与传统检索系统类似，存在多个子Agent模块前后依赖，这导致了不同链路目标不一致等问题，制约了视频效果的增长。

解决方案：构建剧本生成Agent，基于大模型进行端到端的完整剧本生成。通过端到端的剧本撰写，视频的画面，脚本，BGM可以实现优化目标的统一化。

AIGC生成式视频：

现有问题：目前视频是基于现有的视频素材打碎重组（混剪）而成的，在很多时候都面临供给不足的问题，而AIGC生成（文生图/视频）的方式能较好的解决这样的问题。

目前困难：AIGC生成目前的可用率仍不足，会出现文字乱码，人物/实体错误，物理规律不遵循等问题，在电商商品场景下尤为明显，这些仍需要进一步去探索和尝试。

曝 OpenAI 将推出「AI 抖音」：禁止上传实拍内容，Sora 2 加持

爱范儿

张子豪

2025年9月30日 16:03

这两天的 AI 圈，更新速度快得让人喘不过气，哪是要让人放假的样子。

昨天 DeepSeek 更新了 V3.2-Exp 模型，Anthropic 凌晨就紧跟着发布了性能更强的 Claude 4.5。

正当大家都在爆料牌桌上的其他巨头何时出手时，行业领头羊 OpenAI 的「王炸」似乎已经提前被剧透了，那就是 Sora 2。

▲ 视频链接：https://x.com/OpenAI/status/1972416122613014556

最近，OpenAI 不仅在 X 平台连发多条神秘视频，引爆社区对 Sora 2 的猜想。

一则来自《连线》杂志的重磅爆料更是指出：OpenAI 的下一步棋，并非简单升级一个模型，而是要亲自下场，推出一个独立的 AI 视频社交 App，一个酷似抖音，但内容 100% 由 AI 生成的全新平台。

奥特曼曾经发 X 说，未来几周，OpenAI 将推出一些新的计算密集型产品，且最初只会向 Pro 用户开放。而需要大量算力的，不正是视频生成吗？目前 Sora 也仅面向 Plus 和 Pro 用户，传闻已久的 Sora 2 真的要发布了。

▲ https://x.com/sama/status/1969835407421374910

AI 视频也要迎来它的「吉卜力」时刻了。

揭秘「Sora 2 App」：一个怎样的 AI 抖音？

从目前曝光的信息来看，OpenAI 正在测试一款名为 Sora 2 的短视频应用，乍看之下，它就是一个 AI 版抖音。但最颠覆的一点是，在这个平台上，我们看不到任何真实拍摄的内容。

▲ TikTok 应用截图

它的界面和交互，与我们熟悉的短视频 App 几乎一模一样。采用竖屏信息流，和滑动切换的导航方式的视频源，并由推荐算法为我们提供「为你推荐」的内容。

在视频的右侧下方，同样提供了点赞、评论等互动选项，甚至还有一个独特的「Remix」（再创作）功能。

▲ OpenAI 去年 12 月正式推出了 Sora，很快被整合到 ChatGPT 应用中，图为 Sora 网页版截图。OpenAI 指出它存在一些局限性，例如似乎并不完全理解物理学，在制作逼真的动作场景时尤其困难，尤其是在较长的片段中。目前，1080p 超高清分辨率仅支持生成 10s。地址：sora.chatgpt.com

根据文件显示，用户只能使用 OpenAI 的下一代视频模型 Sora 2，生成最长 10 秒的视频片段。并且，App 不提供任何从手机相册或其他应用上传照片或视频的选项。这意味着，这个平台将成为全球首个内容 100% 由 AI 生成的短视频社区。

用数字分身来做社交

如果说纯 AI 生成内容还只是概念上的不同，OpenAI 还要为这个短视频 APP 引入社交的功能。

Sora 2 应用具有身份验证的功能，即允许用户确认自己的「肖像」（likeness）。一旦验证通过，就可以在生成的视频中，使用自己的形象。

更有趣的是，社交的边界被进一步打破。你的朋友也可以在他们的视频里标记你，使用你的「数字分身」。

▲ AI 图片视频生成平台即梦，也提供了数字人生成。

举个例子，我们可以直接使用别人的数字分身，生成一个视频，内容是「你和朋友在从没去过的主题公园，一起坐过山车」。

为了保护用户隐私，数字分生这项功能，也设置了提醒机制。每当你的形象被他人使用时，无论对方是公开发布，还是仅仅保存在草稿中且从未发布，你都会收到通知。

这款应用上周已经在 OpenAI 内部发布，并收到了员工压倒性的积极反馈。据连线杂志的消息，员工们使用得非常频繁，以至于一些管理者开玩笑说，这可能会影响生产力。可能真的跟刷抖音一样会上瘾？

为什么 OpenAI 要亲自下场做社交？

答案或许和 ChatGPT 的成功路径如出一辙。

OpenAI 似乎在押注，Sora 2 这个 AI 版抖音，能让我们与 AI 视频的互动方式发生根本性改变，就像 ChatGPT 让大众第一次真正体验到 AI 文本的潜力一样。

▲ 社交榜和娱乐榜第一名分别是 Meta 的 Thread 和 TikTok

当然，也不是只有 OpenAI 想到了 AI 视频社交这条路，就在上周，Meta 在它们的 AI 应用中，推出了名为「Vibes」的新功能。这是一个 AI 生成短视频的新平台，集创作、分享与社交功能于一体。

用户可通过浏览、创作、或二次创作（Remix）来生成自己的 AI 视频，并将视频快速分享到 Vibes、Instagram、Facebook 等 Meta 社交平台。

▲ Vibes 视频生成界面截图

Google 也早已宣布，计划将自己最新的视频生成模型 Veo 3 整合到 YouTube 中。一个是坐拥最大的社交网络平台，一个是最大的视频分享平台，OpenAI 的 AI 视频社交之路看起来，也并非一片坦途。

从一个聊天机器人，到一个可能的内容社交平台，OpenAI 的野心，在于建造下一代的互联网入口，而这个入口，完全由 AI 驱动。

这种野心并非空谈，就在今天，OpenAI 推出了其商业化布局中最重要的一步棋，在 ChatGPT 内直接购物。

用户现在可以在与 ChatGPT 的对话中，直接购买来自 Etsy 甚至 Shopify 商家的商品。当我们跟 ChatGPT 聊天，问到「适合送给陶瓷爱好者的礼物」时，ChatGPT 不再只是给一个链接，而是直接展示商品并提供一个「购买」按钮，不需要离开聊天窗口，几下点击就能完成支付。

▲ 这项名为「即时结账」（Instant Checkout）的功能，背后是 OpenAI 与 Stripe 联合开发并开源的「代理商业协议」（Agentic Commerce Protocol）。通过这个协议，OpenAI 正在为 AI 时代的电商制定新的规则。

电商、视频、社交、生产力，当这些过去分散在不同 App 中的功能，开始被一个统一的 AI 入口所整合时，OpenAI 的 Open 原来是「我全都要」。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博

大疆 vs 影石：1998 元起，最强拇指相机对决

爱范儿

Lin

2025年9月23日 20:00

你有没有发现，大疆最近有点不讲武德了？
新出的全景相机 OSMO 360，直接硬刚影石；扫地机器人 ROMO，更是面向所有品牌「无差别出击」。
现在他们又带来了 OSMO nano，规格对标影石 GO Ultra，但价格仅售 1998 元起，国补后仅需 1698 元，它用起来有看起来这么香吗？

竟然一切都还是熟悉的样子

OSMO nano 的磁吸分体设计其实在大疆几年前的 Action 2 就用过了，我个人很喜欢那款产品，还安利好哥们买了个大全套。可惜当时技术有限，温度控制很糟糕，哥们被它玩得一头雾水。所以这一次，我特别在意它长时间拍摄的散热表现。

大疆延续了堆料的传统，这次直接给到了 1/1.3 英寸的传感器，可以正面硬刚影石最新的 GO Ultra，所以这次我们就直接拿来对比。大中午在广州的太阳底下开拍，对我们的相机来说也是个挑战，我很希望大疆能有亮眼的表现。

但是……经过我们实测，这次的温度控制还是有些不尽人意。

同样是 4K60 标准码率，其他设置保持默认或调到一致，OSMO nano 比 GO Ultra 要更早停机进入过热保护。

摄影同事外出拍摄回来也和我说这次有点容易过热，一开始我还不信。说实话，大疆这个表现我认为还有非常大的提升空间，希望能赶紧优化掉这个问题，千万不要重蹈覆辙了。

温度的牺牲换来了什么？

接着对比画质，两部产品的传感器尺寸接近（DJI OSMO nano 为 1/1.3″，insta360 GO Ultra 为 1/1.28″），但是画面表现有一些明显的差别。

我们把两部设备调整到同样的色温和自动曝光，但是出来的颜色区别很大，大疆的色彩比影石更冷更明艳，再加上大疆有 10bit 的色彩直出，动态范围更是好得太多。放大也能发现大疆的细节会比影石更锐利一些，所以整体观感上大疆会清晰很多。

夜景部分大疆的优势更明显，清晰度和动态范围比起影石要明显更好一些，所以整体看下来，大疆虽然发热大一些，但确实得到了更好的画面表现。

将两部相机同时穿在身上，正常走几段路看看防抖效果。同样是超广角，大疆的视角会比影石更广一些，画面的运动幅度会更大，但整体的稳定效果我觉得二者差距不大，夜间拍摄也是类似的表现。

大疆标称的相机本体续航比影石更长，但在室内环境里二者都因为过热而提前结束了比赛；合体状态的差距更明显，大疆的发热问题实在太影响续航时长。需要长时间拍摄的话，建议大家适当降低拍摄规格，或者设置里打开「长续航模式」，情况会有所改善。

OSMO nano 这次依然做了内置存储，还有能一键导出用来备份的 SD 卡槽，不用另外再买配件，这点值得好评。不过我希望这个盖子能再优化一下，它是这样直接盖上去的，用久了我感觉会容易扣不紧，不像 Action 上的那种滑盖那么靠谱。

创新是竞争的源动力，也是副产物

不难看出，OSMO nano 是一款很“大疆”的产品：经典的工业设计、最新的透明语言、熟悉的堆料风格，还有强烈的大疆生态延续性。经过几年布局，大疆的手持影像产品已经自成体系。

OSMO nano 兼容 Action 系列配件，老用户能省下一大笔配件开支。反观影石，几乎每一代都有新接口，新配件必须买新的，主打一个「影石面前人人平等」。

最近这一两个月，看影石和大疆斗法堪称科技圈一大趣事。大疆做了影石擅长的全景相机，影石出了大疆拿手的无人机，现在大疆又杀入影石开创的拇指相机赛道。

有人觉得这是无谓内卷，但爱范儿觉得恰恰相反——正是在这种交锋中，两家都展现出了惊人的创造力——大疆定制方形传感器解决全景画质难题，影石把全景方案带上了天，大疆又凭借堆料实力突破了拇指相机的性能瓶颈。

这样的竞争在爱范儿看来是良性的：他们很清楚各自的用户群体，不打价格战、不炒作参数，靠技术积淀去挖掘产品潜力，强化品牌定位。

那说回到 OSMO nano 和 GO Ultra 之间的选择。如果你是家庭用户，我建议选择影石，它侧重易用，推出更贴近普通玩家的功能和 app。两家都认真研究了用户，也在形态和功能上积极创新；如果你是偏专业的用户，我建议选择大疆，它强调性能，面向专业用户提供 10bit 色彩和 D-Log M 模式。

而且，国补后仅需 1698 元起的价格，让 OSMO nano 具有了超强的竞争力。

爱范儿很乐于在更多行业看到这样的「竞争」，毕竟，无论是大疆创新还是影石创新，他们的核心竞争力，还是落在「创新」二字。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博