阅读视图

发现新文章,点击刷新页面。

早报|App Store搜索页将加更多广告/海南封关:iPhone直降最高2140元/小红书发力「优质中长视频」

cover

🚀

ChatGPT 版应用商店正式上线

📱

海南自贸港封关首日 iPhone 17 Pro Max 最高直降 2140 元

🕵️‍♂️

苹果 App Store 搜索页将加入更多广告

📈

中国大模型「第一股」将至:智谱与 MiniMax 通过港交所聆讯

💰

OpenAI 洽谈最高 1000 亿美元融资,估值或达 7500 亿美元

🚗

芯片短缺,本田中日工厂或暂停生产

🎦

小红书社区架构大调整:全面发力「优质中长视频」

📢

腾讯回应「元宝到底是 AI 还是人」质疑

🗺

千问 App 全面接入高德地图

💡

微软 AI 负责人:未来 5–10 年保持 AI 前沿将付出「数千亿美元」成本

📱

小米 17 Ultra 定档下周,与徕卡合作全面升级

🤖

逐际动力发布多形态具身机器人 TRON 2:一机三态,4.98 万元起

🚀

火山引擎发布豆包大模型 1.8,Agent 能力全球领先

重磅

ChatGPT 版应用商店正式上线

昨天,OpenAI 在 ChatGPT 正式上线「应用」商店功能,在 ChatGPT 网页端点击「应用」或访问 chatgpt.com/apps 即可进入新功能页面,应用分为「精选 / 生活方式 / 工作效率」三大类。

目前,已上架的应用包括 Adobe Photoshop、Apple Music、Canva、Figma、Booking.com 等,应用可为对话引入新的上下文,支持在聊天中完成订购、将大纲转为演示文稿、搜索酒店公寓等操作。

连接后,可在聊天界面中通过「@ 应用名」调用指定应用或点击对话框左侧的「加号」进行选择,ChatGPT 还会基于上下文与使用习惯自动推荐相关应用。

OpenAI 表示,开发者已可提交应用进行审核与发布,并提供最佳实践指南、开源示例应用、专门的 UI 库与处于测试阶段的 Apps SDK 等资源,深受用户欢迎的应用有望获得重点推荐或在对话中被主动推荐。

早期阶段,开发者可将 ChatGPT 应用与其网站或原生应用相连以完成实体商品交易,OpenAI 也在探索包括数字商品在内的更多变现方式,并将根据反馈持续迭代。

所有应用须遵守严格的安全与隐私规定:符合 OpenAI 使用政策、提供清晰隐私政策、仅请求实现功能所需的必要信息;用户可随时断开连接,断开后应用将立即失去访问权限。

与此前的「GPTs Store」不同,本次应用商店以更接近苹果 App Store 的形态将复杂能力封装为可点击、可订阅、可组合的「应用」,使看似普通的对话框成为总入口,并为其带来连接第三方应用的能力。

🔗 相关阅读:突发|ChatGPT 版应用商店正式上线

海南自贸港封关首日 iPhone 17 Pro Max 最高直降 2140 元

昨天,海南自由贸易港正式启动全岛封关运作,实施「一线放开、二线管住、岛内自由」政策:

  • 一线,即海南与境外之间的货物、人流进出更加便利;
  • 二线,即海南与内地之间的货物进出需严格监管;
  • 岛内则实现要素自由流通。

据界面新闻报道,三亚海旅免税城等门店迎来购物热潮,苹果 iPhone 等热门数码商品因免税与消费券叠加出现显著降价。

其中,iPhone 17 Pro Max 256GB 免税价为 9299 元,较电商平台便宜 700 元;2TB 顶配版本免税价 16859 元,叠加消费券后低至 15859 元,较官网省 2140 元。

免税城方面称,iPhone 17 Pro Max 1TB 和 2TB 版本目前无货,256GB 与 512GB 版本可正常购买。

同一门店其他机型价格也有下调:iPhone 17 Pro 256GB 免税价为 8299 元,叠加优惠后较电商平台省 1000 元;iPhone 17 256GB 差价约 420 元,幅度相对较小。

免税清单扩容同步落地,新增扫地机器人、微型无人机等品类,覆盖税目扩充至 6600 个、较此前近 3 倍。封关配套的便利措施包括「即购即提」不限机场提货、免税商品种类扩容与高单价商品的显著价格优势。

离岛免税规则明确:离岛旅客需凭离岛交通凭证及身份证购买,全年免税额度为 10 万元,超额需补税;岛内居民在有年度离岛记录情况下,可不限次购买 15 类「即购即提」商品,但单件单价需低于 2 万元。

官方强调,免税商品不得转售,「套代购」将面临禁购及征信处罚。海旅免税城当前热门机型出现断货与补货交替的供需情况,提示消费者提前规划购买与出行安排。

海南大学教授刘家诚,表示「封关不是封闭,也不是封岛,而是更高水平的开放」,海南自贸港将成为中国与全球市场的「超级接口」,亦是国内国际双循环的重要交汇点。

大公司

OpenAI 发布 GPT‑5.2‑Codex,强化防御性网络安全应用

今天,OpenAI 正式发布智能体编码模型 GPT‑5.2‑Codex,定位为「迄今最前沿的智能体编码模型」,面向复杂的软件工程与防御性网络安全场景。

该模型基于 GPT‑5.2 定向优化,具备更强的长程任务执行能力、代码重构与迁移性能、原生 Windows 环境适配,以及对截图、技术图表和用户界面的精准理解。

OpenAI 表示,GPT‑5.2‑Codex 已在 Codex CLI、IDE 扩展、云端与代码审查场景向付费 ChatGPT 用户开放,API 接入将在未来数周逐步启用。

在性能方面,GPT‑5.2‑Codex 在 SWE‑Bench Pro 基准测试中准确率达到 56.4%,在 Terminal‑Bench 2.0 中准确率为 64.0%,均较前代模型有所提升。

模型通过原生上下文压缩提升长周期任务的稳定性与 token 使用效率,并在终端任务中展现更高成功率与可靠性。

此前,研究人员已利用 GPT‑5.1‑Codex‑Max 在 React 框架中发现并披露漏洞,显示该系列模型在现实防御性研究中的潜力。

在网络安全方面,OpenAI 强调 GPT‑5.2‑Codex 虽未达到「高」级能力门槛,但已显著增强防御性能力。

公司同步推出「可信访问计划」,仅限邀请安全专业人士与具备明确应用场景的机构参与,用于漏洞研究、授权红队测试等防御性工作。

OpenAI 表示,随着模型能力持续提升,将以负责任的方式逐步开放访问,并与安全社区保持紧密合作,以降低滥用风险。

苹果 App Store 搜索页将加入更多广告

据 9to5Mac 报道,苹果宣布将在 App Store 搜索结果中扩充广告位,明年起在搜索结果列表更靠后的位置新增广告,以进一步提高广告主通过搜索推动下载的机会。

苹果在 Apple Ads 官网更新中称「搜索是大多数用户在 App Store 中查找并下载应用的主要方式,近 65% 的下载发生在搜索之后」,因此将「在各类搜索查询中引入更多广告」。

目前,App Store 搜索结果顶部仅有一个广告位,新增广告将出现在更靠后位置。

苹果表示,广告主与开发者无法选择或竞价特定广告位置,实际展示位置取决于竞价出价金额及其在拍卖中的排名,且同一广告活动的展示位置也可能变化。

计费方式维持按点击付费或按安装付费,广告格式在不同位置保持一致,可使用默认或自定义产品页面并可选深度链接。现有搜索广告将自动获得新广告位资格,支持 iOS 26.2 与 iPadOS 26.2 及更高版本。

苹果官网信息显示,App Store 每周访问用户超过 8 亿,超过 85% 的用户在最近一次访问中至少下载了一款应用,搜索结果顶部广告位的转化率约 60%。

美光:全球内存短缺将延续至 2026 年后

据 The Verge 报道,全球三大内存供应商之一美光在最新财报中预计,受 AI 驱动的需求激增影响,DRAM 和 NAND 的「紧张行业状况」将持续至 2026 年以后,且「在可预见的未来」供给将明显落后于需求。

美光 CEO Sanjay Mehrotra 在周三的财报电话会上表示,过去数月客户的 AI 数据中心建设计划显著推高了对内存与存储的需求预估,公司虽将于明年把 DRAM 与 NAND 出货提高约 20%,但仍不足以满足各类市场的广泛需求,PC 出货在明年可能因此受到影响。

在 AI 浪潮带动下,美光财季营收再创新高,达到 136.4 亿美元,较去年同期的 87.1 亿美元显著增长。

随着 OpenAI、Meta、Microsoft 与 Google 等公司为数据中心部署更强算力,附带高带宽内存(HBM)的芯片需求快速上行,美光正将资源优先倾斜至 HBM 业务。

近期,该公司关闭了面向消费者的英睿达 Crucial 业务,以集中满足 AI 客户的更高价值订单;HBM 相较标准 DRAM 需要约三倍硅晶圆,从而进一步挤压面向 PC、智能手机、智能电视与汽车等日常消费设备的 DRAM 供给。

Mehrotra 称「供给将在可预见的未来显著低于需求」,并表示尽管投入巨大,公司仍「无法满足所有细分市场其他客户的需求」。

为扩充产能,美光计划于 2027 年在爱达荷州新厂投产,2030 年在纽约州新厂投产;但在新产能落地前,行业性内存供需不平衡将延续。

中国大模型「第一股」将至:智谱与 MiniMax 通过港交所聆讯

据 36 氪报道,国产大模型企业 MiniMax(稀宇科技)与智谱 AI 已于本周初完成中国证监会备案,并通过港交所聆讯;其中 MiniMax 计划于 2026 年 1 月在港挂牌上市。

若成功,MiniMax 将成为全球从成立到上市速度最快的 AI 公司之一,自 2022 年初成立至 IPO 仅用四年。

MiniMax 的收入结构中 C 端产品占据重要位置,彭博社曾报道其 2024 年预期营收约 7000 万美元,较大比例来自角色互动产品 Talkie。

第三方数据显示,2024 年 11 月 Talkie 月活约 2519 万;视频生成产品「海螺 AI」自上线以来,曾连续 6 个月位居全球视频生成类产品榜首。

资本层面,MiniMax 已完成 7 轮融资:腾讯领投 2.5 亿美元 B 轮、阿里 6 亿美元战略投资、最新一轮由上海国资出资 3 亿美元,公司估值超过 40 亿美元(约 288 亿元人民币)。

智谱 AI 的上市路径今年以来明显加速:4 月在北京证监局完成 IPO 辅导备案,由中金公司担任辅导机构;7 月有消息称其评估将 IPO 地点调整至港交所,如今完成聆讯意味着这一判断已落地。

融资方面,智谱自 2019 年成立至今累计完成 16 笔融资,IT 桔子数据显示最新估值约 400 亿元人民币;2025 年内先后引入杭州、成都、珠海等地资金,并于上市辅导后三个月获浦东创投集团与张江集团联合注资 10 亿元,背后已集齐北京、杭州、成都、珠海、上海五地国资背景。

组织与营收方面,智谱今年调整 G 端与 B 端业务,由 CEO 张鹏统一管理以提升人效;其面向开发者的软件工具与模型业务年度经常性收入(ARR)已超 1 亿元,预计 2025 年总营收将实现 100% 以上同比增长,并希望未来 API 业务收入占比提升至 50%。

OpenAI 洽谈最高 1000 亿美元融资,估值或达 7500 亿美元

据澎湃新闻、财联社报道,OpenAI 正在与投资者就新一轮融资进行初步洽谈,融资规模最高或达 1000 亿美元,公司的估值目标约为 7500 亿美元。

消息称,这笔潜在融资将成为今年规模最大交易之一,若落地,OpenAI 的估值较今年 10 月约 5000 亿美元将跃升近 50%。

此前多家外媒报道称,亚马逊正在与 OpenAI 洽谈一项至少 100 亿美元的投资,OpenAI 将使用 AWS 的自研 AI 芯片 Trainium。

奥特曼透露,公司或在 2027 年上市,且正考虑最早在 2026 年下半年向监管提交上市申请。

芯片短缺,本田中日工厂或暂停生产

据日本共同社报道,受半导体短缺影响,本田计划自 12 月下旬至明年 1 月上旬对日本与中国工厂实施停产或减产:

  • 与广汽集团的合资工厂将自 12 月 29 日起停产 5 天;
  • 日本工厂将在明年 1 月 5 日至 6 日停产两天,7 日至 9 日的产量也将低于原计划。

本田称,今后的生产将视半导体供应情况调整,涉及的日本工厂未公布,但埼玉制作所(埼玉县寄居町)与铃鹿制作所(三重县铃鹿市)被指「可能对象」。

本田在 11 月公布的截至 2026 年 3 月的财年合并财报显示,因半导体短缺导致产量低于预期,营业利润预计缩减 1500 亿日元(约合 67.83 亿元人民币)。

小红书社区架构大调整:全面发力「优质中长视频」

据凤凰网科技报道,小红书在几个月前对社区组织架构进行了深度调整,核心目标直指「增长」,从过往的垂类运营逻辑转向依据不同业务目标的划分。

报道指出,社区部作为基础与核心板块,现由云帆(薯名)与新岛(薯名)分别负责两条业务线:

  • 云帆负责的「Live」直接向小红书 COO 柯南(薯名)汇报;
  • 新岛负责的「Village」继续向社区业务负责人帕鲁汇报。

「Live」将对应一部分PGC内容,初步定位为「优质中长视频」,时长或超过 2 分钟,并计划培养更多大 V。

云帆此前供职于 B 站,拥有更丰富的视频运营经验。帕鲁(本名叶恒)在 2024 年初加入小红书,此前任快手电商产品一号位,入职后负责增长产品、生态产品及视频产品;社区市场部门由白板(薯名)负责,现向云帆汇报。

此次调整延续了小红书在增长上的策略演进:2023 年提出「坐一观三」,即在坐拥 1 亿DAU(日活用户)的基础上向 3 亿 DAU 进发。

除社区业务外,小红书由商业部与交易部整合的「大商业」板块由柯南担任总负责人,并与小红书 CMO 之恒共同组成领导班子;两部门的一级架构保持稳定,不作调整。

彭博社引金沙江创投内部文件称,小红书在 2025 年中估值升至 260 亿美元(约 1830 亿元人民币),较 2025 年初的 200 亿美元增长 30%。

对标同行,截至 2025 年 12 月,B 站市值约 100 亿美元(约 702 亿元人民币),快手市值约 2787 亿港元(约 2522 亿元人民币);财报显示,B 站 Q3 日活 1.17 亿、月活 3.76 亿,快手日活 4.16 亿、月活 7.31 亿。

腾讯回应「元宝到底是 AI 还是人」质疑

昨天,腾讯针对「元宝到底是 AI 还是人」的质疑发表声明:所有带有「内容由 AI 生成」标识的评论,均由元宝 AI 独立生成;无该标识的回复为编辑真人撰写。

腾讯同时强调,元宝在多平台与跨时段的高频响应「并非轮班人工可达」,以此澄清外界对运营模式的误解。

腾讯称,当前微信公众号、视频号、QQ 浏览器、腾讯新闻、QQ 音乐、腾讯自选股与腾讯视频等主流产品评论区,均已接通「@元宝」互动。

在社交层面,微信与 QQ 可添加元宝为好友,支持一对一交流、文件处理、事务咨询与群聊「一键总结」,用于快速梳理「999+」消息。上述覆盖的时间段横跨凌晨、清晨、早高峰、午休与深夜。

索尼与腾讯就《荒野起源》案达成和解:索尼撤诉、腾讯多平台下架

据 The Verge 报道,索尼互动娱乐与腾讯就《荒野起源》涉嫌抄袭《地平线》系列一案已达成保密和解。

当地时间 12 月 17 日提交的法院文件显示,索尼已撤回起诉,相关案件被法院驳回,原告不得就同一事由再次起诉。

腾讯美洲区通讯主管 Sean Dejin 表示,双方不会就此事发表进一步公开评论,并期待未来合作。

值得注意的是,《荒野起源》已从 Steam 及 Epic Games Store 等平台下架。不过,《荒野起源》官网仍可正常访问。

12 月初,双方递交联合动议达成临时协议:腾讯暂停宣发与测试,且不早于 2027 年第四季度发售;索尼同意延长法律程序时限并合并听证会日程。案件原定 2026 年 1 月 29 日听证,如今已在开庭前以和解方式落幕。

此前,PlayStation 中国官方账号曾转发《荒野起源》宣传物料并提及未来合作,随后删除;索尼也欢迎腾讯《三角洲行动》登陆 PlayStation 平台,并推荐腾讯北极光工作室新品。

两家公司在第三方项目与股权层面亦有交集,这次和解与「期待继续携手」的表态,释放出维持合作空间的信号。

Manus 达 1 亿美元 ARR 里程碑

AI Agent 应用 Manus 近期达到「从零到 1 亿美元 ARR」的商业化里程碑,联合创始人张涛(社区 ID「hidecloud」)披露,自 3 月底启动商业化至今不足 9 个月,年化运行率已达 1.26 亿美元。

Manus 团队的产品路线由「AI 浏览器」转向「云端可操作的浏览器与数据访问」的 Agent 框架,核心信念是「Less structure,more intelligence」,减少对模型的人工控制,让 AI 在具备「电脑、权威数据访问、适当训练与用户反馈」的环境中自行涌现能力并持续进化。

千问 App 全面接入高德地图

昨天起,千问 App 全面接入高德地图能力,围绕导航与生活服务实现深度打通:用户在千问 App 中可一体化完成路线规划、周边餐饮娱乐检索与「顺路」店铺筛选,提升复杂出行需求的响应效率。

此次接入覆盖新能源车出行、限行规避与服务信息等关键场景。

用户提供出发地、目的地与车辆续航信息后,千问 App 将参考高德路线数据自动规划沿途充电站;同时支持依据车牌尾号、出行时间与目的地生成合规出行方案,并在路线规划界面同步展示收费站、服务区与限行提示。

高德称,未来将与千问在餐饮、娱乐、休闲等生活场景继续扩展智能服务体验。

蔚来全新 ES8 交付突破 30000 台,创国内纯电 SUV 新纪录

昨天,第 30000 台蔚来全新 ES8 新车在成都天府艺术公园蔚来中心完成交付。这一里程碑距离 11 月 29 日达成第 20000 台交付仅过去 19 天,创下国内 40 万元以上纯电车型最快突破三万台交付的纪录。

交付现场车主任先生表示,此次增购全新 ES8,主要看中其基于纯电架构带来的越级空间表现,以及蔚来「可充可换可升级」能源服务体系所提供的便利与高效补能体验。

蔚来方面称,全新 ES8 销售势能持续走强,产能正在加速爬坡,交付节奏明显提速。随着纯电技术的成熟与补能体系的完善,越来越多原本选择增程技术的用户正加速转向纯电车型。

💡 微软 AI 负责人:未来 5–10 年保持 AI 前沿将付出「数千亿美元」成本

据《商业内幕》报道,微软 AI 负责人 Mustafa Suleyman 在播客「Moonshots with Peter Diamandis」的最新一期中表示,未来 5 到 10 年内,想在前沿 AI 领域保持领先将需要「数千亿美元」级别的投入。

他强调,这不仅包括前沿模型的研发,还涉及对顶尖研究人员与技术人才的高薪竞争,以及在全球范围内建设「千兆瓦级」 CPU 与 AI 加速器所需的基础设施规模。

Suleyman 称,微软正将自身视作一家「现代施工公司」,其使命是实现前沿模型的自给自足,并打造「世界级的超级智能团队」。他表示微软正在「全力推进前沿」,目标是构建「最强、最安全的超级智能模型」。

Suleyman 在节目中坦言,按照当前的成本曲线,「很难说」初创公司能否与大厂在前沿 AI 上抗衡,市场估值的「泡沫与不确定性」部分源于对「智能爆炸」是否会突然到来的分歧 —— 一旦这类拐点出现,「可能会有很多玩家同时到达」。

在此前的公开表述中,他将团队目标描述为打造「人本主义的超级智能」,即更加贴近人类利益的系统取向。

微软在最新一个财季的营收为 777 亿美元,当前市值约 3.54 万亿美元,Suleyman 认为大型公司在算力与资本密集投入上的「结构性优势」在这一轮竞争中会持续显现。

Suleyman 还强调,置身大型公司带来的工程组织与资源整合能力是关键优势,他将微软的长期目标描述为在前沿模型上实现更强的内生能力与安全标准,从而在下一阶段的「超级智能」竞争中争取主导权。

新产品

3299 元,XREAL 推出新一代 AR 眼镜 1S

昨天,AR 眼镜厂商 XREAL 正式发布新品 XREAL 1S,面向更广泛的年轻消费群体,主打「一副眼镜,开启 500 英寸随身空间巨幕时代」,核心亮点包括:

  • 搭载自研 X1 空间计算芯片,支持实时 2D 转 3D 功能;
  • 配备 Sony Micro-OLED 微显示屏,双眼 1200p 分辨率与 700 尼特亮度,并获得 TÜV 莱茵眼舒适五星认证;
  • 原生 3DoF 空间显示能力,无需手机 App 或额外配件即可实现稳定画面;
  • 全链路优化,M2P 延迟低至 3ms,显著降低眩晕感;
  • 提供多规格鼻托与柔性铰链,确保长时间佩戴舒适;
  • 跨生态即插即用,支持 iPhone、Android 手机、Steam Deck、Windows PC 与 MacBook。

XREAL 创始人兼 CEO 徐驰在发布会上表示,眼镜是最接近人类感知的终端,也是最有可能承载下一代计算形态的入口。

XREAL 强调,X1 芯片的使命是「Spatial Display for All」,即不挑设备、不设门槛,让任何人都能随时拥有可靠的空间屏幕。

XREAL 1S 定价 3299 元,已在京东与天猫开启预约,并将在 12 月 22 日 20:00 正式发售。

小米 17 Ultra 定档下周,与徕卡合作全面升级

昨天,小米宣布,小米 17 Ultra 将于下周正式发布。官方同时确认与徕卡的全球影像战略合作升级,引入「战略共创模式」,首次在移动影像领域推出徕卡 APO 认证长焦镜头,并将在夜景画质与长焦创作体验上实现显著提升。

根据相关爆料,小米 17 Ultra 的硬件规格预测整理如下:

  • 搭载第五代骁龙 8 至尊版、1.5K 超级像素直屏;
  • 内置接近 7000mAh 电池,支持 100W 有线与 80W 无线快充;
  • 支持超声波屏幕指纹,并保留 IP68 防尘防水;
  • 影像系统据称为三摄组合:主摄为豪威 OV50X 1 英寸传感器、5000 万像素超广角(支持微距)、2 亿像素潜望长焦(推测支持 5 倍光学变焦)。

值得注意的是,雷军将小米 17 Ultra 称为「超高端手机」。他表示,小米与徕卡全球影像战略合作升级,引入「战略共创模式」,并将首次应用全新的光学能力。

售价方面,信息源「数码闲聊站」推测,在保持 256GB 起步配置的前提下,小米 17 Ultra 起售价较上一代上调 500 元,至 6999 元,或是存储芯片价格上涨所致。而上代小米 15 Ultra 的起售价为 6499 元、顶配 7999 元(双卫星版)。

此外,网传已久的「小米NAS」新品或将同时在本次发布会上亮相。

逐际动力发布多形态具身机器人 TRON 2:一机三态,4.98 万元起

昨天,逐际动力 LimX Dynamics 发布多形态具身机器人「TRON 2」,售价 4.98 万元起。

据介绍,该产品基于「具身机器人通用基座」理念与全身模块化架构,一个本体即可在双臂、双足、双轮足三种核心构型间快速切换,并支持人形、四足等形态重构,面向 VLA 科研、移动操作与全身运控的全场景应用。

TRON 2 配备仿人类手臂自由度设计的具身双臂系统:单臂 7‑DoF 类人构型关节、70 cm 臂展与超大包络覆盖,末端采用仿人球形手腕构型以实现高自由度与狭小空间内的灵活运动;

双臂具备 10 kg 负载能力,机身极限负重可达 60 kg,覆盖高位、远距与宽范围任务,面向工业与家庭等多场景操作需求。

为适配不同应用场景,TRON 2 支持主流 VLA 前沿模型,包括 Pi 0.5 与 ACT,并基于家庭操作场景拆解餐品制作、桌面清理、衣物清洁、物品收纳、快递拿取等 10 个典型任务,提供数据集、模型训练与算法部署示例,宣称无需额外调试、即插即用。

火山引擎发布豆包大模型 1.8,Agent 能力全球领先

昨天,字节跳动旗下火山引擎在 FORCE 原动力大会上正式发布豆包大模型 1.8 及音视频创作模型 Seedance 1.5 pro。

据介绍,在多项公开评测中,豆包 1.8 在视觉推理、通用视觉问答、空间理解及视频理解等任务中均获得最佳或接近最佳成绩,整体水平已接近全球顶尖通用模型。

豆包大模型 1.8 工具调用能力、复杂指令遵循能力及 OS Agent 能力均得到增强,提升了模型在处理复杂任务时的规划与执行水平。

在视觉理解方面,单次视频理解帧数由 640 帧提升至 1280 帧,支持低帧率理解超长视频,并能调用工具对关键片段进行高帧率分析,适用于在线教育、产品质检等场景。

火山引擎总裁谭待介绍,截至今年 12 月,豆包大模型日均 token 使用量突破 50 万亿,较去年同期增长超过 10 倍;目前已有超过 100 家企业客户累计 token 使用量超过 1 万亿。

与此同时,火山引擎推出了 Seedance 1.5 pro 音视频创作模型。该模型采用原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现毫秒级音画同步。

在对白处理上,模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语)、英文及小语种,显著提升视频内容的真实感与全球化创作潜力。

🔗 相关阅读:实测豆包 Seedance 1.5 Pro:哪吒朱迪在线飙戏,复刻名场面,AI 台词、音效水平大更新

新消费

太二酸菜鱼推「透明菜单分类」,预制菜将明示

昨天,连锁餐饮品牌「太二酸菜鱼」宣布全面启动「透明菜单分类制度」,以食材新鲜度为核心明示原料使用情况,并按主材鲜活属性与预处理程度将菜品划分为 4 个类别。具体分类为:

  • A 类代表「新鲜主食材制作」,在太二「鲜活模式」门店中涵盖活鱼、活虾、鲜鸡、鲜牛肉及新鲜蔬菜;
  • B 类明确标注使用冷冻原料,如「香辣鱿鱼须」;
  • C 类覆盖预先腌制的食材,如「川式猪颈肉」;
  • D 类为集中预处理后配送至门店的品项,如「虎皮鸡爪」。

官方表示,招牌「酸菜鱼」采用每日新鲜配送到店的活鱼,门店现杀、切片、腌制,并搭配非遗工艺酸菜现点现煮;如「生炒菜心」「白玉丝瓜」等承诺日供新鲜蔬菜、现点现炒。

官方强调,「透明菜单分类制度」已同步覆盖母公司「九毛九」集团旗下多个餐饮品牌,消费者可据此直观选择不同食材处理方式对应的菜品。

不到一个月降超 30%,车厘子价格跳水

据央视财经报道,安徽合肥周谷堆批发市场车厘子批发价较去年同期整体下降约 20%,当前每箱主流报价在 150 元至 240 元之间,大尺码每箱 230 元至 240 元。

随着海运车厘子提前进入市场,价格回落较往年提前约一周,主打品种为「桑提娜」,日均进场量约 5 吨。市场预期未来几周海运到货将迎来供应高峰,交易或呈现「量大价跌」态势。

蓝鲸新闻援引北京新发地市场信息显示,11 月 30 日进口车厘子最低价为 55 元/斤,至 12 月 10 日空运车厘子降至 50 元/斤,海运最低价达 35 元/斤,按海运价格计算,不到一个月降幅超过 30%。

新发地批发端方面,4J 规格车厘子 5 斤装批发价为 248 元。零售端价格同样回落。

据盒马平台数据,智利车厘子 4J 级精品果从约 120 元/斤降至 91.8 元/斤,降幅超 20%;3J 级从 79.8 元/斤降至 71.8 元/斤,降幅约 10%;2J 级从最高约 71.6 元/斤降至 51.8 元/斤,降幅超 27%。

蓝鲸新闻报道认为,供给增加是主因。

一亩田产业研究院研究员许丽峰告诉记者,今年同期车厘子供应热度高于去年,智利种植面积较往年增长超 4%,上市时间提前且供应期延长,叠加国内蓝莓、柑橘等水果充足,消费端对车厘子的替代效应增强,整体行情预计较去年更低。

值得注意的是,春节较晚且接近智利车厘子尾季,消费高峰期价格或有一定上浮;与批发端对于海运高峰「量大价跌」的判断相互印证当前阶段的回落与后续波动预期。

周大福今天起再提价,官方回应

近日,周大福天猫官方旗舰店在首页提示「受市场因素影响,部分商品即将提价」,调价窗口为 12 月 19 日;多地门店销售表示已陆续收到新价签,大部分产品上调幅度集中在 4% — 16%。

其中,一条约 32.35g 的足金手链由 56800 元上调至 65800 元,涨幅约 15.8%。这将是周大福今年对「一口价黄金」产品的第三次提价。

据新浪财经此前报道,部分畅销款的实际涨幅已超过 30%,例如约 27g 的「五帝钱盘缠手串」从 38600 元上调至 50800 元,标价涨幅为 31.6%,今天上调后新价格更是达到 53800 元。

此前,3 月首轮调价幅度为 10% — 20%,10 月底第二次提价官方预计多数产品涨幅在 12% — 18% 之间,主要受国际金价持续上涨推升成本所致。

蓝鲸财经报道指出,周大福此次列出的调价商品除「一口价黄金」外,还包含部分铂金与铂金镶钻产品;周大福回应称价格调整属集团日常营运政策,将根据市场环境及产品需求适时调价。

行业背景方面,界面新闻称今年金价年内涨幅已超过 50%,波动加剧促使多家金店开启涨价;周大福同时推进渠道「瘦身」策略。

截至 2025 年 9 月 30 日,中国内地零售点总数降至 5663 家,较 2025 财年末减少 611 家,内地同店(直营)销售额上半年上升 2.6%,剔除钟表业务后增长 4.7%。

好看的

央视春晚公布四款马年吉祥物

据新京报报道,中央广播电视总台《2026 年春节联欢晚会》昨日发布四款吉祥物形象「骐骐」「骥骥」「驰驰」「骋骋」,与晚会主题「骐骥驰骋 势不可挡」呼应。

吉祥物整体设计融入流云纹、山云纹等千年纹样,寓意生生不息与万象更新,寄托「马到成功、前程似锦」的美好祝愿:

  • 「骐骐」灵感源自西周盠驹尊,配色取自「骐」本义(青黑色马),造型以当卢、束发髻呈现庄重典雅的气质;
  • 「骥骥」取材汉代天马与铜奔马姿态,并借鉴错金银镶松石狩猎纹铜伞铤上的飞马造型,以双翼舒展呈现腾云逐日的英姿;
  • 「驰驰」参考唐代三花马与昭陵六骏,束起马尾强化英武与自信;
  • 「骋骋」以普氏野马为原型,强调粗壮结实与身形矫健的野生血统。四者共同以历史文物与典型纹样为依据,形成跨时期的视觉谱系。

报道指出,中国普氏野马种群数量居世界之首,体现生物多样性保护与生态文明建设的阶段性成果。吉祥物发布以「四骏齐亮相」呈现,意在与全球华人共享新春气象,迎接马年新岁。

《永恒站》定档 12 月 24 日

《永恒站》昨天发布定档海报与预告,确认将于 12 月 24 日登陆院线。影片由大卫·费恩执导,叙述「死后世界」中转站的奇幻设定与一场关于真爱的抉择。

故事围绕女主角琼安在「现任丈夫赖瑞」与「战时阵亡、苦候 67 年的前夫卢克」之间的最终选择展开。片方称其以轻盈幽默与温暖情感呈现「爱与永恒的终极考验」。

《用武之地》开启预售:12 月 24、25 日全国点映

电影《用武之地》宣布开启预售,将于 2025 年 12 月 24、25 日 18:00-22:00 全国点映、于 12 月 31 日跨年上映。

片方称,为呈现「真实的人质自救逃亡之路」,剧组前期远赴非洲取景采风,拍摄近万张照片并筛选约百张作为创作参考。

片中的「子弹集市」依据当地真实市场改造,战乱地带枪支交易与日常买菜同样便利,当地人以布自制足球的生活面貌亦被纳入呈现。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


实测豆包 Seedance 1.5 Pro:哪吒朱迪在线飙戏,复刻名场面,AI台词、音效水平大更新

AI 视频最近的玩法特别多,颇有上半年 AI 生图火起来的那种感觉。

▲ 视频来源:https://x.com/pabloprompt/status/2000706593579573301/

之前火过一遍的 AI 探班视频,随着模型能力的提升,现在又开始变成了社交媒体上的热门玩法。

不过彻底摒弃了以往复杂的工作流,有更好用的模型,甚至是简单几句提示词就能复刻,视频里的同款真实感。

视频生成模型的优化,不断地在降低,对我们人类提示词工程的依赖,同时还带来了更稳定的一致性保持。

豆包最近更新了新一代的音视频生成模型,豆包 Seedance 1.5 Pro,在音视频的生成上也有了明显的改善。现在它生成的视频,支持中文、英文、日文、韩语、西班牙语等语种的不同声韵,同时针对中文场景,还能生成四川话、粤语等方言。

不仅能说,而且还能模仿不同语言的口音。有声视频是 Seedance 1.5 Pro 的一大突破,在视频生成本身,结合音频的音画同步,以及电影级的运镜两项优化,让 AI 视频看起来更真实、更细致。

目前该模型已上线豆包 APP,只需要打开豆包,点击「照片动起来」,选择 1.5 Pro 模型,就能体验到 AI 生视频的快乐。此外,在火山引擎体验中心、即梦 AI 也可以体验。

我们也提前测试了一波,Seedance 1.5 Pro 完全可以说,是现在手边能拿起来直接用,能同时融合声音,表现最好的视频生成模型。

听听「臣妾做不到啊」的原音重现

《疯狂动物城 2 》上映之前,网友们对配音演员的选择,有很大的争议。现在 Seedance 1.5 Pro 的语音生成有多牛,我们可以看看之前网上很火的甄嬛传和让子弹飞,两个视频的配音,让它来完成是什么样。

从网上找了一张影视剧的截图,然后丢给豆包,我们甚至什么提示词都没有输入,它就能做到自动识别视频画面,生成一段有感情的台词戏。

▲在豆包 App 内,使用「照片动起来」,上传首帧,生成视频

皇后和张麻子都演得太像了,这和几个月前的视频生成模型,完全不是一个 Level。 以前那些 AI 视频,口型对不上,或者声音有机械感的问题,现在都解决了。

但普通话对它来说都是基本操作,方言的表现才是 Seedance 1.5 Pro 打败那些国外模型的独门秘籍。就像 Sora 2 和 Google Veo 3.1 虽然在画面生成上被认为是行业领先,但如果把上面这两张首帧图片丢给它们。Sora 和 Veo 3 都理解不了甄嬛传的经典台词,和张麻子这流利的四川话口音。

全运会刚结束,如果你也在广州,一定忘不了「活力大湾区,魅力新广州」这句魔性的口号。我们生成了一张站在广州塔前面的照片,然后在豆包「照片动起来」里面输入提示词。

画面里的这个男生正在面向镜头,向大家介绍他身后的广州塔,他用粤语说「活力大湾区,魅力新广州,我身后面嗰个就系广州塔喇!」

这个粤语水平怎么样,比多邻国里面的早茶四件套,虾饺、肠粉、烧卖、豉汁排骨,听着是不是要舒服一点。

而且,Seedance 1.5 Pro 有一个好处是「视听一致性」,意思是它能根据画面的内容,理解视频想要表达的故事,来自动生成对应的配音。

举个例子,当我们上传了一张明显是外国人的图片时,我们不输入任何提示词,它会自动使用英文来配音,并且让画面里的角色,说合适的台词。

即便是在中餐厅面馆里吃面的威尔·史密斯,Seedance 1.5 Pro 还是让他自动用英文来说话,而且这个吃面姿势也完全对了。

同样地,我们用它复刻了 AI 片场探班的视频,直接上传一张图片给豆包,不输入任何提示词,它会自动用中文来生成视频,还配上了台词,「哇,跟阿凡达合影啦!」

当我们重新生成时,Seedance 1.5 Pro 还把照片里的男生识别成韩国人,然后生成了一段讲韩语的视频。不过,说实话,他确实是有点韩国欧巴的感觉。

豆包视频生成还有一点特别好,是我们可以直接把生成的视频,下载为动图保存在手机。配合现在模型更强大的多模态理解能力,以及能生成更真实的画面,手机里那些静态的图片,让它们「真实地」动起来,然后发到微信朋友圈,可能真的会有人看不出来。

AI 巨人照加上无人机运镜,太酷啦

叙事是 Seedance 1.5 Pro 更新的一个关键词,它的意思是这些 AI 视频不只是单纯的生成,而是有了一定的故事感,能够对要表达的内容进行理解,让 AI 生成的视频,更像是一个有血肉的作品。

一个好的视频作品,灯光色彩、音效要出色。技术性的工作也少不了,运镜就是在音画之外,不可忽视的镜头语言。

Seedance 1.5 Pro 在这次更新里,在长镜头跟随、希区柯克变焦这些电影级运镜都有了大幅度的提升。

像是之前我们做的子弹时间,现在上传一张图片到豆包,调整一下提示词,子弹时间特效也自由了。

▲提示词:子弹时间效果。时间完全冻结。舞者悬浮在半空中,对抗重力。[定格画面]:舞者、她的头发和她的蓝色裙子绝对静止,就像时间冻结中的 3D 雕像。摄像机围绕悬浮的舞者水平轨道运行。背景建筑物改变透视(视差),而舞者保持锁定在中心。头发保持僵硬并指向上方,没有飘动。裙子布料是固体的并冻结保持不动。 电影级照明,高质量。

我们把同样的照片交给 Veo 3.1 处理时,它生成的子弹时间也很难做到保持角色一动不动。因为对大多数视频生成模型来说,识别到头发,就一定要飘动;看到裙边也要摆动;所以精准的运镜控制和调度,也是区分不同模型的一项重要能力。

还有这个前段时间很火的 AI 巨人照,现在我们也可以用超酷炫的无人机俯冲和穿越运镜,来凸显视频里的巨人。

▲提示词:电影级 FPV 无人机镜头,极致动态运镜:从高空鸟瞰开始,无人机急速俯冲向一位坐在城市街道中央的巨人,红砖建筑环绕两侧。巨人保持完全静止的姿势,身体、头部、四肢均不移动,如同雕塑般定格。无人机以特技飞行动作环绕巨人静止的身体——盘旋绕腿、从手臂下穿越、沿躯干螺旋上升,然后拉远展现巨人与微小车辆(红色双层巴士、黑色出租车)和行人的尺寸对比。超写实合成。比例 16:9,时长 5s,模型 1.5 Pro。

从参考图转视频,能更好的控制视频的输出效果。但 Seedance 1.5 Pro 的文生视频能力也毫不逊色。

根据字节公开的 Seedance 1.5 pro,在内部基准测试 SeedVideoBench-1.5 的模型表现结果,显示无论是 T2V 文生视频,还是 I2V 首帧转视频,和可灵 2.6、Google Veo 3.1 等模型对比,Seedance 1.5 Pro 的表现都有一定优势。

尤其是在音频生成和音画同步上,Seedance 1.5 Pro 几乎是碾压性的存在。

我们尝试让疯狂动物城朱迪和哪吒一起,一个普通话,一个四川话,演了一出 10s 的小剧场。

▲提示词:[0s-4s] 朱迪指着哪吒说(普通话,语速快,严肃): “那个小孩!站住!双手抱头!根据《动物城交通法》,你刚才风火轮超速了!” • [5s-10s] 哪吒(四川话,翻白眼,语速慢,拖长音): “哎呀,莫挨老子!我是踩的风火轮,又没烧你的油。瓜娃子,管得宽!”

这个视频的风格和内容,和我们平时看的动画片风格真的很类似。当义正辞严的兔朱迪警官,抓到哪吒的时候,那严肃的表情和语气;还有哪吒用四川话说台词,也能对上嘴型。

APPSO 今年前前后后也测试了有十多款 AI 视频生成的模型,我们在使用的过程中,发现很多以前的测试案例,放到现在已经是 Out 了。

一开始是鲁迅来了,都得让他说两句英文;能生成一个 5s 流畅播放的视频,就谢天谢地。现在的模型,不仅支持中、英、日、韩等多语种,广东话、四川话这些特色方言都能同步生成。

恍然间,AI 视频的进化,已经从按年计算变成了按月计算。昨天的突破,今天就是及格线。

▲ Seedance 1.5 Pro 案例截图|来源:字节跳动 Seed 官网

Seedance 1.5 Pro 这次更新,可能又会变成新的及格线。但至少现在我们看到了,有了音画同步后更有感染力的视频;多语种和方言的支持,也让 AI 视频更有「生活味」;专业的电影级运镜和智能理解能力,让一些高难度的复杂场景,也有机会通过 AI 生成。

当技术能够理解画面背后的故事,自动匹配合适的语言和情绪,我们距离想象力和创作自由的时代,又近了一大步。

实现这一切需要什么? 一张图片或者一句提示词。

打开豆包 APP,上传/输入,生成,就这么简单。每张照片都是待激活的故事,每次上传都是创作的开始。

步骤越少,门槛越低,创作者越多,用 AI 视频实现创意就该是这样。

文章内视频可点击该链接前往观看:https://mp.weixin.qq.com/s/em_E90Q7AdydHsNwVkAMTQ

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


NASA 新局长上任:亿万富豪转行上太空,自称和马斯克不太熟

美国国家航天局(NASA),来了个另类的新局长。

当地时间 12 月 17 日,美国参议院以 67 票赞成、30 票反对的结果,正式批准 Jared Isaacman 出任 NASA 局长,结束了此前 NASA 由交通部长 Sean Duffy 临时的代管的局面。

Jared Isaacman 何许人也?一个亿万富翁企业家,一位私人飞行员,上过两次太空的业余宇航员,是 SpaceX 的金主,现在是史上最年轻的 NASA 局长。

兴趣是上太空的亿万富翁

Issacman 的生涯也颇有企业家的传奇色彩。从小,Issacman 就对计算机和技术表现浓厚兴趣,16 岁时选择辍学,进入了一家支付公司做技术支持工作,发现商业模式有不少低效之处。

同样是 16 岁那一年,Isaacman 得到了爷爷给的 1 万美元支票,在家里的地下室开创了自己的第一家公司——一家名为「United Bank Card」的初创企业,旨在改变商业支付现状,Isaacman 会亲自打电话,一个个寻找潜在的客户。

这家公司不断壮大,几经变更后,成为现在知名的端到端支付技术提供商 Shift4 Payment。

2020 年,Shift4 Payment 在纽约证券交易所上市,作为 CEO 和创始人的 Isaacman 一跃成为亿万富翁,随后几年 Shift4 不断进军新领域,例如太空业务,和 Starlink 有所合作。

除了在商业领域取得成功,Isaacman 也在飞行领域颇有建树:他拥有多款军用喷气式飞机的飞行资格,在民用和退役军用飞机上累计超过 7000 小时的飞行时间, 还在 2009 和 2011 年打破了轻型喷气机环球速度世界纪录。Isaacman 还创立了 Draken International,运营着全球最大的私营退役军用战斗机机队。

征服了蓝天后,Isaacman 的下一个目标是宇宙。

他出钱又出力,亲自领导了 SpaceX 在 2021 年的 Inspiration4 计划,实现了人类史上第一次私人太空旅行,绕地球轨道飞行三天;在 2024 年的「北极星黎明」计划,Isaacman 再次领导团队出征,达到美国登月以来人类距离地球最远距离,Isaacman 本人更是成为了第一批在太空行走的私人宇航员

▲ 北极星黎明计划中出舱的 Isaacman

虽然主导过载人航天计划,还亲自「上天」两次,但 Isaacman 本人既非科学家出身,也没有政治背景,给人感觉更像是,一个相当富有的航空爱好者,通过不懈努力(和烧钱),跨界成为了全世界最重要的航天机构领导者,堪称「用爱发电」的最高境界。

资本选出的局长,目标是月球

不难看出,Isaacman 和 SpaceX 以及马斯克的关系密切,实际上他能参选 NASA 局长这件事,背后很可能也是马斯克在推动。

去年,当马斯克的盟友唐纳德 · 特朗普当选美国总统后,在 12 月就提名了 Isaacman,但今年 5 月特朗普和马斯克关系恶化,Isaacman 的提名又被撤回,上个月才重新批准。

本周三,参议员们以 67 票对 30 票的大幅票数,通过了 Isaacman 出任 NASA 局长的任命,这也是 Isaacman 政治生涯的开端。

不管是 Isaacman 的背景,还是和 SpaceX 的关系,都让人明显感觉到,这是资本选出来的航空局长。在听证会上,Isaacman 也表示,随着各国太空竞赛的进一步升温,吸引更多互相竞争的私营力量,是领先的关键。

网友纷纷担心 Isaacman 和 SpaceX 的密切联系,会使得 NASA 国家资源被马斯克个人所用,扭曲 NASA 宇宙探索的纯粹使命。

▲ 马斯克和 Isaacman

不过 Isaacman 直接否认了他与马斯克关系密切的说法:「有趣的是,在一个充满摄像头的世界里里,在餐厅、游艇等各种地方都没有我们的合照,因为根本不存在。」他表示,之前他选择和 SpaceX 合作,只是因为那是当时唯一的选择。

在上周,Isaacman 还对 SpaceX 的竞争对手、杰夫 · 贝索斯的蓝色起源公司示好,不排除未来会加大 NASA 与其的合作,这是有损马斯克利益的。

▲ 蓝色起源今年的全女私人航天计划

除此之外,他还建议 NASA 多和大学以及学术机构合作,认为未来 NASA 的角色是「科学的力量放大器」。

不管 Isaacman 和马斯克是不是一个战线,可以确定的是,这个新局长是一个不折不扣的前进派,并且有事他真上,面对当前 NASA 的困境,他雄心勃勃:

我会探索所有办法将项目送达发射台,甚至如果需要的话,我自己会资助。

曾经那些科学家和官员出身的局长很难给出这样的说辞,但对于自掏腰包让自己上太空的 Isaacman 来说,又相当合理。

▲ Inspiration4

目前特朗普、Isaacman 和马斯克都有同一个目标——月球。

Isaacman 在参选的听证会上强调了对总统登月计划的赞同;马斯克在上个月也宣布 SpaceX 接下来将大力聚焦登月;NASA 的「阿耳忒弥斯」登月计划也已经在与 SpaceX 紧密合作。

月球已经成为了各国太空竞赛的必争之地,中国已经计划在 2030 年在月球建立一个可运作的永久性月球基地;特朗普也表示,希望美国建立一个永久的月球基地,以便资源开采,并作为通往火星的跳板。

目前 NASA 的登月计划已经落后,虽然对外宣称将于明年春季进行载人绕月飞行任务,但实际情况并不明朗。

因此,对于 Isaacman 任期的一个重要的考察指标,就是能不能建出 NASA 的月球分部。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


Vidu Agent 掀桌子!一张图直出 4A 广告大片,拿来直接投放

过去这几个月,大家的朋友圈大概都被极其逼真的 AI 视频刷过屏,比如刀切一切、片场穿梭合影等等。它们的光影和细节如此逼真,近乎达到了「以假乱真」的地步。

而龙林、土豆人等 AI 创作者,更是靠 AI 视频火出了圈。

但当你也跃跃欲试,想要将它们转化为生产力时,断裂感便扑面而来 ——

你生成了一张绝美的产品图,想把它变成 15 秒的电商 TVC,结果 AI 给你吐出一段脸部崩坏、画质塌陷的废片;你想剪一个热门短视频,却发现需要分别生成几十个镜头,再自己去剪辑软件里对着音轨、找 BGM、调色。

目前的 AI 视频工具,大多还停留在「生成素材」的逻辑里。它们能给你一块精美的砖头,但没法直接给你盖出一栋房子。创作者依然被困在繁琐的「抽卡」和后期的修修补补中,那种「所想即所得」的快感,在复杂的商业需求面前瞬间烟消云散,该加的班一秒也没少。

同作为打工人的我,也一直在等待一个能把创意、分镜、生成、剪辑、音效统统打包,直接交付「成品」而不是「玩具」的帮手。

Vidu Agent 的出现,让我离这个期待更近了一步。它不再谈论参数,而是直接打出了一个极具诱惑力的口号:「你的专业视频创作伙伴」。

12 月 16 日起 Vidu Agent 已全球开放内测,用户进入 Vidu 官网(Vidu.cn)申请 Agent 内测,并加入社群即可优先获得体验权限,快去申请吧~

一键成片,从「灵感」到「交付」只需一步

「效率」与「质感」,往往是一对难以调和的矛盾。

既然主打「一站式」解决方案,我们决定略过寒暄,直接将 Vidu Agent 置入对效率极其敏感的电商广告与内容营销战场,看看它所谓的「一键成片」,究竟是噱头,还是具备掀翻桌子的底气。

初见 Vidu Agent,标准的输入框、附件栏与选项按钮,并没有让我感受到特别之处。反倒是整体「紫色渐变」的风格,确实很符合我对 AI 页面的刻板印象。

先来做个香水广告试试。我生成了一个香水的图片,并要求它输出一段具有高端质感的 TVC。

此时,Vidu Agent 才真正展露锋芒 —— 它并没有急于生成视频,而是先切换至「画布创作模式」。不到一分钟,一份完成度极高的分镜脚本便呈现在眼前。

这不仅是简单的画面描述,从场景构建到镜头语言,甚至连旁白文案都已就位。这种「先脚本,后成片」的交互逻辑,不仅赋予了用户掌控感,更提供了一种与众不同的交互体验。

我回复满意后,Vidu Agent 就马不停蹄开始干活。又是不到一分钟,一段完整可用的 15 秒香水广告就出来了。

成片的质感令人印象深刻:色彩的调教、光影的流动、镜头间的衔接都显得游刃有余。更重要的是,它读懂了香水这一品类场景下的「隐性需求」,知道香水这种产品的「调调」,成功营造了高端的品牌调性。

接着,让我们来看看 SKU 极多的服装电商。为了展示服装在不同场景的特性,拍摄团队往往需要频繁转场外拍,差旅和人力成本都巨大。那 Vidu Agent 能解决这个问题吗?

我们让它来做个冲锋衣的广告。我给它一张图片,让它生成一个具有溯溪、登山、野外徒步和城市遛狗多个场景切换的短片,以展示冲锋衣的日常穿搭场景以及防水、防风、防寒、时尚等功能特性。

初版交付迅速,观感尚可。但为了测试其极限,我们决定扮演挑剔的「甲方」,对溯溪场景的细节与内搭款式提出了修改意见。

给出修改意见之后,Vidu Agent 都能根据我的需求迅速呈现新的脚本,直到我给出「满意」的答复。

「提个意见」对于人类来说习以为常,但对于 AI 可不同,它考验的是一致性能力。过去不少 AI 生成的内容都需要不停「抽卡」,就是因为做不到一致性,没法在生成的结果里继续优化,经常出现产品变形或者「相似但不一样」的尴尬。

但在使用 Vidu Agent 的过程中,我完全没有遇到这个问题。你可以基于已有的好结果继续推进,一步步在画布里落实你的各种想法,而不是因为部分的不合心意而导致全盘推倒重来,给了创作者对于过程的「精细化编辑」权利。

哪怕实在不放心,我也可以直接点击画布的脚本区域,自己上手修改,算是一个兜底。

除了服装之外,面临同样问题的产品,还有家居和小家电。为了拍摄它们在各种家庭场景里的效果,要么得自己搭建实景拍摄,要么就得靠 3D 软件渲染。无论哪种,工作量都可以预见得大。

我们就以一个斗柜和一款面包机为例,看看 Vidu Agent 如何解决这些问题。

这两条产品的视频,前后花了不过十分钟。

没有繁琐的布景和建模,只需要给几张产品图片与不足 20 字的功能、场景要求, Vidu Agent 便完成了两条高质量产品宣传视频。

广告电商从业者即使不会写任何提示词,意味着只要有产品素材,就能批量产出可以直接投放的高质量产品宣传视频。

除了真实度极高的视频,Vidu Agent 还提供了丰富的音色选择,涵盖了各类电商品类常见的声音。

像是面向孩子们的玩具车,它就会明白应充满童趣,会智能适配小男孩的声音。

除了这些之外,你还可以把脑洞开得更大一些。比如最近的巨人照和巨型产品,也可以用来一键生成创意类广告。

如果仅止步于生成脚本与视频,Vidu Agent 充其量只能算是一个合格的「效率工具」,难免陷入同质化的平庸。

但它更难能可贵的一点是,哪怕你只是一个模糊的想法,Vidu Agent 也可以为你写一个完整故事。你只需要提供故事的主人公和角色,大致描述故事的情节,它就能帮你补充完整故事,做出直接可商用的专业视频。

▲用给的素材生成一个动画短片,以小猫和狼为主角,主题为猫陷入危险,狼挺身而出救它,它们从天敌成为好朋友的故事。保持画面风格和主角的一致性。

坦白讲,面对这样一支由 AI 生成的动画短片,即便是看惯了科技内容的我,也被它传递的暖意所打动。无论是画面的光影质感,还是配音的情绪拿捏,它都交出了一份超越预期的答卷。

但真正令我感到惊喜的,是它生成的内容已经到了「理解」的层面。

它读懂了香水和口红需要优雅的推拉镜头,家电和家居产品要融入生活场景,而潮牌需要品质感的场景切换,童趣的场景需要辅以温暖的故事与口音,以展示不同产品在多元使用场景中的功能和品牌调性。

直白来说就是,它像是一位在 4A 广告公司工作多年的创意总监,明白你想要什么样的内容。

这就好比你以前做饭得自己买菜、洗菜、切菜、炒菜,而现在你只需要告诉大厨:「我想吃鸡」,大厨就会为你奉上各种口味不同的菜单,你只要再确认一遍味道,等着菜做好端上来就行了。

不难看出,Vidu Agent 将想法落地的时间大大缩短,让创作者得以从无尽的重复劳动中抽身,回归到最本质的工作—— 创造。

复刻爆款,把专业「导演」请回家

爆款内容的诞生,往往伴随着全网范围内的解构与效仿。但实际上,模仿也并非易事:从分镜拆解到场景复现,再到重写故事、后期剪辑,复刻爆款的隐形成本居高不下。

可比起繁琐的流程,高强度的投入与不确定的流量反馈之间,更容易让创作者产生巨大落差。精心复刻的作品,很可能会在算法的海洋中石沉大海,让辛苦投入看不见回报。

而 Vidu Agent 要做的事情,就是打破这种高风险的博弈,让爆款生产成为可批量复制的事情,同时成本降低到可以忽略不计。

同样,我们找了几个不同类型的经典案例进行「复刻」测试。

首先是最近很火的《疯狂动物城 2》。我想让朱迪飞上蓝天,于是我想到了经典的宝矿力广告,让 Vidu Agent 给我二创一个朱迪在动物城飞上蓝天,实现新梦想的短片。

实话说,这个效果真的很不错。朱迪在车上跳跃,最后登上蓝天的故事,简直像是第三季的预告片。

当然,将爆款视频的画面语言和叙事逻辑复刻到一个产品上,也不费力气。例如前不久引发大家调侃的《WE ARE M》广告,我们就能将它变得更加高大上起来 ——

而这,正是 Vidu Agent 可怕的地方:如果说「一键成片」是降低了门槛,那么 Vidu Agent 的「复刻视频」功能,算是要把门槛都拆了。

Vidu Agent 不是简单的像素拷贝,而是真的懂得「爆款内核」。它会理解视频背后的骨架,学习视频的节奏、镜头切换和情绪曲线,将这些「爆款 DNA」提取出来,迁移到你提供的产品素材上。

那些曾经需要资深剪辑师逐帧分析才能习得的运镜逻辑,现在变成了一个你随时可用的表达工具。你不再需要从0推导公式,直接填写需求,AI 自会给出最优解。

门槛降低,简单可交付

Vidu Agent 的体验,让我有一个强烈的感受:AI 视频生成,正在经历从「玩具」到「工具」的蜕变,甚至开始扮演起「合伙人」的角色。

在过去,制作一条专业的电商 TVC 或爆款短视频,需要编导、摄影、剪辑组成的团队,以天甚至周为单位来打磨各种细节。这道由技术和成本构筑的「护城河」,曾将无数中小创作者挡在门外。

这种门槛,放在 AI 创作的领域亦是如此。从最初 Stable Diffusion 时代那令人望而生畏的复杂工作流,到后来需要像写代码一样撰写一长串提示词,「专业」的门槛都一直高悬。

而 Vidu Agent 作为一站式「专业视频创作伙伴」,让普通人也获得了这种落地的能力。它不再要求你精通镜头推拉摇移的语言,电脑上复杂的非线性剪辑,也不需要你苦练复杂的 Prompt 咒语 —— 它将繁琐的执行过程压缩进了一个简单的对话框,让「一人成军」不再是一句空话。

这意味着,创作者的「试错成本」被空前拉低,可以更加专注于自己的想法和创意,以极低的成本进行高频次的内容迭代。

另外敲重点!多模态领域 Vidu 首推 Agent API,Vidu 深入场景为企业提供可端到端交付结果的 API,不再是单点原子能力!

该 API 通过多智能体深度协同技术实现,主要面向全球开发者、企业及合作伙伴,广泛适用于全球电商平台、广告代理、品牌方、MCN 机构以及内容工作室等场景。欢迎开发者和企业体验,快速在自有业务/系统中构建创作智能体!

附体验地址:

https://platform.vidu.cn/

当创作者可以不再受困于技术细节的平庸,重新聚焦于创意本身,想象的主权才能再次回归:你只需专注于故事的灵魂,至于如何呈现,Vidu Agent 自会给你答案。

爱范儿,让未来触手可及。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


❌