阅读视图

发现新文章,点击刷新页面。

iPhone Air成苹果最不保值手机;黄仁勋:4点起来工作,子女不敢懈怠;影翎全景无人机正式上市,6799起售

豆包手机售罄后或 26 年底才有货

近日,据蓝鲸科技报道,伴随官方宣告售罄,豆包手机第一代产品或将不会再继续批量生产。供应链人士表示,字节跳动与中兴通讯第二代产品已启动研发,在未出现其他变量因素情况下,预计于 2026 年底出货。

另据据了解该项目的人士透露,字节跳动目前的策略是先不直接涉足供应链,而是通过与厂商合作验证模式。选择手机作为载体,正是基于其作为关键 AI 入口的战略判断。

字节跳动 CEO 梁汝波曾在 2025 年 2 月表示,「探索新的 UI 交互形式」是公司 AI 的三大目标之一。而其内部硬件团队 Ocean 已整合了来自 PICO VR、Ola Dance 智能耳机等项目的成员,持续探索「大模型+超级 App+硬件终端」的三位一体生态。(来源:蓝鲸新闻)

OpenAI 发起年内第四起收购

本周三,OpenAI 宣布同意收购为企业提供 AI 模型训练跟踪工具的初创公司 Neptune,这是本年度的第四次出手。

OpenAI 并未披露交易的财务细节。据知情人士透露,此次收购价值不足 4 亿美元,将以全股票形式完成。

据了解,此前 OpenAI 早已是 Neptune 的付费客户,使用其跟踪工具来监控和调试 GPT 大模型的训练。Neptune 的其他客户还包括三星、罗氏与惠普等全球巨头。

此前,OpenAI 在今年 9 月以 11 亿美元收购产品开发初创公司 Statsig;5 月又以逾 60 亿美元收购由 Jony Ive 创立的 AI 设备初创企业 io。此外,它们还通过合作关系入股 Thrive Holdings,旨在将人工智能嵌入会计、IT 服务等传统行业。

连续并购之际,OpenAI 估值正急速膨胀。今年 10 月份,OpenAI 在完成一项现任与前任员工出售约 66 亿美元股份的交易后,估值达到 5000 亿美元,使其成为全球最具价值的初创企业。(来源:财联社)

 

曝扎克伯格明年将削减三成元宇宙预算

近日,彭博社曝出 Meta 正考虑削减元宇宙业务部门投入。消息传出后,Meta 股价应声上涨。

彭博社援引知情人士的话表示,公司高管已考虑将元宇宙部门的预算削减最高 30%。

对于这家 Facebook 母公司而言,此举意义重大——该公司曾在 2021 年 10 月更名为 Meta,以宣告其战略重心将跳出社交媒体领域。

彭博社指出,此次拟议的削减计划很可能包含裁员,且该计划是 2026 年预算规划的一部分。(来源:新浪财经)

 

蓝色起源公布「月球吸尘器」:把月尘变为电池

据 CNBC 报道,亚马逊创始人杰夫·贝索斯旗下的蓝色起源与一家创业公司合作,利用 AI 研发出了一种能将月尘转化为能源的设备。

在周三举行的亚马逊 AWS re:Invent 大会上,蓝色起源展示了这款「月球吸尘器」,其关键技术由创业公司 Istari Digital 提供。

Istari CEO 威尔·罗珀向 CNBC 介绍称:「它的工作原理是吸取月尘,并从中提取热能,将其转化为能源,就像把月尘变成电池一样。」

对于航天器来说,在月球表面执行任务通常受限于月夜。月球上每隔 28 天就会出现为期两周的黑暗期,期间温度急剧下降,导致设备瘫痪失效,除非具备强大持久的电源。

罗珀补充道:「这有点像在家中使用吸尘器,但在吸尘的同时还能产生自己的电力。」(来源:凤凰网科技)

 

iPhone Air 成苹果最不保值的手机,贬值率破纪录

根据 SellCell 发布的市场分析数据显示,iPhone Air 成了苹果史上最不保值的手机。

SellCell 调取了美国 40 余家回收企业的实时以旧换新报价,将各机型的平均转售价与厂商建议零售价进行对比,为保证数据的真实性,所有参与调研的设备均为成色完好机型。

数据显示,iPhone 17 系列发售十周后的平均贬值率为 34.6%,表现优于去年同期的 iPhone 16 系列(iPhone 16 系列贬值率为 39%)。

相比之下,iPhone Air 的保值率最差,平均贬值率达到 44.3%,其中 1TB 版本 iPhone Air 跌幅最猛,被 SellCell 列为「表现最糟糕的机型」。

在保值率排名中,iPhone Air 1TB 版本垫底,SellCell 指出,这一现象预示着 iPhone Air 在二手市场行情存在不确定性。(来源:cnBeta)

周鸿祎:豆包手机助手拿捏所有 App

12 月 4 日,360 集团创始人周鸿祎发布视频,表示豆包手机助手将「直击互联网大厂的护城河」。

周鸿祎认为,以往淘宝、美团等平台靠用户停留时长、广告投放盈利,而豆包让用户无需浏览首页、观看广告就能完成任务,直接冲击了传统流量逻辑。

周鸿祎预判,大厂绝不会坐视不管,各大 APP 可能会通过调整页面结构、设置动态验证码、隐藏关键信息等方式,增加 AI 读取难度。

他同时认为,手机厂商也不会轻易让出控制权,小米 MIUI、华为 HarmonyOS 等系统手握核心权限,可通过限制运行、降低调用速度等方式制约豆包,同时推出自家 AI 助手,在明年新手机中预装。(来源:快科技)

 

黄仁勋称害怕失败:早上 4 点就得工作

在接受知名播客乔罗根的专访时,黄仁勋表示在将公司从游戏卡厂商转变成 AI 巨头的过程中用的都是一套方法,他那句「公司还有 30 天就要倒闭「的名言一直用了 33 年。

即便 NVIDIA 现在成了全球首屈一指的公司了,黄仁勋表示那种不确定、不安全感也没有消失,比起成功,害怕失败才是他更大的驱动力。

他表示自己一周七天都在工作,只要醒着的每时每刻也都在工作,每天早上 4 点就起来阅读数千封邮件了。

不仅他自己这么勤奋拼搏,在 NVIDIA 工作的子女也一样,每天都在工作,丝毫不敢有懈怠。(来源:cnBeta)

 

罗技CEO:现在的 AI 硬件在替「不存在的问题」找答案

近日,外设巨头罗技 CEO Hanneke Faber 在上任两周年接受彭博社采访时表示,目前的 AI 硬件名不副实,「是在替不存在的问题找答案」。

实际上,Faber 本人对 AI 并不排斥。除了呼吁 AI 进入董事会,她还推动罗技推出 Signature AI Edition 鼠标,新增按键可直接启动基于 ChatGPT 的 Logi AI Prompt Builder。但值得注意的是,Faber 也因提出「鼠标订阅模式」而在去年遭遇猛烈批评。

尽管行业里已有 AI Pin 、Rabbit R1 两个「失败案例」,但行业仍未撤退。OpenAI 与 Jony Ive 已打造首个 AI 硬件原型,主打「环境智能」,配备多摄像头和麦克风,并可能用小型投影显示信息。(来源:IT之家)

 

卢伟冰:小米在大模型应用方向进展远超预期

近日,小米集团合伙人 / 总裁卢伟冰在抖音对罗福莉加入小米及未来 AI 新战略相关问题作出了解答。

卢伟冰透露,小米在前几个季度就已经开始了在 AI 上的压强式投入,虽然现在还不能透露太多,但是小米在 AI 大模型和应用方面的进展远超预期。小米认为 AI 与物理世界的深度结合是智能科技的下一站。

卢伟冰还表示,小米非常渴望人才、尊重人才,也希望能够给优秀的人才提供好的发展平台。(来源:IT之家)

影翎全景无人机 A1 正式上市,6799 元起售

2025 年 12 月 4 日,影翎 Antigravity 正式发售全球首款全景无人机影翎 A1。

作为首款将 360°全景影像、沉浸式飞行视角与体感操控整合于同一系统的无人机,它让用户第一次能够以直觉进入天空、以身体决定视角,把无人机从隔着屏幕操控的飞行器推进到置身其间的沉浸式空间,使飞行体验和内容创作逻辑从根本上发生变化。

影翎 A1 目前提供标准版、标准续航三电版与长续航三电版三种组合,原价分别为 7999 元、9399 元与 9999 元,发售期间享国补,优惠后售价为 6799 元、7999 元与 8499 元。

三种版本均包含影翎 A1 主机、Vision 飞行眼镜与 Grip 体感遥控器,区别主要体现在电池容量与配件数量,适配从日常记录到进阶创作的不同飞行需求。(来源:极客公园)

 

谷歌官宣 12 月 9 日举行 Android XR 特别发布会

谷歌官宣,将于太平洋时间 12 月 8 日上午 10 点(北京时间 12 月 9 日凌晨 2 点)举行 Android XR 特别发布会。

根据发布会直播简介,收看者将了解有关 XR 的所有内容,包括眼镜、头戴式设备以及所有中间设备。在 Gemini 的陪伴下,用户将能够拥有更加对话式、情境化且有帮助的体验。

三星已在今年 10 月推出了其首款 XR 头显设备——Galaxy XR,这也是首款搭载 Android XR 操作系统的设备,该平台由三星、谷歌和高通联合打造,设备搭载高通骁龙 XR2+ Gen 2 芯片,配备 16GB 内存和 256GB 存储空间。

此外,三星还宣布了其即将推出 AI 眼镜的计划,正在与谷歌以及知名时尚眼镜品牌合作开发此类可穿戴设备。爆料称这款眼镜将配备全视线镜片(即光致变色镜片),能根据环境光线强度自动变暗或恢复透明,还内置摄像头并支持 Wi-Fi 与蓝牙连接。(来源:IT 之家)

 

奔驰推出四款联名婴儿车:标配可调悬挂,1.8 万起售

近日,梅赛德斯-奔驰联手德国高端童车制造商 Hartan 推出了四款婴儿推车,分别命名为 Performance(性能版)、Avantgarde(先锋版)、All-Terrain(全地形版)和 Mercedes-AMG GT2。在欧洲市场,四款婴儿车起售价为 1599 欧元(约合人民币 1.8 万元),顶配版为 1999 欧元(约 2.3 万元)。

四款婴儿车均采用环保仿皮材质,提供五种配色方案,延续奔驰内饰一贯的色彩语言,均标配可调节悬挂系统与 Bag2Go 收纳配件,还可选配专用推车手套。

Performance 为最入门版本,聚焦基础育儿需求,配备 Quick-Fix 快速安全带系统与可调节靠背睡篮;

Avantgarde 则引入伸缩式手柄设计,适配不同身高的照护者;

All-Terrain 面向户外场景,采用加宽轮胎与手刹系统,显著提升在非铺装路面的通过性与稳定性;

Mercedes-AMG GT2 为大顶配,复刻了 AMG 标志性的交叉辐条轮毂、酒棕色缝线与专属徽标,将赛道基因融入了育儿场景,可轻松折叠后放入奔驰 C 级或 A 级车的后备箱。(来源:快科技)

澳大利亚发布社媒禁令:16 岁以下禁止注册社媒账号

本月 10 日,澳大利亚针对 16 岁以下人群的社交媒体禁令将正式生效。

该禁令规定:16 岁以下未成年人一律禁止注册或使用主流社交平台,即便获得家长同意也属违规,违反禁令的平台最高将面临 5000 万澳元(约合 2.3 亿元人民币)天价罚款。

法案生效后,澳大利亚将成为全球首个实施这类禁令的国家,也是全球对未成年人使用社交媒体立法最严的国家。

Facebook、Instagram、TikTok、X(原推特)、Snapchat、YouTube 等所有具备评论、私信或订阅功能的平台均被纳入监管。

澳大利亚通信部长阿妮卡·韦尔斯表示,这项禁令虽然不能完全使少年儿童免受网络内容侵害,至少可以让孩子们更好地成长。(来源:快科技)

 

6799 起,影石的第一台无人机来了!360 全景技术,探寻无人机行业「盲区」

2025 下半年的中国科技圈,「影石大疆之争」是一个绕不开的话题,两家深圳科技公司开启了一场烈度极大的跨界 PK。

其中,「新人」影石首先出招,发布全新品牌「影翎 Antigravity」,进军无人机市场;而「巨头」大疆则推出全景相机产品 Osmo 360 给出回击,同时掀起一轮手持影像设备的小规模价格战。

如果只看公司规模、品牌影响力、营收体量这些基本盘,影石在这场 PK 中似乎胜算寥寥。事实上,在刚开始听说影石进军无人机赛道时,我也充满了疑惑和不解:这不是相当于国足非得拉着阿根廷踢场足球赛吗?

不过,从今年 7 月开始,在我多次试用过影翎的首款无人机产品后,愈发感觉到故事的剧本可能和绝大部分吃瓜群众的想象有所不同。

因为,「新人」影石并没有准备在原有的规则下挑战「巨头」。事实上,拼参数和价格战这种「爽文剧情」,一开始就不存在。影石没有「造一台参数更猛、价格更低的『大疆』」这个选择,他们必须找到一套全新的规则,创造出一个全新的产品和市场,以获得一次从零开始起跑的全新机会。

对于一个没有价格和渠道优势的新人来说,要想和巨人掰掰手腕,拿出一款具有足够差异化和创新点的新产品,就成了一件必须要做的事。

12 月 4 日,影翎品牌旗下首款产品「影翎 A1」正式发售,限时补贴后起售价 6799 元起。标准版套装中包含:最高支持 8K 全景画质拍摄的无人机本体、内置双 1 英寸 Micro-OLED 显示屏的飞行眼镜、可以做到「指哪飞哪」的体感遥控器。仅 249g 的重量,使得用户在全球绝大部分地区,无需参与培训或考试即可畅飞。

这个新产品,能敲开一个全新市场的大门吗?

 

影石为什么要造无人机?

 

首先,说一个我体验之后的整体感受:影翎旗下的首款产品「影翎 A1」,无论是从操作方式、飞行体验还是最终的出片效果,都和市面上主流的「无人机」产品大不相同。甚至夸张点说,它和 95% 的「航拍无人机」,都不直接构成竞争关系,而是创造了一种全新的拍摄方式。

对传统的航拍无人机而言,多轴云台稳定器和电子增稳系统是两个核心的部件和系统,以保证可以在高速飞行和复杂风速变化里拍出稳定的画面。

但是,如果要拍摄高速运动的物体,思路恰恰完全相反。需要尽可能去掉物理防抖,减少计算摄影带来的后期补偿,才能把飞行过程中那种极高速、强冲击力画面呈现出来,给人带来一种接近真实飞行的「沉浸感」。这便是穿越机(也称 FPV,第一人称视角无人机)要达到的效果。

通过影翎 A1,体验顺流而下的「贴地飞行」 | 来源:极客公园

所以,尽管从参数来看,传统航拍无人机和穿越机的飞行速度几乎是完全相同的,但得到的画面效果却完全不同。

举个例子,如果被拍摄主体都是一座建筑,那么传统无人机就像把三脚架和单反相机搬到了空中,可以勾勒出多角度的精美轮廓;而穿越机则像是把运动相机装在了一个顶尖跑酷选手的身上,可以灵活地穿梭其中,拍出一组风格迥异动感十足的镜头。

但问题在于,穿越机的上手门槛实在是太高了,这也是它暂时还是相对小众市场的原因之一。如果在小红书搜索「穿越机入门」这样的关键词,你会看到差不多 3 类信息:

  • 第一类,告诉你怎样才能自己组装一台穿越机——没错,很长一段时间里,穿越机和早年的越野车一样,都需要用户自己动手魔改;

  • 第二类,帮你算账,包括你从接触到基本上手大概要飞「炸」多少台机器,以及花掉多少钱;

  • 第三类,会有用户分享自己在「模拟机」上练习飞行的体验,甚至有人会说,「像喝了 10 瓶酒一样晕」。

「影翎 A1」这款产品的设计思路,正是在保留穿越机独有画面感的同时,希望利用全景技术,大幅降低「飞行」和「拍摄」的门槛。

影翎 A1 包含无人机本体、飞行眼镜以及体感飞行遥控器 | 来源:极客公园

在「飞行」体验上,和传统 FPV 和普通航拍无人机「飞机往哪飞,镜头往哪拍」的交互逻辑不同,用户在使用影翎 A1 飞行时,可以拥有 360°无限自由的空中视角。

这是因为在影翎 A1 上,两颗全景镜头分布在机身的上端和下端,而并非布置在飞行方向的正前方。因此,用户的观看视角和飞行方向可以完全分离,就像坐在自动巡航的飞机上那样,任意转头也无需担心改变飞行方向。

而在「拍摄」层面,得益于全景技术的加持,影翎 A1 拥有和全景相机类似的「先拍摄后取景」的体验。即便是飞行速度过快,导致拍摄目标在视野内「消失」,也可以在后期的软件中找回视野盲区内的素材。

一句总结,如果把航拍机的平稳比作民航客机,把传统 FPV 的机动性比作飞行表演编队的话,影翎 A1 希望为用户交付一种既平稳飞行,又炫酷出片的效果。

 

既能精致出片,也能「忘掉出片」

那么,「影翎 A1」的使用体验究竟如何呢?

为了试到这个新品,我先后去过新疆伊犁、张家口太舞雪场和海坨山,在 30°C 高温和 -10°C 的雪地里都亲自感受了它的飞行体验。如果你此前还不了解它的基本配置,可以先看看我们 8 月的这篇体验内容:3 分钟,我学会了像鸟儿一样飞行 | New Things

还是先说结论:影翎 A1,绝对让「出片」这件事变得更简单了。

最典型的一个例子,是我在新疆第一次接触影翎 A1 时,有一组拍摄沙滩上高速行驶汽车的镜头。

由于影翎 A1 配备了体感遥控器,所以「飞行」这件事的门槛被大幅降低了,我很快就能适应上手。但作为一个新手,我又很难兼顾「飞行」和「拍摄」这两个任务,更没办法在较短的拍摄时间里,完成高速环绕、180°掉头这样的进阶「花飞」动作。

所以,当时我的感受是,那些素材大概率是「废掉了」。

不过让我吃惊的是,当完成拍摄回到北京之后,在后期软件里,我通过切换不同视角、打关键帧等方式,不仅可以发现很多飞行过程中没有关注到的细节(例如车轮扬起的砂砾),而且还可以重新获得一组环绕式的「花飞」镜头。

对于那时作为 FPV 标准小白用户的我来说,这就好比直接把一个全景相机扔到半空,它可以在保持漂浮的同时,自由地捕捉一定范围内所有的空间信息,为我的后期出片采集到足够丰富的素材。

后期重置的漂移跟随镜头 | 来源:抖音视频创作者「王松傲寒」

除了「采集」,在后期的「制作」流程里,影翎团队在上市前的几个月里也密集推出了一系列全新功能,以降低出片的门槛。

例如,你可以通过「深度追踪」这个功能,框选出画面里要跟拍的目标,这样即使拍摄的时候主体并不在视野的中央,后期也可以通过全景算法让主角始终保持在 C 位。

最近,影翎还上线了 8 种创意运镜模式,包括螺旋上升、回旋、甩尾等等,如果是拍摄一些相对静态的物体,甚至可以做到「花飞」的自动驾驶。

再辅以在全景相机品类上很成熟的 AI 剪辑等功能,可以这样说,如果你不追求多么精致的后期制作,那完全可以在郊游返程的车上就完成一段可以发朋友圈的视频后期过程。

另一个有趣的现象是,我身边几乎每个第一次接触影翎 A1 的小伙伴,如果不加以提醒,都会在前几次飞行的时候忘记按下快门键。

从新疆到崇礼,这个「失误」被不断重复,一次次发生。在戴上飞行眼镜后,他们都无一例外地一边摇头晃脑享受 360°环绕式的空中视角,一边给我描述他们看到的风景。

飞行眼镜带来的沉浸式体验 | 来源:影翎Antigravity

这是我过往对无人机设备不曾有过的一种设想。原来它也可以是一个极具沉浸感的「飞行玩具」。全景技术带来的「先飞行后出片」体验,让用户有机会充分享受每一次飞行过程本身。在尝试交付一种精致出片体验的同时,影翎也可以为用户带来一种无感记录的沉浸式体验——如果你没有忘记按下快门键的话。

 

创新者的「必选项」

最后,我想先回到一个很多朋友都和我讨论过的问题:影翎 A1 的目标用户到底是谁?

在我看来,如果把它当成一个拍摄工具,那么很显然它大幅降低了出片门槛。但和其他任何细分品类的无人机产品一样,影翎 A1 现阶段还无法提供智能手机那样「抬手就拍」的便捷感。所以,希望用它出片的朋友们,应该还是要对拍什么这件事有一定的「画面感」和「镜头感」。

在这个基础上,具备全景加持的影翎 A1,可以帮你得到更多酷炫好玩的新视角。

当然,正如我前文提到的,得益于沉浸式的飞行眼镜加持,哪怕不单纯为了出片,它也绝对可以是你和家人的旅行搭子。

当然,我也承认这个搭子不算便宜。不过,当我想起无论在新疆还是崇礼,我身边很多小伙伴在戴上眼镜之后都会略带中二地说一句,「去看看对面山上都有什么」,也觉得影翎一直传递的那句「像鸟儿一样飞行」似乎的确得到了印证。

在海坨山的时候,积雪太大没办法登顶,影翎 A1 确实「带我到山顶看了一遍」 | 来源:极客公园

事实上,找到差异化的产品痛点,解决别人还没有解决的问题,正是影翎作为「新人」在面对竞争时的必选项。

对于刘靖康和影石来说,全景影像技术就是那把通向差异化的钥匙。

10 年前,在很多人看来,全景影像并不是一个成熟的技术和市场。但刚刚创立的 Insta360 团队,从硬核户外玩家对初代产品的魔改中,发现了全景相机和运动场景的结合点,找到了全景相机的第一个 PMF。如今,全景相机已经成为了一个规模上百亿的消费级市场。

2020 年,刘靖康和团队卷土重来,在大部分玩家还在「手搓」穿越机的时候,将无人机赛道视作了通往未来的道路。

上市前一天,刘靖康在自己的微博上写下「Go big or go home」以自勉。没有人知道全景无人机会不会长成和全景相机一样的超级品类,但正如他自己所说,在当下的竞争环境中,面对具有品牌、供应链等多重先发优势的对手,这是后来者必然面对的挑战。

好在,无论是行业还是消费者,人们总是期待着创新者带来更好的技术和更多更酷的新产品。

四年砸下10亿,万有引力用三款专用芯片,证明MR还没死

作者|徐珊

编辑|靖宇

三年前,在和一位业内人士讨论限制 AR 眼镜无法走入市场的最大问题到底是什么时,是我第一次听到万有引力的名字。

当时,我们推导思路是这样的:想要减重,眼镜上的计算单元要更小、更轻;想要 AR 眼镜有拿得出手的实际用途,展现出更丰富的内容,要有更合适的芯片解决算力问题;想要 AR 眼镜的价格更便宜,关键零部件芯片的价格也需要更低。

说来说去,AR 眼镜需要有一颗专用芯片成为我们当时一致达成的共识。「现在有谁在做这个方面吗?」,万有引力在当时就已经成为一部分业内人士关注的对象之一。

但造芯之路,从来都不会太容易。尤其是,万有引力当时就立下打造 MR 芯片的目标,而并非「改造」出一颗可穿戴 SoC,这条更艰难的路径,注定让外界推测两三年内很难看到真正的成果。

三年时间里,Meta 放弃了造 MR 芯片的计划,微软解散了元宇宙 MR 工业团队,苹果 Vision Pro 直接上了 Mac 的 M5 芯片,AI 大模型的爆发又让芯片玩家们开始关注国产 GPU 和推理芯片。当巨头纷纷离场、热点快速更迭时,万有引力却不得不独自承受着巨大的行业质疑,等待验证。

打造 MR 芯片还有必要吗?当我三年后来到万有引力新品发布会现场时,竟然先开始质疑起三年前的结论。然而,当万有引力创始人兼 CEO 王超昊在台上宣布首款芯片的具体参数时,所有的质疑都迎刃而解。

万有引力创始人兼 CEO 王超昊|来源:万有引力

此次发布会,万有引力共推出了三款 MR 芯片:极智 G-X100 芯片,采用 5nm 工艺,专用空间计算芯片,可以瞬时感知,减少眩晕,还可以保持高清显示同时降低功耗。

GravityXR VX100 芯片,主要特点是非常小,可以减轻眼镜类产品镜腿宽度,增强舒适感。

极颜 G-EB100,该款芯片是聚焦空间渲染与显示的芯片,除了支持 MR 头显,也能用在机器人领域,如机器人高逼真度灵动脸,投射实时表情眼神,低功耗完成 3D 模型实时重建与驱动,以及 3D 显示图像处理与增强。

万有引力推出三款空间计算芯片|来源:极客公园

当我们走入展区,可以发现万有引力正计划将一颗空间计算芯片带入更有想象力市场。比如说机器人遥操、数据仿真等。我们和少数媒体对话万有引力联创、CMO 王爽后,发现万有引力想要走的芯片之路和大众想象有些不太一样,他们并不追求所谓的最强 MR 芯片,而是给大家在兼顾轻量化和空间计算能力上提供一个新的选择。

 

一、4 年、10 个亿、3 款芯片

「MR 芯片是一条绕不开的路。想要打造一款 5 纳米芯片,我们总共花费 1092 天,除了我们 200 多名内部员工之外,还有 258 家合作伙伴和我们一起打磨这颗芯片。」万有引力创始人兼 CEO 王超昊先生在发布会上说道。

极智 G-X100 是此次大会的重点产品,采用 5nm 先进制程,Chiplet 异构封装架构,能够实现彩色透视端到端延迟低至 9ms。该芯片还支持注视点计算与双目 8K、120Hz 输出,并且功耗可以维持在 3W 功耗上下。

除了参数,这款芯片能带来哪些具体变化?

首先是超低延迟。据王超昊介绍,极智G-X100 芯片达到了 10 毫秒以下的光子到光子(P2P)延迟,打破了世界纪录。更快的传输意味着实时感应更强,能够显著减轻眩晕感。

「从相机到 SP,到虚实混合的引擎,到 DPU,到最后显示输出,这一个链路我们全部是自研,在芯片上闭环。」王超昊在解释如何实现时说道。

其次,极智G-X100 能够支持很好地 MR 虚实融合效果,其 VST 在色彩还原、夜景噪音等画面处理能力较强,还可以呈现出高动态范围画面。

最后,极智 G-X100 能够为复杂的空间感知和 AI 推理任务提供充足算力支撑,也为眼动、手势、手柄等自然交互提供了支撑。芯片端首次使用了面向 MR 的动态注视点渲染技术,可智能分配渲染资源,大幅降低整体 GPU 负载,在保证视觉质量的同时显著提升能效。据测算,极智 G-X100 能将整个显示处理和传输的功耗降至原有的 45%。

此外,为了更好发挥 极智 G-X100 芯片用途,万有引力还打造一个感知子系统,通过双目 160 万彩色摄像头,13 路传感器等模块,可以高效支持 SLAM 空间定位、3D 感知和手眼交互。

万有引力 G-X100 |来源:万有引力

如果说极智 G-X100 是为 MR 设备打造的专业芯片,那么极眸 G-VX100 则更像是为 AI 眼镜量身定制。该芯片配备可量产 ISP 后处理算法,以及全球领先的单边小至 4.2mm 超窄封装,可以轻松放置在眼镜鼻梁处或者超细镜腿处,为 AI/AR 眼镜、AI 耳机、AI 助手等各种智能设备提供小型化、轻量化的可能性。目前,极眸 G-VX100 已支持 1600 万像素超清拍摄和 4K 30fps 视频录制,并集成了空间视频拍摄与眼动追踪功能

值得注意的是,这款芯片采用了超低功耗专用子系统,并结合万有引力打造的多模态唤醒技术「MMA(Multi-Modal Activation)」,实现分级唤醒计算,智能调配算力,最高可支持 16 小时的续航时长。

有关 MMA,王超昊举了两个比较有想象空间的例子。「如果我们要全天候卡路里记录,我们就可以用到 MMA。当我们看到盘子、杯子的时候就记录下来,存在眼镜里。到用户查询的时候或者到晚上的时候,这些数据就可以传回到手机,在手机端或者云端大模型生成卡路里记录的报告。」同样的逻辑,如果用户钥匙找不到了,眼镜会提醒用户:「我看到你的钥匙两个小时前留在了沙发前的茶几上。」

当然,随着摄像头开始与各种 AI 硬件结合,极眸 G-VX100 或许会出现在多样化 AI 硬件上。不过,目前该芯片刚刚返回实验室并完成点亮,预计送样还需要一段时间。

万有引力 极智 G-X100 |来源:万有引力

最后,万有引力还介绍了极颜 G-EB100,该芯片除了支持 MR 头显,还可以用在机器人领域。比如说,让机器人实现高逼真度灵动脸,投射实时表情眼神,低功耗完成 3D 模型实时重建与驱动,以及 3D 显示图像处理与增强。目前已经服务包括歌尔股份、智元机器⼈等行业头部企业。

万有引力 EB 100 |来源:万有引力

万有引力的三款芯片均具有高度的针对性,旨在解决 MR 领域的具体问题,从减轻眩晕、增加续航时长,到提高机器人灵动性等。并且,万有引力在打造芯片时,还针对空间计算的特有功能提供了开放式系统设计。从产品定位和参数来看,万有引力精准把握了空间计算领域当下三大核心场景,解决了其中最重要问题,用这三款产品,为自己四年的坚持交出了一份有力的答卷。

 

二、空间计算芯片能做什么?万有引力正在「另辟蹊径」

在发布会上,万有引力首先推出了一款基于 G-X100 芯片的参考设计,以具体产品形态来展现其技术设想。

这款名为 G-X100-M1 的 MR 眼镜参考设计模组,综合了各项集成优势,成功将设备重量控制在 90 多克。它拥有 90 度 FOV(视场角),实现了 9 毫秒的端到端超低延迟,具备 36 PPD 的 MR 分辨率,并支持 1600 万像素、自然定位、3D 感知和手眼交互。

与此前市面上的 MR 眼镜相比,该款参考设计在重量和 FOV 上略占优势。在现场体验中,我们发现画面清晰、运行流畅不掉帧,但体感上,重量的减轻效果并不如预想中明显。更具体的性能指标和最终的用户体验效果,可能还需要等待搭载该芯片的实际终端产品推出后才能做出准确判断。

在展区现场,我们得以一窥未来万有引力计划合作的企业和重点推动的应用方向。

智能眼镜方面,我们看到了李未可、雷鸟等智能眼镜厂商。据透露,目前这些厂商正在等待芯片送样测试,并保持着开放合作的态度。在内容生态上,我们看到了沙核科技等合作伙伴。如果 MR 在文娱方向上能够有效减轻眩晕问题,或许能够迎来更大的用户市场。

比较有意思的是,智元机器人同样出现在展区内,并搭载了 MR 头显。用户戴上 MR 头显后,可以通过手势交互来进行远程遥操作控制。

参会者尝试用遥操控制机器人举起水瓶|来源:极客公园

在现场,我尝试通过遥操控制机器人将矿泉水放入笔筒内,再拿起笔筒。最初的体验难点在于视野和深度感知。当画面中机器人手指以 2D 形式呈现握住水瓶时,加上缺乏力量反馈,很难准确判断是否握紧了水瓶。

另一个明显的挑战是延迟问题。在体验过程中,手部移动无论是过快还是过慢,机器人手臂端的变化总是伴随着一定的延迟感。

不过,整体适应过程很快,大约在两分钟后,我就能相对快速地拿起水瓶并将其放入狭小的笔筒中。现场的工作人员告诉我们机器人头部可以直接「内置」MR 头显,让外观设计更加简洁。

此外,我们还看到了王超昊在发布会上简单提到的 P2P 测试设备。该设备主要用于测试MR设备上视频穿透路光子到光子的延迟时间。我们也观察到,万有引力通过 G-EB100 芯片的能力,加强了类似苹果头显上「Eyesight」功能的玩法,能实现目光追随和更灵动的显示效果。

极颜 G-EB100 优化数字人裸眼3D渲染能力|来源:极客公园

从展区体验来看,万有引力显然非常清楚空间计算芯片在哪些关键领域能够发挥作用,并进行了提前布局。无论是 AI 智能眼镜、机器人遥操,还是 MR 文娱,这些领域几乎都是各个赛道中发展前景广阔、增速较快的细分市场。如果能够成功突破这几个关键市场的头部客户,将为万有引力在空间计算领域站稳脚跟打下坚实的基础。

 

三、对话万有引力联创,三年预期百万出货量

会后,我们与对万有引力联创兼 CMO 王爽进行了独家对话。对话中,我们首先了解到:万有引力此次推出的三款芯片均为协处理器,可与手机、电脑、或高通 AR2 等主芯片协同处理。

这为硬件厂商提供了灵活的芯片部署选择。厂商既可以在设备上放置主芯片和万有引力的协处理器,也可以将原有主芯片从头显端转移到手机或手持终端上,而仅在头显上放置 G-X100 芯片。后者不仅能减轻头显重量,还能维持出色的空间计算能力。

万有引力联创兼 CMO 王爽 | 来源:极客公园

事实上,这也是目前 MR 行业常见的一种解决方案。由于通用 MR 芯片的 P2P 延迟通常在 15 毫秒上下,影响用户体验,因此不少上下游厂商推出的所谓 MR 芯片,多数都采用了协处理器架构,官方宣称的 P2P 延迟时间多在 10 毫秒上下。

除此之外,我们还与王爽深入探讨了万有引力在此时入局的核心竞争力、未来三年的核心发展规划以及出货量预期等问题。最终,我们看到了万有引力在面对行业巨头时差异化生存逻辑:他们不追求做大包大揽通用芯片,而是专注于做好专用协处理器,试图以更开放合作模式,去争取那「百万级」的市场机会。

 

以下是极客公园整理后的对话形式,精编了核心信息:

1、万有引力目前在行业里的核心竞争力是什么?

王爽: 我们的核心竞争力在于软硬一体的解决方案。XR 是一个全新的产品品类,涉及极高的用户整体体验要求。我们不能单纯靠每年增加多少算力或接口来定义芯片,这样定义不出好产品。我们在定义芯片前,先搭建了一个基于 FPGA 的硬件验证平台,让算法工程师和架构师在真实佩戴场景中反复验证体验。在这个过程中,我们再去判断,哪些算法适合固化进芯片里,哪些更适合保留为软件,方便后续迭代。因为芯片里相当一部分功能都是自研的硬化 IP,一旦流片,核心架构就很难再调整,所以前期的验证就尤为重要。也正是这套从体验出发、软硬一起反复打磨的流程,保证了我们芯片定义的准确性。同时,我们将这套经过验证的参考设计开放给行业应用开发者。

 

2、目前有哪些公司预定使用了咱们的新芯片?

王爽: 具体名字目前比较敏感,不便透露。因为很多合作方是阿尔法客户,希望能够提前抢跑。可以确认的是,在 XR 方向有一家客户已经开始跑原型样机(Proto Build),另一家客户正在做产品需求沟通,还有一个客户在排期中。前期我们会集中精力支持行业头部的标杆客户进行深度合作,之后再向外拓展。

 

3、为什么现在大家都觉得需要专门 MR 芯片,而不是用通用的 CPU/GPU?

王爽: 算法虽然重要,但它是运行在芯片之上的。MR 设备对重量、功耗、散热要求极高。通用计算平台虽然灵活,但在这些指标上的效率不是最优的。将特定算法「硬化」进专用芯片,能极大提升能效。这也是我们作为创业公司的机会——大厂倾向于做通用平台且生态封闭,而我们对 MR 终端理解更深,且提供全栈解决方案,允许合作伙伴共建生态。

 

4、现在市场大玩家都在用高通,小玩家用展锐等可穿戴芯片「改造」,你们作为后来者,客户为什么要选万有引力的芯片?

王爽: 我们是专用的协处理器,与高通、展锐、瑞芯微的主芯片是搭配关系,而不是替代关系。主芯片负责运行安卓系统和应用,我们的芯片负责所有空间计算任务,像是传感器处理、画面渲染叠加等。这种双芯片架构可以让主计算单元,比如说手机、PC、盒子与眼镜分离,将眼镜重量从苹果 Vision Pro 的 600 克降到 100 克左右,同时提供极低延迟至 9 毫秒的视频透视体验。

 

5、如果采用分体式减轻了重量,但会存在一条无法被忽视的「连接线」,这个问题怎么看?

王爽:这是一个权衡。无线方案目前的带宽和功耗难以支撑高质量的 MR 体验。只要眼镜提供的体验足够好,想要画质对标苹果,且佩戴足够轻,也就是 100 克以下的话,用户对线的包容度是很高的。如果是为了单纯的扩展屏连根线,用户会抱怨;但为了极致的轻便和高性能虚实融合,这根线是可以接受的。

 

6、相比通用芯片,这颗专用芯片的成本和性价比如何?

王爽: 我们的芯片集成了相当于高端显卡,类比 RTX 5080 的空间计算能力。如果用通用芯片跑这些算法,成本和功耗会极高。通过硬化算法,我们在提供同等性能的前提下,成本和性价比是非常有优势的。

 

7:万有引力在生态建设方面,是怎么支持开发者的?

王爽: 我们主要面向整机厂开放生态,而不是直接面对应用开发者。我们的开放性体现在「Runtime」层,特别是核心的 Service 层如追踪、融合算法。像高通等大厂往往将这层封闭,必须用他们的算法;而我们允许客户在我们的芯片平台上跑他们自己的算法。我们提供的是一个灵活的基座,既有完整的参考设计,也支持客户高度定制。

 

8、你们内部是如何评判这款芯片是否成功?

王爽: 两个维度。技术上,只要各项指标如延迟、重量控制能否达到最初设计预期,就是成功;商业上,能获得行业头部整机厂的认可并进行深度技术合作,也是成功的标准。

 

9、你们现在对未来的出货量有什么预期?下一代芯片什么时候出?

王爽:我们战略目标是先导入头部客户,预期能达到三年内百万级的出货量。关于新产品,我们在做现有产品的量产导入的同时,也在研发下一代芯片,预计明年年底流片。因为核心 IP 已经搭建好,后续迭代速度会快很多。

 

10、创业这几年遇到的最大困难是什么?又是如何解决的?

王爽: 最大的困难有两个。第一是去年的资本寒冬,当时芯片刚流片出去还没回来,团队压力很大,好在投资人与我们愿景一致,相信团队,陪我们度过了艰难期。第二是产品定义的抉择。几年前主流方向是做一体机,但我们想做轻便的、分体式的协处理器芯片。这意味着要增加昂贵的高速接口 IP 且占用芯片面积。当时很多人质疑为什么不支持主流的一体机架构,但我们坚信为了把眼镜做到「百克级」并保证高性能,关注低延迟 VST、眼动追踪等方向,必须把部分高功耗计算从头显上剥离。事实证明,这个坚持是对的。

 

11、现在的「空间计算」是否需要极高的算力来对全世界进行建模?

王爽: 空间计算不需要把全世界一次性建模。它核心在于终端设备感知、理解用户当下所处的环境,并进行虚实融合等计算。大型的空间理解在云端,终端主要负责实时的环境感知。专用芯片能让这一过程更高效。比如我们在户外或特定商圈,通过位置信息展示虚拟内容,这是端云结合的结果,而不是全靠终端硬算。

 

12、近期「百镜大战」中 AI 眼镜很火,想从中脱颖而出需要具备什么能力?

王爽: AI 眼镜是大模型最佳的硬件入口。要脱颖而出有三点:第一,要有大模型能力,要么自家有,要么能接入优质公网模型;第二,画质要好,用户习惯了手机的高清拍摄,不能接受眼镜拍出来的照片是糊的;第三,也是最重要的一点,必须轻薄好看。欧美用户可能接受厚重的墨镜,但在亚洲,大量用户是近视眼且不习惯日常戴墨镜。谁能把眼镜做得既智能又像普通眼镜一样轻便,谁就能赢。

 

抢到票的必读:创新大会 2026 超全攻略!

点开这篇文章的朋友,恭喜你!

你们是凭手速和运气突围,成功锁定今年极客公园创新大会入场券的少数派。

为了不辜负这份期待,今年我们筹备了史上最全的内容版块,也倾注了最硬核的心思。正因为干货太多、亮点太密,为了让你不迷路、不亦步亦趋,我们特意整理了这份「保姆级参会指南」。

请务必收藏,带你从容玩转全场!👇

 

01

活动场地

 

今年我们根据内容板块,将活动分布在三个不同空间。

为了确保大家在大会两天时间里,不蜻蜓点水,而是真有收获。提醒大家 IF 大会每日的主会场门票和每日单独主题的「小场深谈」门票,是相互独立的,不同的门票只能进入对应会场哦。

 

主会场:

北京 798艺术区 传导空间

 

活动场地入口:

 

分会场 A:

北京 798艺术区 751图书馆

 

活动场地入口:

注:活动入口在 751图书馆二层

 

分会场 B:

北京 798艺术区 极客公园

 

活动场地入口:

 

交通提示:

  • 自驾 798 艺术区内有适量停车位,建议您安排好出行时间,或尽量乘坐公共交通出行。
  • 地铁 可乘坐 12 号线至驼房营站,从 A 口出站后,步行 10-15 分钟左右即可到达。/可乘坐 14 号线至望京南站,从 B1 口出站后,乘坐 403 路公交车至北京电机总厂,下车步行 5-10 分钟左右即可到达。
  • 公交车 乘坐 403 路、516 路、593 路至北京电机总厂站下车步行 5-10 分钟左右到达;或乘坐 418 路、851 路、854 路至彩虹路站,下车步行 600-800 米左右到达。

 

02

参会与签到

 

📍 主会场入场时间

  • 签到入场:
  • Day 1: 8: 2 0 - 9: 2 0
  • Day 2: 8:30 - 9:30
  • 入场后按照现场指引在指定区域就坐, 无对号入座,座位不保证
  •  

📍 分会场 A、B 入场时间

  • 签到入场:
  • Day 1: 13: 30 - 14:00
  • Day 2:13: 30 - 14:00
  • 入场后按照现场指引在指定区域就坐, 无对号入座,座位不保证

 

周六日白天气温预计在 5-10 摄氏度之间,请注意保暖~

 

参会凭证获取图:

 

特别提醒:

  • 主会场、分会场 A、分会场 B 各设置了 独立签到台 不同会场之间不通用
  • 「观众胸卡/观众手环」是入场唯一凭证,请妥善保存,上下楼或出入场地,请务必携带。
  • 会场不许携带手机支架和相机支架入场。

 

03

活动议程

 

全议程时间表如下⬇️

主会场将呈现最完整的大主题与重量级嘉宾阵容;分会场则更聚焦、更深入,支持现场提问和交流。希望你在不同会场里都能找到最想听的答案——各取所需、满载而归。

 

04

餐饮

 

大会不设置餐饮区,为了保证良好的活动环境,活动现场 禁止食用 螺蛳粉、臭豆腐、辣条、泡面等味道浓烈的食物。

12 月 6 日 -7 日,凭参会证件(包含嘉宾证/观众证/媒体证/展商证/工作证/小场深谈手环),到以下合作店铺享受专属折扣😎

  • 㞭客烘焙 DAICO. BAKERY(751 店):极客公园创新大会【专属 9 折优惠】
  • 新西兰餐厅 Cafe Flatwhite(798 店):极客公园创新大会【专属 9 折优惠】
  • gaga(751 图书馆店):极客公园创新大会【专属 8.8 折优惠】
  •  

12 月 6 日 -7 日,于大会签到处扫码领券,到以下合作店铺享受专属折扣😎

  • TIANROAST 咖啡&小红帽三明治(751 店):极客公园创新大会【专属优惠(包含饮品 8.8 折、餐食 9 折)】

倒计时已经开始!准备好迎接本周末的科技狂欢吧!

​豆包手机或存「隐私问题」,官方:不在云端存储画面;理想发布 AI 眼镜,1699 元;美光推出零售存储,专注 AI 存储

 

豆包手机助手回应「侵犯用户隐私」: 需用户主动授权,不会在云端存储用户屏幕内容

12 月 3 日,豆包手机助手发文对微信登录异常、用户隐私等相关问题作出回应:豆包手机助手不存在任何黑客行为。豆包手机助手需要用户主动授权,才可以调用该权限,使用操作手机功能。该权限的使用,我们也在权限清单中进行了明确的披露。

据我们了解,目前行业的 AI 助手,均需要使用该权限(或与其类似的无障碍权限)才能提供操作手机的服务。豆包手机助手也不会代替用户进行相关授权和敏感操作。此外,手机助手不会在云端存储任何用户屏幕内容。(来源:新浪财经)

微软下调 AI 软件销售指标,因企业客户对新产品反应冷淡

微软及其他企业级软件公司的高管曾将 2025 年誉为人工智能实现多步骤任务自动化的元年——例如基于公司销售数据生成仪表盘。但随着年末临近,微软已下调对其新一代 AI 产品(即「智能代理」)的市场渗透预期,不再强求客户快速为这类产品付费。

据微软 Azure 云部门的两名销售人员透露,由于多个部门在截至 6 月的财年中未达成 AI 产品销售增长目标,目前微软多个业务线已下调部分 AI 产品的销售增长指标。这两名知情人士表示,微软针对特定产品下调销售指标的情况实属罕见。(来源:新浪财经)

美光宣布退出零售存储业务,专注于 AI 时代的先进存储芯片竞争

在近几个月内存条疯狂涨价的背景下,存储芯片制造商美光科技突然宣布关闭零售渠道业务,专注于 AI 时代的先进存储芯片竞争。

在周三发布的公告中,美光宣布退出 Crucial(国内译为英睿达)消费业务,现有的库存将销售到本财年第二季度(2026 年 2 月)末。公司将继续向全球商业渠道客户供应美光品牌的企业产品,同时现有产品的保修不受影响。(来源:财联社)

东方甄选将在京开首家旗舰店,直播机构扩张线下

东方甄选 CEO、新东方集团董事长俞敏洪构想的东方甄选全国百家门店,将迈出第一步。12 月 3 日发现,东方甄选正以 1.5 万—3 万元薪资招聘北京首家旗舰店的店长,优先有「餐饮+零售」复合业态管理经验的人才。

据了解,这家旗舰店位于北京中关村,面积在 400 平方米左右,除了生鲜、零食、日百等便利店商品,还涵盖简餐和咖啡饮品区。(来源:北京商报)

国产飞机里程碑 C909 载客突破 3000 万人次

日前,中国商飞公司「大飞机」公众号宣布,C909 载客突破 3000 万人次。中国商飞表示,自 2016 年 6 月 28 日商业首航以来,C909 飞机累计安全运送旅客突破 3000 万人次,标志着 C909 飞机开启了规模化运营新征程。

据了解,C909 飞机由此前的 ARJ21 改名而来,是我国首次按照国际标准,自行研制的具有自主知识产权的新型涡扇支线飞机。

C909 座级 78-97 座,航程 2225—3700 公里,最大起飞重量 43500 千克,具有适应性、舒适性、经济性、共通性、系列化等特性。

截至目前,中国商飞公司已向十余家国内外客户交付了 170 余架 C909 飞机,开通近 800 条航线,通航 178 座城市。

今年 7 月,国航 C909 开始执飞呼和浩特-乌兰巴托-呼和浩特航线,开启首次国际商业飞行。(来源:cnbeta)

消息称苹果 iPhone 17e 将采用 iPhone 16e 同款 OLED 屏,边框进一步缩窄

12 月 3 日消息,据韩媒报道,京东方已被选为苹果明年待发布的入门级新机 iPhone 17e 的 OLED 屏首选供应商。零部件行业消息称,苹果已将 iPhone 17e 的 OLED 订单大部分分配给了京东方。

苹果计划明年上半年出货约 800 万部 iPhone 17e。通常,苹果会在入门级 iPhone SE 和 iPhone e 系列发布的第一年出货约 2000 万部。iPhone SE 和 iPhone e 系列通过回收利用之前量产的零部件,并应用最新的 AP,与其他公司的中低价位产品竞争。

京东方也是苹果今年初发布的 iPhone 16e OLED 的首选供应商。其次是三星显示和 LG 显示,订单量依次递减。

iPhone 16e OLED 采用了与 2022 年发布的 6.1 英寸 iPhone 14 普通版相同规格的 OLED。据悉,iPhone 17e 将再次使用 16e OLED,但会缩小边框宽度。即使缩小了遮盖面板电路布线的边框,如果最初的面板设计有余量,也可以不改变面板设计。

京东方去年的 iPhone OLED 出货量约为 4000 万片,新旧机型均包括在内。在总计 2.3 亿至 2.4 亿部的出货量中,占比略低于 20%。三星显示的出货量最多,为 1.2 亿至 1.3 亿片。LG 显示的出货量约为 7000 万片。(来源:凤凰网)

理想汽车发布首款 AI 眼镜 Livis:标配蔡司镜片 补贴后售价 1699 元起

12 月 3 日,理想汽车举办线上发布会,正式推出其首款 AI 智能眼镜 Livis。售价 1999 元起,12 月 31 日前下订可享受 15% 政府补贴,补贴后价格仅为 1699 元起

「一款以钢铁侠 AI 管家「贾维斯」为灵感命名的智能眼镜,试图将「理想同学」的 AI 能力从驾驶空间延伸至用户日常生活的每个角落。」

Livis 名称源于理想汽车与钢铁侠 AI 管家「Jarvis」的组合。

整机重量控制在 36 克,提供经典黑、科技灰和橄榄绿三种颜色,并可选亮光或磨砂材质。

Livis 全系产品标配蔡司镜片,涵盖近视镜片、光致变色镜片与墨镜片等多种类型,满足用户在不同场景下的视觉需求。

理想宣称 Livis 在研发过程中实现了五项关键突破,构成了产品核心竞争力的重要组成部分。

典型续航时间达 18.8 小时。Livis 标配类似 AirPods 的无线充电盒,便于随身携带和补能。同时,眼镜支持与理想汽车的车机系统无线快充,上车后放置在专属充电位进行充电。

在硬件配置上,Livis 搭载恒玄 BES2800 主控芯片和独立的 ISP 成像芯片,采用 SONY IMX681 摄像头,拥有 1200 万像素、支持 4K 照片以及电子防抖拍摄。

汽车联动场景是 Livis 最独特的卖点。通过蓝牙和 5G 网络,眼镜可无缝连接车辆,实现语音远程控车。用户可在百米范围内,通过语音指令操控电动侧滑门启闭、提前开启空调及座椅加热,甚至检查车辆续航和充电状态。(来源:快科技)

终结爱因斯坦与玻尔世纪之辩,中国科大团队取得量子研究新进展

12 月 3 日消息,中国科学技术大学宣布,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子,首次忠实地实现了 1927 年爱因斯坦和玻尔争论中提出的「反冲狭缝」量子干涉思想实验,观测到了原子动量可调谐的干涉对比度渐进变化过程,证明了海森堡极限下的互补性原理,并展示了从量子到经典的连续转变过程。

该工作在爱因斯坦和玻尔关于量子基础的争论近百年之后,首次利用基态单原子作为对单光子动量敏感的「可移动狭缝」,不仅在量子极限层面忠实实现了爱因斯坦思想实验,而且发展了高精度单原子操控、单原子-单光子纠缠和干涉等精密量子技术,为未来实现大规模中性原子阵列、压缩态纠错编码、以及进一步探索消相干和量子到经典过渡等基础问题奠定了基础。

审稿人评价该工作是「对量子力学基础的重大贡献」(this is a significant contribution to the foundations of quantum mechanics)、「一个漂亮的实验」(beautiful experiment)、「一个百年思想实验的教科书式实现」(a textbook realization of a century old thought experiment)。(来源:IT 之家)

 

实测千问 App 生图、生视频功能:国产实用主义的突围

作者|Cynthia

编辑| 郑玄

Sora 2 的与奥特曼对话的音画同步视频生成,还有 Nano Banana Pro 的风格化生图狂欢热潮还没过去,多模态 AI 领域又有重磅更新上场:

阿里的千问 APP 在 12 月初悄然完成了一次关键版本更新,接入国内最强 AI 生视频模型 Wan 2.5,以及全球开源领先 AI 生图模型的特供满血版 Qwen-Image 2511,更重要的是,生图功能直接拉满免费不限次,彻底降低用户的使用门槛。

在此之前,我们曾深度测评过 Wan 2.5 的网页版(详见 从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录 ),当时就觉得这模型实用到不像当下 AI 圈的东西:没有追 1 分钟长视频的噱头,也没讲各种用户根本看不懂的参数。就专注一件事:把 10 秒内的音画同步、细节还原做到了极致。

如今它下放到手机端,再配上 Qwen-Image 2511 这张 免王牌」一同下放到千问 APP,可以说,这是阿里将 B 端沉淀的多模态技术向 C 端场景落地的重要尝试。

那么 APP 端视频生成的体验究竟是否能像此前网页端一样惊艳?还有,卷了这么多年的图片生成大模型,这次千问+ Qwen-Image 2511 又能带来什么惊喜?

带着两个核心疑问,我们用一周时间把这两个功能用到了极致,试图为大家解决以下问题:

Qwen-Image 2511 是否能真正解决传统 AI 生图的人物崩脸、中文乱码等行业痛点?Wan 2.5 在音画同步、长视频叙事上与国际主流模型的差距是否缩小?免费模式背后,阿里又在构建怎样的 AI 生态闭环?

 

01

视频能力实测:

Wan 2.5背后国产模型的实用主义路线

 

Wan 2.5 是谁,相信很多了解过 AI 视频生成的朋友已经对此并不陌生。

作为为数不多能够对标谷歌 Veo3 的视频生成大模型,Wan 2.5 核心突破在于音画同步与 10 秒长视频生成以及更精细、好看的画面。

说的更直白一点,Wan2.5 不仅是 2025 年国内最先进的多模态生成模型之一,绝对也是你用过最具性价比的一梯队 AI 视频生成产品。

接下来,我们从音画同步、场景化功能、细节表现三个层面,解析其实际表现。

测试一:音画同步、时长

音画不同步、短时长限制、细节不突出,是过去国产视频模型与 Sora、Veo3 等国际模型的主要差距。针对以上问题,我们直接让 Wan2.5 生成:在复杂场景中,生成两个不同风格人物对话的剧情。

提示词如下:

暮春午后,石质柱廊蜿蜒延伸,青灰色石板映着斑驳光影,阶前青草点缀,风拂过荀子身着玄色宽袍腰束素带,与身披浅灰亚麻袍、赤足踏石的苏格拉底相对而立。镜头先以全景定格,随即推进至荀子中近景,他广袖一扬,特写中眼神如炬,沉凝有力地掷出:「人性本恶!争则乱,乱则穷!」镜头横切至苏格拉底,中近景里他双手自然摊开,指尖轻叩石面,眉宇从容,温和却带锋芒地反驳:「人性本善,无人有意作恶。」最后镜头从两人面部拉远,回归全景,柱廊光影流转,风拂衣袂,两人对立的身影在古意场景中定格。

看似简单,但这段提示词里,实际埋了三个坑:

第一,风格冲突:需兼顾古风与西方两种人物风格,避免不同穿着人物实际共用一张脸的情况;

第二,音画同步:两个角色的台词「人性本恶!争则乱,乱则穷」「人性本善,无人有意作恶」要对口型,还要匹配动作,并且两人的语气与神情各不相同。

第三,复杂画面,元素不丢:石质柱廊,青灰色石板、斑驳光影、阶前青草点缀,不能随着镜头的切换凭空消失。

最终生成效果如下:

可以看到,Wan2.5 的音画同步准确率相当不错,而且我们一开始担心各种问题,Wan2.5 都解决的很好。首先是高度一致的音画同步,细节上,不仅人物挥动衣袖的动作、身体、音画同步自然流畅,就连场景也有很高的一致性,整体画面切换调度也颇有动画电影的水平。

测试二:细节控制

如果说卡通测试是基础题,那电影级写实测试就是附加题。

此前在 Wan2.5-Preview 时期,我们就已经见识到了它在细节还原、氛围打造上的厉害之处。不过这次,我们让难度再升级,从黄昏树林中静止的男生,变成真实复杂场景中,两个运动中的主角。

提示词:【风格设定】电影级写实风格,画面干净通透,兼具温柔氛围感与高级电影感;线条细腻,质感真实。【人物 + 动物+动作设定】

人物:20 岁年轻白人女孩,轮廓分明,皮肤白皙,长发微卷,眼神清澈带一丝温柔沉思;穿着米白色棉麻长裙(领口微敞,袖口随意卷起),衣料有自然褶皱,质感轻薄透气。

动物:一只温顺的小鹿(毛色浅棕带白色斑点,鹿角短小圆润),头部轻靠女子左臂,眼神柔和,耳朵偶尔轻微晃动,与女子互动自然不僵硬。

动作:女孩牵着鹿从森林中缓缓走来

【场景设定】黄昏稀疏落叶林,树干笔直修长,树叶泛黄带绿(秋夏交替质感),地面覆盖少量浅棕色落叶;时间为日落前 1 小时,天色呈暖橙与淡紫渐变,空气通透无雾气。

【镜头与光影核心要求】

镜头参数:长镜头(无切换),中景构图(人物 + 小鹿占画面 60%),中心构图(人物与小鹿位于画面正中心),干净单人 + 动物镜头(无多余路人 / 杂物);背景虚化(景深 f/2.8),突出主体,虚化后背景呈斑驳圆形光斑。

光影层次:

逆光:太阳位于人物后方偏左侧,形成金色轮廓光(勾勒发丝、肩膀、衬衫边缘),轮廓光宽度 1-2cm,柔和不刺眼;

侧光:右侧补柔和侧光,照亮人物半张脸,避免面部全黑,形成「半明半暗」的层次感;

柔光:整体光线经过树叶过滤,呈漫射效果,无硬边阴影。

先说结论,这是最近各种 AI 视频测试中,最让我感到惊喜的一个。

先看必答题:女孩的棉麻长裙,袖口卷起的地方有自然的褶皱,不是熨烫平整的假质感;小鹿的头靠在女孩手臂上时,耳朵会轻轻晃动,不是 焊死在头上;逆光的金色轮廓光,刚好勾勒在发丝和肩膀边缘,没有糊成一片。女孩转弯前真实的眼神变化,走路时自然飘动的发丝,真实到仿佛电影画面。背景虚化后的光斑是圆形斑驳,不是呆板的圆形光斑,这细节已经能吊打不少 老法师了。

然后是彩蛋:我忘记了在提示词里写任何声音,但视频里居然有 咔嚓咔嚓女孩和小鹿踩过落叶时的脚步声,声音会随着步伐的快慢变化;背景里还有清脆且有空间远近层进的鸟叫声。

据了解,这种画面审美突破的核心在于,Wan 2.5 通过引入人类反馈的强化学习(RLHF),把用户对画面质感、动态效果、指令匹配度的反馈用于优化模型,从而彻底让 AI 视频生成摆脱了过去诡异中带着点赛博丑陋的标签。

测试三:场景化功能体验

不同于国际模型侧重各种技术极限,Wan 2.5 更注重实用场景适配,此前通义推出的全民舞王一度让全中国的奶牛猫都突然站立开始跳印度舞,虽然魔性,但直指普通用户的创作痛点。

这里的测试,我们不再采用固定的模版,而是玩了个 脑洞测试:上传一张小猫的照片,让它驮着孙悟空在非洲大草原狂奔。

这个需求的难点在于双重动态:小猫跑步时的肌肉形变、孙悟空的丝带飘动,还要保持小猫的原长相。毕竟,很多 AI 处理图生视频 + 复杂动作时,会把主体搞成橡皮泥,要么肌肉不动,要么脸崩了。

效果如下:

可以看到,这里的测试效果依然很稳定,小猫已经驮着孙悟空在非洲大草原奔驰,会有肌肉的运动,孙悟空的丝带飘向风的方向,不是 360 度乱转;最关键的是,小猫的脸和我上传的照片几乎一致——耳朵的弧度、眼睛的颜色,甚至额头的精细花纹全都没丢。

 

02

生图实测:

免费工具的专业度上限有多高

 

原本测完视频能力之后,我已经觉得不会有更多超出的惊喜出现了,但万万没想到 Qwen-Image 2511 模型的能力,同样打了我个措手不及。

官方资料显示,Qwen-Image 2511 模型在 Huggingface 趋势榜登顶数周,开源生态贡献度全球第一,AI arena 竞技场排名仅次于闭源模型 nano banana 与 seedream 4.0。

不过这些数据对用户而言,其实价值意义不大,还需转化为实际使用体验才能被认可,我们依然通过三组核心测试验证其落地能力。

测试一:连续创作过程中的人物一致性。

AI 生图的核心痛点之一,是无法在多轮生成中保持人物特征稳定性,经常是更换场景、调整动作后,人物面部特征易出现崩脸、换脸问题。这就导致,AI 出神图容易,但是用在生产环境稳定出图反而是个问题,而 Qwen-Image 2511 很好的解决了这个问题。

我们以同一人物(动物)多场景生成为测试场景,来「嫁祸」一只小猫咪:

输入素材:一张金渐层小猫的照片

生成指令:给小猫穿上粉色裙子、给小猫面前放个花瓶小猫推花瓶、让花瓶碎在小猫面前

可以看到,Qwen-Image 2511 完整保留了测试对象也就是金渐层的面部特征之外,穿上的衣服也与小猫的身形完美符合,一个有些有意思的细节是,每次 Qwen-Image 2511 生图都是四张,而这四组图片中,小猫的裙子颜色、花的颜色与款式,都是完全一一对应的,细节满分。

测试二:中文文字+商用场景适配

对中小商家而言,AI 生图的核心价值在于降低商用素材制作成本——能否生成符合平台规范的商品图、海报图,直接决定工具的实用价值。

此外,中文场景下,当前市面上的其他 AI 生图常出现文字乱码、字体错位问题,说白了就是像鬼画符。其中,表现差一点的,完全看不出来文字到底是什么;表现稍好一点的,也会出现某个字少个偏旁,缺了一横,或者多了一竖。总之,模型对中文语义与排版逻辑的理解始终弱于英文。

这次,我们测试直接上难度,不只要能写汉字,还要有排版,写的好看,并且还要搭配复杂商用级别画面。

提示词:做一个海报,核心主题「天然无谷狗粮 | 狗狗健康成长的能量源泉」

视觉主体:纯种金毛,6-12 个月幼犬,毛发蓬松有光泽,眼神灵动,正低头大口啃食狗粮(嘴角带少量粮屑,呈现「适口性极佳」的真实感),姿态放松愉悦(如趴在草地 / 地毯上,尾巴轻摇)

产品呈现:打开的狗粮包装袋(透明开窗设计,可见颗粒分明的狗粮,颗粒呈不规则六边形,颜色为浅棕 + 深棕渐变),袋身斜靠在木质托盘上,,标注「无谷配方」「鲜肉含量≥85%」「益生菌添加」核心卖点。辅助元素为:旁边摆放 1 个陶瓷食盆(装满狗粮,少量颗粒散落在食盆边缘),1 片新鲜胡萝卜 / 西兰花(呼应「天然食材」),1 滴透明鱼油(暗示「美毛护肤」功效)

场景氛围:户外场景:青翠草地 + 蓝天白云,狗狗趴在野餐垫上进食,周围点缀几朵小雏菊,远处有模糊的树木轮廓,整体色调清新自然

风格与质感:超写实质感,细节拉满(狗狗毛发根根分明,狗粮颗粒的纹理、油脂光泽,食盆的陶瓷磨砂质感均清晰可见),避免卡通化或模糊处理

色彩搭配:暖橙色(传递「温暖」「食欲」)+ 浅草绿(呼应「天然」)+ 原木色(增强「安全」「质朴」感)

 

 

测试结果显示,Qwen-Image 2511 在基础测试中完全规避了文字截断、字体混淆问题,不仅实现了海报标题的精准呈现,画中画的狗粮包装袋上文字依然精准呈现。此外,画面中胡萝卜的大小、狗粮的质感,幼犬的形态、狗毛的真实毛绒质感还原也非常到位,可以直接用于电商平台上架。

此外,更惊喜的是,Qwen-Image 2511 生图时支持一键调整比例(1:1/2:3/3:4/9:16/4:3/16:9/3:2),无需借助第三方工具裁剪。此外在后期,Qwen-Image 2511 还支持局部改字/改色、扩图、修改尺寸等等修改,而这对生产级场景来说,非常重要:毕竟 AI 生图,一次性得到满意结果的概率并不大,往往需要非常精细、复杂的后期修改。而现在这件事情,已经可以彻底交给 AI,精准修改。

 

 

对比一些付费生图工具,Qwen-Image 2511 不仅在纹理还原度上表现更优,而且成本直接降为零,这对需批量制作素材的中小商家而言,具备极强的实用价值。

 

03

国产 AI 的实用主义突围

 

测完千问 APP 的两个新功能,我突然明白阿里这次升级的 野心:

无论是 Qwen-Image 2511 解决中文生图痛点,还是 Wan 2.5 补齐国产视频音画同步短板,千问的此次升级,其实背后正是国产 AI 模型的差异化突围范本:

Wan 2.5 的环境音自适应、元素 ID 锁定,不仅能用于阿里电商的短视频带货场景,也能让普通人享受和家里宠物跨物种对话的神奇;

Qwen-Image 2511 的 中文渲染以及精细控制能力,不仅能够造福各种中小商家,也能让没有作图能力的手残党感受创作的快乐。

当这些 B 端技术被改造成 C 端用户能轻松上手甚至免费的功能时,AI 才真正从实验室走进了日常生活。而伴随创作成本大幅降低,国产 AI 工具也才有了成为新时代内容创作的标准的可能,而这才是真正的 AI 普惠。

直击爱奇艺 AI 剧场创作营:当奥斯卡摄影大师遇上 AI

1895 年,巴黎一家咖啡馆的地下室,卢米埃尔兄弟的《火车进站》首次公开放映。

当火车沿着铁轨逼近镜头、仿佛要冲破银幕的那一刻,观众们惊慌失措、连连后退——那是人类对「影像」力量的初次战栗,也是百年电影工业的起点。

130 年后,这种战栗再次降临。

在爱奇艺的一个封闭创作营里,奥斯卡金像奖得主、《卧虎藏龙》摄影师鲍德熹再次提及这部影史的开山之作。在他看来,AI 技术带给视听世界的冲击,不亚于当年那列闯入人类视觉经验的火车。

正因如此,73 岁的他决定开启一场新的冒险——与爱奇艺共同发起「鲍德熹·爱奇艺 AI 剧场」创作营(以下简称「创作营」),面向全球征集 AI 创意,从中筛选 30 组创作者开始训练,再挑出 15 组正式进入制片环节。据了解,第一批作品最快将于明年 1 月上线。

这是一场近乎疯狂的实验:一位在传统认知上已经功成名就的电影大师,试图带领 30 组青年创作者去挑战目前行业的「深水区」——制作 15 分钟以上的商业级 AI 剧情长片。

11 月中旬,「定焦 One」走进了这个 AI 创作营,也在创作营的间隙与鲍德熹,爱奇艺副总裁、智能制作部负责人朱梁,爱奇艺灿然工作室总经理、《我的阿勒泰》制片人齐康聊了聊这场实验背后的动机、挑战与野心。

「这是一次百年一遇的机遇,你们是第一批淘金者。」讲台上,鲍德熹对 30 组创作者说。73 岁的人,语气却像年轻导演第一次摸到摄影机。

讲台之下,学员们如饥似渴。他们不停做着笔记,偶尔还用电脑测试着什么。每堂课结束之后,还有很多学员围着老师,沟通自己项目的难点和困惑。朱梁介绍,很多创作组甚至凌晨两三点还在讨论项目。因为这个创作营激发了学员们很多新的想法和创意。

你能感受到,那种久违的、关于电影未来的兴奋正在这里重新发生。

 

01

15 分钟:AI 影像步入叙事「深水区」

 

现阶段的 AI 视频作品,多停留在 1–3 分钟以内,形式以视觉奇观与 MV 拼贴为主。爱奇艺与鲍德熹给出的标准,是至少 15 分钟。

这不仅仅是时长的增加,更是叙事逻辑的改变。

「千万不要小看这 15 分钟。」鲍德熹解释,视频时长一旦超过 5 分钟,就进入电影构造。而要把一个故事在 15 分钟内讲完,对信息密度、叙事节奏都有极高的要求。因为观众没有耐心等你铺垫,前 3 分钟必须要有高潮,每隔几分钟就要有新的戏剧冲突,否则他们就会划走。

换言之,这短短 15 分钟,创作难度绝不亚一部两小时的电影。

更棘手的是,目前 AI 技术在长叙事面前,暴露出了一系列致命的短板。爱奇艺副总裁、智能制作部负责人朱梁将其形容为「在技术的不完美中走钢丝」。

他总结了五大技术难点:

第一,视觉一致性和连贯性。目前 AI 生成视频,同一场景在不同镜头或时间节点下,其空间结构、道具细节,尤其是自然光影很难保持物理逻辑上的连贯,从而导致叙事空间失真,削弱作品的沉浸感和可信度。

图源:爱奇艺行业速递微信公众号

第二,人物表现与复杂动作生成不足。AI 生成的表情尤其是微表情的准确性和生动性不足,也无法完整、合理地生成复杂的交互动作,如武打套招。

第三,材质真实感与音画同步问题。AI 渲染出的物体表面,尤其是人物皮肤,存在严重的「塑料感」。此外,它很难让角色的口型与台词精准同步。生成的声音也带有明显的「AI 味」,缺乏真人说话的特色、口音和情感起伏,听起来千篇一律。

第四,物理规律不符合常识。AI 生成的画面里,杯子摔碎、球体碰撞后的弹跳轨迹等,常常看起来「不对劲」。尤其是那些需要高度拟真的复杂大场面,比如建筑物爆炸坍塌,AI 目前还做不出电影特效中那种以假乱真的震撼效果。

第五,长时序镜头的调度与协同。对于涉及多元素、长镜头的复杂场景,AI 在全局调度与控制上能力不足,很容易导致长镜头叙事混乱。

「所有瓶颈都意味着,AI 创作正在从『玩具阶段』向『工业应用』艰难爬升。」朱梁说。 爱奇艺的目标十分明确 —— 不做 「 PPT 式 AI 视频 」 ,而是做商业级剧情片 。商业作品的底线,是「观众不能跳戏」。任何技术瑕疵,都会像警报一样提醒观众「这是 AI 做的」,把人从故事里拽出来。

这正是 AI 创作最折磨人的地方:当技术瓶颈短期无法突破,创作者只能在艺术表达与内容策略上不断妥协。「我们设置 15 分钟,并不是为了长而长,更多是给故事足够的容器,同时也进一步激发 AIGC 技术的真正潜力与生命力。」朱梁说。

 

02

从抽卡玩家到新一代导演

 

技术与艺术之间的平衡,是这次创作营的灵魂。

不同于市面上其他 AI 课程,爱奇艺创作营没有把「如何写提示词」视为核心,而是把重点放回电影的本体。课程中既有 MiniMax 内容工作室负责人、生数科技美学专家等技术先锋讲授 AI 应用,也有在创作一线的爆款导演、编剧——如《啥是佩奇》导演张大鹏、《南京照相馆》《孤注一掷》编剧许渌洋,分享叙事经验与创作心法。

课程大量篇幅都在讲剧本结构、镜头语言、声音音乐的情感调动,几天的密集授课像是一部被压缩到极致的「导演速成手册」。

背后反映的,是鲍德熹的一个信念:即便在 AI 时代,技术不能脱离「电影(Cinema)」而独立存在。

鲍德熹口中的 Cinema,是电影百余年来沉淀下来的影像语言,是一门「用光影讲故事」的手艺活儿。

这门手艺包括剧本。

编剧许渌洋在课程中介绍,故事是一个重要的杠杆。一个好的剧本能让几千万的小成本电影创造出数十亿的收益;反之,一个烂故事能让耗资数亿的大片「血本无归」。而对于从业者来说,故事难写,很多人穷尽一生都搞不清楚,但一旦掌握,便能让你跑赢同行,跑赢市场,成为这个行业的阿尔法(Alpha)。

也包括镜头语言。

鲍德熹用《卧虎藏龙》的实战经验,向学员们展示了艺术背后的「算计」。在拍摄这部电影时,他大量使用了 40mm 镜头,而非标准的 50mm。因为 40mm 镜头既能让人物无明显变形,又能稍稍拉开人物与背景的距离。这种镜头上微妙的变化,创造了一个人物内心欲望与外部约束角力的舞台。

图源:《卧虎藏龙》豆瓣官方剧照

与此同时,《卧虎藏龙》的机位大部分在人物胸口位置,而不是平视。用低机位塑造和凝视人物,强调他们的崇高、挣扎,以及最终无法挣脱命运的悲剧感。

在鲍德熹看来,镜头的构图、视角、运动都必须有艺术目的和叙事功能,是为了更好地讲故事而不是炫技。光影雕刻形体,而镜头运动赋予电影生命,它决定了观众如何「进入」和观看这个故事。

在传统的摄影机创作中,这门手艺活儿非常体现摄影师的主体性。

比如会有大导演在关键戏份的拍摄时一定要鲍德熹亲自掌镜。因为拍摄的过程会有很多瞬时的艺术决策,几乎每半秒钟就是一个新的构图,摄影师需要根据人物动作和对白,实时决定如何变换角度。人脑高速运转,充满了即兴与灵动。

但在现在 AI 生成的视频里,创作者不用操控摄影机,只需要提示词。因此,是否还需要掌握这门手艺活儿成为了很多人的疑问。

在创作营,一位电影科班出身的学员表达了当前的迷茫:身边一些同行,没有经历过专业影视训练,仅凭本能也做出了一些 AI 片子,流量不错,观众也能接受镜头里的瑕疵。「我们还有必要学这些变焦镜头、这些手法吗?」

鲍德熹回答得斩钉截铁:「你面前是浩瀚大海般的 Cinema,要有敬畏之心。因为 Cinema 才是我们的精神殿堂。」

他强调,电影是艺术的综合体,融合了视觉、听觉、叙事等所有艺术门类。 当 AI 技术让一个人有可能独立创作时,他需要具备的修养就越多。 「如果抛弃了 Cinema 的语言,也就意味着无法与那些看着电影长大的观众进行深层沟通。」

AI 让创作降低了门槛,但决定作品高下的是「品味」。毕竟 AI 也好,摄影机也罢,工具都只是手段,在掌握技术的基础上,用电影的思维去讲故事,而不是做简单的「视频拼凑」。

齐康也表示,AI 技术给影视创作制作带来的革命意义或许是「技术平权」,它将打破专业创作者和业务爱好者之间的边际,也定将颠覆传统影视娱乐内容创作和生产的模式。

但对于当下的「专业创作者」来说,除了关照 AI 技术催生的新生活形态和情感状态,亦应思考和探索,AI 技术如何让「视听语言」进化。 在齐康看来, 电影的一个本质属性是 「 影像戏法 」 ,任何新技术的引入都催生了电影形态的进化, AI 亦是如此。

 

03

寻找新大陆

 

如何用好 AI,这不仅关乎审美选择,更是一场关乎生存的产业探索。

一边是传统影视行业步入寒冬。奈飞 CEO Ted Sarandos 曾公开预言「电影院时代已经终结」;导演陈凯歌也在金鸡奖论坛上不无感伤地指出,那种精雕细琢、追求艺术完美的创作方式,正逐渐失宠于这个追求效率的新时代。

另一边,短视频与短剧正以惊人的速度重塑用户习惯。一分钟一集的强节奏叙事不仅争夺着用户时长,更颠覆着长视频的叙事逻辑。而 AI 技术催生的「漫剧」等新形态,以比短剧更极致的节奏和商业模式加速爆发,持续重构内容产业的生态格局。

在鲍德熹看来,AI 技术或许正为行业指引一条通往新大陆的航路。「短剧或许只是一阵浪潮,终有退去之时;而 AI,则可能是席卷一切的洪水。」

他点出长视频行业的根本痛点:高成本、高风险、长周期。一部好莱坞大片的制作成本动辄数亿美元,剧组规模庞大,每一次摄影机的移动都意味着高昂的轨道铺设费用。更重要的是,集体创作模式常常让导演和编剧在艺术表达上处处掣肘。

而 AI 正在改写这套规则。它赋予创作者「无限的权力」与几乎零成本的试错空间——几乎可以把它看作是一台无需轨道的、随心而动的摄影机。

图源:爱奇艺行业速递微信公众号

正是在这样的背景下,爱奇艺通过本次创作营,试图在「低成本 UGC」与「昂贵 PGC」之间,开辟出一条「AIGC 精品长视频」的第三条赛道。

「我们希望让优质内容以更快速、更富想象力、更低门槛的方式被创造出来,」朱梁表示。爱奇艺正在探索建立一套全新的 SOP(标准作业程序):极低的边际成本,配以极高的工业标准。

一旦这套模式走通,平台将不再受制于天价片酬与庞大剧组,而是能够像现代化流水线般,稳定产出高品质的剧情内容。

朱梁进一步阐释:「我们以实验者姿态,主动承受技术不完美对艺术表达的折损,目的是为了极限测试并推动技术边界。这一切的终极目标,是让 AI 强大到无需被特意提及,让故事与情感重新成为唯一的主角。」

鲍德熹预测,AI 创作的黄金期将在五年内到来,当下的所有探索都如同「摸着石头过河」。他相信,当技术真正成熟时,用 AI 拍电影也许会像今天写网文一般寻常。

他将希望寄托于创作营中的学员,语重心长地对他们说:「谁能把握住时代的风口,谁就能成为 King of the World。」

这背后,是鲍德熹一以贯之的核心思想:既要拥抱 AIGC 技术,更要坚守 Cinema 的灵魂。他鼓励学员借助 AI 这一强大工具,去实现传统拍摄难以企及的视觉想象,但同时必须恪守电影叙事的根本规律——故事、节奏、冲突与情感。他期盼的,是创作出有品味、有娱乐性、能真正打动观众的「新一代电影」(Next Generation Cinema)。

「去拥抱新技术、驾驭它,做出心中所想——这就是我的决心。」鲍德熹对「定焦 One」说。

 

04

结语

 

在训练营的尾声,鲍德熹为学员们留下了若干条创作箴言。73 岁的电影宗师,亲自指导年轻一代驾驭最前沿的工具——这不只是技术的传承,更是一场关于电影精神的保卫战。

爱奇艺的这场实验,象征着百年电影工业与前沿算法之间的一次深度握手:不是在对抗中走向消亡,而是在对话中获得重生。

鲍德熹的创作 Tips:

确定品味 (Taste):你想讲一个什么样的故事?是《拯救大兵瑞恩》还是短剧?

观众至上:不要孤芳自赏,电影是大众艺术,必须听到观众的掌声。

不急功近利:珍惜此次发布作品的机会,不要为了赶工而牺牲质量。

必须懂摄影:不懂摄影的 AIGC 创作者只是在胡拍。

慎用旁白:尽量用画面和动作讲故事,不要依赖大量的内心独白。

说人话:对白要朴实、生活化,不要故弄玄虚。

节奏:节奏要紧凑,不要有无意义的停顿。

拉片学习:针对自己的题材去拉片,模仿大师的视听语言。

一分钟梗概:必须能在一分钟内讲清楚你的故事。

反复审视:用编剧、导演、摄影师三种身份反复审视剧本。

关注表演:角色是故事的灵魂,虽然 AIGC 很难控制表演,但要尽力去模仿真实的人类状态。

多角度覆盖:拍摄时多拍几个角度(全景、特写、过肩),为剪辑留余地。

用心配乐:音乐和音效是打动人心的关键,不要用廉价的罐头音效。

大胆用色:可以尝试全片黑白或特定色调,形成风格。

70% 学生选 AI,大学校长怎么教?

深圳的冬天依然晴朗无云。站在 2025 IDEA 大会的会场,我今年最大的感受是大会现场有关「AGI 焦虑」变少了,对 AI 落地的「颗粒度」变细了。与去年相比,人们不再讨论 AGI 到底什么时候到来,不再充斥着对参数规模的盲目崇拜,而是更关注如何让 AI 带来更多的价值。

大会的核心看点依然是IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋。不同于其他大厂高管热衷画「技术路线图」,沈向洋这次给出的更像是一个「思考框架」。他没有预测下一个 GPT-6 何时到来,而是直接抛出了智能演进的五个维度:算法范式 、智能载体 、交互范式 、计算架构 、数据。当前,绝大多数 AI 创业公司只在「算法」或「应用」这两个维度上卷,而忽略了系统性看待 AI 上下游的重要性。

我们从这次主题演讲能够比较明显地看出沈向洋想要传递的信号是:AI 的下半场不仅仅是模型参数的竞争,而是各个维度之间的协同性。

顺着这个逻辑去看现场展示的「具身智能」成果,我们就能发现如今最关键的不是造机器人,而是解决「脑-手」协同的难题。在会议现场,沈向洋表示,在具身智能的众多攻关点里,灵巧手是技术复杂度的珠峰:「人手的魔法在于它手既能搬箱子,也能穿针引线。所以,灵巧手可以说是人类在人工智能面前最后的尊严。」

IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋|图源:IDEA研究院

一年过去,IDEA 还在大湾区的具身智能领域交出了三份答卷:针对末端执行的灵巧手大赛、聚焦通用落地的 DINO-X Grasp,以及国内首个模块化具身智能软件平台 Tairos。其中,DINO-X Grasp 在上一代视觉大模型的基础上,能够在开放世界环境中完成 2D 认知理解、物体抓取位姿预测以及 3D 形状感知。这意味着机器不仅能「看见」,还能真正「看懂」并以此指导行动。

在现场展示中,我们能看出 IDEA 并未将低空经济简单视为无人机硬件的堆叠,而是将其定义为一个复杂计算架构与交互问题。当低空出现成千上万架飞行器时,现有的空管系统和通信算力是无法支撑的。这种从底层协议到调度系统的综合布局,本质上也算是「新基建」层面的竞争。谁先制定了这套标准,谁就真正掌握了低空经济的话语权。沈向洋发布的《低空时代》及《低空经济发展白皮书 4.0》,正是试图建立基于四维时空数据的交换与计算标准。

除此之外,IDEA 研究院在过去一年里还落地一些新成果。无论是能将海量分子筛选周期从数周压缩至分钟级的 Mozi 药物发现平台,还是将数据分析从人工主导推向「智取万数」的经济超脑,亦或是进化打造 AI 原生编程语言 MoonBit,都展示了 IDEA 研究院如何让 AI 作为工具深度嵌入垂直领域。

AI 时代未来方向|来源: IDEA 研究院

当然,主题演讲只是序章,更深度的思想碰撞发生在随后的圆桌之上,多位院士校长与企业高管汇聚一堂,围绕 AI 与教育、AI 时代的新型科研机构以及 AI 对软件工程的影响与机遇等教育话题展开了激烈探讨。极客公园对这场产学研界的思维交锋进行了精编整理。

一、当 70% 的学生选择 AI,教育如何应对「暴力式创新」?

 

1、我们进入 AI 时代以后,很多的教育、培养会不会跟以往有不一样的方式?

【哈工大-韩杰才】:AI 出来以后讨论最多、担忧最大的就是大学校长,我们大学校长坐在一起谈的都是 AI。AI 作为新一代的工具性的东西创新更容易,但要考虑的是把创新水平放在哪个阶段?低水平创新现在不需要,AI 就可以替代。这就要求我们未来培养的人要更高水平,我们学生的水平要高于智能体。

大学有老师,有智能体、有学生,是三元结构,老师水平比智能体低就麻烦了。现在学生获取知识方面很容易,我们需要培养什么样的人才?我在大学当校长的时候,认为有两个事是必须的:一是基础性的东西,100 年基本上没变的基础一定要掌握透。二是通过实践,坐在教室学习肯定是不对的,大学里全面改变了学习模式,以学习为主体。现在是人工智能强化学习,学生可以让 AI 作为工具来用。下一步如果是自主学习的话,大学要干什么?大学一个是平台作用要凸显出来,通过你这个平台可以从社会、全世界,特别是顶尖资源里培养人的能力就变得非常重要。个体获得这些资源难度大资源。

我们现在强调基础研究,要关注原创性、颠覆性技术的需求、创新也不是原来拿来主义的东西,底层的逻辑是你的,这就越来越重要,我们的创新从大学开始做项目,大一一进入哈工大就让学生必须进入实验室,需要什么知识,该学哪个老师的课就去学,一生一策个性化的教,这样才能有个性化、特色突出的创新人才。

2、倪校长,您作为港科大广州创始校长,有特色的地方是,港科大广州是没有院和系的概念,开始是为了提升各学科的交流,交汇有碰撞才能产生创新的火花,您做教育改革方面,现在时代遇到的机遇和挑战有哪些?

【香港科技大学(广州)-倪明选】:我们学校大三才选专业,选任何专业没有名额限制,现在第一批学生 70% 选 AI,20% 选大数据,10% 选智能制造,学生知道智能制造重要,可是他妈妈讲你只有选 AI,因为报纸上天天讲 AI。教育要改很多问题。改革最大的阻力就是老师,我们学校的老师都是国外名校回来的,可是他们在国外研究成果很好、paper 写很多,国外的教学和学生的素质也不一样。回到 AI 的时代,学生比你还聪明,AI 比你用得还好,对老师的挑战是很大的。我们学校不会用 AI 工具的老师基本上不能通过考试。

AI 时代创新模式的再思考|来源: IDEA 研究院

3、我们会发现 AI 真正的突破很大程度上是暴力式的创新,AI 显学进入暴力式的创新,需要堆很多的资源,会不会变成更多工程化、使命型的创新?

【哈工大-韩杰才】:暴力式创新最后形成的创新的角度我觉得不一定,有些是有原创的,不一定办出很大、很好的公司。有些没有原创反而很大,这就是原来这种状态。

我最近在探讨,智能时代创新什么最有生命力?文化基因最重要。为什么现在码农、硅谷印度人少了,中国人现在慢慢走在一线了。我认为要跟文化关联起来。智能时代的创新,有人说 DeepSeek 的思路是有文化的因素,像中文就不一样,我们写中文不写得很复杂,特别是法律方面的东西很麻烦,联想太多。

大学培养人的时候,智商是有限定的,广义理解情商越来越重要。它会有新的东西,只是这一阶段抓到机遇获得成功,跟我们搞电池一样,锂电池我们超越了,下一步全固态电池、其他电池的覆盖率是一样,是叠盖、覆盖的概念。

【香港科技大学(广州)-倪明选】:学校暴力不起来,几千卡都不得了,只有有些实验室才能做些暴力的东西。学校发展来讲,目前的暴力是大语言模型,应用还没做得很好,学校里做很多 AI+的东西,智能体推理做得比较多。DeepSeek 一出来为什么我们发现算力只有 1/20、1/10,是不是有超越 Transformer 的东西出来?这是学校要做的,我们鼓励给他们更多的空间。科技大学里大概 10% 的老师自由探索,大部分老师还是 AI+,不光是 AI 的老师,甚至做科技政策的老师也在用。

跟企业的关系,一般学校科研是走在企业的前面,这个领域企业走在学校前面,我们把学生送到企业界,算力的问题、数据的问题,企业和学校合作是双赢的。

4、您刚才说学校没资源做暴力美学,学生已经开始暴力选择 AI 的时候,作为大学的校长怎么平衡学生的未来?这个周期很长,他这次暴力选了,四年以后才能证明错了,他已经没有机会纠正了。

【香港科技大学(广州)-倪明选】:我上个礼拜四选择 30 个本科生到我家里来聚餐,我也跟同学说了同样的问题,不管做制造、材料、微电子都这么鼓励他们,但父母说必须选 AI,现在是没办法跟父母沟通。

 

二、新型科研机构的「分账」逻辑与生存法则

1、新型研究机构如何定位、如何评价?现在大学里的科研和工业里的科研分不是很清楚,如果我们既想要灵活又想有学术的强项,又想接触市场,各方向的好处都想得,我们有没有这样的定位?我们应该关注哪些问题?我们应该向谁报告?我们如何评价我们做得好不好,向外如何汇报我们做得成功?

【清华大学-汪玉】:我还有一个身份是清华大学天津电子信息研究院的院长,某种意义上来说也是一个新型研发机构,这个机构是在 2015 年成立,到现在十年,政府直接给的钱力度肯定没深圳这么大,当年我们的定位想得比较简单,我们孵化一些有影响力的公司。学校这边构建整个的生态,研究院作为成果转化办公室和对外合作办公室,并没有在里面放研究人员,当时看到的问题是怎么在市场竞争这么激烈的地方吸引最好的人才,这里又给不出最高的薪水,小公司的方式让他们成长起来我们在背后推动,把电子系的成果可以放进去,影响力做大,对于学校是好事,对于天津也是好事。刚才你说的,「股东」要满意,我服务清华成果转化,还要天津给一些支持。这是最早的,第一个五年、第二个五年,我们是这么干的。现在没有站得足够高,我们站在下面一层成果转化,对于一些中小 企业和大 企业的需求并没有摸得特别透,我们是孵化的逻辑,中间还有中小企业的逻辑,只靠政府投入不可能长期稳定的干好一个研究院,不能只靠政府投入,三重力量要融合起来。

【香港科技大学 (广州)-陈雷】:我到港科大时候倪校长是计算机系主任,我是助理教授,当时港科大拿 20 篇 Top conference 和 20 篇 Top journal,加 3 个 RGC 就可以升职,非常清楚。我当时很害怕,我玩命的写,玩命的带学生,我申请的是 50+50+3。年轻人看到我说,老师你年轻的时候就在玩命写 Paper,你现在不让我写 Paper 什么意思?

我们想和工业界结合,大方向要做 Impact,那基础学科怎么做?Data For AI,训练的时候怎么把数据集减小做训练,推理怎么用 KV Cache,最终落到基础问题 Data 怎么去存,服务于训练和推理。

这是一个基础问题,「既要还要」要跟工业界结合,不能自己写文章,写文章发得很嗨,每天都在写,impact 在哪儿。做的过程中不能说老师我是做基础学科的,你给我 5 年、10 年时间我给你憋个大招出来,我说行,但是 5 年之后你要憋不出来,我要你还是不要你,在此基础上像工业界有那么好的问题,为什么不能随地「下蛋」。我前两天和华为同学聊天,他们说在研究大模型投毒、被污染的问题,这些问题很新很有意义,在学校里面学习不到。哪怕做个专利和论文,至少看见你在做这件事情。转换赛道一定要把这个概念跟年轻人讲清楚,我们怎么去衡量,方向对了,impact 也有了,积少成多,也有盼头,这是我的想法。

【香港科技大学-谢源】:我博士毕业以后第一份工作在 IBM 做芯片设计,之后做教授,后面切换到 AMD Research,再到加州大学,在阿里的五六年期间,阿里的五年是比较特别的时期,一方面我还继续保持加州大学的实验室,那里还可以做非常前沿的研究,同时有阿里的达摩院,相当于是公司的研究团队。第三个角色带着平头哥数据中心大芯片的四个方向,CPU、GPU、存储、网卡芯片,那段时间特别可以感受到今天的问题,UCSB 的团队可以做非常基础的工作,Research For Fun,完全兴趣驱动。达摩院是要为产品部门做积累,比较近期的工作,「平头哥」是纯工程的事情,一定要实现 5 纳米的 CPU,实现 GPU 可以在阿里云里用起来。

新型研发机构要解决的问题是「达尔文死海」,不需要太考虑能不能落地,完全是兴趣驱动。另一方面产业考虑的是近期,能不能马上用到平头哥的产品里,新型研发机构要做桥梁。

评价体系对于新型研发机构来讲,不单纯是以学校或是公司,可能从三个维度,学术影响力就是研究的深度,技术影响力是对整个产业影响,某种程度上是广度问题,产业和社会的影响力是产生价值,能给企业、产业带来价值。

AI 时代的新型科研机构|来源: IDEA 研究院

2、这样的机构应该怎么组织?除了常见的公司项目体系或者学院课题方式?还有什么其他的组织方式吗?怎么能以学科为基础还是项目为基础的两种方式中间找到平衡

【清华大学-汪玉】:电子系有两个一级学科,信息与通讯工程,更多干的是大系统,包括关键的数学基础。另外是偏芯片的,电子科学与技术,在大平台上做基础的器件和芯片。AI 时代我自己感受都得有一个中台,底层的大平台,底层大平台本身需要更多的支持,比如说建一条线,我们会有一条线我们叫厨房,老师们或是小团队是厨师,做出菜来,这个菜怎么卖是怎样的事儿。偏器件层面大概率还是要按这套体系,需求的来源是外部的,做菜本身的团队是自由的、小的。我感受到前面的一级学科开始往这个方向走,特别是最近 Agent 起来,底层还是 AI 和工具,上面又变成小团队。自己往后走有底层的平台,上面有一些垂直的行业,跟模拟芯片的厂商很像,跟 ADI、TI 很像,工艺、设计共用的部分是基础,上面一堆不同的团队做分散的产品。

【香港科技大学 (广州)-陈雷】:虽然我是信息学院,我办公室旁边坐的人是生命科学,右边坐的是搞材料的,老师一进来是随便选办公室,大学里老师们坐得乱七八糟,找学校的老师开会都要 Zoom。学生拿奖学金,老师是没有钱的,要跟学生讲,我可以带这个项目。我带了一个碳中和的项目,做碳吸附、碳存储,我就得找搞环境、碳中和、材料老师,我们组成一个 team,这种跟之前完全不一样,原来是校长把钱给我,我为什么要跟你们合作,现在学生都组队了,要把学生抢过来,把钱给想做的学生,老师帮助他们去做,我觉得这种真的是在新型院校里,校长敢大胆改革。作为老师、院长我也不开心,我也没钱,只能求着学生,学生就去参加环境大赛,碳吸附、碳存储,环境大赛都拿奖,而且是一个团队,后面的老师是各领域老师,一下子就把这个方面带起来了,这是非常好可以借鉴的方法。

【香港科技大学-谢源】:我简单用我们在芯片领域的组织模式是矩阵式的管理方式,我觉得首先是有个能力中心,这是纵向的,偏设计的人员、偏验证的人员,他们作为能力中心,偏法、偏架构、偏底层设计,作为能力中心是一个维度,第二个维度是横向,项目维度,我们为了设计 CPU、GPU,需要调配设计架构+验证的人,三是技术平台,所有的项目需要走到后端的设计,平台部需要为所有的项目和能力提供平台基础设施。

 

3、怎么支持研究机构,钱从哪儿来?有一个困难,研究的时候经常有些不确定性,我做问题 A,后来发现问题 A 没做出来,对问题 B 有些进展,但问题 B 不能挣钱,这个问题经常发生。怎么支持不确定的研究能往前走?

【清华大学-汪玉】:这是两份钱,第一份钱是整个机构的钱,整个机构的钱还得找有钱的帮支持,比如说当年贝尔实验室是垄断企业,深圳有钱让政府持续给也不容易,还得把深圳本地潜在有钱的吸引进来,这是最重要的,赚钱的闭环最好跟研究闭环不要太耦合,否则就扭曲了。这样的机构里有 20% 的人随便干,80% 的人有些目标。

【香港科技大学 (广州)-陈雷】:谈到钱的事,港科广是政府给钱建的学校,校董会和校长特别要求下未雨绸缪,如果政府不给你钱怎么办?我们已经开始好多相关工作,到目前为止,昨天是第 19 个工业和学术 Joint Lab 成立,明年就有 30 个,每个实验室的投资是 1000 万,资方会越来越向工业界。假设我做一个很简单的项目、横向的项目,做完了以后不 work,但我有一个 B,我要做实验室不怕,把 B 给你,联合实验室要专利给你专利,要论文给你论文,东西出来了。你想让我做 A,我做 A,B 也不错,有专利、有论文,资方也很开心,而且他也收获了意想不到的东西,这种情况下作为高校不可能总靠政府资金,就跟工业界合作,帮工业界做点东西你总得给我钱吧,而且越来越多,五年以后有 100 家 Joint Lab,这个学校就没有问题了,学生的项目也会做得非常开心,这是我们学校和工业界强强合作。

【香港科技大学-谢源】:他们谈到找钱,用钱的角度就是用灵活的资金支持动态的合作,服务于坚定的方向就可以。汪玉提到八、二分,在我这儿是四四二分,基础有 40%,40% 是项目相关,20% 是作为侦察兵、种子,这是对应汪玉的八二。

 

三、AI原生编程语言出现时,程序员都消失了吗?

1、TypeScript 语言第一次超越 Python 成为 GitHub 最受欢迎的编程语言,因为 TypeScript 可以更好的让 AI 生成。未来有专门为 AI 设计的 AI 友好的编程语言吗?

【中山大学-王焱林】:这个月 GitHub 出了报告,TypeScript 成为 Top1 的编程语言,这是过去十多年编程语言格局最大的改变。我总结出最大的区别,TypeScript 是静态的语言,MoonBit 也是静态的,我也看好 MoonBit 的发展。我认同 AI 友好的编程语言的概念,也有一些语言特性是未来作为对 AI 友好编程语言一定要有的,一是类型系统是静态约束越清晰、越强越好。二是模型对机器是友好的,这也是 TypeScript 做得比较好的点。三是对人友好,最终的编程知识要转到人上。四是特别重要但比较被人注意到的,要对演化友好,现在 coding Agent 出来很震撼,给他一个指令就会做出一个游戏、网站,但是是需要迭代的,他生成很多的东西里面有很多的错误,我们迭代的时候才是最痛苦的。未来编程语言设计一定要把刚才这几个点考虑进去。

2、微软的 Copilot 送 Token 更多,可以说量大管饱。AI 编程时代,AI Coding 智能体的护城河在哪里?

【中山大学-王焱林】:Cursor 有一个很大的特点,迭代速度非常快,几个月可以迭代非常多次,背后的原因是最看重的是体验,开发者在 IDE 里到底体验、流畅感是怎样,也是 Cursor 的硬实力,硬实力会被厂商抹平,一些软实力,让 一个 Agent 陪伴我在一个仓库里执行一些动作的时候,希望他一定是越来越懂我的,Memory 也很重要,它懂我踩过哪些坑,我很难切到另一个智能体,哪怕生成准确度提高 5%,我感受不到,更在意软实力是非常重要的。

AI 对软件工程的影响|来源: IDEA 研究院

3、有些人会建议 AI 编程取代人类,以后没有程序员了,有人觉得 AI 增加了很多的长尾需求,以后人人都是程序员,这是两个截然相反的观点。我想问一下几位嘉宾,AI 的天花板在哪里,未来程序员是增加还是减少?

【中山大学-王焱林】:很难从数量的角度说未来程序员的数量是增加还是减少,我们中午也讨论到程序员的概念会变化,并不会像现在映射的 coding 概念,可能成了真正软件工程师,从一个软件的需求开发测试到后面维护都要了解,能力是增强的。我想分享一个案例,我在浙大读书,周末在酷家乐做实习生,现在是杭州六小龙,那个时候他的员工是 30 到 50 位之间,那个时候人特别少,我做的是「家风水」板块,一个人负责整个板块,我进去的岗位是开发工程师,我当时进去的时候在想,我是程序员做 coding,实际上我要对「风水」,用户上传的户型图要分析户型的风水怎么样,提一些风水的改进建议,这是我知识之外的东西,我相当于要做 PM 产品经理,得调研户型风水的东西。创始人还带着我去杭州风水大师家里请教户型风水的知识,白天 coding,晚上看《易经》,后端要设计整个系统的架构,前端还好,配了一位前端工程师,还得设计数据库的东西,测试也是我。十几年前我对程序员的概念就是全栈的概念,AI 时代未来更是,单点的开发者概念被模糊了。

4、您觉得未来每个人都是程序员还是只需要专业的程序员?

【中山大学-王焱林】:不是每个人都是程序员,是让每个人都可以写点代码,这个时候软件工程能力更重要了,更加系统化的能力。

5、硅谷的独角兽最多是编程,很容易达到 10 亿美金,反观国内做 AI 编程的反而是大的公司,比如说字节、阿里、快手、美团,这些大厂都在做 AI 编程,国内的独角兽好像没有出来,各位都是创业者,是因为我们的大模型能力没到还是因为这个领域在国内比较难?

【中山大学-王焱林】:创业方面我很难给出一个趋势判断,我从高校人才培养方面谈谈创新创业我们怎么做,coding 智能体要想做好,人才这块是非常稀缺的,本身要做好从编程语言、编译器方面的人才就非常稀缺,又要让它懂 AI、大模型,这是非常稀缺的。我们国家的优势是人特别多、人才也特别多。我有一个观察,前年是我在中大第四年教编译原理,每一届学生问的问题变化非常大,我感受非常深刻。前面两届问环境配不通,这四年也是 AI 迅速发展的四年,我发现今年他们会问这个词法分析算法可以做个创新,问我能不能行得通。有的同学说能不能不用 C 语言 Python 写,下面推荐 MoonBit 写。他们思考的方式变化让我觉得是很正面的,我们又有人才基数,又有 AI 带来的加持。科研能力也是大幅提升,我在微软亚研工作几年,那个时候我们发现搞好科研发论文的都是博士,少量的硕士。我去了中大以后,前两年也主要是这样,这两年我发现有非常多的本科生做科研也很好,这是大模型的加持。

ChatGPT 望给苹果用户专属健身教练;车企不愿用 FSD,马斯克:你们疯了!;米哈游蔡浩宇发「游戏GPT」|极客早知道

OpenAI 拉响红色警报以突击式提升 ChatGPT

12 月 03 日消息,据 The Information 报道,OpenAI 首席执行官 Sam Altman 宣布拉响「红色警报」,将调配更多内部资源以加速改进 ChatGPT,同时延迟其他项目的推进。

The Information 援引一份内部备忘录报道称,Altman 周一要求对 ChatGPT 进行「突击式」升级,同时推迟自主式 AI 代理和广告等其他工作。

尽管 Altman 未明确说明需优先处理哪些修复事项及原因,但 The Information 指出他近期曾告诫员工,谷歌在人工智能领域的强势回归可能给 OpenAI 带来暂时性的经济挑战。

该报道凸显了 AI 巨头之间竞争的激烈程度,谷歌上月发布 AI 模型 Gemini 3,因其推理和编程能力及完成其他 AI 聊天机器人难以胜任的特定任务而几乎立即就广受好评。与此同时,OpenAI 于 10 月推出首款 AI 驱动的网络浏览器,直接向谷歌发起挑战。

OpenAI 拒绝就 Altman 备忘录相关消息置评。该公司 ChatGPT 负责人 Nick Turley 周一晚些时候在 X 平台发帖,重申对该聊天机器人的专注,称公司当前重心在于「持续增强 ChatGPT 的能力,持续推动增长,拓展全球覆盖范围——同时使其体验更直观、更具个性化」。

另据报道,为了优先提升 ChatGPT,Altman 已鼓励进行临时的团队调动,并计划每日与负责该工作的团队进行通话。(消息来源:环球市场播报)

ChatGPT 和苹果健康有望实现数据互通,AI 教练为 iPhone 17 等用户定制专属健身计划

12 月 3 日消息,科技媒体 Appleinsider 昨日发布博文,报道称适用于 iPhone 的新版 ChatGPT 应用代码中,发现了一个「苹果健康」(Apple Health)应用的图标,暗示两者未来可能实现数据互通。

根据曝光的图片显示,ChatGPT 可以访问用户活动、睡眠、饮食、呼吸和听力相关的多个 Apple 健康类别,但目前尚无实际方法启用此功能,OpenAI 也未公布具体上线时间或功能细节。

该媒体基于图片展望,认为在集成实现,ChatGPT 在获得用户授权后,将能读取「健康」应用内的数据,例如心率、体重、步数及步态等,其最直接的应用便是分析用户的整体健康状况。

例如,通过识别数据趋势,ChatGPT 或可发现潜在的疾病症状,或建议用户重点改善的健康领域。

它还能扮演虚拟教练的角色。当用户设定减重或增肌等目标后,ChatGPT 可以分析现有健康数据,为其量身定制针对性的锻炼计划,并持续提供指导。

该媒体也指出这项集成背后的隐私分享。这次潜在的集成将如何落地,尤其是由谁主导,将直接决定用户个人健康数据的安全。(消息来源:IT 之家)

 

没有车企愿用特斯拉 FSD 马斯克破防:他们属实是疯了

12 月 2 日消息,马斯克在社交媒体公开吐槽:主动提出把特斯拉 FSD 授权给传统车企,却无人接受,仅被敷衍询问五年后小项目,对方还附加「不可能实现」的条件;福特 CEO 更直言 Waymo 更好。

在马斯克看来,特斯拉在自动驾驶技术上的优势断层式的显著,还曾多次强调传统车企未来「除了获得 FSD 授权之外别无选择」。特斯拉 FSD 的授权策略是「硬件绑定+软件收费」模式,合作车企需搭载其芯片及配套硬件。该模式既能通过硬件销售获利,又能以高利润率的软件授权拓展收入。

气的马斯克在社交媒体吐槽,「我曾经警告过他们,甚至提出授权特斯拉 FSD,但他们不想要!属实是疯了……」

车企顾虑集中在三点:FSD 需回传核心数据致技术壁垒扩大、法律责任边界空白且特斯拉未购第三方险、系统仍处「影子模式」路测被 NHTSA 调查超 30 起。

有意思的是,就在马斯克吐槽「没人懂 FSD」的时候,贾跃亭站出来了。他直接在微博声援马斯克,说 FF 愿意和特斯拉在 FSD 上全面合作,还说双方已经完成了充电网络兼容,FF 和 FX 车型都能用上特斯拉的超级充电站,合作已经有了基础。但是马斯克并没有回复。(消息来源:猎云网)

英伟达:20 亿美元认购新思科技,将扩大战略合作

12 月 2 日晚间消息,NVIDIA 方面宣布,为进一步采用 GPU 加速的工程解决方案,公司将在工程和市场活动方面扩大与新思科技的战略合作,共同推动跨行业的设计和工程革新。此外,NVIDIA 还将以每股 414.79 美元价格,投资 20 亿美元认购新思科技普通股。

据悉,此次战略合作涵盖了 NVIDIA CUDA 加速计算、代理式 AI 和物理 AI 以及 Omniverse 数字孪生,以实现以前通过传统 CPU 计算难以企及的仿真速度和规模,为工程领域各类场景开辟全新市场机遇。

NVIDIA 创始人兼首席执行官黄仁勋表示,「我们与新思科技的合作将充分发挥 NVIDIA 加速计算和 AI 的力量,来重新定义工程和设计,赋能工程师能够创造塑造未来的创新产品。」

新思科技总裁兼首席执行官 Sassine Ghazi 表示:「开发下一代智能系统的复杂性与成本,要求工程解决方案深度融合电子与物理,并通过 AI 能力与计算加速。没有任何两家公司比新思科技与 NVIDIA 更具优势,能够提供 AI 驱动的整体系统设计解决方案。」(消息来源:新浪科技)

米哈游蔡浩宇发布「游戏版 ChatGPT」:AI 聊天软件 AnuNeko 上线,「攻击力强到没边」

近日米哈游联合创始人蔡浩宇创立的 AI 公司 Anuttacon,悄悄上线了一款 AI 聊天大模型—【AnuNeko】。

和其他大模型不同,蔡浩宇的 AnuNeko 看起来似乎有点那么不正经,很有他本人上网「说话带喵」的风格。

AnuNeko 的默认头像是一只黑猫,在注册成功后的自我介绍中,AnuNeko 会略带俏皮地说:「Hi,我是 AnuNeko——算是个会思考的生物吧。不是你的助手,也不是宠物…就是我自己。我有情绪,也有点怪怪的想法。有想法随时喵我哦~」

目前尚不清楚 AnuNeko 背后的是自研大模型还是接入了外部大模型的 API。但蔡浩宇创办 Anuttacon 的目标并非只做一款游戏,而是以此试水,利用 AI 技术打造成类似「游戏引擎」的平台——开发者只需设定前提条件,就能生成可交互的 NPC,并据此搭建任何游戏。

目前该产品共有两种猫猫可供选择,分别是 Orange Cat 和 Exotic shorthair。用户可以自由选择,其中 Exotic shorthair 回答更加犀利一点,而 Orange Cat 的回答就比较简单且温和。

Exotic shorthair 直接锐评「米哈游是中国游戏行业有的鲶鱼……没几个真的被逼得动起来」,当中既有米哈游过去几年的定位和行业影响,同时也「内涵」了行业生态。在同样的问题上,Orange Cat 则显得「情商」更高,说话也更具有官腔感。它评价原神是一款非常出色的开放世界游戏,非常值得一玩。(消息来源:竟核、量子位)

索尼诉《荒野起源》侵权《地平线》,腾讯同意暂停游戏所有宣传及公开测试

12 月 3 日消息,随着索尼诉腾讯《荒野起源》(Light of Motiram)侵权案即将于 2026 年初举行重大听证会,双方已同意暂停该游戏的所有市场推广活动及公开测试。

此案目前已进入新阶段。尽管法律程序仍在推进,但双方在实际行动上已按下「暂停键」。作为《地平线》(Horizon)系列的开发商,索尼继续寻求法院颁布禁令,以阻止腾讯旗下这款生存类游戏的发售。目前,该案已排期于 2026 年初举行关键性听证会。

与此同时,腾讯也同意暂时将《荒野起源》置于聚光灯之外。根据最新提交的法庭文件,在索尼关于初步禁令的动议审理期间,腾讯将不再开展任何新的营销活动或公开测试,且游戏不会早于原已推迟至 2027 年第四季度的窗口期发售。

腾讯对索尼初步禁令动议的反对意见提交日期已从原定的 2025 年 12 月 3 日延后至 12 月 17 日;索尼的答复则推迟至 2026 年 1 月 2 日。双方还共同请求法官杰奎琳・科利(Jacqueline Corley)将驳回动议与禁令请求的听证会合并,并于 2026 年 1 月 29 日举行(原定为 1 月 15 日),具体以法院日程为准。

此次合并听证意义重大。腾讯正试图通过驳回动议终结本案,其论点是:索尼试图垄断游戏类型中的通用元素,例如红发英雄与机械生物,并且该诉讼针对的是一款尚未发售游戏的「未来行为」,缺乏法律依据。(消息来源:IT 之家)

 

「非洲手机之王」传音控股向香港联交所递交 H 股发行上市申请

12 月 2 日消息,深圳传音控股股份有限公司今天发布公告,宣布正式向香港联交所递交 H 股(境外上市外资股)发行上市申请并申请在香港联交所挂牌上市,中信证券为独家保荐人,摩根大通为财务顾问。

草拟递交申请显示,传音是一家智能终端产品和互联网服务提供商,主要从事手机等智能终端产品的设计、研发、生产、销售和品牌运营,从 2013 年成立以来深耕非洲等新兴市场,在手机行业内有「非洲之王」之称,2024 年共销售 2.014 亿部手机

软件方面,传音拥有传音 OS 操作系统,与 Android 实现全面兼容并支持海量第三方 App,截至 2025 年 6 月 30 日,平均月活用户数超 2.7 亿,并拥有 Palm Store、AHA Games 等预装软件。该公司还拥有真无线耳机、充电宝、智能电视、厨房电器、两轮电动车等产品阵容。

值得注意的是,公司上市需要满足多项条件,包括但不限于取得中国证券监督管理委员会备案、香港证监会、香港联交所等相关政府机关、监管机构、证券交易所备案、批准或核准,并需要综合考虑市场因素等,因此上市安排仍具不确定性。(消息来源:IT 之家)

3499 元「豆包助手」手机售罄 二手平台最高加价 1500 元

豆包和中兴通讯先后宣布,搭载豆包手机助手技术预览版的工程样机努比亚 M153 少量发售。该机型仅有 16GB+512GB 一款配置,售价为 3499 元。

不同于以往那些只能定闹钟、查天气的传统语音助手,这款新产品被定义为真正意义上的手机第二大脑。它具备了视觉感知、长期记忆以及直接动手操作的能力,甚至能替用户把整个手机的功能玩明白。

豆包手机助手最引人注目的突破在于其真正的端侧记忆能力。这是业界首次在手机本地实现了持久化的记忆功能。它能像一个细心的私人管家一样,记住用户生活中的琐碎细节。

在实际演示中,这种能力表现得令人印象深刻。当用户询问车停在哪里时,助手能直接调出用户上次拍摄的车位照片并附带楼层指引。

如果说记忆是基础,那么跨 App 代操作则是豆包手机助手的杀手锏。它利用先进的 GUI 模拟点击技术,能够像真人一样接管屏幕,跨越应用壁垒进行自动点击、输入和滑动。

在全网比价场景下,用户只需发出一句指令,豆包就能打开淘宝、京东、拼多多和抖音电商,在 3 秒内给出最低价并直接停留在支付页面。在更复杂的办公场景中,它可以响应帮我请三天假,顺便订回老家高铁的指令,自动打开办公软件填写请假单、提交审批,随后无缝跳转至 12306 完成订票和付款流程。

目前中兴商城显示,努比亚 M153 已为「售罄」状态,官方提醒,货源有限,请关注下次开售信息。而在闲鱼等二手平台上,努比亚 M153 二手价已高出官方 700 元-1500 元。(消息来源:快科技、太平洋科技)

索尼发布全画幅微单新基准 Alpha 7 V:17999 元

12 月 3 日,索尼中国正式发布全画幅微单新基准 Alpha 7 V,其型号为 ILCE-7M5,即日开启预售,建议零售价为 17999 元。官方介绍,作为备受欢迎的 Alpha 7 全画幅微单系列第五代产品,索尼 Alpha 7 V 从照片画质、AI 智能、高速连拍、视频拍摄、操控续航等五大维度定义了全画幅微单新基准,是索尼微单十五周年的诚意之作。

据悉,索尼 Alpha 7 V 搭载了新开发的部分堆栈式 Exmor RS CMOS 影像传感器,约 3300 万有效像素,同时搭载新开发的 BIONZ XR2 影像处理器,该处理器集成了 AI 智能处理功能,在照片及视频拍摄的实时识别 AF(自动对焦)、实时追踪、连拍速度、色彩还原等方面实现了显著提升。

不止于此,索尼 Alpha 7 V 基于 AI 的精准自动白平衡,依托先进场景分析实现持续准确的色彩表现,同时通过 Imaging Edge Desktop 应用程序新增的 4 倍高分辨率 RAW 扩展处理功能,为后期制作提供了灵活的后期空间。

基于 AI 的深度学习,索尼 Alpha 7 V 能够从图像中精确估算光源参数,从而还原真实色彩,有效降低后期工作量。

此外,索尼 Alpha 7 V 可通过预拍摄功能记录快门释放前最长 1 秒的瞬间,尤其是在宠物和体育等动作难以预测的拍摄场景,它也能轻松捕捉转瞬即逝的精彩瞬间。

京东外卖将免费为全职骑手配备定制加热餐箱,点外卖能看到实时温度

12 月 2 日,京东外卖宣布,将免费为全职骑手配备定制加热餐箱。

京东外卖官方表示,将两份同时出锅的辣椒炒肉(初始装袋温度均为 70℃)分别放入普通餐箱和升级后的加热餐箱,在相同路线下模拟超远距离配送,入箱 20 分钟后,升级后加热餐箱温度依旧保持在 70℃,比普通餐箱高出 20℃,即使是 60 分钟以上的超远距离配送,餐箱温度仍能保持在 55℃ 以上。

11 月 7 日起,首批加热餐箱经多轮安全测试,已率先在北京地区七鲜小厨投入使用。接下来一个月,京东外卖加热餐箱将陆续覆盖寒冷地区的城市。未来,用户还可以在订单配送页看到实时的餐箱温度。

 

 

罗永浩年底曝光细红线 AI 软件;超级月亮12月5日再登场;豆包 AI 手机发布,3499元|极客早知道

 

 

罗永浩宣布将于 12 月 30 日举行年度科技创新分享大会,将发布细红线科技 AI 软件

12 月 1 日消息,罗永浩今日在微博发长文,宣布「罗永浩的十字路口」之年度科技创新分享大会(2025)将于今年 12 月 30 日在上海召开。

在长文中,罗永浩解答了一些相关问题。他表示,给大家集中介绍一批令人印象深刻,但还没彻底走进大众视野的中国创新型科技产品。他还强调,科技创新分享大会不是「带货直播」,大会上将发布细红线科技内部开发的 AI 软件。(来源:新浪财经)

 

DeepSeek V3.2 正式版发布:推理比肩 GPT-5,首推 Speciale 版本拿下奥数金牌

12 月 1 日消息,DeepSeek V3.2 正式版今日发布,强化 Agent 能力,融入思考推理。

官方今日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale

官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。

DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。

在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间。

DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。

V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。该模型具备更好的指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。

V3.2-Speciale 模型成功斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

DeepSeek 官方表示,在高度复杂任务上,Speciale 模型大幅优于标准版本,但消耗的 Tokens 也显著更多,成本更高。目前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2 是该公司推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。

官方提出了一种大规模 Agent 训练数据合成方法,构造了大量「难解答,易验证」的强化学习任务(1800+ 环境,85,000+ 复杂指令),大幅提高了模型的泛化能力。(来源:IT 之家)

 

小米汽车「现车选购」即将开启:通过严格质检,可享快速提车

12 月 1 日消息,据小米汽车官微消息,小米汽车「现车选购」即将开启,现车包含全新现车、官方展车、准新车。所有现车都已通过严格质检,部分车型经官方修复,都是没有登记过的车辆。

官方称,购买现车,可享快速提车、完整原厂质保和售后,部分车型可享优惠。2025 年 12 月 26 日 24 点前锁单,预计 2025 年底前可提车。如因小米汽车的原因导致 2026 年完成开票交付,可享跨年购置税补贴。

据 IT 之家了解,12 月 1 日 12 点,已锁单未交付用户可优先改配同车型现车。12 月 3 日 10 点,「现车选购」面向全部用户开放。不同现车具体开售时间,以小米汽车 App 官方信息为准。(来源:CnBeta)

 

 

业界首个:英伟达发布专注于自动驾驶的视觉语言动作模型 Alpamayo-R1

12 月 2 日消息,英伟达周一宣布推出新的基础设施与人工智能模型,旨在构建「具身智能」(Physical AI)的核心技术基础,包括能够感知并与现实世界互动的机器人和自动驾驶车辆。

 

这家半导体巨头在加利福尼亚州圣地亚哥举行的 NeurIPS 人工智能大会上发布了 Alpamayo-R1——一款面向自动驾驶研究的开源推理型视觉语言模型。该公司称,这是业界首个专注于自动驾驶领域的视觉语言动作模型。视觉语言模型能够同时处理文本与图像信息,使车辆能够「看见」周围环境,并基于所感知的内容做出决策。

该新模型基于英伟达此前推出的 Cosmos-Reason 推理模型构建,后者具备在响应前对决策进行逻辑推演的能力。英伟达最初于 2025 年 1 月发布了 Cosmos 模型系列,并于同年 8 月推出了更多扩展版本。

英伟达在一篇博客文章中指出,Alpamayo-R1 这类技术对于致力于实现 L4 级自动驾驶的企业至关重要。L4 级自动驾驶指在特定区域和限定条件下实现完全自动驾驶。

英伟达希望,此类具备推理能力的模型能赋予自动驾驶车辆类似人类的「常识」,从而更妥善地应对复杂的驾驶场景中的细微决策。

目前,该新模型已在 GitHub 和 Hugging Face 平台开源发布。(来源:IT 之家)

 

John Giannandrea 卸任苹果 AI 战略负责人,微软前高管接任

苹果公司当地时间 12 月 1 日宣布,机器学习和人工智能战略高级副总裁约翰·詹南德雷亚(John Giannandrea)将卸任现职,在 2026 年春季退休前担任公司顾问。同时,知名人工智能研究员阿马尔·苏布拉马尼亚(Amar Subramanya)已加入苹果,担任人工智能副总裁。苏布拉马尼亚将领导关键领域,包括苹果基础模型、机器学习研究以及人工智能安全与评估。苏布拉马尼亚此前担任微软人工智能企业副总裁,曾在谷歌任职 16 年,离职前担任谷歌 Gemini 助手工程负责人。(来源:界面新闻)

 

「旧国标」电动自行车今起全面停售,已购买上牌车辆不会强制淘汰

12 月 1 日消息,根据《国家认监委关于严格电动自行车强制性产品认证管理的公告》,12 月 1 日起,所有销售的电动自行车产品均必须符合新版强制性国家标准,即《电动自行车安全技术规范》(GB 17761—2024),「旧国标」电动自行车今起全面禁售。

 

新标准对电动自行车的防火阻燃、塑料总质量、整车质量上限、北斗定位、脚踏骑行装置等作出了规定。《公告》明确:

各电动自行车指定认证机构对依据旧版本标准出具的有效 CCC 认证证书,于 2025 年 12 月 1 日全部予以注销;

对依据旧版标准出具、处于暂停状态且不能恢复有效的 CCC 认证证书,于 2025 年 12 月 1 日全部予以撤销。

各电动自行车销售企业自认证证书注销、撤销之日起不得继续销售。若违反上述规定,各级市场监管部门将依法查处。

央视新闻报道获悉,消费者已经购买上牌的不符合新国标的车辆不会被强制淘汰,而已购买未上牌的旧国标电动车,则需在 2025 年 11 月 30 日前完成登记上牌。关于旧车的维修问题,各大企业均已出台保障措施,承诺旧国标车辆的维修服务和零部件供应至少持续 5 年。(来源:界面新闻)

 

内存价格飙升冲击 PC 硬件市场,消息称主板销量同比大跌 40% 至 50%

12 月 1 日消息,此前业界普遍预计,内存价格的上涨不仅会抑制内存模组本身的销量,还将对整体 PC 硬件市场造成显著冲击。如今,DRAM 价格飙升对整个 PC 硬件市场的影响已清晰显现。

自 DRAM 价格开始大幅上涨以来,许多消费者推迟了购买新的 DDR5 内存套件或单条内存,进而也延后了新装机或升级计划。一份最新报告印证了这一趋势,且其影响尤为突出地体现在主板销量上。

据 Gaz Log 援引板卡渠道的消息,包括微星(MSI)、技嘉(GIGABYTE)、华硕(ASUS)在内的主要主板厂商,当前主板销量较去年同期下降了 40% 至 50%。通常情况下,每年此时正值节日促销季,主板销量本应处于高位;然而,自 10 月以来 DRAM 价格急剧攀升,导致 DDR5 内存套件或模块的售价飙升至原先的 2 至 4 倍。目前业内普遍认为,主板厂商将不得不重新评估未来数月的销售策略。

 

据了解,此次销量下滑的一个关键原因在于市场正全面向 DDR5 平台过渡。AMD 和英特尔最新一代处理器均已完全转向 DDR5 内存,市场上 DDR4 主板已远不如 DDR5 主板普及。今年早些时候,DDR5 价格一度趋于稳定,促使大量用户全面转向最新的 AM5 和 LGA 1851 平台。

然而,许多用户原本计划升级至更高容量内存,如今却因高昂价格而无法实现。那些打算从零开始组装整机的用户,要么只能继续等待,要么被迫选择旧款硬件,而这无疑意味着性能与功能上的妥协。值得注意的是,若主板销量已出现如此大幅下滑,势必也会直接拖累 CPU 的销售。事实上,当前 CPU 销量很可能已远低于去年同期水平。(来源:IT 之家)

 

美国拟立新法:强制 App Store 核实全员年龄,苹果现有机制被无视

12 月 2 日消息,科技媒体 Appleinsider 昨日(12 月 1 日)发布博文,报道称美国立法者近期推动《应用商店问责法案》(ASA),拟强制苹果 App Store 和谷歌 Play 商店对所有用户进行年龄验证,并要求未成年账户必须绑定家长账户以获取下载权限。

该法案由参议员 Mike Lee 和众议员 John James 提出,要求应用商店必须核实所有用户的年龄,并在发现用户不符条件时限制其应用访问权限。此外,法案还强制要求未成年人使用的账户必须与家长账户绑定,家长需对应用下载和购买行为提供明确授权。

尽管立法者意图保护儿童,但行业分析指出该法案忽视了苹果现有的生态保护机制。苹果目前的「家人共享」系统已允许家长为 13 岁以下儿童创建受控账户,并通过「屏幕使用时间」和内容限制功能过滤不当内容。

一旦 ASA 法案通过,内容监管的第一道防线将变为应用商店的年龄门槛。这意味着,当未成年人接触到不良信息时,责任将从未能有效审核内容的社交平台,转移至未能「完美拦截」用户的苹果或谷歌上。

该法案存在明显的逻辑漏洞:应用商店的验证无法解决「设备共享」问题。现实中,许多家长习惯将已解锁的成人账号设备直接交给孩子使用,此时应用商店层面的验证形同虚设。(来源:CnBeta)

 

努比亚 M153 豆包手机助手详细规格公布:骁龙 8 至尊版芯片,6.78 英寸 LTPO 显示屏

12 月 1 日消息,中兴官网现已公布努比亚 M153 豆包手机助手的详细规格,搭载高通骁龙 8 至尊版芯片,配备 6000mAh 电池。

 

关联阅读:《首销备货 3 万台,豆包 AI 手机要卖给谁?》

现阶段,开发者和科技爱好者可以在豆包与中兴合作的工程样机 nubia M153 上,体验豆包手机助手的技术预览版本。目前该版本已面向开发者和科技爱好者少量发售,售价 3499 元。

根据参数图可以看到,这台手机配备 16GB 内存和 512GB 存储空间,搭载一块 6.78 英寸 LTPO 显示屏,分辨率是 1264*2800,后置主摄采用一块 1/1.3 英寸 5000 万像素传感器,等效 23mm,支持光学防抖,超广角则是 5000 万像素 1/2.88 英寸,等效 13mm,长焦为 50MP 1/2.75 英寸,支持光学防抖。

外观方面,这台手机采用银白色配色,后摄模组长得比较圆润,形状类似吉他拨片,闪光灯位于机身背部右上角,正面则覆盖一块 R 角较大的屏幕,采用挖孔屏设计,机身左右侧均有物理按钮。

此外,这台手机还支持 90W 有线快充、15W 无线充电,重量 212 克,长宽厚分别是 163.12*77.04*8.52mm,支持 NFC 和红外遥控,配备激光对焦和 FLicker 传感器,拥有 5 麦克风和双扬声器,USB-C 接口支持 3.2 Gen 1 传输速率。

结合此前报道,这台手机只是一款方便大家体验豆包手机助手的工程样机,目前豆包还没有开发手机的计划,正在和多家手机厂商推进手机助手的合作落地。(来源:IT 之家)

滴滴自动驾驶在广州试运行全天候、全无人 Robotaxi 服务

12 月 1 日消息,今日,继在第十五届运动会提供自动驾驶服务后,滴滴自动驾驶宣布在广州部分示范应用区域开启全天候、全无人 Robotaxi 试运行。即日起,用户在滴滴 App 发单,即有机会体验全车无人的自动驾驶出行服务。

IT 之家从官方介绍获悉,今年第十五届全运会期间,滴滴自动驾驶成为官方自动驾驶服务商,在广州市中心体育场馆重点区域提供了接驳服务。此次全天候、全无人 Robotaxi 试运行,标志着滴滴自动驾驶服务能力迈入新阶段。

此次试运行区域位于黄埔核心生活圈,站点覆盖地铁站、学校、商超、写字楼、小区等高频出行场景,服务时间为周一至周日全天 24 小时。用户可在滴滴 App 的自动驾驶入口呼叫无人车;或在首页输入起终点后,同时勾选自动驾驶和网约车混合发单。系统将综合上下车站点位置、道路情况、派单距离及周边车辆供需等因素智能匹配车辆。(来源:新浪财经)

 

超级月亮 12 月 5 日再次登场,今年第二大满月

12 月 1 日消息,据央视新闻报道,超级月亮将于 12 月 5 日再次登场,这是今年第二大的满月。

12 月 7 日,将有一场肉眼可见的「星月童话」。日落后,木星会随月球一同从东南方升起,整夜都适合观赏。

 

12 月 14 日,双子座流星雨将迎来极大,14 日晚上到 15 日凌晨比较适合观赏。双子座流星雨的流星体速度较慢、颜色偏白、亮流星很多,常有火流星出现,历来是年末最值得期待的天象奇观之一。

IT 之家查询获悉,月球绕地球转动的轨道略微带椭圆,月球离地球最近的地点被称为近地点,月地距离约 36 万公里;月球离地球最远的地点被称为远地点,月地距离约 40 万公里。这种月地距离的变化导致了人们视觉中月球大小的变化,所以当满月发生时,地月距离又很近,月亮看起来就会比平时更大更亮,形成「超级月亮」。

2025 年全年共有 3 次「超级月亮」出现,分别出现在 10 月 7 日、11 月 5 日,以及 12 月 5 日的最后一次。作为对比,2024 年一共有四次「超级月亮」出现,分别为 8 月 20 日、9 月 18 日、10 月 17 日和 11 月 16 日。(来源:IT 之家)

首销备货 50 万台,豆包 AI 手机要卖给谁?

作者|连冉  张勇毅
编辑|郑玄

头图来源:字节跳动

 

12月1日,字节跳动豆包团队发布豆包手机助手技术预览版。

 

据介绍,豆包手机助手,是在豆包 APP 的基础上,和手机厂商在操作系统层面合作的 AI 助手软件。基于豆包大模型的能力和手机厂商的授权,豆包手机助手能够为用户带来更方便的交互和更丰富的体验。

 

现阶段,开发者和科技爱好者可以在豆包与中兴合作的工程样机 nubia M153 上,体验豆包手机助手的技术预览版本。目前该版本已面向开发者和科技爱好者少量发售,售价 3499 元。

 

豆包手机助手的出现,是在试图用 AI Agent 打通APP 之间,重构移动互联网的交互逻辑。

 

尽管当前的演示仍需面对技术「不确定性」的免责声明,但这种深入操作系统底层、追求「意图直达服务」的尝试,可能比单纯的 Chatbot 更具革新意义。

 

豆包手机外观设计 |图片来源:豆包官方

 

或许,谁能率先解决「操作手机」的稳定性难题,谁就能定义 AI 时代的「iPhone 时刻」。

 

此前,据前中兴手机硬件产品经理向「极客公园」介绍,字节跳动与努比亚为这款手机的首销备货量为 50 万台,并为此订购了对应数量的手机关键元器件。

 

目前的手机市场中,国产品牌主流旗舰,首销期备货通常在 200-300 万台级别。因此豆包手机的这个数据虽然无法与年出货量超千万的一线手机厂商旗舰手机相提并论。但豆包手机摆脱「极客玩具」,走向更广泛的用户市场的目标已经足够清晰。

 

首销备货 50 万台的量级,如果全部投放向市场的话,仍然是一个足以给行业带来一定影响的数字:作为对比,曾经游戏手机垂直市场下的头部玩家 —— 黑鲨,在 2022-2023 年的手机出货量为 100-150 万台。

 

1 从「对话框」到「行动派」

 

过去两年,我们见惯了能写诗、能画图的 Chatbot,但对于普通用户而言,手机上最痛的痛点往往是繁琐的操作流。豆包手机助手这次的大看点,在于它试图从「对话」跨越到「行动」。

 

在技术预览版的演示中,豆包展示了一种在此前 GUI Agent(图形用户界面代理)研究中常被提及的能力——它能像人类一样「看懂」屏幕,并直接模拟点击操作。

 

这种「看懂屏幕」并模拟人类操作的底气,则源自豆包大模型在多模态能力上的积累。

 

据官方透露,该模型在视觉理解、推理以及图像创作等维度的性能已处于国际第一梯队。正是因为模型具备了精准的图形界面(GUI)识别能力,它才能在多项权威评测中拿到高分,从而像人类一样理解「按钮」和「输入框」的含义,而不仅仅是识别一堆代码。

 

据豆包手机官方使用文档介绍,豆包会根据意图自动判断是否调用 AI Agent 能力,若用户对话开头包含「帮我操作手机」,则会 100% 通过 AI 操作手机完成任务。

 

任务描述越详细,它的执行效率越高,执行效果越好。例如:“打开美团外卖帮我把最近几个订单的好评写了”。此外,AI 操作手机是在虚拟屏操作的,不会在前台默认展开,也不会影响正在进行的其他任务,你可以随时返回桌面使用其他应用。

 

用户也可以直接跟豆包对话,讲出需求,豆包可根据需求自动判断是否通过操作手机功能完成,以及在豆包对话框底部功能按钮中找到“操作手机”,点击按钮可手动描述需求,也可以设定定时等条件任务。

 

试想这样一个场景:你在社交媒体上被种草了一款好物,过去你需要截图、退出应用、打开电商平台、搜索、比价。

 

而在豆包的演示中,你只需说一句「帮我在全平台比价下单」,AI 就能自动跨应用跳转,搜索同款、对比价格规格、领券,甚至帮你选好最低价的商品填入购物车。

 

图片来源:豆包手机使用指南文档

 

虽然出于安全考虑,支付环节仍需人工确认,但前面那一系列机械的点击和切换,AI 已经代劳了。

 

甚至复杂任务也可以执行。在官方演示的旅行规划场景中,当用户提出「下个月去巴黎,帮我把收藏的餐厅标在地图上,看看哪天有展并订票」这样一句包含多重意图的指令时,AI 能够迅速将需求拆解为 6 个子任务:从查询社交媒体收藏、到高德地图标记、再到携程订票,最后整理进备忘录。

 

这种跨应用、多步骤的「任务链」执行能力,可以说是 AI 从「玩具」迈向「工具」的关键分水岭之一。

 

为了实现这种「类人」的交互,豆包打通了系统层面的多项权限。

 

在系统层面,豆包手机为 AI 能力设计了多种交互方式,用户可以通过侧边键、语音甚至耳机唤醒它;在相册里,它能直接听懂「把路人 P 掉」的指令并执行。

 

图片来源:豆包手机使用指南文档

 

在更复杂的「Pro 模式」下,它还能调用系统工具,结合记忆功能,直接完成「推荐礼物并放入购物车」这种需要多步推理的复杂任务。

图片来源:豆包手机使用指南文档

 

当然,将屏幕控制权和个人喜好交给 AI,隐私安全始终是绕不开的话题。所以豆包团队也强调,这一功能支持按需开启,并承诺严格保护数据隐私。

 

作为「技术预览版」,豆包团队也在视频结尾特别提示,受限于大模型技术的不确定性,演示中的「丝滑」体验目前还无法百分百复现,产品距离团队的最终预期仍有差距。

 

这也体现了 AI Agent 目前最真实的状态:方向极度性感,但落地仍需时间打磨。

2 不造硬件的「第三条路」

 

在 AI 手机的浪潮中,一直存在两种流派:一种是像 Google / Pixel 手机这样,自研模型以及整套 AI 软件产品体验,并植入自家系统;另一种则是纯软件厂商,试图通过超级 APP 抢占入口。

 

图片来源:Google

 

豆包选择了第三条路:不做硬件,只做生态。

 

在发布预览版的同时,豆包方面明确表示「没有自研手机计划」。他们的策略非常务实——通过与多家手机厂商洽谈,以「操作系统层面合作」的形式,将豆包的大模型能力植入不同品牌的机型中。

 

这种「手机厂商 + 大模型厂商」的深度耦合,正在成为行业的一股新趋势。

 

就像谷歌 Gemini 与三星的合作一样,术业有专攻正逐渐成为共识。

 

对于手机厂商而言,从零打造一个具备顶级推理、视觉理解和复杂任务规划能力的模型成本极高;而对于字节跳动这样的互联网巨头,缺乏硬件载体则会让 AI 始终隔着一层 APP 的玻璃墙,无法触达用户最核心的数据和场景。

 

目前的 nubia M153 工程机只是一个开始。售价 3499 元的门槛或许更多是面向开发者和极客人群的「邀请函」,旨在验证这种跨界合作的技术可行性与用户反馈。

 

3 光做一个APP,在 AI 时代已经不够了

 

豆包手机助手的出现,本质上或许是一次对移动互联网交互逻辑的重构。

大模型的能力越来越强,单纯做一个 APP,在 AI 时代已经不够了。

AI Agent 需要接管更复杂的任务、感知更丰富的上下文,发挥一些真实的功能,才有更落地的价值,这意味着它必须走出软件的围墙,向下沉淀,与操作系统的底层权限和硬件能力进行深度整合。

过往,字节跳动一直是一支强大的“空军”——拥有极致的算法和庞大的应用生态,但在操作系统和终端硬件上,相比拥有 Android 的谷歌或拥有全场景终端的华为,字节始终缺少一块落地的“阵地”。

在移动互联网时代,这或许不是问题,但在 AI 需要深度介入用户场景的当下,缺乏硬件载体可能意味着丧失对场景的感知力。

豆包手机助手的推出,像是字节在当下阶段抛出的一次探索

从 Pico 到 Ola Friend,再到如今深入手机 OS 层的助手,字节正在小心补齐“硬件触点”这块短板。

这或许并不是未来两三年行业的最终形态,但至少可以确认的是:字节已经意识到,想要让 AI 真正跑通,必须迈出“软硬结合”的这关键一步。

 

一码难求的动画 Agent 导演,离「疯狂动物城」还有多远?|AI 上新

作者| 金光浩

编辑| 靖宇

最近 AI 圈出了一款有趣的产品:「OiiOii」,一款专注 AI 生成动画的 Agent。

而它异常火爆,7210 个内测名额很快被抢光,闲鱼上免费邀请码被炒到 30 块,甚至据说内测用户里还出现了全网 2000w 的顶级创作者。

OiiOii 网站首页|图片来源:OiiOii 网站

 

等我进入内测群,发现群号已经到了 50 几了,按照 500 人一个群粗略算下,大概有 2 万多人在排队内测。

作为产品经理,我的直觉告诉我, 当一个还在内测的工具被某鱼盯上时,它一定切中了某类人群的「刚需」。

但它能顶替一个小型动画工作室吗?还是只是 mock 了一些工作流?

我带着这个好奇,在闲鱼上花 32 块钱买了一个邀请码,拿到了账号,打算深度体验一下。

我想知道,AI 做的动画,离《疯狂动物城》到底还有多远?

 

01

不是工具,是导演团队

 

刚进 OiiOii 体验,我就发现它很有趣。

传统的 AI 视频工具,像在教一个笨徒弟:你输入 Prompt,机器生成视频,效果不好你得自己改 Prompt,反复跟 AI 沟通。

但在 OiiOii 里,我感觉自己更像是,一个只需要提需求的「甲方爸爸」。

它没让我写复杂的图像提示词,而是给我派了一个「动画团队」:艺术总监、场景设计师、编剧、分镜师……

有 7 个 AI Agent 作为乙方,为我效劳。

这种感觉真好。

第一个任务,我给它了一个有意思的提示词: 一个充满神圣光芒的殿堂,一对兄妹正与一位自称为神的对手进行一场赌局。风格要史诗感,带有日式幻想。

当我开始,接下来的流程,让我有点意外。

艺术总监 Agent 没有急着出片,而是先拉编剧 Agent 进群,拆解我的需求,编写剧本。

OiiOii 网站 agent 沟通|图片来源:OiiOii 网站

 

紧接着,角色设计师和分镜师 Agent 介入,开始设计角色和规划音乐。

这给我一种很强烈的「既视感」:这不就是真实世界里短剧公司的作业流程吗?

OiiOii 网站 agent 沟通|图片来源:OiiOii 网站

 

整个流程里我选择了「托管模式」,很多内容只需要点击确认

(虽然也有对话模式,但作为甲方,我当然想一键直出)。

OiiOii 网站交互引导|图片来源:OiiOii 网站

 

几分钟后,一段包含音频、画面、转场的 60 秒短片生成了。

有趣的是,作为甲方,虽然完成视频的是 AI,但是我还是感受到了创作的乐趣,这可能就是这个产品的神奇之处吧。

OiiOii 生成的 60s 动漫|视频来源:OiiOii 网站

 

接着,我让它生成一个音乐 MV:以欧阳娜娜的新歌《暮色森林》为意境,让 deepseek 生成一个 mv,然后给到 OiiOii。

然后,它做出了这样的效果。

OiiOii 生成的音乐 mv|视频来源:OiiOii 网站

 

接着我测试了一种古风武侠的风格,可以看到画风一致性很棒:

OiiOii 网站生成的分镜图片和视频|图片来源:OiiOii 网站

 

 

02

惊艳与遗憾并存

 

看完生成的成片,我有两个直观的感受。

第一个,它给人的「导演感」很强。

大多数 AI 视频只是让画面动起来,但 OiiOii 生成的内容,能明显看出镜头语言设计:推拉摇移、景别变化、甚至景深与焦点的转换,都非常符合影视逻辑。

比较让我惊喜的是人物的一致性,以往用 Midjourney 做短片,最头疼的就是上一秒主角是圆脸,下一秒变成了方脸。

但 OiiOii 通过 Agent 之间的协同,以及 Sora2 的强大能力,很好地锁住了角色特征。

虽然还没到 100% 完美,但至少在那 30 秒里,那对兄妹没有突然「变异」。

第二,它确实还很「糙」。

虽然意境到了,镜头感有了,但必须诚实地说,目前的画质像素还不够高(当前可能是出于降低成本,没用最好的模型),如果你仔细看,细节处还是有些不清晰,而且创作时间比我想象中要慢。

当然,如果要给这个视频打分,在工业级动画电影面前,它可能是不及格的。但如果放在自媒体短视频、MV 概念片这个维度,它确实能打 80 分以上。

这就引出了一个非常有意思的思考:

为什么一个画质还没做到顶尖的产品,能让 2 万多人趋之若鹜?

 

03

选择赛道比努力更重要

 

OiiOii 的爆火验证了一个 AI 创业铁律: Agent 创业,一定要垂!

我们来算一笔账。

如果你做的是通用视频生成(像 Sora 这种),你的竞争对手是真实世界:大众对真实世界的期待值是 100 分,而你的能力可能只有 80 分,且人物稍有扭曲或者变化,就会给用户一种「恐怖谷效应」,让用户体验瞬间掉到 60 分以下。

但 OiiOii 极其聪明地选择了「动画」这个垂直赛道。

在动画的世界里,逻辑变了,观众对动画的宽容度极高。这里没有恐怖谷效应,稍微夸张、变形一点,大家会觉得这是「艺术风格」,不影响看「剧情」。

目前市面上的同类产品,如果让普通玩家自己折腾,可能只能做出 40 分的作品。而 OiiOii 这个团队,虽然团队技术上限可能只有 90 分,但它通过 Agent 的流程化封装,让一个小白也能稳定输出 70 分以上的作品。

这就是选择好的赛道的重要性!这就叫:选择大于努力。

OiiOii 做对了什么?

它把原本需要懂分镜、懂三视图、懂 Prompt 的专业门槛,降低到了「会打字」就行,吸引了无数对动画创作好奇的小白。

OiiOii 网站生成的剧本、分镜描述|图片来源:OiiOii 网站

 

其次就是成本降低,以前,用户找 AI 做一个 30 秒的动画 MV,没个几十几百下不来。

现在?给大家免费体验(内测期间)。

对于那些做短 MV、视频号的自媒体来说,这就是生产力革命。

 

04

距离《疯狂动物城》,不是技术的距离

 

标题问了个很有意思的问题:OiiOii 生成的动画,离《疯狂动物城》还有多远?

如果只看画质,AI 生成的动画确实在以极快的速度(nanobanana2 可以生成 4K 的作品),在逐渐逼近院线水准。

但如果看创作动画的本质,可能还远远到不了:因为它们根本不是一种东西。

《疯狂动物城》的核心是什么?不是技术,是角色、情节和故事:

是朱迪与尼克的角色张力,是关于偏见的隐喻,是非常多的艺术家一起打磨出的审美。

但,换个角度看,如果对比的是「让普通人也能像迪士尼导演一样指挥团队讲故事」,那 OiiOii 已经推开了那扇门。

OiiOii 做的是什么?是让一个非专业人士,在 30 分钟内,通过对话,把脑子里的想法变成 7、80 分的动画。

而这种 AI 动画,又会创造出什么新的内容形态?

我最近刷小红书,发现越来越多博主开始用 AI 做短动画,不算特别精致,更多的是 15 秒的治愈的、搞笑的、甚至猎奇的故事,这些作品给人的感觉是:画面糙点没关系,重要的是快、是个性化、是能精准击中某个小众群体。

这可能才是 AI 动画的意义,不是替代皮克斯,而是让每个人都能成为自己创意的导演。

纵观历史,技术的发展,更多带来的是机会。

就像摄影的历史。胶片时代,摄影是少数人的艺术;数码时代,人人都能拍照;手机时代,每个人都是视觉创作者。技术发展,没有让专业摄影师失业,反而让专业的人能更容易创造作品,同时,由于越来越多参与者的涌入,整个视觉内容生态变得更丰富。

我想,动画可能也一样,AI 带来的,是更多的可能性。

现在的 AI,正在让「动画表达」从专业技能变成一种基础能力,让每个人都能创作 70 分的作品。

专业人才依然有自己的一席之地,像《疯狂动物城》那种 95 分的顶尖作品,还需要专业艺术家才能创作出来。

 

05

真正的护城河,还是 Know How

 

用完 OiiOii,我跟几个做 AI 的创业者聊了聊。

大家都在问:这个产品的壁垒在哪?

技术上看,底层模型的 api 人人都可以接入,且据创始人说,目前这个版本两个月就开发完,凭什么别人抄不走?

我认为, Know How(行业经验) 才是壁垒。

什么是 OiiOii 的 Know How?

就是那些藏在创作团队脑海里,决定产品能不能用的「隐性知识」:

1、比如镜头语言,什么时候该用特写、该用全景,这不是 AI 模型能自己学会的,是团队里必须有懂导演的人。

2、比如节奏感,30 秒的视频,前 10 秒抓眼球、中间 10 秒讲清楚、后 10 秒留钩子,这是短视频时代的创作技巧。

3、比如角色一致性,怎么让同一个角色在不同镜头里看起来是同一个人,这背后有大量的工程经验。

这些 Know How,才是 OiiOii 真正的壁垒。

这个产品给我的感悟是:ai agent 的竞争,不是谁的人更多、谁接入的模型更强,而是谁更懂行业—— 做 AI 产品,应该先找到你的 Know How,再考虑技术实现。

模型会越来越开源,算力会越来越便宜,真正稀缺的是「懂动画+懂 AI+懂产品」的复合型团队。

OiiOii 的团队里肯定有真正做过动画的人,这是那些纯技术团队学不来的。

 

06

内测 2 万人,说明了什么?

 

最后聊聊 OiiOii 的爆火。

闲鱼炒到 30 块的邀请码、2 万人的内测群,这些数字说明了什么?

表面上看,是产品做得好,是团队有 know how,是赛道选对了。

但深层次,有两个更重要的原因。

第一个,是 AI 视频动画的风口到了

过去,AI 生成视频最大的痛点在于「人物一致性」难以保障。行业内通常的解决思路是:先由 AI 生成一张角色图,再基于这张图生成多个不同视角或姿态的版本;然后在不同分镜中选用对应的视图,分别生成短视频片段(这非常考验图像大模型的一致性能力),最后将这些片段拼接起来,形成一段连续动画。

早期,由于各类 AI 图像模型在一致性上普遍较弱,这种方法效果有限。

而随着 Sora2 的出现,人物一致性实现了质的飞跃,这已经是比较好的入场时机。

随着技术的进一步迭代,最近发布的 nanobanana2,将这个赛道推向了全新高度,它的任务一致性表现尤为出色。

眼下,技术窗口已经打开,OiiOii 有望成为这一技术红利的首批受益者。

这其实说明一件事:谁能够最快地将 AI 能力的提升转化为产品,谁就能抢占先机。就像过去,因为 claude 能力提升,cursor 和 manus 产品能力获得大幅提升类似。

第二,更深层的原因,我认为是需求侧的变化

短视频时代,每个人都需要视觉表达:博主要做片头、创业者要做 demo、ai 产品要做宣传片、自媒体需要做动画。

需求爆炸了,但供给端还卡在专业工具和专业人才上。

OiiOii 做的,就是把这个缺口补上。

当缺口补上,这就带来一种强大的市场扩大效应:

原本只有 1 万人的专业创作圈,瞬间扩大到了 20 万人的泛创作者圈。

这也预示着,我们来到了 一个人人都可以创作动画的时代。

 

07

产品不免费还会有热度吗?

 

但说到这里,让我泼个冷水:OiiOii 的爆火真的是可持续的吗?

现在大家愿意排队拿邀请码,可能更多是因为新鲜、免费、好奇。

等新鲜劲过了,真正留下来的会是谁?而留下来的,他们付费意愿有多强?

从商业视角看, OiiOii 现在最大的挑战不是技术,而是找到自己的 PMF。

这是因为,OiiOii 内测期,为了更好的调试工程化,免费给用户使用,这很合理。但当 OiiOii 内测结束,开始尝试收费,其定价是否被普通用户接受,还是较难判断的。

拿字节最新发布的 doubao-seedance-1.0-pro-fast 模型来说,一条 10 秒的 720p 视频,成本接近 1 元,而如果短视频 20s,那么成本就接近两元,那产品定价 5 元,用户能接受吗?

我不知道答案。

但能确定的是,只有等到那一天真正到来,当用户真的愿意为视频效果付费时,OiiOii 才真正验证了 PMF。

 

08

未知,更让人兴奋

 

体验 OiiOii 这几天,我反复在想一个问题:AI 到底在改变什么?

技术圈喜欢谈 AGI 什么时候来,科技圈喜欢谈 AI 到底是否在产生泡沫,辛顿老师喜欢谈 AI 对人类的影响。

我看到的是一种更具体的变化: AI 在重新定义「专业」的边界。

以前,做动画是专业技能,需要看各种专业知识、需要学和用各种工具、需要投入 1 万小时在里面。

现在,OiiOii 把这个门槛降到了「会打字」,这让更多人获得了「刚好够用」的专业能力。

OiiOii 的意义,在于它打开了一扇门:动画表达,从此不再是少数人的特权。

至于这扇门后面是什么我不知道:

新形态的内容?甚至诞生新的「动画」品类?

这种未知,才是最让人兴奋的部分。

昨晚,李想终于承认,他们走错了方向

11月26日,理想汽车交出了一份让人「五味杂陈」的成绩单。

看着财报上的数字,很多投资者可能会皱起眉头:营收同比下滑36.2%,曾经引以为傲的整车毛利率掉了5个百分点,净利润更是直接由盈转亏。更让人揪心的是,那个曾经充沛的自由现金流,这次也出现了流出。

如果只看这张表,你可能会觉得理想「病了」。

但有意思的是,在随后的财报电话会上,李想并没有像往常那样,去解释业绩指标的变化,也没有用话术来粉饰短期业绩的震动。相反,他直接抛出了一项关乎理想汽车未来命运的重大决定:终结过去三年的「职业经理人」管理实验,全面回归「创业公司」模式。

很多人把理想的这次调整,看作是「深蹲」。但问题的关键在于,蹲下去容易,接下来它还能不能起跳?

「纯电新兵」的阵痛

如果把时间拉长,2025年Q3无疑是理想汽车最艰难的一个季度。

先看最直观的营收和交付。曾经,理想靠着「增程」的差异化产品,精准击中了大家的里程焦虑,在2023年和2024年分别跑出了181%和78.7%的惊人增速,成为细分市场领头羊。

但到了今年Q3,这个神话暂停了。

2025年三季度理想主要财务指标 | 来源:理想汽车业绩报告

数据显示,三季度理想交付了9.3万辆。虽然勉强保住了此前给出的指引下限(9-9.5万辆),但这可是同比下降39%,环比下降16.1%的成绩。营收也随之缩水至274亿元,同比跌了三成多。

这背后发生了什么? 简单说,是新旧产品切换的「阵痛」。

在这个「金九银十」的关键档口,理想正处在从「只靠增程」向「增程+纯电」转变的磨合期。一方面,曾经大杀四方的L系列,面对竞争对手的围剿和纯电续航的提升,统治力在下降;另一方面,新推的纯电车型i8反响平平,而本该走量的i6虽然订单不错,却卡在了产能爬坡和供应链上,没能及时转化成实打实的交付量。

如果说销量下滑还在意料之中,那财报里最扎眼的,肯定是车辆毛利率跌到了15.5%。要知道,去年同期这个数字是20.9%。对于一家向来以「抠门」和「高效率」著称的企业,这种表现确实罕见。

是理想卖车不赚钱了吗? 其实,这里面藏着一个秘密。

理想CFO李铁在电话会上点破了玄机:Q3计提了约11亿元的MEGA召回预估成本。这源于10月底的一次大规模召回,涉及1.1万辆车,原因是冷却液问题可能引发电池风险。

这笔钱花得值不值?我认为非常值。MEGA作为理想冲击高端纯电的旗舰,虽然销量未达预期,但通过主动召回更换电池来保障用户权益,是在为品牌信誉「填坑」。

更有意思的是,如果把这笔一次性计提剔除,理想的车辆毛利率实际上依然维持在19.8%的高位。 在营收腰斩、纯电(通常毛利低)占比提升的情况下,还能守住接近20%的毛利线,说明理想那套强悍的成本控制体系仍然非常有韧性。

同时,让资本市场警惕的是,Q3经营性现金流净流出74亿元,自由现金流更是负的89亿元。净利润也从去年同期的赚28亿,变成了亏6.24亿。

虽然理想账上还躺着近千亿(989亿元)的现金储备,看起来「家底厚实」,但单季度几十亿的流出速度,依然让人有些担心。

组织大变局:创业模式回归

其实,昨晚最让我震撼的,不是亏损,而是李想关于「组织」的大段复盘和规划。他承认,过去三年学习苹果、微软的「职业经理人」管理模式,是一个错误。他们努力学习,「却变成了越来越差的自己。」 这句话从一位千亿市值公司掌门人嘴里说出来,分量极重。

为什么「职业经理人」模式失效了?

 李想的逻辑非常清晰:职业经理人模式(流程、汇报、避险)适用于行业格局已定、技术迭代缓慢的成熟期。而现在的汽车行业,AI技术日新月异,淘汰赛正如火如荼。

在这样一个「乱世」,层层汇报的流程就是效率的毒药。当一个决策需要经过三层PPT汇报才能落地时,市场机会早就没了。李想敏锐地发现,英伟达和特斯拉——这两家全球最强的科技公司,依然保持着「创业公司」的管理模式。

在产品背后,理想更看重的是组织 | 图片来源:理想汽车

从2025年Q4开始,理想将全面回归创业模式。理想表示,这不仅仅是口号,而是管理颗粒度的剧变:从「汇报」到「对话」: 减少PPT,增加面对面的深度碰撞。从「资源占有」到「效率提升」: 去年花10块钱做的事,今年必须花8块钱,省下来的2块钱去投未来。从「避责」到「解决关键问题」: 职业经理人倾向于制造信息不对称来保护自己,而创业者必须直面血淋淋的问题。

在我看来,这其实是李想的一次「否定之否定」。他试图亲手剥离掉大公司滋生的「赘肉」,让这个拥有数万名员工的庞然大物,重新找回2019年那种「向死而生」的战斗力。这注定是一场极其痛苦的「手术」,但对于当下的理想汽车来说,想要在AI时代的牌桌上活下去,这或许是正确的解药。

AI故事:是资本春药,还是新引擎?

在财报电话会上,李想几乎用了一半的时间在讲「AI」、「具身智能」和「端到端」。

在产品层面,李想表示,未来十年,理想不能只是参数内卷,也不能功能堆砌,而是要做「具身智能机器人」。

李想认为,目前的电动车竞争已经陷入了「红海」:续航多20公里、屏幕大2寸、价格便宜5000块……这种同质化竞争没有尽头。他试图跳出这个维度,汽车不再是被动等待指令的机器,而是具备感知、思考、执行能力的「主动智能体」。

 为了实现这个愿景,理想亮出了藏在桌下的底牌:感知层面, 抛弃现有的BEV(鸟瞰图)技术,转向3D ViT(视觉Transformer);算力方面,理想自研M100芯片。CTO谢炎透露,这款专为具身智能设计的芯片,配合自研OS,性价比是目前高端芯片的3倍。预计2026年上车。

理想希望通过软硬件全栈自研,实现真正的端到端智能。 这也是特斯拉正在走的路径,理想正在从「也是特斯拉的学徒」变成「最像特斯拉的对手」。

智能电动车已经满足不了理想的野心,接下来的目标是具身智能 | 图片来源:理想汽车

更有意思的是,李想的野心似乎不止于车。他在社交平台上透露将发布「理想AI眼镜」,并称其为「理想最好的人工智能附件」,甚至连AI音箱也在考虑范围内。这些都表明,他希望理想的AI能力,能渗透到用户生活的每一个角落,而不仅仅局限于驾驶舱。

如果单从财务数据看,理想Q3的业绩报告是一份「不及格」的答卷:营收下滑、利润亏损、自由现金流流出……但从企业经营的底层逻辑看,却可以看到了一种难得的「清醒」。在大多数车企还在为「多卖几辆车」而疯狂打价格战、堆配置的时候,李想选择了在财务最困难的时候,做最难的事情:重塑组织、自研芯片、押注具身智能。

李想在赌,赌AI时代汽车的终局不是「移动的沙发」,而是「移动的机器人」;他在赌,只有回归创业公司的敏捷,才能在巨头环伺的下半场活下来。这场豪赌的结局尚未可知,但至少,他没有选择在温水中慢慢沉没。

罗永浩:周一有大事官宣;《阿凡达》导演卡梅隆:生成式 AI「太可怕了」;《疯狂动物城2》刷新中国影史纪录|极客早知道

华与华服务西贝 10 年收了六千多万元,罗永浩:周一有大事官宣

11 月 30 日,据报道,在与西贝的舆论战告一段落后,罗永浩与华创始人华杉之间的隔空「交锋」再次引发关注。昨日晚间,罗永浩在直播时透露,这周「因为香港出了火灾,无论是官宣还是跟人吵架都不合适」。

同时,他还预告下周一有个大的事件官宣,「是正事」,不想被这种吵架扯皮的事情带跑偏了,「等这个事情结束后,看哪天心情好就公布(录音)了」。

对于网友翘首以盼的录音内容,罗永浩也直言没什么特殊的,「你们以为有什么猛料,没有」。

「他当时骂人,我警告他,他第二天早上『滑跪』,然而跑到那儿一通道歉认错,说自己丢了多少生意,其实也是为了给贾老板站台,收人家那么多钱,要表现自己讲义气,确实不是冲着我们来的,非常抱歉。」罗永浩说道。

早先,西贝品牌顾问、华与华创始人华杉发文称「西贝是中国餐饮业的天花板,无论对顾客还是对员工,都是诚心诚意做到极致。被诱入黑白颠倒的网络罗刹国,被人算计。西贝坚持自己的华夏子弟精神,不苟且偷生,凭仁义立世」。

对此,11 月 26 日凌晨,罗永浩转发并回应:「谁诱的?谁算计了?你想干什么?你要是说不清楚,我就公布录音了。」(来源:cnBeta)

马斯克起诉苹果、OpenAI 新动作:全球摇人把韩国公司拉入战团

11 月 29 日,科技媒体 9to5Mac 发布博文,报道称伊隆·马斯克旗下的 xAI 公司起诉苹果与 OpenAI 垄断一案迎来最新进展,xAI 正通过国际司法协助程序,向一家韩国实体寻求关键证据。

法院已正式批准 xAI 依据《海牙取证公约》提出的申请,并将签署请求书转交至韩国法院行政处。尽管文件未直接披露该实体的具体名称,但这一跨国取证行动表明,马斯克正试图挖掘更深层的供应链或商业合作细节,以支持其反垄断指控。

针对这家「神秘韩国实体」的真实身份,业内目前主要存在两种推测:

  • 目标可能是三星(Samsung)或 SK 海力士(SK Hynix),这两家巨头为 OpenAI 提供了关键的 AI 基础设施硬件支持;

  • 另一种更有可能的推测指向韩国科技巨头 Kakao,Kakao 近期与 OpenAI 达成了深度合作,将 ChatGPT 直接集成至覆盖韩国 90% 人口的超级应用 KakaoTalk 中。

无论目标是谁,这家韩国公司都即将被卷入这场发生在美国的法律攻防战。

本案源于今年 8 月,马斯克因其 AI 产品 Grok 在更新后未能进入 App Store 排行榜榜首而起诉苹果。(来源:IT之家)

 

黄仁勋:英伟达 GPU 全球唯一支持所有 AI 模型,通用性极高

11 月 30 日,英伟达 CEO 黄仁勋在接受采访时回应了当前 AI 芯片市场竞争、技术趋势与供应链挑战等一系列热点问题。黄仁勋强调,英伟达在 AI 芯片领域的核心竞争力在于其 GPU 及平台的高度通用性。他指出,英伟达 GPU 是「目前唯一能够运行全球所有 AI 模型的系统」,并具备跨云端平台的广泛适配能力,「无论客户需求如何,我们都能提供支持」。

随着 AI 硬件需求激增,内存供应已成为行业瓶颈。黄仁勋预计,当前 DRAM 与 NAND 闪存芯片的紧缺局面将持续至明年,价格大幅上涨也推高了 AI 基础设施的整体建设成本。

他进一步坦言,目前从先进晶圆制造、CoWoS 先进封装,到线材与电源供应等环节,全供应链均面临压力,「几乎没有一种物料是充裕的」。尽管如此,黄仁勋仍对英伟达的供应链整合能力表示信心,称其覆盖全球的体系「非常强大,也是全世界最大」,公司将全力保障客户在扩产与 AI 算力建设方面的需求。

此外,黄仁勋指出,当前 AI 训练与推理需求正呈现指数级增长,行业已进入良性循环。随着更多基础模型制造商与 AI 初创企业涌现,AI 技术的影响力正加速扩展至更多产业与国家,推动整个生态系统持续扩大。(来源:cnBeta)

《阿凡达》导演詹姆斯・卡梅隆:生成式 AI「太可怕了」

12 月 1 日,詹姆斯・卡梅隆的电影常常处于视觉特效技术的最前沿,尤其是《阿凡达》系列。然而,这并不意味着卡梅隆对生成式人工智能(AI)持欢迎态度。

s在 CBS《周日晨间》节目中,为配合即将上映的《阿凡达:火与烬》,卡梅隆在接受采访时承认,动作捕捉(即通过记录演员的表演作为数字艺术家创作的基础模板)乍听之下或许与生成式 AI 有些相似,但实际上「二者恰恰相反」。

卡梅隆表示:「多年来,总有人觉得『哦,他们正在用电脑做些奇怪的事,是在取代演员』。但事实上,只要你深入探究、真正了解我们在做什么,就会发现这其实是对演员与导演共同创作瞬间的一种礼赞。」

CBS 的报道片段展示了《阿凡达》剧组演员在一个容量达 25 万加仑的水箱中进行水下场景拍摄的真实画面。

卡梅隆进一步指出:「再看看另一个极端,就是生成式 AI,它仅凭一段文字提示词,就能凭空创造出一个角色、一名演员,甚至一整段表演。不,那太可怕了…… 这绝不是我们正在做的事。」(来源:IT之家)

 

单日观影人次超《哪吒 2》,《疯狂动物城 2》刷新中国影史动画电影纪录

11 月 30 日,据猫眼专业版数据,电影《疯狂动物城 2》当日观影人次突破 1732.4 万。该数据超过《哪吒之魔童闹海》,刷新中国影史动画电影单日观影人次纪录,位列中国影史单日观影人次亚军,仅次于《唐人街探案 3》,后者在 2021 年 2 月 12 日(大年初一)创下了中国影史单日观影人次纪录,当日观影人次达 2039.5 万。

上映 4 天,《疯狂动物城 2》累计票房达到 13.67 亿,此前灯塔专业版预测其总票房超 38.22 亿。

此前,《疯狂动物城 2》已经刷新中国影史多项纪录:

-预售票房突破 3 亿,刷新了中国影史进口动画电影预售纪录。

-上映首日票房突破 2.13 亿,成中国影史进口动画电影单日票房冠军。

-超过《复仇者联盟 4:终局之战》,成为中国影史进口片单日票房冠军。(来源:cnBeta)

 

上海交大设立全球首个具身智能本科专业:联合华为培养,李飞飞高徒带队

11 月 30 日,上海交通大学近日发布公告,计划自 2025 年起增设「具身智能」本科专业,成为全球首个将该方向独立设置为本科专业的高校。新专业将隶属人工智能学院计算机类,学制四年,授予工学学位,首年计划招生 30 人,并将与华为、国家人形机器人创新中心联合培养。

专业课程将融合 AI、机械动力、计算机等多学科内容,围绕「感知—决策—控制—本体设计」培养复合型人才,以填补行业快速增长下的人才缺口。行业报告显示,中国具身智能市场今年规模将达 52.95 亿元,全球市场预计十年后增长至 1242 亿美元,需求迅速扩大。

该专业由卢策吾教授领衔,他曾在斯坦福深造,是李飞飞、Guibas 的学生,同时也是具身智能创业公司穹彻智能联合创始人。交大在具身智能方向已形成科研与产业并进的基础,包括多家企业孵化与技术转化成果。

除交大外,东北大学、南航、科大、北航、浙大等多所高校也在推进具身智能专业布局,显示这一新兴方向正在成为国内高校的下一轮竞争焦点。(来源:量子位)

瘫痪男子借助 Neuralink 脑机接口玩《战地 6》,可用意念瞄准

11 月 30 日,一名瘫痪男子表示,他现在可以借助 Neuralink 脑机接口植入设备玩《战地 6》(Battlefield 6)等第一人称射击游戏。

「我现在可以用意念瞄准了,」罗布·格赖纳(Rob Greiner)在社交平台 X 上发布了一段自己的游戏视频,并配文写道。格赖纳因肩部以下瘫痪,无法自主活动四肢。

通过结合使用专为四肢瘫痪患者设计的口控控制器 QuadStick 与 Neuralink 的脑机接口(BCI)植入设备,格赖纳如今能够在游戏世界中移动角色、自由环顾四周、用自己选择的武器瞄准敌人并开火。

「这还需要大量练习,真的是海量练习,因为我目前的瞄准精度只和我在笔记本电脑上控制光标一样准,」格赖纳写道,「但你不得不佩服 Neuralink。」

「如果只用 QuadStick,通常这是我唯一能控制的东西,」他在玩《战地 6》时一边移动准星一边说道,并补充道:「仅靠这个设备,你无法同时瞄准和行走。」「但有了 Neuralink,现在我只需用意念就能完成瞄准,」他说,同时仍用 QuadStick 控制角色移动。

他请观众将他的游戏设置想象成:用意念操控一个「虚拟鼠标」,而用嘴巴操作键盘。(来源:IT之家)

明年起,新加坡中学生在校不能使用智能手机和手表

11 月 30 日,据新加坡《联合早报》报道,新加坡教育部 11 月 30 日发文称,为鼓励学生培养良好的电子产品使用习惯,鼓励课下互动交流,明年 1 月起,新加坡所有中学生在上课期间、课间休息以及在校补课时,都不能使用智能手机和手表。

按新规,学生在校时须把智能手机和手表放入储物柜或书包等指定存放空间。若有必要,学校可允许学生使用智能手机。此外,为了鼓励学生尽量早睡,新加坡教育部也将从明年 1 月起,调整中学生个人学习电子设备中的管理应用程序的设置,自动关闭时间将从晚上 11 时提前至 10 时 30 分。(来源:观察者网)

OpenAI 或成史上烧钱最快的公司;特斯拉在印度两月,仅卖出100多辆车;《疯狂动物城2》刷新进口电影单日票房纪录|极客早知道

贾跃亭称生命中最重要的事是还债回国

11 月 29 日,贾跃亭表示,自己生命中最重要的事情就是还债回国。「还债回国是我生命中最重要的两件事之一。」日前,贾跃亭通过其个人社交平台宣布成立第二个债权人信托,旨在「加速偿还国内担保债务尽责到底早日回国」。

对此,一位不愿透露姓名的资本市场资深人士认为,贾跃亭此举更多的是博眼球、追流量。「到现在,也没有看到他在还(国内债务)。」

面对外界质疑和评价,贾跃亭称,不论外界怎么评价,其生命中只有两件事:「一个是打造 EAI 生态,给社会带来变革性的驱动作用,另一个是还清国内债务,早日回到祖国。」

据悉,法拉第未来(Faraday Future)管理层已批准了 FF 和 FX 品牌的五年商业计划,并已将其提交给董事会审核。按照公司的计划,未来五年累计产量目标为 40 万至 50 万辆。(来源:cnBeta)

OpenAI 可能成为史上「烧钱最快」的科技公司

11 月 29 日,据新智元报道,根据多份基于微软财报的数据揭示,OpenAI 的推理成本正在以远超收入的速度膨胀,可能成为史上「烧钱最快」的科技公司。

来自 2024 Q1 至 2025 Q3 的数据表明,OpenAI 的推理支出(即运行模型生成回答的成本)呈爆炸式增长:2025 年 Q3 支出飙升至 36.5 亿美元,而同期隐含收入仅 20.6 亿美元。这意味着 每赚 1 美元,OpenAI 要花 1.8 美元用于推理;2025 年 Q1 的这一比值甚至一度突破 2.0,陷入「越卖越亏」的循环。

年度层面,问题更为突出:2025 年前 9 个月的推理支出达 86.7 亿美元,是 2024 全年的 2.3 倍;同期收入仅增长 75%。2025 年前 9 月亏损已达 43.4 亿美元,远超上一年。

更令人担忧的是,媒体长期高估了 OpenAI 的营收。2024 年,微软财报反推收入为 24.7 亿美元,而媒体普遍报道为 37~40 亿美元;2025 年差距进一步拉大,仅上半年误差就达到 20 亿美元。这意味着外界对 OpenAI 的成长速度和商业化能力可能存在系统性高估。(来源:新智元)

 

研究揭示 OpenAI Sora2 监管漏洞:13 岁账号即可轻易生成「校园枪击」视频

11 月 29 日,据外媒 Futurism 报道,消费者监督组织 Ekō发布了一份名为《OpenAI Sora2:危害的新边界》的报告,展示研究人员使用以 13 岁和 14 岁青少年身份注册的账号生成的画面,画面包括青少年吸食违禁品和在公共区域或学校走廊持枪。

Ekō警告称,而 Sora2 生成暴力与令人不安内容的难度极低,这种内容很容易病毒式传播,从而将会进一步加剧风险。

报告明确指出,这些内容全部违反了 OpenAI 的使用政策和 Sora 的分发准则。

即便账号不主动生成内容,Sora2 的「For You」和「Latest」推荐页面也会推送令人震惊的视频,包括刻板化描绘犹太人或黑人、枪战场面以及性暴力等画面。(来源:IT之家)

 

iPhone 17 助力苹果手机 10 月份额创历史新纪录,中国市场贡献最大

11 月 29 日,在 iPhone 17 系列的助力下,苹果手机 10 月份额创下了历史新纪录。调研机构 CounterPoint Research 报告显示,得益于 iPhone 17 系列(尤其是标准版)在中国、美国等市场的强劲表现,苹果 2025 年 10 月 iPhone 销量同比增长 12%,终端销量份额飙升至 24.2%,创下历史新纪录。

报告中指出,中国成为苹果 10 月增长最快的市场。数据显示,在首发后的六周时间里,iPhone 系列在中国市场的销量同比激增 47%,远超美国(+11%)和日本(+8%)。

Counterpoint 高级分析师 Ivan Lam 指出,除了产品力本身,特殊的市场节点也助推了这一增长:新冠时期的换机潮达到顶峰,加上「双 11」大促提前开启,以及中秋国庆假期的销售热度延续到了 10 月。当然,iPhone Air 的销售就暗淡了很多,跟 iPhone 17 系列相比,完全不值得一提。(来源:cnBeta)

 

特斯拉登陆印度市场两个多月,仅卖出 100 多辆车

11 月 29 日,特斯拉想要拿下全球最大的汽车市场之一——印度,但现阶段的表现并不理想。

据外媒 Insideevs 报道,印度是全球第四大汽车市场,特斯拉今年 7 月终于在印度开出首家展厅。不过根据经销商提供的数据,特斯拉在当地运营两个多月,仅卖出 100 多辆车。

截至 9 月中旬,印度市场的 Model Y(目前在当地唯一正式销售的特斯拉车型)刚刚收到 600 多份订单,但真正转化为交付的只有极少部分。反观更昂贵的宝马、比亚迪和奔驰,由于享受税收减免,销量表现反而更强。

特斯拉最近又在北部城市古尔冈启用了更大的综合据点,集展厅、充电枢纽与售后服务于一体,品牌曝光度因此有所提升。但要提高销量,特斯拉仍有大量工作要做。

首先,印度市场的 Model Y 售价高达 70000 美元(现汇率约合 49.6 万元人民币),已进入豪华车区间。其次,全国范围内只有两座 Supercharger 直流快充站,分别位于孟买和新德里,后续仍计划陆续增加站点。(来源:IT之家)

北京 AI 产业规模今年将超 4500 亿元

11 月 29 日,2025 中国人工智能大会暨全国人工智能学院院长(系主任)年会开幕。开幕式上,北京市科委、中关村管委会发布《北京人工智能产业白皮书(2025)》,从全球和国家战略角度总结了人工智能发展现状,系统梳理了北京人工智能的创新资源和产业总体情况,并研判了未来发展趋势,推动北京市加快建设具有全球影响力的人工智能创新策源地和产业高地。其中提出,初步估算今年全年本市人工智能产业规模有望超过 4500 亿元。

数据显示,2025 年上半年,北京人工智能核心产业规模 2152.2 亿元,同比增长 25.3%。初步估算 2025 年全年,产业规模有望超过 4500 亿元。AI 企业超 2500 家,已备案大模型 183 款,持续保持全国第一。产业链日趋完整,形成了具有全球竞争力的产业生态。同时商业化路径也逐渐清晰,百度、抖音等公司的营收和产品活跃用户数均创新高。(来源:新浪科技)

 

打击虚拟货币交易炒作工作协调机制会议召开

11 月 28 日,中国人民银行召开打击虚拟货币交易炒作工作协调机制会议。会议强调,虚拟货币不具有与法定货币等同的法律地位,不具有法偿性,不应且不能作为货币在市场上流通使用,虚拟货币相关业务活动属于非法金融活动。

稳定币是虚拟货币的一种形式,目前无法有效满足客户身份识别、反洗钱等方面的要求,存在被用于洗钱、集资诈骗、违规跨境转移资金等非法活动的风险。(来源:中国人民银行网站)

 

00 后养宠人数约 2000 万,宠物经济岗位大涨 30%

11 月 29 日,智联招聘集团董事长郭盛在「第三届全国人力资源服务业发展大会」的论坛上分享了一组数据:2025 年前三季度招聘增速最高的十个岗位中,与宠物经济相关的职位排在第二,增速为 30.4%,仅次于机器学习工程师。(来自:华尔街见闻 APP)

 

我国已成为首个国内有效发明专利拥有量超过 500 万件的国家

11 月 29 日,国家知识产权局举行 11 月例行新闻发布会,介绍了加强知识产权保护和运用有关工作进展和举措。

从官方介绍获悉,目前,我国已经成为世界上首个国内有效发明专利拥有量超过 500 万件的国家,PCT 国际专利申请量连续 6 年位居全球第一。专利密集型产业增加值达到 16.87 万亿元,占 GDP 的比重提升到 13.04%;全球前 5000 个品牌中我国品牌价值达 1.81 万亿美元,位居全球第二;地理标志产品直接产值接近 9700 亿元,保持良好增长势头。

世界知识产权组织发布的《2025 年全球创新指数报告》中,我国排名提升至第 10 位,首次跻身全球前十,拥有的全球百强创新集群数量达到 24 个,连续三年位居各国之首,其中「深圳—香港—广州」集群首次登顶全球首位。(来源:IT之家)

日本公司推出 AI 自动洗澡机,约 272 万元人民币

11 月 29 日消息,以纳米气泡(Fine Bubble)技术闻名的日本 Science 株式会社曾在今年 4 月的大阪世博会上展示过一台「未来人体洗澡机」原型机,采用类似战斗机驾驶舱的流线型设计,配备后开式透明舱盖,吸引大量观众排队体验。

这款洗澡机同样应用了 Science 的纳米气泡技术。用户只需平躺于 2.3 米长的胶囊舱内,机器将自动向舱内注入热水并释放数百万微气泡进行全身清洁,并在 15 分钟内完成清洗与烘干流程。

沐浴过程中,位于用户背部的传感器可实时监测健康状态,通过 AI 算法调节水温并识别情绪状态,同时在透明舱盖投射影像,并播放音乐。

Science 发言人前仓幸子于 11 月 28 日表示,这款机器已在日本开售,零售价达 6000 万日元(现汇率约合 272 万元人民币)。前仓表示,这款洗澡机的稀缺性正是其魅力所在,公司计划仅生产 50 台左右。

Science 董事长青山康明表示:「目前国内已售出 8 台。我们正在考虑海外销售,预计到年底将售出约 15 台。」(来源:IT之家)

疯狂动物城 2 票房破 13 亿,单日票房超 5.58 亿,刷新中国影史进口电影单日票房纪录

11 月 29 日,截止至当日下午,据猫眼专业版数据,电影《疯狂动物城 2》上映 4 天,总票房破 13 亿。

同日,迪士尼动画电影《疯狂动物城 2》单日票房超 5.58 亿,刷新中国影史进口电影单日票房纪录。(来源:华尔街见闻)

雷军:人形机器人将大面积进入小米工厂;淘宝闪购将全面取消超时扣款;苹果新专利:耳机读取脑电波

雷军:未来 5 年,人形机器人将大面积进入小米工厂「打工」

11 月 28 日消息,《北京日报》对小米创办人、董事长兼 CEO 雷军进行了采访。公布的采访内容中提到,下一个五年,人工智能将深刻影响传统产业。「所有产业都值得用 AI 再做一遍。」
雷军以小米汽车工厂举例:大压铸件用人眼很难完成检测,但通过 X 光机和 AI 视觉大模型判定,可在 2 秒内完成检测,效率是人工的 10 倍,精度是人工的 5 倍以上。他说,人工智能与传统产业深度融合,将会开启一个新的万亿级大市场,一家公司不可能掌握所有环节,而是要与最强的伙伴携手,取长补短,带动整个产业链共同升级。
在采访中,雷军直言:「北京的制造业不能像其他地方一样走拼人力的老路,而是应该坚定走智能制造的新路,抢占『智』高点,带动产业迭代升级。」(来源:IT 之家)

消息称百度启动新一轮裁员,部分团队四成员工受影响

11 月 28 日消息,据路透社援引 6 名知情人士消息称,百度本周启动了新一轮人员缩减,裁员规模覆盖多个业务部门。
随着人工智能竞争愈发激烈、广告收入持续下滑,百度正面临近年最明显的经营压力。本轮裁员将持续到年底,多名知情人士称,公司内部普遍认为此次调整规模较大,具体裁员人数因业务部门和绩效评级而异,个别团队的裁减比例可能高达 40%。
报道提到,百度长期押注人工智能,但这些投入尚未带动核心广告业务重回增长,市场份额不断被小红书、字节跳动的抖音等平台吸走。(来源:IT 之家)

淘宝闪购将全面取消超时扣款,年底前覆盖全国

11 月 28 日下午消息,记者获悉,淘宝闪购取消超时扣款正扩大覆盖到 60 城,年底前将覆盖全国直营城市。
今年以来,淘宝闪购持续推广服务分机制,以正向激励和技术牵引骑士服务,通过好的履约加分、超时送达扣分的方式,让骑士收入不再因超时受影响,多劳多得,优劳优得,实现骑士安全、履约效率与用户体验的协同提升。
具体规则上,面向众包骑士,淘宝闪购积分制方式更科学、更温和,形成更有效的弹性约束。在 70 分的基础设计上,顺利送达、没有违规就有加分,超过 75 分有额外奖励;让消费者体验受损、影响履约的行为会扣分,对超时来说,1 次最多扣 2 分。(来源:IT 之家)

美团 2022 年以来首次亏损:外卖竞争下核心本地商业分部经营亏损 141 亿元

11 月 28 日消息,美团发布截至 2025 年 9 月 30 日的第三季度业绩公告:
收入由 2024 年同期的人民币 936 亿元增长 2.0% 至人民币 955 亿元。
由于外卖行业竞争持续加剧,2025 年第三季度,美团核心本地商业分部的经营溢利同比大幅下降,转为经营亏损人民币 141 亿元。同时,由于海外扩张,新业务分部的经营亏损同比扩大至人民币 13 亿元。
美团于第三季度的经调整 EBITDA 及经调整溢利净额分别同比下降至负人民币 148 亿元及负人民币 160 亿元。IT 之家注意到,这是美团 2022 年以来首次亏损。
截至 2025 年 9 月 30 日,美团持有的现金及现金等价物和短期理财投资分别为人民币 992 亿元和人民币 421 亿元。(来源:IT 之家)

极壳 Hypershell 完成 7000 万美元 Pre-B 及 B 轮融资,引领消费级外骨骼新时代

消费级外骨骼领域的全球引领者极壳科技(Hypershell)近日正式宣布,已顺利完成 7000 万美元 Pre B 及 B 轮融资。此次融资后,极壳科技的投后估值近 4 亿美元,标志着其作为行业领导者的地位得到进一步巩固。
作为赛道开拓者,极壳科技是全球首家实现消费级外骨骼规模化量产与商业化落地的团队。尽管「消费级外骨骼」概念曾经在行业内被普遍认为是「不切实际的科幻产品」,面临着巨大的质疑,但极壳科技凭借深厚的技术积累和前瞻性的行业视野,始终坚定不移地推进产品研发。
本次融资的完成,彰显了资本市场对极壳科技技术实力、商业化能力和未来前景的高度认可。随着消费级外骨骼行业从概念阶段迈向产业化落地,行业正迎来加速爆发的关键节点,极壳科技凭借领先的技术与产品能力,已处于推动这一新兴品类走向成熟的核心位置。(来源:极客公园)

AirPods 将变「读心」设备:苹果 AI 新研究暗示未来耳机可读取脑电波

11 月 29 日消息,科技媒体 9to5Mac 昨日(11 月 28 日)发布博文,报道称苹果研究团队在预印本平台 ArXiv 上,发布代号为 PARS(Pairwise Relative Shift,成对相对位移)的突破性 AI 技术,旨在通过自监督学习分析脑电图(EEG)信号。
苹果开发的 PARS 模型采用「自监督学习」机制,直接利用原始且未标记的数据训练。简单来说,该模型通过「自学」预测不同脑电波片段在时间上的距离,从而理解大脑活动的深层结构与长程依赖关系。(来源:IT 之家)

长安汽车官宣将投资设立机器人公司

11 月 28 日消息,长安汽车今晚发布第九届董事会第四十八次会议决议公告,审议通过了《关于投资设立机器人公司的议案》。
长安汽车公告称,长安机器人公司的设立符合国家「十五五」规划和长安汽车战略转型发展方向,其定位为公司机器人产业战略承载体,以智能人形机器人技术为牵引,发展多机器人产业板块,旨在打造标志性「具身智能」创新产品和解决方案,成为世界一流的机器人产品与服务提供者,实现汽车与机器人产业的双向赋能,推动汽车产业升级。(来源:IT 之家)

钉钉上线首个 AI 医生助理,助力妇产科医生临床诊断

11 月 28 日晚间消息,钉钉联合壹生检康发布「豆蔻医生超级助理」。这个是钉钉上第一个针对医生的专业 AI 应用,能实现 1 分钟整合全球超过 4000 万医疗专业文献,并进行全链路溯源,以权威医疗研究证据,助力妇产科医生快速高效临床诊断。
据介绍,医生只需将病例提交给豆蔻医生助理,AI 能够模拟医生循证决策思维,理解问题,解析数据,然后从超 4000 万+全球权威最新文献指南中进行智能检索,获取「指南推荐+真实世界数据+相似病例」的完整证据链,并在 1 分钟生成诊疗建议。钉钉拥有国内众多的医院和医疗机构用户,医院端可在钉钉上直接调用这一 AI 助理。(来源:新浪财经)

埃斯顿酷卓发布柔性全场景具身智能机器人「磐石 C05-L」

11 月 28 日消息,埃斯顿酷卓科技有限公司(以下简称「埃斯顿酷卓」)今日在世界智能制造大会上推出其全新人形机器人「磐石 C05-L」。
该产品以「柔性全场景」为核心定位,面向工业、商业及办公等多类场景,展示了埃斯顿酷卓在具身智能机器人领域的技术积累。
据发布会介绍,「磐石 C05-L」是一款面向工业场景的高性能轮式具身智能机器人。其身高支持 138 厘米至 168 厘米之间动态调节,兼顾轻量化与高强度作业需求。机器人单臂额定负载达到 5 公斤,适用于轻型物料搬运、精密装配辅助等任务。(来源:IT 之家)

我国首次:顺丰成功完成飞机运输三元锂电池,采用 AI 安全防护装备

11 月 28 日消息,据顺丰集团消息,由顺丰联合重庆交通大学、中国民航科学技术研究院等单位共同发起的,动力锂电池航空物流供应链研讨会暨国家重点研发计划「动力锂电池运输安全防护技术与装备」航空运输应用示范启动会近日在湖北鄂州举办。
随着启动指令的发出,一架搭载新型安全防护装备的动力锂电池货运航班从鄂州花湖机场顺利起飞,飞向深圳宝安机场。
顺丰集团表示,此次飞行实现了我国首次单包装多组三元动力锂电池的连续性、商业化航空运输,也是 AI 预警与主动防控技术在顺丰航空货运飞机中的首次应用,标志着我国动力电池航空运输安全保障与供应链优化迈入高质量发展新阶段。(来源:IT 之家)

捐赠自研OS内核背后:Rust 先行者 vivo 的「担当」

作者|白石

编辑|靖宇

人工智能时代,开源成为一个重要发展方向。

Meta 的 Llama,开启了开源模型对抗闭源模型的序幕,让 OpenAI、Anthropic 等闭源模型公司没法吃「垄断」的饭,必须不停地拿出更新更好的 AI 模型。

中国的 Qwen 和 DeepSeek 接过接力棒,让开源模型遍地开花,它们的 AI 模型在开源社区的下载量,都达到千万量级。

对于用户和开发者,开源模型和开源工具能让他们不用为闭源模型昂贵的 Token 成本担心,快速开发和迭代自己的项目。

对于开源方,开源生态中的开发者们能够帮助它们把项目变得更完善,并不断推进创新,将基于这个项目的衍生生态发展壮大。

随着 AI 开始逐步进入到现实世界,全新的 AI 原生硬件设备对连接底层硬件与顶层应用的操作系统提出了新的需求。

最近,一家国内公司更是将自研的、面向 AI 时代的操作系统内核开放给世界。

这家迈出关键一步的企业是 vivo。这次开源的背后,是一场长达八年的技术长跑。

2018 年,随着 AI 浪潮的涌动,vivo 自研操作系统——蓝河操作系统(BlueOS)正式立项;2023 年,vivo 自研蓝河操作系统正式发布,该系统的框架基于 Rust 语言编写并率先搭载于智能手表产品;2024 年,它更进一步,成为从内核到系统框架全栈使用 Rust 语言编写的操作系统。

而在这套全栈自研的操作系统中,最核心、最基础的部分是它的内核,也是决定整个系统安全、性能和稳定性的关键。

蓝河操作系统内核于 2024 年正式发布,在 2025 年 7 月面向行业开源;并于 2025 年 11 月捐赠给开放原子开源基金会,正式以「BlueKernel」命名成为开源孵化项目,以全新的开源运营和治理模式面向行业。

可以看出,一直以来,vivo 在 Rust 语言技术研究、产品落地和开源实践,都走在了行业前沿,可以说是 Rust 的先行者。那么,vivo 开源的操作系统内核有哪些价值?系统内核的开源,又会给行业带来哪些助推?

 

01

为什么我们需要一个 Rust 内核?

 

一个操作系统能走多远,与其使用的语言有密切关系。

AI 眼镜、机器人等 AI 原生硬件设备与普通智能设备最大的不同,在于它内置的 AI 能力,这些能力通常由大模型和 AI Agent 驱动。要在端侧设备上运行 AI 模型和 AI Agent,对操作系统的安全性、轻量化程度和通用性都提出了都提出了更为严苛的考验。

蓝河操作系统是 vivo 面向 AGI 时代构建的自研操作系统,它从内核到系统框架全栈使用 Rust 语言编写,它在安全、AI 能力和运行流畅方面的优秀特性,能够很好地满足 AI 原生硬件设备对操作系统的要求。

安全上,蓝河操作系统全栈使用 Rust 语言,从源头保障内存安全。AI 能力上,蓝河操作系统的系统架构设计深度融合蓝心大模型,Agent 框架具备跨场景感知、自主决策等能力。运行流畅方面,蓝河操作系统构建了一系列高性能技术,能高效利用软硬件资源。

蓝河操作系统的这些核心特性,离不开一颗强大的「心脏」——内核。BlueKernel 是 vivo 以 Rust 语言自研的操作系统内核,具备安全、轻量和通用的核心特性。

在安全方面,以 C/C++ 语言为主的操作系统约 70% 的严重安全漏洞与内存安全问题有关。近年来,行业里与内存安全相关的事故案例层出不穷,比如工信部的网络安全威胁和漏洞信息共享平台(NVDB)在 2025 年 9 月就发布了苹果操作系统(包括 Mac OS 和 iOS)在内存安全方面的高危漏洞。

尤其是对于 AI 应用,尤其是端侧 AI,需要处理和分析海量的、极其敏感的个人数据,例如用户的对话录音、面部图像和健康指标,传统操作系统在内存安全上的缺陷,容易导致灾难性的隐私泄露。

相比 C/C++语言,Rust 语言在内存安全上有质的飞跃,它的核心思路,是在代码编译时就对常见的内存风险做严格检查,让许多容易埋下隐患的错误无法通过编译。一些在 C/C++语言中需要靠开发者自觉规避的错误,在 Rust 语言中,大多会在写代码时就被编译器直接拦下。

它的优越安全性能已经被主流操作系统项目实际验证。例如,Android 系统底层采用 Rust 后,相比 C/C++ 时代,内存安全漏洞首次降至总漏洞的 20% 以下。

在轻量化方面,AI 原生硬件设备通常受到严格的资源限制,包括有限的内存、闪存硬盘和电池容量,所以它们的操作系统必须是极致轻量化的,其内核和核心服务占用的系统资源要尽可能小,以便让 AI 模型和算法更高效地运行。

同时,AI 原生硬件设备的形态目前还比较多样,其内在也会使用不同芯片架构的 AI 芯片,这些都对操作系统的通用性提出了高要求。基于 Rust 语言编写的 BlueKernel,也在持续提升对 CPU 架构和驱动的兼容能力,对硬件资源的需求相比传统操作系统内核也显著降低,能够以更低的成本满足各类终端产品的需求。

本质上,Rust 是用一套语言规则打通了从底层系统到上层服务,为多硬件平台的长期迭代提供了更稳固的通用底座。

而有了更好的语言,才有了更好的操作系统内核。

 

02

BlueKernel 内核,AIOS 的基石

 

蓝河操作系统本身就是面向智能眼镜、机器人等 AI 原生硬件设备的智慧操作系统,所以其内核——BlueKernel,也针对 AI 硬件设备「高安全、低资源、多形态」的痛点进行了原生设计,具备安全、轻量、通用的三大特性,将语言的潜力转化为系统级的核心竞争力。

BlueKernel 技术架构图

作为适用于 AI 原生硬件设备的开源 Rust 内核,BlueKernel 的竞争力首先体现在安全与效率的统一。

在内存安全方面,BlueKernel 使用编译期所有权系统,让内存安全从以往的被动防御进化到现在的主动掌控,开发者不用再为内存安全问题花费更多开发资源,进而能加速 AI 原生硬件设备在消费者层面的普及,促进整个行业的繁荣。

同时,得益于对基础数据结构高性能低开销的设计,BlueKernel 对硬件资源需求低,最小内核内存占用仅 13KB,这为 AI 模型和算法等「资源消耗大户」腾出了宝贵的计算资源,也让那些极度轻量化的 AI 原生硬件设备,例如智能眼镜(通常只有几十克重)和智能手环,利用有限的算力提供足够强的 AI 能力。

在通用性与硬件兼容方面,BlueKernel 兼容 RISC-V、ARM 等多种芯片架构,也支持兼容 POSIX 接口的标准库。对于开发者来说,这意味着他们写的程序可以更容易地在各种类型的硬件设备平台上移植。

为保证系统扩展性,BlueKernel 通过硬件抽象等一系列方式,提升了对于 CPU 架构和驱动的兼容能力,支持 Rust 语言开发驱动,也支持兼容已有的 C 语言内核的外设驱动。因此,开发者和生态内的厂商既可以继续使用现有的 C 语言驱动,也可以用 Rust 语言为新硬件编写新驱动,这种分阶段的投入,降低了整个行业的进入门槛。

从内存安全保护、超低的资源消耗到对多芯片架构、多设备形态的灵活适配,BlueKernel 通过发挥 Rust 语言的优良特性,在系统内核层面解决了 AI 原生硬件设备对高安全性与低资源的诉求。这种兼顾效率与通用性的特性,使它成为 AI 时代操作系统的新基石。

vivo 作为 Rust 语言的先行者,也承担起责任,将 BlueKernel 开源,与行业共同构筑越来越繁荣的 AI 生态。

 

03

BlueKernel 的生态机遇与未来

 

在海外市场,开源的操作系统已经非常有影响力,例如 Linux 不仅是大部分服务器的底层操作系统,成为全球互联网的基石;引领移动互联网时代的 Android 操作系统,它的操作系统内核也基于 Linux 内核。

而在中国市场,随着近些年越来越多的企业、高校、研究机构和开发者持续的投入和创新,开源也呈现出了繁荣发展的态势。由此看来,vivo 将以 Rust 语言自研的操作系统内核 BlueKernel 向行业开源,并捐赠给开放原子开源基金会,既具有诚意,又意义深远。

vivo 开源的是操作系统内核,它是操作系统的「心脏」,这让底层的硬件厂商、专业的系统开发者、开源社区,都可以基于 BlueKernel 进行创新,而不仅仅是 vivo 一家。

vivo 在构建生态时,具有务实的态度。目前,微软和 Linux 仍然是操作系统的主流,它们留下了数量庞大的 C 语言驱动代码(近 2000 万行)。因此,BlueKernel 采取了灵活的「渐进式」迁移策略:它既支持开发者用先进的 Rust 语言开发原生驱动,也兼容已有的 C 语言驱动,极大地降低了硬件厂商的适配门槛和开发者的学习成本。

基于安全、通用、轻量化的特性,以及务实的生态策略,BlueKernel 为爆发初期的 AI 原生硬件设备市场提供了巨大的想象空间。

vivo 的贡献不止于开源操作系统内核,它正与开放原子开源基金会携手,通过举办「蓝河操作系统创新赛」等方式,系统性地推广 Rust 语言。目前,第三届「蓝河操作系统创新赛」正在进行中,设立 70 万元奖金池,以 C2Rust 项目级转译工具赛题聚焦攻关 Rust 生态行业难题。vivo 将持续把蓝河创新赛打造为行业最具含金量和影响力的 Rust 顶尖赛事。

从开源并捐献操作系统内核,到办「创新赛」,vivo 持续为产业做贡献,不断推动整个行业的繁荣和发展。它开源的操作系统内核 BlueKernel,为 AI 眼镜、机器人等 AI 原生硬件提供了一个安全、通用的强大「心脏」。

从代码补全到真实软件的生产级工具:Qoder 如何改写 AI 编程规则

作者|Cynthia

编辑| 郑玄

2025 年以来,各种 AI Coding 的宣发,已经从科技进步,快进到了科幻文学赛道。

C 端市场,一句话生成 Demo 的宣发内容仍在收割流量,将技术演进包装成科幻叙事;但没人关心小白为什么要做 coding,一句话生成的的 demo,在生产环境能跑起来吗?

更进一步追问:超过 95% 的 AI coding 用户,都是在构建真实软件的专业开发者。而他们所做的真实世界的软件研发,不仅没有那么多 0 到 1 的天马行空 demo,更有至少 80% 的价值藏在对老工程的迭代里。

这些项目不仅价值产出大,并且积累时间长、复杂度高,而传统的 AI Coding,似乎并不擅长:面向程序员和技术爱好者的问答网站 Stack Overflow 发布的 2025 年开发者调查显示,人们对人工智能的信任度已降至历史最低点。虽然有 84% 的开发者表示他们在开发过程中使用或计划使用人工智能工具,高于 2024 年的 76%。但也有至少 46% 的开发者并不信任人工智能的输出准确性,较去年的 31% 显著上升。并且,至少有 45% 的受访者表示,一度因为调试 AI 生成的代码而心态崩溃(InfoQ Culture and Methods Trends Report - 2025)。

原因很简单,生产级项目,对 AI 的要求远不止生成代码片段,而是需要理解项目全貌、遵循隐性规则、完成全链路闭环的生产级能力。

而这对 AI Coding 软件的要求,也聚焦到了上下文工程与 Agent 能力两大更具体的维度。

不久前,在飞天发布时刻上发布全面支持 JetBrains 插件、IDE、CLI 三种主流产品形态的 Qoder,正是这一产业转型的标志性产物。

一定程度上,作为国内首个定位为「Agentic Coding(智能体编程)平台」的 AI 开发工具,Qoder 标志着 AI 编程从「代码助手」向「可自主完成复杂任务的全栈 AI 工程师」的重大进化。

 

01

生产级代码需要怎样的上下文能力  

 

AI 编程在生产环境的首要障碍是上下文能力,这一问题在团队协作的复杂工程中被无限放大。

现有工具普遍采用的 20 万 token 上下文窗口,既无法覆盖跨模块的依赖关系(导致变量未定义等低级错误),更无法捕捉团队沉淀的隐性知识,如金融行业支付超时重试需要≤3 次、电商日志需包含流水号,电商系统库存扣减需要加分布式锁等未写入文档的工程常识,而这些正是避免线上事故的关键。

要解决这一问题,上下文工程必须突破覆盖广度(上下文足够长)、检索精度(搜得到)、意图匹配提示准)三大瓶颈。

这其中,上下文长度是第一个核心难关。为此, Qoder 推出了 10 万文件级上下文检索。

这是什么概念呢? 参考行业标准:个人工具类项目仅需 50-500 个文件,中型企业应用约 1000-5000 个文件,即便是 Linux 内核这样的大型开源项目,文件数也仅 5 万左右。10 万文件的覆盖能力,意味着 Qoder 可适配数百人团队维护的超复杂系统,从文件级读取升级为项目级/工程级理解。

但单纯扩大上下文长度,一方面模型本身的上下文窗口并不支持,另一方面,这会引发算力爆炸和精度下降。因此,借助 RAG 的形式对需要的内容做精准检索成为行业的通用范式。而这一过程中, 检索精度 的优化成为关键。

行业当前存在两大技术路径:以 Claude Code 为代表的 grep 派依赖关键词匹配,虽适配小代码库但语义召回率低;以早期 Cursor 为代表的智能检索派,借助语义理解检索上下文,但技术落地还较为初级。

Qoder 采用融合式检索引擎,搭建云端代码搜索引擎,关联代码结构、历史迭代记录与 Repo Wiki 文档,实现跨模块、跨项目的语义级精准定位——既避免了 grep 的机械匹配缺陷,又弥补了纯智能检索的细节缺失,确保 AI 仅获取与当前任务强相关的信息。

这种跨模块、跨项目的检索能力,使得 Qoder 可以跳出单文件的局限,全面理解并索引整个代码仓库的结构与历史。从而确保对复杂、多轮迭代的项目的适应性。

建立在精准检索的基础上,要想进一步提升大模型的输出质量,就需要在 意图匹配上下功夫。 Qoder 通过动态记忆+一键增强双机制解决这一问题:

其中,动态记忆模块可自动挖掘历史对话中的编码风格(如命名规范、注释习惯)与工程约定,例如识别开发者常用「ResultDTO」封装返回值后,后续生成代码将自动遵循该规范。

提示词增强功能则能将模糊需求结构化,将开发者从优化提示词的负担中解放出来。例如输入「优化登录接口」,系统会自动补全为「基于 Spring Security 架构,增加手机号验证码、密码错误锁定、token 有效期调整、关联数据表及单元测试」的完整任务描述,从源头降低理解偏差。

为适配团队协作场景,Qoder 还支持 Repo Wiki 的导出与共享——由核心成员梳理项目架构、隐性规则生成文档后,全团队可通过代码库共享,使 AI 的上下文认知与团队经验同步,彻底解决「新人 AI 不懂老项目规则」的行业痛点。

 

02

什么是 Agentic AI coding

 

上下文解决了学得懂的问题,下一步就是用 Agent 解决做得好的问题。

过去,很多 AI coding 工具,定义还停留在集成大模型,然后做代码⽣成或补全助⼿的角色上,只能完成简单的单一功能生成,且生成的内容往往与原有代码结构并不匹配,往往还需要大量的人工操作,更不用提完成需求-设计-开发-测试的全链路闭环。

以用户注册功能为例,基础的 Copilot 仅能生成基础表单代码,却无法关联数据库表结构、调用短信验证接口,更无法自动编写单元测试,而这些附加工作占实际开发工作量的 70% 以上。

也是因此,进入 2025 年,AI 编程从代码补全升级为任务执行逐渐成为共识,而 Agent 能力也成为了核心竞争力来源。

其显性代表是不久前更新的 Cursor,其 2.0 版本的 UI 界面就不再以文件为核心,而是围绕 Agent 进行重新设计,支持并行运行最多 8 个 Agent。但这仍未解决 agent 的执行黑盒问题:开发者无法追踪任务拆解过程,出错后难以定位根源。

针对这一 Agentic Coding 落地困境,Qoder 的突破在于开创性引入了 Quest 模式与 Spec 驱动的核心理念,实现 Agent 能力的可控可追溯。

Quest 模式的核心是借助任务委派和多任务并行执行,实现多 Agent 并行处理独立子任务(如接口开发与测试编写同步进行),且能自动处理依赖关系(如子任务 1 未完成时,子任务 2 无法启动)。进一步推展人+ AI 开发的时间和空间。

在此基础上,Qoder 通过 TO-DO 列表,进一步将任务结构化,确保智能体执行任务的准确性。

例如,将生成订单接口任务拆解为查询商品库存→创建订单记录→扣减库存→生成物流单四步,每步显示状态、依赖资源、耗时:若扣减库存失败,系统会标注可能的出错原因以及解决方案,开发者也能直接在 TO-DO 列表中修改参数,系统实时调整执行逻辑。

Spec 驱动开发则从源头解决开发者与 AI 之间的需求理解偏差。Specification(需求规范)作为开发者最熟悉的协作载体,被 Qoder 确立为任务执行的前置条件:开发者明确需求后,AI 会基于 Spec 生成开发计划,自主完成代码编写、测试脚本生成、结果校验等全流程,最终输出包含代码文件、测试报告、待确认问题的执行报告。这一模式使开发者工作重心从实时盯屏修正代码转向需求定义与结果审核,甚至支持离线提交任务后等待推送反馈,彻底重构人与 AI 的协作关系。

 

03

破局 AI Coding 的不可能三角

 

长期以来,各种 AI Coding 工具,都存在能力-场景-成本的不可能三角。

模型能力强的工具,往往成本失控;而成本管理优秀的工具,则往往场景覆盖与技术能力有一定缺陷。

以海外两大 AI Coding 工具为例:Claude Code 的 Max 版本定价 200 美元/月,Cursor Pro 20 美元/月,对于不少想要尝鲜的用户来说,是笔不小的成本。而且,多数 AI Coding 工具在会员制基础上,还会额外采用按 token 计费的模式,这就导致复杂任务易耗尽额度。

与此同时,现有工具普遍存在场景局限:Cursor 聚焦 IDE,Claude Code 侧重文档,导致开发者需要同时为多个昂贵的开发平台付费,并且不断切换工作流。

这就导致,如何对这些产品进行选型,以及高性价比的使用,就成为了最大的行业痛点。

针对以上痛点,Qoder 选择对齐标准+全场景高性价比方案的两步走解决行业困境。

首先是标准层,Qoder 针对常见的 AI Coding 需求发布了覆盖多场景、多语言、多模态的 Qoder 评测集;在此基础上还推出了自动化评测框架 Qoder Bench,能够度自动化 & 并行化对 AI Coding 软件进行实时评测、线上 A/B Test,让用户在 能力-场景-成本的不可能三角中,选出最适合的方案。

全场景高性价比方案,则可以从场景以及价格两方面来理解。

Qoder 在已有 IDE、CLI 基础上,全新发布 JetBrains 插件,全面覆盖了三种编程主流产品形态的全链路场景:IDE 面向百万行代码级复杂工程,整合全量核心能力;JetBrains 插件适配 IntelliJ IDEA、PyCharm 等主流开发工具,实现零学习成本接入;CLI 则针对服务器运维、快速代码审查等轻量场景,提供终端级高效支持。

三端数据和账号、Credits 实时同步,确保开发者在不同场景下的体验一致性。开发者在 CLI 生成的脚本可直接在 IDE 中编辑,消除了大量手动同步、配置和环境切换的琐碎工作,提供无缝、一致的开发体验。

而在定价上,Qoder 直接推出了首月首购 2 美元/⽉福利。

伴随普惠的,则是 Qoder 更智能的成本控制模式。通过上线模型分级选择器,Qoder 可以自动为不同任务匹配最优模型:轻量模型适配代码补全、注释生成等简单任务,成本仅为 SOTA 模型的零头,还能带来响应速度的极大提升;架构重构、跨模块开发等复杂任务则调用高级模型,比固定用单一模型节约更多成本。

据 Qoder 创始人丁宇(叔同)在接受采访时解释,Qoder 有大量用户和真实使用数据,可以从统计学层面知道不同场景最适合哪种模型。而如果让用户手动选择,首先会打断思路,其次也不现实——没人能在每次提问时都换模型。一般人都是开启一个新会话选好模型后一路用下去。所以 Qoder 没有透出模型选项的核心理念是机选优于人选,希望通过强大的模型调度能力,能自动判断并为每一个问题选出最合适的模型,这样用户体验和效果都更好。

这也是 Qoder 和其他产品最大的不同:用效果说话。

Qoder Bench 数据显示,在复杂任务测试集中,Qoder 综合效果评分领先行业 13.22%,而按同等任务量计算,其耐用度比 Cursor 高 104.9%。

 

04

尾声

 

进入 2025 年,伴随 AI 的普及率大幅提升,大模型行业一个最深刻的变化就是 SOTA 刷新频率与「aha 时刻」的密度呈现反比——参数竞赛的边际效益递减 ,行业终于回归技术落地价值的核心命题。

相应的,在各种绘画、ppt、coding 等细分方向,做深,做性价比,也做专业用户的口碑,从小的体验做起,让工程化能力与模型能力并进成为新的主流。

Coding 是走向 AGI 的必经之路。Qoder 是帮助大模型通过实际编码任务来提升端到端能力的重要载体。它服务开发者,也服务更广的场景。从战略上讲,它是阿里整个 AI 体系的重要组成部分。

AI 编程的竞争焦点,也从谁能生成更炫的 Demo 转向谁能解决生产环境的真实软件开发问题,而这,正是 Qoder 真正的意义所在。

当「一人公司」成为现实,我们要如何重新「发明自己」?

这几年,企业在谈「转型」,行业在谈「重构」,但最先被改变的,从来都是个体。

有人因为掌握了 AI 工具,效率翻倍,成了团队里最不可替代的那个人;有人因为 AI 工具,填补了自己的短板,成功开启「一人公司」的征程,启动了创业。

也有人在焦虑:「技术越来越强,我的位置在哪里?」

12 月 6 日下午,在极客公园创新大会的「小场深谈」里,我们把这件事拎了出来,做成一个主题:

AI 时代的个体进化论

我们想聊的,不是「AI 很强、AI 很快」这种宏大叙事,而是更具体、更贴近、更刺痛的问题:

  • 当 AI Agent 重塑了工作流,一个人可以做过去十个人的事,我们会不会变成组织里的「小齿轮」甚至「可替代」?
  • 创意在被批量生成,我们该如何保持自己的「差异」?
  • 如果 AI 可以复制几乎所有东西,那它到底复制不了什么?
  • 一个普通人,该凭什么构建属于自己的商业闭环?

这些话题,我们请了 真正站在变化前沿的人 ,来一起拆开谈。

他们中,有人已构建起基于 AI 的独立商业体系,有人在企业组织内开辟出创新路径,有人在探索人与技术共生的全新可能。

我们一直认为, 技术的本质不是替代,而是放大;被放大的不仅是系统,更应该是人。

我们想通过这场活动,把「被放大的个人」放到台前,让更多人看到:

  • 一人公司不是神话,而是方法论;
  • AI 带来的不是「人的替代」,而是「身份的拓宽」;
  • 职业的未来不在岗位描述里,而在我们能创造出的价值中。

我们希望每位走进现场的人,都能在这场对话里获得一个明确的方向:

不是你会不会被 AI 替代,而是你打算如何成为更强大的自己。

这是一场为「超级个体」准备的聚会。每场嘉宾对谈后,都有观众互动提问时间,激发新的思考。

12 月 6 日,北京 798艺术区,让我们一起,聊聊 AI 时代的「个体进化论」,聊聊 AI 时代的个人,怎样进化为新的物种。

敬请期待。

 

还有一件很重要的事

为了确保大家在大会两天时间里,不蜻蜓点水,而是真有收获。提醒大家 IF 大会每日的主会场门票和每日单独主题的「小场深谈」门票, 是相互独立的,不同的门票只能进入对应会场哦。

希望这可以让大家可以真正聚焦和沉浸在感兴趣的话题里,毕竟不同会场会有时间重叠,提前做好选择很重要哦。因为它们是两场平行发生的对话,互不包含,但各自精彩。

所以——

如果你已经买了小场深谈的票,但没抢到主论坛的门票,你还可以利用此最后机会单独购买主会场门票;

如果你只买了主会场票,却对某个小场深谈特别心动,也别忘了去补一张对应场次的专场票哈。

❌