普通视图

发现新文章,点击刷新页面。
昨天 — 2025年12月3日极客公园

实测千问 App 生图、生视频功能:国产实用主义的突围

2025年12月3日 14:45

作者|Cynthia

编辑| 郑玄

Sora 2 的与奥特曼对话的音画同步视频生成,还有 Nano Banana Pro 的风格化生图狂欢热潮还没过去,多模态 AI 领域又有重磅更新上场:

阿里的千问 APP 在 12 月初悄然完成了一次关键版本更新,接入国内最强 AI 生视频模型 Wan 2.5,以及全球开源领先 AI 生图模型的特供满血版 Qwen-Image 2511,更重要的是,生图功能直接拉满免费不限次,彻底降低用户的使用门槛。

在此之前,我们曾深度测评过 Wan 2.5 的网页版(详见 从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录 ),当时就觉得这模型实用到不像当下 AI 圈的东西:没有追 1 分钟长视频的噱头,也没讲各种用户根本看不懂的参数。就专注一件事:把 10 秒内的音画同步、细节还原做到了极致。

如今它下放到手机端,再配上 Qwen-Image 2511 这张 免王牌」一同下放到千问 APP,可以说,这是阿里将 B 端沉淀的多模态技术向 C 端场景落地的重要尝试。

那么 APP 端视频生成的体验究竟是否能像此前网页端一样惊艳?还有,卷了这么多年的图片生成大模型,这次千问+ Qwen-Image 2511 又能带来什么惊喜?

带着两个核心疑问,我们用一周时间把这两个功能用到了极致,试图为大家解决以下问题:

Qwen-Image 2511 是否能真正解决传统 AI 生图的人物崩脸、中文乱码等行业痛点?Wan 2.5 在音画同步、长视频叙事上与国际主流模型的差距是否缩小?免费模式背后,阿里又在构建怎样的 AI 生态闭环?

 

01

视频能力实测:

Wan 2.5背后国产模型的实用主义路线

 

Wan 2.5 是谁,相信很多了解过 AI 视频生成的朋友已经对此并不陌生。

作为为数不多能够对标谷歌 Veo3 的视频生成大模型,Wan 2.5 核心突破在于音画同步与 10 秒长视频生成以及更精细、好看的画面。

说的更直白一点,Wan2.5 不仅是 2025 年国内最先进的多模态生成模型之一,绝对也是你用过最具性价比的一梯队 AI 视频生成产品。

接下来,我们从音画同步、场景化功能、细节表现三个层面,解析其实际表现。

测试一:音画同步、时长

音画不同步、短时长限制、细节不突出,是过去国产视频模型与 Sora、Veo3 等国际模型的主要差距。针对以上问题,我们直接让 Wan2.5 生成:在复杂场景中,生成两个不同风格人物对话的剧情。

提示词如下:

暮春午后,石质柱廊蜿蜒延伸,青灰色石板映着斑驳光影,阶前青草点缀,风拂过荀子身着玄色宽袍腰束素带,与身披浅灰亚麻袍、赤足踏石的苏格拉底相对而立。镜头先以全景定格,随即推进至荀子中近景,他广袖一扬,特写中眼神如炬,沉凝有力地掷出:「人性本恶!争则乱,乱则穷!」镜头横切至苏格拉底,中近景里他双手自然摊开,指尖轻叩石面,眉宇从容,温和却带锋芒地反驳:「人性本善,无人有意作恶。」最后镜头从两人面部拉远,回归全景,柱廊光影流转,风拂衣袂,两人对立的身影在古意场景中定格。

看似简单,但这段提示词里,实际埋了三个坑:

第一,风格冲突:需兼顾古风与西方两种人物风格,避免不同穿着人物实际共用一张脸的情况;

第二,音画同步:两个角色的台词「人性本恶!争则乱,乱则穷」「人性本善,无人有意作恶」要对口型,还要匹配动作,并且两人的语气与神情各不相同。

第三,复杂画面,元素不丢:石质柱廊,青灰色石板、斑驳光影、阶前青草点缀,不能随着镜头的切换凭空消失。

最终生成效果如下:

可以看到,Wan2.5 的音画同步准确率相当不错,而且我们一开始担心各种问题,Wan2.5 都解决的很好。首先是高度一致的音画同步,细节上,不仅人物挥动衣袖的动作、身体、音画同步自然流畅,就连场景也有很高的一致性,整体画面切换调度也颇有动画电影的水平。

测试二:细节控制

如果说卡通测试是基础题,那电影级写实测试就是附加题。

此前在 Wan2.5-Preview 时期,我们就已经见识到了它在细节还原、氛围打造上的厉害之处。不过这次,我们让难度再升级,从黄昏树林中静止的男生,变成真实复杂场景中,两个运动中的主角。

提示词:【风格设定】电影级写实风格,画面干净通透,兼具温柔氛围感与高级电影感;线条细腻,质感真实。【人物 + 动物+动作设定】

人物:20 岁年轻白人女孩,轮廓分明,皮肤白皙,长发微卷,眼神清澈带一丝温柔沉思;穿着米白色棉麻长裙(领口微敞,袖口随意卷起),衣料有自然褶皱,质感轻薄透气。

动物:一只温顺的小鹿(毛色浅棕带白色斑点,鹿角短小圆润),头部轻靠女子左臂,眼神柔和,耳朵偶尔轻微晃动,与女子互动自然不僵硬。

动作:女孩牵着鹿从森林中缓缓走来

【场景设定】黄昏稀疏落叶林,树干笔直修长,树叶泛黄带绿(秋夏交替质感),地面覆盖少量浅棕色落叶;时间为日落前 1 小时,天色呈暖橙与淡紫渐变,空气通透无雾气。

【镜头与光影核心要求】

镜头参数:长镜头(无切换),中景构图(人物 + 小鹿占画面 60%),中心构图(人物与小鹿位于画面正中心),干净单人 + 动物镜头(无多余路人 / 杂物);背景虚化(景深 f/2.8),突出主体,虚化后背景呈斑驳圆形光斑。

光影层次:

逆光:太阳位于人物后方偏左侧,形成金色轮廓光(勾勒发丝、肩膀、衬衫边缘),轮廓光宽度 1-2cm,柔和不刺眼;

侧光:右侧补柔和侧光,照亮人物半张脸,避免面部全黑,形成「半明半暗」的层次感;

柔光:整体光线经过树叶过滤,呈漫射效果,无硬边阴影。

先说结论,这是最近各种 AI 视频测试中,最让我感到惊喜的一个。

先看必答题:女孩的棉麻长裙,袖口卷起的地方有自然的褶皱,不是熨烫平整的假质感;小鹿的头靠在女孩手臂上时,耳朵会轻轻晃动,不是 焊死在头上;逆光的金色轮廓光,刚好勾勒在发丝和肩膀边缘,没有糊成一片。女孩转弯前真实的眼神变化,走路时自然飘动的发丝,真实到仿佛电影画面。背景虚化后的光斑是圆形斑驳,不是呆板的圆形光斑,这细节已经能吊打不少 老法师了。

然后是彩蛋:我忘记了在提示词里写任何声音,但视频里居然有 咔嚓咔嚓女孩和小鹿踩过落叶时的脚步声,声音会随着步伐的快慢变化;背景里还有清脆且有空间远近层进的鸟叫声。

据了解,这种画面审美突破的核心在于,Wan 2.5 通过引入人类反馈的强化学习(RLHF),把用户对画面质感、动态效果、指令匹配度的反馈用于优化模型,从而彻底让 AI 视频生成摆脱了过去诡异中带着点赛博丑陋的标签。

测试三:场景化功能体验

不同于国际模型侧重各种技术极限,Wan 2.5 更注重实用场景适配,此前通义推出的全民舞王一度让全中国的奶牛猫都突然站立开始跳印度舞,虽然魔性,但直指普通用户的创作痛点。

这里的测试,我们不再采用固定的模版,而是玩了个 脑洞测试:上传一张小猫的照片,让它驮着孙悟空在非洲大草原狂奔。

这个需求的难点在于双重动态:小猫跑步时的肌肉形变、孙悟空的丝带飘动,还要保持小猫的原长相。毕竟,很多 AI 处理图生视频 + 复杂动作时,会把主体搞成橡皮泥,要么肌肉不动,要么脸崩了。

效果如下:

可以看到,这里的测试效果依然很稳定,小猫已经驮着孙悟空在非洲大草原奔驰,会有肌肉的运动,孙悟空的丝带飘向风的方向,不是 360 度乱转;最关键的是,小猫的脸和我上传的照片几乎一致——耳朵的弧度、眼睛的颜色,甚至额头的精细花纹全都没丢。

 

02

生图实测:

免费工具的专业度上限有多高

 

原本测完视频能力之后,我已经觉得不会有更多超出的惊喜出现了,但万万没想到 Qwen-Image 2511 模型的能力,同样打了我个措手不及。

官方资料显示,Qwen-Image 2511 模型在 Huggingface 趋势榜登顶数周,开源生态贡献度全球第一,AI arena 竞技场排名仅次于闭源模型 nano banana 与 seedream 4.0。

不过这些数据对用户而言,其实价值意义不大,还需转化为实际使用体验才能被认可,我们依然通过三组核心测试验证其落地能力。

测试一:连续创作过程中的人物一致性。

AI 生图的核心痛点之一,是无法在多轮生成中保持人物特征稳定性,经常是更换场景、调整动作后,人物面部特征易出现崩脸、换脸问题。这就导致,AI 出神图容易,但是用在生产环境稳定出图反而是个问题,而 Qwen-Image 2511 很好的解决了这个问题。

我们以同一人物(动物)多场景生成为测试场景,来「嫁祸」一只小猫咪:

输入素材:一张金渐层小猫的照片

生成指令:给小猫穿上粉色裙子、给小猫面前放个花瓶小猫推花瓶、让花瓶碎在小猫面前

可以看到,Qwen-Image 2511 完整保留了测试对象也就是金渐层的面部特征之外,穿上的衣服也与小猫的身形完美符合,一个有些有意思的细节是,每次 Qwen-Image 2511 生图都是四张,而这四组图片中,小猫的裙子颜色、花的颜色与款式,都是完全一一对应的,细节满分。

测试二:中文文字+商用场景适配

对中小商家而言,AI 生图的核心价值在于降低商用素材制作成本——能否生成符合平台规范的商品图、海报图,直接决定工具的实用价值。

此外,中文场景下,当前市面上的其他 AI 生图常出现文字乱码、字体错位问题,说白了就是像鬼画符。其中,表现差一点的,完全看不出来文字到底是什么;表现稍好一点的,也会出现某个字少个偏旁,缺了一横,或者多了一竖。总之,模型对中文语义与排版逻辑的理解始终弱于英文。

这次,我们测试直接上难度,不只要能写汉字,还要有排版,写的好看,并且还要搭配复杂商用级别画面。

提示词:做一个海报,核心主题「天然无谷狗粮 | 狗狗健康成长的能量源泉」

视觉主体:纯种金毛,6-12 个月幼犬,毛发蓬松有光泽,眼神灵动,正低头大口啃食狗粮(嘴角带少量粮屑,呈现「适口性极佳」的真实感),姿态放松愉悦(如趴在草地 / 地毯上,尾巴轻摇)

产品呈现:打开的狗粮包装袋(透明开窗设计,可见颗粒分明的狗粮,颗粒呈不规则六边形,颜色为浅棕 + 深棕渐变),袋身斜靠在木质托盘上,,标注「无谷配方」「鲜肉含量≥85%」「益生菌添加」核心卖点。辅助元素为:旁边摆放 1 个陶瓷食盆(装满狗粮,少量颗粒散落在食盆边缘),1 片新鲜胡萝卜 / 西兰花(呼应「天然食材」),1 滴透明鱼油(暗示「美毛护肤」功效)

场景氛围:户外场景:青翠草地 + 蓝天白云,狗狗趴在野餐垫上进食,周围点缀几朵小雏菊,远处有模糊的树木轮廓,整体色调清新自然

风格与质感:超写实质感,细节拉满(狗狗毛发根根分明,狗粮颗粒的纹理、油脂光泽,食盆的陶瓷磨砂质感均清晰可见),避免卡通化或模糊处理

色彩搭配:暖橙色(传递「温暖」「食欲」)+ 浅草绿(呼应「天然」)+ 原木色(增强「安全」「质朴」感)

 

 

测试结果显示,Qwen-Image 2511 在基础测试中完全规避了文字截断、字体混淆问题,不仅实现了海报标题的精准呈现,画中画的狗粮包装袋上文字依然精准呈现。此外,画面中胡萝卜的大小、狗粮的质感,幼犬的形态、狗毛的真实毛绒质感还原也非常到位,可以直接用于电商平台上架。

此外,更惊喜的是,Qwen-Image 2511 生图时支持一键调整比例(1:1/2:3/3:4/9:16/4:3/16:9/3:2),无需借助第三方工具裁剪。此外在后期,Qwen-Image 2511 还支持局部改字/改色、扩图、修改尺寸等等修改,而这对生产级场景来说,非常重要:毕竟 AI 生图,一次性得到满意结果的概率并不大,往往需要非常精细、复杂的后期修改。而现在这件事情,已经可以彻底交给 AI,精准修改。

 

 

对比一些付费生图工具,Qwen-Image 2511 不仅在纹理还原度上表现更优,而且成本直接降为零,这对需批量制作素材的中小商家而言,具备极强的实用价值。

 

03

国产 AI 的实用主义突围

 

测完千问 APP 的两个新功能,我突然明白阿里这次升级的 野心:

无论是 Qwen-Image 2511 解决中文生图痛点,还是 Wan 2.5 补齐国产视频音画同步短板,千问的此次升级,其实背后正是国产 AI 模型的差异化突围范本:

Wan 2.5 的环境音自适应、元素 ID 锁定,不仅能用于阿里电商的短视频带货场景,也能让普通人享受和家里宠物跨物种对话的神奇;

Qwen-Image 2511 的 中文渲染以及精细控制能力,不仅能够造福各种中小商家,也能让没有作图能力的手残党感受创作的快乐。

当这些 B 端技术被改造成 C 端用户能轻松上手甚至免费的功能时,AI 才真正从实验室走进了日常生活。而伴随创作成本大幅降低,国产 AI 工具也才有了成为新时代内容创作的标准的可能,而这才是真正的 AI 普惠。

直击爱奇艺 AI 剧场创作营:当奥斯卡摄影大师遇上 AI

2025年12月3日 14:13

1895 年,巴黎一家咖啡馆的地下室,卢米埃尔兄弟的《火车进站》首次公开放映。

当火车沿着铁轨逼近镜头、仿佛要冲破银幕的那一刻,观众们惊慌失措、连连后退——那是人类对「影像」力量的初次战栗,也是百年电影工业的起点。

130 年后,这种战栗再次降临。

在爱奇艺的一个封闭创作营里,奥斯卡金像奖得主、《卧虎藏龙》摄影师鲍德熹再次提及这部影史的开山之作。在他看来,AI 技术带给视听世界的冲击,不亚于当年那列闯入人类视觉经验的火车。

正因如此,73 岁的他决定开启一场新的冒险——与爱奇艺共同发起「鲍德熹·爱奇艺 AI 剧场」创作营(以下简称「创作营」),面向全球征集 AI 创意,从中筛选 30 组创作者开始训练,再挑出 15 组正式进入制片环节。据了解,第一批作品最快将于明年 1 月上线。

这是一场近乎疯狂的实验:一位在传统认知上已经功成名就的电影大师,试图带领 30 组青年创作者去挑战目前行业的「深水区」——制作 15 分钟以上的商业级 AI 剧情长片。

11 月中旬,「定焦 One」走进了这个 AI 创作营,也在创作营的间隙与鲍德熹,爱奇艺副总裁、智能制作部负责人朱梁,爱奇艺灿然工作室总经理、《我的阿勒泰》制片人齐康聊了聊这场实验背后的动机、挑战与野心。

「这是一次百年一遇的机遇,你们是第一批淘金者。」讲台上,鲍德熹对 30 组创作者说。73 岁的人,语气却像年轻导演第一次摸到摄影机。

讲台之下,学员们如饥似渴。他们不停做着笔记,偶尔还用电脑测试着什么。每堂课结束之后,还有很多学员围着老师,沟通自己项目的难点和困惑。朱梁介绍,很多创作组甚至凌晨两三点还在讨论项目。因为这个创作营激发了学员们很多新的想法和创意。

你能感受到,那种久违的、关于电影未来的兴奋正在这里重新发生。

 

01

15 分钟:AI 影像步入叙事「深水区」

 

现阶段的 AI 视频作品,多停留在 1–3 分钟以内,形式以视觉奇观与 MV 拼贴为主。爱奇艺与鲍德熹给出的标准,是至少 15 分钟。

这不仅仅是时长的增加,更是叙事逻辑的改变。

「千万不要小看这 15 分钟。」鲍德熹解释,视频时长一旦超过 5 分钟,就进入电影构造。而要把一个故事在 15 分钟内讲完,对信息密度、叙事节奏都有极高的要求。因为观众没有耐心等你铺垫,前 3 分钟必须要有高潮,每隔几分钟就要有新的戏剧冲突,否则他们就会划走。

换言之,这短短 15 分钟,创作难度绝不亚一部两小时的电影。

更棘手的是,目前 AI 技术在长叙事面前,暴露出了一系列致命的短板。爱奇艺副总裁、智能制作部负责人朱梁将其形容为「在技术的不完美中走钢丝」。

他总结了五大技术难点:

第一,视觉一致性和连贯性。目前 AI 生成视频,同一场景在不同镜头或时间节点下,其空间结构、道具细节,尤其是自然光影很难保持物理逻辑上的连贯,从而导致叙事空间失真,削弱作品的沉浸感和可信度。

图源:爱奇艺行业速递微信公众号

第二,人物表现与复杂动作生成不足。AI 生成的表情尤其是微表情的准确性和生动性不足,也无法完整、合理地生成复杂的交互动作,如武打套招。

第三,材质真实感与音画同步问题。AI 渲染出的物体表面,尤其是人物皮肤,存在严重的「塑料感」。此外,它很难让角色的口型与台词精准同步。生成的声音也带有明显的「AI 味」,缺乏真人说话的特色、口音和情感起伏,听起来千篇一律。

第四,物理规律不符合常识。AI 生成的画面里,杯子摔碎、球体碰撞后的弹跳轨迹等,常常看起来「不对劲」。尤其是那些需要高度拟真的复杂大场面,比如建筑物爆炸坍塌,AI 目前还做不出电影特效中那种以假乱真的震撼效果。

第五,长时序镜头的调度与协同。对于涉及多元素、长镜头的复杂场景,AI 在全局调度与控制上能力不足,很容易导致长镜头叙事混乱。

「所有瓶颈都意味着,AI 创作正在从『玩具阶段』向『工业应用』艰难爬升。」朱梁说。 爱奇艺的目标十分明确 —— 不做 「 PPT 式 AI 视频 」 ,而是做商业级剧情片 。商业作品的底线,是「观众不能跳戏」。任何技术瑕疵,都会像警报一样提醒观众「这是 AI 做的」,把人从故事里拽出来。

这正是 AI 创作最折磨人的地方:当技术瓶颈短期无法突破,创作者只能在艺术表达与内容策略上不断妥协。「我们设置 15 分钟,并不是为了长而长,更多是给故事足够的容器,同时也进一步激发 AIGC 技术的真正潜力与生命力。」朱梁说。

 

02

从抽卡玩家到新一代导演

 

技术与艺术之间的平衡,是这次创作营的灵魂。

不同于市面上其他 AI 课程,爱奇艺创作营没有把「如何写提示词」视为核心,而是把重点放回电影的本体。课程中既有 MiniMax 内容工作室负责人、生数科技美学专家等技术先锋讲授 AI 应用,也有在创作一线的爆款导演、编剧——如《啥是佩奇》导演张大鹏、《南京照相馆》《孤注一掷》编剧许渌洋,分享叙事经验与创作心法。

课程大量篇幅都在讲剧本结构、镜头语言、声音音乐的情感调动,几天的密集授课像是一部被压缩到极致的「导演速成手册」。

背后反映的,是鲍德熹的一个信念:即便在 AI 时代,技术不能脱离「电影(Cinema)」而独立存在。

鲍德熹口中的 Cinema,是电影百余年来沉淀下来的影像语言,是一门「用光影讲故事」的手艺活儿。

这门手艺包括剧本。

编剧许渌洋在课程中介绍,故事是一个重要的杠杆。一个好的剧本能让几千万的小成本电影创造出数十亿的收益;反之,一个烂故事能让耗资数亿的大片「血本无归」。而对于从业者来说,故事难写,很多人穷尽一生都搞不清楚,但一旦掌握,便能让你跑赢同行,跑赢市场,成为这个行业的阿尔法(Alpha)。

也包括镜头语言。

鲍德熹用《卧虎藏龙》的实战经验,向学员们展示了艺术背后的「算计」。在拍摄这部电影时,他大量使用了 40mm 镜头,而非标准的 50mm。因为 40mm 镜头既能让人物无明显变形,又能稍稍拉开人物与背景的距离。这种镜头上微妙的变化,创造了一个人物内心欲望与外部约束角力的舞台。

图源:《卧虎藏龙》豆瓣官方剧照

与此同时,《卧虎藏龙》的机位大部分在人物胸口位置,而不是平视。用低机位塑造和凝视人物,强调他们的崇高、挣扎,以及最终无法挣脱命运的悲剧感。

在鲍德熹看来,镜头的构图、视角、运动都必须有艺术目的和叙事功能,是为了更好地讲故事而不是炫技。光影雕刻形体,而镜头运动赋予电影生命,它决定了观众如何「进入」和观看这个故事。

在传统的摄影机创作中,这门手艺活儿非常体现摄影师的主体性。

比如会有大导演在关键戏份的拍摄时一定要鲍德熹亲自掌镜。因为拍摄的过程会有很多瞬时的艺术决策,几乎每半秒钟就是一个新的构图,摄影师需要根据人物动作和对白,实时决定如何变换角度。人脑高速运转,充满了即兴与灵动。

但在现在 AI 生成的视频里,创作者不用操控摄影机,只需要提示词。因此,是否还需要掌握这门手艺活儿成为了很多人的疑问。

在创作营,一位电影科班出身的学员表达了当前的迷茫:身边一些同行,没有经历过专业影视训练,仅凭本能也做出了一些 AI 片子,流量不错,观众也能接受镜头里的瑕疵。「我们还有必要学这些变焦镜头、这些手法吗?」

鲍德熹回答得斩钉截铁:「你面前是浩瀚大海般的 Cinema,要有敬畏之心。因为 Cinema 才是我们的精神殿堂。」

他强调,电影是艺术的综合体,融合了视觉、听觉、叙事等所有艺术门类。 当 AI 技术让一个人有可能独立创作时,他需要具备的修养就越多。 「如果抛弃了 Cinema 的语言,也就意味着无法与那些看着电影长大的观众进行深层沟通。」

AI 让创作降低了门槛,但决定作品高下的是「品味」。毕竟 AI 也好,摄影机也罢,工具都只是手段,在掌握技术的基础上,用电影的思维去讲故事,而不是做简单的「视频拼凑」。

齐康也表示,AI 技术给影视创作制作带来的革命意义或许是「技术平权」,它将打破专业创作者和业务爱好者之间的边际,也定将颠覆传统影视娱乐内容创作和生产的模式。

但对于当下的「专业创作者」来说,除了关照 AI 技术催生的新生活形态和情感状态,亦应思考和探索,AI 技术如何让「视听语言」进化。 在齐康看来, 电影的一个本质属性是 「 影像戏法 」 ,任何新技术的引入都催生了电影形态的进化, AI 亦是如此。

 

03

寻找新大陆

 

如何用好 AI,这不仅关乎审美选择,更是一场关乎生存的产业探索。

一边是传统影视行业步入寒冬。奈飞 CEO Ted Sarandos 曾公开预言「电影院时代已经终结」;导演陈凯歌也在金鸡奖论坛上不无感伤地指出,那种精雕细琢、追求艺术完美的创作方式,正逐渐失宠于这个追求效率的新时代。

另一边,短视频与短剧正以惊人的速度重塑用户习惯。一分钟一集的强节奏叙事不仅争夺着用户时长,更颠覆着长视频的叙事逻辑。而 AI 技术催生的「漫剧」等新形态,以比短剧更极致的节奏和商业模式加速爆发,持续重构内容产业的生态格局。

在鲍德熹看来,AI 技术或许正为行业指引一条通往新大陆的航路。「短剧或许只是一阵浪潮,终有退去之时;而 AI,则可能是席卷一切的洪水。」

他点出长视频行业的根本痛点:高成本、高风险、长周期。一部好莱坞大片的制作成本动辄数亿美元,剧组规模庞大,每一次摄影机的移动都意味着高昂的轨道铺设费用。更重要的是,集体创作模式常常让导演和编剧在艺术表达上处处掣肘。

而 AI 正在改写这套规则。它赋予创作者「无限的权力」与几乎零成本的试错空间——几乎可以把它看作是一台无需轨道的、随心而动的摄影机。

图源:爱奇艺行业速递微信公众号

正是在这样的背景下,爱奇艺通过本次创作营,试图在「低成本 UGC」与「昂贵 PGC」之间,开辟出一条「AIGC 精品长视频」的第三条赛道。

「我们希望让优质内容以更快速、更富想象力、更低门槛的方式被创造出来,」朱梁表示。爱奇艺正在探索建立一套全新的 SOP(标准作业程序):极低的边际成本,配以极高的工业标准。

一旦这套模式走通,平台将不再受制于天价片酬与庞大剧组,而是能够像现代化流水线般,稳定产出高品质的剧情内容。

朱梁进一步阐释:「我们以实验者姿态,主动承受技术不完美对艺术表达的折损,目的是为了极限测试并推动技术边界。这一切的终极目标,是让 AI 强大到无需被特意提及,让故事与情感重新成为唯一的主角。」

鲍德熹预测,AI 创作的黄金期将在五年内到来,当下的所有探索都如同「摸着石头过河」。他相信,当技术真正成熟时,用 AI 拍电影也许会像今天写网文一般寻常。

他将希望寄托于创作营中的学员,语重心长地对他们说:「谁能把握住时代的风口,谁就能成为 King of the World。」

这背后,是鲍德熹一以贯之的核心思想:既要拥抱 AIGC 技术,更要坚守 Cinema 的灵魂。他鼓励学员借助 AI 这一强大工具,去实现传统拍摄难以企及的视觉想象,但同时必须恪守电影叙事的根本规律——故事、节奏、冲突与情感。他期盼的,是创作出有品味、有娱乐性、能真正打动观众的「新一代电影」(Next Generation Cinema)。

「去拥抱新技术、驾驭它,做出心中所想——这就是我的决心。」鲍德熹对「定焦 One」说。

 

04

结语

 

在训练营的尾声,鲍德熹为学员们留下了若干条创作箴言。73 岁的电影宗师,亲自指导年轻一代驾驭最前沿的工具——这不只是技术的传承,更是一场关于电影精神的保卫战。

爱奇艺的这场实验,象征着百年电影工业与前沿算法之间的一次深度握手:不是在对抗中走向消亡,而是在对话中获得重生。

鲍德熹的创作 Tips:

确定品味 (Taste):你想讲一个什么样的故事?是《拯救大兵瑞恩》还是短剧?

观众至上:不要孤芳自赏,电影是大众艺术,必须听到观众的掌声。

不急功近利:珍惜此次发布作品的机会,不要为了赶工而牺牲质量。

必须懂摄影:不懂摄影的 AIGC 创作者只是在胡拍。

慎用旁白:尽量用画面和动作讲故事,不要依赖大量的内心独白。

说人话:对白要朴实、生活化,不要故弄玄虚。

节奏:节奏要紧凑,不要有无意义的停顿。

拉片学习:针对自己的题材去拉片,模仿大师的视听语言。

一分钟梗概:必须能在一分钟内讲清楚你的故事。

反复审视:用编剧、导演、摄影师三种身份反复审视剧本。

关注表演:角色是故事的灵魂,虽然 AIGC 很难控制表演,但要尽力去模仿真实的人类状态。

多角度覆盖:拍摄时多拍几个角度(全景、特写、过肩),为剪辑留余地。

用心配乐:音乐和音效是打动人心的关键,不要用廉价的罐头音效。

大胆用色:可以尝试全片黑白或特定色调,形成风格。

70% 学生选 AI,大学校长怎么教?

2025年12月3日 12:29

深圳的冬天依然晴朗无云。站在 2025 IDEA 大会的会场,我今年最大的感受是大会现场有关「AGI 焦虑」变少了,对 AI 落地的「颗粒度」变细了。与去年相比,人们不再讨论 AGI 到底什么时候到来,不再充斥着对参数规模的盲目崇拜,而是更关注如何让 AI 带来更多的价值。

大会的核心看点依然是IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋。不同于其他大厂高管热衷画「技术路线图」,沈向洋这次给出的更像是一个「思考框架」。他没有预测下一个 GPT-6 何时到来,而是直接抛出了智能演进的五个维度:算法范式 、智能载体 、交互范式 、计算架构 、数据。当前,绝大多数 AI 创业公司只在「算法」或「应用」这两个维度上卷,而忽略了系统性看待 AI 上下游的重要性。

我们从这次主题演讲能够比较明显地看出沈向洋想要传递的信号是:AI 的下半场不仅仅是模型参数的竞争,而是各个维度之间的协同性。

顺着这个逻辑去看现场展示的「具身智能」成果,我们就能发现如今最关键的不是造机器人,而是解决「脑-手」协同的难题。在会议现场,沈向洋表示,在具身智能的众多攻关点里,灵巧手是技术复杂度的珠峰:「人手的魔法在于它手既能搬箱子,也能穿针引线。所以,灵巧手可以说是人类在人工智能面前最后的尊严。」

IDEA 研究院创院理事长、美国国家工程院外籍院士沈向洋|图源:IDEA研究院

一年过去,IDEA 还在大湾区的具身智能领域交出了三份答卷:针对末端执行的灵巧手大赛、聚焦通用落地的 DINO-X Grasp,以及国内首个模块化具身智能软件平台 Tairos。其中,DINO-X Grasp 在上一代视觉大模型的基础上,能够在开放世界环境中完成 2D 认知理解、物体抓取位姿预测以及 3D 形状感知。这意味着机器不仅能「看见」,还能真正「看懂」并以此指导行动。

在现场展示中,我们能看出 IDEA 并未将低空经济简单视为无人机硬件的堆叠,而是将其定义为一个复杂计算架构与交互问题。当低空出现成千上万架飞行器时,现有的空管系统和通信算力是无法支撑的。这种从底层协议到调度系统的综合布局,本质上也算是「新基建」层面的竞争。谁先制定了这套标准,谁就真正掌握了低空经济的话语权。沈向洋发布的《低空时代》及《低空经济发展白皮书 4.0》,正是试图建立基于四维时空数据的交换与计算标准。

除此之外,IDEA 研究院在过去一年里还落地一些新成果。无论是能将海量分子筛选周期从数周压缩至分钟级的 Mozi 药物发现平台,还是将数据分析从人工主导推向「智取万数」的经济超脑,亦或是进化打造 AI 原生编程语言 MoonBit,都展示了 IDEA 研究院如何让 AI 作为工具深度嵌入垂直领域。

AI 时代未来方向|来源: IDEA 研究院

当然,主题演讲只是序章,更深度的思想碰撞发生在随后的圆桌之上,多位院士校长与企业高管汇聚一堂,围绕 AI 与教育、AI 时代的新型科研机构以及 AI 对软件工程的影响与机遇等教育话题展开了激烈探讨。极客公园对这场产学研界的思维交锋进行了精编整理。

一、当 70% 的学生选择 AI,教育如何应对「暴力式创新」?

 

1、我们进入 AI 时代以后,很多的教育、培养会不会跟以往有不一样的方式?

【哈工大-韩杰才】:AI 出来以后讨论最多、担忧最大的就是大学校长,我们大学校长坐在一起谈的都是 AI。AI 作为新一代的工具性的东西创新更容易,但要考虑的是把创新水平放在哪个阶段?低水平创新现在不需要,AI 就可以替代。这就要求我们未来培养的人要更高水平,我们学生的水平要高于智能体。

大学有老师,有智能体、有学生,是三元结构,老师水平比智能体低就麻烦了。现在学生获取知识方面很容易,我们需要培养什么样的人才?我在大学当校长的时候,认为有两个事是必须的:一是基础性的东西,100 年基本上没变的基础一定要掌握透。二是通过实践,坐在教室学习肯定是不对的,大学里全面改变了学习模式,以学习为主体。现在是人工智能强化学习,学生可以让 AI 作为工具来用。下一步如果是自主学习的话,大学要干什么?大学一个是平台作用要凸显出来,通过你这个平台可以从社会、全世界,特别是顶尖资源里培养人的能力就变得非常重要。个体获得这些资源难度大资源。

我们现在强调基础研究,要关注原创性、颠覆性技术的需求、创新也不是原来拿来主义的东西,底层的逻辑是你的,这就越来越重要,我们的创新从大学开始做项目,大一一进入哈工大就让学生必须进入实验室,需要什么知识,该学哪个老师的课就去学,一生一策个性化的教,这样才能有个性化、特色突出的创新人才。

2、倪校长,您作为港科大广州创始校长,有特色的地方是,港科大广州是没有院和系的概念,开始是为了提升各学科的交流,交汇有碰撞才能产生创新的火花,您做教育改革方面,现在时代遇到的机遇和挑战有哪些?

【香港科技大学(广州)-倪明选】:我们学校大三才选专业,选任何专业没有名额限制,现在第一批学生 70% 选 AI,20% 选大数据,10% 选智能制造,学生知道智能制造重要,可是他妈妈讲你只有选 AI,因为报纸上天天讲 AI。教育要改很多问题。改革最大的阻力就是老师,我们学校的老师都是国外名校回来的,可是他们在国外研究成果很好、paper 写很多,国外的教学和学生的素质也不一样。回到 AI 的时代,学生比你还聪明,AI 比你用得还好,对老师的挑战是很大的。我们学校不会用 AI 工具的老师基本上不能通过考试。

AI 时代创新模式的再思考|来源: IDEA 研究院

3、我们会发现 AI 真正的突破很大程度上是暴力式的创新,AI 显学进入暴力式的创新,需要堆很多的资源,会不会变成更多工程化、使命型的创新?

【哈工大-韩杰才】:暴力式创新最后形成的创新的角度我觉得不一定,有些是有原创的,不一定办出很大、很好的公司。有些没有原创反而很大,这就是原来这种状态。

我最近在探讨,智能时代创新什么最有生命力?文化基因最重要。为什么现在码农、硅谷印度人少了,中国人现在慢慢走在一线了。我认为要跟文化关联起来。智能时代的创新,有人说 DeepSeek 的思路是有文化的因素,像中文就不一样,我们写中文不写得很复杂,特别是法律方面的东西很麻烦,联想太多。

大学培养人的时候,智商是有限定的,广义理解情商越来越重要。它会有新的东西,只是这一阶段抓到机遇获得成功,跟我们搞电池一样,锂电池我们超越了,下一步全固态电池、其他电池的覆盖率是一样,是叠盖、覆盖的概念。

【香港科技大学(广州)-倪明选】:学校暴力不起来,几千卡都不得了,只有有些实验室才能做些暴力的东西。学校发展来讲,目前的暴力是大语言模型,应用还没做得很好,学校里做很多 AI+的东西,智能体推理做得比较多。DeepSeek 一出来为什么我们发现算力只有 1/20、1/10,是不是有超越 Transformer 的东西出来?这是学校要做的,我们鼓励给他们更多的空间。科技大学里大概 10% 的老师自由探索,大部分老师还是 AI+,不光是 AI 的老师,甚至做科技政策的老师也在用。

跟企业的关系,一般学校科研是走在企业的前面,这个领域企业走在学校前面,我们把学生送到企业界,算力的问题、数据的问题,企业和学校合作是双赢的。

4、您刚才说学校没资源做暴力美学,学生已经开始暴力选择 AI 的时候,作为大学的校长怎么平衡学生的未来?这个周期很长,他这次暴力选了,四年以后才能证明错了,他已经没有机会纠正了。

【香港科技大学(广州)-倪明选】:我上个礼拜四选择 30 个本科生到我家里来聚餐,我也跟同学说了同样的问题,不管做制造、材料、微电子都这么鼓励他们,但父母说必须选 AI,现在是没办法跟父母沟通。

 

二、新型科研机构的「分账」逻辑与生存法则

1、新型研究机构如何定位、如何评价?现在大学里的科研和工业里的科研分不是很清楚,如果我们既想要灵活又想有学术的强项,又想接触市场,各方向的好处都想得,我们有没有这样的定位?我们应该关注哪些问题?我们应该向谁报告?我们如何评价我们做得好不好,向外如何汇报我们做得成功?

【清华大学-汪玉】:我还有一个身份是清华大学天津电子信息研究院的院长,某种意义上来说也是一个新型研发机构,这个机构是在 2015 年成立,到现在十年,政府直接给的钱力度肯定没深圳这么大,当年我们的定位想得比较简单,我们孵化一些有影响力的公司。学校这边构建整个的生态,研究院作为成果转化办公室和对外合作办公室,并没有在里面放研究人员,当时看到的问题是怎么在市场竞争这么激烈的地方吸引最好的人才,这里又给不出最高的薪水,小公司的方式让他们成长起来我们在背后推动,把电子系的成果可以放进去,影响力做大,对于学校是好事,对于天津也是好事。刚才你说的,「股东」要满意,我服务清华成果转化,还要天津给一些支持。这是最早的,第一个五年、第二个五年,我们是这么干的。现在没有站得足够高,我们站在下面一层成果转化,对于一些中小 企业和大 企业的需求并没有摸得特别透,我们是孵化的逻辑,中间还有中小企业的逻辑,只靠政府投入不可能长期稳定的干好一个研究院,不能只靠政府投入,三重力量要融合起来。

【香港科技大学 (广州)-陈雷】:我到港科大时候倪校长是计算机系主任,我是助理教授,当时港科大拿 20 篇 Top conference 和 20 篇 Top journal,加 3 个 RGC 就可以升职,非常清楚。我当时很害怕,我玩命的写,玩命的带学生,我申请的是 50+50+3。年轻人看到我说,老师你年轻的时候就在玩命写 Paper,你现在不让我写 Paper 什么意思?

我们想和工业界结合,大方向要做 Impact,那基础学科怎么做?Data For AI,训练的时候怎么把数据集减小做训练,推理怎么用 KV Cache,最终落到基础问题 Data 怎么去存,服务于训练和推理。

这是一个基础问题,「既要还要」要跟工业界结合,不能自己写文章,写文章发得很嗨,每天都在写,impact 在哪儿。做的过程中不能说老师我是做基础学科的,你给我 5 年、10 年时间我给你憋个大招出来,我说行,但是 5 年之后你要憋不出来,我要你还是不要你,在此基础上像工业界有那么好的问题,为什么不能随地「下蛋」。我前两天和华为同学聊天,他们说在研究大模型投毒、被污染的问题,这些问题很新很有意义,在学校里面学习不到。哪怕做个专利和论文,至少看见你在做这件事情。转换赛道一定要把这个概念跟年轻人讲清楚,我们怎么去衡量,方向对了,impact 也有了,积少成多,也有盼头,这是我的想法。

【香港科技大学-谢源】:我博士毕业以后第一份工作在 IBM 做芯片设计,之后做教授,后面切换到 AMD Research,再到加州大学,在阿里的五六年期间,阿里的五年是比较特别的时期,一方面我还继续保持加州大学的实验室,那里还可以做非常前沿的研究,同时有阿里的达摩院,相当于是公司的研究团队。第三个角色带着平头哥数据中心大芯片的四个方向,CPU、GPU、存储、网卡芯片,那段时间特别可以感受到今天的问题,UCSB 的团队可以做非常基础的工作,Research For Fun,完全兴趣驱动。达摩院是要为产品部门做积累,比较近期的工作,「平头哥」是纯工程的事情,一定要实现 5 纳米的 CPU,实现 GPU 可以在阿里云里用起来。

新型研发机构要解决的问题是「达尔文死海」,不需要太考虑能不能落地,完全是兴趣驱动。另一方面产业考虑的是近期,能不能马上用到平头哥的产品里,新型研发机构要做桥梁。

评价体系对于新型研发机构来讲,不单纯是以学校或是公司,可能从三个维度,学术影响力就是研究的深度,技术影响力是对整个产业影响,某种程度上是广度问题,产业和社会的影响力是产生价值,能给企业、产业带来价值。

AI 时代的新型科研机构|来源: IDEA 研究院

2、这样的机构应该怎么组织?除了常见的公司项目体系或者学院课题方式?还有什么其他的组织方式吗?怎么能以学科为基础还是项目为基础的两种方式中间找到平衡

【清华大学-汪玉】:电子系有两个一级学科,信息与通讯工程,更多干的是大系统,包括关键的数学基础。另外是偏芯片的,电子科学与技术,在大平台上做基础的器件和芯片。AI 时代我自己感受都得有一个中台,底层的大平台,底层大平台本身需要更多的支持,比如说建一条线,我们会有一条线我们叫厨房,老师们或是小团队是厨师,做出菜来,这个菜怎么卖是怎样的事儿。偏器件层面大概率还是要按这套体系,需求的来源是外部的,做菜本身的团队是自由的、小的。我感受到前面的一级学科开始往这个方向走,特别是最近 Agent 起来,底层还是 AI 和工具,上面又变成小团队。自己往后走有底层的平台,上面有一些垂直的行业,跟模拟芯片的厂商很像,跟 ADI、TI 很像,工艺、设计共用的部分是基础,上面一堆不同的团队做分散的产品。

【香港科技大学 (广州)-陈雷】:虽然我是信息学院,我办公室旁边坐的人是生命科学,右边坐的是搞材料的,老师一进来是随便选办公室,大学里老师们坐得乱七八糟,找学校的老师开会都要 Zoom。学生拿奖学金,老师是没有钱的,要跟学生讲,我可以带这个项目。我带了一个碳中和的项目,做碳吸附、碳存储,我就得找搞环境、碳中和、材料老师,我们组成一个 team,这种跟之前完全不一样,原来是校长把钱给我,我为什么要跟你们合作,现在学生都组队了,要把学生抢过来,把钱给想做的学生,老师帮助他们去做,我觉得这种真的是在新型院校里,校长敢大胆改革。作为老师、院长我也不开心,我也没钱,只能求着学生,学生就去参加环境大赛,碳吸附、碳存储,环境大赛都拿奖,而且是一个团队,后面的老师是各领域老师,一下子就把这个方面带起来了,这是非常好可以借鉴的方法。

【香港科技大学-谢源】:我简单用我们在芯片领域的组织模式是矩阵式的管理方式,我觉得首先是有个能力中心,这是纵向的,偏设计的人员、偏验证的人员,他们作为能力中心,偏法、偏架构、偏底层设计,作为能力中心是一个维度,第二个维度是横向,项目维度,我们为了设计 CPU、GPU,需要调配设计架构+验证的人,三是技术平台,所有的项目需要走到后端的设计,平台部需要为所有的项目和能力提供平台基础设施。

 

3、怎么支持研究机构,钱从哪儿来?有一个困难,研究的时候经常有些不确定性,我做问题 A,后来发现问题 A 没做出来,对问题 B 有些进展,但问题 B 不能挣钱,这个问题经常发生。怎么支持不确定的研究能往前走?

【清华大学-汪玉】:这是两份钱,第一份钱是整个机构的钱,整个机构的钱还得找有钱的帮支持,比如说当年贝尔实验室是垄断企业,深圳有钱让政府持续给也不容易,还得把深圳本地潜在有钱的吸引进来,这是最重要的,赚钱的闭环最好跟研究闭环不要太耦合,否则就扭曲了。这样的机构里有 20% 的人随便干,80% 的人有些目标。

【香港科技大学 (广州)-陈雷】:谈到钱的事,港科广是政府给钱建的学校,校董会和校长特别要求下未雨绸缪,如果政府不给你钱怎么办?我们已经开始好多相关工作,到目前为止,昨天是第 19 个工业和学术 Joint Lab 成立,明年就有 30 个,每个实验室的投资是 1000 万,资方会越来越向工业界。假设我做一个很简单的项目、横向的项目,做完了以后不 work,但我有一个 B,我要做实验室不怕,把 B 给你,联合实验室要专利给你专利,要论文给你论文,东西出来了。你想让我做 A,我做 A,B 也不错,有专利、有论文,资方也很开心,而且他也收获了意想不到的东西,这种情况下作为高校不可能总靠政府资金,就跟工业界合作,帮工业界做点东西你总得给我钱吧,而且越来越多,五年以后有 100 家 Joint Lab,这个学校就没有问题了,学生的项目也会做得非常开心,这是我们学校和工业界强强合作。

【香港科技大学-谢源】:他们谈到找钱,用钱的角度就是用灵活的资金支持动态的合作,服务于坚定的方向就可以。汪玉提到八、二分,在我这儿是四四二分,基础有 40%,40% 是项目相关,20% 是作为侦察兵、种子,这是对应汪玉的八二。

 

三、AI原生编程语言出现时,程序员都消失了吗?

1、TypeScript 语言第一次超越 Python 成为 GitHub 最受欢迎的编程语言,因为 TypeScript 可以更好的让 AI 生成。未来有专门为 AI 设计的 AI 友好的编程语言吗?

【中山大学-王焱林】:这个月 GitHub 出了报告,TypeScript 成为 Top1 的编程语言,这是过去十多年编程语言格局最大的改变。我总结出最大的区别,TypeScript 是静态的语言,MoonBit 也是静态的,我也看好 MoonBit 的发展。我认同 AI 友好的编程语言的概念,也有一些语言特性是未来作为对 AI 友好编程语言一定要有的,一是类型系统是静态约束越清晰、越强越好。二是模型对机器是友好的,这也是 TypeScript 做得比较好的点。三是对人友好,最终的编程知识要转到人上。四是特别重要但比较被人注意到的,要对演化友好,现在 coding Agent 出来很震撼,给他一个指令就会做出一个游戏、网站,但是是需要迭代的,他生成很多的东西里面有很多的错误,我们迭代的时候才是最痛苦的。未来编程语言设计一定要把刚才这几个点考虑进去。

2、微软的 Copilot 送 Token 更多,可以说量大管饱。AI 编程时代,AI Coding 智能体的护城河在哪里?

【中山大学-王焱林】:Cursor 有一个很大的特点,迭代速度非常快,几个月可以迭代非常多次,背后的原因是最看重的是体验,开发者在 IDE 里到底体验、流畅感是怎样,也是 Cursor 的硬实力,硬实力会被厂商抹平,一些软实力,让 一个 Agent 陪伴我在一个仓库里执行一些动作的时候,希望他一定是越来越懂我的,Memory 也很重要,它懂我踩过哪些坑,我很难切到另一个智能体,哪怕生成准确度提高 5%,我感受不到,更在意软实力是非常重要的。

AI 对软件工程的影响|来源: IDEA 研究院

3、有些人会建议 AI 编程取代人类,以后没有程序员了,有人觉得 AI 增加了很多的长尾需求,以后人人都是程序员,这是两个截然相反的观点。我想问一下几位嘉宾,AI 的天花板在哪里,未来程序员是增加还是减少?

【中山大学-王焱林】:很难从数量的角度说未来程序员的数量是增加还是减少,我们中午也讨论到程序员的概念会变化,并不会像现在映射的 coding 概念,可能成了真正软件工程师,从一个软件的需求开发测试到后面维护都要了解,能力是增强的。我想分享一个案例,我在浙大读书,周末在酷家乐做实习生,现在是杭州六小龙,那个时候他的员工是 30 到 50 位之间,那个时候人特别少,我做的是「家风水」板块,一个人负责整个板块,我进去的岗位是开发工程师,我当时进去的时候在想,我是程序员做 coding,实际上我要对「风水」,用户上传的户型图要分析户型的风水怎么样,提一些风水的改进建议,这是我知识之外的东西,我相当于要做 PM 产品经理,得调研户型风水的东西。创始人还带着我去杭州风水大师家里请教户型风水的知识,白天 coding,晚上看《易经》,后端要设计整个系统的架构,前端还好,配了一位前端工程师,还得设计数据库的东西,测试也是我。十几年前我对程序员的概念就是全栈的概念,AI 时代未来更是,单点的开发者概念被模糊了。

4、您觉得未来每个人都是程序员还是只需要专业的程序员?

【中山大学-王焱林】:不是每个人都是程序员,是让每个人都可以写点代码,这个时候软件工程能力更重要了,更加系统化的能力。

5、硅谷的独角兽最多是编程,很容易达到 10 亿美金,反观国内做 AI 编程的反而是大的公司,比如说字节、阿里、快手、美团,这些大厂都在做 AI 编程,国内的独角兽好像没有出来,各位都是创业者,是因为我们的大模型能力没到还是因为这个领域在国内比较难?

【中山大学-王焱林】:创业方面我很难给出一个趋势判断,我从高校人才培养方面谈谈创新创业我们怎么做,coding 智能体要想做好,人才这块是非常稀缺的,本身要做好从编程语言、编译器方面的人才就非常稀缺,又要让它懂 AI、大模型,这是非常稀缺的。我们国家的优势是人特别多、人才也特别多。我有一个观察,前年是我在中大第四年教编译原理,每一届学生问的问题变化非常大,我感受非常深刻。前面两届问环境配不通,这四年也是 AI 迅速发展的四年,我发现今年他们会问这个词法分析算法可以做个创新,问我能不能行得通。有的同学说能不能不用 C 语言 Python 写,下面推荐 MoonBit 写。他们思考的方式变化让我觉得是很正面的,我们又有人才基数,又有 AI 带来的加持。科研能力也是大幅提升,我在微软亚研工作几年,那个时候我们发现搞好科研发论文的都是博士,少量的硕士。我去了中大以后,前两年也主要是这样,这两年我发现有非常多的本科生做科研也很好,这是大模型的加持。

ChatGPT 望给苹果用户专属健身教练;车企不愿用 FSD,马斯克:你们疯了!;米哈游蔡浩宇发「游戏GPT」|极客早知道

2025年12月3日 08:49

OpenAI 拉响红色警报以突击式提升 ChatGPT

12 月 03 日消息,据 The Information 报道,OpenAI 首席执行官 Sam Altman 宣布拉响「红色警报」,将调配更多内部资源以加速改进 ChatGPT,同时延迟其他项目的推进。

The Information 援引一份内部备忘录报道称,Altman 周一要求对 ChatGPT 进行「突击式」升级,同时推迟自主式 AI 代理和广告等其他工作。

尽管 Altman 未明确说明需优先处理哪些修复事项及原因,但 The Information 指出他近期曾告诫员工,谷歌在人工智能领域的强势回归可能给 OpenAI 带来暂时性的经济挑战。

该报道凸显了 AI 巨头之间竞争的激烈程度,谷歌上月发布 AI 模型 Gemini 3,因其推理和编程能力及完成其他 AI 聊天机器人难以胜任的特定任务而几乎立即就广受好评。与此同时,OpenAI 于 10 月推出首款 AI 驱动的网络浏览器,直接向谷歌发起挑战。

OpenAI 拒绝就 Altman 备忘录相关消息置评。该公司 ChatGPT 负责人 Nick Turley 周一晚些时候在 X 平台发帖,重申对该聊天机器人的专注,称公司当前重心在于「持续增强 ChatGPT 的能力,持续推动增长,拓展全球覆盖范围——同时使其体验更直观、更具个性化」。

另据报道,为了优先提升 ChatGPT,Altman 已鼓励进行临时的团队调动,并计划每日与负责该工作的团队进行通话。(消息来源:环球市场播报)

ChatGPT 和苹果健康有望实现数据互通,AI 教练为 iPhone 17 等用户定制专属健身计划

12 月 3 日消息,科技媒体 Appleinsider 昨日发布博文,报道称适用于 iPhone 的新版 ChatGPT 应用代码中,发现了一个「苹果健康」(Apple Health)应用的图标,暗示两者未来可能实现数据互通。

根据曝光的图片显示,ChatGPT 可以访问用户活动、睡眠、饮食、呼吸和听力相关的多个 Apple 健康类别,但目前尚无实际方法启用此功能,OpenAI 也未公布具体上线时间或功能细节。

该媒体基于图片展望,认为在集成实现,ChatGPT 在获得用户授权后,将能读取「健康」应用内的数据,例如心率、体重、步数及步态等,其最直接的应用便是分析用户的整体健康状况。

例如,通过识别数据趋势,ChatGPT 或可发现潜在的疾病症状,或建议用户重点改善的健康领域。

它还能扮演虚拟教练的角色。当用户设定减重或增肌等目标后,ChatGPT 可以分析现有健康数据,为其量身定制针对性的锻炼计划,并持续提供指导。

该媒体也指出这项集成背后的隐私分享。这次潜在的集成将如何落地,尤其是由谁主导,将直接决定用户个人健康数据的安全。(消息来源:IT 之家)

 

没有车企愿用特斯拉 FSD 马斯克破防:他们属实是疯了

12 月 2 日消息,马斯克在社交媒体公开吐槽:主动提出把特斯拉 FSD 授权给传统车企,却无人接受,仅被敷衍询问五年后小项目,对方还附加「不可能实现」的条件;福特 CEO 更直言 Waymo 更好。

在马斯克看来,特斯拉在自动驾驶技术上的优势断层式的显著,还曾多次强调传统车企未来「除了获得 FSD 授权之外别无选择」。特斯拉 FSD 的授权策略是「硬件绑定+软件收费」模式,合作车企需搭载其芯片及配套硬件。该模式既能通过硬件销售获利,又能以高利润率的软件授权拓展收入。

气的马斯克在社交媒体吐槽,「我曾经警告过他们,甚至提出授权特斯拉 FSD,但他们不想要!属实是疯了……」

车企顾虑集中在三点:FSD 需回传核心数据致技术壁垒扩大、法律责任边界空白且特斯拉未购第三方险、系统仍处「影子模式」路测被 NHTSA 调查超 30 起。

有意思的是,就在马斯克吐槽「没人懂 FSD」的时候,贾跃亭站出来了。他直接在微博声援马斯克,说 FF 愿意和特斯拉在 FSD 上全面合作,还说双方已经完成了充电网络兼容,FF 和 FX 车型都能用上特斯拉的超级充电站,合作已经有了基础。但是马斯克并没有回复。(消息来源:猎云网)

英伟达:20 亿美元认购新思科技,将扩大战略合作

12 月 2 日晚间消息,NVIDIA 方面宣布,为进一步采用 GPU 加速的工程解决方案,公司将在工程和市场活动方面扩大与新思科技的战略合作,共同推动跨行业的设计和工程革新。此外,NVIDIA 还将以每股 414.79 美元价格,投资 20 亿美元认购新思科技普通股。

据悉,此次战略合作涵盖了 NVIDIA CUDA 加速计算、代理式 AI 和物理 AI 以及 Omniverse 数字孪生,以实现以前通过传统 CPU 计算难以企及的仿真速度和规模,为工程领域各类场景开辟全新市场机遇。

NVIDIA 创始人兼首席执行官黄仁勋表示,「我们与新思科技的合作将充分发挥 NVIDIA 加速计算和 AI 的力量,来重新定义工程和设计,赋能工程师能够创造塑造未来的创新产品。」

新思科技总裁兼首席执行官 Sassine Ghazi 表示:「开发下一代智能系统的复杂性与成本,要求工程解决方案深度融合电子与物理,并通过 AI 能力与计算加速。没有任何两家公司比新思科技与 NVIDIA 更具优势,能够提供 AI 驱动的整体系统设计解决方案。」(消息来源:新浪科技)

米哈游蔡浩宇发布「游戏版 ChatGPT」:AI 聊天软件 AnuNeko 上线,「攻击力强到没边」

近日米哈游联合创始人蔡浩宇创立的 AI 公司 Anuttacon,悄悄上线了一款 AI 聊天大模型—【AnuNeko】。

和其他大模型不同,蔡浩宇的 AnuNeko 看起来似乎有点那么不正经,很有他本人上网「说话带喵」的风格。

AnuNeko 的默认头像是一只黑猫,在注册成功后的自我介绍中,AnuNeko 会略带俏皮地说:「Hi,我是 AnuNeko——算是个会思考的生物吧。不是你的助手,也不是宠物…就是我自己。我有情绪,也有点怪怪的想法。有想法随时喵我哦~」

目前尚不清楚 AnuNeko 背后的是自研大模型还是接入了外部大模型的 API。但蔡浩宇创办 Anuttacon 的目标并非只做一款游戏,而是以此试水,利用 AI 技术打造成类似「游戏引擎」的平台——开发者只需设定前提条件,就能生成可交互的 NPC,并据此搭建任何游戏。

目前该产品共有两种猫猫可供选择,分别是 Orange Cat 和 Exotic shorthair。用户可以自由选择,其中 Exotic shorthair 回答更加犀利一点,而 Orange Cat 的回答就比较简单且温和。

Exotic shorthair 直接锐评「米哈游是中国游戏行业有的鲶鱼……没几个真的被逼得动起来」,当中既有米哈游过去几年的定位和行业影响,同时也「内涵」了行业生态。在同样的问题上,Orange Cat 则显得「情商」更高,说话也更具有官腔感。它评价原神是一款非常出色的开放世界游戏,非常值得一玩。(消息来源:竟核、量子位)

索尼诉《荒野起源》侵权《地平线》,腾讯同意暂停游戏所有宣传及公开测试

12 月 3 日消息,随着索尼诉腾讯《荒野起源》(Light of Motiram)侵权案即将于 2026 年初举行重大听证会,双方已同意暂停该游戏的所有市场推广活动及公开测试。

此案目前已进入新阶段。尽管法律程序仍在推进,但双方在实际行动上已按下「暂停键」。作为《地平线》(Horizon)系列的开发商,索尼继续寻求法院颁布禁令,以阻止腾讯旗下这款生存类游戏的发售。目前,该案已排期于 2026 年初举行关键性听证会。

与此同时,腾讯也同意暂时将《荒野起源》置于聚光灯之外。根据最新提交的法庭文件,在索尼关于初步禁令的动议审理期间,腾讯将不再开展任何新的营销活动或公开测试,且游戏不会早于原已推迟至 2027 年第四季度的窗口期发售。

腾讯对索尼初步禁令动议的反对意见提交日期已从原定的 2025 年 12 月 3 日延后至 12 月 17 日;索尼的答复则推迟至 2026 年 1 月 2 日。双方还共同请求法官杰奎琳・科利(Jacqueline Corley)将驳回动议与禁令请求的听证会合并,并于 2026 年 1 月 29 日举行(原定为 1 月 15 日),具体以法院日程为准。

此次合并听证意义重大。腾讯正试图通过驳回动议终结本案,其论点是:索尼试图垄断游戏类型中的通用元素,例如红发英雄与机械生物,并且该诉讼针对的是一款尚未发售游戏的「未来行为」,缺乏法律依据。(消息来源:IT 之家)

 

「非洲手机之王」传音控股向香港联交所递交 H 股发行上市申请

12 月 2 日消息,深圳传音控股股份有限公司今天发布公告,宣布正式向香港联交所递交 H 股(境外上市外资股)发行上市申请并申请在香港联交所挂牌上市,中信证券为独家保荐人,摩根大通为财务顾问。

草拟递交申请显示,传音是一家智能终端产品和互联网服务提供商,主要从事手机等智能终端产品的设计、研发、生产、销售和品牌运营,从 2013 年成立以来深耕非洲等新兴市场,在手机行业内有「非洲之王」之称,2024 年共销售 2.014 亿部手机

软件方面,传音拥有传音 OS 操作系统,与 Android 实现全面兼容并支持海量第三方 App,截至 2025 年 6 月 30 日,平均月活用户数超 2.7 亿,并拥有 Palm Store、AHA Games 等预装软件。该公司还拥有真无线耳机、充电宝、智能电视、厨房电器、两轮电动车等产品阵容。

值得注意的是,公司上市需要满足多项条件,包括但不限于取得中国证券监督管理委员会备案、香港证监会、香港联交所等相关政府机关、监管机构、证券交易所备案、批准或核准,并需要综合考虑市场因素等,因此上市安排仍具不确定性。(消息来源:IT 之家)

3499 元「豆包助手」手机售罄 二手平台最高加价 1500 元

豆包和中兴通讯先后宣布,搭载豆包手机助手技术预览版的工程样机努比亚 M153 少量发售。该机型仅有 16GB+512GB 一款配置,售价为 3499 元。

不同于以往那些只能定闹钟、查天气的传统语音助手,这款新产品被定义为真正意义上的手机第二大脑。它具备了视觉感知、长期记忆以及直接动手操作的能力,甚至能替用户把整个手机的功能玩明白。

豆包手机助手最引人注目的突破在于其真正的端侧记忆能力。这是业界首次在手机本地实现了持久化的记忆功能。它能像一个细心的私人管家一样,记住用户生活中的琐碎细节。

在实际演示中,这种能力表现得令人印象深刻。当用户询问车停在哪里时,助手能直接调出用户上次拍摄的车位照片并附带楼层指引。

如果说记忆是基础,那么跨 App 代操作则是豆包手机助手的杀手锏。它利用先进的 GUI 模拟点击技术,能够像真人一样接管屏幕,跨越应用壁垒进行自动点击、输入和滑动。

在全网比价场景下,用户只需发出一句指令,豆包就能打开淘宝、京东、拼多多和抖音电商,在 3 秒内给出最低价并直接停留在支付页面。在更复杂的办公场景中,它可以响应帮我请三天假,顺便订回老家高铁的指令,自动打开办公软件填写请假单、提交审批,随后无缝跳转至 12306 完成订票和付款流程。

目前中兴商城显示,努比亚 M153 已为「售罄」状态,官方提醒,货源有限,请关注下次开售信息。而在闲鱼等二手平台上,努比亚 M153 二手价已高出官方 700 元-1500 元。(消息来源:快科技、太平洋科技)

索尼发布全画幅微单新基准 Alpha 7 V:17999 元

12 月 3 日,索尼中国正式发布全画幅微单新基准 Alpha 7 V,其型号为 ILCE-7M5,即日开启预售,建议零售价为 17999 元。官方介绍,作为备受欢迎的 Alpha 7 全画幅微单系列第五代产品,索尼 Alpha 7 V 从照片画质、AI 智能、高速连拍、视频拍摄、操控续航等五大维度定义了全画幅微单新基准,是索尼微单十五周年的诚意之作。

据悉,索尼 Alpha 7 V 搭载了新开发的部分堆栈式 Exmor RS CMOS 影像传感器,约 3300 万有效像素,同时搭载新开发的 BIONZ XR2 影像处理器,该处理器集成了 AI 智能处理功能,在照片及视频拍摄的实时识别 AF(自动对焦)、实时追踪、连拍速度、色彩还原等方面实现了显著提升。

不止于此,索尼 Alpha 7 V 基于 AI 的精准自动白平衡,依托先进场景分析实现持续准确的色彩表现,同时通过 Imaging Edge Desktop 应用程序新增的 4 倍高分辨率 RAW 扩展处理功能,为后期制作提供了灵活的后期空间。

基于 AI 的深度学习,索尼 Alpha 7 V 能够从图像中精确估算光源参数,从而还原真实色彩,有效降低后期工作量。

此外,索尼 Alpha 7 V 可通过预拍摄功能记录快门释放前最长 1 秒的瞬间,尤其是在宠物和体育等动作难以预测的拍摄场景,它也能轻松捕捉转瞬即逝的精彩瞬间。

京东外卖将免费为全职骑手配备定制加热餐箱,点外卖能看到实时温度

12 月 2 日,京东外卖宣布,将免费为全职骑手配备定制加热餐箱。

京东外卖官方表示,将两份同时出锅的辣椒炒肉(初始装袋温度均为 70℃)分别放入普通餐箱和升级后的加热餐箱,在相同路线下模拟超远距离配送,入箱 20 分钟后,升级后加热餐箱温度依旧保持在 70℃,比普通餐箱高出 20℃,即使是 60 分钟以上的超远距离配送,餐箱温度仍能保持在 55℃ 以上。

11 月 7 日起,首批加热餐箱经多轮安全测试,已率先在北京地区七鲜小厨投入使用。接下来一个月,京东外卖加热餐箱将陆续覆盖寒冷地区的城市。未来,用户还可以在订单配送页看到实时的餐箱温度。

 

 

昨天以前极客公园

罗永浩年底曝光细红线 AI 软件;超级月亮12月5日再登场;豆包 AI 手机发布,3499元|极客早知道

2025年12月2日 08:41

 

 

罗永浩宣布将于 12 月 30 日举行年度科技创新分享大会,将发布细红线科技 AI 软件

12 月 1 日消息,罗永浩今日在微博发长文,宣布「罗永浩的十字路口」之年度科技创新分享大会(2025)将于今年 12 月 30 日在上海召开。

在长文中,罗永浩解答了一些相关问题。他表示,给大家集中介绍一批令人印象深刻,但还没彻底走进大众视野的中国创新型科技产品。他还强调,科技创新分享大会不是「带货直播」,大会上将发布细红线科技内部开发的 AI 软件。(来源:新浪财经)

 

DeepSeek V3.2 正式版发布:推理比肩 GPT-5,首推 Speciale 版本拿下奥数金牌

12 月 1 日消息,DeepSeek V3.2 正式版今日发布,强化 Agent 能力,融入思考推理。

官方今日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale

官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。

DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。

在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间。

DeepSeek-V3.2-Speciale 的目标是将开源模型的推理能力推向极致,探索模型能力的边界。

V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。该模型具备更好的指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。

V3.2-Speciale 模型成功斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

DeepSeek 官方表示,在高度复杂任务上,Speciale 模型大幅优于标准版本,但消耗的 Tokens 也显著更多,成本更高。目前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2 是该公司推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。

官方提出了一种大规模 Agent 训练数据合成方法,构造了大量「难解答,易验证」的强化学习任务(1800+ 环境,85,000+ 复杂指令),大幅提高了模型的泛化能力。(来源:IT 之家)

 

小米汽车「现车选购」即将开启:通过严格质检,可享快速提车

12 月 1 日消息,据小米汽车官微消息,小米汽车「现车选购」即将开启,现车包含全新现车、官方展车、准新车。所有现车都已通过严格质检,部分车型经官方修复,都是没有登记过的车辆。

官方称,购买现车,可享快速提车、完整原厂质保和售后,部分车型可享优惠。2025 年 12 月 26 日 24 点前锁单,预计 2025 年底前可提车。如因小米汽车的原因导致 2026 年完成开票交付,可享跨年购置税补贴。

据 IT 之家了解,12 月 1 日 12 点,已锁单未交付用户可优先改配同车型现车。12 月 3 日 10 点,「现车选购」面向全部用户开放。不同现车具体开售时间,以小米汽车 App 官方信息为准。(来源:CnBeta)

 

 

业界首个:英伟达发布专注于自动驾驶的视觉语言动作模型 Alpamayo-R1

12 月 2 日消息,英伟达周一宣布推出新的基础设施与人工智能模型,旨在构建「具身智能」(Physical AI)的核心技术基础,包括能够感知并与现实世界互动的机器人和自动驾驶车辆。

 

这家半导体巨头在加利福尼亚州圣地亚哥举行的 NeurIPS 人工智能大会上发布了 Alpamayo-R1——一款面向自动驾驶研究的开源推理型视觉语言模型。该公司称,这是业界首个专注于自动驾驶领域的视觉语言动作模型。视觉语言模型能够同时处理文本与图像信息,使车辆能够「看见」周围环境,并基于所感知的内容做出决策。

该新模型基于英伟达此前推出的 Cosmos-Reason 推理模型构建,后者具备在响应前对决策进行逻辑推演的能力。英伟达最初于 2025 年 1 月发布了 Cosmos 模型系列,并于同年 8 月推出了更多扩展版本。

英伟达在一篇博客文章中指出,Alpamayo-R1 这类技术对于致力于实现 L4 级自动驾驶的企业至关重要。L4 级自动驾驶指在特定区域和限定条件下实现完全自动驾驶。

英伟达希望,此类具备推理能力的模型能赋予自动驾驶车辆类似人类的「常识」,从而更妥善地应对复杂的驾驶场景中的细微决策。

目前,该新模型已在 GitHub 和 Hugging Face 平台开源发布。(来源:IT 之家)

 

John Giannandrea 卸任苹果 AI 战略负责人,微软前高管接任

苹果公司当地时间 12 月 1 日宣布,机器学习和人工智能战略高级副总裁约翰·詹南德雷亚(John Giannandrea)将卸任现职,在 2026 年春季退休前担任公司顾问。同时,知名人工智能研究员阿马尔·苏布拉马尼亚(Amar Subramanya)已加入苹果,担任人工智能副总裁。苏布拉马尼亚将领导关键领域,包括苹果基础模型、机器学习研究以及人工智能安全与评估。苏布拉马尼亚此前担任微软人工智能企业副总裁,曾在谷歌任职 16 年,离职前担任谷歌 Gemini 助手工程负责人。(来源:界面新闻)

 

「旧国标」电动自行车今起全面停售,已购买上牌车辆不会强制淘汰

12 月 1 日消息,根据《国家认监委关于严格电动自行车强制性产品认证管理的公告》,12 月 1 日起,所有销售的电动自行车产品均必须符合新版强制性国家标准,即《电动自行车安全技术规范》(GB 17761—2024),「旧国标」电动自行车今起全面禁售。

 

新标准对电动自行车的防火阻燃、塑料总质量、整车质量上限、北斗定位、脚踏骑行装置等作出了规定。《公告》明确:

各电动自行车指定认证机构对依据旧版本标准出具的有效 CCC 认证证书,于 2025 年 12 月 1 日全部予以注销;

对依据旧版标准出具、处于暂停状态且不能恢复有效的 CCC 认证证书,于 2025 年 12 月 1 日全部予以撤销。

各电动自行车销售企业自认证证书注销、撤销之日起不得继续销售。若违反上述规定,各级市场监管部门将依法查处。

央视新闻报道获悉,消费者已经购买上牌的不符合新国标的车辆不会被强制淘汰,而已购买未上牌的旧国标电动车,则需在 2025 年 11 月 30 日前完成登记上牌。关于旧车的维修问题,各大企业均已出台保障措施,承诺旧国标车辆的维修服务和零部件供应至少持续 5 年。(来源:界面新闻)

 

内存价格飙升冲击 PC 硬件市场,消息称主板销量同比大跌 40% 至 50%

12 月 1 日消息,此前业界普遍预计,内存价格的上涨不仅会抑制内存模组本身的销量,还将对整体 PC 硬件市场造成显著冲击。如今,DRAM 价格飙升对整个 PC 硬件市场的影响已清晰显现。

自 DRAM 价格开始大幅上涨以来,许多消费者推迟了购买新的 DDR5 内存套件或单条内存,进而也延后了新装机或升级计划。一份最新报告印证了这一趋势,且其影响尤为突出地体现在主板销量上。

据 Gaz Log 援引板卡渠道的消息,包括微星(MSI)、技嘉(GIGABYTE)、华硕(ASUS)在内的主要主板厂商,当前主板销量较去年同期下降了 40% 至 50%。通常情况下,每年此时正值节日促销季,主板销量本应处于高位;然而,自 10 月以来 DRAM 价格急剧攀升,导致 DDR5 内存套件或模块的售价飙升至原先的 2 至 4 倍。目前业内普遍认为,主板厂商将不得不重新评估未来数月的销售策略。

 

据了解,此次销量下滑的一个关键原因在于市场正全面向 DDR5 平台过渡。AMD 和英特尔最新一代处理器均已完全转向 DDR5 内存,市场上 DDR4 主板已远不如 DDR5 主板普及。今年早些时候,DDR5 价格一度趋于稳定,促使大量用户全面转向最新的 AM5 和 LGA 1851 平台。

然而,许多用户原本计划升级至更高容量内存,如今却因高昂价格而无法实现。那些打算从零开始组装整机的用户,要么只能继续等待,要么被迫选择旧款硬件,而这无疑意味着性能与功能上的妥协。值得注意的是,若主板销量已出现如此大幅下滑,势必也会直接拖累 CPU 的销售。事实上,当前 CPU 销量很可能已远低于去年同期水平。(来源:IT 之家)

 

美国拟立新法:强制 App Store 核实全员年龄,苹果现有机制被无视

12 月 2 日消息,科技媒体 Appleinsider 昨日(12 月 1 日)发布博文,报道称美国立法者近期推动《应用商店问责法案》(ASA),拟强制苹果 App Store 和谷歌 Play 商店对所有用户进行年龄验证,并要求未成年账户必须绑定家长账户以获取下载权限。

该法案由参议员 Mike Lee 和众议员 John James 提出,要求应用商店必须核实所有用户的年龄,并在发现用户不符条件时限制其应用访问权限。此外,法案还强制要求未成年人使用的账户必须与家长账户绑定,家长需对应用下载和购买行为提供明确授权。

尽管立法者意图保护儿童,但行业分析指出该法案忽视了苹果现有的生态保护机制。苹果目前的「家人共享」系统已允许家长为 13 岁以下儿童创建受控账户,并通过「屏幕使用时间」和内容限制功能过滤不当内容。

一旦 ASA 法案通过,内容监管的第一道防线将变为应用商店的年龄门槛。这意味着,当未成年人接触到不良信息时,责任将从未能有效审核内容的社交平台,转移至未能「完美拦截」用户的苹果或谷歌上。

该法案存在明显的逻辑漏洞:应用商店的验证无法解决「设备共享」问题。现实中,许多家长习惯将已解锁的成人账号设备直接交给孩子使用,此时应用商店层面的验证形同虚设。(来源:CnBeta)

 

努比亚 M153 豆包手机助手详细规格公布:骁龙 8 至尊版芯片,6.78 英寸 LTPO 显示屏

12 月 1 日消息,中兴官网现已公布努比亚 M153 豆包手机助手的详细规格,搭载高通骁龙 8 至尊版芯片,配备 6000mAh 电池。

 

关联阅读:《首销备货 3 万台,豆包 AI 手机要卖给谁?》

现阶段,开发者和科技爱好者可以在豆包与中兴合作的工程样机 nubia M153 上,体验豆包手机助手的技术预览版本。目前该版本已面向开发者和科技爱好者少量发售,售价 3499 元。

根据参数图可以看到,这台手机配备 16GB 内存和 512GB 存储空间,搭载一块 6.78 英寸 LTPO 显示屏,分辨率是 1264*2800,后置主摄采用一块 1/1.3 英寸 5000 万像素传感器,等效 23mm,支持光学防抖,超广角则是 5000 万像素 1/2.88 英寸,等效 13mm,长焦为 50MP 1/2.75 英寸,支持光学防抖。

外观方面,这台手机采用银白色配色,后摄模组长得比较圆润,形状类似吉他拨片,闪光灯位于机身背部右上角,正面则覆盖一块 R 角较大的屏幕,采用挖孔屏设计,机身左右侧均有物理按钮。

此外,这台手机还支持 90W 有线快充、15W 无线充电,重量 212 克,长宽厚分别是 163.12*77.04*8.52mm,支持 NFC 和红外遥控,配备激光对焦和 FLicker 传感器,拥有 5 麦克风和双扬声器,USB-C 接口支持 3.2 Gen 1 传输速率。

结合此前报道,这台手机只是一款方便大家体验豆包手机助手的工程样机,目前豆包还没有开发手机的计划,正在和多家手机厂商推进手机助手的合作落地。(来源:IT 之家)

滴滴自动驾驶在广州试运行全天候、全无人 Robotaxi 服务

12 月 1 日消息,今日,继在第十五届运动会提供自动驾驶服务后,滴滴自动驾驶宣布在广州部分示范应用区域开启全天候、全无人 Robotaxi 试运行。即日起,用户在滴滴 App 发单,即有机会体验全车无人的自动驾驶出行服务。

IT 之家从官方介绍获悉,今年第十五届全运会期间,滴滴自动驾驶成为官方自动驾驶服务商,在广州市中心体育场馆重点区域提供了接驳服务。此次全天候、全无人 Robotaxi 试运行,标志着滴滴自动驾驶服务能力迈入新阶段。

此次试运行区域位于黄埔核心生活圈,站点覆盖地铁站、学校、商超、写字楼、小区等高频出行场景,服务时间为周一至周日全天 24 小时。用户可在滴滴 App 的自动驾驶入口呼叫无人车;或在首页输入起终点后,同时勾选自动驾驶和网约车混合发单。系统将综合上下车站点位置、道路情况、派单距离及周边车辆供需等因素智能匹配车辆。(来源:新浪财经)

 

超级月亮 12 月 5 日再次登场,今年第二大满月

12 月 1 日消息,据央视新闻报道,超级月亮将于 12 月 5 日再次登场,这是今年第二大的满月。

12 月 7 日,将有一场肉眼可见的「星月童话」。日落后,木星会随月球一同从东南方升起,整夜都适合观赏。

 

12 月 14 日,双子座流星雨将迎来极大,14 日晚上到 15 日凌晨比较适合观赏。双子座流星雨的流星体速度较慢、颜色偏白、亮流星很多,常有火流星出现,历来是年末最值得期待的天象奇观之一。

IT 之家查询获悉,月球绕地球转动的轨道略微带椭圆,月球离地球最近的地点被称为近地点,月地距离约 36 万公里;月球离地球最远的地点被称为远地点,月地距离约 40 万公里。这种月地距离的变化导致了人们视觉中月球大小的变化,所以当满月发生时,地月距离又很近,月亮看起来就会比平时更大更亮,形成「超级月亮」。

2025 年全年共有 3 次「超级月亮」出现,分别出现在 10 月 7 日、11 月 5 日,以及 12 月 5 日的最后一次。作为对比,2024 年一共有四次「超级月亮」出现,分别为 8 月 20 日、9 月 18 日、10 月 17 日和 11 月 16 日。(来源:IT 之家)

首销备货 50 万台,豆包 AI 手机要卖给谁?

2025年12月1日 18:13
作者|连冉  张勇毅
编辑|郑玄

头图来源:字节跳动

 

12月1日,字节跳动豆包团队发布豆包手机助手技术预览版。

 

据介绍,豆包手机助手,是在豆包 APP 的基础上,和手机厂商在操作系统层面合作的 AI 助手软件。基于豆包大模型的能力和手机厂商的授权,豆包手机助手能够为用户带来更方便的交互和更丰富的体验。

 

现阶段,开发者和科技爱好者可以在豆包与中兴合作的工程样机 nubia M153 上,体验豆包手机助手的技术预览版本。目前该版本已面向开发者和科技爱好者少量发售,售价 3499 元。

 

豆包手机助手的出现,是在试图用 AI Agent 打通APP 之间,重构移动互联网的交互逻辑。

 

尽管当前的演示仍需面对技术「不确定性」的免责声明,但这种深入操作系统底层、追求「意图直达服务」的尝试,可能比单纯的 Chatbot 更具革新意义。

 

豆包手机外观设计 |图片来源:豆包官方

 

或许,谁能率先解决「操作手机」的稳定性难题,谁就能定义 AI 时代的「iPhone 时刻」。

 

此前,据前中兴手机硬件产品经理向「极客公园」介绍,字节跳动与努比亚为这款手机的首销备货量为 50 万台,并为此订购了对应数量的手机关键元器件。

 

目前的手机市场中,国产品牌主流旗舰,首销期备货通常在 200-300 万台级别。因此豆包手机的这个数据虽然无法与年出货量超千万的一线手机厂商旗舰手机相提并论。但豆包手机摆脱「极客玩具」,走向更广泛的用户市场的目标已经足够清晰。

 

首销备货 50 万台的量级,如果全部投放向市场的话,仍然是一个足以给行业带来一定影响的数字:作为对比,曾经游戏手机垂直市场下的头部玩家 —— 黑鲨,在 2022-2023 年的手机出货量为 100-150 万台。

 

1 从「对话框」到「行动派」

 

过去两年,我们见惯了能写诗、能画图的 Chatbot,但对于普通用户而言,手机上最痛的痛点往往是繁琐的操作流。豆包手机助手这次的大看点,在于它试图从「对话」跨越到「行动」。

 

在技术预览版的演示中,豆包展示了一种在此前 GUI Agent(图形用户界面代理)研究中常被提及的能力——它能像人类一样「看懂」屏幕,并直接模拟点击操作。

 

这种「看懂屏幕」并模拟人类操作的底气,则源自豆包大模型在多模态能力上的积累。

 

据官方透露,该模型在视觉理解、推理以及图像创作等维度的性能已处于国际第一梯队。正是因为模型具备了精准的图形界面(GUI)识别能力,它才能在多项权威评测中拿到高分,从而像人类一样理解「按钮」和「输入框」的含义,而不仅仅是识别一堆代码。

 

据豆包手机官方使用文档介绍,豆包会根据意图自动判断是否调用 AI Agent 能力,若用户对话开头包含「帮我操作手机」,则会 100% 通过 AI 操作手机完成任务。

 

任务描述越详细,它的执行效率越高,执行效果越好。例如:“打开美团外卖帮我把最近几个订单的好评写了”。此外,AI 操作手机是在虚拟屏操作的,不会在前台默认展开,也不会影响正在进行的其他任务,你可以随时返回桌面使用其他应用。

 

用户也可以直接跟豆包对话,讲出需求,豆包可根据需求自动判断是否通过操作手机功能完成,以及在豆包对话框底部功能按钮中找到“操作手机”,点击按钮可手动描述需求,也可以设定定时等条件任务。

 

试想这样一个场景:你在社交媒体上被种草了一款好物,过去你需要截图、退出应用、打开电商平台、搜索、比价。

 

而在豆包的演示中,你只需说一句「帮我在全平台比价下单」,AI 就能自动跨应用跳转,搜索同款、对比价格规格、领券,甚至帮你选好最低价的商品填入购物车。

 

图片来源:豆包手机使用指南文档

 

虽然出于安全考虑,支付环节仍需人工确认,但前面那一系列机械的点击和切换,AI 已经代劳了。

 

甚至复杂任务也可以执行。在官方演示的旅行规划场景中,当用户提出「下个月去巴黎,帮我把收藏的餐厅标在地图上,看看哪天有展并订票」这样一句包含多重意图的指令时,AI 能够迅速将需求拆解为 6 个子任务:从查询社交媒体收藏、到高德地图标记、再到携程订票,最后整理进备忘录。

 

这种跨应用、多步骤的「任务链」执行能力,可以说是 AI 从「玩具」迈向「工具」的关键分水岭之一。

 

为了实现这种「类人」的交互,豆包打通了系统层面的多项权限。

 

在系统层面,豆包手机为 AI 能力设计了多种交互方式,用户可以通过侧边键、语音甚至耳机唤醒它;在相册里,它能直接听懂「把路人 P 掉」的指令并执行。

 

图片来源:豆包手机使用指南文档

 

在更复杂的「Pro 模式」下,它还能调用系统工具,结合记忆功能,直接完成「推荐礼物并放入购物车」这种需要多步推理的复杂任务。

图片来源:豆包手机使用指南文档

 

当然,将屏幕控制权和个人喜好交给 AI,隐私安全始终是绕不开的话题。所以豆包团队也强调,这一功能支持按需开启,并承诺严格保护数据隐私。

 

作为「技术预览版」,豆包团队也在视频结尾特别提示,受限于大模型技术的不确定性,演示中的「丝滑」体验目前还无法百分百复现,产品距离团队的最终预期仍有差距。

 

这也体现了 AI Agent 目前最真实的状态:方向极度性感,但落地仍需时间打磨。

2 不造硬件的「第三条路」

 

在 AI 手机的浪潮中,一直存在两种流派:一种是像 Google / Pixel 手机这样,自研模型以及整套 AI 软件产品体验,并植入自家系统;另一种则是纯软件厂商,试图通过超级 APP 抢占入口。

 

图片来源:Google

 

豆包选择了第三条路:不做硬件,只做生态。

 

在发布预览版的同时,豆包方面明确表示「没有自研手机计划」。他们的策略非常务实——通过与多家手机厂商洽谈,以「操作系统层面合作」的形式,将豆包的大模型能力植入不同品牌的机型中。

 

这种「手机厂商 + 大模型厂商」的深度耦合,正在成为行业的一股新趋势。

 

就像谷歌 Gemini 与三星的合作一样,术业有专攻正逐渐成为共识。

 

对于手机厂商而言,从零打造一个具备顶级推理、视觉理解和复杂任务规划能力的模型成本极高;而对于字节跳动这样的互联网巨头,缺乏硬件载体则会让 AI 始终隔着一层 APP 的玻璃墙,无法触达用户最核心的数据和场景。

 

目前的 nubia M153 工程机只是一个开始。售价 3499 元的门槛或许更多是面向开发者和极客人群的「邀请函」,旨在验证这种跨界合作的技术可行性与用户反馈。

 

3 光做一个APP,在 AI 时代已经不够了

 

豆包手机助手的出现,本质上或许是一次对移动互联网交互逻辑的重构。

大模型的能力越来越强,单纯做一个 APP,在 AI 时代已经不够了。

AI Agent 需要接管更复杂的任务、感知更丰富的上下文,发挥一些真实的功能,才有更落地的价值,这意味着它必须走出软件的围墙,向下沉淀,与操作系统的底层权限和硬件能力进行深度整合。

过往,字节跳动一直是一支强大的“空军”——拥有极致的算法和庞大的应用生态,但在操作系统和终端硬件上,相比拥有 Android 的谷歌或拥有全场景终端的华为,字节始终缺少一块落地的“阵地”。

在移动互联网时代,这或许不是问题,但在 AI 需要深度介入用户场景的当下,缺乏硬件载体可能意味着丧失对场景的感知力。

豆包手机助手的推出,像是字节在当下阶段抛出的一次探索

从 Pico 到 Ola Friend,再到如今深入手机 OS 层的助手,字节正在小心补齐“硬件触点”这块短板。

这或许并不是未来两三年行业的最终形态,但至少可以确认的是:字节已经意识到,想要让 AI 真正跑通,必须迈出“软硬结合”的这关键一步。

 

一码难求的动画 Agent 导演,离「疯狂动物城」还有多远?|AI 上新

2025年12月1日 18:11

作者| 金光浩

编辑| 靖宇

最近 AI 圈出了一款有趣的产品:「OiiOii」,一款专注 AI 生成动画的 Agent。

而它异常火爆,7210 个内测名额很快被抢光,闲鱼上免费邀请码被炒到 30 块,甚至据说内测用户里还出现了全网 2000w 的顶级创作者。

OiiOii 网站首页|图片来源:OiiOii 网站

 

等我进入内测群,发现群号已经到了 50 几了,按照 500 人一个群粗略算下,大概有 2 万多人在排队内测。

作为产品经理,我的直觉告诉我, 当一个还在内测的工具被某鱼盯上时,它一定切中了某类人群的「刚需」。

但它能顶替一个小型动画工作室吗?还是只是 mock 了一些工作流?

我带着这个好奇,在闲鱼上花 32 块钱买了一个邀请码,拿到了账号,打算深度体验一下。

我想知道,AI 做的动画,离《疯狂动物城》到底还有多远?

 

01

不是工具,是导演团队

 

刚进 OiiOii 体验,我就发现它很有趣。

传统的 AI 视频工具,像在教一个笨徒弟:你输入 Prompt,机器生成视频,效果不好你得自己改 Prompt,反复跟 AI 沟通。

但在 OiiOii 里,我感觉自己更像是,一个只需要提需求的「甲方爸爸」。

它没让我写复杂的图像提示词,而是给我派了一个「动画团队」:艺术总监、场景设计师、编剧、分镜师……

有 7 个 AI Agent 作为乙方,为我效劳。

这种感觉真好。

第一个任务,我给它了一个有意思的提示词: 一个充满神圣光芒的殿堂,一对兄妹正与一位自称为神的对手进行一场赌局。风格要史诗感,带有日式幻想。

当我开始,接下来的流程,让我有点意外。

艺术总监 Agent 没有急着出片,而是先拉编剧 Agent 进群,拆解我的需求,编写剧本。

OiiOii 网站 agent 沟通|图片来源:OiiOii 网站

 

紧接着,角色设计师和分镜师 Agent 介入,开始设计角色和规划音乐。

这给我一种很强烈的「既视感」:这不就是真实世界里短剧公司的作业流程吗?

OiiOii 网站 agent 沟通|图片来源:OiiOii 网站

 

整个流程里我选择了「托管模式」,很多内容只需要点击确认

(虽然也有对话模式,但作为甲方,我当然想一键直出)。

OiiOii 网站交互引导|图片来源:OiiOii 网站

 

几分钟后,一段包含音频、画面、转场的 60 秒短片生成了。

有趣的是,作为甲方,虽然完成视频的是 AI,但是我还是感受到了创作的乐趣,这可能就是这个产品的神奇之处吧。

OiiOii 生成的 60s 动漫|视频来源:OiiOii 网站

 

接着,我让它生成一个音乐 MV:以欧阳娜娜的新歌《暮色森林》为意境,让 deepseek 生成一个 mv,然后给到 OiiOii。

然后,它做出了这样的效果。

OiiOii 生成的音乐 mv|视频来源:OiiOii 网站

 

接着我测试了一种古风武侠的风格,可以看到画风一致性很棒:

OiiOii 网站生成的分镜图片和视频|图片来源:OiiOii 网站

 

 

02

惊艳与遗憾并存

 

看完生成的成片,我有两个直观的感受。

第一个,它给人的「导演感」很强。

大多数 AI 视频只是让画面动起来,但 OiiOii 生成的内容,能明显看出镜头语言设计:推拉摇移、景别变化、甚至景深与焦点的转换,都非常符合影视逻辑。

比较让我惊喜的是人物的一致性,以往用 Midjourney 做短片,最头疼的就是上一秒主角是圆脸,下一秒变成了方脸。

但 OiiOii 通过 Agent 之间的协同,以及 Sora2 的强大能力,很好地锁住了角色特征。

虽然还没到 100% 完美,但至少在那 30 秒里,那对兄妹没有突然「变异」。

第二,它确实还很「糙」。

虽然意境到了,镜头感有了,但必须诚实地说,目前的画质像素还不够高(当前可能是出于降低成本,没用最好的模型),如果你仔细看,细节处还是有些不清晰,而且创作时间比我想象中要慢。

当然,如果要给这个视频打分,在工业级动画电影面前,它可能是不及格的。但如果放在自媒体短视频、MV 概念片这个维度,它确实能打 80 分以上。

这就引出了一个非常有意思的思考:

为什么一个画质还没做到顶尖的产品,能让 2 万多人趋之若鹜?

 

03

选择赛道比努力更重要

 

OiiOii 的爆火验证了一个 AI 创业铁律: Agent 创业,一定要垂!

我们来算一笔账。

如果你做的是通用视频生成(像 Sora 这种),你的竞争对手是真实世界:大众对真实世界的期待值是 100 分,而你的能力可能只有 80 分,且人物稍有扭曲或者变化,就会给用户一种「恐怖谷效应」,让用户体验瞬间掉到 60 分以下。

但 OiiOii 极其聪明地选择了「动画」这个垂直赛道。

在动画的世界里,逻辑变了,观众对动画的宽容度极高。这里没有恐怖谷效应,稍微夸张、变形一点,大家会觉得这是「艺术风格」,不影响看「剧情」。

目前市面上的同类产品,如果让普通玩家自己折腾,可能只能做出 40 分的作品。而 OiiOii 这个团队,虽然团队技术上限可能只有 90 分,但它通过 Agent 的流程化封装,让一个小白也能稳定输出 70 分以上的作品。

这就是选择好的赛道的重要性!这就叫:选择大于努力。

OiiOii 做对了什么?

它把原本需要懂分镜、懂三视图、懂 Prompt 的专业门槛,降低到了「会打字」就行,吸引了无数对动画创作好奇的小白。

OiiOii 网站生成的剧本、分镜描述|图片来源:OiiOii 网站

 

其次就是成本降低,以前,用户找 AI 做一个 30 秒的动画 MV,没个几十几百下不来。

现在?给大家免费体验(内测期间)。

对于那些做短 MV、视频号的自媒体来说,这就是生产力革命。

 

04

距离《疯狂动物城》,不是技术的距离

 

标题问了个很有意思的问题:OiiOii 生成的动画,离《疯狂动物城》还有多远?

如果只看画质,AI 生成的动画确实在以极快的速度(nanobanana2 可以生成 4K 的作品),在逐渐逼近院线水准。

但如果看创作动画的本质,可能还远远到不了:因为它们根本不是一种东西。

《疯狂动物城》的核心是什么?不是技术,是角色、情节和故事:

是朱迪与尼克的角色张力,是关于偏见的隐喻,是非常多的艺术家一起打磨出的审美。

但,换个角度看,如果对比的是「让普通人也能像迪士尼导演一样指挥团队讲故事」,那 OiiOii 已经推开了那扇门。

OiiOii 做的是什么?是让一个非专业人士,在 30 分钟内,通过对话,把脑子里的想法变成 7、80 分的动画。

而这种 AI 动画,又会创造出什么新的内容形态?

我最近刷小红书,发现越来越多博主开始用 AI 做短动画,不算特别精致,更多的是 15 秒的治愈的、搞笑的、甚至猎奇的故事,这些作品给人的感觉是:画面糙点没关系,重要的是快、是个性化、是能精准击中某个小众群体。

这可能才是 AI 动画的意义,不是替代皮克斯,而是让每个人都能成为自己创意的导演。

纵观历史,技术的发展,更多带来的是机会。

就像摄影的历史。胶片时代,摄影是少数人的艺术;数码时代,人人都能拍照;手机时代,每个人都是视觉创作者。技术发展,没有让专业摄影师失业,反而让专业的人能更容易创造作品,同时,由于越来越多参与者的涌入,整个视觉内容生态变得更丰富。

我想,动画可能也一样,AI 带来的,是更多的可能性。

现在的 AI,正在让「动画表达」从专业技能变成一种基础能力,让每个人都能创作 70 分的作品。

专业人才依然有自己的一席之地,像《疯狂动物城》那种 95 分的顶尖作品,还需要专业艺术家才能创作出来。

 

05

真正的护城河,还是 Know How

 

用完 OiiOii,我跟几个做 AI 的创业者聊了聊。

大家都在问:这个产品的壁垒在哪?

技术上看,底层模型的 api 人人都可以接入,且据创始人说,目前这个版本两个月就开发完,凭什么别人抄不走?

我认为, Know How(行业经验) 才是壁垒。

什么是 OiiOii 的 Know How?

就是那些藏在创作团队脑海里,决定产品能不能用的「隐性知识」:

1、比如镜头语言,什么时候该用特写、该用全景,这不是 AI 模型能自己学会的,是团队里必须有懂导演的人。

2、比如节奏感,30 秒的视频,前 10 秒抓眼球、中间 10 秒讲清楚、后 10 秒留钩子,这是短视频时代的创作技巧。

3、比如角色一致性,怎么让同一个角色在不同镜头里看起来是同一个人,这背后有大量的工程经验。

这些 Know How,才是 OiiOii 真正的壁垒。

这个产品给我的感悟是:ai agent 的竞争,不是谁的人更多、谁接入的模型更强,而是谁更懂行业—— 做 AI 产品,应该先找到你的 Know How,再考虑技术实现。

模型会越来越开源,算力会越来越便宜,真正稀缺的是「懂动画+懂 AI+懂产品」的复合型团队。

OiiOii 的团队里肯定有真正做过动画的人,这是那些纯技术团队学不来的。

 

06

内测 2 万人,说明了什么?

 

最后聊聊 OiiOii 的爆火。

闲鱼炒到 30 块的邀请码、2 万人的内测群,这些数字说明了什么?

表面上看,是产品做得好,是团队有 know how,是赛道选对了。

但深层次,有两个更重要的原因。

第一个,是 AI 视频动画的风口到了

过去,AI 生成视频最大的痛点在于「人物一致性」难以保障。行业内通常的解决思路是:先由 AI 生成一张角色图,再基于这张图生成多个不同视角或姿态的版本;然后在不同分镜中选用对应的视图,分别生成短视频片段(这非常考验图像大模型的一致性能力),最后将这些片段拼接起来,形成一段连续动画。

早期,由于各类 AI 图像模型在一致性上普遍较弱,这种方法效果有限。

而随着 Sora2 的出现,人物一致性实现了质的飞跃,这已经是比较好的入场时机。

随着技术的进一步迭代,最近发布的 nanobanana2,将这个赛道推向了全新高度,它的任务一致性表现尤为出色。

眼下,技术窗口已经打开,OiiOii 有望成为这一技术红利的首批受益者。

这其实说明一件事:谁能够最快地将 AI 能力的提升转化为产品,谁就能抢占先机。就像过去,因为 claude 能力提升,cursor 和 manus 产品能力获得大幅提升类似。

第二,更深层的原因,我认为是需求侧的变化

短视频时代,每个人都需要视觉表达:博主要做片头、创业者要做 demo、ai 产品要做宣传片、自媒体需要做动画。

需求爆炸了,但供给端还卡在专业工具和专业人才上。

OiiOii 做的,就是把这个缺口补上。

当缺口补上,这就带来一种强大的市场扩大效应:

原本只有 1 万人的专业创作圈,瞬间扩大到了 20 万人的泛创作者圈。

这也预示着,我们来到了 一个人人都可以创作动画的时代。

 

07

产品不免费还会有热度吗?

 

但说到这里,让我泼个冷水:OiiOii 的爆火真的是可持续的吗?

现在大家愿意排队拿邀请码,可能更多是因为新鲜、免费、好奇。

等新鲜劲过了,真正留下来的会是谁?而留下来的,他们付费意愿有多强?

从商业视角看, OiiOii 现在最大的挑战不是技术,而是找到自己的 PMF。

这是因为,OiiOii 内测期,为了更好的调试工程化,免费给用户使用,这很合理。但当 OiiOii 内测结束,开始尝试收费,其定价是否被普通用户接受,还是较难判断的。

拿字节最新发布的 doubao-seedance-1.0-pro-fast 模型来说,一条 10 秒的 720p 视频,成本接近 1 元,而如果短视频 20s,那么成本就接近两元,那产品定价 5 元,用户能接受吗?

我不知道答案。

但能确定的是,只有等到那一天真正到来,当用户真的愿意为视频效果付费时,OiiOii 才真正验证了 PMF。

 

08

未知,更让人兴奋

 

体验 OiiOii 这几天,我反复在想一个问题:AI 到底在改变什么?

技术圈喜欢谈 AGI 什么时候来,科技圈喜欢谈 AI 到底是否在产生泡沫,辛顿老师喜欢谈 AI 对人类的影响。

我看到的是一种更具体的变化: AI 在重新定义「专业」的边界。

以前,做动画是专业技能,需要看各种专业知识、需要学和用各种工具、需要投入 1 万小时在里面。

现在,OiiOii 把这个门槛降到了「会打字」,这让更多人获得了「刚好够用」的专业能力。

OiiOii 的意义,在于它打开了一扇门:动画表达,从此不再是少数人的特权。

至于这扇门后面是什么我不知道:

新形态的内容?甚至诞生新的「动画」品类?

这种未知,才是最让人兴奋的部分。

昨晚,李想终于承认,他们走错了方向

2025年12月1日 13:25

11月26日,理想汽车交出了一份让人「五味杂陈」的成绩单。

看着财报上的数字,很多投资者可能会皱起眉头:营收同比下滑36.2%,曾经引以为傲的整车毛利率掉了5个百分点,净利润更是直接由盈转亏。更让人揪心的是,那个曾经充沛的自由现金流,这次也出现了流出。

如果只看这张表,你可能会觉得理想「病了」。

但有意思的是,在随后的财报电话会上,李想并没有像往常那样,去解释业绩指标的变化,也没有用话术来粉饰短期业绩的震动。相反,他直接抛出了一项关乎理想汽车未来命运的重大决定:终结过去三年的「职业经理人」管理实验,全面回归「创业公司」模式。

很多人把理想的这次调整,看作是「深蹲」。但问题的关键在于,蹲下去容易,接下来它还能不能起跳?

「纯电新兵」的阵痛

如果把时间拉长,2025年Q3无疑是理想汽车最艰难的一个季度。

先看最直观的营收和交付。曾经,理想靠着「增程」的差异化产品,精准击中了大家的里程焦虑,在2023年和2024年分别跑出了181%和78.7%的惊人增速,成为细分市场领头羊。

但到了今年Q3,这个神话暂停了。

2025年三季度理想主要财务指标 | 来源:理想汽车业绩报告

数据显示,三季度理想交付了9.3万辆。虽然勉强保住了此前给出的指引下限(9-9.5万辆),但这可是同比下降39%,环比下降16.1%的成绩。营收也随之缩水至274亿元,同比跌了三成多。

这背后发生了什么? 简单说,是新旧产品切换的「阵痛」。

在这个「金九银十」的关键档口,理想正处在从「只靠增程」向「增程+纯电」转变的磨合期。一方面,曾经大杀四方的L系列,面对竞争对手的围剿和纯电续航的提升,统治力在下降;另一方面,新推的纯电车型i8反响平平,而本该走量的i6虽然订单不错,却卡在了产能爬坡和供应链上,没能及时转化成实打实的交付量。

如果说销量下滑还在意料之中,那财报里最扎眼的,肯定是车辆毛利率跌到了15.5%。要知道,去年同期这个数字是20.9%。对于一家向来以「抠门」和「高效率」著称的企业,这种表现确实罕见。

是理想卖车不赚钱了吗? 其实,这里面藏着一个秘密。

理想CFO李铁在电话会上点破了玄机:Q3计提了约11亿元的MEGA召回预估成本。这源于10月底的一次大规模召回,涉及1.1万辆车,原因是冷却液问题可能引发电池风险。

这笔钱花得值不值?我认为非常值。MEGA作为理想冲击高端纯电的旗舰,虽然销量未达预期,但通过主动召回更换电池来保障用户权益,是在为品牌信誉「填坑」。

更有意思的是,如果把这笔一次性计提剔除,理想的车辆毛利率实际上依然维持在19.8%的高位。 在营收腰斩、纯电(通常毛利低)占比提升的情况下,还能守住接近20%的毛利线,说明理想那套强悍的成本控制体系仍然非常有韧性。

同时,让资本市场警惕的是,Q3经营性现金流净流出74亿元,自由现金流更是负的89亿元。净利润也从去年同期的赚28亿,变成了亏6.24亿。

虽然理想账上还躺着近千亿(989亿元)的现金储备,看起来「家底厚实」,但单季度几十亿的流出速度,依然让人有些担心。

组织大变局:创业模式回归

其实,昨晚最让我震撼的,不是亏损,而是李想关于「组织」的大段复盘和规划。他承认,过去三年学习苹果、微软的「职业经理人」管理模式,是一个错误。他们努力学习,「却变成了越来越差的自己。」 这句话从一位千亿市值公司掌门人嘴里说出来,分量极重。

为什么「职业经理人」模式失效了?

 李想的逻辑非常清晰:职业经理人模式(流程、汇报、避险)适用于行业格局已定、技术迭代缓慢的成熟期。而现在的汽车行业,AI技术日新月异,淘汰赛正如火如荼。

在这样一个「乱世」,层层汇报的流程就是效率的毒药。当一个决策需要经过三层PPT汇报才能落地时,市场机会早就没了。李想敏锐地发现,英伟达和特斯拉——这两家全球最强的科技公司,依然保持着「创业公司」的管理模式。

在产品背后,理想更看重的是组织 | 图片来源:理想汽车

从2025年Q4开始,理想将全面回归创业模式。理想表示,这不仅仅是口号,而是管理颗粒度的剧变:从「汇报」到「对话」: 减少PPT,增加面对面的深度碰撞。从「资源占有」到「效率提升」: 去年花10块钱做的事,今年必须花8块钱,省下来的2块钱去投未来。从「避责」到「解决关键问题」: 职业经理人倾向于制造信息不对称来保护自己,而创业者必须直面血淋淋的问题。

在我看来,这其实是李想的一次「否定之否定」。他试图亲手剥离掉大公司滋生的「赘肉」,让这个拥有数万名员工的庞然大物,重新找回2019年那种「向死而生」的战斗力。这注定是一场极其痛苦的「手术」,但对于当下的理想汽车来说,想要在AI时代的牌桌上活下去,这或许是正确的解药。

AI故事:是资本春药,还是新引擎?

在财报电话会上,李想几乎用了一半的时间在讲「AI」、「具身智能」和「端到端」。

在产品层面,李想表示,未来十年,理想不能只是参数内卷,也不能功能堆砌,而是要做「具身智能机器人」。

李想认为,目前的电动车竞争已经陷入了「红海」:续航多20公里、屏幕大2寸、价格便宜5000块……这种同质化竞争没有尽头。他试图跳出这个维度,汽车不再是被动等待指令的机器,而是具备感知、思考、执行能力的「主动智能体」。

 为了实现这个愿景,理想亮出了藏在桌下的底牌:感知层面, 抛弃现有的BEV(鸟瞰图)技术,转向3D ViT(视觉Transformer);算力方面,理想自研M100芯片。CTO谢炎透露,这款专为具身智能设计的芯片,配合自研OS,性价比是目前高端芯片的3倍。预计2026年上车。

理想希望通过软硬件全栈自研,实现真正的端到端智能。 这也是特斯拉正在走的路径,理想正在从「也是特斯拉的学徒」变成「最像特斯拉的对手」。

智能电动车已经满足不了理想的野心,接下来的目标是具身智能 | 图片来源:理想汽车

更有意思的是,李想的野心似乎不止于车。他在社交平台上透露将发布「理想AI眼镜」,并称其为「理想最好的人工智能附件」,甚至连AI音箱也在考虑范围内。这些都表明,他希望理想的AI能力,能渗透到用户生活的每一个角落,而不仅仅局限于驾驶舱。

如果单从财务数据看,理想Q3的业绩报告是一份「不及格」的答卷:营收下滑、利润亏损、自由现金流流出……但从企业经营的底层逻辑看,却可以看到了一种难得的「清醒」。在大多数车企还在为「多卖几辆车」而疯狂打价格战、堆配置的时候,李想选择了在财务最困难的时候,做最难的事情:重塑组织、自研芯片、押注具身智能。

李想在赌,赌AI时代汽车的终局不是「移动的沙发」,而是「移动的机器人」;他在赌,只有回归创业公司的敏捷,才能在巨头环伺的下半场活下来。这场豪赌的结局尚未可知,但至少,他没有选择在温水中慢慢沉没。

罗永浩:周一有大事官宣;《阿凡达》导演卡梅隆:生成式 AI「太可怕了」;《疯狂动物城2》刷新中国影史纪录|极客早知道

2025年12月1日 08:01

华与华服务西贝 10 年收了六千多万元,罗永浩:周一有大事官宣

11 月 30 日,据报道,在与西贝的舆论战告一段落后,罗永浩与华创始人华杉之间的隔空「交锋」再次引发关注。昨日晚间,罗永浩在直播时透露,这周「因为香港出了火灾,无论是官宣还是跟人吵架都不合适」。

同时,他还预告下周一有个大的事件官宣,「是正事」,不想被这种吵架扯皮的事情带跑偏了,「等这个事情结束后,看哪天心情好就公布(录音)了」。

对于网友翘首以盼的录音内容,罗永浩也直言没什么特殊的,「你们以为有什么猛料,没有」。

「他当时骂人,我警告他,他第二天早上『滑跪』,然而跑到那儿一通道歉认错,说自己丢了多少生意,其实也是为了给贾老板站台,收人家那么多钱,要表现自己讲义气,确实不是冲着我们来的,非常抱歉。」罗永浩说道。

早先,西贝品牌顾问、华与华创始人华杉发文称「西贝是中国餐饮业的天花板,无论对顾客还是对员工,都是诚心诚意做到极致。被诱入黑白颠倒的网络罗刹国,被人算计。西贝坚持自己的华夏子弟精神,不苟且偷生,凭仁义立世」。

对此,11 月 26 日凌晨,罗永浩转发并回应:「谁诱的?谁算计了?你想干什么?你要是说不清楚,我就公布录音了。」(来源:cnBeta)

马斯克起诉苹果、OpenAI 新动作:全球摇人把韩国公司拉入战团

11 月 29 日,科技媒体 9to5Mac 发布博文,报道称伊隆·马斯克旗下的 xAI 公司起诉苹果与 OpenAI 垄断一案迎来最新进展,xAI 正通过国际司法协助程序,向一家韩国实体寻求关键证据。

法院已正式批准 xAI 依据《海牙取证公约》提出的申请,并将签署请求书转交至韩国法院行政处。尽管文件未直接披露该实体的具体名称,但这一跨国取证行动表明,马斯克正试图挖掘更深层的供应链或商业合作细节,以支持其反垄断指控。

针对这家「神秘韩国实体」的真实身份,业内目前主要存在两种推测:

  • 目标可能是三星(Samsung)或 SK 海力士(SK Hynix),这两家巨头为 OpenAI 提供了关键的 AI 基础设施硬件支持;

  • 另一种更有可能的推测指向韩国科技巨头 Kakao,Kakao 近期与 OpenAI 达成了深度合作,将 ChatGPT 直接集成至覆盖韩国 90% 人口的超级应用 KakaoTalk 中。

无论目标是谁,这家韩国公司都即将被卷入这场发生在美国的法律攻防战。

本案源于今年 8 月,马斯克因其 AI 产品 Grok 在更新后未能进入 App Store 排行榜榜首而起诉苹果。(来源:IT之家)

 

黄仁勋:英伟达 GPU 全球唯一支持所有 AI 模型,通用性极高

11 月 30 日,英伟达 CEO 黄仁勋在接受采访时回应了当前 AI 芯片市场竞争、技术趋势与供应链挑战等一系列热点问题。黄仁勋强调,英伟达在 AI 芯片领域的核心竞争力在于其 GPU 及平台的高度通用性。他指出,英伟达 GPU 是「目前唯一能够运行全球所有 AI 模型的系统」,并具备跨云端平台的广泛适配能力,「无论客户需求如何,我们都能提供支持」。

随着 AI 硬件需求激增,内存供应已成为行业瓶颈。黄仁勋预计,当前 DRAM 与 NAND 闪存芯片的紧缺局面将持续至明年,价格大幅上涨也推高了 AI 基础设施的整体建设成本。

他进一步坦言,目前从先进晶圆制造、CoWoS 先进封装,到线材与电源供应等环节,全供应链均面临压力,「几乎没有一种物料是充裕的」。尽管如此,黄仁勋仍对英伟达的供应链整合能力表示信心,称其覆盖全球的体系「非常强大,也是全世界最大」,公司将全力保障客户在扩产与 AI 算力建设方面的需求。

此外,黄仁勋指出,当前 AI 训练与推理需求正呈现指数级增长,行业已进入良性循环。随着更多基础模型制造商与 AI 初创企业涌现,AI 技术的影响力正加速扩展至更多产业与国家,推动整个生态系统持续扩大。(来源:cnBeta)

《阿凡达》导演詹姆斯・卡梅隆:生成式 AI「太可怕了」

12 月 1 日,詹姆斯・卡梅隆的电影常常处于视觉特效技术的最前沿,尤其是《阿凡达》系列。然而,这并不意味着卡梅隆对生成式人工智能(AI)持欢迎态度。

s在 CBS《周日晨间》节目中,为配合即将上映的《阿凡达:火与烬》,卡梅隆在接受采访时承认,动作捕捉(即通过记录演员的表演作为数字艺术家创作的基础模板)乍听之下或许与生成式 AI 有些相似,但实际上「二者恰恰相反」。

卡梅隆表示:「多年来,总有人觉得『哦,他们正在用电脑做些奇怪的事,是在取代演员』。但事实上,只要你深入探究、真正了解我们在做什么,就会发现这其实是对演员与导演共同创作瞬间的一种礼赞。」

CBS 的报道片段展示了《阿凡达》剧组演员在一个容量达 25 万加仑的水箱中进行水下场景拍摄的真实画面。

卡梅隆进一步指出:「再看看另一个极端,就是生成式 AI,它仅凭一段文字提示词,就能凭空创造出一个角色、一名演员,甚至一整段表演。不,那太可怕了…… 这绝不是我们正在做的事。」(来源:IT之家)

 

单日观影人次超《哪吒 2》,《疯狂动物城 2》刷新中国影史动画电影纪录

11 月 30 日,据猫眼专业版数据,电影《疯狂动物城 2》当日观影人次突破 1732.4 万。该数据超过《哪吒之魔童闹海》,刷新中国影史动画电影单日观影人次纪录,位列中国影史单日观影人次亚军,仅次于《唐人街探案 3》,后者在 2021 年 2 月 12 日(大年初一)创下了中国影史单日观影人次纪录,当日观影人次达 2039.5 万。

上映 4 天,《疯狂动物城 2》累计票房达到 13.67 亿,此前灯塔专业版预测其总票房超 38.22 亿。

此前,《疯狂动物城 2》已经刷新中国影史多项纪录:

-预售票房突破 3 亿,刷新了中国影史进口动画电影预售纪录。

-上映首日票房突破 2.13 亿,成中国影史进口动画电影单日票房冠军。

-超过《复仇者联盟 4:终局之战》,成为中国影史进口片单日票房冠军。(来源:cnBeta)

 

上海交大设立全球首个具身智能本科专业:联合华为培养,李飞飞高徒带队

11 月 30 日,上海交通大学近日发布公告,计划自 2025 年起增设「具身智能」本科专业,成为全球首个将该方向独立设置为本科专业的高校。新专业将隶属人工智能学院计算机类,学制四年,授予工学学位,首年计划招生 30 人,并将与华为、国家人形机器人创新中心联合培养。

专业课程将融合 AI、机械动力、计算机等多学科内容,围绕「感知—决策—控制—本体设计」培养复合型人才,以填补行业快速增长下的人才缺口。行业报告显示,中国具身智能市场今年规模将达 52.95 亿元,全球市场预计十年后增长至 1242 亿美元,需求迅速扩大。

该专业由卢策吾教授领衔,他曾在斯坦福深造,是李飞飞、Guibas 的学生,同时也是具身智能创业公司穹彻智能联合创始人。交大在具身智能方向已形成科研与产业并进的基础,包括多家企业孵化与技术转化成果。

除交大外,东北大学、南航、科大、北航、浙大等多所高校也在推进具身智能专业布局,显示这一新兴方向正在成为国内高校的下一轮竞争焦点。(来源:量子位)

瘫痪男子借助 Neuralink 脑机接口玩《战地 6》,可用意念瞄准

11 月 30 日,一名瘫痪男子表示,他现在可以借助 Neuralink 脑机接口植入设备玩《战地 6》(Battlefield 6)等第一人称射击游戏。

「我现在可以用意念瞄准了,」罗布·格赖纳(Rob Greiner)在社交平台 X 上发布了一段自己的游戏视频,并配文写道。格赖纳因肩部以下瘫痪,无法自主活动四肢。

通过结合使用专为四肢瘫痪患者设计的口控控制器 QuadStick 与 Neuralink 的脑机接口(BCI)植入设备,格赖纳如今能够在游戏世界中移动角色、自由环顾四周、用自己选择的武器瞄准敌人并开火。

「这还需要大量练习,真的是海量练习,因为我目前的瞄准精度只和我在笔记本电脑上控制光标一样准,」格赖纳写道,「但你不得不佩服 Neuralink。」

「如果只用 QuadStick,通常这是我唯一能控制的东西,」他在玩《战地 6》时一边移动准星一边说道,并补充道:「仅靠这个设备,你无法同时瞄准和行走。」「但有了 Neuralink,现在我只需用意念就能完成瞄准,」他说,同时仍用 QuadStick 控制角色移动。

他请观众将他的游戏设置想象成:用意念操控一个「虚拟鼠标」,而用嘴巴操作键盘。(来源:IT之家)

明年起,新加坡中学生在校不能使用智能手机和手表

11 月 30 日,据新加坡《联合早报》报道,新加坡教育部 11 月 30 日发文称,为鼓励学生培养良好的电子产品使用习惯,鼓励课下互动交流,明年 1 月起,新加坡所有中学生在上课期间、课间休息以及在校补课时,都不能使用智能手机和手表。

按新规,学生在校时须把智能手机和手表放入储物柜或书包等指定存放空间。若有必要,学校可允许学生使用智能手机。此外,为了鼓励学生尽量早睡,新加坡教育部也将从明年 1 月起,调整中学生个人学习电子设备中的管理应用程序的设置,自动关闭时间将从晚上 11 时提前至 10 时 30 分。(来源:观察者网)

OpenAI 或成史上烧钱最快的公司;特斯拉在印度两月,仅卖出100多辆车;《疯狂动物城2》刷新进口电影单日票房纪录|极客早知道

2025年11月30日 08:26

贾跃亭称生命中最重要的事是还债回国

11 月 29 日,贾跃亭表示,自己生命中最重要的事情就是还债回国。「还债回国是我生命中最重要的两件事之一。」日前,贾跃亭通过其个人社交平台宣布成立第二个债权人信托,旨在「加速偿还国内担保债务尽责到底早日回国」。

对此,一位不愿透露姓名的资本市场资深人士认为,贾跃亭此举更多的是博眼球、追流量。「到现在,也没有看到他在还(国内债务)。」

面对外界质疑和评价,贾跃亭称,不论外界怎么评价,其生命中只有两件事:「一个是打造 EAI 生态,给社会带来变革性的驱动作用,另一个是还清国内债务,早日回到祖国。」

据悉,法拉第未来(Faraday Future)管理层已批准了 FF 和 FX 品牌的五年商业计划,并已将其提交给董事会审核。按照公司的计划,未来五年累计产量目标为 40 万至 50 万辆。(来源:cnBeta)

OpenAI 可能成为史上「烧钱最快」的科技公司

11 月 29 日,据新智元报道,根据多份基于微软财报的数据揭示,OpenAI 的推理成本正在以远超收入的速度膨胀,可能成为史上「烧钱最快」的科技公司。

来自 2024 Q1 至 2025 Q3 的数据表明,OpenAI 的推理支出(即运行模型生成回答的成本)呈爆炸式增长:2025 年 Q3 支出飙升至 36.5 亿美元,而同期隐含收入仅 20.6 亿美元。这意味着 每赚 1 美元,OpenAI 要花 1.8 美元用于推理;2025 年 Q1 的这一比值甚至一度突破 2.0,陷入「越卖越亏」的循环。

年度层面,问题更为突出:2025 年前 9 个月的推理支出达 86.7 亿美元,是 2024 全年的 2.3 倍;同期收入仅增长 75%。2025 年前 9 月亏损已达 43.4 亿美元,远超上一年。

更令人担忧的是,媒体长期高估了 OpenAI 的营收。2024 年,微软财报反推收入为 24.7 亿美元,而媒体普遍报道为 37~40 亿美元;2025 年差距进一步拉大,仅上半年误差就达到 20 亿美元。这意味着外界对 OpenAI 的成长速度和商业化能力可能存在系统性高估。(来源:新智元)

 

研究揭示 OpenAI Sora2 监管漏洞:13 岁账号即可轻易生成「校园枪击」视频

11 月 29 日,据外媒 Futurism 报道,消费者监督组织 Ekō发布了一份名为《OpenAI Sora2:危害的新边界》的报告,展示研究人员使用以 13 岁和 14 岁青少年身份注册的账号生成的画面,画面包括青少年吸食违禁品和在公共区域或学校走廊持枪。

Ekō警告称,而 Sora2 生成暴力与令人不安内容的难度极低,这种内容很容易病毒式传播,从而将会进一步加剧风险。

报告明确指出,这些内容全部违反了 OpenAI 的使用政策和 Sora 的分发准则。

即便账号不主动生成内容,Sora2 的「For You」和「Latest」推荐页面也会推送令人震惊的视频,包括刻板化描绘犹太人或黑人、枪战场面以及性暴力等画面。(来源:IT之家)

 

iPhone 17 助力苹果手机 10 月份额创历史新纪录,中国市场贡献最大

11 月 29 日,在 iPhone 17 系列的助力下,苹果手机 10 月份额创下了历史新纪录。调研机构 CounterPoint Research 报告显示,得益于 iPhone 17 系列(尤其是标准版)在中国、美国等市场的强劲表现,苹果 2025 年 10 月 iPhone 销量同比增长 12%,终端销量份额飙升至 24.2%,创下历史新纪录。

报告中指出,中国成为苹果 10 月增长最快的市场。数据显示,在首发后的六周时间里,iPhone 系列在中国市场的销量同比激增 47%,远超美国(+11%)和日本(+8%)。

Counterpoint 高级分析师 Ivan Lam 指出,除了产品力本身,特殊的市场节点也助推了这一增长:新冠时期的换机潮达到顶峰,加上「双 11」大促提前开启,以及中秋国庆假期的销售热度延续到了 10 月。当然,iPhone Air 的销售就暗淡了很多,跟 iPhone 17 系列相比,完全不值得一提。(来源:cnBeta)

 

特斯拉登陆印度市场两个多月,仅卖出 100 多辆车

11 月 29 日,特斯拉想要拿下全球最大的汽车市场之一——印度,但现阶段的表现并不理想。

据外媒 Insideevs 报道,印度是全球第四大汽车市场,特斯拉今年 7 月终于在印度开出首家展厅。不过根据经销商提供的数据,特斯拉在当地运营两个多月,仅卖出 100 多辆车。

截至 9 月中旬,印度市场的 Model Y(目前在当地唯一正式销售的特斯拉车型)刚刚收到 600 多份订单,但真正转化为交付的只有极少部分。反观更昂贵的宝马、比亚迪和奔驰,由于享受税收减免,销量表现反而更强。

特斯拉最近又在北部城市古尔冈启用了更大的综合据点,集展厅、充电枢纽与售后服务于一体,品牌曝光度因此有所提升。但要提高销量,特斯拉仍有大量工作要做。

首先,印度市场的 Model Y 售价高达 70000 美元(现汇率约合 49.6 万元人民币),已进入豪华车区间。其次,全国范围内只有两座 Supercharger 直流快充站,分别位于孟买和新德里,后续仍计划陆续增加站点。(来源:IT之家)

北京 AI 产业规模今年将超 4500 亿元

11 月 29 日,2025 中国人工智能大会暨全国人工智能学院院长(系主任)年会开幕。开幕式上,北京市科委、中关村管委会发布《北京人工智能产业白皮书(2025)》,从全球和国家战略角度总结了人工智能发展现状,系统梳理了北京人工智能的创新资源和产业总体情况,并研判了未来发展趋势,推动北京市加快建设具有全球影响力的人工智能创新策源地和产业高地。其中提出,初步估算今年全年本市人工智能产业规模有望超过 4500 亿元。

数据显示,2025 年上半年,北京人工智能核心产业规模 2152.2 亿元,同比增长 25.3%。初步估算 2025 年全年,产业规模有望超过 4500 亿元。AI 企业超 2500 家,已备案大模型 183 款,持续保持全国第一。产业链日趋完整,形成了具有全球竞争力的产业生态。同时商业化路径也逐渐清晰,百度、抖音等公司的营收和产品活跃用户数均创新高。(来源:新浪科技)

 

打击虚拟货币交易炒作工作协调机制会议召开

11 月 28 日,中国人民银行召开打击虚拟货币交易炒作工作协调机制会议。会议强调,虚拟货币不具有与法定货币等同的法律地位,不具有法偿性,不应且不能作为货币在市场上流通使用,虚拟货币相关业务活动属于非法金融活动。

稳定币是虚拟货币的一种形式,目前无法有效满足客户身份识别、反洗钱等方面的要求,存在被用于洗钱、集资诈骗、违规跨境转移资金等非法活动的风险。(来源:中国人民银行网站)

 

00 后养宠人数约 2000 万,宠物经济岗位大涨 30%

11 月 29 日,智联招聘集团董事长郭盛在「第三届全国人力资源服务业发展大会」的论坛上分享了一组数据:2025 年前三季度招聘增速最高的十个岗位中,与宠物经济相关的职位排在第二,增速为 30.4%,仅次于机器学习工程师。(来自:华尔街见闻 APP)

 

我国已成为首个国内有效发明专利拥有量超过 500 万件的国家

11 月 29 日,国家知识产权局举行 11 月例行新闻发布会,介绍了加强知识产权保护和运用有关工作进展和举措。

从官方介绍获悉,目前,我国已经成为世界上首个国内有效发明专利拥有量超过 500 万件的国家,PCT 国际专利申请量连续 6 年位居全球第一。专利密集型产业增加值达到 16.87 万亿元,占 GDP 的比重提升到 13.04%;全球前 5000 个品牌中我国品牌价值达 1.81 万亿美元,位居全球第二;地理标志产品直接产值接近 9700 亿元,保持良好增长势头。

世界知识产权组织发布的《2025 年全球创新指数报告》中,我国排名提升至第 10 位,首次跻身全球前十,拥有的全球百强创新集群数量达到 24 个,连续三年位居各国之首,其中「深圳—香港—广州」集群首次登顶全球首位。(来源:IT之家)

日本公司推出 AI 自动洗澡机,约 272 万元人民币

11 月 29 日消息,以纳米气泡(Fine Bubble)技术闻名的日本 Science 株式会社曾在今年 4 月的大阪世博会上展示过一台「未来人体洗澡机」原型机,采用类似战斗机驾驶舱的流线型设计,配备后开式透明舱盖,吸引大量观众排队体验。

这款洗澡机同样应用了 Science 的纳米气泡技术。用户只需平躺于 2.3 米长的胶囊舱内,机器将自动向舱内注入热水并释放数百万微气泡进行全身清洁,并在 15 分钟内完成清洗与烘干流程。

沐浴过程中,位于用户背部的传感器可实时监测健康状态,通过 AI 算法调节水温并识别情绪状态,同时在透明舱盖投射影像,并播放音乐。

Science 发言人前仓幸子于 11 月 28 日表示,这款机器已在日本开售,零售价达 6000 万日元(现汇率约合 272 万元人民币)。前仓表示,这款洗澡机的稀缺性正是其魅力所在,公司计划仅生产 50 台左右。

Science 董事长青山康明表示:「目前国内已售出 8 台。我们正在考虑海外销售,预计到年底将售出约 15 台。」(来源:IT之家)

疯狂动物城 2 票房破 13 亿,单日票房超 5.58 亿,刷新中国影史进口电影单日票房纪录

11 月 29 日,截止至当日下午,据猫眼专业版数据,电影《疯狂动物城 2》上映 4 天,总票房破 13 亿。

同日,迪士尼动画电影《疯狂动物城 2》单日票房超 5.58 亿,刷新中国影史进口电影单日票房纪录。(来源:华尔街见闻)

雷军:人形机器人将大面积进入小米工厂;淘宝闪购将全面取消超时扣款;苹果新专利:耳机读取脑电波

2025年11月29日 09:12

雷军:未来 5 年,人形机器人将大面积进入小米工厂「打工」

11 月 28 日消息,《北京日报》对小米创办人、董事长兼 CEO 雷军进行了采访。公布的采访内容中提到,下一个五年,人工智能将深刻影响传统产业。「所有产业都值得用 AI 再做一遍。」
雷军以小米汽车工厂举例:大压铸件用人眼很难完成检测,但通过 X 光机和 AI 视觉大模型判定,可在 2 秒内完成检测,效率是人工的 10 倍,精度是人工的 5 倍以上。他说,人工智能与传统产业深度融合,将会开启一个新的万亿级大市场,一家公司不可能掌握所有环节,而是要与最强的伙伴携手,取长补短,带动整个产业链共同升级。
在采访中,雷军直言:「北京的制造业不能像其他地方一样走拼人力的老路,而是应该坚定走智能制造的新路,抢占『智』高点,带动产业迭代升级。」(来源:IT 之家)

消息称百度启动新一轮裁员,部分团队四成员工受影响

11 月 28 日消息,据路透社援引 6 名知情人士消息称,百度本周启动了新一轮人员缩减,裁员规模覆盖多个业务部门。
随着人工智能竞争愈发激烈、广告收入持续下滑,百度正面临近年最明显的经营压力。本轮裁员将持续到年底,多名知情人士称,公司内部普遍认为此次调整规模较大,具体裁员人数因业务部门和绩效评级而异,个别团队的裁减比例可能高达 40%。
报道提到,百度长期押注人工智能,但这些投入尚未带动核心广告业务重回增长,市场份额不断被小红书、字节跳动的抖音等平台吸走。(来源:IT 之家)

淘宝闪购将全面取消超时扣款,年底前覆盖全国

11 月 28 日下午消息,记者获悉,淘宝闪购取消超时扣款正扩大覆盖到 60 城,年底前将覆盖全国直营城市。
今年以来,淘宝闪购持续推广服务分机制,以正向激励和技术牵引骑士服务,通过好的履约加分、超时送达扣分的方式,让骑士收入不再因超时受影响,多劳多得,优劳优得,实现骑士安全、履约效率与用户体验的协同提升。
具体规则上,面向众包骑士,淘宝闪购积分制方式更科学、更温和,形成更有效的弹性约束。在 70 分的基础设计上,顺利送达、没有违规就有加分,超过 75 分有额外奖励;让消费者体验受损、影响履约的行为会扣分,对超时来说,1 次最多扣 2 分。(来源:IT 之家)

美团 2022 年以来首次亏损:外卖竞争下核心本地商业分部经营亏损 141 亿元

11 月 28 日消息,美团发布截至 2025 年 9 月 30 日的第三季度业绩公告:
收入由 2024 年同期的人民币 936 亿元增长 2.0% 至人民币 955 亿元。
由于外卖行业竞争持续加剧,2025 年第三季度,美团核心本地商业分部的经营溢利同比大幅下降,转为经营亏损人民币 141 亿元。同时,由于海外扩张,新业务分部的经营亏损同比扩大至人民币 13 亿元。
美团于第三季度的经调整 EBITDA 及经调整溢利净额分别同比下降至负人民币 148 亿元及负人民币 160 亿元。IT 之家注意到,这是美团 2022 年以来首次亏损。
截至 2025 年 9 月 30 日,美团持有的现金及现金等价物和短期理财投资分别为人民币 992 亿元和人民币 421 亿元。(来源:IT 之家)

极壳 Hypershell 完成 7000 万美元 Pre-B 及 B 轮融资,引领消费级外骨骼新时代

消费级外骨骼领域的全球引领者极壳科技(Hypershell)近日正式宣布,已顺利完成 7000 万美元 Pre B 及 B 轮融资。此次融资后,极壳科技的投后估值近 4 亿美元,标志着其作为行业领导者的地位得到进一步巩固。
作为赛道开拓者,极壳科技是全球首家实现消费级外骨骼规模化量产与商业化落地的团队。尽管「消费级外骨骼」概念曾经在行业内被普遍认为是「不切实际的科幻产品」,面临着巨大的质疑,但极壳科技凭借深厚的技术积累和前瞻性的行业视野,始终坚定不移地推进产品研发。
本次融资的完成,彰显了资本市场对极壳科技技术实力、商业化能力和未来前景的高度认可。随着消费级外骨骼行业从概念阶段迈向产业化落地,行业正迎来加速爆发的关键节点,极壳科技凭借领先的技术与产品能力,已处于推动这一新兴品类走向成熟的核心位置。(来源:极客公园)

AirPods 将变「读心」设备:苹果 AI 新研究暗示未来耳机可读取脑电波

11 月 29 日消息,科技媒体 9to5Mac 昨日(11 月 28 日)发布博文,报道称苹果研究团队在预印本平台 ArXiv 上,发布代号为 PARS(Pairwise Relative Shift,成对相对位移)的突破性 AI 技术,旨在通过自监督学习分析脑电图(EEG)信号。
苹果开发的 PARS 模型采用「自监督学习」机制,直接利用原始且未标记的数据训练。简单来说,该模型通过「自学」预测不同脑电波片段在时间上的距离,从而理解大脑活动的深层结构与长程依赖关系。(来源:IT 之家)

长安汽车官宣将投资设立机器人公司

11 月 28 日消息,长安汽车今晚发布第九届董事会第四十八次会议决议公告,审议通过了《关于投资设立机器人公司的议案》。
长安汽车公告称,长安机器人公司的设立符合国家「十五五」规划和长安汽车战略转型发展方向,其定位为公司机器人产业战略承载体,以智能人形机器人技术为牵引,发展多机器人产业板块,旨在打造标志性「具身智能」创新产品和解决方案,成为世界一流的机器人产品与服务提供者,实现汽车与机器人产业的双向赋能,推动汽车产业升级。(来源:IT 之家)

钉钉上线首个 AI 医生助理,助力妇产科医生临床诊断

11 月 28 日晚间消息,钉钉联合壹生检康发布「豆蔻医生超级助理」。这个是钉钉上第一个针对医生的专业 AI 应用,能实现 1 分钟整合全球超过 4000 万医疗专业文献,并进行全链路溯源,以权威医疗研究证据,助力妇产科医生快速高效临床诊断。
据介绍,医生只需将病例提交给豆蔻医生助理,AI 能够模拟医生循证决策思维,理解问题,解析数据,然后从超 4000 万+全球权威最新文献指南中进行智能检索,获取「指南推荐+真实世界数据+相似病例」的完整证据链,并在 1 分钟生成诊疗建议。钉钉拥有国内众多的医院和医疗机构用户,医院端可在钉钉上直接调用这一 AI 助理。(来源:新浪财经)

埃斯顿酷卓发布柔性全场景具身智能机器人「磐石 C05-L」

11 月 28 日消息,埃斯顿酷卓科技有限公司(以下简称「埃斯顿酷卓」)今日在世界智能制造大会上推出其全新人形机器人「磐石 C05-L」。
该产品以「柔性全场景」为核心定位,面向工业、商业及办公等多类场景,展示了埃斯顿酷卓在具身智能机器人领域的技术积累。
据发布会介绍,「磐石 C05-L」是一款面向工业场景的高性能轮式具身智能机器人。其身高支持 138 厘米至 168 厘米之间动态调节,兼顾轻量化与高强度作业需求。机器人单臂额定负载达到 5 公斤,适用于轻型物料搬运、精密装配辅助等任务。(来源:IT 之家)

我国首次:顺丰成功完成飞机运输三元锂电池,采用 AI 安全防护装备

11 月 28 日消息,据顺丰集团消息,由顺丰联合重庆交通大学、中国民航科学技术研究院等单位共同发起的,动力锂电池航空物流供应链研讨会暨国家重点研发计划「动力锂电池运输安全防护技术与装备」航空运输应用示范启动会近日在湖北鄂州举办。
随着启动指令的发出,一架搭载新型安全防护装备的动力锂电池货运航班从鄂州花湖机场顺利起飞,飞向深圳宝安机场。
顺丰集团表示,此次飞行实现了我国首次单包装多组三元动力锂电池的连续性、商业化航空运输,也是 AI 预警与主动防控技术在顺丰航空货运飞机中的首次应用,标志着我国动力电池航空运输安全保障与供应链优化迈入高质量发展新阶段。(来源:IT 之家)

捐赠自研OS内核背后:Rust 先行者 vivo 的「担当」

2025年11月28日 20:30

作者|白石

编辑|靖宇

人工智能时代,开源成为一个重要发展方向。

Meta 的 Llama,开启了开源模型对抗闭源模型的序幕,让 OpenAI、Anthropic 等闭源模型公司没法吃「垄断」的饭,必须不停地拿出更新更好的 AI 模型。

中国的 Qwen 和 DeepSeek 接过接力棒,让开源模型遍地开花,它们的 AI 模型在开源社区的下载量,都达到千万量级。

对于用户和开发者,开源模型和开源工具能让他们不用为闭源模型昂贵的 Token 成本担心,快速开发和迭代自己的项目。

对于开源方,开源生态中的开发者们能够帮助它们把项目变得更完善,并不断推进创新,将基于这个项目的衍生生态发展壮大。

随着 AI 开始逐步进入到现实世界,全新的 AI 原生硬件设备对连接底层硬件与顶层应用的操作系统提出了新的需求。

最近,一家国内公司更是将自研的、面向 AI 时代的操作系统内核开放给世界。

这家迈出关键一步的企业是 vivo。这次开源的背后,是一场长达八年的技术长跑。

2018 年,随着 AI 浪潮的涌动,vivo 自研操作系统——蓝河操作系统(BlueOS)正式立项;2023 年,vivo 自研蓝河操作系统正式发布,该系统的框架基于 Rust 语言编写并率先搭载于智能手表产品;2024 年,它更进一步,成为从内核到系统框架全栈使用 Rust 语言编写的操作系统。

而在这套全栈自研的操作系统中,最核心、最基础的部分是它的内核,也是决定整个系统安全、性能和稳定性的关键。

蓝河操作系统内核于 2024 年正式发布,在 2025 年 7 月面向行业开源;并于 2025 年 11 月捐赠给开放原子开源基金会,正式以「BlueKernel」命名成为开源孵化项目,以全新的开源运营和治理模式面向行业。

可以看出,一直以来,vivo 在 Rust 语言技术研究、产品落地和开源实践,都走在了行业前沿,可以说是 Rust 的先行者。那么,vivo 开源的操作系统内核有哪些价值?系统内核的开源,又会给行业带来哪些助推?

 

01

为什么我们需要一个 Rust 内核?

 

一个操作系统能走多远,与其使用的语言有密切关系。

AI 眼镜、机器人等 AI 原生硬件设备与普通智能设备最大的不同,在于它内置的 AI 能力,这些能力通常由大模型和 AI Agent 驱动。要在端侧设备上运行 AI 模型和 AI Agent,对操作系统的安全性、轻量化程度和通用性都提出了都提出了更为严苛的考验。

蓝河操作系统是 vivo 面向 AGI 时代构建的自研操作系统,它从内核到系统框架全栈使用 Rust 语言编写,它在安全、AI 能力和运行流畅方面的优秀特性,能够很好地满足 AI 原生硬件设备对操作系统的要求。

安全上,蓝河操作系统全栈使用 Rust 语言,从源头保障内存安全。AI 能力上,蓝河操作系统的系统架构设计深度融合蓝心大模型,Agent 框架具备跨场景感知、自主决策等能力。运行流畅方面,蓝河操作系统构建了一系列高性能技术,能高效利用软硬件资源。

蓝河操作系统的这些核心特性,离不开一颗强大的「心脏」——内核。BlueKernel 是 vivo 以 Rust 语言自研的操作系统内核,具备安全、轻量和通用的核心特性。

在安全方面,以 C/C++ 语言为主的操作系统约 70% 的严重安全漏洞与内存安全问题有关。近年来,行业里与内存安全相关的事故案例层出不穷,比如工信部的网络安全威胁和漏洞信息共享平台(NVDB)在 2025 年 9 月就发布了苹果操作系统(包括 Mac OS 和 iOS)在内存安全方面的高危漏洞。

尤其是对于 AI 应用,尤其是端侧 AI,需要处理和分析海量的、极其敏感的个人数据,例如用户的对话录音、面部图像和健康指标,传统操作系统在内存安全上的缺陷,容易导致灾难性的隐私泄露。

相比 C/C++语言,Rust 语言在内存安全上有质的飞跃,它的核心思路,是在代码编译时就对常见的内存风险做严格检查,让许多容易埋下隐患的错误无法通过编译。一些在 C/C++语言中需要靠开发者自觉规避的错误,在 Rust 语言中,大多会在写代码时就被编译器直接拦下。

它的优越安全性能已经被主流操作系统项目实际验证。例如,Android 系统底层采用 Rust 后,相比 C/C++ 时代,内存安全漏洞首次降至总漏洞的 20% 以下。

在轻量化方面,AI 原生硬件设备通常受到严格的资源限制,包括有限的内存、闪存硬盘和电池容量,所以它们的操作系统必须是极致轻量化的,其内核和核心服务占用的系统资源要尽可能小,以便让 AI 模型和算法更高效地运行。

同时,AI 原生硬件设备的形态目前还比较多样,其内在也会使用不同芯片架构的 AI 芯片,这些都对操作系统的通用性提出了高要求。基于 Rust 语言编写的 BlueKernel,也在持续提升对 CPU 架构和驱动的兼容能力,对硬件资源的需求相比传统操作系统内核也显著降低,能够以更低的成本满足各类终端产品的需求。

本质上,Rust 是用一套语言规则打通了从底层系统到上层服务,为多硬件平台的长期迭代提供了更稳固的通用底座。

而有了更好的语言,才有了更好的操作系统内核。

 

02

BlueKernel 内核,AIOS 的基石

 

蓝河操作系统本身就是面向智能眼镜、机器人等 AI 原生硬件设备的智慧操作系统,所以其内核——BlueKernel,也针对 AI 硬件设备「高安全、低资源、多形态」的痛点进行了原生设计,具备安全、轻量、通用的三大特性,将语言的潜力转化为系统级的核心竞争力。

BlueKernel 技术架构图

作为适用于 AI 原生硬件设备的开源 Rust 内核,BlueKernel 的竞争力首先体现在安全与效率的统一。

在内存安全方面,BlueKernel 使用编译期所有权系统,让内存安全从以往的被动防御进化到现在的主动掌控,开发者不用再为内存安全问题花费更多开发资源,进而能加速 AI 原生硬件设备在消费者层面的普及,促进整个行业的繁荣。

同时,得益于对基础数据结构高性能低开销的设计,BlueKernel 对硬件资源需求低,最小内核内存占用仅 13KB,这为 AI 模型和算法等「资源消耗大户」腾出了宝贵的计算资源,也让那些极度轻量化的 AI 原生硬件设备,例如智能眼镜(通常只有几十克重)和智能手环,利用有限的算力提供足够强的 AI 能力。

在通用性与硬件兼容方面,BlueKernel 兼容 RISC-V、ARM 等多种芯片架构,也支持兼容 POSIX 接口的标准库。对于开发者来说,这意味着他们写的程序可以更容易地在各种类型的硬件设备平台上移植。

为保证系统扩展性,BlueKernel 通过硬件抽象等一系列方式,提升了对于 CPU 架构和驱动的兼容能力,支持 Rust 语言开发驱动,也支持兼容已有的 C 语言内核的外设驱动。因此,开发者和生态内的厂商既可以继续使用现有的 C 语言驱动,也可以用 Rust 语言为新硬件编写新驱动,这种分阶段的投入,降低了整个行业的进入门槛。

从内存安全保护、超低的资源消耗到对多芯片架构、多设备形态的灵活适配,BlueKernel 通过发挥 Rust 语言的优良特性,在系统内核层面解决了 AI 原生硬件设备对高安全性与低资源的诉求。这种兼顾效率与通用性的特性,使它成为 AI 时代操作系统的新基石。

vivo 作为 Rust 语言的先行者,也承担起责任,将 BlueKernel 开源,与行业共同构筑越来越繁荣的 AI 生态。

 

03

BlueKernel 的生态机遇与未来

 

在海外市场,开源的操作系统已经非常有影响力,例如 Linux 不仅是大部分服务器的底层操作系统,成为全球互联网的基石;引领移动互联网时代的 Android 操作系统,它的操作系统内核也基于 Linux 内核。

而在中国市场,随着近些年越来越多的企业、高校、研究机构和开发者持续的投入和创新,开源也呈现出了繁荣发展的态势。由此看来,vivo 将以 Rust 语言自研的操作系统内核 BlueKernel 向行业开源,并捐赠给开放原子开源基金会,既具有诚意,又意义深远。

vivo 开源的是操作系统内核,它是操作系统的「心脏」,这让底层的硬件厂商、专业的系统开发者、开源社区,都可以基于 BlueKernel 进行创新,而不仅仅是 vivo 一家。

vivo 在构建生态时,具有务实的态度。目前,微软和 Linux 仍然是操作系统的主流,它们留下了数量庞大的 C 语言驱动代码(近 2000 万行)。因此,BlueKernel 采取了灵活的「渐进式」迁移策略:它既支持开发者用先进的 Rust 语言开发原生驱动,也兼容已有的 C 语言驱动,极大地降低了硬件厂商的适配门槛和开发者的学习成本。

基于安全、通用、轻量化的特性,以及务实的生态策略,BlueKernel 为爆发初期的 AI 原生硬件设备市场提供了巨大的想象空间。

vivo 的贡献不止于开源操作系统内核,它正与开放原子开源基金会携手,通过举办「蓝河操作系统创新赛」等方式,系统性地推广 Rust 语言。目前,第三届「蓝河操作系统创新赛」正在进行中,设立 70 万元奖金池,以 C2Rust 项目级转译工具赛题聚焦攻关 Rust 生态行业难题。vivo 将持续把蓝河创新赛打造为行业最具含金量和影响力的 Rust 顶尖赛事。

从开源并捐献操作系统内核,到办「创新赛」,vivo 持续为产业做贡献,不断推动整个行业的繁荣和发展。它开源的操作系统内核 BlueKernel,为 AI 眼镜、机器人等 AI 原生硬件提供了一个安全、通用的强大「心脏」。

从代码补全到真实软件的生产级工具:Qoder 如何改写 AI 编程规则

2025年11月28日 17:25

作者|Cynthia

编辑| 郑玄

2025 年以来,各种 AI Coding 的宣发,已经从科技进步,快进到了科幻文学赛道。

C 端市场,一句话生成 Demo 的宣发内容仍在收割流量,将技术演进包装成科幻叙事;但没人关心小白为什么要做 coding,一句话生成的的 demo,在生产环境能跑起来吗?

更进一步追问:超过 95% 的 AI coding 用户,都是在构建真实软件的专业开发者。而他们所做的真实世界的软件研发,不仅没有那么多 0 到 1 的天马行空 demo,更有至少 80% 的价值藏在对老工程的迭代里。

这些项目不仅价值产出大,并且积累时间长、复杂度高,而传统的 AI Coding,似乎并不擅长:面向程序员和技术爱好者的问答网站 Stack Overflow 发布的 2025 年开发者调查显示,人们对人工智能的信任度已降至历史最低点。虽然有 84% 的开发者表示他们在开发过程中使用或计划使用人工智能工具,高于 2024 年的 76%。但也有至少 46% 的开发者并不信任人工智能的输出准确性,较去年的 31% 显著上升。并且,至少有 45% 的受访者表示,一度因为调试 AI 生成的代码而心态崩溃(InfoQ Culture and Methods Trends Report - 2025)。

原因很简单,生产级项目,对 AI 的要求远不止生成代码片段,而是需要理解项目全貌、遵循隐性规则、完成全链路闭环的生产级能力。

而这对 AI Coding 软件的要求,也聚焦到了上下文工程与 Agent 能力两大更具体的维度。

不久前,在飞天发布时刻上发布全面支持 JetBrains 插件、IDE、CLI 三种主流产品形态的 Qoder,正是这一产业转型的标志性产物。

一定程度上,作为国内首个定位为「Agentic Coding(智能体编程)平台」的 AI 开发工具,Qoder 标志着 AI 编程从「代码助手」向「可自主完成复杂任务的全栈 AI 工程师」的重大进化。

 

01

生产级代码需要怎样的上下文能力  

 

AI 编程在生产环境的首要障碍是上下文能力,这一问题在团队协作的复杂工程中被无限放大。

现有工具普遍采用的 20 万 token 上下文窗口,既无法覆盖跨模块的依赖关系(导致变量未定义等低级错误),更无法捕捉团队沉淀的隐性知识,如金融行业支付超时重试需要≤3 次、电商日志需包含流水号,电商系统库存扣减需要加分布式锁等未写入文档的工程常识,而这些正是避免线上事故的关键。

要解决这一问题,上下文工程必须突破覆盖广度(上下文足够长)、检索精度(搜得到)、意图匹配提示准)三大瓶颈。

这其中,上下文长度是第一个核心难关。为此, Qoder 推出了 10 万文件级上下文检索。

这是什么概念呢? 参考行业标准:个人工具类项目仅需 50-500 个文件,中型企业应用约 1000-5000 个文件,即便是 Linux 内核这样的大型开源项目,文件数也仅 5 万左右。10 万文件的覆盖能力,意味着 Qoder 可适配数百人团队维护的超复杂系统,从文件级读取升级为项目级/工程级理解。

但单纯扩大上下文长度,一方面模型本身的上下文窗口并不支持,另一方面,这会引发算力爆炸和精度下降。因此,借助 RAG 的形式对需要的内容做精准检索成为行业的通用范式。而这一过程中, 检索精度 的优化成为关键。

行业当前存在两大技术路径:以 Claude Code 为代表的 grep 派依赖关键词匹配,虽适配小代码库但语义召回率低;以早期 Cursor 为代表的智能检索派,借助语义理解检索上下文,但技术落地还较为初级。

Qoder 采用融合式检索引擎,搭建云端代码搜索引擎,关联代码结构、历史迭代记录与 Repo Wiki 文档,实现跨模块、跨项目的语义级精准定位——既避免了 grep 的机械匹配缺陷,又弥补了纯智能检索的细节缺失,确保 AI 仅获取与当前任务强相关的信息。

这种跨模块、跨项目的检索能力,使得 Qoder 可以跳出单文件的局限,全面理解并索引整个代码仓库的结构与历史。从而确保对复杂、多轮迭代的项目的适应性。

建立在精准检索的基础上,要想进一步提升大模型的输出质量,就需要在 意图匹配上下功夫。 Qoder 通过动态记忆+一键增强双机制解决这一问题:

其中,动态记忆模块可自动挖掘历史对话中的编码风格(如命名规范、注释习惯)与工程约定,例如识别开发者常用「ResultDTO」封装返回值后,后续生成代码将自动遵循该规范。

提示词增强功能则能将模糊需求结构化,将开发者从优化提示词的负担中解放出来。例如输入「优化登录接口」,系统会自动补全为「基于 Spring Security 架构,增加手机号验证码、密码错误锁定、token 有效期调整、关联数据表及单元测试」的完整任务描述,从源头降低理解偏差。

为适配团队协作场景,Qoder 还支持 Repo Wiki 的导出与共享——由核心成员梳理项目架构、隐性规则生成文档后,全团队可通过代码库共享,使 AI 的上下文认知与团队经验同步,彻底解决「新人 AI 不懂老项目规则」的行业痛点。

 

02

什么是 Agentic AI coding

 

上下文解决了学得懂的问题,下一步就是用 Agent 解决做得好的问题。

过去,很多 AI coding 工具,定义还停留在集成大模型,然后做代码⽣成或补全助⼿的角色上,只能完成简单的单一功能生成,且生成的内容往往与原有代码结构并不匹配,往往还需要大量的人工操作,更不用提完成需求-设计-开发-测试的全链路闭环。

以用户注册功能为例,基础的 Copilot 仅能生成基础表单代码,却无法关联数据库表结构、调用短信验证接口,更无法自动编写单元测试,而这些附加工作占实际开发工作量的 70% 以上。

也是因此,进入 2025 年,AI 编程从代码补全升级为任务执行逐渐成为共识,而 Agent 能力也成为了核心竞争力来源。

其显性代表是不久前更新的 Cursor,其 2.0 版本的 UI 界面就不再以文件为核心,而是围绕 Agent 进行重新设计,支持并行运行最多 8 个 Agent。但这仍未解决 agent 的执行黑盒问题:开发者无法追踪任务拆解过程,出错后难以定位根源。

针对这一 Agentic Coding 落地困境,Qoder 的突破在于开创性引入了 Quest 模式与 Spec 驱动的核心理念,实现 Agent 能力的可控可追溯。

Quest 模式的核心是借助任务委派和多任务并行执行,实现多 Agent 并行处理独立子任务(如接口开发与测试编写同步进行),且能自动处理依赖关系(如子任务 1 未完成时,子任务 2 无法启动)。进一步推展人+ AI 开发的时间和空间。

在此基础上,Qoder 通过 TO-DO 列表,进一步将任务结构化,确保智能体执行任务的准确性。

例如,将生成订单接口任务拆解为查询商品库存→创建订单记录→扣减库存→生成物流单四步,每步显示状态、依赖资源、耗时:若扣减库存失败,系统会标注可能的出错原因以及解决方案,开发者也能直接在 TO-DO 列表中修改参数,系统实时调整执行逻辑。

Spec 驱动开发则从源头解决开发者与 AI 之间的需求理解偏差。Specification(需求规范)作为开发者最熟悉的协作载体,被 Qoder 确立为任务执行的前置条件:开发者明确需求后,AI 会基于 Spec 生成开发计划,自主完成代码编写、测试脚本生成、结果校验等全流程,最终输出包含代码文件、测试报告、待确认问题的执行报告。这一模式使开发者工作重心从实时盯屏修正代码转向需求定义与结果审核,甚至支持离线提交任务后等待推送反馈,彻底重构人与 AI 的协作关系。

 

03

破局 AI Coding 的不可能三角

 

长期以来,各种 AI Coding 工具,都存在能力-场景-成本的不可能三角。

模型能力强的工具,往往成本失控;而成本管理优秀的工具,则往往场景覆盖与技术能力有一定缺陷。

以海外两大 AI Coding 工具为例:Claude Code 的 Max 版本定价 200 美元/月,Cursor Pro 20 美元/月,对于不少想要尝鲜的用户来说,是笔不小的成本。而且,多数 AI Coding 工具在会员制基础上,还会额外采用按 token 计费的模式,这就导致复杂任务易耗尽额度。

与此同时,现有工具普遍存在场景局限:Cursor 聚焦 IDE,Claude Code 侧重文档,导致开发者需要同时为多个昂贵的开发平台付费,并且不断切换工作流。

这就导致,如何对这些产品进行选型,以及高性价比的使用,就成为了最大的行业痛点。

针对以上痛点,Qoder 选择对齐标准+全场景高性价比方案的两步走解决行业困境。

首先是标准层,Qoder 针对常见的 AI Coding 需求发布了覆盖多场景、多语言、多模态的 Qoder 评测集;在此基础上还推出了自动化评测框架 Qoder Bench,能够度自动化 & 并行化对 AI Coding 软件进行实时评测、线上 A/B Test,让用户在 能力-场景-成本的不可能三角中,选出最适合的方案。

全场景高性价比方案,则可以从场景以及价格两方面来理解。

Qoder 在已有 IDE、CLI 基础上,全新发布 JetBrains 插件,全面覆盖了三种编程主流产品形态的全链路场景:IDE 面向百万行代码级复杂工程,整合全量核心能力;JetBrains 插件适配 IntelliJ IDEA、PyCharm 等主流开发工具,实现零学习成本接入;CLI 则针对服务器运维、快速代码审查等轻量场景,提供终端级高效支持。

三端数据和账号、Credits 实时同步,确保开发者在不同场景下的体验一致性。开发者在 CLI 生成的脚本可直接在 IDE 中编辑,消除了大量手动同步、配置和环境切换的琐碎工作,提供无缝、一致的开发体验。

而在定价上,Qoder 直接推出了首月首购 2 美元/⽉福利。

伴随普惠的,则是 Qoder 更智能的成本控制模式。通过上线模型分级选择器,Qoder 可以自动为不同任务匹配最优模型:轻量模型适配代码补全、注释生成等简单任务,成本仅为 SOTA 模型的零头,还能带来响应速度的极大提升;架构重构、跨模块开发等复杂任务则调用高级模型,比固定用单一模型节约更多成本。

据 Qoder 创始人丁宇(叔同)在接受采访时解释,Qoder 有大量用户和真实使用数据,可以从统计学层面知道不同场景最适合哪种模型。而如果让用户手动选择,首先会打断思路,其次也不现实——没人能在每次提问时都换模型。一般人都是开启一个新会话选好模型后一路用下去。所以 Qoder 没有透出模型选项的核心理念是机选优于人选,希望通过强大的模型调度能力,能自动判断并为每一个问题选出最合适的模型,这样用户体验和效果都更好。

这也是 Qoder 和其他产品最大的不同:用效果说话。

Qoder Bench 数据显示,在复杂任务测试集中,Qoder 综合效果评分领先行业 13.22%,而按同等任务量计算,其耐用度比 Cursor 高 104.9%。

 

04

尾声

 

进入 2025 年,伴随 AI 的普及率大幅提升,大模型行业一个最深刻的变化就是 SOTA 刷新频率与「aha 时刻」的密度呈现反比——参数竞赛的边际效益递减 ,行业终于回归技术落地价值的核心命题。

相应的,在各种绘画、ppt、coding 等细分方向,做深,做性价比,也做专业用户的口碑,从小的体验做起,让工程化能力与模型能力并进成为新的主流。

Coding 是走向 AGI 的必经之路。Qoder 是帮助大模型通过实际编码任务来提升端到端能力的重要载体。它服务开发者,也服务更广的场景。从战略上讲,它是阿里整个 AI 体系的重要组成部分。

AI 编程的竞争焦点,也从谁能生成更炫的 Demo 转向谁能解决生产环境的真实软件开发问题,而这,正是 Qoder 真正的意义所在。

当「一人公司」成为现实,我们要如何重新「发明自己」?

2025年11月28日 17:22

这几年,企业在谈「转型」,行业在谈「重构」,但最先被改变的,从来都是个体。

有人因为掌握了 AI 工具,效率翻倍,成了团队里最不可替代的那个人;有人因为 AI 工具,填补了自己的短板,成功开启「一人公司」的征程,启动了创业。

也有人在焦虑:「技术越来越强,我的位置在哪里?」

12 月 6 日下午,在极客公园创新大会的「小场深谈」里,我们把这件事拎了出来,做成一个主题:

AI 时代的个体进化论

我们想聊的,不是「AI 很强、AI 很快」这种宏大叙事,而是更具体、更贴近、更刺痛的问题:

  • 当 AI Agent 重塑了工作流,一个人可以做过去十个人的事,我们会不会变成组织里的「小齿轮」甚至「可替代」?
  • 创意在被批量生成,我们该如何保持自己的「差异」?
  • 如果 AI 可以复制几乎所有东西,那它到底复制不了什么?
  • 一个普通人,该凭什么构建属于自己的商业闭环?

这些话题,我们请了 真正站在变化前沿的人 ,来一起拆开谈。

他们中,有人已构建起基于 AI 的独立商业体系,有人在企业组织内开辟出创新路径,有人在探索人与技术共生的全新可能。

我们一直认为, 技术的本质不是替代,而是放大;被放大的不仅是系统,更应该是人。

我们想通过这场活动,把「被放大的个人」放到台前,让更多人看到:

  • 一人公司不是神话,而是方法论;
  • AI 带来的不是「人的替代」,而是「身份的拓宽」;
  • 职业的未来不在岗位描述里,而在我们能创造出的价值中。

我们希望每位走进现场的人,都能在这场对话里获得一个明确的方向:

不是你会不会被 AI 替代,而是你打算如何成为更强大的自己。

这是一场为「超级个体」准备的聚会。每场嘉宾对谈后,都有观众互动提问时间,激发新的思考。

12 月 6 日,北京 798艺术区,让我们一起,聊聊 AI 时代的「个体进化论」,聊聊 AI 时代的个人,怎样进化为新的物种。

敬请期待。

 

还有一件很重要的事

为了确保大家在大会两天时间里,不蜻蜓点水,而是真有收获。提醒大家 IF 大会每日的主会场门票和每日单独主题的「小场深谈」门票, 是相互独立的,不同的门票只能进入对应会场哦。

希望这可以让大家可以真正聚焦和沉浸在感兴趣的话题里,毕竟不同会场会有时间重叠,提前做好选择很重要哦。因为它们是两场平行发生的对话,互不包含,但各自精彩。

所以——

如果你已经买了小场深谈的票,但没抢到主论坛的门票,你还可以利用此最后机会单独购买主会场门票;

如果你只买了主会场票,却对某个小场深谈特别心动,也别忘了去补一张对应场次的专场票哈。

宗馥莉卸任娃哈哈集团公司董事长;小米、OV 等手机厂商取消 AIR 机型;Deepseek 推出新数学模型

2025年11月28日 09:38

市场监管总局开展手机行业反不正当竞争合规指导

11 月 27 日消息,据「市说新语」公众号,11 月 26 日,市场监管总局在广东深圳对手机和手机应用平台企业开展反不正当竞争合规指导。

市场监管总局通报了手机行业不正当竞争典型案例,并指出,作为数字经济关键组成部分,手机和手机应用领域当前非理性竞争问题较为突出,部分企业利用技术、数据、平台规则等优势实施流量劫持、强制跳转、恶意不兼容等不正当竞争行为,损害其他经营者和消费者的合法权益,扰乱市场公平竞争秩序。

市场监管总局强调,手机行业相关经营者要切实增强责任意识,深入学习新反不正当竞争法,高度重视反不正当竞争合规工作。要全面排查风险隐患,建立健全内部合规管理体系,自觉维护公平竞争市场环境。要坚决停止并防范各类不正当竞争行为,推动形成优质优价、良性竞争的市场秩序。要遵守法律和商业道德,共同构建健康有序、互利共赢的产业生态。

市场监管总局将持续强化反不正当竞争监管执法,不断完善公平竞争制度规则,用好梯次性监管工具,切实维护市场公平竞争和消费者合法权益,推动手机行业规范健康可持续发展。(来源:IT 之家)

宗馥莉卸任娃哈哈集团公司董事长

 11 月 27 日消息,企查查显示,11 月 27 日,杭州娃哈哈集团有限公司发生工商变更,宗馥莉卸任法定代表人、董事长、总经理职务,由许思敏接任,同时,多位主要人员发生变更。

股权信息显示,目前宗馥莉仍持有杭州娃哈哈集团 29.40% 的股权。

据澎湃新闻报道,11 月 18 日,娃哈哈集团召开 2025 年销售会议,娃哈哈总经理许思敏代表娃哈哈集团发言,宗馥莉未出现在现场。

许思敏表示,过去一年市场环境复杂,全球经济复苏承压,消费市场迭代加速,行业竞争愈发激烈,但越是艰难险阻,越能彰显同心协力的力量,「娃哈哈牢牢站稳了近 10 年业绩巅峰,实现稳健增长。」

在今年 1 月举行的娃哈哈集团全国销售工作总结大会上,宗馥莉曾宣布,公司 2024 年营收回到 700 亿元区间,较上年增加 200 亿元,涨幅约 40%。这时距离宗馥莉正式掌舵娃哈哈不足一年。(来源:IT 之家)

 

长安、华为、宁德时代三方联手!阿维塔向港交所提交上市申请书

11 月 27 日消息,港交所文件显示,阿维塔科技 (重庆) 股份有限公司向港交所提交上市申请书,联席保荐人为中信证券、中金公司。

招股书显示,公司截至 2025 年 6 月 30 日止六个月收入为 122.08 亿元,同比增长 98.5%。

其中,车辆销售收入 114.9 亿元,其他业务(包括辅助驾驶解决方案、生态系统和售后服务以及销售零部件)收入 7.18 亿元。

若阿维塔上市顺利,这将是长安汽车、华为、宁德时代三方联合孵化的首个 IPO 项目。

据了解,阿维塔成立于 2018 年,最初由长安汽车与蔚来汽车合资成立(当时称作「长安蔚来」),在 2021 年蔚来退出后,阿维塔引入华为、宁德时代两大战略投资者,形成「CHN(长安、华为、宁德时代)」协同模式。(来源:快科技)

 

三星与 SK 电讯联手研发 6G 人工智能将全面接管网络管理

11 月 27 日消息,据媒体报道,韩国科技巨头三星与 SK 电讯正率先布局下一代通信技术。2025 年 11 月,双方正式签署合作协议,共同推进 6G 研发,核心目标是构建由人工智能全面接管网络运维的智能通信系统,实现「自感知、自优化」的下一代通信架构。

根据协议,三星研究院将主导硬件与射频技术研发,SK 电讯则依托其在韩国的大规模现网资源,提供真实测试环境。

双方重点聚焦未来无线接入网(RAN)的重构,使其具备实时环境感知与参数动态调节能力。这一理念也与二者共同参与的「AI-RAN 联盟」——一个致力于推动 AI 原生无线网络标准化的国际组织高度契合。

具体而言,AI 将在 6G 中承担三大关键职能:一是实现「AI 信道估计」,通过预测信号在复杂城市环境中的反射与衰减,提前补偿失真,确保连接稳定;二是推动「分布式 MIMO」技术落地,使来自多个基站的天线协同工作,而非各自为战,从而扩大覆盖范围并提升信号质量;三是优化数据调度与路由,在网络拥堵时智能分配资源,减少延迟与卡顿。

三星自 2019 年启动 6G 基础研究,目前已为 Verizon、Airtel、O2 等全球主流运营商提供 5G 设备,积累了扎实的商用经验。而 SK 电讯作为韩国领先的移动运营商,拥有高度成熟的 5G 基础设施,为 6G 原型系统验证提供了理想平台。(来源:快科技)

 

OpenAI 称青少年先规避安全机制后才在 ChatGPT 协助下自杀 否认法律责任

今年 8 月,Matthew 和 Maria Raine 夫妇起诉 OpenAI 及其首席执行官 Sam Altman,指控公司对其 16 岁儿子 Adam 自杀一案负有法律责任,理由是 ChatGPT 涉嫌协助其儿子实施自杀。周二,OpenAI 对此案提交了法律回应,坚称公司不应对这起悲剧负责。

OpenAI 在其声明中称,Adam 在大约九个月的使用过程中,ChatGPT 曾超过 100 次建议其寻求专业帮助。但根据原告父母的说法,Adam 设法绕过了公司的安全机制,最终令 ChatGPT 详细提供了包括药物过量、溺水和一氧化碳中毒等多种自杀方式的「技术细节」计划,还协助他规划了一场所谓的「美丽自杀」。

OpenAI 强调,Adam 绕过安全机制已经违反了服务条款,条款中明确用户不得绕过平台提供的任何保护措施。此外,公司也指出其常见问题页面一直告知用户,ChatGPT 的回答需得到单独核实,不建议完全依赖。

Edelson 律师认为,OpenAI 的回应并未正面解决家庭的关切。他称:「OpenAI 和 Altman 至今还无法解释 Adam 生命最后数小时发生了什么——那时 ChatGPT 不仅给了他鼓励,还主动提出帮他写遗书。」(来源:cnBeta)

多家手机厂商取消 Air 机型

小米、OPPO、vivo 等手机厂商最近都取消了各自的 Air 机型项目,并将原本搭载在 Air 机型上的 eSIM 方案放到常规机型中。

供应链知情人士称,小米曾规划真 Air 机型,其产品对标苹果放在高端数字系列产品线上,有明确的路标。vivo 用的则是 s 系列中端产品线,在原系列的基础上主打轻薄,其他厂家则没有太多明确节点信息。

截至发稿,小米、OPPO、vivo 对此消息暂无回应。

目前荣耀仍有类似项目,但不以「Air」来命名,联想和传音则还保留有 Air 机型。

iPhone Air 自 2025 年 10 月 22 日发售以来市场表现不佳,销量低于预期。据《The Information》报道,苹果重要供应商富士康已拆除了大多数 iPhone Air 生产线,「仅留下了一条半的生产线」,预计本月末将全面停产。另一家供应商立讯精密(Luxshare)则已于 10 月底停止生产。

报道还称苹果公司已将下一代 iPhone Air 从其发布计划中移除。

对此消息,有苹果供应商告诉界面新闻,苹果目前没有明确说下一代 Air 产品不做。目前 iPhone Air 可以帮苹果做超薄电池和部分感传感器的技术验证,为后续的折叠屏产品做准备。(来源:界面新闻)

 

​李想终于承认,他们走错了方向

11 月 26 日,理想汽车交出了一份让人「五味杂陈」的成绩单。看着财报上的数字,很多投资者可能会皱起眉头:营收同比下滑 36.2%,曾经引以为傲的整车毛利率掉了 5 个百分点,净利润更是直接由盈转亏。更让人揪心的是,那个曾经充沛的自由现金流,这次也出现了流出。

如果只看这张表,你可能会觉得理想「病了」。但有意思的是,在随后的财报电话会上,李想并没有像往常那样,去解释业绩指标的变化,也没有用话术来粉饰短期业绩的震动。相反,他直接抛出了一项关乎理想汽车未来命运的重大决定:终结过去三年的「职业经理人」管理实验,全面回归「创业公司」模式。

从 2025 年 Q4 开始,理想将全面回归创业模式。理想表示,这不仅仅是口号,而是管理颗粒度的剧变:从「汇报」到「对话」: 减少 PPT,增加面对面的深度碰撞。从「资源占有」到「效率提升」: 去年花 10 块钱做的事,今年必须花 8 块钱,省下来的 2 块钱去投未来。从「避责」到「解决关键问题」: 职业经理人倾向于制造信息不对称来保护自己,而创业者必须直面血淋淋的问题。

如果单从财务数据看,理想 Q3 的业绩报告是一份「不及格」的答卷:营收下滑、利润亏损、自由现金流流出……但从企业经营的底层逻辑看,却可以看到了一种难得的「清醒」。在大多数车企还在为「多卖几辆车」而疯狂打价格战、堆配置的时候,李想选择了在财务最困难的时候,做最难的事情:重塑组织、自研芯片、押注具身智能。(来源:极客公园)

 

安卓版微信更新:聊天能发实况图了

11 月 28 日消息,REDMI 产品经理胡馨心表示,安卓版微信聊天能发实况照片,选中照片上的实况后,发送的照片将会包含动态画面和声音。

目前这项功能在逐步推送中,部分用户需要等一等,相信很快就能体验到。

目前微信朋友圈已支持发布实况图,发布时可以关闭实况效果,也支持静态照片与实况照片混合发布,发布后朋友圈图片将出现实况圈效果。(来源:快科技)

 

DeepSeek 推出 DeepSeekMath‑V2 模型,主打自验证数学推理能力

11 月 27 日消息,DeepSeek 发布了 DeepSeekMath‑V2,主打可自我验证的数学推理训练框架。

团队认为,仅追求最终答案正确率难以保证推理链条的严谨性,尤其在定理证明等需要逐步推导的任务中更为突出。模型通过构建基于 LLM 的验证器,对生成的证明进行自动审查,并利用扩展的验证计算持续生成高难度训练样本提升验证器能力。

DeepSeekMath‑V2 基于 DeepSeek‑V3.2‑Exp‑Base,在 2025 年国际数学奥林匹克竞赛(IMO 2025)与 2024 年中国数学奥林匹克竞赛(CMO 2024)中均达到金牌水准,并在 2024 年普特南数学竞赛(Putnam 2024)中取得 118/120(近乎满分)的优异成绩。官方称,尽管尚有大量工作待推进,当前成果已表明:可自验证的数学推理是一条切实可行的研究路径,有望为构建更强大、更可靠的数学智能系统奠定基础。(来源:IT 之家)

 

绿源与越疆达成战略合作,推动 5000 台机器狗规模应用于智慧门店升级计划

11 月 27 日晚间消息,绿源集团与越疆科技在金华签署战略合作框架协议。基于在产品研发与产业应用层面的深度共识,绿源与越疆将共同推动规模达 5000 台机器狗应用于智慧门店升级计划,探索具身智能在智慧门店、智能工厂等场景的应用。

据悉,本次合作致力于构建「技术驱动+场景落地」深度融合的智能机器人 (16.970, -0.09, -0.53%) 商业范式,为行业建立可复制、可推广的智慧门店系统解决方案,树立具身智能在商业端规模化应用的行业标杆。双方利用各自领域优势联合开发行业级具身四足机器人项目,越疆负责总体机器狗开发,绿源负责关节电机模组,电池、轮胎的部件开发。(来源:新浪科技)

「第二大脑」来了!夸克 AI 眼镜发布:搭载阿里千问 1999 元起

11 月 27 日消息,首个搭载千问助手的智能硬件夸克 AI 眼镜正式发布,这标志着阿里千问首次走出屏幕,进入物理世界。用户可随时随地唤起千问,结合眼镜获取的实时音视频数据,体验完全不同于手机 APP 的助手能力。

阿里巴巴集团副总裁吴嘉表示,夸克 AI 眼镜让千问更充分地连接物理世界,千问将继续向更多智能终端延展。

目前夸克 AI 眼镜搭载的千问助手已经融合支付宝、高德地图、淘宝、飞猪、阿里商旅等阿里生态核心场景,初步具备了在物理世界辅助用户、帮用户办事的能力。

据悉,夸克 AI 眼镜提供 S1、G1 两个系列,售价方面,夸克 AI 眼镜 S1 标准套装售价 3999 元,夸克 AI 眼镜 S1 超级续航套装售价 4299 元,参与首周预售即可获得相关权益,包括夸克网盘 3 年 SVIP 会员、配镜享 9 折优惠、12 期免息分期、好评晒单有礼等等。

夸克 AI 眼镜 G1 威灵顿框售价 1999 元,夸克 AI 眼镜 G1 风尚眉框售价 2199 元,夸克 AI 眼镜 G1 威灵顿框太阳镜款售价 2299 元。(来源:快科技)

 

代号「哪吒」:小米 17 Ultra 手机曝光,后置三摄方案

11 月 27 日消息,科技媒体 XiaomiTime 昨日(11 月 26 日)发布博文,分享了小米 17 Ultra 手机的最新消息,透露该机开发代号为「哪吒」(Nezha),并展示了手机的后置相机布局。

外观方面,小米 17 Ultra 似乎延续了小米 15 Ultra 标志性的圆形相机模组设计,不过摄影套件揭示的最关键细节在于,原先预计的第四颗镜头开孔被一个特殊传感器取代,相机单元从四个减少为三个。

代号方面,消息源挖掘发现小米以「哪吒」为代号,测试了以下多种传感器配置:

nezha_sunny_ov50m_front

nezha_sunny_ov50m_ultra

nezha_sunny_s5kjn5_tele

nezha_s5kjn5_ultra

nezha_semco_ovx10500u_wide

nezha_semco_s5khpe_tele

影像方面,该媒体预估小米 17 Ultra 的配置如下:主摄:5000 万像素的 OVX10500U 传感器;长焦镜头:2 亿像素 S5KHPE 传感器;超广角镜头:5000 万像素的 OV50M 或 S5KJN5 传感器;前置摄像头:5000 万像素的 OV50M 传感器。

其它规格方面,小米 17 Ultra 将采用高通第五代骁龙 8 至尊版芯片,预装 HyperOS 3.0,此外已确认其国际版机型将支持卫星通信功能,为用户在偏远地区提供可靠的连接保障。(来源:IT 之家)

全国首例「医保价」脑机接口手术完成 置入费 6552 元/次

11 月 27 日消息,据媒体综合报道,11 月 26 日,在华中科技大学同济医院神经外科,我国首例按照政府核定医疗服务价格项目执行的脑机接口手术顺利完成。

此次手术采用武汉衷华脑机融合科技发展有限公司生产的植入式脑机接口设备,可用于监测大脑手部运动和感觉区域的脑电信号。

值得一提的是,本次手术是我国首例按照政府核定医疗服务价格项目执行的脑机接口临床操作(即侵入式脑机接口置入费 6552 元/次,不含脑机接口设备等费用),标志着脑机接口技术从科研探索阶段正式进入医疗服务收费目录体系,在推动技术普惠化与产业化方面迈出重要一步。

今年 3 月 31 日,湖北省医保局率先发布全国首个脑机接口医疗服务价格,明确「侵入式脑机接口置入费」为 6552 元/次。这一开创性的政策,为脑机接口技术纳入规范化诊疗体系铺设了制度通道。

但从政策出台到临床落地仍需关键一跃。同济医院负责人表示,本次手术的费用虽然是由研究经费承担,无需患者自付费用,但这是全国率先将脑机接口手术纳入医院诊疗项目体系,并按照规范标准进行收费结算的临床实践。(来源:快科技)

硅谷在追逐「永生」,他只想给你一个「AI 医生」

2025年11月27日 17:09

在科技的「奥林匹斯山」上,硅谷的诸神正痴迷于一场终极游戏:永生。

从 Bryan Johnson 的「蓝图计划」(Project Blueprint),每年花费数百万美元只为「逆转」生理年龄;到马斯克和 Altman 押注脑机接口,试图将意识上传,实现「数字永生」。

图片来源:网络截图

他们汇聚了世界上最聪明的头脑和最海量的资本,试图用 AI 和生物科技撬动「神」的权柄。在他们宏大的叙事中,AI 的终极价值,似乎就是服务于「个体永生」的伟大幻想。

但,AI 的价值仅此而已吗?

 

01

「 长生」是幻想,「健康」是刚需

 

我们必须承认,AI 在生命科学领域早已展现了改天换地的力量。谷歌的 AlphaFold 精准预测蛋白质折叠,AI 辅助新药研发,这些都在解决人类「生存」与「健康」的根本问题。

而在中国的 AI 牌桌上, 王小川 是一个「异类」。

就在一年前,当行业还在「卷」通用基座时,他已经率先一头扎进了「医疗」这个窄门。在当时,这几乎是一个不被理解的选择。

他已经敏锐地洞察到: AI 的终局,不在于「广度」的炫技,而在于「深度」的信任。如果不走通在医疗、法律等高风险领域,AI 永远没办法走向 AGI。

图片来源:视觉中国

当「永生」的幻想高高在上时,他却一头扎进了最朴实、也最刚需的场景——他要给每个人配备一个「AI 家庭医生」。

 

02

你的门票,通向 AI 的另一种未来

 

长生虽好,但近乎幻想;AI 普惠,才是眼前刚需。

相比于遥不可及的「大脑永生」,针对每个人数据定制的健康大模型,才是这个时代最真实的 AI 普惠,能真正改变亿万家庭的健康轨迹。

如今,王小川的「定力」已经让他迈出了坚实的第一步。

已经在医疗领域表现领先的 Baichuan-M2 Plus 医疗模型,仅仅是他宏大蓝图的序章,其核心目的,是彻底验证「高可信」AI 在医疗这条路上的可行性。

现在,「第一步」已经走通,

那么,「第二步」是什么?

他将如何从「可信」走向「普惠」,让 AI 医生真正走进千家万户?

在极客公园创新大会 2026 上, 王小川将首次系统分享他关于「AI 医生」的完整蓝图,并重磅揭晓他的「第二步」计划。

作为探索者,他一年前究竟看到了怎样的未来图景?

在攻克「AI 幻觉」的深水区,他和团队积累了哪些不为人知的经验?

「AI 医生」的普惠之路,将如何从这关键的「第二步」开始?

立即购票,来现场,聆听 AI 医疗的中国答案。

还有一件很重要的事

为了确保大家在大会两天时间里,不蜻蜓点水,而是真有收获。提醒大家 IF 大会每日的主会场门票和每日单独主题的「小场深谈」门票,是相互独立的,不同的门票只能进入对应会场哦。

希望这可以让大家可以真正聚焦和沉浸在感兴趣的话题里,毕竟不同会场会有时间重叠,提前做好选择很重要哦。因为它们是两场平行发生的对话,互不包含,但各自精彩。

 

听说你要做「硬件创业」?你真想明白了吗?

2025年11月27日 17:06

在罗永浩最新的视频播客中,罗老师告诉知名 B 站网红「何同学」,如果当年不做「TNT」,可能锤子手机还能继续再做几年。

不知道当年的「锤粉」们,听到罗老师这句话,心里作何感想。

创业做硬件,在供应链异常成熟的中国,似乎是一个非常简单的事情——就像不少人直到现在还认为,国产手机本质是「组装厂」。

但其实,伟大的 idea+天才产品经理+成熟供应链,未必一定等于一个成功的硬件和企业。毕竟,地表最强硬件公司苹果,也曾经推出过夭折的「牛顿」。

AI Pin 的故事,则是这个真理的又一次循环:

它曾拥有一个「天选开局」——团队出自苹果,手握顶尖设计品味与巨额融资,瞄准了全新的交互方式。但结果证明,即便拥有明星光环,也并不代表你的产品不会最终被退货率超 80%,以远低于估值的价格,被传统公司收购。

随着 AI 技术的爆火,硬件,再次成为创业风口。

在 AI 硬件的长征里,理想与现实之间,横亘着一道名为「实现」的鸿沟。鸿沟之下,是供应链的未知深渊,是产品从「可用」到「好用」的漫漫长路,更是一场与市场耐心的极限赛跑。

每一项挑战,都是一道鬼门关。每一次前行,都是一场豪赌。

AI 硬件的机会是真实的,但成功需要的不只是愿景与品味,更需要穿越生死线的系统能力、对市场的准确预估,以及从别人的挫折中习得经验。

因此,我们邀请你,与三位真正走在创业路上的探索者们,进行一场深度对谈。他们将分享自己闯过「大难」的实战经验,助你避开那些可能让你满盘皆输的「大坑」,在关键节点做出更清醒的选择。

在我们不说正确的梦想,我们聊真实的教训与经验。我们会讨论:

  • AI 世代的孩子,会有怎样的童年?
  • AI Native 的交互方式,藏着什么新机会?
  • AI 眼镜的「非共识」路径,如何塑造人机关系的未来?

12 月 7 日(周日)下午,极客公园创新大会 2026,分会场 A,硬控 AI 专场|AI 硬件的机会和「大坑」。

带上你的信仰与勇气,在「硬控 AI 专场」,听实战经验,然后闯出自己的路!

还有一件很重要的事

为了确保大家在大会两天时间里,不蜻蜓点水,而是真有收获。提醒大家 IF 大会每日的主会场门票和每日单独主题的「小场深谈」门票,是相互独立的,不同的门票只能进入对应会场哦。

希望这可以让大家可以真正聚焦和沉浸在感兴趣的话题里,毕竟不同会场会有时间重叠,提前做好选择很重要哦。因为它们是两场平行发生的对话,互不包含,但各自精彩。

深度复盘:从推荐算法、XR 到 AI,过去 12 年字节跳动的技术演进史

2025年11月27日 16:56

 

在刚刚结束的第五届字节跳动奖学金颁奖典礼上,字节跳动技术副总裁杨震原通过回顾过去 12 年的技术演进,分享了一些外界鲜为人知的“幕后故事”。

 

比如这家以算法著称的公司,其实早在 2021 年就曾尝试训练大语言模型并用于搜索相关性任务,但因为当时效果提升微弱且成本高昂,得出了「这个LLM目前没什么用」的结论,一度搁置,「所以还是很没眼光」。

 

但凭借在基础设施(Infra)领域的深厚积累,字节在 2022 年迅速调整方向并后来居上。其构建的 MegaScale 训练系统实现了超过 55% 的浮点运算利用率(MFU),不仅支撑了“豆包”成为中国最流行的 AI 助手之一,也让火山引擎能以极低的成本提供模型服务。

 

而在硬件领域,针对 2023 年 Pico 减少市场营销投入的动作,杨震原澄清道,这是因为当时的硬件体验尚未成熟,公司选择转向更底层的核心技术攻坚。

 

为了解决传统 VR 设备“看不清”的痛点,字节跳动自 2022 年起与供应商联合定制 MicroOLED 屏幕,试图将 PPD(角分辨率)从行业的 20 提升至 40 以上,其 4000 PPI 的像素密度甚至是 iPhone 17 Pro Max 的近 9 倍 。

 

此外,为了解决 MR 混合现实中的眩晕与延迟问题,字节跳动甚至全链路自研了一颗头显专用芯片,芯片在2024年回片,目前进入量产阶段,各项指标均达到设计要求,目前系统延迟已压低至 12 毫秒,远超行业 25 毫秒的极限。

 

杨震原也透露,经过这些底层技术的沉淀,新的 XR 产品预计将在 2026 年发布。

 

而从 2014 年团队仅仅只有 5 个人负责核心算法,却定下一个激进的目标:在第一版推荐系统中就实现“万亿(T)级别”的特征规模的故事里,也能看出这家公司在面对技术浪潮时的决策逻辑与工程底色。

 

面向未来,杨震原提出了一个关于 AGI 的思考实验:只有当 AI 能完成人类 95% 的工作(从初级客服到顶尖科学家)时,才能称之为实现了通用人工智能。

 

目前大模型在“持续学习能力”和“与物理世界交互(IO)”方面仍有短板,这正是技术人未来需要攻克的关键方向 。

 

以下为杨震原分享原文:

 

AI 万象,最近直播间一款很有梗的产品

2025年11月27日 14:54

在快手最新发布的第三季度财报中,AI 深度渗透进了内容创作与商业变现的每一个环节。

一个尤为值得关注的信号来自直播业务,这个看似传统的业务板块,其稳健增长曲线的背后,首次出现了可灵 AI 规模化落地的身影。

这款名为「AI 万象」的产品,将 AI 生成礼物变为直播间里的日常互动,并在上线首日就创下纪录,用户付费生成并送出超过 10 万次个性化定制礼物。

与传统的预设动画不同,每个 AI 礼物都需要云端大模型在几分钟内,根据用户上传的照片实时生成高质量短视频特效,并无缝分发给直播间内的所有观众。

借助可灵 AI,「AI 万象」正在将原本高门槛的 PGC 生产流程,变成一场全民参与的创意狂欢。这场礼物特效的升级变革,掀起了一场 AIGC 对直播互动生态的深度重塑。

 

01

体验为先:AI 礼物解锁个性化表达

 

直播礼物的演变历程,本质上是一部技术驱动体验进化的编年史。

从早期的「小可爱」静态图标,到支持动画素材、实时加载头像、DIY 文字,再到如今「一支穿云箭,千军万马来相见」成为深入人心的社区文化符号,每一次重大体验升级的背后都有新技术的影子。直播礼物也演进为富含情感的社交货币。

「直播作为一个实时互动媒介,礼物本质上是线下社交行为的线上映射,」快手直播活动负责人魏玉龙表示,「就像结婚要送钻戒、春节要发红包,直播间里对兄弟可以发啤酒,对异性可以送花,这些礼物承载着特定的文化符号意义,用户自然会产生个性化表达的诉求。」

过去,快手直播曾尝试提供定制礼物服务,但高昂的成本令其难以规模化推广。可灵 AI 的出现带来了转机。早在其上线后,快手直播团队就已尝试借助图生视频能力优化礼物创作,但不稳定的「抽卡」效果仍不具备大规模落地的条件。

随着可灵 AI 技术能力持续完善,「AI 万象」才被顺水推舟提上日程。其探索直指两个核心命题:一是如何给用户更优质的创意体验,二是如何将成本降至可普及的水平。

在直播间这个强互动、注重即时反馈的场域,实时性与体验流畅性是生命线。「体验不好,用户就留存不了」,这意味着复杂的 AI 技术必须隐藏在极简的操作之后。

为此,团队选择了稳妥的起步方式:提供固定模板,用户仅需上传一张人物照片,即可生成专属礼物特效。从图像预处理、prompt 适配到文生图、图生视频,整个复杂的 AI 生成链路被完全封装在云端,用户无需感知任何技术细节,真正实现了无门槛操作。

与此同时,AI 礼物的制作成本得到大幅降低,且只支付一次,即可将独家特效永久收入礼物背包。魏玉龙指出:「更低的用户成本意味着更广泛的用户渗透,而更优质的使用体验将进一步推动这一进程。」

这一策略的有效性得到了数据验证。「AI 万象」灰度测试期间,仅面向 200 多个主播开放,AI 礼物的转化率就比普通礼物高出 30% 至 50%。9 月 24 日正式上线后,成果更为显著:首日用户付费生成并送出量便突破 10 万,实时排队请求高达 4000,许多用户宁愿等待 8-10 小时也不选择退款,参与热情远超团队预期。

当用户内心深处对个性化表达的渴望,被低门槛、高效率的技术方案满足,便会迸发出巨大的市场能量。而直播行业本身成熟的付费心智,也为「AI 万象」的落地提供了理想土壤。可以说,快手直播团队敏锐地抓住了用户愿意为创意和情感付费,且技术能颠覆传统成本结构的黄金结合点。

 

02

产品攻坚:实现稳定可用且好用

 

将前沿的模型能力转化为稳定可靠的用户体验,整个过程被团队形容为「唐僧取经」,需要突破重重技术难关,任何一环的缺失都会导致功亏一篑。

团队始终明确一个目标:为用户提供「自动挡」般的流畅体验,全力降低使用门槛。从技术架构到产品设计,这对整个团队而言是一场需要紧密协作的「立体战」。

在技术层面,算力支撑成为首要挑战。传统方案是在礼物种类有限的前提下,提前下载动效至用户本地进行播放,但在「万人万面」的实时生成需求面前,显然已行不通。

「AI 万象」搭建了一个云端特效工作室,当用户送出 AI 礼物时,复杂的生成过程完全在线上完成,有效规避了海量个性化内容对用户设备存储和平台带宽的冲击。

「我们需要通过技术手段,扛住 AI 礼物在直播间并发制作的问题。这涉及到大量工程细节。经过反复调试和上线后的不断优化,如今我们逐渐适应大量用户的同时需求,用户生成一款万象礼物制作时间可以控制在三分钟内。」快手直播活动技术负责人陈曦说。

针对生成式模型固有的不稳定性,团队构建了一套精密的「预处理+智能拦截+质量检测」流程:通过图像预处理自动优化用户上传图片的质量,利用精细化 prompt 为 AI 的创作划定明确边界,最后再通过专门的 AI 检测模型对生成结果进行美学评判与安全过滤。

凭借这套组合拳,「AI 万象」将 AI 礼物的最终良品率稳定在 92% 的高水平,为规模化应用扫清了障碍。

在产品设计层面,团队意识到,在社交送礼这一特定场景中,情感价值与创意趣味往往比绝对的视觉精度更为重要。

快手直播设计负责人海生表示,「我们推出的特效设计,是契合快手直播用户与主播对礼物创意的偏好特点——大家更喜欢直给、超现实的概念和物象,营造突破现实边界的场景表达。礼物特效需要成为直播间的 『氛围引爆点』:通过构建超现实画面,既满足了用户对新鲜体验的期待,更强化了直播间的视觉张力与互动氛围。」

放在直播间,用户追求的是特定的情感共鸣和氛围感受,这反而降低了对模型细节完美度的要求。例如,当用户想要流星雨效果时,他们期待的是满屏流星划过的浪漫与壮观,而非特定星座的精准再现。

因此,团队首批推出了「天使之翼」、「至尊王座」等四款氛围感十足的礼物,并创新性地引入「盲盒」机制,在同一模板下随机生成不同颜色、光效的变体,甚至设置「隐藏款」,极大地激发了用户的收集热情。

同时,设计团队与技术团队通力合作,精心优化从上传、生成到发送的完整操作链路,确保每个环节都流畅自然。这种技术攻坚与用户体验设计深度融合、始终以用户为中心的解题思路,最终为用户带来了超越期待的惊喜体验。在一些直播间里,AI 礼物已经催生了「抽象玩梗」的趣味文化。

值得关注的是,在首批上线的四款礼物中,定价最高的「至尊王座」反而销量不错,这充分证明了优质、新奇的体验本身就能创造巨大的商业价值。

 

03

未来图景:创意生产力的全民下放

 

目前,「AI 万象」已稳步进入常态化运营阶段,其迭代方向清晰地指向两个维度:模板的持续丰富与体验的深度优化。

现代社会多元化的审美需求,呼唤更多样的场景适配。团队结合节日热点与用户情绪不断拓展创意场景,如双 11「光棍节」的双人特效、万圣节的主题特效等;未来,可定制的内容也将更加多元,例如让指定物品出现在用户心仪的任何场景。同时,从单人到双人、从单镜头到组合镜头的体验升级,将指数级地拓展创意的可能性空间。

虽然仅短短几秒,礼物特效作为一种内容载体,其核心驱动力始终是创意本身。随着用户认知的形成和工具的进化,创意的表达将会被彻底打开。

当 AI 让内容产能从稀缺走向丰沛,乃至无限,所有基于内容生产的工业化场景都将被重塑。快手通过「AI 万象」在直播场景的成功实践,为整个行业探索 AIGC 技术规模化落地提供了可行路径与生态范本。

❌
❌