阅读视图

发现新文章,点击刷新页面。

世界模型,是自动驾驶的终极答案吗?

图片来源:视觉中国

文|肖漫

编辑|李勤

过去两三年,车企谈智驾必提及各类新颖的技术名词。

世界模型是继端到端、 VLA 后,智驾领域最时髦的词。不同公司还给它套上新的外壳——小鹏推出了“世界基座模型”、蔚来的叫“端到端世界模型”、华为的叫“世界行为模型”(WA)。除了他们,地平线、理想、元戎启行、Momenta也在做世界模型。

但只看他们的发布会,很难分清它们口中的世界模型到底是不是同一种东西?它究竟解决什么问题,又被放进智能驾驶架构的哪一个位置?

把视角拉到更广义的语境里,“世界模型”本质是在虚拟世界里再造真实世界,人工智能能像人一样理解现实世界,认知物理规律、事物的因果关系和环境动态的技术。

世界模型被大部分科学家和科技公司视为“物理世界 AI”技术远征的关键拼图。斯坦福大学教授李飞飞曾指出,空间智能是AI的下一个十年,而世界模型是构建空间智能的关键技术。

走在行业前沿的科学家和科技公司还在探索当中,但中国汽车行业已经用各种新颖的概念名词把位置占住。

实际上,智驾行业里今天谈的“世界模型”也只是名词差异,在技术路径上并没有太大差别。只是对行业原来的仿真工具进行技术范式升级,在还原度更高、颗粒度更高、场景更丰富、自由度更高的虚拟世界中,解决端到端模型测试、验证问题,这一切都是为了训练出效果更高、更加拟人的端到端智驾模型。 

换句话说,智驾厂商和车企并非真正打造一个完整的数字物理世界,只是用世界模型的思路造仿真器。

也许各家对于世界模型的期待有所不同,但据我们了解,截至目前,智驾行业的世界模型只应用于云端,并没有用到汽车上。

端到端普及,凸显仿真器短板

过去两三年,头部梯队的智驾方案从规则栈转向AI驱动,在“形式上”完成了统一,感知、预测、规划被尽可能揉进一张网络里,外加更大的模型、更高的算力,用车企常在发布会上的话说“端到端之后的智驾更像人在开车”。

但在实际应用上却出现了一个反直觉现象:端到端之后的新版本OTA并不一定变得更好,甚至可能“退步”。

问题的核心不是模型变差了,而是AI驱动让评估和回归变得困难。

当时许多智驾从业者认为,只要把前端训练得足够好,车就会开得足够像人。这条路径并非没有效果,端到端的前期表现让许多智驾从业者大为震撼,但端到端的“黑盒”形态也带来的副作用,当模型出错时,研发人员很难得知为什么犯错?如何证明它在下一次不会再犯?

模型好不好不再只是“训练得够不够大、数据够不够多”的问题,更取决于你如何发现问题、定义问题、验证问题。厂商们逐渐意识到,需要一个更好的仿真器在模型验证阶段用来评估模型的表现。

头部梯队玩家大都打造世界模型作为仿真器应用。为了能够让理想VLA在仿真环境里进行强化学习,理想在2025年提出了一种包含自车和他车轨迹的驾驶世界模型,充当打分老师;小鹏尽管对外只说了“世界基座模型”这一本质上世界模型无关的技术名词,但据36氪汽车了解,小鹏也在采用世界模型做仿真测试,评测新版本的模型算法能力。

端到端的普及暴露出传统仿真器的短板。“以前端到端还不是这么普及的时候,大家验证成本也没那么高,还可以分段去验证一下系统。现在端到端了以后,没法分段验证系统了,这个时候仿真器的问题就凸显出来了。”一位业内研发人员说道。

在规则时代,车企做仿真往往服务于两件事,一是半路接管的问题重现,把路测里出过事的片段拿回来回放;二是的使用仿真器增加corner case的数据丰富度,在模拟器里搭几个典型路口、横穿行人、加塞车辆的脚本场景,让系统跑一遍。

当时的仿真器更多承担“放大镜”的角色,但端到端之后,模型很难再把责任拆开,且很难系统性地产生更细的、可控的 corner case,更难支撑端到端所需要的大规模闭环验证——而这正是世界模型被引入的原因。

端到端时代,世界模型是智驾模型的“教练”

“目前国内车企世界模型的水平和特斯拉存在一定距离,不过仅相差了不到一年时间。”一位业内人士说道。

特斯拉并未使用“世界模型”的概念,而是采用了“世界模拟器”的说法(特斯拉自动驾驶副总裁Ashok Elluswamy在去年的ICCV上首次提及),该模拟器基于特斯拉自建的海量数据集进行训练,根据当前状态与下一步动作生成未来状态。从而与车端的端到端基础模型闭环,做真实效果的评估。

特斯拉神经网络闭环仿真(图片来源:

一位业内人士指出,特斯拉更像是在用神经网络“拟合”世界,渲染过程是通过计算生成,尽量减少显式的物理规则堆叠;素材库也并非完全由人提前预定义,而是保留了某种概率权重与组合空间。而这么做的好处是,模型能够具备更强的泛化能力。

国内车企走的多是另一条更“可控”的路。与36氪汽车交流的一家供应商表示,理想采用的是 3D 高斯重建——这也是目前大多数车企在采用的方式之一。

无论是哪种路线,世界模型在工程上最终都指向同一个位置:世界模型正在被车企当作端到端时代的“验证与反证系统”,用来在云端重放、改写、扩增现实驾驶中可能发生的情境,检验车端大模型的输出是否稳定、可复现,并把“哪里错、为什么错”重新变成可追踪的证据链。

世界模型扮演的角色好比教练员,优秀的教练员更能够调教出优秀的运动员。“随着云端世界模型越来越强,理论上训练出来端侧模型能力就应该是越来越强。”一位研发人员说道。

世界模型核心能力主要有两个方面:一是对物理世界的数字化建模和抽象;二是基于这样的建模,产生对物理世界合理的想象和预测,例如通过给定的图片预测未来世界将会如何变化。

世界模型的好坏取决于就是在云端能生成足够真实、足够多样性的数据。“车企如果只是用采到的真实数据去做仿真,那显然并不是在做世界模型,只是做一套回放数据的流程而已。”一位供应商产品经理说道。

世界模型需要从物理世界的数据中学习到世界的运行模式,因此世界模型的训练数据质量会显著影响模型生成的质量。极佳视界产品线负责人毛继明提到,“对于世界模型这样的生成模型,它的生成结果最终会对齐输入数据的特征分布规律。在真实的世界模型商业化过程中我们发现,如果数据质量只有60分,基于此的世界模型的生成数据质量可能就只有55分。”

基于世界模型,车企在云端做仿真的时候,可以无限制的从各个维度去去生成需要的场景,能够根据指令生成视频作为训练数据。“效率比真实采集后再去训练高了不是一星半点,模型迭代速度也会是断代式领先。”一位供应商研发人员说道。

但这些都是理想化的结果。“世界模型相对于智驾用的仿真器来说,或者说没有仿真信息,只能用离线采的数据来做验证已经是很大的升级了,但距离理想状态的仿真器还差得多。”

世界模型算法还未成熟,还有很多“幻觉”

行业现在普遍处在“刚开始”的阶段。

一位车企研发人员告诉36氪汽车,国内厂商基于世界模型最长能生成30-60秒视频片段,但动态物体的一致性并不好,无论是时空的一致性还是多视角一致性都存在较大问题。

世界模型的底层是生成式模型,而生成式模型天生带着“幻象”的风险。“世界模型目前最难的地方是怎么能保证生成的东西是真实的,如果是生成一个人,怎么保证他的行为、轨迹是在真实世界里可能发生的。”一位供应商产品经理说道。“如果世界模型生成错乱,会导致模型学到的东西都是错的,进而导致到部署到车端的模型效果非常差。”

一个极端的例子是,如果云端生成的车都是横着走的,那模就会认为一个在左前方的车会瞬间移动到右前方,在实际开车的过程中,模型就可能做出刹车的行为。

一个仿真器如果无法逼近现实世界的关键因果关系,比如湿滑路面对制动距离的影响、逆光下对静止物体的误检概率、并线时对方车辆的博弈策略等,它生成的“corner case”就可能是假的;你在假问题上优化,等于把研发资源浪费在幻影上。

在很多人看来,世界模型的瓶颈在数据与算力,但前理想汽车辅助驾驶“端到端”模型负责人夏中谱更同意Lecun的观点:“世界模型算法层面没有大突破,图像模型的自监督训练还没有像语言那样,找到一个比较顺的范式。”

语言模型之所以能迅速规模化,一个原因是语言本身信息密度高,每个词都携带明确的语义约束。而图像信息密度低,对“驾驶决策”而言,有用信息只占极小部分。

例如,模型不需要预测正后方很远那辆车的轨迹,也不需要预测远处建筑物的变化,这些都是噪声数据;但必须预测本车道前车是否会突然急刹、旁车是否会抢道、行人是否会突然横穿,模型要先知道“该把注意力放在哪”。

“目前智驾算法提取不出足够对驾驶有用的图像信息。”夏中谱说道。一张图像有可能有上百万个像素点,但跟决策相关的就20多个像素点,其他的都是噪音,模型得先学会从噪声里抓出那 1‰ 甚至 1‱ 的有效信号,再谈得上如何把信号组织成可用于推理与预测的结构。

夏中谱看来,世界模型算法尚未突破,更谈不上数据是否足够、算力需要多少的问题。也正是世界模型现在基础技术还没看到明确突破,车企的投入更多是研究性质的,甚至部分车企老板对此都是迷茫。

如果世界模型做得足够好,且在算力能够支撑的情况下,是能够放进车端。“国内现在基本把世界模型当仿真系统用,对智驾决策层面的技术理解程度还不够。”夏中谱说道。

它也能解释一个表面矛盾:为什么各家都在讲世界模型,但用户体感差异并不明显——因为大多数人的世界模型仍停留在“用于训练与验证”的第一阶段,而不是进入“能支撑决策规划”的第二阶段。

“端侧部署世界模型是最难的。”夏中谱说道。

目前还没有任何一家公司在端侧应用世界模型。他同时指出,“使用大模型方法建模物理世界,通过自身与物理世界的交互预测世界发展变化,进而通过决策影响世界朝着对自身有利方向发展。如果世界模型做到这个层面,自动驾驶和机器人相关问题都是可以解决的。”

索尼上调全年经营利润预期

2月5日,索尼集团发布财报显示,2025财年第三季度经营利润5150亿日元,同比增长22%;净利润3773亿日元,同比增长11%。公司预计全年经营利润1.54万亿日元,此前预计1.43万亿日元。(界面)

恒指午间休盘跌1.27%,恒生科技指数跌1.16%

36氪获悉,恒指午间休盘跌1.27%,恒生科技指数跌1.16%;贵金属板块领跌,天齐锂业跌超12%,万国黄金集团、五矿资源跌超9%;半导体、科技股走弱,华虹半导体、兆易创新跌超5%,哔哩哔哩、快手跌超3%;消费股逆势走强,百胜中国涨超9%,名创优品涨超5%;南向资金净买入94亿港元。

半日主力资金加仓传媒股,抛售电力设备股

主力资金早间净流入传媒、食品饮料、银行等板块,净流出电力设备、有色金属、电子等板块。具体到个股来看,协鑫集成、贵州茅台、平潭发展获净流入16.30亿元、12.29亿元、11.45亿元。净流出方面,湖南黄金、特变电工、紫金矿业遭抛售15.02亿元、13.13亿元、12.98亿元。(第一财经)

中国中免短线拉升涨超2%

36氪获悉,中国中免短线拉升涨超2%;消息面上,财政部发布关于海南自由贸易港岛内居民消费的进境商品“零关税”政策的通知。

金银大跳水 现货白银的市值约等于蒸发了一个摩根大通

北京时间09:00开始,金银大跳水。现货黄金从5006.71美元/盎司大幅下挫,最低至4805.17美元,两小时累计大跌201.54美元。根据世界黄金协会(2025年)的数据,全球地上黄金储量估计约为21.63万公吨 。若以此计算,现货黄金的市值在此时段蒸发1.4万亿美元,约等于蒸发了一个伯克希尔哈撒韦和一个AMD。同一时段,现货白银从89.56美元重挫至73.77美元,两小时累计大跌15.79美元。据CPM集团2019白银年鉴估计,全球白银开采量为175.1万吨。若以此计算,现货白银的市值在此时段蒸发8889亿美元,约等于蒸发了一个摩根大通。(新浪财经)

财政部等三部门:海南自由贸易港岛内居民消费进境商品实行“零关税”政策

36氪获悉,财政部等三部门发布海南自由贸易港岛内居民消费的进境商品“零关税”政策。政策规定,对海南自由贸易港岛内居民在指定经营场所购买的进境商品,在免税额度和商品清单范围内免征进口关税、进口环节以及国内环节增值税和消费税。其中,岛内居民包括持有海南省身份证、海南省居住证或海南省社保卡的中国公民,在海南省工作生活并持有居留证件的境外人员。免税额度为每人每年1万元人民币,不限购买次数。免税商品聚焦岛内居民日常生活所需,主要包括部分食品饮料、日化用品、家居百货、母婴用品等。

A股三大指数午间休盘集体下跌,贵金属板块走弱

36氪获悉,A股三大指数午间休盘集体下跌,沪指跌1.03%,深成指跌1.81%,创业板跌1.94%;光伏、光模块领跌,钧达股份、双良节能跌停,捷佳伟创、德科立跌超10%,源杰科技跌近7%;贵金属板块走弱,湖南黄金、湖南白银触及跌停;短剧游戏概念走强,天地在线涨停,幸福蓝海、浙文影业涨超10%;沪深京三市近3700股下跌。

马到成功CFO年会在京召开

36氪获悉,近日,由中关村中小型科技文化企业促进会、中国国际经济技术合作促进会上市公司发展工作委员会联合主办,首都统战智库联合会民营经济高质量发展专委会协办,CFO之友承办的“马到成功CFO年会”在京召开。本次活动为A股港股美股上市/拟上市公司CFO、创始人、投资机构及专业服务机构搭建了高效的交流对接平台。未来,各主办、协办、承办单位将持续发挥资源整合与桥梁纽带作用,助力企业在复杂多变的市场环境中稳健前行。

玻璃基板“黑灯工厂”投产,实现从基板到封装全链布局,「巽霖科技」完成近亿元A轮融资 | 36氪首发

文 | 张冰冰

编辑 | 阿至

36氪获悉,天津巽霖科技有限公司(以下简称「巽霖科技」)近日宣布完成近亿元A轮融资,由金雨茂物领投,海通开元、滨海产业基金、老股东厦门海弘跟投,资金将用于大尺寸玻璃基板全流程加工能力的持续扩产,下游封装模组线的研发建设、以及针对芯片载板和光模块等玻璃基板新品研发。

「巽霖科技」是36氪长期关注的企业,以玻璃基板、陶瓷基板PVD覆铜技术为核心,建设新型基板全流程生产能力,实现超高铜厚、高覆铜结合强度玻璃基板的高效率与高一致性生产。

近一年,「巽霖科技」获得了滨城人才创新创业特等奖、璞悦中国概念验证Top50等奖项,借由大客户的定制基板需求,攻克了MicroLED下一代显示技术,实现了Micro LED级别线路精度与高TGV密度基板的量产,并向先进封装领域发展。

一、迎来市场导入期,玻璃基板产业化提速

「巽霖科技」CEO甄真介绍,在RGB mini背光、Micro LED直显领域,玻璃基板迎来了市场导入的良好机遇。

在液晶显示领域,据技术研究与咨询机构Omdia预测,全球电视机年度出货量有望在2026年突破2.1亿台。在这一庞大市场中,背光技术的进步推动着显示的升级,而画质升级是核心竞争点。

近年来,HDR(高动态范围)、高色域、高对比度等画质要求推动背光技术向高分区、高精度控制方向发展。Mini LED RGB背光则是这一技术方向上的主力。甄真表示,「巽霖科技」依托玻璃基板技术,瞄准关键市场,既要做到高精度,也要做到高价值(更好的画质,更好的服务,更高的效率以及更高的一致性),实现显示产业的升级和拓容。

同时,Micro LED直显大屏,也在冲击商用大屏市场。尽管当前渗透率基数不高、头部厂商导入节奏存在差异,但行业共识在于,玻璃基板凭借其物理及性价比优势,有望在未来高端显示领域成为重要的主流工艺路线之一。

“一旦进入高分区或者低间距的领域,玻璃基板的大尺寸、线路密度、焊盘精度、平整度、线路尺度以及综合性价比带来了极大的优势。”甄真认为,面对显示领域的激烈竞争,玻璃基板是实现产品“加量不加价”的核心抓手之一。

2025年8月,「巽霖科技」在天津落地自主建设的玻璃基板全流程生产线,从切割、清洗、TGV、埋孔、覆铜、刻蚀工艺流程等方面,完全针对玻璃基定制。自动化连续生产线的“黑灯工厂”,使「巽霖科技」具备了稳定的批量交付能力。

「巽霖科技」天津“黑灯工厂”

“我们在覆铜工艺上实现的超高结合强度,达到了铜厚提升20倍、强度提升5倍的技术指标。” 甄真解释道,更高的线路结合强度,使基板在冷热循环、跌落测试及后续焊接维修中表现出更高的可靠性,这直接提升了终端产品的合格率,并最终体现在极高的生产效率与一致性。“相比传统基板,现在玻璃基板封装可以大幅提升生产良率和一致性,带来更广阔的利润空间和市场竞争空间。”

成本优势之外,基于全流程生产能力,「巽霖科技」产品可覆盖多分区在RGB mini背光、高亮直显(如万尼特级户外商用显示屏)、对亮度与可靠性有严苛要求的透明显示,以及AR HUD、激光投影、AR/VR设备等高功率精密基板领域。目前,「巽霖科技」Micro LED及COB直显屏基板相关产品将进入批量出货阶段。

「巽霖科技」基板产品

二、完善产业链布局,发力基板一体化集成技术

“黑灯工厂”跑通后,「巽霖科技」已有能力承接封装芯片基板需求,在解决高密度TGV一致性、孔边裂纹、埋孔良率和覆铜结合强度等技术指标的同时,借助玻璃的透明导光、稳定性、微加工能力和综合成本、大尺寸特性,实现光电共封与芯片载板替代。

面向更广阔的应用领域,「巽霖科技」聚焦Micro MIP工艺路线的突破,正将产品技术能力进一步向下游封装领域延伸。

Micro MIP工艺,简单来说,是一种“芯片先封装、后贴装”的中间介质方案。先将LED芯片封装成标准化的显示模组颗粒,再将其高精度贴装到基板上,是实现“终极显示技术”Micro LED的关键封装工艺。实现Micro LED的最大挑战不在于概念,而在于制造工艺:如何实现百万级的TGV通孔玻璃基板以及将数百万级甚至千万颗微米级的芯片高效、精准且低成本地转移到驱动基板上,同时保证良率。

为此,「巽霖科技」与迈为技术(Maxwell)合作,规划落地建设一条月产能千平方米级的Micro LED刺晶封装生产线。甄真介绍,“这条封装产线是一条针对玻璃基板定制的大尺寸、小芯片的刺晶封装线,该线体采用了全自动设计,可以大幅提升生产效率,取消涨缩分选,从新材料大尺寸基板的角度重新定义直显模组产品。”

Micro LED刺晶封装生产线示例图

甄真希望,借助「巽霖科技」在PCB玻璃基的批产能力和定义能力,未来无论是大显示产业链结构,还是AR/VR 眼镜复杂的内部结构(壳、导光板、导线板、连线板和主板等)都可以全部集成在一块玻璃基板,以高线路密度集成贴片,实现光机主板、灯板、器件和外壳一体化集成技术。

这意味着「巽霖科技」的核心能力将不再是一个简单的覆铜加工厂,而是可以联合行业头部企业,定义和设计产品。“我们下一步将会逐步开放玻璃基板全线程制程的能力。服务整个产业链升级,贡献我们的技术资源进行生态合作。”甄真总结。

未来规划上,「巽霖科技」预计在2026年将 基板 工厂产能从30万平米扩张到50万平米,同时将封装产线建设投产,进行实质性的 玻璃基板 模组 出货 验证 。 随着 精密线路的生产经验 的累积 ,开放玻璃基板制程生产的生态能力,服务PCB 多层板 、高清显示、先进封装以及光电 共封等领域的产业升级。 

36氪未来产业

「36氪未来产业」持续关注城市发展、产业转型和创新创业项目落地。寻求报道可邮箱联系wangfengzhi@36kr.com或扫码联系。

此外,今年36氪正式推出《36氪企业投资指南内参》,依托在经济圈产业群、区域重点推进规划与招商领域的深厚积累,36氪通过提供深入详细、更为及时、独家专有的全面信息服务,为政府部门提供高效、精准的产业项目内参;助力项目方匹配产业资金、链接关键人脉、快速融入新的产业生态。

   

本文来自微信公众号“36氪未来产业”,作者:张冰冰,阿至,36氪经授权发布。

云从科技与中冶京诚联手打造工程智能问答AI智能体

36氪获悉,近日,云从科技与中冶京诚工程技术有限公司联合作研发的“工程数字化智能辅助系统”正式落地。该系统以AI智能体(Agent)为技术核心,面向工程设计与校审场景,构建了工程领域首个全流程智能辅助体系,实现工程标准、规范与历史经验的系统化沉淀和智能化调用,标志着垂直场景下的AI应用从“概念”走向了大规模“实操”。

金价跳水,国内金饰克价回落

2月5日,国际贵金属价格再度跳水,截至发稿,现货黄金跌破4900美元/盎司,日内跌超2%。国内多个黄金珠宝品牌足金饰品价格出现回落,其中周生生足金饰品报1558元/克,较昨日1600元/克下跌42元。此外,老庙黄金足金饰品价格今日报1569元/克,周大福足金饰品报1555元/克。(第一财经)

史上首次,米兰冬奥基于阿里千问打造官方大模型

36氪获悉,2月5日,国际奥委会正式发布基于阿里千问打造的首个奥运官方大模型。该模型将在米兰冬奥会上投入使用,首批服务各个国家和地区的奥委会工作人员,提供多语言的官方AI助手,并计划随后向全球公众开放。国际奥委会主席考文垂表示,阿里千问让米兰冬奥会将成为史上最智能的一届奥运。

GQY视讯等在宁波成立新公司,含半导体相关业务

36氪获悉,爱企查App显示,近日,宁波市晶映商显科技有限公司成立,法定代表人为杨剑君,注册资本2000万元人民币,经营范围包括半导体照明器件制造、半导体照明器件销售、半导体器件专用设备制造、半导体器件专用设备销售等。股东信息显示,该公司由宁波GQY视讯股份有限公司等共同持股。

市场监管总局:整治滥用权力排除、限制竞争行为,办结案件数量同比上升32%

国务院新闻办公室今天(5日)举行的新闻发布会上,市场监管总局介绍,过去一年,开展整治滥用权力排除、限制竞争专项行动,立案调查、办结案件数量同比分别上升34%和32%。各级市场监管部门对拟由本级人民政府出台的重要政策措施开展审查,修改调整1.2万余件,有力保障相关重大政策措施符合全国统一大市场和公平竞争要求,政府行为尺度更加统一规范。(央视新闻)
❌