普通视图
比亚迪计划到2026年年底建设落成2万个闪充站
欧盟最终批准2040年气候目标
*ST辉丰:拟1.1亿元转让大丰农商行3.9%股权
广安爱众:参与设立投资基金,投资于低空无人机领域、自动驾驶领域等
林俊旸离开的48小时:一条朋友圈、一个小模型、和一个万亿美金的假设
「按照原来安排继续干」
离职的消息最沸沸扬扬的时候,在 Qwen 团队的核心负责人林俊旸在朋友圈发了两句话:
![]()
「Qwen 的兄弟们,按照原来安排继续干,没问题的。」
「安排好的」?这是什么?
林俊旸离开前夕,Qwen 团队刚刚发布了一件被全球开发者社区刷屏的东西。Qwen 3.5 Small 系列,参数量从 0.8B 到 9B,专为端侧设备设计,可以在普通笔记本电脑上运行。
![]()
不是一个更大的模型——而是一组更小的模型。要知道,过去三年里,AI 行业最强大的共识是「越大越好」。OpenAI 的 Sam Altman 四处筹措万亿美金建设算力基础设施,各家实验室军备竞赛般地烧钱烧卡,底层假设只有一个:模型越大,就越聪明。
这套逻辑被称为 Scaling Law,它不仅仅是一条技术规律,更像一种信仰——整个行业的融资叙事、人才分配、硬件投资都建立在这个前提之上。
但 Qwen 3.5 Small 的发布,和林俊旸的离开,同时发生。一个技术信号和一个人事信号,交织出一个更复杂的故事:小模型到底在发生什么?它为什么重要?
当 9B 打赢 120B
即便不是开发者,也可以跑分上一窥 Qwen 3.5 的战绩:
Qwen 3.5 Small 系列中,9B 参数的模型在多项基准测试中全面超越了 OpenAI 的 gpt-oss-120B——一个参数量是它 13 倍的模型。
![]()
这些不是边缘指标上的微弱优势,而是在核心推理任务上的系统性领先。一个可以装进笔记本的模型,在数学、科学、视觉推理上全面击败了一个需要数据中心级硬件才能运行的对手。
当然了,摸着良心说,gpt-oss-120B 不是 OpenAI 的旗舰产品,而是其开放权重的中端线。而且它采用 MoE 架构,标称 120B 参数,但每个 token 实际只激活约 5.1B 参数——所以参数量的对比,在工程层面并不像字面数字那么悬殊。
但这不影响趋势本身的成立。因为 Qwen 3.5 Small 并不是孤例。
同一时期,Nature 报道了一个微型递归模型(TRM),在 ARC-AGI 逻辑测试中击败了多个顶级大语言模型。Google Research 在 2026 年初发表论文,证明小模型在意图提取任务上的表现优于显著更大的模型。PNAS 上的一项研究更直接——模型规模与说服力之间呈急剧递减收益,大到一定程度之后,更大几乎不带来更好。
![]()
《华尔街日报》早在 2025 年 10 月就已经敢说,「大模型拿走了所有的关注,但小模型才真正干活的那个。」
这些信号共同指向一个判断:以小博大不是偶发事件,而是大势所趋。
那么问题来了——小模型凭什么?
才不是大模型的替身文学
直觉上,人们容易把小模型理解为「大模型的平替」,同样的方法,只是规模小一些,性能差一点,胜在便宜。
但事实恰恰相反:今天的小模型之所以能以小博大,是因为它们在技术方法论上,走了一条和大模型完全不同的路。
第一,数据质量压倒数据规模。 大模型的路线是「尽可能多地吞入互联网数据」,而小模型路线的代表——比如微软的 Phi-4 系列——走的是精筛路线:用高质量的合成数据加上严格筛选的公开数据集,让模型在更少的数据上学到更精确的能力。这背后的逻辑转变是根本性的:不是「喂得越多越聪明」,而是「吃得精才学得好」。
![]()
第二,原生多模态设计取代了适配器拼接。 传统做法是先训练一个纯文本大模型,再通过适配器模块接入图像、视频、音频等能力。Qwen 3.5 采用了完全不同的架构:将视觉 token 和文本 token 在同一个潜空间中联合训练,从底层就是多模态的。这意味着它是一个天生就同时理解文字和图像的模型。这种架构在小参数量下反而更有优势,因为不需要额外的适配器开销。
![]()
第三,量化技术带来的不只是压缩。 4-bit 量化常常被理解为「把模型压小 4 倍以节省存储」,但它真正的意义在于减少 4 倍的内存吞吐量。在端侧设备上,瓶颈往往不是存储空间,而是内存带宽,也就是数据从内存搬运到处理器的速度。量化技术让小模型在带宽受限的手机和笔记本上,获得了决定性的速度优势。
这些方法论上的突破已经开始转化为产品。3 月第一周,苹果发布了 M5 全线芯片,每颗 GPU 核心内置 Neural Accelerator,AI 性能较 M1 提升最高 8 倍。与此同时,苹果研究院公开了 Ferret-UI Lite——一个仅 3B 参数的端侧 GUI 代理,可以本地操控手机和桌面应用。加上 Apple Intelligence 约 3B 参数的端侧基础模型,苹果正在将「on-device AI」从概念推进到芯片、模型、交互三位一体的产品形态。
![]()
微软的 Phi-4 multimodal 也开始尝试商用上线 Azure,3.8B 参数,接受文本、音频和图像输入。开源社区的反馈更加直接——Reddit 上的开发者实测后认为 Qwen 3.5 的 4B 版本是「甜点级」模型:跨任务稳定、无崩溃、远快于 9B 版本。
技术路线已经被验证,产品化拐点已经到来,天边泛起鱼肚白,曙光乍现。
而就在此刻,林俊旸选择离开。
最会做小模型的公司,最没有动力让它成功
Qwen 3.5 Small 在发布后获得了开发者社区的广泛认可,开源社区的评测结果甚至超出了官方发布时的宣传。
但是,他所在的公司是阿里巴巴,阿里巴巴的商业引擎是阿里云。
大模型和云计算之间存在天然的正向循环:模型越大,推理所需的算力越多,客户就越需要购买云计算服务。对阿里云来说,大模型是完美的商业叙事——它同时推高了客户的算力需求和对云平台的依赖。
![]()
而小模型的逻辑恰恰相反。小模型的核心价值在于可以在端侧设备上运行——手机、笔记本、边缘服务器。这意味着客户可以绕开云,在本地完成推理。对用户来说,这意味着更低的成本、更好的隐私和更低的延迟。但对阿里云来说,这意味着收入被侵蚀。
Qwen 3.5 Small 做得越好,对阿里云的商业叙事就越尴尬。
这不是阿里一家的问题。放眼中国的科技巨头,几乎所有 AI 领先的公司都面临同样的结构性矛盾。百度和腾讯的处境与阿里类似——商业模式建立在云服务和平台抽成之上,小模型的端侧化趋势直接削弱了它们的价值主张。
字节跳动的豆包手机是一个有趣的例外,但字节做硬件才刚起步,远没有建立起「芯片+操作系统+模型」的垂直整合能力。
华为理论上最有条件,既有芯片,又有终端设备。但在制裁的影响下,它的算力上限本身就逼着它走小模型路线,这更多是被动的求生策略,而非主动的战略选择。至于小米、OPPO、vivo,它们有设备,却不是 AI-first 的公司,缺乏自研模型的基因和持续投入的动力。
全球范围内,真正打通端侧 AI 全栈的公司,可能只有一家:苹果。芯片、设备、操作系统、自研模型,全部自有。苹果的动力来自复合型的商业模式,这驱动它把一切计算尽可能留在设备上,因为每一次端侧 AI 体验的提升,都会转化为硬件的溢价和生态的黏性。
![]()
不过,这里需要诚实地处理一个可能的反驳:云厂商难道不能走「端云协同」的路线吗?用小模型做端侧入口,复杂的推理任务回调云端处理,两边都不耽误。
理论上可以。但这恰恰说明了问题——在端云协同的框架下,小模型对云厂商来说是「引流工具」,而不是「独立产品」。云厂商没有动力把小模型做到好到不需要云。
还有一个绕不开的反例:微软也是云厂商,但它在认真做 Phi-4 系列小模型,而且已经商用上线。这是否说明「左右互搏」的论点站不住脚?
非也。微软之所以能两条腿走路,是因为它同时拥有 Windows 和 Surface 的硬件生态、Azure 的云平台以及 Copilot 的端侧产品线。做 Phi-4 对微软来说是防御性布局:如果端侧 AI 的趋势不可逆转,为了大局,宁可壮士断腕,自折一臂,也不能把端侧市场拱手让给开源社区和苹果。
![]()
但阿里没有这个选项——没有消费级操作系统、没有主流终端硬件、没有面向个人用户的 AI 产品矩阵。Qwen 做得再好,也没有自家的「最后一公里」可以落地。
动力不同,产品的天花板就不同。
这就形成了一个令人不安的画面: 小模型从实验室走向产品的真正瓶颈,不是技术能力,而是供需错位;最擅长做小模型的公司(云厂商),最没有动力让它真正成功;最需要小模型的公司(设备厂商),又缺乏独立研发的能力。
「没问题的」
回到林俊旸的那条朋友圈,「继续按照安排好的干,没问题的」。
也许技术路线确实没有问题,一切都在朝着正确的方向走。但在一家以云为重的公司里,就算做出世界级的小模型,团队的处境注定不会舒适。
这不是对阿里的批评——任何一家以云收入为生命线的公司,面对一项可能侵蚀自身收入的技术路线,都会陷入同样的两难。这是一个结构性矛盾,不是个人或管理层的选择问题。
比人事更值得关注的,是 Scaling Law 本身正在发生的变化。
过去三年,「越大越好」不仅仅是一条技术规律,它是整个 AI 行业的信条。融资叙事围绕它建立——投资人相信更大的模型意味着更强的能力,所以万亿美金涌向算力基础设施。人才分配围绕它运转——最顶尖的研究者被吸引到训练最大模型的团队。硬件投资围绕它定价——英伟达的估值建立在一个前提之上:对算力的需求会永远增长。
现在,这个前提正在松动。MIT 的研究估计,效率提升将使中等硬件上的模型在 5 到 10 年内逐步追平最大最贵的模型。芝加哥大学的研究表示,数据质量正在取代数据规模成为核心竞争维度。
![]()
产品化的方向不再只有云端,而是同时向端侧扩散。Scaling Law 正在从一条单调递增的曲线,变成一张需要在多个维度上寻找最优解的地图。
不再是「越大越好」,而是「在对的地方,用对的大小」。
林俊旸大概比大多数人更早地感受到了这个变化。他用 Qwen 3.5 Small 证明了一件事:在对的方法论下,9B 参数可以击败 120B。但他同时也撞上了另一堵墙——技术上的正确,不等于商业上的可行,更不等于组织上的舒适。
他说,没问题的。确实,技术路线已经铺好了,而剩下的问题不在实验室里,而在实验室外面。
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。
宏盛华源:下属子公司预中标9.75亿元南方电网项目
聚飞光电:公司MicroLED技术未应用于CPO领域,也未因CPO产生收入
奔驰新车平台首落中国,要用吉利架构 | 36氪独家
今年1月底,奔驰管理层开始不断出现在吉利杭州湾研发中心,36氪从多位产业人士处了解到,两家车企巨头正在商谈一场整车电子电气级别的合作。
电子电气架构,也叫EE架构,是汽车智能化、数字化、网联化的基础,也是支撑辅助驾驶、智能座舱的核心。或者说,它就是智能汽车时代,车企口中的“灵魂”部分。
2月初,吉利管理层又带着翻译人员前往上海金桥,与奔驰进一步敲定了合作方向。
目前,双方已经达成共识,奔驰将基于吉利的GEEA4.0电子电气架构,开发全新的电动车平台。
吉利GEEA4.0架构,是吉利集团正在开发的、油电通用的电子电气架构。2024年,GEEA3.0架构首发于银河E5车型,这一架构曾为吉利撑起了百万级的销量规模。
吉利是奔驰母公司戴姆勒的最大机构股东,从发动机、到混动系统以及智驾,双方业务交往颇多。
但整车级的合作,这几乎是首次。事实上,在行业中,也几乎只有大众和小鹏、斯特兰蒂斯与零跑等车企之间,通过强资本绑定,方能展开整车级的深度合作。
奔驰对此早有一场更为宏大的规划。
36氪从多位与奔驰有业务往来的知情人士处获悉,奔驰已经启动了一个代号为“凤凰”的新平台,支撑全球的入门级电动车型,正是这个全新平台,将融合吉利GEEA4.0架构。
消息人士透露,奔驰正紧密筹备“凤凰”平台的开发工作,预计在2030年实现SOP。届时,它将代替奔驰现有的、油电同行的MMA平台,打造奔驰旗下的A级、B级、GLA、GLB、CLA等紧凑型车型。这些车型将面向全球进行销售。
奔驰品牌的紧凑型车型,利润空间虽不如奔驰E级、S级等车型,却也占据去年奔驰全球销量的约20%,也是奔驰吸引年轻用户的基础。
36氪曾报道,奔驰曾在开发电子电气架构软件时碰壁,并因此推迟了纯电长轴距版奔驰CLA的投产。如今,痛定思痛的奔驰,决定借用吉利的电子电气架构,加快自己的电动化转型进程。
实际上,大量跨国车企宥于软件产业的基础,都曾在EE架构上遇到挑战。36氪曾报道,大众投资小鹏后,甚至派德国软件工程师前往小鹏接受长期培训。
借用自主品牌的“软”实力,开发电动车的外资车企,奔驰不是第一个,也势必不会是最后一个。
奔驰中国接手紧凑车开发,辐射全球
过去三个月,奔驰公司内部经历了一场重大调整。
去年年底,奔驰董事会主席康林松与多位高管进行了多场会议,商讨公司未来的战略方向。“如何降本、实现盈利是核心议题”,知情人士告诉36氪。
不到一个月,这场会议的决策成果便下发至奔驰中国研发中心:奔驰中国研发中心迎来新角色,成为全球紧凑型车开发总部,独立负责紧凑型新车的设计开发,德国研发中心则将专注于中大型车。而“凤凰”平台正是奔驰中国接手全球紧凑型车型后的第一个项目。
这也是奔驰130余年历史上,首次将新车平台的独立开发权,交由德国总部以外的研发中心。
接近奔驰的人士告诉36氪,“最近1-2年,奔驰一直在研究中国汽车的成本魔法”,降本便是奔驰该决策的核心目标之一。
这场变革,雷厉风行。
1月中下旬,新车项目便已浮出水面:在MMA平台之后,奔驰将启动名为“凤凰”的新平台以生产紧凑型新车,该平台由中国研发中心独立负责,暂定将于2030年推进SOP。
MMA平台是奔驰继EQ系列后的第二次电动化尝试,于2024年面世,该平台规划了纯电CLA、混动GLA/GLB等车型。
在奔驰2024年公布的信息中,MMA平台应用800V高压架构、配备碳化硅电机,车辆续航里程均达到750km以上,且配备新一代智能座舱与L2+级辅助驾驶,几乎已与当时国内主流新能源汽车平台站在同一起跑线。
不过,直到2025年11月,MMA平台首款车型纯电CLA方在中国市场开启交付。同一时期,中国新势力品牌新车已经走进座舱大模型时代,智能驾驶也已进入L3级硬件备战赛。
在快速迭代的市场中,奔驰的抉择体现了最根本的商业理性:与其持续投入资源为MMA平台解困,不如直面沉没成本,将力量集中于赢面更大的未来。
新启动的凤凰平台,便是奔驰的新锚点。
过往,外资品牌在中国的研发模式,一直局限于“总部开发,中国团队验证导入”。这个合作模式下,中国团队大都没有新车开发项目的完整开发经验。
但智能电动车产业在中国的成熟,逐渐扭转了这个作业局面。大众首先变阵,以打造“中国狼堡”的愿景,两年时间,在安徽建起一个超3000人的研发中心,支持大众新车的开发,其中便包括电子电气架构等核心部分研发。
奔驰中国研发中心早在2014年就已落地,经历十年发展,目前总人员规模在2000人左右。而奔驰为了追击电动化,也正在尝试将整车级开发权限交给中国团队,以从中国的电动化沃土中汲取资源。
不止吉利,奔驰广泛物色产业链
尽管不拥有董事会投票和实际经营权,但不可否认,吉利依然是奔驰的第一大股东。股权上的紧密联系,为奔驰和吉利的合作创造了许多先决条件。
MMA平台之前一代的混动CLA、GLA车型,便搭载了与吉利合作开发的发动机;奔驰中国筹备的混动新车项目,也拟采用吉利旗下的动力技术。数次合作下,奔驰和吉利之间已具备信任基础。
36氪此前曾报道,奔驰内部长期对中国市场的新车竞品进行调研活动,针对个别车型更是会进行全方位的拆车研究。其中,吉利集团旗下的极氪001便曾是奔驰的首款拆车研究对象。
有知情人士告诉36氪,奔驰公司内部对极氪001的评价不俗,“工程师们认可极氪001的技术和用料都不错,并且拆车后发现,001的成本比奔驰低非常多”。
“所以,凤凰项目的第一志愿,其实是极氪的电子电气架构”,知情人士向36氪表示。
吉利集团旗下的电子电气架构主要有GEEA及ZEEA等。ZEEA 3.0是吉利旗下的核心架构之一,但目前仅用于极氪品牌,“ZEEA架构投入不小,成本挺高的”,有知情人士向36氪表示。
GEEA则用于吉利博越/星越、银河E5、领克900等车型。接近吉利的人士向36氪透露,相较GEEA3.0版本,GEEA4.0架构不仅性能有所提升,还在底层架构上做了更多集成化的努力,“简单点说,更好用,还更便宜了”。
而成本,正是奔驰此次寻求合作的核心诉求。
36氪获悉,除了吉利的整车架构,奔驰也在与比亚迪初步接洽,寻找电池领域的合作。
智能电动,中国技术赋能全球产业
吉利与奔驰的合作,折射的是智能汽车时代,自主品牌技术反向输出的新趋势。
传统汽车时代,整车制造相关技术及标准,皆掌握在外资车企手中,“市场换技术”是国内汽车产业的鲜明标签。
而智能汽车时代下,智能化水平越来越成为一款车产品力的新标尺。智能化是许多中国车企的优势,却是诸多外资车企的弱项。
奔驰曾因电子电器架构软件开发进展不顺,推迟纯电长轴版CLA的投产;
大众也曾因为同样的原因,导致基于PPE平台开发的奥迪Q6L、A5L、保时捷Macan EV等车型的上市,有不同程度的推迟。
于是,外资品牌开始寻找可结盟的中国车企。
2023年,大众与小鹏曾发布公告,双方达成技术框架协议,将共同开发两款大众品牌电动车型,同期大众向小鹏投资约50亿元人民币。去年,双方的合作,从大众在中国市场纯电平台,扩大至燃油和混合动力车型平台。
也是在2023年,Stellantis与零跑合资成立零跑国际,零跑为Stellantis输送LEAP 3.5 架构、三电技术等,换取Stellantis在海外的渠道与产能。
除此之外,在奔驰之前,雷诺也与吉利有着多年的深入合作:
2022年,吉利对韩国雷诺输出CMA架构与混动技术,得到了雷诺在韩国的设计与渠道;去年,雷诺又宣布借用吉利GEA纯电架构打造两款电动车型,作为回报,吉利EX5、EX2等出海车型可以借助雷诺渠道在巴西上市。
今年2月,据路透社报道,福特也流露出与吉利合作的意向,双方正在讨论,让吉利用福特在欧洲现有的产能来生产汽车,吉利则对福特输出自动驾驶系统、智能网联软件等领域的技术。
大众、奔驰、福特……这些急于在智能化中转型的跨国车企,先后借用中国车企的“灵魂”补齐智能汽车开发能力,这或许正预示着新的全球汽车产业格局的到来。
![]()
作者微信:luckg17305264638