普通视图

发现新文章,点击刷新页面。
昨天 — 2026年5月28日首页

对话云鲸创始人张峻彬:2 年之后,扫地机器人就有「手」干更多活了

作者 刘学文
2026年5月28日 15:14

在硬件行业,规模很容易被当作一种衡量成功的标准,但它有时也是一种幻觉。

规模是看起来像更大的销量、更高的市场份额、更快的发布节奏,也像一场所有人都必须参加的军备竞赛:更多 SKU、更宽价格带、更密集的营销投放,以及更激烈的渠道争夺。尤其是在清洁电器这个行业,过去几年,扫地机器人、洗地机、吸尘器、除螨仪不断交叉生长,国补、价格战、出海、AI 和具身智能又轮番成为关键词。

另外一家总部位于苏州的清洁电器品牌制造了巨大的声量,深圳本地硬件品牌大疆和影石之间的竞争也有尖锐的摩擦啸叫,相较之下,云鲸,以及云鲸创始人张峻彬在行业的喧嚣期显得相当谨慎和沉默。

十年前,「产品经理」张峻彬需要解决的问题是「如何做出一台好用的扫地机器人」,但现在,造产品的快感不再单纯,他的职责已经从「造一台机器」,变成了「让一家公司成为一台更高效的机器」。

规模很重要,但不能强求

过去两年,国补刺激带来了阶段性的高基数;另一方面,线上红利不再像早期那样明显,线下渠道开始重新回到家电行业的主航道。张峻彬提到,今年1-4月 线上虽然有所下降,但线下增长维稳,云鲸线下增长了 150% 以上。在他看来,随着国补退却,线下业态正在回归,清洁行业的大盘仍然会继续增长:

随着国补退却以后,整个线下业态是在逐步回升的,回升速度比想象快。云鲸线下增长了 150% 以上。所以,整个线下业态回归到家电逻辑。

早期的扫地机器人,更像互联网消费电子产品,线上种草、线上转化、线上爆发,早期的云鲸 J1 就是这样获得爆发的。但当品类逐渐进入更广泛的家庭用户,尤其是进入下沉市场和传统家电消费场景,它也会重新回到家电行业的基本面:渠道、服务、口碑、价格体系、终端体验,以及长期复购。

但这并不意味着企业应该立刻把油门踩到底。

张峻彬对规模的态度很明确,规模不是不要,而是要等组织效率匹配之后再要:

在这个阶段,你的精力可能要聚焦在组织效率提升的事情上。你会发现当效率不高的时候,要砸大钱就得花费精力去盯着,这个精力就特别不划算。

所以他给出的阶段性选择是:

我现在阶段性很简单,就是加速组织体系的效率化改革,在这个过程中肯定是以利润优先,当到达一个阶段以后,我就会以规模优先,是一种战略的阶段性的选择的不同。

这背后其实是非常朴素的商业规律:如果组织本身还在漏水,越大的规模,可能只是越大的浪费。

张峻彬在采访里举了一个具体例子:以前云鲸从前端需求到后端生产,沟通时间很长,经常出现生产完之后,前端不要了的情况。后来补齐这个前后端配合的漏洞后,库存周转率得到明显提升。

消费者并不关心公司经营和治理,只在乎产品本身,但 CEO 如果沉迷产品,对供应链,库存周转,研发效率不投入足够精力,那并不算是合格的 CEO。

在宣传中,这样枯燥的库存周转效率提升几乎没有意义,但是相比于 AI 概念、具身智能概念,这更加接近一家公司真正的经营内核。

过去很多消费硬件公司在扩张时都会遇到类似的问题:产品能打,组织跟不上;渠道铺开了,价格体系乱了;SKU 多了,资源被摊薄;营销声量上去了,但用户心智没有真正建立起来。

张峻彬显然也意识到了这一点。

他提到,2025 年云鲸其实做了更多 SKU,但多 SKU 并没有带来和预期成正比的收益,所以今年反而调整策略:

我们做了很多 SKU,围绕扫地机和洗地机,但是会发现多 SKU 并没有带来预期成正比的收益。所以我们今年就调整了策略,聚焦研发,打磨最好的产品。

规模不是目的地,它更像一面放大镜。组织健康时,它放大优势;组织粗糙时,它也会放大漏洞。

对于品类扩张,他也没有把资金视为核心瓶颈,而是把问题指向「管理者的带宽」:

首先资金肯定不是一个问题。但是你的精力不足以覆盖这件事情的时候,可能就又会跑偏。可能是组织选错了人,还不如别那么快开始。

创业公司容易相信单点突破,相信一款爆品可以改写命运;但到了新的阶段,公司更需要系统能力。这就是很多企业家说的,创始人的上限就是公司的上限。

当产品经理张峻彬足够优秀的时候,就有云鲸的梦幻开局:大学毕业就创业,花了 3 年打磨第一款产品 J1,预期只卖 1 万台,结果卖了几十万台。

但当企业经营者张峻彬自己的管理者带宽没有升级的时候,就需要花费代价来学习规模很重要,但规模不能强求。

张峻彬开始找属于自己的那枚「硬币」

云鲸的变化,首先发生在张峻彬自己身上。

过去外界对他的典型印象,是在于产品打磨能力。这个标签很好理解:云鲸早期的崛起,来自对用户痛点的敏感捕捉,以及对应的产品方案。从自动洗拖布到基站维护,云鲸一直试图把用户不愿意做但又绕不开的家务细节交给机器。

不过新的阶段,张峻彬开始接管一个更复杂的系统。

他在采访中直接说,自己过去一直专注产品和研发,对营销看得很少,直到去年 9、10 月份开始接全球营销,才发现过去对商业增长的理解需要更新:

我之前一直以为产品和营销是加法逻辑,产品 + 营销,就是产品做得特别好,营销稍微少看一点,也还不错。但后面发现产品和营销是乘法逻辑,产品 X 营销,这意味着产品和营销都必须做得足够好,才能真正把公司带到一个新的高度。

很多产品型创始人都会经历类似转变:早期相信好产品会自己说话,后来发现,在一个信息过载、渠道碎片化、竞争高度同质化的市场里,好产品也需要被准确表达、被有效触达。

张峻彬用了一个比喻:找到云鲸自己的「硬币」。

在接管营销之后,他与许多行业人士沟通,有一个营销例子让他记忆深刻:卡萨帝当年在洗衣机上立一个硬币而不倒,来展示直驱电机工作时的平稳和安静。

▲ 10 多年前,卡萨帝洗衣机做的立硬币营销案例

用户也许并不懂底层技术,但看到洗衣机上立着的硬币,就知道这台洗衣机震动极小,颠覆认知地小。

在汽车领域,也有在汽车上摆香槟塔连续过减速带,通过香槟杯不倒,香槟酒不洒来表现底盘素质的优秀。

张峻彬说:

这段时间我带领大家梳理云鲸的产品真正的竞争力是什么,以及找到那个硬币的传播方式,在这个事情上我做得相对多一些。

在他看来,云鲸并不缺产品创新,但相对内敛。很多功能是「人有我优」,但如果讲不清楚,技术优势就很容易被淹没在参数和卖点里。尤其在清洁电器行业,用户购买决策又非常现实和具象:扫得干不干净、拖得干不干净、会不会缠毛、需不需要手动清理、售后麻不麻烦。

技术本身并不直接构成心智,能被用户感知的技术才构成心智。

▲ 云鲸扫地机器人的视觉能力可以帮助识别物体规划路线

张峻彬接手营销,并不意味着云鲸从产品与技术导向转向营销导向,只是创始人意识到,产品力必须经过商业系统的翻译,才会变成真实的市场结果。

这件事此前不是他擅长的:

这些事确实在我能力圈之外,但不代表我不能快速迭代和学习,这是两码事。我以前看营销和销售确实少,去年9、10 月份接了之后,其实是在疯狂地学。10 月份基本上每天干到凌晨三四点,高强度学习、高强度接触业务。

「创始人自我更新」是一种新的叙事方式,一个创始人承认自己原来的能力结构不够用了,于是重新进入一线,重新学习一套新系统,左右脑互博,文理思维碰撞是常见的现象。

在张峻彬看来,营销和技术的差异很明显:

做技术,很多地方是数理化、理工科那套逻辑,有清晰的对错边界。但营销里,第一性原理的东西也很多,不可量化的地方更多。

但他也可以把营销拆成了自己熟悉的逻辑:

搭建清晰的财务系统去监控和调整,是一个数学优化的逻辑,背后是对业务的深刻理解……公司现在产品特别多,不同产品对应的人群卡位、生命周期、资源配置和组织能力都不一样,这本质上就是个数学优化问题。

这仍然是工程师和产品经理的思考方式:面对营销这样看似开放、感性、不确定的系统,他试图先找到里面能被结构化、数据化、模型化的部分。

这也是张峻彬个人成长路径的一部分:

我觉得肯定是我在经历一个成长,从最早是一个工程师,到一个产品经理,再到一个组织的管理者,到跨领域的组织的管理者,到逐步的思考战略。

他说,云鲸早期三到四年打磨第一款产品时,他更多扮演的是产品经理和系统工程师角色,并不认为那时自己已经是一个成熟的管理者,团队从 200 人扩展到 1000 人的时候,他的管理半径没有跟上。

现在云鲸是近 2000 人规模了。

▲ 学生时期的张峻彬就是机器人爱好者

很少谈具身智能,但不代表投入很少

在过去一两年,AI 和具身智能几乎成为一级市场最热的方向,许多还没有被市场验证的项目,也能拿到很高估值。对于扫地机器人公司来说,它们天然可以把自己放进家庭机器人、空间智能、具身智能的叙事里。

不过把营销纳入自己管理范围的张峻彬并没有急着把云鲸包装成一家「具身智能公司」。

当被问到为什么没有明确说自己是一家具身智能公司时,张峻彬说:

没有对外说,不代表没有在做。但是云鲸一直以来都比较低调,我们希望把产品的很多东西做好,我们再去做这件事情。

他进一步解释说:

挂上了具身这个头衔之后,是不是对用户就更有价值?我现在判断好像也不一定会。但不代表我们没有在做具身的产品,这是两码事。一个是宣传端,一个是产品端。产品端的东西我们是非常激进地在做。

这是云鲸对具身智能的态度:宣传端克制,产品端激进。

克制的原因也很现实。对一家已经在用户心中建立「清洁」认知的公司来说,过早把自己推向一个更宏大的 AI 叙事,未必一定是好事。张峻彬担心的是,用户会觉得云鲸不聚焦:

我们确实没有说云鲸是一家具身智能公司。因为我担心给用户产生一种想法,就是云鲸是不是不聚焦了?我们还是希望把产品做好。

但宣传端克制不等于技术和产品端保守。

▲学生时期的张峻彬

事实上,云鲸已经设立了具身事业部。目前公司有三个事业部:手持清洁、扫地机和具身事业部,具身智能事业部的产品量产时间暂时保密,但「肯定不会那么远」,并且「肯定是有整机形态出来的」。

更具体的信息,来自空间清洁方向。

在回应何时「从平面清洁走向空间清洁」的问题时,张峻彬透露:

我们一直有具身的团队在做空间收纳、空间清洁的工作。某种意义上我们对于特定的、立体表面的清洁做得还是比较好的。比如说清洁马桶、立面瓷砖等等。对于很大种类物体的抓取和收纳,现在做得还是很不错的。

这是之前他接受爱范儿专访提到的产品愿景,云鲸的产品未来一定会具备空间清洁能力,但是空间清洁能力对于整体产品技术的要求是量级程度的提升,至少目前来看,他们开始攻克一些具体的场景和任务了。

张峻彬也直接提到了机械臂产品的时间判断:

我觉得在两年后可能有一个带机械臂的产品,真正能解决扫地机解决不了的很多事情的产品形态进入家庭。

从去年开始,带机械臂的扫地机器人就出现在了一些行业展会上,云鲸的认知是,给扫地机器人装上机械臂并不难,难的是这个机械臂能够做什么?

当然,张峻彬认为在扫地机器人基础上做形态创新是合理的乃至必要的。

真正的家庭机器人,不太可能一开始就以科幻电影里的仿人机器人形态出现。它更可能长在一个已经成熟的家电品类上,先解决一个明确、高频、有支付意愿的任务,再逐步增加能力。

张峻彬自己也提到,任何一个具身产品要真正突破大规模生产,都需要在一个成熟产品形态上做加法。就像 iPhone 首先仍然是一台手机,用户为它买单的基础功能依旧成立;具身产品也需要找到类似扫地机这样的基础品类,再在上面增加机械臂、视觉、交互和空间操作能力。他说:

任何一个具身产品要真正的突破大规模生产,一定是他要赋予一个像手机一样的行业,或者是像扫地机一样的东西去做加法,这个过程中才有机会做大规模的量的突破。

相比很多从零开始定义家庭机器人的创业公司,扫地机器人公司已经拥有几个关键基础:它们熟悉家庭空间,拥有真实用户数据,理解清洁任务,也已经建立了供应链、服务和渠道体系。更重要的是,扫地机器人本身就是目前最接近普通家庭的机器人产品。

从平面清洁到空间清洁,从地面移动到物体操作,从路径规划到任务理解,扫地机再往前一步,是迥异于一些人形机器人的路线。即便踏出这一步也并不简单,张峻彬也提到,这里面牵涉大量算法、产品定义和机电系统创新。机械臂不是简单装上去就能解决问题,家庭环境比工厂复杂得多:物体种类多、摆放不规则、用户容错率低、成本敏感,安全性要求也更高。

但他的判断是,这件事「越来越近了」。云鲸内部做具身智能的逻辑是,先去做技术储备和知识储备,摸索技术的天花板,然后再做产品力。

现在云鲸到了开始做产品定义的阶段了。

产品可以是一种「时间状态」,在它之前是技术,之后是营销,现在的张峻彬不再只关心如何做出好产品,也开始关心好产品如何被用户理解;不再只关心规模增长,也开始关心规模增长之前组织是否健康;不再只把自己放在产品经理的位置上,也开始进入营销、战略、价值观和全球经营这些更复杂的系统。

张峻彬在谈 IPO 时有一句话,是对这种状态的另一重理解:

我个人觉得 IPO 不是终点,只是一个开始,我希望在开始的那一刻,它会有特别好的,我们内部叫二次创业,就是希望在那一刻是一个二次创业的状态,最好的组织,最好的人才,最好的业务。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

昨天以前首页

小米最新人形机器人的手,会「出汗」了

作者 张子豪
2026年4月30日 14:15

最近小米最让我惊喜的新品,不是汽车,也不是手机,而是一款还没正式发布的人形机器人,小米 CyberOne V2。

在前天的小米投资者大会上,它第一次公开亮相。

不跑不跳,也没有表演后空翻,只是安静地站在那里,像一位训练有素的工作人员,给与会嘉宾递上伴手礼,和人握手、击掌。

小米官方目前还没有发布正式的参数,根据网上的爆料信息,小米 CyberOne V2 这款人形机器人身高 178cm、体重约 52kg。

其他的参数像是机器人的步行速度,大约为 0.98m/s,单臂的举重能力可以支撑 3kg 的重量。对比早前宇树发布的 H2 机器人,其最快行走速度是 3.3m/s,手臂最大负载 15kg,额定 7kg。

小米 CyberOne V2 的重点,很明显没有放在走路和举重上,这次最值得关注的,是小米机器人重新设计的手部。

这双手是按照成年男性的手 1:1 比例制作,具有 22-27 个自由度,不仅能做到快速拧螺丝、掌内转螺柱这些精细工业化场景的任务,还能捏羽毛和触碰气球。

更意外的是,这双手竟然还有人类的「汗腺」。

其他的爆料还提到,小米 CyberOne V2 依靠背后的情感 AI 模型,能够识别面部表情和声音,从而给出恰当的互动反馈。

但也有美国网友在下面评论说,小米 CyberOne V2 的样子和特斯拉 Optimus 也太像了,马斯克选择不提前展示 Optimus 的任何信息是对的。

此前马斯克有说过,推迟展示 Optimus V3,是为了防止竞争对手抄袭,并认为在大规模量产前,应尽可能将其藏在门后。

灵巧手是机器人的硬件瓶颈

从技术和资本市场,机器人这段时间的发展都很迅猛,几乎每天都有一个具身智能的融资。

在脚上的功夫,机器人半马刷新了人类纪录,来到了一小时内。

但在「用手操作」上,翻书、系鞋带,这些人类双手的日常操作,对机器人来说却还是天方夜谭。

具身智能的核心,其实就在于机器人的大脑如何通过物理躯体与现实世界交互,而灵巧手成了实现完美交互最大的硬件瓶颈。

多家机器人公司都曾专门研究过灵巧手的问题,强脑科技此前发布了 BrainCo Revo 3 智能灵巧手;21 个自由度,集成了全掌触觉和指尖视触觉,并且兼容开源生态。

在官方发布的演示视频里,这只手超越了人手的活动空间,并且覆盖了 33 种抓握手势,能双手解魔方,使用剪刀,和盘手串等。

灵巧手之所以成为一项难题,是难在软件和硬件同时卡住。软件上,人手到机器人手的动作需要重定向;硬件上,手指内部的小型执行器又很难同时做到有力、灵敏、可靠。

这里的「重定向」可以理解为:把人手的姿态、指尖轨迹和接触关系,转换成机器人手能执行的关节角和控制命令。

但人手和机械手的尺寸、关节数量、运动范围都不完全一样。人类做起来很自然的动作,直接映射到机器人手上,可能会变成不可达、穿模,或者接触点不对。

在硬件上,腿部关节通常有更多空间,可以放更大半径、更高扭矩密度的电机,因此更容易采用低减速比或准直驱方案。比如 6:1 减速比,意思是电机转 6 圈,输出轴转 1 圈;速度降下来,输出扭矩放大上去。

▲腿部电机(齿轮比:6)与手指(齿轮比:288)。扭矩随r³缩放。

手指没有这种空间。电机必须缩到能塞进指节的尺寸,而在几何相似的情况下,电机扭矩大致随特征长度的三次方下降。线性尺寸缩小到 1/10,扭矩可能只剩原来的 1/1000 量级。

扭矩不够时,常见做法是靠更高减速比补回来,比如 100:1、200:1,甚至 288:1。

高减速比的代价也很直接:摩擦、齿隙、效率损失和反射惯量都会变得更难处理。仿真里很轻巧的手指,到了现实里可能变得又硬又钝,接触时不够柔顺,精细操作也就难了。

根据小米技术此前发布的全掌触觉仿生手探索文章,为了能 100% 复用人类的数据,小米对 CyberOne V2 的仿生手这次也进行了大刀阔斧的重构。

1:1 极致仿生: 将仿生手体积大幅压缩了 60%,尺寸与成年男性手部完全一致。同时增加了 64% 的自由度,具有 22-27 个自由度 DoF,可达空间、惯量分布都无限逼近真实人手。

全掌触觉覆盖: 机器人如果视觉一旦被遮挡,基本上就无法正常运作。小米引入了触觉手套方案,将全掌触觉传感器覆盖面积提升至 8200 平方毫米。人类穿上它打样,机器人就能完美继承「手感」。

15 万次耐久拉锯: 在实验室里、演示视频里捏个杯子很简单,但在工厂里连续打一万次螺丝,机器人的腱绳、弹簧和套管就会断裂。小米这双仿生手目前在实际抓握中,突破了 15 万次的循环寿命。

而最特别的细节,是灵巧手的「汗腺」。

为了实现这双高自由度的灵巧手,小米也必须在机器人的单手小臂内塞满各种电机。

而在实际应用中,单手电机功率超 100W,其中 30W 会直接转化为废热,极易烧毁线路。在没有外挂大型风扇的狭小空间里,他们从人类「出汗散热」中找到了灵感。

小米使用金属 3D 打印,在紧凑的小臂结构中制作了微型液冷循环通道。利用微泵将热量转移,再通过水分蒸发吸热降温。

在实测中,这套仿生汗腺系统,每分钟仅需蒸发 0.5mL 水,就能提供约 10W 的主动散热能力。

手之外,还有机器人的大脑

硬件在迭代,模型也在同步推进。

两个月前,小米开源了 Xiaomi-Robotics-0,一个面向具身智能的 VLA(视觉-语言-动作)模型。

在小米技术的官方推文里,他们进一步开源了真机后训练(Post-training)的完整流程。

最直观的数据是,基于预训练基座,用 20 小时的任务数据进行真机后训练,Xiaomi-Robotics-0 模型就能学会「把耳机放进耳机盒」这个高难度任务,并且能连续完成多个耳机的收纳。

这套后训练流程里有一个值得关注的技术细节:「偷懒效应」的解决方案。

为了让机器人动作不卡顿,业界通常采用异步推理和「动作前缀」技术,即让新动作顺着上一个动作的惯性自然过渡。但这会导致 AI 开始「偷懒」:过度依赖动作惯性,选择性无视摄像头传来的实时视觉反馈。

小米用了三种机制来对抗这个问题:自适应加权损失、Λ 型注意力掩码、前缀动作随机遮蔽。简单说,就是在训练里故意给模型制造「答案残缺」的情况,强迫它不得不去看当前的视觉信号。

软硬件能力的综合,也让小米机器人已经在汽车工厂里搬砖了。在自攻螺母上件工位,做到了 3 小时持续无干预作业,安装成功率高达 90.2%,能配合生产线 76 秒的高速节拍。

开始大规模交付的机器人

特斯拉此前把 Model S/X 的整条生产线砍掉,腾位置给机器人。

在一季度财报会上马斯克宣布,第三代 Optimus V3 预计年中亮相,7 月下旬至 8 月在加州弗里蒙特工厂启动生产,2026 年下半年向企业客户交付,规划年产能 100 万台。

但就像马斯克之前在播客里承认的一样,手部精细操作是「整个项目最难的环节」。

特斯拉的 Optimus 还没量产,美国另一家人形机器人公司 Figure 机器人,今天在 X 上宣布生产规模扩大了 24 倍,从每天生产一个机器人,变成 1 小时生产一个机器人。

在官方新闻稿里,Figure 提到他们已经交付了超过 350 个机器人。

对小米来说,做机器人,可能不会很快像 Figure、宇树、甚至是特斯拉一样,卖出一台消费级通用人形机器人。

但从 CyberOne V2 的方向也能看出来,小米真正想解决的,除了要让机器人跑得更快、举得更重,还有要让它更像一个能真正干活的手。

▲小米领投的量变机器人公司官网视频

毕竟,人形机器人能不能走进工厂、家庭,决定因素从来都不是它能不能翻跟头,而是它能不能拧螺丝、收耳机、递东西,完成那些看似简单、却最贴近日常的动作。

而这,恰恰也是人形机器人距离大规模落地最近的一步。

部分图片素材来自小米技术公众号、X@niccruzpatane 和 https://www.origami-robotics.com/blog/dexterity-deadlocks.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

具身智能公司自变量发布了机器人模型 WALL-B,35 天后进入真实家庭

作者 刘学文
2026年4月21日 18:16

上周末在北京亦庄举办的机器人马拉松比赛证明了一件事:跑得最快的人形机器人,速度已经可以把人类最顶尖的马拉松选手甩在身后了。但这事儿之所以没有引起太多的轰动,还是大家对机器人,或者具身智能行业有非常高的预期。

荣耀的人形机器人半马只用 50 分钟完成,宇树的机器人能在春晚舞台上完成人类极难完成的武术动作,这仿佛就是应该的事儿,并且,人们还有疑问,具身智能机器人别整这些活了,干点真正的活儿吧,比如把碗洗了,把衣服收了叠了,把地扫了……

但这些普通人能做的家务活,却远比跑马拉松做武术动作难得多,也比进厂在流水线打工难得多。

机器人什么时候,才能真正帮人收拾家里那一地狼藉?4 月 21 日,自变量机器人举行发布会,正式发布新一代具身智能基础模型 WALL-B,并宣布 35 天后,搭载该模型的新一代机器人将进入首批真实家庭。

在这家公司看来,机器人行业真正的决赛场,不在舞台,也不在实验室,而在家庭。因为家庭环境远比工厂复杂,也远比公开演示更难预测:拖鞋可能被踢到沙发底下,孩子把书包扔在地上,猫随时跳上餐桌,刚拖完的地面又被打翻一杯水。这些看似琐碎的小事,恰恰是机器人至今最难解决的问题。

从 WALL-A 到 WALL-B,机器人模型为什么要重写一遍?

发布会上,自变量创始人兼 CEO 王潜用一个普通清晨开场:「早上七点,闹钟响了。你走到客厅,拖鞋不见了,厨房碗没洗,孩子书包扔在地上,猫又打翻了一杯水。」

这段描述背后的核心判断是:家庭是一个随机、碎片化、持续变化的环境。

而过去大量机器人能力展示,并不发生在这样的场景里。舞台上的后空翻、写毛笔字、跳舞,多数依赖预设轨迹与固定动作流程;工厂里的工业机器人,则建立在高重复、低变量的标准化环境中。

但家庭恰好相反。每一次动作都可能不同,每一个障碍都可能临时出现,每一秒都可能有新变量加入。

自变量认为,当前机器人行业的瓶颈,已经不再是硬件本体,而是「大脑」。双足、灵巧手、力控关节都在快速成熟,但如何理解环境、判断风险、处理意外、持续学习,仍然是机器人进入家庭前最大的门槛。

自变量此前已经推出过第一代具身模型 WALL-A,采用行业常见的 VLA(视觉-语言-动作)架构。

这类模型的基本逻辑是:

  • 摄像头看见东西(V,Vision)
  • 模型理解语言指令(L,Language)
  • 再生成动作轨迹执行任务(A,Action)

听起来合理,但问题也很明显:这些能力往往来自不同模块,再拼接到一起。

自变量联合创始人兼 CTO 王昊解释称:

视觉模块负责识别物体,语言模块理解指令,动作模块生成轨迹。信息在模块之间逐级传递,每经过一次边界,就会出现损耗和延迟。

更关键的是,这类模型擅长模仿,却不一定理解世界。机器人可以学会「拿杯子」,但未必知道杯子为什么会掉下来;它知道把盘子放桌上,却未必知道半个盘子悬空意味着即将摔碎。

这也是 WALL-B 出现的原因。如果用更容易理解的话来说,它想做的事情是:让机器人不再分模块思考,而是像一个整体那样感知和行动。官方用 Apple Silicon 的统一内存架构做类比。过去 CPU、GPU、内存彼此独立,数据搬运本身就会拖慢效率;统一架构后,所有能力共享同一套资源,性能明显提升。

机器人也是类似逻辑。

在 WUM 架构(世界统一模型架构)下,视觉、语言、动作、触觉、物理预测等能力被放进同一个网络里联合训练,不是拆开后再组合。这带来一些重要变化,传统机器人常常是「先识别,再行动」,WALL-B 的目标是同步完成感知与决策。

自变量称,模型从训练第一天起,就让视觉、听觉、语言、触觉、动作数据同时参与训练,实现「多模态输入、多模态输出」。简单来说:它看到杯子的同时,就已经在计算如何抓取;感受到重量时,也会同步调整力度。

王昊表示,模型开始学习重力、惯性、摩擦力、速度等基本物理规律。例如桌边有一个半悬空盘子,即便机器人从未见过这个具体场景,也能推断盘子可能掉落,从而主动把它推回安全位置。这意味着机器人未来不必为每一个家庭重新训练。因为房间布局不同,但物理规律是相同的。

过去很多机器人任务失败后,只会停止执行,等待人工介入,WALL-B 的设想是:失败后重新尝试,成功后把经验直接写进模型。王昊将其比作人类学用筷子的过程:

筷子掉了无数次,但每一次失败都在修正控制方式,最后才形成稳定技能。

如果这一机制真正跑通,机器人迭代速度将不再完全依赖实验室训练,而是来自真实世界持续反馈。

35 天后,机器人真的要住进用户家里了

在训练数据上,自变量提出了一个很形象的说法:实验室数据像「糖水」,真实家庭数据像「牛奶」。前者干净、稳定、量大,但营养有限;后者复杂、嘈杂,却更接近真实世界。

王昊透露,为获取这些数据,团队进入了数百个志愿者家庭采集环境样本,而且,每个家庭都不同:灯光冷暖不同,地面材质不同,玩具和拖鞋乱放,猫会突然跳上桌子,孩子会制造新的混乱……

这些变量在实验室里很难完整模拟,却是机器人进入家庭后每天都会面对的现实。

这也是具身智能行业正在形成的新共识:谁拥有真实场景数据,谁就更可能建立长期壁垒。比模型发布更具体的,是自变量给出的时间表。这家公司宣布,35 天后,新一代机器人将进入首批用户家庭。这意味着,它不再只是演示机,也不是封闭测试设备,而是真正开始面向 C 端环境落地。

当然,自变量并没有把这件事说得过于完美。王潜坦言,当前机器人仍处于「实习生阶段」。它会犯错,可能把拖鞋放进厨房,擦桌子擦到一半停下来思考,也仍然需要远程协助。但另一方面,它可以 24 小时持续工作,并在每天运行中积累新经验。这种「边服务、边成长」的逻辑,和今天的软件产品迭代方式很像,只是这次载体变成了机器人。

过去几年,机器人行业最擅长制造惊艳时刻。但真正改变生活的产品,往往不是最会表演的那个,而是最能解决琐事的那个。

自变量这次发布 WALL-B,本质上是在回答一个更现实的问题:机器人能不能先把家务做好,再谈未来。

35 天后,答案会开始进入第一批用户的客厅。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌