普通视图
土耳其将继续紧缩货币政策以抑制高通胀
上交所:对双良节能及有关责任人予以监管警示
这家机器人公司把“具身数据”塞进1万个背包里
作者丨苏建勋
在具身智能领域,“搞数据”这个事儿,可能是为数不多的共识。
依靠训练巨量数据,大语言模型诞生了Chatgpt,“Scaling Law”也成了AI人的信仰,可在具身智能所属的物理世界,没有互联网上海量的数据参照。不论是人,还是机器人,在现实中的数据量,都不足以复现GPT时刻。
所以,数据怎么搞,能搞到多少,以及要让数据有质量,就成了具身智能从业者当下最重要的工作之一。
最近,就有一家机器人公司想在数据采集上“整点花活儿”。鹿明机器人发布了全球首款背包版UMI数采设备FastUMI Pro(背包版),并计划在2026年投放1万台设备,在工业、家庭、酒店、餐馆、商场、办公等六大真实场景开展系统性数据采集。
![]()
全球首款背包版UMI数采设备:鹿明FastUMI Pro(背包版)
简单解释一下“UMI(通用操作接口)”:UMI是斯坦福大学、哥伦比亚大学与丰田研究所联合提出的低成本数据收集与学习框架。区别于市场同行的遥操数采,UMI可以与机器人本体解耦,这就意味着训练出的数据,可以不仅适用于某一家/个机器人形态。
在2026年初的一次媒体交流会上,鹿明机器人创始人兼CEO喻超也聊到UMI和遥操的效率与成本对比:
“同样是像叠衣服这样的事情,遥操作数据采集,需要花 50 秒,成本是3-5元,如果是用FastUMI Pro的方式去采集,只要 10 秒,成本<0.6元,这样的话其实采集的效率能大大提升,成本更低。”
鹿明机器人成立于2024年9月,创始人喻超是前追觅具身机器人业务负责人,拥有近10年具身机器人研发经验,主导了小米CyberDog的研发和千台量产。联席CTO丁琰是大陆最早做UMI的人,首次将UMI从实验室带向工业界。
有量,也要有质
2025年,鹿明通过自建数采中心的方式,已实现10万小时的数据产能。喻超判断,2026年,头部具身模型的数据规模预计100万小时起。
而鹿明在2026年最重要的目标,就是建立年采集百万小时的UMI数据产能。这意味着,鹿明需要用更具规模化的手段,采集更多数据。
“机器人训练数据本不应该如此昂贵和稀缺。人类在物理世界作业过程中产生的数据无处不在,只是没有被很好地收集。”喻超表示。
背包版FastUMI正是为解决这一问题而生——它是一款便携的标准数采工作站,可将真实场景操作高效转化为高质量训练数据。
此前具身数据采集,大多依靠实验室或单一场景采集,这就会导致一个问题:机器人在采集时往往只在一个场景下重复几个动作,这样得到的数据就会缺乏多样性,也会影响模型的泛化能力。
因此,鹿明机器人希望采用更轻便的数据采集方式,将采集工具直接装进背包,让真实场景的数据采集门槛更低。
在具体场景上,鹿明机器人希望覆盖工业、家庭、酒店、餐馆、商场、办公六大核心场景,细分30个小类任务,构建结构化、多维度的操作数据体系。
“采–训–推”一体化闭环能力是鹿明数据基础设施的核心。此次规模化数据采集的启动,正依托于这一已全面打通的基建体系:依托FastUMI Pro,鹿明双臂具身机器人MOS在5小时内完成从“数据采集-策略训练-模型推理”的工厂质检全流程验证;FastUMI Pro在合肥实地部署后,仅用7小时便跑通真实场景下的采集、训练与部署推理。
![]()
FastUMI Pro在分拣零部件任务中,完成“数据采集-策略训练-模型推理”闭环
要训模型,数据先行
有了背包式的采集工具以外,鹿明还做了一件事,他们建了一个“数据超市”,把采集到的数据变成了可以流通的标准产品,让客户可以直接在官网上采购标准化操作数据。可以看出,作为一家具身智能公司,鹿明当下的公司战略重点,都围绕“数据”。
鹿明机器人的一系列动作背后,实际上反映了具身智能当下“最痛”的业务需求。
在年初的媒体沟通会上,鹿明机器人联席CTO丁琰就对《智能涌现》等媒体分享了他对于数据和模型的感悟。
“我就是做模型出身的,我之前一直在训模型,当时我们在做的时候就发现一个很大的问题。“丁琰说到,”要想训一个非常好的模型,必须要有一个很好的数据管线,包括数据生产、数据评估、数据筛选,建立的过程本身就需要时间。“
在摸清行业真实发展现状后,丁琰和团队当时就决定,模型和数据二选一的话,肯定先选数据,不能上来就训模型。
”因为模型架构拼到最后,大家拼的不是模型架构,而是模型数据的质量,这是一个行业的共识。“丁琰说到。
具身智能的能力上限高度依赖真实操作数据的规模与质量,当通用数据可以像硬件一样在线下单,行业模型训练门槛被显著拉低,具身智能才能从定制化探索走向工程化生产。
从“万台设备同步开采”到“通用数据电商下单”,鹿明正将“无处不在却未被收集”的物理世界操作数据,变为可规模供给的标准化基础设施,并以此构建数据驱动的生态系统。当数据不再稀缺,机器人才真正走向通用。
![]()
end