XDOF获7000万美元融资 搭建机器人训练数据生态助力物理AI竞争
•1 阅读•3分钟•视野
a16zThrive CapitalXDOFSpark Capital伯克利
Tim Fernholz••1 阅读•3分钟•视野

背景
两周前,OpenAI 宣布重新启动已停摆多年的机器人项目,标志着大型实验室正加速布局“物理 AI”。与语言模型依赖海量公开文本不同,机器人需要高质量的交互式数据,而这类数据在公开渠道几乎不存在。传统的 YouTube 视频或零散的工人记录往往噪声大、真实性低,难以直接用于模型训练。
XDOF 的解决方案
XDOF(发音为 “ecks‑doff”)自 2024 年十月成立以来,致力于打造机器人训练数据的完整生态链。核心业务包括:
- 数据采集平台:基于低成本遥操作系统 GELLO,让人类操作者远程控制机械臂生成高保真轨迹。
- 数据清洗与标注:提供自动化去噪、坐标对齐以及动作标签工具,确保数据可直接用于大模型预训练。
- 多层次数据金字塔:
- 一线机器人遥操作数据——在实际部署机器人上采集的高精度轨迹;
- 通用遥操作数据——使用 GELLO 采集的通用动作库;
- 自我感知(egocentric)数据——通过可穿戴传感器记录人类日常操作,为机器人提供生活化场景。
目前,XDOF 已与加州大学伯克利 AI 实验室合作,发布了被称为 ABC 的数据集,包含 13 万条机器人操作轨迹、300 小时仿真数据和 100 小时评估实验,规模创下学术界历史新高。
融资与合作
本轮融资由 Thrive Capital、a16z、Spark Capital、Lux 与 WndrCo 共同领投,累计 7000 万美元。公司创始人兼 CEO Philipp Wu 表示:“所有顶级实验室都在追赶机器人领域的突破,但缺乏大规模数据是最大的卡点。我们希望通过标准化的数据供应链,让实验室无需自行搭建昂贵的采集设施。”
XDOF 现有约 60 名员工,服务的 20 家客户包括多家前沿 AI 实验室,虽未公开名称,但业内普遍认为这些客户正是 OpenAI、DeepMind 等巨头。
行业意义与前景
从语言模型到视觉模型,再到如今的机器人模型,数据规模与质量始终是性能提升的关键。XDOF 的出现为物理 AI 打通了从“数据缺口”到“数据供给”的闭环,可能催生出一批专注于机器人感知、操作与协作的基础模型。
- 资本层面的信号:顶级 VC 对机器人数据基础设施的重金投入,预示着行业对物理 AI 的长期押注。
- 技术层面的突破:高质量、统一格式的训练数据将降低研发成本,加速从实验室原型到工业落地的转化。
- 竞争格局的演变:如果数据供应链被少数公司垄断,可能形成新的“数据寡头”,对 AI 实验室的研发策略产生深远影响。
随着 XDOF 继续扩张遥操作团队并研发自有穿戴式感知硬件,机器人训练数据的规模有望在未来两年内突破千万级别,为实现真正的通用物理智能奠定基础。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。