智元机器人今天宣布推出全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一项目标志着具身智能领域的“ImageNet 时刻”已经到来。
智元机器人将按计划在 HuggingFace、Github 以及 agibot-world.com 项目主页上分批上传数据。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。相比谷歌开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。
未来,智元机器人将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;发布具身基座大模型,支持模型微调;并发布全套工具链,实现采集、训练和评测闭环。
AgiBot World 数据集中涵盖的场景具备多样化和多元化特点,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等复杂动作,几乎涵盖了人类日常生活所需的绝大多数场景。例如,其中一个视频展示了机器人在电脑主机中安装内存条的过程,这需要毫米级精细控制,稍有不慎就可能导致设备损坏。其末端触觉传感器帮助机器人实现了精准对接。另一个视频展示了机器人使用洗碗机,整理杂乱的餐具至相应卡槽中,操作流程长且动作繁琐。AgiBot World 数据集中收录了 80 多种日常生活中的多样化技能视频,让机器人能够掌握多种技能。