通过“解剖”小脑模型,能看出数据对其的塑造作用。“我们首先收集了大量的人力数据,以模仿学习为基础打造行为策略和行为标准。然后利用控制理论和强化学习打造运动控制系统,在3个月内完成了小脑模型的算法开发和迭代。”田翀说,我们充分利用了人体运动数据,结合模仿学习策略,为机器人运动训练提供了精准的参考轨迹和运动标准。同时,我们还将传统的运动控制方法应用于数据收集工具的开发,并将这些思想融入到强化学习训练中。
通过技术融合,不仅提高了机器人运动控制策略的训练效率,缩短了训练周期,还确保了策略在实际应用中的安全性和可靠性,这是“玄武”小脑模型与其他小脑模型相比的一大特点。“当然,该模型还在发展初期,能力和功能仍需提升和完善。”田翀说。
借助AI,管控平台同时完成对数据标注、管理与模型部署的需求,助力实现机器人数据采集、评估清洗、训推一体的全流程闭环。邢伯阳向记者解释说,通过仿真环境对采集数据实现快速的测试,对失败数据单元进行删除,完成对原始数据的清洗,再对神经网络模型进行训练,实现面向机器人端快速部署。
中心计划用3年时间完成“白虎”数据集的构建,一方面建设超过100个高精度运动采集设备,另一方面共享业界其他单位采集的数据,实现清洗后的高质量数据总量超过1PB,覆盖超过100个场景、2000个任务。如果1部高清电影占用的数据空间大约是1GB,那么1PB的数据量大约可以存储100万部这样的电影。
训练场:人形机器人的学校
“人为演示一个动作大约50次,机器人就能学会。”在2024世界人工智能大会的国家地方共建人形机器人创新中心展区,记者看到了一个小型的机器人“训练场”,现场工作人员如同一个熟练的“老师傅”做着生产线上的抓取动作,4个机器人则跟着他同步做出了一样的动作。
为什么要搭建训练场?中心技术负责人刘宇飞说,构建智能训练场,模拟产线及工业流水线,收集多模态数据,并搭建数据管理平台,将有效提升人形机器人在不同场景下的作业能力,加速具身智能技术的发展与应用落地。
|