|
| 机器人在北京国家速滑馆“冰丝带”举行的2025世界人形机器人运动会开幕式上进行100米赛跑(图片来源:新华社) |
中评社北京11月19日电/新华社刊发《瞭望》新闻周刊文章,以下为文章内容。
从央视春晚上宇树机器人“扭秧歌”开始,中国具身智能正以惊人速度成长,跑马拉松、打拳击、踢足球、跳街舞,还可以在汽车工厂“上岗”……每一个“惊人”的技能都在凸显这个行业的发展新高度。
“这些花样玩活的视频放出来,把大家的胃口吊起来了,容易让人误判形势,以为机器人已经高度成熟,可以做很多高难度事情,就快上天入地、无所不能了。”一位工业机器人企业高管感叹,我们需要透过“表面繁荣”,看到具身智能的实际能力。
细心的人会发现,几乎所有做高难度动作的机器人身旁,都有一位人类工程师在遥操,或者机器人提前植入了程序,也就是说,这些机器人还是“提线木偶”,需要人类“把着手”做事。
具身智能何时才能摆脱遥控器,距离“全自主”还有多远?
大脑“进化”
突破遥操的关键是要具备强大大脑,即机器能够理解物理世界并与之交互,实现感知—决策—执行—反馈的闭环。以自动驾驶领域为例,VLA大模型(视觉—语言—行动模型)、端到端强化学习和世界模型是三类核心技术要素,三者协同实现机器从感知环境到执行动作的自主智能。
VLA大模型融合视觉、语言和动作三种模态,用于让机器人理解环境、接受指令并执行物理动作,是具身智能基础模型。今年6月银河通用发布了面向零售场景的大模型GroceryVLA,实现机器人对复杂环境的自主决策与精准执行,例如当人类发出“帮我拿点吃的”指令后,机器人无需遥操作,无事先采集场景数据,通过自主规划路径,从货架中识别并抓取饼干饮料送达。
|