2023年9月7日,英国爱丁堡大学和英国伦敦大学学院的研究人员在《Nature Machine Intelligence》杂志发表了一篇题为“Hybrid hierarchical learning for solving complex sequential tasks using the robotic manipulation network ROMAN”的论文。
研究内容
解决长时间的连续任务仍然是体现型人工智能领域的一项艰巨挑战。使机器人系统能够以广泛的操纵技能执行各种连续任务是一个值得注意的开放性问题,并且仍然是一个活跃的研究领域。
在这项工作中提出了一个混合分层学习框架-机器人操纵网络 ROMAN,以应对在机器人操纵过程中长时间解决多个复杂任务的挑战。通过整合行为克隆、模仿学习和强化学习,ROMAN 实现了任务的多功能性和强大的故障恢复能力。它由一个中央操纵网络组成,该网络协调各种神经网络的集合,每个神经网络都擅长于不同的可重组子任务,以生成正确的序列动作,从而解决复杂的长时间跨度操纵任务。
实验表明,通过协调和激活这些专门的操纵专家,ROMAN 能够产生正确的序列激活,从而完成复杂的长序列操纵任务,并实现超越演示的自适应行为,同时对各种感官噪音表现出稳健性。这些结果凸显了 ROMAN 具有自主故障恢复能力的动态适应性的重要性和多功能性,并强调了它在各种需要自适应运动技能的自主操纵任务中的潜力。