一种算法允许自动地面车辆通过观察人类驾驶来改善其现有的导航系统
在美国陆军作战能力发展司令部的陆军研究实验室和得克萨斯大学奥斯汀分校,研究人员设计了一种算法,该算法允许自动地面车辆通过观察人类驾驶来改善其现有的导航系统 。该团队在陆军的一种实验性自动地面车辆上测试了其方法,即通过演示进行自适应规划器参数学习,即APPLD 。
陆军研究员加勒特·沃内尔博士说:“使用APPLD之类的方法,现有训练设施中的现役士兵只需简单地正常操作车辆就能够为自主系统的改进做出贡献 。”“像这样的技术将为陆军设计和部署能够在越野部署环境中自动导航的下一代战斗车辆的计划做出重要贡献 。”
研究人员将演示算法和更多经典的自主导航系统中的机器学习融合在一起 。APPLD并没有完全取代经典系统,而是学习如何调整现有系统使其表现得更像人类演示 。Warnell说,这种范例使部署的系统可以保留传统导航系统的所有优点,例如最优性,可解释性和安全性,同时还可以使系统灵活并适应新环境 。
【一种算法允许自动地面车辆通过观察人类驾驶来改善其现有的导航系统】 Warnell说:“使用日常的Xbox无线控制器提供的一次人类驾驶演示,使APPLD学习了如何根据特定的本地环境以不同的方式调整车辆现有的自动导航系统 。”“例如,在狭窄的走廊中,驾驶员放慢速度并小心驾驶 。观察到这种行为后,自动驾驶系统学会了在类似的环境中也降低其最大速度并增加其计算预算 。这最终使车辆能够成功在以前失败的其他狭窄走廊中自主导航 。”
这项研究是陆军开放校园计划的一部分,德克萨斯州的陆军科学家通过该计划与UT Austin的学术合作伙伴进行合作 。
UT奥斯丁机器人联盟的教授兼主席彼得·斯通博士说:“ APPLD是UT奥斯汀与陆军研究实验室之间独特的合作安排促进了研究成果不断增长的又一个例子 。”“通过将沃内尔博士全职安排在UT奥斯汀分校,我们能够迅速发现并解决研究问题,这些研究问题既是尖端的科学进步,也是与军队直接相关的 。”
团队的实验表明,经过培训后,APPLD系统比传统系统能够更快地导航测试环境,并且减少故障 。此外,受过训练的APPLD系统通常比受过训练的人在环境中的导航更快 。经同行评审的期刊《IEEE机器人与自动化快报》发表了该团队的工作:APPLD:从演示中学习自适应规划器参数 。
“从机器学习的角度来看,APPLD与试图从头开始学习整个导航系统的所谓的端到端学习系统形成了鲜明的对比 。”“这些方法往往需要大量数据,并且可能导致行为既不安全也不稳健 。APPLD利用了经过精心设计的控制系统部分,同时将其机器学习工作集中在参数调整过程上,这是通常是根据一个人的直觉来完成的 。”
APPLD代表了一种新的范例,在该范例中,不具备机器人专业知识的人可以在各种环境中帮助训练和改善自动驾驶汽车导航 。而不是由工程师组成的小型团队试图在少数测试环境中手动调整导航系统,实际上,数量不受限制的用户将能够向系统提供所需的数据,以将其自身调整到不受限制的环境中 。
陆军研究员乔纳森·芬克(Jonathan Fink)博士说:“对于每个新的部署环境,通常都必须手动重新调整当前的自主导航系统 。”“此过程非常困难-必须由接受过机器人技术培训的人员来完成,并且需要反复试验,直到找到正确的系统设置为止 。相反,APPLD通过观察人工驾驶来自动调整系统系统-任何人只要有视频游戏控制器的经验就可以做 。在部署过程中,APPLD还允许系统随着环境的变化实时地重新调整自身 。”
陆军对下一代战斗车辆进行现代化改造的重点包括设计可以在越野部署环境中自动导航的可选有人驾驶战斗车辆和机器人战斗车辆 。士兵们可以驾驶当前的战车在这些环境中导航,但对于先进的自主导航系统而言,环境仍然充满挑战 。APPLD和类似方法为陆军改善现有的自主导航能力提供了新的潜在途径 。
“除了与陆军直接相关之外,APPLD还为弥合传统工程方法与新兴机器学习技术之间的鸿沟提供了机会,从而在现实世界中创建了强大,自适应和多功能的移动机器人 。”肖学苏,UT Austin的博士后研究员,论文的主要作者 。
为了继续这项研究,研究小组将在各种户外环境中测试APPLD系统,雇用士兵驾驶员,并尝试使用多种现有的自动导航方法 。此外,研究人员将调查是否包含其他传感器信息(例如相机图像)是否可以导致学习更复杂的行为,例如调整导航系统以在各种条件下(例如在不同地形或存在其他物体的情况下)
推荐阅读
- 富含维c的水果有哪些
- 甘蔗的功效与作用 吃甘蔗的好处
- 甘蔗怎么吃 甘蔗的食用方法
- 韭菜能壮阳吗?怎样吃?
- 牛油果怎么催熟 新鲜牛油果怎么催熟最快
- 豆腐乳哪个地方最出名
- Google的算法不再是您可以轻易愚弄的机器人
- 菊花有哪些品种及图片
- 人人都说三七粉好
- 补血圣品三七