近期,工学院张军国教授牵头的林木资源高效生产全国重点实验室林业智能化装备研究组,在机器人自主运动决策领域取得新进展,研究成果以 “Event-triggered Reconfigurable Reinforcement Learning Motion-planning Approach for Mobile Robot in Unknown Dynamic Environments”为题发表于国际人工智能领域的著名期刊《Engineering Applications of Artificial Intelligence》(中科院2区TOP, IF=7.802)。
近年来,机器人技术与强化学习的结合已成为该领域的前沿科技之一,并逐步推动了人类社会生产和生活方式的转变。强化学习利用数据驱动的方式来提升机器人系统对复杂环境的应对能力,但随之而来也出现了学习成本过高和自主决策稳定性不足的难题。
为了提升移动机器人在未知环境中的自主学习和高效决策能力,课题组开发了一种基于事件驱动的深度确定性策略梯度(RS-DDPG)运动规划方法。利用样本预处理技术和自适应奖励机制,解决了强化学习网络长期存在的奖励稀疏和收敛困难的问题,促进了有限样本资源的高效利用。结果表明,重构强化学习系统大幅减少了策略训练时间,可靠性能高,可以在非结构复杂环境中精准决策。该项研究对移动机器人在非结构环境中的自主导航和目标搜索等任务具有潜在的应用价值。
本文第一作者为工学院博士生孙辉辉,通讯作者为胡春鹤副教授和张军国教授,北京林业大学为第一完成单位。该工作得到了国家自然科学基金(61703047)资助。
文章链接:https://www.sciencedirect.com/science/article/pii/S0952197623003810?via%3Dihub