多機器人在網(wǎng)格環(huán)境約束下的運動策略
摘要: 針對多智能體在網(wǎng)格環(huán)境下的尋路與避障規(guī)劃問題,提出一種分布式、基于深度強化學習的多機器人避障導航方法。該方法基于最近策略優(yōu)化算法(PPO)用于離散決策下的改進方法進行訓練得到的策略模型,該模型通過每個智能體自身的前序多幀仿真激光雷達距離信息,生成符合預設(shè)規(guī)范的動作,實現(xiàn)多機器人系統(tǒng)在不同環(huán)境中的尋路避障。該模型在訓練過程中通過引入密度獎勵、距離獎勵以及步長懲罰,提高了智能體在場... (共11頁)
開通會員,享受整站包年服務