基于知識抽取和強(qiáng)化學(xué)習(xí)的無人飛行器智能路徑?jīng)Q策方法研究
摘要: 無人飛行器在現(xiàn)實生活中因其模型的復(fù)雜性,基于學(xué)習(xí)的方法往往需要耗費(fèi)大量的時間進(jìn)行離線訓(xùn)練。因此,提出了一種基于知識抽取的強(qiáng)化學(xué)習(xí)路徑規(guī)劃方法,使無人飛行器能夠在連續(xù)環(huán)境中完成路徑規(guī)劃。設(shè)計神經(jīng)網(wǎng)絡(luò)對無人飛行器氣動模塊進(jìn)行知識抽取。采用深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法使無人機(jī)能夠自主做出決策。此外,為避開障礙... (共10頁)
開通會員,享受整站包年服務(wù)