噜噜噜噜私人影院,少妇人妻综合久久中文字幕888,AV天堂永久资源网,5566影音先锋

一種改進dueling網(wǎng)絡的機器人避障方法

作者:周翼; 陳渤 西安電子科技大學雷達信號處理國家重點實驗室; 陜西西安710071; 西安電子科技大學信息感知技術協(xié)同創(chuàng)新中心; 陜西西安710071

摘要:針對傳統(tǒng)增強學習方法在運動規(guī)劃領域,尤其是機器人避障問題上存在容易過估計、難以適應復雜環(huán)境等不足,提出了一種基于深度增強學習的提升機器人避障性能的新算法模型。該模型將dueling神經(jīng)網(wǎng)絡架構與傳統(tǒng)增強學習算法Q學習相結合,并利用兩個獨立訓練的dueling網(wǎng)絡處理環(huán)境數(shù)據(jù)來預測動作值,在輸出層分別輸出狀態(tài)值和動作優(yōu)勢值,并將兩者結合輸出最終動作值。該模型能處理較高維度數(shù)據(jù)以適應復雜多變的環(huán)境,并輸出優(yōu)勢動作供機器人選擇以獲得更高的累積獎勵。實驗結果表明,該新算法模型能有效地提升機器人避障性能。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

西安電子科技大學學報

北大期刊 下單

國際刊號:1001-2400

國內刊號:61-1076/TN

雜志詳情
相關熱門期刊

服務介紹LITERATURE

正規(guī)發(fā)表流程 全程指導

多年專注期刊服務,熟悉發(fā)表政策,投稿全程指導。因為專注所以專業(yè)。

保障正刊 雙刊號

推薦期刊保障正刊,評職認可,企業(yè)資質合規(guī)可查。

用戶信息嚴格保密

誠信服務,簽訂協(xié)議,嚴格保密用戶信息,提供正規(guī)票據(jù)。

不成功可退款

如果發(fā)表不成功可退款或轉刊。資金受第三方支付寶監(jiān)管,安全放心。