《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 聯合隨機性策略的深度強化學習探索方法
聯合隨機性策略的深度強化學習探索方法
信息技術與網絡安全
楊尚彤,王子磊
(中國科學技術大學 網絡空間安全學院,安徽 合肥230027)
摘要: 目前深度強化學習算法已經可以解決許多復雜的任務,然而如何平衡探索和利用的關系仍然是強化學習領域的一個基本的難題,為此提出一種聯合隨機性策略的深度強化學習探索方法。該方法利用隨機性策略具有探索能力的特點,用隨機性策略生成的經驗樣本訓練確定性策略,鼓勵確定性策略在保持自身優勢的前提下學會探索。通過結合確定性策略算法DDPG和提出的探索方法,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG)。在多個復雜環境下的實驗表明,面對探索問題,SGDPG的探索效率和樣本利用率要優于DDPG算法。
中圖分類號: TP18
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.06.008
引用格式: 楊尚彤,王子磊. 聯合隨機性策略的深度強化學習探索方法[J].信息技術與網絡安全,2021,40(6):43-49.
Efficient exploration with stochastic policy for deep reinforcement learning
Yang Shangtong,Wang Zilei
(School of Cyberspace Security,University of Science and Technology of China,Hefei 230027,China)
Abstract: At present, deep reinforcement learning algorithms have been shown to solve many complex tasks, but how to balance the relationship between exploration and exploitation is still a basic problem. Thus, this paper proposes an efficient exploration strategy combined with stochastic policy for deep reinforcement learning. The main contribution is to use the experience generated by stochastic policies to train deterministic policies, which encourages deterministic strategies to learn to explore while maintaining their own advantages. This takes advantage of the exploration ability of stochastic policies. By combining DDPG(Deep Deterministic Policy Gradient) and the proposed exploration method, the algorithm called stochastic guidance for deterministic policy gradient(SGDPG) is obtained. Finally, the results of the experiment in several complex environments show that SGDPG has higher exploration and sample efficiency than DDPG when faced with deep exploration problems.
Key words : reinforcement learning;deep reinforcement learning;exploration-exploitation dilemma

 0 引言

目前,強化學習(reinforcement learning)作為機器學習領域的一個研究熱點,已經在序列決策問題中取得了巨大的進步,廣泛應用于游戲博弈[1]、機器人控制[2]、工業應用[3]等領域。近年來,許多強化學習方法利用神經網絡來提高其性能,于是有了一個新的研究領域,被稱為深度強化學習(Deep Reinfor-

cement Learning,DRL)[4]。但是強化學習仍然面臨一個主要的問題:探索利用困境(exploration-exploitation dilemma)。在智能體學習過程中,探索(exploration)意味著智能體嘗試之前沒有做過的動作,有可能獲得更高的利益,而利用(exploitation)是指智能體根據之前的經驗選擇當前最優的動作。目前,深度強化學習方法的研究主要集中在結合深度學習提高強化學習算法的泛化能力,如何有效地探索狀態空間仍然是一個關鍵的挑戰。




本文詳細內容請下載:http://m.jysgc.com/resource/share/2000003599




作者信息:

楊尚彤,王子磊

(中國科學技術大學 網絡空間安全學院,安徽 合肥230027)


此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美三日本三级三级在线播放| 亚洲综合欧美日韩| 欧美日韩亚洲综合在线| 一本色道久久88亚洲综合88| 日韩亚洲视频| 国产精品国产| 久久精品二区| 亚洲国产91| 亚洲精品一二| 国产精品美女在线| 久久精品欧美| 国产精品男女猛烈高潮激情| 欧美激情一级片一区二区| 亚洲中字黄色| 欧美一区二区黄| 国产精品xxx在线观看www| 久久精品久久99精品久久| 性欧美大战久久久久久久久| 久久精品人人做人人爽| 亚洲精品美女在线| 亚洲人成亚洲人成在线观看| 国产婷婷97碰碰久久人人蜜臀| 久久久久亚洲综合| 亚洲图色在线| 久久国产成人| 一本不卡影院| 一色屋精品视频免费看| 欧美午夜在线观看| 国产精品高清网站| 国产日本精品| 欧美日韩在线播放三区| 欧美日韩喷水| 国产精品女主播一区二区三区| 国产精品影视天天线| 欧美人妖在线观看| 久久影音先锋| 亚洲字幕一区二区| 亚洲欧美伊人| 日韩亚洲国产欧美| 欧美一区网站| 亚洲电影av| 99精品福利视频| 亚洲综合电影| 久久精品99国产精品日本| 卡一卡二国产精品| 欧美亚洲一区二区在线观看| 亚洲免费精彩视频| 夜夜精品视频| 欧美在线高清| 亚洲女性喷水在线观看一区| 欧美主播一区二区三区| 噜噜噜噜噜久久久久久91| 欧美日韩国产色综合一二三四 | 亚洲福利专区| 99精品国产高清一区二区| 亚洲欧美日韩在线播放| 久久夜色精品国产亚洲aⅴ| 欧美精品在线网站| 国产欧美亚洲视频| 亚洲国产精品福利| 好吊日精品视频| 国产日韩欧美在线视频观看| 在线观看亚洲a| 国产一区二区三区久久 | 久久久噜噜噜久久久| 欧美母乳在线| 国产婷婷精品| 日韩亚洲国产欧美| 亚洲高清不卡在线| 亚洲一区尤物| 欧美福利在线观看| 欧美一区二区三区精品电影| 麻豆成人在线观看| 快射av在线播放一区| 欧美日韩精品综合| 国内精品久久久久影院色 | 午夜伦欧美伦电影理论片| 中文国产成人精品久久一| 亚洲理伦电影| 99视频一区二区| 久久精品视频导航| 亚洲一区二区黄色| 欧美aⅴ99久久黑人专区| 欧美黄色影院| 国产午夜精品视频| 亚洲视频免费| 日韩写真在线| 免费人成网站在线观看欧美高清| 国产精品午夜在线观看| 国产乱码精品| 9l视频自拍蝌蚪9l视频成人| 亚洲国产老妈| 99国产精品久久久久久久久久| 欧美一区二区三区播放老司机| 欧美日韩国产成人高清视频| 很黄很黄激情成人| 午夜欧美不卡精品aaaaa| 亚洲特级片在线| 欧美韩日一区二区| 一区二区三区在线视频播放| 亚洲欧美另类在线| 亚洲福利视频免费观看| 亚洲欧美成人一区二区在线电影 | 久久激五月天综合精品| 国产精品成人在线观看| 亚洲伦理在线免费看| 亚洲欧美激情视频| 欧美成人精品一区| 黑人一区二区三区四区五区| 亚洲欧美综合v| 亚洲欧美日韩国产一区二区| 欧美日韩国产一区二区三区| 亚洲高清自拍| 91久久亚洲| 亚洲福利精品| 久久久av水蜜桃| 国产精品亚洲综合色区韩国| 亚洲视频播放| 亚洲在线成人精品| 国产精品盗摄一区二区三区| 宅男噜噜噜66一区二区| 欧美一区激情视频在线观看| 欧美亚洲视频| 国产免费亚洲高清| 午夜视频久久久| 久久精品视频网| 国产在线拍偷自揄拍精品| 欧美一级精品大片| 久久久久久国产精品mv| 国内精品伊人久久久久av一坑| 久久成人免费网| 久久久噜噜噜久久中文字免| 狠狠狠色丁香婷婷综合激情| 亚洲黄色天堂| 欧美久久精品午夜青青大伊人| 亚洲日本va午夜在线影院| 在线视频精品一区| 久久久久久久久久看片| 国产一区二区三区四区hd| 欧美中文在线免费| 久久人人爽国产| 在线观看欧美成人| 99国内精品久久| 国产精品超碰97尤物18| 亚洲欧美日韩视频二区| 久久久噜噜噜久久久| 亚洲国内自拍| 欧美一区二区在线| 久久男女视频| 亚洲国产专区| 中国女人久久久| 欧美91视频| 日韩视频免费观看| 亚洲一区免费视频| 国产乱码精品一区二区三区av| 欧美在线一二三区| 欧美国产日本在线| 一卡二卡3卡四卡高清精品视频| 亚洲欧美日韩一区在线观看| 国内精品伊人久久久久av影院| 亚洲乱码视频| 另类春色校园亚洲| 亚洲精品视频在线播放| 亚洲免费伊人电影在线观看av| 国产婷婷色一区二区三区在线| 亚洲精品欧美精品| 午夜天堂精品久久久久| 国产一区二区三区直播精品电影| 亚洲激情午夜| 国产精品成人一区二区| 久久国产一区| 欧美日韩一区二区在线播放| 亚洲欧美日韩成人| 欧美成人午夜影院| 亚洲自拍16p| 亚洲女爱视频在线| 韩国女主播一区二区三区| 日韩亚洲欧美综合| 国产欧美日韩亚洲| 日韩香蕉视频| 国产一区二区中文| 一本色道久久加勒比88综合| 国产主播精品在线| 亚洲视频综合| 尤物精品在线| 亚洲欧美日韩一区二区三区在线| 亚洲国产精品久久久| 欧美一区二区在线播放| 亚洲精品免费在线播放| 久久久久久久综合日本| 艳女tv在线观看国产一区| 久久一区欧美| 亚洲欧美国产三级| 欧美日韩国产另类不卡| 亚洲福利专区| 国产日产欧美a一级在线| 一区二区三区黄色| 在线日本高清免费不卡| 亚洲精品久久嫩草网站秘色| 国产精品一区二区在线观看网站|