《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 學界 | 北京大學研究者提出注意力通信模型ATOC,助力多智能體協作

學界 | 北京大學研究者提出注意力通信模型ATOC,助力多智能體協作

2018-05-29
關鍵詞: arXiv ATOC 智能電網

近日,來自北京大學的研究者在 arXiv 上發布論文,提出一種新型注意力通信模型 ATOC,使智能體在大型多智能體強化學習的部分可觀測分布式環境下能夠進行高效的通信,幫助智能體開發出更協調復雜的策略。


從生物學角度來看,通信與合作關系密切,并可能起源于合作。例如,長尾黑顎猴可以發出不同的聲音來警示群體中的其他成員有不同的捕食者 [2]。類似地,在多智能體強化學習(multi-agent reinforcement learning,MARL)中,通信對于合作尤為重要,特別是在大量智能體協同工作的場景下,諸如自動車輛規劃 [1]、智能電網控制 [20] 和多機器人控制 [14]。


深度強化學習(RL)在一系列具有挑戰性的問題中取得了顯著成功,如游戲 [16] [22] [8] 和機器人 [12] [11] [5]。我們可以把 MARL 看作是獨立的 RL,其中每個學習器都將其他智能體看成是環境的一部分。然而,隨著訓練進行,其他智能體的策略是會變動的,所以從任意單個智能體的角度來看,環境變得不穩定,智能體間難以合作。此外,使用獨立 RL 學習到的策略很容易與其他智能體的策略產生過擬合 [9]。


本論文研究者認為解決該問題的關鍵在于通信,這可以增強策略間的協調。MARL 中有一些學習通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,現有方法所采用的智能體之間共享的信息或是預定義的通信架構是有問題的。當存在大量智能體時,智能體很難從全局共享的信息中區分出有助于協同決策的有價值的信息,因此通信幾乎毫無幫助甚至可能危及協同學習。此外,在實際應用中,由于接收大量信息需要大量的帶寬從而引起長時間的延遲和高計算復雜度,因此所有智能體之間彼此的通信是十分昂貴的。像 master-slave [7] 這樣的預定義通信架構可能有所幫助,但是它們限定特定智能體之間的通信,因而限制了潛在的合作可能性。


為了解決這些困難,本論文提出了一種名為 ATOC 的注意力通信模型,使智能體在大型 MARL 的部分可觀測分布式環境下學習高效的通信。受視覺注意力循環模型的啟發,研究者設計了一種注意力單元,它可以接收編碼局部觀測結果和某個智能體的行動意圖,并決定該智能體是否要與其他智能體進行通信并在可觀測區域內合作。如果智能體選擇合作,則稱其為發起者,它會為了協調策略選擇協作者來組成一個通信組。通信組進行動態變化,僅在必要時保持不變。研究者利用雙向 LSTM 單元作為信道來連接通信組內的所有智能體。LSTM 單元將內部狀態(即編碼局部觀測結果和行動意圖)作為輸入并返回指導智能體進行協調策略的指令。與 CommNet 和 BiCNet 分別計算內部狀態的算術平均值和加權平均值不同,LSTM 單元有選擇地輸出用于協作決策的重要信息,這使得智能體能夠在動態通信環境中學習協調策略。


研究者將 ATOC 實現為端到端訓練的 actor-critic 模型的擴展。在測試階段,所有智能體共享策略網絡、注意力單元和信道,因此 ATOC 在大量智能體的情況下具備很好的擴展性。研究者在三個場景中通過實驗展示了 ATOC 的成功,分別對應于局部獎勵、共享全局獎勵和競爭性獎勵下的智能體協作。與現有的方法相比,ATOC 智能體被證明能夠開發出更協調復雜的策略,并具備更好的可擴展性(即在測試階段添加更多智能體)。據研究者所知,這是注意力通信首次成功地應用于 MARL。

微信圖片_20180529225448.jpg

圖 1:ATOC 架構。

微信圖片_20180529225510.jpg

圖 2:實驗場景圖示:協作導航(左)、協作推球(中)、捕食者-獵物(右)。

微信圖片_20180529225534.jpg

圖 3:在協作導航訓練期間,ATOC 獎勵與基線獎勵的對比。

微信圖片_20180529225551.jpg

表 1:協作導航。

微信圖片_20180529225610.jpg

圖 4:ATOC 智能體之間關于協作導航的通信可視化。最右邊的圖片說明在有無通信時,一組智能體采取的行動。

微信圖片_20180529225632.jpg

圖 5:在協作推球訓練期間,ATOC 獎勵與基線獎勵的對比。

微信圖片_20180529225654.jpg

表 2:協作推球。

微信圖片_20180529225714.jpg

圖 6:在捕食者-獵物中,ATOC 和基線的捕食者得分的交叉對比。

微信圖片_20180529225736.jpg

ATOC 算法。


論文:Learning Attentional Communication for Multi-Agent Cooperation 

微信圖片_20180529225800.jpg


論文鏈接:https://arxiv.org/pdf/1805.07733.pdf


摘要:通信可能是多智能體協作的一個有效途徑。然而,現有方法所采用的智能體之間共享的信息或是預定義的通信架構存在問題。當存在大量智能體時,智能體很難從全局共享的信息中區分出有助于協同決策的有用信息。因此通信幾乎毫無幫助甚至可能危及多智能體間的協同學習。另一方面,預定義的通信架構限定特定智能體之間的通信,因而限制了潛在的合作可能性。為了解決這些困難,本論文提出了一種注意力通信模型,它學習何時需要通信以及如何整合共享信息以進行合作決策。我們的模型給大型的多智能體協作帶來了有效且高效的通信。從實驗上看,我們證明了該模型在不同協作場景中的有效性,使得智能體可以開發出比現有方法更協調復雜的策略。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美日韩国产精品一区| 激情久久久久久| 久久综合导航| 欧美在线啊v| 亚洲一区精品在线| 一本色道久久88亚洲综合88| 亚洲日本免费| 亚洲第一页自拍| 久久国产一区| 欧美一区二区视频在线观看| 亚洲一级高清| 亚洲天堂av电影| 国产一区导航| 国产三级精品在线不卡| 国产日产欧美a一级在线| 国产精品亚洲аv天堂网| 国产精品第13页| 国产精品免费视频观看| 国产精品久久久久一区二区三区 | 欧美视频在线一区二区三区| 欧美人牲a欧美精品| 欧美剧在线免费观看网站| 欧美精品一线| 欧美日韩在线播放三区四区| 欧美日韩在线不卡一区| 欧美午夜不卡| 国产精品毛片a∨一区二区三区|国 | 欧美成人高清视频| 欧美成人午夜77777| 欧美激情va永久在线播放| 欧美激情一区二区三区在线视频观看 | 欧美国产日韩xxxxx| 欧美日本二区| 国产精品久久午夜| 国产亚洲欧洲一区高清在线观看| 欧美日韩大片| 国产精品福利影院| 国产欧美日韩视频在线观看 | 性欧美办公室18xxxxhd| 久久久九九九九| 欧美a一区二区| 欧美日韩在线综合| 国产乱码精品| 影音先锋在线一区| 日韩亚洲精品视频| 亚洲欧美日本国产有色| 亚洲第一天堂av| 一区二区免费在线播放| 欧美一区二区三区免费观看| 久久久久久国产精品一区| 欧美肥婆在线| 国产精品久久久久aaaa樱花| 国产亚洲精品bt天堂精选| 亚洲国产裸拍裸体视频在线观看乱了| 亚洲美女视频在线免费观看| 亚洲欧美日韩另类精品一区二区三区| 亚洲电影在线观看| 亚洲天堂网站在线观看视频| 久久久久九九视频| 欧美日韩国产综合新一区| 国产午夜精品久久| 日韩亚洲国产欧美| 久久精品人人爽| 亚洲综合视频网| 欧美ab在线视频| 国产欧美精品一区二区色综合| 亚洲国语精品自产拍在线观看| 亚洲免费伊人电影在线观看av| 日韩手机在线导航| 久久精品人人爽| 国产精品xxx在线观看www| 在线精品视频在线观看高清| 亚洲午夜久久久久久久久电影院| 亚洲国产婷婷| 午夜精品国产更新| 欧美精品一区二区三区在线看午夜 | 亚洲东热激情| 亚洲综合二区| 免费看的黄色欧美网站| 欧美日韩亚洲综合| 国产欧美亚洲精品| 一本一本a久久| 亚洲成人自拍视频| 亚洲性线免费观看视频成熟| 久久久91精品国产| 欧美日韩在线综合| 在线观看成人小视频| 亚洲视频在线视频| 一区二区三区日韩精品| 久久久久久久一区二区三区| 欧美日韩视频一区二区三区| 韩国亚洲精品| 亚洲一区制服诱惑| 亚洲精品人人| 久久精品99| 欧美日韩国产综合视频在线观看| 一区精品在线播放| 亚洲欧美激情精品一区二区| 日韩视频免费观看高清在线视频| 久久国产色av| 国产精品va在线播放| 亚洲福利av| 欧美一区二区在线播放| 亚洲欧美在线另类| 午夜激情一区| 欧美精品日韩三级| 精品51国产黑色丝袜高跟鞋| 亚洲一区二区三区视频| 亚洲精品乱码久久久久久按摩观 | 国产一区二区三区四区| 亚洲美女黄网| 亚洲肉体裸体xxxx137| 久久国产精品一区二区三区四区 | 99精品国产在热久久| 亚洲激情在线激情| 欧美在线视频观看| 国产精品国产三级国产aⅴ入口| 亚洲国产mv| 久久精品亚洲一区二区| 欧美一区二区在线免费播放| 欧美视频在线观看视频极品| 一区二区三区高清在线 | 一本色道久久综合一区| 蜜臀av一级做a爰片久久| 欧美精品一区二区视频| 亚洲精品社区| 亚洲每日在线| 免费亚洲电影在线观看| 国产一区二区三区免费不卡| 亚洲欧美日韩精品久久奇米色影视| 这里只有精品视频在线| 欧美了一区在线观看| 亚洲欧洲日夜超级视频| 亚洲视频精品在线| 欧美日本网站| 亚洲看片一区| 中日韩在线视频| 欧美日韩国产影片| 99国产精品视频免费观看| 9l视频自拍蝌蚪9l视频成人| 欧美精品一区二区精品网| 亚洲日本成人女熟在线观看| 亚洲精品久久嫩草网站秘色| 欧美电影电视剧在线观看| 亚洲国产精品999| 亚洲看片免费| 欧美区国产区| 妖精成人www高清在线观看| 亚洲视频在线播放| 欧美日韩一卡二卡| 午夜精品久久久久久久99黑人| 欧美一区网站| 国产一区二区三区观看| 久久av一区二区三区| 免费成人你懂的| 亚洲精品1区2区| 一本色道**综合亚洲精品蜜桃冫 | 亚洲日本成人网| 欧美精品电影在线| 亚洲精品色婷婷福利天堂| 99re热这里只有精品免费视频| 欧美午夜寂寞影院| 亚洲自拍三区| 久久久久久久久久久成人| 激情久久久久久久| 亚洲人成在线播放| 欧美另类高清视频在线| 亚洲乱码视频| 久久九九精品99国产精品| 悠悠资源网亚洲青| 99精品国产在热久久| 国产精品福利网站| 欧美在线free| 欧美大片在线观看一区| 99国产麻豆精品| 欧美中文日韩| 亚洲电影在线| 亚洲一区二区在线免费观看视频| 国产精品午夜国产小视频| 香蕉视频成人在线观看| 欧美日韩国产一区二区三区地区| 亚洲一区二区在| 久久伊人一区二区| 日韩一级二级三级| 欧美一级视频精品观看| 韩日视频一区| 亚洲天堂偷拍| 欧美成年视频| 亚洲香蕉网站| 免费观看在线综合| 一区二区三区.www| 久久琪琪电影院| 欧美日韩情趣电影| 亚洲第一综合天堂另类专| 欧美伦理在线观看| 午夜视频在线观看一区| 欧美精品性视频| 午夜精品一区二区三区在线| 欧美成人激情在线| 久久爱www|