《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 前沿 | 不使用深度學(xué)習(xí),進化算法也能玩Atari游戲!

前沿 | 不使用深度學(xué)習(xí),進化算法也能玩Atari游戲!

2018-07-23
關(guān)鍵詞: 深度學(xué)習(xí) 計算機 ALE

深度學(xué)習(xí)因為其強大的表征能力,在很多方面都有非常優(yōu)秀的性能,它不論是在計算機視覺、自然語言處理,還是在游戲智能體上都能構(gòu)建出優(yōu)秀的模型。而最近圖盧茲聯(lián)邦大學(xué)等研究者表示進化算法也有著與深度學(xué)習(xí)相類似的潛力,它可以進化出一些能玩 Atari 游戲的智能體,并取得與人類相匹配的性能。


近期街機學(xué)習(xí)環(huán)境(ALE)被用于對比不同的控制器算法,從深度 Q 學(xué)習(xí)到神經(jīng)進化算法。Atari 游戲的環(huán)境在一個通用界面上提供了大量不同任務(wù)、可理解的獎勵度量和令人興奮的研究領(lǐng)域,且它所需的計算資源相對有限。無怪乎該基準套件得到了如此廣泛的應(yīng)用。


Atari 領(lǐng)域中的一個困難在于使用純像素的輸入。盡管與現(xiàn)代游戲平臺相比,Atari 的屏幕分辨率不算高,但處理這類視覺信息對于人工智能體來說仍然是個挑戰(zhàn)。人們使用目標表征和像素縮減方法,將該信息壓縮成更適合進化控制器的形式。這里深度神經(jīng)網(wǎng)絡(luò)控制器表現(xiàn)更加優(yōu)秀,原因在于卷積層和在計算機視覺領(lǐng)域的長期應(yīng)用。


笛卡爾遺傳規(guī)劃(Cartesian Genetic Programming,CGP)在計算機視覺領(lǐng)域的應(yīng)用也有很長的歷史,盡管比深度學(xué)習(xí)稍微短了一些。CGP-IP 能夠創(chuàng)建圖像濾波器,用于去噪、目標檢測和質(zhì)心定位(centroid determination)。在強化學(xué)習(xí)任務(wù)中使用 CGP 的研究相對較少,本論文將展示首次使用 CGP 作為游戲智能體的研究。


簡單而言,笛卡爾遺傳規(guī)劃是遺傳規(guī)劃的一種形式,其中程序表征為有向的、通常由笛卡爾坐標索引的非循環(huán)圖。其中功能性節(jié)點通常由一組進化的基因定義,并通過它們的坐標連接輸入與其它功能性節(jié)點。程序的輸出由任何內(nèi)部節(jié)點或程序輸入基于進化的輸出坐標得出。


ALE 提供了 CGP 和其他方法之間的定量對比。直接將 Atari 游戲分數(shù)與之前研究中的不同方法結(jié)果進行對比,以對比 CGP 與其他方法在該領(lǐng)域的能力。


CGP 的獨特優(yōu)勢使得其應(yīng)用在 ALE 上非常合適。通過定長的基因組,小型程序能通過進化生成并被讀取以理解。雖然深度 actor 或進化神經(jīng)網(wǎng)絡(luò)的內(nèi)部機制可能難以了解,但 CGP 進化的程序可以讓我們深入理解玩 Atar 游戲的策略。最后,通過使用用于矩陣運算的函數(shù)集,CGP 能夠僅使用像素輸入而不使用先驗游戲知識,在多種游戲上實現(xiàn)與人類相當(dāng)?shù)男阅堋?/p>

論文:Evolving simple programs for playing Atari games


微信圖片_20180723191606.jpg


論文地址:https://arxiv.org/abs/1806.05695

項目地址:hps://github.com/d9w/CGP.jl


摘要:笛卡爾遺傳規(guī)劃(Cartesian Genetic Programming,CGP)之前已被證明在圖像處理任務(wù)中具備使用計算機視覺專用的函數(shù)集來進化程序的能力。類似的方法也可用于 Atari 游戲。使用混合型 CGP 和適用于矩陣運算的函數(shù)集(包括圖像處理)來進化程序,但是允許出現(xiàn)控制器動作。盡管這些程序相對較小,但很多控制器的性能與 Atari 基準集的最優(yōu)方法不相上下,且需要的訓(xùn)練時間更短。通過評估最優(yōu)進化的程序,我們可以找到簡單卻有效的策略。


3 方法


盡管有很多在圖像處理中使用 CGP 的案例,但在玩 Atari 游戲時這些實現(xiàn)必須進行修改。最重要的是,輸入像素必須通過進化程序處理以確定標量輸出,這需要程序減少輸入空間。本研究選擇的方法可確保和其它 ALE 結(jié)果的可比較性,同時鼓勵有競爭力且簡單的程序的進化。

微信圖片_20180723191714.jpg

圖 1:使用 CGP 來玩 Atari 游戲,藍色像素矩陣是進化程序的輸入,進化的輸出決定最后的控制器動作。這里展示了所有控制器動作,但大多數(shù)游戲僅使用可用動作的子集。帶紅色標記的動作表示一個按鈕。


4 結(jié)果

微信圖片_20180723191745.jpg

圖 2: Kung-Fu Master 游戲的蹲伏方法和玩家功能圖。為簡潔起見,這里忽略未激活的輸出和導(dǎo)致這些輸出的計算圖。

微信圖片_20180723191813.jpg

圖 3:Centipede 玩家,僅激活了輸出 17,下-左-開火。所有其它輸出導(dǎo)致空值或恒定零輸入,此處未展示。

微信圖片_20180723191834.jpg

圖 4:Boxing 游戲,使用像素輸入來連續(xù)移動和采取不同動作。這里,CGP 智能體通過不斷打擊 Atari 玩家來緩慢移動,將 Atari 玩家逼到圍繩處。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲综合色网站| 欧美精品国产| 在线天堂一区av电影| 亚洲福利视频一区二区| 欧美亚洲三区| 欧美亚洲一级| 欧美一区亚洲| 欧美中文在线字幕| 久久国产精品色婷婷| 久久国产精品久久国产精品| 欧美一级久久久| 校园春色综合网| 欧美与黑人午夜性猛交久久久| 亚洲欧美在线磁力| 亚洲欧美日韩成人高清在线一区| 亚洲一区二区三区在线| 亚洲欧美韩国| 午夜宅男久久久| 久久精品久久综合| 亚洲人www| 亚洲最新视频在线| 亚洲在线日韩| 久久se精品一区二区| 久久精品亚洲乱码伦伦中文| 久久久久国产一区二区三区| 久久久久免费观看| 欧美ed2k| 欧美视频导航| 国产欧美日本一区二区三区| 国产在线欧美| 亚洲国产精品毛片| 夜夜嗨av色综合久久久综合网| 正在播放欧美一区| 欧美一区二区三区四区在线观看| 亚洲韩日在线| 亚洲图片自拍偷拍| 欧美在线观看一区二区| 久久综合久色欧美综合狠狠 | 亚洲女ⅴideoshd黑人| 欧美一区二区三区免费看| 久久久人成影片一区二区三区观看 | 欧美精品三级日韩久久| 欧美色123| 国产视频一区二区在线观看| 精品不卡一区二区三区| 亚洲精品欧美在线| 午夜精品剧场| 亚洲日本视频| 亚洲欧美激情一区二区| 久久综合色88| 国产精品av一区二区| 国产日韩欧美在线看| 亚洲激情精品| 欧美一区二区福利在线| 亚洲精品自在久久| 亚洲欧美影音先锋| 免费日韩av电影| 国产精品男女猛烈高潮激情| 精品成人一区二区三区| 正在播放亚洲| 亚洲欧洲精品成人久久奇米网| 亚洲专区一区| 免费成人你懂的| 国产精品女人网站| 亚洲国产婷婷综合在线精品| 亚洲女女做受ⅹxx高潮| 亚洲精品自在在线观看| 久久成人资源| 欧美视频1区| 亚洲第一视频| 性欧美videos另类喷潮| 洋洋av久久久久久久一区| 久久国产视频网站| 欧美午夜无遮挡| 亚洲国产va精品久久久不卡综合| 亚洲永久免费观看| 亚洲最新视频在线| 美女在线一区二区| 国产私拍一区| aa级大片欧美| 亚洲精品视频免费| 久久精品一区二区| 国产精品女主播| 日韩亚洲欧美成人| 亚洲人妖在线| 久久综合给合久久狠狠色 | 99在线精品视频在线观看| 久久成人资源| 国产精品美女久久久久久免费 | 99国产精品久久久久久久| 亚洲欧洲一区二区三区| 久久精品夜色噜噜亚洲a∨| 国产精品久久久久久亚洲调教| 亚洲欧洲日本专区| 91久久国产综合久久蜜月精品| 久久精品主播| 国产欧美精品国产国产专区| 一本色道久久综合亚洲精品不卡 | 欧美视频四区| 最新日韩中文字幕| 亚洲黄色一区| 久久影视精品| 狠狠爱综合网| 欧美伊人精品成人久久综合97 | 久久网站免费| 国产资源精品在线观看| 午夜精品一区二区三区四区 | 亚洲福利视频一区| 久久久精品一区| 国产欧美综合一区二区三区| 亚洲女优在线| 欧美一区1区三区3区公司| 国产精品美女一区二区| 亚洲午夜一区| 午夜一区二区三区在线观看 | 国产亚洲欧美日韩精品| 香蕉久久精品日日躁夜夜躁| 欧美一二三视频| 国产欧美日韩另类视频免费观看| 亚洲综合成人婷婷小说| 欧美一区免费| 国产亚洲欧美一区二区三区| 欧美在线视频免费观看| 久久精品国产久精国产一老狼 | 在线一区二区三区做爰视频网站 | 亚洲一区二区三区精品在线观看| 亚洲私人影吧| 国产精品毛片在线| 亚洲欧美激情一区二区| 久久精品国产成人| 极品少妇一区二区三区精品视频| 亚洲第一天堂av| 欧美激情精品久久久久久免费印度 | 欧美涩涩网站| 亚洲欧美日韩精品在线| 久久精品一区二区三区不卡| 狠狠色狠狠色综合人人| 亚洲激情婷婷| 欧美四级伦理在线| 亚洲一区二区少妇| 久久精品国产v日韩v亚洲| 激情亚洲网站| 一道本一区二区| 国产精品日韩欧美| 久久国产精品黑丝| 欧美精品午夜| 亚洲视频一区二区免费在线观看| 欧美一级大片在线观看| 在线欧美电影| 亚洲调教视频在线观看| 国产日韩精品视频一区二区三区| 亚洲丰满少妇videoshd| 欧美日本韩国一区二区三区| 亚洲视频在线视频| 久久综合色婷婷| 夜夜嗨一区二区| 久久精品一区中文字幕| 亚洲激情成人| 欧美一级视频一区二区| 在线播放一区| 亚洲欧美一区二区三区久久 | 久久婷婷国产综合国色天香| 亚洲七七久久综合桃花剧情介绍| 亚洲欧美区自拍先锋| 黄色成人av网| 亚洲中午字幕| 在线观看91精品国产麻豆| 亚洲永久网站| 在线观看欧美精品| 亚洲欧美日韩综合国产aⅴ| 一区二区三区在线视频播放| 亚洲视频在线观看免费| 激情综合五月天| 亚洲综合日韩| 亚洲黄色免费| 久久精视频免费在线久久完整在线看| 亚洲片在线资源| 久久久精品一品道一区| 99精品国产高清一区二区| 久久夜色精品国产亚洲aⅴ| 一区二区三区精品国产| 美日韩精品视频免费看| 欧美二区在线| 99亚洲精品| 亚洲午夜视频在线| 黄色一区二区三区| 亚洲一区二区伦理| 在线观看视频日韩| 香蕉久久夜色| 亚洲精品视频一区| 久久午夜精品一区二区| 一区二区三区久久| 欧美成人一区二区三区片免费| 亚洲欧美怡红院| 欧美日韩精品免费| 最新精品在线| 国产一区二区三区自拍| 亚洲一区二区日本| 亚洲国产日韩一区二区| 久久久噜噜噜久久人人看|