《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > 業(yè)界動(dòng)態(tài) > 前沿 | 不使用深度學(xué)習(xí),進(jìn)化算法也能玩Atari游戲!

前沿 | 不使用深度學(xué)習(xí),進(jìn)化算法也能玩Atari游戲!

2018-07-23

深度學(xué)習(xí)因?yàn)槠鋸?qiáng)大的表征能力,在很多方面都有非常優(yōu)秀的性能,它不論是在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理,還是在游戲智能體上都能構(gòu)建出優(yōu)秀的模型。而最近圖盧茲聯(lián)邦大學(xué)等研究者表示進(jìn)化算法也有著與深度學(xué)習(xí)相類(lèi)似的潛力,它可以進(jìn)化出一些能玩 Atari 游戲的智能體,并取得與人類(lèi)相匹配的性能。


近期街機(jī)學(xué)習(xí)環(huán)境(ALE)被用于對(duì)比不同的控制器算法,從深度 Q 學(xué)習(xí)到神經(jīng)進(jìn)化算法。Atari 游戲的環(huán)境在一個(gè)通用界面上提供了大量不同任務(wù)、可理解的獎(jiǎng)勵(lì)度量和令人興奮的研究領(lǐng)域,且它所需的計(jì)算資源相對(duì)有限。無(wú)怪乎該基準(zhǔn)套件得到了如此廣泛的應(yīng)用。


Atari 領(lǐng)域中的一個(gè)困難在于使用純像素的輸入。盡管與現(xiàn)代游戲平臺(tái)相比,Atari 的屏幕分辨率不算高,但處理這類(lèi)視覺(jué)信息對(duì)于人工智能體來(lái)說(shuō)仍然是個(gè)挑戰(zhàn)。人們使用目標(biāo)表征和像素縮減方法,將該信息壓縮成更適合進(jìn)化控制器的形式。這里深度神經(jīng)網(wǎng)絡(luò)控制器表現(xiàn)更加優(yōu)秀,原因在于卷積層和在計(jì)算機(jī)視覺(jué)領(lǐng)域的長(zhǎng)期應(yīng)用。


笛卡爾遺傳規(guī)劃(Cartesian Genetic Programming,CGP)在計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用也有很長(zhǎng)的歷史,盡管比深度學(xué)習(xí)稍微短了一些。CGP-IP 能夠創(chuàng)建圖像濾波器,用于去噪、目標(biāo)檢測(cè)和質(zhì)心定位(centroid determination)。在強(qiáng)化學(xué)習(xí)任務(wù)中使用 CGP 的研究相對(duì)較少,本論文將展示首次使用 CGP 作為游戲智能體的研究。


簡(jiǎn)單而言,笛卡爾遺傳規(guī)劃是遺傳規(guī)劃的一種形式,其中程序表征為有向的、通常由笛卡爾坐標(biāo)索引的非循環(huán)圖。其中功能性節(jié)點(diǎn)通常由一組進(jìn)化的基因定義,并通過(guò)它們的坐標(biāo)連接輸入與其它功能性節(jié)點(diǎn)。程序的輸出由任何內(nèi)部節(jié)點(diǎn)或程序輸入基于進(jìn)化的輸出坐標(biāo)得出。


ALE 提供了 CGP 和其他方法之間的定量對(duì)比。直接將 Atari 游戲分?jǐn)?shù)與之前研究中的不同方法結(jié)果進(jìn)行對(duì)比,以對(duì)比 CGP 與其他方法在該領(lǐng)域的能力。


CGP 的獨(dú)特優(yōu)勢(shì)使得其應(yīng)用在 ALE 上非常合適。通過(guò)定長(zhǎng)的基因組,小型程序能通過(guò)進(jìn)化生成并被讀取以理解。雖然深度 actor 或進(jìn)化神經(jīng)網(wǎng)絡(luò)的內(nèi)部機(jī)制可能難以了解,但 CGP 進(jìn)化的程序可以讓我們深入理解玩 Atar 游戲的策略。最后,通過(guò)使用用于矩陣運(yùn)算的函數(shù)集,CGP 能夠僅使用像素輸入而不使用先驗(yàn)游戲知識(shí),在多種游戲上實(shí)現(xiàn)與人類(lèi)相當(dāng)?shù)男阅堋?/p>

論文:Evolving simple programs for playing Atari games


微信圖片_20180723191606.jpg


論文地址:https://arxiv.org/abs/1806.05695

項(xiàng)目地址:hps://github.com/d9w/CGP.jl


摘要:笛卡爾遺傳規(guī)劃(Cartesian Genetic Programming,CGP)之前已被證明在圖像處理任務(wù)中具備使用計(jì)算機(jī)視覺(jué)專(zhuān)用的函數(shù)集來(lái)進(jìn)化程序的能力。類(lèi)似的方法也可用于 Atari 游戲。使用混合型 CGP 和適用于矩陣運(yùn)算的函數(shù)集(包括圖像處理)來(lái)進(jìn)化程序,但是允許出現(xiàn)控制器動(dòng)作。盡管這些程序相對(duì)較小,但很多控制器的性能與 Atari 基準(zhǔn)集的最優(yōu)方法不相上下,且需要的訓(xùn)練時(shí)間更短。通過(guò)評(píng)估最優(yōu)進(jìn)化的程序,我們可以找到簡(jiǎn)單卻有效的策略。


3 方法


盡管有很多在圖像處理中使用 CGP 的案例,但在玩 Atari 游戲時(shí)這些實(shí)現(xiàn)必須進(jìn)行修改。最重要的是,輸入像素必須通過(guò)進(jìn)化程序處理以確定標(biāo)量輸出,這需要程序減少輸入空間。本研究選擇的方法可確保和其它 ALE 結(jié)果的可比較性,同時(shí)鼓勵(lì)有競(jìng)爭(zhēng)力且簡(jiǎn)單的程序的進(jìn)化。

微信圖片_20180723191714.jpg

圖 1:使用 CGP 來(lái)玩 Atari 游戲,藍(lán)色像素矩陣是進(jìn)化程序的輸入,進(jìn)化的輸出決定最后的控制器動(dòng)作。這里展示了所有控制器動(dòng)作,但大多數(shù)游戲僅使用可用動(dòng)作的子集。帶紅色標(biāo)記的動(dòng)作表示一個(gè)按鈕。


4 結(jié)果

微信圖片_20180723191745.jpg

圖 2: Kung-Fu Master 游戲的蹲伏方法和玩家功能圖。為簡(jiǎn)潔起見(jiàn),這里忽略未激活的輸出和導(dǎo)致這些輸出的計(jì)算圖。

微信圖片_20180723191813.jpg

圖 3:Centipede 玩家,僅激活了輸出 17,下-左-開(kāi)火。所有其它輸出導(dǎo)致空值或恒定零輸入,此處未展示。

微信圖片_20180723191834.jpg

圖 4:Boxing 游戲,使用像素輸入來(lái)連續(xù)移動(dòng)和采取不同動(dòng)作。這里,CGP 智能體通過(guò)不斷打擊 Atari 玩家來(lái)緩慢移動(dòng),將 Atari 玩家逼到圍繩處。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲午夜伦理| 最新中文字幕一区二区三区| 日韩视频精品在线| 久久久精品一区二区三区| 亚洲日本va午夜在线影院| 欧美一区二区三区精品电影| 亚洲七七久久综合桃花剧情介绍| 亚洲欧美视频在线观看视频| 在线精品视频在线观看高清| 欧美一区免费视频| 一区二区精品| 欧美精品一线| 黄色成人精品网站| 日韩一级精品| 亚洲淫性视频| 亚洲第一视频| 国产精品久久国产精品99gif| 先锋影音网一区二区| 欧美在线观看视频一区二区| 亚洲国产高清在线观看视频| 亚洲一级电影| 一本色道久久综合亚洲精品婷婷| 欧美成人一区二区| 久久精品首页| 国产精品自拍三区| 亚洲一区二区高清| 亚洲精品久久久久久久久久久久| 久久蜜桃精品| 久久精品国产亚洲一区二区| 国产精品日韩二区| 亚洲欧美日韩另类精品一区二区三区| 亚洲国内精品在线| 欧美高清视频一区| 一区二区欧美精品| 99精品欧美一区二区三区| 欧美日韩国产色视频| 欧美精品在线观看一区二区| 亚洲高清一二三区| 一本久道久久综合婷婷鲸鱼| 国产精品视频| 欧美ed2k| 香蕉久久夜色精品| 亚洲国产精品第一区二区| 亚洲精美视频| 国产精品综合视频| 免费成人激情视频| 香蕉精品999视频一区二区| 亚洲丶国产丶欧美一区二区三区| 99re8这里有精品热视频免费| 国产视频在线观看一区二区| 欧美电影在线| 午夜一区二区三区不卡视频| 亚洲美女精品久久| 午夜欧美大片免费观看| 日韩视频一区二区三区在线播放| 国产午夜精品全部视频播放| 欧美日韩视频在线一区二区观看视频| 欧美一级欧美一级在线播放| 亚洲毛片av| 久久精品亚洲一区二区三区浴池 | 亚洲伊人第一页| 一区二区三区四区五区精品| 亚洲自拍另类| 欧美一区二区三区在线观看| 欧美中在线观看| 国产精品久久国产愉拍 | 99一区二区| 麻豆精品91| 99精品免费| 亚洲影视在线| 久久激情视频久久| 六月婷婷久久| 欧美日韩一区自拍| 国产日韩欧美一二三区| 亚洲高清不卡| 亚洲午夜激情| 亚洲国产天堂久久综合网| 亚洲一品av免费观看| 欧美一区午夜视频在线观看| 亚洲视频在线观看三级| 亚洲日本中文| 亚洲国产毛片完整版| 亚洲国产精品久久久久秋霞蜜臀| 狠狠色狠狠色综合| 韩日精品视频一区| 在线国产日韩| 亚洲人妖在线| 亚洲一二三区精品| 欧美一区二区在线免费播放| 久久精品视频在线观看| 亚洲人成人99网站| 亚洲天堂av在线免费| 欧美亚洲日本国产| 久色婷婷小香蕉久久| 欧美日韩国产区一| 国产精品入口麻豆原神| 国产亚洲观看| 亚洲激情另类| 精品91在线| 亚洲麻豆视频| 午夜精品久久久久影视| 亚洲国产第一| 亚洲男人的天堂在线观看| 久久精品在线观看| 欧美了一区在线观看| 国产欧美激情| 亚洲欧洲综合| 久久精品视频导航| 亚洲免费视频观看| 欧美大片免费观看| 国产日韩欧美中文在线播放| 亚洲区国产区| 久久国产精品99国产| 亚洲伊人网站| 欧美精品www在线观看| 国内成+人亚洲| 亚洲一区999| 99爱精品视频| 欧美成黄导航| 激情一区二区| 久久精品视频一| 久久国内精品自在自线400部| 欧美丝袜第一区| 亚洲美女淫视频| 亚洲卡通欧美制服中文| 久久久久一区| 国产亚洲福利一区| 欧美一区二区| 久久九九久精品国产免费直播| 国产精品二区在线| 在线综合亚洲| 亚洲综合色激情五月| 欧美日韩国产综合视频在线观看中文| 黑人操亚洲美女惩罚| 欧美一二三视频| 久久久久女教师免费一区| 国产一区二区三区在线观看网站 | 亚洲三级视频| 亚洲一区二区免费在线| 欧美日韩日本视频| 一区二区激情小说| 亚洲欧美视频在线观看视频| 国产精品一区免费视频| 欧美亚洲专区| 欧美高潮视频| 一区二区激情小说| 亚洲欧美中文日韩v在线观看| 国产精品永久| 久久精品91久久香蕉加勒比 | 在线观看欧美| 亚洲制服丝袜在线| 国内自拍一区| 一本色道久久88综合日韩精品| 欧美性一区二区| 欧美一区二区精品| 欧美福利网址| 亚洲免费小视频| 久久亚裔精品欧美| 一本久久a久久免费精品不卡| 欧美与欧洲交xxxx免费观看 | 激情综合亚洲| 艳妇臀荡乳欲伦亚洲一区| 国产精品自拍视频| 亚洲毛片视频| 国产一区二区三区的电影 | 亚洲一区免费网站| 免费一级欧美片在线播放| 日韩亚洲一区二区| 狼人社综合社区| 亚洲资源在线观看| 欧美精品成人91久久久久久久| 亚洲欧美日韩一区二区| 小处雏高清一区二区三区| 在线观看欧美日韩| 欧美在线亚洲在线| 日韩小视频在线观看| 美女图片一区二区| 亚洲欧美日韩精品久久亚洲区| 欧美日韩精品是欧美日韩精品| 久久精品国产77777蜜臀| 国产精品毛片| 亚洲午夜激情网页| 日韩亚洲精品电影| 欧美精品videossex性护士| 91久久精品美女高潮| 国产精品久久久久三级| 亚洲欧美日本视频在线观看| 亚洲国内自拍| 欧美午夜不卡在线观看免费| 亚洲美女在线一区| 亚洲国产精品一区二区第一页| 久久久综合网| 亚洲高清不卡| 精久久久久久久久久久| 久久久噜噜噜久久中文字免| 亚洲欧美视频在线观看视频| 国产精品日韩精品| 欧美在线视频导航| 欧美一区综合| 亚洲国产高清一区|