《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > Ian Goodfellow:你的GAN水平我來打分

Ian Goodfellow:你的GAN水平我來打分

2018-08-17

如何評價生成模型的性能好壞?這似乎是一個復雜而困難的任務。Ian Goodfellow 提出的生成對抗網絡 GAN 已經成為人工智能的重要研究方向,吸引了眾多學者投入研究。但 GAN 也遭遇了「改無可改」的呼聲(參見:六種改進均未超越原版:谷歌新研究對 GAN 現狀提出質疑)。近日,Goodfellow 團隊提出了一種全新生成模型評價方式,看來,GAN 的開山鼻祖終于坐不住了,他試圖親自解決這個問題。


Ian Goodfellow 表示:通過估計解釋模型表現的隱技能變量來評估生成模型的能力似乎是一個很有希望的研究方向。

微信圖片_20180817184112.jpg

谷歌研究科學家 Jordi Pont-Tuset 對于 CVPR 各屆接收論文名稱的統計,GAN 已經超過 LSTM,成為了重要關鍵詞,大有趕超「深度學習」的趨勢。但眾多論文里,真正的改進又有多少?


生成模型的評估是一項非常困難的任務。目前該領域已經探索了許多不同的方法,但每一種方法都存在顯著的缺點。Theis [2016] 和 Borji [2018] 等人概覽了這些方法,并展示了它們各自的缺點。


在這一篇論文中,谷歌大腦提出了一種通過對抗過程評估生成模型的新框架,在該對抗過程中,許多模型在錦標賽(tournament)中進行對抗。谷歌大腦團隊利用先前開發的人類選手評估方法來量化模型在這類錦標賽中的性能。


在國際象棋或網球比賽中,Elo 或 Glicko2 等技能評分系統通過觀察多個參賽者的勝利數和失敗數,推斷每一個參與者的隱藏、未觀察到的技能值(它們解釋了這些觀察到的輸贏數),從而評估他們的技能表現。同樣,谷歌大腦團隊通過構建一個多參與者的錦標賽將生成模型的評估構建為隱藏技能估計問題,該錦標賽可推廣至噪聲對比估計(NCE)和生成對抗網絡(GAN)所使用的兩參與者的可分辨博弈(two-player distinguishability game),并且估計參與這些錦標賽的生成模型的隱藏技能。


錦標賽的參與者可以是嘗試區別真實數據和偽數據的判別器,也可以是嘗試欺騙判別器將偽造數據誤認為是真實數據的生成器。雖然框架主要為 GAN 設計,但它也可以估計任何成為該框架參與者的模型效果。例如顯式密度模型等任何能夠生成樣本的模型都可以作為生成器。


我們引入了兩種方法來總結錦標賽的結果:


錦標賽勝率:錦標賽中每個生成器成功欺騙判別器的平均比率。

技能評分。用技能評分系統對錦標賽的結果進行評估,然后對每個生成器生成一個技能分數。


實驗表明,錦標賽是一種評估生成器模型的有效方式。首先,within-trajectory 錦標賽(在訓練的連續迭代中,單個 GAN 自身的判別器和生成器的 snapshot 之間)提供了一個有用的訓練進度衡量標準,即使只能接觸正在訓練的生成器或判別器。其次,更普遍的錦標賽(具有不同種子、超參數和架構的 GAN 生成器和判別器 snapshot 之間)提供了不同訓練過的 GAN 之間的有效對比。


本論文第二部分將研究放在生成模型評估系統這一更大背景下,詳細說明了谷歌大腦提出的方法和其他方法相比的優點和局限性。4.1 節初步證明了該方法適用于不能很好地表征為標準化圖像嵌入的數據集,例如未標注數據集或自然圖像以外的形式。谷歌大腦研究者還展示了使用技能評分系統來總結錦標賽結果,實現了在一場比賽中對所有參與者進行技能評分,而無需進行二次比賽。4.2 節展示了 GAN 判別器能成功地判斷哪些樣本來自于沒訓練過的生成器,包括其他 GAN 生成器和其他類型的生成模型。4.3 節展示了該方法可以應用于生成器近乎完美的情況下。


論文:Skill Rating for Generative Models

微信圖片_20180817184250.jpg


論文鏈接:https://arxiv.org/abs/1808.04888v1


摘要:我們利用評估人類選手在競技游戲中表現的方法,探索了一種評估生成模型的新方式。我們通過實驗展示了生成器和判別器之間的錦標賽為評估生成模型提供了一種有效方式。我們介紹了兩種對比錦標賽結果的方法:贏率和技能評定。評估在不同語境中都有用,包括監控單個模型在訓練過程中的進展、對比兩個不同的完全訓練模型的能力。我們展示了包含單個模型與其之前、之后版本比賽的錦標賽可以有效輔助對訓練進展的衡量。包含多個單獨模型(使用不同隨機種子、超參數和架構)的錦標賽提供了對不同訓練 GAN 的有效對比。基于錦標賽的評定方法在概念上與大量之前的評估生成模型方法不同,且具備互補的優劣勢。

微信圖片_20180817184322.jpg

圖 1:實驗 1 的 Within-trajectory 錦標賽結果。圖 1a:左圖展示了原始比賽結果。每個像素表示來自實驗 1 不同迭代的生成器和判別器之間的平均贏率。像素越亮表示生成器的性能越強。右圖對比了比賽的概括性指標和 SVHN 分類器得分。該圖中比賽贏率指熱力圖中每列平均像素值。(注意:i=0 時分類器得分低于 4.0,遮擋了同一軸線上其余曲線的對齊,因此我們選擇忽略它。)圖 1b 展示了相同的數據,不過它使用的是相距較遠的迭代之間的比賽,如圖 1b 左圖褐色像素所示的部分。右圖展示了技能評定繼續追蹤模型的進展,即使忽略了一些信息量最大的「戰斗」(早期生成器和晚期判別器,如圖左上角所示),而贏率不再具備信息。

微信圖片_20180817184346.jpg

圖 2:繪制蘋果圖片的 within-trajectory 技能評分。我們評估了在 QuickDraw 數據集上訓練的 DCGAN。從左到右,主觀樣本(subjective sample)質量隨著迭代次數的增加而提高。SVHN 分類器判斷這些樣本質量的能力不強,迭代 0 次時評成了最高分,此后提供了不穩定且惡化的得分。SVHN Fréchet 距離擬合地更好,采樣質量的評分穩定增加,直到 1300 次迭代;但是,它會在 1300 上飽和,而主觀樣本質量繼續增加。(注意 Fréchet 距離圖上的 y 軸是反轉的,這使得較低距離(更好質量)在圖上位置更高)。within-trajectory 技能評分在 1300 次迭代以后繼續提升。

微信圖片_20180817184408.jpg

圖 3:多軌競賽結果。我們組織了一個競賽,其中包含 SVHN 生成器和具有不同種子、超參數和架構的模型的判別器 snapshot(已在 4.2 節中提及)。我們利用 SVHN 分類器評分 (左)、SVHN Fréchet 距離 (中) 和技能評分方法(右;見 3.2 節)對其進行評估。每個點代表一個模型一次迭代的分數。總體軌跡表明隨著訓練次數增加,每個模型都得到了改進。要注意 Fréchet 距離圖上的 y 軸是反轉的,這使得較短的距離(質量較好)在坐標圖上標得更高。真實數據樣本的得分用黑線表示。6-auto 的分數是根據單個 snapshot 而非一條完整的訓練曲線來計算的,并以灰線表示。技能評分生成的學習曲線與 Fréchet 距離生成的學習曲線大致相同,僅在條件模型 4-cond 和 5-cond 中與分類器得分的曲線不一致——我們在 4.2 節中對此差異進行了推測。

微信圖片_20180817184651.jpg

圖 4:完全訓練的生成模型樣本。從每個訓練模型中,我們展示了 64 個樣本(來自 GAN 的 200,000 次迭代和 6-auto 的 106 次 epoch),以及用于比較的真實數據。在每組樣本中,我們列出模型的 Glicko2 技能評分(SR)、SVHN 分類器分數(CS)以及模型的 SVHN Fréchet 距離(FD)。我們的技能評分系統在實驗 5-cond 中略遜于真實數據,但優于 runner-ups 4-cond 和 1,而分類器得分 5-cond 比真實數據好,Fréchet 距離 5-cond 比 4-cond 和 1 都差。在其它情況下,我們系統的排名與 Fréchet 距離一致。

微信圖片_20180817184719.jpg

圖 5:用一個簡單的任務來評估近乎完美的生成器。我們訓練一個普通的 GAN 來模擬具有全協方差矩陣的高斯分布。迭代 8000 次以后的生成器已經掌握了這個任務。迭代 8000 次以后的判別器不再產生有用的判斷(圖 5a),迭代 8000 次之后的 Chekhov GAN 判別器則仍可以判斷之前的生成器樣本(圖 5b)。圖 5c 對這些判別器的技能評分與普通生成器的真實性能進行了比較,并將之衡量為生成器的協方差矩陣估計和數據協方差矩陣之間的平均絕對差。與 within-trajectory 比賽相比,Chekhov 判別器的技能評分更符合真實情況。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
一本色道久久综合亚洲二区三区| 久久久久国内| 性做久久久久久久久| 欧美三级中文字幕在线观看| 久久最新视频| 久久夜精品va视频免费观看| 久久精品国产一区二区三区| 欧美伊人久久| 欧美一区二区三区视频在线观看| 午夜日韩激情| 亚洲欧美综合| 午夜免费电影一区在线观看| 亚洲欧美综合精品久久成人 | 鲁大师成人一区二区三区| 久久精品一区二区| 久久久亚洲国产天美传媒修理工| 久久人人97超碰国产公开结果| 久久久久免费| 美日韩精品免费| 欧美国产精品v| 欧美理论电影网| 欧美色大人视频| 国产精品久久久久久亚洲调教 | 毛片av中文字幕一区二区| 免费成人黄色片| 欧美精品在线视频观看| 欧美日韩人人澡狠狠躁视频| 欧美亚一区二区| 国产欧美日韩一区二区三区在线观看| 国产欧美日本一区二区三区| 国产一区二区高清视频| 国内精品久久久久久久97牛牛| 伊伊综合在线| 亚洲精品乱码久久久久久按摩观 | 亚洲免费影视| 亚洲国产精品欧美一二99| 日韩视频免费看| 亚洲欧美第一页| 久久精品一本| 欧美国产亚洲精品久久久8v| 国产精品sss| 国产人妖伪娘一区91| 在线观看国产欧美| 一本色道久久加勒比88综合| 欧美亚洲免费高清在线观看| 亚洲激情一区二区三区| 亚洲一区二区黄| 久久久久久久波多野高潮日日| 欧美经典一区二区三区| 国产精品亚洲第一区在线暖暖韩国| 狠狠色丁香婷婷综合影院| 亚洲精品欧美精品| 午夜激情久久久| 99re6热只有精品免费观看| 亚洲欧美日韩在线综合| 蜜桃久久精品一区二区| 国产精品v亚洲精品v日韩精品 | 国产精品日韩久久久久| 怡红院精品视频| 在线亚洲电影| 亚洲国产欧美一区二区三区久久 | 亚洲精品久久久久中文字幕欢迎你| 亚洲综合色自拍一区| 久久米奇亚洲| 欧美亚洲成人网| 狠狠综合久久av一区二区老牛| aⅴ色国产欧美| 亚洲第一二三四五区| 亚洲在线视频一区| 欧美多人爱爱视频网站| 国产午夜久久| 一区二区久久| 亚洲精品免费一二三区| 欧美在线亚洲在线| 欧美日韩一区二区三区免费| 狠狠色伊人亚洲综合成人| 一区二区欧美精品| 亚洲欧洲日产国产网站| 欧美永久精品| 欧美日韩视频专区在线播放| 在线观看国产成人av片| 亚洲欧美日韩国产中文| 中文日韩在线视频| 欧美成人免费在线观看| 国产一区二区三区成人欧美日韩在线观看| 99精品视频免费在线观看| 亚洲激情影视| 久久久97精品| 国产精品乱子乱xxxx| 日韩一级大片在线| 日韩性生活视频| 麻豆精品一区二区av白丝在线| 国产欧美一区二区三区久久 | 亚洲尤物在线| 亚洲尤物影院| 欧美日韩精品二区第二页| 亚洲福利视频专区| 久久精品女人| 久久精品一区二区| 国产日韩亚洲欧美综合| 亚洲在线视频免费观看| 亚洲一区精品视频| 欧美色图一区二区三区| 亚洲毛片视频| 一本一本a久久| 欧美精品一区二区精品网 | 亚洲第一网站免费视频| 久久精品一区蜜桃臀影院| 国产亚洲精品福利| 国产模特精品视频久久久久| 亚洲高清视频的网址| 欧美一级淫片播放口| 亚洲欧美日韩天堂| 欧美视频中文字幕在线| 亚洲免费av观看| 99re热精品| 欧美激情国产日韩| 亚洲国产黄色片| 最新国产精品拍自在线播放| 久久综合影视| 在线观看三级视频欧美| 久久精品国产免费观看| 久久综合久久综合久久| 黄色成人在线网站| 欧美综合国产精品久久丁香| 久久黄色影院| 国产一区二区黄| 久久av二区| 麻豆免费精品视频| 亚洲电影第1页| 日韩一级在线| 欧美日韩一区在线播放| 一区二区成人精品| 亚洲欧美一区二区原创| 国产农村妇女毛片精品久久莱园子 | 国产在线一区二区三区四区| 久久国产88| 麻豆av一区二区三区久久| 亚洲国产一区二区三区青草影视| 日韩亚洲成人av在线| 欧美日韩美女在线| 中文国产亚洲喷潮| 欧美在线视频导航| 韩国成人精品a∨在线观看| 亚洲国产欧美在线人成| 欧美日本一道本| 亚洲亚洲精品在线观看 | 久久夜色精品一区| 在线精品福利| 国产精品99久久久久久久久| 国产精品美女主播| 欧美在线视频日韩| 欧美黄色免费网站| 亚洲天堂av电影| 久久精品国产一区二区三区免费看| 经典三级久久| 一区二区三区久久| 国产欧美成人| 亚洲伦理中文字幕| 国产精品视频免费观看| 亚洲国产精品久久久久婷婷884 | 国产精品综合视频| 亚洲国产精品悠悠久久琪琪 | 一区二区三区你懂的| 久久不见久久见免费视频1| 1024成人| 午夜精品美女自拍福到在线 | 久久精品国产一区二区电影| 亚洲黄色免费电影| 午夜精品亚洲一区二区三区嫩草| 好看的亚洲午夜视频在线| 在线午夜精品自拍| 韩国一区二区三区美女美女秀| 一本色道久久加勒比精品| 国产一区二区三区久久| 一区二区三区 在线观看视| 国产日韩欧美一区二区| 9久re热视频在线精品| 国产亚洲一级| 亚洲视频欧洲视频| 一区二区三区亚洲| 午夜精品久久久久| 亚洲人成毛片在线播放| 久久精品女人| 一区二区欧美在线| 六月婷婷久久| 亚洲欧美一区二区激情| 欧美日韩国内| 亚洲国产精品va在线看黑人| 国产精品亚洲精品| 一本久道久久综合狠狠爱| 国产一区二区在线观看免费| 亚洲性av在线| 亚洲黄一区二区三区| 久久爱www久久做| 一区二区三区|亚洲午夜| 欧美aⅴ一区二区三区视频| 亚洲欧美另类中文字幕| 欧美天堂亚洲电影院在线播放| 亚洲欧洲一区二区在线播放|