《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > Ian Goodfellow:你的GAN水平我來打分

Ian Goodfellow:你的GAN水平我來打分

2018-08-17

如何評價生成模型的性能好壞?這似乎是一個復雜而困難的任務。Ian Goodfellow 提出的生成對抗網絡 GAN 已經成為人工智能的重要研究方向,吸引了眾多學者投入研究。但 GAN 也遭遇了「改無可改」的呼聲(參見:六種改進均未超越原版:谷歌新研究對 GAN 現狀提出質疑)。近日,Goodfellow 團隊提出了一種全新生成模型評價方式,看來,GAN 的開山鼻祖終于坐不住了,他試圖親自解決這個問題。


Ian Goodfellow 表示:通過估計解釋模型表現的隱技能變量來評估生成模型的能力似乎是一個很有希望的研究方向。

微信圖片_20180817184112.jpg

谷歌研究科學家 Jordi Pont-Tuset 對于 CVPR 各屆接收論文名稱的統計,GAN 已經超過 LSTM,成為了重要關鍵詞,大有趕超「深度學習」的趨勢。但眾多論文里,真正的改進又有多少?


生成模型的評估是一項非常困難的任務。目前該領域已經探索了許多不同的方法,但每一種方法都存在顯著的缺點。Theis [2016] 和 Borji [2018] 等人概覽了這些方法,并展示了它們各自的缺點。


在這一篇論文中,谷歌大腦提出了一種通過對抗過程評估生成模型的新框架,在該對抗過程中,許多模型在錦標賽(tournament)中進行對抗。谷歌大腦團隊利用先前開發的人類選手評估方法來量化模型在這類錦標賽中的性能。


在國際象棋或網球比賽中,Elo 或 Glicko2 等技能評分系統通過觀察多個參賽者的勝利數和失敗數,推斷每一個參與者的隱藏、未觀察到的技能值(它們解釋了這些觀察到的輸贏數),從而評估他們的技能表現。同樣,谷歌大腦團隊通過構建一個多參與者的錦標賽將生成模型的評估構建為隱藏技能估計問題,該錦標賽可推廣至噪聲對比估計(NCE)和生成對抗網絡(GAN)所使用的兩參與者的可分辨博弈(two-player distinguishability game),并且估計參與這些錦標賽的生成模型的隱藏技能。


錦標賽的參與者可以是嘗試區別真實數據和偽數據的判別器,也可以是嘗試欺騙判別器將偽造數據誤認為是真實數據的生成器。雖然框架主要為 GAN 設計,但它也可以估計任何成為該框架參與者的模型效果。例如顯式密度模型等任何能夠生成樣本的模型都可以作為生成器。


我們引入了兩種方法來總結錦標賽的結果:


錦標賽勝率:錦標賽中每個生成器成功欺騙判別器的平均比率。

技能評分。用技能評分系統對錦標賽的結果進行評估,然后對每個生成器生成一個技能分數。


實驗表明,錦標賽是一種評估生成器模型的有效方式。首先,within-trajectory 錦標賽(在訓練的連續迭代中,單個 GAN 自身的判別器和生成器的 snapshot 之間)提供了一個有用的訓練進度衡量標準,即使只能接觸正在訓練的生成器或判別器。其次,更普遍的錦標賽(具有不同種子、超參數和架構的 GAN 生成器和判別器 snapshot 之間)提供了不同訓練過的 GAN 之間的有效對比。


本論文第二部分將研究放在生成模型評估系統這一更大背景下,詳細說明了谷歌大腦提出的方法和其他方法相比的優點和局限性。4.1 節初步證明了該方法適用于不能很好地表征為標準化圖像嵌入的數據集,例如未標注數據集或自然圖像以外的形式。谷歌大腦研究者還展示了使用技能評分系統來總結錦標賽結果,實現了在一場比賽中對所有參與者進行技能評分,而無需進行二次比賽。4.2 節展示了 GAN 判別器能成功地判斷哪些樣本來自于沒訓練過的生成器,包括其他 GAN 生成器和其他類型的生成模型。4.3 節展示了該方法可以應用于生成器近乎完美的情況下。


論文:Skill Rating for Generative Models

微信圖片_20180817184250.jpg


論文鏈接:https://arxiv.org/abs/1808.04888v1


摘要:我們利用評估人類選手在競技游戲中表現的方法,探索了一種評估生成模型的新方式。我們通過實驗展示了生成器和判別器之間的錦標賽為評估生成模型提供了一種有效方式。我們介紹了兩種對比錦標賽結果的方法:贏率和技能評定。評估在不同語境中都有用,包括監控單個模型在訓練過程中的進展、對比兩個不同的完全訓練模型的能力。我們展示了包含單個模型與其之前、之后版本比賽的錦標賽可以有效輔助對訓練進展的衡量。包含多個單獨模型(使用不同隨機種子、超參數和架構)的錦標賽提供了對不同訓練 GAN 的有效對比?;阱\標賽的評定方法在概念上與大量之前的評估生成模型方法不同,且具備互補的優劣勢。

微信圖片_20180817184322.jpg

圖 1:實驗 1 的 Within-trajectory 錦標賽結果。圖 1a:左圖展示了原始比賽結果。每個像素表示來自實驗 1 不同迭代的生成器和判別器之間的平均贏率。像素越亮表示生成器的性能越強。右圖對比了比賽的概括性指標和 SVHN 分類器得分。該圖中比賽贏率指熱力圖中每列平均像素值。(注意:i=0 時分類器得分低于 4.0,遮擋了同一軸線上其余曲線的對齊,因此我們選擇忽略它。)圖 1b 展示了相同的數據,不過它使用的是相距較遠的迭代之間的比賽,如圖 1b 左圖褐色像素所示的部分。右圖展示了技能評定繼續追蹤模型的進展,即使忽略了一些信息量最大的「戰斗」(早期生成器和晚期判別器,如圖左上角所示),而贏率不再具備信息。

微信圖片_20180817184346.jpg

圖 2:繪制蘋果圖片的 within-trajectory 技能評分。我們評估了在 QuickDraw 數據集上訓練的 DCGAN。從左到右,主觀樣本(subjective sample)質量隨著迭代次數的增加而提高。SVHN 分類器判斷這些樣本質量的能力不強,迭代 0 次時評成了最高分,此后提供了不穩定且惡化的得分。SVHN Fréchet 距離擬合地更好,采樣質量的評分穩定增加,直到 1300 次迭代;但是,它會在 1300 上飽和,而主觀樣本質量繼續增加。(注意 Fréchet 距離圖上的 y 軸是反轉的,這使得較低距離(更好質量)在圖上位置更高)。within-trajectory 技能評分在 1300 次迭代以后繼續提升。

微信圖片_20180817184408.jpg

圖 3:多軌競賽結果。我們組織了一個競賽,其中包含 SVHN 生成器和具有不同種子、超參數和架構的模型的判別器 snapshot(已在 4.2 節中提及)。我們利用 SVHN 分類器評分 (左)、SVHN Fréchet 距離 (中) 和技能評分方法(右;見 3.2 節)對其進行評估。每個點代表一個模型一次迭代的分數??傮w軌跡表明隨著訓練次數增加,每個模型都得到了改進。要注意 Fréchet 距離圖上的 y 軸是反轉的,這使得較短的距離(質量較好)在坐標圖上標得更高。真實數據樣本的得分用黑線表示。6-auto 的分數是根據單個 snapshot 而非一條完整的訓練曲線來計算的,并以灰線表示。技能評分生成的學習曲線與 Fréchet 距離生成的學習曲線大致相同,僅在條件模型 4-cond 和 5-cond 中與分類器得分的曲線不一致——我們在 4.2 節中對此差異進行了推測。

微信圖片_20180817184651.jpg

圖 4:完全訓練的生成模型樣本。從每個訓練模型中,我們展示了 64 個樣本(來自 GAN 的 200,000 次迭代和 6-auto 的 106 次 epoch),以及用于比較的真實數據。在每組樣本中,我們列出模型的 Glicko2 技能評分(SR)、SVHN 分類器分數(CS)以及模型的 SVHN Fréchet 距離(FD)。我們的技能評分系統在實驗 5-cond 中略遜于真實數據,但優于 runner-ups 4-cond 和 1,而分類器得分 5-cond 比真實數據好,Fréchet 距離 5-cond 比 4-cond 和 1 都差。在其它情況下,我們系統的排名與 Fréchet 距離一致。

微信圖片_20180817184719.jpg

圖 5:用一個簡單的任務來評估近乎完美的生成器。我們訓練一個普通的 GAN 來模擬具有全協方差矩陣的高斯分布。迭代 8000 次以后的生成器已經掌握了這個任務。迭代 8000 次以后的判別器不再產生有用的判斷(圖 5a),迭代 8000 次之后的 Chekhov GAN 判別器則仍可以判斷之前的生成器樣本(圖 5b)。圖 5c 對這些判別器的技能評分與普通生成器的真實性能進行了比較,并將之衡量為生成器的協方差矩陣估計和數據協方差矩陣之間的平均絕對差。與 within-trajectory 比賽相比,Chekhov 判別器的技能評分更符合真實情況。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
午夜视黄欧洲亚洲| 亚洲视频一二区| 一区二区三区黄色| 亚洲日本电影在线| 亚洲日本电影| 日韩亚洲视频| 一区二区成人精品 | 性欧美精品高清| 亚洲综合视频在线| 午夜精品久久久久久久蜜桃app| 国产精品99久久久久久白浆小说 | 久久国产手机看片| 欧美在线视频一区二区三区| 欧美在线播放视频| 久久精品国产一区二区三区免费看| 久久av一区二区三区| 久久精品视频在线播放| 亚洲国产高清一区二区三区| 亚洲欧洲精品一区| 一区二区三区国产精华| 亚洲午夜黄色| 午夜免费电影一区在线观看| 欧美亚洲自偷自偷| 久久久久久久一区| 欧美本精品男人aⅴ天堂| 欧美久久久久久| 欧美日韩一区在线观看| 国产精品毛片大码女人| 国产婷婷色一区二区三区四区| 好吊日精品视频| 亚洲国产一区二区视频| 亚洲免费高清| 亚洲欧美日韩在线播放| 久久精品国产免费| 日韩视频在线永久播放| 亚洲一区二三| 久久精品亚洲一区二区| 免费欧美在线视频| 欧美日韩亚洲一区二区| 国产精品日韩二区| 精久久久久久| 99re66热这里只有精品3直播| 一区二区三区日韩精品视频| 亚洲欧美日韩精品久久久久| 亚洲福利视频专区| 在线亚洲电影| 久久精品女人| 欧美精品性视频| 国产精品视频yy9099| 好看的亚洲午夜视频在线| 最新69国产成人精品视频免费| 一区二区三区日韩在线观看| 久久av一区| 中文国产成人精品| 久久久久久伊人| 欧美日韩另类字幕中文| 国产日韩专区在线| 亚洲精品乱码视频| 欧美一区1区三区3区公司| 亚洲美女电影在线| 欧美一级淫片aaaaaaa视频| 美日韩精品视频免费看| 国产精品久久久久av免费| 在线观看欧美日本| 亚洲欧美日韩第一区| 亚洲精品资源美女情侣酒店| 欧美一区永久视频免费观看| 欧美精品尤物在线| 国内精品嫩模av私拍在线观看 | 欧美精品电影在线| 国产欧美精品一区二区色综合 | 一本久久综合亚洲鲁鲁| 久久精品亚洲精品国产欧美kt∨| 欧美日韩国产色站一区二区三区| 国产偷久久久精品专区| 99在线热播精品免费99热| 亚洲第一综合天堂另类专| 亚洲免费视频网站| 欧美激情第五页| 国语精品中文字幕| 亚洲欧美久久| 亚洲天堂免费在线观看视频| 久久久久一区二区| 国产精品v欧美精品v日韩精品| 亚洲成人自拍视频| 校园激情久久| 亚洲综合色在线| 欧美日韩国产二区| 永久域名在线精品| 欧美在线观看日本一区| 午夜欧美电影在线观看| 欧美日韩免费高清| 亚洲黄网站黄| 最新国产成人av网站网址麻豆| 久久精品国产一区二区电影 | 国产精品系列在线播放| 99re热这里只有精品视频| 亚洲国产另类久久精品| 欧美资源在线| 国产精品丝袜久久久久久app| 亚洲精品久久久久久一区二区| 亚洲国产视频一区| 久久久久久国产精品mv| 国产老女人精品毛片久久| 一区二区三区久久| 一本久久青青| 欧美日韩国产成人精品| 亚洲精品偷拍| 夜夜嗨av一区二区三区四区 | 亚洲社区在线观看| 欧美精品一区二区三| 亚洲大片精品永久免费| 亚洲黄色天堂| 美女尤物久久精品| 亚洲高清免费| 亚洲精品综合精品自拍| 欧美gay视频激情| 亚洲国产精品小视频| 亚洲国产专区校园欧美| 久色婷婷小香蕉久久| 精品动漫3d一区二区三区| 欧美一区二区三区免费视| 久久精品国产欧美激情| 国内精品视频久久| 亚洲第一精品福利| 免费视频一区二区三区在线观看| 一区精品在线播放| 亚洲精品欧美精品| 欧美精品色网| 一区二区三欧美| 午夜精品久久久久| 国产欧美一级| 久久成人在线| 欧美成人免费观看| 亚洲三级电影在线观看| 亚洲午夜av电影| 国产精品婷婷午夜在线观看| 亚洲专区一区二区三区| 久久gogo国模裸体人体| 精品91久久久久| 亚洲免费大片| 国产精品久久久久久久久久久久久| 亚洲在线播放| 久热精品在线| 亚洲美女诱惑| 欧美一区二区视频在线| 国模大胆一区二区三区| 亚洲精品人人| 国产精品多人| 性色av一区二区三区在线观看| 裸体素人女欧美日韩| 亚洲毛片av在线| 欧美一区二区三区视频在线观看 | 亚洲女同同性videoxma| 国产精品免费一区二区三区在线观看 | 亚洲欧美区自拍先锋| 久久性天堂网| 亚洲精品综合久久中文字幕| 亚洲男女自偷自拍| 国语自产在线不卡| 宅男66日本亚洲欧美视频 | 国产一区二区电影在线观看| 亚洲国产日韩欧美一区二区三区| 欧美另类极品videosbest最新版本| 亚洲少妇自拍| 久久综合国产精品| 一区二区三区四区蜜桃| 久久综合电影| 亚洲一二三区精品| 米奇777在线欧美播放| 在线视频亚洲欧美| 免费91麻豆精品国产自产在线观看| 99视频精品全部免费在线| 久久成人羞羞网站| 亚洲精品视频一区| 久久精品视频va| 亚洲免费av网站| 久久视频在线看| 在线亚洲一区观看| 蜜臀久久久99精品久久久久久| 亚洲少妇自拍| 欧美精品aa| 久久精品国产欧美激情| 国产精品igao视频网网址不卡日韩| 久久精品国产免费看久久精品| 国产精品成人一区二区三区夜夜夜| 久久精品视频在线| 国产精品男女猛烈高潮激情| 日韩视频免费大全中文字幕| 国产日韩一级二级三级| 国产精品99久久久久久白浆小说| 激情91久久| 久久9热精品视频| 99视频在线观看一区三区| 另类春色校园亚洲| 午夜精品久久久久影视 | 亚洲自拍啪啪| 亚洲精品乱码久久久久久蜜桃91| 久久精品一区二区三区不卡| 亚洲午夜羞羞片|