《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > NIPS 2018 | 哪種特征分析法適合你的任務(wù)?Ian Goodfellow提出顯著性映射的可用性測試

NIPS 2018 | 哪種特征分析法適合你的任務(wù)?Ian Goodfellow提出顯著性映射的可用性測試

2018-10-31

顯著性方法被廣泛應(yīng)用于突出輸入中與學(xué)到的模型的預(yù)測結(jié)果相關(guān)的特征。現(xiàn)有的顯著性方法通常是以圖像數(shù)據(jù)的視覺吸引作為指導(dǎo)的。本文提出了一種可行的方法來評估一個給定的方法能夠/不能提供什么樣的解釋。研究發(fā)現(xiàn),僅僅依賴于視覺的評估可能會產(chǎn)生一些誤導(dǎo)性的結(jié)果。通過大量實驗,研究人員證明了一些現(xiàn)有的顯著性方法獨(dú)立于模型和數(shù)據(jù)生成過程。因此,在本文測試中表現(xiàn)較差的方法不能夠勝任那些對數(shù)據(jù)或模型敏感的任務(wù)。


機(jī)器之心SyncedIan Goodfellow小程序


隨著機(jī)器學(xué)習(xí)的復(fù)雜度和影響力不斷提升,許多人希望找到一些解釋的方法,用于闡釋學(xué)得模型的重要屬性 [1, 2]。對模型的解釋可能有助于模型滿足法規(guī)要求 [3],幫助從業(yè)人員對模型進(jìn)行調(diào)試 [4],也許還能揭示模型學(xué)到的偏好或其他預(yù)期之外的影響 [5, 6]。顯著性方法(Saliency method)是一種越來越流行的工具,旨在突出輸入(通常是圖像)中的相關(guān)特征。盡管最近有一些令人振奮的重大研究進(jìn)展 [7-20],但是解釋機(jī)器學(xué)習(xí)模型的重要努力面臨著方法論上的挑戰(zhàn):難以評估模型解釋的范圍和質(zhì)量。當(dāng)要在眾多相互競爭的方法中做出選擇時,往往缺乏原則性的指導(dǎo)方針,這會讓從業(yè)者感到困惑。


本論文提出了一種基于隨機(jī)化檢驗(randomization test)的可行方法來評估解釋方法的性能。作者在神經(jīng)網(wǎng)絡(luò)圖像分類任務(wù)上分析了一些顯著性方法。實際上,本論文提出的方法論適用于任何解釋方法。而且本文提出的隨機(jī)化檢驗是很容易實現(xiàn)的,可以幫助人們評估某個解釋方法對手頭任務(wù)的適用性。


研究者在大量實驗研究中,將該方法論應(yīng)用到了大量現(xiàn)有的顯著性方法、模型架構(gòu)和數(shù)據(jù)集上。令人吃驚的是,一些被廣泛采用的顯著性方法是獨(dú)立于訓(xùn)練數(shù)據(jù)和模型參數(shù)的。因此,這些方法對依賴模型的任務(wù)(如調(diào)試模型)或依賴數(shù)據(jù)顯示出的輸入和輸出之間關(guān)系的任務(wù)沒有太大幫助。


為了說明這一點,圖 1 將標(biāo)準(zhǔn)顯著性方法的輸出和一個邊緣檢測器的輸出進(jìn)行了對比。邊緣檢測器不依賴于模型或訓(xùn)練數(shù)據(jù),但它會產(chǎn)生與顯著圖(saliency map)在視覺上相似的結(jié)果。這表明,基于視覺效果的檢查方法在判斷某種解釋方法是否對底層的模型和數(shù)據(jù)敏感時指導(dǎo)意義較差。

微信圖片_20181031231227.jpg

圖 1:一些常用方法與邊緣檢測器的顯著圖對比。上圖顯示了在 ImageNet 上訓(xùn)練的 Inception v3 模型 3 個不同輸入的顯著性掩碼(saliency mask)。可以看到邊緣檢測器產(chǎn)生的輸出與一些顯著性方法的輸出極為相似。實際上,邊緣檢測器也可以產(chǎn)生突出與模型類別預(yù)測相關(guān)特征的掩碼。有趣的是,研究者發(fā)現(xiàn)與邊緣檢測器最類似的顯著性方法(即 Guided Backprop 及其變體)對本研究的隨機(jī)化檢驗最不敏感。


本論文提出的方法源于統(tǒng)計隨機(jī)化檢驗,它將自然實驗和人為的隨機(jī)試驗進(jìn)行了對比。研究者重點關(guān)注通用框架的兩種實例化:模型參數(shù)隨機(jī)化檢驗及數(shù)據(jù)隨機(jī)化檢驗。


模型參數(shù)隨機(jī)化檢驗將顯著性方法在訓(xùn)練好的模型上的輸出與顯著性方法在一個隨機(jī)初始化的、結(jié)構(gòu)相同的未訓(xùn)練網(wǎng)絡(luò)上的輸出進(jìn)行對比。如果顯著性方法依賴于模型學(xué)習(xí)到的參數(shù),我們應(yīng)該期望它的輸出在這兩種情況下會有很大的差異。但是,如果輸出類似,我們可以推斷出顯著性映射對模型的屬性(本例中為模型參數(shù))是不敏感的。特別地,顯著性映射的輸出對于諸如模型調(diào)試這樣不可避免地依賴于模型的任務(wù)是沒有幫助的。


數(shù)據(jù)隨機(jī)化檢驗將應(yīng)用于在帶標(biāo)簽的數(shù)據(jù)集上訓(xùn)練的模型的顯著性方法與應(yīng)用于架構(gòu)相同但是在我們隨機(jī)排列所有標(biāo)簽的數(shù)據(jù)集副本上訓(xùn)練的模型的顯著性方法進(jìn)行了對比。如果顯著性方法依賴于數(shù)據(jù)標(biāo)簽,我們也應(yīng)該期望它的輸出在這兩種情況下會有很大的差異。然而,顯著性方法對重新排列的標(biāo)簽的不敏感表明,該方法不依賴于實例(例如圖像)和原始數(shù)據(jù)中存在的標(biāo)簽之間的關(guān)系。


從更大的范疇上說,任何解釋方法都遵循一系列不變的特性,即不改變方法的輸出的數(shù)據(jù)和模型的變換。如果我們發(fā)現(xiàn)了一種不符合當(dāng)前任務(wù)需求的不變特性,我們可以拒絕該方法。因此,我們的測試可以看作是實際部署方法之前要執(zhí)行的可用性測試。


本文的貢獻(xiàn):


我們提出了 2 種易于實現(xiàn)的具體檢驗方法,用于評估解釋方法的范圍和質(zhì)量:模型參數(shù)隨機(jī)化檢驗和數(shù)據(jù)隨機(jī)化檢驗。這兩種檢驗方法可以廣泛應(yīng)用于各種解釋方法。

我們對不同的數(shù)據(jù)集和模型架構(gòu)上應(yīng)用的解釋方法進(jìn)行了廣泛的實驗。并發(fā)現(xiàn)一些被檢驗的方法獨(dú)立于模型參數(shù)和訓(xùn)練模型所使用的數(shù)據(jù)的標(biāo)簽。

因此,我們的發(fā)現(xiàn)表明,那些在我們提出的測試中表現(xiàn)不好的顯著性方法沒有能力為那些需要對任何模型和數(shù)據(jù)都適用的解釋方法的任務(wù)提供支持。

我們通過一系列對于線性模型和一個簡單的 1 層卷積求和池化(sum pooling)架構(gòu)的分析來說明我們的發(fā)現(xiàn),同時也與邊緣檢測器進(jìn)行了對比。


論文:Sanity Checks for Saliency Maps

微信圖片_20181031231248.jpg


論文鏈接:https://arxiv.org/pdf/1810.03292v1.pdf


摘要:顯著性方法已經(jīng)成為了一種流行的工具,被用于突出輸入中被認(rèn)為與學(xué)到的模型的預(yù)測結(jié)果相關(guān)的特征。目前研究人員提出的顯著性方法通常是以圖像數(shù)據(jù)的視覺吸引作為指導(dǎo)的。本文提出了一種可行的方法來評估一個給定的方法能夠提供/不能提供什么樣的解釋。我們發(fā)現(xiàn),僅僅依賴于視覺的評估可能會產(chǎn)生一些誤導(dǎo)性的結(jié)果。通過大量的實驗,我們證明了一些現(xiàn)有的顯著性方法獨(dú)立于模型和數(shù)據(jù)生成過程。因此,在我們的測試中表現(xiàn)較差的方法不能夠勝任那些對數(shù)據(jù)或模型敏感的任務(wù)(例如找出數(shù)據(jù)中的異常值、解釋輸入和模型學(xué)到的輸出之間的關(guān)系以及對模型進(jìn)行調(diào)試)。我們通過與圖像的邊緣檢測器(一種既不需要訓(xùn)練數(shù)據(jù)也不需要模型的技術(shù))進(jìn)行類比對我們發(fā)現(xiàn)進(jìn)行說明。線性模型和單層卷積神經(jīng)網(wǎng)絡(luò)場景下的理論能夠支持我們實驗中的發(fā)現(xiàn)。


研究方法和相關(guān)工作


在本文提出的方法的形式化定義中,輸入為向量 x ∈ R^d。模型描述了一個函數(shù) S : R^d → R^C,其中 C 是分類問題中的類別數(shù)。解釋方法會提供一個解釋映射 E : R^d → R^d,它將輸入映射到形狀相同的物體上。


現(xiàn)在,我們將簡要描述一下我們所研究的一些解釋方法。文章的補(bǔ)充材料包含了對這些方法更加深入的概述。我們的目的不是詳盡地評估所有先前的解釋方法,而是要強(qiáng)調(diào)我們的方法如何應(yīng)用于一些我們很感興趣的案例。


對輸入 x 的梯度解釋(gradient explanation)是 E_grad(x) = ?S/?x [21, 7]。梯度量化了在每個輸入維度上的變化量會在輸入的一個小的鄰域內(nèi)如何改變預(yù)測結(jié)果 S(x)。


梯度輸入。另一種形式的解釋是輸入和梯度之間的內(nèi)積,記做 x·?S/?x,它可以解決「梯度飽和」問題并減少視覺擴(kuò)散 [12]。


積分梯度(IG)也通過對標(biāo)準(zhǔn)化后的輸入求和來處理梯度飽和問題。對于輸入 x 的 IG 可以表示為微信圖片_20181031231328.jpg,其中 x^ˉ 是一個「基線輸入」,表示原始輸入 x 中缺失的特征。


導(dǎo)向反向傳播(GBP)[8] 建立在解釋方法「DeConvNet」[9] 的基礎(chǔ)上,并且和負(fù)梯度向設(shè)置為 0 、通過 ReLU 單元進(jìn)行反向傳播的梯度解釋相一致。


由 Selvaraju 等人 [18] 提出的導(dǎo)向 GradCAM 解釋對應(yīng)于 DNN 最后的卷積單元的特征映射組成的分類得分(logit)的梯度。對于像素級力度的 GradCAM,可以通過元素積與導(dǎo)向方向傳播結(jié)合在一起


SmoothGrad(SG,平滑梯度)[15] 試圖通過對輸入的帶噪聲的副本的解釋進(jìn)行平均,以減少顯著性映射的噪聲、緩解視覺擴(kuò)散現(xiàn)象 [13,12]。對于給定的解釋映射 E,SmoothGrad 被定義為 微信圖片_20181031231402.jpg,其中,噪聲向量的元素微信圖片_20181031231417.jpg 為從正態(tài)分布中提取的獨(dú)立同分布的變量。


模型參數(shù)的隨機(jī)性檢驗

微信圖片_20181031231437.jpg

圖 2:在 Inception v3(ImageNet)上的級聯(lián)隨機(jī)性。此圖顯示了 Junco 鳥的原始解釋結(jié)果(第一列)以及每種解釋類型的標(biāo)簽。從左到右的過程顯示了網(wǎng)絡(luò)權(quán)值(以及其他可訓(xùn)練的變量)全部的隨機(jī)性,直到包含「塊」。我們展示了隨機(jī)性的 17 個塊。坐標(biāo)(Gradient,mixed_7b)顯示的是從 Logits 開始直到 mixed_7b 的頂層已經(jīng)被重新初始化的網(wǎng)絡(luò)的梯度解釋。最后一列對應(yīng)于一個權(quán)值完全重新初始化的網(wǎng)絡(luò)。更多示例請參見附錄。

微信圖片_20181031231454.jpg

圖 3:級聯(lián)隨機(jī)性。對于 ImageNet 上的 Inception v3 模型、 Fashion MNIST 數(shù)據(jù)集上的卷積神經(jīng)網(wǎng)絡(luò)、MNIST 數(shù)據(jù)集上的多層感知機(jī)的從頂層開始的權(quán)值連續(xù)重初始化過程。在所有的圖中,y 坐標(biāo)是原始解釋和由直到該點所代表的層/塊的隨機(jī)性所推導(dǎo)出的隨機(jī)解釋之間的秩相關(guān)性,而 x 坐標(biāo)則與 DNN 從輸出層開始的層/塊相對應(yīng)。黑色的虛線代表網(wǎng)絡(luò)的連續(xù)隨機(jī)化由此開始,它處于模型的頂層。上面一排是帶絕對值的 Spearman 秩相關(guān)性,下面一排是不帶絕對值的 Spearman 秩相關(guān)性。說明:對于不帶絕對值的 ImageNet 上的 Inception v3 模型,積分梯度、梯度輸入和梯度重合。對于 MNIST 數(shù)據(jù)集上的多層感知機(jī)模型,積分梯度和梯度輸入重合。


數(shù)據(jù)的隨機(jī)性檢驗

微信圖片_20181031231512.jpg

圖 5:對真實模型和用隨機(jī)標(biāo)簽訓(xùn)練的模型的解釋的對比。左上角:將 用于卷積神經(jīng)網(wǎng)絡(luò)的 MNIST 測試集中數(shù)字 0 的掩膜的絕對值可視化結(jié)果。右上角:用各種顏色顯示的用于卷積神經(jīng)網(wǎng)絡(luò)的 MNIST 測試集中數(shù)字 0 的顯著性掩膜。

微信圖片_20181031231532.jpg

圖 21:對 Corn 進(jìn)行獨(dú)立隨機(jī)性測試

微信圖片_20181031231551.jpg

圖 23:對在 MNIST 數(shù)據(jù)集上訓(xùn)練的 CNN 分別進(jìn)行獨(dú)立、連續(xù)的重初始化工作。

微信圖片_20181031231607.jpg

圖 27:應(yīng)用在一維卷積求和模型上的顯著性方法。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产精品免费aⅴ片在线观看| 国内揄拍国内精品久久| 欧美一区二视频| 在线视频精品一区| 日韩一区二区电影网| 亚洲日本中文字幕| 亚洲国产一区在线观看| 亚洲高清在线播放| 欧美一区二区黄| 亚洲欧美影院| 午夜一区不卡| 欧美亚洲尤物久久| 性欧美大战久久久久久久久| 亚洲尤物精选| 亚洲欧美中文日韩在线| 亚欧成人精品| 久久福利视频导航| 久久国产日韩| 亚洲激精日韩激精欧美精品| 亚洲电影免费| 亚洲电影免费| 最新亚洲一区| 一二三四社区欧美黄| 中文网丁香综合网| 亚洲欧美变态国产另类| 欧美一区二区三区四区高清 | 亚洲视频在线一区观看| 亚洲视频电影图片偷拍一区| 亚洲一本视频| 性欧美大战久久久久久久免费观看| 欧美怡红院视频| 亚洲欧洲精品一区二区三区| 亚洲精品一区二区三区av| 99亚洲一区二区| 亚洲性图久久| 久久国产一区二区| 免费试看一区| 欧美日韩国产系列| 欧美午夜片欧美片在线观看| 国产精品私房写真福利视频 | 亚洲已满18点击进入久久| 欧美一级大片在线免费观看| 亚洲国产精品成人久久综合一区| 亚洲人成网站999久久久综合| 在线亚洲免费| 久久福利影视| 欧美黑人一区二区三区| 国产精品久久久久久久一区探花 | 午夜亚洲伦理| 久久欧美肥婆一二区| 欧美激情综合在线| 国产乱码精品| 亚洲国产另类久久久精品极度| 在线中文字幕一区| 久久国产精品一区二区| 夜夜嗨av一区二区三区中文字幕| 午夜欧美精品久久久久久久| 久久综合九色欧美综合狠狠| 欧美日韩视频在线一区二区观看视频| 国产精品毛片va一区二区三区| 狠狠色狠狠色综合| 夜夜爽夜夜爽精品视频| 久久国产乱子精品免费女| 一区二区三区国产盗摄| 久久久国产一区二区三区| 欧美日韩国产精品自在自线| 国产日韩欧美二区| 亚洲精品日韩激情在线电影| 欧美亚洲在线视频| 一区二区三区四区五区精品视频| 久久国产乱子精品免费女 | 欧美色综合网| 一区二区三区在线免费播放| 亚洲五月六月| 日韩网站免费观看| 久久国产夜色精品鲁鲁99| 欧美日韩视频一区二区| 伊人久久大香线蕉av超碰演员| 一本色道久久综合| 亚洲人妖在线| 久久久久久久尹人综合网亚洲| 欧美日韩视频在线一区二区| 激情综合亚洲| 亚洲欧美国产毛片在线| 日韩一区二区精品在线观看| 久久久久久噜噜噜久久久精品| 国产精品成人免费精品自在线观看| 极品尤物av久久免费看| 午夜伦理片一区| 亚洲视频视频在线| 欧美电影免费观看高清| 国内精品久久久久影院色 | 欧美亚洲日本网站| 欧美日韩国语| 亚洲二区精品| 久久精品国产91精品亚洲| 欧美一区二区三区久久精品茉莉花 | 欧美特黄一区| 亚洲免费黄色| 亚洲理伦在线| 欧美v日韩v国产v| 狠狠色丁香久久综合频道 | 久久久国产一区二区| 国产精品亚洲不卡a| 99在线精品免费视频九九视| 亚洲精品在线免费| 欧美成人激情视频| 亚洲第一级黄色片| 亚洲国产激情| 免费观看30秒视频久久| 精品电影在线观看| 亚洲国产精品精华液网站| 久久亚洲视频| 在线日本高清免费不卡| 久久精品亚洲国产奇米99| 久久精品亚洲一区二区三区浴池| 国产欧美亚洲日本| 午夜精品三级视频福利| 欧美一区二区私人影院日本 | 国内精品伊人久久久久av一坑 | 久久精品国产v日韩v亚洲| 久久精品人人做人人综合| 国产亚洲va综合人人澡精品| 欧美一激情一区二区三区| 久久精品国产99| 国产尤物精品| 久久激情五月婷婷| 久久综合久色欧美综合狠狠| 在线国产亚洲欧美| 最新国产乱人伦偷精品免费网站| 欧美肥婆在线| 亚洲伦理在线| 亚洲欧洲99久久| 国产欧美日韩免费| 久久国产精品99国产精| 久久综合色天天久久综合图片| 尤物九九久久国产精品的分类| 亚洲国产三级| 欧美片在线观看| 99日韩精品| 午夜精品久久久久久久99热浪潮| 国产乱码精品一区二区三区av| 新67194成人永久网站| 久久综合狠狠综合久久综青草| 亚洲国产高清一区| 亚洲少妇自拍| 国产欧美日韩一区二区三区| 欧美在线播放高清精品| 欧美不卡视频一区| 亚洲六月丁香色婷婷综合久久| 亚洲欧美在线播放| 国内揄拍国内精品久久| 亚洲精选视频在线| 国产精品久久久久久久久果冻传媒| 欧美亚洲视频在线观看| 欧美大片免费观看| 制服丝袜亚洲播放| 久久久亚洲国产美女国产盗摄| 亚洲激情视频在线观看| 亚洲欧美日韩成人| 狠狠入ady亚洲精品经典电影| 一本不卡影院| 国产一区二区三区久久久| 亚洲精品综合久久中文字幕| 国产精品第一区| 亚洲第一色中文字幕| 欧美日韩精品在线观看| 午夜在线观看免费一区| 欧美精品导航| 午夜欧美理论片| 欧美激情女人20p| 亚洲欧美日韩精品| 欧美精品播放| 欧美一级精品大片| 欧美日产在线观看| 欧美一区深夜视频| 欧美三区在线观看| 亚洲第一区中文99精品| 国产精品久久777777毛茸茸| 亚洲国产欧美一区| 国产精品亚洲成人| 日韩视频在线观看国产| 国产一区二区精品久久91| 在线一区视频| 在线观看欧美视频| 欧美影视一区| 亚洲免费成人av| 免费欧美在线| 亚洲欧美日韩国产一区二区| 欧美精品一区二区蜜臀亚洲| 久久国内精品视频| 国产精品一区免费在线观看| 亚洲最新视频在线| 国内精品久久久久伊人av| 亚洲欧美日韩国产综合精品二区| 亚洲国产婷婷综合在线精品| 久久国产精品亚洲va麻豆| 99国产一区| 欧美精品九九99久久| 亚洲福利电影|