《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > ImageNet分類器可以泛化到ImageNet上嗎?

ImageNet分類器可以泛化到ImageNet上嗎?

2019-02-27

當前的分類模型泛化到新數據時總會有不同程度的準確率下降,傳統觀點認為這種下降與模型的適應性相關。但本文通過實驗證明,準確率下降的原因是模型無法泛化到比原始測試集中更難分類的圖像上。


機器學習的首要目標是生成泛化模型。我們常通過測量模型在測試集上的性能來量化模型的泛化能力。在測試集上的良好性能是指什么?至少在遵循相同的數據清理協議時,模型在由相同數據源組成的新測試集上也能表現良好。


在本文中,研究人員通過復制兩個重要基線數據集(CIFAR-10 和 ImageNet)的創建過程來實現這一實驗。與理想結果相反,他們發現很多分類模型未能達到其原始的準確率分數。CIFAR-10 的準確率下降了 3%~15%,ImageNet 的準確率下降了 11%~14%。在 ImageNet 上,損失的準確率大概需要機器學習研究高度活躍時期五年的進步來彌補。


傳統觀點認為,出現這種下降的原因是模型已經適應了原始測試集中的特定圖像,例如,通過廣泛的超參數調整。然而,本文的實驗表明,模型的相對順序在新測試集上幾乎保持不變:在原始測試集上具有最高準確率的模型仍然是新測試集上具有最高準確率的模型。而且,準確率方面也沒有遞減。實際上,原始測試集上的準確率每提高一個百分點都意味著新測試集上更大的改進。因此,雖然后來的模型本可以更好地適應測試集,但它們的準確率下降較小。實驗結果證明,全面的測試集評估是改進圖像分類模型的有效方法。因此,自適應性不太可能是準確率下降的原因。


相反,研究人員基于原始和新測試集的相對難度提出了另一種解釋。他們證明,如果新數據集只包含候選池中最簡單的圖像,幾乎可以完全恢復原始的 ImageNet 準確率。這表明即使是最好的圖像分類器,其準確率分數也對數據清理過程的細節高度敏感。它還表明,即使在精心控制的重復性實驗的良性環境中,目前的分類器仍然不能可靠地泛化。


圖 1 顯示了實驗的主要結果。為了支持未來研究,研究人員還發布了新的測試集和相應的代碼。

微信圖片_20190227204524.jpg

圖 1:在原始測試集和新測試集上的模型準確率。每個數據點對應于測試平臺中的一個模型(顯示為 95%的 Clopper-Pearson 置信區間)。該圖揭示了兩個主要現象:1)從原始測試集到新測試集的準確率明顯下降。2)模型準確率遵循斜率大于 1 的線性函數(CIFAR-10 為 1.7,ImageNet 為 1.1)。這意味著原始測試集上的每個百分點的改進會轉換為新測試集上超過一個百分點的改進。從上圖可以直觀地對比兩邊的斜率。紅色區域是 10 萬個 bootstrap 樣本線性擬合的 95%置信區域。


論文:Do ImageNet Classifiers Generalize to ImageNet?

微信圖片_20190227204546.jpg


論文地址:http://people.csail.mit.edu/ludwigs/papers/imagenet.pdf



摘要:我們為 CIFAR-10 和 ImageNet 數據集構建了新的測試集。這兩個基準測試集近十年來一直是研究的焦點,增加了過度重復使用測試集的風險。通過密切關注原始數據集創建過程,我們測試了當前分類模型泛化到新數據的程度。我們評估了大量模型,發現在 CIFAR-10 上的準確率下降了 3%~15%,在 ImageNet 上的準確率下降了 11%~14%。但是,原始測試集上準確率的改進能夠為新測試集帶來更大的改進。結果表明,準確率下降不是由適應性造成的,而是由于模型無法泛化到比原始測試集中更難分類的圖像上。


實驗總結


可重復性實驗的主要步驟如下。附錄 B 和 C 詳細地描述了此方法。第一步是選擇信息性數據集。

微信圖片_20190227204603.jpg

表 1:原始 CIFAR-10 測試集、原始 ImageNet 驗證集和新測試集上的模型準確率。ΔRank 是所有模型完整排序中從原始測試集到新測試集的排名相對差異(參見附錄 B.3.3 和 C.4.4)。例如,ΔRank= -2 意味著與原始測試集相比,新測試集上的模型下降了兩名。置信區間為 95%的 Clopper-Pearson 區間。由于篇幅限制,模型的參考資料見附錄 B.3.2 和 C.4.3。

微信圖片_20190227204629.jpg

表 2:三種采樣策略對 ImageNet 測試集的影響。該表顯示了結果數據集中的平均 MTurk 選擇頻率,以及與原始驗證集相比模型準確率的平均變化。所有三個測試集的平均選擇頻率都超過 0.7,但模型準確率仍然相差很大。相比之下,在 MTurk 實驗中,原始 ImageNet 驗證集的平均選擇頻率為 0.71。在 top-1 和 top-5 中,平均準確率的變化分別為 14%和 10%。這表明采樣策略的細節對結果的準確率有很大影響。

微信圖片_20190227204646.jpg

圖 2:原始 ImageNet 驗證集上的模型準確率 vs. 新測試集的兩個變體上的準確率。每個數據點對應于測試平臺中的一個模型(顯示為 95%的 Clopper-Pearson 置信區間)。閾值為 0.7 時,模型準確率比在原始測試集上低了 3%。在 MTurk 工作人員最常選擇圖像的 TopImages 上,模型的性能比在原始測試集上提高了 2%。兩個數據集的準確率都遵循線性函數規律,類似于圖 1 中的 MatchedFrequency。紅色陰影區域是 10 萬個 bootstrap 樣本線性擬合的 95%置信區域。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲视频香蕉人妖| 久久阴道视频| 亚洲激情偷拍| 欧美中文字幕久久| 午夜亚洲福利| 性欧美8khd高清极品| 亚洲一级黄色| 国产精品99久久久久久宅男| 亚洲精品少妇| 亚洲乱码国产乱码精品精| 亚洲黄网站在线观看| 永久555www成人免费| 国内久久视频| 今天的高清视频免费播放成人| 国内一区二区三区| 伊人久久大香线| 一区二区三区亚洲| 怡红院精品视频| 在线看片一区| 亚洲欧洲精品天堂一级| 亚洲精品美女| 9色国产精品| 亚洲视频在线视频| 亚洲一区二区在线视频| 亚洲你懂的在线视频| 亚洲欧美综合一区| 欧美呦呦网站| 亚洲激情视频在线| 一本大道久久a久久精品综合| 在线亚洲观看| 午夜精品久久久久久久久久久久久 | 亚洲精品视频啊美女在线直播| 亚洲美女在线看| 亚洲摸下面视频| 欧美在线一区二区| 亚洲区在线播放| 在线综合视频| 欧美一区二区精品久久911| 久久视频精品在线| 欧美另类在线播放| 国产精品专区h在线观看| 国产一区二区三区的电影 | 国产精品99久久不卡二区| 午夜精品久久久99热福利| 久久精品91| 欧美www视频在线观看| 欧美日韩小视频| 国产乱人伦精品一区二区| 好看的日韩视频| 亚洲精品免费网站| 亚洲影院色在线观看免费| 亚洲高清av| 亚洲私人影院| 六月丁香综合| 国产精品国产亚洲精品看不卡15 | 一区二区欧美精品| 欧美一区二区免费视频| 免费在线成人| 国产精品久久久久久久免费软件 | 国产精品久久久久久一区二区三区 | 日韩视频一区| 欧美一区午夜精品| 99精品欧美一区二区三区| 欧美亚洲一区二区在线观看| 欧美成人精品h版在线观看| 欧美深夜影院| 在线观看福利一区| 亚洲一区欧美激情| 亚洲精品国久久99热| 午夜国产精品视频免费体验区| 另类亚洲自拍| 国产女主播一区二区三区| 亚洲精品人人| 亚洲电影专区| 午夜激情综合网| 欧美精品在线网站| 一区二区三区在线免费视频| 亚洲无人区一区| 日韩网站在线看片你懂的| 久久精品中文| 国产精品家教| 亚洲精品小视频| 久久精品九九| 欧美呦呦网站| 欧美视频日韩视频在线观看| 尹人成人综合网| 香蕉国产精品偷在线观看不卡| 制服丝袜激情欧洲亚洲| 麻豆免费精品视频| 国产亚洲一区二区精品| 亚洲视频在线观看三级| 一个色综合av| 欧美激情视频网站| 黄色成人在线免费| 午夜精品久久久久久久99水蜜桃 | 欧美成人精品在线播放| 国产视频一区二区在线观看 | 国产日韩三区| 亚洲天堂成人在线视频| 一本大道av伊人久久综合| 欧美成人免费在线观看| 国产一区二区三区久久久久久久久| 亚洲午夜电影在线观看| 中日韩美女免费视频网站在线观看| 美乳少妇欧美精品| 国内精品伊人久久久久av影院 | 欧美日韩1234| 亚洲日产国产精品| 最近看过的日韩成人| 久久久女女女女999久久| 国产欧美一区二区三区在线看蜜臀 | 国产精品大片wwwwww| 日韩午夜电影av| av成人天堂| 欧美日韩国产一中文字不卡| 亚洲黄色精品| 日韩视频一区二区三区在线播放免费观看 | 亚洲人成毛片在线播放女女| 久久婷婷亚洲| 一区二区在线看| 亚洲日本aⅴ片在线观看香蕉| 鲁大师成人一区二区三区| 国内精品久久久久久久97牛牛| 欧美在线网站| 麻豆精品在线观看| 亚洲国产精品成人va在线观看| 亚洲日本激情| 欧美日本精品一区二区三区| 亚洲精品欧洲| 亚洲一区欧美二区| 国产精品久久久久婷婷| 亚洲在线成人精品| 久久精品国产一区二区电影 | 午夜在线观看免费一区| 国产午夜精品理论片a级大结局| 欧美在线观看一区二区| 麻豆精品网站| 亚洲人成免费| 亚洲欧美精品一区| 国产日韩亚洲欧美精品| 久久精品视频va| 欧美国产第二页| 99国产精品久久久| 欧美亚洲综合网| 黄色免费成人| 99re6这里只有精品| 国产精品久久久久av免费| 欧美一区2区三区4区公司二百| 久久综合色88| 亚洲精品色婷婷福利天堂| 亚洲永久视频| 国产主播喷水一区二区| 亚洲美女免费精品视频在线观看| 欧美日本在线看| 亚洲欧美自拍偷拍| 欧美成人首页| 亚洲一级一区| 噜噜噜在线观看免费视频日韩| 91久久精品www人人做人人爽 | 亚洲欧美在线网| 激情综合色综合久久| 99视频精品全部免费在线| 国产精品亚洲视频| 亚洲高清毛片| 欧美日韩在线免费观看| 欧美亚洲专区| 欧美激情视频一区二区三区免费 | 午夜影院日韩| 欧美极品欧美精品欧美视频| 亚洲一区二区三区四区五区午夜 | 亚洲视频1区2区| 久久综合五月| 日韩一区二区久久| 久久久欧美精品| 99国内精品久久久久久久软件| 久久精品免费看| 亚洲美洲欧洲综合国产一区| 久久精品免费观看| 一区二区不卡在线视频 午夜欧美不卡在 | 国产欧美精品在线播放| 亚洲精品五月天| 国产一区91| 亚洲视频免费看| 亚洲成人在线免费| 亚洲欧美在线播放| 亚洲人成网站精品片在线观看| 久久国产精品久久国产精品| 亚洲精品久久嫩草网站秘色| 久久gogo国模啪啪人体图| 亚洲品质自拍| 久久综合国产精品| 亚洲与欧洲av电影| 欧美日韩成人| 久久黄色网页| 国产精品系列在线| 中文亚洲欧美| 91久久久久久| 老司机亚洲精品| 欧美影院精品一区| 国产精品亚洲综合|