《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 學界 | Hinton提出的經典防過擬合方法Dropout,只是SDR的特例

學界 | Hinton提出的經典防過擬合方法Dropout,只是SDR的特例

2018-08-27

Hinton 等人提出的 Dropout 方案在避免神經網絡過擬合上非常有效,而本文則提出,Dropout 中的按概率刪除神經元的原則只是二項隨機變量的特例。也就是說,研究者用神經元權重的連續分布替換了原先的二值(零/非零)分布,實現了廣義的 Dropout——隨機 delta 規則(SDR)。基準實驗表明,SDR 能顯著降低分類誤差和損失值,并且收斂得更快。


1 引言


多層神經網絡在文本、語音和圖像處理的多種基準任務上都取得了令人矚目的效果。盡管如此,這些深層神經網絡也會產生難以搜索的高維、非線性超參數空間,進而導致過擬合以及泛化能力差。早期的神經網絡使用反向傳播算法,它們會由于缺乏足夠的數據、梯度損失恢復以及很可能陷入性能較差的局部最小值而失效。深度學習(Hinton et al,2006)引入了一些創新技術來減少、控制這些過擬合和過度參數化問題,包括用線性整流單元(ReLU)來減少連續梯度損失,用 Dropout 技術避免陷入局部最小值,以及通過有效的模型平均技術來增強泛化能力。盡管數據海嘯可以為各種各樣的分類和回歸任務提供大量的數據,在本文中,作者仍將重點討論深層神經網絡的過度參數化問題。Dropout 可以用來緩解過度參數化以及過度參數化引起的深度學習應用過擬合問題,還能夠避免陷入性能較差的局部最小值。具體而言,Dropout 實現了一個概率為 p(有偏的 0-1 抽簽法)的伯努利隨機變量,在每一輪更新時從網絡架構中隨機刪除隱藏單元及其連接,從而產生一個稀疏的網絡架構——其中剩余權重被更新并保留到下一個 dropout 步驟中。在學習結束時,通過計算每個權重 p_w_ij 的期望值,重構了深度學習網絡,這樣的做法近似于對指數級數量的一組神經網絡進行模型平均。在大多數情況下,帶 Dropout 機制的深度學習能夠在常見的基準測試中降低 50% 以上的誤差率。


在本文余下的部分中,作者將介紹一種通用類型的 Dropout 技術,它能夠在權值級別上進行操作并在每輪更新中注入依賴于梯度的噪聲,這種技術被稱為隨機 delta 規則(SDR,參見 Murray & Andrews, 1991)。SDR 為每個權重實現了一個隨機變量,并且為隨機變量中的每個參數提供了更新規則,本文使用了帶自適應參數的高斯分布(均值為μ_w_ij,標準差為 σ_w_ij)。盡管所有的 SDR 可以作用于任意的隨機變量(gamma 分布、beta 分布、二項分布等)。本文將說明,Dropout 是一個帶有固定參數 (np, np(1 ? p)) 的二項隨機變量的特例。最后,作者將用高斯 SDR 在標準基準(例如,CIFAR-10 和 CIFAR-100)中測試 DenseNet 框架,并且說明其相對于二項分布的 Dropout 具有很大的優勢。


論文:Dropout is a special case of the stochastic delta rule: faster and more accurate deep learning 

微信圖片_20180827220805.jpg

論文地址:https://arxiv.org/pdf/1808.03578v1.pdf


摘要:多層神經網絡在文本、語音和圖像處理的各種基準任務中都取得了令人矚目的效果。然眾所周知,層次模型中的非線性參數估計存在過擬合問題。Dropout(Srivastava, et al 2014, Baldi et al 2016)是一種用來解決這種過擬合以及相關問題(局部最小值、共線性、特征發現等)的方法。這種方法在每輪更新中通過帶有概率 p 的伯努利隨機變量刪除隱藏單元。在本文中,我們說明了 Dropout 是一種更加通用的模型特例,這種被稱為隨機 delta 規則(「SDR」, Hanson, 1990)的模型于 1990 年被首次發表。SDR 用一個均值為μ_w_ij、標準差為 σ_w_ij 的隨機變量將網絡中的權值參數化。這些隨機變量在每一次前饋激活中通過采樣得到,從而建立指數級數量的共享權值的潛在網絡。這兩個參數都會根據預測誤差而更新,從而實現了反映預測誤差局部歷史的權值噪聲注入和高效的模型平均。因此,SDR 對每個權值實現了一個局部梯度依賴的模擬退火,從而收斂為一個貝葉斯最優網絡。使用改進版的 DenseNet 在標準基準(CIFAR)上進行測試的結果顯示,SDR 相較于標準 dropout 誤差率降低了 50% 以上,損失也減少了 50% 以上。此外,SDR 的實現在指定的解決方案上收斂得更快,而且,采用 SDR 的 DenseNet-40 只需要訓練 15 個 epoch 就實現誤差率為 5% 的目標,而標準 DenseNet-40 實現這一目標需要訓練 94 個 epoch。

微信圖片_20180827220829.jpg

5 實驗結果


表 1:采用 SDR 的 DenseNet 與采用 dropout 的 DenseNet 誤差率對比


上述結果表明,在 DenseNet 測試中,用 SDR 替換 dropout 技術會使所有 CIFAR 基準測試的誤差減少 50 % 以上,降幅高達 64%。原始 DenseNet 實現的誤差結果低于原始 DenseNet 論文中的誤差結果,因為我們發現使用更大的批處理會帶來更高的總體準確率。

微信圖片_20180827220850.jpg

表 2:達到訓練誤差率為 15%,10%,5% 分別所需的 epoch 數量。


如表 2 所示,使用 SDR 后,在訓練中將誤差率降到 15%,10%,5% 所需的時間明顯縮短。使用了 SDR 的 DenseNet-40 只需要原本 1/6 的 epoch 就能夠取得 5% 的誤差率,而使用了 SDR 的 DenseNet-100 則只需原來 60% 的 epoch 就能實現 5% 的誤差率。

微信圖片_20180827220913.jpg

圖 3:采用 dropout 的 DenseNet-100 訓練 100 個 epoch 之后的準確率(橙色曲線)和采用 SDR 的 DenseNet-100 訓練 100 個 epoch 的準確率(藍色曲線)。比起 dropout,SDR 不僅能夠更快地提高訓練準確率(訓練 17 個 epoch 達到了 96% 的準確率,drouout 達到相同的準確率需要 33 個 epoch),而且還能夠在訓練 40 個 epoch 后達到 98% 的準確率。

微信圖片_20180827220943.jpg

圖 4:表示采用 SDR 的 DenseNet-100 的第 21 層第 1 塊的權重值頻率的直方圖,其中每個切片都是來自訓練一個 epoch 的 snapshot,而最上面的切片是來自第一個 epoch 的 snapshot。在訓練 100 個 epoch 的過程中,隨著權值的標準差趨近于零,曲線變窄。


2 隨機 delta 規則


眾所周知,實際的神經傳播包含噪聲。如果一個皮質分離的神經元周期性地受到完全相同的刺激,它永遠不會產生相同的反應(如燒傷等刺激)。設計 SDR 的部分原因是生物系統中通過神經元傳遞信號的隨機性。顯然,平滑的神經速率函數是建立在大量的刺激試驗基礎上的。這讓我們想到了一種實現方法,即兩個神經元之間的突觸可以用一個具有固定參數的分布來建模。與這種分布相關的隨機變量在時域內可能是一個 Gamma 分布(或在分級響應中,參見泊松分布)。在這里,我們假設有一個符合中心極限定理的獨立同分布集合,并且采用高斯分布作為一般形式。盡管如此,對于獨立成分分析(ICA)來說,同等情況下,長尾分布可能更具優勢。

微信圖片_20180827221005.jpg

圖 1:SDR 采樣


如圖 1 所示,我們按照圖中的方法實現采用均值為 μwij、標準差為 σwij 的高斯隨機變量的 SDR 算法。因此,將從高斯隨機變量中采樣得到每個權值,作為一種前饋運算。實際上,與 Dropout 類似,指數級別的網絡集合通過訓練期間的更新采樣獲取。與 Dropout 在這一點上的區別是,SDR 會調整每個權重上附加的隱藏單元的權重和影響,以便在更新時隨誤差梯度自適應地變化。這里的效果也與 Dropout 相類似,除了每個隱藏單元的響應會分解到權重上(與分類誤差對信用分配的影響成比例)。因此,每個權重梯度本身也是基于隱藏單元預測性能的隨機變量,它讓系統能夠:(1)在相同的例程/刺激下接受多值響應假設,(2)保留一個預測歷史,與 Dropout 不同,Dropout 是局部的隱藏單元權重,在某個集合上是有條件的,甚至是一個特定的例程(3)可能返回由于貪婪搜索得到的性能較差的局部最小值,但是同時也遠離了更好的局部最小值。局部噪聲注入的結果對網絡的收斂具有全局影響,并且為深度學習提供了更高的搜索效率。最后一個優點是,如 G. Hinton 所說,局部噪聲注入可能通過模型平均平滑誤差表面的溝壑,使模型能夠更快更穩定地收斂到更好的局部最小值。

微信圖片_20180827221029.jpg

圖 2:Dropout 采樣


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产亚洲免费的视频看| 亚洲人成在线观看| 欧美成人黑人xx视频免费观看| 亚洲国产一区二区a毛片| 欧美一区亚洲| 午夜一区二区三视频在线观看| 亚洲天堂av图片| 亚洲丝袜av一区| 一本色道久久综合狠狠躁的推荐| 亚洲精品裸体| 日韩天堂在线视频| 亚洲免费高清视频| 亚洲精品一区在线| 99视频一区二区三区| 一区二区精品| 亚洲午夜一级| 午夜精品一区二区三区在线| 午夜精品一区二区三区在线视| 亚洲欧美电影在线观看| 性欧美在线看片a免费观看| 久久av免费一区| 久久精品欧美日韩| 亚洲欧洲免费视频| 亚洲国产成人高清精品| 亚洲第一精品影视| 91久久精品www人人做人人爽 | 一本久道久久综合婷婷鲸鱼| 一区二区三欧美| 午夜视频在线观看一区二区三区| 欧美影院成年免费版| 久久免费观看视频| 欧美粗暴jizz性欧美20| 欧美日韩一区二区高清| 国产精品三级视频| 黑丝一区二区三区| 亚洲乱码国产乱码精品精天堂| 一区二区欧美日韩| 午夜精品福利一区二区三区av| 久久精品亚洲国产奇米99| 亚洲日本电影| 亚洲影视综合| 久久午夜精品一区二区| 欧美精品99| 国产日韩在线看片| 亚洲国产精品小视频| 亚洲视频香蕉人妖| 亚洲大片av| 国产精品99久久久久久久女警 | 久久精品一本久久99精品| 牛牛影视久久网| 欧美偷拍一区二区| 国精产品99永久一区一区| 91久久久精品| 亚洲欧美在线磁力| 亚洲人成网站精品片在线观看| 亚洲一区二区在线免费观看视频| 久久久激情视频| 欧美揉bbbbb揉bbbbb| 国外成人在线视频网站| 亚洲毛片在线看| 久久福利毛片| 亚洲一区www| 欧美aa国产视频| 国产精品一区一区三区| 亚洲日本va在线观看| 欧美一级在线视频| 亚洲午夜精品福利| 欧美成人精品在线观看| 国产伦精品一区二区三区免费迷| 亚洲国产精品一区二区三区| 小辣椒精品导航| 亚洲小视频在线观看| 麻豆成人小视频| 国产精品日本精品| 日韩视频免费观看高清完整版| 久久国产精品99精品国产| 亚洲一区亚洲二区| 欧美精品激情在线| 激情欧美丁香| 欧美一区二区免费视频| 亚洲小说区图片区| 欧美精品日韩综合在线| 国内偷自视频区视频综合| 亚洲一区在线观看免费观看电影高清| 91久久极品少妇xxxxⅹ软件| 久久精品成人一区二区三区| 国产精品久久久久久久7电影| 亚洲欧洲精品一区二区精品久久久| 国产一区亚洲一区| 亚洲精品一区在线观看香蕉| 久久久精品一区| 欧美激情精品久久久六区热门| 国产精品一区久久| 99国产精品私拍| 亚洲人成欧美中文字幕| 久久精品一本| 国产美女诱惑一区二区| 一区二区三区国产在线| 99在线视频精品| 欧美3dxxxxhd| 狠狠色丁香婷综合久久| 欧美一级网站| 欧美一二三区精品| 国产精品久久久久av免费| 亚洲免费电影在线| 日韩一区二区福利| 欧美风情在线观看| 亚洲高清不卡| 亚洲人成在线观看| 麻豆精品在线视频| 精品51国产黑色丝袜高跟鞋| 欧美一区二区三区免费视| 欧美中文在线观看| 国产精品视频最多的网站| 一区二区三区久久| 一区二区电影免费在线观看| 欧美激情91| 亚洲区在线播放| 日韩午夜电影av| 欧美极品aⅴ影院| 亚洲激情视频网站| 99成人在线| 欧美日韩色一区| 一本一本久久a久久精品综合麻豆 一本一本久久a久久精品牛牛影视 | 久久精品国产免费观看| 欧美中文在线免费| 国产在线观看一区| 久久aⅴ国产紧身牛仔裤| 久久久人人人| 在线观看欧美亚洲| 日韩视频一区二区三区在线播放免费观看| 牛人盗摄一区二区三区视频| 亚洲国内自拍| 一区二区三区不卡视频在线观看| 欧美日韩在线三区| 亚洲网友自拍| 久久精品国内一区二区三区| 国模精品一区二区三区色天香| 欧美在线免费一级片| 免费永久网站黄欧美| 91久久精品久久国产性色也91| 夜夜狂射影院欧美极品| 国产精品高潮在线| 午夜视频精品| 免费观看30秒视频久久| 亚洲国产精品久久久久婷婷老年| 亚洲一区二区精品在线| 国产欧美日韩在线视频| 亚洲国产成人精品久久久国产成人一区| 欧美~级网站不卡| 日韩亚洲欧美一区二区三区| 亚洲欧美日韩中文播放| 国产一区二区三区在线观看精品| 亚洲二区三区四区| 欧美日韩国产黄| 亚洲欧美电影在线观看| 麻豆精品国产91久久久久久| 亚洲理伦电影| 欧美专区在线| 亚洲国产专区| 午夜免费电影一区在线观看| 黑人一区二区| 亚洲视频在线观看视频| 国产亚洲精品一区二555| 亚洲精品久久久久久久久| 国产精品久久久99| 亚洲国产精品成人精品| 欧美亚州一区二区三区| 久久av老司机精品网站导航| 欧美精品在线观看| 亚洲欧美在线高清| 欧美美女福利视频| 午夜日韩av| 欧美日韩国产系列| 欧美一区二区黄色| 欧美天堂在线观看| 久久精品一本| 国产精品卡一卡二卡三| 亚洲高清激情| 国产精品久久久久久久久久尿| 亚洲激情av| 国产欧美日韩亚洲| 中文av一区特黄| 狠狠色伊人亚洲综合成人| 亚洲性线免费观看视频成熟| 一区在线免费| 性欧美xxxx大乳国产app| 亚洲激情小视频| 久久久久国产精品一区二区| 9国产精品视频| 蜜月aⅴ免费一区二区三区| 亚洲欧美激情一区| 欧美日韩一区二区三区在线观看免 | 榴莲视频成人在线观看| 亚洲尤物精选| 欧美日韩一区在线观看| 亚洲国产一区二区精品专区| 国产乱子伦一区二区三区国色天香| 一区二区av在线| 亚洲国产精品一区在线观看不卡 |