《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 學界 | 小改進,大飛躍:深度學習中的最小牛頓求解器

學界 | 小改進,大飛躍:深度學習中的最小牛頓求解器

2018-06-05

牛頓法等利用二階梯度信息的方法在深度學習中很少有應用,我們更喜歡直接使用一階梯度信息求解最優參數。本論文提出了一種新型基于二階信息的最優化方法,它的內存占用與帶動量的 SGD 一樣小,但當收斂速度卻比只使用一階信息的最優化方法快。


1 引言


隨機梯度下降(SGD)和反向傳播 [9] 是現今深度網絡訓練的算法核心。深度學習的成功證明了這種組合的有效性,它已經成功地運用在各種具有大型數據集和極深網絡的不同任務中。


然而,盡管 SGD 有很多優點,但這種一階方法的收斂速度(就迭代次數而言)還有很大的改進區間。盡管單次 SGD 迭代的計算速度非常快并且在優化開始時有迅速的進展,但很快,優化就會進入一個緩慢提升的階段。這可以歸因于迭代進入了目標函數錯誤縮放的參數空間中。在這種情況下,快速的進展需要在參數空間內不同的方向上采用不同的步長,而 SGD 無法實現這種迭代。


諸如牛頓法及其變體的二階方法根據目標函數的局部曲率重新調整梯度,從而消除了這個問題。對于 R 中的標量損失,這種調整采用 H?1J 的形式,其中 H 是黑塞矩陣(Hessian matrix;二階導數)或者是目標空間中局部曲率的一個近似,J 是目標函數的梯度。事實上,它們可以實現局部尺度不變性,并在梯度下降停滯 [24] 的地方取得顯著進展。盡管在其它領域它們是無可比擬的,但一些問題阻礙了它們在深度模型中的應用。首先,因為黑塞矩陣的參數數量以二次形式增長,且通常有著數百萬的參數,故而對它求逆或存儲它是不現實的。其次,由于隨機抽樣,任何黑塞矩陣的估計都必然產生噪聲和病態的條件數,因而經典的求逆方法如共軛梯度對于黑塞矩陣是不穩健的。


在本文中,我們提出了一種新的算法,它可以克服這些困難并使得二階優化適用于深度學習。我們特別展示了如何去避免存儲黑塞矩陣或其逆矩陣的任何估計值。反之,我們將牛頓更新,即 H?1J 的計算看成是求解一個能通過梯度下降法求解的線性系統。通過交叉求解步驟和參數更新步驟,求解這個線性系統的成本會隨著時間推移被攤銷。此外,與共軛梯度法不同,梯度下降的選擇使其對噪聲穩健。我們提出的方法增加了很小的開銷,因為一個黑塞矩陣向量積可通過兩步自動微分的現代網絡實現。有趣的是,我們證明了我們的方法等價于帶有一個額外項的動量 SGD(也稱為重球法),這個額外項能計算曲率。因此,我們將該方法命名為 CURVEBALL。與其他方法不同,我們方法的總內存占用與動量 SGD 一樣小。

微信圖片_20180605172409.jpg


圖 1:已知解決方案的問題。左:不同求解器的 Stochastic Rosenbrock 函數軌跡(較深的陰影區域表示較高的函數值)。右:針對軌跡圖繪制的損失函數與迭代數之間的關系。

微信圖片_20180605172438.jpg

表 1:在小數據集上優化器的比較。對于每一個優化器,我們展示了解決問題所需迭代數的平均值 ± 標準差。對于隨機 Rosenbrock 函數,U[λ1, λ2] 表示來自 U[λ1, λ2] 的噪聲(詳見 4.1)。

微信圖片_20180605172525.jpg

圖 2:不同優化器在不同數據集和網絡上的性能對比。在一系列實際設置下,包括大型數據集(ImageNet)、是否使用批量歸一化和過度參數化的模型(ResNet),我們的方法似乎表現十分良好。

微信圖片_20180605172546.jpg

表 2:不同模型和優化方法的最佳百分比誤差(訓練/驗證誤差)。CURVEBALL λ 表示使用了重新調整的參數 λ(第 3 節)。括號內的數字表示帶有額外 Dropout 正則化(比例 0.3)的驗證誤差。前 3 列在是在 CIFAR - 10 上訓練的,第 4 列是在 ImageNet - 100 上訓練的。

微信圖片_20180605172608.jpg

圖 3:訓練誤差 vs. 訓練時間(基于 CIFAR - 10 模型)。


論文:Small steps and giant leaps: Minimal Newton solvers for Deep Learning(小改進,大飛躍:深度學習中的最小牛頓求解器)


微信圖片_20180605172634.jpg

論文地址:https://arxiv.org/abs/1805.08095


我們提出了一種能直接替換現今深度學習求解器的快速二階方法。與隨機梯度下降法(SGD)比,它只需要在每次迭代時進行 2 次額外的前向自動微分操作,同時它的運算成本與 2 次標準前向傳播相當且易于實現。我們的方法解決了現有二階求解器長期存在的問題,即在每次迭代時需要對黑塞矩陣的近似精確求逆或使用共軛梯度法,而這個過程既昂貴又對噪聲敏感。相反,我們提出保留逆黑塞矩陣投影梯度的單個估計,并在每次迭代時更新一次。這個估計值有著相同的維度,并與 SGD 中常用的動量變量相似。黑塞矩陣的估計是變動的。我們首先驗證我們的方法—CurveBall 在一些已知閉式解的小問題(帶噪聲的 Rosenbrock 函數和退化的 2 層線性網絡)上的有效性,而這是現今深度學習解釋器仍在努力的地方。我們接著在 CIFAR、ImageNet 上訓練一些大型模型,包括 ResNet,VGG-f 網絡,我們的方法在沒有調整超參數的情況下,表現出更快的收斂性。最后,所有的代碼已經開源。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲综合激情| 日韩亚洲欧美精品| 亚洲精品一二三| 亚洲高清一二三区| 国产真实乱子伦精品视频| 国产精品一区二区在线观看不卡| 欧美日韩亚洲三区| 欧美另类在线播放| 欧美精品一区二区三区高清aⅴ| 欧美成人免费在线观看| 免费在线成人av| 欧美不卡高清| 欧美国产日本高清在线| 欧美精品一卡二卡| 欧美日韩一区二区视频在线观看 | 一本色道久久综合亚洲精品高清| 日韩视频在线观看| 中文av字幕一区| 亚洲伊人久久综合| 欧美亚洲综合网| 久久久www成人免费毛片麻豆| 久久久久久亚洲精品不卡4k岛国| 久久婷婷国产综合尤物精品 | 欧美理论电影在线观看| 欧美日韩二区三区| 国产精品扒开腿爽爽爽视频| 国产精品毛片高清在线完整版| 国产欧美精品日韩| 国语自产在线不卡| 最新国产精品拍自在线播放| 99人久久精品视频最新地址| 亚洲一区一卡| 亚洲高清视频一区二区| 日韩午夜av| 亚洲综合精品| 久久久久久久一区二区| 免费看亚洲片| 欧美视频在线观看一区| 国产精品私房写真福利视频| 国产一区二区日韩精品欧美精品| 亚洲第一主播视频| 在线视频欧美日韩| 欧美中文在线观看| 9国产精品视频| 午夜精品福利在线| 久久手机精品视频| 欧美日韩一区二区免费在线观看| 国产精品热久久久久夜色精品三区| 国产自产在线视频一区| 亚洲日本中文字幕区| 亚洲欧美激情一区二区| 亚洲欧洲一区二区三区久久| 亚洲一区二区高清| 久久资源av| 欧美视频福利| 狠狠综合久久av一区二区小说 | 欧美伦理91i| 国产日韩欧美高清免费| 91久久精品日日躁夜夜躁国产| 亚洲天天影视| 91久久夜色精品国产九色| 亚洲在线黄色| 你懂的一区二区| 国产精品一区在线观看| 最新中文字幕亚洲| 香蕉久久a毛片| 亚洲手机在线| 久久久欧美精品| 欧美日韩在线大尺度| 一色屋精品视频在线看| 亚洲视频福利| 亚洲精品欧洲| 欧美中文在线免费| 欧美三级电影网| 永久久久久久| 午夜亚洲性色视频| 亚洲图片你懂的| 欧美国产先锋| 国产一区二区三区av电影 | 亚洲精品久久嫩草网站秘色 | 日韩亚洲欧美精品| 亚洲黄色片网站| 久久国产精品一区二区| 欧美日韩一区二区三区| 在线日本成人| 欧美一级久久| 欧美亚洲免费电影| 欧美日韩在线免费观看| 亚洲高清视频在线| 久久精品国产久精国产爱| 性做久久久久久久久| 欧美日韩另类视频| 亚洲国产精品一区二区www| 久久成人18免费网站| 午夜精品在线看| 欧美日韩亚洲免费| 亚洲片区在线| 亚洲精品乱码久久久久| 久久全球大尺度高清视频| 国产日韩欧美| 亚洲综合导航| 亚洲欧美不卡| 国产精品v片在线观看不卡| 亚洲精品欧美日韩专区| 亚洲美女精品成人在线视频| 免费国产一区二区| 狠狠色狠狠色综合系列| 久久岛国电影| 久久青草福利网站| 国产一区二区三区高清在线观看| 亚洲欧美国产精品桃花| 午夜精品久久久久久久白皮肤| 国产精品v亚洲精品v日韩精品 | 亚洲欧美激情四射在线日| 亚洲欧美日韩在线高清直播| 欧美先锋影音| 中国成人在线视频| 亚洲欧美日韩成人高清在线一区| 欧美午夜精品久久久久久孕妇 | 亚洲欧美一区二区三区在线| 亚洲免费一在线| 国产精品久久福利| 亚洲视频第一页| 午夜精品久久久久影视| 国产精品私拍pans大尺度在线| 亚洲性夜色噜噜噜7777| 午夜性色一区二区三区免费视频| 国产精品日韩欧美大师| 亚洲欧美韩国| 久久精选视频| 亚洲电影网站| 日韩一区二区精品视频| 欧美日韩国产一区二区| av不卡在线| 午夜精品久久久久久久99樱桃| 国产精品一二三| 久久www免费人成看片高清| 巨胸喷奶水www久久久免费动漫| 亚洲成人资源| 亚洲深夜av| 国产精品久久久久一区| 西瓜成人精品人成网站| 久久久最新网址| 亚洲国内自拍| 国产精品99久久久久久久vr | 欧美一区精品| 欧美a级一区| 99在线精品免费视频九九视| 亚洲欧美综合一区| 国产综合欧美| 一区二区三区精品视频在线观看| 国产精品久久国产愉拍 | 欧美一激情一区二区三区| 国内精品视频666| 亚洲精品网站在线播放gif| 欧美日韩在线不卡| 性欧美xxxx视频在线观看| 久热精品在线| 99精品国产一区二区青青牛奶| 欧美一区二区三区的| 伊人成人开心激情综合网| 亚洲图色在线| 黄色欧美日韩| 中文av一区二区| 国产一区二区三区久久久久久久久| 亚洲人成在线影院| 国产精品久久久亚洲一区 | 国产日本亚洲高清| 亚洲精品日韩激情在线电影| 国产精品国产三级国产aⅴ9色| 欧美在线视频日韩| 欧美日产国产成人免费图片| 亚洲欧美成人一区二区在线电影 | 久久久久看片| 99视频精品全国免费| 久久久亚洲精品一区二区三区| 日韩视频三区| 久久女同精品一区二区| 夜夜爽av福利精品导航| 久久综合亚洲社区| 国产精品99久久久久久久久| 久久综合网hezyo| 亚洲一区二区三区色| 男女精品视频| 午夜精品久久久久久久蜜桃app| 欧美激情视频网站| 销魂美女一区二区三区视频在线| 欧美区日韩区| 久久精品麻豆| 国产女同一区二区| a91a精品视频在线观看| 狠狠色狠色综合曰曰| 亚洲欧美激情精品一区二区| 亚洲国产一区二区三区在线播 | 亚洲一区二区成人| 欧美人与禽性xxxxx杂性| 亚洲福利视频网| 国产区精品在线观看| 亚洲一区二区少妇| 91久久中文字幕|