《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 學界 | 新型循環神經網絡IndRNN:可構建更長更深的RNN(附GitHub實現)

學界 | 新型循環神經網絡IndRNN:可構建更長更深的RNN(附GitHub實現)

2018-03-20

選自arXiv

作者:Shuai Li等

機器之心編譯

參與:張倩、黃小天


近日,澳大利亞伍倫貢大學聯合電子科技大學提出一種新型的循環神經網絡 IndRNN,不僅可以解決傳統 RNN 所存在的梯度消失和梯度爆炸問題,還學習長期依賴關系;此外,借助 relu 等非飽和激活函數,訓練之后 IndRNN 會變得非常魯棒,并且通過堆疊多層 IndRNN 還可以構建比現有 RNN 更深的網絡。實驗結果表明,與傳統的 RNN 和 LSTM 相比,使用 IndRNN 可以在各種任務中取得更好的結果。同時本文還給出了 IndRNN 的 TensorFlow 實現,詳見文中 GitHub 鏈接。


循環神經網絡 (RNN) [16] 已在動作識別 [8]、場景標注 [4] 、語言處理 [5] 等序列學習問題中獲得廣泛應用,并且成果顯著。與卷積神經網絡 ( CNN ) 等前饋網絡相比,RNN 具有循環連接,其中最后的隱藏狀態是到下一狀態的輸入。狀態更新可描述如下:

微信圖片_20180320102548.jpg


其中微信圖片_20180320102625.jpg  和微信圖片_20180320102629.jpg分別為時間步 t 的輸入和隱藏狀態。微信圖片_20180320102732.jpg、微信圖片_20180320102736.jpg 和微信圖片_20180320102739.jpg 分別為當前輸入的權重、循環輸入以及神經元偏差,σ 是神經元的逐元素激活函數,N 是該 RNN 層中神經元的數目。

由于循環權重矩陣不斷相乘,RNN 的訓練面臨著梯度消失和梯度爆炸的問題。長短期記憶 ( LSTM ) [ 10,17 ] 和門控循環單元 ( GRU ) [5] 等若干 RNN 模型可用來解決這些梯度問題。然而,在這些變體中使用雙曲正切和 Sigmoid 函數作為激活函數會導致網絡層的梯度衰減。因此,構建和訓練基于 RNN 的深度 LSTM 或 GRU 其實存在困難。

相比之下,使用 relu 等非飽和激活函數的現有 CNN 可以堆棧到非常深的網絡中 (例如,使用基本卷積層可以堆疊到 20 層以上;使用殘差連接可以到 100 層以上 [12]),并且仍然在接受高效的訓練。雖然在若干研究 [44, 36] 中已經嘗試把殘差連接用于 LSTM 模型,但情況并沒有明顯改善 (上述使用雙曲正切和 sigmoid 函數的 LSTM 的梯度衰減是主要原因)。

此外,現有的 RNN 模型在 ( 1 ) 中使用相同的微信圖片_20180320102826.jpg ,其中的循環連接連通所有神經元。這使得解釋和理解已訓練的神經元 (如每個神經元響應哪種模式) 的作用變得困難,因為單個神經元 [18] 的輸出的簡單可視化很難在不考慮其它神經元的情況下確定一個神經元的功能。


本文提出了一種新型循環神經網絡——獨立循環神經網絡(IndRNN)。在 IndRNN 中,循環輸入用 Hadamard 乘積處理為

微信圖片_20180320102833.jpg

。與傳統 RNN 相比,它有許多優點,其中包括:


通過調節基于時間的梯度反向傳播,可以有效地解決梯度消失和爆炸問題。

利用 IndRNN 可以保留長期記憶,處理長序列。實驗表明,IndRNN 可以很好地處理 5000 步以上的序列,而 LSTM 能夠處理的序列還不到 1000 步。

IndRNN 可以很好地利用 relu 等非飽和函數作為激活函數,并且訓練之后非常魯棒。

IndRNN 可以實現高效的多層堆疊以增加網絡的深度,尤其是在層上具有殘差連接的情況下。語言建模實驗給出了一個 21 層 IndRNN 的實例。

由于各層神經元相互獨立,就很容易解釋每層 IndRNN 神經元的行為。


實驗表明,IndRNN 在加法問題、序貫 MNIST 分類、語言建模和動作識別等方面的性能明顯優于傳統的 RNN 和 LSTM 模型。


3. 獨立循環神經網絡(IndRNN)

本文提出了一種獨立循環神經網絡 ( IndRNN ),具體描述如下:

微信圖片_20180320103110.jpg


其中循環權重 u 是向量,表示 Hadamard 乘積。每一層的每個神經元各自獨立,神經元之間的連接可以通過堆疊兩層或更多層的 IndRNNs 來實現(見下文)。對于第 n 個神經元,隱藏狀態 h_n,t 可以通過下式得出:

微信圖片_20180320103114.jpg


其中 w_n 和 u_n 分別是輸入權重和循環權重的第 n 行。每個神經元僅在前一時間步從輸入和它自己的隱藏狀態中接收信息。也就是說,IndRNN 中的每個神經元獨立地處理一種類型的時空模型。傳統上,RNN 被視為時間上的、共享參數的多層感知器。與傳統的 RNN 不同的是,本文提出的 IndRNN 神經網絡為循環神經網絡提供了一個新視角,即隨著時間的推移 (即通過 u ) 獨立地聚集空間模式 (即通過 w )。不同神經元之間的相關性可以通過兩層或多層的堆疊來加以利用。在這種情況下,下一層的每個神經元處理上一層所有神經元的輸出。

4. 多層 IndRNN

如上所述,同一 IndRNN 層中的神經元彼此獨立,時間上的跨通道信息通過多層 IndRNN 進行探索。

IndRNN 基本架構如圖 1(a) 所示,其中「weight」和「Recurrent+ ReLU」表示以 relu 作為激活函數的每個步驟的輸入處理和循環處理。通過堆疊此基本架構,可以構建深度 IndRNN 網絡。

基于 [13] 中殘差層的「預激活」類型的殘差 IndRNN 實例見圖 1(b)。在每個時間步,梯度都可以從恒等映射直接傳播到其他層。由于 IndRNN 解決了隨時間累積的梯度爆炸和消失的問題,所以梯度可以在不同的時間步上有效地傳播。因此,網絡可以更深更長。

微信圖片_20180320103203.jpg


圖 1:( a ) 為 IndRNN 基本架構圖解;( b ) 為殘差 IndRNN 架構圖解。

5. 實驗

微信圖片_20180320103212.jpg


圖 2:不同序列長度情況下解決相加問題的結果。所有圖的圖例相同,因此僅在 ( a ) 中示出。

微信圖片_20180320103218.jpg


表 1:序貫 MNIST 和置換 MNIST(誤差率 ( % ) ) 結果。

微信圖片_20180320103222.jpg


表 2:IndRNN 模型的 PTB-c 結果與文獻記錄結果的對比(基于 BPC)。

微信圖片_20180320103226.jpg


表 3:所有基于骨架的方法在 NTU RGB+D 數據集上的結果。

論文:Independently Recurrent Neural Network (IndRNN): Building A Longer and Deeper RNN



論文鏈接:https://arxiv.org/abs/1803.04831


摘要:循環神經網絡 ( RNN ) 已廣泛應用于序列數據的處理。然而,由于眾所周知的梯度消失和爆炸問題以及難以保持長期學習的模式,RNN 通常難以訓練。長短期記憶 ( LSTM ) 和門控循環單元 ( GRU ) 被用來解決這些問題,但是雙曲正切函數和 sigmoid 函數的使用會導致層上梯度衰減。因此,構建可有效訓練的深度網絡頗具挑戰性。此外,每層 RNN 中的所有神經元都連接在一起,它們的運行狀況很難解釋。針對這些問題,本文提出了一種新的循環神經網絡——獨立循環神經網絡 ( IndRNN ),即同一層的神經元相互獨立,跨層連接。我們指出,IndRNN 可以通過簡單的調節避免梯度爆炸和消失問題,同時允許網絡學習長期依賴關系。此外,IndRNN 可以使用 relu 等非飽和激活函數,訓練之后可變得非常魯棒。通過堆疊多層 IndRNN 可以構建比現有 RNN 更深的網絡。實驗結果表明,本文中的 IndRNN 能夠處理很長的序列 (超過 5000 個時間步),可以用來構建很深的網絡 (實驗中使用了 21 層),并且經過訓練還可以更加魯棒。與傳統的 RNN 和 LSTM 相比,使用 IndRNN 可以在各種任務中取得更好的結果。

GitHub實現

上文是 IndRNN 具體的論文簡介,論文作者其實還提供了該循環架構的 TensorFlow 實現代碼和試驗結果。我們發現架構代碼中有非常詳盡的參數解釋,因此各位讀者可參考 ind_rnn_cell.py 文件詳細了解 IndRNN 的基本架構。此外,作者表示該實現使用 Python 3.4 和 TensorFlow 1.5 完成,所以我們可以在該環境或更新的版本測試。

項目地址:https://github.com/batzner/indrnn

1. 用法

將 ind_rnn_cell.py 文件復制到你的項目目錄中,如下展示了 IndRNN 單元的簡單調用過程:

from ind_rnn_cell import IndRNNCell

# Regulate each neuron's recurrent weight as recommended in the paper
recurrent_max = pow(2, 1 / TIME_STEPS)

cell = MultiRNNCell([IndRNNCell(128, recurrent_max_abs=recurrent_max),
                    IndRNNCell(128, recurrent_max_abs=recurrent_max)])
output, state = tf.nn.dynamic_rnn(cell, input_data, dtype=tf.float32)
...


2. 原論文中提到的實驗

有關本文中重構「相加問題」的相關腳本,請參見示例 examples/addition_rnn.py。更多實驗(如 Sequential MNIST)將在今后幾天進行更新與展示。



本文為機器之心編譯,轉載請聯系本公眾號獲得授權。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲在线观看视频| 欧美高清视频一区二区三区在线观看| 欧美中文在线观看| 一本色道久久综合亚洲精品小说| 一区二区视频在线观看| 国产精品三上| 欧美色区777第一页| 欧美好吊妞视频| 老鸭窝91久久精品色噜噜导演| 翔田千里一区二区| 亚洲在线播放电影| 亚洲网站在线看| 一区二区电影免费观看| 亚洲欧洲一区| 亚洲国产视频一区| 亚洲福利av| 久久国产精品高清| 欧美在线亚洲| 欧美一区二区三区四区在线 | 亚洲综合精品自拍| 99精品欧美一区| 99国产精品久久久| 99国产精品久久| av成人免费观看| 一本色道88久久加勒比精品| 99精品视频免费全部在线| 日韩午夜激情| 一区二区三区高清在线| 在线中文字幕一区| 亚洲手机在线| 亚洲婷婷综合久久一本伊一区| 亚洲视频在线一区| 亚洲宅男天堂在线观看无病毒| 亚洲午夜一区二区三区| 亚洲一区二区在线免费观看视频| 亚洲欧美电影院| 欧美一区二区精品久久911| 欧美亚洲免费高清在线观看| 欧美主播一区二区三区美女 久久精品人| 欧美一区成人| 久久久蜜桃一区二区人| 蜜臀va亚洲va欧美va天堂| 欧美成人网在线| 欧美另类亚洲| 国产精品免费看| 国产欧美日韩综合一区在线播放| 国产性色一区二区| 尤物九九久久国产精品的特点| 亚洲国产欧美日韩精品| 亚洲精品一区二区三区在线观看| 中国av一区| 性一交一乱一区二区洋洋av| 久久精品视频免费观看| 最新高清无码专区| 在线亚洲一区观看| 欧美一区二区黄色| 美女啪啪无遮挡免费久久网站| 欧美激情亚洲另类| 国产精品爽爽ⅴa在线观看| 国产在线不卡精品| 亚洲人成高清| 亚洲私拍自拍| 久久精品国产成人| 一区二区三区国产在线观看| 先锋影音久久| 免费成人av在线看| 欧美性大战久久久久久久| 国产亚洲二区| 亚洲精品综合| 欧美一区不卡| 一本色道久久综合狠狠躁的推荐| 久久av一区二区三区漫画| 欧美大片一区| 国产日韩欧美一二三区| 亚洲国产成人精品女人久久久 | 国产精品一区二区久久国产| 精品51国产黑色丝袜高跟鞋| 99re66热这里只有精品3直播| 欧美亚洲一区二区在线| 亚洲日本欧美在线| 午夜免费在线观看精品视频| 久热成人在线视频| 国产精品高清在线| 亚洲国产精品精华液2区45 | 日韩一级黄色av| 久久精品亚洲一区二区| 亚洲自拍偷拍麻豆| 欧美大胆人体视频| 国产视频在线观看一区二区| 亚洲美女诱惑| 亚洲国产小视频| 欧美一区二区三区日韩视频| 欧美日韩精品免费看| 精品动漫av| 性做久久久久久久免费看| 亚洲制服欧美中文字幕中文字幕| 欧美大香线蕉线伊人久久国产精品| 国产日韩欧美视频在线| 一区二区av在线| 999亚洲国产精| 蜜臀a∨国产成人精品| 国产亚洲精品一区二555| 一本色道久久综合亚洲精品婷婷| 亚洲精品日韩一| 久久青草久久| 国产亚洲精品资源在线26u| 亚洲永久在线| 亚洲一区二区在| 欧美视频一区在线| 亚洲三级观看| 亚洲精品综合| 亚洲一区二区在线免费观看视频 | 国产性色一区二区| 亚洲一二三区视频在线观看| 亚洲三级影院| 欧美va亚洲va国产综合| 国产日韩欧美亚洲| 亚洲无线一线二线三线区别av| 亚洲精品国产精品久久清纯直播 | 久久精品国产v日韩v亚洲| 午夜精品视频在线观看一区二区| 欧美国产欧美亚洲国产日韩mv天天看完整 | 欧美激情视频一区二区三区免费| 国产午夜精品视频| 中日韩在线视频| 一本久久a久久免费精品不卡| 久久亚洲精品视频| 国产欧美一区二区三区另类精品 | 国产欧美一区二区精品秋霞影院 | 亚洲三级影院| 久久国产一二区| 校园激情久久| 欧美性猛交99久久久久99按摩| 91久久精品一区| 妖精视频成人观看www| 欧美成人一区二区三区片免费| 韩国一区二区三区美女美女秀| 亚洲欧美日韩成人高清在线一区| 亚洲视频一区在线观看| 欧美精品情趣视频| 1000部国产精品成人观看| 亚洲欧洲在线一区| 另类国产ts人妖高潮视频| 极品少妇一区二区| 久久国产综合精品| 久久人人超碰| 黄色av成人| 亚洲美女网站| 欧美人交a欧美精品| 亚洲美女av网站| 亚洲手机成人高清视频| 欧美日韩中文字幕| 一本久道久久综合狠狠爱| 午夜免费在线观看精品视频| 国产精品美女久久久浪潮软件| 亚洲一区二区三区高清不卡| 亚洲欧美日韩爽爽影院| 国产精品最新自拍| 午夜激情久久久| 欧美黑人国产人伦爽爽爽| 亚洲激情专区| 一区二区三区产品免费精品久久75| 欧美日韩国产91| 亚洲丝袜av一区| 久久亚洲综合网| 亚洲国产精品一区二区久| 一区二区激情视频| 一本色道久久综合亚洲二区三区| 欧美人妖另类| 亚洲一区在线观看免费观看电影高清 | 亚洲少妇自拍| 国产精品网站在线播放| 午夜免费电影一区在线观看| 久久久7777| 亚洲国产成人在线播放| 亚洲欧洲日夜超级视频| 欧美少妇一区二区| 亚洲综合首页| 蜜臀91精品一区二区三区| 最新亚洲视频| 亚洲自拍偷拍视频| 在线看片成人| 亚洲色图自拍| 国产亚洲一区二区精品| 亚洲激情在线播放| 欧美日韩另类综合| 亚洲综合色激情五月| 久久一本综合频道| 亚洲肉体裸体xxxx137| 久久久久久噜噜噜久久久精品| 亚洲国产女人aaa毛片在线| 亚洲在线国产日韩欧美| 国产日韩亚洲欧美| 亚洲精品视频在线看| 欧美午夜精品久久久| 亚洲日本无吗高清不卡| 国产精品久久999| 亚洲国产另类 国产精品国产免费| 欧美激情综合网| 亚洲五月婷婷|