《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 32分鐘訓練神經機器翻譯,速度提升45倍

32分鐘訓練神經機器翻譯,速度提升45倍

2018-09-10

深度模型的訓練時間通常對研究者而言都是很大的挑戰(zhàn),我們需要花數小時甚至數天才能知道某個小改進到底好不好。然而如果我們從一開始就考慮降低模型訓練時間,那么很多概念都能迅速驗證。在 Facebook 開發(fā)者的試驗中,他們采用了低精度和大批量等一系列加速訓練方法,并成功地將需要 24 小時訓練的 NMT 降低到 32 分鐘。該項目相關的分布式訓練代碼已開源。


項目地址:https://github.com/pytorch/fairseq

微信圖片_20180910214226.gif


我們想讓用戶用自己喜歡的語言體驗我們的產品,同時與世界各地的人們建立聯(lián)系。為此,我們使用神經機器學習(NMT)自動翻譯帖子和內容中的文本。我們之前關于這一課題的研究 fairseq 已經開源,這是一個序列到序列的學習庫,可供任何人訓練 NMT 模型,完成自動摘要或其他文本生成任務。


隨著 NMT 模型在從大規(guī)模單語數據(只有一種語言的數據)中的學習越來越成功,訓練速度變得越來越重要。為了適應這樣的發(fā)展,我們必須想辦法大大減少訓練時間。直到最近,NMT 模型的這種訓練在單臺機器上還需要數周,對于快速實驗和部署來說,這一速度實在太慢。


由于在精度和訓練設置上做了幾項改變,我們在短短 32 分鐘內就能訓練一個強大的 NMT 模型(參見《Scaling Neural Machine Translation》),速度是原來的 45 倍(原來需要 24 小時)。在之后的一項研究《Understanding Back-Translation at Scale》中,我們展示了這一速度大幅提升的訓練設置如何讓我們利用單語文本訓練準確得多的模型。


《Scaling Neural Machine Translation》:https://arxiv.org/abs/1806.00187

《Understanding Back-Translation at Scale》(EMNLP 2018):https://arxiv.org/abs/1808.09381


加速訓練


我們首先在一臺配備 8 塊 Volta GPU 的英偉達 DGX-1 機器上把模型的訓練時間從近 24 小時縮減至不到 5 小時。神經網絡包含數百萬個參數,這些參數在訓練過程中會被調整并通常以 32 位浮點精度存儲。然后,我們把訓練的精度從 32 位轉換為 16 位,這樣不僅能減少 GPU 內存占用,還讓我們能夠使用英偉達最新 Volta GPU 架構提供的經過高度優(yōu)化的 Tensor Core。降低了精度(16 位)的訓練有時會由于浮點「溢出」而導致模型質量降低。在本研究中,我們實施了一個已知的自動監(jiān)控和防止溢出程序,并將訓練時間從近 24 小時減至 8.25 小時,速度提升 2.9 倍而沒有降低模型質量。


接下來,我們通過所謂的累積更新,延遲了模型更新來減少 GPU 之間的通信。通過同步訓練模型,從而每個 GPU 可以維持一個完整、相同的模型副本,但是會處理訓練數據的不同部分。處理時需要反向傳播——在網絡上被分為 forward pass 和 backward pass(前向/反向),以計算訓練模型所需的統(tǒng)計量。在處理每個小批量(mini-batch),GPU 會同步地相互交流結果(梯度)。這樣可能導致效率低下:首先,在 GPU 之間發(fā)送數據會消耗時間;其次,處理較快的工作站必須等待速度較慢的工作站(即所謂散兵游勇),然后訓練才能繼續(xù)。


后者對于文本相關模型來說是一大挑戰(zhàn),不同的句子長度會使這個問題更加嚴重。我們對這兩個問題的解決方案是在工作線程互相通信之前,讓每個工作線程處理并累積多個小批量的結果,從而延遲同步點。這將訓練時間縮減至 7.5 小時,且無損模型質量。


累積更新還能增加有效的批大小,即每一個訓練步所使用的數據量。在我們的研究設置中,批大小增大為 16 倍。這使得學習率可以翻倍,訓練時間減少到 5.2 個小時,比原始系統(tǒng)實現(xiàn)了 4.6 倍的加速。


圖:通過 (i) 減少工作站之間的通信、(ii) 減少不同 GPU 的工作負載變化從而節(jié)約閑置時間,累加多個前向/反向步驟的梯度,實現(xiàn)訓練加速。

微信圖片_20180910214254.jpg

最后,我們使用 16 位浮點數來進一步提高每一個工作站的批大小,從而利用釋放出的額外 GPU 內存。通過將每個工作站的批大小從 3.5K 單詞提升到 5K 單詞,該研究將總訓練時間減少到 4.9 個小時,對原始系統(tǒng)實現(xiàn)了 4.9 倍的加速。


擴展


我們對單個機器訓練的優(yōu)化還可應用于在多個機器上進行并行訓練(即分布式訓練)。我們將訓練從單個 DGX-1 機器擴展到 16 個機器(即 128 塊 GPU),發(fā)現(xiàn)可以在 37 分鐘內訓練完成同樣的模型,與原始的單機器設置相比,速度提升了 38.6 倍。


在多個機器上訓練時,另一個優(yōu)化是同時發(fā)生 GPU 通信和反向傳播。在反向傳播之后,我們將所有信息傳達給其他工作站。典型情況下,反向傳播和通信按順序執(zhí)行,但是我們通過盡可能并行 GPU 通信和反向傳播而節(jié)省時間。具體來說,我們在反向傳播步驟結束后立刻開始在多個工作站之間同步梯度。這樣 GPU 通信和反向傳播發(fā)生就實現(xiàn)了并行,這節(jié)省了 14% 的訓練時間,且使總訓練時間從將近 24 個小時下降到 32 分鐘,速度提升了 44.7 倍。

微信圖片_20180910214342.jpg

圖:反向傳播與梯度同步的并行示意圖。

微信圖片_20180910214407.jpg

圖:每次改進后訓練總時間的變化情況。


在更多未翻譯數據上訓練


加速訓練允許我們在更大數據集上訓練模型。一般而言,訓練 NMT 模型需要原文與參考譯文對應的成對文本,例如雙語數據等。但是,雙語數據相對于網絡上或其它地方常見的大量單語數據要有限地多。在第二篇論文《Understanding Back-Translation at Scale》中,我們展示了如何通過僅提供我們想要翻譯的語言的文本來提升模型的翻譯性能,以及利用大量的此類數據可以大幅提升模型準確度。


通過單語數據提升 NMT 模型最高效的方法之一是反向翻譯(back-translation)。如果我們的目標是訓練一個英語到德語的翻譯模型,我們可以首先訓練一個從德語翻譯到英語的模型并利用該模型翻譯所有的單語德語數據,然后在已有的和新的數據上簡單地訓練一個英語到德語的最終模型。我們的論文顯示,數據如何被翻譯是非常重要的,通過采樣故意不總是選擇最好的翻譯同樣也是非常重要的。

微信圖片_20180910214435.gif

圖:演示反向翻譯的動畫


如果我們把 2.26 億個反向翻譯的句子添加到現(xiàn)有的包含 500 萬個句子的訓練數據中,我們就能大幅提升翻譯質量。下圖(左)顯示了這一系統(tǒng)在標準 WMT』14 英-德基準測試集上的準確率(fairseq & 單語數據)。該系統(tǒng)可以在 16 個 DGX-1 機器上經過 22.5 小時訓練而成。圖中還顯示了 DeepL 的準確率,這是一個依賴于高質量人工翻譯的專業(yè)翻譯服務,此前該服務在該基準測試上表現(xiàn)最佳。

微信圖片_20180910214456.jpg


快速翻譯


我們還提高了 fairseq 模型的翻譯速度。具體來說,我們實現(xiàn)了很巧妙的高速緩存,或從計算和批處理中移除完成句子的幾個單詞而不是句子。這提高了大約 60% 的速度。下圖展示了 fairseq 和其它工具集的對比。只從 32 位浮點數變到 16 位浮點數就能提升 40% 的速度。

微信圖片_20180910214542.jpg

圖:在標準 WMT』14 英語-德語基準測試集上使用大型 Transformer 模型和 V100GPU 得到的翻譯速度。


未來計劃


擴展和提高自動化翻譯技術仍將是我們工作的重點。為了讓該研究項目盡快成長起來,我們共享了分布式訓練的代碼,并將其作為我們的 fairseq 開源項目的一部分,從而使其他研究者也可以輕松地以更快的速度訓練 NMT 模型。進行分布式訓練僅需稍微改動訓練命令。


實現(xiàn)更快的 NMT 訓練是一項激動人心的發(fā)現(xiàn)。大幅度地降低訓練時間可以加快實驗周轉,使我們能更輕松地在更好的模型中做研究。把無標簽數據應用到翻譯之外的問題(如問答或自動摘要)上也是很不錯的發(fā)現(xiàn)。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
久久亚洲国产成人| 欧美午夜电影完整版| 日韩一二三区视频| 亚洲第一精品电影| 欧美影院久久久| 亚洲欧美清纯在线制服| 在线视频日韩| 一级日韩一区在线观看| 亚洲精品视频在线播放| 亚洲日韩视频| 亚洲精品视频在线观看网站| 91久久精品一区二区别| 91久久久亚洲精品| 亚洲黄页视频免费观看| 亚洲国产一区二区视频| 亚洲国产精品www| 亚洲第一主播视频| 伊人久久婷婷| 亚洲国产综合在线| 亚洲品质自拍| 亚洲精品九九| 亚洲作爱视频| 亚洲视频1区2区| 中文精品视频| 亚洲女性裸体视频| 性欧美xxxx大乳国产app| 欧美一级播放| 久久精品一区二区三区中文字幕| 亚洲高清在线观看| 亚洲精品女人| 亚洲午夜久久久| 午夜精品亚洲一区二区三区嫩草| 欧美一级视频免费在线观看| 欧美在线亚洲在线| 久久―日本道色综合久久| 久久这里有精品15一区二区三区 | 亚洲欧美精品伊人久久| 亚洲一区二区三区中文字幕| 香蕉国产精品偷在线观看不卡 | 欧美诱惑福利视频| 久久精品动漫| 欧美成人国产| 欧美午夜不卡在线观看免费 | 国产精品资源在线观看| 国产一区二区三区成人欧美日韩在线观看| 狠狠干综合网| 91久久精品国产91性色| 一区二区三区免费网站| 欧美亚洲免费| 亚洲精品国产精品乱码不99| 一本色道综合亚洲| 欧美在线播放视频| 欧美大片免费观看在线观看网站推荐| 欧美日韩国产色站一区二区三区| 国产精品久久久久久久久动漫| 国产综合网站| 日韩视频一区二区三区在线播放免费观看 | 午夜精品福利一区二区蜜股av| 亚洲丰满少妇videoshd| 亚洲婷婷在线| 久久久久五月天| 欧美三级第一页| 国产字幕视频一区二区| 亚洲三级免费电影| 午夜一区二区三区不卡视频| 亚洲免费电影在线| 久久国产天堂福利天堂| 欧美日韩国产成人在线| 国产亚洲欧美在线| 日韩一级精品| 亚洲国产精品视频一区| 午夜激情亚洲| 欧美日韩视频一区二区| 国语自产精品视频在线看抢先版结局 | 一区二区日韩免费看| 欧美一区二区成人| 欧美激情精品久久久久久免费印度| 国产精品久久久一区麻豆最新章节 | 久久激情视频免费观看| 欧美日韩mp4| 国内外成人免费激情在线视频网站| 亚洲精品午夜精品| 久久gogo国模啪啪人体图| 一区二区三区四区五区精品| 免费成人你懂的| 国产日韩成人精品| 亚洲免费高清| 久久精品亚洲国产奇米99| 亚洲免费在线| 欧美日韩国产一级片| 一区二区三区在线观看欧美| 亚洲影院在线| 亚洲视频在线二区| 欧美大胆人体视频| 国产揄拍国内精品对白| 亚洲欧美国产视频| 亚洲一区高清| 欧美日韩精品福利| 亚洲国产精品久久| 亚洲大片一区二区三区| 久久福利毛片| 国产精品男女猛烈高潮激情| 亚洲另类自拍| 在线免费观看成人网| 国产精品国产亚洲精品看不卡15| 在线观看国产成人av片| 欧美在线亚洲在线| 欧美一级专区| 国产精品对白刺激久久久| 亚洲欧洲在线看| 91久久精品一区二区别| 久久人人爽人人爽爽久久| 国产日产精品一区二区三区四区的观看方式 | 久久精品盗摄| 久久精品国产96久久久香蕉| 国产精品一区视频网站| 亚洲午夜精品久久| 亚洲永久免费精品| 欧美午夜精品久久久| 一区二区三区.www| 亚洲五月婷婷| 欧美午夜精品久久久久久久| 在线视频亚洲一区| 亚洲欧美精品| 国产欧美不卡| 性欧美xxxx大乳国产app| 久久国产66| 国产一区二区在线观看免费播放| 欧美综合国产| 久久综合狠狠综合久久激情| 激情欧美日韩| 亚洲精品女人| 欧美日韩日本网| 亚洲图片在线| 欧美在线关看| 国内伊人久久久久久网站视频| 亚洲福利小视频| 女同一区二区| 日韩视频免费在线| 亚洲一级在线观看| 国产精品久久久久久一区二区三区 | 亚洲欧洲精品一区二区精品久久久| 欧美+亚洲+精品+三区| 亚洲国产精品va在线观看黑人| 亚洲精品综合| 欧美日韩一视频区二区| 一区二区三区国产精华| 亚洲欧美日韩电影| 国产午夜亚洲精品理论片色戒| 欧美一区久久| 欧美成人资源网| 日韩视频在线免费| 国产一区日韩一区| 亚洲电影欧美电影有声小说| 乱人伦精品视频在线观看| 黑人一区二区| aa亚洲婷婷| 国产欧美日韩精品一区| 亚洲国产成人不卡| 欧美精品久久一区| 亚洲性视频h| 麻豆成人在线播放| 99ri日韩精品视频| 久久国产高清| 亚洲欧洲三级电影| 亚洲欧美一区二区原创| 国内外成人在线| 亚洲一区三区电影在线观看| 国产一区二区精品在线观看| 亚洲免费观看在线视频| 国产精品夜夜嗨| 亚洲欧洲在线观看| 国产精品久久久久久久电影 | 精品二区视频| 亚洲自拍电影| 激情自拍一区| 亚洲视频综合在线| 黄色成人av网| 亚洲小说区图片区| 黄色一区二区在线| 在线一区二区日韩| 激情欧美一区二区三区| 亚洲天堂网在线观看| 在线成人激情视频| 午夜精品视频网站| 亚洲国产欧美日韩| 久久国内精品视频| 日韩一级视频免费观看在线| 午夜在线一区二区| 亚洲日本欧美在线| 久久精品二区三区| 夜夜嗨av一区二区三区网页| 久久青草欧美一区二区三区| 中日韩美女免费视频网址在线观看| 久久蜜桃资源一区二区老牛 | 美女露胸一区二区三区| 亚洲男人第一网站| 欧美日韩美女一区二区| 亚洲国产裸拍裸体视频在线观看乱了| 国产精品蜜臀在线观看|