《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > FPGA與深度學習的關系究竟是什么

FPGA與深度學習的關系究竟是什么

2018-07-04

  人工智能的風潮從技術一路蔓延到硬件,讓“芯片”成為今年行業(yè)里盛極一時的主題。人們關注通用芯片領域里CPU和GPU不斷刷新的基準(benchmark),更對專用芯片(ASIC)領域不同場景下不斷問世的解決方案表示出了空前的熱情。

  而眾所周知,在專用芯片與通用芯片中間,還有一個更為靈活,也更為神秘的領域:FPGA。無論是英特爾天價的收購還是微軟與 IBM 雄心勃勃的計劃,都讓人對其更加好奇。而“萬能芯片”的名稱,以及多樣化的職責范圍:它可以是智能手機里不起眼的一個小組件,也可以是數(shù)千美金一塊的開發(fā)板,也讓人對其真面目更加疑惑。

  FPGA 與深度學習的關系究竟是什么?它適合加速何種類型的運算?適合應用于何種場景?6 月,機器之心采訪了美國伊利諾伊大學香檳分校電氣與計算機工程系(UIUC ECE)教授、深度學習算法硬件加速解決方案創(chuàng)業(yè)公司 Inspirit IoT 創(chuàng)始人陳德銘,與他聊了聊“萬能芯片”FPGA 在深度學習領域的用法。陳教授于近期宣布兼任國內計算機視覺領域創(chuàng)業(yè)公司觸景無限的首席科學家。

  以下為采訪實錄。

  機器之心:從算法的角度,F(xiàn)PGA 適合于加速哪些運算?

  FPGA 的優(yōu)勢在于可定制化的并行。它可以為了特定算法專門定制邏輯單元。例如,算法中需要完成一個開三次方的運算,在通用芯片上需要一長串指令實現(xiàn)它,但是在 FPGA 上可以為這個特定運算設計一個單元。

  定制化的一個“極限”的例子是,如果能夠把神經(jīng)網(wǎng)絡中的參數(shù)全部二值化、特征圖(feature map)也全部二值化,那么甚至可以不用乘法器,而是用異或門(XOR gate)完成計算,會有異常強大的表現(xiàn)。即使不全部二值化,因為全部二值化會讓準確度明顯下降,只要合理使用各種低位寬的運算,仍可以讓 FPGA 大放異彩。比如在我們最近和 IBM 合作的 ELB-NN 項目中,我們可以在功耗低于 5 瓦的情形下,讓神經(jīng)網(wǎng)絡在 FPGA 上的算力達到 10.3 TOPS,同時依然維持非常高的準確度。

  另一個例子是微軟的 Brainwave FPGA 項目,通過使用特殊的 8-bit 的浮點運算,可以在高容量的 FPGA 上達到 40 TOPS。

  值得一提的是,LSTM 等神經(jīng)網(wǎng)絡每一步操作都很相似,這種整體運算過程是序列的算法也非常適用于用 FPGA 進行加速。FPGA 非常擅長處理流數(shù)據(jù),可以設計流水線機制,使得在運算過程中不需要將中間數(shù)據(jù)存入內存而是直接送到下一步進行操作。

  機器之心:相比于其他芯片,F(xiàn)PGA 在實現(xiàn)深度學習模型時有哪些結構帶來的優(yōu)勢?

  FPGA 的引腳比一般的芯片多,同時它的邏輯單元可以完全根據(jù)算法要求來重組從而產(chǎn)生定制化的數(shù)據(jù)通路(datapath),因此非常適合處理大批量流數(shù)據(jù)。它不像 GPU 一樣需要反復調取片外存儲中的數(shù)據(jù),理想狀態(tài)時,只要數(shù)據(jù)一次性流進去再流出來,算法就完成了,因此,F(xiàn)PGA 非常適合具有低延遲需求的任務。

  另外 FPGA 的速度快、功率低的特點也讓它在能耗方面相比于 CPU、GPU 也有很大優(yōu)勢。

  比如我們在 FPGA 上實現(xiàn)了長期循環(huán)卷積網(wǎng)絡(Long-term Recurrent ConvoluTIonal Network),它的速度 ( latency ) 比 GPU 快 3.1 倍,F(xiàn)PGA 的功率比 GPU 小 5.6 倍,最終整體能耗降低 17 倍左右。

  機器之心:從行業(yè)的角度,F(xiàn)PGA 都能夠用于哪些機器學習與深度學習任務的加速?

  在終端,有些自動駕駛公司的車上系統(tǒng)中就采用了 FPGA 完成一些實時檢測識別任務。例如,我曾經(jīng)代表 UIUC 與小鵬汽車的副總裁、機器學習專家谷俊麗女士交流,她提到,F(xiàn)PGA 可以憑借信號處理和低能耗方面的優(yōu)勢,成為一個可靠的第二系統(tǒng),在汽車的第一系統(tǒng)出現(xiàn)失誤的時候,作為安全模式介入進來。IoT 方面的應用就更多了,無論是安防還是智能家居,F(xiàn)PGA 都會有機會進入市場。

  在云端,也有結合 FPGA 的巨大空間。之前,微軟的 Project Catapult 就搭建起了大規(guī)模的 FPGA 云服務器。現(xiàn)在 Catapult 正在運行搜索和數(shù)據(jù)存儲方面的運算,同時,他們也在積極地思考如何把機器學習運算部署在上面,包括是否能將 FPGA 作為其 Azure 云的后端支持。亞馬遜 AWS 的 FPGA 云計算已經(jīng)很有規(guī)模了,并且一直在大力推動之中。最近,國內創(chuàng)業(yè)公司深鑒也開始結合華為的云端 FPGA 來進行深度學習算法的加速,特別在基于 LSTM 的語音識別上非常有優(yōu)勢。

  機器之心:能否介紹一下使用高層次綜合(HLS)自動生成寄存器級(RTL)實現(xiàn)與手工用硬件描述語言(HDL)進行實現(xiàn)的區(qū)別?

  對于深度學習相關算法來說,HLS 是有優(yōu)勢的。

  當你閱讀用高層語言描述的深度學習模型時,你會發(fā)現(xiàn)模型是有規(guī)律的。比如,卷積操作在 C 語言里就是一個六層的嵌套循環(huán)。此時我就可以針對這個循環(huán)開發(fā)一個 IP 核,確定如何進行流水線設計(pipelining),如何分配存儲等,然后再將 IP 核用在 FPGA 上,進而讓神經(jīng)網(wǎng)絡中的所有卷積層來共享 IP 核即可。

  此時設計的優(yōu)化要點是 IP 核的大小、是否需要多個 IP 核并行運算等。這是一個非常適用 HLS 的場景,因為 HLS 可以自動化地、快速地探索不同的解決方案。如果采用 RTL,則需要很多工程師,組成多個團隊,每個團隊根據(jù)工程師過去的設計經(jīng)驗著重探索一個方向,這是一個成本非常高的過程。

  RTL 是一種描述硬件的空間的關系和邏輯時序等邏輯關系的硬件描述語言。這是一門難學的語言,能夠熟練掌握的從業(yè)者也不多,開發(fā)和測試都很慢。夸張點說,如果 HLS 開發(fā)周期以天和周來計算,那么 RTL 通常是以月和年。

  從最終結果角度講,RTL 完全手工調制的解決方案是很可能比 HLS 自動生成的方案效果好的。我們曾經(jīng)做過比較,在深度學習的情境下,HLS 和 RTL 方法的差距在 10% 左右。

  因此,問題在于是否愿意花 3-5 倍的時間獲得額外 10% 的效果。

  機器之心:在簡化 FPGA 開發(fā)過程這一任務上,研究者做了哪些工作?

  我們的團隊開發(fā)了一個研究工具,是一個 C 語言的模板庫,能夠根據(jù) Caffe 和 TensorFlow 的代碼自動生成 C 語言的表達。然后研究者可以將 C 語言的代碼再交給 HLS 工具生成 RTL 代碼。

  C 語言是軟件工程師普遍掌握的語言,這樣的工具讓軟件工程師也具有 FPGA 開發(fā)能力,而且讓開發(fā)者更專注于算法,而不用過多考慮底層硬件。

  而且,這個過程中的中間結果都可以導出,專業(yè)人員也可以在自動生成的基礎上再進行優(yōu)化,總而言之,整個開發(fā)的效率都得到了極大的提高。

  這只是舉一個例子。還有其它很多的研究人員在做相關的提升深度學習設計效率和質量的各類工具和平臺。工業(yè)和學術屆的都有。學術屆比如 UCLA 的叢京生老師,以及 Cornell 的張志汝老師等。工業(yè)屆比較領先的是賽靈思和英特爾自己設計的一些工具。

  機器之心:各個大公司在 FPGA 的應用方面都進行了哪些工作?拓展市場的思路都有哪些?

  IBM 和賽靈思正在 Power 系列上進行合作,致力于在 FPGA 上加更多的存儲,在最新的原型機上,把存儲加到了 64G,相比于市面上現(xiàn)在常見的最大 8 或 16G,極大擴展了數(shù)據(jù)帶寬,來進行和大數(shù)據(jù)相關的處理。

  英特爾收購了 Altera,并且致力于幫助 Altera 進行編譯等工具的開發(fā)。這是一個 FPGA 商品化的思路,就像 GPU 一樣,說不定未來的 PC 里就會有一個 FPGA 協(xié)處理器在 CPU 旁邊完成工作。或者在芯片層面上,CPU 片上就有一塊 FPGA。總而言之,一旦工具做好,整合的機會會有很多。英特爾在智能城市、智慧制造方面都有很多的構想,并且希望借由 FPGA 實現(xiàn)。

  再就是微軟。它的思路主要就是云計算,除了 Bing 之外,也希望在進行機器學習任務的 Azure 云中使用 FPGA。

  機器之心:能否介紹一下 Inspirit IoT 通過哪些產(chǎn)品實現(xiàn)了深度學習算法在 FPGA 上的加速?

5b3b0dc3689f6-thumb.jpg

  我們公司主要有三個產(chǎn)品,按照層次分別是 DNN 優(yōu)化器、高層次綜合加速編譯器(HLS compiler),以及整體 FPGA 解決方案。

  DNN 優(yōu)化器的目標是定制一個 FPGA 友好的模型,把訓練好的模型中對于推理來說冗余的部分去掉。例如,訓練時使用的浮點數(shù)可以被替換為定點數(shù),訓練時每層有非常多的單元,但是在推理的時候可以進行剪枝(Pruning),等等。DNN 優(yōu)化器就是以各種高層框架的模型為基礎,根據(jù)硬件的特性和場景的特性進行自動的優(yōu)化。

  高層次綜合編譯器讓開發(fā)者得以繞開寫 Verilog 硬件描述語言,將 C、 C++、CUDA 等代碼直接編成 FPGA,旨在降低硬件開發(fā)的門檻,提高軟件工程師的生產(chǎn)力。我們的特色是這個編譯器可以自然結合深度學習算法中的各種 IP 核,從而可以最好的優(yōu)化各種深度學習算法在 FPGA 上的高速及高質量的實現(xiàn)。

  除此之外,我們也有嵌入 FPGA 的開發(fā)板,用于聲音相關的應用場景。其上嵌入了 FPGA 和 4 個麥克風,可以檢測聲音來源、提高聲音質量,也可以和攝像頭等其他設備連用。例如,捕捉到車輛撞擊聲、尖叫聲等特定聲音之后,能夠調轉攝像頭,收錄相關的視頻等,希望獲得一個「1+1>3」的效果。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲电影网站| 亚洲成色www久久网站| 红桃视频成人| 国产欧美日本| 国产精品欧美一区二区三区奶水| 欧美日韩国产影片| 欧美日韩久久| 欧美午夜不卡视频| 国产精品劲爆视频| 国产精品国产一区二区| 国产精品成人国产乱一区| 欧美日韩在线视频一区| 欧美日本中文字幕| 欧美日本成人| 欧美日韩一区高清| 欧美午夜精品理论片a级按摩| 欧美视频不卡| 国产精品视屏| 国产亚洲欧美一区二区| 激情小说亚洲一区| 在线观看一区欧美| 亚洲国产精品成人综合色在线婷婷| 亚洲福利在线看| 亚洲精品美女| 中文精品在线| 午夜精品亚洲| 亚洲成色777777女色窝| 日韩一区二区免费高清| 亚洲一区中文| 欧美影院视频| 久久阴道视频| 欧美精品啪啪| 国产精品夜夜夜一区二区三区尤| 国产婷婷色一区二区三区| 永久555www成人免费| 亚洲日韩成人| 亚洲免费在线精品一区| 久久精品91| 一本色道88久久加勒比精品 | 久久精品国产一区二区三区| 最新中文字幕亚洲| 亚洲一区在线免费| 久久精品欧美日韩| 欧美黄色免费网站| 国产精品美女久久久久久免费| 国产午夜精品视频免费不卡69堂| 一区在线电影| 一二三区精品| 欧美影视一区| 99精品国产福利在线观看免费| 亚洲欧美在线免费观看| 久久一区二区三区四区| 欧美日韩一二区| 国产亚洲人成a一在线v站| 亚洲欧洲一区二区三区| 亚洲一区日韩在线| 亚洲国产一区在线| 亚洲一区二区在线免费观看| 久久久天天操| 欧美视频国产精品| 精品1区2区| 中文有码久久| 亚洲乱码国产乱码精品精可以看 | 亚洲精品婷婷| 欧美一级视频精品观看| av成人免费在线观看| 久久精品99国产精品日本| 欧美日韩国产一区精品一区| 黑人巨大精品欧美黑白配亚洲| 亚洲麻豆一区| 亚洲国产精品视频| 欧美亚洲视频一区二区| 欧美国产日本| 国产一区欧美日韩| 在线视频精品| 日韩视频永久免费| 久久嫩草精品久久久精品| 国产精品国码视频| 最新日韩精品| 久久精品视频va| 欧美一区成人| 欧美天天视频| 亚洲黄色成人网| 久久福利影视| 欧美一二三区精品| 欧美日韩网址| 亚洲欧洲一区二区三区久久| 久久精品欧洲| 久久大逼视频| 国产精品伦子伦免费视频| 亚洲区第一页| 亚洲精品国产欧美| 六月丁香综合| 韩国精品主播一区二区在线观看| 亚洲一区三区电影在线观看| 亚洲一区二区三区精品视频| 欧美激情导航| 亚洲风情亚aⅴ在线发布| 欧美在线观看www| 欧美在线关看| 国产欧美精品在线| 亚洲一区精品电影| 亚洲自拍高清| 欧美性视频网站| 日韩视频在线一区| 一区二区欧美精品| 欧美精品入口| 亚洲高清在线视频| 亚洲国产精品嫩草影院| 久久综合久久综合久久综合| 国产综合色在线| 久久激情视频免费观看| 久久精品视频免费| 国产日韩视频一区二区三区| 亚洲欧美第一页| 欧美一区国产一区| 国产麻豆成人精品| 亚洲欧美在线磁力| 久久精品国产成人| 国产视频久久久久| 欧美在线免费观看| 久久天堂精品| 在线观看一区| 日韩亚洲欧美成人| 欧美日韩精品二区第二页| 亚洲人妖在线| 中文精品视频一区二区在线观看| 欧美日韩高清免费| 一区二区电影免费在线观看| 亚洲在线第一页| 国产精品日韩一区二区三区| 亚洲一区二区在线| 欧美一级艳片视频免费观看| 国产日韩专区| 亚洲高清一区二| 欧美电影在线观看| 一个色综合导航| 午夜电影亚洲| 国产一区二区三区在线观看免费| 亚洲高清视频中文字幕| 欧美黄色免费| 中日韩高清电影网| 欧美一区二区视频网站| 国产尤物精品| 亚洲人成在线观看| 欧美日韩一区二区三区高清| 亚洲一区二区精品| 久久午夜色播影院免费高清| 亚洲国产清纯| 亚洲主播在线播放| 国产欧美一区二区视频| 亚洲大片免费看| 欧美精品麻豆| 午夜精品国产更新| 欧美a级片网| 中文无字幕一区二区三区| 久久精品综合| 亚洲欧洲在线视频| 亚洲欧美日韩天堂一区二区| 国内成人自拍视频| 99天天综合性| 国产欧美一区在线| 亚洲精品美女在线| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ入口 | 久久精品女人的天堂av| 亚洲高清不卡| 午夜精品免费在线| 一区二区视频欧美| 亚洲影院在线观看| 在线观看欧美一区| 亚洲一区二区三区成人在线视频精品| 国产欧美一区二区三区另类精品 | 国产欧美日韩一区二区三区在线 | 日韩小视频在线观看| 欧美一区二区三区视频在线观看| 尤物九九久久国产精品的特点 | 久久久精品久久久久| 亚洲美女精品成人在线视频| 久久不射电影网| 亚洲久久视频| 久久蜜桃资源一区二区老牛 | 99国产精品视频免费观看| 国产人成精品一区二区三| 99精品久久免费看蜜臀剧情介绍| 国产视频在线观看一区二区| 99视频精品在线| 激情欧美一区二区| 香蕉精品999视频一区二区| 亚洲国产三级网| 久久久精品五月天| 亚洲香蕉网站| 欧美人与性动交a欧美精品| 久久精品论坛| 国产精品综合av一区二区国产馆| 日韩视频在线一区| 在线观看成人av| 久久久精品国产免费观看同学| 亚洲小视频在线观看| 欧美日韩国产综合网 | 国内精品国产成人|