《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > 一種基于FPGA的CNN硬件加速器實現
一種基于FPGA的CNN硬件加速器實現
電子技術應用
邱臻博
重慶郵電大學 光電工程學院, 重慶 400065
摘要: 提出了一種基于FPGA的通用CNN硬件加速器設計方案。針對計算量最大的卷積層,采用了輸入通道并行、核內并行、輸出通道并行三種加速方式,根據FPGA的片上資源,合理地設置相應并行度。在數據加載方面,采用相鄰數據位寬合并傳輸,有效提高了加速器的實際傳輸帶寬。基于行的數據流加載思想,設計了輸入緩存模塊。該緩存模塊只需緩存兩行數據即可開始卷積運算,有效地提前卷積運算的開始時間。在數據輸入、數據運算、數據輸出模塊之間,利用流水線循環優化方式,極大地提高了硬件的計算性能。最后將該加速器應用于VGG16和Darknet-19網絡,實驗表明,計算性能分別達到34.30 GOPS和33.68 GOPS,DSP計算效率分別高達79.45%和78.01%。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.234372
中文引用格式: 邱臻博. 一種基于FPGA的CNN硬件加速器實現[J]. 電子技術應用,2023,49(12):20-25.
英文引用格式: Qiu Zhenbo. An FPGA-based implementation of CNN hardware accelerator[J]. Application of Electronic Technique,2023,49(12):20-25.
An FPGA-based implementation of CNN hardware accelerator
Qiu Zhenbo
College of Photoelectric Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
Abstract: This paper proposes a general CNN hardware accelerator design scheme based on FPGA. For the most computationally intensive convolutional layer, three acceleration modes are adopted: input channel parallelism, intra-core parallelism, and output channel parallelism, and the corresponding parallelism degree is reasonably set according to the on-chip resources of FPGA. In terms of data loading, adjacent data bit width combined transmission is adopted, which effectively improves the actual transmission bandwidth of the accelerator. Based on the idea of row-based data flow loading, the input cache module is designed. The cache module only needs to cache two rows of data to start the convolution operation, effectively advancing the start time of the convolution operation. Between the data input, data operation, and data output modules, the pipeline cycle optimization method is used to greatly improve the computing performance of the hardware. Finally, the accelerator is applied to VGG16 and Darknet-19 networks, and experiments show that the computing performance reaches 34.30 GOPS and 33.68 GOPS, respectively, and the DSP computing efficiency is as high as 79.45% and 78.01%.
Key words : convolutional neural network acceleration;FPGA;row data loading;module division;pipeline structure

0 引言

隨著深度學習技術的飛速發展,神經網絡模型在圖像識別、目標檢測和圖像分割等領域取得了巨大技術進步[1-2]。然而相比較傳統算法,神經網絡在獲得高的性能同時也帶來了高計算復雜度的問題,使得基于專用硬件設備加速神經網絡成為神經網絡模型應用領域關注的焦點。目前,神經網絡模型硬件加速的主要方案有GPU、ASIC和FPGA三種方案。相比較GPU,FPGA具有成本功耗低的特點;相比較ASIC,FPGA具有模型實現靈活、開發速度快、綜合成本低的特點,特別適用于當前神經網絡在邊緣設備上部署的需求,因此基于FPGA的神經網絡模型加速研究成為當前神經網絡領域研究的熱點[3-5]。

大多數神經網絡模型中卷積層的運算量占到了總計算量的90%以上,因此可以通過在FPGA中執行卷積運算來實現神經網絡加速[6-7]。文獻[6]基于FPGA實現通用矩陣乘法加速器來實現神經網絡加速,獲得了很好的加速性能。文獻[7]則提出了一種基于脈動陣結構的矩陣乘法加速模塊,并用于神經網絡加速,獲得了較好的性能提升。文獻[8-9]從卷積運算的加速算法方面進行研究,Liang Y[8]等人基于二維Winograd算法在FPGA上對CNN進行了實現,與常規的卷積計算單元相比,該實現中基于二維Winograd算法設計的卷積計算單元將乘法操作減少了56%。Tahmid Abtahi[10]等人使用快速傅里葉變換(Fast Fourier Transform,FFT)對ResNet-20模型中的卷積運算進行優化,成功減少了單個卷積計算單元的DSP資源使用量。除卷積運算加速外,相關研究團隊對神經網絡加速過程中的其他方面也展開深入研究[10-14]。文獻[10]提出了一種塊卷積方法,這是傳統卷積的一種內存高效替代方法,將中間數據緩沖區從外部DRAM完全移動到片上存儲器,但隨著分塊層數的增加,精度會降低。文獻[11]提出一種相鄰層位寬合并和權重參數重排序的策略實現數據傳輸的優化方法,增加數據傳輸并行度的同時節省了通道的使用。文獻[12-14]采取乒-乓處理結構,分別在輸入模塊、卷積運算單元、輸出模塊方面提升了卷積運算的速率。



本文詳細內容請下載http://m.jysgc.com/resource/share/2000005800


作者信息

邱臻博

(重慶郵電大學 光電工程學院, 重慶 400065)




weidian.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一区日韩在线| 久久精品亚洲乱码伦伦中文| 国产日韩一区二区三区| 欧美深夜影院| 欧美日韩成人综合在线一区二区 | 国产精品国产a级| 欧美日韩视频| 欧美三日本三级三级在线播放| 欧美激情精品久久久久久久变态| 欧美成ee人免费视频| 蜜桃精品久久久久久久免费影院| 久久综合成人精品亚洲另类欧美| 久久综合狠狠综合久久综合88| 久久久欧美精品| 久久久久高清| 久久亚洲精品一区二区| 榴莲视频成人在线观看| 美女久久一区| 欧美成人午夜影院| 欧美国产欧美亚洲国产日韩mv天天看完整 | 亚洲视频碰碰| 亚洲一区二区在| 午夜久久黄色| 欧美一站二站| 亚洲黄网站黄| 9l国产精品久久久久麻豆| 日韩一级免费| 亚洲午夜av| 欧美一区二区三区四区在线观看| 欧美一激情一区二区三区| 久久国产一区| 免费久久99精品国产| 欧美激情女人20p| 欧美日韩亚洲视频| 国产精品福利在线观看网址| 国产欧美一区二区视频| 国产色视频一区| 在线日本欧美| 99国产精品久久久久久久久久| 亚洲视频香蕉人妖| 欧美一区二区三区在线看| 亚洲国产日韩欧美在线图片| 99视频日韩| 欧美一区日本一区韩国一区| 久久一区国产| 欧美日韩精品综合在线| 国产精品亚洲а∨天堂免在线| 国产一区二区丝袜高跟鞋图片| 亚洲国产精品第一区二区| 99国产麻豆精品| 欧美在线影院| 99国产精品99久久久久久粉嫩| 亚洲欧美日本伦理| 久久视频一区| 欧美日韩视频在线观看一区二区三区| 国产九九精品| 亚洲经典三级| 亚洲欧美激情视频| 亚洲激情成人网| 亚洲欧美国产va在线影院| 久久久av毛片精品| 欧美精品七区| 国产亚洲人成网站在线观看| 最新国产乱人伦偷精品免费网站 | 一本久道久久综合婷婷鲸鱼| 亚洲欧美在线高清| 亚洲精品久久久久久下一站| 午夜精品福利在线| 欧美电影免费| 国产欧美一区二区三区视频 | aaa亚洲精品一二三区| 久久国产精品久久久| 欧美激情一区二区三区| 国产日本亚洲高清| 亚洲精品在线观| 久久不射电影网| 亚洲永久字幕| 欧美成人免费播放| 国产午夜精品一区二区三区欧美| 99热在线精品观看| 亚洲精品1区2区| 欧美在线亚洲| 欧美视频在线一区二区三区| 伊人狠狠色丁香综合尤物| 亚洲一区二区三区在线观看视频| 亚洲毛片一区| 久久综合狠狠综合久久激情| 国产精品欧美风情| 亚洲免费成人av电影| 亚洲国产精选| 久久精品综合一区| 国产精品久久久久aaaa| 亚洲精品中文字| 91久久精品国产91性色| 亚洲精品色图| 亚洲一区二区在线观看视频| 亚洲欧美在线x视频| 欧美乱在线观看| 一区二区三区在线不卡| 午夜视频一区在线观看| 亚洲综合日本| 欧美视频免费| 亚洲人成毛片在线播放| 亚洲人成人一区二区在线观看| 久久国产主播| 国产麻豆精品久久一二三| 亚洲视频碰碰| 亚洲一品av免费观看| 欧美日韩国产免费| 亚洲欧洲日夜超级视频| 亚洲欧洲偷拍精品| 久久综合狠狠| 精品成人一区二区三区| 久久精品官网| 久久亚洲精选| 精品福利电影| 亚洲国产精品成人一区二区| 久久蜜臀精品av| 国内成人在线| 欧美在线视频一区二区三区| 欧美中文字幕在线| 国产精品一区三区| 亚洲一区二区三区午夜| 欧美一区二区三区在线观看视频| 国产精品国产福利国产秒拍| 一区二区三区 在线观看视频| 一区二区三区欧美亚洲| 欧美精品在线观看播放| 亚洲精品美女| 亚洲免费婷婷| 国产精品美女久久久久久免费| 亚洲午夜电影网| 性久久久久久久| 国产日韩欧美在线播放| 久久国产精品一区二区| 鲁大师成人一区二区三区| 亚洲国产精品第一区二区三区| 亚洲日本电影| 欧美日本一道本| 一本色道久久综合狠狠躁篇怎么玩| 亚洲一级电影| 国产精品丝袜xxxxxxx| 欧美亚洲视频| 免费在线观看成人av| 亚洲激情电影在线| 在线亚洲+欧美+日本专区| 国产精品成人免费视频| 欧美一级片一区| 欧美成人一品| 在线亚洲精品福利网址导航| 欧美一级午夜免费电影| 国产一区二区精品丝袜| 91久久精品国产91久久性色| 欧美日韩免费观看一区| 亚洲午夜久久久| 久久久精品999| 亚洲黄色成人| 亚洲影院高清在线| 国产一区二区三区视频在线观看 | 亚洲综合色网站| 久久久青草青青国产亚洲免观| 亚洲国产精品久久久久秋霞蜜臀| 一本一本a久久| 国产精品一区二区在线| 亚洲级视频在线观看免费1级| 欧美少妇一区| 欧美在线在线| 欧美日本高清视频| 午夜亚洲一区| 欧美国产日韩a欧美在线观看| 一区二区欧美日韩视频| 久久婷婷久久| 一本久久青青| 久久久久一区| 一区二区三区欧美视频| 久久久无码精品亚洲日韩按摩| 亚洲精品久久7777| 久久精品国产欧美激情| 亚洲开发第一视频在线播放| 久久精品日韩| 一本大道av伊人久久综合| 久久米奇亚洲| 亚洲视频一区在线观看| 欧美成人黄色小视频| 午夜精品福利一区二区蜜股av| 欧美国产成人精品| 欧美一区二区三区四区视频| 欧美日韩在线观看视频| 亚洲激情一区二区| 国产精品亚洲一区| 99在线精品观看| 黄色成人小视频| 午夜精品免费视频| 亚洲精品亚洲人成人网| 久久尤物视频| 亚洲欧美成人一区二区三区| 欧美美女福利视频| 亚洲成色777777女色窝| 国产精品欧美日韩一区| 一区二区国产在线观看|