《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > 一種基于FPGA的CNN硬件加速器實現
一種基于FPGA的CNN硬件加速器實現
電子技術應用
邱臻博
重慶郵電大學 光電工程學院, 重慶 400065
摘要: 提出了一種基于FPGA的通用CNN硬件加速器設計方案。針對計算量最大的卷積層,采用了輸入通道并行、核內并行、輸出通道并行三種加速方式,根據FPGA的片上資源,合理地設置相應并行度。在數據加載方面,采用相鄰數據位寬合并傳輸,有效提高了加速器的實際傳輸帶寬。基于行的數據流加載思想,設計了輸入緩存模塊。該緩存模塊只需緩存兩行數據即可開始卷積運算,有效地提前卷積運算的開始時間。在數據輸入、數據運算、數據輸出模塊之間,利用流水線循環優化方式,極大地提高了硬件的計算性能。最后將該加速器應用于VGG16和Darknet-19網絡,實驗表明,計算性能分別達到34.30 GOPS和33.68 GOPS,DSP計算效率分別高達79.45%和78.01%。
中圖分類號:TP391 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.234372
中文引用格式: 邱臻博. 一種基于FPGA的CNN硬件加速器實現[J]. 電子技術應用,2023,49(12):20-25.
英文引用格式: Qiu Zhenbo. An FPGA-based implementation of CNN hardware accelerator[J]. Application of Electronic Technique,2023,49(12):20-25.
An FPGA-based implementation of CNN hardware accelerator
Qiu Zhenbo
College of Photoelectric Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
Abstract: This paper proposes a general CNN hardware accelerator design scheme based on FPGA. For the most computationally intensive convolutional layer, three acceleration modes are adopted: input channel parallelism, intra-core parallelism, and output channel parallelism, and the corresponding parallelism degree is reasonably set according to the on-chip resources of FPGA. In terms of data loading, adjacent data bit width combined transmission is adopted, which effectively improves the actual transmission bandwidth of the accelerator. Based on the idea of row-based data flow loading, the input cache module is designed. The cache module only needs to cache two rows of data to start the convolution operation, effectively advancing the start time of the convolution operation. Between the data input, data operation, and data output modules, the pipeline cycle optimization method is used to greatly improve the computing performance of the hardware. Finally, the accelerator is applied to VGG16 and Darknet-19 networks, and experiments show that the computing performance reaches 34.30 GOPS and 33.68 GOPS, respectively, and the DSP computing efficiency is as high as 79.45% and 78.01%.
Key words : convolutional neural network acceleration;FPGA;row data loading;module division;pipeline structure

0 引言

隨著深度學習技術的飛速發展,神經網絡模型在圖像識別、目標檢測和圖像分割等領域取得了巨大技術進步[1-2]。然而相比較傳統算法,神經網絡在獲得高的性能同時也帶來了高計算復雜度的問題,使得基于專用硬件設備加速神經網絡成為神經網絡模型應用領域關注的焦點。目前,神經網絡模型硬件加速的主要方案有GPU、ASIC和FPGA三種方案。相比較GPU,FPGA具有成本功耗低的特點;相比較ASIC,FPGA具有模型實現靈活、開發速度快、綜合成本低的特點,特別適用于當前神經網絡在邊緣設備上部署的需求,因此基于FPGA的神經網絡模型加速研究成為當前神經網絡領域研究的熱點[3-5]。

大多數神經網絡模型中卷積層的運算量占到了總計算量的90%以上,因此可以通過在FPGA中執行卷積運算來實現神經網絡加速[6-7]。文獻[6]基于FPGA實現通用矩陣乘法加速器來實現神經網絡加速,獲得了很好的加速性能。文獻[7]則提出了一種基于脈動陣結構的矩陣乘法加速模塊,并用于神經網絡加速,獲得了較好的性能提升。文獻[8-9]從卷積運算的加速算法方面進行研究,Liang Y[8]等人基于二維Winograd算法在FPGA上對CNN進行了實現,與常規的卷積計算單元相比,該實現中基于二維Winograd算法設計的卷積計算單元將乘法操作減少了56%。Tahmid Abtahi[10]等人使用快速傅里葉變換(Fast Fourier Transform,FFT)對ResNet-20模型中的卷積運算進行優化,成功減少了單個卷積計算單元的DSP資源使用量。除卷積運算加速外,相關研究團隊對神經網絡加速過程中的其他方面也展開深入研究[10-14]。文獻[10]提出了一種塊卷積方法,這是傳統卷積的一種內存高效替代方法,將中間數據緩沖區從外部DRAM完全移動到片上存儲器,但隨著分塊層數的增加,精度會降低。文獻[11]提出一種相鄰層位寬合并和權重參數重排序的策略實現數據傳輸的優化方法,增加數據傳輸并行度的同時節省了通道的使用。文獻[12-14]采取乒-乓處理結構,分別在輸入模塊、卷積運算單元、輸出模塊方面提升了卷積運算的速率。



本文詳細內容請下載http://m.jysgc.com/resource/share/2000005800


作者信息

邱臻博

(重慶郵電大學 光電工程學院, 重慶 400065)




weidian.jpg

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲激情视频在线| 欧美伊人久久大香线蕉综合69| 亚洲免费高清| 亚洲福利在线看| 在线观看91精品国产入口| 国产亚洲精品久久飘花| 国产农村妇女精品| 国产精品专区第二| 国产精品区一区二区三| 国产精品久久久久久久久| 欧美日韩一区二区在线播放| 欧美精品一区在线| 欧美激情1区2区3区| 欧美激情第3页| 欧美精品久久一区| 欧美日韩成人| 欧美日韩免费观看一区=区三区| 欧美日韩第一区日日骚| 欧美日本高清视频| 欧美日韩亚洲一区二区三区| 欧美三区美女| 国产精品视频内| 国产美女一区| 国产在线日韩| 亚洲福利国产| 日韩系列欧美系列| 中文国产一区| 午夜在线一区| 欧美在线观看视频一区二区三区| 欧美伊人影院| 最新亚洲一区| 国产精品99久久久久久久vr | 一区视频在线| 亚洲高清一区二| 99国产精品久久久久久久久久| 在线中文字幕不卡| 午夜精品亚洲| 91久久精品国产| 亚洲视频999| 欧美诱惑福利视频| 麻豆精品传媒视频| 欧美日韩三级电影在线| 国产精品色网| 好吊色欧美一区二区三区视频| 亚洲国产精品传媒在线观看| 99视频热这里只有精品免费| 欧美一级黄色录像| 亚洲激情网站| 亚洲欧美日韩国产精品| 老司机亚洲精品| 欧美涩涩视频| 国产一区二区毛片| 亚洲日本欧美在线| 午夜亚洲性色福利视频| 亚洲精品国产精品国自产观看浪潮 | 亚洲欧美另类中文字幕| 久久精品女人天堂| 欧美日韩国产色视频| 国产欧美日韩另类视频免费观看| 精品成人久久| 在线亚洲成人| 亚洲欧洲一区二区三区在线观看| 亚洲综合色丁香婷婷六月图片| 久久婷婷麻豆| 国产精品久久精品日日| 红桃视频国产一区| 一二三区精品| 亚洲精品123区| 香蕉视频成人在线观看| 欧美xxxx在线观看| 国产精品视频最多的网站| 在线视频国产日韩| 亚洲一二三四区| 亚洲另类黄色| 久久久不卡网国产精品一区| 欧美肉体xxxx裸体137大胆| 黄色日韩网站视频| 亚洲一级二级| 日韩天堂在线观看| 久久综合给合久久狠狠色 | 久久精品视频网| 国产精品av久久久久久麻豆网| 一区二区亚洲精品| 亚洲欧美日韩精品一区二区| 99成人在线| 六月婷婷一区| 国产乱码精品一区二区三区忘忧草| 亚洲欧洲精品一区二区三区 | 国产伦精品一区二区三区四区免费| 亚洲国产91| 久久精品国产成人| 香蕉久久夜色| 欧美日韩在线播放一区二区| 亚洲国产精品第一区二区| 欧美在线不卡视频| 香蕉av777xxx色综合一区| 欧美日韩视频在线一区二区观看视频 | 亚洲欧美日韩国产中文| 欧美高清在线视频观看不卡| 国产一区二区三区在线播放免费观看 | 亚洲麻豆一区| 欧美+亚洲+精品+三区| 国产亚洲精品久| 亚洲尤物视频在线| 亚洲一区二区在线免费观看视频| 欧美韩国日本综合| 雨宫琴音一区二区在线| 久久av最新网址| 久久精品成人欧美大片古装| 国产精品人人爽人人做我的可爱| 亚洲乱码视频| 一区二区91| 欧美日韩国产91| 亚洲精品国产精品国自产观看浪潮 | 欧美在线亚洲一区| 久久久精彩视频| 国产亚洲综合性久久久影院| 亚洲综合第一页| 午夜视频久久久| 国产精品视频yy9099| 亚洲小说欧美另类婷婷| 亚洲一区二区欧美| 欧美深夜福利| 亚洲一级网站| 欧美影院视频| 国产一区二区三区在线观看免费| 欧美在线观看天堂一区二区三区| 久久久久久久一区二区| 国产一区二区三区久久精品| 久久国产精彩视频| 蜜桃久久精品一区二区| 亚洲成人在线观看视频| 91久久久久久国产精品| 欧美国产日本在线| 亚洲精品乱码| 亚洲综合视频一区| 国产日韩av高清| 久久精品女人天堂| 欧美国产综合视频| 夜夜嗨av一区二区三区免费区| 亚洲欧美日韩区| 国产人久久人人人人爽| 久久精品视频亚洲| 欧美精品v日韩精品v国产精品| 日韩视频久久| 新狼窝色av性久久久久久| 国产一区二区三区av电影| 亚洲国产日韩欧美在线99| 欧美精品国产一区二区| 在线亚洲精品| 久久男女视频| 亚洲精品国产欧美| 亚洲综合色网站| 国产一区二区三区奇米久涩| 亚洲激情视频网| 欧美视频中文一区二区三区在线观看| 亚洲一区二区毛片| 久久久999国产| 亚洲黄网站黄| 午夜精品视频在线观看一区二区| 国产午夜精品一区二区三区欧美| 亚洲丶国产丶欧美一区二区三区| 欧美精品一区二区视频| 亚洲愉拍自拍另类高清精品| 久热精品视频在线观看| 亚洲精品美女在线| 欧美在线视频观看免费网站| 亚洲成人在线| 午夜精品福利视频| 一区二区在线观看av| 一区二区三区四区国产| 国产亚洲毛片| 一区二区三区日韩在线观看| 国产美女一区| 99成人免费视频| 国产亚洲日本欧美韩国| 亚洲最快最全在线视频| 国产日韩视频| 在线综合欧美| 国产一区二区视频在线观看| 99精品视频免费观看视频| 国产亚洲人成a一在线v站 | 久热精品视频在线| 亚洲视频在线观看免费| 欧美成人精品影院| 亚洲欧美久久| 欧美日韩不卡合集视频| 欧美中文字幕在线播放| 国产精品高潮呻吟| 亚洲麻豆av| 国内精品久久久久久久果冻传媒 | 欧美在线黄色| 日韩视频免费观看高清在线视频 | 久久99伊人| 99精品欧美| 欧美成人久久| 欧美在线在线| 国产精品日韩| 亚洲视频一区二区在线观看| 在线观看成人网|