《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 設(shè)計應(yīng)用 > 一種HEVC標準中IDCT變換的FPGA實現(xiàn)
一種HEVC標準中IDCT變換的FPGA實現(xiàn)
2017年電子技術(shù)應(yīng)用第5期
黃友文,董 洋
江西理工大學(xué) 信息工程學(xué)院,江西 贛州341000
摘要: 為降低新一代高效視頻編碼(HEVC)標準中解碼端多尺寸逆離散余弦變換(Inverse Discrete Cosine Transform,IDCT)中的資源消耗,設(shè)計了一種IDCT硬件電路結(jié)構(gòu)。通過使用現(xiàn)場可編程門陣列(Field-Programmable Gate Array,F(xiàn)PGA)內(nèi)部嵌入式RAM單元進行矩陣轉(zhuǎn)置運算,從而減少了對內(nèi)部寄存器的使用。對IDCT系數(shù)矩陣進行分解得到不同尺寸下的統(tǒng)一運算電路結(jié)構(gòu),利用流水線技術(shù)實現(xiàn)對運算單元的加速,同時采用并行數(shù)據(jù)調(diào)度減少數(shù)據(jù)處理等待時間。設(shè)計結(jié)果表明,設(shè)計吞吐量為3.6點/時鐘周期,滿足了4k×2k@30 f/s視頻信號的實時處理需求。
關(guān)鍵詞: HEVC IDCT FPGA 嵌入式RAM
中圖分類號: TN919.81
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2017.05.008
中文引用格式: 黃友文,董洋. 一種HEVC標準中IDCT變換的FPGA實現(xiàn)[J].電子技術(shù)應(yīng)用,2017,43(5):38-40.
英文引用格式: Huang Youwen,Dong Yang. An IDCT transform implementation on FPGA in HEVC[J].Application of Electronic Technique,2017,43(5):38-40.
An IDCT transform implementation on FPGA in HEVC
Huang Youwen,Dong Yang
School of Information Engineering,Jiangxi University of Science and Technology,Ganzhou 341000,China
Abstract: To reduce the mutl-sized IDCT resource consume in the decoder of the new generation HEVC(High Efficient Video Coding),an IDCT processing circuit was proposed.In order to reduce the using of inner registers ,the embedded RAM units in FPGA were used to process the matrix transposition. A uniform circuit architecture of IDCT was derived from the decomposition of coefficient matrix.Pipeline technology was used to speed up the operation.Meanwhile,parallel data schedule will help to reduce the processing latency. Result showed that the throuput is 3.6 points per clock.It can handle 4k×2k@30 f/s video signal.
Key words : HEVC;IDCT;FPGA;embedded RAM

0 引言

    為解決當(dāng)前主流視頻編碼標準H.264/AVC無法滿足高分辨率視頻和圖像的問題,視頻編碼聯(lián)合開發(fā)組(Joint Collaborative Team on Video Coding)于2013年1月正式發(fā)布了新一代高效視頻編碼標準HEVC(High Efficiency Video Coding),HEVC的目標是在H.264/AVC的基礎(chǔ)上,在相同碼率條件下,提高50%的壓縮率[1]。HEVC標準中采用的是整數(shù)逆離散余弦變換(Inverse Discrete Cosine Transform),這樣就防止了采用浮點數(shù)在有限數(shù)據(jù)精度下編碼器與解碼器之間的誤差。

    HEVC支持的IDCT包括4、8、16、32點4種不同尺寸[1],因此,硬件結(jié)構(gòu)的靈活性顯得格外重要。目前已有的設(shè)計對全部尺寸的IDCT變換支持不夠全面[2-3],文獻[4]可以實現(xiàn)全部尺寸的IDCT變換,但是由于采用單一IDCT計算單元,不能很好地對視頻信號進行實時處理。

    本文在研究HEVC標準中的IDCT算法之后[9],設(shè)計了一種可以統(tǒng)一處理各種尺寸的電路結(jié)構(gòu)。通過對IDCT變換矩陣系數(shù)的分解[6],復(fù)用小尺寸的變換單元來構(gòu)建更大的變換單元,采用傳統(tǒng)的移位加進行常系數(shù)的乘法,同時優(yōu)化了移位加中的操作冗余。利用FPGA內(nèi)部的雙口RAM進行矩陣轉(zhuǎn)置,減少硬件消耗[5]。為了使設(shè)計達到預(yù)期的工作頻率,采用流水線技術(shù)對其關(guān)鍵路徑進行優(yōu)化,同時設(shè)計并行數(shù)據(jù)調(diào)度機制,減少硬件等待時間,提高硬件使用率,使其滿足了實時處理30幀/秒、采樣率為4:2:0的視頻信號的要求。

1 設(shè)計總體架構(gòu)

    整體設(shè)計結(jié)構(gòu)如圖1所示,完整的二維IDCT由兩個IDCT運算單元和一個轉(zhuǎn)置單元組成,為了使系統(tǒng)可以擁有更高的數(shù)據(jù)吞吐量,采用了經(jīng)典的全并行結(jié)構(gòu)??紤]到在HEVC解碼器中IDCT模塊需要配合其他相應(yīng)的模塊進行工作,采用并行的方式輸入,圖1箭頭方向表示數(shù)據(jù)及控制信號的流動,為了簡明起見,結(jié)構(gòu)圖中省略了時鐘與復(fù)位信號。IDCT_1D模塊對數(shù)據(jù)進行一維IDCT運算,IDCT_2D模塊對數(shù)據(jù)進行二維IDCT運算,Transpose模塊對內(nèi)部的數(shù)據(jù)進行轉(zhuǎn)置操作,采用這種單向數(shù)據(jù)流的硬件電路,減少了控制邏輯的復(fù)雜度,數(shù)據(jù)處理過程如下:首先把使能sel信號拉高,模塊開始工作,然后輸入指示數(shù)據(jù)塊TU的尺寸大小信號blk與數(shù)據(jù)in0~in31,先按列輸入到一維變換單元IDCT_1D,計算得到的中間結(jié)果,經(jīng)過轉(zhuǎn)置單元Transpose轉(zhuǎn)置之后,再在二維變換單元IDCT_2D中進行運算,輸出最終結(jié)果,rdy信號表示得到有效計算數(shù)據(jù)。

wdz2-t1.gif

2 IDCT模塊

    相比H.264/AVC,HEVC支持的整數(shù)IDCT尺寸為4×4,8×8,16×16,32×32四種塊尺寸變換[1],圖1中的IDCT_1D模塊與IDCT_2D模塊實現(xiàn)結(jié)構(gòu)類似,不同之處在于兩個模塊輸入的數(shù)據(jù)位寬,參考HM16.0[7],IDCT_1D輸入位寬為8 bit,即預(yù)測圖像與原始圖像的殘差值數(shù)據(jù)位寬為8 bit,經(jīng)過Transpose模塊的輸出數(shù)據(jù)位寬為16 bit,即IDCT_2D輸入數(shù)據(jù)位寬為16 bit,為了節(jié)約硬件資源并保證數(shù)據(jù)的準確性,在經(jīng)過IDCT_1D運算之后,參考標準HM模型,數(shù)據(jù)需要進行截位操作,使其位寬保持在16 bit,這樣就統(tǒng)一了硬件結(jié)構(gòu)與轉(zhuǎn)置操作過程中所需要的存儲器消耗[6]。

    圖2顯示了IDCT運算單元的內(nèi)部細節(jié),該設(shè)計復(fù)用了硬件結(jié)構(gòu),使得在進行較大尺寸的IDCT運算時可以使用較小的IDCT模塊,IDCT32為最終的運算單元,可以進行尺寸為32×32的IDCT運算,其內(nèi)部的IDCT4、IDCT8、IDCT16,分別完成4×4、8×8、16×16三種運算。

wdz2-t2.gif

    當(dāng)sel信號高電平有效的時候,表示模塊開始工作,blk配合輸入數(shù)據(jù)送入到IDCT模塊,其取值為00、01、10、11,分別表示了當(dāng)前變換塊為4×4、8×8、16×16、32×32的情況。ps_i模塊的作用在于調(diào)整輸入數(shù)據(jù)的順序,如在計算IDCT4的時候,送入IDCT模塊的數(shù)據(jù)為x0、x1、x2、x3,但是由于復(fù)用了硬件模塊,需要經(jīng)過ps_i模塊調(diào)序后變?yōu)閤0、x8、x16、x24送入內(nèi)部的IDCT4單元進行計算,在計算IDCT8的時候,在圖2中可以看到,IDCT8模塊復(fù)用了IDCT4作為計算單元的一部分,輸入數(shù)據(jù)為x0、x8、x16、x24,輸出結(jié)果作為偶部分,MCM4為4位常系數(shù)乘法部分,輸入數(shù)據(jù)為x4、x12、x20、x28,輸出結(jié)果作為奇部分,奇偶部分結(jié)果進行簡單的加減操作即可得到最終的結(jié)果,IDCT16和IDCT32運算過程與之類似。每次計算開始的時候啟動IDCT32模塊,輸出的結(jié)果為32個數(shù)據(jù),因此需要ps_o模塊選擇有效數(shù)據(jù)輸出。

3 Transpose模塊

    進行二維IDCT變換的時候需要在兩個IDCT變換單元之間使用轉(zhuǎn)置單元對中間結(jié)果進行行列轉(zhuǎn)置操作,本文的轉(zhuǎn)置操作過程如圖3所示,變換數(shù)據(jù)塊最大為32×32,所以使用32個16 bit的雙口RAM作為必要的數(shù)據(jù)存儲單元,為了減少對RAM頻繁操作,采用統(tǒng)一的地址寫入,列變換得到的數(shù)據(jù)依次寫入不同RAM單元的相同地址,在地址達到指示變換塊上限時,經(jīng)過一個時鐘周期的延時后,利用模塊內(nèi)部的有限狀態(tài)機FSM(Finite State Machine)按RAM0、RAM1、…、RAM31的順序讀取數(shù)據(jù),由于采用了雙口RAM,定義的輸出端口位寬為512 bit,每個周期最多可以讀取32個數(shù)據(jù),根據(jù)不同的變換塊指示標志,可以實現(xiàn)不同數(shù)據(jù)塊的轉(zhuǎn)置操作。

wdz2-t3.gif

3.1 RAM讀取順序

    宏觀上的轉(zhuǎn)置單元Transpose包含32個RAM,如何合理地讀取RAM是本設(shè)計要解決的一個問題,為了實現(xiàn)對不同變換數(shù)據(jù)塊的靈活操作,在寫入數(shù)據(jù)的時候,寫入地址單元采用統(tǒng)一地址寫入,即同時寫入多個RAM的相同地址,地址的寫滿通過數(shù)據(jù)塊尺寸指示標志blk判斷,這樣就簡化了多個地址的寫入控制邏輯。在讀取RAM的時候,使用FSM順序訪問RAM0~RAM31,blk指示當(dāng)前需要讀取到的RAM編號,根據(jù)參考模型HM16.0[9],定義每個數(shù)據(jù)位16 bit,每塊RAM有512 bit,輸出端口也定義為512 bit,每讀取16 bit即表示一個有效數(shù)據(jù),這樣就保證了單周期讀取數(shù)據(jù)塊的所有行數(shù)據(jù)。

3.2 并行處理的數(shù)據(jù)調(diào)度

    在全并行的結(jié)構(gòu)中,轉(zhuǎn)置模塊在處理不同尺寸的數(shù)據(jù)塊時很容易發(fā)生數(shù)據(jù)覆蓋現(xiàn)象,即下一個數(shù)據(jù)塊到來的時候,當(dāng)前數(shù)據(jù)塊較大時未能全部讀取出來,造成原來數(shù)據(jù)被下一個到來的數(shù)據(jù)覆蓋掉的現(xiàn)象。為解決這一問題,本文借鑒計算機指令中的流水線處理方式,數(shù)據(jù)調(diào)度如圖4所示,圖中方塊代表若干時鐘周期,Transpose處理周期中W表示寫入數(shù)據(jù),R表示讀取數(shù)據(jù),F(xiàn)表示數(shù)據(jù)轉(zhuǎn)置完畢,當(dāng)前數(shù)據(jù)塊在轉(zhuǎn)置完成之后,Transpose模塊發(fā)出完成信號使能IDCT_2D模塊,即圖4中的F處,同時該信號使能外部的數(shù)據(jù)輸入單元發(fā)送下一數(shù)據(jù)塊,當(dāng)前數(shù)據(jù)進行IDCT_2D運算的時候,下一數(shù)據(jù)塊進行IDCT_1D運算,這樣兩個IDCT模塊就不存在數(shù)據(jù)處理的空閑期,硬件利用率大大提高。

wdz2-t4.gif

4 電路仿真與實驗結(jié)果分析

    電路結(jié)構(gòu)采用Verilog HDL設(shè)計,在Altera Arria II GX EP2AGX190FF35C4芯片上綜合通過,使用Modelsim進行仿真,并與HM標準模型中的結(jié)果進行比較,結(jié)果一致,證明本文設(shè)計的正確性。

    在結(jié)構(gòu)上,DCT與IDCT并無本質(zhì)的區(qū)別,因此本文也選取了DCT的相關(guān)文獻作為參考,本文的資源占用率如表1所示。

wdz2-b1.gif

    由表1可以發(fā)現(xiàn),本文設(shè)計的結(jié)構(gòu)可以處理HEVC中多種變換塊尺寸,并且擁有較高的吞吐率。文獻[2]擁有較大的數(shù)據(jù)吞吐量,但是不能很好地處理HEVC中所有的變換塊,文獻[4]、文獻[7]采用面積優(yōu)先的方式,單周期處理量較小,文獻[8]能夠?qū)崿F(xiàn)對不同變換塊的一維DCT運算,且效率較高,但是并未對二維DCT變換進行很好地優(yōu)化。本文在面積與速度之間做了平衡,在滿足實時處理的基礎(chǔ)上,盡可能地減少資源的消耗。設(shè)計結(jié)果表明,最大延時為41個時鐘周期,模塊固定的流水線延時為9個時鐘周期。為了可以對采樣率為4:2:0、分辨率為3 840×2 160、幀率為30幀/秒的視頻實時處理,滿足設(shè)計要求的電路工作時鐘最小為104 MHz(3 840×2 160×30×1.5/3.6)。設(shè)計結(jié)果完全滿足4k視頻處理的要求。

5 結(jié)論

    本文提出了一種整數(shù)IDCT變換的FPGA設(shè)計,針對IDCT變換矩陣的特點,采用復(fù)用模塊的方法減少了硬件消耗。利用FPGA內(nèi)嵌的RAM資源進行轉(zhuǎn)置,節(jié)約了其內(nèi)部的寄存器資源,在滿足處理要求的基礎(chǔ)上盡量減少硬件消耗,充分利用結(jié)構(gòu)特點,設(shè)計并行數(shù)據(jù)調(diào)度,提高了硬件的使用率,對工程應(yīng)用具有一定的指導(dǎo)意義。

參考文獻

[1] SULLIVAN G J,OHM J R,HAN W J,et al.Overview of the high efficiency video coding(HEVC) standard [J].IEEE Transactions on Circuits and Systems for Video Technology,2012,22(12):1649-1668.

[2] PARK J S,NAM W J,HAN S M,et al.2-D large inverse transform (16×16,32×32) for HEVC(high efficiency video coding)[J].Journal of Semiconductor Technology and Science(JSTS),2012,12(2):203-211.

[3] CONCEICAO R,SOUZA J C,JESKE R,et al.Hardware design for the 32×32 IDCT of the HEVC video coding standard[M].Symposium on Integrated Circuits and Systems Design. Curitiba;IEEE Press.2013:1-6.

[4] SHEN S,SHEN W W,SHEN Y,et al.A unified 4/8/16/32-point integer IDCT architecture for multiple video coding standards[M].IEEE International Conference on Multimedia and Expo.2012:788-793.

[5] 許亞軍,韓雪松,韓應(yīng)征.AVS二維DCT變換的FPGA實現(xiàn)[J].電視技術(shù),2013,37(11):18-21.

[6] SZE V,BUDAGAVI M,J S G.High efficiency video coding(HEVC)-algorithms and architectures[M].Springer:2014.

[7] TIKEKAR M,HUANG C T,SZE V,et al.Energy and area-efficient harware implementation of HEVC inverse transform and dequantization[M].International Conference on Image Processing(ICIP).IEEE Press.2014:2100-2104.

[8] 楊啟洲,劉一清.基于HEVC的多長度DCT變換的VLSI設(shè)計[J].微電子學(xué),2015,45(1):100-103.

[9] Joint collaborative team on video coding(JCT-VC).HEVC Test Model HM-16.0[EB/OL].https://hevc.hhi.fraunhofer.de/trac/hevc/browser/tags/HM-16.0.



作者信息:

黃友文,董  洋

(江西理工大學(xué) 信息工程學(xué)院,江西 贛州341000)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
国产乱码精品| 亚洲视频1区2区| 国产精品久久久久免费a∨大胸| 免费亚洲电影在线观看| 欧美在线视频一区二区| 午夜精品成人在线| 亚洲欧美精品中文字幕在线| 亚洲午夜性刺激影院| 亚洲四色影视在线观看| 一区二区三区黄色| 一本久久a久久免费精品不卡| 亚洲精品在线视频| 亚洲免费观看高清在线观看| 99v久久综合狠狠综合久久| 日韩性生活视频| 日韩午夜精品视频| 99视频超级精品| 一本久久综合亚洲鲁鲁| 一二三四社区欧美黄| 一本大道久久a久久精二百| 日韩亚洲欧美中文三级| 洋洋av久久久久久久一区| 在线中文字幕日韩| 亚洲制服av| 午夜欧美不卡精品aaaaa| 性欧美1819sex性高清| 欧美一站二站| 久久久久欧美| 欧美成人小视频| 欧美绝品在线观看成人午夜影视| 欧美日本久久| 欧美视频在线观看一区二区| 国产精品美女999| 国产日韩成人精品| 黄网站免费久久| 亚洲黄色性网站| 在线亚洲免费| 欧美淫片网站| 亚洲人成人99网站| 中文精品一区二区三区| 午夜视频一区| 久久久一二三| 欧美精品免费视频| 国产精品国产一区二区| 国产亚洲成年网址在线观看| 欲香欲色天天天综合和网| 亚洲精品影视| 亚洲欧美成人综合| 亚洲第一搞黄网站| 一区二区三区不卡视频在线观看| 亚洲一区二区三| 久久久久久久高潮| 欧美精品日韩综合在线| 国产精品视频| 亚洲大片免费看| 正在播放亚洲一区| 久久国产精品久久久久久电车| 亚洲乱码国产乱码精品精98午夜| 亚洲午夜一级| 久久日韩粉嫩一区二区三区| 欧美日韩精品欧美日韩精品一| 国产精品伊人日日| 亚洲国产精品久久久久婷婷884| 一区二区三区视频观看| 久久激情五月丁香伊人| 一区二区高清视频| 久久精品在线播放| 欧美啪啪一区| 国内精品伊人久久久久av一坑| 亚洲精品日韩在线| 欧美亚洲网站| 这里只有精品丝袜| 老司机免费视频一区二区三区| 欧美日韩一区二区三区四区在线观看| 国产日韩欧美麻豆| 日韩亚洲欧美中文三级| 欧美专区日韩视频| 亚洲欧美日韩国产| 欧美激情一二三区| 国产伊人精品| 这里只有精品视频在线| 亚洲欧洲一区二区在线观看| 欧美一级片久久久久久久| 欧美国产综合视频| 国产在线国偷精品产拍免费yy| 一本高清dvd不卡在线观看| 久久国产精品久久w女人spa| 亚洲性感美女99在线| 欧美jjzz| 狠狠色综合网| 午夜视频一区| 亚洲综合欧美日韩| 欧美精品日本| 精品成人在线视频| 午夜在线成人av| 亚洲视频一区二区在线观看| 欧美大片在线观看一区| 国产在线观看91精品一区| 亚洲一区国产精品| 亚洲网站在线看| 欧美精品一区二区在线观看| 精品999网站| 欧美一区二视频| 午夜一区在线| 国产精品大片| 日韩一级片网址| 夜夜嗨一区二区| 欧美高清hd18日本| 伊人久久综合| 亚洲国产99| 久久久综合激的五月天| 国产农村妇女毛片精品久久莱园子| 99亚洲精品| av不卡在线| 欧美日本国产| 亚洲精品美女91| 亚洲美女诱惑| 欧美freesex交免费视频| 伊人成人网在线看| 亚洲国产成人在线视频| 久久综合九色综合欧美就去吻 | 国产一区二区成人久久免费影院| 一本久久a久久免费精品不卡| 夜夜嗨av一区二区三区四季av| 欧美激情亚洲精品| 在线观看一区欧美| 亚洲日本成人女熟在线观看| 久久在线观看视频| 一区在线视频| 亚洲精品免费观看| 欧美欧美午夜aⅴ在线观看| 亚洲精品久久久久久久久久久久 | 久久躁狠狠躁夜夜爽| 伊人狠狠色j香婷婷综合| 亚洲高清不卡一区| 噜噜噜在线观看免费视频日韩| 一区免费观看| 日韩小视频在线观看| 欧美视频三区在线播放| 亚洲伊人观看| 久久久精品欧美丰满| 原创国产精品91| 99视频在线观看一区三区| 欧美日韩亚洲国产一区| 亚洲一区在线视频| 久久久久久尹人网香蕉| 亚洲高清在线观看| 一本大道久久a久久综合婷婷| 欧美午夜无遮挡| 欧美亚洲综合另类| 欧美成人按摩| 亚洲色图综合久久| 久久精品亚洲一区二区| 亚洲国产精彩中文乱码av在线播放| 99国产精品99久久久久久粉嫩| 欧美色视频日本高清在线观看| 亚洲欧美激情四射在线日| 久久综合色播五月| 亚洲精品一区二区三区99| 亚洲综合日本| 激情综合自拍| 亚洲无玛一区| 国内揄拍国内精品少妇国语| 亚洲乱码国产乱码精品精可以看| 欧美系列精品| 久久精品理论片| 欧美日韩国产小视频| 亚洲免费视频观看| 免播放器亚洲| 亚洲视频专区在线| 玖玖综合伊人| 中文有码久久| 蜜桃av综合| 亚洲一区二区在线播放| 欧美777四色影视在线| 亚洲午夜精品网| 欧美va天堂va视频va在线| 亚洲视频一二三| 美女露胸一区二区三区| 一区二区动漫| 免费成人高清视频| 亚洲夜间福利| 欧美精品国产一区| 欧美一区二区三区久久精品茉莉花 | 亚洲精品美女久久7777777| 久久精品99国产精品日本| 亚洲日本欧美日韩高观看| 欧美在线免费视频| 日韩视频免费| 久热精品视频在线免费观看| 在线性视频日韩欧美| 蜜臀av一级做a爰片久久| 亚洲一区二区三区四区五区黄| 欧美成人一区二区三区| 欧美一区二区啪啪| 欧美日韩国产天堂| 亚洲国产日本| 国产一区视频网站| 欧美在线观看天堂一区二区三区| 日韩一级黄色av|