《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 非精確浮點數乘法器設計
非精確浮點數乘法器設計
2016年電子技術應用第3期
尹培培
南京航空航天大學 計算中心,江蘇 南京210016
摘要: 隨著電路系統數值運算范圍以及數據運算精度的不斷擴大,浮點數運算的研究變得越來越重要。但傳統浮點數運算單元硬件復雜、功耗大、延時長,這些因素很大程度上制約著浮點數運算的性能。非精確計算可以減少容錯設備的動態及靜態能量損耗,作為解決以上問題的有效方法。提出了一種非精確浮點數乘法器的算法設計,同時將該算法應用于高動態范圍圖片的圖像處理中,并將結果與精確浮點數乘法器的應用結果進行對比,結果表明所提出的非精確浮點數乘法器具有很好的性能。
中圖分類號: TP332.2
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2016.03.011
中文引用格式: 尹培培. 非精確浮點數乘法器設計[J].電子技術應用,2016,42(3):38-41,46.
英文引用格式: Yin Peipei. Design and analysis of inexact floating-point multiplier[J].Application of Electronic Technique,2016,42(3):38-41,46.
Design and analysis of inexact floating-point multiplier
Yin Peipei
Computer Center,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China
Abstract: With the increasing extending the scope of digital operation and demands of digital precision, the study of floating-point(FP) arithmetic has become more important. But the complex hardware, high power consumption and long delay of traditional floating-point arithmetic unit restrict the performance of floating-point arithmetic. An inexact circuit offers a promising approach to significantly reduce both dynamic and static power dissipation for error-tolerant applications. To solve the above problems, the inexact floating-point multiplier is proposed by approximately designing a mantissa multiplier. High dynamic range(HDR) images are processed using the proposed inexact floating-point multiplier to show the validity of the inexact design,comparison results show that the proposed inexact floating-point multiplier has a good property.
Key words : floating-point;inexact;multiplier;HDR

0 引言

    目前,集成電路的設計工藝已經進入深亞微米階段,工藝水平大幅度提高,計算機微處理器也不斷更新換代。在微處理系統中,數據類型分為定點數和浮點數,相對于定點數的有限范圍及有限精度,浮點數可以靈活地表示更大范圍及更高精度的實數,由于以上原因,浮點數運算成為微處理器以及信號處理系統中的重要部件之一。但同時相對于定點數而言,浮點數運算需要更復雜的硬件電路,消耗更大的面積及能量,因此為數據范圍的拓寬帶來了能量及面積上的消耗。傳統的電路設計大多運用精確計算算法,但對于一些圖像處理的可容錯應用,這些系統并不需要絕對的精確性。所以將非精確運算[1]運用到這些系統中可以減小能量損耗及電路面積,同時也可提高系統的性能。

    非精確的算法設計作為減少容錯設備的動態及靜態能量損耗的有效方法,它的主要思想是通過減小硬件的復雜度來提高系統的性能及效率。目前非精確計算主要集中在定點數的研究[2-5],文獻[2]中非精確處理器犧牲了7.58%的相對錯誤率,但速度、面積比精確處理器速度提高了將近15倍,能量損耗也減少了將近15倍。研究表明運用非精確算法設計出的芯片面積更小,速度更快,能量損耗更低。雖然定點數在非精確研究方面取得了較成功的應用,但相對于定點數而言,目前對非精確浮點數運算的研究并不多。由于浮點數運算電路更復雜,能量也消耗更多,非精確浮點數算法的研究顯得尤為重要。

    文獻[5]設計了一種非精確的浮點數加法器,該設計通過將低位部分精確加法替代為或門算法實現非精確運算;文獻[6]研究了一種低功耗的浮點數乘法器,該研究通過直接截斷浮點數的數值位來減少硬件;文獻[7]設計了一種高效率的浮點數乘法器;文獻[8]利用低精度浮點數來減小MP3解碼時的內存損耗。

    本文提出了一種非精確浮點數乘法器的算法設計,同時將該算法應用于高動態范圍圖片的圖像處理中,并將結果與精確浮點數乘法器的應用結果進行對比。文章內容分布如下:在第1節中,首先簡單介紹了浮點數構成及精確的浮點數乘法器的結構;在第2節中提出了非精確乘法器的設計方法;在第3節中將該非精確乘法器應用到高動態范圍圖片中;最后總結了該設計算法。

1 背景簡介

1.1 浮點數表示方法

    在算數運算中,數據的表示方法有兩個,定點數和浮點數。定點數可以表示以0為中心的一定范圍的正負整數,由于定點數小數點固定,不能表示太大動態范圍的數,同時也不能表示過大或過小的數,此時浮點數的優勢就體現了出來,它可以在不增加位數的前提下擴展數據的動態范圍。

    在IEEE 754-2008標準中,浮點數是一個以3個量表示的二進制位串(如圖1所示),該位串分為3個部分:符號位部分、指數位部分和尾數位部分。

wdz4-t1.gif

    浮點數的標準表達式為:

    wdz4-gs1.gif

其中,S為符號位,當S=0時表示該浮點數是一個正值,當S=1時表示該浮點數是一個負值;E為指數位,bias表示偏移量,對于單精度bias=127,雙精度bias=1023,則E-bias既可為正數也可為負數;M為尾數位,對于規格化的尾數,存儲時默認省去小數點前的1,則對于非零尾數,尾數值為1.M。

1.2 精確浮點數乘法器

    最初的浮點數乘法器是依靠軟件實現的,但隨著超大規模集成技術的發展以及乘法器對計算速度要求的提高,乘法運算逐漸變成一個硬件的部件,浮點數乘法的基本原理是將相乘兩數的指數和作為乘積的指數,相乘兩數尾數的積作為乘積的尾數,相乘兩數的符號位異或作為乘積符號位。

    精確的浮點數乘法器如圖2所示,默認這里兩個操作數都已規格化,如若沒有,則首先需將輸入的操作數規格化。然后從兩操作數中分別提取每個操作數的符號位、指數位及尾數位,并將尾數位補充省略的第一位1。浮點數的乘法只要包括兩個運算:指數的加法和尾數的乘法,這兩運算結束后就是將結果進行規格化,生成符合IEEE 754-2008標準的結果。

wdz4-t2.gif

2 非精確浮點數乘法器設計

    非精確乘法器的設計是基于圖2所示的精確計算的算法級設計,主要是將非精確定點數乘法器運用到浮點數尾數乘法設計中,同時考慮到尾數乘積已是非精確結果,舍入單元及規格化也進行了簡化。

2.1 尾數乘法器

    尾數乘法器就是計算兩個浮點數尾數部分的乘積,也就是兩個無符號定點數的乘法,主要包括3個部分:部分積的生成、部分積壓縮及最終結果的生成。本文部分積通過非精確Booth編碼[9]生成,部分積壓縮通過非精確4-2壓縮器[10]及Wallace樹[11]完成。對于單精度浮點數,尾數的乘法是無符號定點24×24位的乘法器,修正Booth編碼產生了13個部分積;4-2壓縮器、Wallace樹以及進位存儲加法器將部分積壓縮成2個操作數;最后48位和進位采用快速超前進位加法器相加。

    非精確Booth編碼是在修正Booth編碼算法上改進的,修正Booth編碼算法的門級電路如圖3(a)所示,式(2)給出了部分積(Partial Products,PP)與輸入之間的關系。非精確Booth編碼的門級電路如圖3(b)所示,式(3)給出了部分積與輸入之間的關系。

    wdz4-gs2-3.gif

wdz4-t3.gif

    部分積的壓縮通過4-2壓縮器實現,非精確壓縮器是在精確4-2壓縮器上改進得到,精確4-2壓縮器的實現方法如圖4(a)所示,式(4)~式(6)給出了壓縮結果與部分積輸入之間的關系。非精確4-2壓縮器的實現方法如圖4(b)所示,式(7)~式(8)給出了壓縮結果與部分積輸入之間的關系。

    wdz4-gs4-8.gif

wdz4-t4.gif

    以單精度浮點數為例,非精確尾數乘法器的Wallace樹結構如圖5所示,由于最終標準化后只取乘積的前24位,所以進行24×24乘法時0~23位的計算直接舍去,24~42位進行非精確計算,43~47位進行精確計算,圖5中實線框中進行非精確Booth編碼及非精確壓縮,虛線框進行精確Booth編碼及精確壓縮。

wdz4-t5.gif

2.2 舍入單元

    舍入單元的作用是在結果被返回放回浮點格式時,將多出來的位舍棄,使得有效數據的位數保持在固定的位數范圍內。在精確浮點數乘法器中,IEEE列出了4種不同的舍入方法:舍入到最近(Round To Nearest,RTN)、朝正無窮大方向舍入(Round To Positive Infinity,RTPI)、朝負無窮大方向舍入(Round To Negative Infinity,RTNI)、朝0方向舍入(Round To Zero,RTZ)。在非精確設計中,乘積結果已是非精確的,舍入方法的選擇對算法沒有太大意義,所以在非精確浮點數乘法器中,舍入單元將不再考慮。

2.3 非精確浮點數乘法器結構

    基于以上分析,非精確浮點數乘法器可以通過設計非精確無符號定點數乘法器、簡化規格化處理及省略舍入單元來實現,具體結構如圖6所示。

wdz4-t6.gif

3 圖像處理應用

    很多非精確浮點數乘法都應用于圖像處理中, OpenEXR是由Industrial Light and Magic開發的高動態范圍圖片(High Dynamic-Range,HDR)的文件格式,它支持16位及32位浮點。本文采用高動態范圍圖片來驗證該非精確浮點數乘法器的有效性。高動態范圍可視區分度檢測(High Dynamic Range Visible Difference Predictor,HDR-VDP)是度量兩幅圖片區別的方法,它可以檢測兩幅圖片的可視區別。圖7、圖8分別為精確、非精確浮點數乘法生成圖片,兩幅圖片的區別檢測圖如圖9所示。

wdz4-t7-8.gif

wdz4-t9.gif    HDR-VDP中整體可視檢測中定義了兩個度量方法,一個為P_det,定義為兩幅圖片的可視區別概率,它的范圍為0~1,數值越大,說明兩圖片的區別人眼越容易察覺;另一度量方法是Q_MOS,它定義為圖片的平均觀測質量,它的范圍是0~100,數值越大說明圖片質量越好。經測量本文設計的非精確浮點數乘法器的兩個度量值分別為:

    wdz4-gs9-10.gif

    度量值P_det表明兩幅圖片的差異不太容易被檢測,度量值Q_MOS表明兩幅圖片質量很好。

4 結論

    本文主要采用非精確定點尾數乘法器設計非精確浮點數乘法器,并將該乘法器運用到圖像處理中,結果表明本文所設計的非精確浮點數乘法器具有很好的性能。

參考文獻

[1] PALEM K,INGAMNENI A.Ten years of building broken-chips:the physics and engineeringofinexact  computing[J].ACMTrans.Embedded Computing Systems,2013,12(2),87:1-23.

[2] LINGAMNENI A,MUNTIMADUGU A,ENZ C,et al.Algorithmic methodologies for ultra-efficient inexact architectures for sustaining technology scaling[J].Proc.ACM Int.Conf.Computing Frontiers,2012:3-12.

[3] YANG Z,JAIN A,LIANG J,et al.Approximate XOR XNOR-based Adders for inexact computing[J].Proc.13rd IEEE Conf.Nanotechnol.(IEEE-NANO),2013:690-693.

[4] Liu Weiqiang,Chen Linbin,Wang Chenghua,et al.Design and analysis of inexact floating-point adders[J].IEEE Transactions on Computers,2016,65(1):308-314.

[5] Liu Weiqiang,Chen Linbin,WANG C,et al.Inexact Floating-Point Adder for Dynamic Image Processing[J].Proceedings of the 14th IEEEInternational Conference on Nano-technology Toronto,Canada,2014.

[6] TONG J Y,NAGLE D,RUTENBAR R.Reducing power byoptimizingthe necessary precision/rangeof floating-point arithmetic[J].IEEE Trans.Very Large Scale Integr.Syst.2000,8:273-286.

[7] GUPTA A,MANDAVALLI S,MOONEY V,et al.Low power probabilistic floatingpoint multiplier design[J].Proc.IEEE Comput.Soc.Annu.Symp.VLSI,2011:182-187.

[8] EILERT J,EHLIAR A,LIU D.Using low  precision  floating point  numbers  to  reduce  memory  cost  for  MP3 decoding[J].Proc. 6th IEEE Workshop on Multimedia Signal Processing,2004:119-122.

[9] YEH W C,JEN C W.High-speed booth encoded parallel multiplier design[J].IEEE Trans.Computers,2000,49(7):692-701.

[10] Amir Momeni,Jie Han,Paolo Montuschi,et al.Design and analysis of approximate compressor for multilication[J].IEEE Trans.Computers,2015,64(4):984-994.

[11] MILLAR B,MADRID P E,SWARTZLANDER E E.A fast hybrid multiplier combining Booth and Wallace/Dadda algorithms[J].Proceedings of the 35th MidwestSymposium on Circuits and Systems,1992,1(8):158-165.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲在线视频一区| 麻豆精品在线视频| 亚洲黄色成人| 午夜在线不卡| 亚洲永久网站| 亚洲一区二区三区高清不卡| 一本一本久久a久久精品牛牛影视| 亚洲欧洲日产国产网站| 亚洲韩国青草视频| 91久久国产综合久久蜜月精品| 伊人久久大香线| 黄色精品一区| 在线观看欧美黄色| 亚洲国产免费看| 亚洲日本va在线观看| 亚洲人永久免费| 亚洲精品在线观看视频| 日韩一区二区免费看| 一本色道久久88综合亚洲精品ⅰ | 欧美天天综合网| 欧美视频一区二区三区四区| 欧美无乱码久久久免费午夜一区| 欧美视频中文一区二区三区在线观看 | 久久蜜桃av一区精品变态类天堂| 久久人体大胆视频| 久久青草久久| 欧美成人精精品一区二区频| 欧美极品在线播放| 国产精品白丝黑袜喷水久久久| 国产精品久久久久久av下载红粉| 国产精品一区免费观看| 国产在线播放一区二区三区| 在线电影欧美日韩一区二区私密| 亚洲国产精品福利| 一本久道久久综合狠狠爱| 亚洲免费一级电影| 久久精品国产99国产精品澳门| 亚洲七七久久综合桃花剧情介绍| 夜久久久久久| 欧美在线精品免播放器视频| 美女精品国产| 欧美三级午夜理伦三级中视频| 国产精品美女久久久久久久| 狠狠色2019综合网| 亚洲日本成人| 先锋影音久久久| 亚洲激情校园春色| 亚洲综合久久久久| 久久夜精品va视频免费观看| 欧美激情国产高清| 国产精品一区二区久久精品| 伊人久久综合97精品| 99热这里只有成人精品国产| 欧美一区三区二区在线观看| 亚洲精品一区二区在线观看| 亚洲在线黄色| 免费观看一区| 国产精品一区二区黑丝| 91久久久在线| 欧美一区=区| 一本一道久久综合狠狠老精东影业 | 欧美一区二区三区视频| 亚洲精品视频在线观看免费| 亚洲欧美日韩国产一区| 免费永久网站黄欧美| 国产精品一区二区三区久久久| 亚洲国产欧美精品| 欧美伊人久久| 亚洲永久免费精品| 欧美国产视频在线| 国产香蕉久久精品综合网| 日韩视频在线免费| 亚洲国产你懂的| 欧美一区二区成人| 欧美日韩免费精品| 尤物在线精品| 性色av一区二区三区| 亚洲一级免费视频| 欧美ab在线视频| 国产综合网站| 亚洲欧美日本日韩| 在线一区二区三区四区五区| 久久先锋资源| 国产日韩精品在线播放| 这里只有精品丝袜| 一本色道久久99精品综合| 久久久久久穴| 国产毛片久久| 亚洲一区二区免费在线| 一区二区欧美在线| 欧美国产国产综合| 极品尤物一区二区三区| 亚洲欧美制服另类日韩| 亚洲自拍偷拍色片视频| 欧美日韩精品一区二区在线播放| 加勒比av一区二区| 欧美一区二区三区视频免费| 午夜精品一区二区三区电影天堂 | 久久精品麻豆| 久久精品一区二区三区不卡| 欧美午夜久久久| 日韩视频一区| 一区二区三区精品国产| 欧美精品一区二区在线观看| 亚洲成人在线视频网站| 久久精品亚洲精品国产欧美kt∨| 欧美一区二区三区日韩视频| 国产精品美女一区二区在线观看| 日韩一区二区免费高清| 国产精品99久久不卡二区| 欧美日韩1234| 亚洲精品在线电影| 一区二区三欧美| 欧美日韩国产综合久久| 亚洲欧洲三级| 日韩亚洲在线| 欧美日韩国产在线播放| 日韩视频永久免费观看| 一区二区三区四区五区精品视频| 欧美理论在线| 中文无字幕一区二区三区| 亚洲图片欧洲图片日韩av| 欧美日韩综合在线免费观看| 99re6热在线精品视频播放速度| 一区二区欧美日韩| 欧美亚州在线观看| 亚洲一区免费看| 久久av最新网址| 国产自产在线视频一区| 亚洲电影自拍| 欧美精品免费在线观看| 日韩午夜中文字幕| 亚洲欧美激情一区| 国产精品视频福利| 欧美一区国产在线| 免费不卡中文字幕视频| 亚洲精品免费一区二区三区| 中文精品一区二区三区| 国产精品久久99| 欧美一区二区三区日韩| 欧美+日本+国产+在线a∨观看| 亚洲黄色性网站| 亚洲一区二区免费视频| 国产精品日韩欧美大师| 久久都是精品| 欧美激情在线有限公司| 中文成人激情娱乐网| 久久不射中文字幕| 1000部精品久久久久久久久| 一区二区三区欧美| 国产精品亚洲一区| 亚洲国产精品成人综合| 欧美国产视频在线观看| 亚洲午夜电影网| 久久天堂成人| 日韩一区二区免费看| 欧美一区观看| 亚洲国产精品久久久| 亚洲综合成人婷婷小说| 国产主播精品在线| 9久re热视频在线精品| 国产噜噜噜噜噜久久久久久久久| 亚洲电影免费在线| 欧美视频在线观看一区| 欧美一区二区三区在| 欧美精品日韩一区| 欧美一区二区啪啪| 欧美日韩999| 午夜视频在线观看一区| 欧美激情一区二区三区全黄| 亚洲欧美成人一区二区三区| 欧美成人免费一级人片100| 亚洲天堂av在线免费观看| 久久亚洲精品伦理| 中文日韩在线视频| 欧美成人dvd在线视频| 亚洲一区免费看| 欧美精品v日韩精品v韩国精品v| 亚洲一区二区三区影院| 欧美国产日韩一区二区| 午夜精品视频在线观看| 欧美日韩国产a| 久久精品免费观看| 国产精品每日更新在线播放网址| 亚洲经典在线看| 国产欧美在线看| 亚洲调教视频在线观看| 极品少妇一区二区三区| 午夜精品在线视频| 亚洲精品国产精品国自产在线| 久久精品在线| 亚洲一区三区电影在线观看| 欧美韩国一区| 久久黄色级2电影| 国产精品私房写真福利视频| 99re66热这里只有精品4| 精品91在线| 欧美在线在线| 亚洲一级免费视频| 欧美日韩的一区二区|