《電子技術(shù)應用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 基于SRT算法的單精度浮點除法器

基于SRT算法的單精度浮點除法器

2008-07-11
作者:劉志剛1,汪旭東1, 鄭關(guān)東2

??? 摘 要: 采用VHDL語言,在FPGA上實現(xiàn)了單精度" title="單精度">單精度浮點除法器" title="除法器">除法器的設計,通過采用SRT算法、SD表示法、常數(shù)比較法以及飛速轉(zhuǎn)換法,進一步提高電路的運算速度" title="運算速度">運算速度。使用NC-sim和Maxplus2仿真軟件進行前仿真和后仿真,使用Synplify進行邏輯綜合,采用EPF10K40RC208-3芯片,對除法器進行了仿真。
??? 關(guān)鍵詞: 除法器? SRT? 單精度浮點? 數(shù)字循環(huán)法? 仿真

?

??? 在語音通信、圖像處理等領(lǐng)域中,系統(tǒng)往往涉及大量的數(shù)據(jù)處理,而且數(shù)據(jù)計算精度和實時性要求很高,需要很高的浮點處理能力來提高系統(tǒng)的執(zhí)行效率。Soerquist等人[1]指出,在四種基本浮點運算中,浮點除法的執(zhí)行速度最慢,處理器執(zhí)行浮點加法和浮點乘法時,一般需要2~3個機械周期,而浮點除法則需要8到60個機械周期。然而,在浮點運算中浮點除法占的比例較小。Oberman和Flynn認為[2]在所有浮點指令中,浮點加法指令占55%,浮點乘法大約占37%,浮點除法大約占3%,與浮點加法和浮點乘法相比,浮點除法的比例很小。但是,這并不表示浮點除法對處理器性能的影響很小,在因為浮點指令阻塞等待而引起的處理器性能下降的因素中,浮點除法指令大約占40%,浮點加法大約占42%,浮點乘法大約占18%。由此可見,浮點除法雖然出現(xiàn)的頻率較低,但對處理器整體性能有較大的影響。因此設計一種執(zhí)行效率較高的浮點除法結(jié)構(gòu)對處理器性能的提高具有很重要的意義。
1 SRT算法的優(yōu)點
??? 在處理單精度浮點數(shù)時,處理除法器的算法主要有兩種:函數(shù)迭代法及數(shù)字循環(huán)法。由于函數(shù)迭代法所提供的商的最低位不準確,導致四舍五入操作無效,不能滿足IEEE 754標準對精度的要求,而且它不產(chǎn)生余數(shù),循環(huán)部分的執(zhí)行復雜性程度較高。Oberman和Flynn的研究[2]表明數(shù)字循環(huán)算法可以取得較好的延時和面積平衡。數(shù)字循環(huán)算法是以加法和減法運算為基礎的算法,需要多個循環(huán)周期,但是,該算法的實現(xiàn)比較簡單,所需的硬件面積較小,功耗也較小,非常利于芯片的設計。
??? 該算法的實現(xiàn)主要有三種方法:恢復余數(shù)算法、不恢復余數(shù)算法以及SRT[3](Sweeney,Robertson and Tocher)算法。傳統(tǒng)的除法器采用恢復余數(shù)算法或不恢復余數(shù)算法,但是這兩種算法的運算速度較低,每次循環(huán)僅能產(chǎn)生一位的商數(shù)字,需要較多的循環(huán)次數(shù)" title="循環(huán)次數(shù)">循環(huán)次數(shù)才能達到需要的指標。在每次循環(huán)時,恢復余數(shù)算法都需要將被除數(shù)或部分余數(shù)與除數(shù)進行比較,如果除數(shù)較大,還需要將部分余數(shù)恢復到上一次循環(huán)的數(shù)值。不恢復余數(shù)算法雖然不需要將部分余數(shù)恢復到原來的數(shù)值,但是商的數(shù)字集會出現(xiàn)負值,最后需要額外的加法器,將商的正數(shù)部分與負數(shù)部分相減。SRT算法是不恢復余數(shù)算法的擴展,具備了不恢復算法的優(yōu)點,而且每次循環(huán)可產(chǎn)生log2r位結(jié)果(r為基數(shù)),大大減少了循環(huán)的次數(shù)。基于SRT算法的優(yōu)點,并考慮到本除法器應用在自動語音編碼,本文所設計的除法器采用SRT算法進行除法運算。
??? SRT算法由下面的表達式來確定商和余數(shù):
???
??? d表示除數(shù);Pj+1表示第j次循環(huán)后的部分余數(shù);r表示SRT算法的基;qj+1表示第j次循環(huán)得到的商,qj+1的值由除數(shù)和部分余數(shù)組成的商數(shù)字選擇函數(shù)決定。最后的商為,最后的余數(shù)為:
2 單精度浮點除法器的設計
??? 本文是針對IEEE 754單精度浮點數(shù)據(jù)格式進行的浮點除法器設計。IEEE 754單精度浮點格式:A=(-1)s×M×2E-127,s表示符號位,E表示偏移碼,E-127表示階碼,M表示尾數(shù)。
??? 除法器運算操作分四步進行:
??? (1)確定結(jié)果的符號,對被除數(shù)和除數(shù)的符號位做異或操作。
??? (2)計算階碼,兩數(shù)相除,結(jié)果的階碼是被除數(shù)的階碼與除數(shù)的階碼的相減。
??? (3)尾數(shù)相除,采用SRT算法進行尾數(shù)相除,被除數(shù)和除數(shù)的實際尾數(shù)都是24位數(shù),即尾數(shù)實際為1.M,最高位1是隱藏位。
??? (4)結(jié)果格式化,將結(jié)果整合為單精度浮點格式的標準。
??? 在進行尾數(shù)部分處理時,雖然被除數(shù)和除數(shù)的實際尾數(shù)均為24位,但考慮到最后格式化以及商的數(shù)值的要求,實際上需要進行處理的位數(shù)為26位。因此,根據(jù)SRT算法公式,要使得循環(huán)次數(shù)減少,并且面積適中,必須選擇適合的基數(shù)。而且每次循環(huán)時都需要與除數(shù)進行比較,若26位數(shù)進行比較,則延時較大,必須選擇位數(shù)較少的數(shù)值代替26位的除數(shù)。為了適應自適應語音編碼對速度的需求,本文針對上述兩個需要進行時序改善的地方,設計了基4的SRT算法的除法器結(jié)構(gòu),如圖1所示。

???????????????????????????
2.1 基數(shù)的選擇
??? 考慮到部分余數(shù)以及基數(shù)實現(xiàn)的簡單性,本除法器選擇SRT算法的基數(shù)為2的冪次方。基數(shù)大小和所需的循環(huán)次數(shù)成反比,基數(shù)越大,實現(xiàn)除法所需要的循環(huán)次數(shù)越少。但是基數(shù)增加,會導致商數(shù)字選擇函數(shù)復雜性的提高,而且商數(shù)字選擇函數(shù)往往處在關(guān)鍵路徑上,其復雜度的增加無疑增加了每次循環(huán)的時間延遲。另外,大基數(shù)使得產(chǎn)生所有可能商的乘積的硬件電路變得復雜,增大了每個循環(huán)周期。因此,在實際應用中,SRT算法的基數(shù)一般限制在2或4。相比較而言,基4的性能較優(yōu),每次循環(huán)產(chǎn)生的位數(shù)為基2的兩倍,Oberman的研究[4]表明,基4除法的速度幾乎是基2除法速度的2倍,而且更有利于進一步優(yōu)化,降低整體的時間延遲。因此,在平衡面積和速度方面,本除法器的SRT算法選取基4,這樣可以用較小的面積消耗換取較快的速度。
2.2 商數(shù)字集
??? 由于SRT算法的基數(shù)選擇了4,因此,商的數(shù)字集不再是{0,1},而是{0,…,3}。在傳統(tǒng)的非冗余表示法中,商的每一位僅由一個正確的有效值表示,因此在確定每一位商數(shù)字時,需要將部分余數(shù)和除數(shù)進行完整的比較,即24位數(shù)的比較,效率較低。為了進一步提高除法器的運算速度,本除法器采用Avizienis[5]介紹的冗余商數(shù)字集SD,它是一種對稱的冗余表示法,商數(shù)字集表示為
≤a≤r-1,冗余因子。在確定每位商數(shù)字時,僅需要將部分余數(shù)和除數(shù)進行粗略的比較,不要求當前循環(huán)確定的商準確,可由下次循環(huán)修正,商的選擇余地較大,而且產(chǎn)生的所有可能商的乘積數(shù)目較少,可以簡化商數(shù)字選擇函數(shù)。對于基4來說,商數(shù)字集只有兩種選擇,最小冗余{-2,-1,0,1,2}和最大" title="最大">最大冗余{-3,-2,-1,0,1,2,3},Oberman的研究[4]表明采用最大冗余商數(shù)字集的商數(shù)字選擇函數(shù)速度比最小冗余的快20%,而且面積小50%,因此本除法器采用商數(shù)字集的最大冗余表示法。
2.3 商數(shù)字選擇函數(shù)
??? 商數(shù)字選擇函數(shù)的功能是從商數(shù)字集中有效地選擇出正確的商數(shù)字,它是除法器的核心。由于商數(shù)字集選擇了最大冗余,因此商數(shù)字選擇公式如下:
????qj+1=k∈{-3,-2,-1,0,1,2,3}
??? 如果d(k-1)≤rp[j]??? 由基4最大冗余的Robertson圖[6]可見(如圖2所示),部分余數(shù)的有效區(qū)域共分8個小區(qū)域,相鄰區(qū)域有部分區(qū)域重疊,每個商數(shù)字都有兩個區(qū)域與之對應,就是說允許商數(shù)字有兩個選擇,不正確的可通過下次循環(huán)進行糾正。但是,有效地判斷部分余數(shù)所在的區(qū)域,選擇比較接近的商數(shù)字,可以提高商數(shù)字選擇函數(shù)的執(zhí)行效率和實現(xiàn)的簡單性,因此必須選取合適的區(qū)域分界點。傳統(tǒng)的做法是通過PD曲線法來求得各區(qū)域的分界點,但是需要將部分余數(shù)和除數(shù)進行比較,24位數(shù)比較產(chǎn)生的時延較大,而且商數(shù)字選擇函數(shù)的實現(xiàn)比較復雜。為了簡化商數(shù)字選擇函數(shù),提高除法器的運算速度,本除法器采用常數(shù)選擇法,用常數(shù)來代替除數(shù)進行比較,將所需要進行比較的位數(shù)縮小,降低這部分引起的時間延時,而且實現(xiàn)起來比較簡單。其主體思想是把分解成若干個小區(qū)域,然后判斷除數(shù)的合適區(qū)域,再確定比較常數(shù)及每一位商數(shù)字所對應的區(qū)域,最后根據(jù)部分余數(shù)確定每一位商數(shù)字。常數(shù)選擇法如圖3[7]所示。
??? ?

???????????????????????????

???????????????????????????????

??? 根據(jù)最大冗余基4的商數(shù)字集,區(qū)域可以分成兩個小區(qū)域,相應的比較常數(shù)集分別為{-3/2,-1,-1/2,1/2,1,3/2}和{-2,-1,-1/2,1/2,1,2},這些比較常數(shù)就是每位商數(shù)字所對應區(qū)域的分界點。由所得到的兩個比較常數(shù)集可知,在確定商數(shù)字時,僅需要比較部分余數(shù)的高三位,而不需要比較24位,產(chǎn)生的延時較小,而且硬件實現(xiàn)比較簡單。
2.4 飛速轉(zhuǎn)換
??? SD表示的商數(shù)字集可以簡化商數(shù)字選擇函數(shù)的實現(xiàn),但是商數(shù)字集會出現(xiàn)負值,最后需要一個加法器,將商的正數(shù)部分與負數(shù)部分相減。24位數(shù)的相減,位傳遞產(chǎn)生的時延比較大,而且由于商數(shù)字的選取空間比較大,會出現(xiàn)最后余數(shù)為負的現(xiàn)象,需要對其進行修正。同時,商也需要進行操作,效率較低。較好的轉(zhuǎn)換方法是飛速轉(zhuǎn)換法[8],它采用移位的方法來完成SD表示的商數(shù)字集的轉(zhuǎn)換,而不采用相減的方法,這樣就不存在借位的問題,效率較高,可以降低時間延時。其轉(zhuǎn)換公式如下:
???
??? 當完成最后一次轉(zhuǎn)換后,需要根據(jù)最后余數(shù)的符號來選擇正確的商,如果最后余數(shù)為負,則商選擇qmi+1,否則商選擇qi+1,則最后余數(shù)的選取不需要進行修正。
3 除法器的仿真實現(xiàn)
??? 根據(jù)所設計的結(jié)構(gòu),編寫本單精度除法器的Verilog模型,在NC-sim進行前仿真,然后利用Synplify以Altera FLEX10K工藝庫的EPF10K40RC208-3芯片的參數(shù)進行綜合,最后完成的單精度除法器的規(guī)模為778個LUT,頻率為20.8MHz。在Max+plus2進行后仿真,輸入除數(shù)為424A8000(1.01×2127),被除數(shù)為3FA00000(1.10010101×2132),運算結(jié)果為42220000(1.010001×2132),余數(shù)為2F000000(0),時序圖如圖4所示,最后下載到芯片上運行。

????????????????????????????
??? 本文給出了單精度浮點除法器的設計,結(jié)合當前比較流行的SRT算法與飛速轉(zhuǎn)換法對除法器的關(guān)鍵部分進行時間延時的改善,具有高精度性及較寬的運算范圍,可以滿足自適應語音編碼的要求。
參考文獻
[1] SOERQUIST P,LEESER M.Area and performance tradeoffs?in floating-point divide and square-root implementations.ACM Computing Surveys(CSUR),1996,28(3):518-564.
[2] OBERMAN S,F(xiàn)LYNN M J.Division algorithm and implementations.IEEE transactions on computers,1997,46(8):833-854.
[3] HARRIS D L,OBERMAN S F,HOROWITZ M A.SRT?division architectures and Implementations.Computer systems
laboratory stanford university,1997.
[4] OBERMAN S F.Design issues in high performance floating?point arithmetic units.PHD thesis,stanford university,Electrical and electronic department,1997,1.
[5] AVIZIENIS A.Signed-Digit number representations for fast?parallel arithmetic.IRE transactions on electronic computers,EC-10:389-400,1961,9.
[6] WILLIAMS T E,HOROWITZ M.SRT division diagrams and?their usage in designing custom integrated circuits for division.Computer systems laboratory department of electrical?engineering stanford university.1986,10.
[7] NIKMEHR H.Architectures for floating-point division.The?university of adelaide australia.2005,8.
[8] JAMES E.S.Digital computer arithmetic datapath design using verilog HDL.Kluwer academic publishers.2004:108-112.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美视频| 亚洲国产91| 国语自产精品视频在线看| 欧美女同视频| 欧美激情第3页| 一本久久a久久精品亚洲| 亚洲第一偷拍| 欧美在线视频免费| 亚洲欧美精品在线| 亚洲一区二区日本| 一区二区三区四区在线| 亚洲精品视频一区| 亚洲国产午夜| 亚洲国产精品热久久| 一区二区三区在线高清| 欧美日韩久久精品| 欧美另类极品videosbest最新版本| 欧美中文字幕在线观看| 亚洲一区二区免费| 在线亚洲电影| 宅男噜噜噜66国产日韩在线观看| 国产精品久久777777毛茸茸| 欧美精品亚洲一区二区在线播放| 亚洲欧美国产精品专区久久| 在线一区二区三区做爰视频网站| 一区二区三区视频在线看| 亚洲精品国产精品乱码不99| 亚洲国产成人久久| 最新亚洲一区| 日韩午夜电影av| 一区二区三区欧美激情| 亚洲一区二区三区四区五区黄 | 欧美日韩国内自拍| 欧美国产视频在线| 欧美成人精品h版在线观看| 欧美va亚洲va日韩∨a综合色| 亚洲自拍偷拍麻豆| 亚洲欧美日韩在线一区| 欧美一区二区三区精品| 久久激情视频| 久久亚洲国产精品日日av夜夜| 一区二区三区**美女毛片| 99精品热视频| 亚洲尤物视频网| 久久久精彩视频| 欧美成人精品福利| 欧美区视频在线观看| 欧美jizz19hd性欧美| 欧美日韩在线观看视频| 国产精品电影网站| 国产免费亚洲高清| 在线看一区二区| 99这里只有久久精品视频| 午夜精品久久久久久久蜜桃app| 日韩午夜在线电影| 午夜精彩国产免费不卡不顿大片| 中文有码久久| 久久经典综合| 亚洲色图在线视频| 久久久不卡网国产精品一区| 欧美激情国产日韩| 国产视频一区欧美| 亚洲精品欧美激情| 香蕉久久夜色精品国产| 亚洲免费成人av电影| 欧美亚洲一区三区| 欧美激情一区二区久久久| 国产精品久久久久久av福利软件 | 久久久一二三| 欧美日韩不卡一区| 国产在线麻豆精品观看| 亚洲精品日韩欧美| 亚洲视频在线观看网站| 久久精品国产一区二区三区| 一区二区三区四区蜜桃| 午夜精品99久久免费| 亚洲最新在线视频| 午夜精品999| 美女91精品| 欧美日韩久久不卡| 亚洲第一精品福利| 亚洲视频在线播放| 亚洲人成绝费网站色www| 一本色道久久综合亚洲精品不 | 亚洲青涩在线| 亚洲性视频网站| 久久色在线播放| 欧美韩日一区| 精品不卡一区二区三区| 日韩亚洲欧美一区二区三区| 欧美一区二区国产| 99视频精品免费观看| 久久狠狠婷婷| 欧美色中文字幕| 在线不卡中文字幕| 亚洲自拍偷拍一区| 久久精品天堂| 久久国产精品72免费观看| 欧美人成在线视频| 国产在线精品成人一区二区三区| 欧美日韩三级视频| 国产中文一区| 亚洲视频香蕉人妖| 亚洲激情网站| 欧美专区18| 欧美日韩在线大尺度| 精品电影在线观看| 亚洲美女一区| 亚洲美女性视频| 久久久久久亚洲精品杨幂换脸| 久久精品一本| 欧美日韩国产探花| 精品动漫3d一区二区三区| 亚洲女同性videos| 一区二区三区国产精品| 久久永久免费| 国产欧美日韩一区二区三区在线观看 | 亚洲精品国产精品乱码不99按摩 | 欧美国产日韩免费| 国产精品日日摸夜夜添夜夜av| 国产精品久久中文| 亚洲国产精品国自产拍av秋霞| 亚洲国产日韩欧美综合久久| 午夜日韩激情| 亚洲免费在线观看视频| 欧美另类69精品久久久久9999| 欧美日韩影院| 亚洲国产高清一区二区三区| 亚洲欧美文学| 亚洲欧美日本伦理| 欧美日韩在线观看一区二区三区 | 国产精品理论片在线观看| 91久久久国产精品| 亚洲国产精品传媒在线观看 | 久久av二区| 欧美日韩国产限制| 亚洲人成网站在线观看播放| 亚洲黄色性网站| 久久亚洲二区| 国产欧美丝祙| 亚洲第一中文字幕在线观看| 久久久久88色偷偷免费| 国产亚洲欧美一区二区| 午夜精品一区二区三区在线视| 亚洲欧洲日韩综合二区| 欧美在线啊v| 国产一区二区三区成人欧美日韩在线观看 | 欧美xx69| 亚洲国产片色| 欧美一区二区三区在线观看| 午夜精品久久久久久99热| 国产精品久久夜| 亚洲淫性视频| 欧美亚洲免费高清在线观看| 国产情人综合久久777777| 亚洲欧美日韩综合一区| 久久精品免费观看| 红桃视频国产一区| 亚洲高清一区二| 免费一级欧美片在线播放| 在线精品视频一区二区| 亚洲高清在线视频| 欧美大片免费观看| 亚洲精品视频在线观看免费| 中文欧美在线视频| 国产精品观看| 午夜精品偷拍| 男人的天堂亚洲| 亚洲精品乱码久久久久久蜜桃麻豆| 欧美亚洲一区二区在线观看| 欧美在线999| 在线观看av一区| 夜夜爽99久久国产综合精品女不卡| 99综合电影在线视频| 欧美一级久久久| 国产精品嫩草99av在线| 亚洲电影av在线| 欧美日本三区| 夜夜爽av福利精品导航| 欧美一级艳片视频免费观看| 国产亚洲精品7777| 最新热久久免费视频| 国产精品美腿一区在线看| 欧美一区亚洲| 亚洲欧美日韩国产另类专区| 国产一区二区三区四区在线观看 | 久久国产精品99精品国产| 裸体一区二区| 99re6热在线精品视频播放速度| 久久国产精品色婷婷| 欧美超级免费视 在线| 亚洲高清视频一区| 亚洲一区精品视频| 国产一区二区三区四区老人| 亚洲精华国产欧美| 国产精品99免费看 | 91久久国产综合久久91精品网站| 久久av一区| 亚洲国产免费看| 久久国产黑丝|