《電子技術應用》
您所在的位置:首頁 > 微波|射頻 > 設計應用 > 一種高性能32位移位寄存器單元的設計
一種高性能32位移位寄存器單元的設計
摘要: 本文給出了一種可用于32位以上CPU執(zhí)行單元的移位寄存器電路,并針對CISC指令集INTELX86進行了優(yōu)化(由于RISC指令集中移位類指令實現(xiàn)比較簡單,故沒有在文中討論);采用指令預處理的技術和通過冗余位,能很方便的實現(xiàn)帶進位標志CF移位和設置CF位,并使得每條移位指令的平均執(zhí)行速度為兩個指令周期。
Abstract:
Key words :

  1 引言

  隨著CPU設計位數(shù)與性能的不斷提高,對CPU 執(zhí)行單元中專用硬件移位寄存器的要求也越來越高。CPU移位寄存器的性能直接影響到所設計CPU 對移位類指令的處理能力和執(zhí)行速度。傳統(tǒng)結(jié)構的CPU中,移位寄存器的設計一般采用矩陣結(jié)構和樹狀結(jié)構。當CPU的位數(shù)達到32位,速度達到100M以上時,要在一個指令周期內(nèi)對32位的數(shù)據(jù)進行32 位內(nèi)任意移位,以前的設計方法已經(jīng)很難達到要求。曾經(jīng)有過對32位桶形移位寄存器的行為級描述,但其只適用于RISC指令集,并且作為CPU中的專用硬件為了達到功耗、速度和面積上的最佳,通常硬件電路采用全定制設計。

  本文給出了一種可用于32位以上CPU執(zhí)行單元的移位寄存器電路,并針對CISC指令集INTEL X86進行了優(yōu)化(由于RISC指令集中移位類指令實現(xiàn)比較簡單,故沒有在文中討論);采用指令預處理的技術和通過冗余位,能很方便的實現(xiàn)帶進位標志 CF移位和設置CF位,并使得每條移位指令的平均執(zhí)行速度為兩個指令周期。它有效地提高了CPU對移位類指令的執(zhí)行性能,并且作為一個基本的內(nèi)核單元能很方便地移植到不同指令集(RISC或 CISC)的CPU設計之中。

  2 32位CPU中執(zhí)行單元總體結(jié)構

  我們所設計的32位CPU的執(zhí)行部分采用雙總線結(jié)構,數(shù)據(jù)總線(Abus,Bbus)的寬度是32位。由于移位類指令如果用ALU進行實現(xiàn)的話,必然會耗費太多的CPU周期,為實現(xiàn)在一個指令周期內(nèi)對32位數(shù)據(jù)進行任意位的移位操作,因此有必要在執(zhí)行單元中設計專用硬件移位寄存器,在執(zhí)行移位類指令時由它進行32位數(shù)據(jù)的移位。

  圖1給出了32位CPU執(zhí)行單元總體結(jié)構數(shù)據(jù)流結(jié)構簡圖,并省略了所有控制信號。圖中Abus為雙向32數(shù)據(jù)總線,Bbus為單向32位數(shù)據(jù)總線。由于考慮到要實現(xiàn)INTEL X86系列所有的移位類指令(RCR,RCL,ROR,ROL等),所以移位寄存器在設計時采用雙輸入端,即實際該移位寄存器最大能實現(xiàn)64位移位。通過特殊的指令預設置方法,并通過增加冗余位實現(xiàn)標志位的設置。

32位CPU執(zhí)行單元總體結(jié)構數(shù)據(jù)流結(jié)構簡圖

  3 移位寄存器單元的設計

  3.1 矩陣移位器和樹狀移位器

  在CPU中移位寄存器單元的設計一般采用的是矩陣結(jié)構和樹狀結(jié)構的移位器。

  3.1.1 矩陣結(jié)構(Matrix Style)移位器

  它的結(jié)構為一傳輸門組成的陣列。行數(shù)等于操作數(shù)據(jù)寬度,列數(shù)等于最多能移位數(shù)如圖2所示(以4位舉例)。

矩陣結(jié)構移位器

  其中A3~A0是4位數(shù)據(jù)輸入線,sh3~sh0是 4根控制信號線。每次進行N位移位操作,對應的shN為高,其它控制信號為低。

  這種結(jié)構的優(yōu)點是:(1)數(shù)據(jù)傳輸?shù)乃俣瓤欤總€信號到達輸出端只經(jīng)過了一級傳輸,不受移位器位數(shù)限制;(2)版圖很規(guī)整。缺點是:(1)每根控制信號的負載太大,如32位移位器,每根信號線(sh0,sh1,……sh31)都要驅(qū)動32個開關管;(2)所需晶體管數(shù)目太多,如n位移位器所需晶體管數(shù)為2× n×n=2n2 (傳輸門部分采用CMOS實現(xiàn)),所帶來的功耗和芯片面積也會增加;(3)每一移位操作只需一根控制線為1,所以需輔以額外的譯碼單元。

  3.1.2 樹狀結(jié)構(Tree Style)移位器

  這種結(jié)構M位移位器所需的級數(shù)是log 2M每一級都由兩根信號線(shn和sh n#)控制數(shù)據(jù)的傳輸,數(shù)據(jù)在第i級要么移動2 i位或者不移動。 樹狀移位器如圖3所示。

樹狀移位器

  這種結(jié)構的優(yōu)點是:(1)晶體管數(shù)目少, n位移器所需晶體管數(shù)目為2×n×log n(傳輸門部分采用CMOS實現(xiàn)),版圖面積小于矩陣移位器;(2)控制信號shN~sh0本身就是二進制表示,不需要額外的譯碼單元。缺點是:數(shù)據(jù)通路所需經(jīng)過的開關管數(shù)目太多,M位移位器所需的級數(shù)是log 2M,因此導致延時太大。

  3.2 矩陣-樹狀結(jié)構移位器

  由上面的分析我們可以看出,如果所設計的處理器為16位以下CPU,那其移位器不管采用上述哪種方案都能達到要求,但當數(shù)據(jù)寬度到32位以上,從功耗,速度及版圖面積考慮以上方案的固有缺點就會顯得非常突出。在本設計中,移位寄存器的實際輸入為64位,為結(jié)合矩陣結(jié)構的優(yōu)點(速度快、版圖規(guī)整)和樹狀結(jié)構的優(yōu)點(晶體管數(shù)目少、譯碼簡單),我們在設計中采用矩陣-樹狀結(jié)構整個移位寄存器的是由雙總線輸入,即輸入64位,表1中列舉了不同級別比例的矩陣-樹狀結(jié)構所需晶體管數(shù)目(n1為tree的級數(shù),n2為matrix的控制線,n3為matrix中用的晶體管數(shù)目)。經(jīng)過綜合考慮,我們采用第2行的矩陣-樹狀級別比例,即矩陣部分最大能實現(xiàn)8位移位,樹狀部分最大能實現(xiàn)4位移位。

不同級別比例的矩陣-樹狀結(jié)構所需晶體管數(shù)目

  經(jīng)過各方面綜合考慮,我們所設計的移位寄存器的前級為矩陣結(jié)構部分(輸入數(shù)據(jù)為64位,控制信號8位),由這一部分形成一36位的數(shù)據(jù)送入下一級樹狀結(jié)構(輸入數(shù)據(jù)為36位,控制信號2位)部分再完成剩余的4位移位,形成32位輸出數(shù)據(jù)。結(jié)構簡圖如圖4所示。

 

結(jié)構簡圖

  在這個結(jié)構中,后級的樹狀移位器最高實現(xiàn)3 位移位。輸入的2bit信號為2進制碼,這兩位由移位計數(shù)器sh4~sh0直接將最低兩位送入(在后一節(jié)將介紹)。前級的矩陣結(jié)構完成64位輸入36位輸出,我們設64位數(shù)據(jù)輸入由Abus,Bbus提供,如圖5所示。每一小格代表4位數(shù)據(jù)。這64位數(shù)據(jù)送入矩陣移位器后,根據(jù)計數(shù)器的高三位sh4~sh2 進行譯碼對其進行4,8,12,16,20,24,28,32中的一種移位(對應8bits中的一位為高)。形成36位的數(shù)據(jù)輸出送入下級樹狀移位器以完成剩余位數(shù)的移位。36位數(shù)據(jù)輸出格式如圖6所示。其中COUNT表示總共移位數(shù)。

64位數(shù)據(jù)輸入格式

36位數(shù)據(jù)輸出格式

  4 指令的預處理及移位類指令的實現(xiàn)

  在我們設計的這片CPU中,需要對INTEL的 X86系列移位類指令進行兼容。因此移位寄存器單元需要在周圍譯碼和鎖存單元的配合下,要能在一個指令節(jié)拍內(nèi)實現(xiàn)ROL,ROR,RCL,RCR, SHL,SHR,SAR,其中RCL,RCR實現(xiàn)了帶標志位C的移位(指令說明見文獻[4])。因此需由處理器的控制單元在每類移位指令移位之前進行指令的預處理。

  4.1 移位寄存器單元總體結(jié)構

  最終設計出的移位寄存器單元總體結(jié)構如圖7 所示,其中其核心部分的矩陣-樹狀結(jié)構的移位寄存器就是使用上一節(jié)所描述的結(jié)構。記數(shù)器中的數(shù)據(jù)(sh4~sh0)在移位上一拍由Bbus寫入,并進行譯碼,其中低兩位(sh1,sh0)直接送樹狀結(jié)構移位部分,高三位(sh4,sh3,sh2)經(jīng)過譯碼產(chǎn)生8位控制信號送入矩陣移位部分。Abus和Bbus輸入鎖存器能鎖存32位數(shù)據(jù)輸入,并根據(jù)不同指令的要求進行操作,對指令進行預處理。移位結(jié)果送ALU輸出鎖存器,并對CF寄存器進行設置。

移位寄存器單元總體結(jié)構

  4.2 指令的預處理

  由于要對實現(xiàn)帶進位CF的移位并在移位操作后對CF進行設置,在一般情況下這需要CPU的控制單元提供多周期指令節(jié)拍來實現(xiàn)。在本設計中,將 Abus和Bbus輸入鎖存器設計為能根據(jù)不同的指令實現(xiàn)清0和帶CF左移一位或右移一位的操作,以便為移位做好數(shù)據(jù)上的準備,使輸入數(shù)據(jù)的0~32位移位能在一個指令周期內(nèi)完成。對不同的指令具體設置情況如圖8所示。圖中CF表示為進位標志位;len為操作數(shù)長度(如32位數(shù)據(jù)); n為移位數(shù);DATA表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)據(jù)本身; 0表示輸入鎖存輸出的數(shù)據(jù)為0;CF:DATA(-1)表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)帶CF右移一位;DATA(-1):CF表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)帶CF左移一位;SIGN_EXT表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)帶符號擴展。橫線下為移位前Abus和Bbus鎖存器中數(shù)據(jù)預處理完后的格式,橫線上方位移位完成后數(shù)據(jù)輸出及進位CF所處位置。

對不同的指令具體設置情況

  例:RCL AX , CL 指令

  設AX=0001H , CL="3" , CF=1

  Abus鎖存器輸出數(shù)據(jù)為操作數(shù)本0001H;

  Bbus鎖存器輸出的數(shù)據(jù)為操作數(shù)帶CF右移一位為1000H;

  在輸出中,CF在輸出結(jié)果的最左端為0。

  5 驗證及結(jié)論

  通過verilog的行為仿真及starsim的時序仿真顯示,性能完全符合要求。對比INTEL X86指令集中移位類指令標準執(zhí)行周期為4~7個機器周期,本設計移位類指令平均執(zhí)行時間為2個指令周期,因此大大提高了移位類指令執(zhí)行效率。移位寄存器作為CPU中執(zhí)行單元的專用硬件,其性能的好壞直接影響到CPU處理移位類指令的速度和效率。本文采用的矩陣-樹狀結(jié)構移位寄存器,配合指令預處理技術,能有效實現(xiàn)32位數(shù)據(jù)的移位操作,并兼容INTEL X86系列的所有移位類指令還可作為通用硬件方便地移植到其他指令級別的CPU設計之中。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉(zhuǎn)載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美在线你懂的| 欧美乱大交xxxxx| 亚洲日本电影在线| 久久精品电影| 性欧美暴力猛交另类hd| 亚洲午夜精品在线| 亚洲视频专区在线| 亚洲午夜精品17c| 亚洲婷婷国产精品电影人久久| 亚洲免费成人av| 日韩亚洲国产欧美| 99视频在线观看一区三区| 亚洲免费播放| 中国成人亚色综合网站| 亚洲婷婷国产精品电影人久久| 亚洲无限av看| 午夜精品一区二区三区在线播放 | 亚洲天堂av在线免费观看| 日韩亚洲精品视频| 亚洲视频福利| 亚洲欧美日韩国产精品| 欧美一区二区精品在线| 久久精品天堂| 日韩午夜电影av| 亚洲一二三区视频在线观看| 亚洲一区久久久| 久久精品国产91精品亚洲| 久热精品视频在线| 欧美—级a级欧美特级ar全黄| 欧美日韩第一区| 国产精品美女在线| 国产日韩精品视频一区| 在线观看欧美激情| 亚洲靠逼com| 午夜日韩视频| 亚洲三级电影全部在线观看高清| 在线亚洲国产精品网站| 午夜在线一区二区| 久久综合九色九九| 欧美日韩精品一本二本三本| 国产麻豆精品视频| 极品中文字幕一区| 日韩图片一区| 午夜在线精品偷拍| 亚洲人永久免费| 亚洲免费影视第一页| 久久久之久亚州精品露出| 欧美激情91| 国产伦精品一区二区三区视频孕妇| 精品不卡一区| 99国内精品久久久久久久软件| 性欧美1819sex性高清| 亚洲美女视频网| 欧美亚洲视频| 欧美成人精品1314www| 国产精品国产精品| 影音先锋亚洲视频| 亚洲天堂激情| 亚洲欧洲综合另类在线| 午夜亚洲福利在线老司机| 免费一级欧美片在线观看| 欧美午夜在线一二页| 国内外成人免费激情在线视频网站| 亚洲每日更新| 亚洲国产精品久久久久秋霞影院| 亚洲亚洲精品三区日韩精品在线视频| 久久在线视频在线| 国产精品黄色| 亚洲欧洲在线免费| 久久成人综合网| 亚洲综合色激情五月| 免费看的黄色欧美网站| 国产精品一区二区视频 | 亚洲一区中文字幕在线观看| 久久深夜福利免费观看| 国产精品久久久久久久久久免费看 | 亚洲特黄一级片| 美女主播一区| 国产视频亚洲精品| 亚洲美女毛片| 亚洲激情第一区| 欧美中文在线字幕| 欧美性猛交xxxx乱大交蜜桃| 亚洲国产91| 久久精品国产亚洲精品| 亚洲欧美日韩电影| 欧美三级视频在线观看| 永久91嫩草亚洲精品人人| 午夜精品久久久久久久久久久久久| 99re这里只有精品6| 久久综合给合久久狠狠狠97色69| 国产精品入口夜色视频大尺度| 亚洲人成网站999久久久综合| 亚洲成人资源| 久久精品国产99| 国产女优一区| 中文在线不卡| 亚洲制服少妇| 欧美性大战久久久久| 亚洲美女少妇无套啪啪呻吟| 亚洲精品国产欧美| 女人香蕉久久**毛片精品| 红桃视频亚洲| 欧美在线影院| 久久九九国产| 国产一区二区三区免费在线观看 | 久久国产88| 久久久精品一区二区三区| 国产日韩一区二区三区| 亚洲欧美日韩一区在线| 午夜精品区一区二区三| 国产精品无码永久免费888| 亚洲视频大全| 亚洲欧美综合v| 国产精品社区| 午夜精品久久99蜜桃的功能介绍| 亚洲欧美国内爽妇网| 国产精品久久久久久久久动漫| 亚洲视频在线二区| 欧美一区二区久久久| 国产九区一区在线| 欧美亚洲视频在线看网址| 午夜视频在线观看一区| 国产欧美日韩91| 欧美一区二区在线观看| 久久蜜桃精品| 在线视频国产日韩| 亚洲毛片播放| 欧美色欧美亚洲另类二区 | 久久成人国产| 麻豆久久婷婷| 亚洲日本视频| 亚洲一本大道在线| 国产精品日韩欧美一区二区| 亚洲欧美变态国产另类| 久久久久久亚洲精品杨幂换脸| 好看的av在线不卡观看| 亚洲精品美女免费| 欧美日韩午夜剧场| 亚洲一区二区在| 久久久久久久97| 亚洲国产成人不卡| 亚洲一区二区毛片| 国产精品综合视频| 亚洲高清免费在线| 欧美日产国产成人免费图片| 亚洲一区二区日本| 久久久综合激的五月天| 亚洲韩国精品一区| 午夜欧美精品| 狠狠色狠狠色综合| 在线视频精品一| 国产婷婷色一区二区三区在线| 亚洲国产精品一区二区www在线| 欧美精品乱码久久久久久按摩| 在线中文字幕不卡| 久久久国产一区二区三区| 亚洲激情在线观看| 亚洲欧美日韩另类| 一区二区三区自拍| 亚洲一区二区三区久久| 国产美女精品人人做人人爽| 亚洲国产欧美不卡在线观看| 欧美午夜不卡在线观看免费 | 亚洲第一精品福利| 亚洲欧美日韩天堂| 影音先锋日韩有码| 亚洲专区免费| 亚洲国产高清一区| 欧美亚洲一区二区在线| 亚洲激情自拍| 久久se精品一区精品二区| 亚洲欧洲日产国码二区| 欧美一区高清| 亚洲另类自拍| 久久男女视频| 这里只有精品在线播放| 老司机亚洲精品| 亚洲制服av| 欧美激情精品久久久久久大尺度 | 亚洲免费网址| 欧美日韩国产综合网| 久久国产乱子精品免费女 | 欧美一激情一区二区三区| 欧美精品www在线观看| 午夜精品美女久久久久av福利| 欧美另类一区| 亚洲电影免费观看高清完整版在线| 欧美视频日韩视频在线观看| 久久精品一本| 国产日韩欧美精品一区| 这里只有精品视频在线| 亚洲第一精品在线| 久久漫画官网| 亚洲欧美日韩天堂| 欧美小视频在线| 一区二区三区精品| 亚洲成人在线视频网站| 久久精品综合网| 亚洲欧美视频一区|