国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

一款32位嵌入式CPU的定點加法器設計

發布時間:2010-11-5 19:42    發布者:techshare
關鍵詞: 32位 , CPU , 定點 , 加法器 , 嵌入式
從CPU的指令執行頻率上看,算術邏輯單元、程序計數器、協處理器是CPU中使用頻率最多的模塊,而加法器正是這些模塊的核心部件,幾乎所有的關鍵路徑都與之有關,因而設計一種通用于這些模塊的加法器是整個CPU設計中關鍵的一步。為此,筆者根據32位CPU的400MHz主頻的要求,結合CPU流水線結構,借鑒各種算法成熟的加法器,提出一種電路設計簡單、速度快、功耗低、版圖面積小的32位改進定點加法器的設計方案。

1 設計思路

對于高性能CPU中使用的加法器,速度顯然是第一位的,所以考慮采用并行計算的方法,并且在電路的設計上采用少量的器件來獲得速度上的巨大提升。從面積角度出發,鏈式進位加法器(Ripple-Carry Adder)的器件最少,面積最小,版圖工作量也最小,可是由于加法器的高位進位要等待低位的運算結束后才能得到,所以沒有辦法在速度上達到要求。鑒于此,采用類似于鏈式加法器的結構。

首先從進位選擇加法器(Carry-Select Adder)得到提示,將32位加法器一分為二,分為低16位加法器和高16位加法器,再將低16位加法器的進位輸出作為選擇信號,用于選擇高16位加法器的和及第27位的進位輸出(這個進位輸出要在溢出邏輯判斷中使用,而普通的加法器則不用產生進位)。通過這樣的處理,將一個32位的加法器簡化就成了兩個16位的加法器,如圖1所示。




另外,從超前進位加法器(Carry-Look-Ahead Adder)獲得提示,在超前進位加法器中引入中間變量G和P用于加速進位鏈的速度。而G和P在邏輯表達式上與前一級的進位無關,只與每一級的操作數輸入有關,而且它們又是構成本級進位的必要部分。在微處理器的數據通道上,數據傳輸是并行進行的,即兩個32位操作數幾乎同一時間到達加法器。所以,G和P不論是加法器的最低位還是加法器的最高位,幾乎都可以在相同的時間內得到,因而在進位鏈上就可以借鑒這個特點加速進位的傳遞。以一個四位加法器為例,有如下的邏輯推導過程:



令上式中P1P2P3P4為Pgroup,G1P2P3P4+G2P3P4+G3P4+G4為Ggroup,如果將32位加法器劃分為若干的小塊,則每一個小塊都可以有自己相對應的Ggroup和Pgroup。由此可知對于整個加法器的時延來說,關鍵路徑的時延總值可以由三部分組成:①產生Ggroup和Pgroup的時延;②進位傳遞邏輯上的器件時延;③加法器進位鏈上的導線時延。對于這三類時延,時延①與時延(②+③)存在重疊的部分,于是使這兩類時延合理銜接,可以使得進位鏈上的邏輯級數最小,從而使得電路上的傳輸時延達到最小。

2 具體實現

2.1 4位加法器模塊的實現

在具體的電路設計中,先將32位數據通道劃分成了高低兩部分,然后以4位為單元劃分成更小的模塊。這些模塊在結構上是基本一致的,但在功能上要完成本模塊四組操作數(A[k:k+3]和B[k:k+3])與進位Ck的加法運算,并要產生模塊的中間變量Ggroup和Pgroup的運算。

對于單一的每一位,定義它的G和P分別為:Gi=AiBi, Pi=Ai⊕Bi,加法器的和SUMi=Ai⊕Bi⊕Ci-1=Pi⊕Ci-1,考慮到器件的實際驅動能力,結合加法器的另一個功能——減法運算,設計出如圖2所示的帶減法功能的一位加法器電路。




設計的4位加法器進位鏈如圖3所示,除C0外,輸入(i和i)都是由圖2的一位加法器產生的,所有4位進位鏈Ci都按超前進位加法器連接方式直接接入相應位置。由此可以看出,進位信號到達各位的邏輯級數是相當的,只要在進位信號到達之前使所有的中間信號i和i都能及時產生,就能及時得到每一位的和(SUM)。





圖4是產生4位加法器塊進位及塊的Ggroup和Pgroup信號的電路。借鑒于超前進位加法器的傳遞邏輯電路,可知并不是所有的4位加法器都需要向它的下一個模塊傳送進位信號,而只要產生傳遞進位所需的Ggroup和Pgroup信號即可。而有些位置,由于進位鏈設計的實際需要,只需要利用4位加法器模塊產生的進位信號,而不必采用傳遞邏輯產生的進位信號,具體的情況還是有區別的。為了充分利用圖3中產生的相關信號的復用,在進位信號C4的產生電路部分,進位鏈方向上的邏輯級數只有兩級,可以說還是比較簡單了。可是,綜合前面所談到的4位加法器的電路,可以發現有一些中間信號(i和i)的負載是不均衡的,如2的負載比3或4要重很多。所以在設計的時候,如果考慮到盡量降低版圖的復雜程度,就要在面積上做出適當的犧牲,盡量以最大負載進行考慮,使得器件的設計符合時延上的要求;同時還要充分考慮到在深亞微米工藝條件下導線的時延問題,即設計的電路不但要考慮到所承受的器件的負載,而且還要結合版圖設計中實際的導線負載,定出上述電路的合理尺寸。




2.2 傳遞邏輯電路實現

完成上述基本4位加法器的電路設計后,要構造一個完整的32位加法器還需借助于傳遞邏輯電路。傳遞邏輯電路可以對4位加法器模塊的進位進行傳遞,也可以對由兩個4位加法器模塊組成的8位加法器模塊的進位進行傳遞。對于8位加法器模塊,由于低4位的進位可以表示為C4=C0Ggroup+Pgroup,則8位加法器模塊的進位為:



由此可以設計出如圖5和圖6所示的兩種進位傳遞邏輯電路。






2.3 溢出邏輯電路實現

設計中還采用了判斷溢出的方法。當兩個有符號數進行加減法運算時,若最高的數值位向符號位的進位(本設計中的C30)值與符號位產生的進位(本設計中的C31)輸出值不同,則表明加減運算產生了溢出。

由上述可知,加法器時延的關鍵路徑在進位鏈上,而進行溢出判斷所需要的信息C30與C31都在這條路徑上。于是采用類似于進位跳位加法器(Carry-Skip Adder)的辦法,使得低位的進位快速跳位到高位,使C30與C31快速產生。具體實現如下:

①溢出的邏輯表達式推導

由于Overflow=(C30⊕C31)·Overflag(Overflag表示當前ALU加法器進行有符號運算),需要進行溢出判斷(它是ALU控制模塊在譯碼階段產生的,在指令執行階段起始段就輸出到數據通道,所以它不在關鍵路徑上)。



顯然,分式(1)是和進位鏈無關的一部分,可以在每一個流水線的指令執行階段起始段很快得到,而分式(2)則是和進位鏈有關的部分,其具體邏輯值將取決于進位C27的值。分式(1)中高位的Gi和Pi都可以在進位C27到來之前預先得到,只要C27一到就可以進行邏輯判斷,得到相應的邏輯。



②溢出邏輯電路實現

根據式(3)的邏輯表達式,可設計出加法器溢出邏輯產生電路,如圖7所示。



設計得到的32位加法器在SMIC流片后,經測試,運算速度在400MHz以上,滿足設計要求,為后續浮點加法器的設計提供了很好的鋪墊。
本文地址:http://m.qingdxww.cn/thread-36851-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 使用SAM-IoT Wx v2開發板演示AWS IoT Core應用程序
  • 使用Harmony3加速TCP/IP應用的開發培訓教程
  • 集成高級模擬外設的PIC18F-Q71家族介紹培訓教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 国产成人精品日本欧美动漫 | 成人午夜免费观看 | 狠狠色丁香婷婷综合久久来 | 久热中文字幕精品视频在线 | 毛片免费全部免费观看 | 最近中文字幕2019 | 亚洲综合激情视频 | 好男人官网在线手机免费观看 | 牛牛在线 | 六月婷婷色 | 激情五月婷婷久久 | 婷婷四房播客五月天 | 日本精品一区二区三本中文 | 91婷婷色| 男女免费视频网站 | 精品四虎免费观看国产高清午夜 | 五月天婷婷精品视频 | 九九视频精品在线 | 亚洲不卡视频在线观看 | 99精品国产三级在线观看 | 欧美一区二区三区在线观看免费 | 无限视频免费观看网 | 国产成人精品日本亚洲专一区 | 天堂网2021| 国内精品久久久久久久97牛牛 | 国产福利在线观看永久视频 | 中文在线视频 | 日韩在线中文 | 美国一区二区 | 亚洲性爰视频 | 欧美视频在线免费看 | 成品人app软件大全免费下载 | 99在线观看视频免费精品9 | 国产一区二三区 | 成人黄色在线观看视频 | 四虎性| 狠狠色伊人亚洲综合第8页 狠狠色网站 | 天天噜噜揉揉狠狠夜夜 | 国产精品老牛影视 | 九九热精品免费观看 | 国产三级91|