国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

32位高性能嵌入式CPU中Load Aligner 模塊的設計與實現

發布時間:2010-6-8 14:46    發布者:看門狗
關鍵詞: Aligner
引言

一般的,在CPU中,訪問寄存器比訪問主存速度要快。所以為了減少訪問存儲器而花的時間或延遲,MIPS4KC處理器采用了Load/Store設計。在CPU芯片上有許多寄存器,所有的操作都由存儲在寄存器里的操作數來完成,而主存只有通過Load和Store指令來訪問。這樣做不僅可以減少訪問主存的次數,有利于降低對主存儲器容量的要求,而且可以精簡指令集,有利于編譯人員優化寄存器分配。Load Aligner就是數據存儲器(DCACHE)和數據通道之間的接口。所以設計出性能優良的Load Aligner對提高CPU的整體性能是非常重要的。本文介紹了在一款32位CPU中Load Aligner模塊的設計與實現,其中主要是數據通道部分的設計和實現。

設計目標

本設計中,Load Aligner模塊要實現的指令有LB、LBU、LH、LHU、LW、LWL、LWR。CPU通過這些指令把從數據存儲器中取出來的數據重新排序,然后放進寄存器堆RF中,進入CPU的數據通道。表1是對這些指令的介紹。



如果把從DCACHE中取出的一個32位的字表示成4字節:A、B、C、D,如表2所示。

31-24/  23-16/  15-18/  7-0
A       /     B    /  C     /   D

那么經過上述指令操作后,這個字被重新排列的結果(即Load Aligner模塊的輸出,也用4字節來表示)見表3。

表3中,s表示符號擴展,*表示這個字節上的寄存器中的數保持不變。不過在Load Aligner模塊,先將這些字節置0,在寄存器堆模塊再控制這些字節是否直接寫進寄存器。



以上是Load Aligner模塊要實現的指令目標,另外由于此模塊是CPU關鍵路徑的一部分,因此數據通道部分最長時延不能超過0.7ns。

邏輯設計

分析比較經過上述指令后Load Aligner模塊的輸入輸出變化可以看出:輸入字的每一字節經過Load Aligner模塊后可以在輸出字的任意字節位置上。換言之,輸出字的每一字節都可以有A、B、C、D四種情況。所以需要一個8位的控制信號Bit<7:0>來控制四個四選一的數據選擇器,稱為字節組合模塊,來獲得所需要的字節組合。不過,經過這個字節組合模塊選出來的4字節并不全是所需要的,還需要去掉冗余的字節或者進行符號擴展。因此需要有能夠產生符號擴展或者0擴展的模塊稱為符號產生模塊,然后把它的輸出和一個4位的控制信號Mask<3:0>一起控制一組二選一數據選擇器,稱為輸出模塊,來獲得最后的排序結果。邏輯實現流程圖見圖1。



以上是Load Aligner模塊數據通道部分的設計。它還需要有控制模塊來產生上述控制信號,此外由于任何一個控制信號都要驅動數據通道子模塊中的32個cell,所以還要有一個驅動模塊來使控制信號有足夠的驅動能力。由以上分析,整個Load Aligner模塊的框圖如圖2所示。其中,控制模塊采用自動布局布線生成,而驅動模塊和數據通道模塊均采用全定制設計。



功能驗證

對此模塊的RTL代碼和所設計的電路分別進行了功能驗證。設從DCACHE取出的32位數據用十六進制表示為AABBCCDD,對表3中的所有指令進行測試。圖3所示的波形圖就是依次測試指令LW、LH00、LHU00、LH10、LHU10、LB00、LBU00、LB01、LBU01、LB10等的結果。可以看出,結果與表3完全吻合。說明所設計的電路滿足設計目標,可以實現所要求的所有指令。



電路仿真

根據圖1可以看出,從符號選擇信號Sandz<4:0>到輸出的路徑為最長路徑,我們選取這條路徑進行仿真,并考慮在0.18μm時線電阻電容對時延的影響,用Hspice確定了所需器件的尺寸。仿真結果如圖4所示。上升時時延為0.52ns,下降時時延為0.47ns,均滿足小于0.7ns 的要求。


結論     

在CPU中,Load Aligner模塊是DCACHE和數據通道之間的接口。從DCACHE中取出的數據只有通過Load Aligner模塊重新排序,才能進入CPU的數據通道。在設計中應用了自上而下的設計方法,所設計的電路實現了所有的指令,在時延上也達到了設計目標。

參考文獻

1 李學干.計算機系統結構.西安電子科技出版社.2000
2 CMOS Circuit Design, Layout, and Simulation. R. Jacob Baker and Harry W. Li and David E. Boyce. The Institute of Electrical and Electronics Engineers, Inc. New York. 1998
3 Digital Logic Circuit Analysis & Design, by N. P. Nelson.1997
本文地址:http://m.qingdxww.cn/thread-12324-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 使用SAM-IoT Wx v2開發板演示AWS IoT Core應用程序
  • 使用Harmony3加速TCP/IP應用的開發培訓教程
  • 集成高級模擬外設的PIC18F-Q71家族介紹培訓教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿澤電子(Mouser)專區
關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 黑人异族日本人hd | 久久久国产高清 | 精品欧美小视频在线观看 | 一级毛片免费观看不卡的 | 欧美成人免费观看国产 | 日日射日日操 | 欧美日韩在线视频播放 | 岛国片在线 | 亚洲欧美综合在线观看 | 欧美成人三级网站 | 四虎网址在线观看 | 狠狠干快播 | 亚洲福利视频一区二区三区 | 国产女明星专区视频在线播放 | 狠狠色综合网站 | 日本另类视频 | 天堂一区二区在线观看 | 亚洲最黄视频 | 精品久久久久久乐 | 美国大片免费看 | 精品国产欧美一区二区最新 | 欧美亚洲欧美 | 九九热网 | 久久国产麻豆 | 欧美在线香蕉在线现视频 | 欧美区视频 | 四虎麻豆| 黄视频免费网站 | 看全色黄大色黄大片视频 | 色综合色综合色综合网址 | 手机在线看片国产 | 幻女free性zozo仙踪林 | 在线看片亚洲 | 日韩女同 | 精品不卡一区中文字幕 | 天堂中文在线观看 | 日日干日日操日日射 | 九九99久久精品影视 | 国产精品国产三级国产an不卡 | 69视频网| 青青精品 |