国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

基于XC166單片機的DSP優化方法

發布時間:2010-9-2 09:42    發布者:techshare
關鍵詞: dsp , XC166 , 單片機
與專用數字信號處理器(DSP)相比,英飛凌的C166單片機的DSP性能相當差,為了提高C166單片機的DSP處理能力,英飛凌推出了新的16位單片機系列XC166,XC166系列單片機與C166單片機的最主要的區別在于,XC166中的CPU核加入了乘法-累加(MAC)單元,用于提高DSP的功能。MAC單元在XC166中是以一個算法處理單元出現的,類似于CPU中的算術邏輯(ALU)單元。這種結構的優點是可以保持XC166與C166的兼容性。  

MAC單元有自己的尋址模式和指令集,MAC指令集是專為開發DSP程序而設計的。獨立的尋址模式是為了保證MAS指令能在1個機器周期內完成對2個操作數的間接尋址。與XC166中的一般尋址模式不同,MAC尋址模式有2個地址指針(IDX0/IDX1)及2對地址偏移指針(QX0/QX1,QR0/QR1)用于對雙操作數尋址。另外,單機器周期的MAC指令還要求MAC單元具有Harvard結構,也即代碼與數據獨立尋址。但英飛凌的16位單片機的存儲器地址都是線性的,采用的是Von Neumann結構,代碼與數據在一個線性存儲空間。為了在線性空間中實現Harvard結構,XC166專門把MAC指令的兩個操作數中的一個定義在DPRAM中,所以,在使用MAC單元時要特別注意,有些操作數只能存在DPRAM中,否則,指令無法正常運行。目前,XC166系列單片機配有2KB的DPRAM,從地址0xF600到0xFDFF。  

由于硬件的要求,XC166單片機的指令流水線存在著不可避免的阻塞現象,MAC單元指令也一樣。盡管在硬件設計時已經采用了專用模塊來減少阻塞,但有些阻塞是不可避免的,從程序優化的角度來說,可以充分利用指令流水線阻塞現象,通過重排指令流水線上的指令,消除阻塞,以使得程序的運行時間縮短,從而達到優化的目的。  

通常DSP優化方法可以分為兩類:一類是與芯片相關的,另一類是與芯片無關的。與芯片無關的優化方法獨立于單片機硬件,適用于所有單片機及DSP處理器,下面根據使用XC166單片機的經驗總結一些優化DSP程序的方法。  

1 通用優化方法

1.1 數據組處理

數據組處理的基本思想是通過成組的處理數據,以節約每次調用處理子程序所需的附加指令。數據組處理可以在C語言或匯編語言程序中實現。一般而言,對于開發DSP程序,最常用的程序語言為C和匯編。下面分別介紹如何在C和匯編程序中使用數據組處理優化方法。

(1)C程序  

在C環境中開發DSP程序,通常算法本身由匯編編寫,以便優化實現。C主程序通過調用匯編實現的核心處理子程序來完成對數據的處理。核心處理子程序有兩種實現方法,一種是數組處理,另一種是單值處理,假設單值處理子程序的核心部分與數組處理子程序的核心部分所需機器周期相同,并且調用子程序的前期處理需M個機器周期,后期處理需要N個機器周期,如果子程序被調用K次,那么理想情況下,數據組處理可以節約(K-1)(M+N)個機器周期,如圖1所示。  




(2)匯編程序

在匯編程序中實現數據組處理有多種方法,比如數組操作,數組讀入/寫出等。  

1、數組操作。數組操作是將多個不同的短操作數裝入一個長位數的寄存器,然后進行運算操作。比如,1個16位的寄存器可以裝入2個8位的來自A/D轉換器的數據。下面舉例說明數據組處理在匯編程序中的應用。



2、數組讀入寫出。這種方法是將多個短操作數合并為一個長操作數后進行讀入/寫出操作,如上面例子中的輸入/輸出部分。

1.2 數據存儲器交織

數據存儲器交織的目的是通過重新排列數據在存儲器中的位置,以使得程序讀寫數據的時間最短,比如有2個8位的復數x和y,一般情況下,復數將按下列順序存入內存:real(x),image(x),real(y),image(y)。但如果想使得讀取復數的實部更容易,可以把數據重新排列如下:real(x),real(y),image(x),image(y),如圖2所示。  
  



1.3 循環展開

循環展開是一種非常傳統的程序優化方法,可以用于所有程序優化中,循環展開的目的是通過重復循環中的程序,減少循環次數,從而減少循環判斷指令的執行次數,以此來降低程序執行所需的機器周期,下面舉一個例子來說明循環展開在XC164CS單片機中的應用。





1.4 指令流水線重排

指令流水線重排的意思是通過軟件程序中的指令重排來改變指令流水線,以此來排除由于硬件引起的指令堵塞,從而加快程序的運行時間。這種優化操作通常用在匯編程序中,指令流水線重排是一個一般的優化原理,把這個原理用于不同類型的單片機可以導出不同的與單片機硬件相關的優化方法。下面介紹的基于XC166單片機的優化方法主要是應用這個優化原理得到的。  

2 與芯片相關的優化技術

2.1 XC166指令流水線

XC166單片機指令流水線共有7級,前兩級為取指令流水線,后5級為執行流水線,所有指令都必須經過5級執行流水線的每一級。  

第1級--指令預取。這一級根據預測順序,把指令從程序管理單元(PMU)取出,取出的指令在跳轉檢測單元進行前期處理,以檢測是否有跳轉,預測邏輯決定是否接收轉移。  

第2級--取指令。根據轉移預測規則計算出下一條被取指令的指針。對于零機器周期轉移,轉移合并單元先預處理,并將檢測到的轉移與正在執行的指令結合起來。預取出的指令存在FIFO緩存器中,同時,下一條要執行的指令輸出FIFO緩存器,進入執行流水線。  

第3級--譯碼。指令被譯碼,如需要,在間接尋址模式中,寄存器文件將被訪問,以讀取通用寄存器GPR。  

第4級--尋址。計算所有操作數地址,對于所有隱含訪問系統堆棧的指令,堆棧指針遞減或增加。  

第5級--存儲。所有需要的操作數被取出。  

第6級--執行。使用已取出的操作數進行MAC單元操作。對于非MAC單元指令,在這一級中,指令將由算術邏輯單元(ALU)執行。條件標志被更新,執行所有直接對CPU特殊功能寄存器CPU_SFRs進行寫操作的指令,在間接尋址時,作為地址指針的GPRs自動遞減或增加。

第7級--寫回。所有外部操作數以及剩余的,在內部DPRAM空間內的操作器被寫回。定位在內部SRAM中的操作數進入寫回緩沖區。  

下面給出一個具體例子:






上面程序的指令流水線如表1所列,(Tn表示機器周期)

2.2 數據相關性排除

在XC166的CPU中,由于指令流水線的設計要求,在使用通用寄存器(GPRs)的指令之間存在一些數據相互依賴的情況,盡管XC166單片機已經使用了專用硬件來檢測及解決數據相關性,但仍然有一些不可避免的數據相關性。在編程時,可以充分利用數據相關性來達到程序優化的目的,比如,在用GPR作為間接尋址指針時,如果PGR中的地址值被改變,間接尋址操作必須等待2個機器指令周期后,才能使用GPR作為地址指針尋址。在這種情況下,可以在這2個等待機器周期內插入2條其他單機器周期指令,充分利用這2個周期的等待時間以便程序更優化。  

下面舉一個例子:



另外一種數據相關性發生在間接尋址訪問內存時,XC166單片機中的地址產生單元使用推測原理,在地址譯碼前,數據的讀取路經將根據歷史記錄表中選出;在歷史記錄表中,每個GPR都有一個入口。這些入口記錄了用相應GPR所訪問的內存空間情況。如果這種預測發生錯誤,讀取操作必須重新開始。

因此,如果用GPR作為間接尋址,GPR最好能指向相同內存空間。如果更新后的GPR指向不同內存空間,下一個操作將出現訪問錯誤,讀操作必須重復,這就產生了指令流水線堵塞。例如:



2.3 內存帶寬沖突排除

如果在流水線上的指令在同一時間訪問同一內存,就會發生內存帶寬沖突,MAC單元的CoXXX指令是特別為實現DSP設計的。為了避免在DPRAM中發生帶寬沖突,CoXXX指令的其中一個操作數必須放在SRAM中,以保證在單個機器周期內執行MAC單元指令。例如:



2.4 指令重排

在用MAC單元指令編程時,經常要改變MAC單元的特殊功能寄存器,比如IDX0,IDX1、QX0、QX1、QR0以及QR1等,在XC166單片機中,有一些指令將會阻塞在譯碼階段,如果這些指令正好在一條修改特殊功能寄存器(SFR)指令之后執行,這種阻塞將引起3個機器周期的延時。

這些指令包括:  

◇使用長地址模式的指令;
◇使用間接尋址的指令,除JMPS和CALLI外;
◇所有MAC單元指令(CoXXX指令)。

為了避免指令阻塞,在使用上述指令時,如有阻塞情況發生,應該重新重排指令,以消除延時,例如:



3 結論

用于英飛凌XC166單片機的DSP優化技術分為兩類:與硬件相關的優化技術和獨立于硬件的優化技術。獨立于硬件的優化技術也可以用于其他的單片機或專用數字信號處理器。
本文地址:http://m.qingdxww.cn/thread-25163-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 使用SAM-IoT Wx v2開發板演示AWS IoT Core應用程序
  • 使用Harmony3加速TCP/IP應用的開發培訓教程
  • 集成高級模擬外設的PIC18F-Q71家族介紹培訓教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿澤電子(Mouser)專區

相關在線工具

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 国产欧美一区二区 | 亚洲国产精品欧美日韩一区二区 | 日韩精品国产自在久久现线拍 | 亚洲欧美综合乱码精品成人网 | 亚洲高清国产一区二区三区 | 精品欧美视频 | 欧美视频在线观 | 色婷婷精品 | 91在线综合 | 成人午夜亚洲影视在线观看 | 国内精品视频在线播放 | 国产成人久久精品二区三区牛 | 青青草操| 国产成人毛片亚洲精品不卡 | 亚洲第一成年免费网站 | 欧美性色欧美a在线播放 | 日日夜夜狠狠 | 两个人免费观看高清在线 | 亚洲一区中文字幕在线观看 | 日日操日日插 | 亚洲欧洲色 | 麻豆精品视频在线观看 | 99久久精品费精品国产 | xx色综合| 日韩高清dvd | 欧美日韩大尺码免费专区 | 国产欧美日韩亚洲 | 内地精品露脸自拍视频香蕉 | 日本视频在线免费播放 | 日本精品久久久久中文字幕 1 | www.日本在线| 青青在线精品2022国产 | 欧美自拍区 | 日本不卡高清视频 | 99国产精品热久久久久久夜夜嗨 | 天堂在线观看视频 | 尤物国产在线精品福利一区 | 日韩日韩日韩日韩日韩 | 欧美精品在线看 | 亚洲一区二区三区四区在线观看 | 欧美在线视频a |