1. 8051與AndesCoreTM 本文將介紹使用8051與AndesCore?差異事項,并對兩種CPU系統相關事項做說明,后面再介紹從 8051移植到AndesCore ?上注意事項,舉中斷向量表及異常處理函數的例子說明差異及移植,最后簡要介紹AndesCore?在MCU應用的三款CPU: N705,N801 和N968A。 2. 8051與AndesCore常見差異事項 2.1. 位寬的差異 位寬是指處理器一次執行指令的數據帶寬。8051 是8 位寬的處理器, 而AndesCore?是32位寬的處理器,支持32位與 16位的混合指令集,位數越寬,在數據的處理方面就更有效率。 2.2. 指令差異 8051 匯編語言共有111 條指令集,AndeStar?的V3m指令集有 157 條,AndeStar?的V3指令集有 200 多條,兩種 CPU的指令集大概可以分為以下幾類:算術運算,如加,減,乘,除等操作;數據傳送,如數據在寄存器,內存間的傳送,賦值等;邏輯跳轉,如函數呼叫,無條件跳轉,條件跳轉,中斷返回等;在AndesCore ?中還有特權模式的指令部分,關于兩種指令集的具體差別,可以分別參考對應的指令集介紹文檔。 2.3. 地址空間映射差異 AndesCore?使用memory map 方式映射地址空間,主要有兩種,內存的空間映射,如其中的RAM或ROM地址,它們用于存放程序運行時的代碼和數據,在AndesCore?上代碼在link 后,程序運行的代碼和數據地址會最終確定,Andes 提供了一個簡便的 link script 工具sag ,可以很方便的對系統中可用的內存空間進行分配設定。 另一個是外設所對應的地址空間,可以通過查看SoC 對應的手冊了解對應的外設映射的空間范圍及相應的使用方法。 2.4. 堆棧設置差異 8051的堆棧的起始位置是固定的(部分衍生 8051可以做程序設定),它通常固定在片內的RAM中,8051 內存空間有限,非常小,程序中所使用的變量存放于特定的數據空間中,并不會放在堆棧空間,所以在 8051中所需要的堆棧空間很小。而對于 And esCore?來說,堆棧可以設置在任意合適的 RAM上。程序運行時所有的局部變量都存放在堆棧中,只需要確保在設計系統的時候有足夠的堆棧空間。在 AndesCore?中有$ sp寄存器表示棧頂位置,這需要在系統上電或者是系統reset 后初始化時進行設置。 2.5. 代碼和數據的存儲差異 在8051 系列單片機中,數據存儲區可以分為內部數據存儲區以及外部數據存儲區。 內部數據存儲區有幾個區別:data ,bdata,idata。 data : 片內RAM直接尋址區。bdata: 片內RAM位尋址區。idata: 片內 RAM間接尋址區。 外部數據存儲區又有:xdata,pdata。 xdata 和pdata:是外部存儲區,有些芯片會帶有 XRAM 。 在有些開發工具中,如K eil,可以通過設置存儲模式來處理,存儲模式決定了默認的存儲器類型, 此存儲器類型將應用于函數參數, 局部變量和定義時未包含存儲器類型的變量。 SMALL 所有的變量存放在片內 RAM(data 區間) COMPACT 所有的變量存放在外部存儲區(pdata 區間) LARGE 所有的變量存放在外部存儲區(xdata 區間) AndesCore?以內存映射的方式,內存空間不會有特別的限制,就是說不會像8051那樣需放在某處區間,這樣的設計更方便靈活,允許程序代碼和數據在可用的空間里自由放置。 有時候需要將某段代碼或者數據存放在指定的位置上,在8051 中,可以在代碼中使用"at" 關鍵字,但該關鍵字是 8051 中所特有的,會造成可移植性和維護的問題,在 AndesCore?上,提供了一種簡便的 link script 工具,如上所提到的sag 工具,在 C 代碼中使用GNU標準的語法格式,在 link 之后相應的代碼和數據將存放于指定的位置,這樣可以避免在代碼中使用"at" 該平臺相關的屬性設置。 2.6. 數據類型及對齊差異 8051和AndesCore ?是不同類型的CPU,它們所使用的數據類型所對應的寬度也不同,如下表所示: 在鏈接完成后數據通常都會按照本身的屬性對齊,比如int 類型則會4 bytes對齊,short則會2 bytes對齊。這樣的存放方式可以提高 CPU對數據讀取時的效率。雖然AndesCore?是32bit的CPU, 在只需要8bit 和16bit的數據時能節省存儲空間,但在處理16bit 和32bit的數據上則有更高效。 在8051中有sbit 關鍵字用于設置對特殊功能寄存器 SFR的直接訪問,8051的特殊功能寄存器分布在內存地址0x80到0xFF處,如下表: sbit 是8051擴展的變量類型,非標準 C 語法,移植的時候需要將其修改成標準C 操作語法,另外在AndesCore?中,所有的寄存器都是單獨存在的,不會占用內存的空間。 2.7. 指針使用差異 8051中兩種類型的指針,分別是存儲器指針和通用指針,通用指針由3 個字節組成,第一個字節用來指明對應的內存類型,所以這種類型的指針類型占用空間更大也更慢,存儲器指針只能用來訪問指定類型的存儲器空間。 而在AndesCore?上指針不會有這方面的限制,它是一個 32bit的數據,普通的寄存器就可以存放指針內容,可以訪問到系統4G 范圍內的空間(N705,N801地址空間只有 16M,N968A以上的 CPU地址空間可達4G)。 2.8. 函數聲明差異 在8051中由于堆棧空間有限,如果有函數是可重入的,需要在函數聲明的時候用關鍵字reentrant 做說明。8051 的中斷處理函數則需要使用關鍵字interrupt 聲明,中斷處理函數有時也需要用 using 關鍵字指明哪一寄存器組會被使用到。 在AndesCore?中,都采用標準的 C 語法,在聲明函數時并不需要這些附加的聲明。AndesCore?遵行底層的ABI 機制,編譯器處理底層的寄存器及堆棧相關機制。對于上層用戶來說是透明的。 3. 系統相關事項說明 3.1. 操作模式 8051只有一種mode,AndesCore?有兩種mode,分別是 superuser mode和user mode ,當系統上電啟動時是在 superuser mode,或者當系統進入到中斷或者異常時也進入到superuser mode,當從中斷或者是異常返回后,會返回到user mode 。由于8051沒有mode切換的問題,所以在移植的時候只需要理解AndesCore?在mode方面的機制就可以。 3.2. 系統的啟動 8051和AndesCore ?的系統啟動過程類似,通常在0 地址存放中斷向量表,第一個向量表是reset,當系統上電或者是reset 后,經過該向量會跳轉到一個啟動函數中,該啟動函數會完成系統啟動所必要的步驟,比如設置CPU,初始化SoC ,清理內存,初始化 C 運行環境等, 最后完成所有的準備后跳轉到 main函數。 3.3. 中斷處理 8051有5 個中斷源,通常中斷向量表只是一個跳轉,會跳到真正的中斷處理函數,8051只能設置成兩級的中斷優先級。 AndesCore?包含了9 個內部異常,中斷向量號對應于從 0 到8, 9 之后對應于外部中斷,在Internal VIC (IVIC )mode時可支持32個外部中斷, 當External VIC(EVIC) mode時由外部中斷控制器決定, 最多有64個。 中斷的處理由以下幾部分組成: 1. 實現中斷處理函數 可以用匯編實現8051 的中斷處理函數,也可以用C 來實現,在8051中C 實現的中斷處理函數會有一個"interrupt" 的關鍵字,如果有寄存器 bank被使用到,還要加上"using"關鍵字。如果要將中斷處理函數固定在特定位置還需要使用"at" 關鍵字,而 AndesCore?使用的是標準的 C 語法,不需要為中斷處理函數做這些設置。 2. 中斷向量表的產生 8051 中斷向量表擺放在 0 開始的位置,在AndesCore?中硬件可以設定啟動地址,通常設為 0 地址,也可以是非 0 地址,中斷向量表存放在對應系統啟動地址處。在程序編寫過程中可以通過標準的gnu 語法再加上link script 的sag 工具,以使產生的中斷向量表在鏈接的時候存放于特定的位置。 3. 中斷配置 在8051中,需要做以下設置 1. IE 寄存器中Individual Interrupt Enable 位設1 2. IE 寄存器中EA(Enable All)位設1 3. 當是外部中斷時,配置相關的pin 為輸入,并設置對應的觸發屬性為edge或level 觸發。 而在AndesCore?中需要做以下設置: 1 .設置CPU IVIC 或者 EVIC mode 2 .設置INT_MASK位 3 .設置中斷的優先級 4. 關于異常處理差異 在8051中沒有異常處理向量,所以在8051中并沒有這部分的處理函數,在AndesCore?中有一些系統的exception 中斷向量,比如Machine Error,GeneralException, 建議在AndesCore ?上實現對應的處理函數, 當發生這類異常時做一些基本的處理。 3.4. 時序和延遲 在8051中可以采用NOP指令來延遲,在 AndesCore?中也有NOP指令來達到類似目的。 3.5. 電源管理 8051 單片機中有兩種省電方式,分別是空閑方式和掉電模式, 單片機處于空閑工作方式時,CPU處于睡眠狀態,它的片內其它部件還是會繼續工作,片內RAM的內容和所有專用寄存器的內容在空閑方式期間都被保存下來了, 可以通過中斷或者硬件復位來終止空閑工作方式。單片機處于掉電工作方式時,片內的振蕩器停止了工作,因此它的一切都被迫停止了。但片內 RAM的內容和專用寄存器的內容一直保持到掉電方式結束為止。掉電方式的喚醒方式只有一種,就是硬件復位。 在AndesCore?上,可以通過軟件standby 指令使CPU進入到低功耗模式,通常標準c 代碼并不能直接控制硬件,Andes 的compiler 提供了intrinsic 函數來做到這點。分別是:__nds32_standby_no_wake_grant(), __nds32_standby_wake_grant(),__nds32_standby_wait_done().指定系統進入低功耗模式時被喚醒的方式,分別是外部中斷中斷喚醒,電源管理模塊喚醒,和中斷配合電源管理模塊喚醒,可以根據系統需要分別設計。 4. 從8051移植到AndesCore上注意事項 一個8051工程,當移植到AndesCore?上時有以下注意事項: 1. 內存映射,代碼和數據擺放位置相關的設置。 2. 可以不必考慮變量數目,或者是函數的overlay, 因為在32bit 的AndesCore?上開發時內存空間通常不會像 8051那樣小。 3. 如果空間允許,在 AndesCore?上盡量使用32bit的數據類型,這樣效率會更高。 4. 在8051上用于表示內存區域屬性的標志如(idata, xdata, bdata, pdata 等)在AndesCore?上可以移除。 5. 在8051上不需要設置內存區塊模式,比如:small, compact, large 等。 6. 在8051 上用于表示對像遠近的屬性"near" 和"far",都可以移除,AndesCore?上的指針的訪問可以達到所有地址空間。 7. 在中斷處理函數中不需要像8051那樣指定哪塊寄存器塊會被用到的關鍵字"using"。 8. 在8051上中斷處理函數就和普通的函數一樣,中不需要設置其它的關鍵字,如interrupt 。 9. 如果有8051匯編部分移植到 AndesCore?,需要重新實現,盡可能的用c 來實現,便于維護和調試。 10. 在8051中使用到的#progma 相關部分需要刪除。 11. 在AndesCore?中函數不需要聲明為"reentrant" 屬性。 12. 如果使用了數學運算,在8051中默認是使用32bit單精度浮點,如果要 保持和8051 中相同的精度,需要將函數名做一些調整,如將 sin() 改成sinf()。 5. 中斷向量及異常處理函數例子 以中斷向量及中斷處理函數的例子說明差異及移植。 5.1. 匯編實現中段向量表 [8051] 該例子顯示怎樣用匯編設置8051的中斷向量和中斷處理函數,在8051匯編中ORG指定了后面匯編代碼的位置,后面的中斷向量通常是一個跳轉語句。如下例第一個向量跳到主函數MAIN函數中,另外一個外部中斷1, 也是一個跳轉指令:LJMP INT 到后面的用匯編實現的中斷處理函數 INT 中。 [ AndesCore?] 該例子顯示怎樣用匯編設置AndesCore?的中斷向量表和中斷處理函數, 該例子中exception_vector 是中斷向量表的label, 后面分別表示第0,1,2,3…個中斷向量,它們只是簡單的跳轉指令,跳到具體的執行實體中去,如vector 0 跳到_start, 做系統相關的初始化操作,_start 是系統啟動代碼,用匯編語言來實現。vector 9 后面對應的是外部中斷,中斷處理函數如OS_Trap_Interrupt_HW0,OS_Trap_Interrupt_HW1… 它通常用C 來實現,可以參考后面5.2 章節的AndesCore?中斷處理函數范例。 在上面用匯編設置AndesCore?的中斷向量表的例子中,我們需要將中斷向量表最終設定在0 地址處,可以通過 section語法配合sag 工具實現,例子中我們設定該段的 section 名為.vector, 所以在sag 中,我們自定義一個 USER_SECTION 為.vector,并 將.vector放在0 開始的地方并作為第一個 section。 通過上面的sag 語法,并使用andes 提供的sag 轉ld 的工具,可以產生類似以下的ld ,在工程進行鏈接的時候選擇該 ld 時就能確保 .vector鏈接的地址位于0 處。 關于詳細的SAG使用,可以參考我們的另一篇文章:《Andes 的分散聚合(SAG)機制》 5.2. 中斷處理函數的C 實現 6. 適用于MCU的Andes CPUs Andes 有三款非常適用于 MCU應用的CPU,分別是:N705,N801,N968A,如下圖所列: N705和N801分別采用了兩級和三級流水線,都具有很低的功耗和很好的性能,當應用需要的頻率較低時,使用兩級流水線的N705能發揮出更好的性能和更低功耗的特性,相比于8051,兩級流水線的 N705 在頻率方面高出許多,比如在TSMC 40nm LP 工藝下能跑到超過240MHz ,所以完全能勝任8051的應用需求。N968A使用了五級的流水線,同樣有低功耗的特性和很好的性能,同時該款CPU具有很強的可配置性,如支持多種總線接口,還支持了專門為audio的加速指令,N968A是一個多面手,性能好,功耗低,又具備強大的可配置特性,適合于多種應用。 |