ARM11系列微處理器是ARM公司近年推出的新一代RISC處理器,它是ARM新指令架構——ARMv6的第一代設計實現。 該系列主要有ARM1136J,ARM1156T2和ARM1176JZ三個內核型號,分別針對不同應用領域。 本文將對全新的ARMv6架構進行介紹,并深入分析ARM11處理器的先進特點和關鍵技術。 一 ARMv6結構體系 實現新一代微處理器的第一步就是訂立一個新的結構體系。這里所說的結構體系只是對處理器行為進行描述,并不包括具體地指定處理器是如何被建造的。結構體系的定義提供了處理器和外界(操作系統,應用程序和調試支持)的接口,從細節上說,處理器結構體系定義了指令集、編程模式和最近的存儲器之間的接口。 最新的ARM處理器架構—ARMv6,發布于2001年10月,它建立于過去十年ARM許多成功的結構體系基礎上。同處理器的授權相似,ARM也向客戶授權它的結構體系。比如,Intel的XScale就是基于ARMv5TE的處理器。本文也會就ARM11和Intel XScale的特點作一比較。 二 目標應用 ARMv6架構是根據下一代的消費類電子、無線設備、網絡應用和汽車電子產品等需求而制定的。ARM11的媒體處理能力和低功耗特點,特別適用于無線和消費類電子產品;其高數據吞吐量和高性能的結合非常適合網絡處理應用;另外,也在實時性能和浮點處理等方面ARM11可以滿足汽車電子應用的需求。可以預言,基于AMRv6體系結構的ARM11系列處理器將在上述領域發揮巨大的作用。 1 主要特點 對于各種無線移動應用,毫無節制的提供高性能處理器是無用的。同成本控制類似,功耗的控制也是一個重要因素。 ARM11系列處理器展示了在性能上的巨大提升,首先推出350M~500MHz時鐘頻率的內核,在未來將上升到1GHz時鐘頻率(如圖2)。 ARM11處理器在提供高性能的同時,也允許在性能和功耗間做權衡以滿足某些特殊應用。通過動態調整時鐘頻率和供應電壓,開發者完全可以控制這兩者的平衡。在0.13um工藝,1.2v條件下,ARM11處理器的功耗可以低至0.4mW/MHz。 ARM11處理器同時提供了可綜合版本和半定制硬核兩種實現。可綜合版本可以讓客戶根據自己的半導體工藝開發出各有特色的處理器內核,并保持足夠靈活性。ARM實現的硬核則是為了滿足那些極高性能和速度要求的應用,同時為客戶節省實現的成本和時間。 為了讓客戶更方便地走完實現流程,ARM11處理器采用了易于綜合的流水線結構,并和常用的綜合工具以及RAM compiler良好結合,確保了客戶可以成功并迅速的達到時序收斂。目前已有的ARM11處理器在不包含Cache的情況下面積小于2.7mm2,對于當前復雜的SoC設計來說,如此小的die size對芯片成本的降低是極其重要的。ARM11處理器在很多方面為軟件開發者帶來便利。一方面,它包含了更多的多媒體處理指令來加速視頻和音頻處理;另一方面,它的新型存儲器系統進一步提高了操作系統的性能;此外,還提供了新指令來加速實時性能和中斷的響應。 再次,目前有很多應用要求多處理器的配置(多個ARM內核,或ARM+DSP的組合),ARM11處理器從設計伊始就注重更容易地與其他處理器共享數據,以及從非ARM的處理器上移植軟件。此外,ARM還開發了基于ARM11系列的多處理器系統——MPCORE(由二個到四個ARM11內核組成)。 2 優秀的性能 ARM11處理器的超強性能是由一系列的架構特點所決定的。ARMv6—決定性能的基礎ARMv6架構決定了可以達到高性能處理器的基礎。 總的來說,ARMv6架構通過以下幾點來增強處理器的性能: ·多媒體處理擴展 使MPEG4編碼/解碼加快一倍 音頻處理加快一倍 ·增強的Cache結構 實地址Cache 減少Cache的刷新和重載 減少上下文切換的開銷 ·增強的異常和中斷處理 使實時任務的處理更加迅速= 支持Unaligned和Mixed-endian數據訪問 使數據共享、軟件移植更簡單,也有利于節省存儲器空間 對絕大多數應用來說,ARMv6保持了100%的二進制向下兼容,使用戶過去開發的程序可以進一步繼承下去。ARMv6 保持了所有過去架構中的T(Thumb指令)和E(DSP指令)擴展,使代碼壓縮和DSP處理特點得到延續;為了加速Java代碼執行速度的ARM Jazalle技術也繼續在ARMv6架構中發揮重要作用。 三 ARM11處理器的內核特點 ARM11處理器是為了有效的提供高性能處理能力而設計的。在這里需要強調的是,ARM并不是不能設計出運行在更高頻率的處理器,而是,在處理器能提供超高性能的同時,還要保證功耗、面積的有效性。ARM11優秀的流水線設計是這些功能的重要保證。 |