如今,芯片制造商接受ARM架構已經不再是什么新鮮事。ARM市場很好,ARM處理器很強大。即便是ASSP陣營對面的FPGA廠商也不斷試圖開辟ARM新戰場。10年前,Altera公司宣布推出了基于ARM9內核的XA(Excalibur-ARM)系列;今年3月,Actel公司推出基于Cortex-M3內核的SmartFusion FPGA。本周,Xilinx(賽靈思)則推出了基于ARM處理器的可擴展式處理平臺架構。 雖然FPGA廠商一直與ASSP或ASIC唱對臺戲,但他們卻無法否認硬核處理器的市場優勢。傳統上,FPGA需要硬件語言編程,但現實情況是,軟件工程師與硬件工程師數量的比例為10:1。雖然FPGA廠商不斷推出各種工具來簡化FPGA開發,但工程師們的習慣已經形成,FPGA廠商順勢而為采納最流行的ARM架構也在情理之中。 賽靈思稱,此平臺采用ARM處理器技術主要原因在于ARM的處理器發展規劃以及廣泛的生態系統,此外也包括 ARM 的業界領先地位和廣泛的客戶群。ARM已擁有200多家芯片合作伙伴以及500多份許可證和設計方案,在全球出貨量中有170億部器件均采用了ARM 技術。ARM 顯然已在處理器架構領域占據世界級領先地位,其產品在嵌入式、主流和高性能應用領域已廣受市場驗證。 賽靈思此次推出的以ARM處理器為中心的可擴展式平臺架構如下圖所示。其主要特點包括:雙核Cortex-A9 MPCore處理器、28nm可編程邏輯和AMBA-AXI片上總線。這幾點的結合可實現極高的系統性能、靈活性和集成度。 圖1:以ARM處理器為中心的可擴展式平臺架構 ARM Cortex-A9 MPCore處理器 賽靈思此平臺采用的是內核速度高達800MHz的雙核Cortex-A9 MPCore處理器。2007年10月,ARM公司發布了Cortex-A9單核和Cortex-A9 MPCore多核處理器。Cortex-A9多核處理器是首款結合了Cortex應用級架構以及用于可擴展性能的多處理能力的ARM處理器,提供了下列增強的多核技術: •加速器一致性端口(ACP),用于提高系統性能和降低系統能耗 •先進總線接口單元,用于在高帶寬設備中實現低延遲時間 •多核TrustZone技術,結合中斷虛擬,允許基于硬件的安全和加強的類虛擬解決方案 •通用中斷控制器(GIC),用于軟件移植和優化的多核通信 AMBA AXI4總線 隨著片上系統復雜程度和CPU處理能力的提高,總線結構可能成為系統性能的瓶頸,尤其是在多處理器SoC 設計當中。為解決總線瓶頸,ARM 公司于15年前提出提出了AMBA總線結構。由于它的高性能以及ARM微處理器的廣泛應用,AMBA已經成為了SoC設計實際的總線標準。 AXI是AMBA中一個新的高性能協議。AXI技術豐富了現有的AMBA標準內容,滿足超高性能和復雜的片上系統設計的需求。2010年3月10日,ARM公司推出了全新的AMBA 4第一階段規范,它包括一個對擴展的AXI互聯協議系列(包括AXI4、AXI4-Lite和AXI4-Stream)的定義。 AXI4協議可擴展用于滿足FPGA實施的需求。賽靈思參與了此規范的定義、制定及審議。AMBA AXI4使開發人員有可能將FPGA所能實現的高速并行處理性能與傳統處理器系統結合起來,達到前所未有的性能。借助AMBA,可編程邏輯能夠使用現成的IP和定制 IP,將關鍵的系統功能速度提升達100倍。這種架構方法不僅能解決并行和串行計算環境、存儲器以及I/O之間的常見性能瓶頸問題,而且還能讓處理器系統實現包括動態重配置在內的可編程邏輯配置控制。 綜上可見,賽靈思此平臺理論上超越了單純的ARM架構ASSP。在性能上,它可以同時利用串行和并行處理;在可擴展方面,由于集成了可編程邏輯,它為用戶提供了更高的靈活性,可實現產品的高度差異化;在集成度方面,它采用臺積電最新高介電層/金屬閘 (HKMG)、高性能低功耗28nm工藝,集成度更高,芯片占位面積更小,功耗更低。 應用示例 該平臺的目標市場包括汽車輔助駕駛、智能視頻監控、工業自動化、航天與國防以及新一代無線應用等。 在汽車駕駛輔助 據國際汽車制造商協會數據,70%的汽車撞人事故發生在夜間,60%的頭部撞車事故可通過縮短0.5 秒的響應時間而避免,30%的駕駛員死亡事故源于疲勞駕駛。這些損失可以通過更智能的汽車駕駛輔助系統降至最低。全集成駕駛輔助系統將包括車道偏離警告系統、碰撞避免系統、盲點檢測、自動巡航控制、夜視和自動泊車系統等。這樣的系統對處理器的性能、成本和功耗要求很高。賽靈思稱,ASSP+DSP的多芯片方案在成本方面余度不大,功耗方面則不能滿足要求,而賽靈思的可擴展平臺則完全沒有問題(如下面兩圖所示)。 圖2:基于多芯片的汽車駕駛輔助系統方案 圖3:基于賽靈思的可擴展平臺的汽車駕駛輔助系統方案 智能視頻監控 智能視頻監控市場發展迅速。最新的智能視頻分析技術可自動監控視頻圖像并作出正確決策,降低出錯率。這樣的系統往往備有全色彩高清視頻攝像頭,處理能器能力要達到3100 DMIP,實時數字信號處理達到49GMAC,存儲器帶寬要達到2240MB/s。賽靈思稱,多芯片方案的成本較高,功耗則無法滿足要求,而賽靈思的可擴展平臺在兩項指標上都實現了相當的余度(如下面兩圖所示)。 圖4:基于多芯片的智能視頻監控方案 圖5:基于賽靈思的可擴展平臺的智能視頻監控方案 軟件支持 賽靈思稱,可擴展式處理平臺架構這種以處理器為核心的方法使嵌入式軟件開發人員能夠移植代碼,因為他們可以使用支持 ARM處理器的業界標準操作系統 (OS),以及他們熟悉的使用 ARM RealView及相關第三方工具、基于 Eclipse 的 IDE、GNU、賽靈思軟件開發套件等其它工具的軟件開發與調試環境。該平臺使設計團隊能通過可編程邏輯擴展系統功能,執行ARM生態系統成員和賽靈思開發的專用加速器和外設以及定制加速器和外設功能。Xilinx Platform Studio (XPS) 工具套件作為 ISE設計套件的一部分,可用來開發并調試器件的可編程邏輯部分,并幫助硬件設計人員創建和實施AMBA支持的IP模塊,從而擴展處理器系統性能。 下一步,賽靈思及其合作伙伴將開發全套通用標準化加速器和外設以及相關驅動程序和API,進一步幫助軟件和系統開發人員在減少硬件設計工程師參與協助的情況下向設計方案添加功能。許多加速器和外設將以IP核的形式出現,配合賽靈思實現目標設計平臺戰略,提供嵌入式開發工具、方法、IP 和技術支持。 為了進一步提高從軟件代碼向硬件轉變的優勢,賽靈思還與 “C 語言到 FPGA” 編譯器流程的重點廠商合作,共同為嵌入式軟件和系統開發人員提供用 C 語言方便構建處理器函數的方式,并將其移植到可編程邏輯擴展模塊(通過 C 語言到 FPGA 綜合)。賽靈思是BDTI 高級統合工具認證計劃的支持者。軟件開發人員能使用自己最喜愛的商業開發工具,同時賽靈思也將提供自己基于 GNU 的編譯器、調試器和驅動程序,并為常用的商業開發工具提供開放式支持。 賽靈思將開始與客戶、合作伙伴以及其他第三方廠商展開合作,共同幫助系統架構師對適用于新一代嵌入式系統的可選設計方案進行評估。賽靈思稱,將于2011年年中公開發布采用可擴展式處理平臺構建的相關產品系列的詳細信息。 |