前言 由于現代數字信號處理器(DSP)設計、半導體工藝、并行處理和互連與傳輸技術的進步,現代高性能DSP的處理能力得到極大發展。但在移動通信、雷達信號處理和實時圖像處理等復雜電子系統中,單片DSP的性能仍可能無法滿足需求,通常需要使用多片DSP構成并行信號處理系統。 在多DSP系統中,互連技術連接DSP、接口及其他處理器,一起構成系統的靜態體系結構,是數據傳輸的中間介質的總和。互連技術傳輸代表計算任務、中間數據、結果或狀態控制信息的數據流,使接口與DSP中的算法模塊通過數據流動態地連接起來,整合成分工協作的有機整體。 已經有一些對多DSP并行系統互連技術的綜述[1][2] [3][4][5][6],但還不夠全面而且沒有反映高性能DSP互連技術的最新進展。因此,本文以世界主流公司的典型高性能DSP產品為例,全面總結概括高性能DSP的互連接口技術及其發展,對其互連特性進行總結和歸納分類,在此基礎上全面總結給出并行信號處理系統中多DSP互連設計的總體設計考慮和實際經驗。 高性能DSP互連接口技術及其發展 多DSP系統的互連以DSP自身接口為基礎,下面以TI、ADI和Freescale三家公司的高性能DSP為例系統概括現有的DSP互連接口,見表1。 現有DSP的互連接口在物理層和傳輸控制上的特性是選擇使用互連技術的基礎,表2是對表1中所有的DSP互連接口的互連特性的總結。 表1 主流DSP公司典型高性能DSP的互連接口 可以看出,在越來越高的傳輸速率需求的推動下,高性能DSP互連接口在物理層技術的主要發展趨勢是:從高電壓擺幅→低電壓擺幅,從單端信號→差分信號;從并行總線→串行信號線;從收發異步→收發外同步→源同步→串行碼流中嵌入時鐘的串行器/解串行器(SerDes);從半雙工→全雙工;從多點分時共享總線→點-點的專用互連;最終使接口傳輸速率從幾十Mbps發展到目前的10Gbps。 數據的串行化意味著數據必須以分組方式傳輸。而由于信號完整性問題,高速串行差分線一般不允許多點負載,因此基于SerDes的互連一般是點到點的直接互連。當DSP數量較少時,可以采用DSP間兩兩的直接互連;當DSP數量較多時,須要采用中間DSP或用于數據傳輸的中間器件—交換機。 因此,物理層技術的發展推動著高性能DSP的主要互連技術從多點并行總線轉向高速串行直連和分組傳輸交換。例如TI在2008年10月發布的3核DSP TMS320C6474、Freescale在2008年11月發布的6核DSP MSC8156,都已經取消傳統意義上的數據、地址和控制三總線接口而代之以sRIO、GE之類的標準分組交換網絡接口以及AIF這樣的高速直連接口。 根據傳輸特性對互連技術的分類 互連的目的滿足接口及算法鏈路的數據傳輸需要,因此互連特性往往與傳輸特性緊密相關。各種互連技術雖各有不同,但可以根據互連與傳輸的共性進行統一分類,有助于理解并選擇合適的互連技術。表3是根據互連與傳輸的特性對現有主要DSP互連技術的分類總結。圖1~圖4是對典型互連技術實例的圖示。 表3 互連與傳輸技術的分類總結 對表3補充說明如下:多點總線為多DSP共享并分時占用,不能多數據流并發傳輸。多點主從總線可能有主總線的橋接轉換,例如PCI-HPI的PCI2040(TI)、PCI-Local總線的PCI9054(PLX)。傳統互連中的數據傳輸過程一般都需要源、中間或目的處理器的顯性或隱性(例如TDM中的時隙分配)地直接參與。而基于交換機的網絡互連則一般不需要。間接傳輸中的中介器件、DSP或交換機可以根據需要級聯。接口轉換橋方式連接標準網絡的實例有:專用于ADI公司SHARC及TigerSHARC的SharcFin和FINe(Bittware)、通用的TSI620(Tundra)。高端FPGA由于其豐富的接口、對幾乎所有互連標準的有效支持、使用的靈活性和高性能的計算處理能力,也會在多DSP的互連中發揮重要作用。 在2003年RapidIO成為ISO/IEC 18372標準之前,還沒有規范的多DSP互連網絡標準,各廠商推出了多種非標準DSP互連網絡、接口和交換芯片,例如:Solano(SpectrumSignal)、StarFabric(StarGen)、FPDP/sFPDP(ICS/VITA)、RaceWay(Mercury)、SKYChannel(SKY Computer)。RapidIO是在這些技術的基礎上發展起來的,特別針對高性能DSP或嵌入式系統互連優化,其產業鏈已經基本成熟,并開始逐步取代這些非標準互連技術。 圖1 典型直接互連:鏈式、星型、陣列 圖2 典型多點總線直接互連:對等總線、主從總線 圖3 典型非網絡間接互連:存儲器中介(雙口、FIFO、共享)、FPGA 總結高性能DSP間的數據傳輸及控制,可以看出,其主要發展趨勢是:從DSP間的直接互連傳輸→通過中介DSP的間接傳輸→通過分組交換互連網絡的間接傳輸;源DSP和目的DSP的關系從主從關系→對等關系;從DSP軟件主動參與傳輸控制→硬件獨立自主控制傳輸過程,例如sRIO由硬件完成檢錯和重傳;從專有互連傳輸技術→標準互連傳輸技術。 圖4 交換網絡互連:直接接入及需要適配器接口轉換 系統級設計考慮 構建多DSP并行DSP系統時,需要決策解決的系統級問題有:為主數據路徑選用哪些互連技術與整體拓撲?統一互連還是混合互連技術?直接還是間接互連?如果直接互連采用何種DSP接口?如果間接互連是采用存儲器、FPGA、交換機還是其他器件擴展?是否需要連接外部網絡?如何處理控制、程序配置、管理等的傳輸需求?是否需要區分數據平面、控制/配置平面、管理平面?在控制/配置/管理平面內,又應采用何種互連技術與互連拓撲? 如何選擇合適的互連技術,設計合理的互連體系結構,應當根據數字信號處理算法及其在各DSP上的分解、解耦與適配結果,考慮數據傳遞鏈路在速率、延遲、并發數等方面的性能需求,針對已有DSP接口的互連與傳輸特性,滿足系統在控制、配置和管理方面的數據傳遞需要,滿足系統在成本、硬軟件開發復雜度、調試測試方便性、構建使用靈活性與可擴展性等使用特性上的需要。在工程中設計實際并行處理系統時,一般需要混合使用多種互連傳輸技術與互連拓撲架構。 經驗總結 在信號處理平面:當多DSP間整體流量不大或需要共享內存且器件支持時,可以使用對等并行總線;當處理過程需要主處理器參與轉移、分配、匯聚或控制時,可以選用主從并行總線;當多DSP異構、具有非對等總線接口、需要分發匯聚或需要FPGA參與處理時,可以用緩存或FPGA做中介的間接互連;當需要高性能且鏈路為直接點—點時,可以選用高速直接互連鏈路或多點總線蛻化的直接互連;當需要并發的多個高速數據流、路徑需要動態變化或需要擴展性,可以采用高性能分組交換網絡互連;如果DSP不具有網絡接口或網絡為非標準,則需要橋接器件。語音、定時特性明顯的中小數據量傳輸可以采用McASP、TDM、McBSP等同步串行總線;對網絡數據可以采用FE、GE的標準網絡。 在配置、控制和管理數據平面,對低速數據可以采用串行總線如UART、I2C、CAN、UART擴展的RS485等;對于高速傳輸可以采用主從并行總線如PCI、HPI、DSI、UTOPIA等,或采用FE/GE、PCIe、sRIO等網絡互連技術;如果需要通過外部以太網管理系統內部則需要使用FE、GE等通用網絡技術。 對于系統的整體互連拓撲,當整體算法鏈路固定且主要為順序傳遞或逐級分解/匯聚或DSP數量較少時,可以采用兩DSP間點—點直接互連組成的鏈/環式、樹/星型、二/三維規則拓撲、Mesh等拓撲結構;當需要中、低性能的多DSP間相互傳輸,可以采用多點總線、FPGA星型、FE/GE的星型網絡拓撲;當需要較多DSP間的高性能互連、算法靈活或需要性能與規模的線性擴展時,可以使用FPGA或分組交換網絡形成的星型拓撲。 結語 現代高性能多DSP并行DSP系統一般將采用分平面的混合互連與傳輸技術。高性能多DSP的互連和數據傳輸將主要是基于低壓差分SerDes的全雙工互連和分組數據傳輸。當DSP數量較少時系統級互連將以DSP間的直接互連為主,當DSP數量較多時將以交換機及交換網絡為中心。多DSP互連的整體發展趨勢是從局部的差異化互連→全局統一的網絡互連;從直接互連/傳輸→通過中介的間接傳輸→通過互連網絡的間接傳輸;從非標準互連→標準互連;從通用以太網→面向信號處理優化的高性能嵌入互連網絡sRIO。 |