1971年發明的處理器芯片起著定義計算機的作用,從此,計算機是按照處理器芯片的發展而演變的,是芯片上的計算機,處理器芯片的 ISA(Instruction Set Architecture,指令集架構)已是國外的一統天下。1987年人們提出了系統芯片(SoC)的概念,研究如何將計算機的系統設計都轉移到系統芯片設計上來,將起到換代的作用。系統芯片已有總線互連的MP(Multi-Processor,多處理器)系統芯片與網絡互連的AP(Array Processor,陣列處理器)系統芯片,但AP系統芯片還沒有發展到成熟的階段,給我國的芯片設計提供了一次競爭的機會。因此,我們對MPP(Massively Parallel Processing,大規模并行處理)系統芯片體系結構進行了研究[1]。現在,又從數據流動的計算模式、并行計算的陣列芯片、應用演變的數學技術、以及硅基芯片的制造技術等4個方面的統一,研究了陣列處理器系統芯片的發展問題,提出了如何設計一種統一體系結構的陣列處理器系統芯片,簡稱APU(Array Processing for Unification architecture,統一體系結構的陣列處理器)系統芯片。 數據流動的計算模式的統一 1935年的圖靈抽象機定義了控制數據流動而完成計算的計算模式,現在已形成了指令流、數據流與構令流三種控制數據流動的計算模式。現在流行的控制數據流動的計算模式主要是馮·諾依曼的指令流計算模式,有SISD、SIMD、MISD與MIMD四種體系結構的指令流計算模式。但現在的單核/多核/眾核芯片,只實現了SISD的指令流計算模式,以及MMX[SIMD],流水線[MISD],VLIW[MIMD]等低并行計算度的指令流計算模式。由于SIMD的指令流計算模式最適合圖像處理算法,SIMD體系結構的處理器與計算機早已得到了發展。數據流計算模式是采用電路設計的ASIC/ASSP芯片,或者是靜態重構的FPGA芯片實現的,而構令流計算模式是通過可重構的RC Device(Re Configurable Device)芯片實現的,它們的計算效率高,應用的設計門檻也高,沒有程序設計的靈活性,芯片的品種多。因此,我們研究并實現了MISD/MIMD的指令流計算模式,它不僅具有數據流/構令流計算模式的計算高效性,而且具有程序設計的靈活性,應用的設計門檻低,芯片的品種少等。計算模式的統一就是用MISD/MIMD的指令流計算模式,取代沒有程序設計靈活性的數據流/構令流計算模式,使所有計算統一成指令流計算模式。 并行計算的陣列芯片的統一 從并行計算來看,有任務級并行計算、數據級并行計算、操作級并行計算與指令級并行計算的陣列芯片。現在的MPP計算機主要是按任務級并行 (TLP,Task Level Parallel)完成計算的;是采用單核/多核/眾核芯片實現的。單核/多核/眾核芯片正在向TLP計算的MP系統芯片與AP系統芯片演變[2,3],TLP計算是將任務(進程/線程)映射到核(處理器)上完成計算的,是一種MPMD的計算。由于任務(進程/線程)之間存在同步與互斥問題,TLP計算的效率低、編程復雜。數據級并行(DLP,Data Level Parallel)計算是按SIMD模式完成的計算,主要是采用指令流計算模式中的SIMD體系結構實現的,已有GPU等系統芯片[4,5],以及GPU或者是CPU+GPU的MPP計算機。操作級并行(OLP,Operation Level Parallel)計算是在數據流計算模式的ASIC/ASSP/FPGA陣列芯片,與構令流計算模式的RC Device的陣列芯片上完成并行計算的,沒有程序設計(改變)的靈活性。科學和藝術都是用來探索4維的時空關系的,APU系統芯片是采用PE(Processing Element)之間的鄰接(abutting)技術,探索4維的時空并行計算關系的,實現DLP計算與指令級并行(ILP,Instruction Level Parallel)計算的。陣列芯片的統一就是SIMD的DLP計算與MISD/MIMD的ILP計算,是采用處理元之間鄰接互連(Abutting)的 APU系統芯片統一實現的。 應用演變的數學技術的統一 計算科學是源于數學思維與工程思維的“數學技術”,它改變了人們的思維方式。芯片集成度按照摩爾預言速度上升的結果,在高性能計算、網絡化計算與嵌入式計算的應用演變中,數學技術促進了計算機的新發展。高性能計算機主要是通過模擬幫助人類了解世界與創造世界的,有地球模擬機、藍色風暴、宇宙計算機、密碼破譯機與武器模擬機等。這些計算機的名稱就說明了它們的應用演變,都需要通過數學技術建立很復雜的數學模型,以及實驗或觀測的數據庫。模擬的核心就是建立一個與真實或者虛擬系統相關的數學模型,通過數學模型與數據庫探討對高性能計算機體系結構的影響。網絡化計算的通信作用是非常成功的,從根本上改變了世界的信息基礎設施。現在,隨應用演變的數學技術,使計算機網絡的作用已從通信作用,發展到資源共享的服務作用,叫做網絡計算(Net- Centric Computing)/網格計算(Grid Computing)與網絡存儲。在高性能并行計算與大容量存儲系統的支持下,云計算與SaaS(Software as a Service, Storage as a Service,軟件即服務,存儲即服務)或HaaS( Hardware as a Service,硬件即服務)等數學技術使下一代數據中心將扮演“數據電廠”與“數據銀行”的服務角色。 嵌入式計算是一種計算技術與物理世界相結合的服務模式,有人叫做具體化與物理化應用,模擬了人類與物理世界交互的形式,成了有傳感器(模擬人的視覺、聽覺與感覺等)與執行機構(模擬人的四肢)的計算機,并通過隨應用演變的數學技術,讓工業機器能像人一樣自主工作。雖然現在人工智能的數學技術只使機器人有了邏輯思維能力、部分形象思維能力,基本沒有創造思維能力,但為機器人研究帶來了有創見的方法。從形狀來說,有人形機器人與非人形機器人。而美國國防部的變形機器人就是要通過隨應用演變的數學技術,使機器人具有自組裝能力,可保證機器人能成功地登上星球表面。從功能實現方法來說,有人工方法與自然的仿生方法。人工方法的機器人有手術機器人、自動駕駛機器人等。仿生方法的機器人有氣流發音的機器人、重力行走機器人、化學機器人、神經元機器人、情感機器人、模擬生物進化過程的機器人、以及分子機器人等,仿生方法使隨應用演變的數學技術的計算日益自然化。計算技術的飛速發展,也體現在編程語言的演變上,從最早的Basic到Algol,再到Fortran,以及現在的接近匯編語言的C語言。數學技術最后是通過匯編語言映射到計算機上完成計算的。匯編語言的優點是程序質量高,缺點是可讀性差,沒有兼容性,是不統一的。因此,APU系統芯片的ISA不是用助記憶符的匯編語言描述的,而是采用了一種面向數學技術也面向指令定義的映射語言描述ISA的,簡稱M語言 (Mapping/Middle Language)。數學技術是統一到映射語言上,以提高程序的復用性的。 硅基芯片的制造技術的統一 量子計算與生物計算還處于探索階段,現在的計算機是采用硅基芯片制造技術實現的。人們預計硅基芯片的制造技術到2016年將接近其發展極限,需要尋找新的技術突破。例如,通過擴大芯片面積是提高芯片集成度的一種新途徑,就是圓片規模集成(WSI,Wafer Scale Integration)技術。又例如,混合集成電路是一種小型化、高性能和高可靠的互連封裝手段,國內將其稱為二次集成技術。1993年美國佐治亞理工學院提出了將SoC芯片、MEMS芯片、以及無源元件二次集成在一起的SoP(System on Package,系統級封裝)的概念。按摩爾定律發展的IC芯片僅占一個系統的10%的體積,而SoP則解決了系統中90%的體積。特別是2007年 Intel公司率先具備了45nm硅基芯片的生產能力,使半導體產業進入了“材料推動革命”的時代。集成度高達近20億晶體管的32nm芯片接近實用。 為了解決深亞微米技術的“紅墻”問題與嵌入式應用的小型化問題,硅基芯片的TSV三維集成制造技術得到了發展。IBM、Intel與 Samsung等都采用了TSV(Through-Silicon-Via,硅穿孔封裝)的三維集成技術。據IBM稱,TSV技術能使芯片數據所需要的傳輸距離縮短1000倍,連線數目增加100倍,功耗低達20%。IBM將把TSV技術應用到無線通信芯片、電源處理器、Blue Gene超級計算機芯片和高帶寬內存中。我國2006年全國科學大會提出的“十六專項”體現了芯片設計、制造與應用的產業鏈特點。在“十六專項”的戰略任務的牽引下,有望使我國的芯片技術跟上“摩爾預言”的發展步伐。制造技術的統一就是指三維集成的TSV技術的統一,以實現嵌入式計算機小型化與解決深亞微米的Red brick Wall(紅墻)問題;也是提高我國芯片制造能力的必經之路。從設計上講,APU系統芯片的陣列體系結構,以及傳感器、顯示器與存儲器等芯片都是陣列的,是正好適合于TSV技術的應用的。 結語 APU系統芯片是基于三維集成的TSV制造技術的統一,隨應用演變的數學技術的統一、鄰接互連的陣列芯片的統一、以及SIMD與MISD/MIMD的指令流計算模式的統一設計的。因為計算機的ISA是隨應用演變的數學技術與硅基芯片的制造技術的發展而不斷創新的,APU系統芯片設計主要體現在統一改變的并行計算ISA模型上,即DLP計算與ILP計算統一后的雙指令格式的ISA模型上。 APU系統芯片的應用需求:精度(字長)、速度(主頻,陣列大小)、存儲容量、可靠性與功耗等是ISA設計的先導,來源于隨應用演變的數學技術,因此,需要為系統設計者提供ISA設計的平臺。在APU系統芯片的統一語言的支持下,ISA設計平臺也是可以統一的,使它成為不同應用領域的系統設計者的協作工具。 參考文獻: [1]Shen X B.Evolution of MPP SoC architecture techniques, Sci China Ser F-lnf Sci.2008,51(6):756-764 [2]Johns C R, Brokenshire D A.Introduction to the Cell Broadband Engine Architecture. IBM Journal of Research and Development,2007,51(5):503-519 [3]GARA A,et al.Overview of the Blue Gene/L system architecture. IBM journal of research and development, 2005(49): 195-212 [4]NVIDIA Corp., NVIDIA GeForce 8800 Architecture Technical Brief.2006 [5]Emil P,ATI Radeon HD 2000 programming guide.AMD Graphics Products Report[R],2007 [6]Shen X B.The AP SoC for Unification Architecture.待發表 [7]沈緒榜.嵌入式陣列處理器的發展(J).電子產品世界, 2008,15(10):74-80 [8]沈緒榜. 航天時代的嵌入式圖像處理技術(J).電子產品世界, 2007,14(1):40-42 [9]沈緒榜.星載嵌入式計算機的技術展望(J).電子產品世界, 2008(1):41 作者:沈緒榜 西安微電子研究所 來源:電子產品世界 2010-2 |