天數智芯首席科學家 鄭金山 2020年8月4日,國務院公布《新時期促進集成電路產業和軟件產業高質量發展的若干政策》,開篇指出,集成電路產業和軟件產業是信息產業的核心,是引領新一輪科技革命和產業變革的關鍵力量。2020年的國際環境,讓全社會越來越認識到中國集成電路和軟件產業的薄弱,越來越堅定要把集成電路和軟件產業搞上去的決心。 今天,我們來談一談GPGPU市場。 縱觀整個IT系統,從CPU、操作系統、辦公套件、整機到服務器,我們都已經初步具有一些商用化的可替代產品。唯獨在GPGPU領域,目前還是一片空白。如下圖所示: GPGPU是什么 GPGPU全稱是通用圖形處理器(General-Purpose computing on Graphics Processing Units)。它是用專門處理圖形任務的處理器,執行原本由中央處理器處理(CPU)完成的通用計算任務。這些通用計算常常與圖形處理沒有任何關系。圖形處理器的特點是,并行處理能力特別強,計算能效比高,并且有很大的存儲帶寬。有些應用,例如人工智能(機器學習)模型訓練與推理、高性能計算,它們往往是大數據流應用,這時,用GPGPU解決這類問題就比CPU效率更高。雖然目前機器學習會有遷移到專用硬件的可能,但在編程模型上GPU是圖靈完備的,且對于用傳統語言編寫的、軟件形式的計算有較好的支持,具有高度的靈活性。 因此,GPGPU目前廣泛應用于高性能計算、行業AI應用、安防與政府項目、互聯網及云數據中心等。其主要應用場景:一是人工智能模型訓練與推理;二是高性能計算。 根據有關數據預測,到2025年,中國GPGPU芯片板卡的市場規模將達到458億元,是2019年86億元的5倍多,2019年到2025年的年復合增長率高達32%。按行業來分,互聯網及云數據中心為228億元,安防與政府數據中心為142億元,行業AI應用為37億元,高性能計算為28億元。按應用場景來分,到2025年的預測數據是,人工智能推理286億元,人工智能訓練144億元,高性能計算28億元。 可以看出,GPGPU在中國的未來需求量很大,對國民經濟的發展至關重要。 GPGPU國產替代的市場呼喚 一般人對GPGPU沒有什么概念。某頭部供應商的一塊高端GPGPU板卡,其售價接近一輛普通轎車的價格。 當前,人工智能應用的閘門打開了,很多企業、研究機構、研究者希望利用人工智能。首先是要做的是人工智能訓練,根據現有數據,反復訓練,得出一個模型。將這個模型部署到業務應用中,當對這個模型輸入一個新的數據時,根據模型計算出一個結果,這一過程稱為人工智能推理。例如,一個游戲網站接收到一個新用戶注冊,它想判斷這個用戶是正常用戶,還是競爭對手注冊進來拉人的惡意用戶。它就可以利用過去大量的用戶行為數據,訓練出一個人工智能模型。這個模型能夠計算出,什么樣的用戶行為就有可能是惡意用戶,從而自動地對這些用戶限制權限,或者交給人工客服來處理。類似的應用特別多,可以訓練機器做很多以前由人工來完成的事情,例如,安防領域的視頻分析,媒體領域的內容生產、字幕生成、內容審核、分類與標簽,醫療健康領域的藥物發現與探索、醫學影像自動識別、輔助醫療、自動診療,電商領域的個性化推薦、信用評級,金融交易領域的交易算法、服務管理與推薦、潛在用戶挖掘,客服領域的語音服務、聊天機器人、呼叫中心優化,等等。 高性能計算則是國之重器,計算機學科中的明珠,廣泛應用于勘探、天氣、海洋、氣候變化、核能、發動機、航空航天等領域。 面對日益增長的需求來說,GPGPU的供應是沒有很好地滿足的。當前,全球GPGPU市場供應處于一家獨大的局面,價格昂貴,產品種類單一。以中國的云端AI訓練芯片市場為例,最大的供應商市場份額達到90%,其中,某一款產品就占整個市場的50%,另一款產品占25%。 這樣的局面雖然源自該供應商的技術和實力,但是客戶還是需要更多的選擇。例如在2017年,因為人工智能訓練和數字貨幣挖礦的需求猛增,GPGPU供不應求,價格高漲,一部分用戶嘗試將原本用作獨立顯卡的消費級GPGPU,替代用于數據中心,但是被供應商在軟件驅動上禁用,當時引起一陣熱議。 從國家的供應鏈安全角度,這兩年,一些重要的企業和機構陸續被美國列入禁售實體名單。這些用戶除了國產替代,別無選擇。 GPGPU國產替代如何突圍 看到這里,很多人一定會問。第一位的供應商占據90%的市場,這個市場一定很難攻下,不然全球有那么多芯片公司,早就有別的公司來制衡了。 一方面,前面分析了目前的國際環境下,我們實現國產替代的必要性和緊迫性。國家也出臺了《若干政策》這樣的鼓勵措施,從財稅、投融資、研究開發、進出口、人才培養、知識產權、市場應用、國際合作等多個方面,支持相關的企業發展壯大。另一方面,從技術難度看,GPGPU也不是可望不可及的。改革開放四十多年來,中國有一大批芯片人才,在國際公司積累了深厚的經驗。現在恰逢中國經濟實力增長、下決心發展半導體產業的良好時機,他們希望抓住這一機遇,一顯身手,為中國半導體產業發展做出一份貢獻。 天數智芯就是這樣一家公司。天數智芯的芯片研發團隊于2018年初組建,數十名創始團隊主要來自世界知名芯片公司AMD的GPU部門和企業軟件翹楚Oracle、IBM、英偉達等公司。完整的芯片設計團隊在芯片設計領域平均積累了近十年經驗,可以說,這是一支在世界范圍內都不可多得的、完善的高端芯片設計隊伍。 公司正在積極研發針對云端算力提升的訓練及推理芯片。其中,面向人工智能訓練的GPGPU芯片計劃在今年實現批量生產,2021年初商業化投向市場,這將是國內首款自研的GPGPU芯片;面向人工智能推理的GPGPU芯片也在研發之中。 天數智芯在芯片設計初始,就與服務器廠商合作共同對產品設計進行定義,以實現未來在數據中心中的國產替代。目前,天數智芯已經與浪潮、新華三等服務器廠商簽署戰略合作,共同推動服務器領域人工智能和HPC的計算芯片及硬件解決方案發展。天數智芯還與國產CPU龍頭中科龍芯等密切對接技術及業務合作,打造天數GPGPU+國產CPU的自主可控超算解決方案。 展望未來,我們深知任務艱巨,但我們也有信心、決心和耐力,為國產GPGPU闖出一片天地。也希望有更多的人才、合作伙伴、行業應用單位加入我們的征程。 作者簡介: 鄭金山,上海天數智芯半導體有限公司首席科學家,擁有21年芯片設計工作經驗,曾先后供職于Trident、XGI、ATI Technologies、AMD超微半導體上海有限公司和酷芯微電子(Artosyn),任高級經理、PMTS和架構師等職位。專注于GPU IP設計多年,對GPU架構與設計有深厚的造詣。他建立與帶領上海芯片設計團隊參與過多個顯卡(從Radeon HD2000到R400)芯片的研發與產品化。在酷芯微電子參與了機器視覺芯片9201的研發并成功量產。鄭金山1999年畢業于復旦大學ASIC與系統國家重點實驗室,獲微電子與固體電子學專業碩士學位。 |