來源:半導體行業觀察 我們正在目睹GPU市場的重要轉折。八月初,GPU龍頭企業Nvidia發布二季度財報預警,其中提到公司的二季度收入比之前的預計大幅下降,其主要原因是由于游戲市場和加密貨幣市場在2022年的規模大大下降——相關的收入同比下降33%,環比下降44%。我們認為,這標志著GPU市場正在加速進入轉折期,這也會加速GPU相應公司尋找新的增長點。 ![]() 傳統上,GPU最關鍵的市場是游戲市場,這包括了PC主機上的GPU,以及游戲主機中的GPU,然而從長期大趨勢上來看,PC主機和游戲主機的市場增長正在趨緩,甚至有下降的勢頭。從短期來看,2021年新冠疫情導致居家辦公等新的工作狀態導致了PC和游戲主機相關需求短暫上升,而目前這樣的非常態帶來的福利已經結束,對于GPU需求也在大幅下降。此外,加密貨幣的繁榮也曾讓GPU一卡難求,但是隨著加密貨幣市場的崩潰,對于GPU市場也造成了一定的影響。根據Digitimes的報道,GPU在2022年的出貨量預計將比2021年下降40-50%(這個數字和Nvidia的第二季度預報也相符)。總之,無論是從短期還是從長期來看,傳統的游戲行業都已經很難成為GPU市場的增長點。 未來GPU的市場在哪里? 其實從Nvidia的財報中我們也可以看出,數據中心將會是GPU的新增長點。數據中心中的GPU使用主要是用于高性能計算,包括人工智能相關的計算和視頻處理等。在Nvidia公布的第二季度預報中,數據中心相關的收入同比增長高達61%,且收入已經高于游戲市場,可見數據中心增長勢頭之強。 數據中心中使用GPU預計未來還會在未來呈快速上升態勢。人工智能將會進入越來越多的應用中,而在數據中心側人工智能模型的訓練和推理,目前最佳的解決方案就是GPU。我們目前看到人工智能模型的復雜度正在快速上升,訓練所需要的數據量也在越來越大,這也意味著單個模型需要的計算量正在上升,同時結合模型部署和訓練數量的上升,兩者的乘數效應使得數據中心對于GPU的需求仍然會持續上升。 除了高性能計算之外,另一個未來可能的新增長點是元宇宙相關的圖像渲染任務。隨著MR/VR硬件和相關應用的成熟,如何為用戶提供高性能的圖像渲染將會是相關用戶體驗的核心要素。如果元宇宙的VR/MR真的如預期的一樣會成為一個巨大的市場,那么相關的渲染任務也將會成為GPU的一個新增長點。當然其中也存在著很大的不確定性,首先元宇宙和VR/MR是否會如愿增長還不清楚,此外相關的渲染會在云端完成并且通過網絡串流的方式來到用戶的本地顯示,還是使用本地的GPU直接做渲染,相關的技術方案還沒有定論。 綜上所述,我們認為GPU市場的轉折將會是傳統游戲相關收入逐漸飽和(甚至在短期內大幅下降),而在人工智能和高性能計算(即GPGPU)相關的數據中心市場會成為目前和中期內的首要增長點,遠期來看元宇宙相關的渲染任務有可能會取代傳統游戲相關收入,但是還存在很大的不確定性。 GPU技術演進路線 如前所述,數據中心中的人工智能和高性能計算正在成為GPU目前最關鍵的增長點,因此GPU廠商技術研發目前也主要圍繞這個目標。這里我們將會分析GPU領域兩大龍頭Nvidia和AMD的相關技術路線圖,來分析一下GPU在未來幾年內演進的一些重要技術路線。 首先是專用加速器與通用GPU的融合。在人工智能硬件剛興起的時候,使用專用加速器還是使用通用GPU做加速幾乎是兩大陣營——專用加速器效率高但是只能支持幾種特定的算法和模型;通用GPU兼容性好,但是效率較差,功耗也較大。但是,隨著人工智能硬件的演進,目前我們看到通用GPU和專用加速器正在慢慢融合,或者說在GPU上我們在看到越來越多的針對一些特定人工智能模型的專用IP來實現加速。舉例來說,混合精度計算和低精度整數運算加速已經成為數據中心GPU的標配。在這個領域,Nvidia更為激進,憑借其對于人工智能模型生態的大量布局和龍頭地位,Nvidia能夠把握人工智能模型發展的態勢(如新模型的流行程度)并且據此在GPU產品上加入相關支持。在Nvidia下一代的H100 GPU中就加入了對于Transformer系列模型的專用加速模塊,而這樣的專用加速模塊集成在通用GPU中恰恰說明了通用GPU和專用加速器之間的融合將會是未來的重要技術演進方向。 除此之外,決定GPU計算性能的關鍵指標是存儲訪問帶寬和延遲。在這個方面,增加DRAM帶寬,使用HBM等最新的內存接口已經是GPU的標準配置,相信未來隨著DRAM接口標準的演進,GPU也會優先使用最新的DRAM接口。而除了DRAM之外,高速緩存(cache)也是關鍵的存儲,緩存容量會大大影響計算的延遲和功耗。Nvidia和AMD都在積極地擴大高速緩存的容量,而在這方面AMD使用新技術的步伐則領先Nvidia——目前Nvidia在H100增加緩存主要還是考慮2D的方式即在同芯片上加大緩存面積,而根據AMD今年六月份公布的最新CDNA3 GPU架構,CDNA3會使用高級封裝技術,使用單獨的緩存芯片粒(chiplet),并且將緩存芯片粒和GPU使用堆疊的方式集成在一起(即Infinity Cache)。這樣一來,高速緩存芯片粒的存儲容量就有可能大大增加,從而提升性能。 在存儲之外,另一個數據中心端GPU技術演進的重要方向是如何減少CPU和GPU通信帶來的性能損失。在傳統設計中,CPU和GPU處于兩個完全不同的系統,其內存空間并不共享,因此CPU和GPU之間的通信開銷很大。為了解決這個問題,Nvidia和AMD都在這方面做了不少投入。Nvidia的解決方案是使用自研的基于ARM架構的Grace CPU,并且在架構設計上給每個GPU單獨配一個CPU并且使用NVLINK高速接口連接在一起,從而減小CPU和GPU之間的協同工作開銷。而AMD因為一直同時有GPU和CPU業務,因此相關的設計在技術上更為激進,在CDNA3架構中CPU和GPU將會使用高級封裝的方式集成在一起,共享HBM3高速內存接口和內存空間,從而大大增加CPU和GPU之間的集成度和協作的能力。 綜上,我們認為未來服務器端GPU將會是GPU市場最重要的市場增長點,而圍繞這個增長點有幾個重要的技術路徑將會成為主流,包括專用加速IP和通用GPU融合,高速DRAM和緩存的進一步演進,以及CPU和GPU的進一步集成。比較Nvidia和AMD的技術路徑,我們可以發現Nvidia的強項在于坐擁人工智能生態護城河,通過極強的軟硬件協同設計能力和對于人工智能領域的洞察力,它在專用加速IP和通用GPU融合方面做得極為成功,因此可以通過最小的成本和功耗代價來實現最大化的相關任務性能提升。而AMD的強項在于其高級封裝領域的積累以及在CPU領域的經驗,未來可望使用晶圓級技術的突破來提升性能。 市場競爭格局 未來市場競爭格局而言,Nvidia和AMD都是從傳統的游戲市場切入,在保持傳統游戲市場的同時,也正在把精力越來越多地投入云端市場。Nvidia目前擁有服務器市場GPU的領先地位,但是從技術發展角度來看AMD的勢頭也很不錯,其關鍵在于能否打通軟件生態,如果能突破Nvidia CUDA的生態包圍圈的話AMD可望在服務器市場也擁有重要的一席之地。 在服務器市場另一個值得關注的新勢力是中國的GPU初創公司。以燧原,壁仞等為代表的GPU中國新興勢力也把服務器市場作為其主打方向。從市場動態上來說,其實目前是一個很好的時間點,因為在GPU市場來看,中國GPU較為薄弱的游戲渲染等領域正在被服務器市場增長所取代,而在服務器市場相對來說中國公司的技術包袱并不大,可以輕裝上陣。隨著未來國際形勢的變化(例如逆全球化),可望中國的GPU新勢力也能獲得GPU市場的重要份額。 |