來源:21世紀經濟報道 AI芯片的戰役正愈演愈烈。 7月11日,英特爾(33.98, 0.68, 2.04%)面向中國市場推出了AI芯片Habana Gaudi 2,Gaudi 2直接對標英偉達GPU的100系列,欲爭奪AI算力市場的寶座。 眾所周知,目前GPU資源緊缺,英偉達的100系列在國內禁售,而百模大戰之下算力的需求還在飆升。對于中國市場而言,當前急需AI芯片“解渴”,對于英特爾而言,眼下正值算力緊缺的窗口期,也是進攻的絕佳時機。 英特爾也強調,Gaudi 2芯片是專為訓練大語言模型而構建,采用7納米制程,有24個張量處理器核心。事實上,去年英特爾就已經在海外發布了Gaudi 2,此次在中國推出的是“中國特供版”。 由于各國的出口管制限制,外界首要關心的是AI芯片在中國市場的供應可持續性。對此,英特爾公司執行副總裁、數據中心與人工智能事業部總經理Sandra Rivera在接受21世紀經濟報道記者采訪時做出了肯定的回答。 Sandra Rivera說道:“這張卡也是中國定制版的產品,對于出口或者是支持中國的客戶是沒有任何問題的。英特爾肯定是合法合規地在中國繼續支持我們的客戶,不管是Gaudi 2或者是未來的Gaudi 3,我們一定是在合法合規的情況下做出一些中國定制的產品,以滿足中國的客戶的需求。” 同時,芯片的性能并沒有打折,她表示:“在網絡速度上,(中國版)和國際版相比,是從24個網口變成21個網口,但是整體性能還是基本一致的。” 隨著大模型的日新月異,英特爾在近幾個月內圍繞著Gaudi2繼續進行優化。 Sandra Rivera介紹道,在性能上,根據機器學習與人工智能開放產業聯盟MLCommons在6月底公布的AI性能基準測試MLPerf Training 3.0結果顯示,Gaudi 2是除了英偉達產品外,唯一能把MLPerf GPT 3.0模型跑起來的芯片。 在發布會現場,英特爾也直接將Gaudi2和英偉達的A100進行比較,其野心可見一斑。根據英特爾公布的數據,從計算機視覺模型訓練到1760億參數的BLOOMZ推理,Gaudi 2每瓦性能約A100的2倍,模型訓練和部署的功耗降低約一半。 同時,英特爾高管還介紹道,目前相比A100,Gaudi 2價格更有競爭力,且性能更高。接下來到9月,采用FP8軟件的Gaudi 2預計能夠提供比H100更高的性價比。 整體而言,除了芯片,在此次發布會上,英特爾展示了一系列支持大模型的算力解決體系,接下來具體的落地應用和產品迭代狀況也受到關注。 一方面,目前在中國市場上,英特爾已經和浪潮信息、新華三、超聚變等國內主要的服務器廠商合作,其中,浪潮信息的NF5698G7是專為面向生成式AI市場的新款AI服務器,支持8顆OAM高速互聯的Gaudi2加速器,而在終端客戶方面,Sandra Rivera表示:“中國市場對人工智能解決方案的需求非常強勁,我們正在與幾乎所有傳統客戶洽談。我們的云服務提供商、通信服務提供商都是企業客戶,因此對人工智能解決方案有著強烈的需求。” 另一方面,在產品路線上,英特爾近年一直強調XPU,即多樣化、多組合的異構計算。在AI相關的產品線上,既有集成AI加速器的CPU處理器、有GPU產品,以及Habana Gaudi系列代表的ASIC類型AI芯片。 Habana Labs成立于2016年,主要研發方向為人工智能、深度學習計算等,創業初期就得到了英特爾的投資,而后在2019年12月以20億美元被其正式收購。 對于GPU和AI芯片的組合,Sandra Rivera透露:“Gaudi是一個人工智能加速的專屬產品,在英特爾產品里,如果是針對大模型這個工作負載,它是性能最佳、最優的一個產品。明年我們還會有下一代產品Gaudi 3發布。在2025年的時候,我們會把Gaudi的AI芯片跟GPU路線圖合二為一,推出一個更整合的GPU的產品。” 大模型的火熱還在持續拉動AI芯片的需求。 Sandra Rivera告訴21世紀經濟報道記者:“在4月份回顧一季度的情況時,我們看到了各種人工智能帶來的芯片需求,包括Gaudi在內,需求至少翻了兩倍以上。” TrendForce集邦咨詢向21世紀經濟報道記者提供的數據顯示,目前主要由搭載NVIDIA A100、H100、AMD(114.58, 3.26, 2.93%) MI300,以及大型CSP業者如Google、AWS等自主研發ASIC的AI服務器成長需求較為強勁,2023年AI服務器出貨量(包含搭載GPU、FPGA、ASIC等)出貨量預估近120萬臺,年增率近38%,AI芯片出貨量同步看漲,可望成長突破五成。 芯片廠商們也在AI領域開足馬力。英偉達不必多言,當前不論是100系列還是800系列,都十分緊缺,在AI芯片市場上占據先發優勢;在6月中旬,AMD推出了新一代AI芯片、數據中心CPU以及DPU,其中AI芯片Instinct MI 300X,直接對標英偉達H100;此外,谷歌(119.62, 1.91, 1.62%)、亞馬遜(130.8, 2.02, 1.57%)、百度(148.83, 5.50, 3.84%)等大廠也都在自研AI芯片,在算力市場上的競爭維度更加豐富。 而除了硬件之外,軟件也同樣關鍵。比如,目前大部分AI芯片都繞不開英偉達的CUDA平臺,CUDA建立了一套軟硬件間的開發標準。如何從CUDA遷移、如何建立自己的優勢生態都是挑戰者的重要課題。 對于軟件生態的競爭,Sandra Rivera表示:“軟件開發或者是開發者生態,其實是英特爾多年的一個強項,在整個數據中心領域的軟件生態中,一個是x86的軟件生態,另外一個是CUDA。而且我們注意到,隨著越來越多的公司希望使用人工智能,軟件生態系統也正在加速挖掘更多硬件潛能,以大幅提高生產力。” 她進一步談道:“英特爾希望能在多種語言環境中,能夠提供更簡便的應用。通過軟件、庫和工具提供一種模塊化的方法,來優化并加速跨多種架構的異構負載。當然在人工智能或者是AI運算的時候,確實很多人在用CUDA,但是大部分開發者不會做那么底層的開發,他們是在一個比較高的框架,比如說在PyTorch、TensorFlow上面去創新。” Habana Labs首席運營官Eitan Medina進一步向21世紀經濟報道記者指出:“在Gaudi2之前,我們已經有一代產品,在軟件上也做了好幾年的積累,底層的軟件庫都已經開發好了,我們希望讓開發者能夠在最上層的20%的比例能夠做他的開發,這里的開發和CUDA并沒有那么直接的關聯。” Gaudi系列作為英特爾AI的一艘旗艦,外界也拭目以待Gaudi 2在實際應用中的性能表現、算力實力。從硬件迭代到軟件生態,AI芯片的競爭故事還將繼續。 |