來源:半導體行業觀察 盡管近一年來大模型的熱度居高不下,但AI并不是一項全新的概念。在過去,我們關注的是圖片識別、語音識別、推薦引擎等,但現在我們認識到,從掃描共享單車到瀏覽推薦的短視頻,日常生活中幾乎所有的技術負載都與AI相關。從智能終端到邊緣計算,再到數據中心,AI的應用無處不在,且在計算能力的各個層面上發揮著越來越關鍵的作用。 正因為此,算力需求年年在增加。作為驅動算力提升背后的底層基石,過去幾年,不管是CPU、GPU還是IPU每年都有不同火的點。例如去年整個行業面臨大缺貨的難題,今年龐大的智算算力需求之下,芯片供給端仍然不足。英特爾的技術專家指出,在技術趨勢中,CPU和GPU主要扮演通用與專用計算能力的角色,而IPU則被視為一種技術堆棧架構的計算資源。每種處理器都有其獨特的價值和優點。 然而,觀察長期發展趨勢,我們可以看到計算需求的動態性:很多計算需求可能最初被視為專用計算能力,但隨著其應用的廣泛化,它們逐漸轉變成通用的資源。以人工智能為例,英特爾在其CPU中集成了AVX、AMX等計算引擎,這是基于對AI應用日益普及的觀察,并非僅僅針對專用CPU設計。此外,針對大型公共云環境中的任務卸載,IPU提供了特定的功能,而英特爾DSA等引擎也被集成到CPU中,以便執行通用數據傳輸任務。英特爾一直在通用計算能力和專用計算能力之間,根據市場的動態變化進行的平衡和調整。 不是每個智算中心都需要海量的GPU算力 英特爾數據中心與人工智能集團兼副總裁兼中國區總經理陳葆立表示,目前十分火爆的大模型是一個新的技術演進,但它絕不是一個最終的形態,極可能仍在繼續演進。但是模型的存在推動了數據化和數字化進程,促使企業重新考慮如何高效運作,這無疑是正面的。 AI所需要的算力是非常大的,這給我們帶來了更高的要求,不管是突破硬件的極限,還是創新軟件編程的方式。這種對算力的渴求甚至促使我們重新審視網絡架構,以支撐AI算力節點間日益增長的數據傳輸需求。 陳葆立強調,盡管智算中心和GPU在當前市場中受到熱捧,但不是所有數據中心都必須轉型為智算中心,也不是每個智算中心都需要海量的GPU算力。實際上,許多企業使用最新的至強處理器就能滿足他們的需求。 CPU如何贏得AI市場? 傳統上,在AI市場中,主要以GPU芯片為主導。英特爾CPU想要打AI市場,需要進行哪些工作?對此,英特爾技術專家表示需要做的主要有兩方面:一是需要借助oneAPI這類中間層進行底層硬件適配;二是針對通用的一些接口,如TensorFlow和PyTorch,英特爾提供了一系列量化工具來更精確的進行精度調整。量化又分為兩種情況,一種是訓練和推理階段都做,這樣的效果最好,另一種是只在推理階段做,這在實際應用時更加方便。因此,英特爾的工作重點是提供合適的平臺和支持上層數據適配。 在整個AI市場當中,除了ChatGPT的火爆之外,英特爾所觀察到的另外一大風向是數據中心的節能減碳。算力的持續增加,對電量的使用也異常巨大。據統計,在沒有大模型之前,中國3%的供電都在數據中心,如果繼續下去,會達到4%、5%,而AI大模型算力大爆發下,增速進一步提高。因此,綠色的數據中心顯得尤為重要。英特爾也正在這個領域不斷投入,如液冷方案和智能調度。 其實不僅僅是在數據中心,現在就連PC領域,如聯想,也開始推AI PC的概念。英特爾CEO帕特·基辛格此前曾提到,看好AI PC的原因主要是它解決了兩個問題:一是數據隱私性,個人的數據在小范圍內做小模型訓練會比上傳到大的地方訓練隱私性更好;另一個是網絡持續性,雖然在中國,4G和5G已經非常普遍,但仍會出現網絡卡頓的情況。而當我們在需要這個服務的時候,希望即使在離線的狀態也可以穩定執行,這就是AI PC的作用。 陳葆立表示:“無論是數據中心還是PC,至強可擴展處理器都是一個非常全能的CPU,可以運行包括AI和大模型推理等在內的各種工作負載。但除了芯片本身之外,英特爾更加看重整個數據中心硬件和軟件生態的發展。算力很重要,而更大的內存如HBM,能顯著提高大模型的訓練和推理性能。此外,網絡質量、多卡之間的互連速度和傳輸率也是關鍵的比較點。因此,從這些不同的維度和層面來看,競爭和發展的空間是巨大的。” 陳葆立進一步談到:“我們不希望有一個點是不平衡的,比如某一個地方的算力增加了,但是相匹配的內存、散熱或者軟件跟不上,這對于用戶來說,并沒有很好的應用到整體數據中心該有的性能發揮,所以我們在系統上有多點的投入和投資。”英特爾的愿望一直以來都是想給開發者提供一個完整的體驗,所以在軟件方面,希望不管是至強以及未來的產品上所有的AI軟件棧和軟件工具都能無縫銜接。 在AI市場實際應用的業務方面,陳葆立指出,傳統的互聯網客戶與英特爾的合作非常緊密,例如美團,今年采用了第四代英特爾至強可擴展處理器在一些簡單的AI推理工作上,包括目標識別(Object recognition)或者是計算機視覺(Computer vision)等工作負載,也收獲了不錯的成績。其他的互聯網公司等亦是如此。通過與頭部互聯網的試煉,再將比較好的應用解決方案更好地推廣到更大范圍的企業,如跟橫向或是行業中的軟件商、方案商合作。 “四年五個節點”,下一代至強呼之欲出 英特爾正處于“四年五個制程節點”的飛速進程中,明年是比較重要的至強路線圖升級的一年。下一代至強第一次采用了“雙核并進”的路線圖設計,分別是性能核(P-core)和能效核(E-core),對應的就是Granite Rapids和Sierra Forest這兩個產品,以更好地滿足不同數據中心需求。“我們非常有信心,整個至強處理器的路線圖發展能夠更好地全方位覆蓋客戶需求。”陳葆立表示。 放眼國內的數據中心市場,英特爾觀察到,呈現出“從無到有,從少到多”的發展趨勢。隨著國內數據中心服務器裝機量越來越多,已經從原來單純滿足業務需求轉變為更多的精細化運營,開始關注產品的穩定性、產品的故障率。 英特爾技術專家指出:“目前來說,數據中心故障率最大的來源與內存有關。了解了這一痛點之后,英特爾正在與客戶進行內存故障預測方面的技術創新,通過預先布置好的運維措施和內存技術。以此來盡早的預知故障風險,避免潛在的內存顆粒故障導致系統出錯,最終來增強整個服務器系統的穩定性。” 據英特爾技術專家透露,目前英特爾的這兩款產品在內部的執行、測試、樣品方面都進展的非常順利。國內包括OEM等廠商的通用渠道產品,以及一些大型CSP也都已經開始做定制化產品,而且也陸續有平臺開始應用。 總結 隨著AI技術的不斷成熟和大模型的熱潮不減,英特爾的技術專家和業界領導者們一致認識到,AI的未來不僅在于算力的增長,更在于技術的全面融合與創新。英特爾的前瞻性布局,尤其在“雙軌并進”的產品路線圖設計中體現得淋漓盡致,展示了對不同數據中心需求的深刻理解和高度適應性。此外,英特爾在推動AI市場進步的同時,也在積極響應節能減碳的全球趨勢,投入液冷方案和智能調度等綠色數據中心技術。這不僅符合可持續發展的目標,也體現了企業的社會責任感。 總之,隨著AI技術的日益普及,我們可以預見,英特爾將繼續在這個充滿挑戰和機遇的市場中扮演關鍵角色,引領創新,同時為全球的數字化轉型貢獻力量。 |