Graphcore今日宣布發布最新產品IPU-POD128和IPU-POD256。IPU-POD128和IPU-POD256是Graphcore迄今為止發布的最大型的產品,分別能夠提供32 petaFLOPS和64 petaFLOPS的AI計算。IPU-POD128和IPU-POD256的發布意味著Graphcore進一步擴展了其在超級計算機領域的業務范圍,將為超級計算機領域提供超強AI算力。 IPU-POD128和IPU-POD256的發布進一步兌現了Graphcore在AI旅程的每個階段為客戶提供服務的承諾。IPU-POD16仍然是理想的探索平臺,IPU-POD64適用于想要建立AI計算的客戶,而IPU-POD128和IPU-POD256適合需要實現進一步快速增長的客戶,可以在整個系統中更快地訓練基于Transformer的大型語言模型,在生產中運行大規模商業AI推理應用程序,通過將系統劃分為更小、更靈活的vPOD,為更多開發人員提供IPU訪問權限,或者通過在整個系統中探索GPT和GNN等新興模型來實現科學突破,是云超大規模企業(Cloud Hyperscaler)、國家科學計算實驗室以及在金融服務或制藥等市場擁有大型AI團隊的企業的理想之選。 首批部署IPU-POD128的客戶包括韓國科技巨頭Korea Telecom(KT)。為了不斷滿足日益增長的超大規模AI HPC環境市場需求,KT正與Graphcore合作,將其所擁有的IPU-POD64升級為IPU-POD128,以增加為客戶所提供的“超大規模AI服務”。 KT云/數字體驗業務部高級副總裁Mihee Lee表示:“通過此次升級,預計我們的AI計算規模將增加至32 petaFLOPS的AI計算,使更多元的客戶能夠使用KT的先進AI計算技術進行大規模AI模型訓練和推理。” 與其他IPU-POD系統一樣,AI計算和服務器的解聚意味著IPU-POD128和IPU-POD256可以在優化后,為不同的AI工作負載提供最大性能,實現最佳總體擁有成本(TCO)。例如一個以自然語言處理(NLP)為主的系統可以只使用2臺服務器;而更多的數據密集型任務,例如計算機視覺任務等可以使用8臺服務器。此外,系統存儲可以使用來自Graphcore最近公布的存儲合作伙伴所提供的技術,圍繞特定的AI工作負載進行優化。 廣泛使用的語言和視覺模型的結果顯示,IPU-POD128和IPU-POD256具有極為出色的訓練性能和高效的擴展能力,隨著未來軟件的優化,這兩大產品有望進一步提高性能。 將Graphcore計算擴展到IPU-POD128和IPU-POD256需要大量使能技術支持,其中既包括硬件技術也包括軟件技術。Graphcore將攜手合作伙伴為全球客戶部署IPU-POD256和IPU-POD128,客戶可以從云端或Atos等Graphcore的合作伙伴處獲取IPU-POD256和IPU-POD128。 Atos集團高級副總裁兼HPC和Quantum主管Agnès Boudot表示:“我們十分高興能將IPU-POD128和IPU-POD256加入到我們的Atos ThinkAI產品組合中,使我們的客戶能夠在眾多領域更快探索和部署更大、更具創新性的AI模型。” 如欲了解有關IPU-POD128和IPU-POD256的更多信息,請訪問https://www.graphcore.ai/products/mk2/ipu-pod128和https://www.graphcore.ai/products/mk2/ipu-pod256。 |