Graphcore公布首次MLPerf提交結果，AI性能穩居領先地位

發布時間：2021-7-1 21:14 發布者：eechina

關鍵詞： Graphcore , IPU , POD64 , MLPerf

今天Graphcore（擬未科技）正式公布其參與的首次MLPerf提交結果，Graphcore產品表現優異，AI性能穩居領先地位。MLPerf是AI行業最受認可的比較基準測試。此次測試結果顯示，在Graphcore IPU-POD64上，BERT的訓練時間只有9分多鐘，ResNet-50的訓練時間為14.5分鐘，AI性能已達超級計算機級別。

MLPerf還對比了市面上的Graphcore系統與NVIDIA的最新產品，結果證實Graphcore在“每美元性能”（Performance-Per-Dollar）指標上穩居領先地位。對客戶而言，這項重要的第三方測試確認了Graphcore系統不僅具有新一代AI的優異性能，同時在目前的廣泛應用中也表現得更出色。

MLPerf基準測試

對于第一次MLPerf（訓練版本1.0）提交，Graphcore選擇聚焦在關鍵圖像分類和自然語言處理的應用基準測試類別。MLPerf圖像分類基準使用流行的ResNet-50版本1.5模型，在ImageNet數據集上訓練,以達到適用于所有提交情況的準確率。對于自然語言處理，使用了BERT-Large模型和選取的一個代表性片段。該片段大約占總訓練計算工作負載的10%，并使用維基百科數據集進行訓練。Graphcore決定提交使用ResNet-50和BERT的圖像分類和自然語言處理，在很大程度上是由客戶和潛在客戶驅動的，因為這是他們最常用的一些應用和模型。此次在MLPerf測試中的強勁表現，進一步證明了Graphcore系統完全可以滿足當今的AI計算要求。

參與測試的兩個Graphcore系統，IPU-POD16和IPU-POD64，均已在生產中交付給客戶。

• 價格實惠、結構緊湊的5U IPU-POD16系統適用于剛開始構建IPU AI計算能力的企業客戶。它由4個1U的IPU-M2000和1個雙CPU服務器（dual-CPU server）組成，可以提供4 PetaFLOPS的AI處理能力。
• 縱向擴展的IPU-POD64包含16個IPU-M2000和數量靈活的服務器。Graphcore系統實現了服務器和AI加速器的解耦，因此客戶可以根據工作負載指定CPU與IPU的比率。例如，和自然語言處理相比，計算機視覺任務通常對服務器的需求更高。對于MLPerf，IPU-POD64在BERT的提交中使用了1臺服務器，在ResNet-50的提交中使用了4臺服務器。每臺服務器均由2個AMD EPYC CPU驅動。

MLPerf測試包含開放分區和封閉分區兩個提交分區。封閉分區嚴格要求提交者使用完全相同的模型實施和優化器方法，包括定義超參數狀態和訓練時期。開放分區保證和封閉分區完全相同的模型準確性和質量，但支持更靈活的模型實施以促進創新。因此，該分區支持更快的模型實現，更加適應不同的處理器功能和優化器方法。對于像Graphcore IPU這樣的創新架構，開放分區更能體現出產品的優異性能，但Graphcore還是選擇在開放和封閉分區都進行了提交。

測試結果體現了Graphcore系統的優異性能，即使在具有限制規格的開箱即用的封閉分區上也是如此。更令人矚目的是開放分區結果，Graphcore能夠在其中優化部署，以充分利用IPU和系統功能。這更貼近真實應用，支持客戶可以不斷提升其系統性能。

“每美元性能”指標

MLPerf被稱為比較基準，實際上進行直接比較可能很復雜。從相對簡單的硅片到有著昂貴存儲的復雜堆棧式芯片，如今的處理器和系統架構可謂千差萬別。從“每美元性能”角度來看，往往最能夠說明問題。

Graphcore的IPU-POD16是一個5U的系統，標價149,995美元。如前所述，它由4個IPU-M2000加速器以及行業標準主機服務器構成。每個IPU-M2000由4個IPU處理器構成。MLPerf中使用的NVIDIA DGX-A100 640GB是一個6U機盒，標價約為300,000美元（基于市場情報和公布的經銷商定價），有8個DGX A100芯片。IPU-POD16的價格是它的一半。在這個系統中，IPU-M2000的價格和一個DGX A100 80GB的價格是一樣的，或者在更細的層次上，一個IPU的價格是它的四分之一。

在MLPerf比較分析中，Graphcore采用了嚴格監管的封閉分區的結果，并針對系統價格對其進行了歸一化。對于ResNet-50和BERT，很明顯Graphcore系統提供了比NVIDIA產品更好的每美元性能。在IPU-POD16上進行ResNet-50訓練的情況下，Graphcore的每美元性能是NVIDIA的1.6倍。在BERT上，Graphcore的每美元性能是NVIDIA的1.3倍。Graphcore系統的經濟性可以更好地幫助客戶實現其AI計算目標，同時，由于IPU專為AI構建的架構特點，Graphcore系統還可以解鎖下一代模型和技術。

Graphcore高級副總裁兼中國區總經理盧濤表示：“首次提交MLPerf就獲得如此出色的成績，我們感到非常自豪。此次測試還會帶給Graphcore客戶更多價值，因為我們在準備階段所做的所有改進和優化都會反饋到Graphcore軟件棧中。全球范圍內的Graphcore用戶都會從MLPerf測試中受益匪淺，不僅局限于BERT和ResNet-50模型。我們將繼續參與包括訓練和推理在內的MLPerf測試，為追求更優性能、更大規模和添加更多模型，貢獻Graphcore的所有智慧和力量。”

本文地址：http://m.qingdxww.cn/thread-769813-1-1.html 【打印本頁】

本站部分文章為轉載或網友發布，目的在于傳遞和分享信息，并不代表本網贊同其觀點和對其真實性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問題，我們將根據著作權人的要求，第一時間更正或刪除。