国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

Graphcore公布首次MLPerf提交結果,AI性能穩(wěn)居領先地位

發(fā)布時間:2021-7-1 21:14    發(fā)布者:eechina
關鍵詞: Graphcore , IPU , POD64 , MLPerf
今天Graphcore(擬未科技)正式公布其參與的首次MLPerf提交結果,Graphcore產品表現優(yōu)異,AI性能穩(wěn)居領先地位。MLPerf是AI行業(yè)最受認可的比較基準測試。此次測試結果顯示,在Graphcore IPU-POD64上,BERT的訓練時間只有9分多鐘,ResNet-50的訓練時間為14.5分鐘,AI性能已達超級計算機級別。

MLPerf還對比了市面上的Graphcore系統(tǒng)與NVIDIA的最新產品,結果證實Graphcore在“每美元性能”(Performance-Per-Dollar)指標上穩(wěn)居領先地位。對客戶而言,這項重要的第三方測試確認了Graphcore系統(tǒng)不僅具有新一代AI的優(yōu)異性能,同時在目前的廣泛應用中也表現得更出色。

MLPerf基準測試

對于第一次MLPerf(訓練版本1.0)提交,Graphcore選擇聚焦在關鍵圖像分類和自然語言處理的應用基準測試類別。MLPerf圖像分類基準使用流行的ResNet-50版本1.5模型,在ImageNet數據集上訓練,以達到適用于所有提交情況的準確率。對于自然語言處理,使用了BERT-Large模型和選取的一個代表性片段。該片段大約占總訓練計算工作負載的10%,并使用維基百科數據集進行訓練。Graphcore決定提交使用ResNet-50和BERT的圖像分類和自然語言處理,在很大程度上是由客戶和潛在客戶驅動的,因為這是他們最常用的一些應用和模型。此次在MLPerf測試中的強勁表現,進一步證明了Graphcore系統(tǒng)完全可以滿足當今的AI計算要求。

參與測試的兩個Graphcore系統(tǒng),IPU-POD16和IPU-POD64,均已在生產中交付給客戶。

•        價格實惠、結構緊湊的5U IPU-POD16系統(tǒng)適用于剛開始構建IPU AI計算能力的企業(yè)客戶。它由4個1U的IPU-M2000和1個雙CPU服務器(dual-CPU server)組成,可以提供4 PetaFLOPS的AI處理能力。
•        縱向擴展的IPU-POD64包含16個IPU-M2000和數量靈活的服務器。Graphcore系統(tǒng)實現了服務器和AI加速器的解耦,因此客戶可以根據工作負載指定CPU與IPU的比率。例如,和自然語言處理相比,計算機視覺任務通常對服務器的需求更高。對于MLPerf,IPU-POD64在BERT的提交中使用了1臺服務器,在ResNet-50的提交中使用了4臺服務器。每臺服務器均由2個AMD EPYC CPU驅動。

MLPerf測試包含開放分區(qū)和封閉分區(qū)兩個提交分區(qū)。封閉分區(qū)嚴格要求提交者使用完全相同的模型實施和優(yōu)化器方法,包括定義超參數狀態(tài)和訓練時期。開放分區(qū)保證和封閉分區(qū)完全相同的模型準確性和質量,但支持更靈活的模型實施以促進創(chuàng)新。因此,該分區(qū)支持更快的模型實現,更加適應不同的處理器功能和優(yōu)化器方法。對于像Graphcore IPU這樣的創(chuàng)新架構,開放分區(qū)更能體現出產品的優(yōu)異性能,但Graphcore還是選擇在開放和封閉分區(qū)都進行了提交。

測試結果體現了Graphcore系統(tǒng)的優(yōu)異性能,即使在具有限制規(guī)格的開箱即用的封閉分區(qū)上也是如此。更令人矚目的是開放分區(qū)結果,Graphcore能夠在其中優(yōu)化部署,以充分利用IPU和系統(tǒng)功能。這更貼近真實應用,支持客戶可以不斷提升其系統(tǒng)性能。


“每美元性能”指標

MLPerf被稱為比較基準,實際上進行直接比較可能很復雜。從相對簡單的硅片到有著昂貴存儲的復雜堆棧式芯片,如今的處理器和系統(tǒng)架構可謂千差萬別。從“每美元性能”角度來看,往往最能夠說明問題。

Graphcore的IPU-POD16是一個5U的系統(tǒng),標價149,995美元。如前所述,它由4個IPU-M2000加速器以及行業(yè)標準主機服務器構成。每個IPU-M2000由4個IPU處理器構成。MLPerf中使用的NVIDIA DGX-A100 640GB是一個6U機盒,標價約為300,000美元(基于市場情報和公布的經銷商定價),有8個DGX A100芯片。IPU-POD16的價格是它的一半。在這個系統(tǒng)中,IPU-M2000的價格和一個DGX A100 80GB的價格是一樣的,或者在更細的層次上,一個IPU的價格是它的四分之一。

在MLPerf比較分析中,Graphcore采用了嚴格監(jiān)管的封閉分區(qū)的結果,并針對系統(tǒng)價格對其進行了歸一化。對于ResNet-50和BERT,很明顯Graphcore系統(tǒng)提供了比NVIDIA產品更好的每美元性能。在IPU-POD16上進行ResNet-50訓練的情況下,Graphcore的每美元性能是NVIDIA的1.6倍。在BERT上,Graphcore的每美元性能是NVIDIA的1.3倍。Graphcore系統(tǒng)的經濟性可以更好地幫助客戶實現其AI計算目標,同時,由于IPU專為AI構建的架構特點,Graphcore系統(tǒng)還可以解鎖下一代模型和技術。

Graphcore高級副總裁兼中國區(qū)總經理盧濤表示:“首次提交MLPerf就獲得如此出色的成績,我們感到非常自豪。此次測試還會帶給Graphcore客戶更多價值,因為我們在準備階段所做的所有改進和優(yōu)化都會反饋到Graphcore軟件棧中。全球范圍內的Graphcore用戶都會從MLPerf測試中受益匪淺,不僅局限于BERT和ResNet-50模型。我們將繼續(xù)參與包括訓練和推理在內的MLPerf測試,為追求更優(yōu)性能、更大規(guī)模和添加更多模型,貢獻Graphcore的所有智慧和力量。”

本文地址:http://m.qingdxww.cn/thread-769813-1-1.html     【打印本頁】

本站部分文章為轉載或網友發(fā)布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區(qū)
  • 想要避免發(fā)生災難,就用MPLAB® SiC電源仿真器!
  • 為何選擇集成電平轉換?
  • 無線充電基礎知識及應用培訓教程3
  • 無線充電基礎知識及應用培訓教程2
  • 貿澤電子(Mouser)專區(qū)
關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 国产视频一区在线观看 | 国产精品欧美久久久久天天影视 | 国产精品成人免费福利 | 青青青国产免费 | 久久青青草原精品影院 | 在线免费观看日本视频 | 国产人看人摸人啪视 | 日韩成人一级 | 精品综合网 | 爱逼综合| 亚洲成人影院在线 | 亚洲免费人成在线视频观看 | 婷婷色香五月激情综合2020 | 亚洲欧美色视频 | 日韩精品一区二区三区中文在线 | 国产成人综合精品一区 | 国产午夜免费不卡精品理论片 | 啦啦啦免费高清在线影院 | 色播五月激情五月 | 99精品国产福利在线观看 | 男人网站在线亚洲影院 | 亚洲色图视频在线 | 在线观看精品视频一区二区三区 | 寡妇一级a毛片免费播放 | 国产日本欧美在线观看 | 日日摸人人看97人人澡 | 高清日韩在线 | 日韩亚洲欧洲在线rrrr片 | 天天操天天插天天干 | 精品96在线观看影院 | 欧美四虎精品二区免费 | 亚洲综合成人在线 | 亚洲第一精品福利 | 日本aⅴ在线观看 | 久久精品夜夜春 | 91网站入口最新 | 99国产热| 窝窝午夜看片成人精品 | 久久久久久久国产a∨ | 手机看片日韩高清国产欧美 | 四虎在线免费播放 |