国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

英特爾:Habana Gaudi2性能穩(wěn)超英偉達A100,助力實現(xiàn)高效AI訓(xùn)練

發(fā)布時間:2022-7-4 17:19    發(fā)布者:eechina
關(guān)鍵詞: Habana , Gaudi2 , MLPerf , AI訓(xùn)練
MLPerf測試結(jié)果驗證了Gaudi2在ResNet和BERT模型訓(xùn)練時間上的優(yōu)勢

近日,英特爾宣布Habana Gaudi2深度學(xué)習(xí)處理器在MLPerf行業(yè)測試中表現(xiàn)優(yōu)于英偉達A100提交的AI訓(xùn)練時間,結(jié)果突顯了5月在英特爾On產(chǎn)業(yè)創(chuàng)新峰會上發(fā)布的Gaudi2處理器在視覺(ResNet-50)和語言(BERT)模型上訓(xùn)練時間的優(yōu)勢。

英特爾公司執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理 Sandra Rivera表示:“非常高興能與大家分享Gaudi 2在MLPerf基準(zhǔn)測試中的出色表現(xiàn),我也為英特爾團隊在產(chǎn)品發(fā)布僅一個月取得的成就感到自豪。我們相信,在視覺和語言模型中提供領(lǐng)先的性能能夠為客戶帶來價值,有助于加速其AI深度學(xué)習(xí)解決方案。”

借助Habana Labs的Gaudi平臺,英特爾數(shù)據(jù)中心團隊能夠?qū)W⒂谏疃葘W(xué)習(xí)處理器技術(shù),讓數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)工程師得以高效地進行模型訓(xùn)練,并通過簡單的代碼實現(xiàn)新模型構(gòu)建或現(xiàn)有模型遷移,提高工作效率的同時降低運營成本。

Habana Gaudi2處理器在縮短訓(xùn)練時間(TTT)方面相較第一代Gaudi有了顯著提升。Habana Labs于2022年5月提交的Gaudi2處理器在視覺和語言模型訓(xùn)練時間上已超越英偉達A100-80G的MLPerf測試結(jié)果。其中,針對視覺模型ResNet-50,Gaudi2處理器的TTT結(jié)果相較英偉達A100-80GB縮短了36%,相較戴爾提交的同樣針對ResNet-50和BERT模型、采用8個加速器的A100-40GB服務(wù)器,Gaudi2的TTT測試結(jié)果則縮短了45%。



MLCommons發(fā)布的數(shù)據(jù),2022年6月。https://mlcommons.org/en/training-normal-20/

相比于第一代Gaudi處理器,Gaudi2在ResNet-50模型的訓(xùn)練吞吐量提高了3倍,BERT模型的訓(xùn)練吞吐量提高了4.7倍。這些歸因于制程工藝從16納米提升至7納米、Tensor處理器內(nèi)核數(shù)量增加了三倍、增加GEMM引擎算力、封裝的高帶寬存儲容量提升了三倍、SRAM帶寬提升以及容量增加一倍。對于視覺處理模型的訓(xùn)練,Gaudi2處理器集成了媒體處理引擎,能夠獨立完成包括AI訓(xùn)練所需的數(shù)據(jù)增強和壓縮圖像的預(yù)處理。

兩代Gaudi處理器的性能都是在沒有特殊軟件操作的情況下通過Habana客戶開箱即用的商業(yè)軟件棧實現(xiàn)的。

通過商用軟件所提供的開箱即用性能,在Habana 8個GPU服務(wù)器與HLS-Gaudi2參考服務(wù)器上進行測試比對。其中,訓(xùn)練吞吐量來自于NGC和Habana公共庫的TensorFlow docker,采用雙方推薦的最佳性能參數(shù)在混合精度訓(xùn)練模式下進行測量。值得注意的是,吞吐量是影響最終訓(xùn)練時間收斂的關(guān)鍵因素。


圖形測試配置詳見說明部分。


圖形測試配置見說明部分。

除了Gaudi2在MLPerf測試中的卓越表現(xiàn),第一代Gaudi在128個加速器和256個加速器的ResNet基準(zhǔn)測試中展現(xiàn)了強大的性能和令人印象深刻的近線性擴展,支持客戶高效系統(tǒng)擴展。

Habana Labs首席運營官Eitan Medina表示:“我們最新的MLPerf測試結(jié)果證明Gaudi2在訓(xùn)練性能方面顯著優(yōu)勢。我們將持續(xù)深度學(xué)習(xí)訓(xùn)練架構(gòu)和軟件創(chuàng)新,打造最具性價比的AI訓(xùn)練解決方案。”

關(guān)于MLPerf基準(zhǔn)測試:MLPerf社區(qū)旨在設(shè)計公平且極具實際價值的基準(zhǔn)測試,以公平地測量機器學(xué)習(xí)解決方案的準(zhǔn)確度、速度和效率。該社區(qū)由來自學(xué)術(shù)界、研究實驗室和業(yè)界的AI領(lǐng)導(dǎo)者創(chuàng)建,他們確立基準(zhǔn)并制定了一套嚴(yán)格的規(guī)則,以確保所有參與者均能夠公平公正地進行性能比對。基于一套明確的規(guī)則,以及能夠?qū)Χ说蕉巳蝿?wù)進行公平比較,目前MLPerf是AI行業(yè)唯一可靠的基準(zhǔn)測試。此外,MLPerf基準(zhǔn)測試結(jié)果要經(jīng)過為期一個月的同行評審,這將進一步驗證報告結(jié)果。

本文地址:http://m.qingdxww.cn/thread-795252-1-1.html     【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問題,我們將根據(jù)著作權(quán)人的要求,第一時間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區(qū)
  • 利用SAM E54 Xplained Pro評估工具包演示CAN轉(zhuǎn)USB橋接器以及基于CAN的主機和自舉程序應(yīng)用程序
  • 使用SAM-IoT Wx v2開發(fā)板演示AWS IoT Core應(yīng)用程序
  • 使用Harmony3加速TCP/IP應(yīng)用的開發(fā)培訓(xùn)教程
  • 集成高級模擬外設(shè)的PIC18F-Q71家族介紹培訓(xùn)教程
  • 貿(mào)澤電子(Mouser)專區(qū)
關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 精品卡1卡2卡三卡免费网站视频 | 四虎影片国产精品8848 | 免费99视频有精品视频高清 | 日韩一级片在线观看 | 2021国产麻豆剧果冻传媒入 | 91大神在线精品视频一区 | 亚洲欧美日韩精品久久 | 日本天堂视频在线观看 | 殴美一级 | 国产99精品 | 国产伦一区二区三区四区久久 | 毛片一级在线观看 | 天天干在线免费视频 | 国产一级特黄aa级特黄裸毛片 | 成人 在线欧美亚洲 | 96国产 | 99国产精品农村一级毛片 | 大量国产激情视频在线观看 | 这里只有精品久久 | 免费观看成人久久网免费观看 | 久久久久九九 | 成人免费在线视频网 | 五月天婷婷色综合 | 九色视频网 | 99成人在线观看 | 亚洲精品视频在线观看免费 | 欧美性动态视频 | 中文字幕天堂在线 | 久久久久免费精品国产 | 青青在线 | 就是干就是操 | 国产一国产一有一级毛片 | 亚洲欧洲日产国码久在线观看 | 亚洲国产成人久久 | 四虎影视国产精品亚洲精品hd | 4虎tv| 欧美视频一区二区三区精品 | 色综合天天综久久久噜噜噜久久〔 | 欧美成人午夜精品免费福利 | 久热中文字幕在线精品首页 | 97视频在线 |