為系統(tǒng)帶來性能突破、實(shí)現(xiàn)本地以太網(wǎng)擴(kuò)展 Habana Labs (www.habana.ai) 宣布推出Habana Gaudi人工智能訓(xùn)練處理器,基于Gaudi的訓(xùn)練系統(tǒng)實(shí)現(xiàn)了比擁有相同數(shù)量的GPU系統(tǒng)高四倍的處理能力。 Gaudi處理器的創(chuàng)新架構(gòu)可實(shí)現(xiàn)訓(xùn)練系統(tǒng)性能的近線性擴(kuò)展,即使是在較小Batch Size的情況下,也能保持高計(jì)算力。因此,基于Gaudi處理器的訓(xùn)練性能可實(shí)現(xiàn)從單一設(shè)備擴(kuò)展至由數(shù)百個(gè)處理器搭建的大型系統(tǒng)的線性擴(kuò)展。 除了領(lǐng)先的性能,Gaudi處理器還為人工智能訓(xùn)練帶來了另一項(xiàng)“行業(yè)第一”。該人工智能處理器片上集成了 RDMA over Converged Ethernet (RoCE v2) 功能,從而讓人工智能系統(tǒng)能夠使用標(biāo)準(zhǔn)以太網(wǎng)擴(kuò)展至任何規(guī)模。憑借Gaudi處理器,Habana Labs的客戶亦可利用標(biāo)準(zhǔn)以太網(wǎng)交換進(jìn)行人工智能訓(xùn)練系統(tǒng)的縱向擴(kuò)展和橫向擴(kuò)展。同時(shí),以太網(wǎng)交換機(jī)已被數(shù)據(jù)中心應(yīng)用于計(jì)算系統(tǒng)和存儲(chǔ)系統(tǒng)的擴(kuò)展中,在速度和端口數(shù)方面可提供幾乎無限的可擴(kuò)展性。另外,與Habana的標(biāo)準(zhǔn)設(shè)計(jì)相比,基于GPU的系統(tǒng)依賴于專有的系統(tǒng)接口,對系統(tǒng)設(shè)計(jì)人員來說,這從本質(zhì)上限制了可擴(kuò)展性和選擇性。 Linley集團(tuán)首席分析師Linley Gwennap評(píng)論說:“Habana Labs推出新產(chǎn)品,其產(chǎn)品組合迅速地從推理處理器擴(kuò)展到訓(xùn)練處理器,涵蓋了神經(jīng)網(wǎng)絡(luò)的所有功能。在眾多的人工智能訓(xùn)練加速器產(chǎn)品中,Gaudi處理器能夠提供強(qiáng)大的性能,達(dá)到行業(yè)領(lǐng)先的能效水平。作為首款集成100G以太網(wǎng)鏈路并支持RoCE的人工智能處理器,Gaudi為使用行業(yè)標(biāo)準(zhǔn)組件構(gòu)建而成的大型加速器集群提供了強(qiáng)大的支持。” Gaudi人工智能訓(xùn)練處理器配備32GB HBM-2內(nèi)存,目前提供兩種規(guī)格: • HL-200 - PCIe卡,設(shè)有8個(gè)100Gb以太網(wǎng)端口; • HL-205 - 基于OCP-OAM標(biāo)準(zhǔn)的子卡,設(shè)有10個(gè)100Gb以太網(wǎng)端口或20個(gè)50Gb以太網(wǎng)端口。 另外,Habana推出了一款名為HLS-1的8-Gaudi系統(tǒng),配備了8個(gè)HL-205子卡、PCIe外部主機(jī)連接器和24個(gè)用于連接現(xiàn)有以太網(wǎng)交換機(jī)的100Gbps以太網(wǎng)端口,讓客戶能夠通過在19英寸標(biāo)準(zhǔn)機(jī)柜中部署多個(gè)HLS-1系統(tǒng)實(shí)現(xiàn)性能擴(kuò)展。 Gaudi處理器是Habana Labs繼去年推出Goya人工智能推理處理器后的第二款人工智能專用處理器。Goya處理器自2018年第四季度開始發(fā)貨,并向業(yè)界展示了領(lǐng)先的推理性能,可實(shí)現(xiàn)業(yè)界最高的吞吐量、功效比(圖片/每秒瓦)以及實(shí)時(shí)。 Habana Labs首席執(zhí)行官David Dahan 表示:“人工智能模型訓(xùn)練所需的計(jì)算能力每年呈指數(shù)增長。因此,提高生產(chǎn)率和可擴(kuò)展性,解決數(shù)據(jù)中心和云計(jì)算對計(jì)算能力的迫切需求成為至關(guān)重要的任務(wù)。憑借Gaudi處理器的創(chuàng)新架構(gòu),Habana Labs帶來了業(yè)界最高的性能,同時(shí)集成了標(biāo)準(zhǔn)以太網(wǎng),進(jìn)而實(shí)現(xiàn)無限可擴(kuò)展性。Gaudi處理器將打破人工智能訓(xùn)練處理器領(lǐng)域的現(xiàn)狀。” Facebook技術(shù)和戰(zhàn)略總監(jiān)Vijay Rao表示:“Facebook正在尋找開放的平臺(tái)以進(jìn)行行業(yè)創(chuàng)新融合。我們很高興看到Habana Labs的Goya人工智能推理處理器為Glow機(jī)器學(xué)習(xí)編譯器實(shí)現(xiàn)后端開源,并且Gaudi人工智能訓(xùn)練處理器采用OCP加速器模塊 (OAM) 規(guī)范。” Gaudi是一款完全可編程且可定制的處理器,搭載第二代Tensor處理核 (TPC) 并集成開發(fā)工具、庫和編譯器,共同提供全面而靈活的解決方案。此外,Habana Labs的SynapseAI軟件棧包含一個(gè)豐富的內(nèi)核庫和開放工具鏈,以供客戶添加專有內(nèi)核。 Habana Labs將于2019年下半年面向特定客戶提供Gaudi人工智能訓(xùn)練處理器的樣品。欲了解更多關(guān)于Gaudi處理器和Goya處理器的信息,敬請瀏覽www.habana.ai。 ![]() ![]() ![]() ![]() 關(guān)于Habana Labs Habana Labs創(chuàng)立于2016年,是一家人工智能 (AI) 處理器開發(fā)商。最初的業(yè)務(wù)為開發(fā)專為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和生產(chǎn)環(huán)境中的推理部署而優(yōu)化的處理器平臺(tái)。Habana Labs致力于釋放人工智能的真正潛力,運(yùn)用其處理器平臺(tái)顯著改善產(chǎn)品的處理性能、擴(kuò)展性、成本和功耗。Habana Labs在特拉維夫、圣何塞、北京、波蘭設(shè)有辦事處,全球員工人數(shù)量為150人。欲了解更多信息,請瀏覽官網(wǎng)pr@habana.ai。 |