為系統帶來性能突破、實現本地以太網擴展 Habana Labs (www.habana.ai) 宣布推出Habana Gaudi人工智能訓練處理器,基于Gaudi的訓練系統實現了比擁有相同數量的GPU系統高四倍的處理能力。 Gaudi處理器的創新架構可實現訓練系統性能的近線性擴展,即使是在較小Batch Size的情況下,也能保持高計算力。因此,基于Gaudi處理器的訓練性能可實現從單一設備擴展至由數百個處理器搭建的大型系統的線性擴展。 除了領先的性能,Gaudi處理器還為人工智能訓練帶來了另一項“行業第一”。該人工智能處理器片上集成了 RDMA over Converged Ethernet (RoCE v2) 功能,從而讓人工智能系統能夠使用標準以太網擴展至任何規模。憑借Gaudi處理器,Habana Labs的客戶亦可利用標準以太網交換進行人工智能訓練系統的縱向擴展和橫向擴展。同時,以太網交換機已被數據中心應用于計算系統和存儲系統的擴展中,在速度和端口數方面可提供幾乎無限的可擴展性。另外,與Habana的標準設計相比,基于GPU的系統依賴于專有的系統接口,對系統設計人員來說,這從本質上限制了可擴展性和選擇性。 Linley集團首席分析師Linley Gwennap評論說:“Habana Labs推出新產品,其產品組合迅速地從推理處理器擴展到訓練處理器,涵蓋了神經網絡的所有功能。在眾多的人工智能訓練加速器產品中,Gaudi處理器能夠提供強大的性能,達到行業領先的能效水平。作為首款集成100G以太網鏈路并支持RoCE的人工智能處理器,Gaudi為使用行業標準組件構建而成的大型加速器集群提供了強大的支持。” Gaudi人工智能訓練處理器配備32GB HBM-2內存,目前提供兩種規格: • HL-200 - PCIe卡,設有8個100Gb以太網端口; • HL-205 - 基于OCP-OAM標準的子卡,設有10個100Gb以太網端口或20個50Gb以太網端口。 另外,Habana推出了一款名為HLS-1的8-Gaudi系統,配備了8個HL-205子卡、PCIe外部主機連接器和24個用于連接現有以太網交換機的100Gbps以太網端口,讓客戶能夠通過在19英寸標準機柜中部署多個HLS-1系統實現性能擴展。 Gaudi處理器是Habana Labs繼去年推出Goya人工智能推理處理器后的第二款人工智能專用處理器。Goya處理器自2018年第四季度開始發貨,并向業界展示了領先的推理性能,可實現業界最高的吞吐量、功效比(圖片/每秒瓦)以及實時。 Habana Labs首席執行官David Dahan 表示:“人工智能模型訓練所需的計算能力每年呈指數增長。因此,提高生產率和可擴展性,解決數據中心和云計算對計算能力的迫切需求成為至關重要的任務。憑借Gaudi處理器的創新架構,Habana Labs帶來了業界最高的性能,同時集成了標準以太網,進而實現無限可擴展性。Gaudi處理器將打破人工智能訓練處理器領域的現狀。” Facebook技術和戰略總監Vijay Rao表示:“Facebook正在尋找開放的平臺以進行行業創新融合。我們很高興看到Habana Labs的Goya人工智能推理處理器為Glow機器學習編譯器實現后端開源,并且Gaudi人工智能訓練處理器采用OCP加速器模塊 (OAM) 規范。” Gaudi是一款完全可編程且可定制的處理器,搭載第二代Tensor處理核 (TPC) 并集成開發工具、庫和編譯器,共同提供全面而靈活的解決方案。此外,Habana Labs的SynapseAI軟件棧包含一個豐富的內核庫和開放工具鏈,以供客戶添加專有內核。 Habana Labs將于2019年下半年面向特定客戶提供Gaudi人工智能訓練處理器的樣品。欲了解更多關于Gaudi處理器和Goya處理器的信息,敬請瀏覽www.habana.ai。 ![]() ![]() ![]() ![]() 關于Habana Labs Habana Labs創立于2016年,是一家人工智能 (AI) 處理器開發商。最初的業務為開發專為深度神經網絡訓練和生產環境中的推理部署而優化的處理器平臺。Habana Labs致力于釋放人工智能的真正潛力,運用其處理器平臺顯著改善產品的處理性能、擴展性、成本和功耗。Habana Labs在特拉維夫、圣何塞、北京、波蘭設有辦事處,全球員工人數量為150人。欲了解更多信息,請瀏覽官網pr@habana.ai。 |