來源:量子位(ID:QbitAI) 英偉達的新殺器又來了。 剛剛,在GTC 2018大會上,黃仁勛發布全球最大GPU。 他說的是DGX-2。 DGX-2能夠實現每秒2千萬億次浮點運算(2 PFLOPS),性能比去年9月推出的DGX-1性能提高了10倍,售價39.9萬美元(人民幣250萬元)。 這次的GTC 2018大會在美國加州圣何塞舉行,黃仁勛照例身著皮衣登臺演講。(官方還特別提示:這次是一件全新的皮衣) 而老黃這次的演講主題,是四個Amazing:amazing graphics、amazing science、amazing AI、amazing robots。 首先,從不可思議的圖像開始。 在這個環節里,黃仁勛介紹了英偉達在圖像實時光線追蹤處理方面的最新進展,展示了細膩的反射效果。 這項技術,稱為RTX。它面向圖形領域,借助深度學習技術,實現了實時光線追蹤。 然后黃仁勛發布了首款基于Volta架構的工作站GPU:Quadro GV100。 它支持英偉達RTX技術,支持NVLink 2,32GB容量HBM2顯存。兩個GV100相連,可以提供10000多個CUDA核心,236 teraflops的TensorFlow核心。 說著說著,老黃又開始講這句:買得越多,省得越多。(The more GPUs to buy, the more money you save。) “來GTC,學習如何節省百萬美元。”老黃發出誠懇的建議。 然后進入不可思議的科學環節。 我們正處在GPU計算的關鍵點,黃仁勛表示。這部分他還介紹TESLA V100等產品的多快好省,也談到一些GPU在計算和醫療影像方面的貢獻。 比如醫療影像超級計算機CLARA。 深度學習給醫療影響的識別帶來了諸多變革,但投入到實際使用中卻很難。醫院用著十幾年前生產的超聲儀,黑白渣畫質成了醫療進步的阻礙。 要等所有醫院升級設備,可能要花上30年。 CLARA是一款醫療影像的超級計算機,讓醫院可以升級那些已有的系統。醫生可以仍然用原有的超聲、CT等設備,然后將圖像輸入超級計算機,推理出更清晰的圖像。 在這個項目上,英偉達聯合了一大群醫療行業的合作伙伴: 以及在這個環節,黃仁勛又引導全場跟他念:買得越多,省得越多。 來到不可思議的AI環節。 這個環節的主題是“全球最大的GPU”。 首先,英偉達把Volta V100m每張卡的內存擴大到32GB。適用于內存密集型的深度學習和高性能計算,還能將內存受限的HPC應用性能提升高達50%。 其次,是全新發布的互聯結構NVSwitch,帶寬比最好的PCIe交換機高出5倍,最高支持16個Tesla V100同時以2.4TB/秒的速度進行通信。 最后,一個全新的DGX服務器發布了。 黃仁勛說這個現在是全球最大的GPU了:新的DGX-2,包括20億個晶體管,12個交換機。每個GPU都可以通過光纖交換機互相通信,比PCIe接口快20倍。 DGX-2的算力可達2千萬億次浮點運算,功耗10千瓦。這臺機器內部是NVLink連接的兩組Tesla V100陣列。 與6個月前發布的DGX-1相比,DGX-2提速10倍。 五年前,在兩塊GTX 580上進行Alexnet訓練耗時六天,現在使用DGX-2,可以在18分鐘以內完成。 這款產品將于今年三季度發售,每臺價格39.9萬美元(人民幣250萬元)。 DGX-2具有300臺服務器的深度學習處理能力,占用15個數據中心機架空間,而體積則縮小60倍,能效提升18倍。 此外,英偉達還更新了CUDA、TensorRT、NCCL、cuDNN等深度學習和HPC軟件堆棧。 新版的TensorRT能快速優化、驗證和部署在超大規模的數據中心,針對更廣泛的應用加速深度學習推理。它最高可以 將深度學習推理的速度加快190倍,降低70%的數據中心成本。 TensorRT 4還集成到了谷歌TensorFlow 1.7版本中,更易于使用。 另外,NVIDIA還宣布和ARM合作,將英偉達深度學習加速器架構集成到Arm的Project Trillium上,在手機、智能家居等設備上實現深度學習推理。 以及英偉達GPU現在支持Kubernetes了。這是一個基于容器技術的分布式架構方案。這個技術讓英偉達的GPU進一步加速。 還有一事,英偉達驕傲的宣布,TITAN V仍然斷貨中。 最后是不可思議的機器人環節。 發布了機器人開發工具包Issac SDK之后,話題轉向了自動駕駛。 “我們正試圖從頭到尾了解這個系統,這其中包含四個最重要的方面:數據收集、模型訓練、模擬和駕駛。”老黃說,這個了解過程,大約花了5到7年。 老黃在現場,又展示了一把云代駕。 他把VR和自動駕駛結合起來。通過一個VR眼鏡和方向盤,就能啟動自動駕駛汽車。 云代駕所用的平臺,是新鮮發布的NVIDIA DRIVETM Constellation,基于兩臺服務器。 第一臺服務器運行NVIDIA DRIVE Sim 軟件,用以模擬自動駕駛汽車的傳感器,如攝像頭、激光雷達和雷達。第二臺服務器搭載NVIDIA DRIVE PegasusTM AI汽車計算平臺,可運行完整的自動駕駛汽車軟件堆棧,并能夠處理模擬數據,這些模擬數據如同來自路面行駛汽車上的傳感器。 老黃又詳細介紹了英偉達的感知基礎架構。 每輛汽車都在收集PB級的數據,每個月有1500人大概標注100萬件物品。 老黃表示,英偉達并沒有試圖建立一個基于軟件定義的計算機的自主車輛系統,確切的說是在研究一個架構。 英偉達以Drive PX Parker單芯片架構為基礎創建DRIVE Xavier。這是一個四芯片系統,包含兩個Xaviers和兩個Voltas。 這臺耗能300瓦的電腦正在用于機器人汽車,將于今年晚些時候投入生產。 對了,這項技術英偉達擁有全部產權。 BTW,英偉達今天還宣布暫停了自動駕駛測試。 可能是受此影響,發布會一開始,英偉達股價就同步下跌,至發布會結束,英偉達股價累積下跌6.64%。 |