來源: 網易科技報道 8月20日消息,美國當地時間周四,電動汽車制造商特斯拉在“特斯拉AI日”上發布了自主研發的AI芯片,用于訓練超級計算機Dojo。 特斯拉Dojo項目主管迦乃士·溫卡特摩南(Ganesh Venkataramanan)在當天的活動上表示,這款名為D1的芯片是特斯拉Dojo超級計算機系統的重要組成部分,采用7納米制程工藝制造。特斯拉會將一組這樣的芯片放在單獨的“訓練瓦”上,以提供9千萬億次計算能力,其中120個訓練瓦聚集在幾個服務器機柜中,相當于提供超過1萬萬億次的運算能力。 曾為芯片制造商AMD效力的溫卡特摩南說:“我們很快就會組裝第一批機柜。”他表示,特斯拉的技術將支持最快的AI訓練計算機。芯片制造商英特爾、顯卡制造商英偉達和初創企業Graphcore都在制造芯片,這些芯片可以用來訓練AI模型。這些芯片可以幫助訓練模型識別特斯拉車輛攝像頭收集的視頻流中的各種物品,模型培訓往往需要大量的計算工作。 溫卡特摩南稱,首席執行官埃隆·馬斯克(Elon Musk)幾年前曾要求特斯拉工程師“設計超高速訓練計算機,這就是我們啟動Dojo項目的原因”。他解釋稱,Dojo是個通過網絡結構連接的分布式計算體系結構,它有大型計算平面、極高的帶寬和低延遲。Dojo是一臺純學習機,擁有50多萬個訓練節點。 溫卡特摩南指出,Dojo的全部潛力都被特斯拉用于幫助使自動駕駛汽車成為可能。不過,Dojo的開發還沒完成,將來它會變得更加強大。馬斯克也表示:“我們應該在明年讓Dojo投入運行。” 兩年前,特斯拉開始生產內置AI芯片的汽車。這些芯片幫助車載軟件快速做出決定,以應對道路上發生的情況。特斯拉目前為新車型提供了所謂的“全自動駕駛”(FSD)功能。這項售價1萬美元的服務可以讓汽車自動變換車道、在高速公路上行駛、自動泊車以及支持智能召喚功能。特斯拉表示,今年晚些時候,該套餐還將包括特斯拉在城市街道上自動駕駛的功能,盡管特斯拉此前承諾該功能將于2019年推出。 但特斯拉警告稱,FSD功能依然“需要司機主動監督,并不會讓車輛實現自動駕駛”。批評人士表示,特斯拉對其司機輔助駕駛功能的稱呼具有誤導性,因為特斯拉的軟件并不提供L5級自動駕駛功能,即汽車可以在任何情況下完全自動駕駛,無需人類干預。 此前英偉達汽車業務副總裁丹尼·夏皮羅(Danny Shapiro)在博客文章中指出,特斯拉用于訓練自動駕駛深度神經網絡的超級計算機Dojo中使用了英偉達的GPU芯片。 夏皮羅在博客中指出,特斯拉人工智能高級主管安德烈·卡帕西(Andrej Karpathy) 在6月20日曾就特斯拉的自動駕駛功能做過一次演講。夏皮羅指出,卡帕西當時“展示了公司內部用于訓練自動駕駛深度神經網絡的超級計算機Dojo。”卡帕西說,這可能是世界上第五強的超級計算機。 夏皮羅表示,這臺超級計算機中使用的是英偉達GPU芯片。他稱,“該集群使用有720個節點的8倍NVIDIA A100張量核心GPU(總計有5760個GPU),算力達到業界領先的1.8 exaflops。” 關于特斯拉在超級中使用其硬件的原因,夏皮羅解釋稱:“NVIDIA A100 GPU提供了各種規模的加速能力,為世界上性能最高的數據中心提供動力。A100 GPU采用英偉達Ampere架構,性能比上一代提高20倍,并可劃分為7個GPU實例,以動態調整需求變化。” 夏皮羅稱,“特斯拉的周期性運算始于汽車。一個運行在‘影子模式’下的深層神經網絡會在汽車行駛時悄悄感知并做出預測,而不需要實際控制車輛。” 這些預測以及任何關于周圍環境的誤判都會被記錄下來。然后,特斯拉工程師會使用這些實例創建一個包含各種不同場景的訓練數據集,以完善深度神經網絡。 結果是收集到大約100萬個10秒、每秒36幀的視頻片段,總共有1.5PB的數據。深度神經網絡在數據中心反復運行這些場景,直到運行無誤。最后再反饋給車載電腦,重復進行這一過程。 特斯拉的卡帕西說,以這種方式訓練深度神經網絡,需要對海量數據進行大規模計算,這使得特斯拉開發制造出搭載英偉達A100GPU芯片的超級計算機Dojo。 |