來源: 網(wǎng)易科技報道 8月20日消息,美國當(dāng)?shù)貢r間周四,電動汽車制造商特斯拉在“特斯拉AI日”上發(fā)布了自主研發(fā)的AI芯片,用于訓(xùn)練超級計算機Dojo。 特斯拉Dojo項目主管迦乃士·溫卡特摩南(Ganesh Venkataramanan)在當(dāng)天的活動上表示,這款名為D1的芯片是特斯拉Dojo超級計算機系統(tǒng)的重要組成部分,采用7納米制程工藝制造。特斯拉會將一組這樣的芯片放在單獨的“訓(xùn)練瓦”上,以提供9千萬億次計算能力,其中120個訓(xùn)練瓦聚集在幾個服務(wù)器機柜中,相當(dāng)于提供超過1萬萬億次的運算能力。 曾為芯片制造商AMD效力的溫卡特摩南說:“我們很快就會組裝第一批機柜。”他表示,特斯拉的技術(shù)將支持最快的AI訓(xùn)練計算機。芯片制造商英特爾、顯卡制造商英偉達(dá)和初創(chuàng)企業(yè)Graphcore都在制造芯片,這些芯片可以用來訓(xùn)練AI模型。這些芯片可以幫助訓(xùn)練模型識別特斯拉車輛攝像頭收集的視頻流中的各種物品,模型培訓(xùn)往往需要大量的計算工作。 溫卡特摩南稱,首席執(zhí)行官埃隆·馬斯克(Elon Musk)幾年前曾要求特斯拉工程師“設(shè)計超高速訓(xùn)練計算機,這就是我們啟動Dojo項目的原因”。他解釋稱,Dojo是個通過網(wǎng)絡(luò)結(jié)構(gòu)連接的分布式計算體系結(jié)構(gòu),它有大型計算平面、極高的帶寬和低延遲。Dojo是一臺純學(xué)習(xí)機,擁有50多萬個訓(xùn)練節(jié)點。 溫卡特摩南指出,Dojo的全部潛力都被特斯拉用于幫助使自動駕駛汽車成為可能。不過,Dojo的開發(fā)還沒完成,將來它會變得更加強大。馬斯克也表示:“我們應(yīng)該在明年讓Dojo投入運行。” 兩年前,特斯拉開始生產(chǎn)內(nèi)置AI芯片的汽車。這些芯片幫助車載軟件快速做出決定,以應(yīng)對道路上發(fā)生的情況。特斯拉目前為新車型提供了所謂的“全自動駕駛”(FSD)功能。這項售價1萬美元的服務(wù)可以讓汽車自動變換車道、在高速公路上行駛、自動泊車以及支持智能召喚功能。特斯拉表示,今年晚些時候,該套餐還將包括特斯拉在城市街道上自動駕駛的功能,盡管特斯拉此前承諾該功能將于2019年推出。 但特斯拉警告稱,F(xiàn)SD功能依然“需要司機主動監(jiān)督,并不會讓車輛實現(xiàn)自動駕駛”。批評人士表示,特斯拉對其司機輔助駕駛功能的稱呼具有誤導(dǎo)性,因為特斯拉的軟件并不提供L5級自動駕駛功能,即汽車可以在任何情況下完全自動駕駛,無需人類干預(yù)。 此前英偉達(dá)汽車業(yè)務(wù)副總裁丹尼·夏皮羅(Danny Shapiro)在博客文章中指出,特斯拉用于訓(xùn)練自動駕駛深度神經(jīng)網(wǎng)絡(luò)的超級計算機Dojo中使用了英偉達(dá)的GPU芯片。 夏皮羅在博客中指出,特斯拉人工智能高級主管安德烈·卡帕西(Andrej Karpathy) 在6月20日曾就特斯拉的自動駕駛功能做過一次演講。夏皮羅指出,卡帕西當(dāng)時“展示了公司內(nèi)部用于訓(xùn)練自動駕駛深度神經(jīng)網(wǎng)絡(luò)的超級計算機Dojo。”卡帕西說,這可能是世界上第五強的超級計算機。 夏皮羅表示,這臺超級計算機中使用的是英偉達(dá)GPU芯片。他稱,“該集群使用有720個節(jié)點的8倍NVIDIA A100張量核心GPU(總計有5760個GPU),算力達(dá)到業(yè)界領(lǐng)先的1.8 exaflops。” 關(guān)于特斯拉在超級中使用其硬件的原因,夏皮羅解釋稱:“NVIDIA A100 GPU提供了各種規(guī)模的加速能力,為世界上性能最高的數(shù)據(jù)中心提供動力。A100 GPU采用英偉達(dá)Ampere架構(gòu),性能比上一代提高20倍,并可劃分為7個GPU實例,以動態(tài)調(diào)整需求變化。” 夏皮羅稱,“特斯拉的周期性運算始于汽車。一個運行在‘影子模式’下的深層神經(jīng)網(wǎng)絡(luò)會在汽車行駛時悄悄感知并做出預(yù)測,而不需要實際控制車輛。” 這些預(yù)測以及任何關(guān)于周圍環(huán)境的誤判都會被記錄下來。然后,特斯拉工程師會使用這些實例創(chuàng)建一個包含各種不同場景的訓(xùn)練數(shù)據(jù)集,以完善深度神經(jīng)網(wǎng)絡(luò)。 結(jié)果是收集到大約100萬個10秒、每秒36幀的視頻片段,總共有1.5PB的數(shù)據(jù)。深度神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)中心反復(fù)運行這些場景,直到運行無誤。最后再反饋給車載電腦,重復(fù)進(jìn)行這一過程。 特斯拉的卡帕西說,以這種方式訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),需要對海量數(shù)據(jù)進(jìn)行大規(guī)模計算,這使得特斯拉開發(fā)制造出搭載英偉達(dá)A100GPU芯片的超級計算機Dojo。 |