來源:中國電子報 日前,IBM蘇黎世研究中心宣布,制造出世界首個人造納米級隨機相變神經元芯片,可實現人工智能的高速無監督學習。外媒對此高度重視并評論道:“這一突破標志著人類在認知計算應用中超密度集成神經形態技術,以及高效節能技術上的發展又向前邁進重要的一步。” 人工智能的火熱,被今年3月份AlphaGo與李世石的圍棋大戰推向高潮,本次IBM人工智能芯片的“生物神經元”、“人腦工作方式”等“高大上”屬性更是引起了業界的廣泛關注。關于類腦計算誰將主導未來趨勢呢? 神經元芯片不屬于生物神經網絡范疇 英特爾中國研究院前院長吳甘沙告訴記者,關于類腦計算,現在也沒有一個廣為接受的定義,但現在基本可以看到兩個方向,人工神經網絡從功能層面模仿大腦的能力,而神經擬態計算(neuromorphic computing)則是從結構層面去逼近大腦,其結構也有兩個層次,一是神經網絡層面,與之相應的是神經擬態架構和處理器,二是神經元層面,與之相應的是元器件。 大家還可以看到其他的一些名詞,比如腦啟發計算(brain inspired computing),基本都是在上述層次里游移。IBM剛剛宣布的人工神經元即是在神經擬態計算方向,在神經元結構層面做出的努力。 “我們稱IBM關注的這類模型為‘脈沖神經網絡’。”北京中科寒武紀科技有限公司創始人兼CEO陳天石在接受記者采訪時指出,“IBM在人造神經元方面的工作,是以新器件的方式直接模仿脈沖神經元的行為,與其前期推出的TrueNorth是一脈相承的。我們不認為它是生物神經網絡,而只是理論神經科學家的一種數學模型。但生物的神經網絡究竟是什么樣,神經科學家都還是一知半解,IBM現在就開始模仿,可能為時過早。” 寒武紀科技的兩個創始人均是中國科學院腦科學與智能技術卓越創新中心的成員,該中心是由世界頂尖神經科學家,美國科學院院士、中國科學院外籍院士蒲慕明教授組建的,挑選了中國科學院最優秀的腦科學和智能技術專家組建,一直密切關注著神經科學的前沿動態。 “從新聞報道的內容來看,IBM推出的人造神經元是屬于脈沖型神經網絡的一款芯片。”作為成功量產中國首款嵌入式神經網絡處理器芯片的企業,中星微電子集團首席技術官張韻東的看法與陳天石相同。 作為人工神經網絡的一種,卷積神經網絡CNN 是當前人工智能機器視覺領域的研究熱點。 張韻東進一步指出,IBM人工神經元與卷積神經網絡處理器芯片(如中星微的“星光智能一號”)相比,共同之處是,都是屬于受到生物人腦機理的啟發而通過半導體電路與器件去實現的,都是采用CMOS半導體工藝來生產的。而不同之處在于,所采用的架構和實現方式不同,前者采用脈沖型架構,用數模混合電路來實現;后者采用卷積型架構,用數據驅動的并行數字電路來實現。 由此看來,不管是叫神經擬態計算,還是叫脈沖神經網絡,IBM的這種技術路線是和人工神經網絡并行的一種技術路線。那么,兩種路線孰優孰劣? 人工神經網絡技術更被看好? 張韻東更看好人工神經網絡。他認為,卷積神經網絡與軟件開發環境的結合更加緊密,更加易于編程,易于商用化。 陳天石也認為,目前為止,脈沖神經網絡與人工神經網絡相比,尚有很大差距。 他舉例道,脈沖神經網絡無法做大尺度的圖像識別,即使是做簡單的手寫數字識別,其識別精度也還沒有上世紀80年代流行的多層感知機(經典的人工神經網絡)做得好。 我們知道,寒武紀科技和中星微電子都是國內致力于人工神經網絡技術路線的企業,他們對IBM人造神經元的看法是否會偏頗? IEEE“神經網絡先鋒獎”獲得者、Facebook人工智能實驗室負責人、人工智能深度學習權威Yann LeCun此前的評論我們可以參考。 對TrueNorth以及IBM一直關注的脈沖神經網絡,Yann LeCun說:“這類網絡沒有在任何有意思的問題上表現出與當前最好技術(指人工神經網絡深度學習技術)接近的結果”。 回答得有點迂回,但表達的意思基本清楚。 脈沖神經網絡芯片商業化還需要好幾年 條條大路通羅馬。不同技術路線的存在,也自有其生存的土壤。 人工神經網絡是從算法向硬件發展的。吳甘沙告訴記者,傳統的算法在通用芯片(CPU和GPU)上效率不高,于是出現了特定的算法加速器,來加速包括卷積神經網絡、遞歸神經網絡在內的各種神經網絡算法。比如Teradeep,它來源于Yann LeCun(上文提到的深度學習大神)的工作NeuFlow,已經實現了商業化。 中國科學院計算技術研究所寒武紀系列芯片在知識產權布局上非常獨到,也開始了商業化的探索。谷歌的TPU(Tensor Processing Unit)也是一種專用的加速器芯片,跟其深度學習軟件Tensor Flow匹配。就中短期而言,這類芯片有很好的商業化前景。 對于神經擬態芯片,常常見諸媒體的是架構和處理器層面的進展。吳甘沙提出,IBM的TrueNorth芯片和高通的Zeroth芯片,兩者都基于脈沖神經網絡。TrueNorth發源于DARPA的SyNAPSE,展示了在100mW功耗下模擬復雜的遞歸神經網絡的能力,體現了這一架構的獨特之處(但也有人指出功耗優勢來自較低的主頻)。Zeroth的商業試用并不成功,目前已轉向人工神經網絡加速器。 英特爾也在做脈沖神經網絡的芯片,估計商業化還需要好幾年。即便如此,各家公司還是投入重兵,因為它所代表的新型處理范式——計算與記憶的一體化、復雜互聯、遞歸、時空編碼、異步、低精度、隨機性、高容錯等特征,有很高的研究價值。例如,生物神經元有很多突觸連接,這在硅芯片上很難實現。另外,傳統的CPU和GPU都是同步的,實現神經擬態需要異步電路。 “所以說,另一種思路是在器件方面得到突破,比如DARPA UPSIDE基于模擬芯片,有些類腦芯片基于憶阻器(memristor),以及IBM剛剛宣布的人工神經元,所有這些都比傳統的晶體管更容易實現類腦計算。”吳甘沙強調。 “IBM的神經元新器件對脈沖神經網絡的硬件實現有很大幫助,但這類模型在算法方面尚有很長的路要走。”陳天石表示,“未來也許會有突破,但近年不樂觀。” 實際上,對于人工神經元芯片的問世,IBM自身也是非常清醒的。他們在指出“這些相變神經元是我們到目前為止所創造出的行為最接近生物神經元的人工器件”的同時,也強調將面臨“更難的部分——編寫一些能夠真正利用該芯片的神經形態的軟件”。 但正如IBM所說:“我們沒有任何理由止步于此。” |