來(lái)源: 第一財(cái)經(jīng)資訊 上周,百度推出基于大模型的AI聊天機(jī)器人“文心一言”,成為國(guó)內(nèi)首個(gè)沖進(jìn)GPT賽道的互聯(lián)網(wǎng)企業(yè)。3月18日,第一財(cái)經(jīng)記者從達(dá)觀數(shù)據(jù)獲悉,該公司自主研發(fā)的大型語(yǔ)言模型“曹植”系統(tǒng)也取得突破性進(jìn)展,有望成為國(guó)內(nèi)大規(guī)模語(yǔ)言模型中首批可落地的產(chǎn)業(yè)應(yīng)用級(jí)模型。 在國(guó)產(chǎn)版GPT接踵而至的背景下,目前國(guó)內(nèi)的算力平臺(tái)還不足以提供支撐,這也成為制約我國(guó)大模型發(fā)展的重要瓶頸。 垂直大模型也需要上千張GPU 據(jù)介紹,“曹植”與ChatGPT和“文心一言”這類(lèi)更加通用的大語(yǔ)言模型不同,是專(zhuān)注于垂直、專(zhuān)用領(lǐng)域的模型,目標(biāo)是賦能金融、政務(wù)、制造等多個(gè)垂直領(lǐng)域。 達(dá)觀數(shù)據(jù)創(chuàng)始人CEO陳運(yùn)文對(duì)第一財(cái)經(jīng)表示:“‘曹植’在垂直領(lǐng)域內(nèi)的理解和生成的任務(wù)上都達(dá)到了很好的效果。目前在一些技術(shù)細(xì)節(jié)方面還在調(diào)優(yōu),未來(lái)達(dá)觀數(shù)據(jù)將建立多個(gè)垂直領(lǐng)域的專(zhuān)用語(yǔ)言大模型,整體功能會(huì)很有特色。” 他舉例稱(chēng),基于達(dá)觀AIGC智能寫(xiě)作能力,可適配各類(lèi)材料申報(bào)業(yè)務(wù)場(chǎng)景,基于已有各結(jié)構(gòu)化類(lèi)數(shù)據(jù),快速撰寫(xiě)各類(lèi)制式和非制式文檔,應(yīng)用于公文、招投標(biāo)、投行申報(bào)文檔、法律文書(shū)等專(zhuān)業(yè)寫(xiě)作場(chǎng)景。 華為公司創(chuàng)始人任正非近期也對(duì)ChatGPT發(fā)表看法。他表示:“未來(lái)在AI大模型上會(huì)風(fēng)起云涌,不只是微軟一家,人工智能軟件平臺(tái)公司對(duì)人類(lèi)社會(huì)的直接貢獻(xiàn)可能不到2%,98%都是對(duì)工業(yè)社會(huì)、農(nóng)業(yè)社會(huì)的促進(jìn),大家要關(guān)注應(yīng)用。” ChatGPT帶動(dòng)了自然語(yǔ)言處理整體上下游以及芯片的思考和發(fā)展,某種程度上大模型也很可能成為下一代技術(shù)發(fā)展的基礎(chǔ)設(shè)施。中國(guó)建立自己的基礎(chǔ)模型體系已成為必然需求,在這一發(fā)展過(guò)程中,目前國(guó)內(nèi)企業(yè)面臨的普遍問(wèn)題是算力不足。 陳運(yùn)文向第一財(cái)經(jīng)記者坦言,訓(xùn)練一個(gè)垂直的大模型可能需要上千張GPU芯片集群。“現(xiàn)在面臨的問(wèn)題是,我們需要的GPU數(shù)量還遠(yuǎn)遠(yuǎn)不夠,遠(yuǎn)水解不了近渴。”他對(duì)第一財(cái)經(jīng)記者說(shuō)道,“集群需要的GPU數(shù)量很多,建設(shè)周期長(zhǎng)投入大。” 目前支撐包括ChatGPT大模型在內(nèi)的95%用于機(jī)器學(xué)習(xí)的芯片都是英偉達(dá)的A100(或者國(guó)內(nèi)使用的替代產(chǎn)品A800),該芯片的單價(jià)超過(guò)1萬(wàn)美元。此外,英偉達(dá)最新一代的H100芯片的性能也遠(yuǎn)超A100,但價(jià)格也更高,約合25萬(wàn)元人民幣。 除了單個(gè)的芯片之外,英偉達(dá)還出售一個(gè)包含8個(gè)A100的服務(wù)器系統(tǒng)DGX,售價(jià)接近20萬(wàn)美元。分析師和技術(shù)專(zhuān)家估計(jì),訓(xùn)練GPT-3等大型語(yǔ)言模型的耗資可能超過(guò)400萬(wàn)美元。 這對(duì)于大多數(shù)中小企業(yè)而言幾乎是不可能承受的開(kāi)支。在陳運(yùn)文看來(lái),如果有超大中心能夠提供算力租賃的模式,將會(huì)解決中小企業(yè)很大一部分算力不足的問(wèn)題。“國(guó)內(nèi)現(xiàn)有的租賃平臺(tái)的問(wèn)題是算力規(guī)模還太小,而且價(jià)格太高。”陳運(yùn)文告訴第一財(cái)經(jīng)記者。 企業(yè)探索減少對(duì)算力的依賴(lài) 在GPT這類(lèi)大模型問(wèn)世前,國(guó)內(nèi)幾乎沒(méi)有任何應(yīng)用場(chǎng)景需要用到如此大的算力。第一財(cái)經(jīng)記者了解到,商湯科技等國(guó)內(nèi)企業(yè)都擁有自己的超算中心,但這些平臺(tái)僅向定向合作客戶(hù)開(kāi)放;而阿里巴巴等對(duì)外出租的超算平臺(tái)的的算力仍然不足以滿(mǎn)足目前大量的大模型需求。 復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室邱錫鵬教授此前也表示,該實(shí)驗(yàn)室開(kāi)發(fā)的大語(yǔ)言模型MOSS受制于算力資源不足的問(wèn)題。據(jù)介紹,MOSS是基于32張英偉達(dá)A100芯片算力。相比之下,ChatGPT模型背后擁有約3萬(wàn)塊A100芯片,差距接近1000倍。 對(duì)此,邱錫鵬認(rèn)為,在資源有限的情況下發(fā)展大模型的方向是“用規(guī)模較小的模型找到特定的應(yīng)用場(chǎng)景”,例如可以在企業(yè)內(nèi)部私有部署,經(jīng)過(guò)一些數(shù)據(jù)微調(diào)就可以轉(zhuǎn)化為生產(chǎn)力。 作為GPT算力最重要的提供者,英偉達(dá)已經(jīng)在探索新的商業(yè)模式。黃仁勛已經(jīng)表示,英偉達(dá)愿意將人工智能的算力放在云端共享給企業(yè)。 “我們提供的價(jià)值是將原來(lái)需要投入10億美元運(yùn)行CPU的數(shù)據(jù)中心縮減為僅用1億美元就能搞定的數(shù)據(jù)中心,現(xiàn)在將該數(shù)據(jù)中心放在云端共享,意味著可以由100家公司來(lái)分擔(dān)這一成本,因此每家公司支付的實(shí)際上是非常少的費(fèi)用。”他說(shuō)道,“現(xiàn)在企業(yè)可以花一兩千萬(wàn)來(lái)構(gòu)建一個(gè)類(lèi)似GPT的大型語(yǔ)言模型,這是可以支付得起的。” 不過(guò)也有業(yè)內(nèi)人士指出,解決算力問(wèn)題只是開(kāi)發(fā)大模型的第一步。瀾舟科技創(chuàng)始人CEO周明對(duì)第一財(cái)經(jīng)記者表示:“雖然現(xiàn)在算力平臺(tái)不足是行業(yè)面臨的普遍問(wèn)題,但是即便算力問(wèn)題解決了,還是會(huì)有其他問(wèn)題,關(guān)鍵在于對(duì)大模型本質(zhì)的理解需要提升。” 周明表示,在美國(guó)現(xiàn)在大家也是一窩蜂地去搞大模型,其實(shí)很多人對(duì)大模型的機(jī)理理解還停留在比較初步的認(rèn)知,包括大語(yǔ)言模型的工程化管理,缺乏獨(dú)立思考的精神。 周明也同意,未來(lái)大模型的一個(gè)發(fā)展方向是,在算法上進(jìn)行優(yōu)化,從而減少對(duì)模型和算力的依賴(lài)。“比如用很小的GPU也可以做大模型,這個(gè)方向值得關(guān)注。”他對(duì)第一財(cái)經(jīng)記者表示。 |