“未來(lái)可能不是百模大戰(zhàn),而是萬(wàn)模群舞。”自ChatGPT掀起大模型的發(fā)展熱潮之后,層出不窮的大模型已然蜂擁而入,風(fēng)雷激蕩。但在經(jīng)歷了最初的驚艷之后,行業(yè)已轉(zhuǎn)移到對(duì)商業(yè)化落地的冷靜觀察,一方面業(yè)界認(rèn)可垂直類應(yīng)用模型有望率先實(shí)現(xiàn)落地應(yīng)用,另一方面AI大模型的壓縮和優(yōu)化發(fā)展,使得向邊緣端滲透的步伐也在加快,邊緣算力的重要性正加速凸顯。 以更直觀的數(shù)據(jù)來(lái)看,有預(yù)測(cè)到2030年,邊緣計(jì)算潛在市場(chǎng)將在10年內(nèi)以48%的復(fù)合年增長(zhǎng)率從2020年的90億美元增長(zhǎng)到2030年的4450億美元。而且,中國(guó)是邊緣算力的主戰(zhàn)場(chǎng),預(yù)估到2026年全球26%的網(wǎng)絡(luò)邊緣站點(diǎn)將位于中國(guó)。 通用GPU這一算力主流芯片在經(jīng)過(guò)AI的淬煉之后,如何更進(jìn)一步,承接AI大模型下沉至邊緣端的新機(jī)遇?無(wú)疑,這將更是一場(chǎng)實(shí)打?qū)嵉挠舱獭?/font> 可重構(gòu)架構(gòu)打造算力第三極 在日前舉辦的第六屆世界人工智能大會(huì)(WAIC)上,珠海芯動(dòng)力、天數(shù)智芯、燧原科技、登臨科技、愛(ài)芯元智、沐曦等企業(yè)展出的芯片、加速卡、軟硬件解決方案和廣泛的行業(yè)應(yīng)用,成為WAIC不容錯(cuò)過(guò)的“風(fēng)景”。 在WAIC舞臺(tái)同場(chǎng)競(jìng)技的背后,暗藏的邏輯是通用GPU廠商比拼的賽點(diǎn),已經(jīng)從單純的性能指標(biāo)轉(zhuǎn)向進(jìn)入真實(shí)應(yīng)用場(chǎng)景落地的較量,邊緣側(cè)的競(jìng)奪也走向白熱化。 “隨著AIGC興起,算力將成為重要的生產(chǎn)力。相比云端,邊緣側(cè)應(yīng)用場(chǎng)景更廣泛,也更能促進(jìn)生產(chǎn)力的提升創(chuàng)造價(jià)值,將對(duì)通用GPU產(chǎn)生巨大的市場(chǎng)機(jī)會(huì)。”芯動(dòng)力CEO李原樂(lè)觀表示。 顯然這涉及通用GPU的算力、擴(kuò)展性和編程性、生態(tài)等多維度的比拼。在這一市場(chǎng),英偉達(dá)、AMD、英特爾等占據(jù)強(qiáng)勢(shì)地位,且在當(dāng)下國(guó)內(nèi)半導(dǎo)體制造面臨全面打壓的情形下,我國(guó)通用GPU企業(yè)想要撕開(kāi)一道口子,有專家建議不能按“常理”出牌,需要從架構(gòu)、材料、封裝等層面進(jìn)行創(chuàng)新。 不走尋常路,發(fā)布首款基于可重構(gòu)架構(gòu)的GPGPU芯片RPP-R8的珠海芯動(dòng)力可謂獨(dú)辟蹊徑。該公司在2017年成功研發(fā)出可重構(gòu)并行處理器(RPP)架構(gòu),借助于獨(dú)有的底層硬件架構(gòu),自帶高性能、原生支持CUDA語(yǔ)言和低功耗等“光芒”,可對(duì)AI推理的性能進(jìn)行深度優(yōu)化。 (RPP-六邊形戰(zhàn)士) 芯動(dòng)力創(chuàng)始人李原分析,在可重構(gòu)芯片面世之前,AI算力芯片主要有專用和通用GPU兩大類,專用芯片性能雖強(qiáng)但編程能力差,有的通用GPU可編程性高但算力不強(qiáng),要從激烈的競(jìng)爭(zhēng)中脫穎而出,必須建立強(qiáng)大的優(yōu)勢(shì),而第三類可重構(gòu)芯片則將兩類產(chǎn)品的優(yōu)勢(shì)“合二為一”,將躋身成為通用GPU的新一極。 據(jù)悉,RPP-R8作為一款通用GPU,每顆芯片內(nèi)含有1024個(gè)計(jì)算核,相比傳統(tǒng)GPU架構(gòu)在同樣的算力占用更小的芯片面積,實(shí)現(xiàn)了低功耗和高能效的有效平衡。此外,面積效率比可達(dá)到同類產(chǎn)品的7~10倍,能效比也超過(guò)3倍。而且,除原生支持CUDA之外,芯動(dòng)力還擁有自主開(kāi)發(fā)的工具鏈,使得其能夠在cuDNN和TensorRT上實(shí)現(xiàn)API的兼容,同時(shí)也支持廣泛的人工智能框架,如TensorFlow和Pytorch等,可全面滿足高效并行計(jì)算及AI算力應(yīng)用。 憑借高能效、高算力、低功耗、編程靈活等功力的“加持”,芯動(dòng)力的RPP-R8在邊緣側(cè)的落地也在快馬加鞭。 解決客戶痛點(diǎn) 打開(kāi)落地之旅 觸及落地,盡管RPP-R8的性能和生態(tài)獨(dú)樹(shù)一幟,但作為一個(gè)新生“物種”,仍要面臨逐級(jí)解鎖的過(guò)程。 對(duì)此李原認(rèn)為,邊緣側(cè)的市場(chǎng)巨大,傳統(tǒng)市場(chǎng)的AI加速是剛需,通用GPU可替代專用芯片打入供應(yīng)鏈;而新興市場(chǎng)的需求如智能安防、機(jī)器視覺(jué)等市場(chǎng)也在持續(xù)擴(kuò)容。但落地最重要的是要解決客戶的痛點(diǎn),要厘清市場(chǎng)的規(guī)律。 李原進(jìn)一步剖析,芯片公司容易陷入提倡軟硬件一體化的“怪圈”,但邊緣側(cè)終端客戶對(duì)成本并非那么敏感,從產(chǎn)業(yè)鏈來(lái)看,芯片公司的客戶大都為設(shè)備廠商,處于終端客戶的下游,一方面芯片公司要學(xué)會(huì)將更多利潤(rùn)留給設(shè)備廠商,讓他們有動(dòng)力合作切入市場(chǎng),另一方面芯片公司的客戶大都有實(shí)力進(jìn)行軟件自主開(kāi)發(fā),因而要順應(yīng)軟硬件分離的需求。 “因而,芯動(dòng)力提供的是一個(gè)過(guò)硬的純硬件,加上底層兼容x86、Arm、Windows等軟件系統(tǒng),與其他家的軟件結(jié)合在一起可快速應(yīng)用,讓客戶可順暢地進(jìn)行開(kāi)發(fā),有效幫助企業(yè)降低開(kāi)發(fā)成本和產(chǎn)品周期,加速產(chǎn)品迭代與擴(kuò)展,這是共贏之道和長(zhǎng)久之道。”李原分析說(shuō)。 基于這樣的深刻洞察,加上直擊痛點(diǎn)以及秉承讓利的“哲學(xué)”,讓芯動(dòng)力的產(chǎn)品在落地之旅行進(jìn)在“坦途”之上。李原提到,芯動(dòng)力產(chǎn)品在智能安防、工業(yè)自動(dòng)化等一些行業(yè)因可切實(shí)解決設(shè)備廠商的痛點(diǎn),具有不可替代性,起量非常快,基本已處于拐點(diǎn),更大規(guī)模的出貨將順利推進(jìn)。 而這只是芯動(dòng)力的“一小步”,未來(lái)還有更遼闊的征程。 李原介紹,芯動(dòng)力已推出了基于可重構(gòu)架構(gòu)RPP-R8系列三種不同封裝形式的GPGPU芯片,分別是AE8100、AE7100和AE6100;每一款芯片能夠滿足相對(duì)的應(yīng)用場(chǎng)景需求。 “AE8100芯片面向邊緣服務(wù)器等領(lǐng)域,對(duì)體積、功耗要求較高;AE7100芯片著力面向低功耗、小體積的應(yīng)用場(chǎng)景;AE6100則聚焦于更小體積上承載更大的性能,正在與客戶一起定義,針對(duì)機(jī)器視覺(jué)的Camera,融合信號(hào)采集、圖像處理和GPU加速等功能,以代替前端的ISP,下半年將著重在工業(yè)視覺(jué)領(lǐng)域?qū)崿F(xiàn)新的突破。”李原躊躇滿志表示。 不再跟隨?創(chuàng)新當(dāng)?shù)?/font> 在AIGC熱潮掀起通用GPU的算力革命之際,一個(gè)更值得業(yè)界深思的問(wèn)題也浮出水面。 “業(yè)界均認(rèn)為AIGC大模型是一大風(fēng)口,一大史詩(shī)級(jí)機(jī)遇。但值得深思的是,中國(guó)這么多AI公司和GPU公司,為什么美國(guó)開(kāi)大模型之先河?如果不深刻反省,下次再有風(fēng)口出現(xiàn)時(shí)我們還是被動(dòng)跟隨的境況。”李原的表述中藏著一些深層的內(nèi)省。 李原進(jìn)一步提議,對(duì)國(guó)內(nèi)高科技界來(lái)說(shuō),最重要的是要思考未來(lái)十年會(huì)向什么方向演變?如果只是一味地跟隨或Repeating,實(shí)際上沒(méi)有太大價(jià)值,也走不出這一循環(huán)。 著眼于通用GPU發(fā)展,李原高瞻遠(yuǎn)矚地表示,下一個(gè)十年比拼的是它的效率,而不僅是性能。為持續(xù)降低時(shí)延和提高帶寬,將衍生出眾多新技術(shù),業(yè)界應(yīng)著力解決芯片外部互聯(lián)挑戰(zhàn),并嘗試采用光電子技術(shù),突破原有的方式才有可能實(shí)現(xiàn)超越。 此外,chiplet成為未來(lái)算力芯片“擴(kuò)張”的必然之路,也將產(chǎn)生更多Cost Effective的效果。李原提到,芯動(dòng)力也將在這一方向持續(xù)耕耘,加強(qiáng)與FPGA廠商合作共贏,切入更多場(chǎng)景,為客戶帶來(lái)更具想象力的價(jià)值。 對(duì)于CUDA兼容的走向,李原也洞察道,客戶不在意底層是用CUDA或別的語(yǔ)言,最重要的是能夠快速迭代、快速開(kāi)發(fā)。在已經(jīng)選用了CUDA語(yǔ)言的領(lǐng)域里,我們會(huì)尊重客戶的選擇,但在新的領(lǐng)域里,完全可以有自由的選擇。 伴隨生成式AI帶動(dòng)下的這場(chǎng)新興科技革命,邊緣計(jì)算的價(jià)值將被如芯動(dòng)力這批“搶灘登陸”的企業(yè)率先釋放,而芯動(dòng)力的未來(lái)之路,也將成為國(guó)內(nèi)眾多行業(yè)的數(shù)字化、智能化轉(zhuǎn)型升級(jí)的動(dòng)力之源。 |