來源:全球半導(dǎo)體觀察 ChatGPT大放異彩之后,OpenAI公司于今年春節(jié)期間發(fā)布了文生視頻模型Sora,可以用文字指令生成長達1分鐘的高清視頻,AI技術(shù)從文本、圖像滲透進視頻領(lǐng)域,再次引發(fā)業(yè)界對生成式AI的討論與關(guān)注。 算力硬件是生成式AI的核心底座,核心環(huán)節(jié)包括服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備、芯片、IDC建設(shè)、光通信等。由于生成式AI需要大量計算與數(shù)據(jù)處理,AI芯片需求旺盛增長,以英偉達為代表的半導(dǎo)體大廠業(yè)績與股價暴漲,相關(guān)產(chǎn)品長期供不應(yīng)求。 AI強勢推動下,全球廠商爭相布局AI芯片,我國也不例外。目前國內(nèi)AI芯片廠商有哪些?與英偉達等大廠有何差距,又有哪些自身優(yōu)勢? AI芯片梳理 AI芯片廣義來講,指的是能運行AI算法的芯片。但業(yè)界通常意義的AI芯片是指對AI算法做了特殊加速設(shè)計的芯片,能處理AI應(yīng)用中大量計算任務(wù)的模塊,這一概念下,AI芯片也被稱之為加速器。 按技術(shù)分類,AI芯片主要分為GPU、FPGA、ASIC等;按照功能分類,AI芯片包括訓(xùn)練(training)和推理(inference)兩類;從應(yīng)用場景來看,AI芯片則包括服務(wù)器端與移動端兩類,或者云端、邊緣與終端三類。 圖片來源:全球半導(dǎo)體觀察制表 全球AI芯片市場當(dāng)前基本被以英偉達為代表的歐美大廠主導(dǎo),業(yè)界數(shù)據(jù)顯示,英偉達以80%的市占率幾乎“壟斷”AI芯片市場。我國人工智能產(chǎn)業(yè)起步較晚,近幾年在國際形勢變化以及政策力挺的大環(huán)境下,國內(nèi)AI芯片廠商逐漸嶄露頭角,在終端以及大模型推理方面表現(xiàn)相對出色,不過在門檻更高的GPU以及大模型訓(xùn)練環(huán)節(jié)與國外大廠仍有追趕空間。 GPU為通用型芯片,目前在AI芯片市場用量最大,通用型算力GPU已經(jīng)廣泛應(yīng)用于人工智能模型訓(xùn)練與推理領(lǐng)域。目前英偉達與AMD主導(dǎo)GPU市場,國內(nèi)代表企業(yè)包括海光信息、景嘉微、燧原科技等。 FPGA為半定制芯片,具備低延時,開發(fā)周期短等特性,與GPU相比,其適用于多指令,單數(shù)據(jù)流的分析,而不適合復(fù)雜算法的計算,主要用于深度學(xué)習(xí)算法中的推理階段,美國的賽靈思和英特爾是該領(lǐng)域翹楚,國內(nèi)代表企業(yè)包括百度昆侖芯、深鑒科技等。 ASIC為全定制型AI芯片,在功耗、可靠性、 集成度等方面具備優(yōu)勢,主流產(chǎn)品包括流TPU芯片、NPU芯片、VPU芯片以及BPU芯片等,國外代表廠商包括谷歌、英特爾等,國內(nèi)代表廠商包括華為、阿里巴巴、寒武紀(jì)、地平線等。 國內(nèi)8家AI芯片廠商進展 近年在AI大勢與國產(chǎn)替代東風(fēng)下,國內(nèi)AI芯片廠商抓住機遇加速發(fā)展,不僅百度、阿里巴巴、騰訊和華為等大廠加速自研AI芯片,而且AI芯片公司不斷涌現(xiàn),并深受資本市場青睞。 以下將盤點國內(nèi)8家AI芯片廠商進展: 百度昆侖芯 百度對AI芯片的布局最早可以追溯到2011年,經(jīng)過七年發(fā)展,2018年百度自研AI芯片——昆侖1正式亮相,采用14nm工藝與自研XPU架構(gòu),于2020年量產(chǎn),主要應(yīng)用于百度搜索引擎、小度等業(yè)務(wù)。2021年3月,百度昆侖芯片完成獨立融資,同年8月,百度宣布第2代自研AI芯片——昆侖2正式量產(chǎn),采用7nm制程,搭載自研的第二代XPU架構(gòu),相比1代性能提升2-3倍,通用性、易用性方面顯著增強。 百度昆侖芯前兩代的產(chǎn)品已有數(shù)萬片部署,第三代產(chǎn)品有望在2024年4月舉辦的百度Create AI開發(fā)者大會上亮相。 阿里平頭哥 阿里平頭哥于2018年9月成立,是阿里巴巴全資半導(dǎo)體芯片業(yè)務(wù)主體,擁有端云一體全棧產(chǎn)品系列,涵蓋數(shù)據(jù)中心芯片、IoT芯片、處理器IP授權(quán)等,實現(xiàn)芯片端到端設(shè)計鏈路全覆蓋。 AI芯片布局上,阿里平頭哥2019年9月推出了其首款高性能人工智能推理芯片——含光800,基于12nm工藝與自研架構(gòu),集成了170億晶體管,性能峰值算力達820 TOPS。在業(yè)界標(biāo)準(zhǔn)的ResNet-50測試中,推理性能達到78563 IPS,能效比達500 IPS/W。 2023年8月,阿里平頭哥發(fā)布了首個自研RISC-V AI平臺,支持運行170余個主流AI模型,推動RISC-V進入高性能AI應(yīng)用時代。同時,平頭哥宣布玄鐵處理器C920全新升級,C920執(zhí)行GEMM(矩陣的矩陣乘法)計算較Vector方案可提速15倍。 2023年11月,阿里平頭哥玄鐵RISC-V上新了三款基于軟硬協(xié)同新范式的處理器(C920、C907、R910),大幅提升了加速計算能力、安全性及實時性,有望加速推動RISC-V在自動駕駛、人工智能、企業(yè)級SSD、網(wǎng)絡(luò)通信等場景和領(lǐng)域的大規(guī)模商用落地。 騰訊 2021年11月,騰訊宣布在三款芯片上已有實質(zhì)性進展,分別為針對AI計算的紫霄、用于視頻處理的滄海以及面向高性能網(wǎng)絡(luò)的玄靈,其中紫霄已經(jīng)流片成功并點亮。 據(jù)悉,紫霄采用自研存算架構(gòu)和自研加速模塊,可以提供高達3倍的計算加速性能和超過45%的整體成本節(jié)省。紫霄芯片為騰訊內(nèi)部使用,不對外銷售,騰訊通過其云服務(wù)出租算力獲利。 近期,媒體報道知情人士稱騰訊正考慮將紫霄V1作為英偉達A10芯片的替代品,用于AI圖像和語音識別應(yīng)用。此外,騰訊還將推出針對AI訓(xùn)練優(yōu)化的紫霄V2 Pro芯片,以在未來取代英偉達L40S芯片。 華為 華為在2018全聯(lián)接大會上提出了華為AI戰(zhàn)略和全棧全場景AI解決方案,并發(fā)布了2顆全新的AI芯片:昇騰910(Ascend 910)和昇騰310(Ascend 310)。 兩款A(yù)I芯片均基于華為自研達芬奇架構(gòu),其中Ascend 910(用于訓(xùn)練)采用7nm工藝,半精度達256TFOPs,功耗為350W,運算密度超越了英偉達Tesla V100和谷歌TPU v3。昇騰310屬于Ascend-mini系列第一顆華為商用AI SoC芯片,面向邊緣計算等低功耗領(lǐng)域。 基于昇騰910、昇騰310 AI芯片,華為還推出了Atlas AI計算解決方案。華為昇騰社區(qū)顯示,目前 Atlas 300T 產(chǎn)品有三個型號,分別對應(yīng)昇騰 910A、910B、910 Pro B,最大 300W 功耗,前兩者 AI 算力均為 256 TFLOPS,而 910 Pro B 可達 280 TFLOPS(FP16)。據(jù)悉,華為昇騰芯片910B在2023年已經(jīng)獲得了大客戶至少5000套的訂單,預(yù)計會在2024年交付。業(yè)界認(rèn)為,華為昇騰910B能力已經(jīng)基本做到可對標(biāo)英偉達A100。 由于國內(nèi)對于華為昇騰910B等國產(chǎn)AI芯片的需求激增,路透社近期報道華為計劃優(yōu)先生產(chǎn)昇騰910B,而這可能將會影響到Mate 60系列所搭載的麒麟9000s芯片的產(chǎn)能。 寒武紀(jì) 寒武紀(jì)成立于2016年,專注于人工智能芯片產(chǎn)品的研發(fā)與技術(shù)創(chuàng)新,提供云邊端一體、軟硬件協(xié)同、訓(xùn)練推理融合、具備統(tǒng)一生態(tài)的系列化智能芯片產(chǎn)品和平臺化基礎(chǔ)系統(tǒng)軟件,產(chǎn)品廣泛應(yīng)用于服務(wù)器廠商和產(chǎn)業(yè)公司。 成立以后,寒武紀(jì)推出多款芯片產(chǎn)品,覆蓋終端、云端與邊緣領(lǐng)域。其中終端芯片包括寒武紀(jì)1A、寒武紀(jì)1H、寒武紀(jì)1M 系列智能處理器;云端智能加速卡包括思元100、思元270、思元 290芯片和思元370;邊緣智能加速卡包括思元220芯片。 其中,思元290智能芯片是寒武紀(jì)的首顆訓(xùn)練芯片,采用臺積電7nm先進制程工藝,集成460億個晶體管,支持MLUv02擴展架構(gòu),全面支持AI訓(xùn)練、推理或混合型人工智能計算加速任務(wù)。思元370則為該公司的主力產(chǎn)品,采用是7nm制程工藝,同時支持推理和訓(xùn)練任務(wù)。此外,思元370也是寒武紀(jì)首款采用chiplet(芯粒)技術(shù)的AI芯片,集成了390億個晶體管,最大算力高達256TOPS(INT8)。 璧仞科技 壁仞科技創(chuàng)立于2019年,發(fā)展路徑上,壁仞科技將首先聚焦云端通用智能計算,逐步在人工智能訓(xùn)練和推理、圖形渲染等多個領(lǐng)域趕超現(xiàn)有解決方案,實現(xiàn)國產(chǎn)高端通用智能計算芯片的突破。壁仞科技已完成B輪融資,總?cè)谫Y額超50億元人民幣,是國內(nèi)成長勢頭最為迅猛的“獨角獸”企業(yè)之一。 2021年,壁仞科技首款通用GPU芯片BR100系列正式交付開始流片,2022年3月BR100成功點亮,同年8月BR100正式發(fā)布。 據(jù)悉,BR100系列基于壁仞科技自主原創(chuàng)的芯片架構(gòu)開發(fā),采用成熟的7納米工藝制程,集成770億晶體管,16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單芯片峰值算力達到PFLOPS級別。同時,BR100結(jié)合了包括Chiplet(芯粒技術(shù))等在內(nèi)的多項業(yè)內(nèi)前沿芯片設(shè)計、制造與封裝技術(shù),具有高算力、高能效、高通用性等優(yōu)勢。 地平線 地平線是國內(nèi)高效能智能駕駛計算方案提供商,于2015年7月成立,經(jīng)過幾年發(fā)展,陸續(xù)推出多款A(yù)I芯片,產(chǎn)品主要包含旭日與征程系列,其中旭日系列面向AIOT市場,征程系列面向智能駕駛領(lǐng)域。 目前旭日系列已經(jīng)發(fā)展至第三代,旭日3M和旭日3E,分別對應(yīng)高端和低端市場。性能方面,只需在 2.5W 的功耗下,旭日3能夠達到等效 5TOPS 的標(biāo)準(zhǔn)算力,較前一代大幅升級。 征程系列目前已經(jīng)迭代至第五代,征程5芯片于2021年發(fā)布,2022年9月全球首發(fā)量產(chǎn),單顆芯片AI算力最高可達128 TOPS,支持16路攝像頭,可滿足車廠高級別自動駕駛的量產(chǎn)需求。 2023年11月,地平線宣布征程6系列將于2024年4月正式發(fā)布,并于2024年第四季度完成首批量產(chǎn)車型交付。據(jù)悉,已有多家車企與地平線達成意向合作,包括比亞迪、廣汽集團、大眾汽車集團旗下軟件公司CARIAD、博世等汽車領(lǐng)域頭部企業(yè)。 燧原科技 燧原科技于2018年3月成立,專注人工智能領(lǐng)域云端和邊緣算力,成立5年多已建成云端訓(xùn)練和云端推理兩條產(chǎn)品線,并開發(fā)出云燧®T10、云燧®T20/T21訓(xùn)練產(chǎn)品以及云燧®i10、云燧®i20等推理產(chǎn)品。 燧原科技已于2023年9月宣布完成D輪融資20億元人民幣,由上海國際集團旗下子公司及產(chǎn)業(yè)基金,包括國際資管、國鑫創(chuàng)投、國方創(chuàng)新、金浦投資旗下上海金融科技基金、國和投資聯(lián)合領(lǐng)投,騰訊、美圖公司、武岳峰科創(chuàng)、允泰資本、弘卓資本、紅點中國、廣發(fā)乾和、達泰資本、浦東投控等多家新老股東跟投。 另據(jù)媒體報道,燧原科技第三代AI芯片產(chǎn)品將于2024年初上市。 結(jié)語 展望未來,業(yè)界持續(xù)看好AI商用發(fā)展,并認(rèn)為AI將使得大規(guī)模算力需求出現(xiàn)大量缺口,AI芯片市場前景值得期待。業(yè)界數(shù)據(jù)顯示,2022年全球AI芯片市場規(guī)模已經(jīng)達到了5800億美元,預(yù)計到2030年將超過萬億美元。 以英偉達為代表的頭部AI芯片廠商自然將繼續(xù)受益,與此同時國內(nèi)AI芯片廠商也有機會在AI巨大風(fēng)口下,縮小差距,加速成長。 |