來源:遠(yuǎn)川研究所 后疫情時代,不造兩顆芯片似乎都不好意思叫大廠。最近,字節(jié)和快手也加入了造芯群聊。 字節(jié)的芯片團(tuán)隊(duì)劃出了服務(wù)器芯片、AI芯片、視頻云芯片三大類。快手發(fā)布了視頻云服務(wù)品牌StreamLake,推出云端智能視頻處理SoC芯片SL200。據(jù)其官方介紹,這款芯片視頻壓縮速率是“世界上最快的”。 鈔能力大廠的加入直接推高了芯片設(shè)計人才的薪酬待遇,去年,百度的3個芯片相關(guān)人才被截胡,據(jù)HR部門透露,原因是“他們給的太多了”。 千方百計轉(zhuǎn)行的集成電路專業(yè)學(xué)生,突然發(fā)現(xiàn)自己成為了大廠香餑餑。這讓吃瓜群眾多少有些猝不及防,硬科技的大旗怎么說扛就扛了? 01 大廠都在造什么芯? 關(guān)于大廠造芯這件事,首先要明確兩個基本事實(shí): 1.互聯(lián)網(wǎng)公司造芯片是件很正常的事,不僅中國公司造,谷歌和亞馬遜也造。 2.不過,互聯(lián)網(wǎng)公司造的芯片,跟解決“卡脖子”問題沒有太大關(guān)系。 早在2013年,谷歌就開始研發(fā)用于AI場景的TPU芯片,解決公司內(nèi)部日益龐大運(yùn)算需求與成本問題[1]。 當(dāng)時,谷歌旗下已經(jīng)有圖像搜索、谷歌照片、云視覺API、谷歌翻譯等和AI掛鉤的業(yè)務(wù),在這之后又收購了知名AI獨(dú)角獸企業(yè)DeepMind,要支撐這么多產(chǎn)品和服務(wù),數(shù)據(jù)中心的算力恐怕得再翻一倍。 2017年的烏鎮(zhèn)圍棋峰會,強(qiáng)化版AlphaGo2.0以碾壓式優(yōu)勢三比零全勝,對弈結(jié)束后柯潔放聲痛哭,靠的就是TPU芯片。 亞馬遜也在2013年推出了Nitro1芯片,同樣是服務(wù)自身業(yè)務(wù)。時至今日,亞馬遜已經(jīng)坐擁網(wǎng)絡(luò)芯片、服務(wù)器芯片和人工智能機(jī)器學(xué)習(xí)芯片三條產(chǎn)品線,8年倒騰出9顆芯。 幾年后,這股造芯熱傳遞到國內(nèi),大廠陸續(xù)加入群聊。 2017年,百度和老牌半導(dǎo)體公司賽靈思合作了一款XPU芯片,并在此基礎(chǔ)上自研了云端全功能AI芯片“昆侖”。 昆侖1經(jīng)由三星代工成功量產(chǎn),在百度搜索引擎及云計算上已經(jīng)部署了兩萬片。2021年,智能芯片及架構(gòu)部門干脆被拆分出來獨(dú)立融資,估值130個億,同時昆侖2進(jìn)入量產(chǎn)。 阿里巴巴則全資收購了中天微(擁有大陸唯一自主嵌入式CPU IP Core),把它和達(dá)摩院芯片團(tuán)隊(duì)合并,成立全資子公司“平頭哥半導(dǎo)體”。 目前平頭哥共有玄鐵(處理器IP)、羽陣(RFID芯片)、倚天(ARM服務(wù)器芯片)和含光(高性能AI推理芯片)四個產(chǎn)品系列。據(jù)稱玄鐵系列處理器出貨量已超20億,超過200家企業(yè)在用。 騰訊去年一口氣發(fā)布了AI推理芯片“紫霄”、視頻轉(zhuǎn)碼芯片“滄海”、智能網(wǎng)卡芯片“玄靈”三款產(chǎn)品。還先后入股了國產(chǎn)DRAM廠商長鑫儲存、DPU獨(dú)角獸云豹智能、芯片新秀光舟半導(dǎo)體等,還高薪收編造芯人才。 拋開大廠在產(chǎn)業(yè)鏈上的投資,單純看自研芯片,它們的特點(diǎn)非常相似:大部分都是通用性不高的專項(xiàng)芯片。 舉例來說,所謂通用芯片,如英偉達(dá)的GPU,可以勝任游戲、渲染、AI、挖礦等多個場景;而專項(xiàng)芯片大多僅用于某個非常細(xì)分的場景,比如世紀(jì)初曾誕生過一類名為PPU(Physics processing Unit)的芯片,獨(dú)立于CPU和GPU之外,專門處理3D游戲中對物理效果的模擬。 平頭哥自研的“含光800”就專門服務(wù)于淘寶的按圖識別商品的功能“拍立淘”,5分鐘就能完成10億張“拍立淘”商品圖的識別,而傳統(tǒng)的GPU處理需要1小時。 比如淘寶的按圖識別商品功能“拍立淘”,這是阿里決戰(zhàn)購物節(jié)的法寶之一。用上平頭哥的AI推理專項(xiàng)芯片“含光800”后,5分鐘就能完成10億張“拍立淘”商品圖的識別,而傳統(tǒng)的GPU處理卻需要1小時。 簡單來說,專項(xiàng)芯片犧牲了通用性,強(qiáng)化了某一特定功能。英偉達(dá)做芯片的時候,既要服務(wù)谷歌、亞馬遜,也要服務(wù)特斯拉和蔚來,還要考慮廣大游戲玩家和礦老板,這就是“通用性”。 而放在專項(xiàng)芯片上,研發(fā)AI推理芯片,不會考慮做AI訓(xùn)練這個場景。阿里給淘寶業(yè)務(wù)做芯片,也不會考慮拼多多用著順不順手。 由于極度專精,專項(xiàng)芯片的技術(shù)門檻相對有限。在設(shè)計這一環(huán)上,用在邊緣側(cè)、還有終端的很多芯片,干脆采用ARM和RISC-V等精簡架構(gòu),指令集都是開源的;而一些專用性比較強(qiáng)的芯片,甚至完全可以采用自研架構(gòu)。 所以,互聯(lián)網(wǎng)公司自研芯片,最大的目的恰恰是他們目前正在做的事情:降本增效。 02 還是為了省錢 今年4月,谷歌發(fā)布了自研視頻處理芯片Argos VCU,替換掉了數(shù)千萬個英特爾CPU,一舉為谷歌節(jié)省了200億人民幣的資本開支。亞馬遜通過自研芯片處理Alexa語音助手的運(yùn)算,成功替代了英偉達(dá)的芯片,降低了30%的成本。 自有芯片推出一年時間內(nèi),亞馬遜云服務(wù)全年降價次數(shù)超過9次,成功帶動下游客戶一塊降本增效。 所以,性價比才是大廠造芯的第一動力。比如,騰訊的“玄靈”就是把虛擬化這種不太重要的功能,讓自研的專項(xiàng)芯片處理,那么成本更高的CPU就可以騰出精力,處理更重要的事情。 騰訊、字節(jié)和快手都在投入音視頻云處理專項(xiàng)芯片,追求在更高壓縮率、更小帶寬下傳輸內(nèi)容,要知道大廠們的帶寬支出常年占比近10%,快手的帶寬量級已經(jīng)接近上百TB[3],有了專項(xiàng)芯片幫忙可以省不少錢。 簡單來說,在流媒體播放、語音識別等特定場景中,可以用CPU/GPU這類通用芯片處理,代價就是效率不高、成本不低。因此,當(dāng)業(yè)務(wù)量大到一定程度后,自研的專項(xiàng)芯片就是性價比更好的選擇了。 在獨(dú)立自主語境下,輿論期待大廠們和高通/AMD這類通用芯片設(shè)計公司硬碰硬,但這并不符合商業(yè)邏輯。 即便是蘋果這樣的公司,他們研發(fā)M1芯片的時候,也是從一些細(xì)分場景入手,比如突出剪輯、視頻處理等特定場景上的更強(qiáng)表現(xiàn),以及和macOS的適配,而不是全方位“吊打英特爾”。 雖然蘋果聲稱新的M1芯片對比此前的處理器性能有數(shù)倍提升,但芯片剛問世時,MacBook Pro只有低配版采用了M1芯片;高配版仍然搭載英特爾i5-1038NG7處理器,并且價格貴得多。在Mac mini上也類似,其高配版仍在使用第八代的英特爾六核i5處理器。 以蘋果的體量,尚且要避開鋒芒差異化競爭,以卵擊石的后果可想而知。 小米曾經(jīng)高調(diào)進(jìn)入SoC的開發(fā),外界盛傳,小米重注押寶的手機(jī)SoC澎湃S2在多次流片試產(chǎn)后以失敗告終,保守估計燒掉了三億人民幣的研發(fā)費(fèi)用。 另一個典型的失敗案例是三星,2015年,三星首次推出貓鼬M1架構(gòu),并在部分旗艦手機(jī)GalaxyS7和Note7中采用,矛頭直指蘋果的A系列SoC。 貓鼬架構(gòu)一路迭代到了M5,但性能一直落后于高通和蘋果,最終在2019年被徹底放棄。 國內(nèi)絕大多數(shù)的芯片設(shè)計公司,發(fā)展策略都是瞄準(zhǔn)一個細(xì)分場景,從通用性不高的芯片開始做,比如壁仞科技、天數(shù)智芯、沐曦等國內(nèi)初創(chuàng)GPU企業(yè),大多都繞道瞄準(zhǔn)B端\G端數(shù)據(jù)中心的GPGPU需求,砍掉了數(shù)據(jù)中心里并不需要的圖形處理功能,在一些垂直領(lǐng)域足夠和巨頭殺幾個來回了。 對這些公司來說,從專項(xiàng)芯片做起是一條更實(shí)際的路徑,一上來就高舉高打,在通用場景里和巨頭硬碰硬并不明智。事實(shí)上,英偉達(dá)的GPU一開始也是游戲場景里的專項(xiàng)芯片,然后擴(kuò)展到了AI、虛擬貨幣等場景。 互聯(lián)網(wǎng)公司的確很有錢,但造芯片的花銷更大,先進(jìn)制程芯片尤甚。 7nm工藝芯片流片一次需要3000萬美元,5nm的流片成本更是達(dá)到4725萬美元,就這還沒有計入前期購買芯片IP的成本、購買芯片設(shè)計軟件EDA的成本、動輒百萬年薪的芯片設(shè)計人才的工資成本等等一系列投入。 對造芯來說,一年花一個億,只夠在新手村練級。 通常情況下,只有蘋果、華為這樣的公司,能依靠產(chǎn)品的龐大出貨量覆蓋研發(fā)CPU等通用芯片的成本。而對缺乏終端產(chǎn)品的互聯(lián)網(wǎng)公司來說,再財大氣粗,恐怕也算不清通用芯片這筆越滾越大的賬。 03 沒那么厲害 研發(fā)一款芯片并不難,難的是研發(fā)一款面向消費(fèi)市場的高利潤芯片,這不僅需要技術(shù)的突破,還需要終端產(chǎn)品的配合,對應(yīng)的軟件生態(tài),長期的資本投入。 最近幾年,芯片自主的熱情空前高漲。平心而論,過去十多年里國內(nèi)半導(dǎo)體產(chǎn)業(yè)有不小的進(jìn)步,但貢獻(xiàn)并不來自互聯(lián)網(wǎng)新貴,而是那些積累已久的產(chǎn)業(yè)老兵。 最典型的是海思,它的成立甚至早于華為的智能機(jī)業(yè)務(wù)。Ascend D系列首次搭載海思的四核手機(jī)處理器芯片K3V2,因體驗(yàn)太差網(wǎng)友罵成一片,據(jù)說震怒的任正非曾當(dāng)著眾多高管的面,把這款手機(jī)砸在余承東臉上。 海思造芯的前提則是,華為擁有支撐高額研發(fā)費(fèi)用和試錯成本的運(yùn)營商業(yè)務(wù),它在華為的收入結(jié)構(gòu)中常年占比超過40%。 DRAM領(lǐng)域,合肥長鑫在2019年量產(chǎn)國產(chǎn)DDR4內(nèi)存芯片,在應(yīng)對“卡脖子”這件事上意義重大。兆易創(chuàng)新則是全球前三、中國第一的NOR FLASH企業(yè),紫光展銳也成為了高通、聯(lián)發(fā)科之后全球第三大主流手機(jī)SoC解決方案商。 而在芯片封測環(huán)節(jié),長電科技在2016年收購了新加坡的星科金朋,一舉成為全球第三的封測廠,拿下了高通、聯(lián)發(fā)科、英特爾、博通等等國際大廠的訂單。另一家公司富瀚微實(shí)現(xiàn)了對AMD封測廠的收購,幫助國產(chǎn)企業(yè)實(shí)現(xiàn)了在7nm CPU以及GPU高端芯片封測的突破。 高風(fēng)險、高投入、長周期是半導(dǎo)體行業(yè)的鐵律,每個環(huán)節(jié)都壁壘極深,這顯然不是習(xí)慣了高舉高打、快速擴(kuò)張的互聯(lián)網(wǎng)公司能夠適應(yīng)的。 然而,當(dāng)芯片設(shè)計套上了獨(dú)立自主的語境,互聯(lián)網(wǎng)大廠反而成為了聲浪最大的,儼然硬科技的帶頭大哥。 所以,針對大廠造芯這件事,還是得從兩方面看待: 一方面,絕大多數(shù)公司的自研芯片,本質(zhì)上是基于新場景的創(chuàng)新。比如大規(guī)模的虛擬化需求、AI需求,視頻圖片編解碼需求。這種創(chuàng)新雖然離“吊打英特爾”差了十萬八千里,但為行業(yè)積累人才儲備,再不濟(jì)讓苦了十幾年的芯片工程師拿拿大廠期權(quán),也是好事。 同時,半導(dǎo)體是個高度分工與高度全球化的行業(yè),要求互聯(lián)網(wǎng)公司去和全世界頂級的芯片設(shè)計公司硬碰硬,讓他們?nèi)?shí)現(xiàn)CPU等通用芯片的自主可控,顯然也不是現(xiàn)實(shí)的。 無論是字節(jié)、阿里、還是快手,都沒有自己的終端產(chǎn)品,他們靠什么覆蓋芯片的研發(fā)的成本呢?這不符合商業(yè)邏輯。 但另一方面,做了幾個相對邊緣的芯片就大吹特吹,也實(shí)在是沒必要。 如果真想在硬科技上有所建樹,是不是應(yīng)該先想想,高薪招進(jìn)來的芯片工程師,是匯報給技術(shù)部門,還是匯報給公關(guān)部門? |