熱門關(guān)鍵詞：Xilinx S3C2410 Microchip CSR Maxim

為大模型定制一顆芯片？

發(fā)布時(shí)間：2024-4-6 11:36 發(fā)布者：eechina

關(guān)鍵詞：大模型 , 芯片

來源：半導(dǎo)體行業(yè)觀察

當(dāng)我們回顧2023年爆火的AI時(shí)，有兩位明星獲得了最多的關(guān)注度，一位是開發(fā)了ChatGPT的OpenAI，另一位是為各路AI選手提供雄厚算力的英偉達(dá)。

逢大模型必提OpenAI，逢顯卡必提英偉達(dá)，成了過往一年的常態(tài)。

但這樣的情形必然不會(huì)持續(xù)太久，不論是AI大模型還是AI顯卡，都是動(dòng)輒每年上百億美元乃至于千億美元的市場(chǎng)，大家都不想讓兩家廠商獨(dú)吞蛋糕。

在大模型上，LaMDA 、LLaMA、Gemini等早已虎視眈眈，而在顯卡上，不光有傳統(tǒng)的英特爾與AMD這兩家，還有各類定制與自研芯片涌現(xiàn)，OpenAI與英偉達(dá)已經(jīng)迎來了各自的競(jìng)爭(zhēng)對(duì)手。

但更有意思的事情也在發(fā)生，AI的軟件和硬件并非天然對(duì)立，如果把大型語言模型和顯卡芯片結(jié)合在一起，會(huì)有什么樣的奇妙反應(yīng)呢？

為大模型量身打造芯片

想要訓(xùn)練一個(gè)大模型，代表算力的芯片就是最關(guān)鍵的一環(huán)，也是成本最高的一環(huán)。

這也導(dǎo)致了一個(gè)問題，如果AI照著現(xiàn)在這幅樣子發(fā)展下去，那么成本就會(huì)越來越高，高到絕大部分公司都難以承受的地步，根據(jù)外媒估計(jì)，如今正在開發(fā)的大模型，平均每個(gè)需要花費(fèi)約 10 億美元，而下一代大模型呢，平均每個(gè)需要花費(fèi) 100 億美元來訓(xùn)練，這個(gè)天文數(shù)字，在硅谷買下幾十家有潛力的初創(chuàng)公司都還有得找。

這也暴露出了目前行業(yè)最常用的英偉達(dá)顯卡的弊端，英偉達(dá)的GPU并非為了AI而生，它起初是為了處理各種各樣的圖形化計(jì)算而生產(chǎn)制造的，整體設(shè)計(jì)也沒有脫離傳統(tǒng)計(jì)算的范疇，面對(duì)人工智能蓬勃發(fā)展時(shí)，強(qiáng)大的算力有相當(dāng)一部分被浪費(fèi)了，也意味著白花花的銀子被浪費(fèi)了。

大公司可以一邊著手自研，一邊繼續(xù)購買英偉達(dá)的顯卡，但對(duì)于中小型公司來說，顯卡成為了他們最大的絆腳石，如此一來，AI在某種程度上就成為了一部分公司的專屬。

不過這種需求已被一部分人所注意到，在美國(guó)硅谷，邁克-岡特（Mike Gunter）和雷納-波普（Reiner Pope）這兩位從谷歌出走的工程師，他們成立了一家名為 MatX 的公司，而這家公司的目標(biāo)，就是設(shè)計(jì)專門用于LLM（大型語言模型）的，更便宜、更快速、更適合人工智能的芯片。

在谷歌任職時(shí)，Gunter主要負(fù)責(zé)設(shè)計(jì)運(yùn)行人工智能軟件的硬件（包括芯片），Pope則負(fù)責(zé)編寫人工智能軟件本身，這里不得不提到谷歌此前自研的TPU了，從2014年發(fā)展至今，已經(jīng)更迭了整整五代，但它們和英偉達(dá)H100一樣，都不是為了LLM所量身打造的，放在人工智能領(lǐng)域中，顯得過于通用了一些。

Pope在接受采訪時(shí)表示：“我們?cè)噲D讓LLM在谷歌運(yùn)行得更快，并取得了一些進(jìn)展，但這有點(diǎn)困難，”他說到，“在谷歌內(nèi)部，有很多人希望對(duì)芯片進(jìn)行各種改動(dòng)，因此很難只專注于 LLM。為此，我們選擇了離開。”

這兩位創(chuàng)始人都認(rèn)為，在人工智能時(shí)代到來之際，芯片上額外的空間增加了不必要的成本和復(fù)雜性，因此需要“一刀切”，去掉所有不必要的部分，只保留必要的部分，MatX公司的做法就是在硅片上設(shè)計(jì)一個(gè)大型處理內(nèi)核，目的只有一個(gè)，那就是盡可能快地將數(shù)字相乘——這是 LLM 的核心任務(wù)。

MatX表示，自己的芯片在訓(xùn)練 LLM 和提供其結(jié)果方面將比英偉達(dá)的 GPU 至少好 10 倍。“英偉達(dá)有非常強(qiáng)大的產(chǎn)品，顯然是大多數(shù)公司的理想選擇，” Pope說，“但我們認(rèn)為我們可以做得更好。

其預(yù)測(cè)，通過贏得包括OpenAI和Anthropic PBC在內(nèi)的多家主要人工智能企業(yè)的青睞，它的業(yè)務(wù)將蒸蒸日上。“這些公司的經(jīng)濟(jì)狀況與一般公司完全相反，"Gunter說，"他們把錢都花在了計(jì)算上，而不是工資上。如果情況不改變，他們就會(huì)沒錢。”

無獨(dú)有偶，隔壁總部位于多倫多的人工智能芯片初創(chuàng)公司 Taalas，同樣立志于改變由英偉達(dá)主導(dǎo)的AI世界，公司創(chuàng)始人包括Ljubisa Bajic、Lejla Bajic 和 Drago Ignjatovic，他們均來自傳奇架構(gòu)師Jim Keller所領(lǐng)導(dǎo)的Tenstorrent。

與前東家Tenstorrent不同的是，Taalas幾位創(chuàng)始人想開發(fā)一種自動(dòng)流程，能將任何人工智能模型快速轉(zhuǎn)化為定制芯片，其表示，由此產(chǎn)生的硬核模型的效率是軟件模型的 1000 倍。

“要實(shí)現(xiàn)人工智能的商品化，就必須將計(jì)算能力和效率提高 1000 倍，而目前的漸進(jìn)式方法是無法實(shí)現(xiàn)這一目標(biāo)的。我們不應(yīng)該在通用計(jì)算機(jī)上模擬智能，而應(yīng)該直接在芯片中打造智能，在芯片中實(shí)現(xiàn)深度學(xué)習(xí)模型是實(shí)現(xiàn)可持續(xù)人工智能的最直接途徑。”Taalas 首席執(zhí)行官Ljubisa Bajic說。

Taalas認(rèn)為，公司會(huì)解決了當(dāng)今人工智能硬件的兩大問題，即能效和成本。如果客戶需要在手機(jī)里使用特定參數(shù)Llama2模型，而且確定了產(chǎn)品生命周期中的全部需求，那么可能只需要為它提供一款最低功耗和最低成本的專用芯片，未來的AI在消費(fèi)者日常生活中的普及程度將像電力一樣無處不在，而Taalas認(rèn)為自己能夠推動(dòng)這一切的發(fā)展。

Taalas表示，它將在2024年第三季度推出首款大型語言模型芯片，并計(jì)劃在2025年第一季度向首批客戶提供芯片。

目前，這兩家打算顛覆目前AI芯片市場(chǎng)的公司都拿到了一筆數(shù)額不菲的投資，MatX獲得了2500萬美元的融資，而Taalas則獲得了5000萬美元的融資。

MatX的投資人提到，MatX這樣的公司象征著人工智能世界的一種新趨勢(shì)，因?yàn)樗麄冋诎岩恍┐蠊鹃_發(fā)出來的最好的創(chuàng)意（這些公司有點(diǎn)行動(dòng)太慢、太官僚化）獨(dú)立商業(yè)化，硅谷之所以能成為硅谷，正是因?yàn)橐慌峙錆M活力的初創(chuàng)公司，初創(chuàng)公司能改變目前芯片行業(yè)沉悶的情況。

但問題也隨之而來，設(shè)計(jì)芯片并不是吃飯喝水那么簡(jiǎn)單，設(shè)計(jì)和制造一款新芯片需要三到五年的時(shí)間，中間還不能出現(xiàn)重大失誤，五年前的想法拿到現(xiàn)在來看，不少已然過時(shí)，這就要求這些初創(chuàng)公司對(duì)未來技術(shù)趨勢(shì)有一個(gè)更準(zhǔn)確的判斷。

上個(gè)月，英偉達(dá)已經(jīng)推出了全新的B200芯片，原本可能上百倍的差距，或許已經(jīng)縮小到數(shù)十倍，隨著時(shí)間的推移，這部分差距只會(huì)越來越小，到了優(yōu)勢(shì)不那么明顯的時(shí)候，恐怕這些初創(chuàng)公司就很難說服英偉達(dá)原來的客戶遷移到新芯片之上了。

消費(fèi)端客戶關(guān)心體驗(yàn)和效果，大模型企業(yè)關(guān)心能效和成本，芯片公司看重技術(shù)與趨勢(shì)，這一條鏈路上環(huán)環(huán)相扣，誰能把握技術(shù)趨勢(shì)，誰就能真正勝券在握，看明白了這一點(diǎn)，我們或許就能明白為何有MatX和Taalas這樣的公司涌現(xiàn)了。

英偉達(dá)的押注

比較有意思的是，英偉達(dá)雖然坐擁大半個(gè)AI芯片市場(chǎng)，但它也有自己的危機(jī)意識(shí)。此前雖傳出消息，它將為部分廠商提供定制芯片服務(wù)，但在CEO黃仁勛的演講中，英偉達(dá)再怎么放下身段，也不會(huì)完全迎合與滿足客戶需求，與上述的新興芯片公司形成了鮮明反比。

英偉達(dá)的實(shí)際護(hù)城河是什么？毫無疑問是CUDA，黃仁勛將其視作成功的根本來源，這種生態(tài)絕非一朝一夕能夠建立起來，英偉達(dá)想做和要做的，就是把CUDA鋪設(shè)到無處不在。

因此，英偉達(dá)開始了自己的押注，根據(jù)金融數(shù)據(jù)公司Dealogic提供的數(shù)據(jù)，英偉達(dá)在2023年對(duì)30多家初創(chuàng)公司進(jìn)行了投資，數(shù)量是上一年的三倍多。英偉達(dá)已發(fā)布的財(cái)報(bào)顯示，截至今年1月末的上一財(cái)季，該公司對(duì)其他公司的投資總額約為15.5億美元，遠(yuǎn)遠(yuǎn)超過一年前的3億美元。

2023年，英偉達(dá)投資了大約11家AI基礎(chǔ)設(shè)施提供商，包括數(shù)據(jù)分析公司Databricks Inc.，GPU云提供商CoreWeave Inc.和大語言模型提供商Mistral AI SAS，此外，英偉達(dá)還投資了像視頻生成器Twelve Labs Inc.，聊天機(jī)器人創(chuàng)建者Cohere Inc.和機(jī)器人流程自動(dòng)化初創(chuàng)公司Adept AI Labs Inc.這樣的生成式AI公司。

英偉達(dá)的投資并不僅限于IT領(lǐng)域，還包括將AI應(yīng)用于醫(yī)療保健的初創(chuàng)公司，它投資了八家藥物發(fā)現(xiàn)初創(chuàng)公司，包括Generate Biomedicines Inc.和Genesis Therapeutics Inc.，這兩家公司都在使用AI來發(fā)現(xiàn)新藥。

通過這些投資，英偉達(dá)不僅能夠支持和利用這些初創(chuàng)公司在AI領(lǐng)域的創(chuàng)新，把市場(chǎng)蛋糕做大；還能與重要客戶建立緊密聯(lián)系，形成了一個(gè)良好的生態(tài)。這種策略可能使英偉達(dá)在競(jìng)爭(zhēng)激烈的市場(chǎng)中獲得優(yōu)勢(shì)，因?yàn)檫@些初創(chuàng)公司的成功可能進(jìn)一步提升對(duì)英偉達(dá)產(chǎn)品的需求。同時(shí)，這也為英偉達(dá)提供了一個(gè)了解市場(chǎng)動(dòng)向、技術(shù)創(chuàng)新和客戶需求的窗口。

值得一提的是，根據(jù)英偉達(dá)2023財(cái)年的財(cái)報(bào)，其客戶現(xiàn)可通過云服務(wù)，全面接觸英偉達(dá)AI的各個(gè)層面：AI超級(jí)計(jì)算機(jī)、加速庫軟件以及預(yù)訓(xùn)練的生成式AI模型。用戶可通過瀏覽器，通過英偉達(dá)DGX Cloud服務(wù)，接入英偉達(dá)DGX AI超級(jí)計(jì)算機(jī)。在AI平臺(tái)軟件層面，用戶能夠使用英偉達(dá)AI企業(yè)版，以訓(xùn)練和部署大型語言模型或其他AI工作負(fù)載。在AI模型即服務(wù)層面，英偉達(dá)為希望為其業(yè)務(wù)定制生成式AI模型和服務(wù)的企業(yè)客戶提供NeMo和BioNeMo定制AI模型。

英偉達(dá)可能不會(huì)積極地提供定制芯片，但它卻一定會(huì)樂于推銷自己的定制生態(tài)，即使初期這些AI公司并不能提供什么實(shí)質(zhì)性的回報(bào)，但它們所代表的未來趨勢(shì)，正是英偉達(dá)所看重的，這種做法有點(diǎn)像是電腦上的付費(fèi)軟件，先提供一段時(shí)間的免費(fèi)試用，等到用戶養(yǎng)成使用習(xí)慣了，再開啟收費(fèi)模式。

而且英偉達(dá)這種拋磚引玉的做法不是沒有成功的先例，OpenAI為什么會(huì)堅(jiān)定不移地使用英偉達(dá)的芯片來訓(xùn)練模型，最早可以追溯到免費(fèi)贈(zèng)送的DGX-1，一臺(tái)超算就撬動(dòng)了百億美元市場(chǎng)，這筆買賣怎么看這么劃算。

寫在最后

事到如今，AI芯片市場(chǎng)似乎已經(jīng)分成了旗幟分明的三派：第一派也是最大的一派，當(dāng)然是英偉達(dá)，靠著新鮮出爐的B200又能賺得盆滿缽滿，第二派是以博通為代表的定制派，比起英偉達(dá)，他們才更像是賣服務(wù)的，自己不生產(chǎn)芯片，幫企業(yè)造好芯片。

但這兩派更多覆蓋的還是那些中大型的巨頭，只有它們才有財(cái)力和實(shí)力來訓(xùn)練自己的大模型，一部分初創(chuàng)AI公司實(shí)質(zhì)上是被忽略了，即使英偉達(dá)豪擲數(shù)十億美元，也只是覆蓋了很小一部分初創(chuàng)公司，且縱使是巨頭，在瘋狂燒錢這件事上也已經(jīng)出現(xiàn)了動(dòng)搖，新的需求已經(jīng)從幕后走向臺(tái)前。

第三派如今開始嶄露頭角，喊出為每個(gè)大模型定制芯片的口號(hào)，意圖就是打入英偉達(dá)和博通所不能顧及的市場(chǎng)，在AI浪潮中分得一杯羹。

你認(rèn)為MatX和Taalas這樣的公司會(huì)脫穎而出嗎？

本文地址：http://m.qingdxww.cn/thread-854514-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時(shí)間更正或刪除。