來源:融中財(cái)經(jīng) 近日,大數(shù)據(jù)巨頭公司Databricks宣布億13億美元的價(jià)格(約合94億人民幣)收購(gòu)生成式AI初創(chuàng)公司MosaicML。該筆發(fā)生在美國(guó)硅谷的收購(gòu)案,為年內(nèi)生成式AI領(lǐng)域內(nèi)公布的最大一筆。引來業(yè)界高度關(guān)注。 MosaicML于2021年成立于美國(guó)舊金山,其剛成立不久便成功完成了第一輪融資,知名風(fēng)投DCVC、Lux Capital、Future Ventures等投資機(jī)構(gòu)參與,MosaicML共獲得3700萬美元的融資。 第一輪融資時(shí),MosaicML公司估值為2.2億美元,但在此次收購(gòu)中,MosaicML的估值直接提高近6倍,令業(yè)界感到驚嘆。 成立不到兩年,估值便如此之高,這家生成式AI初創(chuàng)公司到底有何“看家本領(lǐng)”? 01 AI模型服務(wù)企業(yè)端 產(chǎn)品質(zhì)優(yōu)價(jià)廉 根據(jù)公開資料顯示,MosaicML的產(chǎn)品組合包括開源的、商業(yè)授權(quán)的MPT Foundation系列模型和MosaicML 推理和訓(xùn)練服務(wù)。 其推出的MosaicML Composer開源的深度學(xué)習(xí)庫(kù),提供20種用于計(jì)算機(jī)視覺和自然語言處理的方法,包括模型、數(shù)據(jù)集和基準(zhǔn)。推出的MosaicML Explorer可以幫助開發(fā)人員探索和理解不同的云服務(wù)和硬件選項(xiàng)之間的時(shí)間、性能和成本,以簡(jiǎn)化和評(píng)估實(shí)施選項(xiàng)。推出的MosaicML AI開發(fā)平臺(tái),提供了成本效益高的模型部署和定制訓(xùn)練,同時(shí)保證數(shù)據(jù)安全,使用戶能夠擁有模型的所有權(quán)等。 值得一體的是,MPT基礎(chǔ)模型系列是MosaicML 提供的一系列開源、商業(yè)可用的大型語言模型,它們可以作為用戶構(gòu)建自己的生成式AI應(yīng)用的基礎(chǔ)。 MosaicML 的MPT基礎(chǔ)模型系列包括MPT-7B 和MPT-30B 兩個(gè)模型,分別有70億和300億個(gè)參數(shù)。 MPT-7B是MosaicML在今年5月5日發(fā)布的類ChatGPT開源大語言模型。MPT-7B 在MosaicML平臺(tái)上進(jìn)行了9.5天的訓(xùn)練,零人工干預(yù),成本僅用了20萬美元。該模型具備可商業(yè)化、高性能、資源消耗低、1T訓(xùn)練數(shù)據(jù)、可生成代碼等技術(shù)優(yōu)勢(shì)。 AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs等知名廠商皆使用MPT-7B開發(fā)各種生成式AI產(chǎn)品。 截至目前,MPT-7B開源項(xiàng)目的下載量超過300萬次。收購(gòu)方Databricks表示,這也是其收購(gòu)MosaicML的重要原因之一。 另一款模型MPT-30B推出之后,同樣引來業(yè)界關(guān)注,十分受歡迎。其訓(xùn)練成本遠(yuǎn)低于其他競(jìng)爭(zhēng)對(duì)手,有望推動(dòng)AI模型在更廣泛領(lǐng)域的應(yīng)用并逐步降低訓(xùn)練成本。 MosaicML首席執(zhí)行官兼聯(lián)合創(chuàng)始人Naveen Rao表示,MPT-30B的訓(xùn)練成本僅為70萬美元,遠(yuǎn)遠(yuǎn)低于類似產(chǎn)品如GPT-3所需的數(shù)千萬美元訓(xùn)練成本。該模型由于成本低、體積小,可以更快速地進(jìn)行訓(xùn)練,并且更適合在本地硬件上部署。 MosaicML還介紹稱,公司用 2 個(gè)月的時(shí)間訓(xùn)練了 MPT-30B,通過數(shù)據(jù)混合進(jìn)行預(yù)訓(xùn)練,從 10 個(gè)不同的開源文本語料庫(kù)中收集了 1T 個(gè)預(yù)訓(xùn)練數(shù)據(jù) token,并使用 EleutherAI GPT-NeoX-20B 分詞器對(duì)文本進(jìn)行分詞,并根據(jù)上述比率進(jìn)行采樣。 需要注意的是,開發(fā)者可以從Hugging Face下載并使用開源的MPT-30B基礎(chǔ)模型,還可以使用自己的數(shù)據(jù)在本地硬件上進(jìn)行微調(diào)。 MosaicML同時(shí)表示,將模型參數(shù)擴(kuò)展到300億只是第一步,隨后他們將以降低更低成本推出更大體積、更高質(zhì)量的模型。 MosaicML另一個(gè)比較有亮點(diǎn)的產(chǎn)品是今年推出的面向企業(yè)的MosaicML推理。 MosaicML首席執(zhí)行官兼聯(lián)合創(chuàng)始人Naveen Rao表示:“一些初創(chuàng)公司已經(jīng)在使用MosaicML的模型和工具來構(gòu)建自然語言前端和搜索系統(tǒng)。MosaicML允許企業(yè)使用公司的模型架構(gòu)根據(jù)自己的數(shù)據(jù)訓(xùn)練模型,然后通過其推理API部署模型。如果客戶訓(xùn)練了一個(gè)模型,他們可以放心,他們擁有該模型的所有迭代,該模型就是他們的。我們對(duì)此不擁有所有權(quán)。使用 MosaicML 的新推理產(chǎn)品,企業(yè)客戶可以部署用于文本完成和文本嵌入的 AI 模型,其成本比使用OpenAI的LLM低4倍,而圖像生成的成本比使用OpenAI的DALL-E 2便宜 15倍。” “我們希望讓盡可能多的人了解和使用這項(xiàng)技術(shù),這就是我們的目標(biāo)。這并不是排他性的。這不是精英主義。”Naveen Rao同時(shí)表示。 02 由英特爾前高管創(chuàng)立 MosaicML起點(diǎn)不低 作為初創(chuàng)公司的MosaicML,為何會(huì)連續(xù)推出爆款產(chǎn)品,這當(dāng)然很其創(chuàng)始人有很大關(guān)系。 MosaicML是由曾在英特爾擔(dān)任AI產(chǎn)品負(fù)責(zé)人、Nervana Systems 的聯(lián)合創(chuàng)始人 Naveen Rao ,以及英特爾AI實(shí)驗(yàn)室的高級(jí)主管Hanlin Tang創(chuàng)立。 MosaicML的創(chuàng)始人Naveen Rao ,1997年畢業(yè)于杜克大學(xué)的計(jì)算機(jī)科學(xué)專業(yè),后取得布朗大學(xué)神經(jīng)科學(xué)的博士學(xué)位。Naveen Rao長(zhǎng)期致力于人工智能神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和開發(fā),曾在高通擔(dān)任過神經(jīng)形態(tài)機(jī)器的研究員,并在2014年創(chuàng)立了人工智能公司Nervana Systems。后來這家公司在2016年以4.08億美元被英特爾收購(gòu)。 Hanlin Tang畢業(yè)于哈佛大學(xué),研究人類視覺中的遞歸神經(jīng)網(wǎng)絡(luò)。他在普林斯頓大學(xué)取得物理學(xué)學(xué)士學(xué)位,隨后在哈佛大學(xué)取得生物物理學(xué)的博士學(xué)位,研究人類視覺中的遞歸神經(jīng)網(wǎng)絡(luò),Hanlin Tang少年時(shí)代在臺(tái)北度過。后來加入英特爾后,在英特爾AI實(shí)驗(yàn)室擔(dān)任高級(jí)主管,在此期間Hanlin Tang負(fù)責(zé)算法工程和深度學(xué)習(xí)研究,并參與了MLPerf基準(zhǔn)測(cè)試的開發(fā)。 Hanlin Tang在國(guó)際頂級(jí)期刊和會(huì)議上發(fā)表了多篇論文,涉及計(jì)算神經(jīng)科學(xué)、計(jì)算機(jī)視覺、自然語言處理和強(qiáng)化學(xué)習(xí)等領(lǐng)域。 還有一位值得一提的團(tuán)隊(duì)成員是MosaicML的首席科學(xué)家Jonathan Frankle,他是MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室的博士后研究員,也是哈佛Kempner研究所的附屬教員。Jonathan Frankle的研究方向是神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)動(dòng)力學(xué)和訓(xùn)練算法,旨在提高大型語言模型(LLM)的效率同時(shí)降低訓(xùn)練成本。這一研究方向也正是MosaicML的核心競(jìng)爭(zhēng)力所在,可以說Jonathan Frankle是MosaicML能賣到94億的關(guān)鍵人物。 Naveen Rao和Hanlin Tang之所以能在英特爾任職,是因?yàn)镹ervana Systems開發(fā)了Neon 這一高性能的深度學(xué)習(xí)框架,以及后來推出的Nervana Cloud深度學(xué)云平臺(tái)、Nervana Engine專用硬件加速器,英特爾認(rèn)為這些產(chǎn)品非常有價(jià)值,就把Nervana Systems收購(gòu)了。Naveen Rao和Hanlin Tang也一起加入英特爾,一位成為了AI產(chǎn)品集團(tuán)的負(fù)責(zé)人,一位成為了AI實(shí)驗(yàn)室高級(jí)主管。 不過,2020年英特爾宣布放棄原計(jì)劃的Nervana服務(wù)器端AI加速芯片,去耗資20億美元收購(gòu)以色列公司Habana的產(chǎn)品。 在英特爾決定“拋棄” Nervana后,Naveen Rao和Nervana的前核心員工Hanlin Tang也一起離開了英特爾,兩人另立門戶創(chuàng)立了今天的MosaicML。根據(jù)LinkedIn的信息,目前Hanlin Tang擔(dān)任MosaicML的CTO。 03 Databricks收購(gòu)MosaicML 強(qiáng)強(qiáng)聯(lián)合? Databricks收購(gòu)MosaicML不僅僅是因?yàn)樯虡I(yè)價(jià)值,更是為了兩個(gè)公司可以強(qiáng)強(qiáng)聯(lián)合,實(shí)現(xiàn)技術(shù)上的突破,加碼AI大模型。 先來看看收購(gòu)方Databricks,這是一家數(shù)據(jù)存儲(chǔ)和分析領(lǐng)域的巨頭公司,由美國(guó)加州大學(xué)伯克利 AMP 實(shí)驗(yàn)室的 Spark 大數(shù)據(jù)處理系統(tǒng)多位創(chuàng)始人聯(lián)合創(chuàng)立。Databricks 的客戶遍及大中小企業(yè),以及各個(gè)行業(yè)。截至 2023 年 03 月,其全球已有超過 9000 家企業(yè)用戶。包括 AT&T、殼牌、巴寶莉、豐田、Walgreens、Adobe、康泰納仕和再生元制藥等。 2021 年,Databricks拿下了摩根士丹利旗下Counterpoint Global領(lǐng)投的16億美元H輪融資。2023年4月18日,Databricks以298億美元億的估值入選《2023·胡潤(rùn)全球獨(dú)角獸榜》,名列第七。 業(yè)內(nèi)專家表示,收購(gòu)?fù)瓿芍螅琈osaicML 將成為 Databricks Lakehouse 平臺(tái)的一部分,MosaicML 的整個(gè)團(tuán)隊(duì)和技術(shù)都將納入 Databricks 旗下,為公司提供統(tǒng)一的平臺(tái)來管理數(shù)據(jù)資產(chǎn),助力 Databricks更好的開發(fā)生成式AI技術(shù)。同時(shí)能夠使用自己的專有數(shù)據(jù)來構(gòu)建、擁有和保護(hù)自己的生成式 AI 模型。 DataBricks 的 CEO Ali Ghodsi 也表示,收購(gòu) MosaicML 將進(jìn)一步增強(qiáng) DataBricks 的數(shù)據(jù)分析平臺(tái)。 DataBricks收購(gòu)MosaicML是為加碼AI大模型是主流觀點(diǎn),原因是MosaicML因其尖端的MPT大語言模型而受到認(rèn)可,MPT-7B和MPT-30B都是今年開發(fā)的爆款產(chǎn)品,下載量均突破百萬。 值得一提的是,MosaicML的模型訓(xùn)練自動(dòng)優(yōu)化使得訓(xùn)練速度比標(biāo)準(zhǔn)方法快2-7倍,而資源的近線性擴(kuò)展允許在幾小時(shí)內(nèi)訓(xùn)練多十億參數(shù)的模型。 借助于雙方的聯(lián)合產(chǎn)品,Databricks和MosaicML的目標(biāo)是將訓(xùn)練和使用LLMs的成本從數(shù)百萬美元降低到數(shù)千美元。 由此可見,Databricks正試圖加碼AI大模型,去挑戰(zhàn)OpenAI、微軟、谷歌等大公司的市場(chǎng)地位,為行業(yè)帶來新的選擇。 但也有反對(duì)觀點(diǎn)認(rèn)為Databricks 整合 LLM 的價(jià)值主張是不太明確,因?yàn)镈atabricks主營(yíng)Lakehouse,主要是用Spark來處理大規(guī)模集群數(shù)據(jù),因此其整合大語言的價(jià)值并不明確。還有業(yè)內(nèi)人士認(rèn)為,Databricks 是在借當(dāng)前大模型熱度進(jìn)行炒作,收購(gòu)對(duì)技術(shù)方面不會(huì)有明顯的突破,MosaicML 遲早會(huì)被Databricks放棄。 這起收購(gòu)案能否能獲得良好的效果,在實(shí)現(xiàn)商業(yè)價(jià)值的同時(shí),也能有技術(shù)突破,可能仍需要等待時(shí)間去驗(yàn)證。 財(cái)經(jīng)方面專家認(rèn)為,收購(gòu)MosaicML的交易可能是這家AI獨(dú)角獸公司為IPO之路打下基礎(chǔ)。 04 AI大模型并購(gòu)潮拉開大幕 去年末ChatGPT的橫空出世,拉開了AI競(jìng)賽的大幕,半年之后,又出現(xiàn)了AI并購(gòu)潮。 原因無外乎是生成式AI經(jīng)過一段時(shí)間的野蠻生長(zhǎng),然后大型企業(yè)取得一定的進(jìn)展,同時(shí)也發(fā)現(xiàn)了現(xiàn)有技術(shù)和人才的不足,而那些AI初創(chuàng)公司,相對(duì)來說要專業(yè)一些,既有人才也有技術(shù),但存在資金不足、資源稀缺等問題。所以AI并購(gòu)潮現(xiàn)在出現(xiàn)是必然的,對(duì)于整個(gè)行業(yè)來講也是正向的、有利的。 除了本文介紹的Databricks收購(gòu)MosaicML之外,今年5月,云計(jì)算巨頭Snowflake宣布收購(gòu)了由兩位前Google員工創(chuàng)立的生成式AI搜索初創(chuàng)公司Neeva。業(yè)內(nèi)專家認(rèn)為,此次收購(gòu)將使Snowflake能夠利用尖端的搜索技術(shù),并將其注入到數(shù)據(jù)云中,充分客戶、合作伙伴和開發(fā)者的需求。 值得一提的是,Neeva的領(lǐng)導(dǎo)團(tuán)隊(duì)成員在創(chuàng)建YouTube貨幣化和Google的搜索廣告等產(chǎn)品時(shí),起到了非常重要的作用。不出意外的話,此次收購(gòu)將把Snowflake中的搜索和對(duì)話提升到一個(gè)新水平。不過此次收購(gòu)的金額并沒有對(duì)外公布。 6月26日,全球最大的專業(yè)信息服務(wù)提供商湯森路透宣布,以6.5億美元現(xiàn)金收購(gòu)AI初創(chuàng)公司Casetext,該公司主營(yíng)業(yè)務(wù)是為法律人士提供AI助理服務(wù)。 公開資料顯示,Casetext員工數(shù)為104名,客戶包括1萬多家律師事務(wù)所和企業(yè)法務(wù)部門。其主要產(chǎn)品CoCounsel是一款于今年推出的人工智能法律助理,由GPT-4提供支持。該筆收購(gòu)將有效補(bǔ)充湯森路透現(xiàn)有的AI路線圖。 6月29日,AI初創(chuàng)公司Inflection宣布完成13億美元融資,該輪融資由微軟、英偉達(dá)等牽頭投資,其融資總額達(dá)到15.25億美元。 再看中國(guó)的AI市場(chǎng),6月29日,美團(tuán)發(fā)布公告,宣布已完成光年之外境內(nèi)外主體100% 的股權(quán)收購(gòu),耗資20.65億人民幣。 對(duì)于此次并購(gòu),美團(tuán)在公告表示,光年之外是中國(guó)領(lǐng)先的AGI創(chuàng)新者,其目前的管理與技術(shù)團(tuán)隊(duì)具有開發(fā)深度學(xué)習(xí)框架的高水平經(jīng)驗(yàn)。公司通過收購(gòu)事項(xiàng)可以獲得領(lǐng)先的AGI技術(shù)及人才,有機(jī)會(huì)加強(qiáng)其于快速增長(zhǎng)的人工智能行業(yè)中的競(jìng)爭(zhēng)力。 美團(tuán)方面表示,并購(gòu)?fù)瓿珊螅瑢⒅С止饽陥F(tuán)隊(duì)繼續(xù)在AI大模型領(lǐng)域進(jìn)行研究和探索。 無獨(dú)有偶,今年6月16日,昆侖萬維發(fā)布公告稱,旗下控股子公司Star Group擬發(fā)股收購(gòu)Singularity AI全部股權(quán)。 Singularity AI致力于實(shí)現(xiàn)通用人工智能,目前聚焦于自然語言大型預(yù)訓(xùn)練模型及開發(fā)者API的研發(fā)工作,主要產(chǎn)品及服務(wù)包括通用開發(fā)者API、聊天機(jī)器人和知識(shí)抽取。 國(guó)外出現(xiàn)AI并購(gòu)潮,釋放出了一個(gè)強(qiáng)烈的行業(yè)信號(hào),意味著國(guó)外AIGC的發(fā)展已經(jīng)開始升級(jí),無論是技術(shù)、業(yè)務(wù)、場(chǎng)景還是商業(yè)化,都隨時(shí)可能出現(xiàn)顛覆性的創(chuàng)新。 對(duì)于國(guó)內(nèi)AI市場(chǎng),投資人持謹(jǐn)慎樂觀態(tài)度。總的來說是B端應(yīng)用面臨企業(yè)端數(shù)字化緩慢,軟件付費(fèi)意愿不強(qiáng),商業(yè)化緩慢等問題,對(duì)比國(guó)外AI市場(chǎng)依然差距不小。 不過我們也要看到,中國(guó)是美國(guó)市場(chǎng)之外唯一一個(gè)擁有完整的AIGC產(chǎn)業(yè)鏈的國(guó)家,在這場(chǎng)第四次工業(yè)革命之中,大家都沒有退路。 |