【Gemini 大模型主打多模態(tài),性能對標 GPT-4】 當?shù)貢r間12月6日, 谷歌公司宣布推出其規(guī)模最大、功能最強的多模態(tài)大模型 Gemini, 其最強大的 TPU (張量處理單元)系統(tǒng) “Cloud TPU v5p”, 以及來自谷歌云的人工智能超級計算機。 本次谷歌推出的多模態(tài)大模型Gemini 依然采用Transformer架構(gòu),采用高效Attention機制,支持32k 的上下文長度。Gemini 主打在多模態(tài)領(lǐng)域的突出能力,在輸入端, Gemin 可以適應文本與音視頻交叉的輸入序列,比如自然圖像、圖表、截圖、pdf 和視頻等。在輸出端,Gemini 兼具文本和圖像兩種輸出形式。與市面上大模型不同的地方在于,Gemini 從設計之初開始就是多模態(tài)的,并不像 OpenAI 構(gòu)建 DALL·E和 Whisper 單獨訓練圖像和語音模型。 Gemini 1.0家族涵蓋三類模型,各有定位: 1)Gemini Ultra: 用于高度復雜的任務,為規(guī)模最大、功能最強的類別,定位為GPT-4的競爭對手; 2)Gemini Pro: 是一款中端型號, 用于增強性能和大規(guī)模部署能力,根據(jù)谷歌技術(shù)報告,其性能優(yōu)于GPT-3.5; 3)Gemini Nano: 主要用于特定任務和移動設備。 模型能力方面, Gemini 系列在文本、多模態(tài)、模態(tài)組合等領(lǐng)域均實現(xiàn)了較大進展,在絕大多數(shù)基準測試中性能領(lǐng)先于GPT-4。 我們認為,此次AI 模型Gemini 的推出對AI 產(chǎn)業(yè)鏈上下游均有不同程度的帶動作用。上游層面,受益于AI 巨頭在大模型領(lǐng)域的競爭白熱化, AI 算力需求持續(xù)增進;下游層面AIGC產(chǎn)業(yè)可借助大模型應用變革內(nèi)容生產(chǎn)方式,擴大發(fā)展空間。 【國內(nèi)AI 大模型加速布局,推動下游AIGC 業(yè)務發(fā)展】 AIGC 相關(guān)應用方面的創(chuàng)新主要包括兩種大模型的應用分支: 生成對抗網(wǎng)絡 (GAN)/ 擴散模型 (Diffusion); Transformer 預訓練大模型。在國外AIGC 應用大規(guī)模運用大模型技術(shù)的同 時,我國企業(yè)也在加快對大模型產(chǎn)品的布局。云廠商、AI 大廠、創(chuàng)企、各行業(yè) 公司及技術(shù)服務商等產(chǎn)業(yè)各領(lǐng)域玩家也在陸續(xù)推出大模型或基于大模型的應用產(chǎn)品及各類技術(shù)服務。 AIGC 產(chǎn)業(yè)擁有巨大的發(fā)展?jié)摿εc成長空間,可借助大模型變革內(nèi)容生產(chǎn)方式,提升生產(chǎn)效率和創(chuàng)意。 根據(jù)艾瑞咨詢預測, 2028年我國AIGC 產(chǎn)業(yè)預計規(guī)模將達到7202億元,將完成在重點領(lǐng)域、關(guān)鍵場景的技術(shù)價值兌現(xiàn),并逐步建立完善的模型即服務產(chǎn)業(yè) 生態(tài),預計2030年中國AIGC 產(chǎn)業(yè)規(guī)模將突破至11441億元。大模型對內(nèi)容理解 和內(nèi)容生成的雙向能力使其既能以極低門檻實現(xiàn)多模態(tài)內(nèi)容生成,也可脫離內(nèi)容生產(chǎn)核心場景泛化為一種人機對話的媒介。 未來,全行業(yè)將借助大模型能力衍生出的大量AI 生產(chǎn)工具,實現(xiàn)內(nèi)容生產(chǎn)效率的飛躍,并進一步降低數(shù)字生態(tài)的人機交互門檻! 【多模態(tài)大模型呼喚更多算力,開啟上游服務器新發(fā)展】 Gemini1.0 號稱具有原生多模態(tài)能力,能夠處理視頻、音頻、圖像、文本和代碼等多種形式的內(nèi)容,且性能優(yōu)于現(xiàn)有的“拼接型”多模態(tài)大模型。從谷歌官方公布的技術(shù)文檔中的示例來看,Gemini 不僅能夠進行雙模態(tài)之間的轉(zhuǎn)換(如文生圖或文生視頻),亦能處理需要進行多模態(tài)轉(zhuǎn)換的復雜任務。 多模態(tài)大模型的算力需求遠高于純文本模態(tài)。 以 Gemini 為例,其強大的多模態(tài)能力背后,是龐大的算力需求。雖然沒有正式公布,但根據(jù)內(nèi)部消息,Gemini 有萬億參數(shù),訓練所用的算力甚至達到GPT-4的五倍。有別于傳統(tǒng)大模型對英偉達硬件及生態(tài)的依賴,Gemini 訓練所需的算力基于谷歌自研的 TPUv4 和 v5e等硬件。 在推出新模型的同時,谷歌順勢宣布推出迄今為止功能最強大、最高效、可擴展性最強的 TPU 系統(tǒng) Cloud TPU v5p,將用于開發(fā)更高層次的AI 大模型。其 TPU v5p的訓練性能是上一代 TPU v4的2.8倍,內(nèi)存帶寬提升3倍,芯片間互聯(lián)帶寬翻倍,達到4.8Tbps, 同時,v5p 單個 POD 中的芯片數(shù)量翻倍,達到8960顆。 受到人工智能大模型的發(fā)展熱潮影響,AI服務器的需求量將大幅度增加。 數(shù)量方面,根據(jù)TrendForce 預測,2023 年全球 AI 服務器出貨量將接近120萬臺,年增長率接近38.4%,占整體服務器的9%。預計到2025年整體出貨量將增加至190萬臺,2022-2025年年復合增長率將達到30.4%。 價格方面,通用服務器價格一般為幾千美金/臺,而主流AI 服務器價格多在 10-15萬美金/臺,單價呈現(xiàn)指數(shù)型提升。 根據(jù)中商情報網(wǎng)預計,2022年全球 AI 服務器市場規(guī)模約為183億美元,預計2023年將達到211億美元,同比增長率高達15.3%。 我們篩選出以下潛力標的 紫光股份(000938)公司發(fā)布了全新一代自研八路關(guān)鍵業(yè)務服務器H3C UniServer R8900 G3,可支持高達8顆高端處理器,224個計算核心,具備96個內(nèi)存插槽, 滿足核心數(shù)據(jù)庫,虛擬化,高性能計算,人工智能,內(nèi)存計算等多種關(guān)鍵業(yè)務場景運算需求。 中科曙光(603019)公司通用服務器產(chǎn)品、存儲產(chǎn)品在國內(nèi)市場上處于領(lǐng)先地位。具有完整的產(chǎn)品線,能夠滿足各類細分市場的需求。 浪潮信息(000977) 目前,公司已成為百度、阿里巴巴、騰訊等客戶最主要的AI 服務器供應商。 參考資料: 平安證券-計算機行業(yè)動態(tài)跟蹤報告:多模態(tài)能力表現(xiàn)亮眼,谷歌攜Gemini 王者歸來-231208.pdf 上海證券-通信行業(yè)周報:最強AI 模型Gemini 正式發(fā)布,多模態(tài)應用前景廣闊-231215.pdf 免責聲明: 本文由投資顧問 : 馮利勇(執(zhí)業(yè)證書編碼:A1280620060001)、何軍(執(zhí)業(yè)證書編碼:A1280621060001)、羅力川(登記編號:A1280622110002)等編輯整理,僅代表團隊觀點,任何投資建議不作為您投資的依據(jù),您須獨立作出投 資決策,風險自擔。請您確認自己具有相應的權(quán)利能力、行為能力、風險識別 能力及風險承受能力,能夠獨立承擔法律責任。所涉及個股僅作投資參考和學習交流,不作為買賣依據(jù)。投資有風險,入市需謹慎! |