來(lái)源:半導(dǎo)體行業(yè)觀察 在昨日舉辦的“Advancing AI”峰會(huì)上,AMD CEO Lisa Su除了帶來(lái)精彩的MI 300系列芯片介紹外,“Ryzen AI”也成為了她昨天演講中不可忽略的一個(gè)重點(diǎn)。IDC在日前發(fā)布的一份白皮書中也表示,到2024年,人工智能將成為PC行業(yè)的“必備功能和主流選擇”。 以中國(guó)市場(chǎng)為例,根據(jù)IDC提供的數(shù)據(jù),2024年中國(guó)新增的個(gè)人電腦將有54.7%是人工智能個(gè)人電腦,但在2023年這一比例僅為8.1%。展望2027年,這個(gè)數(shù)字將快速飆升至84.6% 。 而伴隨著AI PC的火熱,整個(gè)PC市場(chǎng)也有望迅速回溫。 研究公司Canalys在最近的報(bào)告中表示,由于宏觀經(jīng)濟(jì)環(huán)境改善以及假期通常是銷售旺季,所以本季度PC出貨量將增長(zhǎng) 5%,一扭過去七個(gè)月連續(xù)下降的局勢(shì)。報(bào)告進(jìn)一步指出,在AI進(jìn)入PC這個(gè)概念的推動(dòng)下,整個(gè)PC出貨量在2024 年將進(jìn)一步加速,全球增速將達(dá)到 8%。 面對(duì)這“潑天的富貴”,AMD也正在加緊其布局。 率先將NPU引入X86處理器 首先說(shuō)明一下,將AI引入PC,AMD是x86領(lǐng)域的第一個(gè)。 早在年初發(fā)布銳龍7040系列處理器的時(shí)候,AMD就領(lǐng)先于競(jìng)爭(zhēng)對(duì)手,率先將一個(gè)NPU集成到其X86處理器中,從而引出了公司的“Ryzen AI”概念。據(jù)了解,這是一種集成的 AI 引擎,可以處理諸如在視頻通話期間進(jìn)行背景模糊、自動(dòng)取景、眼神矯正等任務(wù)。從技術(shù)層面看,如下圖所示,AMD通過在X86處理器中加入一個(gè)NPU,讓消費(fèi)者在 AI PC 上更接近個(gè)人計(jì)算的強(qiáng)大功能,將工作、協(xié)作和創(chuàng)新的效率提升到一個(gè)全新的水平,以便您可以更好地與周圍的世界保持聯(lián)系。 在行業(yè)盛會(huì)Hotchips 2023上,AMD更是通過銳龍7040 Phoenix系列,概覽公司“Ryzen AI背后的神秘面紗——XDNA架構(gòu),這也是其NPU的核心技術(shù)。如圖所示,AMD 在Phoenix 中集成了16 個(gè)AIE-ML 區(qū)塊,并可功能分割,讓多個(gè)應(yīng)用共用人工智能引擎。 雖然AMD并沒有詳細(xì)介紹AIE,但據(jù)臺(tái)媒引述相關(guān)資料介紹,這是一個(gè)來(lái)自AMD收購(gòu)的Xilinx公司的技術(shù),集成了六個(gè)指令的超長(zhǎng)指令集架構(gòu)(6-way VLIW),單一指令含兩個(gè)純量(Scalar)運(yùn)算、一個(gè)向量乘法(Vector Multiplication)、兩個(gè)存儲(chǔ)載入(Load)和一個(gè)存儲(chǔ)回存(Store)。AIE 有兩個(gè)向量暫存器檔案,一組6kB 提供浮點(diǎn)乘法器輸入,另一組8kB 保存累加值。此外,AIE 有16kB 指令存儲(chǔ)和64kB 數(shù)據(jù)存儲(chǔ),16 個(gè)AIE 共用2MB L2 快取。 值得一提的是,和Nvidia A100 / H100 一樣,AIE 支援50% 稀疏率(Sparsity),特定場(chǎng)合可提高一倍理論效能。 AMD Lisa Su表示,目前市場(chǎng)上已經(jīng)有50多款筆記本產(chǎn)品采用基于銳龍7040系列處理器的Ryzen AI。AMD 現(xiàn)在也已發(fā)貨超過數(shù)百萬(wàn)顆內(nèi)置 XDNA NPU 的處理器。不過,他們并未止步,開始邁入了Ryzen AI的第二個(gè)階段,Ryzen 8040則是其首個(gè)重磅產(chǎn)品。 Ryzen AI,新的路線圖 據(jù)AMD介紹,代號(hào)為“Hawk Point”的銳龍8040 系列移動(dòng)處理器AI性能將提升60%。該芯片采用與現(xiàn)有銳龍7040“Phoenix”處理器相同的 4nm Zen 4 核心、RDNA 3 顯卡和 XDNA AI 引擎,但性能卻有不同程度的提升。 AMD透露,以 8 核銳龍9 8945HS為首的銳龍8040系列芯片在 Llama 2 和 AI 視覺模型性能方面比前代產(chǎn)品快了 1.4 倍。其游戲速度更是比英特爾高端i9-13900H芯片快 1.8 倍,內(nèi)容創(chuàng)建速度快 1.4 倍。與競(jìng)品相比,在視頻編輯、3D渲染和游戲性能等方面也是大幅領(lǐng)先。 而AI性能也提升顯著,AMD表示,銳龍7040 的 NPU AMD XDNA 能夠達(dá)到 10 TOPS,而 8040 的 NPU 可以達(dá)到 16 TOPS。展望 2024 年,AMD 還預(yù)告了其下一代 NPU 架構(gòu)的處理器,代號(hào)為“Strix Point”,它將提供“超過 3 倍的生成式 AI NPU 性能”。這主要得益于全新改進(jìn)的 XDNA 2 NPU 引擎。 與此同時(shí),AMD 還發(fā)布了新的 Ryzen AI 軟件,這是一款可以讓愛好者和開發(fā)人員可以在其芯片上部署與 XDNA AI 引擎配合使用的預(yù)先訓(xùn)練的 AI 模型。據(jù)介紹,Ryzen AI 軟件 1.0 版的新增功能是支持開源 ONNX Runtime 機(jī)器學(xué)習(xí)加速器,其中包括對(duì)混合精度量化的支持,當(dāng)中包括 UINT16/32、INT16/32 和 FLOAT16 浮點(diǎn)格式。同時(shí),AMD Ryzen AI 1.0 版還支持 PyTorch 以及 TensorFlow 2.11 和 2.12,這拓寬了軟件開發(fā)人員在模型和 LLM 方面運(yùn)行的能力,從而為軟件創(chuàng)建新的創(chuàng)新功能。 具體而言,用戶只需選擇在 PyTorch 或 TensorFlow 等框架上訓(xùn)練的機(jī)器學(xué)習(xí)模型,并使用 AMD 的 Vitis AI 量化器將模型量化為 ONNX 格式。然后軟件對(duì)模型進(jìn)行分區(qū)和編譯,然后在 Ryzen AI NPU 上運(yùn)行。 借助新的軟件,AMD讓開發(fā)者可以獲得基于 XDNA 的 NPU 硬件能力,以促進(jìn)高級(jí) AI 應(yīng)用程序的開發(fā),例如手勢(shì)識(shí)別、生物識(shí)別身份驗(yàn)證和其他輔助功能(包括相機(jī)背景)。AMD表示,Ryzen AI 軟件現(xiàn)已免費(fèi)提供,公司同時(shí)還在 Hugging Face 上提供了預(yù)先優(yōu)化的模型供用戶使用。值得一提的是,該軟件目前僅適用于 Windows,但據(jù)AMD方面透露,公司Linux 版本的軟件將在未來(lái)幾個(gè)季度推出。 過去幾十年里,PC處理器的競(jìng)爭(zhēng)主要集中在性能和功耗等多個(gè)方面。但從現(xiàn)在開始,AI將會(huì)給PC帶來(lái)新的革命,這值得我們所有人期待。 |