近日,Marvell(美滿電子)宣布推出采用共封裝光學(xué)器件(CPO)技術(shù)的定制XPU架構(gòu)。 Marvell的這一舉措是對(duì)當(dāng)前人工智能行業(yè)發(fā)展需求的有效回應(yīng)。在數(shù)據(jù)處理量持續(xù)增長(zhǎng)的當(dāng)下,傳統(tǒng)AI加速器在計(jì)算能力與互聯(lián)規(guī)模方面存在局限,最多只能在單一機(jī)架內(nèi)連接數(shù)十個(gè)XPU。而新推出的CPO架構(gòu)能夠?qū)⒒ヂ?lián)規(guī)模提升至多個(gè)機(jī)架上的數(shù)百個(gè)XPU,極大地拓展了計(jì)算資源的集成范圍。 該定制XPU架構(gòu)基于Marvell之前推出的定制HBM計(jì)算架構(gòu),在這一基礎(chǔ)上進(jìn)一步鞏固了Marvell在定制芯片領(lǐng)域的領(lǐng)導(dǎo)地位。其架構(gòu)運(yùn)用高速SerDes、D2D接口和先進(jìn)的封裝技術(shù),將XPU計(jì)算模塊、HBM內(nèi)存以及其它小芯片與該公司的3D硅光子學(xué)引擎集成于同一基板之上。 這種集成方式具有諸多優(yōu)勢(shì)。在互連距離和數(shù)據(jù)傳輸速率方面,它能實(shí)現(xiàn)XPU間最大互聯(lián)距離達(dá)到傳統(tǒng)銅線連接方式的百倍,從而大大加快數(shù)據(jù)傳輸速度,這對(duì)于大數(shù)據(jù)傳輸和高并發(fā)計(jì)算場(chǎng)景意義重大。從信號(hào)完整性和延遲方面來(lái)看,由于CPO技術(shù)將光學(xué)元件直接集成到單一封裝內(nèi)部,有效縮短了電氣路徑長(zhǎng)度。這一改變顯著減少了信號(hào)損失、增強(qiáng)了高速信號(hào)完整性,并且極大地降低了延遲。 同時(shí),新架構(gòu)還降低了數(shù)據(jù)鏈路受電磁干擾(EMI)的影響,優(yōu)化了元件清單(BOM),提升了能效表現(xiàn)。以Marvell現(xiàn)有的6.4Tb/s 3D硅光子學(xué)引擎為例,該引擎集成了數(shù)百個(gè)組件,能提供32條200Gb/s的電氣和光學(xué)I/O,這意味著在單個(gè)器件內(nèi)能夠?qū)崿F(xiàn)2倍的帶寬和2倍的輸入/輸出帶寬密度,而且與100Gb/s接口同類設(shè)備相比,每比特功耗降低了30%。 目前,許多客戶正在積極評(píng)估該技術(shù)以集成到下一代解決方案之中,這也顯示出該CPO架構(gòu)在推動(dòng)人工智能服務(wù)器發(fā)展方面的巨大潛力,未來(lái)有望在AI服務(wù)器性能提升方面發(fā)揮重要作用。 |