在2019年Hot Chips大會上,英特爾公布了即將推出的高性能人工智能(AI)加速器——英特爾 Nervana神經網絡處理器的最新細節,包括用于訓練的NNP-T和用于推理的NNP-I。英特爾工程師還介紹了混合芯片封裝技術、英特爾傲騰數據中心級持久內存和光學I/O小芯片技術的細節。 “要想實現‘人工智能無處不在’的未來愿景,我們必須解決數據的積壓問題,確保企業能夠有效利用數據,必要的時候在收集數據的地方對數據進行處理,并更明智地利用上游的數據和計算資源。數據中心和云端需要為復雜的AI應用提供高性能和可擴展的通用計算,以及專門的加速。在人工智能無處不在的未來愿景中,從硬件到軟件再到應用,都需要一種全面的解決方案! ——Naveen Rao,英特爾公司全球副總裁兼人工智能產品事業部總經理 將數據轉化為信息、再轉化為知識,需要硬件架構和封裝、內存、存儲、互連技術的相互配合,這些技術不斷演進并支持新興且日益復雜的應用場景和AI技術。AI專用加速器能夠在適當的時間為客戶提供合適的智能,比如全新構建的英特爾Nervana NNP。 英特爾Nervana NNP-T——全新構建,旨在大規模訓練深度學習模型。英特爾Nervana NNP-T(神經網絡處理器)不斷突破深度學習訓練的極限。它優先考慮兩個關鍵的實際因素:盡可能快地訓練網絡并在給定的功率預算內完成訓練。這款深度學習訓練處理器在構建時充分考慮到靈活性,并在計算、通信和內存之間取得平衡。雖然英特爾至強可擴展處理器增加了AI指令集并為人工智能奠定良好基礎,但全新構建的NNP-T考慮到了應對大型模型所需的功能特性和要求,不必提供額外所需以支持傳統技術。為了滿足未來的深度學習需求,英特爾Nervana NNP-T具備靈活性和可編程性,因此可以進行定制,以便加速各種負載,無論是現有負載還是新興負載。 英特爾Nervana NNP-I——針對主要數據中心負載的高性能深度學習推理。英特爾Nervana NNP-I專為推理而設計,旨在大規模加速深度學習部署,它充分利用英特爾的10納米制程技術和Ice Lake內核,在所有主要數據中心負載上提供業界領先的每瓦性能。此外,英特爾Nervana NNP-I在不影響性能或功耗效率的前提下,提供了高度可編程性。隨著人工智能在各項負載中變得無處不在,擁有一個易于編程、時延較短、可快速移植代碼并支持所有主要深度學習框架的專用推理加速器,企業就能將數據的全部潛力轉化為可踐行的洞察而加以利用。 Lakefield——三維封裝中的混合核心。Lakefield是業界首款采用3D堆疊和IA混合計算架構的產品,將用于新一類移動設備。利用英特爾最新的10納米制程和Foveros先進封裝技術,Lakefield在待機功率、核心面積和封裝高度上都比前幾代技術有了顯著降低。Lakefield帶來的頂級計算性能和超低熱設計功率,讓全新纖薄外觀的設備、二合一設備和雙屏設備都能以極低的待機功耗始終在線、始終互聯。 TeraPHY——用于高帶寬、低功耗通信的封裝內光學I/O小芯片。英特爾和Ayar Labs共同演示了整體內封光件(MIPO)與高性能系統芯片(SOC)的業界首次集成。Ayar Labs的TeraPHY*光學I/O小芯片與采用英特爾嵌入式多芯片互連橋接(EMIB)技術的英特爾Stratix 10 FPGA共同封裝,從芯片封裝中提供高帶寬、低功耗的數據通信,在一定時間內的延續距離高達2公里。此次合作將消除數據傳輸中性能、功耗和成本的固有瓶頸,幫助以新方法為摩爾定律的下一階段構建計算系統。 英特爾傲騰數據中心級持久內存——架構和性能。現已批量出貨的英特爾傲騰數據中心級持久內存是內存/存儲層級結構中首款被稱為持久內存的產品,并處于整個層級結構中全新的一層;谟⑻貭 3D XPoint技術,傲騰數據中心級持久內存擁有內存模塊外形,能夠以接近內存的速度提供超大容量,納秒級的低延時,并提供本地化的持久存儲。兩種運行模式(內存模式和App Direct模式)的詳細信息以及性能示例展示了這一全新層級如何支持數據供應子系統的完全重新架構,從而支持更快的,以及新的工作負載。 |