來源: 第一財經資訊 “計算機發展正面臨一個非常重要的變化,就是我們正在步入的泛在計算,它一個重要特點是從人使用計算機變成機器使用計算機,對智能計算的要求越來越迫切。”9月14日,2023全球AI芯片峰會上,清華大學教授、中國半導體行業協會副理事長魏少軍表示。 以大模型為代表的生成式AI年內大火,成為資本追逐的對象。但隨著AI訓練和計算需求增大,人們很快發現,AI算力成為瓶頸。這不僅體現在高算力AI訓練GPU一片難求,還體現在現有芯片難以滿足高性能計算。 魏少軍認為,AI需要新的芯片架構,以實現靈活的軟硬件編程能力。目前,芯片已難以靠工藝進步實現高性能計算,通過應用定義軟件、軟件定義芯片促成軟硬件有機融合,是提高計算效率的可行路徑。軟件定義芯片技術還有望成為我國集成電路設計業擺脫跟隨模仿、實現趕超提供一條全新技術路線。 AI呼喚新芯片架構 算力和算法成為當前AI訓練和AI推理的關鍵一環,源于深度神經網絡出現后對AI業態的重構。業界探索AI過程中,算法和算力均出現棘手問題。 魏少軍介紹,邁入智能化時代,業界曾探索過類腦計算路徑,但遇到一個難點,類腦計算依賴于人們對人腦的理解,在對人腦的理解不足夠深的情況下,可能只能模仿一些細胞層面的東西。而在深度神經網絡出現后,則出現了算法、數據、算力三個基本要素。 深度神經網絡發展也涌現新的問題。魏少軍表示,隨著深度神經網絡發展,算法不斷演進,新算法層出不窮,此外,一種算法對應一種應用,沒有統一的算法。在人腦工作時如何使用算法尚未明晰的情況下,用機械的計算方式模擬人類認知過程出現了難以解決的問題。當把復雜計算從云端遷至邊緣端的時候時,還會發現機器并不具備足夠的算力和能量。 為解決以上問題,魏少軍表示,AI可能需要新的計算方式,深度學習需要一款“智能計算引擎”,其可編程能力適應各類應用,且為計算和存儲密集型,還能實現數據從“云端”向“邊緣端”遷移的能力。AI呼喚新的芯片架構具有較高靈活性,這個新架構考慮到硬件和軟件兩個部分,使硬件和軟件形成比較有效的可編程性。 據魏少軍介紹,基于軟硬件可編程性,可把AI芯片分為幾類。包含CPU、DSP等在內的處理器的硬件可編程性較弱,軟件可編程性較強;ASIC、SoC等專用集成電路運行過程通常不需軟件,無靈活性,軟硬件可編程性均較弱;FPGA、EPLD等可編程邏輯器件在硬件編程方面則有高靈活性,但軟件編程性弱,且成本高、價格貴。目前,業內正探索的新型架構則具通用性且有高靈活性,軟硬件可編程性高,可擴大用量、降低成本。 “應用定義軟件,軟件定義芯片,是計算芯片技術的一次根本變革。”魏少軍表示,中國在軟件定義芯片領域突破早于并優于世界同行,目前已實現芯片架構和功能納秒級重構,使硬件電路可隨軟件算法的變化而快速變化,軟件定義芯片技術是能替代ASIC和FPGA的新型電路架構技術。 大算力時代 AI時代,算力爆發。但在半導體繼承接近物理極限,摩爾定律放緩情況下,通過制程提升提高芯片性能的路徑越來越難走通,且現有芯片架構也面臨難以供給高算力的問題。 魏少軍表示,人類對更高算力的追求在過去十年從未停滯,高性能計算機的計算能力已進入E級,即每秒可進行百億億次數學運算,隨著全球數據量超100ZB,對Z級計算能力的需求愈發迫切。而依靠工藝技術進步幾乎已無法實現更高性能的計算,若超算速度達Z級,耗電量與投資量必然巨大,難以落地。2022年世界第一的超算E級計算機的GPU芯片使用6nm工藝,若沿著現有路線發展,即便用尚未量產的3nm工藝也難落地現下一代超算Z級。 “從現有計算芯片的主流路線推演,難以滿足Z級超算的性能、功耗和成本需求。”魏少軍表示。現有計算芯片包括CPU、FPGA、GPU等,計算芯片計算資源占比至0.1%以下,計算資源利用率低至5%以下,數據傳輸耗能高達90%。 基于算力增長的需求,芯片架構有待變革。魏少軍表示,智能計算芯片應有學習和成長能力,有算法和軟件自主演進能力、架構動態變換能力、可編程性等,且有應具備高能量效率和高計算效率,避免使用指令這類低效率架構。 |