一種新穎的深度學習加速器。專用單元定義了一個SRAM,該單元可以處理矩陣乘法,量化,存儲以及推理處理器所需的其他工作。 在Spice仿真中,當使用8位整數數學識別手寫數字時,該設計可提供100兆次操作/秒/瓦(TOPS / W)。它的計算密度可以擊敗Google的TPU一個數量級。 該設計是使用內存中計算方法的加速器產品線中最新的一種。設計使用40納米NOR閃存單元的深度學習處理器,其目標是為監視攝像機等設備使用低功耗芯片。 設計時使用了很少的模擬電路,因此可以擴展到精細的工藝節點。它可能成為低功耗處理器中引擎(從邊緣到云)的引擎。 獨特的方式操縱SRAM單元以處理深度學習任務 這個設計使用戶可以為從權重到神經網絡層甚至單個神經元的所有內容創建自定義參數。這種靈活性可以使將來設計用于訓練處理器的設計成為可能。但是尚無用于對該設計進行編程的軟件堆棧,可能會在以后解決或留給將來的客戶使用。 |