ORihard KCU116E: 經濟實惠的 100Gbps 網絡和存儲 FPGA 開發平臺
Kintex® UltraScale+™ 系列被認為是 Xilinx® 基于 TSMC 16 nm FinFET 技術構建的、具有“價格/性能/瓦特”平衡比的 FPGA 器件。結合皆為新的 UltraRAM 和互連優化技術 (SmartConnect),該器件為需要通過高端功能收發器實現 100 Gbps 連接內核的應用提供了最經濟實惠的解決方案。這個系列專門為網絡和存儲應用而設計,如網絡包處理和無線 MIMO 技術、100 Gbps 有線網絡、工業和數據中心網絡加速以及 NVMe SSD(固態硬盤)存儲加速。本文通過使用 Design Gateway 的 TOE100G-IP 內核和 NVMeG4-IP 內核,在 Xilinx 的 KCU116E 評估套件上演示了 TCP 卸載引擎網絡和 NVMe SSD 實現的100Gbps 解決方案。其中,TOE100G-IP 內核用于在 100 GbE 接口上進行 12GB/s TCP 傳輸的 CPU 解決方案,而 NVMeG4-IP 內核則能夠實現每個 SSD 約 4GB/s 的難以置信的快速傳輸性能。
Kintex® UltraScale+ KCU116E 評估套件簡介
KCU116E 非常適用于評估 Kintex UltraScale+ 的關鍵功能,尤其是 28 Gbps 收發器性能。該套件非常適用于基于 XCKU5P-2FFVB676E FPGA 器件的快速原型開發。
板上包括一個板載的 1GB 64 位 DDR4-2666、以及用于多達 2 個 M.2 NVMe SSD 接口的 PCIe Gen4 x8 通道。16 x 28 Gbps GTY 收發器可用于組成 PCIe Gen4 X8和 2個100 GbE 接口,并提供各種外設接口和 FPGA 邏輯以方便用戶進行定制設計。
圖 1:KCU116E 評估套件。
通過搭配 Design Gateway 的 IP Cores,KCU116E 能提供開發最先進的 100Gbps 網絡和存儲解決方案所需的一切,而且不需要 MPSoC 支持。
實現 100Gbps 網絡和存儲解決方案
圖 2:KCU116E 的 100Gbps 網絡和存儲解決方案。(圖片來源:Design Gateway)
盡管 Kintex UltraScale+ 器件不像 Zynq UltraScale+ 那樣采用了 MPSoC 技術,但通過利用 Design Gateway 的 IP Cores 解決方案,可以實現網絡和 NVMe 存儲協議處理,無需處理器和操作系統。
1. TOE100G-IP:100GbE 全 TCP 協議棧 IP Core,無需 CPU
2. NVMeG4-IP:獨立的 NVMe 主機控制器,內置 PCIe Gen4 IP 軟核
TOE100G-IP 和 NVMeG4-IP 都可以在不需要 CPU/OS/驅動的情況下運行。對于使用這兩種 IP 的控制和數據路徑的用戶邏輯,可以由 Microblaze 的純硬件邏輯或裸機操作系統來實現,以使高層應用和算法的開發更快、更容易,而無需擔心復雜的網絡和 NVMe 協議。這為先進的系統級解決方案創造了新的機會,如傳感器數據采集、板載計算和基于 AI 的邊緣計算設備。
Design Gateway 的 TOE100G-IP 用于 UltraScale+設備
圖 3:TOE100G-IP 系統。(圖片來源:Design Gateway)
TOE100G IP 內核執行 TCP/IP 協議棧(在硬線邏輯中),與 Xilinx 的 100Gb 以太網子系統模塊連接,用于下層硬件。TOE100G IP 的用戶接口包括一個用于控制信號的寄存器接口、一個用于數據信號的 FIFO 接口。TOE100G IP 旨在與 100Gb 以太網子系統連接,后者使用 512 位 AXI4-ST 連接至用戶接口。Xilinx 提供的以太網子系統包括 EMAC、PCS 和 PMA 功能。100Gb 以太網子系統的用戶接口時鐘頻率等于 322.265625 MHz。
TOE100G-IP 的特點
· 完整的 TCP/IP 堆棧實施
· 一個 TOE100G IP 支持一個會話(可通過使用多個 TOE100G IP 實現多重會話)
· 同時支持服務器和客戶端模式(被動/主動打開和關閉)
· 支持 Jumbo 框架
· 通過標準 FIFO 接口提供簡單的數據接口
· 通過單端口 RAM 接口進行簡單的接口控制
XCKU5P-2FFVB676E FPGA 器件上的 FPGA 資源使用情況如下表 1 所示。
表 1:Kintex Ultrascale+ 器件的使用統計示例
有關 TOE100G-IP 的更多詳情,請參閱其規格書。可從 Design Gateway 網站下載規格書。
Design Gateway 的 GTY 收發器的 NVMe PCIe Gen4 主機控制器
Kintex UltraScale+ 有一個 GTY 收發器,能夠支持 PCIe Gen4 接口,但不含 PCIe Gen4 集成塊和 ARM 處理器。
Design Gateway 通過開發 NVMeG4-IP 內核解決了這個問題,該內核能夠作為獨立 NVMe 主機控制器運行并在單個內核中內置 PCIe 軟 IP 和 PCIe 橋接邏輯。NVMe PCIe Gen4 固態硬盤訪問的啟用簡化了用戶界面,使標準功能設計易于使用,而不需要掌握 NVMe 協議的知識。
圖 4:NVMeG4-IP 框圖。(圖片來源:Design Gateway)
NVMeG4-IP 的特點
· 能夠實現應用層、事務層、數據鏈路層和物理層的某些部分在沒有 CPU 或外部 DDR 存儲器的情況下訪問 NVMe SSD
· 使用配置為 4 通道 PCIe Gen4(256 位總線接口)的 Xilinx PCIe PHY IP 進行操作
· 包含 256 KB RAM 數據緩沖區
· 支持六條命令,即識別、關斷、寫入、讀取、SMART 和刷新(可選擇支持其他命令)
· 用戶時鐘頻率必須大于或等于 PCIe 時鐘(Gen4 為 250 MHz)
XCKU5P-2FFVB676E FPGA 器件上的 FPGA 資源使用情況如下表 2 所示。
表 2:Kintex Ultrascale+ 器件的實施統計舉例
有關 NVMeG4-IP 的更多詳情,請參閱其規格書。可從 Design Gateway 網站下載規格書。
在 KCU116E 上實施 TOE100G-IP 的舉例和性能結果
圖 5 所示為基于 KCU116E 的參考設計,以展示 TOE100G-IP 的應用情況。該演示系統包括裸機操作系統 Microblaze 系統、用戶邏輯和 Xilinx 的 100Gb 以太網子系統。
圖 5:TOE100G-IP 演示系統框圖。(圖片來源:Design Gateway)
該演示系統專們用于評估 TOE100G-IP 在客戶端和服務器模式下的操作。使用測試邏輯功能,可在測試模式下發送和接收數據,以便在用戶界面側獲得盡可能高的數據速度。對于使用 KCU116E 的 100GbE 接口,需要四個 SFP+ 收發器 (25GBASE-R) 和光纖電纜,如圖 6 所示。
圖 6:在 KCU116 上安裝的 TOE100G-IP 演示環境。(圖片來源:Design Gateway)
圖 7 顯示了 100G 與其他 (1G/10G/25G/40G) 比較時的示例測試結果。
圖 7:TOE100G-IP 與 KCU116E 上的 1G/10G/25G/40G 性能比較。(圖片來源:Design Gateway)
測試結果表明,TOE100G-IP 能夠實現大約 12GB/s 的 TCP 傳輸速度。
在 KCU116E 上的 NVMeG4-IP 實施和性能結果示例
圖 8 所示為基于 KCU116E 的參考設計,以展示 1CH NVMeG4-IP 的實施情況。如果用戶定制設計的 FPGA 資源可用的話,可以實施 NVMeG4-IP 的多個實例以實現更高的存儲性能。
關于 NVMeG4-IP 參考設計的更多詳情,請參考 Design Gateway 網站上提供的 NVMeG4-IP 參考設計文件。
圖 8:NVMeG4-IP 參考設計概覽。(圖片來源:Design Gateway)
該演示系統旨在通過 KCU116E 上的 NVMe SSD 寫入/驗證數據。用戶可通過串行控制臺控制測試操作。為了使 NVMe SSD 與 KCU116E 連接,需要一塊 AB18-PCIeX16 適配器板,如圖 9 所示。
圖 9:在 KCU116E 上安裝的 NVMeG4-IP 演示環境。(圖片來源:Design Gateway)
使用 512 GB Samsung 970 Pro 時,在 ZCU116 上運行演示系統的示例測試結果如圖 10 所示。
圖 10:使用 Samsung 970 PRO S 時,ZCU116 上 NVMe SSD 的讀/寫性能。(圖片來源:Design Gateway)
結語
TOE100G-IP 和 NVMeG4-IP 內核都提供了在 KCU116E 板上使用 100Gbps 連接功能的解決方案,可實現網絡和 NVMe 存儲應用。一個 TOE100G-IP 能夠在 100GbE 上進行大約 12GB TCP 傳輸。NVMeG4-IP 可以通過 NVMe PCIe Gen4 提供卓越的高性能存儲,每塊 SSD 的速度約為 4GB/s。NVMeG4-IP 的多個實例可用于組成 RAID0 控制器,并可提高存儲性能,以匹配 100GbE 的傳輸速度。
利用 KCU116E 評估套件和 Design Gateway 的網絡與存儲 IP 解決方案,就有可能以最少的 FPGA 資源實現最高性能的目標,從而獲得基于 Xilinx® Kintex UltraScale+® 器件的、經濟實惠的解決方案或產品。
VX: orihard2014