国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

美光 DDR5 內存配合第四代 AMD EPYC 處理器,提升高性能計算工作負載

發布時間:2022-12-19 16:50    發布者:eechina
關鍵詞: DDR5 , EPYC , 高性能計算 , HPC
作者:Krishna Yalamanchi、Sudharshan Vazhkudai

美光與AMD聯手為客戶及數據中心平臺提供一流的用戶體驗。雙方在奧斯汀建立聯合服務器實驗室,以減少服務器內存驗證時間,在產品驗證和發布期間共同進行工作負載測試。目前美光適用于數據中心的 DDR5 內存和第四代 AMD EPYCTMTM (霄龍)處理器均已出貨,我們對其進行了一些常見的高性能計算(HPC)工作負載基準測試。

長期以來,超級計算機承擔著高性能計算工作負載。此類大規模的數據密集型工作負載需要運行TB 級的數據量以進行數百萬個并行操作,以解決人類世界的難題,如天氣和氣候預測;地震建模;化學、物理和生物分析等。

隨著計算機架構的進步,此類工作負載往往托管在超大型“可橫向擴展”的高性能服務器集群中。這些服務器集群需要集合最強大的算力、架構、內存和存儲基礎設施,以滿足關鍵工作負載對可擴展性、低延遲和高性能的需求。然而隨著服務器 CPU 的性能和吞吐量不斷增長,DDR4 無法提供足夠的內存帶寬,來滿足不斷增長的高性能內核。



為緩解這一瓶頸,美光 DDR5 內存與采用了Zen 4 服務器架構的第四代AMD EPYC 處理器強強聯合,使服務器 CPU 能夠更好地匹配內存產品,滿足數據密集型工作負載對性能和效率的需求。美光DDR5 內存可幫助企業從本地和云端數據中更快獲取洞察。我們對最新的 AMD Zen 4 96 核CPU和美光DDR5進行了行業內高性能計算工作負載基準測試,所有結果均顯示性能提升了兩倍。

美光 DDR5 搭配第四代 AMD EPYC 處理器,在STREAM 測試中實現內存帶寬翻倍

STREAM1 是常見的基準測試工具,用于測量高性能計算機的內存帶寬,可捕獲高性能計算系統的峰值內存帶寬。

該工作負載使用的軟件堆棧

•        Alma 9 Linux kernel 5.14
•        STREAM.f,2021 年 11 月 29 日發布版本



測試設置

•        DDR4 系統搭配第三代 64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB
•        DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果

•        DDR5 系統每插槽內存帶寬翻倍,達到 378 GB/s
•        該結果意味著客戶能運行更大規模的人工智能/機器學習 (AI/ML)項目,或利用 DDR5 增加的內存帶寬進行更多高性能計算。



美光 DDR5, 助力天氣研究和預報 (WRF)4 速度提升2倍

此次測試使用的高性能計算工作負載代碼針對天氣和氣候。WRF模型在一些支持高性能浮點處理、高內存帶寬、低延遲網絡等傳統高性能計算架構中表現良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區 (CONUS)。

該工作負載使用的軟件堆棧

•        Alma 9 Linux kernel 5.14 
•        WRF 2.3.5 & 4.3.3 
•        Open MPI v4.1.1

測試設置

•        DDR4 系統搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB
•        DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果

•        美光 DDR5 搭配第四代 AMD EPYC 處理器,可實現 1.3567 時間步/秒 VS DDR4 系統的2.8533 時間步/秒
•        速度更快意味著可使用更大的數據庫或運行更多模型以進行天氣預測,進而改善預測的準確度。

美光 DDR5,助力OpenFOAM5 速度提升2倍

OpenFOAM 是一種計算流體動力學(CFD)的開源高性能計算工作負載,廣泛應用于多個行業,有助于縮短開發時間并降低成本。從消費類產品設計到航空航天設計,OpenFOAM能夠模擬不同應用中的物理互動,包括摩托車風擋湍流。在該模擬中,OpenFOAM 能夠計算摩托車和騎手周圍的穩定氣流。OpenFOAM 能夠根據用戶指定的進程數進行負載均衡計算,以此將網格分解成多個部分并分配給不同的進程求解。求解完成后,再將網格和解重新組合為單個域。

該工作負載使用的軟件堆棧

•        OpenFOAM CFD 軟件(版本8),其中摩托車網格尺寸為:600 x 240 x 240
•        Alma 9 Linux kernel 5.14 
•        Open MPI v4.1.1

測試設置

•        DDR4 系統搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB
•        DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果

測試結果表明美光DDR5 產品組合將OpenFOAM 性能提高了 2.4 倍。OpenFOAM 為五大高性能計算軟件平臺之一,擁有大型開源社區。該軟件廣泛應用于大學和研發中心,可利用高帶寬內存和擁有密集內核的高性能CPU,實現高度的并行操作。

美光 DDR5 ,助力分子動力學6 速度提升2倍

CP2K 是一款開源量子化學工具,適用于許多應用,包括固態生物系統模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水(H2O)的密度泛函理論(DFT),模擬盒子中共包含 6,144 個原子(2,048 個水分子)。

該工作負載使用的軟件堆棧

•        H2O-DFT-LS.NREP4 及 H2O-DFT-LS
•        Alma 9 Linux kernel 5.14

測試設置

•        DDR4 系統搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統2的 RDIMM 內存槽插滿,共 64GB
•        DDR5 系統搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統3的 RDIMM 內存槽插滿,共 64GB

測試結果
測試結果表明美光DDR5 產品組合將分子動力學性能提高了2.1 倍。隨著內核數和內存帶寬增加,此類工作負載的性能也顯著提升。

總結

目前我們只針對少量高性能計算工作負載進行了測試,因此以上只是我們的初步成果。將高性能高帶寬內存與最新的服務器處理器(如第四代 AMD EPYC 處理器)相結合,可為高性能計算客戶創造新的可能。我們期待更多企業數據中心和云服務商,能夠在新平臺上應用美光 DDR5 產品,解鎖更高的性能與能效。

________________________
1 我們在 STREAM 基準測試中配置了 25 億個向量的STREAM Benchmark——運行在一臺單 AMD CPU 系統上
2 AMD DDR4 系統為一臺 64 核 AMD EPYC 7763 處理器, DDR4-3200 MHz 的RDIMM 內存槽插滿,共 64GB
3 AMD DDR5 系統為一臺 96 核 AMD EPYC 9654 處理器, DDR5-4800 MHz 的RDIMM 內存槽插滿,共 64GB
4  橫向分辨率為 12.5 公里CONUS 的 WRF 在 DDR4 系統上的運行時間為 929 秒,在 DDR5 系統上的運行時間為 287 秒(均包括存儲器的輸入/輸出時間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結果為 1.3567 時間步/ 秒, 相比之下DDR4 的運行時間為2.8533時間步/秒。
5 針對 OpenFOAM,我們運行了三種變體:
5a:1004040 runtimes,DDR4 系統運行時間為 1,144 秒,DDR5 系統運行時間為 478 秒
5b:1084646 runtimes,DDR4 系統運行時間為 1,633 秒,DDR5 系統運行時間為 698 秒
5c:1305252 runtimes,DDR4 系統運行時間為 2,522秒,DDR5 系統運行時間為 1,091 秒
6 分子動力學工作負載在 DDR4 系統上的運行時間為 2,519 秒,在 DDR5 系統上的運行時間為 1,242 秒

作者:

Krishna Yalamanchi
Krishna 擔任美光生態系統高級開發經理,專注于研發 DDR5 和 CXL 解決方案。他曾在英特爾 IT 部門任職,領導 SAP HANA 的遷移工作,通過與SI、OEM和云服務提供商共同搭建的合作伙伴生態系統,推出了用于SAP工作負載的第三代與第四代 Intel Xeon 處理器。


Sudharshan Vazhkudai
Sudharshan S. Vazhkudai 博士擔任美光系統架構和工作負載分析總監。他領導一支位于奧斯汀和印度海得拉巴的團隊,致力于研究內存和存儲(DDR、CXL、HBM 和 NVME)產品中層次結構的可組合性,并優化與數據中心工作負載相關的系統架構。

本文地址:http://m.qingdxww.cn/thread-808151-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 利用SAM E54 Xplained Pro評估工具包演示CAN轉USB橋接器以及基于CAN的主機和自舉程序應用程序
  • 使用SAM-IoT Wx v2開發板演示AWS IoT Core應用程序
  • 使用Harmony3加速TCP/IP應用的開發培訓教程
  • 集成高級模擬外設的PIC18F-Q71家族介紹培訓教程
  • 貿澤電子(Mouser)專區
關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 99久久国产综合精麻豆 | 黑人中文字幕在线精品视频站 | 国产精品爽爽va在线观看网站 | 国产精品入口免费麻豆 | 国产高清在线精品一区在线 | 一级毛片免费网站 | 在线观看欧美视频 | 热99精品在线 | 狠狠色丁香婷婷综合激情 | 特黄特黄 | 国产亚洲精品xxx | 视频久久 | 日韩欧美综合 | 欧美一区二区放荡人妇 | 在线日本视频 | 综合久久99久久99播放 | 成人 亚洲 成人影院 | 日韩在线视频一区 | 欧美精品日韩一区二区三区 | 国产内地激情精品毛片在线一 | 四虎精品视频 | 国产精品资源在线 | 国产一级精品视频 | 国产亚洲蜜芽精品久久 | 国产成人亚洲精品 | 四虎影院4hu| 狠狠干伊人网 | 免费观看欧美性生 | 久久成人福利视频 | 点击进入毛片免费观看 | 中文字幕久荜一区日本精品 | 成年女人18级毛片毛片免费观看 | 亚洲区精选网址 | 综合亚洲欧美日韩一区二区 | 日韩高清一区二区三区五区七区 | 日本中文字幕在线视频 | 亚欧乱色视频网站大全 | 97se狠狠狠狠狠亚洲综合网 | 亚洲4388全网最大色 | 日韩午夜在线视频不卡片 | 中文字幕视频二区 |