国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

歐洲最強(qiáng)芯片,碰壁!

發(fā)布時(shí)間:2024-6-26 14:59    發(fā)布者:eechina
來(lái)源:半導(dǎo)體行業(yè)觀察

設(shè)計(jì)芯片并將其引導(dǎo)至代工、封裝和組裝是一個(gè)復(fù)雜而困難的過(guò)程,如果國(guó)家層面不具備這些技能,將對(duì)這些國(guó)家的競(jìng)爭(zhēng)力產(chǎn)生深遠(yuǎn)影響。

在許多方面,歐洲的行為更像一個(gè)國(guó)家,超級(jí)計(jì)算當(dāng)然也是如此,過(guò)去幾十年來(lái),超級(jí)計(jì)算一直是一項(xiàng)合作事業(yè)。2010 年代末,正當(dāng) HPC 加速計(jì)算的浪潮在人工智能領(lǐng)域達(dá)到高潮時(shí),歐洲厭倦了依賴美國(guó)和日本供應(yīng)商的超級(jí)計(jì)算機(jī)計(jì)算引擎,并成立了歐洲處理器計(jì)劃,以創(chuàng)建本土的歐洲計(jì)算引擎,并成立了歐洲 HPC 合資企業(yè),為整個(gè)歐洲安裝的百億億次級(jí)和百億億次級(jí)系統(tǒng)提供資金。迄今為止,已為三個(gè)百億億次級(jí)系統(tǒng)編制了預(yù)算。

EPI 處理器和加速器路線圖上出現(xiàn)了一些坎坷和延誤,但歐洲仍然致力于在當(dāng)前情況下盡可能實(shí)現(xiàn)百億億次系統(tǒng)所用計(jì)算引擎的本土化。

當(dāng)我們進(jìn)一步了解歐洲第二個(gè)百億億次級(jí)系統(tǒng)時(shí),我們想到了這一點(diǎn),該系統(tǒng)將被稱為“Alice Recoque”,并將在法國(guó)運(yùn)行,與此同時(shí),我們也在思考 SiPearl 推遲推出其第一代“Rhea1”基于 Arm 的處理器,該處理器將設(shè)計(jì)為 EuroHPC 聯(lián)盟的主機(jī)處理器,該聯(lián)盟正在 EPI 努力下推動(dòng) CPU 和加速器的設(shè)計(jì)。

處理器交付延遲是芯片行業(yè)的常態(tài),而非例外,盡管從外部來(lái)看可能并非如此。芯片設(shè)計(jì)者/銷售商(我們不愿使用“制造商”這個(gè)名詞,因?yàn)槿缃癯擞⑻貭栆酝,他們通常不生產(chǎn)芯片)內(nèi)置緩沖區(qū),這就是他們堅(jiān)持相當(dāng)常規(guī)的路線圖的方式。設(shè)計(jì) Rhea 系列 CPU 的 SiPearl 芯片初創(chuàng)公司正在實(shí)時(shí)學(xué)習(xí)所有這些技能,這些 CPU 旨在用作歐洲百億億次級(jí)超級(jí)計(jì)算機(jī)的主處理器以及 HPC 領(lǐng)域常見(jiàn)的僅 CPU 工作負(fù)載的計(jì)算引擎。它在設(shè)計(jì)第一款芯片時(shí)已經(jīng)耗盡了大量緩沖區(qū)。這對(duì)于 EPI 工作和歐洲的百億億次級(jí)愿望來(lái)說(shuō)都是不幸的,但歐洲在試圖培養(yǎng)本土芯片技術(shù)時(shí)有應(yīng)急計(jì)劃。

你必須在這里打一場(chǎng)長(zhǎng)期的比賽,包括投資鑄造廠和封裝公司,以便他們?cè)跉W洲建立先進(jìn)的工廠,如果你想要能夠自力更生,正如歐洲肯定做的那樣。

SiPearl 是一家位于法國(guó)巴黎郊外的初創(chuàng)公司,其 Rhea1 CPU是“Jupiter”百億億次級(jí)超級(jí)計(jì)算機(jī)的核心,該超級(jí)計(jì)算機(jī)將于今年在德國(guó)于利希研究中心安裝。EuroHPC JV 尚未透露有關(guān)最終 Jupiter 配置的大量細(xì)節(jié),但我們知道 Jupiter 系統(tǒng)中所謂的“GPU Booster”部分可能基于 Nvidia 的“Grace”CG100 Arm 服務(wù)器芯片和“Hopper”H100 GPU 加速器超級(jí)芯片。我們之所以說(shuō)“可能”,是因?yàn)槲覀冋J(rèn)為,當(dāng) Jupiter 的 GPU Booster 模塊在今年晚些時(shí)候啟動(dòng)時(shí),很有可能基于 Nvidia 的“Blackwell”B100 GPU,與 H100 相比,其 FP64 性能提高了 2.3 倍,預(yù)計(jì)增量成本約為 1.6 倍。

在 6 月份的 500 強(qiáng)超級(jí)計(jì)算機(jī)排行榜上,我們一窺了 Jupiter 系統(tǒng)的大部分計(jì)算能力,當(dāng)時(shí) FZJ 展示了一個(gè)名為“Jedi”的原型系統(tǒng),該系統(tǒng)由 Grace-Hopper 超級(jí)芯片組成,通過(guò)同樣來(lái)自 Nvidia 的四軌 200 Gb/秒 NDR InfiniBand 網(wǎng)絡(luò)連接。Jedi 是 Jupiter Exascale Development Instrument 的縮寫(xiě),它有 24 個(gè) Grace-Hopper 超級(jí)芯片,在 FP64 性能上峰值為 5.1 petaflops,在高性能 LINPACK 基準(zhǔn)測(cè)試中峰值為 4.5 petaflops。重要的是,在 67.3 千瓦的功耗下,這架 Grace-Hopper 系統(tǒng)每瓦可提供 72.7 gigaflops,這使其成為各種 HPC 基準(zhǔn)測(cè)試中能效最高的機(jī)器。Blackwell GPU 可能會(huì)將 GPU Booster 的能效推得更高。

我們推測(cè),為了挽回面子,并讓 Rhea1 經(jīng)受真正的壓力測(cè)試,EuroHPC 和 EPI 都希望 Jupiter 的通用集群(也稱為集群模塊)仍然基于 Rhea1 處理器,即使這款 CPU 的交付時(shí)間已經(jīng)推遲到 2025 年,盡管它基于 Arm 的 Neoverse“Zeus”V1 內(nèi)核。

但無(wú)論如何,由于 EPI 并未為 Jupiter 提供可以取代 Nvidia GPU 的 RISC-V 加速器(我們認(rèn)為它仍將嘗試這樣做),因此由于 GPU 助推器已切換到 Nvidia 超級(jí)芯片,因此將有大量 Arm 內(nèi)核可用于運(yùn)行僅使用 CPU 的應(yīng)用程序。

Jupiter 的絕大部分計(jì)算能力將集中在 GPU 加速節(jié)點(diǎn)上。通過(guò)在 GPU Booster 節(jié)點(diǎn)中使用 Nvidia 超級(jí)芯片,將有大量 Grace 處理器可用——準(zhǔn)確地說(shuō),每個(gè) Hopper 或 Blackwell GPU 都有一個(gè)。要在 LINPACK 測(cè)試中輕松突破 1 exaflops 的性能,可能需要 32,000 個(gè)帶有 H100 的節(jié)點(diǎn)和 16,000 個(gè)帶有 B100 的節(jié)點(diǎn),因此將需要 32,000 或 16,000 個(gè) Grace CPU,每個(gè) CPU 有 72 個(gè)內(nèi)核,總共 230 萬(wàn)或 115 萬(wàn)個(gè)內(nèi)核。我們認(rèn)為后者在 GPU 性能和能效方面是理想的,但很難說(shuō) EuroHPC 是否能讓 Nvidia 放棄 Blackwell GPU 來(lái)為 Jupiter 系統(tǒng)服務(wù)。如果 Nvidia 在 Jupiter 時(shí)間范圍內(nèi)只有 H100,那么 FZJ 將獲得兩倍的 Grace 核心,因?yàn)樗诘却?Rhea1 的交付和基于它的通用集群。

相比之下,F(xiàn)ZJ 的“Juwels”系統(tǒng)基于英特爾“Skylake”Xeon 8168 處理器,具有 114,840 個(gè)內(nèi)核,峰值聚合 FP64 性能為 9.9 petaflops。較新的“Juwels Booster”系統(tǒng)于 2020 年安裝,擁有 449,280 個(gè) AMD Epyc 7402 處理器內(nèi)核,峰值額定速度略低于 71 petaflops。我們根據(jù)布里斯托大學(xué)安裝的 Isambard 3 系統(tǒng)中使用的 Grace-Grace 超級(jí)芯片的性能得出的猜測(cè)是,Jupiter 的 GPU Booster 中的 32,000 個(gè) Grace CPU 本身將在 FP64 下提供約 225 petaflops 的性能。這是 FZJ 目前安裝的 Juwels 和 Juwels Booster 全 CPU 系統(tǒng)的全 CPU 性能的 2.8 倍。

Rhea1 對(duì)此添加的任何內(nèi)容都是漸進(jìn)的且好的,并且為 Rhea1 創(chuàng)建的軟件可以在 Grace 上運(yùn)行,反之亦然,因?yàn)樗鼈兌甲袷?Arm 標(biāo)準(zhǔn)。

正如我們之前在 2023 年 4 月報(bào)道的那樣,Rhea1 預(yù)計(jì)將擁有 72 個(gè)基于 Arm 的“Zeus”V1 內(nèi)核的內(nèi)核,并將于今年上市。在最近的一次延遲之后,SiPearl 現(xiàn)在表示,它將在 2025 年的某個(gè)時(shí)候提供最多 80 個(gè)內(nèi)核的 Rhea1。這意味著在恒定時(shí)鐘速度下吞吐量將提高 11%,這有助于稍微緩解延遲問(wèn)題。

我們認(rèn)為最初的計(jì)劃是使用臺(tái)灣半導(dǎo)體制造公司的 7 納米工藝來(lái)生產(chǎn) 72 個(gè)內(nèi)核,而在此過(guò)程中,SiPearl 轉(zhuǎn)向了臺(tái)積電的 7 納米工藝的 N6 改進(jìn)版,并能夠在設(shè)計(jì)中添加另外 8 個(gè)活動(dòng)內(nèi)核。(84 個(gè)內(nèi)核更容易添加,因?yàn)樽畛醯脑O(shè)計(jì)似乎是每列 12 個(gè)內(nèi)核,而為了實(shí)現(xiàn)良率可能會(huì)損失 4 個(gè)內(nèi)核。)



Rhea1 芯片混合了 DDR5 主內(nèi)存和 HBM2e 堆疊內(nèi)存,據(jù)我們所知,混合內(nèi)存子系統(tǒng)是導(dǎo)致該處理器延遲的原因。我們?cè)?2020 年看到的規(guī)格顯示它有四個(gè) DDR5 內(nèi)存控制器,但現(xiàn)在我們看到它也有四個(gè) HBM2e 內(nèi)存堆棧,來(lái)自三星。該芯片的 I/O 控制器預(yù)計(jì)還將有 104 條 PCI-Express 5.0 通道。

還有一件事需要考慮:Nvidia在 Grace CPU 中使用了“Demeter”V2 內(nèi)核,這一點(diǎn)很重要。亞馬遜網(wǎng)絡(luò)服務(wù) (Amazon Web Services ) 即將推出的“Graviton4”自主研發(fā)處理器也使用了這些V2 內(nèi)核。Rhea1 中使用的 Zeus 內(nèi)核中的 V1 內(nèi)核有一對(duì) 256 位 SVE2 矢量引擎,但 V2 內(nèi)核有四個(gè) 128 位矢量,在某些類型的處理中效率更高。

無(wú)論如何,按照某種思維方式,32,000 個(gè) Grace-Hopper 超級(jí)芯片在 LINPACK 上達(dá)到每秒百億億次浮點(diǎn)運(yùn)算的峰值 FP64 性能要比在 FZJ 上達(dá)到 16,000 個(gè) Grace-Blackwells 更好,因?yàn)檫@樣可以獲得兩倍的 CPU 數(shù)量。

這將帶我們走進(jìn)將安裝在 GENCI 的 Alice Recoque 系統(tǒng),該系統(tǒng)由 CEA(法國(guó)相當(dāng)于美國(guó)能源部)運(yùn)營(yíng),并由法國(guó)和荷蘭政府以及 EuroHPC JV 集體出資。



Rhea2 芯片預(yù)計(jì)將由兩個(gè)芯片組成,根據(jù)上述路線圖,從今年早些時(shí)候開(kāi)始,它預(yù)計(jì)將于 2025 年完成,使用 Rhea2 的百億億次級(jí)系統(tǒng)(復(fù)數(shù))將于 2026 年在歐洲安裝。我們猜測(cè)兩個(gè)芯片至少各有 64 個(gè)內(nèi)核,性能將提高 1.6 倍。Rhea2 可能會(huì)嘗試將內(nèi)核數(shù)量推至 192 個(gè),每個(gè)芯片有 96 個(gè)內(nèi)核。這將是 Rhea1 內(nèi)核數(shù)量的 2.4 倍,但我們認(rèn)為時(shí)鐘速度必須略有降低,因此最終性能可能只有 2 倍。

如果 SiPearl 想要避免 Rhea2 芯片的麻煩,我們強(qiáng)烈建議該公司與 Arm 合作,使用“Poseidon”V3 核心及其“Voyager”計(jì)算子系統(tǒng) (CSS) V3 包。這將有助于所有芯片設(shè)計(jì)人員簡(jiǎn)化流程并加快開(kāi)發(fā)速度。因?yàn)闆](méi)有時(shí)間嘗試從頭開(kāi)始做所有事情,以滿足 Rhea2 和 Alice Recoque 系統(tǒng)進(jìn)入 GENCI 并由 CEA 運(yùn)行的 2026 年最后期限。

Arm 早在 2023 年 8 月就啟動(dòng)了 CSS 計(jì)劃,并展示了如何采用 CSS 堆棧(包括內(nèi)核、網(wǎng)格互連、I/O 控制器等)來(lái)節(jié)省 80 個(gè)工程師年的工作量。由于只有 190 名員工,并且只有兩年時(shí)間推出 Rhea2,即 380 個(gè)工程師年,SiPearl 似乎是 Voyager CSS V3 套件的理想候選者。



在上表中,Jupiter 機(jī)器有 32,000 個(gè) Grace-Hopper 節(jié)點(diǎn)。在其他機(jī)器中,當(dāng)有 GPU 時(shí),CPU 基本上被忽略,但出于上述原因,我們認(rèn)為 Jupiter 不會(huì)出現(xiàn)這種情況。有傳言稱 Rhea1 集群將只有 1,300 個(gè)節(jié)點(diǎn)。這性能不是很好。

我們認(rèn)為 EuroHPC JV 確實(shí)希望在 Alice Recoque 系統(tǒng)的所有節(jié)點(diǎn)中都使用 Rhea2,并且希望在系統(tǒng)中基于 RISC-V 架構(gòu)加速“Hurricane”EPAC。我們認(rèn)為每個(gè) Rhea2 CPU 上都會(huì)連接大量此類 EPAC 協(xié)處理器,我們還認(rèn)為它們將以四比一的 CPU 和加速器比例配置。我們不知道 Hurricane 設(shè)備的性能如何或效率如何,因此我們無(wú)法估計(jì)需要多少設(shè)備才能突破 LINPACK 上的 1 exaflops 障礙。

如果這一切都失敗了,那么 EuroHPC JV 可以資助一個(gè)基于 Nvidia 電機(jī)的系統(tǒng),使用未來(lái)的“Vera”Arm 服務(wù)器 CPU 和“Rubin”GPU 加速器,然后就完事了。

我們還認(rèn)為,Alice Recoque 不由法國(guó)系統(tǒng)制造商和 IT 服務(wù)供應(yīng)商 Atos 的超級(jí)計(jì)算子公司 Eviden 打造是不可想象的。

Alice Recoque 系統(tǒng)的預(yù)算為 5.42 億歐元(5.802 億美元),其中 2.71 億歐元(2.911 億美元)來(lái)自 EuroHPC JV,2.63 億歐元(2.815 億美元)來(lái)自法國(guó)政府,800 萬(wàn)歐元(860 萬(wàn)美元)來(lái)自荷蘭政府。

順便說(shuō)一句,歐洲第二臺(tái)百億億次級(jí)計(jì)算機(jī)系統(tǒng)的名字來(lái)源于愛(ài)麗絲·阿爾諾·雷科克,她于 1929 年出生于阿爾及利亞,并于 1954 年在巴黎高等電子與電氣工程學(xué)院(相當(dāng)于法國(guó)的麻省理工學(xué)院)獲得工程學(xué)研究生學(xué)位。畢業(yè)后,她在 Société d'Electronique et d'Automatisme (SAE) 工作,幫助設(shè)計(jì)了多代小型計(jì)算機(jī),特別是 Mitra 系列,該系列是為了與 Digital Equipment Corp 的 PDP 和 VAX 系列競(jìng)爭(zhēng)而創(chuàng)建的。1985 年,她轉(zhuǎn)投 Bull Group,從事并行超級(jí)計(jì)算機(jī)和人工智能方面的工作,同時(shí)還擔(dān)任多所法國(guó)著名大學(xué)的計(jì)算機(jī)科學(xué)教授。
本文地址:http://m.qingdxww.cn/thread-861877-1-1.html     【打印本頁(yè)】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,我們將根據(jù)著作權(quán)人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評(píng)論 登錄 | 立即注冊(cè)

廠商推薦

  • Microchip視頻專區(qū)
  • 利用SAM E54 Xplained Pro評(píng)估工具包演示CAN轉(zhuǎn)USB橋接器以及基于CAN的主機(jī)和自舉程序應(yīng)用程序
  • 使用SAM-IoT Wx v2開(kāi)發(fā)板演示AWS IoT Core應(yīng)用程序
  • 使用Harmony3加速TCP/IP應(yīng)用的開(kāi)發(fā)培訓(xùn)教程
  • 集成高級(jí)模擬外設(shè)的PIC18F-Q71家族介紹培訓(xùn)教程
  • 貿(mào)澤電子(Mouser)專區(qū)
關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號(hào) | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 日本欧美大码a在线视频播放 | 亚洲精品在线免费看 | 羞羞视频免费看网站 | 成人精品一级毛片 | 亚洲欧美精品综合中文字幕 | 亚洲欧洲自拍 | 麻豆免费视频 | 国产中文字幕亚洲 | 91美女视频 | 亚洲成人网在线 | 久久国产区 | 黄色片视频在线播放 | 国产婷婷综合在线视频 | 国产午夜视频在永久在线观看 | 黄色网页在线观看 | 欧美高清一级 | 欧美日韩国产亚洲一区二区 | 亚洲视频在线免费看 | 麻豆国产13p| 综合九九 | 日韩在线视精品在亚洲 | 99久久www免费 | 日本高清视频在线www色 | 国产免费看| 天天操中文字幕 | 国产国拍亚洲精品福利 | 五月婷婷六月爱 | 欧美在线天堂 | 手机免费看黄色 | 五十路亲子中出在线观看 | 77788色淫免费网站视频 | 国产又爽又黄又刺激的软件 | 啦啦啦在线观看视频免费观看4 | 国产麻豆精品免费密入口 | 热re99久久精品国99热 | 九九在线观看高清免费 | 韩国特黄毛片一级毛片免费 | 成人免费午间影院在线观看 | 欧美三茎同入 | 91热在线 | 三级欧美在线 |