跳至內容

酋長岩 (超級電腦)

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

酋長岩(英語:El Capitan)是一台百億億級超級電腦,位於美國加利福尼亞州利弗莫爾市的勞倫斯利弗莫爾國家實驗室,於2024年投入執行[1]。該系統基於Cray EX Shasta架構設計。酋長岩在2024年11月發布的第64屆全球超級電腦500強榜單中超越前沿,成為世界上最快的超級電腦[2]。酋長岩是美國部署的第三個百億億級系統,其主要用途是支援美國國家核安全管理局核武庫管理計劃[3]

設計

[編輯]

El Capitan總共使用11,039,616個CPU和GPU核心,包括43,808個AMD第四代EPYC 24核"Genoa" 1.8 GHz CPU(共1,051,392個核心)和43,808個AMD Instinct MI300A GPU(共9,988,224個核心)。MI300A將24個基於Zen4的CPU核心和基於CDNA3的GPU整合在一個有機封裝中,同時配備128GB HBM3主記憶體。

伺服器刀片通過慧與科技Slingshot 64埠交換機互連,提供12.8太位元/秒的頻寬。刀片組以蜻蜓拓撲方式連接,任意兩個節點之間最多經過三跳。系統使用光纖或銅纜,經過最佳化以最小化線纜長度。匯流排纜長度達145公里。

El Capitan採用APU架構,CPU和GPU共享片上相干互連。

El Capitan占地約697平方米,相當於兩個網球場大小。系統由至少87個電腦櫃組成,包括"Rabbit" NVM-Express快速儲存陣列和計算節點。根據The Next Platform報道:"El Capitan總共有11,136個節點,安裝在液冷的Cray EX機櫃中,每個節點配備四個MI300A計算引擎,系統總共配備44,544個裝置。每個裝置都有128 GB的HBM3主主記憶體,在CPU和GPU晶片之間共享,執行頻率為5.2 GHz,提供5.3 TB/秒的CPU和GPU晶片間總頻寬。"

歷史

[編輯]

El Capitan是美國能源部CORAL-2計劃的一部分,旨在替代2018年部署的IBM/NVIDIA機器Sierra勞倫斯利弗莫爾國家實驗室慧與科技CrayAMD合作建造該系統。

2023年6月,三個El Capitan原型機(名為rzVernal、Tioga和Tenaya)的效能足以進入TOP500超級電腦排行榜。其中rzVernal達到4.1拍浮點運算速度。2023年7月初,El Capitan的首批組件在勞倫斯利弗莫爾實驗室安裝,預計到2024年中期完成全部安裝。

到2024年11月18日,El Capitan已投入執行,並被驗證為世界上最快的超級電腦,達到1.742百億億浮點運算速度。

2025年2月,該系統在加利福尼亞州勞倫斯利弗莫爾國家實驗室正式啟用。實驗室表示,這台超級電腦耗資6億美元,將用於處理與美國核武器庫相關的各種敏感和機密任務。

揭幕儀式

[編輯]

El Capitan於2025年1月9日正式揭幕。慧與科技(HPE)執行長安東尼奧·內里超威半導體(AMD)執行長蘇姿丰出席了揭幕儀式。

在活動中,兩位執行長討論了El Capitan對其公司人工智慧計劃的影響。內里表示:"這是完全的技術復用,"強調了El Capitan與用於訓練人工智慧的系統之間的相似之處。蘇姿丰補充道:"正如安東尼奧所說,這基本上是相同的構建模組,只是以不同方式組態,"強調了為El Capitan開發的技術在增強其人工智慧努力方面的適應性。

參考來源

[編輯]
紀錄
前任者:
前沿_(超級電腦)
1.3百億億浮點
世界最快超級電腦
2024年11月至今
1.7百億億浮點
現任