Supermicro 的端到端液冷解決方案,利用 NVIDIA Blackwell 平臺推動行業,向可持續的人工智能數據中心過渡
加利福尼亞州圣何塞2024年10月17日 /美通社/ -- Supermicro, Inc.(納斯達克:SMCI)是人工智能 (AI)、云端、存儲和 5G/Edge 的整體 IT 解決方案提供商正在利用 NVIDIA Blackwell 平臺,向液冷數據中心加速過渡,為新人工智能基礎設施快速增長的能源需求提供新的能效模式。Supermicro 業界領先的端到端液體冷卻解決方案,由 NVIDIA GB200 NVL72 平臺提供支持,可在單機架上進行百萬兆級計算,并已開始向部分客戶提供樣品,并將于第四季度末全面投產。此外,最近發布的 Supermicro X14、H14 4U 液冷系統以及 10U 風冷系統已準備就緒,可用于 NVIDIA HGX B200 8-GPU 系統。
Supermicro 總裁兼首席執行官 Charles Liang 表示:"我們正在推動可持續 AI 計算的未來,我們的液冷 AI 解決方案,正在被世界上一些最具野心的 AI 基礎設施項目爭相采用,自 2024 年 6 月以來已出貨的液冷機架計有 2,000 多個。" "Supermicro 的端到端液體冷卻解決方案采用 NVIDIA Blackwell 平臺,可釋放下一代 GPU 的計算能力、成本效益和能效,例如 NVIDIA GB200 NVL72(單個機架中的超大規模計算機)的計算能力、成本效益和能效。Supermicro 在部署液冷 AI 基礎設施方面的豐富經驗,以及全面的現場服務、管理軟件和全球制造能力,為客戶在使用最強大、最可持續的 AI 解決方案改造數據中心方面提供了明顯的優勢。"
https://www.supermicro.com/en/solutions/ai-supercluster
Supermicro 為基于 NVIDIA GB200 NVL72 平臺的系統推出的液冷超級集群,采用全新的先進機架內或行內冷卻劑分配單元 (CDU),以及定制冷板,用于在 1U 外形中容納兩個 NVIDIA GB200 Grace Blackwell 超級芯片的計算托盤。Supermicro 的 NVIDIA GB200 NVL72 利用 Supermicro 的端到端液冷解決方案,在單個機架中實現了超大規模 AI 計算能力。該機架解決方案,集成了 72 個 NVIDIA Blackwell GPU 和 32 個 NVIDIA Grace CPU,通過 NVIDIA 第五代 NVLink 網絡互連。NVIDIA NVLink 交換機系統,以極低的延遲實現每秒 130 太字節 (TB/s) 的 GPU 總通信量,從而增強了人工智能和高性能計算 (HPC) 工作負載的性能。此外,Supermicro 支持最近發布的 NVIDIA GB200 NVL2 平臺,采用緊密耦合的兩顆 NVIDIA Blackwell GPU 和兩顆 NVIDIA Grace CPU 的 2U 風冷系統,適合輕松部署各種工作負載,如大型 LLM 推理、檢索增強生成 (RAG)、數據處理和高性能計算 (HPC) 應用。
Supermicro 領先的 4U 液冷系統和全新的 10U 風冷系統,現已支持 NVIDIA HGX B200 8-GPU 系統,并可投入生產。新開發的冷板和 250kW 容量的機架內冷卻劑分配裝置,最大限度地提高了 8 GPU 系統的性能和效率,在一個 48U 機架內可提供 64x 1000W NVIDIA Blackwell GPU 和 16x 500W CPU。最多 4 個全新 10U 風冷系統可以安裝并完全集成到機架中,其密度與上一代相同,同時提供高達 15 倍的推理和 3 倍的訓練性能。
SuperCloud Composer 軟件是 Supermicro 的綜合數據中心管理平臺,提供強大的工具,用于監控有關液冷系統和機架、冷卻劑分配裝置和冷卻塔的重要信息,包括壓力、濕度、泵和閥門狀況等。SuperCloud Composer 的液體冷卻咨詢模塊 (LCCM),冇助優化液體冷卻數據中心的運營成本并管理其完整性。
Supermicro 為數萬億參數的人工智能模型擴展基礎架構,走在采用 InfiniBand 和以太網創新網絡技術的前沿,包括 NVIDIA BlueField®-3 SuperNIC 和 400Gb/s 的 NVIDIA ConnectX®-7、NVIDIA ConnectX®-8、Spectrum?-4 和 NVIDIA Quantum-3 為 NVIDIA Blackwell 平臺提供 800Gb/s 的網絡連接。NVIDIA Spectrum-X? Ethernet 與超微公司的 4U 液冷和 8U 風冷 NVIDIA HGX H100 和 H200 系統集群配合使用,現在為迄今為止最大的 AI 部署之一提供動力。
Supermicro 是一站式商店,從概念驗證 (PoC) 到全面部署,提供所有必要的技術、液體冷卻、網絡解決方案和現場安裝服務。Supermicro 提供全面的、內部設計的液體冷卻生態系統,包括針對各種 GPU、CPU 和內存模塊進行了優化的定制冷板,還有多種 CDU 外形和容量、歧管、軟管、連接器、冷卻塔以及監控和管理軟件。這種端到端解決方案無縫集成到機架級配置中,顯著提高系統效率,緩解熱節流,同時降低數據中心運營的總體擁有成本 (TCO) 和對環境的影響,以迎接人工智能時代的來臨。
Supermicro 參加 2024 OCP Global Summit
2024 年 10 月 15 日至 17 日,請在加利福尼亞州圣何塞 OCP Global Summit 的 #21 號展位了解更多信息。
關于 Super Micro Computer, Inc.
Supermicro(納斯達克股票代碼:SMCI)是應用優化整體IT解決方案的全球領軍企業。Supermicro 成立于加州圣何塞并在該地運營,致力于為企業、云計算、AI 和 5G 電信/邊緣 IT 基礎設施提供創新,并爭取搶先一步上市。我們是一家提供服務器、人工智能、存儲、物聯網、交換機系統、軟件和支持服務的整體 IT 解決方案提供商。Supermicro 的主板、電源和機箱設計方面的專業知識推動了我們的研發和生產,為全球客戶提供了從云端到邊緣的下一代創新技術。我們的產品均在公司內部(包括美國、亞洲和荷蘭)完成設計和制造,通過全球運營實現規模和效益,從而優化總體擁有成本(TCO),并能夠(通過綠色計算)減少對環境的影響。獲獎無數的Server Building Block Solutions®通過我們靈活可重復使用的構建塊,為客戶提供了豐富的可選系統產品系列,用于優化其確切的工作負載和應用。這些構建塊支持全系列外形規格、處理器、內存、GPU、存儲、網絡、電源和冷卻解決方案(空調、自然空氣冷卻或液體冷卻)。
Supermicro、Server Building Block Solutions和We Keep IT Green是Super Micro Computer, Inc.的商標和/或注冊商標。
所有其他品牌、名稱和商標均為其各自所有者所有。