北京2022年7月25日 /美通社/ -- 近期,一系列針對浪潮NF5468A5服務器的專業測評不斷發布,報告顯示這款GPU服務器在典型的AI計算場景擁有超乎預期的卓越性能,在MLPerf Training、MLPerf Inference、Alphafold2、NAMD、HPL、Stream等各種典型應用評測中展示出了讓人驚嘆的領先性能,因而被媒體稱贊為"算力猛獸"。浪潮信息官網顯示,NF5468A5正在進行"超值機型 限免試用"活動,對算力有強大需求的用戶都可以免費申請。
NF5468A5是浪潮信息推出的一款面向AI訓練、AI推理、HPC、視頻處理等多種應用場景的GPU服務器,在4U空間內搭載2顆AMD EPYC處理器,支持多達8張雙寬加速卡,巧妙的分區散熱設計有效實現CPU與GPU模組的分流,同時通過PCIE 4.0直連有效降低CPU和GPU間的通信延遲。該服務器支持高達8T的DDR4內存、409.6 GB/s的內存總帶寬,并且提供了8個全高全長雙寬PCIe x16的物理插槽。其強勁的處理器性能、巨大的內存容量和帶寬、豐富的IO擴展,特別適合AI計算、云計算、HPC以及企業各類業務的工作負載。
媒體對NF5468A5進行了一系列測評。其中HPL測試結果表明,NF5468A5搭載2顆AMD EPYC 7543處理器,浮點計算速度為2.69 TFLOPS,根據AMD平臺理論浮點計算速度,處理器計算效率達到93.74%。在STREAM測試中,由于采用多線程并行,實測結果內存帶寬373 GB/s,對比平臺內存理論帶寬,實測內存帶寬效率同樣達到驚人的91.1%。
在AI訓練性能測試中,浪潮NF5468A5搭配8張NVIDIA A100 PCIE 40GB GPU,使用MLPerf Training V1.0代碼訓練卷積神經網絡ResNet50,每秒處理的圖片數量可以達到21486張,單臺機器35分鐘即可完成Resnet50模型訓練。參考最近幾期MLPerf訓練榜單,搭載8張NVIDIA A100 40G GPU卡的服務器的最好成績是36.2分鐘。可以說,在同等GPU配置的服務器中,浪潮NF5468A5的ResNet50訓練性能是最好的。
在AI推理性能測試中,搭載1張NVIDIA Tesla T4 GPU的NF5468A5,使用MLPerf Inference V1.0代碼,ResNet50測試結果為每秒處理5671.9張圖片,這份成績也是非常出色的。同時,NF5468A5能夠很好地支持寒武紀MLU270-S4推理加速卡,Caffe框架下的ResNet18計算性能每秒超過7000張圖片。
同時,媒體還對浪潮信息自研的專用加速器M10A進行了性能測試,結果表明,浪潮NF5468A5搭配1張M10A,可實現480fps 1080P視頻的流暢轉碼,一張M10A的視頻處理能力相當于一臺雙路服務器的性能。此外,NF5468A5搭載1張RTX3090顯卡,ETHASH算法性能突破100MH/s。
浪潮NF5468A5+單卡RTX3090 HASH算法測試結果
算法 |
ETHASH |
ETCHASH |
AUTOLYKOS2 |
BLAKE3 |
MTP |
MTP-TCR |
OCTOPUS |
性能 |
108MH/s |
108MH/s |
232MH/s |
2.44GH/s |
7.23MH/s |
28.78MH/s |
103.07MH/s |
算法 |
KAWPOW |
PROGPOW |
PROGPOW-VEIL |
PROGPOW-VERIBLOCK |
PROGPOWZ |
FIROPOW |
/ |
性能 |
55MH/s |
54.4MH/s |
54.85MH/s |
27.31MH/s |
54.37MH/s |
54.91MH/s |
/ |
NF5468A5在HPC應用性能方面同樣有非常優秀的表現。媒體在NF5468A5平臺上搭載了2顆AMD Milan-X 7773X運行常見的氣象應用WRF和計算流體力學應用OpenFOAM進行性能基準測試。測試數據顯示,WRF測試其性能相比同平臺搭載兩顆Rome 7742處理器的計算性能提升23%~34%;而在OpenFOAM測試中,其性能相比同平臺Rome 7742處理器計算性能提升34%~80%。
在最新一期評測中,媒體還對NF5468A5服務器在AI+Science應用場景的表現進行了全面的測評。測試選擇了兩項近期大熱的應用AlphaFold2和NAMD。評測結果發現,對于長度在1000以內的蛋白序列,結構預測的完整時間基本在半小時以內,意味著一臺NF5468A5服務器一天可以完成至少384個Alphafold2蛋白序列的預測任務;對于分子動力學模擬來說,STMV算例在NF5468A5上可以實現90.6ns/day的計算速度,一臺服務器一天就能實現100萬原子近100ns的模擬。浪潮NF5468A5 GPU服務器可以滿足絕大多數科研團隊在AlphaFold2、NAMD等科學應用領域的AI加速計算需求。
NF5468A5+單張A100預測得到的AlphaFold2 top1模型計算性能
通過多次不同配置、不同場景的深度評測,媒體認為浪潮NF5468A5是一款性能強大、應用場景廣泛的GPU服務器。該服務器硬件設計合理,可最大化發揮核心組件的性能優勢,并通過分區散熱設計保障服務器穩定運行。同時,NF5468A5廣泛兼容主流加速卡,以更靈活的計算架構最大程度地滿足用戶在圖像識別、自然語言處理、語音識別等多場景應用需求。
目前,據浪潮官網顯示NF5468A5正在推出 "超值機型 限免試用"活動,感興趣的用戶不妨申請,一試究竟。