北京2023年9月15日 /美通社/ -- 精益求精的設計理念最早起源于建筑學,它要求設計師在建筑結構荷載上充分考慮極限設計下的結構功能,強調建筑結構需滿足安全性、可靠性、耐久性。如今,這種設計理念也融匯到各行各業,其中科技行業更是典型代表,服務器產品的設計更不例外。
對于服務器來說,可以從三個方面來看:首先,在產品設計時,結合不同的應用場景設計不同形態的產品來滿足業務需求;其次,在部件選型上,要考慮如何發揮性能和品質保障;最后,對產品結構、部件進行優化,在滿足期望性能的前提下,加強產品的易用性和可靠性。
浪潮信息今年發布的全新G7算力平臺,正是秉承了精益求精的設計理念,采用最先進的計算、存儲和互聯技術,實現全場景覆蓋,提供了從器件、整機到數據中心的全尺度智能化管理。
更佳性能 源自以系統為核心
建筑大師張開濟曾說過:"建筑設計不能只顧自己的一個設計,而要和整個城市的風格相和諧"。以整體為核心的設計,才是筑基經典的開始…而服務器作為數據中心中承載著數據處理的算力平臺,需要以全局視角來進行產品設計才是發揮出極限性能,包括解決架構設計、核心部件、高速互聯、散熱設計等一系列問題。
浪潮信息G7算力平臺堅持以系統為核心,從電路級、部件級、固件級、系統級進行了大量的創新工作。以一臺通用服務器的研發為例,整個系統需要經過30多個開發流程,使用150多種加工制造工藝,對280多個關鍵過程控制點的質量進行嚴格把控,并且還要實現與軟件和應用的優化和適配等問題。
系統設計的開端是保障供電,G7算力平臺擁有極限供電能力,采用第三代半導體碳化硅及氮化鎵開關元件,電源功率密度提升至100W/in³,在占比最高的20%~50%電源負載時,自動識別調適轉化率可達94%,提升4%~6%的轉換效率。
擁有強大動源后,影響產品性能的關鍵因素是整機散熱能力,G7算力平臺提供多種散熱方案,傳統風冷模式從風扇結構、熱流導風技術、智能風扇調控技術、EVAC散熱技術、整機架構等進行優化,通過復合型散熱調控,破解風源、風流場和高功耗部件難題,整機散熱效率提升24%以上,單臺設備一年可以節電近千度。面對PUE更嚴苛的需求,G7算力平臺支持冷板式液冷、浸沒式液冷等創新技術,其中冷板式液冷覆蓋包括CPU、內存等高功耗部件,液冷覆蓋部件的功耗占比70%以上,可幫助數據中心的PUE下降到1.1以下。
在內存優化方面,G7算力平臺的存儲模塊E3.S可通過CXL實現遠端內存擴展,延時性能基本與跨處理器內存訪問延時相當,滿足云計算虛擬化場景內存擴展不足問題。在網絡互聯方面,G7算力平臺支持Multi-Host網卡,不僅可以使多個CPU同時連接單張網卡,實現多CPU網絡IO Balance,減少跨CPU訪問延遲,同時支持多系統之間的互聯,多個計算、存儲節點可以通過單一的網卡和外界互連,數據中心性能可提升150%以上。
正是由于有了以上設計,G7服務器在最新的評測中摘下SPEC CPU、SPEC jbb雙路、四路性能冠軍,實現了不同處理器平臺、不同類型產品性能的全面升級,成為多元計算力平臺的性能標桿。
場景化設計 打造最強產品組合
建筑的本質是服務于功能,歌劇院和寫字樓的應用場景不同,呈現的建筑形態也截然不同,數據中心的建設也是一樣,不同用戶數據中心的建設面對著不同的挑戰,比如機房空間不足、數據量爆炸式增長、運維人員資源不足、擴容需求周期緊張等。面對不同的業務場景需求,G7算力平臺從計算密度、存儲密度、IO擴展等多個方面進行優化。
例如,大數據技術的發展讓數據中心用戶開始面對分布式緩存、熱存儲等差異化的存儲場景,對服務器計算性能、存儲密度以及IO有不同需求。
為此,浪潮信息推出了針對存儲優化型產品——NF5266G7,可應對計算性能、存儲密度不斷提升,IO擴展等多方面的壓力,在2U空間能支持2顆最新處理器,同時提供最大600TB和上百種存儲配置方案,讓大數據應用在CPU投資減少50%;而面對計算密集型場景, G7算力平臺可提供2U空間4節點產品,單機柜算力可提升4.2倍;而面對I/O擴展需求,G7算力平臺全系支持雙OCP及Multi-host網卡擴展,支持在線熱維護等,性能提升10%以上。
G7算力平臺支持8種主流通用處理器芯片,51種加速計算芯片,打造包括通用計算、AI計算、高端計算、應用優化、整機柜、一體機等產品,并搭載浪潮信息KeyarchOS操作系統,實現了服務器的軟硬件協同系統優化。
精益求精 穩定輸出澎湃算力
建筑設計最基本的要求是安全,結構安全性是防止破壞倒塌的能力,是結構工程最重要的質量指標,體現在材料、結構、消防、電氣等建筑的各方面。浪潮信息對于產品的打造也一直如此,堅持將精益求精的設計理念融匯到每個產品,打造高RAS特性。
G7算力平臺采用 "整機3層保護模式",從物理的硬件冗余、系統的降額設計及軟件的系統保護設計上層層提升產品可靠性。關鍵部件的冗余設計,如CPU供電采用多路供電方式,風扇、PSU等部件的N+1冗余設計,BIOS、BMC的雙ROM設計等,在一個器部件故障后,冗余的器部件可以保障系統作業不會中斷。
系統的降額設計,當機柜供電能力受限或者單個PSU供電不足時,浪潮信息獨有的動態Power Capping技術提供過載實時響應措施確保系統供電安全,確保業務連續性,實現主板MTBF無故障工作時間超過24W小時。這背后是主板上每一顆電容的嚴苛選擇,通過千萬次的測試和仿真實驗,優化元器件布局和散熱策略,減少元器件壓力及減緩老化,從而延長產品壽命,避免業務場景不同或機房差異帶來的系統工作異常問題;而軟件的系統保護是可靠算力的再一次進化,為了支持更多部件的熱插拔保護,G7算力平臺支持PSU、風扇、硬盤、OCP網卡等多個部件的Efuse保護機制,當出現異常時可實現毫秒級直接熔斷,為系統提供強力保護。
除了產品級的嚴苛設計,浪潮信息自有的王牌實驗室——"澎湃實驗室"對每款產品都要進行2000多項測試,包括30余項極限測試,開發的工藝文件、生產品控標準經由信息系統分發至世界各地工廠,通過智能制造系統統一執行,從而實現全球高品質交付。