北京2021年9月22日 /美通社/ -- 9月17日,在蘇州舉行的第四屆全球人工智能產品應用博覽會(AIExpo2021)上,浪潮發布了新版AIStation人工智能推理服務平臺,為快速發展的人工智能應用提供強大的服務管理支撐,并可統一高效調度多款國際國內領先的AI芯片的算力,幫助企業和智算中心充分發揮多元算力作用,加速AI應用場景落地。此次發布是為了應對日趨豐富的人工智能應用對多元化AI芯片算力的需求,以及智能計算中心日益復雜的異構計算資源管理調度挑戰。
浪潮AIStation是業界領先的人工智能開發服務平臺,可支持超過數千節點AI服務器的超大規模人工智能集群調度管理。基于容器化技術簡化算力調度過程,幫助用戶擺脫在大規模AI計算集群中進行算力選擇、算力適配等繁雜工作,提高調度效率。實現資源敏捷調配,使得資源利用率得以大幅提升;強大的平臺調度機制可以應對需求突發場景在幾分鐘內自動完成服務擴容;支持多源模型統一部署,模型部署時間從數天縮短到幾分鐘,從而實現業務快速上線。AIStation可支持百萬級高并發的大規模AI推理服務場景,服務響應平均延遲低于1ms。
當前,日趨豐富的人工智能應用對多元化AI芯片算力的需求激增,驅動人工智能計算系統向多元算力計算架構轉化。使用多種AI芯片的混合計算架構需求越來越多,這種需求在產業AI化、智算中心等大規模AI計算系統建設時更加迫切。然而,各種類型AI芯片的連接接入標準不同,用戶在使用多元AI芯片系統時會遇到系統適配、芯片驅動、互聯互通、功耗管理、安全傳輸、易用性等各類問題,給用戶在部署多元AI芯片算力系統時提出巨大挑戰。
針對當前多元化算力的應用困局,浪潮此次發布的新版AIStation推理服務平臺實現了對英偉達、寒武紀、昆侖芯、高通等6家國際國內廠商的12款AI和GPU芯片的多元算力支持。AI芯片可通過適配浪潮提供的AI芯片算力接入規范即可快速接入AIStation平臺,幫助用戶降低對多元AI芯片的使用和管理難度。AIStation平臺實現多元算力的統一管理及調度,為生產環境算力運行提供一致的監管功能,對GPU、MLU、XPU等AI芯片的性能狀況、AI業務流量及響應延時進行實時監控,并根據監控數據進行分析、決策、執行操作,實現服務算力的自動調節、自適應推理業務突發資源擴展需求。
AIStation是業界首個支持多元AI芯片算力的人工智能服務平臺,打通了多元AI芯片從接入、管理、調度、適配到應用的路徑,通過構建AI芯片算力接入規范實現多元算力的標準化管理,為產業AI化和智算中心建設提供高效便捷的AI算力調度,讓AI應用和AI服務更便捷,助力用戶充分使用多元算力實現AI技術創新和落地。目前,浪潮AIStation推理服務平臺已在諸多客戶獲得成功應用,在新基建、互聯網、金融、保險、交通、手機通信、智能汽車、智慧城市等多個AI場景發揮著重要作用。