新聞要點:
- 新一代IBM Telum II 處理器和 IBM Spyre 加速器可解鎖更多企業級 AI 能力,包括大語言模型和生成式 AI
- 先進的 I/O 技術實現并簡化可擴展的 I/O 子系統,進一步降低能耗和數據中心占地面積
北京2024年8月29日 /美通社/ -- 近日,IBM(紐約證券交易所:IBM)在 Hot Chips 2024大會上公布了即將推出的 IBM Telum® II 處理器和 IBM Spyre? 加速器的架構細節。這些新技術旨在大幅擴展下一代 IBM Z 大型主機系統的處理能力,通過新的 AI 集成方法,加速企業對傳統 AI 模型和大語言 AI 模型的協同使用。
IBM 推出全新Telum處理器,依托新一代 IBM Z 大型主機加速 AI 應用
隨著基于大語言模型的 AI 項目從概念驗證階段進入生產階段,企業對高能效、高安全性和高度可擴展解決方案的需求日益迫切。摩根士丹利最近發布的一份研究報告預測,在未來幾年,生成式 AI 的電力需求將以每年 75% 的速度激增,其 2026 年的能耗或將與西班牙 2022 年的全年能耗相當。許多 IBM 客戶表示,支持適當規模的基礎模型和針對 AI 工作負載的混合架構越來越重要。
此次IBM發布的主要創新技術包括:
- IBM Telum II 處理器:這一全新芯片將搭載于下一代 IBM Z 系列主機,與第一代 Telum 芯片相比,其頻率和內存容量均有提升,高速緩存提升40%;集成 AI 加速器內核和數據處理單元 (DPU) 的性能也得到改善。IBM Telum II處理器將支持大語言模型驅動的企業計算解決方案,滿足金融等行業的復雜交易需求。
- IO 加速單元:Telum II 處理器芯片上的全新數據處理單元 (DPU) 旨在加速大型主機上用于聯網和數據存儲的復雜 IO 協議,可簡化系統操作,提高關鍵組件性能。
- IBM Spyre加速器:可提供額外的AI計算能力,與 Telum II 處理器相得益彰。Telum II 和 Spyre 芯片共同構成了一個可擴展的架構,可支持AI集成建模方法,即將多個機器學習或深度學習的AI模型與基于編碼器的大語言模型相結合。通過利用每個模型架構的優勢,AI集成的方法可以生成比單個模型更準確、更穩健的結果。Spyre 加速器芯片在 Hot Chips 2024 大會期間進行了預覽,并將作為Telum II 處理器的附加選件提供。每個加速器芯片均與IBM 研究院合作開發,通過一個 75 瓦 PCIe 適配器連接。與其他 PCIe 卡一樣,Spyre 加速器可根據客戶需求進行擴展。
IBM主機和 LinuxONE 產品管理副總裁 Tina Tarquinio 表示:"得益于IBM強大的多代并行的開發路線圖,我們得以在保持技術領先的同時,滿足企業不斷升級的 AI 需求。Telum II 處理器和 Spyre 加速器旨在提供安全、節能、高性能的企業計算解決方案。這些多年研發的創新成果將被引入下一代 IBM Z 平臺,幫助客戶大規模利用大語言模型和生成式 AI技術。"
Telum II 處理器和 IBM Spyre 加速器將由 IBM 的長期合作伙伴三星晶圓代工(Samsung Foundry)生產,采用其高性能、高能效的 5 納米工藝節點。二者將共同支持企業的先進AI 用例,釋放業務價值,從而創造新的競爭優勢。利用AI集成的方法,客戶可以更快、更準確地獲得預測結果。適用的生成式 AI用例包括:
- 保險理賠欺詐檢測:通過AI集成方法將大語言模型與傳統神經網絡相結合,以提高性能和準確性,增強對保險理賠欺詐的檢測。
- 反洗錢高級監測:對可疑金融活動進行高級檢測,支持遵守監管要求并降低金融犯罪風險。
- AI 助手:加速應用生命周期、知識和專業技能的傳授、代碼解釋和轉換等。
規格和性能指標:
- Telum II 處理器:配備八個運行頻率達 5.5GHz的高性能內核,每個內核配備 36MB二級高速緩存,片上高速緩存容量增加 40%(總容量達 360MB)。每個處理器抽屜的虛擬 L4 高速緩存為 2.88GB,相比上一代增加 40%。集成的 AI 加速器可實現低延遲、高吞吐量的交易中 AI 推理,例如增強金融交易期間的欺詐檢測,并且每塊芯片的計算能力是上一代的四倍。
Telum II 芯片中集成了最新的 I/O 加速單元 DPU。在設計上,其I/O 密度提高 50%,可大幅提高數據處理能力,進一步提高 IBM Z 的整體效率和可擴展性,使其成為處理大規模AI工作負載和數據密集型應用的不二之選。
- Spyre 加速器:這是一款專為復雜 AI 模型和生成式 AI 用例提供可擴展功能的企業級加速器。它有高達 1TB 的內存,可在普通 IO 抽屜的八塊卡上串聯工作,以支持大型主機的整體 AI 工作負載,同時每塊卡的功耗不超過 75W。每塊芯片由 32 個計算內核組成,支持 int4、int8、fp8 和 fp16 數據類型,適用于低延遲和高吞吐量的 AI 應用。
產品時間表
作為 IBM 下一代 IBM Z 和 IBM LinuxONE 平臺的中央處理器,Telum II 處理器預計在 2025 年向 IBM Z 和 LinuxONE 客戶提供。IBM Spyre 加速器仍在技術預覽階段,預計也將于 2025 年推出。
關于 IBM 未來方向和意向的聲明可能會隨時更改或撤銷,恕不另行通知。
訪問下方鏈接了解更多:
關于IBM
IBM 是全球領先的混合云、人工智能及企業服務提供商,幫助超過 175 個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,并獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的超過 4000 家政府和企業實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業云解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh
媒體聯絡人
崔守峰,shou.feng.cui@ibm.com
IBM Corporation logo.