IBM用最新芯片,打造了一個大型機
IBM 的最新大型機以平臺傳統(tǒng)的關(guān)鍵任務(wù)工作負載的安全性和可靠性屬性為基礎(chǔ),添加了 AI 來支持大型語言模型 (LLM)、助手和代理。
z17 系列引入了改進的 Telum II 處理器和 Spyre AI 加速器卡,這兩者都是在去年帕洛阿爾托舉行的Hot Chips 會議上討論過的,據(jù)稱其 AI 性能比 z16 提高了 7.5 倍。
IBM 聲稱,雖然 Telum II 提供了改進的 AI 推理來針對交易運行欺詐檢測檢查(就像z16 中引入的那樣),但 Spyre 卡提供了一種擴展 AI 處理的方法,以支持生成 AI 和 LLM,并使用多種模型來提高準確性并減少誤報。
IBM 院士兼 IBM Z 架構(gòu)師 Elpida Tzortzatos 在談到藍色巨人為這款最新大型計算機開發(fā)的硬件增強功能時表示:“如果將數(shù)據(jù)視為新的燃料,那么基礎(chǔ)設(shè)施就是推動企業(yè) AI 之旅走向成功的引擎。”
該公司表示,他們花了很多時間與客戶討論他們希望在大型機中看到什么,這為 z17 的開發(fā)提供了參考。客戶顯然告訴他們要更新他們的應(yīng)用程序并使大型機更加人工智能驅(qū)動。
但這并不是像其他一些公司那樣,將生成式人工智能簡單地投入到其中。藍色巨人聲稱已經(jīng)仔細考慮過這個問題。
Tzortzatos 表示:“GenAI 對我們的客戶來說非常重要,但也不是唯一的 AI 工具。盡管最近有很多關(guān)于 GenAI 的討論,但預(yù)測性 AI 仍將在企業(yè)中發(fā)揮關(guān)鍵作用。”
“我們將繼續(xù)非常非常好地服務(wù)于這些用例,但 GenAI 為新的用例打開了大門,例如擁有助手并能夠總結(jié)文檔,能夠為開發(fā)人員提供支持,讓副駕駛能夠自動完成代碼等等。”
這些助手包括該公司的watsonx Code Assistant for Z 和 watsonx Assistant for Z 等。
Tzortzatos 聲稱,該公司看到的一個新趨勢是將預(yù)測人工智能的優(yōu)勢與大型語言和代碼模型的優(yōu)勢結(jié)合起來,以提取新特征或新見解,并從這些人工智能模型中獲得更好、更準確的結(jié)果。
她舉了一個保險的例子,保險公司從 DB2 數(shù)據(jù)庫中提取與索賠相關(guān)的結(jié)構(gòu)化信息,然后從非結(jié)構(gòu)化文本中提取關(guān)鍵見解(例如索賠原因或索賠緊急程度),并將其輸入預(yù)測 AI 模型以獲得更好、更準確的結(jié)果。
根據(jù) Hot Chips 的詳細介紹,z17 中的 Telum II 處理器與上一代一樣是八核芯片,但運行速度更高,為 5.5 GHz。Telum II 的緩存大小也增加了 40%,并增加了另一項新功能——片上 IO 加速器或數(shù)據(jù)處理單元 (DPU),旨在卸載 Spyre AI Accelerator 卡在處理較新的 AI 模型時需要處理的大量數(shù)據(jù)。
Tzortzatos 解釋說:“當談到大型語言模型和 GenAI 時,我們看到模型復(fù)雜性和模型尺寸增加了超過一百倍,這對 AI 計算提出了更高的要求。”
這些 Spyre AI 加速器卡可插入 PCIe 插槽,每個卡最多有 32 個核心,據(jù)說與 Telum II 芯片本身的 AI 加速器架構(gòu)類似。IBM 表示,z17 可以在單個系統(tǒng)中擁有最多 48 張卡。
藍色巨人還在準備 z/OS 3.2,這是其為 IBM Z 系統(tǒng)開發(fā)的下一個主要操作系統(tǒng)版本,計劃于今年第三季度發(fā)布。這將為整個系統(tǒng)提供對硬件加速 AI 功能的支持,并使用運營 AI 實現(xiàn)系統(tǒng)管理功能。
IBM 表示,新平臺將增加對現(xiàn)代數(shù)據(jù)訪問方法、NoSQL 數(shù)據(jù)庫和混合云數(shù)據(jù)處理的支持,以使 AI 能夠利用更廣泛的企業(yè)數(shù)據(jù)來應(yīng)用預(yù)測性業(yè)務(wù)洞察。
IBM 推出新款大型機正值這種高價位產(chǎn)品的艱難時期,特朗普政府的國際貿(mào)易政策動搖了 商業(yè) 信心。傳統(tǒng)上,隨著舊系統(tǒng)客戶升級,新大型機的推出將為藍色巨人帶來收入激增,但今年的銷售可能會很困難。
然而,Gartner 基礎(chǔ)設(shè)施和運營集團執(zhí)行副總裁 Mike Chuba 表示,公司已經(jīng)充分了解客戶的需求。
Chuba 向The Register表示:“如果你回顧一下最近幾代大型機的發(fā)布會,并繼續(xù)回顧這一代,你會發(fā)現(xiàn),IBM 在涉及大型大型機客戶的研發(fā)過程中投入了更多時間。”
“IBM 的研發(fā)工作現(xiàn)在專注于新硬件如何直接解決客戶面臨的挑戰(zhàn)。他們在 z16 上引入的專用加速器和這一代的渦輪增壓版 2 直接解決了交易時欺詐檢測等挑戰(zhàn),從而專注于人工智能。”
IBM 的的新芯片
去年,IBM 為其著名的大型機系統(tǒng)推出了一款更強大的處理器,承諾增強用于推理的片上 AI 加速,并集成數(shù)據(jù)處理單元 (DPU) 以增強 IO 處理能力。
IBM還為其提供了一個單獨的 AI 加速器,旨在支持更大規(guī)模的推理。
據(jù)藍色巨人稱, Telum II 處理器在帕洛阿爾托舉行的Hot Chips 2024大會上發(fā)布,預(yù)計將為大型機帶來顯著的性能提升。該公司還預(yù)覽了 Spyre AI Accelerator,并表示預(yù)計這兩款芯片將于 2025 年上半年與下一代 IBM Z 系統(tǒng)一起推出。
如果 IBM 的說法可信的話,那么全球大約 70% 的交易都是通過其大型機進行的,而 IBM 表示,它在 Hot Chips 上展示的開發(fā)成果將使其能夠?qū)⑸尚?AI 引入這些關(guān)鍵任務(wù)工作負載。
Telum II 和其前代產(chǎn)品一樣,是一款八核芯片,但在新芯片中,這些芯片的時鐘速度更高,為 5.5GHz。有十個 36 MB 二級緩存;每個內(nèi)核一個,DPU 一個,第十個作為整體芯片緩存。IBM 表示,隨著虛擬 L3 和虛擬 L4 分別增長到 360 MB 和 2.88 GB,這意味著緩存大小增加了 40%。
首款 Telum 處理器于 2022 年推出時為 z16 帶來了內(nèi)置 AI 推理功能。它能夠在處理 金融 交易時對其進行實時欺詐檢測檢查。
藍色巨人表示,它已顯著增強 Telum II 處理器上的 AI 加速器功能,達到每秒 24 萬億次運算 (TOPS)。但正如The Register之前所解釋的那樣,TOPS 可能是一個誤導(dǎo)性指標。雖然增加了對 INT8 作為數(shù)據(jù)類型的支持,但 Telum II 本身的設(shè)計旨在使模型運行時能夠與最苛刻的企業(yè)工作負載并行運行。
添加片上 DPU是為了幫助滿足不斷增長的工作負載需求,特別是著眼于未來的 AI 工作負載和即將推出的 Z 系統(tǒng) Spyre 加速器。
據(jù) Armonk 公司介紹,每個 DPU 包括四個處理集群,每個集群有八個可編程微控制器和一個管理這些處理集群的 IO 加速器,以及兩個 IO 抽屜域的 IO 子系統(tǒng)。DPU 還具有單獨的 L1 緩存和請求管理器來跟蹤未完成的請求。
DPU 位于主處理器結(jié)構(gòu)和 PCIe 結(jié)構(gòu)之間。將其直接連接到結(jié)構(gòu)的目的是大大減少數(shù)據(jù)傳輸?shù)拈_銷,同時提高吞吐量和功率效率。
IBM 表示,作為最高配置,未來的 Z 系統(tǒng)可能擁有多達 32 個 Telum II 處理器和 12 個 IO 籠,每個籠子最多有 16 個 PCIe 插槽,使系統(tǒng)總共支持多達 192 個 PCIe 卡,大大擴展了 IO 容量。
Spyre 加速器將包含 32 個核心,其架構(gòu)與集成在 Telum II 芯片中的 AI 加速器類似。IBM Z 可以配置多個 Spyre 加速器,通過 PCIe 安裝,以便根據(jù)需要擴展 AI 加速。例如,八張卡的集群將為單個 IBM Z 系統(tǒng)添加 256 個加速器核心。
Telum II 和 Spyre Accelerator 均旨在支持 IBM 所稱的集成 AI,即使用多個 AI 模型來提高與單個模型相比的預(yù)測性能和準確性。
藍色巨人 IBM Z 和 LinuxONE 產(chǎn)品管理副總裁 Tina Tarquinio 在評論中表示:“Telum II 處理器和 Spyre 加速器旨在提供高性能、安全且更節(jié)能的企業(yè)計算解決方案。”
她補充道:“經(jīng)過多年的開發(fā),這些創(chuàng)新將被引入我們的下一代 IBM Z 平臺,以便客戶可以大規(guī)模利用 LLM 和生成式 AI。”
藍色巨人希望超越推理,在其大型機上進行微調(diào),甚至可能訓(xùn)練模型。該公司表示,這將使銀行和其他希望將數(shù)據(jù)安全保存在自己場所的企業(yè)等客戶能夠完全在組織內(nèi)部訓(xùn)練和部署模型。
Telum II 和 Spyre Accelerator 都將由三星采用 5 nm 工藝節(jié)點為 IBM 生產(chǎn)。
【來源: 半導(dǎo)體行業(yè)觀察 】