AMD舉辦Advancing AI 2025大會(huì):Instinct MI350系列GPU發(fā)布,35倍推理性能提升
6 月 13 日消息,AMD 在北京時(shí)間今日凌晨 00:30 舉辦了其年度人工智能直播活動(dòng) Advancing AI 2025,AMD 董事長兼首席執(zhí)行官蘇姿豐同其它高管以及 AI 生態(tài)系統(tǒng)合作伙伴、客戶、開發(fā)人員一起,共同討論了 AMD 的產(chǎn)品和軟件如何重塑 AI 和高性能計(jì)算(HPC)格局。
在本次大會(huì)上,AMD 展示了其全面的端到端集成人工智能平臺(tái)愿景,并推出了全新基于行業(yè)標(biāo)準(zhǔn)的開放、可擴(kuò)展的機(jī)架級(jí)人工智能基礎(chǔ)設(shè)施產(chǎn)品。
首先,AMD 推出了全新一代 Instinct MI350 系列 GPU,在生成式人工智能和高性能計(jì)算的性能、效率和可擴(kuò)展性方面得到全面提升。
Instinct MI350 系列包括 Instinct MI350X 和 MI355X GPU 及平臺(tái),實(shí)現(xiàn)了每代 4 倍的 AI 計(jì)算能力提升和 35 倍的推理性能飛躍。
新的 GPU 基于 AMD CDNA 4 架構(gòu),3nm 制程工藝打造,集成了 1850 億個(gè)晶體管,支持 FP4 & FP6 新一代 AI 數(shù)據(jù)類型,可提供 288GB HBM3E 顯存,支持單 GPU 上運(yùn)行高達(dá) 520B 參數(shù)的 AI 模型,支持 UBB8 行業(yè)標(biāo)準(zhǔn) GPU 節(jié)點(diǎn),提供風(fēng)冷和直液冷兩種版本,可以幫助企業(yè)實(shí)現(xiàn)快速部署基礎(chǔ)設(shè)施。
AMD Instinct MI355X GPU 在 AI 和 HPC 領(lǐng)域性能有出色表現(xiàn),根據(jù) AMD 的介紹,在與 NVIDIA B200 和 GB200 的對(duì)比中:
在內(nèi)存容量方面,MI355X 約為競(jìng)品的 1.6 倍,內(nèi)存帶寬則基本持平。
針對(duì) FP64 和 FP32 運(yùn)算,MI355X 的峰值性能接近競(jìng)品的兩倍。
對(duì)于 FP16 和 FP8 運(yùn)算,其峰值性能與競(jìng)品相當(dāng)或略高,F(xiàn)P6 性能則達(dá)到 2 倍以上。
在 FP4 運(yùn)算上,MI355X 與競(jìng)品的峰值性能相近,小幅領(lǐng)先。
另外相比 B200,使用 Instinct MI355X 可獲得 40% Tokens/$ 性價(jià)比提升。
而在和上一代 MI300X 的對(duì)比中,MI355X 運(yùn)行 Llama 3.1 405B 模型,在 AI 智能體性能表現(xiàn)上是前者的 4.2 倍,內(nèi)容生成能力是上一代 MI300X 的 2.9 倍,摘要能力是上一代的 3.8 倍,對(duì)話式人工智能表現(xiàn)則為 2.6 倍。
AMD 表示,Instinct MI350 系列超出了 AMD 設(shè)定的五年目標(biāo),即將 AI 訓(xùn)練和高性能計(jì)算節(jié)點(diǎn)的能效提高 30 倍,最終實(shí)現(xiàn)了 38 倍的提升。
AMD Instinct MI350 系列提供基于開放標(biāo)準(zhǔn)的機(jī)架基礎(chǔ)設(shè)施和網(wǎng)絡(luò)解決方案。
該系列產(chǎn)品支持 UEC、OCP 設(shè)計(jì),搭載 Instinct GPU 與第五代 EPYC x86 CPU,不同配置包括 128 顆 GPU、96 顆 GPU 和 64 顆 GPU,分別具備 36TB、27TB 和 18TB HBM3E 內(nèi)存,性能指標(biāo)涵蓋 FP8、FP6 和 FP4 精度,適用于大規(guī)模機(jī)架擴(kuò)展方案,預(yù)計(jì)從 Q3 開始通過 AMD 解決方案合作伙伴提供相關(guān)產(chǎn)品。
IT之家從活動(dòng)獲悉,AMD 還預(yù)告了其下一代 AI 機(jī)架架構(gòu)“Helios”。它將基于下一代 AMD Instinct MI400 系列 GPU、基于“Zen 6”架構(gòu)的 AMD EPYC “Venice” CPU 以及 AMD Pensando “Vulcano”網(wǎng)卡構(gòu)建。
同時(shí) AMD 更預(yù)告了 Instinct MI400 系列 GPU,預(yù)計(jì) 2026 年上市。該系列配備 432GB HBM4 顯存,帶寬達(dá) 19.6TB/s,每 GPU 擴(kuò)展帶寬為 300GB/s;提供 40PF FP4 和 20PF FP8 的 AI 計(jì)算性能,延續(xù) MI300X、MI325X 等系列優(yōu)勢(shì)。
AMD 還公布了一個(gè)新的 2030 年目標(biāo),即從 2024 年基準(zhǔn)年起,將機(jī)架級(jí)能效提高 20 倍,屆時(shí),現(xiàn)在需要超過 275 個(gè)機(jī)架才能訓(xùn)練的典型 AI 模型,在 2030 年時(shí)僅需一個(gè)完全利用的機(jī)架即可完成訓(xùn)練,同時(shí)耗電量減少 95%。
此外最新版本的 AMD 開源 AI 軟件棧 ROCm 7 也受到了不少網(wǎng)友的關(guān)注,其旨在滿足生成式人工智能和高性能計(jì)算工作負(fù)載不斷增長的需求 —— 同時(shí)全面提升開發(fā)者體驗(yàn)。ROCm 7 具有改進(jìn)的行業(yè)標(biāo)準(zhǔn)框架支持、擴(kuò)展的硬件兼容性以及新的開發(fā)工具、驅(qū)動(dòng)程序、API 和庫,以加速 AI 的開發(fā)和部署。
最后值得一提的是,AMD 將為面向全球開發(fā)者和開源社區(qū)的 AMD 開發(fā)者云帶來更廣泛的使用權(quán)限。該平臺(tái)專為快速、高性能的 AI 開發(fā)而構(gòu)建,用戶在 AMD 開發(fā)者云上將能夠訪問一個(gè)完全托管的云環(huán)境,包括擁有啟動(dòng) AI 項(xiàng)目所需的工具和靈活性,并能夠無限制擴(kuò)展。
【來源: IT之家 】