AMD舉辦Advancing AI 2025大會(huì):Instinct MI350系列GPU發(fā)布,35倍推理性能提升

我是創(chuàng)始人李巖:很抱歉!給自己產(chǎn)品做個(gè)廣告,點(diǎn)擊進(jìn)來看看。  

6 月 13 日消息,AMD 在北京時(shí)間今日凌晨 00:30 舉辦了其年度人工智能直播活動(dòng) Advancing AI 2025,AMD 董事長兼首席執(zhí)行官蘇姿豐同其它高管以及 AI 生態(tài)系統(tǒng)合作伙伴、客戶、開發(fā)人員一起,共同討論了 AMD 的產(chǎn)品和軟件如何重塑 AI 和高性能計(jì)算(HPC)格局。

在本次大會(huì)上,AMD 展示了其全面的端到端集成人工智能平臺(tái)愿景,并推出了全新基于行業(yè)標(biāo)準(zhǔn)的開放、可擴(kuò)展的機(jī)架級(jí)人工智能基礎(chǔ)設(shè)施產(chǎn)品。

首先,AMD 推出了全新一代 Instinct MI350 系列 GPU,在生成式人工智能和高性能計(jì)算的性能、效率和可擴(kuò)展性方面得到全面提升。

Instinct MI350 系列包括 Instinct MI350X 和 MI355X GPU 及平臺(tái),實(shí)現(xiàn)了每代 4 倍的 AI 計(jì)算能力提升和 35 倍的推理性能飛躍。

AMD舉辦Advancing AI 2025大會(huì):Instinct MI350系列GPU發(fā)布,35倍推理性能提升

AMD舉辦Advancing AI 2025大會(huì):Instinct MI350系列GPU發(fā)布,35倍推理性能提升

新的 GPU 基于 AMD CDNA 4 架構(gòu),3nm 制程工藝打造,集成了 1850 億個(gè)晶體管,支持 FP4 & FP6 新一代 AI 數(shù)據(jù)類型,可提供 288GB HBM3E 顯存,支持單 GPU 上運(yùn)行高達(dá) 520B 參數(shù)的 AI 模型,支持 UBB8 行業(yè)標(biāo)準(zhǔn) GPU 節(jié)點(diǎn),提供風(fēng)冷和直液冷兩種版本,可以幫助企業(yè)實(shí)現(xiàn)快速部署基礎(chǔ)設(shè)施。

AMD舉辦Advancing AI 2025大會(huì):Instinct MI350系列GPU發(fā)布,35倍推理性能提升

AMD Instinct MI355X GPU 在 AI 和 HPC 領(lǐng)域性能有出色表現(xiàn),根據(jù) AMD 的介紹,在與 NVIDIA B200 和 GB200 的對(duì)比中:

在內(nèi)存容量方面,MI355X 約為競(jìng)品的 1.6 倍,內(nèi)存帶寬則基本持平。

針對(duì) FP64 和 FP32 運(yùn)算,MI355X 的峰值性能接近競(jìng)品的兩倍。

對(duì)于 FP16 和 FP8 運(yùn)算,其峰值性能與競(jìng)品相當(dāng)或略高,F(xiàn)P6 性能則達(dá)到 2 倍以上。

在 FP4 運(yùn)算上,MI355X 與競(jìng)品的峰值性能相近,小幅領(lǐng)先。

另外相比 B200,使用 Instinct MI355X 可獲得 40% Tokens/$ 性價(jià)比提升。

圖片 2

而在和上一代 MI300X 的對(duì)比中,MI355X 運(yùn)行 Llama 3.1 405B 模型,在 AI 智能體性能表現(xiàn)上是前者的 4.2 倍,內(nèi)容生成能力是上一代 MI300X 的 2.9 倍,摘要能力是上一代的 3.8 倍,對(duì)話式人工智能表現(xiàn)則為 2.6 倍。

圖片 3

AMD 表示,Instinct MI350 系列超出了 AMD 設(shè)定的五年目標(biāo),即將 AI 訓(xùn)練和高性能計(jì)算節(jié)點(diǎn)的能效提高 30 倍,最終實(shí)現(xiàn)了 38 倍的提升。

AMD Instinct MI350 系列提供基于開放標(biāo)準(zhǔn)的機(jī)架基礎(chǔ)設(shè)施和網(wǎng)絡(luò)解決方案。

該系列產(chǎn)品支持 UEC、OCP 設(shè)計(jì),搭載 Instinct GPU 與第五代 EPYC x86 CPU,不同配置包括 128 顆 GPU、96 顆 GPU 和 64 顆 GPU,分別具備 36TB、27TB 和 18TB HBM3E 內(nèi)存,性能指標(biāo)涵蓋 FP8、FP6 和 FP4 精度,適用于大規(guī)模機(jī)架擴(kuò)展方案,預(yù)計(jì)從 Q3 開始通過 AMD 解決方案合作伙伴提供相關(guān)產(chǎn)品。

圖片 4

IT之家從活動(dòng)獲悉,AMD 還預(yù)告了其下一代 AI 機(jī)架架構(gòu)“Helios”。它將基于下一代 AMD Instinct MI400 系列 GPU、基于“Zen 6”架構(gòu)的 AMD EPYC “Venice” CPU 以及 AMD Pensando “Vulcano”網(wǎng)卡構(gòu)建。

同時(shí) AMD 更預(yù)告了 Instinct MI400 系列 GPU,預(yù)計(jì) 2026 年上市。該系列配備 432GB HBM4 顯存,帶寬達(dá) 19.6TB/s,每 GPU 擴(kuò)展帶寬為 300GB/s;提供 40PF FP4 和 20PF FP8 的 AI 計(jì)算性能,延續(xù) MI300X、MI325X 等系列優(yōu)勢(shì)。

圖片 5

asdfa

AMD 還公布了一個(gè)新的 2030 年目標(biāo),即從 2024 年基準(zhǔn)年起,將機(jī)架級(jí)能效提高 20 倍,屆時(shí),現(xiàn)在需要超過 275 個(gè)機(jī)架才能訓(xùn)練的典型 AI 模型,在 2030 年時(shí)僅需一個(gè)完全利用的機(jī)架即可完成訓(xùn)練,同時(shí)耗電量減少 95%。

此外最新版本的 AMD 開源 AI 軟件棧 ROCm 7 也受到了不少網(wǎng)友的關(guān)注,其旨在滿足生成式人工智能和高性能計(jì)算工作負(fù)載不斷增長的需求 —— 同時(shí)全面提升開發(fā)者體驗(yàn)。ROCm 7 具有改進(jìn)的行業(yè)標(biāo)準(zhǔn)框架支持、擴(kuò)展的硬件兼容性以及新的開發(fā)工具、驅(qū)動(dòng)程序、API 和庫,以加速 AI 的開發(fā)和部署。

最后值得一提的是,AMD 將為面向全球開發(fā)者和開源社區(qū)的 AMD 開發(fā)者云帶來更廣泛的使用權(quán)限。該平臺(tái)專為快速、高性能的 AI 開發(fā)而構(gòu)建,用戶在 AMD 開發(fā)者云上將能夠訪問一個(gè)完全托管的云環(huán)境,包括擁有啟動(dòng) AI 項(xiàng)目所需的工具和靈活性,并能夠無限制擴(kuò)展。

【來源: IT之家

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
亚洲国产美女精品久久久久| 国产人妖系列在线精品| 国产精品综合在线| 久久er这里只有精品| 麻豆国产精品一二三在线观看| 国产成人精品高清在线观看93| 日韩精品一区二区三区老鸦窝| 四虎成人精品永久免费AV| 亚洲欧洲久久久精品| 久9热视频这里只精品18| 国产午夜精品无码| 亚洲国产精品13p| 国产精品第一区揄拍| 亚洲2022国产成人精品无码区 | 国产精品青青青高清在线观看| 国产精品国产三级国产av品爱网| 国产一区二区三区精品久久呦| 国产精品视频第一页| 久久九九国产精品怡红院| 久久精品一区二区三区中文字幕| 揄拍成人国产精品视频| 模特私拍国产精品久久| 亚洲精品国产综合久久一线| 亚洲国产高清国产拍精品 | 久久这里只精品99re免费| 国产偷伦精品视频| 国产91精品久久久久久久| 中文字幕av日韩精品一区二区 | 国精品产区WNW2544| 亚洲国产日产无码精品| 无码人妻精品一区二区三区66| 亚洲精品~无码抽插| 中文字幕在线视频精品| 一区二区不卡久久精品| 国产精品久久久久一区二区| 国产精品无码一区二区在线| 亚洲国产日韩综合久久精品 | 国产精品亚洲自在线播放页码| 无码国产精品一区二区免费16| 久久96国产精品久久久| 中文字幕精品亚洲无线码一区应用|