AMD 發布 CDNA 4 架構:HBM3E 加持,聚焦提升 AI 負載能力

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

6 月 19 日消息, 科技 媒體 chipsandcheese 昨日(6 月 18 日)發布博文,報道稱 AMD 正式發布 CDNA 4 架構,在保持在通用向量運算領域的優勢外, 主要聚焦提升低精度數據類型的矩陣乘法性能,以強化人工智能(AI)工作負載處理能力。

AMD 發布 CDNA 4 架構:HBM3E 加持,聚焦提升 AI 負載能力

CDNA 4 延續了 CDNA 3 的模塊化設計,采用類似 CPU 的芯粒(chiplet)布局。每個計算芯片單元(XCD)搭載 CDNA 計算單元(CU),通過四塊基底芯片整合八塊 XCD,形成包含 256MB 內存側緩存的完整 GPU 架構。

AMD 發布 CDNA 4 架構:HBM3E 加持,聚焦提升 AI 負載能力

與 CDNA 3 的 MI300X 相比,CDNA 4 的 MI355X 通過減少單 XCD 的 CU 數量并關閉部分單元以提升良率,但憑借更高時鐘頻率縮小了性能差距。

AMD 發布 CDNA 4 架構:HBM3E 加持,聚焦提升 AI 負載能力

在低精度矩陣運算這個 AI 關鍵指標中,CDNA 4 的每 CU 矩陣吞吐量翻倍,其 FP6 精度性能與英偉達 B200 的流式多處理器(SM)持平。

但在 8 位與 16 位數據類型中,英偉達仍保持單周期吞吐量優勢。然而,AMD 憑借更高的 CU 數量與頻率,維持了通用向量運算(如 FP32)的絕對領先,單 CU 仍提供 128 條 FP32 運算管線,整體性能遠超英偉達 Blackwell 架構。

CDNA 4 的核心改進之一是提升本地數據共享(LDS)的容量與帶寬。LDS 容量從 64KB 增至 160KB,讀取帶寬翻倍至每周期 256 字節,并新增“轉置讀取”指令,優化矩陣乘法的內存訪問效率。

盡管英偉達的共享內存(Shared Memory)在單核容量與緩存靈活性上更優(最高 228KB 可分配為共享內存或 L1 緩存),但 AMD 通過 40MB 全 GPU LDS 容量(B200 僅約 33MB)彌補了核心級存儲的不足。

顯存方面,MI355X 升級至 HBM3E 技術,總帶寬達 8TB/s,容量 288GB,顯著超越英偉達 B200 的 7.7TB/s 與 180GB。這一優勢在大數據量運算中尤為重要,尤其當 AI 模型超出顯存容量時,AMD 的架構可減少數據交換延遲。

該媒體認為 AMD 的 CDNA 4 延續了 CDNA 3 的“保守進化”路線,類似 Zen 3 到 Zen 4 的迭代邏輯,通過優化而非顛覆性創新鞏固優勢。其策略聚焦于擴大計算規模與顯存帶寬,同時針對性補足 AI 短板。

該媒體認為在提升性能方面,AMD和英偉達的路徑差異顯著:AMD 依賴“大芯片 + 大緩存”模式,而英偉達更注重顯存帶寬與單核效率。

【來源: IT之家

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
亚洲国产成人久久精品动漫 | 久久er国产精品免费观看8| 久久se精品一区二区国产| 国产精品女上位在线观看| 91在线老王精品免费播放| 国产成人精品日本亚洲专区| 精品国产午夜理论片不卡| 在线观看亚洲精品福利片| 国产精品爽黄69天堂a片| 人妻少妇精品中文字幕AV| 一本大道无码日韩精品影视_| 亚洲精品一二三区| 亚洲处破女AV日韩精品| 免费视频成人国产精品网站| 国产精品玖玖玖在线观看| 无码人妻精品一区二区三区99仓本 | 亚洲男人的天堂久久精品| 日本精品不卡视频| 精品人妻中文无码AV在线| 亚洲日韩精品无码专区加勒比☆| 国产精品日韩AV在线播放| 国产成人精品久久| 精品伊人久久久香线蕉| 亚洲男人的天堂久久精品| 亚洲av永久无码精品表情包| selao久久国产精品| 日日夜夜精品免费视频| 国产精品自产拍在线观看| 久久国产精品自由自在| 99re这里只有精品国产精品| 无码乱码观看精品久久| 日韩精品一区在线| 亚洲午夜精品久久久久久app| 久久无码专区国产精品发布| 久久国产精品免费网站| 日韩A∨精品日韩在线观看 | 精品国产高清自在线一区二区三区| 亚洲欧洲国产成人精品| 99精品国产在热久久无码| 亚洲AV无码精品无码麻豆| 三级精品视频在线播放|