AMD Instinct MI350 亮相,2026 年還有 MI400 系列及 Helios 機架式 AI 伺服器

作者 | 發布日期 2025 年 06 月 13 日 3:30 | 分類 AI 人工智慧 , GPU , IC 設計 line share Linkedin share follow us in feedly line share
Loading...
AMD Instinct MI350 亮相,2026 年還有 MI400 系列及 Helios 機架式 AI 伺服器

在 Advancing AI 2025 大會上,AMD 董事長暨執行長蘇姿丰表示,AMD 在人工智慧領域的發展步伐從未停歇,始終致力於設定產業新標準,為客戶提供真正可部署且具備可擴展性的解決方案。

AMD Instinct MI350 系列,賦能當代 AI 工作負載

為滿足現代 AI 基礎設施的需求,AMD 推出了 AMD Instinct MI350 系列 GPU,包含 MI350X 和 MI355X 型號。這些 GPU 基於 AMD CDNA 4 架構,目的在賦能各行各業的創新者,幫助他們更快發展、更聰明地擴展,並建立未來。

MI350 系列在 AI 運算能力上實現了 4 倍的提升,並在推理能力上取得 35 倍的飛躍。這為各行各業的變革性 AI 解決方案鋪平了道路。在記憶體方面,MI350 系列提供領先業界的 288GB HBM3E 記憶體容量,以及高達 8TB/s 的記憶體頻寬,確保推理和訓練都能獲得卓越的傳輸量。

在部署彈性方面,Instinct MI350 系列支援靈活的風冷和直接液冷配置,並針對無縫部署進行了優化。風冷機架最多可支援 64 個 GPU,而直接水冷機架則可支援高達 128 個 GPU,能夠提供高達 2.6 exaFLOPS 的 FP4/FP6 性能。這使得在基於行業標準的基礎架構中加快 AI 落地速度並降低成本成為可能。

另外,MI350 系列的生態系統發展勢頭強勁,隨時可供部署。它將透過領先的雲端服務供應商廣泛提供,包括主要的超大規模運算平台和新一代 Neo Cloud,為客戶提供靈活的雲端 AI 擴充選項。同時,戴爾 (Dell)、慧與科技 (HPE) 和美超微 (Supermicro) 等頂級 OEM 廠商正積極將 MI350 系列解決方案整合到其平台中,以提供強大的本地和混合 AI 基礎架構。

ROCm 7 用於 AI 加速的開放軟體引擎

蘇姿丰強調,人工智慧正以創紀錄的速度發展,而 AMD 的 ROCm 願景是透過一個開放、可擴展且以開發者為中心的平台,為每個人解鎖創新。在過去一年中,ROCm 迅速成熟,提供了領先的推理效能,擴展了訓練能力,並深化了與開源社群的整合。

ROCm 目前已為全球一些最大的 AI 平台提供支援,從第一天起就支持 LLaMA 和 DeepSeek 等主流模型。在即將發布的 ROCm 7 版本中,實現了超過 3.5 倍的推理性能提升。憑藉頻繁的更新、FP4 等高級資料類型以及 FAv3 等新演算法,ROCm 正在賦能下一代 AI 效能。同時,它也正在推動 vLLM 和 SGLang 等開源框架以比封閉式替代方案更快的速度發展。

隨著 AI 應用從研究轉向實際的企業部署,ROCm 也隨之不斷發展。ROCm 企業 AI 將全端 MLOps 平台推向前沿,透過用於微調、合規性、部署和整合的交鑰匙工具,實現安全、可擴展的 AI。目前,已有超過 180 萬個 Hugging Face 模型開箱即用,顯示 ROCm 不僅在迎頭趕上,還在引領開放式 AI 革命。

開發者始終是 AMD 一切工作的核心。AMD 致力於提供卓越的體驗,透過更強大的開箱即用工具、即時 CI 儀錶板、豐富的資料以及活躍的開發者社群,讓採用 ROCm 的構建變得前所未有的輕鬆。為了加速創新,AMD 非常高興地推出了 AMD 開發者雲,讓開發者能夠即時、無障礙地存取 ROCm 和 AMD GPU。無論是優化大型語言模型或擴展推理平台,ROCm 7 都能提供開發者所需的工具,幫助他們快速從實驗階段轉向生產階段。

未來展望 AMD Instinct MI400 系列和「Helios」AI 機架式伺服器

蘇姿丰強調,AMD 對創新的承諾不只於 Instinct MI350 系列,該公司已預覽其下一代 AMD Instinct MI400 系列,預計將於 2026 年推出,代表著全新的性能水平。AMD Instinct MI400 系列將代表效能的顯著飛躍,為大規模訓練和分散式推理提供全機架式解決方案。AMD Instinct MI400 系列主要性能創新包括高達 432GB 的 HBM4 記憶體,19.6TB/s 的顯存頻寬。FP4 性能下達到 40 PF,FP8 性能下達到 20 PF,高達 300GB/s 的橫向擴充頻寬。

而同樣將於 2026 年推出的還有「Helios」AI 機架式伺服器架構,其全新設計目的在將 AMD 領先的晶片,AMD EPYC Venice CPU、Instinct MI400 系列 GPU 和 Pensando Vulcano AI NI,以及 ROCm 軟體整合到一個完全整合的解決方案中。Helios 被設計為一個統一的系統,支援緊密耦合的縱向擴展域,最多可容納 72 個 MI400 系列 GPU,縱向擴展頻寬高達 260TB/s,並支援 Ultra Accelerator Link。

(首圖來源:科技新報)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》