AMD 將晶片運算效能提升百倍,蘇姿丰:2026~2027 年達成

作者 | 發布日期 2024 年 05 月 24 日 17:50 | 分類 AI 人工智慧 , IC 設計 , 半導體 line share follow us in feedly line share
AMD 將晶片運算效能提升百倍,蘇姿丰:2026~2027 年達成


IMEC(比利時微電子研究中心)舉辦的 ITF World 2024 大會,AMD 董事長兼執行長蘇姿丰領取 IMEC 創新大獎,表彰創新與領導。英特爾創辦人 Gordon Moore、微軟創辦人比爾蓋茲 Bill Gates、台積電創辦人張忠謀也得過此殊榮。

演講時蘇姿丰談到,AMD 全力衝刺 30×25 目標,到 2025 年計算能效提升到 2014 年 30 倍,到 2026~2027 年,計算能效再提升到 2014 年 100 倍。速度遠超過業界平均。

處理器、顯示卡等能耗越來越高,AMD 早在 2014 年就設定 25×20 目標,2020 年產品能效提升 25 倍,最終超額 31.7 倍。AMD 又立下 30×25 新目標,2025 年就能順利達成。蘇姿丰指出,提升運算產品能效的最大障礙就是 AI 大模型訓練、微調的龐大算力,往往離不開成千上萬 GPU,以及成千上萬兆瓦電力,且急劇成長。

AMD 將多管齊下,從產品架構、製程技術、封裝技術、互連技術等方面提升能效,比如 3 奈米 GAA 全環繞柵極製程技術,以及 2.5D / 3D 先進封裝技術等等。蘇姿丰強調,AMD 最強的 AI 晶片 Instinct MI300X 就是高能效的典型代表,其擁有 1,530 億個電晶體,分為 12 顆小晶片,還整合 24 顆共 192GB HBM3 記憶體。

另外,核心執行序數量從單核心/單執行序,增加到 96 核心/192 執行序,頻率從 20MHz 提高到 3.5GHz,暫存記憶體容量從 16MB 增加到 486MB,內核心面積從 49 mm² 增加到 1240mm² 所有這些技術都可當成 GPU,透過與封裝內單元的功率和性能最佳化,加上無限結構互連相結合,使運算和記憶體密度能更接近處理核心,減少傳輸數據能量。

蘇姿丰強調雖然硬體最佳化很重要,但 AMD 軟硬體協同最佳化也取得令人矚目的成果。使用較低精度數位格式可提高能源效率和能耗,使得特定硬體加速的設計對於持續擴展變得非常重要。尤其,轉向 FP4 等較低精度格式,相較 FP32 會大幅增加每焦耳消耗能量,包括對 FP8 的能耗提高了 15 倍,而 FP4 的能耗則是提高了約 30 倍。

不過,因為較低的精度會導致較低的準確。蘇姿丰強調,先進量化有助解決這個問題,即使 MXFP6 也能產生與 FP32 相似精度,只有少數不同模型的 MXFP4 上出現了下降,其他模型同樣準確。提高低精度格式準確性的工作仍在繼續,因此 AMD 甚至看到 MXFP4 將來更多模型變得與 FP32 一樣準確。

蘇姿丰最後指出,總體而言,AMD 每節點電源效率超過業界速度,還在努力實現 30 倍電源效率提高。趨勢持續,且透過創新,將照今天狀況,AMD 可做得更好。到 2026 年和 2027 年,有望實現百倍目標。

(首圖來源:AMD)