中國 DeepSeek 掀起 AI 話題，外資不認為具成本優勢以影響 AI 晶片市場

就在大家準備過農曆新年前夕，全球科技界迎接巨大變局。根據市場消息指出，日前總部位於杭州的 AI 公司「深度求索（DeepSeek）」發布了一個推理模型 DeepSeek-R1，號稱在數學、程式碼及推理基準測試中，已經可以匹敵，甚至超越美國矽谷研發的模型，但是成本卻只要十分之一，不但讓科技界大為震驚，也使得引領 AI 產業的輝達、台積電等公司的股價一度大跌。

根據外媒報導，中國 DeepSeek 在這次所發表的推理模型中，就以數學和推理的性能來比較， DeepSeek-R1 超越 OpenAI o1，而在程式編寫方面性能則是不相上下。除了性能之外，DeepSeek-R1 的開發成本不到 600 萬美元，僅是 Meta 訓練 Llama 3.1 的十分之一。這讓矽谷科技界大為震驚，也備感壓力。另外，現階段的 DeepSeek-R1 完全開放原始碼，無償提供免費網頁給大眾使用。甚至，還將所有技術細節、步驟進一步進行公開，這些動作相較採取收費機制的矽谷 AI 廠商更加加普及化。在性能、成本、開放的三大優勢下，現在矽谷 AI 廠商就如坐針氈。

事實上，對於中國 DeepSeek 新發表推理模型的情況，這對於美國政府一直以來持續給予中國在 AI 晶片上的限制措施可謂是一大壓力，也就是代表限制出口手段不但沒有防堵中國在AI 技術上的成功發展，甚至可進一步超過美國的競爭對手。因此，這情況對於未來在 AI 晶片市場上的生態變化也就備受市場的關注。就有外資表示，中國開發出 DeepSeek-R1人工智慧模型，就短期來看，因為其訓練成本號稱僅為美國的矽谷 AI 的十分之一，因此使美國的廠商確面臨了壓力。

不過，就長遠來觀察，預計不會對運算需求產生太大變化，而是將 DeepSeek 的發展突破視為加速 AI 發展的步伐，甚至導致邊緣 AI 的更快部署。產生這樣結果的原因，在於 AI 是一場邁向通用人工智慧的廣泛競賽，所有超大規模企業和 AI 實驗室都在競爭領先地位。因此，所有人都在關注其他參與者的動向。而隨著新模型的發展，任何突破都會很快被競爭對手吸收到他們的發展規劃中，從而推動創新的步伐。

此外，DeepSeek 的創新發展似乎可以讓 AI 模型訓練更加高效，使得競賽中的任何廠商都不會放慢其發展規劃的步伐。因為各 AI 廠商為了保持領先，仍然需要獲得盡可能更多的運算能力和電力。因此，從長遠來看，這不會影響 AI 資料中心的資本支出規模。另外，有看法指出 DeepSeek 使用的是 llama 3，而且是使用 gpt4o 作為驗證器的情況下，包括 META 或更多矽谷 AI 企業都將停止開放原始碼的 AI 模型，以幣面中國透過逆向工程來模仿。

至於，最重要的是 DeepSeek 實際上使用了 5 萬個 GPU，其中包括 1 萬個 H100、1 萬個 H800、3 萬個 H20，而 GPT4 則是使用了使用的是 2.5 萬個 A100。因此，市場認為 GPT4 相比，DeepSeek-R1 的訓練成本僅為 5% 到 10% 的成本計算並不正確，DeepSeek 仍是付出了相當巨大的基礎設施成本，其成本效益不如市場猜測的那樣具競爭力。因此，從以上的分析結果來觀察，未來的 AI晶片市場供需是否還會因此事件有巨大的改變，目前似乎含言之過早，後續還需要進一步的觀察。

(首圖來源：Image by Freepik)