中國 DeepSeek 掀起 AI 話題,外資不認為具成本優勢以影響 AI 晶片市場

作者 | 發布日期 2025 年 01 月 27 日 17:10 | 分類 AI 人工智慧 , IC 設計 , 中國觀察 line share Linkedin share follow us in feedly line share
中國 DeepSeek 掀起 AI 話題,外資不認為具成本優勢以影響 AI 晶片市場

就在大家準備過農曆新年前夕,全球科技界迎接巨大變局。根據市場消息指出,日前總部位於杭州的 AI 公司「深度求索 (DeepSeek)」發布了一個推理模型 DeepSeek-R1,號稱在數學、程式碼及推理基準測試中,已經可以匹敵,甚至超越美國矽谷研發的模型,但是成本卻只要十分之一,不但讓科技界大為震驚,也使得引領 AI 產業的輝達、台積電等公司的股價一度大跌。

根據外媒報導,中國 DeepSeek 在這次所發表的推理模型中,就以數學和推理的性能來比較, DeepSeek-R1 超越 OpenAI o1,而在程式編寫方面性能則是不相上下。除了性能之外,DeepSeek-R1 的開發成本 不到 600 萬美元,僅是 Meta 訓練 Llama 3.1 的十分之一。這讓矽谷科技界大為震驚,也備感壓力。另外,現階段的 DeepSeek-R1 完全開放原始碼,無償提供免費網頁給大眾使用。甚至,還將所有技術細節、步驟進一步進行公開,這些動作相較採取收費機制的矽谷 AI 廠商更加加普及化。在性能、成本、開放的三大優勢下,現在矽谷 AI 廠商就如坐針氈。

事實上,對於中國 DeepSeek 新發表推理模型的情況,這對於美國政府一直以來持續給予中國在 AI 晶片上的限制措施可謂是一大壓力,也就是代表限制出口手段不但沒有防堵中國在AI 技術上的成功發展,甚至可進一步超過美國的競爭對手。因此,這情況對於未來在 AI 晶片市場上的生態變化也就備受市場的關注。就有外資表示,中國開發出 DeepSeek-R1人工智慧模型,就短期來看,因為其訓練成本號稱僅為美國的矽谷 AI 的十分之一,因此使美國的廠商確面臨了壓力。

不過,就長遠來觀察,預計不會對運算需求產生太大變化,而是將 DeepSeek 的發展突破視為加速 AI 發展的步伐,甚至導致邊緣 AI 的更快部署。產生這樣結果的原因,在於 AI 是一場邁向通用人工智慧的廣泛競賽,所有超大規模企業和 AI 實驗室都在競爭領先地位。因此,所有人都在關注其他參與者的動向。而隨著新模型的發展,任何突破都會很快被競爭對手吸收到他們的發展規劃中,從而推動創新的步伐。

此外,DeepSeek 的創新發展似乎可以讓 AI 模型訓練更加高效,使得競賽中的任何廠商都不會放慢其發展規劃的步伐。因為各 AI 廠商為了保持領先,仍然需要獲得盡可能更多的運算能力和電力。因此,從長遠來看,這不會影響 AI 資料中心的資本支出規模。另外,有看法指出 DeepSeek 使用的是 llama 3,而且是使用 gpt4o 作為驗證器的情況下,包括 META 或更多矽谷 AI 企業都將停止開放原始碼的 AI 模型,以幣面中國透過逆向工程來模仿。

至於,最重要的是 DeepSeek 實際上使用了 5 萬個 GPU,其中包括 1 萬個 H100、1 萬個 H800、3 萬個 H20,而 GPT4 則是使用了使用的是 2.5 萬個 A100。因此,市場認為 GPT4 相比,DeepSeek-R1 的訓練成本僅為 5% 到 10% 的成本計算並不正確,DeepSeek 仍是付出了相當巨大的基礎設施成本,其成本效益不如市場猜測的那樣具競爭力。因此,從以上的分析結果來觀察,未來的 AI晶片市場供需是否還會因此事件有巨大的改變,目前似乎含言之過早,後續還需要進一步的觀察。

(首圖來源:Image by Freepik)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》