A- A+

DeepSeek強調AI效率革命,R2模型備受關注

全球縮影   2026/01/06

(1)現象:中國AI新創DeepSeek於2026年1月初發布最新研究論文,提出名為「流形約束超連接」(mHC)的全新訓練框架,主打在降低算力與能源需求的同時,提升大型模型的可擴展性。該論文由創辦人梁文鋒參與署名,並同步發布於arXiv與Hugging Face等開源平台。市場注意到,DeepSeek過往每次公開關鍵論文後,往往預告新一代模型即將推出,使得外界對其下一代旗艦AI系統R2在2026年2月前後亮相的期待快速升溫。

(2)原因:在無法自由取得輝達高階AI晶片的背景下,中國AI產業被迫走向「以效率換算力」的技術路線。DeepSeek此次提出的mHC框架,核心在於透過架構設計與基礎設施優化,改善訓練不穩定與擴展受限等問題,使中大型模型能以較低硬體成本完成訓練。此研究延續字節跳動於2024年對超連接架構的成果,反映中國AI業者正嘗試以演算法、系統工程與開源策略,彌補先進製程與GPU供給受限的劣勢。

(3)影響:若DeepSeek的新訓練方法與R2模型成功落地,將對全球AI產業形成兩層影響。其一,AI競爭焦點可能由單純堆疊算力,轉向「效率導向」的模型與系統設計,降低對最先進GPU的依賴。其二,此趨勢可能削弱部分高階晶片需求成長斜率,同時推升對模型優化、邊緣運算與推理效率的重視。對雲端服務商與企業用戶而言,更低成本的先進模型,有助於加速AI應用普及,但也將加劇全球AI技術路線的分歧。

(4)受影響股票:台積電(2330)

注目焦點

推薦排行

點閱排行

你的新聞