A- A+

《大陸產業》算力突破高速網路瓶頸 填補陸國產智算系統關鍵空白

時報新聞   2026/03/13 11:27

【時報-台北電】大陸《環球時報》報導,大陸《「十五五」規畫綱要》明確提出,要「統籌推進算力設施建設、模型演算法發展和高品質數據資源供給,築牢數智化發展底座」。算力是人工智慧(AI)大模型訓練和運作的基礎,特別是超大規模智算集群已經成為全球AI競爭的制高點。中科曙光12日宣布突破高速網路的瓶頸問題,填補了大陸發展智算系統的「關鍵空白」。

此次中科曙光發布的scaleFabric是大陸首款原生無損RDMA(遠端直接記憶體存取)高速網絡,其技術規格全面對標輝達NDR,部分指標實現追趕。它面向超大規模智算集群設計,從核心關鍵IP、交換晶片、網路卡到交換器、驅動與管理軟體均實現自主研發,建構起從硬體到軟體的完整技術體系。

大陸工程院院士鄔賀驒在主題演講中表示,當前AI全面普及,算力成為核心生產力,算力的競爭也升級為「算網存」協同的全生態的博弈。大模型的訓練,智算集群的規模化部署,對網路提出了超低時延、超高頻寬、全程無損的嚴苛要求,高速網路作為算力基礎設施的核心關鍵技術,其自主可控性直接關乎國家算力基建安全與發展的品質。

現在超大規模集群服務是當前AI發展的底座,想要訓練全球領先的大模型,萬卡級甚至十萬卡級的智算集群已經成為必備的技術基礎。研究表明,在大規模分散式訓練中,網路通訊耗時占比已達到30%-50%,網路效能直接影響算力系統的整體效率。中科曙光高級副總裁李斌描述說,從過去的邊緣運算到現在人工智慧大模型的訓練,其實對網路通訊速度的要求越來越苛刻。對中小規模的算力系統來說,計算比網路的重要性略高,但是對於大規模算力系統而言,網路的重要性排在第一位。

「計算決定了算力系統性能的上限,而網路決定了其能力的下限,如果網路拉胯的話,有可能會把整個性能歸零。」

《環球時報》報導,在大規模智算集群領域,RDMA網路憑藉零丟包、高頻寬、低延遲等特徵,可大幅提升通訊效率,已成為算力中心的基本需求。

鄔賀驒表示,在大模型訓練與智算集群規模化部署背景下,網路需要同時具備超低延遲、超高頻寬與無損傳輸能力,而RDMA高速網路正是智算集群的「算力大動脈」。其中InfiniBand網路架構憑藉低時延與原生無損傳輸能力,在全球頂級超算與AI叢集中被廣泛採用。根據TOP500榜單,目前全球約60%的高效能運算系統都採用這種網路架構。

鄔賀驒強調,高端高速網路市場被國外技術壟斷,已成為大陸算力產業自主發展的核心瓶頸之一。中國信通院雲端運算與數位化研究所雲端運算部副主任鄭立說,超大規模智算集群成全球AI競爭焦點,而當前智算網絡普遍面臨資源孤島、時延過高、算網協同難等瓶頸,傳統RDMA實現路徑存在生態封閉或性能短板問題,倒檔行業走向融合與自研。(新聞來源:中時即時 李文輝)

注目焦點

推薦排行

點閱排行

你的新聞