跳至內容

中國電信基於 800GWDM 現網完成業界首例千卡分佈式無損智算網驗證

更新時間
快连VPN:速度和安全性最佳的VPN服务
快连VPN:速度和安全性最佳的VPN服务

1. 當前,隨着智算卡數達到千卡、甚至萬卡,所需帶寬往往高達百 T 比特級、甚至超 P 比特級。因此,光傳輸系統的大帶寬、高可靠與高效率的特點是保證分佈式訓練高算效的關鍵。

2. 中國電信研究院、中國電信北京公司、天翼雲公司共同在中國電信現網基於 800G C+L 技術,爲 1024 卡規模的分佈式集羣提供大容量帶寬,實現 120 公里千億參數大模型分佈式訓練,性能達到集中訓練的 95% 以上。

3. 針對數據傳輸的大帶寬問題,中國電信採用高階調製格式的單波長 800G 技術以提高頻譜效率,配合當前的業界熱點的 C+L 波段技術實現超大傳輸帶寬,在中國電信武清與潤澤機房之間採用華爲公司傳輸設備,通過多次環回構建了大帶寬互聯的智算驗證網,距離達到 120km。

4. 針對數據傳輸的高可靠問題,中國電信完成了鏈路誤碼、波長故障、光纖故障等異常測試試驗,結果表明,一個 800G 業務波中斷會導致超 40% 的算效降低,而百毫秒級以上光纖故障會導致算效大幅下降甚至訓練中斷。從官方獲悉,採用 WSON 重路由恢復技術,此次在兩點間將重路由恢復時間控制在 50ms 以內,可保證分佈式智算業務的高可靠互聯,最大程度釋放算效。

5. 針對傳輸鏈路的高效率問題,中國電信提出分鐘級波長動態拆建解決方案來實現算與網的協同分時複用,有效提升網絡資源利用率。此次驗證爲跨地域、跨層級、跨主體高可靠的算力協同調度奠定基礎。

以上就是中國電信基於 800GWDM 現網完成業界首例千卡分佈式無損智算網驗證的詳細內容,更多請關注本站其它相關文章!

更新時間

發表留言

請注意,留言須先通過審核才能發佈。