移動云主導的IETF國際標準發布, 助AI大模型突破通信瓶頸
近日,移動云主導制定的IETF國際標準RFC9793《BGPExtensionsforBitIndexExplicitReplication(BIER)》正式發布,該標準針對主流的MoE(MixtureofExperts)架構AI大模型的專家并行All-to-All通信瓶頸問題提供了高效解決方案,為AI大模型的高效訓練和推理提供了堅實的保障。這一突破性成果標志著移動云的技術創新實力獲國際權威認可,彰顯了中國在全球 互聯網 標準體系建設中的重要話語權。
突破瓶頸:高效組播賦能MoE架構
在人工智能邁向萬億參數大模型時代的關鍵進程中,MoE架構憑借其優異的性能表現,成為主流AI模型的基石架構。然而,在MoE大模型的訓練與推理環節,專家并行所需的All-to-All通信對網絡帶寬提出了極為苛刻的要求,特別是在超節點的scale-up網絡中,傳統的通信模式難以滿足需求,成為制約AI大模型進一步發展的一大痛點。
移動云主導制定的高效組播方案,憑借獨特的無狀態組播特性,可實現AI大模型門控路由器的實時靈活指定,并具備在數據報文中攜帶組播接收者列表的能力,無需依賴復雜耗時的組播樹建立過程。這一特性與MoE大模型的門控路由器根據專家實時負載水平等因素為每個Token動態選擇對應的TopN專家的機制完美契合。通過上述創新技術方案,可以大幅提升All-to-All通信效率,有效提升AI大模型訓練與推理的效率和性能。
標準筑基:推動AI技術普惠化落地
在云智算戰略深化落地的背景下,AI大模型的訓練與推理的效率和性能成為產業發展的核心競爭力。本次由移動云主導制定的IETF國際標準,為解決MoE架構AI大模型關鍵通信瓶頸問題提供了國際通用技術規范,并有望應用于AI超節點產品,提升MoE架構大模型的訓練以及推理的通信效率,有效降低大模型訓練和推理成本,助力AI技術在千行百業的標準化、普惠化應用。
未來,移動云將繼續發揮技術優勢,加強AI大模型等前沿技術領域的自主創新,讓中國主導的國際標準成為AI和云計算基礎設施高質量發展的技術基石,持續賦能各行業的數字化轉型。