<fieldset id="uky0i"><table id="uky0i"></table></fieldset>

<ul id="uky0i"></ul>

<fieldset id="uky0i"></fieldset>

<del id="uky0i"><tfoot id="uky0i"></tfoot></del>

<fieldset id="uky0i"><table id="uky0i"></table></fieldset>

首頁

營銷

財富

IDC

IT資訊

創(chuàng)業(yè)頭條

創(chuàng)業(yè)加盟

創(chuàng)業(yè)項目加盟: 招商合作; VIP特權; 最新創(chuàng)業(yè)項目; 創(chuàng)業(yè)項目排行榜

網(wǎng)站服務: SEO診斷; SEO顧問

營銷推廣服務: A5全媒體平臺; 品牌營銷; 企業(yè)會員; 小紅書推廣; 快手信息流開戶; 云主機優(yōu)惠

當前位置：首頁 > 科技 > IT業(yè)界 > 正文

品牌
標簽
企業(yè)會員

全調(diào)度以太網(wǎng)（GSE），中國智算網(wǎng)絡新標準

2024-08-14 09:14 來源：互聯(lián)網(wǎng) 我來投稿撤稿糾錯

　域名預訂/競價，好“米”不錯過

伴隨著智算技術的發(fā)展,越來越多的研究表明在 AI 訓練達到一定規(guī)模下能力才會涌現(xiàn),在AI大模型的擴展定律和涌現(xiàn)能力的驅動下,AI大模型的參數(shù)規(guī)模越來越大。國內(nèi)外業(yè)界已出現(xiàn)多個萬億參數(shù)模型,十萬億參數(shù)模型在不遠的將來也有望問世。公開資料表明,GPT-4 的參數(shù)體量比 GPT-3 增長了 10 倍,達到 1.8 萬億參數(shù)。國內(nèi)的盤古、悟道大模型,其參數(shù)規(guī)模同樣超過了萬億。

注:數(shù)據(jù)截至23年3月,資料來源:北京智源人工智能研究院,中金公司研究院

美國當?shù)貢r間7月22日,特斯拉CEO埃隆·馬斯克在旗下社交平臺X上表示,xAI團隊、X團隊、英偉達及其他支持公司已經(jīng)于當?shù)貢r間凌晨4時20分開始在“孟菲斯超級集群(Memphis Supercluster)”上進行訓練。“孟菲斯超級集群”由10萬個液冷H100 GPU組成,在單個RDMA結構上運行,是“世界上最強大的人工智能訓練集群”,該集群將被用于訓練xAI旗下第三代大語言模型Grok-3。大規(guī)模 AI 計算從萬卡進入到十萬卡時代。

大規(guī)模智算集群需要高性能的網(wǎng)絡連接,以保證各智算節(jié)點間的通信效率、數(shù)據(jù)吞吐和整個智算集群的算力性能。這對智算網(wǎng)絡提出了新的挑戰(zhàn)。

在基礎訓練模型中,一方面多任務混合部署,傳統(tǒng)以太網(wǎng)源端發(fā)流直接采用網(wǎng)絡“Push”流量模式,不考慮網(wǎng)絡及接收端的接受能力,導致網(wǎng)絡擁塞,使得 GPU 處于等待狀態(tài),造成梯度和參數(shù)同步過程中算力資源浪費較大,傳統(tǒng)的 RoCE 網(wǎng)絡有效吞吐僅為 50%;另一方面,智算集群網(wǎng)絡流量呈現(xiàn)出數(shù)據(jù)流數(shù)目少、單流流量大的特點,在傳統(tǒng)網(wǎng)絡均衡算法下容易引發(fā)HASH 沖突,造成鏈路丟包,導致訓練異常中斷,極大影響訓練效率。時代呼喚 “ 零丟包 ” 、 “ 高吞吐 ” 、 “ 低時延 ” 為核心特征的無損智算網(wǎng)絡設備,來解決超大規(guī)模 AI 計算通信效率低的問題。

當前全球 已商用的 智算網(wǎng)絡技術,主要有 2 大流派:

流派 1 : IB(InfiniBand)網(wǎng)絡,是目前市場占有率最高的智算網(wǎng)絡解決方案,IB 技術較為封閉,市場基本被英偉達壟斷,不符合全球開放生態(tài)的產(chǎn)業(yè)共識。

流派 2 : RoCE(RDMA over Converged Ethernet)網(wǎng)絡,RoCE廣泛應用于需要高帶寬和低延遲的網(wǎng)絡,在傳統(tǒng)的通算領域有很高的占有率,但是RoCE在智算網(wǎng)絡中存在流量HASH極化的問題,需要輔助以各種均衡調(diào)參進行智算網(wǎng)絡的適配。

為了 更好的 提升 智算網(wǎng)絡性能,更好的服務于 大規(guī)模 AI 計算, 出現(xiàn)了更多的新型技術流派:

新技術流派 1 :UEC(Ultra Ethernet Consortium)網(wǎng)絡,2023 年 7 月Linux 基金會與全球頭部科技企業(yè)聯(lián)合成立 UEC 以太網(wǎng)創(chuàng)新聯(lián)盟,其創(chuàng)始成員包括AMD、Arista、博通、思科、HPE、Intel、Meta、微軟、Oracle和Eviden,致力于從物理層、鏈路層、傳輸層、軟件層改進以太網(wǎng)技術的革新,來滿足 AI 計算網(wǎng)絡的需求。

新技術流派 2 :GSE(Global Scheduling Ethernet)網(wǎng)絡,中國智算中心的建設熱潮始于 2020 年,目前已有 40 多個城市在建設或在建智算中心。智算中心建設步伐加快,但國內(nèi)的網(wǎng)絡技術發(fā)展卻滯后于 AI 大模型的演進。 AI 網(wǎng)絡技術上的競爭已經(jīng)成為中美技術博弈的新戰(zhàn)場。在這樣嚴峻的形勢下,2023 年 5 月,中國移動聯(lián)合產(chǎn)業(yè)界發(fā)布了全調(diào)度以太網(wǎng)(GSE)白皮書,同年8 月全調(diào)度以太網(wǎng)推進計劃正式開啟,標志著具有中國自主技術的 GSE 流派正式誕生。

GSE 是一個開放的生態(tài)組織,2023 年 9 月,中國移動發(fā)布推GSE 交換機原型系統(tǒng)樣機。2024 年 1 月在移動實驗室完成了GSE 交換機多廠商設備的互聯(lián)互通測試。

GSE 網(wǎng)絡 ,專為大規(guī)模 AI 訓練集群 打造:

• 按需調(diào)度,性能無損

GSE 網(wǎng)絡基于 PKTC 容器技術,實現(xiàn)了高精度的網(wǎng)絡負載均衡,從根本上改善了傳統(tǒng) AI 算力網(wǎng)絡鏈路的帶寬利用率;采用基于 DQSQ 的信令申請調(diào)度技術,數(shù)據(jù)流以“Pull”的方式進行轉發(fā),突破了傳統(tǒng)以太網(wǎng)的性能瓶頸,網(wǎng)絡性能提升至 95%以上。

在多業(yè)務部署場景下,相較于傳統(tǒng) RoCE 網(wǎng)絡性能大幅下降,GSE 交換機能保持與單業(yè)務場景持平的網(wǎng)絡轉發(fā)性能,極大提升網(wǎng)絡效率。

• 場景靈活,快速部署

GSE 純網(wǎng)側方案即可滿足智算無損需求,可搭配國產(chǎn) GPU 集成網(wǎng)卡,降低端側網(wǎng)卡要求。GSE技術原生解決了適配不同大模型訓練的網(wǎng)絡調(diào)參問題,避免了傳統(tǒng)RoCE達數(shù)天甚至數(shù)周的網(wǎng)絡參數(shù)調(diào)優(yōu),在算力昂貴、AI大模型競爭激烈的市場中,為客戶帶來靈活的算力網(wǎng)絡建設方案,縮短了訓練調(diào)優(yōu)周期,幫助客戶快速搶占市場先機。

• 全局解耦, 開放生態(tài)

GSE 技術體系支持標準以太網(wǎng)標準,新增標準協(xié)議頭,完成基于以太報文的轉發(fā),實現(xiàn)端到端的多廠家設備互聯(lián)互通,構建了多廠家充分參與的開放生態(tài),全面激活國內(nèi) AI 產(chǎn)業(yè)鏈,促進智算產(chǎn)業(yè)創(chuàng)新發(fā)展。

GSE標準協(xié)議頭

【總結】

銳捷網(wǎng)絡致力于與 GSE 生態(tài)一起打造中國的AIGC智算網(wǎng)絡新標準。GSE 網(wǎng)絡設備基于標準以太網(wǎng)在轉發(fā)架構方面進行技術創(chuàng)新,突破傳統(tǒng)以太網(wǎng)的性能瓶頸,拓展智算網(wǎng)絡的應用場景,充分滿足國產(chǎn)化智算集群網(wǎng)絡的需求,為客戶帶來了三大核心價值:提高智算效率, 增強運維體驗 , 開放 生態(tài) 解耦 。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

相關文章

加載更多

熱門排行

信息推薦

編輯推薦

熱門標簽

淘寶鵲橋藍牙技術網(wǎng)紅營銷互聯(lián)網(wǎng)家裝猩便利汽車金融 fb推相親應用韓檢方搜lg總部深圳滴滴乘客規(guī)則網(wǎng)站首頁網(wǎng)絡推廣網(wǎng)站電商戰(zhàn) 凡客誠品語音搜索公司網(wǎng)站源碼京東回應取消底薪騰訊新聞哥致歉王思聰限消令和解手游推廣容聲冰箱

站長必看的網(wǎng)站-站長信息和服務中心: 徐州好推網(wǎng)絡科技有限公司版權所有; 舉報投訴郵箱：yy@haotui.cn

<del id="w0scg"><sup id="w0scg"></sup></del><ul id="w0scg"><sup id="w0scg"></sup></ul>

<strike id="w0scg"></strike>

<strike id="w0scg"><menu id="w0scg"></menu></strike>