(CWW)近日,在2021第三屆中國超級(jí)算力大會(huì)上,國家超級(jí)計(jì)算濟(jì)南中心(以下簡(jiǎn)稱“濟(jì)南超算”)聯(lián)合華為重磅發(fā)布《算力互聯(lián)網(wǎng)技術(shù)白皮書》(以下簡(jiǎn)稱“白皮書”),圍繞算力互聯(lián)網(wǎng)發(fā)展趨勢(shì)和技術(shù)挑戰(zhàn),闡述算力互聯(lián)網(wǎng)解決方案的架構(gòu)、關(guān)鍵技術(shù),以及實(shí)踐經(jīng)驗(yàn),以加速未來計(jì)算模式轉(zhuǎn)變,推動(dòng)計(jì)算性能維持指數(shù)級(jí)增長。
在“十四五”規(guī)劃與2035遠(yuǎn)景目標(biāo)的政策背景下,數(shù)字經(jīng)濟(jì)成為國民經(jīng)濟(jì)發(fā)展的重要引擎。山東是中國的經(jīng)濟(jì)大省,也是創(chuàng)新大省。山東省的“十四五”規(guī)劃中特別提到,要加快發(fā)展數(shù)字經(jīng)濟(jì),推動(dòng)數(shù)字產(chǎn)業(yè)化,打造先進(jìn)計(jì)算、信創(chuàng)等具有競(jìng)爭(zhēng)力的數(shù)字產(chǎn)業(yè)集群,其中一條就是要支持濟(jì)南建設(shè)中國算谷。面向大趨勢(shì),濟(jì)南超算的愿景是要打造供給算力的超強(qiáng)大腦,超算生態(tài)的高端基地,培育產(chǎn)業(yè)鏈群的專業(yè)園區(qū)和計(jì)算學(xué)科的中堅(jiān)力量,聚集創(chuàng)新資源的重要載體,并拓展國家合作的開放平臺(tái)。
國家超級(jí)計(jì)算濟(jì)南中心聯(lián)合華為發(fā)布《算力互聯(lián)網(wǎng)技術(shù)白皮書》
濟(jì)南超算的研究員張瑋表示:“超算業(yè)務(wù)具有強(qiáng)算力、大數(shù)據(jù)、高通量等特點(diǎn),但當(dāng)前也面臨用戶接入難、算力變現(xiàn)難、算力資源使用不均衡、安全防護(hù)難的問題。因此,需要構(gòu)建一張具備集約化、高算力、服務(wù)化和高安全四大特征的算力互聯(lián)網(wǎng)。濟(jì)南超算攜手華為先行先試,圍繞算力互聯(lián)網(wǎng)率先突破,取得了顯著的效果。”
此次發(fā)布的白皮書中提出了算力互聯(lián)網(wǎng)解決方案,以算力資源為核心,支持網(wǎng)絡(luò)動(dòng)態(tài)感知算力資源分布,實(shí)現(xiàn)動(dòng)態(tài)調(diào)整最優(yōu)路徑并提供差異化保障服務(wù),從而滿足新一代超算數(shù)據(jù)中心大規(guī)模超算組網(wǎng)的需求。算力互聯(lián)網(wǎng)解決方案由算力生產(chǎn)網(wǎng)、算力配給網(wǎng)、算力一體安全組成。
算力生產(chǎn)網(wǎng):作為各算力資源池的基礎(chǔ)網(wǎng)絡(luò),算力生產(chǎn)網(wǎng)是計(jì)算中心的動(dòng)脈樞紐,為算力資源的充分釋放提供基礎(chǔ)支撐。通過全以太網(wǎng)絡(luò)和直連拓?fù)涞染W(wǎng)絡(luò)架構(gòu)創(chuàng)新構(gòu)建集約化算力中心,降低建網(wǎng)和運(yùn)維成本,同時(shí)滿足更大規(guī)模組網(wǎng)的需求,助力算力普惠。通過智能無損網(wǎng)絡(luò)和網(wǎng)算一體等算網(wǎng)融合技術(shù),實(shí)現(xiàn)總線級(jí)數(shù)據(jù)通信能力,更高效地釋放集群算力。通過長距無損算法,實(shí)現(xiàn)多算力中心間網(wǎng)絡(luò)流量的預(yù)測(cè)性調(diào)整控制,支撐區(qū)域內(nèi)算力高效調(diào)度。
算力配給網(wǎng):作為各算力中心連接的骨干通道,算力配給網(wǎng)實(shí)現(xiàn)用戶與算力中心的高速互聯(lián)和算力中心之間的高速互聯(lián),基于SRv6協(xié)議實(shí)現(xiàn)業(yè)務(wù)自動(dòng)化開通,支持任意連接,讓算力觸手可及;通過FlexE網(wǎng)絡(luò)切片技術(shù)實(shí)現(xiàn)算力差異化服務(wù),為敏感類業(yè)務(wù)提供安全隔離能力;通過智能運(yùn)維實(shí)現(xiàn)故障精準(zhǔn)定位定界,最終讓用戶像使用電力一樣便捷地享受算力服務(wù)。
算力一體安全:算力安全是算力互聯(lián)網(wǎng)的基礎(chǔ)。傳統(tǒng)的邊界防護(hù)手段存在很多局限性,已無法滿足新形勢(shì)下的算力互聯(lián)網(wǎng)安全需求。為了實(shí)現(xiàn)算力一體安全,所有安全能力以內(nèi)建的方式為產(chǎn)品和解決方案提供各種安全機(jī)制,所有接入網(wǎng)絡(luò)的實(shí)體對(duì)象都要具備唯一可信任的身份,并通過動(dòng)態(tài)持續(xù)檢測(cè)來實(shí)時(shí)識(shí)別風(fēng)險(xiǎn),實(shí)現(xiàn)云網(wǎng)安一體的安全協(xié)同防護(hù)。
基于算力互聯(lián)網(wǎng)的整體架構(gòu),張瑋還分享了基于業(yè)界首個(gè)算力互聯(lián)網(wǎng)絡(luò)的聯(lián)合創(chuàng)新測(cè)試結(jié)果。測(cè)試表明,在算力生產(chǎn)網(wǎng),開啟網(wǎng)算一體后的RoCE網(wǎng)絡(luò),相比超算專網(wǎng)的任務(wù)完成時(shí)間最大減少27%;采用直連拓?fù)湎啾葌鹘y(tǒng)CLOS組網(wǎng),計(jì)算性能最大提升29%;基于長距無損算法,從濟(jì)南-淄博的RoCE網(wǎng)絡(luò)平均時(shí)延最多可降低49.8%。在算力配給網(wǎng),部署SRv6后,帶寬利用率提升50%;開啟隨流檢測(cè)功能,可以實(shí)現(xiàn)分鐘級(jí)故障定位。
未來算力網(wǎng)絡(luò)將從算力互聯(lián)走向算力協(xié)同,進(jìn)而探索算力融合。濟(jì)南超算與華為將繼續(xù)攜手合作,通過統(tǒng)一算力服務(wù)平臺(tái),實(shí)現(xiàn)多超算中心的統(tǒng)一資源管理、統(tǒng)一用戶管理、統(tǒng)一記賬、資源融合調(diào)度、和應(yīng)用協(xié)同服務(wù),進(jìn)而實(shí)現(xiàn)高效利用算力資源和高質(zhì)量用戶服務(wù),為行業(yè)和重要應(yīng)用領(lǐng)域的科學(xué)研究、經(jīng)濟(jì)建設(shè)和社會(huì)發(fā)展提供優(yōu)質(zhì)的算力基礎(chǔ)設(shè)施,實(shí)現(xiàn)國家超算中心的可持續(xù)發(fā)展。
關(guān)鍵詞: 資訊 通信世界網(wǎng) 算力 濟(jì)南超算 華為 算力互聯(lián)網(wǎng)技術(shù)白皮書