(CWW)當前國家大力推動“東數(shù)西算”和“雙碳”戰(zhàn)略,將催生以數(shù)據(jù)為關鍵生產要素、算力為核心生產力的綠色經(jīng)濟新形態(tài)。算力網(wǎng)絡可提供基于數(shù)據(jù)、計算、智能、網(wǎng)絡融合發(fā)展的新型共享服務模式,廣泛服務于智能科學計算、行業(yè)數(shù)字化應用、政府大數(shù)據(jù)治理和公共服務等場景,成為我國數(shù)字經(jīng)濟發(fā)展重要驅動力。算力承載網(wǎng)絡作為算力服務的底層支撐系統(tǒng),負責完成算網(wǎng)中多級算力節(jié)點的接入與互聯(lián)、數(shù)據(jù)的傳輸與備份、資源的調度與協(xié)同。算力承載網(wǎng)成為算力網(wǎng)絡發(fā)展的根基,也將影響算力服務體驗的品質。目前,業(yè)界已積極開展了算力承載網(wǎng)絡架構、關鍵技術和演進方案的研究。本文將分析典型算力應用場景和承載需求,梳理算力應用的SLA指標。在此基礎上,開展SPN(切片分組網(wǎng)絡)算力承載關鍵技術研究和探討,最后給出SPN算力承載網(wǎng)演進策略建議。
典型算力應用場景與承載需求分析
(資料圖片)
“算力+網(wǎng)絡”雙SLA承載需求
5G、人工智能、大數(shù)據(jù)和云AR/VR等新型ICT技術的發(fā)展,將推動我國數(shù)據(jù)中心和算力網(wǎng)絡的建設。在國家“東數(shù)西算”政策驅動下,算力網(wǎng)絡將迎來新一波的發(fā)展熱潮?,F(xiàn)階段,運營商和云服務商都在規(guī)劃覆蓋城域邊緣算力、省級核心算力、區(qū)域樞紐算力的多級算力網(wǎng)絡。不同的算力應用對算力資源和網(wǎng)絡連接需求存在較大差異,承載網(wǎng)需滿足多級算力調度和“算力+網(wǎng)絡”雙SLA承載需求。典型算力應用場景和業(yè)務流量流向如圖1所示。
圖 1典型算力應用場景和業(yè)務流量流向
表1算力承載網(wǎng)“算力+網(wǎng)絡”雙SLA承載需求
算力承載網(wǎng)“算力+網(wǎng)絡”雙SLA承載需求如表1所示,總體來看,不同算力應用場景的算力和承載需求趨向差異化和多樣化。超算和大數(shù)據(jù)類應用提出了強算力、大帶寬和高可靠的承載需求,典型應用主要體現(xiàn)在高校/研究機構的科學計算、政府大數(shù)據(jù)治理和公共服務領域。實時采集決策類應用主要涉及基于高清圖像處理和策略下發(fā)的智能計算場景,提出了確定性低時延和高可靠的網(wǎng)絡需求。AI機器視覺類應用主要體現(xiàn)在智能制造的高清視頻質檢等場景,帶來了大帶寬、低時延和高可靠的承載需求。云AR/VR和視頻渲染類應用主要涉及云邊側多級視頻渲染的T~P級別大型算力,提出大帶寬、低時延的承載需求。物聯(lián)網(wǎng)數(shù)據(jù)采集類應用采用邊緣算力完成對各類異構終端的遠程狀態(tài)監(jiān)測、性能測量和遠程控制,該應用帶來小帶寬和廣連接的承載需求。工業(yè)控制類應用呈現(xiàn)出低時延、低抖動、低帶寬和高可靠的確定性承載需求。DC異地災備提出大帶寬、低時延、安全隔離的確定性承載需求。
結合典型算網(wǎng)應用場景和需求分析,隨著算力資源的不斷下沉,面向行業(yè)和用戶/家庭類的應用(表1和圖1中②~④類)主要涉及城域邊緣算力調度;超算和備份類應用(表1和圖1中①、⑤類)要求更強的核心調度能力。隨著算力資源從中心向邊緣發(fā)展,廣覆蓋的城域網(wǎng)絡也成為算力承載的關鍵,需發(fā)揮城域承載網(wǎng)絡優(yōu)勢,以網(wǎng)絡為核心調度算力資源,支持泛在的算力接入和互聯(lián)。
算力承載網(wǎng)的挑戰(zhàn)與特征
算力流量/流向復雜性、算力接入的廣覆蓋要求承載網(wǎng)具備更加靈活泛在的連接能力,面向分布在邊緣、區(qū)域中心、樞紐中心的泛在算力資源,結合不同應用的東西向+南北向復雜流量流向,在骨干層靈活高速的全光連接基礎上,城域/接入需采用協(xié)議精簡的L1~L3層技術實現(xiàn)快速敏捷的算力接入和調度。
滿足算力應用的差異化承載需求,業(yè)務多維感知成為基本網(wǎng)絡能力要求。不同算力應用在承載網(wǎng)絡性能、算力類型、算力規(guī)模上均存在明顯差異,通過多維算網(wǎng)性能、業(yè)務和通道的深度感知,精準適配差異化的承載技術和方案,從而保障業(yè)務的高質量體驗。
支撐行業(yè)關鍵應用,確定性網(wǎng)絡成為高品質承載的重要保障。確定性帶寬、確定性低時延/抖動、高可靠性等網(wǎng)絡能力將有效支撐行業(yè)關鍵應用。如在數(shù)據(jù)存儲備份場景下,需要提供跨地域大帶寬的數(shù)據(jù)搬運服務,要求提供大帶寬、低時延、高可靠的確定性網(wǎng)絡服務。
災備場景和應急通信場景對承載網(wǎng)絡管控系統(tǒng)提出智能調度和彈性便捷的能力要求。數(shù)據(jù)存儲災備場景需要提供跨地域海量數(shù)據(jù)備份,承載網(wǎng)絡需提供算力智能調度服務,支持算力、網(wǎng)絡資源的自動化分配和智能化調度。此外,應急算力通信場景需提供彈性的網(wǎng)絡帶寬服務。算力服務供給要保證算力使用的便捷性,保障用戶能夠隨時隨地接入不同區(qū)域、不同企業(yè)提供的算力資源。
SPN算力承載網(wǎng)架構
隨著“東數(shù)西算”戰(zhàn)略的實施以及運營商算力網(wǎng)絡建設的逐步推進,面向區(qū)域和地市的邊緣算力將在城域范圍內廣泛部署。具備綜合業(yè)務承載網(wǎng)能力的SPN將面臨復雜的算力接入和互聯(lián)場景,主要包括區(qū)域算力用戶接入、邊緣算力用戶接入、邊緣算力云邊協(xié)同、邊緣算力邊邊協(xié)同等場景。中國移動端到端算網(wǎng)連接通常包括邊緣算力、中心算力、SPN網(wǎng)絡、云專網(wǎng)等,典型結構如圖2所示。
圖2端到端算網(wǎng)連接典型結構
SPN主要負責在城域范圍完成邊緣和城域算力的接入,通過與云專網(wǎng)采用網(wǎng)絡層接口互通,實現(xiàn)與中心樞紐算力的連接和調度。在轉發(fā)層面,SPN網(wǎng)絡與云專網(wǎng)可采用網(wǎng)關和逐跳方式構建跨域SRv6隧道。在管控層面,SPN算力承載網(wǎng)現(xiàn)階段采用分層分域的管控架構,SPN網(wǎng)管、云專網(wǎng)控制負責各自域內SRv6隧道配置管理,上層的跨域編排器通過SRv6強大可編程能力實現(xiàn)多個跨域隧道的統(tǒng)一編排和綁定標簽的配置。
SPN算力承載網(wǎng)關鍵技術
基于SRv6的靈活泛在連接技術
通過引入SRv6技術,SPN可實現(xiàn)全程基于標準IPv6的轉發(fā),提供覆蓋“云、網(wǎng)、邊”的端到端SLA保證能力。傳統(tǒng)SPN設備采用SR-MPLS滿足5G承載南北向和東西向流量的轉發(fā)需求。在5G網(wǎng)絡中,由于東西向流量占比相對較?。?lt;5%),且東西向連接多發(fā)生在相鄰基站間,業(yè)務流量流向的復雜度相對較低。因此,SPN網(wǎng)絡主要采用域內SR-TP隧道、少量跨域場景引入SR-BE隧道的方式。相比5G網(wǎng)絡,算力承載的業(yè)務流量和流向將更為復雜多樣,涉及多級算力、復雜流量流向調度,原有的承載技術體制已無法滿足算網(wǎng)承載需求。
在隧道層面,通過采用SRv6 Policy可實現(xiàn)SPN城域網(wǎng)到云專網(wǎng)業(yè)務的一跳入云和端到端SR-TE承載,為算力接入和互聯(lián)提供靈活選路、跨網(wǎng)融合能力。采用S-BFD結合SRv6 Policy HSB保護,將提升隧道故障的快速檢測和端到端保護能力。SPN城域網(wǎng)與云專網(wǎng)通過EBGP協(xié)議可實現(xiàn)跨域路由的發(fā)布,從而構建跨越云網(wǎng)的端到端SB-BE隧道,滿足跨域靈活邊緣算力接入、算力互聯(lián)需求。
在業(yè)務層面,通過引入EVPN L3VPN over SRv6實現(xiàn)基于BGP協(xié)議的私網(wǎng)路由學習分發(fā)及L3 VPN業(yè)務高效承載。EVPN L3VPN支持基于VPN FRR和IP FRR/混合FRR的節(jié)點級保護技術,可提供業(yè)務層的高可靠性保證,支撐算網(wǎng)業(yè)務靈活泛在、高質量的承載。
基于通道的算網(wǎng)感知技術
SPN網(wǎng)絡支持MTN、FGU、SR-TP/MPLS-TP和SR-BE等多種通道技術?;诓煌乃憔W(wǎng)承載需求,SPN需匹備相應的技術機制,實現(xiàn)基于通道的算網(wǎng)感知能力。目前,SPN通道算網(wǎng)感知技術采用了首節(jié)點感知、管控系統(tǒng)集中下發(fā)通道配置的方式。SPN網(wǎng)絡可提供透明感知、敏捷感知和深度感知3種算網(wǎng)感知通道方案,如圖3所示。
圖 3SPN通道算網(wǎng)感知技術
在業(yè)務場景方面,透明感知通道通過SPN端到端時隙交叉連接能力實現(xiàn)算網(wǎng)連接,適用于低時延、高安全隔離的場景;敏捷感知通道在SPN內采用SR-TP隧道,適用于靈活高效算網(wǎng)連接場景;深度感知通道采用了全程SRv6 Policy部署方式,主要面向泛在算力部署下的算網(wǎng)連接場景。
在技術機制方面,三類感知通道本質上都是利用了SRv6強大的可編程能力,通過SRv6的轉發(fā)行為可編程功能實現(xiàn)將SRv6 Policy綁定至MTN/FGU通道、SR-TP隧道和逐跳SRv6。敏捷感知通道采用網(wǎng)關方式實現(xiàn)SRv6 over SR-TP,深度感知通道則是采用了逐跳SRv6實現(xiàn)跨域SRv6 Policy;透明感知通道通過SRv6的SRv6 SID可編程實現(xiàn)不同層隧道的綁定。
基于MTN接口的確定性品質承載技術
表 2SPN網(wǎng)絡的切片資源隔離技術及時延特性
注:表中單跳時延為未擁塞下P節(jié)點數(shù)據(jù);單跳抖動為切片間擁塞切片內不擁塞時高優(yōu)先業(yè)務P節(jié)點數(shù)據(jù)。
SPN算力承載網(wǎng)演進策略建議
基于對SPN算力承載網(wǎng)關鍵技術和方案的研究,本文探討性地提出了SPN算力承載網(wǎng)演進策略建議。目前,業(yè)界已基本達成共識,算力網(wǎng)絡的發(fā)展將經(jīng)歷算網(wǎng)協(xié)同、算網(wǎng)融合和算網(wǎng)一體3個階段。隨著算力網(wǎng)絡的發(fā)展演進,SPN算力承載網(wǎng)也將按照3個階段不斷創(chuàng)新發(fā)展,SPN算力承載網(wǎng)演進如圖4所示。
圖 4SPN算力承載網(wǎng)演進
在算網(wǎng)協(xié)同階段,“網(wǎng)”與“算”相對獨立,通過上層算網(wǎng)編排器實現(xiàn)算力和網(wǎng)絡協(xié)同調度和運營。此階段,SPN算力承載網(wǎng)實現(xiàn)從SR-MPLS向SRv6逐步演進,具備SRv6基本能力,包括SRv6 Policy、EVPN L3VPN、EBGP等,支持基于網(wǎng)關和逐跳的通道算網(wǎng)感知能力。管控層面通過運營編排系統(tǒng)實現(xiàn)業(yè)務的敏捷發(fā)放。
在算網(wǎng)融合階段,“網(wǎng)”與“算”的基礎設施完成部分融合,同時形成統(tǒng)一的“算網(wǎng)大腦”,實現(xiàn)算網(wǎng)融合的服務供給和一體化運營。此階段,SPN算力承載網(wǎng)將向“IPv6+”持續(xù)演進,具備“IPv6+”的增強功能,包括應用感知(APN6)和業(yè)務鏈(SFC)等,實現(xiàn)基于應用驅動的網(wǎng)絡感知算力;支持基于SRv6的算力時延可視、可測和選路。管控層面通過向算力平臺開放網(wǎng)絡能力,提供算網(wǎng)融合服務。
在算網(wǎng)一體階段,徹底打破算網(wǎng)邊界,形成算網(wǎng)一體化的基礎設施,讓用戶可以隨時隨地體驗到多要素融合和算網(wǎng)一體化的服務。此階段,SPN算力承載網(wǎng)將基于統(tǒng)一算網(wǎng)標識和度量,實現(xiàn)算力感知和算力路由。在管控層面,網(wǎng)絡路徑計算將融合算力資源信息,實現(xiàn)最優(yōu)資源調度。
隨著算力網(wǎng)絡的發(fā)展演進,算力承載網(wǎng)需經(jīng)歷技術和標準的不斷創(chuàng)新。產業(yè)界需凝聚共識,協(xié)同推動算力承載技術的應用落地和標準化工作,共促算力網(wǎng)絡的持續(xù)發(fā)展。
*本文首發(fā)于《通信世界》
2022年11月10日 第21期 總第907期
原文標題:面向算力承載的SPN關鍵技術與演進策略探討
關鍵詞: 東數(shù)西算 雙碳戰(zhàn)略 算力承載 SPN關鍵技術