(CWW)近年來,低碳發(fā)展已上升為我國的國家戰(zhàn)略,2022年黨的二十大報告中再次強調了碳達峰、碳中和的重要性,各領域需持續(xù)拓展低能耗綠色發(fā)展之路。云計算作為促進能源效率提升和結構優(yōu)化的關鍵技術,幫助企業(yè)實現(xiàn)“減排不減產、增收不增耗”的可持續(xù)發(fā)展目標,在企業(yè)“雙碳”節(jié)能工作中起到重要作用。
作為IT資源的新型服務形式,云計算正加速成為各行業(yè)企業(yè)數(shù)字化轉型與低碳發(fā)展的新引擎,不僅提高計算、存儲、網(wǎng)絡等資源利用率以及社會整體的算力利用率,而且大幅度降低二氧化碳排放量,推動社會資源效能全面提升,為傳統(tǒng)企業(yè)軟件架構變革、管理模式創(chuàng)新、業(yè)務生產增效帶來新動力,加速企業(yè)業(yè)務數(shù)字化發(fā)展。
隨著企業(yè)上云廣度、深度持續(xù)拓展,業(yè)務云計算的成本投入與用云復雜程度不斷增加,成本過高、效益不及預期等問題開始顯現(xiàn)。如何節(jié)省上云和用云成本、提高使用效益,成為當前企業(yè)關注重點,企業(yè)工作中心逐漸從如何遷移上云轉變?yōu)槿绾蝺?yōu)化用云。
【資料圖】
云資源浪費普遍存在,云成本優(yōu)化成為必然
云計算使企業(yè)IT消費模型產生巨大變化,原有的成本管控模式不再適用于云計算環(huán)境,各類業(yè)務陸續(xù)上云導致企業(yè)成本管理難度不斷提高,云資源浪費愈發(fā)嚴重。企業(yè)如何應對日益復雜的云環(huán)境,提升自身成本優(yōu)化能力成為關鍵課題。
企業(yè)用云效果不佳,云計算價值釋放不足
近年來,企業(yè)選擇成本更低、更綠色的云計算代替?zhèn)鹘y(tǒng)IT基礎設備,讓生產效率、運維效率、能源效率最大化。雖然企業(yè)云計算采用率不斷攀升,但是高采用率并沒有對應高成功率,云計算使用成本和復雜程度均超出企業(yè)預期。企業(yè)上云用云成本過高、價值釋放不足、管控難度大等問題日益顯現(xiàn)?!吨袊剖褂脙?yōu)化報告》數(shù)據(jù)顯示,企業(yè)上云后成本不可控制是企業(yè)用云面臨的最大挑戰(zhàn),且九成以上用云企業(yè)面臨成本浪費問題。過高的成本導致云資源投入與產出收益不匹配,其中較為典型的是以工業(yè)為代表的傳統(tǒng)行業(yè)。麥肯錫調查數(shù)據(jù)顯示,74%的企業(yè)云轉型未能獲取預期價值,受訪者認為,云技術比他們最初預期的更復雜。40%的受訪者認為云資源成本超出了企業(yè)的預算,而云轉型所帶來的IT價值與預期價值卻存在較大差距。
資源效益?zhèn)涫荜P注,成本優(yōu)化進入新階段
Flexera《2023 年云現(xiàn)狀調查報告》顯示,云成本的管理取代了安全性話題,成為當下云使用者面臨的首要問題。82% 的受訪者面臨的首個挑戰(zhàn)是管理云計算支出,其中有71%的重度云用戶將優(yōu)先考慮優(yōu)化云的現(xiàn)有使用情況(節(jié)省成本),79%的受訪者要解決安全性問題,上云用云企業(yè)仍然面臨平均約30%的成本浪費。面對遠超預期的成本浪費;過去企業(yè)對于成本優(yōu)化的需求主要集中在如何降低云計算成本開支與減少成本浪費。然而隨著企業(yè)對于云計算的理解不斷深入,他們逐漸意識到,應關注使用云資源后能為業(yè)務帶來多少效益,而非單純節(jié)省成本。
云資源效益是衡量企業(yè)上云用云成效的關鍵因素,即企業(yè)使用各種云資源為業(yè)務發(fā)展所帶來的貢獻度,或云資源投入與收益比。在企業(yè)用云過程中,云資源為上層業(yè)務提供支撐,云資源的使用與運營關乎著云平臺整體效能水平以及云業(yè)務的敏捷性、創(chuàng)新性和安全性等。優(yōu)化提升云資源效益,可以使云資源為業(yè)務提供更加優(yōu)質的支持,是企業(yè)云計算價值充分釋放的重要標志。企業(yè)成本優(yōu)化也隨之進入新階段,從一味地追求降低業(yè)務云計算成本,轉為在成本可控的保障下全方位提升云資源效益。
云改變企業(yè)IT成本模型,組織建設是云成本優(yōu)化的關鍵保障
云計算重塑企業(yè) IT 消費模型。云成本與傳統(tǒng) IT 固定成本不同,企業(yè) IT 基礎設施采購方式從原來的集中式重塑為分布式,且采購決策模式從原來的短期決策重塑為長期運營。企業(yè) IT 成本管理由原來的前置評估重塑為后置監(jiān)控,且成本類型由原來的固定成本CapEX重塑為“CapEX+OpEX”可變成本,這些變化需要企業(yè)優(yōu)化調整組織結構以應對云成本的管控。一方面,企業(yè)需要建立云成本優(yōu)化的長效運營機制,從原來的采購階段延伸至戰(zhàn)略、采購、上云、用云、持續(xù)運營等階段,并循序漸進形成閉環(huán);另一方面,云成本管理也從原先的IT預算制變?yōu)檫\營制。相應的,企業(yè)需要從人員組織、工具平臺、流程制度等方面建立可持續(xù)的云成本優(yōu)化體系。
企業(yè)云成本優(yōu)化能力建設應貫穿用云全周期
成本優(yōu)化貫穿業(yè)務上云用云全周期,各階段采取對應策略實現(xiàn)閉環(huán)優(yōu)化。從企業(yè)上云用云歷程看,大致可以劃分為戰(zhàn)略、采購、上云、用云、持續(xù)運營等階段。圍繞成本問題,每個階段的工作關注點不同,在各階段實施對應的技術和管理手段能夠幫助企業(yè)實現(xiàn)成本優(yōu)化管理。戰(zhàn)略階段是決策云部署及技術選型的關鍵期,選擇不同的云計算模式意味著不同的云成本構成,架構的選型也會很大程度影響成本優(yōu)化管理方式方法。采購階段解決如何采購云資源。云資源類型和計費方式種類繁多,根據(jù)業(yè)務特性選擇合適的資源和付費方式,避免成本浪費是成本優(yōu)化最直接的手段。上云階段結合業(yè)務實際情況規(guī)劃云上IT治理結構,提前設計并建設權限、審計、成本等方面管理體系,全面制定成本優(yōu)化治理模型。用云階段對云資源進行全面監(jiān)控管理,對閑置、低效率情況進行及時處理,采取針對性優(yōu)化措施。持續(xù)運行階段建設成本長效運作機制,對各環(huán)節(jié)成本優(yōu)化工作進行復盤,定期匯總分析歷史數(shù)據(jù),形成更加有效的優(yōu)化策略并應用于各環(huán)節(jié)中,進行持續(xù)閉環(huán)的成本優(yōu)化。
企業(yè)云成本優(yōu)化能力建設須協(xié)同人員、工具和流程
企業(yè)需要從人員角色、工具平臺、流程制度3方面建立可持續(xù)的云成本優(yōu)化體系。
人員角色是云成本優(yōu)化工作的關鍵抓手,成本優(yōu)化需要企業(yè)業(yè)務、財務、技術等方面多個角色共同參與,打破原有“各管一段、各自為戰(zhàn)”的傳統(tǒng)IT管理方式,形成FinOps成本優(yōu)化團隊,各角色長期協(xié)同共同努力達到成本長期治理的目標。工具平臺是云成本優(yōu)化工作的重要手段,成本優(yōu)化是個復雜且耗時的工作,例如賬單的拆分、計費的管理,僅靠人工是無法使成本優(yōu)化工作效率提升至較高水平的,需要將各項能力沉淀到工具中。流程機制是云成本優(yōu)化工作的前提保障,面對云計算特殊的消費模式和運營模式,成本優(yōu)化工作需要組織內部與流程機制進行對應。權限管控體系、資源申請流程、獎罰機制等優(yōu)化流程機制能夠確保在閉環(huán)環(huán)境下,優(yōu)化策略可以在企業(yè)內部精確、高效運轉。
云改變企業(yè)IT運行模式,資源提效是云成本優(yōu)化的核心
當前,企業(yè)對自身云資源使用情況不夠了解,相關人員通常關注云資源采購較多,對于上云后的如何用云、資源運營情況關注程度較低,造成資源使用效率低下、資源閑置、資源低效率運行,甚至大量計費資源未使用等現(xiàn)象普遍。在此背景下,提升云資源效益尤為重要,企業(yè)可從資源的規(guī)劃、監(jiān)控和使用3方面優(yōu)化云資源,并通過云資源效益度量了解自身效益情況。
合理規(guī)劃資源容量,配置彈性資源補給
根據(jù)業(yè)務特性選擇合適的付費方式是成本優(yōu)化最直接的方式。從付費層面來看,按照業(yè)務場景長期使用的穩(wěn)定業(yè)務資源需求,通過選擇成本較低的包年包月等方式來支撐負載??梢韵仁褂玫团渲觅Y源,觀察評估運行資源負載后再升級配置,還可以將使用率低的資源降低配置或釋放。如果業(yè)務有使用周期且有不同狀態(tài)下的資源需求可以選擇成本相對較高但使用時長更靈活的按量付費方式,如臨時測試、彈性伸縮選擇按量付費資源。按量付費資源采用停機不收費的模式,以保留數(shù)據(jù)并能快速啟用。如需長期運行,可以更換預付費模式??扇蒎e的業(yè)務可以通過成本非常低廉的“搶占式”來支撐。
此外,付費方式并不是一成不變的,企業(yè)應根據(jù)業(yè)務資源歷史運行數(shù)據(jù),及時調整資源類型。例如,針對CPU利用率一直較高的后付費類(按量計費)云服務器,如果其連續(xù)兩個月使用時長產生的費用超過同規(guī)格預付費類(包年包月計費)費用,可以將計費模式更改為預付費。
企業(yè)可以通過組合使用多種類型資源節(jié)省成本。針對云成本的管理與優(yōu)化,企業(yè)需要關注實例的收費模式。其中,云服務商實例定價模式通常有以下3種。
(1)按需:隨用隨啟,根據(jù)運行的實例以按小時或按秒的方式計算容量并付費。
(2)預留:有一定的使用承諾(如1年或3年的使用承諾),與按需實例的定價相比,預留實例可提供大幅折扣(通常為按需實例的60%)。
(3)競價:提供極端彈性和廉價的計算資源。其價格根據(jù)供需關系而變化,與按量付費實例的相比具有非常明顯的價格優(yōu)勢(通常為按需實例的10%~20%)。
根據(jù)業(yè)務特性采用資源組合方式是重要的成本優(yōu)化方式,組合付費是指企業(yè)利用云端彈性的優(yōu)勢配置自動伸縮功能,以實現(xiàn)按需購買實例和預留實例的組合使用,以應對業(yè)務變化引起的資源需求變化,從而獲得最佳的成本效益。
構建資源監(jiān)控體系,有效識別低效資源
在實際運行中,生產系統(tǒng)的底層資源運行情況才是資源利用率的真實反映。通過構建云資源監(jiān)控體系,持續(xù)監(jiān)控系統(tǒng)與資源對應的各項指標。一方面,需要監(jiān)控各類云資源的使用情況,如監(jiān)控云主機CPU使用率、內存使用率等指標,通過時間等維度配置策略。另一方面,需要有效劃分閑置資源、低負載資源,如某類云主機從創(chuàng)建后,一直處于關機狀態(tài),此類云主機可判定為閑置資源,運維管理員可將云主機進行回收,釋放對應的CPU、內存等資源,避免云資源浪費。
根據(jù)監(jiān)控數(shù)據(jù)分析出存在優(yōu)化空間的資源單元。根據(jù)持續(xù)周期的監(jiān)控數(shù)據(jù),平臺可以評估可優(yōu)化的費用空間,同時對于存在忙時及閑時流量特性的場景,可靈活組合多種計費方式資源以節(jié)省成本。例如,監(jiān)控各業(yè)務使用云資源配額的情況,若出現(xiàn)配額閑置,管理員應當減少該租戶部門的容量配額,將配額優(yōu)先分配給處于瓶頸的業(yè)務,減少云平臺配額的浪費。此外,在監(jiān)控的基礎上,企業(yè)可分析以往數(shù)據(jù),有效預測云平臺容量未來變化,提前預警提醒企業(yè)運維人員。
閑時資源自動縮容,閑置資源合理關停
負載訪問有明顯的周期規(guī)律類業(yè)務,閑時可以進行資源降配。很多業(yè)務的流量具備周期性規(guī)律,若是使用常備服務器支撐日常峰值流量,在非峰值時段服務器的利用率顯然是不足的。對于此類業(yè)務,可以根據(jù)業(yè)務的實際流量定時擴縮容,以此大幅降低云上成本。
業(yè)務訪問有明顯閑時周期的業(yè)務通??煞譃?類,一是開發(fā)、測試類系統(tǒng),這類系統(tǒng)所用的按量付費資源,非工作時間自動啟停。二是社交類業(yè)務系統(tǒng),如微博、抖音等峰值流量出現(xiàn)在中午1點和晚上10點左右,可能達到日常流量的1.5倍甚至更多,可設置閾值自動調配資源。三是證券類業(yè)務系統(tǒng),工作時間內有穩(wěn)定的訪問需求,工作時間外(例如晚間或者節(jié)假日)可對資源進行適度降配。四是運行在企業(yè)內部的軟件系統(tǒng),例如企業(yè)級套裝軟件ERP、客戶關系管理系統(tǒng)CRM等,辦公類系統(tǒng)節(jié)假日可以適度降低資源配置。
企業(yè)在云上的閑置資源關停通常有兩種情況,一是過剩資源關停,當大部分資源的使用率或配額低于原本規(guī)劃的范圍,且合理使用時被定義為預留過剩,應降低預算配額,合理優(yōu)化成本。二是遺留資源關停,通常是依賴關系不存在時的遺留資源,例如快照資源,依賴于其他資源生成數(shù)據(jù),當其他資源不存在時,快照也無需存在,針對該類資源建議及時停止或刪除。
企業(yè)云成本優(yōu)化能力建設指導標準體系
標準規(guī)范和評價體系讓企業(yè)云能力建設“有規(guī)可依”
當前企業(yè)云成本優(yōu)化能力體系建設正處于初級階段,尚無大規(guī)模落地經(jīng)驗,企業(yè)缺少相關環(huán)節(jié)的標準規(guī)范引領。企業(yè)云成本優(yōu)化能力體系建設以及云成本優(yōu)化相關的標準、成效評價體系成為新的關注方向。當前,中國信通院已經(jīng)形成了覆蓋云成本優(yōu)化能力建設、云資源效益水平度量等全方位、多角度的標準和評估模型,并將持續(xù)研究企業(yè)云能力優(yōu)化課題,完善企業(yè)在云成本、性能、安全、數(shù)據(jù)等領域的優(yōu)化和治理標準體系,面向央國企等場景展開深入研究,形成多維度、完整的評估體系。
云成本優(yōu)化能力建設標準規(guī)范和評價體系
云成本優(yōu)化能力建設標準規(guī)范助力企業(yè)構建高質量、高效率的成本優(yōu)化體系,標準既涵蓋企業(yè)云成本優(yōu)化領域能力建設、工具水平、服務質量,同時還提出企業(yè)事后云資源效益情況度量的一套方法,為企業(yè)云成本優(yōu)化前期規(guī)劃、中期執(zhí)行、后期復盤全流程提供專業(yè)指導。
在能力建設方面,中國信息通信研究院研究發(fā)布了成本優(yōu)化服務商、優(yōu)化工具、成本優(yōu)化能力成熟度等領域多項標準。成本優(yōu)化服務商標準包括考察服務方成本優(yōu)化咨詢能力、工具服務能力、實施能力、培訓賦能能力4方面,對服務方成本優(yōu)化流程和質量進行規(guī)范性要求。成本優(yōu)化工具標準針對原生成本優(yōu)化工具和混合多云成本優(yōu)化工具提出了場景化的能力要求,為企業(yè)選擇成本優(yōu)化工具提供重要依據(jù)。成本優(yōu)化能力成熟度標準考察企業(yè)自身成本優(yōu)化能力是否完備,從技術、流程、組織維度評價企業(yè)成本優(yōu)化能力成熟度,引導企業(yè)正確規(guī)劃未來成本優(yōu)化建設方案。
在評價體系方面,中國信息通信研究院提出了企業(yè)云資源效益度量模型(Cloud CAPEX Efficiency Model ),依據(jù)《企業(yè)云資源效益度量模型》幫助企業(yè)分層次、分模塊地評估衡量云計算使用成效,評估價值結果分為基礎級、增強級、優(yōu)秀級、卓越級和引領級5個級別,企業(yè)可選擇IaaS模塊、PaaS模塊、業(yè)務應用模塊等部分分別評估云計算價值成效,并獲取相應水平等級證書?!镀髽I(yè)云資源效益度量模型》通過定因、定則、定權、定級4個步驟,對企業(yè)業(yè)務云資源效益進行專業(yè)度量。資源效益定因是確定云資源效益涉及的所有因子,并按照通用行業(yè)因子與業(yè)務專屬因子對其進行分類,根據(jù)因子之間關系,從成本、業(yè)務、安全3個方面出發(fā),自上而下逐級細化效益因子。資源效益定則是確定各效益因子的量化規(guī)則,針對所有效益因子設定分級要求,將各類因子進行統(tǒng)一量化,從低到高根據(jù)業(yè)務云資源相關能力的深度、廣度與相關產出的高低,設置量化規(guī)則。資源效益定權是確定效益因子在度量模型中的權重,通過AHP層次分析法,對資源效益因子進行權重賦值,結合通用權重與業(yè)務適應性權重生成的業(yè)務專屬權重進行資源效益度量。資源效益定級是確定云資源效益度量最終等級,對業(yè)務效益因子進行統(tǒng)一評估、量化后,將結果與因子權重進行計算,最終得到資源效益等級。在整個效益度量過程中,企業(yè)可全方位診斷業(yè)務資源使用、效益、能力等情況,并了解分析自身資源使用問題或能力短板,為業(yè)務云資源優(yōu)化策略的規(guī)劃和更新提供數(shù)據(jù)支撐。
企業(yè)云優(yōu)化發(fā)展展望
隨著企業(yè)上云范圍不斷擴大、用云程度逐漸加深,企業(yè)上云用云進入了新周期,環(huán)境的變革引發(fā)了云優(yōu)化領域發(fā)展新態(tài)勢。一是云計算部署模式推陳出新,帶動上云用云新需求?;旌显啤S性频仍朴嬎悴渴鹉J街饾u成為主流,代替?zhèn)鹘y(tǒng)的單一部署模式,隨之而來的是更加復雜的消費模型和運營體系,環(huán)境的變化為企業(yè)上云用云帶來更多挑戰(zhàn),優(yōu)化的需求也隨之增加。二是企業(yè)用云行業(yè)屬性顯著,云優(yōu)化治理應因地制宜。云計算在各個行業(yè)中的應用不斷深化,上云用云的場景更加豐富多樣,云優(yōu)化治理需要根據(jù)場景需求進一步細化指標和要求。三是云優(yōu)化產業(yè)合作持續(xù)加強,產品工具將日益完善。在產業(yè)政策的推動下,云計算技術在近年來得到快速發(fā)展,微服務、容器、資源運維等云計算技術將在未來繼續(xù)升級,為企業(yè)上云用云優(yōu)化提供更先進的手段,幫助企業(yè)進一步釋放云計算價值。四是云優(yōu)化標準體系逐步完善,規(guī)范并指導企業(yè)上云用云。隨著越來越多的企業(yè)認識到云優(yōu)化的重要性,優(yōu)化標準體系也將逐步建設完善。標準為企業(yè)優(yōu)化效果和優(yōu)化服務質量提供基礎保障,為優(yōu)化能力建設和服務選擇提供更加專業(yè)的指導。
關鍵詞: