一、AI數(shù)據(jù):產業(yè)生態(tài)圈
中游廠商提供數(shù)據(jù)開發(fā)與治理服務,助力AI應用高效落地
AI基礎數(shù)據(jù)服務與數(shù)據(jù)治理產業(yè)鏈結構為:1)上游:數(shù)據(jù)源與數(shù)據(jù)產能;2)中游:數(shù)據(jù)產品開發(fā)工具與管理服務;3) 下游:人工智能應用。處于中游的兩類服務商中,AI基礎數(shù)據(jù)服務商使用數(shù)據(jù)采集與標注工具處理圖片、語音、文本等非 結構化數(shù)據(jù),面向AI的數(shù)據(jù)治理服務商則負責使用數(shù)據(jù)治理的各組件管治多源異構數(shù)據(jù),使其形成數(shù)據(jù)資產,從而提高數(shù)據(jù)質量。二者處理后的數(shù)據(jù)可直接為下游的AI訓練所用,使AI應用落地能夠省時省力。
二、數(shù)智融合產業(yè)帶來多元廠商參與
數(shù)據(jù)治理與AI應用開展交匯融合,廠商參與更加豐富多元
依托于數(shù)據(jù)與AI模型的緊密關聯(lián),數(shù)據(jù)治理與AI應用產品已逐步開展交匯融合,展現(xiàn)“由數(shù)據(jù)治理到開發(fā)AI應用平臺/產品”與“AI應用平臺/產品開發(fā)到面向AI的數(shù)據(jù)治理”的兩路發(fā)展方向:1)數(shù)據(jù)治理廠商在積累數(shù)據(jù)經驗與AI模型理解后,為實現(xiàn)業(yè)務拓展而將領域從數(shù)據(jù)層延伸至AI應用及平臺開發(fā)層;2)從事AI應用及平臺開發(fā)的AI廠商,也會在數(shù)據(jù)治理經驗不斷豐富的背景下,著手向底層開展面向AI的數(shù)據(jù)治理業(yè)務,依托于自身AI技術與業(yè)務理解,讓面向AI的數(shù)據(jù)源更加契合AI應用模型要求以提升模型擬合效果。因此,面向AI的數(shù)據(jù)治理從業(yè)者不僅僅為數(shù)據(jù)治理廠商,更包括眾多AI企業(yè),參與者更加豐富多元。
三、數(shù)智產業(yè)生態(tài)圈的受益節(jié)奏
三方陣營廠商構建行業(yè)競合格局
AI應用的加速落地帶來的大量數(shù)據(jù)治理需求,吸引眾多廠商參與其中。從行業(yè)廠商類型來看,主要包括咨詢公司、數(shù)據(jù)服務相關提供商和人工智能產品提供商三類。各類廠商根據(jù)自身業(yè)務特點和切入方式獲得差異化的競爭優(yōu)勢,而由于面向人工智能的數(shù)據(jù)治理服務的參與立足點豐富,廠商之間可能基于同類業(yè)務展開競爭,同時在差異化領域進行合作,形成競爭與合作高度共存的行業(yè)格局。
四、數(shù)智產業(yè)生態(tài)圈的參與立足點
“智”為面向人工智能的數(shù)據(jù)治理服務的核心立足點
面向人工智能的數(shù)據(jù)治理服務常包含于數(shù)據(jù)服務、平臺能力和數(shù)據(jù)產品三類采購形式中。
第一類,數(shù)據(jù)服務即以單獨的數(shù)據(jù)治理產品形式出現(xiàn),但由于面向人工智能的數(shù)據(jù)治理尚未發(fā)展出成熟獨立的產品模式,因此以該類形式出現(xiàn)的業(yè)務涉及較少。市面上大多數(shù)據(jù)治理服務仍以傳統(tǒng)數(shù)據(jù)治理的形式存在,對于已搭建AI中臺或AI應用較為廣泛的智能化轉型先行企業(yè),會在數(shù)據(jù)治理產品采購方案中添加對支持AI應用數(shù)據(jù)的治理需求;
第二類,數(shù)據(jù)平臺,主要包括大數(shù)據(jù)平臺、數(shù)據(jù)中臺、數(shù)據(jù)倉庫和AI能力平臺等項目。大體量大數(shù)據(jù)平臺、數(shù)據(jù)中臺和數(shù)倉項目多會包含AI應用體系建設,從而涵蓋部分對應的AI數(shù)據(jù)治理服務。另外AI平臺/中臺可沉淀面向AI的數(shù)據(jù)治理能力,將其標準化后納入平臺模塊和產品項目中;
第三類,數(shù)據(jù)產品,范圍限定在應用AI算法的數(shù)據(jù)產品,可劃分為機器學習產品、自然語言理解產品和知識圖譜三類AI產品。
為保證AI算法模型的優(yōu)質運行效果,更好地提供預測、決策、推薦和風控等產品功能,需要對算法模型的訓練原料,即支持AI應用的底層數(shù)據(jù),進行針對性優(yōu)化治理。如今AI產品需求旺盛,AI開發(fā)平臺陸續(xù)推進AI產品的規(guī)?;涞?,且AI數(shù)據(jù)治理效果與最終平臺產品交付效果緊密相連,AI應用驅動成為面向人工智能的數(shù)據(jù)治理服務的核心立足點。
五、面向人工智能的數(shù)據(jù)治理:行業(yè)規(guī)模
2021年市場規(guī)模約為40億元,預計五年后規(guī)模突破百億
從數(shù)智產業(yè)圈的參與立足點出發(fā),艾瑞提取測算了大數(shù)據(jù)平臺、數(shù)據(jù)中臺、AI應用與數(shù)據(jù)治理服務的項目中與AI應用相關的數(shù)據(jù)治理規(guī)模并加總而得,2021年中國面向人工智能的數(shù)據(jù)治理規(guī)模約為40億元。受數(shù)據(jù)平臺服務、數(shù)據(jù)治理服務和AI應用建設的需求推動影響,面向人工智能的數(shù)據(jù)治理規(guī)模將持續(xù)上升,2026年規(guī)模突破百億達105億元,2021-2026CAGR=21.3%。2021年,中國的數(shù)據(jù)治理市場規(guī)模約為121億元。作為數(shù)據(jù)服務的基礎工作,數(shù)據(jù)治理規(guī)模將保持上揚態(tài)勢,預計2026年市場規(guī)模達到294億元,2021-2026 CAGR=19.5%。從發(fā)展曲線來看,數(shù)據(jù)治理與面向人工智能的數(shù)據(jù)治理規(guī)模增長均處于良性區(qū)間,共同鞏固相關治理產業(yè)生態(tài)圈的向好形勢。
六、面向人工智能的數(shù)據(jù)治理:時機路徑
契合客戶的數(shù)據(jù)基礎和AI應用需求的多元化選擇
從數(shù)據(jù)基礎的維度劃分,可將企業(yè)分為數(shù)據(jù)原生企業(yè)與非數(shù)據(jù)原生企業(yè)。數(shù)據(jù)原生企業(yè)以互聯(lián)網為代表的數(shù)據(jù)原生企業(yè),在設立之初則以數(shù)字世界為中心構建,生成以軟件和數(shù)據(jù)平臺為核心的數(shù)字世界入口。該類企業(yè)往往不需要信息化、數(shù)字化轉型,所要做的即為讓數(shù)據(jù)共享流通的規(guī)范式管理。非數(shù)據(jù)原生企業(yè)成立之初以物理世界構建,圍繞生產、流通、服務等具體的經濟活動展開,天然缺乏以軟件和數(shù)據(jù)平臺為核心的數(shù)字世界入口。為了更好挖掘自身企業(yè)數(shù)據(jù)價值,非數(shù)字原生往往需要進行企業(yè)的數(shù)字化轉型,需通過數(shù)字化轉型程度與數(shù)據(jù)治理階段判斷非數(shù)據(jù)原生企業(yè)的數(shù)據(jù)基礎優(yōu)劣。最終,結合企業(yè)數(shù)據(jù)基礎與AI應用需求為面向人工智能的數(shù)據(jù)治理的體系搭建提供契合路徑,完成企業(yè)數(shù)據(jù)體系的進一步升級。