9月1日,由人民網(wǎng)·人民數(shù)據(jù)主辦的“數(shù)據(jù)要素發(fā)展座談會(huì)暨數(shù)據(jù)要素公共服務(wù)平臺(tái)上線儀式”活動(dòng)在人民日?qǐng)?bào)社成功舉辦。
(相關(guān)資料圖)
在主題演講環(huán)節(jié),中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏發(fā)表《數(shù)據(jù)要素技術(shù)概覽》主題演講。
圖為中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏發(fā)表演講
何寶宏表示,數(shù)據(jù)市場(chǎng)發(fā)展幾十年來(lái),技術(shù)一直在變化。在過(guò)去20年,大數(shù)據(jù)時(shí)代讓所有的數(shù)據(jù)能夠管起來(lái)、用起來(lái),把原始數(shù)據(jù)提煉成數(shù)據(jù)資源,但仍然面臨“用得不夠好、價(jià)值釋放不夠”的難題。從大數(shù)據(jù)到數(shù)據(jù)要素時(shí)代的目標(biāo),是讓數(shù)據(jù)資源向數(shù)據(jù)資產(chǎn)發(fā)展,從能存、能算到釋放價(jià)值、對(duì)外流通,真正進(jìn)入數(shù)據(jù)3.0時(shí)代。
何寶宏指出,圍繞數(shù)據(jù)資產(chǎn)化過(guò)程主要有三大類:第一是數(shù)據(jù)管理,當(dāng)前的數(shù)據(jù)管理的工具和智能化不夠,人為介入比較高,應(yīng)該更技術(shù)化;第二是數(shù)據(jù)安全,原來(lái)數(shù)據(jù)安全主要靠防火墻的邊界,只有在邊界內(nèi)才是安全可控的,數(shù)據(jù)要素要求在流通中解決安全問(wèn)題,就要將邊界安全變?yōu)閿?shù)據(jù)的內(nèi)生安全;第三類是數(shù)據(jù)流通,致力于從“流通即失控”變?yōu)椤翱捎貌豢梢?jiàn)”。
何寶宏認(rèn)為,數(shù)據(jù)管理技術(shù)應(yīng)達(dá)到好用、易用的技術(shù)需求。易用,即靈活應(yīng)對(duì)各類需求;好用,即數(shù)據(jù)質(zhì)量全面提升。數(shù)據(jù)管理的基礎(chǔ)性技術(shù)現(xiàn)已成熟,而創(chuàng)新融合還在繼續(xù)。面向數(shù)據(jù)質(zhì)量自動(dòng)化管理的AI技術(shù)方案已基本成熟,有待進(jìn)一步推廣應(yīng)用;針對(duì)“讓數(shù)據(jù)更好地找到人,而不是讓人找數(shù)據(jù)”的問(wèn)題,融合各類技術(shù)進(jìn)行數(shù)據(jù)管理以實(shí)現(xiàn)“數(shù)據(jù)主動(dòng)找人”的數(shù)據(jù)編織技術(shù)正在快速興起,但目前處于概念期;數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖技術(shù)已得到廣泛應(yīng)用,融合數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖各自優(yōu)勢(shì)的湖倉(cāng)一體技術(shù)有待進(jìn)一步提高性能。
何寶宏指出,數(shù)據(jù)安全保護(hù)技術(shù)已相對(duì)成熟,全生命周期的模式創(chuàng)新不斷。數(shù)據(jù)安全技術(shù)方面,應(yīng)從數(shù)據(jù)存儲(chǔ)、訪問(wèn)、使用和流通安全及數(shù)據(jù)的分級(jí)分類幾個(gè)方面實(shí)現(xiàn)數(shù)據(jù)的有效保護(hù)和有力控制。建立“規(guī)則+AI識(shí)別”是當(dāng)前常用的數(shù)據(jù)安全保護(hù)技術(shù)路線,分類分級(jí)、防泄露、零信任驗(yàn)證等均在一定程度上依賴相應(yīng)規(guī)則的設(shè)置和人工智能的精準(zhǔn)度;基于“持續(xù)驗(yàn)證,永不信任”理念的零信任技術(shù)架構(gòu)進(jìn)一步適應(yīng)不斷突破邊界的云、網(wǎng)環(huán)境,進(jìn)一步推動(dòng)數(shù)據(jù)安全對(duì)全生命周期的覆蓋。
何寶宏表示,數(shù)據(jù)流通的技術(shù)需求:確權(quán)、轉(zhuǎn)移和定價(jià)。數(shù)據(jù)流通中的問(wèn)題主要是確權(quán)、轉(zhuǎn)移和定價(jià)在法律法規(guī)的基礎(chǔ)上需要相應(yīng)技術(shù)手段的支持。在確權(quán)方面要解決聲明技術(shù)和共識(shí):聲明權(quán)利可通過(guò)在數(shù)據(jù)內(nèi)嵌入標(biāo)識(shí)、憑證以聲明權(quán)利的數(shù)字水印等技術(shù)來(lái)實(shí)現(xiàn);權(quán)利獲得共識(shí)且不可篡改則可通過(guò)數(shù)據(jù)各類權(quán)利共識(shí)存證、不可篡改、可追溯的區(qū)塊鏈/web3等技術(shù)來(lái)實(shí)現(xiàn)。
何寶宏認(rèn)為,數(shù)據(jù)轉(zhuǎn)移則是核心問(wèn)題,涉及到很多的相關(guān)技術(shù)。API接口和數(shù)據(jù)脫敏是目前最常用的兩個(gè)技術(shù),兩者經(jīng)常會(huì)結(jié)合使用。何寶宏指出,這兩者當(dāng)前也存在一定的局限性。首先,API接口只提供數(shù)據(jù)集中的部分記錄、字段,數(shù)據(jù)脫敏改變了原始數(shù)據(jù)的形態(tài),原始數(shù)據(jù)的全量信息均受到損失,價(jià)值較原始數(shù)據(jù)大幅降低;其次,通過(guò)API或脫敏給出的數(shù)據(jù)已不再受數(shù)據(jù)提供方掌控,容易被濫用,或通過(guò)其他關(guān)聯(lián)反推原始數(shù)據(jù)。何寶宏表示,基于加密隱藏的多方安全計(jì)算技術(shù)是數(shù)據(jù)轉(zhuǎn)移的另一個(gè)重要技術(shù),其需要去中心化及支持通用計(jì)算,目前計(jì)算效率還較低、開(kāi)發(fā)難度較大,應(yīng)用性距產(chǎn)業(yè)化推廣還需要一個(gè)過(guò)程;另一方面,傳遞建模中間信息隱藏原始數(shù)據(jù)的聯(lián)邦學(xué)習(xí)日趨發(fā)展成熟,廣泛適用于風(fēng)控、營(yíng)銷、政務(wù)、醫(yī)療、互聯(lián)網(wǎng)金融等應(yīng)用場(chǎng)景,但這項(xiàng)技術(shù)的局限性在于目前缺乏嚴(yán)謹(jǐn)?shù)陌踩C明機(jī)制,參與方可能通過(guò)交互的中間數(shù)據(jù)反推出原始數(shù)據(jù),還易受到數(shù)據(jù)投毒和模型攻擊等攻擊方式;另外,聯(lián)合建模往往需要多輪迭代,在多方參與情況下,由于計(jì)算資源不同會(huì)造成數(shù)據(jù)聚合不同步,從而影響整體性能;再者,該技術(shù)目前尚缺乏相關(guān)法律法規(guī)的支持。何寶宏還提到,智能合約則能實(shí)現(xiàn)數(shù)據(jù)流通使用限量、限目的、不可篡改,實(shí)現(xiàn)完全數(shù)字原生的合約,數(shù)字原生的定價(jià)機(jī)制等,但目前總體處于初步發(fā)展階段,理論和技術(shù)手段還不太成熟。隱私計(jì)算的“可用不可見(jiàn)”——企業(yè)在控制所持?jǐn)?shù)據(jù)的基礎(chǔ)上,讓數(shù)據(jù)“來(lái)去自由”,成為自主可控的數(shù)據(jù)資產(chǎn),已經(jīng)可以產(chǎn)業(yè)化應(yīng)用了。
何寶宏指出,定價(jià)問(wèn)題的技術(shù)需求則是多方合作時(shí)的數(shù)據(jù)價(jià)值貢獻(xiàn)度量。對(duì)于多方聯(lián)合參與計(jì)算的場(chǎng)景,每方所提供數(shù)據(jù)的價(jià)值衡量需要技術(shù)支持,即在聯(lián)合計(jì)算的過(guò)程中通過(guò)算法公平合理地衡量數(shù)據(jù)價(jià)值貢獻(xiàn)度,作為收益分配的依據(jù)。數(shù)據(jù)定價(jià)在多方參與聯(lián)合建模的場(chǎng)景中,綜合運(yùn)用博弈論、人工智能模型、信息論等技術(shù),探討數(shù)據(jù)價(jià)值與決策模型精度的關(guān)系,可以為度量各數(shù)據(jù)方的貢獻(xiàn)度、進(jìn)一步分配收益提供依據(jù)。何寶宏認(rèn)為,目前其應(yīng)用的場(chǎng)景相對(duì)比較局限、產(chǎn)業(yè)化不足,新的應(yīng)用場(chǎng)景還不多。
何寶宏表示,總體而言,圍繞著數(shù)據(jù)要素需要更多的新技術(shù),也需要相關(guān)法律法規(guī)的密切配合,目前依然面臨著嚴(yán)峻考驗(yàn)。
來(lái)自29個(gè)中央部委相關(guān)部門(mén)負(fù)責(zé)人,湖北、河南、黑龍江、安徽、內(nèi)蒙古等省區(qū)的地方政府部門(mén)負(fù)責(zé)人,以及各地大數(shù)據(jù)交易所、大數(shù)據(jù)企業(yè)的代表500多人出席會(huì)議。
關(guān)鍵詞: