(CWW)“數(shù)據(jù)要素具有多項屬性,包括可見性、易理解性、可鏈接性、可視性、互操作性、安全性、歸屬性、開放性和資產(chǎn)性?!痹?022北京網(wǎng)絡安全大會上,中國工程院院士鄔賀銓詳細介紹了數(shù)據(jù)要素的九大基本特征,并闡述了這九大特征與網(wǎng)絡安全之間的內(nèi)在關聯(lián)。
第一大特征是數(shù)據(jù)的可見性。通常情況下,安全檢測會使用數(shù)據(jù)可視化來發(fā)現(xiàn)異常,可如果將可視化工具部署在公有云上,就意味著數(shù)據(jù)也要上傳到公有云,顯然這將帶來一定的安全風險。與此同時,部署私有云的成本又相對偏高,因此大量政企機構(gòu)希望將云化的可視化工具下載到本地終端進行部署,在增加數(shù)據(jù)可見性的同時,確保數(shù)據(jù)的安全性。
第二大特征是數(shù)據(jù)的易理解性。鄔賀銓表示,為了讓計算機能更好的理解數(shù)據(jù),工程師們會對數(shù)據(jù)進行前期的預處理。比如人臉識別,需要對人臉事先進行標注,區(qū)別眼睛、鼻子、耳朵、嘴巴等等,幫助計算機識別五官;再例如智能駕駛,大量道路情況也需要標注紅綠燈、斑馬線、障礙物等等。不過,目前標注依然需要人工處理,甚至需要外包、眾包的參與,這就帶來了極大的用戶隱私泄漏風險。
【資料圖】
尤其是人臉探測、視覺探測、車輛識別等等敏感公共信息,與個人隱私、車輛安全甚至是智慧城市安全息息相關,一旦處置不當很可能會造成較為嚴重的后果。
第三個特征是數(shù)據(jù)的可鏈接性。大數(shù)據(jù)技術(shù)能夠?qū)⒑A慨悩?gòu)分布數(shù)據(jù)結(jié)合在一起,實現(xiàn)數(shù)據(jù)深度地挖掘。在數(shù)據(jù)鏈接的過程中,除了依靠流程和管理制度之外,接入數(shù)據(jù)的權(quán)限該如何管理?鄔賀銓認為,跨多個應用程序和云服務存儲的數(shù)據(jù)共享需要明確可共享的原則、范圍、層次和內(nèi)容,規(guī)定共享程序與審計,只向授權(quán)人開放,重要數(shù)據(jù)的接入認證需要采用數(shù)字簽名,并且防止員工使用不安全的應用共享敏感數(shù)據(jù)。
另一方面,隨著歐洲《通用數(shù)據(jù)保護條例》的實施,元數(shù)據(jù)需要負擔起個人身份信息標記、數(shù)據(jù)屏蔽、訪問請求和數(shù)據(jù)管理生命周期管理等功能,顯然,應重點保證元數(shù)據(jù)平臺對網(wǎng)絡攻擊的防御能力。
第四是數(shù)據(jù)互操作性。數(shù)據(jù)要流動、要使用才能產(chǎn)生價值,尤其是跨境數(shù)據(jù)流動,這樣才能支撐國際貿(mào)易以及科技、教育、文化、產(chǎn)業(yè)交流合作。但在數(shù)據(jù)跨境流動過程中,如何保證國家的安全、商業(yè)秘密及個人隱私亟待解決。鄔賀銓認為,數(shù)據(jù)流動的管理首先需明確并確定數(shù)據(jù)類型,以便在出境口攔截未經(jīng)批準的敏感數(shù)據(jù)。其次還需還原數(shù)據(jù)路徑,實施數(shù)據(jù)處理流程的全鏈路監(jiān)控,便于事后追溯。
第五是數(shù)據(jù)的可信性。深度神經(jīng)網(wǎng)絡是個分類器,當事件和圖像處于AI模型辨識分界線或被干擾時會使AI誤判。不過對抗樣本僅對指定圖片和攻擊模型生效,可通過區(qū)域截圖、放大縮小等預處理發(fā)現(xiàn)數(shù)據(jù)被投毒。
事實上,在整個供應鏈中,數(shù)據(jù)也極易受到污染而出現(xiàn)失真現(xiàn)象。因此可采用區(qū)塊鏈+隱私計算方法,整合訂單、發(fā)票、物流和資金流等數(shù)據(jù),來發(fā)現(xiàn)有無造假。
第六是數(shù)據(jù)的安全性。數(shù)據(jù)是生產(chǎn)要素,因此要使用加密手段防止數(shù)據(jù)被竊取或者濫用。但加密在保障安全性的同時,也會帶來其他的安全問題,比如黑客可以利用勒索軟件對數(shù)據(jù)進行二次加密。因此需要實時對數(shù)據(jù)進行審計與版本核對,防止被惡意再加密而被控或被勒索。
另一方面,盡管傳統(tǒng)加密技術(shù)能夠大幅提升數(shù)據(jù)的安全性,但也在一定程度上阻礙了數(shù)據(jù)的流轉(zhuǎn)和融合。比如兩家企業(yè)都希望利用對方的數(shù)據(jù),但同時都不愿意把自己原始數(shù)據(jù)交給對方,此時可以利用多方計算技術(shù),允許各參與方只提交密文分片的前提下,通過既定邏輯共同計算出結(jié)果,但不透露各自數(shù)據(jù)。
第七是數(shù)據(jù)的資產(chǎn)性。數(shù)據(jù)是生產(chǎn)要素,需要從數(shù)據(jù)采集、數(shù)據(jù)開發(fā)利用、數(shù)據(jù)鑒權(quán)、數(shù)據(jù)應用等全生命周期去保證數(shù)據(jù)資產(chǎn)的安全性。鄔賀銓強調(diào),在所有環(huán)節(jié)中,特別注意元數(shù)據(jù)的管理、開發(fā)過程的管理、流通過程的管理和運維過程的管理,這些過程需要采用相應的安全技術(shù)支持資產(chǎn)安全管理。
第八是數(shù)據(jù)的歸屬性。毋庸置疑的是,數(shù)據(jù)本身是有歸屬權(quán)的,包括持有權(quán)、使用權(quán)、經(jīng)營權(quán),關系到數(shù)據(jù)使用的安全性和合法性。對一個國家而言,數(shù)據(jù)有主權(quán)的含義,因為涉及到國家安全以及社會經(jīng)濟發(fā)展的重要內(nèi)容,每個國家對自己的數(shù)據(jù)有對外的獨立自主權(quán),以及國際事務的參與決策權(quán)。
對個人而言,個人的身份、家庭、經(jīng)濟狀況、興趣偏好,以及人臉、指紋、DNA等等生物特征等關鍵敏感數(shù)據(jù),要堅持非必要不能收集原則。即便在個人同意收集使用的前提下,也不意味著個人對數(shù)據(jù)所有權(quán)被轉(zhuǎn)讓,使用后應及時刪除。
不過,不同于傳統(tǒng)資產(chǎn)的是,數(shù)據(jù)是可復制的,數(shù)據(jù)使用也基本上可以不留痕跡,這為數(shù)據(jù)的歸屬確權(quán)帶來了很大的困難。
第九是數(shù)據(jù)的開放性。鄔賀銓認為,原則上不涉及國家安全、企業(yè)秘密和個人隱私的政務數(shù)據(jù),都應該向社會開放,才能發(fā)揮更大的價值。但政務數(shù)據(jù)開放要特別注意個人身份識別和地理位置等隱私保護,在大數(shù)據(jù)技術(shù)日益發(fā)達的今天,通過混合不同數(shù)據(jù)集進行關聯(lián)分析,可以間接地追蹤到個人工作生活等隱私,因此需要進行匿名化等脫敏處理。
鄔賀銓強調(diào),數(shù)據(jù)是重要的生產(chǎn)要素,它的安全性不僅關乎國家安全、國民經(jīng)濟、社會穩(wěn)定,還跟企業(yè)的商業(yè)秘密、個人隱私、財產(chǎn)安全密切相關。數(shù)據(jù)安全不僅是技術(shù)問題,還涉及法律、政策、管理、人才、倫理等方面,要面對更多的新挑戰(zhàn),需要在實踐中加深認識,加大研究創(chuàng)新力度。