這兩天,百度網(wǎng)盤的瓜,大家吃了嗎?
有一位可能是入職百度網(wǎng)盤審核崗的網(wǎng)友爆料,百度網(wǎng)盤的照片是人工審核,并且審核人員還能隨意把用戶的照片截下來保存發(fā)到網(wǎng)上。
還能這么玩?
(資料圖片僅供參考)
那黑馬保存在網(wǎng)盤里的照片,豈不是被看到了?照片都能看到,會不會找黑馬要聯(lián)系方式?
正當黑馬胡思亂想的時候,百度網(wǎng)盤發(fā)了一條公告:
百度網(wǎng)盤不存在所謂的照片人工審核,網(wǎng)絡(luò)上關(guān)于百度網(wǎng)盤照片真人審核的內(nèi)容是謠言。
總而言之,此事完全是子虛烏有。
公告是發(fā)了,但黑馬看到一些網(wǎng)友似乎不太相信。
這也難怪,百度網(wǎng)盤信息泄露這事,也不是一回兩回了,但人工審核用戶上傳照片,還是有點駭人聽聞。
那么網(wǎng)盤有沒有必要人工審核照片?
先說大多數(shù)情況下,網(wǎng)盤一般不需要人工審核,大家可以想一下,網(wǎng)盤的用戶數(shù)量,每天那么多用戶上傳下載和分享文件,如果主要靠人工審核,這工作量實在很大。
當然,文件還是要審核的,有違規(guī)的信息,該屏蔽還是要屏蔽,該刪除還是要刪除。
網(wǎng)盤是怎么檢測違規(guī)文件的?
大致有這么幾種檢測方式:
最簡單的就是建立一個搜索關(guān)鍵詞庫,網(wǎng)羅違規(guī)關(guān)鍵詞,一旦機器檢測到違規(guī)詞,可以立馬屏蔽。
不過這種檢測方式,難免會有漏網(wǎng)之魚。
所以我們就給文件們建立了一個身份檔案庫。
就像是我們每個人的指紋都是我們獨一無二的特征一樣,文件也有自己獨一無二的特征,而這個特征是MD5,可以簡單理解成一個文件的特有數(shù)字信息。
(圖源:百度百科)
通過建立文件的MD5數(shù)據(jù)庫,用戶上傳文件后自動分析文件特征是否存在違規(guī),避免違規(guī)的文件重復(fù)傳播。
在去年Meta 公司推出了一個據(jù)說開發(fā)了4年的鑒黃工具,也差不多類似的原理,通過提取照片的數(shù)字指紋,將指紋共享到社交平臺上,檢測是否有人分享這些涉黃照片。
不過最初的版本,在搜集照片的數(shù)字指紋時,是靠人工審核的,直到去年這個工作才交給AI來做。
別擔(dān)心,目前的網(wǎng)盤對文件指紋特征的識別一般也是通過AI識別的。
對于視頻文件,一般網(wǎng)盤都能自動截取視頻縮略圖,提取圖片中特征元素,根據(jù)元素判斷圖像類別并與違規(guī)數(shù)據(jù)庫進行比對判定是否違規(guī)。
以上的這些審核,一般來說都是有AI進行,在識別審核完成后,系統(tǒng)也會擦除審核過程中所記錄的數(shù)據(jù),防止信息泄露。
但是任何機器審核,都無法做到百分百過濾違規(guī)信息,勢必需要人工審核。
隨便在各大招聘平臺上搜索,也都能找到互聯(lián)網(wǎng)公司招聘的人工審核崗位。
百度網(wǎng)盤需要人工審核,這并不奇怪,但審核的范圍界限在哪里?這就不得而知了。
總而言之,我們上傳的文件,一般情況下,都不會經(jīng)過人工,AI足以應(yīng)對大多數(shù)的審核。
至于有沒有特殊情況,那就視情況而定了。
最好的辦法就是敏感的個人信息,盡可能不要上傳到云端上。
還有分享的文件,務(wù)必選擇加密方式分享,也就是需要密碼才能獲取文件,如果是選擇沒有密碼的公共分享,分享的文件是可以被網(wǎng)絡(luò)爬蟲檢測到的。
總而言之,在這個大數(shù)據(jù)時代,絕對的安全是沒有的,黑馬覺得如果不是什么太隱私的信息,該怎么保存到網(wǎng)盤還是怎么保存到網(wǎng)盤。
過于擔(dān)心隱私問題,反而會失去便利性。
當然,對于網(wǎng)盤運營者來說,用戶的數(shù)據(jù)安全還是要放在第一位的。
我可以接受“小姐姐”突然消失,但我的正當合法數(shù)據(jù),總不能也消失吧?甚至是曝露在大眾視野中。
關(guān)鍵詞: 傳網(wǎng)盤照片人工審核你存里面的秘密 藏不住了