奧運(yùn)AI手語(yǔ)主播、虛擬偶像、換臉明星……這些應(yīng)用背后的深度合成技術(shù)發(fā)展到了什么階段?大火的“元宇宙”和深度合成的關(guān)系是什么?深度合成監(jiān)管面臨怎樣的技術(shù)和倫理難題?
2月18日,在北京舉辦的第二次長(zhǎng)城工程科技會(huì)議“人工智能的安全可控與倫理治理”分論壇上,《深度合成應(yīng)用十大趨勢(shì)報(bào)告》(2022)發(fā)布。圍繞深度合成帶來(lái)的倫理問(wèn)題,多位專家在會(huì)上進(jìn)行了探討。
1
深度合成內(nèi)容高速增長(zhǎng),相關(guān)研究不斷升級(jí)
深度合成技術(shù),是指利用以深度學(xué)習(xí)、虛擬現(xiàn)實(shí)為代表的生成合成類算法制作文本、圖像、音頻、視頻、虛擬場(chǎng)景等信息的技術(shù)。2017年,一位名叫“Deepfakes”的用戶在美國(guó)Reddit網(wǎng)站上分享了篡改人臉的色情視頻,將深度合成技術(shù)帶到了大眾面前。
《報(bào)告》顯示,近幾年,深度合成內(nèi)容制作和傳播數(shù)量高速增長(zhǎng)。2021年新發(fā)布的深度合成視頻的數(shù)量,較2017年已增長(zhǎng)10倍以上。此外,深度合成內(nèi)容關(guān)注度也呈指數(shù)級(jí)增長(zhǎng),以視頻的點(diǎn)贊/喜歡數(shù)據(jù)為例進(jìn)行統(tǒng)計(jì),2021年新發(fā)布的深度合成視頻的點(diǎn)贊數(shù)已超過(guò)6億。
數(shù)據(jù)說(shuō)明:在10家國(guó)內(nèi)外平臺(tái)中(愛(ài)奇藝、騰訊視頻、優(yōu)酷、嗶哩嗶哩、抖音、快手、微博、YouTube、 Twitter、TikTok),以“Deepfakes”等10個(gè)中英文關(guān)鍵詞進(jìn)行檢索,并通過(guò)URL去重后,統(tǒng)計(jì)出數(shù)據(jù)結(jié)果。圖自《深度合成應(yīng)用十大趨勢(shì)報(bào)告》(2022)
研究成果是深度合成內(nèi)容傳播的底層推動(dòng)力。其中,蒙特利爾大學(xué)在2014年提出了生成對(duì)抗網(wǎng)絡(luò)(GAN),將數(shù)據(jù)的逼真度推到了一個(gè)新的高度,大大降低了深度合成的門檻。《報(bào)告》顯示,每年深度合成領(lǐng)域的論文數(shù)量正持續(xù)增長(zhǎng)。這些深度合成領(lǐng)域的論文,包含對(duì)圖像、語(yǔ)音、文本等不同模態(tài)的合成方面的技術(shù)研究,其中,對(duì)圖像生成的研究占比最高,為64%。音頻和文本分別占24%和12%。
論文研究之外,深度合成領(lǐng)域開源項(xiàng)目也呈持續(xù)攀升的趨勢(shì)。開源項(xiàng)目促進(jìn)了深度合成方法在合成質(zhì)量、制作效率等方面不斷升級(jí)和迭代。
在應(yīng)用場(chǎng)景方面,《報(bào)告》顯示,深度合成的應(yīng)用場(chǎng)景不斷豐富,如修復(fù)歷史照片、AI手語(yǔ)主播、虛擬偶像等應(yīng)用。特別是在影視制作領(lǐng)域,近些年來(lái),深度合成技術(shù)已成為受少數(shù)藝人劣跡行為拖累作品的救場(chǎng)工具。
此外,越來(lái)越多的企業(yè)機(jī)構(gòu)開始利用深度合成技術(shù)提供面向公眾的產(chǎn)品和服務(wù)。不同領(lǐng)域的情況有所差異,《報(bào)告》顯示,圖像和視頻在深度合成應(yīng)用的初期應(yīng)用最為普遍,但是由于產(chǎn)品質(zhì)量良莠不齊且容易侵犯用戶隱私,當(dāng)監(jiān)管規(guī)范到位后其數(shù)量逐漸減少。音頻方面,語(yǔ)音合成已經(jīng)成為人機(jī)交互的重要一環(huán),且被廣泛應(yīng)用于智能硬件、智能客服、語(yǔ)音導(dǎo)航、有聲讀物、機(jī)器人、語(yǔ)音助手、自動(dòng)新聞播報(bào)等場(chǎng)景。文本方面,深度合成在新聞報(bào)道、詩(shī)文創(chuàng)作、聊天問(wèn)答等方面都得到越來(lái)越多的應(yīng)用,并顯現(xiàn)出巨大的創(chuàng)作效率和未來(lái)潛力。
《報(bào)告》預(yù)測(cè),伴隨著自動(dòng)數(shù)據(jù)生成、全身合成、3D塑型等技術(shù)的逐漸成型,一個(gè)新的人類生存場(chǎng)景將以深度合成技術(shù)為基石展開。元宇宙就是基于深度合成技術(shù)打造的未來(lái)人類虛擬數(shù)字空間,它“完成了對(duì)現(xiàn)實(shí)空間和時(shí)間的多重復(fù)制和延伸,跳脫了傳統(tǒng)物理空間的局限,提供了一個(gè)虛擬人、自然人和機(jī)器人融生的逼近現(xiàn)實(shí)且超越現(xiàn)實(shí)的新世界”。
2
深度合成負(fù)面風(fēng)險(xiǎn)加劇,各國(guó)監(jiān)管成趨勢(shì)
《報(bào)告》認(rèn)為,在深度合成技術(shù)向社會(huì)生活的各個(gè)領(lǐng)域滲透之時(shí),深度合成內(nèi)容負(fù)面風(fēng)險(xiǎn)持續(xù)加劇且產(chǎn)生實(shí)質(zhì)危害。隨著深度合成技術(shù)的開放開源、深度合成產(chǎn)品和服務(wù)的增多,深度合成內(nèi)容制作的技術(shù)門檻越來(lái)越低,實(shí)現(xiàn)了技術(shù)的“平民化”。通過(guò)深度合成技術(shù)制造虛假視頻、虛假音頻進(jìn)行誣陷、誹謗、詐騙、勒索等違法行為已屢見(jiàn)不鮮。
深度合成技術(shù)還將對(duì)信息傳播產(chǎn)生更為深遠(yuǎn)的影響。《報(bào)告》分析,人類的傳播活動(dòng),因深度合成技術(shù)逐漸步入“深度后真相”時(shí)代。首先, “深度偽造”深刻影響了新聞對(duì)真相的記錄,對(duì)虛假內(nèi)容高難度的甄別影響了事實(shí)核查的有效性。其次,在社會(huì)重大突發(fā)事件或政治事件節(jié)點(diǎn)上,深度合成技術(shù)如若被惡意使用,將會(huì)借助社交媒體,使虛假信息在互聯(lián)網(wǎng)上產(chǎn)生病毒式的擴(kuò)散和蔓延。第三,在日常事件的信息發(fā)布與追蹤中,深度偽造的信息還會(huì)造成輿論場(chǎng)中輿論意見(jiàn)的不斷翻轉(zhuǎn),激化社會(huì)不同群體的矛盾。亟需警惕的是,深度合成技術(shù)的惡意偽造內(nèi)容通常迎合大眾獵奇心理,具有極強(qiáng)的意識(shí)塑造能力。
《報(bào)告》還指出,深度合成內(nèi)容的鑒別正面臨技術(shù)挑戰(zhàn)。新型偽造方法的層出不窮,加上基于深度神經(jīng)網(wǎng)絡(luò)的檢測(cè)算法存在結(jié)構(gòu)性缺陷等,反深偽檢測(cè)技術(shù)也面臨“強(qiáng)對(duì)抗性”,需要持續(xù)更新與迭代優(yōu)化。這類似于“貓鼠游戲”,深度合成和檢測(cè)在不斷學(xué)習(xí)攻防過(guò)程中會(huì)自我進(jìn)化,規(guī)避上一代的對(duì)抗技術(shù)。目前,學(xué)術(shù)界和產(chǎn)業(yè)界均已對(duì)鑒別檢測(cè)技術(shù)的研發(fā)進(jìn)行了大量投入,國(guó)內(nèi)外多個(gè)科研機(jī)構(gòu)和科技企業(yè)推出了檢測(cè)產(chǎn)品。
隨著深度合成的負(fù)面影響顯現(xiàn),世界各國(guó)監(jiān)管機(jī)制的建立也成為一個(gè)趨勢(shì)。歐盟傾向于將深度合成納入既有法律框架進(jìn)行規(guī)制;在美國(guó),已有一些州通過(guò)了正式法律,對(duì)“深度偽造”進(jìn)行規(guī)制,如加利福尼亞州、弗吉尼亞州和德克薩斯州;新加坡也出臺(tái)了專門法案明確主體、平臺(tái)責(zé)任;我國(guó)在2021年1月發(fā)布的《網(wǎng)絡(luò)音視頻服務(wù)管理規(guī)定》專門提到了不得利用深度學(xué)習(xí)技術(shù)制作并傳播虛假新聞信息,今年1月,國(guó)家網(wǎng)信辦發(fā)布了《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定(征求意見(jiàn)稿)》,是一份具有系統(tǒng)性、針對(duì)性和可操作性的專門管理規(guī)定。
3
專家:未來(lái)一切有價(jià)值的東西都可能被偽造
面對(duì)當(dāng)前的挑戰(zhàn),如何規(guī)范深度合成技術(shù)應(yīng)用、減輕技術(shù)帶來(lái)的負(fù)面影響?多位專家從倫理和治理的角度表達(dá)了自己的看法。
阿里巴巴安全感知與認(rèn)知智能部負(fù)責(zé)人薛輝認(rèn)為,難點(diǎn)主要有兩方面,一是因?yàn)樯疃群铣杉夹g(shù)有很大的商業(yè)價(jià)值,因此不能一刀切地禁止,而是要采取“包容審慎”的態(tài)度,但怎么確定監(jiān)管的邊界,這是一個(gè)問(wèn)題。另一個(gè)問(wèn)題在于,深度合成面臨持續(xù)的攻防和博弈,而攻防中往往攻擊方找到了一個(gè)點(diǎn)就能突破,但防御卻是相對(duì)落后的。
中國(guó)科學(xué)院自動(dòng)化研究所研究員陶建華指出,目前,深度合成概念的內(nèi)涵和外延并不清晰,造成監(jiān)管上的困難?!笆遣皇怯蒙疃葘W(xué)習(xí)方法得到的就叫深度合成?我覺(jué)得這值得商榷?!?/p>
此外,他認(rèn)為,應(yīng)該更有效地管理深度合成的使用者,而不是過(guò)多地約束它的研發(fā)者。人工智能的大量技術(shù)是有兩面性的,他把技術(shù)比較刀,技術(shù)的影響取決于如何使用它。最早從事深度合成相關(guān)研究的人,很多人的動(dòng)機(jī)是娛樂(lè)、改善人的生活,比如,有人想能不能讓機(jī)器自主學(xué)習(xí)媽媽的聲音,給嬰兒做朗讀,這是改善生活的方式。但也不排除一些惡意的攻擊工具。因此,對(duì)技術(shù)的監(jiān)管還是應(yīng)當(dāng)采用開放的方式。
浙江大學(xué)網(wǎng)絡(luò)空間安全學(xué)院院長(zhǎng)任奎提出了數(shù)據(jù)集不足的問(wèn)題。他介紹,當(dāng)前的深度合成技術(shù)主要還是針對(duì)人,因此訓(xùn)練深度合成檢測(cè)模型需要大量人臉數(shù)據(jù),但是人臉數(shù)據(jù)和音頻數(shù)據(jù)都是高度敏感的個(gè)人信息,這部分?jǐn)?shù)據(jù)很難獲取。他建議公信力比較高的非營(yíng)利性機(jī)構(gòu)能夠把數(shù)據(jù)梳理出來(lái),讓合格的研究機(jī)構(gòu)一起參與,這樣能夠把數(shù)據(jù)的價(jià)值最大化發(fā)揮出來(lái),“用在正面的方向”。
不過(guò),未來(lái)的深度合成場(chǎng)景可能會(huì)更加復(fù)雜。在他看來(lái),深度合成在未來(lái)不僅僅停留在簡(jiǎn)單的音頻、圖像和視頻,而是會(huì)用于各種各樣的偽造,而且不僅限于數(shù)字空間的偽造,在物理空間的偽造可能更加有欺騙性和致命性?!皬年P(guān)鍵場(chǎng)景來(lái)看,比如說(shuō)自動(dòng)駕駛,在這里我可能偽造一個(gè)場(chǎng)景,這個(gè)場(chǎng)景可能是數(shù)字的,也有可能是跟物理世界融合的方式。如果我們考慮更遠(yuǎn)一點(diǎn),比如元宇宙的概念,不見(jiàn)得是偽造關(guān)于人的信息,一切有價(jià)值的東西都可能被偽造,這里深度合成可能有非常多的想象空間和利用、攻擊的空間?!?/p>
北京瑞萊智慧科技有限公司首席執(zhí)行官田天認(rèn)為,深度偽造的本質(zhì)問(wèn)題是透明度不足。在這項(xiàng)技術(shù)中,傳統(tǒng)的“眼見(jiàn)為實(shí)”受到了沖擊,因此,提高人們對(duì)深度合成技術(shù)的認(rèn)知尤為重要?!皩?duì)于普通觀眾來(lái)說(shuō),需要降低問(wèn)題的門檻,認(rèn)識(shí)到什么是深度合成,或者有簡(jiǎn)單的工具判斷它是合成的。只有把門檻降低到所有的受眾能夠在共同的框架下認(rèn)識(shí)、討論、理解這個(gè)問(wèn)題的時(shí)候,它才有可能是比較健康、良性的發(fā)展,它的應(yīng)用才可能更大范圍地拓展?!彼f(shuō)。
采寫:南都記者李婭寧
關(guān)鍵詞: 深度合成應(yīng)用趨勢(shì)報(bào)告發(fā)布 專家未來(lái)一切都可能被偽造