作為人工智能行業(yè)的領(lǐng)域之一,深度合成的重要性正在滲透進生活的方方面面。
無論是視頻換臉、語音合成,或是影像修復以及最近因元宇宙大火的虛擬數(shù)字人,其背后均是深度合成技術(shù)在發(fā)揮作用。在當下,深度合成正愈發(fā)頻繁地出現(xiàn)在社交娛樂、影視制作等領(lǐng)域,并發(fā)展出多元化的數(shù)字應用。
從內(nèi)容量而言,深度合成行業(yè)應用也在迎來跳躍發(fā)展。
近日清華大學人工智能研究院、國家工業(yè)信息安全發(fā)展研究中心等機構(gòu)聯(lián)合發(fā)布的《深度合成十大趨勢報告(2022)》(以下簡稱《報告》)顯示,互聯(lián)網(wǎng)中深度合成視頻的新增發(fā)布量從2017年的1680個飆升至2021年的24317個,互聯(lián)網(wǎng)中深度合成視頻的點贊/喜歡數(shù)量也從2017年的249.74萬次,躍至2021年的3.16億次。
在行業(yè)蓬勃發(fā)展的過程中,行業(yè)相關(guān)的合規(guī)步伐也在提速。3月1日,由國家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部、國家市場監(jiān)督管理總局聯(lián)合頒布的《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》正式施行,其中明確要求不得生成合成虛假新聞信息。
而就在2022年1月28日,國家互聯(lián)網(wǎng)信息辦公室還頒布《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定(征求意見稿)》,旨在促進深度合成技術(shù)依法合理、有效利用,規(guī)范發(fā)展互聯(lián)網(wǎng)信息服務深度合成活動。
在接受包括21世紀經(jīng)濟報道在內(nèi)的媒體采訪時,中國社會科學院哲學所研究員、科學技術(shù)哲學研究室主任段偉文表示,深度合成技術(shù)涉及認知安全,所以要提升社會認知安全意識,提升公眾的數(shù)字素養(yǎng)。與此同時,政府部門、企業(yè)及各界需要積極開展相關(guān)法律倫理、治理的對話與規(guī)范制定,從而實現(xiàn)創(chuàng)新與治理間的動態(tài)平衡。
應用提速
面部替換、表情操縱、語音合成……伴隨技術(shù)的發(fā)展成熟,當前互聯(lián)網(wǎng)上出現(xiàn)了越來越多的深度合成內(nèi)容。
《報告》顯示,根據(jù)不完全統(tǒng)計,創(chuàng)作者在互聯(lián)網(wǎng)平臺中發(fā)布的深度合成內(nèi)容數(shù)量,正在呈現(xiàn)高速增長。以視頻為例,2021年新發(fā)布的深度合成視頻數(shù)量,較2017年已增長10倍以上。
不僅是內(nèi)容量本身暴增,深度合成的內(nèi)容關(guān)注度也在呈現(xiàn)指數(shù)級增長?!秷蟾妗分赋觯砸曨l的“點贊/喜歡”數(shù)據(jù)為例,自2017年以來,該項數(shù)據(jù)呈現(xiàn)出指數(shù)級的顯著增長,2021年新發(fā)布的深度合成視頻點贊數(shù)已超過3億。
此外,《報告》選取超過4000條深度合成視頻的互動視頻,并分析“播放量、點贊/喜歡數(shù)、收藏數(shù)、轉(zhuǎn)發(fā)數(shù)、評論數(shù)”幾項互動數(shù)據(jù)之間的關(guān)系后發(fā)現(xiàn),平均每1000次播放,可產(chǎn)生約8.92次點贊/喜歡,同時會產(chǎn)生約3.51次轉(zhuǎn)發(fā),從而將深度合成內(nèi)容進行新一輪傳播。
除了內(nèi)容層面之外,在技術(shù)層,深度合成領(lǐng)域同樣飛速發(fā)展。《報告》顯示,2021年深度合成領(lǐng)域的論文發(fā)表數(shù)量達到4559篇,相較2017年的1012篇大幅提升。在這些深度合成領(lǐng)域的論文中,包含對圖像、視頻、音頻、文本等不同模態(tài)合成方面的技術(shù)研究,其中針對圖像類生成模型的研究占比高達64%。
與此同時,自2017年以來,深度合成領(lǐng)域的開源項目發(fā)布數(shù)量也在逐年提升。到2021年,在GitHub中,與“GAN”等16個關(guān)鍵詞相關(guān)的開源項目發(fā)布量已達到23030個,相較2017年的8250個增長179%。深度合成在開源社區(qū)中持續(xù)走高的熱度,也將繼續(xù)推動該技術(shù)的發(fā)展與在產(chǎn)業(yè)中的落地。
事實上,當前深度合成的應用場景已經(jīng)在持續(xù)豐富,無論是手語AI生成主播、虛擬偶像或是修復老照片、AI換臉等,隨著技術(shù)成熟度的持續(xù)提升,深度合成正在快速進入大眾視野,越來越多的企業(yè)機構(gòu)也開始利用深度合成技術(shù),提供面向公眾的產(chǎn)品和服務。
這也很大程度上降低了深度合成的門檻。瑞萊智慧CEO田天介紹稱,以自去年下半年開始大熱的虛擬數(shù)字人為例,如果沒有深度合成技術(shù),虛擬形象的成本非常高昂,且需要極強的專業(yè)性?!暗谏疃群铣杉夹g(shù),可以通過AI自動學習來降低成本及門檻,從而令更多人參與到內(nèi)容生成中,并促進數(shù)字空間的發(fā)展?!?/p>
合規(guī)治理
隨著深度合成行業(yè)持續(xù)發(fā)展,內(nèi)容制作的技術(shù)門檻持續(xù)降低甚至實現(xiàn)技術(shù)“平民化”,相關(guān)的內(nèi)容風險也在持續(xù)加劇。
事實上,通過深度合成技術(shù)制造虛假視頻、虛假音頻進行誣陷、誹謗、詐騙等違法行為和事例已屢見不鮮,深度偽造內(nèi)容數(shù)量持續(xù)增多、危害性不斷增強,因此,深度合成行業(yè)治理也是亟待解決的問題。
“目前深度合成的鑒別需求在快速增長,但鑒別難度也在快速提升?!碧锾煜?1世紀經(jīng)濟報道記者坦言道,行業(yè)挑戰(zhàn)主要體現(xiàn)在深度合成逼真度正在快速提升,甚至很難分辨真?zhèn)芜吔纾送庾钚碌纳疃葌卧旒夹g(shù)具備強對抗性,天然針對檢測方法進行對抗攻擊,從而使檢測方法失效。
而為了促進深度偽造檢測技術(shù)的發(fā)展,國內(nèi)外已發(fā)布專項研究計劃及開展相關(guān)學術(shù)競賽。目前,學術(shù)界和產(chǎn)業(yè)界均已對深度合成鑒別檢測技術(shù)的研發(fā)進行了大量投入,包括Meta、谷歌、微軟等機構(gòu)均推出視頻認證的方法或產(chǎn)品,在國內(nèi)包括清華大學、中科大等機構(gòu)及企業(yè)也已構(gòu)建人臉合成檢測平臺并發(fā)布針對性檢測產(chǎn)品。
從監(jiān)管機制而言,國內(nèi)外也在持續(xù)探索。早在2018年,美國便提出《2018年惡意偽造禁令法案》,2019年又繼續(xù)發(fā)布《深度偽造責任法案》,持續(xù)重拳出擊深度偽造行為。歐盟同樣自2018年開始陸續(xù)推出《應用線上虛假信息:歐洲方案》《通用數(shù)據(jù)保護條例(GDPR)》《反虛假信息行為準則》等,打擊深度偽造相關(guān)違法違規(guī)行為。
我國也在積極探尋建設有效治理機制。自2019年以來,包括《網(wǎng)絡音視頻信息服務管理規(guī)定》《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》等均對深度合成違法違規(guī)行為進行了約束,今年1月更是頒布《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定(征求意見稿)》,從而形成深度合成領(lǐng)域系統(tǒng)性、針對性和可操作性的專門管理規(guī)定。
段偉文指出,深度合成的穩(wěn)健治理需要多措并舉,不僅需要技術(shù)管理也需要內(nèi)容管理,同時需要提升社會整體認知和安全意識。此外,行業(yè)內(nèi)還需要形成具有預見性、穩(wěn)健的治理框架。
“現(xiàn)在行業(yè)希望政府或相關(guān)部門及各界積極開展有關(guān)法律倫理、治理上的對話,相關(guān)規(guī)范的制定,以及實踐的推廣,這些都是為了實現(xiàn)在創(chuàng)新和治理之間的動態(tài)平衡,實施敏捷、穩(wěn)健的治理,從而令科技更好地服務數(shù)字化轉(zhuǎn)型等。”段偉文說。
關(guān)鍵詞: 深度合成應用提速 行業(yè)治理需多方合力