熱門看點:AI模仿齊白石畫“鋼鐵蝦”,版權(quán)歸誰,算抄襲嗎?

發(fā)布時間:2022-11-26 12:31:28  |  來源:騰訊網(wǎng)  

丨劃重點

1人類現(xiàn)在能創(chuàng)作的內(nèi)容,AI都可以有所助力。這一波AI的最新進(jìn)展在于,過去AI偏科,分得很細(xì),現(xiàn)在通用能力更強2AIGC界面表面上好像有點像搜索,但底層原理完全不同,有很大的創(chuàng)造成分存在,基于數(shù)據(jù)收集、算法計算可創(chuàng)作出獨一無二作品,甚至能模仿大師風(fēng)格,畫出“機(jī)械蝦”3傳統(tǒng)創(chuàng)作者需要擁抱新技術(shù)變革,AIGC本身的意義是“解放人類”而非“替代人類”,會賦予更多普通人強大的創(chuàng)作能力,不是簡單的“搶飯碗”4AIGC作品著作權(quán)歸屬現(xiàn)階段尚無明確定論,平臺一般不會聲明版權(quán),但也不建議創(chuàng)作者利用AIGC內(nèi)容進(jìn)行商業(yè)化

丨概述


(資料圖片)

2022,AIGC(人工智能產(chǎn)生內(nèi)容)爆火并迅速出圈,在PGC(專業(yè)人員產(chǎn)生內(nèi)容)、UGC(用戶產(chǎn)生內(nèi)容)之后成為生產(chǎn)內(nèi)容的新方式。

這一趨勢是由OpenAI、DeepMind和智源等優(yōu)秀的科研機(jī)構(gòu)引領(lǐng)的,巨頭也積極下場搶占風(fēng)口,包括谷歌、Meta、微軟等知名科技公司先后布局,當(dāng)然業(yè)內(nèi)也不乏AIGC的新晉獨角獸Stability AI、Jasper、MidJourney 加速搶占制高點。

但AIGC“光鮮亮麗”的背后也隱藏著許多問題,諸如版權(quán)、創(chuàng)意等等目前都并沒有得到有效的解決,AIGC是否真的會從人類手中“搶飯碗”,商業(yè)化的持續(xù)探索又該何去何從?

AIGC在今年快速走紅這個現(xiàn)象,智源研究院運營副院長劉江認(rèn)為這離不開AI“大模型”(是指基于大規(guī)模算力,使用大規(guī)模數(shù)據(jù)訓(xùn)練而得到的新一代規(guī)模巨大的人工智能模型,可以用于廣泛的應(yīng)用場景)的快速發(fā)展。

關(guān)于AI內(nèi)容生產(chǎn)對PGC和UGC等傳統(tǒng)內(nèi)容生成形式的沖擊,智源研究院NLP/多模態(tài)模型研究負(fù)責(zé)人伍昱認(rèn)為AIGC的目的是幫助創(chuàng)作者從重復(fù)性、比較枯燥的勞動中解放出來,與現(xiàn)存的創(chuàng)作形式并不存在沖突,創(chuàng)作者應(yīng)該更多的學(xué)習(xí)、利用AIGC的技術(shù)。

智源創(chuàng)新應(yīng)用實驗室負(fù)責(zé)人黃文灝則認(rèn)為未來AIGC的發(fā)展始終需要保持開放開源的態(tài)度,要重視產(chǎn)品形態(tài)的設(shè)計以及對UX(用戶體驗)的把握,讓AI繪畫不只是一個茶余飯后的消遣,而是成為一種剛需。

01

基于通用大模型,AIGC可以打90分

劉興亮:AIGC到底是什么,它有什么作用?

劉江:AIGC英文是AI-Generated Content(AI生成內(nèi)容),Content不僅僅包含繪畫,還有文字、音樂等等。

文字方面代表的平臺是美國研究機(jī)構(gòu)OpenAI的GPT-3,智源研究院在這方面的悟道模型也是比較領(lǐng)先的。只需一段文字提示(類似高考作文題或者一個開頭),AI系統(tǒng)就可以寫一篇作文,甚至長篇大論。

往下繼續(xù)延伸,AIGC還可以生成代碼(也是一種文字),如今已經(jīng)出現(xiàn)比較成熟的商業(yè)化平臺可以幫助廣大程序員寫代碼。智源也在從事音樂和視頻生成模型的研究。

在我看來,人類所能想象到的東西,AI都有可能實現(xiàn),至少能幫助人更好更快地實現(xiàn)。未來會賦予更多普通人強大的創(chuàng)作能力。

最近AIGC為什么火了呢,因為確實效果太好了。利用AI或編程進(jìn)行內(nèi)容生成,之前其實有很長的歷史,但效果不能滿足大多數(shù)人的需求。這次為什么生成的效果這么驚人?這離不開這幾年AI領(lǐng)域的最新進(jìn)展——我們稱之為“大模型”。

大家可能不知道,之前AI都是非常偏科的,每個系統(tǒng)只會干很專門的事情,分得非常細(xì)。多細(xì)呢?搞文字和搞語音、音樂、圖片視頻的是好幾波人,都有自己的技術(shù)和工具,搞的是不同的系統(tǒng)。甚至搞圖片的也要分成分類、目標(biāo)檢測、分割、生成等很多小任務(wù),都是不同的。有點像高考,有系統(tǒng)會做數(shù)學(xué)卷子,但不會語文、英語、物理、化學(xué),反過來也一樣。甚至語文卷子里,會做填空題的不會做選擇題,會做閱讀題的不會做作文題。所以AI總體發(fā)展還是挺難的。

而近幾年“大模型”出現(xiàn)之后,原來分得很細(xì)的AI科研人員和AI系統(tǒng),有了共同的基礎(chǔ)技術(shù),開始往通用的方向發(fā)展了?,F(xiàn)在智源研究院的科研團(tuán)隊,原來搞文字的和搞圖片的已經(jīng)開始打通,可以有廣泛合作了。

智源研究院旗下免費AIGC創(chuàng)作平臺FlagStudio

伍昱:過去對不同任務(wù)需求,都是需要不同的方法去求解,大模型或者說預(yù)訓(xùn)練模型,則是嘗試用同一套技術(shù)去解決,然后針對不用的任務(wù)/應(yīng)用場景,進(jìn)行一定程度的微調(diào),在自然語言領(lǐng)域已經(jīng)形成了用預(yù)訓(xùn)練模型這樣一種相對統(tǒng)一的方法去解決不同的問題的范式。

近兩年可能是更大的一個融合,包括像計算機(jī)方向。智源也有團(tuán)隊在研究視覺的大模型,其實在解決問題的技術(shù)和方法上是很接近的,從技術(shù)的發(fā)展上確實看到了不同模態(tài)、不同任務(wù)的統(tǒng)一這樣一種范式的轉(zhuǎn)變。

多模態(tài)的發(fā)展非常迅速,而文字生成視頻近年來爆火,正是多模態(tài)方向的發(fā)展。近一兩年來,從Open AI提出DALLE模型開始,在實現(xiàn)方法上會有一定的區(qū)別——它引入了文字控制,而文字的控制又是從語言大模型發(fā)展過來的。

GPT-3(自然語言處理計算模型)它能夠去做文本的生成,而對于語言的能力轉(zhuǎn)化,我可以通過語言來交互,讓計算機(jī)生成一張圖片,使得它能夠符合我的預(yù)期。同時我的語言其實又可以與計算機(jī)交流,讓它生產(chǎn)代碼,所我的語言變成了一種工具,可以完成更多的事情。

黃文灝:AIGC技術(shù)已有一段時間的發(fā)展歷史,之前就有通過AI完成內(nèi)容生成的案例,但一直沒有引爆話題。

我覺得從產(chǎn)品上來看,最大的問題——之前的質(zhì)量生成內(nèi)容質(zhì)量不符合使用者預(yù)期,可能在60分的水平,但這次AIGC火爆和出圈的原因爆火出圈的原因在于我們擁有了大模型的能力,使得它的模型水平可以從60提高到80-90分。

它肯定不是完美的,和預(yù)期會存在差距,但基本上可以做到以假亂真的地步,而且比大多數(shù)人實際繪畫要好很多,滿足使用者的預(yù)期,得到他們想要的圖片。

所以,我覺得大模型帶來了技術(shù)或者模型層面上的一個質(zhì)變,使得更多的產(chǎn)品涌現(xiàn)出來,讓使用者更容易體驗到技術(shù)帶來的優(yōu)勢。

02

齊白石也能畫“鋼鐵蝦”

劉興亮:體驗AIGC后,有時感覺自己是個畫家,有時候感覺這只是另一種形式的搜索,有什么區(qū)別嗎?

劉江:它的界面看上去與搜索很像,也是在一個框里輸入一些文字,就出結(jié)果了。但底層原理其實完全不同,AIGC并不是將預(yù)先生成的很多圖片,根據(jù)搜索詞進(jìn)行匹配調(diào)出。AI是收到文字(其實是一種命令提示)后,再調(diào)用底層模型,把畫計算出來的。

AIGC背后涉及比較復(fù)雜的數(shù)學(xué)、計算算法,基于海量的數(shù)據(jù)。同樣的一條指令,可能不同時間,生成的內(nèi)容卻是不一樣的,它有比較強的隨機(jī)性,看上去是有一定創(chuàng)造能力的(背后的機(jī)理還不完全清楚)。

搜索則是基于已經(jīng)存在庫中的已有圖片,最后呈現(xiàn)的圖片也是數(shù)據(jù)庫中的,只是去找對應(yīng)的圖像,而AI繪畫的前提是,這幅畫本身并不存在。

比如齊白石,算法為什么知道齊白石?因為齊白石的風(fēng)格統(tǒng)一,而且有很多作品,計算機(jī)算法會對現(xiàn)有的作品和風(fēng)格進(jìn)行規(guī)律總結(jié)。你可以命令系統(tǒng)畫出齊白石風(fēng)格的變形金剛、星球大戰(zhàn)等場景,這是大師生前都不知道的事情。當(dāng)然你也可以讓AI畫梵高、畢加索風(fēng)格的中國畫……

AIGC生成的融合齊白石風(fēng)格、金屬元素的“蝦”

伍昱:首先它肯定不完全是搜索,因為它有創(chuàng)造的成分。

搜索的空間是有限的,比如給定的圖片的數(shù)據(jù),只能從固定的數(shù)據(jù)中尋找,如果沒有,就不會出現(xiàn)相應(yīng)的圖片。而AIGC的模型是從大量的數(shù)據(jù)中去學(xué)習(xí)的,首先肯定具有很大的數(shù)據(jù)庫,并且有文字和圖片對應(yīng),AI模型會學(xué)習(xí)文字跟圖片對應(yīng)的概念。

其次AI模型可以從數(shù)據(jù)中掌握規(guī)律,比如蘋果可能是什么樣的,其他的概念是什么樣的,再通過語言的創(chuàng)作來組合不同的元素,結(jié)果則是,圖片原來可能數(shù)據(jù)庫中不存在,但是可以基于給定的條件和規(guī)律生成。

甚至可以去混搭一些概念,比如嘗試不同的風(fēng)格,像齊白石他有自己的繪畫風(fēng)格,但在新概念下,蒸汽朋克風(fēng)、機(jī)械風(fēng)都可以成為可能,我們也能創(chuàng)作一個齊白石畫風(fēng)的機(jī)械蝦。

黃文灝:可以舉兩個例子來回答,第一個就是牛油果椅子。

AI生成的牛油果椅子

上圖是模型生成出來的牛油果椅子,相當(dāng)于模型知道牛油果是什么,也知道椅子是什么,盡管世界上之前是沒有人畫過牛油果椅子或者造出過。AI模型仍然可以進(jìn)行組合,生成既像牛油果又是個椅子的繪畫作品。

這就可以很直接證明,AIGC的內(nèi)容是模型創(chuàng)造出來的,而不是搜索出來的,因為世界上還沒有出現(xiàn)類似的實物。

這樣的例子還有很多,像鏤空的咖啡杯也很火。

第二個很簡單的方法也可以用來驗證AIGC的唯一性,用戶可以拿生成的圖片去百度或者Google,通過以圖搜圖會發(fā)現(xiàn)很多搜索結(jié)果當(dāng)中,與生產(chǎn)的圖片很相似,但卻找不到完全一樣的結(jié)果,這就證明AI具備理解大多數(shù)類似的圖片相同規(guī)律的能力,但它提供的結(jié)果則不完全一樣,足以證明生成的內(nèi)容是它創(chuàng)造出來的。

劉興亮:如果用戶輸入條件完全一模一樣,出現(xiàn)“撞畫”的概率有多少?

伍昱:AI創(chuàng)作模型有很大的隨機(jī)性,普通用戶不用擔(dān)心“撞畫”的情況,這種概率非常小,但如果從專業(yè)的模型研究或者開發(fā)的角度來講,其實是能夠去控制隨機(jī)性的。

開發(fā)者可以通過控制讓算法基于同樣的輸入,得到同樣的結(jié)果輸出,因為整個模型算法的設(shè)計中雖然引入了隨機(jī)性,但可以對隨機(jī)性可以進(jìn)行控制。在用戶接觸到的產(chǎn)品端,往往不會讓用戶來控制這個隨機(jī)性,所以即使相同的文本輸入,用戶的圖片生成結(jié)果也會不一樣。

劉興亮:從數(shù)學(xué)的角度,重復(fù)概率用一個直觀的數(shù)據(jù)來表達(dá)會是多???

黃文灝:AIGC相關(guān)的繪畫工具涉及到很多參數(shù),但如果所有參數(shù)都一樣,也會因為“隨機(jī)種子”這個參數(shù),使得輸出結(jié)果是隨機(jī)的,但考慮到用戶友好的問題,我們會把隨機(jī)種子“藏”起來,用戶在生成時都是默認(rèn)隨機(jī)的狀態(tài)。

這種情況下概率應(yīng)該是二的32次方分之一。

隨機(jī)種子在AIGC應(yīng)用中挺有用處,我們發(fā)現(xiàn)隨機(jī)種子會控制圖片的風(fēng)格,比如通過控制隨機(jī)種子,來控制不同時間生成的圖片的相似度。目前,很多的產(chǎn)品設(shè)計里面都會把隨機(jī)種子固定住,如果隨機(jī)種子固定,其他參數(shù)一致,那兩次生成就會出現(xiàn)同樣的圖片。

03

AIGC是高級版PS,不會搶人類“飯碗”

劉興亮:AIGC生成圖片,哪些行業(yè)可能會受到影響,會搶奪人類“飯碗”嗎,PGC跟UGC創(chuàng)作者應(yīng)該如何應(yīng)對?

劉江:對于所有技術(shù)包括AI的影響,人容易在短期高估,長期低估。這個問題也不是AI獨有的。人類科技不斷進(jìn)步的進(jìn)程中,從最早的機(jī)械化到后來的電氣化、計算機(jī),包括軟件等各種各樣的技術(shù)趨勢,都是在不斷的對我們工作產(chǎn)生巨大的影響。

需要認(rèn)識到的是,科技能把餅做得更大,是人類社會發(fā)展的底層動力,但每個人能否在科技帶來的變革中能分到更多份額,取決于你是否能擁抱科技、擁抱變化。

我給大家的建議是,每個人無論你做什么工作,都要思考一下,自己從事的工作中比較重復(fù)、枯燥類型的成分是不是很多,這類工作本來就不應(yīng)該人來做,而更適合機(jī)器,我認(rèn)為是會逐步被AI的發(fā)展所取代的,但它的進(jìn)程不會那么快。

而工作中需要思考和進(jìn)行復(fù)雜判斷的成分,具有真正創(chuàng)造力的,AI想取代人就很難。比如司機(jī)這個工作,其實大部分人稍加培訓(xùn)都能勝任,看似不難,但由于路況復(fù)雜多變,盡管自動駕駛發(fā)展多年,投入巨大,還遠(yuǎn)沒有對司機(jī)就業(yè)方面產(chǎn)生重大的影響。

另一方面,AIGC等技術(shù)手段首先的目的是幫助提升人類的效率,而不是為了取代人。所以從業(yè)者要減少重復(fù)性工作,積極學(xué)習(xí)新知識、新技能和新工具,擁抱變化,以開放的心態(tài),享受AI技術(shù)發(fā)展所帶來的好處。

伍昱:AIGC技術(shù)的發(fā)展,更多的是能夠消除重復(fù)的勞動,幫助創(chuàng)作者更好的去創(chuàng)作,將創(chuàng)作者從重復(fù)的勞動中解放出來,更專注于創(chuàng)作的本身,更好的去表達(dá)內(nèi)容。

有人認(rèn)為,AIGC可能是下一代更加高級的PS,能更方便的進(jìn)行圖片編輯與創(chuàng)造。

AI工具降低了創(chuàng)作的門檻,比如以前繪畫這項工作,必須接受長期的訓(xùn)練,那通過技術(shù)的形式,能夠?qū)㈤L期訓(xùn)練的門檻降低,使創(chuàng)作者縮短訓(xùn)練時間,就能夠更輕易的進(jìn)行創(chuàng)作。

PGC與UGC需要去利用好AI這個工具,開發(fā)者則需要將其擴(kuò)展到更多的領(lǐng)域,讓更多的人加入到AI創(chuàng)作中來。

黃文灝:我覺得“繪畫”這個行業(yè)可能會一直存在。

AIGC爆火之后,我們可能仍然會在某些招聘平臺上看到插畫師的崗位,只是的職位要求改變了——過去可能會要求有過硬的繪畫技術(shù),但在未來可能會要求具備使用AI創(chuàng)作工具的能力,插畫師則變成了創(chuàng)意專家。

面對AIGC,我認(rèn)為我們應(yīng)該去擁抱它們,PGC和UGC的創(chuàng)作者們要將AI工具作為他們創(chuàng)作的一部分,幫助他們更高效或者更便捷的去產(chǎn)生相應(yīng)的內(nèi)容。

所以我覺得未來會是合作創(chuàng)造作品的狀態(tài),而且專業(yè)內(nèi)容的創(chuàng)造者或者說插畫師,他對圖畫的審美是有能力,AI繪畫外行可能覺得已經(jīng)很不錯,但是專業(yè)領(lǐng)域的人會發(fā)現(xiàn)瑕疵,會接著去做細(xì)微的修改,最后的作品必然會更加優(yōu)質(zhì)。

如果說,AI可能現(xiàn)在可以做到80-90分的繪畫水平,人類是可以把后面的10分彌補上的。對于專業(yè)人士來說,其實他們更擅長后面的部分,在前面90分內(nèi)容的基礎(chǔ)上,接著去完善作品。

基于這個角度,AIGC應(yīng)該是一種幫助,所以未來應(yīng)該是專業(yè)內(nèi)容生產(chǎn)者和AI工具,共同協(xié)作的一種模式。

04

版權(quán)歸屬尚無定論,需要多領(lǐng)域協(xié)同共建

劉興亮:AIGC相關(guān)作品,版權(quán)是屬于誰?

黃文灝:FlagStudio有明確規(guī)定,作品的版權(quán)是歸創(chuàng)作者所有,模型開發(fā)者沒有版權(quán)。

即便如此,也不建議用戶利用生成的作品去盈利,去做商用。這方面,法律上對此并沒有強制的約束,因為世界上對于AIGC著作權(quán)在法律上并沒有統(tǒng)一的認(rèn)知,著作權(quán)究竟是屬于誰如今還處在爭議的區(qū)域,現(xiàn)階段并無強制規(guī)定。

劉興亮:假如侵權(quán),誰來賠?通過AIGC生產(chǎn)的作品,如果獲獎屬于自己還是平臺?

伍昱:我覺得因為AIGC發(fā)展非常迅速,引起的爭議與版權(quán)相關(guān)的法律法規(guī)可能目前還在逐步完善。一些創(chuàng)作者在進(jìn)行藝術(shù)創(chuàng)作過程中,也沒有意識作品會被AI模型去學(xué)習(xí),被其他的用戶進(jìn)行再創(chuàng)作獲利,導(dǎo)致自身利益因而在某種程度上被損害。

未來技術(shù)發(fā)展過程中,我覺得有一種可能,創(chuàng)作者一開始就能夠知情——我的作品會被AI模型去學(xué)習(xí)——同時模型產(chǎn)生的后續(xù)基于自身作品的新創(chuàng)造,原始創(chuàng)作者同樣能夠從中獲利。

從這個角度上來講,解決模型創(chuàng)作時損害原始創(chuàng)作者利益的問題,需要形成一套更新的規(guī)范和流程。

劉江:各種爭議的源頭,即法律到底在著作權(quán)矛盾中起到什么作用?其實本質(zhì)上都是在做利益共享機(jī)制的分配。

由于法律和規(guī)范也在不斷變化,且會有一定滯后性,協(xié)調(diào)和規(guī)范的前提都是基于“出現(xiàn)什么問題,解決什么問題”,但是技術(shù)發(fā)展的速度快,所以經(jīng)常會出現(xiàn)法律不適用的情況。

AI版權(quán)問題的復(fù)雜性表現(xiàn)在兩個方面,一是AI要基于數(shù)據(jù)進(jìn)行創(chuàng)作,在數(shù)據(jù)基礎(chǔ)上進(jìn)行訓(xùn)練,但是數(shù)據(jù)的收集、使用、確權(quán)、商用等目前在法律上還很不清晰。

二是從貢獻(xiàn)來講,需要有一個合適的利益分配機(jī)制,現(xiàn)在還是缺乏的。我最近在研究Web3,也是出于這個原因。

接下來AI發(fā)展它要基于數(shù)據(jù),但數(shù)據(jù)單獨放置也并沒有多大價值,只有當(dāng)全部數(shù)據(jù)都匯聚在一起,用人類的集體智慧,再加上AI技術(shù),這樣才能夠發(fā)揮更大的價值。

因此,相關(guān)法律法規(guī)在未來也需要不斷的進(jìn)行完善,才能更好的推動AI行業(yè)進(jìn)一步的發(fā)展。

黃文灝:數(shù)據(jù)對于創(chuàng)作者非常重要,智源的下一個方向可能會是讓大家去做自己的定制化模型。這個數(shù)據(jù)可能是用戶自己的,比如梵高,它有自己的數(shù)據(jù),用戶也可以使用。

在一個開放的基礎(chǔ)模型情況下,創(chuàng)作者自身可以利用梵高的數(shù)據(jù)訓(xùn)練出一個梵高風(fēng)格的模型。因為基礎(chǔ)模型是開放的,定制模型也屬于用戶,用來定制的數(shù)據(jù)也是如此,那么用戶就可以通過定制模型去進(jìn)行商業(yè)化的使用,但無論是共享,還是商業(yè)化,我認(rèn)為未來版權(quán)相關(guān)的法律規(guī)范都會有更準(zhǔn)確嚴(yán)謹(jǐn)?shù)亩x。

劉興亮:如今的AIGC已經(jīng)大火,那在未來我們要用什么樣的眼光去看待這項技術(shù)的繼續(xù)發(fā)展?

伍昱:我們希望能夠多方共建,既包括從AI技術(shù)的方向,也希望有更多的專家從法律層面來考慮其中存在的很多問題,包括著作權(quán)、圖片生成的安全性,是否會對社會造成影響,怎樣進(jìn)行AI的交互等等。

一個新的技術(shù)發(fā)展,肯定需要得到多方利用專業(yè)知識來共建,而不僅僅是AI的專家。

此外,技術(shù)本身它是有多面性的,也需要更多的專家來保證技術(shù)是被用在合理的地方,能夠更好的促進(jìn)社會發(fā)展,我們也希望更多的人關(guān)注到AI的發(fā)展,加入AI相關(guān)行業(yè),一起去推動這項新興技術(shù)的發(fā)展。

黃文灝:AIGC技術(shù)如今基本上是開源開放的狀態(tài)。智源也一直是秉承著這種開源開放的態(tài)度來運行,我們做的所有模型也都是開放的,免費進(jìn)行使用。

在這種情況下,我覺得未來在產(chǎn)品方面,更多是對產(chǎn)品形態(tài)的設(shè)計以及對U X(用戶體驗)把握的考驗。如果基礎(chǔ)模型或者技術(shù)能力都很接近的情況下,誰能更好的幫助到用戶解決真正的痛點,將會更加重要。

以及,如何能讓技術(shù)能在商業(yè)模式上或者在落地層面找到它的剛需場景,也是比較重要的,只有這樣才能更好的發(fā)揮技術(shù)的作用,而不是像現(xiàn)在很多用戶僅僅嘗試一次,之后便不再會去使用。

關(guān)鍵詞: AI模仿齊白石畫鋼鐵蝦 版權(quán)歸誰 算抄襲嗎 人工智能

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com