衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
(資料圖片)
不希望自己作品被Stable Diffusion“白嫖”的畫家們,可以松口氣了!
Stable Diffusion 3.0版本將會(huì)提供一個(gè)選項(xiàng):
藝術(shù)家們可以選擇將自己的畫作納入Stable Diffusion 3的訓(xùn)練數(shù)據(jù)集,或從數(shù)據(jù)集中刪掉。
據(jù)了解,未來幾周內(nèi),這個(gè)操作就會(huì)被開啟。
不過,承接這個(gè)任務(wù)的不是Stability AI本身,而是一個(gè)叫Spawning的藝術(shù)家倡導(dǎo)組織。
自由選擇納入或刪除作品
選擇在Stable Diffusion3中納入或刪除自己的作品,步驟十分簡單。
畫師們只需要在網(wǎng)站“Have I Been Trained?”注冊,并表明自己希望在訓(xùn)練數(shù)據(jù)集中刪除或者納入哪些自己的作品。
而后,Spawning會(huì)收集藝術(shù)家們在網(wǎng)站上的意向。
網(wǎng)站Have I Been Trained背后是LAION-5B訓(xùn)練數(shù)據(jù)集,它被用來訓(xùn)練Stable Diffusion和Google的Imagen AI等模型。
LAION是一個(gè)非營利性的開源數(shù)據(jù)集,Stability AI對其進(jìn)行了部分資金資助。
具體操作是醬嬸的:
首先需要在Have I Been Trained上注冊一個(gè)賬戶,然后上傳自己的畫作。
利用LAION圖像數(shù)據(jù)庫,搜索引擎會(huì)顯示出上傳畫作在數(shù)據(jù)庫訓(xùn)練集中的匹配項(xiàng)。
這個(gè)時(shí)候,只需要分別右鍵單擊幾個(gè)縮略圖,并在彈出選項(xiàng)中選擇選擇刪除此圖像即可。
所有退出數(shù)據(jù)集的圖像,都會(huì)集中顯示在一個(gè)“選擇退出”的圖像列表中。
當(dāng)然,上述還只是進(jìn)行操作的大概步驟,實(shí)施細(xì)節(jié)尚待完善。
Stability AI創(chuàng)始人兼CEO Emad Mostaque在推特上表示,除了選擇刪除外,Spawning還將提供選擇加入請求。
也就是說,希望自己作品成為訓(xùn)練集一部分的藝術(shù)家,同樣可以把自己的畫作添加到里面。
這位CEO在推特上還說了:
我們希望為大伙兒建立更好的數(shù)據(jù)集,相信這是一項(xiàng)變革性的技術(shù)。
我們樂意與各方接觸,并盡可能做到透明。
承接數(shù)據(jù)收集工作的Spawning,是一個(gè)總部位于柏林的藝術(shù)家倡導(dǎo)組織。
它很年輕,今年9月剛剛創(chuàng)建創(chuàng)建,創(chuàng)始人是Dryhurst夫婦和一位音樂家。
Dryhurst表示,這三個(gè)月來,Spawning一直在和Stability AI和LAION進(jìn)行洽談,并得到了支持。
他還表示,Spwaning是一個(gè)獨(dú)立組織,不會(huì)把收集來的數(shù)據(jù)拿去做任何別的事。
然而,人們對事情的擔(dān)心并不局限在數(shù)據(jù)隱私上。
一個(gè)方面是,要從訓(xùn)練集中刪除圖像,前提是你想要?jiǎng)h除的圖像已經(jīng)存在于LAION數(shù)據(jù)集中,且可以在Have I Been Trained上搜索到。
此外,目前沒有辦法選擇批量刪除圖片,如果數(shù)據(jù)集中存在同一圖像的多個(gè)副本,那么刪除起來可是個(gè)費(fèi)時(shí)費(fèi)力的大工程。
而爭議的目光最為聚集的一點(diǎn),則是讓藝術(shù)家們紛紛跑去注冊一個(gè)和Stability AI或LAION沒有法律約束的網(wǎng)站。
目前在Have I Been Trained完成“刪除圖像”的操作,整個(gè)流程可以說是暢通無阻。
沒錯(cuò),你既不會(huì)遇上任何試圖驗(yàn)證身份的步驟,也不會(huì)遇上任何法律約束的條約。
也就是說,你想把別人的作品添加或從訓(xùn)練集中刪除,輕而易舉,完全不受阻礙。
△有人上傳了一張版權(quán)不屬于自己的圖像,并將其從數(shù)據(jù)集中刪除
以及,針對Spawning在其公告視頻中關(guān)于同意的聲明,有網(wǎng)友指出,選擇退出過程不符合歐洲通用數(shù)據(jù)保護(hù)條例(GDPR)中關(guān)于“同意”的定義。
這份條例中規(guī)定,必須予以用戶主動(dòng)同意的權(quán)利,而不是默認(rèn)同意了。
誰擁有AIGC作品版權(quán)?
有看客擁有更激烈一些的看法:
設(shè)置的選項(xiàng),應(yīng)該只有“要不要讓自己的畫作加入訓(xùn)練集”,而不是既有加入也有刪除。
他們的觀點(diǎn)是,所有的藝術(shù)作品都應(yīng)該默認(rèn)被AI訓(xùn)練集排除在外。
今年,AIGC的力量噴薄而出,席卷全球各行各業(yè)。
自DALL·E 2在4月發(fā)布以來,創(chuàng)意產(chǎn)業(yè)一直對AI藝術(shù)圖像所有權(quán)的問題議論紛紛,尤其是畫家本人,他們中不少都抱著飯碗對AIGC罵罵咧咧。
△DALL·E 2生成圖像
等到開源的Stable Diffusion在8月發(fā)布時(shí),有關(guān)模型訓(xùn)練的爭議也越來越大。
用大量網(wǎng)絡(luò)中真人畫師的作品組成數(shù)據(jù)集,然后生成AI畫作,被有的網(wǎng)友批判為“抄襲和偷竊”。
但是這樣的“抄襲”很難衡量其頻次,因?yàn)閿U(kuò)散系統(tǒng)是根據(jù)來自不同來源的數(shù)十億張圖像進(jìn)行訓(xùn)練的。
而且,這樣生成的作品,版權(quán)到底歸屬哪一方?
是被“學(xué)習(xí)”的畫家,還是AI模型背后的公司,抑或是AI模型本身?
一切尚未有所定論。
前幾天,馬里蘭大學(xué)和紐約大學(xué)的科學(xué)家們做了一項(xiàng)新研究,研究表明:
DALL·E2和Stable Diffusion這樣的文生圖AI模型,可以并且確實(shí)在從它們的訓(xùn)練數(shù)據(jù)集中,瘋狂復(fù)制數(shù)據(jù)集圖像的各個(gè)方面。
“使用擴(kuò)散模型生成數(shù)據(jù)的公司,可能需要重新考慮涉及知識產(chǎn)權(quán)法的任何部分。”研究人員表示,“因?yàn)閹缀鯖]辦法驗(yàn)證Stable Diffusion生成的任何圖像,是不是全新的,或者有沒有從訓(xùn)練數(shù)據(jù)集中竊取別人的成果?!?/p>
△Stable Diffusion 從其訓(xùn)練數(shù)據(jù)集中復(fù)制元素的更多示例(圖源:TechCrunch)
研究表明,模型復(fù)制的頻率取決于幾個(gè)因素,包括訓(xùn)練數(shù)據(jù)集的大小,較小的集合往往比較大的集合導(dǎo)致更多的復(fù)制。
與此同時(shí),一旦模型記住了原畫作,就很難判定生成圖像和原始圖像之間的界限。
相似度達(dá)到多少,才能判定抄襲與否或版權(quán)歸屬何方呢?
研究人員也并沒有給出答案,他們只是說:
我們不能拋棄擴(kuò)散模型,應(yīng)該考慮如何在不損害隱私的情況下保持它們的性能。
那么,有沒有一種辦法,讓藝術(shù)家的版權(quán)受到保護(hù)需求,和AI生成技術(shù)繼續(xù)進(jìn)步達(dá)到微妙的平衡?
Stability AI承認(rèn),自家產(chǎn)品引發(fā)了對在線AI生成藝術(shù)的大規(guī)模道德辯論,其間主流還是抗議的聲音。
不過,就讓藝術(shù)家自動(dòng)選擇加入或刪除圖像這事兒,CEO同志Emad Mostaque毫不忌諱地表達(dá)了自己的開放態(tài)度。
他在推特上寫道:
@laion_ai 團(tuán)隊(duì)對反饋有著非常開放的心態(tài),我們的初心是希望為所有人構(gòu)建更好的數(shù)據(jù)集。
那么,你是怎么看待AIGC生成作品版權(quán)歸屬的?
參考鏈接:
[1]https://venturebeat.com/ai/stability-ai-to-honor-artist-opt-out-requests-for-stable-diffusion-3/
[2]https://twitter.com/EMostaque
關(guān)鍵詞: Stable Diffusion新版畫師可自主選擇作品是否加入訓(xùn)練