最近兩個月,二次元們找到了AI的“正確用法”——玩梗。
以造梗最多的NovelAI為例,無論你投喂什么圖片,AI都能二次元化,輸出精美中不失離譜的圖片。
(資料圖片僅供參考)
你猜它們的原圖是什么?
圖片均由NovelAI生成,答案在評論區(qū)公布
這只是大量AI作畫正面案例里的一個少數(shù)。最近兩個月,AI作畫帶著大量梗圖火出圈,帶動了整個AIGC領(lǐng)域的投融資,AI行業(yè)也順帶著被“奶”了一口。
但AIGC能做的,遠不止作畫。
楊景詒丨作者
李拓丨編輯
果殼硬科技丨策劃
AIGC實現(xiàn)創(chuàng)作自由?
AIGC(AI-generated content),意為由AI生產(chǎn)的內(nèi)容。因此,只要創(chuàng)作的主體是AI,無論內(nèi)容的形式是文本、圖像、音頻、視頻以及它們排列組合的多模態(tài)內(nèi)容,都屬于AIGC。
在這個范疇上,游戲領(lǐng)域由AI生成的NPC和游戲策略,還有市面上一抓一大把的虛擬數(shù)字人,勉強可能算作AIGC之列。
2020年12月,投資機構(gòu)a16z官網(wǎng)發(fā)布文章,提出“內(nèi)容生成的四個階段”,依次為PGC、UGC、AI輔助生成和完全的AIGC[1]。
圖片來源:a16z[1]
該文章發(fā)布時,a16z還非常保守地認為,“我們?nèi)蕴幱诘谝恢恋诙A段”。實際上,果殼硬科技歷史文章曾提到,騰訊早在2015年推出了AI寫作機器人Dreamwriter,為里約奧運會進行賽事報道,這說明彼時內(nèi)容產(chǎn)業(yè)已經(jīng)觸碰到第三個階段——AI輔助生成。
2022年百度世界大會上,李彥宏就表示AIGC有三個發(fā)展階段:首先是“助手階段”,AIGC用來輔助人類進行內(nèi)容生產(chǎn);第二是“協(xié)作階段”,AIGC以虛擬人形態(tài)出現(xiàn),形成人機共生局面;第三是“原創(chuàng)階段”,AIGC將獨立完成內(nèi)容創(chuàng)作。
若以此為標準,我們已經(jīng)實現(xiàn)了AIGC的第一個階段,AI生成文字、圖像、視頻等方面已有多款產(chǎn)品。
AIGC項目雖然多,但是依據(jù)定位不同可分為兩類:產(chǎn)品型和研發(fā)型。
產(chǎn)品型項目以創(chuàng)業(yè)公司為主,它們的產(chǎn)品一般更加更加商業(yè)化,盈利需求明顯。
它們要么向用戶收費——AI作畫公司PromptBase直接收取1.99美元/張的作品費用;Discord的Midjourney雖然允許用戶免費試用AI作畫,但是免費版有使用次數(shù)限制,若想將畫作商用,就要支付每個月30美元的費用。另外,若用戶因Midjourney每月獲利超過2萬美元,還需要與Discord進行分成,分成比例在20%左右。
要么向公司收費——小冰公司公司CEO李笛曾向果殼硬科技表示,小冰通過提供人工智能框架,從其它公司處賺錢。每日經(jīng)濟新聞、紅杉中國等公司都使用了小冰的解決方案。
而研發(fā)型項目以科技巨頭的大規(guī)模深度學習模型為代表,它們一般為某些專用目的或是服務于巨頭的底層技術(shù),一般不會推出面向普通用戶的產(chǎn)品。
如Open AI、騰訊、阿里等公司的預訓練語言模型。以阿里為例,其語言模型作為自然語言技術(shù)平臺的底層能力,支持產(chǎn)品的搜索、推薦、廣告、客服等功能。
圖片來源:機器之心[2]
研發(fā)型項目即便推出面向一般用戶的產(chǎn)品,也以小規(guī)模測試為主,目的是在使用中獲得更多學習數(shù)據(jù),自我學習。如百度基于文心大模型推出了AI作畫產(chǎn)品,但使用該功能需要申請,對于使用次數(shù)也有限制。
此外,出于展示研發(fā)實力、減少重復勞動、推動技術(shù)交流等考慮,大公司一般這些項目開源,供學界研究,但這也給了少數(shù)AIGC項目一條“創(chuàng)業(yè)的捷徑”。
市面上部分AIGC項目并非都有自己的模型,而是采購或剽竊自其它項目。
行業(yè)媒體EasyAI就在2021年的文章中提到,人工智能寫作工具Copysmith AI及其同類產(chǎn)品Copy AI的模型并非自研,而是使用了GPT-3的語言模型。2020年10月起,GPT-3開始有償向外界開放自然語言處理能力,這些公司利用GPT-3商業(yè)化也無可厚非[3]。
但少數(shù)公司還存在剽竊行為。今年8月,媒體曝出一家名為WriteSonic的AIGC創(chuàng)業(yè)公司剽竊了Stable Diffusion,推出一款AI作圖的產(chǎn)品Photosonic AI。Stable Diffusion是一個在GitHub上完全公開免費的模型,但WriteSonic并未在產(chǎn)品中標注技術(shù)來源,該公司創(chuàng)始人也未做回應,等于是默認了[4]。
成熟的能力、開放的模型,給人工智能行業(yè)帶來了新機遇,也帶來了大量魚龍混雜的AIGC項目,但是資本對此并不介意,甚至開始搶起項目。
有人旗幟鮮明,有人舉棋不定
今年9月19日,紅杉資本兩名合伙人黃松雅(音譯,Songya Huang)和帕特·格雷迪(Pat Grady)用GPT-3寫了一篇名為《生成式AI,一個創(chuàng)造性的新世界》的文章[5]。
文章提到,AIGC正在變得更快、更便宜,而且在某些情況下比人類的創(chuàng)作質(zhì)量更高,并表示“AIGC有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟價值”。
但一級市場的投資熱,在此之前已經(jīng)開始。
有投資人稱,AIGC投資從今年七八月開始熱了起來,到9月已經(jīng)鋪天蓋地了[6]。西南某新一線城市投資經(jīng)理也告訴果殼硬科技,今年下半年陸續(xù)看過幾個AIGC的案子,但因為項目一般,并未出手。
10月17日,Stability AI宣布獲得來自Coatue和光速創(chuàng)投領(lǐng)投的1.01億美元投資,投后估值達10億美元,被媒體“尊為”AIGC領(lǐng)域首個獨角獸[7]。兩日后,德州AIGC公司Jasper獲得獲得Insight Partners領(lǐng)投的1.25億美元A輪融資,投后估值達15億美元。
國內(nèi)方面,今年以來有多家涉及AIGC業(yè)務的公司獲得新融資,它們的融資時間幾乎全部發(fā)生在7月后,天使輪融資占比近半。
2022年獲得融資的AIGC相關(guān)公司 | 果殼硬科技制表
對于AIGC公司來說,融資事關(guān)公司擴張。
研發(fā)算法和搭建、訓練模型需要投入大量人力物力,比如1750億參數(shù)的GPT-3,訓練成本為1200萬美元。另外,為了訓練GPT-3,微軟還投資5億美元,專門為它搭建了一座超算中心,裝載了一萬張英偉達GPU[8]。
即便套用現(xiàn)成的模型,也要租用大量算力維持服務,并且使用的人越多、占用的算力越大。這也是為什么大部分AI作畫產(chǎn)品,不會無限制向用戶提供免費服務——每一幅作品都有算力成本。
對于投資機構(gòu)來說,AIGC可能會創(chuàng)造巨大的商業(yè)價值。
我們可以參照計算機視覺技術(shù)的發(fā)展趨勢。晨山資本副總裁吳文超認為,計算機視覺技術(shù)發(fā)展時間超40年,但遲遲沒有好的商業(yè)化途徑。直到人臉識別、工業(yè)視覺檢測等殺手級應用出現(xiàn),計算機數(shù)據(jù)技術(shù)極大提升了生產(chǎn)力,也創(chuàng)造了大量社會價值和投資機會。而AIGC的技術(shù)成熟度較計算機視覺晚了3~5年,如今已經(jīng)到了大爆發(fā)的前期[9]。
圖片來源:晨山資本[9]
有AI行業(yè)投資人告訴果殼硬科技,AIGC行業(yè)到了商業(yè)化的重要節(jié)點已經(jīng)是業(yè)內(nèi)共識,不能錯過這個機會。
AIGC能不能投,也有VC舉棋不定。
北京某一線VC投資經(jīng)理對果殼硬科技表示,在AIGC產(chǎn)品上,她更看好大公司而非創(chuàng)業(yè)團隊,一方面大部分創(chuàng)業(yè)公司無法承擔運行AI大模型的成本,另一方面大公司有先發(fā)優(yōu)勢,不過前提是方向和模式正確。
此外,她還認為AIGC無法替代創(chuàng)意工作者,無論生成的內(nèi)容是什么,最終的創(chuàng)意來源都是人,而服務創(chuàng)作者就是AIGC產(chǎn)品最直觀的落地方式。
AIGC,別靠玩梗賺錢了
無論是否投資AIGC,我們還是應該關(guān)注那些具有普遍意義的問題——
一個好的AIGC產(chǎn)品應該長什么樣?
最近兩個月,被拿來玩梗的AIGC一個個都出了圈,但梗圖脫離了AI的生產(chǎn)力定位,無法帶來商業(yè)價值。
在前述北京VC投資經(jīng)理看來,投資AIGC就是“選商業(yè)模式”。AIGC無法替代創(chuàng)意工作者,無論生成的內(nèi)容是什么,最終的創(chuàng)意來源都是人,而服務創(chuàng)作者就是AIGC產(chǎn)品最直觀的落地方式。她對果殼硬科技表示,“能更好地替代創(chuàng)意工作者操作過程的AIGC,才是一個好的產(chǎn)品?!?/p>
不過,目前的AIGC產(chǎn)品距離“生產(chǎn)力工具”仍有距離。
AIGC能做到什么程度?
整體上看,目前AIGC產(chǎn)品輔助生產(chǎn)的作用有限。
果殼硬科技歷史文章也提到了AI寫作高度程式化、產(chǎn)品退居幕后的問題。至于音視頻領(lǐng)域,AI也存在套旋律和效果生硬、畫面獵奇等硬傷[10]。
在最有望替代基礎(chǔ)畫師的作畫領(lǐng)域,AI的理解能力和易用性程度還不夠強——出現(xiàn)了手腳不協(xié)調(diào)、口眼歪斜等不合常理的問題,包括“不會用筷子”和“不分鮭魚和刺身”這樣的著名翻車案例。
比如百度推出的AI作畫產(chǎn)品“文心一格”,就給我創(chuàng)作了這么一張“雙手持筷”的作品,而它的關(guān)鍵詞是“一個用筷子吃盒飯的少女”。
本圖片由百度文心一格生成
總之,AIGC的能力還是不盡如人意。
我們離AIGC還有多遠?
我們更加期待AIGC可以在一些高度商業(yè)化的領(lǐng)域發(fā)揮作用,比如電影工業(yè)。
制作難、成本高是制約CG電影發(fā)展的原因之一。比如《阿凡達》制作成本2.61億美元,其中特效成本高達2億美元。《變形金剛5》制作成本2.17億美元;《變形金剛5》制作成本2.17億美元,特效支出占1.3億美元。
而中國信通院發(fā)布的《人工智能生成內(nèi)容(AIGC)白皮書(2022年)》提到,AIGC能夠合成虛擬場景,結(jié)合摳像技術(shù),將無法實拍或成本過高的場景生成出來[11]。2017年播出的《熱血長安》, 劇中的大量場景便是通過人工智能技術(shù)虛擬生成。
雖然仍有觀眾對AI生成的視頻場景評價褒貶不一,但至少我們已經(jīng)看到了AIGC應用的影子。
References:
[1] Meet Me in the Metaverse 2020.12.7 https://a16z.com/2020/12/07/social-strikes-back-metaverse/
[2] WAIC 2021 | 阿里副總裁司羅:大規(guī)模語言模型如何賦能行業(yè)、創(chuàng)造價值 2021.7.18 https://mp.weixin.qq.com/s/-SVH32XRzW5Y_FWAIr79MA
[3] AI會永遠改變內(nèi)容營銷嗎?2021.4.23 https://easyai.tech/blog/will-ai-change-content-marketing-forever/
[4] 模型開源還強大?神秘公司成了吊打巨頭和學閥的AI “第三極” 2022.8.31 https://mp.weixin.qq.com/s/QLAwtrVeCx5vLOELr6cXUQ
[5] Generative AI: A Creative New World 2022.9.9 https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/
[6] AIGC火了,VC正在催FA推案子 2022.10.21 https://mp.weixin.qq.com/s/RSSHIRlLDFI7zc6dGB47yQ
[7] 獲1億美元投資,AI畫圖驚現(xiàn)獨角獸,人類畫師的末日真來了?2022.10.18 https://mp.weixin.qq.com/s/cqiC11gAXbw4Xt3ZPWEr1g
[8] OpenAI Presents GPT-3, a 175 Billion Parameters Language Model 2020.7.7 https://developer.nvidia.com/blog/openai-presents-gpt-3-a-175-billion-parameters-language-model/
[9] AIGC:自動化內(nèi)容生成,AI的下一個引爆點?|晨思 2022.8.24 https://mp.weixin.qq.com/s/nJOR20fYgGVB147ZbO1JLQ
[10] 視頻創(chuàng)作者飯碗不保!Meta和谷歌推出的AI黑科技來搶活兒了 2022.10.18 https://36kr.com/p/1963050276766720
[11] 人工智能生成內(nèi)容(AIGC) 白皮書(2022 年) 2022.9 http://www.caict.ac.cn/kxyj/qwfb/bps/202209/P020220902534520798735.pdf
關(guān)鍵詞: AI廠工什么時候開始賽博搬磚 人工智能 gpt-3