圖片來(lái)源@視覺(jué)中國(guó)
文|日晞研究所,作者|ICE,編輯|南汐、Lydia、WW
ChatGPT是一款人工智能聊天機(jī)器人,在今年1月份的月活躍用戶預(yù)計(jì)已達(dá)到1億。
(資料圖片)
ChatGPT由人工智能研究公司OpenAI在2022年11月30日上線,其功能包括了信息查詢、日常聊天、撰寫(xiě)文章、編寫(xiě)程序甚至賦詩(shī)作詞等人們?nèi)粘9ぷ魃钕嚓P(guān)的方方面面。
2023年在實(shí)現(xiàn)商業(yè)化落地后,A股市場(chǎng)ChatGPT、AIGC概念股持續(xù)走熱,賽為智能、海天瑞聲、云從科技、初靈信息、漢王科技等概念股領(lǐng)漲,上周漲幅均超過(guò)60%。
ChatGPT是什么?從何而來(lái)
簡(jiǎn)單來(lái)說(shuō),ChatGPT是一個(gè)智能聊天機(jī)器人,通過(guò)使用Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)理解和生成文本,模擬人類(lèi)對(duì)話。
你打開(kāi)ChatGPT的對(duì)話框,輸入“請(qǐng)寫(xiě)一部關(guān)于XX的小說(shuō)”,幾分鐘后,你就能收獲一篇結(jié)構(gòu)完整的短篇小說(shuō)。
ChatGPT的神奇之處,在于它做到了幾乎能和人類(lèi)無(wú)差別的場(chǎng)景交流。
它可以輕松撰寫(xiě)文案、代碼,涉及歷史、文化、科技等諸多領(lǐng)域,甚至還能寫(xiě)詩(shī)、求醫(yī)問(wèn)藥、改bug、編代碼、寫(xiě)論文、寫(xiě)歌詞。
去年有報(bào)道稱(chēng),ChatGPT通過(guò)了谷歌編碼三級(jí)工程師面試,年薪18.3萬(wàn)美元,這相對(duì)人類(lèi)來(lái)說(shuō),簡(jiǎn)直可以稱(chēng)之為“無(wú)所不能,什么都懂”。
因此,2023年春節(jié)剛過(guò),ChatGPT就引爆了人工智能領(lǐng)域。
一經(jīng)亮相,便成“王者”。
ChatGPT的出現(xiàn),引發(fā)全民追捧AI科技。
研究顯示,ChatGPT推出短短五天時(shí)間,注冊(cè)用戶數(shù)就超過(guò)了100萬(wàn),目前這一數(shù)據(jù)已經(jīng)突破了1億。
過(guò)億用戶的盛情追捧,離不開(kāi)科技巨頭微軟、Meta以及亞馬遜AWS等公司的高強(qiáng)度關(guān)注。
在ChatGPT母公司OpenAI成立的七年來(lái),微軟為其注資10億美元并調(diào)動(dòng)大量研發(fā)力量。日前,微軟宣布向OpenAI追加投資數(shù)十億美元,并打算將其AI工具整合在微軟的Bing搜索以及多項(xiàng)產(chǎn)品當(dāng)中。同時(shí),Meta也表示將向OpenAI支付數(shù)百萬(wàn)美元,幫助ChatGPT為Facebook等旗下產(chǎn)品生成創(chuàng)作者內(nèi)容。
與此同時(shí),谷歌對(duì)于ChatGPT可能帶來(lái)的改變表示關(guān)注。
谷歌母公司Alphabet CEO桑達(dá)爾·皮查伊表示谷歌將在“未來(lái)幾周或幾個(gè)月”推出類(lèi)似ChatGPT、基于人工智能的大型語(yǔ)言模型。
同時(shí)有消息稱(chēng),百度將在2023年3月推出和ChatGPT類(lèi)似的人工智能聊天機(jī)器人服務(wù),其最初版本將內(nèi)嵌在其搜索服務(wù)當(dāng)中。
ChatGPT為何火速躥紅?背后的核心技術(shù)原理是什么
ChatGPT靠仿真聊天和回答出圈,躥火的一方面還在于美國(guó)89%的大學(xué)生都用ChatGPT來(lái)做作業(yè),各國(guó)投顧圈用ChatGPT能一分鐘直接生成投研報(bào)告,科技界都開(kāi)始關(guān)注ChatGPT背后的核心技術(shù),甚至在ChatGPT還在普及階段,斯坦福大學(xué)就已經(jīng)研究了反AI的全新算法,制止學(xué)生用AI生成文本的DetectGPT。
伴隨著ChatGPT火爆的ChatGPT概念股,在A股這幾天也紛紛跟紅。
虧損的AI龍頭,股價(jià)6天翻倍。
愈演愈烈的ChatGPT概念,使得這在國(guó)內(nèi)看起來(lái)不像是一場(chǎng)全球人工智能領(lǐng)域難得的突破性事件,而更像一場(chǎng)資本追逐概念股的狂歡。
一個(gè)ChatGPT應(yīng)用的走紅,A股是人工智能和不是人工智能的公司好像都瞬間獲益了。
偽AI公司股價(jià)也已翻倍。
但獲益的背后,也只是純粹的市場(chǎng)概念炒作的結(jié)果,并非來(lái)自真正國(guó)內(nèi)AI技術(shù)的突破和創(chuàng)新。
而說(shuō)到ChatGPT背后的核心技術(shù),緣起自然語(yǔ)言處理領(lǐng)域的一篇科研論文《Attention is all your need》中名為transformer的算法。
transformer算法自誕生之日起,就被廣泛應(yīng)用于AI領(lǐng)域,成為了近幾年最熱門(mén)的AI算法模型。
AI技術(shù)數(shù)十年間從transformer算法到GPT(Generative Pre-Training),再到GPT2的迭代標(biāo)志Open AI,以及GPT3和ChatGPT的“出圈”,未來(lái)很長(zhǎng)一段時(shí)間,人類(lèi)將迎來(lái)“科研、算力、基礎(chǔ)架構(gòu)、工程、數(shù)據(jù)、解決方案”循環(huán)的快速迭代。
transformer算法的核心內(nèi)容是并行計(jì)算。
Transformer模型示意圖
自然語(yǔ)言處理主要的算法叫RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))算法,其弊病是需要大量的串行計(jì)算,效率低。
而在Transformer算法里,作者將每個(gè)字與句子中所有單詞進(jìn)行計(jì)算,算出這個(gè)詞與每個(gè)單詞的相關(guān)度,從而確定這個(gè)詞在這個(gè)句子里的更準(zhǔn)確意義。
同時(shí),機(jī)器學(xué)習(xí)領(lǐng)域最核心的一個(gè)概念——“向量”,誕生了。
在數(shù)字化時(shí)代,數(shù)學(xué)運(yùn)算最小單位往往是自然數(shù)字。
但在AI時(shí)代,這個(gè)最小單元變成了向量。這是數(shù)字化時(shí)代計(jì)算和智能化時(shí)代最重要的差別之一。
向量是一組數(shù)據(jù)的集合,也可以想象成在一個(gè)超高維度空間里的一個(gè)點(diǎn)。
這種方法,可以在一個(gè)超長(zhǎng)句子中發(fā)揮優(yōu)勢(shì),而且最關(guān)鍵的是一舉突破了時(shí)序序列的屏障,以前對(duì)于圖像和NLP算法的劃分,很大程度上是由于NLP有很明顯的時(shí)序特征,即每個(gè)單詞和下一個(gè)以及在下一個(gè)有比較明顯的時(shí)序關(guān)系。
計(jì)算過(guò)程在于將attention數(shù)值就是除了“我”字自有信息和位置信息以外,成功得到這個(gè)句子中每個(gè)單詞的相關(guān)度信息。
這是理論科研、算法、架構(gòu)、工程的角度上,真正意義的進(jìn)步。
ChatGPT到底可以關(guān)聯(lián)多少行業(yè)?
公關(guān),健身,金融,學(xué)術(shù),數(shù)字營(yíng)銷(xiāo)
計(jì)算機(jī),管理,體育,醫(yī)美,自動(dòng)駕駛
ChatGPT的火已經(jīng)燒到了許多不同的行業(yè)。
程序員行業(yè),ChatGPT拿下了谷歌120萬(wàn)年薪offer,可以做谷歌三級(jí)程序員。
金融行業(yè),財(cái)通證券李躍博團(tuán)隊(duì)采用ChatGPT撰寫(xiě)了一篇醫(yī)美行業(yè)研究報(bào)告《ChatGPT實(shí)測(cè):提高外在美,增強(qiáng)內(nèi)在自信——醫(yī)療美容革命》。
ChatGPT擁有強(qiáng)大的的語(yǔ)言理解能力,可廣泛應(yīng)用于多種對(duì)話問(wèn)答場(chǎng)景,包括智能客服、虛擬人、機(jī)器人、游戲 NPC 等應(yīng)用領(lǐng)域。
文娛傳播行業(yè),在ChatGPT輸入你想要的文本要求,它一分鐘就能生成小說(shuō),詩(shī)歌,企業(yè)年報(bào),財(cái)報(bào),金融研報(bào),危機(jī)公關(guān)方案,健身計(jì)劃,學(xué)術(shù)論文,高中作業(yè),數(shù)字營(yíng)銷(xiāo)方案,計(jì)算機(jī)程序語(yǔ)言,醫(yī)美方案,體育方案等等。
互聯(lián)網(wǎng)行業(yè),和目前的搜索引擎以及知乎等平臺(tái)相比,ChatGPT給出的答案比較系統(tǒng)、全面,而且非常及時(shí)。
另外還有一些日常的文字處理工作,比如就某個(gè)主題寫(xiě)一個(gè)提綱或者起草一個(gè)方案,ChatGPT幾秒鐘就可以給出結(jié)果。
AI技術(shù)在2017年就曾寫(xiě)出過(guò)唯美詩(shī)歌集:“孤陳的城市在長(zhǎng)夜中埋葬/他們記憶著最美麗的皇后/飄零在西落的太陽(yáng)下/要先做一場(chǎng)夢(mèng)……”(微軟小冰《陽(yáng)光失了玻璃窗》)
甚至,ChatGPT還能回答專(zhuān)業(yè)度較高的問(wèn)題,充當(dāng)AI在線知乎,以及創(chuàng)作小說(shuō)大綱(仿《流浪地球》)。
AI繪畫(huà)作品出圈、一級(jí)投資活躍,2022年AIGC爆發(fā)式發(fā)展。
AI作詞、作曲、編曲等,具體包括由旋律生成歌詞、由歌詞生成旋律、不同曲風(fēng)旋律生成、和弦生成、音樂(lè)續(xù)寫(xiě)等,可應(yīng)用于音樂(lè)欣賞、游戲音效、實(shí)體場(chǎng)景配樂(lè)等多個(gè)領(lǐng)域。
使用AI對(duì)視頻進(jìn)行編輯,包括刪除視頻特定主體、自動(dòng)跟蹤剪輯、視頻特效生成、自動(dòng)添加特定內(nèi)容、視頻美顏等,大大降低了視頻編輯的專(zhuān)業(yè)門(mén)檻,提升了視頻剪輯效率,目前已廣泛應(yīng)用于視頻創(chuàng)作領(lǐng)域,具體應(yīng)用包括剪映、百度智能創(chuàng)作平臺(tái)、抖音、美圖等。
ChatGPT 在學(xué)術(shù)、房產(chǎn)等領(lǐng)域的應(yīng)用逐漸落地。除了各大科技公司,ChatGPT也開(kāi)始應(yīng)用于學(xué)術(shù)、房產(chǎn)等領(lǐng)域。
美國(guó)房產(chǎn)中介也開(kāi)始使用 ChatGPT,用于房源信息撰寫(xiě)、房貸計(jì)算等。
中國(guó)傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院副教授王小寧在接受《環(huán)球時(shí)報(bào)》采訪時(shí)談道,“ChatGPT的出現(xiàn)是一種機(jī)遇和挑戰(zhàn)的結(jié)合,在發(fā)揮它優(yōu)勢(shì)的同時(shí),也應(yīng)該認(rèn)真對(duì)待它可能帶來(lái)的問(wèn)題。”
ChatGPT時(shí)代,人類(lèi)會(huì)逐步失業(yè)嗎?
最近ChatGPT的再次出圈,讓許多人又開(kāi)始探討和研究AIGC。
這樣的氛圍確實(shí)很好,不過(guò)人類(lèi)可能也需要對(duì)AI抱有更多的理智。
一方面,AI還有很多缺陷。
比如ChatGPT作為語(yǔ)言模型,是一個(gè)極度偏科的“文科生”。
粗略來(lái)說(shuō),它可以通過(guò)極大的文本訓(xùn)練量把話說(shuō)得人模人樣,但卻很難“長(zhǎng)腦子”,也就是通過(guò)自己的邏輯思考來(lái)得出結(jié)果。
最主要的問(wèn)題之一就是聊天機(jī)器人和文本生成工具無(wú)法判斷內(nèi)容的質(zhì)量和好壞,可以學(xué)習(xí)網(wǎng)絡(luò)上所有文本,可能產(chǎn)生惡意的甚至攻擊性的語(yǔ)言輸出。
另一方面,ChatGPT的記憶力有限。
雖然ChatGPT能夠記住用戶說(shuō)過(guò)的話,但ChatGPT目前也只能從當(dāng)前會(huì)話中引用最多約3000個(gè)單詞,因?yàn)槌龃朔秶娜魏斡脩粜畔⒍疾粫?huì)被保存。
ChatGPT暫時(shí)還無(wú)法勝任人類(lèi)營(yíng)養(yǎng)師及健身教練的工作,因?yàn)檫@些工作涉及用戶隱私、數(shù)據(jù)保存以及個(gè)性化推薦等。
如果ChatGPT算對(duì)了一個(gè)簡(jiǎn)單的加法,很可能是因?yàn)榫W(wǎng)上就這么說(shuō)的,而不是它真的會(huì)算。
在對(duì)海量文本數(shù)據(jù)集的學(xué)習(xí)之上,ChatGPT形成的預(yù)測(cè)和關(guān)聯(lián)知識(shí),其實(shí)質(zhì)是將人類(lèi)已有的群體知識(shí)連接在一起的自動(dòng)化媒介。
ChatGPT這類(lèi)基于人類(lèi)群體知識(shí)和記憶的知識(shí)生產(chǎn)方式,總體而言還是“人工”帶來(lái)的智能,它的成就必然與既有的主要基于個(gè)體知識(shí)與記憶的知識(shí)生產(chǎn)方式產(chǎn)生沖突。
因此,在ChatGPT后時(shí)代,不少行業(yè)的從業(yè)人員工作會(huì)受到適量沖擊。
但也像谷歌,微軟等科技巨頭和金融界大佬所分析的,ChatGPT只能從事基礎(chǔ)程序員工作,更高級(jí)的工作需要更多學(xué)習(xí),迭代后有望出現(xiàn)機(jī)會(huì),但目前很多金融和科技類(lèi)工作分析還是富含個(gè)性化思維,目前ChatGPT還很難建立自己的邏輯,并非《流浪地球》里的智能量子計(jì)算機(jī)Moss。
據(jù)投資公司 Radical Ventures 預(yù)測(cè),GPT-4 或采用更大規(guī)模的數(shù)據(jù)集,可能在10 萬(wàn)億個(gè) token 的數(shù)據(jù)集上進(jìn)行訓(xùn)練,同時(shí)它的參數(shù)有望比 Megatron-Turing 的要少。GPT-4 有可能是多模態(tài)的,支持文本、圖片、視頻等多種數(shù)據(jù)類(lèi)型的輸入。意味著 GPT-4 可以根據(jù)文本提示詞(prompt)生成圖像,或者是可以輸入視頻然后通過(guò)文本的形式回答問(wèn)題。
但就目前而言,ChatGPT目前的成功主要是技術(shù)上的,我們?cè)趽肀鋷?lái)的機(jī)遇的同時(shí),也應(yīng)當(dāng)看到ChatGPT的漏洞。
比如,一,在各專(zhuān)業(yè)領(lǐng)域的運(yùn)用,還需要進(jìn)行各專(zhuān)業(yè)領(lǐng)域的特殊訓(xùn)練和模式適應(yīng)。
如金融行業(yè),人工智能算法可以生成研報(bào),在投研領(lǐng)域,ChatGPT主要應(yīng)用的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型技術(shù)已被廣泛投入使用。
但是當(dāng)其引入垂直金融領(lǐng)域落地時(shí),其預(yù)訓(xùn)練環(huán)節(jié)還需要調(diào)整。
一方面需要做加法,用金融領(lǐng)域的私有、專(zhuān)有數(shù)據(jù)對(duì)其進(jìn)行增強(qiáng)樣本的訓(xùn)練,補(bǔ)足通用模型在金融領(lǐng)域的短板;另一方面需要做減法,將超大模型中金融領(lǐng)域用不到的資源摘除。
不過(guò)以上的深入,也涉及到了金融行業(yè)的隱秘性信息安全等問(wèn)題。
二,在ChatGPT 風(fēng)口已至,商業(yè)化落地加速的同時(shí),ChatGPT面臨的潛在法律風(fēng)險(xiǎn)卻也大幅上升。
ChatGPT其僅僅是Transformer和GPT等自然語(yǔ)言處理技術(shù)的集成,本質(zhì)上依然是一個(gè)基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,按計(jì)算機(jī)專(zhuān)業(yè)人士行話評(píng)價(jià),依然還是“人工”智能。
人工兩個(gè)字就很巧妙,AI與法律的邊界也在于使用人工的不同人類(lèi)與法律的邊界關(guān)系。
據(jù)新聞報(bào)道,ChatGPT技術(shù)也被黑客拿來(lái)利用,作為其破壞行為升級(jí)的“新武器”。
黑莓(Black Berry)的一份報(bào)告調(diào)查了英國(guó)500名IT行業(yè)決策者對(duì)ChatGPT這項(xiàng)革命性技術(shù)的看法,發(fā)現(xiàn)超過(guò)四分之三(76%)的人認(rèn)為,外國(guó)已經(jīng)在針對(duì)其他國(guó)家的網(wǎng)絡(luò)戰(zhàn)爭(zhēng)中使用ChatGPT。
近一半(48%)的人認(rèn)為,2023年,將會(huì)出現(xiàn)有人惡意使用ChatGPT而造成“成功”的網(wǎng)絡(luò)攻擊,譬如網(wǎng)絡(luò)罪犯使用人工智能聊天機(jī)器人來(lái)偽造可信的網(wǎng)絡(luò)釣魚(yú)郵件(57%),提高攻擊的復(fù)雜性(51%),并加速新的社交網(wǎng)絡(luò)攻擊(49%)。
蘋(píng)果手機(jī)用戶就經(jīng)常吐槽,自己的手機(jī)下載了國(guó)家反詐中心也防不勝防,各種釣魚(yú)網(wǎng)站短信走cloud紛飛,一不留神就是點(diǎn)擊進(jìn)了一個(gè)社交網(wǎng)絡(luò)攻擊的陷阱。
目前,中國(guó)尚無(wú)國(guó)家層面的人工智能產(chǎn)業(yè)立法,人工智能在中國(guó)整體監(jiān)管仍有待完善。
同時(shí),ChatGPT帶來(lái)的虛假信息存在法律風(fēng)險(xiǎn)問(wèn)題。另外,AI技術(shù)廣泛應(yīng)用還伴隨著知識(shí)產(chǎn)權(quán)的合規(guī)問(wèn)題。
三,雖然生成式 AI 賽道火熱,資金扎堆涌入,但是國(guó)外頭部機(jī)構(gòu)引領(lǐng)技術(shù)和商業(yè)應(yīng)用,國(guó)內(nèi)整體進(jìn)度落后 2到3 年。
技術(shù)發(fā)展可能存在不及預(yù)期的風(fēng)險(xiǎn),且當(dāng)前 AIGC 技術(shù)仍有局限。
新的技術(shù)需要商業(yè)化驗(yàn)證目前 AIGC 的商業(yè)化仍處于早期探索階段,有存在不及預(yù)期風(fēng)險(xiǎn)。
畢竟,不得不面對(duì)的殘酷現(xiàn)實(shí)是,國(guó)內(nèi)AI四小龍至今沒(méi)有一家實(shí)現(xiàn)盈利。
參考資料:
《從CHAT-GPT到生成式AI(Generative AI):人工智能新范式,重新定義生產(chǎn)力》中信建投證券《ChatGPT:又一個(gè)“人形機(jī)器人”主題》東吳證券《ChatGPT風(fēng)口已至,商業(yè)化落地加速》國(guó)聯(lián)證券《關(guān)注ChatGPT和代工龍頭在美建廠》華泰證券《體驗(yàn)ChatGPT》真格基金等
關(guān)鍵詞: ChatGPT后時(shí)代互聯(lián)網(wǎng)人均失業(yè) 人工智能