新上線的ChatGPT迅速成為了現(xiàn)象級(jí)的AI應(yīng)用。它代表了AI技術(shù)怎樣的飛躍進(jìn)步?它的出現(xiàn)又將顛覆現(xiàn)有的哪些應(yīng)用?本文以ChatGPT實(shí)際使用案例詳細(xì)分析了這款應(yīng)用的技術(shù)路線,以及它在信息搜索可能引發(fā)的顛覆性影響。希望能給你帶來啟發(fā)。
這兩天,新上線的ChatGPT實(shí)在是太火了!首富馬斯克一馬當(dāng)先,帶著大家玩得不亦樂乎,看起來,人工智能的奇點(diǎn)就要到來了!沒玩過的朋友,我也不多作介紹了,自行搜索即可。
作為一名二手人工智能從業(yè)者,好多人催我寫寫,人類是不是懸了?當(dāng)然,人家源代碼我沒地看去,看了沒人給講也是一頭霧水,外面那些信息,我看也半真半假。
(資料圖片)
所以,咱們也不講什么技術(shù)框架,就從實(shí)際的使用案例來看看,這款現(xiàn)象級(jí)的AI應(yīng)用,采用的是什么樣的技術(shù)路線,能顛覆現(xiàn)有的哪些應(yīng)用。
篇幅有限,今天只聊以下幾個(gè)問題:
這次的ChatGPT,為啥一下子這么猛? 這家伙準(zhǔn)備先顛覆誰,是搜索引擎么? AI關(guān)底的圖靈測(cè)試,馬上要被KO了么?
一、ChatGPT這次為啥這么猛?
與其前一代相比,ChatGPT的效果太驚艷了!大家體會(huì)最深的一點(diǎn),是機(jī)器人說的“像人話”了。這個(gè)像人話,有兩層意思,首先是對(duì)一些知識(shí)性內(nèi)容的回答準(zhǔn)確率大大提升,這個(gè)例子就太多了,咱們隨便貼兩條:
您看這專業(yè)程度,至少比問我靠譜!它反映了什么技術(shù)進(jìn)展呢?
自然語言處理的大模型,一直有個(gè)問題:如果完全無監(jiān)督訓(xùn)練,無法甄別語料的真假和質(zhì)量;這次ChatGPT從回答質(zhì)量上有質(zhì)變,應(yīng)該是對(duì)某些高質(zhì)量?jī)?nèi)容做了加權(quán),采用了類似有監(jiān)督訓(xùn)練的方法。從結(jié)果上來看,是相當(dāng)成功的。
最讓我感到驚訝的,是ChatGPT這次在倫理方面給出了諸多令人稱贊的限制,不用說,這肯定也得有點(diǎn)監(jiān)督。除了大家熟悉的“未來預(yù)測(cè)類問題不作答”以外,下面這兩個(gè)例子的對(duì)比,也相當(dāng)出彩:
除了內(nèi)容,ChatGPT回答的條理性和語言流暢度也特別好?;旧蠒?huì)把各方面的信息綜合成一二三點(diǎn)的模板,頗有點(diǎn)領(lǐng)導(dǎo)講話的派頭。因此,我認(rèn)為在語言生成的結(jié)構(gòu)上,也應(yīng)該是特意選擇了一些高質(zhì)量的嚴(yán)肅帖子,同樣采用某種程度的有監(jiān)督學(xué)習(xí)。
所以您也能看出來,它說話老是脖子沖南臉沖北的老干體,一點(diǎn)兒也不像在論壇里混出來的語言風(fēng)格。
后來有消息說,ChatGPT這回采用了強(qiáng)化學(xué)習(xí)的方案,而強(qiáng)化的具體做法,就是找?guī)讉€(gè)人盯著結(jié)果標(biāo)注,這本質(zhì)上跟有監(jiān)督意思也差不多。
二、ChatGPT將首先顛覆誰?
那么,ChatGPT是不是能夠如很多人所期盼的那樣,成為搜索引擎的殺手呢?
熟悉搜索的朋友應(yīng)該了解,搜索查詢分為兩類:信息型搜索(Informational search)和瀏覽型搜索(Navigational search),咱們分別來看看。
信息型搜索,就是要找某個(gè)具體的信息或知識(shí),要求當(dāng)然就是準(zhǔn)確、清晰。從清晰性來說,ChatGPT給的這種結(jié)構(gòu)性呈現(xiàn),比傳統(tǒng)搜索引擎強(qiáng)多了!可是從準(zhǔn)確性來說,坦率地說,目前還差點(diǎn)兒,經(jīng)常會(huì)有些似是而非回答,關(guān)鍵是——人家還倍兒自信:
特別是中間那個(gè),給我氣樂了:要這么找富婆,恐怕活不過正月十五!
再來說說瀏覽型搜索,說白了就是用戶給個(gè)關(guān)鍵詞用搜搜引擎幫忙逛街呢,這時(shí)候不要求信息每條都準(zhǔn)確,但是全面性和實(shí)時(shí)性很重要。
拿實(shí)時(shí)性來說,這個(gè)模型目前還是做不到準(zhǔn)實(shí)時(shí)更新的,并且可能因?yàn)橛?xùn)練成本相當(dāng)高,目前其信息的橫截面,應(yīng)該還停留在去年的《紐約時(shí)報(bào)》。
從語言相關(guān)的信息覆蓋度來看,ChatGPT說只有英文語料,中文的問答都是通過機(jī)器翻譯轉(zhuǎn)換成英文進(jìn)行的。這一點(diǎn)也通過實(shí)測(cè)得到了驗(yàn)證,如果要用到只有中文語料中才有的背景知識(shí),它基本上回答得是驢唇不對(duì)馬嘴的:
所以,總結(jié)一下:我認(rèn)為ChatGPT對(duì)于搜索引擎來說,肯定算是一個(gè)重要對(duì)手了。只不過,由于用單條回答替代了信息羅列,對(duì)準(zhǔn)確性的挑戰(zhàn)相當(dāng)大,目前還是任重道遠(yuǎn);另外,現(xiàn)有的技術(shù)??雌饋磉€不能支持準(zhǔn)實(shí)時(shí)的信息索引,這對(duì)其實(shí)用性限制非常大。
(順便說一下,關(guān)于秦明夜走瓦礫場(chǎng)的事兒,普遍認(rèn)為是被宋江所害,然而金圣嘆認(rèn)為,是花榮出的主意。)
然而,目前的ChatGPT,替代維基百科、Stackoverflow這種非實(shí)時(shí)專業(yè)信息社區(qū),前景十分光明。這不,Stackoverflow應(yīng)該已經(jīng)感到了寒意,開始禁止上傳ChatGPT生成的內(nèi)容了。
當(dāng)然,對(duì)那些情緒性、非專業(yè)性的圖文社交網(wǎng)絡(luò),比如微博、Twitter,這么個(gè)說話人五人六、又不知疲倦的機(jī)器人,很可能給整個(gè)社區(qū)內(nèi)容生態(tài)帶來巨變,那就不是顛覆了,有可能直接就給干挺了!
三、圖靈測(cè)試要被通關(guān)了么?
最后,再說說圖靈測(cè)試的事兒。
ChatGPT一出,有群眾驚呼:圖靈測(cè)試要被終結(jié)了!我的看法是,這恐怕還是大大言過其實(shí)了。
圖靈測(cè)試的標(biāo)準(zhǔn),其實(shí)遠(yuǎn)超普通人的想象。要想讓計(jì)算機(jī)聊一會(huì)不露餡兒,關(guān)鍵并不在于寫代碼、問攻略這些專業(yè)問題,而在于人類看起來非常淺近的一些日常聊天。
會(huì)聊的人,聊一兩句對(duì)方就現(xiàn)原形了。比方說,我問ChatGPT的這兩個(gè)問題,您看看它怎么回答的:
前一個(gè)問題,正常的人類回答多半是:“你為啥會(huì)關(guān)心1.25億這個(gè)奇怪的數(shù)???”
后一個(gè)問題,正常的人類回答應(yīng)該是:“這事兒哪能提醒領(lǐng)導(dǎo),多尷尬呀!”
看到這兩個(gè)問題的回答,我知道,雖然ChatGPT在理解和表達(dá)上已經(jīng)取得了長(zhǎng)足的進(jìn)步,但是一些核心的困難點(diǎn)還是如常,并不容易解決。
當(dāng)然,也沒必要要求人工智能一定要通過圖靈測(cè)試,即使通過不了,它潛在的商業(yè)應(yīng)用場(chǎng)景也很多了。只是,客觀地說,在目前的技術(shù)棧和方法體系下,通過圖靈測(cè)試,短期內(nèi)我認(rèn)為還看不見希望。
毫無疑問,ChatGPT是人機(jī)自然語言交互的一個(gè)重要里程碑,并且已經(jīng)具備了在非實(shí)時(shí)、專業(yè)性知識(shí)領(lǐng)域替代原有社區(qū)和垂直搜索的巨大潛力。
當(dāng)然,客觀地說,就目前的狀態(tài)而言,如果說它就能替代搜索引擎,甚至通過圖靈測(cè)試,那無疑是過于樂觀了。
大家不要誤會(huì),我可并不是唱衰ChatGPT!恰恰相反,我覺得這玩意應(yīng)該早點(diǎn)商用,隨著大量用戶反饋的累積,質(zhì)量的提高很可能一日千里,適用的場(chǎng)景也越來越多。只是,就像咱們一開始分析的,如果在大規(guī)模的用戶反饋中甄別高質(zhì)量語料,實(shí)行有監(jiān)督的模型進(jìn)化,可能還真是個(gè)挑戰(zhàn)!
當(dāng)然,作為一個(gè)老碼畜,看到ChatGPT寫的哪些程序,我是為很多碼農(nóng)朋友的未來捏一把汗的。怎么樣,你的后脊梁發(fā)涼了嗎?
關(guān)鍵詞: 爆火的ChatGPT 先顛覆誰 搜索引擎 人工智能