新年伊始,新型智能AI聊天機器人模型ChatGPT橫空出世,在全球掀起廣泛熱潮。它能夠通過學(xué)習(xí)和理解人類的語言來進行對話,如流暢對答、寫代碼、寫劇本、內(nèi)容糾錯等,表現(xiàn)出各種驚人的能力。短短兩個月,ChatGPT用戶量破億,日活量也已突破1000萬。與此同時,微軟、谷歌、百度等互聯(lián)網(wǎng)公司與科技巨頭宣布跟進布局,發(fā)布或?qū)l(fā)布最新的對話式AI產(chǎn)品。ChatGPT正在以其強大的人工智能語言處理能力,再次掀起公眾對AI聊天機器人的關(guān)注熱潮。
一、ChatGPT為何如此火爆?
ChatGPT是美國人工智能知名研究機構(gòu)OpenAI公司對外發(fā)布的一款聊天機器人,使用的是該公司的大型語言模型GPT-3.5加上instructGPT融合形成的一個語言大模型,用于處理自然語言問答。OpenAI的官方說法是,“我們已經(jīng)訓(xùn)練了一個名為 ChatGPT 的模型,它以對話的方式進行交互。對話模式使 ChatGPT能夠回答連續(xù)的問題、承認(rèn)錯誤、質(zhì)疑不正確的前提并拒絕不恰當(dāng)?shù)恼埱蟆hatGPT是InstructGPT的兄弟模型,InstructGPT模型被訓(xùn)練為遵循對話中的指令并提供詳細(xì)的響應(yīng)?!?/p>
【資料圖】
ChatGPT能夠如此火爆的根本原因,在于它能夠迅速響應(yīng)用戶輸入的文本請求,通過其廣泛的知識面與流暢的回答,使得AI聊天機器人趨近于一個“真人”的表現(xiàn)。ChatGPT目前主要被用于聊天機器人、問答系統(tǒng)和其他自然語言處理應(yīng)用中,目前大家在線體驗的ChatGPT服務(wù),是基于ChatGPT模型封裝的在線問答SaaS服務(wù),可以基于用戶輸入文本實現(xiàn)對話聊天、內(nèi)容創(chuàng)作甚至是修訂代碼等功能。
二、ChatGPT的三大核心能力
1、具備媲美人類的創(chuàng)造力,替代部分腦力性質(zhì)勞動
ChatGPT使用基于Transformer、GPT3.5架構(gòu)的大規(guī)模語言模型(LLM,Large Language Model),大模型參數(shù)高達1750億。區(qū)別于之前的“小模型”針對單類任務(wù)、根據(jù)已有數(shù)據(jù)進行分析、判斷進而預(yù)測,大模型通過海量數(shù)據(jù)學(xué)習(xí)歸納后可以實現(xiàn)對復(fù)雜任務(wù)理解進而演繹創(chuàng)造。因此ChatGPT具備一定的創(chuàng)造能力,可被應(yīng)用在多個行業(yè)。比如根據(jù)人類提供的文字描述,編寫高質(zhì)量的廣告文案、教學(xué)材料;根據(jù)任務(wù)描述和提示,幫助程序員寫代碼,甚至通過代碼發(fā)送郵件。ChatGPT比人類更具有效率,可以替代部分腦力勞動,從而大幅提升生產(chǎn)力。
2、多模場景相互結(jié)合,應(yīng)用前景廣闊
ChatGPT在多模態(tài)領(lǐng)域的能力同樣也令人期待。事實上,得益于大模型千億級的參數(shù)和TB級別的數(shù)據(jù)集量,其在圖像、視頻、語音語義等領(lǐng)域的應(yīng)用效果也十分出眾,已涌現(xiàn)以文本輸入為主導(dǎo),不同模態(tài)的生成模型。包括文字-圖像生成(Dalle-2模型)、文字-文字生成(ChatGPT)、文本-視頻生成(Make-A-Video模型),文本-3D建模生成(DreamFusion)等。以ChatGPT對文字任務(wù)的理解能力,賦能多模態(tài)場景的應(yīng)用,將高效完成更多創(chuàng)造性工作。比如設(shè)計師簡要描述一種風(fēng)格,用ChatGPT擴展成具象化、細(xì)節(jié)繁多的文字描述,再用Dalle-2模型生成高質(zhì)量圖像。過程中設(shè)計師只需要提供一個點子,就可生成具象的圖像、視頻、3D模型方案,這將大幅拓展其應(yīng)用場景。
3、深度理解人類語音語義,大幅提升對話體驗
ChatGPT通過使用人類反饋強化學(xué)習(xí)(RLHF)算法針對對話進行了優(yōu)化,根據(jù)人類回答反饋和對話上下文邏輯,生成更連貫、更準(zhǔn)確的對話內(nèi)容。不同于現(xiàn)有的聊天機器人的一問一答模式,與ChatGPT的交流更貼近正常聊天,它可以深度理解你的語義,增添聊天的樂趣。比如根據(jù)多輪的提示和指引,ChatGPT已經(jīng)可以正確回答腦筋急轉(zhuǎn)彎,或者回答出“高情商”的答案(圖1)。
圖1:ChatGPT“高情商”回答
三、ChatGPT賦能運營商三大業(yè)務(wù)方向
1、toC端:賦能AI個人助理場景
ChatGPT有望成為用戶真正的私人工作助理和生活小幫手,植入到用戶所有智能終端中,基于其強大的“生成式”AI能力,對個人用戶提供面向生活、工作多場景全方位服務(wù),大幅增強用戶體驗?;贑hatGPT技術(shù)的AI個人助理,可以根據(jù)用戶平時的工作、生活習(xí)慣以及行程安排,結(jié)合與用戶對話內(nèi)容的上下文分析,為用戶提供合理的決策建議與解決方案。比如,用戶可以列出本周的工作關(guān)鍵詞,讓它寫一篇工作報告;或者讓它幫訂一張從上海到北京的機票,以及不方便接電話時,自動生成文字應(yīng)答與來電者對話。ChatGPT能夠大幅超越運營商通信助理的智能應(yīng)答、留言信箱等傳統(tǒng)功能,并結(jié)合多元化音色與外形的虛擬數(shù)字人形象,全方位提升C端用戶AI助理使用體驗及用戶黏性。
作為運營商利用ChatGPT研發(fā)AI助理產(chǎn)品的先行者,SK電訊在近日公布了其首款大型商用AI產(chǎn)品“A.”的產(chǎn)品愿景。據(jù)其首席財務(wù)官表示,“A.”是第一款韓語GPT3產(chǎn)品,重點加強了長期記憶能力和處理圖像、語音、數(shù)據(jù)以及文本的“多模”能力上。“A.”將被打造成為個人客戶服務(wù)的一個“日常數(shù)字伙伴”,提供更自然的交互界面,以及提供“基于差異化對話的差異化服務(wù)”的能力。
2、toB端:賦能政企服務(wù)場景
目前,ChatGPT在B端產(chǎn)品中的定位相對明確,可作為輔助工具來改進或提升現(xiàn)有企業(yè)服務(wù)類產(chǎn)品功能。當(dāng)把ChatGPT的文本交互與內(nèi)容生成能力,擴展到語音、視覺等多模態(tài)數(shù)據(jù)空間中時,與圖像識別、音頻識別等技術(shù)的結(jié)合將產(chǎn)生無限可能。搭載ChatGPT的toB工具主要提供語義理解與信息檢索、代碼糾錯與生成、文案、圖片內(nèi)容創(chuàng)作等功能,賦能法律、媒體、IT等垂直行業(yè)。
目前,在該應(yīng)用領(lǐng)域,諸多科技巨頭開始布局并發(fā)布相關(guān)產(chǎn)品戰(zhàn)略,例如京東云宣布旗下言犀人工智能應(yīng)用平臺將推出產(chǎn)業(yè)版ChatGPT:ChatJD,并公布ChatJD的落地應(yīng)用路線圖“125”計劃?!?”是指ChatJD智能人機對話平臺;“2”即零售、金融;“5”即包括內(nèi)容生成、人機對話、用戶意圖理解、信息抽取、情感分類五大應(yīng)用場景。
ChatGPT等大模型的運行和服務(wù)離不開算力和網(wǎng)絡(luò)支撐,運營商作為新型云、網(wǎng)、算力等信息基礎(chǔ)設(shè)施服務(wù)運營者,應(yīng)積極關(guān)注產(chǎn)業(yè)版“ChatGPT”,考慮在政企等業(yè)務(wù)上通過自研、投資、合作研發(fā)等方式,為千行百業(yè)數(shù)字化轉(zhuǎn)型賦能提供重要工具,通過合作打造億級參數(shù)量的垂直行業(yè)領(lǐng)域大模型,以更小規(guī)模、更短訓(xùn)練周期、更低計算資源達到百億甚至千億參數(shù)量級的模型效果,實現(xiàn)通用大模型結(jié)果可復(fù)現(xiàn)、成本可控制、應(yīng)用可落地的目標(biāo)。
3、toH端:賦能智能家居場景
傳統(tǒng)智能家居中智能音箱、家居機器人中語音助手的交互更類似于搜索引擎,產(chǎn)品僅能對相應(yīng)問題及指令做出簡單回應(yīng)。未來搭載ChatGPT生成式AI加上語音控制功能后,能夠自動生成完整的對話語句,智能家居產(chǎn)品反饋的豐富程度及準(zhǔn)確性將大幅提升,對用戶需求的理解更加智能。同時,基于ChatGPT的自回歸特性下的自學(xué)習(xí)能力,當(dāng)用戶發(fā)出指令時,ChatGPT能夠根據(jù)用戶平常的使用習(xí)慣和當(dāng)時的場景,給出最合適的執(zhí)行意圖。用戶不再需要進行復(fù)雜的操作,讓過去的被動式智能家居操控有望變成個性化的主動服務(wù),將為用戶提供更簡化、自然、智能的居家體驗。
圖2:亞馬遜家庭陪護機器人Astro
以亞馬遜的家庭陪護機器人Astro為例,其帶有智能顯示器,麥克風(fēng),揚聲器,夜視LED,潛望鏡攝像頭等設(shè)備,能夠語音交互、監(jiān)控家庭安全、檢測寵物等,已具備自學(xué)習(xí)與多模交互能力。智慧家庭作為運營商業(yè)務(wù)中越發(fā)重要的一環(huán),從家庭云到IPTV、智慧安防監(jiān)控、全屋智能等產(chǎn)品形態(tài)及終端來看,搭載ChatGPT的家庭側(cè)智慧終端AI助手會進一步普及人機自然對話的交互方式,并很可能從文本對話模式擴展到語音對話模式,進而將大大提升信息通信流量和用戶粘度,將為家庭用戶帶來更加高效和智能的體驗,提升智慧家庭和垂直行業(yè)的數(shù)字化水平。
四、結(jié)語
短短三個月,關(guān)于ChatGPT的討論席卷全世界,引發(fā)各行各業(yè)的無限遐想。作為AI技術(shù)發(fā)展的新高度,ChatGPT所引發(fā)的“AI即服務(wù)”趨勢拓展了更大的業(yè)務(wù)空間,為通信業(yè)創(chuàng)新提供了廣闊舞臺。作為通信運營商,應(yīng)該積極跟進AI領(lǐng)域前沿技術(shù)發(fā)展及基礎(chǔ)研究工作,基于垂直行業(yè)及關(guān)鍵場景拓展相關(guān)業(yè)務(wù)布局,并時刻關(guān)注ChatGPT相關(guān)創(chuàng)新產(chǎn)品應(yīng)用及發(fā)展趨勢。從重要舉措來看,一是以服務(wù)對象為切入角度,加大基于垂直行業(yè)領(lǐng)域的大模型建設(shè),以通用模型能力高效賦能2C、2B、2H等業(yè)務(wù),提升現(xiàn)有算法服務(wù)能力及水平。二是升級運營商平臺側(cè)的通用AI能力,積極探索AI+多模態(tài)融合的新場景,挖掘新興AI技術(shù)的落地應(yīng)用,如智能數(shù)字人助理、家庭服務(wù)機器人等。三是要關(guān)注生成類AI產(chǎn)品的應(yīng)用風(fēng)險和監(jiān)管問題,只有確保在合法、合規(guī)、合理的范圍內(nèi)服務(wù)用戶,才能順利引導(dǎo)新技術(shù)的廣泛應(yīng)用,在這波AI產(chǎn)業(yè)發(fā)展熱潮中占得先機。