(CWW)近期,以“生成式人工智能”(Generative AI)為核心技術(shù)的聊天機(jī)器人ChatGPT火爆全球。百度、阿里巴巴、科大訊飛、360等國(guó)內(nèi)企業(yè)紛紛拋出ChatGPT相關(guān)進(jìn)展,打造中國(guó)版的ChatGPT。
科大訊飛此前在投資者互動(dòng)平臺(tái)表示,ChatGPT主要涉及到自然語(yǔ)言處理相關(guān)技術(shù),屬于認(rèn)知智能領(lǐng)域的應(yīng)用之一,公司在該方向技術(shù)和應(yīng)用具備長(zhǎng)期深厚的積累。并稱2022年12月已進(jìn)一步啟動(dòng)生成式預(yù)訓(xùn)練大模型任務(wù)攻關(guān),類ChatGPT技術(shù)將在今年5月率先落地科大訊飛AI學(xué)習(xí)機(jī)產(chǎn)品。
(資料圖片)
近日,科大訊飛副總裁、研究院執(zhí)行院長(zhǎng)劉聰圍繞什么是ChatGPT,它強(qiáng)在哪里?會(huì)對(duì)未來(lái)世界帶來(lái)哪些顛覆性影響?進(jìn)一步闡述ChatGPT來(lái)的的模式創(chuàng)新與產(chǎn)業(yè)變革。
劉聰,科大訊飛副總裁、研究院執(zhí)行院長(zhǎng)
語(yǔ)音及語(yǔ)言信息處理國(guó)家工程研究中心副主任,國(guó)家級(jí)領(lǐng)軍人才
ChatGPT將會(huì)對(duì)未來(lái)世界帶來(lái)哪些重大影響?
在劉聰看來(lái),ChatGPT本質(zhì)上是一個(gè)由浮點(diǎn)數(shù)參數(shù)表示的深度神經(jīng)網(wǎng)絡(luò)大模型,屬于深度學(xué)習(xí)的框架。ChatGPT的推出是深度學(xué)習(xí)提出后又一個(gè)里程碑式的技術(shù)革命,將為以自然語(yǔ)言處理為核心的認(rèn)知智能技術(shù)發(fā)展提供新的“歷史機(jī)遇期”。
這次ChatGPT引發(fā)全球?qū)W術(shù)界和產(chǎn)業(yè)界的熱議和關(guān)注,關(guān)鍵原因是ChatGPT通過(guò)至少以下五個(gè)維度能力的顯著提升,實(shí)現(xiàn)了初步的“智慧涌現(xiàn)”:
1、海量高價(jià)值信息的全量在線記憶能力;2、自然語(yǔ)言輸入的任意任務(wù)和多輪對(duì)話理解能力;3、復(fù)雜邏輯的思維鏈推理能力;4、多角色多風(fēng)格的長(zhǎng)文本生成表達(dá)能力;5、即時(shí)新知識(shí)學(xué)習(xí)應(yīng)用與進(jìn)化能力。此外,因?yàn)橐肓舜a作為訓(xùn)練語(yǔ)料,ChatGPT還額外產(chǎn)生了自動(dòng)寫(xiě)代碼和理解代碼的能力。
綜合來(lái)看,ChatGPT的能力之強(qiáng)已不僅是停留在單一場(chǎng)景的人機(jī)對(duì)話,而是一個(gè)同時(shí)具備多種能力的通用“對(duì)話式AI系統(tǒng)”。與傳統(tǒng)認(rèn)知智能需要針對(duì)各領(lǐng)域任務(wù)定制對(duì)應(yīng)的系統(tǒng)不同,它不僅能完成多個(gè)場(chǎng)景、多輪的相當(dāng)自然的人機(jī)對(duì)話,更為重要的是以自然語(yǔ)言交互式學(xué)習(xí)的“類人”新范式,能在多輪交互中以“類人”的方式交流、學(xué)習(xí)和進(jìn)步,并可以自主、快速、不間斷地學(xué)習(xí)各領(lǐng)域?qū)I(yè)知識(shí)并達(dá)到人類專家水平。
他進(jìn)一步談到,ChatGPT的初步突破帶來(lái)的當(dāng)前影響和未來(lái)想象空間是巨大的。在技術(shù)演化的基礎(chǔ)上,以自然語(yǔ)言處理為代表的人工智能算法有可能重構(gòu)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的產(chǎn)品形態(tài),促進(jìn)教育業(yè)、醫(yī)療業(yè)、汽車業(yè)、金融業(yè)、消費(fèi)業(yè)、媒體業(yè)、服務(wù)業(yè)和制造業(yè)等眾多產(chǎn)業(yè)的升級(jí),最終帶來(lái)對(duì)應(yīng)商業(yè)模式的變革。
劉聰認(rèn)為,類ChatGPT模型的持續(xù)發(fā)展未來(lái)至少會(huì)從以下4個(gè)方面的能力提升推動(dòng)產(chǎn)業(yè)變革與模式創(chuàng)新:
一是改變現(xiàn)有人機(jī)交互模式。未來(lái)人們可能用自然對(duì)話的方式與智能產(chǎn)品交互,ChatGPT通過(guò)精準(zhǔn)理解用戶意圖,調(diào)用系統(tǒng)的各種軟件或服務(wù)來(lái)滿足用戶需求,提高交互效率與任務(wù)成功率。這種人機(jī)交互模式的改變將可能改變當(dāng)前的APP等應(yīng)用的使用方式,例如多個(gè)功能的軟件能力被整合,甚至出現(xiàn)“大一統(tǒng)”能力的超級(jí)通用APP。
二是改變信息分發(fā)獲取模式。基于認(rèn)知智能技術(shù)可實(shí)現(xiàn)更高效的信息整合和知識(shí)推薦等。以搜索為例,傳統(tǒng)搜索引擎根據(jù)關(guān)鍵字匹配內(nèi)容,使用者需要在海量搜索結(jié)果中篩選出有用信息,而ChatGPT加持的必應(yīng)直接給出答案,并提高了問(wèn)題與答案的匹配精準(zhǔn)度,大大提升用戶體驗(yàn)。信息分發(fā)獲取模式的改變將影響流量的分布,并改變流量變現(xiàn)的商業(yè)模式。
三是革新內(nèi)容生產(chǎn)模式,提高生產(chǎn)力。作為AIGC(人工智能生成內(nèi)容)技術(shù)的典型代表,ChatGPT一經(jīng)上線便被大量應(yīng)用于公文寫(xiě)作、郵件編寫(xiě)、代碼編寫(xiě)等,ChatGPT的編程能力將極大拓展普通人利用電腦和網(wǎng)絡(luò)進(jìn)行創(chuàng)新和創(chuàng)意的能力。未來(lái)ChatGPT被集成到word、excel、ppt等工具軟件后,將提升內(nèi)容生產(chǎn)效率與豐富度,變革人們的辦公方式,成為新的全行業(yè)生產(chǎn)力工具。ChatGPT還將帶動(dòng)圖像、音頻、視頻等形式的AIGC技術(shù)與產(chǎn)業(yè)發(fā)展,使得AIGC的內(nèi)容既有“好看的外在”,更有“豐富的內(nèi)涵”。
四是加速“AI for Science”的發(fā)展。對(duì)于科研人員,ChatGPT不僅可以輔助生成論文摘要與文獻(xiàn)綜述,隨著其學(xué)習(xí)的科研數(shù)據(jù)越來(lái)越多,未來(lái)有可能提供專業(yè)的研究建議甚至主動(dòng)探索發(fā)現(xiàn)新的理論,帶來(lái)整個(gè)科學(xué)研究范式的全新變化,把“AI for Science”推上一個(gè)全新臺(tái)階。
這次ChatGPT所帶來(lái)的革命將會(huì)深刻地改變當(dāng)今世界的生產(chǎn)和生活方式,重構(gòu)產(chǎn)業(yè)格局,是人工智能領(lǐng)域推動(dòng)工業(yè)乃至社會(huì)變革的重大戰(zhàn)略機(jī)遇,是未來(lái)發(fā)展兵家必爭(zhēng)之地。
科大訊飛在ChatGPT方面有哪些布局?未來(lái)研發(fā)計(jì)劃如何?
在ChatGPT引發(fā)的AI技術(shù)新一輪熱潮背景下,科大訊飛基于認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室,已在核心算法、行業(yè)數(shù)據(jù)、算力支撐及團(tuán)隊(duì)組建等方面建立了優(yōu)勢(shì)保障。
核心算法上,在Transformer深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富經(jīng)驗(yàn),已廣泛應(yīng)用于科大訊飛的語(yǔ)音識(shí)別、圖文識(shí)別、機(jī)器翻譯等任務(wù)并達(dá)到國(guó)際領(lǐng)先水平;創(chuàng)新提出了知識(shí)與大模型融合統(tǒng)一的理解框架X-Reasoner,有望彌補(bǔ)大模型的模糊記憶技術(shù)短板,并在認(rèn)知智能技術(shù)領(lǐng)域,2022年累計(jì)獲得了常識(shí)閱讀理解挑戰(zhàn)賽OpenBookQA等13項(xiàng)世界冠軍;開(kāi)源了6個(gè)大類、超過(guò)40個(gè)通用領(lǐng)域的系列中文預(yù)訓(xùn)練語(yǔ)言模型,相關(guān)模型庫(kù)月均調(diào)用量超1000萬(wàn),在Github平臺(tái)獲得星標(biāo)數(shù)位列同類中文預(yù)訓(xùn)練語(yǔ)言模型第一并遠(yuǎn)超第二名。
數(shù)據(jù)積累上,在嚴(yán)格遵守適用法律法規(guī)前提下,在多年認(rèn)知智能系統(tǒng)研發(fā)推廣中積累了超過(guò)50TB的行業(yè)語(yǔ)料和每天超10億人次用戶交互的活躍應(yīng)用,為訓(xùn)練實(shí)現(xiàn)達(dá)到人類專家水平的行業(yè)認(rèn)知大模型提供了海量行業(yè)文本語(yǔ)料和用戶反饋數(shù)據(jù),也為基于大模型的創(chuàng)新應(yīng)用研發(fā)和試點(diǎn)推廣提供了場(chǎng)景保障。
算力支撐上,訊飛在總部自建有業(yè)界一流的數(shù)據(jù)中心,為大模型訓(xùn)練平臺(tái)建設(shè)奠定了很好的硬件基石。此外,在工程技術(shù)方面實(shí)現(xiàn)了百億參數(shù)大模型推理效率的近千倍加速,為未來(lái)更大更多認(rèn)知智能大模型技術(shù)經(jīng)濟(jì)實(shí)惠規(guī)?;瘧?yīng)用提供了可能。
劉聰表示:“結(jié)合我們多年來(lái)在深度學(xué)習(xí)算法、大模型技術(shù)、行業(yè)大數(shù)據(jù)、知識(shí)圖譜、多模態(tài)感知、系統(tǒng)工程技術(shù)方面優(yōu)勢(shì)積累,通過(guò)最近兩個(gè)多月的系統(tǒng)分析和快速驗(yàn)證,我們非常有信心實(shí)現(xiàn)ChatGPT類似的技術(shù)階躍進(jìn)步,并在中文認(rèn)知智能領(lǐng)域達(dá)到國(guó)際領(lǐng)先水平?!?/p>
為了進(jìn)一步提高大模型在細(xì)分行業(yè)的實(shí)用性,劉聰說(shuō),訊飛計(jì)劃采用“1+N”架構(gòu),其中“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺(tái),“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公、翻譯、汽車、工業(yè)等多個(gè)行業(yè)領(lǐng)域的專用大模型版本。例如,通過(guò)學(xué)習(xí)海量醫(yī)學(xué)教材、論文和病例,實(shí)現(xiàn)專業(yè)的醫(yī)療領(lǐng)域?qū)υ捠紸I系統(tǒng),打造“每個(gè)醫(yī)生的AI診療助理,每個(gè)人的AI健康助手”。
此外,訊飛也非常希望基于認(rèn)知大模型與各行各業(yè)的伙伴們?cè)谄髽I(yè)數(shù)字化、行業(yè)內(nèi)容生產(chǎn)等方面開(kāi)展深入合作,基于行業(yè)數(shù)據(jù)與知識(shí),形成智能化定制解決方案。我們的技術(shù)底座和行業(yè)積累合力共贏,能助力合作伙伴跨越認(rèn)知智能技術(shù)壁壘,提高產(chǎn)品競(jìng)爭(zhēng)力,實(shí)現(xiàn)協(xié)同創(chuàng)新,共同加快行業(yè)轉(zhuǎn)型升級(jí),推進(jìn)數(shù)字中國(guó)建設(shè)。
此外談及資本市場(chǎng)當(dāng)前的熱潮,劉聰認(rèn)為,全球資本都在ChatGPT的技術(shù)突破后看到了人工智能對(duì)社會(huì)產(chǎn)生的重大產(chǎn)業(yè)機(jī)遇,眾多行業(yè)都有被深度重構(gòu)的機(jī)會(huì),重構(gòu)過(guò)程中一定會(huì)產(chǎn)生巨大的全新商業(yè)價(jià)值,因此資本市場(chǎng)的興奮是可以理解的。
但是我們要踏踏實(shí)實(shí)把科研做好,把產(chǎn)品做好,把服務(wù)做好,最終還是要回到人工智能紅利能否兌現(xiàn)的三大標(biāo)準(zhǔn):“有沒(méi)有看得見(jiàn)摸得著的真實(shí)應(yīng)用案例,有沒(méi)有能夠規(guī)?;茝V應(yīng)用的產(chǎn)品,有沒(méi)有統(tǒng)計(jì)數(shù)據(jù)能夠證明的應(yīng)用成效”,只有這些才能夠經(jīng)得起時(shí)間的考驗(yàn),才能夠真正把人工智能做實(shí)做透。
關(guān)鍵詞: Generative-AI 人工智能 ChatGPT 科大訊飛