21世紀(jì)經(jīng)濟(jì)報(bào)道記者 蔡姝越 上海報(bào)道
近年來,“AI for Science”“預(yù)訓(xùn)練新范式”“自監(jiān)督學(xué)習(xí)”“計(jì)算機(jī)圖形學(xué)”“深度學(xué)習(xí)框架”等關(guān)鍵詞,是AI開發(fā)者重點(diǎn)關(guān)注的幾個(gè)研究方向。
(相關(guān)資料圖)
9月3日,由機(jī)器之心主辦的“WAIC·AI開發(fā)者日”論壇作為世界人工智能大會的重要分論壇之一,在張江科學(xué)會堂正式拉開帷幕。據(jù)悉,“WAIC·AI開發(fā)者日”論壇是大會期間唯一一場面向 AI開發(fā)者和技術(shù)人員的活動(dòng),也是最受關(guān)注的人工智能技術(shù)論壇之一。
上海市經(jīng)濟(jì)和信息化委員會總工程師張宏韜在論壇開幕式致辭中指出,人工智能是上海落實(shí)國家戰(zhàn)略部署重點(diǎn)發(fā)展的三大先導(dǎo)產(chǎn)業(yè)之一?!敖陙恚虾VㄔO(shè)人工智能上海高地和世界級產(chǎn)業(yè)集群,已形成產(chǎn)業(yè)集聚、創(chuàng)新活躍、要素融通、開放共享的良好發(fā)展生態(tài)。AI開發(fā)者作為其中一項(xiàng)重要力量,鏈接了理論技術(shù)與應(yīng)用實(shí)踐,是人工智能產(chǎn)業(yè)發(fā)展的加速器和主力軍?!彼硎尽?/p>
值得關(guān)注的是,多位專家學(xué)者在會議中分享了近期在研AI技術(shù)的最新進(jìn)展,包括多模態(tài)AI技術(shù)、可控文本、AI技術(shù)與RPA技術(shù)的結(jié)合等。此外,如何在技術(shù)快速發(fā)展的過程中,實(shí)現(xiàn)AI“可信賴”,也是本次會議的關(guān)鍵議題之一。
多項(xiàng)AI在研技術(shù)取得最新進(jìn)展
“多模態(tài)交互”技術(shù)是近期AI領(lǐng)域的關(guān)注重點(diǎn)之一。據(jù)悉,“模態(tài)”(Modality)是德國理學(xué)家赫爾姆霍茨提出的一種生物學(xué)概念,即生物憑借感知器官與經(jīng)驗(yàn)來接收信息的通道,如人類有視覺、聽覺、觸覺、味覺和嗅覺模態(tài)。而多模態(tài)交互與傳統(tǒng)的深度學(xué)習(xí)(Deep Learning)的不同點(diǎn)在于,用戶可以通過聲音、肢體語言、信息載體、環(huán)境等多個(gè)通道與計(jì)算機(jī)進(jìn)行交流,充分模擬人與人之間的交互方式。
清華大學(xué)惠妍講席教授、銜遠(yuǎn)科技創(chuàng)始人周伯文分享了清華協(xié)同交互智能研究中心目前的主要研究課題,即“智能體在于以人為中心的世界和環(huán)境交互的過程中,如何不斷地迭代和自我學(xué)習(xí)”。主要研究方向就包括多模態(tài)表征交互、推理等方面,而研究的核心則會圍繞“可信賴AI”進(jìn)行設(shè)計(jì)。
上文中提到的多模態(tài)AI技術(shù),目前主要存在三個(gè)發(fā)展趨勢。周伯文指出,多模態(tài)AI的第一個(gè)發(fā)展趨勢是越來越多的人在構(gòu)建統(tǒng)一的、跨場景、多任務(wù)、多模態(tài)的技術(shù)原型。第二個(gè)發(fā)展趨勢是越來越多地采用自監(jiān)督學(xué)習(xí)(Self-supervised learning)的方式,通過構(gòu)建自監(jiān)督任務(wù),能夠提高多模態(tài)的表征能力,同時(shí)緩解了缺少大規(guī)模監(jiān)督數(shù)據(jù)的挑戰(zhàn)。而第三個(gè)趨勢則在于多模態(tài)的表征跟知識的融合開始有更進(jìn)一步的拓展,如何更精確、更自動(dòng)化地生成大模型的知識和推理表征,將會是接下來的重點(diǎn)工作。
此外,也有與會專家分享了如何通過AI生成“可控文本”這一技術(shù)的最新進(jìn)展。
瀾舟科技創(chuàng)始人兼CEO周明指出,用戶在使用AI生成文本時(shí),時(shí)常會面臨詞不達(dá)意的情況,此時(shí)便需要設(shè)定一些可控參數(shù)來達(dá)到自己想要的效果,這便是生成“可控文本”的技術(shù)原理。“基于神經(jīng)網(wǎng)絡(luò)的生成模型,目前我們已經(jīng)構(gòu)建了能夠接受垂直數(shù)據(jù)或知識的圖譜,并已開發(fā)了弱標(biāo)注、學(xué)習(xí)數(shù)據(jù)構(gòu)建、篇章結(jié)構(gòu)建模、自動(dòng)評測等技術(shù),能夠支持用戶生成各種各樣的文本?!彼f。
另一方面,AI技術(shù)在機(jī)器人流程自動(dòng)化(以下簡稱“RPA”)領(lǐng)域的應(yīng)用與落地,也是本次論壇的重要議題之一。
實(shí)在智能創(chuàng)始人兼CEO孫林君認(rèn)為,AI技術(shù)興起后,在傳統(tǒng)的RPA領(lǐng)域中,有很多的地方可以與AI進(jìn)行結(jié)合。比如與語音、OCR等技術(shù)的結(jié)合,這是簡單的加法?!癛PA技術(shù)本身存在一些瓶頸,比如要去控制各種各樣的軟件時(shí),首先要識別這些軟件中的要素,但是識別過程強(qiáng)依賴于操作系統(tǒng)底層。”他進(jìn)一步指出,RPA技術(shù)能力的瓶頸和AI結(jié)合后,可以實(shí)現(xiàn)進(jìn)一步的突破,并能真正泛化至所有行業(yè)上的軟件,成為普適性的自動(dòng)化技術(shù)。
如何成為“可信賴AI”?
雖然近年來我國的AI技術(shù)進(jìn)展頗豐,但目前仍存在著部分亟待克服的技術(shù)難點(diǎn)。
周伯文指出,“多模態(tài)理解”加“交互式學(xué)習(xí)”和以人為中心的設(shè)計(jì)模式,在未來的應(yīng)用空間會越來越大,但是在發(fā)展過程中存在著一項(xiàng)較大的挑戰(zhàn)——如何讓AI的理解和執(zhí)行更可控,即如何讓AI真正變成“可信賴AI”?
他認(rèn)為,可信賴AI在發(fā)展的過程中主要面臨著“魯棒性”和“公平無偏”兩項(xiàng)標(biāo)準(zhǔn)的挑戰(zhàn)。
“日常生活中,有三個(gè)領(lǐng)域的AI技術(shù)容易受到攻擊。一是在智能助手領(lǐng)域,可以通過在播放的音樂中插入噪音從而導(dǎo)致系統(tǒng)失控;二是在電商領(lǐng)域,僵尸用戶通過一些社交行為改變系統(tǒng)的推薦機(jī)制;三則是通過擾動(dòng)少量文本攻擊感情分析系統(tǒng)?!敝懿呐e例說明了AI技術(shù)經(jīng)常面臨的三種攻擊類型。
而在社會認(rèn)知公平無偏的層面,他指出,目前的AI技術(shù)仍廣泛存在著偏差的風(fēng)險(xiǎn),尤其是在人臉識別和性別的默認(rèn)問題中?!坝脩舻男袨闀绊憯?shù)據(jù),數(shù)據(jù)會影響算法,如果數(shù)據(jù)具有廣泛的代表性,那么算法就會出現(xiàn)偏差,隨著技術(shù)的迭代,這一偏差會不斷地放大,這就是人工智能落地發(fā)生的真實(shí)挑戰(zhàn)?!敝懿恼f。
而聚焦至AI技術(shù)中的機(jī)器學(xué)習(xí)(Machine Learning)領(lǐng)域,九章云極開源技術(shù)副總裁、D-Lab主任楊健則提到,AI的高度發(fā)展,最核心的貢獻(xiàn)便是來自機(jī)器學(xué)習(xí)。然而,機(jī)器學(xué)習(xí)隨著大量的應(yīng)用和普及,在實(shí)操過程中也出現(xiàn)了瓶頸和短板,在實(shí)現(xiàn)可信賴AI這一目標(biāo)的過程中也遇到了諸多難點(diǎn)。
首先是泛化能力不足。楊健指出,根據(jù)福布斯提供的相關(guān)數(shù)據(jù),全球范圍機(jī)器學(xué)習(xí)的項(xiàng)目能夠真正投入生產(chǎn)的只有10%多一點(diǎn),訓(xùn)練不足、數(shù)據(jù)質(zhì)量不達(dá)標(biāo)、數(shù)據(jù)漂移等問題導(dǎo)致絕大部分項(xiàng)目最后無法投產(chǎn)。另一方面,可解釋性缺乏,導(dǎo)致機(jī)器學(xué)習(xí)目前難以讓用戶理解為什么會做出這些決策,從而難以取得用戶的信任,也成為了達(dá)到可信賴AI這一目標(biāo)的障礙。此外,機(jī)器學(xué)習(xí)目前對決策任務(wù)的支持能力并不足夠,僅依靠對未來結(jié)果的預(yù)測很難提供有效的決策選項(xiàng)。
若要讓AI技術(shù)真正成為“可信賴AI”,又需要具體符合哪些條件?周伯文認(rèn)為,可信賴AI需要具備6個(gè)原則和要素,即穩(wěn)健性、可復(fù)制、可解釋、公平、價(jià)值對齊、負(fù)責(zé)任。
“以上提到的6個(gè)維度,背后本質(zhì)上面臨的都是技術(shù)挑戰(zhàn)。但是AI一定具有社會屬性,這一點(diǎn)也會倒逼AI開發(fā)者思考技術(shù)進(jìn)步。我相信目前存在的問題,將會通過未來技術(shù)的進(jìn)步逐一解決?!彼f。
關(guān)鍵詞: AI開發(fā)者日觀察如何實(shí)現(xiàn)AI技術(shù)可信賴 自監(jiān)督學(xué)習(xí)