扎克伯格:AI技術(shù)才是AR和VR的萬(wàn)物之源

發(fā)布時(shí)間:2022-02-25 05:01:34  |  來(lái)源:騰訊網(wǎng)  

在去年一連串的轟炸之下,“元宇宙”這個(gè)詞終于被“用濫了”。

當(dāng)Meta提出全面轉(zhuǎn)型元宇宙時(shí),就已經(jīng)騙過(guò)了不少人。而當(dāng)那些追隨者紛紛曬出自己所謂的“元宇宙”產(chǎn)品時(shí),Meta再一次拿技術(shù)實(shí)力打了它們的臉。

充分結(jié)合了AI技術(shù),將是未來(lái)AR/VR發(fā)展的重要一環(huán),這一點(diǎn)我們?cè)赒uest 2、以及Workrooms等產(chǎn)品上已經(jīng)看到。包括Quest 2的定位追蹤,手勢(shì)識(shí)別,桌面和沙發(fā)追蹤,鍵盤(pán)追蹤等都不離不開(kāi)AI技術(shù)的加入。

這一次,Meta打算進(jìn)一步發(fā)揮AI的作用,讓AI技術(shù)生成你想要的虛擬場(chǎng)景,“你說(shuō)出來(lái),機(jī)器就做出來(lái)”,給了一眾BUG多、審美怪的”元宇宙“怪咖當(dāng)頭一棒。

不僅如此,這項(xiàng)研究基礎(chǔ)“基于AI的語(yǔ)言和機(jī)器翻譯模型”也將被用于更多場(chǎng)景。在今天的AI技術(shù)論壇(Inside the Lab)上,Meta向外界展示包括:Builder Bot、基于LASER語(yǔ)言工具包的多語(yǔ)言翻譯模型、語(yǔ)音助理AI模型Project CAIRaoke、成立人工智能學(xué)習(xí)聯(lián)盟,免費(fèi)在線提供課程。

同時(shí),Meta熟悉AI科學(xué)家楊立昆也分享了打造具備生物級(jí)別思考能力的AI模型愿景,通過(guò)自主智能架構(gòu),讓AI模擬世界的運(yùn)作方式,接近人類智能水平,簡(jiǎn)直不可思議。

當(dāng)然,我們?cè)诒疚闹袑⒅攸c(diǎn)來(lái)說(shuō)一下Builder Bot和多語(yǔ)言翻譯模型。

1,理想化的三維場(chǎng)景創(chuàng)建模型

眾所周知,目前的VR設(shè)計(jì)平臺(tái)一個(gè)重點(diǎn)就是虛擬場(chǎng)景的豐富性,其中包括頭部VR社交平臺(tái)已經(jīng)允許用戶自定義虛擬場(chǎng)景,這是保持多樣性的重要一步。

對(duì)于大多數(shù)而言,在三維場(chǎng)景中(例如佩戴VR條件下)創(chuàng)作并非易事,不僅效率低下,而且難以達(dá)到理想的狀態(tài)。當(dāng)然,我們知道很多的虛擬場(chǎng)景基本上也都是在2D屏幕下,通過(guò)專業(yè)設(shè)計(jì)師或準(zhǔn)專業(yè)人士(愛(ài)好者等等)來(lái)開(kāi)發(fā)的。

所以,對(duì)于Meta這樣的企業(yè)也一直在思考,VR和AR中的便捷性如何體現(xiàn)。

AI或許是最好的方案。就像是如今AI創(chuàng)作畫(huà)作一樣,將AI技術(shù)延伸到三維場(chǎng)景中,你指出要說(shuō)出你想要的場(chǎng)景,Builder Bot就能幫你實(shí)現(xiàn)。

從上面的視頻也能看出,扎克伯格的整個(gè)演示視頻基本十分流暢,機(jī)器能夠聽(tīng)懂創(chuàng)作者意圖并且給出基本合理的場(chǎng)景,很難挑出其中的瑕疵。

扎克伯格表示:AI是元宇宙的關(guān)鍵技術(shù)之一。正如AI、機(jī)器學(xué)習(xí)等技術(shù)在其它領(lǐng)域的應(yīng)用,在虛擬場(chǎng)景中它可以用來(lái)幫助我們很好地理解上下文,甚至像人類一樣理解和預(yù)測(cè)我們想要做什么。這一趨勢(shì),未來(lái)會(huì)更為明顯。

2,人工智能學(xué)習(xí)聯(lián)盟

在介紹翻譯系統(tǒng)之前,我們先來(lái)看一下Meta的人工智能學(xué)習(xí)聯(lián)盟。

扎克伯格舉例表示:目前的AI系統(tǒng)多收到過(guò)監(jiān)督學(xué)習(xí)訓(xùn)練,也就是說(shuō),如果想讓系統(tǒng)知道這張照片中是一只貓,就需要明確告訴它,并且拿出幾萬(wàn)張貓的圖片進(jìn)行標(biāo)注,讓系統(tǒng)進(jìn)行監(jiān)督學(xué)習(xí)。這些系統(tǒng)有著不錯(cuò)的效果,尤其是用于圖像和視頻領(lǐng)域,但前提是需要進(jìn)行大量數(shù)據(jù)標(biāo)注的學(xué)習(xí)過(guò)程。

因?yàn)樵谔摂M的三維場(chǎng)景中,環(huán)境復(fù)雜多變,就像現(xiàn)實(shí)環(huán)境一樣,幾乎很難用傳統(tǒng)的數(shù)據(jù)標(biāo)記法進(jìn)行監(jiān)督式學(xué)習(xí),因此也就無(wú)法支撐自由、隨意互動(dòng)的元宇宙生態(tài)。

Meta首席AI科學(xué)家楊立昆,也是2018年圖靈獎(jiǎng)得主,他認(rèn)為:“自監(jiān)督學(xué)習(xí)”可以提供真正的接近人類思維的AI系統(tǒng)。感興趣的朋友,也建議讀一下楊立昆的《科學(xué)之路》這本書(shū)。

自監(jiān)督學(xué)習(xí)的優(yōu)勢(shì)在于無(wú)需給出數(shù)據(jù)標(biāo)注,模型可以從無(wú)標(biāo)注的數(shù)據(jù)中自我學(xué)習(xí),是一種理想的機(jī)器學(xué)習(xí)模型。

目前Meta已經(jīng)聯(lián)合13所大學(xué)組成聯(lián)盟,組成了有史以來(lái)最大的自我監(jiān)督學(xué)習(xí)數(shù)據(jù)集,目前積累了幾千小時(shí)的第一人稱視頻,大家可用于研究在虛擬空間中的任何工作。

3,多語(yǔ)言翻譯系統(tǒng)

雖然現(xiàn)在翻譯軟件已經(jīng)能夠很好的應(yīng)用到文本中來(lái),YouTube視頻也支持提取英文并進(jìn)行翻譯,但是在三維場(chǎng)景中存在同樣的問(wèn)題。

如同我們?nèi)粘I?,在虛擬場(chǎng)景中與任何人交流時(shí)并不會(huì)看到文字或字幕,即便是外國(guó)人。因此,常規(guī)的翻譯方案并不適用于三維場(chǎng)景。

扎克伯格表示:目前全球仍有近一半人群無(wú)法在互聯(lián)網(wǎng)上使用自己的語(yǔ)言,例如在中非和西非地區(qū)有幾百萬(wàn)人的語(yǔ)言在互聯(lián)網(wǎng)并不流行,只能訪問(wèn)英文或其它語(yǔ)言。

另一個(gè)現(xiàn)實(shí)是,即便目前最主流的機(jī)器學(xué)習(xí)翻譯模型,也只能通過(guò)英語(yǔ)作為中轉(zhuǎn)語(yǔ)言,即:將A語(yǔ)言翻譯為英文,再將英文翻譯為B語(yǔ)言。

而這就會(huì)給翻譯增加一些噪點(diǎn)和不確定性。為此,Meta推出了開(kāi)源AI翻譯模型:LASER語(yǔ)言工具包。

LASER特點(diǎn)是可以將任何句子轉(zhuǎn)換為其它語(yǔ)言,省去了英文中轉(zhuǎn)步驟,例如A語(yǔ)言可以直接翻譯為B語(yǔ)言。

目前,已經(jīng)支持100多種語(yǔ)言的翻譯,并且進(jìn)行了1400小時(shí)的法語(yǔ)、德語(yǔ)、西班牙語(yǔ)、英語(yǔ)之間確定性的語(yǔ)音對(duì)齊。這其中的難點(diǎn)包括:口語(yǔ)到書(shū)面語(yǔ)的表達(dá)形式不同,尤其是少見(jiàn)的沒(méi)有書(shū)面習(xí)慣的語(yǔ)言。

為此,Meta也正在開(kāi)發(fā)一套語(yǔ)音到語(yǔ)音翻譯系統(tǒng),即可以實(shí)現(xiàn):A語(yǔ)言的人說(shuō)話,B語(yǔ)言的人直接收聽(tīng)翻譯后的語(yǔ)音。Meta表示:這種方法已經(jīng)被證明比常規(guī)單獨(dú)語(yǔ)音識(shí)別+機(jī)器翻譯的合成模型要更快。

當(dāng)然,這類語(yǔ)音到語(yǔ)音的翻譯系統(tǒng),更是為了今后的AR眼鏡所準(zhǔn)備,屆時(shí)一套接近人類翻譯水平的實(shí)時(shí)翻譯眼鏡就。

除此之外,Meta還公布了CAIRaoke,這是一套專為AR虛擬助手開(kāi)發(fā)的AI對(duì)話模型,目的是讓機(jī)器人聊天助手更好的理解你的說(shuō)話內(nèi)容,可以更好與你對(duì)話,在三維場(chǎng)景中互動(dòng)。

關(guān)鍵詞: 扎克伯格AI技術(shù)才是AR和VR的萬(wàn)物之源 人工智能

 

網(wǎng)站介紹  |  版權(quán)說(shuō)明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營(yíng)業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com