機(jī)器之心報(bào)道
編輯:澤南、蛋醬
它們都將成為元宇宙時(shí)代的殺手級(jí) APP?
Meta 正在致力于通過(guò)語(yǔ)音生成元宇宙世界的人工智能研究,還有很多神奇的技術(shù)。首席執(zhí)行官馬克 · 扎克伯格本周三表示,該公司正在研究改善人們與語(yǔ)音助手交流順暢程度,以及在不同語(yǔ)言之間進(jìn)行翻譯的方式。
最近一段時(shí)間,扎克伯格正帶領(lǐng)臉書(shū) all in 元宇宙,并預(yù)測(cè)在未來(lái)人們可以在虛擬世界中工作、社交和娛樂(lè),這一環(huán)境將最終代替互聯(lián)網(wǎng)。
至于元宇宙、虛擬現(xiàn)實(shí)是如何能夠讓人沉浸其中的,「解鎖這些進(jìn)步的關(guān)鍵是人工智能,」扎克伯格說(shuō)道。
讓做飯看起來(lái)和《模擬人生》里一樣簡(jiǎn)單。
Meta 正在研究一類(lèi)新的生成 AI 模型,該模型將允許人們描述一個(gè)世界,人工智能自動(dòng)生成它的各個(gè)方面。在昨天的演示中,扎克伯格展示了一個(gè)名為 Builder Bot 的 AI 概念,人們?cè)谠钪娴膷u嶼上以 3D 化身的形式出現(xiàn),并發(fā)出語(yǔ)音命令創(chuàng)建海灘,系統(tǒng)可以遵從人們的命令隨時(shí)更改天氣,添加樹(shù)木甚至野餐毯。
海灘、島嶼、椰子樹(shù),想要什么場(chǎng)景,跟 AI 說(shuō)一聲就有了 。
「隨著我們進(jìn)一步推動(dòng)這項(xiàng)技術(shù),你將可以創(chuàng)造出夢(mèng)想中的世界,用你的聲音與他人探索和分享經(jīng)驗(yàn)?!共贿^(guò)扎克伯格沒(méi)有為這些計(jì)劃設(shè)定時(shí)間表,也沒(méi)有提供有關(guān) Builder Bot 工作原理的更多細(xì)節(jié)。
另一部分是語(yǔ)音識(shí)別技術(shù),Meta 表示正在研究人工智能,讓人們能夠與語(yǔ)音助手進(jìn)行更自然的對(duì)話(huà),這是讓人們?cè)谠钪嬷信c人工智能順暢交流邁出的一步。扎克伯格表示,該公司的 CAIRaoke 項(xiàng)目是「用于構(gòu)建設(shè)備助手的完全端到端的神經(jīng)模型」。
在扎克伯格的展示中,CAIRaoke 在一個(gè)「非常實(shí)用」的家庭場(chǎng)景中起到了作用:人在煮燉菜時(shí),語(yǔ)音助手會(huì)發(fā)出提示,警告說(shuō)鹽已經(jīng)加到鍋里了。AI 助理還注意到鹽放少了,于是提示要放更多。
在 Meta 隨后發(fā)布的博客中,研究者們對(duì) CAIRaoke 背后的技術(shù)進(jìn)行了解讀。人工智能語(yǔ)音助手的傳統(tǒng)方法需要四組輸入和輸出——管道的每層(NLU、DST、DP 和 NLG)各一組。它還需要為每一層的輸入和輸出定義標(biāo)準(zhǔn)。例如,對(duì)于 NLU,傳統(tǒng)的會(huì)話(huà) AI 系統(tǒng)需要定義的本體(例如,各種意圖和實(shí)體)。
但 Meta 提出的新模型根本沒(méi)有規(guī)定會(huì)話(huà)流,使用時(shí)我們只需要一組訓(xùn)練數(shù)據(jù)。CAIRaoke 減少了添加新域所需的工作。在規(guī)范方法中,擴(kuò)展到新領(lǐng)域需要順序構(gòu)建和更改每個(gè)模塊,然后才能可靠地訓(xùn)練下一個(gè)模塊。換句話(huà)說(shuō),如果 NLU 和 DST 每天都在變化,就無(wú)法有效地訓(xùn)練 DP。一個(gè)組件的更改可能會(huì)破壞其他組件的效果,從而需要對(duì)所有后續(xù)模塊的重新訓(xùn)練。這種相互依賴(lài)減慢了后續(xù)模塊的進(jìn)度。
Meta 的端到端技術(shù)消除了對(duì)上游模塊的依賴(lài),提高了開(kāi)發(fā)和訓(xùn)練速度,使我們能夠以更少的數(shù)據(jù)微調(diào)其他模型。
Meta 表示,它已在旗下的視頻通話(huà)設(shè)備 Portal 中使用該模型,并期待將其集成到具有增強(qiáng)現(xiàn)實(shí) (AR) 和虛擬現(xiàn)實(shí) (VR) 的硬件設(shè)備中。在接受路透社采訪時(shí),Meta 的 AI 副總裁 Jér me Pesenti 表示,該公司正在嚴(yán)格限制其基于 CAIRaoke 人工智能新助手的響應(yīng),直到它能夠確保系統(tǒng)不會(huì)產(chǎn)生冒犯性的語(yǔ)言。
「這些語(yǔ)言模型性能強(qiáng)大…… 我們正在努力研究如何控制,」Pesenti 說(shuō)道。
扎克伯格還宣布,Meta 正在開(kāi)發(fā)一款通用語(yǔ)音翻譯器,旨在提供橫跨所有語(yǔ)言的即時(shí)語(yǔ)音到語(yǔ)音翻譯。該公司此前已為其人工智能系統(tǒng)設(shè)定了翻譯所有書(shū)面語(yǔ)言的目標(biāo)。
「能夠用任何語(yǔ)言與任何人交流,這是人們夢(mèng)寐以求的超能力,而人工智能將在我們有生之年實(shí)現(xiàn)這一目標(biāo)?!乖瞬癖硎尽?/p>
盡管當(dāng)前的翻譯工具可以很好地適用于英語(yǔ)、普通話(huà)、西班牙語(yǔ)等常用語(yǔ)言,但世界上大約 20% 的人口不會(huì)說(shuō)這些系統(tǒng)所涵蓋的語(yǔ)言。通常,這些服務(wù)不足的語(yǔ)言沒(méi)有易于訪問(wèn)的書(shū)面文本語(yǔ)料庫(kù),這些語(yǔ)料庫(kù)也是訓(xùn)練 AI 系統(tǒng)必需的,甚至一些語(yǔ)言根本沒(méi)有標(biāo)準(zhǔn)化的書(shū)寫(xiě)系統(tǒng)。
Meta 表示,它希望通過(guò)在兩個(gè)特定領(lǐng)域部署新的機(jī)器學(xué)習(xí)技術(shù)來(lái)克服這些挑戰(zhàn)。第一個(gè)稱(chēng)為 No Language Left Behind,將專(zhuān)注于構(gòu)建可以使用更少的訓(xùn)練示例學(xué)習(xí)翻譯語(yǔ)言的 AI 模型。第二個(gè)是通用語(yǔ)音翻譯器,旨在構(gòu)建直接將語(yǔ)音從一種語(yǔ)言實(shí)時(shí)翻譯成另一種語(yǔ)言的系統(tǒng),而無(wú)需書(shū)面組件作為中介(書(shū)面中介是許多翻譯應(yīng)用程序的常用技術(shù))。
具體來(lái)說(shuō),Meta 正在構(gòu)建一個(gè)新的高級(jí) AI 模型,其可以從更少的示例中進(jìn)行語(yǔ)言學(xué)習(xí),Meta 將使用它來(lái)實(shí)現(xiàn)數(shù)百種語(yǔ)言的專(zhuān)家級(jí)翻譯,從阿斯圖里亞斯語(yǔ)、盧甘達(dá)語(yǔ)到烏爾都語(yǔ)。Meta 還在構(gòu)建新型通用實(shí)時(shí)語(yǔ)音翻譯器,以支持沒(méi)有標(biāo)準(zhǔn)書(shū)寫(xiě)系統(tǒng)的語(yǔ)言及口頭語(yǔ)。
基于自動(dòng)數(shù)據(jù)集創(chuàng)建工具 LASER,Meta 研究者構(gòu)建了 ccMatrix 和 ccAligned 等系統(tǒng),它們能夠在互聯(lián)網(wǎng)上查找不同語(yǔ)言的平行文本。由于低資源語(yǔ)言的可用數(shù)據(jù)很少,Meta 創(chuàng)建了一種新的訓(xùn)練方法,使 LASER 能夠?qū)W⒂谔囟ǖ恼Z(yǔ)言子組——例如班圖語(yǔ)——并從更小的數(shù)據(jù)集中學(xué)習(xí)。
這些努力使得 LASER 能夠跨語(yǔ)言大規(guī)模有效地運(yùn)行,Meta 最近還將 LASER 擴(kuò)展到了語(yǔ)音處理領(lǐng)域。
為了提升機(jī)器翻譯模型的性能,Meta 投入大量資源創(chuàng)建了大容量且可以高效訓(xùn)練的模型(稀疏門(mén)控的專(zhuān)家混合模型)。通過(guò)增加模型體量和自動(dòng)路徑學(xué)習(xí)功能,不同的符號(hào)可以使用不同的專(zhuān)家能力。為了將基于文本的機(jī)器翻譯模型擴(kuò)展到上百種語(yǔ)言,Meta 構(gòu)建了第一個(gè)不以英語(yǔ)為核心的多語(yǔ)言翻譯系統(tǒng),其效果甚至優(yōu)于最好的雙語(yǔ)翻譯模型。
在宣布這一消息的博客文章中,Meta 研究這還沒(méi)有提供完成這些項(xiàng)目的時(shí)間表,也沒(méi)有提供實(shí)現(xiàn)目標(biāo)的主要路線圖。相反,該公司只是強(qiáng)調(diào)了通用語(yǔ)言翻譯的可能性。
Meta 還設(shè)想這種技術(shù)將極大造福于其遍布全球的產(chǎn)品,進(jìn)一步擴(kuò)大其影響范圍并轉(zhuǎn)變?yōu)閿?shù)百萬(wàn)人必不可少的通信工具。正如博客文章寫(xiě)到的那樣,通用翻譯軟件將成為未來(lái)可穿戴設(shè)備的殺手級(jí)應(yīng)用,如 Meta 正在構(gòu)建的 AR 眼鏡,還將打破「沉浸式」VR 和 AR 現(xiàn)實(shí)空間(Meta 也在構(gòu)建)的界限。
換句話(huà)說(shuō),雖然開(kāi)發(fā)通用翻譯工具會(huì)帶來(lái)人道主義利益,但對(duì)于 Meta 這樣的公司來(lái)說(shuō),它也具有良好的商業(yè)意義。
這家社交媒體為主業(yè)的公司在最近的財(cái)報(bào)公布之后市值縮水了近三分之一,出于對(duì)未來(lái)的思考,臉書(shū)已將努力的主要方向轉(zhuǎn)變?yōu)榻⑻摂M世界,并為此直接更改了公司名稱(chēng)。本月 Meta 報(bào)告稱(chēng),該公司的增強(qiáng)和虛擬現(xiàn)實(shí)業(yè)務(wù) Reality Labs 2021 年凈虧損 102 億美元。
Meta 的 AI 負(fù)責(zé)人 Pesenti 表示,這家公司正在探索 AI 如何調(diào)節(jié)元宇宙中的內(nèi)容和行為。
「在我們的主要平臺(tái)上,使用了大量的 AI 來(lái)調(diào)節(jié)其中的內(nèi)容。元宇宙有些與眾不同,因?yàn)樗訉?shí)時(shí),」Pesenti 說(shuō)。他表示這是一項(xiàng)「發(fā)展中」的工作,Meta 也在研究元宇宙的一些策略問(wèn)題。
在 AI event 上,扎克伯格表示 Meta 正在探索 AI 如何通過(guò)自監(jiān)督學(xué)習(xí)來(lái)解釋和預(yù)測(cè)元宇宙中可能發(fā)生的互動(dòng)類(lèi)型。因此 AI 可以通過(guò)自監(jiān)督學(xué)習(xí)獲得原始數(shù)據(jù),而不是用大量標(biāo)記的數(shù)據(jù)進(jìn)行訓(xùn)練。
同時(shí),Meta 也在研究以個(gè)人為中心的數(shù)據(jù),包括從第一人稱(chēng)看世界。扎克伯格表示 Meta 已經(jīng)與 13 所大學(xué)和實(shí)驗(yàn)室組成了一個(gè)全球性的聯(lián)盟,共同推進(jìn) Ego4D 數(shù)據(jù)集的研究,這是目前最大的以個(gè)人為中心的數(shù)據(jù)集。
參考內(nèi)容:
https://www.reuters.com/technology/metaverse-event-metas-zuckerberg-unveils-work-improve-how-humans-chat-ai-2022-02-23/
https://ai.facebook.com/blog/teaching-ai-to-translate-100s-of-spoken-and-written-languages-in-real-time/
https://www.theverge.com/2022/2/23/22947368/meta-facebook-ai-universal-speech-translation-project
關(guān)鍵詞: 扎克伯格曝光Meta的小目標(biāo)AI自動(dòng)生成元宇宙 實(shí)時(shí)翻譯所