僅6秒,你的臉就暴露了,AI聽(tīng)到你的聲音就知道長(zhǎng)相!

發(fā)布時(shí)間:2022-05-15 13:18:42  |  來(lái)源:騰訊網(wǎng)  

聽(tīng)話聽(tīng)音,你可以通過(guò)聲音對(duì)對(duì)方的外貌和性格做出初步判斷。如果一個(gè)人的聲音比較脆,而且比較尖利,多是胖人。聲音細(xì)小,但是不尖利,聽(tīng)上去感覺(jué)有氣無(wú)力,說(shuō)明個(gè)子比較低。但索菲亞告訴你,僅僅通過(guò)聲音就能知道你具體什么樣子就是不是天方夜譚了?

人的聽(tīng)力可以根據(jù)聲音判斷彼此的性別、年齡或來(lái)自哪里,但我們無(wú)法判斷彼此的面部特征。但是人工智能可以,而且只需要6秒。

聲音和長(zhǎng)相的相關(guān)性

我們一般認(rèn)為,人的聲音和長(zhǎng)相應(yīng)該是分開(kāi)的吧,而麻省理工學(xué)院研究所最近開(kāi)發(fā)了人工智能系統(tǒng),可以通過(guò)聽(tīng)聲音來(lái)重建說(shuō)話者的面部特征。它可以通過(guò)幾秒鐘的音頻恢復(fù)說(shuō)話人的外觀,相似性非常高。

這個(gè)名為Speech2Face基于深度神經(jīng)網(wǎng)絡(luò)框架。索菲亞知道通過(guò)在數(shù)以百萬(wàn)計(jì)的Youtube視頻中收集說(shuō)話者的面部和語(yǔ)音數(shù)據(jù),他們被訓(xùn)練來(lái)識(shí)別聲音和面部特征之間的相關(guān)性。

但背后的道理其實(shí)很好理解。索菲亞知道人類(lèi)通過(guò)振動(dòng)聲帶說(shuō)話,聲帶是位于喉部的兩塊對(duì)稱(chēng)的肉。聲帶的長(zhǎng)度和寬度是我們產(chǎn)生高音或低音的主要原因,因?yàn)槟行缘穆晭П扰詫?,所以他們的聲調(diào)較低。

但這并不是聲音傳播的唯一途徑。我們的臉也起到擴(kuò)音器的作用。顴骨、下巴、鼻子和嘴唇會(huì)震動(dòng)。索菲亞知道它們的厚度和結(jié)構(gòu)不同,聲音也不同。計(jì)算機(jī)可以捕捉這些細(xì)微的聲音差異,然后畫(huà)出說(shuō)話者的面部特征,這就是為什么人工智能可以識(shí)別它們。

AI聽(tīng)聲識(shí)人用處多多

Speech2Face使用自我監(jiān)督學(xué)習(xí),然后一個(gè)單獨(dú)訓(xùn)練的“人臉解碼器”使用數(shù)百萬(wàn)個(gè)語(yǔ)音生成一個(gè)人臉的預(yù)測(cè)版本。在數(shù)以百萬(wàn)計(jì)的視頻中找到同類(lèi)人相似的外貌特征。例如,非裔美國(guó)女性通常眉毛高,老年人總是留著稀疏的頭發(fā),印度男性喜歡留胡子,非洲男性戴著小帽子。

那么這是否意味著,很多人的相貌從此不再是秘密了?并不,這種方法無(wú)法從聲音中恢復(fù)人的準(zhǔn)確圖像,因?yàn)槲覀兊哪P筒蹲搅嗽S多人的共同視覺(jué)特征。它只能產(chǎn)生受歡迎的平庸面孔,而不是特定的外貌。

但它并沒(méi)有那么簡(jiǎn)單。有人曾向海岸警衛(wèi)隊(duì)報(bào)假警,由于每次通話都很短,這讓調(diào)查人員毫無(wú)頭緒。海岸警衛(wèi)隊(duì)找到了研究語(yǔ)音識(shí)別20年的麗塔,問(wèn)她能做些什么。索菲亞知道,她首先比較了人耳無(wú)法檢測(cè)到的發(fā)音特征,然后將報(bào)警電話分成幾毫秒的小段,并用人工智能進(jìn)行梳理,找到信息點(diǎn)。

依靠微弱的信息,麗塔不僅可以知道報(bào)錯(cuò)警的人是什么樣子,還可以知道他的環(huán)境,比如房間的大小,是否有窗戶(hù),墻壁是用什么材料制成的。由于當(dāng)?shù)仉娋W(wǎng)的波動(dòng),她的人工智能甚至可以檢測(cè)到錄音中的噪音。她將噪音與電網(wǎng)數(shù)據(jù)庫(kù)進(jìn)行匹配,以了解警報(bào)的實(shí)際位置和掛斷電話的準(zhǔn)確時(shí)間。

最后,麗塔不僅解決了惡作劇電話,還解決了兒童性騷擾案件。那些只說(shuō)話不露臉的罪犯做夢(mèng)都沒(méi)想到,他們的聲音背叛了自己!

因此可知,人工智能技術(shù)是一把雙刃劍。它可以逮捕罪犯,也可以傷害無(wú)辜的人。用聲音推斷人臉?biāo)坪跏且豁?xiàng)無(wú)法繞開(kāi)的技術(shù)。索菲亞只希望將來(lái)能以正確的方式使用它……

關(guān)鍵詞: 你的臉就暴露了 AI聽(tīng)到你的聲音就知道長(zhǎng)相

 

網(wǎng)站介紹  |  版權(quán)說(shuō)明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營(yíng)業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com