微軟智能語(yǔ)音實(shí)現(xiàn)技術(shù)升級(jí) 新增5個(gè)聲音角色供用戶(hù)選擇

發(fā)布時(shí)間:2020-12-21 16:21:03  |  來(lái)源:IT之家  

近期,微軟智能語(yǔ)音實(shí)現(xiàn)技術(shù)升級(jí),一次性新增了 5 個(gè)聲音角色供用戶(hù)自由選擇,覆蓋男女聲和不同年齡段,以及不同性格和聲線特征,包括陽(yáng)光活潑的男青年(云希)和獨(dú)立自信的女青年(曉萱),溫柔大方的女中青年(曉涵)和多才多藝的女青年(曉墨),以及成熟睿智的女中老年(曉睿)。另外,中年男聲(云野)也同步更新了多種聲音風(fēng)格。他們與此前多個(gè)聲音角色一起,共同組成了微軟豐富的中文智能語(yǔ)音 “家族”。

類(lèi)似人類(lèi)主播在播講一個(gè)有聲小說(shuō)時(shí)會(huì)模擬不同的角色,微軟最新的智能語(yǔ)音也支持聲線變換,一人模擬多個(gè)角色,比如女生扮演男生,年輕人扮演老人的聲音,做到 “聲隨境轉(zhuǎn)”,大秀聲音 “演技”。同時(shí),不同的聲線變化也包含多種情感變換,讓角色更加活靈活現(xiàn)。

正是基于這些豐富多樣且功能強(qiáng)大的聲音角色,用戶(hù)得以自由組合出豐富的音頻產(chǎn)品。

IT之家獲悉,這些新聲音在開(kāi)發(fā)過(guò)程中采用了最新的遷移學(xué)習(xí)技術(shù),僅利用少量表現(xiàn)力語(yǔ)料數(shù)據(jù),便可以訓(xùn)練出具有高質(zhì)量、高自然度表現(xiàn)力語(yǔ)音生成能力的源模型。該源模型通過(guò)對(duì)人類(lèi)語(yǔ)音表現(xiàn)力特征的深入挖掘,獲取了穩(wěn)定性高,適應(yīng)性強(qiáng)的語(yǔ)音情感表征,極大地豐富了合成語(yǔ)音的表現(xiàn)力與可控性。微軟還進(jìn)一步構(gòu)建了基于角色和風(fēng)格變換的隱式表達(dá)空間,可以靈活地將多個(gè)不同的角色和風(fēng)格適應(yīng)到一個(gè)新的表現(xiàn)力豐富的說(shuō)話人模型。

目前,微軟語(yǔ)音合成多角色可應(yīng)用在有聲書(shū)、兒童故事、新聞串講等多種場(chǎng)景,滿(mǎn)足不同的產(chǎn)品矩陣。

對(duì)于音頻內(nèi)容產(chǎn)業(yè)而言,微軟此次語(yǔ)音合成多角色技術(shù)更新不僅令聲音風(fēng)格更為多樣且具有感染力,也將進(jìn)一步降低音頻內(nèi)容生產(chǎn)成本、提高制作速度和質(zhì)量。

關(guān)鍵詞: 微軟 智能語(yǔ)音

 

網(wǎng)站介紹  |  版權(quán)說(shuō)明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營(yíng)業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com