日前,百度智能云曦靈正式發(fā)布“AI手語平臺(tái)”與“AI手語平臺(tái)一體機(jī)”。據(jù)悉,近期曦靈AI手語相關(guān)能力已被運(yùn)用于央視新聞播報(bào)、冬奧直播等場景,目前累計(jì)觀看量也已突破1億人次。
百度方面透露,AI手語平臺(tái)平臺(tái)可實(shí)現(xiàn)鐘級(jí)生成手語合成視頻、手語主播實(shí)時(shí)直播等服務(wù),為手語服務(wù)普及提供新途徑。此外,“AI手語平臺(tái)一體機(jī)”則可通過規(guī)模化部署快速建立無障礙窗口,適用于在醫(yī)院、銀行、車站等多種公共場合緩解無障礙窗口短缺的問題。
據(jù)悉,AI手語平臺(tái)主要是針對(duì)線上場景而設(shè),具有視頻手語合成、直播手語合成、文本轉(zhuǎn)手語、語音轉(zhuǎn)手語4種功能,只需前期幾小時(shí)的設(shè)置就可以實(shí)現(xiàn)以上場景的手語服務(wù)。此外,該平臺(tái)還可以在各類 App、網(wǎng)站、小程序中,以滿足聽障人士線上社交、娛樂休閑、課程學(xué)習(xí)等日常需求。
而AI手語平臺(tái)一體機(jī)則主要是針對(duì)于線下場景,百度智能云曦靈此次推出的全離線一體機(jī)V3和端云結(jié)合一體機(jī)P3,就搭載的是AI手語平臺(tái),可進(jìn)行ASR 音識(shí)別、語音翻譯、人像渲染等多種服務(wù),讓手語服務(wù)滲透在各種生活場景中。此外,公共服務(wù)機(jī)構(gòu)還可通過這一設(shè)備將普通窗口轉(zhuǎn)換為無障礙窗口。
在語音識(shí)別效果方面,百度智能云曦靈AI手語平臺(tái)通過SMLTA語音識(shí)別算法模型,實(shí)現(xiàn)了聲學(xué)、語言一體化端到端建模語音識(shí)別,在手機(jī)端近場語音識(shí)別率可達(dá)98%以上。對(duì)此,百度語音技術(shù)部總監(jiān)高亮表示,百度自研的深度學(xué)習(xí)算法,可以針對(duì)諸如旅游、醫(yī)院、司法等不同領(lǐng)域的詞準(zhǔn)率進(jìn)行針對(duì)性訓(xùn)練,準(zhǔn)率可達(dá)96%。
在手語翻譯方面,百度方面表示其研發(fā)了首個(gè)基于神經(jīng)網(wǎng)絡(luò)的精煉度可控手語翻譯模型,并聯(lián)合手語語言學(xué)專家、特殊教育專家以及天津理工大學(xué)聾人工學(xué)院等制定了自然手語標(biāo)注規(guī)范和語料庫,讓AI模型能在真實(shí)數(shù)據(jù)中學(xué)習(xí)手語翻譯知識(shí),例如語序的調(diào)整、詞語的映射以及長度控制等。而在手語動(dòng)作方面,AI手語平臺(tái)參考了《國家通用手語詞典》規(guī)范精修近11000個(gè)手語動(dòng)作,同時(shí)采用4D掃描技術(shù)訓(xùn)練,AI手語數(shù)字人的口型生成準(zhǔn)確度可以達(dá)到98.5%。
百度集團(tuán)副總裁吳甜對(duì)此表示,“人工智能呈現(xiàn)融合創(chuàng)新和降低門檻的新特點(diǎn),綜合運(yùn)用多技術(shù)的數(shù)字人帶來新體驗(yàn),AI加持使數(shù)字人制作和運(yùn)營成本與門檻降低,AI手語平臺(tái)將讓更多聽障人士享受科技帶來的便利”。
【本文圖片來自網(wǎng)絡(luò)】
關(guān)鍵詞: 百度智能云發(fā)布多款手語服務(wù)產(chǎn)品 準(zhǔn)率可達(dá)96%