哈科學(xué)家發(fā)明哈薩克語語音識(shí)別系統(tǒng) 引來飛利浦談合作

發(fā)布時(shí)間:2022-04-24 18:25:55  |  來源:騰訊網(wǎng)  

哈薩克斯坦

新冠疫情實(shí)時(shí)報(bào)道

1305457

確診病例

1704

現(xiàn)有病例

10

單日新增

89

單日康復(fù)

據(jù)Khabar24 電視頻道報(bào)道,哈薩克斯坦科學(xué)家奧肯·馬米爾巴耶夫開發(fā)了一種哈薩克語語音識(shí)別系統(tǒng),可將該語言的語音信息轉(zhuǎn)換為文本文字。

該項(xiàng)目是在2018-2020 年財(cái)政支持的框架內(nèi)實(shí)施的,項(xiàng)目主題為“基于深度神經(jīng)網(wǎng)絡(luò)的多語言語音自動(dòng)識(shí)別技術(shù)”。2021年,奧肯·馬米爾巴耶夫和他的團(tuán)隊(duì)獲得了另一個(gè) IT 項(xiàng)目的資助,用于開發(fā)一個(gè)自動(dòng)搜索和分析非法網(wǎng)絡(luò)內(nèi)容的系統(tǒng)。

奧肯·馬米爾巴耶夫

在讀博士期間,奧肯·馬米爾巴耶夫就萌生了發(fā)明一項(xiàng)有用服務(wù)的想法,并在語言學(xué)家的幫助下建立了語言基礎(chǔ)。哈薩克語語音識(shí)別系統(tǒng)的原理非常簡單:人工智能讀取聲音,然后將其轉(zhuǎn)換為文本文字。

“創(chuàng)建系統(tǒng)時(shí),遇到的最大問題就是語音數(shù)據(jù)語料庫的開發(fā)。如果我們能收集到更多的數(shù)據(jù),那么我們的識(shí)別模型就被訓(xùn)練出來了,可以識(shí)別所有單詞。如果語料庫很小,有些單詞它就無法識(shí)別。我們現(xiàn)已獲得兩千小時(shí)的語音記錄,進(jìn)行系統(tǒng)測試時(shí),單詞識(shí)別的準(zhǔn)確率為 8%。如果我們的語音記錄達(dá)到五千小時(shí)左右,那么準(zhǔn)確率可以達(dá)到90%,”奧肯·馬米爾巴耶夫說。

現(xiàn)在,該系統(tǒng)被應(yīng)用于Telegram 社交網(wǎng)絡(luò)中的聊天機(jī)器人。要對其進(jìn)行測試,只需按住錄制語音消息按鈕即可。之后,機(jī)器人會(huì)自動(dòng)將語音轉(zhuǎn)換為文字。

為方便起見,開發(fā)人員還開發(fā)了一個(gè)可用于商務(wù)會(huì)議的錄音筆;完成錄制后,系統(tǒng)可將其形成哈薩克語文本。飛利浦國際公司已經(jīng)對這一發(fā)明產(chǎn)生了興趣,并計(jì)劃將該系統(tǒng)應(yīng)用到其面向哈薩克斯坦市場的產(chǎn)品之一。

帶有語音識(shí)別功能的飛利浦 Smart Mike Duo錄音筆將被引入哈薩克斯坦市場,該麥克風(fēng)會(huì)自動(dòng)將語音轉(zhuǎn)換為文字。該設(shè)備能夠識(shí)別同時(shí)發(fā)出的兩種不同的聲音,并在兩個(gè)不同的通道上自動(dòng)將語音轉(zhuǎn)換為文本。

奧肯·馬米爾巴耶夫介紹說:“飛利浦提出合作并進(jìn)一步推廣該產(chǎn)品。將軟件加載到計(jì)算機(jī)中,然后與錄音筆連接。會(huì)自動(dòng)識(shí)別兩種不同的聲音,并以兩個(gè)塊顯示哈薩克語文本。這種錄音筆在開會(huì)時(shí)很有用,可以文本形式保存會(huì)議信息”。

來源:24.kz orda.kz

責(zé)編:項(xiàng)婧

關(guān)鍵詞: 哈科學(xué)家發(fā)明哈薩克語語音識(shí)別系統(tǒng) 引來飛利浦談合作

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com