隨著物聯(lián)網(wǎng)技術(shù)和智能設(shè)備技術(shù)的快速發(fā)展,人與機(jī)器的交互,不再僅依賴于鼠標(biāo)和鍵盤,更有可能的是直接采用語音。
這其中的關(guān)鍵技術(shù)就是自動語音識別(Automatic Speech Recognition,ASR)。其所要完成的工作,簡單地說,就是在與機(jī)器進(jìn)行語音交流時,能夠讓機(jī)器聽懂你在說什么。
自20世紀(jì)50年代以來,對語音識別的研究已有近70年的歷史,取得了多方面的突破,如今已在產(chǎn)業(yè)界有較多的應(yīng)用,如語音輸入法、語音搜索、智能音箱等軟硬件產(chǎn)品。這些產(chǎn)業(yè)應(yīng)用帶動了更多的企業(yè)和科研機(jī)構(gòu)參與進(jìn)來,因此需要了解和掌握語音識別技術(shù)的學(xué)生和工程師也越來越多,這時很需要一本合適的教材和參考書。
到目前為止,已出版的書籍介紹的知識各有側(cè)重,對語音產(chǎn)業(yè)界起到了很大的推動作用,在此深表敬意。
但語音識別技術(shù)的發(fā)展日新月異,新的理論和方案不斷出現(xiàn),讀者除了掌握基本原理,也亟須了解語音識別最新的前沿技術(shù),例如加權(quán)有限狀態(tài)轉(zhuǎn)換器(WFST)、端到端(E2E)語音識別等。
全方位解讀語音識別的最新著作來了!
《語音識別:原理與應(yīng)用》
洪青陽 李琳 著
本書內(nèi)容來自作者多年積累總結(jié),第一手教學(xué)資料,第一線研發(fā)經(jīng)驗;
既有語音采集、聲學(xué)特征介紹,又有聲學(xué)模型和語言模型講解,循序漸進(jìn),圖文并茂,深入淺出;
系統(tǒng)介紹經(jīng)典算法、前沿技術(shù)和應(yīng)用實踐,涵蓋語音識別全貌,包括GMM-HMM、DNN-HMM和E2E框架,以及WFST和LF-MMI等關(guān)鍵技術(shù)。
為幫助讀者動手操作, 提高實戰(zhàn)技能,本書最后還結(jié)合Kaldi和Espnet等開源工具,介紹了具體的工程實踐方法。同時也詳細(xì)介紹了諸如 Kaldi工具的使用和封裝、云服務(wù)等開發(fā)實踐,因此本書對于那些希望將理論轉(zhuǎn)換成實際投產(chǎn)系統(tǒng)的研發(fā)人員極具實用性。
本書理論指導(dǎo)和工程實踐并重,適合用作高校教材和技術(shù)人員手冊。
關(guān)鍵詞: 圖書推薦丨語音識別原理與應(yīng)用(文末贈書)