-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
新一代人工智能與語音識別 版權信息
- ISBN:9787302523840
- 條形碼:9787302523840 ; 978-7-302-52384-0
- 裝幀:一般純質紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
新一代人工智能與語音識別 本書特色
本書系統介紹基于新聞語料的俄語連續語音識別方法。全書共分以下幾個部分:基于Kaldi設計實現俄語連續語音識別原型系統,使之具備在線識別和離線識別功能,以驗證聲學模型和語言模型優化算法的有效性,進而為面向特定領域的俄語語音識別實用系統研發提供理論方法、實驗數據和關鍵技術支撐。為了實現上述目標,需要進行如下環環緊扣的操作步驟:俄語語音語料的采集加工處理、俄語文本語料的采集清洗過濾、俄語發音詞典的自動預測生成、聲學模型建模基本單元(音素集)的確定、聲學模型和語言模型的優化等。
新一代人工智能與語音識別 內容簡介
本書系統介紹基于新聞語料的俄語連續語音識別方法。全書共分以下幾個部分:基于Kaldi設計實現俄語連續語音識別原型系統,使之具備在線識別和離線識別功能,以驗證聲學模型和語言模型優化算法的有效性,進而為面向特定領域的俄語語音識別實用系統研發提供理論方法、實驗數據和關鍵技術支撐。為了實現上述目標,需要進行如下環環緊扣的操作步驟:俄語語音語料的采集加工處理、俄語文本語料的采集清洗過濾、俄語發音詞典的自動預測生成、聲學模型建模基本單元(音素集)的確定、聲學模型和語言模型的優化等。
新一代人工智能與語音識別 目錄
第0章緒論1
0.1研究依據1
0.2研究對象與研究目標2
0.3研究方法3
0.4研究意義3
0.5本書的創新點4
0.6語料來源4
0.7本書的結構5
第1章語音識別技術研究綜述7
1.1語音識別的定義與分類7
1.1.1語音識別的定義7
1.1.2語音識別的分類8
1.2語音識別技術的研究進展9
1.2.1語音識別技術的發展概況9
1.2.2國外俄語語音識別技術的研究進展10
1.2.3中國俄語語音識別技術的研究進展13
1.3語音識別系統的基本原理14
1.3.1特征提取15
1.3.2聲學模型16
1.3.3語言模型17
1.3.4解碼18
1.4語音識別技術研究所關注的關鍵問題19
本章小結21〖4〗新一代人工智能與語音識別〖2〗目錄〖4〗第2章語音數據的加工處理22
2.1問題描述22
2.2眾包的定義及內涵23
2.2.1眾包的基本概念23
2.2.2眾包的基本流程24
2.2.3眾包的關鍵問題24
2.3解決方案25
2.3.1質量控制25
2.3.2語音標注平臺的架構27
2.3.3標注平臺的設計與實現28
2.4語音標注31
2.4.1語音有效性判斷31
2.4.2語音轉寫規范32
2.4.3語音標注規范32
2.5實驗設計與結果分析33
2.5.1實驗設計33
2.5.2結果分析34
2.5.3結論36
本章小結36
第3章俄語聲學模型的建立37
3.1連續語音識別37
3.1.1連續語音識別的整體模型38
3.1.2聲學模型訓練的HMMGMM方法40
3.1.3聲學模型訓練中的HMMDNN方法48
3.2俄語語音學概述52
3.2.1俄語的使用及分布情況52
3.2.2俄語語音的基本特點55
3.2.3俄語音素的發音特征56
3.2.4俄語元音音素的隨位變化58
3.2.5俄語輔音音素的隨位變化60
3.3俄語聲學單元的選擇61
3.3.1俄語SAMPA音素集61
3.3.2俄語音系表64
3.4實驗設計與結果分析64
3.4.1實驗設計65
3.4.2結果分析66
本章小結67
第4章俄語語言模型的建立68
4.1文本語料的準備與清洗68
4.1.1數據來源的篩選69
4.1.2數據爬取71
4.1.3數據的去重與清洗71
4.1.4格式化處理74
4.2語言模型簡述75
4.2.1語言模型的平滑技術77
4.2.2語言模型的剪枝算法81
4.3語言模型的訓練流程84
4.3.1語言模型的訓練實現84
4.3.2詞典的選擇85
4.3.3LM的剪枝與優化87
4.4實驗結果分析89
4.4.1詞典規模測試89
4.4.2語料規模測試89
4.4.3語言模型剪枝測試90
本章小結91
第5章基于Kaldi的俄語語音識別原型系統92
5.1系統設計的目標與原則92
5.1.1系統設計的目標92
5.1.2系統設計的原則92
5.2系統的開發環境與整體架構93
5.2.1系統的開發環境93
5.2.2系統的整體架構93
5.3Kaldi環境的搭建94
5.3.1Kaldi及實驗環境94
5.3.2Kaldi訓練服務器的搭建96
5.3.3AM訓練數據及參數設置98
5.3.4LM訓練數據及參數設置107
5.4Kaldi訓練優化111
5.4.1Kaldi聲學建模111
5.4.2GPU加速113
5.5語音識別原型系統的設計114
5.5.1系統GUI的設計114
5.5.2在線識別功能114
5.5.3離線識別功能117
5.6實驗設計與結果分析119
5.6.1實驗設計119
5.6.2實驗結果119
5.6.3結果分析120
本章小結121
第6章總結與展望122
6.1本書的主要成果122
6.2未來的研究計劃123
附錄A英漢術語對照表124
附錄B其他相關資料126
B.1俄語發音詞典(76277個詞形)示例126
B.2俄語解碼詞表(189971個詞形)示例127
B.3俄語字符Unicode編碼對照表128
B.4俄語語音格式化程序(轉換為16KB、16b)128
B.5俄語文本轉Unicode編碼程序129
B.6從https: //twitter.com網站上下載的部分網頁文件
(json格式)示例131
B.7從http: //www.interfax.ru網站上下載的部分網頁
文件(json格式)示例131
B.8俄語拉丁字母轉寫表132
參考文獻134
新一代人工智能與語音識別 作者簡介
馬延周,男,戰略支援部隊信息工程大學洛陽校區,副教授,博士研究生
1996-2000,解放軍信息工程大學學員,計算機應用專業
2000-2005,解放軍外國語學院基礎部講師
2005-2008,解放軍信息工程大學碩士研究生,計算機技術應用
2008-2012,解放軍外國語學院基礎部講師
2012-2016,解放軍外國語學院博士研究生,語言信息處理(語音識別)
2013-2015,中國科學技術大學、科大訊飛研究院訪學,主要研究連續語音識別
2016-,解放軍信息工程大學洛陽校區(原解放軍外國語學院)副教授馬延周,男,戰略支援部隊信息工程大學洛陽校區,副教授,博士研究生
1996-2000,解放軍信息工程大學學員,計算機應用專業
2000-2005,解放軍外國語學院基礎部講師
2005-2008,解放軍信息工程大學碩士研究生,計算機技術應用
2008-2012,解放軍外國語學院基礎部講師
2012-2016,解放軍外國語學院博士研究生,語言信息處理(語音識別)
2013-2015,中國科學技術大學、科大訊飛研究院訪學,主要研究連續語音識別
2016-,解放軍信息工程大學洛陽校區(原解放軍外國語學院)副教授
從教18年來,主要承擔計算機類、語言信息類本碩博課程的主講與輔導任務,主持或參與的國家級、省部級、院校級各類項目17余項是,主編或參編的教材4部。科研成果主要集中在多語種的信息處理(如語音識別、關鍵詞識別、聲紋識別等領域)及多語種語料的采集處理等領域。
2016年博士論文獲解放軍外國語學院優秀博士論文,排名第一。
2017年申報河南省優秀博士論文,2018年4月獲批河南省優秀博士論文(當年,全省15篇優秀博士論文)。
- >
我與地壇
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
苦雨齋序跋文-周作人自編集
- >
唐代進士錄
- >
姑媽的寶刀
- >
回憶愛瑪儂
- >
羅庸西南聯大授課錄
- >
小考拉的故事-套裝共3冊