-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
現代語音信號處理理論與技術 版權信息
- ISBN:9787121455445
- 條形碼:9787121455445 ; 978-7-121-45544-5
- 裝幀:平塑
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
現代語音信號處理理論與技術 內容簡介
本書系統介紹了語音信號處理的基礎、原理、方法、應用、新理論、新成果與新技術、前沿領域及研究進展,以及背景知識、研究現狀、應用前景和發展趨勢。全書分三篇共18章。**篇語音信號處理基礎,包括第1章緒論,第2章語音信號處理的基礎知識;第二篇語音信號分析,包括第3章時域分析,第4章短時傅里葉分析,第5章倒譜分析與同態濾波,第6章線性預測分析,第7章語音信號的非線性分析,第8章語音聲學參數檢測與估計,第9章矢量量化,第10章隱馬爾可夫模型;第三篇語音信號處理技術與應用,包括第11章語音編碼,第12章語音合成,第13章語音識別,第14章說話人識別和語種辨識,第15章智能信息處理技術在語音信號處理中的應用,第16章語音增強,第17章麥克風陣列語音信號處理,第18章語音信息對抗。本書體系完整,結構嚴謹,系統性強,原理闡述透徹,內容繁簡適中,豐富而新穎,聯系實際應用。本書可作為高等院校信號與信息處理、通信與電子工程、電路與系統、模式識別與人工智能等專業及學科高年級本科生及研究生的教材,也可供該領域的科研及工程技術人員參考。
現代語音信號處理理論與技術 目錄
篇 語音信號處理基礎
第1章 緒論 1
1.1 語音信號處理的發展歷史 1
1.2 語音信號處理的主要研究內容及
發展概況 3
1.3 本書的內容 7
思考與復習題 8
第2章 語音信號處理的基礎知識 9
2.1 概述 9
2.2 語音產生的過程 9
2.3 語音信號的特性 12
2.3.1 語言和語音的基本特性 12
2.3.2 語音信號的時間波形和頻譜特性 13
2.3.3 語音信號的統計特性 15
2.4 語音產生的線性模型 16
2.4.1 激勵模型 17
2.4.2 聲道模型 18
2.4.3 輻射模型 20
2.4.4 語音信號數字模型 20
2.5 語音產生的非線性模型 21
2.5.1 FM-AM模型的基本原理 22
2.5.2 Teager能量算子 22
2.5.3 能量分離算法 23
2.5.4 FM-AM模型的應用 24
2.6 語音感知 24
2.6.1 聽覺系統 24
2.6.2 神經系統 25
2.6.3 語音感知 26
思考與復習題 29
第二篇 語音信號分析
第3章 時域分析 30
3.1 概述 30
3.2 數字化和預處理 31
3.2.1 取樣率和量化字長的選擇 31
3.2.2 預處理 33
3.3 短時能量分析 34
3.4 短時過零分析 36
3.5 短時相關分析 39
3.5.1 短時自相關函數 39
3.5.2 修正的短時自相關函數 40
3.5.3 短時平均幅差函數 41
3.6 語音端點檢測 42
3.6.1 雙門限前端檢測 43
3.6.2 多門限過零率前端檢測 43
3.6.3 基于FM-AM模型的端點檢測 43
3.7 基于高階累積量的語音端點檢測 44
3.7.1 噪聲環境下的端點檢測 44
3.7.2 高階累積量與高階譜 44
3.7.3 基于高階累積量的端點檢測 46
思考與復習題 48
第4章 短時傅里葉分析 50
4.1 概述 50
4.2 短時傅里葉變換 50
4.2.1 短時傅里葉變換的定義 50
4.2.2 傅里葉變換的解釋 51
4.2.3 濾波器的解釋 54
4.3 短時傅里葉變換的取樣率 55
4.4 語音信號的短時綜合 56
4.4.1 濾波器組求和法 56
4.4.2 FFT求和法 58
4.5 語譜圖 59
思考與復習題 61
第5章 倒譜分析與同態濾波 62
5.1 概述 62
5.2 同態信號處理的基本原理 62
5.3 復倒譜和倒譜 63
5.4 語音信號兩個卷積分量復倒譜的性質 64
5.4.1 聲門激勵信號 64
5.4.2 聲道沖激響應序列 65
5.5 避免相位卷繞的算法 66
5.5.1 微分法 67
5.5.2 小相位信號法 67
5.5.3 遞推法 69
5.6 語音信號復倒譜分析實例 70
5.7 Mel頻率倒譜系數 72
思考與復習題 73
第6章 線性預測分析 74
6.1 概述 74
6.2 線性預測分析的基本原理 74
6.2.1 基本原理 74
6.2.2 語音信號的線性預測分析 75
6.3 線性預測方程組的建立 76
6.4 線性預測分析的解法(1)—自相關和
協方差法 77
6.4.1 自相關法 78
6.4.2 協方差法 79
6.4.3 自相關和協方差法的比較 80
6.5 線性預測分析的解法(2)—格型法 81
6.5.1 格型法基本原理 81
6.5.2 格型法的求解 83
6.6 線性預測分析的應用—LPC譜估計和
LPC復倒譜 85
6.6.1 LPC譜估計 85
6.6.2 LPC復倒譜 87
6.6.3 LPC譜估計與其他譜分析方法的
比較 88
6.7 線譜對(LSP)分析 89
6.7.1 線譜對分析原理 89
6.7.2 線譜對參數的求解 91
6.8 極零模型 91
思考與復習題 93
第7章 語音信號的非線性分析 94
7.1 概述 94
7.2 時頻分析 94
7.2.1 短時傅里葉變換的局限 95
7.2.2 時頻分析 96
7.3 小波分析 97
7.3.1 概述 97
7.3.2 小波變換的定義 97
7.3.3 典型的小波函數 99
7.3.4 離散小波變換 100
7.3.5 小波多分辨分析與Mallat算法 100
7.4 基于小波的語音分析 101
7.4.1 語音分解與重構 101
7.4.2 清/濁音判斷 102
7.4.3 語音去噪 102
7.4.4 聽覺系統模擬 103
7.4.5 小波包變換在語音端點檢測中的應用 103
7.5 混沌與分形 104
7.6 基于混沌的語音分析 105
7.6.1 語音信號的混沌性 105
7.6.2 語音信號的相空間重構 106
7.6.3 語音信號的Lyapunov指數 108
7.6.4 基于混沌的語音、噪聲判別 109
7.7 基于分形的語音分析 110
7.7.1 概述 110
7.7.2 語音信號的分形特征 110
7.7.3 基于分形的語音分割 111
7.8 壓縮感知 113
7.9 語音信號的壓縮感知 114
7.9.1 語音信號的稀疏性 114
7.9.2 語音壓縮感知的實現 114
7.9.3 需要進一步解決的問題 116
思考與復習題 117
第8章 語音聲學參數檢測與估計 118
8.1 基音估計 118
8.1.1 自相關法 119
8.1.2 并行處理法 121
8.1.3 倒譜法 122
8.1.4 簡化逆濾波法 124
8.1.5 高階累積量法 127
8.1.6 小波變換法 127
8.1.7 基音檢測的后處理 128
8.2 共振峰估計 129
8.2.1 帶通濾波器組法 129
8.2.2 DFT法 130
8.2.3 倒譜法 131
8.2.4 LPC法 133
8.2.5 FM-AM模型法 134
思考與復習題 135
第9章 矢量量化 136
9.1 概述 136
9.2 矢量量化的基本原理 137
9.3 失真測度 138
9.3.1 歐氏距離—均方誤差 139
9.3.2 LPC失真測度 139
9.3.3 識別失真測度 141
9.4 矢量量化器和碼本的設計 141
9.4.1 矢量量化器設計的兩個條件 141
9.4.2 LBG算法 142
9.4.3 初始碼書生成 142
9.5 降低復雜度的矢量量化系統 143
9.5.1 無記憶的矢量量化系統 144
9.5.2 有記憶的矢量量化系統 146
9.6 語音參數的矢量量化 148
9.7 智能信息處理在矢量量化中的應用策略 149
思考與復習題 150
第10章 隱馬爾可夫模型 151
10.1 概述 151
10.2 隱馬爾可夫模型的引入 152
10.3 隱馬爾可夫模型的定義 154
10.4 隱馬爾可夫模型三個問題的求解 155
10.4.1 概率的計算 156
10.4.2 HMM的識別 158
10.4.3 HMM的訓練 159
10.4.4 EM算法 160
10.5 HMM的選取 161
10.5.1 HMM的類型選擇 161
10.5.2 輸出概率分布的選取 162
10.5.3 狀態數的選取 162
10.5.4 初值選取 162
10.5.5 訓練準則的選取 164
10.6 HMM應用與實現中的一些問題 165
10.6.1 數據下溢 165
10.6.2 多輸出(觀察矢量序列)情況 165
10.6.3 訓練數據不足 166
10.6.4 考慮狀態持續時間的HMM 167
10.7 HMM的結構和類型 169
10.7.1 HMM的結構 169
10.7.2 HMM的類型 171
10.7.3 按輸出形式分類 172
10.8 HMM的相似度比較 173
思考與復習題 174
第三篇 語音信號處理技術與應用
第11章 語音編碼 175
11.1 概述 175
11.2 語音信號的壓縮編碼原理 177
11.2.1 語音壓縮的基本原理 177
11.2.2 語音通信中的語音質量 178
11.2.3 兩種壓縮編碼方式 179
11.3 語音信號的波形編碼 179
11.3.1 PCM及APCM 179
11.3.2 預測編碼及自適應預測編碼 182
11.3.3 ADPCM及ADM 184
11.3.4 子帶編碼(SBC) 186
11.3.5 自適應變換編碼(ATC) 188
11.4 聲碼器 190
11.4.1 概述 190
11.4.2 聲碼器的基本結構 191
11.4.3 通道聲碼器 191
11.4.4 同態聲碼器 193
11.5 LPC聲碼器 194
11.5.1 LPC參數的變換與量化 195
11.5.2 LPC-10 196
11.5.3 LPC-10e 197
11.5.4 變幀率LPC聲碼器 198
11.6 各種常規語音編碼方法的比較 198
11.6.1 波形編碼的信號壓縮技術 198
11.6.2 波形編碼與聲碼器的比較 199
11.6.3 各種聲碼器的比較 199
11.7 基于LPC模型的混合編碼 200
11.7.1 混合編碼采用的技術 201
11.7.2 MPLPC 203
11.7.3 RPELPC 206
11.7.4 CELP 207
11.7.5 CELP的改進形式 210
11.7.6 基于分形碼本的CELP 212
11.8 基于正弦模型的混合編碼 213
11.8.1 正弦變換編碼 214
11.8.2 多帶激勵(MBE)編碼 214
11.9 極低速率語音編碼 216
11.9.1 (400~1.2k)b/s數碼率的聲碼器 216
11.9.2 識別-合成型聲碼器 217
11.10 語音壓縮感知編碼 218
11.11 語音編碼的性能指標 219
11.12 語音編碼的質量評價 220
11.12.1 主觀評價方法 221
11.12.2 客觀評價方法 222
11.12.3 主客觀評價方法的結合 225
11.12.4 基于多重分形的語音質量評價 226
11.13 語音編碼國際標準 227
11.14 語音編碼與圖像編碼的關系 227
小結 228
思考與復習題 229
第12章 語音合成 230
12.1 概述 230
12.2 語音合成原理 231
12.2.1 語音合成的方法 231
12.2.2 語音合成的系統特性 233
12.3 共振峰合成 233
12.3.1 共振峰合成原理 233
12.3.2 共振峰合成實例 235
12.4 LPC合成 236
12.5 PSOLA語音合成 238
12.5.1 概述 238
12.5.2 PSOLA的原理 238
12.5.3 PSOLA的實現 239
12.5.4 PSOLA的改進 241
12.5.5 PSOLA語音合成系統的發展 241
12.6 文語轉換系統 242
12.6.1 組成與結構 242
12.6.2 文本分析 242
12.6.3 韻律控制 244
12.6.4 語音合成 246
12.6.5 TTS系統的一些問題 247
12.7 基于HMM的參數化語音合成 248
12.8 語音合成的發展趨勢 252
12.9 語音合成硬件簡介 253
思考與復習題 254
第13章 語音識別 255
13.1 概述 255
13.2 語音識別原理 258
13.3 動態時間規整 262
13.4 基于有1
現代語音信號處理理論與技術 作者簡介
胡航,哈爾濱工業大學電子信息學院,副教授,主要從事信號處理方面的教學、科研工作,編著出版《語音信號處理》等教材多部,
- >
姑媽的寶刀
- >
【精裝繪本】畫給孩子的中國神話
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
莉莉和章魚
- >
山海經
- >
有舍有得是人生
- >
二體千字文
- >
人文閱讀與收藏·良友文學叢書:一天的工作