掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
語音情感識別 版權信息
- ISBN:9787030676832
- 條形碼:9787030676832 ; 978-7-03-067683-2
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
語音情感識別 內容簡介
本書系統地闡述了語音情感識別的理論、方法和研究成果,主要由兩部分構成:**部分包括第1章到第9章,這九章的內容涵蓋語音情感識別的基礎知識、基本流程、特征提取以及識別網絡,是對語音情感識別深入研究中不可或缺的知識;第二部分包括第10章和第11章,這兩章的內容是在語音情感識別研究基礎上的進一步深入,將腦電信號引入到情感識別研究中,以情感腦電輔助語音情感識別,是腦認知過程與傳統信號處理手段的有效結合,為今后情感識別研究提供了新思路和新方法。 本書可作為人工智能、計算機、電子信息等專業的教師、研究生和技術開發人員學習語音情感識別知識的參考書。
語音情感識別 目錄
第1章 語音情感識別基本知識 1
1.1 語音情感識別的研究背景和意義 1
1.2 語音情感識別關鍵技術 1
1.2.1 情感語音數據庫 1
1.2.2 語音情感特征 2
1.2.3 語音情感識別模型 3
1.3 基于腦認知的語音情感識別研究 5
小結 5
參考文獻 5
第2章 情感的劃分 7
2.1 離散情感劃分 7
2.2 情感維度空間模型 8
2.3 基于離散情感的維度空間模型 11
2.4 其他情感模型 12
小結 13
參考文獻 13
第3章 情感語音數據庫 15
3.1 情感語音數據庫建立的基本原則 15
3.2 TYUT1.0情感語音數據庫的建立 17
3.2.1 語音的采集 17
3.2.2 語句的有效性分析 18
3.3 TYUT2.0情感語音數據庫的建立 20
3.3.1 截取情感語音素材 20
3.3.2 語句的有效性評價 20
3.4 基于PAD情緒模型的情感語音數據庫優化及標注 24
3.4.1 TYUT2.0 情感語音數據庫的優化實驗 24
3.4.2 三維PAD情感模型量化標注實驗 26
3.5 常用情感語音數據庫 33
3.5.1 柏林情感語音數據庫 33
3.5.2 VAM數據庫 34
3.5.3 SEMAINE數據庫 34
3.5.4 IEMOCAP數據庫 34
3.5.5 AVEC 2012數據庫 35
3.5.6 MERC數據庫 35
小結 35
參考文獻 36
第4章 語音情感特征分析與研究 37
4.1 傳統語音情感特征 37
4.1.1 韻律特征 37
4.1.2 音質特征 39
4.1.3 MFCC特征 39
4.1.4 LPCC特征 40
4.2 基于人耳聽覺模型的譜能量特征 40
4.2.1 基本的譜能量特征介紹 40
4.2.2 人耳聽覺特性 42
4.2.3 基于Bark尺度頻帶劃分的譜能量特征 44
4.2.4 基于ERB尺度頻帶劃分的譜能量特征 47
4.3 基于人耳聽覺特性的譜能量特征的優化改進 49
4.3.1 聲道響應對譜能量特征的補償算法 49
4.3.2 基于TEO的譜能量特征 51
4.3.3 多種特征的情感識別率對比 52
4.4 基于HHT情感語音特征提取 57
4.4.1 HHT基本理論 57
4.4.2 集合經驗模態分解方法EEMD 61
4.4.3 基于EEMD的IMFE特征提取 65
4.4.4 EEMD-Teager能量譜特征提取 68
4.4.5 HHT邊際譜特征提取 69
小結 72
參考文獻 72
第5章 基于人耳聽覺的情感特征及在語音情感識別中的應用 74
5.1 ZCPA特征 74
5.2 幀優化算法對ZCPA特征的改進 77
5.2.1 幀優化算法基本理論 77
5.2.2 實驗步驟 79
5.2.3 實驗結果及分析 79
5.3 基于人耳聽覺特性的過零峰值Teager能量算子(ZCMT)特征 80
5.3.1 ZCMT特征原理及提取步驟 80
5.3.2 實驗結果及分析 81
5.4 聲門補償的ZCMT特征 83
5.4.1 語音產生的非線性模型 83
5.4.2 典型的聲門特征及基音周期的提取 84
5.4.3 聲門特征對于人耳聽覺模型特征的影響 86
5.4.4 人耳聽覺補償算法 87
5.4.5 聲門特征補償的人耳聽覺模型特征在語音情感識別中的應用 88
5.4.6 實驗結果及分析 89
小結 90
參考文獻 90
第6章 情感語音非線性特征分析研究 92
6.1 語音的非線性特性 92
6.2 情感語音信號的非線性特性 93
6.2.1 功率譜分析 93
6.2.2 主分量分析 94
6.2.3 相空間重構 95
6.3 非線性屬性特征分析研究 99
6.3.1 關聯維數 99
6.3.2 Kolmogorov熵 100
6.3.3 Lyapunov指數 101
6.3.4 Hurst指數 102
6.3.5 基于非線性屬性特征的語音情感識別實驗 103
6.4 基于相空間重構的非線性幾何特征 108
6.4.1 非線性幾何特征參數提取 108
6.4.2 基于五種描述符輪廓的語音情感識別實驗 110
6.4.3 基于非線性幾何特征的語音情感識別實驗 113
6.5 基于特征級融合的情感語音特征參數優化 115
6.5.1 特征級融合在語音情感識別中的應用 115
6.5.2 基于特征級融合的語音情感識別實驗 116
6.6 基于特征選擇的情感語音特征參數優化 118
6.6.1 特征選擇在語音情感識別中的應用 118
6.6.2 基于特征選擇的語音情感識別實驗 119
6.7 基于特征優化的情感語音特征參數優化 120
6.7.1 特征分析 120
6.7.2 特征優化算法 122
6.7.3 基于非線性全局特征的特征優化預實驗 123
6.7.4 基于特征全集的特征優化語音情感識別實驗 123
小結 124
參考文獻 124
第7章 語音情感識別建模 126
7.1 基于CHMM語音情感識別系統的建立與實現 126
7.1.1 HMM建模的語音情感識別系統 126
7.1.2 CHMM語音情感識別系統的設計與實現 127
7.1.3 實驗結果與分析 131
7.2 基于極限學習機的情感識別模型 133
7.2.1 核函數ELM基本理論 133
7.2.2 基于核函數ELM的情感識別 137
7.2.3 Im-ABC優化KELM識別網絡 140
7.2.4 選擇性集成極限學習機的研究 147
7.3 基于FCM的語音情感識別 152
7.3.1 FCM基本理論概述 152
7.3.2 FCM語音情感識別網絡的架構 153
7.3.3 e-FCM語音情感識別網絡的實現 155
7.3.4 實驗及結果分析 157
小結 166
參考文獻 167
第8章 融合算法應用于語音情感識別的研究 168
8.1 數據融合 168
8.1.1 數據融合的概念 168
8.1.2 特征級融合 169
8.1.3 決策級融合 170
8.2 決策融合e-FCM算法介紹 170
8.2.1 概率矩陣 170
8.2.2 決策方法制定 171
8.3 實驗結果與分析 173
8.3.1 語音特征的選擇 173
8.3.2 決策融合e-FCM實驗 173
小結 177
參考文獻 177
第9章 連續維度語音情感識別研究 178
9.1 情感語音特征與PAD三維相關性分析 178
9.1.1 原理介紹 178
9.1.2 Pearson相關介紹 179
9.1.3 結果分析 179
9.2 猶豫模糊集決策融合預測PAD值 180
9.2.1 猶豫模糊信息 180
9.2.2 加權融合預測PAD值 182
9.3 仿真實驗及結果分析 183
9.3.1 PAD數據的概率特性驗證 183
9.3.2 情感PAD數據空間分布 184
9.4 基于特征選擇改進模型的PAD情感維度預測 185
9.4.1 基于GRA-PCA特征選擇的PAD維度預測 186
9.4.2 基于聚類PSO-LSSVM模型的PAD維度預測 196
9.4.3 PAD維度預測的綜合模型研究 203
小結 208
參考文獻 208
第10章 情感語音誘發的腦電信號分析研究 211
10.1 腦電信號 211
10.1.1 腦電信號的概念 211
10.1.2 腦電信號的電極導聯 212
10.1.3 事件相關電位 214
10.1.4 情感語音誘發的事件相關電位 215
10.1.5 基于誘發腦電信號的認知心理學分析方法 216
10.2 情感語音誘發的腦電信號采集與處理 219
10.2.1 實驗設計 220
10.2.2 實驗準備 221
10.2.3 實驗材料的篩選與預處理 222
10.2.4 實驗任務和實驗程序 224
10.2.5 ERP的記錄與預處理 225
10.2.6 數據分析 226
10.3 基于情感語音持續時長影響的ERP研究 226
10.3.1 實驗方法 227
10.3.2 實驗結果及分析 229
10.3.3 實驗結論 234
10.4 基于情感語音基頻影響的ERP研究 235
10.4.1 實驗方法 235
10.4.2 實驗結果及分析 237
10.4.3 實驗結論 241
10.5 言語的可理解性及非言語情感誘發的ERP研究 242
10.5.1 實驗方法 242
10.5.2 實驗結果及分析 244
10.5.3 實驗結論 249
小結 249
參考文獻 250
第11章 腦電輔助語音信號的情感識別研究 254
11.1 腦電信號與語音信號的常用信號處理方法 254
11.2 結合非線性全局特征和譜特征的情感腦電信號分析 256
11.2.1 情感語音腦電信號非線性全局特征提取 256
11.2.2 結合非線性全局特征和譜特征的情感腦電識別實驗 258
11.3 基于壓縮感知的情感識別模型 261
11.3.1 壓縮感知基本理論 261
11.3.2 CS識別模型的構建 263
11.3.3 CS中不同重構算法性能對比實驗 267
11.3.4 CS情感識別的過程 268
11.4 基于CS的腦電輔助語音信號的情感識別 269
11.4.1 語音信號的情感識別 270
11.4.2 腦電信號的情感識別 274
11.4.3 基于特征的CCA融合 277
小結 282
參考文獻 282
展開全部
書友推薦
- >
苦雨齋序跋文-周作人自編集
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
名家帶你讀魯迅:朝花夕拾
- >
姑媽的寶刀
- >
伊索寓言-世界文學名著典藏-全譯本
- >
名家帶你讀魯迅:故事新編
- >
煙與鏡
本類暢銷