-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
語音增強及心音降噪算法研究 版權信息
- ISBN:9787121276545
- 條形碼:9787121276545 ; 978-7-121-27654-5
- 裝幀:一般輕型紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
語音增強及心音降噪算法研究 本書特色
(1)學術性較強:本書力求反映當前智能語音處理領域解決音頻降噪和語音增強問題的*新研究進展,書中的理論是當前音頻領域研究的熱點之一,內容豐富,闡述全面,能夠為相關研究人員開辟新的研究方向提供啟示。(2)內容新穎:給出了課題組*新的研究成果,如基于端到端深度學習的語音降噪、結合注意力機制的語音頻帶擴展、基于神經網絡的心音分類等。(3)強化應用:書中內容面向應用,涉及了語音降噪、心音增強、語音頻帶擴展、聲源定位等眾多分支領域,力求為解決工程實際問題提供有益參考。(4)案例分析透徹。本書給出了一些深層神經網絡在語音處理系統前端的應用案例,并對案例進行理論分析、過程推導、實驗測試、結果分析以及應用展望,有助于讀者深入理解智能語音理論基礎和相關算法,為實際應用提供借鑒。
語音增強及心音降噪算法研究 內容簡介
本書是根據作者在音頻降噪領域的研究成果而著,全書共分為10章,主要內容包括緒論、基于高斯混合模型的非監督在線建模噪聲功率譜估計、結合優化U-Net和殘差網絡的單通道語音增強算法、基于差分麥克風陣列的變步長LMS語音增強算法、語音頻帶擴展研究綜述、基于時間卷積神經網絡的語音頻帶擴展、基于編解碼器網絡的語音頻帶擴展、基于時頻感知神經網絡的語音頻帶擴展、IMCRA-OMLSA噪聲動態估計下的心音降噪、結合SVM和香農能量的HSMM心音分割方法。
語音增強及心音降噪算法研究 目錄
1.1 引言
1.2 語音增強基礎
1.2.1 模型描述
1.2.2 噪聲類型
1.2.3 語音質量評價方法
1.3 傳統單通道語音增強技術發展
1.4 監督性單通道語音增強技術發展
1.4.1 基于淺層模型的語音增強算法
1.4.2 基于深層模型的語音增強算法
1.5 本章小結
參考文獻
第2章 基于高斯混合模型的非監督在線建模噪聲功率譜估計
2.1 引言
2.2 基于GMM的在線建模方法
2.3 基于極大似然的在線參數估計
2.4 基于MDL準則的在線約束
2.5 聚類方法實現
2.6 實驗設置與分析
2.6.1 實驗設置
2.6.2 實驗結果與分析
2.7 本章小結
參考文獻
第3章 結合優化U-Net和殘差網絡的單通道語音增強算法
3.1 引言
3.2 Residual-U-Net語音增強方法
3.2.1 自編碼器結構
3.2.2 U-Net網絡結構
3.2.3 殘差網絡
3.2.4 Residual-U-Net網絡
3.3 實驗設置與分析
3.3.1 數據集及參數設置
3.3.2 結果與分析
3.3.3 語譜圖比較
3.4 本章小結
參考文獻
第4章 基于差分麥克風陣列的變步長LMS語音增強算法
4.1 引言
4.2 雙通道信號模型
4.3 算法描述
4.3.1 一階差分麥克風陣列
4.3.2 變步長頻域LMS算法
4.4 實驗設置與分析
4.5 本章小結
參考文獻
第5章 語音頻帶擴展研究綜述
5.1 引言
5.2 源-濾波器模型
5.2.1 寬帶激勵信號生成
5.2.2 寬帶譜包絡估計
5.3 深度學習的端到端語音頻帶擴展
5.3.1 全連接神經網絡
5.3.2 基于全連接神經網絡的語音頻帶擴展
5.4 基于卷積神經網絡的語音頻帶擴展
5.5 基于循環神經網絡的語音頻帶擴展
5.6 基于時頻神經網絡的語音頻帶擴展
5.7 數據預處理方式及窄帶語音特性
5.7.1 窄帶語音產生原因
5.7.2 時域預處理方法
5.7.3 頻域預處理方法
5.8 仿真與分析
5.8.1 客觀評價
5.8.2 主觀評價
5.8.3 語譜圖
5.9 本章小結
參考文獻
第6章 基于時間卷積神經網絡的語音頻帶擴展
6.1 時間卷積網絡結構
6.1.1 擴張因果卷積
6.1.2 時間卷積網絡
6.2 基于TCN的語音頻帶擴展
6.2.1 模型架構
6.2.2 時頻損失
6.3 實驗設置與分析
6.3.1 實驗設置
6.3.2 實驗結果與分析
6.4 本章小結
參考文獻
第7章 基于編解碼器網絡的語音頻帶擴展
7.1 編解碼器網絡模型
7.2 時頻感知損失函數
7.3 實驗設置與分析
7.3.1 實驗設置
7.3.2 語譜圖
7.3.3 客觀評價
7.3.4 主觀評價
7.4 本章小結
參考文獻
第8章 基于時頻感知神經網絡的語音頻帶擴展
8.1 編解碼器注意力模型
8.1.1 編碼器結構
8.1.2 局部敏感哈希自注意力層
8.1.3 解碼器結構
8.2 深度時頻感知損失函數
8.3 實驗設置與分析
8.3.1 實驗設置
8.3.2 語譜圖
8.3.3 客觀評價
8.3.4 主觀評價
8.4 消融對比實驗
8.5 本章小結
參考文獻
第9章 IMCRA-OMLSA噪聲動態估計下的心音降噪
9.1 引言
9.2 算法框架
9.3 基于IMCRA-OMLSA的心音降噪
9.3.1 基于OMLSA的心音降噪
9.3.2 基于IMCRA的噪聲估計
9.4 降噪結果的定性分析
9.5 降噪結果的定量評估
9.5.1 數據集與特征提取
9.5.2 分類器構建
9.5.3 評估結果及分析
9.6 本章小結
參考文獻
第10章 結合SVM和香農能量的HSMM心音分割方法
10.1 引言
10.2 分割的原理與方法
10.2.1 預處理
10.2.2 LR-HSMM
10.2.3 歸一化香農能量
10.2.4 支持向量機(SVM)
10.2.5 心音持續時間分布
10.2.6 Viterbi解碼
10.3 分割算法流程
10.4 訓練與評價指標
10.4.1 數據集
10.4.2 訓練集
10.4.3 模型評估
10.5 實驗設置與分析
10.5.1 實驗結果
10.5.2 性能指標對比
10.6 本章小結
參考文獻
主要符號縮寫
語音增強及心音降噪算法研究 作者簡介
許春冬,男,博士,副教授,碩士生導師,江西理工大學人工智能系主任,江西省第四屆電子信息類教學指導委員會委員。主持和參與國家級項目5項,主持省部級課題11項,授權發明專利和軟件著作權各1件,公開發表核心以上學術論文30余篇。獲得省部級科研二等獎勵1項,地廳級科研獎勵3項,主持獲得學校教學成果獎2項。
- >
【精裝繪本】畫給孩子的中國神話
- >
羅庸西南聯大授課錄
- >
自卑與超越
- >
唐代進士錄
- >
月亮虎
- >
莉莉和章魚
- >
經典常談
- >
中國歷史的瞬間