數字語音處理理論與應用 版權信息
- ISBN:9787121275906
- 條形碼:9787121275906 ; 978-7-121-27590-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數字語音處理理論與應用 本書特色
本書是作者繼1978年出版的經典教材《語音信號的數字處理》之后的又一著作,全書除有簡練精辟的基礎知識介紹外,系統講解了近30年來語音信號處理的新理論、新方法和在應用上的新進展。全書共14章,分四部分:**部分介紹語音信號處理基礎知識,主要包括數字信號處理基礎、語音產生機理、(人的)聽覺和聽感知機理,以及聲道中的聲傳播原理;第二部分介紹語音信號的時、頻域表示和分析;第三部分介紹語音參數估計方法;第四部分介紹語音信號處理的應用,主要包括語音編碼、語音和音頻信號的頻域編輯、語音合成、語音識別及自然語言理解。
數字語音處理理論與應用 內容簡介
本書是作者繼1978年出版的經典教材《語音信號的數字處理》之后的又一著作,全書除有簡練精辟的基礎知識介紹外,系統講解了近30年來語音信號處理的新理論、新方法和在應用上的新進展。全書共14章,分四部分:**部分介紹語音信號處理基礎知識,主要包括數字信號處理基礎、語音產生機理、(人的)聽覺和聽感知機理,以及聲道中的聲傳播原理;第二部分介紹語音信號的時、頻域表示和分析;第三部分介紹語音參數估計方法;第四部分介紹語音信號處理的應用,主要包括語音編碼、語音和音頻信號的頻域編輯、語音合成、語音識別及自然語言理解。
數字語音處理理論與應用 目錄
第1章 數字語音處理介紹 11.1 語音信號 21.2 語音堆 51.3 數字語音處理的應用 61.3.1 語音編碼 61.3.2 文語轉換合成 71.3.3 語音識別和其他模式匹配問題 71.3.4 其他語音應用 81.4 參考文獻評論 91.5 小結 10第2章 數字信號處理基礎回顧 112.1 引言 112.2 離散時間信號與系統 112.3 信號與系統的變換表示 132.3.1 連續時間傅里葉變換 142.3.2 z變換 142.3.3 離散時間傅里葉變換 162.3.4 離散傅里葉變換 172.3.5 dtft的采樣 182.3.6 dft的性質 192.4 數字濾波器基礎 202.4.1 fir系統 202.4.2 fir濾波器設計方法 212.4.3 fir濾波器實現 232.4.4 iir系統 232.4.5 iir濾波器設計方法 232.4.6 iir系統的實現 242.4.7 關于fir和iir濾波器設計方法的說明 272.5 采樣 272.5.1 采樣原理 272.5.2 語音和音頻波形的采樣率 282.5.3 改變采樣信號的采樣率 292.5.4 抽取 292.5.5 插值 322.5.6 非整數采樣率變化 332.5.7 fir濾波器的優點 342.6 小結 34習題 34第3章 人類語音產生基礎 423.1 引言 423.2 語音產生過程 423.2.1 語音產生機理 423.2.2 語音特征與語音波形 463.2.3 語音生成的聲學理論 493.3 語音的短時傅里葉表示 503.4 聲音語音學 533.4.1 元音 553.4.2 雙元音 603.4.3 聲音的辨音特質 603.4.4 半元音 613.4.5 鼻音 623.4.6 清擦聲 643.4.7 濁擦音 653.4.8 濁塞音 673.4.9 清塞音 673.4.10 破擦聲和耳語音 693.5 美式英語音素的辨音特質 703.6 小結 70習題 71第4章 聽覺、聽感知模型和語音感知 804.1 引言 804.2 語言鏈 804.3 解剖學和耳的功能 824.3.1 基底膜機理 844.3.2 臨界頻帶 854.4 聲音的感知 854.4.1 聲音的強度 874.4.2 人的聽覺范圍 874.4.3 響度級 904.4.4 響度 914.4.5 音高 914.4.6 掩蔽效應——音調 924.4.7 掩蔽效應——噪聲 934.4.8 時域掩蔽效應 944.4.9 語音編碼中的掩蔽效應 954.4.10 參數鑒別——jnd 954.5 聽感知模型 964.5.1 感知線性預測 964.5.2 seneff聽感知模型 974.5.3 lyon聽感知模型 994.5.4 整體區間直方圖方法 1004.5.5 聽感知模型小結 1014.6 人類語音感知實驗 1014.6.1 噪聲中的聲音感知 1024.6.2 噪聲中的語音感知 1034.7 語音質量和可懂度測量 1044.7.1 主觀測試 1054.7.2 語音質量的客觀測量 1064.8 小結 107習題 107第5章 聲道中的聲音傳輸 1095.1 語音產生的聲學原理 1095.1.1 聲音傳播 1095.1.2 例子:均勻無損聲管 1105.1.3 聲道中損耗的影響 1145.1.4 嘴唇的輻射影響 1175.1.5 元音的聲道傳輸函數 1205.1.6 鼻腔耦合的影響 1235.1.7 聲道中聲音的激勵 1235.1.8 基于聲學理論的模型 1275.2 無損聲管模型 1285.2.1 級聯無損聲管中的波形傳播 1285.2.2 邊界條件 1305.2.3 與數字濾波器的關系 1345.2.4 無損聲管模型的傳輸函數 1375.3 采樣語音信號的數字模型 1415.3.1 聲道建模 1415.3.2 輻射模型 1435.3.3 激勵模型 1445.3.4 完整模型 1445.4 小結 146習題 146第6章 語音信號處理的時域方法 1536.1 引言 1536.2 語音的短時分析 1546.2.1 短時分析的通用框架 1566.2.2 短時分析中的濾波和采樣 1566.3 短時能量和短時幅度 1596.3.1 基于短時能量的自動增益控制 1606.3.2 短時幅度 1626.4 短時過零率 1636.5 短時自相關函數 1696.6 修正短時自相關函數 1736.7 短時平均幅度差分函數 1766.8 小結 177習題 177第7章 頻域表示 1837.1 引言 1837.2 離散時間傅里葉分析 1847.3 短時傅里葉分析 1867.3.1 dtft解釋 1877.3.2 dft實現 1887.3.3 加窗對分辨率的影響 1887.3.4 關于短時自相關函數 1937.3.5 線性濾波解釋 1937.3.6 時域和頻域中 的采樣率 1977.4 頻譜顯示 1997.5 合成的重疊相加法 2067.5.1 精確重建的條件 2067.5.2 合成窗的應用 2117.6 合成的濾波器組求和方法 2127.7 時間抽取濾波器組 2177.7.1 通用fbs抽取系統 2187.7.2 *大抽取濾波器組 2217.8 雙通道濾波器組 2227.8.1 正交鏡像濾波器組 2237.8.2 qmf濾波器組的多相結構 2257.8.3 共軛正交濾波器 2257.8.4 樹形結構濾波器組 2267.9 使用fft實現fbs方法 2287.9.1 fft分析技術 2287.9.2 fft合成技術 2307.10 ola再論 2327.11 修正的stft 2337.11.1 乘性修正 2337.11.2 加性修正 2367.11.3 時間標度修正:相位聲碼器 2377.12 小結 242習題 242第8章 倒譜和同態語音處理 2558.1 簡介 2558.2 卷積同態系統 2568.2.1 dtft表示 2578.2.2 z變換表示 2608.2.3 復倒譜的性質 2608.2.4 復倒譜分析實例 2628.2.5 *小和*大相位信號 2648.3 語音模型的同態分析 2658.3.1 濁音模型的同態分析 2668.3.2 清音模型的同態分析 2718.4 計算語音的短時倒譜和復倒譜 2738.4.1 基于離散傅里葉變換的計算 2738.4.2 基于z變換的計算 2768.4.3 *小相位和*大相位信號的遞歸計算 2788.5 自然語音的同態濾波 2798.5.1 語音短時倒譜分析模型 2808.5.2 使用多項式根的短時分析實例 2818.5.3 應用dft的濁音分析 2828.5.4 *小相位分析 2868.5.5 應用dft的清音分析 2878.5.6 短時倒譜分析小結 2898.6 全極點模型的倒譜分析 2908.7 倒譜距離度量 2918.7.1 線性濾波補償 2928.7.2 加權倒譜距離度量 2928.7.3 群時延頻譜 2938.7.4 mel頻率倒譜系數 2948.7.5 動態倒譜特征 2968.8 小結 296習題 296第9章 語音信號的線性預測分析 3019.1 引言 3019.2 線性預測分析的基本原理 3029.2.1 線性預測分析方程的基本公式 3049.2.2 自相關法 3059.2.3 協方差法 3079.2.4 小結 3089.3 模型增益的計算 3099.4 線性預測分析的頻域解釋 3119.4.1 線性預測短時頻譜分析 3119.4.2 均方預測誤差的頻域解釋 3139.4.3 模型階數p的作用 3169.4.4 線性預測語譜圖 3189.4.5 與其他譜分析方法的對比 3209.4.6 選擇性線性預測 3219.5 lpc方程組的解 3229.5.1 cholesky分解 3229.5.2 levinson-durbin算法 3259.5.3 格型公式及其解 3289.5.4 計算需求比較 3349.6 預測誤差信號 3359.6.1 歸一化均方誤差的其他表示法 3389.6.2 lpc參數值的實驗評估 3399.6.3 歸一化誤差隨幀位置的變化 3429.7 lpc多項式a(z)的一些性質 3449.7.1 預測誤差濾波器的*小相位性質 3449.7.2 parcor系數和lpc多項式的穩定性 3449.7.3 *佳lp模型根的位置 3459.8 線性預測分析與無損聲管模型的關系 3489.9 lp參數的替代表示 3519.9.1 預測誤差多項式的根 3519.9.2 全極點系統 的沖激響應 3529.9.3 沖激響應的自相關 3529.9.4 倒譜 3529.9.5 預測器多項式的自相關系數 3539.9.6 parcor系數 3539.9.7 對數面積比系數
展開全部
數字語音處理理論與應用 作者簡介
Lawrence R. Rabiner: 美國工程院和美國科學院院士,美國聲學學會、IEEE、貝爾實驗室、AT&T會士,以及Eta Kappa Nu、Sigma Xi、Tau Beta Pi等榮譽學會會員。曾擔任美國聲學學會副主席、IEEE Trans、ASSP主編和IEEE Proceedings編委。主要研究方向包括通信、控制與信號處理、數字信號處理、數字語音處理、多媒體通信、多模態處理、Rabiner教授于2002年從AT&T退休,隨后擔任羅格斯大學和加州大學圣巴巴拉分校教授,及羅格斯大學先進信息處理中心副主任。
劉加,清華大學教授,主要從事數字信號處理與數字語音信號處理的教學與研究工作,發表論文多篇,在教學與研究方面獲得多面榮譽。主要研究方向為信號與信號處理,語音通信等。