中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >
語音識(shí)別:原理與應(yīng)用

包郵 語音識(shí)別:原理與應(yīng)用

作者:洪青陽
出版社:電子工業(yè)出版社出版時(shí)間:2020-06-01
開本: 其他 頁數(shù): 332
中 圖 價(jià):¥63.7(5.0折) 定價(jià)  ¥128.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
開年大促, 全場(chǎng)包郵
?新疆、西藏除外
本類五星書更多>

語音識(shí)別:原理與應(yīng)用 版權(quán)信息

語音識(shí)別:原理與應(yīng)用 本書特色

適讀人群 :本書可以作為普通高等學(xué)校人工智能、計(jì)算機(jī)科學(xué)與技術(shù)、電子信息工程、自動(dòng)化等專業(yè)的本科生及研究生教材,也適合作為從事智能語音系統(tǒng)的科研和工程技術(shù)人員的參考用書!倘视∷ⅲ瑘D文并茂 √解析GMM-HMM、DNN-HMM和E2E框架,WFST和LF-MMI等關(guān)鍵技術(shù)全貌 √系統(tǒng)梳理經(jīng)典算法、前沿技術(shù) √工程實(shí)踐Kaldi和Espnet

語音識(shí)別:原理與應(yīng)用 內(nèi)容簡(jiǎn)介

本書系統(tǒng)地介紹了語音識(shí)別的原理和應(yīng)用,全書共分 15 章,原理部分涵蓋聲學(xué)特征、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、深度神經(jīng)網(wǎng)絡(luò)(DNN)、語言模型和加權(quán)有限狀態(tài)轉(zhuǎn)換器(WFST),重點(diǎn)描述了 GMM-HMM、DNN-HMM 和端到端(E2E)三種語音識(shí)別框架。本書應(yīng)用部分包含 Kaldi、Espnet、工業(yè)應(yīng)用實(shí)踐介紹,內(nèi)容主要來自工程經(jīng)驗(yàn),極具實(shí)用性。 本書可以作為普通高等學(xué)校人工智能、計(jì)算機(jī)科學(xué)與技術(shù)、電子信息工程、自動(dòng)化等專業(yè)的本科生及研究生教材,也適合作為從事智能語音系統(tǒng)的科研和工程技術(shù)人員的參考用書。

語音識(shí)別:原理與應(yīng)用 目錄

第1章 語音識(shí)別概論 1

1.1 語音的產(chǎn)生和感知 1

1.2 語音識(shí)別過程 4

1.3 語音識(shí)別發(fā)展歷史 8

1.4 國(guó)內(nèi)語音識(shí)別現(xiàn)狀 15

1.5 語音識(shí)別建模方法 19

1.5.1 DTW 19

1.5.2 GMM-HMM 20

1.5.3 DNN-HMM 20

1.5.4 端到端 22

1.6 語音識(shí)別開源工具 22

1.7 語音識(shí)別常用數(shù)據(jù)庫(kù) 22

1.8 語音識(shí)別評(píng)價(jià)指標(biāo) 24

第2章 語音信號(hào)基礎(chǔ) 28

2.1 聲波的特性 28

2.2 聲音的接收裝置 29

2.2.1 麥克風(fēng)陣列 31

2.3 聲音的采樣 32

2.4 聲音的量化 33

2.5 語音的編碼 35

2.6 WAV文件格式 38

2.7 WAV文件分析 39

第3章 語音特征提取 44

3.1 預(yù)處理 44

3.2 短時(shí)傅立葉變換 48

3.3 聽覺特性 51

3.4 線性預(yù)測(cè) 54

3.5 倒譜分析 55

3.6 常用的聲學(xué)特征 56

3.6.1 語譜圖 57

3.6.2 FBank 58

3.6.3 MFCC 59

3.6.4 PLP 61

3.6.5 CQCC 62

第4章 HMM 67

4.1 HMM的基本概念 69

4.1.1 馬爾可夫鏈 70

4.1.2 雙重隨機(jī)過程 71

4.1.3 HMM的定義 72

4.2 HMM的三個(gè)基本問題 73

4.2.1 模型評(píng)估問題 74

4.2.2 *佳路徑問題 77

4.2.3 模型訓(xùn)練問題 79

第5章 GMM-HMM 83

5.1 概率統(tǒng)計(jì) 84

5.2 高斯分布 85

5.3 GMM 88

5.3.1 初始化 89

5.3.2 重估計(jì) 90

5.4 GMM-HMM 91

5.5 GMM-HMM的訓(xùn)練 97

5.6 模型自適應(yīng) 99

5.6.1 MAP 99

5.6.2 MLLR 100

5.6.3 fMLLR 100

5.6.4 SAT 101

課程實(shí)踐:基于HTK搭建GMM-HMM系統(tǒng) 103

第6章 基于HMM的語音識(shí)別 104

6.1 建模單元 104

6.2 發(fā)音過程與HMM狀態(tài) 107

6.3 串接HMM 108

6.4 固定語法的識(shí)別 112

6.5 隨機(jī)語法的識(shí)別 117

第7章 音素的上下文建模 125

7.1 協(xié)同發(fā)音 125

7.2 上下文建模 126

7.3 決策樹 128

7.4 問題集 129

7.4.1 手工設(shè)計(jì) 129

7.4.2 自動(dòng)生成 131

7.5 三音子模型的訓(xùn)練 134

第8章 語言模型 136

8.1 n-gram模型 138

8.2 評(píng)價(jià)指標(biāo)——困惑度 142

8.3 平滑技術(shù) 143

8.3.1 Good-Turing折扣法 143

8.3.2 Jelinek-Mercer插值法 144

8.3.3 Kneser-Ney插值法 144

8.3.4 Katz回退法 146

8.4 語言模型的訓(xùn)練 148

8.5 遞歸神經(jīng)網(wǎng)絡(luò)語言模型 151

第9章 WFST解碼器 158

9.1 基于動(dòng)態(tài)網(wǎng)絡(luò)的Viterbi解碼 159

9.2 WFST理論 163

9.3 HCLG構(gòu)建 168

9.3.1 H的構(gòu)建 169

9.3.2 C的構(gòu)建 171

9.3.3 L的構(gòu)建 172

9.3.4 G的構(gòu)建 173

9.3.5 HCLG合并 175

9.4 WFST的Viterbi解碼 177

9.4.1 Token的定義 177

9.4.2 Viterbi算法 178

9.5 Lattice解碼 185

9.5.1 主要數(shù)據(jù)結(jié)構(gòu) 185

9.5.2 令牌傳播過程 186

9.5.3 剪枝策略 189

9.5.4 Lattice 190

第10章 DNN-HMM 194

10.1 深度學(xué)習(xí) 194

10.2 DNN 195

10.2.1 激活函數(shù) 196

10.2.2 損失函數(shù) 198

10.2.3 梯度下降算法 199

10.3 DNN與HMM的結(jié)合 201

10.4 不同的DNN結(jié)構(gòu) 205

10.4.1 CNN 205

10.4.2 LSTM 210

10.4.3 GRU 210

10.4.4 TDNN 211

10.4.5 TDNN-F 214

第11章 序列區(qū)分性訓(xùn)練 220

11.1 區(qū)分性準(zhǔn)則 221

11.1.1 MMI 221

11.1.2 BMMI 222

11.1.3 MPE/sMBR 222

11.2 MMI求導(dǎo)過程 223

11.3 Lattice-based MMI 225

11.4 Lattice-free MMI 227

11.5 Kaldi Chain模型 230

第12章 端到端語音識(shí)別 233

12.1 CTC 234

12.1.1 損失函數(shù) 235

12.1.2 前向算法 239

12.1.3 后向算法 242

12.1.4 求導(dǎo)過程 243

12.1.5 CTC解碼 245

12.2 RNN-T 248

12.3 Attention模型 251

12.4 Hybrid CTC/Attention 254

12.5 Transformer 256

第13章 Kaldi實(shí)踐 262

13.1 下載與安裝Kaldi 263

13.1.1 獲取源代碼 263

13.1.2 編譯 264

13.2 創(chuàng)建與配置基本的工程目錄 265

13.3 aishell語音識(shí)別工程 266

13.3.1 數(shù)據(jù)映射目錄準(zhǔn)備 267

13.3.2 詞典準(zhǔn)備和lang目錄生成 269

13.3.3 語言模型訓(xùn)練 271

13.3.4 聲學(xué)特征提取與倒譜均值歸一化 273

13.3.5 聲學(xué)模型訓(xùn)練與強(qiáng)制對(duì)齊 274

13.3.6 解碼測(cè)試與指標(biāo)計(jì)算 277

第14章 Espnet實(shí)踐 280

14.1 數(shù)據(jù)準(zhǔn)備 280

14.1.1 映射文件準(zhǔn)備 280

14.1.2 特征提取 281

14.1.3 數(shù)據(jù)增強(qiáng) 282

14.1.4 詞典生成 282

14.1.5 數(shù)據(jù)打包 283

14.2 Espnet配置文件 284

14.3 語言模型訓(xùn)練 285

14.4 聲學(xué)模型訓(xùn)練 287

14.4.1 聲學(xué)模型訓(xùn)練腳本 287

14.4.2 CTC聲學(xué)模型訓(xùn)練 288

14.4.3 Attention聲學(xué)模型訓(xùn)練 289

14.4.4 RNN-T模型訓(xùn)練 290

14.4.5 Transformer模型訓(xùn)練 292

14.5 語音識(shí)別解碼 293

14.6 Espnet訓(xùn)練解碼可視化 294

14.6.1 Espnet訓(xùn)練參數(shù)可視化 294

14.6.2 Espnet中的Attention可視化 295

14.6.3 Espnet解碼結(jié)果可視化 296

第15章 工業(yè)應(yīng)用實(shí)踐 298

15.1 動(dòng)態(tài)庫(kù)封裝 298

15.1.1 函數(shù)接口 298

15.1.2 動(dòng)態(tài)庫(kù)編譯 306

15.1.3 動(dòng)態(tài)庫(kù)調(diào)用 309

15.2 語音云平臺(tái) 310

15.3 識(shí)別引擎優(yōu)化 315

15.3.1 加快響應(yīng)速度 315

15.3.2 定制語言模型 316

15.3.3 定制聲學(xué)模型 316

15.4 嵌入式移植 318

展開全部

語音識(shí)別:原理與應(yīng)用 作者簡(jiǎn)介

洪青陽,廈門大學(xué)副教授,天聰智能創(chuàng)始人,主要研究方向是語音識(shí)別、聲紋識(shí)別,先后主持國(guó)家自然基金兩項(xiàng),科技部創(chuàng)新基金兩項(xiàng)。牽頭組建廈門大學(xué)智能語音實(shí)驗(yàn)室,帶領(lǐng)xmuspeech團(tuán)隊(duì)連續(xù)兩屆獲東方語種識(shí)別(OLR)競(jìng)賽第一名,成功研發(fā)國(guó)內(nèi)第一套閩南語合成系統(tǒng)。具有豐富的工業(yè)界研發(fā)經(jīng)驗(yàn),與華為、云從、掌數(shù)科技等知名企業(yè)合作,承擔(dān)過大量的智能語音項(xiàng)目,核心技術(shù)應(yīng)用到華為智能手機(jī)和全國(guó)十五個(gè)省市的司法/社保/證券/電力系統(tǒng)。長(zhǎng)期從事本科生、研究生的語音識(shí)別教學(xué)工作,從動(dòng)態(tài)時(shí)間規(guī)整(DTW)、隱馬爾可夫模型(HMM)到E2E語音識(shí)別框架,與時(shí)俱進(jìn)更新教學(xué)內(nèi)容,積累了豐富的教學(xué)經(jīng)驗(yàn)。

商品評(píng)論(0條)
暫無評(píng)論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 合肥汽车充电桩_安徽充电桩_电动交流充电桩厂家_安徽科帝新能源科技有限公司 | 呼末二氧化碳|ETCO2模块采样管_气体干燥管_气体过滤器-湖南纳雄医疗器械有限公司 | 卸料器-卸灰阀-卸料阀-瑞安市天蓝环保设备有限公司 | 潍坊大集网-潍坊信息港-潍坊信息网| 鑫铭东办公家具一站式定制采购-深圳办公家具厂家直销 | RV减速机-蜗轮蜗杆减速机-洗车机减速机-减速机厂家-艾思捷 | 高温热泵烘干机,高温烘干热泵,热水设备机组_正旭热泵 | 缓蚀除垢剂_循环水阻垢剂_反渗透锅炉阻垢剂_有机硫化物-郑州威大水处理材料有限公司 | 雷冲击高压发生器-水内冷直流高压发生器-串联谐振分压器-武汉特高压电力科技有限公司 | 无缝钢管-聊城无缝钢管-小口径无缝钢管-大口径无缝钢管 - 聊城宽达钢管有限公司 | 西宁装修_西宁装修公司-西宁业之峰装饰-青海业之峰墅级装饰设计公司【官网】 | 温州食堂承包 - 温州市尚膳餐饮管理有限公司 | 通风天窗,通风气楼,屋顶通风天窗,屋顶通风天窗公司 | AR开发公司_AR增强现实_AR工业_AR巡检|上海集英科技 | 软启动器-上海能曼电气有限公司| 武汉刮刮奖_刮刮卡印刷厂_为企业提供门票印刷_武汉合格证印刷_现金劵代金券印刷制作 - 武汉泽雅印刷有限公司 | 无菌检查集菌仪,微生物限度仪器-苏州长留仪器百科 | 对辊破碎机-液压双辊式,强力双齿辊,四辊破碎机价格_巩义市金联机械设备生产厂家 | 沙盘模型公司_沙盘模型制作公司_建筑模型公司_工业机械模型制作厂家 | 航空障碍灯_高中低光强航空障碍灯_民航许可认证航空警示灯厂家-东莞市天翔航天科技有限公司 | 玉米深加工设备-玉米深加工机械-新型玉米工机械生产厂家-河南粮院机械制造有限公司 | 双段式高压鼓风机-雕刻机用真空泵-绍兴天晨机械有限公司 | 优考试_免费在线考试系统_培训考试系统_题库系统_组卷答题系统_匡优考试 | ERP企业管理系统永久免费版_在线ERP系统_OA办公_云版软件官网 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库-首页-东莞市傲马网络科技有限公司 | 石家庄网站建设|石家庄网站制作|石家庄小程序开发|石家庄微信开发|网站建设公司|网站制作公司|微信小程序开发|手机APP开发|软件开发 | 深圳离婚律师咨询「在线免费」华荣深圳婚姻律师事务所专办离婚纠纷案件 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 老城街小面官网_正宗重庆小面加盟技术培训_特色面馆加盟|牛肉拉面|招商加盟代理费用多少钱 | 金现代信息产业股份有限公司--数字化解决方案供应商 | 北京晚会活动策划|北京节目录制后期剪辑|北京演播厅出租租赁-北京龙视星光文化传媒有限公司 | 上海办公室装修,办公楼装修设计,办公空间设计,企业展厅设计_写艺装饰公司 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 圆盘鞋底注塑机_连帮鞋底成型注塑机-温州天钢机械有限公司 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 派财经_聚焦数字经济内容服务平台| 高铝矾土熟料_细粉_骨料_消失模_铸造用铝矾土_铝酸钙粉—嵩峰厂家 | 智能风向风速仪,风速告警仪,数字温湿仪,综合气象仪(气象五要素)-上海风云气象仪器有限公司 | 环压强度试验机-拉链拉力试验机-上海倾技仪器仪表科技有限公司 | 北京银联移动POS机办理_收银POS机_智能pos机_刷卡机_收银系统_个人POS机-谷骐科技【官网】 | 自动螺旋上料机厂家价格-斗式提升机定制-螺杆绞龙输送机-杰凯上料机 |