中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >
語音識別:原理與應(yīng)用(第2版)

包郵 語音識別:原理與應(yīng)用(第2版)

作者:洪青陽
出版社:電子工業(yè)出版社出版時間:2022-12-01
開本: 其他 頁數(shù): 364
中 圖 價:¥89.7(6.5折) 定價  ¥138.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

語音識別:原理與應(yīng)用(第2版) 版權(quán)信息

語音識別:原理與應(yīng)用(第2版) 本書特色

語音識別領(lǐng)域經(jīng)典著作升級版∣系統(tǒng)梳理經(jīng)典算法、前沿技術(shù)與工程實踐∣全彩印刷√配合大量插圖,詳解語音識別原理√夯實基礎(chǔ)理論和關(guān)鍵技術(shù),提高實戰(zhàn)技能√工程實踐方法剖析:Kaldi、ESPnet和WeNet等洪青陽老師是國內(nèi)語音信息處理領(lǐng)域的著名學(xué)者。本書從語音信號處理的知識講起,覆蓋了概率模型和神經(jīng)網(wǎng)絡(luò)時代語音識別領(lǐng)域的代表性算法,兼顧了歷史沉積和技術(shù)前沿。書中既包括理論知識,也包括算法原理,同時給出了動手實踐的案例,集理論性與實操性于一體,可見作者用心細致。通過本書的學(xué)習(xí),讀者將獲得語音識別的基礎(chǔ)知識和前沿視野,為進一步研究打下堅實的基礎(chǔ)。 清華大學(xué)副研究員/語音語言研究中心副主任 王東 洪老師的《語音識別:原理與應(yīng)用(第2版)》是一本優(yōu)秀的人工智能領(lǐng)域的教材。它既有語音技術(shù)基本原理和語音識別基礎(chǔ)框架的講解,又有*新前沿技術(shù)的闡述,娓娓道來,潤物無聲,使讀者從入門循序漸進地深入技術(shù)前沿。同時,本書還詳細介紹了語音識別的工程實踐方法,幫助讀者迅速掌握語音識別的落地技術(shù)。這兩方面是本書區(qū)別于現(xiàn)有教材的顯著特色。 中國科學(xué)院聲學(xué)研究所研究員/博士生導(dǎo)師 趙慶衛(wèi) 我從九幾年畢業(yè)到現(xiàn)在一直從事電信行業(yè)的語音應(yīng)用開發(fā)工作。電信行業(yè)語音識別**次大規(guī)模應(yīng)用應(yīng)該是21世紀(jì)初的語音電話本和彩鈴搜索。然而,由于受到環(huán)境、信道和口音的影響,語音識別基本只是受限的應(yīng)用,特別是在8kHz電話信道下,要提高識別率還需要不斷地研究和實踐。國內(nèi)兼顧理論研究和工程應(yīng)用的語音識別類書籍還很少,本書是介紹語音識別較為全面的一本書。書中不僅介紹了語音識別相關(guān)理論,而且詳細介紹了諸如Kaldi工具的使用和封裝、云服務(wù)等開發(fā)實踐。因此,本書對于那些希望將理論轉(zhuǎn)換成能實際投產(chǎn)的生產(chǎn)系統(tǒng)的研究人員極具實用性,對于從事語音識別應(yīng)用集成開發(fā)的工程師也具有參考價值。 資深CTI專家/《百問FreeSwitch》作者 余洪涌 洪青陽老師在智能語音領(lǐng)域耕耘多年,桃李天下。今傾心編寫本書,把語音識別領(lǐng)域的技術(shù)一一道來,本人作為證券行業(yè)從業(yè)者,并非語音專業(yè)人士,但讀完本書有一種茅塞頓開的感覺。如今語音識別、語音合成和聲紋識別技術(shù)在證券行業(yè)擁有廣泛的應(yīng)用場景,相信讀者學(xué)習(xí)完本書,能夠更加深刻地理解語音識別的技術(shù)原理和應(yīng)用技巧。建議金融行業(yè)身居客服、運營等技術(shù)創(chuàng)新崗位的同仁閱讀學(xué)習(xí)。 東方證券股份有限公司系統(tǒng)研發(fā)部總監(jiān) 包怡軍 人工智能特別是智能語音技術(shù)在證券行業(yè)得到空前發(fā)展,這得益于大數(shù)據(jù)方面的積累,源于開源社區(qū)對深度學(xué)習(xí)算法的研究,以及GPU等硬件加速技術(shù)的算力加持。洪青陽和李琳老師帶領(lǐng)廈門大學(xué)智能語音實驗室團隊,在語音識別技術(shù)方面進行了系統(tǒng)、深入及全面的研究,終得以成就本書。拜讀后深深感到,書中所提及的有關(guān)技術(shù),正在被金融證券智能化語音場景(如智能外呼、智能審核、智能質(zhì)檢、智能雙錄、智能運營等)廣泛使用,具有極強的實用性。書中所述的對聲學(xué)模型與語言模型的調(diào)優(yōu)方法,有著作者獨到的見解。推薦致力于從事智能語音技術(shù)和算法研究的人士閱讀。 上海掌數(shù)科技有限公司總經(jīng)理 劉建上海掌數(shù)科技有限公司技術(shù)總監(jiān) 高星

語音識別:原理與應(yīng)用(第2版) 內(nèi)容簡介

本書圍繞語音識別的原理和應(yīng)用講解,理論結(jié)合實際,采用大量插圖,輔以實例,力求深入淺出,讓讀者能較快地理解語音識別的基礎(chǔ)理論和關(guān)鍵技術(shù)。為了幫助讀者動手操作,提高實戰(zhàn)技能,本書*后還結(jié)合Kaldi、ESPnet和WeNet等開源工具,介紹了具體的工程實踐方法。

語音識別:原理與應(yīng)用(第2版) 目錄

第1章 語音識別概論 1 1.1 語音的產(chǎn)生和感知 1 1.2 語音識別過程 4 1.3 語音識別發(fā)展歷史 8 1.4 國內(nèi)語音識別現(xiàn)狀 15 1.5 語音識別建模方法 18 1.5.1 DTW 19 1.5.2 GMM-HMM 19 1.5.3 DNN-HMM 20 1.5.4 E2E模型 22 1.6 語音識別開源工具 22 1.7 常用語音識別數(shù)據(jù)庫 23 1.8 語音識別評價指標(biāo) 24 1.9 參考資料 25 第2章 語音信號基礎(chǔ) 28 2.1 聲波的特性 28 2.2 聲音的接收裝置 29 2.2.1 麥克風(fēng)的性能指標(biāo) 30 2.2.2 麥克風(fēng)陣列 31 2.3 聲音的采樣 32 2.4 聲音的量化 33 2.5 語音的編碼 35 2.6 WAV文件格式 39 2.7 WAV文件分析 40 2.8 本章小結(jié) 43 思考練習(xí)題 43 第3章 語音特征提取 44 3.1 預(yù)處理 44 3.2 短時傅里葉變換 48 3.3 聽覺特性 51 3.4 線性預(yù)測 54 3.5 倒譜分析 55 3.6 常用的聲學(xué)特征 56 3.6.1 語譜圖 57 3.6.2 FBank 58 3.6.3 MFCC 59 3.6.4 PLP 60 3.7 本章小結(jié) 62 思考練習(xí)題 63 第4章 HMM 64 4.1 HMM的基本概念 66 4.1.1 馬爾可夫鏈 67 4.1.2 雙重隨機過程 68 4.1.3 HMM的定義 69 4.2 HMM的三個基本問題 70 4.2.1 模型評估問題 71 4.2.2 *佳路徑問題 74 4.2.3 模型訓(xùn)練問題 76 4.3 本章小結(jié) 78 4.4 參考資料 79 思考練習(xí)題 79 第5章 GMM-HMM 80 5.1 概率統(tǒng)計 81 5.2 高斯分布 82 5.3 GMM 85 5.3.1 初始化 86 5.3.2 重估計 87 5.4 GMM與HMM的結(jié)合 88 5.5 GMM-HMM的訓(xùn)練 94 5.6 模型自適應(yīng) 96 5.6.1 MAP 96 5.6.2 MLLR 97 5.6.3 fMLLR 97 5.6.4 SAT 98 5.7 本章小結(jié) 98 5.8 參考資料 98 思考練習(xí)題 99 第6章 基于HMM的語音識別 100 6.1 建模單元 100 6.2 發(fā)音過程與HMM狀態(tài) 103 6.3 串接HMM 104 6.4 固定語法的識別 108 6.5 隨機語法的識別 113 6.6 音素的上下文建模 119 6.6.1 協(xié)同發(fā)音 120 6.6.2 上下文建模 121 6.6.3 決策樹 122 6.6.4 問題集 123 6.6.5 三音子模型的訓(xùn)練 128 6.7 本章小結(jié) 129 思考練習(xí)題 130 第7章 DNN-HMM 131 7.1 深度學(xué)習(xí) 131 7.2 DNN 132 7.2.1 激活函數(shù) 133 7.2.2 損失函數(shù) 135 7.2.3 梯度下降算法 136 7.3 DNN與HMM的結(jié)合 138 7.4 不同的DNN結(jié)構(gòu) 142 7.4.1 CNN 143 7.4.2 LSTM 147 7.4.3 GRU 147 7.4.4 TDNN 148 7.4.5 TDNN-F 151 7.5 本章小結(jié) 154 7.6 參考資料 155 思考練習(xí)題 155 第8章 語言模型 156 8.1 n-gram模型 158 8.2 評價指標(biāo)——困惑度 162 8.3 平滑技術(shù) 163 8.3.1 Good-Turing折扣法 163 8.3.2 Witten-Bell折扣法 165 8.3.3 Katz回退法 166 8.3.4 Jelinek-Mercer插值法 169 8.3.5 Kneser-Ney插值法 170 8.4 語言模型的訓(xùn)練 172 8.5 神經(jīng)網(wǎng)絡(luò)語言模型 175 8.6 本章小結(jié) 180 8.7 參考資料 180 思考練習(xí)題 181 第9章 WFST解碼器 183 9.1 基于動態(tài)網(wǎng)絡(luò)的Viterbi解碼 184 9.2 WFST理論 189 9.3 HCLG構(gòu)建 193 9.3.1 H的構(gòu)建 194 9.3.2 C的構(gòu)建 195 9.3.3 L的構(gòu)建 196 9.3.4 G的構(gòu)建 197 9.3.5 HCLG合并 200 9.4 WFST的Viterbi解碼 202 9.4.1 Token的定義 202 9.4.2 Viterbi算法 203 9.5 Lattice解碼 210 9.5.1 主要數(shù)據(jù)結(jié)構(gòu) 211 9.5.2 令牌傳播過程 212 9.5.3 剪枝策略 215 9.5.4 Lattice 216 9.6 本章小結(jié) 218 9.7 參考資料 218 思考練習(xí)題 218 第10章 序列區(qū)分性訓(xùn)練 219 10.1 區(qū)分性準(zhǔn)則 220 10.1.1 MMI 220 10.1.2 BMMI 221 10.1.3 MPE/sMBR 221 10.2 MMI求導(dǎo)過程 222 10.3 Lattice-based MMI 224 10.4 Lattice-free MMI 226 10.5 Kaldi Chain模型 228 10.6 本章小結(jié) 230 10.7 參考資料 230 思考練習(xí)題 231 第11章 端到端語音識別 232 11.1 CTC 233 11.1.1 損失函數(shù) 234 11.1.2 前向算法 238 11.1.3 后向算法 241 11.1.4 求導(dǎo)過程 242 11.1.5 CTC解碼 244 11.2 RNN-T 247 11.3 基于Attention的Encoder-Decoder模型 250 11.4 Hybrid CTC/Attention 253 11.5 Transformer 255 11.6 Conformer 258 11.7 本章小結(jié) 259 11.8 參考資料 259 思考練習(xí)題 261 第12章 Kaldi實踐 262 12.1 下載與安裝Kaldi 263 12.1.1 獲取源代碼 263 12.1.2 編譯 264 12.2 創(chuàng)建和配置基本的工程目錄 265 12.3 aishell語音識別工程 266 12.3.1 數(shù)據(jù)集映射目錄準(zhǔn)備 267 12.3.2 詞典準(zhǔn)備和lang目錄生成 269 12.3.3 語言模型訓(xùn)練 271 12.3.4 聲學(xué)特征提取與倒譜均值歸一化 273 12.3.5 聲學(xué)模型訓(xùn)練與強制對齊 275 12.3.6 解碼測試與指標(biāo)計算 277 12.4 本章小結(jié) 279 第13章 ESPnet實踐 280 13.1 數(shù)據(jù)準(zhǔn)備 280 13.1.1 映射文件準(zhǔn)備 280 13.1.2 特征提取 281 13.1.3 數(shù)據(jù)擴增 282 13.1.4 詞典生成 282 13.1.5 數(shù)據(jù)打包 283 13.2 ESPnet配置文件 284 13.3 語言模型訓(xùn)練 286 13.4 聲學(xué)模型訓(xùn)練 287 13.4.1 聲學(xué)模型訓(xùn)練腳本 287 13.4.2 CTC聲學(xué)模型訓(xùn)練 288 13.4.3 Attention聲學(xué)模型訓(xùn)練 289 13.4.4 RNN-T模型訓(xùn)練 290 13.4.5 Transformer模型訓(xùn)練 292 13.5 語音識別解碼 293 13.6 ESPnet訓(xùn)練解碼可視化 294 13.6.1 ESPnet訓(xùn)練參數(shù)可視化 294 13.6.2 ESPnet中的Attention可視化 295 13.6.3 ESPnet解碼結(jié)果可視化 296 13.7 ESPnet2 297 13.7.1 ESPnet2與ESPnet 297 13.7.2 數(shù)據(jù)準(zhǔn)備 298 13.7.3 配置文件 299 13.7.4 模型訓(xùn)練 300 13.7.5 訓(xùn)練日志與可視化 303 13.7.6 性能對比 304 13.8 本章小結(jié) 305 13.9 參考資料 305 第14章 WeNet實踐 306 14.1 數(shù)據(jù)準(zhǔn)備 306 14.1.1 映射文件準(zhǔn)備 306 14.1.2 CMVN計算 307 14.1.3 詞典生成 307 14.1.4 數(shù)據(jù)打包 307 14.2 WeNet配置文件 308 14.3 聲學(xué)模型訓(xùn)練 309 14.3.1 聲學(xué)模型訓(xùn)練腳本 309 14.3.2 Transformer模型訓(xùn)練 310 14.3.3 Conformer模型訓(xùn)練 313 14.3.4 Unified Conformer模型訓(xùn)練 314 14.3.5 U2++ Conformer模型訓(xùn)練 315 14.4 Python環(huán)境解碼 315 14.5 WeNet 模型部署 317 14.5.1 模型導(dǎo)出 317 14.5.2 語言模型訓(xùn)練 317 14.5.3 結(jié)合語言模型的解碼 318 14.6 WeNet 解碼結(jié)果可視化 318 14.7 本章小結(jié) 319 14.8 參考文獻 319 第15章 工業(yè)應(yīng)用實踐 320 15.1 應(yīng)用場景 321 15.2 引擎優(yōu)化 323 15.2.1 Kaldi方案 323 15.2.2 WeNet方案 327 15.3 工程部署 330 15.3.1 SDK封裝 330 15.3.2 語音云平臺 338 15.3.3 Kaldi嵌入式移植 342 15.3.4 WeNet端側(cè)部署 344 15.4 本章小結(jié)
展開全部

語音識別:原理與應(yīng)用(第2版) 作者簡介

洪青陽,廈門大學(xué)副教授,天聰智能創(chuàng)始人,主要研究方向是語音識別、聲紋識別,先后主持國家自然科學(xué)基金三項,科技部創(chuàng)新基金兩項。牽頭組建廈門大學(xué)智能語音實驗室,帶領(lǐng)XMUSPEECH團隊連續(xù)兩屆獲東方語種識別(OLR)競賽第一名,成功研發(fā)國內(nèi)第一套閩南語合成系統(tǒng)。具有豐富的工業(yè)界研發(fā)經(jīng)驗,與華為、云從、掌數(shù)、鼎橋等知名企業(yè)合作,承擔(dān)過大量的智能語音項目,核心技術(shù)應(yīng)用到華為智能手機和全國十幾個省市的司法/社保/證券/電力系統(tǒng)。長期從事本科生、研究生的語音識別教學(xué)工作,從最早的動態(tài)時間規(guī)整(DTW)、隱馬爾可夫模型(HMM)到最新的端到端(E2E)語音識別框架,與時俱進更新教學(xué)內(nèi)容,積累了豐富的教學(xué)經(jīng)驗。 李琳,廈門大學(xué)副教授,博士生導(dǎo)師,主要研究方向為語音信號處理、聲紋識別、智能系統(tǒng)設(shè)計,主持國家自然科學(xué)基金一項,負責(zé)國家科技部重點研發(fā)計劃項目子課題一項,曾獲福建省科技進步獎二等獎、福建省教學(xué)成果獎二等獎、廈門市科技進步獎一等獎。參與指導(dǎo)XMUSPEECH團隊連續(xù)兩屆獲東方語種識別競賽第一名。國際IEEE學(xué)會會員,CCF高級會員,CCF語音對話與聽覺專業(yè)委員會委員,NCMMSC常設(shè)機構(gòu)委員會委員。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 脉冲除尘器,除尘器厂家-淄博机械 | 即用型透析袋,透析袋夹子,药敏纸片,L型涂布棒-上海桥星贸易有限公司 | 馋嘴餐饮网_餐饮加盟店火爆好项目_餐饮连锁品牌加盟指南创业平台 | 高压无油空压机_无油水润滑空压机_水润滑无油螺杆空压机_无油空压机厂家-科普柯超滤(广东)节能科技有限公司 | 杭州高温泵_热水泵_高温油泵|昆山奥兰克泵业制造有限公司 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | 飞利浦LED体育场灯具-吸顶式油站灯-飞利浦LED罩棚灯-佛山嘉耀照明有限公司 | 可程式恒温恒湿试验箱|恒温恒湿箱|恒温恒湿试验箱|恒温恒湿老化试验箱|高低温试验箱价格报价-广东德瑞检测设备有限公司 | 康明斯发电机,上柴柴油发电机,玉柴柴油发电机组_海南重康电力官网 | 耐热钢-耐磨钢-山东聚金合金钢铸造有限公司 | Honsberg流量计-Greisinger真空表-气压计-上海欧臻机电设备有限公司 | 锻造液压机,粉末冶金,拉伸,坩埚成型液压机定制生产厂家-山东威力重工官方网站 | 长沙网站建设制作「网站优化推广」-网页设计公司-速马科技官网 | 专业广州网站建设,微信小程序开发,一物一码和NFC应用开发、物联网、外贸商城、定制系统和APP开发【致茂网络】 | 翰墨AI智能写作助手官网_人工智能问答在线AI写作免费一键生成 | 企业管理培训,企业培训公开课,企业内训课程,企业培训师 - 名课堂企业管理培训网 | 筒瓦厂家-仿古瓦-寺庙-古建琉璃瓦-宜兴市古典园林建筑陶瓷厂有限公司 | 顺辉瓷砖-大国品牌-中国顺辉| 压片机_高速_单冲_双层_花篮式_多功能旋转压片机-上海天九压片机厂家 | 中药二氧化硫测定仪,食品二氧化硫测定仪|俊腾百科 | 深圳公司注册-工商注册代理-注册公司流程和费用_护航财税 | 微量水分测定仪_厂家_卡尔费休微量水分测定仪-淄博库仑 | 培训无忧网-教育培训咨询招生第三方平台 | 青州开防盗门锁-配汽车芯片钥匙-保险箱钥匙-吉祥修锁店 | 液压升降货梯_导轨式升降货梯厂家_升降货梯厂家-河南东圣升降设备有限公司 | 大通天成企业资质代办_承装修试电力设施许可证_增值电信业务经营许可证_无人机运营合格证_广播电视节目制作许可证 | 网架支座@球铰支座@钢结构支座@成品支座厂家@万向滑动支座_桥兴工程橡胶有限公司 | 胀套-锁紧盘-风电锁紧盘-蛇形联轴器「厂家」-瑞安市宝德隆机械配件有限公司 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 全自动贴标机-套标机-工业热风机-不干胶贴标机-上海厚冉机械 | 米顿罗计量泵(科普)——韬铭机械 | 电镀整流器_微弧氧化电源_高频电解电源_微弧氧化设备厂家_深圳开瑞节能 | 昆明网络公司|云南网络公司|昆明网站建设公司|昆明网页设计|云南网站制作|新媒体运营公司|APP开发|小程序研发|尽在昆明奥远科技有限公司 | 净化板-洁净板-净化板价格-净化板生产厂家-山东鸿星新材料科技股份有限公司 | 工业制氮机_psa制氮机厂家-宏骁智能装备科技江苏有限公司 | 二次元影像仪|二次元测量仪|拉力机|全自动影像测量仪厂家_苏州牧象仪器 | 建筑消防设施检测系统检测箱-电梯**检测仪器箱-北京宇成伟业科技有限责任公司 | 制丸机,小型中药制丸机,全自动制丸机价格-甘肃恒跃制药设备有限公司 | 市政路灯_厂家-淄博信达电力科技有限公司 | 点胶机_点胶阀_自动点胶机_智能点胶机_喷胶机_点胶机厂家【欧力克斯】 | 行星齿轮减速机,减速机厂家,山东减速机-淄博兴江机械制造 |