中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
語音識別:模式、算法設計與實踐

包郵 語音識別:模式、算法設計與實踐

作者:董雪燕
出版社:中國鐵道出版社出版時間:2024-01-01
開本: 16開 頁數: 340
中 圖 價:¥63.4(6.4折) 定價  ¥99.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

語音識別:模式、算法設計與實踐 版權信息

  • ISBN:9787113304225
  • 條形碼:9787113304225 ; 978-7-113-30422-5
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

語音識別:模式、算法設計與實踐 本書特色

(1)理論與實踐相結合 讀者不僅可以看到理論模型的設計思想 ,還可以通過代碼實踐加深對算法的理解 , 可以看到算法是如何去解決具體的語音識別問題的。 (2)語言有親和力 在不失嚴謹的前提下 ,增加文字表達的活潑度和內容表達的圖形化展示程度,保證讀者能夠 一步 一步地深入理解 , 而不是僅僅停留在數學公式的簡單介紹層面。 (3)分享作者多年的經驗 ,讓內容“有血有肉” 在書中適當位置嵌入過來人的思考和經驗,一 來讓讀者避坑 , 二 來提供 一 些問題的解決思路。 (4)案例豐富 本書融入了多個案例 , 目的是展示算法是如何解決實際問題的 。 同時 ,橫向算法的比較也很必要 ,這樣能幫助讀者透徹理解不同算法的優缺點。

語音識別:模式、算法設計與實踐 內容簡介

隨著深度學習技術和計算機硬件設備的發展,作為人工智能領域重要課題的語音識別技術發展迅速,部分應用開始落地,實踐流程也日漸成熟。本書凝聚作者多年實踐心得和經驗,力求用抽絲剝繭的方式幫讀者梳理出語音識別的學習與提升之路,涉及語音識別發展脈絡、知識地圖、模式識別、核心算法和實踐案例,*終形成“基礎知識—算法理論—實踐”的完整的閉環。在具體的寫作中,本書力求梳理清楚經典算法之間的邏輯關聯,并對其在實踐案例中的具體應用作出細致描述,幫助讀者實現原理與實踐之間的平滑過渡。

語音識別:模式、算法設計與實踐 目錄

第1章 語音識別概述 1.1 走進語音識別 1.1.1 語音識別的定義 1.1.2 語音識別任務的分類 1.1.3 語音識別是一門交叉學科 1.1.4 語音識別的應用 1.2 發展概況 1.2.1 人工語音識別 1.2.2 自動化語音識別 1.3 面臨的挑戰 1.3.1 語音信號的復雜性 1.3.2 機器學習模型的局限性 1.3.3 硬件設備的制約 1.3.4 應用場景的復雜性 1.3.5 倫理問題 第2章 必知必會的數學基礎知識 2.1 向量與矩陣 2.1.1 向量 2.1.2 矩陣 2.2 概率與統計 2.2.1 概率基礎 2.2.2 分類分布 2.2.3 數據的標準模型——高斯分布 2.2.4 適用性極為廣泛的貝葉斯定理 2.3 基本函數的用法 2.3.1 一元一次函數 2.3.2 一元二次函數 2.3.3 神經網絡中不得不提的階躍函數 2.4 函數的求導 2.4.1 一元函數的導數 2.4.2 多元函數的偏導數 2.4.3 復合函數的導數計算法則 2.4.4 線性模型尋找*優參數的方法——*小二乘法 2.4.5 非線性模型求解*小值的方法——梯度下降法 2.4.6 適用于復雜模型的參數優化方法——正則化 2.5 數列和遞推公式 2.5.1 數列的定義 2.5.2 數列的通項公式 2.5.3 由遞推關系式定義數列 第3章 模式識別 3.1 模式識別的基本概念 3.1.1 我們應該怎樣理解模式識別 3.1.2 統計模式識別系統的組成 3.1.3 示例:一個橘子分類系統 3.1.4 模式識別發展史中的里程碑事件 3.2 關于數據集的準備 3.2.1 數據的收集 3.2.2 數據集的劃分 3.3 預處理 3.3.1 預處理的內涵 3.3.2 常見的預處理思路 3.4 特征提取 3.4.1 特征向量和特征空間 3.4.2 特征提取的流程 3.4.3 常見的語音特征表示 3.4.4 特征選擇 3.5 分類器 3.5.1 監督學習算法 3.5.2 統計分類器 3.5.3 深度神經網絡模型 3.6 語言模型 3.6.1 N-gram語言模型 3.6.2 實踐案例:計算“梅吃餅干”出現的概率 3.6.3 N-gram模型中平滑的重要性 3.7 識別效果的評價 3.7.1 錯詞率 3.7.2 句錯率 第4章 語音信號處理 4.1 導言 4.2 語音的產生 4.2.1 語音學在研究什么 4.2.2 人的發聲機制 4.2.3 語音產生的數字模型 4.2.4 發音的基本單位 4.2.5 識別連續發音的難點 4.3 語音的傳播 4.3.1 語音的物理傳播原理 4.3.2 語音傳播的聲學機制 4.3.3 無損聲道模型 4.4 語音的感知 4.4.1 人耳可感知的頻率范圍 4.4.2 人耳的聽覺特性 4.4.3 聽覺模型 4.5 數字語音信號處理 4.5.1 語音信號處理的一般流程 4.5.2 數據采樣 4.5.3 參數化分析 4.5.4 圖形化表示 4.5.5 數字化特征分析 第5章 實踐前的準備:安裝必要的Python包 5.1 一些必要的交代 5.2 基礎的語音識別包:speechRecognition 5.2.1 SpeechRecognition的主要接口 5.2.2 SpeechRecognition的安裝與導入 5.2.3 應用案例:調用不同接口識別英文和中文語音 5.3 語音分析庫:Librosa 5.3.1 Librosa的主要接口 5.3.2 Librosa的安裝與導入 5.3.3 應用案例:繪制語音信號的波形圖和Me1時頻譜圖 5.4 精于數組運算的庫:NumPy 5.4.1 Numpy的安裝與導入 5.4.2 Numpy數組的生成 5.4.3 訪問Numpy數組中的元素 5.4.4 Numpy數組的算術運算 5.5 科學計算的工具包:Scipy 5.5.1 Scipy的核心功能模塊 5.5.2 Scipy的安裝與導入 5.5.3 應用案例:*小二乘法擬合直線 5.6 機器學習算法的工具包:scikit-1earn 5.6.1 Sk1earn的主要接口 5.6.2 Sk1earn的安裝與導入 5.6.3 應用案例:鳶尾花的分類問題 5.7 工業級深度學習框架:Keras 5.7.1 Keras的主要接口 5.7.2 Keras的安裝與導入 5.7.3 應用案例:利用Keras搭建神經網絡實現手寫數字識別 5.8 科學研究深度學習框架:PyT0rch 5.8.1 PyTorch的主要庫和模塊 5.8.2 PyTorch的安裝 5.8.3 應用案例:利用PyT0rch搭建神經網絡實現手寫體識別 第6章 數據預處理 6.1 語音信號分析基礎 6.2 語音信號的參數化分析 6.2.1 時域分析 6.2.2 頻譜分析 6.2.3 倒譜分析 6.2.4 三種語音信號分析方法的比較 6.3 去噪算法 6.3.1 什么是去噪 6.3.2 譜減法 6.3.3 維納濾波算法 6.3.4 LMS自適應濾波器算法 6.3.5 基于機器學習的去噪算法 6.4 端點檢測算法 6.4.1 什么是端點檢測 6.4.2 基于短時平均能量和過零率的自適應雙門限算法 6.4.3 基于相關函數的端點檢測算法 6.4.4 基于倒譜距離的端點檢測算法 6.4.5 基于頻譜方差的端點檢測算法 第7章 特征提取算法 7.1 特征提取算法概述 7.1.1 特征提取算法的設計要求 7.1.2 特征提取算法的兩大陣營 7.2 基于時域變換的特征 7.2.1 短時振幅包絡 7.2.2 短時平均能量 7.2.3 過零率 7.2.4 示例:基于時域信號的特征提取 7.3 基于傅里葉變換的頻域特征 7.3.1 頻率中心 7.3.2 共振峰 7.4 基于倒譜變換的特征 7.4.1 線性預測倒譜系數 7.4.2 梅爾倒譜系數 7.4.3 示例:通過Librosa計算MFCC特征及衍生特征 7.5 基于神經網絡的特征圖 7.5.1 基于神經網絡的特征學習算法 7.5.2 示例:利用Resnet-50網絡結構生成特征圖 第8章 基于機器學習的分類算法 8.1 傳統機器學習分類算法簡介 8.2 基于有監督學習的分類算法 8.2.1 K鄰近算法 8.2.2 示例:KNN算法實現二分類 8.3 基于無監督學習的分類模型 8.3.1 Kmeans算法 8.3.2 示例:利用Kmeans算法對砂糖橘特征做聚類 8.3.3 高斯混合模型 8.3.4 示例:利用GMM實現二維特征的聚類 8.4 基于序列數據分類的隱馬爾可夫模型 8.4.1 HMM模型 8.4.2 示例:HMM在序列數據分類中的應用 8.5 適用于線性分類和非線性分類的算法 8.5.1 SVM算法 8.5.2 示例:基于SM0算法實現SVM分類器 第9章 基于深度學習的分類模型 9.1 深度學習技術簡介 9.2 卷積神經網絡模型 9.2.1 CNN的基本結構 9.2.2 示例:CNN實現數字手寫體圖片的分類 9.3 循環神經網絡 9.3.1 RNN的基本結構 9.3.2 示例:TextRNN對句子下一個詞語的預測 9.4 長短時記憶網絡 9.4.1 LSTM的基本原理 9.4.2 示例:LSTM預測余弦函數的趨勢 9.5 預訓練模型 9.5.1 預訓練的由來與意義 9.5.2 預訓練模型的三大核心技術 9.5.3 用于語音識別的WavML預訓練模型 第10章 搭建基于GMM-HMM模型的語音識別系統 10.1 動手前的分析 10.1.1 任務分析 10.1.2 流程設計 10.2 數據收集 10.2.1 數據集初探 10.2.2 數據集的處理 10.3 預處理:數據的頻域表示 10.4 特征提取:頻率峰值的計算 10.5 分類模型:GMM-HMM 10.6 結果分析與算法評價 10.6.1 測試效果的統計 10.6.2 分類結果的分析 第11章 搭建基于LSTM模型的語音分類系統 11.1 初期分析 11.1.1 目標和實現思想 11.1.2 基本處理流程 11.2 安裝必要的Python庫 11.3 讀取音頻文件和標簽 11.4 提取MFCC特征 11.5 構建雙向LSTM模型 11.6 模型的訓練 后記
展開全部

語音識別:模式、算法設計與實踐 作者簡介

董雪燕,北京聯合大學講師,澳大利亞昆士蘭科技大學計算機科學博士,主要研究領域為語音識別,以第一作者身份發表數十篇SCI,EI英文文章,國內核心期刊文章2篇;回國后參加設計和編寫多個自然語言處理(偏重于語音識別模塊)的實踐項目。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 无压烧结银_有压烧结银_导电银胶_导电油墨_导电胶-善仁(浙江)新材料 | 清管器,管道清管器,聚氨酯发泡球,清管球 - 承德嘉拓设备 | 定硫仪,量热仪,工业分析仪,马弗炉,煤炭化验设备厂家,煤质化验仪器,焦炭化验设备鹤壁大德煤质工业分析仪,氟氯测定仪 | 不锈钢监控杆_监控立杆厂家-廊坊耀星光电科技有限公司 | 煤矿支护网片_矿用勾花菱形网_缝管式_管缝式锚杆-邯郸市永年区志涛工矿配件有限公司 | 污水处理设备,一体化泵站,一体化净水设备-「梦之洁环保设备厂家」 | 上海电子秤厂家,电子秤厂家价格,上海吊秤厂家,吊秤供应价格-上海佳宜电子科技有限公司 | 最新范文网_实用的精品范文美文网| 道康宁消泡剂-瓦克-大川进口消泡剂供应商 | ET3000双钳形接地电阻测试仪_ZSR10A直流_SXJS-IV智能_SX-9000全自动油介质损耗测试仪-上海康登 | 浙江工业冷却塔-菱电冷却塔厂家 - 浙江菱电冷却设备有限公司 | 信阳网站建设专家-信阳时代网联-【信阳网站建设百度推广优质服务提供商】信阳网站建设|信阳网络公司|信阳网络营销推广 | 企业彩铃制作_移动、联通、电信集团彩铃上传开通_彩铃定制_商务彩铃管理平台-集团彩铃网 | 电解抛光加工_不锈钢电解抛光_常州安谱金属制品有限公司 | 120kv/2mA直流高压发生器-60kv/2mA-30kva/50kv工频耐压试验装置-旭明电工 | Honsberg流量计-Greisinger真空表-气压计-上海欧臻机电设备有限公司 | 银川美容培训-美睫美甲培训-彩妆纹绣培训-新娘化妆-学化妆-宁夏倍莱妮职业技能培训学校有限公司 临时厕所租赁_玻璃钢厕所租赁_蹲式|坐式厕所出租-北京慧海通 | 海尔生物医疗四川代理商,海尔低温冰箱四川销售-成都壹科医疗器械有限公司 | 3d打印服务,3d打印汽车,三维扫描,硅胶复模,手板,快速模具,深圳市精速三维打印科技有限公司 | 驾驶式洗地机/扫地机_全自动洗地机_工业洗地机_荣事达工厂官网 | 高尔夫球杆_高尔夫果岭_高尔夫用品-深圳市新高品体育用品有限公司 | 重庆监控_电子围栏设备安装公司_门禁停车场管理系统-劲浪科技公司 | 破碎机锤头_合金耐磨锤头_郑州宇耐机械工程技术有限公司 | 济南网站策划设计_自适应网站制作_H5企业网站搭建_济南外贸网站制作公司_锐尚 | 我车网|我关心的汽车资讯_汽车图片_汽车生活! | SMN-1/SMN-A ABB抽屉开关柜触头夹紧力检测仪-SMN-B/SMN-C-上海徐吉 | 数年网路-免费在线工具您的在线工具箱-shuyear.com | 紫外线老化试验箱_uv紫外线老化试验箱价格|型号|厂家-正航仪器设备 | 婚博会2024时间表_婚博会门票领取_婚博会地址-婚博会官网 | 发电机价格|发电机组价格|柴油发电机价格|柴油发电机组价格网 | 博客-悦享汽车品质生活| 防水套管_柔性防水套管_刚性防水套管-巩义市润达管道设备制造有限公司 | 写方案网_方案策划方案模板下载| 河南生物显微镜,全自动冰冻切片机-河南荣程联合科技有限公司 | 聚合氯化铝价格_聚合氯化铝厂家_pac絮凝剂-唐达净水官网 | 杭州厂房降温,车间降温设备,车间通风降温,厂房降温方案,杭州嘉友实业爽风品牌 | 无机纤维喷涂棉-喷涂棉施工工程-山东华泉建筑工程有限公司▲ | 上海洗地机-洗地机厂家-全自动洗地机-手推式洗地机-上海滢皓洗地机 | 风淋室生产厂家报价_传递窗|送风口|臭氧机|FFU-山东盛之源净化设备 | 深圳网站建设-高端企业网站开发-定制网页设计制作公司 | 安徽免检低氮锅炉_合肥燃油锅炉_安徽蒸汽发生器_合肥燃气锅炉-合肥扬诺锅炉有限公司 |