掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
自然語言處理實戰 算法卷 版權信息
- ISBN:9787113312114
- 條形碼:9787113312114 ; 978-7-113-31211-4
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
自然語言處理實戰 算法卷 內容簡介
本書在開篇章節清晰解釋自然語言與人工智能關系的基礎上,結合當前自然語言處理領域主流和前沿應用,從9個實踐應用場景方面講解了自然語言處理相關算法的實踐,包括文本特征提取、語言生成、語義分析與理解、信息檢索與推薦系統等。對于每種實踐場景的描述會先幫助讀者弄懂原理,再與場景需求進行匹配,*后橫向對比不同算法的特點,旨在向讀者闡明,算法沒有優劣之分,只有是否合適的區別,這便是實踐場景的特點。二維碼下載包中包含全書示例源代碼,幫助讀者通過調整不同參數來體會算法的實現效果。
自然語言處理實戰 算法卷 目錄
第1章 人工智能與自然語言處理基礎
1.1 人工智能
1.1.1 人工智能的發展歷程
1.1.2 人工智能的研究領域
1.2 機器學習和深度學習
1.2.1 機器學習
1.2.2 深度學習
1.2.3 機器學習和深度學習的區別
1.3 什么是自然語言處理
1.4 自然語言處理的挑戰與機遇
1.4.1 挑戰
1.4.2 機遇
第2章 文本預處理算法
2.1 分詞
2.1.1 分詞的重要性和基本原理
2.1.2 基于空格的分詞
2.1.3 基于標點符號的分詞
2.2 詞干化與詞形還原
2.2.1 詞干化與詞形還原的區別
2.2.2 詞干化算法
2.2.3 詞形還原算法
2.3 去除停用詞
2.3.1 什么是停用詞
2.3.2 基于詞匯列表的停用詞去除
2.3.3 基于詞頻的停用詞去除
2.3.4 使用TF-IDF算法去除停用詞
2.3.5 利用機器學習方法去除停用詞
2.4 數據清洗和處理
2.4.1 處理缺失值
2.4.2 異常值檢測與處理
2.4.3 處理重復數據
第3章 特征提取
3.1 特征的類型
3.2 特征選擇
3.2.1 特征選擇的必要性
3.2.2 特征選擇的方法
3.3 特征抽取
3.3.1 特征抽取的概念
3.3.2 主成分分析
3.3.3 獨立成分分析
3.3.4 自動編碼器
3.4 嵌入
3.4.1 嵌入的重要應用場景
3.4.2 PyTorch嵌入層的特征提取
3.4.3 TensorFlow嵌入層的特征提取
3.4.4 Word2Vec模型
3.4.5 GloVe模型
3.5 詞袋模型
3.5.1 詞袋模型的實現步驟與具體示例
3.5.2 詞袋模型的限制與改進
3.6 TF-IDF
3.6.1 TF-IDF關鍵概念與計算方式
3.6.2 使用TF-IDF提取文本特征
第4章 文本分類與情感分析算法
4.1 樸素貝葉斯分類器
4.1.1 樸素貝葉斯分類器的基本原理與應用場景示例
4.1.2 應用場景示例:垃圾郵件過濾
4.2 支持向量機
4.2.1 支持向量機的核心思想和主要原理
4.2.2 線性SVM與非線性SVM
4.3 隨機森林算法
4.3.1 隨機森林算法的主要原理和應用場景
4.3.2 隨機森林算法應用:垃圾郵件分類器
4.4 卷積神經網絡
4.4.1 卷積神經網絡的發展背景
4.4.2 卷積神經網絡的結構
4.4.3 卷積神經網絡實戰案例
4.5 循環神經網絡
4.5.1 循環神經網絡介紹
4.5.2 文本分類
4.5.3 循環神經網絡實戰案例1:使用PyTorch開發歌詞生成器模型
4.5.4 循環神經網絡實戰案例2:使用TensorFlow制作情感分析模型
4.6 遞歸神經網絡
4.6.1 遞歸神經網絡介紹
4.6.2 RvNN
第5章 語言生成算法
5.1 基于規則的生成算法
5.1.1 基于規則的生成算法的優缺點
5.1.2 基于規則的生成算法在自然語言處理中的應用場景
5.2 基于統計的生成算法
5.2.1 基于統計的生成算法介紹
5.2.2 常見基于統計的生成模型
5.2.3 N-gram模型
5.2.4 隱馬爾可夫模型
5.2.5 *大熵模型
5.3 基于神經網絡的生成模型
5.3.1 常見的基于神經網絡的生成模型
5.3.2 神經網絡生成的基本原理
5.3.3 生成對抗網絡
5.4 注意力機制
5.4.1 注意力機制介紹
5.4.2 注意力機制的變體
5.4.3 注意力機制解決什么問題
5.5 序列到序列模型
5.5.1 Seq2Seq模型介紹
5.5.2 Seq2Seq編碼器-解碼器結構
5.5.3 使用Seq2Seq模型實現翻譯系統
第6章 語義分析與理解算法
6.1 詞義表示
6.2 語義相似度計算
6.2.1 語義相似度的重要性
6.2.2 詞匯語義相似度計算方法
6.2.3 文本語義相似度計算方法
6.3 命名實體識別
6.3.1 命名實體識別介紹
6.3.2 基于規則的NER方法
6.3.3 基于機器學習的NER方法
6.4 語義角色標注
6.4.1 語義角色標注介紹
6.4.2 基于深度學習的SRL方法
6.5 依存分析
6.5.1 依存分析介紹
6.5.2 依存分析的基本步驟
6.5.3 依存分析的方法
6.5.4 依存分析在自然語言處理中的應用
6.6 語法樹生成
6.6.1 語法樹介紹
6.6.2 語法樹生成的基本原理
6.6.3 生成語法樹的方法
6.6.4 基于上下文無關文法的語法樹生成
6.7 知識圖譜與圖數據分析
6.7.1 知識圖譜的特點
6.7.2 知識圖譜的構建方法
6.7.3 圖數據分析的基本原理
6.7.4 圖數據分析的應用場景
第7章 機器翻譯算法
7.1 常見的機器翻譯算法
7.2 統計機器翻譯
7.2.1 統計機器翻譯的實現步驟
7.2.2 常見的SMT模型
7.2.3 SMT的訓練和解碼
7.3 神經機器翻譯
7.3.1 NMT模型的一般工作流程
7.3.2 NMT的應用領域
7.3.3 NMT的訓練和解碼
7.3.4 基于NMT的簡易翻譯系統
7.4 跨語言情感分析
7.4.1 跨語言情感分析介紹
7.4.2 跨語言情感分析的挑戰
7.4.3 跨語言情感分析的方法
第8章 NLP應用實戰:智能客服系統
8.1 背景介紹
8.2 系統介紹
8.3 模型介紹與準備
8.3.1 模型介紹
8.3.2 下載模型文件
8.4 Android智能客服系統
8.4.1 準備工作
8.4.2 頁面布局
8.4.3 實現主Activity
8.4.4 智能回復處理
第9章 NLP應用實戰:文本摘要系統
9.1 文本摘要系統介紹
9.2 抽取式文本摘要方法
9.3 抽象生成式文本摘要方法
9.4 文本摘要生成系統
9.4.1 準備數據
9.4.2 數據預處理
9.4.3 數據分析
9.4.4 構建Seq2Seq模型
第10章 NLP應用實戰:消費者投訴處理模型
10.1 需求分析
10.2 具體實現
10.2.1 數據集預處理
10.2.2 目標特征的分布
10.2.3 探索性數據分析
10.2.4 制作模型
展開全部
自然語言處理實戰 算法卷 作者簡介
陳繼生,碩士研究生,前百度飛槳項目發工程師,在大規模機器學習、深度學習、數據搜索、行業垂直應用、研發管理等領域擁有豐富的開發經驗。現在就職于商湯科技,負責SenseAvatar 項目的研發工作。擁有多年開發經驗,在企業智能化轉型、業務線上化經營、擁有豐富的大規模搜索架構、個性化推薦架構、機器學習系統架構經驗和技術團隊管理經驗。
書友推薦
- >
經典常談
- >
唐代進士錄
- >
有舍有得是人生
- >
我從未如此眷戀人間
- >
回憶愛瑪儂
- >
山海經
- >
伊索寓言-世界文學名著典藏-全譯本
- >
小考拉的故事-套裝共3冊
本類暢銷