-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
自然語言處理技術與應用 版權信息
- ISBN:9787115612632
- 條形碼:9787115612632 ; 978-7-115-61263-2
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
自然語言處理技術與應用 本書特色
1.本書旨在實現人與計算機之間用自然語言進行有效通信,彌補人類交流與計算機理解之間的差距。
2.本書基于Python編程語言,以實戰為導向,介紹了中文自然語言處理的各種理論、方法及應用案例。
3.本書采用任務驅動的編寫方式,讀者可以直接進行實驗效果體驗,并進行自由調整。
4.本書提供豐富的教學資源,包括電子課件、習題解答、實驗設計、指導書等。
5.本書提供實踐所需的虛擬機以及其他配套工具軟件。
6.逐步建設在線教學網站,教學資源上傳網上,提供線上與線下同步學習。
自然語言處理技術與應用 內容簡介
本書基于Python編程語言,以實戰為導向,主要介紹中文自然語言處理的各種理論、方法及應用案例,幫助讀者快速熟悉理論知識,理解相關技術原理,為讀者選擇自然語言處理相關的研究方向或從業領域提供參考。全書共分為三個部分:**部分(第1~3章)是“基礎篇”,側重介紹自然語言處理的基礎知識,并在相應的知識板塊中設置實驗案例;第二部分(第4~12章)是“技術篇”,主要講解自然語言處理核心技術的原理及實現方法,以及文本分類、特征提取、RNN等技術在自然語言處理中的應用;第三部分(第13章)是“應用篇”,主要介紹自然語言處理比較典型的應用場景。 本書適合作為人工智能相關課程的教材,也可作為人工智能的普及讀物供廣大讀者自學或參考。
自然語言處理技術與應用 目錄
1.1 什么是自然語言處理2
1.1.1 自然語言處理的概念2
1.1.2 自然語言處理的研究任務3
1.2 自然語言處理的發展歷程5
1.3 自然語言處理相關知識的構成7
1.3.1 基礎術語7
1.3.2 知識結構8
1.4 探討自然語言處理的層面9
1.5 自然語言處理與人工智能10
1.5.1 智慧醫療11
1.5.2 智慧司法.11
1.5.3 智慧金融11
1.6 本章小結12
第 2章 使用Python進行自然語言基礎處理13
2.1 正則表達式在自然語言處理中的基本應用14
2.1.1 匹配字符串14
2.1.2 使用轉義符17
2.1.3 抽取文本中的數字18
2.2 NumPy使用詳解 13.219
2.2.1 創建數組19
2.2.2 獲取NumPy中數組的維度20
2.2.3 獲取本地數據21
2.2.4 正確讀取數據22
2.2.5 數組索引22
2.2.6 數組切片23
2.2.7 數組比較23
2.2.8 替代值24
2.2.9 數據類型轉換25
2.2.10 NumPy的統計計算方法25
2.3 本章小結26
第3章 使用NLTK獲取和構建語料庫27
3.1 語料庫基礎28
3.2 NLTK29
3.2.1 NLTK簡介29
3.2.2 安裝NLTK30
3.2.3 使用NLTK31
3.2.4 在Python NLTK下使用Stanford NLP36
3.3 獲取語料庫40
3.3.1 通過語料庫網站獲取語料庫40
3.3.2 通過編寫程序獲取語料庫41
3.3.3 通過NLTK獲取語料庫42
3.4 綜合案例:走進《紅樓夢》44
3.4.1 數據采集和預處理44
3.4.2 構建本地語料庫45
3.4.3 語料操作45
3.5 本章小結48
第4章 jieba中文分詞49
4.1 中文分詞簡介50
4.2 規則分詞50
4.2.1 正向*大匹配法51
4.2.2 逆向*大匹配法52
4.2.3 雙向*大匹配法54
4.3 統計分詞57
4.3.1 統計語言模型57
4.3.2 HMM58
4.3.3 其他統計分詞算法65
4.4 混合分詞65
4.5 Jieba高頻詞提取66
4.5.1 jieba的3種分詞模式66
4.5.2 實戰之高頻詞提取66
4.6 本章小結69
第5章 jieba詞性標注71
5.1 詞性標注簡介72
5.2 詞性標注規范72
5.3 jieba分詞中的詞性標注74
5.4 本章小結75
第6章 命名實體識別之日期識別和地名識別77
6.1 命名實體識別簡介78
6.2 基于CRF的命名實體識別79
6.3 命名實體識別之日期識別82
6.4 命名實體識別之地名識別86
6.4.1 安裝CRF 86
6.4.2 確定標簽體系87
6.4.3 語料數據處理88
6.4.4 特征模板設計90
6.4.5 模型訓練和測試91
6.4.6 模型使用93
6.5 本章小結94
第7章 提取文本關鍵詞95
7.1 關鍵詞提取算法96
7.2 TF-IDF算法96
7.3 TextRank算法97
7.4 LSA LSI LDA算法99
7.4.1 LSA LSI算法99
7.4.2 LDA算法100
7.5 提取文本關鍵詞101
7.6 本章小結108
第8章 詞向量算法109
8.1 word2vec詞向量算法110
8.1.1 神經網絡語言模型110
8.1.2 C&W模型112
8.1.3 CBOW模型和Skip-gram模型113
8.2 doc2vec str2vec文本向量化算法114
8.3 將網頁文本向量化116
8.3.1 詞向量的訓練116
8.3.2 段落向量的訓練119
8.3.3 利用word2vec詞向量算法和doc2vec文本向量化算法計算網頁相似度120
8.4 本章小結124
第9章 句法分析125
9.1 句法分析概述126
9.1.1 句法分析的基本概念126
9.1.2 句法分析的基本方法126
9.2 句法分析的數據集與評測方法127
9.2.1 句法分析的數據集127
9.2.2 句法分析的評測方法129
9.3 句法分析的常用方法130
9.3.1 基于PCFG的句法分析130
9.3.2 基于*大間隔馬爾可夫網絡的句法分析131
9.3.3 基于CRF的句法分析132
9.3.4 基于移進-歸約的句法分析132
9.4 使用Standford Parser的PCFG進行句法分析134
9.4.1 Stanford Parser134
9.4.2 基于PCFG的中文句法分析實戰135
9.5 本章小結136
第 10章 情感分析137
10.1 情感分析的應用138
10.2 情感分析的基本方法139
10.2.1 詞法分析139
10.2.2 機器學習140
10.2.3 混合分析140
10.3 電影評論情感分析141
10.3.1 模型選擇141
10.3.2 載入數據144
10.3.3 輔助函數146
10.3.4 模型設置147
10.3.5 調參配置148
10.3.6 訓練過程149
10.4 本章小結149
第 11章 機器學習在自然語言處理的應用151
11.1 幾種常用的機器學習方法152
11.1.1 文本分類152
11.1.2 特征提取152
11.1.3 標注153
11.1.4 搜索與排序154
11.1.5 推薦系統155
11.1.6 序列學習156
11.2 無監督學習的文本聚類156
11.3 文本分類實戰-中文垃圾郵件分類158
11.4 文本聚類實戰——用K均值聚類對豆瓣讀書數據聚類164
11.5 本章小結168
第 12章 深度學習在自然語言中的應用169
12.1 RNN簡介170
12.1.1 簡單RNN170
12.1.2 LSTM172
12.1.3 Attention機制174
12.2 Seq2Seq問答機器人175
12.2.1 Seq2Seq模型175
12.2.2 實戰Seq2Seq聊天機器人176
12.3 本章小結184
第 13章 自然語言處理典型的應用場景185
13.1 機器翻譯與寫作186
13.1.1 機器翻譯186
13.1.2 機器寫作195
13.2 智能問答與對話204
13.2.1 智能問答204
13.2.2 智能對話系統204
13.2.3 問答系統的主要組成206
13.2.4 不同類型的問答系統207
13.2.5 前景與挑戰218
13.3 個性化推薦218
13.3.1 推薦系統的概念218
13.3.2 個性化推薦的基本問題219
13.3.3 推薦的可解釋性222
13.3.4 前景與挑戰223
13.4 本章小結226
自然語言處理技術與應用 作者簡介
許桂秋 《大數據導論》《Python編程基礎與應用》《NoSQL數據庫原理與應用》《數據挖掘與機器學習》等9本系列教材,浙江科技出版社,2019年。
- >
苦雨齋序跋文-周作人自編集
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
詩經-先民的歌唱
- >
月亮與六便士
- >
莉莉和章魚
- >
有舍有得是人生
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
李白與唐代文化