中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊
> >
Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn)

包郵 Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn)

出版社:人民郵電出版社出版時(shí)間:2022-01-01
開本: 16開 頁數(shù): 236
本類榜單:教材銷量榜
中 圖 價(jià):¥38.7(6.5折) 定價(jià)  ¥59.8 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn) 版權(quán)信息

  • ISBN:9787115566881
  • 條形碼:9787115566881 ; 978-7-115-56688-1
  • 裝幀:一般膠版紙
  • 冊數(shù):暫無
  • 重量:暫無
  • 所屬分類:>

Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn) 本書特色

歡迎加入人郵大數(shù)據(jù)教師服務(wù)群:6698198711.內(nèi)容契合“1+X”證書制度試點(diǎn)工作中的大數(shù)據(jù)應(yīng)用開發(fā)(Python)職業(yè)技能高級(jí)證書考核標(biāo)準(zhǔn)2.全書與真實(shí)案例相結(jié)合,方便讀者系統(tǒng)學(xué)習(xí)并動(dòng)手實(shí)踐3.全書緊扣任務(wù)需求展開,不堆積知識(shí)點(diǎn),著重于思路的啟發(fā)與解決方案的實(shí)施

Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn) 內(nèi)容簡介

本書以Python自然語言處理的常用技術(shù)與真實(shí)案例相結(jié)合的方式,深入淺出地介紹Python自然語言處理的重要內(nèi)容。全書共12章,內(nèi)容包括緒論、語料庫、正則表達(dá)式、中文分詞技術(shù)、詞性標(biāo)注與命名實(shí)體識(shí)別、關(guān)鍵詞提取、文本向量化、文本分類與文本聚類、文本情感分析、NLP中的深度學(xué)習(xí)技術(shù)、智能問答系統(tǒng),以及基于TipDM大數(shù)據(jù)挖掘建模平臺(tái)實(shí)現(xiàn)垃圾短信分類。本書包含實(shí)訓(xùn)和課后習(xí)題,幫助讀者通過練習(xí)和操作實(shí)踐,鞏固所學(xué)內(nèi)容。 本書可作為“1+X”證書制度試點(diǎn)工作中“大數(shù)據(jù)應(yīng)用開發(fā)(Python)”職業(yè)技能等級(jí)證書的教學(xué)和培訓(xùn)用書,也可以作為高校數(shù)據(jù)科學(xué)或人工智能相關(guān)專業(yè)的教材,還可作為機(jī)器學(xué)習(xí)愛好者的自學(xué)用書。

Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn) 目錄

第 1章 緒論 1
1.1 自然語言處理概述 1
1.1.1 NLP的發(fā)展歷程 2
1.1.2 NLP研究內(nèi)容 3
1.1.3 NLP的幾個(gè)應(yīng)用場景 4
1.1.4 NLP與人工智能技術(shù) 5
1.1.5 學(xué)習(xí)NLP的難點(diǎn) 6
1.2 NLP基本流程 6
1.2.1 語料獲取 6
1.2.2 語料預(yù)處理 7
1.2.3 文本向量化 7
1.2.4 模型構(gòu)建 7
1.2.5 模型訓(xùn)練 7
1.2.6 模型評(píng)價(jià) 8
1.3 NLP的開發(fā)環(huán)境 8
1.3.1 Anaconda安裝 8
1.3.2 Anaconda應(yīng)用介紹 9
小結(jié) 14
課后習(xí)題 14
第 2章 語料庫 16
2.1 語料庫概述 16
2.1.1 語料庫簡介 16
2.1.2 語料庫的用途 17
2.2 語料庫的種類與構(gòu)建原則 17
2.2.1 語料庫的種類 17
2.2.2 語料庫的構(gòu)建原則 18
2.3 NLTK 19
2.3.1 NLTK簡介 19
2.3.2 安裝步驟 19
2.3.3 NLTK中函數(shù)的使用 21
2.4 語料庫的獲取 23
2.4.1 獲取NLTK語料庫 23
2.4.2 獲取網(wǎng)絡(luò)在線語料庫 30
2.5 任務(wù):語料庫的構(gòu)建與應(yīng)用 32
2.5.1 構(gòu)建作品集語料庫 32
2.5.2 武俠小說語料庫分析 33
小結(jié) 35
實(shí)訓(xùn) 35
實(shí)訓(xùn)1 構(gòu)建語料庫 35
實(shí)訓(xùn)2 《七劍下天山》語料庫分析 36
課后習(xí)題 36
第3章 正則表達(dá)式 38
3.1 正則表達(dá)式的概念 38
3.1.1 正則表達(dá)式函數(shù) 38
3.1.2 正則表達(dá)式的元字符 40
3.2 任務(wù):正則表達(dá)式的應(yīng)用 43
3.2.1 《西游記》字符過濾 43
3.2.2 自動(dòng)提取人名與電話號(hào)碼 44
3.2.3 提取網(wǎng)頁標(biāo)簽信息 45
小結(jié) 46
實(shí)訓(xùn) 46
實(shí)訓(xùn)1 過濾《三國志》中的字符 46
實(shí)訓(xùn)2 提取地名與郵編 46
實(shí)訓(xùn)3 提取網(wǎng)頁標(biāo)簽中的文本 46
課后習(xí)題 47
第4章 中文分詞技術(shù) 48
4.1 中文分詞簡介 48
4.2 基于規(guī)則分詞 48
4.2.1 正向*大匹配法 49
4.2.2 逆向*大匹配法 49
4.2.3 雙向*大匹配法 50
4.3 基于統(tǒng)計(jì)分詞 51
4.3.1 n元語法模型 51
4.3.2 隱馬爾可夫模型相關(guān)概念 55
4.4 中文分詞工具jieba 62
4.4.1 基本步驟 63
4.4.2 分詞模式 63
4.5 任務(wù):中文分詞的應(yīng)用 64
4.5.1 HMM中文分詞 64
4.5.2 提取新聞文本中的高頻詞 68
小結(jié) 69
實(shí)訓(xùn) 70
實(shí)訓(xùn)1 使用HMM進(jìn)行中文分詞 70
實(shí)訓(xùn)2 提取文本中的高頻詞 70
課后習(xí)題 70
第5章 詞性標(biāo)注與命名實(shí)體識(shí)別 72
5.1 詞性標(biāo)注 72
5.1.1 詞性標(biāo)注簡介 72
5.1.2 詞性標(biāo)注規(guī)范 73
5.1.3 jieba詞性標(biāo)注 74
5.2 命名實(shí)體識(shí)別 77
5.2.1 命名實(shí)體識(shí)別簡介 77
5.2.2 CRF模型 78
5.3 任務(wù):中文命名實(shí)體識(shí)別 82
5.3.1 sklearn-crfsuite庫簡介 83
5.3.2 命名實(shí)體識(shí)別流程 83
小結(jié) 90
實(shí)訓(xùn) 中文命名實(shí)體識(shí)別 90
課后習(xí)題 91
第6章 關(guān)鍵詞提取 92
6.1 關(guān)鍵詞提取技術(shù)簡介 92
6.2 關(guān)鍵詞提取算法 93
6.2.1 TF-IDF算法 93
6.2.2 TextRank算法 94
6.2.3 LSA與LDA算法 96
6.3 任務(wù):自動(dòng)提取文本關(guān)鍵詞 103
小結(jié) 109
實(shí)訓(xùn) 109
實(shí)訓(xùn)1 文本預(yù)處理 109
實(shí)訓(xùn)2 使用TF-IDF算法提取關(guān)鍵詞 109
實(shí)訓(xùn)3 使用TextRank算法提取關(guān)鍵詞 110
實(shí)訓(xùn)4 使用LSA算法提取關(guān)鍵詞 110
課后習(xí)題 110
第7章 文本向量化 112
7.1 文本向量化簡介 112
7.2 文本離散表示 113
7.2.1 獨(dú)熱表示 113
7.2.2 BOW模型 113
7.2.3 TF-IDF表示 114
7.3 文本分布式表示 114
7.3.1 Word2Vec模型 114
7.3.2 Doc2Vec模型 118
7.4 任務(wù):文本相似度計(jì)算 120
7.4.1 Word2Vec詞向量的訓(xùn)練 121
7.4.2 Doc2Vec段落向量的訓(xùn)練 122
7.4.3 計(jì)算文本的相似度 124
小結(jié) 128
實(shí)訓(xùn) 128
實(shí)訓(xùn)1 實(shí)現(xiàn)基于Word2Vec模型的新聞?wù)Z料詞向量訓(xùn)練 128
實(shí)訓(xùn)2 實(shí)現(xiàn)基于Doc2Vec模型的新聞?wù)Z料段落向量訓(xùn)練 128
實(shí)訓(xùn)3 使用Word2Vec模型和Doc2Vec模型計(jì)算新聞文本的相似度 129
課后習(xí)題 129
第8章 文本分類與文本聚類 131
8.1 文本挖掘簡介 131
8.2 文本分類常用算法 132
8.3 文本聚類常用算法 133
8.4 文本分類與文本聚類的步驟 135
8.5 任務(wù):垃圾短信分類 136
8.6 任務(wù):新聞文本聚類 141
小結(jié) 144
實(shí)訓(xùn) 144
實(shí)訓(xùn)1 基于樸素貝葉斯的新聞分類 144
實(shí)訓(xùn)2 食品種類安全問題聚類分析 145
課后習(xí)題 145
第9章 文本情感分析 147
9.1 文本情感分析簡介 147
9.1.1 文本情感分析的主要內(nèi)容 147
9.1.2 文本情感分析的常見應(yīng)用 148
9.2 情感分析的常用方法 149
9.2.1 基于情感詞典的方法 149
9.2.2 基于文本分類的方法 150
9.2.3 基于LDA主題模型的方法 151
9.3 任務(wù):基于情感詞典的情感分析 151
9.4 任務(wù):基于文本分類的情感分析 154
9.4.1 基于樸素貝葉斯分類的情感分析 154
9.4.2 基于SnowNLP庫的情感分析 156
9.5 任務(wù):基于LDA主題模型的情感分析 157
9.5.1 數(shù)據(jù)處理 157
9.5.2 模型訓(xùn)練 158
9.5.3 結(jié)果分析 159
小結(jié) 160
實(shí)訓(xùn) 160
實(shí)訓(xùn)1 基于詞典的豆瓣評(píng)論文本情感分析 160
實(shí)訓(xùn)2 基于樸素貝葉斯算法的豆瓣評(píng)論文本情感分析 160
實(shí)訓(xùn)3 基于SnowNLP的豆瓣評(píng)論文本情感分析 161
實(shí)訓(xùn)4 基于LDA主題模型的豆瓣評(píng)論文本情感分析 161
課后習(xí)題 161
第 10章 NLP中的深度學(xué)習(xí)技術(shù) 163
10.1 循環(huán)神經(jīng)網(wǎng)絡(luò)概述 163
10.2 RNN結(jié)構(gòu) 164
10.2.1 多對(duì)一結(jié)構(gòu) 164
10.2.2 等長的多對(duì)多結(jié)構(gòu) 164
10.2.3 非等長結(jié)構(gòu)(Seq2Seq模型) 169
10.3 深度學(xué)習(xí)工具 171
10.3.1 TensorFlow簡介 171
10.3.2 基于TensorFlow的深度學(xué)習(xí)庫Keras 172
10.4 任務(wù):基于LSTM的文本分類與情感分析 172
10.4.1 文本分類 172
10.4.2 情感分析 181
10.5 任務(wù):基于Seq2Seq的機(jī)器翻譯 185
10.5.1 語料預(yù)處理 185
10.5.2 構(gòu)建模型 188
10.5.3 定義優(yōu)化器和損失函數(shù) 191
10.5.4 訓(xùn)練模型 191
10.5.5 翻譯 194
小結(jié) 195
實(shí)訓(xùn) 195
實(shí)訓(xùn)1 實(shí)現(xiàn)基于LSTM模型的新聞分類 195
實(shí)訓(xùn)2 實(shí)現(xiàn)基于LSTM模型的攜程網(wǎng)評(píng)論情感分析 196
實(shí)訓(xùn)3 實(shí)現(xiàn)基于Seq2Seq和GPU的機(jī)器翻譯 196
課后習(xí)題 197
第 11章 智能問答系統(tǒng) 198
11.1 智能問答系統(tǒng)簡介 198
11.2 智能問答系統(tǒng)的主要組成部分 198
11.2.1 問題理解 199
11.2.2 知識(shí)檢索 199
11.2.3 答案生成 200
11.3 任務(wù):基于Seq2Seq模型的聊天機(jī)器人 201
11.3.1 讀取語料庫 201
11.3.2 文本預(yù)處理 202
11.3.3 模型構(gòu)建 206
11.3.4 模型訓(xùn)練 211
11.3.5 模型評(píng)價(jià) 218
小結(jié) 218
實(shí)訓(xùn) 基于Seq2Seq模型的聊天機(jī)器人 218
課后習(xí)題 219
第 12章 基于TipDM大數(shù)據(jù)挖掘建模平臺(tái)實(shí)現(xiàn)垃圾短信分類 220
12.1 平臺(tái)簡介 220
12.1.1 實(shí)訓(xùn)庫 221
12.1.2 數(shù)據(jù)連接 222
12.1.3 實(shí)訓(xùn)數(shù)據(jù) 222
12.1.4 我的實(shí)訓(xùn) 223
12.1.5 系統(tǒng)算法 223
12.1.6 個(gè)人算法 225
12.2 實(shí)現(xiàn)垃圾短信分類 226
12.2.1 數(shù)據(jù)源配置 227
12.2.2 文本預(yù)處理 229
12.2.3 樸素貝葉斯分類模型 234
小結(jié) 235
實(shí)訓(xùn) 實(shí)現(xiàn)基于樸素貝葉斯的新聞分類 235
課后習(xí)題 236
展開全部

Python中文自然語言處理基礎(chǔ)與實(shí)戰(zhàn) 作者簡介

肖剛(1968-),博士,教授。韓山師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院院長、廣東省中小型企業(yè)大數(shù)據(jù)與智能化工程研究中心主任,華南師范大學(xué)、廣州大學(xué)兼職碩士生導(dǎo)師。中國醫(yī)學(xué)裝備協(xié)會(huì)磁共振成像裝備與技術(shù)專業(yè)委員會(huì)委員、廣東省生物醫(yī)學(xué)工程學(xué)會(huì)醫(yī)學(xué)信息工程分會(huì)委員、廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會(huì)、廣東省現(xiàn)場統(tǒng)計(jì)學(xué)會(huì)和廣東省計(jì)算數(shù)學(xué)學(xué)會(huì)理事,“泰迪杯”全國數(shù)據(jù)挖掘挑戰(zhàn)賽專家組成員。主要從事應(yīng)用數(shù)學(xué)、數(shù)據(jù)挖掘和醫(yī)學(xué)影像學(xué)的研究工作以及創(chuàng)新創(chuàng)業(yè)競賽、數(shù)學(xué)建模競賽、數(shù)據(jù)挖掘挑戰(zhàn)賽的教學(xué)與指導(dǎo)工作。主持廣東省自然科學(xué)基金項(xiàng)目2項(xiàng),主持廣東省教育廳項(xiàng)目4項(xiàng)。2016年廣東省科學(xué)技術(shù)進(jìn)步獎(jiǎng)三等獎(jiǎng)、2018年汕頭科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)、2019年廣東省科學(xué)技術(shù)進(jìn)步獎(jiǎng)優(yōu)秀獎(jiǎng)以及2019年廣東省教學(xué)成果(基礎(chǔ)教育)一等獎(jiǎng)主要成員。 張良均。高級(jí)信息系統(tǒng)項(xiàng)目管理師,泰迪杯全國大學(xué)生數(shù)據(jù)挖掘競賽(www.tipdm.org)的發(fā)起人。華南師范大學(xué)、廣東工業(yè)大學(xué)兼職教授,廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會(huì)理事。兼有大型高科技企業(yè)和高校的工作經(jīng)歷,主要從事大數(shù)據(jù)挖掘及其應(yīng)用的策劃、研發(fā)及咨詢培訓(xùn)。全國計(jì)算機(jī)技術(shù)與軟件專業(yè)技術(shù)資格(水平)考試?yán)^續(xù)教育和CDA數(shù)據(jù)分析師培訓(xùn)講師。發(fā)表數(shù)據(jù)挖掘相關(guān)論文數(shù)二十余篇,已取得國家發(fā)明專利12項(xiàng),主編圖書《神經(jīng)網(wǎng)絡(luò)實(shí)用教程》、《數(shù)據(jù)挖掘:實(shí)用案例分析》、《MATLAB數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》等9本圖書,主持并完成科技項(xiàng)目9項(xiàng)。獲得SAS、SPSS數(shù)據(jù)挖掘認(rèn)證及Hadoop開發(fā)工程師證書,具有電力、電信、銀行、制造企業(yè)、電子商務(wù)和電子政務(wù)的項(xiàng)目經(jīng)驗(yàn)和行業(yè)背景。

商品評(píng)論(0條)
暫無評(píng)論……
書友推薦
本類暢銷
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 新疆乌鲁木齐网站建设-乌鲁木齐网站制作设计-新疆远璨网络 | 华禹护栏|锌钢护栏_阳台护栏_护栏厂家-华禹专注阳台护栏、楼梯栏杆、百叶窗、空调架、基坑护栏、道路护栏等锌钢护栏产品的生产销售。 | 全自动真空上料机_粉末真空上料机_气动真空上料机-南京奥威环保科技设备有限公司 | 儋州在线-儋州招聘找工作、找房子、找对象,儋州综合生活信息门户! | 包头市鑫枫装饰有限公司| 法兰螺母 - 不锈钢螺母制造厂家 - 万千紧固件--螺母街 | vr安全体验馆|交通安全|工地安全|禁毒|消防|安全教育体验馆|安全体验教室-贝森德(深圳)科技 | MVR蒸发器厂家-多效蒸发器-工业废水蒸发器厂家-康景辉集团官网 | 翻斗式矿车|固定式矿车|曲轨侧卸式矿车|梭式矿车|矿车配件-山东卓力矿车生产厂家 | 软文推广发布平台_新闻稿件自助发布_媒体邀约-澜媒宝 | 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 天津云仓-天津仓储物流-天津云仓一件代发-顺东云仓 | 合肥注册公司|合肥代办营业执照、2024注册公司流程 | 深圳天际源广告-形象堆头,企业文化墙,喷绘,门头招牌设计制作专家 | 盐城网络公司_盐城网站优化_盐城网站建设_盐城市启晨网络科技有限公司 | 超声波焊接机,振动摩擦焊接机,激光塑料焊接机,超声波焊接模具工装-德召尼克(常州)焊接科技有限公司 | 房在线-免费房产管理系统软件-二手房中介房屋房源管理系统软件 | 贵阳用友软件,贵州财务软件,贵阳ERP软件_贵州优智信息技术有限公司 | 深圳公司注册-工商注册公司-千百顺代理记账公司 | SRRC认证_电磁兼容_EMC测试整改_FCC认证_SDOC认证-深圳市环测威检测技术有限公司 | 板框压滤机-隔膜压滤机配件生产厂家-陕西华星佳洋装备制造有限公司 | 水厂污泥地磅|污泥处理地磅厂家|地磅无人值守称重系统升级改造|地磅自动称重系统维修-河南成辉电子科技有限公司 | 耐酸泵,耐酸泵厂家-淄博华舜耐腐蚀真空泵 | 沥青灌缝机_路面灌缝机_道路灌缝机_沥青灌缝机厂家_济宁萨奥机械有限公司 | 锂电池生产厂家-电动自行车航模无人机锂电池定制-世豹新能源 | 执业药师报名条件,考试时间,考试真题,报名入口—首页 | 办公室家具公司_办公家具品牌厂家_森拉堡办公家具【官网】 | 进口试验机价格-进口生物材料试验机-西安卡夫曼测控技术有限公司 | 净化车间_洁净厂房_净化公司_净化厂房_无尘室工程_洁净工程装修|改造|施工-深圳净化公司 | atcc网站,sigma试剂价格,肿瘤细胞现货,人结肠癌细胞株购买-南京科佰生物 | 郑州水质检测中心_井水检测_河南废气检测_河南中环嘉创检测 | 筛分机|振动筛分机|气流筛分机|筛分机厂家-新乡市大汉振动机械有限公司 | 六维力传感器_三维力传感器_二维力传感器-南京神源生智能科技有限公司 | 数年网路-免费在线工具您的在线工具箱-shuyear.com | 便携式XPDM露点仪-在线式防爆露点仪-增强型烟气分析仪-约克仪器 冰雕-冰雪世界-大型冰雕展制作公司-赛北冰雕官网 | 郑州大巴车出租|中巴车租赁|旅游大巴租车|包车|郑州旅游大巴车租赁有限公司 | 破碎机锤头_合金耐磨锤头_郑州宇耐机械工程技术有限公司 | 防堵吹扫装置-防堵风压测量装置-电动操作显示器-兴洲仪器 | 塑料造粒机「厂家直销」-莱州鑫瑞迪机械有限公司 | 警方提醒:赣州约炮论坛真的安全吗?2025年新手必看的网络交友防坑指南 | bng防爆挠性连接管-定做金属防爆挠性管-依客思防爆科技 |