中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >>
文本數(shù)據(jù)挖掘/宗成慶等

包郵 文本數(shù)據(jù)挖掘/宗成慶等

出版社:清華大學(xué)出版社出版時(shí)間:2019-05-01
開本: 其他 頁數(shù): 308
讀者評(píng)分:4分1條評(píng)論
本類榜單:教材銷量榜
中 圖 價(jià):¥48.2(6.4折) 定價(jià)  ¥75.0 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
開年大促, 全場(chǎng)包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

文本數(shù)據(jù)挖掘/宗成慶等 版權(quán)信息

文本數(shù)據(jù)挖掘/宗成慶等 本書特色

本書闡述文本數(shù)據(jù)挖掘的理論模型、實(shí)現(xiàn)算法和相關(guān)應(yīng)用,主要內(nèi)容包括:信息抽取和知識(shí)庫構(gòu)建、文本聚類、情感文本分析、熱點(diǎn)發(fā)現(xiàn)、生物醫(yī)學(xué)文本挖掘和多文檔自動(dòng)摘要等。寫作風(fēng)格力求言簡(jiǎn)意賅,深入淺出,通過實(shí)例說明實(shí)現(xiàn)相關(guān)任務(wù)的理論方法和技術(shù)思路,而不過多地涉及實(shí)現(xiàn)細(xì)節(jié)。本書可作為大學(xué)高年級(jí)本科生或研究生從事相關(guān)研究的入門文獻(xiàn),也可作為從事相關(guān)技術(shù)研發(fā)的開發(fā)人員的參考資料。

文本數(shù)據(jù)挖掘/宗成慶等 內(nèi)容簡(jiǎn)介

本書闡述文本數(shù)據(jù)挖掘的理論模型、實(shí)現(xiàn)算法和相關(guān)應(yīng)用,主要內(nèi)容包括:信息抽取和知識(shí)庫構(gòu)建、文本聚類、情感文本分析、熱點(diǎn)發(fā)現(xiàn)、生物醫(yī)學(xué)文本挖掘和多文檔自動(dòng)摘要等。寫作風(fēng)格力求言簡(jiǎn)意賅,深入淺出,通過實(shí)例說明實(shí)現(xiàn)相關(guān)任務(wù)的理論方法和技術(shù)思路,而不過多地涉及實(shí)現(xiàn)細(xì)節(jié)。本書可作為大學(xué)高年級(jí)本科生或研究生從事相關(guān)研究的入門文獻(xiàn),也可作為從事相關(guān)技術(shù)研發(fā)的開發(fā)人員的參考資料。

文本數(shù)據(jù)挖掘/宗成慶等 目錄

第 1章緒論 .1

1.1基本概念 1

1.2文本挖掘任務(wù) .2

1.3文本挖掘面臨的困難 .5

1.4方法概述與本書的內(nèi)容組織 .7

1.5進(jìn)一步閱讀 .9

第 2章數(shù)據(jù)預(yù)處理和標(biāo)注 . 11

2.1數(shù)據(jù)獲取 11

2.2數(shù)據(jù)預(yù)處理 . 15

2.3數(shù)據(jù)標(biāo)注 17

2.4基本工具 19

2.4.1漢語自動(dòng)分詞與詞性標(biāo)注 19

2.4.2句法分析 . 20

2.4.3 n元語法模型 . 21

2.5進(jìn)一步閱讀 . 22

第 3章文本表示 . 23

3.1向量空間模型 . 23

3.1.1向量空間模型的基本概念 23

3.1.2特征項(xiàng)的構(gòu)造與權(quán)重 . 24

3.1.3文本長度規(guī)范化 . 25

3.1.4特征工程 . 26

3.1.5其他文本表示方法 27

3.2詞的分布式表示 29

3.2.1神經(jīng)網(wǎng)絡(luò)語言模型 29

3.2.2 C&W模型 . 32

3.2.3 CBOW與 Skip-gram模型 34

3.2.4噪聲對(duì)比估計(jì)與負(fù)采樣 . 35

3.2.5字詞混合的分布式表示方法 . 37

3.3短語的分布式表示 . 38

3.3.1基于詞袋的分布式表示 . 39

3.3.2基于自動(dòng)編碼器的分布式表示 . 39

3.4句子的分布式表示 . 42

3.4.1通用的句子表示 . 42

3.4.2任務(wù)相關(guān)的句子表示 . 45

3.5文檔的分布式表示 . 48

3.5.1通用的文檔分布式表示 . 48

3.5.2任務(wù)相關(guān)的文檔分布式表示 . 49

3.6進(jìn)一步閱讀 . 52

第 4章文本分類 . 53

4.1概述 . 53

4.2傳統(tǒng)文本表示 . 54

4.3特征選擇 55

4.3.1互信息法 . 55

4.3.2信息增益法 58

4.3.3卡方統(tǒng)計(jì)量法 . 59

4.3.4其他方法 . 60

4.4傳統(tǒng)分類算法 . 61

4.4.1樸素貝葉斯模型 . 61

4.4.2 Logistic回歸、 Softmax回歸與*大熵模型 . 63

4.4.3支持向量機(jī) 65

4.4.4集成學(xué)習(xí) . 67

4.5深度神經(jīng)網(wǎng)絡(luò)方法 . 68

4.5.1多層前饋神經(jīng)網(wǎng)絡(luò) 68

4.5.2卷積神經(jīng)網(wǎng)絡(luò) . 69

4.5.3循環(huán)神經(jīng)網(wǎng)絡(luò) . 71

4.6文本分類性能評(píng)估 . 78

4.7進(jìn)一步閱讀 . 81

第 5章文本聚類 . 83

5.1概述 . 83

5.2文本相似性度量 83

5.2.1樣本間的相似性 . 83

5.2.2簇間的相似性 . 86

目錄 IX
5.2.3樣本與簇之間的相似性 . 87

5.3文本聚類算法 . 87

5.3.1 K-均值聚類 . 87

5.3.2單遍聚類 . 91

5.3.3層次聚類 . 92

5.3.4密度聚類 . 95

5.4性能評(píng)估 97

5.4.1外部標(biāo)準(zhǔn) . 97

5.4.2內(nèi)部標(biāo)準(zhǔn) . 99

5.5進(jìn)一步閱讀 . 99

第 6章主題模型 . 101

6.1概述 . 101

6.2潛在語義分析 . 102

6.2.1奇異值分解 102

6.2.2詞項(xiàng) -文檔矩陣的奇異值分解 103

6.2.3詞項(xiàng)和文檔的概念表示及相似度計(jì)算 . 104

6.3概率潛在語義分析 . 106

6.3.1模型假設(shè) . 106

6.3.2參數(shù)學(xué)習(xí) . 107

6.4潛在狄利克雷分布 . 108

6.4.1模型假設(shè) . 108

6.4.2詞項(xiàng)和主題序列的聯(lián)合概率 . 110

6.4.3模型推斷 . 112

6.4.4新文檔的推斷 . 114

6.4.5 PLSA與 LDA的聯(lián)系與區(qū)別 . 115

6.5進(jìn)一步閱讀 . 115

第 7章情感分析與觀點(diǎn)挖掘 117

7.1概述 . 117

7.2情感分析任務(wù)類型 . 118

7.2.1按目標(biāo)形式劃分 . 118

7.2.2按分析粒度劃分 . 119

7.3文檔或句子級(jí)情感分析方法 . 121

7.3.1基于規(guī)則的無監(jiān)督情感分類 . 122

7.3.2基于傳統(tǒng)機(jī)器學(xué)習(xí)的監(jiān)督情感分類 . 123

7.3.3深度神經(jīng)網(wǎng)絡(luò)方法 126

文本數(shù)據(jù)挖掘
7.4詞語級(jí)情感分析與情感詞典構(gòu)建 . 131

7.4.1基于語義知識(shí)庫的方法 . 131

7.4.2基于語料庫的方法 131

7.4.3情感詞典性能評(píng)估 134

7.5屬性級(jí)情感分析 134

7.5.1屬性抽取 . 135

7.5.2屬性情感分類 . 138

7.5.3主題與情感的生成式建模 141

7.6情感分析中的特殊問題 143

7.6.1情感極性轉(zhuǎn)移問題 143

7.6.2領(lǐng)域適應(yīng)問題 . 145

7.7進(jìn)一步閱讀 . 147

第 8章話題檢測(cè)與跟蹤 . 149

8.1概述 . 149

8.2術(shù)語與任務(wù) . 151

8.2.1術(shù)語 151

8.2.2任務(wù) 152

8.3報(bào)道或話題的表示與相似性計(jì)算 . 154

8.4話題檢測(cè) 156

8.4.1話題在線檢測(cè) . 157

8.4.2話題回溯檢測(cè) . 158

8.5話題跟蹤 159

8.6評(píng)估方法 160

8.7社交媒體話題檢測(cè)與跟蹤 . 161

8.7.1社交媒體話題檢測(cè) 162

8.7.2社交媒體話題跟蹤 163

8.8突發(fā)話題檢測(cè) . 163

8.8.1突發(fā)狀態(tài)識(shí)別 . 164

8.8.2以文檔為中心的方法:先檢測(cè)話題后評(píng)估突發(fā)性 . 167

8.8.3以特征為中心的方法:先識(shí)別突發(fā)特征后生成突發(fā)話題 . 168

8.9進(jìn)一步閱讀 . 169

第 9章信息抽取 . 171

9.1概述 . 171

9.2命名實(shí)體識(shí)別 . 173

9.2.1基于規(guī)則的命名實(shí)體識(shí)別方法 . 174

目錄 XI
9.2.2有監(jiān)督的命名實(shí)體識(shí)別方法 . 175

9.2.3半監(jiān)督的命名實(shí)體識(shí)別方法 . 181

9.2.4命名實(shí)體識(shí)別方法評(píng)價(jià) . 183

9.3共指消解 184

9.3.1基于規(guī)則的共指消解方法 185

9.3.2數(shù)據(jù)驅(qū)動(dòng)的共指消解方法 187

9.3.3共指消解評(píng)價(jià) . 190

9.4實(shí)體消歧 193

9.4.1基于聚類的實(shí)體消歧方法 193

9.4.2基于鏈接的實(shí)體消歧 . 197

9.4.3實(shí)體消歧任務(wù)的評(píng)價(jià)方法 203

9.5關(guān)系抽取 204

9.5.1基于離散特征的關(guān)系分類方法 . 206

9.5.2基于分布式特征的關(guān)系分類方法 212

9.5.3基于遠(yuǎn)程監(jiān)督的關(guān)系分類方法 . 214

9.5.4關(guān)系分類性能評(píng)價(jià) 215

9.6事件抽取 215

9.6.1事件描述模板 . 215

9.6.2事件抽取方法 . 217

9.6.3事件抽取評(píng)價(jià) . 224

9.7進(jìn)一步閱讀 . 224

第 10章文本自動(dòng)摘要 227

10.1概述 . 227

10.2抽取式自動(dòng)摘要 228

10.2.1句子重要性評(píng)估 229

10.2.2基于約束的摘要生成方法 . 237

10.3壓縮式自動(dòng)摘要方法 238

10.3.1句子壓縮方法 238

10.3.2基于句子壓縮的自動(dòng)摘要方法 242

10.4生成式自動(dòng)摘要 244

10.4.1基于信息融合的生成式摘要方法 . 244

10.4.2基于編碼 -解碼的生成式摘要方法 249

10.5基于查詢的自動(dòng)摘要 251

10.5.1基于語言模型的相關(guān)性計(jì)算方法 . 251

10.5.2基于關(guān)鍵詞語重合度的相關(guān)性計(jì)算方法 . 252

10.5.3基于圖模型的相關(guān)性計(jì)算方法 252

10.6跨語言和多語言自動(dòng)摘要方法 253

10.6.1跨語言自動(dòng)摘要 253

10.6.2多語言自動(dòng)摘要 256

10.7摘要質(zhì)量評(píng)估方法和相關(guān)評(píng)測(cè) 258

10.7.1摘要質(zhì)量評(píng)估方法 . 258

10.7.2相關(guān)評(píng)測(cè)活動(dòng) 262

10.8進(jìn)一步閱讀 . 263

參考文獻(xiàn) . 265

名詞術(shù)語索引 . 285
展開全部

文本數(shù)據(jù)挖掘/宗成慶等 作者簡(jiǎn)介

宗成慶,中國科學(xué)院自動(dòng)化研究所研究員,博士生導(dǎo)師。主要從事自然語言處理、機(jī)器翻譯和文本情感分析等相關(guān)研究,主持國家科研項(xiàng)目10余項(xiàng),發(fā)表論文150余篇,出版專著一部、譯著一部。2013年獲國務(wù)院政府特殊津貼,2014年獲錢偉長中文信息處理科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)(第一獲獎(jiǎng)人),現(xiàn)為國際計(jì)算語言學(xué)委員會(huì)(ICCL)委員,2015年擔(dān)任本領(lǐng)域國際頂級(jí)會(huì)議ACL-IJCNLP 程序委員會(huì)共同主席(PC Co-chair),是多個(gè)國際學(xué)術(shù)期刊的編委或副主編(Associate Editor)。

夏睿,南京理工大學(xué)副教授,碩士生導(dǎo)師。主要從事自然語言處理、機(jī)器學(xué)習(xí)、情感分析與觀點(diǎn)挖掘等方面的研究工作,在領(lǐng)域頂級(jí)期刊和會(huì)議上(如IEEE TKDE、IEEE IS、INS、IPM、IJCAI、AAAI、ACL、COLING等)發(fā)表論文20余篇,曾任多個(gè)國際頂級(jí)會(huì)議和研討會(huì)(如IJCAI、ACL、SENTIRE、WISDOM、MABSDA)的程序委員會(huì)委員和 Session Chair,并擔(dān)任多個(gè)國際期刊(如IEEE TKDE、DMKD、IEEE IS、IEEE CIM、ACM TALIP、CogCom、JCST、計(jì)算機(jī)學(xué)報(bào)、自

商品評(píng)論(1條)
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 深圳装修_店面装修设计_餐厅设计_装修全包价格-尚泰装饰设计 | 在线钠离子分析仪-硅酸根离子浓度测定仪-油液水分测定仪价格-北京时代新维测控设备有限公司 | 带锯机|木工带锯机圆木推台锯|跑车带锯机|河北茂业机械制造有限公司| | 天津货架厂_穿梭车货架_重型仓储货架_阁楼货架定制-天津钢力仓储货架生产厂家_天津钢力智能仓储装备 | 迪威娱乐|迪威娱乐客服|18183620002 | 智能气瓶柜(大型气瓶储存柜)百科 | 昆明网络公司|云南网络公司|昆明网站建设公司|昆明网页设计|云南网站制作|新媒体运营公司|APP开发|小程序研发|尽在昆明奥远科技有限公司 | 上海赞永| 杭州双螺杆挤出机-百科| 皮带式输送机械|链板式输送机|不锈钢输送机|网带输送机械设备——青岛鸿儒机械有限公司 | 别墅图纸超市|别墅设计图纸|农村房屋设计图|农村自建房|别墅设计图纸及效果图大全 | 搪玻璃冷凝器_厂家-越宏化工设备| 武汉天安盾电子设备有限公司 - 安盾安检,武汉安检门,武汉安检机,武汉金属探测器,武汉测温安检门,武汉X光行李安检机,武汉防爆罐,武汉车底安全检查,武汉液体探测仪,武汉安检防爆设备 | 网带通过式抛丸机,,网带式打砂机,吊钩式,抛丸机,中山抛丸机生产厂家,江门抛丸机,佛山吊钩式,东莞抛丸机,中山市泰达自动化设备有限公司 | 气动机械手-搬运机械手-气动助力机械手-山东精瑞自动化设备有限公司 | 破碎机锤头_合金耐磨锤头_郑州宇耐机械工程技术有限公司 | 空气能采暖,热泵烘干机,空气源热水机组|设备|厂家,东莞高温热泵_正旭新能源 | 尊享蟹太太美味,大闸蟹礼卡|礼券|礼盒在线预订-蟹太太官网 | 综合管廊模具_生态,阶梯护坡模具_检查井模具制造-致宏模具厂家 | SDG吸附剂,SDG酸气吸附剂,干式酸性气体吸收剂生产厂家,超过20年生产使用经验。 - 富莱尔环保设备公司(原名天津市武清县环保设备厂) | 水冷式工业冷水机组_风冷式工业冷水机_水冷螺杆冷冻机组-深圳市普威机械设备有限公司 | 硫化罐-胶管硫化罐-山东鑫泰鑫智能装备有限公司 | 天津拓展_天津团建_天津趣味运动会_天津活动策划公司-天津华天拓展培训中心 | 济南轻型钢结构/济南铁艺护栏/济南铁艺大门-济南燕翔铁艺制品有限公司 | 浙江建筑资质代办_二级房建_市政_电力_安许_劳务资质办理公司 | 玉米深加工机械,玉米加工设备,玉米加工机械等玉米深加工设备制造商-河南成立粮油机械有限公司 | 异噻唑啉酮-均三嗪-三丹油-1227-中北杀菌剂厂家 | 万家财经_财经新闻_在线财经资讯网 | 步入式高低温测试箱|海向仪器| 螺旋丝杆升降机-SWL蜗轮-滚珠丝杆升降机厂家-山东明泰传动机械有限公司 | 护栏打桩机-打桩机厂家-恒新重工 | Safety light curtain|Belt Sway Switches|Pull Rope Switch|ultrasonic flaw detector-Shandong Zhuoxin Machinery Co., Ltd | 气动隔膜泵厂家-温州永嘉定远泵阀有限公司 | 防水套管厂家_刚性防水套管_柔性防水套管_不锈钢防水套管-郑州中泰管道 | 硫化罐_蒸汽硫化罐_大型硫化罐-山东鑫泰鑫智能装备有限公司 | NM-02立式吸污机_ZHCS-02软轴刷_二合一吸刷软轴刷-厦门地坤科技有限公司 | 混合气体腐蚀试验箱_盐雾/硫化氢/气体腐蚀试验箱厂家-北京中科博达 | 考勤系统_考勤管理系统_网络考勤软件_政企|集团|工厂复杂考勤工时统计排班管理系统_天时考勤 | 电梯乘运质量测试仪_电梯安全评估测试仪-武汉懿之刻 | 聚合甘油__盐城市飞龙油脂有限公司| 小小作文网_中小学优秀作文范文大全 |