中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
文本數(shù)據(jù)挖掘/宗成慶等

包郵 文本數(shù)據(jù)挖掘/宗成慶等

出版社:清華大學(xué)出版社出版時間:2019-05-01
開本: 其他 頁數(shù): 308
讀者評分:4分1條評論
本類榜單:教材銷量榜
中 圖 價:¥48.2(6.4折) 定價  ¥75.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

文本數(shù)據(jù)挖掘/宗成慶等 版權(quán)信息

文本數(shù)據(jù)挖掘/宗成慶等 本書特色

本書闡述文本數(shù)據(jù)挖掘的理論模型、實現(xiàn)算法和相關(guān)應(yīng)用,主要內(nèi)容包括:信息抽取和知識庫構(gòu)建、文本聚類、情感文本分析、熱點發(fā)現(xiàn)、生物醫(yī)學(xué)文本挖掘和多文檔自動摘要等。寫作風(fēng)格力求言簡意賅,深入淺出,通過實例說明實現(xiàn)相關(guān)任務(wù)的理論方法和技術(shù)思路,而不過多地涉及實現(xiàn)細節(jié)。本書可作為大學(xué)高年級本科生或研究生從事相關(guān)研究的入門文獻,也可作為從事相關(guān)技術(shù)研發(fā)的開發(fā)人員的參考資料。

文本數(shù)據(jù)挖掘/宗成慶等 內(nèi)容簡介

本書闡述文本數(shù)據(jù)挖掘的理論模型、實現(xiàn)算法和相關(guān)應(yīng)用,主要內(nèi)容包括:信息抽取和知識庫構(gòu)建、文本聚類、情感文本分析、熱點發(fā)現(xiàn)、生物醫(yī)學(xué)文本挖掘和多文檔自動摘要等。寫作風(fēng)格力求言簡意賅,深入淺出,通過實例說明實現(xiàn)相關(guān)任務(wù)的理論方法和技術(shù)思路,而不過多地涉及實現(xiàn)細節(jié)。本書可作為大學(xué)高年級本科生或研究生從事相關(guān)研究的入門文獻,也可作為從事相關(guān)技術(shù)研發(fā)的開發(fā)人員的參考資料。

文本數(shù)據(jù)挖掘/宗成慶等 目錄

第 1章緒論 .1

1.1基本概念 1

1.2文本挖掘任務(wù) .2

1.3文本挖掘面臨的困難 .5

1.4方法概述與本書的內(nèi)容組織 .7

1.5進一步閱讀 .9

第 2章數(shù)據(jù)預(yù)處理和標(biāo)注 . 11

2.1數(shù)據(jù)獲取 11

2.2數(shù)據(jù)預(yù)處理 . 15

2.3數(shù)據(jù)標(biāo)注 17

2.4基本工具 19

2.4.1漢語自動分詞與詞性標(biāo)注 19

2.4.2句法分析 . 20

2.4.3 n元語法模型 . 21

2.5進一步閱讀 . 22

第 3章文本表示 . 23

3.1向量空間模型 . 23

3.1.1向量空間模型的基本概念 23

3.1.2特征項的構(gòu)造與權(quán)重 . 24

3.1.3文本長度規(guī)范化 . 25

3.1.4特征工程 . 26

3.1.5其他文本表示方法 27

3.2詞的分布式表示 29

3.2.1神經(jīng)網(wǎng)絡(luò)語言模型 29

3.2.2 C&W模型 . 32

3.2.3 CBOW與 Skip-gram模型 34

3.2.4噪聲對比估計與負采樣 . 35

3.2.5字詞混合的分布式表示方法 . 37

3.3短語的分布式表示 . 38

3.3.1基于詞袋的分布式表示 . 39

3.3.2基于自動編碼器的分布式表示 . 39

3.4句子的分布式表示 . 42

3.4.1通用的句子表示 . 42

3.4.2任務(wù)相關(guān)的句子表示 . 45

3.5文檔的分布式表示 . 48

3.5.1通用的文檔分布式表示 . 48

3.5.2任務(wù)相關(guān)的文檔分布式表示 . 49

3.6進一步閱讀 . 52

第 4章文本分類 . 53

4.1概述 . 53

4.2傳統(tǒng)文本表示 . 54

4.3特征選擇 55

4.3.1互信息法 . 55

4.3.2信息增益法 58

4.3.3卡方統(tǒng)計量法 . 59

4.3.4其他方法 . 60

4.4傳統(tǒng)分類算法 . 61

4.4.1樸素貝葉斯模型 . 61

4.4.2 Logistic回歸、 Softmax回歸與*大熵模型 . 63

4.4.3支持向量機 65

4.4.4集成學(xué)習(xí) . 67

4.5深度神經(jīng)網(wǎng)絡(luò)方法 . 68

4.5.1多層前饋神經(jīng)網(wǎng)絡(luò) 68

4.5.2卷積神經(jīng)網(wǎng)絡(luò) . 69

4.5.3循環(huán)神經(jīng)網(wǎng)絡(luò) . 71

4.6文本分類性能評估 . 78

4.7進一步閱讀 . 81

第 5章文本聚類 . 83

5.1概述 . 83

5.2文本相似性度量 83

5.2.1樣本間的相似性 . 83

5.2.2簇間的相似性 . 86

目錄 IX
5.2.3樣本與簇之間的相似性 . 87

5.3文本聚類算法 . 87

5.3.1 K-均值聚類 . 87

5.3.2單遍聚類 . 91

5.3.3層次聚類 . 92

5.3.4密度聚類 . 95

5.4性能評估 97

5.4.1外部標(biāo)準(zhǔn) . 97

5.4.2內(nèi)部標(biāo)準(zhǔn) . 99

5.5進一步閱讀 . 99

第 6章主題模型 . 101

6.1概述 . 101

6.2潛在語義分析 . 102

6.2.1奇異值分解 102

6.2.2詞項 -文檔矩陣的奇異值分解 103

6.2.3詞項和文檔的概念表示及相似度計算 . 104

6.3概率潛在語義分析 . 106

6.3.1模型假設(shè) . 106

6.3.2參數(shù)學(xué)習(xí) . 107

6.4潛在狄利克雷分布 . 108

6.4.1模型假設(shè) . 108

6.4.2詞項和主題序列的聯(lián)合概率 . 110

6.4.3模型推斷 . 112

6.4.4新文檔的推斷 . 114

6.4.5 PLSA與 LDA的聯(lián)系與區(qū)別 . 115

6.5進一步閱讀 . 115

第 7章情感分析與觀點挖掘 117

7.1概述 . 117

7.2情感分析任務(wù)類型 . 118

7.2.1按目標(biāo)形式劃分 . 118

7.2.2按分析粒度劃分 . 119

7.3文檔或句子級情感分析方法 . 121

7.3.1基于規(guī)則的無監(jiān)督情感分類 . 122

7.3.2基于傳統(tǒng)機器學(xué)習(xí)的監(jiān)督情感分類 . 123

7.3.3深度神經(jīng)網(wǎng)絡(luò)方法 126

文本數(shù)據(jù)挖掘
7.4詞語級情感分析與情感詞典構(gòu)建 . 131

7.4.1基于語義知識庫的方法 . 131

7.4.2基于語料庫的方法 131

7.4.3情感詞典性能評估 134

7.5屬性級情感分析 134

7.5.1屬性抽取 . 135

7.5.2屬性情感分類 . 138

7.5.3主題與情感的生成式建模 141

7.6情感分析中的特殊問題 143

7.6.1情感極性轉(zhuǎn)移問題 143

7.6.2領(lǐng)域適應(yīng)問題 . 145

7.7進一步閱讀 . 147

第 8章話題檢測與跟蹤 . 149

8.1概述 . 149

8.2術(shù)語與任務(wù) . 151

8.2.1術(shù)語 151

8.2.2任務(wù) 152

8.3報道或話題的表示與相似性計算 . 154

8.4話題檢測 156

8.4.1話題在線檢測 . 157

8.4.2話題回溯檢測 . 158

8.5話題跟蹤 159

8.6評估方法 160

8.7社交媒體話題檢測與跟蹤 . 161

8.7.1社交媒體話題檢測 162

8.7.2社交媒體話題跟蹤 163

8.8突發(fā)話題檢測 . 163

8.8.1突發(fā)狀態(tài)識別 . 164

8.8.2以文檔為中心的方法:先檢測話題后評估突發(fā)性 . 167

8.8.3以特征為中心的方法:先識別突發(fā)特征后生成突發(fā)話題 . 168

8.9進一步閱讀 . 169

第 9章信息抽取 . 171

9.1概述 . 171

9.2命名實體識別 . 173

9.2.1基于規(guī)則的命名實體識別方法 . 174

目錄 XI
9.2.2有監(jiān)督的命名實體識別方法 . 175

9.2.3半監(jiān)督的命名實體識別方法 . 181

9.2.4命名實體識別方法評價 . 183

9.3共指消解 184

9.3.1基于規(guī)則的共指消解方法 185

9.3.2數(shù)據(jù)驅(qū)動的共指消解方法 187

9.3.3共指消解評價 . 190

9.4實體消歧 193

9.4.1基于聚類的實體消歧方法 193

9.4.2基于鏈接的實體消歧 . 197

9.4.3實體消歧任務(wù)的評價方法 203

9.5關(guān)系抽取 204

9.5.1基于離散特征的關(guān)系分類方法 . 206

9.5.2基于分布式特征的關(guān)系分類方法 212

9.5.3基于遠程監(jiān)督的關(guān)系分類方法 . 214

9.5.4關(guān)系分類性能評價 215

9.6事件抽取 215

9.6.1事件描述模板 . 215

9.6.2事件抽取方法 . 217

9.6.3事件抽取評價 . 224

9.7進一步閱讀 . 224

第 10章文本自動摘要 227

10.1概述 . 227

10.2抽取式自動摘要 228

10.2.1句子重要性評估 229

10.2.2基于約束的摘要生成方法 . 237

10.3壓縮式自動摘要方法 238

10.3.1句子壓縮方法 238

10.3.2基于句子壓縮的自動摘要方法 242

10.4生成式自動摘要 244

10.4.1基于信息融合的生成式摘要方法 . 244

10.4.2基于編碼 -解碼的生成式摘要方法 249

10.5基于查詢的自動摘要 251

10.5.1基于語言模型的相關(guān)性計算方法 . 251

10.5.2基于關(guān)鍵詞語重合度的相關(guān)性計算方法 . 252

10.5.3基于圖模型的相關(guān)性計算方法 252

10.6跨語言和多語言自動摘要方法 253

10.6.1跨語言自動摘要 253

10.6.2多語言自動摘要 256

10.7摘要質(zhì)量評估方法和相關(guān)評測 258

10.7.1摘要質(zhì)量評估方法 . 258

10.7.2相關(guān)評測活動 262

10.8進一步閱讀 . 263

參考文獻 . 265

名詞術(shù)語索引 . 285
展開全部

文本數(shù)據(jù)挖掘/宗成慶等 作者簡介

宗成慶,中國科學(xué)院自動化研究所研究員,博士生導(dǎo)師。主要從事自然語言處理、機器翻譯和文本情感分析等相關(guān)研究,主持國家科研項目10余項,發(fā)表論文150余篇,出版專著一部、譯著一部。2013年獲國務(wù)院政府特殊津貼,2014年獲錢偉長中文信息處理科學(xué)技術(shù)獎一等獎(第一獲獎人),現(xiàn)為國際計算語言學(xué)委員會(ICCL)委員,2015年擔(dān)任本領(lǐng)域國際頂級會議ACL-IJCNLP 程序委員會共同主席(PC Co-chair),是多個國際學(xué)術(shù)期刊的編委或副主編(Associate Editor)。

夏睿,南京理工大學(xué)副教授,碩士生導(dǎo)師。主要從事自然語言處理、機器學(xué)習(xí)、情感分析與觀點挖掘等方面的研究工作,在領(lǐng)域頂級期刊和會議上(如IEEE TKDE、IEEE IS、INS、IPM、IJCAI、AAAI、ACL、COLING等)發(fā)表論文20余篇,曾任多個國際頂級會議和研討會(如IJCAI、ACL、SENTIRE、WISDOM、MABSDA)的程序委員會委員和 Session Chair,并擔(dān)任多個國際期刊(如IEEE TKDE、DMKD、IEEE IS、IEEE CIM、ACM TALIP、CogCom、JCST、計算機學(xué)報、自

商品評論(1條)
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 软文发布平台 - 云软媒网络软文直编发布营销推广平台 | 桂林腻子粉_内墙外墙抗裂砂浆腻子粉推荐广西鑫达涂料厂家供应 | 并离网逆变器_高频UPS电源定制_户用储能光伏逆变器厂家-深圳市索克新能源 | 【MBA备考网】-2024年工商管理硕士MBA院校/报考条件/培训/考试科目/提前面试/考试/学费-MBA备考网 | 抓斗式清污机|螺杆式|卷扬式启闭机|底轴驱动钢坝|污水处理闸门-方源水利机械 | 电缆隧道在线监测-智慧配电站房-升压站在线监测-江苏久创电气科技有限公司 | 应急灯_消防应急灯_应急照明灯_应急灯厂家-大成智慧官网 | 油罐车_加油机_加油卷盘_加油机卷盘_罐车人孔盖_各类球阀_海底阀等车用配件厂家-湖北华特专用设备有限公司 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 集装箱展厅-住人集装箱住宿|建筑|房屋|集装箱售楼处-山东锐嘉科技工程有限公司 | 江苏皓越真空设备有限公司 | 金属波纹补偿器厂家_不锈钢膨胀节价格_非金属伸缩节定制-庆达补偿器 | 低粘度纤维素|混凝土灌浆料|有机硅憎水粉|聚羧酸减水剂-南京斯泰宝 | 食品质构分析仪-氧化诱导分析仪-瞬态法导热系数仪|热冰百科 | 上海宿田自动化设备有限公司-双面/平面/单面贴标机 | 西安展台设计搭建_西安活动策划公司_西安会议会场布置_西安展厅设计西安旭阳展览展示 | 贝壳粉涂料-内墙腻子-外墙腻子-山东巨野七彩贝壳漆业中心 | 聚合甘油__盐城市飞龙油脂有限公司 | 圆盘鞋底注塑机_连帮鞋底成型注塑机-温州天钢机械有限公司 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 环境模拟实验室_液体-气体控温机_气体控温箱_无锡双润冷却科技有限公司 | 全自动面膜机_面膜折叠机价格_面膜灌装机定制_高速折棉机厂家-深圳市益豪科技有限公司 | CCE素质教育博览会 | CCE素博会 | 教育展 | 美育展 | 科教展 | 素质教育展 | 水热合成反应釜-防爆高压消解罐-西安常仪仪器设备有限公司 | 卫生纸复卷机|抽纸机|卫生纸加工设备|做卫生纸机器|小型卫生纸加工需要什么设备|卫生纸机器设备多少钱一台|许昌恒源纸品机械有限公司 | 一体式钢筋扫描仪-楼板测厚仪-裂缝检测仪-泰仕特(北京) | 危废处理系统,水泥厂DCS集散控制系统,石灰窑设备自动化控制系统-淄博正展工控设备 | 上海小程序开发-小程序制作-上海小程序定制开发公司-微信商城小程序-上海咏熠 | CTAB,表面活性剂1631溴型(十六烷基三甲基溴化铵)-上海升纬化工原料有限公司 | 酵素生产厂家_酵素OEM_酵素加盟_酵素ODM_酵素原料厂家_厦门益力康 | 冷油器-冷油器换管改造-连云港灵动列管式冷油器生产厂家 | 深圳装修_店面装修设计_餐厅设计_装修全包价格-尚泰装饰设计 | 贴片电感_贴片功率电感_贴片绕线电感_深圳市百斯特电子有限公司 贴片电容代理-三星电容-村田电容-风华电容-国巨电容-深圳市昂洋科技有限公司 | 恒温油槽-恒温水槽-低温恒温槽厂家-宁波科麦仪器有限公司 | 无纺布包装机|径向缠绕包装机|缠绕膜打包机-上海晏陵智能设备有限公司 | 武汉天安盾电子设备有限公司 - 安盾安检,武汉安检门,武汉安检机,武汉金属探测器,武汉测温安检门,武汉X光行李安检机,武汉防爆罐,武汉车底安全检查,武汉液体探测仪,武汉安检防爆设备 | 润滑油加盟_润滑油厂家_润滑油品牌-深圳市沃丹润滑科技有限公司 琉璃瓦-琉璃瓦厂家-安徽盛阳新型建材科技有限公司 | 环氧乙烷灭菌器_压力蒸汽灭菌器_低温等离子过氧化氢灭菌器 _低温蒸汽甲醛灭菌器_清洗工作站_医用干燥柜_灭菌耗材-环氧乙烷灭菌器_脉动真空压力蒸汽灭菌器_低温等离子灭菌设备_河南省三强医疗器械有限责任公司 | 食品无尘净化车间,食品罐装净化车间,净化车间配套风淋室-青岛旭恒洁净技术有限公司 | 首页|专注深圳注册公司,代理记账报税,注册商标代理,工商变更,企业400电话等企业一站式服务-慧用心 | 河南道路标志牌_交通路标牌_交通标志牌厂家-郑州路畅交通 |