中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊

包郵 數(shù)據(jù)挖掘與分析概念與算法

出版社:人民郵電出版社出版時間:2017-09-01
開本: 32開 頁數(shù): 505
中 圖 價:¥64.2(5.0折) 定價  ¥129.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數(shù)據(jù)挖掘與分析概念與算法 版權(quán)信息

數(shù)據(jù)挖掘與分析概念與算法 本書特色

本書是專注于數(shù)據(jù)挖掘與分析的基本算法的入門圖書,內(nèi)容分為數(shù)據(jù)分析基礎(chǔ)、頻繁模式挖掘、聚類和分類四個部分,每一部分的各個章節(jié)兼顧基礎(chǔ)知識和前沿話題,例如核方法、高維數(shù)據(jù)分析、復(fù)雜圖和網(wǎng)絡(luò)等。每一章*后均附有參考書目和習(xí)題。

數(shù)據(jù)挖掘與分析概念與算法 內(nèi)容簡介

● 數(shù)據(jù)挖據(jù)與分析的入門書,針對初學(xué)者闡述所有關(guān)鍵概念,包括探索性數(shù)據(jù)分析、頻繁模式挖掘、聚類和分類。 ● 兼顧前沿話題,例如核方法、高維數(shù)據(jù)分析、復(fù)雜圖和網(wǎng)絡(luò)等。 ● 提供算法對應(yīng)的開源實現(xiàn)方法。 ● 每章均有豐富示例和練習(xí),幫助讀者理解和鞏固相關(guān)主題。 ● 配備豐富教輔資源,包括課程幻燈片、教學(xué)視頻、數(shù)據(jù)集等,可從以下網(wǎng)址獲取:http://www.dataminingbook.info/pmwiki.php/Main/BookResources。

數(shù)據(jù)挖掘與分析概念與算法 目錄

第1章 數(shù)據(jù)挖掘與分析 1

1.1 數(shù)據(jù)矩陣 1

1.2 屬性 2

1.3 數(shù)據(jù)的幾何和代數(shù)描述 3

1.3.1 距離和角度 5

1.3.2 均值與總方差 8

1.3.3 正交投影 9

1.3.4 線性無關(guān)與維數(shù) 10

1.4 數(shù)據(jù):概率觀點 12

1.4.1 二元隨機變量 17

1.4.2 多元隨機變量 20

1.4.3 隨機抽樣和統(tǒng)計量 21

1.5 數(shù)據(jù)挖掘 22

1.5.1 探索性數(shù)據(jù)分析 23

1.5.2 頻繁模式挖掘 24

1.5.3 聚類 24

1.5.4 分類 25

1.6 補充閱讀 26

1.7 習(xí)題 26

**部分 數(shù)據(jù)分析基礎(chǔ)

第2章 數(shù)值屬性 28

2.1 一元變量分析 28

2.1.1 數(shù)據(jù)居中度度量 29

2.1.2 數(shù)據(jù)離散度度量 32

2.2 二元變量分析 35

2.2.1 位置和離散度的度量 36

2.2.2 相關(guān)性度量 37

2.3 多元變量分析 40

2.4 數(shù)據(jù)規(guī)范化 44

2.5 正態(tài)分布 46

2.5.1 一元正態(tài)分布 46

2.5.2 多元正態(tài)分布 47

2.6 補充閱讀 50

2.7 習(xí)題 51

第3章 類別型屬性 53

3.1 一元分析 53

3.1.1 伯努利變量(Bernoulli variable) 53

3.1.2 多元伯努利變量 55

3.2 二元分析 61

3.3 多元分析 69

3.4 距離和角度 74

3.5 離散化 75

3.6 補充閱讀 77

3.7 習(xí)題 78

第4章 圖數(shù)據(jù) 79

4.1 圖的概念 79

4.2 拓撲屬性 83

4.3 中心度分析 86

4.3.1 基本中心度 86

4.3.2 Web中心度 88

4.4 圖的模型 96

4.4.1 Erd s-Rényi隨機圖模型 98

4.4.2 Watts-Strogatz小世界圖模型 101

4.4.3 Barabási-Albert無標度模型 104

4.5 補充閱讀 111

4.6 習(xí)題 112

第5章 核方法 114

5.1 核矩陣 117

5.1.1 再生核映射 118

5.1.2 Mercer核映射 120

5.2 向量核 122

5.3 特征空間中的基本核操作 126

5.4 復(fù)雜對象的核 132

5.4.1 字符串的譜核 132

5.4.2 圖節(jié)點的擴散核 133

5.5 補充閱讀 137

5.6 習(xí)題 137

第6章 高維數(shù)據(jù) 139

6.1 高維對象 139

6.2 高維體積 141

6.3 超立方體的內(nèi)接超球面 143

6.4 薄超球面殼的體積 144

6.5 超空間的對角線 145

6.6 多元正態(tài)的密度 146

6.7 附錄:球面體積的推導(dǎo) 149

6.8 補充閱讀 153

6.9 習(xí)題 153

第7章 降維 156

7.1 背景知識 156

7.2 主成分分析 160

7.2.1 *優(yōu)線近似 160

7.2.2 *優(yōu)二維近似 163

7.2.3 *優(yōu)r維近似 167

7.2.4 主成分分析的幾何意義 170

7.3 核主成分分析 172

7.4 奇異值分解 178

7.4.1 奇異值分解的幾何意義 179

7.4.2 奇異值分解和主成分分析之間的聯(lián)系 180

7.5 補充閱讀 182

7.6 習(xí)題 182

第二部分 頻繁模式挖掘

第8章 項集挖掘 186

8.1 頻繁項集和關(guān)聯(lián)規(guī)則 186

8.2 頻繁項集挖掘算法 189

8.2.1 逐層的方法:Apriori算法 191

8.2.2 事務(wù)標識符集的交集方法:Eclat算法 193

8.2.3 頻繁模式樹方法:FPGrowth算法 197

8.3 生成關(guān)聯(lián)規(guī)則 201

8.4 補充閱讀 203

8.5 習(xí)題 203

第9章 項集概述 208

9.1 *大頻繁項集和閉頻繁項集 208

9.2 挖掘*大頻繁項集:GenMax算法 211

9.3 挖掘閉頻繁項集:Charm算法 213

9.4 非可導(dǎo)項集 215

9.5 補充閱讀 220

9.6 習(xí)題 221

第10章 序列挖掘 223

10.1 頻繁序列 223

10.2 挖掘頻繁序列 224

10.2.1 逐層挖掘:GSP 225

10.2.2 垂直序列挖掘:Spade 226

10.2.3 基于投影的序列挖掘:PrefixSpan 228

10.3 基于后綴樹的子串挖掘 230

10.3.1 后綴樹 230

10.3.2 Ukkonen線性時間算法 233

10.4 補充閱讀 238

10.5 習(xí)題 239

第11章 圖模式挖掘 242

11.1 同形和支撐 242

11.2 候選生成 245

11.3 gSpan算法 249

11.3.1 擴展和支撐計算 250

11.3.2 權(quán)威性測試 255

11.4 補充閱讀 256

11.5 習(xí)題 257

第12章 模式與規(guī)則評估 260

12.1 規(guī)則和模式評估的度量 260

12.1.1 規(guī)則評估度量 260

12.1.2 模式評估度量 268

12.1.3 比較多條規(guī)則和模式 270

12.2 顯著性檢驗和置信區(qū)間 273

12.2.1 產(chǎn)生式規(guī)則的費希爾精確檢驗 273

12.2.2 顯著性的置換檢驗 277

12.2.3 置信區(qū)間內(nèi)的自助抽樣 282

12.3 補充閱讀 284

12.4 習(xí)題 285

第三部分 聚類

第13章 基于代表的聚類 288

13.1 K-means 算法 288

13.2 核K-means 292

13.3 期望*大聚類 295

13.3.1 一維中的EM 297

13.3.2 d維中的EM 300

13.3.3 極大似然估計 305

13.3.4 EM方法 309

13.4 補充閱讀 311

13.5 習(xí)題 312

第14章 層次式聚類 315

14.1 預(yù)備知識 315

14.2 聚合型層次式聚類 317

14.2.1 簇間距離 317

14.2.2 更新距離矩陣 321

14.2.3 計算復(fù)雜度 322

14.3 補充閱讀 322

14.4 習(xí)題 323

第15章 基于密度的聚類 325

15.1 DBSCAN 算法 325

15.2 核密度估計 328

15.2.1 一元密度估計 328

15.2.2 多元密度估計 331

15.2.3 *近鄰密度估計 333

15.3 基于密度的聚類:DENCLUE 333

15.4 補充閱讀 338

15.5 習(xí)題 339

第16章 譜聚類和圖聚類 341

16.1 圖和矩陣 341

16.2 基于圖的割的聚類 347

16.2.1 聚類目標函數(shù):比例割與歸—割 349

16.2.2 譜聚類算法 351

16.2.3 *大化目標:平均割與模塊度 354

16.3 馬爾可夫聚類 360

16.4 補充閱讀 366

16.5 習(xí)題 367

第17章 聚類的驗證 368

17.1 外部驗證度量 368

17.1.1 基于匹配的度量 369

17.1.2 基于熵的度量 372

17.1.3 成對度量 375

17.1.4 關(guān)聯(lián)度量 378

17.2 內(nèi)部度量 381

17.3 相對度量 388

17.3.1 分簇穩(wěn)定性 394

17.3.2 聚類趨向性 396

17.4 補充閱讀 400

17.5 習(xí)題 401

第四部分 分類

第18章 基于概率的分類 404

18.1 貝葉斯分類器 404

18.1.1 估計先驗概率 404

18.1.2 估計似然 405

18.2 樸素貝葉斯分類器 409

18.3 K*近鄰分類器 412

18.4 補充閱讀 414

18.5 習(xí)題 415

第19章 決策樹分類器 416

19.1 決策樹 417

19.2 決策樹算法 419

19.2.1 分割點評估度量 420

19.2.2 評估分割點 422

19.3 補充閱讀 429

19.4 習(xí)題 429

第20章 線性判別分析 431

20.1 *優(yōu)線性判別 431

20.2 核判別分析 437

20.3 補充閱讀 443

20.4 習(xí)題 443

第21章 支持向量機 445

21.1 支持向量和間隔 445

21.2 SVM:線性可分的情況 450

21.3 軟間隔SVM:線性不可分的情況 454

21.3.1 鉸鏈誤損 455

21.3.2 二次誤損 458

21.4 核SVM:非線性情況 459

21.5 SVM訓(xùn)練算法 462

21.5.1 對偶解法:隨機梯度上升 463

21.5.2 原始問題解:牛頓優(yōu)化 467

21.6 補充閱讀 473

21.7 習(xí)題 473

第22章 分類的評估 475

22.1 分類性能度量 475

22.1.1 基于列聯(lián)表的度量 476

22.1.2 二值分類:正類和負類 479

22.1.3 ROC分析 482

22.2 分類器評估 487

22.2.1 K折交叉驗證 487

22.2.2 自助抽樣 488

22.2.3 置信區(qū)間 489

22.2.4 分類器比較:配對t檢驗 493

22.3 偏置-方差分解 495

22.4 補充閱讀 503

22.5 習(xí)題 504

展開全部

數(shù)據(jù)挖掘與分析概念與算法 作者簡介

【作者簡介】 Mohammed J. Zaki 倫斯勒理工學(xué)院計算機科學(xué)系教授,ACM杰出科學(xué)家,IEEE會士,目前致力于研究新數(shù)據(jù)挖掘技術(shù)。曾獲得谷歌教職研究獎等諸多獎項。 Wagner Meira Jr. 巴西米納斯聯(lián)邦大學(xué)計算機科學(xué)系教授,數(shù)據(jù)庫專家。 【譯者簡介】 吳誠堃 博士,2014年畢業(yè)于英國曼徹斯特大學(xué),博士論文題為《應(yīng)用大規(guī)模文本挖掘?qū)崿F(xiàn)疾病分子機理重構(gòu)》。現(xiàn)擔任國防科技大學(xué)計算機學(xué)院助理研究員,從事高性能計算應(yīng)用研究。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 美国HASKEL增压泵-伊莱科elettrotec流量开关-上海方未机械设备有限公司 | 玉米加工设备,玉米深加工机械,玉米糁加工设备.玉米脱皮制糁机 华豫万通粮机 | 酶联免疫分析仪-多管旋涡混合仪|混合器-莱普特科学仪器(北京)有限公司 | 布袋除尘器-单机除尘器-脉冲除尘器-泊头市兴天环保设备有限公司 布袋除尘器|除尘器设备|除尘布袋|除尘设备_诺和环保设备 | 广州市哲铭油墨涂料有限公司,水性漆生产研发基地 | 「银杏树」银杏树行情价格_银杏树种植_山东程锦园林 | 氨水-液氨-工业氨水-氨水生产厂家-辽宁顺程化工 | PTFE接头|聚四氟乙烯螺丝|阀门|薄膜|消解罐|聚四氟乙烯球-嘉兴市方圆氟塑制品有限公司 | 权威废金属|废塑料|废纸|废铜|废钢价格|再生资源回收行情报价中心-中废网 | 合同书格式和范文_合同书样本模板_电子版合同,找范文吧 | 陕西华春网络科技股份有限公司 | 众能联合-提供高空车_升降机_吊车_挖机等一站工程设备租赁 | 煤粉取样器-射油器-便携式等速飞灰取样器-连灵动 | 解放卡车|出口|济南重汽|报价大全|山东三维商贸有限公司 | 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 北京征地律师,征地拆迁律师,专业拆迁律师,北京拆迁律师,征地纠纷律师,征地诉讼律师,征地拆迁补偿,拆迁律师 - 北京凯诺律师事务所 | 保定市泰宏机械制造厂-河北铸件厂-铸造厂-铸件加工-河北大件加工 | 重庆私家花园设计-别墅花园-庭院-景观设计-重庆彩木园林建设有限公司 | 铝扣板-铝方通-铝格栅-铝条扣板-铝单板幕墙-佳得利吊顶天花厂家 elisa试剂盒价格-酶联免疫试剂盒-猪elisa试剂盒-上海恒远生物科技有限公司 | 常州减速机_减速机厂家_常州市减速机厂有限公司 | 螺钉式热电偶_便携式温度传感器_压簧式热电偶|无锡联泰仪表有限公司|首页 | 石家庄律师_石家庄刑事辩护律师_石家庄取保候审-河北万垚律师事务所 | 柔性输送线|柔性链板|齿形链-上海赫勒输送设备有限公司首页[输送机] | 设定时间记录电子秤-自动累计储存电子秤-昆山巨天仪器设备有限公司 | 动环监控_机房环境监控_DCIM_机房漏水检测-斯特纽 | 美国PARKER齿轮泵,美国PARKER柱塞泵,美国PARKER叶片泵,美国PARKER电磁阀,美国PARKER比例阀-上海维特锐实业发展有限公司二部 | 蓝米云-专注于高性价比香港/美国VPS云服务器及海外公益型免费虚拟主机 | 耐磨焊丝,堆焊焊丝,耐磨药芯焊丝,碳化钨焊丝-北京耐默公司 | 贵州成人高考网_贵州成考网| 蜗轮丝杆升降机-螺旋升降机-丝杠升降机厂家-润驰传动 | 拉伸膜,PE缠绕膜,打包带,封箱胶带,包装膜厂家-东莞宏展包装 | 上海租车公司_上海包车_奔驰租赁_上海商务租车_上海谐焕租车 | 低噪声电流前置放大器-SR570电流前置放大器-深圳市嘉士达精密仪器有限公司 | 大型果蔬切片机-水果冬瓜削皮机-洗菜机切菜机-肇庆市凤翔餐饮设备有限公司 | 沈阳激光机-沈阳喷码机-沈阳光纤激光打标机-沈阳co2激光打标机 | 施工电梯_齿条货梯_烟囱电梯_物料提升机-河南大诚机械制造有限公司 | 河北中仪伟创试验仪器有限公司是专业生产沥青,土工,水泥,混凝土等试验仪器的厂家,咨询电话:13373070969 | TPE_TPE热塑性弹性体_TPE原料价格_TPE材料厂家-惠州市中塑王塑胶制品公司- 中塑王塑胶制品有限公司 | 撕碎机,撕破机,双轴破碎机-大件垃圾破碎机厂家 | 杭州可当科技有限公司—流量卡_随身WiFi_AI摄像头一站式解决方案 | 山东活动策划|济南活动公司|济南公关活动策划-济南锐嘉广告有限公司 |