中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊

包郵 數(shù)據(jù)挖掘方法與應(yīng)用

作者:徐雪琪
出版社:清華大學(xué)出版社出版時間:2020-08-01
開本: 16 頁數(shù): 280
中 圖 價:¥25.0(5.1折) 定價  ¥49.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數(shù)據(jù)挖掘方法與應(yīng)用 版權(quán)信息

數(shù)據(jù)挖掘方法與應(yīng)用 本書特色

數(shù)據(jù)挖掘出現(xiàn)于20 世紀(jì)80 年代后期,隨著信息化技術(shù)的持續(xù)發(fā)展,它不斷汲取統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫技術(shù)、人工智能、模式識別和數(shù)據(jù)可視化等多學(xué)科領(lǐng)域的知識,無可爭議地成為當(dāng)今利用大數(shù)據(jù)分析獲取知識的核心利器。本教材是浙江省“十三五”優(yōu)勢專業(yè)(經(jīng)濟(jì)統(tǒng)計(jì)學(xué))、浙江省一流學(xué)科(統(tǒng)計(jì)學(xué))、浙江省優(yōu)勢特色學(xué)科(統(tǒng)計(jì)學(xué))的建設(shè)成果之一,具有以下顯著特點(diǎn): (1) 重視數(shù)據(jù)挖掘項(xiàng)目實(shí)現(xiàn)的整個流程,除了包含數(shù)據(jù)挖掘的經(jīng)典理論與方法,還詳細(xì)介紹了數(shù)據(jù)挖掘工具、挖掘的數(shù)據(jù)類型和存儲環(huán)境、大數(shù)據(jù)平臺及數(shù)據(jù)預(yù)處理方法。 (2) 重視數(shù)據(jù)挖掘理論和方法的基本思想,在不失嚴(yán)謹(jǐn)?shù)那疤嵯拢赃^了一些復(fù)雜程度高,但又不影響理解的數(shù)學(xué)推導(dǎo),將各個知識點(diǎn)言簡意賅地闡述透徹。 (3) 重視實(shí)際案例應(yīng)用及實(shí)現(xiàn),每類方法結(jié)合多個案例,以運(yùn)用恰當(dāng)?shù)姆椒ń鉀Q實(shí)際問題為導(dǎo)向,以培養(yǎng)分析問題能力為重點(diǎn),詳細(xì)介紹IBM SPSS Modeler 和R 軟件的實(shí)現(xiàn)過程。

數(shù)據(jù)挖掘方法與應(yīng)用 內(nèi)容簡介

《數(shù)據(jù)挖掘方法與應(yīng)用》以應(yīng)用為導(dǎo)向介紹數(shù)據(jù)挖掘的相關(guān)工具、理論和方法,包括數(shù)據(jù)挖掘概述、數(shù)據(jù)挖掘工具、數(shù)據(jù)與數(shù)據(jù)平臺、數(shù)據(jù)預(yù)處理、關(guān)聯(lián)分析、決策樹、貝葉斯分類和神經(jīng)網(wǎng)絡(luò)。通過循序漸進(jìn)地講解數(shù)據(jù)挖掘可使用的工具、數(shù)據(jù)存儲及分析環(huán)境、原始數(shù)據(jù)可能存在的問題及相應(yīng)的預(yù)處理方法、數(shù)據(jù)挖掘經(jīng)典算法等相關(guān)知識,使讀者對數(shù)據(jù)挖掘有整體的認(rèn)識和了解。此外,《數(shù)據(jù)挖掘方法與應(yīng)用》以解決問題為目的,結(jié)合實(shí)例闡述了使用IBM SPSS Modeler和R軟件進(jìn)行數(shù)據(jù)挖掘的方法與步驟,便于讀者更好地理解和掌握。 《數(shù)據(jù)挖掘方法與應(yīng)用》可作為統(tǒng)計(jì)學(xué)、大數(shù)據(jù)等相關(guān)專業(yè)高年級本科生及碩士研究生數(shù)據(jù)挖掘課程的教材,也可作為其他數(shù)據(jù)挖掘愛好者的參考用書。

數(shù)據(jù)挖掘方法與應(yīng)用 目錄

目 錄


第1章 數(shù)據(jù)挖掘概述 1

1.1 數(shù)據(jù)挖掘的產(chǎn)生與發(fā)展 1

1.1.1 數(shù)據(jù)挖掘概念的提出 2

1.1.2 數(shù)據(jù)挖掘系統(tǒng)的發(fā)展 3

1.1.3 當(dāng)前熱點(diǎn)和未來趨勢 5

1.2 數(shù)據(jù)挖掘過程 10

1.2.1 Fayyad過程模型 10

1.2.2 CRISP-DM過程模型 11

1.3 數(shù)據(jù)挖掘功能與使用技術(shù) 21

1.3.1 數(shù)據(jù)挖掘功能 21

1.3.2 數(shù)據(jù)挖掘使用技術(shù) 22

1.4 數(shù)據(jù)挖掘應(yīng)用 26

1.4.1 金融領(lǐng)域的數(shù)據(jù)挖掘 26

1.4.2 電信領(lǐng)域的數(shù)據(jù)挖掘 26

1.4.3 零售與電子商務(wù)領(lǐng)域的數(shù)據(jù)挖掘 27

1.4.4 政府政務(wù)領(lǐng)域的數(shù)據(jù)挖掘 27

1.4.5 醫(yī)療領(lǐng)域的數(shù)據(jù)挖掘 28

1.4.6 科學(xué)領(lǐng)域的數(shù)據(jù)挖掘 28

1.5 練習(xí)與拓展 28

第2章 數(shù)據(jù)挖掘工具 30

2.1 Weka 30

2.1.1 Weka簡述 30

2.1.2 Weka運(yùn)行界面 31

2.2 IBM SPSS Modeler 34

2.2.1 IBM SPSS Modeler簡述 34

2.2.2 IBM SPSS Modeler主界面及功能 35

2.3 R語言 41

2.3.1 R語言簡述 41

2.3.2 RStudio 42

2.3.3 R語言與數(shù)據(jù)挖掘 42

2.4 Python語言 45

2.4.1 Python語言簡述 45

2.4.2 Python與數(shù)據(jù)分析 46

2.4.3 Anaconda 46

2.5 練習(xí)與拓展 50

第3章 數(shù)據(jù)與數(shù)據(jù)平臺 51

3.1 數(shù)據(jù)類型 51

3.1.1 數(shù)據(jù)形態(tài)與數(shù)據(jù)類型 51

3.1.2 數(shù)據(jù)環(huán)境與數(shù)據(jù)類型 54

3.2 關(guān)系型數(shù)據(jù)庫 55

3.2.1 關(guān)系型數(shù)據(jù)庫概述 55

3.2.2 關(guān)系型數(shù)據(jù)庫管理系統(tǒng) 56

3.3 NoSQL數(shù)據(jù)庫 57

3.3.1 鍵值數(shù)據(jù)庫 57

3.3.2 文檔數(shù)據(jù)庫 58

3.3.3 列族數(shù)據(jù)庫 60

3.3.4 圖數(shù)據(jù)庫 61

3.4 數(shù)據(jù)倉庫與大數(shù)據(jù)平臺 63

3.4.1 數(shù)據(jù)倉庫 63

3.4.2 大數(shù)據(jù)平臺 68

3.5 練習(xí)與拓展 74

第4章 數(shù)據(jù)預(yù)處理 75

4.1 數(shù)據(jù)預(yù)處理概述 75

4.1.1 原始數(shù)據(jù)中存在的問題 75

4.1.2 數(shù)據(jù)預(yù)處理的主要任務(wù) 77

4.2 數(shù)據(jù)清洗 77

4.2.1 缺失數(shù)據(jù)處理 77

4.2.2 異常數(shù)據(jù)處理 78

4.3 數(shù)據(jù)集成 80

4.3.1 模式匹配及數(shù)值一致化 80

4.3.2 刪除冗余數(shù)據(jù) 81

4.4 數(shù)據(jù)變換 82

4.4.1 定性數(shù)據(jù)數(shù)值化 82

4.4.2 定量數(shù)據(jù)離散化和規(guī)范化 83

4.4.3 不平衡數(shù)據(jù)處理 84

4.5 數(shù)據(jù)歸約 85

4.5.1 屬性的歸約 85

4.5.2 記錄的歸約 87

4.5.3 數(shù)值的歸約 88

4.6 練習(xí)與拓展 89

第5章 關(guān)聯(lián)分析 90

5.1 關(guān)聯(lián)分析概述 90

5.1.1 關(guān)聯(lián)分析基本概念 91

5.1.2 關(guān)聯(lián)規(guī)則挖掘的基本過程 93

5.2 Apriori算法 94

5.2.1 Apriori性質(zhì) 94

5.2.2 Apriori算法的頻繁項(xiàng)集產(chǎn)生 95

5.3 強(qiáng)關(guān)聯(lián)規(guī)則的悖論 99

5.3.1 強(qiáng)關(guān)聯(lián)規(guī)則不一定是有趣的規(guī)則 99

5.3.2 基于提升度過濾無趣的強(qiáng)關(guān)聯(lián)規(guī)則 100

5.3.3 基于支持度、置信度及提升度的關(guān)聯(lián)規(guī)則發(fā)現(xiàn) 100

5.4 基于IBM SPSS Modeler的應(yīng)用 103

5.4.1 事實(shí)表數(shù)據(jù)的應(yīng)用示例 103

5.4.2 事務(wù)表數(shù)據(jù)的應(yīng)用示例 113

5.5 基于R語言的應(yīng)用 123

5.5.1 數(shù)據(jù)初探 123

5.5.2 可視化交易數(shù)據(jù) 125

5.5.3 挖掘關(guān)聯(lián)規(guī)則 127

5.5.4 可視化關(guān)聯(lián)規(guī)則 130

5.6 練習(xí)與拓展 134

第6章 決策樹 136

6.1 決策樹概述 136

6.1.1 決策樹分析相關(guān)概念 137

6.1.2 決策樹分析核心問題 138

6.2 ID3算法 138

6.2.1 信息論的基本概念 138

6.2.2 ID3算法基本原理 139

6.2.3 使用ID3算法建立決策樹 141

6.3 C5.0算法 143

6.3.1 C5.0算法的決策樹生長 144

6.3.2 C5.0算法的決策樹修剪 149

6.4 基于IBM SPSS Modeler的應(yīng)用 151

6.4.1 數(shù)據(jù)讀取與審核 152

6.4.2 探索性分析 153

6.4.3 數(shù)據(jù)預(yù)處理 158

6.4.4 決策樹模型構(gòu)建與評估:基于C5.0算法 163

6.4.5 預(yù)測結(jié)果 170

6.5 基于R語言的應(yīng)用 171

6.5.1 數(shù)據(jù)探索 172

6.5.2 數(shù)據(jù)分區(qū) 177

6.5.3 模型訓(xùn)練與評估 178

6.5.4 使用boosting和代價矩陣調(diào)整模型 181

6.6 練習(xí)與拓展 184

第7章 貝葉斯分類 185

7.1 貝葉斯分類概述 185

7.1.1 貝葉斯定理 186

7.1.2 貝葉斯信念網(wǎng)絡(luò) 186

7.2 樸素貝葉斯分類 188

7.2.1 樸素貝葉斯分類原理 188

7.2.2 樸素貝葉斯分類計(jì)算示例 191

7.2.3 零概率問題:拉普拉斯平滑 193

7.3 TAN貝葉斯分類 194

7.3.1 TAN貝葉斯網(wǎng)絡(luò)結(jié)構(gòu) 194

7.3.2 TAN貝葉斯分類過程 195

7.4 基于IBM SPSS Modeler的應(yīng)用 196

7.4.1 數(shù)據(jù)讀取與審核 198

7.4.2 探索性分析 199

7.4.3 數(shù)據(jù)預(yù)處理 208

7.4.4 TAN貝葉斯分類模型構(gòu)建與評估 210

7.5 基于R語言的應(yīng)用 214

7.5.1 數(shù)據(jù)探索 214

7.5.2 文本數(shù)據(jù)預(yù)處理 215

7.5.3 劃分?jǐn)?shù)據(jù)集 219

7.5.4 詞云分析 221

7.5.5 模型訓(xùn)練與評估 223

7.6 練習(xí)與拓展 225

第8章 神經(jīng)網(wǎng)絡(luò) 226

8.1 神經(jīng)網(wǎng)絡(luò)概述 226

8.1.1 生物神經(jīng)元與人工神經(jīng)元 226

8.1.2 激活函數(shù) 227

8.1.3 神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu) 230

8.2 BP神經(jīng)網(wǎng)絡(luò) 232

8.2.1 BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程 232

8.2.2 BP算法描述 237

8.2.3 前饋神經(jīng)網(wǎng)絡(luò)計(jì)算示例 238

8.3 卷積神經(jīng)網(wǎng)絡(luò) 240

8.3.1 卷積層 240

8.3.2 激活層 243

8.3.3 池化層 244

8.3.4 全連接層 244

8.4 基于IBM SPSS Modeler的應(yīng)用 245

8.4.1 數(shù)據(jù)讀取 246

8.4.2 “數(shù)據(jù)審核”節(jié)點(diǎn)預(yù)處理 247

8.4.3 探索性分析 250

8.4.4 分區(qū)與平衡 251

8.4.5 模型構(gòu)建與評價 252

8.5 基于R語言的應(yīng)用 260

8.5.1 數(shù)據(jù)初探 260

8.5.2 數(shù)據(jù)轉(zhuǎn)換與分區(qū) 263

8.5.3 模型構(gòu)建與評價 263

8.6 練習(xí)與拓展 268

參考文獻(xiàn) 270


展開全部
商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 起好名字_取个好名字_好名网免费取好名在线打分 | 汽车润滑油厂家-机油/润滑油代理-高性能机油-领驰慧润滑科技(河北)有限公司 | 南京办公用品网-办公文具用品批发-打印机耗材采购 | 铝合金风口-玻璃钢轴流风机-玻璃钢屋顶风机-德州东润空调设备有限公司 | 挨踢网-大家的导航! | 首页 - 军军小站|张军博客 | 杭州公司变更法人-代理记账收费价格-公司注销代办_杭州福道财务管理咨询有限公司 | 压力变送器-上海武锐自动化设备有限公司 | 氢氧化钙设备, 氢氧化钙生产线-淄博惠琛工贸有限公司 | 冲击式破碎机-冲击式制砂机-移动碎石机厂家_青州市富康机械有限公司 | 阳光1号桔柚_无核沃柑_柑橘新品种枝条苗木批发 - 苧金网 | 济南玻璃安装_济南玻璃门_济南感应门_济南玻璃隔断_济南玻璃门维修_济南镜片安装_济南肯德基门_济南高隔间-济南凯轩鹏宇玻璃有限公司 | 中医治疗皮肤病_潍坊银康医院「山东」重症皮肤病救治平台 | 实验室隔膜泵-无油防腐蚀隔膜泵-耐腐蚀隔膜真空泵-杭州景程仪器 电杆荷载挠度测试仪-电杆荷载位移-管桩测试仪-北京绿野创能机电设备有限公司 | 广东成考网-广东成人高考网| 贝壳粉涂料-内墙腻子-外墙腻子-山东巨野七彩贝壳漆业中心 | 气力输送设备_料封泵_仓泵_散装机_气化板_压力释放阀-河南锐驰机械设备有限公司 | 雷达液位计_超声波风速风向仪_雨量传感器_辐射传感器-山东风途物联网 | 工业插头-工业插头插座【厂家】-温州罗曼电气 | 炒货机-炒菜机-炒酱机-炒米机@霍氏机械 | 影合社-影视人的内容合作平台| 3d可视化建模_三维展示_产品3d互动数字营销_三维动画制作_3D虚拟商城 【商迪3D】三维展示服务商 广东健伦体育发展有限公司-体育工程配套及销售运动器材的体育用品服务商 | 丹佛斯压力传感器,WISE温度传感器,WISE压力开关,丹佛斯温度开关-上海力笙工业设备有限公司 | 浙江筋膜枪-按摩仪厂家-制造商-肩颈按摩仪哪家好-温州市合喜电子科技有限公司 | 玉米深加工设备-玉米深加工机械-新型玉米工机械生产厂家-河南粮院机械制造有限公司 | ptc_浴霸_大巴_干衣机_呼吸机_毛巾架_电动车加热器-上海帕克 | 复合肥,化肥厂,复合肥批发,化肥代理,复合肥品牌-红四方 | 深圳法律咨询【24小时在线】深圳律师咨询免费 | 脱硝喷枪-氨水喷枪-尿素喷枪-河北思凯淋环保科技有限公司 | 智能案卷柜_卷宗柜_钥匙柜_文件流转柜_装备柜_浙江福源智能科技有限公司 | 东亚液氮罐-液氮生物容器-乐山市东亚机电工贸有限公司 | 济南网站建设_济南网站制作_济南网站设计_济南网站建设公司_富库网络旗下模易宝_模板建站 | 别墅图纸超市|别墅设计图纸|农村房屋设计图|农村自建房|别墅设计图纸及效果图大全 | 2025福建平潭岛旅游攻略|蓝眼泪,景点,住宿攻略-趣平潭网 | 专业生物有机肥造粒机,粉状有机肥生产线,槽式翻堆机厂家-郑州华之强重工科技有限公司 | 托盘租赁_塑料托盘租赁_托盘出租_栈板出租_青岛托盘租赁-优胜必达 | 无刷电机_直流无刷电机_行星减速机-佛山市藤尺机电设备有限公司 无菌检查集菌仪,微生物限度仪器-苏州长留仪器百科 | 模型公司_模型制作_沙盘模型报价-中国模型网| 深圳法律咨询【24小时在线】深圳律师咨询免费 | Magnescale探规,Magnescale磁栅尺,Magnescale传感器,Magnescale测厚仪,Mitutoyo光栅尺,笔式位移传感器-苏州连达精密量仪有限公司 | 板式换网器_柱式换网器_自动换网器-郑州海科熔体泵有限公司 |