中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
數據挖掘(第2版)

包郵 數據挖掘(第2版)

作者:王朝霞
出版社:電子工業出版社出版時間:2023-05-01
開本: 其他 頁數: 308
中 圖 價:¥55.6(6.3折) 定價  ¥88.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據挖掘(第2版) 版權信息

  • ISBN:9787121455025
  • 條形碼:9787121455025 ; 978-7-121-45502-5
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

數據挖掘(第2版) 內容簡介

本書是《數據挖掘》的第2版,系統地介紹了數據挖掘的理論、方法與應用,包括數據特征分析及預處理、經典數據挖掘算法(分類、回歸、聚類、關聯規則和集成學習等)、大數據新常態下催生的數據分析方法(推薦系統、鏈接分析與網頁排序、互聯網信息抽取、日志挖掘與查詢分析等)理論與方法。在此基礎上,除第1章外,每章均有基于Python語言的實例應用。

數據挖掘(第2版) 目錄

第1章 緒論 1
1.1 數據挖掘的基本概念 1
1.1.1 數據挖掘的概念 1
1.1.2 大數據環境下的數據挖掘 2
1.1.3 數據挖掘的特性 3
1.1.4 數據挖掘的任務和功能 3
1.1.5 數據挖掘的對象 4
1.1.6 數據挖掘的過程 5
1.2 數據挖掘的起源及發展 6
1.3 數據挖掘的常用工具 9
1.3.1 商用工具 9
1.3.2 開源工具 10
1.4 數據挖掘的應用 12
習題 15
參考文獻 16
第2章 數據特征分析及預處理 17
2.1 數據類型 17
2.1.1 屬性與度量 17
2.1.2 數據集的類型 18
2.2 數據特征分析 19
2.2.1 描述數據集中趨勢的度量 19
2.2.2 描述數據離散程度的度量 21
2.2.3 數據相關性分析 24
2.3 數據預處理 28
2.3.1 數據清洗 28
2.3.2 數據集成 34
2.3.3 數據規范化 34
2.3.4 數據規約 38
2.3.5 數據離散化 45
2.4 數據的相似性 47
2.4.1 數值屬性的相似性度量 47
2.4.2 標稱屬性的相似性度量 49
2.4.3 組合異種屬性的相似性度量 50
2.4.4 文本的相似性度量 52
2.4.5 離散序列的相似性度量 53
習題 55
參考文獻 56
第3章 分類 57
3.1 分類概述 58
3.1.1 分類的基本概念 58
3.1.2 分類的過程 58
3.1.3 分類器性能的評估方法 59
3.2 決策樹 61
3.2.1 決策樹的基本概念 62
3.2.2 決策樹的用途和特性 62
3.2.3 決策樹的工作原理 63
3.2.4 決策樹的構建步驟 64
3.2.5 決策樹算法原理 65
3.3 貝葉斯分類 76
3.3.1 貝葉斯定理 76
3.3.2 樸素貝葉斯分類 77
3.3.3 貝葉斯分析 80
3.3.4 貝葉斯決策 80
3.3.5 貝葉斯估計 81
3.4 支持向量機 81
3.4.1 支持向量機的主要思想 82
3.4.2 支持向量機的基礎理論 82
3.4.3 支持向量機的原理 87
3.5 實戰:Python支持向量機分類 92
習題 95
參考文獻 95
第4章 回歸 98
4.1 回歸的基本概念 99
4.1.1 回歸分析的定義 99
4.1.2 回歸分析的步驟 99
4.1.3 回歸分析要注意的問題 100
4.2 一元回歸分析 100
4.2.1 一元回歸分析的模型設定 100
4.2.2 回歸參數的*小二乘估計 102
4.2.3 基本假設下OLS估計的統計性質 104
4.2.4 誤差方差估計 105
4.2.5 回歸系數檢驗(t檢驗) 106
4.2.6 擬合優度和模型檢驗(F檢驗) 107
4.3 多元線性回歸分析 108
4.3.1 多元線性回歸模型 108
4.3.2 多元線性回歸模型的假定 110
4.3.3 多元線性回歸模型的參數估計 110
4.3.4 顯著性檢驗 112
4.3.5 回歸變量的選擇與逐步回歸 114
4.4 邏輯回歸分析 116
4.4.1 邏輯回歸模型 116
4.4.2 logit變換 117
4.4.3 估計回歸系數 118
4.4.4 Logistic分布 118
4.4.5 列聯表的Logistic回歸模型 119
4.5 其他回歸分析 120
4.5.1 多項式回歸 120
4.5.2 逐步回歸 120
4.5.3 嶺回歸 120
4.5.4 套索回歸 121
4.5.5 彈性網絡 122
4.6 實戰:獲得*大有效率時的藥物用量 122
習題 127
參考文獻 128
第5章 聚類 129
5.1 聚類基本概念 129
5.2 劃分聚類方法 131
5.2.1 k-平均算法 132
5.2.2 k-中心點算法 134
5.3 層次聚類方法 137
5.3.1 層次聚類方法的分類 137
5.3.2 BIRCH算法 141
5.4 密度聚類方法 144
5.5 實戰:Python聚類分析 147
5.5.1 Python實現k-均值劃分聚類 147
5.5.2 Python實現BIRCH層次聚類 150
5.5.3 Python實現DBSCAN密度聚類 152
習題 153
參考文獻 154
第6章 關聯規則 155
6.1 基本概念 155
6.1.1 啤酒與尿布的經典案例 155
6.1.2 關聯規則的概念 155
6.1.3 頻繁項集的產生 159
6.2 Apriori算法:通過限制候選產生發現頻繁項集 160
6.2.1 Apriori算法的頻繁項集產生 160
6.2.2 Apriori算法描述 162
6.3 FP-growth算法 164
6.3.1 構造FP樹 165
6.3.2 挖掘FP樹 167
6.3.3 FP-growth算法 169
6.4 其他關聯規則算法 170
6.4.1 約束性關聯規則 170
6.4.2 增量式關聯規則 171
6.4.3 多層關聯規則 172
6.5 實戰:購物籃關聯規則挖掘 174
6.5.1 背景與挖掘目標 174
6.5.2 分析方法與過程 174
6.5.3 總結 176
習題 177
參考文獻 177
第7章 集成學習 180
7.1 集成學習的概念 180
7.1.1 集成學習的構建 180
7.1.2 集成學習的優勢 181
7.2 Bagging算法與隨機森林算法 183
7.2.1 Bagging算法基本思想 183
7.2.2 Bagging算法流程 185
7.2.3 隨機森林算法 185
7.3 Boosting算法 187
7.3.1 Boosting算法流程 187
7.3.2 Boosting系列算法 188
7.4 結合策略 189
7.4.1 投票方法 189
7.4.2 疊加方法 190
7.5 多樣性 190
7.5.1 多樣性的概念 190
7.5.2 多樣性的作用 191
7.5.3 多樣性的度量 192
7.5.4 多樣性的構建 195
7.6 實戰案例 196
7.6.1 鳶尾花數據集 197
7.6.2 集成學習算法 198
7.6.3 集成學習在鳶尾花數據集上的應用 200
7.7 本章小結 205
習題 205
參考文獻 205
第8章 推薦系統 206
8.1 推薦系統概述 206
8.1.1 什么是推薦系統 206
8.1.2 推薦系統評測指標 207
8.1.3 推薦系統中的冷啟動 210
8.2 基于內容的推薦 213
8.2.1 物品表示 214
8.2.2 物品相似度 217
8.2.3 用戶對物品的評分 218
8.2.4 基于向量空間模型的推薦 218
8.3 協同過濾推薦 222
8.3.1 協同過濾的基本概念 222
8.3.2 基于用戶的協同過濾 226
8.3.3 基于物品的協同過濾 228
8.3.4 隱語義模型和矩陣因子分解模型 230
8.4 基于標簽的推薦 237
8.4.1 數據標注與關鍵詞提取 238
8.4.2 標簽分類 239
8.4.3 基于標簽的推薦系統原理 240
8.5 實戰:搭建一個電影推薦系統 243
8.5.1 數據準備與導入 243
8.5.2 電影熱度值計算 244
8.5.3 電影相似度計算 244
8.5.4 指定標簽下的電影統計 248
習題 250
參考文獻 250
第9章 互聯網數據挖掘 253
9.1 鏈接分析與網頁排序 253
9.1.1 PageRank 253
9.1.2 PageRank的快速計算 259
9.1.3 面向主題的PageRank 260
9.1.4 時間序列分析 260
9.1.5 排序背后的機理探討 262
9.1.6 重新思考時間序列 263
9.2 互聯網信息抽取 264
9.2.1 互聯網信息深度挖掘概述 264
9.2.2 典型應用模型構建 264
9.2.3 挖掘、存儲與網絡技術分析 265
9.2.4 數據信息采集管理 266
9.2.5 信息抽取方法與知識發現 267
9.2.6 智能決策 269
9.2.7 行業案例研究 270
9.3 日志挖掘與查詢分析 272
9.3.1 互聯網日志分析概述 272
9.3.2 挖掘分析技術方法 274
9.3.3 工具比較 275
9.3.4 海量數據挖掘過程展現與分析 276
9.3.5 行業應用舉例 277
9.4 Python實戰案例 280
9.4.1 PageRank Python實現 280
9.4.2 跨境電商運營潛在市場選擇 282
9.4.3 天池“雙11”日志數據挖掘示例 286
習題 290
參考文獻 290
展開全部

數據挖掘(第2版) 作者簡介

劉鵬:教授,清華大學博士,南京云創大數據科技股份有限公司總裁,中國大數據應用聯盟人工智能專家委員會主任,中國信息協會教育分會人工智能教育專家委員會主任,教育部全國普通高校畢業生就業創業指導委員會委員,第45屆世界技能大賽中國區云計算選拔賽裁判長/專家指導組組長,2019年全國大學生數據建模比賽命題人,工信部云計算研究中心專家。在云計算、大數據、人工智能領域具有多年的研究積累,是我國該領域的知名專家。主持科研項目40多項,發表論文80余篇,出版專業書籍30多種。曾于2002年獲得全球數據處理比賽PennySort的世界冠軍,于2003年奪得全國挑戰杯比賽總冠軍。提出的反垃圾郵件網格,被IEEE Cluster 2003評為杰出網格項目,為解決困擾全球的垃圾郵件問題做出根本貢獻,該技術成為云安全技術的基礎。曾擔任全軍網格技術研究中心主任,獲“全軍十大學習成才標兵”(排名第一)、南京市“十大杰出青年”、“中國大數據創新百人”、江蘇省“333工程”中青年領軍人才、清華大學“學術新秀”等稱號。王朝霞:主要從事大數據分析、后勤信息化、軍事物流技術與裝備研究與教學工作。作為碩士研究生導師,已培養碩士生3名。指導本科畢業設計20余名。主持國家博士后基金1項、軍隊后勤重點科研項目2項、軍隊雙重建設子項目1項,參與軍隊網信建設重大項目1項、參與軍隊后勤重點科研項目4項。發表論文50余篇,其中SCI檢索3篇(兩篇1作,一篇通信作者)、EI檢索6篇(四篇1作)。出版教材3本(主編1本)、譯著1本。授權專利3項、軟件著作權1項。獲教育部科技進步一等獎1項,省部級優秀課題二等獎1項。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 塑钢件_塑钢门窗配件_塑钢配件厂家-文安县启泰金属制品有限公司 深圳南财多媒体有限公司介绍 | 软膜天花_软膜灯箱_首选乐创品牌_一站式天花软膜材料供应商! | 水质监测站_水质在线分析仪_水质自动监测系统_多参数水质在线监测仪_水质传感器-山东万象环境科技有限公司 | 箱式破碎机_移动方箱式破碎机/价格/厂家_【华盛铭重工】 | 水热合成反应釜-防爆高压消解罐-西安常仪仪器设备有限公司 | 餐饮加盟网_特色餐饮连锁加盟店-餐饮加盟官网| 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 东莞螺丝|东莞螺丝厂|东莞不锈钢螺丝|东莞组合螺丝|东莞精密螺丝厂家-东莞利浩五金专业紧固件厂家 | 精密五金加工厂-CNC数控车床加工_冲压件|蜗杆|螺杆加工「新锦泰」 | 深圳市宏康仪器科技有限公司-模拟高空低压试验箱-高温防爆试验箱-温控短路试验箱【官网】 | 干式变压器厂_干式变压器厂家_scb11/scb13/scb10/scb14/scb18干式变压器生产厂家-山东科锐变压器有限公司 | 臭氧老化试验箱,高低温试验箱,恒温恒湿试验箱,防水试验设备-苏州亚诺天下仪器有限公司 | 仪器仪表网 - 永久免费的b2b电子商务平台| 污泥烘干机-低温干化机-工业污泥烘干设备厂家-焦作市真节能环保设备科技有限公司 | 查分易-成绩发送平台官网| 金属波纹补偿器厂家_不锈钢膨胀节价格_非金属伸缩节定制-庆达补偿器 | 浇注料-高铝砖耐火砖-郑州凯瑞得窑炉耐火材料有限公司 | 江苏大隆凯科技有限公司| 深圳法律咨询【24小时在线】深圳律师咨询免费 | 大行程影像测量仪-探针型影像测量仪-增强型影像测量仪|首丰百科 大通天成企业资质代办_承装修试电力设施许可证_增值电信业务经营许可证_无人机运营合格证_广播电视节目制作许可证 | 成都离婚律师|成都结婚律师|成都离婚财产分割律师|成都律师-成都离婚律师网 | 细沙回收机-尾矿干排脱水筛设备-泥石分离机-建筑垃圾分拣机厂家-青州冠诚重工机械有限公司 | 517瓜水果特产网|一个专注特产好物的网站 | 手术室净化厂家-成都做医院净化工程的公司-四川华锐-15年特殊科室建设经验 | 球盟会·(中国)官方网站| 北京百度网站优化|北京网站建设公司-百谷网络科技 | 硅PU球场、篮球场地面施工「水性、环保、弹性」硅PU材料生产厂家-广东中星体育公司 | 钢制暖气片散热器_天津钢制暖气片_卡麦罗散热器厂家 | 烘干设备-热泵烘干机_广东雄贵能源设备有限公司| 南京种植牙医院【官方挂号】_南京治疗种植牙医院那个好_南京看种植牙哪里好_南京茀莱堡口腔医院 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 电液推杆生产厂家|电动推杆|液压推杆-扬州唯升机械有限公司 | 哈尔滨发电机,黑龙江柴油发电机组-北方星光 | 江苏农村商业银行招聘网_2024江苏农商行考试指南_江苏农商行校园招聘 | 2025世界机器人大会_IC China_半导体展_集成电路博览会_智能制造展览网 | 隆众资讯-首页_大宗商品资讯_价格走势_市场行情 | 深圳办公室装修-写字楼装修设计-深圳标榜装饰公司 | 道达尔润滑油-食品级润滑油-道达尔导热油-合成导热油,深圳道达尔代理商合-深圳浩方正大官网 | 泥沙分离_泥沙分离设备_泥砂分离机_洛阳隆中重工机械有限公司 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 压力控制器,差压控制器,温度控制器,防爆压力控制器,防爆温度控制器,防爆差压控制器-常州天利智能控制股份有限公司 | 无线遥控更衣吊篮_IC卡更衣吊篮_电动更衣吊篮配件_煤矿更衣吊篮-力得电子 |