中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 數據挖掘

出版社:清華大學出版社出版時間:2023-10-01
開本: 其他 頁數: 236
本類榜單:教材銷量榜
中 圖 價:¥34.4(7.7折) 定價  ¥44.5 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據挖掘 版權信息

數據挖掘 本書特色

本書內容新穎,可操作性強,圖文并茂,簡明易懂,可以作為普通高等學校、高職高專院校數據科學與大數據專業、軟件工程專業等計算機相關專業和信息管理類專業大數據開發技術課程的教材,也可以作為大數據技術培訓班教材,并適合大數據技術研發人員和廣大計算機愛好者自學使用

數據挖掘 內容簡介

近年來,數據挖掘(Data Mining)引起了產業界的極大關注,主要原因是生產制造等環節中存在海 量有潛在價值的數據,而各行各業都迫切需要將這些數據轉換成有用的信息和知識。這些信息和知識可 以廣泛用于各種領域,包括商務管理、生產控制、市場分析、工程設計等,幫助企業創造更高的利潤和 占據新的制高點。 本書內容新穎,可操作性強,圖文并茂,簡明易懂,可作為高等學校數據科學與大數據、軟件工程 等計算機相關專業和信息管理類專業“大數據開發技術”課程的教材,也可作為大數據技術培訓班的教 材,還適合大數據技術研發人員和廣大計算機愛好者自學使用。

數據挖掘 目錄


第1章 緒論 1
1.1 數據挖掘概述 1
1.2 數據挖掘的定義 1
1.2.1 數據挖掘的一般步驟 2
1.2.2 數據挖掘任務 2
1.3 數據挖掘的主要問題 3
1.3.1 數據挖掘算法的有效性和可擴展性 3
1.3.2 處理噪聲和不完全數據 3
1.3.3 高維度數據 3
1.3.4 關系數據庫和復雜數據類型的處理 4
1.3.5 異種數據庫和全球信息系統挖掘信息 4
1.4 數據挖掘的應用 4
1.4.1 推薦系統 4
1.4.2 互聯網風險控制 5
1.5 小結 5
1.6 參考文獻 5
第2章 數據及數據集基本分析 6
2.1 數據對象與屬性 6
2.1.1 屬性的定義 7
2.1.2 定性屬性 7
2.1.3 定量屬性 8
2.2 數據與元數據 9
2.2.1 傳統的元數據 9
2.2.2 元數據的類型 10
2.2.3 元數據的模式 10
2.3 結構化、非結構化和半結構化數據 11
2.3.1 結構化數據 11
2.3.2 非結構化數據 12
2.3.3 半結構化數據 13
2.4 數據集基本分析技術 14
2.4.1 頻率和眾數 15
2.4.2 百分位數 15
2.4.3 均值和中位數 16
2.4.4 極差和方差 16
2.4.5 多元數據統計 17
2.5 結構化數據集基本分析技術 17
2.5.1 鳶尾花數據集介紹 17
2.5.2 描述統計 18
2.6 文本數據集基本分析技術 19
2.6.1 20newsgroups數據集介紹 19
2.6.2 文本可視化 22
2.7 數據可視化技術 23
2.7.1 可視化數據變量之間的相關性 24
2.7.2 可視化數據變量值的分布情況 26
2.8 數據對象相似性與距離計算 30
2.8.1 數據對象的相似性定義 30
2.8.2 數據對象相似性的度量方法 30
2.9 大數據概述 31
2.9.1 大數據的興起 31
2.9.2 大數據的特點 32
2.10 小結 32
2.11 練習題 32
2.12 參考文獻 33
第3章 數據預處理 34
3.1 數據預處理概述 34
3.2 數據清洗 35
3.2.1 缺失值處理 35
3.2.2 異常點檢測 36
3.2.3 異常點處理 37
3.2.4 重復數據處理 37
3.2.5 噪聲處理 38
3.3 數據降維 39
3.3.1 數據降維概述 39
3.3.2 主成分分析降維 39
3.3.3 多維縮放降維 41
3.3.4 等度量映射降維 43
3.3.5 局部線性嵌入降維 45
3.3.6 降維效果比較 47
3.4 結構化數據預處理技術 50
3.4.1 數據清洗 50
3.4.2 分組與聚合 53
3.4.3 合并 54
3.4.4 案例------房價預測競賽 55
3.5 文本數據預處理技術 58
3.5.1 文本數據預處理技術概述 58
3.5.2 文本數據獲取 58
3.5.3 分詞 59
3.5.4 數據清洗 59
3.5.5 詞干提取 62
3.5.6 詞形還原 63
3.5.7 案例------新聞數據預處理 63
3.6 隱私保護與數據脫敏 67
3.6.1 隱私保護與數據脫敏概述 67
3.6.2 隱私保護與數據脫敏定義 67
3.6.3 敏感信息識別 67
3.6.4 敏感信息去除 69
3.7 小結 70
3.8 練習題 71
3.9 參考文獻 71
第4章 分類基本算法 72
4.1 分類概述 72
4.1.1 分類任務簡介 72
4.1.2 二分類及多分類 73
4.1.3 不均衡問題 73
4.2 k近鄰算法 74
4.2.1 算法 74
4.2.2 距離度量 74
4.2.3 k值的選擇 75
4.2.4 分類決策規則 75
4.2.5 參數說明 75
4.3 決策樹 76
4.3.1 決策樹簡介 76
4.3.2 決策樹算法 77
4.3.3 信息增益 77
4.3.4 增益率 77
4.4 支持向量機 79
4.4.1 線性可分支持向量機 80
4.4.2 線性支持向量機 82
4.4.3 非線性支持向量機 82
4.4.4 參數說明 83
4.5 隨機森林 84
4.5.1 隨機森林簡介 84
4.5.2 隨機森林算法 85
4.5.3 參數說明 85
4.6 AdaBoost 86
4.6.1 AdaBoost簡介 86
4.6.2 AdaBoost算法 86
4.6.3 參數說明 88
4.7 樸素貝葉斯 88
4.7.1 樸素貝葉斯基本方法 88
4.7.2 樸素貝葉斯算法 89
4.7.3 參數說明 90
4.8 特征權重函數 91
4.8.1 無監督特征權重函數 91
4.8.2 有監督特征權重函數 92
4.9 結構化數據分類案例 93
4.9.1 鳶尾花數據集 93
4.9.2 評估方式 94
4.9.3 KNN實例 94
4.9.4 SVM實例 94
4.9.5 決策樹實例 95
4.9.6 隨機森林實例 95
4.9.7 AdaBoost實例 96
4.9.8 樸素貝葉斯分類器實例 96
4.10 文本分類實例 96
4.10.1 文本表示 96
4.10.2 分類模型的訓練 99
4.11 小結 108
4.12 練習題 108
4.13 參考文獻 108
第5章 基于深度學習的分類算法 110
5.1 深度學習概述 110
5.1.1 深度學習的發展歷程 110
5.1.2 深度學習的概念 111
5.1.3 深度學習的應用 111
5.1.4 深度學習的未來 112
5.2 卷積神經網絡 113
5.2.1 卷積神經網絡簡介 113
5.2.2 卷積運算 114
5.2.3 非線性激活函數 115
5.2.4 *大池化運算 115
5.3 循環神經網絡 116
5.3.1 循環神經網絡簡介 116
5.3.2 循環神經網絡的結構類型 119
5.4 長短期記憶網絡 121
5.5 圖像分類案例 123
5.5.1 數據集下載與預處理 123
5.5.2 模型架構搭建 126
5.5.3 模型的訓練與驗證 128
5.5.4 使用數據增強策略 129
5.5.5 隨機失活策略 130
5.5.6 使用預訓練模型提升結果 131
5.6 結構化數據分類案例 134
5.6.1 數據分析和可視化 134
5.6.2 模型架構搭建 136
5.6.3 模型訓練和預測 137
5.7 文本分類案例 137
5.7.1 數據預處理 137
5.7.2 模型架構搭建 139
5.7.3 模型訓練與預測 139
5.8 小結 140
5.9 練習題 140
5.10 參考文獻 140
第6章 聚類分析 142
6.1 聚類概述 142
6.2 劃分聚類 143
6.2.1 K均值 143
6.2.2 K均值算法的實現 144
6.2.3 二分K均值 145
6.2.4 二分K均值算法實現 146
6.2.5 劃分聚類的優點與缺點 148
6.3 層次聚類 149
6.3.1 簇的鄰近性度量 149
6.3.2 AGNES算法 150
6.3.3 層次聚類的優點與缺點 153
6.4 基于密度的聚類 153
6.4.1 DBSCAN 153
6.4.2 算法實現 155
6.4.3 參數的選取 156
6.4.4 密度聚類的優點與缺點 157
6.5 主題模型 157
6.5.1 LDA 模型 158
6.5.2 LDA參數估計 159
6.5.3 LDA的優點與缺點 159
6.6 結構化數據聚類案例 161
6.6.1 數據集 161
6.6.2 評價指標 161
6.6.3 聚類及評估 162
6.7 文本聚類案例 166
6.7.1 數據集 166
6.7.2 數據預處理 166
6.7.3 LDA的訓練和評估 168
6.7.4 LDA 結果的可視化 170
6.8 聚類分析的相關工作 171
6.9 小結 172
6.10 練習題 172
6.11 參考文獻 172
第7章 推薦系統 175
7.1 推薦系統概述 175
7.1.1 推薦系統的發展 175
7.1.2 推薦系統的應用場景 178
7.1.3 推薦系統評測指標 178
7.1.4 推薦系統存在的問題 182
7.2 個性化建模方法 184
7.2.1 基于向量空間模型的表示法 184
7.2.2 基于主題的表示法 184
7.2.3 基于用戶--物品評分矩陣的表示法 185
7.2.4 基于神經網絡的表示法 185
7.3 基于內容的推薦 185
7.3.1 基于內容的推薦簡介 185
7.3.2 基于內容的推薦算法 186
7.3.3 基于內容的推薦的優點和缺點 188
7.4 基于協同過濾的推薦 189
7.4.1 協同過濾簡介 189
7.4.2 用戶行為數據介紹 189
7.4.3 基于用戶的協同過濾 191
7.4.4 基于物品的協同過濾 193
7.4.5 矩陣分解 197
7.4.6 負樣本的采樣 201
7.5 混合推薦 202
7.5.1 混合推薦簡介 202
7.5.2 結合不同的推薦系統 202
7.5.3 在協同過濾中添加基于內容的特征 203
7.5.4 在基于內容的推薦中加入協同過濾的特征 203
7.5.5 構建一個統一推薦模型 203
7.5.6 混合推薦的優點和缺點 203
7.6 基于主題的推薦 204
7.6.1 為什么需要用到主題模型 204
7.6.2 LDA主題模型概述 204
7.6.3 使用主題模型計算相似物品 205
7.6.4 使用主題模型計算相似用戶 206
7.7 基于深度學習的推薦算法 206
7.8 推薦算法案例 208
7.8.1 數據的讀取與分析 208
7.8.2 推薦算法的應用 213
7.9 小結 220
7.10 練習題 220
7.11 參考文獻 221
展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 抓斗式清污机|螺杆式|卷扬式启闭机|底轴驱动钢坝|污水处理闸门-方源水利机械 | 欧版反击式破碎机-欧版反击破-矿山石料破碎生产线-青州奥凯诺机械 | 台式低速离心机-脱泡离心机-菌种摇床-常州市万丰仪器制造有限公司 | 马尔表面粗糙度仪-MAHR-T500Hommel-Mitutoyo粗糙度仪-笃挚仪器 | 高低温万能试验机-复合材料万能试验机-馥勒仪器 | 肉嫩度仪-凝胶测试仪-国产质构仪-气味分析仪-上海保圣实业发展有限公司|总部 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | 自动钻孔机-全自动数控钻孔机生产厂家-多米(广东)智能装备有限公司 | 塑胶跑道_学校塑胶跑道_塑胶球场_运动场材料厂家_中国塑胶跑道十大生产厂家_混合型塑胶跑道_透气型塑胶跑道-广东绿晨体育设施有限公司 | EPK超声波测厚仪,德国EPK测厚仪维修-上海树信仪器仪表有限公司 | 盘装氧量分析仪-防爆壁挂氧化锆分析仪-安徽吉帆仪表有限公司 | LZ-373测厚仪-华瑞VOC气体检测仪-个人有毒气体检测仪-厂家-深圳市深博瑞仪器仪表有限公司 | 温泉机设备|温泉小镇规划设计|碳酸泉设备 - 大连连邦温泉科技 | 污水/卧式/潜水/钻井/矿用/大型/小型/泥浆泵,价格,参数,型号,厂家 - 安平县鼎千泵业制造厂 | 成都LED显示屏丨室内户外全彩led屏厂家方案报价_四川诺显科技 | 沈阳真空机_沈阳真空包装机_沈阳大米真空包装机-沈阳海鹞真空包装机械有限公司 | PTFE接头|聚四氟乙烯螺丝|阀门|薄膜|消解罐|聚四氟乙烯球-嘉兴市方圆氟塑制品有限公司 | 郑州大巴车出租|中巴车租赁|旅游大巴租车|包车|郑州旅游大巴车租赁有限公司 | 上海璟文空运首页_一级航空货运代理公司_机场快递当日达 | 重庆监控_电子围栏设备安装公司_门禁停车场管理系统-劲浪科技公司 | 郑州巴特熔体泵有限公司专业的熔体泵,熔体齿轮泵与换网器生产厂家 | 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 - 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 | 工业插头-工业插头插座【厂家】-温州罗曼电气 | 对辊破碎机_四辊破碎机_双齿辊破碎机_华盛铭重工 | RFID电子标签厂家-上海尼太普电子有限公司 | 临沂招聘网_人才市场_招聘信息_求职招聘找工作请认准【马头商标】 | 安平县鑫川金属丝网制品有限公司,防风抑尘网,单峰防风抑尘,不锈钢防风抑尘网,铝板防风抑尘网,镀铝锌防风抑尘网 | 托利多电子平台秤-高精度接线盒-托利多高精度电子秤|百科 | 塑料瓶罐_食品塑料瓶_保健品塑料瓶_调味品塑料瓶–东莞市富慷塑料制品有限公司 | 佛山市钱丰金属不锈钢蜂窝板定制厂家|不锈钢装饰线条|不锈钢屏风| 电梯装饰板|不锈钢蜂窝板不锈钢工艺板材厂家佛山市钱丰金属制品有限公司 | 儿童语言障碍训练-武汉优佳加感统文化发展有限公司 | 冷油器,取样冷却器,热力除氧器-连云港振辉机械设备有限公司 | 广东教师资格网-广东教师资格证考试网 | OLChemim试剂-ABsciex耗材-广州市自力色谱科仪有限公司 | 玉米深加工机械,玉米加工设备,玉米加工机械等玉米深加工设备制造商-河南成立粮油机械有限公司 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 苏州伊诺尔拆除公司_专业酒店厂房拆除_商场学校拆除_办公楼房屋拆除_家工装拆除拆旧 | 「安徽双凯」自动售货机-无人售货机-成人用品-自动饮料食品零食售货机 | 东莞市踏板石餐饮管理有限公司_正宗桂林米粉_正宗桂林米粉加盟_桂林米粉加盟费-东莞市棒子桂林米粉 | 医养体检包_公卫随访箱_慢病随访包_家签随访包_随访一体机-济南易享医疗科技有限公司 | 车载加油机品牌_ 柴油加油机厂家|