中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 大數據分析與挖掘

作者:石勝飛
出版社:人民郵電出版社出版時間:2017-04-01
開本: 其他 頁數: 265
本類榜單:教材銷量榜
中 圖 價:¥32.4(6.5折) 定價  ¥49.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據分析與挖掘 版權信息

大數據分析與挖掘 本書特色

1. 校企結合典型案例。 2. 華為提供技術支持和技術案例。 3. 計算機教指委提供專家指導意見。 4. 作者來自985高校,水平高。 5. 配套資源豐富。

大數據分析與挖掘 內容簡介

《大數據分析與挖掘》主要內容包括:第 1章緒論、第 2章數據特征分析與預處理、第3章關聯規則挖掘、第4章分類算法、第5章聚類算法、第6章分布式大數據流挖掘、第7章 綜合案例——基于華為技術與設備。本書可作為高等院校數據科學與大數據技術、計算機科學與技術等相關專業的本科生教材。

大數據分析與挖掘 目錄

第1章 緒論 1
1.1 大數據分析與挖掘簡介 1
1.2 大數據應用及挑戰 2
1.3 大數據分析與挖掘主要技術 3
1.4 大數據分析與挖掘工具 4
1.4.1 Sklearn 4
1.4.2 Spark ML 5
1.4.3 華為云的機器學習服務 5
第2章 數據特征分析與預處理 15
2.1 數據類型 15
2.1.1 數據集類型 15
2.1.2 數據屬性的類型 17
2.2 數據的描述性特征 20
2.2.1 描述數據集中趨勢的度量 20
2.2.2 描述數據離中趨勢的度量 22
2.2.3 數據分布形態的度量 24
2.2.4 數據分布特征的可視化 27
2.3 數據的相關分析 30
2.3.1 相關分析 31
2.3.2 卡方(χ2)檢驗 32
2.4 數據預處理 34
2.4.1 數據變換、離散化與編碼 35
2.4.2 數據抽樣技術 40
2.4.3 主成分分析 42
2.4.4 數據清洗 49
2.5 Spark數據預處理功能簡介 52
2.5.1 二值化 52
2.5.2 分箱器 52
2.5.3 哈達瑪積變換 53
2.5.4 *大絕對值標準化 53
2.5.5 *小—*大變換 54
2.5.6 正則化 54
2.5.7 多項式擴展 55
2.5.8 標準化 55
2.5.9 特征向量合并 56
2.5.10 類別特征索引 57
習題 57
第3章 關聯規則挖掘 59
3.1 基本概念 59
3.2 基于候選項產生—測試策略的頻繁模式挖掘算法 61
3.2.1 Apriori算法 61
3.2.2 基于劃分的算法 64
3.2.3 事務數據的存儲 65
3.3 不需要產生候選項集的頻繁模式挖掘算法 66
3.3.1 FP-Growth算法 66
3.3.2 Spark上FP-Growth算法實踐 71
3.4 結合相關性分析的關聯規則 72
3.5 多層關聯規則挖掘算法 74
3.6 序列模式挖掘 77
3.6.1 序列模式的定義 77
3.6.2 PrefixSpan算法 78
3.6.3 與其他序列模式挖掘算法的比較和分析 80
3.7 其他類型關聯規則簡介 81
3.7.1 量化關聯規則 82
3.7.2 時態關聯規則 82
3.7.3 局部化的關聯規則 82
3.7.4 優化的關聯規則 82
習題 83
第4章 分類與回歸算法 85
4.1 決策樹算法 85
4.1.1 決策樹簡介 85
4.1.2 決策樹的類型 86
4.1.3 決策樹的構造過程 86
4.1.4 信息論的有關概念 87
4.1.5 ID3算法 87
4.1.6 信息論在ID3算法中的應用 90
4.1.7 C4.5算法 91
4.1.8 CART算法 91
4.1.9 過擬合與決策樹剪枝 93
4.1.10 決策樹后剪枝策略 95
4.1.11 決策樹的生成與可視化 103
4.1.12 幾種屬性選擇度量的對比 106
4.2 貝葉斯分類器 106
4.2.1 貝葉斯決策理論 106
4.2.2 極大似然估計 107
4.2.3 樸素貝葉斯分類器 108
4.2.4 貝葉斯網絡基礎 110
4.2.5 通過貝葉斯網絡判斷條件獨立 111
4.2.6 貝葉斯網絡推理實例 112
4.3 基于實例的分類算法 115
4.3.1 KNN分類器 115
4.3.2 局部加權回歸 121
4.3.3 基于案例的推理 123
4.4 組合分類算法 130
4.4.1 Adaboost算法 130
4.4.2 Bagging算法 135
4.4.3 隨機森林 140
4.5 分類器算法的評估 142
4.6 回歸分析 146
4.6.1 線性回歸 146
4.6.2 嶺回歸 149
4.6.3 多項式回歸 149
4.6.4 邏輯回歸 151
4.6.5 決策樹回歸 152
4.6.6 梯度提升決策樹 155
習題 160
第5章 聚類算法 165
5.1 聚類分析概述 165
5.2 聚類算法的分類 166
5.3 距離度量 166
5.3.1 冪距離 166
5.3.2 歐式距離 167
5.3.3 曼哈頓距離 167
5.3.4 切比雪夫距離 168
5.3.5 余弦相似度 168
5.3.6 蘭氏距離 169
5.3.7 馬氏距離 169
5.3.8 斜交空間距離 170
5.3.9 杰卡德距離 170
5.3.10 漢明距離 171
5.4 基于劃分的聚類算法 172
5.4.1 K均值算法 172
5.4.2 二分K均值聚類算法 174
5.4.3 小批量K均值算法 175
5.4.4 K均值++算法 179
5.4.5 K中心點算法 180
5.4.6 數據流K均值算法 181
5.5 基于密度的聚類算法 182
5.5.1 DBSCAN算法 182
5.5.2 OPTICS算法 185
5.6 基于模型的聚類算法:高斯混合模型算法 189
5.6.1 算法原理 189
5.6.2 GMM算法的參數估計 190
5.6.3 GMM算法實踐 191
5.7 層次聚類 193
5.7.1 凝聚的層次聚類算法 193
5.7.2 聚類之間距離的度量方法 193
5.7.3 層次聚類算法的性質 204
5.7.4 BIRCH算法 207
5.8 基于網格的聚類算法 211
5.8.1 STING算法 211
5.8.2 CLIQUE算法 213
5.9 Mean Shift聚類算法 218
5.9.1 基本概念 218
5.9.2 Mean Shift算法聚類過程 219
5.9.3 Mean Shift聚類算法實踐 222
5.9.4 改進的Mean Shift算法 223
5.10 聚類算法評價指標 224
5.10.1 調整蘭德指數 224
5.10.2 互信息評分 225
5.10.3 同質性、完整性以及調和平均 226
5.10.4 Fowlkes-Mallows評分 228
5.10.5 輪廓系數 229
5.10.6 Calinski-Harabz 指數 229
習題 230
第6章 數據挖掘綜合應用:異常檢測 232
6.1 預備知識 232
6.1.1 相關統計學概念 232
6.1.2 異常檢測評價指標 234
6.1.3 異常檢測問題的特點 234
6.1.4 異常檢測算法分類 234
6.2 基于隔離森林的異常檢測算法 235
6.2.1 隔離與隔離樹iTree 236
6.2.2 隔離森林的特點 238
6.2.3 隔離森林算法 239
6.2.4 應用實例 240
6.3 局部異常因子算法 242
6.3.1 基本定義 242
6.3.2 異常檢測 243
6.3.3 應用實例 244
6.4 基于One-Class SVM的異常檢測算法 245
6.4.1 基本原理 245
6.4.2 應用實例 246
6.5 基于主成分分析的異常檢測算法 247
6.6 基于集成學習的異常檢測算法 249
6.6.1 基本原理 249
6.6.2 應用實例 250
6.7 其他有監督學習類型的檢測算法 253
6.7.1 罕見類別檢測 254
6.7.2 基于有監督學習的異常檢測實例 256
6.7.3 異常檢測應用實例——時空異常檢測 257
6.7.4 Spark異常值檢測實例 259
6.8 習題 261
附錄 《大數據分析與挖掘》配套實驗課程方案簡介 263
參考文獻 264
展開全部

大數據分析與挖掘 作者簡介

石勝飛,哈爾濱工業大學副教授,主要研究領域數據挖掘、大數據分析。中國計算機學會數據庫專家會委員。中國計算機學會數據庫專家會委員。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 原色会计-合肥注册公司_合肥代理记账公司_营业执照代办 | 渣油泵,KCB齿轮泵,不锈钢齿轮泵,重油泵,煤焦油泵,泊头市泰邦泵阀制造有限公司 | 济南玻璃安装_济南玻璃门_济南感应门_济南玻璃隔断_济南玻璃门维修_济南镜片安装_济南肯德基门_济南高隔间-济南凯轩鹏宇玻璃有限公司 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 航拍_专业的无人机航拍摄影门户社区网站_航拍网| 干式磁选机_湿式磁选机_粉体除铁器-潍坊国铭矿山设备有限公司 | 钢托盘,钢制托盘,立库钢托盘,金属托盘制造商_南京飞天金属制品实业有限公司 | 圆形振动筛_圆筛_旋振筛_三次元振动筛-河南新乡德诚生产厂家 | 在线PH计-氧化锆分析仪-在线浊度仪-在线溶氧仪- 无锡朝达 | 破碎机锤头_耐磨锤头_合金锤头-鼎成机械一站式耐磨铸件定制服务 微型驱动系统解决方案-深圳市兆威机电股份有限公司 | 无缝钢管-聊城无缝钢管-小口径无缝钢管-大口径无缝钢管 - 聊城宽达钢管有限公司 | GAST/BRIWATEC/CINCINNATI/KARL-KLEIN/ZIEHL-ABEGG风机|亚喜科技 | 天津货架厂_穿梭车货架_重型仓储货架_阁楼货架定制-天津钢力仓储货架生产厂家_天津钢力智能仓储装备 | 硬齿面减速机_厂家-山东安吉富传动设备股份有限公司 | 钛合金标准件-钛合金螺丝-钛管件-钛合金棒-钛合金板-钛合金锻件-宝鸡远航钛业有限公司 | 称重传感器,测力传感器,拉压力传感器,压力变送器,扭矩传感器,南京凯基特电气有限公司 | 企小优-企业数字化转型服务商_网络推广_网络推广公司 | 注塑模具_塑料模具_塑胶模具_范仕达【官网】_东莞模具设计与制造加工厂家 | 广东泵阀展|阀门展-广东国际泵管阀展览会 | 四合院设计_四合院装修_四合院会所设计-四合院古建设计与建造中心1 | 垃圾处理设备_餐厨垃圾处理设备_厨余垃圾处理设备_果蔬垃圾处理设备-深圳市三盛环保科技有限公司 | 上海阳光泵业制造有限公司 -【官方网站】 | 我爱古诗词_古诗词名句赏析学习平台 | 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 企业彩铃制作_移动、联通、电信集团彩铃上传开通_彩铃定制_商务彩铃管理平台-集团彩铃网 | 岩棉板|岩棉复合板|聚氨酯夹芯板|岩棉夹芯板|彩钢夹芯板-江苏恒海钢结构 | 地源热泵一体机,地源热泵厂家-淄博汇能环保设备有限公司 | 光栅尺厂家_数显表维修-苏州泽升精密机械| 家乐事净水器官网-净水器厂家「官方」 | 无机纤维喷涂棉-喷涂棉施工工程-山东华泉建筑工程有限公司▲ | 裹包机|裹膜机|缠膜机|绕膜机-上海晏陵智能设备有限公司 | 建筑资质代办-建筑企业资质代办机构-建筑资质代办公司 | 工业洗衣机_工业洗涤设备_上海力净工业洗衣机厂家-洗涤设备首页 bkzzy在职研究生网 - 在职研究生招生信息咨询平台 | 粉末冶金-粉末冶金齿轮-粉末冶金零件厂家-东莞市正朗精密金属零件有限公司 | 宝宝药浴-产后药浴-药浴加盟-艾裕-专注母婴调养泡浴 | 便携式表面粗糙度仪-彩屏硬度计-分体式粗糙度仪-北京凯达科仪科技有限公司 | 工作心得_读书心得_学习心得_找心得体会范文就上学道文库 | 撕碎机_轮胎破碎机_粉碎机_回收生产线厂家_东莞华达机械有限公司 | 流程管理|流程管理软件|企业流程管理|微宏科技-AlphaFlow_流程管理系统软件服务商 | 济南ISO9000认证咨询代理公司,ISO9001认证,CMA实验室认证,ISO/TS16949认证,服务体系认证,资产管理体系认证,SC食品生产许可证- 济南创远企业管理咨询有限公司 郑州电线电缆厂家-防火|低压|低烟无卤电缆-河南明星电缆 | 煤棒机_增碳剂颗粒机_活性炭颗粒机_木炭粉成型机-巩义市老城振华机械厂 |