中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 大數據分析原理與實踐

出版社:機械工業出版社出版時間:2017-07-01
開本: 32開 頁數: 443
中 圖 價:¥55.5(7.0折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

大數據分析原理與實踐 版權信息

大數據分析原理與實踐 本書特色

本書介紹了大數據分析的多種模型、所涉及的算法和技術、實現大數據分析系統所需的工具以及大數據分析的具體應用。本書共16章。第1章為緒論,就大數據、大數據分析等概念進行了闡釋,并對本書內容進行了概述;第2~7章介紹了關聯分析模型、分類分析模型、聚類分析模型、結構分析模型和文本分析模型;第8章介紹大數據分析的數據預處理問題;第9章介紹降維方法;第10章介紹了數據倉庫的概念、內涵、組成、體系結構和建立方法,還介紹了分布式數據倉庫系統和內存數據倉庫系統。第11章介紹大數據分析算法中的回歸算法、關聯規則挖掘算法、分類算法以及聚類算法的實現。第12~14章介紹了三種用于實現大數據分析算法的平臺,即并行計算平臺、流式計算平臺和大圖分析平臺。第15章和第16章介紹兩類大數據分析的具體應用,分別講述了社會網絡分析和推薦系統。本書可作為高等院校大數據相關專業的教學用書,也可以作為從事大數據相關工作的工程技術人員的參考用書。

大數據分析原理與實踐 內容簡介

本書介紹了大數據分析的多種模型、所涉及的算法和技術、實現大數據分析系統所需的工具以及大數據分析的具體應用。本書共16章。第1章為緒論,就大數據、大數據分析等概念進行了闡釋,并對本書內容進行了概述;第2~7章介紹了關聯分析模型、分類分析模型、聚類分析模型、結構分析模型和文本分析模型;第8章介紹大數據分析的數據預處理問題;第9章介紹降維方法;第10章介紹了數據倉庫的概念、內涵、組成、體系結構和建立方法,還介紹了分布式數據倉庫系統和內存數據倉庫系統。第11章介紹大數據分析算法中的回歸算法、關聯規則挖掘算法、分類算法以及聚類算法的實現。第12~14章介紹了三種用于實現大數據分析算法的平臺,即并行計算平臺、流式計算平臺和大圖分析平臺。第15章和第16章介紹兩類大數據分析的具體應用,分別講述了社會網絡分析和推薦系統。本書可作為高等院校大數據相關專業的教學用書,也可以作為從事大數據相關工作的工程技術人員的參考用書。

大數據分析原理與實踐 目錄

目  錄

前言
教學建議
第1章 緒論 1
1.1 什么是大數據 1
1.2 哪里有大數據 3
1.3 什么是大數據分析 4
1.4 大數據分析的過程、技術與難點 5
1.5 全書概覽 8
小結 10
習題 10
第2章 大數據分析模型 11
2.1 大數據分析模型建立方法 11
2.2 基本統計量 13
2.2.1 全表統計量 14
2.2.2 皮爾森相關系數 15
2.3 推斷統計 16
2.3.1 參數估計 16
2.3.2 假設檢驗 20
2.3.3 假設檢驗的阿里云實現 23
小結 28
習題 28
第3章 關聯分析模型 30
3.1 回歸分析 31
3.1.1 回歸分析概述 31
3.1.2 回歸模型的拓展 35
3.1.3 回歸的阿里云實現 43
3.2 關聯規則分析 52
3.3 相關分析 54
小結 57
習題 58
第4章 分類分析模型 60
4.1 分類分析的定義 60
4.2 判別分析的原理和方法 61
4.2.1 距離判別法 61
4.2.2 Fisher判別法 64
4.2.3 貝葉斯判別法 67
4.3 基于機器學習分類的模型 71
4.3.1 支持向量機 72
4.3.2 邏輯回歸 74
4.3.3 決策樹與回歸樹 75
4.3.4 k近鄰 78
4.3.5 隨機森林 78
4.3.6 樸素貝葉斯 81
4.4 分類分析實例 82
4.4.1 二分類實例 82
4.4.2 多分類實例 94
小結 101
習題 102
第5章 聚類分析模型 105
5.1 聚類分析的定義 105
5.1.1 基于距離的親疏關系度量 105
5.1.2 基于相似系數的相似性度量 108
5.1.3 個體與類以及類間的親疏關系度量 110
5.1.4 變量的選擇與處理 111
5.2 聚類分析的分類 111
5.3 聚類有效性的評價 112
5.4 聚類分析方法概述 112
5.5 聚類分析的應用 113
5.6 聚類分析的阿里云實現 114
小結 119
習題 119
第6章 結構分析模型 122
6.1 *短路徑 122
6.2 鏈接排名 123
6.3 結構計數 125
6.4 結構聚類 126
6.5 社團發現 128
6.5.1 社團的定義 128
6.5.2 社團的分類 128
6.5.3 社團的用途 128
6.5.4 社團的數學定義 128
6.5.5 基于阿里云的社團發現 130
小結 132
習題 133
第7章 文本分析模型 135
7.1 文本分析模型概述 135
7.2 文本分析方法概述 136
7.2.1 SplitWord 136
7.2.2 詞頻統計 137
7.2.3 TF-IDF 138
7.2.4 PLDA 140
7.2.5 Word2Vec 147
小結 148
習題 149
第8章 大數據分析的數據預處理 150
8.1 數據抽樣和過濾 150
8.1.1 數據抽樣 150
8.1.2 數據過濾 154
8.1.3 基于阿里云的抽樣和過濾實現 154
8.2 數據標準化與歸一化 157
8.3 數據清洗 159
8.3.1 數據質量概述 159
8.3.2 缺失值填充 160
8.3.3 實體識別與真值發現 162
8.3.4 錯誤發現與修復 169
小結 171
習題 171
第9章 降維 173
9.1 特征工程 173
9.1.1 特征工程概述 173
9.1.2 特征變換 175
9.1.3 特征選擇 178
9.1.4 特征重要性評估 183
9.2 主成分分析 191
9.2.1 什么是主成分分析 191
9.2.2 主成分分析的計算過程 192
9.2.3 基于阿里云的主成分分析 194
9.2.4 主成分的表現度量 195
9.3 因子分析 196
9.3.1 因子分析概述 196
9.3.2 因子分析的主要分析指標 196
9.3.3 因子分析的計算方法 197
9.4 壓縮感知 203
9.4.1 什么是壓縮感知 203
9.4.2 壓縮感知的具體模型 204
9.5 面向神經網絡的降維 205
9.5.1 面向神經網絡的降維方法概述 205
9.5.2 如何利用神經網絡降維 206
9.6 基于特征散列的維度縮減 207
9.6.1 特征散列方法概述 207
9.6.2 特征散列算法 207
9.7 基于Lasso算法的降維 208
9.7.1 Lasso方法簡介 208
9.7.2 Lasso方法 209
9.7.3 Lasso算法的適用情景 211
小結 211
習題 212
第10章 面向大數據的數據倉庫系統 214
10.1 數據倉庫概述 214
10.1.1 數據倉庫的基本概念 214
10.1.2 數據倉庫的內涵 215
10.1.3 數據倉庫的基本組成 215
10.1.4 數據倉庫系統的體系結構 216
10.1.5 數據倉庫的建立 217
10.2 分布式數據倉庫系統 221
10.2.1 基于Hadoop的數據倉庫系統 221
10.2.2 Shark:基于Spark的數據倉庫系統 227
10.2.3 Mesa 228
10.3 內存數據倉庫系統 231
10.3.1 SAP HANA 231
10.3.2 HyPer 234
10.4 阿里云數據倉庫簡介 236
小結 238
習題 239
第11章 大數據分析算法 240
11.1 大數據分析算法概述 240
11.2 回歸算法 242
11.3 關聯規則挖掘算法 248
11.4 分類算法 255
11.4.1 二分類算法 256
11.4.2 多分類算法 273
11.5 聚類算法 283
11.5.1 k-means算法 283
11.5.2 CLARANS算法 291
小結 293
習題 293
第12章 大數據計算平臺 295
12.1 Spark 295
12.1.1 Spark簡介 295
12.1.2 基于Spark的大數據分析實例 296
12.2 Hyracks 299
12.2.1 Hyracks簡介 299
12.2.2 基于Hyracks的大數據分析實例 299
12.3 DPark
展開全部

大數據分析原理與實踐 作者簡介

王宏志,博士,博士生導師,哈爾濱工業大學計算機科學與技術學院副教授,中國計算機學會高級會員,YOCSEF黑龍江省分論壇AC。2008年7月在哈爾濱工業大學計算機軟件與理論學科獲得博士學位,博士論文獲得“中國計算機學博士論文”和“哈爾濱工業大學博士論文”。研究方向包括XML數據管理、圖數據管理、數據質量、信息集成等。先后被評為“微軟學者”、“中國數據庫工程師”和“IBM博士英才”。曾先后擔任全國數據庫會議等多個學術會議的程序委員會委員和IEEE TKDE等多個重要國際期刊的審稿人。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 净化板-洁净板-净化板价格-净化板生产厂家-山东鸿星新材料科技股份有限公司 | 焦作网 WWW.JZRB.COM| 油液红外光谱仪-油液监测系统-燃油嗅探仪-上海冉超光电科技有限公司 | 苏州教学设备-化工教学设备-环境工程教学模型|同科教仪 | 超细粉碎机|超微气流磨|气流分级机|粉体改性设备|超微粉碎设备-山东埃尔派粉碎机厂家 | 新疆系统集成_新疆系统集成公司_系统集成项目-新疆利成科技 | 螺钉式热电偶_便携式温度传感器_压簧式热电偶|无锡联泰仪表有限公司|首页 | 净气型药品柜-试剂柜-无管道净气型通风柜-苏州毕恩思 | 球盟会·(中国)官方网站| 预制舱-电力集装箱预制舱-模块化预制舱生产厂家-腾达电器设备 | 留学生辅导网-在线课程论文辅导-留学生挂科申诉机构 | 西安微信朋友圈广告投放_微信朋友圈推广_西安度娘网络科技有限公司 | 南京精锋制刀有限公司-纵剪机刀片_滚剪机刀片_合金刀片厂家 | 衬氟止回阀_衬氟闸阀_衬氟三通球阀_衬四氟阀门_衬氟阀门厂-浙江利尔多阀门有限公司 | 专业甜品培训学校_广东糖水培训_奶茶培训_特色小吃培训_广州烘趣甜品培训机构 | 骁龙云呼电销防封号系统-axb电销平台-外呼稳定『免费试用』 | 定制液氮罐_小型气相液氮罐_自增压液氮罐_班德液氮罐厂家 | elisa试剂盒价格-酶联免疫试剂盒-猪elisa试剂盒-上海恒远生物科技有限公司 | 北京自然绿环境科技发展有限公司专业生产【洗车机_加油站洗车机-全自动洗车机】 | HEYL硬度计量泵-荧光法在线溶解氧仪-净时测控技术(上海)有限公司 | 北京包装设计_标志设计公司_包装设计公司-北京思逸品牌设计 | 婚博会2024时间表_婚博会门票领取_婚博会地址-婚博会官网 | 耐火砖厂家,异形耐火砖-山东瑞耐耐火材料厂 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛婚外情取证-青岛王军侦探事务所 | 高考志愿规划师_高考规划师_高考培训师_高报师_升学规划师_高考志愿规划师培训认证机构「向阳生涯」 | 法兰连接型电磁流量计-蒸汽孔板节流装置流量计-北京凯安达仪器仪表有限公司 | 祝融环境-地源热泵多恒系统高新技术企业,舒适生活环境缔造者! | 缠绕机|缠绕膜包装机|缠绕包装机-上海晏陵智能设备有限公司 | 密集柜_档案密集柜_智能密集架_密集柜厂家_密集架价格-智英伟业 密集架-密集柜厂家-智能档案密集架-自动选层柜订做-河北风顺金属制品有限公司 | 液压压力机,液压折弯机,液压剪板机,模锻液压机-鲁南新力机床有限公司 | 保定市泰宏机械制造厂-河北铸件厂-铸造厂-铸件加工-河北大件加工 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 衬氟旋塞阀-卡套旋塞阀-中升阀门首页| 深圳市八百通智能技术有限公司官方网站 | 最新电影-好看的电视剧大全-朝夕电影网 | 【官网】博莱特空压机,永磁变频空压机,螺杆空压机-欧能优 | 聚氨酯保温钢管_聚氨酯直埋保温管道_聚氨酯发泡保温管厂家-沧州万荣防腐保温管道有限公司 | 深圳APP开发公司_软件APP定制开发/外包制作-红匣子科技 | 广东泵阀展|阀门展-广东国际泵管阀展览会 | 全自动端子机|刺破式端子压接机|全自动双头沾锡机|全自动插胶壳端子机-东莞市傅氏兄弟机械设备有限公司 | 厂房出租_厂房出售_产业园区招商_工业地产 - 中工招商网 |