中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
大數據、數據挖掘理論與應用實踐

包郵 大數據、數據挖掘理論與應用實踐

作者:李文書 等
出版社:北京大學出版社出版時間:2020-12-01
開本: 16開 頁數: 400
中 圖 價:¥50.7(7.3折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據、數據挖掘理論與應用實踐 版權信息

  • ISBN:9787301318997
  • 條形碼:9787301318997 ; 978-7-301-31899-7
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

大數據、數據挖掘理論與應用實踐 本書特色

本書包括了大數據分析相關技術的基本內容,同時又具有一定的深度和廣度。希望通過本書的講解,使讀者既能了解大數據的概貌,又能把握大數據技術的國際動態和發展趨勢。

大數據、數據挖掘理論與應用實踐 內容簡介

本書從大數據、數據挖掘、實際案例三個方面深入淺出地介紹了大數據領域的知識。全書分為三個部分:部分是大數據篇,主要從數據起源、生態系統、生命周期以及行業應用來分析大數據的研究方向和趨勢,并對數據預處理、可視化、安全等大數據技術進行了詳細的闡述;第二部分是數據挖掘認知篇,主要從線性回歸、聚類、關聯規則、分類與預測、時間序列等方面剖析數據挖掘技術;第三部分是數據實踐篇,主要從業務和技術角度闡述巳有的科研成果,使讀者在從理論到實踐的過程中深刻理解大數據的用途及技術的本質。本書可作為大學本科學生的教材,也可作為從事智能信息處理、大數據、云服務等領域的科研工作者和廣大工程技術人員的參考書,以及對大數據感興趣的讀者的自學用書。

大數據、數據挖掘理論與應用實踐 目錄

第1章 緒論 3
1.1 什么是大數據 4
1.1.1 大數據的來源 4
1.1.2 大數據的表現形式 5
1.1.3 大數據的特征 7
1.2 什么是商業智能 8
1.3 大數據生命周期 9
1.4 數據科學研究的主要問題 11
1.5 數據科學的模型方法 14
1.5.1 有監督學習 14
1.5.2 無監督學習 15
1.5.3 半監督學習 15
1.6 大數據方向 16
1.6.1 大數據架構方向 16
1.6.2 大數據分析方向 16
1.6.3 大數據開發方向 17
第2章 數據預處理 19
2.1 統計分析 20
2.1.1 統計描述 21
2.1.2 統計分析中的基本概念 25
2.1.3 參數估計和假設檢驗 27
2.1.4 區間估計和檢驗 28
2.1.5 方差分析 31
2.2 數據預處理 41
2.2.1 數據清洗 42
2.2.2 數據集成 45
2.2.3 數據變換 46
2.2.4 數據歸約 47
第3章 大數據可視化 63
3.1 數據可視化的發展歷程 64
3.1.1 萌芽時期 66
3.1.2 拉開帷幕 68
3.1.3 初露鋒芒 69
3.1.4 黃金時代 70
3.1.5 穩步發展 72
3.1.6 日新月異 73
3.2 數據可視化的分類 74
3.2.1 依據數據類型分類 74
3.2.2 依據展示方式分類 77
3.2.3 依據應用場景分類 77
3.3 數據可視化設計的原則 78
3.3.1 親密性(分組) 78
3.3.2 對齊 78
3.3.3 重復/統一 79
3.3.4 對比/強調 79
3.3.5 力求表達準確、到位、簡潔、易懂 80
3.4 數據可視化的流程 80
3.4.1 了解需求 80
3.4.2 可視化設計 82
3.5 應用實踐 82
3.5.1 折線圖 83
3.5.2 散點圖 84
3.5.3 柱狀圖 85
3.5.4 詞云圖 86
3.5.5 雷達圖 88
第4章 大數據安全 91
4.1 大數據安全概述 92
4.1.1 保密性 92
4.1.2 完整性 93
4.1.3 可用性 93
4.2 基本的密碼技術 93
4.2.1 加密技術 93
4.2.2 數字簽名技術 94
4.2.3 Hash函數和MAC算法 95
4.3 全同態加密技術 95
4.3.1 基本定義 95
4.3.2 全同態加密技術原理 96
4.3.3 全同態加密技術的應用 98
4.4 安全多方計算 100
4.4.1 基本定義 100
4.4.2 安全多方計算原理 100
4.4.3 安全多方計算的應用 102
4.5 差分隱私 103
4.5.1 基本定義 104
4.5.2 差分隱私原理 105
4.5.3 差分隱私的應用 107
4.6 區塊鏈 109
4.6.1 基本定義 110
4.6.2 區塊鏈技術原理 111
4.6.3 區塊鏈技術的應用 112
第5章 線性回歸分析 119
5.1 一元線性回歸 120
5.1.1 一元線性回歸概述 120
5.1.2 一元線性回歸的參數估計 123
5.1.3 一元線性回歸模型的檢驗 125
5.1.4 一元線性回歸的預測 127
5.2 多元線性回歸分析 128
5.2.1 多元線性回歸模型及假定 129
5.2.2 參數估計 129
5.2.3 模型檢驗 130
5.2.4 預測 131
5.3 應用實踐 133
5.3.1 基于Lasso回歸的波士頓房價預測 133
5.3.2 基于線性回歸的降雨量預測 136
第6章 聚類分析 142
6.1 聚類概述 143
6.2 幾種常用的度量方法 143
6.2.1 歐幾里得距離(Euclidean distance) 144
6.2.2 曼哈頓距離(Manhattan distance) 144
6.2.3 切比雪夫距離(Chebyshev distance) 145
6.2.4 冪距離(Power distance) 145
6.2.5 馬氏距離(Mahalanobis distance) 146
6.2.6 余弦相似度(Cosine similarity) 148
6.2.7 Pearson相關系數(Pearson correlation coefficient) 148
6.2.8 Jaccard相似系數(Jaccard similarity coefficient) 148
6.3 聚類的方法 150
6.3.1 層次聚類 150
6.3.2 密度聚類 151
6.3.3 分割聚類 152
6.4 應用實踐 154
6.4.1 基于DBSCAN密度聚類的鳶尾花品種分類 154
6.4.2 基于聚類和可視化的世界國家幸福指數分析 157
第7章 關聯規則分析 164
7.1 關聯規則分析概述 165
7.2 關聯規則分析常用的基本概念 166
7.3 基于Apriori算法的關聯規則分析 168
7.3.1 連接(linking)步驟 168
7.3.2 剪枝(pruning)步驟 169
7.3.3 Apriori算法處理流程 169
7.3.4 Apriori算法實例 170
7.3.5 由頻繁項集生成關聯規則 172
7.4 改進的Apriori算法 172
7.4.1 基于劃分的方法 172
7.4.2 基于抽樣的方法 173
7.4.3 增量更新的方法 173
7.4.4 概念層次的方法 174
7.4.5 基于散列和壓縮技術的方法 174
7.5 基于FP-Growth算法的關聯規則分析 175
7.6 多維和多層關聯規則 177
7.6.1 多維關聯規則挖掘 177
7.6.2 多層關聯規則挖掘 178
7.7 應用實踐 179
7.7.1 基于Apriori算法的用戶購物關聯度分析 179
7.7.2 基于FP-Growth算法的用戶購物關聯度分析 183
第8章 分類與預測 195
8.1 分類問題評價準則 196
8.2 線性分類 198
8.2.1 Logistic模型 199
8.2.2 判別分析 202
8.3 決策樹 206
8.3.1 決策樹的概念及基本算法 206
8.3.2 基于信息熵的決策樹歸納算法 208
8.3.3 決策樹修剪 212
8.3.4 提取決策規則 212
8.3.5 決策樹的改進 213
8.4 AdaBoost算法 215
8.5 隨機森林算法 217
8.5.1 設計隨機森林分類器 217
8.5.2 構建隨機森林 218
8.6 應用實踐 223
8.6.1 基于隨機森林算法預測是否被錄取 223
8.6.2 基于決策樹算法預測是否被錄取 227
第9章 時間序列分析 231
9.1 時間序列分析概述 232
9.2 ARIMA模型 233
9.2.1 ARIMA模型的基本概念 233
9.2.2 ARIMA模型預測步驟 234
9.2.3 預測實例 234
9.3 HMM 241
9.3.1 HMM的基本概念 241
9.3.2 HMM的基本問題 243
9.3.3 HMM基本問題的解法 244
9.4 動態貝葉斯網絡 248
9.4.1 動態貝葉斯網絡的基本概念 248
9.4.2 動態貝葉斯網絡的學習 250
9.4.3 動態貝葉斯網絡的推理 252
9.5 應用實踐 252
9.5.1 基于ARIMA模型的二氧化碳濃度預測 252
9.5.2 基于HMM的比特幣投資預測 258
第10章 大數據工具 271
10.1 分布式系統概述 272
10.2 Hadoop概述 273
10.3 Hadoop偽分布式的安裝和配置 273
10.3.1 安裝前準備 273
10.3.2 安裝Hadoop 275
10.3.3 偽分布式配置 275
10.4 MapReduce 277
10.4.1 MapReduce任務的工作流程 278
10.4.2 MapReduce編程 280
10.5 利用MapReduce中的矩陣相乘 281
10.5.1 數據準備 281
10.5.2 矩陣的存儲方式 282
10.6 Hive 286
10.6.1 Hive簡介 286
10.6.2 數據存儲 287
10.6.3 用Python執行HQL命令 288
10.6.4 必知的HQL知識 289
10.6.5 HQL實例 294
10.7 HBase 295
10.7.1 數據模型 296
10.7.2 HBase的特點 297
10.7.3 獲取數據 297
10.7.4 存儲數據 298
第11章 基于卷積神經網絡和深度
哈希編碼的圖像檢索方法 301
11.1 圖像檢索方法的發展歷程 302
11.2 卷積深度哈希網絡的基本框架 303
11.2.1 卷積子網絡 303
11.2.2 損失函數 304
11.2.3 哈希層 304
11.3 實驗結果與性能分析 305
11.3.1 神經網絡參數 305
11.3.2 數據庫和評價指標 305
11.3.3 實驗結果分析 306
第12章 蛋白質作用網絡模型 310
第13章 基于改進的長短期記憶網絡的道路交通事故預測模型 322
第14章 大數據工作流的性能建模和預測 364
附錄 數學基礎知識 379
參考文獻 386
展開全部

大數據、數據挖掘理論與應用實踐 作者簡介

1.李文書,教授,工學博士,現任浙江理工大學信息學院,智能檢測與系統實驗室主任,碩士生導師。IEEE (1-1163129461)、中國計算機學會(E200016385M)會員和杭州市計算機學會會員。2.吳奇石,工學博士,西北大學國家特聘教授,鄭州大學講座教授,西安電子科技大學華山學者,天津大學客座教授。3.蔡霞,女,計算機科學與技術碩士,浙江理工大學信息學院講師,主要研究方向為數據挖掘、機器學習,獲得CIIT大數據開發工程師證書。4.李楊,男,工學博士,現任浙江理工大學信息學院講師,中國生物醫學工程學會會員,主要研究方向為醫學圖像分析、機器學習,發表SCI/EI論文10余篇,申請發明專利3項。5.黃海,男,工學博士,現任浙江理工大學信息學院計算機系副教授,碩士生導師,主要研究方向為信息安全與密碼學、大數據安全以及云計算安全等。6.蘇先創,男,工學博士,現任浙江理工大學信息學院講師,主要研究方向為機器學習、仿生智能系統,發表SCI/EI論文10余篇,獲授權專利3項。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 密度电子天平-内校-外校电子天平-沈阳龙腾电子有限公司 | 卫生纸复卷机|抽纸机|卫生纸加工设备|做卫生纸机器|小型卫生纸加工需要什么设备|卫生纸机器设备多少钱一台|许昌恒源纸品机械有限公司 | 七维官网-水性工业漆_轨道交通涂料_钢结构漆 | 浙江美尔凯特智能厨卫股份有限公司 | 电动百叶窗,开窗器,电动遮阳百叶,电动开窗机生产厂家-徐州鑫友工控科技发展有限公司 | 定制液氮罐_小型气相液氮罐_自增压液氮罐_班德液氮罐厂家 | 山东商品混凝土搅拌楼-环保型搅拌站-拌合站-分体仓-搅拌机厂家-天宇 | 西安标准厂房_陕西工业厂房_西咸新区独栋厂房_长信科技产业园官方网站 | 有机废气处理-rto焚烧炉-催化燃烧设备-VOC冷凝回收装置-三梯环境 | 谈股票-今日股票行情走势分析-牛股推荐排行榜| 砖机托板价格|免烧砖托板|空心砖托板厂家_山东宏升砖机托板厂 | 杰恒蠕动泵-蠕动泵专业厂家-19年专注蠕动泵| 蓄电池回收,ups电池后备电源回收,铅酸蓄电池回收,机房电源回收-广州益夫铅酸电池回收公司 | 自动气象站_气象站监测设备_全自动气象站设备_雨量监测站-山东风途物联网 | B2B网站_B2B免费发布信息网站_B2B企业贸易平台 - 企资网 | nalgene洗瓶,nalgene量筒,nalgene窄口瓶,nalgene放水口大瓶,浙江省nalgene代理-杭州雷琪实验器材有限公司 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 【同风运车官网】一站式汽车托运服务平台,验车满意再付款 | 塑料异型材_PVC异型材_封边条生产厂家_PC灯罩_防撞扶手_医院扶手价格_东莞市怡美塑胶制品有限公司 | 土壤肥料养分速测仪_测土配方施肥仪_土壤养分检测仪-杭州鸣辉科技有限公司 | 丝印油墨_水性油墨_环保油墨油漆厂家_37国际化工 | 户外-组合-幼儿园-不锈钢-儿童-滑滑梯-床-玩具-淘气堡-厂家-价格 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | 哔咔漫画网页版在线_下载入口访问指引 | 威廉希尔WilliamHill·足球(中国)体育官方网站 | 细石混凝土泵_厂家_价格-烟台九达机械有限公司 | 多物理场仿真软件_电磁仿真软件_EDA多物理场仿真软件 - 裕兴木兰 | 招商帮-一站式网络营销服务|搜索营销推广|信息流推广|短视视频营销推广|互联网整合营销|网络推广代运营|招商帮企业招商好帮手 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 二手电脑回收_二手打印机回收_二手复印机回_硒鼓墨盒回收-广州益美二手电脑回收公司 | 合肥仿石砖_合肥pc砖厂家_合肥PC仿石砖_安徽旭坤建材有限公司 | 深圳高新投三江工业消防解决方案提供厂家_服务商_园区智慧消防_储能消防解决方案服务商_高新投三江 | 能量回馈_制动单元_电梯节能_能耗制动_深圳市合兴加能科技有限公司 | 医养体检包_公卫随访箱_慢病随访包_家签随访包_随访一体机-济南易享医疗科技有限公司 | 3dmax渲染-效果图渲染-影视动画渲染-北京快渲科技有限公司 | 长春网站建设,五合一网站设计制作,免费优化推广-长春网站建设 | 早报网 | 太阳能发电系统-太阳能逆变器,控制器-河北沐天太阳能科技首页 | 丁基胶边来料加工,医用活塞边角料加工,异戊二烯橡胶边来料加工-河北盛唐橡胶制品有限公司 | 膜片万向弹性联轴器-冲压铸造模具「沧州昌运模具」 | 视觉检测设备_自动化检测设备_CCD视觉检测机_外观缺陷检测-瑞智光电 |