中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據科學與應用叢書HADOOP大數據實戰權威指南(第2版)

包郵 大數據科學與應用叢書HADOOP大數據實戰權威指南(第2版)

作者:黃東軍
出版社:電子工業出版社出版時間:2019-09-01
開本: 其他 頁數: 320
中 圖 價:¥52.3(6.6折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據科學與應用叢書HADOOP大數據實戰權威指南(第2版) 版權信息

  • ISBN:9787121370335
  • 條形碼:9787121370335 ; 978-7-121-37033-5
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

大數據科學與應用叢書HADOOP大數據實戰權威指南(第2版) 本書特色

基于"深入分析組件原理、充分展示搭建過程、詳細指導應用開發”的理念,以*版Hadoop及其生態組件為對象,采用理論與應用高度融合的方法,介紹大數據的概念、技術、方法、應用、以及項目開發。全書分為三篇,*篇為大數據的基本概念和技術綜述,第二篇為平臺搭建與基本應用,內容設計Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark、Phoenix等;第三篇為數據處理與項目開發,綜合運用各類組件進行實際數據處理,包括交互式應用、決策、推薦算法、銷售數據分析系統等。

大數據科學與應用叢書HADOOP大數據實戰權威指南(第2版) 內容簡介

基于"深入分析組件原理、充分展示搭建過程、詳細指導應用開發”的理念,以近期新版Hadoop及其生態組件為對象,采用理論與應用高度融合的方法,介紹大數據的概念、技術、方法、應用、以及項目開發。全書分為三篇,篇為大數據的基本概念和技術綜述,第二篇為平臺搭建與基本應用,內容設計Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark、Phoenix等;第三篇為數據處理與項目開發,綜合運用各類組件進行實際數據處理,包括交互式應用、決策、推薦算法、銷售數據分析系統等。

大數據科學與應用叢書HADOOP大數據實戰權威指南(第2版) 目錄

目 錄
**篇 大數據的基本概念和技術 1
第1章 緒論 3
1.1 大數據的時代背景 3
1.1.1 全球大數據浪潮 3
1.1.2 我國的大數據戰略 5
1.2 大數據的基本概念和特征 6
1.2.1 基本概念 6
1.2.2 基本特征 7
1.3 大數據系統的技術支撐體系 7
1.3.1 技術支撐體系概覽 7
1.3.2 大數據系統的采集層 8
1.3.3 大數據系統的存儲層 9
1.3.4 大數據系統的分析層 9
1.3.5 大數據系統的應用層 9
1.3.6 大數據系統的垂直層 10
1.4 大數據領域的主要職位及其能力要求 11
1.4.1 首席數據官 11
1.4.2 數據科學家 11
1.4.3 大數據開發工程師 12
1.4.4 大數據運維工程師 13
1.5 本章小結 13
第2章 Hadoop大數據關鍵技術 15
2.1 Hadoop大數據應用生態系統 15
2.1.1 架構的基本理論 15
2.1.2 Hadoop大數據應用生態系統的主要組件及其關系 16
2.2 大數據采集技術 19
2.2.1 結構化數據采集工具 19
2.2.2 日志收集工具與技術 20
2.3 大數據存儲技術 23
2.3.1 相關概念 23
2.3.2 分布式存儲系統 27
2.3.3 數據庫(HBase)與數據倉庫(Hive) 30
2.4 分布式計算框架 35
2.4.1 離線計算框架 35
2.4.2 實時流計算平臺 40
2.5 數據分析平臺與工具 45
2.5.1 面向大數據的數據挖掘與分析工具 45
2.5.2 機器學習 49
2.6 本章小結 52
第二篇 Hadoop大數據平臺搭建與基本應用 55
第3章 Linux操作系統與集群搭建 57
3.1 Linux操作系統 57
3.1.1 概述 57
3.1.2 特點 58
3.1.3 Linux操作系統的組成 59
3.2 Linux集群的搭建 62
3.2.1 安裝VMware Workstation 62
3.2.2 在VMware Workstation Pro 12上安裝Linux(CentOS 7) 65
3.3 集群的配置 77
3.3.1 設置主機名 77
3.3.2 網絡設置 79
3.3.3 關閉防火墻 83
3.3.4 安裝JDK 84
3.3.5 免密鑰登錄配置 87
3.4 Linux基本命令 89
3.5 本章小結 96
第4章 HDFS安裝與基本應用 97
4.1 HDFS概述 97
4.1.1 特點 97
4.1.2 主要組件與架構 97
4.2 HDFS架構分析 98
4.2.1 數據塊 98
4.2.2 NameNode 98
4.2.3 DataNode 99
4.2.4 SecondaryNameNode 100
4.2.5 數據備份 100
4.2.6 通信協議 101
4.2.7 可靠性保證 101
4.3 文件操作過程分析 101
4.3.1 讀文件 101
4.3.2 寫文件 102
4.3.3 刪除文件 103
4.4 Hadoop的安裝與配置 104
4.4.1 解壓Hadoop安裝包 104
4.4.2 配置Hadoop環境變量 105
4.4.3 配置Yarn環境變量 106
4.4.4 配置核心組件 106
4.4.5 配置文件系統 107
4.4.6 配置yarn site.xml文件 108
4.4.7 配置MapReduce計算框架文件 109
4.4.8 配置Master中的workers文件 111
4.4.9 將Master上的Hadoop復制到Slave 111
4.5 Hadoop集群的啟動 112
4.5.1 配置操作系統的環境變量 112
4.5.2 創建Hadoop數據目錄 113
4.5.3 格式化文件系統 113
4.5.4 啟動和關閉Hadoop 114
4.5.5 驗證Hadoop是否成功啟動 115
4.6 Hadoop集群的基本應用 117
4.6.1 HDFS基本命令 117
4.6.2 在Hadoop集群中運行程序 120
4.7 本章小結 122
第5章 MapReduce與Yarn 123
5.1 MapReduce程序的概念 123
5.1.1 基本編程模型 123
5.1.2 計算過程分析 124
5.2 深入理解Yarn 126
5.2.1 Yarn的基本架構 126
5.2.2 Yarn的工作流程 130
5.3 在Linux平臺安裝Eclipse 130
5.3.1 Eclipse簡介 130
5.3.2 安裝并啟動Eclipse 131
5.4 開發MapReduce程序的基本方法 133
5.4.1 為Eclipse安裝Hadoop插件 133
5.4.2 WordCount:**個MapReduce程序 137
5.5 本章小結 150
第6章 Hive和HBase的安裝與應用 151
6.1 在CentOS 7下安裝MySQL 151
6.1.1 下載或復制MySQL安裝包 151
6.1.2 執行安裝命令 152
6.1.3 啟動MySQL 153
6.1.4 登錄MySQL 153
6.1.5 使用MySQL 154
6.1.6 問題與解決辦法 156
6.2 Hive安裝與應用 157
6.2.1 下載并解壓Hive安裝包 158
6.2.2 配置Hive 158
6.2.3 啟動并驗證Hive 161
6.2.4 Hive的基本應用 162
6.3 ZooKeeper集群安裝 163
6.3.1 ZooKeeper簡介 163
6.3.2 安裝ZooKeeper 164
6.3.3 配置ZooKeeper 165
6.3.4 啟動和測試 166
6.4 HBase的安裝與應用 168
6.4.1 解壓并安裝HBase 168
6.4.2 配置HBase 169
6.4.3 啟動并驗證HBase 171
6.4.4 HBase的基本應用 173
6.4.5 HBase應用中常見問題及其解決辦法 175
6.5 本章小結 176
第7章 Sqoop和Kafka的安裝與應用 177
7.1 安裝部署Sqoop 177
7.1.1 下載或復制Sqoop安裝包 177
7.1.2 解壓并安裝Sqoop 177
7.1.3 配置Sqoop 178
7.1.4 啟動并驗證Sqoop 180
7.1.5 測試Sqoop與MySQL的連接 180
7.2 安裝部署Kafka集群 182
7.2.1 下載或復制Kafka安裝包 182
7.2.2 解壓縮Kafka安裝包 182
7.2.3 配置Kafka集群 183
7.2.4 Kafka的初步應用 184
7.3 本章小結 188
第8章 Spark集群的安裝與開發環境的配置 189
8.1 深入理解Spark 189
8.1.1 Spark的系統架構 189
8.1.2 Spark的關鍵概念 191
8.2 Scala的安裝與配置 193
8.2.1 下載Scala安裝包 194
8.2.2 安裝Scala 194
8.2.3 啟動并應用Scala 195
8.3 Spark集群的安裝與配置 195
8.3.1 安裝模式 195
8.3.2 Spark的安裝 196
8.3.3 啟動并驗證Spark 198
8.3.4 幾點說明 202
8.4 IDEA開發環境的安裝與配置 203
8.4.1 IDEA簡介 203
8.4.2 IDEA的安裝 204
8.4.3 IDEA的配置 205
8.5 本章小結 208
第9章 Spark應用基礎 209
9.1 Spark應用程序的運行模式 209
9.1.1 Spark on Yarn-cluster- 209
9.1.2 Spark on Yarn-client 210
9.2 Spark的應用設計 211
9.2.1 分布式估算圓周率 211
9.2.2 基于Spark MLlib的貸款風險預測 226
9.3 本章小結 242
第三篇 大數據處理與項目開發 243
第10章 交互式數據處理 245
10.1 數據預處理 245
10.1.1 查看數據 245
10.1.2 數據擴展 247
10.1.3 數據過濾 247
10.1.4 數據上傳 248
10.2 創建數據倉庫 249
10.2.1 創建Hive數據倉庫的基本命令 249
10.2.2 創建Hive分區表 251
10.3 數據分析 253
10.3.1 基本統計 253
10.3.2 用戶行為分析 254
10.3.3 實時數據 256
10.4 本章小結 256
第11章 協同過濾推薦系統 257
11.1 推薦算法概述 257
11.1.1 基于人口統計學的推薦 257
11.1.2 基于內容的推薦 258
11.1.3 協同過濾推薦 258
11.2 協同過濾推薦算法分析 259
11.2.1 基于用戶的協同過濾推薦 259
11.2.2 基于物品的協同過濾推薦 261
11.3 Spark MLlib推薦算法應用 262
11.3.1 ALS算法原理 262
11.3.2 ALS的應用設計 264
11.4 本章小結 277
第12章 銷售數據分析系統 279
12.1 數據采集 279
12.1.1 在Windows平臺安裝JDK 279
12.1.2 在Windows平臺安裝Eclipse 281
12.1.3 將WebCollector項目導入Eclipse 282
12.1.4 在Windows平臺安裝MySQL 283
12.1.5 連接JDBC 286
12.1.6 運行爬蟲程序 286
12.2 在HBase集群上準備數據 287
12.2.1 將數據導入MySQL 287
12.2.2 將MySQL表中的數據導入HBase集群 289
12.3 安裝Phoenix中間件 291
12.3.1 Phoenix架構 291
12.3.2 解壓安裝Phoenix 293
12.3.3 Phoenix環境配置 293
12.3.4 使用Phoenix 294
12.4 基于Web的前端開發 298
12.4.1 將Web前端項目導入Eclipse 298
12.4.2 安裝Tomcat 300
12.4.3 在Eclipse中配置Tomcat 300
12.4.4 在Web瀏覽器中查看執行結果 303
12.5 本章小結 305
參考文獻307
展開全部

大數據科學與應用叢書HADOOP大數據實戰權威指南(第2版) 作者簡介

黃東軍,男,教授,博士,博士生導師。畢業于中南大學計算機應用技術,先工作于中南大學信息科學與工程學院。中國計算機學會高級會員,教育部計算機科學與技術專業教學指導委員會"物聯網工程專業教學研究專家組”成員。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库-首页-东莞市傲马网络科技有限公司 | 网架支座@球铰支座@钢结构支座@成品支座厂家@万向滑动支座_桥兴工程橡胶有限公司 | 网架支座@球铰支座@钢结构支座@成品支座厂家@万向滑动支座_桥兴工程橡胶有限公司 | 工业CT-无锡璟能智能仪器有限公司 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 纯化水设备-纯水设备-超纯水设备-[大鹏水处理]纯水设备一站式服务商-东莞市大鹏水处理科技有限公司 | CCC验厂-家用电器|服务器CCC认证咨询-奥测世纪 | 小青瓦丨古建筑瓦丨青瓦厂家-宜兴市徽派古典建筑材料有限公司 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | 电子万能试验机_液压拉力试验机_冲击疲劳试验机_材料试验机厂家-济南众标仪器设备有限公司 | 安徽合肥格力空调专卖店_格力中央空调_格力空调总经销公司代理-皖格制冷设备 | 超细粉碎机|超微气流磨|气流分级机|粉体改性设备|超微粉碎设备-山东埃尔派粉碎机厂家 | 威海防火彩钢板,威海岩棉复合板,威海彩钢瓦-文登区九龙岩棉复合板厂 | 联系我们-腾龙公司上分客服微信19116098882 | 培训中心-翰香原香酥板栗饼加盟店总部-正宗板栗酥饼技术 | 气动隔膜阀_气动隔膜阀厂家_卫生级隔膜阀价格_浙江浙控阀门有限公司 | 上海乾拓贸易有限公司-日本SMC电磁阀_德国FESTO电磁阀_德国FESTO气缸 | 广东西屋电气有限公司-广东西屋电气有限公司 | 桂林腻子粉_内墙外墙抗裂砂浆腻子粉推荐广西鑫达涂料厂家供应 | 物流公司电话|附近物流公司电话上门取货 | 金属清洗剂,防锈油,切削液,磨削液-青岛朗力防锈材料有限公司 | 上海APP开发-APP制作-APP定制开发-上海APP开发制作公司-咏熠科技 | 正压密封性测试仪-静态发色仪-导丝头柔软性测试仪-济南恒品机电技术有限公司 | 天津市能谱科技有限公司-专业的红外光谱仪_红外测油仪_紫外测油仪_红外制样附件_傅里叶红外光谱技术生产服务厂商 | 郑州水质检测中心_井水检测_河南废气检测_河南中环嘉创检测 | 热风机_工业热风机生产厂家上海冠顶公司提供专业热风机图片价格实惠 | 厦门ISO认证|厦门ISO9001认证|厦门ISO14001认证|厦门ISO45001认证-艾索咨询专注ISO认证行业 | 胶原检测试剂盒,弹性蛋白检测试剂盒,类克ELISA试剂盒,阿达木单抗ELISA试剂盒-北京群晓科苑生物技术有限公司 | 不锈钢水管-不锈钢燃气管-卫生级不锈钢管件-不锈钢食品级水管-广东双兴新材料集团有限公司 | 郑州宣传片拍摄-TVC广告片拍摄-微电影短视频制作-河南优柿文化传媒有限公司 | 二手色谱仪器,十万分之一分析天平,蒸发光检测器,电位滴定仪-湖北捷岛科学仪器有限公司 | 网站制作优化_网站SEO推广解决方案-无锡首宸信息科技公司 | 南京种植牙医院【官方挂号】_南京治疗种植牙医院那个好_南京看种植牙哪里好_南京茀莱堡口腔医院 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 低噪声电流前置放大器-SR570电流前置放大器-深圳市嘉士达精密仪器有限公司 | 派克防爆伺服电机品牌|国产防爆伺服电机|高低温伺服电机|杭州摩森机电科技有限公司 | 马尔表面粗糙度仪-MAHR-T500Hommel-Mitutoyo粗糙度仪-笃挚仪器 | 油冷式_微型_TDY电动滚筒_外装_外置式电动滚筒厂家-淄博秉泓机械有限公司 | Dataforth隔离信号调理模块-信号放大模块-加速度振动传感器-北京康泰电子有限公司 | 密度电子天平-内校-外校电子天平-沈阳龙腾电子有限公司 | 网优资讯-为循环资源、大宗商品、工业服务提供资讯与行情分析的数据服务平台 | 槽钢冲孔机,槽钢三面冲,带钢冲孔机-山东兴田阳光智能装备股份有限公司 |