-
>
闖進數(shù)學(xué)世界――探秘歷史名題
-
>
中醫(yī)基礎(chǔ)理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學(xué)·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
HADOOP大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版) 版權(quán)信息
- ISBN:9787302633969
- 條形碼:9787302633969 ; 978-7-302-63396-9
- 裝幀:平裝
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
HADOOP大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版) 本書特色
本書附有配套視頻、教學(xué)PPT、教學(xué)設(shè)計、測試題等資源,同時,為了幫助初學(xué)者更好地學(xué)習(xí)本書中的內(nèi)容,還提供了在線答疑,歡迎讀者關(guān)注。
HADOOP大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版) 內(nèi)容簡介
本書以Hadoop 3.x為主線,全面介紹Hadoop及其生態(tài)體系中常用的大數(shù)據(jù)開源項目的安裝和使用。全書共11章,分別講解大數(shù)據(jù)概念、Hadoop基礎(chǔ)知識、Hadoop集群部署、HDFS、MapReduce、YARN、ZooKeeper、Hive、Flume、Azkaban和Sqoop,并在*后開發(fā)一個完整的網(wǎng)站流量日志分析系統(tǒng),幫助讀者鞏固前面所學(xué)的內(nèi)容。 本書附有配套視頻、教學(xué)課件、教學(xué)設(shè)計、測試題等資源;同時,為了幫助初學(xué)者更好地學(xué)習(xí)本書的內(nèi)容,還提供在線答疑,歡迎讀者關(guān)注。 本書可作為高等教育本科院校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)及相關(guān)專業(yè)的教材,并適合大數(shù)據(jù)開發(fā)初學(xué)者、大數(shù)據(jù)運維人員以及大數(shù)據(jù)分析與挖掘領(lǐng)域的從業(yè)者閱讀。
HADOOP大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版) 目錄
1.1大數(shù)據(jù)概述1
1.1.1什么是大數(shù)據(jù)1
1.1.2大數(shù)據(jù)的數(shù)據(jù)類型2
1.1.3大數(shù)據(jù)的特征2
1.1.4研究大數(shù)據(jù)的意義3
1.2大數(shù)據(jù)的應(yīng)用場景3
1.2.1醫(yī)療行業(yè)的應(yīng)用3
1.2.2金融行業(yè)的應(yīng)用4
1.2.3零售行業(yè)的應(yīng)用4
1.3Hadoop概述5
1.3.1Hadoop的前世今生5
1.3.2Hadoop的優(yōu)點6
1.3.3Hadoop的缺點6
1.3.4Hadoop的生態(tài)體系6
1.3.5Hadoop架構(gòu)變遷8
1.4本章小結(jié)10
1.5課后習(xí)題10
第2章部署Hadoop11
2.1安裝準備11
2.1.1創(chuàng)建虛擬機11
2.1.2克隆虛擬機21
2.1.3配置虛擬機23
2.1.4安裝JDK31
2.2Hadoop集群部署模式33
2.3基于偽分布式模式部署
Hadoop34
2.4基于完全分布式模式部署
Hadoop40
2.5案例——詞頻統(tǒng)計47
2.6本章小結(jié)50
2.7課后習(xí)題51
第3章HDFS分布式文件系統(tǒng)52
3.1文件系統(tǒng)的分類52
3.2HDFS簡介54
3.2.1HDFS架構(gòu)54
3.2.2HDFS的特點56
3.3HDFS的文件讀寫流程57
3.4HDFS的健壯性59
3.5HDFS的Shell操作60
3.5.1HDFS Shell介紹60
3.5.2案例——通過Shell腳本定
時采集數(shù)據(jù)到HDFS …68
3.6HDFS的Java API操作72
3.6.1HDFS的Java API
介紹72
3.6.2案例——使用Java API
操作HDFS73
3.7Federation機制82
3.7.1Federation機制的實現(xiàn)
原理82
3.7.2Federation機制的
特點84
3.7.3Federation機制的
實現(xiàn)84
3.8Erasure Coding 88
3.9本章小結(jié)91
3.10課后習(xí)題92目錄Hadoop大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版)第4章MapReduce分布式計算框架…93
4.1MapReduce概述93
4.2MapReduce編程模型94
4.3MapReduce工作原理96
4.3.1MapReduce工作過程 … 96
4.3.2MapTask工作原理97
4.3.3ReduceTask工作
原理 98
4.3.4Shuffle工作原理99
4.4MapReduce編程組件100
4.4.1InputFormat組件100
4.4.2Mapper組件101
4.4.3Reducer組件103
4.4.4Partitioner組件104
4.4.5OutputFormat
組件106
4.5MapReduce驅(qū)動類107
4.6MapReduce性能優(yōu)化策略 …110
4.7YARN資源管理框架112
4.7.1YARN基本架構(gòu)112
4.7.2YARN工作流程113
4.8MapReduce經(jīng)典案例——數(shù)據(jù)
去重114
4.8.1案例分析114
4.8.2案例實現(xiàn)116
4.9MapReduce經(jīng)典案例——
TopN118
4.9.1案例分析118
4.9.2案例實現(xiàn)119
4.10MapReduce經(jīng)典案例——
倒排索引121
4.10.1倒排索引介紹121
4.10.2案例分析122
4.10.3案例實現(xiàn)124
4.11本章小結(jié)129
4.12課后習(xí)題130
第5章ZooKeeper分布式協(xié)調(diào)服務(wù) … 131
5.1ZooKeeper簡介131
5.1.1ZooKeeper特性132
5.1.2ZooKeeper集群架構(gòu) …132
5.2ZooKeeper數(shù)據(jù)模型133
5.3ZooKeeper典型應(yīng)用場景134
5.4ZooKeeper的Watcher機制 …135
5.5ZooKeeper的選舉機制136
5.6部署ZooKeeper集群138
5.6.1基于偽分布式模式部署
ZooKeeper集群139
5.6.2基于完全分布式模式部署
ZooKeeper集群142
5.7ZooKeeper的Shell操作146
5.8ZooKeeper的Java API操作 …153
5.8.1創(chuàng)建會話153
5.8.2操作ZooKeeper154
5.9本章小結(jié)160
5.10課后習(xí)題160
第6章Hadoop高可用集群161
6.1HDFS高可用集群161
6.2YARN高可用集群163
6.3部署Hadoop高可用集群164
6.4本章小結(jié)180
6.5課后習(xí)題180
第7章Hive數(shù)據(jù)倉庫181
7.1數(shù)據(jù)倉庫簡介181
7.1.1什么是數(shù)據(jù)倉庫181
7.1.2數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)182
7.1.3數(shù)據(jù)倉庫分層183
7.1.4數(shù)據(jù)倉庫模型184
7.2Hive簡介185
7.2.1Hive與傳統(tǒng)關(guān)系數(shù)據(jù)庫
的區(qū)別185
7.2.2Hive系統(tǒng)架構(gòu)186
7.2.3Hive工作原理187
7.2.4Hive數(shù)據(jù)存儲模型 …188
7.3Hive的部署189
7.3.1內(nèi)嵌模式189
7.3.2本地模式192
7.3.3遠程模式197
7.4Hive數(shù)據(jù)類型200
7.5數(shù)據(jù)庫操作202
7.5.1創(chuàng)建數(shù)據(jù)庫202
7.5.2查看數(shù)據(jù)庫信息203
7.5.3修改數(shù)據(jù)庫屬性204
7.5.4刪除數(shù)據(jù)庫204
7.6表操作205
7.6.1創(chuàng)建表205
7.6.2查看表208
7.6.3修改表209
7.6.4刪除表211
7.6.5修改分區(qū)212
7.7數(shù)據(jù)操作215
7.7.1導(dǎo)入數(shù)據(jù)215
7.7.2向分區(qū)導(dǎo)入數(shù)據(jù)218
7.7.3查詢數(shù)據(jù)221
7.7.4查詢插入228
7.7.5關(guān)聯(lián)查詢230
7.8本章小結(jié)233
7.9課后習(xí)題233
第8章Flume日志采集系統(tǒng)235
8.1Flume概述235
8.2Flume日志采集系統(tǒng)結(jié)構(gòu)236
8.3Flume的部署238
8.4Flume的基本使用239
8.5Flume的采集方案242
8.5.1Flume Sources243
8.5.2Flume Channels245
8.5.3Flume Sinks247
8.6Flume攔截器251
8.7Flume的可靠性保證253
8.7.1負載均衡253
8.7.2故障恢復(fù)259
8.8案例——將日志采集到
HDFS263
8.8.1案例分析264
8.8.2案例實現(xiàn)264
8.9本章小結(jié)271
8.10課后習(xí)題271
第9章Azkaban工作流管理器272
9.1工作流管理器概述272
9.2Azkaban概述273
9.3部署Azkaban274
9.3.1Azkaban部署模式274
9.3.2安裝Azkaban274
9.3.3配置Azkaban276
9.3.4啟動Azkaban279
9.4Azkaban的使用283
9.4.1Azkaban的常用
概念283
9.4.2案例演示——依賴任務(wù)
調(diào)度管理284
9.4.3案例演示——MapReduce
程序調(diào)度管理290
9.4.4案例演示——Hive腳本
任務(wù)調(diào)度管理295
9.5本章小結(jié)299
9.6課后習(xí)題299
第10章Sqoop數(shù)據(jù)遷移301
10.1Sqoop概述301
10.1.1Sqoop簡介301
10.1.2Sqoop原理302
10.2Sqoop安裝配置303
10.3Sqoop命令介紹305
10.4Sqoop數(shù)據(jù)的導(dǎo)入306
10.4.1數(shù)據(jù)準備307
10.4.2MySQL導(dǎo)入
HDFS 308
10.4.3增量導(dǎo)入310
10.4.4MySQL導(dǎo)入Hive …311
10.4.5MySQL過濾導(dǎo)入
HDFS312
10.5Sqoop數(shù)據(jù)的導(dǎo)出314
10.6本章小結(jié)315
10.7課后習(xí)題316
第11章綜合項目——網(wǎng)站流量日志
數(shù)據(jù)分析系統(tǒng)31711.1系統(tǒng)概述317
11.1.1系統(tǒng)背景介紹317
11.1.2需求分析317
11.1.3系統(tǒng)架構(gòu)318
11.2模塊開發(fā)319
11.3本章小結(jié)319
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
李白與唐代文化
- >
莉莉和章魚
- >
自卑與超越
- >
名家?guī)阕x魯迅:故事新編
- >
有舍有得是人生
- >
隨園食單
- >
中國歷史的瞬間