-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
HADOOP專家:管理.調優與SPARKYARNHDFS安全 版權信息
- ISBN:9787121356698
- 條形碼:9787121356698 ; 978-7-121-35669-8
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
HADOOP專家:管理.調優與SPARKYARNHDFS安全 本書特色
本書翻譯自Sam R. Alapati 的Expert Hadoop Administration。Sam R. Alapati 是Sabre 公司的首席Hadoop 管理員,具有多年的Hadoop 運維管理經驗。他希望通過本書,為Hadoop 集群開發與管理人員提供一些有益指導。從事Hadoop 的管理工作,首先要了解Hadoop 的架構,只進行單純的操作并不能被稱為合格的管理員。基于此,本書在介紹Hadoop 及其生態組件時,都會首先介紹其架構,以期讀者能夠在更高的層次認識管理工作。本書首先介紹了Hadoop 的整體架構及其部署與使用;然后著重介紹了兩個重要的計算引擎MapReduce 與Spark ;接著介紹了Hadoop 的數據存儲與安全、數據均衡等特性;*后則介紹了如何進行參數調優與故障排除。整個流程下來,讀者能夠建立起完整的關于Hadoop 管理的體系架構。
HADOOP專家:管理.調優與SPARKYARNHDFS安全 內容簡介
本書翻譯自Sam R. Alapati 的Expert Hadoop Administration。Sam R. Alapati 是Sabre 公司的首席Hadoop 管理員,具有多年的Hadoop 運維管理經驗。他希望通過本書,為Hadoop 集群開發與管理人員提供一些有益指導。從事Hadoop 的管理工作,首先要了解Hadoop 的架構,只進行單純的操作并不能被稱為合格的管理員;诖,本書在介紹Hadoop 及其生態組件時,都會首先介紹其架構,以期讀者能夠在更高的層次認識管理工作。本書首先介紹了Hadoop 的整體架構及其部署與使用;然后著重介紹了兩個重要的計算引擎MapReduce 與Spark ;接著介紹了Hadoop 的數據存儲與安全、數據均衡等特性;很后則介紹了如何進行參數調優與故障排除。整個流程下來,讀者能夠建立起完整的關于Hadoop 管理的體系架構。
HADOOP專家:管理.調優與SPARKYARNHDFS安全 目錄
第Ⅰ部分 Hadoop架構與Hadoop集群介紹
第1章 Hadoop與Hadoop環境介紹............................................................................... 3
Hadoop簡介.........................................................................................................................4
Hadoop 的特性............................................................................................................5
Hadoop 與大數據........................................................................................................5
Hadoop 的典型應用場景............................................................................................6
傳統數據庫系統..........................................................................................................7
數據湖..........................................................................................................................9
大數據、數據科學和Hadoop ..................................................................................10
Hadoop集群與集群計算................................................................................................... 11
集群計算.................................................................................................................... 11
Hadoop 集群..............................................................................................................12
Hadoop組件和Hadoop生態..............................................................................................14
Hadoop管理員需要做些什么...........................................................................................16
Hadoop 管理—新的范式......................................................................................17
關于Hadoop 管理你需要知道的.............................................................................18
Hadoop 管理員的工具集..........................................................................................19
Hadoop 1和Hadoop 2的關鍵區別....................................................................................19
架構區別....................................................................................................................20
高可用性....................................................................................................................20
多計算引擎................................................................................................................21
xiv 目錄
分離處理和調度........................................................................................................21
Hadoop 1 和Hadoop 2 中的資源分配.....................................................................22
分布式數據處理:MapReduce和Spark、Hive、Pig ......................................................22
MapReduce ................................................................................................................22
Apache Spark .............................................................................................................23
Apache Hive ...............................................................................................................24
Apache Pig .................................................................................................................24
數據整合:Apache Sqoop、Apache Flume和Apache Kafka ..........................................25
Hadoop管理中的關鍵領域...............................................................................................26
集群存儲管理............................................................................................................26
集群資源分配............................................................................................................26
作業調度....................................................................................................................27
Hadoop 數據安全......................................................................................................27
總結....................................................................................................................................28
第2章 Hadoop架構介紹............................................................................................. 31
Hadoop與分布式計算.......................................................................................................31
Hadoop 架構......................................................................................................................32
Hadoop 集群..............................................................................................................33
主節點和工作節點....................................................................................................33
Hadoop 服務..............................................................................................................34
數據存儲—Hadoop分布式文件系統...........................................................................35
HDFS 特性................................................................................................................35
HDFS 架構................................................................................................................36
HDFS 文件系統........................................................................................................38
NameNode 操作........................................................................................................41
利用YARN(Hadoop操作系統)進行數據處理...........................................................45
YARN 的架構............................................................................................................46
ApplicationMaster 如何與ResourceManager 協作進行資源分配..........................51
總結....................................................................................................................................54
第3章 創建和配置一個簡單的Hadoop集群................................................................ 55
Hadoop發行版本和安裝類型...........................................................................................56
目錄xv
Hadoop 發行版本......................................................................................................56
Hadoop 安裝類型......................................................................................................57
設置一個偽分布式Hadoop集群.......................................................................................58
滿足操作系統的要求................................................................................................58
修改內核參數............................................................................................................59
設置SSH ...................................................................................................................64
Java 需求....................................................................................................................65
安裝Hadoop ..............................................................................................................66
創建必要的Hadoop 用戶.........................................................................................66
創建必要的目錄........................................................................................................67
Hadoop初始配置...............................................................................................................67
環境變量配置文件....................................................................................................69
只讀默認配置文件....................................................................................................70
site 專用配置文件..............................................................
HADOOP專家:管理.調優與SPARKYARNHDFS安全 作者簡介
Sam R. Alapati,從事Hadoop相關工作6年。目前在Sabre任Principal Hadoop Administrator,負責大規模Hadoop集群的日常管理工作,主要對多個關鍵數據科學、數據分析Hadoop作業工作流進行管理。Sam R. Alapati還是一位Oracle DBA專家,在過去14年間出版了18部廣受好評的Oracle技術著作。
貝殼大數據架構團隊,負責公司大數據存儲平臺、計算平臺、實時數據流平臺的架構、性能調優、研發等,提供高效的大數據olap引擎,以及大數據工具鏈組件研發,為公司提供穩定、高效、開放的大數據基礎組件與基礎平臺。
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
我從未如此眷戀人間
- >
朝聞道
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
名家帶你讀魯迅:故事新編
- >
推拿
- >
伯納黛特,你要去哪(2021新版)
- >
莉莉和章魚