-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
HCIA-BIG DATA學習指南 版權信息
- ISBN:9787115649355
- 條形碼:9787115649355 ; 978-7-115-64935-5
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
HCIA-BIG DATA學習指南 本書特色
1.本書是華為HCIA-Big Data認證的官方教材,內容專業、可靠。
2.本書采用大量的實踐案例,并結合了行業典型應用。
3.本書從基礎概念到核心技術,再到解決方案,全方位覆蓋大數據知識體系。
4.本書介紹前沿技術如ClickHouse與ElasticSearch,拓寬讀者視野,緊跟技術發展趨勢。
5.本書提供豐富的教學資源,如電子課件等。
HCIA-BIG DATA學習指南 內容簡介
本書以大數據為中心,對大數據及其相關技術、產品和實踐案例進行了詳細的講解。全書共分9章,從大數據概述、華為大數據產品入手,詳細介紹了開源的分布式計算框架——Hadoop,以及Hadoop生態圈的多個組件:Flume、Kafka、HDFS、Zookeeper、MapReduce、YARN、HBase、Hive、Spark以及Flink;除上述組件外,還介紹了ElasticSearch和ClickHouse。 本書適合正在準備考取華為HCIA-Big Data認證的人員、從事大數據工作的專業人員閱讀,也可作為高等院校相關專業師生的參考書。
HCIA-BIG DATA學習指南 目錄
1.1 什么是大數據 4
1.1.1 大數據的來源 4
1.1.2 大數據的發展歷程 6
1.2 大數據的數據特征及數據類型 7
1.3 華為鯤鵬大數據 12
1.4 大數據的發展趨勢 14
1.5 華為DataArts Studio 15
1.5.1 什么是DataArts Studio 16
1.5.2 DataArts Studio產品功能 16
1.5.3 DataArts Studio應用場景 18
1.6 華為云大數據服務——MRS 21
習題 24
第 2章 大數據采集與分布式流處理平臺 26
2.1 大數據采集技術 28
2.2 Flume 29
2.2.1 Flume簡介及框架 29
2.2.2 Flume的關鍵特性 32
2.2.3 Flume應用舉例 33
2.3 Kafka 33
2.3.1 Kafka簡介 34
2.3.2 Kafka的架構與功能 36
2.3.3 Kafka數據管理 40
習題 42
第3章 大數據分布式處理概述 44
3.1 大數據開發與分布式技術簡介 46
3.1.1 大數據開發 47
3.1.2 分布式管理技術 49
3.2 Hadoop——分布式大數據系統 50
3.2.1 Hadoop簡介 50
3.2.2 Hadoop 3.x 53
3.3 Hadoop的體系架構 55
3.4 Hadoop與分布式開發 58
3.5 Hadoop的生態系統 60
習題 68
第4章 HDFS分布式文件系統和ZooKeeper 70
4.1 分布式文件系統 72
4.1.1 分布式文件系統的設計思路 72
4.1.2 *早的分布式文件系統 73
4.1.3 大數據環境下分布式文件系統的優化思路 75
4.2 HDFS的體系架構及特點 76
4.2.1 HDFS的體系架構 76
4.2.2 HDFS的特點 78
4.3 HDFS的完整性 79
4.3.1 校驗和 79
4.3.2 運行后臺進程來檢測數據塊 79
4.4 HDFS數據的讀/寫流程 80
4.5 HDFS的常用工具 83
4.5.1 FsShell實現 83
4.5.2 DFSAdmin實現 84
4.6 ZooKeeper分布式協調服務 86
4.6.1 ZooKeeper概述 86
4.6.2 ZooKeeper的體系結構 87
4.6.3 ZooKeeper奇數節點和偶數節點 89
習題 90
第5章 分布式計算——MapReduce和YARN 92
5.1 什么是MapReduce 94
5.2 MapReduce編程模型 95
5.2.1 MapReduce簡單模型 96
5.2.2 MapReduce復雜模型 97
5.2.3 WordCount案例 98
5.3 MapReduce數據流及任務流 101
5.3.1 MapReduce數據流 101
5.3.2 MapReduce任務流 104
5.4 YARN概述 106
5.5 YARN的基本框架 107
5.6 YARN的工作流程 110
習題 112
第6章 分布式數據庫技術——HBase 114
6.1 海量數據與NoSQL 116
6.1.1 關系數據庫的局限 116
6.1.2 CAP理論 116
6.1.3 NoSQL 118
6.2 HBase簡介 119
6.3 HBase表視圖 122
6.3.1 HBase邏輯視圖 122
6.3.2 HBase物理視圖 123
6.4 HBase物理存儲模型 126
6.5 HBase的基本操作 127
6.5.1 HBase Shell的命令 127
6.5.2 general操作 128
6.5.3 DDL(數據定義語言)操作 129
習題 131
第7章 分布式數據倉庫技術——Hive 134
7.1 什么是Hive 136
7.1.1 Hive的本質 136
7.1.2 Hive的基礎架構 137
7.2 Hive的安全性 140
7.2.1 默認授權模式 140
7.2.2 基于存儲的授權模式 140
7.2.3 基于SQL標準的授權模式 141
7.3 Hive Shell 141
7.4 Hive的性能調優 145
7.4.1 分區表 146
7.4.2 存儲優化 147
7.4.3 矢量化查詢優化 148
7.5 HQL簡介 149
7.5.1 認識HQL 149
7.5.2 Hive管理數據的方式 150
習題 151
第8章 ClickHouse與ElasticSearch分布式搜索 152
8.1 ClickHouse概述 154
8.2 ClickHouse的架構及其基本特性 155
8.2.1 ClickHouse的架構 155
8.2.2 ClickHouse的基本特性 157
8.3 ClickHouse的使用案例 159
8.4 ElasticSearch簡介 166
8.5 ElasticSearch的架構及其基本特性 170
8.5.1 ElasticSearch的架構 170
8.5.2 ElasticSearch的基本特性 172
8.6 ElasticSearch的使用案例 173
習題 179
第9章 大數據實時處理技術 182
9.1 Spark——分布式技術 184
9.1.1 Spark概述與架構 184
9.1.2 彈性分布式數據集 186
9.1.3 Spark的擴展功能 188
9.1.4 Spark的應用舉例 190
9.2 Flink——分布式實時處理引擎 192
9.2.1 Flink的原理與架構 193
9.2.2 Flink的運行架構 195
9.2.3 Flink應用舉例 197
習題 202
HCIA-BIG DATA學習指南 作者簡介
華為技術有限公司 華為技術有限公司,成立于1987年,總部位于廣東省深圳市龍崗區。華為是全球領先的信息與通信技術(ICT)解決方案供應商,專注于ICT領域,堅持穩健經營、持續創新、開放合作,在電信運營商、企業、終端和云計算等領域構筑了端到端的解決方案優勢,為運營商客戶、企業客戶和消費者提供有競爭力的ICT解決方案、產品和服務,并致力于實現未來信息社會、構建更美好的全聯接世界。
- >
我從未如此眷戀人間
- >
苦雨齋序跋文-周作人自編集
- >
巴金-再思錄
- >
羅曼·羅蘭讀書隨筆-精裝
- >
【精裝繪本】畫給孩子的中國神話
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
小考拉的故事-套裝共3冊
- >
有舍有得是人生