-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
機械工業出版社HADOOP大數據挖掘從入門到進階實戰(視頻教學版) 版權信息
- ISBN:9787111600107
- 條形碼:9787111600107 ; 978-7-111-60010-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
機械工業出版社HADOOP大數據挖掘從入門到進階實戰(視頻教學版) 本書特色
本書采用“理論 實戰”的形式編寫,全面介紹了Hadoop大數據挖掘的相關知識。本書共分為13章,涵蓋的主要內容有:集群及開發環境搭建;快速構建一個Hadoop項目并線上運行;Hadoop套件實戰;Hive編程——使用SQL提交MapReduce任務到Hadoop集群;游戲玩家的用戶行為分析——特征提取;Hadoop平臺管理與維護;Hadoop異常處理解決方案;初識Hadoop核心源碼;Hadoop通信機制和內部協議;Hadoop分布式文件系統剖析;ELK實戰案例——游戲應用實時日志分析平臺;Kafka實戰案例——實時處理游戲用戶數據;Hadoop拓展——Kafka剖析。本書不但適合剛入門的初學者系統學習Hadoop的各種基礎語法和開發技巧,而且也適合有多年開發經驗的開發者進階提高。另外,本書也適合社會培訓機構和相關院校作為教材或者教學參考書。
機械工業出版社HADOOP大數據挖掘從入門到進階實戰(視頻教學版) 內容簡介
本書采用“理論+實戰”的形式編寫,全面介紹了Hadoop大數據挖掘的相關知識。本書共分為13章,涵蓋的主要內容有:集群及開發環境搭建;快速構建一個Hadoop項目并線上運行;Hadoop套件實戰;Hive編程——使用SQL提交MapReduce任務到Hadoop集群;游戲玩家的用戶行為分析——特征提取;Hadoop平臺管理與維護;Hadoop異常處理解決方案;初識Hadoop核心源碼;Hadoop通信機制和內部協議;Hadoop分布式文件系統剖析;ELK實戰案例——游戲應用實時日志分析平臺;Kafka實戰案例——實時處理游戲用戶數據;Hadoop拓展——Kafka剖析。本書不但適合剛入門的初學者系統學習Hadoop的各種基礎語法和開發技巧,而且也適合有多年開發經驗的開發者進階提高。另外,本書也適合社會培訓機構和相關院校作為教材或者教學參考書。
機械工業出版社HADOOP大數據挖掘從入門到進階實戰(視頻教學版) 目錄
前言
第1章 集群及開發環境搭建1
1.1 環境準備1
1.1.1 基礎軟件下載1
1.1.2 準備Linux操作系統2
1.2 安裝Hadoop4
1.2.1 基礎環境配置4
1.2.2 Zookeeper部署7
1.2.3 Hadoop部署9
1.2.4 效果驗證21
1.2.5 集群架構詳解24
1.3 Hadoop版Hello World25
1.3.1 Hadoop Shell介紹25
1.3.2 WordCount初體驗27
1.4 開發環境28
1.4.1 搭建本地開發環境28
1.4.2 運行及調試預覽31
1.5 小結34
第2章 實戰:快速構建一個Hadoop項目并線上運行35
2.1 構建一個簡單的項目工程35
2.1.1 構建Java Project結構工程35
2.1.2 構建Maven結構工程36
2.2 操作分布式文件系統(HDFS)39
2.2.1 基本的應用接口操作39
2.2.2 在高可用平臺上的使用方法42
2.3 利用IDE提交MapReduce作業43
2.3.1 在單點上的操作43
2.3.2 在高可用平臺上的操作46
2.4 編譯應用程序并打包51
2.4.1 編譯Java Project工程并打包51
2.4.2 編譯Maven工程并打包55
2.5 部署與調度58
2.5.1 部署應用58
2.5.2 調度任務59
2.6 小結60
第3章 Hadoop套件實戰61
3.1 Sqoop——數據傳輸工具61
3.1.1 背景概述61
3.1.2 安裝及基本使用62
3.1.3 實戰:在關系型數據庫與分布式文件系統之間傳輸數據64
3.2 Flume——日志收集工具66
3.2.1 背景概述67
3.2.2 安裝與基本使用67
3.2.3 實戰:收集系統日志并上傳到分布式文件系統(HDFS)上72
3.3 HBase——分布式數據庫74
3.3.1 背景概述74
3.3.2 存儲架構介紹75
3.3.3 安裝與基本使用75
3.3.4 實戰:對HBase業務表進行增、刪、改、查操作79
3.4 Zeppelin——數據集分析工具85
3.4.1 背景概述85
3.4.2 安裝與基本使用85
3.4.3 實戰:使用解釋器操作不同的數據處理引擎88
3.5 Drill——低延時SQL查詢引擎92
3.5.1 背景概述93
3.5.2 安裝與基本使用93
3.5.3 實戰:對分布式文件系統(HDFS)使用SQL進行查詢95
3.5.4 實戰:使用SQL查詢HBase數據庫99
3.5.5 實戰:對數據倉庫(Hive)使用類實時統計、查詢操作101
3.6 Spark——實時流數據計算104
3.6.1 背景概述104
3.6.2 安裝部署及使用105
3.6.3 實戰:對接Kafka消息數據,消費、計算及落地108
3.7 小結114
第4章 Hive編程——使用SQL提交MapReduce任務到Hadoop集群115
4.1 環境準備與Hive初識115
4.1.1 背景介紹115
4.1.2 基礎環境準備116
4.1.3 Hive結構初識116
4.1.4 Hive與關系型數據庫(RDBMS)118
4.2 安裝與配置Hive118
4.2.1 Hive集群基礎架構119
4.2.2 利用HAProxy實現Hive Server負載均衡120
4.2.3 安裝分布式Hive集群123
4.3 可編程方式126
4.3.1 數據類型126
4.3.2 存儲格式128
4.3.3 基礎命令129
4.3.4 Java編程語言操作數據倉庫(Hive)131
4.3.5 實踐Hive Streaming134
4.4 運維和監控138
4.4.1 基礎命令138
4.4.2 監控工具Hive Cube140
4.5 小結143
第5章 游戲玩家的用戶行為分析——特征提取144
5.1 項目應用概述144
5.1.1 場景介紹144
5.1.2 平臺架構與數據采集145
5.1.3 準備系統環境和軟件147
5.2 分析與設計148
5.2.1 整體分析148
5.2.2 指標與數據源分析149
5.2.3 整體設計151
5.3 技術選型153
5.3.1 套件選取簡述154
5.3.2 套件使用簡述154
5.4 編碼實踐157
5.4.1 實現代碼157
5.4.2 統計結果處理163
5.4.3 應用調度169
5.5 小結174
第6章 Hadoop平臺管理與維護175
6.1 Hadoop分布式文件系統(HDFS)175
6.1.1 HDFS特性175
6.1.2 基礎命令詳解176
6.1.3 解讀NameNode Standby179
6.2 Hadoop平臺監控182
6.2.1 Hadoop日志183
6.2.2 常用分布式監控工具187
6.3 平臺維護196
6.3.1 安全模式196
6.3.2 節點管理198
6.3.3 HDFS快照200
6.4 小結203
第7章 Hadoop異常處理解決方案204
7.1 定位異常204
7.1.1 跟蹤日志204
7.1.2 分析異常信息208
7.1.3 閱讀開發業務代碼209
7.2 解決問題的方式210
7.2.1 搜索關鍵字211
7.2.2 查看Hadoop JIRA212
7.2.3 閱讀相關源碼213
7.3 實戰案例分析216
7.3.1 案例分析1:啟動HBase失敗216
7.3.2 案例分析2:HBase表查詢失敗219
7.3.3 案例分析3:Spark的臨時數據不自動清理222
7.4 小結223
第8章 初識Hadoop核心源碼224
8.1 基礎準備與源碼編譯224
8.1.1 準備環境224
8.1.2 加載源碼228
8.1.3 編譯源碼230
8.2 初識Hadoop 2233
8.2.1 Hadoop的起源233
8.2.2 Hadoop 2源碼結構圖234
8.2.3 Hadoop模塊包235
8.3 MapReduce框架剖析236
8.3.1 **代MapReduce框架236
8.3.2 第二代MapReduce框架238
8.3.3 兩代MapReduce框架的區別239
8.3.4 第二代MapReduce框架的重構思路240
8.4 序列化241
8.4.1 序列化的由來242
8.4.2 Hadoop序列化243
8.4.3 Writable實現類245
8.5 小結247
第9章 Hadoop通信機制和內部協議248
9.1 Hadoop RPC概述248
9.1.1 通信模型248
9.1.2 Hadoop RPC特點250
9.2 Hadoop R
機械工業出版社HADOOP大數據挖掘從入門到進階實戰(視頻教學版) 作者簡介
鄧杰,博客園資深博主,資深大數據全棧開發者,極客學院大數據講師,開源愛好者。善于開發大數據監控系統輔助日常工作,提升工作效率。主導開發了大數據自助類平臺系統。開發并在GitHub上發布了Kafka系統監控管理工具Kafka Eagle,深受業內開發者的贊譽。作為極客學院特邀講師,制作了多個技術視頻,講授Hadoop和Kafka等相關技術課程,廣受學員好評。
- >
名家帶你讀魯迅:故事新編
- >
唐代進士錄
- >
自卑與超越
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
巴金-再思錄
- >
我與地壇
- >
名家帶你讀魯迅:朝花夕拾
- >
伯納黛特,你要去哪(2021新版)