-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
Hadoop應用開發實戰詳解-深入云計算-修訂版 版權信息
- ISBN:9787113186258
- 條形碼:9787113186258 ; 978-7-113-18625-8
- 裝幀:一般輕型紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
Hadoop應用開發實戰詳解-深入云計算-修訂版 本書特色
本書由淺入深,全面、系統地介紹了hadoop這一高性能處理大量數據集的理想工具。本書內容主要包括hdfs、mapreduce、hive、hbase、mahout、pig、zookeeper、avro、chukwa等與hadoop相關的子項目,各個知識點都配有精心設計的大量經典的小案例,實戰性和可操作性強。 本書旨在幫助云計算初學者迅速掌握hadoop系統,提升讀者在云計算實踐中的應用和開發能力。同時本書極強的系統性和大量翔實的案例對于有一定基礎的中高級用戶有非常好的參考價值。
Hadoop應用開發實戰詳解-深入云計算-修訂版 內容簡介
精準的內容梯度安排:遵循讀者學習習慣和hadoop技術應用實踐,合理安排圖書內容;精挑細選經典實例,嵌入完善的代碼注釋。 精煉的實用經驗闡述:作者多年開發經驗融入其中,讀者在全面掌握hadoop編程和開發技術的同時更能獲得快速分析和解決實際問題的能力。 書中源代碼下載地址:http://www.tdpress.com/zyzx/tsscflwj 【本書的特點】 1.結構合理,內容系統全面;敘述翔實,例程豐富:在內容的安排上,根據讀者的學習習慣和內容的梯度合理安排,更加適合讀者學習。同時,本書有詳細的例程,每個例子都經過精挑細選,有很強的針對性。而且代碼非常簡潔和高效,便于讀者學習和調試,讀者也可以直接使用這些代碼來解決自己的問題。 2.基礎知識和實踐并重:本書不僅注重基礎知識,而且非常注重實踐,讓讀者快速上手,迅速掌握hadoop知識。 3.結合實際,實戰項目貫穿其中:本書寫作時特意給出了大量的實戰項目,這些項目的靈活使用,將會讓讀者事半功倍。同時,為了便于讀者高效、直觀地學習本書內容,對每章的內容的學習都特意編寫了思考與總結。
Hadoop應用開發實戰詳解-深入云計算-修訂版 目錄
第1章 初識hadoop
1.1 hadoop簡介
1.1.1 hadoop的起源
1.1.2 什么是hadoop
1.1.3 hadoop的核心技術是google核心技術的開源實現
1.1.4 hadoop的功能與優點
1.1.5 hadoop的應用現狀和發展趨勢
1.2 hadoop的體系結構
1.2.1 hdfs的體系結構
1.2.2 mapreduce的體系結構
1.3 hadoop與分布式開發
1.4 hadoop的數據管理
1.4.1 hdfs的數據管理
1.4.2 hbase的數據管理
1.4.3 hive的數據管理
1.5 思考與總結
第2章 hadoop的安裝和配置
2.1 在windows下安裝與配置hadoop
2.1.1 jdk的安裝
2.1.2 cygwin的安裝
2.1.3 hadoop的安裝
2.2 在linux下安裝與配置hadoop
2.2.1 ubuntu的安裝
2.2.2 jdk的安裝
2.2.3 hadoop的安裝
2.3 hadoop的執行實例
2.3.1 運行hadoop
2.3.2 運行wordcount.java程序
2.4 hadoop eclipse簡介和使用
2.4.1 eclipse插件介紹
2.4.2 eclipse插件開發配置
2.4.3 在eclipse下運行wordcount程序
2.5 hadoop的集群和優化
2.5.1 hadoop的性能優化
2.5.2 hadoop配置機架感知信息
2.6 思考與總結
第3章 hdfs海量存儲
3.1 開源的gfs——hdfs
3.1.1 hdfs簡介
3.1.2 hdfs的體系結構
3.1.3 hdfs的保障可靠性措施
3.2 hdfs的常用操作
3.2.1 hdfs下的文件操作
3.2.2 管理與更新
3.2.3 hdfs api詳解
3.2.4 hdfs的讀/寫數據流
3.3 用hdfs存儲海量的視頻數據
3.3.1 場景分析
3.3.2 設計實現
3.4 思考與總結
第4章 初識mapreduce
4.1 mapreduce簡介
4.1.1 mapreduce要解決什么問題
4.1.2 mapreduce的理論基礎
4.1.3 mapreduce的編程模式
4.2 mapreduce的集群行為
4.3 map/reduce框架
4.4 樣例分析:單詞計數
4.4.1 wordcount實例的運行過程
4.4.2 wordcount的源碼分析和程序處理過程
4.4.3 mapreduce常用類及其接口
4.5 實例:倒排索引
4.5.1 倒排索引的分析和設計
4.5.2 倒排索引完整源碼
4.5.3 運行代碼結果
4.6 mapreduce 在日志分析中數據去重案例
4.6.1 什么是數據去重
4.6.2 設計思路
4.6.3 程序代碼
4.6.4 代碼運行結果
4.7 數據排序實例
4.7.1 實例描述
4.7.2 設計思路
4.7.3 程序代碼
4.8 思考與總結
第5章 分布式開源數據庫hbase
5.1 hbase簡介
5.1.1 hbase邏輯視圖
5.1.2 hbase物理存儲
5.1.3 子表region服務器
5.1.4 hmaster主服務器
5.1.5 元數據表
5.2 hbase的安裝配置
5.2.1 hbase單機模式
5.2.2 hbase偽分布模式
5.2.3 hbase完全分布模式
5.3 學生成績表實例
5.3.1 shell的基本操作
5.3.2 代碼實現
5.3.3 關于中文的處理
5.3.4 常用hbase的 shell操作
5.4 思考與總結
第6章 mapreduce進階
6.1 api的配置
6.1.1 一個簡單的配置文件
6.1.2 合并多個源文件
6.1.3 可變的擴展
6.2 配置開發環境
6.2.1 配置文件設置
6.2.2 設置用戶標識
6.3 復合鍵值對的使用
6.3.1 小的鍵值對如何合并成大的鍵值對
6.3.2 巧用復合鍵讓系統完成排序
6.4 用戶定制數據類型
6.4.1 內置數據類型
6.4.2 用戶自定義數據類型
6.5 用戶定制輸入/輸出格式
6.5.1 內置數據的輸入格式
6.5.2 用戶定制數據輸入格式與recordreader
6.5.3 hadoop內置的數據輸出格式
6.5.4 hadoop內置的數據輸出格式與recordwriter
6.6 用戶定制partitioner和combiner
6.7 組合式的mapreduce作業
6.7.1 mapreduce作業運行機制
6.7.2 組合式mapreduce計算作業
6.8 datajoin連接多數據源
6.9 思考與總結
第7章 hive數據倉庫
7.1 hive簡介
7.2 hive安裝與配置
7.3 hive的服務
7.3.1 hive shell
7.3.2 jdbc/odbc
7.3.3 thrift服務
7.3.4 web接口
7.3.5 元數據服務
7.4 hiveql查詢語言
7.5 hive實例
7.5.1 udf 編程實例
7.5.2 udaf 編程實例
7.5.3 hive的日志數據統計實戰
7.6 思考與總結
第8章 pig開發應用
8.1 pig簡介
8.2 pig的安裝與配置
8.3 pig的使用
8.3.1 pig的mapreduce模式
8.3.2 pig的運行方式
8.4 通過grunt學習pig latin
8.4.1 pig的數據模型
8.4.2 運算符
8.4.3 常用操作
8.4.4 各種sql在pig中的實現
8.4.5 pig latin實現
8.5 pig使用的案例
8.6 思考與總結
第9章 chukwa數據收集系統
9.1 chukwa簡介
9.1.1 chukwa是什么
9.1.2 chukwa主要解決什么問題
9.2 chukwa的安裝配置
9.2.1 chukwa的安裝
9.2.2 chukwa的配置
9.2.3 chukwa的啟動
9.3 chukwa的基本命令
9.3.1 chukwa端的命令
9.3.2 agent 端的命令
9.4 chukwa在數據收集處理方面的運用
9.4.1 數據生成
9.4.2 數據收集
9.4.3 數據處理
9.4.4 數據析取
9.4.5 數據稀釋
9.4.6 數據顯示
9.5 思考與總結
第10章 zookeeper開發應用
10.1 zookeeper簡介
10.1.1 zookeeper的設計目標
10.1.2 zookeeper主要解決什么問題
10.1.3 zookeeper的基本概念和工作原理
10.2 zookeeper的安裝配置
10.2.1 單機模式
10.2.2 啟動并測試zookeeper
10.2.3 集群模式
10.3 zookeeper提供的接口
10.4 zookeeper事件
10.5 zookeeper實例
10.5.1 實例1:一個簡單的應用——分布式互斥鎖
10.5.2 實例2:進程調度系統
10.6 思考與總結
第2篇 hadoop管理和容錯篇
第11章 hadoop管理
11.1 hadoop權限管理
11.2 hdfs文件系統管理
11.3 hadoop維護與管理
11.4 hadoop常見問題及解決辦法
11.5 思考與總結
第12章 hadoop容錯
12.1 hadoop的可靠性
12.1.1 hdfs中的namenode單點失效解決方案
12.1.2 hdfs數據塊副本機制
12.1.3 hdfs心跳機制
12.1.4 hdfs負載均衡
12.1.5 mapreduce容錯
12.2 hadoop的secondaynamenode機制
12.2.1 磁盤鏡像與日志文件
12.2.2 secondarynamenode更新鏡像的流程
12.3 avatar機制
12.3.1 avatar機制簡介
12.3.2 avatars部署實戰
12.4 hadoop_hbase容錯
12.5 思考與總結
第3篇 hadoop實戰篇
第13章 綜合實戰1:hadoop中的數據庫訪問
13.1 dbinputformat類訪問數據庫
13.1.1 在dbinputformat類中包含的內置類
13.1.2 使用dbinputformat讀取數據庫表中的記錄
13.1.3 使用示例
13.2 使用dboutputformat向數據庫中寫記錄
13.3 思考與總結
第14章 綜合實戰2:一個簡單的分布式的grep
14.1 分析與設計
14.2 實現代碼
14.3 運行程序
14.4 思考與總結
第15章 綜合實戰3:打造一個搜索引擎
15.1 搜索引擎工作原理
15.2 網頁搜集與信息提取
15.2.1 設計的主要思想
15.2.2 系統設計目標
15.3 網頁信息的提取與存儲
15.4 mapreduce的預處理
15.4.1 **步:源數據過濾
15.4.2 第二步:生成倒排文件
15.4.3 第三步:建立二級索引
15.5 建立web信息查詢服務
15.6 思考與總結
第16章 綜合實戰4:移動通信信令監測與查詢
16.1 分析與設計
16.1.1 cdr數據文件的檢測與索引創建任務調度
16.1.2 從hdfs讀取數據并創建索引
16.1.3 查詢cdr信息
16.2 代碼實現
16.2.1 cdr文件檢測和索引創建任務程序
16.2.2 讀取cdr數據和索引創建處理
16.2.3 cdr查詢
16.3 思考與總結
附錄a hadoop命令大全
附錄b hdfs命令大全
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
月亮與六便士
- >
名家帶你讀魯迅:故事新編
- >
龍榆生:詞曲概論/大家小書
- >
羅曼·羅蘭讀書隨筆-精裝
- >
唐代進士錄
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
苦雨齋序跋文-周作人自編集