中圖網小程序
一鍵登錄
更方便
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
HADOOP大數據集群部署及數據存儲項目化教程(張立輝) 版權信息
- ISBN:9787122448583
- 條形碼:9787122448583 ; 978-7-122-44858-3
- 裝幀:平裝
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
HADOOP大數據集群部署及數據存儲項目化教程(張立輝) 內容簡介
本書從實用角度出發,圍繞Linux 操作系統和Hadoop 集群部署,從虛擬機安裝入手,結合典型項目和案例,較為全面地介紹了大數據開發技術平臺Hadoop 及其生態系統的相關知識。主要內容包括大數據技術中的Hadoop 集群部署、HDFS、MapReduce、Hive、HBase和Sqoop 等。全書所有知識點都結合具體的編程示例講解,重要知識點配有視頻講解。 本書可作為高等職業院校大數據技術、軟件技術、計算機網絡技術、人工智能技術等專業的教材,也可作為大數據愛好者的參考書,同時也可作為企業培訓教材。
HADOOP大數據集群部署及數據存儲項目化教程(張立輝) 目錄
第1章 Hadoop 概述 1
1.1 大數據認知 1
1.1.1 大數據的定義 1
1.1.2 大數據的應用領域 2
1.1.3 大數據的特征 4
1.1.4 大數據的技術架構 5
1.2 Hadoop 認知 7
1.2.1 Hadoop 的發展史 7
1.2.2 Hadoop 的特點 9
1.2.3 Hadoop 的生態系統 10
1.2.4 Hadoop 的核心架構 11
1.3 Hadoop 的安裝和配置 12
1.3.1 VMWare 的安裝 12
1.3.2 Ubuntu 系統的安裝 13
1.3.3 Linux 常用命令 15
1.3.4 JDK 安裝和配置 16
1.3.5 Hadoop 的安裝 18
課后練習 19 第2章 Hadoop 集群部署 20
2.1 Linux 環境設置 20
2.1.1 創建用戶(組) 20
2.1.2 Windows 和Linux 系統間文件傳輸 22
2.1.3 更新apt 24
2.1.4 vim 編輯器的應用 25
2.1.5 網絡配置 25
2.2 Hadoop 偽分布式搭建 27
2.2.1 環境變量的配置 27
2.2.2 SSH 安裝 28
2.2.3 core-site.xml 配置文件 30
2.2.4 hdfs-site.xml 配置文件 30
2.2.5 Hadoop 偽分布式運行實例 31
2.3 Yarn 認知 33
2.3.1 初識Yarn 33
2.3.2 Yarn 基本服務組件 33
2.3.3 Yarn 執行過程 34
2.4 Hadoop 分布式搭建 35
2.4.1 部署前準備 35
2.4.2 網絡配置 37
2.4.3 配置文件的設置 37
2.4.4 分布式部署 38
課后練習 39 第3章 分布式文件系統HDFS 41
3.1 HDFS 認知 42
3.1.1 HDFS 的了解 42
3.1.2 HDFS 的特性 43
3.1.3 HDFS 的設計思想 44
3.1.4 HDFS 的核心概念 44
3.2 HDFS 常用shell 命令 47
3.2.1 HDFS 查看命令 47
3.2.2 HDFS 目錄操作命令 48
3.2.3 文件操作 49
3.3 HDFS 基礎編程 52
3.3.1 用HDFS API 上傳本地文件 52
3.3.2 用HDFS API 創建HDFS 文件 54
3.3.3 用HDFS API 讀取和寫入文件 55
3.3.4 用HDFS API 創建HDFS 目錄 56
3.3.5 用HDFS API 查找文件所在位置 57
3.4 HDFS 工作機制 58
3.4.1 HDFS 寫數據流程 58
3.4.2 HDFS 讀數據流程 59
3.4.3 NameNode 工作機制 60
3.4.4 DataNode 工作機制 61
3.5 HDFS 客戶信息管理 62
3.5.1 環境搭建 62
3.5.2 寫入客戶信息 66
3.5.3 讀取客戶信息 69
課后練習 69 第4章 MapReduce 編程 71
4.1 MapReduce 的工作原理 71
4.1.1 MapReduce 的由來和特點 72
4.1.2 MapReduce 執行過程 73
4.1.3 MapTask 執行過程 75
4.1.4 Reduce 執行過程 76
4.1.5 Shuffle 執行過程 77
4.2 MapReduce 程序編寫 78
4.2.1 開發工具IDEA 的安裝 78
4.2.2 MapReduce 輸入/輸出類型 81
4.2.3 MapReduce 輸入處理類 81
4.2.4 MapReduce 輸出處理類 83
4.2.5 入門案例—WordCount 84
4.3 統計網站*大訪問次數 87
4.3.1 實體類 87
4.3.2 Mapper 類 88
4.3.3 Reducer 類 89
4.3.4 項目驅動類 90
課后練習 91 第5章 MapReduce 高級編程 92
5.1 MapReduce 高級開發一 92
5.1.1 Combiner 編程 93
5.1.2 Partitioner 編程 94
5.1.3 RecordReader 編程 97
5.2 MapReduce 高級開發二 102
5.2.1 MapReduce 連接操作 103
5.2.2 MapReduce 排序操作 109
5.2.3 MapReduce 多文件聯合查詢 111
5.3 實現課程名稱和成績的二次排序 115
5.3.1 實體類 115
5.3.2 Mapper 類 116
5.3.3 Reducer 類 117
5.3.4 項目驅動類編寫 117
課后練習 118 第6章 Hive 數據倉庫 120
6.1 什么是Hive 121
6.1.1 Hive 簡介 121
6.1.2 為什么使用Hive 121
6.1.3 Hive 的優缺點 122
6.1.4 Hive 體系結構 122
6.1.5 Hive 設計特征 123
6.2 Hive 安裝 124
6.2.1 偽分布式安裝與配置Hive 124
6.2.2 安裝與配置MySQL 126
6.3 Hive 基本操作 128
6.3.1 Hive 數據類型 128
6.3.2 數據庫操作 129
6.3.3 內部表操作 131
6.3.4 外部表操作 139
6.3.5 分區表操作 139
6.3.6 分桶表操作 143
6.3.7 Hive 數據操作 144
6.4 實現購物用戶數據清洗項目 148
6.4.1 導入數據 148
6.4.2 數據分析 149
6.4.3 數據導出 150
課后練習 150 第7章 HBase 數據庫 152
7.1 HBase 認知 153
7.1.1 HBase 簡介. 153
7.1.2 HBase 體系結構 153
7.1.3 HBase 寫數據流程 154
7.1.4 HBase 讀數據流程 155
7.2 HBase 安裝 156
7.2.1 下載軟件 156
7.2.2 偽分布式安裝與配置 157
7.3 HBase shell 操作命令 159
7.3.1 HBase 數據模型 159
7.3.2 數據表空間操作 161
7.3.3 數據表操作 164
7.3.4 數據操作 170
7.4 HBase API 操作 174
7.4.1 HBase 常用的API 175
7.4.2 Configuration 對象 175
7.4.3 HTable 句柄創建 178
7.4.4 HBase 數據的CRUD 操作 179
7.5 學生成績管理 187
7.5.1 學生成績表數據準備 187
7.5.2 學生成績表設計分析 188
7.5.3 學生成績表代碼實現 189
課后練習 191 第8章 Sqoop 導入和導出 193
8.1 概述 194
8.1.1 Sqoop 產生背景 194
8.1.2 Sqoop 是什么 194
8.1.3 為什么選擇 Sqoop 194
8.2 工作原理 195
8.2.1 導入機制 195
8.2.2 導出機制 196
8.3 安裝 196
8.3.1 前提準備 196
8.3.2 下載Sqoop 197
8.3.3 安裝Sqoop 198
8.3.4 配置Sqoop 199
8.3.5 MySQL 驅動包 199
8.3.6 驗證Sqoop. 200
8.4 Sqoop 的基本命令 200
8.4.1 基本操作 200
8.4.2 示例 200
8.5 數據導入和導出 208
8.5.1 從RDBMS 導入HDFS 中 208
8.5.2 MySQL 數據導入Hive 中 209
8.5.3 MySQL 數據導入HBase 209
課后練習 210 參考文獻 212
1.1 大數據認知 1
1.1.1 大數據的定義 1
1.1.2 大數據的應用領域 2
1.1.3 大數據的特征 4
1.1.4 大數據的技術架構 5
1.2 Hadoop 認知 7
1.2.1 Hadoop 的發展史 7
1.2.2 Hadoop 的特點 9
1.2.3 Hadoop 的生態系統 10
1.2.4 Hadoop 的核心架構 11
1.3 Hadoop 的安裝和配置 12
1.3.1 VMWare 的安裝 12
1.3.2 Ubuntu 系統的安裝 13
1.3.3 Linux 常用命令 15
1.3.4 JDK 安裝和配置 16
1.3.5 Hadoop 的安裝 18
課后練習 19 第2章 Hadoop 集群部署 20
2.1 Linux 環境設置 20
2.1.1 創建用戶(組) 20
2.1.2 Windows 和Linux 系統間文件傳輸 22
2.1.3 更新apt 24
2.1.4 vim 編輯器的應用 25
2.1.5 網絡配置 25
2.2 Hadoop 偽分布式搭建 27
2.2.1 環境變量的配置 27
2.2.2 SSH 安裝 28
2.2.3 core-site.xml 配置文件 30
2.2.4 hdfs-site.xml 配置文件 30
2.2.5 Hadoop 偽分布式運行實例 31
2.3 Yarn 認知 33
2.3.1 初識Yarn 33
2.3.2 Yarn 基本服務組件 33
2.3.3 Yarn 執行過程 34
2.4 Hadoop 分布式搭建 35
2.4.1 部署前準備 35
2.4.2 網絡配置 37
2.4.3 配置文件的設置 37
2.4.4 分布式部署 38
課后練習 39 第3章 分布式文件系統HDFS 41
3.1 HDFS 認知 42
3.1.1 HDFS 的了解 42
3.1.2 HDFS 的特性 43
3.1.3 HDFS 的設計思想 44
3.1.4 HDFS 的核心概念 44
3.2 HDFS 常用shell 命令 47
3.2.1 HDFS 查看命令 47
3.2.2 HDFS 目錄操作命令 48
3.2.3 文件操作 49
3.3 HDFS 基礎編程 52
3.3.1 用HDFS API 上傳本地文件 52
3.3.2 用HDFS API 創建HDFS 文件 54
3.3.3 用HDFS API 讀取和寫入文件 55
3.3.4 用HDFS API 創建HDFS 目錄 56
3.3.5 用HDFS API 查找文件所在位置 57
3.4 HDFS 工作機制 58
3.4.1 HDFS 寫數據流程 58
3.4.2 HDFS 讀數據流程 59
3.4.3 NameNode 工作機制 60
3.4.4 DataNode 工作機制 61
3.5 HDFS 客戶信息管理 62
3.5.1 環境搭建 62
3.5.2 寫入客戶信息 66
3.5.3 讀取客戶信息 69
課后練習 69 第4章 MapReduce 編程 71
4.1 MapReduce 的工作原理 71
4.1.1 MapReduce 的由來和特點 72
4.1.2 MapReduce 執行過程 73
4.1.3 MapTask 執行過程 75
4.1.4 Reduce 執行過程 76
4.1.5 Shuffle 執行過程 77
4.2 MapReduce 程序編寫 78
4.2.1 開發工具IDEA 的安裝 78
4.2.2 MapReduce 輸入/輸出類型 81
4.2.3 MapReduce 輸入處理類 81
4.2.4 MapReduce 輸出處理類 83
4.2.5 入門案例—WordCount 84
4.3 統計網站*大訪問次數 87
4.3.1 實體類 87
4.3.2 Mapper 類 88
4.3.3 Reducer 類 89
4.3.4 項目驅動類 90
課后練習 91 第5章 MapReduce 高級編程 92
5.1 MapReduce 高級開發一 92
5.1.1 Combiner 編程 93
5.1.2 Partitioner 編程 94
5.1.3 RecordReader 編程 97
5.2 MapReduce 高級開發二 102
5.2.1 MapReduce 連接操作 103
5.2.2 MapReduce 排序操作 109
5.2.3 MapReduce 多文件聯合查詢 111
5.3 實現課程名稱和成績的二次排序 115
5.3.1 實體類 115
5.3.2 Mapper 類 116
5.3.3 Reducer 類 117
5.3.4 項目驅動類編寫 117
課后練習 118 第6章 Hive 數據倉庫 120
6.1 什么是Hive 121
6.1.1 Hive 簡介 121
6.1.2 為什么使用Hive 121
6.1.3 Hive 的優缺點 122
6.1.4 Hive 體系結構 122
6.1.5 Hive 設計特征 123
6.2 Hive 安裝 124
6.2.1 偽分布式安裝與配置Hive 124
6.2.2 安裝與配置MySQL 126
6.3 Hive 基本操作 128
6.3.1 Hive 數據類型 128
6.3.2 數據庫操作 129
6.3.3 內部表操作 131
6.3.4 外部表操作 139
6.3.5 分區表操作 139
6.3.6 分桶表操作 143
6.3.7 Hive 數據操作 144
6.4 實現購物用戶數據清洗項目 148
6.4.1 導入數據 148
6.4.2 數據分析 149
6.4.3 數據導出 150
課后練習 150 第7章 HBase 數據庫 152
7.1 HBase 認知 153
7.1.1 HBase 簡介. 153
7.1.2 HBase 體系結構 153
7.1.3 HBase 寫數據流程 154
7.1.4 HBase 讀數據流程 155
7.2 HBase 安裝 156
7.2.1 下載軟件 156
7.2.2 偽分布式安裝與配置 157
7.3 HBase shell 操作命令 159
7.3.1 HBase 數據模型 159
7.3.2 數據表空間操作 161
7.3.3 數據表操作 164
7.3.4 數據操作 170
7.4 HBase API 操作 174
7.4.1 HBase 常用的API 175
7.4.2 Configuration 對象 175
7.4.3 HTable 句柄創建 178
7.4.4 HBase 數據的CRUD 操作 179
7.5 學生成績管理 187
7.5.1 學生成績表數據準備 187
7.5.2 學生成績表設計分析 188
7.5.3 學生成績表代碼實現 189
課后練習 191 第8章 Sqoop 導入和導出 193
8.1 概述 194
8.1.1 Sqoop 產生背景 194
8.1.2 Sqoop 是什么 194
8.1.3 為什么選擇 Sqoop 194
8.2 工作原理 195
8.2.1 導入機制 195
8.2.2 導出機制 196
8.3 安裝 196
8.3.1 前提準備 196
8.3.2 下載Sqoop 197
8.3.3 安裝Sqoop 198
8.3.4 配置Sqoop 199
8.3.5 MySQL 驅動包 199
8.3.6 驗證Sqoop. 200
8.4 Sqoop 的基本命令 200
8.4.1 基本操作 200
8.4.2 示例 200
8.5 數據導入和導出 208
8.5.1 從RDBMS 導入HDFS 中 208
8.5.2 MySQL 數據導入Hive 中 209
8.5.3 MySQL 數據導入HBase 209
課后練習 210 參考文獻 212
展開全部
書友推薦
- >
推拿
- >
小考拉的故事-套裝共3冊
- >
經典常談
- >
莉莉和章魚
- >
苦雨齋序跋文-周作人自編集
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
我與地壇
- >
上帝之肋:男人的真實旅程
本類暢銷