中圖網小程序
一鍵登錄
更方便
本類五星書更多>
-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
基于新信息技術的HADOOP大數據技術 版權信息
- ISBN:9787560670096
- 條形碼:9787560670096 ; 978-7-5606-7009-6
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
基于新信息技術的HADOOP大數據技術 內容簡介
本書面向Hadoop大數據技術,通過大量實例,循序漸進地介紹了Hadoop生態系統常用組件的安裝及使用方法。 全書共15個項目,主要內容包括:在虛擬機中安裝CentOS 7、安裝Hadoop偽分布、配置平臺基礎環境、搭建Zookeeper分布式集群、搭建HDFS分布式集群、搭建YARN分布式集群、Hadoop分布式計算框架(MapReduce)、Hive的安裝與部署、Hive常用命令的使用、搭建HBase分布式集群、Sqoop的安裝與部署、Flume的安裝與使用、搭建Kafka分布式集群、Davinci的安裝與部署以及互聯網金融項目的離線分析。本書內容由淺入深,涵蓋了Hadoop大數據生態系統的各個主要知識點。 本書內容翔實,通俗易懂,可作為大數據初學者的學習教材,也可作為大數據應用開發人員的參考書。
基于新信息技術的HADOOP大數據技術 目錄
項目一 在虛擬機中安裝CentOS 7 1
1.1 Linux概述 1
1.1.1 Linux操作系統簡介 1
1.1.2 Linux操作系統的應用場景 1
1.1.3 Linux版本 2
1.2 Linux的常用命令 2
1.2.1 ls命令 2
1.2.2 cd命令 3
1.2.3 pwd命令 3
1.2.4 mkdir 命令 3
1.2.5 rm命令 4
1.2.6 rmdir命令 4
1.2.7 mv命令 4
1.2.8 cp命令 5
1.2.9 cat命令 5
1.2.10 head命令 5
1.2.11 chmod命令 5
1.2.12 chown命令 6
1.2.13 ln命令 7
1.2.14 date命令 8
1.2.15 kill命令 9
1.3 VMware Workstation的安裝與部署 9
1.4 創建虛擬機 14
1.5 安裝CentOS 7系統 21
項目二 安裝Hadoop偽分布 29
2.1 大數據概述 29
2.1.1 什么是大數據 29
2.1.2 Hadoop是什么 29
2.1.3 Hadoop項目起源 30
2.1.4 Hadoop的發展歷程 30
2.1.5 Hadoop名字起源 30
2.1.6 Hadoop的優勢 30
2.1.7 Hadoop的應用領域 31
2.1.8 Hadoop與云計算 31
2.1.9 Hadoop與Spark 32
2.1.10 Hadoop與關系型數據庫
管理系統 34
2.2 配置靜態IP地址 35
2.3 Xshell連接工具 37
2.4 FileZilla傳輸工具 41
2.5 配置主機名和IP地址的映射 42
2.6 關閉Linux防火墻 42
2.7 創建Linux的用戶和用戶組 43
2.8 Linux SSH免密登錄 44
2.9 JDK的安裝與配置 45
2.10 Hadoop的安裝與配置 46
項目三 配置平臺基礎環境 52
3.1 Linux虛擬機的克隆 52
3.2 配置靜態IP地址 54
3.3 Xshell連接克隆虛擬機 56
3.4 修改克隆虛擬機主機名 57
3.5 關閉克隆虛擬機防火墻 57
3.6 FileZilla連接克隆虛擬機 58
3.7 Hadoop集群安裝前的準備工作 58
項目四 搭建Zookeeper分布式集群 66
4.1 Zookeeper概述 66
4.1.1 Zookeeper的特點 66
4.1.2 Zookeeper的基本架構與
工作原理 67
4.1.3 Zookeeper的數據模型 67
4.1.4 Znode的特性 68
4.1.5 監聽機制 68
4.2 Zookeeper集群的安裝與配置 68
4.3 Zookeeper Shell的常用操作 72
項目五 搭建HDFS分布式集群 73
5.1 HDFS的架構設計與工作原理 73
5.1.1 HDFS是什么 73
5.1.2 HDFS的產生背景 73
5.1.3 HDFS的設計理念 74
5.1.4 HDFS的核心設計目標 74
5.1.5 HDFS的系統架構 74
5.1.6 HDFS的優缺點 76
5.1.7 HDFS讀數據流程 76
5.1.8 HDFS寫數據流程 77
5.1.9 HDFS的高可用機制及架構 78
5.2 HDFS集群的安裝與配置 79
5.3 HDFS集群服務的啟動 82
5.4 測試HDFS集群 83
5.5 HDFS Shell的操作命令 85
5.5.1 HDFS Shell的基本操作命令 85
5.5.2 HDFS Shell的管理員操作命令 85
項目六 搭建YARN分布式集群 87
6.1 YARN的架構設計與工作原理 87
6.1.1 YARN是什么 87
6.1.2 YARN的作用 87
6.1.3 YARN的基本構架 88
6.1.4 YARN的工作原理 89
6.1.5 YARN的工作流程 89
6.1.6 YARN的高可用機制 90
6.1.7 YARN的調度器 91
6.2 YARN集群的配置 91
6.3 YARN集群服務的啟動 94
6.4 YARN集群的測試 95
6.5 Hadoop集群的運維管理 96
6.5.1 Hadoop集群進程的管理 97
6.5.2 Hadoop集群的運維技巧 99
項目七 Hadoop分布式計算框架
(MapReduce) 103
7.1 初識MapReduce 103
7.1.1 MapReduce概述 103
7.1.2 MapReduce的基本設計思想 104
7.1.3 MapReduce的優缺點 105
7.2 MapReduce編程模型 106
7.2.1 MapReduce的執行步驟 106
7.2.2 深入剖析MapReduce
編程模型 107
項目八 Hive的安裝與部署 111
8.1 Hive概述 111
8.1.1 Hive的定義 111
8.1.2 Hive的產生背景 111
8.1.3 Hive的優缺點 111
8.1.4 Hive在Hadoop生態系統中的
位置 112
8.1.5 Hive和Hadoop的關系 112
8.2 Hive的原理及架構 113
8.2.1 Hive的設計原理 113
8.2.2 Hive的體系結構 113
8.2.3 Hive的運行機制 114
8.2.4 Hive的轉換過程 115
8.2.5 Hive的數據類型 115
8.2.6 Hive的數據存儲 116
8.3 MySQL的安裝與部署 117
8.4 安裝與部署Hive客戶端 118
項目九 Hive常用命令的使用 121
9.1 Hive對數據庫的操作 121
9.1.1 創建數據庫 121
9.1.2 使用數據庫 122
9.1.3 修改數據庫 123
9.1.4 刪除數據庫 123
9.2 Hive對數據表的操作 124
9.2.1 創建表 124
9.2.2 查看表 126
9.2.3 修改表 127
9.2.4 刪除表 127
9.3 Hive數據的相關操作 128
9.3.1 數據導入 128
9.3.2 數據導出 130
9.3.3 數據備份與恢復 132
9.4 Hive查詢的相關操作 133
9.4.1 查詢顯示所有字段 133
9.4.2 查詢顯示部分字段 133
9.4.3 where條件查詢 133
9.4.4 distinct去重查詢 134
9.4.5 group by分組查詢 134
9.4.6 order by全局排序 134
9.4.7 sort by局部排序 135
9.4.8 distribute by分區查詢 135
9.4.9 cluster by分區排序 136
9.5 Hive表連接的相關操作 137
9.5.1 等值連接 137
9.5.2 內連接 137
9.5.3 左連接 137
9.5.4 右連接 138
9.5.5 全連接 138
9.6 Hive內部表和外部表的相關操作 139
9.6.1 內部表 139
9.6.2 外部表 140
9.7 Hive分區與分桶的相關操作 140
9.7.1 創建表分區 140
9.7.2 創建分桶 142
項目十 搭建HBase分布式集群 144
10.1 HBase 概述 144
10.1.1 HBase是什么 144
10.1.2 HBase的特點 144
10.2 HBase的模型及架構 145
10.2.1 HBase的邏輯模型 145
10.2.2 HBase的數據模型 145
10.2.3 HBase的物理模型 146
10.2.4 HBase的基本構架 147
10.3 HBase集群的安裝與配置 149
10.4 啟動HBase集群服務 151
10.5 HBase Shell工具 152
10.6 HBase Java客戶端 154
10.6.1 添加HBase的相關依賴 154
10.6.2 連接HBase數據庫 154
10.6.3 創建HBase表 155
10.6.4 向HBase表中插入數據 155
10.6.5 查詢HBase表數據 156
10.6.6 HBase過濾查詢 157
10.6.7 刪除HBase表 158
項目十一 Sqoop的安裝與部署 160
11.1 Sqoop數據遷移工具 160
11.1.1 Sqoop概述 160
11.1.2 Sqoop的優勢 161
11.1.3 Sqoop的架構及工作機制 161
11.1.4 Sqoop Import流程 161
11.1.5 Sqoop Export流程 162
11.2 Sqoop的安裝與配置 163
11.3 案例:Sqoop遷移Hive倉庫數據 164
項目十二 Flume的安裝與使用 166
12.1 Flume日志采集系統 166
12.1.1 Flume概述 166
12.1.2 Flume NG架構設計 167
12.2 Flume的安裝與配置 168
12.3 測試實例:監控端口數據 170
12.3.1 案例需求 170
12.3.2 實現步驟 170
項目十三 搭建Kafka分布式集群 173
13.1 Kafka 概述 173
13.1.1 Kafka的定義 173
13.1.2 Kafka的設計目標 173
13.1.3 Kafka的特點 174
13.2 Kafka的構架設計 174
13.2.1 主題和分區 175
13.2.2 消費者和消費者組 175
13.2.3 副本 176
13.3 Kafka分布式集群的安裝與配置 176
項目十四 Davinci的安裝與部署 180
14.1 Davinci的架構設計 180
14.1.1 Davinci的定義 180
14.1.2 Davinci的架構設計 180
14.1.3 Davinci的應用場景 181
14.2 Davinci的安裝與部署 181
14.2.1 部署規劃 181
14.2.2 準備前置環境 182
14.2.3 下載安裝包 182
14.2.4 安裝與初始化目錄 182
14.2.5 配置環境變量 183
14.2.6 初始化數據庫 183
14.2.7 Davinci服務器的啟停與注冊 185
項目十五 互聯網金融項目的離線分析 187
15.1 需求分析及流程設計 187
15.2 創建文件夾與數據庫 188
15.3 創建相應表格 189
15.4 Sqoop采集MySQL中的數據 191
15.4.1 啟動集群相關服務 191
15.4.2 創建Hive數據庫 191
15.4.3 MySQL數據遷移至Hive 191
15.5 對金融項目進行離線分析 193
15.5.1 信用卡用戶特征分析 193
15.5.2 信用卡用戶消費行為分析 195
15.5.3 信用卡用戶管理行為分析 196
15.6 創建MySQL業務表 197
15.7 統計結果導入MySQL 200
15.8 Davinci數據可視化分析 203
15.8.1 啟動Davinci并創建項目 203
15.8.2 創建不同的視圖 204
15.8.3 創建不同的圖表 215
15.8.4 創建大屏 220
參考文獻 223
展開全部
書友推薦
- >
經典常談
- >
史學評論
- >
月亮虎
- >
莉莉和章魚
- >
中國歷史的瞬間
- >
龍榆生:詞曲概論/大家小書
- >
隨園食單
- >
朝聞道
本類暢銷