-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
HIVE編程技術與應用/孫帥/普通高等教育新工科人才培養規劃教材(大數據專業) 版權信息
- ISBN:9787517069140
- 條形碼:9787517069140 ; 978-7-5170-6914-0
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
HIVE編程技術與應用/孫帥/普通高等教育新工科人才培養規劃教材(大數據專業) 內容簡介
本書通過原理加案例的方式系統地講解了Hive編程技術,使讀者能夠全面地了解使用Hive的開發流程。書中精心安排了Hive的原理分析、架構特點、環境搭建、HiveQL使用等內容,給出了大量的開發案例及其開發過程,使讀者對Hive開發有直觀的印象。全書共10章:前6章系統講解Hive工作原理、特點,Hive架構,HiveQL表操作,HiveQL數據操作,HiveQL查詢,Hive安裝與配置,Hive自定義函數;第8、9、10章是綜合案例部分,通過案例幫助讀者掌握整個大數據項目的開發流程,包括數據清洗、數據處理、數據導入導出。本書知識結構簡單明了,案例生動具體,內容設計新穎,思路清晰。本書不僅可作為普通高校大數據相關專業的教材,也可以作為想繼續深入了解大數據編程的讀者的參考書,還可作為各類相關培訓班的培訓教材。
HIVE編程技術與應用/孫帥/普通高等教育新工科人才培養規劃教材(大數據專業) 目錄
第1章 Hive介紹
1.1 Hive工作原理
1.2 Hive的數據類型
1.3 Hive的特點
1.4 本章小結
第2章 Hive架構
2.1 Hive用戶接口
2.1.1 Hive CLI
2.1.2 HWI
2.1.3 Thrift服務
2.2 Hive元數據庫
2.2.1 Hive元數據表結構
2.2.2 Hive元數據的三種存儲模式
2.3 Hive數據存儲
2.4 Hive文件格式
2.4.1 TextFile格式
2.4.2 SequenceFile格式
2.4.3 RCFile格式
2.4.4 ORC格式
2.5 本章小結
第3章 HiveQL表操作
3.1 內部表
3.2 外部表
3.3 分區表
3.3.1 靜態分區
3.3.2 動態分區
3.4 桶表
3.5 視圖
3.5.1 使用視圖降低查詢復雜度
3.5.2 使用視圖來限制基于條件過濾的數據
3.5.3 動態分區中的視圖和map類型
3.6 本章小結
第4章 HiveQL數據操作
4.1 裝載數據到表中
4.2 通過查詢語句向表中插入數據
4.3 單個查詢語句中創建并加載數據
4.4 導出數據
4.5 本章小結
第5章 HiveQL查詢
5.1 SELECT…FROM語句
5.1.1 使用正則表達式來指定列的
5.1.2 使用列值進行計算
5.1.3 算述運算符
5.1.4 使用函數
5.1.5 LIMIT語句
5.1.6 列別名
5.1.7 嵌套SELECT語句
5.1.8 CASE…WHEN…THEN語句
5.2 WHERE語句
5.2.1 謂詞操作符
5.2.2 關于浮點數比較
5.2.3 LIKE和RLIKE
5.3 GROtJPBY語句
5.4.JOIN語句
5.4.1 INNER JOIN
5.4.2 JOIN優化
5.4.3 LEFTOUTER JOIN
5.4.4 R1GHTOUTER JOIN
5.4.5 FULLOUTER JOIN
5.4.6 LEFT SEMI JOIN
5.4.7 笛卡爾積JOIN
5.4.8 mad-side JOIN
5.5 ORDER BY和SOPT BY
5.6 含有SOftT BY的DISTRIBIJTE BY
5.7 CLUSTER BY
5.8 類型轉換
5.9 抽樣查詢
5.9.1 數據塊抽樣
5.9.2 分桶表的輸入裁剪
5.1 0LINIONALL
5.1 1本章小結
第6章 Hive配置與應用
6.1 Hive安裝與配置
6.2 Hive訪問
6.3 Hive基本操作
6.3.1 Hive CLI命令行操作講解
6.3.2 Hive的數據類型
6.3.3 Hive表的創建
6.3.4 Hive數據導入
6.3.5 Hive數據導出
6.4 Hive數據定義
6.4.1 內部表與外部表的區別
6.4.2 內部表建立
6.4.3 外部表建立
6.4.4 表的分區與桶的建立
6.4.5 刪除表與修改表結構
6.4.6 HiveQL簡單查詢語句
6.4.7 WHERE語句
6.5 Hive高級查詢
6.6 本章小結
第7章Hive自定義函數
7.1 LIDF
7.2 UDTF
7.3 UDAF
7.4 Hive函數綜合案例
7.4.1 Row-Sequence實現列自增長
7.4.2 列轉行和行轉列
7.5 本章小結
第8章Hive綜合案例(一)
8.1 項目背景與數據情況
8.2 關鍵指標KPI
8.3 開發步驟分析
8.4 表結構設計
8.5 數據清洗過程
8.5.1 定期上傳日志至HDFS
8.5.2 編寫.MapReduce程序清理日志
8.5.3 定期清理日志至HDFS
8.5.4 查詢清洗前后的數據
8.6 數據統計分析
8.6.1 借助Hive進行統計
8.6.2 使用HiveQL統計關鍵指標
8.7 本章小結
第9章Hive綜合案例(二)
9.1 項目應用場景
9.2 設計與實現
9.2.1 日志格式分析
9.2.2 建立表
9.2.3 程序設計
9.2.4 編碼實現
9.2.5 運行并測試
9.3 本章小結
第10章Hive綜合案例(三)
10.1 應用場景
10.2 設計與實現
10.2.1 數據處理
10.2.2 使用Hive對清洗后的數據進行多維分析
10.2.3 在MySQL中建立數據庫
10.2.4 使用sqoop把分析結果導入到MySQL中
10.2.5 程序設計與實現
10.2.6 運行并測試
10.3 本章總結
附錄
HIVE編程技術與應用/孫帥/普通高等教育新工科人才培養規劃教材(大數據專業) 作者簡介
孫帥,中關村軟件園百知教育課程研發部總監,曾主持開發項目:易寶支付3代平臺系統、易寶支付風控系統、GDB敏捷開發平臺、精品科技期刊全文數據庫和網絡服務系統、國家科技圖書文獻中心NSTL網絡服務系統、萬方數據知識服務平臺、的士通3G項目、鳳凰網視頻3G項目。
- >
史學評論
- >
中國歷史的瞬間
- >
月亮虎
- >
我從未如此眷戀人間
- >
朝聞道
- >
唐代進士錄
- >
自卑與超越
- >
山海經