-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
基于Apache Kylin構建大數(shù)據(jù)分析平臺 版權信息
- ISBN:9787302454526
- 條形碼:9787302454526 ; 978-7-302-45452-6
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
基于Apache Kylin構建大數(shù)據(jù)分析平臺 本書特色
Apache Kylin是一個開源的分布式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規(guī)模數(shù)據(jù),*初由eBay公司開發(fā)并貢獻至開源社區(qū)。它能在亞秒內查詢巨大的Hive表。本書分為21章,詳細講解Apache Kylin概念、安裝、配置、部署,讓讀者對Apache Kylin構建大數(shù)據(jù)分析平臺有一個感性認識。同時,本書從應用角度,結合Dome和實例介紹了用于多維分析的Cube算法的創(chuàng)建、配置與優(yōu)化。*后還介紹了Kyligence公司發(fā)布KAP大數(shù)據(jù)分析平臺,對讀者有極大的參考價值。本書適合大數(shù)據(jù)技術初學者、大數(shù)據(jù)分析人員、大數(shù)據(jù)架構師等,也適合用于高等院校和培訓學校相關專業(yè)師生教學參考。
基于Apache Kylin構建大數(shù)據(jù)分析平臺 內容簡介
Apache Kylin將傳統(tǒng)的數(shù)據(jù)倉庫及商務智能分析能力帶入到了大數(shù)據(jù)時代,作為新興的技術已經(jīng)被廣大用戶所使用。作為創(chuàng)始作者,我非常欣喜能看到關于Apache Kylin相關書籍的出版, 這無疑對中國用戶更好地使用Kylin,解決實際的大數(shù)據(jù)分析架構及業(yè)務問題有很大幫助。
韓卿
Kyligence 聯(lián)合創(chuàng)始人兼CEO,Apache Kylin項目管理委員會主席(PMC Chair)
伴隨著大數(shù)據(jù)發(fā)展的三條主線是大數(shù)據(jù)技術、大數(shù)據(jù)思維和大數(shù)據(jù)實踐。因為RDBMS很難處理單表10億行數(shù)據(jù),所以大數(shù)據(jù)技術應需而生。大數(shù)據(jù)技術從*初的解決海量數(shù)據(jù)的快速存儲和讀取,到今天的海量數(shù)據(jù)的OLAP,當中衍生出眾多的技術產品,ApacheKylin就是其中的一個優(yōu)秀產品,目標是解決大數(shù)據(jù)范疇中的OLAP。
Kyligence
聯(lián)合創(chuàng)始人兼CEO,Apache Kylin項目管理委員會主席(PMC Chair)韓卿武漢市云升科技發(fā)展有限公司董事長,《智慧城市—大數(shù)據(jù)、物聯(lián)網(wǎng)和云計算之應用》作者楊正洪萬達網(wǎng)絡科技集團大數(shù)據(jù)中心副總經(jīng)理,《Spark高級數(shù)據(jù)分析》中文版譯者龔少成
數(shù)據(jù)架構師,IT脫口秀(清風那個吹)創(chuàng)始人,《開源大數(shù)據(jù)分析引擎Impala實戰(zhàn)》作者賈傳青
等等業(yè)內專家聯(lián)合推薦
Apache Kylin將傳統(tǒng)的數(shù)據(jù)倉庫及商務智能分析能力帶入到了大數(shù)據(jù)時代,作為新興的技術已經(jīng)被廣大用戶所使用。作為創(chuàng)始作者,我非常欣喜能看到關于Apache Kylin相關書籍的出版, 這無疑對中國用戶更好地使用Kylin,解決實際的大數(shù)據(jù)分析架構及業(yè)務問題有很大幫助。韓卿Kyligence 聯(lián)合創(chuàng)始人兼CEO,Apache Kylin項目管理委員會主席(PMC Chair) 伴隨著大數(shù)據(jù)發(fā)展的三條主線是大數(shù)據(jù)技術、大數(shù)據(jù)思維和大數(shù)據(jù)實踐。因為RDBMS很難處理單表10億行數(shù)據(jù),所以大數(shù)據(jù)技術應需而生。大數(shù)據(jù)技術從*初的解決海量數(shù)據(jù)的快速存儲和讀取,到今天的海量數(shù)據(jù)的OLAP,當中衍生出眾多的技術產品,Apache
Kylin就是其中的一個優(yōu)秀產品,目標是解決大數(shù)據(jù)范疇中的OLAP。第二條主線是大數(shù)據(jù)思維。數(shù)據(jù)處理的*近幾十年都被RDBMS的思想所束縛,小表、多表、表的連接、過分注重冗余性的壞處,等等,這些都限制了海量數(shù)據(jù)上的處理與分析。大數(shù)據(jù)技術出來之后,隨著而來的大數(shù)據(jù)思維,給我們帶來了海量數(shù)據(jù)處理的新思維。這個新思維的核心就是突破表的概念,而采用面向對象的數(shù)據(jù)模型在數(shù)據(jù)層上實現(xiàn)。Apache Kylin的Cube模型就是在逐步體現(xiàn)大數(shù)據(jù)的思維。*后一條主線是大數(shù)據(jù)實踐。大數(shù)據(jù)實踐分為數(shù)據(jù)梳理、數(shù)據(jù)建模、數(shù)據(jù)采集、數(shù)據(jù)管控、數(shù)據(jù)服務、數(shù)據(jù)可視化和數(shù)據(jù)分析。這是一環(huán)套一環(huán)的步驟,不能跳過。Apache Kylin作為數(shù)據(jù)分析環(huán)節(jié)的技術產品,一定要同數(shù)據(jù)管理的《基于Apache Kylin構建大數(shù)據(jù)分析平臺》一書淺顯易懂,實操性強,是目前Apache Kylin界不可多得的技術資料,值得細讀和研究。 楊正洪武漢市云升科技發(fā)展有限公司董事長 Apache Kylin是基于MOLAP的實時大數(shù)據(jù)引擎,與Hadoop生態(tài)系統(tǒng)結合更加緊密,先天的優(yōu)勢注定了其支持更大的數(shù)據(jù)規(guī)模,更好的擴展性,獨有的中國血統(tǒng)較其他開源軟件更具本地化優(yōu)勢,更符合中國國情。本書包含了守壯多年的實踐經(jīng)驗
,系統(tǒng)全面的介紹了Apache Kylin技術,值得推薦。 賈傳青數(shù)據(jù)架構師,IT脫口秀(清風那個吹)創(chuàng)始人
信息
基于Apache Kylin構建大數(shù)據(jù)分析平臺 目錄
**部分 Apache Kylin基礎部分
第1章 Apache Kylin前世今生 3
1.1 Apache Kylin的背景 3
1.2 Apache Kylin的應用場景 3
1.3 Apache Kylin的發(fā)展歷程 4
第2章 Apache Kylin前奏 7
2.1 事實表和維表 7
2.2 星型模型和雪花型模型 7
2.2.1 星型模型 7
2.2.2 雪花型模型 8
2.2.3 星型模型示例 8
2.3 OLAP 9
2.3.1 OLAP分類 9 **部分 Apache Kylin基礎部分 第1章 Apache Kylin前世今生 3 1.1 Apache Kylin的背景 3 1.2 Apache Kylin的應用場景 3 1.3 Apache Kylin的發(fā)展歷程 4 第2章 Apache Kylin前奏 7 2.1 事實表和維表 7 2.2 星型模型和雪花型模型 7 2.2.1 星型模型 7 2.2.2 雪花型模型 8 2.2.3 星型模型示例 8 2.3 OLAP 9 2.3.1 OLAP分類 9 2.3.2 OLAP的基本操作 10 2.4 數(shù)據(jù)立方體(Data Cube) 11 第3章 Apache Kylin 工作原理和體系架構 12 3.1 Kylin工作原理 12 3.2 Kylin體系架構 13 3.3 Kylin中的核心部分:Cube構建 15 3.4 Kylin的SQL查詢 16 3.5 Kylin的特性和生態(tài)圈 16 第4章 搭建CDH大數(shù)據(jù)平臺 18 4.1 系統(tǒng)環(huán)境和安裝包 19 4.1.1 系統(tǒng)環(huán)境 19 4.1.2 安裝包的下載 20 4.2 準備工作:系統(tǒng)環(huán)境搭建 21 4.2.1 網(wǎng)絡配置(CDH集群所有節(jié)點) 21 4.2.2 打通SSH,設置ssh無密碼登錄(所有節(jié)點) 21 4.3 正式安裝CDH:準備工作 29 4.4 正式安裝CDH5:安裝配置 30 4.4.1 CDH5的安裝配置 30 4.4.2 對Hive、HBase執(zhí)行簡單操作 39 第5章 使用Kylin構建企業(yè)大數(shù)據(jù)分析平臺的4種部署方式 41 5.1 Kylin部署的架構 41 5.2 Kylin的四種典型部署方式 42 第6章 單獨為Kylin部署HBase集群 44 第7章 部署Kylin集群環(huán)境 58 7.1 部署Kylin的先決條件 58 7.2 部署Kylin集群環(huán)境 61 7.3 為Kylin集群搭建負載均衡器 70 7.3.1 搭建Nginx環(huán)境 70 7.3.2 配置Nginx實現(xiàn)Kylin的負載均衡 73 第二部分 Apache Kylin 進階部分 第8章 Demo案例實戰(zhàn) 77 8.1 Sample Cube案例描述 77 8.2 Sample Cube案例實戰(zhàn) 78 8.2.1 準備數(shù)據(jù) 78 8.2.2 構建Cube 81 第9章 多維分析的Cube創(chuàng)建實戰(zhàn) 89 9.1 Cube模型 89 9.2 創(chuàng)建Cube的流程 90 9.2.1 步驟一:Hive中事實表,以及多張維表的處理 90 9.2.2 步驟二:Kylin中建立項目(Project) 95 9.2.3 步驟三:Kylin中建立數(shù)據(jù)源(Data Source) 95 9.2.4 步驟四:Kylin中建立數(shù)據(jù)模型(Model) 98 9.2.5 步驟五:Kylin中建立Cube 104 9.2.6 步驟六:Build Cube 114 9.2.7 步驟七:查詢Cube 118 第10章 Build Cube的來龍去脈 120 10.1 流程分析 120 10.2 小結 134 第三部分 Apache Kylin 高級部分 第11章 Cube優(yōu)化 137 第12章 備份Kylin的Metadata 142 12.1 Kylin的元數(shù)據(jù) 142 12.2 備份元數(shù)據(jù) 143 12.3 恢復元數(shù)據(jù) 146 第13章 使用Hive視圖 147 13.1 使用Hive視圖 147 13.2 使用視圖實戰(zhàn) 149 第14章 Kylin的垃圾清理 153 14.1 清理元數(shù)據(jù) 153 14.2 清理存儲器數(shù)據(jù) 154 第15章 JDBC訪問方式 157 第16章 通過RESTful訪問Kylin 161 第17章 Kylin版本之間升級 179 17.1 從1.5.2升級到*新版本1.5.3 179 17.2 從1.5.1升級到1.5.2版本 180 17.3 從Kylin 1.5.2.1升級到Kylin 1.5.3實戰(zhàn) 181 17.4 補充內容 187 第18章 大數(shù)據(jù)可視化實踐 189 18.1 可視化工具簡述 189 18.2 安裝Kylin ODBC驅動 190 18.3 通過Excel訪問Kylin 192 18.4 通過Power BI訪問Kylin 194 18.4.1 安裝配置Power BI 194 18.4.2 實戰(zhàn)操作 198 18.5 通過Tableau訪問Kylin 199 18.6 Kylin Mondrian Saiku 205 18.7 實戰(zhàn)演練:通過Saiku訪問Kylin 211 18.7.1 **個Schema例子:myproject_pvuv_cube的演示 211 18.7.2 第二個Schema例子:kylin_sales_cube的演示 219 18.7.3 Saiku使用的一些問題 223 18.8 通過Apache Zepplin訪問Kylin 229 18.9 通過Kylin的“Insight”查詢 232 第19章 使用Streaming Table 構建準實時Cube 236 第20章 快速數(shù)據(jù)立方算法 251 20.1 快速數(shù)據(jù)立方算法概述 251 20.2 快速數(shù)據(jù)立方算法優(yōu)點和缺點 253 20.3 獲取Fast Cubing算法的優(yōu)勢 254 第四部分 Apache Kylin的擴展部分 第21章 大數(shù)據(jù)智能分析平臺KAP 257 21.1 大數(shù)據(jù)智能分析平臺KAP概述 257 21.2 KAP的安裝部署 259信息
基于Apache Kylin構建大數(shù)據(jù)分析平臺 作者簡介
蔣守壯,現(xiàn)就職于萬達網(wǎng)絡科技集團有限公司,資深大數(shù)據(jù)工程師,大數(shù)據(jù)實踐者。曾任平安科技資深大數(shù)據(jù)分析師和架構師,CSDN社區(qū)專家,知識庫特邀編輯。目前專注于Docker、Kubernetes、Mesos、Hadoop、Spark和Kylin等技術領域。
- >
二體千字文
- >
中國歷史的瞬間
- >
朝聞道
- >
經(jīng)典常談
- >
伊索寓言-世界文學名著典藏-全譯本
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學概述
- >
姑媽的寶刀
- >
唐代進士錄