包郵 《高效使用Greenplum:入門、進(jìn)階與數(shù)據(jù)中臺(tái)》資深數(shù)據(jù)架構(gòu)師和數(shù)倉專家10余年經(jīng)驗(yàn)總結(jié)
-
>
全國計(jì)算機(jī)等級(jí)考試最新真考題庫模擬考場及詳解·二級(jí)MSOffice高級(jí)應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
《高效使用Greenplum:入門、進(jìn)階與數(shù)據(jù)中臺(tái)》資深數(shù)據(jù)架構(gòu)師和數(shù)倉專家10余年經(jīng)驗(yàn)總結(jié) 版權(quán)信息
- ISBN:9787111696490
- 條形碼:9787111696490 ; 978-7-111-69649-0
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
《高效使用Greenplum:入門、進(jìn)階與數(shù)據(jù)中臺(tái)》資深數(shù)據(jù)架構(gòu)師和數(shù)倉專家10余年經(jīng)驗(yàn)總結(jié) 本書特色
適讀人群 :本書適合于以下讀者:商業(yè)智能分析領(lǐng)域的工程師。Greenplum作為一款簡單易用、性能卓越的OLAP分析數(shù)據(jù)庫,非常適合作為數(shù)據(jù)分析的底層數(shù)據(jù)庫。通過閱讀本書,你將快速掌握掌(1)作者背景資深:在數(shù)倉、數(shù)據(jù)中臺(tái)等領(lǐng)域深耕10余年,啟高信息大數(shù)據(jù)架構(gòu)師,Apache Doris和OpenGauss源碼貢獻(xiàn)者。 (2)作者經(jīng)驗(yàn)豐富:豐富的數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)中臺(tái)項(xiàng)目實(shí)戰(zhàn)經(jīng)驗(yàn),對(duì)大數(shù)據(jù)主流技術(shù)架構(gòu)、產(chǎn)品選型與解決方案有深入研究,尤其擅長用優(yōu)雅的SQL實(shí)現(xiàn)復(fù)雜的邏輯。 (3)講透Greenplum:從工作原理、功能組件、深入應(yīng)用3個(gè)維度全面、深入講解Greenplum,幫助讀者快速實(shí)現(xiàn)Greenplum的入門、實(shí)戰(zhàn)與進(jìn)階。 (4)Greenplum數(shù)據(jù)中臺(tái)搭建:從建設(shè)思路、接口實(shí)戰(zhàn)、建模實(shí)戰(zhàn)到數(shù)據(jù)中臺(tái)管理和應(yīng)用,全方位解讀基于 Greenplum 數(shù)據(jù)庫實(shí)現(xiàn)數(shù)據(jù)中臺(tái)的過程 (5)Greenplum中文社區(qū)推薦:Greenplum中文社區(qū)創(chuàng)始人姚延棟、啟高信息創(chuàng)始人趙書賢等7位專家聯(lián)袂推薦 (6)豐富案例和圖示:通過淺顯易懂的語言,用豐富的案例和圖示,將復(fù)雜的內(nèi)容簡單化,引導(dǎo)讀者深入學(xué)習(xí),事半功倍。
《高效使用Greenplum:入門、進(jìn)階與數(shù)據(jù)中臺(tái)》資深數(shù)據(jù)架構(gòu)師和數(shù)倉專家10余年經(jīng)驗(yàn)總結(jié) 內(nèi)容簡介
內(nèi)容簡介這不僅是一本從原理到使用、從入門到進(jìn)階講解Greenplum的著作,而且是一本指導(dǎo)企業(yè)用更省錢、更高效地方式使用Greenplum構(gòu)建企業(yè)級(jí)數(shù)據(jù)倉庫和數(shù)據(jù)中臺(tái)的著作。作者在數(shù)據(jù)架構(gòu)和數(shù)據(jù)倉庫一線工作10余年,積累了豐富的項(xiàng)目經(jīng)驗(yàn),他用淺顯易懂的語言、貼近生產(chǎn)環(huán)境的案例、豐富的示意圖例寫作了本書,能幫助讀者快速掌握具有實(shí)戰(zhàn)價(jià)值的知識(shí)。具體地,閱讀本書你將收獲如下內(nèi)容:?掌握數(shù)據(jù)倉庫技術(shù)的發(fā)展歷程和發(fā)展方向;?理解MPP架構(gòu)的架構(gòu)特點(diǎn)和實(shí)現(xiàn)邏輯;?Greenplum數(shù)據(jù)庫的安裝和基本操作;?Greenplum數(shù)據(jù)庫的工作原理;?SQL語句從入門到開發(fā)實(shí)戰(zhàn);?Greenplum數(shù)據(jù)庫ETL相關(guān)功能的具體用途;?機(jī)器學(xué)習(xí)、文本處理、圖計(jì)算、GIS等的入門知識(shí);?掌握Greenplum數(shù)據(jù)庫的運(yùn)維和監(jiān)控要點(diǎn);?全面掌握Greenplum數(shù)據(jù)庫的性能優(yōu)化;?數(shù)據(jù)中臺(tái)的理念和建設(shè)路徑;?數(shù)據(jù)中臺(tái)從接口到智能化應(yīng)用的項(xiàng)目實(shí)戰(zhàn);?零售行業(yè)數(shù)據(jù)中臺(tái)的項(xiàng)目實(shí)戰(zhàn)案例。
《高效使用Greenplum:入門、進(jìn)階與數(shù)據(jù)中臺(tái)》資深數(shù)據(jù)架構(gòu)師和數(shù)倉專家10余年經(jīng)驗(yàn)總結(jié) 目錄
序一
序二
序三
前言
**部分 大數(shù)據(jù)平臺(tái)概述
第1章 大數(shù)據(jù)平臺(tái)技術(shù)的演進(jìn)2
1.1 關(guān)系型數(shù)據(jù)庫2
1.1.1 數(shù)據(jù)庫發(fā)展歷程2
1.1.2 關(guān)系型數(shù)據(jù)庫獨(dú)霸天下4
1.1.3 結(jié)構(gòu)化查詢語言SQL4
1.1.4 列存儲(chǔ)的興起5
1.2 Hadoop生態(tài)系統(tǒng)7
1.2.1 Hadoop概述7
1.2.2 Hadoop生態(tài)圈7
1.2.3 Hadoop的優(yōu)缺點(diǎn)9
1.3 NoSQL的瓶頸和SQL數(shù)據(jù)庫的回歸10
1.3.1 NoSQL產(chǎn)品的發(fā)展10
1.3.2 NoSQL的共性11
1.3.3 SQL數(shù)據(jù)庫的回歸12
1.4 MPP架構(gòu)的興起14
1.4.1 什么是MPP架構(gòu)14
1.4.2 MPP架構(gòu)的蓬勃發(fā)展15
1.4.3 MPP數(shù)據(jù)庫代表—TBase17
1.4.4 淺談HTAP19
第二部分 Greenplum入門
第2章 Greenplum概述24
2.1 Greenplum的前世今生24
2.2 Greenplum數(shù)據(jù)庫架構(gòu)27
2.3 Greenplum數(shù)據(jù)庫的特點(diǎn)28
2.4 Greenplum新特性及展望30
2.5 Greenplum的優(yōu)勢32
第3章 Greenplum的安裝與部署35
3.1 Greenplum數(shù)據(jù)庫安裝過程35
3.1.1 準(zhǔn)備工作35
3.1.2 安裝Master節(jié)點(diǎn)39
3.1.3 復(fù)制安裝包到其他節(jié)點(diǎn)41
3.1.4 初始化Greenplum數(shù)據(jù)庫42
3.2 安裝GPCC43
3.3 Greenplum訪問接口46
3.3.1 CLI46
3.3.2 JDBC47
3.3.3 ODBC48
3.4 Greenplum數(shù)據(jù)庫常用命令48
3.4.1 啟動(dòng)和停止48
3.4.2 修改參數(shù)49
3.4.3 其他常用命令51
3.5 Greenplum性能測試52
第4章 Greenplum使用入門54
4.1 數(shù)據(jù)類型詳解54
4.1.1 基本數(shù)據(jù)類型54
4.1.2 特殊數(shù)據(jù)類型56
4.1.3 組合數(shù)據(jù)類型60
4.2 數(shù)據(jù)表的基本使用62
4.2.1 表對(duì)象定義62
4.2.2 表的基本操作63
4.2.3 數(shù)據(jù)的基本操作64
4.3 數(shù)據(jù)表的高級(jí)應(yīng)用65
4.3.1 數(shù)據(jù)表的存儲(chǔ)特性69
4.3.2 分區(qū)表詳解72
4.3.3 外部表76
4.4 數(shù)據(jù)庫函數(shù)79
4.4.1 數(shù)學(xué)函數(shù)79
4.4.2 三角函數(shù)列表80
4.4.3 字符串函數(shù)和操作符80
4.4.4 類型轉(zhuǎn)換相關(guān)函數(shù)82
4.4.5 自定義函數(shù)83
4.5 數(shù)據(jù)庫的其他對(duì)象85
4.5.1 視圖85
4.5.2 索引85
4.5.3 序列87
第三部分 Greenplum應(yīng)用
第5章 Greenplum查詢詳解90
5.1 SQL語法92
5.1.1 簡單SQL語法92
5.1.2 WITH子句特性95
5.1.3 IN語句和EXISTS語句98
5.1.4 MERGE子句的實(shí)現(xiàn)100
5.2 JOIN操作101
5.3 分析函數(shù)的妙用106
5.4 高級(jí)函數(shù)精選110
第6章 ETL工具箱114
6.1 數(shù)據(jù)加載王者GPLoad114
6.1.1 GPLoad簡介114
6.1.2 GPLoad配置詳解116
6.1.3 GPLoad實(shí)戰(zhàn)118
6.2 自定義存儲(chǔ)過程120
6.2.1 存儲(chǔ)過程介紹 120
6.2.2 存儲(chǔ)過程應(yīng)用模板121
6.2.3 存儲(chǔ)過程精選案例122
6.3 PXF插件131
6.3.1 PXF簡介131
6.3.2 安裝PXF132
6.3.3 PXF實(shí)戰(zhàn)135
6.4 DBLink136
6.4.1 DBLink簡介136
6.4.2 安裝DBLink137
6.4.3 DBlink實(shí)戰(zhàn)139
6.5 拉鏈表142
第7章 Greenplum高級(jí)應(yīng)用147
7.1 開放的編程接口147
7.1.1 PL/Python148
7.1.2 PL/R150
7.2 MADlib機(jī)器學(xué)習(xí)庫153
7.2.1 安裝MADlib154
7.2.2 線性回歸案例157
7.2.3 關(guān)聯(lián)規(guī)則案例158
7.2.4 樸素貝葉斯分類案例159
7.3 半結(jié)構(gòu)化數(shù)據(jù)分析164
7.4 地理空間數(shù)據(jù)分析166
7.5 圖計(jì)算應(yīng)用168
第8章 Greenplum運(yùn)維管理和監(jiān)控172
8.1 數(shù)據(jù)庫管理172
8.1.1 創(chuàng)建和管理數(shù)據(jù)庫172
8.1.2 創(chuàng)建和管理模式173
8.1.3 創(chuàng)建和管理表空間175
8.1.4 創(chuàng)建和管理用戶178
8.1.5 創(chuàng)建和管理資源隊(duì)列180
8.2 可視化監(jiān)控頁面—GPCC183
8.3 管理好幫手—gp_toolkit185
8.4 Greenplum備份和恢復(fù)187
8.5 在線擴(kuò)容工具GPExpand189
8.5.1 Greenplum擴(kuò)容實(shí)戰(zhàn)189
8.5.2 擴(kuò)容原理分析191
8.6 鎖機(jī)制192
8.6.1 鎖管理概述192
8.6.2 普通鎖數(shù)據(jù)結(jié)構(gòu)192
第9章 Greenplum性能優(yōu)化197
9.1 系統(tǒng)級(jí)優(yōu)化197
9.1.1 操作系統(tǒng)選擇197
9.1.2 硬件資源配置198
9.1.3 磁盤讀寫199
9.1.4 節(jié)點(diǎn)之間的網(wǎng)絡(luò)帶寬202
9.1.5 系統(tǒng)參數(shù)202
9.2 數(shù)據(jù)庫級(jí)優(yōu)化204
9.2.1 數(shù)據(jù)庫參數(shù)配置204
9.2.2 資源隊(duì)列206
9.3 表級(jí)優(yōu)化206
9.3.1 建表參數(shù)207
9.3.2 表的優(yōu)化208
9.4 執(zhí)行計(jì)劃和查詢優(yōu)化209
9.4.1 查看執(zhí)行計(jì)劃210
9.4.2 數(shù)據(jù)掃描方式210
9.4.3 分布式執(zhí)行方式213
9.4.4 兩種聚合方式214
9.4.5 關(guān)聯(lián)分類214
9.4.6 優(yōu)化器的選擇216
9.4.7 其他關(guān)鍵術(shù)語217
第10章 Greenplum與開源組件220
10.1 Kettle220
10.2 DataX224
10.3 HDFS、Hive和HBase228
10.4 Spark230
10.5 Kafka235
10.6 Flink238
第11章 Greenplum與BI應(yīng)用244
11.1 Tableau244
11.1.1 Tableau連接Greenplum245
11.1.2 Tableau*佳實(shí)踐要點(diǎn)245
11.2 永洪BI248
11.3 帆軟BI250
11.4 DataV253
11.5 Quick BI253
第四部分 數(shù)據(jù)中臺(tái)實(shí)戰(zhàn)
第12章 數(shù)據(jù)中臺(tái)建設(shè)思路256
12.1 為什么要搭建數(shù)據(jù)中臺(tái)256
12.2 什么是數(shù)據(jù)中臺(tái)258
12.3 如何搭建數(shù)據(jù)中臺(tái)259
12.3.1 數(shù)據(jù)資產(chǎn)盤點(diǎn)和規(guī)劃259
12.3.2 數(shù)據(jù)應(yīng)用規(guī)劃與設(shè)計(jì)260
12.3.3 數(shù)據(jù)平臺(tái)選型與建設(shè)261
12.3.4 數(shù)據(jù)應(yīng)用設(shè)計(jì)與實(shí)現(xiàn)262
12.3.5 組織架構(gòu)調(diào)整與流程變革262
12.4 數(shù)據(jù)中臺(tái)怎么選型263
12.4.1 數(shù)據(jù)倉庫選型263
12.4.2 ETL工具選型265
12.4.3 調(diào)度平臺(tái)選型266
12.4.4 BI工具選型268
第13章 接口數(shù)據(jù)同步270
13.1 全量接口同步270
13.2 增量接口同步276
13.3 流式數(shù)據(jù)同步281
13.4 日志流數(shù)據(jù)同步283
第14章 數(shù)據(jù)建模285
14.1 數(shù)據(jù)建模思想285
14.1.1 Inmon企業(yè)信息化工廠286
14.1.2 Kimball的維度數(shù)據(jù)倉庫287
14.1.3 兩種建模體系的對(duì)比288
14.2 數(shù)據(jù)分層設(shè)計(jì)288
14.2.1 操作數(shù)據(jù)存儲(chǔ)層289
14.2.2 數(shù)據(jù)倉庫層290
14.2.3 數(shù)據(jù)集市層292
14.3 數(shù)據(jù)分層實(shí)戰(zhàn)案例293
14.3.1 ODS層293
14.3.2 DWD層293
14.3.3 DWB層297
14.3.4 DWS層299
14.3.5 ADS層307
14.4 數(shù)據(jù)中臺(tái)命名規(guī)范311
14.4.1 數(shù)據(jù)庫表命名312
14.4.2 數(shù)據(jù)庫字段命名312
14.4.3 腳本命名規(guī)范313
第15章 數(shù)據(jù)中臺(tái)主要配套功能314
15.1 數(shù)據(jù)權(quán)限管理314
15.2 數(shù)據(jù)補(bǔ)錄319
15.3 BI門戶320
15.4 元數(shù)據(jù)管理323
15.5 指標(biāo)管理324
第16章 數(shù)據(jù)中臺(tái)數(shù)據(jù)應(yīng)用328
16.1 商業(yè)智能328
16.2 自助分析平臺(tái)331
16.3 數(shù)據(jù)服務(wù)332
16.4 標(biāo)簽平臺(tái)335
16.5 推薦系統(tǒng)338
第17章 基于Greenplum的數(shù)據(jù)中臺(tái)實(shí)踐案例342
17.1 項(xiàng)目背景342
17.2 項(xiàng)目需求343
17.3 項(xiàng)目技術(shù)實(shí)現(xiàn)344
17.3.1 系統(tǒng)架構(gòu)344
17.3.2 系統(tǒng)ETL分層345
17.3.3 系統(tǒng)調(diào)度任務(wù)346
17.4 智能數(shù)據(jù)應(yīng)用347
17.4.1 自助分析應(yīng)用348
17.4.2 固定報(bào)表349
17.4.3 可視化大屏350
17.4.4 釘釘數(shù)據(jù)服務(wù)351
17.5 典型技術(shù)方案分享352
17.5.1 準(zhǔn)實(shí)時(shí)需求實(shí)現(xiàn)方案352
17.5.2 數(shù)據(jù)庫優(yōu)化方案353
17.5.3 數(shù)據(jù)權(quán)限控制方案355
17.5.4 歷史數(shù)據(jù)離線存儲(chǔ)方案358
17.5.5 系統(tǒng)備份方案358
17.6 典型業(yè)務(wù)方案分享359
17.6.1 零售指標(biāo)同期分析359
17.6.2 零售指標(biāo)節(jié)假日對(duì)比分析361
17.6.3 在庫庫存362
17.6.4 在途庫存363
17.6.5 售罄率365
17.6.6 齊碼率368
17.7 項(xiàng)目總結(jié)370
《高效使用Greenplum:入門、進(jìn)階與數(shù)據(jù)中臺(tái)》資深數(shù)據(jù)架構(gòu)師和數(shù)倉專家10余年經(jīng)驗(yàn)總結(jié) 作者簡介
王春波 資深架構(gòu)師和數(shù)據(jù)倉庫專家,現(xiàn)任上海啟高信息科技有限公司大數(shù)據(jù)架構(gòu)師,Apache Doris和openGauss貢獻(xiàn)者,Greenplum中文社區(qū)參與者。 具有十多年的數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)中臺(tái)項(xiàng)目實(shí)戰(zhàn)經(jīng)驗(yàn),對(duì)大數(shù)據(jù)主流技術(shù)架構(gòu)、產(chǎn)品選型與解決方案有深入研究,尤其擅長用優(yōu)雅的SQL實(shí)現(xiàn)復(fù)雜的邏輯。 常年奔波在各個(gè)項(xiàng)目交付現(xiàn)場,曾成功主導(dǎo)過中國郵政儲(chǔ)蓄銀行、南海農(nóng)商銀行、廣東省聯(lián)社、前海微眾銀行、廣東南粵銀行等多家銀行的管理會(huì)計(jì)項(xiàng)目,以及卡賓、安踏、特步等多家零售鞋服企業(yè)的數(shù)據(jù)中臺(tái)項(xiàng)目。 公眾號(hào)“數(shù)據(jù)中臺(tái)研習(xí)社”運(yùn)營者。
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
隨園食單
- >
山海經(jīng)
- >
推拿
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
名家?guī)阕x魯迅:故事新編
- >
中國歷史的瞬間
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)