-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
TRINO權威指南(原書第2版) 版權信息
- ISBN:9787111731603
- 條形碼:9787111731603 ; 978-7-111-73160-3
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
TRINO權威指南(原書第2版) 本書特色
使用Trino高性能分布式SQL查詢引擎可以對不同的數據源進行快速交互式分析。在本書中,你將學習如何在不遷移數據的情況下對數據進行分析。需要分析的數據,可以存在于使用Hive的傳統數據湖中,或者存在于使用Iceberg、Delta Lake等格式的湖倉一體系統中,或者存在于Cassandra、Kafka或SingleStore等異構系統中,還可以存在于PostgreSQL或Oracle等關系型數據庫中。
數據分析師、軟件工程師和產品工程師可以學習如何管理、使用Trino,甚至使用Trino進行開發,并使其成為自己的數據平臺的關鍵部分。本書將向你展示如何使用一個Trino查詢合并來自多個來源的數據,以便在整個組織中進行數據分析。
通過閱讀本書,你將:
? 探索Trino的使用場景,了解與Trino相關的各類工具。
? 學習Trino的內部工作原理,包括如何連接和查詢數據源,以及Trino支持的SQL語句、運算符、函數等。
? 了解Trino的安全機制、大規模部署能力、監控工作負載、調優查詢,并連接更多應用程序。
? 了解其他組織如何成功應用Trino。
TRINO權威指南(原書第2版) 內容簡介
本書詳細介紹了開源的分布式SQL查詢引擎Trino涉及的方方面面的知識。本書共三部分,**部分介紹Trino的發展歷史、主要功能以及如何安裝和使用它,第二部分介紹Trino的內部架構、部署、連接器和所支持的SQL語句的使用等,第三部分介紹在生產環境中部署Trino的推薦知識,以及一些真實世界的部署案例。通過學習本書,你將了解Trino在解決海量數據分析和查詢問題方面的優越性,并學會在現實場景中使用它來高效地解決需要在短時間內返回結果的大數據查詢問題。
TRINO權威指南(原書第2版) 目錄
序1
前言3
**部分 Trino入門
第1章 Trino介紹9
1.1 大數據帶來的問題9
1.2 Trino來救場10
1.3 Trino使用場景13
1.4 Trino資源17
1.5 Trino簡史21
1.6 小結22
第2章 安裝和配置Trino23
2.1 使用Docker容器探索Trino23
2.2 使用歸檔文件安裝Trino24
2.3 添加數據源27
2.4 運行Trino28
2.5 小結28
第3章 使用Trino29
3.1 Trino CLI29
3.2 Trino JDBC驅動34
3.3 Trino與ODBC38
3.4 客戶端庫38
3.5 Trino Web UI39
3.6 使用Trino執行SQL39
3.7 小結43
第二部分 深入理解Trino
第4章 Trino架構47
4.1 集群中的協調器和工作節點47
4.2基于連接器的架構50
4.3 catalog、schema和表52
4.4 查詢執行模型52
4.5 查詢計劃55
4.6 優化規則59
4.7 實現規則61
4.8 基于代價的優化器63
4.9 使用表統計信息70
4.10 小結72
第5章 生產環境部署74
5.1 配置細節74
5.2 服務端配置74
5.3 日志75
5.4 節點配置76
5.5 JVM配置77
5.6 啟動器77
5.7 集群安裝79
5.8 使用RPM安裝80
5.9在云上安裝82
5.10 用Helm chart部署Kubernetes83
5.11 考慮集群規模84
5.12 小結85
第6章 連接器86
6.1 配置87
6.2 RDBMS連接器示例:PostgreSQL87
6.3 TPC-H連接器和TPC-DS連接器93
6.4 用于分布式存儲數據源的Hive連接器94
6.5 現代分布式存儲管理和分析103
6.6 非關系型數據源105
6.7 Trino JMX連接器105
6.8 black hole連接器107
6.9內存連接器107
6.10 其他連接器108
6.11 小結108
第7章 高級連接器示例109
7.1 用Phoenix連接HBase109
7.2 鍵值存儲連接器示例:Accumulo110
7.3 Apache Cassandra連接器117
7.4 流系統連接器示例:Kafka117
7.5 文檔存儲連接器示例:Elasticsearch119
7.6 Trino中的聯邦查詢122
7.7 ETL和聯邦查詢128
7.8 小結128
第8章 在Trino中使用SQL129
8.1 Trino語句130
8.2 Trino系統表132
8.3 catalog134
8.4 schema135
8.5 information schema136
8.6 表137
8.7 視圖143
8.8 會話信息和配置144
8.9 數據類型145
8.10 SELECT語句基礎153
8.11 WHERE子句154
8.12 GROUP BY和HAVING子句155
8.13 ORDER BY子句和LIMIT子句157
8.14 JOIN語句157
8.15 UNION、INTERSECT和EXCEPT子句159
8.16 分組操作160
8.17 WITH子句161
8.18 子查詢163
8.19 從表中刪除數據165
8.20 小結165
第9章 高級SQL特性166
9.1 函數和運算符介紹166
9.2 標量函數和運算符167
9.3 布爾運算符167
9.4邏輯運算符169
9.5 用BETWEEN語句選擇范圍170
9.6 用IS (NOT) NULL檢測值的存在170
9.7 數學函數和運算符170
9.8 三角函數171
9.9 常數和隨機函數172
9.10 字符串函數和運算符172
9.11 字符串和映射174
9.12 Unicode174
9.13 正則表達式176
9.14 解嵌套復雜數據類型178
9.15 JSON函數180
9.16 日期和時間函數及運算符180
9.17 直方圖183
9.18 聚合函數184
9.19 窗函數187
9.20 lambda表達式189
9.21 地理空間函數189
9.22 預處理語句190
9.23 小結192
第三部分 Trino的實際應用
第10章 安全195
10.1 認證196
10.2 授權199
10.3 加密204
10.4 CA與自簽名證書212
10.5 證書認證213
10.6 Kerberos216
10.7 數據源訪問和安全配置217
10.8 使用Hive連接器進行Kerberos認證219
10.9 集群分離220
10.10 小結220
第11章 將Trino與其他工具集成221
11.1 使用Apache Superset進行查詢、可視化和更多操作221
11.2 使用RubiX提高性能222
11.3 使用Apache Airflow的工作流222
11.4 嵌入式Trino示例:Amazon Athena223
11.5 企業版:Starburst Enterprise和Starburst Galaxy226
11.6 其他集成示例227
11.7 自定義集成228
11.8 小結228
第12章 生產環境中的Trino229
12.1 使用Trino Web UI進行監控229
12.2 Trino SQL查詢調優240
12.3 內存管理243
12.4 任務并發性246
12.5 工作節點調度246
12.6 網絡數據交換247
12.7 JVM調優247
12.8 資源組249
12.9 小結253
第13章 真實世界案例254
13.1 部署和運行時平臺254
13.2 集群規模255
13.3 Hadoop/Hive遷移的使用場景257
13.4 其他數據源257
13.5 用戶和流量258
13.6 小結258
總結259
TRINO權威指南(原書第2版) 作者簡介
Matt Fuller,是Starburst的聯合創始人,這是一家數據訪問和分析公司。 Manfred Moser,是Starburst的社區倡導者、作家、培訓師和軟件工程師。 Martin Traverso,是Trino軟件基金會的聯合創始人、Starburst的首席技術官和Trino的聯合創始人。
- >
山海經
- >
我與地壇
- >
小考拉的故事-套裝共3冊
- >
回憶愛瑪儂
- >
上帝之肋:男人的真實旅程
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
我從未如此眷戀人間
- >
朝聞道