中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 Presto實戰

出版社:人民郵電出版社出版時間:2021-03-01
開本: 16開 頁數: 241
中 圖 價:¥77.2(7.8折) 定價  ¥99.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Presto實戰 版權信息

Presto實戰 本書特色

1.Presto是由Facebook開源的高性能分布式SQL查詢引擎,其用戶包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。 2.作為高性能分布式SQL查詢引擎,Presto能夠針對不同的數據源高效、快速地執行交互式分析。大數據的興起使得數據存儲機制多樣化。面對標準不一的存儲系統,你可以利用Presto輕松打破壁壘,連通數據孤島。 3.本書由Presto項目創始成員參與執筆。你將學會用簡單的Presto語句快速查詢多個數據源,把握SQL-on-Anything的精髓。在任何規模、任何存儲系統、任何環境中,你都能發揮SQL的威力。- 入門:探索Presto的用例,學習安裝、配置和使用Presto。 - 進階:深入理解Presto的架構,學習連接器實例和SQL高級特性。 - 實踐:了解如何在生產環境中使用Presto,保證安全性,與其他工具集成。

Presto實戰 內容簡介

隨著各行各業對大數據實時查詢的需求持續增長,數據查詢及分析引擎正變得不可或缺。Presto是由Facebook開源的高性能分布式SQL查詢引擎,其用戶包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。本書由Presto的核心開發人員參與撰寫,教你系統地學習Presto的用法。書中內容涵蓋Presto的安裝、設計理念、查詢操作、很好實踐、與主要云平臺的結合等。本書分為三大部分:部分介紹Presto的基礎知識;第二部分更進一步,介紹Presto架構、集群部署、與數據源的連接等;第三部分講解安全配置以及Presto的實際用例。你可以通過本書學會針對不同的數據源快速執行交互式SQL數據分析,并利用Presto管理和使用海量數據。

Presto實戰 目錄

譯者序 xv
序 xvii
前言 xix
第 一部分 Presto 入門
第 1章 Presto 介紹 3
1.1 大數據帶來的問題 3
1.2 Presto來救場 4
1.2.1 為性能和規模而生 5
1.2.2 SQL-on-Anything 5
1.2.3 存儲與計算分離 6
1.3 Presto使用場景 6
1.3.1 單一的SQL分析訪問點 7
1.3.2 數據倉庫和數據源系統的訪問點 7
1.3.3 提供對任何內容的SQL訪問 8
1.3.4 聯邦查詢 9
1.3.5 虛擬數據倉庫的語義層 9
1.3.6 數據湖查詢引擎 9
1.3.7 SQL轉換和ETL10
1.3.8 更快的響應帶來更好的數據見解 10
1.3.9 大數據、機器學習和人工智能 10
1.3.10 其他使用場景 11
1.4 Presto 資源 11
1.4.1 官方網站 11
1.4.2 文檔 12
1.4.3 社區交流 12
1.4.4 源代碼、許可證和版本 12
1.4.5 貢獻 12
1.4.6 本書資源 13
1.4.7 鳶尾花數據集 13
1.4.8 航班數據集 14
1.5 Presto簡史 14
1.6 小結 15
第 2章 安裝和配置Presto 16
2.1 使用Docker容器嘗試Presto 16
2.2 使用歸檔文件安裝 17
2.2.1 JVM 17
2.2.2 Python 18
2.2.3 安裝 18
2.2.4 配置 19
2.3 添加數據源 20
2.4 運行Presto 21
2.5 小結 21
第3章 使用Presto 22
3.1 Presto CLI 22
3.1.1 使用入門 22
3.1.2 分頁 25
3.1.3 命令歷史 25
3.1.4 額外診斷 25
3.1.5 執行查詢 25
3.1.6 輸出格式 26
3.1.7 忽略錯誤 26
3.2 Presto JDBC驅動 27
3.2.1 下載和注冊驅動 28
3.2.2 創建到Presto的連接 29
3.3 Presto與ODBC 31
3.4 客戶端庫 31
3.5 Presto Web UI 31
3.6 使用Presto執行SQL 32
3.6.1 概念 33
3.6.2 入門案例 33
3.7 小結 36
第二部分 深入理解Presto
第4章 Presto的架構 39
4.1 集群中的協調器和工作節點 39
4.2 協調器 41
4.3 節點發現服務 41
4.4 工作節點 42
4.5 基于連接器的架構 42
4.6 catalog、schema和表 43
4.7 查詢執行模型 44
4.8 查詢優化 47
4.8.1 解析和分析 48
4.8.2 初始查詢計劃 49
4.9 優化規則 50
4.9.1 謂詞下推 51
4.9.2 Cross Join 消除 51
4.9.3 TopN 52
4.9.4 局部聚合 52
4.10 實現規則 53
4.10.1 Lateral Join 去關聯化 53
4.10.2 Semi-join(IN)去關聯化 54
4.11 基于代價的優化器 55
4.11.1 代價的概念 55
4.11.2 Join的代價 57
4.11.3 表統計信息 57
4.11.4 過濾統計信息 58
4.11.5 分區表的統計信息 59
4.11.6 Join枚舉 60
4.11.7 廣播Join和分布式Join 60
4.12 使用表統計信息 62
4.12.1 Presto的ANALYZE 命令 62
4.12.2 在寫入存儲時收集數據 63
4.12.3 Hive的ANALYZE 命令 63
4.12.4 顯示表統計信息 63
4.13 小結 64
第5章 生產環境部署 65
5.1 配置細節 65
5.2 服務端配置 65
5.3 日志 66
5.4 節點配置 67
5.5 JVM配置 68
5.6 啟動器 69
5.7 集群安裝 70
5.8 使用RPM安裝 72
5.8.1 安裝目錄結構 72
5.8.2 配置 73
5.8.3 卸載Presto 73
5.9 在云上安裝 73
5.10 集群規模的考量 74
5.11 小結 74
第6章 連接器 75
6.1 配置 76
6.2 RDBMS連接器示例:PostgreSQL 76
6.2.1 查詢下推 78
6.2.2 并行性和并發性 79
6.2.3 其他RDBMS連接器 80
6.2.4 安全性 81
6.3 Presto TPC-H和TPC-DS連接器 81
6.4 用于分布式存儲數據源的Hive 連接器 82
6.4.1 Apache Hadoop和Hive 82
6.4.2 Hive連接器 83
6.4.3 Hive式表格式 85
6.4.4 內部表與外部表 85
6.4.5 分區數據 87
6.4.6 加載數據 88
6.4.7 文件格式和壓縮 90
6.4.8 MinIO示例 91
6.5 非關系數據源 91
6.6 Presto JMX 連接器 92
6.7 黑洞連接器 94
6.8 內存連接器 94
6.9 其他連接器 95
6.10 小結 95
第7章 高級連接器實例 96
7.1 用Phoenix連接HBase 96
7.2 鍵值存儲連接器示例:Accumulo 97
7.2.1 使用Presto Accumulo連接器 100
7.2.2 Accumulo中的謂詞下推 102
7.3 Apache Cassandra 連接器 103
7.4 流式系統連接器示例:Kafka 104
7.5 文檔存儲連接器示例:Elasticsearch 106
7.5.1 概述 106
7.5.2 配置和使用方法 106
7.5.3 查詢處理 107
7.5.4 全文搜索 107
7.5.5 總結 108
7.6 Presto中的聯邦查詢 108
7.7 ETL和聯合查詢 114
7.8 小結 114
第8章 在Presto中使用SQL 115
8.1 Presto語句 116
8.2 Presto系統表 118
8.3 catalog 120
8.4 schema 120
8.5 Information Schema 121
8.6 表 122
8.6.1 表和列屬性 124
8.6.2 復制現有的表 125
8.6.3 從查詢結果中新建表 126
8.6.4 修改表 127
8.6.5 刪除表 127
8.6.6 連接器對表操作的限制 127
8.7 視圖 128
8.8 會話信息和配置 128
8.9 數據類型 129
8.9.1 集合數據類型 131
8.9.2 時態數據類型 132
8.9.3 類型轉換 135
8.10 SELECT語句基礎 136
8.11 WHERE子句 137
8.12 GROUP BY和HAVING子句 138
8.13 ORDER BY子句和LIMIT子句 140
8.14 JOIN語句 140
8.15 UNION、INTERSECT和EXCEPT子句 141
8.16 分組操作 143
8.17 WITH子句 144
8.18 子查詢 145
8.18.1 標量子查詢 145
8.18.2 EXISTS子查詢 146
8.18.3 集合比較子查詢 146
8.19 從表中刪除數據 147
8.20 小結 147
第9章 高級SQL特性 148
9.1 函數和運算符介紹 148
9.2 標量函數和運算符 149
9.3 布爾運算符 150
9.4 邏輯運算符 151
9.5 用BETWEEN語句選擇范圍 152
9.6 用IS(NOT) NULL檢測值的存在 152
9.7 數學函數和運算符 152
9.8 三角函數153
9.9 常數和隨機函數 154
9.10 字符串函數和運算符 154
9.11 字符串和映射 155
9.12 Unicode 156
9.13 正則表達式 158
9.14 解嵌套復雜數據類型 160
9.15 JSON函數 161
9.16 日期和時間函數及運算符 161
9.17 直方圖 164
9.18 聚合函數 165
9.18.1 映射聚合函數 165
9.18.2 近似聚合函數 167
9.19 窗函數 168
9.20 lambda表達式 169
9.21 地理空間函數 170
9.22 Prepared Statement 171
9.23 小結 173
第三部分 Presto的實際應用
第 10章 安全 177
10.1 認證 178
10.2 授權 181
10.2.1 系統訪問控制 181
10.2.2 連接器訪問控制 184
10.3 加密 186
10.3.1 加密Presto客戶端與協調器之間的通信 188
10.3.2 創建Java keystore和Java truststore 190
10.3.3 在Presto集群內加密通信 192
10.4 CA與自簽名證書 193
10.5 證書認證 194
10.6 Kerberos 197
10.6.1 前提條件 198
10.6.2 Kerberos客戶端認證 198
10.6.3 集群內部Kerberos 198
10.7 數據源訪問和安全配置 199
10.8 使用Hive連接器進行Kerberos驗證 200
10.8.1 Hive Metastore Thrift服務認證 201
10.8.2 HDFS認證 201
10.9 集群分離 202
10.10 小結 202
第 11章 將Presto與其他工具集成 203
11.1 使用Apache Superset進行查詢、可視化和更多操作 203
11.2 使用RubiX提高性能 204
11.3 使用Apache Airflow的工作流 205
11.4 嵌入式Presto示例:Amazon Athena 205
11.5 Starburst企業版Presto 208
11.6 其他集成案例 208
11.7 自定義集成 209
第 12章 生產環境中的Presto 211
12.1 使用Presto Web UI監控 211
12.1.1 集群級的細節 212
12.1.2 查詢列表 213
12.1.3 查詢細節視圖 215
12.2 Presto SQL查詢調優 221
12.3 內存管理 223
12.4 任務并發性 226
12.5 工作節點調度 227
12.5.1 根據任務或節點調度切片 227
12.5.2 本地調度策略 227
12.6 網絡數據交換 228
12.6.1 并發性 228
12.6.2 緩沖區大小 228
12.7 JVM調優 228
12.8 資源組 230
12.8.1 資源組的定義 231
12.8.2 調度策略 232
12.8.3 選擇器規則定義 233
12.9 小結 233
第 13章 真實世界的案例 234
13.1 部署和運行時平臺 234
13.2 集群規模 235
13.3 Hadoop/Hive遷移的使用場景 237
13.4 其他數據源 237
13.5 用戶和流量 237
13.6 小結 238
第 14章 總結 239
關于作者 240
關于封面 240
展開全部

Presto實戰 作者簡介

馬特.富勒(Matt Fuller)Starburst公司聯合創始人。曼弗雷德.莫澤(Manfred Moser)開源社區擁護者、技術作家、培訓師,Starburst公司軟件工程師。馬丁.特拉韋爾索(Martin Traverso)Presto項目創始成員,Presto軟件基金會聯合創始人,Starburst公司首席技術官。【譯者簡介】張晨畢業于上海交通大學,熱愛大數據技術、數據庫、分布式系統和函數式編程,現于Indeed東京擔任軟件工程師。黃鵬程畢業于北京郵電大學,專注于數據庫和大數據平臺的開發與架構工作。曾就職于中國民生銀行,擔任大數據基礎架構團隊負責人。現任阿里云高級產品專家,負責阿里云數據庫相關產品的設計與規劃工作。傅宇畢業于南京大學,專注于數據庫技術,現任阿里云技術專家,擔任PolarDB-X云原生分布式數據庫內核研發工作,熟悉分布式事務、查詢優化器和執行器,對大數據領域充滿熱情。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 一体式钢筋扫描仪-楼板测厚仪-裂缝检测仪-泰仕特(北京) | 陕西自考报名_陕西自学考试网| MTK核心板|MTK开发板|MTK模块|4G核心板|4G模块|5G核心板|5G模块|安卓核心板|安卓模块|高通核心板-深圳市新移科技有限公司 | 合肥活动房_安徽活动板房_集成打包箱房厂家-安徽玉强钢结构集成房屋有限公司 | 压缩空气冷冻式干燥机_吸附式干燥机_吸干机_沪盛冷干机 | 座椅式升降机_无障碍升降平台_残疾人升降平台-南京明顺机械设备有限公司 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 南京PVC快速门厂家南京快速卷帘门_南京pvc快速门_世界500强企业国内供应商_南京美高门业 | 圆周直径尺-小孔内视镜-纤维研磨刷-东莞市高腾达精密工具 | 大型工业风扇_工业大风扇_大吊扇_厂房车间降温-合昌大风扇 | 不锈钢法兰-碳钢法兰-法兰盘生产加工厂家-[鼎捷峰]-不锈钢法兰-碳钢法兰-法兰盘生产加工厂家-[鼎捷峰] | 高博医疗集团上海阿特蒙医院| 活性炭厂家-蜂窝活性炭-粉状/柱状/果壳/椰壳活性炭-大千净化-活性炭 | 武汉高温老化房,恒温恒湿试验箱,冷热冲击试验箱-武汉安德信检测设备有限公司 | 济南ISO9000认证咨询代理公司,ISO9001认证,CMA实验室认证,ISO/TS16949认证,服务体系认证,资产管理体系认证,SC食品生产许可证- 济南创远企业管理咨询有限公司 郑州电线电缆厂家-防火|低压|低烟无卤电缆-河南明星电缆 | 西安标准厂房_陕西工业厂房_西咸新区独栋厂房_长信科技产业园官方网站 | 洁净棚-洁净工作棚-无菌室-净化工程公司_北京卫护科技有限公司 | _网名词典_网名大全_qq网名_情侣网名_个性网名 | 河南卓美创业科技有限公司-河南卓美防雷公司-防雷接地-防雷工程-重庆避雷针-避雷器-防雷检测-避雷带-避雷针-避雷塔、机房防雷、古建筑防雷等-山西防雷公司 | 纸箱抗压机,拉力机,脂肪测定仪,定氮仪-山东德瑞克仪器有限公司 | 依维柯自动挡房车,自行式国产改装房车,小型房车价格,中国十大房车品牌_南京拓锐斯特房车 - 南京拓锐斯特房车 | 螺钉式热电偶_便携式温度传感器_压簧式热电偶|无锡联泰仪表有限公司|首页 | 企业彩铃制作_移动、联通、电信集团彩铃上传开通_彩铃定制_商务彩铃管理平台-集团彩铃网 | 氢氧化钾厂家直销批发-济南金昊化工有限公司 | 转向助力泵/水泵/发电机皮带轮生产厂家-锦州华一精工有限公司 | 南京技嘉环保科技有限公司-杀菌除臭剂|污水|垃圾|厕所|橡胶厂|化工厂|铸造厂除臭剂 | 书信之家_书信标准模板范文大全 最新范文网_实用的精品范文美文网 | 无线遥控更衣吊篮_IC卡更衣吊篮_电动更衣吊篮配件_煤矿更衣吊篮-力得电子 | 武汉天安盾电子设备有限公司 - 安盾安检,武汉安检门,武汉安检机,武汉金属探测器,武汉测温安检门,武汉X光行李安检机,武汉防爆罐,武汉车底安全检查,武汉液体探测仪,武汉安检防爆设备 | 上海办公室装修,办公楼装修设计,办公空间设计,企业展厅设计_写艺装饰公司 | 外观设计_设备外观设计_外观设计公司_产品外观设计_机械设备外观设计_东莞工业设计公司-意品深蓝 | 东莞市天进机械有限公司-钉箱机-粘箱机-糊箱机-打钉机认准东莞天进机械-厂家直供更放心! | 纯水电导率测定仪-万用气体检测仪-低钠测定仪-米沃奇科技(北京)有限公司www.milwaukeeinst.cn 锂辉石检测仪器,水泥成分快速分析仪-湘潭宇科分析仪器有限公司 手术室净化装修-手术室净化工程公司-华锐手术室净化厂家 | 专业生物有机肥造粒机,粉状有机肥生产线,槽式翻堆机厂家-郑州华之强重工科技有限公司 | 拉力测试机|材料拉伸试验机|电子拉力机价格|万能试验机厂家|苏州皖仪实验仪器有限公司 | 造价工程师网,考试时间查询,报名入口信息-网站首页 | 上海电子秤厂家,电子秤厂家价格,上海吊秤厂家,吊秤供应价格-上海佳宜电子科技有限公司 | 伊卡洛斯软装首页-电动窗帘,别墅窗帘,定制窗帘,江浙沪1000+别墅窗帘案例 | 凝胶成像系统(wb成像系统)百科-上海嘉鹏 | 飞扬动力官网-广告公司管理软件,广告公司管理系统,喷绘写真条幅制作管理软件,广告公司ERP系统 | 风化石头制砂机_方解石制砂机_瓷砖石子制砂机_华盛铭厂家 |