中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >>
大數(shù)據(jù)SQL優(yōu)化 原理與實(shí)踐

包郵 大數(shù)據(jù)SQL優(yōu)化 原理與實(shí)踐

出版社:機(jī)械工業(yè)出版社出版時(shí)間:2025-01-01
開本: 16開 頁數(shù): 384
中 圖 價(jià):¥69.3(7.0折) 定價(jià)  ¥99.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
開年大促, 全場(chǎng)包郵
?新疆、西藏除外
本類五星書更多>

大數(shù)據(jù)SQL優(yōu)化 原理與實(shí)踐 版權(quán)信息

大數(shù)據(jù)SQL優(yōu)化 原理與實(shí)踐 本書特色

大數(shù)據(jù)優(yōu)化經(jīng)歷了從SQL優(yōu)化到各種優(yōu)化理論、技術(shù)、產(chǎn)品的過程,目前發(fā)展到再次回歸SQL優(yōu)化的階段。SQL是大數(shù)據(jù)優(yōu)化的根本,也是必然歸宿。但是很多大數(shù)據(jù)相關(guān)從業(yè)者已經(jīng)迷失在了繁多的優(yōu)化理論和技術(shù)中,他們?cè)诿娴谋姸嗥脚_(tái)、插件等各類產(chǎn)品時(shí),會(huì)通過各種不同的技術(shù)進(jìn)行優(yōu)化工作,但是*終得到的效果并不能盡如人意。本書兩位作者作為長(zhǎng)期活躍在大廠研發(fā)一線的工程師,不僅對(duì)大數(shù)據(jù)優(yōu)化有深入理解,還一直抱有一顆工匠之心,長(zhǎng)期研究大數(shù)據(jù)優(yōu)化的底層邏輯,*終總結(jié)得到一條可以從底層實(shí)現(xiàn)優(yōu)化的方法,這套方法論具有一定的普適性。本書就是對(duì)這套方法論的完整呈現(xiàn)和深度分享。

大數(shù)據(jù)SQL優(yōu)化 原理與實(shí)踐 內(nèi)容簡(jiǎn)介

這是一本站在一線開發(fā)人員的視角,從SQL的本質(zhì)出發(fā),采用理論與實(shí)踐相結(jié)合、案例與分析相結(jié)合、作者經(jīng)驗(yàn)與一線需求相結(jié)合的方式,深度解讀大數(shù)據(jù)SQL優(yōu)化核心技術(shù)和解決方案的工具書。本書主要面向大數(shù)據(jù)初中級(jí)技術(shù)人員,期望幫大家深度理解大數(shù)據(jù)SQL優(yōu)化原理,掌握SQL優(yōu)化的落地實(shí)踐方法,從而真正“玩轉(zhuǎn)”大數(shù)據(jù)SQL優(yōu)化技術(shù),根據(jù)實(shí)際問題和需求設(shè)計(jì)出有針對(duì)性的提升SQL性能的解決方案。 本書共分為4篇,包括10章。 認(rèn)知篇(第1章)主要面向初學(xué)者闡述為什么大數(shù)據(jù)計(jì)算或存儲(chǔ)引擎發(fā)展至今*終選擇SQL作為統(tǒng)一查詢語言的原因及利弊,大數(shù)據(jù)SQL從業(yè)者目前面臨的主要問題,以及調(diào)優(yōu)的兩個(gè)根本目標(biāo)。 原理篇(第2章)以深入淺出的方式解讀SQL的本質(zhì)。為了降低讀者理解的門檻,本篇還以Hive、Spark和Flink這三個(gè)主流的引擎為例,從源碼的角度探索SQL執(zhí)行背后的秘密。 實(shí)踐篇(第3~9章)首先深入解讀引擎查詢優(yōu)化器的兩大優(yōu)化策略——基于規(guī)則的優(yōu)化和基于代價(jià)的優(yōu)化的實(shí)現(xiàn)原理、示例和局限性,然后以Hive、Spark、Flink等主流引擎為藍(lán)本,探索SQL優(yōu)化(包括結(jié)構(gòu)與參數(shù)調(diào)優(yōu)、子查詢優(yōu)化、連接優(yōu)化、聚合優(yōu)化)的解決思路和方法論,并給出作者多年總結(jié)的一些“坑”。 案例篇(第10章)以實(shí)踐篇的各種真實(shí)需求調(diào)優(yōu)歷程為基礎(chǔ),以點(diǎn)帶面,以小明大,分享電商、金融、銀行這三個(gè)典型行業(yè)的典型公司大數(shù)據(jù)SQL調(diào)優(yōu)案例,還給出了內(nèi)容平臺(tái)數(shù)倉(cāng)、查詢高可用、實(shí)時(shí)性數(shù)倉(cāng)等業(yè)務(wù)場(chǎng)景的解決方案。

大數(shù)據(jù)SQL優(yōu)化 原理與實(shí)踐 目錄

目 錄 Contents前言認(rèn)知篇第1章 概述21.1 大數(shù)據(jù)的發(fā)展歷程21.2 大數(shù)據(jù)為什么選用SQL41.2.1 標(biāo)準(zhǔn)化語言51.2.2 聲明式編程61.2.3 借鑒關(guān)系數(shù)據(jù)庫(kù)成熟理論81.3 大數(shù)據(jù)SQL的弊端91.3.1 易學(xué)難精91.3.2 表達(dá)能力有限101.3.3 與關(guān)系型數(shù)據(jù)庫(kù)求同存異121.4 為什么要調(diào)優(yōu)13目 錄 Contents前言認(rèn)知篇第1章 概述21.1 大數(shù)據(jù)的發(fā)展歷程21.2 大數(shù)據(jù)為什么選用SQL41.2.1 標(biāo)準(zhǔn)化語言51.2.2 聲明式編程61.2.3 借鑒關(guān)系數(shù)據(jù)庫(kù)成熟理論81.3 大數(shù)據(jù)SQL的弊端91.3.1 易學(xué)難精91.3.2 表達(dá)能力有限101.3.3 與關(guān)系型數(shù)據(jù)庫(kù)求同存異121.4 為什么要調(diào)優(yōu)131.4.1 降本提效131.4.2 知其然并知其所以然15原理篇第2章 SQL的本質(zhì)182.1 執(zhí)行過程提煉182.2 抽象語法樹202.3 SQL抽象語法樹222.4 Hive執(zhí)行原理242.4.1 詞法解析252.4.2 語義分析262.4.3 邏輯優(yōu)化282.4.4 物理優(yōu)化292.5 Spark執(zhí)行原理302.5.1 詞法解析322.5.2 語義分析342.5.3 邏輯優(yōu)化362.5.4 物理優(yōu)化372.6 Flink執(zhí)行原理392.6.1 詞法解析402.6.2 語義分析422.6.3 邏輯優(yōu)化432.6.4 物理優(yōu)化45實(shí)踐篇第3章 任勞任怨的引擎503.1 基于規(guī)則優(yōu)化概述513.1.1 謂詞下推523.1.2 常量堆疊543.1.3 常量傳遞553.1.4 等式傳遞553.1.5 布爾表達(dá)式簡(jiǎn)化563.1.6 BETWEEN-AND重寫573.1.7 NOT取反重寫583.1.8 簡(jiǎn)化IF/CASE WHEN條件   表達(dá)式593.1.9 優(yōu)化LIKE正則表達(dá)式593.1.10 簡(jiǎn)化CAST表達(dá)式603.1.11 簡(jiǎn)化UPPER/LOWER表    達(dá)式603.1.12 優(yōu)化二元表達(dá)式613.1.13 簡(jiǎn)化復(fù)雜類型數(shù)據(jù)結(jié)構(gòu)的    操作符613.1.14 合并投影623.1.15 列裁剪623.1.16 優(yōu)化冗余別名623.1.17 替換NULL表達(dá)式633.1.18 CONCAT合并633.1.19 等式變換643.1.20 不等式變換643.2 基于代價(jià)優(yōu)化的簡(jiǎn)析643.3 兩種優(yōu)化的局限性70第4章 調(diào)優(yōu)解決方案734.1 理解業(yè)務(wù),選擇需求734.2 利用執(zhí)行計(jì)劃764.3 利用統(tǒng)計(jì)信息794.4 利用日志824.5 利用分析工具874.5.1 Dr.Elephant874.5.2 火焰圖934.5.3 Prometheus944.6 等價(jià)重寫思想984.6.1 關(guān)系代數(shù)994.6.2 等價(jià)變換規(guī)則100第5章 結(jié)構(gòu)與參數(shù)調(diào)優(yōu)1035.1 參數(shù)調(diào)優(yōu)1035.1.1 并行執(zhí)行1035.1.2 預(yù)聚合1055.1.3 擴(kuò)大并行度1085.1.4 內(nèi)存分配1135.1.5 數(shù)據(jù)重用1175.1.6 Kafka限流1195.2 利用Hint1255.3 合理的表設(shè)計(jì)1265.3.1 小文件合并1265.3.2 分區(qū)表1305.3.3 分桶表1325.3.4 物化視圖1335.4.存儲(chǔ)調(diào)整1405.4.1 存儲(chǔ)格式1425.4.2 壓縮類型147第6章 子查詢優(yōu)化案例解析1506.1 案例分享1516.1.1 子查詢改寫為JOIN1516.1.2 避免全表掃描1546.1.3 避免無效過濾條件1576.1.4 子查詢改寫為窗口函數(shù)1586.1.5 復(fù)雜UDF緩存1606.1.6 子查詢改寫為半連接1646.2 深度剖析1676.2.1 讓人又愛又恨的子查詢1676.2.2 子查詢消除算法1686.2.3 子查詢合并算法177第7章 連接優(yōu)化案例解析1817.1 案例分享1817.1.1 改寫為UNION1817.1.2 強(qiáng)制廣播1857.1.3 使用Bucket Join1907.1.4 數(shù)據(jù)打散1927.1.5 謹(jǐn)慎對(duì)待關(guān)聯(lián)鍵的數(shù)據(jù)類型1967.1.6 傾斜數(shù)據(jù)分離1997.1.7 慎用外連接2027.1.8 流Join的實(shí)現(xiàn)2057.1.9 手動(dòng)過濾下推2097.1.10 先聚合,再關(guān)聯(lián)2157.1.11 一對(duì)一再膨脹策略2167.2 深度剖析2187.2.1 連接實(shí)現(xiàn)2187.2.2 外連接消除算法2207.2.3 連接排序算法222第8章 聚合優(yōu)化案例解析2358.1 分而治之2358.2 兩階段聚合2378.3 多維聚合轉(zhuǎn)UNION2418.4 異常值過濾2448.5 去重轉(zhuǎn)為求和/計(jì)數(shù)2468.6 使用其他結(jié)構(gòu)去重 2498.7 善用標(biāo)簽2528.8 避免使用FINAL2558.9 轉(zhuǎn)為二進(jìn)制處理2588.10 行列互置的處理辦法2638.11 炸裂函數(shù)中的謂詞下推2698.12 數(shù)據(jù)膨脹導(dǎo)致的任務(wù)異常2738.13 用MAX替換排序278第9章 SQL優(yōu)化的“*后一公里”2819.1 謹(jǐn)慎操作NULL值2819.2 決定性能的關(guān)鍵—Shuffle2849.3 數(shù)據(jù)傾斜的危害2949.4 切莫盲目升級(jí)版本2979.5 引擎自優(yōu)化的利弊308案例篇第10章 實(shí)戰(zhàn)案例分享31410.1 某電商業(yè)務(wù)營(yíng)銷活動(dòng)實(shí)時(shí)指標(biāo)   優(yōu)化方案31410.2 某金融業(yè)務(wù)風(fēng)控行為實(shí)時(shí)指標(biāo)   優(yōu)化方案32710.3 某銀行監(jiān)管項(xiàng)目實(shí)時(shí)指標(biāo)優(yōu)化   方案33110.4 某內(nèi)容平臺(tái)數(shù)倉(cāng)建設(shè)歷程33810.4.1 建模指導(dǎo)思想33910.4.2 數(shù)倉(cāng)架構(gòu)設(shè)計(jì)34010.4.3 數(shù)倉(cāng)建設(shè)理論3431
展開全部

大數(shù)據(jù)SQL優(yōu)化 原理與實(shí)踐 作者簡(jiǎn)介

陳鶴大數(shù)據(jù)專家和架構(gòu)師,現(xiàn)任東南亞某電商公司大數(shù)據(jù)專家,曾就職于VIVO等大廠。長(zhǎng)期從事大數(shù)據(jù)架構(gòu)、實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)、流批一體與數(shù)據(jù)應(yīng)用平臺(tái)架構(gòu)研發(fā)工作。在Hadoop、Spark、Flink等方面積累了豐富的經(jīng)驗(yàn)。曾先后主導(dǎo)或參與了多個(gè)電商、金融領(lǐng)域的數(shù)據(jù)體系建設(shè)、疑難項(xiàng)目改造、數(shù)據(jù)平臺(tái)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)項(xiàng)目。數(shù)據(jù)之力技術(shù)叢書編委會(huì)委員,PowerData社區(qū)核心成員,擁有豐富的大數(shù)據(jù)相關(guān)寫作和授課經(jīng)驗(yàn)。楊國(guó)棟數(shù)據(jù)之力技術(shù)叢書編委會(huì)主任,杭州電子科技大學(xué)碩士,前騰訊軟件工程師,《Apache Pulsar原理解析與應(yīng)用實(shí)踐》作者。一直就職于頭部互聯(lián)網(wǎng)公司,從事大數(shù)據(jù)平臺(tái)與基礎(chǔ)架構(gòu)研發(fā)相關(guān)工作,在大數(shù)據(jù)引擎與消息隊(duì)列引擎方面,一線工作經(jīng)驗(yàn)特別豐富。熱衷知識(shí)分享,長(zhǎng)期活躍于各個(gè)社區(qū)。

商品評(píng)論(0條)
暫無評(píng)論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 多功能真空滤油机_润滑油全自动滤油机_高效真空滤油机价格-重庆润华通驰 | 美缝剂_美缝剂厂家_美缝剂加盟-地老板高端瓷砖美缝剂 | 大型低温冷却液循环泵-低温水槽冷阱「厂家品牌」京华仪器_京华仪器 | 彩超机-黑白B超机-便携兽用B超机-多普勒彩超机价格「大为彩超」厂家 | 焦作网 WWW.JZRB.COM| 破碎机锤头_耐磨锤头_合金锤头-鼎成机械一站式耐磨铸件定制服务 微型驱动系统解决方案-深圳市兆威机电股份有限公司 | 微水泥_硅藻泥_艺术涂料_艺术漆_艺术漆加盟-青岛泥之韵环保壁材 武汉EPS线条_EPS装饰线条_EPS构件_湖北博欧EPS线条厂家 | 微水泥_硅藻泥_艺术涂料_艺术漆_艺术漆加盟-青岛泥之韵环保壁材 武汉EPS线条_EPS装饰线条_EPS构件_湖北博欧EPS线条厂家 | 应急灯_消防应急灯_应急照明灯_应急灯厂家-大成智慧官网 | 电销卡_北京电销卡_包月电话卡-豪付网络 | 精益专家 - 设备管理软件|HSE管理系统|设备管理系统|EHS安全管理系统 | 掺铥光纤放大器-C/L波段光纤放大器-小信号光纤放大器-合肥脉锐光电技术有限公司 | 捷码低代码平台 - 3D数字孪生_大数据可视化开发平台「免费体验」 | 天津电机维修|水泵维修-天津晟佳机电设备有限公司 | jrs高清nba(无插件)直播-jrs直播低调看直播-jrs直播nba-jrs直播 上海地磅秤|电子地上衡|防爆地磅_上海地磅秤厂家–越衡称重 | 压力变送器-上海武锐自动化设备有限公司 | 湿地保护| EDLC超级法拉电容器_LIC锂离子超级电容_超级电容模组_软包单体电容电池_轴向薄膜电力电容器_深圳佳名兴电容有限公司_JMX专注中高端品牌电容生产厂家 | 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 | ICP备案查询_APP备案查询_小程序备案查询 - 备案巴巴 | 上海新光明泵业制造有限公司-电动隔膜泵,气动隔膜泵,卧式|立式离心泵厂家 | 重庆网站建设,重庆网站设计,重庆网站制作,重庆seo,重庆做网站,重庆seo,重庆公众号运营,重庆小程序开发 | 比士亚-专业恒温恒湿酒窖,酒柜,雪茄柜的设计定制 | 铆钉机|旋铆机|东莞旋铆机厂家|鸿佰专业生产气压/油压/自动铆钉机 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 上海诺狮景观规划设计有限公司| 大巴租车平台承接包车,通勤班车,巴士租赁业务 - 鸿鸣巴士 | 迪威娱乐|迪威娱乐客服|18183620002 | 橡胶接头_橡胶软接头_可曲挠橡胶接头-巩义市创伟机械制造有限公司 | 闪电优家-卫生间防水补漏_酒店漏水渗水维修_防水堵漏公司 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 西安微信朋友圈广告投放_微信朋友圈推广_西安度娘网络科技有限公司 | 半自动预灌装机,卡式瓶灌装机,注射器灌装机,给药器灌装机,大输液灌装机,西林瓶灌装机-长沙一星制药机械有限公司 | 伺服电机维修、驱动器维修「安川|三菱|松下」伺服维修公司-深圳华创益 | 丹佛斯变频器-Danfoss战略代理经销商-上海津信变频器有限公司 | 行吊_电动单梁起重机_双梁起重机_合肥起重机_厂家_合肥市神雕起重机械有限公司 | 3d打印服务,3d打印汽车,三维扫描,硅胶复模,手板,快速模具,深圳市精速三维打印科技有限公司 | 紫外线老化试验箱_uv紫外线老化试验箱价格|型号|厂家-正航仪器设备 | 活性炭-果壳木质煤质柱状粉状蜂窝活性炭厂家价格多少钱 | 深圳市东信高科自动化设备有限公司 | 重庆网站建设,重庆网站设计,重庆网站制作,重庆seo,重庆做网站,重庆seo,重庆公众号运营,重庆小程序开发 |