中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
Flink核心技術(源碼剖析與特性開發)

包郵 Flink核心技術(源碼剖析與特性開發)

作者:黃偉哲
出版社:人民郵電出版社出版時間:2022-07-01
開本: 16開 頁數: 414
中 圖 價:¥71.4(6.5折) 定價  ¥109.9 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Flink核心技術(源碼剖析與特性開發) 版權信息

Flink核心技術(源碼剖析與特性開發) 本書特色

本書從設計思想與特性開發兩個視角,對Flink框架進行介紹。設計思想篇概述Flink的歷史、應用場景與架構,介紹Flink核心API的使用方式,并分模塊介紹Flink的源碼實現及其設計思想。特性開發篇基于真實的企業級代碼運行流程,針對Flink核心功能進行特性開發,幫助讀者解決復雜的業務難題。

Flink核心技術(源碼剖析與特性開發) 內容簡介

本書以核心概念和基本應用為脈絡,介紹Flink的核心待性(如檢查點機制、時間與窗口、混洗機制等)、任務部署、DataSream API、DataSet API.Table API的應用以及運行時原理等內容。每章先對概念進行基本介紹,然后基于應用實例詳細分析Flink的設計思想和源碼實現,逐步引領讀者掌握定制化的開發特性并提升性能,讓讀者對Flink的理解有質的飛躍,本書內容是作者多年工作實踐的總結,能夠幫助讀者實現真實的企業級需求。 本書適合想要學習Fink設計原理并希望對Fink進行定制化開發的平臺開發工程師,需要進行架構設計和技術選型的架構師與項目經理,以及計算機相關專業的學生閱讀。

Flink核心技術(源碼剖析與特性開發) 目錄

第 一部分 設計思想篇
第 1章 序篇 3
1.1 Flink的誕生與發展 3
1.1.1 Stratosphere項目 3
1.1.2 Apache Flink的發展 4
1.2 Flink的應用場景 5
1.2.1 事件驅動型應用 5
1.2.2 數據分析型應用 5
1.2.3 數據管道型應用 9
1.3 Flink的核心特性與架構 9
1.3.1 核心特性 9
1.3.2 架構 10
1.4 準備工作 11
1.5 總結 12
第 2章 Flink編程 13
2.1 API層級 13
2.2 DataStream API 14
2.2.1 DataStream版本的
WordCount 14
2.2.2 數據源 16
2.2.3 數據的轉換操作 16
2.2.4 數據的輸出 20
2.2.5 重分區 21
2.3 DataSet API 21
2.3.1 DataSet版本的WordCount 21
2.3.2 數據源 22
2.3.3 數據的轉換操作 22
2.3.4 數據的輸出 24
2.3.5 重分區 25
2.4 Table API 25
2.4.1 Table API版本的WordCount 25
2.4.2 初始化執行環境 26
2.4.3 獲取Table對象 28
2.4.4 Table API中的轉換操作及輸出 28
2.5 SQL 34
2.6 總結 34
第3章 Flink API層的實現原理 36
3.1 DataStream API 37
3.1.1 StreamExecutionEnvironment執行環境 37
3.1.2 Function接口分析 42
3.1.3 StreamOperator算子分析 45
3.1.4 轉換操作分析 48
3.1.5 數據流相關類分析 53
3.2 DataSet API 59
3.2.1 ExecutionEnvironment執行環境 59
3.2.2 InputFormat和OutputFormat 62
3.2.3 數據集相關類分析 63
3.3 Table API和SQL 68
3.4 總結 71
第4章 Flink的執行圖 72
4.1 StreamGraph的生成 73
4.1.1 StreamGraphGenerator分析 73
4.1.2 StreamGraph分析 77
4.1.3 StreamNode和StreamEdge 80
4.2 Plan的生成 81
4.2.1 OperatorTranslation分析 82
4.2.2 Plan分析 84
4.3 從StreamGraph到JobGraph 85
4.3.1 StreamingJobGraphGenerator分析 87
4.3.2 JobGraph分析 93
4.3.3 JobVertex、JobEdge和IntermediateDataSet 94
4.4 從Plan到JobGraph 95
4.5 從JobGraph到ExecutionGraph 96
4.5.1 ExecutionGraphBuilder分析 98
4.5.2 ExecutionGraph分析 99
4.5.3 ExecutionJobVertex、ExecutionVertex和Execution分析 102
4.5.4 IntermediateResult、IntermediateResultPartition和ExecutionEdge 106
4.6 總結 108
第5章 Flink的運行時架構 109
5.1 客戶端代碼的運行 110
5.2 高可用相關組件 115
5.2.1 EmbeddedHaServices 115
5.2.2 EmbeddedLeaderService 117
5.3 派發器的初始化與啟動 122
5.4 資源管理器的初始化與啟動 128
5.5 TaskExecutor的初始化與啟動 131
5.6 JobMaster的初始化與啟動 134
5.7 總結 137
第6章 任務調度 138
6.1 調度器 138
6.1.1 調度器的基本構成與初始化 139
6.1.2 構造ExecutionGraph 142
6.2 調度拓撲 143
6.3 調度策略 147
6.3.1 EagerSchedulingStrategy 147
6.3.2 LazyFromSourcesSchedulingStrategy 149
6.3.3 InputDependencyConstraintChecker 152
6.4 調度過程的實現 157
6.4.1 開始調度 157
6.4.2 更新任務狀態 159
6.4.3 調度或更新消費者 163
6.5 任務的部署 163
6.6 Execution對象在調度過程中的行為 166
6.7 總結 173
第7章 任務的生命周期 174
7.1 任務的提交 174
7.1.1 TaskDeploymentDescriptor 176
7.1.2 ResultPartitionDeployment Descriptor 178
7.1.3 InputGateDeployment Descriptor 180
7.1.4 ShuffleDescriptor 181
7.1.5 ProducerDescriptor和PartitionDescriptor 185
7.1.6 TaskDeploymentDescriptor的提交 188
7.2 任務的初始化 189
7.2.1 Task的初始化 189
7.2.2 ResultPartition的初始化 191
7.2.3 InputGate的初始化 194
7.3 任務的執行 197
7.3.1 StreamTask的初始化 202
7.3.2 StreamTask中的重要概念 204
7.3.3 StreamTask的實現類 219
7.3.4 StreamTask的生命周期 222
7.3.5 DataSourceTask、BatchTask和DataSinkTask 227
7.4 總結 237
第8章 數據傳輸 238
8.1 基本概念與設計思想 238
8.1.1 從邏輯執行圖到物理執行圖 239
8.1.2 用同一套模型應對批處理和流處理 242
8.1.3 混洗 242
8.1.4 流量控制 245
8.2 數據的輸出 252
8.2.1 ResultPartitionType 253
8.2.2 ResultPartitionWriter 256
8.2.3 ResultSubpartition 262
8.3 數據的讀取 265
8.3.1 ResultSubpartitionView 266
8.3.2 InputGate 269
8.3.3 InputChannel 273
8.4 反壓機制的原理 278
8.5 總結 283
第9章 時間與窗口 284
9.1 基本概念和設計思想 284
9.1.1 從批處理到流處理 284
9.1.2 數據流模型的設計思想 287
9.1.3 Flink中與窗口操作相關的核心概念 289
9.2 WindowedStream 290
9.3 窗口相關模型的實現 292
9.3.1 Window類 292
9.3.2 WindowAssigner類 293
9.3.3 Trigger類 294
9.3.4 Evictor類 296
9.4 WindowOperator 297
9.5 水位線 299
9.5.1 產生水位線 300
9.5.2 多個數據流傳來的水位 303
9.6 定時器 304
9.7 總結 307
第 10章 狀態與容錯 308
10.1 基本概念與設計思想 308
10.1.1 狀態與容錯的基本概念 308
10.1.2 Hadoop與Spark如何設計容錯機制 311
10.1.3 Flink中容錯機制的設計思想 311
10.1.4 Flink的狀態與容錯機制的核心概念 313
10.2 狀態存儲 315
10.2.1 檢查點的觸發 316
10.2.2 柵欄的傳輸 323
10.2.3 狀態數據的更新和存儲 331
10.2.4 元信息的存儲 336
10.3 狀態恢復 341
10.3.1 元信息的讀取 342
10.3.2 狀態的重分配 344
10.3.3 狀態數據的恢復 347
10.4 狀態的重分配策略 349
10.4.1 操作符狀態的重分配 350
10.4.2 鍵控狀態的重分配 352
10.5 總結 353
第二部分 特性開發篇
第 11章 動態調整并行度 357
11.1 模型設計 357
11.1.1 傳統模型的局限 357
11.1.2 DS2模型的核心概念 358
11.1.3 算法原理 359
11.1.4 架構設計 360
11.1.5 使用DS2模型的注意事項 361
11.2 指標收集 361
11.3 指標管理 364
11.4 總結 366
第 12章 自適應查詢執行 367
12.1 Flink框架下的自適應查詢執行 368
12.1.1 執行階段的劃分 368
12.1.2 優化流程 368
12.1.3 優化策略 370
12.2 統計信息的收集 373
12.3 執行圖與調度拓撲的修改 374
12.4 上下游關系的建立 377
12.5 總結 378
第 13章 Flink Sort-Merge Shuffle 379
13.1 混洗機制的對比 379
13.2 Flink混洗機制 381
13.3 Blink混洗的數據流轉 382
13.3.1 ExternalResultPartition 383
13.3.2 PartitionMergeFileWriter 384
13.4 Blink混洗的Sort-Merge過程 386
13.4.1 PushedUnilateralSort Merger 387
13.4.2 NormalizedKeySorter 390
13.4.3 排序線程 393
13.4.4 溢寫線程 393
13.4.5 合并線程 395
13.5 文件的讀取和元信息管理 398
13.5.1 ExternalBlockResultPartition Manager 398
13.5.2 ExternalBlockResultPartition Meta 399
13.5.3 ExternalBlockSubpartition View 400
13.6 總結 402
第 14章 修改檢查點的狀態 403
14.1 狀態修改的原理 403
14.1.1 狀態元信息的讀取 404
14.1.2 狀態數據的讀取 405
14.2 狀態處理器API 407
14.2.1 數據的讀取 409
14.2.2 數據的寫出 413
14.3 總結 414
展開全部

Flink核心技術(源碼剖析與特性開發) 作者簡介

黃偉哲,約翰斯·霍普金斯大學碩士,架構師、軟件開發工程師、咨詢師,Spark Contributor。《人工智能技術與大數據》譯者,目前就職于美團。在開源大數據框架的應用與特性開發方面有豐富的經驗。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: TPE_TPE热塑性弹性体_TPE原料价格_TPE材料厂家-惠州市中塑王塑胶制品公司- 中塑王塑胶制品有限公司 | 不锈钢电动球阀_气动高压闸阀_旋塞疏水调节阀_全立阀门-来自温州工业阀门巨头企业 | 刮板输送机,粉尘加湿搅拌机,螺旋输送机,布袋除尘器 | TPU薄膜_TPU薄膜生产厂家_TPU热熔胶膜厂家定制_鑫亘环保科技(深圳)有限公司 | 自清洗过滤器,浅层砂过滤器,叠片过滤器厂家-新乡市宇清净化 | IHDW_TOSOKU_NEMICON_EHDW系列电子手轮,HC1系列电子手轮-上海莆林电子设备有限公司 | 多米诺-多米诺世界纪录团队-多米诺世界-多米诺团队培训-多米诺公关活动-多米诺创意广告-多米诺大型表演-多米诺专业赛事 | 深圳湾1号房价_深圳湾1号二手房源| hdpe土工膜-防渗膜-复合土工膜-长丝土工布价格-厂家直销「恒阳新材料」-山东恒阳新材料有限公司 ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 | 安全光栅|射频导纳物位开关|音叉料位计|雷达液位计|两级跑偏开关|双向拉绳开关-山东卓信机械有限公司 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 | 北京工业设计公司-产品外观设计-产品设计公司-千策良品工业设计 北京翻译公司-专业合同翻译-医学标书翻译收费标准-慕迪灵 | 高压绝缘垫-红色配电房绝缘垫-绿色高压绝缘地毯-上海苏海电气 | 政府园区专业委托招商平台_助力企业选址项目快速落地_东方龙商务集团 | 异噻唑啉酮-均三嗪-三丹油-1227-中北杀菌剂厂家 | 桥架-槽式电缆桥架-镀锌桥架-托盘式桥架 - 上海亮族电缆桥架制造有限公司 | 无锡市珂妮日用化妆品有限公司|珂妮日化官网|洗手液厂家 | 玉米深加工设备-玉米深加工机械-新型玉米工机械生产厂家-河南粮院机械制造有限公司 | 英国公司注册-新加坡公司注册-香港公司开户-离岸公司账户-杭州商标注册-杭州优创企业 | 【直乐】河北石家庄脊柱侧弯医院_治疗椎间盘突出哪家医院好_骨科脊柱外科专业医院_治疗抽动症/关节病骨伤权威医院|排行-直乐矫形中医医院 | 临沂招聘网_人才市场_招聘信息_求职招聘找工作请认准【马头商标】 | 苏商学院官网 - 江苏地区唯一一家企业家自办的前瞻型、实操型商学院 | 流水线电子称-钰恒-上下限报警电子秤-上海宿衡实业有限公司 | 不锈钢螺丝 - 六角螺丝厂家 - 不锈钢紧固件 - 万千紧固件--紧固件一站式采购 | 派克防爆伺服电机品牌|国产防爆伺服电机|高低温伺服电机|杭州摩森机电科技有限公司 | 扬尘在线监测系统_工地噪声扬尘检测仪_扬尘监测系统_贝塔射线扬尘监测设备「风途物联网科技」 | 上海皓越真空设备有限公司官网-真空炉-真空热压烧结炉-sps放电等离子烧结炉 | 不锈钢拉手厂家|浴室门拉手厂家|江门市蓬江区金志翔五金制品有限公司 | 智能楼宇-楼宇自控系统-楼宇智能化-楼宇自动化-三水智能化 | 拉力机-万能试验机-材料拉伸试验机-电子拉力机-拉力试验机厂家-冲击试验机-苏州皖仪实验仪器有限公司 | 车载加油机品牌_ 柴油加油机厂家 | 扬尘监测_扬尘监测系统_带证扬尘监测设备 - 郑州港迪科技有限公司 | 电动球阀_不锈钢电动球阀_电动三通球阀_电动调节球阀_上海湖泉阀门有限公司 | 德州网站开发定制-小程序开发制作-APP软件开发-「两山开发」 | PTFE接头|聚四氟乙烯螺丝|阀门|薄膜|消解罐|聚四氟乙烯球-嘉兴市方圆氟塑制品有限公司 | PE一体化污水处理设备_地埋式生活污水净化槽定制厂家-岩康塑业 | 多功能真空滤油机_润滑油全自动滤油机_高效真空滤油机价格-重庆润华通驰 | 密集柜_档案密集柜_智能密集架_密集柜厂家_密集架价格-智英伟业 密集架-密集柜厂家-智能档案密集架-自动选层柜订做-河北风顺金属制品有限公司 | 雷蒙磨,雷蒙磨粉机,雷蒙磨机 - 巩义市大峪沟高峰机械厂 | 泰兴市热钻机械有限公司-热熔钻孔机-数控热熔钻-热熔钻孔攻牙一体机 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 |