中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 Flink原理與實踐

作者:魯蔚征
出版社:人民郵電出版社出版時間:2021-02-01
開本: 16開 頁數: 301
中 圖 價:¥46.4(6.6折) 定價  ¥69.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Flink原理與實踐 版權信息

Flink原理與實踐 本書特色

本書一方面對Flink的技術架構做了深入的介紹,另一方面涵蓋了Flink大多數API,本書每章都提供了一些實踐案例和習題訓練,幫助讀者了解、上手和熟悉Flink技術。與其他中文Flink圖書相比,本書從初學者角度出發,結合相關案例,深入淺出,有助于讀者學懂學會Flink。

Flink原理與實踐 內容簡介

本書圍繞大數據流處理領域,介紹Flink DataStream API、時間和窗口、狀態和檢查點、Table API和SQL等知識。本書以實踐為導向,使用大量真實業務場景案例來演示如何基于Flink進行流處理。 本書主要面向對大數據領域感興趣的本科生、研究生,想轉行到大數據開發行業的在職人員,或有一定大數據開發經驗的相關從業人員。讀者優選有一定的Java或Scala編程基礎,掌握計算機領域的常見技術概念。

Flink原理與實踐 目錄

第1章 大數據技術概述 ................ 1 1.1 什么是大數據 ................................. 2 1.1.1 大數據的5個“V” ....................... 2 1.1.2 大數據分而治之 ............................... 3 1.2 從批處理到流處理 .......................... 6 1.2.1 數據與數據流 ................................... 6 1.2.2 批處理與流處理 ............................... 7 1.2.3 為什么需要一個優秀的 流處理框架 ........................................ 7 1.3 代表性大數據技術 .......................... 9 1.3.1 Hadoop ............................................ 9 1.3.2 Spark ............................................... 10 1.3.3 Apache Kafka ............................... 11 1.3.4 Flink ................................................. 12 1.4 從Lambda到Kappa: 大數據處理平臺的演進 .................. 13 1.4.1 Lambda架構 ................................ 14 1.4.2 Kappa架構 .................................... 15 1.5 流處理基礎概念 ........................... 16 1.5.1 延遲和吞吐 ..................................... 16 1.5.2 窗口與時間 ..................................... 17 1.5.3 狀態與檢查點 ................................. 20 1.5.4 數據一致性保障 ............................. 21 1.6 編程語言的選擇 ........................... 21 1.6.1 Java和Scala ................................. 21 1.6.2 Python ............................................ 22 1.6.3 SQL .................................................. 23 1.7 案例實戰 使用Kafka構建 文本數據流 .................................. 23 1.7.1 Kafka和消息隊列相關 背景知識 ..........................................23 1.7.2 使用Kafka構建一個 文本數據流 ......................................24 本章小結 ............................................. 26 第2章 大數據**編程知識 ...... 27 2.1 繼承和多態 .................................. 28 2.1.1 繼承、類和接口 .............................28 2.1.2 重寫與重載 .....................................30 2.1.3 繼承和多態小結 .............................32 2.2 泛型 ............................................ 32 2.2.1 Java中的泛型 ................................32 2.2.2 Scala中的泛型 ..............................35 2.2.3 泛型小結 .........................................36 2.3 函數式編程 .................................. 36 2.3.1 函數式編程思想簡介 .....................36 2.3.2 Lambda表達式的內部結構 ........37 2.3.3 函數式接口 .....................................38 2.3.4 Java Stream API ...........................40 2.3.5 函數式編程小結 .............................41 2.4 案例實戰 Flink開發環境搭建 ........ 42 2.4.1 準備所需軟件 .................................42 2.4.2 下載并安裝Flink ...........................43 2.4.3 創建Flink工程 ..............................43 2.4.4 調試和運行Flink程序 ..................48 2.4.5 運行程序 .........................................50 Flink原理與實踐 本章小結 ............................................. 53 第3章 Flink的設計與 運行原理 ........................... 54 3.1 Flink數據流圖簡介 ....................... 55 3.1.1 Flink程序和數據流圖 .................. 55 3.1.2 從邏輯視圖轉化為物理執行圖 .... 57 3.1.3 數據交換策略 ................................. 58 3.2 Flink分布式架構與核心組件 .......... 59 3.2.1 Flink作業提交過程....................... 59 3.2.2 Flink核心組件 ............................... 60 3.2.3 Flink組件棧 ................................... 61 3.3 任務執行與資源劃分 ..................... 63 3.3.1 再談邏輯視圖到物理執行圖 ........ 63 3.3.2 任務、算子子任務與算子鏈 ........ 64 3.3.3 Slot與計算資源 ............................ 65 3.4 實驗WordCount程序 迭代和完善 .................................. 67 一、實驗目的 .............................................. 67 二、實驗內容 .............................................. 67 三、實驗要求 .............................................. 68 四、實驗報告 .............................................. 68 本章小結 ............................................. 68 第4章 DataStream API的 介紹和使用 ....................... 70 4.1 Flink程序的骨架結構 ................... 71 4.1.1 設置執行環境 ................................. 71 4.1.2 讀取數據源 ..................................... 72 4.1.3 進行轉換操作 ................................. 72 4.1.4 結果輸出 ......................................... 73 4.1.5 執行 ..................................................73 4.2 常見Transformation的 使用方法 ..................................... 73 4.2.1 單數據流基本轉換 .........................74 4.2.2 基于Key的分組轉換 ....................78 4.2.3 多數據流轉換 .................................84 4.2.4 并行度與數據重分布 .....................86 4.3 數據類型和序列化 ........................ 92 4.3.1 Flink支持的數據類型 ...................92 4.3.2 TypeInformation .........................96 4.3.3 注冊類 ..............................................98 4.3.4 Avro、Kryo、Thrift和 Protobuf .........................................99 4.3.5 數據類型的選擇 .......................... 103 4.4 用戶自定義函數 .......................... 104 4.4.1 接口 ............................................... 104 4.4.2 Lambda表達式 .......................... 105 4.4.3 Rich函數類 ................................. 108 4.5 實驗 股票價格數據流處理 ........... 109 一、實驗目的 ............................................ 109 二、實驗內容 ............................................ 110 三、實驗要求 ............................................ 111 四、實驗報告 ............................................ 112 本章小結 ........................................... 112 第5章 時間和窗口 .................... 113 5.1 Flink的時間語義 ........................ 114 5.1.1 Flink的3種時間語義 ............... 114 5.1.2 設置時間語義 .............................. 115 5.1.3 Event Time和Watermark ..... 116 5.1.4 分布式環境下Watermark的 傳播 ................................................ 116 5.1.5 設置時間戳及生成 Watermark .................................. 118 5.1.6 平衡延遲和準確性 ..................... 123 5.2 ProcessFunction系列函數 ........ 123 5.2.1 Timer的使用方法 ...................... 123 5.2.2 側輸出 .......................................... 126 5.2.3 在兩個數據流上使用 ProcessFunction ....................... 127 5.3 窗口算子的使用 .......................... 129 5.3.1 窗口程序的骨架結構 ................. 129 5.3.2 內置的3種窗口劃分方法 ......... 131 5.3.3 窗口處理函數 .............................. 135 5.3.4 拓展和自定義窗口 ..................... 141 5.4 雙流連接 ................................... 146 5.4.1 Window Join ............................. 146 5.4.2 Interval Join ............................... 149 5.5 處理遲到數據 ............................. 150 5.5.1 將遲到數據發送到另外一個 數據流 ........................................... 151 5.5.2 更新計算結果 .............................. 151 5.6 實驗 股票價格數據進階分析 ........ 153 一、實驗目的 ........................................... 153 二、實驗內容 ........................................... 153 三、實驗要求 ........................................... 154 四、實驗報告 ........................................... 154 本章小結 ........................................... 154 第6章 狀態和檢查點 ................ 155 6.1 實現有狀態的計算 ...................... 156 6.1.1 為什么要管理狀態 ..................... 156 6.1.2 Flink中幾種常用的狀態 ........... 157 6.1.3 橫向擴展問題 .............................. 159 6.1.4 Keyed State的使用方法 .......... 160 6.1.5 Operator List State的 使用方法 ....................................... 165 6.1.6 BroadcastState的使用方法 .... 169 6.2 Checkpoint機制的原理及 配置方法 ................................... 173 6.2.1 Flink分布式快照流程 ................ 173 6.2.2 分布式快照性能優化方案 ......... 177 6.2.3 State Backend ........................... 177 6.2.4 Checkpoint相關配置 ............... 179 6.2.5 重啟恢復流程 .............................. 180 6.3 Savepoint機制的原理及 使用方法 ................................... 182 6.3.1 Savepoint機制與Checkpoint 機制的區別 ................................... 182 6.3.2 Savepoint的使用方法 ............. 183 6.3.3 讀/寫Savepoint中的數據 ...... 184 6.3.4 Queryable State和 State Processor API ................... 194 6.4 實驗 電商平臺用戶行為分析 ........ 195 一、實驗目的 ............................................ 195 二、實驗內容 ............................................ 195 三、實驗要求 ............................................ 195 四、實驗報告 ............................................ 195 本章小結 ........................................... 195 第7章 Flink連接器 ................ 196 7.1 Flink端到端的 Exactly-Once保障 ................... 197 7.1.1 故障恢復與一致性保障 ............. 197 7.1.2 冪等寫 ........................................... 198 7.1.3 事務寫 ........................................... 199 7.2 自定義Source和Sink ............... 200 7.2.1 Flink 1.11之前的Source ........ 200 7.2.2 Flink 1.11之后的Source ........ 205 Flink原理與實踐 7.2.3 自定義Sink ................................. 205 7.3 Flink中常用的Connector .......... 211 7.3.1 內置I/O接口 .............................. 212 7.3.2 Flink Kafka Connector ........... 217 7.4 實驗 讀取并輸出股票價格 數據流 ...................................... 220 一、實驗目的 ........................................... 220 二、實驗內容 ........................................... 220 三、實驗要求 ........................................... 220 四、實驗報告 ........................................... 221 本章小結 ........................................... 221 第8章 Table API & SQL的 介紹和使用 ..................... 222 8.1 Table API & SQL綜述 .............. 223 8.1.1 Table API & SQL程序的 骨架結構 ....................................... 223 8.1.2 創建TableEnvironment .......... 224 8.1.3 獲取表 .......................................... 227 8.1.4 在表上執行語句 .......................... 228 8.1.5 將表結果輸出 .............................. 229 8.1.6 執行作業 ...................................... 229 8.1.7 獲取表的具體方式 ..................... 231 8.2 動態表和持續查詢 ...................... 233 8.2.1 動態表和持續查詢 ..................... 233 8.2.2 流處理的限制 .............................. 237 8.2.3 狀態過期時間 .............................. 238 8.3 時間和窗口 ................................ 238 8.3.1 時間屬性 ...................................... 238 8.3.2 窗口聚合 ...................................... 241 8.4 Join .......................................... 249 8.4.1 時間窗口 Join ............................ 250 8.4.2 臨時表 Join ................................ 251 8.4.3 傳統意義上的Join ..................... 254 8.5 SQL DDL ................................. 256 8.5.1 注冊和獲取表 .............................. 256 8.5.2 USE和SHOW語句 .................. 258 8.5.3 CREATE、DROP、 ALTER語句 .................................. 259 8.5.4 INSERT語句 ............................... 262 8.6 系統內置函數 ............................. 263 8.6.1 標量函數 ...................................... 264 8.6.2 聚合函數 ...................................... 269 8.6.3 時間單位 ...................................... 269 8.7 用戶自定義函數 .......................... 270 8.7.1 注冊函數 ...................................... 270 8.7.2 標量函數 ...................................... 270 8.7.3 表函數 ........................................... 272 8.7.4 聚合函數 ...................................... 274 8.8 實驗 使用Flink SQL處理 IoT數據 .................................... 277 一、實驗目的 ............................................ 277 二、實驗內容 ............................................ 277 三、實驗要求 ............................................ 278 四、實驗報告 ............................................ 279 本章小結 ........................................... 279 第9章 Flink的部署和配置 .... 280 9.1 Flink集群部署模式 ..................... 281 9.1.1 Standalone集群 ....................... 281 9.1.2 Hadoop YARN集群 ................. 282 9.1.3 Kubernetes集群 ....................... 285 9.2 配置文件 ................................... 287 9.2.1 Java和類加載 ............................. 288 9.2.2 并行度與槽位劃分 ...................... 289 9.2.3 內存 .............................................. 290 9.2.4 磁盤 .............................................. 294 9.3 算子鏈與槽位共享 ...................... 294 9.3.1 設置算子鏈 .................................. 294 9.3.2 設置槽位共享 .............................. 295 9.4 命令行工具 ................................ 296 9.4.1 提交作業 ...................................... 297 9.4.2 管理作業 ...................................... 298 9.5 與Hadoop集成 ........................ 299 9.5.1 添加Hadoop Classpath ......... 299 9.5.2 將Hadoop依賴包添加到 9.5.3 本地調試 ...................................... 300 9.6 實驗 作業編碼、打包與提交 ........ 301 一、實驗目的 ............................................ 301 二、實驗內容 ............................................ 301 三、實驗要求 ............................................ 301 四、實驗報告 ............................................ 301 本章小結 ........................................... 301 參考文獻 ......................................... 302
展開全部

Flink原理與實踐 作者簡介

魯蔚征 前小米工程師,現中國人民大學教師,一直從事大數據相關的開發和研究工作,關注大數據行業的發展,先后接觸了Hadoop、Hive、Kafka、Spark、TensorFlow等大數據中間件,在大數據的流處理和批處理方向上有一定的實際工作經驗。主要研究項目及領域為推薦系統、大數據。今日頭條科技領域優質創作者。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 丹佛斯变频器-Danfoss战略代理经销商-上海津信变频器有限公司 | 镀锌钢格栅_热镀锌格栅板_钢格栅板_热镀锌钢格板-安平县昊泽丝网制品有限公司 | 车辆定位管理系统_汽车GPS系统_车载北斗系统 - 朗致物联 | 山楂片_雪花_迷你山楂片_山楂条饼厂家-青州市丰源食品厂 | 外观设计_设备外观设计_外观设计公司_产品外观设计_机械设备外观设计_东莞工业设计公司-意品深蓝 | 北京模型公司-工业模型-地产模型-施工模型-北京渝峰时代沙盘模型制作公司 | 广州中央空调回收,二手中央空调回收,旧空调回收,制冷设备回收,冷气机组回收公司-广州益夫制冷设备回收公司 | 高效复合碳源-多核碳源生产厂家-污水处理反硝化菌种一长隆科技库巴鲁 | 石栏杆_青石栏杆_汉白玉栏杆_花岗岩栏杆 - 【石雕之乡】点石石雕石材厂 | 市政路灯_厂家-淄博信达电力科技有限公司 | 山东集装箱活动房|济南集装箱活动房-济南利森集装箱有限公司 | 大数据营销公司_舆情监测软件_上海SEO公司-文军营销官网 | 护腰带生产厂家_磁石_医用_热压护腰_登山护膝_背姿矫正带_保健护具_医疗护具-衡水港盛 | 中视电广_短视频拍摄_短视频推广_短视频代运营_宣传片拍摄_影视广告制作_中视电广 | 优考试_免费在线考试系统_培训考试系统_题库系统_组卷答题系统_匡优考试 | 蜘蛛车-高空作业平台-升降机-高空作业车租赁-臂式伸缩臂叉装车-登高车出租厂家 - 普雷斯特机械设备(北京)有限公司 | 谈股票-今日股票行情走势分析-牛股推荐排行榜 | 礼至家居-全屋定制家具_一站式全屋整装_免费量房设计报价 | 轴流风机-鼓风机-离心风机-散热风扇-罩极电机,生产厂家-首肯电子 | 多米诺-多米诺世界纪录团队-多米诺世界-多米诺团队培训-多米诺公关活动-多米诺创意广告-多米诺大型表演-多米诺专业赛事 | 恒温恒湿箱(药品/保健品/食品/半导体/细菌)-兰贝石(北京)科技有限公司 | 无菌水质袋-NASCO食品无菌袋-Whirl-Pak无菌采样袋-深圳市慧普德贸易有限公司 | 智能交通网_智能交通系统_ITS_交通监控_卫星导航_智能交通行业 | 杭州公司变更法人-代理记账收费价格-公司注销代办_杭州福道财务管理咨询有限公司 | 凝胶成像仪,化学发光凝胶成像系统,凝胶成像分析系统-上海培清科技有限公司 | 自动售货机_无人售货机_专业的自动售货机运营商_免费投放售货机-广州富宏主官网 | 济南货架定做_仓储货架生产厂_重型货架厂_仓库货架批发_济南启力仓储设备有限公司 | 欧洲MV日韩MV国产_人妻无码一区二区三区免费_少妇被 到高潮喷出白浆av_精品少妇自慰到喷水AV网站 | 柴油发电机组_柴油发电机_发电机组价格-江苏凯晨电力设备有限公司 | 通风天窗,通风气楼,屋顶通风天窗,屋顶通风天窗公司 | 杭州月嫂技术培训服务公司-催乳师培训中心报名费用-产后康复师培训机构-杭州优贝姆健康管理有限公司 | 除尘器布袋骨架,除尘器滤袋,除尘器骨架,电磁脉冲阀膜片,卸灰阀,螺旋输送机-泊头市天润环保机械设备有限公司 | 长春网站建设,五合一网站设计制作,免费优化推广-长春网站建设 | 三氯异氰尿酸-二氯-三氯-二氯异氰尿酸钠-优氯净-强氯精-消毒片-济南中北_优氯净厂家 | 康明斯发电机,上柴柴油发电机,玉柴柴油发电机组_海南重康电力官网 | 雷蒙磨,雷蒙磨粉机,雷蒙磨机 - 巩义市大峪沟高峰机械厂 | 化妆品加工厂-化妆品加工-化妆品代加工-面膜加工-广东欧泉生化科技有限公司 | 搜木网 - 木业全产业链交易平台,免费搜货、低价买货! | 智能电表|预付费ic卡水电表|nb智能无线远传载波电表-福建百悦信息科技有限公司 | 金属波纹补偿器厂家_不锈钢膨胀节价格_非金属伸缩节定制-庆达补偿器 | 西安标准厂房_陕西工业厂房_西咸新区独栋厂房_长信科技产业园官方网站 |