實時分析實戰:構建實時流處理應用和分析系統 版權信息
- ISBN:9787111759805
- 條形碼:9787111759805 ; 978-7-111-75980-5
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
實時分析實戰:構建實時流處理應用和分析系統 本書特色
本書以一家虛構的比薩公司貫穿始終,展示了如何實現不同類型的實時分析應用程序,理論與實踐相結合。
本書帶領讀者深入探索實時分析系統,包括這些系統的核心功能以及它們所解決的復雜問題。通過閱讀本書,數據工程師將獲得使用Kafka、Google Pub/Sub和AWS Kinesis等事件處理系統進行數據流實時分析的實踐技能。洞察數據的速度越快,就越能迅捷地識別業務動態,并及時做出響應。
本書提供了對實時分析領域的全面概覽,并介紹了構建實時應用程序所需的專業知識。書中提供了一系列實踐教程,并詳細演示了如何融合多種軟件產品來打造一個虛擬比薩外賣服務的實時分析應用程序,從而將理論與實踐完美結合。
實時分析實戰:構建實時流處理應用和分析系統 內容簡介
本書為想要設計、構建和維護實時分析應用程序的人員(包括數據工程師、架構師和技術領導者)提供了結構合理的基礎知識。第1章和第2章簡要介紹實時分析,并概述可以構建的實時分析應用程序的類型。第3章介紹一家虛構的比薩公司,該公司已經建立了流處理基礎設施,但尚未實現任何實時分析功能。 第4~10章展示如何為這家比薩公司實現不同類型的實時分析應用程序。第11~13章介紹將應用程序投入生產時的注意事項、實時分析的一些真實使用案例,以及未來幾年該領域可能會出現的情況。
實時分析實戰:構建實時流處理應用和分析系統 目錄
目錄序1前言3第1章 實時分析簡介71.1 什么是事件流71.2 理解流數據91.3 什么是實時分析91.4 實時分析的優勢111.4.1 新的收入來源111.4.2 及時洞察客戶121.4.3 降低基礎設施成本121.4.4 改善整體客戶體驗121.5 實時分析用例121.5.1 面向用戶的分析131.5.2 個性化131.5.3 指標141.5.4 異常檢測和根本原因分析141.5.5 可視化141.5.6 即時分析151.5.7 日志分析/文本搜索151.6 對實時分析應用程序進行分類151.6.1 面向內部與面向外部161.6.2 面向機器與面向人類171.7 本章小結17第2章 實時分析生態系統192.1 定義實時分析生態系統192.2 經典流處理技術棧212.2.1 復雜事件處理212.2.2 大數據時代222.3 現代流處理技術棧252.3.1 事件生成器272.3.2 流處理數據平臺292.3.3 流處理層312.3.4 服務層332.3.5 前端372.4 本章小結38第3章 介紹AATD:比薩外賣店的實時分析393.1 現有架構403.2 設置423.2.1 MySQL433.2.2 Apache Kafka463.2.3 ZooKeeper473.2.4 訂單服務483.2.5 啟動組件493.3檢查數據493.4 實時分析的應用533.5 本章小結54第4章 使用Kafka Streams進行查詢554.1 什么是Kafka Streams564.2 什么是Quarkus584.3 Quarkus應用程序584.3.1 安裝Quarkus CLI584.3.2 創建Quarkus應用程序594.3.3 創建拓撲結構604.3.4 查詢鍵值存儲624.3.5 創建HTTP端點654.4 運行應用程序664.5 查詢HTTP端點664.6 Kafka Streams的局限性664.7 本章小結67第5章 服務層—Apache Pinot685.1 為什么不能使用其他流處理器695.2 為什么不能使用數據倉庫695.3 什么是Apache Pinot695.4 Pinot如何對數據進行建模和存儲715.4.1 數據模式715.4.2 表725.5 配置725.6 數據攝取735.7 Pinot數據瀏覽器765.8 索引785.9 更新Web應用程序805.10 本章小結83第6章 構建實時分析儀表盤846.1 儀表盤架構846.2 什么是 Streamlit856.3 配置856.4構建儀表盤866.5 本章小結94第7章 通過CDC獲取產品變化957.1 從業務數據庫獲取更改信息957.2 CDC967.2.1 為什么需要CDC967.2.2 什么是CDC977.2.3 實施CDC的策略977.2.4 基于日志的數據采集987.2.5 CDC系統的需求997.2.6 Debezium 1007.3 將CDC應用于AATD1017.3.1 配置1017.3.2 將 Debezium 連接到 MySQL1027.3.3查詢商品數據流1037.3.4 更新產品1047.4 本章小結106第 8 章 使用Kafka Streams連接流1078.1 使用Kafka Streams豐富訂單數據1078.2 將訂單項添加到 Pinot1138.3更新訂單服務信息1168.4 刷新 Streamlit 儀表盤1218.5 本章小結123第9章 服務層的插入更新1249.1 訂單狀態1249.2 豐富訂單流信息1269.3 Apache Pinot 的插入更新1299.4 更新訂單服務1339.4.1 創建用戶資源文件1349.4.2 添加一個所有用戶的端點1349.4.3 為用戶端點添加訂單1359.4.4 添加單個訂單端點1369.4.5 實現跨資源共享1399.5 前端應用程序1399.6 儀表盤上的訂單狀態1429.6.1 每個訂單狀態的耗時1429.6.2 可能被延誤的訂單1449.7 本章小結148第10章 地理空間查詢14910.1 交付狀態15010.2 更新 Apache Pinot15210.2.1 訂單15210.2.2 交付狀態15410.3 更新訂單服務16110.3.1 個人訂單16210.3.2 按地區劃分的延遲訂單16410.3.3 使用新的 API 端點16610.4 本章小結167第11章 生產環境中的注意事項16911.1 前期準備16911.1.1 容量規劃16911.1.2 數據分區17111.1.3 吞吐量17311.1.4 數據保留17411.1.5 數據粒度17511.1.6 總數據大小17511.1.7 復制因子17611.2 部署平臺17611.2.1 自身技能17611.2.2 數據隱私和安全17611.2.3 成本17711.2.4 控制17811.3 后期管理17811.3.1 監控和報警17811.3.2 數據治理17911.4 本章小結180第12章 現實世界中的實時分析18112.1 內容推薦(專業社交網絡)18112.1.1 問題18212.1.2 解決方案18212.1.3 收益18312.2 運營分析(流媒體服務)18412.2.1 問題18512.2.2 解決方案18512.2.3 收益18712.3 實時廣告分析(網上商城)18712.3.1 問題18812.3.2 解決方案18812.3.3 收益18912.4 面向用戶的分析(協作
展開全部
實時分析實戰:構建實時流處理應用和分析系統 作者簡介
[英]馬克·尼達姆(Mark Needham)是Neo4j的圖形倡導者和開發人員關系工程師。Mark幫助用戶使用圖形和Neo4j,為具有挑戰性的數據問題構建復雜的解決方案。Mark在圖數據方面有很深的專業知識,之前曾幫助構建Neo4j的因果聚類系統。