大規模數據管理 版權信息
- ISBN:9787519890179
- 條形碼:9787519890179 ; 978-7-5198-9017-9
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大規模數據管理 本書特色
編輯推薦
隨著數據管理和集成持續不斷地快速進化,把所有的數據存儲在像數據倉庫等單?位置的辦法不再有可拓展性。在不久的將來,數據需要分散式存儲并對多個技術解決?案提供可?性。通過這本實?指南,你將學習如何將企業從復雜且緊密耦合的數據環境遷移到?個更靈活的架構,以適應現代數據消費的需求。
企業?管、數據架構師、分析團隊,以及合規與治理?員將學習如何使?可拓展架構來構建現代可拓展的數據環境。這種架構可以逐步引???需?規模的前期投?。本書作者提供了藍圖、原則、觀察、*z佳實踐及模式,幫助你快速掌握相關知識。
專家推薦
“這?蘊含著智慧:新舊的?法論和*z佳實踐在這?被平衡地運?,這得益于長期實踐的經驗。*z棒的是施特倫霍爾特展?了新?代企業數據管理是?項團隊活動,解決?案需要包容并對接到所有參與者。”
——Joe Hellerstein,
Trifacta的共同創始?及CSO
“在這本創新的著作中,Piethein Strengholt提出了?種全新的?法,來構建數據管理領域的架構。這本書將指導并啟發那些在2020年之后負責設計數據管理架構的?們。”
——Santhosh Pillai,
荷蘭銀?總架構師兼
數據管理負責?
大規模數據管理 內容簡介
本書的主要內容有:研究數據管理趨勢,包括技術發展、法規要求和隱私問題。深?了解可拓展架構,學習各組件之間如何協同?作。探索數據治理和數據安全、主數據管理、?助式數據市場,以及元數據的重要性。
大規模數據管理 目錄
目錄序 1前言 3第1 章 數據管理的變革 . 111.1 數據管理121.2 分析正在分割數據景觀 .151.3 軟件交付的速度正在發生變化 171.4 網絡變得更加快捷 181.5 隱私和安全性是重中之重 191.6 運營和事物系統需要被整合 201.7 數據商業化需要生態系統到生態系統的架構 201.8 企業受困于過時的數據架構 211.8.1 企業數據倉庫和商業智能 211.8.2 數據湖 24目錄序 1前言 3第1 章 數據管理的變革 . 111.1 數據管理121.2 分析正在分割數據景觀 .151.3 軟件交付的速度正在發生變化 171.4 網絡變得更加快捷 181.5 隱私和安全性是重中之重 191.6 運營和事物系統需要被整合 201.7 數據商業化需要生態系統到生態系統的架構 201.8 企業受困于過時的數據架構 211.8.1 企業數據倉庫和商業智能 211.8.2 數據湖 241.8.3 中心化視角 261.9 小結 .27第2 章 初窺可拓展架構:大規模數據管理 .292.1 普遍認可的起點 302.1.1 每一個應用程序都有一個應用程序數據庫 302.1.2 應用程序都是特定的而且有獨特的上下文 302.1.3 黃金數據源 312.1.4 無法擺脫的數據集成困境 312.1.5 應用程序既是數據提供者也是數據消費者 322.2 關鍵的理論考量 332.2.1 面向對象的編程原則.332.2.2 領域驅動設計 352.2.3 業務架構 .382.3 通信和集成模式 452.3.1 點對點 462.3.2 孤島 462.3.3 輪輻模型 .472.4 可擴展架構 482.4.1 黃金數據源和域數據存儲 492.4.2 數據交付契約和數據共享協議 .512.4.3 擺脫孤島方案 522.4.4 企業規模的領域驅動設計 532.4.5 讀優化的數據 562.4.6 從整體的視角看數據層 582.4.7 元數據和目標運營模式 612.5 小結 .63第3 章 管理海量數據:只讀數據存儲架構 .653.1 RDS 架構簡介 653.2 命令和查詢職責分離 663.2.1 什么是CQRS 663.2.2 規模化的CQRS 683.3 只讀數據存儲組件和服務 733.3.1 元數據 743.3.2 數據質量 .753.3.3 RDS 層級 773.3.4 數據攝取 .783.3.5 集成商業化現成解決方案 813.3.6 從外部API 和SaaS 提取數據 823.3.7 歷史數據服務 823.3.8 設計的變化 863.3.9 數據復制 .883.3.10 訪問層 .893.3.11 文件操作服務 903.3.12 交付通知服務 .913.3.13 匿名服務 913.3.14 分布式編排923.4 智能消費服務 .933.5 按需填充RDS 963.6 直接使用RDS 的考量 973.7 小結 .98第4 章 API 架構的服務和API 管理 994.1 API 架構簡介 994.2 什么是面向服務的架構 1004.2.1 企業應用集成 1044.2.2 服務編排 1064.2.3 服務編舞 1104.2.4 公共服務和私有服務 1114.2.5 服務模型和規范數據模型 1114.2.6 SOA 與企業數據倉庫架構的相似之處 . 1124.3 SOA 的現代觀點 1144.3.1 API 網關 1144.3.2 責任模式 1164.3.3 企業服務總線的新職責 . 1184.3.4 服務合約 1194.3.5 服務發現 1194.4 微服務 .1204.4.1 API 網關在微服務中的作用 1224.4.2 函數 .1224.4.3 服務網格 1244.4.4 微服務的邊界 .1254.4.5 在API 參考架構內的微服務 1264.5 生態系統通信 1274.6 基于API 的通信渠道 1294.6.1 GraphQL 1304.6.2 為前端服務的后端 1314.7 元數據 .1314.8 利用RDS 進行實時和密集讀取 .1334.9 小結 134第5 章 事件和響應管理:流式架構 . 1375.1 流式架構簡介 1375.2 異步事件模型與眾不同 1385.3 事件驅動架構是什么樣的 .1395.3.1 調停者拓撲 .1405.3.2 代理者拓撲 .1415.3.3 事件處理風格 .1425.4 Apache Kafka 簡易入門 1435.4.1 分布式事件數據 1455.4.2 Apache Kafka 的功能 .1475.5 流式架構.1485.5.1 事件生產者 .1485.5.2 事件消費者 .1515.5.3 事件平臺 1535.5.4 事件溯源和命令溯源1545.5.5 治理模型 1575.5.6 業務流 1585.5.7 流式數據消費模式 1615.5.8 事件攜帶狀態轉移 1635.5.9 扮演RDS 的角色 .1645.5.10 使用流式處理來填充RDS 1645.5.11 用來指導領域的控制措施和政策 1655.6 作為運營支撐的流式處理 .1665.7 保證與一致性 1675.7.1 一致性水平 .1675.7.2 “至少一次、恰好一次和至多一次”的處理 1675.7.3 消息順序 1685.7.4 死信隊列 1685.7.5 流式處理的互操作性1695.8 用于治理和自助服務模型的元數據1705.9 小結 171第6 章 將知識串聯起來 1736.1 架構回顧.1736.1.1 RDS 架構 .1746.1.2 API 架構 1746.1.3 流式架構 1756.1.4 強化模式 1756.2 企業互操作性標準 .1776.2.1 穩定的數據端點 .1786.2.2 數據交付契約 .1816.2.3 可訪問和可尋址的數據 .1826.2.4 跨網絡原則 .1826.3 企業數據標準 1886.3.1 消費優化原則 .1896.3.2 元數據的可發現性 1926.3.3 語義一致性 .1966.3.4 提供相應的元數據 2006.3.5 數據來源與移動 2006.4 參考架構.2036.5 小結 204第7 章 可持續的數據治理與數據安全 2077.1 數據治理.2077.1.1 組織:數據治理的角色 .2097.1.2 流程:數據治理的活動 .2127.1.3 人員:信任與道德、社會和經濟的考量 2147.1.4 技術:黃金數據源,所有權和應用程序管理 2147.1.5 數據:黃金數據源,黃金源數據集和分類 .2167.2 數據安全.2247.2.1 時下的孤島方法 2257.2.2 架構的統一數據安全2257.2.3 身份提供者 .2277.2.4 安全參考架構和數據上下文方法 .2287.2.5 安全處理流程 .2307.3 實踐指南.2347.3.1 RDS 架構 .2347.3.2 API 架構 2367.3.3 流式架構 2407.3.4 智能學習引擎 .2417.4 小結 242第8 章 從數據獲取價值 2438.1 消費模式.2448.1.1 直接使用只讀數據存儲 .2448.1.2 領域數據存儲 .2458.2 目標運營模式 2478.3 作為目標用戶群體的數據專業人員2488.4 業務需求.2508.5 非功能性需求 2508.6 創建數據管道和數據模型 .2528.7 分發集成數據 2598.8 商業智能能力 2608.9 自助服務能力 2628.10 分析能力 2658.10.1 自動化部署的標準基礎設施 2668.10.2 無狀態模型2668.10.3 預設和配置好的工作臺 2668.10.4 模型集成模式的標準化 2678.10.5 自動化 .2688.10.6 模型元數據2688.11 高級分析參考架構 2708.12 小結 273第9 章 掌握企業數據資產 2759.1 揭秘主數據管理 .2769.2 主數據管理風格 .2769.3 主數據管理參考架構 2789.3.1 設計主數據管理解決方案 2799.3.2 MDM 的分發 2819.3.3 主標識號 2819.3.4 參考數據與主數據 2829.4 確定企業數據的范圍 2839.5 MDM 和數據質量即服務 2869.6 精選數據.2869.6.1 元數據交換 .2879.6.2 集成視圖 2889.6.3 可復用組件和集成邏輯 .2889.6.4 數據重新發布 .2899.7 與數據治理的關系 .2909.8 小結 290第10 章 通過元數據實現數據民主化 29310.1 元數據管理 .29410.2 企業元數據模型 29510.3 企業知識圖譜 30310.4 元數據管理的架構方法 30710.4.1 元數據互操作性 .30810.4.2 元數據存儲庫 31010.5 能提供快速訪問授權數據的市場 31310.6 小結 316第11 章 結論 31711.1 交付模式 31811.1.1 完全去中心化方案 31911.1.2 部分去中心化方案 32011.1.3 構建團隊 32011.1.4 內部開源策略 32111.2 文化 32211.3 技術選擇 32311.4 傳統企業架構的沒落 .32411.4.1 藍圖和圖表 32411.4.2 現代技能 32511.4.3 控制和管理 32511.5 *后的話 326術語 . 327
展開全部
大規模數據管理 作者簡介
Piethein Strengholt喜愛為復雜問題尋找實?且持久的解決?案。在擔任戰略顧問和?由職業應?程序開發?員超過?年之久后,他作為?席架構師加?了荷蘭銀?(ABN AMRO),推進數據管理、云計算和系統集成等領域的發展。在這個激動??的職位上,他負責監督公司的數據戰略及其對組織的影響。他和家??前住在荷蘭。