-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據工程之道:設計和構建健壯的數據系統 版權信息
- ISBN:9787111745273
- 條形碼:9787111745273 ; 978-7-111-74527-3
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據工程之道:設計和構建健壯的數據系統 本書特色
數據工程在過去的十幾年發展迅速,許多軟件工程師、數據科學家和分析師想要追尋數據工程的全景。通過這本實用的書,你將學會通過數據工程生命周期框架評估現有的*佳技術,從而規劃和構建系統來滿足組織和客戶的需求。
作者將帶領你了解數據工程生命周期,并展示各種云技術的組合運用來滿足下游數據消費者的需求。你將了解如何應用數據生成、攝取、編排、轉換、存儲和治理的概念,無論底層技術如何,這些概念在任何數據環境中都至關重要。
本書將幫助你:
? 全面概覽數據工程領域。
? 使用端到端的*佳實踐框架來評估數據工程問題。
? 看穿營銷炒作,選擇正確的技術、數據架構和流程。
? 使用數據工程生命周期來設計和構建健壯的架構。
? 將數據治理和數據安全融入數據工程生命周期。
數據工程之道:設計和構建健壯的數據系統 內容簡介
本書介紹了數據工程生命周期,并展示如何組合運用各種云技術來滿足下游數據消費者的需求。本書分為三部分:**部分介紹了數據工程的定義、數據工程的生命周期、合理的架構設計和幫助技術選型的框架;第二部分深入介紹了數據工程生命周期的每個階段——數據生成、存儲、獲取、轉換和服務;第三部分討論了數據工程的重要部分——安全和隱私。附錄還介紹了與處理數據文件和評估數據系統的性能有關的序列化和壓縮,以及云網絡。本書適合軟件工程師、數據科學家、數據工程師和數據分析師等相關技術人員閱讀。
數據工程之道:設計和構建健壯的數據系統 目錄
**部分 基礎和構建塊7
第1章 數據工程概述9
1.1 什么是數據工程9
1.2 數據工程技能和活動18
1.3 組織內部的數據工程師26
1.4 總結34
1.5 補充資料34
第2章 數據工程生命周期36
2.1 什么是數據工程生命周期36
2.2 數據工程生命周期中的主要底層設計49
2.3 總結66
2.4 補充資料67
第3章 設計好的數據架構68
3.1 什么是數據架構68
3.2 好的數據架構的原則73
3.3 主要架構概念81
3.4 數據架構的示例和類型91
3.5 誰參與了數據架構的設計102
3.6 總結102
3.7 補充資料103
第4章 根據數據生命周期選擇技術107
4.1 團隊大小和能力108
4.2 加速市場化109
4.3 互操作性109
4.4 成本優化和商業價值110
4.5 現在與未來:不變的與暫時的技術112
4.6 部署位置114
4.7 構建與購買122
4.8 單體與模塊化128
4.9 無服務器與服務器131
4.10 優化、性能和基準戰爭135
4.11 底層設計及其對技術選擇的影響137
4.12 總結139
4.13 補充資料139
第二部分 深入數據工程生命周期141
第5章 源系統中的數據生成143
5.1 數據源:數據是如何生成的?144
5.2 源系統:主要觀點144
5.3 源系統實際細節152
5.4 你和誰一起工作166
5.5 數據底層設計及其對源系統的影響167
5.6 總結171
5.7 補充資料172
第6章 存儲173
6.1 數據存儲的原材料174
6.2 數據存儲系統180
6.3 數據工程存儲抽象195
6.4 存儲的重要思想和趨勢198
6.5 你和誰一起工作206
6.6 底層設計207
6.7 總結209
6.8 補充資料209
第7章 獲取210
7.1 什么是數據獲取210
7.2 數據獲取階段的關鍵工程考慮因素212
7.3 批量獲取的考慮因素220
7.4 消息和流獲取的考慮因素223
7.5 獲取數據的方式225
7.6 你和誰一起工作236
7.7 底層設計237
7.8 總結241
7.9 補充資料242
第8章 查詢、建模和轉換243
8.1 查詢244
8.2 數據建模257
8.3 轉換276
8.4 你和誰一起工作293
8.5 底層設計294
8.6 總結298
8.7 補充資料298
第9章 為分析、機器學習和反向ETL提供數據服務300
9.1 提供數據服務的常見關注點301
9.2 分析306
9.3 機器學習310
9.4 數據工程師需要理解的機器學習知識310
9.5 為分析和機器學習提供數據服務的方法312
9.6 反向ETL318
9.7 你和誰一起工作319
9.8 底層設計320
9.9 總結324
9.10 補充資料324
第三部分 安全、隱私和數據工程的未來327
第10章 安全和隱私329
10.1 人員330
10.2 流程330
10.3 技術333
10.4 總結336
10.5 補充資料336
第11章 數據工程的未來337
11.1 常青的數據工程生命周期337
11.2 復雜性的下降和易用的數據工具的興起338
11.3 云數據操作系統及其高互通性339
11.4 “企業級”數據工程340
11.5 數據工程師的頭銜和職責將發生的變化341
11.6 超越現代數據棧,邁向實時數據棧341
11.7 總結345
附錄A 序列化和壓縮技術的細節347
附錄B 云網絡353
數據工程之道:設計和構建健壯的數據系統 作者簡介
Joe Reis是“數據恢復科學家”,也是數據工程師和架構師。他是Ternary Data的首席執行官和聯合創始人,在統計建模、預測、機器學習、數據工程、數據架構等領域有豐富的從業經驗。
Matt Housley是數據工程顧問和云計算專家,目前專注于基于云的數據工程。
- >
月亮虎
- >
經典常談
- >
我與地壇
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
我從未如此眷戀人間
- >
龍榆生:詞曲概論/大家小書
- >
小考拉的故事-套裝共3冊
- >
名家帶你讀魯迅:朝花夕拾