-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據血緣:理論與業務實踐 版權信息
- ISBN:9787121459511
- 條形碼:9787121459511 ; 978-7-121-45951-1
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據血緣:理論與業務實踐 本書特色
數據血緣在數據治理、數據分析、數據集成、元數據管理等工作中發揮著重要作用。然而,對許多用戶來說,數據血緣仍然是一個抽象且未知的概念。數據血緣的實現過程是復雜且耗費資源的。即使實現了,它也未必能如預期一樣使用。 本書專門為數據開發人員和數據管理人員打造,書中不僅提供了關于數據血緣的定義和模型,還展示了數據血緣的*佳實踐案例,并討論了數據血緣的主要應用領域。 本書適用于以下不同專業領域的人群: (1)數據管理和數據業務相關專業人員,通過本書可以在數據血緣及其應用領域方面獲得啟發并拓寬思路。 (2)具有技術背景的專業人員,通過本書可以更好地了解業務需求和數據血緣需求。 (3)項目管理專業人員,通過本書可以熟練掌握數據血緣的*佳實踐。
數據血緣:理論與業務實踐 內容簡介
本書共分為四篇。前三篇分別對應數據血緣的理論、實現和應用:**篇闡明數據血緣的概念,主要介紹有關數據血緣概念的綜合知識;第二篇介紹如何實現數據血緣,包括一些關于實現數據血緣的可行性見解和建議;第三篇介紹如何使用數據血緣,利用數據血緣結果實現不同的業務目的。第四篇是關于“構建數據血緣業務案例”的研究,介紹如何將數據血緣落地到業務案例中。 本書主要面向數據開發人員和數據管理人員,用于針對數據血緣及其應用領域拓寬思路。本書也適合具有技術背景的數據業務人員參考閱讀,便于更好地理解業務需求和數據血緣需求。
數據血緣:理論與業務實踐 目錄
**篇 闡明數據血緣的概念
第1 章 數據血緣的現有觀點和方法分析… ……………………… 010
1.1 數據血緣和其他類似的概念 ……………………………………… 010
1.2 數據血緣組件 ……………………………………………………… 016
1.3 數據血緣與數據生命周期的關系 ………………………………… 018
1.4 數據血緣與數據管理能力和企業架構 …………………………… 019
1.5 DAMA-DMBOK2 關于記錄數據血緣的建議 ……………………… 024
1.6 本書使用的概念 …………………………………………………… 025
第2 章 記錄數據血緣的業務驅動因素… ………………………… 028
2.1 滿足法規需求 ……………………………………………………… 028
2.2 業務變更 …………………………………………………………… 033
2.3 數據管理舉措 ……………………………………………………… 034
2.4 透明性和審計需求 ………………………………………………… 034
第3 章 元模型的概念… …………………………………………… 036
3.1 數據和信息的概念 ………………………………………………… 036
3.2 元數據語境下的數據血緣 ………………………………………… 040
3.3 元模型的定義 ……………………………………………………… 042
第4 章 數據血緣元模型… ………………………………………… 045
4.1 數據血緣元模型的結構 …………………………………………… 046
4.2 業務層 ……………………………………………………………… 047
4.2.1 業務能力… …………………………………………………… 048
4.2.2 流程… ………………………………………………………… 049
4.2.3 角色… ………………………………………………………… 051
4.2.4 業務主題域(數據)… ………………………………………… 051
4.2.5 IT 資產(工具)… ……………………………………………… 051
4.3 與數據模型相關的挑戰 …………………………………………… 053
4.4 概念層 ……………………………………………………………… 055
4.4.1 傳統概念模型… ……………………………………………… 055
4.4.2 語義模型… …………………………………………………… 057
4.4.3 本書使用的概念層模型… …………………………………… 058
4.5 邏輯層 ……………………………………………………………… 059
4.5.1 傳統邏輯模型… ……………………………………………… 059
4.5.2 解決方案模型… ……………………………………………… 061
4.5.3 本書使用的邏輯層模型… …………………………………… 061
4.6 物理層 ……………………………………………………………… 063
4.7 業務規則 …………………………………………………………… 064
4.8 數據血緣元模型的圖形化表示 …………………………………… 066
第5 章 數據血緣類型… …………………………………………… 073
5.1 元數據血緣和數據值血緣 ………………………………………… 074
5.2 不同記錄層級的數據血緣 ………………………………………… 075
5.3 橫向和縱向數據血緣 ……………………………………………… 076
5.4 描述型和自動型數據血緣 ………………………………………… 076
5.5 各種數據血緣之間的相關性 ……………………………………… 077
第二篇 實現數據血緣
第6 章 使用九步方法論構建數據血緣案例… …………………… 085
第7 章 明確數據血緣工作的范圍… ……………………………… 091
7.1 “企業”的范圍 ……………………………………………………… 092
7.2 數據血緣的“長度” ………………………………………………… 092
7.3 數據血緣的“深度” ………………………………………………… 094
7.4 關鍵數據集 ………………………………………………………… 094
7.5 數據血緣組件的數量 ……………………………………………… 094
第8 章 定義數據血緣相關的角色… ……………………………… 096
8.1 影響角色設計的主要因素 ………………………………………… 096
8.1.1 數據專員類型… ……………………………………………… 098
8.1.2 業務能力維度… ……………………………………………… 100
8.1.3 數據鏈上的角色位置… ……………………………………… 101
8.1.4 數據管理子能力… …………………………………………… 102
8.1.5 數據架構風格… ……………………………………………… 104
8.1.6 IT 解決方案的設計方法… …………………………………… 106
8.1.7 業務域定義… ………………………………………………… 106
8.1.8 “企業”的規模… ……………………………………………… 107
8.2 記錄數據血緣涉及的數據管理角色 ……………………………… 107
第9 章 定義數據血緣需求… ……………………………………… 110
9.1 需求類型 …………………………………………………………… 111
9.2 元數據血緣需求 …………………………………………………… 112
9.2.1 通用需求… …………………………………………………… 112
9.2.2 橫向數據血緣需求… ………………………………………… 113
9.2.3 縱向數據血緣需求… ………………………………………… 115
9.3 數據值血緣需求 …………………………………………………… 116
第10 章 確定數據血緣實施方案…………………………………… 118
10.1 影響方案選擇的因素 ……………………………………………… 119
10.2 溝通數據血緣的范圍和方案 ……………………………………… 126
第11 章 選擇合適的數據血緣解決方案…………………………… 129
11.1 軟件解決方案相關的術語 ………………………………………… 130
11.2 記錄數據血緣的軟件解決方案類型 ……………………………… 131
11.3 數據血緣解決方案的主要來源 …………………………………… 133
11.4 記錄數據血緣的解決方案 ………………………………………… 138
11.4.1 業務流程建模解決方案… …………………………………… 139
11.4.2 企業架構解決方案… ………………………………………… 140
11.4.3 數據建模解決方案… ………………………………………… 142
11.4.4 元數據、數據治理和數據血緣解決方案… ………………… 143
11.4.5 數據質量和知識圖譜解決方案… …………………………… 147
11.4.6 數據血緣解決方案的高階功能概述… ……………………… 147
第12 章 數據血緣的記錄和構建分析……………………………… 152
12.1 描述型和自動型數據血緣記錄方法的主要組件 ………………… 153
12.2 數據血緣記錄的主要步驟 ………………………………………… 154
12.3 使用描述型方法記錄數據血緣 …………………………………… 155
12.4 使用自動型方法記錄數據血緣 …………………………………… 161
12.5 描述型和自動型數據血緣組件的集成 …………………………… 165
12.6 數據值血緣管理 …………………………………………………… 165
第13 章 數據血緣業務案例的風險因素和成功因素……………… 169
13.1 風險因素 …………………………………………………………… 169
13.2 成功因素 …………………………………………………………… 170
第三篇 使用數據血緣
第14 章 關鍵數據…………………………………………………… 177
14.1 關鍵數據的使用場景 ……………………………………………… 177
14.2 關鍵數據(元素)的定義 ………………………………………… 178
14.3 “關鍵數據”概念的應用領域 …………………………………… 180
14.4 “關鍵數據”概念的實施 ………………………………………… 182
第15 章 數據質量…………………………………………………… 190
15.1 設定數據質量需求 ………………………………………………… 190
15.2 設計和構建數據質量檢查和控制機制 …………………………… 191
第16 章 影響分析和根因分析……………………………………… 194
第17 章 業務驅動因素建模………………………………………… 199
第18 章 建立數據管理框架………………………………………… 202
18.1 數據管理的“橙色”模型 ………………………………………… 202
18.2 建立數據管理框架與記錄數據血緣 ……………………………… 204
第四篇 案例研究:構建數據血緣業務案例
步驟1:確定業務驅動因素 ……………………………………………… 211
步驟2:主要利益相關者的預算支持和參與 …………………………… 212
步驟3:數據血緣工作的范圍 …………………………………………… 212
步驟4:定義角色和職責 ………………………………………………… 218
步驟5:準備數據血緣需求 ……………………………………………… 218
步驟6:選擇記錄數據血緣的方式和方法 ……………………………… 221
步驟7:選擇合適的數據血緣解決方案 ………………………………… 222
附錄…………………………………………………………………… 226
模板1 數據血緣需求 …………………………………………………… 227
模板2 數據血緣工作的范圍和進展 …………………………………… 229 概述 數據血緣解決方案 ………………………………………………… 231 模板3 比較數據血緣解決方案 ………………………………………… 233
數據血緣:理論與業務實踐 相關資料
譯者序 在數據量不斷增長、數據生態系統復雜的時代,追蹤數據從源頭到目的地,及其經過的各種流程和系統的信息,對確保數據質量、合規性和決策來說至關重要。這些信息被稱為數據血緣。 數據血緣既能回答“這些數據從哪里來,到哪里去”這樣的哲學問題,也能回答“數據是如何進行加工轉換的”這樣的技術問題,幫助我們深入了解數據資產的可靠性、可信度。 數據血緣的重要性超出了傳統的數據治理和合規性。它在智能數據分析、數據集成、數據質量管理和數據驅動決策方面發揮著至關重要的作用。了解數據血緣,能夠使組織識別數據異常、解決問題、跟蹤數據轉換,并確保遵守 GDPR、CCPA 等法規。 數據血緣是企業最重要的數據資產之一,而且未來它將充當更加重要的角色。一方面,完整的數據血緣信息可以有效跟蹤敏感數據的全鏈路生命周期,實現數據安全合規。例如:源端系統中的PII(個人身份識別信息)在數倉、大數據平臺、數據湖中是否得到有效的脫敏?哪些數據服務可能泄露機密?哪些數據可能被消費者獲取?另一方面,數據血緣可以進行變更影響分析,即分析數據的變更對相關業務的影響。例如:當源端業務系統的數據結構發生變化時,要及時分析其對后端數據應用的影響,以便在源業務系統升級前給出合適的應對措施,保障后端應用的連續性。這種影響就如同在制造業中,上游原材料的價格波動對下游產品成本的影響。 數據血緣是元數據管理的重要手段之一。在建設數據倉庫、數據集市、商業智能及大數據系統的過程中,國內許多組織對配套元數據模塊進行了多年探索,研發了許多數據血緣處理技術,試圖構建一套準確、完整、實用的數據血緣圖,以滿足業務需要。讓用戶在“管理數據、使用數據”的工作中,能夠了解數據的來龍去脈,做到心中有“數”。然而在實踐過程中,即使經過長期的持續建設,配套元數據模塊的實際效果仍會大打折扣,不盡如人意。 Irina Steenbeek博士基于多年的研究和實踐經驗編著的《數據血緣:理論與業務實踐》(Data Lineage: from a Business Perspective)一書,填補了數據血緣領域的空白。本書在辨析數據血緣及其相關概念、類型的理論基礎上,詳細介紹了作者提煉總結的“構建數據血緣的九步方法論”,并通過一個實際案例展示了如何使用數據血緣,最后在附錄中給出了方法論中的工作模板。在翻譯本書的過程中,書中的許多觀點(如數據血緣項目的“企業”范圍、數據血緣的層級、橫向和縱向數據血緣、描述型和自動型數據血緣等)幫助譯者打消了多年來對數據血緣的疑慮和困惑。希望本書能夠為國內從事數據管理工作的同仁帶來同樣的收益,為提高數據血緣項目的實施效果和用戶滿意度提供助力。 最后,感謝原著作者Irina Steenbeek博士為我們帶來這本好書,并授權我們將本書翻譯為中文版本。同樣感謝電子工業出版社能夠引進本書的中文版權,感謝張爽老師擔任責任編輯,她的辛勤工作是本書能夠在第一時間與各位讀者見面的關鍵。
數據血緣:理論與業務實踐 作者簡介
Irina Steenbeek 博士是一位擁有超過 11 年經驗的數據管理從業者。她擅長的主要領域是數據管理成熟度評估、數據管理框架的實施和數據血緣。Irina 在 ERP 和 DWH/BI、管理咨詢、財務和業務控制及數據科學等軟件實施方面具有豐富的實踐經驗。多年來,她曾服務于全球機構及不同領域的大中型組織,包括金融機構、專業服務和 IT 公司。2016年,她創立了Data Crossroads——一家數據管理培訓和輔導服務企業。 Data Crossroads 專注于通過建立適合公司業務目標和資源的有效數據管理框架來幫助客戶改進決策。 本書譯者: 王琤,Datablau(北京數語科技有限公司)創始人兼CEO,信通院數據資產專家委員會成員,數據資產管理實踐白皮書主要撰寫人之一,國資委數據要素專家組成員,復旦大學、北京航空航天大學客座講師,曾任CA ERwin全球研發負責人。 車春雷,高級工程師、信息系統分析師,在科技和數據領域有30余年工作經歷,先后從事企業自動化、軟件研發、網絡設計、商業智能與企業級數據倉庫、數據標準、數據質量、數據建模等工作,積累了豐富的數據管理經驗。
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
【精裝繪本】畫給孩子的中國神話
- >
羅庸西南聯大授課錄
- >
煙與鏡
- >
經典常談
- >
詩經-先民的歌唱
- >
名家帶你讀魯迅:朝花夕拾
- >
中國人在烏蘇里邊疆區:歷史與人類學概述