-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據血緣分析原理與實踐 版權信息
- ISBN:9787111757016
- 條形碼:9787111757016 ; 978-7-111-75701-6
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據血緣分析原理與實踐 本書特色
數據資產化是大趨勢,也是未來企業必須做的事情。而數據要想真正實現資產化,必須要有高質量的數據作為基礎。數據血緣將成為高質量數據的*底層保障。數據血緣的重要性正在慢慢顯現,建議所有數據相關的從業者都不要錯過這波紅利,也許這本書將為你的職業生涯打開新篇章。
數據血緣分析原理與實踐 內容簡介
這是一部可以幫助讀者從0開始理解、建設并深度實踐數據血緣及其系統的專業指導手冊。全書所有內容均來自兩位作者長期在世界500強企業從事數據相關工作的經驗總結,書中不僅從原理層面帶領讀者深挖數據血緣本質,還有從實踐層面對數據血緣的建設方法、核心技術、主流工具、在數據治理中的應用、典型行業應用案例進行了全方位剖析。 本書得到了美國南卡羅來納大學教授、DAMA大中華區主席、中國大數據技術標準推進委員會專家、招商蛇口數字化管理及運營負責人、PowerData社區主理人等多位業界專家的鼎力推薦。 本書包括4篇14章,具體內容如下。 概念篇從企業面臨的主要數據問題入手,逐漸延伸到對數據血緣的相關定義、特征、價值,以及數據組成的深度解讀。這部分是真正落地數據血緣項目的基礎,只有充分理解了這部分內容,才知道如何與上下游溝通協作。 建設篇先完整展示了一個可落地的數據血緣框架模型——“1355”框架模型,即1個周期、3種實體、5個類型、5個層級,這是數據血緣建設的基礎模型;然后詳細介紹了數據血緣實施路徑,其中包括可能會面臨的問題、具體建設方式和具體建設步驟。 技術篇重點數據血緣相關技術和產品,以及數據血緣分析的主要應用場景——數據治理。其中,包括3大數據血緣應用場景、7大數據血緣核心技術、9款主流的數據血緣產品,以及數據血緣在數據治理中的深度實踐。 案例篇主要分享了互聯網、服務、制造、零售快消等行業中數據血緣建設案例,幫助大家了解典型行業數據血緣的落地情況,以求獲得一些啟發。
數據血緣分析原理與實踐 目錄
前言
致謝
概念篇
第1章 走進數據血緣2
1.1 企業目前面臨的問題與挑戰2
1.1.1 互聯網行業:數據安全面臨
嚴峻挑戰3
1.1.2 能源化工行業:數據共享互通能力待加強4
1.1.3 裝備制造行業:產品數據采集難5
1.1.4 零售行業:數據分析勢在必行5
1.1.5 建筑行業:大數據治理能力亟須提升6
1.1.6 從問題和挑戰中找解決方案7
1.2 揭開數據血緣的面紗8
1.2.1 什么是數據和數據管理8
1.2.2 什么是數據血緣10
1.2.3 什么是數據血緣分析11
1.2.4 什么是數據血緣可視化14
1.2.5 數據血緣的特征16
1.2.6 與數據血緣相關的概念20
1.3 數據血緣分析是解決數據問題的靈丹妙藥23
1.3.1 破除數據質疑23
1.3.2 數據變更影響范圍快速評估24
1.3.3 數據資產價值評估度量工具25
1.3.4 為數據濫用加上一把“道德”
之鎖26
1.4 本章小結27
第2章 數據血緣中的數據組成部分29
2.1 溯源血緣關系的重要依據—
元數據29
2.1.1 元數據的概念29
2.1.2 元數據的數據血緣特征31
2.2 確定血緣關系的黃金數據—
主數據32
2.2.1 主數據的概念32
2.2.2 主數據的數據血緣特征34
2.3 記錄業務動態發生的數據—
業務數據35
2.3.1 業務數據的概念35
2.3.2 業務數據的數據血緣特征35
2.4 提供分析決策的重要成果—
指標數據36
2.4.1 指標數據的概念36
2.4.2 指標數據的數據血緣特征37
2.5 本章小結37
建設篇
第3章 數據血緣分析框架模型40
3.1 1個周期:數據全生命周期管理40
3.2 3種實體:數據血緣實體結構43
3.2.1 數據庫血緣44
3.2.2 數據表血緣44
3.2.3 字段血緣46
3.3 5個類型:數據血緣分類48
3.3.1 邏輯血緣48
3.3.2 物理血緣48
3.3.3 時間血緣48
3.3.4 操作血緣48
3.3.5 業務血緣49
3.4 5個層級:構建基礎平臺,支撐
數據血緣分析49
3.4.1 血緣采集層50
3.4.2 血緣處理層52
3.4.3 血緣存儲層52
3.4.4 血緣接口層53
3.4.5 血緣應用層53
3.5 本章小結57
第4章 數據血緣實施路徑59
4.1 數據血緣實施過程中的問題與難點59
4.1.1 血緣質量不高59
4.1.2 實施路徑不清晰61
4.1.3 數據血緣關系自動解析難62
4.2 數據血緣建設方式63
4.2.1 常見的3種建設方式的優劣勢63
4.2.2 建設方式注意事項65
4.3 數據血緣建設步驟65
4.3.1 明確數據血緣目標66
4.3.2 制定數據血緣需求范圍75
4.3.3 構建數據血緣系統77
4.3.4 完成數據血緣收集85
4.3.5 完成數據血緣初始化92
4.3.6 實現數據血緣的可視化93
4.4 本章小結98
技術篇
第5章 數據血緣分析應用100
5.1 數據開發應用場景100
5.2 數據資產應用場景102
5.3 數據安全應用場景103
5.4 本章小結106
第6章 數據血緣技術107
6.1 概述107
6.2 數據采集技術108
6.2.1 ETL技術應用108
6.2.2 SQL解析應用109
6.3 數據建模110
6.3.1 概念建模111
6.3.2 邏輯建模111
6.3.3 物理建模112
6.4 數據可視化技術112
6.4.1 數據可視化工具113
6.4.2 圖形庫和框架114
6.5 其他相關技術115
6.5.1 數據挖掘技術115
6.5.2 區塊鏈技術116
6.5.3 人工智能技術117
6.5.4 大數據技術118
6.6 本章小結119
第7章 數據血緣產品121
7.1 國外主流數據血緣產品介紹121
7.1.1 開源的Apache Atlas平臺121
7.1.2 社交網站LinkedIn的數據
平臺123
7.2 國內主流數據血緣產品介紹126
7.2.1 馬哈魚數據血緣平臺126
7.2.2 FineBI數據可視化工具129
7.2.3 億信元數據管理平臺129
7.2.4 飛算SoData數據機器人130
7.3 其他數據血緣產品介紹131
7.3.1 Informatica數據平臺131
7.3.2 Alation數據平臺131
7.3.3 Collibra數據平臺132
7.4 本章小結133
第8章 數據治理中的數據血緣
應用134
8.1 數據治理體系簡介134
8.1.1 數據管理、數據治理與數據
資產管理134
8.1.2 DAMA的數據治理體系136
8.1.3 DMM和DCMM138
8.1.4 華為的數據治理體系139
8.1.5 阿里的數據治理體系140
8.2 數據治理與數據血緣的關系140
8.3 數據血緣在數據治理中的應用141
8.3.1 數據血緣在數據質量提升中的
應用141
8.3.2 數據血緣在數據架構中的應用143
8.3.3 數據血緣在數據建模和設計
中的應用144
8.3.4 數據血緣在數據安全中的應用145
8.4 本章小結146
第9章 數據血緣的平
數據血緣分析原理與實踐 作者簡介
成于念,資深數據治理專家,具有近10年數據治理相關工作經驗,曾就職于某世界500強企業,專門從事數據治理相關工作。曾為多家千億級企業提供主數據、數據治理方向的培訓服務,熟悉各種主流數據治理技術和產品,并發表過多篇關于數據相關文章及論文。DAMA中國會員,“人人都是產品經理”專欄作者,“PMTalk社區”專欄作者,“三節課”兼職講師,“老司機聊數據”公眾號主理人。
賽助力,資深數據治理專家,曾就職于某世界500強企業,負責數據管理相關工作,10余年ERP及數據管理類項目實踐經驗,曾為多家千億級企業提供數據治理方案,行業覆蓋地產、制造業、消費品、醫藥、汽車等,熟悉多種主流數據治理軟件。發表過數據類相關文獻20余篇,被多家企業推薦或引用。DAMA中國會員,“人人都是產品經理”專欄作者,“老司機聊數據”公眾號主理人。
- >
苦雨齋序跋文-周作人自編集
- >
伯納黛特,你要去哪(2021新版)
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
龍榆生:詞曲概論/大家小書
- >
巴金-再思錄
- >
史學評論
- >
羅曼·羅蘭讀書隨筆-精裝
- >
回憶愛瑪儂