-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據管理十講 版權信息
- ISBN:9787111733348
- 條形碼:9787111733348 ; 978-7-111-73334-8
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據管理十講 本書特色
中國工程院院士鄭緯民作序
數據庫領域專家學者攜手打造,系統構建知識體系
綜述當下領域前沿研究方向、理論與技術
以宏觀視野把握領域前沿,獲取領域底層邏輯
數據管理十講 內容簡介
隨著社交網絡等新型應用的興起和云計算等新技術的快速發展,人類獲取數據的規模正以靠前的速度增長,數據中包含了大量有價值的信息,能夠有效助力社會、經濟、科技的發展,因此數據管理與分析方面的研究工作倍受關注。本書針對該領域的研究熱點和前沿技術進行了深入淺出的介紹,包括圖數據、云數據庫系統、時空數據、數據質量、數據庫智能化等,幫助讀者構建宏觀視野,把握領域前沿。 本書適合數據管理與分析等相關領域的科研人員、年輕教師、研究生,以及從事相關工作的人員閱讀。
數據管理十講 目錄
“十講”序
前言
第1講 圖數據管理本講概覽/ 2
1.1 圖數據庫的數據模型和查詢語言/ 2
1.1.1 數據模型/ 2
1.1.2 查詢語言/ 5
1.2 圖數據庫的系統架構/ 8
1.2.1 Neo4j/ 8
1.2.2 Jena/ 10
1.2.3 gStore/ 12
1.3 圖數據庫中的查詢處理/ 15
1.3.1 基于探索的子圖匹配算法/ 16
1.3.2 基于連接的子圖匹配算法/ 19
1.3.3 分布式子圖匹配算法/ 20
1.4 本講小結/ 22
參考文獻/ 22
第2講 云數據管理本講概覽/ 28
2.1 云數據庫概述/ 28
2.1.1 云數據庫的定義/ 29
2.1.2 云數據庫的優勢/ 29
2.2 云服務簡介/ 30
2.2.1 云服務的背景/ 30
2.2.2 云服務的特性/ 32
2.3 云托管數據庫/ 33
2.3.1 傳統數據庫的制約/ 34
2.3.2 云托管數據庫的起源/ 34
2.3.3 云托管數據庫的利弊/ 35
2.4 云原生數據庫/ 36
2.4.1 云原生數據庫系統架構/ 37
2.4.2 OLTP云數據庫架構/ 37
2.4.3 OLAP云數據庫架構/ 42
2.4.4 云原生數據庫系統關鍵技術/ 45
2.5 本講小結/ 56
參考文獻/ 56
第3講 多模態數據管理本講概覽/ 60
3.1 問題背景/ 60
3.2 數據存儲/ 61
3.2.1 分散存儲/ 62
3.2.2 統一存儲/ 64
3.3 數據建模/ 65
3.3.1 統一建模/ 67
3.3.2 混合建模/ 69
3.4 數據查詢/ 70
3.4.1 查詢執行/ 71
3.4.2 查詢優化/ 72
3.5 多模態數據管理系統/ 74
3.6 本講小結/ 76
參考文獻/ 76
第4講 時空數據管理本講概覽/ 78
4.1 時空數據管理概述/ 78
4.1.1 空間數據管理的基本概念/ 78
4.1.2 軌跡數據管理的基本概念/ 78
4.2 空間數據管理/ 79
4.2.1 空間數據索引/ 79
4.2.2 空間區域查詢/ 86
4.2.3 空間數據k*近鄰查詢/ 86
4.2.4 空間數據Skyline查詢/ 91
4.3 軌跡數據管理/ 96
4.3.1 地圖匹配/ 96
4.3.2 軌跡數據索引/ 100
4.3.3 軌跡數據相似性查詢/ 104
4.3.4 軌跡數據聚類/ 107
4.4 本講小結/ 110
參考文獻/ 111
第5講 流數據管理本講概覽/ 124
5.1 流數據管理的基本概念/ 124
5.1.1 流數據管理/ 124
5.1.2 流數據管理的作用/ 126
5.2 基礎流算法/ 126
5.2.1 常見數據流模型/ 126
5.2.2 元素個數估計/ 129
5.2.3 top k元素估計與直方圖/ 131
5.2.4 數據流上不同元素個數估計/ 133
5.3 數據挖掘與流算法/ 137
5.3.1 數據流上的頻繁項估計/ 138
5.3.2 數據流上的聚類/ 139
5.4 進階流算法/ 142
5.4.1 Count Sketch/ 142
5.4.2 Count-Min Sketch/ 144
5.5 流數據管理系統/ 145
5.5.1 常見的流數據管理系統/ 146
5.5.2 流數據管理系統的比較/ 152
5.5.3 批、流數據管理系統對比/ 155
5.6 流數據的應用與未來/ 160
5.6.1 流數據的應用/ 160
5.6.2 流數據管理的未來展望/ 162
5.7 本講小結/ 162
參考文獻/ 163
第6講 區塊鏈數據管理本講概覽/ 168
6.1 區塊鏈概述/ 168
6.1.1 區塊鏈:信任構建的基礎設施/ 168
6.1.2 區塊鏈發展歷史/ 169
6.1.3 區塊鏈架構劃分/ 170
6.2 區塊鏈數據存儲/ 170
6.2.1 鏈式數據結構/ 170
6.2.2 默克爾樹/ 171
6.2.3 區塊數據和狀態數據/ 172
6.2.4 數據存儲方式/ 174
6.3 共識算法/ 176
6.3.1 PoX系列/ 177
6.3.2 Raft共識協議/ 179
6.3.3 PBFT協議/ 180
6.4 交易處理方式/ 182
6.4.1 “共識-執行”模型/ 183
6.4.2 “執行-共識-驗證”模式/ 185
6.4.3 分片執行/ 187
6.5 區塊鏈查詢方法/ 189
6.5.1 可驗證查詢/ 189
6.5.2 基于可信執行環境的查詢處理/ 191
6.6 本講小結/ 192
參考文獻/ 192
第7講 數據質量管理本講概覽/ 196
7.1 概述/ 196
7.1.1 數據質量管理的意義與價值/ 196
7.1.2 數據質量管理研究歷程介紹/ 198
7.2 數據質量/ 200
7.2.1 數據質量維度/ 200
7.2.2 數據質量評估模型/ 201
7.2.3 數據可用性問題/ 203
7.3 數據可用性理論研究/ 204
7.3.1 數據可用性概念與表達機理/ 205
7.3.2 數據可用性的判定理論/ 207
7.3.3 大數據量質融合管理理論與技術/ 209
7.3.4 弱可用數據的近似計算理論與算法/ 210
7.4 數據清洗技術研究/ 212
7.4.1 數據質量問題分類/ 212
7.4.2 清洗流程概述/ 213
7.5 數據質量持續改進模型與技術/ 214
7.5.1 人工參與的數據清洗模型/ 214
7.5.2 面向大數據的清洗技術/ 219
7.5.3 數據質量問題溯源分析技術/ 223
7.5.4 人工智能賦能的數據清洗技術/ 226
7.6 數據清洗工具與系統介紹/ 229
7.6.1 基于規則約束的數據清洗工具/ 229
7.6.2 基于眾包的數據清洗工具/ 235
7.6.3 基于
數據管理十講 作者簡介
袁野
北京理工大學計算機學院教授,國家杰青和優青基金獲得者。長期從事大數據管理與分析研究,發表CCF A類論文100余篇。主持國家自然科學基金重點項目、科技部重點研發項目。獲中國電子學會自然科學一等獎,和遼寧省科技進步一等獎。擔任中國計算機學會數據庫專業委員會副主任。香港科技大學、香港中文大學、英國愛丁堡大學訪問學者。
崔斌
北京大學計算機學院教授,數據科學與工程研究所所長。長期從事數據庫系統、大數據管理與分析研究,在國際頂級期刊、會議發表論文200余篇。擔任中國計算機學會數據庫專業委員會副主任,DSE期刊主編,VLDB 2024大會主席。獲得“微軟青年教授獎”、“CCF 青年科學家獎”、自然科學二等獎,2023年當選IEEE Fellow。
李戰懷袁野
北京理工大學計算機學院教授,國家杰青和優青基金獲得者。長期從事大數據管理與分析研究,發表CCF A類論文100余篇。主持國家自然科學基金重點項目、科技部重點研發項目。獲中國電子學會自然科學一等獎,和遼寧省科技進步一等獎。擔任中國計算機學會數據庫專業委員會副主任。香港科技大學、香港中文大學、英國愛丁堡大學訪問學者。
崔斌
北京大學計算機學院教授,數據科學與工程研究所所長。長期從事數據庫系統、大數據管理與分析研究,在國際頂級期刊、會議發表論文200余篇。擔任中國計算機學會數據庫專業委員會副主任,DSE期刊主編,VLDB 2024大會主席。獲得“微軟青年教授獎”、“CCF 青年科學家獎”、自然科學二等獎,2023年當選IEEE Fellow。
李戰懷
西北工業大學計算機學院教授,工業和信息化部大數據存儲與管理重點實驗室主任,中國計算機學會數據庫專業委員會主任。主要從事大數據管理技術、海量信息存儲系統等研究。主持國家973課題,科技部重點研發計劃課題,國家自然科學基金重點項目、重大國際合作項目,國家863計劃重大項目課題等。獲省部級一等獎、二等獎各兩項。
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
二體千字文
- >
推拿
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
隨園食單
- >
月亮與六便士
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
詩經-先民的歌唱