-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據技術體系與開源生態 版權信息
- ISBN:9787115492234
- 條形碼:9787115492234 ; 978-7-115-49223-4
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據技術體系與開源生態 本書特色
本書分為7篇,分為15章,從大數據生命周期的角度詳細介紹了大數據技術體系與開源生態的相關內容。包括技術概述、獲取技術、管理技術、分析與挖掘技術、可視化與交互技術、安全與治理技術。內容詳實全面。 編者是現任國家科學技術獎評審專家、全國專業技術標準化委員會委員,知名度高,在業內知名,已編著書籍有很好的口碑,本書的內容專業、技術領先。
大數據技術體系與開源生態 內容簡介
本書從大數據生命周期的角度闡述大數據技術體系與開源生態的發展。全書分為7篇,包括大數據技術體系與開源生態概述、大數據獲取技術、大數據管理技術、大數據處理技術、大數據分析與挖掘技術、大數據可視化與交互技術、大數據安全與治理技術。又分為15章,詳細介紹大數據的技術概況、發展近況和技術優勢、軟件架構、和應用場景等內容。 本書適合大數據和人工智能業內人員、各大高校相關專業的高年級本科生和研究生、以及對大數據應用中各類框架組件的愛好者閱讀。
大數據技術體系與開源生態 目錄
第 一篇 大數據技術體系與開源生態概述
第 1章 大數據技術體系概述 3
1.1 大數據技術的主要內容 3
1.2 大數據開源框架 4
1.2.1 大數據獲取技術 4
1.2.2 大數據管理技術 5
1.2.3 大數據處理技術 5
1.2.4 大數據安全與治理技術 5
1.2.5 大數據分析與挖掘技術 6
1.2.6 大數據可視化技術 6
1.3 本章小結 7
第 2章 開源生態與代碼托管平臺簡介 8
2.1 開源和開源軟件的簡介 8
2.1.1 開源的簡介 8
2.1.2 開源軟件的簡介 8
2.2 開源代碼托管平臺——GitHub 9
2.3 本章小結 10
第3章 大數據開源生態的介紹 11
3. 1 Apache軟件基金會 11
3.1.1 發展歷史 11
3.1.2 主要參與者 12
3.1.3 開源項目 13
3.2 Linux 基金會 14
3.2.1 發展歷史 15
3.2.2 主要參與者 15
3.2.3 開源項目 17
3.3 開源中國 18
3.3.1 發展歷史 18
3.3.2 主要參與者 19
3.4 本章小結 19
第4章 云計算開源生態的介紹 20
4.1 OpenStack 基金會 20
4.1.1 發展歷史 21
4.1.2 主要參與者 21
4.1.3 開源項目 22
4.2 Cloud Native Computing Foundation 23
4.2.1 發展歷史 23
4.2.2 主要參與者 23
4.2.3 開源項目 25
4.3 本章小結 25
第二篇 大數據獲取技術
第5章 消息隊列相關技術 29
5.1 ZeroMQ 29
5.1.1 技術概況 29
5.1.2 發展近況和技術優勢 30
5.1.3 軟件架構 31
5.1.4 應用場景 33
5.2 RabbitMQ 34
5.2.1 技術概況 34
5.2.2 發展近況和技術優勢 35
5.2.3 軟件架構 36
5.2.4 應用場景 38
5.3 Active MQ 40
5.3.1 技術概況 40
5.3.2 發展近況和技術優勢 40
5.3.3 軟件架構 42
5.3.4 應用場景 43
5.4 Apache Kafka 44
5.4.1 技術概況 44
5.4.2 發展近況和技術優勢 45
5.4.3 軟件架構 46
5.4.4 應用場景 47
5.5 本章小結 50
第三篇 大數據管理技術
第6章 數據庫相關技術 53
6.1 傳統關系型數據庫 53
6.1.1 MySQL 53
6.1.2 PostgreSQL 60
6.2 文檔型數據庫 65
6.2.1 MongoDB 65
6.2.2 Apache CouchDB 69
6.3 列存儲數據庫 73
6.3.1 Vertica 73
6.3.2 Apache HBase 76
6.4 鍵/值對型數據庫 80
6.4.1 Redis 80
6.4.2 Riak 82
6.5 圖形數據庫 85
6.5.1 Neo4j 85
6.5.2 OrientDB 90
6.5.3 InfiniteGraph 93
6.6 基于內存的分布式文件系統之Alluxio 95
6.6.1 技術概況 95
6.6.2 發展近況和技術優勢 96
6.6.3 軟件架構 97
6.6.4 應用場景 98
6.7 數據倉庫系統之ApacheTajo 99
6.7.1 技術概況 99
6.7.2 發展近況和技術優勢 100
6.7.3 軟件架構 101
6.7.4 應用場景 103
6.8 本章小結 105
第7章 大數據平臺資源管理技術 106
7.1 Apache ZooKeeper 106
7.1.1 技術概況 106
7.1.2 發展近況和技術優勢 107
7.1.3 軟件架構 108
7.1.4 應用場景 110
7.2 Apache Hadoop YARN 111
7.2.1 技術概況 111
7.2.2 發展近況和技術優勢 112
7.2.3 軟件架構 113
7.2.4 應用場景 116
7.3 Apache Mesos 119
7.3.1 技術概況 119
7.3.2 發展近況和技術優勢 120
7.3.3 軟件架構 120
7.3.4 應用場景 122
7.4 Apache Mnemonic 123
7.4.1 技術概況 123
7.4.2 發展近況和技術優勢 124
7.5 本章小結 125
第四篇 大數據處理技術
第8章 開源批處理平臺 129
8.1 Apache Hadoop 129
8.1.1 技術概況 129
8.1.2 發展近況和技術優勢 130
8.1.3 軟件架構 131
8.1.4 應用場景 136
8.2 Apache Spark 142
8.2.1 技術概況 142
8.2.2 發展近況和技術優勢 142
8.2.3 軟件架構 144
8.2.4 應用場景 146
8.3 Apache Kylin 150
8.3. 1 技術概況 150
8.3.2 發展近況和技術優勢 150
8.3.3 軟件架構 152
8.3.4 應用場景 153
8.4 本章小結 159
第9章 開源實時處理平臺 160
9.1 Apache Storm 160
9.1.1 技術概況 160
9.1.2 發展近況和技術優勢 161
9.1.3 軟件架構 162
9.1.4 應用場景 163
9.2 Apache Spark Streaming 169
9.2.1 技術概況 169
9.2.2 發展近況和技術優勢 170
9.2.3 軟件架構 170
9.2.4 應用場景 171
9.3 Apache Flink 173
9.3.1 技術概況 173
9.3.2 發展近況和技術優勢 174
9.3.3 軟件架構 175
9.3.4 應用場景 176
9.4 Apache Beam 179
9.4.1 技術概況 179
9.4.2 發展近況和技術優勢 180
9.4.3 軟件架構 181
9.4.4 應用場景 182
9.5 Apache Apex 186
9.5.1 技術概況 186
9.5.2 發展近況和技術優勢 187
9.5.3 軟件架構 188
9.5.4 應用場景 191
9.6 本章小結 194
第五篇 大數據分析與挖掘技術
第 10章 開源數據分析平臺 199
10.1 Apache Mahout 199
10.1.1 技術概況 199
10.1.2 發展近況和技術優勢 200
10.1.3 應用場景 202
10.2 Apache Spark MLlib 204
10.2.1 技術概況 204
10.2.2 發展近況和技術優勢 204
10.2.3 軟件架構 205
10.2.4 應用場景 207
10.3 Apache Lens 208
10.3.1 技術概況 208
10.3.2 發展近況及技術優勢 209
10.3.3 軟件架構 213
10.3.4 應用場景 214
10.4 Scikit-Learn 217
10.4.1 技術概況 217
10.4.2 發展近況與技術優勢 217
10.4.3 軟件架構 218
10.4.4 應用場景 220
10.5 本章小結 223
第 11章 開源深度學習平臺 225
11.1 TensorFlow 225
11.1.1 技術概況 225
11.1.2 發展近況和技術優勢 226
11.1.3 軟件架構 226
11.1.4 應用場景 230
11.2 Tensorflow Lite 233
11.2.1 技術概況 233
11.2.2 發展近況和技術優勢 233
11.2.3 軟件架構 234
11.3 Caffe 237
11.3.1 技術概述 237
11.3.2 發展近況和技術優勢 237
11.3.3 軟件架構 239
11.3.4 應用場景 241
11.4 PyTorch 243
11.4.1 技術概況 243
11.4.2 發展近況和技術優勢 243
11.4.3 軟件架構 245
11.4.4 應用場景 247
11.5 本章小結 248
第六篇 大數據可視化與交互技術
第 12章 主流大數據可視化與交互工具 251
12.1 Tableau 251
12.1.1 技術概況 251
12.1.2 發展近況和技術優勢 252
12.1.3 軟件架構 255
12.1.4 應用場景 256
12.2 Apache Zeppelin 260
12.2.1 技術概況 260
12.2.2 發展近況和技術優勢 261
12.2.3 軟件架構 262
12.2.4 應用場景 263
12.3 本章小結 266
第 13章 其他大數據可視化與交互工具 267
13.1 Jaspersoft Community 267
13.1.1 技術概況 267
13.1.2 發展近況和技術優勢 268
13.1.3 軟件架構 270
13.1.4 應用場景 271
13.2 BIRT 274
13.2.1 技術概況 274
13.2.2 發展近況和技術優勢 275
13.2.3 軟件架構 278
13.2.4 應用場景 280
13.3 KNIME 281
13.3.1 技術概況 281
13.3.2 發展近況和技術優勢 281
13.3.3 軟件架構 283
13.3.4 應用場景 285
13.4 本章小結 285
第七篇 大數據安全與治理技術
第 14章 大數據治理技術 289
14.1 Apache Falcon 289
14.1.1 技術概況 290
14.1.2 發展近況和技術優勢 290
14.1.3 軟件架構 292
14.1.4 應用場景 294
14.2 Apache Atlas 297
14.2.1 技術概況 298
14.2.2 發展近況和技術優勢 301
14.2.3 軟件架構 306
14.3 本章小結 314
第 15章 大數據安全技術 316
15.1 Apache Ranger 316
15.1.1 技術概況 316
15.1.2 發展近況和技術優勢 318
15.1.3 軟件架構 321
15.1.4 應用場景 322
15.2 Apache Sentry 324
15.2.1 技術概況 324
15.2.2 發展近況和技術優勢 326
15.2.3 軟件架構 332
15.3 Apache Kerberos 334
15.3.1 技術概況 335
15.3.2 發展近況和技術優勢 336
15.3.3 軟件架構 337
15.4 Apache Metron 339
15.4.1 技術概況 339
15.4.2 發展近況及技術優勢 340
15.4.3 軟件架構 344
15.5 Hyperledger 346
15.5.1 技術概況 346
15.5.2 發展近況和技術優勢 347
15.5.3 軟件架構 348
15.5.4 應用場景 349
15.6 本章小結 351
結束語 353
名詞索引 355
大數據技術體系與開源生態 作者簡介
主編,劉馳,北京理工大學教授、博士生導師、計算機學院副院長。分別于清華大學和英國帝國理工學院獲得學士和博士學位,曾任美國IBM T.J. Watson研究中心和IBM中國研究院研究主管,并在德國電信研究總院(柏林)任博士后研究員。研究方向為大數據和物聯網技術。主持了國家自然科學基金、國家重點研發計劃課題、工信部、***等20余省部級研究項目,發表論文90余篇,授權國內外發明專利14項,編寫書籍9本,Google Scholar索引2100余次,H index為23,F任中國電子學會物聯網專委會委員、中國計算機學會物聯網專委會委員、中國自動化學會大數據專委會委員等。入選國家人社部“高層次留學人才回國資助計劃”,中國科協“青年人才托舉工程”、陜西省第八批“百人計劃(短期項目)”、中國電子學會優秀科技工作者、國家“十二五”輕工業科技創新先進個人、2017年中國物聯網年度人物等,并獲得省部級一等獎1項、三等獎1項。
- >
推拿
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
二體千字文
- >
羅曼·羅蘭讀書隨筆-精裝
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
苦雨齋序跋文-周作人自編集
- >
詩經-先民的歌唱
- >
人文閱讀與收藏·良友文學叢書:一天的工作