中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據技術體系詳解原理.架構與實踐

包郵 大數據技術體系詳解原理.架構與實踐

作者:董西成著
出版社:機械工業出版社出版時間:2018-03-01
開本: 16開 頁數: 361
中 圖 價:¥55.5(7.0折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

大數據技術體系詳解原理.架構與實踐 版權信息

  • ISBN:9787111590729
  • 條形碼:9787111590729 ; 978-7-111-59072-9
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

大數據技術體系詳解原理.架構與實踐 本書特色

本書站在大數據落地應用的角度,系統闡述大數據從數據收集,到數據存儲、分布式協調及資源管理、計算引擎、分析工具,再到數據可視化這一完整流程,本書既包含主要技術的實現原理及其框架,也包含了具體落地指導,是幫助企業和個人整體了解大數據框架不可多得的參考書。本章主要包括6個部分共16章的內容,其中:第壹部分介紹了大數據體系架構,以及Google和Hadoop技術棧;第二部分介紹大數據分析相關技術,主要涉及關系型數據收集工具Sqoop與Canel、非關系型數據收集系統Flume以及分布式消息隊列Kafka;第三部分介紹大數據存儲相關技術,涉及數據存儲格式、分布式文件系統以及分布式數據庫;第四部分介紹資源管理和服務協調相關技術,涉及資源管理和調度系統YARN以及資源協調系統ZooKeeper;第五部分介紹計算引擎相關技術,涉及批處理、交互式處理以及流式實時處理三類引擎;第六部分數據分析相關技術,涉及基于數據分析語言HQL與SQL、大數據統一編程模型及機器學習庫等。

大數據技術體系詳解原理.架構與實踐 內容簡介

本書站在大數據落地應用的角度,系統闡述大數據從數據收集,到數據存儲、分布式協調及資源管理、計算引擎、分析工具,再到數據可視化這一完整流程,本書既包含主要技術的實現原理及其框架,也包含了具體落地指導,是幫助企業和個人整體了解大數據框架不可多得的參考書。本章主要包括6個部分共16章的內容,其中:第壹部分介紹了大數據體系架構,以及Google和Hadoop技術棧;第二部分介紹大數據分析相關技術,主要涉及關系型數據收集工具Sqoop與Canel、非關系型數據收集系統Flume以及分布式消息隊列Kafka;第三部分介紹大數據存儲相關技術,涉及數據存儲格式、分布式文件系統以及分布式數據庫;第四部分介紹資源管理和服務協調相關技術,涉及資源管理和調度系統YARN以及資源協調系統ZooKeeper;第五部分介紹計算引擎相關技術,涉及批處理、交互式處理以及流式實時處理三類引擎;第六部分數據分析相關技術,涉及基于數據分析語言HQL與SQL、大數據統一編程模型及機器學習庫等。

大數據技術體系詳解原理.架構與實踐 目錄

目  錄?Contents
前 言
**部分 概述篇
第1章 企業級大數據技術體系概述 2
1.1 大數據系統產生背景及應用場景 2
1.1.1 產生背景 2
1.1.2 常見大數據應用場景 3
1.2 企業級大數據技術框架 5
1.2.1 數據收集層 6
1.2.2 數據存儲層 7
1.2.3 資源管理與服務協調層 7
1.2.4 計算引擎層 8
1.2.5 數據分析層 9
1.2.6 數據可視化層 9
1.3 企業級大數據技術實現方案 9
1.3.1 Google大數據技術棧 10
1.3.2 Hadoop與Spark開源大數據技術棧 12
1.4 大數據架構:Lambda Architecture 15
1.5 Hadoop與Spark版本選擇及安裝部署 16
1.5.1 Hadoop與Spark版本選擇 16
1.5.2 Hadoop與Spark安裝部署 17
1.6 小結 18
1.7 本章問題 18
第二部分 數據收集篇
第2章 關系型數據的收集 20
2.1 Sqoop概述 20
2.1.1 設計動機 20
2.1.2 Sqoop基本思想及特點 21
2.2 Sqoop基本架構 21
2.2.1 Sqoop1基本架構 22
2.2.2 Sqoop2基本架構 23
2.2.3 Sqoop1與Sqoop2對比 24
2.3 Sqoop使用方式 25
2.3.1 Sqoop1使用方式 25
2.3.2 Sqoop2使用方式 28
2.4 數據增量收集CDC 31
2.4.1 CDC動機與應用場景 31
2.4.2 CDC開源實現Canal 32
2.4.3 多機房數據同步系統Otter 33
2.5 小結 35
2.6 本章問題 35
第3章 非關系型數據的收集 36
3.1 概述 36
3.1.1 Flume設計動機 36
3.1.2 Flume基本思想及特點 37
3.2 Flume NG基本架構 38
3.2.1 Flume NG基本架構 38
3.2.2 Flume NG高級組件 41
3.3 Flume NG數據流拓撲構建方法 42
3.3.1 如何構建數據流拓撲 42
3.3.2 數據流拓撲實例剖析 46
3.4 小結 50
3.5 本章問題 50
第4章 分布式消息隊列Kafka 51
4.1 概述 51
4.1.1 Kafka設計動機 51
4.1.2 Kafka特點 53
4.2 Kafka設計架構 53
4.2.1 Kafka基本架構 54
4.2.2 Kafka各組件詳解 54
4.2.3 Kafka關鍵技術點 58
4.3 Kafka程序設計 60
4.3.1 Producer程序設計 61
4.3.2 Consumer程序設計 63
4.3.3 開源Producer與Consumer實現 65
4.4 Kafka典型應用場景 65
4.5 小結 67
4.6 本章問題 67
第三部分 數據存儲篇
第5章 數據序列化與文件存儲格式 70
5.1 數據序列化的意義 70
5.2 數據序列化方案 72
5.2.1 序列化框架Thrift 72
5.2.2 序列化框架Protobuf 74
5.2.3 序列化框架Avro 76
5.2.4 序列化框架對比 78
5.3 文件存儲格式剖析 79
5.3.1 行存儲與列存儲 79
5.3.2 行式存儲格式 80
5.3.3 列式存儲格式ORC、Parquet與CarbonData 82
5.4 小結 88
5.5 本章問題 89
第6章 分布式文件系統 90
6.1 背景 90
6.2 文件級別和塊級別的分布式文件系統 91
6.2.1 文件級別的分布式系統 91
6.2.2 塊級別的分布式系統 92
6.3 HDFS基本架構 93
6.4 HDFS關鍵技術 94
6.4.1 容錯性設計 95
6.4.2 副本放置策略 95
6.4.3 異構存儲介質 96
6.4.4 集中式緩存管理 97
6.5 HDFS訪問方式 98
6.5.1 HDFS shell 98
6.5.2 HDFS API 100
6.5.3 數據收集組件 101
6.5.4 計算引擎 102
6.6 小結 102
6.7 本章問題 103
第7章 分布式結構化存儲系統 104
7.1 背景 104
7.2 HBase數據模型 105
7.2.1 邏輯數據模型 105
7.2.2 物理數據存儲 107
7.3 HBase基本架構 108
7.3.1 HBase基本架構 108
7.3.2 HBase內部原理 110
7.4 HBase訪問方式 114
7.4.1 HBase shell 114
7.4.2 HBase API 116
7.4.3 數據收集組件 118
7.4.4 計算引擎 119
7.4.5 Apache Phoenix 119
7.5 HBase應用案例 120
7.5.1 社交關系數據存儲 120
7.5.2 時間序列數據庫OpenTSDB 122
7.6 分布式列式存儲系統Kudu 125
7.6.1 Kudu基本特點 125
7.6.2 Kudu數據模型與架構 126
7.6.3 HBase與Kudu對比 126
7.7 小結 127
7.8 本章問題 127
第四部分 分布式協調與資源管理篇
第8章 分布式協調服務ZooKeeper 130
8.1 分布式協調服務的存在意義 130
8.1.1 leader選舉 130
8.1.2 負載均衡 131
8.2 ZooKeeper數據模型 132
8.3 ZooKeeper基本架構 133
8.4 ZooKeeper程序設計 134
8.4.1 ZooKeeper API 135
8.4.2 Apache Curator 139
8.5 ZooKeeper應用案例 142
8.5.1 leader選舉 142
8.5.2 分布式隊列 143
8.5.3 負載均衡 143
8.6 小結 144
8.7 本章問題 145
第9章 資源管理與調度系統YARN 146
9.1 YARN產生背景 146
9.1.1 MRv1局限性 146
9.1.2 YARN設計動機 147
9.2 YARN設計思想 148
9.3 YARN的基本架構與原理 149
9.3.1 YARN基本架構 149
9.3.2 YARN高可用 152
9.3.3 YARN工作流程 153
9.4 YARN資源調度器 155
9.4.1 層級隊列管理機制 155
9.4.2 多租戶資源調度器產生背景 156
9.4.3 Capacity/Fair Scheduler 157
9.4.4 基于節點標簽的調度 160
9.4.5 資源搶占
展開全部

大數據技術體系詳解原理.架構與實踐 作者簡介

董西成,資深大數據技術實踐者和研究者,對大數據基礎架構有非常深刻的認識和理解,有著豐富的實踐經驗。熟悉常見的開源大數據解決方案,包括Hadoop和spark生態系統等,擅長底層分布式系統的優化和開發。撰寫了大量Had00p和spark等大數據相關的技術文章并分享在自己的博客上,由于文章技術含量高,所以非常受歡迎。 出版有大數據領域負有盛名的專著:《Hadoop技術內幕:深入解析MapReduce架構設計與實現原理》和《Had00p技術內幕:深入解析YARN架構設計與實現原理》。 個人博客:http://dongxicheng.Org/(大量關于Hadoop的干貨分享) 微信公眾賬號:hadoopl23(大量關于大數據最新資訊和干貨分享) 如果想了解更多關于本書的內容,可訪問:http://hadoopl23.com/

商品評論(0條)
暫無評論……
書友推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 不锈钢搅拌罐_高速搅拌罐厂家-无锡市凡格德化工装备科技有限公司 | 水厂污泥地磅|污泥处理地磅厂家|地磅无人值守称重系统升级改造|地磅自动称重系统维修-河南成辉电子科技有限公司 | 氟氨基酮、氯硝柳胺、2-氟苯甲酸、异香兰素-新晨化工 | 发电机价格|发电机组价格|柴油发电机价格|柴油发电机组价格网 | 【黄页88网】-B2B电子商务平台,b2b平台免费发布信息网 | HV全空气系统_杭州暖通公司—杭州斯培尔冷暖设备有限公司 | 企业微信营销_企业微信服务商_私域流量运营_艾客SCRM官网 | 杭州|上海贴标机-百科| 温泉机设备|温泉小镇规划设计|碳酸泉设备 - 大连连邦温泉科技 | 防爆正压柜厂家_防爆配电箱_防爆控制箱_防爆空调_-盛通防爆 | 轴承振动测量仪电箱-轴承测振动仪器-测试仪厂家-杭州居易电气 | 减速机三参数组合探头|TSM803|壁挂式氧化锆分析仪探头-安徽鹏宸电气有限公司 | 机床主轴维修|刀塔维修|C轴维修-常州翔高精密机械有限公司 | 北京四合院出租,北京四合院出售,北京平房买卖 - 顺益兴四合院 | 屏蔽泵厂家,化工屏蔽泵_维修-淄博泵业 | 烟雾净化器-滤筒除尘器-防爆除尘器-除尘器厂家-东莞执信环保科技有限公司 | 珠光砂保温板-一体化保温板-有釉面发泡陶瓷保温板-杭州一体化建筑材料 | 安徽合肥格力空调专卖店_格力中央空调_格力空调总经销公司代理-皖格制冷设备 | 航空连接器,航空插头,航空插座,航空接插件,航插_深圳鸿万科 | 台式恒温摇床价格_大容量恒温摇床厂家-上海量壹科学仪器有限公司 | 等离子表面处理机-等离子表面活化机-真空等离子清洗机-深圳市东信高科自动化设备有限公司 | 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | 磁棒电感生产厂家-电感器厂家-电感定制-贴片功率电感供应商-棒形电感生产厂家-苏州谷景电子有限公司 | 搬运设备、起重设备、吊装设备—『龙海起重成套设备』 | 货车视频监控,油管家,货车油管家-淄博世纪锐行电子科技 | 黄石妇科医院_黄石东方女子医院_黄石东方妇产医院怎么样 | 北京晚会活动策划|北京节目录制后期剪辑|北京演播厅出租租赁-北京龙视星光文化传媒有限公司 | 定量包装机,颗粒定量包装机,粉剂定量包装机,背封颗粒包装机,定量灌装机-上海铸衡电子科技有限公司 | 交联度测试仪-湿漏电流测试仪-双85恒温恒湿试验箱-常州市科迈实验仪器有限公司 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 福建成考网-福建成人高考网 | 真空粉体取样阀,电动楔式闸阀,电动针型阀-耐苛尔(上海)自动化仪表有限公司 | 纸布|钩编布|钩针布|纸草布-莱州佳源工艺纸布厂 | 杭州翻译公司_驾照翻译_专业人工翻译-杭州以琳翻译有限公司官网 组织研磨机-高通量组织研磨仪-实验室多样品组织研磨机-东方天净 | 河南15年专业网站建设制作设计,做网站就找郑州启凡网络公司 | 大数据营销公司_舆情监测软件_上海SEO公司-文军营销官网 | 波纹补偿器_不锈钢波纹补偿器_巩义市润达管道设备制造有限公司 | 混合反应量热仪-高温高压量热仪-微机差热分析仪DTA|凯璞百科 | 东莞市天进机械有限公司-钉箱机-粘箱机-糊箱机-打钉机认准东莞天进机械-厂家直供更放心! | 专业广州网站建设,微信小程序开发,一物一码和NFC应用开发、物联网、外贸商城、定制系统和APP开发【致茂网络】 | 湖南档案密集架,智能,物证,移动,价格-湖南档案密集架厂家 |