中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
大數據技術及架構圖解實戰派

包郵 大數據技術及架構圖解實戰派

作者:徐葳
出版社:電子工業出版社出版時間:2022-07-01
開本: 16開 頁數: 500
中 圖 價:¥94.9(6.5折) 定價  ¥146.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據技術及架構圖解實戰派 版權信息

大數據技術及架構圖解實戰派 本書特色

(1)體系完整,內容豐富。 (2)從零起步,循序漸進。 (3)大量插圖,易于理解。 (4)豐富的實戰案例。 (5)銜接運維,無須擔心大數據集群環境問題。 (6)豐富的大數據架構案例。

大數據技術及架構圖解實戰派 內容簡介

本書提供了學習大數據技術及架構的一站式解決方案,覆蓋了大數據生態圈中的完整技術體系,包含以下內容。 . 一、數據采集日志數據采集工具(Flume 、Logstash、Filebeat )數據庫數據采集工具(離線采集工具——Sqoop、DataX,實時數據采集工具——Canal、Maxwell 網頁數據采集工具物聯網數據采集工具消息隊列中間件 . 二、數據存儲分布式文件存儲之HDFSNoSQL數據庫之HBaseNoSQL數據庫之Redis . 三、離線數據計算離線計算引擎MapReduce離線計算引擎Spark . 四、實時數據計算實時計算引擎Storm實時計算引擎Spark Streaming新一代實時計算引擎Flink . 五、OLAP數據分析 離線OLAP引擎(Hive、Impala、Kylin)實時OLAP引擎(Druid、ClickHouse、Doris) . 六、全文檢索引擎 Lucene SolrElasticsearch . 七、分布式任務調度系統AzkabanOoizeDolphinScheduler . 八、分布式資源管理 YARN的原理、架構YARN中的資源調度器【實戰】配置和使用YARN多資源隊列 . 九 、大數據平臺搭建工具 大數據平臺工具HDP大數據平臺工具CDH大數據平臺工具CDP . 本書還介紹了多個企業級大數據應用案例(包括海量數據采集、“雙十一”數據大屏、海量數據全文搜索系統等)和大數據平臺架構案例(包括離線數據倉庫架構、實時數據倉庫架構、批流一體化數據倉庫架構、數據中臺架構、直播大數據平臺架構、電商大數據平臺架構等),可以幫助讀者從全局角度理解大數據。 . 在本書中,技術內容基本上都是從零講起的,結合原理和架構,以“圖解 實戰”的形式幫助讀者輕松理解復雜的知識。

大數據技術及架構圖解實戰派 目錄

基 礎 篇 第1章 大數據的前世今生 2 1.1 什么是大數據 2 1.2 大數據產生的背景 3 1.3 大數據的4V特征 3 1.4 大數據的典型應用場景 4 1.5 大數據生態圈核心技術總覽 7 技 術 篇 第2章 海量數據采集 9 2.1 為什么需要數據采集 9 2.2 數據形態 9 2.3 數據來源 11 2.4 數據采集規則 11 2.5 日志數據采集工具 13 2.5.1 對比常見的日志數據采集工具 13 2.5.2 Flume的原理及架構分析 14 2.5.3 Flume的應用 17 -安裝Flume 17 -Hello World 17 -【實戰】日志匯總采集 23 2.5.4 Logstash的原理及架構分析 28 2.5.5 Logstash的應用 30 -安裝Logstash 31 -【實戰】Hello World案例 31 -【實戰】采集異常日志案例 34 2.5.6 Filebeat的原理及架構分析 38 - Filebeat的由來 38 -原理及架構分析 39 2.5.7 Filebeat的應用 42 - 安裝Filebeat 42 -【實戰】采集應用程序日志 43 2.6 數據庫數據采集工具 46 2.6.1 對比常見的數據庫數據采集工具 46 -數據庫離線數據采集工具 46 -數據庫實時數據采集工具 47 2.6.2 Sqoop的原理及架構分析 49 2.6.3 DataX的原理及架構分析 53 2.6.4 Sqoop的應用 55 -安裝Sqoop 55 -Sqoop常見參數 57 -【實戰】導入數據 59 -【實戰】導出數據 61 -【實戰】封裝Sqoop腳本 63 2.6.5 Canal的原理及架構分析 64 2.6.6 Maxwell的原理及架構分析 65 2.6.7 Maxwell的應用 66 -安裝Maxwell 66 -【實戰】采集MySQL數據庫的實時數據 67 2.7 網頁數據采集工具 71 2.7.1 常見的網頁數據采集工具 71 2.7.2 網頁數據采集工具的原理及架構分析 71 2.8 物聯網數據采集工具 73 2.8.1 什么是物聯網數據采集 73 2.8.2 如何實現物聯網數據采集 73 2.9 消息隊列中間件 73 2.9.1 為什么需要消息隊列中間件 73 2.9.2 對比常見的消息隊列中間件 75 2.9.3 Kafka原理及架構分析 75 2.9.4 Kafka的應用 77 -安裝Zookeeper集群 77 -安裝Kafka集群 79 -【實戰】生產者的使用 81 -【實戰】消費者的使用 82 2.9.5 Filebeat + Flume + Kafka的典型架構分析 82 -數據采集聚合層 83 -數據分發層 83 -數據落盤層 84 第3章 海量數據存儲 85 3.1 海量數據存儲的演進之路 85 3.2 分布式文件存儲之HDFS 86 3.2.1 HDFS的前世今生 86 3.2.2 HDFS的原理及架構分析 87 3.2.3 常見的分布式文件系統 90 3.2.4 安裝Hadoop集群 91 3.2.5 安裝Hadoop客戶端 102 3.2.6 HDFS的應用 104 -HDFS常用命令的使用 105 -【實戰】統計HDFS中的文件 107 3.3 NoSQL數據庫之HBase 108 3.3.1 HBase的前世今生 108 3.3.2 HBase的原理及架構分析 108 3.3.3 HBase的典型應用場景 115 3.3.4 安裝HBase集群 116 3.3.5 HBase的應用 120 -【實戰】使用Shell命令行操作HBase 121 -【實戰】使用Java API操作HBase 132 3.4 NoSQL數據庫之Redis 136 3.4.1 Redis的產生背景 136 3.4.2 Redis的發展歷程 137 3.4.3 Redis的原理及架構分析 137 3.4.4 Redis的應用 142 -安裝Redis 142 -【實戰】Redis常見命令的使用 144 -【實戰】存儲一個班的學員信息 154 -【實戰】使用Java代碼操作Redis 155 第4章 離線數據計算 158 4.1 離線數據計算引擎的發展之路 158 4.2 離線計算引擎MapReduce 160 4.2.1 MapReduce的前世今生 160 4.2.2 MapReduce核心原理及架構分析 161 4.2.3 【實戰】MapReduce離線數據計算――計算文件中每個單詞出現的總次數 170 4.3 離線計算引擎Spark 176 4.3.1 Spark可以取代Hadoop嗎 176 4.3.2 Spark核心原理及架構分析 177 4.3.3 【實戰】Spark離線數據計算――計算文件中每個單詞出現的總次數 184 4.3.4 Spark中核心算子介紹及使用 189 第5章 實時數據計算 207 5.1 從離線數據計算到實時數據計算 207 5.2 實時數據計算引擎的演進之路 208 5.3 實時數據計算引擎的技術選型 209 5.4 實時計算引擎Storm 211 5.4.1 Storm的原理及架構分析 211 5.4.2 安裝Storm集群 216 5.4.3 【實戰】Storm實時數據計算 220 -實時清洗訂單數據(實時ETL) 220 -向Storm集群中提交任務 224 -停止Storm集群中正在運行的任務 226 5.5 實時計算引擎Spark Streaming 227 5.5.1 Spark Streaming的原理 227 5.5.2 對比Spark Streaming和Structured Streaming 229 5.5.3 【實戰】Spark Streaming實時數據計算 230 5.6 新一代實時計算引擎Flink 237 5.6.1 Flink的原理及架構分析 237 5.6.2 Flink中核心算子的使用 244 5.6.3 【實戰】Flink實時數據計算 251 5.6.4 【實戰】利用Flink + DataV實現“雙十一”數據大屏 261 第6章 OLAP數據分析 274 6.1 OLAP起源及現狀 274 6.2 OLAP引擎的分類 278 6.2.1 從數據建模方式分類 278 6.2.2 從數據處理時效分類 279 6.3 常見OLAP引擎的應用場景 280 6.4 常見離線OLAP引擎 282 6.4.1 Hive的原理及架構分析 282 6.4.2 Impala的原理及架構分析 284 6.4.3 Kylin的原理及架構分析 287 6.4.4 對比Hive、Impala和Kylin 290 6.5 常見實時OLAP引擎 290 6.5.1 Druid的原理及架構分析 290 6.5.2 ClickHouse的原理及架構分析 297 6.5.3 Doris的原理及架構分析 299 6.5.4 對比Druid、ClickHouse和Doris 302 6.6 Hive快速上手 303 6.6.1 Hive部署 303 6.6.2 Hive核心功能使用 307 - Hive的使用方式 307 -【實戰】Hive中數據庫和表的操作 310 -【實戰】Hive中的數據類型 314 -【實戰】Hive中的表類型 318 -【實戰】Hive中的視圖 324 -【實戰】Hive中的高級函數 324 -【實戰】Hive中的排序語句 327 6.7 【實戰】Hive離線數據統計分析 329 6.7.1 需求及架構分析 329 6.7.2 核心步驟實現 330 第7章 海量數據全文檢索引擎 336 7.1 大數據時代全文檢索引擎的發展之路 336 7.1.1 全文檢索引擎的發展 337 7.1.2 全文檢索引擎技術選型 338 7.2 全文檢索引擎原理與架構分析 340 7.2.1 Lucene的原理及架構分析 340 7.2.2 Solr的原理及架構分析 343 7.2.3 Elasticsearch的原理及架構分析 345 7.3 Elasticsearch快速上手 351 7.3.1 Elasticsearch集群安裝部署 351 -安裝Elasticsearch集群 351 -安裝Elasticsearch集群的監控管理工具 356 7.3.2 Elasticsearch核心功能的使用 359 -Elasticsearch的常見操作 359 -【實戰】Elasticsearch集成中文分詞器 371 -【實戰】Elasticsearch自定義詞庫 379 -【實戰】Elasticsearch查詢詳解 383 -【實戰】Elasticsearch SQL的使用 387 7.4 【實戰】基于Elasticsearch + HBase構建全文搜索系統 390 7.4.1 全文搜索系統需求分析 390 7.4.2 系統架構流程設計 391 7.4.3 開發全文搜索系統 394 第8章 分布式任務調度系統 411 8.1 任務調度系統的作用 411 8.2 傳統任務調度系統Crontab的痛點 411 8.3 分布式任務調度系統原理與架構分析 412 8.3.1 常見的分布式任務調度系統 413 8.3.2 Azkaban的原理及架構分析 414 8.3.3 Ooize的原理及架構分析 417 8.3.4 DolphinScheduler的原理及架構分析 420 8.4 Azkaban快速上手 422 8.4.1 安裝Azkaban 422 8.4.2 【實戰】配置一個定時執行的獨立任務 424 8.4.3 【實戰】配置一個帶有多級依賴的任務 432 8.5 【實戰】Azkaban在數據倉庫中的應用 435 8.5.1 創建Job文件并進行壓縮 436 8.5.2 在Azkaban中創建項目并上傳gmv_calc.zip 441 8.5.3 給Azkaban中的任務設置定時執行 441 第9章 分布式資源管理 444 9.1 分布式資源管理 444 9.2 YARN的原理及架構分析 445 9.3 YARN中的資源調度器 448 9.4 【實戰】配置和使用YARN多資源隊列 450 第10章 大數據平臺搭建工具 456 10.1 如何快速搭建大數據平臺 456 10.2 了解常見的大數據平臺工具 457 10.2.1 大數據平臺工具HDP 457 10.2.2 大數據平臺工具CDH 458 10.2.3 大數據平臺工具CDP 460 架 構 篇 第11章 數據倉庫架構演進之路 463 11.1 什么是數據倉庫 463 11.2 為什么需要數據倉庫 464 11.3 數據倉庫的基礎知識 465 11.3.1 事實表和維度表 465 11.3.2 數據庫三范式 466 11.3.3 數據倉庫建模方式 467 11.3.4 維度建模模型 468 11.4 數據倉庫分層 469 11.4.1 數據分層設計 470 11.4.2 數據倉庫命名規范 471 11.5 數據倉庫架構設計 471 11.5.1 離線數據倉庫架構 472 11.5.2 實時數據倉庫架構 472 第12章 數據中臺架構演進之路 475 12.1 什么是中臺 475 12.2 什么是數據中臺 477 12.3 數據中臺演進過程 478 12.4 數據中臺架構 479 12.4.1 采 480 12.4.2 存 480 12.4.3 通 481 12.4.4 用 481 第13章 典型行業大數據架構分析 482 13.1 直播大數據平臺架構分析 482 13.2 電商大數據平臺架構分析 483 13.3 金融大數據平臺架構分析 484 13.4 交通大數據平臺架構分析 485 13.5 游戲大數據平臺架構分析 486
展開全部

大數據技術及架構圖解實戰派 作者簡介

徐葳 中科院大數據研究院大數據技術專家,曾就職于北京獵豹移動科技有限公司

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 安徽华耐泵阀有限公司-官方网站 安德建奇火花机-阿奇夏米尔慢走丝|高维|发那科-北京杰森柏汇 | 无缝方管|无缝矩形管|无缝方矩管|无锡方管厂家 | 超声骨密度仪-动脉硬化检测仪器-人体成分分析仪厂家/品牌/价格_南京科力悦 | DAIKIN电磁阀-意大利ATOS电磁阀-上海乾拓贸易有限公司 | 森旺-A级防火板_石英纤维板_不燃抗菌板装饰板_医疗板 | 全自动实验室洗瓶机,移液管|培养皿|进样瓶清洗机,清洗剂-广州摩特伟希尔机械设备有限责任公司 | 智慧食堂_食堂管理系统_食堂订餐_食堂消费系统—客易捷 | 小型气象站_车载气象站_便携气象站-山东风途物联网 | 立式壁挂广告机厂家-红外电容触摸一体机价格-华邦瀛 | 安全,主动,被动,柔性,山体滑坡,sns,钢丝绳,边坡,防护网,护栏网,围栏,栏杆,栅栏,厂家 - 护栏网防护网生产厂家 | 辽宁资质代办_辽宁建筑资质办理_辽宁建筑资质延期升级_辽宁中杭资质代办 | 衬塑设备,衬四氟设备,衬氟设备-淄博鲲鹏防腐设备有限公司 | uv机-uv灯-uvled光固化机-生产厂家-蓝盾机电 | 酵素生产厂家_酵素OEM_酵素加盟_酵素ODM_酵素原料厂家_厦门益力康 | 电动高尔夫球车|电动观光车|电动巡逻车|电动越野车厂家-绿友机械集团股份有限公司 | 合景一建-无尘车间设计施工_食品医药洁净车间工程装修总承包公司 | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 上海盐水喷雾试验机_两厢式冷热冲击试验箱-巨怡环试 | 四川成都干燥设备_回转筒干燥机_脉冲除尘器_输送设备_热风炉_成都川工星科机电设备有限公司 | 电镀整流器_微弧氧化电源_高频电解电源_微弧氧化设备厂家_深圳开瑞节能 | 合肥活动房_安徽活动板房_集成打包箱房厂家-安徽玉强钢结构集成房屋有限公司 | 中空玻璃生产线,玻璃加工设备,全自动封胶线,铝条折弯机,双组份打胶机,丁基胶/卧式/立式全自动涂布机,玻璃设备-山东昌盛数控设备有限公司 | 济南侦探调查-济南调查取证-山东私家侦探-山东白豹调查咨询公司 密集架|电动密集架|移动密集架|黑龙江档案密集架-大量现货厂家销售 | 有源电力滤波装置-电力有源滤波器-低压穿排电流互感器|安科瑞 | 中天寰创-内蒙古钢结构厂家|门式刚架|钢结构桁架|钢结构框架|包头钢结构煤棚 | 电动高尔夫球车|电动观光车|电动巡逻车|电动越野车厂家-绿友机械集团股份有限公司 | 幂简集成 - 品种超全的API接口平台, 一站搜索、试用、集成国内外API接口 | 不锈钢散热器,冷却翅片管散热器厂家-无锡市烨晟化工装备科技有限公司 | 不锈钢轴流风机,不锈钢电机-许昌光维防爆电机有限公司(原许昌光维特种电机技术有限公司) | 砖机托板价格|免烧砖托板|空心砖托板厂家_山东宏升砖机托板厂 | 西安文都考研官网_西安考研辅导班_考研培训机构_西安在职考研培训 | 耐腐蚀泵,耐腐蚀真空泵,玻璃钢真空泵-淄博华舜耐腐蚀真空泵有限公司 | 识禅_对禅的了解,从这里开始| 东莞工作服_东莞工作服定制_工衣订做_东莞厂服 | 石家庄小程序开发_小程序开发公司_APP开发_网站制作-石家庄乘航网络科技有限公司 | SRRC认证|CCC认证|CTA申请_IMEI|MAC地址注册-英利检测 | 专业甜品培训学校_广东糖水培训_奶茶培训_特色小吃培训_广州烘趣甜品培训机构 | 冷柜风机-冰柜电机-罩极电机-外转子风机-EC直流电机厂家-杭州金久电器有限公司 | 河北凯普威医疗器材有限公司,高档轮椅系列,推车系列,座厕椅系列,协步椅系列,拐扙系列,卫浴系列 | 深圳活动策划公司|庆典策划|专业公关活动策划|深圳艺典文化传媒 重庆中专|职高|技校招生-重庆中专招生网 | 砂石生产线_石料生产线设备_制砂生产线设备价格_生产厂家-河南中誉鼎力智能装备有限公司 |