中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
實戰大數據(Hadoop+Spark+Flink)??從平臺構建到交互式數據分析(離線/實時)

包郵 實戰大數據(Hadoop+Spark+Flink)??從平臺構建到交互式數據分析(離線/實時)

作者:楊俊
出版社:機械工業出版社出版時間:2021-06-01
開本: 16開 頁數: 236
中 圖 價:¥69.3(7.0折) 定價  ¥99.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

實戰大數據(Hadoop+Spark+Flink)??從平臺構建到交互式數據分析(離線/實時) 版權信息

實戰大數據(Hadoop+Spark+Flink)??從平臺構建到交互式數據分析(離線/實時) 本書特色

適讀人群 :面向大數據開發工程師,大數據運維工程師面向大數據開發工程師,大數據運維工程師圍繞Hadoop、Spark、Flink三大主流平臺,詳解大數據平臺的搭建及數據分析(離線/實時)隨書配備全套數據集、安裝包、配置文件、海量教學視頻(近30GB),方便學用

實戰大數據(Hadoop+Spark+Flink)??從平臺構建到交互式數據分析(離線/實時) 內容簡介

《實戰大數據(Hadoop+Spark+Flink)——從平臺構建到交互式數據分析(離線/實時)》詳細介紹了大數據工程師在實際工作中應該熟練掌握的大數據技術。全書共8章,分別是大數據技術概述、搭建IDEA開發環境及Linux虛擬機、基于Hadoop構建大數據平臺、基于HBase和Kafka構建海量數據存儲與交換系統、用戶行為離線分析—構建日志采集和分析平臺、基于Spark的用戶行為實時分析、基于Flink的用戶行為實時分析、用戶行為數據可視化。本書以一個完整的大數據項目為主線,涵蓋Hadoop、Spark、Flink等主流大數據技術,按照大數據工程師的項目開發流程,理論與實踐結合,逐步推進,使讀者在學習大數據核心技術的同時,也能掌握開發大數據項目的完整流程,從而獲得大數據項目開發經驗。《實戰大數據(Hadoop+Spark+Flink)——從平臺構建到交互式數據分析(離線/實時)》既可以作為大數據工程師的**開發手冊,也可以作為高校大數據及相關專業的教材或實驗手冊。

實戰大數據(Hadoop+Spark+Flink)??從平臺構建到交互式數據分析(離線/實時) 目錄

目錄 前言 第1章 大數據技術概述1 1.1 什么是大數據1 1.2 大數據平臺架構1 1.2.1 數據獲取2 1.2.2 數據存儲2 1.2.3 數據處理3 1.2.4 交互式分析3 1.2.5 機器學習與數據挖掘4 1.2.6 資源管理4 1.3 大數據工程師的技能樹4 1.3.1 大數據主流開發語言5 1.3.2 大數據平臺的構建5 1.3.3 大數據采集5 1.3.4 大數據存儲與交換5 1.3.5 大數據離線計算5 1.3.6 大數據實時計算6 1.4 大數據項目需求分析與設計6 1.4.1 項目需求分析6 1.4.2 系統架構設計7 1.4.3 離線和實時計算數據流程設計8 1.4.4 大數據平臺規劃8 1.5 本章小結9 第2章 搭建IDEA開發環境及Linux 虛擬機10 2.1 搭建IDEA開發環境10 2.1.1 JDK 的安裝與配置10 2.1.2 Maven 的安裝與配置12 2.1.3 IDEA 的安裝與配置13 2.1.4 使用IDEA構建Maven項目17 2.2 搭建Linux虛擬機19 2.2.1 安裝Linux系統19 2.2.2 配置Linux靜態IP19 2.2.3 Linux主機名和IP映射20 2.2.4 關閉Linux防火墻20 2.2.5 創建Linux用戶和用戶組20 2.2.6 Linux SSH免密登錄21 2.3 本章小結22 第3章 基于Hadoop構建大數據 平臺23 3.1 Zookeeper分布式協調服務23 3.1.1 Zookeeper架構設計及原理23 3.1.2 Zookeeper集群安裝前的準備 工作26 3.1.3 Zookeeper集群的安裝部署29 3.1.4 Zookeeper shell的操作32 3.2 HDFS分布式文件系統34 3.2.1 HDFS架構設計及原理34 3.2.2 HDFS的高可用(HA)42 3.2.3 HDFS聯邦機制44 3.3 YARN資源管理系統44 3.3.1 YARN架構設計及原理45 3.3.2 MapReduce on YARN工作流程48 3.3.3 YARN的容錯性49 3.3.4 YARN的高可用(HA)49 3.3.5 YARN的調度器及使用50 3.4 Hadoop分布式集群的構建53 3.4.1 HDFS分布式集群的構建53 3.4.2 YARN分布式集群的構建58 3.4.3 Hadoop集群運行測試61 3.4.4 Hadoop集群調優62 3.5 MapReduce分布式計算框架64 3.5.1 MapReduce概述64 3.5.2 MapReduce編程模型67 3.5.3 MapReduce應用示例68 3.5.4 WordCount代碼實現70 3.6 本章小結72 第4章 基于HBase和Kafka構建 海量數據存儲與交換系統73 4.1 構建HBase分布式實時 數據庫73 4.1.1 HBase概述73 4.1.2 HBase架構設計76 4.1.3 HBase分布式集群的構建78 4.1.4 HBase性能調優82 4.1.5 HBase新聞業務表建模86 4.2 搭建Kafka分布式消息系統86 4.2.1 Kafka概述86 4.2.2 Kafka架構設計87 4.2.3 Kafka分布式集群的構建89 4.2.4 Kafka集群監控92 4.3 本章小結94 第5章 用戶行為離線分析——構建 日志采集和分析平臺95 5.1 搭建Flume日志采集系統95 5.1.1 Flume概述95 5.1.2 Flume架構設計96 5.1.3 Flume環境的搭建98 5.1.4 構建Flume集群100 5.2 使用Flume采集用戶行為 數據102 5.2.1 Flume與Kafka集成102 5.2.2 Flume與HBase集成104 5.2.3 Flume與Kafka、HBase集成109 5.3 基于Hive的離線大數據分析112 5.3.1 Hive概述112 5.3.2 Hive架構設計112 5.3.3 Hive的安裝部署117 5.3.4 Hive在大數據倉庫中的應用120 5.3.5 Hive與HBase集成121 5.4 基于Hive 的用戶行為數據 離線分析122 5.4.1 離線項目架構設計122 5.4.2 用戶行為離線分析123 5.5 本章小結126 第6章 基于Spark的用戶行為實時 分析127 6.1 Spark快速入門127 6.1.1 Spark概述127 6.1.2 Spark的*簡安裝128 6.1.3 Spark實現WordCount129 6.2 Spark Core的核心功能131 6.2.1 Spark架構的原理131 6.2.2 彈性分布式數據集RDD132 6.2.3 Spark 算子133 6.2.4 Pair RDD及算子135 6.3 Spark分布式集群的構建135 6.3.1 Spark的運行模式135 6.3.2 Standalone模式集群的構建136 6.3.3 Spark on YARN模式集群的 構建139 6.4 基于Spark Streaming的新聞 項目實時分析140 6.4.1 Spark Streaming概述140 6.4.2 Spark Streaming的運行原理141 6.4.3 Spark Streaming編程模型142 6.4.4 Spark Streaming實時分析用戶 行為144 6.5 基于Spark SQL的新聞項目 離線分析157 6.5.1 Spark SQL架構的原理157 6.5.2 Spark SQL與Hive、MySQL、 HBase集成158 6.5.3 Spark SQL用戶行為離線分析162 6.6 基于Spark Structured Streaming 的新聞項目實時分析167 6.6.1 Structured Streaming概述167 6.6.2 Structured Streaming編程模型168 6.6.3 基于Structured Streaming的用戶 行為實時分析168 6.7 本章小結173 第7章 基于Flink的用戶行為實時 分析174 7.1 Flink快速入門174 7.1.1 Flink概述174 7.1.2 Flink的*簡安裝176 7.1.3 Flink實現WordCount177 7.2 Flink分布式集群的構建181 7.2.1 Flink的運行模式181 7.2.2 Flink Standalone模式集群的 構建181 7.2.3 Flink on YARN模式集群的構建184 7.3 基于Flink DataStream的新聞 項目實時分析187 7.3.1 Flink DataStream概述187 7.3.2 Flink DataStream 編程模型188
展開全部

實戰大數據(Hadoop+Spark+Flink)??從平臺構建到交互式數據分析(離線/實時) 作者簡介

楊俊,大數據架構師。大數據技術達人, Hadoop源碼級技術專家,擅長Hadoop、Spark、Flink等主流大數據生態技術。具有近10年大數據開發經驗,參與過10余個重量級大數據項目。曾任廣電數據咨詢公司大數據高級架構師,負責大數據平臺架構設計與實施,并構建企業級數據倉庫。暢銷書《Hadoop大數據技術基礎與應用》作者。51CTO知名培訓講師,擁有20余萬粉絲,具有豐富的大數據技術培訓經驗,為數十家企業、院校開展過大數據技術課程培訓。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 无锡装修装潢公司,口碑好的装饰装修公司-无锡索美装饰设计工程有限公司 | MOOG伺服阀维修,ATOS比例流量阀维修,伺服阀维修-上海纽顿液压设备有限公司 | 变频器维修公司_plc维修_伺服驱动器维修_工控机维修 - 夫唯科技 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 成都LED显示屏丨室内户外全彩led屏厂家方案报价_四川诺显科技 | 硬齿面减速机_厂家-山东安吉富传动设备股份有限公司 | 硫酸钡厂家_高光沉淀硫酸钡价格-河南钡丰化工有限公司 | 石牌坊价格石牌坊雕刻制作_石雕牌坊牌楼石栏杆厂家_山东嘉祥石雕有限公司 | 爆炸冲击传感器-无线遥测传感器-航天星百科 | 渣土车电机,太阳能跟踪器电机,蜗轮蜗杆减速电机厂家-淄博传强电机 | 火锅底料批发-串串香技术培训[川禾川调官网] | 蓝米云-专注于高性价比香港/美国VPS云服务器及海外公益型免费虚拟主机 | NM-02立式吸污机_ZHCS-02软轴刷_二合一吸刷软轴刷-厦门地坤科技有限公司 | 成都治疗尖锐湿疣比较好的医院-成都治疗尖锐湿疣那家医院好-成都西南皮肤病医院 | 冷却塔降噪隔音_冷却塔噪声治理_冷却塔噪音处理厂家-广东康明冷却塔降噪厂家 | 贝壳粉涂料-内墙腻子-外墙腻子-山东巨野七彩贝壳漆业中心 | 铝机箱_铝外壳加工_铝外壳厂家_CNC散热器加工-惠州市铂源五金制品有限公司 | (中山|佛山|江门)环氧地坪漆,停车场地板漆,车库地板漆,聚氨酯地板漆-中山永旺地坪漆厂家 | 全自动端子机|刺破式端子压接机|全自动双头沾锡机|全自动插胶壳端子机-东莞市傅氏兄弟机械设备有限公司 | 粒米特测控技术(上海)有限公司-测功机_减速机测试台_电机测试台 | 山东艾德实业有限公司| 暴风影音| 钢衬玻璃厂家,钢衬玻璃管道 -山东东兴扬防腐设备有限公司 | 湖南自考_湖南自学考试 | 立式矫直机_卧式矫直机-无锡金矫机械制造有限公司 | IPO咨询公司-IPO上市服务-细分市场研究-龙马咨询 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 河南膏药贴牌-膏药代加工-膏药oem厂家-洛阳今世康医药科技有限公司 | 压力控制器,差压控制器,温度控制器,防爆压力控制器,防爆温度控制器,防爆差压控制器-常州天利智能控制股份有限公司 | 手术室净化厂家_成都实验室装修公司_无尘车间施工单位_洁净室工程建设团队-四川华锐16年行业经验 | 宜兴紫砂壶知识分享 - 宜兴壶人 医用空气消毒机-医用管路消毒机-工作服消毒柜-成都三康王 | 西子馋火锅鸡加盟-太原市龙城酉鼎餐饮管理有限公司 | pbt头梳丝_牙刷丝_尼龙毛刷丝_PP塑料纤维合成毛丝定制厂_广州明旺 | 南京试剂|化学试剂|分析试剂|实验试剂|cas号查询-专业60年试剂销售企业 | 合肥汽车充电桩_安徽充电桩_电动交流充电桩厂家_安徽科帝新能源科技有限公司 | 防爆电机生产厂家,YBK3电动机,YBX3系列防爆电机,YBX4节防爆电机--河南省南洋防爆电机有限公司 | 开锐教育-学历提升-职称评定-职业资格培训-积分入户 | 储能预警-储能消防系统-电池舱自动灭火装置-四川千页科技股份有限公司官网 | 档案密集架_电动密集架_移动密集架_辽宁档案密集架-盛隆柜业厂家现货批发销售价格公道 | 电伴热系统施工_仪表电伴热保温箱厂家_沃安电伴热管缆工业技术(济南)有限公司 | 滤芯,过滤器,滤油机,贺德克滤芯,精密滤芯_新乡市宇清流体净化技术有限公司 | 干式变压器厂_干式变压器厂家_scb11/scb13/scb10/scb14/scb18干式变压器生产厂家-山东科锐变压器有限公司 |