中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
基于Hadoop與Spark的大數據開發實戰

包郵 基于Hadoop與Spark的大數據開發實戰

出版社:人民郵電出版社出版時間:2018-04-14
開本: 16開 頁數: 367
中 圖 價:¥49.1(7.4折) 定價  ¥66.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

基于Hadoop與Spark的大數據開發實戰 版權信息

  • ISBN:9787115477644
  • 條形碼:9787115477644 ; 978-7-115-47764-4
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

基于Hadoop與Spark的大數據開發實戰 本書特色

大數據技術讓我們以一種前所未有的方式,對海量數據進行分析,從中獲得有巨大價值的產品和服務,*終形成變革之力。本書圍繞Hadoop和Spark兩個主流大數據技術進行講解,主要內容包括Hadoop環境配置、Hadoop分布式文件系統(HDFS)、Hadoop分布式計算框架MapReduce、Hadoop資源調度框架YARN與Hadoop新特性、Hadoop分布式數據庫HBase、數據倉庫Hive、大數據離線處理輔助系統、Spark Core、Spark SQL、Spark Streaming等知識。 本書緊密結合實際應用,運用大量案例說明和實踐,提煉含金量十足的開發經驗。另外,本書配以多元的學習資源和支持服務,包括視頻教程、案例素材下載、學習交流社區、討論組等學習內容,為讀者帶來全方位的學習體驗。

基于Hadoop與Spark的大數據開發實戰 內容簡介

1、選取知識點核心實用,以互聯網 實現終身學習 2、以企業需求為設計導向,以任務驅動為講解方式 3、以案例為主線組織知識點,以實戰項目來提升技術 4、充分考慮學習者的認知曲線,由淺入深,邊講邊練

基于Hadoop與Spark的大數據開發實戰 目錄

序言

前言

關于引用作品的版權聲明

第 1章Hadoop初體驗 1

任務1初識大數據 2

1.1.1 大數據基本概念 2

1.1.2 大數據帶來的挑戰 3

任務2初識Hadoop 3

1.2.1 Hadoop概述 4

1.2.2 Hadoop生態圈 6

1.2.3 Hadoop應用案例 8

任務3安裝Hadoop平臺 9

1.3.1 安裝虛擬機 10

1.3.2 安裝Linux系統 13

1.3.3 安裝Hadoop偽分布式環境 30

本章總結 34

本章練習 34

第 2章Hadoop分布式文件系統 35

任務1HDFS入門 36

2.1.1 認識HDFS 36

2.1.2 HDFS基礎 38

2.1.3 HDFS架構 40

任務2HDFS基本操作 41

2.2.1 使用HDFS shell訪問 41

2.2.2 使用Java API訪問 45

任務3HDFS運行原理 48

2.3.1 HDFS讀寫流程 49

2.3.2 HDFS副本機制 50

2.3.3 HDFS負載均衡 51

2.3.4 HDFS機架感知 52

任務4HDFS高級知識 53

2.4.1 Hadoop序列化機制 53

2.4.2 SequenceFile 58

2.4.3 MapFile 63

本章總結 65

本章練習 66

第3章Hadoop分布式計算框架 67

任務1認識MapReduce編程模型 68

3.1.1 MapReduce基礎 68

3.1.2 MapReduce編程模型 69

3.1.3 MapReduce詞頻統計編程實例 70

任務2MapReduce應用開發 75

3.2.1 MapReduce輸入/輸出類型 75

3.2.2 MapReduce輸入格式 76

3.2.3 MapReduce輸出格式 78

3.2.4 Combiner操作 79

3.2.5 Partitioner操作 82

3.2.6 自定義RecordReader 86

任務3MapReduce高級應用 92

3.3.1 使用MapReduce實現join操作 93

3.3.2 使用MapReduce實現排序 100

3.3.3 使用MapReduce實現二次排序 103

3.3.4 使用MapReduce合并小文件 108

本章總結 113

本章練習 113

第4章Hadoop新特性 115

任務1初識YARN 116

4.1.1 YARN產生背景 116

4.1.2 YARN簡介 117

4.1.3 YARN架構設計 119

任務2了解HDFS新特性 121

4.2.1 HDFS NameNode 高可用機制 121

4.2.2 HDFS NameNode Federation 129

4.2.3 HDFS Snapshots 130

4.2.4 HDFS REST API 134

4.2.5 DistCp工具 134

任務3了解YARN新特性 135

4.3.1 ResourceManager自動重啟 135

4.3.2 ResourceManager高可用機制 136

本章總結 139

本章練習 139

第5章Hadoop分布式數據庫 141

任務1認識HBase 142

5.1.1HBase簡介 142

5.1.2 HBase體系結構 143

5.1.3HBase數據模型 145

5.1.4HBase的安裝 148

任務2HBase Shell操作 155

5.2.1 HBase Shell簡介 155

5.2.2 HBase Shell的使用 156

任務3HBase編程 162

5.3.1 開發HBase應用程序 162

5.3.2HBase數據存儲管理API 163

本章總結 175

本章練習 175

第6章Hadoop綜合實戰——音樂排行榜 177

任務1MapReduce與HBase的集成 178

6.1.1 MapReduce與HBase的集成環境 178

6.1.2 批量數據導入(Bulk Loading) 181

任務2HBase MapReduce API 182

6.2.1HBase MapReduce API 簡介 182

6.2.2 TableMapper的使用 183

6.2.3 TableReducer的使用 195

任務3實現音樂排行榜 197

6.3.1 程序的結構與實現 198

6.3.2 HBase數據庫設計優化 205

6.3.3 MapReduce全局共享數據 205

本章總結 207

本章練習 207

第7章數據倉庫Hive 209

任務1Hive基礎 210

7.1.1 認識Hive 210

7.1.2 Hive架構設計 211

7.1.3 Hive與Hadoop 212

7.1.4 Hive與傳統關系型數據庫 212

7.1.5 Hive數據存儲模型 213

7.1.6 Hive部署 213

任務2掌握Hive操作 214

7.2.1 Hive DDL 214

7.2.2 Hive DML 217

7.2.3 Hive shell 222

任務3Hive高級應用 223

7.3.1 Hive函數 224

7.3.2 Hive調優策略 227

本章總結 232

本章練習 232

第8章大數據離線處理輔助系統 233

任務1認識并使用數據遷移框架Sqoop 234

8.1.1 Sqoop簡介 234

8.1.2 使用Sqoop導入MySQL數據到HDFS 239

8.1.3 使用Sqoop導出HDFS數據到MySQL 246

8.1.4 使用Sqoop導入MySQL數據到Hive 248

8.1.5 Sqoop Job 250

任務2使用Azkaban實現工作流調度 250

8.2.1 Azkaban概述 250

8.2.2 Azkaban環境部署 252

8.2.3 Azkaban應用實例 256

本章總結 259

本章練習 259

第9章Spark基礎 261

任務1Spark入門 262

9.1.1 Spark簡介 262

9.1.2 Spark優勢 262

9.1.3 Spark生態圈 264

任務2Scala基礎 267

9.2.1 Scala簡介 268

9.2.2 Scala函數定義 271

9.2.3 Scala面向對象操作 272

9.2.4 Scala集合的使用 275

9.2.5 Scala高階函數 278

任務3編譯Spark 281

9.3.1 下載Spark源碼 281

9.3.2 編譯Spark源碼 282

任務4Spark初體驗 284

9.4.1 Spark環境部署 284

9.4.2 spark-shell 285

本章總結 286

本章練習 286

第 10章Spark Core 287

任務1Spark RDD 288

10.1.1 RDD介紹 288

10.1.2 RDD的創建 289

10.1.3 RDD的轉換算子 291

10.1.4 RDD的動作算子 293

10.1.5 RDD的依賴關系 295

任務2RDD高級應用 297

10.2.1 RDD緩存機制 297

10.2.2 共享變量 300

10.2.3 Spark架構設計 302

任務3基于RDD的Spark應用程序開發 303

10.3.1 準備工作 303

10.3.2 詞頻計數實例 304

10.3.3 年齡統計實例 308

本章總結 309

本章練習 309

第 11章Spark SQL 311

任務1認識Spark SQL 312

11.1.1 SQL 312

11.1.2 SQL on Hadoop框架 312

11.1.3 Spark SQL簡介 314

任務2Spark SQL編程基礎 315

11.2.1 Spark SQL編程入口 315

11.2.2 DataFrame基礎 317

11.2.3 DataFrame編程實例 318

任務3Spark SQL編程進階 325

11.3.1 Spark SQL操作外部數據源 325

11.3.2 Spark SQL函數 329

11.3.3 Spark SQL調優 332

本章總結 334

本章練習 335

第 12章Spark Streaming 337

任務1流處理框架及Spark Streaming 338

12.1.1 流處理框架簡介 338

12.1.2 Spark Streaming簡介 340

任務2使用Spark Streaming編程 343

12.2.1 Spark Streaming核心 343

12.2.2 Spark Streaming編程實例 348

任務3Spark Streaming高級應用 352

12.3.1 使用Spark Streaming整合Flume 353

12.3.2 使用Spark Streaming整合Kafka 356

12.3.3 Spark Streaming優化策略 361

本章總結 363

本章練習 363

附錄 365

展開全部

基于Hadoop與Spark的大數據開發實戰 作者簡介

肖睿任職于北京課工場教育科技有限公司。課工場是專注互聯網教育的生態平臺,匯聚了中國和北美數百位來自知名互聯網企業的行業大咖,向尋求就業和技術提升的人群提供直播、錄播、面授等多模式教學場景,并通過遍布全國的線下服務中心提供成熟的學習服務,形成完善的“互聯網 教育”解決方案。同時,課工場也為高校、企業、行業提供教育技術賦能,依托Transformer智能教育生態平臺,打造智慧校園、企業大學、行業培訓的教育場景,提供一站式教育解決方案。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: atcc网站,sigma试剂价格,肿瘤细胞现货,人结肠癌细胞株购买-南京科佰生物 | 正压送风机-多叶送风口-板式排烟口-德州志诺通风设备 | 天津市能谱科技有限公司-专业的红外光谱仪_红外测油仪_紫外测油仪_红外制样附件_傅里叶红外光谱技术生产服务厂商 | 温州食堂承包 - 温州市尚膳餐饮管理有限公司 | 阳光1号桔柚_无核沃柑_柑橘新品种枝条苗木批发 - 苧金网 | 自动气象站_气象站监测设备_全自动气象站设备_雨量监测站-山东风途物联网 | 开锐教育-学历提升-职称评定-职业资格培训-积分入户 | 农业四情_农业气象站_田间小型气象站_智慧农业气象站-山东风途物联网 | 撕碎机,撕破机,双轴破碎机-大件垃圾破碎机厂家 | 汽液过滤网厂家_安平县银锐丝网有限公司 | 深圳网站建设-高端企业网站开发-定制网页设计制作公司 | 耐酸碱泵-自吸耐酸碱泵型号「品牌厂家」立式耐酸碱泵价格-昆山国宝过滤机有限公司首页 | 日本SMC气缸接头-速度控制阀-日本三菱伺服电机-苏州禾力自动化科技有限公司 | 科威信洗净科技,碳氢清洗机,超声波清洗机,真空碳氢清洗机 | 塑料脸盆批发,塑料盆生产厂家,临沂塑料广告盆,临沂家用塑料盆-临沂市永顺塑业 | 金属切削液-脱水防锈油-电火花机油-抗磨液压油-深圳市雨辰宏业科技发展有限公司 | 丹佛斯变频器-Danfoss战略代理经销商-上海津信变频器有限公司 | 高温热泵烘干机,高温烘干热泵,热水设备机组_正旭热泵 | 北京公司注册_代理记账_代办商标注册工商执照-企力宝 | T恤衫定做,企业文化衫制作订做,广告T恤POLO衫定制厂家[源头工厂]-【汉诚T恤定制网】 | 【官网】博莱特空压机,永磁变频空压机,螺杆空压机-欧能优 | 818手游网_提供当下热门APP手游_最新手机游戏下载 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 深圳宣传片制作-企业宣传视频制作-产品视频拍摄-产品动画制作-短视频拍摄制作公司 | 重庆钣金加工厂家首页-专业定做监控电视墙_操作台 | 无水硫酸铝,硫酸铝厂家-淄博双赢新材料科技有限公司 | 变频器维修公司_plc维修_伺服驱动器维修_工控机维修 - 夫唯科技 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 超声波分散机-均质机-萃取仪-超声波涂料分散设备-杭州精浩 | 电销卡_稳定企业大语音卡-归属地可选-世纪通信| 通用磨耗试验机-QUV耐候试验机|久宏实业百科 | 热闷罐-高温罐-钢渣热闷罐-山东鑫泰鑫智能热闷罐厂家 | 湿地保护| 网站建设-临朐爱采购-抖音运营-山东兆通网络科技 | 聚合甘油__盐城市飞龙油脂有限公司 | 派克防爆伺服电机品牌|国产防爆伺服电机|高低温伺服电机|杭州摩森机电科技有限公司 | 衬塑管道_衬四氟管道厂家-淄博恒固化工设备有限公司 | 污水提升器,污水提升泵,地下室排水,增压泵,雨水泵,智能供排水控制器-上海智流泵业有限公司 | 电子海图系统-电梯检验系统-智慧供热系统开发-商品房预售资金监管系统 | 模型公司_模型制作_沙盘模型报价-中国模型网 | elisa试剂盒价格-酶联免疫试剂盒-猪elisa试剂盒-上海恒远生物科技有限公司 |