中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據處理技術基礎與應用(HADOOP+SPARK)

包郵 大數據處理技術基礎與應用(HADOOP+SPARK)

出版社:人民郵電出版社出版時間:2024-02-01
開本: 16開 頁數: 237
中 圖 價:¥48.9(7.0折) 定價  ¥69.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據處理技術基礎與應用(HADOOP+SPARK) 版權信息

大數據處理技術基礎與應用(HADOOP+SPARK) 本書特色

1.本書是《大數據》編委會針對校企合作的精心力作。
2.本書凝結了曙光瑞翼多年的教學經驗,能夠滿足校企融合教學的需求。
3.本書旨在介紹Hadoop和Spark的基礎知識,為即將學習大數據技術的讀者奠定基礎。
4.本書采用任務驅動的編寫方式,讀者可以直接進行實驗效果體驗,并進行自由調整。
5.本書采用大量的實踐案例,結合行業典型應用,編寫行業實踐。
6.本書提供豐富的教學資源,包括電子課件、實驗設計等。

大數據處理技術基礎與應用(HADOOP+SPARK) 內容簡介

本書是一本介紹大數據處理技術的專業圖書,力求提高讀者對大數據處理的認知水平和動手能力。本書首先介紹大數據技術的相關概念和發展歷程,從實踐的角度介紹 Hadoop 和 Spark 的安裝部署、編程基礎和使用方法;然后結合具體案例,重點介紹 Spark RDD、 Spark SQL、 Spark Streaming、 Spark GraphFrame 等的應用思路和方法,并通過具體代碼,讓讀者更好地感受大數據處理技術的效果。 本書既可以作為高等院校計算機、大數據等相關專業的教材,也可以作為大數據技術相關從業人員的參考書,還可作為零基礎人員學習 Hadoop 和 Spark 技術的入門圖書。

大數據處理技術基礎與應用(HADOOP+SPARK) 目錄

第 1章 大數據技術概述1
1.1 大數據技術簡介1
1.1.1 大數據的發展1
1.1.2 大數據的流程4
1.2 大數據的主流軟件5
1.2.1 Hadoop5
1.2.2 Spark8
1.2.3 Flink10
1.2.4 Hadoop與Spark對比11
1.3 大數據的主流編程語言12
1.3.1 Python語言12
1.3.2 Java語言13
1.3.3 Scala語言13
1.4 本章小結13
第 2章 Hadoop部署安裝與使用14
2.1 Linux基本操作14
2.1.1 Linux簡介14
2.1.2 新建與刪除用戶15
2.1.3 目錄權限的查看與修改16
2.1.4 Linux的常用命令18
2.1.5 任務實現21
2.2 搭建Hadoop完全分布式集群21
2.2.1 關閉防火墻21
2.2.2 安裝SSH22
2.2.3 安裝Xshell及Xftp(可選)22
2.2.4 安裝Java24
2.2.5 安裝Hadoop25
2.2.6 克隆主機27
2.2.7 安裝完全分布式模式29
2.3 查看Hadoop集群的基本信息37
2.3.1 查詢存儲系統信息37
2.3.2 查詢計算資源信息38
2.4 本章小結39
第3章 HDFS基本操作40
3.1 Hadoop Shell命令操作HDFS40
3.1.1 HDFS簡介40
3.1.2 HDFS Shell命令簡介45
3.1.3 目錄操作47
3.1.4 文件操作47
3.1.5 利用Web界面管理HDFS50
3.1.6 任務實現52
3.2 Java操作HDFS52
3.2.1 在Eclipse中創建HDFS交互Java項目53
3.2.2 在Java項目中編寫Java應用程序57
3.2.3 編譯運行應用程序與打包文件59
3.2.4 任務實現63
3.2.5 文件常用操作的參考代碼65
3.3 本章小結71
第4章 MapReduce基本原理與編程實現72
4.1 MapReduce基本原理72
4.1.1 MapReduce簡介72
4.1.2 MapReduce編程核心思想73
4.1.3 MapReduce編程規范74
4.1.4 MapReduce的輸入格式75
4.1.5 MapReduce的輸出格式77
4.1.6 分區77
4.1.7 合并78
4.2 編程實現——按訪問次數排序79
4.2.1 編程思路與處理邏輯79
4.2.2 核心模塊代碼81
4.2.3 任務實現83
4.3 本章小結86
第5章 Hive部署與編程基礎87
5.1 搭建偽分布式Hive87
5.1.1 Hive概述87
5.1.2 Hive安裝和配置89
5.2 Hive基本操作91
5.2.1 數據庫基本操作92
5.2.2 數據表基本操作93
5.2.3 數據基本操作95
5.3 編程實現——部門工資統計96
5.4 本章小結98
第6章 Spark部署與編程基礎99
6.1 Spark的運行原理99
6.1.1 集群架構99
6.1.2 運行流程100
6.1.3 核心數據集RDD101
6.1.4 核心原理101
6.2 Scala安裝與使用102
6.2.1 Scala 語言概述102
6.2.2 Scala特性102
6.2.3 環境設置與安裝103
6.3 Spark安裝與使用105
6.3.1 環境搭建前的準備105
6.3.2 Spark的安裝與配置106
6.3.3 在PySpark中運行代碼109
6.3.4 編程實現——Spark獨立應用程序111
6.4 本章小結112
第7章 Spark RDD:彈性分布式數據集113
7.1 RDD概述113
7.2 RDD編程114
7.2.1 RDD編程基礎114
7.2.2 鍵值對RDD136
7.2.3 數據讀 寫操作141
7.3 編程實現145
7.3.1 任務1:取出排名前五的訂單支付金額145
7.3.2 任務2:文件排序149
7.3.3 任務3:二次排序153
7.4 本章小結158
第8章 Spark SQL:結構化數據文件處理159
8.1 Spark SQL概述159
8.1.1 Spark SQL簡介159
8.1.2 Spark SQL CLI配置160
8.1.3 Spark SQL與Shell交互161
8.2 DataFrame基礎操作161
8.2.1 創建DataFrame對象162
8.2.2 DataFrame查看數據168
8.2.3 DataFrame查詢操作171
8.2.4 DataFrame輸出操作176
8.3 Spark SQL與MySQL的交互177
8.4 本章小結180
第9章 Spark Streaming:實時計算框架181
9.1 Spark Streaming概述181
9.1.1 Spark Streaming應用場景181
9.1.2 流計算概述181
9.1.3 Spark Streaming特性分析184
9.2 DStream編程模型基礎187
9.2.1 DStream概述187
9.2.2 基本輸入源188
9.2.3 轉換操作196
9.2.4 輸出操作201
9.3 編程實現——流數據過濾與分析206
9.4 本章小結210
第 10章 Spark GraphFrames:圖計算211
10.1 圖計算概述211
10.1.1 圖的基本概念211
10.1.2 圖計算的應用212
10.1.3 GraphFrames簡介213
10.2 GraphFrames編程模型基礎213
10.2.1 創建實例化圖213
10.2.2 視圖和圖操作214
10.2.3 保存和加載圖216
10.3 編程實現——基于GraphFrames的網頁排名216
10.3.1 準備數據集217
10.3.2 GraphFrames實現算法218
10.3.3 使用PageRank進行網頁排名220
10.4 本章小結220
第 11章 大數據生態常用工具介紹221
11.1 Flume的安裝與使用221
11.1.1 安裝及配置Flume221
11.1.2 實例分析223
11.2 Kafka的安裝與使用225
11.2.1 Kafka相關概念225
11.2.2 安裝Kafka225
11.2.3 實例分析225
11.3 Sqoop的安裝與使用226
11.3.1 安裝及配置Sqoop227
11.3.2 添加MySQL驅動程序229
11.3.3 測試Sqoop與MySQL的連接229
11.4 編程實現——編寫Spark程序使用Kafka數據源230
11.4.1 Kafka準備工作230
11.4.2 Spark準備工作231
11.4.3 編寫代碼233
11.5 本章小結237
展開全部

大數據處理技術基礎與應用(HADOOP+SPARK) 作者簡介

許桂秋,北京中科特瑞科技有限公司運營總監,主要研究方向為大數據、人工智能技術 ,已出版《大數據導論》《Python編程基礎與應用》《NoSQL數據庫原理與應用》《數據挖掘與機器學習》等圖書。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 台式核磁共振仪,玻璃软化点测定仪,旋转高温粘度计,测温锥和测温块-上海麟文仪器 | 北京律师咨询_知名专业北京律师事务所_免费法律咨询 | 深圳市超时尚职业培训学校,培训:月嫂,育婴,养老,家政;化妆,美容,美发,美甲. | 楼承板-开闭口楼承板-无锡海逵楼承板| 交变/复合盐雾试验箱-高低温冲击试验箱_安奈设备产品供应杭州/江苏南京/安徽马鞍山合肥等全国各地 | 江西自考网-江西自学考试网| 科普仪器菏泽市教育教学仪器总厂| 聚合甘油__盐城市飞龙油脂有限公司 | YT保温材料_YT无机保温砂浆_外墙保温材料_南阳银通节能建材高新技术开发有限公司 | 管理会计网-PCMA初级管理会计,中级管理会计考试网站 | 顶空进样器-吹扫捕集仪-热脱附仪-二次热解吸仪-北京华盛谱信仪器 | 电动垃圾车,垃圾清运车-江苏速利达机车有限公司 | 威客电竞(vk·game)·电子竞技赛事官网 | EPK超声波测厚仪,德国EPK测厚仪维修-上海树信仪器仪表有限公司 | 胶辊硫化罐_胶鞋硫化罐_硫化罐厂家-山东鑫泰鑫智能装备有限公司 意大利Frascold/富士豪压缩机_富士豪半封闭压缩机_富士豪活塞压缩机_富士豪螺杆压缩机 | AGV无人叉车_激光叉车AGV_仓储AGV小车_AGV无人搬运车-南昌IKV机器人有限公司[官网] | 电表箱-浙江迈峰电力设备有限公司-电表箱专业制造商 | 润东方环保空调,冷风机,厂房车间降温设备-20年深圳环保空调生产厂家 | 400电话_400电话申请_866元/年_【400电话官方业务办理】-俏号网 3dmax渲染-效果图渲染-影视动画渲染-北京快渲科技有限公司 | 免费网站网址收录网_海企优网站推荐平台| ZHZ8耐压测试仪-上海胜绪电气有限公司 | 合肥汽车充电桩_安徽充电桩_电动交流充电桩厂家_安徽科帝新能源科技有限公司 | 钢骨架轻型板_膨石轻型板_钢骨架轻型板价格_恒道新材料 | 陶氏道康宁消泡剂_瓦克消泡剂_蓝星_海明斯德谦_广百进口消泡剂 | 自清洗过滤器,浅层砂过滤器,叠片过滤器厂家-新乡市宇清净化 | HEYL硬度计量泵-荧光法在线溶解氧仪-净时测控技术(上海)有限公司 | 油冷式_微型_TDY电动滚筒_外装_外置式电动滚筒厂家-淄博秉泓机械有限公司 | wika威卡压力表-wika压力变送器-德国wika代理-威卡总代-北京博朗宁科技 | 防火门-专业生产甲级不锈钢钢质防火门厂家资质齐全-广东恒磊安防设备有限公司 | 超声波清洗机_细胞破碎仪_实验室超声仪器_恒温水浴-广东洁盟深那仪器 | 信阳网站建设专家-信阳时代网联-【信阳网站建设百度推广优质服务提供商】信阳网站建设|信阳网络公司|信阳网络营销推广 | 济南轻型钢结构/济南铁艺护栏/济南铁艺大门-济南燕翔铁艺制品有限公司 | 滚筒烘干机_转筒烘干机_滚筒干燥机_转筒干燥机_回转烘干机_回转干燥机-设备生产厂家 | 膏剂灌装旋盖机-眼药水灌装生产线-西林瓶粉剂分装机-南通博琅机械科技 | R507制冷剂,R22/R152a制冷剂厂家-浙江瀚凯制冷科技有限公司 | 低粘度纤维素|混凝土灌浆料|有机硅憎水粉|聚羧酸减水剂-南京斯泰宝 | 派克防爆伺服电机品牌|国产防爆伺服电机|高低温伺服电机|杭州摩森机电科技有限公司 | 聚合氯化铝_喷雾聚氯化铝_聚合氯化铝铁厂家_郑州亿升化工有限公司 | SMC-SMC电磁阀-日本SMC气缸-SMC气动元件展示网 | 上海地磅秤|电子地上衡|防爆地磅_上海地磅秤厂家–越衡称重 | 头条搜索极速版下载安装免费新版,头条搜索极速版邀请码怎么填写? - 欧远全 |