中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
大數據技術基礎及應用教程(Linux+Hadoop+Spark面向新工科高等院校大數據專業系列教材)

包郵 大數據技術基礎及應用教程(Linux+Hadoop+Spark面向新工科高等院校大數據專業系列教材)

出版社:機械工業出版社出版時間:2022-07-01
開本: 16開 頁數: 228
中 圖 價:¥41.7(7.0折) 定價  ¥59.9 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據技術基礎及應用教程(Linux+Hadoop+Spark面向新工科高等院校大數據專業系列教材) 版權信息

  • ISBN:9787111710912
  • 條形碼:9787111710912 ; 978-7-111-71091-2
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

大數據技術基礎及應用教程(Linux+Hadoop+Spark面向新工科高等院校大數據專業系列教材) 本書特色

適讀人群 :高校數據科學與大數據技術等相關專業學生系統介紹大數據三大核心技術(Linux、Hadoop、Spark)原理及其應用。 實例講解典型大數據應用:構建基于分布式集群的大數據平臺及離線/在線數據分析。 豐富的教學配套資源:教學PPT、程序源代碼、集群虛擬機、擴展學習視頻、課后練習題及答案。

大數據技術基礎及應用教程(Linux+Hadoop+Spark面向新工科高等院校大數據專業系列教材) 內容簡介

本書從大數據技術相關概念出發,系統介紹了構建大數據平臺的相關技術,并在此基礎上進行離線數據分析和在線數據分析。全書共三篇,分為7章,內容包括技術基礎篇、分布式集群篇、平臺構建篇,第壹篇包括大數據技術概述、大數據分析技術,第二篇包括Linux技術基礎、Hadoop技術基礎及構建Hadoop集群、Spark技術基礎及構建Spark集群,第三篇包括構建基于Spark的實時交易數據統計平臺、構建基于Hadoop的離線電商大數據分析平臺。 本書以理論為基礎,以實例為引導,完整闡述了如何從無到有搭建大數據平臺,并在此平臺基礎上進行應用。本書配套資源豐富,包括教學PPT、所有程序的源代碼、相關集群虛擬機、擴展學習視頻、課后練習題及答案,可方便授課教師教學及學生自學。 本書可作為高校數據科學與大數據技術等相關專業的教材,也可作為對大數據技術感興趣的相關人員的參考用書。 本書配有授課教學資源,需要的教師可登錄www.cmpedu.com免費注冊,審核通過后下載,或聯系編輯索取(微信:15910938545,電話:010-88379739)。

大數據技術基礎及應用教程(Linux+Hadoop+Spark面向新工科高等院校大數據專業系列教材) 目錄

目錄
前言
**篇 技術基礎篇

第1章 大數據技術概述2
1.1 大數據的基本概念2
1.1.1 大數據的產生階段2
1.1.2 大數據的特征2
1.1.3 大數據在各個領域的應用3
1.1.4 大數據的核心技術和計算模式3
1.2 分布式技術與集群4
1.2.1 分布式技術概述4
1.2.2 分布式大數據集群概述4
1.3 大數據技術生態圈7
1.3.1 Linux操作系統7
1.3.2 Hadoop生態系統9
1.3.3 Spark對Hadoop的完善13
本章小結13
本章練習13
第2章 大數據分析技術15
2.1 大數據分析流程及相關技術15
2.1.1 數據采集與預處理15
2.1.2 大數據存儲16
2.1.3 大數據分析與挖掘17
2.1.4 數據可視化18
2.2 大數據分析常用方法18
2.2.1 數理統計分析18
2.2.2 聚類分析18
2.2.3 分類分析19
2.2.4 回歸分析19
2.3 數據分析基礎工具19
2.3.1 數據采集工具—Selenium和
PhantomJS19
2.3.2 數據清洗工具—Kettle20
2.3.3 數據存儲工具—MongoDB和
MySQL21
2.3.4 機器學習工具—Scikit-learn23
2.3.5 數據可視化工具—Matplotlib、
PyEcharts、Superset23
本章小結25
本章練習26
第二篇 分布式集群篇

第3章 Linux技術基礎28
3.1 用戶與組管理28
3.1.1 用戶管理相關命令28
3.1.2 組管理相關命令29
3.1.3 其他命令29
3.2 文件與目錄管理29
3.2.1 常用文件操作命令29
3.2.2 目錄操作命令31
3.2.3 改變文件或目錄訪問權限32
3.2.4 文件備份和壓縮33
3.3 進程管理與作業控制33
3.3.1 進程查看34
3.3.2 進程調度34
3.4 磁盤存儲管理34
3.4.1 磁盤管理命令35
3.4.2 存取命令35
3.5 系統管理與常用網絡命令35
3.5.1 系統管理35
3.5.2 常用網絡命令36
3.6 在線幫助系統36
3.7 實踐:Linux操作系統的
安裝與部署37
3.7.1 Linux的安裝和卸載37
3.7.2 局域網主機間遠程復制文件/
目錄38
3.7.3 XML文件介紹38
3.7.4 VMware安裝及CentOS系統
環境準備40
3.7.5 克隆虛擬機48
3.7.6 配置主機名50
3.7.7 配置網絡IP地址51
本章小結53
本章練習53
第4章 Hadoop技術基礎及構建
Hadoop集群55
4.1 Hadoop技術基礎55
4.1.1 Hadoop的組成55
4.1.2 Hadoop的運行模式62
4.1.3 HDFS文件的存取63
4.1.4 Hadoop集群的環境配置64
4.1.5 Hadoop集群的搭建65
4.1.6 啟動Hadoop集群69
4.2 ZooKeeper技術基礎及部署70
4.2.1 ZooKeeper簡介70
4.2.2 ZooKeeper的安裝部署73
4.2.3 Leader選舉機制75
4.2.4 ZooKeeper客戶端訪問集群
(命令行操作方式)82
4.3 HDFS與YARN高可用技術
基礎84
4.3.1 HDFS高可用的工作機制84
4.3.2 HDFS高可用配置85
4.3.3 YARN高可用的工作機制93
4.3.4 YARN高可用配置94
4.4 實踐:HDFS及MapReduce的
應用示例98
4.4.1 讀寫HDFS文件98
4.4.2 MapReduce操作 1:二次排序105
4.4.3 MapReduce操作 2:計數器110
4.4.4 MapReduce操作 3:Join操作113
本章小結119
本章練習119
第5章 Spark技術基礎及構建
Spark集群121
5.1 Spark核心機制121
5.1.1 Spark基本原理121
5.1.2 Spark系統架構122
5.1.3 Spark Shell操作123
5.2 Hive原理及實踐124
5.2.1 Hive定義124
5.2.2 Hive架構124
5.2.3 Hive表分類及查詢操作126
5.3 HBase原理及實踐130
5.3.1 HBase定義130
5.3.2 HBase集群架構130
5.3.3 HBase數據模型131
5.4 Kafka原理及實踐133
5.4.1 Kafka定義133
5.4.2 Kafka消息隊列133
5.4.3 Kafka基礎架構134
5.5 Flume原理及實踐135
5.5.1 Flume簡介135
5.5.2 Flume基礎架構135
5.6 實踐:搭建基于Spark的實時
大數據平臺137
5.6.1 Spark安裝部署137
5.6.2 MySQL安裝部署140
5.6.3 Hive安裝部署141
5.6.4 HBase安裝部署143
5.6.5 Kafka安裝部署147
5.6.6 Flume安裝部署149
5.6.7 Spark集群典型應用150
本章小結158
本章練習158

第三篇 平臺構建篇

第6章 構建基于Spark的實時交易
數據統計平臺161
6.1 系統需求與架構161
6.1.1 系統背景介紹161
6.1.2 系統功能需求162
6.1.3 系統架構設計162
6.2 Redis簡介163
6.2.1 Redis數據庫的作用163
6.2.2 Redis部署與啟動163
6.2.3 Redis常用命令165
6.3 系統開發流程166
6.4 數據獲取模塊實現174
6.4.1 模擬訂單數據174
6.4.2 向Kafka集群發送訂單數據175
6.5 數據分析與處理模塊實現178
6.5.1 分析訂單數據178
6.5.2 生成結果182
6.6 數據可視化模塊實現182
6.6.1 搭建Web開發環境183
6.6.2 實現數據展示功能185
6.6.3 可視化平臺展示192
本章小結192
本章練習192
第7章 構建基于Hadoop的離線
電商大數據分析平臺194
7.1 系統需求與架構194
7.1.1 系統背景介紹194
7.1.2 系統功能需求195
7.1.3 系統架構設計195
7.2 數據采集模塊實現196
7.2.1 商品信息爬取196
7.2.2 調試分析210
7.3 數據處理與存儲模塊實現211
7.3.1 信息分析與處理211
7.3.2 商品信息存儲220
7.3.3 調試分析222
7.4 數據可視化模塊實現222
7.4.1 使用Superset連接MySQL
數據庫223
7.4.2 調試分析223
本章小結226
本章練習227
參考文獻228
展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: MTK核心板|MTK开发板|MTK模块|4G核心板|4G模块|5G核心板|5G模块|安卓核心板|安卓模块|高通核心板-深圳市新移科技有限公司 | 电力测功机,电涡流测功机,磁粉制动器,南通远辰曳引机测试台 | NBA直播_NBA直播免费观看直播在线_NBA直播免费高清无插件在线观看-24直播网 | 多功能干燥机,过滤洗涤干燥三合一设备-无锡市张华医药设备有限公司 | 安徽合肥项目申报咨询公司_安徽合肥高新企业项目申报_安徽省科技项目申报代理 | 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 赛尔特智能移动阳光房-阳光房厂家-赛尔特建筑科技(广东)有限公司 | 顶空进样器-吹扫捕集仪-热脱附仪-二次热解吸仪-北京华盛谱信仪器 | 膜结构停车棚-自行车棚-膜结构汽车棚加工安装厂家幸福膜结构 | 臭氧老化试验箱,高低温试验箱,恒温恒湿试验箱,防水试验设备-苏州亚诺天下仪器有限公司 | 西点培训学校_法式西点培训班_西点师培训_西点蛋糕培训-广州烘趣西点烘焙培训学院 | 水冷式工业冷水机组_风冷式工业冷水机_水冷螺杆冷冻机组-深圳市普威机械设备有限公司 | 青岛代理记账_青岛李沧代理记账公司_青岛崂山代理记账一个月多少钱_青岛德辉财税事务所官网 | 珠海冷却塔降噪维修_冷却塔改造报价_凉水塔风机维修厂家- 广东康明节能空调有限公司 | 上海租车公司_上海包车_奔驰租赁_上海商务租车_上海谐焕租车 | 济南品牌包装设计公司_济南VI标志设计公司_山东锐尚文化传播 | 拉力机-万能试验机-材料拉伸试验机-电子拉力机-拉力试验机厂家-冲击试验机-苏州皖仪实验仪器有限公司 | 液氨泵,液化气泵-淄博「亚泰」燃气设备制造有限公司 | 烟雾净化器-滤筒除尘器-防爆除尘器-除尘器厂家-东莞执信环保科技有限公司 | 闭端端子|弹簧螺式接线头|防水接线头|插线式接线头|端子台|电源线扣+护线套|印刷电路板型端子台|金笔电子代理商-上海拓胜电气有限公司 | 苏州同创电子有限公司 - 四探针测试仪源头厂家 | 耐酸碱泵-自吸耐酸碱泵型号「品牌厂家」立式耐酸碱泵价格-昆山国宝过滤机有限公司首页 | 农业四情_农业气象站_田间小型气象站_智慧农业气象站-山东风途物联网 | 哈尔滨治「失眠/抑郁/焦虑症/精神心理」专科医院排行榜-京科脑康免费咨询 一对一诊疗 | SOUNDWELL 编码器|电位器|旋转编码器|可调电位器|编码开关厂家-广东升威电子制品有限公司 | 磁力链接搜索神器_BT磁力狗_CILIMAO磁力猫_高效磁力搜索引擎2024 | 加热制冷恒温循环器-加热制冷循环油浴-杭州庚雨仪器有限公司 | 郑州爱婴幼师学校_专业幼师培训_托育师培训_幼儿教育培训学校 | 镀锌角钢_槽钢_扁钢_圆钢_方矩管厂家_镀锌花纹板-海邦钢铁(天津)有限公司 | 背压阀|减压器|不锈钢减压器|减压阀|卫生级背压阀|单向阀|背压阀厂家-上海沃原自控阀门有限公司 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 | 巩义市科瑞仪器有限公司| 细砂提取机,隔膜板框泥浆污泥压滤机,螺旋洗砂机设备,轮式洗砂机械,机制砂,圆锥颚式反击式破碎机,振动筛,滚筒筛,喂料机- 上海重睿环保设备有限公司 | 企业微信scrm管理系统_客户关系管理平台_私域流量运营工具_CRM、ERP、OA软件-腾辉网络 | 磁粉制动器|张力控制器|气胀轴|伺服纠偏控制器整套厂家--台灵机电官网 | 运动木地板价格,篮球馆体育运动木地板生产厂家_欧氏地板 | 广州监控安装公司_远程监控_安防弱电工程_无线wifi覆盖_泉威安防科技 | sfp光模块,高速万兆光模块工厂-性价比更高的光纤模块制造商-武汉恒泰通 | 游泳池设备安装工程_恒温泳池设备_儿童游泳池设备厂家_游泳池水处理设备-东莞市君达泳池设备有限公司 | 石家庄网站建设|石家庄网站制作|石家庄小程序开发|石家庄微信开发|网站建设公司|网站制作公司|微信小程序开发|手机APP开发|软件开发 | 柔性输送线|柔性链板|齿形链-上海赫勒输送设备有限公司首页[输送机] | 广东燎了网络科技有限公司官网-网站建设-珠海网络推广-高端营销型外贸网站建设-珠海专业h5建站公司「了了网」 |