中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >
大數(shù)據(jù)平臺(tái)技術(shù)實(shí)例教程

包郵 大數(shù)據(jù)平臺(tái)技術(shù)實(shí)例教程

作者:鄭嘯
出版社:電子工業(yè)出版社出版時(shí)間:2022-12-01
開本: 其他 頁數(shù): 268
本類榜單:教材銷量榜
中 圖 價(jià):¥43.5(7.4折) 定價(jià)  ¥59.0 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
開年大促, 全場(chǎng)包郵
?新疆、西藏除外
本類五星書更多>

大數(shù)據(jù)平臺(tái)技術(shù)實(shí)例教程 版權(quán)信息

大數(shù)據(jù)平臺(tái)技術(shù)實(shí)例教程 內(nèi)容簡(jiǎn)介

本書通過大量實(shí)例介紹大數(shù)據(jù)平臺(tái)技術(shù),分4篇。大數(shù)據(jù)存儲(chǔ)篇包括第1~3章,內(nèi)容包括大數(shù)據(jù)技術(shù)概述、數(shù)據(jù)采集和大數(shù)據(jù)、大數(shù)據(jù)框架的安裝和配置;大數(shù)據(jù)管理篇包括第4~7章,內(nèi)容包括HDFS、Hadoop分布式計(jì)算模型、分布式協(xié)調(diào)服務(wù)ZooKeeper、Hadoop的集群資源管理系統(tǒng)YARN;大數(shù)據(jù)分析篇包括第8~10章,內(nèi)容包括數(shù)據(jù)庫MySQL和數(shù)據(jù)倉庫Hive、NoSQL數(shù)據(jù)庫HBase、基于內(nèi)存的分布式計(jì)算框架Spark;大數(shù)據(jù)應(yīng)用篇包括第11、12章,內(nèi)容包括數(shù)據(jù)可視化、大數(shù)據(jù)應(yīng)用綜合案例。 本書可作為高等學(xué)校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、計(jì)算機(jī)科學(xué)與技術(shù)、人工智能等理工類專業(yè)大數(shù)據(jù)平臺(tái)技術(shù)課程的教材,也可供廣大計(jì)算機(jī)愛好者及軟件開發(fā)人員參考。

大數(shù)據(jù)平臺(tái)技術(shù)實(shí)例教程 目錄

目錄
第1篇 大數(shù)據(jù)存儲(chǔ)篇

第1章 大數(shù)據(jù)技術(shù)概述 1
1.1 大數(shù)據(jù)源起和應(yīng)用 1
1.2 大數(shù)據(jù)技術(shù)框架 2
1.3 大數(shù)據(jù)就業(yè)崗位 5
1.4 大數(shù)據(jù)的特點(diǎn) 8
1.5 大數(shù)據(jù)的深遠(yuǎn)影響 9
1.6 大數(shù)據(jù)的意義和發(fā)展目標(biāo) 9
1.7 大數(shù)據(jù)與云計(jì)算、物聯(lián)網(wǎng)、
人工智能的關(guān)系 10
1.8 教材在線資源及使用說明 12
1.9 本章思維導(dǎo)圖 14
1.10 習(xí)題 14
第2章 數(shù)據(jù)采集和大數(shù)據(jù) 15
2.1 數(shù)據(jù)采集和ETL 15
2.2 網(wǎng)絡(luò)爬蟲 15
2.2.1 通用網(wǎng)絡(luò)爬蟲與聚焦網(wǎng)絡(luò)
爬蟲 16
2.2.2 網(wǎng)絡(luò)爬蟲的工作過程 16
2.3 Python常用開發(fā)工具簡(jiǎn)介 16
2.3.1 Python開發(fā)環(huán)境搭建 17
2.3.2 開發(fā)工具PyCharm 17
2.3.3 開發(fā)工具Jupyter Notebook 17
2.4 Python語言簡(jiǎn)介 18
2.4.1 Python常見的數(shù)據(jù)類型 18
2.4.2 NumPy庫 22
2.5 基于Python的網(wǎng)絡(luò)爬蟲應(yīng)用
實(shí)例 25
2.5.1 Urllib庫介紹 25
2.5.2 數(shù)據(jù)采集和ETL實(shí)例 28
2.6 本章思維導(dǎo)圖 32
2.7 習(xí)題 32
第3章 大數(shù)據(jù)框架的安裝和配置 33
3.1 大數(shù)據(jù)框架配置環(huán)境 33
3.2 Linux操作系統(tǒng)介紹 34
3.2.1 Linux的發(fā)展歷史 34
3.2.2 Linux版本特點(diǎn) 35
3.2.3 Linux版本選擇 36
3.3 Linux終端常見命令 37
3.3.1 基本命令 37
3.3.2 目錄操作命令 38
3.3.3 文件操作命令 41
3.3.4 系統(tǒng)工作命令 51
3.3.5 其他常見命令 54
3.4 虛擬機(jī)的使用 57
3.5 遠(yuǎn)程登錄工具配置 57
3.6 Hadoop偽分布式安裝和使用 58
3.6.1 環(huán)境配置 58
3.6.2 配置SSH免密登錄 58
3.6.3 配置JDK 58
3.6.4 Hadoop偽分布式配置 59
3.6.5 運(yùn)行WordCount實(shí)例 60
3.7 本章思維導(dǎo)圖 61
3.8 習(xí)題 62


第2篇 大數(shù)據(jù)管理篇

第4章 HDFS 63
4.1 引言 63
4.2 HDFS基礎(chǔ)知識(shí) 64
4.2.1 HDFS的特點(diǎn) 65
4.2.2 HDFS的優(yōu)缺點(diǎn) 65
4.2.3 HDFS的核心概念 66
4.2.4 HDFS執(zhí)行流程 66
4.3 HDFS的常用Shell命令 68
4.4 Hadoop中HDFS的Web管理
界面 72
4.5 基于Java API的HDFS操作 73
4.5.1 實(shí)驗(yàn)環(huán)境配置 74
4.5.2 案例實(shí)現(xiàn) 76
4.6 本章思維導(dǎo)圖 78
4.7 習(xí)題 78
第5章 Hadoop分布式計(jì)算模型 79
5.1 完全分布式環(huán)境配置 79
5.2 完全分布式配置步驟 80
5.3 MapReduce計(jì)算模型 83
5.4 Mapper-Reducer實(shí)例 84
5.4.1 實(shí)驗(yàn)準(zhǔn)備 84
5.4.2 案例實(shí)現(xiàn) 84
5.5 本章思維導(dǎo)圖 89
5.6 習(xí)題 89
第6章 分布式協(xié)調(diào)服務(wù)ZooKeeper 90
6.1 高可靠性大數(shù)據(jù)框架配置 90
6.2 ZooKeeper簡(jiǎn)介 91
6.3 ZooKeeper的常用命令 92
6.4 ZooKeeper的安裝與運(yùn)行 93
6.5 本章思維導(dǎo)圖 95
6.6 習(xí)題 95
第7章 Hadoop的集群資源管理系統(tǒng)
YARN 96
7.1 Hadoop資源管理配置 96
7.2 YARN簡(jiǎn)介 97
7.3 YARN的工作流程 98
7.4 YARN的安裝與運(yùn)行 99
7.5 本章思維導(dǎo)圖 100
7.6 習(xí)題 101
第3篇 大數(shù)據(jù)分析篇

第8章 數(shù)據(jù)庫MySQL和數(shù)據(jù)倉庫
Hive 102
8.1 基于Hive的大數(shù)據(jù)分析
配置 102
8.2 Hive的意義和應(yīng)用 103
8.3 Hive和數(shù)據(jù)庫的異同 104
8.4 Hive的架構(gòu)模式及其執(zhí)行 106
8.5 MySQL的安裝和使用 108
8.5.1 MySQL數(shù)據(jù)庫簡(jiǎn)介 108
8.5.2 安裝MySQL 109
8.5.3 MySQL的基本操作 109
8.6 Hive的安裝 114
8.7 Hive表的操作 114
8.7.1 內(nèi)部表和外部表 114
8.7.2 Hive表的操作 115
8.8 典型內(nèi)置函數(shù)與自定義函數(shù) 118
8.8.1 空值轉(zhuǎn)換函數(shù)nvl 118
8.8.2 case when和sum函數(shù)的綜合
應(yīng)用 119
8.8.3 UDAF聚合函數(shù)concat 121
8.8.4 UDTF炸裂函數(shù)explode 123
8.8.5 窗口函數(shù) 124
8.8.6 自定義函數(shù)實(shí)例 127
8.9 本章思維導(dǎo)圖 131
8.10 習(xí)題 131
第9章 NoSQL數(shù)據(jù)庫HBase 132
9.1 大數(shù)據(jù)框架的數(shù)據(jù)庫存儲(chǔ)
配置 132
9.2 NoSQL概念和分類 133
9.3 HBase數(shù)據(jù)庫 134
9.3.1 HBase數(shù)據(jù)模型 135
9.3.2 HBase體系架構(gòu)及組件 136
9.4 HBase的安裝 137
9.4.1 偽分布式 137
9.4.2 完全分布式 137
9.4.3 HBase的啟動(dòng)和關(guān)閉 138
9.4.4 HBase的網(wǎng)頁端 139
9.5 HBase的Shell操作 141
9.6 基于Java API訪問HBase
實(shí)例 146
9.6.1 準(zhǔn)備工作 146
9.6.2 Eclipse環(huán)境下編程 146
9.7 HBase綜合實(shí)例 150
9.8 本章思維導(dǎo)圖 157
9.9 習(xí)題 157
第10章 基于內(nèi)存的分布式計(jì)算
框架Spark 158
10.1 基于Spark的大數(shù)據(jù)分析框架
配置 158
10.2 Spark基礎(chǔ)知識(shí) 159
10.2.1 Spark的特點(diǎn) 159
10.2.2 Spark和Hadoop的比較 160
10.2.3 RDD的概念 161
10.2.4 Spark的運(yùn)行機(jī)制 161
10.2.5 Spark的運(yùn)行模式 163
10.3 Spark的安裝和使用 164
10.3.1 Spark安裝 164
10.3.2 Python 3和Jupyter安裝 165
10.3.3 啟動(dòng)PySpark 166
10.4 Spark的常用操作 168
10.5 Spark SQL的應(yīng)用 174
10.6 Spark綜合應(yīng)用實(shí)例 178
10.7 Spark的機(jī)器學(xué)習(xí) 179
10.7.1 MLlib 179
10.7.2 Scala語言 180
10.7.3 MLlib的機(jī)器學(xué)習(xí)算法 181
10.7.4 Spark的機(jī)器學(xué)習(xí)流程 183
10.8 本章思維導(dǎo)圖 194
10.9 習(xí)題 194
第4篇 大數(shù)據(jù)應(yīng)用篇

第11章 數(shù)據(jù)可視化 195
11.1 可視化分析展示配置 195
11.2 數(shù)據(jù)可視化概述 195
11.3 數(shù)據(jù)可視化繪圖 197
11.3.1 繪制折線圖 197
11.3.2 繪制柱狀圖 198
11.3.3 繪制直方圖 199
11.3.4 繪制散點(diǎn)圖 200
11.3.5 繪制餅圖 201
11.3.6 繪制極坐標(biāo)圖 202
11.3.7 繪制雷達(dá)圖 203
11.3.8 繪制熱力圖 205
11.3.9 繪制3D圖 206
11.4 綜合實(shí)例—鳶尾花數(shù)據(jù)集的
可視化分析 207
11.4.1 實(shí)驗(yàn)環(huán)境搭建 207
11.4.2 數(shù)據(jù)集介紹 208
11.4.3 數(shù)據(jù)可視化 208
11.5 本章思維導(dǎo)圖 217
11.6 習(xí)題 217
第12章 大數(shù)據(jù)應(yīng)用綜合案例 218
12.1 醫(yī)療大數(shù)據(jù)應(yīng)用框架配置 218
12.2 案例概述 218
12.2.1 背景和意義 218
12.2.2 預(yù)備知識(shí) 220
12.2.3 技術(shù)方案 223
12.3 準(zhǔn)備數(shù)據(jù)和開發(fā)環(huán)境配置 224
12.3.1 實(shí)驗(yàn)環(huán)境安裝簡(jiǎn)述 224
12.3.2 Sqoop的安裝和使用 225
12.3.3 數(shù)據(jù)集介紹 225
12.4 數(shù)據(jù)探索性分析 226
12.5 數(shù)據(jù)遷移 235
12.6 數(shù)據(jù)預(yù)處理 239
12.7 數(shù)據(jù)建模與訓(xùn)練 241
12.8 模型評(píng)估 244
12.8.1 特征重要性 244
12.8.2 混淆矩陣 245
12.8.3 評(píng)估指標(biāo) 245
12.8.4 ROC曲線 247
12.9 本章思維導(dǎo)圖 248
12.10 習(xí)題 248
附錄A 教材實(shí)驗(yàn) 249
實(shí)驗(yàn)1:基于Python的數(shù)據(jù)抓取和
清洗 249
實(shí)驗(yàn)2:基于Linux的Hadoop偽
分布式安裝和操作 250
實(shí)驗(yàn)3:分布式Hadoop的配置和
使用 252
實(shí)驗(yàn)4:基于數(shù)據(jù)倉庫Hive的數(shù)據(jù)
分析 253
實(shí)驗(yàn)5:NoSQL數(shù)據(jù)庫HBase
使用 255
實(shí)驗(yàn)6:基于分布式Spark框架的
編程 256
實(shí)驗(yàn)7:綜合案例設(shè)計(jì)與實(shí)現(xiàn) 258
參考文獻(xiàn) 260
展開全部

大數(shù)據(jù)平臺(tái)技術(shù)實(shí)例教程 作者簡(jiǎn)介

鄭嘯,安徽工業(yè)大學(xué)教授,博士畢業(yè)于東南大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)專業(yè),碩士生導(dǎo)師,安徽省高等學(xué)校優(yōu)秀中青年骨干教師。主攻方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)、工業(yè)互聯(lián)網(wǎng)、云計(jì)算與服務(wù)計(jì)算、數(shù)據(jù)隱私保護(hù)。

商品評(píng)論(0條)
暫無評(píng)論……
書友推薦
本類暢銷
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 卫生纸复卷机|抽纸机|卫生纸加工设备|做卫生纸机器|小型卫生纸加工需要什么设备|卫生纸机器设备多少钱一台|许昌恒源纸品机械有限公司 | 沈阳建筑设计公司_加固改造设计_厂房设计_设计资质加盟【金辉设计】 | 快速卷帘门_硬质快速卷帘门-西朗门业| ET3000双钳形接地电阻测试仪_ZSR10A直流_SXJS-IV智能_SX-9000全自动油介质损耗测试仪-上海康登 | POM塑料_PBT材料「进口」聚甲醛POM杜邦原料、加纤PBT塑料报价格找利隆塑料 | 标准件-非标紧固件-不锈钢螺栓-非标不锈钢螺丝-非标螺母厂家-三角牙锁紧自攻-南京宝宇标准件有限公司 | 24位ADC|8位MCU-芯易德科技有限公司| 充气膜专家-气膜馆-PTFE膜结构-ETFE膜结构-商业街膜结构-奥克金鼎 | 水性漆|墙面漆|木器家具漆|水漆涂料_晨阳水漆官网 | 领先的大模型技术与应用公司-中关村科金| 南京兰江泵业有限公司-水解酸化池潜水搅拌机-絮凝反应池搅拌机-好氧区潜水推进器 | 啤酒设备-小型啤酒设备-啤酒厂设备-济南中酿机械设备有限公司 | 数码听觉统合训练系统-儿童感觉-早期言语评估与训练系统-北京鑫泰盛世科技发展有限公司 | 涡街流量计_LUGB智能管道式高温防爆蒸汽温压补偿计量表-江苏凯铭仪表有限公司 | 塑料检查井_双扣聚氯乙烯增强管_双壁波纹管-河南中盈塑料制品有限公司 | 考勤系统_考勤管理系统_网络考勤软件_政企|集团|工厂复杂考勤工时统计排班管理系统_天时考勤 | 活性炭-果壳木质煤质柱状粉状蜂窝活性炭厂家价格多少钱 | 深圳诚暄fpc首页-柔性线路板,fpc柔性线路板打样生产厂家 | 专业深孔加工_东莞深孔钻加工_东莞深孔钻_东莞深孔加工_模具深孔钻加工厂-东莞市超耀实业有限公司 | 华东师范大学在职研究生招生网_在职研究生招生联展网 | 四合院设计_四合院装修_四合院会所设计-四合院古建设计与建造中心1 | 不锈钢管件(不锈钢弯头,不锈钢三通,不锈钢大小头),不锈钢法兰「厂家」-浙江志通管阀 | 北京发电机出租_发电机租赁_北京发电机维修 - 河北腾伦发电机出租 | 济南展厅设计施工_数字化展厅策划设计施工公司_山东锐尚文化传播有限公司 | hdpe土工膜-防渗膜-复合土工膜-长丝土工布价格-厂家直销「恒阳新材料」-山东恒阳新材料有限公司 ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 | 仿清水混凝土_清水混凝土装修_施工_修饰_保护剂_修补_清水混凝土修复-德州忠岭建筑装饰工程 | 上海赞永| 考试试题_试卷及答案_诗词单词成语 - 优易学 | 雄松华章(广州华章MBA)官网-专注MBA/MPA/MPAcc/MEM辅导培训 | 压片机_高速_单冲_双层_花篮式_多功能旋转压片机-上海天九压片机厂家 | 电子万能试验机_液压拉力试验机_冲击疲劳试验机_材料试验机厂家-济南众标仪器设备有限公司 | 玻璃钢罐_玻璃钢储罐_盐酸罐厂家-河北华盛节能设备有限公司 | 茶楼装修设计_茶馆室内设计效果图_云臻轩茶楼装饰公司 | VOC检测仪-甲醛检测仪-气体报警器-气体检测仪厂家-深恒安科技有限公司 | 钢木实验台-全钢实验台-化验室通风柜-实验室装修厂家-杭州博扬实验设备 | ISO9001认证咨询_iso9001企业认证代理机构_14001|18001|16949|50430认证-艾世欧认证网 | 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 镀锌钢格栅_热镀锌格栅板_钢格栅板_热镀锌钢格板-安平县昊泽丝网制品有限公司 | 刘秘书_你身边专业的工作范文写作小秘书| 活性氧化铝|无烟煤滤料|活性氧化铝厂家|锰砂滤料厂家-河南新泰净水材料有限公司 | 单螺旋速冻机-双螺旋-流态化-隧道式-食品速冻机厂家-广州冰泉制冷 |