中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
面向新工科專業(yè)建設計算機系列教材大數(shù)據(jù)技術(微課版)

包郵 面向新工科專業(yè)建設計算機系列教材大數(shù)據(jù)技術(微課版)

出版社:清華大學出版社出版時間:2020-08-01
開本: 其他 頁數(shù): 356
本類榜單:教材銷量榜
中 圖 價:¥33.4(5.7折) 定價  ¥59.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

面向新工科專業(yè)建設計算機系列教材大數(shù)據(jù)技術(微課版) 版權(quán)信息

面向新工科專業(yè)建設計算機系列教材大數(shù)據(jù)技術(微課版) 本書特色

■ 從大數(shù)據(jù)處理相關技術基礎入手,循序漸進講解大數(shù)據(jù)處理相關技術。 ■ 注重原理與技術相結(jié)合,力求對大數(shù)據(jù)處理技術給出理論上的解釋。 ■ 注重理論與實踐相結(jié)合,對涉及的大數(shù)據(jù)處理理論給出對應的操作示例。

面向新工科專業(yè)建設計算機系列教材大數(shù)據(jù)技術(微課版) 內(nèi)容簡介

本書系統(tǒng)地講解了大數(shù)據(jù)處理常用技術,具體包括大數(shù)據(jù)處理架構(gòu)Hadoop、分布式文件系統(tǒng)HDFS、MapReduce編程模型、分布式數(shù)據(jù)庫Hbase、NoSQL數(shù)據(jù)庫、Spark分布式內(nèi)存計算、MapReduce應用開發(fā)、Spark SQL編程、數(shù)據(jù)可視化。本書編寫特色理論與具體操作相結(jié)合,較低基礎入門大數(shù)據(jù)技術。讀者對象是本科、?苹蜓芯可髷(shù)據(jù)技術課程教材,大數(shù)據(jù)技術愛好者,其他對大數(shù)據(jù)技術感興趣的人員。

面向新工科專業(yè)建設計算機系列教材大數(shù)據(jù)技術(微課版) 目錄

第1章大數(shù)據(jù)概述1

1.1大數(shù)據(jù)的基本概念1

1.1.1大數(shù)據(jù)的定義1

1.1.2大數(shù)據(jù)的特征1

1.2大數(shù)據(jù)技術2

1.2.1數(shù)據(jù)采集技術2

1.2.2數(shù)據(jù)預處理技術3

1.2.3云計算技術3

1.2.4分布式處理技術6

1.2.5數(shù)據(jù)存儲技術6

1.3大數(shù)據(jù)計算模式與典型系統(tǒng)7

1.3.1批處理計算模式與典型系統(tǒng)7

1.3.2流式計算模式與典型系統(tǒng)7

1.3.3迭代計算模式與典型系統(tǒng)8

1.3.4圖計算模式與典型系統(tǒng)8

1.3.5內(nèi)存計算模式與典型系統(tǒng)8

1.4習題8

第2章大數(shù)據(jù)軟件基礎9

2.1Linux基礎9

2.1.1命令格式9

2.1.2用戶管理10

2.1.3文件操作12

2.1.4目錄操作15

2.1.5文件壓縮和解壓縮命令17

2.1.6安裝和卸載軟件18

2.1.7主機名更改19

2.2Java語言基礎202.2.1基本數(shù)據(jù)類型20

2.2.2主類結(jié)構(gòu)21

2.2.3定義類24

2.2.4類的實例化26

2.2.5包28

2.2.6常用實用類31

2.3SQL基礎33

2.4在VirtualBox上安裝虛擬機34

2.4.1Master節(jié)點的安裝34

2.4.2復制虛擬機41

2.5習題45

大數(shù)據(jù)技術(微課版)目錄第3章Hadoop大數(shù)據(jù)處理架構(gòu)46

3.1Hadoop概述46

3.1.1Hadoop簡介46

3.1.2Hadoop特性46

3.2Hadoop生態(tài)系統(tǒng)47

3.2.1Hadoop分布式文件系統(tǒng)47

3.2.2MapReduce分布式計算模型48

3.2.3Hive數(shù)據(jù)倉庫49

3.2.4HBase分布式數(shù)據(jù)庫49

3.2.5Zookeeper分布式協(xié)調(diào)服務49

3.2.6Sqoop數(shù)據(jù)導入導出工具50

3.2.7Pig數(shù)據(jù)分析50

3.2.8Mahout數(shù)據(jù)挖掘算法庫50

3.2.9Flume日志收集工具51

3.2.10Oozie作業(yè)流調(diào)度系統(tǒng)51

3.2.11Spark分布式內(nèi)存計算51

3.2.12Tez有向無環(huán)圖計算52

3.2.13Storm流數(shù)據(jù)處理52

3.3Hadoop的安裝與使用53

3.3.1安裝Hadoop前的準備工作53

3.3.2下載Hadoop安裝文件55

3.3.3Hadoop單機模式配置56

3.3.4Hadoop偽分布式模式配置56

3.3.5Hadoop分布式模式配置60

3.4習題69

第4章Hadoop分布式文件系統(tǒng)70

4.1分布式文件系統(tǒng)的結(jié)構(gòu)70

4.1.1主控服務器71

4.1.2數(shù)據(jù)服務器72

4.1.3客戶端73

4.2HDFS的基本特征73

4.3HDFS存儲架構(gòu)及組件功能74

4.3.1HDFS存儲架構(gòu)74

4.3.2數(shù)據(jù)塊74

4.3.3數(shù)據(jù)節(jié)點75

4.3.4名稱節(jié)點76

4.3.5第二名稱節(jié)點77

4.3.6心跳消息77

4.3.7客戶端77

4.4HDFS文件讀寫流程77

4.4.1HDFS讀文件流程78

4.4.2HDFS寫文件流程79

4.5HDFS的Shell操作80

4.5.1查看命令使用方法80

4.5.2HDFS常用的Shell操作81

4.5.3HDFS管理員命令86

4.5.4HDFS的Java API操作86

4.5.5利用HDFS的Web管理頁面87

4.6HDFS編程實踐87

4.6.1安裝eclipse88

4.6.2在eclipse中創(chuàng)建項目89

4.6.3為項目添加需要用到的JAR包90

4.6.4編寫Java應用程序92

4.6.5編譯運行程序94

4.6.6應用程序的部署95

4.7習題97

第5章MapReduce分布式計算框架99

5.1MapReduce概述99

5.1.1并發(fā)、并行與分布式編程的概念99

5.1.2MapReduce并行編程模型100

5.1.3Map函數(shù)和Reduce函數(shù)100

5.2MapReduce的工作原理101

5.2.1MapReduce的體系架構(gòu)101

5.2.2MapTask的工作原理103

5.2.3ReduceTask的工作原理104

5.3MapReduce編程類105

5.3.1InputFormat輸入格式類105

5.3.2Mapper基類110

5.3.3Combiner合并類112

5.3.4Partitioner分區(qū)類112

5.3.5Sort排序類113

5.3.6Reducer類113

5.3.7輸出格式類OutputFormat116

5.4MapReduce經(jīng)典案例117

5.4.1WordCount執(zhí)行流程示例117

5.4.2WordCount具體實現(xiàn)119

5.4.3使用eclipse編譯運行詞頻統(tǒng)計程序124

5.5習題129

第6章HBase分布式數(shù)據(jù)庫130

6.1HBase概述130

6.1.1HBase的技術特點130

6.1.2HBase與傳統(tǒng)關系數(shù)據(jù)庫的區(qū)別130

6.1.3HBase與Hadoop中其他組件的關系131

6.2HBase系統(tǒng)架構(gòu)和訪問接口132

6.2.1HBase系統(tǒng)架構(gòu)132

6.2.2ROOT表和.META.表135

6.2.3HBase訪問接口137

6.3HBase數(shù)據(jù)表138

6.3.1HBase數(shù)據(jù)表邏輯視圖138

6.3.2HBase數(shù)據(jù)表物理視圖140

6.3.3HBase數(shù)據(jù)表面向列的存儲141

6.3.4HBase數(shù)據(jù)表的查詢方式142

6.3.5HBase表結(jié)構(gòu)設計143

6.4HBase安裝143

6.4.1下載安裝文件143

6.4.2配置環(huán)境變量143

6.4.3添加用戶權(quán)限144

6.4.4查看HBase版本信息144

6.5HBase配置145

6.5.1單機運行模式配置145

6.5.2偽分布式運行模式配置146

6.6HBase常用Shell命令148

6.6.1基本命令149

6.6.2創(chuàng)建表150

6.6.3插入與更新表中的數(shù)據(jù)152

6.6.4查看表中的數(shù)據(jù)152

6.6.5刪除表中的數(shù)據(jù)154

6.6.6表的啟用/禁用155

6.6.7修改表結(jié)構(gòu)155

6.6.8刪除HBase表156

6.7常用的Java API156

6.7.1HBase數(shù)據(jù)庫管理API156

6.7.2HBase數(shù)據(jù)庫表API157

6.7.3HBase數(shù)據(jù)庫表行列API159

6.8HBase編程161

6.8.1在eclipse中創(chuàng)建項目161

6.8.2添加項目需要用到的JAR包162

6.8.3編寫Java應用程序163

6.8.4編譯運行程序166

6.9習題167

第7章NoSQL數(shù)據(jù)庫168

7.1NoSQL數(shù)據(jù)庫概述168

7.1.1NoSQL數(shù)據(jù)庫興起的原因168

7.1.2NoSQL數(shù)據(jù)庫的特點169

7.2“鍵值”數(shù)據(jù)庫169

7.2.1Redis安裝170

7.2.2Redis數(shù)據(jù)庫的特點171

7.2.3Redis數(shù)據(jù)庫的基本數(shù)據(jù)類型171

7.3列族數(shù)據(jù)庫177

7.4文檔數(shù)據(jù)庫177

7.4.1MongoDB簡介177

7.4.2MongoDB下載與安裝177

7.4.3MongoDB文檔操作181

7.4.4MongoDB集合操作185

7.4.5MongoDB數(shù)據(jù)庫操作186

7.4.6MongoDB數(shù)據(jù)類型187

7.5圖數(shù)據(jù)庫188

7.5.1下載和安裝Neo4j189

7.5.2Neo4j的啟動和停止189

7.5.3Neo4j的CQL操作191

7.5.4在Neo4j瀏覽器中創(chuàng)建節(jié)點和關系194

7.6習題196

第8章Scala基礎編程197

8.1Scala特性197

8.2Scala安裝198

8.2.1用IntelliJ IDEA搭建Scala開發(fā)環(huán)境198

8.2.2用scala.msi搭建Scala開發(fā)環(huán)境202

8.3Scala數(shù)據(jù)類型203

8.4Scala常量和變量204

8.4.1常量204

8.4.2變量205

8.5Scala數(shù)組、列表、集合和映射205

8.5.1定長數(shù)組206

8.5.2變長數(shù)組208

8.5.3列表209

8.5.4集合210

8.5.5映射211

8.6Scala控制結(jié)構(gòu)212

8.6.1條件表達式212

8.6.2if…else選擇結(jié)構(gòu)213

8.6.3編寫Scala腳本213

8.6.4循環(huán)214

8.7Scala函數(shù)215

8.7.1函數(shù)定義215

8.7.2匿名函數(shù)216

8.7.3高階函數(shù)217

8.8Scala類217

8.9Scala讀寫文件218

8.10習題219

第9章Python基礎編程220

9.1Python安裝220

9.2Python代碼編寫方式221

9.2.1用帶圖形界面的Python Shell編寫交互式代碼221

9.2.2用帶圖形界面的Python Shell編寫程序代碼221

9.3Python對象和引用222

9.3.1對象的身份223

9.3.2對象的類型223

9.3.3對象的值223

9.3.4對象的引用223

9.4Python基本數(shù)據(jù)類型224

9.4.1數(shù)值數(shù)據(jù)類型224

9.4.2字符串數(shù)據(jù)類型225

9.4.3列表數(shù)據(jù)類型231

9.4.4元組數(shù)據(jù)類型236

9.4.5字典數(shù)據(jù)類型238

9.4.6集合數(shù)據(jù)類型242

9.4.7Python數(shù)據(jù)類型之間的轉(zhuǎn)換244

9.5Python中的數(shù)據(jù)輸入244

9.6Python中的數(shù)據(jù)輸出245

9.6.1表達式語句輸出245

9.6.2print函數(shù)輸出245

9.6.3字符串對象的format方法的格式化輸出247

9.7Python中文件的基本操作248

9.8選擇結(jié)構(gòu)249

9.8.1選擇語句249

9.8.2條件表達式250

9.9循環(huán)結(jié)構(gòu)250

9.9.1while循環(huán)250

9.9.2for循環(huán)251

9.9.3循環(huán)中的break、continue和else252

9.10函數(shù)252

9.10.1定義函數(shù)252

9.10.2函數(shù)調(diào)用253

9.11類255

9.11.1定義類255

9.11.2創(chuàng)建類的對象256

9.12習題257

第10章Spark分布式內(nèi)存計算258

10.1Spark概述258

10.1.1Spark產(chǎn)生背景258

10.1.2Spark的優(yōu)點259

10.1.3Spark應用場景259

10.1.4Spark生態(tài)系統(tǒng)261

10.2Spark的安裝及配置261

10.2.1Spark安裝的基礎環(huán)境261

10.2.2下載安裝文件262

10.2.3單機模式配置262

10.2.4偽分布式模式配置263

10.3使用Spark Shell編寫Scala代碼264

10.3.1啟動Spark Shell265

10.3.2退出Spark Shell266

10.4Spark核心數(shù)據(jù)結(jié)構(gòu)RDD266

10.4.1RDD創(chuàng)建266

10.4.2RDD操作268

10.4.3RDD屬性275

10.4.4RDD持久化277

10.5Spark運行機制278

10.5.1Spark基本概念278

10.5.2Spark運行架構(gòu)281

10.5.3Spark應用執(zhí)行基本流程282

10.6使用Scala語言編寫Spark應用程序283

10.6.1安裝sbt283

10.6.2編寫詞頻統(tǒng)計Scala應用程序284

10.6.3用sbt打包Scala應用程序285

10.6.4通過sparksubmit運行程序286

10.7使用Python語言編寫Spark應用程序286

10.7.1SparkContext287

10.7.2pyspark對RDD的轉(zhuǎn)換操作289

10.7.3pyspark對RDD的行動操作290

10.8習題292

第11章Spark SQL編程293

11.1Spark SQL概述293

11.2Spark SQL與Shell交互293

11.3DataFrame對象的創(chuàng)建294

11.3.1使用parquet格式文件創(chuàng)建DataFrame294

11.3.2使用JSON數(shù)據(jù)文件創(chuàng)建DataFrame295

11.3.3使用RDD創(chuàng)建DataFrame296

11.4DataFrame對象上的常用操作296

11.4.1內(nèi)容查看297

11.4.2過濾299

11.4.3分組與聚合299

11.4.4獲取所有數(shù)據(jù)到數(shù)組299

11.4.5獲取所有數(shù)據(jù)到列表300

11.4.6獲取指定字段的統(tǒng)計信息300

11.5習題300

第12章數(shù)據(jù)可視化301

12.1Tableau繪圖301

12.1.1Tableau的主要特性301

12.1.2Tableau工作表工作區(qū)302

12.1.3Tableau儀表板工作區(qū)307

12.1.4Tableau故事工作區(qū)308

12.1.5Tableau菜單欄310

12.1.6Tableau可視化與數(shù)據(jù)分析舉例311

12.2ECharts繪圖312

12.2.1ECharts的特點312

12.2.2ECharts環(huán)境搭建313

12.2.3使用Dreamweaver 8創(chuàng)建網(wǎng)頁313

12.2.4使用Echarts繪制折線圖314

12.2.5使用Echarts繪制柱狀圖318

12.2.6使用Echarts繪制餅圖320

12.2.7使用Echarts繪制雷達圖322

12.3PyeCharts繪圖324

12.3.1繪制柱狀圖325

12.3.2繪制折線圖327

12.3.3繪制餅圖329

12.3.4繪制雷達圖330

12.3.5繪制漏斗圖331

12.3.6繪制3D立體圖332

12.3.7繪制詞云圖333

12.4習題334

參考文獻335


展開全部

面向新工科專業(yè)建設計算機系列教材大數(shù)據(jù)技術(微課版) 作者簡介

曹潔:男,鄭州輕工業(yè)大學副教授,同濟大學博士畢業(yè)。研究方向:數(shù)據(jù)分析、機器學習、并行分布式處理。近年在軟件學報、電子學報、計算機研究與發(fā)展、通信學報等刊物上發(fā)表10余篇論文。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 实验室装修_实验室设计_实验室规划设计- 上海广建净化工程公司 | 短信营销平台_短信群发平台_106短信发送平台-河南路尚 | 选矿设备,选矿生产线,选矿工艺,选矿技术-昆明昆重矿山机械 | 铸铝门厂家,别墅大门庭院大门,别墅铸铝门铜门[十大品牌厂家]军强门业 | 农业四情_农业气象站_田间小型气象站_智慧农业气象站-山东风途物联网 | 滚筒烘干机_转筒烘干机_滚筒干燥机_转筒干燥机_回转烘干机_回转干燥机-设备生产厂家 | 美侍宠物-专注宠物狗及宠物猫训练|喂养|医疗|繁育|品种|价格 | 首页 - 张店继勇软件开发工作室 兰州UPS电源,兰州山特UPS-兰州万胜商贸 | 安全,主动,被动,柔性,山体滑坡,sns,钢丝绳,边坡,防护网,护栏网,围栏,栏杆,栅栏,厂家 - 护栏网防护网生产厂家 | 橡胶接头_橡胶软接头_套管伸缩器_管道伸缩器厂家-巩义市远大供水材料有限公司 | ERP企业管理系统永久免费版_在线ERP系统_OA办公_云版软件官网 | 法兰连接型电磁流量计-蒸汽孔板节流装置流量计-北京凯安达仪器仪表有限公司 | 真空搅拌机-行星搅拌机-双行星动力混合机-广州市番禺区源创化工设备厂 | 电子厂招聘_工厂招聘_普工招聘_小时工招聘信息平台-众立方招工网 | 上海办公室装修,办公楼装修设计,办公空间设计,企业展厅设计_写艺装饰公司 | 液压中心架,数控中心架,自定心中心架-烟台恒阳机电设计有限公司 行星搅拌机,双行星搅拌机,动力混合机,无锡米克斯行星搅拌机生产厂家 | 智能型高压核相仪-自动开口闪点测试仪-QJ41A电雷管测试仪|上海妙定 | 物联网卡_物联网卡购买平台_移动物联网卡办理_移动联通电信流量卡通信模组采购平台? | 小型气象站_便携式自动气象站_校园气象站-竞道气象设备网 | 潍坊青州古城旅游景点攻略_青州酒店美食推荐-青州旅游网 | 荣事达手推洗地机_洗地机厂家_驾驶式扫地机_工业清洁设备 | 金属回收_废铜废铁回收_边角料回收_废不锈钢回收_废旧电缆线回收-广东益夫金属回收公司 | 轻型地埋电缆故障测试仪,频响法绕组变形测试仪,静荷式卧式拉力试验机-扬州苏电 | 插针变压器-家用电器变压器-工业空调变压器-CD型电抗器-余姚市中驰电器有限公司 | 泰兴市热钻机械有限公司-热熔钻孔机-数控热熔钻-热熔钻孔攻牙一体机 | 潜水搅拌机-双曲面搅拌机-潜水推进器|奥伯尔环保 | 2025世界机器人大会_IC China_半导体展_集成电路博览会_智能制造展览网 | 818手游网_提供当下热门APP手游_最新手机游戏下载 | 复合土工膜厂家|hdpe防渗土工膜|复合防渗土工布|玻璃纤维|双向塑料土工格栅-安徽路建新材料有限公司 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | ET3000双钳形接地电阻测试仪_ZSR10A直流_SXJS-IV智能_SX-9000全自动油介质损耗测试仪-上海康登 | 导电银胶_LED封装导电银胶_半导体封装导电胶厂家-上海腾烁 | 培训中心-翰香原香酥板栗饼加盟店总部-正宗板栗酥饼技术 | 金刚网,金刚网窗纱,不锈钢网,金刚网厂家- 河北萨邦丝网制品有限公司 | 衬塑管道_衬四氟管道厂家-淄博恒固化工设备有限公司 | IIS7站长之家-站长工具-爱网站请使用IIS7站长综合查询工具,中国站长【WWW.IIS7.COM】 | 裹包机|裹膜机|缠膜机|绕膜机-上海晏陵智能设备有限公司 | 潍坊大集网-潍坊信息港-潍坊信息网| 诗词大全-古诗名句 - 古诗词赏析 | 润滑油加盟_润滑油厂家_润滑油品牌-深圳市沃丹润滑科技有限公司 琉璃瓦-琉璃瓦厂家-安徽盛阳新型建材科技有限公司 | 提升海外网站流量,增加国外网站访客UV,定制海外IP-访客王 |