中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 Spark大數據處理與分析

作者:雷擎
出版社:清華大學出版社出版時間:2020-11-01
開本: 其他 頁數: 600
中 圖 價:¥63.7(5.0折) 定價  ¥128.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Spark大數據處理與分析 版權信息

Spark大數據處理與分析 本書特色

介紹大數據發展趨勢和基于Spark的生態環境,全面系統地提供Spark開發的基礎知識,提供基于Docker容器開發環境和編程實例,引導Spark技術學習者快速入門,系統的掌握Spark的編程技術。

Spark大數據處理與分析 內容簡介

本書是Spark技術入門的基礎類書籍,通過本書的學習實驗可以牢固掌握Spark編程技術的基本概念、原理和編程方法,能夠進行應用程序的實際開發。

Spark大數據處理與分析 目錄

第1章Spark生態環境/1

1.1平臺設計1

1.2Spark簡介5

1.2.1技術特性6

1.2.2數據格式9

1.2.3編程語言12

1.3虛擬環境18

1.3.1發展歷史19

1.3.2技術特征20

1.3.3技術架構21

1.3.4管理命令24

1.4HBase技術30

1.4.1系統架構31

1.4.2存儲機制33

1.4.3常用命令35

1.5環境部署46

1.6小結46

第2章理解Spark/47

2.1數據處理48

2.1.1MapReduce48

2.1.2工作機制51

2.2認識RDD54

2.3操作RDD57

2.3.1轉換57

2.3.2動作62

2.4Scala編程66

2.4.1面向對象編程66

2.4.2函數式編程83

2.4.3集合類88

2.5案例分析96

2.5.1啟動交換界面97

2.5.2SparkContext和

SparkSession98

2.5.3加載數據99

2.5.4應用操作100

2.5.5緩存處理103

2.6小結106

第3章鍵值對與分區/107

3.1鍵值對RDD107

3.1.1創建108

3.1.2轉換111

3.1.3動作123

3.2分區和洗牌124

3.2.1分區125

3.2.2洗牌131

3.3共享變量133

3.3.1廣播變量133

3.3.2累加器136

3.4Scala高級語法139

3.4.1高階函數139

3.4.2泛型類145

3.4.3隱式轉換150

3.5案例分析152

3.5.1檢查事件數據153

3.5.2reduceByKey和

groupByKey155

3.5.3三種連接轉換159

3.5.4執行幾個動作161

3.5.5跨節點分區162

3.6小結164

第4章關系型數據處理/166

4.1Spark SQL概述167

4.1.1Catalyst優化器168

4.1.2DataFrame與

DataSet169

4.1.3創建結構化數據171

4.2結構化數據操作181

4.2.1選取列182

4.2.2選擇語句(select、

selectExpr)184

4.2.3操作列(withColumn、

withColumnRenamed、

drop)186

4.2.4條件語句(where、

filter)187

4.2.5去除重復(distinct、

dropDuplicates)189

4.2.6排序語句(sort、

orderBy)190

4.2.7操作多表(union、

join)191

4.2.8聚合操作198

4.2.9用戶定義函數202

4.3案例分析204

4.3.1創建DataFrame

204

4.3.2操作DataFrame

209

4.3.3按年份組合211

4.4小結213

第5章數據流的操作/214

5.1處理范例215

5.1.1至少一次215

5.1.2*多一次216

5.1.3恰好一次216

5.2理解時間218

5.3離散化流219

5.3.1一個例子220

5.3.2StreamingContext

222

5.3.3輸入流223

5.4離散流的操作228

5.4.1基本操作229

5.4.2transform230

5.4.3連接操作232

5.4.4SQL操作232

5.4.5輸出操作233

5.4.6窗口操作235

5.4.7有狀態轉換237

5.5結構化流242

5.5.1一個例子242

5.5.2工作機制245

5.5.3窗口操作251

5.6案例分析255

5.6.1探索數據256

5.6.2創建數據流260

5.6.3轉換操作267

5.6.4窗口操作268

5.7小結271

〖1〗Spark大數據處理與分析目錄〖3〗〖3〗第6章分布式的圖處理/272

6.1理解圖的概念272

6.2圖并行系統276

6.3一個例子279

6.4創建和探索圖283

6.4.1屬性圖284

6.4.2構建器287

6.4.3創建圖288

6.4.4探索圖296

6.5圖運算符298

6.5.1屬性運算符300

6.5.2結構運算符301

6.5.3聯結運算符305

6.5.4點和邊操作311

6.5.5收集相鄰信息314

6.6Pregel317

6.6.1一個例子318

6.6.2Pregel運算符320

6.6.3標簽傳播算法321

6.6.4PageRank算法322

6.7案例分析325

6.7.1定義點326

6.7.2定義邊328

6.7.3創建圖329

6.7.4PageRank331

6.7.5Pregel332

6.8小結334

第7章機器學習/335

7.1MLlib335

7.2數據類型336

7.2.1局部向量336

7.2.2標簽向量337

7.2.3局部矩陣338

7.2.4分布矩陣340

7.3統計基礎344

7.3.1相關分析344

7.3.2假設檢驗346

7.3.3摘要統計347

7.4算法概述348

7.4.1有監督學習349

7.4.2無監督學習350

7.4.3多種算法介紹351

7.4.4協同過濾353

7.5交叉驗證354

7.6機器學習管道355

7.6.1概念介紹356

7.6.2Spark管道357

7.6.3模型選擇364

7.7實例分析371

7.7.1預測用戶偏好371

7.7.2分析飛行延誤377

7.8小結384

第8章特征工程/385

8.1特征提取385

8.1.1TFIDF385

8.1.2Word2Vec388

8.1.3CountVectorizer

390

8.2特征轉換392

8.2.1Tokenizer392

8.2.2StopWordsRemover

394

8.2.3ngram395

8.2.4Binarizer396

8.2.5PCA396

8.2.6PolynomialExpansion

397

8.2.7Discrete Cosine

Transform398

8.2.8StringIndexer400

8.2.9IndexToString402

8.2.10OneHotEncoder

405

8.2.11VectorIndexer406

8.2.12Interaction408

8.2.13Normalizer411

8.2.14StandardScaler

413

8.2.15MinMaxScaler415

8.2.16MaxAbsScaler417

8.2.17Bucketizer418

8.2.18ElementwiseProduct

419

8.2.19SQLTransformer

420

8.2.20VectorAssembler

421

8.2.21QuantileDiscretizer

423

8.2.22Imputer424

8.3特征選擇426

8.3.1VectorSlicer426

8.3.2RFormula428

8.3.3ChiSqSelector430

8.4局部敏感哈希433

8.4.1局部敏感哈希

操作433

8.4.2局部敏感哈希

算法434

8.5小結439

第9章算法匯總/440

9.1決策樹和集成樹440

9.1.1決策樹440

9.1.2集成樹447

9.2分類和回歸461

9.2.1線性方法462

9.2.2分類463

9.2.3回歸487

9.3聚集505

9.3.1K均值505

9.3.2潛在狄利克雷

分配506

9.3.3二分K均值509

9.3.4高斯混合模型510

9.4小結512第10章Spark應用程序/513

10.1SparkContext與

SparkSession513

10.2構建應用519

10.3部署應用527

10.3.1集群架構531

10.3.2集群管理534

10.4小結542

第11章監視和優化/543

11.1工作原理543

11.1.1依賴關系544

11.1.2劃分階段547

11.1.3實例分析548

11.2洗牌機制553

11.3內存管理555

11.4優化策略558

11.4.1數據序列化558

11.4.2內存調優559

11.4.3其他方面561

11.5*佳實踐563

11.5.1系統配置563

11.5.2程序調優569

11.6案例分析576

11.6.1執行模型576

11.6.2監控界面578

11.6.3調試優化583

11.7小結585

參考文獻/586


展開全部

Spark大數據處理與分析 作者簡介

雷擎,對外經濟貿易大學教師,中國科學院計算技術研究所博士

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 高精度电阻回路测试仪-回路直流电阻测试仪-武汉特高压电力科技有限公司 | 校园文化空间设计-数字化|中医文化空间设计-党建|法治廉政主题文化空间施工-山东锐尚文化传播公司 | 压滤机滤板_厢式_隔膜_板框压滤机滤板厂家价格型号材质-大凯环保 | 锯边机,自动锯边机,双面涂胶机-建业顺达机械有限公司 | 锤式粉碎机,医药粉碎机,锥式粉碎机-无锡市迪麦森机械制造有限公司 | 真石漆,山东真石漆,真石漆厂家,真石漆价格-山东新佳涂料有限公司 | 铆钉机|旋铆机|东莞旋铆机厂家|鸿佰专业生产气压/油压/自动铆钉机 | 浩方智通 - 防关联浏览器 - 跨境电商浏览器 - 云雀浏览器 | 仿真茅草_人造茅草瓦价格_仿真茅草厂家_仿真茅草供应-深圳市科佰工贸有限公司 | 医疗仪器模块 健康一体机 多参数监护仪 智慧医疗仪器方案定制 血氧监护 心电监护 -朗锐慧康 | 高压直流电源_特种变压器_变压器铁芯-希恩变压器定制厂家 | 淬火设备-钎焊机-熔炼炉-中频炉-锻造炉-感应加热电源-退火机-热处理设备-优造节能 | 耙式干燥机_真空耙式干燥机厂家-无锡鹏茂化工装备有限公司 | 密集架-密集柜厂家-智能档案密集架-自动选层柜订做-河北风顺金属制品有限公司 | 打孔器,打孔钳厂家【温州新星德牌五金工具】 | 智能电表|预付费ic卡水电表|nb智能无线远传载波电表-福建百悦信息科技有限公司 | 德州网站开发定制-小程序开发制作-APP软件开发-「两山开发」 | 电销卡_北京电销卡_包月电话卡-豪付网络| 高精度-恒温冷水机-螺杆式冰水机-蒸发冷冷水机-北京蓝海神骏科技有限公司 | 断桥铝破碎机_铝合金破碎机_废铁金属破碎机-河南鑫世昌机械制造有限公司 | 步进电机_agv电机_伺服马达-伺服轮毂电机-和利时电机 | 南京交通事故律师-专打交通事故的南京律师 | 工业制氮机_psa制氮机厂家-宏骁智能装备科技江苏有限公司 | 博客-悦享汽车品质生活| 阿尔法-MDR2000无转子硫化仪-STM566 SATRA拉力试验机-青岛阿尔法仪器有限公司 | 真石漆,山东真石漆,真石漆厂家,真石漆价格-山东新佳涂料有限公司 | 小型气象站_便携式自动气象站_校园气象站-竞道气象设备网 | 运动木地板_体育木地板_篮球馆木地板_舞台木地板-实木运动地板厂家 | LOGO设计_品牌设计_VI设计 - 特创易 | 钢托盘,铁托盘,钢制托盘,镀锌托盘,饲料托盘,钢托盘制造商-南京飞天金属13260753852 | 新能源汽车电池软连接,铜铝复合膜柔性连接,电力母排-容发智能科技(无锡)有限公司 | HV全空气系统_杭州暖通公司—杭州斯培尔冷暖设备有限公司 | 台湾阳明固态继电器-奥托尼克斯光电传感器-接近开关-温控器-光纤传感器-编码器一级代理商江苏用之宜电气 | 北京森语科技有限公司-模型制作专家-展览展示-沙盘模型设计制作-多媒体模型软硬件开发-三维地理信息交互沙盘 | 锯边机,自动锯边机,双面涂胶机-建业顺达机械有限公司 | 定量包装秤,吨袋包装称,伸缩溜管,全自动包装秤,码垛机器人,无锡市邦尧机械工程有限公司 | 欧景装饰设计工程有限公司-无锡欧景装饰官网 | 活性炭-蜂窝-椰壳-柱状-粉状活性炭-河南唐达净水材料有限公司 | MVE振动电机_MVE震动电机_MVE卧式振打电机-河南新乡德诚生产厂家 | 电动不锈钢套筒阀-球面偏置气动钟阀-三通换向阀止回阀-永嘉鸿宇阀门有限公司 | 塑料瓶罐_食品塑料瓶_保健品塑料瓶_调味品塑料瓶–东莞市富慷塑料制品有限公司 |