中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
SPARK大數(shù)據(jù)技術(shù)與應(yīng)用/趙紅艷

包郵 SPARK大數(shù)據(jù)技術(shù)與應(yīng)用/趙紅艷

出版社:人民郵電出版社出版時間:2018-08-01
開本: 其他 頁數(shù): 132
本類榜單:教材銷量榜
中 圖 價:¥24.9(6.3折) 定價  ¥39.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

SPARK大數(shù)據(jù)技術(shù)與應(yīng)用/趙紅艷 版權(quán)信息

SPARK大數(shù)據(jù)技術(shù)與應(yīng)用/趙紅艷 本書特色

本書是關(guān)于大數(shù)據(jù)和Spark的實用手冊。它將助你學(xué)習(xí)如何用Spark來完成很多大數(shù)據(jù)分析任務(wù),其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進(jìn)行交互式數(shù)據(jù)分析、如何編寫Spark應(yīng)用、如何在Spark中對大規(guī)模數(shù)據(jù)進(jìn)行交互分析、如何使用SparkStreaming處理高速數(shù)據(jù)流、如何使用Spark進(jìn)行機(jī)器學(xué)習(xí)、如何使用Spark進(jìn)行圖處理如何監(jiān)控Spark應(yīng)用等。

SPARK大數(shù)據(jù)技術(shù)與應(yīng)用/趙紅艷 內(nèi)容簡介

本書是關(guān)于大數(shù)據(jù)和Spark的實用手冊。它將助你學(xué)習(xí)如何用Spark來完成很多大數(shù)據(jù)分析任務(wù),其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進(jìn)行交互式數(shù)據(jù)分析、如何編寫Spark應(yīng)用、如何在Spark中對大規(guī)模數(shù)據(jù)進(jìn)行交互分析、如何使用SparkStreaming處理高速數(shù)據(jù)流、如何使用Spark進(jìn)行機(jī)器學(xué)習(xí)、如何使用Spark進(jìn)行圖處理如何監(jiān)控Spark應(yīng)用等。

SPARK大數(shù)據(jù)技術(shù)與應(yīng)用/趙紅艷 目錄

第1章 Spark簡介與運行原理 1

1.1 Spark是什么 1

1.1.1 Spark的版本發(fā)展歷程 2

1.1.2 Spark與Hadoop的區(qū)別與聯(lián)系 2

1.1.3 Spark的應(yīng)用場景 3

1.2 Spark的生態(tài)系統(tǒng) 3

1.3 Spark的架構(gòu)與原理 4

1.3.1 Spark架構(gòu)設(shè)計 4

1.3.2 Spark作業(yè)運行流程 5

1.3.3 Spark分布式計算流程 6

1.4 Spark 2.X新特性 6

1.4.1 精簡的API 6

1.4.2 Spark作為編譯器 7

1.4.3 智能化程度 7

1.5 小結(jié) 7

習(xí)題 8

第2章 Spark的環(huán)境搭建 9

2.1 環(huán)境搭建前的準(zhǔn)備 9

2.2 Spark相關(guān)配置 13

2.2.1 安裝SSH 13

2.2.2 SSH免密碼登錄 14

2.2.3 修改訪問權(quán)限 15

2.2.4 修改profile文件 15

2.2.5 修改Spark配置文件 16

2.3 Spark集群啟動與關(guān)閉 17

2.4 Spark應(yīng)用提交到集群 18

2.5 Spark Web監(jiān)控頁面 19

2.6 小結(jié) 20

習(xí)題 20

第3章 使用Python開發(fā)Spark應(yīng)用 21

3.1 Python編程語言 21

3.1.1 Python語言介紹 21

3.1.2 PySpark是什么 22

3.2 PySpark的啟動與日志設(shè)置 22

3.2.1 PySpark的啟動方式 22

3.2.2 日志輸出內(nèi)容控制 24

3.3 PySpark開發(fā)包的安裝 24

3.3.1 使用pip命令安裝 24

3.3.2 使用離線包安裝 25

3.4 使用PyCharm編寫Spark應(yīng)用 25

3.4.1 PyCharm的安裝與基本配置 25

3.4.2 編寫Spark應(yīng)用 27

3.5 小結(jié) 29

習(xí)題 30

第4章 Spark RDD 31

4.1 彈性分布式數(shù)據(jù)集 31

4.1.1 RDD的定義 31

4.1.2 RDD的特點 32

4.1.3 RDD的創(chuàng)建 33

4.1.4 RDD的操作 34

4.2 transform算子 34

4.2.1 map轉(zhuǎn)換 34

4.2.2 flatMap轉(zhuǎn)換 35

4.2.3 filter轉(zhuǎn)換 35

4.2.4 union轉(zhuǎn)換 35

4.2.5 intersection轉(zhuǎn)換 36

4.2.6 distinct轉(zhuǎn)換 36

4.2.7 sortBy轉(zhuǎn)換 36

4.2.8 mapPartitions轉(zhuǎn)換 36

4.2.9 mapPartitionsWithIndex轉(zhuǎn)換 37

4.2.10 partitionBy轉(zhuǎn)換 37

4.3 action算子 37

4.3.1 reduce(f)動作 37

4.3.2 collect( )動作 38

4.3.3 count( )動作 38

4.3.4 take(num)動作 39

4.3.5 first( )動作 39

4.3.6 top(num)動作 39

4.3.7 saveAsTextFile( )動作 39

4.3.8 foreach(f)動作 40

4.3.9 foreachPartition(f)動作 40

4.4 RDD Key-Value轉(zhuǎn)換算子 41

4.4.1 mapValues(f)操作 41

4.4.2 flatMapValues(f)操作 41

4.4.3 combineByKey操作 41

4.4.4 reduceByKey操作 42

4.4.5 groupByKey操作 42

4.4.6 sortByKey操作 43

4.4.7 keys( )操作 43

4.4.8 values( )操作 43

4.4.9 join操作 43

4.4.10 leftOuterJoin操作 43

4.4.11 rightOuterJoin操作 44

4.5 RDD Key-Value動作運算 44

4.5.1 collectAsMap( )操作 44

4.5.2 countByKey( )操作 44

4.6 共享變量 45

4.6.1 累加器 45

4.6.2 廣播變量 45

4.7 依賴關(guān)系 47

4.7.1 血統(tǒng) 47

4.7.2 寬依賴與窄依賴 47

4.7.3 shuffle 48

4.7.4 DAG的生成 49

4.8 Spark RDD的持久化 50

4.8.1 持久化使用方法 50

4.8.2 持久化存儲等級 51

4.8.3 檢查點 52

4.9 小結(jié) 52

習(xí)題 52

第5章 DataFrame與Spark SQL 54

5.1 DataFrame 54

5.1.1 DataFrame介紹 54

5.1.2 DataFrame創(chuàng)建 55

5.2 Spark SQL 56

5.2.1 Spark SQL介紹 56

5.2.2 Spark SQL的執(zhí)行原理 57

5.2.3 Spark SQL的創(chuàng)建 58

5.3 Spark SQL、DataFrame的常用操作 61

5.3.1 字段計算 61

5.3.2 條件查詢 62

5.3.3 數(shù)據(jù)排序 63

5.3.4 數(shù)據(jù)去重 63

5.3.5 數(shù)據(jù)分組統(tǒng)計 64

5.3.6 數(shù)據(jù)連接 65

5.3.7 數(shù)據(jù)繪圖 67

5.4 小結(jié) 68

習(xí)題 69

第6章 Spark Streaming 70

6.1 Spark Streaming介紹 70

6.1.1 什么是Spark Streaming 70

6.1.2 Spark Streaming工作原理 70

6.2 流數(shù)據(jù)加載 71

6.2.1 初始化StreamingContext 71

6.2.2 Discretized Stream離散化流 71

6.2.3 Spark Streaming數(shù)據(jù)源 72

6.3 DStream輸出操作 73

6.4 DStream轉(zhuǎn)換操作 75

6.4.1 map轉(zhuǎn)換 75

6.4.2 flatMap轉(zhuǎn)換 76

6.4.3 filter轉(zhuǎn)換 76

6.4.4 reduceByKey轉(zhuǎn)換 77

6.4.5 count轉(zhuǎn)換 77

6.4.6 updateStateByKey轉(zhuǎn)換 77

6.4.7 其他轉(zhuǎn)換 78

6.5 DataFrame與SQL操作 78

6.6 實時WordCount實驗 79

6.7 小結(jié) 81

習(xí)題 81

第7章 Spark機(jī)器學(xué)習(xí)庫 82

7.1 Spark機(jī)器學(xué)習(xí)庫 82

7.1.1 機(jī)器學(xué)習(xí)簡介 82

7.1.2 Spark機(jī)器學(xué)習(xí)庫的構(gòu)成 82

7.2 準(zhǔn)備數(shù)據(jù) 83

7.2.1 獲取數(shù)據(jù) 83

7.2.2 數(shù)據(jù)預(yù)處理 84

7.2.3 數(shù)據(jù)探索 84

7.3 使用MLlib機(jī)器學(xué)習(xí)庫 85

7.3.1 搭建環(huán)境 85

7.3.2 加載數(shù)據(jù) 86

7.3.3 探索數(shù)據(jù) 89

7.3.4 預(yù)測嬰兒生存機(jī)會 92

7.4 使用ML機(jī)器學(xué)習(xí)庫 93

7.4.1 轉(zhuǎn)換器、評估器和管道 94

7.4.2 預(yù)測嬰兒生存率 95

7.5 小結(jié) 97

習(xí)題 97

第8章 GraphFrames圖計算 98

8.1 圖 98

8.1.1 度 99

8.1.2 路徑和環(huán) 99

8.1.3 二分圖 100

8.1.4 多重圖和偽圖 100

8.2 GraphFrames介紹 101

8.2.1 應(yīng)用背景 101

8.2.2 GraphFrames庫 102

8.2.3 使用GraphFrames庫 102

8.3 GraphFrame編程模型 102

8.3.1 GraphFrame實例 103

8.3.2 視圖和圖操作 104

8.3.3 模式發(fā)現(xiàn) 105

8.3.4 圖加載和保存 105

8.4 GraphFrames實現(xiàn)的算法 106

8.4.1 廣度優(yōu)先搜索 106

8.4.2 *短路徑 106

8.4.3 三角形計數(shù) 107

8.4.4 連通分量 107

8.4.5 標(biāo)簽傳播算法 108

8.4.6 PageRank算法 109

8.5 基于GraphFrames的網(wǎng)頁排名 110

8.5.1 準(zhǔn)備數(shù)據(jù)集 110

8.5.2 創(chuàng)建GraphFrames 111

8.5.3 使用PageRank進(jìn)行網(wǎng)頁排名 111

8.6 小結(jié) 111

習(xí)題 111

第9章 出租車數(shù)據(jù)分析 112

9.1 數(shù)據(jù)處理 112

9.2 數(shù)據(jù)分析 113

9.2.1 創(chuàng)建DataFrame 113

9.2.2 KMeans聚類分析 114

9.3 百度地圖可視化 115

9.3.1 申請地圖key 115

9.3.2 聚類結(jié)果可視化 116

9.4 小結(jié) 117

第10章 圖書推薦系統(tǒng) 118

10.1 Django簡介 118

10.1.1 Django是什么 118

10.1.2 ORM模型 119

10.1.3 Django模板 119

10.1.4 View視圖 120

10.2 Django項目搭建 121

10.2.1 創(chuàng)建項目 121

10.2.2 創(chuàng)建應(yīng)用 122

10.2.3 創(chuàng)建模型 122

10.3 推薦引擎設(shè)計 124

10.3.1 導(dǎo)入數(shù)據(jù) 124

10.3.2 訓(xùn)練模型 126

10.3.3 圖書推薦 127

10.4 系統(tǒng)設(shè)計與實現(xiàn) 128

10.4.1 Bootstrap介紹與使用 128

10.4.2 Redis數(shù)據(jù)庫安裝與使用 129

10.4.3 視圖與路由設(shè)計 130

10.5 小結(jié) 132

展開全部

SPARK大數(shù)據(jù)技術(shù)與應(yīng)用/趙紅艷 作者簡介

許桂秋,計算機(jī)學(xué)士,工商管理碩士。 2009年-2012年,中國石油天然氣股份有限公司,負(fù)責(zé)項目管理工作,企業(yè)內(nèi)部高級講師; 2012年-2015年,曙光信息產(chǎn)業(yè)股份有限公司,負(fù)責(zé)項目管理與企業(yè)內(nèi)部培訓(xùn)工作,企業(yè)內(nèi)部高級講師; 2016年至今,曙光瑞翼教育合作中心,教學(xué)運營總監(jiān),負(fù)責(zé)各高校合作項目部的具體運營管理及指導(dǎo)工作。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 披萨石_披萨盘_电器家电隔热绵加工定制_佛山市南海区西樵南方综合保温材料厂 | 沥青灌缝机_路面灌缝机_道路灌缝机_沥青灌缝机厂家_济宁萨奥机械有限公司 | 承插管件_不锈钢承插管件_锻钢高压管件-温州科正阀门管件有限公司 | 中开泵,中开泵厂家,双吸中开泵-山东博二泵业有限公司 | 焊接烟尘净化器__焊烟除尘设备_打磨工作台_喷漆废气治理设备 -催化燃烧设备 _天津路博蓝天环保科技有限公司 | 网站建设-高端品牌网站设计制作一站式定制_杭州APP/微信小程序开发运营-鼎易科技 | TPE_TPE热塑性弹性体_TPE原料价格_TPE材料厂家-惠州市中塑王塑胶制品公司- 中塑王塑胶制品有限公司 | 锥形螺带干燥机(新型耙式干燥机)百科-常州丰能干燥工程 | 高铝矾土熟料_细粉_骨料_消失模_铸造用铝矾土_铝酸钙粉—嵩峰厂家 | 软瓷_柔性面砖_软瓷砖_柔性石材_MCM软瓷厂家_湖北博悦佳软瓷 | 六维力传感器_六分量力传感器_模腔压力传感器-南京数智微传感科技有限公司 | 开云(中国)Kaiyun·官方网站-登录入口| 培训中心-翰香原香酥板栗饼加盟店总部-正宗板栗酥饼技术 | 广州展台特装搭建商|特装展位设计搭建|展会特装搭建|特装展台制作设计|展览特装公司 | 超声波气象站_防爆气象站_空气质量监测站_负氧离子检测仪-风途物联网 | 传动滚筒_厂家-淄博海恒机械制造厂 | [官网]叛逆孩子管教_戒网瘾学校_全封闭问题青少年素质教育_新起点青少年特训学校 | 深圳VI设计-画册设计-LOGO设计-包装设计-品牌策划公司-[智睿画册设计公司] | 双工位钻铣攻牙机-转换工作台钻攻中心-钻铣攻牙机一体机-浙江利硕自动化设备有限公司 | 杭州顺源过滤机械有限公司官网-压滤机_板框压滤机_厢式隔膜压滤机厂家 | 南溪在线-南溪招聘找工作、找房子、找对象,南溪综合生活信息门户! | SOUNDWELL 编码器|电位器|旋转编码器|可调电位器|编码开关厂家-广东升威电子制品有限公司 | 济南宣传册设计-画册设计_济南莫都品牌设计公司 | 北京开源多邦科技发展有限公司官网| LED太阳能中国结|发光红灯笼|灯杆造型灯|节日灯|太阳能灯笼|LED路灯杆装饰造型灯-北京中海轩光电 | 刹车盘机床-刹车盘生产线-龙口亨嘉智能装备 | 400电话_400电话申请_888元包年_400电话办理服务中心_400VIP网 | 智慧农业|农业物联网|现代农业物联网-托普云农物联网官方网站 | 上海阳光泵业制造有限公司 -【官方网站】| 披萨石_披萨盘_电器家电隔热绵加工定制_佛山市南海区西樵南方综合保温材料厂 | 裹包机|裹膜机|缠膜机|绕膜机-上海晏陵智能设备有限公司 | ge超声波测厚仪-电动涂膜机-电动划格仪-上海洪富 | 金属清洗剂,防锈油,切削液,磨削液-青岛朗力防锈材料有限公司 | 户外-组合-幼儿园-不锈钢-儿童-滑滑梯-床-玩具-淘气堡-厂家-价格 | 退火炉,燃气退火炉,燃气热处理炉生产厂家-丹阳市丰泰工业炉有限公司 | 自清洗过滤器-全自动自清洗过反冲洗过滤器 - 中乂(北京)科技有限公司 | 江苏皓越真空设备有限公司 | 安徽净化板_合肥岩棉板厂家_玻镁板厂家_安徽科艺美洁净科技有限公司 | 双吸泵,双吸泵厂家,OS双吸泵-山东博二泵业有限公司 | 专业广州网站建设,微信小程序开发,一物一码和NFC应用开发、物联网、外贸商城、定制系统和APP开发【致茂网络】 | 月嫂_保姆_育婴_催乳_母婴护理_产后康复_养老护理-吉祥到家家政 硫酸亚铁-聚合硫酸铁-除氟除磷剂-复合碳源-污水处理药剂厂家—长隆科技 |