-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
SPARK 3.X綜合項目實戰(zhàn) 版權信息
- ISBN:9787302658030
- 條形碼:9787302658030 ; 978-7-302-65803-0
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
SPARK 3.X綜合項目實戰(zhàn) 本書特色
《Spark 3 x綜合項目實戰(zhàn)》力求做到每個任務都有可見的結果,給學生以成就感,激發(fā)學生繼續(xù)學習的熱情。每個任務的內
容適合一次課程完成。《Spark 3 x綜合項目實戰(zhàn)》注重實踐,突出應用與操作,既可作為高職高專院校、計算機培訓學校相關課程的教材
SPARK 3.X綜合項目實戰(zhàn) 內容簡介
《Spark 3 x綜合項目實戰(zhàn)》分為基礎篇、案例篇兩部分。在基礎篇(第1-2章)中首先介紹了Spark運行環(huán)境的搭建、Spark的生態(tài)體系、編程模型、Scala基本語法、高階函數、集合等方面的基礎知識;在案例篇(第3-7章)中的5個綜合案例詳實的介紹了如何使用Spark實現音樂、房地產、氣象、電商等領域大數據分析與挖掘的技巧。主要目的是通過Spark綜合應用項目,幫助讀者食味知髓,領悟Spark項目的精妙而步步漸悟,修煉成Spark高手。同時,本書還提供了詳細的實訓指導、數據源和程序代碼等配套資源。 《Spark 3 x綜合項目實戰(zhàn)》既可以作為普通高等院校大數據、計算機、人工智能等相關專業(yè)的本科生、研究生的實驗實訓教材,也可以作為大學生競賽、畢業(yè)論文的重要素材和參考讀物。同時,也可滿足數據分析從業(yè)人員及數據挖掘愛好者的需要。
SPARK 3.X綜合項目實戰(zhàn) 目錄
第1 章 Spark 概述 2
1.1 認識Spark 2
1.2 了解Spark 生態(tài)系統(tǒng) 3
1.3 Spark 環(huán)境安裝 4
1.3.1 安裝JDK 5
1.3.2 Hadoop 集群搭建 6
1.3.3 Spark 安裝及配置 9
1.4 Spark 初體驗 12
1.5 掌握Spark 編程模型 14
本章小結 16
本章練習 16
第2 章 Spark 基礎 17
2.1 Scala 初識 17
2.1.1 學習使用Scala 解釋器 18
2.1.2 Scala 變量定義 18
2.1.3 Scala 數據類型 19
2.1.4 Scala 算術運算符 20
2.1.5 Scala 關系運算符 21
2.1.6 Scala 邏輯運算符 22
2.1.7 Scala 選擇結構 22
2.1.8 Scala 循環(huán)結構 23
2.1.9 Scala 數組 25
2.1.10 Scala 函數 26
2.1.11 Scala 元組 30
2.1.12 Scala 集合 30
2.2 計算淡旺季飛機票的價格 36
2.3 按班級計算學生平均分 37
2.4 計算城市氣溫的均值 38
本章小結 38
本章練習 39
案 例 篇
第3 章 流行音樂數據分析 42
3.1 項目背景 42
3.2 分析任務 42
3.3 技術準備 43
3.3.1 實驗環(huán)境 43
3.3.2 Spark RDD 43
3.3.3 Spark 編程入門 49
3.3.4 Spark 運行架構 53
3.3.5 Spark 運行模式 53
3.4 任務實現 58
3.4.1 數據源 58
3.4.2 架構設計 59
3.4.3 設計思路 60
3.4.4 數據分析 61
3.4.5 可視化展示 68
3.5 部署運行 74
本章小結 77
本章練習 77
第4 章 區(qū)域性房屋交易數據分析 79
4.1 項目背景 79
4.2 分析任務 79
4.3 技術準備 80
4.3.1 實驗環(huán)境 80
4.3.2 Spark SQL 80
4.4 任務實現 88
4.4.1 數據源 88
4.4.2 架構設計 89
4.4.3 設計思路 91
4.4.4 統(tǒng)計分析 91
4.4.5 可視化展示 96
4.5 部署運行 105
本章小結 107
本章練習 107
第5 章 基于數據挖掘的氣象分析 109
5.1 項目背景 109
5.2 分析任務 109
5.3 技術準備 109
5.3.1 實驗環(huán)境 109
5.3.2 HBase 110
5.3.3 Spark MLlib 機器學習 118
5.4 任務實現 122
5.4.1 數據源導入HBase 122
5.4.2 架構設計 124
5.4.3 設計思路 125
5.4.4 數據分析 125
5.4.5 可視化展示 131
5.4.6 氣溫預測分析 135
5.5 部署運行 140
本章小結 141
本章練習 141
第6 章 基于廣告流量數據的實時分析 143
6.1 項目背景 143
6.2 實現任務 143
6.3 技術準備 144
6.3.1 實驗環(huán)境 144
6.3.2 Kafka 144
6.3.3 Spark Streaming 149
6.3.4 Spark Streaming 整合Kafka 操作 151
6.4 任務實現 152
6.4.1 數據源 152
6.4.2 架構設計 153
6.4.3 設計思路 154
6.4.4 數據實時發(fā)送 154
6.4.5 實時分析 158
6.4.6 可視化展示 165
6.5 部署運行 169
本章小結 170
本章練習 171
第7 章 基于多元分析的電影智能推薦系統(tǒng) 172
7.1 項目背景 172
7.2 實現任務 172
7.3 技術準備 172
7.3.1 實驗環(huán)境 172
7.3.2 交替*小二乘推薦算法 173
7.4 過程實現 175
7.4.1 架構設計 175
7.4.2 設計思路 176
7.4.3 電影數據分析 176
7.4.4 電影智能推薦 181
7.5 部署與運行 187
本章小結 188
本章練習 188
參考文獻 190
SPARK 3.X綜合項目實戰(zhàn) 作者簡介
馬衛(wèi)花,西安五潤信息技術有限公司項目經理,高級工程師。主持參與銀行、旅游、交通等多個大型企業(yè)項目和大數據項目的研發(fā),主要研究方向為大數據、移動開發(fā)、項目管理等,承擔眾多985和211學校的大數據和人工智能的實踐課程的實習實訓。 張文勝,西安歐亞學院教師,副教授。主要研究方向為移動應用開發(fā),大數據等,主持多項省部級項目,主編教材10余部。 段毅,西安電子科技大學教師,副教授,軟件工程碩士,具有二十余年軟件工程實踐教學工作經驗,主要研究方向為軟件工程,大數據,指導學生參加ACM-ICPC等程序設計類競賽獲得國際國內金銀獎多項。
- >
煙與鏡
- >
隨園食單
- >
苦雨齋序跋文-周作人自編集
- >
我從未如此眷戀人間
- >
羅曼·羅蘭讀書隨筆-精裝
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
月亮虎
- >
上帝之肋:男人的真實旅程