-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
大數(shù)據(jù)開發(fā)項目實戰(zhàn) 版權(quán)信息
- ISBN:9787115598042
- 條形碼:9787115598042 ; 978-7-115-59804-2
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
大數(shù)據(jù)開發(fā)項目實戰(zhàn) 本書特色
適讀人群 :本書可以作為高校大數(shù)據(jù)技術(shù)類專業(yè)的大數(shù)據(jù)項目實訓(xùn)課程的教材,也可以作為大數(shù)據(jù)技術(shù)愛好者的自學(xué)用書。1. 以任務(wù)為導(dǎo)向,實現(xiàn)大數(shù)據(jù)項目開發(fā)全流程操作 2. 隨書附帶案例數(shù)據(jù)及代碼,方便讀者系統(tǒng)學(xué)習(xí)并動手實踐 3. 實現(xiàn)企業(yè)實際項目,綜合性強 4. 包括數(shù)據(jù)采集、數(shù)據(jù)分析、數(shù)據(jù)存儲、數(shù)據(jù)可視化等多個模塊
大數(shù)據(jù)開發(fā)項目實戰(zhàn) 內(nèi)容簡介
本書以項目案例為導(dǎo)向,貫穿講解一個大數(shù)據(jù)的實戰(zhàn)項目:廣電大數(shù)據(jù)用戶畫像。全書共8章,具體內(nèi)容包括大數(shù)據(jù)項目概述、Hadoop生態(tài)組件基礎(chǔ)、廣電大數(shù)據(jù)用戶畫像——需求分析、廣電大數(shù)據(jù)用戶畫像——數(shù)據(jù)采集與預(yù)處理、廣電大數(shù)據(jù)用戶畫像——實時統(tǒng)計訂單信息、廣電大數(shù)據(jù)用戶畫像——用戶標簽計算與可視化、廣電大數(shù)據(jù)用戶畫像——任務(wù)調(diào)度實現(xiàn)、基于TipDM大數(shù)據(jù)挖掘建模平臺實現(xiàn)廣電大數(shù)據(jù)用戶畫像。本書從項目需求探索、技術(shù)選型、架構(gòu)設(shè)計、集群安裝部署與集成開發(fā)以及項目開發(fā)進行實戰(zhàn)講解,有助于讀者綜合運用大數(shù)據(jù)技術(shù)知識和各種工具軟件,實現(xiàn)大數(shù)據(jù)項目開發(fā)全流程操作。 本書可以作為高校大數(shù)據(jù)技術(shù)類專業(yè)的大數(shù)據(jù)項目實訓(xùn)課程的教材,也可以作為大數(shù)據(jù)技術(shù)愛好者的自學(xué)用書。
大數(shù)據(jù)開發(fā)項目實戰(zhàn) 目錄
學(xué)習(xí)目標 1
1.1 企業(yè)大數(shù)據(jù)項目簡介 1
1.1.1 數(shù)據(jù)處理流程 1
1.1.2 架構(gòu)分析 2
1.1.3 人員安排 5
1.2 大數(shù)據(jù)項目實戰(zhàn)基礎(chǔ) 5
1.2.1 實戰(zhàn)環(huán)境 5
1.2.2 涉及的技術(shù)及需掌握的能力 11
小結(jié) 20
第 2章 Hadoop生態(tài)組件基礎(chǔ) 21
學(xué)習(xí)目標 21
2.1 Hadoop基礎(chǔ) 21
2.1.1 Hadoop概述 21
2.1.2 Hadoop集群安裝與配置 25
2.1.3 Hadoop框架組成 36
2.1.4 Hadoop應(yīng)用實踐 42
2.2 Hive基礎(chǔ) 45
2.2.1 Hive概述 45
2.2.2 Hive安裝與配置 46
2.2.3 Hive體系架構(gòu) 50
2.2.4 Hive應(yīng)用實踐 54
2.3 Spark基礎(chǔ) 58
2.3.1 Spark概述 59
2.3.2 Spark集群安裝與配置 63
2.3.3 Spark集群架構(gòu) 66
2.3.4 Spark應(yīng)用實踐 67
小結(jié) 69
第3章 廣電大數(shù)據(jù)用戶畫像——需求分析 70
學(xué)習(xí)目標 70
3.1 項目需求 70
3.1.1 項目背景 70
3.1.2 項目目標 71
3.2 需求探索 71
3.2.1 數(shù)據(jù)說明 71
3.2.2 基礎(chǔ)探索 76
3.2.3 業(yè)務(wù)需求探索 84
3.3 技術(shù)方案 96
3.3.1 技術(shù)選型 96
3.3.2 系統(tǒng)架構(gòu) 98
小結(jié) 99
第4章 廣電大數(shù)據(jù)用戶畫像——數(shù)據(jù)采集與預(yù)處理 101
學(xué)習(xí)目標 101
4.1 業(yè)務(wù)數(shù)據(jù) 101
4.1.1 生產(chǎn)數(shù)據(jù)來源 101
4.1.2 模擬產(chǎn)生業(yè)務(wù)數(shù)據(jù) 102
4.2 數(shù)據(jù)存儲與傳輸 119
4.2.1 Elasticsearch數(shù)據(jù)傳輸?shù)紿ive 119
4.2.2 用戶畫像標簽結(jié)果保存到MySQL 133
4.3 基礎(chǔ)數(shù)據(jù)預(yù)處理 135
小結(jié) 141
第5章 廣電大數(shù)據(jù)用戶畫像——實時統(tǒng)計訂單信息 142
學(xué)習(xí)目標 142
5.1 實時統(tǒng)計目標 142
5.2 Kafka安裝和配置 142
5.3 實時統(tǒng)計訂單信息 144
5.3.1 模擬產(chǎn)生訂單實時數(shù)據(jù)流 144
5.3.2 Spark Streaming實時統(tǒng)計訂單信息 146
小結(jié) 151
第6章 廣電大數(shù)據(jù)用戶畫像——用戶標簽計算與可視化 152
學(xué)習(xí)目標 152
6.1 SVM預(yù)測用戶是否值得挽留 152
6.1.1 SVM算法 152
6.1.2 構(gòu)建特征列和標簽列數(shù)據(jù) 153
6.1.3 建立SVM模型 159
6.1.4 模型評估 160
6.1.5 模型預(yù)測 161
6.1.6 整體實現(xiàn)及參數(shù)封裝 163
6.2 用戶畫像 168
6.2.1 用戶畫像概述 169
6.2.2 標簽計算 170
6.2.3 用戶畫像工程實現(xiàn) 179
6.3 用戶畫像可視化 188
6.3.1 用戶畫像可視化簡介 188
6.3.2 可視化工程實現(xiàn) 188
6.3.3 結(jié)果展示 192
小結(jié) 195
第7章 廣電大數(shù)據(jù)用戶畫像——任務(wù)調(diào)度實現(xiàn) 196
學(xué)習(xí)目標 196
7.1 調(diào)度策略 196
7.2 調(diào)度實現(xiàn) 199
小結(jié) 227
第8章 基于TipDM大數(shù)據(jù)挖掘建模平臺實現(xiàn)廣電大數(shù)據(jù)用戶畫像 229
學(xué)習(xí)目標 229
8.1 平臺簡介 229
8.1.1 模板 230
8.1.2 數(shù)據(jù)空間 231
8.1.3 我的項目 232
8.1.4 系統(tǒng)組件 232
8.1.5 個人組件 234
8.1.6 訪問TipDM大數(shù)據(jù)挖掘建模平臺的方式 234
8.2 廣電大數(shù)據(jù)用戶畫像開發(fā) 234
8.2.1 數(shù)據(jù)源配置 236
8.2.2 數(shù)據(jù)探索 238
8.2.3 數(shù)據(jù)處理 239
8.2.4 用戶畫像 241
小結(jié) 249
大數(shù)據(jù)開發(fā)項目實戰(zhàn) 作者簡介
祝錫永,男,現(xiàn)為浙江理工大學(xué)管理科學(xué)與工程教授,管理科學(xué)與工程系主任,信息管理與信息系統(tǒng)專業(yè)負責(zé)人,***雙萬一流專業(yè)建設(shè)點負責(zé)人。主講課程:數(shù)據(jù)庫原理與應(yīng)用、軟件開發(fā)工具、管理信息系統(tǒng)、數(shù)據(jù)挖掘與應(yīng)用。主要研究方向:信息系統(tǒng)開發(fā)工具與技術(shù)、數(shù)據(jù)庫技術(shù)、知識管理與商務(wù)智能 張良均,資深大數(shù)據(jù)專家,廣東泰迪智能科技股份有限公司董事長,國家科技部入庫技術(shù)專家,教育部全國專業(yè)學(xué)位水平評估專家,工信部教育與考試中心入庫專家,中國工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會理事,廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會副理事長,廣東省高等職業(yè)教育教學(xué)指導(dǎo)委員會委員,華南師范大學(xué)、中南財經(jīng)政法大學(xué)等40余所高校校外碩導(dǎo)或兼職教授,泰迪杯全國數(shù)據(jù)挖掘挑戰(zhàn)賽發(fā)起人。曾在國內(nèi)外重要學(xué)術(shù)刊物上發(fā)表學(xué)術(shù)論文10余篇,主導(dǎo)編寫圖書專著60余部,其中獲普通高等教育“十一五”規(guī)劃教材一部,“十三五”職業(yè)教育國家規(guī)劃教材一部;參與標準建設(shè)4項,主持***課題1項、省部級課題4項。獲得SAS、SPSS數(shù)據(jù)挖掘認證及Hadoop開發(fā)工程師證書,具有信訪、電力、電信、銀行、制造企業(yè)、電子商務(wù)和電子政務(wù)的項目經(jīng)驗和行業(yè)背景,并榮獲中國產(chǎn)學(xué)研合作促進獎、中國南方電網(wǎng)公司發(fā)明專利一等獎、廣東省農(nóng)業(yè)技術(shù)推廣二等獎、廣州市荔灣區(qū)科學(xué)技術(shù)進步獎。
- >
我從未如此眷戀人間
- >
經(jīng)典常談
- >
朝聞道
- >
煙與鏡
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
我與地壇
- >
羅庸西南聯(lián)大授課錄
- >
有舍有得是人生