-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
SPARK項目實訓(PYTHON版) 版權信息
- ISBN:9787302685302
- 條形碼:9787302685302 ; 978-7-302-68530-2
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
SPARK項目實訓(PYTHON版) 本書特色
本書為傳智播客公司大數據系列中的一本,全書內容完整,結構清晰,條理分明,術語規范,描述流暢,質量較好。本書以電商網站中的用戶行為數據作為數據源,系統地介紹了如何使用 Spark生態系統進行離線分析和實時分析的方法。全書共6章,分別講解了項目概述、集群環境搭建、使用Flume實現數據采集、使用Hive構建數據倉庫、使用Spark進行數據分析以及使用FineBI實現數據可視化。本書有較高的知識性、科學性和實用性,出版價值較高。本書附有配套視頻、教學PPT、教學設計等資源,同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。
SPARK項目實訓(PYTHON版) 內容簡介
"本書以電商網站中的用戶行為數據作為數據源,系統介紹了使用Spark生態系統進行離線分析和實時分析的方法。全書共6章,分別講解了項目概述、搭建集群環境、使用Flume實現數據采集、使用Hive構建數據倉庫、使用Spark進行數據分析以及使用FineBI實現數據可視化。 本書附有教學PPT、教學設計等資源,同時,為了幫助初學者更好地學習書中內容,還提供了在線答疑,歡迎讀者關注。 本書適合作為高等學校數據科學與大數據技術及相關專業的教材,也適合數據分析、數據可視化等領域的從業者閱讀。"
SPARK項目實訓(PYTHON版)SPARK項目實訓(PYTHON版) 前言
黨的二十大報告強調了“加快發展數字經濟,促進數字經濟和實體經濟深度融合,打造具有國際競爭力的數字產業集群”的重要性。隨著云計算、移動互聯網、電子商務、物聯網和社交媒體的蓬勃發展,全球數據正以驚人的速度呈指數級增長,大數據已成為與物質資產和人力資本同等重要的戰略資源。
然而,數據的價值不僅取決于數量,更取決于質量和分析能力。要從海量數據中挖掘出真正的價值,需要構建高效的數據采集、存儲、處理和分析體系,為商業決策和社會發展提供有力支撐。
本書以電商網站用戶行為數據為基礎,系統講解利用Spark生態系統進行離線分析和實時分析的方法,適合具備一定數據分析知識和大數據基礎的讀者學習。本書共6章,具體如下。
第1章帶領讀者初步了解項目背景、核心需求、技術架構及開發流程。
第2章詳細介紹基于Linux操作系統搭建集群環境,包括Hadoop、Hive、Flume、Kafka、Spark等。
第3章講解通過配置Flume的采集方案實現歷史和實時用戶行為數據的采集。
SPARK項目實訓(PYTHON版) 目錄
第1章項目概述1
1.1項目需求和目標1
1.2預備知識2
1.3項目架構3
1.4開發環境和工具3
1.5項目開發流程5
1.6本章小結6
第2章搭建集群環境7
2.1基礎環境搭建7
2.1.1創建虛擬機7
2.1.2安裝Linux操作系統15
2.1.3克隆虛擬機23
2.1.4配置虛擬機26
2.2安裝JDK38
2.3部署Hadoop集群42
2.4部署Hive50
2.5部署Flume56
2.6部署ZooKeeper集群57
2.7部署Kafka集群61
2.8部署Spark64
2.9部署Doris集群67
2.10本章小結74
第3章數據采集75
3.1用戶行為數據概述75
3.2模擬生成用戶行為數據76
3.2.1生成歷史用戶行為數據77
3.2.2生成實時用戶行為數據82
3.3配置采集方案83
3.4采集用戶行為數據87
3.5本章小結91
第4章數據倉庫92
4.1 數據倉庫設計92
4.2構建數據倉庫96
4.3向數據倉庫加載數據100
4.3.1向ODS層的表加載數據101
4.3.2向DWD層的表加載數據103
4.4本章小結112
第5章數據分析113
5.1流量分析113
5.2商品分析119
5.3設備分析123
5.4推薦系統127
5.5地域分析133
5.6本章小結138
第6章數據可視化139
6.1Doris集成Hive139
6.2FineBI的安裝與配置143
6.3實現數據可視化152
6.3.1新建數據集152
6.3.2實現流量分析的可視化158
6.3.3實現商品分析的可視化169
6.3.4實現設備分析的可視化175
6.3.5實現地域分析的可視化178
6.4本章小結184
- >
我與地壇
- >
有舍有得是人生
- >
山海經
- >
巴金-再思錄
- >
煙與鏡
- >
名家帶你讀魯迅:故事新編
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
自卑與超越