大數據技術原理與案例應用 微課版 版權信息
- ISBN:9787115638991
- 條形碼:9787115638991 ; 978-7-115-63899-1
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據技術原理與案例應用 微課版 本書特色
(1)內容全面,結構合理:根據大數據處理的經典方式,講解大數據離線處理、實時處理、交互式OLAP多維分析三種不同應用場景的技術架構、組件構成及其基本理論、案例工程設計及實訓。
(2)真實案例,實踐實訓:結合中國移動“梧桐”平臺,以“真案例、真數據、全流程、可視化”,達成大數據實踐教學“四真”創新“實踐目標真、環境操作真、能力提升真、收獲感受真”為亮點。
(3)注重應用,體現前沿:與科技發展動態緊密結合,用現實生活和工作中的具體實例去印證書中講述的理論知識,讓學生理解得更透徹。
【資源特點】提供詳細的實驗指導、數據集資源,除了配套常規資源(如PPT、教學大綱、習題答案)外,還提供在線實訓平臺、微課視頻,助力打造新形態精品教材。
【服務特點】作者可以提供直播以及QQ服務群等支持。
大數據技術原理與案例應用 微課版 內容簡介
本書共5章,包括大數據技術及實訓學習概述、大數據離線處理開發實踐、大數據實時處理開發實踐、大數據交互式OLAP多維分析開發實踐、大數據可視化應用開發實踐,系統介紹離線處理、實時處理、交互式OLAP多維分析、可視化應用開發的基礎理論知識和工程實踐方法。本書在基本概念、基本原理和操作方法的基礎上,突出工程應用,結合中國移動梧桐大數據平臺,以中國移動的真實大數據分析工程為案例,詳細講解通過在線實訓平臺實現大數據處理開發的過程,力圖做到基礎理論知識成體系、結構與條理清晰、內容精煉,工程實踐聯系實際、重點突出、實操性強。
本書可作為數據科學與大數據技術、計算機科學與技術、軟件工程、人工智能、網絡空間安全、金融科技等專業大數據課程的教材;可供零基礎大數據技術學習者使用;適合有經驗的軟件工程師使用,可幫助其掌握大數據綜合工程實踐的技術路線,更好地將相關知識運用于實際工作;可提各行各業致力于使用大數據技術快速推動本行業數字化轉型的相關科技人員參考。
大數據技術原理與案例應用 微課版 目錄
第1章 大數據技術及實訓學習概述
1.1 大數據技術概述
1.1.1 大數據概念與大數據技術發展歷史簡述
1.1.2 數據要素與數字經濟發展趨勢
1.2 大數據平臺架構
1.2.1 大數據平臺概述
1.2.2 大數據離線處理架構
1.2.3 大數據實時處理架構
1.2.4 大數據交互式OLAP多維分析架構
1.2.5 大數據可視化應用架構
1.2.6 大數據工程學習技能樹
1.3 大數據開發案例實訓學習介紹
1.3.1 梧桐·鴻鵠大數據實訓平臺介紹
1.3.2 梧桐·鴻鵠大數據實訓開發案例介紹
1.3.3 梧桐·鴻鵠校企合作平臺介紹
1.4 本章小結
1.5 習題
第2章 大數據離線處理開發實踐
2.1 大數據離線批處理技術棧
2.1.1 大數據離線批處理應用場景
2.1.2 大數據離線批處理技術棧演進
2.2 分布式文件系統HDFS
2.2.1 HDFS體系框架及基本原理
2.2.2 HDFS操作實踐
2.3 分布式計算框梁MapReduce
2.3.1 MapReduce基木原理
2.3.2 MapReduce
2.3.3 Map任務和Reduce任務與HDFS的配合
2.3.4 MapReduce運行機制
2.3.5 MapReduce操作實踐
2.4 分布式資源管理組件YARN
2.4.1 YARN資源調度框架產生的背景
2.4.2 YARN的基本原理
2.4.3 YARN的作業調度
2.5 分布式內存計算框架Spark
2.5.1 Spark體系框架及基本原理
2.5.2 Spark RDD及Spark算子知識
2.5.3 Spark操作實踐一Scala語言
2.6 金融行業“羊毛黨”識別案例實踐
2.6.1 “羊毛黨”識別需求背景概述
2.6.2 “羊毛黨”識別基礎理論概述
2.6.3 “羊毛黨”識別數據方案設計
2.6.4 基于梧桐·鴻鵠大數據實訓平臺的“羊毛黨”識別實踐
2.7 本章小結
2.8 習題
第3章 大數據實時處理開發實踐
3.1 大數據實時處理技術棧
3.1.1 大數據實時處理應用場景
3.1.2 大數據實時處理技術棧演進
3.2 分布式消息系統Kafka
3.2.1 Kafka體系框架及基本原理
3.2.2 Kafka操作實踐
3.3 分布式實時處理Spark Streaming
3.3.1 Spark Streaming基本原理
3.3.2 Spark Streaming操作實踐
3.4 分布式實時處理Flink
3.4.1 Flink體系框梁及基本原理
3.4.2 Flink DataStream知識
3.4.3 Flink操作實踐
3.5 高速道路及服務區擁堵洞察案例實踐
3.5.1 高速道路及服務區擁堵洞察背景概述
3.5.2 高速道路及服務區擁堵人數數據方案設計
3.5.3 基于梧桐·鴻鵠大數據實訓平臺的高速道路用戶速度和服務區人數的計算
3.5.4 高速用戶和服務區實時數據的應用
3.6 本章小結
3.7 習題
第4章 大數據交互式OLAP多維分析開發實踐
4.1 大數據交五式分析技術棧
4.1.1 大數據交互式分析應用場景
4.1.2 數據倉庫基本概念
4.1.3 多維數據模型與多維數據分析
4.1.4 OLAP與數據立方體
4.1.5 大數據交互式分析技術棧演進
4.2 分布式數據倉庫Hive
4.2.1 Hive體系框架及基本原理
4.2.2 Hive在數據倉庫中的應用
4.3 Hive SQL操作實踐
4.3.1 Hive SQL:數據定義
4.3.2 Hive SQL:數據導人
4.3.3 Hive SQL:數據查詢
4.4 分布式計算框架Spark SQL
4.4.1 Spark SQL簡介
4.4.2 Spark SQL原理
4.4.3 Spark SQL操作實踐
4.5 分布式計算框架Flink關系型API
4.5.1 Flink的關系型API概述及實現原理
4.5.2 Flink SQL操作實踐
4.6 大數據交互武OLAP多維分析案例實踐
4.6.1 大數據交互武OLAP多維分析需求背景概述
4.6.2 大數據交互式OLAP多維分析數據方案設計
4.6.3 基于梧桐·鴻鵠大數據實訓平臺的案例實踐
4.7 本章小結
4.8 習題
第5章 大數據可視化應用開發實踐
5.1 基于Java Web的大數據可視化應用技術棧
5.1.1 大數據可視化應用場景
5.1.2 大數據可視化應用技術棧
5.2 開源大數據可視化應用介紹
5.2.1 開源大數據可視化系統簡介
5.2.2 系統架構
5.2.3 系統界面
5.3 開源大數據可視化工具部署及核心代碼分析
5.3.1 搭建后端開發環境
5.3.2 搭建前端開發環境
5.3.3 前后端核心代碼邏輯
5.4 “園區務工人員洞察”可視化分析案例應用
5.4.1 “園區務工人員洞察”用戶識別需求背景概述
5.4.2 “園區務工人員洞察”用戶識別數據方案設計
5.4.3 基于梧桐·鴻鵠大數據實訓平臺的“園區務工人員洞察”用戶識別實踐
5.5 “園區務工人員洞察”可視化數據大屏案例應用
5.5.1 分析數據導人
5.5.2 數據大屏設計
5.5.3 數據大屏發布
5.6 本章小結
5.7 習題
展開全部
大數據技術原理與案例應用 微課版 作者簡介
鄂海紅,博士,教授,2010年7月畢業于北京郵電大學計算機學院,首批北京市青年英才、北京郵電大學1551托舉人才、北京郵電大學青年教學名師,北郵本科課程思政示范課程《大數據技術基礎》優秀教學團隊負責人、課程思政教學名師 ,獲教育部-華為智能基座棟梁之師、華為“先鋒教師”、首屆北郵“優秀研究生育人導師” 稱號。先后擔任了6門大數據技術系列課程負責人,主導完成大數據北郵-華為智能基座課程建設,在大數據方向探索出了同行可全面復用的華為云大數據高校課程實驗體系,被華為評為優秀教學方案,2022年獲評教育部-華為“智能基座”優秀課件。指導學生獲得首屆教育部“中國高校科技成果交易會”成果創新獎;指導學生獲市級優秀本科畢業設計、獲評華為“智能基座”“未來之星”。主導了大數據方向的3項教育部協同育人項目、3項校級“高新課程”、2項校級教改項目;出版《數聯網-大數據如何互聯》專著和《大數據技術基礎》《大數據技術基礎實驗》 教材。