-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據分析技術 版權信息
- ISBN:9787111712084
- 條形碼:9787111712084 ; 978-7-111-71208-4
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據分析技術 本書特色
適讀人群 :高等職業院校大數據技術、信息安全與管理、軟件技術、計算機網絡技術、云計算技術等專業本書為國家教學資源庫“大數據分析技術”課程的配套教材 本書采用項目驅動方式編寫,理實一體 本書為新形態一體化教材,配套建設了電子課件、微課視頻、源代碼和習題答案等數字化學習資源
大數據分析技術 內容簡介
本書主要面向高職大數據技術專業的學生,注重大數據分析技術的應用和實踐。本書每個項目主要分為兩個部分。部分是大數據分析技術的理論知識,主要講解了大數據分析模型、Python數據分析工具、NumPy和Pandas數據分析庫、Matplotlib數據分析可視化庫、Hadoop及其常用組件以及scikitlearn機器學習庫的基本原理和操作。第二部分是任務實施,通過17個實操任務充分展現了大數據分析技術的主要功能和特點。 本書既可作為高等職業院校大數據技術、信息安全與管理、軟件技術、計算機網絡技術、云計算技術等專業的教材,也適合有一定Python編程經驗并對大數據分析技術感興趣的讀者閱讀。
大數據分析技術 目錄
前言
項目1 認識大數據分析
1.1 大數據分析概述
1.1.1 大數據分析的概念和發展
1.1.2 大數據分析的作用和影響
1.2 大數據分析模型
1.2.1 大數據分析的技術和工具
1.2.2 大數據分析的流程
1.2.3 大數據分析的模型簡介
【任務實施】
任務1 網站用戶活躍度指標綜合分析
任務2 身高體重指標數據關聯分析
練習題
項目2 安裝Python數據分析工具
2.1 Python數據分析基本概念
2.1.1 Python數據分析的特點
2.1.2 Python與其他數據分析工具的比較
2.2 Python數據分析常用庫介紹
2.2.1 NumPy簡介
2.2.2 Pandas簡介
2.2.3 SciPy簡介
2.2.4 Matplotlib簡介
2.2.5 scikitlearn簡介
2.2.6 Statmodels簡介
2.2.7 Seaborn簡介
【任務實施】
任務1 在Windows系統中安裝Anaconda
任務2 運行Jupyter Notebook
任務3 PyCharm的安裝和使用
練習題
項目3 使用NumPy實現統計分析和處理
3.1 NumPy的基本概念
3.1.1 NumPy基礎理論和引用方法
3.1.2 ndarry對象
3.1.3 NumPy數據類型
3.1.4 NumPy數組屬性
3.1.5 NumPy切片和索引
3.2 NumPy函數
3.2.1 NumPy數學函數
3.2.2 NumPy數組維度操作函數
3.2.3 NumPy創建數組函數
3.2.4 NumPy常用IO函數
3.2.5 NumPy廣播
【任務實施】
任務1 使用Numpy實現股票數據分析
任務2 使用Numpy實現豆瓣電影數據
分析
練習題
項目4 Pandas數據分析和處理
4.1 Pandas的基本概念
4.1.1 Pandas基礎理論和引用方法
4.1.2 Pandas基本數據結構
4.2 Pandas的基本用法
4.2.1 創建Pandas對象
4.2.2 查看Pandas基本數據
4.2.3 Pandas索引和切片
4.2.4 Pandas缺失值和空值處理
4.2.5 Pandas連接和合并數據
4.2.6 Pandas分組
4.2.7 Pandas重塑
4.2.8 Pandas數據透視表
4.2.9 Pandas時間序列
4.2.10 Pandas分類
4.2.11 Pandas IO操作
【任務實施】
任務1 使用Pandas實現水果銷售數據分析
任務2 使用Pandas實現用戶消費行為數據分析
任務3 使用Pandas實現電商銷售數據分析
練習題
項目5 Matplotlib數據分析可視化庫
5.1 Matplotlib的基本概念
5.1.1 Matplotlib基礎理論和引用方法
5.1.2 散點圖
5.1.3 條形圖
5.1.4 折線圖
5.1.5 餅圖
5.1.6 直方圖
5.1.7 箱形圖
5.2 組合圖
5.2.1 曲線組合圖
5.2.2 柱狀、散點、折線組合圖
5.2.3 直方圖組合圖123 【任務實施】
任務1 使用餅圖實現零售總額數據分析
任務2 使用折線圖實現零售總額數據分析
任務3 使用雙柱狀圖實現零售總額變化情況數據分析
練習題
項目6 基于Hadoop的數據分析
6.1 掌握Hadoop框架和生態組件
6.1.1 Hadoop簡介
6.1.2 Hadoop核心組件和工作原理
6.1.3 Hadoop安裝、部署和應用
6.2 Hadoop生態組件
6.2.1 Hadoop生態圈簡介
6.2.2 Hive的安裝、部署和應用
6.2.3 Spark的安裝、部署和應用
6.2.4 HBase的安裝、部署和應用
6.2.5 Kafka的安裝、部署和應用
6.2.6 Flume的安裝、部署和應用
6.2.7 Sqoop的安裝、部署和應用
6.2.8 Zookeeper的安裝、部署和應用
【任務實施】
任務1 使用Hadoop及其組件Hive實現數據分析
任務2 使用Hadoop及其組件Spark實現數據分析
練習題
項目7 基于scikitlearn機器學習庫的數據分析
7.1 掌握機器學習基本概念
7.1.1 機器學習簡介
7.1.2 機器學習基本流程
7.1.3 機器學習開發流程
7.1.4 機器學習算法分類
7.2 掌握scikitlearn的基本用法
7.2.1 scikitlearn的安裝和引用方法
7.2.2 scikitlearn的基本用法
【任務實施】
任務1 使用scikitlearn實現鳶尾花數據分析
任務2 使用scikitlearn實現波士頓房價數據分析
練習題
參考文獻
大數據分析技術 作者簡介
李俊翰,中共黨員,執教13年。教學經驗豐富。作為主研參與大數據技術與應用國家專業教學資源庫建設工作,主持子課程《應用程序開發基礎(Java)》;發表SCI2篇,中文核心3篇;完成軟件著作權1項,實用新型專利4項,橫向課題2項;作為指導教師,指導學生參加全國職業院校技能大賽“大數據技術與應用”賽項獲二等獎,重慶市職業院校技能競賽“大數據技術與應用”賽項獲得一等獎3項,“一帶一路”暨金磚國際技能大賽大數據賽項三等獎等;主參編教材《大數據采集與爬蟲》《大數據平臺應用》《Python編程基礎》《Spark大數據實時分析實戰》;作為主講教師先后承擔《數據預處理》《大數據編程基礎(Python)》和《大數據可視化技術》等十余門課程。
- >
李白與唐代文化
- >
月亮虎
- >
伯納黛特,你要去哪(2021新版)
- >
自卑與超越
- >
姑媽的寶刀
- >
山海經
- >
朝聞道
- >
隨園食單