掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
Python大數據分析技術及應用 版權信息
- ISBN:9787576713138
- 條形碼:9787576713138 ; 978-7-5767-1313-8
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
Python大數據分析技術及應用 內容簡介
大數據技術涵蓋面廣、體系龐大,涉及不同層面及其相關技術。本書主要介紹大數據應用中的兩大關鍵技術,即數據存儲和數據處理與分析。首先介紹大數據的基本概念,然后基于Hadoop架構簡要講解HDFS大數據存儲原理,剖析MapReduce和Spark分布式計算模型,重點通過Python語言詳細介紹大數據處理、數據可視化和數據分析的方法及相關技術,同時詳細介紹PySpark大數據分析的方法,*后通過綜合案例演示大數據處理和分析過程。本書力求較全面地介紹大數據的理論以及Python數據處理和分析的實踐,使讀者輕松學會利用Python進行大數據分析及應用的技術。本書適合信息類專業開設大數據技術課程時作為教材使用,也適合大數據相關技術人員作為入門參考書使用。
Python大數據分析技術及應用 目錄
第1章 大數據概述1.1 什么是大數據? 1.2 大數據的發展歷程 1.3 大數據關鍵技術1.4 大數據計算模式本章小結課后習題第2章 大數據分布式存儲 2.1 大數據處理架構 Hadoop2.2 分布式文件系統 HDFS本章小結課后習題第3章 大數據分布式處理3.1 MapReduce第1章 大數據概述1.1 什么是大數據? 1.2 大數據的發展歷程 1.3 大數據關鍵技術1.4 大數據計算模式本章小結課后習題第2章 大數據分布式存儲 2.1 大數據處理架構 Hadoop2.2 分布式文件系統 HDFS本章小結課后習題第3章 大數據分布式處理3.1 MapReduce3.2 Spark本章小結 課后習題第4章 Python語言基礎 4.1 Python基本語法4.2 NumPy簡介4.3 Pandas簡介本章小結課后習題第5章 Python基本數據處理5.1 數據清洗5.2 數據透視5.3 數據分組5.4 離散化處理5.5 合并數據集本章小結課后習題
第6章 Python 數據可視化
6.1 matplotlib繪圖基礎
6.2 matplotlib可視化實例
6.3 Seaborn繪圖
6.4 中文分詞及詞云圖
6.5 圖像處理簡介
本章小結
課后習題
第7章 數據分析之機器學習
7.1 機器學習基本概念
7.2 機器學習庫sklearn簡介
7.3 回歸算法原理與應用
7.4 支持向量機算法原理與應用
7.5 KNN分類算法原理與應用
7.6 KMeans 聚類算法原理與應用
本章小結
課后習題
第8章 數據分析之文本分析
8.1 距離度量和相似性度量
8.2 文本向量表示及應用
本章小結
課后習題
第9章 PySpark 數據處理及分析
9.1 PySpark數據基本操作
9.2 PySpark 機器學習
9.3 Spark Streaming流處理技術
9.4 Kafka消息發布-訂閱系統
本章小結
課后習題
第10章 大數據應用綜合案例
10.1 網絡爬行器
10.2 案例需求分析
10.3 案例設計
10.4 案例實現
本章小結
課后習題
參考文獻
展開全部
書友推薦
- >
伯納黛特,你要去哪(2021新版)
- >
苦雨齋序跋文-周作人自編集
- >
小考拉的故事-套裝共3冊
- >
伊索寓言-世界文學名著典藏-全譯本
- >
二體千字文
- >
月亮與六便士
- >
煙與鏡
- >
上帝之肋:男人的真實旅程
本類暢銷