中圖網

>

計算機教材

PYthon大數據分析

包郵 PYthon大數據分析

作者：Ivan

出版社：北京航空航天大學出版社出版時間：2023-04-01

開本： 16開 頁數： 233

本類榜單：計算機/網絡銷量榜

中圖價:¥52.8(7.7折) 定價 ~~¥69.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

¥14.4¥45
>
決戰行測5000題(言語理解與表達)

決戰行測5000題(言語理解與表達)

¥44.1¥88
>
軟件性能測試.分析與調優實踐之路

軟件性能測試.分析與調優實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續交付

JAVA持續交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學習

深度學習

¥92.4¥168

商品詳情
商品評論(0條)

中圖價:¥52.8 加入購物車

版權信息
本書特色
內容簡介
目錄
作者簡介

PYthon大數據分析版權信息

ISBN：9787512440715
條形碼：9787512440715 ; 978-7-5124-4071-5
裝幀：平裝-膠訂
冊數：暫無
重量：暫無
所屬分類：
計算機/網絡
>
計算機教材

PYthon大數據分析本書特色

Python大數據分析是為Python開發人員、數據分析師和數據科學家設計的，他們需要親自動手控制數據并將其轉化為有影響力的見解。書中關于統計度量和關系數據庫的基本知識將幫助您理解在本書中的各種概念。

PYthon大數據分析內容簡介

這本書先介紹了如何使用Ppandas在Python中進行數據操作，教您熟悉統計分析和繪圖技術。還將通過多個實踐測試，讓您學會使用Dask分析分布在多臺計算機上的數據。接著還將為您介紹如何在內存無法容納全部數據時，為繪圖聚合數據。本書還將帶領您探索Hadoop(HDFS和YARN)，它可幫助您處理更大的數據集。此外，這本書還介紹了Spark相關知識，并解釋了它如何與其他工具進行交互。 Python大數據分析是為Python開發人員、數據分析師和數據科學家設計的，他們需要親自動手控制數據并將其轉化為有影響力的見解。書中關于統計度量和關系數據庫的基本知識將幫助您理解在本書中的各種概念。

PYthon大數據分析目錄

第1章Python數據科學堆棧1
1.1概述1
1.2Python庫和軟件包2
1.2.1IPython：一個功能強大的交互式shell2
1.2.2Jupyter Notebook4
1.2.3使用IPython還是Jupyter8
1.2.4Numpy9
1.2.5Scipy10
1.2.6Matplotlib10
1.2.7Pandas11
1.3使用Pandas11
1.3.1讀取數據12
1.3.2數據操作13
1.4數據類型轉換21
1.5聚合和分組24
1.6從Pandas導出數據26
1.7Pandas可視化29
1.8總結31
第2章統計數據可視化33
2.1概述33
2.2可視化圖表34
2.3圖表的組件36
2.4Seaborn40
2.5圖的類型41
2.5.1折線圖(Line graph)42
2.5.2散點圖(Scatter plot)45
2.5.3直方圖(Histogram)48
2.5.4箱線圖(Boxplot)51
2.6Pandas DataFrame54
2.7修改圖的組件57
2.7.1配置軸對象的標題和標簽57
2.7.2修改線條顏色和樣式60
2.7.3修改圖的大小60
2.8導出圖像63
2.9總結67
第3章使用大數據框架69
3.1概述69
3.2Hadoop70
3.2.1使用HDFS操控數據71
3.3Spark數據處理平臺73
3.3.1Spark SOL以及Pandas DataFrame75
3.4Parquet文件80
3.4.1編寫Parquet文件81
3.4.2使用Parquet和Partitions提高分析性能82
3.5處理非結構化數據84
3.6總結87
第4章Spark DataFrame89
4.1概述89
4.2使用Spark DataFrame使用方法90
4.3從Spark DataFrame中寫入輸出94
4.4探索和了解Spark DataFrame更多特點95
4.5使用Spark DataFrame對數據進行相關操作98
4.6Spark DataFrame繪制圖形106
4.7總結112
第5章處理缺失值以及相關性分析114
5.1概述114
5.2設置Jupyter Notebook115
5.3缺失值116
5.4處理Spark DataFrame中的缺失值119
5.5相關性121
5.6總結126
第6章進行探索性數據分析127
6.1概述127
6.2定義商業問題128
6.2.1問題識別129
6.2.2需求收集130
6.2.3數據管道和工作流130
6.2.4識別可測量的指標130
6.2.5文檔和展示131
6.3將商業問題轉化為可測量的度量標準和進行探索性數據分析（Exploratory Data Analysis, EDA）131
6.3.1數據采集132
6.3.2數據生成分析132
6.3.3KPI可視化133
6.3.4特征重要性133
6.4數據科學項目生命周期的結構化方法145
6.4.1階段：理解和定義業務問題146
6.4.2第二階段：數據訪問與發現146
6.4.3第三階段：數據工程和預處理147
6.4.4第四階段：模型開發148
6.5總結149
第7章大數據分析中的再現性150
7.1概述150
7.2Jupyter Notebooks的再現性151
7.2.1業務問題介紹152
7.2.2記錄方法和工作流程152
7.2.3數據管道153
7.2.4相關性153
7.2.5使用源代碼版本控制153
7.2.6模塊化過程154
7.3以可復制的方式收集數據154
7.3.1標記單元格和代碼單元格中的功能155
7.3.2解釋標記語言中的業務問題156
7.3.3提供數據源的詳細介紹157
7.3.4解釋標記中的數據屬性157
7.4進行編碼實踐和標準編寫162
7.4.1環境文件162
7.4.2編寫帶有注釋的可讀代碼162
7.4.3工作流程的有效分割163
7.4.4工作流文檔163
7.5避免重復167
7.5.1使用函數和循環優化代碼168
7.5.2為代碼/算法重用開發庫/包169
7.6總結170
第8章創建完整的分析報告171
8.1概述171
8.2Spark可從不同的數據源讀取數據172
8.3在Spark DataFrame上進行SQL操作173
8.4生成統計測量值181
8.5總結185
附錄187

展開全部

PYthon大數據分析作者簡介

Ivan Marin是一名系統架構師和數據科學家，目前就職于位于坎皮納斯的軟件公司Daitan Group。他設計用于大量數據的大數據系統，并使用Python和Spark端到端實現機器學習管道。他還是圣保羅數據科學、機器學習和Python活躍組織者，并在大學級別教授Python數據科學課程。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
經典常談
經典常談
朱自清
¥13.7~~¥39.8~~
>
龍榆生：詞曲概論/大家小書
龍榆生：詞曲概論/大家小書
龍榆生
¥10.9~~¥24.0~~
>
有舍有得是人生
有舍有得是人生
梁實秋
¥25.7~~¥45.0~~
>
朝聞道
朝聞道
劉慈欣
¥9.8~~¥23.8~~
>
上帝之肋:男人的真實旅程
上帝之肋:男人的真實旅程
[美] 羅伯特·布萊著，田國力/盧文戈譯
¥20.2~~¥35.0~~
>
莉莉和章魚
莉莉和章魚
[美]史蒂文·羅利著，祝文亭譯
¥16.4~~¥42.0~~
>
人文閱讀與收藏·良友文學叢書:一天的工作
人文閱讀與收藏·良友文學叢書:一天的工作
魯迅
¥19.7~~¥45.8~~
>
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
[英] 達爾文著，朱邦芊譯
¥6.3~~¥14.0~~

本類暢銷

大數據技術導論(第2版)

陳明

¥28.9~~¥41~~
計算機組成原理實驗指導與習題解析

譚志虎

¥34.8~~¥52~~
數據結構教程(第6版·微課視頻·題庫版)

李春葆尹為民蔣晶玨喻丹丹蔣林

¥45.9~~¥65~~
MATLAB基礎及應用

張學敏主編

¥30.9~~¥49.8~~
DREAMWEAVER網頁設計制作項目教程

沙繼東,車蕾

¥21.3~~¥39~~
C#程序設計

崔舒寧

¥20.6~~¥45.6~~

中图网(原中国图书网)：网上书店，尾货特色书店，30万种特价书低至2折！

包郵 PYthon大數據分析

PYthon大數據分析版權信息

PYthon大數據分析本書特色

PYthon大數據分析內容簡介

PYthon大數據分析目錄

PYthon大數據分析作者簡介

經典常談

龍榆生：詞曲概論/大家小書

有舍有得是人生

朝聞道

上帝之肋:男人的真實旅程

莉莉和章魚

人文閱讀與收藏·良友文學叢書:一天的工作

企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)

大數據技術導論(第2版)

計算機組成原理實驗指導與習題解析

數據結構教程(第6版·微課視頻·題庫版)

MATLAB基礎及應用

DREAMWEAVER網頁設計制作項目教程

C#程序設計

上海灘的賈斯汀·比伯

熊千佳昆蟲記

百年夢憶:梁實秋人生自述

每日論語

人間草木

張學良人格圖譜

包郵 PYthon大數據分析

PYthon大數據分析 版權信息

PYthon大數據分析 本書特色

PYthon大數據分析 內容簡介

PYthon大數據分析 目錄

PYthon大數據分析 作者簡介

PYthon大數據分析版權信息

PYthon大數據分析本書特色

PYthon大數據分析內容簡介

PYthon大數據分析目錄

PYthon大數據分析作者簡介