中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
Python數據分析:零基礎入門到實戰開發

包郵 Python數據分析:零基礎入門到實戰開發

出版社:中國鐵道出版社出版時間:2020-11-01
開本: 16開 頁數: 269頁
中 圖 價:¥51.3(7.3折) 定價  ¥69.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

Python數據分析:零基礎入門到實戰開發 版權信息

  • ISBN:9787113267377
  • 條形碼:9787113267377 ; 978-7-113-26737-7
  • 裝幀:簡裝本
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

Python數據分析:零基礎入門到實戰開發 本書特色

系統:立體化、全方位解讀數據分析行業技能掌握路線細致:沿著需求->代碼實現的思路,介紹上百個數分小技巧,適合各類讀者閱讀深入:18個統計學知識點,建立數據分析背后的數學思維案例:列舉了多個數據分析案例,趁熱打鐵,理論與實踐相結合

Python數據分析:零基礎入門到實戰開發 內容簡介

本書主要分為三部分。**部分為數據分析相關Python技能的介紹, 包括NumPy、pandas等重要的第三方庫的使用技巧。第二部分為數據分析相關統計學知識的介紹, 主要包含構建模型的流程、思路、背后的數學原理的說明。第三部分為數個實戰介紹, 結合Python數據分析工具與統計學知識進行小試牛刀。

Python數據分析:零基礎入門到實戰開發Python數據分析:零基礎入門到實戰開發 前言

前 言
這本書是寫給誰看的?
首先,本書非常適合從事數據分析行業的人員學習。從書中可以學會利用pandas批量處理數據,通過可視化技術給領導和客戶帶來強烈的視覺沖擊。建議對這部分感興趣的讀者著重學習第4章、第6章、□□□章。
其次,本書還適合在科研過程中頻繁處理數據的研究人員。據我所知,尤其是生物領域的科研人員,在進行數值分析、方程擬合時,有一部分人還在使用傳統的SPSS軟件,不過它功能有限,也很不靈活,而通過對SciPy的學習,可以感受到Python在科學計算方面的強大功能。建議這部分讀者著重學習第5章。
□后,本書對于那些有志于從事數據領域工作的讀者也很有指導作用。無論你以后想從事數據分析行業,還是大數據挖掘行業,本書都可以作為一本值得入手的啟蒙讀物。
本書架構
□□章從總體講解數據分析,包括其發展歷史、技能需求等。通過經典案例展示數據分析全過程,讓讀者帶著疑問、興趣閱讀本書。□后介紹了兩個非常出色的數據分析案例。
第□章介紹Python基礎編程知識與技巧,有一定Python編程基礎的讀者可以跳過此章,往后閱讀。
第3~7章是本書的核心內容,同時章節講述的先后順序與數據分析的流程相對應。
NumPy中包含了許多大規模數組快速計算的算法,是數據分析的基礎,也是學習其他庫的基礎。
pandas非常擅長將非結構化數據處理為結構化數據,包括清除缺失數據、填充值、表格的合并與刪除等操作。
SciPy是一個科學計算包,當收到規整的數據集,如何挖掘數據信息的任務就落到了SciPy的身上。在本章中你可以掌握數值分析、數值擬合、插值等技能。
數據可視化是數據分析的□后一步,當分析得出了結論就要展示出來。在第6章,會介紹兩個可視化庫,一個是matplotlib,另一個是pyechart。二者其中一個擅長基礎繪圖,一個擅長交互式繪圖,各有所長,互相補充。
在現實生活中,尤其是在金融、科研等領域,很多數據都是時間序列的函數,因此本書在第7章還介紹了Python在時間序列中的應用。
第8~1□章是本書的實戰章節,將介紹一些數據分析的實戰案例,幫助大家融會貫通前面掌握的技能。
本書的目的
希望閱讀本書的數據分析和大數據挖掘從業者、科研人員和愛好者能掌握一些數據分析編程技能,不再僅僅依賴于局限性很強的傳統工具。
希望閱讀本書的學生,能對數據分析的概念、流程,與其他領域的區別有大致的了解,并提高對數據分析技術的興趣。如果能引領出幾位目前迷茫,但閱讀完本書后有志于在數據領域深耕的極客那就更好了。

Python數據分析:零基礎入門到實戰開發 目錄

第1章 什么是數據分析
1.1 Python開發環境 1
1.2 數據分析的前世今生 2
1.2.1 數據分析歷史 2
1.2.2 數據分析的現實應用 2
1.2.3 數據分析的技能需求 3
1.3 數據分析流程 4
1.3.1 數據導入、清洗 5
1.3.2 單變量分析 6
1.3.3 多變量分析 6
1.3.4 選擇模型 6
1.3.5 估計與假設檢驗 7
1.3.6 可視化 8
1.4 數據分析經典案例 8
1.4.1 犯罪率的下降與法律條文的生成 8
1.4.2 利用數據觀察校園作弊行為 9
1.4.3 靠統計學致富的數學家 11
1.5 數據分析的**個實戰 12
1.5.1 單變量探索 12
1.5.2 多變量分析 16
1.5.3 選擇模型 21
1.5.4 假設檢驗 25
第2章 Python知識進階
2.1 Python語言 28
2.1.1 Python的歷史 29
2.1.2 Python的特色 29
2.2 Python技巧與進階 31
2.2.1 數據類型方面的技巧 31
2.2.2 數字方面的使用技巧 32
2.2.3 枚舉 34
2.2.4 匿名函數的應用 35
2.2.5 裝飾器:語法糖 37
2.2.6 列表生成式 39
2.2.7 迭代器與生成器 39
2.3 Python編程的易錯點 41
2.3.1 全局變量與局部變量 42
2.3.2 閉包 43
2.3.3 函數傳參 44
2.3.4 列表和數組的區別 45
2.3.5 變量和按引用傳遞 45
2.3.6 None:一個獨特的類型 47
2.4 小結 48
第3章 NumPy的入門與進階
3.1 ndarray數組 49
3.1.1 ndarray數組的創建 49
3.1.2 C和Fortran順序 51
3.2 索引 51
3.2.1 基本索引 51
3.2.2 高維數組的索引 52
3.2.3 高階索引 54
3.3 廣播機制 56
3.4 NumPy數組的運算 58
3.4.1 NumPy的數值計算 58
3.4.2 比較與排序 59
3.4.3 NumPy的數組計算 60
3.4.4 ufunc高級應用 61
3.4.5 NumPy初等函數與math內置初等函數的區別 63
3.4.6 NumPy中的多項式函數 64
3.4.7 其他功能函數 65
第4章 pandas的入門與進階
4.1 pandas的數據結構 66
4.1.1 Series的創建 67
4.1.2 Series的數值計算 68
4.1.3 DataFrame的創建 69
4.1.4 DataFrame的基本屬性 70
4.2 pandas數據結構的基本操作 72
4.2.1 轉置 72
4.2.2 索引 73
4.2.3 DataFrame的關系型操作 75
4.2.4 DataFrame的畫圖操作 76
4.2.5 查看數據 80
4.3 pandas數據結構的進階操作 81
4.3.1 數據導入導出 81
4.3.2 表格合并 83
4.3.3 讀寫文件中的編碼問題 90
4.3.4 刪除與替換數據 92
4.3.5 表格整體性分析 96
4.3.6 GroupBy分組運算 98
4.3.7 綜合練習 103
第5章 SciPy入門與進階
5.1 SciPy中的常數與函數 106
5.1.1 SciPy中的常數 106
5.1.2 SciPy中的special模塊 107
5.2 SciPy中的科學計算工具 108
5.2.1 求解多元方程組 108
5.2.2 擬合方程 110
5.2.3 *優化算法 113
5.2.4 統計分布 116
5.2.5 積分 120
5.2.6 插值 121
第6章 可視化
6.1 可視化的魅力 124
6.1.1 別出心裁的可視化 124
6.1.2 可視化的基本理論 126
6.1.3 可視化實例 127
6.2 matplotlib第三方庫的基本功能 131
6.2.1 matplotlib繪圖的基礎組件 131
6.2.2 餅圖 134
6.2.3 條形圖 139
6.2.4 散點圖 142
6.2.5 折線圖 145
6.2.6 箱線圖 146
6.2.7 小提琴圖 148
6.2.8 Basemap簡單介紹 150
6.3 交互式繪圖 151
6.3.1 matplotlib的簡單交互式繪圖 151
6.3.2 pyecharts可視化庫 154
第7章 時間序列
7.1 datetime庫的簡單介紹 160
7.1.1 時間坐標的構造 160
7.1.2 時間和字符串的轉換 161
7.2 時間序列中pandas的應用 162
7.2.1 DatetimeIndex 162
7.2.2 pandas中時間坐標的構造 163
7.2.3 PeriodIndex(時間索引類型) 164
7.2.4 采樣 166
7.2.5 超前或滯后 167
7.2.6 移動窗口函數 168
7.3 時間序列的時區轉換 169
第8章 數據分析中的統計學
8.1 有趣的選擇 171
8.2 數據分析回答ofo多久才能退押金 172
8.3 統計學在數據分析中扮演的角色 178
8.4 數據預處理 178
8.4.1 數據清洗 178
8.4.2 數據集成 180
8.4.3 數據變換 181
8.5 特征工程 182
8.5.1 過濾法 183
8.5.2 包裝法 186
8.5.3 嵌入式方法 190
8.5.4 正則化 193
8.6 模型訓練 194
8.7 模型評估 199
8.8 數據分析中的其他問題 201
8.8.1 數據泄露 201
8.8.2 大數據下的數據分析 202
8.8.3 辛普森悖論 204
8.8.4 數據集的劃分 205
8.8.5 優化調參 206
第9章 豆瓣電影TOP 250數據分析
9.1 項目介紹 210
9.1.1 爬蟲的簡單介紹 210
9.1.2 網頁的構成 210
9.1.3 實戰中的爬蟲技術介紹 211
9.1.4 實戰中數據存儲與讀取 215
9.1.5 實戰中的界面設計 216
9.1.6 實戰中的數據可視化 219
9.2 數據庫操作 224
9.2.1 數據庫的安裝與配置 225
9.2.2 數據存儲到數據庫 227
9.3 數據庫標準語言 228
9.3.1 創建數據庫、表 229
9.3.2 表的刪除與更新 229
9.3.3 查詢 230
9.3.4 聚合與排序 230
9.3.5 數據更新 231
9.3.6 表的集合運算 232
9.3.7 Python和數據庫語言的關系 234
第10章 Python豐富的可視化案例
10.1 turtle庫的簡單使用 236
10.2 北上廣深租房分析可視化案例 238
10.2.1 數據爬取 238
10.2.2 讀取數據 240
10.2.3 數據分析 241
第11章 Python預測應用——SVM預測股票漲跌
11.1 SVM介紹 246
11.1.1 SVM原理 246
11.1.2 核函數 247
11.2 SVM實戰 249
11.2.1 數據預處理 249
11.2.2 訓練模型 251
11.2.3 遺傳算法 252
第12章 文本分析《三國演義》:挖掘人物圖譜
12.1 項目簡單說明 262
12.1.1 代碼分塊介紹 262
12.1.2 效果圖展示 265
12.2 工程具體實現 265
12.2.1 設計思想 266
12.2.2 代碼詳解 266
12.2.3 可視化 267

目 錄
第1章 什么是數據分析
1.1 Python開發環境 1
1.2 數據分析的前世今生 2
1.2.1 數據分析歷史 2
1.2.2 數據分析的現實應用 2
1.2.3 數據分析的技能需求 3
1.3 數據分析流程 4
1.3.1 數據導入、清洗 5
1.3.2 單變量分析 6
1.3.3 多變量分析 6
1.3.4 選擇模型 6
1.3.5 估計與假設檢驗 7
1.3.6 可視化 8
1.4 數據分析經典案例 8
1.4.1 犯罪率的下降與法律條文的生成 8
1.4.2 利用數據觀察校園作弊行為 9
1.4.3 靠統計學致富的數學家 11
1.5 數據分析的**個實戰 12
1.5.1 單變量探索 12
1.5.2 多變量分析 16
1.5.3 選擇模型 21
1.5.4 假設檢驗 25
第2章 Python知識進階
2.1 Python語言 28
2.1.1 Python的歷史 29
2.1.2 Python的特色 29
2.2 Python技巧與進階 31
2.2.1 數據類型方面的技巧 31
2.2.2 數字方面的使用技巧 32
2.2.3 枚舉 34
2.2.4 匿名函數的應用 35
2.2.5 裝飾器:語法糖 37
2.2.6 列表生成式 39
2.2.7 迭代器與生成器 39
2.3 Python編程的易錯點 41
2.3.1 全局變量與局部變量 42
2.3.2 閉包 43
2.3.3 函數傳參 44
2.3.4 列表和數組的區別 45
2.3.5 變量和按引用傳遞 45
2.3.6 None:一個獨特的類型 47
2.4 小結 48
第3章 NumPy的入門與進階
3.1 ndarray數組 49
3.1.1 ndarray數組的創建 49
3.1.2 C和Fortran順序 51
3.2 索引 51
3.2.1 基本索引 51
3.2.2 高維數組的索引 52
3.2.3 高階索引 54
3.3 廣播機制 56
3.4 NumPy數組的運算 58
3.4.1 NumPy的數值計算 58
3.4.2 比較與排序 59
3.4.3 NumPy的數組計算 60
3.4.4 ufunc高級應用 61
3.4.5 NumPy初等函數與math內置初等函數的區別 63
3.4.6 NumPy中的多項式函數 64
3.4.7 其他功能函數 65
第4章 pandas的入門與進階
4.1 pandas的數據結構 66
4.1.1 Series的創建 67
4.1.2 Series的數值計算 68
4.1.3 DataFrame的創建 69
4.1.4 DataFrame的基本屬性 70
4.2 pandas數據結構的基本操作 72
4.2.1 轉置 72
4.2.2 索引 73
4.2.3 DataFrame的關系型操作 75
4.2.4 DataFrame的畫圖操作 76
4.2.5 查看數據 80
4.3 pandas數據結構的進階操作 81
4.3.1 數據導入導出 81
4.3.2 表格合并 83
4.3.3 讀寫文件中的編碼問題 90
4.3.4 刪除與替換數據 92
4.3.5 表格整體性分析 96
4.3.6 GroupBy分組運算 98
4.3.7 綜合練習 103
第5章 SciPy入門與進階
5.1 SciPy中的常數與函數 106
5.1.1 SciPy中的常數 106
5.1.2 SciPy中的special模塊 107
5.2 SciPy中的科學計算工具 108
5.2.1 求解多元方程組 108
5.2.2 擬合方程 110
5.2.3 *優化算法 113
5.2.4 統計分布 116
5.2.5 積分 120
5.2.6 插值 121
第6章 可視化
6.1 可視化的魅力 124
6.1.1 別出心裁的可視化 124
6.1.2 可視化的基本理論 126
6.1.3 可視化實例 127
6.2 matplotlib第三方庫的基本功能 131
6.2.1 matplotlib繪圖的基礎組件 131
6.2.2 餅圖 134
6.2.3 條形圖 139
6.2.4 散點圖 142
6.2.5 折線圖 145
6.2.6 箱線圖 146
6.2.7 小提琴圖 148
6.2.8 Basemap簡單介紹 150
6.3 交互式繪圖 151
6.3.1 matplotlib的簡單交互式繪圖 151
6.3.2 pyecharts可視化庫 154
第7章 時間序列
7.1 datetime庫的簡單介紹 160
7.1.1 時間坐標的構造 160
7.1.2 時間和字符串的轉換 161
7.2 時間序列中pandas的應用 162
7.2.1 DatetimeIndex 162
7.2.2 pandas中時間坐標的構造 163
7.2.3 PeriodIndex(時間索引類型) 164
7.2.4 采樣 166
7.2.5 超前或滯后 167
7.2.6 移動窗口函數 168
7.3 時間序列的時區轉換 169
第8章 數據分析中的統計學
8.1 有趣的選擇 171
8.2 數據分析回答ofo多久才能退押金 172
8.3 統計學在數據分析中扮演的角色 178
8.4 數據預處理 178
8.4.1 數據清洗 178
8.4.2 數據集成 180
8.4.3 數據變換 181
8.5 特征工程 182
8.5.1 過濾法 183
8.5.2 包裝法 186
8.5.3 嵌入式方法 190
8.5.4 正則化 193
8.6 模型訓練 194
8.7 模型評估 199
8.8 數據分析中的其他問題 201
8.8.1 數據泄露 201
8.8.2 大數據下的數據分析 202
8.8.3 辛普森悖論 204
8.8.4 數據集的劃分 205
8.8.5 優化調參 206
第9章 豆瓣電影TOP 250數據分析
9.1 項目介紹 210
9.1.1 爬蟲的簡單介紹 210
9.1.2 網頁的構成 210
9.1.3 實戰中的爬蟲技術介紹 211
9.1.4 實戰中數據存儲與讀取 215
9.1.5 實戰中的界面設計 216
9.1.6 實戰中的數據可視化 219
9.2 數據庫操作 224
9.2.1 數據庫的安裝與配置 225
9.2.2 數據存儲到數據庫 227
9.3 數據庫標準語言 228
9.3.1 創建數據庫、表 229
9.3.2 表的刪除與更新 229
9.3.3 查詢 230
9.3.4 聚合與排序 230
9.3.5 數據更新 231
9.3.6 表的集合運算 232
9.3.7 Python和數據庫語言的關系 234
第10章 Python豐富的可視化案例
10.1 turtle庫的簡單使用 236
10.2 北上廣深租房分析可視化案例 238
10.2.1 數據爬取 238
10.2.2 讀取數據 240
10.2.3 數據分析 241
第11章 Python預測應用——SVM預測股票漲跌
11.1 SVM介紹 246
11.1.1 SVM原理 246
11.1.2 核函數 247
11.2 SVM實戰 249
11.2.1 數據預處理 249
11.2.2 訓練模型 251
11.2.3 遺傳算法 252
第12章 文本分析《三國演義》:挖掘人物圖譜
12.1 項目簡單說明 262
12.1.1 代碼分塊介紹 262
12.1.2 效果圖展示 265
12.2 工程具體實現 265
12.2.1 設計思想 266
12.2.2 代碼詳解 266
12.2.3 可視化 267

展開全部

Python數據分析:零基礎入門到實戰開發 作者簡介

張玉皓畢業于中國科學院大學計算機應用技術專業,在國際ROBOmaster人工智能挑戰大賽上與中科院自動化所、伯克利大學、哥倫比亞大學同臺競技,榮獲第八名。映客直播實習期間,參與直播間文本分析,計算直播間受歡迎指標的項目。京東實習期間,參與京東商城全品類評論短文本聚類項目,將短文本智能聚類,積累短對話語料庫。畢業斬獲瓜子二手車、映客、馬蜂窩、百度、京東等大廠offer,后就職于京東零售,從事NLP算法領域智能客服的優化工作。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: PCB厂|线路板厂|深圳线路板厂|软硬结合板厂|电路板生产厂家|线路板|深圳电路板厂家|铝基板厂家|深联电路-专业生产PCB研发制造 | 钢绞线万能材料试验机-全自动恒应力两用机-混凝土恒应力压力试验机-北京科达京威科技发展有限公司 | 不锈钢反应釜,不锈钢反应釜厂家-价格-威海鑫泰化工机械有限公司 不干胶标签-不干胶贴纸-不干胶标签定制-不干胶标签印刷厂-弗雷曼纸业(苏州)有限公司 | 电机保护器-电动机综合保护器-上海硕吉电器有限公司 | 滚筒线,链板线,总装线,流水线-上海体能机电有限公司 | 制氮设备_PSA制氮机_激光切割制氮机_氮气机生产厂家-苏州西斯气体设备有限公司 | 日本细胞免疫疗法_肿瘤免疫治疗_NK细胞疗法 - 免疫密码 | 一体化预制泵站-一体化提升泵站-一体化泵站厂家-山东康威环保 | 飞行者联盟-飞机模拟机_无人机_低空经济_航空技术交流平台 | 广东风淋室_广东风淋室厂家_广东风淋室价格_广州开源_传递窗_FFU-广州开源净化科技有限公司 | 生鲜配送系统-蔬菜食材配送管理系统-连锁餐饮订货配送软件-挪挪生鲜供应链管理软件 | 布袋除尘器-单机除尘器-脉冲除尘器-泊头市兴天环保设备有限公司 布袋除尘器|除尘器设备|除尘布袋|除尘设备_诺和环保设备 | 航空障碍灯_高中低光强航空障碍灯_民航许可认证航空警示灯厂家-东莞市天翔航天科技有限公司 | 水冷散热器_水冷电子散热器_大功率散热器_水冷板散热器厂家-河源市恒光辉散热器有限公司 | 长信科技产业园官网_西安厂房_陕西标准工业厂房 | Magnescale探规,Magnescale磁栅尺,Magnescale传感器,Magnescale测厚仪,Mitutoyo光栅尺,笔式位移传感器-苏州连达精密量仪有限公司 | 食品无尘净化车间,食品罐装净化车间,净化车间配套风淋室-青岛旭恒洁净技术有限公司 | 闭端端子|弹簧螺式接线头|防水接线头|插线式接线头|端子台|电源线扣+护线套|印刷电路板型端子台|金笔电子代理商-上海拓胜电气有限公司 | 北京浩云律师事务所-企业法律顾问_破产清算等公司法律服务 | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 钢结构-钢结构厂房-钢结构工程[江苏海逵钢构厂] | VI设计-LOGO设计公司-品牌设计公司-包装设计公司-导视设计-杭州易象设计 | 莱州网络公司|莱州网站建设|莱州网站优化|莱州阿里巴巴-莱州唯佳网络科技有限公司 | 智能楼宇-楼宇自控系统-楼宇智能化-楼宇自动化-三水智能化 | 衬氟旋塞阀-卡套旋塞阀-中升阀门首页 | 集装箱标准养护室-集装箱移动式养护室-广州璟业试验仪器有限公司 | 陕西安玻璃自动感应门-自动重叠门-磁悬浮平开门厂家【捷申达门业】 | 首页 - 军军小站|张军博客 | 江苏农村商业银行招聘网_2024江苏农商行考试指南_江苏农商行校园招聘 | 天津货架厂_穿梭车货架_重型仓储货架_阁楼货架定制-天津钢力仓储货架生产厂家_天津钢力智能仓储装备 | RV减速机-蜗轮蜗杆减速机-洗车机减速机-减速机厂家-艾思捷 | 水性漆|墙面漆|木器家具漆|水漆涂料_晨阳水漆官网 | 仪器仪表网 - 永久免费的b2b电子商务平台 | 高铝矾土熟料_细粉_骨料_消失模_铸造用铝矾土_铝酸钙粉—嵩峰厂家 | 能耗监测系统-节能监测系统-能源管理系统-三水智能化 | 陕西视频监控,智能安防监控,安防系统-西安鑫安5A安防工程公司 | 世界箱包品牌十大排名,女包小众轻奢品牌推荐200元左右,男包十大奢侈品牌排行榜双肩,学生拉杆箱什么品牌好质量好 - Gouwu3.com | 台式低速离心机-脱泡离心机-菌种摇床-常州市万丰仪器制造有限公司 | 西安标准厂房_陕西工业厂房_西咸新区独栋厂房_长信科技产业园官方网站 | 微信聊天记录恢复_手机短信删除怎么恢复_通讯录恢复软件下载-快易数据恢复 | 沥青车辙成型机-车托式混凝土取芯机-混凝土塑料试模|鑫高仪器 |