-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
PYTHON數(shù)據(jù)分析與實戰(zhàn)(微課版) 版權(quán)信息
- ISBN:9787115656216
- 條形碼:9787115656216 ; 978-7-115-65621-6
- 裝幀:平裝
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
PYTHON數(shù)據(jù)分析與實戰(zhàn)(微課版) 本書特色
1.全流程能力培養(yǎng)體系:從NumPy數(shù)值計算到pandas數(shù)據(jù)處理,從Matplotlib可視化到scikit-learn建模,完整覆蓋數(shù)據(jù)分析全鏈路,配套實訓項目實現(xiàn)學練閉環(huán)。
2.商業(yè)級實戰(zhàn)案例驅(qū)動:行業(yè)標桿案例——用戶行為分析、客戶流失預測深度解析,融合回歸、預測、SVM等主流算法,無縫對接企業(yè)級數(shù)據(jù)分析場景。
3.二維可視化能力矩陣:同時掌握Matplotlib+seaborn靜態(tài)可視化與pyecharts交互可視化技術(shù),覆蓋分布分析、相關(guān)性分析等大數(shù)據(jù)分析維度。
4.教學練習一體化設(shè)計:每章配置思維導圖式小結(jié)+分層習題+完整實訓案例,特別提供數(shù)獨游戲矩陣構(gòu)建、超市價格對比等創(chuàng)新實訓場景,實現(xiàn)零障礙上手。
PYTHON數(shù)據(jù)分析與實戰(zhàn)(微課版) 內(nèi)容簡介
本書全面介紹數(shù)據(jù)分析的流程和Python數(shù)據(jù)分析庫的應(yīng)用,詳細講解利用Python解決企業(yè)實際問題的方法。全書共10章,第1章介紹數(shù)據(jù)分析的概念等相關(guān)知識;第2~6章介紹Python數(shù)據(jù)分析的常用庫及其應(yīng)用,涵蓋NumPy數(shù)組計算基礎(chǔ),pandas統(tǒng)計分析基礎(chǔ),使用pandas進行數(shù)據(jù)預處理,Matplotlib、seaborn、pyecharts數(shù)據(jù)可視化基礎(chǔ),以及使用scikit-learn構(gòu)建模型,較為全面地闡述Python數(shù)據(jù)分析方法;第7~9章結(jié)合前面章節(jié)介紹的數(shù)據(jù)分析技術(shù),進行企業(yè)綜合案例數(shù)據(jù)分析;第10章基于去編程化的TipDM大數(shù)據(jù)挖掘建模平臺進行客戶流失預測。除了第1章,其余各章都包含實訓,有利于讀者通過練習和操作實踐鞏固所學內(nèi)容。 本書可以作為高校大數(shù)據(jù)技術(shù)相關(guān)專業(yè)的教材和大數(shù)據(jù)技術(shù)愛好者的自學參考書。
PYTHON數(shù)據(jù)分析與實戰(zhàn)(微課版) 目錄
1.1 認識數(shù)據(jù)分析 2
1.1.1 數(shù)據(jù)分析的概念 2
1.1.2 數(shù)據(jù)分析的流程 3
1.1.3 數(shù)據(jù)分析的應(yīng)用場景 5
1.2 Python數(shù)據(jù)分析 6
1.2.1 數(shù)據(jù)分析常用工具 7
1.2.2 Python數(shù)據(jù)分析的優(yōu)勢 7
1.2.3 Python數(shù)據(jù)分析常用庫 8
1.3 安裝Python的Anaconda發(fā)行版 10
1.3.1 Python的Anaconda發(fā)行版 10
1.3.2 在Windows系統(tǒng)中安裝Anaconda發(fā)行版 10
1.4 Jupyter Notebook的常用功能 13
1.4.1 Jupyter Notebook的基本功能 13
1.4.2 Jupyter Notebook的高級功能 15
小結(jié) 18
課后習題 18
第 2章 NumPy數(shù)組計算基礎(chǔ) 20
2.1 NumPy數(shù)組對象ndarray 21
2.1.1 創(chuàng)建數(shù)組對象 21
2.1.2 生成隨機數(shù) 27
2.1.3 通過索引訪問數(shù)組 29
2.1.4 變換數(shù)組的形狀 31
2.2 NumPy矩陣與通用函數(shù) 34
2.2.1 創(chuàng)建NumPy矩陣 34
2.2.2 ufunc函數(shù) 37
2.3 利用NumPy進行統(tǒng)計分析 40
2.3.1 讀/寫文件 40
2.3.2 使用函數(shù)進行簡單的統(tǒng)計分析 43
小結(jié) 47
實訓 48
實訓1 使用數(shù)組比較運算對超市牛奶價格進行對比 48
實訓2 創(chuàng)建6×6的簡單數(shù)獨游戲矩陣 48
課后習題 48
第3章 pandas統(tǒng)計分析基礎(chǔ) 50
3.1 讀/寫不同數(shù)據(jù)源的數(shù)據(jù) 51
3.1.1 認識pandas 51
3.1.2 讀/寫文本文件 52
3.1.3 讀/寫Excel文件 55
3.1.4 讀/寫數(shù)據(jù)庫 57
3.2 DataFrame的常用操作 60
3.2.1 查看DataFrame的常用屬性 60
3.2.2 查、改、增、刪DataFrame數(shù)據(jù) 61
3.2.3 描述分析DataFrame數(shù)據(jù) 67
3.3 轉(zhuǎn)換與處理時間序列數(shù)據(jù) 70
3.3.1 轉(zhuǎn)換時間字符串為標準時間 70
3.3.2 提取時間序列數(shù)據(jù) 72
3.3.3 時間數(shù)據(jù)的算術(shù)運算 73
3.4 使用分組聚合進行組內(nèi)計算 74
3.4.1 使用groupby()方法拆分數(shù)據(jù) 75
3.4.2 使用agg()方法聚合數(shù)據(jù) 76
3.4.3 使用apply()方法聚合數(shù)據(jù) 79
3.4.4 使用transform()方法聚合數(shù)據(jù) 80
小結(jié) 81
實訓 81
實訓1 讀取并查看某地區(qū)房屋銷售數(shù)據(jù)的基本信息 81
實訓2 提取房屋售出時間信息并描述房屋價格信息 81
實訓3 使用分組聚合方法分析房屋銷售情況 82
課后習題 82
第4章 使用pandas進行數(shù)據(jù)預處理 85
4.1 數(shù)據(jù)合并 86
4.1.1 堆疊合并 86
4.1.2 主鍵合并 89
4.1.3 重疊合并 90
4.2 數(shù)據(jù)清洗 92
4.2.1 檢測與處理重復值 92
4.2.2 檢測與處理缺失值 95
4.2.3 檢測與處理異常值 99
4.3 數(shù)據(jù)標準化 100
4.3.1 離差標準化 101
4.3.2 標準差標準化 101
4.3.3 小數(shù)定標標準化 102
4.4 數(shù)據(jù)變換 103
4.4.1 啞變量處理 103
4.4.2 離散化處理 104
小結(jié) 107
實訓 107
實訓1 合并年齡、平均血糖數(shù)據(jù)和中風患者信息數(shù)據(jù) 107
實訓2 刪除年齡異常的數(shù)據(jù) 108
實訓3 離散化年齡特征 109
課后習題 109
第5章 Matplotlib、seaborn、pyecharts數(shù)據(jù)可視化基礎(chǔ) 111
5.1 Matplotlib基礎(chǔ)繪圖 112
5.1.1 pyplot繪圖基礎(chǔ)語法與常用參數(shù) 112
5.1.2 使用Matplotlib繪制進階圖形 118
5.2 seaborn基礎(chǔ)繪圖 128
5.2.1 seaborn繪圖基礎(chǔ) 128
5.2.2 使用seaborn繪制基礎(chǔ)圖形 144
5.3 pyecharts基礎(chǔ)繪圖 145
5.3.1 pyecharts繪圖基礎(chǔ) 146
5.3.2 使用pyecharts繪制交互式圖形 150
小結(jié) 155
實訓 155
實訓1 分析學生成績特征的分布與分散情況 155
實訓2 分析學生成績與各個特征之間的關(guān)系 156
實訓3 分析各空氣質(zhì)量指標之間的相關(guān)關(guān)系 156
實訓4 繪制交互式基礎(chǔ)圖形 157
課后習題 158
第6章 使用scikit-learn構(gòu)建模型 160
6.1 使用sklearn轉(zhuǎn)換器處理數(shù)據(jù) 161
6.1.1 加載datasets模塊中的數(shù)據(jù)集 161
6.1.2 將數(shù)據(jù)集劃分為訓練集和測試集 164
6.1.3 使用sklearn轉(zhuǎn)換器進行數(shù)據(jù)預處理 165
6.2 構(gòu)建并評價聚類模型 167
6.2.1 使用sklearn估計器構(gòu)建聚類模型 168
6.2.2 評價聚類模型 171
6.3 構(gòu)建并評價分類模型 173
6.3.1 使用sklearn估計器構(gòu)建分類模型 173
6.3.2 評價分類模型 175
6.4 構(gòu)建并評價回歸模型 176
6.4.1 使用sklearn估計器構(gòu)建線性回歸模型 177
6.4.2 評價回歸模型 179
小結(jié) 180
實訓 181
實訓1 使用sklearn處理競標行為數(shù)據(jù)集 181
實訓2 構(gòu)建基于競標行為數(shù)據(jù)集的K-Means聚類模型 182
實訓3 構(gòu)建基于競標行為數(shù)據(jù)集的支持向量機分類模型 182
實訓4 構(gòu)建基于競標行為數(shù)據(jù)集的回歸模型 182
課后習題 183
第7章 競賽網(wǎng)站用戶行為分析 185
7.1 競賽網(wǎng)站用戶行為分析的背景和方法 186
7.1.1 分析競賽網(wǎng)站背景 186
7.1.2 認識用戶行為分析 187
7.1.3 競賽網(wǎng)站用戶行為分析的步驟與流程 187
7.2 預處理競賽網(wǎng)站用戶訪問數(shù)據(jù) 188
7.2.1 用戶識別 188
7.2.2 數(shù)據(jù)清洗 189
7.2.3 網(wǎng)頁分類 192
7.2.4 構(gòu)造特征 194
7.3 對競賽網(wǎng)站用戶進行分群 194
7.3.1 K-Means聚類算法 195
7.3.2 使用K-Means聚類算法進行用戶分群 196
7.3.3 模型應(yīng)用 198
小結(jié) 198
實訓 198
實訓1 處理某App用戶信息數(shù)據(jù)集 198
實訓2 構(gòu)建與用戶使用信息相關(guān)的特征 199
實訓3 構(gòu)建K-Means聚類模型 200
課后習題 200
第8章 企業(yè)所得稅預測分析 201
8.1 企業(yè)所得稅預測的背景與方法 202
8.1.1 分析企業(yè)所得稅預測背景 202
8.1.2 企業(yè)所得稅預測的方法 204
8.1.3 企業(yè)所得稅預測的步驟與流程 204
8.2 分析企業(yè)所得稅數(shù)據(jù)特征的相關(guān)性 205
8.2.1 相關(guān)性分析 205
8.2.2 計算Pearson相關(guān)系數(shù) 205
8.3 使用Lasso回歸方法選取企業(yè)所得稅預測的關(guān)鍵特征 207
8.3.1 Lasso回歸方法 207
8.3.2 選取關(guān)鍵特征 208
8.4 使用灰色預測算法和SVR算法構(gòu)建企業(yè)所得稅預測模型 209
8.4.1 灰色預測算法 209
8.4.2 SVR算法 210
8.4.3 預測企業(yè)所得稅 211
小結(jié) 214
實訓 215
實訓1 處理二手汽車交易數(shù)據(jù)集 215
實訓2 構(gòu)建二手汽車價格預測關(guān)鍵特征 216
實訓3 構(gòu)建線性回歸模型 216
課后習題 217
第9章 餐飲企業(yè)客戶流失預測 218
9.1 餐飲企業(yè)客戶分析需求 219
9.1.1 分析餐飲企業(yè)客戶流失預測背景 219
9.1.2 認識餐飲企業(yè)客戶流失預測 221
9.1.3 餐飲企業(yè)客戶流失預測的步驟與流程 221
9.2 預處理餐飲企業(yè)數(shù)據(jù) 221
9.2.1 數(shù)據(jù)探索 222
9.2.2 查看重復值 224
9.2.3 處理異常值 224
9.2.4 處理缺失值 225
9.2.5 構(gòu)建客戶流失特征 226
9.3 使用決策樹算法和支持向量機算法進行餐飲企業(yè)客戶流失預測 228
9.3.1 決策樹算法 228
9.3.2 支持向量機算法 229
9.3.3 預測餐飲企業(yè)客戶流失 231
小結(jié) 233
實訓 233
實訓1 預處理尺碼信息數(shù)據(jù) 233
實訓2 構(gòu)建支持向量機分類模型預測客戶服裝尺寸 234
課后習題 234
第 10章 基于TipDM大數(shù)據(jù)挖掘建模平臺進行客戶流失預測 236
10.1 平臺簡介 237
10.1.1 共享庫 238
10.1.2 數(shù)據(jù)連接 238
10.1.3 數(shù)據(jù)集 239
10.1.4 我的工程 239
10.1.5 個人組件 242
10.2 使用平臺進行客戶流失預測 242
10.2.1 使用平臺配置客戶流失預測案例的步驟和流程 242
10.2.2 數(shù)據(jù)源配置 244
10.2.3 數(shù)據(jù)預處理 245
10.2.4 構(gòu)建模型 251
小結(jié) 256
實訓 256
實訓 預測客戶服裝尺寸 256
課后習題 256
PYTHON數(shù)據(jù)分析與實戰(zhàn)(微課版) 作者簡介
趙男男,廣東海洋大學副教授,碩士研究生導師,省優(yōu)秀教師,九三學社社員,市政協(xié)委員,中國人工智能學會專委委員,廣東海洋大學計算機科學與工程學院副院長,主要從事計算機應(yīng)用方向教學與科研工作。在國內(nèi)外權(quán)威刊物累計發(fā)表論文50余篇,獲發(fā)明專利3項,軟件著作權(quán)10項,主持省部級課題10余項,參與課題若干項。 曾在國內(nèi)外重要學術(shù)刊物上發(fā)表學術(shù)論文10余篇,主導編寫圖書專著60余部,其中獲普通高等教育“十一五”規(guī)劃教材一部,“十三五”職業(yè)教育國家規(guī)劃教材一部;參與標準建設(shè)4項,主持國家級課題1項、省部級課題4項。獲得SAS、SPSS數(shù)據(jù)挖掘認證及Hadoop開發(fā)工程師證書,具有信訪、電力、電信、銀行、制造企業(yè)、電子商務(wù)和電子政務(wù)的項目經(jīng)驗和行業(yè)背景,并榮獲中國產(chǎn)學研合作促進獎、中國南方電網(wǎng)公司發(fā)明專利一等獎、廣東省農(nóng)業(yè)技術(shù)推廣二等獎、廣州市荔灣區(qū)科學技術(shù)進步獎。
- >
朝聞道
- >
小考拉的故事-套裝共3冊
- >
伊索寓言-世界文學名著典藏-全譯本
- >
二體千字文
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
龍榆生:詞曲概論/大家小書
- >
煙與鏡
- >
【精裝繪本】畫給孩子的中國神話