python數(shù)據(jù)分析 版權(quán)信息
- ISBN:9787302555179
- 條形碼:9787302555179 ; 978-7-302-55517-9
- 裝幀:簡裝本
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
python數(shù)據(jù)分析 本書特色
本書涉及的主題 數(shù)據(jù)分析; 數(shù)據(jù)清洗; 數(shù)據(jù)可視化; 探索性數(shù)據(jù)分析; 概率分布與假設(shè)檢驗(yàn); 群組分析; 購物籃分析; 時(shí)間序列分析。 本書突出的特點(diǎn) 系統(tǒng)討論基于Python的數(shù)據(jù)分析環(huán)境構(gòu)建與數(shù)據(jù)分析流程; 將數(shù)據(jù)分析理論與實(shí)踐結(jié)合,基于真實(shí)的案例介紹數(shù)據(jù)分析。
python數(shù)據(jù)分析 內(nèi)容簡介
這是一個數(shù)據(jù)驅(qū)動的時(shí)代,如何解讀數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)變?yōu)橹R、利用知識做出決策將是所有企業(yè)必不可少的能力。在數(shù)據(jù)分析過程中我們清洗數(shù)據(jù),探索數(shù)據(jù),利用數(shù)據(jù)進(jìn)行決策。本書將以當(dāng)前z流行數(shù)據(jù)科學(xué)分析工具Python為基礎(chǔ)介紹如何構(gòu)建基于Python的數(shù)據(jù)科學(xué)環(huán)境,利用Pandas處理與分析數(shù)據(jù),如何利用Matplotlib以及Seaborn進(jìn)行數(shù)據(jù)可視化。同時(shí)本書還將以商業(yè)應(yīng)用為目標(biāo),通過學(xué)習(xí)還將掌握何利用學(xué)習(xí)到的Python數(shù)據(jù)分析知識來完成客戶留存分析,同期群分析,時(shí)間序列分析,產(chǎn)品銷售數(shù)據(jù)的關(guān)聯(lián)分析,客戶聚類,統(tǒng)計(jì)檢驗(yàn)等數(shù)據(jù)分析。
python數(shù)據(jù)分析 目錄
上篇Pandas數(shù)據(jù)分析基礎(chǔ)
第1章數(shù)據(jù)分析初探
1.1“數(shù)據(jù)+”時(shí)代的到來
1.2什么是數(shù)據(jù)分析
1.2.1數(shù)據(jù)分析的目標(biāo)
1.2.2數(shù)據(jù)分析分類
1.2.3典型的數(shù)據(jù)分析方法
1.3數(shù)據(jù)分析的基本流程
1.3.1問題定義
1.3.2收集數(shù)據(jù)
1.3.3數(shù)據(jù)處理
1.3.4數(shù)據(jù)分析
1.3.5結(jié)果解讀與應(yīng)用
1.4硝煙中的數(shù)據(jù)分析
1.4.1數(shù)據(jù)分析的產(chǎn)生
1.4.2驗(yàn)證問題
1.4.3尋找原因
1.4.4數(shù)據(jù)怎么說
1.4.5數(shù)據(jù)分析中應(yīng)該避免的典型問題
第2章搭建數(shù)據(jù)科學(xué)開發(fā)環(huán)境
2.1為什么選擇Python
2.1.1人生苦短,我用Python
2.1.2為何Python是數(shù)據(jù)科學(xué)家的*佳選擇
2.2Python數(shù)據(jù)科學(xué)開發(fā)棧
2.2.1Cython
2.2.2NumPy
2.2.3IPython
2.2.4Jupyter
2.2.5SciPy
2.2.6Matplotlib
2.2.7Pandas
2.2.8Scikitlearn
2.2.9NetworkX
2.2.10PyMC3
2.2.11數(shù)據(jù)科學(xué)領(lǐng)域中*新的一些Python包
2.3Anaconda的安裝與使用
2.3.1安裝Anaconda
2.3.2利用Conda管理Python環(huán)境
2.3.3利用Conda管理Python包
2.3.4安裝本書所需的包
2.4使用Jupyter Notebook進(jìn)行可重復(fù)數(shù)據(jù)分析
2.4.1Jupyter Notebook的配置
2.4.2Jupyter Notebook中的單元格
2.4.3Jupyter Notebook中的命令模式與編輯模式鍵
2.4.4使用Jupyter Notebook進(jìn)行數(shù)據(jù)分析
第3章Pandas基礎(chǔ)
3.1什么是DataFrame
3.1.1DataFrame的基本要素
3.1.2數(shù)據(jù)類型
3.1.3了解Series
3.1.4鏈?zhǔn)椒椒?br />3.2索引與列
3.2.1修改索引與列
3.2.2添加、修改或刪除列
3.3選擇多列
第4章數(shù)據(jù)篩選
4.1使用.loc和.iloc篩選行與列數(shù)據(jù)
4.1.1選擇Series和DataFrame中的行
4.1.2同時(shí)選擇行與列
4.2布爾選擇
4.2.1計(jì)算布爾值
4.2.2多條件篩選數(shù)據(jù)
第5章開始利用Pandas進(jìn)行數(shù)據(jù)分析
5.1了解元數(shù)據(jù)
5.2數(shù)據(jù)類型轉(zhuǎn)換
5.3缺失數(shù)據(jù)與異常數(shù)據(jù)處理
5.3.1缺失值與重復(fù)值
5.3.2處理缺失數(shù)據(jù)
5.3.3NumPy與Pandas對缺失數(shù)據(jù)的不同處理方式
5.3.4填充缺失值
5.4處理重復(fù)數(shù)據(jù)
5.5異常值
5.6描述性統(tǒng)計(jì)
第6章數(shù)據(jù)整理
6.1什么是數(shù)據(jù)整理
6.1.1數(shù)據(jù)的語義
6.1.2整齊的數(shù)據(jù)
6.2數(shù)據(jù)整理實(shí)戰(zhàn)
6.2.1列標(biāo)題是值,而非變量名
6.2.2多個變量存儲在一列中
6.2.3變量既在列中存儲,又在行中存儲
6.2.4多個觀測單元存儲在同一表中
6.2.5一個觀測單元存儲在多個表中
6.2.6思考
第7章分組統(tǒng)計(jì)
7.1分組、應(yīng)用和聚合
7.2Pandas中的GroupBy操作
7.2.1單列數(shù)據(jù)分組統(tǒng)計(jì)
7.2.2多列數(shù)據(jù)分組統(tǒng)計(jì)
7.2.3使用自定義函數(shù)進(jìn)行分組統(tǒng)計(jì)
7.2.4數(shù)據(jù)過濾與變換
第8章數(shù)據(jù)整合
8.1數(shù)據(jù)讀入
8.1.1基本數(shù)據(jù)讀入方法
8.1.2文件讀取進(jìn)階
8.1.3讀取其他格式文件
8.2數(shù)據(jù)合并
8.2.1認(rèn)識merge操作
8.2.2merge進(jìn)階
8.2.3join與concat
第9章數(shù)據(jù)可視化
9.1Matplotlib
9.1.1繪制**個散點(diǎn)圖
9.1.2理解figure與axes
9.1.3Matplotlib中面向?qū)ο笈c類Matlab語法的區(qū)別
9.1.4修改坐標(biāo)軸屬性
9.1.5修改圖形屬性
9.1.6定制圖例,添加標(biāo)注
9.1.7子圖
9.1.8利用Matplotlib繪制各種圖形
9.2Pandas繪圖
9.2.1Pandas基礎(chǔ)繪圖
9.2.2整合Pandas繪圖與Matplotlib繪圖
9.3Seaborn
9.3.1Seaborn中的樣式
9.3.2Seaborn繪制統(tǒng)計(jì)圖形
9.4可視化進(jìn)階
9.4.1其他可視化工具
9.4.2推薦讀物
第10章探索性數(shù)據(jù)分析——某電商銷售數(shù)據(jù)分析
10.1數(shù)據(jù)清洗
10.1.1分析準(zhǔn)備
10.1.2了解數(shù)據(jù)
10.2數(shù)據(jù)清洗與整理
10.2.1數(shù)據(jù)類型轉(zhuǎn)換與錯誤數(shù)據(jù)刪除
10.2.2添加新數(shù)據(jù)
10.3探索性數(shù)據(jù)分析
10.3.1客戶分析
10.3.2訂單趨勢分析
10.3.3客戶國家分析
10.3.4留給讀者的問題
下篇Python數(shù)據(jù)分析實(shí)戰(zhàn)
第11章群組分析
11.1群組分析概述
11.1.1從AARRR到RARRA的轉(zhuǎn)變
11.1.2什么是群組分析
11.2群組分析實(shí)戰(zhàn)
11.2.1定義群組以及周期
11.2.2群組分析具體過程
11.2.3思考
第12章利用RFM分析對用戶進(jìn)行分類
12.1RFM分析簡介
12.1.1RFM模型概述
12.1.2理解RFM
12.2RFM實(shí)戰(zhàn)
12.2.1R、F、M值的計(jì)算
12.2.2利用RFM模型對客戶進(jìn)行細(xì)分
12.2.3思考
第13章購物籃分析
13.1購物籃分析概述
13.1.1什么是購物籃分析
13.1.2購物籃分析在超市中的應(yīng)用
13.1.3購物籃分析實(shí)現(xiàn)
13.2購物籃分析案例
13.2.1Mlxtend庫中Apriori算法使用介紹
13.2.2在線銷售數(shù)據(jù)購物籃分析
13.3留給讀者的思考
第14章概率分布
14.1隨機(jī)數(shù)
14.2常見的概率分布
14.2.1均勻分布
14.2.2正態(tài)分布
14.2.3二項(xiàng)分布
14.2.4泊松分布
14.2.5幾何分布與指數(shù)分布
14.3點(diǎn)估計(jì)與置信區(qū)間
14.3.1點(diǎn)估計(jì)
14.3.2抽樣分布與中心極限定理
14.3.3置信區(qū)間
14.4留給讀者的思考
第15章假設(shè)檢驗(yàn)
15.1假設(shè)檢驗(yàn)概述
15.1.1初識假設(shè)檢驗(yàn)
15.1.2假設(shè)檢驗(yàn)的步驟
15.1.3假設(shè)檢驗(yàn)中的Ⅰ類錯誤與Ⅱ類錯誤
15.2Python中的假設(shè)檢驗(yàn)
15.2.1單樣本ttest
15.2.2雙樣本ttest
15.2.3配對ttest
15.2.4卡方檢驗(yàn)
15.3留給讀者的思考
第16章一名數(shù)據(jù)分析師的游戲上線之旅
16.1游戲啟動時(shí)間是否超過目標(biāo)
16.1.1啟動時(shí)間是否超過3秒
16.1.2構(gòu)造啟動時(shí)間監(jiān)測圖
16.2次日留存率是否大于30%
16.3應(yīng)該在游戲第幾關(guān)加入關(guān)聯(lián)微信提示
16.3.1A/B測試
16.3.2貝葉斯解決方案
16.4如何定價(jià)
16.5留給讀者的思考
第17章利用數(shù)據(jù)分析找工作
17.1設(shè)定分析目標(biāo)
17.1.1問題定義
17.1.2獲取數(shù)據(jù)
17.2準(zhǔn)備分析數(shù)據(jù)
17.2.1數(shù)據(jù)準(zhǔn)備
17.2.2數(shù)據(jù)清洗
17.3開始數(shù)據(jù)分析
17.3.1職位來自哪里
17.3.2職位薪酬如何
17.3.3崗位要求
17.3.4思考
第18章用數(shù)據(jù)解讀成都房價(jià)
18.1設(shè)定分析目標(biāo)
18.1.1問題定義
18.1.2獲取數(shù)據(jù)
18.2解讀成都二手房
18.2.1數(shù)據(jù)準(zhǔn)備
18.2.2列名調(diào)整
18.2.3數(shù)據(jù)類型轉(zhuǎn)換
18.2.4數(shù)據(jù)解讀
18.2.5思考
第19章時(shí)間序列分析
19.1認(rèn)識時(shí)間序列數(shù)據(jù)
19.1.1讀入時(shí)間序列數(shù)據(jù)
19.1.2時(shí)間序列數(shù)據(jù)的可視化
19.2時(shí)間序列數(shù)據(jù)的分解
19.2.1認(rèn)識時(shí)間序列數(shù)據(jù)中的模式
19.2.2Python中進(jìn)行時(shí)間序列數(shù)據(jù)的分解
19.3時(shí)間序列的平穩(wěn)性
19.3.1認(rèn)識平穩(wěn)與非平穩(wěn)時(shí)間序列
19.3.2如何讓時(shí)間序列平穩(wěn)
19.4利用ARIMA模型分析家具銷售
19.4.1ARIMA模型簡介
19.4.2數(shù)據(jù)準(zhǔn)備
19.4.3ARIMA模型中的參數(shù)
19.5留給讀者的思考
第20章股票數(shù)據(jù)分析
20.1股票收益分析
20.1.1獲取股票數(shù)據(jù)
20.1.2計(jì)算每日收益
20.1.3多只股票收益比較
20.1.4股價(jià)相關(guān)性分析
20.2CAPM資產(chǎn)定價(jià)模型選股
20.2.1CAPM公式
20.2.2在Python中實(shí)現(xiàn)CAPM
20.3留給讀者的思考
第21章大規(guī)模數(shù)據(jù)處理
21.1不同規(guī)模數(shù)據(jù)處理工具的選擇
21.2利用Pandas處理大規(guī)模數(shù)據(jù)
21.2.1文件分塊讀入
21.2.2使用數(shù)據(jù)庫
21.2.3使用DASK
21.3其他可選方法
21.4留給讀者的思考
python數(shù)據(jù)分析 作者簡介
江雪松 2001年獲工學(xué)碩士學(xué)位,曾服務(wù)于華為、諾基亞等公司,有豐富的產(chǎn)品團(tuán)隊(duì)與研發(fā)團(tuán)隊(duì)管理經(jīng)驗(yàn)。先后擔(dān)任項(xiàng)目經(jīng)理、研發(fā)經(jīng)理、產(chǎn)品研發(fā)負(fù)責(zé)人,管理多個產(chǎn)品全球支持與交付團(tuán)隊(duì),軟件維護(hù)業(yè)務(wù)。 鄒靜 2006年獲理學(xué)碩士學(xué)位,現(xiàn)服務(wù)于四川省人民醫(yī)院,擔(dān)任副主任藥師。擁有十多年的臨床藥物試驗(yàn)設(shè)計(jì)、數(shù)據(jù)統(tǒng)計(jì)與分析經(jīng)驗(yàn)。先后參加了多個國家自然科學(xué)基金項(xiàng)目及四川省衛(wèi)生廳科研項(xiàng)目。
- >
羅庸西南聯(lián)大授課錄
- >
伯納黛特,你要去哪(2021新版)
- >
小考拉的故事-套裝共3冊
- >
李白與唐代文化
- >
回憶愛瑪儂
- >
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
- >
自卑與超越
- >
我從未如此眷戀人間