中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
OReilly精品圖書系列利用PYTHON進行數據分析(原書第2版)

包郵 OReilly精品圖書系列利用PYTHON進行數據分析(原書第2版)

出版社:機械工業出版社出版時間:2018-07-01
開本: 16開 頁數: 476
中 圖 價:¥71.4(6.0折) 定價  ¥119.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

OReilly精品圖書系列利用PYTHON進行數據分析(原書第2版) 版權信息

  • ISBN:9787111603702
  • 條形碼:9787111603702 ; 978-7-111-60370-2
  • 裝幀:簡裝本
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

OReilly精品圖書系列利用PYTHON進行數據分析(原書第2版) 本書特色

本書由Python pandas項目創始人Wes McKinney親筆撰寫,詳細介紹利用Python進行操作、處理、清洗和規整數據等方面的具體細節和基本要點。第2版針對Python 3.6進行全面修訂和更新,涵蓋新版的pandas、NumPy、IPython和Jupyter,并增加大量實際案例,可以幫助你高效解決一系列數據分析問題。
第2版中的主要更新包括:
•所有的代碼,包括把Python的教程更新到了Python
3.6版本(第1版中使用的是Python
2.7)
•更新了Python第三方發布版Anaconda和其他所需Python包的安裝指引
•更新pandas庫到2017年的新版
•新增一章,關于更多高級pandas工具和一些使用提示
•新增statsmodels和scikit-learn的簡明使用介紹

OReilly精品圖書系列利用PYTHON進行數據分析(原書第2版) 內容簡介

閱讀本書可以獲得關于在Python下操作、處理、清洗、規整數據集的完整說明。本書第2版針對Python3.6進行了更新,并增加了實際案例向你展示如何高效地解決一系列數據分析問題。你將在閱讀過程中學習到新版本的pandas、NumPy、IPython和Jupyter。

OReilly精品圖書系列利用PYTHON進行數據分析(原書第2版) 目錄

前言1
第1章 準備工作7
1.1 本書內容7
1.1.1 什么類型的數據7
1.2 為何利用Python進行數據分析8
1.2.1 Python作為膠水8
1.2.2 解決“雙語言”難題8
1.2.3 為何不使用Python9
1.3 重要的Python庫9
1.3.1 NumPy9
1.3.2 pandas10
1.3.3
matplotlib11
1.3.4 IPython與Jupyter11
1.3.5 SciPy12
1.3.6
scikit-learn12
1.3.7
statsmodels13
1.4 安裝與設置13
1.4.1 Windows14
1.4.2 Apple(OS X和macOS)14
1.4.3 GNU/Linux14
1.4.4 安裝及更新Python包15
1.4.5 Python 2和Python 316
1.4.6 集成開發環境和文本編輯器16
1.5 社區和會議17
1.6 快速瀏覽本書17
1.6.1 代碼示例18
1.6.2 示例數據18
1.6.3導入約定18
1.6.4術語19
第2章 Python語言基礎、IPython及Jupyter notebook20
2.1 Python解釋器21
2.2 IPython基礎22
2.2.1 運行IPython命令行22
2.2.2 運行 Jupyter notebook23
2.2.3 Tab補全25
2.2.4 內省27
2.2.5 %run命令28
2.2.6 執行剪貼板中的程序30
2.2.7 終端快捷鍵30
2.2.8 關于魔術命令31
2.2.9 matplotlib集成33
2.3 Python語言基礎34
2.3.1 語言語義34
2.3.2 標量類型42
2.3.3 控制流49
第3章 內建數據結構、函數及文件54
3.1 數據結構和序列54
3.1.1 元組54
3.1.2 列表57
3.1.3 內建序列函數61
3.1.4 字典64
3.1.5集合67
3.1.6 列表、集合和字典的推導式69
3.2 函數72
3.2.1 命名空間、作用域和本地函數72
3.2.2 返回多個值73
3.2.3 函數是對象74
3.2.4 匿名(Lambda)函數75
3.2.5 柯里化:部分參數應用76
3.2.6 生成器77
3.2.7 錯誤和異常處理79
3.3 文件與操作系統82
3.3.1 字節與Unicode文件85
3.4 本章小結86
第4章 NumPy基礎:數組與向量化計算87
4.1 NumPy ndarray:多維數組對象89
4.1.1 生成ndarray90
4.1.2 ndarray的數據類型92
4.1.3 NumPy數組算術94
4.1.4 基礎索引與切片95
4.1.5 布爾索引100
4.1.6 神奇索引103
4.1.7 數組轉置和換軸104
4.2 通用函數:快速的逐元素數組函數106
4.3 使用數組進行面向數組編程109
4.3.1 將條件邏輯作為數組操作110
4.3.2 數學和統計方法111
4.3.3 布爾值數組的方法113
4.3.4 排序114
4.3.5 唯一值與其他集合邏輯115
4.4 使用數組進行文件輸入和輸出115
4.5 線性代數116
4.6 偽隨機數生成118
4.7 示例:隨機漫步120
4.7.1 一次性模擬多次隨機漫步121
4.8 本章小結122
第5章 pandas入門123
5.1 pandas數據結構介紹123
5.1.1 Series123
5.1.2
DataFrame128
5.1.3 索引對象134
5.2 基本功能135
5.2.1 重建索引136
5.2.2 軸向上刪除條目138
5.2.3 索引、選擇與過濾140
5.2.4 整數索引144
5.2.5 算術和數據對齊145
5.2.6 函數應用和映射150
5.2.7 排序和排名152
5.2.8 含有重復標簽的軸索引155
5.3 描述性統計的概述與計算157
5.3.1 相關性和協方差159
5.3.2 唯一值、計數和成員屬性161
5.4 本章小結164
第6章 數據載入、存儲及文件格式165
6.1 文本格式數據的讀寫165
6.1.1 分塊讀入文本文件171
6.1.2 將數據寫入文本格式172
6.1.3 使用分隔格式174
6.1.4 JSON數據176
6.1.5 XML和HTML:網絡抓取177
6.2 二進制格式180
6.2.1 使用HDF5格式181
6.2.2 讀取Microsoft Excel文件183
6.3 與Web API交互184
6.4 與數據庫交互186
6.5 本章小結187
第7章 數據清洗與準備188
7.1 處理缺失值188
7.1.1 過濾缺失值189
7.1.2 補全缺失值191
7.2 數據轉換194
7.2.1 刪除重復值194
7.2.2 使用函數或映射進行數據轉換195
7.2.3 替代值197
7.2.4 重命名軸索引198
7.2.5 離散化和分箱199
7.2.6 檢測和過濾異常值202
7.2.7 置換和隨機抽樣203
7.2.8 計算指標/虛擬變量204
7.3 字符串操作207
7.3.1 字符串對象方法208
7.3.2 正則表達式210
7.3.3 pandas中的向量化字符串函數213
7.4 本章小結215
第8章 數據規整:連接、聯合與重塑216
8.1 分層索引216
8.1.1重排序和層級排序219
8.1.2 按層級進行匯總統計220
8.1.3 使用DataFrame的列進行索引220
8.2 聯合與合并數據集221
8.2.1 數據庫風格的DataFrame連接222
8.2.2 根據索引合并226
8.2.3 沿軸向連接230
8.2.4 聯合重疊數據235
8.3 重塑和透視236
8.3.1 使用多層索引進行重塑236
8.3.2 將“長”透視為“寬”240
8.3.3 將“寬”透視為“長”242
8.4 本章小結244
第9章 繪圖與可視化245
9.1 簡明matplotlib API入門245
9.1.1 圖片與子圖246
9.1.2 顏色、標記和線類型250
9.1.3 刻度、標簽和圖例252
9.1.4 注釋與子圖加工255
9.1.5 將圖片保存到文件258
9.1.6 matplotlib設置258
9.2 使用pandas和seaborn繪圖259
9.2.1 折線圖259
9.2.2 柱狀圖262
9.2.3 直方圖和密度圖266
9.2.4 散點圖或點圖269
9.2.5 分面網格和分類數據270
9.3 其他Python可視化工具271
9.4 本章小結272
第10章 數據聚合與分組操作274
10.1 GroupBy機制274
10.1.1 遍歷各分組278
10.1.2 選擇一列或所有列的子集279
10.1.3 使用字典和Series分組280
10.1.4 使用函數分組281
10.1.5 根據索引層級分組282
10.2 數據聚合282
10.2.1 逐列及多函數應用284
10.2.2 返回不含行索引的聚合數據287
10.3 應用:通用拆分-應用-聯合288
10.3.1 壓縮分組鍵290
10.3.2 分位數與桶分析291
10.3.3 示例:使用指定分組值填充缺失值292
10.3.4 示例:隨機采樣與排列294
10.3.5 示例:分組加權平均和相關性296
10.3.6 示例:逐組線性回歸298
10.4 數據透視表與交叉表298
10.4.1 交叉表:crosstab301
10.5 本章小結302
第11章 時間序列303
11.1 日期和時間數據的類型及工具303
11.1.1 字符串與datetime互相轉換305
11.2 時間序列基礎307
11.2.1 索引、選擇、子集308
11.2.2 含有重復索引的時間序列311
11.3 日期范圍、頻率和移位312
11.3.1 生成日期范圍313
11.3.2 頻率和日期偏置316
11.3.3 移位(前向和后向)日期317
11.4 時區處理320
11.4.1 時區的本地化和轉換320
11.4.2 時區感知時間戳對象的操作323
11.4.3 不同時區間的操作324
11.5 時間區間和區間算術324
11.5.1 區間頻率轉換326
11.5.2 季度區間頻率327
11.5.3 將時間戳轉換為區間(以及逆轉換)329
11.5.4 從數組生成PeriodIndex330
11.6 重新采樣與頻率轉換332
11.6.1 向下采樣334
11.6.2 向上采樣與插值336
11.6.3 使用區間進行重新采樣337
11.7 移動窗口函數339
11.7.1 指數加權函數342
11.7.2 二元移動窗口函數343
11.7.3 用戶自定義的移動窗口函數344
11.8 本章小結344
第12章 高階pandas346
12.1 分類數據346
12.1.1 背景和目標346
12.1.2 pandas中的Categorical類型348
12.1.3 使用Categorical對象進行計算350
12.1.4 分類方法352
12.2 高階GroupBy應用355
12.2.1 分組轉換和“展開”GroupBy355
12.2.2 分組的時間重新采樣359
12.3 方法鏈技術361
12.3.1 pipe方法362
12.4 本章小結363
第13章 Python建模庫介紹364
13.1 pandas與建模代碼的結合364
13.2 使用Patsy創建模型描述367
13.2.1 Patsy公式中的數據轉換369
13.2.2 分類數據與Patsy371
13.3 statsmodels介紹373
13.3.1 評估線性模型374
13.3.2 評估時間序列處理377
13.4 scikit-learn介紹377
13.5 繼續你的教育381
第14章 數據分析示例382
14.1 從Bitly獲取1.USA.gov數據382
14.1.1 純Python時區計數383
14.1.2 使用pandas進行時區計數385
14.2 MovieLens 1M數據集392
14.2.1 測量評價分歧396
14.3 美國1880~2010年的嬰兒名字397
14.3.1分析名字趨勢402
14.4 美國農業部食品數據庫410
14.5 2012年聯邦選舉委員會數據庫416
14.5.1 按職業和雇主的捐獻統計419
14.5.2 捐贈金額分桶421
14.5.3 按州進行捐贈統計423
14.6 本章小結424
附錄A 高階NumPy425
附錄B 更多IPython系統相關內容457
展開全部

OReilly精品圖書系列利用PYTHON進行數據分析(原書第2版) 作者簡介

Wes McKinney 是流行的Python開源數據分析庫pandas的創始人。他是一名活躍的演講者,也是Python數據社區和Apache軟件基金會的Python/C 開源開發者。目前他在紐約從事軟件架構師工作。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 陶瓷砂磨机,盘式砂磨机,棒销式砂磨机-无锡市少宏粉体科技有限公司 | 东莞猎头公司_深圳猎头公司_广州猎头公司-广东万诚猎头提供企业中高端人才招聘服务 | 中国玩具展_玩具展|幼教用品展|幼教展|幼教装备展 | 哈尔滨京科脑康神经内科医院-哈尔滨治疗头痛医院-哈尔滨治疗癫痫康复医院 | 土壤肥料养分速测仪_测土配方施肥仪_土壤养分检测仪-杭州鸣辉科技有限公司 | 高压分散机(高压细胞破碎仪)百科-北京天恩瀚拓 | 网带通过式抛丸机,,网带式打砂机,吊钩式,抛丸机,中山抛丸机生产厂家,江门抛丸机,佛山吊钩式,东莞抛丸机,中山市泰达自动化设备有限公司 | 户外环保不锈钢垃圾桶_标识标牌制作_园林公园椅厂家_花箱定制-北京汇众环艺 | 玻璃钢罐_玻璃钢储罐_盐酸罐厂家-河北华盛节能设备有限公司 | 硬度计,金相磨抛机_厂家-莱州华煜众信试验仪器有限公司 | 新疆系统集成_新疆系统集成公司_系统集成项目-新疆利成科技 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | 拉力机-万能试验机-材料拉伸试验机-电子拉力机-拉力试验机厂家-冲击试验机-苏州皖仪实验仪器有限公司 | 钢丝绳探伤仪-钢丝绳检测仪-钢丝绳探伤设备-洛阳泰斯特探伤技术有限公司 | 恒温恒湿试验箱_高低温试验箱_恒温恒湿箱-东莞市高天试验设备有限公司 | 硫酸亚铁-聚合硫酸铁-除氟除磷剂-复合碳源-污水处理药剂厂家—长隆科技 | 超声波气象站_防爆气象站_空气质量监测站_负氧离子检测仪-风途物联网 | 生物制药洁净车间-GMP车间净化工程-食品净化厂房-杭州波涛净化设备工程有限公司 | 粉末冶金注射成型厂家|MIM厂家|粉末冶金齿轮|MIM零件-深圳市新泰兴精密科技 | 深圳诚暄fpc首页-柔性线路板,fpc柔性线路板打样生产厂家 | 酸度计_PH计_特斯拉计-西安云仪 纯水电导率测定仪-万用气体检测仪-低钠测定仪-米沃奇科技(北京)有限公司www.milwaukeeinst.cn | 厚壁钢管-厚壁无缝钢管-小口径厚壁钢管-大口径厚壁钢管 - 聊城宽达钢管有限公司 | 骨灰存放架|骨灰盒寄存架|骨灰架厂家|智慧殡葬|公墓陵园管理系统|网上祭奠|告别厅智能化-厦门慈愿科技 | 拖鞋定制厂家-品牌拖鞋代加工厂-振扬实业中国高端拖鞋大型制造商 | 广东佛电电器有限公司|防雷开关|故障电弧断路器|智能量测断路器 广东西屋电气有限公司-广东西屋电气有限公司 | 金刚网,金刚网窗纱,不锈钢网,金刚网厂家- 河北萨邦丝网制品有限公司 | 丹佛斯变频器-丹佛斯压力开关-变送器-广州市风华机电设备有限公司 | 创富网-B2B网站|供求信息网|b2b平台|专业电子商务网站 | 高铝砖-高铝耐火球-高铝耐火砖生产厂家-价格【荣盛耐材】 | 重庆网站建设,重庆网站设计,重庆网站制作,重庆seo,重庆做网站,重庆seo,重庆公众号运营,重庆小程序开发 | 耐酸碱泵-自吸耐酸碱泵型号「品牌厂家」立式耐酸碱泵价格-昆山国宝过滤机有限公司首页 | 执业药师报名条件,考试时间,考试真题,报名入口—首页 | 高效复合碳源-多核碳源生产厂家-污水处理反硝化菌种一长隆科技库巴鲁 | 防水套管厂家_刚性防水套管_柔性防水套管_不锈钢防水套管-郑州中泰管道 | 大流量卧式砂磨机_强力分散机_双行星双动力混合机_同心双轴搅拌机-莱州市龙跃化工机械有限公司 | 济南ISO9000认证咨询代理公司,ISO9001认证,CMA实验室认证,ISO/TS16949认证,服务体系认证,资产管理体系认证,SC食品生产许可证- 济南创远企业管理咨询有限公司 郑州电线电缆厂家-防火|低压|低烟无卤电缆-河南明星电缆 | 全自动包装秤_全自动上袋机_全自动套袋机_高位码垛机_全自动包装码垛系统生产线-三维汉界机器(山东)股份有限公司 | 挤塑板-XPS挤塑板-挤塑板设备厂家[襄阳欧格] | 一体化污水处理设备,一体化污水设备厂家-宜兴市福源水处理设备有限公司 | 焦作网 WWW.JZRB.COM | 江苏皓越真空设备有限公司 |