中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
pandas數據處理與分析

包郵 pandas數據處理與分析

作者:耿遠昊
出版社:人民郵電出版社出版時間:2022-08-01
開本: 16開 頁數: 327
中 圖 價:¥49.0(5.0折) 定價  ¥98.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

pandas數據處理與分析 版權信息

  • ISBN:9787115583659
  • 條形碼:9787115583659 ; 978-7-115-58365-9
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

pandas數據處理與分析 本書特色

1.梳理pandas中常用的函數,將函數之間的邏輯關系總結為“基礎知識+4類操作+4類數據”的模塊結構2.展示了數據處理的宏觀體系,并針對數據分析中“怎么分析”“怎么處理”“怎么加速”3個核心問題給出解決方案。3.結合大量代碼講解理論知識,并通過“練一練”和章末的“習題”等形式提供高質量的練習,幫助讀者理解、強化和拓展所學知識。4.不需要讀者掌握數據科學或數據分析的先驗知識,適合具有一定Python編程基礎、想要使用pandas進行數據處理與分析的數據科學領域的從業者或研究人員閱讀。

pandas數據處理與分析 內容簡介

本書以Python中的pandas庫為主線,介紹各類數據處理與分析方法。 本書共包含13章,**部分介紹NumPy和pandas的基本內容;第二部分介紹pandas庫中的4類操作,包括索引、分組、變形和連接;第三部分介紹基于pandas庫的4類數據,包括缺失數據、文本數據、分類數據和時間序列數據,并介紹這4類數據的處理方法;第四部分介紹數據觀測、特征工程和性能優化的相關內容。本書以豐富的練習為特色,每章的*后一節為習題,同時每章包含許多即時性的練習(練一練)。讀者可通過這些練習將對數據科學的宏觀認識運用到實踐中。

pandas數據處理與分析 目錄

第 一部分 基礎知識
第 1章 預備知識 2
1.1 Python基礎 2
1.1.1 推導式 2
1.1.2 匿名函數 4
1.1.3 打包函數 5
1.2 NumPy基礎 7
1.2.1 NumPy數組的構造 7
1.2.2 NumPy數組的變形 11
1.2.3 NumPy數組的切片 15
1.2.4 廣播機制 17
1.2.5 常用函數 19
1.3 習題 24
第 2章 pandas基礎 26
2.1 文件的讀取和寫入 26
2.1.1 文件讀取 26
2.1.2 數據寫入 28
2.2 基本數據結構 29
2.2.1 Series 29
2.2.2 DataFrame 30
2.3 常用基本函數 32
2.3.1 匯總函數 33
2.3.2 特征統計函數 34
2.3.3 頻次函數 35
2.3.4 替換函數 36
2.3.5 排序函數 39
2.3.6 apply()函數 40
2.4 窗口 42
2.4.1 滑動窗口 42
2.4.2 擴張窗口 45
2.5 習題 46

第二部分 4類操作

第3章 索引 50
3.1 單級索引 50
3.1.1 DataFrame的列索引 50
3.1.2 Series的行索引 51
3.1.3 loc索引器 52
3.1.4 iloc索引器 56
3.1.5 query()函數 57
3.1.6 索引運算 58
3.2 多級索引 59
3.2.1 多級索引及其表的結構 59
3.2.2 多級索引中的loc索引器 61
3.2.3 多級索引的構造 65
3.3 常用索引方法 66
3.3.1 索引層的交換和刪除 66
3.3.2 索引屬性的修改 67
3.3.3 索引的設置與重置 70
3.3.4 索引的對齊 71
3.4 習題 72
第4章 分組 74
4.1 分組模式及其對象 74
4.1.1 分組的一般模式 74
4.1.2 分組依據的本質 75
4.1.3 groupby對象 76
4.2 聚合函數 78
4.2.1 內置聚合函數 78
4.2.2 agg()函數 79
4.3 變換和過濾 80
4.3.1 變換函數 81
4.3.2 組索引與過濾 82
4.4 跨列分組 83
4.5 習題 85
第5章 變形 87
5.1 長寬表的變形 87
5.1.1 長表的透視變形 88
5.1.2 寬表的逆透視變形 91
5.2 其他變形方法 95
5.2.1 索引變形 95
5.2.2 擴張變形 98
5.3 習題 98
第6章 連接 100
6.1 關系連接 100
6.1.1 關系連接的基本概念 100
6.1.2 列連接 102
6.1.3 索引連接 104
6.2 其他連接 105
6.2.1 方向連接 105
6.2.2 比較與組合 108
6.3 習題 109

第三部分 4類數據

第7章 缺失數據 114
7.1 缺失值的統計和刪除 114
7.1.1 缺失信息的統計 114
7.1.2 缺失信息的刪除 115
7.2 缺失值的填充和插值 116
7.2.1 利用fillna() 進行填充 116
7.2.2 插值函數 118
7.3 Nullable類型 120
7.3.1 缺失記號及其缺陷 120
7.3.2 Nullable類型的性質 122
7.3.3 缺失數據的計算和分組 124
7.4 習題 126
第8章 文本數據 128
8.1 str對象 128
8.1.1 str對象的設計意圖 128
8.1.2 []索引器 129
8.1.3 string類型 129
8.2 正則表達式基礎 131
8.2.1 元字符 132
8.2.2 分組捕獲與反向引用 134
8.2.3 零寬斷言 135
8.3 文本處理的5類操作 136
8.3.1 拆分 136
8.3.2 合并 137
8.3.3 匹配 138
8.3.4 替換 139
8.3.5 提取 140
8.4 其他字符串方法 141
8.4.1 字母型方法 141
8.4.2 數值型方法 142
8.4.3 統計型方法 143
8.4.4 格式型方法 143
8.5 習題 145
第9章 分類數據 147
9.1 cat對象 147
9.1.1 cat對象的屬性 147
9.1.2 類別的增加、刪除和修改 148
9.2 有序類別 150
9.2.1 序的建立 150
9.2.2 排序和比較 150
9.3 區間類別 152
9.3.1 利用cut()和qcut()進行區間構造 152
9.3.2 一般區間的構造 153
9.3.3 區間的屬性與方法 155
9.4 習題 155
第 10章 時間序列數據 159
10.1 時間戳 160
10.1.1 時間戳的構造與屬性 160
10.1.2 時間戳序列的生成 161
10.1.3 dt對象 164
10.1.4 時間戳序列的索引與切片 166
10.2 時間差 167
10.2.1 時間差序列的生成 168
10.2.2 時間差序列的運算 169
10.3 日期偏置 170
10.3.1 Offset對象 170
10.3.2 采樣頻率 173
10.4 時間序列操作 175
10.4.1 采樣頻率滑窗 175
10.4.2 重采樣 177
10.4.3 特殊連接 181
10.5 習題 184

第四部分 進階實戰

第 11章 數據觀測 190
11.1 可視化方法 190
11.1.1 基本繪圖 190
11.1.2 元素控制 198
11.1.3 子圖繪制 203
11.2 數據觀測方法 206
11.2.1 數據類型 206
11.2.2 數據統計量 207
11.2.3 數據分布 209
11.2.4 基于數據報告的觀測 210
11.3 習題 212
第 12章 特征工程 216
12.1 單特征構造 216
12.1.1 特征變換 216
12.1.2 文本數據特征 223
12.1.3 時間序列數據特征 226
12.1.4 單特征構造的一般方法 230
12.2 多特征構造 236
12.2.1 分組技術 236
12.2.2 特征降維 239
12.3 特征選擇 242
12.3.1 基于統計量的選擇 242
12.3.2 基于模型的選擇 249
12.4 習題 255
第 13章 性能優化 258
13.1 pandasic代碼要義 258
13.2 多進程加速 261
13.2.1 多進程和多線程 261
13.2.2 多進程的陷阱 264
13.2.3 異步進程 268
13.2.4 進程中的數據共享 271
13.2.5 在pandas中使用 多進程 282
13.3 利用Cython加速 286
13.3.1 初識Cython 286
13.3.2 優化策略 288
13.3.3 多線程加速 295
13.3.4 Cython類及其應用 306
13.3.5 模塊構建 311
13.4 利用Numba加速 315
13.4.1 noPython模式 315
13.4.2 ufunc與向量化 320
13.4.3 jitclass及其應用 323
13.5 習題 325
展開全部

pandas數據處理與分析 作者簡介

耿遠昊威斯康星大學麥迪遜分校統計學碩士在讀,Datawhale成員,“Joyful Pandas”開源項目作者。pandas貢獻者,活躍于pandas開源社區,主要貢獻涉及漏洞修復、功能實現與性能優化等方面,對pandas在數據處理與分析中的應用有豐富經驗。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 鲁网 - 山东省重点新闻网站,山东第一财经门户 | 陕西视频监控,智能安防监控,安防系统-西安鑫安5A安防工程公司 | 德国EA可编程直流电源_电子负载,中国台湾固纬直流电源_交流电源-苏州展文电子科技有限公司 | 小型UV打印机-UV平板打印机-大型uv打印机-UV打印机源头厂家 |松普集团 | 青海电动密集架_智能密集架_密集架价格-盛隆柜业青海档案密集架厂家 | (中山|佛山|江门)环氧地坪漆,停车场地板漆,车库地板漆,聚氨酯地板漆-中山永旺地坪漆厂家 | 森旺-A级防火板_石英纤维板_不燃抗菌板装饰板_医疗板 | 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 | 智能案卷柜_卷宗柜_钥匙柜_文件流转柜_装备柜_浙江福源智能科技有限公司 | 三效蒸发器_多效蒸发器价格_四效三效蒸发器厂家-青岛康景辉 | 北京模型公司-工业模型-地产模型-施工模型-北京渝峰时代沙盘模型制作公司 | 检验科改造施工_DSA手术室净化_导管室装修_成都特殊科室建设厂家_医疗净化工程公司_四川华锐 | 山东锐智科电检测仪器有限公司_超声波测厚仪,涂层测厚仪,里氏硬度计,电火花检漏仪,地下管线探测仪 | 软文世界-软文推广-软文营销-新闻稿发布-一站式软文自助发稿平台 | 上海地磅秤|电子地上衡|防爆地磅_上海地磅秤厂家–越衡称重 | 玻璃瓶厂家_酱菜瓶厂家_饮料瓶厂家_酒瓶厂家_玻璃杯厂家_徐州东明玻璃制品有限公司 | 期货软件-专业期货分析软件下载-云智赢 | CNC机加工-数控加工-精密零件加工-ISO认证厂家-鑫创盟 | 炉门刀边腹板,焦化设备配件,焦化焦炉设备_沧州瑞创机械制造有限公司 | 泥浆在线密度计厂家-防爆数字压力表-膜盒-远传压力表厂家-江苏大亚自控设备有限公司 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 合肥网带炉_安徽箱式炉_钟罩炉-合肥品炙装备科技有限公司 | 南京试剂|化学试剂|分析试剂|实验试剂|cas号查询-专业60年试剂销售企业 | 胀套-锁紧盘-风电锁紧盘-蛇形联轴器「厂家」-瑞安市宝德隆机械配件有限公司 | 水环真空泵厂家,2bv真空泵,2be真空泵-淄博真空设备厂 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 | 江苏农村商业银行招聘网_2024江苏农商行考试指南_江苏农商行校园招聘 | 便携式表面粗糙度仪-彩屏硬度计-分体式粗糙度仪-北京凯达科仪科技有限公司 | 背压阀|减压器|不锈钢减压器|减压阀|卫生级背压阀|单向阀|背压阀厂家-上海沃原自控阀门有限公司 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 | 模具ERP_模具管理系统_模具mes_模具进度管理_东莞市精纬软件有限公司 | 折弯机-刨槽机-数控折弯机-数控刨槽机-数控折弯机厂家-深圳豐科机械有限公司 | 锡膏喷印机-全自动涂覆机厂家-全自动点胶机-视觉点胶机-深圳市博明智控科技有限公司 | GEDORE扭力螺丝刀-GORDON防静电刷-CHEMTRONICS吸锡线-上海卓君电子有限公司 | 蔬菜配送公司|蔬菜配送中心|食材配送|饭堂配送|食堂配送-首宏公司 | 沈阳液压泵_沈阳液压阀_沈阳液压站-沈阳海德太科液压设备有限公司 | 储气罐,真空罐,缓冲罐,隔膜气压罐厂家批发价格,空压机储气罐规格型号-上海申容压力容器集团有限公司 | HDPE土工膜,复合土工膜,防渗膜价格,土工膜厂家-山东新路通工程材料有限公司 | SMN-1/SMN-A ABB抽屉开关柜触头夹紧力检测仪-SMN-B/SMN-C-上海徐吉 | 超高频感应加热设备_高频感应电源厂家_CCD视觉检测设备_振动盘视觉检测设备_深圳雨滴科技-深圳市雨滴科技有限公司 | 河南卓美创业科技有限公司-河南卓美防雷公司-防雷接地-防雷工程-重庆避雷针-避雷器-防雷检测-避雷带-避雷针-避雷塔、机房防雷、古建筑防雷等-山西防雷公司 |