中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據應用與技術叢書數據科學實戰入門(使用Python和R)/大數據應用與技術叢書

包郵 大數據應用與技術叢書數據科學實戰入門(使用Python和R)/大數據應用與技術叢書

出版社:清華大學出版社出版時間:2020-07-01
開本: 16開 頁數: 231
中 圖 價:¥35.2(5.0折) 定價  ¥69.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據應用與技術叢書數據科學實戰入門(使用Python和R)/大數據應用與技術叢書 版權信息

大數據應用與技術叢書數據科學實戰入門(使用Python和R)/大數據應用與技術叢書 本書特色

內容組織 《數據科學實戰入門 使用Python 和R》一書基于數據科學方法論進行內容的組織。數據科學方法是一種在科學框架體系內進行數據分析的階段性、自適應和迭代式方法。 1. 問題理解階段。首先,需要清晰地闡明項目目標;然后將這些目標轉化為一種可以用數據科學解決的問題。 2. 數據準備階段。數據清洗/準備階段很可能是整個數據科學處理過程中*費力氣的階段。 ● 相關內容參見第3 章:“數據準備”。 3. 探索性數據分析階段。在此階段通過圖形化探索方法獲得對數據的初步認識。 ● 相關內容參見第4 章:“探索性數據分析”。 4. 設置階段。建立數據模型的性能基準,如果需要,可以對數據進行分割和平衡處理。 ● 相關內容詳見第5 章:“為建模數據做準備”。 5. 建模階段。建模階段是數據科學研究過程的核心,在此階段應用各種先進的算法來發現隱藏在數據中的一些確實具有價值的關系。 ● 相關內容參見第6 章以及第8~14 章。 6. 評估階段。確定設計的模型是否有價值,在此階段需要從一系列可選的模型中選擇性能更佳的模型。 ● 相關內容參見第7 章:“模型評估”。 7. 部署應用階段。在此階段需要與管理層協作來調整模型以適應實際部署。

大數據應用與技術叢書數據科學實戰入門(使用Python和R)/大數據應用與技術叢書 內容簡介

《數據科學實戰入門  使用Python和R》一書將使你深入了解數據科學很流行的兩大開源平臺:Python和R。     當前數據科學很好熱門。Python和R是世界更流行的兩個開源數據科學工具。在本書中,你將逐步學習如何使用更優選的技術,針對現實世界的業務問題提供切實可行的解決方案。     本書為沒有數據分析和編程經驗的讀者編寫。章專門為初學者講解Pyhton和R的基礎知識。此后的每一章都提供了使用Python和R解決數據科學問題的分步說明和實踐演練。     對于那些有數據分析經驗的讀者而言,他們將一站式學習如何使用Python和R進行數據科學實踐。本書的主題涵蓋數據準備、探索性數據分析、準備建模數據、決策樹、模型評估、錯誤分類代價、樸素貝葉斯分類、神經網絡、聚類、回歸建模、降維和關聯規則挖掘。此外,本書還包含一些令人興奮的新主題,如隨機森林和廣義線性模型。     本書在每章的結尾提供了大量的練習,共有500多道習題。通過實踐性的分析習題,讀者將能輕松應對使用真實數據集解決有趣業務問題的挑戰。

大數據應用與技術叢書數據科學實戰入門(使用Python和R)/大數據應用與技術叢書 目錄

第1章 數據科學導引 1

1.1 為何學習數據科學 1

1.2 何為數據科學 1

1.3 數據科學方法論 2

1.4 數據科學任務 5

1.4.1 描述 5

1.4.2 估計 6

1.4.3 分類 6

1.4.4 聚類 6

1.4.5 預測 6

1.4.6 關聯 7

1.5 習題 7

第2章 Python和R語言基礎 9

2.1 下載Python 9

2.2 Python編程基礎 10

2.2.1 在Python中使用注釋 10

2.2.2 在Python中執行命令 11

2.2.3 在Python中導入軟件包 11

2.2.4 將數據引入Python 12

2.2.5 在Python中保存輸出 13

2.2.6 訪問Python中的記錄和變量 14

2.2.7 在Python中設置圖形 16

2.3 下載R和RStudio 18

2.4 R語言編程基礎 19

2.4.1 在R中使用注釋 20

2.4.2 在R中執行命令 20

2.4.3 在R中導入軟件包 20

2.4.4 將數據導入R 21

2.4.5 在R中保存輸出 23

2.4.6 在R中訪問記錄和變量 24

2.5 習題 26

第3章 數據準備 29

3.1 銀行營銷數據集 29

3.2 問題理解階段 29

3.2.1 明確闡明項目目標 29

3.2.2 將這些目標轉化為數據科學問題 30

3.3 數據準備階段 30

3.4 添加索引字段 31

3.4.1 如何使用Python添加索引字段 31

3.4.2 如何使用R添加索引字段 32

3.5 更改誤導性字段值 33

3.5.1 如何使用Python更改誤導性字段值 33

3.5.2 如何使用R更改誤導性字段值 35

3.6 將分類數據重新表示為數字 36

3.6.1 如何使用Python重新表達分類字段值 37

3.6.2 如何使用R重新表達分類字段值 38

3.7 標準化數字字段 39

3.7.1 如何使用Python標準化數字字段 40

3.7.2 如何使用R標準化數字字段 40

3.8 識別異常值 40

3.8.1 如何使用Python識別異常值 41

3.8.2 如何使用R識別異常值 42

3.9 習題 43

第4章 探索性數據分析 47

4.1 EDA對比HT 47

4.2 疊加了response的條形圖 47

4.2.1 如何使用Python構建疊加的條形圖 49

4.2.2 如何使用R構建疊加的條形圖 50

4.3 列聯表 51

4.3.1 如何使用Python構建列聯表 52

4.3.2 如何使用R構建列聯表 53

4.4 疊加有響應的柱狀圖 54

4.4.1 如何使用Python構建疊加柱狀圖 55

4.4.2 如何使用R構建疊加柱狀圖 58

4.5 基于預測值的分箱 59

4.5.1 如何使用Python基于預測值執行分箱 61

4.5.2 如何使用R基于預測值執行分箱 63

4.6 習題 64

第5章 為建模數據做準備 69

5.1 迄今完成的任務 69

5.2 數據分區 69

5.2.1 如何使用Python對數據進行分區 70

5.2.2 如何使用R對數據進行分區 71

5.3 驗證數據分區 72

5.4 平衡訓練數據集 73

5.4.1 如何使用Python平衡訓練數據集 73

5.4.2 如何使用R平衡訓練數據集 75

5.5 建立模型性能基準 76

5.6 習題 78

第6章 決策樹 81

6.1 決策樹簡介 81

6.2 分類與回歸樹 83

6.2.1 如何使用Python構建CART決策樹 83

6.2.2 如何使用R構建CART決策樹 86

6.3 用于構建決策樹的C5.0算法 88

6.3.1 如何使用Python構建C5.0決策樹 89

6.3.2 如何使用R構建C5.0決策樹 90

6.4 隨機森林 91

6.4.1 如何使用Python構建隨機森林 92

6.4.2 如何使用R構建隨機森林 92

6.5 習題 93

第7章 模型評估 97

7.1 模型評估簡介 97

7.2 分類評價措施 97

7.3 靈敏度和特異度 99

7.4 精確度、召回率和Fβ分數 99

7.5 模型評估方法 100

7.6 模型評估的應用示例 100

7.7 說明不對稱的錯誤成本 104

7.8 比較考慮和不考慮不相等錯誤成本的模型 106

7.9 數據驅動的錯誤成本 107

7.10 習題 110

第8章 樸素貝葉斯分類 113

8.1 樸素貝葉斯簡介 113

8.2 貝葉斯定理 113

8.3 *大化后驗假設 114

8.4 分類條件獨立性 114

8.5 樸素貝葉斯分類的應用 115

8.5.1 Python中的樸素貝葉斯 120

8.5.2 R中的樸素貝葉斯 123

8.6 習題 126

第9章 神經網絡 129

9.1 神經網絡簡介 129

9.2 神經網絡結構 129

9.3 連接權重和組合函數 131

9.4 sigmoid激活函數 133

9.5 反向傳播 133

9.6 神經網絡模型的應用 134

9.7 解釋神經網絡模型中的權重 136

9.8 如何在R中使用神經網絡 137

9.9 習題 138

第10章 聚類 141

10.1 聚類的定義 141

10.2 k均值聚類算法簡介 142

10.3 k均值聚類的應用 143

10.4 簇驗證 144

10.5 如何使用Python執行k均值聚類 145

10.6 如何使用R執行k均值聚類 147

10.7 習題 149

第11章 回歸建模 151

11.1 估計任務 151

11.2 回歸建模描述 151

11.3 多元回歸建模的應用 152

11.4 如何使用Python執行多重回歸建模 154

11.5 如何使用R執行多重回歸建模 156

11.6 用于估計的模型評估 158

11.6.1 如何使用Python進行估計模型評估 159

11.6.2 如何使用R進行估計模型評估 161

11.7 逐步回歸 162

11.8 回歸的基準模型 163

11.9 習題 164

第12章 降維 169

12.1 降維的必要性 169

12.2 多重共線性 170

12.3 使用方差膨脹因子識別多重共線性 173

12.3.1 如何使用Python識別多重共線性 174

12.3.2 如何使用R識別多重共線性 175

12.4 主成分分析 177

12.5 主成分分析的應用 178

12.6 我們應該提取多少分量 179

12.6.1 特征值準則 179

12.6.2 方差解釋比例的準則 180

12.7 執行k = 4的PCA 180

12.8 主成分分析的驗證 181

12.9 如何使用Python進行主成分分析 182

12.10 如何使用R進行主成分分析 184

12.11 何時多重共線性不是問題 187

12.12 習題 187

第13章 廣義線性模型 191

13.1 廣義線性模型概述 191

13.2 線性回歸是一種廣義線性模型 192

13.3 作為廣義線性模型的邏輯回歸 192

13.4 邏輯回歸模型的應用 193

13.4.1 如何使用Python執行邏輯回歸 194

13.4.2 如何使用R執行邏輯回歸 195

13.5 泊松回歸 196

13.6 泊松回歸模型的應用 197

13.6.1 如何使用Python執行泊松回歸 197

13.6.2 如何使用R執行泊松回歸 199

13.7 習題 199

第14章 關聯規則 203

14.1 關聯規則簡介 203

14.2 關聯規則挖掘的簡單示例 203

14.3 支持度、信任度和提升度 204

14.4 挖掘關聯規則 206

14.5 確認我們的指標 211

14.6 置信差準則 212

14.7 置信商準則 213

14.8 習題 215

附錄A 數據匯總與可視化 219


展開全部

大數據應用與技術叢書數據科學實戰入門(使用Python和R)/大數據應用與技術叢書 作者簡介

Chantal D. Larose博士是東康涅狄格州立大學(ECSU)統計學與數據科學的助理教授。她已經參與撰寫了三本有關數據科學和預測性分析的著作,并在ECSU和紐約州立大學新帕爾茲分校(SUNY New Paltz)參與開發了數據科學相關程序。 Daniel T. Larose博士是中央康涅狄格州立大學數據科學和統計學的教授,數據科學項目主任。他在數據科學、數據挖掘、預測性分析和統計學方面出版了多本著作。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 微量水分测定仪_厂家_卡尔费休微量水分测定仪-淄博库仑 | IP检测-检测您的IP质量| 传递窗_超净|洁净工作台_高效过滤器-传递窗厂家广州梓净公司 | 细砂提取机,隔膜板框泥浆污泥压滤机,螺旋洗砂机设备,轮式洗砂机械,机制砂,圆锥颚式反击式破碎机,振动筛,滚筒筛,喂料机- 上海重睿环保设备有限公司 | pbt头梳丝_牙刷丝_尼龙毛刷丝_PP塑料纤维合成毛丝定制厂_广州明旺 | 合肥通道闸-安徽车牌识别-人脸识别系统厂家-安徽熵控智能技术有限公司 | AGV无人叉车_激光叉车AGV_仓储AGV小车_AGV无人搬运车-南昌IKV机器人有限公司[官网] | 泰来华顿液氮罐,美国MVE液氮罐,自增压液氮罐,定制液氮生物容器,进口杜瓦瓶-上海京灿精密机械有限公司 | loft装修,上海嘉定酒店式公寓装修公司—曼城装饰 | 移动机器人产业联盟官网 | 铝板冲孔网,不锈钢冲孔网,圆孔冲孔网板,鳄鱼嘴-鱼眼防滑板,盾构走道板-江拓数控冲孔网厂-河北江拓丝网有限公司 | 橡胶粉碎机_橡胶磨粉机_轮胎粉碎机_轮胎磨粉机-河南鼎聚重工机械制造有限公司 | 生产自动包装秤_颗粒包装秤_肥料包装秤等包装机械-郑州鑫晟重工科技有限公司 | 油液红外光谱仪-油液监测系统-燃油嗅探仪-上海冉超光电科技有限公司 | 减速机_上海宜嘉减速机| 防水套管-柔性防水套管-刚性防水套管-上海执品管件有限公司 | 快干水泥|桥梁伸缩缝止水胶|伸缩缝装置生产厂家-广东广航交通科技有限公司 | 圆窗水平仪|伊莉莎冈特elesa+ganter | 恒温恒湿试验箱_高低温试验箱_恒温恒湿箱-东莞市高天试验设备有限公司 | 「阿尔法设计官网」工业设计_产品设计_产品外观设计 深圳工业设计公司 | 顺景erp系统_erp软件_erp软件系统_企业erp管理系统-广东顺景软件科技有限公司 | 工业车间焊接-整体|集中除尘设备-激光|等离子切割机配套除尘-粉尘烟尘净化治理厂家-山东美蓝环保科技有限公司 | 青岛美佳乐清洁工程有限公司|青岛油烟管道清洗|酒店|企事业单位|学校工厂厨房|青岛油烟管道清洗 插针变压器-家用电器变压器-工业空调变压器-CD型电抗器-余姚市中驰电器有限公司 | 儿童乐园|游乐场|淘气堡招商加盟|室内儿童游乐园配套设备|生产厂家|开心哈乐儿童乐园 | 硅胶布|电磁炉垫片|特氟龙胶带-江苏浩天复合材料有限公司 | 余姚生活网_余姚论坛_余姚市综合门户网站 | 山东彩钢板房,山东彩钢活动房,临沂彩钢房-临沂市贵通钢结构工程有限公司 | 室内室外厚型|超薄型|非膨胀型钢结构防火涂料_隧道专用防火涂料厂家|电话|价格|批发|施工 | 真空泵厂家_真空泵机组_水环泵_旋片泵_罗茨泵_耐腐蚀防爆_中德制泵 | 双工位钻铣攻牙机-转换工作台钻攻中心-钻铣攻牙机一体机-浙江利硕自动化设备有限公司 | ★店家乐|服装销售管理软件|服装店收银系统|内衣店鞋店进销存软件|连锁店管理软件|收银软件手机版|会员管理系统-手机版,云版,App | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 远程会诊系统-手术示教系统【林之硕】医院远程医疗平台 | 搪瓷反应釜厂家,淄博搪瓷反应釜-淄博卓耀 | 上海恒驭仪器有限公司-实验室平板硫化机-小型平板硫化机-全自动平板硫化机 | 森旺-A级防火板_石英纤维板_不燃抗菌板装饰板_医疗板 | VOC检测仪-甲醛检测仪-气体报警器-气体检测仪厂家-深恒安科技有限公司 | 新能源汽车电机定转子合装机 - 电机维修设备 - 睿望达 | 昆明网络公司|云南网络公司|昆明网站建设公司|昆明网页设计|云南网站制作|新媒体运营公司|APP开发|小程序研发|尽在昆明奥远科技有限公司 | 奇酷教育-Python培训|UI培训|WEB大前端培训|Unity3D培训|HTML5培训|人工智能培训|JAVA开发的教育品牌 | 河南道路标志牌_交通路标牌_交通标志牌厂家-郑州路畅交通 |