中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >
Python數(shù)據(jù)挖掘入門與實踐

包郵 Python數(shù)據(jù)挖掘入門與實踐

出版社:人民郵電出版社出版時間:2020-03-01
開本: 24cm 頁數(shù): 253頁
中 圖 價:¥46.0(5.8折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Python數(shù)據(jù)挖掘入門與實踐 版權信息

  • ISBN:9787115528025
  • 條形碼:9787115528025 ; 978-7-115-52802-5
  • 裝幀:平裝-膠訂
  • 冊數(shù):暫無
  • 重量:暫無
  • 所屬分類:>

Python數(shù)據(jù)挖掘入門與實踐 本書特色

本書以實踐為宗旨,對數(shù)據(jù)挖掘進行了詳細地入門引導。本書囊括了比賽結果預測、電影推薦、特征提取、好友推薦、破解驗證碼、作者歸屬、新聞聚類等大量經(jīng)典案例,并以此為基礎提供了大量練習和額外活動。在練習中,本書介紹了數(shù)據(jù)挖掘的基本工具和基本方法;在額外活動中,本書為深入了解數(shù)據(jù)挖掘指明了方向。 本書適合希望應用Python進行數(shù)據(jù)挖掘的程序員閱讀。

Python數(shù)據(jù)挖掘入門與實踐 內(nèi)容簡介

本書由淺入深地介紹了數(shù)據(jù)挖掘的基礎知識; 圖文并茂,同時提供了種類繁多的Python庫來支持具體實踐; 第二版更新了示例和代碼,每一章都引入了新的算法和技術。 本書將手把手指引你: 基于過去結果預測體育賽事勝負 根據(jù)行文風格確定文檔作者 調(diào)用API下載社會媒體或其他在線服務的數(shù)據(jù)集 在復雜數(shù)據(jù)集中尋找并提取合適的特征 創(chuàng)建解決現(xiàn)實問題的模型 運用各種各樣的數(shù)據(jù)集,設計并開發(fā)數(shù)據(jù)挖掘應用 利用深度神經(jīng)網(wǎng)絡完成圖像中的對象檢測

Python數(shù)據(jù)挖掘入門與實踐 目錄

第 1 章 數(shù)據(jù)挖掘入門 1

1.1 什么是數(shù)據(jù)挖掘 1

1.2 使用 Python 和 Jupyter Notebook 3

1.2.1 安裝 Python 3

1.2.2 安裝 Jupyter Notebook 4

1.2.3 安裝 scikit-learn 5

1.3 親和性分析的簡單示例 6

1.4 商品推薦 6

1.4.1 用NumPy 加載數(shù)據(jù)集 7

1.4.2 實現(xiàn)規(guī)則的簡單排序 9

1.4.3 挑選*佳規(guī)則 11

1.5 分類的簡單示例 13

1.6 什么是分類 14

1.6.1 準備數(shù)據(jù)集 14

1.6.2 實現(xiàn) OneR 算法 15

1.6.3 測試算法功能 17

1.7 本章小結 19

第 2 章 用 scikit-learn 估計器 解決分類問題 20

2.1 scikit-learn 估計器 20

2.1.1 *近鄰算法 21

2.1.2 距離度量 22

2.1.3 加載數(shù)據(jù)集 24

2.1.4 形成標準的工作流程 25

2.1.5 運行算法 26

2.1.6 設置參數(shù) 27

2.2 預處理 29

2.2.1 標準預處理 30

2.2.2 組裝成型 31

2.3 流水線 31

2.4 本章小結 32

第 3 章 用決策樹預測獲勝球隊 34

3.1 加載數(shù)據(jù)集34

3.1.1 收集數(shù)據(jù)35

3.1.2 用 pandas 加載數(shù)據(jù)集 35

3.1.3 清洗數(shù)據(jù)集 36

3.1.4 提取新特征 37

3.2 決策樹 39

3.2.1 決策樹的參數(shù) 40

3.2.2 決策樹的使用 41

3.3 體育賽事結果預測 42

3.4 隨機森林 45

3.4.1 集成學習原理 46

3.4.2 設置隨機森林的參數(shù) 46

3.4.3 應用隨機森林 47

3.4.4 創(chuàng)建特征 48

3.5 本章小結 49

第 4 章 用親和性分析推薦電影 50

4.1 親和性分析 50

4.1.1 親和性分析算法 51

4.1.2 總體方法 52

4.2 電影推薦問題 52

4.3 Apriori 算法的原理與實現(xiàn) 54

4.3.1 Apriori 算法的基本思路 56

4.3.2 實現(xiàn) Apriori 算法 57

4.3.3 提取關聯(lián)規(guī)則 59

4.3.4 評估關聯(lián)規(guī)則 62

4.4 本章小結 64

第 5 章 特征與 scikit-learn 轉換器 65

5.1 特征提取 65

5.1.1 用模型表述現(xiàn)實 66

5.1.2 常見的特征模式 68

5.1.3 創(chuàng)建好的特征 71

5.2 特征的選取 71

5.3 特征創(chuàng)建 76

5.4 主成分分析 78

5.5 創(chuàng)建自己的轉換器 80

5.5.1 轉換器 API 81

5.5.2 實現(xiàn)轉換器 81

5.6 單元測試 82

5.7 組裝成型 83

5.8 本章小結 84

第 6 章 用樸素貝葉斯算法探索社交

媒體 85

6.1 消歧 85

6.2 從社交媒體下載數(shù)據(jù) 87

6.2.1 加載數(shù)據(jù)集并分類 89

6.2.2 創(chuàng)建可重現(xiàn)的 Twitter 數(shù)據(jù)集 92

6.3 文本轉換器 95

6.3.1 詞袋模型 95

6.3.2 n 元語法特征 96

6.3.3 其他文本特征 97

6.4 樸素貝葉斯 98

6.4.1 理解貝葉斯定理 98

6.4.2 樸素貝葉斯算法 99

6.4.3 原理展示 100

6.5 樸素貝葉斯的應用 101

6.5.1 提取單詞計數(shù) 102

6.5.2 把字典轉換成矩陣 103

6.5.3 組裝成型 103

6.5.4 用 F1-score 評估算法 104

6.6 從模型中找出有用的特征 105

6.7 本章小結 107

第 7 章 用圖挖掘實現(xiàn)推薦關注 109

7.1 加載數(shù)據(jù)集 109

7.2 從 Twitter 獲取關注者信息 113

7.3 創(chuàng)建圖 116

7.4 尋找子圖 122

7.4.1 連通分量 122

7.4.2 優(yōu)化準則 125

7.5 本章小結 127

第 8 章 用神經(jīng)網(wǎng)絡識別驗證碼 129

8.1 人工神經(jīng)網(wǎng)絡 130

8.2 創(chuàng)建數(shù)據(jù)集 132

8.2.1 繪制簡單的驗證碼 133

8.2.2 按字母分割圖像 135

8.2.3 創(chuàng)建訓練數(shù)據(jù)集 137

8.3 訓練與分類 139

8.4 預測單詞 143

8.4.1 用詞典提升準確率 146

8.4.2 單詞相似度的排名機制 146

8.4.3 組裝成型 147

8.5 本章小結 148

第 9 章 作者歸屬問題 149

9.1 文檔的作者歸屬 149

9.1.1 應用與場景 150

9.1.2 作者歸屬 151

9.2 獲取數(shù)據(jù) 152

9.3 功能詞的使用 155

9.3.1 統(tǒng)計功能詞 156

9.3.2 用功能詞分類 158

9.4 支持向量機 159

9.4.1 用支持向量機分類 160

9.4.2 核函數(shù) 160

9.5 字符 n 元語法 161

9.6 安然(Enron)數(shù)據(jù)集 162

9.6.1 獲取安然數(shù)據(jù)集 163

9.6.2 創(chuàng)建數(shù)據(jù)集加載函數(shù) 163

9.7 組裝成型 166

9.8 評估 166

9.9 本章小結 168

第 10 章 聚類新聞文章 169

10.1 發(fā)現(xiàn)熱門話題 169

10.1.1 用 Web API 獲取數(shù)據(jù) 170

10.1.2 把 reddit 作為數(shù)據(jù)源 172

10.1.3 獲取數(shù)據(jù) 173

10.2 從任意網(wǎng)站提取文本 175

10.2.1 尋找任意網(wǎng)站中的新聞報道內(nèi)容 176

10.2.2 提取內(nèi)容 177

10.3 為新聞文章分組 179

10.4 k-均值算法 179

10.4.1 評估結果 182

10.4.2 從聚類簇中提取話題信息 184

10.4.3 把聚類算法作為轉換器 185

10.5 聚類集成 185

10.5.1 證據(jù)積累方法 185

10.5.2 工作原理 188

10.5.3 算法實現(xiàn) 190

10.6 在線學習 191

10.7 本章小結 194

第 11 章 用深度神經(jīng)網(wǎng)絡實現(xiàn)圖像中的對象檢測 195

11.1 對象分類 195

11.2 應用場景 197

11.3 深度神經(jīng)網(wǎng)絡 199

11.3.1 直觀感受 199

11.3.2 實現(xiàn)深度神經(jīng)網(wǎng)絡 200

11.4 TensorFlow 簡介 201

11.5 使用 Keras 204

11.6 GPU 優(yōu)化 210

11.6.1 適用 GPU 的計算場景 211

11.6.2 在 GPU 上運行代碼 212

11.6.3 設置環(huán)境 213

11.7 應用 214

11.7.1 獲取數(shù)據(jù) 214

11.7.2 創(chuàng)建神經(jīng)網(wǎng)絡 215

11.7.3 組裝成型 216

11.8 本章小結 217

第 12 章 大數(shù)據(jù)處理 219

12.1 大數(shù)據(jù) 219

12.2 MapReduce 222

12.2.1 直觀感受 223

12.2.2 Hadoop MapReduce 226

12.3 應用 MapReduce 227

12.4 樸素貝葉斯預測 229

12.5 提取博客文章 229

12.6 訓練樸素貝葉斯 231

12.7 組裝成型 235

12.8 在亞馬遜 EMR 基礎設施上訓練 239

12.9 本章小結 241

附錄 A 下一步工作 242

A.1 數(shù)據(jù)挖掘入門 242

A.1.1 scikit-learn 教程 242

A.1.2 擴展 Jupyter Notebook 242

A.1.3 更多數(shù)據(jù)集 243

A.1.4 其他評估指標 243

A.1.5 更多應用思路 243

A.2 用 scikit-learn 估計器解決分類問題 243

A.2.1 *近鄰算法的伸縮性 244

A.2.2 更復雜的流水線 244

A.2.3 比較分類器 244

A.2.4 自動學習 244

A.3 用決策樹預測獲勝球隊 245

A.3.1 更復雜的特征 245

A.3.2 Dask 246

A.3.3 研究 246

A.4 用親和性分析推薦電影 246

A.4.1 新數(shù)據(jù)集 246

A.4.2 等價類變換算法 246

A.4.3 協(xié)同過濾 247

A.5 特征與 scikit-learn 轉換器 247

A.5.1 增加噪聲 247

A.5.2 Vowpal Wabbit 247

A.5.3 word2vec 247

A.6 用樸素貝葉斯算法探索社交媒體 247

A.6.1 垃圾信息檢測 248

A.6.2 自然語言處理與詞性標注 248

A.7 用圖挖掘實現(xiàn)推薦關注 248

A.7.1 更復雜的算法 248

A.7.2 NetworkX 248

A.8 用神經(jīng)網(wǎng)絡識別驗證碼 249

A.8.1 更好(更壞?)的驗證碼 249

A.8.2 深度神經(jīng)網(wǎng)絡 249

A.8.3 強化學習 249

A.9 作者歸屬問題 249

A.9.1 增大樣本 250

A.9.2 博客數(shù)據(jù)集 250

A.9.3 局部 n 元語法 250

A.10 聚類新聞文章 250

A.10.1 聚類的評估 250

A.10.2 時域分析 251

A.10.3 實時聚類 251

A.11 用深度神經(jīng)網(wǎng)絡實現(xiàn)圖像中的對象檢測 251

A.11.1 Mahotas 251

A.11.2 Magenta 251

A.12 大數(shù)據(jù)處理 252

A.12.1 Hadoop 課程 252

A.12.2 Pydoop 252

A.12.3 推薦引擎 252

A.12.4 W.I.L.L 252

A.13 更多資源 253

A.13.1 Kaggle 競賽 253

A.13.2 Coursera 253
展開全部

Python數(shù)據(jù)挖掘入門與實踐 作者簡介

羅伯特·萊頓(Robert Layton) 數(shù)據(jù)科學家,計算機科學博士,網(wǎng)絡犯罪問題和文本分析方面的專家。擁有多年Python編程經(jīng)驗,參與開發(fā)過scikit-learn庫等眾多開源軟件,曾擔任2014年“谷歌編程之夏”項目導師,也曾多次在PyCon Au上做報告。他創(chuàng)立了數(shù)據(jù)挖掘咨詢公司DataPipeline,以及為創(chuàng)業(yè)公司提供技術咨詢和支持的Eurekative公司,還運營著LearningTensorFlow 網(wǎng)站。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 深圳市简易检测技术有限公司| 交变/复合盐雾试验箱-高低温冲击试验箱_安奈设备产品供应杭州/江苏南京/安徽马鞍山合肥等全国各地 | 金属清洗剂,防锈油,切削液,磨削液-青岛朗力防锈材料有限公司 | 丝印油墨_水性油墨_环保油墨油漆厂家_37国际化工 | 过跨车_过跨电瓶车_过跨转运车_横移电动平车_厂区转运车_无轨转运车 | 手术示教系统-数字化手术室系统-林之硕医疗云智能视频平台 | 长沙网站建设制作「网站优化推广」-网页设计公司-速马科技官网 | 蔡司三坐标-影像测量机-3D扫描仪-蔡司显微镜-扫描电镜-工业CT-ZEISS授权代理商三本工业测量 | 生物颗粒燃烧机-生物质燃烧机-热风炉-生物颗粒蒸汽发生器-丽水市久凯能源设备有限公司 | 不锈钢水箱生产厂家_消防水箱生产厂家-河南联固供水设备有限公司 | 液晶拼接屏厂家_拼接屏品牌_拼接屏价格_监控大屏—北京维康 | 电解抛光加工_不锈钢电解抛光_常州安谱金属制品有限公司 | 武汉天安盾电子设备有限公司 - 安盾安检,武汉安检门,武汉安检机,武汉金属探测器,武汉测温安检门,武汉X光行李安检机,武汉防爆罐,武汉车底安全检查,武汉液体探测仪,武汉安检防爆设备 | 实验室pH计|电导率仪|溶解氧测定仪|离子浓度计|多参数水质分析仪|pH电极-上海般特仪器有限公司 | 顶空进样器-吹扫捕集仪-热脱附仪-二次热解吸仪-北京华盛谱信仪器 | 欧必特空气能-商用空气能热水工程,空气能热水器,超低温空气源热泵生产厂家-湖南欧必特空气能公司 | 气胀轴|气涨轴|安全夹头|安全卡盘|伺服纠偏系统厂家-天机传动 | 通信天线厂家_室分八木天线_对数周期天线_天线加工厂_林创天线源头厂家 | 热回收盐水机组-反应釜冷水机组-高低温冷水机组-北京蓝海神骏科技有限公司 | 注塑机-压铸机-塑料注塑机-卧式注塑机-高速注塑机-单缸注塑机厂家-广东联升精密智能装备科技有限公司 | 胶泥瓷砖胶,轻质粉刷石膏,嵌缝石膏厂家,腻子粉批发,永康家德兴,永康市家德兴建材厂 | 视觉检测设备_自动化检测设备_CCD视觉检测机_外观缺陷检测-瑞智光电 | 电动葫芦|手拉葫芦|环链电动葫芦|微型电动葫芦-北京市凌鹰起重机械有限公司 | 防火门|抗爆门|超大门|医疗门|隔声门-上海加汇门业生产厂家 | MVR蒸发器厂家-多效蒸发器-工业废水蒸发器厂家-康景辉集团官网 | 混合气体腐蚀试验箱_盐雾/硫化氢/气体腐蚀试验箱厂家-北京中科博达 | 硫化罐_蒸汽硫化罐_大型硫化罐-山东鑫泰鑫智能装备有限公司 | 微信聊天记录恢复_手机短信删除怎么恢复_通讯录恢复软件下载-快易数据恢复 | 高温链条油|高温润滑脂|轴承润滑脂|机器人保养用油|干膜润滑剂-东莞卓越化学 | 上海洗地机-洗地机厂家-全自动洗地机-手推式洗地机-上海滢皓洗地机 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | 急救箱-应急箱-急救包厂家-北京红立方医疗设备有限公司 | 阴离子聚丙烯酰胺价格_PAM_高分子聚丙烯酰胺厂家-河南泰航净水材料有限公司 | 换网器_自动换网器_液压换网器--郑州海科熔体泵有限公司 | 手持式3d激光扫描仪-便携式三维立体扫描仪-北京福禄克斯 | 货车视频监控,油管家,货车油管家-淄博世纪锐行电子科技 | 香港新时代国际美容美发化妆美甲培训学校-26年培训经验,值得信赖! | 展厅装修公司|企业展厅设计|展厅制作|展厅搭建—广州展厅装饰公司 | 中空玻璃生产线,玻璃加工设备,全自动封胶线,铝条折弯机,双组份打胶机,丁基胶/卧式/立式全自动涂布机,玻璃设备-山东昌盛数控设备有限公司 | 天津试验仪器-电液伺服万能材料试验机,恒温恒湿标准养护箱,水泥恒应力压力试验机-天津鑫高伟业科技有限公司 | 上海赞永|