中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >
Spark和Python機器學習實戰(zhàn):預測分析核心方法(第2版)

包郵 Spark和Python機器學習實戰(zhàn):預測分析核心方法(第2版)

出版社:人民郵電出版社出版時間:2022-03-01
開本: 16開 頁數(shù): 314
中 圖 價:¥70.9(7.1折) 定價  ¥99.9 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Spark和Python機器學習實戰(zhàn):預測分析核心方法(第2版) 版權(quán)信息

  • ISBN:9787115583819
  • 條形碼:9787115583819 ; 978-7-115-58381-9
  • 裝幀:一般膠版紙
  • 冊數(shù):暫無
  • 重量:暫無
  • 所屬分類:>

Spark和Python機器學習實戰(zhàn):預測分析核心方法(第2版) 本書特色

機器學習重點關注的是預測——利用歷史和未來之間的關系,根據(jù)所知道的預測想知道的。機器學習的核心是一種基于數(shù)學/算法的技術(shù),本書聚焦于兩類能夠?qū)崿F(xiàn)有效預測結(jié)果的算法族,并借助當前流行的 Python 語言來展現(xiàn)如何應用這些算法,使掌握機器學習更加簡單。本書展示了如何利用 PySpark 將這兩類算法擴展到需要使用多個分布式處理器的超大規(guī)模數(shù)據(jù)集上。1.深入淺出,簡單術(shù)語。本書沒有用復雜的數(shù)學公式,而是用簡單的術(shù)語來解釋算法,并提供示例代碼來幫助讀者快速上手。2.針對小白設計,內(nèi)容豐富易懂。本書專為沒有專業(yè)數(shù)學或統(tǒng)計學背景的讀者設計,包含如下內(nèi)容:● 為任務選擇合適的算法;● 學習相關機制以及準備數(shù)據(jù);● 通過代碼演示算法的PySpark實現(xiàn),可擴展到使用數(shù)百個處理器的大規(guī)模數(shù)據(jù)集上;● 掌握核心Python機器學習算法包;● 構(gòu)建多種有效的預測模型;● 將訓練好的模型應用于各種實際場景;● 評測模型的性能,以實現(xiàn)更好的質(zhì)量控制和應用;● 使用Jupyter Notebook格式的示例代碼設計和構(gòu)建自己的模型。通過本書,讀者將深入探究方案構(gòu)建背后的機制,并學會選擇和應用適合當前問題的算法。具體代碼的詳細示例,以及懲罰線性回歸和集成方法的詳細描述可以幫助讀者了解機器學習的基本過程。

Spark和Python機器學習實戰(zhàn):預測分析核心方法(第2版) 內(nèi)容簡介

本書著重介紹可以有效預測結(jié)果的兩類核心算法,包括懲罰線性回歸方法和集成方法,然后通過一系列的示例細節(jié)來展示針對不同的問題如何使用這些方法。全書分為7章,主要講述算法的選擇、構(gòu)建預測模型時的要點等內(nèi)容,并且結(jié)合Spark和Python技術(shù),引入巖石與水雷、鮑魚年齡問題、紅酒口感、玻璃分類等經(jīng)典數(shù)據(jù)集,將機器學習應用到數(shù)據(jù)預測分析中,幫助讀者全面系統(tǒng)地掌握利用機器學習進行預測分析的基本過程,并將其應用到實際項目中。

Spark和Python機器學習實戰(zhàn):預測分析核心方法(第2版) 目錄

目錄
第 1章 做預測的兩類核心算法 1
1.1 為什么這兩類算法如此有用 1
1.2 什么是懲罰線性回歸方法 5
1.3 什么是集成方法 7
1.4 算法的選擇 8
1.5 構(gòu)建預測模型的步驟 10
1.5.1 構(gòu)造一個機器學習問題 12
1.5.2 特征提取和特征工程 13
1.5.3 確定訓練好的模型的性能 14
1.6 各章內(nèi)容及其依賴關系 14
1.7 小結(jié) 16
第 2章 通過理解數(shù)據(jù)來了解問題 17
2.1 剖析一個新問題 17
2.1.1 屬性和標簽的不同類型決定模型的選擇 19
2.1.2 新數(shù)據(jù)集的注意事項 20
2.2 分類問題:用聲吶發(fā)現(xiàn)未爆炸的水雷 21
2.2.1 巖石與水雷數(shù)據(jù)集的物理特性 21
2.2.2 巖石與水雷數(shù)據(jù)集的統(tǒng)計概要 24
2.2.3 用分位數(shù)圖展示異常點 26
2.2.4 類別屬性的統(tǒng)計特征 28
2.2.5 用Python pandas對巖石與水雷數(shù)據(jù)集進行統(tǒng)計分析 28
2.3 對巖石與水雷數(shù)據(jù)集屬性進行可視化 31
2.3.1 用平行坐標圖進行可視化 31
2.3.2 對屬性和標簽間關系進行可視化 33
2.3.3 用熱圖對屬性和標簽的相關性進行可視化 40
2.3.4 對巖石與水雷數(shù)據(jù)集探究過程的小結(jié) 41
2.4 以因素變量進行實數(shù)值預測:鮑魚的年齡 41
2.4.1 回歸問題的平行坐標圖——鮑魚年齡問題的屬性關系可視化 47
2.4.2 將相關性熱圖用于回歸問題——鮑魚年齡問題的屬性對相關性的可視化 50
2.5 用實數(shù)值屬性進行實數(shù)值預測:評估紅酒口感 52
2.6 多類別分類問題:玻璃分類 59
2.7 用PySpark理解大規(guī)模數(shù)據(jù)集 63
2.8 小結(jié) 67
第3章 構(gòu)建預測模型:平衡性能、復雜度和大數(shù)據(jù) 69
3.1 基本問題:理解函數(shù)逼近 69
3.1.1 使用訓練數(shù)據(jù) 70
3.1.2 評估預測模型的性能 72
3.2 影響算法選擇及性能的因素——復雜度及數(shù)據(jù) 72
3.2.1 簡單問題和復雜問題的比較 73
3.2.2 簡單模型和復雜模型的比較 75
3.2.3 影響預測算法性能的因素 79
3.2.4 選擇算法:線性或者非線性 79
3.3 評測預測模型的性能 80
3.3.1 不同類型問題的性能評測 80
3.3.2 模擬部署后模型的性能 94
3.4 模型與數(shù)據(jù)的均衡 95
3.4.1 通過權(quán)衡問題復雜度、模型復雜度和數(shù)據(jù)集規(guī)模來選擇模型 96
3.4.2 使用前向逐步回歸來控制過擬合 97
3.4.3 評估并理解預測模型 102
3.4.4 通過懲罰回歸系數(shù)來控制過擬合——嶺回歸 104
3.5 在超大規(guī)模數(shù)據(jù)集上用PySpark訓練懲罰回歸模型 113
3.6 小結(jié) 116
第4章 懲罰線性回歸 117
4.1 為什么懲罰線性回歸方法如此有用 117
4.1.1 模型訓練足夠快 118
4.1.2 有變量的重要性信息 118
4.1.3 部署時評估足夠快 118
4.1.4 性能可靠 118
4.1.5 稀疏解 119
4.1.6 問題可能需要線性模型 119
4.1.7 使用集成方法的時機 119
4.2 懲罰線性回歸:對線性回歸進行正則化以獲得*優(yōu)性能 119
訓練線性模型:*小化誤差等 121
4.3 求解懲罰線性回歸問題 126
4.3.1 理解*小角度回歸及其與前向步進回歸的關系 126
4.3.2 使用Glmnet:快速且通用 136
4.4 將線性回歸擴展到分類問題 141
4.4.1 用懲罰回歸求解分類問題 141
4.4.2 多類別分類問題的求解 145
4.4.3 理解基擴展:用線性方法求解非線性問題 145
4.4.4 將非數(shù)值屬性引入線性方法 147
4.5 小結(jié) 150
第5章 用懲罰線性回歸方法構(gòu)建預測模型 153
5.1 懲罰線性回歸的Python包 153
5.2 多變量回歸:預測紅酒口感 154
5.2.1 構(gòu)建并測試預測紅酒口感的模型 155
5.2.2 部署前在整個數(shù)據(jù)集上進行訓練 158
5.3 二元分類:用懲罰線性回歸探測未爆炸水雷 165
5.4 多類別分類:犯罪現(xiàn)場玻璃樣本分類 184
5.5 用PySpark實現(xiàn)線性回歸和分類 187
5.6 用PySpark預測紅酒口感 188
5.7 用PySpark實現(xiàn)邏輯斯蒂回歸:巖石與水雷 193
5.8 將類別變量引入PySpark模型:預測鮑魚年齡 198
5.9 具有元參數(shù)優(yōu)化的多類別邏輯斯蒂回歸 202
5.10 小結(jié) 205
第6章 集成方法 207
6.1 二元決策樹 207
6.1.1 如何用二元決策樹進行預測 210
6.1.2 如何訓練二元決策樹 210
6.1.3 決策樹的訓練等同于分割點的選擇 213
6.1.4 二元決策樹的過擬合 217
6.1.5 針對分類問題和類別特征所做的修改 220
6.2 自舉匯聚:投票法 221
6.2.1 投票法如何工作 221
6.2.2 投票法小結(jié) 232
6.3 梯度提升法 232
6.3.1 梯度提升法的基本原理 232
6.3.2 獲取梯度提升法的*佳性能 236
6.3.3 針對多變量問題的梯度提升法 239
6.3.4 梯度提升法小結(jié) 243
6.4 隨機森林法 243
6.4.1 隨機森林法:投票法加隨機屬性子集 246
6.4.2 影響隨機森林法性能的因素 246
6.4.3 隨機森林法小結(jié) 248
6.5 小結(jié) 248
第7章 用Python構(gòu)建集成模型 251
7.1 用Python集成方法包求解回歸問題 251
7.1.1 用梯度提升法預測紅酒口感 251
7.1.2 構(gòu)建隨機森林模型預測紅酒口感 257
7.2 將非數(shù)值屬性引入Python集成模型 265
7.2.1 用Python將鮑魚性別屬性編碼引入梯度提升法 265
7.2.2 用梯度提升法評估性能和編碼變量的重要性 267
7.2.3 用Python將鮑魚性別屬性編碼引入隨機森林回歸 269
7.2.4 評估性能和編碼變量的重要性 272
7.3 用Python集成方法求解二元分類問題 273
7.3.1 用Python梯度提升法探測未爆炸水雷 273
7.3.2 測定梯度提升分類器的性能 276
7.3.3 用Python隨機森林法探測未爆炸水雷 278
7.3.4 構(gòu)建隨機森林模型探測未爆炸水雷 279
7.3.5 測定隨機森林分類器的性能 283
7.4 用Python集成方法求解多類別分類問題 285
7.4.1 處理類別不均衡問題 286
7.4.2 用梯度提升法對玻璃進行分類 286
7.4.3 測定梯度提升模型在玻璃分類問題上的性能 291
7.4.4 用隨機森林法對玻璃進行分類 292
7.4.5 測定隨機森林模型在玻璃分類問題上的性能 296
7.5 用PySpark集成方法包求解回歸問題 297
7.5.1 用PySpark集成方法預測紅酒口感 298
7.5.2 用PySpark集成方法預測鮑魚年齡 303
7.5.3 用PySpark集成方法區(qū)分巖石與水雷 308
7.5.4 用PySpark集成方法識別玻璃類型 312
7.6 小結(jié) 314
展開全部

Spark和Python機器學習實戰(zhàn):預測分析核心方法(第2版) 作者簡介

邁克爾.鮑爾斯(Michael Bowles)在加利福尼亞大學伯克利分校、紐黑文大學和硅谷的黑客道場教授機器學習,為機器學習項目提供咨詢,還參與了半導體檢測、藥品設計、金融市場交易與優(yōu)化等領域許多創(chuàng)業(yè)公司的創(chuàng)辦。他在麻省理工學院獲得助理教授職位之后,創(chuàng)辦并經(jīng)營了兩家硅谷的創(chuàng)業(yè)公司,目前這兩家公司已上市。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 手持式线材张力计-套帽式风量罩-深圳市欧亚精密仪器有限公司 | 鲁尔圆锥接头多功能测试仪-留置针测试仪-上海威夏环保科技有限公司 | 杭州代理记账多少钱-注册公司代办-公司注销流程及费用-杭州福道财务管理咨询有限公司 | 浙江红酒库-冰雕库-气调库-茶叶库安装-医药疫苗冷库-食品物流恒温恒湿车间-杭州领顺实业有限公司 | 蓝米云-专注于高性价比香港/美国VPS云服务器及海外公益型免费虚拟主机 | 液晶拼接屏厂家_拼接屏品牌_拼接屏价格_监控大屏—北京维康 | 上海噪音治理公司-专业隔音降噪公司-中广通环保 | EPK超声波测厚仪,德国EPK测厚仪维修-上海树信仪器仪表有限公司 | 合肥风管加工厂-安徽螺旋/不锈钢风管-通风管道加工厂家-安徽风之范 | 活性炭-果壳木质煤质柱状粉状蜂窝活性炭厂家价格多少钱 | 密集架|电动密集架|移动密集架|黑龙江档案密集架-大量现货厂家销售 | 衬塑设备,衬四氟设备,衬氟设备-淄博鲲鹏防腐设备有限公司 | 帽子厂家_帽子工厂_帽子定做_义乌帽厂_帽厂_制帽厂_帽子厂_浙江高普制帽厂 | 河南空气能热水器-洛阳空气能采暖-洛阳太阳能热水工程-洛阳润达高科空气能商行 | 首页|成都尚玖保洁_家政保洁_开荒保洁_成都保洁 | 快速门厂家-快速卷帘门-工业快速门-硬质快速门-西朗门业 | 昆山新莱洁净应用材料股份有限公司-卫生级蝶阀,无菌取样阀,不锈钢隔膜阀,换向阀,离心泵 | 长城人品牌官网| 微波萃取合成仪-电热消解器价格-北京安合美诚科学仪器有限公司 | YT保温材料_YT无机保温砂浆_外墙保温材料_南阳银通节能建材高新技术开发有限公司 | 包装机传感器-搅拌站传感器-山东称重传感器厂家-济南泰钦电气 | [官网]叛逆孩子管教_戒网瘾学校_全封闭问题青少年素质教育_新起点青少年特训学校 | 氟塑料磁力泵-不锈钢离心泵-耐腐蚀化工泵厂家「皖金泵阀」 | 科箭WMS仓库管理软件-TMS物流管理系统-科箭SaaS云服务 | 超声波电磁流量计-液位计-孔板流量计-料位计-江苏信仪自动化仪表有限公司 | 层流手术室净化装修-检验科ICU改造施工-华锐净化工程-特殊科室建设厂家 | 锂电混合机-新能源混合机-正极材料混料机-高镍,三元材料混料机-负极,包覆混合机-贝尔专业混合混料搅拌机械系统设备厂家 | 背压阀|减压器|不锈钢减压器|减压阀|卫生级背压阀|单向阀|背压阀厂家-上海沃原自控阀门有限公司 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 | 耐高温硅酸铝板-硅酸铝棉保温施工|亿欧建设工程 | 不锈钢轴流风机,不锈钢电机-许昌光维防爆电机有限公司(原许昌光维特种电机技术有限公司) | 上海皓越真空设备有限公司官网-真空炉-真空热压烧结炉-sps放电等离子烧结炉 | 洗石机-移动滚筒式,振动,螺旋,洗矿机-青州冠诚重工机械有限公司 | 哔咔漫画网页版在线_下载入口访问指引 | 杰福伦_磁致伸缩位移传感器_线性位移传感器-意大利GEFRAN杰福伦-河南赉威液压科技有限公司 | vr安全体验馆|交通安全|工地安全|禁毒|消防|安全教育体验馆|安全体验教室-贝森德(深圳)科技 | 环境模拟实验室_液体-气体控温机_气体控温箱_无锡双润冷却科技有限公司 | 润东方环保空调,冷风机,厂房车间降温设备-20年深圳环保空调生产厂家 | 美缝剂_美缝剂厂家_美缝剂加盟-地老板高端瓷砖美缝剂 | 不锈钢丸厂家,铝丸,铸钢丸-淄博智源铸造材料有限公司 | 乳化沥青设备_改性沥青设备_沥青加温罐_德州市昊通路桥工程有限公司 | 刺绳_刀片刺网_刺丝滚笼_不锈钢刺绳生产厂家_安平县浩荣金属丝网制品有限公司-安平县浩荣金属丝网制品有限公司 |