中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
深度實踐Spark機器學習

包郵 深度實踐Spark機器學習

出版社:機械工業出版社出版時間:2018-02-01
開本: 16開 頁數: 234頁
中 圖 價:¥39.0(5.7折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

深度實踐Spark機器學習 版權信息

  • ISBN:9787111589952
  • 條形碼:9787111589952 ; 978-7-111-58995-2
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

深度實踐Spark機器學習 本書特色

本書以新的Spark2.0為技術基礎,重點講解了如何構建機器學習系統以及如何實現機器學習流程的標準化,這兩點都是目前同類書中沒有的。第1~7章從概念、架構、算法等角度介紹了機器學習的基本概念;第8~12章以實例為主,詳細講解了機器學習流程標準化涉及的關鍵技術;第13章主要以在線數據或流式數據為主介紹了流式計算框架SparkStreaming;第14章重點講解了深度學習的框架TensorFlowOnSprak。此外,附錄部分提供了線性代數、概率統計及Scala的基礎知識,幫助讀者更好地學習和掌握機器學習的相關內容。

深度實踐Spark機器學習 內容簡介

本書以新的Spark2.0為技術基礎,重點講解了如何構建機器學習系統以及如何實現機器學習流程的標準化,這兩點都是目前同類書中沒有的。第1~7章從概念、架構、算法等角度介紹了機器學習的基本概念;第8~12章以實例為主,詳細講解了機器學習流程標準化涉及的關鍵技術;第13章主要以在線數據或流式數據為主介紹了流式計算框架SparkStreaming;第14章重點講解了深度學習的框架TensorFlowOnSprak。此外,附錄部分提供了線性代數、概率統計及Scala的基礎知識,幫助讀者更好地學習和掌握機器學習的相關內容。

深度實踐Spark機器學習 目錄

目  錄?Contents
前言
第1章 了解機器學習 1
1.1 機器學習的定義 1
1.2 大數據與機器學習 2
1.3 機器學習、人工智能及深度學習 2
1.4 機器學習的基本任務 3
1.5 如何選擇合適算法 4
1.6 Spark在機器學習方面的優勢 5
1.7 小結 5
第2章 構建Spark機器學習系統 6
2.1 機器學習系統架構 6
2.2 啟動集群 7
2.3 加載數據 9
2.4 探索數據 10
2.4.1 數據統計信息 10
2.4.2 數據質量分析 11
2.4.3 數據特征分析 12
2.4.4 數據的可視化 17
2.5 數據預處理 19
2.5.1 數據清理 20
2.5.2 數據變換 21
2.5.3 數據集成 22
2.5.4 數據歸約 23
2.6 構建模型 25
2.7 模型評估 26
2.8 組裝 30
2.9 模型選擇或調優 30
2.9.1 交叉驗證 31
2.9.2 訓練–驗證切分 32
2.10 保存模型 32
2.11 小結 33
第3章 ML Pipeline原理與實戰 34
3.1 Pipeline簡介 34
3.2 DataFrame 35
3.3 Pipeline組件 36
3.4 Pipeline原理 37
3.5 Pipeline實例 38
3.5.1 使用Estimator、Transformer和Param的實例 38
3.5.2 ML使用Pipeline的實例 40
3.6 小結 41
第4章 特征提取、轉換和選擇 42
4.1 特征提取 42
4.1.1 詞頻—逆向文件
頻率(TF-IDF) 42
4.1.2 Word2Vec 43
4.1.3 計數向量器 44
4.2 特征轉換 45
4.2.1 分詞器 45
4.2.2 移除停用詞 46
4.2.3 n-gram 47
4.2.4 二值化 48
4.2.5 主成分分析 48
4.2.6 多項式展開 50
4.2.7 離散余弦變換 50
4.2.8 字符串—索引變換 51
4.2.9  索引—字符串變換 53
4.2.10 獨熱編碼 54
4.2.11 向量—索引變換 57
4.2.12 交互式 58
4.2.13 正則化 59
4.2.14 規范化 60
4.2.15 *大值—*小值縮放 60
4.2.16 *大值—絕對值縮放 61
4.2.17 離散化重組 62
4.2.18 元素乘積 63
4.2.19 SQL轉換器 64
4.2.20 向量匯編 65
4.2.21 分位數離散化 66
4.3 特征選擇 67
4.3.1 向量機 67
4.3.2 R公式 69
4.3.3 卡方特征選擇 70
4.4 小結 71
第5章 模型選擇和優化 72
5.1 模型選擇 72
5.2 交叉驗證 73
5.3 訓練驗證拆分法 75
5.4 自定義模型選擇 76
5.5 小結 78
第6章 Spark MLlib基礎 79
6.1 Spark MLlib簡介 80
6.2 Spark MLlib架構 81
6.3 數據類型 82
6.4 基礎統計 84
6.4.1 摘要統計 84
6.4.2 相關性 84
6.4.3 假設檢驗 85
6.4.4 隨機數據生成 85
6.5 RDD、Dataframe和Dataset 86
6.5.1 RDD 86
6.5.2 DatasetDataFrame 87
6.5.3 相互轉換 88
6.6 小結 89
第7章 構建Spark ML推薦模型 90
7.1 推薦模型簡介 91
7.2 數據加載 92
7.3 數據探索 94
7.4 訓練模型 94
7.5 組裝 95
7.6 評估模型 96
7.7 模型優化 96
7.8 小結 98
第8章 構建Spark ML分類模型 99
8.1 分類模型簡介 99
8.1.1 線性模型 100
8.1.2 決策樹模型 101
8.1.3 樸素貝葉斯模型 102
8.2 數據加載 102
8.3 數據探索 103
8.4 數據預處理 104
8.5 組裝 109
8.6 模型優化 110
8.7 小結 113
第9章 構建Spark ML回歸模型 114
9.1 回歸模型簡介 115
9.2 數據加載 115
9.3 探索特征分布 117
9.4 數據預處理 120
9.4.1 特征選擇 121
9.4.2 特征轉換 121
9.5 組裝 122
9.6 模型優化 124
9.7 小結 126
第10章 構建Spark ML聚類模型 127
10.1 K-means模型簡介 128
10.2 數據加載 129
10.3 探索特征的相關性 129
10.4 數據預處理 131
10.5 組裝 132
10.6 模型優化 134
10.7 小結 136
第11章 PySpark 決策樹模型 137
11.1 PySpark 簡介 138
11.2 決策樹簡介 139
11.3 數據加載 140
11.3.1 原數據集初探 140
11.3.2 PySpark的啟動 142
11.3.3 基本函數 142
11.4 數據探索 143
11.5 數據預處理 143
11.6 創建決策樹模型 145
11.7 訓練模型進行預測 146
11.8 模型優化 149
11.8.1 特征值的優化 149
11.8.2 交叉驗證和網格參數 152
11.9 腳本方式運行 154
11.9.1 在腳本中添加配置信息 154
11.9.2 運行腳本程序 154
11.10 小結 154
第12章 SparkR樸素貝葉斯模型 155
12.1 SparkR簡介 156
12.2 獲取數據 157
12.2.1 SparkDataFrame數據結構
說明 157
12.2.2 創建SparkDataFrame 157
12.2.3 SparkDataFrame的常用操作 160
12.3 樸素貝葉斯分類器 162
12.3.1 數據探查 162
12.3.2 對原始數據集進行轉換 163
12.3.3 查看不同船艙的生還率差異 163
12.3.4 轉換成SparkDataFrame格式的數據 165
12.3.5 模型概要 165
12.3.6 預測 165
12.3.7 評估模型 166
12.4 小結 167
第13章 使用Spark Streaming構建在線學習模型 168
13.1 Spark Streaming簡介 168
13.1.1 Spark Streaming常用術語 169
13.1.2 Spark Streaming處理流程 169
13.2 Dstream操作
展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 铝板冲孔网,不锈钢冲孔网,圆孔冲孔网板,鳄鱼嘴-鱼眼防滑板,盾构走道板-江拓数控冲孔网厂-河北江拓丝网有限公司 | 钢化玻璃膜|手机钢化膜|钢化膜厂家|手机保护膜-【东莞市大象电子科技有限公司】 | 济南展厅设计施工_数字化展厅策划设计施工公司_山东锐尚文化传播有限公司 | 罗茨真空机组,立式无油往复真空泵,2BV水环真空泵-力侨真空科技 | 喷漆房_废气处理设备-湖北天地鑫环保设备有限公司 | 电缆接头_防水接头_电缆防水接头_防水电缆接头_上海闵彬 | NM-02立式吸污机_ZHCS-02软轴刷_二合一吸刷软轴刷-厦门地坤科技有限公司 | 大流量卧式砂磨机_强力分散机_双行星双动力混合机_同心双轴搅拌机-莱州市龙跃化工机械有限公司 | 不锈钢丸厂家,铝丸,铸钢丸-淄博智源铸造材料有限公司 | 手持式浮游菌采样器-全排二级生物安全柜-浙江孚夏医疗科技有限公司 | 高空重型升降平台_高空液压举升平台_高空作业平台_移动式升降机-河南华鹰机械设备有限公司 | 挖掘机挖斗和铲斗生产厂家选择徐州崛起机械制造有限公司 | 贴片电容代理-三星电容-村田电容-风华电容-国巨电容-深圳市昂洋科技有限公司 | 高柔性拖链电缆-聚氨酯卷筒电缆-柔性屏蔽电缆厂家-玖泰电缆 | 上海单片机培训|重庆曙海培训分支机构—CortexM3+uC/OS培训班,北京linux培训,Windows驱动开发培训|上海IC版图设计,西安linux培训,北京汽车电子EMC培训,ARM培训,MTK培训,Android培训 | 食品机械专用传感器-落料放大器-低价接近开关-菲德自控技术(天津)有限公司 | 壹作文_中小学生优秀满分作文大全 | 压缩空气检测_气体_水质找上海京工-服务专业、价格合理 | 多米诺-多米诺世界纪录团队-多米诺世界-多米诺团队培训-多米诺公关活动-多米诺创意广告-多米诺大型表演-多米诺专业赛事 | 骁龙云呼电销防封号系统-axb电销平台-外呼稳定『免费试用』 | 阿里巴巴诚信通温州、台州、宁波、嘉兴授权渠道商-浙江联欣科技提供阿里会员办理 | 蚂蚁分类信息系统 - PHP同城分类信息系统 - MayiCMS | 手术室净化厂家-成都做医院净化工程的公司-四川华锐-15年特殊科室建设经验 | 交变/复合盐雾试验箱-高低温冲击试验箱_安奈设备产品供应杭州/江苏南京/安徽马鞍山合肥等全国各地 | 杰恒蠕动泵-蠕动泵专业厂家-19年专注蠕动泵 | 京港视通报道-质量走进大江南北-京港视通传媒[北京]有限公司 | 「阿尔法设计官网」工业设计_产品设计_产品外观设计 深圳工业设计公司 | 玖容气动液压设备有限公司-气液增压缸_压力机_增压机_铆接机_增压器 | 微波消解仪器_智能微波消解仪报价_高压微波消解仪厂家_那艾 | 高柔性拖链电缆-聚氨酯卷筒电缆-柔性屏蔽电缆厂家-玖泰电缆 | 便携式XPDM露点仪-在线式防爆露点仪-增强型烟气分析仪-约克仪器 冰雕-冰雪世界-大型冰雕展制作公司-赛北冰雕官网 | 航空障碍灯_高中低光强航空障碍灯_民航许可认证航空警示灯厂家-东莞市天翔航天科技有限公司 | 自动售货机_无人售货机_专业的自动售货机运营商_免费投放售货机-广州富宏主官网 | 爆炸冲击传感器-无线遥测传感器-航天星百科 | 颗粒机,颗粒机组,木屑颗粒机-济南劲能机械有限公司 | 杭州|上海贴标机-百科| 高低温万能试验机-复合材料万能试验机-馥勒仪器| ★店家乐|服装销售管理软件|服装店收银系统|内衣店鞋店进销存软件|连锁店管理软件|收银软件手机版|会员管理系统-手机版,云版,App | 流量检测仪-气密性检测装置-密封性试验仪-东莞市奥图自动化科技有限公司 | 免费分销系统 — 分销商城系统_分销小程序开发 -【微商来】 | 伶俐嫂培训学校_月嫂培训班在哪里报名学费是多少_月嫂免费政府培训中心推荐 |