中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
機械工業出版社大數據技術叢書SPARK機器學習:核心技術與實踐

包郵 機械工業出版社大數據技術叢書SPARK機器學習:核心技術與實踐

出版社:機械工業出版社出版時間:2017-06-01
開本: 16開 頁數: 229
中 圖 價:¥39.0(5.7折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

機械工業出版社大數據技術叢書SPARK機器學習:核心技術與實踐 版權信息

  • ISBN:9787111598466
  • 條形碼:9787111598466 ; 978-7-111-59846-6
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

機械工業出版社大數據技術叢書SPARK機器學習:核心技術與實踐 本書特色

本書采用理論與大量實例相結合的方式幫助開發人員掌握使用Spark進行分析和實現機器學習算法。通過這些示例和Spark在各種企業級系統中的應用,幫助讀者解鎖Spark機器學習算法的復雜性,通過數據分析產生有價值的數據洞察力。

機械工業出版社大數據技術叢書SPARK機器學習:核心技術與實踐 內容簡介

本書采用理論與大量實例相結合的方式幫助開發人員掌握使用Spark進行分析和實現機器學習算法。通過這些示例和Spark在各種企業級系統中的應用,幫助讀者解鎖Spark機器學習算法的復雜性,通過數據分析產生有價值的數據洞察力。

機械工業出版社大數據技術叢書SPARK機器學習:核心技術與實踐 目錄

目  錄?Contents
譯者序
關于作者
前言
第1章 大規模機器學習和Spark入門 1
1.1 數據科學 2
1.2 數據科學家:21世紀*炫酷的職業 2
1.2.1 數據科學家的一天 3
1.2.2 大數據處理 4
1.2.3 分布式環境下的機器學習算法 4
1.2.4 將數據拆分到多臺機器 6
1.2.5 從Hadoop MapReduce到Spark 6
1.2.6 什么是Databricks 7
1.2.7 Spark包含的內容 8
1.3 H2O.ai簡介 8
1.4 H2O和Spark MLlib的區別 10
1.5 數據整理 10
1.6 數據科學:一個迭代過程 11
1.7 小結 11
第2章 探索暗物質:希格斯玻色子 12
2.1 Ⅰ型錯誤與Ⅱ型錯誤 12
2.1.1 尋找希格斯玻色子 13
2.1.2 LHC和數據的創建 13
2.1.3 希格斯玻色子背后的理論 14
2.1.4 測量希格斯玻色子 14
2.1.5 數據集 14
2.2 啟動Spark與加載數據 15
2.2.1 標記點向量 22
2.2.2 創建訓練和測試集合 24
2.2.3 **個模型:決策樹 26
2.2.4 下一個模型:集合樹 32
2.2.5 *后一個模型:H2O深度學習 37
2.2.6 構建一個3層DNN 39
2.3 小結 45
第3章 多元分類的集成方法 46
3.1 數據 47
3.2 模型目標 48
3.2.1 挑戰 48
3.2.2 機器學習工作流程 48
3.2.3 使用隨機森林建模 61
3.3 小結 78
第4章 使用NLP和Spark Streaming預測電影評論 80
4.1 NLP簡介 81
4.2 數據集 82
4.3 特征提取 85
4.3.1 特征提取方法:詞袋模型 85
4.3.2 文本標記 86
4.4 特征化——特征哈希 89
4.5 我們來做一些模型訓練吧 92
4.5.1 Spark決策樹模型 93
4.5.2 Spark樸素貝葉斯模型 94
4.5.3 Spark隨機森林模型 95
4.5.4 Spark GBM模型 96
4.5.5 超級學習器模型 97
4.6 超級學習器 97
4.6.1 集合所有的轉換 101
4.6.2 使用超級學習器模型 105
4.7 小結 105
第5章 word2vec預測和聚類 107
5.1 詞向量的動機 108
5.2 word2vec解釋 108
5.2.1 什么是單詞向量 108
5.2.2 CBOW模型 110
5.2.3 skip-gram模型 111
5.2.4 玩轉詞匯向量 112
5.2.5 余弦相似性 113
5.3 doc2vec解釋 113
5.3.1 分布式內存模型 113
5.3.2 分布式詞袋模型 114
5.4 應用word2vec并用向量探索數據 116
5.5 創建文檔向量 118
5.6 監督學習任務 119
5.7 小結 123
第6章 從點擊流數據中抽取模式 125
6.1 頻繁模式挖掘 126
6.2 使用Spark MLlib進行模式挖掘 130
6.2.1 使用FP-growth進行頻繁模式挖掘 131
6.2.2 關聯規則挖掘 136
6.2.3 使用prefix span進行序列模式挖掘 138
6.2.4 在MSNBC點擊流數據上進行模式挖掘 141
6.3 部署模式挖掘應用 147
6.4 小結 154
第7章 使用GraphX進行圖分析 155
7.1 基本的圖理論 156
7.1.1 圖 156
7.1.2 有向和無向圖 156
7.1.3 階和度 157
7.1.4 有向無環圖 158
7.1.5 連通分量 159
7.1.6 樹 160
7.1.7 多重圖 160
7.1.8 屬性圖 161
7.2 GraphX分布式圖計算引擎 162
7.2.1 GraphX中圖的表示 163
7.2.2 圖的特性和操作 165
7.2.3 構建和加載圖 170
7.2.4 使用Gephi可視化圖結構 172
7.2.5 圖計算進階 178
7.2.6 GraphFrame 181
7.3 圖算法及其應用 183
7.3.1 聚類 183
7.3.2 頂點重要性 185
7.4 GraphX在上下文中 188
7.5 小結 189
第8章 Lending Club借貸預測 190
8.1 動機 190
8.1.1 目標 191
8.1.2 數據 192
8.1.3 數據字典 192
8.2 環境準備 193
8.3 數據加載 193
8.4 探索——數據分析 194
8.4.1 基本清理 194
8.4.2 預測目標 200
8.4.3 使用模型評分 221
8.4.4 模型部署 224
8.5 小結 229
展開全部

機械工業出版社大數據技術叢書SPARK機器學習:核心技術與實踐 作者簡介

About the Authors?關 于 作 者
Alex Tellez是一名終身的數據黑客/愛好者,對數據科學及其在商業問題上的應用充滿了激情。他在多個行業擁有豐富的經驗,包括銀行業、醫療保健、在線約會、人力資源和在線游戲。Alex還在各種人工智能/機器學習會議上進行過多次演講,同時也在大學講授關于神經網絡的課程。閑暇時間,Alex喜歡和家人在一起,騎自行車,并利用機器學習來滿足他對法國葡萄酒的好奇心!
首先,我要感謝Michal與我一起編寫本書。同樣作為的機器學習(Machine Learning,以下簡稱ML)愛好者、自行車愛好者、跑者和父親,在一年來共同努力的過程中,我們對彼此有了更深的了解。換句話說,沒有Michal的支持和鼓勵,本書是不可能完成的。
接下來,我要感謝我的媽媽、爸爸和哥哥Andres,從我出生天直到現在的每一步,你們都陪伴在我的周圍。毋庸置疑,我的哥哥仍會是我的英雄,是我永遠仰望的人,是我的指路燈。當然,還要感謝我美麗的妻子Denise和女兒Miya,在每個夜晚和周末給予我寫作上的關心和支持。我無法描述你們對我而言意味著多少,你們是我保持持續創作的靈感和動力。對我的女兒Miya,我的希望是,有一天當你拿起這本書時,會意識到你的老爸并不像看起來那么傻。About the Authors?關 于 作 者
Alex Tellez是一名終身的數據黑客/愛好者,對數據科學及其在商業問題上的應用充滿了激情。他在多個行業擁有豐富的經驗,包括銀行業、醫療保健、在線約會、人力資源和在線游戲。Alex還在各種人工智能/機器學習會議上進行過多次演講,同時也在大學講授關于神經網絡的課程。閑暇時間,Alex喜歡和家人在一起,騎自行車,并利用機器學習來滿足他對法國葡萄酒的好奇心!
首先,我要感謝Michal與我一起編寫本書。同樣作為的機器學習(Machine Learning,以下簡稱ML)愛好者、自行車愛好者、跑者和父親,在一年來共同努力的過程中,我們對彼此有了更深的了解。換句話說,沒有Michal的支持和鼓勵,本書是不可能完成的。
接下來,我要感謝我的媽媽、爸爸和哥哥Andres,從我出生天直到現在的每一步,你們都陪伴在我的周圍。毋庸置疑,我的哥哥仍會是我的英雄,是我永遠仰望的人,是我的指路燈。當然,還要感謝我美麗的妻子Denise和女兒Miya,在每個夜晚和周末給予我寫作上的關心和支持。我無法描述你們對我而言意味著多少,你們是我保持持續創作的靈感和動力。對我的女兒Miya,我的希望是,有一天當你拿起這本書時,會意識到你的老爸并不像看起來那么傻。
后,我也要感謝你——讀者,感謝你對這個令人興奮的領域以及難以置信的技術感興趣。無論你是一名經驗豐富的ML專家,還是希望立足的新人,你都會找到適合自己的內容,我希望你能像Michal和我一樣,從本書中獲得很多。
Max Pumperla是一名數據科學家和工程師,專注于深度學習及其應用。他目前在Skymind擔任深度學習工程師,并且是aetros.com的聯合創始人。Max是幾個Python軟件包的作者和維護者,包括elephas,一個使用Spark的分布式深度學習庫。他的開源足跡包括對許多流行的機器學習庫的貢獻,如keras、deeplearning4j和hyperopt。他擁有漢堡大學的代數幾何博士學位。
Michal Malohlava是Sparkling Water的創建者、極客和開發者,Java、Linux、編程語言愛好者,擁有10年以上的軟件開發經驗。他于2012年在布拉格的查爾斯大學獲得博士學位,并在普渡大學攻讀博士后。
在學習期間,他關注利用模型驅動方法和領域特定語言構建分布式、嵌入式、實時和模塊化系統,參與了各種系統的設計和開發,包括SOFA和分形組件系統以及jPapabench控制系統。
現在,他的主要興趣是大數據計算。他參與了高級大數據計算平臺H2O的開發,并將其嵌入到Spark引擎中作為Sparkling Water項目發布。
我要感謝我的妻子Claire,感謝她對于我的愛和鼓勵。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 广东成考网-广东成人高考网 | 橡胶接头_橡胶软接头_可曲挠橡胶接头-巩义市创伟机械制造有限公司 | 东莞螺杆空压机_永磁变频空压机_节能空压机_空压机工厂批发_深圳螺杆空压机_广州螺杆空压机_东莞空压机_空压机批发_东莞空压机工厂批发_东莞市文颖设备科技有限公司 | 集装箱展厅-住人集装箱住宿|建筑|房屋|集装箱售楼处-山东锐嘉科技工程有限公司 | 首页_欧瑞传动官方网站--主营变频器、伺服系统、新能源、软起动器、PLC、HMI | 洗瓶机厂家-酒瓶玻璃瓶冲瓶机-瓶子烘干机-封口旋盖压盖打塞机_青州惠联灌装机械 | 艾默生变频器,艾默生ct,变频器,ct驱动器,广州艾默生变频器,供水专用变频器,风机变频器,电梯变频器,艾默生变频器代理-广州市盟雄贸易有限公司官方网站-艾默生变频器应用解决方案服务商 | 量子管通环-自清洗过滤器-全自动反冲洗过滤器-沼河浸过滤器 | 耐火浇注料-喷涂料-浇注料生产厂家_郑州市元领耐火材料有限公司 耐力板-PC阳光板-PC板-PC耐力板 - 嘉兴赢创实业有限公司 | 铁艺,仿竹,竹节,护栏,围栏,篱笆,栅栏,栏杆,护栏网,网围栏,厂家 - 河北稳重金属丝网制品有限公司 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 一体化隔油提升设备-餐饮油水分离器-餐厨垃圾处理设备-隔油池-盐城金球环保产业发展有限公司 | 砖机托板价格|免烧砖托板|空心砖托板厂家_山东宏升砖机托板厂 | ★塑料拖链__工程拖链__电缆拖链__钢制拖链 - 【上海闵彬】 | 合金耐磨锤头_破碎机锤头_郑州市德勤建材有限公司 | 托盘租赁_塑料托盘租赁_托盘出租_栈板出租_青岛托盘租赁-优胜必达 | 影像测量仪_三坐标测量机_一键式二次元_全自动影像测量仪-广东妙机精密科技股份有限公司 | 中央空调温控器_风机盘管温控器_智能_液晶_三速开关面板-中央空调温控器厂家 | 爆破器材运输车|烟花爆竹运输车|1-9类危险品厢式运输车|湖北江南专用特种汽车有限公司 | 南京种植牙医院【官方挂号】_南京治疗种植牙医院那个好_南京看种植牙哪里好_南京茀莱堡口腔医院 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 物联网卡_物联网卡购买平台_移动物联网卡办理_移动联通电信流量卡通信模组采购平台? | 脉冲除尘器,除尘器厂家-淄博机械 | 气象监测系统_气象传感器_微型气象仪_气象环境监测仪-山东风途物联网 | 实验室装修_实验室设计_实验室规划设计- 上海广建净化工程公司 | 胃口福饺子加盟官网_新鲜现包饺子云吞加盟 - 【胃口福唯一官网】 | 首页 - 军军小站|张军博客 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 变色龙PPT-国内原创PPT模板交易平台 - PPT贰零 - 西安聚讯网络科技有限公司 | 苏州工作服定做-工作服定制-工作服厂家网站-尺品服饰科技(苏州)有限公司 | 济南玻璃安装_济南玻璃门_济南感应门_济南玻璃隔断_济南玻璃门维修_济南镜片安装_济南肯德基门_济南高隔间-济南凯轩鹏宇玻璃有限公司 | 浙江富广阀门有限公司| 天津热油泵_管道泵_天津高温热油泵-天津市金丰泰机械泵业有限公司【官方网站】 | 废气处理设备-工业除尘器-RTO-RCO-蓄热式焚烧炉厂家-江苏天达环保设备有限公司 | 集装箱展厅-住人集装箱住宿|建筑|房屋|集装箱售楼处-山东锐嘉科技工程有限公司 | 舞台木地板厂家_体育运动木地板_室内篮球馆木地板_实木运动地板厂家_欧氏篮球地板推荐 | 商秀—企业短视频代运营_抖音企业号托管 | 拉力测试机|材料拉伸试验机|电子拉力机价格|万能试验机厂家|苏州皖仪实验仪器有限公司 | 屏蔽泵厂家,化工屏蔽泵_维修-淄博泵业 | 工业CT-无锡璟能智能仪器有限公司 | lcd条形屏-液晶长条屏-户外广告屏-条形智能显示屏-深圳市条形智能电子有限公司 | 阁楼货架_阁楼平台_仓库仓储设备_重型货架_广州金铁牛货架厂 |