中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >
Spark MLlib機(jī)器學(xué)習(xí)實(shí)踐-(第2版)

包郵 Spark MLlib機(jī)器學(xué)習(xí)實(shí)踐-(第2版)

作者:王曉華著
出版社:清華大學(xué)出版社出版時(shí)間:2017-03-01
開本: 32開 頁數(shù): 191
中 圖 價(jià):¥25.0(5.1折) 定價(jià)  ¥49.0 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
開年大促, 全場(chǎng)包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

Spark MLlib機(jī)器學(xué)習(xí)實(shí)踐-(第2版) 版權(quán)信息

Spark MLlib機(jī)器學(xué)習(xí)實(shí)踐-(第2版) 本書特色

Spark作為新興的、應(yīng)用范圍*為廣泛的大數(shù)據(jù)處理開源框架引起了廣泛的關(guān)注,它吸引了大量程序設(shè)計(jì)和開發(fā)人員進(jìn)行相關(guān)內(nèi)容的學(xué)習(xí)與開發(fā),其中MLlib是Spark框架使用的核心。本書是一本細(xì)致介紹Spark MLlib程序設(shè)計(jì)的圖書,入門簡(jiǎn)單,示例豐富。 本書分為13章,從Spark基礎(chǔ)安裝和配置開始,依次介紹MLlib程序設(shè)計(jì)基礎(chǔ)、MLlib的數(shù)據(jù)對(duì)象構(gòu)建、MLlib中RDD使用介紹,各種分類、聚類、回歸等數(shù)據(jù)處理方法,*后還通過一個(gè)完整的實(shí)例,回顧了前面的學(xué)習(xí)內(nèi)容,并通過代碼實(shí)現(xiàn)了一個(gè)完整的分析過程。 本書理論內(nèi)容由淺而深,采取實(shí)例和理論相結(jié)合的方式,講解細(xì)致直觀,適合Spark MLlib初學(xué)者、大數(shù)據(jù)分析和挖掘人員,也適合高校和培訓(xùn)學(xué)習(xí)相關(guān)專業(yè)的師生教學(xué)參考。

Spark MLlib機(jī)器學(xué)習(xí)實(shí)踐-(第2版) 內(nèi)容簡(jiǎn)介

MLlib是Apache Spark機(jī)器學(xué)習(xí)庫。本書入門簡(jiǎn)單,實(shí)例豐富,詳解協(xié)同過濾、線性回歸、分類、決策樹、保序回歸、聚類、關(guān)聯(lián)、數(shù)據(jù)降維、特征提取和轉(zhuǎn)換等MLlib主要算法,用實(shí)例說明MLlib大數(shù)據(jù)機(jī)器學(xué)習(xí)算法的運(yùn)用。

Spark MLlib機(jī)器學(xué)習(xí)實(shí)踐-(第2版) 目錄

目 錄 第1章 星星之火 1 1.1 大數(shù)據(jù)時(shí)代 1 1.2 大數(shù)據(jù)分析時(shí)代 2 1.3 簡(jiǎn)單、優(yōu)雅、有效——這就是Spark 3 1.4 核心——MLlib 4 1.5 星星之火,可以燎原 6 1.6 小結(jié) 6 第2章 Spark安裝和開發(fā)環(huán)境配置 7 2.1 Windows單機(jī)模式Spark安裝和配置 7 2.1.1 Windows 7安裝Java 7 2.1.2 Windows 7安裝Scala 10 2.1.3 Intellij IDEA下載和安裝 13 2.1.4 Intellij IDEA中Scala插件的安裝 14 2.1.5 HelloJava——使用Intellij IDEA創(chuàng)建Java程序 18 2.1.6 HelloScala——使用Intellij IDEA創(chuàng)建Scala程序 21 2.1.7 *后一腳——Spark單機(jī)版安裝 26 2.2 經(jīng)典的WordCount 29 2.2.1 Spark實(shí)現(xiàn)WordCount 29 2.2.2 MapReduce實(shí)現(xiàn)WordCount 31 2.3 小結(jié) 34 第3章 RDD詳解 35 3.1 RDD是什么 35 3.1.1 RDD名稱的秘密 35 3.1.2 RDD特性 36 3.1.3 與其他分布式共享內(nèi)存的區(qū)別 37 3.1.4 RDD缺陷 37 3.2 RDD工作原理 38 3.2.1 RDD工作原理圖 38 3.2.2 RDD的相互依賴 38 3.3 RDD應(yīng)用API詳解 39 3.3.1 使用aggregate方法對(duì)給定的數(shù)據(jù)集進(jìn)行方法設(shè)定 39 3.3.2 提前計(jì)算的cache方法 42 3.3.3 笛卡爾操作的cartesian方法 43 3.3.4 分片存儲(chǔ)的coalesce方法 44 3.3.5 以value計(jì)算的countByValue方法 45 3.3.6 以key計(jì)算的countByKey方法 45 3.3.7 除去數(shù)據(jù)集中重復(fù)項(xiàng)的distinct方法 46 3.3.8 過濾數(shù)據(jù)的filter方法 47 3.3.9 以行為單位操作數(shù)據(jù)的flatMap方法 47 3.3.10 以單個(gè)數(shù)據(jù)為目標(biāo)進(jìn)行操作的map方法 48 3.3.11 分組數(shù)據(jù)的groupBy方法 48 3.3.12 生成鍵值對(duì)的keyBy方法 49 3.3.13 同時(shí)對(duì)兩個(gè)數(shù)據(jù)進(jìn)行處理的reduce方法 50 3.3.14 對(duì)數(shù)據(jù)進(jìn)行重新排序的sortBy方法 51 3.3.15 合并壓縮的zip方法 52 3.4 小結(jié) 53 第4章 MLlib基本概念 54 4.1 MLlib基本數(shù)據(jù)類型 54 4.1.1 多種數(shù)據(jù)類型 54 4.1.2 從本地向量集起步 55 4.1.3 向量標(biāo)簽的使用 56 4.1.4 本地矩陣的使用 58 4.1.5 分布式矩陣的使用 59 4.2 MLlib數(shù)理統(tǒng)計(jì)基本概念 62 4.2.1 基本統(tǒng)計(jì)量 62 4.2.2 統(tǒng)計(jì)量基本數(shù)據(jù) 63 4.2.3 距離計(jì)算 64 4.2.4 兩組數(shù)據(jù)相關(guān)系數(shù)計(jì)算 65 4.2.5 分層抽樣 67 4.2.6 假設(shè)檢驗(yàn) 69 4.2.7 隨機(jī)數(shù) 70 4.3 小結(jié) 71 第5章 協(xié)同過濾算法 72 5.1 協(xié)同過濾 72 5.1.1 協(xié)同過濾概述 72 5.1.2 基于用戶的推薦 73 5.1.3 基于物品的推薦 74 5.1.4 協(xié)同過濾算法的不足 75 5.2 相似度度量 75 5.2.1 基于歐幾里得距離的相似度計(jì)算 75 5.2.2 基于余弦角度的相似度計(jì)算 76 5.2.3 歐幾里得相似度與余弦相似度的比較 77 5.2.4 **個(gè)例子——余弦相似度實(shí)戰(zhàn) 77 5.3 MLlib中的交替*小二乘法(ALS算法) 80 5.3.1 *小二乘法(LS算法)詳解 81 5.3.2 MLlib中交替*小二乘法(ALS算法)詳解 82 5.3.3 ALS算法實(shí)戰(zhàn) 83 5.4 小結(jié) 85 第6章 MLlib線性回歸理論與實(shí)戰(zhàn) 86 6.1 隨機(jī)梯度下降算法詳解 86 6.1.1 道士下山的故事 87 6.1.2 隨機(jī)梯度下降算法的理論基礎(chǔ) 88 6.1.3 隨機(jī)梯度下降算法實(shí)戰(zhàn) 88 6.2 MLlib回歸的過擬合 89 6.2.1 過擬合產(chǎn)生的原因 90 6.2.2 lasso回歸與嶺回歸 91 6.3 MLlib線性回歸實(shí)戰(zhàn) 91 6.3.1 MLlib線性回歸基本準(zhǔn)備 91 6.3.2 MLlib線性回歸實(shí)戰(zhàn):商品價(jià)格與消費(fèi)者收入之間的關(guān)系 94 6.3.3 對(duì)擬合曲線的驗(yàn)證 95 6.4 小結(jié) 97 第7章 MLlib分類實(shí)戰(zhàn) 98 7.1 邏輯回歸詳解 98 7.1.1 邏輯回歸不是回歸算法 98 7.1.2 邏輯回歸的數(shù)學(xué)基礎(chǔ) 99 7.1.3 一元邏輯回歸示例 100 7.1.4 多元邏輯回歸示例 101 7.1.5 MLlib邏輯回歸驗(yàn)證 103 7.1.6 MLlib邏輯回歸實(shí)例:腎癌的轉(zhuǎn)移判斷 104 7.2 支持向量機(jī)詳解 106 7.2.1 三角還是圓 106 7.2.2 支持向量機(jī)的數(shù)學(xué)基礎(chǔ) 108 7.2.3 支持向量機(jī)使用示例 109 7.2.4 使用支持向量機(jī)分析腎癌轉(zhuǎn)移 110 7.3 樸素貝葉斯詳解 111 7.3.1 穿褲子的男生or女生 111 7.3.2 貝葉斯定理的數(shù)學(xué)基礎(chǔ)和意義 112 7.3.3 樸素貝葉斯定理 113 7.3.4 MLlib樸素貝葉斯使用示例 114 7.3.5 MLlib樸素貝葉斯實(shí)戰(zhàn):“僵尸粉”的鑒定 115 7.4 小結(jié) 117 第8章 決策樹與保序回歸 118 8.1 決策樹詳解 118 8.1.1 水晶球的秘密 119 8.1.2 決策樹的算法基礎(chǔ):信息熵 119 8.1.3 決策樹的算法基礎(chǔ)——ID3算法 121 8.1.4 MLlib中決策樹的構(gòu)建 122 8.1.5 MLlib中決策樹示例 123 8.1.6 隨機(jī)雨林與梯度提升算法(GBT) 125 8.2 保序回歸詳解 127 8.2.1 何為保序回歸 128 8.2.2 保序回歸示例 128 8.3 小結(jié) 129 第9章 MLlib中聚類詳解 130 9.1 聚類與分類 130 9.1.1 什么是分類 130 9.1.2 什么是聚類 131 9.2 MLlib中的Kmeans算法 131 9.2.1 什么是kmeans算法 131 9.2.2 MLlib中Kmeans算法示例 133 9.2.3 Kmeans算法中細(xì)節(jié)的討論 134 9.3 高斯混合聚類 135 9.3.1 從高斯分布聚類起步 135 9.3.2 混合高斯聚類 137 9.3.3 MLlib高斯混合模型使用示例 137 9.4 快速迭代聚類 138 9.4.1 快速迭代聚類理論基礎(chǔ) 138 9.4.2 快速迭代聚類示例 139 9.5 小結(jié) 140 第10章 MLlib中關(guān)聯(lián)規(guī)則 141 10.1 Apriori頻繁項(xiàng)集算法 141 10.1.1 啤酒與尿布 141 10.1.2 經(jīng)典的Apriori算法 142 10.1.3 Apriori算法示例 144 10.2 FP-growth算法 145 10.2.1 Apriori算法的局限性 145 10.2.2 FP-growth算法 145 10.2.3 FP樹示例 148 10.3 小結(jié) 149 第11章 數(shù)據(jù)降維 150 11.1 奇異值分解(SVD) 150 11.1.1 行矩陣(RowMatrix)詳解 150 11.1.2 奇異值分解算法基礎(chǔ) 151 11.1.3 MLlib中奇異值分解示例 152 11.2 主成分分析(PCA) 153 11.2.1 主成分分析(PCA)的定義 154 11.2.2 主成分分析(PCA)的數(shù)學(xué)基礎(chǔ) 154 11.2.3 MLlib中主成分分析(PCA)示例 155 11.3 小結(jié) 156 第12章 特征提取和轉(zhuǎn)換 157 12.1 TF-IDF 157 12.1.1 如何查找所要的新聞 157 12.1.2 TF-IDF算法的數(shù)學(xué)計(jì)算 158 12.1.3 MLlib中TF-IDF示例 159 12.2 詞向量化工具 160 12.2.1 詞向量化基礎(chǔ) 160 12.2.2 詞向量化使用示例 161 12.3 基于卡方檢驗(yàn)的特征選擇 162 12.3.1 “吃貨”的苦惱 162 12.3.2 MLlib中基于卡方檢驗(yàn)的特征選擇示例 163 12.4 小結(jié) 164 第13章 MLlib實(shí)戰(zhàn)演練——鳶尾花分析 166 13.1 建模說明 166 13.1.1 數(shù)據(jù)的描述與分析目標(biāo) 166 13.1.2 建模說明 168 13.2 數(shù)據(jù)預(yù)處理和分析 171 13.2.1 微觀分析——均值與方差的對(duì)比分析 171 13.2.2 宏觀分析——不同種類特性的長(zhǎng)度計(jì)算 174 13.2.3 去除重復(fù)項(xiàng)——相關(guān)系數(shù)的確定 176 13.3 長(zhǎng)與寬之間的關(guān)系——數(shù)據(jù)集的回歸分析 180 13.3.1 使用線性回歸分析長(zhǎng)與寬之間的關(guān)系 180 13.3.2 使用邏輯回歸分析長(zhǎng)與寬之間的關(guān)系 183 13.4 使用分類和聚類對(duì)鳶尾花數(shù)據(jù)集進(jìn)行處理 184 13.4.1 使用聚類分析對(duì)數(shù)據(jù)集進(jìn)行聚類處理 184 13.4.2 使用分類分析對(duì)數(shù)據(jù)集進(jìn)行分類處理 187 13.5 *終的判定——決策樹測(cè)試 188 13.5.1 決定數(shù)據(jù)集的歸類——決策樹 188 13.5.2 決定數(shù)據(jù)集歸類的分布式方法——隨機(jī)雨林 190 13.6 小結(jié) 191
展開全部

Spark MLlib機(jī)器學(xué)習(xí)實(shí)踐-(第2版) 作者簡(jiǎn)介

王曉華,高校資深計(jì)算機(jī)專業(yè)講師,主要研究方向?yàn)樵朴?jì)算、數(shù)據(jù)挖掘;曾主持和參與多項(xiàng)國(guó)家和省級(jí)科研課題,發(fā)表過多篇論文,有一項(xiàng)專利。

商品評(píng)論(0條)
暫無評(píng)論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 齿轮减速电机一体机_蜗轮蜗杆减速马达-德国BOSERL齿轮减速机带电机生产厂家 | 渣土车电机,太阳能跟踪器电机,蜗轮蜗杆减速电机厂家-淄博传强电机 | 车件|铜件|车削件|车床加工|五金冲压件-PIN针,精密车件定制专业厂商【东莞品晔】 | 包头市鑫枫装饰有限公司| 天津试验仪器-电液伺服万能材料试验机,恒温恒湿标准养护箱,水泥恒应力压力试验机-天津鑫高伟业科技有限公司 | 镀锌钢格栅_热镀锌格栅板_钢格栅板_热镀锌钢格板-安平县昊泽丝网制品有限公司 | 自动气象站_农业气象站_超声波气象站_防爆气象站-山东万象环境科技有限公司 | 水厂自动化|污水处理中控系统|水利信息化|智慧水务|智慧农业-山东德艾自动化科技有限公司 | 彼得逊采泥器-定深式采泥器-电动土壤采样器-土壤样品风干机-常州索奥仪器制造有限公司 | RO反渗透设备_厂家_价格_河南郑州江宇环保科技有限公司 | 膜结构停车棚-自行车棚-膜结构汽车棚加工安装厂家幸福膜结构 | 绿萝净除甲醛|深圳除甲醛公司|测甲醛怎么收费|培训机构|电影院|办公室|车内|室内除甲醛案例|原理|方法|价格立马咨询 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 | 砖机托板价格|免烧砖托板|空心砖托板厂家_山东宏升砖机托板厂 | 细胞染色-流式双标-试剂盒免费代做-上海研谨生物科技有限公司 | 合肥礼品公司-合肥礼品定制-商务礼品定制公司-安徽柏榽商贸有限公司 | 低合金板|安阳低合金板|河南低合金板|高强度板|桥梁板_安阳润兴 北京租车牌|京牌指标租赁|小客车指标出租 | 太空舱_民宿太空舱厂家_移动房屋太空舱价格-豪品建筑 | 丙烷/液氧/液氮气化器,丙烷/液氧/液氮汽化器-无锡舍勒能源科技有限公司 | 中矗模型-深圳中矗模型设计有限公司 | 开平机_纵剪机厂家_开平机生产厂家|诚信互赢-泰安瑞烨精工机械制造有限公司 | 济南律师,济南法律咨询,山东法律顾问-山东沃德律师事务所 | 中开泵,中开泵厂家,双吸中开泵-山东博二泵业有限公司 | 船用泵,船用离心泵,船用喷射泵,泰州隆华船舶设备有限公司 | 台湾HIWIN上银直线模组|导轨滑块|TBI滚珠丝杆丝杠-深圳汉工 | 细砂提取机,隔膜板框泥浆污泥压滤机,螺旋洗砂机设备,轮式洗砂机械,机制砂,圆锥颚式反击式破碎机,振动筛,滚筒筛,喂料机- 上海重睿环保设备有限公司 | 广东护栏厂家-广州护栏网厂家-广东省安麦斯交通设施有限公司 | 档案密集架_电动密集架_移动密集架_辽宁档案密集架-盛隆柜业厂家现货批发销售价格公道 | 亳州网络公司 - 亳州网站制作 - 亳州网站建设 - 亳州易天科技 | 混合气体腐蚀试验箱_盐雾/硫化氢/气体腐蚀试验箱厂家-北京中科博达 | 胶原检测试剂盒,弹性蛋白检测试剂盒,类克ELISA试剂盒,阿达木单抗ELISA试剂盒-北京群晓科苑生物技术有限公司 | 塑料造粒机「厂家直销」-莱州鑫瑞迪机械有限公司 | 塑胶跑道施工-硅pu篮球场施工-塑胶网球场建造-丙烯酸球场材料厂家-奥茵 | Copeland/谷轮压缩机,谷轮半封闭压缩机,谷轮涡旋压缩机,型号规格,技术参数,尺寸图片,价格经销商 CTP磁天平|小电容测量仪|阴阳极极化_双液系沸点测定仪|dsj电渗实验装置-南京桑力电子设备厂 | 钢板仓,大型钢板仓,钢板库,大型钢板库,粉煤灰钢板仓,螺旋钢板仓,螺旋卷板仓,骨料钢板仓 | ge超声波测厚仪-电动涂膜机-电动划格仪-上海洪富| 定制异形重型钢格栅板/钢格板_定做踏步板/排水沟盖板_钢格栅板批发厂家-河北圣墨金属制品有限公司 | 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 金属雕花板_厂家直销_价格低-山东慧诚建筑材料有限公司 | 脉冲除尘器,除尘器厂家-淄博机械 | Maneurop/美优乐压缩机,活塞压缩机,型号规格,技术参数,尺寸图片,价格经销商 |