中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊

包郵 數(shù)據(jù)算法-Hadoop/Spark大數(shù)據(jù)處理技術(shù)

出版社:中國電力出版社出版時間:2016-10-01
開本: 32開 頁數(shù): 696
中 圖 價:¥49.6(3.9折) 定價  ¥128.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標(biāo)記、光盤等附件不全詳細(xì)品相說明>>
本類五星書更多>
買過本商品的人還買了

數(shù)據(jù)算法-Hadoop/Spark大數(shù)據(jù)處理技術(shù) 版權(quán)信息

數(shù)據(jù)算法-Hadoop/Spark大數(shù)據(jù)處理技術(shù) 本書特色

本書介紹了很多基本設(shè)計(jì)模式、優(yōu)化技術(shù)和數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)解決方案,以解決生物信息學(xué)、基因組學(xué)、統(tǒng)計(jì)和社交網(wǎng)絡(luò)分析等領(lǐng)域的很多問題。這本書還概要介紹了MapReduce、Hadoop和Spark。
本書主要內(nèi)容包括:
■ 完成超大量交易的購物籃分析。
■ 數(shù)據(jù)挖掘算法(K-均值、KNN和樸素貝葉斯)。
■ 使用超大基因組數(shù)據(jù)完成DNA和RNA測序。
■ 樸素貝葉斯定理和馬爾可夫鏈實(shí)現(xiàn)數(shù)據(jù)和市場預(yù)測。
■ 推薦算法和成對文檔相似性。
■ 線性回歸、Cox回歸和皮爾遜(Pearson)相關(guān)分析。本書介紹了很多基本設(shè)計(jì)模式、優(yōu)化技術(shù)和數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)解決方案,以解決生物信息學(xué)、基因組學(xué)、統(tǒng)計(jì)和社交網(wǎng)絡(luò)分析等領(lǐng)域的很多問題。這本書還概要介紹了MapReduce、Hadoop和Spark。 本書主要內(nèi)容包括: ■ 完成超大量交易的購物籃分析。 ■ 數(shù)據(jù)挖掘算法(K-均值、KNN和樸素貝葉斯)。 ■ 使用超大基因組數(shù)據(jù)完成DNA和RNA測序。 ■ 樸素貝葉斯定理和馬爾可夫鏈實(shí)現(xiàn)數(shù)據(jù)和市場預(yù)測。 ■ 推薦算法和成對文檔相似性。 ■ 線性回歸、Cox回歸和皮爾遜(Pearson)相關(guān)分析。 ■ 等位基因頻率和DNA挖掘。 ■ 社交網(wǎng)絡(luò)分析(推薦系統(tǒng)、三角形計(jì)數(shù)和情感分析)。信息

數(shù)據(jù)算法-Hadoop/Spark大數(shù)據(jù)處理技術(shù) 內(nèi)容簡介

如果你準(zhǔn)備深入研究MapReduce框架來處理大數(shù)據(jù)集,這本書非常實(shí)用,通過提供豐富的算法和工具,它會循序漸進(jìn)地帶你探索MapReduce世界,用Apache Hadoop或Apache Spark構(gòu)建分布式MapReduce應(yīng)用時通常都需要用到這些算法和工具。每一章分別提供一個實(shí)例來解決一個大規(guī)模計(jì)算問題,如構(gòu)建推薦系統(tǒng)。你會了解如何用代碼實(shí)現(xiàn)適當(dāng)?shù)腗apReduce解決方案,而且可以在你的項(xiàng)目中具體應(yīng)用這些解決方案。

數(shù)據(jù)算法-Hadoop/Spark大數(shù)據(jù)處理技術(shù) 目錄

序 1
前言 3
第1章二次排序:簡介 19
二次排序問題解決方案 21
MapReduce/Hadoop的二次排序解決方案 25
Spark的二次排序解決方案 29
第2章二次排序:詳細(xì)示例 42
二次排序技術(shù) 43
二次排序的完整示例 46
運(yùn)行示例——老版本Hadoop API 50
運(yùn)行示例——新版本Hadoop API 52
第3章 Top 10 列表 54
Top N 設(shè)計(jì)模式的形式化描述 55
MapReduce/Hadoop實(shí)現(xiàn):唯一鍵 56序 1
前言 3
第1章二次排序:簡介 19
二次排序問題解決方案 21
MapReduce/Hadoop的二次排序解決方案 25
Spark的二次排序解決方案 29
第2章二次排序:詳細(xì)示例 42
二次排序技術(shù) 43
二次排序的完整示例 46
運(yùn)行示例——老版本Hadoop API 50
運(yùn)行示例——新版本Hadoop API 52
第3章 Top 10 列表 54
Top N 設(shè)計(jì)模式的形式化描述 55
MapReduce/Hadoop實(shí)現(xiàn):唯一鍵 56
Spark實(shí)現(xiàn):唯一鍵 62
Spark實(shí)現(xiàn):非唯一鍵 73
使用takeOrdered()的Spark Top 10 解決方案 84
MapReduce/Hadoop Top 10 解決方案:非唯一鍵 91
第4章左外連接 96
左外連接示例 96
MapReduce左外連接實(shí)現(xiàn) 99
Spark左外連接實(shí)現(xiàn) 105
使用leftOuterJoin()的Spark實(shí)現(xiàn) 117
第5章反轉(zhuǎn)排序 127
反轉(zhuǎn)排序模式示例 128
反轉(zhuǎn)排序模式的MapReduce/Hadoop實(shí)現(xiàn) 129
運(yùn)行示例 134
第6章移動平均 137
示例1:時間序列數(shù)據(jù)(股票價格) 137
示例2:時間序列數(shù)據(jù)(URL訪問數(shù)) 138
形式定義 139
POJO移動平均解決方案 140
MapReduce/Hadoop移動平均解決方案 143
第7章購物籃分析 155
MBA目標(biāo) 155
MBA的應(yīng)用領(lǐng)域 157
使用MapReduce的購物籃分析 157
Spark解決方案 166
運(yùn)行Spark實(shí)現(xiàn)的YARN 腳本 179
第8章共同好友 182
輸入 183
POJO共同好友解決方案 183
MapReduce算法 184
解決方案1: 使用文本的Hadoop實(shí)現(xiàn) 187
解決方案2: 使用ArrayListOfLongsWritable 的Hadoop實(shí)現(xiàn) 189
Spark解決方案 191
第9章使用MapReduce實(shí)現(xiàn)推薦引擎 201
購買過該商品的顧客還購買了哪些商品 202
經(jīng)常一起購買的商品 206
推薦連接 210
第10章基于內(nèi)容的電影推薦 225
輸入 226
MapReduce階段1 226
MapReduce階段2和階段3 227
Spark電影推薦實(shí)現(xiàn) 234
第11章使用馬爾可夫模型的智能郵件營銷 .253
馬爾可夫鏈基本原理 254
使用MapReduce的馬爾可夫模型 256
Spark解決方案 269
第12章 K-均值聚類 282
什么是K-均值聚類? 285
聚類的應(yīng)用領(lǐng)域 285
K-均值聚類方法非形式化描述:分區(qū)方法 286
K-均值距離函數(shù) 286
K-均值聚類形式化描述 287
K-均值聚類的MapReduce解決方案 288
K-均值算法Spark實(shí)現(xiàn) 292
第13章 k-近鄰 296
kNN分類 297
距離函數(shù) 297
kNN示例 298
kNN算法非形式化描述 299
kNN算法形式化描述 299
kNN的類Java非MapReduce 解決方案 299
Spark的kNN算法實(shí)現(xiàn) 301
第14章樸素貝葉斯 315
訓(xùn)練和學(xué)習(xí)示例 316
條件概率 319
深入分析樸素貝葉斯分類器 319
樸素貝葉斯分類器:符號數(shù)據(jù)的MapReduce解決方案 322
樸素貝葉斯分類器Spark實(shí)現(xiàn) 332
使用Spark和Mahout 347
第15章情感分析 349
情感示例 350
情感分?jǐn)?shù):正面或負(fù)面 350
一個簡單的MapReduce情感分析示例 351
真實(shí)世界的情感分析 353
第16章查找、統(tǒng)計(jì)和列出大圖中的所有三角形 354
基本的圖概念 355
三角形計(jì)數(shù)的重要性 356
MapReduce/Hadoop解決方案 357
Spark解決方案 364
第17章 K-mer計(jì)數(shù) 375
K-mer計(jì)數(shù)的輸入數(shù)據(jù) 376
K-mer計(jì)數(shù)應(yīng)用 376
K-mer計(jì)數(shù)MapReduce/Hadoop解決方案 377
K-mer計(jì)數(shù)Spark解決方案 378
第18章 DNA測序 390
DNA測序的輸入數(shù)據(jù) 392
輸入數(shù)據(jù)驗(yàn)證 393
DNA序列比對 393
DNA測試的MapReduce算法 394
第19章 Cox回歸 413
Cox模型剖析 414
使用R的Cox回歸 415
Cox回歸應(yīng)用 416
Cox回歸 POJO解決方案 417
MapReduce輸入 418
使用MapReduce的Cox回歸 419
第20章 Cochran-Armitage趨勢檢驗(yàn) 426
Cochran-Armitage算法 427
Cochran-Armitage應(yīng)用 432
MapReduce解決方案 435
第21章等位基因頻率 443
基本定義 444
形式化問題描述 448
等位基因頻率分析的MapReduce解決方案 449
MapReduce解決方案, 階段1 449
MapReduce解決方案,階段2 459
MapReduce解決方案, 階段3 463
染色體X 和Y的特殊處理 466
第22章 T檢驗(yàn) 468
對bioset完成T檢驗(yàn) 469
MapReduce問題描述 472
輸入 472
期望輸出 473
MapReduce解決方案 473
Spark實(shí)現(xiàn) 476
第23章皮爾遜相關(guān)系數(shù) 488
皮爾遜相關(guān)系數(shù)公式 489
皮爾遜相關(guān)系數(shù)示例 491
皮爾遜相關(guān)系數(shù)數(shù)據(jù)集 492
皮爾遜相關(guān)系數(shù)POJO 解決方案 492
皮爾遜相關(guān)系數(shù)MapReduce解決方案 493
皮爾遜相關(guān)系數(shù)的Spark 解決方案 496
運(yùn)行Spark程序的YARN 腳本 516
使用Spark計(jì)算斯皮爾曼相關(guān)系數(shù) 517
第24章 DNA堿基計(jì)數(shù) 520
FASTA 格式 521
FASTQ 格式 522
MapReduce解決方案:FASTA 格式 522
運(yùn)行示例 524
MapReduce解決方案: FASTQ 格式 528
Spark 解決方案: FASTA 格式 533
Spark解決方案: FASTQ 格式 537
第25章 RNA測序 543
數(shù)據(jù)大小和格式 543
MapReduce工作流 544
RNA測序分析概述 544
RNA測序MapReduce算法 548
第26章基因聚合 553
輸入 554
輸出 554
MapReduce解決方案(按單個值過濾和按平均值過濾) 555
基因聚合的Spark解決方案 567
Spark解決方案:按單個值過濾 567
Spark解決方案:按平均值過濾 576
第27章線性回歸 586
基本定義 587
簡單示例 587
問題描述 588
輸入數(shù)據(jù) 589
期望輸出 590
使用SimpleRegression的MapReduce解決方案 590
Hadoop實(shí)現(xiàn)類 593
使用R線性模型的MapReduce解決方案 593
第28章 MapReduce和幺半群 600
概述 600
幺半群的定義 602
幺半群和非幺半群示例 603
MapReduce示例:非幺半群 606
MapReduce示例:幺半群 608
使用幺半群的Spark示例 612
使用幺半群的結(jié)論 618
函子和幺半群 619
第29章小文件問題 622
解決方案1:在客戶端合并小文件 623
解決方案2:用CombineFileInputFormat解決小文件問題 629
其他解決方案 634
第30章 MapReduce的大容量緩存 635
實(shí)現(xiàn)方案 636
緩存問題形式化描述 637
一個精巧、可伸縮的解決方案 637
實(shí)現(xiàn)LRUMap緩存 640
使用LRUMap的MapReduce解決方案 646
第31章 Bloom過濾器 651Bloom
過濾器性質(zhì) 651
一個簡單的Bloom過濾器示例 653信息
展開全部

數(shù)據(jù)算法-Hadoop/Spark大數(shù)據(jù)處理技術(shù) 作者簡介

Mahmoud Parsian,計(jì)算機(jī)科學(xué)博士,是一位熱衷于實(shí)踐的軟件專家,作為開發(fā)人員、設(shè)計(jì)人員、架構(gòu)師和作者,他有30多年的軟件開發(fā)經(jīng)驗(yàn)。目前領(lǐng)導(dǎo)著Illumina的大數(shù)據(jù)團(tuán)隊(duì),在過去15年間,他主要從事Java (服務(wù)器端)、數(shù)據(jù)庫、MapReduce和分布式計(jì)算的有關(guān)工作。Mahmoud還著有《JDBC Recipes》和《JDBC Metadata, MySQL,and Oracle Recipes》等書(均由Apress出版)。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 周口风机|周风风机|河南省周口通用风机厂 | 诺冠气动元件,诺冠电磁阀,海隆防爆阀,norgren气缸-山东锦隆自动化科技有限公司 | 氧化锆陶瓷_氧化锆陶瓷加工_氧化锆陶瓷生产厂家-康柏工业陶瓷有限公司 | 井式炉-台车式回火炉-丹阳市电炉厂有限公司 | 网带通过式抛丸机,,网带式打砂机,吊钩式,抛丸机,中山抛丸机生产厂家,江门抛丸机,佛山吊钩式,东莞抛丸机,中山市泰达自动化设备有限公司 | 冻干机(冷冻干燥机)_小型|实验型|食品真空冷冻干燥机-松源 | 金属波纹补偿器厂家_不锈钢膨胀节价格_非金属伸缩节定制-庆达补偿器 | 预制舱-电力集装箱预制舱-模块化预制舱生产厂家-腾达电器设备 | 河北码上网络科技|邯郸小程序开发|邯郸微信开发|邯郸网站建设 | 空气能采暖,热泵烘干机,空气源热水机组|设备|厂家,东莞高温热泵_正旭新能源 | 广州番禺搬家公司_天河黄埔搬家公司_企业工厂搬迁_日式搬家_广州搬家公司_厚道搬迁搬家公司 | 低气压试验箱_高低温低气压试验箱_低气压实验箱 |林频试验设备品牌 | 艺术涂料_进口艺术涂料_艺术涂料加盟_艺术涂料十大品牌 -英国蒙太奇艺术涂料 | 袋式过滤器,自清洗过滤器,保安过滤器,篮式过滤器,气体过滤器,全自动过滤器,反冲洗过滤器,管道过滤器,无锡驰业环保科技有限公司 | 杭州代理记账多少钱-注册公司代办-公司注销流程及费用-杭州福道财务管理咨询有限公司 | 啤酒设备-小型啤酒设备-啤酒厂设备-济南中酿机械设备有限公司 | 高铝轻质保温砖_刚玉莫来石砖厂家_轻质耐火砖价格 | 天津次氯酸钠酸钙溶液-天津氢氧化钠厂家-天津市辅仁化工有限公司 | [品牌官网]贵州遵义双宁口腔连锁_贵州遵义牙科医院哪家好_种植牙_牙齿矫正_原华美口腔 | 哈尔滨京科脑康神经内科医院-哈尔滨治疗头痛医院-哈尔滨治疗癫痫康复医院 | 水热合成反应釜-防爆高压消解罐-西安常仪仪器设备有限公司 | 电伴热系统施工_仪表电伴热保温箱厂家_沃安电伴热管缆工业技术(济南)有限公司 | 破碎机_上海破碎机_破碎机设备_破碎机厂家-上海山卓重工机械有限公司 | 布袋除尘器|除尘器设备|除尘布袋|除尘设备_诺和环保设备 | MES系统-WMS系统-MES定制开发-制造执行MES解决方案-罗浮云计算 | 重庆网站建设,重庆网站设计,重庆网站制作,重庆seo,重庆做网站,重庆seo,重庆公众号运营,重庆小程序开发 | 全自动在线分板机_铣刀式在线分板机_曲线分板机_PCB分板机-东莞市亿协自动化设备有限公司 | 德国进口电锅炉_商用电热水器_壁挂炉_电采暖器_电热锅炉[德国宝] | YAGEO国巨电容|贴片电阻|电容价格|三星代理商-深圳市巨优电子有限公司 | 磁力加热搅拌器-多工位|大功率|数显恒温磁力搅拌器-司乐仪器官网 | 泰安办公家具-泰安派格办公用品有限公司| 上海律师咨询_上海法律在线咨询免费_找对口律师上策法网-策法网 广东高华家具-公寓床|学生宿舍双层铁床厂家【质保十年】 | 翰香原枣子坊加盟费多少钱-正宗枣核糕配方培训利润高飘香 | 上海三信|ph计|酸度计|电导率仪-艾科仪器 | 液压中心架,数控中心架,自定心中心架-烟台恒阳机电设计有限公司 行星搅拌机,双行星搅拌机,动力混合机,无锡米克斯行星搅拌机生产厂家 | 泥沙分离_泥沙分离设备_泥砂分离机_洛阳隆中重工机械有限公司 | 小小作文网_中小学优秀作文范文大全 | PCB接线端子_栅板式端子_线路板连接器_端子排生产厂家-置恒电气 喷码机,激光喷码打码机,鸡蛋打码机,手持打码机,自动喷码机,一物一码防伪溯源-恒欣瑞达有限公司 假肢-假肢价格-假肢厂家-河南假肢-郑州市力康假肢矫形器有限公司 | 线粒体膜电位荧光探针-细胞膜-标记二抗-上海复申生物科技有限公司 | 杭州营业执照代办-公司变更价格-许可证办理流程_杭州福道财务管理咨询有限公司 |