Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn) 版權(quán)信息
- ISBN:9787111522652
- 條形碼:9787111522652 ; 978-7-111-52265-2
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類(lèi):>>
Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn) 本書(shū)特色
本書(shū)共14章,分三個(gè)部分:基礎(chǔ)篇、實(shí)戰(zhàn)篇、高級(jí)篇。基礎(chǔ)篇介紹了數(shù)據(jù)挖掘、hadoop大數(shù)據(jù)的基本原理,實(shí)戰(zhàn)篇介紹了一個(gè)個(gè)真實(shí)案例,通過(guò)對(duì)案例深入淺出的剖析,使讀者在不知不覺(jué)中通過(guò)案例實(shí)踐獲得大數(shù)據(jù)項(xiàng)目挖掘分析經(jīng)驗(yàn),同時(shí)快速領(lǐng)悟看似難懂的大數(shù)據(jù)分析與挖掘理論知識(shí)。讀者在閱讀過(guò)程中,應(yīng)充分利用隨書(shū)配套的案例建模數(shù)據(jù),借助tipdm-hb大數(shù)據(jù)挖掘建模平臺(tái),通過(guò)上機(jī)實(shí)驗(yàn),以快速理解相關(guān)知識(shí)與理論。
Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn) 內(nèi)容簡(jiǎn)介
本書(shū)共14章,分三個(gè)部分:基礎(chǔ)篇、實(shí)戰(zhàn)篇、高級(jí)篇。基礎(chǔ)篇介紹了數(shù)據(jù)挖掘、Hadoop大數(shù)據(jù)的基本原理,實(shí)戰(zhàn)篇介紹了一個(gè)個(gè)真實(shí)案例,通過(guò)對(duì)案例深入淺出的剖析,使讀者在不知不覺(jué)中通過(guò)案例實(shí)踐獲得大數(shù)據(jù)項(xiàng)目挖掘分析經(jīng)驗(yàn),同時(shí)快速領(lǐng)悟看似難懂的大數(shù)據(jù)分析與挖掘理論知識(shí)。讀者在閱讀過(guò)程中,應(yīng)充分利用隨書(shū)配套的案例建模數(shù)據(jù),借助TipDM-HB大數(shù)據(jù)挖掘建模平臺(tái),通過(guò)上機(jī)實(shí)驗(yàn),以快速理解相關(guān)知識(shí)與理論。
Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn) 目錄
目錄前 言基 礎(chǔ) 篇第1章 數(shù)據(jù)挖掘基礎(chǔ)2 1.1 某知名連鎖餐飲企業(yè)的困惑2 1.2 從餐飲服務(wù)到數(shù)據(jù)挖掘3 1.3 數(shù)據(jù)挖掘的基本任務(wù)4 1.4 數(shù)據(jù)挖掘建模過(guò)程41.4.1 定義挖掘目標(biāo)41.4.2 數(shù)據(jù)取樣51.4.3 數(shù)據(jù)探索61.4.4 數(shù)據(jù)預(yù)處理121.4.5 挖掘建模141.4.6 模型評(píng)價(jià)14 1.5 餐飲服務(wù)中的大數(shù)據(jù)應(yīng)用15 1.6 小結(jié)15第2章 hadoop基礎(chǔ)16 2.1 概述162.1.1 hadoop簡(jiǎn)介162.1.2 hadoop生態(tài)系統(tǒng)17 2.2 安裝與配置19 2.3 hadoop原理262.3.1 hadoop hdfs原理262.3.2 hadoop mapreduce原理272.3.3 hadoop yarn原理28 2.4 動(dòng)手實(shí)踐30 2.5 小結(jié)33第3章 hadoop生態(tài)系統(tǒng):hive34 3.1 概述343.1.1 hive簡(jiǎn)介343.1.2 hive安裝與配置35 3.2 hive原理383.2.1 hive架構(gòu)383.2.2 hive的數(shù)據(jù)模型40 3.3 動(dòng)手實(shí)踐41 3.4 小結(jié)45第4章 hadoop生態(tài)系統(tǒng):hbase46 4.1 概述464.1.1 hbase簡(jiǎn)介464.1.2 hbase安裝與配置47 4.2 hbase原理504.2.1 hbase架構(gòu)504.2.2 hbase與rdbms514.2.3 hbase訪問(wèn)接口524.2.4 hbase數(shù)據(jù)模型53 4.3 動(dòng)手實(shí)踐54 4.4 小結(jié)61第5章 大數(shù)據(jù)挖掘建模平臺(tái)62 5.1 常用的大數(shù)據(jù)平臺(tái)62 5.2 tipdm-hb大數(shù)據(jù)挖掘建模平臺(tái)635.2.1 tipdm-hb大數(shù)據(jù)挖掘建模平臺(tái)的功能635.2.2 tipdm-hb大數(shù)據(jù)挖掘建模平臺(tái)操作流程及實(shí)例655.2.3 tipdm-hb大數(shù)據(jù)挖掘建模平臺(tái)的特點(diǎn)67 5.3 小結(jié)68第6章 挖掘建模69 6.1 分類(lèi)與預(yù)測(cè)696.1.1 實(shí)現(xiàn)過(guò)程696.1.2 常用的分類(lèi)與預(yù)測(cè)算法706.1.3 決策樹(shù)716.1.4 mahout中random forests算法的實(shí)現(xiàn)原理756.1.5 動(dòng)手實(shí)踐79 6.2 聚類(lèi)分析836.2.1 常用聚類(lèi)分析算法836.2.2 k-means聚類(lèi)算法846.2.3 mahout中k-means算法的實(shí)現(xiàn)原理886.2.4 動(dòng)手實(shí)踐90 6.3 關(guān)聯(lián)規(guī)則936.3.1 常用的關(guān)聯(lián)規(guī)則算法936.3.2 fp-growth關(guān)聯(lián)規(guī)則算法946.3.3 mahout中parallel frequentpattern mining算法的實(shí)現(xiàn)原理986.3.4 動(dòng)手實(shí)踐100 6.4 協(xié)同過(guò)濾1026.4.1 常用的協(xié)同過(guò)濾算法1026.4.2 基于項(xiàng)目的協(xié)同過(guò)濾算法簡(jiǎn)介1026.4.3 mahout中itembasedcollaborative filtering算法的實(shí)現(xiàn)原理1036.4.4 動(dòng)手實(shí)踐106 6.5 小結(jié)109實(shí) 戰(zhàn) 篇第7章 法律咨詢(xún)數(shù)據(jù)分析與服務(wù)推薦112 7.1 背景與挖掘目標(biāo)112 7.2 分析方法與過(guò)程1147.2.1 數(shù)據(jù)抽取1207.2.2 數(shù)據(jù)探索分析1207.2.3 數(shù)據(jù)預(yù)處理1257.2.4 模型構(gòu)建130 7.3 上機(jī)實(shí)驗(yàn)139 7.4 拓展思考140 7.5 小結(jié)145第8章 電商產(chǎn)品評(píng)論數(shù)據(jù)情感分析146 8.1 背景與挖掘目標(biāo)146 8.2 分析方法與過(guò)程1468.2.1 評(píng)論數(shù)據(jù)采集1478.2.2 評(píng)論預(yù)處理1508.2.3 文本評(píng)論分詞1558.2.4 構(gòu)建模型155 8.3 上機(jī)實(shí)驗(yàn)167 8.4 拓展思考168 8.5 小結(jié)169第9章 航空公司客戶(hù)價(jià)值分析170 9.1 背景與挖掘目標(biāo)170 9.2 分析方法與過(guò)程1719.2.1 數(shù)據(jù)抽取1749.2.2 數(shù)據(jù)探索分析1749.2.3 數(shù)據(jù)預(yù)處理1759.2.4 模型構(gòu)建177 9.3 上機(jī)實(shí)驗(yàn)182 9.4 拓展思考183 9.5 小結(jié)183第10章 基站定位數(shù)據(jù)商圈分析184 10.1 背景與挖掘目標(biāo)184 10.2 分析方法與過(guò)程18610.2.1 數(shù)據(jù)抽取18610.2.2 數(shù)據(jù)探索分析18710.2.3 數(shù)據(jù)預(yù)處理18810.2.4 構(gòu)建模型191 10.3 上機(jī)實(shí)驗(yàn)194 10.4 拓展思考195 10.5 小結(jié)195第11章 互聯(lián)網(wǎng)電影智能推薦196 11.1 背景與挖掘目標(biāo)196 11.2 分析方法與過(guò)程19711.2.1 數(shù)據(jù)抽取19911.2.2 構(gòu)建模型199 11.3 上機(jī)實(shí)驗(yàn)201 11.4 拓展思考202 11.5 小結(jié)203第12章 家電故障備件儲(chǔ)備預(yù)測(cè)分析204 12.1 背景與挖掘目標(biāo)204 12.2 分析方法與過(guò)程20612.2.1 數(shù)據(jù)探索分析20712.2.2 數(shù)據(jù)預(yù)處理20912.2.3 構(gòu)建模型212 12.3 上機(jī)實(shí)驗(yàn)216 12.4 拓展思考217 12.5 小結(jié)217第13章 市供水混凝投藥量控制分析218 13.1 背景與挖掘目標(biāo)218 13.2 分析方法與過(guò)程22013.2.1 數(shù)據(jù)抽取22113.2.2 數(shù)據(jù)探索分析22113.2.3 數(shù)據(jù)預(yù)處理22313.2.4 構(gòu)建模型227 13.3 上機(jī)實(shí)驗(yàn)237 13.4 拓展思考238 13.5 小結(jié)239第14章 基于圖像處理的車(chē)輛壓雙黃線(xiàn)檢測(cè)240 14.1 背景與挖掘目標(biāo)240 14.2 分析方法與過(guò)程24114.2.1 數(shù)據(jù)抽取24214.2.2 數(shù)據(jù)探索分析24214.2.3 數(shù)據(jù)預(yù)處理24214.2.4 構(gòu)建模型249 14.3 上機(jī)實(shí)驗(yàn)250 14.4 拓展思考250 14.5 小結(jié)251高 級(jí) 篇第15章 基于mahout的大數(shù)據(jù)挖掘開(kāi)發(fā)254 15.1 概述254 15.2 環(huán)境配置255 15.3 基于mahout算法接口的二次開(kāi)發(fā)25815.3.1 mahout算法實(shí)例25815.3.2 mahout算法接口的二次開(kāi)發(fā)示例259 15.4 小結(jié)271第16章 基于tipdm-hb的數(shù)據(jù)挖掘二次開(kāi)發(fā)272 16.1 概述27216.1.1 tipdm-hb大數(shù)據(jù)挖掘建模平臺(tái)服務(wù)接口27216.1.2 apache cxf簡(jiǎn)介276 16.2 tipdm-hb大數(shù)據(jù)挖掘建模平臺(tái)服務(wù)開(kāi)發(fā)實(shí)例27716.2.1 環(huán)境配置27716.2.2 開(kāi)發(fā)實(shí)例280 16.3 小結(jié)288參考資料289
展開(kāi)全部
Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn) 作者簡(jiǎn)介
張良均,資深大數(shù)據(jù)挖掘?qū)<液湍J阶R(shí)別專(zhuān)家,高級(jí)信息項(xiàng)目管理師,有10多年的大數(shù)據(jù)挖掘應(yīng)用、咨詢(xún)和培訓(xùn)經(jīng)驗(yàn)。為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等多個(gè)行業(yè)上百家大型企業(yè)提供過(guò)數(shù)據(jù)挖掘應(yīng)用與咨詢(xún)服務(wù),實(shí)踐經(jīng)驗(yàn)非常豐富。此外,他精通Java EE企業(yè)級(jí)應(yīng)用開(kāi)發(fā),是廣東工業(yè)大學(xué)、華南師范大學(xué)、華南農(nóng)業(yè)大學(xué)、貴州師范學(xué)院、韓山師范學(xué)院、廣東技術(shù)師范學(xué)院兼職教授,著有《神經(jīng)網(wǎng)絡(luò)實(shí)用教程》、《數(shù)據(jù)挖掘:實(shí)用案例分析》、《MATLAB數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》《R語(yǔ)言數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》等暢銷(xiāo)書(shū)