中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
Hadoop 大數據開發基礎

包郵 Hadoop 大數據開發基礎

出版社:人民郵電出版社出版時間:2018-02-01
開本: 32開 頁數: 188
本類榜單:教材銷量榜
中 圖 價:¥16.9(4.2折) 定價  ¥39.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>

Hadoop 大數據開發基礎 版權信息

Hadoop 大數據開發基礎 本書特色

本書以任務為導向,較為全面地介紹了Hadoop大數據技術的相關知識。全書共6章,具體內容包括Hadoop介紹、Hadoop集群的搭建及配置、Hadoop基礎操作、MapReduce編程入門、MapReduce進階編程、項目案例:電影網站用戶性別預測。本書的2~5章包含了實訓與課后練習,通過練習和操作實踐,幫助讀者鞏固所學的內容。 本書可以作為高校大數據技術類專業的教材,也可作為大數據技術愛好者的自學用書。

Hadoop 大數據開發基礎 內容簡介

大數據專家張良均領銜暢銷書作者團隊,教育部長江學者特聘教授、國家杰出青年基金獲得者、IEEE Fellow、華南理工大學計算機與工程學院院長張軍傾力推薦。 本書采用了以任務為導向的教學模式,按照解決實際任務的工作流程路線,逐步展開介紹相關的理論知識點,推導生成可行的解決方案,落實在任務實現環節。 全書大部分章節緊扣任務需求展開,不堆積知識點,著重于解決問題時思路的啟發與方案的實施。通過從任務需求到實現這一完整工作流程的體驗,幫助讀者真正理解與消化Hadoop大數據技術。 書中案例全部源于企業真實項目,可操作性強,引導讀者融會貫通,并提供源代碼等相關學習資源,幫助讀者快速掌握大數據相關技能。

Hadoop 大數據開發基礎 目錄

一章 Hadoop介紹 1

1.1 Hadoop概述 1

1.1.1 Hadoop簡介 1

1.1.2 Hadoop的發展歷史 2

1.1.3 Hadoop的特點 3

1.2 Hadoop核心 4

1.2.1 分布式文件系統——HDFS 4

1.2.2 分布式計算框架——MapReduce 7

1.2.3 集群資源管理器——YARN 9

1.3 Hadoop生態系統 12

1.4 Hadoop應用場景 14

小結 15

二章 Hadoop集群的搭建及配置 16

任務2.1 安裝及配置虛擬機 17

2.1.1 創建Linux虛擬機 17

2.1.2 設置固定IP 25

2.1.3 遠程連接虛擬機 27

2.1.4 虛擬機在線安裝軟件 29

2.1.5 任務實現 32

任務2.2 安裝Java 32

2.2.1 在Windows下安裝Java 33

2.2.2 在Linux下安裝Java 35

2.2.3 任務實現 36

任務2.3 搭建Hadoop完全分布式集群 36

2.3.1 修改配置文件 36

2.3.2 克隆虛擬機 41

2.3.3 配置SSH免密碼登錄 43

2.3.4 配置時間同步服務 44

2.3.5 啟動關閉集群 46

2.3.6 監控集群 47

小結 50

實訓 50

實訓1 為Hadoop集群增加一個節點 50

實訓2 編寫Shell腳本同步集群時間 51

課后練習 51

第3章 Hadoop基礎操作 53

任務3.1 查看Hadoop集群的基本信息 54

3.1.1 查詢集群的存儲系統信息 55

3.1.2 查詢集群的計算資源信息 58

任務3.2 上傳文件到HDFS目錄 59

3.2.1 了解HDFS文件系統 59

3.2.2 掌握HDFS的基本操作 62

3.2.3 任務實現 65

任務3.3 運行MapReduce任務 67

3.3.1 了解Hadoop官方的示例程序包 67

3.3.2 提交MapReduce任務給集群運行 68

任務3.4 管理多個MapReduce任務 71

3.4.1 查詢MapReduce任務 72

3.4.2 中斷MapReduce任務 74

小結 76

實訓 77

實訓1 統計文件中所有單詞的平均長度 77

實訓2 查詢與中斷MapReduce任務 77

課后練習 78

第4章 MapReduce編程入門 80

任務4.1 使用Eclipse創建MapReduce工程 81

4.1.1 下載與安裝Eclipse 81

4.1.2 配置MapReduce環境 82

4.1.3 新建MapReduce工程 84

任務4.2 通過源碼初識MapReduce編程 86

4.2.1 通俗理解MapReduce原理 86

4.2.2 了解MR實現詞頻統計的執行流程 88

4.2.3 讀懂官方提供的WordCount源碼 89

任務4.3 編程實現按日期統計訪問次數 94

4.3.1 分析思路與處理邏輯 94

4.3.2 編寫核心模塊代碼 95

4.3.3 任務實現 97

任務4.4 編程實現按訪問次數排序 99

4.4.1 分析思路與處理邏輯 99

4.4.2 編寫核心模塊代碼 100

4.4.3 任務實現 102

小結 104

實訓 104

實訓1 獲取成績表的高分記錄 104

實訓2 對兩個文件中的數據進行合并與去重 105

課后練習 107

第5章 MapReduce進階編程 110

任務5.1 篩選日志文件并生成序列化文件 111

5.1.1 MapReduce輸入格式 111

5.1.2 MapReduce輸出格式 113

5.1.3 任務實現 113

任務5.2 Hadoop Java API讀取序列化日志文件 115

5.2.1 FileSystem API管理文件夾 115

5.2.2 FileSystem API操作文件 119

5.2.3 FileSystem API讀寫數據 121

5.2.4 任務實現 123

任務5.3 優化日志文件統計程序 124

5.3.1 自定義鍵值類型 124

5.3.2 初步探索Combiner 128

5.3.3 淺析Partitioner 130

5.3.4 自定義計數器 132

5.3.5 任務實現 134

任務5.4 Eclipse提交日志文件統計程序 137

5.4.1 傳遞參數 137

5.4.2 Hadoop輔助類ToolRunner 139

5.4.3 Eclipse自動打包并提交任務 140

小結 144

實訓 144

實訓1 統計全球每年的高氣溫和低氣溫 144

實訓2 篩選氣溫在15~25℃之間的數據 145

課后練習 146

第6章 項目案例:電影網站用戶性別預測 151

任務6.1 認識KNN算法 152

6.1.1 KNN算法簡介 152

6.1.2 KNN算法原理及流程 152

任務6.2 數據預處理 154

6.2.1 獲取數據 154

6.2.2 數據變換 155

6.2.3 數據清洗 160

6.2.4 劃分數據集 163

任務6.3 實現用戶性別分類 167

6.3.1 實現思路 167

6.3.2 代碼實現 169

任務6.4 評價分類結果的準確性 179

6.4.1 評價思路 179

6.4.2 實現分類評價 180

6.4.3 尋找優K值 184

小結 188

參考文獻 189
展開全部

Hadoop 大數據開發基礎 作者簡介

張良均,高級信息系統項目管理師,泰迪杯全國大學生數據挖掘競賽(www.tipdm.org)發起人。華南師范大學、廣東工業大學兼職教授,廣東省工業與應用數學學會理事。兼有大型高科技企業和高校的工作經歷,主要從事大數據挖掘及其應用的策劃、研發及咨詢培訓。全國計算機技術與軟件專業技術資格(水平)考試繼續教育和CDA數據分析師培訓講師。發表數據挖掘相關論文數二十余篇,已取得國家發明專利12項,主編《Hadoop大數據分析與挖掘實戰》《Python數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等多本暢銷圖書,主持并完成科技項目9項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有電力、電信、銀行、制造企業、電子商務和電子政務的項目經驗和行業背景。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 厌氧反应器,IC厌氧反应器,厌氧三相分离器-山东创博环保科技有限公司 | 【直乐】河北石家庄脊柱侧弯医院_治疗椎间盘突出哪家医院好_骨科脊柱外科专业医院_治疗抽动症/关节病骨伤权威医院|排行-直乐矫形中医医院 | 蒸压釜_蒸养釜_蒸压釜厂家-山东鑫泰鑫智能装备有限公司 | 聚氨酯催化剂K15,延迟催化剂SA-1,叔胺延迟催化剂,DBU,二甲基哌嗪,催化剂TMR-2,-聚氨酯催化剂生产厂家 | 超声波清洗机_大型超声波清洗机_工业超声波清洗设备-洁盟清洗设备 | 运动木地板厂家,篮球场木地板品牌,体育场馆木地板安装 - 欧氏运动地板 | 地图标注-手机导航电子地图如何标注-房地产商场地图标记【DiTuBiaoZhu.net】 | 中国在职研究生招生信息网| 定制液氮罐_小型气相液氮罐_自增压液氮罐_班德液氮罐厂家 | 生物除臭剂-除味剂-植物-污水除臭剂厂家-携葵环保有限公司 | 防爆电机_ybx3系列电机_河南省南洋防爆电机有限公司 | 免费网站网址收录网_海企优网站推荐平台 | DAIKIN电磁阀-意大利ATOS电磁阀-上海乾拓贸易有限公司 | 硬质合金模具_硬质合金非标定制_硬面加工「生产厂家」-西迪技术股份有限公司 | 河南橡胶接头厂家,河南波纹补偿器厂家,河南可曲挠橡胶软连接,河南套筒补偿器厂家-河南正大阀门 | 废气处理设备-工业除尘器-RTO-RCO-蓄热式焚烧炉厂家-江苏天达环保设备有限公司 | 餐饮小吃技术培训-火锅串串香培训「何小胖培训」_成都点石成金[官网] | 上海刑事律师|刑事辩护律师|专业刑事犯罪辩护律师免费咨询-[尤辰荣]金牌上海刑事律师团队 | 南京租车,南京汽车租赁,南京包车,南京会议租车-南京七熹租车 | 钢板仓,大型钢板仓,钢板库,大型钢板库,粉煤灰钢板仓,螺旋钢板仓,螺旋卷板仓,骨料钢板仓 | 新中天检测有限公司青岛分公司-山东|菏泽|济南|潍坊|泰安防雷检测验收 | 除尘器布袋骨架,除尘器滤袋,除尘器骨架,电磁脉冲阀膜片,卸灰阀,螺旋输送机-泊头市天润环保机械设备有限公司 | 砂石生产线_石料生产线设备_制砂生产线设备价格_生产厂家-河南中誉鼎力智能装备有限公司 | 网架支座@球铰支座@钢结构支座@成品支座厂家@万向滑动支座_桥兴工程橡胶有限公司 | 云阳人才网_云阳招聘网_云阳人才市场_云阳人事人才网_云阳人家招聘网_云阳最新招聘信息 | 济南拼接屏_山东液晶拼接屏_济南LED显示屏—维康国际官网 | 万烁建筑设计院-建筑设计公司加盟,设计院加盟分公司,市政设计加盟 | 液压油缸生产厂家-山东液压站-济南捷兴液压机电设备有限公司 | 石膏基自流平砂浆厂家-高强石膏基保温隔声自流平-轻质抹灰石膏粉砂浆批发-永康市汇利建设有限公司 | 锥形螺带干燥机(新型耙式干燥机)百科-常州丰能干燥工程 | 青岛美佳乐清洁工程有限公司|青岛油烟管道清洗|酒店|企事业单位|学校工厂厨房|青岛油烟管道清洗 插针变压器-家用电器变压器-工业空调变压器-CD型电抗器-余姚市中驰电器有限公司 | CCE素质教育博览会 | CCE素博会 | 教育展 | 美育展 | 科教展 | 素质教育展 | 隧道烘箱_隧道烘箱生产厂家-上海冠顶专业生产烘道设备 | 净化车间_洁净厂房_净化公司_净化厂房_无尘室工程_洁净工程装修|改造|施工-深圳净化公司 | 电磁铁_推拉电磁铁_机械手电磁吸盘电磁铁厂家-广州思德隆电子公司 | 壹作文_中小学生优秀满分作文大全 | 精密五金冲压件_深圳五金冲压厂_钣金加工厂_五金模具加工-诚瑞丰科技股份有限公司 | 胶水,胶粘剂,AB胶,环氧胶,UV胶水,高温胶,快干胶,密封胶,结构胶,电子胶,厌氧胶,高温胶水,电子胶水-东莞聚力-聚厉胶粘 | 恒温槽_恒温水槽_恒温水浴槽-上海方瑞仪器有限公司 | 深圳市八百通智能技术有限公司官方网站 | 自动检重秤-动态称重机-重量分选秤-苏州金钻称重设备系统开发有限公司 |