中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
大數據技術基礎與實戰

包郵 大數據技術基礎與實戰

出版社:人民郵電出版社出版時間:2021-09-01
開本: 16開 頁數: 236
中 圖 價:¥36.9(6.2折) 定價  ¥59.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據技術基礎與實戰 版權信息

  • ISBN:9787115567192
  • 條形碼:9787115567192 ; 978-7-115-56719-2
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

大數據技術基礎與實戰 本書特色

1.全書通過實踐操作講解大數據開發的基礎知識,不僅提供相應命令、配置文件,還提供模擬環境演示等,盡可能通過案例和實操,降低大數據學習的門檻,力求讓讀者學以致用。 2.內容全:大數據技術概述、Linux基礎與集群搭建、Hadoop集群配置、Hadoop分布式文件系統、MapReduce分布式編程、Hive大數據倉庫、HBase數據庫部署與操作、數據獲取與采集、基于Spark的內存計算以及利用大數據平臺處理圖像及視頻

大數據技術基礎與實戰 內容簡介

本書從技術實戰的角度,帶領讀者一步一步掌握大數據的相關技能。本書不僅提供相應命令、配置文件,還提供模擬環境演示等,并盡可能通過案例和實操降低大數據學習的門檻,力求讓讀者學以致用。 本書主要內容包括大數據技術概述、Linux基礎與集群搭建、Hadoop集群配置、HDFS、MapReduce分布式編程、Hive大數據倉庫、HBase數據庫部署與操作、數據獲取與Flume應用、基于Spark的內存計算,以及利用大數據平臺處理圖像及視頻。

大數據技術基礎與實戰 目錄

第1章 大數據技術概述 1
1.1 大數據的概念與基本特性 1
1.2 大數據處理流程 2
1.3 Hadoop大數據技術 3
1.3.1 Hadoop簡介 3
1.3.2 Hadoop的發行版本 5
1.4 實踐環境準備 7
習題 15
第2章 Linux基礎與集群搭建 16
2.1 Linux常用命令 16
2.1.1 用戶和用戶組 16
2.1.2 文件與目錄 18
2.1.3 主機名 24
2.1.4 分區管理 25
2.2 網絡配置 27
2.2.1 基本網絡配置 27
2.2.2 集群網絡配置 28
2.3 Linux集群配置 31
2.3.1 SSH免密碼登錄 31
2.3.2 Java環境安裝 33
2.3.3 MySQL服務 34
2.3.4 配置時鐘同步 35
2.4 快速配置Linux集群 37
2.4.1 導入虛擬機 37
2.4.2 快速配置 39
習題 42
第3章 Hadoop集群配置 43
3.1 Hadoop集群安裝 43
3.1.1 基礎環境準備 43
3.1.2 配置Java環境 49
3.1.3 安裝Hadoop 51
3.1.4 啟動Hadoop 58
3.2 Hadoop集群初始化和日志查看 62
3.2.1 初始化文件系統 62
3.2.2 集群的啟動與停止 62
3.2.3 查看日志 63
習題 64
第4章 HDFS 65
4.1 HDFS簡介 65
4.1.1 HDFS的基本概念 65
4.1.2 HDFS文件的讀取 66
4.1.3 HDFS文件的寫入 67
4.1.4 HDFS 數據備份 68
4.2 HDFS基本命令 69
4.3 HDFS數據平衡優化 72
4.3.1 編程原則 73
4.3.2 平衡邏輯 73
4.3.3 數據平衡案例 74
4.4 HDFS API的使用方法 75
習題 81
第5章 MapReduce分布式編程
82
5.1 MapReduce簡介 82
5.2 詞頻統計編程實例 83
5.3 MapReduce Shuffle過程開發 89
5.3.1 MapReduce數據類型 90
5.3.2 Partitioner負載平衡編程 90
5.3.3 Sort排序編程 92
5.3.4 Combiner減少中間數據編程 93
5.4 MapReduce的性能優化 94
5.4.1 Hadoop配置參數調優 94
5.4.2 使用合適的數據類型 95
5.4.3 基準性能測試工具 96
5.5 YARN數據處理框架 99
5.5.1 YARN常用命令 100
5.5.2 使用Web GUI監控實例 102
5.6 MapReduce實戰:繪制頻度分布 104
5.6.1 實戰概述 104
5.6.2 實戰步驟 104
5.6.3 源碼分析 109
習題 114
第6章 Hive大數據倉庫 115
6.1 Hive簡介 115
6.2 Hive安裝及配置 116
6.3 從創建數據庫到創建表 118
6.3.1 數據類型 118
6.3.2 創建數據庫 119
6.3.3 創建表 119
6.3.4 刪除表 121
6.3.5 修改表 121
6.4 數據查詢及自定義函數運算 123
6.4.1 HiveQL操作 123
6.4.2 JOIN語句 124
6.4.3 內置操作符和函數 125
6.5 Hive自定義函數編程 128
6.5.1 數據準備 128
6.5.2 編程實現 129
6.5.3 使用自定義函數 130
6.6 Hive實戰 132
6.6.1 數據準備 133
6.6.2 實戰步驟 133
習題 136
第7章 HBase數據庫部署與操作
138
7.1 HBase簡介 138
7.1.1 HBase表 138
7.1.2 HBase基本知識 138
7.2 HBase的安裝 139
7.2.1 必要條件 139
7.2.2 安裝配置HBase 140
7.2.3 啟動HBase 142
7.3 HBase Shell操作 143
7.3.1 普通命令 145
7.3.2 DDL操作 146
7.3.3 DML操作 148
7.3.4 工具命令 150
7.3.5 復制命令 151
7.4 HBase客戶端API 151
7.4.1 CRUD操作 151
7.4.2 批量處理 155
7.4.3 行鎖 156
7.4.4 掃描 157
7.4.5 數據過濾 158
7.5 HBase客戶端選擇及配置優化 159
7.6 HBase與MapReduce集成 159
7.7 HBase集群監控 160
7.8 HBase實戰:公有云網盤系統管理 164
7.8.1 部署公有云網盤 165
7.8.2 網盤核心代碼分析 168
習題 171
第8章 數據獲取與Flume應用 172
8.1 公開數據資源獲取 172
8.2 使用網絡爬蟲獲取數據 173
8.2.1 爬蟲的工作原理 173
8.2.2 爬蟲的搜索策略 174
8.2.3 爬蟲的簡單應用 175
8.3 使用Flume獲取數據 177
8.3.1 Flume簡介 177
8.3.2 Flume運行機制 177
8.3.3 Flume安裝部署 179
8.3.4 Flume簡單應用 180
8.4 綜合案例 182
習題 186
第9章 基于Spark的內存計算 187
9.1 Spark簡介 187
9.2 Spark快速部署 188
9.2.1 Spark單機模式部署 188
9.2.2 Spark分布式集群部署 189
9.3 Spark程序 192
9.3.1 Spark Shell 192
9.3.2 在IDEA中編寫詞頻統計 193
9.4 Spark RDD編程 197
9.4.1 RDD簡介 197
9.4.2 RDD的操作算子 198
9.4.3 RDD的持久化 204
9.5 Spark生態系統 205
9.5.1 Spark Core 206
9.5.2 Spark SQL 206
9.5.3 Spark Streaming 206
9.5.4 MLlib 206
9.5.5 GraphX 207
9.6 Spark應用案例 207
9.6.1 案例概述 207
9.6.2 代碼實現 208
9.6.3 運行結果 208
習題 209



第10章 利用大數據平臺處理圖像
210
10.1 圖像的基本概念 210
10.2 Hadoop處理圖像的問題與對策 211
10.2.1 Hadoop直接處理圖像存在
的問題 211
10.2.2 解決途徑 212
10.3 HIPI安裝與部署 212
10.4 使用HIPI進行圖像處理 214
10.5 HIPI工具hibDownload 222
10.5.1 編譯hibDownload 222
10.5.2 hibDownload的使用方法 222
10.5.3 hibDownload的工作原理 222
10.5.4 hibDownload的使用示例 230
習題 235
參考文獻 236
展開全部

大數據技術基礎與實戰 作者簡介

薛志東,博士,研究員,現在華中科技大學軟件學院工作,長期從事大數據相關教學與科研工作。先后講授多門本科生、研究生課程,承擔多項國家自然科學基金、湖北省自然科學基金、華為技術公司委托等重要項目。目前的研究主要涉及大數據處理相關領域等,如基于云計算的圖像與視頻等信息處理技術、醫學與生物信息處理與分析、文本挖掘、深度學習、GPU開發等;同時對移動應用、康復游戲、無人機、機器人應用軟件開發等有濃厚的興趣。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 铸铝门厂家,别墅大门庭院大门,别墅铸铝门铜门[十大品牌厂家]军强门业 | 圣才学习网-考研考证学习平台,提供万种考研考证电子书、题库、视频课程等考试资料 | 安德建奇火花机-阿奇夏米尔慢走丝|高维|发那科-北京杰森柏汇 | 胜为光纤光缆_光纤跳线_单模尾纤_光纤收发器_ODF光纤配线架厂家直销_北京睿创胜为科技有限公司 - 北京睿创胜为科技有限公司 | 工业制氮机_psa制氮机厂家-宏骁智能装备科技江苏有限公司 | 异噻唑啉酮-均三嗪-三丹油-1227-中北杀菌剂厂家 | 起好名字_取个好名字_好名网免费取好名在线打分 | 行星搅拌机,双行星搅拌机,动力混合机,无锡米克斯行星搅拌机生产厂家 | 医学动画公司-制作3d医学动画视频-医疗医学演示动画制作-医学三维动画制作公司 | 空冷器|空气冷却器|空水冷却器-无锡赛迪森机械有限公司[官网] | 南溪在线-南溪招聘找工作、找房子、找对象,南溪综合生活信息门户! | 无负压供水设备,消防稳压供水设备-淄博创辉供水设备有限公司 | 河南空气能热水器-洛阳空气能采暖-洛阳太阳能热水工程-洛阳润达高科空气能商行 | 扬尘在线监测系统_工地噪声扬尘检测仪_扬尘监测系统_贝塔射线扬尘监测设备「风途物联网科技」 | EDLC超级法拉电容器_LIC锂离子超级电容_超级电容模组_软包单体电容电池_轴向薄膜电力电容器_深圳佳名兴电容有限公司_JMX专注中高端品牌电容生产厂家 | 欧必特空气能-商用空气能热水工程,空气能热水器,超低温空气源热泵生产厂家-湖南欧必特空气能公司 | 南京展台搭建-南京展会设计-南京展览设计公司-南京展厅展示设计-南京汇雅展览工程有限公司 | 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 | 私人别墅家庭影院系统_家庭影院音响_家庭影院装修设计公司-邦牛影音 | 安徽集装箱厂-合肥国彩钢结构板房工程有限公司 | 耐压仪-高压耐压仪|徐吉电气 | 3d打印服务,3d打印汽车,三维扫描,硅胶复模,手板,快速模具,深圳市精速三维打印科技有限公司 | 婚博会2024时间表_婚博会门票领取_婚博会地址-婚博会官网 | 厂房出租_厂房出售_产业园区招商_工业地产 - 中工招商网 | 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | LNG鹤管_内浮盘价格,上装鹤管,装车撬厂家-连云港赛威特机械 | [品牌官网]贵州遵义双宁口腔连锁_贵州遵义牙科医院哪家好_种植牙_牙齿矫正_原华美口腔 | 集菌仪_智能集菌仪_全封闭集菌仪_无菌检查集菌仪厂家-那艾 | TMT观察网_独特视角观察TMT行业 派财经_聚焦数字经济内容服务平台 | 北京翻译公司_同传翻译_字幕翻译_合同翻译_英语陪同翻译_影视翻译_翻译盖章-译铭信息 | 运动木地板厂家,篮球场木地板品牌,体育场馆木地板安装 - 欧氏运动地板 | 橡胶接头_橡胶软接头_可曲挠橡胶接头-巩义市创伟机械制造有限公司 | 升降机-高空作业车租赁-蜘蛛车-曲臂式伸缩臂剪叉式液压升降平台-脚手架-【普雷斯特公司厂家】 | 工控机-工业平板电脑-研华工控机-研越无风扇嵌入式box工控机 | 缠膜机|缠绕包装机|无纺布包装机-济南达伦特机械设备有限公司 | 12cr1mov无缝钢管切割-15crmog无缝钢管切割-40cr无缝钢管切割-42crmo无缝钢管切割-Q345B无缝钢管切割-45#无缝钢管切割 - 聊城宽达钢管有限公司 | 雨水收集系统厂家-雨水收集利用-模块雨水收集池-徐州博智环保科技有限公司 | 热闷罐-高温罐-钢渣热闷罐-山东鑫泰鑫智能热闷罐厂家 | 盘式曝气器-微孔曝气器-管式曝气器-曝气盘-斜管填料 | 郑州市前程水处理有限公司 | 碳刷_刷握_集电环_恒压簧_电刷厂家-上海丹臻机电科技有限公司 | 蓝米云-专注于高性价比香港/美国VPS云服务器及海外公益型免费虚拟主机 |