中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據技術與應用基礎

包郵 大數據技術與應用基礎

出版社:人民郵電出版社出版時間:2017-01-01
開本: 32開 頁數: 212
本類榜單:教材銷量榜
中 圖 價:¥19.7(4.9折) 定價  ¥39.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>

大數據技術與應用基礎 版權信息

大數據技術與應用基礎 本書特色

本書在介紹大數據發展背景、特點及主要技術層面的基礎上,對大數據的數據采集、數據存儲、常見計算模式和典型系統工具進行了分析介紹。本書同時對各種典型系統工具進行了講解,包括大數據查詢分析計算及典型工具(HBase、Hive)、批處理計算及典型工具(MapReduce、Spark)、流式計算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。 本書提供了大量的實例和源代碼供讀者參考,指導讀者快速、無障礙地了解和掌握常見大數據分析工具的使用。本書適合作為計算機及相關專業的教學用書,也可以作為大數據初學者的自學教材和參考手冊。

大數據技術與應用基礎 內容簡介

1.內容豐富多樣,對比學習 考慮當前大數據發展處于起步并逐步趕超先進,其應用領域豐富廣泛,本書除了介紹典型開源大數據處理框架Apache Hadoop框架之外,還介紹了批處理計算Spark、流式計算及典型工具(Storm、Apex、Flink)和事件流及典型工具(Druid)等,讓讀者了解不同類型工具系統的特點,并配以豐富簡單易上手的實例,讓讀者能夠切實體會和掌握各種類型工具的特點和應用。 2.輕量級理論,重在培養動手實踐能力 為了讓讀者能夠快速掌握技能并保證理論能夠適應實踐要求,本書本著輕量級理論原則,給出豐富的實例、詳實的實驗操作步驟和使用普通讀者也易于配置的實驗環境,讓讀者能夠快速上手,在做中學。 3.有效結合實際應用 除了各章節給出的配套實例外,本書在*后還給出電商領域的大數據分析綜合實例,以實際行業應用案例說明大數據處理和計算工具的使用以及進一步闡述大數據行業應用的重大意義。

大數據技術與應用基礎 目錄

第1章 大數據概述  1

1.1 大數據的發展 1

1.2 大數據的概念及特征 2

1.2.1 大數據的概念 2

1.2.2 大數據的特征 2

1.3 大數據的產生及數據類型 3

1.3.1 大數據的產生 3

1.3.2 數據類型 3

1.4 大數據計算模式和系統 4

1.5 大數據的主要技術層面和技術內容 4

1.6 大數據的典型應用 6

1.7 本章小結 7

第2章 數據獲取 8

2.1 Scrapy環境搭建 8

2.2 爬蟲項目創建 8

2.3 采集目標數據項定義 10

2.4 爬蟲核心實現 11

2.5 數據存儲 15

2.6 爬蟲運行 17

2.7 本章小結 18

第3章 Hadoop基礎 19

3.1 Hadoop概述 19

3.2 Hadoop原理 20

3.2.1 Hadoop HDFS原理 20

3.2.2 Hadoop MapReduce原理 21

3.2.3 Hadoop YARN原理 22

3.3 Hadoop的安裝與配置 24

3.4 Hadoop生態系統簡介 46

3.5 本章小結 47

第4章 HDFS基本應用 48

4.1 實戰命令行接口 48

4.2 實戰Java接口 52

4.3 數據流 60

4.3.1 數據流簡介 60

4.3.2 數據流讀取 61

4.3.3 數據流寫入 62

4.4 本章小結 64

第5章 MapReduce應用開發 65

5.1 配置Hadoop MapReduce開發環境 65

5.1.1 系統環境及所需文件 65

5.1.2 安裝Eclipse 65

5.1.3 向Eclipse中添加插件 66

5.2 編寫和運行**個MapReduce程序前的準備 69

5.2.1 系統環境及所需要的文件 69

5.2.2 建立運行MapReduce程序的依賴環境 69

5.2.3 建立編寫MapReduce程序的依賴包 70

5.3 MapReduce應用案例 78

5.3.1 單詞計數 78

5.3.2 數據去重 82

5.3.3 排序 85

5.3.4 單表關聯 89

5.3.5 多表關聯 95

5.4 本章小結 102

第6章 分布式數據庫HBase 103

6.1 HBase簡介 103

6.2 HBase接口 103

6.3 安裝HBase集群 104

6.3.1 系統環境 104

6.3.2 安裝ZooKeeper 104

6.3.3 安裝HBase 106

6.4 HBase Shell 108

6.5 HBase API 110

6.6 HBase綜合實例 113

6.7 本章小結 118

第7章 數據倉庫工具Hive 119

7.1 Hive簡介 119

7.2 Hive接口實戰 119

7.3 Hive復雜語句實戰 124

7.4 Hive綜合實例 127

7.4.1 準備數據 127

7.4.2 在Hive上創建數據庫和表 128

7.4.3 導入數據 129

7.4.4 算法分析與執行HQL語句 130

7.4.5 運行結果分析 131

7.5 本章小結 132

第8章 開源集群計算環境Spark 133

8.1 Spark簡介 133

8.2 Spark接口實戰 133

8.2.1 環境要求 133

8.2.2 IDEA使用和打包 134

8.3 Spark編程的RDD 137

8.3.1 RDD 137

8.3.2 創建RDD 138

8.3.3 RDD中與Map和Reduce相關的API 138

8.4 Spark實戰案例——統計1000萬人口的平均年齡 141

8.4.1 案例描述 141

8.4.2 案例分析 143

8.4.3 編程實現 143

8.4.4 提交到集群運行 144

8.4.5 監控執行狀態 144

8.5 Spark MLlib實戰——聚類實戰 145

8.5.1 算法說明 145

8.5.2 實例介紹 145

8.5.3 測試數據說明 146

8.5.4 程序源碼 146

8.5.5 運行腳本 148

8.6 本章小結 150

第9章 流實時處理系統Storm 152

9.1 Storm概述 152

9.1.1 Storm簡介 152

9.1.2 Storm主要特點 152

9.2 Storm安裝與配置 153

9.3 本章小結 160

第10章 企業級、大數據流處理 Apex 161

10.1 Apache Apex簡介 161

10.2 Apache Apex開發環境配置 161

10.2.1 部署開發工具 161

10.2.2 安裝Apex組件 162

10.2.3 創建Top N Words應用 164

10.3 運行TopN Words應用 166

10.3.1 開啟Apex客戶端 166

10.3.2 執行 166

10.4 本章小結 167

第11章 事件流OLAP之Druid 168

11.1 Druid簡介 168

11.2 Druid應用場所 168

11.3 Druid集群 169

11.4 Druid單機環境 170

11.4.1 安裝Druid 170

11.4.2 安裝ZooKeeper 170

11.4.3 啟動Druid服務 171

11.4.4 批量加載數據 172

11.4.5 加載流數據 175

11.4.6 數據查詢 177

11.5 本章小結 180

第12章 事件數據流引擎Flink 181

12.1 Flink概述 181

12.2 Flink基本架構 181

12.3 單機安裝Flink 182

12.4 Flink運行**個例子 184

12.5 Flink集群部署 187

12.5.1 環境準備 187

12.5.2 安裝和配置 187

12.5.3 啟動Flink集群 188

12.5.4 集群中添加JobManager/TaskManager 189

12.6 本章小結 189

第13章 分布式文件搜索 Elasticsearch 190

13.1 Elasticsearch簡介 190

13.2 Elasticsearch單節點安裝 192

13.3 插件Elasticsearch-head安裝 193

13.4 Elasticsearch的基本操作 195

13.5 綜合實戰 199

13.6 本章小結 202

第14章 實例電商數據分析 203

14.1 背景與挖掘目標 203

14.2 分析方法與過程 203

14.2.1 數據收集 203

14.2.2 數據預處理 206

14.2.3 導入數據到Hadoop 206

14.2.4 數據取樣分析 209

14.3 本章小結 211

參考文獻 212

展開全部

大數據技術與應用基礎 作者簡介

陳志德,2005年至今在福建師范大學數學與計算機科學學院工作,任計算機系副主任。主要研究方向包括網絡與信息安全、物聯網與移動計算等,指導碩士研究生20多人,指導研究生的學位論文曾獲校優秀碩士論文一等獎。近年來主持福建省自然科學基金、福建省科技廳K類基金等項目10項,參與國家自然科學基金和省科技廳高校產學合作科技重大項目課題各1項。出版學術專著2本,教材1本。在Journal of Computer and System Sciences、Concurrency and Computation: Practice and Experience等期刊發表學術論文40多篇,申請專利10多項,軟件著作權10多項。擔任CTCIS和NSS等國內和國際學術會議的程序委員會委員。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 重庆网站建设,重庆网站设计,重庆网站制作,重庆seo,重庆做网站,重庆seo,重庆公众号运营,重庆小程序开发 | 皮带机_移动皮带机_大倾角皮带机_皮带机厂家 - 新乡市国盛机械设备有限公司 | 长沙网站建设制作「网站优化推广」-网页设计公司-速马科技官网 | 小程序开发公司_APP开发多少钱_软件开发定制_微信小程序制作_客户销售管理软件-济南小溪畅流网络科技有限公司 | 银川美容培训-美睫美甲培训-彩妆纹绣培训-新娘化妆-学化妆-宁夏倍莱妮职业技能培训学校有限公司 临时厕所租赁_玻璃钢厕所租赁_蹲式|坐式厕所出租-北京慧海通 | 杭州网络公司_百度SEO优化-外贸网络推广_抖音小程序开发-杭州乐软科技有限公司 | 定制防伪标签_防伪标签印刷_防伪标签厂家-510品保防伪网 | 上海诺狮景观规划设计有限公司| 注浆压力变送器-高温熔体传感器-矿用压力传感器|ZHYQ朝辉 | 嘉兴恒升声级计-湖南衡仪声级计-杭州爱华多功能声级计-上海邦沃仪器设备有限公司 | 山东钢衬塑罐_管道_反应釜厂家-淄博富邦滚塑防腐设备科技有限公司 | 砍排机-锯骨机-冻肉切丁机-熟肉切片机-预制菜生产线一站式服务厂商 - 广州市祥九瑞盈机械设备有限公司 | 塑胶地板-商用PVC地板-pvc地板革-安耐宝pvc塑胶地板厂家 | 气密性检测仪_气密性检测设备_防水测试仪_密封测试仪-岳信仪器 | 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 - 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 | 生鲜配送系统-蔬菜食材配送管理系统-连锁餐饮订货配送软件-挪挪生鲜供应链管理软件 | 下水道疏通_管道疏通_马桶疏通_附近疏通电话- 立刻通 | 西点培训学校_法式西点培训班_西点师培训_西点蛋糕培训-广州烘趣西点烘焙培训学院 | 大型冰雕-景区冰雕展制作公司,3D创意设计源头厂家-[赛北冰雕] | 食品级焦亚硫酸钠_工业级焦亚硫酸钠_焦亚硫酸钠-潍坊邦华化工有限公司 | 隧道风机_DWEX边墙风机_SDS射流风机-绍兴市上虞科瑞风机有限公司 | OpenI 启智 新一代人工智能开源开放平台 | 无线联网门锁|校园联网门锁|学校智能门锁|公租房智能门锁|保障房管理系统-KEENZY中科易安 | 转向助力泵/水泵/发电机皮带轮生产厂家-锦州华一精工有限公司 | 无菌检查集菌仪,微生物限度仪器-苏州长留仪器百科 | 洛阳防爆合格证办理-洛阳防爆认证机构-洛阳申请国家防爆合格证-洛阳本安防爆认证代办-洛阳沪南抚防爆电气技术服务有限公司 | 合肥触摸一体机_触摸查询机厂家_合肥拼接屏-安徽迅博智能科技 | 蒜肠网-动漫,二次元,COSPLAY,漫展以及收藏型模型,手办,玩具的新媒体.(原变形金刚变迷TF圈) | 成都网站建设制作_高端网站设计公司「做网站送优化推广」 | 胀套-锁紧盘-风电锁紧盘-蛇形联轴器「厂家」-瑞安市宝德隆机械配件有限公司 | 分类168信息网 - 分类信息网 免费发布与查询 | 恒温恒湿试验箱厂家-高低温试验箱维修价格_东莞环仪仪器_东莞环仪仪器 | 拖鞋定制厂家-品牌拖鞋代加工厂-振扬实业中国高端拖鞋大型制造商 | 高效节能电机_伺服主轴电机_铜转子电机_交流感应伺服电机_图片_型号_江苏智马科技有限公司 | 变色龙云 - 打包app_原生app_在线制作平台_短链接_ip查询 | 北京网络营销推广_百度SEO搜索引擎优化公司_网站排名优化_谷歌SEO - 北京卓立海创信息技术有限公司 | 好物生环保网、环保论坛 - 环保人的学习交流平台 | 药品冷藏箱厂家_低温冰箱_洁净工作台-济南欧莱博电子商务有限公司官网 | 艾乐贝拉细胞研究中心 | 国家组织工程种子细胞库华南分库 | 阿尔法-MDR2000无转子硫化仪-STM566 SATRA拉力试验机-青岛阿尔法仪器有限公司 | 四川成都干燥设备_回转筒干燥机_脉冲除尘器_输送设备_热风炉_成都川工星科机电设备有限公司 |