中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
大數(shù)據(jù)離張分析

包郵 大數(shù)據(jù)離張分析

出版社:清華大學出版社出版時間:2017-08-01
開本: 32開 頁數(shù): 169
本類榜單:教材銷量榜
中 圖 價:¥30.0(8.6折) 定價  ¥35.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數(shù)據(jù)離張分析 版權(quán)信息

大數(shù)據(jù)離張分析 本書特色

本書基于開源Hadoop大數(shù)據(jù)生態(tài)圈的主流離線分析工具Hive和Pig,通過技術(shù)講解和案例實戰(zhàn)相結(jié)合的方式,介紹了海量數(shù)據(jù)離線分析的技術(shù)方法。本書內(nèi)容主要包括Hive數(shù)據(jù)庫表、基于HiveQL的常規(guī)操作、視圖、索引和Pig等數(shù)據(jù)處理分析和基礎(chǔ)工具知識,Hive函數(shù)、Pig Latin編程、ETL工具Sqoop和工作流引擎Oozie等相關(guān)高級技術(shù),以及實際項目案例。 本書既可供學習大數(shù)據(jù)離線分析技術(shù)的本科和高職高專學生作為教材,也可供從事數(shù)據(jù)分析相關(guān)工作的技術(shù)人員作為參考資料。

大數(shù)據(jù)離張分析 內(nèi)容簡介

大數(shù)據(jù)離線處理目前技術(shù)上已經(jīng)成熟。Hadoop框架是主流技術(shù),使用 HDFS存儲數(shù)據(jù),使用 MapReduce做批量計算;需要數(shù)據(jù)倉庫的存入 Hive,然后從Hive進行分析和展現(xiàn);涉及復雜業(yè)務(wù)場景時,使用Sqoop、Pig、Oozie等工具會更靈活方便。本書綜合了大數(shù)據(jù)離線分析所需的主流技術(shù),并配以案例和豐富的輔助學習資源,足以滿足廣大學習者入門的需要。

大數(shù)據(jù)離張分析 目錄

目錄 緒論001 第1章走進Hive003 1.1Hive簡介003 1.1.1Hive發(fā)展史003 1.1.2體系結(jié)構(gòu)004 1.2Hive的安裝部署005 1.2.1安裝配置Hive005 1.2.2啟動Hive008 1.3Hive命令009 1.3.1Hive命令行選項009 1.3.2CLI命令行界面010 1.3.3Hive中CLI命令的快速編輯011 1.3.4Hive中的腳本011 1.3.5dfs命令的執(zhí)行013 1.4數(shù)據(jù)類型和文件格式014 1.4.1基本數(shù)據(jù)類型014 1.4.2集合數(shù)據(jù)類型015 1.4.3文本文件數(shù)據(jù)編碼016 本章小結(jié)018 習題018 第2章HiveQL數(shù)據(jù)定義020 2.1數(shù)據(jù)庫的創(chuàng)建與查詢020 2.2數(shù)據(jù)庫的修改與刪除021 2.3創(chuàng)建表022 2.3.1管理表023 2.3.2外部表023 2.3.3查看表結(jié)構(gòu)024 2.4修改表025 2.5刪除表026大數(shù)據(jù) 離線分析 目錄 2.6分區(qū)表027 2.6.1外部分區(qū)表028 2.6.2自定義表的存儲格式030 2.6.3增加、修改和刪除分區(qū)表031 2.7桶表031 本章小結(jié)032 習題033 第3章HiveQL數(shù)據(jù)操作034 3.1數(shù)據(jù)加載與導出034 3.1.1數(shù)據(jù)加載034 3.1.2數(shù)據(jù)導出036 3.2數(shù)據(jù)查詢037 3.2.1SELECT ... FROM語句037 3.2.2WHERE語句040 3.2.3GROUP BY語句與HAVING語句042 3.2.4JOIN語句043 3.2.5ORDER BY語句和SORT BY語句046 3.2.6CLUSTER BY語句047 3.2.7UNION ALL語句048 3.3抽樣查詢048 3.3.1數(shù)據(jù)塊抽樣049 3.3.2分桶表的輸入裁剪049 本章小結(jié)051 習題051 第4章HiveQL視圖和索引052 4.1視圖052 4.1.1創(chuàng)建視圖052 4.1.2顯示視圖053 4.1.3刪除視圖054 4.2索引054 4.2.1創(chuàng)建索引055 4.2.2重建索引055 4.2.3顯示索引056 4.2.4刪除索引056 本章小結(jié)057 習題057 第5章Hive的函數(shù)058 5.1函數(shù)簡介058 5.1.1發(fā)現(xiàn)和描述函數(shù)058 5.1.2調(diào)用函數(shù)059 5.1.3標準函數(shù)059 5.1.4聚合函數(shù)061 5.1.5表生成函數(shù)067 5.2用戶自定義函數(shù)UDF068 5.3用戶自定義聚合函數(shù)UDAF072 5.4用戶自定義表生成函數(shù)UDTF074 5.5UDF的標注075 5.5.1定數(shù)性標注(deterministic)076 5.5.2狀態(tài)性標注(stateful)076 5.5.3唯一性標注(distinctLike)076 本章小結(jié)076 習題077 第6章認識Pig078 6.1初識Pig078 6.1.1Pig是什么078 6.1.2Pig的應用場景078 6.1.3Pig的設(shè)計思想079 6.1.4Pig的發(fā)展簡史080 6.2安裝、運行Pig080 6.2.1安裝Pig080 6.2.2運行Pig081 本章小結(jié)082 習題082 第7章Pig基礎(chǔ)084 7.1命令行工具Grunt084 7.1.1輸入Pig Latin腳本084 7.1.2使用HDFS命令085 7.1.3控制Pig087 7.2Pig數(shù)據(jù)類型088 7.2.1基本類型088 7.2.2復雜類型089 7.2.3NULL值089 7.2.4類型轉(zhuǎn)換090 本章小結(jié)092 習題092 第8章Pig Latin編程093 8.1Pig Latin介紹093 8.1.1基礎(chǔ)知識093 8.1.2輸入和輸出094 8.2關(guān)系操作095 8.2.1foreach語句096 8.2.2filter語句096 8.2.3group語句097 8.2.4order語句097 8.2.5distinct語句098 8.2.6join語句098 8.2.7limit語句098 8.2.8sample語句099 8.2.9parallel語句099 8.3用戶自定義函數(shù)UDF101 8.3.1注冊UDF102 8.3.2define命令和UDF103 8.3.3調(diào)用Java函數(shù)104 8.4開發(fā)工具104 8.4.1describe104 8.4.2explain105 8.4.3illustrate107 8.4.4Pig統(tǒng)計信息109 8.4.5M/R作業(yè)狀態(tài)信息111 8.4.6調(diào)試技巧112 本章小結(jié)113 習題113 第9章數(shù)據(jù)ETL工具Sqoop115 9.1安裝Sqoop115 9.2數(shù)據(jù)導入117 9.2.1導入實例118 9.2.2導入數(shù)據(jù)的使用119 9.2.3數(shù)據(jù)導入代碼生成120 9.3數(shù)據(jù)導出121 9.3.1導出實例121 9.3.2導出和SequenceFile123 本章小結(jié)123 習題124 第10章Hadoop工作流引擎Oozie125 10.1Oozie是什么125 10.2Oozie的安裝125 10.3Oozie的編寫與運行131 10.3.1Workflow組件131 10.3.2Coordinator組件133 10.3.3Bundle組件134 10.3.4作業(yè)的部署與執(zhí)行134 10.3.5向作業(yè)傳遞參數(shù)136 10.4Oozie控制臺136 10.4.1控制臺界面136 10.4.2獲取作業(yè)信息137 10.5Oozie的高級特性139 10.5.1自定義Oozie Workflow139 10.5.2使用Oozie JavaAPI141 本章小結(jié)143 習題143 第11章離線計算實例145 11.1微博歷史數(shù)據(jù)分析145 11.1.1數(shù)據(jù)結(jié)構(gòu)145 11.1.2需求分析146 11.1.3需求實現(xiàn)146 11.2電商銷售數(shù)據(jù)分析160 11.2.1數(shù)據(jù)結(jié)構(gòu)160 11.2.2需求分析161 11.2.3需求實現(xiàn)161 本章小結(jié)169 參考文獻
展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 高清视频编码器,4K音视频编解码器,直播编码器,流媒体服务器,深圳海威视讯技术有限公司 | 博莱特空压机|博莱特-阿特拉斯独资空压机品牌核心代理商 | 定制异形重型钢格栅板/钢格板_定做踏步板/排水沟盖板_钢格栅板批发厂家-河北圣墨金属制品有限公司 | 杭州月嫂技术培训服务公司-催乳师培训中心报名费用-产后康复师培训机构-杭州优贝姆健康管理有限公司 | 细砂提取机,隔膜板框泥浆污泥压滤机,螺旋洗砂机设备,轮式洗砂机械,机制砂,圆锥颚式反击式破碎机,振动筛,滚筒筛,喂料机- 上海重睿环保设备有限公司 | 流量检测仪-气密性检测装置-密封性试验仪-东莞市奥图自动化科技有限公司 | 灌装封尾机_胶水灌装机_软管灌装封尾机_无锡和博自动化机械制造有限公司 | 高光谱相机-近红外高光谱相机厂家-高光谱成像仪-SINESPEC 赛斯拜克 | 液晶拼接屏厂家_拼接屏品牌_拼接屏价格_监控大屏—北京维康 | 汽车整车综合环境舱_军标砂尘_盐雾试验室试验箱-无锡苏南试验设备有限公司 | 铝板冲孔网,不锈钢冲孔网,圆孔冲孔网板,鳄鱼嘴-鱼眼防滑板,盾构走道板-江拓数控冲孔网厂-河北江拓丝网有限公司 | 蒸压釜_蒸养釜_蒸压釜厂家-山东鑫泰鑫智能装备有限公司 | 深圳APP开发公司_软件APP定制开发/外包制作-红匣子科技 | led太阳能路灯厂家价格_风光互补庭院灯_农村市政工程路灯-中山华可路灯品牌 | 盘古网络技术有限公司 | 建筑资质代办_工程施工资质办理_资质代办公司_北京众聚企服 | 新疆乌鲁木齐网站建设-乌鲁木齐网站制作设计-新疆远璨网络 | 四川成人高考_四川成考报名网 | 泡沫消防车_水罐消防车_湖北江南专用特种汽车有限公司 | 东莞螺杆空压机_永磁变频空压机_节能空压机_空压机工厂批发_深圳螺杆空压机_广州螺杆空压机_东莞空压机_空压机批发_东莞空压机工厂批发_东莞市文颖设备科技有限公司 | 铝镁锰板厂家_进口钛锌板_铝镁锰波浪板_铝镁锰墙面板_铝镁锰屋面-杭州军晟金属建筑材料 | 电子厂招聘_工厂招聘_普工招聘_小时工招聘信息平台-众立方招工网 | HV全空气系统_杭州暖通公司—杭州斯培尔冷暖设备有限公司 | 篷房[仓储-婚庆-展览-活动]生产厂家-江苏正德装配式帐篷有限公司 | 锂离子电池厂家-山东中信迪生电源| 珠宝展柜-玻璃精品展柜-首饰珠宝展示柜定制-鸿钛展柜厂家 | 水成膜泡沫灭火剂_氟蛋白泡沫液_河南新乡骏华消防科技厂家 | 氧氮氢联合测定仪-联测仪-氧氮氢元素分析仪-江苏品彦光电 | 电位器_轻触开关_USB连接器_广东精密龙电子科技有限公司 | 分子精馏/精馏设备生产厂家-分子蒸馏工艺实验-新诺舜尧(天津)化工设备有限公司 | POS机办理_个人POS机免费领取 - 银联POS机申请首页 | 山西3A认证|太原AAA信用认证|投标AAA信用证书-山西AAA企业信用评级网 | 济南菜鸟驿站广告|青岛快递车车体|社区媒体-抖音|墙体广告-山东揽胜广告传媒有限公司 | 校服厂家,英伦校服定做工厂,园服生产定制厂商-东莞市艾咪天使校服 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | WTB5光栅尺-JIE WILL磁栅尺-B60数显表-常州中崴机电科技有限公司 | 动物解剖台-成蚊接触筒-标本工具箱-负压实验台-北京哲成科技有限公司 | 真空干燥烘箱_鼓风干燥箱 _高低温恒温恒湿试验箱_光照二氧化碳恒温培养箱-上海航佩仪器 | MES系统-WMS系统-MES定制开发-制造执行MES解决方案-罗浮云计算 | 食安观察网| 中宏网-今日新闻-财经新闻|