中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
Hadoop大數據技術原理與編程 微課版

包郵 Hadoop大數據技術原理與編程 微課版

出版社:清華大學出版社出版時間:2024-07-01
開本: 16開 頁數: 316
中 圖 價:¥52.8(7.7折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Hadoop大數據技術原理與編程 微課版 版權信息

  • ISBN:9787302666790
  • 條形碼:9787302666790 ; 978-7-302-66679-0
  • 裝幀:70g膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

Hadoop大數據技術原理與編程 微課版 本書特色

內容系統全面:涵蓋Hadoop大部分生態組件。 理論實踐結合:每章知識點配豐富實例實踐。 原理淺顯易懂:對操作給出示例代碼和注解。 入門門檻較低:零基礎輕松快速掌握Hadoop。 配套資源豐富:有教學課件、教學大綱、源代碼、教學視頻。 提供全套PPT教學課件、專業培養計劃、教案、教學大綱、教學進度表。

Hadoop大數據技術原理與編程 微課版 內容簡介

本書系統介紹了大數據技術的相關知識,全書共13章,內容包括Hadoop大數據處理架構、HDFS分布式文件系統、YARN資源管理、MapReduce分布式計算框架、HBase分布式數據庫、流數據采集、典型非關系數據庫的安裝與使用、分布式數據分析工具Pig、Spark大數據處理框架、基于Python語言的Spark RDD編程、基于Python語言的Spark SQL結構化數據處理、Hive分布式數據倉庫、典型數據可視化工具的使用。本書對大數據相關技術給出詳細的編程示例,并給出詳細的注解。
本書可作為高等院校計算機、信息管理、軟件工程、人工智能、數據科學與大數據技術等相關專業的大數據技術課程教材,也可供相關技術人員參考。

Hadoop大數據技術原理與編程 微課版 目錄

目錄 第1章Hadoop大數據處理架構1 1.1大數據的基本概念1 1.1.1大數據時代1 1.1.2大數據定義1 1.1.3大數據的特征2 1.1.4大數據思維2 1.2大數據計算模式與典型系統3 1.2.1批處理計算模式與典型系統3 1.2.2流式計算模式與典型系統4 1.2.3迭代計算模式與典型系統4 1.2.4圖計算模式與典型系統4 1.2.5內存計算模式與典型系統5 1.3Hadoop發展歷程5 1.4Hadoop優缺點6 1.5Hadoop生態圈6 1.6在VirtualBox上搭建Linux操作系統8 1.6.1創建Master節點9 1.6.2克隆虛擬電腦17 1.7Hadoop安裝前的準備工作21 1.7.1創建hadoop用戶22 1.7.2安裝SSH、配置SSH無密碼登錄23 1.7.3安裝Java環境23 1.7.4Linux操作系統下Scala版本的Eclipse的安裝與配置… 24 1.7.5Eclipse環境下Java語言程序開發實例25 1.8Hadoop的安裝與配置28 1.8.1下載Hadoop安裝文件28 1.8.2Hadoop單機模式配置28 1.8.3Hadoop偽分布式模式配置30 1.8.4Hadoop分布式模式配置34 1.9習題43 第2章HDFS分布式文件系統44 2.1HDFS基本特征44 2.2HDFS存儲架構及組件功能45 2.2.1HDFS存儲架構45 2.2.2數據塊45 2.2.3數據節點46 2.2.4名稱節點46 2.2.5第二名稱節點47 2.2.6心跳消息47 2.2.7客戶端48 2.3HDFS讀寫文件流程48 2.3.1HDFS讀文件流程48 2.3.2HDFS寫文件流程49 2.4HDFS的Shell操作50 2.4.1查看命令使用方法50 2.4.2HDFS常用的Shell操作52 2.4.3HDFS管理員命令55 2.4.4HDFS的Java API操作57 2.5案例實戰1: 修改文件名58 2.5.1在Eclipse中創建項目58 2.5.2為項目添加需要用到的JAR包58 2.5.3編寫Java語言應用程序60 2.5.4編譯運行程序62 2.5.5應用程序的部署63 2.6案例實戰2: 文件讀取、上傳和下載65 2.6.1讀取文件內容66 2.6.2文件上傳和下載66 2.7習題67 第3章YARN資源管理68 3.1YARN概述68 3.2YARN基礎架構68 3.2.1Container68 3.2.2ResourceManager69 3.2.3NodeManager69 3.2.4Application Master70 3.2.5Client70 3.3YARN常用命令70 3.3.1YARN啟動與停止70 3.3.2用戶命令71 3.3.3管理命令73 3.4習題74 第4章MapReduce分布式計算框架75 4.1MapReduce工作原理75 4.1.1MapReduce并行編程核心思想75 4.1.2Map函數和Reduce函數75 4.2MapReduce工作機制77 4.2.1Map任務工作機制78 4.2.2Reduce任務工作機制79 4.3MapReduce編程類80 4.3.1InputFormat數據輸入格式類81 4.3.2Mapper類85 4.3.3Combiner合并類86 4.3.4Partitioner分區類87 4.3.5Sort排序類87 4.3.6Reducer歸約類87 4.3.7OutputFormat輸出格式類88 4.4MapReduce編程實現詞頻統計89 4.4.1WordCount執行流程89 4.4.2WordCount具體實現91 4.4.3使用Eclipse編譯運行詞頻統計程序94 4.5習題100 第5章HBase分布式數據庫101 5.1HBase概述101 5.1.1HBase的技術特點101 5.1.2HBase與傳統關系數據庫的區別101 5.1.3HBase與Hadoop中其他組件的關系102 5.2HBase系統架構和數據訪問流程102 5.2.1HBase系統架構102 5.2.2HBase數據訪問流程105 5.3HBase數據表107 5.3.1HBase數據表邏輯視圖107 5.3.2HBase數據表物理視圖109 5.3.3HBase數據表面向列的存儲110 5.3.4HBase數據表的查詢方式111 5.3.5HBase表結構設計111 5.4HBase的安裝112 5.4.1下載安裝文件112 5.4.2配置環境變量112 5.4.3添加用戶權限113 5.4.4查看HBase版本信息113 5.5HBase的配置113 5.5.1單機模式配置114 5.5.2偽分布式模式配置115 5.6HBase的Shell操作117 5.6.1基本操作117 5.6.2創建表118 5.6.3插入與更新表中的數據119 5.6.4查看表中的數據120 5.6.5刪除表中的數據122 5.6.6表的啟用/禁用122 5.6.7修改表結構122 5.6.8刪除HBase表123 5.7HBase的Java API操作123 5.7.1HBase數據庫管理API123 5.7.2HBase數據庫表API124 5.7.3HBase數據庫表行列API126 5.8HBase案例實戰127 5.8.1在Eclipse中創建工程127 5.8.2添加項目用到的JAR包128 5.8.3編寫Java語言應用程序129 5.8.4編譯運行程序132 5.9利用Python語言操作HBase133 5.9.1HappyBase的安裝133 5.9.2Connection類133 5.9.3Table類134 5.10拓展閱讀——HBase存儲策略的啟示134 5.11習題135 第6章流數據采集136 6.1流數據采集工具Flume136 6.1.1Flume概述136 6.1.2Flume組成架構136 6.1.3Flume安裝139 6.1.4Flume簡單使用141 6.2Kafka分布式發布訂閱消息系統142 6.2.1Kafka基本架構142 6.2.2Kafka安裝143 6.2.3Kafka測試實例144 6.3習題145 第7章典型非關系數據庫的安裝與使用146 7.1NoSQL數據庫概述146 7.1.1NoSQL數據庫興起的原因146 7.1.2NoSQL數據庫的特點147 7.2“鍵值”數據庫147 7.2.1Redis安裝147 7.2.2Redis數據庫的特點149 7.2.3Redis數據庫的基本數據類型149 7.3列族數據庫154 7.4文檔數據庫154 7.4.1MongoDB簡介154 7.4.2MongoDB下載與安裝154 7.4.3MongoDB文檔操作158 7.4.4MongoDB集合操作161 7.4.5MongoDB數據庫操作162 7.4.6MongoDB數據類型163 7.5圖數據庫164 7.5.1下載和安裝Neo4j164 7.5.2Neo4j的啟動和停止165 7.5.3Neo4j的CQL操作167 7.5.4在Neo4j瀏覽器中創建節點和關系169 7.6習題170 第8章分布式數據分析工具Pig171 8.1Pig概述171 8.2Pig安裝與配置171 8.2.1Pig安裝171 8.2.2配置環境變量172 8.2.3Pig運行模式和工作方式172 8.3Pig Latin語言173 8.3.1Pig Latin語言基本概念173 8.3.2Pig Latin語言數據類型174 8.3.3Pig操作HDFS文件系統常用的命令175 8.3.4實用程序命令176 8.3.5Pig常用的數據分析命令177 8.4習題180 第9章Spark大數據處理框架181 9.1Spark概述181 9.1.1Spark的產生背景181 9.1.2Spark的優點182 9.1.3Spark的應用場景182 9.1.4Spark的生態系統182 9.2Spark運行機制184 9.2.1Spark基本概念184 9.2.2Spark運行架構186 9.3Spark的安裝與配置186 9.3.1下載Spark安裝文件187 9.3.2單機模式配置187 9.3.3偽分布式模式配置188 9.4使用PySpark編寫Python語言代碼190 9.5安裝pip工具和常用的數據分析庫191 9.6安裝Anaconda和配置Jupyter Notebook192 9.6.1安裝Anaconda192 9.6.2配置Jupyter Notebook193 9.6.3運行Jupyter Notebook194 9.6.4配置Jupyter Notebook實現和PySpark交互196 9.6.5為Anaconda安裝擴展庫197 9.7習題197 第10章基于Python語言的Spark RDD編程198 10.1RDD的創建方式198 10.1.1使用程序中的數據集創建RDD198 10.1.2使用文本文件創建RDD200 10.1.3使用JSON文件創建RDD201 10.1.4使用CSV文件創建RDD203 10.2RDD轉換操作203 10.2.1映射操作203 10.2.2去重操作205 10.2.3排序操作206 10.2.4分組聚合操作208 10.2.5集合操作210 10.2.6抽樣操作211 10.2.7連接操作方法211 10.2.8打包操作方法212 10.2.9獲取鍵值對RDD的鍵和值集合212 10.2.10重新分區操作212 10.3RDD行動操作214 10.3.1統計操作215 10.3.2取數據操作216 10.3.3聚合操作217 10.3.4迭代操作217 10.3.5存儲操作218 10.4RDD之間的依賴關系218 10.4.1窄依賴219 10.4.2寬依賴219 10.5RDD的持久化219 10.6案例實戰: 利用Spark RDD實現詞頻統計221 10.7實驗1: RDD編程實驗222 10.8拓展閱讀——中國女排精神223 10.9習題224 第11章基于Python語言的Spark SQL結構化數據處理225 11.1Spark SQL概述225 11.1.1Spark SQL簡介225 11.1.2DataFrame與DataSet225 11.2創建DataFrame對象的方法226 11.2.1使用Parquet文件創建DataFrame對象226 11.2.2使用JSON文件創建DataFrame對象227 11.2.3使用SparkSession方式創建DataFrame對象228 11.3將DataFrame對象保存為不同格式的文件232 11.3.1通過write.xxx()方法保存DataFrame對象232 11.3.2通過write.format()方法保存DataFrame對象233 11.3.3將DataFrame對象轉化成RDD保存到文件中233 11.4DataFrame的常用操作233 11.4.1行類操作233 11.4.2列類操作234 11.4.3DataFrame的常用屬性236 11.4.4輸出236 11.4.5篩選239 11.4.6排序241 11.4.7匯總與聚合243 11.4.8統計244 11.4.9合并245 11.4.10連接245 11.4.11to系列轉換247 11.5讀寫MySQL數據庫248 11.5.1安裝并配置MySQL數據庫248 11.5.2讀取MySQL數據庫中的數據250 11.5.3向MySQL數據庫寫入數據250 11.6實驗2: Spark SQL編程實驗251 11.7拓展閱讀——中國芯片之路253 11.8習題254 第12章Hive分布式數據倉庫255 12.1Hive分布式數據倉庫概述255 12.2Hive的安裝255 12.2.1下載Hive安裝文件255 12.2.2配置Hive環境變量256 12.2.3修改Hive配置文件256 12.2.4安裝并配置MySQL數據庫257 12.3MySQL數據庫常用操作259 12.3.1數據庫基本語句259 12.3.2數據表基本語句261 12.4Hive的數據類型264 12.5Hive基本操作265 12.5.1數據庫操作265 12.5.2創建表266 12.5.3創建帶有分區的表267 12.5.4查看和修改表268 12.6習題269 第13章典型數據可視化工具的使用270 13.1WordCloud繪制詞云圖270 13.2PyeCharts數據可視化274 13.2.1繪制柱狀圖275 13.2.2繪制折線圖277 13.2.3繪制餅圖278 13.2.4繪制雷達圖279 13.2.5繪制漏斗圖280 13.2.6繪制3D柱狀圖280 13.2.7繪制詞云圖281 13.3Tableau繪圖282 13.3.1Tableau的主要特性282 13.3.2Tableau工作表工作區283 13.3.3Tableau儀表板工作區288 13.3.4Tableau故事工作區289 13.3.5Tableau菜單欄290 13.3.6Tableau可視化與數據分析舉例291 13.4習題293 參考文獻294
展開全部

Hadoop大數據技術原理與編程 微課版 作者簡介

曹潔,博士,畢業于同濟大學電子與信息工程學院計算機軟件與理論專業;主要研究方向是并行分布式處理、云計算、大數據;主持和參與國家級、省部級項目5項;在《軟件學報》《計算機研究與發展》《通信學報》等國內外核心刊物上發表學術論文12篇;主講“Python語言程序設計”“大數據技術及應用”“云計算技術”等課程;主編《Python語言程序設計》(微課版),參編《數據挖掘》《Struts2+Hibermate框架技術教程》(第2版)等多部教材。 齊平,博士,銅陵學院數學與計算機學院副教授、服務計算研究所所長、人工智能教研室主任。長期從事邊緣智能、邊緣計算資源調度等方面的研究工作。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 退火炉,燃气退火炉,燃气热处理炉生产厂家-丹阳市丰泰工业炉有限公司 | 避光流动池-带盖荧光比色皿-生化流动比色皿-宜兴市晶科光学仪器 东莞爱加真空科技有限公司-进口真空镀膜机|真空镀膜设备|Polycold维修厂家 | 网站制作优化_网站SEO推广解决方案-无锡首宸信息科技公司 | 炭黑吸油计_测试仪,单颗粒子硬度仪_ASTM标准炭黑自销-上海贺纳斯仪器仪表有限公司(HITEC中国办事处) | 北京亦庄厂房出租_经开区产业园招商信息平台 | 复合土工膜厂家|hdpe防渗土工膜|复合防渗土工布|玻璃纤维|双向塑料土工格栅-安徽路建新材料有限公司 | 桂林腻子粉_内墙外墙抗裂砂浆腻子粉推荐广西鑫达涂料厂家供应 | 哈尔滨发电机,黑龙江柴油发电机组-北方星光 | 无锡网站建设_小程序制作_网站设计公司_无锡网络公司_网站制作 | 深圳3D打印服务-3D打印加工-手板模型加工厂-悟空打印坊 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 代做标书-代写标书-专业标书文件编辑-「深圳卓越创兴公司」 | 下水道疏通_管道疏通_马桶疏通_附近疏通电话- 立刻通 | 好看的韩国漫画_韩漫在线免费阅读-汗汗漫画| 美的商用净水器_美的直饮机_一级代理经销商_Midea租赁价格-厂家反渗透滤芯-直饮水批发品牌售后 | 硅胶管挤出机厂家_硅胶挤出机生产线_硅胶条挤出机_臣泽智能装备 贵州科比特-防雷公司厂家提供贵州防雷工程,防雷检测,防雷接地,防雷设备价格,防雷产品报价服务-贵州防雷检测公司 | 电子厂招聘_工厂招聘_普工招聘_小时工招聘信息平台-众立方招工网 | 东莞ERP软件_广州云ERP_中山ERP_台湾工厂erp系统-广东顺景软件科技有限公司 | ?水马注水围挡_塑料注水围挡_防撞桶-常州瑞轩水马注水围挡有限公司 | 周易算网-八字测算网 - 周易算网-宝宝起名取名测名字周易八字测算网 | 变压器配件,变压器吸湿器,武强县吉口变压器配件有限公司 | 同学聚会纪念册制作_毕业相册制作-成都顺时针宣传画册设计公司 | 广东成考网-广东成人高考网 | 全自动端子机|刺破式端子压接机|全自动双头沾锡机|全自动插胶壳端子机-东莞市傅氏兄弟机械设备有限公司 | 东莞办公家具厂家直销-美鑫【免费3D效果图】全国办公桌/会议桌定制 | 动物麻醉机-数显脑立体定位仪-北京易则佳科技有限公司 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 诸城网站建设-网络推广-网站优化-阿里巴巴托管-诸城恒泰互联 | 药品仓库用除湿机-变电站用防爆空调-油漆房用防爆空调-杭州特奥环保科技有限公司 | 锂电混合机-新能源混合机-正极材料混料机-高镍,三元材料混料机-负极,包覆混合机-贝尔专业混合混料搅拌机械系统设备厂家 | 开锐教育-学历提升-职称评定-职业资格培训-积分入户 | 番茄畅听邀请码怎么输入 - Dianw8.com | 合肥汽车充电桩_安徽充电桩_电动交流充电桩厂家_安徽科帝新能源科技有限公司 | 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 大立教育官网-一级建造师培训-二级建造师培训-造价工程师-安全工程师-监理工程师考试培训 | 3d可视化建模_三维展示_产品3d互动数字营销_三维动画制作_3D虚拟商城 【商迪3D】三维展示服务商 广东健伦体育发展有限公司-体育工程配套及销售运动器材的体育用品服务商 | 列管冷凝器,刮板蒸发器,外盘管反应釜厂家-无锡曼旺化工设备有限公司 | Q361F全焊接球阀,200X减压稳压阀,ZJHP气动单座调节阀-上海戎钛 | 铝合金重力铸造_铝合金翻砂铸造_铝铸件厂家-东莞市铝得旺五金制品有限公司 | 3A别墅漆/3A环保漆_广东美涂士建材股份有限公司【官网】 | 微水泥_硅藻泥_艺术涂料_艺术漆_艺术漆加盟-青岛泥之韵环保壁材 武汉EPS线条_EPS装饰线条_EPS构件_湖北博欧EPS线条厂家 |