中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據技術入門——Hadoop+Spark

包郵 大數據技術入門——Hadoop+Spark

出版社:清華大學出版社出版時間:2022-01-01
開本: 其他 頁數: 208
中 圖 價:¥38.4(7.7折) 定價  ¥49.9 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據技術入門——Hadoop+Spark 版權信息

  • ISBN:9787302591818
  • 條形碼:9787302591818 ; 978-7-302-59181-8
  • 裝幀:70g膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

大數據技術入門——Hadoop+Spark 本書特色

(1)以實戰開發為導向,對基礎理論知識點與開發過程進行詳細講解。 (2)實戰案例豐富,涵蓋18 個完整項目案例和2個綜合案例,綜合案例可以加深對本書所學的知識點的理解和掌握。 (3)代碼詳盡,避免對 API 的形式展示,規避重復代碼。 (4)語言簡明易懂,由淺入深帶你學會以 Hadoop生態圈為核心的開發技術和大數據常見的機器學習算法。 16個完整的項目案例和兩個綜合案例,配有教學大綱等資源

大數據技術入門——Hadoop+Spark 內容簡介

本書基礎理論、應用開發以及實際案例相結合,圍繞Hadoop、Spark生態圈循序漸進地介紹關于大數據技術領域中的基礎知識、應用開發技術和基于Spark的常見機器學習算法,很后以兩個實戰案例全面、系統地應用了本書介紹的基礎知識和應用開發方法。全書共14章,分別為大數據概述、Hadoop簡介及安裝部署、HDFS、MapReduce計算框架、Hive數據倉庫、HBase分布式數據庫、Spark基礎、Spark RDD彈性分布式數據集、Spark SQL、Spark Streaming實時計算框架、Spark Streaming與Flume、Kafka的整合、Spark MLlib 機器學習、實戰案例——分布式優惠券后臺應用系統和實戰案例——新聞話題實時統計分析系統,書中的每個知識點都有相應的實現代碼和實例。 本書主要面向廣大從事大數據分析、應用開發、機器學習、數據挖掘的專業人員以及從事高校信息技術專業的教師和高等院校的在讀學生及相關領域的廣大科研人員。

大數據技術入門——Hadoop+Spark 目錄





目錄

第1章大數據概述


1.1大數據的研究背景


1.2大數據的定義及其技術特點


1.2.1大數據的定義


1.2.2大數據的基本特點


1.2.3典型的大數據處理需求與計算特征


1.3大數據處理的主要技術特點與難點


1.4研究大數據的意義


1.5本章小結


第2章Hadoop簡介及安裝部署


2.1Hadoop簡介及生態體系


2.2Hadoop集群架構


2.3Hadoop集群運行環境搭建


2.3.1Hadoop安裝配置過程


2.3.2驗證Hadoop的安裝


2.4本章小結


第3章HDFS


3.1相關基本概念


3.2HDFS存儲架構


3.2.1HDFS寫入流程


3.2.2HDFS讀取流程


3.3HDFS的優點與缺點


3.3.1HDFS的優點


3.3.2HDFS的缺點


3.4HDFS Shell常用命令


3.5HDFS的Java API


3.6本章小結


第4章MapReduce計算框架


4.1MapReduce核心思想


4.2MapReduce的工作原理


4.3MapReduce的運行機制


4.4MapReduce數據本地化


4.5MapReduce編程


4.5.1MapReduce運行模式


4.5.2MapReduce編程組件與數據類型


4.6MapReduce編程示例


4.6.1單詞計數


4.6.2倒排索引


4.7本章小結







第5章Hive數據倉庫


5.1Hive概述


5.1.1Hive簡介


5.1.2Hive的架構


5.1.3Hive的優缺點


5.2Hive的安裝


5.2.1安裝MySQL


5.2.2安裝Hive


5.3Hive數據庫相關操作


5.3.1Hive的數據類型


5.3.2Hive基礎SQL語法


5.4本章小結


第6章HBase分布式數據庫


6.1HBase概述


6.1.1HBase的架構


6.1.2HBase的特點


6.1.3HBase數據存儲方式


6.1.4HBase尋址機制


6.2HBase的安裝


6.3HBase數據模型


6.4HBase的Shell操作


6.5HBase常用的Java API及示例程序


6.5.1HBase常用的Java API


6.5.2程序示例


6.6本章小結


第7章Spark基礎


7.1Spark概述


7.1.1Spark的主要特點


7.1.2Spark生態系統


7.1.3Spark相對于Hadoop MapReduce的優勢


7.2Spark的安裝


7.2.1Spark的部署方式


7.2.2Spark的安裝


7.3Spark運行架構與原理


7.4Spark運行流程


7.5本章小結


第8章Spark RDD彈性分布式數據集


8.1RDD的設計與運行原理


8.1.1RDD的概念


8.1.2RDD的分區


8.1.3RDD的依賴關系


8.1.4RDD在Spark中的運行流程


8.1.5RDD容錯機制


8.2RDD API編程


8.2.1RDD的創建


8.2.2RDD的操作


8.3程序示例: 倒排索引


8.4本章小結


第9章Spark SQL


9.1Spark SQL概述


9.1.1Spark SQL簡介


9.1.2Spark SQL的架構


9.2DataFrame


9.2.1DataFrame簡介


9.2.2DataFrame的創建


9.2.3DataFrame的常用操作


9.3Dataset


9.4Spark SQL編程


9.4.1DataFrame操作


9.4.2Spark SQL 讀寫MySQL數據庫


9.4.3Spark SQL 讀寫Hive


9.5本章小結


第10章 Spark Streaming實時計算框架


10.1Spark Streaming概述


10.1.1流數據和流計算


10.1.2Spark Streaming簡介


10.1.3DStream簡介


10.2DStream編程


10.2.1DStream轉換操作


10.2.2DStream輸出操作相關的方法


10.3DStream編程示例


10.3.1DStream編程基本步驟——文件流


10.3.2無狀態轉換操作


10.3.3有狀態轉換操作


10.3.4輸出操作


10.4本章小結


第11章Spark Streaming與Flume、Kafka的整合


11.1Flume簡介及安裝


11.1.1Flume簡介


11.1.2Flume的安裝


11.2Kafka簡介及安裝


11.2.1Kafka簡介


11.2.2Kafka的安裝


11.3Flume與Kafka的區別和側重點


11.4Spark Streaming與Flume、Kafka的整合與開發


11.5本章小結


第12章Spark MLlib機器學習


12.1機器學習的概念


12.1.1機器學習的定義


12.1.2機器學習的分類


12.2MLlib簡介


12.3Spark MLlib的數據類型


12.3.1本地向量


12.3.2標注點


12.3.3本地矩陣


12.4Spark MLlib機器學習示例


12.4.1特征抽取——TFIDF


12.4.2分類與回歸——線性回歸


12.4.3分類與回歸——邏輯回歸


12.4.4協同過濾——電影推薦


12.5本章小結


第13章實戰案例——分布式優惠券后臺應用系統


13.1系統簡介


13.2整體架構


13.3表結構設計


13.4系統實現


13.4.1商戶投放子系統


13.4.2用戶消費子系統


13.5系統運行測試


13.5.1啟動系統


13.5.2商戶投放子系統測試


13.5.3用戶消費子系統測試


13.6本章小結


第14章實戰案例——新聞話題實時統計分析系統


14.1系統簡介


14.2系統總體架構


14.3表結構設計


14.4系統實現


14.4.1模擬日志生成程序


14.4.2Flume配置


14.4.3配置Kafka


14.4.4Spark Streaming開發


14.4.5WebSocket和前端界面開發


14.5系統運行測試


14.6本章小結


參考文獻


展開全部

大數據技術入門——Hadoop+Spark 作者簡介

于海浩,男,1974年1月生,高級工程師,黑龍江工程學院計算機學院教師,主講大數據實踐和人工智能課程,研究方向為大數據處理與挖掘,深度學習。主持或參與國家、省部級、廳局級項目6項。以第一作者發表論文10余篇,作為高級項目經理和企業管理者組織了黑龍江省電力營銷系統、地下管廊運維監管平臺、智慧城管、城鎮職工醫療系統的項目管理工作,有任企業技術總監的職務經歷。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 选矿设备-新型重选设备-金属矿尾矿重选-青州冠诚重工机械有限公司 | 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 智慧钢琴-电钢琴-便携钢琴-数码钢琴-深圳市特伦斯乐器有限公司 | 东莞爱加真空科技有限公司-进口真空镀膜机|真空镀膜设备|Polycold维修厂家 | 货车视频监控,油管家,货车油管家-淄博世纪锐行电子科技 | 塑料熔指仪-塑料熔融指数仪-熔体流动速率试验机-广东宏拓仪器科技有限公司 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 气密性检测仪_气密性检测设备_防水测试仪_密封测试仪-岳信仪器 | 制冷采购电子商务平台——制冷大市场 | 包头市鑫枫装饰有限公司| 水厂污泥地磅|污泥处理地磅厂家|地磅无人值守称重系统升级改造|地磅自动称重系统维修-河南成辉电子科技有限公司 | 危废处理系统,水泥厂DCS集散控制系统,石灰窑设备自动化控制系统-淄博正展工控设备 | 佛山市德信昌电子有限公司 | 安平县鑫川金属丝网制品有限公司,声屏障,高速声屏障,百叶孔声屏障,大弧形声屏障,凹凸穿孔声屏障,铁路声屏障,顶部弧形声屏障,玻璃钢吸音板 | 福州时代广告制作装饰有限公司-福州广告公司广告牌制作,福州展厅文化墙广告设计, | 不锈钢拉手厂家|浴室门拉手厂家|江门市蓬江区金志翔五金制品有限公司 | 菏泽知彼网络科技有限公司| 进口消泡剂-道康宁消泡剂-陶氏消泡剂-大洋消泡剂 | 智能气瓶柜(大型气瓶储存柜)百科 | 膜片万向弹性联轴器-冲压铸造模具「沧州昌运模具」 | 黑龙江「京科脑康」医院-哈尔滨失眠医院_哈尔滨治疗抑郁症医院_哈尔滨精神心理医院 | 劳动法网-专业的劳动法和劳动争议仲裁服务网 | 新型锤式破碎机_新型圆锥式_新型颚式破碎机_反击式打沙机_锤式制砂机_青州建源机械 | 齿轮减速电机一体机_蜗轮蜗杆减速马达-德国BOSERL齿轮减速机带电机生产厂家 | 鑫达滑石-辽宁鑫达滑石集团 | 北京浩云律师事务所-企业法律顾问_破产清算等公司法律服务 | 浇钢砖,流钢砖_厂家价低-淄博恒森耐火材料有限公司 | 便携式谷丙转氨酶检测仪|华图生物科技百科 | 双能x射线骨密度检测仪_dxa骨密度仪_双能x线骨密度仪_品牌厂家【品源医疗】 | 北京西风东韵品牌与包装设计公司,创造视觉销售力! | 袋式过滤器,自清洗过滤器,保安过滤器,篮式过滤器,气体过滤器,全自动过滤器,反冲洗过滤器,管道过滤器,无锡驰业环保科技有限公司 | 炒货机-炒菜机-炒酱机-炒米机@霍氏机械| 挨踢网-大家的导航! | 污水提升器,污水提升泵,地下室排水,增压泵,雨水泵,智能供排水控制器-上海智流泵业有限公司 | 中国玩具展_玩具展|幼教用品展|幼教展|幼教装备展 | 净化车间装修_合肥厂房无尘室设计_合肥工厂洁净工程装修公司-安徽盛世和居装饰 | 楼承板-开闭口楼承板-无锡海逵楼承板| 陕西安玻璃自动感应门-自动重叠门-磁悬浮平开门厂家【捷申达门业】 | 全自动贴标机-套标机-工业热风机-不干胶贴标机-上海厚冉机械 | 锤式粉碎机,医药粉碎机,锥式粉碎机-无锡市迪麦森机械制造有限公司 | 南京展台搭建-南京展会设计-南京展览设计公司-南京展厅展示设计-南京汇雅展览工程有限公司 |