中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據技術與應用叢書SPARK大數據分析與實戰

包郵 大數據技術與應用叢書SPARK大數據分析與實戰

出版社:清華大學出版社出版時間:2018-03-01
開本: 其他 頁數: 228
本類榜單:教材銷量榜
中 圖 價:¥20.6(4.2折) 定價  ¥49.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>
買過本商品的人還買了

大數據技術與應用叢書SPARK大數據分析與實戰 版權信息

大數據技術與應用叢書SPARK大數據分析與實戰 本書特色

本書從初學者角度詳細介紹了Spark應用程序體系架構的核心技術,全書共9章。第1章詳細介紹開發Spark框架的Scala編程語言;第2~4、7~8章主要講解Spark核心基礎、SparkRDD彈性分布式數據集、Spark SQL處理結構化數據、Spark Streaming實時計算框架、Spark MLlib機器學習庫,并包含了搭建Spark集群、Spark集群的操作方式、利用Spark解決大數據工作中遇到的基本問題。第5~6章主要講解大數據環境中常見的輔助系統,HBase數據庫以及Kafka流處理平臺,包含輔助系統的搭建方式、使用方法以及相關底層實現的基本原理;第9章是一個綜合項目,利用Spark框架開發流式計算系統。掌握Spark相關技術,能夠很好地適應企業開發的技術需要,為離線、實時數據處理平臺的開發奠定基礎。 本書附有配套源代碼、教學PPT、題庫、教學視頻、教學補充案例、教學設計等資源。為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。 本書可作為高等院校本、?朴嬎銠C相關專業,大數據課程的專用教材,是一本適合廣大計算機編程愛好者的優秀讀物。

大數據技術與應用叢書SPARK大數據分析與實戰 內容簡介

本書從初學者角度詳細介紹了Spark應用程序體系架構的核心技術,全書共9章。章詳細介紹開發Spark框架的Scala編程語言;第2~4、7~8章主要講解Spark核心基礎、SparkRDD彈性分布式數據集、Spark SQL處理結構化數據、Spark Streaming實時計算框架、Spark MLlib機器學習庫,并包含了搭建Spark集群、Spark集群的操作方式、利用Spark解決大數據工作中遇到的基本問題。第5~6章主要講解大數據環境中常見的輔助系統,HBase數據庫以及Kafka流處理平臺,包含輔助系統的搭建方式、使用方法以及相關底層實現的基本原理;第9章是一個綜合項目,利用Spark框架開發流式計算系統。掌握Spark相關技術,能夠很好地適應企業開發的技術需要,為離線、實時數據處理平臺的開發奠定基礎。 本書附有配套源代碼、教學PPT、題庫、教學視頻、教學補充案例、教學設計等資源。為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。 本書可作為高等院校本、?朴嬎銠C相關專業,大數據課程的專用教材,是一本適合廣大計算機編程愛好者的很好讀物。

大數據技術與應用叢書SPARK大數據分析與實戰 目錄

目錄
第1章Scala語言基礎1
1.1初識Scala1
1.1.1Scala概述1
1.1.2Scala的下載安裝2
1.1.3在IDEA開發工具中下載安裝
Scala插件4
1.1.4開發**個Scala程序6
1.2Scala的基礎語法9
1.2.1聲明值和變量9
1.2.2數據類型9
1.2.3算術和操作符重載10
1.2.4控制結構語句10
1.2.5方法和函數13
1.3Scala的數據結構15
1.3.1數組15
1.3.2元組18
1.3.3集合19
1.4Scala面向對象的特性24
1.4.1類與對象24
1.4.2繼承25
1.4.3單例對象和伴生對象26
1.4.4特質28
1.5Scala的模式匹配與樣例類29
1.5.1模式匹配30
1.5.2樣例類31
1.6本章小結31
1.7課后習題32
第2章Spark基礎33
2.1初識Spark33目錄Spark大數據分析與實戰
2.1.1Spark概述33
2.1.2Spark的特點34
2.1.3Spark應用場景35
2.1.4Spark與Hadoop對比36
2.2搭建Spark開發環境37
2.2.1環境準備37
2.2.2Spark的部署方式37
2.2.3Spark集群安裝部署38
2.2.4Spark HA集群部署41
2.3Spark運行架構與原理45
2.3.1基本概念45
2.3.2Spark集群運行架構45
2.3.3Spark運行基本流程46
2.4體驗**個Spark程序47
2.5啟動SparkShell49
2.5.1運行SparkShell命令49
2.5.2運行SparkShell讀取HDFS文件50
2.6IDEA開發WordCount程序52
2.6.1以本地模式執行Spark程序52
2.6.2集群模式執行Spark程序54
2.7本章小結58
2.8課后習題59
第3章Spark RDD彈性分布式數據集60
3.1RDD簡介60
3.2RDD的創建方式61
3.2.1從文件系統加載數據創建RDD61
3.2.2通過并行集合創建RDD62
3.3RDD的處理過程63
3.3.1轉換算子63
3.3.2行動算子67
3.3.3編寫WordCount詞頻統計案例70
3.4RDD的分區71
3.5RDD的依賴關系71
3.6RDD機制73
3.6.1持久化機制73
3.6.2容錯機制75
3.7Spark的任務調度76
3.7.1DAG的概念76
3.7.2RDD在Spark中的運行流程76
3.8本章小結78
3.9課后習題78
第4章Spark SQL結構化數據文件處理80
4.1Spark SQL的基礎知識80
4.1.1Spark SQL的簡介80
4.1.2Spark SQL架構81
4.2DataFrame的基礎知識82
4.2.1DataFrame簡介82
4.2.2DataFrame的創建83
4.2.3DataFrame的常用操作86
4.3Dataset的基礎知識89
4.3.1Dataset簡介89
4.3.2Dataset對象的創建89
4.4RDD轉換為DataFrame90
4.4.1反射機制推斷Schema90
4.4.2編程方式定義Schema92
4.5Spark SQL操作數據源94
4.5.1操作MySQL94
4.5.2操作Hive數據集96
4.6本章小結99
4.7課后習題99
第5章HBase分布式數據庫101
5.1HBase的基礎知識101
5.1.1HBase的簡介101
5.1.2HBase的數據模型102
5.2HBase的集群部署103
5.3HBase的基本操作107
5.3.1HBase的Shell操作107
5.3.2HBase的Java API操作112
5.4深入學習HBase原理120
5.4.1HBase架構121
5.4.2物理存儲122
5.4.3尋址機制123
5.4.4HBase讀寫數據流程124
5.5HBase和Hive的整合125
5.6本章小結130
5.7課后習題130
第6章Kafka分布式發布訂閱消息系統132
6.1Kafka的基礎知識132
6.1.1消息傳遞模式簡介132
6.1.2Kafka簡介133
6.2Kafka工作原理134
6.2.1Kafka核心組件介紹134
6.2.2Kafka工作流程分析136
6.3Kafka集群部署與測試138
6.3.1安裝Kafka138
6.3.2啟動Kafka服務140
6.4Kafka生產者和消費者實例141
6.4.1基于命令行方式使用Kafka141
6.4.2基于Java API方式使用Kafka143
6.5Kafka Streams148
6.5.1Kafka Streams概述149
6.5.2Kafka Streams開發單詞計數應用149
6.6本章小結153
6.7課后習題153
第7章Spark Streaming實時計算框架155
7.1實時計算的基礎知識155
7.1.1什么是實時計算155
7.1.2常用的實時計算框架155
7.2Spark Streaming的基礎知識156
7.2.1Spark Streaming簡介156
7.2.2Spark Streaming工作原理157
7.3Spark的DStream157
7.3.1DStream簡介157
7.3.2DStream編程模型158
7.3.3DStream轉換操作158
7.3.4DStream窗口操作164
7.3.5DStream輸出操作168
7.3.6DStream實例——實現網站熱詞排序170
7.4Spark Streaming整合Kafka實戰173
7.4.1KafkaUtils.createDstream方式173
7.4.2KafkaUtils.createDirectStream方式177
7.5本章小結180
7.6課后習題180
第8章Spark MLlib 機器學習算法庫182
8.1初識機器學習182
8.1.1什么是機器學習182
8.1.2機器學習的應用183
8.2Spark機器學習庫MLlib的概述184
8.2.1MLlib的簡介184
8.2.2Spark機器學習工作流程185
8.3數據類型186
8.3.1本地向量186
8.3.2標注點186
8.3.3本地矩陣187
8.4Spark MLlib基本統計188
8.4.1摘要統計188
8.4.2相關統計189
8.4.3分層抽樣190
8.5分類191
8.5.1線性支持向量機191
8.5.2邏輯回歸192
8.6案例——構建推薦系統193
8.6.1推薦模型分類194
8.6.2利用MLlib實現電影推薦194
8.7本章小結200
8.8課后習題200
第9章綜合案例——Spark實時交易數據統計202
9.1系統概述202
9.1.1系統背景介紹202
9.1.2系統架構設計202
9.1.3系統預覽203
9.2Redis數據庫203
9.2.1Redis介紹204
9.2.2Redis部署與啟動204
9.2.3Redis操作及命令205
9.3模塊開發——構建工程結構206
9.4模塊開發——構建訂單系統211
9.4.1模擬訂單數據211
9.4.2向Kafka集群發送訂單數據212
9.5模塊開發——分析訂單數據215
9.6模塊開發——數據展示219
9.6.1搭建Web開發環境219
9.6.2實現數據展示功能221
9.6.3可視化平臺展示227
9.7本章小結228
展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: RS系列电阻器,RK_RJ启动调整电阻器,RQ_RZ电阻器-上海永上电器有限公司 | 污水处理设备维修_污水处理工程改造_机械格栅_过滤设备_气浮设备_刮吸泥机_污泥浓缩罐_污水处理设备_污水处理工程-北京龙泉新禹科技有限公司 | 快速门厂家-快速卷帘门-工业快速门-硬质快速门-西朗门业 | 呼末二氧化碳|ETCO2模块采样管_气体干燥管_气体过滤器-湖南纳雄医疗器械有限公司 | 酒店厨房设计_中央厨房设计_北京商用厨房设计公司-奇能商厨 | 硬度计_影像测量仪_维氏硬度计_佛山市精测计量仪器设备有限公司厂家 | 碳纤维布-植筋胶-灌缝胶-固特嘉加固材料公司 | 呼末二氧化碳|ETCO2模块采样管_气体干燥管_气体过滤器-湖南纳雄医疗器械有限公司 | 合同书格式和范文_合同书样本模板_电子版合同,找范文吧 | 同学聚会纪念册制作_毕业相册制作-成都顺时针宣传画册设计公司 | 东莞市天进机械有限公司-钉箱机-粘箱机-糊箱机-打钉机认准东莞天进机械-厂家直供更放心! | 防爆鼓风机-全风-宏丰鼓风机-上海梁瑾机电设备有限公司 | 山东聚盛新型材料有限公司-纳米防腐隔热彩铝板和纳米防腐隔热板以及钛锡板、PVDF氟膜板供应商 | 编织人生 - 权威手工编织网站,编织爱好者学习毛衣编织的门户网站,织毛衣就上编织人生网-编织人生 | GEDORE扭力螺丝刀-GORDON防静电刷-CHEMTRONICS吸锡线-上海卓君电子有限公司 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 亿诺千企网-企业核心产品贸易| 量子管通环-自清洗过滤器-全自动反冲洗过滤器-北京罗伦过滤技术集团有限公司 | 超声波电磁流量计-液位计-孔板流量计-料位计-江苏信仪自动化仪表有限公司 | 青岛代理记账_青岛李沧代理记账公司_青岛崂山代理记账一个月多少钱_青岛德辉财税事务所官网 | 防腐木批发价格_深圳_惠州_东莞防腐木厂家_森源(深圳)防腐木有限公司 | STRO|DTRO-STRO反渗透膜(科普)_碟滤 | 苏州柯瑞德货架-仓库自动化改造解决方案 | 小型气象站_车载气象站_便携气象站-山东风途物联网 | 上海深蓝_缠绕机_缠膜机-上海深蓝机械装备有限公司 | 聚合氯化铝厂家-聚合氯化铝铁价格-河南洁康环保科技 | 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | 真空泵维修保养,普发,阿尔卡特,荏原,卡西亚玛,莱宝,爱德华干式螺杆真空泵维修-东莞比其尔真空机电设备有限公司 | 北京开业庆典策划-年会活动策划公司-舞龙舞狮团大鼓表演-北京盛乾龙狮鼓乐礼仪庆典策划公司 | 特种电缆厂家-硅橡胶耐高温电缆-耐低温补偿导线-安徽万邦特种电缆有限公司 | 济宁工业提升门|济宁电动防火门|济宁快速堆积门-济宁市统一电动门有限公司 | 盐城网络公司_盐城网站优化_盐城网站建设_盐城市启晨网络科技有限公司 | hdpe土工膜-防渗膜-复合土工膜-长丝土工布价格-厂家直销「恒阳新材料」-山东恒阳新材料有限公司 ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 | 广域铭岛Geega(际嘉)工业互联网平台-以数字科技引领行业跃迁 | 高考志愿规划师_高考规划师_高考培训师_高报师_升学规划师_高考志愿规划师培训认证机构「向阳生涯」 | 新密高铝耐火砖,轻质保温砖价格,浇注料厂家直销-郑州荣盛窑炉耐火材料有限公司 | 【MBA备考网】-2024年工商管理硕士MBA院校/报考条件/培训/考试科目/提前面试/考试/学费-MBA备考网 | 上海新光明泵业制造有限公司-电动隔膜泵,气动隔膜泵,卧式|立式离心泵厂家 | 厂厂乐-汇聚海量采购信息的B2B微营销平台-厂厂乐官网 | 电销卡_稳定企业大语音卡-归属地可选-世纪通信 | 液氮罐_液氮容器_自增压液氮罐-北京君方科仪科技发展有限公司 |