中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
Spark SQL入門與實踐指南

包郵 Spark SQL入門與實踐指南

出版社:清華大學出版社出版時間:2018-04-01
開本: 16開 頁數: 200
中 圖 價:¥30.4(6.2折) 定價  ¥49.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

Spark SQL入門與實踐指南 版權信息

  • ISBN:9787302496700
  • 條形碼:9787302496700 ; 978-7-302-49670-0
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

Spark SQL入門與實踐指南 本書特色

Spark SQL是 Spark大數據框架的一部分,支持使用標準SQL查詢和HiveQL來讀寫數據,可用于結構化數據處理,并可以執行類似SQL的Spark數據查詢,有助于開發人員更快地創建和運行Spark程序。全書分為4篇,共9章,*篇講解了Spark SQL 發展歷史和開發環境搭建。第二篇講解了Spark SQL 實例,使得讀者掌握Spark SQL的入門操作,了解Spark RDD、DataFrame和DataSet,并熟悉 DataFrame 各種操作。第三篇講解了基于WiFi探針的商業大數據分析項目,實例中包含數據采集、預處理、存儲、利用Spark SQL 挖掘數據,一步一步帶領讀者學習Spark SQL強大的數據挖掘功能。第四篇講解了Spark SQL 優化的知識。本書適合Spark初學者、Spark數據分析人員以及Spark程序開發人員,也適合高校和培訓學校相關專業的師生教學參考。

Spark SQL入門與實踐指南 內容簡介

(1)講解Spark SQL背景知識、編程基礎(2)通過一個工程實例讓讀者領略Spark SQL強大簡便的分析能力(3)學習構建一個大數據實際應用的方法,加強工程思維(4)洞悉Spark的調優方式及其思想,讓Spark SQL程序高效運行

Spark SQL入門與實踐指南 目錄

目 錄 **部分 入門篇 第1章 初識Spark SQL 3 1.1 Spark SQL的前世今生 3 1.2 Spark SQL能做什么 4 第2章 Spark安裝、編程環境搭建以及打包提交 6 2.1 Spark的簡易安裝 6 2.2 準備編寫Spark應用程序的IDEA環境 10 2.3 將編寫好的Spark應用程序打包成jar提交到Spark上 18 第二部分 基礎篇 第3章 Spark上的RDD編程 23 3.1 RDD基礎 24 3.1.1 創建RDD 24 3.1.2 RDD轉化操作、行動操作 24 3.1.3 惰性求值 25 3.1.4 RDD緩存概述 26 3.1.5 RDD基本編程步驟 26 3.2 RDD簡單實例—wordcount 27 3.3 創建RDD 28 3.3.1 程序內部數據作為數據源 28 3.3.2 外部數據源 29 3.4 RDD操作 33 3.4.1 轉化操作 34 3.4.2 行動操作 37 3.4.3 惰性求值 38 3.5 向Spark傳遞函數 39 3.5.1 傳入匿名函數 39 3.5.2 傳入靜態方法和傳入方法的引用 40 3.5.3 閉包的理解 41 3.5.4 關于向Spark傳遞函數與閉包的總結 42 3.6 常見的轉化操作和行動操作 42 3.6.1 基本RDD轉化操作 43 3.6.2 基本RDD行動操作 48 3.6.3 鍵值對RDD 52 3.6.4 不同類型RDD之間的轉換 56 3.7 深入理解RDD 57 3.8 RDD 緩存、持久化 59 3.8.1 RDD緩存 59 3.8.2 RDD持久化 61 3.8.3 持久化存儲等級選取策略 63 3.9 RDD checkpoint容錯機制 64 第4章 Spark SQL編程入門 66 4.1 Spark SQL概述 66 4.1.1 Spark SQL是什么 66 4.1.2 Spark SQL通過什么來實現 66 4.1.3 Spark SQL 處理數據的優勢 67 4.1.4 Spark SQL數據核心抽象——DataFrame 67 4.2 Spark SQL編程入門示例 69 4.2.1 程序主入口:SparkSession 69 4.2.2 創建 DataFrame 70 4.2.3 DataFrame基本操作 70 4.2.4 執行SQL查詢 72 4.2.5 全局臨時表 73 4.2.6 Dataset 73 4.2.7 將RDDs轉化為DataFrame 75 4.2.8 用戶自定義函數 78 第5章 Spark SQL的DataFrame操作大全 82 5.1 由JSON文件生成所需的DataFrame對象 82 5.2 DataFrame上的行動操作 84 5.3 DataFrame上的轉化操作 91 5.3.1 where條件相關 92 5.3.2 查詢指定列 94 5.3.3 思維開拓:Column的巧妙應用 99 5.3.4 limit操作 102 5.3.5 排序操作:order by和sort 103 5.3.6 group by操作 106 5.3.7 distinct、dropDuplicates去重操作 107 5.3.8 聚合操作 109 5.3.9 union合并操作 110 5.3.10 join操作 111 5.3.11 獲取指定字段統計信息 114 5.3.12 獲取兩個DataFrame中共有的記錄 116 5.3.13 獲取一個DataFrame中有另一個DataFrame中沒有的記錄 116 5.3.14 操作字段名 117 5.3.15 處理空值列 118 第6章 Spark SQL支持的多種數據源 121 6.1 概述 121 6.1.1 通用load/save 函數 121 6.1.2 手動指定選項 123 6.1.3 在文件上直接進行SQL查詢 123 6.1.4 存儲模式 123 6.1.5 持久化到表 124 6.1.6 bucket、排序、分區操作 124 6.2 典型結構化數據源 125 6.2.1 Parquet 文件 125 6.2.2 JSON 數據集 129 6.2.3 Hive表 130 6.2.4 其他數據庫中的數據表 133 第三部分 實踐篇 第7章 Spark SQL 工程實戰之基于WiFi探針的商業大數據分析技術 139 7.1 功能需求 139 7.1.1 數據收集 139 7.1.2 數據清洗 140 7.1.3 客流數據分析 141 7.1.4 數據導出 142 7.2 系統架構 142 7.3 功能設計 143 7.4 數據庫結構 144 7.5 本章小結 144 第8章 **個Spark SQL應用程序 145 8.1 完全分布式環境搭建 145 8.1.1 Java 環境配置 145 8.1.2 Hadoop 安裝配置 146 8.1.3 Spark安裝配置 149 8.2 數據清洗 150 8.3 數據處理流程 153 8.4 Spark程序遠程調試 164 8.4.1 導出jar包 164 8.4.2 IDEA配置 168 8.4.3 服務端配置 170 8.5 Spark的Web界面 171 8.6 本章小結 172 第四部分 優化篇 第9章 讓Spark程序再快一點 175 9.1 Spark執行流程 175 9.2 Spark內存簡介 176 9.3 Spark的一些概念 177 9.4 Spark編程四大守則 178 9.5 Spark調優七式 183 9.6 解決數據傾斜問題 192 9.7 Spark 執行引擎 Tungsten 簡介 195 9.8 Spark SQL解析引擎Catalyst 簡介 197 9.9 本章小結 200
展開全部

Spark SQL入門與實踐指南 作者簡介

紀 涵,數據挖掘、云計算愛好者,曾負責多個中小型網站的開發維護工作,曾參與開發設計多款面向校園服務的App,參與開發設計過多個基于Hadoop、Spark平臺的大數據應用,有著豐富的流數據、結構化數據處理經驗,現主要研究方向為機器學習、數據挖掘。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 离子色谱自动进样器-青岛艾力析实验科技有限公司 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 卷筒电缆-拖链电缆-特种柔性扁平电缆定制厂家「上海缆胜」 | 压滤机-洗沙泥浆处理-压泥机-山东创新华一环境工程有限公司 | 萃取箱-萃取槽-PVC萃取箱厂家-混合澄清槽- 杭州南方化工设备 | PSI渗透压仪,TPS酸度计,美国CHAI PCR仪,渗透压仪厂家_价格,微生物快速检测仪-华泰和合(北京)商贸有限公司 | 河南中整光饰机械有限公司-抛光机,去毛刺抛光机,精密镜面抛光机,全自动抛光机械设备 | 螺杆泵_中成泵业| 防水试验机_防水测试设备_防水试验装置_淋雨试验箱-广州岳信试验设备有限公司 | 对照品_中药对照品_标准品_对照药材_「格利普」高纯中药标准品厂家-成都格利普生物科技有限公司 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 油漆辅料厂家_阴阳脚线_艺术漆厂家_内外墙涂料施工_乳胶漆专用防霉腻子粉_轻质粉刷石膏-魔法涂涂 | 篮球架_乒乓球台_足球门_校园_竞技体育器材_厂家_价格-沧州浩然体育器材有限公司 | 铝合金线槽_铝型材加工_空调挡水板厂家-江阴炜福金属制品有限公司 | BOE画框屏-触摸一体机-触控查询一体机-触摸屏一体机价格-厂家直销-触发电子 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 对夹式止回阀厂家,温州对夹式止回阀制造商--永嘉县润丰阀门有限公司 | 购买舔盐、舔砖、矿物质盐压块机,鱼饵、鱼饲料压块机--请到杜甫机械 | 浙江红酒库-冰雕库-气调库-茶叶库安装-医药疫苗冷库-食品物流恒温恒湿车间-杭州领顺实业有限公司 | 减速机三参数组合探头|TSM803|壁挂式氧化锆分析仪探头-安徽鹏宸电气有限公司 | ZHZ8耐压测试仪-上海胜绪电气有限公司 | 球磨机 选矿球磨机 棒磨机 浮选机 分级机 选矿设备厂家 | 木材烘干机,木炭烘干机,纸管/佛香烘干设备-河南蓝天机械制造有限公司 | 可程式恒温恒湿试验箱|恒温恒湿箱|恒温恒湿试验箱|恒温恒湿老化试验箱|高低温试验箱价格报价-广东德瑞检测设备有限公司 | 溶氧传感器-pH传感器|哈美顿(hamilton) | 电脑知识|软件|系统|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网 | 济南品牌设计-济南品牌策划-即合品牌策划设计-山东即合官网 | 英超直播_英超免费在线高清直播_英超视频在线观看无插件-24直播网 | 众品家具网-家具品牌招商_家具代理加盟_家具门户的首选网络媒体。 | 液压升降货梯_导轨式升降货梯厂家_升降货梯厂家-河南东圣升降设备有限公司 | 深圳办公室装修-写字楼装修设计-深圳标榜装饰公司 | 光栅尺_Magnescale探规_磁栅尺_笔式位移传感器_苏州德美达 | 路面机械厂家| 呼末二氧化碳|ETCO2模块采样管_气体干燥管_气体过滤器-湖南纳雄医疗器械有限公司 | 电子万能试验机_液压拉力试验机_冲击疲劳试验机_材料试验机厂家-济南众标仪器设备有限公司 | 贴片电容-贴片电阻-二三极管-国巨|三星|风华贴片电容代理商-深圳伟哲电子 | 注塑模具_塑料模具_塑胶模具_范仕达【官网】_东莞模具设计与制造加工厂家 | 直线模组_滚珠丝杆滑台_模组滑台厂家_万里疆科技 | 广东风淋室_广东风淋室厂家_广东风淋室价格_广州开源_传递窗_FFU-广州开源净化科技有限公司 | 恒温恒湿试验箱_高低温试验箱_恒温恒湿箱-东莞市高天试验设备有限公司 | 餐饮加盟网_特色餐饮连锁加盟店-餐饮加盟官网 | 氧化锆陶瓷_氧化锆陶瓷加工_氧化锆陶瓷生产厂家-康柏工业陶瓷有限公司 |