中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
Spark SQL大數據分析快速上手

包郵 Spark SQL大數據分析快速上手

出版社:清華大學出版社出版時間:2024-11-01
開本: 16開 頁數: 228
中 圖 價:¥62.3(7.0折) 定價  ¥89.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Spark SQL大數據分析快速上手 版權信息

  • ISBN:9787302674863
  • 條形碼:9787302674863 ; 978-7-302-67486-3
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

Spark SQL大數據分析快速上手 本書特色

《Spark SQL大數據分析快速上手》幫助讀者快速提高Spark 大數據分析技能,內容包括: Spark SQL發展背景、Spark的典型數據容器及關系、Spark開發環境搭建、Spark典型數據結構RDD。 Spark SQL入門實戰(包括Scala編程基礎)、SQL基礎語法、操作多數據源、Spark SQL性能調優。 影評數據分析、商品統計數據分析、咖啡銷售數據分析3個實戰項目。

Spark SQL大數據分析快速上手 內容簡介

本書內容基于Spark新版本展開,符合企業目前開發需要。本書面講解Spark SQL相關知識和實戰應用,各章均提供較為豐富的案例及其詳細的操作步驟,并配套示例源碼、數據集、PPT課件和教學大綱。
本書共10章。第1~3章為Spark SQL的基礎準備部分,內容包括Spark SQL的發展和簡介、Spark的典型數據容器及關系、Spark概述與環境搭建、Spark典型數據結構RDD;第4~7章為Spark SQL的基礎應用部分,內容包括Spark SQL入門實戰(包括Scala編程基礎)、SQL基礎語法、操作多數據源、Spark SQL性能調優等;第8~10章分別通過影評數據分析、商品統計數據分析、咖啡銷售數據分析等3個實戰項目進行鞏固提升。
本書內容翔實、示例豐富,既可作為Spark初學者、大數據分析人員、大數據應用開發人員的自學手冊,也可作為高等院校或高職高專院校計算機、軟件工程、數據科學與大數據技術、智能科學與技術、人工智能等專業大數據課程的教材。

Spark SQL大數據分析快速上手 目錄

目 錄 第 1 章 Spark SQL概述 1 1.1 Spark SQL簡介 1 1.1.1 什么是Spark SQL 1 1.1.2 Spark SQL的特點 2 1.2 Spark數據容器 4 1.2.1 什么是DataFrame 4 1.2.2 什么是DataSet 5 1.2.3 Spark SQL與DataFrame 6 1.2.4 DataFrame與RDD的差異 6 第 2 章 Spark概述及環境搭建 8 2.1 Spark概述 8 2.1.1 關于Spark 8 2.1.2 Spark的基本概念 9 2.1.3 Spark集群相關知識 11 2.2 Linux環境搭建 16 2.2.1 VirtualBox虛擬機的安裝 16 2.2.2 安裝Linux操作系統 18 2.2.3 SSH工具與使用 24 2.2.4 Linux的統一設置 26 2.3 Hadoop完全分布式環境搭建 28 2.4 Spark的安裝與配置 33 2.4.1 本地模式安裝 34 2.4.2 偽分布模式安裝 36 2.4.3 完全分布模式安裝 39 2.4.4 Spark on YARN 41 2.5 Spark的任務提交 45 2.5.1 使用spark-submit提交 45 2.5.2 spark-submit參數說明 46 第 3 章 Spark的典型數據結構RDD 49 3.1 什么是RDD 49 3.2 RDD的主要屬性 50 3.3 RDD的特點 51 3.4 RDD的創建與處理過程 54 3.4.1 RDD的創建 55 3.4.2 RDD的處理過程 55 3.4.3 RDD的算子 56 第 4 章 Spark SQL入門實戰 65 4.1 DataFrame和DataSet實戰體驗 65 4.1.1 SparkSession 65 4.1.2 DataFrame應用 66 4.1.3 DataSet應用 72 4.1.4 DataFrame和DataSet之間的交互 74 4.2 Scala開發環境搭建及其基礎編程 74 4.2.1 開發環境搭建 75 4.2.2 Scala基礎編程 78 4.3 Spark SQL實戰入門體驗 94 第 5 章 Spark SQL語法基礎及應用 101 5.1 Hive安裝與元數據存儲配置 101 5.1.1 安裝Hive 101 5.1.2 配置MySQL存儲元數據 104 5.2 Spark SQL DML語句 107 5.2.1 插入數據 107 5.2.2 加載數據 110 5.3 Spark SQL查詢語句 111 5.4 Spark SQL函數操作 115 5.4.1 內置函數及使用 115 5.4.2 自定義函數 126 第 6 章 Spark SQL數據源 131 6.1 Spark SQL數據加載、存儲概述 131 6.1.1 通用load/save函數 131 6.1.2 手動指定選項 133 6.1.3 在文件上直接進行SQL查詢 133 6.1.4 存儲模式 133 6.1.5 持久化到表 134 6.1.6 桶、排序、分區操作 135 6.2 Spark SQL常見結構化數據源 135 6.2.1 Parquet文件 135 6.2.2 JSON 數據集 140 6.2.3 Hive表 141 6.2.4 其他關系數據庫中的數據表 144 第 7 章 Spark SQL性能調優 148 7.1 Spark執行流程 148 7.2 Spark內存管理 149 7.3 Spark的一些概念 150 7.4 Spark開發原則 151 7.5 Spark調優方法 157 7.6 數據傾斜調優 168 7.7 Spark執行引擎Tungsten簡介 172 7.8 Spark SQL解析引擎Catalyst簡介 173 第 8 章 Spark SQL影評大數據分析項目實戰 177 8.1 項目介紹 177 8.2 項目實現 179 8.2.1 引入依賴 179 8.2.2 公共類開發 184 8.2.3 需求1的實現 187 8.2.4 需求2的實現 191 8.2.5 需求3的實現 194 第 9 章 Spark SQL商品統計分析項目實戰 198 9.1 項目介紹 198 9.2 項目實現 201 9.2.1 引入依賴 201 9.2.2 環境測試 202 9.2.3 Spark SQL初始化數據 203 9.2.4 Spark SQL商品數據分析 206 第 10 章 Spark SQL咖啡銷售數據分析項目實戰 211 10.1 項目介紹 211 10.2 數據預處理與數據分析 212 10.2.1 查看咖啡銷售量排名 213 10.2.2 觀察咖啡銷售量的分布情況 214 10.3 數據可視化 218
展開全部

Spark SQL大數據分析快速上手 作者簡介

遲殿委,計算機軟件與理論專業碩士,系統架構設計師。有多年企業軟件研發經驗和豐富的JavaEE、大數據技術培訓經驗,熟練掌握JavaEE與大數據全棧技術框架,擅長JavaEE系統架構設計、大數據分析與挖掘。著有圖書《Hive入門與大數據分析實戰》《Hadoop大數據分析技術》《Hadoop Spark大數據分析實戰》《Spring Boot企業級開發實戰(視頻教學版)》《深入淺出Java編程》《Spring Boot Spring Cloud微服務開發》。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 翻斗式矿车|固定式矿车|曲轨侧卸式矿车|梭式矿车|矿车配件-山东卓力矿车生产厂家 | 门禁卡_智能IC卡_滴胶卡制作_硅胶腕带-卡立方rfid定制厂家 | 膜结构_ETFE膜结构_膜结构厂家_膜结构设计-深圳市烨兴智能空间技术有限公司 | 谈股票-今日股票行情走势分析-牛股推荐排行榜 | 进口消泡剂-道康宁消泡剂-陶氏消泡剂-大洋消泡剂 | 苗木价格-苗木批发-沭阳苗木基地-沭阳花木-长之鸿园林苗木场 | 低浓度恒温恒湿称量系统,强光光照培养箱-上海三腾仪器有限公司 | 电渗析,废酸回收,双极膜-山东天维膜技术有限公司 | 高温链条油|高温润滑脂|轴承润滑脂|机器人保养用油|干膜润滑剂-东莞卓越化学 | 剪刃_纵剪机刀片_分条机刀片-南京雷德机械有限公司 | 青岛空压机,青岛空压机维修/保养,青岛空压机销售/出租公司,青岛空压机厂家电话 | 合肥弱电工程_安徽安防工程_智能化工程公司-合肥雷润 | 过滤器_自清洗过滤器_气体过滤器_苏州华凯过滤技术有限公司 | 雷冲击高压发生器-水内冷直流高压发生器-串联谐振分压器-武汉特高压电力科技有限公司 | 胶原检测试剂盒,弹性蛋白检测试剂盒,类克ELISA试剂盒,阿达木单抗ELISA试剂盒-北京群晓科苑生物技术有限公司 | 成都APP开发-成都App定制-成都app开发公司-【未来久】 | 达利园物流科技集团- | 冰晶石|碱性嫩黄闪蒸干燥机-有机垃圾烘干设备-草酸钙盘式干燥机-常州市宝康干燥 | 消泡剂_水处理消泡剂_切削液消泡剂_涂料消泡剂_有机硅消泡剂_广州中万新材料生产厂家 | 三轴曲线机-端子插拔力试验机|华杰仪器 | 上海单片机培训|重庆曙海培训分支机构—CortexM3+uC/OS培训班,北京linux培训,Windows驱动开发培训|上海IC版图设计,西安linux培训,北京汽车电子EMC培训,ARM培训,MTK培训,Android培训 | 上海诺狮景观规划设计有限公司 | 路面机械厂家 | elisa试剂盒-PCR试剂盒「上海谷研实业有限公司」 | 过滤器_自清洗过滤器_气体过滤器_苏州华凯过滤技术有限公司 | 药品仓库用除湿机-变电站用防爆空调-油漆房用防爆空调-杭州特奥环保科技有限公司 | 自动化改造_智虎机器人_灌装机_贴标机-上海圣起包装机械 | 称重传感器,测力传感器,拉压力传感器,压力变送器,扭矩传感器,南京凯基特电气有限公司 | 武汉高低温试验箱_恒温恒湿试验箱厂家-武汉蓝锐环境科技有限公司 | 板框压滤机-隔膜压滤机-厢式压滤机生产厂家-禹州市君工机械设备有限公司 | sus630/303cu不锈钢棒,440C/430F/17-4ph不锈钢研磨棒-江苏德镍金属科技有限公司 | 电子元器件呆滞料_元器件临期库存清仓尾料_尾料优选现货采购处理交易商城 | 偏心半球阀-电动偏心半球阀-调流调压阀-旋球阀-上欧阀门有限公司 | 带式过滤机厂家_价格_型号规格参数-江西核威环保科技有限公司 | 大型多片锯,圆木多片锯,方木多片锯,板材多片锯-祥富机械有限公司 | 污泥烘干机-低温干化机-工业污泥烘干设备厂家-焦作市真节能环保设备科技有限公司 | 退火炉,燃气退火炉,燃气热处理炉生产厂家-丹阳市丰泰工业炉有限公司 | 塑胶跑道施工-硅pu篮球场施工-塑胶网球场建造-丙烯酸球场材料厂家-奥茵 | 西安展台设计搭建_西安活动策划公司_西安会议会场布置_西安展厅设计西安旭阳展览展示 | 防爆暖风机_防爆电暖器_防爆电暖风机_防爆电热油汀_南阳市中通智能科技集团有限公司 | 净水器代理,净水器招商,净水器加盟-FineSky德国法兹全屋净水 |