中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 Spark權威指南

出版社:中國電力出版社出版時間:2020-03-01
開本: 16開 頁數: 552
中 圖 價:¥67.6(5.3折) 定價  ¥128.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

Spark權威指南 版權信息

Spark權威指南 本書特色

通過本書你將了解到如何使用、部署和維護Apache Spark開源集群計算框架。本書由Spark的創始人所撰寫,重點介紹Spark*版本的新功能和新特點。本書將Spark功能分解為若干獨立主題來進行全面介紹。
本書的主要內容有:
大數據技術和Spark概述。
通過實例學習DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。
了解Spark如何在集群上運行。
Spark集群和應用程序的調試、監控、和調優。
學習Spark強大的流處理引擎——結構化流處理。通過本書你將了解到如何使用、部署和維護Apache Spark開源集群計算框架。本書由Spark的創始人所撰寫,重點介紹Spark*版本的新功能和新特點。本書將Spark功能分解為若干獨立主題來進行全面介紹。
本書的主要內容有:大數據技術和Spark概述。 通過實例學習DataFrame、SQL、Dataset等Spark的核心API。 了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。 了解Spark如何在集群上運行。 Spark集群和應用程序的調試、監控、和調優。 學習Spark強大的流處理引擎——結構化流處理。 學習MLlib并了解如何應用它解決包括分類、推薦,以及其他多種實際問題。

Spark權威指南 內容簡介

?大數據技術和Spark概述。?通過實例學習DataFrame、SQL、Dataset等Spark的核心API。?了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。?了解Spark如何在集群上運行。?Spark集群和應用程序的調試、監控、和調優。?學習Spark強大的流處理引擎——結構化流處理。?學習MLlib并了解如何應用它解決包括分類、推薦,以及其他多種實際問題。

Spark權威指南 目錄

目錄 前言1 第Ⅰ部分 大數據與Spark概述 第1章 Spark是什么? 9 Apache Spark的設計哲學 10 背景: 大數據問題12 Spark的歷史 12 Spark的現狀和未來 14 運行Spark 14 第2章 Spark淺析 18 Spark的基本架構18 Spark API的多語言支持 20 Spark的API21 啟動Spark 21 轉換操作 24 動作操作 25 Spark用戶接口26 一個完整的例子 27 小結35 第3章 Spark工具集介紹 36 運行生產應用程序37 Dataset: 類型安全的結構化API 38 結構化流處理39 機器學習和高級數據分析 43 低級API48 SparkR 49 Spark的生態系統和工具包50 小結50 第Ⅱ部分 結構化API——DataFrame、 SQL和Dataset 第4章 結構化API概述 53 DataFrame類型和Dataset類型 54 Schema 54 結構化Spark類型概述 54 結構化API執行概述 61 小結63 第5章 基本的結構化操作 64 模式65 列和表達式66 記錄和行 69 DataFrame轉換操作70 小結86 第6章 處理不同的數據類型 87 在哪里查找API87 轉換成Spark類型89 處理布爾類型89 處理數值類型92 處理字符串類型 96 處理日期和時間戳類型 101 處理數據中的空值 106 處理JSON類型 113 用戶自定義函數 115 小結 119 第7章 聚合操作 120 聚合函數 122 分組 128 window函數 130 分組集 133 用戶自定義的聚合函數 138 小結 139 第8章 連接操作 140 連接表達式 140 連接類型 140 內連接 142 外連接 143 左外連接 143 右外連接 144 左半連接 144 左反連接 145 自然連接 146 交叉連接(笛卡爾連接) 146 連接操作常見問題與解決方案 147 小結 152 第9章 數據源 153 數據源 API 的結構 154 CSV 文件 156 JSON 文件 161 Parquet文件 163 ORC文件 164 SQL數據庫 165 文本文件 173 高級I/O概念 174 小結 177 第10章 Spark SQL 178 什么是 SQL? 178 大數據和SQL: Apache Hive 178 大數據和SQL: Spark SQL 179 如何運行Spark SQL 查詢 180 Catalog 182 視圖 187 數據庫 188 選擇語句 189 高級主題 190 其他功能 194 小結 195 第11章 Dataset 196 何時使用Dataset 197 創建Dataset 197 動作操作 199 轉換操作 199 連接 201 分組和聚合 202 小結 203 第Ⅲ部分 低級API 第12章 彈性分布式數據集 207 什么是低級API? 207 關于RDD 208 創建RDD 210 操作RDD 212 轉換操作 213 動作操作 215 保存文件 218 緩存 219 檢查點 220 通過pipe方法調用系統命令操作RDD 220 小結 222 第13章 高級RDD 223 Key-Value基礎 (Key-Value RDD)224 聚合操作 226 CoGroups 230 連接操作 231 控制分區 232 自定義序列化 235 小結 236 第14章 分布式共享變量 237 廣播變量 237 累加器 239 小結 243 第Ⅳ部分 生產與應用 第15章 Spark如何在集群上運行 247 Spark應用程序的體系結構 247 Spark應用程序的生命周期( Spark外部) 250 Spark應用程序的生命周期( Spark內部) 253 執行細節 258 小結 259 第16章 開發Spark應用程序 260 編寫Spark應用程序 260 測試Spark應用程序 265 開發過程 268 啟動應用程序 268 配置應用程序 271 小結 278 第17章 部署Spark 279 在哪里部署Spark集群 280 集群管理器 282 其他注意事項 288 小結 289 第18章 監控與調試 290 監控級別 290 要監視什么 291 Spark日志 292 Spark UI 293 調試和Spark搶救方案 301 小結 311 第19章 性能調優 312 間接性能優化 313 直接性能優化 320 小結 325 第Ⅴ部分 流處理 第20章 流處理基礎 329 什么是流處理? 330 流處理設計要點 334 Spark的流處理API 336 小結 338 第21章 結構化流處理基礎 339 結構化流處理概述 339 核心概念 340 結構化流處理實例 343 結構化流上的轉換操作 347 聚合 348 輸入和輸出 349 流式Dataset API 358 小結 359 第22章 事件時間和有狀態處理 360 事件時間 360 有狀態處理 362 任意有狀態處理 362 事件時間基礎知識 363 事件時間的窗口 363 在流中刪除重復項 370 任意有狀態處理 371 小結 380 第23章 生產中的結構化流處理 381 容錯和檢查點 381 更新應用程序 382 度量和監視 384 警報 386 使用流偵聽器進行高級監視 387 小結 388 第Ⅵ部分 高級分析與機器學習 第24章 高級分析和機器學習概覽 391 高級分析簡介 392 Spark的高級分析工具包 399 高級MLlib概念 400 MLlib的執行 402 部署模式 412 小結 413 第25章 預處理和特征工程 414 根據應用場景格式化模型 414 轉換器 416 預處理的估計器 417 高級轉換器 418 處理連續型特征 422 使用類別特征 428 文本數據轉換器 431 特征操作 440 特征選擇 442 高級主題 443 編寫自定義轉換器 444 小結 445 第26章 分類 446 應用場景 446 分類的類型 446 MLlib中的分類模型 447 邏輯回歸 449 決策樹 452 隨機森林和梯度提升樹 454 樸素貝葉斯 456 分類評估器和自動化模型校正 457 One-vs-Rest分類 459 多層感知器 459 小結 459 第27章 回歸 460 應用場景 460 MLlib中的回歸模型 461 線性回歸 462 廣義線性回歸 464 決策樹 466 隨機森林和梯度提升樹 467 高級方法 468 評估器和自動化模型校正 469 度量標準 470 小結 471 第28章 推薦系統 472 應用場景 472 基于交替*小二乘法的協同過濾 473 推薦系統的評估器 476 度量指標 477 頻繁模式挖掘 479 小結 479 第29章 無監督學習 480 應用場景 480 模型的可擴展性 481 k-means 482 二分k-means 484 高斯混合模型 485 LDA主題模型 487 小結 490 第30章 圖分析 491 構建圖 493 查詢圖 495 模式發現 496 圖算法 498 小結 504 第31章 深度學習 505 什么是深度學習? 505 在Spark中使用深度學習 506 深度學習庫 508 Deep Learning Pipelines的一個簡單示例 510 小結 514 第Ⅶ部分 生態系統 第32章 語言支持: Python(PySpark)和R(SparkR和 Sparklyr) 517 PySpark 518 Spark 中的R 519 小結 529 第33章 生態系統和社區 530 Spark軟件包 530 社區 533 小結 534
展開全部

Spark權威指南 作者簡介

Bill Chambers是Databricks的一名產品經理,致力于使用Spark和Databricks幫助客戶完成大規模數據分析的任務。Bill還定期寫關于數據科學和大數據方面的博客, 并常在各種會議和見面會上展示產品。他擁有加州大學伯克利分校信息學院的信息系統碩士學位, 研究方向為數據科學。Matei Zaharia是斯坦福大學計算機科學系助理教授和Databricks的首席技術官。他于2009年在加州大學伯克利分校創立了Spark項目, 那時他是一名博士生, 并繼續擔任Apache Spark項目的副主席。Matei Zaharia還是Apache Mesos項目的聯合創始人,也是Apache Hadoop項目的貢獻者。Matei Zaharia以他出色的研究工作獲得了2014年美國計算機學會博士論文獎和VMware系統研究獎。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 恒温恒湿箱(药品/保健品/食品/半导体/细菌)-兰贝石(北京)科技有限公司 | 万博士范文网-您身边的范文参考网站Vanbs.com | 板式换网器_柱式换网器_自动换网器-郑州海科熔体泵有限公司 | 石牌坊价格石牌坊雕刻制作_石雕牌坊牌楼石栏杆厂家_山东嘉祥石雕有限公司 | 百方网-百方电气网,电工电气行业专业的B2B电子商务平台 | 湖北省煤炭供应链综合服务平台 | 洛阳网站建设_洛阳网站优化_网站建设平台_洛阳香河网络科技有限公司 | 深圳公司注册-工商注册公司-千百顺代理记账公司 | 钢托盘,钢制托盘,立库钢托盘,金属托盘制造商_南京飞天金属制品实业有限公司 | 河南中专学校|职高|技校招生-河南中职中专网 | 连栋温室大棚建造厂家-智能玻璃温室-薄膜温室_青州市亿诚农业科技 | 硬质合金模具_硬质合金非标定制_硬面加工「生产厂家」-西迪技术股份有限公司 | 定制液氮罐_小型气相液氮罐_自增压液氮罐_班德液氮罐厂家 | 烟雾净化器-滤筒除尘器-防爆除尘器-除尘器厂家-东莞执信环保科技有限公司 | 中红外QCL激光器-其他连续-半导体连续激光器-筱晓光子 | 柴油发电机组_柴油发电机_发电机组价格-江苏凯晨电力设备有限公司 | 冷水机-工业冷水机-冷水机组-欧科隆品牌保障| 双杰天平-国产双杰电子天平-美国双杰-常熟双杰仪器 | 液氮罐_液氮容器_自增压液氮罐_杜瓦瓶_班德液氮罐厂家 | 缠绕机|缠绕膜包装机|缠绕包装机-上海晏陵智能设备有限公司 | 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 - 杭州标识标牌|文化墙|展厅|导视|户内外广告|发光字|灯箱|铭阳制作公司 | 天津次氯酸钠酸钙溶液-天津氢氧化钠厂家-天津市辅仁化工有限公司 | 【星耀裂变】_企微SCRM_任务宝_视频号分销裂变_企业微信裂变增长_私域流量_裂变营销 | 焊管生产线_焊管机组_轧辊模具_焊管设备_焊管设备厂家_石家庄翔昱机械 | 冲锋衣滑雪服厂家-冲锋衣定制工厂-滑雪服加工厂-广东睿牛户外(S-GERT) | 车辆定位管理系统_汽车GPS系统_车载北斗系统 - 朗致物联 | 空心明胶胶囊|植物胶囊|清真胶囊|浙江绿键胶囊有限公司欢迎您! | 北京晚会活动策划|北京节目录制后期剪辑|北京演播厅出租租赁-北京龙视星光文化传媒有限公司 | 北京办公室装修,办公室设计,写字楼装修-北京金视觉装饰工程公司 北京成考网-北京成人高考网 | 温湿度记录纸_圆盘_横河记录纸|霍尼韦尔记录仪-广州汤米斯机电设备有限公司 | 上海噪音治理公司-专业隔音降噪公司-中广通环保 | 水厂自动化|污水处理中控系统|水利信息化|智慧水务|智慧农业-山东德艾自动化科技有限公司 | 冻干机(冷冻干燥机)_小型|实验型|食品真空冷冻干燥机-松源 | 煤棒机_增碳剂颗粒机_活性炭颗粒机_木炭粉成型机-巩义市老城振华机械厂 | 电动葫芦-河北悍象起重机械有限公司 | 青岛代理记账_青岛李沧代理记账公司_青岛崂山代理记账一个月多少钱_青岛德辉财税事务所官网 | 北京京云律师事务所| led冷热冲击试验箱_LED高低温冲击试验箱_老化试验箱-爱佩百科 | 深圳标识制作公司-标识标牌厂家-深圳广告标识制作-玟璟广告-深圳市玟璟广告有限公司 | 全球化工设备网—化工设备,化工机械,制药设备,环保设备的专业网络市场。 | 婚博会2024时间表_婚博会门票领取_婚博会地址-婚博会官网 |