中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 Spark權威指南

出版社:中國電力出版社出版時間:2020-03-01
開本: 16開 頁數: 552
中 圖 價:¥70.4(5.5折) 定價  ¥128.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

Spark權威指南 版權信息

Spark權威指南 本書特色

通過本書你將了解到如何使用、部署和維護Apache Spark開源集群計算框架。本書由Spark的創始人所撰寫,重點介紹Spark*版本的新功能和新特點。本書將Spark功能分解為若干獨立主題來進行全面介紹。
本書的主要內容有:
大數據技術和Spark概述。
通過實例學習DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。
了解Spark如何在集群上運行。
Spark集群和應用程序的調試、監控、和調優。
學習Spark強大的流處理引擎——結構化流處理。通過本書你將了解到如何使用、部署和維護Apache Spark開源集群計算框架。本書由Spark的創始人所撰寫,重點介紹Spark*版本的新功能和新特點。本書將Spark功能分解為若干獨立主題來進行全面介紹。
本書的主要內容有:大數據技術和Spark概述。 通過實例學習DataFrame、SQL、Dataset等Spark的核心API。 了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。 了解Spark如何在集群上運行。 Spark集群和應用程序的調試、監控、和調優。 學習Spark強大的流處理引擎——結構化流處理。 學習MLlib并了解如何應用它解決包括分類、推薦,以及其他多種實際問題。

Spark權威指南 內容簡介

?大數據技術和Spark概述。?通過實例學習DataFrame、SQL、Dataset等Spark的核心API。?了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。?了解Spark如何在集群上運行。?Spark集群和應用程序的調試、監控、和調優。?學習Spark強大的流處理引擎——結構化流處理。?學習MLlib并了解如何應用它解決包括分類、推薦,以及其他多種實際問題。

Spark權威指南 目錄

目錄 前言1 第Ⅰ部分 大數據與Spark概述 第1章 Spark是什么? 9 Apache Spark的設計哲學 10 背景: 大數據問題12 Spark的歷史 12 Spark的現狀和未來 14 運行Spark 14 第2章 Spark淺析 18 Spark的基本架構18 Spark API的多語言支持 20 Spark的API21 啟動Spark 21 轉換操作 24 動作操作 25 Spark用戶接口26 一個完整的例子 27 小結35 第3章 Spark工具集介紹 36 運行生產應用程序37 Dataset: 類型安全的結構化API 38 結構化流處理39 機器學習和高級數據分析 43 低級API48 SparkR 49 Spark的生態系統和工具包50 小結50 第Ⅱ部分 結構化API——DataFrame、 SQL和Dataset 第4章 結構化API概述 53 DataFrame類型和Dataset類型 54 Schema 54 結構化Spark類型概述 54 結構化API執行概述 61 小結63 第5章 基本的結構化操作 64 模式65 列和表達式66 記錄和行 69 DataFrame轉換操作70 小結86 第6章 處理不同的數據類型 87 在哪里查找API87 轉換成Spark類型89 處理布爾類型89 處理數值類型92 處理字符串類型 96 處理日期和時間戳類型 101 處理數據中的空值 106 處理JSON類型 113 用戶自定義函數 115 小結 119 第7章 聚合操作 120 聚合函數 122 分組 128 window函數 130 分組集 133 用戶自定義的聚合函數 138 小結 139 第8章 連接操作 140 連接表達式 140 連接類型 140 內連接 142 外連接 143 左外連接 143 右外連接 144 左半連接 144 左反連接 145 自然連接 146 交叉連接(笛卡爾連接) 146 連接操作常見問題與解決方案 147 小結 152 第9章 數據源 153 數據源 API 的結構 154 CSV 文件 156 JSON 文件 161 Parquet文件 163 ORC文件 164 SQL數據庫 165 文本文件 173 高級I/O概念 174 小結 177 第10章 Spark SQL 178 什么是 SQL? 178 大數據和SQL: Apache Hive 178 大數據和SQL: Spark SQL 179 如何運行Spark SQL 查詢 180 Catalog 182 視圖 187 數據庫 188 選擇語句 189 高級主題 190 其他功能 194 小結 195 第11章 Dataset 196 何時使用Dataset 197 創建Dataset 197 動作操作 199 轉換操作 199 連接 201 分組和聚合 202 小結 203 第Ⅲ部分 低級API 第12章 彈性分布式數據集 207 什么是低級API? 207 關于RDD 208 創建RDD 210 操作RDD 212 轉換操作 213 動作操作 215 保存文件 218 緩存 219 檢查點 220 通過pipe方法調用系統命令操作RDD 220 小結 222 第13章 高級RDD 223 Key-Value基礎 (Key-Value RDD)224 聚合操作 226 CoGroups 230 連接操作 231 控制分區 232 自定義序列化 235 小結 236 第14章 分布式共享變量 237 廣播變量 237 累加器 239 小結 243 第Ⅳ部分 生產與應用 第15章 Spark如何在集群上運行 247 Spark應用程序的體系結構 247 Spark應用程序的生命周期( Spark外部) 250 Spark應用程序的生命周期( Spark內部) 253 執行細節 258 小結 259 第16章 開發Spark應用程序 260 編寫Spark應用程序 260 測試Spark應用程序 265 開發過程 268 啟動應用程序 268 配置應用程序 271 小結 278 第17章 部署Spark 279 在哪里部署Spark集群 280 集群管理器 282 其他注意事項 288 小結 289 第18章 監控與調試 290 監控級別 290 要監視什么 291 Spark日志 292 Spark UI 293 調試和Spark搶救方案 301 小結 311 第19章 性能調優 312 間接性能優化 313 直接性能優化 320 小結 325 第Ⅴ部分 流處理 第20章 流處理基礎 329 什么是流處理? 330 流處理設計要點 334 Spark的流處理API 336 小結 338 第21章 結構化流處理基礎 339 結構化流處理概述 339 核心概念 340 結構化流處理實例 343 結構化流上的轉換操作 347 聚合 348 輸入和輸出 349 流式Dataset API 358 小結 359 第22章 事件時間和有狀態處理 360 事件時間 360 有狀態處理 362 任意有狀態處理 362 事件時間基礎知識 363 事件時間的窗口 363 在流中刪除重復項 370 任意有狀態處理 371 小結 380 第23章 生產中的結構化流處理 381 容錯和檢查點 381 更新應用程序 382 度量和監視 384 警報 386 使用流偵聽器進行高級監視 387 小結 388 第Ⅵ部分 高級分析與機器學習 第24章 高級分析和機器學習概覽 391 高級分析簡介 392 Spark的高級分析工具包 399 高級MLlib概念 400 MLlib的執行 402 部署模式 412 小結 413 第25章 預處理和特征工程 414 根據應用場景格式化模型 414 轉換器 416 預處理的估計器 417 高級轉換器 418 處理連續型特征 422 使用類別特征 428 文本數據轉換器 431 特征操作 440 特征選擇 442 高級主題 443 編寫自定義轉換器 444 小結 445 第26章 分類 446 應用場景 446 分類的類型 446 MLlib中的分類模型 447 邏輯回歸 449 決策樹 452 隨機森林和梯度提升樹 454 樸素貝葉斯 456 分類評估器和自動化模型校正 457 One-vs-Rest分類 459 多層感知器 459 小結 459 第27章 回歸 460 應用場景 460 MLlib中的回歸模型 461 線性回歸 462 廣義線性回歸 464 決策樹 466 隨機森林和梯度提升樹 467 高級方法 468 評估器和自動化模型校正 469 度量標準 470 小結 471 第28章 推薦系統 472 應用場景 472 基于交替*小二乘法的協同過濾 473 推薦系統的評估器 476 度量指標 477 頻繁模式挖掘 479 小結 479 第29章 無監督學習 480 應用場景 480 模型的可擴展性 481 k-means 482 二分k-means 484 高斯混合模型 485 LDA主題模型 487 小結 490 第30章 圖分析 491 構建圖 493 查詢圖 495 模式發現 496 圖算法 498 小結 504 第31章 深度學習 505 什么是深度學習? 505 在Spark中使用深度學習 506 深度學習庫 508 Deep Learning Pipelines的一個簡單示例 510 小結 514 第Ⅶ部分 生態系統 第32章 語言支持: Python(PySpark)和R(SparkR和 Sparklyr) 517 PySpark 518 Spark 中的R 519 小結 529 第33章 生態系統和社區 530 Spark軟件包 530 社區 533 小結 534
展開全部

Spark權威指南 作者簡介

Bill Chambers是Databricks的一名產品經理,致力于使用Spark和Databricks幫助客戶完成大規模數據分析的任務。Bill還定期寫關于數據科學和大數據方面的博客, 并常在各種會議和見面會上展示產品。他擁有加州大學伯克利分校信息學院的信息系統碩士學位, 研究方向為數據科學。Matei Zaharia是斯坦福大學計算機科學系助理教授和Databricks的首席技術官。他于2009年在加州大學伯克利分校創立了Spark項目, 那時他是一名博士生, 并繼續擔任Apache Spark項目的副主席。Matei Zaharia還是Apache Mesos項目的聯合創始人,也是Apache Hadoop項目的貢獻者。Matei Zaharia以他出色的研究工作獲得了2014年美國計算機學會博士論文獎和VMware系統研究獎。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 卫生纸复卷机|抽纸机|卫生纸加工设备|做卫生纸机器|小型卫生纸加工需要什么设备|卫生纸机器设备多少钱一台|许昌恒源纸品机械有限公司 | 振动台-振动试验台-振动冲击台-广东剑乔试验设备有限公司 | 电子万能试验机_液压拉力试验机_冲击疲劳试验机_材料试验机厂家-济南众标仪器设备有限公司 | 杜康白酒加盟_杜康酒代理_杜康酒招商加盟官网_杜康酒厂加盟总代理—杜康酒神全国运营中心 | 成都网站建设制作_高端网站设计公司「做网站送优化推广」 | 继电器模组-IO端子台-plc连接线-省配线模组厂家-世麦德 | 科昊仪器超纯水机系统-可成气相液氮罐-美菱超低温冰箱-西安昊兴生物科技有限公司 | 对夹式止回阀厂家,温州对夹式止回阀制造商--永嘉县润丰阀门有限公司 | 土壤墒情监测站_土壤墒情监测仪_土壤墒情监测系统_管式土壤墒情站-山东风途物联网 | 除甲醛公司-甲醛检测治理-杭州创绿家环保科技有限公司-室内空气净化十大品牌 | 清洁设备_洗地机/扫地机厂家_全自动洗地机_橙犀清洁设备官网 | 识禅_对禅的了解,从这里开始| 铁艺,仿竹,竹节,护栏,围栏,篱笆,栅栏,栏杆,护栏网,网围栏,厂家 - 河北稳重金属丝网制品有限公司 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 杭州可当科技有限公司—流量卡_随身WiFi_AI摄像头一站式解决方案 | 衬塑设备,衬四氟设备,衬氟设备-淄博鲲鹏防腐设备有限公司 | 金刚网,金刚网窗纱,不锈钢网,金刚网厂家- 河北萨邦丝网制品有限公司 | 混合生育酚_醋酸生育酚粉_琥珀酸生育酚-山东新元素生物科技 | atcc网站,sigma试剂价格,肿瘤细胞现货,人结肠癌细胞株购买-南京科佰生物 | 胃口福饺子加盟官网_新鲜现包饺子云吞加盟 - 【胃口福唯一官网】 | 振动筛-交叉筛-螺旋筛-滚轴筛-正弦筛-方形摇摆筛「新乡振动筛厂家」 | 影像测量仪_三坐标测量机_一键式二次元_全自动影像测量仪-广东妙机精密科技股份有限公司 | 色谱柱-淋洗液罐-巴罗克试剂槽-巴氏吸管-5ml样品瓶-SBS液氮冻存管-上海希言科学仪器有限公司 | DDoS安全防护官网-领先的DDoS安全防护服务商 | 作文导航网_作文之家_满分作文_优秀作文_作文大全_作文素材_最新作文分享发布平台 | 爆炸冲击传感器-无线遥测传感器-航天星百科 | 红立方品牌应急包/急救包加盟,小成本好项目代理_应急/消防/户外用品加盟_应急好项目加盟_新奇特项目招商 - 中红方宁(北京) 供应链有限公司 | 上海风淋室_上海风淋室厂家_上海风淋室价格_上海伯淋 | 定制/定做冲锋衣厂家/公司-订做/订制冲锋衣价格/费用-北京圣达信 | 龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司_龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司 | 纸张环压仪-纸张平滑度仪-杭州纸邦自动化技术有限公司 | NMRV减速机|铝合金减速机|蜗轮蜗杆减速机|NMRV减速机厂家-东莞市台机减速机有限公司 | 北京发电车出租-发电机租赁公司-柴油发电机厂家 - 北京明旺盛安机电设备有限公司 | 分光色差仪,测色仪,反透射灯箱,爱色丽分光光度仪,美能达色差仪维修_苏州欣美和仪器有限公司 | 光栅尺厂家_数显表维修-苏州泽升精密机械 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 合肥地磅_合肥数控切割机_安徽地磅厂家_合肥世佳电工设备有限公司 | 减速机_上海宜嘉减速机| 联系我们-腾龙公司上分客服微信19116098882 | 太原装修公司_山西整装家装设计_太原室内装潢软装_肖邦家居 | MVR蒸发器厂家-多效蒸发器-工业废水蒸发器厂家-康景辉集团官网 | 转子泵_凸轮泵_凸轮转子泵厂家-青岛罗德通用机械设备有限公司 |