中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
基于PYSPARK的高級數據分析

包郵 基于PYSPARK的高級數據分析

出版社:中國電力出版社出版時間:2024-10-01
開本: 16開 頁數: 256
中 圖 價:¥45.5(5.8折) 定價  ¥78.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

基于PYSPARK的高級數據分析 版權信息

基于PYSPARK的高級數據分析 本書特色

編輯推薦
時至今日產生的數據量已經達到令人驚人的地步,而且還在不斷增長。Apache Spark已經成為分析大數據的實際工具,并且也是數據科學工具箱的關鍵部分。本書針對Spark*z新版本進行了更新,將Spark、統計方法和真實數據集結合在一起,教你如何運用 PySpark、Spark Python API和Spark編程中的其他*z佳實踐來解決分析問題。
數據科學家Akash Tandon、Sandy Ryza、Uri Laserson、Sean Owen和Josh Wills介紹了Spark生態系統,然后深入研究將常用技術(包括分類、聚類、協同過濾和異常檢測)應用于以下的領域:基因組學、安全工作和金融。此更新版本還涵蓋圖像處理和Spark NLP庫。
如果你對機器學習和統計學有基本的了解,并且能夠使用Python進行編程,那么本書將幫助你開始進行大規模的數據分析。

基于PYSPARK的高級數據分析 內容簡介

本書的主要內容有:熟悉Spark的編程模型和生態系統。學習數據科學的一般方法。檢查分析大型公共數據集執行步驟的完整性。發現哪些機器學習工具對特定問題有幫助。探索可適應多種用途的代碼。

基于PYSPARK的高級數據分析 目錄

目錄前言 1第1 章 大數據分析 711 使用大數據 812 Apache Spark 和PySpark10121 組件 10122 PySpark 12123 生態系統 1313 Spark 30 1414 PySpark 處理數據科學問題 1515 本章小結16第2 章 PySpark 數據分析簡介 1721 Spark 架構 1922 安裝PySpark 21目錄前言 1第1 章 大數據分析 711 使用大數據 812 Apache Spark 和PySpark10121 組件 10122 PySpark 12123 生態系統 1313 Spark 30 1414 PySpark 處理數據科學問題 1515 本章小結16第2 章 PySpark 數據分析簡介 1721 Spark 架構 1922 安裝PySpark 2123 設置我們的數據 2424 使用DataFrame API 分析數據 3125 DataFrames 的快速匯總統計 3526 DataFrame 的透視和重塑 3727 關聯DataFrame 并選擇特征4028 評分和模型評估 4229 本章小結44第3 章 音樂推薦和音頻編碼器的數據集 4731 設置數據4832 我們對推薦系統的要求 5133 數據準備5534 構建**個模型 5835 算法篩查推薦 6236 推薦質量評估 6437 計算AUC 6638 選擇超參數 6839 給出推薦71310 本章小結 72第4 章 使用決策樹和決策森林進行預測 7541 決策樹和決策森林 7642 準備數據7943 **顆決策樹 8444 決策樹超參數 9245 調試決策樹 9446 重溫分類特征 9847 隨機森林10248 進行預測10549 本章小結105第5 章 異常檢測與K-means 聚類算法 10751 K-means 聚類 10852 識別異常網絡流量 10953 初次嘗試聚類 11254 選擇K 值 11455 利用SparkR 實現可視化 11856 特征歸一化 12357 分類變量12458 使用熵(Entropy)標簽 12659 聚類實戰128510 本章小結 130第6 章 通過LDA、Spark NLP 了解維基百科 13361 隱含狄利克雷分布 13462 獲取數據13563 Spark NLP 13764 解析數據13965 使用Spark NLP 準備數據 14166 TF-IDF 14667 計算TF-IDF 14768 創建LDA 模型 14869 本章小結151第7 章 基于出租車行程數據的時空序列數據分析 15371 數據準備155711 將日期格式字符串轉換為時間戳 157712 處理無效記錄 15972 地理空間分析 161721 介紹GeoJSON 161722 GeoPandas 16373 PySpark 會話化 16674 本章小結170第8 章 金融風險評估 17181 金融術語17282 VaR 的計算方法 173821 方差與協方差 173822 歷史模擬法 173823 蒙特卡羅模擬 17483 我們的模型 17484 獲取數據17585 準備數據17786 決定因子權重 18087 抽樣 18488 試驗運行18789 可視化收益分布 191810 本章小結 192第9 章 分析基因組學數據和BDG 項目 19391 從建模中解耦存儲 19492 設置ADAM 19793 介紹如何使用ADAM 處理基因組數據 198931 使用ADAM CLI 進行文件格式轉換 199932 使用PySpark 和ADAM 采集基因組學數據 20094 預測轉錄因子結合位點 20695 本章小結212第10 章 基于深入學習和PySpark LSH 的圖像相似度檢測 215101 PyTorch 216102 準備數據 217103 圖像矢量表示的深度學習模型 2191031 圖像嵌入 2191032 將圖像嵌入導入 PySpark 222104 使用PySpark LSH 進行圖像相似搜索 223105 本章小結 228第11 章 使用MLflow 管理機器學習生命周期 229111 機器學習生命周期 229112 MLflow 231113 實驗跟蹤 232114 管理和服務ML 模型 236115 創建并使用MLflow 項目 239116 本章小結 243
展開全部

基于PYSPARK的高級數據分析 作者簡介

Akash Tandon是Looppanel的聯合創始人兼首席技術官。曾在Atlan擔任高級數據工程師。Sandy Ryza是Apache Spark的核心貢獻人,領導了Dagster項目的開發。Uri Laserson是Patch Biosciences 的創始人兼首席技術官。曾在Cloudera從事大數據和基因組學的研究。Sean Owen是Apache Spark的核心貢獻人和PMC(項目管理委員會)的成員,同時也是Databricks專注于機器學習和數據科學的首席解決方案架構師。Josh Wills是WeaveGrid的軟件工程師,也是Slack的前數據工程主管。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 电竞馆加盟,沈阳网吧加盟费用选择嘉棋电竞_售后服务一体化 | AGV无人叉车_激光叉车AGV_仓储AGV小车_AGV无人搬运车-南昌IKV机器人有限公司[官网] | 洗石机-移动滚筒式,振动,螺旋,洗矿机-青州冠诚重工机械有限公司 | 震动筛选机|震动分筛机|筛粉机|振筛机|振荡筛-振动筛分设备专业生产厂家高服机械 | 乐泰胶水_loctite_乐泰胶_汉高乐泰授权(中国)总代理-鑫华良供应链 | 集装箱展厅-住人集装箱住宿|建筑|房屋|集装箱售楼处-山东锐嘉科技工程有限公司 | 定制异形重型钢格栅板/钢格板_定做踏步板/排水沟盖板_钢格栅板批发厂家-河北圣墨金属制品有限公司 | 注浆压力变送器-高温熔体传感器-矿用压力传感器|ZHYQ朝辉 | 壹作文_中小学生优秀满分作文大全| 高铝矾土熟料_细粉_骨料_消失模_铸造用铝矾土_铝酸钙粉—嵩峰厂家 | 北京中航时代-耐电压击穿试验仪厂家-电压击穿试验机 | 镀锌钢格栅_热镀锌格栅板_钢格栅板_热镀锌钢格板-安平县昊泽丝网制品有限公司 | 防爆大气采样器-防爆粉尘采样器-金属粉尘及其化合物采样器-首页|盐城银河科技有限公司 | 胜为光纤光缆_光纤跳线_单模尾纤_光纤收发器_ODF光纤配线架厂家直销_北京睿创胜为科技有限公司 - 北京睿创胜为科技有限公司 | 非标压力容器_碳钢储罐_不锈钢_搪玻璃反应釜厂家-山东首丰智能环保装备有限公司 | 无菌水质袋-NASCO食品无菌袋-Whirl-Pak无菌采样袋-深圳市慧普德贸易有限公司 | 储能预警-储能消防系统-电池舱自动灭火装置-四川千页科技股份有限公司官网 | 球磨机,节能球磨机价格,水泥球磨机厂家,粉煤灰球磨机-吉宏机械制造有限公司 | 知名电动蝶阀,电动球阀,气动蝶阀,气动球阀生产厂家|价格透明-【固菲阀门官网】 | 京港视通报道-质量走进大江南北-京港视通传媒[北京]有限公司 | 实验室装修_实验室设计_实验室规划设计- 上海广建净化工程公司 | 螺杆式冷水机-低温冷水机厂家-冷冻机-风冷式-水冷式冷水机-上海祝松机械有限公司 | 石家庄网站建设|石家庄网站制作|石家庄小程序开发|石家庄微信开发|网站建设公司|网站制作公司|微信小程序开发|手机APP开发|软件开发 | 自动化生产线-自动化装配线-直流电机自动化生产线-东莞市慧百自动化有限公司 | 翰香原枣子坊加盟费多少钱-正宗枣核糕配方培训利润高飘香 | 西安标准厂房_陕西工业厂房_西咸新区独栋厂房_长信科技产业园官方网站 | 油漆辅料厂家_阴阳脚线_艺术漆厂家_内外墙涂料施工_乳胶漆专用防霉腻子粉_轻质粉刷石膏-魔法涂涂 | 真空冷冻干燥机_国产冻干机_冷冻干燥机_北京四环冻干 | 培训一点通 - 合肥驾校 - 合肥新亚驾校 - 合肥八一驾校 | 磁力轮,磁力联轴器,磁齿轮,钕铁硼磁铁-北京磁运达厂家 | 政府回应:200块在义乌小巷能买到爱情吗?——揭秘打工族省钱约会的生存智慧 | 步进驱动器「一体化」步进电机品牌厂家-一体式步进驱动 | 517瓜水果特产网|一个专注特产好物的网站 | 选矿设备,选矿生产线,选矿工艺,选矿技术-昆明昆重矿山机械 | 市政路灯_厂家-淄博信达电力科技有限公司| 缠膜机|缠绕包装机|无纺布包装机-济南达伦特机械设备有限公司 | 气胀轴|气涨轴|安全夹头|安全卡盘|伺服纠偏系统厂家-天机传动 | 气动隔膜阀_气动隔膜阀厂家_卫生级隔膜阀价格_浙江浙控阀门有限公司 | 运动木地板厂家_体育木地板安装_篮球木地板选购_实木运动地板价格 | 南京试剂|化学试剂|分析试剂|实验试剂|cas号查询-专业60年试剂销售企业 | 匀胶机旋涂仪-声扫显微镜-工业水浸超声-安赛斯(北京)科技有限公司 |