-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
Scala機器學習 版權信息
- ISBN:9787111572152
- 條形碼:9787111572152 ; 978-7-111-57215-2
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
Scala機器學習 本書特色
Copyright ?2016 Packt Publishing. First published in the English language under the title “Mastering Scala Machine Learning”.All rights reserved.Chinese simplified language edition published by China Machine Press.Copyright ?2017 by China Machine Press.本書中文簡體字版由Packt Publishing授權機械工業出版社獨家出版。未經出版者書面許可,不得以任何方式復制或抄襲本書內容。
Scala機器學習 內容簡介
Copyright 2016 Packt Publishing. First published in the English language under the title “Mastering Scala Machine Learning”.All rights reserved.Chinese simplified language edition published by China Machine Press.Copyright 2017 by China Machine Press.本書中文簡體字版由Packt Publishing授權機械工業出版社獨家出版。未經出版者書面許可,不得以任何方式復制或抄襲本書內容。
Scala機器學習 目錄
譯者序
前言
第1章 探索數據分析1
1.1 Scala入門2
1.2 去除分類字段的重復值2
1.3 數值字段概述4
1.4 基本抽樣、分層抽樣和一致抽樣5
1.5 使用Scala和Spark的Note-book工作8
1.6 相關性的基礎12
1.7 總結14
第2章 數據管道和建模15
2.1 影響圖16
2.2 序貫試驗和風險處理17
2.3 探索與利用問題21
2.4 不知之不知23
2.5 數據驅動系統的基本組件23
2.5.1 數據收集24
2.5.2 數據轉換層25
2.5.3 數據分析與機器學習26
2.5.4 UI組件26
2.5.5 動作引擎28
2.5.6 關聯引擎28
2.5.7 監控28
2.6 優化和交互28
2.7 總結29
第3章 使用Spark和MLlib30
3.1 安裝Spark31
3.2 理解Spark的架構32
3.2.1 任務調度32
3.2.2 Spark的組件35
3.2.3 MQTT、ZeroMQ、Flume和Kafka36
3.2.4 HDFS、Cassandra、S3和Tachyon37
3.2.5 Mesos、YARN和Standa-lone38
3.3 應用38
3.3.1 單詞計數38
3.3.2 基于流的單詞計數41
3.3.3 Spark SQL和數據框45
3.4 機器學習庫46
3.4.1 SparkR47
3.4.2 圖算法:Graphx和Graph-Frames48
3.5 Spark的性能調整48
3.6 運行Hadoop的HDFS49
3.7 總結54
第4章 監督學習和無監督學習55
4.1 記錄和監督學習55
4.1.1 Iirs數據集56
4.1.2 類標簽點57
4.1.3 SVMWithSGD58
4.1.4 logistic回歸60
4.1.5 決策樹62
4.1.6 bagging和boosting:集成學習方法66
4.2 無監督學習66
4.3 數據維度71
4.4 總結73
第5章 回歸和分類74
5.1 回歸是什么74
5.2 連續空間和度量75
5.3 線性回歸77
5.4 logistic回歸81
5.5 正則化83
5.6 多元回歸84
5.7 異方差84
5.8 回歸樹85
5.9 分類的度量87
5.10 多分類問題87
5.11 感知機87
5.12 泛化誤差和過擬合90
5.13 總結90
第6章 使用非結構化數據91
6.1 嵌套數據92
6.2 其他序列化格式100
6.3 Hive和Impala102
6.4 會話化104
6.5 使用特質109
6.6 使用模式匹配110
6.7 非結構化數據的其他用途113
6.8 概率結構113
6.9 投影113
6.10 總結113
第7章 使用圖算法115
7.1 圖簡介115
7.2 SBT116
7.3 Scala的圖項目119
7.3.1 增加節點和邊121
7.3.2 圖約束123
7.3.3 JSON124
7.4 GraphX126
7.4.1 誰收到電子郵件130
7.4.2 連通分量131
7.4.3 三角形計數132
7.4.4 強連通分量132
7.4.5 PageRank133
7.4.6 SVD 134
7.5 總結138
第8章 Scala與R和Python的集成139
8.1 R的集成140
8.1.1 R和SparkR的相關配置140
8.1.2 數據框144
8.1.3 線性模型150
8.1.4 廣義線性模型152
8.1.5 在SparkR中讀取JSON文件156
8.1.6 在SparkR中寫入Parquet文件157
8.1.7 從R調用Scala158
8.2 Python的集成161
8.2.1 安裝Python161
8.2.2 PySpark162
8.2.3 從Java/Scala調用Python163
8.3 總結167
第9章 Scala中的NLP169
9.1 文本分析流程170
9.2 Spark的MLlib庫177
9.2.1 TF-IDF177
9.2.2 LDA178
9.3 分詞、標注和分塊185
9.4 POS標記186
9.5 使用word2vec尋找詞關系189
9.6 總結192
第10章 高級模型監控193
10.1 系統監控194
10.2 進程監控195
10.3 模型監控201
10.3.1 隨時間變化的性能202
10.3.2 模型停用標準202
10.3.3 A/B測試202
10.4 總結202
- >
山海經
- >
巴金-再思錄
- >
小考拉的故事-套裝共3冊
- >
推拿
- >
名家帶你讀魯迅:朝花夕拾
- >
名家帶你讀魯迅:故事新編
- >
月亮與六便士
- >
詩經-先民的歌唱