-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
智能系統與技術叢書PYTHON大規模機器學習 版權信息
- ISBN:9787111623144
- 條形碼:9787111623144 ; 978-7-111-62314-4
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
智能系統與技術叢書PYTHON大規模機器學習 本書特色
本書不僅介紹大規模機器學習的基本概念,還包含豐富的案例研究。書中所選皆為*實用的技術和工具,而對理論細節不進行深入討論,旨在提供大規模機器學習方法(甚至非常規方法)。不管是初學者、普通用戶還是專家級用戶,通過本書都能理解并掌握利用Python進行大規模機器學習。為讓讀者快速掌握核心技術,本書由淺入深講解大量實例,圖文并茂呈現每一步的操作結果,幫助讀者更好地掌握大規模機器學習Python工具。例如:基于Scikit-learn可擴展學習、 Liblinear和Vowpal Wabbit快速支持向量機、基于Theano與H2O的大規模深度學習方法、TensorFlow深度學習技術與在線神經網絡方法、大規模分類和回歸樹的可擴展解決方案、大規模無監督學習(PCA,聚類分析和主題建模等)擴展方法、Hadoop和Spark分布式環境、Spark機器學習實踐以及Theano和GPU計算的基礎知識。
智能系統與技術叢書PYTHON大規模機器學習 內容簡介
本書不僅介紹大規模機器學習的基本概念,還包含豐富的案例研究。書中所選皆為*實用的技術和工具,而對理論細節不進行深入討論,旨在提供大規模機器學習方法(甚至很好規方法)。不管是初學者、普通用戶還是專家級用戶,通過本書都能理解并掌握利用Python進行大規模機器學習。為讓讀者快速掌握核心技術,本書由淺入深講解大量實例,圖文并茂呈現每一步的操作結果,幫助讀者更好地掌握大規模機器學習Python工具。例如:基于Scikit-learn可擴展學習、 Liblinear和Vowpal Wabbit快速支持向量機、基于Theano與H2O的大規模深度學習方法、TensorFlow深度學習技術與在線神經網絡方法、大規模分類和回歸樹的可擴展解決方案、大規模無監督學習(PCA,聚類分析和主題建模等)擴展方法、Hadoop和Spark分布式環境、Spark機器學習實踐以及Theano和GPU計算的基礎知識。
智能系統與技術叢書PYTHON大規模機器學習 目錄
前言
作者簡介
審校者簡介
第1章邁向可擴展性的**步1
11詳細解釋可擴展性1
111大規模實例3
112介紹Python4
113使用Python進行向上擴展4
114使用Python進行向外擴展5
12Python用于大規模機器學習6
121選擇Python 2還是Python 36
122安裝Python7
123逐步安裝7
124安裝軟件包8
125軟件包升級9
126科學計算發行版10
127Jupyter/IPython介紹11
13Python包13
131NumPy14
132SciPy14
133pandas14
134Scikitlearn15
135小結21
第2章Scikitlearn中的可擴展學習22
21非核心學習22
211選擇子采樣23
212一次優化一個實例24
213構建非核心學習系統25
22流化源數據25
221處理真實數據集26
222**個示例——流化共享單車數據集28
223使用pandas I/O工具30
224使用數據庫31
225關注實例排序35
23隨機學習37
231批處理梯度下降37
232隨機梯度下降40
233Scikitlearn的SGD實現40
234定義SGD學習參數42
24數據流的特征管理43
241描述目標46
242哈希技巧49
243其他基本變換51
244流測試和驗證52
245使用SGD52
25小結56
第3章實現快速SVM57
31測試數據集58
311共享單車數據集58
312森林覆蓋類型數據集58
32支持向量機59
321hinge loss及其變形64
322Scikitlearn的SVM實現65
323探究通過子采樣改善非線性SVM68
324使用SGD實現大規模SVM70
33正則化特征選擇77
34SGD中的非線性78
35超參數調整82
36小結96
第4章神經網絡與深度學習97
41神經網絡架構98
411神經網絡如何學習106
412選擇正確的架構110
413使用神經網絡111
414sknn并行化111
42神經網絡和正則化113
43神經網絡和超參數優化115
44神經網絡和決策邊界117
45用H2O進行規模化深度學習120
451用H2O進行大規模深度學習121
452H2O上的網格搜索124
46深度學習和無監督預訓練126
47使用theanets進行深度學習126
48自動編碼器和無監督學習128
49小結131
第5章用TensorFlow進行深度學習132
51TensorFlow安裝134
52在TensorFlow上使用SkFlow進行機器學習140
53安裝Keras和TensorFlow148
54在TensorFlow中通過Keras實現卷積神經網絡152
541卷積層153
542池化層153
543全連接層154
55增量CNN方法156
56GPU計算156
57小結159
第6章大規模分類和回歸樹160
61bootstrap聚合162
62隨機森林和極端隨機森林163
63隨機搜索實現快速參數優化167
64CART和boosting172
65XGBoost179
651XGBoost回歸181
652XGBoost流化大型數據集184
653XGBoost模型存儲185
66用H2O實現非核心CART185
661H2O上的隨機森林和網格搜索186
662H2O上的隨機梯度增強和網格搜索188
67小結191
第7章大規模無監督學習192
71無監督方法192
72特征分解:PCA193
721隨機化PCA199
722增量PCA200
723稀疏PCA201
73使用H2O的PCA202
74K-均值聚類算法203
741初始化方法206
742K-均值假設206
743選擇*佳K209
744擴展K-均值算法:小批量212
75用H2O實現K-均值216
76LDA218
77小結226
第8章分布式環境——Hadoop和Spark227
81從單機到集群227
82設置VM230
821VirtualBox230
822Vagrant232
823使用VM232
83Hadoop生態系統234
831架構234
832HDFS235
833MapReduce242
834YARN250
84Spark250
85小結260
第9章Spark機器學習實踐261
91為本章設置虛擬機261
92跨集群節點共享變量262
921廣播只讀變量262
922累加器只寫變量264
923廣播和累加器的示例265
93Spark的數據預處理267
931JSON文件和Spark DataFrame268
932處理缺失數據270
933在內存中分組和創建表271
934將預處理的DataFrame或RDD寫入磁盤273
935使用Spark DataFrame274
94Spark機器學習276
941Spark處理KDD99數據集277
942讀取數據集277
943特征工程280
944訓練學習器284
945評估學習器的表現286
946機器學習管道的威力286
947手動優化288
948交叉驗證291
95小結293
附錄介紹GPU和Theano294
智能系統與技術叢書PYTHON大規模機器學習 作者簡介
Bastiaan Sjardin是一位具有人工智能和數學背景的數據科學家和公司創始人。他獲得萊頓大學和麻省理工學院(MIT)校園課程聯合培養的認知科學碩士學位。在過去五年中,他從事過廣泛的數據科學和人工智能項目。他是密歇根大學社會網絡分析課程Coursera和約翰斯·霍普金斯大學機器學習實踐課程的?。他擅長Python和R編程語言。目前,他是Quandbee(http://wwwquandbeecom)的聯合創始人,該公司主要提供大規模機器學習和人工智能應用。
Luca Massaron是一位數據科學家和市場研究總監,擅長多元統計分析、機器學習和客戶洞察力研究,在解決實際問題和應用推理、統計、數據挖掘和算法來為用戶創造價值方面有十多年經驗。從成為意大利網絡觀眾分析的先驅,到躋身前十名的Kaggler,他一直對數據分析充滿熱情,還向專業人士和普通大眾展示數據驅動知識發現的潛力,相比不必要的復雜性,他更喜歡簡潔。他相信僅僅通過基本操作就可以在數據科學中收獲很多東西。
Alberto Boschetti是一位具有信號處理和統計專業知識的數據科學家。他獲得電信工程博士學位,目前在倫敦生活和工作。在其工作項目中,他面臨過從自然語言處理(NLP)和機器學習到分布式處理的挑戰。 他在工作中充滿熱情,始終努力了解數據科學的*新發展,他喜歡參加聚會、會議和其他活動。
- >
自卑與超越
- >
苦雨齋序跋文-周作人自編集
- >
隨園食單
- >
李白與唐代文化
- >
小考拉的故事-套裝共3冊
- >
伊索寓言-世界文學名著典藏-全譯本
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
回憶愛瑪儂