-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
Python商業數據挖掘(第6版) 版權信息
- ISBN:9787302590248
- 條形碼:9787302590248 ; 978-7-302-59024-8
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
Python商業數據挖掘(第6版) 本書特色
通過學習《Python商業數據挖掘(第6版)》,讀者將掌握使用Python實現數據挖掘的各種方法,并深入理解在將這些方法應用于數據挖掘的過程中存在的商業問題和機遇。
Python商業數據挖掘(第6版) 內容簡介
本書前5版好評如潮,作為第6版,本書搶先發售使用了Python語言。本書除了介紹用于統計和機器學習等領域的預測、分類、可視化、降維、推薦系統、聚類、文本挖掘、網絡分析等方法之外,內容還包括: ● 新加入的合著者Peter Gedeck擁有使用Python講解商業分析課程的豐富經驗以及將機器學習應用于新藥發現過程的專業技能。在本書中,他十分樂于將這些經驗和技能與讀者分享。 ● 討論數據挖掘中的倫理問題。 ● 根據教師和學生的反饋意見對內容做了更新。 ● 通過多個案例展示數據挖掘技術的實際應用。 ● 每章后面的習題有助于讀者評估和加深對該章內容的理解。 ● 在線支持網站提供了數據集、教學資料、習題答案、PPT教案和案例解決方案。
Python商業數據挖掘(第6版) 目錄
第I 部分 預備知識
第1 章 引言............................................................3
1.1 商業分析簡介...........................................3
1.2 什么是數據挖掘......................................4
1.3 數據挖掘及相關術語..............................4
1.4 大數據........................................................5
1.5 數據科學...................................................6
1.6 為什么有這么多不同的方法.................6
1.7 術語與符號...............................................7
1.8 本書的線路圖...........................................8
第2 章 數據挖掘過程概述................................11
2.1 引言..........................................................11
2.2 數據挖掘的核心思想............................11
2.2.1 分類.................................................11
2.2.2 預測.................................................12
2.2.3 關聯規則與推薦系統........................12
2.2.4 預測分析..........................................12
2.2.5 數據規約與降維技術........................12
2.2.6 數據探索和可視化...........................12
2.2.7 監督學習與無監督學習....................13
2.3 數據挖掘步驟.........................................13
2.4 前期步驟.................................................15
2.4.1 數據集的組織...................................15
2.4.2 預測West Roxbury 小區的房價........15
2.4.3 在Python 程序中載入并瀏覽數據....16
2.4.4 Python 包的導入...............................18
2.4.5 從數據庫獲得采樣數據....................18
2.4.6 在分類任務中對小概率事件的
過采樣.............................................19
2.4.7 數據預處理和數據清理....................19
2.5 預測力和過擬合.................................... 24
2.5.1 過擬合............................................. 24
2.5.2 數據分區的創建和使用.................... 26
2.6 建立預測模型........................................ 28
2.7 在本地計算機上用Python 實現
數據挖掘................................................. 32
2.8 自動化數據挖掘解決方案................... 33
2.9 數據挖掘中的倫理規范....................... 33
2.10 習題........................................................ 37
第Ⅱ部分 數據探索與降維技術
第3 章 數據可視化.............................................43
3.1 引言.......................................................... 43
3.2 數據實例................................................. 45
3.3 基本圖形:條形圖、折線圖和
散點圖..................................................... 46
3.3.1 分布圖:箱線圖和直方圖................ 48
3.3.2 熱圖:可視化相關性和缺失值......... 51
3.4 多維數據的可視化................................ 53
3.4.1 添加變量:顏色、大小、形狀、
多面板和動畫.................................. 53
3.4.2 數據操作:重定標、聚合與層次
結構、縮放與過濾........................... 56
3.4.3 趨勢線和標簽.................................. 59
3.4.4 擴展到大型數據集........................... 60
3.4.5 多變量圖:平行坐標圖.................... 62
3.4.6 交互式可視化.................................. 63
3.5 專用的可視化技術................................ 65
3.5.1 網絡數據可視化............................... 65
3.5.2 層次數據可視化:樹狀結構圖......... 66
3.5.3 地理數據可視化:地圖.................... 68
3.6 小結..........................................................71
3.7 習題..........................................................71
第11 章 神經網絡............................................221
11.1 引言......................................................221
11.2 神經網絡的概念和結構...................222
11.3 在數據上擬合神經網絡...................222
11.3.1 計算節點的輸出結果..................223
11.3.2 訓練模型....................................225
11.3.3 對事故的嚴重程度進行分類.......229
11.3.4 避免過擬合................................231
11.3.5 把神經網絡的輸出結果用于
預測和分類................................231
11.4 要求用戶輸入.....................................231
11.5 探索預測變量與因變量的關系......232
11.6 深度學習.............................................232
11.6.1 卷積神經網絡............................233
11.6.2 局部特征圖................................234
11.6.3 層次特征....................................234
11.6.4 學習過程....................................235
11.6.5 無監督學習................................235
11.6.6 結論...........................................236
11.7 神經網絡的優缺點............................236
11.8 習題......................................................237
第12 章 判別分析............................................ 239
12.1 引言......................................................239
12.2 記錄與類別的距離...........................241
12.3 Fisher 線性分類函數........................242
12.4 判別分析的分類性能.......................245
12.5 先驗概率.............................................245
12.6 誤分類成本不均等...........................246
12.7 多類別情形下的分類.......................246
12.8 判別分析的優缺點...........................249
12.9 習題......................................................250
第13 章 組合方法:集成學習和增益
模型.................................................... 253
13.1 集成學習.............................................253
13.1.1 為什么集成學習可以改進
預測能力...................................254
13.1.2 集成學習的優缺點.....................257
13.2 增益(說服)模型.................................257
13.2.1 建立一個簡單的預測模型..........260
13.2.2 建立增益模型............................260
13.2.3 使用Python 程序計算增益.........261
13.2.4 應用增益模型的結果.................262
13.3 小結......................................................262
13.4 習題......................................................263
第Ⅴ部分 挖掘記錄之間的關系
第14 章 關聯規則和協同過濾...................... 267
第15 章 聚類分析............................................289
第Ⅵ部分 時間序列預測
第16 章 時間序列分析...................................313
第17 章 基于回歸的預測...............................325
第18 章 平滑法................................................349
第Ⅶ部分 數據分析
21.7 直郵捐贈.............................................416
21.7.1 背景..........................................416
21.7.2 數據..........................................416
21.7.3 任務..........................................417
21.8 產品目錄交叉銷售...........................417
21.8.1 背景分析...................................417
21.8.2 任務..........................................418
21.9 預測公共交通需求...........................418
21.9.1 背景分析...................................418
21.9.2 問題描述...................................418
21.9.3 數據..........................................418
21.9.4 目標..........................................419
21.9.5 任務..........................................419
21.9.6 提示和步驟................................419
附錄 Python 工具函數.................................... 421
Python商業數據挖掘(第6版) 作者簡介
Galit Shmueli博士自2004年以來,一直在美國馬里蘭大學、statistics.com統計網站、印度商學院設計并指導數據挖掘課程。Shmueli的研究領域包括信息系統的統計方法和數據挖掘,她以研究和擅長講授商業分析而聞名,并發表了100多篇文章。 Peter C. Bruce是statistics.com統計網站的統計教育研究院的主席和創辦人,他發表了多篇學術論文,還開發了Resampling Stats軟件。 Peter Gedeck博士是Collabrative Drug Discovery公司的高級數據科學家,他為這家公司開發了一款基于云的軟件來管理新藥發現過程中用到的海量數據,他還在statistics.com統計網站上教授數據挖掘課程。 Nitin R. Patel博士是位于馬薩諸塞州劍橋市的Cytel公司的共同創始人和董事,是美國統計協會會員,同時還是麻省理工學院和哈佛大學的客座教授。
- >
月亮虎
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
煙與鏡
- >
有舍有得是人生
- >
羅曼·羅蘭讀書隨筆-精裝
- >
推拿
- >
回憶愛瑪儂
- >
名家帶你讀魯迅:故事新編