掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
機械工業出版社數據分析與決策技術叢書實用預測分析 版權信息
- ISBN:9787111603351
- 條形碼:9787111603351 ; 978-7-111-60335-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
機械工業出版社數據分析與決策技術叢書實用預測分析 本書特色
本書詳細講述了預測分析的原理、技術及實現,并深入討論了大數據。重點著眼于掌握提高開發、實行預測分析所需的6項關鍵實用技能。本書還提供了來自市場、醫療和零售等行業的真實案例,有助于讀者針對產品實現自己的預測分析。
機械工業出版社數據分析與決策技術叢書實用預測分析 內容簡介
本書詳細講述了預測分析的原理、技術及實現,并深入討論了大數據。重點著眼于掌握提高開發、實行預測分析所需的6項關鍵實用技能。本書還提供了來自市場、醫療和零售等行業的真實案例,有助于讀者針對產品實現自己的預測分析。
機械工業出版社數據分析與決策技術叢書實用預測分析 目錄
Contents 目 錄
譯者序
關于作者
關于審校者
前言
第1章預測分析入門 1
1.1許多行業中都有預測分析 2
1.1.1市場營銷中的預測分析 2
1.1.2醫療中的預測分析 2
1.1.3其他行業中的預測分析 3
1.2技能和角色在預測分析中都很重要 3
1.3預測分析軟件 4
1.3.1開源軟件 5
1.3.2閉源軟件 5
1.3.3和平共處 5
1.4其他有用的工具 5
1.4.1超越基礎知識 6
1.4.2數據分析/研究 6
1.4.3數據工程 6
1.4.4管理 7
1.4.5數據科學團隊 7
1.4.6看待預測分析的兩種不同方式 7
1.5R 8
1.5.1CRAN 8
1.5.2安裝R語言 8
1.5.3其他安裝R語言的方法 8
1.6預測分析項目是如何組織的 9
1.7圖形用戶界面 10
1.8RStudio入門 11
1.8.1重新布局以保持和示例一致 11
1.8.2部分重要面板的簡要描述 12
1.8.3創建新項目 13
1.9R語言控制臺 14
1.10源代碼窗口 15
1.11**個預測模型 16
1.12第二個腳本 18
1.12.1代碼描述 19
1.12.2predict函數 20
1.12.3檢驗預測誤差 21
1.13 R語言包 22
1.13.1stargazer包 22
1.13.2安裝stargazer包 23
1.13.3保存工作 24
1.14參考資料 24
1.15本章小結 24
第2章 建模過程 25
2.1結構化方法的優點 25
2.2分析過程方法 26
2.2.1CRISP-DM和SEMMA 27
2.2.2CRISP-DM和SEMMA的圖表 27
2.2.3敏捷過程 28
2.2.4六西格瑪和根本原因 28
2.2.5是否需要數據抽樣 28
2.2.6使用所有數據 29
2.2.7比較樣本與群體 29
2.3**步:理解業務 30
2.4第二步:理解數據 36
2.4.1衡量尺度 36
2.4.2單變量分析 38
2.5第三步:數據準備 43
2.6第四步:建模 44
2.6.1具體模型說明 45
2.6.2邏輯回歸 46
2.6.3支持向量機 47
2.6.4決策樹 47
2.6.5降維技術 51
2.6.6主成分 51
2.6.7聚類 52
2.6.8時間序列模型 52
2.6.9樸素貝葉斯分類器 53
2.6.10文本挖掘技術 54
2.7第五步:評估 57
2.7.1模型驗證 58
2.7.2曲線下面積 59
2.7.3樣本內和樣本外測試、前進測試 60
2.7.4訓練/測試/驗證數據集 60
2.7.5時間序列驗證 61
2.7.6*佳冠軍模型的基準測試 61
2.7.7專家意見:人與機器 61
2.7.8元分析 61
2.7.9飛鏢板方法 61
2.8第六步:部署 62
2.9參考資料 62
2.10本章小結 62
第3章 輸入和探索數據 64
3.1數據輸入 64
3.1.1文本文件輸入 65
3.1.2數據庫表格 66
3.1.3電子表格文件 67
3.1.4XML和JSON數據 67
3.1.5生成你自己的數據 68
3.1.6處理大型文件的技巧 68
3.1.7數據整理 68
3.2連接數據 69
3.2.1使用sqldf函數 69
3.2.2生成數據 70
3.2.3檢查元數據 71
3.2.4使用內部連接和外部連接來合并數據 72
3.2.5識別有多個購買記錄的成員 73
3.2.6清除冗余記錄 74
3.3探索醫院數據集 74
3.3.1str(df)函數的輸出 74
3.3.2View函數的輸出 75
3.3.3colnames函數 75
3.3.4summary函數 76
3.3.5在瀏覽器中打開文件 77
3.3.6繪制分布圖 77
3.3.7變量的可視化繪圖 78
3.4轉置數據幀 80
3.5缺失值 84
3.5.1建立缺失值測試數據集 84
3.5.2缺失值的不同類型 85
3.5.3糾正缺失值 87
3.5.4使用替換過的值運行回歸 90
3.6替換分類變量 91
3.7異常值 91
3.7.1異常值為什么重要 91
3.7.2探測異常值 92
3.8數據轉換 96
3.8.1生成測試數據 97
3.8.2Box-Cox轉換 97
3.9變量化簡/變量重要性 98
3.9.1主成分分析法 98
3.9.2全子集回歸 102
3.9.3變量重要性 104
3.10參考資料 106
3.11本章小結 106
第4章 回歸算法導論 107
4.1監督學習模型和無監督學習模型 108
4.1.1監督學習模型 108
4.1.2無監督學習模型 108
4.2回歸技術 109
4.3廣義線性模型 110
4.4邏輯回歸 110
4.4.1比率 111
4.4.2邏輯回歸系數 111
4.4.3示例:在醫療中使用邏輯回歸來預測疼痛閾值 112
4.4.4GLM模型擬合 114
4.4.5檢驗殘差項 115
4.4.6添加變量的分布圖 116
4.4.7p值及其效應量 117
4.4.8p值及其影響范圍 118
4.4.9變量選擇 119
4.4.10交互 121
4.4.11擬合優度統計量 123
4.4.12置信區間和Wald統計 124
4.4.13基本回歸診斷圖 124
4.4.14分布圖類型描述 124
4.4.15擬合優度:Hosmer-Lemeshow檢驗 126
4.4.16正則化 127
4.4.17示例:ElasticNet 128
4.4.18選擇一個正確的Lambda 128
4.4.19基于Lambda輸出可能的系數 129
4.5本章小結 130
第5章決策樹、聚類和SVM導論 131
5.1決策樹算法 131
5.1.1決策樹的優點 131
5.1.2決策樹的缺點 132
5.1.3決策樹的基本概念 132
5.1.4擴展樹 132
5.1.5不純度 133
5.1.6控制樹的增長 134
5.1.7決策樹算法的類型 134
5.1.8檢查目標變量 135
5.1.9在rpart模型中使用公式符號 135
5.1.10圖的解釋 136
5.1.11輸出決策樹的文本版本 137
5.1.12修剪 138
5.1.13渲染決策樹的其他選項 139
5.2聚類分析 140
5.2.1聚類分析應用于多種行業 140
5.2.2什么是聚類 140
5.2.3聚類的類型 141
5.2.4k均值聚類算
譯者序
關于作者
關于審校者
前言
第1章預測分析入門 1
1.1許多行業中都有預測分析 2
1.1.1市場營銷中的預測分析 2
1.1.2醫療中的預測分析 2
1.1.3其他行業中的預測分析 3
1.2技能和角色在預測分析中都很重要 3
1.3預測分析軟件 4
1.3.1開源軟件 5
1.3.2閉源軟件 5
1.3.3和平共處 5
1.4其他有用的工具 5
1.4.1超越基礎知識 6
1.4.2數據分析/研究 6
1.4.3數據工程 6
1.4.4管理 7
1.4.5數據科學團隊 7
1.4.6看待預測分析的兩種不同方式 7
1.5R 8
1.5.1CRAN 8
1.5.2安裝R語言 8
1.5.3其他安裝R語言的方法 8
1.6預測分析項目是如何組織的 9
1.7圖形用戶界面 10
1.8RStudio入門 11
1.8.1重新布局以保持和示例一致 11
1.8.2部分重要面板的簡要描述 12
1.8.3創建新項目 13
1.9R語言控制臺 14
1.10源代碼窗口 15
1.11**個預測模型 16
1.12第二個腳本 18
1.12.1代碼描述 19
1.12.2predict函數 20
1.12.3檢驗預測誤差 21
1.13 R語言包 22
1.13.1stargazer包 22
1.13.2安裝stargazer包 23
1.13.3保存工作 24
1.14參考資料 24
1.15本章小結 24
第2章 建模過程 25
2.1結構化方法的優點 25
2.2分析過程方法 26
2.2.1CRISP-DM和SEMMA 27
2.2.2CRISP-DM和SEMMA的圖表 27
2.2.3敏捷過程 28
2.2.4六西格瑪和根本原因 28
2.2.5是否需要數據抽樣 28
2.2.6使用所有數據 29
2.2.7比較樣本與群體 29
2.3**步:理解業務 30
2.4第二步:理解數據 36
2.4.1衡量尺度 36
2.4.2單變量分析 38
2.5第三步:數據準備 43
2.6第四步:建模 44
2.6.1具體模型說明 45
2.6.2邏輯回歸 46
2.6.3支持向量機 47
2.6.4決策樹 47
2.6.5降維技術 51
2.6.6主成分 51
2.6.7聚類 52
2.6.8時間序列模型 52
2.6.9樸素貝葉斯分類器 53
2.6.10文本挖掘技術 54
2.7第五步:評估 57
2.7.1模型驗證 58
2.7.2曲線下面積 59
2.7.3樣本內和樣本外測試、前進測試 60
2.7.4訓練/測試/驗證數據集 60
2.7.5時間序列驗證 61
2.7.6*佳冠軍模型的基準測試 61
2.7.7專家意見:人與機器 61
2.7.8元分析 61
2.7.9飛鏢板方法 61
2.8第六步:部署 62
2.9參考資料 62
2.10本章小結 62
第3章 輸入和探索數據 64
3.1數據輸入 64
3.1.1文本文件輸入 65
3.1.2數據庫表格 66
3.1.3電子表格文件 67
3.1.4XML和JSON數據 67
3.1.5生成你自己的數據 68
3.1.6處理大型文件的技巧 68
3.1.7數據整理 68
3.2連接數據 69
3.2.1使用sqldf函數 69
3.2.2生成數據 70
3.2.3檢查元數據 71
3.2.4使用內部連接和外部連接來合并數據 72
3.2.5識別有多個購買記錄的成員 73
3.2.6清除冗余記錄 74
3.3探索醫院數據集 74
3.3.1str(df)函數的輸出 74
3.3.2View函數的輸出 75
3.3.3colnames函數 75
3.3.4summary函數 76
3.3.5在瀏覽器中打開文件 77
3.3.6繪制分布圖 77
3.3.7變量的可視化繪圖 78
3.4轉置數據幀 80
3.5缺失值 84
3.5.1建立缺失值測試數據集 84
3.5.2缺失值的不同類型 85
3.5.3糾正缺失值 87
3.5.4使用替換過的值運行回歸 90
3.6替換分類變量 91
3.7異常值 91
3.7.1異常值為什么重要 91
3.7.2探測異常值 92
3.8數據轉換 96
3.8.1生成測試數據 97
3.8.2Box-Cox轉換 97
3.9變量化簡/變量重要性 98
3.9.1主成分分析法 98
3.9.2全子集回歸 102
3.9.3變量重要性 104
3.10參考資料 106
3.11本章小結 106
第4章 回歸算法導論 107
4.1監督學習模型和無監督學習模型 108
4.1.1監督學習模型 108
4.1.2無監督學習模型 108
4.2回歸技術 109
4.3廣義線性模型 110
4.4邏輯回歸 110
4.4.1比率 111
4.4.2邏輯回歸系數 111
4.4.3示例:在醫療中使用邏輯回歸來預測疼痛閾值 112
4.4.4GLM模型擬合 114
4.4.5檢驗殘差項 115
4.4.6添加變量的分布圖 116
4.4.7p值及其效應量 117
4.4.8p值及其影響范圍 118
4.4.9變量選擇 119
4.4.10交互 121
4.4.11擬合優度統計量 123
4.4.12置信區間和Wald統計 124
4.4.13基本回歸診斷圖 124
4.4.14分布圖類型描述 124
4.4.15擬合優度:Hosmer-Lemeshow檢驗 126
4.4.16正則化 127
4.4.17示例:ElasticNet 128
4.4.18選擇一個正確的Lambda 128
4.4.19基于Lambda輸出可能的系數 129
4.5本章小結 130
第5章決策樹、聚類和SVM導論 131
5.1決策樹算法 131
5.1.1決策樹的優點 131
5.1.2決策樹的缺點 132
5.1.3決策樹的基本概念 132
5.1.4擴展樹 132
5.1.5不純度 133
5.1.6控制樹的增長 134
5.1.7決策樹算法的類型 134
5.1.8檢查目標變量 135
5.1.9在rpart模型中使用公式符號 135
5.1.10圖的解釋 136
5.1.11輸出決策樹的文本版本 137
5.1.12修剪 138
5.1.13渲染決策樹的其他選項 139
5.2聚類分析 140
5.2.1聚類分析應用于多種行業 140
5.2.2什么是聚類 140
5.2.3聚類的類型 141
5.2.4k均值聚類算
展開全部
機械工業出版社數據分析與決策技術叢書實用預測分析 作者簡介
作者簡介
拉爾夫·溫特斯(Ralph Winters)目前在一家醫療服務公司擔任數據架構師。他已經給很多名列世界500強的大企業提供過自己在統計和分析方面的經驗,包括金融、市場營銷、保險、醫療和制藥領域的企業。他的工作包括很多不同類型的預測分析項目,包括客戶保留、反洗錢、客戶之聲文本挖掘分析,以及醫療風險和客戶選擇模型。
書友推薦
- >
自卑與超越
- >
經典常談
- >
羅曼·羅蘭讀書隨筆-精裝
- >
月亮與六便士
- >
有舍有得是人生
- >
李白與唐代文化
- >
名家帶你讀魯迅:故事新編
- >
回憶愛瑪儂
本類暢銷