數據分析與挖掘――R語言 版權信息
- ISBN:9787121415388
- 條形碼:9787121415388 ; 978-7-121-41538-8
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據分析與挖掘――R語言 本書特色
大數據的出現改變了傳統數據收集、存儲、處理的方式,數據采集方式更加多樣化,數據來源更加廣泛,數據分析也從發現簡單因果關系的傳統模式演變為尋找豐富聯系的相關關系。要從大數據中發現、挖掘出隱藏的、預先沒有設定的、未知的、有潛在價值的關系、模式或趨勢,需要解決兩個方面的問題:一是處理數據的技術與工具;二是處理數據所需要的方法與模型。
數據分析與挖掘以統計學為基礎,實現描述性、預測性、指導性三個層次的分析目標與應用。常用的實現方法及模型有聚類分析、回歸分析、決策樹(分類算法)、關聯規則分析、人工神經網絡、遺傳算法、可視化等。本書在第2章中簡單介紹了分類與預測的部分模型,力圖采用簡明扼要的語言使讀者能夠對模型有所了解。
數據分析與挖掘――R語言 內容簡介
本書以R語言簡介、數據挖掘基礎為開篇,旨在讓讀者對所用工具及數據挖掘方法有所了解。隨后的章節借助實際案例(數據挖掘網站用戶行為分析及網頁智能推薦、生活服務點評網站客戶分群、水冷中央空調系統的優化控制策略、電商評價文本的主題特征詞分析、均線投資策略等),從數據預處理、模型選擇、算法介紹、R語言實現、結論分析及評價等方面進行詳盡的論述,希望讀者既可以了解數據分析與挖掘的一般流程及方法,又能對常用的算法及模型有所了解。每個案例分析都是一篇完整的論文,初學者通過它們可以了解數據分析與挖掘的一般流程及方法,有一定基礎的讀者可以思考算法的優劣與選擇。不管是對數據分析與挖掘感興趣的入門者,還是希望獲得實踐經驗的初學者,都可以從本書中獲得支持。
數據分析與挖掘――R語言 目錄
第1章 R語言簡介 1
1.1 獲取R 1
1.2 R使用入門 4
1.2.1 R操作界面 4
1.2.2 RStudio窗口介紹 5
1.2.3 R的常用操作 6
1.3 R的簡單操作 8
1.3.1 基本數學運算 8
1.3.2 變量 8
1.3.3 數據結構 9
1.4 R數據分析包 12
1.5 小結 12
參考文獻 13
第2章 數據挖掘基礎 14
2.1 數據挖掘的定義 14
2.2 數據探索及預處理 15
2.2.1 臟數據分析 15
2.2.2 數據特征分析 19
2.2.3 數據預處理 23
2.3 模型簡介 27
2.3.1 聚類模型 27
2.3.2 回歸模型 31
2.3.3 決策樹 34
2.3.4 人工神經網絡 35
2.3.5 關聯規則分析模型 38
2.4 小結 42
參考文獻 42
第3章 數據挖掘網站用戶行為分析及網頁智能推薦 44
3.1 背景與挖掘目標 44
3.2 用戶分群 47
3.2.1 用戶分群的分析方法 47
3.2.2 數據的抽取 48
3.2.3 數據的預處理與探索分析 49
3.2.4 用戶分群結果 57
3.2.5 用戶分群的應用 66
3.3 網頁智能推薦 66
3.3.1 網頁智能推薦的分析方法 66
3.3.2 數據的預處理 67
3.3.3 組合推薦模型 68
3.3.4 組合推薦結果 78
3.4 總結 78
3.4.1 相關結論及應用 78
3.4.2 相關的問題思考 78
參考文獻 79
第4章 生活服務點評網站客戶分群 80
4.1 背景與挖掘目標 80
4.2 分析方法與過程 81
4.2.1 數據抽取 82
4.2.2 數據探索 82
4.2.3 數據預處理 94
4.2.4 模型構建 102
4.3 小結 113
第5章 水冷中央空調系統的優化控制策略 114
5.1 背景及挖掘目標 114
5.2 分析的方法及流程 115
5.3 數據預處理 118
5.3.1 變量選取 118
5.3.2 數據探索 120
5.3.3 數據變換 130
5.4 優化控制模型 131
5.4.1 總耗電量與可控變量 132
5.4.2 冷卻負載與可控變量 140
5.5 模型求解 144
5.5.1 工作日模型求解 144
5.5.2 確定狀態值 148
5.6 總結 155
參考文獻 156
第6章 電商評價文本的主題特征詞分析 157
6.1 背景與挖掘目標 157
6.2 分析的方法及過程 158
6.2.1 評論數據采集 159
6.2.2 文本數據預處理 161
6.2.3 基于LDA主題模型的特征詞分析 167
6.3 小結 169
參考文獻 169
第7章 均線投資策略 171
7.1 背景及投資策略介紹 171
7.1.1 移動平均線相關理論介紹 172
7.1.2 名詞及概念介紹 175
7.2 基于移動平均線的投資策略 176
7.2.1 單均線投資策略 177
7.2.2 雙均線投資策略 177
7.3 雙均線投資策略實際應用 178
7.3.1 雙均線投資策略總體流程 178
7.3.2 數據獲取 178
7.3.3 簡單的K線圖實現 179
7.3.4 均線模型 180
7.3.5 其他雙均線策略的收益 188
7.4 主要結論及展望 189
7.4.1 結論 189
7.4.2 后續策略的展望 190
參考文獻 191
致謝 192
展開全部
數據分析與挖掘――R語言 作者簡介
蔡銀英,女,副教授,就職于重慶第二師范學院,主持市級重點項目一項,主研市級項目四項,主要負責數據分析,模型構建相關的工作。