R語言與數據挖掘 版權信息
- ISBN:9787111540526
- 條形碼:9787111540526 ; 978-7-111-54052-6
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
R語言與數據挖掘 本書特色
這是公認的、權威的適合教學和零基礎自學的r語言與數據挖掘教程,華南師范大學、廣東工業大學、廣西科技大學等20余所大學選為教材。即便你完全沒有r語言編程基礎和數據挖掘基礎,根據本書中的理論知識和上機實踐,你也能迅速掌握如何使用r語言進行數據挖掘。本書已經被多少高校預定為教材,為了便于教學,書中還提供了大量的上機實驗和教學資源。
本書主要分為三個部分:
基礎篇(1~5章),主要包括r語言及圖形操作工具rstudio的安裝及使用方法、數據類型和數據對象、數據預處理的常用操作(包括數據重命名、缺失值分析、排序、隨機抽樣等)、繪圖功能(包括散點圖、直方圖、條形圖、箱線圖等)。
建模應用篇(6~10章),主要對數據挖掘中的常用算法的函數在r語言中的使用方法及其結果解釋進行了介紹。涵蓋了目前數據挖掘的5大類算法,包括分類與預測、聚類分析、關聯規則、智能推薦和時序模式。按照模型建立至模型評價的架構進行介紹,使讀者能熟練的掌握從建模到對模型評價的完整建模過程。
rattle篇(11章),此工具能夠在一個圖形化的界面上對本書所介紹的r語言功能進行操作,使讀者能更好的體驗到使用r語言進行數據挖掘的整個流程。
書中配套提供了原始樣本數據文件及對應章節示例代碼。每個章節有對應的練習實驗和教學ppt,讀者可通過完成對應的練習,迅速掌握r語言的用法和數據挖掘的方法。
R語言與數據挖掘 內容簡介
10余位數據挖掘領域資深專家和科研人員,10余年大數據挖掘咨詢與實施經驗結晶。
為零基礎r語言與數據挖掘教學和自學量身打造,系統講解r語言與數據挖掘的**知識,配有大量的上機實驗、源代碼和教學ppt資源。
R語言與數據挖掘 目錄
前 言**部分 基礎篇第1章 r語言的安裝與使用 21.1 r安裝與升級 31.2 r使用入門 41.2.1 r操作界面 41.2.2 rstudio窗口介紹 51.2.3 r常用操作 61.3 r數據分析包 81.4 配套資源使用說明 101.5 小結 101.6 上機實驗 10第2章 數據對象與數據讀寫 122.1 數據類型 122.2 數據結構 162.2.1 向量 162.2.2 矩陣 192.2.3 數組 242.2.4 數據框 252.2.5 因子 282.2.6 列表 312.3 數據文件的讀寫 342.3.1 鍵盤輸入數據 342.3.2 讀取不同格式的數據 352.3.3 從其他統計軟件獲取數據 372.3.4 從數據庫獲取數據 372.3.5 從網頁獲取數據 392.4 小結 402.5 上機實驗 40第3章 r語言常用數據管理 423.1 變量的重命名 423.2 缺失值分析 453.3 數據排序 463.4 隨機抽樣 483.5 數值運算函數 493.6 字符串處理 523.7 文本分詞 563.8 apply函數族 623.9 數據整合 653.10 控制流 683.11 函數的編寫 713.12 小結 723.13 上機實驗 73第4章 圖形探索 754.1 圖形元素 764.1.1 顏色 764.1.2 點 804.1.3 文本 824.1.4 線條 864.1.5 圖例 914.1.6 坐標軸 924.2 圖形組合 944.3 圖形保存 974.4 圖形函數 984.5 小結 1164.6 上機實驗 116第5章 高級繪圖工具 1175.1 lattice包繪圖工具 1175.1.1 繪圖特色 1175.1.2 基本圖形 1225.2 ggplot2包繪圖工具 1355.2.1 從qplot開始 1355.2.2 ggplot作圖 1375.3 交互式繪圖工具簡介 1425.3.1 rcharts包 1435.3.2 recharts包 1475.3.3 googlevis包 1475.3.4 htmlwidgets包 1485.3.5 shiny包 1535.4 小結 1635.5 上機實驗 163第二部分 建模應用篇第6章 分類與預測 1666.1 回歸分析 1666.2 決策樹 1756.2.1 c4.5算法 1766.2.2 cart算法 1786.2.3 c5.0算法 1806.3 人工神經網絡 1816.4 knn算法 1836.5 樸素貝葉斯分類 1856.6 其他分類與預測算法函數 1876.7 分類與預測算法評價 1926.8 小結 1966.9 上機實驗 196第7章 聚類分析 1987.1 k-means聚類分析函數 1997.2 層次聚類算法 2047.3 其他聚類分析函數 2077.4 小結 2117.5 上機實驗 212第8章 關聯規則 2138.1 apriori關聯規則 2148.2 小結 2268.3 上機實驗 226第9章 智能推薦 2289.1 智能推薦模型構建 2289.2 智能推薦模型評價 2329.3 小結 2359.4 上機實驗 235第10章 時間序列 23710.1 arima模型 23710.2 其他時間序列模型 24510.3 小結 25010.4 上機實驗 251第三部分 rattle篇第11章 可視化數據挖掘工具rattle 25411.1 rattle簡介及其安裝 25411.1.1 rattle簡介 25411.1.2 rattle安裝 25411.2 功能預覽 25511.3 數據導入 25611.3.1 導入csv數據 25611.3.2 導入arff數據 26111.3.3 導入odbc數據 26211.3.4 r dataset——導入其他數據源 26411.3.5 導入rdata file數據集 26711.3.6 導入library數據 26811.4 數據探索 26911.4.1 數據總體概況 26911.4.2 數據分布探索 27211.4.3 相關性 27511.4.4 主成分 27711.4.5 交互圖 27811.5 數據建模 28311.5.1 聚類分析 28311.5.2 關聯規則 28811.5.3 決策樹 29111.5.4 隨機森林 29311.6 模型評估 29611.6.1 混淆矩陣 29611.6.2 風險圖 29611.6.3 roc圖及相關圖表 29711.6.4 模型得分數據集 29811.7 小結 29911.8 上機實驗 299參考資料 301
展開全部
R語言與數據挖掘 作者簡介
張良均
資深大數據挖掘專家,高級信息項目管理師,有近20年的大數據挖掘應用、咨詢和培訓經驗,被稱為“中國大數據挖掘培訓教父”。為電信、電力、政府、互聯網、生產制造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗豐富。現任廣東工業大學、華南師范大學、華南農業大學等6所高校兼職教授。著有《神經網絡實用教程》《數據挖掘:實用案例分析》《R語言數據分析與挖掘實戰》等暢銷圖書。
謝佳標
資深R語言專家,多次于中國R語言大會發表演講,具有十余年的數據挖掘實戰經驗。目前于某上市互聯網游戲公司,任高級數據分析師,負責大數據挖掘及可視化。培訓過的精品課程有:《R語言基礎培訓》《數據分析之R語言實戰》《機器學習與R語言實踐》等。
萬正勇
某國際投行VP,有超過10年的金融系統大數據挖掘及分析經驗,超過15年的大型金融機構核心交易系統規劃設計開發經驗。數據庫及中間件專家,先后獲得中國首屆十大杰出數據庫工程師,Oracle 中間件 ACE Director以及 Oracle 數據庫 ACE 等稱號。曾為電信,電力,航空,銀行,保險,互聯網,交通,制造等等行業相關龍頭企業提供過咨詢服務。著有《衍生數學》,《Oracle數據庫DBA專題技術精粹》等暢銷書。