包郵 數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言
-
>
貨幣大歷史:金融霸權(quán)與大國興衰六百年
-
>
(精)方力鈞作品圖錄
-
>
《藏書報》2021合訂本
-
>
(精)中國當(dāng)代書畫名家作品集·范碩:書法卷+繪畫卷(全2卷)
-
>
(噴繪樓閣版)女主臨朝:武則天的權(quán)力之路
-
>
書里掉出來一只狼+狼的故事-全2冊
-
>
奇思妙想創(chuàng)意玩具書(精裝4冊)
數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言 版權(quán)信息
- ISBN:9787111770794
- 條形碼:9787111770794 ; 978-7-111-77079-4
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:
數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言 本書特色
本書介紹了R語言、機器學(xué)習(xí)算法、統(tǒng)計方法和分析方法,用于讓讀者了解如何在數(shù)據(jù)中找到有趣的結(jié)構(gòu),以及學(xué)會如何使用數(shù)據(jù)來解決復(fù)雜問題。通過簡單、易懂的例子逐步解釋各種機器學(xué)習(xí)算法是如何獨立于任何編程語言工作的。本書詳細介紹了用R編寫的腳本,并將這些腳本應(yīng)用于具有真實數(shù)據(jù)的復(fù)雜問題。提供了腳本代碼,允許讀者在學(xué)習(xí)時執(zhí)行腳本,涵蓋了多種機器學(xué)習(xí)技術(shù)的不同實現(xiàn)方式。本書既適合作為高校計算機及相關(guān)專業(yè)的教材,也適合作為IT技術(shù)人員的參考書。
數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言 內(nèi)容簡介
本書基于R語言介紹了機器學(xué)習(xí)算法、統(tǒng)計方法和數(shù)據(jù)分析方法,讓讀者在邊學(xué)邊做的過程中學(xué)會解決實際問題。本書首先使用簡單易懂的例子來逐步解釋各種機器學(xué)習(xí)算法。接下來,介紹如何用R編寫腳本,這些腳本會應(yīng)用相關(guān)算法來解決實際數(shù)據(jù)中的問題。本書提供腳本代碼,讀者可利用相關(guān)腳本進行學(xué)習(xí)。
數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言 前言
前 言
本書主要介紹R語言、機器學(xué)習(xí)算法、統(tǒng)計方法學(xué)和分析方法,以便讀者學(xué)會使用數(shù)據(jù)來解決復(fù)雜問題。本書有兩個主要目標:
明確展示如何、為什么以及何時使用機器學(xué)習(xí)技術(shù)。
盡快為讀者提供成為R語言高效使用者所需的內(nèi)容。
本書的方法非常直接,可以稱之為“先看后做”,原因如下:
通過簡單易懂的示例,逐步解釋各種機器學(xué)習(xí)算法是如何獨立于任何編程語言工作的。
解釋了腳本的細節(jié),這些腳本與包括第4版在內(nèi)的所有R語言的版本兼容,并且可以用來解決具有真實數(shù)據(jù)的復(fù)雜問題。本書已提供這些腳本,以便讀者在閱讀本書的解釋時,可以觀察這些腳本的執(zhí)行過程。
涵蓋了多種機器學(xué)習(xí)技術(shù)的不同實現(xiàn)方式。
數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言 目錄
目 錄
譯者序
前言
第1章 機器學(xué)習(xí)導(dǎo)論1
1.1 機器學(xué)習(xí)、統(tǒng)計分析和數(shù)據(jù)科學(xué)1
1.2 機器學(xué)習(xí):**個示例2
1.2.1 屬性-值格式2
1.2.2 用于診斷疾病的決策樹3
1.3 機器學(xué)習(xí)策略5
1.3.1 分類5
1.3.2 估計6
1.3.3 預(yù)測6
1.3.4 無監(jiān)督聚類9
1.3.5 市場購物籃分析9
1.4 評估性能9
1.4.1 評估監(jiān)督模型10
1.4.2 二分類誤差分析10
1.4.3 評估數(shù)值輸出11
1.4.4 通過測量提升比較模型11
1.4.5 評估無監(jiān)督模型13
1.5 倫理問題14
1.6 本章小結(jié)14
1.7 關(guān)鍵術(shù)語15
練習(xí)題16
第2章 R語言簡介18
2.1 R語言和RStudio簡介18
2.1.1 R的特性19
2.1.2 安裝R19
2.1.3 安裝RStudio20
2.2 瀏覽RStudio21
2.2.1 控制臺21
2.2.2 源面板22
2.2.3 全局環(huán)境24
2.2.4 包28
2.3 數(shù)據(jù)在哪里29
2.4 獲取幫助和額外信息29
2.5 本章小結(jié)30
練習(xí)題30
相關(guān)安裝包和函數(shù)總結(jié)31
第3章 數(shù)據(jù)結(jié)構(gòu)和操作32
3.1 數(shù)據(jù)類型32
3.1.1 字符數(shù)據(jù)和因子33
3.2 單模式數(shù)據(jù)結(jié)構(gòu)34
3.2.1 向量34
3.2.2 矩陣和數(shù)組36
3.3 多模式數(shù)據(jù)結(jié)構(gòu)37
3.3.1 列表37
3.3.2 數(shù)據(jù)框38
3.4 編寫自己的函數(shù)39
3.4.1 寫一個簡單的函數(shù)39
3.4.2 條件語句41
3.4.3 迭代42
3.4.4 遞歸編程45
3.5 本章小結(jié)46
3.6 關(guān)鍵術(shù)語46
練習(xí)題46
相關(guān)安裝包和函數(shù)總結(jié)47
第4章 準備數(shù)據(jù)48
4.1 知識發(fā)現(xiàn)的過程模型48
4.2 創(chuàng)建目標數(shù)據(jù)集49
4.2.1 R與關(guān)系模型的接口49
4.2.2 目標數(shù)據(jù)的其他來源52
4.3 數(shù)據(jù)預(yù)處理52
4.3.1 噪聲數(shù)據(jù) 52
4.3.2 使用R進行預(yù)處理53
4.3.3 檢測異常值54
4.3.4 缺失數(shù)據(jù)55
4.4 數(shù)據(jù)轉(zhuǎn)換56
4.4.1 數(shù)據(jù)歸一化56
4.4.2 數(shù)據(jù)類型轉(zhuǎn)換57
4.4.3 屬性和實例選擇57
4.4.4 創(chuàng)建訓(xùn)練集和測試集
數(shù)據(jù)58
4.4.5 交叉驗證和自助法59
4.4.6 大規(guī)模數(shù)據(jù)59
4.5 本章小結(jié)59
4.6 關(guān)鍵術(shù)語60
練習(xí)題60
相關(guān)安裝包和函數(shù)總結(jié)61
第5章 監(jiān)督統(tǒng)計技術(shù)62
5.1 簡單線性回歸62
5.2 多元線性回歸66
5.2.1 多元線性回歸:一個示例67
5.2.2 評估數(shù)值輸出69
5.2.3 評估訓(xùn)練/測試集71
5.2.4 使用交叉驗證71
5.2.5 分類數(shù)據(jù)的線性回歸73
5.3 邏輯回歸78
5.3.1 變換線性回歸模型78
5.3.2 邏輯回歸模型79
5.3.3 R中的邏輯回歸79
5.3.4 創(chuàng)建混淆矩陣81
5.3.5 接收器操作特性曲線82
5.3.6 ROC曲線下面積85
5.4 樸素貝葉斯分類器85
5.4.1 貝葉斯分類器:一個示例85
5.4.2 零-值屬性計數(shù)87
5.4.3 缺失數(shù)據(jù)88
5.4.4 數(shù)值數(shù)據(jù)88
5.4.5 用樸素貝葉斯進行實驗90
5.5 本章小結(jié)93
5.6 關(guān)鍵術(shù)語94
練習(xí)題95
相關(guān)安裝包和函數(shù)總結(jié)97
第6章 基于樹的方法98
6.1 決策樹算法98
6.1.1 一種構(gòu)建決策樹的算法98
6.1.2 C4.5屬性選擇99
6.1.3 構(gòu)建決策樹的其他方法102
6.2 構(gòu)建決策樹:C5.0102
6.2.1 信用卡促銷的決策樹103
6.2.2 模擬客戶流失的數(shù)據(jù) 104
6.2.3 使用C5.0預(yù)測客戶流失104
6.3 構(gòu)建決策樹:rpart106
6.3.1 信用卡促銷的rpart決策樹 107
6.3.2 訓(xùn)練和測試rpart:流失
數(shù)據(jù)109
6.3.3 交叉驗證rpart:流失數(shù)據(jù)113
6.4 構(gòu)建決策樹:J48113
6.5 用于提高性能的集成技術(shù)115
6.5.1 裝袋算法116
6.5.2 提升116
6.5.3 提升:C5.0的示例117
6.5.4 隨機森林117
6.6 回歸樹119
6.7 本章小結(jié)121
6.8 關(guān)鍵術(shù)語122
練習(xí)題122
相關(guān)安裝包和函數(shù)總結(jié)123
第7章 基于規(guī)則的技術(shù)124
7.1 從樹到規(guī)則 124
7.1.1 垃圾郵件數(shù)據(jù)集125
7.1.2 垃圾郵件分類:C5.0125
7.2 基本的覆蓋規(guī)則算法128
7.3 生成關(guān)聯(lián)規(guī)則130
7.3.1 置信度和支持度130
7.3.2 挖掘關(guān)聯(lián)規(guī)則:一個示例131
7.3.3 一般考慮事項134
7.3.4 Rweka的Apriori函數(shù)134
7.4 Rattle用戶界面137
7.5 本章小結(jié)143
7.6 關(guān)鍵術(shù)語144
練習(xí)題144
相關(guān)安裝包和函數(shù)總結(jié)145
第8章 神經(jīng)網(wǎng)絡(luò)146
8.1 前饋神經(jīng)網(wǎng)絡(luò)146
8.1.1 神經(jīng)網(wǎng)絡(luò)輸入格式147
8.1.2 神經(jīng)網(wǎng)絡(luò)輸出格式148
8.1.3 sigmoid評估函數(shù)149
8.2 神經(jīng)網(wǎng)絡(luò)訓(xùn)練:概念視角150
8.2.1 使用前饋網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí)150
8.2.2 具有自組織映射的無監(jiān)督
聚類150
8.3 神經(jīng)網(wǎng)絡(luò)解釋151
8.4 一般考慮事項152
8.4.1 優(yōu)勢152
8.4.2 劣勢152
數(shù)據(jù)分析與機器學(xué)習(xí):基于R語言 作者簡介
理查德·J. 羅杰(Richard J. Roiger)
明尼蘇達州立大學(xué)曼卡托分校的榮休教授,他在計算機與信息科學(xué)系從事教學(xué)和研究工作超過30年。羅杰博士于明尼蘇達大學(xué)獲得計算機與信息科學(xué)領(lǐng)域的博士學(xué)位。在機器學(xué)習(xí)和知識發(fā)現(xiàn)領(lǐng)域,他曾發(fā)表多篇會議論文和期刊論文。退休后,羅杰博士繼續(xù)擔(dān)任兼職教師,教授關(guān)于數(shù)據(jù)科學(xué)、人工智能和研究方法的課程。羅杰博士是明尼蘇達州退休教育協(xié)會的董事會成員,并擔(dān)任該協(xié)會的財務(wù)顧問。
- >
煙與鏡
- >
經(jīng)典常談
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
詩經(jīng)-先民的歌唱
- >
自卑與超越
- >
名家?guī)阕x魯迅:朝花夕拾
- >
有舍有得是人生
- >
羅庸西南聯(lián)大授課錄
拉封丹寓言選-多雷插圖本
[法]拉封丹 著,[法]多雷 插圖,何如 譯
¥34.5¥78張學(xué)良人格圖譜
王充閭著
¥14.7¥28人間草木
汪曾祺
¥16.2¥34.8熊千佳昆蟲記
[日]熊田千佳慕著,張勇譯
¥20.2¥48連科六短篇-短篇經(jīng)典文庫
閻連科
¥9.1¥30上海灘的賈斯汀·比伯
老王子
¥13.5¥39

京ICP備09013606號-3京信市監(jiān)發(fā)[2002]122號海淀公安分局備案編號:1101083394