-
>
闖進(jìn)數(shù)學(xué)世界――探秘歷史名題
-
>
中醫(yī)基礎(chǔ)理論
-
>
當(dāng)代中國(guó)政府與政治(新編21世紀(jì)公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國(guó)特色社會(huì)主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學(xué)·全國(guó)中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
數(shù)據(jù)挖掘:原理與應(yīng)用 版權(quán)信息
- ISBN:9787111696308
- 條形碼:9787111696308 ; 978-7-111-69630-8
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>>
數(shù)據(jù)挖掘:原理與應(yīng)用 本書(shū)特色
解析大數(shù)據(jù)挖掘與分析常用算法,掌握大數(shù)據(jù)挖掘問(wèn)題的解決途徑
數(shù)據(jù)挖掘:原理與應(yīng)用 內(nèi)容簡(jiǎn)介
目前,數(shù)據(jù)挖掘類課程已成為我國(guó)新工科教育的數(shù)據(jù)科學(xué)思維提升課程,成為信息、電子等各類工科專業(yè)本科生與研究生的必修課。本書(shū)深入淺出地介紹了數(shù)據(jù)挖掘和數(shù)據(jù)分析的知識(shí)、常用的各類算法;系統(tǒng)梳理與比較各類算法的優(yōu)缺點(diǎn)與適用場(chǎng)景。本書(shū)內(nèi)容結(jié)合作者多年的科研和教學(xué)經(jīng)驗(yàn),大量案例來(lái)自作者的項(xiàng)目和科研成果,不僅適合作為大數(shù)據(jù)特色類專業(yè)的本科生和研究生教材,同時(shí)也適合機(jī)械、航空等其他工科專業(yè)的入門與自學(xué)教材,還可作為各專業(yè)本科生與研究生考試復(fù)習(xí)的參考資料。
數(shù)據(jù)挖掘:原理與應(yīng)用 目錄
第1章 緒論1
1.1 數(shù)據(jù)挖掘的出現(xiàn)1
1.2 為什么要學(xué)習(xí)數(shù)據(jù)挖掘1
1.2.1 數(shù)據(jù)爆炸但知識(shí)貧乏1
1.2.2 從商業(yè)數(shù)據(jù)到商業(yè)智能的進(jìn)化2
1.2.3 科學(xué)發(fā)展范式2
1.3 什么是數(shù)據(jù)挖掘3
1.3.1 數(shù)據(jù)挖掘的出現(xiàn)3
1.3.2 數(shù)據(jù)挖掘的定義3
1.3.3 數(shù)據(jù)的含義4
1.3.4 信息的含義4
1.3.5 知識(shí)的含義5
1.3.6 數(shù)據(jù)、信息、知識(shí)的關(guān)系5
1.3.7 數(shù)據(jù)挖掘過(guò)程5
1.3.8 數(shù)據(jù)挖掘的關(guān)聯(lián)課程6
1.4 數(shù)據(jù)挖掘的內(nèi)容7
1.4.1 關(guān)聯(lián)規(guī)則挖掘7
1.4.2 分類7
1.4.3 聚類9
1.4.4 回歸10
1.5 本章小結(jié)10
第2章 認(rèn)識(shí)數(shù)據(jù)11
2.1 數(shù)據(jù)的基本概念11
2.1.1 數(shù)據(jù)對(duì)象11
2.1.2 數(shù)據(jù)屬性12
2.1.3 屬性的類型13
2.1.4 屬性類型的對(duì)比14
2.1.5 離散屬性與連續(xù)屬性14
2.2 數(shù)據(jù)的基本統(tǒng)計(jì)方法15
2.2.1 中心化趨勢(shì)統(tǒng)計(jì)量:均值、中位數(shù)和眾數(shù)15
2.2.2 離散度度量16
2.2.3 分布形狀度量17
2.3 數(shù)據(jù)的基本可視化方法18
2.3.1 箱線圖可視化18
2.3.2 直方圖可視化19
2.3.3 散點(diǎn)圖可視化19
2.4 數(shù)據(jù)相似性的計(jì)算方法20
2.4.1 數(shù)據(jù)相似性和相異性度量的基本概念20
2.4.2 標(biāo)稱屬性的鄰近性度量21
2.4.3 二值屬性的鄰近性度量22
2.4.4 序數(shù)屬性的鄰近性度量23
2.4.5 數(shù)值屬性的鄰近性度量23
2.4.6 混合類型屬性的鄰近性度量25
2.4.7 余弦相似性25
2.5 本章小結(jié)26
第3章 數(shù)據(jù)預(yù)處理27
3.1 數(shù)據(jù)質(zhì)量27
3.2 數(shù)據(jù)預(yù)處理的主要任務(wù)27
3.2.1 數(shù)據(jù)清理27
3.2.2 數(shù)據(jù)集成28
3.2.3 數(shù)據(jù)規(guī)約32
3.2.4 數(shù)據(jù)規(guī)范化和數(shù)據(jù)離散化37
3.3 特征構(gòu)造38
3.3.1 為什么需要特征構(gòu)造38
3.3.2 基本特征構(gòu)造法38
3.3.3 時(shí)間類型數(shù)據(jù)特征構(gòu)造法39
3.3.4 時(shí)間序列數(shù)據(jù)特征構(gòu)造法41
3.3.5 離散數(shù)據(jù)特征啞編碼42
3.4 本章小結(jié)43
第4章 分類的基本概念與樸素貝葉斯分類器44
4.1 分類的基本概念44
4.2 樸素貝葉斯分類的基礎(chǔ)理論45
4.2.1 貝葉斯示例45
4.2.2 貝葉斯定理46
4.2.3 極大后驗(yàn)假設(shè)46
4.2.4 多維屬性的聯(lián)合概率47
4.2.5 獨(dú)立性假設(shè)47
4.2.6 訓(xùn)練集介紹47
4.3 貝葉斯分類的案例48
4.3.1 案例一:購(gòu)買電腦預(yù)測(cè)48
4.3.2 案例二:垃圾郵件分類49
4.4 連續(xù)類型數(shù)據(jù)分類50
4.5 本章小結(jié)50
第5章 決策樹(shù)分類51
5.1 決策樹(shù)51
5.2 決策樹(shù)構(gòu)建的兩個(gè)問(wèn)題52
5.2.1 如何構(gòu)建決策樹(shù)52
5.2.2 構(gòu)造什么樣的決策樹(shù)是合適的53
5.3 決策樹(shù)算法54
5.3.1 Hunt算法54
5.3.2 構(gòu)建決策樹(shù)的關(guān)鍵問(wèn)題56
5.3.3 信息增益算法57
5.3.4 C4.5算法59
5.3.5 CART算法61
5.4 本章小結(jié)64
第6章 規(guī)則和*近鄰分類器66
6.1 基于規(guī)則的分類66
6.1.1 基于規(guī)則的分類示例66
6.1.2 規(guī)則的質(zhì)量68
6.1.3 規(guī)則分類器的特征68
6.1.4 基于規(guī)則的分類器的建立69
6.1.5 規(guī)則分類的特點(diǎn)76
6.2 急切學(xué)習(xí)與惰性學(xué)習(xí)76
6.3 *近鄰分類器77
6.3.1 *近鄰算法的定義77
6.3.2 K*近鄰分類算法78
6.4 本章小結(jié)79
第7章 回歸算法80
7.1 線性回歸的案例:房?jī)r(jià)預(yù)測(cè)80
7.2 線性回歸算法81
7.2.1 線性回歸的提出81
7.2.2 線性回歸建模81
7.2.3 *小二乘法82
7.3 優(yōu)化求解方法83
7.3.1 梯度下降83
7.3.2 梯度下降法求解83
7.3.3 學(xué)習(xí)率分析84
7.3.4 梯度下降法收斂85
7.3.5 梯度下降法的變體86
7.4 邏輯回歸87
7.4.1 邏輯回歸函數(shù)87
7.4.2 邏輯回歸的特點(diǎn)87
7.4.3 優(yōu)勢(shì)比88
7.4.4 邏輯回歸參數(shù)估計(jì)89
7.4.5 邏輯回歸正則化90
7.4.6 邏輯回歸數(shù)值優(yōu)化91
7.4.7 邏輯回歸訓(xùn)練方法的優(yōu)化93
7.5 決策樹(shù)回歸94
7.5.1 決策樹(shù)回歸的基本概念94
7.5.2 決策樹(shù)分類*佳劃分點(diǎn)的選擇94
7.5.3 決策樹(shù)回歸算法96
7.6 本章小結(jié)96
第8章 模型的評(píng)價(jià)97
8.1 分類模型的評(píng)價(jià)指標(biāo)97
8.1.1 混淆矩陣97
8.1.2 準(zhǔn)確率97
8.1.3 精確率與召回率98
8.1.4 ROC曲線99
8.2 不平衡分類102
8.2.1 基于抽樣的方法103
8.2.2 兩階段學(xué)習(xí)104
8.2.3 代價(jià)敏感學(xué)習(xí)104
8.3 過(guò)擬合與欠擬合105
8.3.1 訓(xùn)練誤差和泛化誤差105
8.3.2 噪聲導(dǎo)致的過(guò)擬合107
8.3.3 缺乏代表性樣本導(dǎo)致的過(guò)擬合107
8.3.4 解決過(guò)擬合的方法一:減少泛化誤差109
8.3.5 解決過(guò)擬合的方法二:使用確認(rèn)集估計(jì)泛化誤差110
8.4 其他模型評(píng)價(jià)指標(biāo)113
8.4.1 回歸模型113
8.4.2 聚類模型114
8.4.3 關(guān)聯(lián)規(guī)則模型115
8.5 本章小結(jié)117
第9章 支持向量機(jī)分類器118
9.1 支持向量機(jī)的提出118
9.1.1 支持向量機(jī)簡(jiǎn)介118
9.1.2 傳統(tǒng)分類方法的不足118
9.1.3 支持向量機(jī)的總體思想119
9.1.4 從Logistic回歸到SVM分析119
9.1.5 支持向量機(jī)的應(yīng)用120
9.2 深入支持向量機(jī)121
9.2.1 支持向量機(jī)算法的原理121
9.2.2 支持向量機(jī)建模122
9.2.3 支持向量機(jī)求解123
9.3 非線性支持向量機(jī)126
9.3.1 基于軟間隔的C-SVM126
9.3.2 非線性SVM與核變換129
9.3.3 支持向量機(jī)二分類推廣131
9.4 本章小結(jié)131
第10章 神經(jīng)網(wǎng)絡(luò)分類器132
10.1 人工神經(jīng)網(wǎng)絡(luò)出現(xiàn)的背景 132
10.1.1 發(fā)展歷程132
10.1.2 端到端的學(xué)習(xí)133
- >
上帝之肋:男人的真實(shí)旅程
- >
伯納黛特,你要去哪(2021新版)
- >
李白與唐代文化
- >
名家?guī)阕x魯迅:故事新編
- >
經(jīng)典常談
- >
莉莉和章魚(yú)
- >
唐代進(jìn)士錄
- >
推拿