-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
大數(shù)據(jù)處理方法與電信客戶價值管理 版權(quán)信息
- ISBN:9787121394560
- 條形碼:9787121394560 ; 978-7-121-39456-0
- 裝幀:暫無
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
大數(shù)據(jù)處理方法與電信客戶價值管理 內(nèi)容簡介
本書集結(jié)了作者近年來在大數(shù)據(jù)及其應(yīng)用領(lǐng)域的研究成果, 針對大數(shù)據(jù)高效處理問題, 從點排序識別聚類、多標(biāo)簽排序、不平衡數(shù)據(jù)采樣、主動學(xué)習(xí)、增量學(xué)習(xí)等方面研究并設(shè)計了相關(guān)算法。在此基礎(chǔ)上, 對大數(shù)據(jù)環(huán)境下電信客戶價值評價、客戶換機預(yù)測和客戶流失預(yù)測等問題, 設(shè)計了相關(guān)算法、流程和仿真實驗, 并提出了一些合理化的建議, 為大數(shù)據(jù)分析與在相關(guān)行業(yè)的應(yīng)用提供了參考。
大數(shù)據(jù)處理方法與電信客戶價值管理 目錄
第1章 大數(shù)據(jù)處理概述 1
1.1 大數(shù)據(jù)的定義 1
1.2 大數(shù)據(jù)帶來的挑戰(zhàn)與機遇 3
1.3 大數(shù)據(jù)研究的現(xiàn)狀 5
1.3.1 大數(shù)據(jù)處理平臺 5
1.3.2 大數(shù)據(jù)處理算法 6
1.3.3 大數(shù)據(jù)應(yīng)用研究 9
1.4 大數(shù)據(jù)研究的挑戰(zhàn)與趨勢 10
1.5 本章小結(jié) 11
參考文獻 12
第2章 Spark點排序識別聚類結(jié)構(gòu)算法 19
2.1 引言 19
2.2 點排序識別聚類結(jié)構(gòu)算法 21
2.3 Spark并行內(nèi)存計算框架 23
2.4 基于Spark的OPTICS算法 25
2.5 仿真實驗與結(jié)果分析 27
2.5.1 度量標(biāo)準(zhǔn) 27
2.5.2 數(shù)據(jù)集與運行環(huán)境 28
2.5.3 實驗方法 29
2.5.4 實驗結(jié)果與分析 29
2.6 本章小結(jié) 32
參考文獻 33
第3章 Spark標(biāo)簽校準(zhǔn)排序多標(biāo)簽算法 35
3.1 引言 35
3.2 校準(zhǔn)標(biāo)簽排序算法與并行化研究 36
3.2.1 校準(zhǔn)標(biāo)簽排序算法介紹 36
3.2.2 校準(zhǔn)標(biāo)簽排序算法研究現(xiàn)狀 37
3.3 樸素貝葉斯校準(zhǔn)標(biāo)簽排序方法 37
3.3.1 樸素貝葉斯概率模型 37
3.3.2 樸素貝葉斯校準(zhǔn)標(biāo)簽排序算法 38
3.3.3 仿真實驗與結(jié)果分析 40
3.4 樸素貝葉斯校準(zhǔn)標(biāo)簽排序方法的并行化研究 44
3.4.1 Spark并行化內(nèi)存計算 44
3.4.2 樸素貝葉斯校準(zhǔn)標(biāo)簽排序算法的并行化研究 45
3.4.3 仿真實驗與結(jié)果分析 47
3.5 本章小結(jié) 51
參考文獻 52
第4章 不平衡數(shù)據(jù)的樣本權(quán)重欠采樣方法 54
4.1 引言 54
4.2 不平衡數(shù)據(jù)處理的相關(guān)方法 55
4.2.1 K-means聚類算法 55
4.2.2 AdaCost算法 56
4.2.3 Bagging算法 58
4.3 基于樣本權(quán)重的欠采樣方法 59
4.3.1 樣本權(quán)重的確定 59
4.3.2 分類器加權(quán)投票 60
4.4 仿真實驗與結(jié)果分析 61
4.4.1 分類的評價方法 61
4.4.2 非參數(shù)統(tǒng)計檢驗方法 62
4.4.3 UCI數(shù)據(jù)集檢驗 63
4.5 本章小結(jié) 67
參考文獻 68
第5章 不平衡數(shù)據(jù)的三支決策過采樣算法 70
5.1 引言 70
5.2 三支決策粗糙集 71
5.2.1 鄰域模型 71
5.2.2 鄰域三支決策模型 71
5.3 不平衡數(shù)據(jù)的三支決策過采樣算法 74
5.3.1 算法思路 74
5.3.2 算法描述與分析 76
5.4 仿真實驗與結(jié)果分析 77
5.4.1 數(shù)據(jù)集選擇 77
5.4.2 實驗方法 78
5.4.3 實驗結(jié)果分析 79
5.5 本章小結(jié) 84
參考文獻 84
第6章 三支決策主動學(xué)習(xí)方法 87
6.1 引言 87
6.2 主動學(xué)習(xí)理論 88
6.2.1 主動學(xué)習(xí)工作機制 88
6.2.2 主動學(xué)習(xí)方法的分類 88
6.3 三支決策主動學(xué)習(xí) 89
6.3.1 對冗余信息的刪減 89
6.3.2 對無標(biāo)簽樣本的區(qū)域劃分 90
6.3.3 對不同區(qū)域樣本的處理 91
6.3.4 算法描述 92
6.4 仿真實驗與結(jié)果分析 95
6.4.1 數(shù)據(jù)集選擇 95
6.4.2 實驗方法 95
6.4.3 實驗結(jié)果分析 96
6.5 本章小結(jié) 100
參考文獻 100
第7章 鄰域粗糙集主動學(xué)習(xí)方法 104
7.1 引言 104
7.2 鄰域粗糙集基本理論 104
7.3 鄰域粗糙集主動學(xué)習(xí)算法 106
7.3.1 算法思路 106
7.3.2 算法描述 109
7.4 仿真實驗與結(jié)果分析 110
7.4.1 數(shù)據(jù)集與實驗方法 110
7.4.2 結(jié)果與分析 111
7.5 本章小結(jié) 117
參考文獻 118
第8章 決策熵增量學(xué)習(xí)方法 120
8.1 引言 120
8.2 粗糙集的基本概念 121
8.3 決策熵增量知識獲取算法 123
8.3.1 算法復(fù)雜度分析 126
8.3.2 實例分析 126
8.4 仿真實驗與結(jié)果分析 128
8.4.1 UCI數(shù)據(jù)集測試 128
8.4.2 KDDCUP99數(shù)據(jù)集測試 130
8.4.3 KDDCUP99數(shù)據(jù)集連續(xù)增量測試 130
8.5 本章小結(jié) 131
參考文獻 131
第9章 MapReduce并行增量FP-Growth算法 133
9.1 引言 133
9.2 MapReduce編程模型與Hadoop平臺 135
9.2.1 MapReduce編程模型 135
9.2.1 Hadoop平臺介紹 136
9.3 MapReduce增量FP-Growth算法 138
9.3.1 增量學(xué)習(xí) 138
9.3.2 FP-Growth算法 139
9.3.3 MapReduce并行FP-Growth算法 140
9.3.4 MapReduce并行增量FP-Growth算法 141
9.4 仿真實驗與結(jié)果分析 143
9.4.1 MapReduce并行增量FP-Growth算法單機效率測試 143
9.4.2 MapReduce并行增量FP-Growth算法集群效率測試 143
9.4.3 Mapreduce并行增量FP-Growth算法性能測試 146
9.5 本章小結(jié) 149
參考文獻 149
第10章 電信客戶價值評價 151
10.1 引言 151
10.2 客戶價值與評價 152
10.2.1 客戶價值的概念 152
10.2.2 電信客戶價值與評價 153
10.3 優(yōu)勢關(guān)系粗糙集的基本概念 155
10.4 領(lǐng)域及數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘模型 156
10.4.1 數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘 156
10.4.2 領(lǐng)域驅(qū)動的數(shù)據(jù)挖掘 157
10.4.3 面向領(lǐng)域的數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘 158
10.5 領(lǐng)域及數(shù)據(jù)驅(qū)動的電信客戶價值評價方法 159
10.5.1 電信客戶價值評價的特征提取 159
10.5.2 電信客戶價值評價流程 161
10.5.3 電信客戶價值評價算法 162
10.6 仿真實驗 163
10.6.1 算法效果驗證 163
10.6.2 算法應(yīng)用 165
10.7 本章小結(jié) 167
參考文獻 167
第11章 電信客戶換機預(yù)測 171
11.1 引言 171
11.2 優(yōu)勢關(guān)系粗糙集換機預(yù)測方法 172
11.2.1 算法描述 172
11.2.2 仿真實驗 174
11.3 數(shù)據(jù)驅(qū)動的電信客戶換機預(yù)測方法 179
11.3.1 手機客戶特征提取 179
11.3.2 算法描述 180
11.3.3 仿真實驗 182
11.4 本章小結(jié) 185
參考文獻 186
第12章 電信客戶流失預(yù)測 188
12.1 引言 188
12.2 C4.5決策樹及其改進算法 189
12.2.1 C4.5決策樹 189
12.2.2 改進C4.5決策樹算法 190
12.3 改進C4.5決策樹不平衡數(shù)據(jù)抽樣方法 191
12.3.1 算法思路 191
12.3.2 算法描述 192
12.4 實驗與結(jié)果分析 193
12.4.1 電信客戶流失預(yù)測流程 194
12.4.2 實驗數(shù)據(jù)選擇 195
12.2.3 實驗結(jié)果與分析 196
12.5 本章小結(jié) 198
參考文獻 198
大數(shù)據(jù)處理方法與電信客戶價值管理 作者簡介
鄧維斌:男,1978年生,中共黨員,博士,教授,碩士生導(dǎo)師,交通部交通運輸青年科技英才,Queensland University of Technology、Poznan University of Technology訪問學(xué)者。現(xiàn)任重慶郵電大學(xué)郵政研究院副院長,重慶市人工智能學(xué)會理事,國際粗糙集學(xué)會(IRSS)會員。主要從事大數(shù)據(jù)分析、不確定性決策、現(xiàn)代物流與快遞服務(wù)等方面的研究。近年來主持和參與了包括國家重點研發(fā)計劃、國家自然科學(xué)基金和社會科會基金等項目10余項,承擔(dān)和參與了國家郵政管理局、重慶市發(fā)展委、渝中區(qū)、巴南區(qū)等委托的各類橫向合作課題20余項;在Fundamenta Informaticae、《計算機學(xué)報》《系統(tǒng)工程理論與實踐》等SCI、權(quán)威期刊等發(fā)表研究論文50余篇;在科學(xué)出版社、電子工業(yè)出版社等出版專著和教材7部。
- >
李白與唐代文化
- >
經(jīng)典常談
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
自卑與超越
- >
苦雨齋序跋文-周作人自編集
- >
伊索寓言-世界文學(xué)名著典藏-全譯本
- >
我與地壇
- >
名家?guī)阕x魯迅:朝花夕拾