大數據.數據挖掘與智慧運營 版權信息
- ISBN:9787302483373
- 條形碼:9787302483373 ; 978-7-302-48337-3
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大數據.數據挖掘與智慧運營 本書特色
本書系統地介紹了大數據挖掘的基本概念、經典挖掘算法、挖掘工具和企業智慧運營應用案例。
全書分為9章,內容包括:大數據挖掘與智慧運營的概念,數據預處理,數據挖掘中的四種主流算法:聚類分析、分類分析、回歸分析、關聯分析,增強型數據挖掘算法,數據挖掘在運營商智慧運營中的應用案例,未來大數據挖掘的發展趨勢等。
全書以運用大數據挖掘方法提升企業運營業績與效率為主線,從運營商實際工作中選取了大量運營和銷售案例,詳細講述了數據采集、挖掘建模、模型落地與精準營銷的全部過程。書中大部分案例的代碼、軟件操作流程和微課視頻可以通過掃描本書封底的二維碼下載。
本書主要面向運營商及其他高科技企業員工、高等院校相關專業本科生和研究生,以及其他對數據挖掘與精準營銷感興趣的讀者。
大數據.數據挖掘與智慧運營 內容簡介
隨著移動互聯網和物聯網時代的來臨,人和萬事萬物被廣泛地聯系在一起。人們在聯系的過程產生了大量的數據,例如用戶基礎信息、網頁瀏覽記錄、歷史消費記錄、視頻監控影像,等等。據此,以Google 為首的互聯網公司提出了“大數據”(Big Data)的概念,并聲稱人類已經脫離了信息時代(Information Time,IT),進入了大數據時代(Data Time,DT)。顯然,海量數據包含了非常豐富的淺層次信息和深層次知識。對于同一競爭領域的企業,誰能獲取*量的數據,展開*精準的數據挖掘與建模分析,并加以精細化的落地實施,誰便能在行業競爭中取得優勢。
對于運營商企業而言,其具備的一個顯著優勢便是手握海量數據資源。如果能運用先進的數據挖掘技術找出客戶的行為規律,從傳統的經驗式、粗放式、“一刀切”式的運營決策向數據化、精細化、個性化的運營決策轉型,運營商將迎來新的騰飛。上述運營模式轉型的目標,便是所謂的“智慧運營”。
大數據.數據挖掘與智慧運營 目錄
第1章
大數據、數據挖掘與智慧運營綜述 1
1.1 數據挖掘的發展史 2
1.1.1 數據挖掘的定義與起源 2
1.1.2 數據挖掘的早期發展 3
1.1.3 數據挖掘的算法前傳 4
1.1.4 數據挖掘的**個里程碑 8
1.1.5 *近十年的發展與應用 11
1.2 數據挖掘的主要流程與金字塔模型 13
1.2.1 數據挖掘的任務 14
1.2.2 數據挖掘的基本步驟 16
1.2.3 數據挖掘的架構——云計算 17
1.2.4 “金字塔”模型 20
1.3 數據挖掘對智慧運營的意義 22
1.3.1 “互聯網 ”時代的來臨及其對運營商的沖擊和挑戰 22
1.3.2 大數據時代的來臨及其對運營商的挑戰和機遇
24
1.3.3 電信運營商運營發展面臨的主要瓶頸 26
1.3.4 電信運營商發展的“三條曲線” 27
1.3.5 智慧運營與大數據變現 29
1.3.6 數據挖掘對于提升智慧運營效率的意義 30
1.4 大數據時代已經來臨 31
1.4.1 大數據的定義 31
1.4.2 大數據的“4V”特征32
1.4.3 結構化數據與非結構化數據33
1.5 非結構化數據挖掘的研究進展 34
1.5.1 文本挖掘34
1.5.2 模式識別36
1.5.3 語音識別40
1.5.4 視頻識別44
1.5.5 其他非結構化數據挖掘48
1.6 數據挖掘與機器學習、深度學習、人工智能及云計算 50
1.6.1 機器學習51
1.6.2 深度學習53
1.6.3 人工智能55
1.6.4 云計算56
1.7 現有數據挖掘的主要分析軟件與系統 61
1.7.1 Hadoop61
1.7.2 Storm
63
1.7.3 Spark
65
1.7.4 SPASS(SPSS) 66
1.7.5 SAS
68
參考文獻 70
第2章數據統計與數據預處理73
2.1 數據屬性類型 74
2.1.1 數據屬性定義74
2.1.2 離散屬性74
2.1.3 連續屬性75
2.2 數據的統計特性 77
2.2.1 中心趨勢度量77
2.2.2 數據散布度量78
2.2.3 數據相關性82
2.3 數據預處理 87
2.3.1 數據預處理概述87
3.6 基于網格的聚類:CLIQUE 140
3.6.1 基于網格的聚類算法概述140
3.6.2 CLIQUE算法的基本原理141
3.6.3 CLIQUE算法的優勢與劣勢142
參考文獻 143
第4章分類分析 145
4.1 分類分析概述 146
4.2 分類分析的評估 148
4.3 決策樹分析 152
4.3.1 決策樹算法的基本原理152
4.3.2 CHAID決策樹160
4.3.3 ID3決策樹 167
4.3.4 C4.5決策樹171
4.3.5 CART 決策樹175
4.3.6 決策樹中的剪枝問題179
4.3.7 決策樹在SPSS中的應用180
4.4 *近鄰分析(KNN) 185
4.4.1 KNN算法的基本原理185
4.4.2 KNN算法流程186
4.4.3 KNN算法的若干問題187
4.4.4 KNN分類器的特征188
4.4.5 KNN算法在SPSS中的應用 188
4.5 貝葉斯分析 191
4.5.1 貝葉斯定理191
4.5.2 樸素貝葉斯分類192
4.5.3 貝葉斯網絡195
4.6 神經網絡 199
4.6.1 感知器200
4.6.2 多重人工神經網絡201
4.6.3 人工神經網絡的特點203
4.7 支持向量機 204
第6章關聯分析 245
6.1 關聯分析概述 246
6.2 關聯分析的評估指標 247
6.2.1 支持度247
6.2.2 置信度248
6.2.3 算法復雜度248
6.3 Apriori 算法 249
6.3.1 頻繁項集的定義與產生249
6.3.2 先驗原理251
6.3.3 基于支持度的計數與剪枝252
6.3.4 候選項集生成253
6.3.5 基于置信度的剪枝259
6.3.6 Apriori算法規則生成 259
6.4 FP-tree 算法 261
6.4.1 頻繁模式樹261
6.4.2 FP-tree算法頻繁項集的產生263
6.4.3 FP-tree算法規則生成263
6.4.4 算法性能對比與評估264
6.5 SPSS Modeler 關聯分析實例 265
參考文獻 269
第7章增強型數據挖掘算法 271
7.1 增強型數據挖掘算法概述 272
7.1.1 組合方法的優勢272
7.1.2 構建組合分類器的方法272
7.2 隨機森林 273
7.2.1 隨機森林的原理273
7.2.2 隨機森林的優缺點276
7.2.3 隨機森林的泛化誤差276
7.2.4 輸入特征的選擇方法277
7.3 Bagging 算法 277
8.4.4 多元線性回歸建模350
8.4.5 制定層次化、個性化精準營銷方案351
8.4.6 落地效果評估與模型調優352
8.5 客戶保有 353
8.5.1 總結客戶流失的歷史規律354
8.5.2 細分潛在流失客戶群體357
8.5.3 客戶保有效益建模與*優決策359
8.5.4 落地效果評估361
8.6 投訴預警 363
8.6.1 客戶投訴現象分析363
8.6.2 挖掘潛在客戶群體366
8.6.3 制定個性化關懷方案368
8.7 網絡質量柵格化呈現 368
8.7.1 柵格化呈現的基本原理369
8.7.2 覆蓋柵格化370
8.7.3 基于流量聚簇的網絡優化策略372
8.8 無線室內定位 376
8.8.1 傳統室內定位方法376
8.8.2 基于Wi-Fi 信號的指紋定位算法 378
8.8.3 基于數據挖掘算法的改進定位方法379
參考文獻 383
第9章面向未來大數據的數據挖掘與機器學習發展趨勢 385
9.1 大數據時代數據挖掘與機器學習面臨的新挑戰 386
9.2 IEEE ICDM 會議數據挖掘與機器學習的*新研究進展 395
9.3 “計算機奧運會”——Sort
Benchmark 400
參考文獻 402
展開全部
大數據.數據挖掘與智慧運營 作者簡介
梁棟,博士畢業于北京郵電大學信號與系統專業,現任教于北京郵電大學,碩士研究生導師,曾主持和參加多項國家自然科學基金項目、國家863課題項目、國家973科技項目和多項省部級科研項目,主要研究方向為大數據、數據挖掘與智慧運營,所帶領的研究團隊在包括IEEE Internet of things Journal、IEEE International Conference on Data Mining等著名學術期刊和會議上發表高水平學術論文20多篇,并且長期與中國移動等運營商企業進行科技產業化合作,在大數據、數據挖掘技術運用于企業智慧化運營方面有著豐富的落地經驗。