-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
SAS數據挖掘與分析項目實戰 版權信息
- ISBN:9787113268503
- 條形碼:9787113268503 ; 978-7-113-26850-3
- 裝幀:80g膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
SAS數據挖掘與分析項目實戰 本書特色
本書的特色 案例豐富:本書不空講SAS語法和模型算法,以大量企業實際案例、清晰簡明的解釋以及盡可能少的專用術語來介紹SAS的實際應用。 內容全面:覆蓋企業中的熱點應用案例,比如精準營銷、流失預警、客戶分群、信用評分、廣告點擊率預測等。如果讀者是公司的數據分析師,則可以直接參考案例進行相關模型研發。 較新的軟件版本:以SAS 94軟件版本,向讀者介紹如何使用SAS進行數據挖掘項目的開發工作。 配備數據和源代碼:提供所有案例的數據文件和SAS源代碼,供讀者操作練習、快速學習。 學習路線圖清晰:每個案例均按照數據挖掘項目的一般工作流程逐步展開。
SAS數據挖掘與分析項目實戰 內容簡介
本書講述了在實際運營中核心的數據挖掘分析案例,為讀者重點展示了SAS在精準營銷、客戶流失預警、客戶分群、廣告點擊、信用卡欺詐、信用風險評分等領域中的具體應用。 本書分為16章,以數據挖掘基礎知識介紹開始,循序漸進地講述了Kaggle數據科學社區調查數據分析、考察汽車耗油量與里程數的關系分析、影響汽車銷售的關鍵因子分析、健身運動中耗氧量回歸分析、旅客量預測分析、客戶群分類判別分析、銷售公司的客戶分群、員工離職預測、廣告點擊率預測、產品精準營銷模型、電信客戶流失預警、銀行貸款用戶風險分析、信用風險評分卡的開發以及信用卡反欺詐預測模型等案例。后一章介紹了與數據挖掘項目中的時間成本有較大關系的SAS數據清洗的相關技術。 本書案例豐富,實用性較強,特別適合從事數據挖掘、統計建模、機器學習、商業分析、運營分析等工作的人員使用,也可作為數學、統計學、金融管理、計算機等專業的學生學習SAS數據挖掘應用的參考書籍。
SAS數據挖掘與分析項目實戰 目錄
第1章數據挖掘知識介紹
11數據挖掘算法簡介
111分類
112聚類
113關聯
114預測
12分類模型的相關概念
121數據說明
122混淆矩陣
123ROC曲線和AUC面積
124提升(Lift)
125KS曲線
13數據挖掘過程中關鍵問題處理
131數據準備
132定義變量及數據抽樣
133變量選擇
134缺失值處理
135模型比較
14SAS STAT介紹
第2章Kaggle數據科學社區調查分析
21描述性統計分析的主要內容
211數據的頻數分析
212數據的集中趨勢分析
213數據的離散程度分析
214數據的分布
215繪制統計圖
22SAS描述性分析過程介紹
221PROC FREQ過程
222PROC MEANS過程
223PROC UNIVARIATE過程
23調查數據說明
24數據探索
25Kaggle社區用戶畫像分析
251人員屬性
252工作屬性
253技能屬性
254學習屬性
第3章考察汽車耗油量與里程數的關系
31項目背景
32非線性回歸簡介
33非線性回歸過程說明
34廣義線性模型過程
35數據文件說明
36數據探索
37模型建立
38結果分析
第4章影響汽車銷售的關鍵因子分析
41數據說明
42因子分析的基本原理
421因子分析模型
422因子旋轉
423計算因子得分
43因子分析的步驟和SAS過程
431因子分析的步驟
432FACTOR過程說明
44模型開發及結果解釋
45主成分分析和因子分析的區別
第5章健身運動中耗氧量回歸分析
51線性回歸模型
52REG過程
521過程選項
522MODEL語句選項
523關鍵字選項
524PLOT語句選項
53數據說明
54相關性分析
55回歸分析
56逐步回歸
561逐步回歸過程
562利用逐步回歸選擇變量
第6章旅客量預測分析
61項目背景
62數據文件說明
63平穩隨機過程概述
631自回歸模型
632滑動平均模型
633自回歸滑動平均模型
64ARMA模型的識別
641基于相關函數的定階方法
642利用信息準則法定階
65模型參數的估計
66時間序列的分析步驟
67SAS系統的ARIMA過程
671ARIMA語句選項
672IDENTIFY語句選項
673ESTIMATE語句選項
674FORECAST語句選項
675ARIMA建模過程
68數據探索
681平穩性檢驗
682序列變換
69自相關函數檢驗
610模型參數估計
611預測
第7章客戶群分類判別分析
71業務背景及數據說明
72判別分析的數學原理
73判別分析的SAS過程
731DISCRIM過程
732CANDISC過程
733STEPDISC過程
74數據探索
75客戶群判別模型建立
76模型應用
第8章銷售公司的客戶分群分析
81項目背景
811客戶細分的概念
812客戶細分模型
813客戶細分模型的基本流程
814細分方法介紹
82聚類分析的數學原理
821聚類的數學原理
822距離和相似距離
823聚類方法
824聚類數的確定
825聚類分析步驟
83SAS中的聚類過程
831Cluster系統聚類過程
832Fastclus快速聚類過程
833Varclus方差聚類過程
834Tree聚類樹型輸出過程
84數據文件說明
85數據探索
851變量衍生
852變量標準化
853變量相關性分析
86模型建立
87客戶畫像分析
88模型應用
第9章員工離職預測
91項目背景
92數據說明
93數據探索
94數據建模
941變量相關分析
942決策樹建模
95模型評估與應用
第10章廣告點擊率預測
101業務背景
1011網絡廣告發展情況
1012計算廣告學
102數據說明
103數據不平衡的處理方式
1031收集更多的數據
1032改變模型性能評價指標
1033重新對樣本進行采樣
104模型開發與評估
1041樣本欠抽樣
1042模型開發
1043模型評估
105CTR模型的發展脈絡
第11章產品精準營銷推薦
111項目背景
1111業務背景
1112數據說明
1113項目目標
112數據探索
1121變量描述性統計分析
1122變量缺失值處理
1123變量衍生處理
113模型建設
1131欠抽樣
1132數據集分割
1133模型開發
1134模型評估
114模型應用
1141產品自動化推薦系統
1142易受到市場環境等各種因素的影響
1143人群特征漂移需要不斷優化模型
第12章通信客戶流失預警模型
121項目背景
1211客戶流失分析要解決的問題
1212分析客戶流失的類型
1213如何進行客戶流失分析
122數據說明
123因變量定義
124樣本抽取
125數據探索
126模型開發
1261變量衍生
1262變量選擇
1263相關性處理
1264模型結果
127模型評估
1271開發樣本上的模型性能
1272驗證樣本上的模型性能
128模型應用
第13章銀行貸款用戶風險分析
131案例背景
132因變量定義
133樣本抽取
134數據探索
1341為什么要進行數據探索
1342數據分布情況
135模型建設
1351變量衍生
1352變量選擇
1353共線性處理
1354模型結果
136模型性能評估
1361開發樣本上的模型性能
1362驗證樣本上的模型性能
137模型應用
第14章信用風險評分卡開發
141信用評分模型簡介
142信用卡模型的開發過程
143案例背景及項目目標確定
1431項目背景說明
1432確定項目目標
144數據獲取
145數據質量檢驗
146項目參數設定
1461排除規則確定
1462表現和觀察窗口
1463確定“壞”的定義
1464滾動率分析
1465客戶分群
147數據探索
1471數據分布分析
1472缺失值的處理
1473極端值的處理
148模型開發
1481證據權重(WOE)
1482信息值(IV)
1483變量選擇
1484變量分組
1485變量相關性分析
1486模型迭代開發
149模型評估
1491混淆矩陣
1492KS統計量
1493ROC曲線
1410評分卡創建
14101評分尺度變換
14102變量分值分配
1411評分卡實施
1412監測與報告
1413拒絕推斷
1414運用評分卡需要注意的事項
第15章信用卡反欺詐預測模型
151信用卡欺詐概述
1511信用卡欺詐的種類
1512智能反欺詐管理
1513其他反欺詐技術
152案例背景
153數據探索
154模型開發
1541不使用分層抽樣策略
1542使用分層抽樣策略
155總結
第16章SAS數據清洗技術
161數據清洗簡介
1611數據清洗
1612數據探索
162數據導入
1621讀入數據到SAS系統的方法
1622指定數據文件的位置
1623讀入由空格分隔的原始數據
1624讀入列對齊的原始數據
1625讀入非標準格式的數據
1626讀入一個觀測占據多行的數據文件
1627讀入原數據文件的一部分
1628IMPORT過程讀入分隔數據文件
163數據格式處理
164SAS函數
1641字符函數
1642數值函數
165缺失值處理
166數據抽樣
1661等比例分層抽樣
1662不等比例分層抽樣
1663分層抽樣
SAS數據挖掘與分析項目實戰 作者簡介
尚濤,畢業于上海交通大學數學系,擁有數學專業碩士學位,研究方向為數據挖掘及機器學習領域,曾任職于支付平臺、平安科技、易方達基金,現任職于南方基金,專注于信用風險評分、精準營銷、推薦系統、文本挖掘等領域數據挖掘項目的研發工作以及企業的數據化運營落地工作,擁有超過10年數據挖掘和優化建模的經驗,以及多年使用SPSS、SAS、R、Python等建模軟件的經驗。在從業經歷中,多次為所在公司的業務方提供數據挖掘技術服務,成功實施了眾多深受好評的數據挖掘項目,取得了較好的業務價值。
- >
名家帶你讀魯迅:故事新編
- >
小考拉的故事-套裝共3冊
- >
我從未如此眷戀人間
- >
山海經
- >
羅庸西南聯大授課錄
- >
羅曼·羅蘭讀書隨筆-精裝
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
中國歷史的瞬間