用戶畫像:方法論與工程化解決方案:methodology and engineering solutions 版權信息
- ISBN:9787111635642
- 條形碼:9787111635642 ; 978-7-111-63564-2
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
用戶畫像:方法論與工程化解決方案:methodology and engineering solutions 本書特色
這是一本從技術、產品和運營3個角度講解如何從0到1構建用戶畫像系統的著作,同時它還為如何利用用戶畫像系統驅動企業的營收增長給出了解決方案。作者有多年的大數據研發和數據化運營經驗,曾參與和負責多個億級規模的用戶畫像系統的搭建,在用戶畫像系統的設計、開發和落地解決方案等方面有豐富的經驗。
全書一共9章:
第1~6章主要講解了搭建用戶畫像系統需要掌握的概念、技術、流程、方法論等,包括用戶畫像的基礎知識、數據指標體系、標簽數據存儲、標簽數據開發、開發性能調優、作業流程調度等;
第7章講解了如何對用戶畫像進行產品化,為工程實踐提供解決方案;
第8章詳細講解了用戶畫像在經營分析、精準營銷和個性化推薦3個經典領域的應用;
第9章通過8個常見的場景講解了8個用戶畫像系統的落地案例,幫助讀者掌握如何利用用戶畫像系統來驅動企業的營收增長。
用戶畫像:方法論與工程化解決方案:methodology and engineering solutions 內容簡介
(1) 作者是資深大數據技術專家,在大數據、數據分析、數據化運營方面積累了豐富的經驗。
(2)作者有多個億級規模的用戶畫像系統的構建經驗。
(3)本書不僅從技術、產品、運營3個維度講解了如何從0到1構建一個用戶畫像系統,而且給出了利用用戶畫像系統驅動企業營收增長的解決方案。
(4)本書對用戶畫像系統的多個使用場景進行了詳細的介紹,同時給出了相關的實踐案例。
用戶畫像:方法論與工程化解決方案:methodology and engineering solutions 目錄
前言
第1章 用戶畫像基礎1
1.1 用戶畫像是什么1
1.1.1 畫像簡介1
1.1.2 標簽類型3
1.2 數據架構4
1.3 主要覆蓋模塊5
1.4 開發階段流程7
1.4.1 開發上線流程7
1.4.2 各階段關鍵產出9
1.5 畫像應用的落地10
1.6 某用戶畫像案例11
1.6.1 案例背景介紹11
1.6.2 相關元數據12
1.6.3 畫像表結構設計16
1.7 定性類畫像21
1.8 本章小結22
第2章 數據指標體系23
2.1 用戶屬性維度23
2.1.1 常見用戶屬性23
2.1.2 用戶性別26
2.2 用戶行為維度27
2.3 用戶消費維度27
2.4 風險控制維度29
2.5 社交屬性維度30
2.6 其他常見標簽劃分方式31
2.7 標簽命名方式33
2.8 本章小結34
第3章 標簽數據存儲35
3.1 Hive存儲35
3.1.1 Hive數據倉庫35
3.1.2 分區存儲37
3.1.3 標簽匯聚39
3.1.4 ID-MAP41
3.2 MySQL存儲45
3.2.1 元數據管理45
3.2.2 監控預警數據47
3.2.3 結果集存儲47
3.3 HBase存儲50
3.3.1 HBase簡介50
3.3.2 應用場景52
3.3.3 工程化案例52
3.4 Elasticsearch存儲59
3.4.1 Elasticsearch簡介59
3.4.2 應用場景60
3.4.3 工程化案例64
3.5 本章小結67
第4章 標簽數據開發69
4.1 統計類標簽開發69
4.1.1 近30日購買行為標簽案例70
4.1.2 *近來訪標簽案例73
4.2 規則類標簽開發74
4.2.1 用戶價值類標簽案例75
4.2.2 用戶活躍度標簽案例79
4.3 挖掘類標簽開發84
4.3.1 案例背景84
4.3.2 特征選取及開發85
4.3.3 文本分詞處理86
4.3.4 數據結構處理89
4.3.5 文本TF-IDF權重90
4.3.6 樸素貝葉斯分類92
4.4 流式計算標簽開發95
4.4.1 流式標簽建?蚣95
4.4.2 Kafka簡介96
4.4.3 Spark Streaming集成Kafka97
4.4.4 標簽開發及工程化99
4.5 用戶特征庫開發104
4.5.1 特征庫規劃105
4.5.2 數據開發107
4.5.3 其他特征庫規劃111
4.6 標簽權重計算112
4.6.1 TF-IDF詞空間向量112
4.6.2 時間衰減系數114
4.6.3 標簽權重配置115
4.7 標簽相似度計算116
4.7.1 案例場景116
4.7.2 數據開發118
4.8 組合標簽計算122
4.8.1 應用場景122
4.8.2 數據計算123
4.9 數據服務層開發124
4.9.1 推送至營銷系統125
4.9.2 接口調用服務127
4.10 GraphX圖計算用戶129
4.10.1 圖計算理論及應用場景129
4.10.2 數據開發案例132
4.11 本章小結135
第5章 開發性能調優137
5.1 數據傾斜調優137
5.2 合并小文件141
5.3 緩存中間數據143
5.4 開發中間表144
5.5 本章小結145
第6章 作業流程調度146
6.1 crontab命令調度146
6.2 Airflow工作平臺148
6.2.1 基礎概念149
6.2.2 Airflow服務構成150
6.2.3 Airflow安裝151
6.2.4 主要模塊功能151
6.2.5 工作流調度155
6.2.6 腳本實例155
6.2.7 常用命令行158
6.2.8 工程化調度方案158
6.3 數據監控預警161
6.3.1 標簽監控預警161
6.3.2 服務層預警162
6.4 ETL異常排查164
6.5 本章小結166
第7章 用戶畫像產品化167
7.1 即時查詢167
7.2 標簽視圖與標簽查詢169
7.3 元數據管理171
7.4 用戶分群功能173
7.5 人群分析功能175
7.6 本章小結177
第8章 用戶畫像應用178
8.1 經營分析178
8.1.1 商品分析178
8.1.2 用戶分析179
8.1.3 渠道分析180
8.1.4 漏斗分析185
8.1.5 客服話術186
8.1.6 人群特征分析186
8.2 精準營銷187
8.2.1 短信/郵件營銷187
8.2.2 效果分析188
8.3 個性化推薦與服務189
8.4 本章小結190
第9章 實踐案例詳解191
9.1 風控反欺詐預警191
9.1.1 應用背景191
9.1.2 用戶畫像切入點192
9.2 A/B人群效果測試193
9.2.1 案例背景194
9.2.2 用戶畫像切入點194
9.2.3 效果分析195
9.3 用戶生命周期劃分與營銷195
9.3.1 生命周期劃分196
9.3.2 不同階段的用戶觸達策略201
9.3.3 畫像在生命周期中的應用204
9.3.4 應用案例206
9.4 高價值用戶實時營銷209
9.4.1 項目應用背景209
9.4.2 用戶畫像切入點209
9.4.3 HBase應用場景小結209
9.5 短信營銷用戶211
9.5.1 案例背景211
9.5.2 畫像切入及其應用效果211
9.6 Session行為分析應用213
9.6.1 關于用戶行為分析213
9.6.2 案例背景218
9.6.3 特征構建219
9.6.4 分析方法與結論221
9.7 人群效果監測報表搭建228
9.7.1 案例背景228
9.7.2 邏輯梳理228
9.7.3 自動報表郵件237
9.8 基于用戶特征庫篩選目標人群239
9.8.1 案例背景239
9.8.2 應用方式及效果240
9.9 本章小結241
附錄 某產品用戶畫像項目規劃文檔242
展開全部
用戶畫像:方法論與工程化解決方案:methodology and engineering solutions 相關資料
在眾多數據分析方法中,用戶畫像幾乎是后期數據工作的“標配”,適用于應用層的個性化推薦、精準營銷、客群管理和運營等各個場景。宏田的這本書涵蓋畫像基礎、指標體系搭建、數據存儲、數據開發、性能調優、流程調度、產品化案例和實踐應用等內容,完整、詳實且落地性強,假以時日,會成為有關用戶畫像的里程碑式的經典書籍。
—— 宋天龍(TonySong) 觸脈咨詢合伙人兼副總裁/《Python數據分析與數據化運營》作者
本書圍繞用戶畫像主題進行了深度剖析,從實戰角度結合多業務場景對用戶畫像相關技術進行詳細講解。通過本書的學習可以系統地掌握如何搭建一套完整的用戶畫像系統,掌握所需要的理論知識和技能。宏田對用戶畫像理解透徹,實戰經驗豐富,推薦讀者品讀。
——肖冠宇 小象科技合伙人
用戶畫像對于企業戰略決策和戰術實施極為關鍵,其體系建設是一個非常復雜的工程。本書從方法論和工程化兩個層面給出了實際解決方案,對于企業的用戶畫像體系構建與實踐具有極高的參考意義,同時也是數據從業人員難得的參考書籍,強烈推薦。
—— 黃小偉 有贊數據分析團隊負責人
用戶畫像是數據分析和算法工程都無法繞過的話題,書中手把手教授工程實現、模型搭建、應用場景等內容,對于做分層策略的運營人員、追求用戶體驗的產品經理、尋找解決方案的數據分析師、搭建底層特征的算法工程師來說,是不可多得的案頭工具書!
——李寧 阿里本地生活數據分析專家
用戶畫像:方法論與工程化解決方案:methodology and engineering solutions 作者簡介
趙宏田——資深大數據技術專家,先后在中國地質大學(武漢)和武漢大學獲得工學和經濟學雙學士學位。在大數據、數據分析和數據化運營領域有多年的實踐經驗,擅長Hadoop、Spark等大數據技術,以及業務數據分析、數據倉庫開發、爬蟲、用戶畫像系統搭建等。開源項目的貢獻者,知乎專欄作者,撰寫了大量專業文章,廣受好評。著有暢銷書《數據化運營:系統方法與實踐案例》。