中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow

包郵 數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow

作者:謝梁
出版社:機械工業出版社出版時間:2021-06-01
開本: 16開 頁數: 259
中 圖 價:¥62.4(7.0折) 定價  ¥89.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow 版權信息

  • ISBN:9787111682547
  • 條形碼:9787111682547 ; 978-7-111-68254-7
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow 本書特色

(1)豪華作者陣容:作者全部是自騰訊、滴滴、快手等一線互聯網企業的數據科學家、數據分析師和算法工程師,經驗極為豐富。 (2)三維度深融合:將數據科學的3個維度——商業理解、量化模型、數據技術全面打通,涵蓋數據科學的應用場景、理論支撐和技術底座。 (3)應用場景面廣:本書所有數據科學應用場景均來自商業環境,強調實用、可操作性強。 (4)方法論與案例:圍繞3大主題給出了大量方法論和*佳實踐,方法論與案例的背景、代碼、解讀等模塊深度融合。

數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow 內容簡介

  這是一本將數據科學三要素一一商業理解、量化模型、數據技術全面打通的實戰性著作,是來自騰訊、滴滴、快手等一線互聯網企業的數據科學家、數據分析師和算法工程師的經驗總結,得到了SQLFlow創始人以及騰訊、網易、快手、貝殼找房、谷歌等企業的專家一致好評和推薦。 《數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow》三個部分,內容相對獨立,既能幫助初學者建立知識體系,又能幫助從業者解決商業中的實際問題,還能幫助有經驗的專家快速掌握數據科學的新技術和發展動向。內容圍繞非實驗環境下的觀測數據的分析、實驗的設計和分析、自助式數據科學平臺3大主題展開,涉及統計學、經濟學、機器學習、實驗科學等多個領域,包含大量常用的數據科學方法、簡潔的代碼實現和經典的實戰案例。 第1部分(第1-6章)觀測數據的分析技術 講解了非實驗環境下不同觀測數據分析場景所對應的分析框架、原理及實際操作,包括消費者選擇偏好分析、消費者在時間維度上的行為分析、基于機器學習的用戶生命周期價值預測、基于可解釋模型技術的商業場景挖掘、基于矩陣分解技術的用戶行為規律發現與挖掘,以及在不能進行實驗分析時如何更科學地進行全量評估等內容。第二部分(第7~9章)實驗設計和分析技術 從A/B實驗的基本原理出發,深入淺出地介紹了各種商業場景下進行實驗設計需要參考的原則和運用的方法,尤其是在有樣本量約束條件下提升實驗效能的方法及商業場景限制導致的非傳統實驗設計。 第三部分(第10~12章)自助式數據科學平臺SQLFlow 有針對性地講解了開源的工程化的自助式數據科學平臺SQLFlow,并通過系統配置、黑盒模型的解讀器應用、聚類分析場景等案例幫助讀者快速了解這一面向未來的數據科學技術。

數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow 目錄

作者簡介

序一

序二

前言

**部分 觀測數據的分析技術

第1章 如何分析用戶的選擇 2

1.1 深入理解選擇行為 2

1.1.1 選擇無處不在 2

1.1.2 選擇行為的經濟學理論 4

1.1.3 離散選擇模型 5

1.2 DCM詳述 6

1.2.1 從經濟模型到計量模型 6

1.2.2 DCM的應用場景 9

1.2.3 DCM的重要數學知識 10

1.3 DCM模型的Python實踐 13

1.3.1 軟件包和數據格式 13

1.3.2 使用邏輯回歸分析自駕選擇問題 16

1.3.3 使用多項Logit模型分析多種交通方式選擇問題 21

1.3.4 使用嵌套Logit模型分析多種交通方式選擇問題 24

1.4 本章小結 26

第2章 與時間相關的行為分析 27

2.1 生存分析與二手車定價案例 27

2.1.1 二手車定價背景 27

2.1.2 為什么不選擇一般回歸模型 28

2.1.3 為什么選擇生存分析 29

2.2 生存分析的理論框架 29

2.2.1 生存分析基本概念界定 30

2.2.2 生存函數刻畫及簡單對比 34

2.2.3 生存函數回歸及個體生存概率的預測 36

2.3 生存分析在二手車定價案例中的應用 37

2.3.1 軟件包、數據格式和數據讀入 38

2.3.2 繪制二手車銷售生存曲線及差異對比 40

2.3.3 二手車銷售生存概率影響因素分析及個體預測 43

2.3.4 基于Cox風險比例模型的*優價格求解 44

2.4 本章小結 46

第3章 洞察用戶長期價值:基于神經網絡的LTV建模 47

3.1 用戶長期價值的概念和商業應用 47

3.1.1 用戶長期價值 47

3.1.2 用戶生命周期和用戶長期價值 48

3.1.3 LTV的特點 49

3.1.4 LTV分析能解決的問題 50

3.1.5 LTV的計算方法 50

3.2 基于Keras的LTV模型實踐 52

3.2.1 Keras介紹 52

3.2.2 數據的加載和預處理 52

3.2.3 輸入數據的準備 56

3.2.4 模型搭建和訓練 61

3.2.5 模型分析 65

3.3 本章小結 66

第4章 使用體系化分析方法進行場景挖掘 67

4.1 經驗化分析與體系化分析 67

4.1.1 經驗化分析的局限性 67

4.1.2 體系化分析的優勢 68

4.2 體系化分析常用工具 69

4.2.1 黑盒模型與白盒模型 69

4.2.2 可解釋模型—決策樹 69

4.2.3 全局代理模型 73

4.2.4 場景挖掘模型分析方法框架 75

4.3 場景挖掘分析的應用與實現 75

4.3.1 數據背景及數據處理 76

4.3.2 經驗化分析方法應用 76

4.3.3 場景挖掘模型的Python實現與模型解讀 79

4.4 本章小結 86

第5章 行為規律的發現與挖掘 87

5.1 對有序數據的規律分析 88

5.1.1 有序數據及SVD方法概述 88

5.1.2 SVD原理及推導 88

5.2 SVD聚類建模Python實戰 93

5.3 對無序稀疏數據的規律分析 101

5.3.1 稀疏數據及NMF方法概述 101

5.3.2 NMF原理及推導 102

5.3.3 NMF聚類建模Python實戰 103

5.4 本章小結 109

第6章 對觀測到的事件進行因果推斷 110

6.1 使用全量評估分析已發生的事件 110

6.2 全量評估的主要方法 111

6.2.1 回歸分析 111

6.2.2 DID方法 118

6.2.3 合成控制 120

6.2.4 Causal Impact方法 122

6.3 全量評估方法的應用 124

6.3.1 使用回歸建模方法對物流單量變化進行全量評估 125

6.3.2 使用DID方法評估恐怖主義對經濟的影響 131

6.3.3 用合成控制法評估恐怖主義對經濟的影響 134

6.3.4 用Causal Impact方法評估天氣情況 136

6.4 本章小結 146

第二部分 實驗設計和分析技術

第7章 如何比較兩個策略的效果 148

7.1 正確推斷因果關系 148

7.1.1 相關性謬誤 148

7.1.2 潛在結果和因果效果 149

7.2 運用A/B實驗進行策略比較 150

7.2.1 什么是A/B實驗 151

7.2.2 為什么應用A/B實驗 151

7.2.3 A/B實驗的基本原理 151

7.3 A/B實驗應用步驟 152

7.3.1 明確實驗要素 152

7.3.2 實驗設計 154

7.3.3 實驗過程監控 155

7.4 A/B實驗案例 156

7.4.1 實驗場景介紹 156

7.4.2 實驗方法設計 157

7.4.3 實驗效果評估 157

7.5 本章小結 159

第8章 提高實驗效能 160

8.1 控制實驗指標方差的必要性和手段 160

8.2 用隨機區組設計控制實驗指標方差 161

8.2.1 利用隨機區組實驗降低方差 161

8.2.2 隨機區組實驗的特征選擇 162

8.3 隨機區組實驗應用步驟 163

8.4 隨機區組實驗案例介紹 167

8.4.1 背景介紹 168

8.4.2 基本設計 168

8.4.3 隨機區組實驗相關的設計 168

8.4.4 效果評估 169

8.5 隨機區組實驗的常見問題 170

8.6 本章小結 171

第9章 特殊場景下的實驗設計和分析方法 172

9.1 解決分流實驗對象之間的干擾 172

9.1.1 使用隨機飽和度實驗減少實驗對象之間的影響 173

9.1.2 隨機濃度實驗的設計流程 174

9.1.3 隨機濃度實驗評估方法及案例 175

9.2 Switchback實驗和評估方法 178

9.2.1 不能使用隨機分流策略的情況 178

9.2.2 Switchback實驗的基本原理 178

9.2.3 Switchback實驗中關于時空切片的聚類方法 179

9.2.4 Switchback實驗的評估方法 180

9.3 交叉實驗 182

9.3.1 交叉實驗的基本概念 183

9.3.2 常見的交叉實驗設計矩陣 183

9.3.3 交叉實驗評估及矩陣誤差說明 185

9.3.4 交叉實驗評估案例 186

9.4 強約束條件下的實驗方法 189

9.4.1 強約束條件場景 189

9.4.2 多基線實驗設計的解決思路 189

9.4.3 多基線實驗的設計流程 190

9.4.4 多基線實驗的評估方法和案例 192

9.5 本章小結 195

第三部分 自助式數據科學平臺SQLFlow

第10章 SQLFlow 198

10.1 SQLFlow簡介 198

10.1.1 什么是SQLFlow 198

10.1.2 SQLFlow的定位和目標 199

10.1.3 SQLFlow的工作原理 200

10.2 設置SQLFlow運行環境 201

10.2.1 通過Docker使用SQLFlow 201

10.2.2 環境配置 205

10.2.3 交互 210

10.2.4 Jupyter Notebook 210

10.2.5 REPL 211

10.3 向SQLFlow提交分析模型 211

10.4 本章小結 214

第11章 機器學習模型可解釋性 215

11.1 模型的可解釋性 215

11.1.1 模型可解釋的重要性 215

11.1.2 模型可解釋的必要性 216

11.2 常見的可解釋模型 216

11.2.1 線性回歸 216

11.2.2 邏輯回歸 219

11.2.3 決策樹 224

11.2.4 KNN算法 225

11.2.5 樸素貝葉斯分類器 228

11.2.6 模型比較 229

11.3 黑盒模型的解釋性 230

11.3.1 黑盒模型解釋方法 230

11.3.2 SQLFlow中的黑盒模型解釋應用 233

11.4 本章小結 237

第12章 基于LSTM-Autoencoder的無監督聚類模型 238

12.1 聚類分析的廣泛應用 238

12.2 聚類模型的應用案例 239

12.2.1 K均值聚類 239

12.2.2 層次聚類 245

12.3 SQLFlow中基于深度學習的聚類模型 250

12.3.1 基于深度學習的聚類算法原理 250

12.3.2 城市道路交通狀況的模式識別與聚類 256

12.4 本章小結 259

展開全部

數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow 作者簡介

謝梁 經濟學博士,騰訊QQ瀏覽器副總經理、QQ瀏覽器數據負責人。CCF數據科學專委會創始委員,入選第一財經數據科學50人,清華大學商學院及香港大學商學院商業分析碩士項目指導嘉賓。曾任滴滴杰出數據科學家、美國微軟云存儲核心工程部首席數據科學家。 繆瑩瑩 浙江大學碩士,曾任滴滴首席數據科學家,CCF數據科學專委會委員。擁有十余項國家發明專利及國際發明專利,具有豐富的數據倉庫建設、數據挖掘建模、實驗科學與戰略分析的經驗。帶領團隊用數據的方式驅動從0到1的初創形態的業務和成熟形態業務的增長,善于發現業務機會和風險,給業務帶來巨大價值。 高梓堯 快手數據分析總監,長期在美國硅谷和中國多家互聯網科技公司從事用戶分析、實驗設計等相關工作。曾帶領滴滴數據科學團隊與螞蟻金服聯合開源共建一站式機器學習工具SQLFlow。擁有多項國家發明專利。清華大學商學院及哥倫比亞大學商學院商業分析碩士項目指導嘉賓、泛華統計協會演講嘉賓。 王子玲 上海交通大學計算數學碩士,曾任滴滴高級數據科學家、高級模型專家、高級風控專家。先后任職于日企MTI、人人網、滴滴出行、愛奇藝等知名互聯網企業,在網約車出行、互聯網金融、在線音樂、短視頻、網游等領域積累了豐富的大數據分析、策略、挖掘、建模、研究、應用經驗。負責過兩段公司級重點項目從0到1增長的整體數據驅動體系設計及落地。申請平臺智能定價及優化算法系統等十余項國家發明專利及國際發明專利。 周銀河 現任騰訊數據科學家,曾任滴滴數據科學家,清華大學商學院及哥倫比亞大學商學院商業分析碩士項目指導嘉賓。擁有豐富的數據分析、統計建模及實驗設計經驗。 丁芬 曾任滴滴數據科學家,曾就職于美團、滴滴等國內知名互聯網公司,工作經歷涉及市場咨詢、信貸風控、網約車交易及信息流等領域。 蘇濤 物理學博士,美國生物物理學會會員。曾任中國科學院研究助理,研究量子計算和主動流體。后任喬治華盛頓大學計算物理研究員,從事細胞模擬、生物領域機器學習、高性能計算等方向的研究。2017年進入互聯網行業,先后在Elex 和滴滴進行數學模型、算法和數據科學方向的研究,熟悉復雜網絡、流形幾何嵌入、時頻分析以及相關的機器學習和優化方法。 王禹 曾任滴滴高級數據分析師,主要負責滴滴分單引擎和調度引擎的實驗設計、評估、數據分析以及成交率等核心指標的預測、異常診斷歸因等工作。現任某短視頻科技企業算法工程師,主要負責LBS定位、POI挖掘等相關場景的策略算法開發。 吳君涵 曾任滴滴資深數據分析師,擅長用戶增長分析和體驗量化建模。具有豐富的大數據挖掘建模、產出數據驅動洞察并通過洞察影響決策的實戰經驗。 楊驍捷 曾任滴滴高級數據分析師,擅長雙邊平臺的供需匹配效率分析,在出行、電商等不同業務場景中靈活運用因果推斷,評估業務收益。現任快手資深數據分析師。 劉沖 曾任滴滴高級數據分析師,主要負責流量運營的實驗設計、評估、數據分析以及優化司機行為和提高司機收入等相關分析,現任快手數據分析師。 王玉璽 中國人民大學商學院博士,美國密歇根大學訪問學者,曾任滴滴數據科學部研究員,主要研究方向為定價策略優化、消費者行為分析等。參與多項國家自然科學基金及社會科學基金研究項目,在Expert System、Information Systems Research、《管理評論》等期刊發表多篇論文。 劉未名 曾任滴滴數據科學家,擁有金融、互聯網等領域的數據分析經驗,擅長利用實驗、量化模型解決業務問題,多次參與公司級重點項目的數據分析,幫助公司搭建數據驅動工業化體系,擁有國內、國際多項發明專利。 楊凱迪 現任快手數據分析部數據科學家。長期就職于國內頭部互聯網企業,對于出行定價補貼以及短視頻行業用戶畫像挖掘、策略分析等有豐富經驗。工作期間累計發表三篇國家發明專利論文。 李依諾 騰訊數據科學家,本碩先后畢業于美國印第安納大學數學專業和美國喬治華盛頓大學生物統計學專業。在在線視頻、網約車、網絡游戲領域積累了豐富的數據科學實戰經驗,從0 到1 參與過騰訊、滴滴的實驗工業化進程。 陳祥 資深算法工程師,碩士畢業于愛丁堡大學計算機科學專業。先后從事異常檢測、強化學習、自然語言處理、領域知識圖譜建設及應用等相關工作。曾就職于愛奇藝、滴滴。SQLFlow 貢獻者之一。現從事用戶畫像、廣告系統和推薦相關工作。 朱文靜 曾任滴滴高級數據分析師,主要從事基于業務數據進行的分析、建模、挖掘等工作。SQLFlow項目重要成員之一,SQLFlow開源社區貢獻者,參與貢獻了多個SQLFlow模型,其中包括可解釋黑盒模型、深度學習聚類模型、時間序列模型等。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: nalgene洗瓶,nalgene量筒,nalgene窄口瓶,nalgene放水口大瓶,浙江省nalgene代理-杭州雷琪实验器材有限公司 | 重庆监控_电子围栏设备安装公司_门禁停车场管理系统-劲浪科技公司 | 西安展台设计搭建_西安活动策划公司_西安会议会场布置_西安展厅设计西安旭阳展览展示 | 塑钢课桌椅、学生课桌椅、课桌椅厂家-学仕教育设备首页 | 米顿罗计量泵(科普)——韬铭机械 | 日本细胞免疫疗法_肿瘤免疫治疗_NK细胞疗法 - 免疫密码 | 二次元影像仪|二次元测量仪|拉力机|全自动影像测量仪厂家_苏州牧象仪器 | 钢托盘,钢制托盘,立库钢托盘,金属托盘制造商_南京飞天金属制品实业有限公司 | 洗瓶机厂家-酒瓶玻璃瓶冲瓶机-瓶子烘干机-封口旋盖压盖打塞机_青州惠联灌装机械 | 干式磁选机_湿式磁选机_粉体除铁器-潍坊国铭矿山设备有限公司 | 武汉高温老化房,恒温恒湿试验箱,冷热冲击试验箱-武汉安德信检测设备有限公司 | 真空吸污车_高压清洗车厂家-程力专用汽车股份有限公司官网 | 高温链条油|高温润滑脂|轴承润滑脂|机器人保养用油|干膜润滑剂-东莞卓越化学 | 杭州画室_十大画室_白墙画室_杭州美术培训_国美附中培训_附中考前培训_升学率高的画室_美术中考集训美术高考集训基地 | 电销卡 防封电销卡 不封号电销卡 电话销售卡 白名单电销卡 电销系统 外呼系统 | 精密模具-双色注塑模具加工-深圳铭洋宇通 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | CXB船用变压器-JCZ系列制动器-HH101船用铜质开关-上海永上船舶电器厂 | 洛阳防爆合格证办理-洛阳防爆认证机构-洛阳申请国家防爆合格证-洛阳本安防爆认证代办-洛阳沪南抚防爆电气技术服务有限公司 | 网站seo优化_seo云优化_搜索引擎seo_启新网络服务中心 | 可程式恒温恒湿试验箱|恒温恒湿箱|恒温恒湿试验箱|恒温恒湿老化试验箱|高低温试验箱价格报价-广东德瑞检测设备有限公司 | 陕西华春网络科技股份有限公司 | 泰安办公家具-泰安派格办公用品有限公司 | 南京欧陆电气股份有限公司-风力发电机官网 | 缓蚀除垢剂_循环水阻垢剂_反渗透锅炉阻垢剂_有机硫化物-郑州威大水处理材料有限公司 | 驾驶人在线_专业学车门户网站| 无线讲解器-导游讲解器-自助讲解器-分区讲解系统 品牌生产厂家[鹰米讲解-合肥市徽马信息科技有限公司] | 电子厂招聘_工厂招聘_普工招聘_小时工招聘信息平台-众立方招工网 | 四探针电阻率测试仪-振实密度仪-粉末流动性测定仪-宁波瑞柯微智能 | 能量回馈_制动单元_电梯节能_能耗制动_深圳市合兴加能科技有限公司 | 复合肥,化肥厂,复合肥批发,化肥代理,复合肥品牌-红四方 | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 阴离子聚丙烯酰胺价格_PAM_高分子聚丙烯酰胺厂家-河南泰航净水材料有限公司 | 酸度计_PH计_特斯拉计-西安云仪| 液氮罐(生物液氮罐)百科-无锡爱思科 | 游动电流仪-流通式浊度分析仪-杰普仪器(上海)有限公司 | 神超官网_焊接圆锯片_高速钢锯片_硬质合金锯片_浙江神超锯业制造有限公司 | 糖衣机,除尘式糖衣机,全自动糖衣机,泰州市长江制药机械有限公司 体感VRAR全息沉浸式3D投影多媒体展厅展会游戏互动-万展互动 | 精密模具制造,注塑加工,吹塑和吹瓶加工,EPS泡沫包装生产 - 济南兴田塑胶有限公司 | 考勤系统_人事考勤管理系统_本地部署BS考勤系统_考勤软件_天时考勤管理专家 | 都江堰招聘网-都江堰人才网 都江堰人事人才网 都江堰人才招聘网 邢台人才网_邢台招聘网_邢台123招聘【智达人才网】 |