-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
這就是推薦系統――核心技術原理與企業應用 版權信息
- ISBN:9787121454226
- 條形碼:9787121454226 ; 978-7-121-45422-6
- 裝幀:平塑勒
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
這就是推薦系統――核心技術原理與企業應用 本書特色
本書不要求讀者必須具備深度學習或者機器學習的背景知識,不論是互聯網行業的技術、產品、運營人員,還是高等院校的在校生,或者對個性化推薦、大數據應用感興趣的愛好者等都可以閱讀此書。 亮點一:完全來自于工業化實踐,內容按照實際推薦系統的模塊劃分:內容理解、用戶畫像、召回、排序、重排等,其他書沒有這樣寫的。 亮點二:內容全面系統但精煉,全書是作者根據實踐總結,沒有大面積理論講解,只講基礎框架、核心技術和前沿發展。 亮點三:囊括當下熱門前沿技術,包括強化學習、因果推斷、端上智能,以及ChatGPT時代的推薦系統未來發展描述,對當下的技術人員很有指導意義。 亮點四:四位作者均是來自一線大廠的工程師,長期在工業界從事推薦算法的相關應用研究,本書的內容融入了作者對推薦算法的思考、體會及實戰經驗。 亮點五:此書不僅具有全局視野,體系完善,而且生動翔實,細節拉滿。不管你是小白還是推薦系統的從業者,閱讀此書都會讓你受益匪淺。 向讀者更全面、更具體地介紹推薦系統,全方位地剖析主流工業推薦系統的運作機理和每個核心模塊,并讓讀者能夠了解不同的互聯網產品中推薦系統是如何與業務場景進行深度結合來加速達成業務核心目標的。 推薦系統具有廣泛的應用背景,作者基于自身在該領域多年從事研發的經驗,將推薦系統整體框架作為切入點,全面而系統地介紹了與推薦系統相關的多項技術,包括內容理解、用戶畫像、排序、重排等。此外,本書還通過實際問題給出多個應用案例,使讀者可以更好地理解和應用推薦系統技術。無論是相關領域的從業人員,還是高校學生,都可以從本書獲益匪淺。 清華大學教授 | 馬少平 從衣食住行到娛樂消費,推薦系統已經深度融入我們的日常生活,成為AI技術落地應用的典型場景。推薦系統不僅要解決多模態內容理解的語義鴻溝和用戶興趣偏好的意圖鴻溝,還需要克服億級用戶與推薦內容下的工程開發與部署難題。本書從工業界的視角系統地介紹了推薦系統的核心技術和工程實現方案,每章的內容循序漸進,深度貼合實際應用,將工業界推薦系統的基礎框架、核心技術和前沿發展呈現在讀者面前;ヂ摼W服務領域的從業人員和高等院校相關專業的本科生、研究生都將從本書中受益。 清華大學教授 | 孫立峰 近年來,推薦系統已經在各種在線平臺中得到廣泛應用,成為用戶獲取信息、平臺滿足用戶需求的主要途徑之一。本書系統地梳理了推薦系統領域的相關重要技術,從多個方面對推薦算法的相關概念、模型及算法進行了詳細介紹,涵蓋了*新的前沿技術。特別是,作者長期在工業界從事推薦算法的相關應用研究,本書的內容融入了作者對推薦算法的思考、體會及實戰經驗,相信相關技術人員能從本書中受益。 中國人民大學教授 | 趙鑫 在如今信息爆炸和碎片化的時代,推薦系統是解決信息過載和提升信息獲取效率的重要技術。本書非常全面地梳理了推薦系統構建所要面臨的核心問題,囊括了學術界和工業界主要的技術進展和實際應用經驗。本書針對視頻場景的推薦系統有精彩的介紹,對于文本、語音、圖片和視頻等多模態信息如何理解,以及應用到推薦系統,有詳細的剖析和深入淺出的闡述。相信無論是入門的新手,還是資深的行業從業者,在本書中都能有所收益,從而對推薦系統有更好的理解。 快手NLP和音頻中心負責人 | 張富崢 在信息爆炸的時代,推薦系統極大地提升了人與信息的匹配效率,是人工智能技術*典型、*成熟的應用之一,已然成為所有互聯網產品的標配。本書作者團隊來自互聯網大廠,完整地經歷了從推薦系統搭建、演化到成熟的全過程,并得以有機會將其總結、提煉并形成此書。此書不僅具有全局視野,體系完善,而且生動翔實,細節拉滿。不管你是小白還是推薦系統的從業者,閱讀此書都會讓你受益匪淺。 數據智能社區DataFun創辦人 | 王大川
這就是推薦系統――核心技術原理與企業應用 內容簡介
推薦系統作為近年來非常熱門的AI技術落地場景,已廣泛應用于各行業的互聯網應用,從衣食住行到娛樂消費,以及無處不在的廣告,背后都依賴推薦系統的決策。本書貼合工業級推薦系統,以推薦系統的整體技術框架為切入點,深入剖析推薦系統中的內容理解、用戶畫像、召回、排序、重排等核心模塊,介紹每個模塊的核心技術和業界應用,并展開介紹了推薦冷啟動、推薦偏置與消偏等常見問題和解決方案。此外,還對當前推薦系統領域的熱門前沿技術進行了介紹,包括強化學習、因果推斷、端上智能等。
這就是推薦系統――核心技術原理與企業應用 目錄
1.1 推薦系統大時代 1
1.1.1 推薦系統的定義 2
1.1.2 推薦系統的價值 3
1.1.3 推薦系統的天時地利 4
1.1.4 推薦系統架構概覽 5
1.2 推薦系統的核心模塊 7
1.2.1 內容理解:理解和刻畫推薦內容 7
1.2.2 用戶畫像:理解和刻畫用戶 7
1.2.3 召回:為用戶初篩內容 8
1.2.4 排序:為用戶精選內容 9
1.2.5 重排:從業務角度進行內容調整 10
1.2.6 推薦系統質量評估體系 11
總結 11
第2章 多模態時代的內容理解 13
2.1 內容標簽體系建設 14
2.1.1 標簽體系的作用 14
2.1.2 標簽體系設計和建設 14
2.1.3 標簽提取和生成 16
2.2 文本內容理解 18
2.2.1 文本分類 18
2.2.2 文本標簽提取 21
2.2.3 文本聚類 22
2.2.4 文本Embedding 22
2.2.5 知識圖譜 26
2.3 多模態內容理解 28
2.3.1 圖像分類 28
2.3.2 視頻分類 30
2.3.3 視頻多模態內容Embedding 31
2.4 內容理解在推薦系統中的應用 32
總結 33
第3章 比你更了解自己的用戶畫像 34
3.1 初識用戶畫像 34
3.1.1 什么是用戶畫像 35
3.1.2 用戶畫像的作用 35
3.1.3 用戶畫像系統架構 36
3.2 用戶畫像標簽體系 37
3.2.1 用戶基礎屬性標簽 37
3.2.2 用戶社交屬性標簽 39
3.2.3 用戶行為屬性標簽 39
3.2.4 用戶興趣標簽 40
3.2.5 用戶分層標簽 41
3.2.6 其他常用維度標簽 41
3.3 用戶畫像標簽開發 42
3.3.1 標簽的基礎數據 42
3.3.2 標簽計算整體流程 42
3.3.3 規則類標簽 44
3.3.4 統計類標簽 44
3.3.5 模型類標簽 45
3.4 用戶畫像實踐案例 46
總結 51
第4章 包羅萬象的召回環節 52
4.1 召回的基本邏輯和方法論 52
4.1.1 召回的重要性 52
4.1.2 召回與排序的區別 53
4.1.3 主要的召回策略與算法 54
4.2 傳統召回策略 55
4.2.1 基于內容的召回 55
4.2.2 經典協同過濾召回 56
4.2.3 探索類召回 58
4.3 向量化模型召回 59
4.3.1 向量化模型召回原理 59
4.3.2 從KNN到ANN 60
4.3.3 經典向量化召回模型 62
4.4 基于用戶行為序列的召回 65
4.4.1 SASRec——經典行為序列召回模型 65
4.4.2 BERT4Rec與BST——NLP技術與用戶行為序列結合 66
4.4.3 MIND及其衍生——多興趣召回模型 68
4.4.4 超長序列召回——建模用戶全期興趣 70
4.5 圖Embedding在召回中的應用 72
4.5.1 圖Embedding技術 73
4.5.2 DeepWalk——經典圖Embedding方法 74
4.5.3 Node2Vec——DeepWalk更進一步 75
4.5.4 PinSAGE——GCN在推薦系統領域的工業化應用 76
4.5.5 MetaPath2Vec——異構圖Embedding方法 77
4.6 前瞻性召回策略與模型 79
4.6.1 TDM——模型與索引結合的藝術 79
4.6.2 對比學習——樣本的魔法 81
4.7 召回質量評估方法 82
4.7.1 召回評估方法概述 83
4.7.2 召回率、精確率、F1值——基準評估指標 83
4.7.3 HR、ARHR——TopN推薦評價指標 84
4.7.4 CG、DCG、nDCG——信息增益維度的評估指標 84
4.7.5 長尾覆蓋評估 85
總結 86
第5章 投你所好的排序環節 87
5.1 排序環節的意義和優化方向 87
5.1.1 排序環節的意義 87
5.1.2 排序環節的優化方向 88
5.2 從Embedding看排序模型的演進 89
5.2.1 什么是Embedding 90
5.2.2 Embedding的產生過程 91
5.2.3 特征組合在深度排序模型中的應用 94
5.2.4 用戶歷史行為建模在深度排序模型中的應用 101
5.2.5 超大規模Embedding在實際中的應用 107
5.3 推薦系統粗排階段及其發展歷程 113
5.3.1 粗排定位與技術路線選擇 114
5.3.2 粗排模型架構的演變 116
5.3.3 使用知識蒸餾增強粗排與精排的一致性 120
5.3.4 緩解樣本選擇偏差 128
5.3.5 粗排效果的評價 130
5.4 多目標排序建模 131
5.4.1 多目標排序建模的意義和挑戰 131
5.4.2 多目標排序建模方法概覽 132
5.4.3 多目標融合尋參 142
5.5 推薦系統排序階段的評估 142
5.5.1 排序評估的兩個階段 143
5.5.2 常用的效果評估指標 144
5.5.3 常用的系統評估指標 145
5.5.4 離線和線上效果的一致性問題 146
總結 147
第6章 權衡再三重排序 148
6.1 重排序的必要性和作用 148
6.2 重排模型 150
6.2.1 重排模型建模的出發點 150
6.2.2 序列重排模型 151
6.2.3 基于強化學習的重排模型 157
6.3 重排多樣性策略 160
6.3.1 重排多樣性的出發點 160
6.3.2 多樣性評估指標 161
6.3.3 規則多樣性打散 162
6.3.4 多樣性模型策略 164
6.4 重排中的業務規則 167
總結 169
第7章 如若初見冷啟動 170
7.1 推薦冷啟動的定義與挑戰 170
7.2 冷啟動一般解決思路 171
7.3 新用戶推薦冷啟動 173
7.3.1 新用戶召回策略 173
7.3.2 新用戶排序模型 175
7.3.3 新用戶重排策略 177
7.4 新物品分發冷啟動 178
7.4.1 新物品冷啟動召回策略 179
7.4.2 新物品冷啟動排序策略 180
7.4.3 新物品冷啟動流量分配機制 181
總結 184
第8章 推薦系統中的魔術手 185
8.1 特征工程 185
8.1.1 特征的理解和分類 186
8.1.2 特征挖掘維度 186
8.1.3 工程視角下的特征工程開發 187
8.1.4 特征工程的流程和方法 190
8.2 樣本加工藝術 193
8.2.1 如何提取有效樣本 193
8.2.2 負樣本優化 195
8.2.3 樣本遷移 197
8.2.4 其他樣本優化技巧 198
8.3 推薦系統實效性 198
8.3.1 推薦數據實效性 199
8.3.2 推薦模型實效性 201
8.3.3 在線學習整體機制 202
8.4 推薦中的偏差與消偏策略 202
8.4.1 推薦偏差的緣由 203
8.4.2 推薦系統常見偏差 203
8.4.3 常用的消偏技術和策略 205
總結 209
第9章 系統進化的利器——AB實驗平臺 210
9.1 什么是AB實驗 210
9.2 AB實驗平臺框架 212
9.3 AB實驗分流機制&實驗類型 214
9.4 AB實驗效果評估 217
9.4.1 推薦系統常見的AB指標 218
9.4.2 AB實驗的假設檢驗 219
9.4.3 AB實驗的流量大小 221
9.5 AB實驗并不是的 221
總結 225
第10章 推薦系統中的前沿技術 226
10.1 強化學習 226
10.2 因果推斷 230
10.3 端上智能 235
10.4 動態算力分配 238
10.5 增益模型 241
總結 246
這就是推薦系統――核心技術原理與企業應用 作者簡介
胡瀾濤,畢業于清華大學計算機系,快手推薦算法技術總監。曾任字節跳動高級算法工程師,騰訊高級研究員。在推薦系統領域有豐富的實踐經驗,負責過包括Tikok、快手、微信看一看在內的多個大規模工業級推薦系統的核心研發工作。主要研究方向為推薦系統,發表相關領域的學術論文6篇,擁有專利5項。李?h亭,畢業于大連理工大學計算機專業。曾先后就職于百度、小米等公司,參與百度鳳巢廣告CTR預估模型的研發,負責小米音樂、閱讀、應用商店、游戲中心等多個產品推薦服務從0到1的搭建,在搜索、廣告、推薦領域有豐富的實戰經驗。目前轉戰智能家居領域,探索智能感知、智能決策等AI技術在新場景的落地。崔光范,畢業于中國科學院軟件研究所,愛奇藝助理研究員,負責短視頻信息流推薦業務。曾任小米推薦算法工程師,負責應用商店、游戲中心、有品等業務的推薦工作,從零構建了小米垂域業務的深度推薦引擎。主要研究方向是推薦系統、計算廣告、搜索等,發表過多篇論文和專利。易可欣,畢業于北京大學,先后在愛奇藝、快手擔任推薦系統算法工程師,主要研究方向為召回策略與模型、數據挖掘、樣本優化等。
- >
伯納黛特,你要去哪(2021新版)
- >
煙與鏡
- >
唐代進士錄
- >
姑媽的寶刀
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
羅曼·羅蘭讀書隨筆-精裝
- >
苦雨齋序跋文-周作人自編集