包郵 MLOPS工程實(shí)踐:工具、技術(shù)與企業(yè)級(jí)應(yīng)用
-
>
全國(guó)計(jì)算機(jī)等級(jí)考試最新真考題庫(kù)模擬考場(chǎng)及詳解·二級(jí)MSOffice高級(jí)應(yīng)用
-
>
決戰(zhàn)行測(cè)5000題(言語理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
MLOPS工程實(shí)踐:工具、技術(shù)與企業(yè)級(jí)應(yīng)用 版權(quán)信息
- ISBN:9787111733294
- 條形碼:9787111733294 ; 978-7-111-73329-4
- 裝幀:平裝-膠訂
- 冊(cè)數(shù):暫無
- 重量:暫無
- 所屬分類:>
MLOPS工程實(shí)踐:工具、技術(shù)與企業(yè)級(jí)應(yīng)用 本書特色
(1)作者背景資深:AI獨(dú)角獸第四范式的聯(lián)合創(chuàng)始人和技術(shù)VP領(lǐng)銜,騰訊、小米、百度、網(wǎng)易、中興、眾安保險(xiǎn)等企業(yè)的技術(shù)專家共同參與。
(2)4個(gè)維度展開:從工具、技術(shù)、企業(yè)級(jí)應(yīng)用、成熟度評(píng)估4個(gè)維度全面講解MLOps,指導(dǎo)企業(yè)構(gòu)建可靠、高效、可復(fù)用、可擴(kuò)展的機(jī)器學(xué)習(xí)模型。
(3)大廠現(xiàn)身說法:騰訊、小米、百度、網(wǎng)易、中興、眾安保險(xiǎn)的AI技術(shù)專家通過案例方式詳細(xì)講解他們?cè)贛LOps領(lǐng)域的工程實(shí)踐。
(4)9大主題內(nèi)容:通過9大主題內(nèi)容講解如何在實(shí)際項(xiàng)目中利用MLOps進(jìn)行機(jī)器學(xué)習(xí)模型的部署、監(jiān)控與優(yōu)化,以及如何利用MLOps實(shí)現(xiàn)持續(xù)集成與持續(xù)交付等高效工作流程。
(5)9位專家推薦:來自小米、字節(jié)、網(wǎng)易、百度、騰訊等企業(yè)的9位知名技術(shù)專家高度評(píng)價(jià)并鼎力推薦。
MLOPS工程實(shí)踐:工具、技術(shù)與企業(yè)級(jí)應(yīng)用 內(nèi)容簡(jiǎn)介
內(nèi)容簡(jiǎn)介這是一本能指導(dǎo)企業(yè)利用MLOps技術(shù)構(gòu)建可靠、高效、可復(fù)用、可擴(kuò)展的機(jī)器學(xué)習(xí)模型從而實(shí)現(xiàn)AI工程化落地的著作。由國(guó)內(nèi)AI領(lǐng)域的獨(dú)角獸企業(yè)第四范式的聯(lián)合創(chuàng)始人和技術(shù)VP領(lǐng)銜撰寫,從工具、技術(shù)、企業(yè)級(jí)應(yīng)用、成熟度評(píng)估4個(gè)維度對(duì)MLOps進(jìn)行了全面的講解。本書的主要內(nèi)容包括如下9個(gè)方面:(1)MLOps的核心概念和方法,可以幫助讀者全面了解MLOps的基本原理;(2)MLOps涉及的幾種角色,以及這些角色之間如何協(xié)作;(3)機(jī)器學(xué)習(xí)項(xiàng)目的基礎(chǔ)知識(shí)和全流程,是學(xué)習(xí)和應(yīng)用MLOps的基礎(chǔ);(4)MLOps中的數(shù)據(jù)處理、主要流水線工具Airflow和MLflow、特征平臺(tái)和實(shí)時(shí)特征平臺(tái)OpenMLDB、推理工具鏈Adlik,為讀者系統(tǒng)講解MLOps的技術(shù)和工具;(5)云服務(wù)供應(yīng)商的端到端MLOps解決方案;(6)第四范式、網(wǎng)易、小米、騰訊、眾安金融等企業(yè)的MLOps工程實(shí)踐案例和經(jīng)驗(yàn);(7)MLOps的成熟度模型,以及微軟、谷歌和信通院對(duì)MLOps成熟度模型的劃分;(8)針對(duì)不同規(guī)模的企業(yè)和團(tuán)隊(duì)的MLOps很好實(shí)踐,幫助他們量身定做MLOps策略;(9)MLOps的未來發(fā)展趨勢(shì),以及如何將新技術(shù)融入MLOps實(shí)踐中。本書深入淺出、循序漸進(jìn)地講解了如何在實(shí)際項(xiàng)目中利用MLOps進(jìn)行機(jī)器學(xué)習(xí)模型的部署、監(jiān)控與優(yōu)化,以及如何利用MLOps實(shí)現(xiàn)持續(xù)集成與持續(xù)交付等高效的工作流程。通過企業(yè)級(jí)的MLOps案例和解決方案,幫助讀者輕松掌握MLOps的設(shè)計(jì)思路以及如何應(yīng)用MLOps解決實(shí)際問題。
MLOPS工程實(shí)踐:工具、技術(shù)與企業(yè)級(jí)應(yīng)用 目錄
作者簡(jiǎn)介
前言
第1章 全面了解MLOps 1
1.1 人工智能的趨勢(shì)和現(xiàn)狀 1
1.1.1 趨勢(shì)1:人工智能在企業(yè)中加速落地,彰顯更多業(yè)務(wù)價(jià)值 1
1.1.2 趨勢(shì)2:人工智能應(yīng)用從以模型為中心向以數(shù)據(jù)為中心轉(zhuǎn)變 3
1.1.3 現(xiàn)狀:人工智能落地成功率低,
成本高 4
1.2 人工智能的問題、挑戰(zhàn)以及應(yīng)對(duì)措施 5
1.2.1 問題1:機(jī)器學(xué)習(xí)代碼只是整個(gè)系統(tǒng)的一小部分 5
1.2.2 問題2:數(shù)據(jù)是*主要的問題 6
1.2.3 挑戰(zhàn):人工智能系統(tǒng)
如何規(guī)模化落地 7
1.2.4 應(yīng)對(duì)措施:MLOps 8
1.3 MLOps簡(jiǎn)介 8
1.3.1 MLOps的定義 8
1.3.2 MLOps相關(guān)的工具和平臺(tái) 12
1.3.3 MLOps的優(yōu)勢(shì) 13
1.4 MLOps與DevOps 14
1.4.1 DevOps的3個(gè)優(yōu)點(diǎn) 14
1.4.2 MLOps延續(xù)了DevOps的優(yōu)點(diǎn) 17
1.4.3 MLOps和DevOps的不同之處 19
1.4.4 MLOps和DevOps的目標(biāo)與
實(shí)踐理念 20
1.5 MLOps與其他XOps的區(qū)別 20
1.5.1 MLOps與AIOps的區(qū)別 21
1.5.2 MLOps與DataOps的區(qū)別 21
1.5.3 MLOps與ModelOps的區(qū)別 22
1.5.4 XOps的相同點(diǎn):
都基于DevOps原則 22
1.6 本章小結(jié) 22
第2章 MLOps涉及的角色 23
2.1 角色類型 23
2.1.1 產(chǎn)品經(jīng)理 24
2.1.2 數(shù)據(jù)科學(xué)家 24
2.1.3 數(shù)據(jù)工程師 25
2.1.4 機(jī)器學(xué)習(xí)工程師 26
2.1.5 DevOps工程師 27
2.1.6 IT運(yùn)維工程師 27
2.2 角色劃分以及角色之間
存在的問題 28
2.2.1 角色劃分 28
2.2.2 問題1:技術(shù)棧不一致導(dǎo)致人工智能模型線上、線下效果不一致 28
2.2.3 問題2:關(guān)注點(diǎn)不同導(dǎo)致對(duì)系統(tǒng)的
需求不同 29
2.2.4 協(xié)作問題及解決辦法 30
2.3 本章小結(jié) 30
第3章 機(jī)器學(xué)習(xí)項(xiàng)目概論 31
3.1 機(jī)器學(xué)習(xí)項(xiàng)目簡(jiǎn)介 31
3.1.1 機(jī)器學(xué)習(xí)的定義 31
3.1.2 機(jī)器學(xué)習(xí)相關(guān)概念 33
3.1.3 機(jī)器學(xué)習(xí)能解決的問題 37
3.1.4 機(jī)器學(xué)習(xí)項(xiàng)目度量 38
3.1.5 機(jī)器學(xué)習(xí)項(xiàng)目難以落地的
原因 41
3.2 深入理解機(jī)器學(xué)習(xí)項(xiàng)目全流程 44
3.2.1 方案調(diào)研 45
3.2.2 方案投產(chǎn) 49
3.3 本章小結(jié) 51
第4章 MLOps中的數(shù)據(jù)部分 52
4.1 從以模型為中心到以數(shù)據(jù)為中心 52
4.1.1 以模型為中心的時(shí)代 52
4.1.2 以數(shù)據(jù)為中心的時(shí)代 53
4.2 MLOps中的數(shù)據(jù)生命周期管理 55
4.3 數(shù)據(jù)存儲(chǔ)架構(gòu)演進(jìn) 56
4.4 MLOps中主要的數(shù)據(jù)問題及
解決方案 57
4.4.1 常見的數(shù)據(jù)質(zhì)量問題及
解決方案 57
4.4.2 時(shí)序數(shù)據(jù)穿越問題及解決方案 59
4.4.3 離線和實(shí)時(shí)數(shù)據(jù)一致性問題及
解決方案 64
4.4.4 數(shù)據(jù)安全問題及解決方案 66
4.4.5 數(shù)據(jù)共享與復(fù)用問題及
解決方案 67
4.5 本章小結(jié) 67
第5章 流水線工具 69
5.1 Airflow 69
5.1.1 Airflow的功能和應(yīng)用場(chǎng)景 69
5.1.2 Airflow的核心概念 72
5.1.3 Airflow的使用方法 72
5.2 MLflow 80
5.2.1 MLflow的功能和應(yīng)用場(chǎng)景 80
5.2.2 MLflow的核心概念 81
5.2.3 MLflow的使用方法 82
5.3 其他流水線工具 91
5.4 本章小結(jié) 93
第6章 特征平臺(tái) 94
6.1 特征平臺(tái)的概念和起源 94
6.2 特征平臺(tái)的特性 96
6.3 特征平臺(tái)的現(xiàn)狀 97
6.4 主流的特征平臺(tái) 98
6.4.1 Tecton的特征平臺(tái) 99
6.4.2 AWS的SageMaker特征平臺(tái) 100
6.4.3 Databricks的特征平臺(tái) 102
6.4.4 Feast項(xiàng)目 103
6.4.5 OpenMLDB項(xiàng)目 105
6.5 特征平臺(tái)的發(fā)展趨勢(shì) 106
6.6 本章小結(jié) 107
第7章 實(shí)時(shí)特征平臺(tái)
OpenMLDB 108
7.1 實(shí)時(shí)特征平臺(tái)構(gòu)建方法論 108
7.1.1 機(jī)器學(xué)習(xí)閉環(huán) 108
7.1.2 實(shí)時(shí)特征計(jì)算 109
7.1.3 痛點(diǎn):線上線下計(jì)算一致性
校驗(yàn)帶來的高成本 110
7.1.4 目標(biāo):開發(fā)即上線 112
7.1.5 技術(shù)需求 112
7.1.6 抽象架構(gòu) 113
7.1.7 OpenMLDB架構(gòu)設(shè)計(jì)實(shí)踐 114
7.2 OpenMLDB項(xiàng)目介紹 116
7.2.1 設(shè)計(jì)理念 116
7.2.2 生產(chǎn)級(jí)機(jī)器學(xué)習(xí)特征平臺(tái) 116
7.2.3 核心特性 117
7.2.4 常見問題 117
7.3 核心模塊—在線引擎 118
7.3.1 概覽 118
7.3.2 Apache ZooKeeper 119
7.3.3 Nameserver 119
7.3.4 Tablet 120
7.4 核心數(shù)據(jù)結(jié)構(gòu) 122
7.4.1 背景介紹 122
7.4.2 雙層跳表索引 122
7.4.3 預(yù)聚合技術(shù) 124
7.4.4 性能表現(xiàn) 125
7.5 高級(jí)特性—主從集群部署 127
7.5.1 定義和目標(biāo) 127
7.5.2 技術(shù)方案 127
7.5.3 主從集群搭建實(shí)踐 130
7.5.4 主從集群部署常見問題 131
7.6 高級(jí)特性—雙存儲(chǔ)引擎 133
7.6.1 內(nèi)存和磁盤雙存儲(chǔ)
引擎架構(gòu) 133
7.6.2 功能支持對(duì)比 134
7.6.3 性能對(duì)比 135
7.7 執(zhí)行流程介紹 136
7.7.1 執(zhí)行流程概覽 136
7.7.2 執(zhí)行模式概覽 137
7.7.3 離線模式 137
7.7.4 在線模式 138
7.7.5 請(qǐng)求模式 138
7.8 實(shí)踐 139
7.8.1 準(zhǔn)備 140
7.8.2 使用流程 141
7.8.3 實(shí)時(shí)特征計(jì)算的結(jié)果說明 144
7.9 生態(tài)整合—在線數(shù)據(jù)源Kafka 145
7.9.1 簡(jiǎn)介 145
7.9.2 準(zhǔn)備工作 146
7.9.3 步驟1:?jiǎn)?dòng)OpenMLDB
并創(chuàng)建數(shù)據(jù)庫(kù) 146
7.9.4 步驟2:?jiǎn)?dòng)Kafka
并創(chuàng)建Topic 147
7.9.5 步驟3:?jiǎn)?dòng)Connector 147
7.9.6 步驟4:測(cè)試 148
7.10 生態(tài)整合—離線數(shù)據(jù)源Hive 149
7.10.1 配置 149
7.10.2 數(shù)據(jù)類型 149
7.10.3 通過LIKE語法快速建表 150
7.10.4 將Hive數(shù)據(jù)導(dǎo)入
OpenMLDB 150
7.10.5 將OpenMLDB數(shù)據(jù)
導(dǎo)出到Hive 151
7.11 案例:出租車行程時(shí)間預(yù)測(cè) 151
7.11.1 環(huán)境準(zhǔn)備和預(yù)備知識(shí) 151
7.11.2 全流程演示 152
7.12 本章小結(jié) 155
第8章 Adlik推理工具鏈 156
8.1 機(jī)器學(xué)習(xí)模型落地挑戰(zhàn) 156
8.2 Adlik的優(yōu)勢(shì) 157
8.3 Adlik的架構(gòu) 158
8.3.1 模型優(yōu)化器 159
8.3.2 模型編譯器 161
8.3.3 推理引擎模塊 161
8.4 快速入門 164
8.4.1 編譯模型 164
8.4.2 部署模型 166
8.4.3 模型推理 166
8.4.4 引入自定義運(yùn)行時(shí) 167
8.5 Adlik端到端模型推理優(yōu)化實(shí)踐 168
8.5.1 模型結(jié)構(gòu)優(yōu)化 168
8.5.2 模型推理引擎 170
8.6 本章小結(jié) 171
第9章 云服務(wù)供應(yīng)商的端到端MLOps解決方案 172
9.1 認(rèn)識(shí)SageMaker 173
9.1.1 SageMaker的主要組成
部分 173
9.1.2 廣泛的數(shù)據(jù)源和數(shù)據(jù)集成
支持 174
9.2 無代碼實(shí)現(xiàn)供應(yīng)鏈中到貨時(shí)間的
預(yù)測(cè) 176
9.2.1 數(shù)據(jù)準(zhǔn)備 177
9.2.2 簡(jiǎn)單的數(shù)據(jù)合并 179
9.2.3 構(gòu)建、訓(xùn)練和分析機(jī)器學(xué)習(xí)
模型 180
9.2.4 模型預(yù)測(cè) 183
9.3 應(yīng)用SageMaker Notebook進(jìn)行 MLOps 管理 183
9.3.1 數(shù)據(jù)導(dǎo)入 184
9.3.2 數(shù)據(jù)清洗和特征設(shè)計(jì) 184
9.3.3 模型訓(xùn)練 185
9.3.4 模型評(píng)估 186
9.3.5 模型上線 187
9.3.6 使用模型倉(cāng)庫(kù)和 Pipeline系統(tǒng)
管理訓(xùn)練成果 187
9.4 本章小結(jié) 194
第10章 MLOps 在反欺詐與推薦
系統(tǒng)中的應(yīng)用 196
10.1 案例1:信用卡交易反欺詐系統(tǒng) 196
10.1.1 定義業(yè)務(wù)目標(biāo) 196
10.1.2 系統(tǒng)設(shè)計(jì)的挑戰(zhàn) 198
10.1.3 數(shù)據(jù)準(zhǔn)備與特征設(shè)計(jì)思路 201
10.1.4 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 202
10.2 案例2:推薦系統(tǒng) 205
10.2.1 推薦系統(tǒng)介紹 205
10.2.2 定義優(yōu)化目標(biāo) 206
10.2.3 系統(tǒng)設(shè)計(jì)挑戰(zhàn)與實(shí)現(xiàn)思路 208
10.3 本章小結(jié) 210
第11章 網(wǎng)易云音樂實(shí)時(shí)模型大規(guī)模應(yīng)用之道 211
11.1 從云音樂直播推薦中的實(shí)時(shí)性
說起 211
11.1.1 直播對(duì)實(shí)時(shí)性的強(qiáng)需求 213
11.1.2 推薦引擎實(shí)時(shí)性的三要素 213
11.1.3 直播精排模型的實(shí)時(shí)化演進(jìn) 216
11.2 實(shí)時(shí)增量模型的構(gòu)建 216
11.2.1 實(shí)時(shí)特征快照 217
11.2.2 實(shí)時(shí)樣本歸因 219
11.2.3 實(shí)時(shí)樣本拼接 222
11.2.4 增量訓(xùn)練和更新 223
11.2.5 線上效果 224
11.3 特征平臺(tái)將實(shí)時(shí)能力泛化到
更多場(chǎng)景 225
11.4 FeatureBox 226
11.4.1 FeatureBox解決的問題 226
11.4.2 FeatureBox整體架構(gòu) 227
11.4.3 DataHub模塊 227
11.4.4 Transform模塊 231
11.4.5 MFDL模塊 232
11.4.6 Storage模塊 233
11.4.7 Monitor模塊 234
11.5 在線預(yù)估基于FeatureBox的
構(gòu)建 236
11.5.1 特征與模型的高效迭代 236
11.5.2 高性能預(yù)估計(jì)算 242
11.5.3 預(yù)估與FeatureBox實(shí)時(shí)性
方案 246
11.6 本章小結(jié) 248
第12章 小米廣告機(jī)器學(xué)習(xí)平臺(tái)
實(shí)踐 249
12.1 小米廣告一站式機(jī)器學(xué)習(xí)平臺(tái)
簡(jiǎn)介 249
12.1.1 傳統(tǒng)機(jī)器學(xué)習(xí)流程的問題 249
12.1.2 小米廣告機(jī)器學(xué)習(xí)平臺(tái)模塊
簡(jiǎn)介 251
12.2 特征工程模塊 252
12.2.1 特征工程簡(jiǎn)介 252
12.2.2 數(shù)據(jù)源管理 253
12.2.3 特征管理 253
12.2.4 樣本管理 257
12.3 模型訓(xùn)練平臺(tái) 259
12.3.1 算法管理 260
12.3.2 離線模型訓(xùn)練管理 261
12.3.3 模型更新 262
12.4 線上推理模塊 264
12.4.1 線上推理服務(wù)介紹 264
12.4.2 高性能和高可用保證 266
12.4.3 模型部署 268
12.5 本章小結(jié) 273
第13章 騰訊金融推薦中臺(tái)實(shí)踐 274
13.1 業(yè)務(wù)介紹 274
13.1.1 業(yè)務(wù)優(yōu)化目標(biāo) 274
13.1.2 業(yè)務(wù)特點(diǎn) 275
13.2 現(xiàn)狀及挑戰(zhàn) 276
13.2.1 推薦系統(tǒng)復(fù)雜性 277
13.2.2 算法工程技術(shù)壁壘 278
13.3 MLOps實(shí)踐 278
13.4 推薦系統(tǒng)產(chǎn)品體系 280
13.4.1 特征系統(tǒng) 281
13.4.2 模型訓(xùn)練系統(tǒng) 281
13.4.3 模型服務(wù)系統(tǒng) 282
13.4.4 推薦運(yùn)營(yíng)系統(tǒng) 283
13.5 系統(tǒng)設(shè)計(jì) 283
13.5.1 特征系統(tǒng) 284
13.5.2 模型服務(wù)系統(tǒng) 290
13.6 本章小結(jié) 293
第14章 眾安金融實(shí)時(shí)特征平臺(tái)
實(shí)踐 294
14.1 眾安金融的MLOps建設(shè)背景 294
14.2 眾安金融的MLOps建設(shè)思路 295
14.2.1 眾安金融的MLOps流程說明 295
14.2.2 眾安金融特征平臺(tái)
能力要求 297
14.3 實(shí)時(shí)特征平臺(tái)的架構(gòu)設(shè)計(jì) 297
14.3.1 實(shí)時(shí)特征平臺(tái)架構(gòu)說明 298
14.3.2 實(shí)時(shí)特征數(shù)據(jù)源層 298
14.3.3 實(shí)時(shí)特征平臺(tái)的核心功能 299
14.4 實(shí)時(shí)業(yè)務(wù)特征計(jì)算 300
14.4.1 實(shí)時(shí)業(yè)務(wù)特征計(jì)算系統(tǒng)
設(shè)計(jì) 300
14.4.2 實(shí)時(shí)業(yè)務(wù)特征核心數(shù)據(jù)
模型 301
14.4.3 實(shí)時(shí)業(yè)務(wù)特征計(jì)算引擎 302
14.5 反欺詐場(chǎng)景中的特征計(jì)算 303
14.5.1 反欺詐特征計(jì)算系統(tǒng)設(shè)計(jì) 303
14.5.2 反欺詐特征分類說明 304
14.5.3 用戶關(guān)系圖譜實(shí)現(xiàn)方案 305
14.6 本章小結(jié) 306
第15章 MLOps成熟度模型 308
15.1 能力成熟度模型概述 308
15.2 谷歌的MLOps成熟度模型 309
15.2.1 谷歌對(duì)MLOps的理解和
認(rèn)識(shí) 309
15.2.2 谷歌對(duì)MLOps成熟度等級(jí)的
定義 310
15.3 微軟的MLOps成熟度模型 317
15.3.1 微軟對(duì)MLOps成熟度模型的
理解和認(rèn)識(shí) 317
15.3.2 微軟對(duì)MLOps成熟度等級(jí)的
定義 318
15.4 信通院的MLOps成熟度模型 322
15.4.1 需求管理能力子域
相關(guān)內(nèi)容 323
15.4.2 數(shù)據(jù)工程能力子域
相關(guān)內(nèi)容 325
15.5 本章小結(jié) 329
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
- >
姑媽的寶刀
- >
山海經(jīng)
- >
煙與鏡
- >
苦雨齋序跋文-周作人自編集
- >
巴金-再思錄
- >
唐代進(jìn)士錄
- >
名家?guī)阕x魯迅:朝花夕拾