設(shè)計(jì)深度學(xué)習(xí)系統(tǒng) 版權(quán)信息
- ISBN:9787111771173
- 條形碼:9787111771173 ; 978-7-111-77117-3
- 裝幀:平裝-膠訂
- 冊(cè)數(shù):暫無
- 重量:暫無
- 所屬分類:
設(shè)計(jì)深度學(xué)習(xí)系統(tǒng) 本書特色
深度學(xué)習(xí)模型必須構(gòu)建到軟件系統(tǒng)中才能實(shí)際使用。作為一名軟件工程師,你需要對(duì)深度學(xué)習(xí)有深刻的理解才能設(shè)計(jì)出這樣的系統(tǒng)。本書將為你提供這種深刻的理解。本書會(huì)教你設(shè)計(jì)和實(shí)現(xiàn)一個(gè)生產(chǎn)級(jí)的深度學(xué)習(xí)平臺(tái)所需的一切知識(shí)。首先,它從開發(fā)者的角度出發(fā),呈現(xiàn)了深度學(xué)習(xí)系統(tǒng)的全貌,包括其主要組件及連接方式。然后,它會(huì)一步步指導(dǎo)你如何使用工程方法構(gòu)建一個(gè)可維護(hù)、高效且可擴(kuò)展的深度學(xué)習(xí)平臺(tái)。本書涵蓋:?深度學(xué)習(xí)開發(fā)周期?TensorFlow和PyTorch自動(dòng)化訓(xùn)練?數(shù)據(jù)集管理、模型服務(wù)和超參數(shù)調(diào)優(yōu)?深度學(xué)習(xí)實(shí)踐實(shí)驗(yàn)室書中提供了Java和Python代碼示例,適合軟件開發(fā)人員和以工程為導(dǎo)向的數(shù)據(jù)科學(xué)家。
設(shè)計(jì)深度學(xué)習(xí)系統(tǒng) 內(nèi)容簡(jiǎn)介
本書主要從軟件開發(fā)者的角度探討如何構(gòu)建和設(shè)計(jì)深度學(xué)習(xí)系統(tǒng)。作者首先描述一個(gè)典型的深度學(xué)習(xí)系統(tǒng)的整體,包括其主要組件以及它們之間的連接方式,然后在各個(gè)單獨(dú)的章節(jié)中深入探討這些主要組件。對(duì)于具體介紹的章節(jié),會(huì)在開始時(shí)討論需求,接著介紹設(shè)計(jì)原則和示例服務(wù)/代碼,并評(píng)估開源解決方案。通過閱讀本書,讀者將能夠了解深度學(xué)習(xí)系統(tǒng)的工作原理,以及如何開發(fā)每個(gè)組件。本書的主要讀者對(duì)象是想要從事深度學(xué)習(xí)平臺(tái)工作或?qū)⒁恍┤斯ぶ悄芄δ芗傻疆a(chǎn)品中的軟件工程師。
設(shè)計(jì)深度學(xué)習(xí)系統(tǒng) 目錄
目 錄譯者序序前言深度學(xué)習(xí)系統(tǒng)架構(gòu)參考第1章 深度學(xué)習(xí)系統(tǒng)介紹 11.1 深度學(xué)習(xí)開發(fā)周期 31.1.1 深度學(xué)習(xí)產(chǎn)品開發(fā)周期的階段 41.1.2 開發(fā)周期中的角色 71.1.3 深度學(xué)習(xí)開發(fā)周期實(shí)例演練 91.1.4 項(xiàng)目開發(fā)的規(guī)模化 101.2 深度學(xué)習(xí)系統(tǒng)設(shè)計(jì)概述 10目 錄譯者序序前言深度學(xué)習(xí)系統(tǒng)架構(gòu)參考第1章 深度學(xué)習(xí)系統(tǒng)介紹 11.1 深度學(xué)習(xí)開發(fā)周期 31.1.1 深度學(xué)習(xí)產(chǎn)品開發(fā)周期的階段 41.1.2 開發(fā)周期中的角色 71.1.3 深度學(xué)習(xí)開發(fā)周期實(shí)例演練 91.1.4 項(xiàng)目開發(fā)的規(guī)模化 101.2 深度學(xué)習(xí)系統(tǒng)設(shè)計(jì)概述 101.2.1 參考系統(tǒng)架構(gòu) 111.2.2 關(guān)鍵組件 121.2.3 關(guān)鍵用戶場(chǎng)景 161.2.4 定制你自己的設(shè)計(jì) 171.2.5 在Kubernetes上構(gòu)建組件 191.3 構(gòu)建深度學(xué)習(xí)系統(tǒng)與開發(fā)模型之間的區(qū)別 20總結(jié) 21第2章 數(shù)據(jù)集管理服務(wù) 222.1 理解數(shù)據(jù)集管理服務(wù) 232.1.1 為什么深度學(xué)習(xí)系統(tǒng)需要數(shù)據(jù)集管理 232.1.2 數(shù)據(jù)集管理設(shè)計(jì)原則 262.1.3 數(shù)據(jù)集的悖論特性 282.2 瀏覽一個(gè)示例數(shù)據(jù)集管理服務(wù) 292.2.1 與示例服務(wù)互動(dòng) 292.2.2 用戶、用戶場(chǎng)景和整體架構(gòu) 352.2.3 數(shù)據(jù)攝取API 362.2.4 訓(xùn)練數(shù)據(jù)集獲取API 402.2.5 內(nèi)部數(shù)據(jù)集存儲(chǔ) 452.2.6 數(shù)據(jù)模式 482.2.7 添加新的數(shù)據(jù)集類型(IMAGE_CLASS) 502.2.8 服務(wù)設(shè)計(jì)回顧 512.3 開源方法 522.3.1 Delta Lake和Apache Spark家族的Petastorm 522.3.2 基于云對(duì)象存儲(chǔ)的Pachyderm 58總結(jié) 61第3章 模型訓(xùn)練服務(wù) 633.1 模型訓(xùn)練服務(wù):設(shè)計(jì)概述 643.1.1 為什么要使用模型訓(xùn)練服務(wù) 643.1.2 訓(xùn)練服務(wù)設(shè)計(jì)原則 663.2 深度學(xué)習(xí)訓(xùn)練代碼模式 673.2.1 模型訓(xùn)練工作流 673.2.2 將模型訓(xùn)練代碼Docker化為黑盒 683.3 一個(gè)示例模型訓(xùn)練服務(wù) 693.3.1 與服務(wù)進(jìn)行交互 693.3.2 服務(wù)設(shè)計(jì)概述 703.3.3 訓(xùn)練服務(wù)API 723.3.4 啟動(dòng)新的訓(xùn)練作業(yè) 733.3.5 更新和獲取作業(yè)狀態(tài) 753.3.6 意圖分類模型訓(xùn)練代碼 783.3.7 訓(xùn)練作業(yè)管理 793.3.8 故障排除指標(biāo) 803.3.9 支持新的算法或新版本 813.4 Kubeflow訓(xùn)練算子:開源方法 813.4.1 Kubeflow訓(xùn)練算子 823.4.2 Kubernetes算子/控制器模式 823.4.3 Kubeflow訓(xùn)練算子設(shè)計(jì) 833.4.4 如何使用Kubeflow訓(xùn)練算子 843.4.5 如何將這些算子集成到現(xiàn)有系統(tǒng)中 863.5 何時(shí)使用公有云 873.5.1 何時(shí)使用公有云解決方案 873.5.2 何時(shí)構(gòu)建自己的訓(xùn)練服務(wù) 87總結(jié) 89第4章 分布式訓(xùn)練 904.1 分布式訓(xùn)練方法的類型 904.2 數(shù)據(jù)并行 914.2.1 理解數(shù)據(jù)并行 914.2.2 多工作節(jié)點(diǎn)訓(xùn)練挑戰(zhàn) 934.2.3 不同訓(xùn)練框架的分布式訓(xùn)練(數(shù)據(jù)并行)代碼編寫 944.2.4 數(shù)據(jù)并行–分布式訓(xùn)練中的工程化努力 984.3 支持?jǐn)?shù)據(jù)并行–分布式訓(xùn)練的示例服務(wù) 1004.3.1 服務(wù)概述 1004.3.2 與服務(wù)進(jìn)行交互 1014.3.3 啟動(dòng)訓(xùn)練作業(yè) 1034.3.4 更新和獲取作業(yè)狀態(tài) 1064.3.5 將訓(xùn)練代碼轉(zhuǎn)換為分布式運(yùn)行 1074.3.6 進(jìn)一步改進(jìn) 1084.4 訓(xùn)練無法在單個(gè)GPU上加載的大模型 1084.4.1 傳統(tǒng)方法:節(jié)省內(nèi)存 1084.4.2 流水線模型并行 1104.4.3 軟件工程師如何支持流水線并行訓(xùn)練 115總結(jié) 115第5章 超參數(shù)優(yōu)化服務(wù) 1175.1 理解超參數(shù) 1185.1.1 什么是超參數(shù) 1185.1.2 超參數(shù)為什么重要 1185.2 理解超參數(shù)優(yōu)化 1195.2.1 什么是HPO 1195.2.2 熱門的HPO算法 1215.2.3 常見的自動(dòng)HPO方法 1255.3 設(shè)計(jì)一個(gè)HPO服務(wù) 1265.3.1 HPO設(shè)計(jì)原則 1275.3.2 通用HPO服務(wù)設(shè)計(jì) 1285.4 開源HPO庫 1295.4.1 Hyperopt 1305.4.2 Optuna 1315.4.3 Ray Tune 1335.4.4 后續(xù)步驟 136總結(jié) 136第6章 模型服務(wù)設(shè)計(jì) 1376.1 模型服務(wù)的解釋 1386.1.1 什么是機(jī)器學(xué)習(xí)模型 1386.1.2 模型預(yù)測(cè)和推理 1396.1.3 什么是模型服務(wù) 1396.1.4 模型服務(wù)的挑戰(zhàn) 1406.1.5 模型服務(wù)術(shù)語 1416.2 常見的模型服務(wù)策略 1426.2.1 直接模型嵌入 1426.2.2 模型服務(wù) 1436.2.3 模型服務(wù)器 1436.3 設(shè)計(jì)預(yù)測(cè)服務(wù) 1446.3.1 單一模型應(yīng)用 1446.3.2 多租戶應(yīng)用 1476.3.3 在一個(gè)系統(tǒng)中支持多個(gè)應(yīng)用程序 1486.3.4 常見的預(yù)測(cè)服務(wù)需求 151總結(jié) 151第7章 模型服務(wù)實(shí)踐 1527.1 模型服務(wù)示例 1527.1.1 運(yùn)行示例服務(wù) 1537.1.2 服務(wù)設(shè)計(jì) 1547.1.3 前端服務(wù) 1557.1.4 意圖分類預(yù)測(cè)器 1597.1.5 模型驅(qū)逐 1657.2
展開全部
設(shè)計(jì)深度學(xué)習(xí)系統(tǒng) 作者簡(jiǎn)介
王遲Salesforce Einstein團(tuán)隊(duì)的首席軟件開發(fā)工程師,負(fù)責(zé)為數(shù)百萬Salesforce客戶構(gòu)建深度學(xué)習(xí)平臺(tái)。此前,他曾在微軟必應(yīng)和Azure工作,負(fù)責(zé)構(gòu)建大規(guī)模分布式系統(tǒng)。他目前已申請(qǐng)了6項(xiàng)專利,其中大部分涉及深度學(xué)習(xí)系統(tǒng)。司徒杰鵬PredictionIO的聯(lián)合創(chuàng)始人兼首席技術(shù)官。在PredictionIO被Salesforce收購(gòu)后,他繼續(xù)從事機(jī)器學(xué)習(xí)和深度學(xué)習(xí)系統(tǒng)方面的工作。他目前也為技術(shù)初創(chuàng)企業(yè)提供投資、咨詢和指導(dǎo)服務(wù)。