決策算法 版權(quán)信息
- ISBN:9787111756583
- 條形碼:9787111756583 ; 978-7-111-75658-3
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無
- 重量:暫無
- 所屬分類:>
決策算法 本書特色
本書源于斯坦福大學(xué)的課程“不確定性狀態(tài)下的決策”,主要介紹不確定狀態(tài)下的決策算法,涵蓋基本的數(shù)學(xué)問題和求解算法。本書主要關(guān)注規(guī)劃和強(qiáng)化學(xué)習(xí),其中一些技術(shù)涉及監(jiān)督學(xué)習(xí)和優(yōu)化。書中的算法是用Julia編程語言實(shí)現(xiàn)的,并配有大量圖表、示例和練習(xí)題。
決策算法 內(nèi)容簡介
本書源于斯坦福大學(xué)的課程“不確定性狀態(tài)下的決策”,主要介紹不確定狀態(tài)下的決策算法,涵蓋基本的數(shù)學(xué)問題和求解算法。本書主要關(guān)注規(guī)劃和強(qiáng)化學(xué)習(xí),其中一些技術(shù)涉及監(jiān)督學(xué)習(xí)和優(yōu)化。書中的算法是用Julia編程語言實(shí)現(xiàn)的,并配有大量圖表、示例和練習(xí)題。
本書共分為五個(gè)部分:首先解決在單個(gè)時(shí)間點(diǎn)上簡單決策的不確定性和目標(biāo)的推理問題;然后介紹隨機(jī)環(huán)境中的序列決策問題;接著討論模型不確定性,包括基于模型的方法和無模型的方法;之后討論狀態(tài)不確定性,包括精確信念狀態(tài)規(guī)劃、離線信念狀態(tài)規(guī)劃、在線信念狀態(tài)規(guī)劃等;*后討論多智能體系統(tǒng),涉及多智能體推理和協(xié)作智能體等。
決策算法 目錄
目錄
Algorithms for Decision Making
譯者序
前言
致謝
第1章導(dǎo)論1
11決策1
12應(yīng)用2
121飛機(jī)防撞控制系統(tǒng)2
122自動(dòng)駕駛控制系統(tǒng)2
123乳腺癌篩查2
124金融消費(fèi)與投資組合配置3
125分布式森林火災(zāi)監(jiān)控系統(tǒng)3
126火星科學(xué)探測(cè)3
13方法3
131顯式編程4
132監(jiān)督式學(xué)習(xí)4
133優(yōu)化4
134規(guī)劃4
135強(qiáng)化學(xué)習(xí)4
14自動(dòng)化決策過程的歷史4
141經(jīng)濟(jì)學(xué)5
142心理學(xué)6
143神經(jīng)科學(xué)6
144計(jì)算機(jī)科學(xué)6
145工程7
146數(shù)學(xué)7
147運(yùn)籌學(xué)8
15社會(huì)影響8
16本書組織結(jié)構(gòu)9
161概率推理9
162序列問題9
163模型不確定性10
164狀態(tài)不確定性10
165多智能體系統(tǒng)10
**部分概率推理
第2章表示12
21信念度和概率12
22概率分布12
221離散概率分布13
222連續(xù)概率分布13
23聯(lián)合分布16
231離散聯(lián)合分布16
232連續(xù)聯(lián)合分配19
24條件分布20
241離散條件模型21
242條件高斯模型21
243線性高斯模型22
244條件線性高斯模型22
245sigmoid模型22
246確定性變量22
25貝葉斯網(wǎng)絡(luò)23
26條件獨(dú)立性25
27本章小結(jié)26
28練習(xí)題27
第3章推理30
31貝葉斯網(wǎng)絡(luò)中的推理30
32樸素貝葉斯模型中的推理33
33“和積”變量消除35
34信念傳播36
35計(jì)算復(fù)雜度37
36直接抽樣37
37似然加權(quán)抽樣39
38吉布斯抽樣41
39高斯模型中的推理43
310本章小結(jié)44
311練習(xí)題45
第4章參數(shù)學(xué)習(xí)49
41*大似然參數(shù)學(xué)習(xí)49
411類別分布的*大似然估計(jì)50
412高斯分布的*大似然估計(jì)50
413貝葉斯網(wǎng)絡(luò)的*大似然估計(jì)51
42貝葉斯參數(shù)學(xué)習(xí)53
421二元分布的貝葉斯學(xué)習(xí)54
422類別分布的貝葉斯學(xué)習(xí)55
423貝葉斯網(wǎng)絡(luò)的貝葉斯學(xué)習(xí)56
43非參數(shù)學(xué)習(xí)57
44缺失數(shù)據(jù)的學(xué)習(xí)58
441數(shù)據(jù)插值58
442期望*大化60
45本章小結(jié)62
46練習(xí)題62
第5章結(jié)構(gòu)學(xué)習(xí)66
51貝葉斯網(wǎng)絡(luò)評(píng)分66
52有向圖搜索68
53馬爾可夫等價(jià)類71
54部分有向圖搜索72
55本章小結(jié)73
56練習(xí)題73
第6章簡單決策75
61理性偏好上的約束75
62效用函數(shù)76
63效用誘導(dǎo)76
64*大期望效用原則78
65決策網(wǎng)絡(luò)79
66信息價(jià)值81
67非理性82
68本章小結(jié)84
69練習(xí)題84
第二部分序列問題
第7章精確求解方法88
71馬爾可夫決策過程88
72策略評(píng)估90
73值函數(shù)策略92
74策略迭代93
75值迭代94
76異步值迭代96
77線性規(guī)劃方程98
78具有二次型獎(jiǎng)勵(lì)的線性系統(tǒng)99
79本章小結(jié)102
710練習(xí)題102
第8章近似值函數(shù)108
81參數(shù)化表示108
82*近鄰109
83核平滑110
84線性插值112
85單純形插值114
86線性回歸116
87神經(jīng)網(wǎng)絡(luò)回歸119
88本章小結(jié)119
89練習(xí)題120
第9章在線規(guī)劃123
91滾動(dòng)時(shí)域規(guī)劃123
92基于預(yù)演的前瞻算法124
93正向搜索125
94分支定界法126
95稀疏抽樣127
96蒙特卡羅樹搜索128
97啟發(fā)式搜索134
98標(biāo)記啟發(fā)式搜索136
99開環(huán)規(guī)劃139
991確定性模型預(yù)測(cè)控制140
992魯棒模型預(yù)測(cè)控制141
993多重預(yù)測(cè)模型預(yù)測(cè)控制142
910本章小結(jié)143
911練習(xí)題143
第10章策略搜索146
101近似策略評(píng)估146
102局部搜索147
展開全部
決策算法 作者簡介
米凱爾·J. 科申德弗
(Mykel J. Kochenderfer)
斯坦福大學(xué)航空航天系和計(jì)算機(jī)科學(xué)系副教授,智能系統(tǒng)實(shí)驗(yàn)室(SISL)主任。曾任職于麻省理工學(xué)院林肯實(shí)驗(yàn)室。目前主要研究用于設(shè)計(jì)魯棒決策系統(tǒng)的算法和分析方法。他擁有愛丁堡大學(xué)博士學(xué)位。
蒂姆·A. 惠勒
(Tim A. Wheeler)
軟件工程師,主要從事自動(dòng)駕駛、控制和決策系統(tǒng)方面的研發(fā)工作。他擁有斯坦福大學(xué)博士學(xué)位。
凱爾·H. 雷
(Kyle H. Wray)
Robust AI 公司工程總監(jiān),曾任硅谷創(chuàng)新聯(lián)盟實(shí)驗(yàn)室首席研究員,目前主要從事自主機(jī)器人的研發(fā)工作,致力于設(shè)計(jì)和實(shí)現(xiàn)機(jī)器人決策系統(tǒng)。他擁有馬薩諸塞大學(xué)阿默斯特分校博士學(xué)位。