-
包郵強(qiáng)化學(xué)習(xí)
¥49.9(7.1折)定價:¥69.8本書詳細(xì)介紹了強(qiáng)化學(xué)習(xí)的理論推導(dǎo)、算法細(xì)節(jié)。全書共12章,包括強(qiáng)化學(xué)習(xí)概述、馬爾可夫決策過程、退化的強(qiáng)化學(xué)習(xí)問題、環(huán)境已知的強(qiáng)化學(xué)習(xí)問題、基于價值的強(qiáng)化學(xué)習(xí)算法、基于策略的強(qiáng)化學(xué)習(xí)算法、AC型算法、基于模型的強(qiáng)化學(xué)習(xí)算法等相關(guān)知識。本書系統(tǒng)性強(qiáng)、概念清晰,內(nèi)容簡明通俗。除了側(cè)重于理論推導(dǎo),本書還提供了許多便于讀者理解的例子,以及大量被實(shí)踐證明有效的算法技巧,旨在幫助讀者進(jìn)一步了解強(qiáng)化學(xué)習(xí)領(lǐng)域的相關(guān)知識,提升其現(xiàn)實(shí)中的工程能力。本書可作