掃一掃
關注中圖網
官方微博
>
控制系統與強化學習
本類五星書更多>
-
>
貨幣大歷史:金融霸權與大國興衰六百年
-
>
(精)方力鈞作品圖錄
-
>
《藏書報》2021合訂本
-
>
(精)中國當代書畫名家作品集·范碩:書法卷+繪畫卷(全2卷)
-
>
(噴繪樓閣版)女主臨朝:武則天的權力之路
-
>
書里掉出來一只狼+狼的故事-全2冊
-
>
奇思妙想創意玩具書(精裝4冊)
控制系統與強化學習 版權信息
- ISBN:9787111775768
- 條形碼:9787111775768 ; 978-7-111-77576-8
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:
控制系統與強化學習 內容簡介
一個高中生可以創建深度的Q-learning代碼來控制她的機器人,卻不了解 "深度 "或 "Q "的含義,也不知道為什么代碼有時會失敗。本書旨在以具有微積分和矩陣代數背景的學生可以理解的方式,解釋強化學習和優化控制背后的科學。本書的一個獨特重點是算法設計,以獲得學習算法的快收斂速度,以及對強化學習有時失敗的原因的洞察。一開始就避開了高級隨機過程理論,用更直觀的確定性探測來代替學習的隨機探索。一旦理解了這些思想,掌握植根于隨機控制的技術就不難了。這些主題在本書的第二部分有所涉及,從馬爾科夫鏈理論開始,以對強化學習的行為者批評方法的全新審視結束。
書友推薦
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
羅庸西南聯大授課錄
- >
伊索寓言-世界文學名著典藏-全譯本
- >
月亮虎
- >
伯納黛特,你要去哪(2021新版)
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
我從未如此眷戀人間
- >
我與地壇
本類暢銷