-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用 版權(quán)信息
- ISBN:9787302685913
- 條形碼:9787302685913 ; 978-7-302-68591-3
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用 內(nèi)容簡介
"《強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》循序漸進地講解了使用Python語言實現(xiàn)強化學(xué)習(xí)的核心算法開發(fā)的知識,內(nèi)容涵蓋了數(shù)據(jù)處理、算法、大模型等知識,并通過具體實例的實現(xiàn)過程演練了各個知識點的使用方法和使用流程。《強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》共分為17章,主要內(nèi)容包括強化學(xué)習(xí)基礎(chǔ)、馬爾可夫決策過程、蒙特卡洛方法、Q-learning與貝爾曼方程、時序差分學(xué)習(xí)和SARSA算法、DQN算法、DDQN算法、競爭DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、連續(xù)動作空間的強化學(xué)習(xí)、值分布式算法、基于模型的強化學(xué)習(xí)、多智能體強化學(xué)習(xí)實戰(zhàn):Predator-Prey 游戲及自動駕駛系統(tǒng)。本書內(nèi)容簡潔而不失技術(shù)深度,以極簡的文字介紹了復(fù)雜的案例,易于閱讀和理解。 《強化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》適用于已經(jīng)了解Python語言基礎(chǔ)語法的讀者,想進一步學(xué)習(xí)強化學(xué)習(xí)、機器學(xué)習(xí)、深度學(xué)習(xí)及相關(guān)技術(shù)的讀者,還可作為大專院校相關(guān)專業(yè)的師生用書和培訓(xùn)機構(gòu)的教材使用。 "
- >
【精裝繪本】畫給孩子的中國神話
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
- >
伊索寓言-世界文學(xué)名著典藏-全譯本
- >
二體千字文
- >
詩經(jīng)-先民的歌唱
- >
月亮虎
- >
名家?guī)阕x魯迅:故事新編
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作