包郵 多智能體強化學(xué)習(xí):基礎(chǔ)與現(xiàn)代方法
-
>
貨幣大歷史:金融霸權(quán)與大國興衰六百年
-
>
(精)方力鈞作品圖錄
-
>
《藏書報》2021合訂本
-
>
(精)中國當(dāng)代書畫名家作品集·范碩:書法卷+繪畫卷(全2卷)
-
>
(噴繪樓閣版)女主臨朝:武則天的權(quán)力之路
-
>
書里掉出來一只狼+狼的故事-全2冊
-
>
奇思妙想創(chuàng)意玩具書(精裝4冊)
多智能體強化學(xué)習(xí):基礎(chǔ)與現(xiàn)代方法 版權(quán)信息
- ISBN:9787111776871
- 條形碼:9787111776871 ; 978-7-111-77687-1
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:
多智能體強化學(xué)習(xí):基礎(chǔ)與現(xiàn)代方法 內(nèi)容簡介
多智能體強化學(xué)習(xí)(Multi-Agent Reinforcement Learning, MARL)是機器學(xué)習(xí)中的一個領(lǐng)域,研究多個智能體如何在共享環(huán)境中學(xué)習(xí)*優(yōu)的交互方式。這一領(lǐng)域在現(xiàn)代生活中有著廣泛的應(yīng)用,包括自動駕駛、多機器人工廠、自動化交易和能源網(wǎng)絡(luò)管理等。 本書是一部系統(tǒng)闡述多智能體強化學(xué)習(xí)理論與技術(shù)的權(quán)威著作,清晰而嚴(yán)謹(jǐn)?shù)亟榻B了MARL的模型、解決方案概念、算法思想、技術(shù)挑戰(zhàn)以及現(xiàn)代方法。書中首先介紹了該領(lǐng)域的基礎(chǔ)知識,包括強化學(xué)習(xí)理論和算法的基礎(chǔ)、交互式博弈模型、博弈中的不同解決方案概念以及支撐MARL研究的算法思想。隨后,書中詳細(xì)介紹了利用深度學(xué)習(xí)技術(shù)的現(xiàn)代MARL算法,涵蓋集中訓(xùn)練與分散執(zhí)行、價值分解、參數(shù)共享和自博弈等思想。本書還附帶了一個用Python編寫的MARL代碼庫,其中包括自包含且易于閱讀的MARL算法實現(xiàn)。 本書技術(shù)內(nèi)容以易于理解的語言解釋,并通過大量示例進(jìn)行說明,既為初學(xué)者闡明了MARL的概念,也為專業(yè)的讀者提供了高層次的見解。
- >
山海經(jīng)
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
- >
苦雨齋序跋文-周作人自編集
- >
月亮虎
- >
名家?guī)阕x魯迅:故事新編
- >
自卑與超越
- >
巴金-再思錄
- >
詩經(jīng)-先民的歌唱