-
>
宇宙、量子和人類心靈
-
>
氣候文明史
-
>
南極100天
-
>
考研數學專題練1200題
-
>
希格斯:“上帝粒子”的發明與發現
-
>
神農架疊層石:10多億年前遠古海洋微生物建造的大堡礁
-
>
聲音簡史
大規模強化學習中的新型函數近似技術研究 版權信息
- ISBN:9787567249363
- 條形碼:9787567249363 ; 978-7-5672-4936-3
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大規模強化學習中的新型函數近似技術研究 內容簡介
本書主要研究如何通過新型函數近似技術提升大規模強化學習器的性能。本書首先分析了傳統的函數近似技術,如Tile編碼與Kanerva編碼在處理大規模問題性能不佳的原因,即原型沖突與不均勻的原型訪問頻率分布。為了解決這些問題,本書分別應用自適應Kanerva函數近似、模糊邏輯函數近似與基于粗糙集的函數近似等方法對強化學習中的函數近似方法進行改進。本書還將以上函數近似方法分別應用于強化學習中不同難度的捕食者-獵物追逐問題與認知無線電網絡應用問題,以此進行驗證。實驗結果表明:本書所提方法不僅提高了類似問題的求解率,同時減少了所需原型數量,*終顯著提高了函數近似技術解決大規模強化學習與多智能體問題的有效性。
大規模強化學習中的新型函數近似技術研究 目錄
**章 引言
**節 強化學習概述
第二節 本書研究的背景和意義
第三節 強化學習的應用領域
第二章 自適應函數近似技術
**節 傳統函數近似技術的實驗評估
第二節 訪問頻率與特征分布
第三節 基于Kanerva自適應機制的函數逼近技術
第四節 本章小結
第三章 基于模糊邏輯的函數近似技術
**節 Kanerva編碼應用于困難實例的實驗評估
第二節 Kanerva編碼中的原型沖突
第三節 自適應模糊Kanerva編碼
第四節 原型調整
第五節 本章小結
第四章 基于粗糙集理論的函數近似技術
**節 不同數量原型影響的實驗評估
第二節 粗糙集和Kanerva編碼
第三節 基于粗糙集的Kanerva編碼
第四節 不同初始原型數量的影響
第五節 本章小結
第五章 強化學習函數近似技術的應用:認知無線電網絡
**節 概述
第二節 基于強化學習的認知無線電
第三節 實驗模擬
第四節 基于強化學習的認知無線電函數近似技術
第五節 本章小結
參考文獻
- >
月亮虎
- >
隨園食單
- >
苦雨齋序跋文-周作人自編集
- >
自卑與超越
- >
伊索寓言-世界文學名著典藏-全譯本
- >
經典常談
- >
史學評論
- >
有舍有得是人生