-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
強化學習算法入門 版權信息
- ISBN:9787522617619
- 條形碼:9787522617619 ; 978-7-5226-1761-9
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
強化學習算法入門 本書特色
本書讀者對象:大中專院校計算機、人工智能相關專業學生,對機器學習、強化學習算法感興趣的程序員。
● 本書從初高中學生都熟悉的“平均值計算”的角度出發,簡單易懂地解釋復雜的強化學習原理。
● 使用常見的例子(多臂老虎機問題和網格世界問題)對各種算法進行比較,使它們的特點更易理解。
● 對于強化學習的核心算法,提供了Python 3和MATLAB兩種類型的代碼。執行代碼,可直觀理解“原理 → 公式 → 程序”這一系列流程。
強化學習算法入門 內容簡介
作為**個戰勝圍棋世界冠軍的人工智能機器人AlphaGo,我們知道其主要工作原理是深度學習。隨著AlphaGo Zero和Alpha Zero的相繼發布,作為機器學習經典算法之一的強化學習,在人工智能領域受到了更多的關注。
《強化學習算法入門》使用通俗易懂的語言,按照“原理-公式-程序”的方式,對強化學習的基礎知識進行了詳細講解。書中先讓大家從熟悉的“平均值計算”作為切入點,學習強化學習的基本概念,然后結合實例學習了函數近似方法、深度強化學習的原理和方法等,比較了各算法的特點和應用,并用Python和MATLAB兩種語言進行了編程實現。
《強化學習算法入門》內容豐富,實踐性強,特別適合高校人工智能相關專業學生,機器學習、深度學習工程師等學習強化學習算法。
強化學習算法入門 目錄
強化學習算法入門 作者簡介
[日] 曾我部東馬
理學博士(物理學專業)。曾任馬克斯·普朗克研究所(德國)博士研究員、劍橋大學(英國)研究員。2009年回到日本,參與創立了Grid公司,擔任董事兼首席技術官。2011年起先后擔任東京大學尖端科學技術研究中心特聘助理教授、特聘副教授。2016年3月起任電氣通信大學副教授,同時兼任Grid公司首席技術顧問、東京大學尖端科學技術研究中心客座研究員至今。
他以開發具有“深度學習—深度強化學習—回歸預測—優化”功能的跨功能機器學習框架∞ReNom而聞名,目前在開發以量子機器學習為代表的最先進量子算法∞ReNomQ的同時,還致力于使用深度強化學習的“在線優化問題”的研究。
- >
龍榆生:詞曲概論/大家小書
- >
羅曼·羅蘭讀書隨筆-精裝
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
上帝之肋:男人的真實旅程
- >
月亮與六便士
- >
史學評論
- >
經典常談
- >
巴金-再思錄