-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
決策用強化與系統性機器學習 版權信息
- ISBN:9787111502418
- 條形碼:9787111502418 ; 978-7-111-50241-8
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
決策用強化與系統性機器學習 本書特色
機器學習是人工智能領域中一個極其重要的研究方向。強化學習是機器學習中的一個重要分支。作為解決序貫優化決策的有效方法,強化學習有效地應用于計算科學、自動控制、機器人技術等各個領域。 當前,強化學習的核心任務是提高學習效率,本書就是針對此問題展開的。第1章介紹系統概念和增強機器學習,它建立了一個突出的相同的機器學習系統范例;第2章將更多關注機器學習的基本原理和多視角學習;第3章關于強化學習;第4章處理機器學習系統和模型建立的問題;決策推理等重要的部分將在第5章展開;第6章討論了自適應機器學習;第7章討論了多視角和全局系統性機器學習;第8章討論了增量學習的需要和知識表示;第9章處理了知識增長方面的問題;第10章討論了學習系統的建立。 本書適合于機器學習、自動化技術、人工智能等方面的相關專業教師與研究生閱讀,也可供自然科學和工程領域相關研究人員參考。
決策用強化與系統性機器學習 內容簡介
本書包括強化的不同方面,通過機器學習來建立知識庫。本書有助于計劃通過智能學習和實驗做出智能機器的人并嘗試新的方式,打開一種相同的新范例。本書第1章主要介紹系統概念,如機器學習、強化學習、系統學習、系統性機器學習等;第2章主要介紹系統性和多視角的機器學習;第3~9章主要介紹本書的主要內容——決策用強化與系統性學習的各個方面內容,有強化學習、系統性機器學習、推理和信息集成、自適應學習、全局系統性學習、增量學習及表示和知識增長。第10章列舉了一些例子來說明如何構建一個學習系統。
決策用強化與系統性機器學習 目錄
原書前言
原書致謝
關于作者
第1章強化與系統性機器學習1
1.1簡介1
1.2監督學習、無監督學習、半監督學習和強化學習1
1.3傳統機器學習方法和機器學習發展歷史3
1.4什么是機器學習?6
1.5機器學習問題6
1.5.1學習的目標6
1.6學習模式7
1.7機器學習技術和范例9
1.8什么是強化學習?11
1.9強化函數和環境函數12
1.10強化學習的需求13
1.11強化學習和機器智能14
1.12什么是系統學習?14
1.13什么是系統性機器學習?15
1.14系統性機器學習的重點15
1.15強化性機器學習和系統性機器學習16
1.16車輛檢測問題的案例研究16
1.17小結16
參考文獻17
第2章全系統原理、系統性和多視角的機器學習18
2.1簡介18
2.1.1什么是系統性學習?19
2.1.2歷史20
2.2什么是系統性機器學習?21
2.2.1基于事件的學習21
2.3廣義系統性機器學習框架23
2.3.1系統定義24
2.4多視角決策和多視角學習26
2.4.1基于完整信息的表示32
2.4.2基于部分信息的表示32
2.4.3單視角決策方案圖32
2.4.4雙重視角決策方案圖32
2.4.5多視角決策方案圖32
2.4.6定性信念網絡和影響圖33
2.5動態和交互式決策33
2.5.1交互決策圖33
2.5.2決策圖和影響圖中時間的角色34
2.5.3系統性視角的建立34
2.5.4信息整合35
2.5.5建立典型決策方案圖35
2.5.6受限信息35
2.5.7多決策者系統在系統性學習中的角色35
2.6系統性學習框架39
2.6.1數學模型39
2.6.2系統性學習的方法39
2.6.3自適應系統性學習40
2.6.4系統性學習框架41
2.7系統分析41
2.8案例學習:在酒店行業中需要系統性學習43
2.9小結44
參考文獻44
第3章強化學習45
3.1簡介45
3.2學習決策者48
3.3回報和獎勵的計算50
3.3.1方案和連續任務50
3.4強化學習和自適應控制51
3.5動態系統54
3.5.1離散事件動態系統54
3.6強化學習和控制55
3.7馬爾科夫性質和決策過程55
3.8價值函數56
3.8.1行動和價值56
3.9學習*優策略(有模型和無模型法)57
3.10動態規劃57
3.10.1動態系統性質57
3.11自適應動態規則58
3.11.1時間差分學習59
3.11.2q學習60
3.11.3統一的視圖60
3.12范例——拳擊訓練器的強化學習61
3.13小結61
參考文獻61
第4章系統性機器學習和模型62
4.1簡介62
4.2系統學習的框架63
4.2.1影響空間64
4.2.2交互作用為中心的模型69
4.2.3以結果為中心的模型69
4.3捕捉系統視圖70
4.4系統交互的數學表達73
4.5影響函數74
4.6決策影響分析74
4.6.1時空界限75
4.7小結80
第5章推理和信息集成82
5.1簡介82
5.2推理機制和需要83
5.2.1情景推理85
5.2.2推理確定影響85
5.3情景和推理的集成88
5.4統計推理和歸納91
5.4.1直接推理91
5.4.2間接推理91
5.4.3信息推理91
5.4.4歸納92
5.5純似然方法92
5.6貝葉斯范例推理93
5.6.1貝葉斯定理93
5.7基于時域推理93
5.8推理建立系統觀點94
5.8.1信息集成94
5.9小結96
參考文獻97
第6章自適應學習98
6.1簡介98
6.2自適應學習和自適應系統98
6.3什么是自適應機器學習101
6.4基于方案的適應性和學習方法101
6.4.1動態適應性和情景感知的學習102
6.5系統學習和自適應學習104
6.5.1多學習器的使用105
6.5.2系統自適應機器學習108
6.5.3自適應應用的設計110
6.5.4自適應學習的需要和適應的原因111
6.5.5適應類型112
6.5.6自適應框架114
6.6競爭學習和自適應學習115
6.6.1適應性函數116
6.6.2決策網絡118
6.6.3自適應學習方案119
6.7范例120
6.7.1案例研究:基于自適應學習的文本120
6.7.2自適應學習的文檔挖掘121
6.8小結122
參考文獻122
第7章多視角和全局系統性的學習123
7.1簡介123
7.2多視角方案構建124
7.3多視角決策和多視角學習126
7.3.1視角結合126
7.3.2影響圖和部分方案決策表示圖127
7.3.3表示決策方案圖(rdsd)130
7.3.4范例:部分方案決策表示圖(pdsrd)表示的不同視角獲取的城市信息131
7.4全局系統性學習和多視角途徑134
7.4.1分散信息整合135
7.4.2多視角和全局系統知識表示135
7.4.3什么是多視角方案?135
7.4.4特定方案136
7.5基于多視角途徑的案例研究136
7.5.1交通控制器用多視角途徑137
7.5.2情感檢測用多視角途徑模型138
7.6多視角方法的局限性143
7.7小結143
參考文獻144
第8章增量學習和知識表示145
8.1簡介145
8.2為什么增量學習?146
8.3學習已經學會的147
8.3.1絕對增量學習148
8.3.2選擇增量學習149
8.4監督增量學習157
8.5增量無監督學習和增量聚類158
8.5.1增量聚類:任務160
8.5.2增量聚類:方法161
8.5.3閾值161
8.6半監督增量學習162
8.7增量與系統性學習163
8.8增量接近值和學習方法164
8.8.1增量學習方法1165
8.8.2增量學習方法2166
8.8.3計算c值增量166
8.9學習與決策模型169
8.10增量分類技術169
8.11案例分析:增量文檔分類170
8.12小結171
第9章知識增長:機器學習的視角173
9.1簡介173
9.2短暫的歷史和相關工作174
9.3知識增長和知識啟發178
9.3.1策略使用進行知識啟發178
9.3.2基于目標的知識啟發179
9.3.3基于過程的知識啟發179
9.4生命周期180
9.4.1知識水平181
9.4.2直接知識181
9.4.3間接知識182
9.4.4程序知識182
9.4.5問題182
9.4.6決策182
9.4.7知識生命周期183
9.5增量知識表達184
9.6案例學習和遺忘學習186
9.7知識的擴充:技術和方法187
9.7.1知識增量技術187
9.7.2知識增量方法188
9.7.3提取知識的機制189
9.8啟發式學習190
9.9系統性機器學習和知識獲取190
9.9.1全方位知識獲取191
9.9.2系統知識管理和先進的機器學習192
9.10在復雜環境下的知識增量193
9.11案例研究193
9.11.1銀行案例研究193
9.11.2軟件開發公司194
9.11.3雜貨集市/零售集市195
9.12小結195
參考文獻196
第10章構建學習系統197
10.1簡介197
10.2系統性學習系統197
10.2.1學習單元199
10.2.2知識庫200
10.2.3性能單元200
10.2.4反饋單元200
10.2.5允許測量的系統200
10.3算法選擇201
10.3.1k近鄰(knn)201
10.3.2支持向量機(svm)202
10.3.3質心法202
10.4知識表示203
10.4.1實用方案和案例研究203
10.5學習系統的設計204
10.6讓系統表現得更智能204
10.7案例學習205
10.8整體知識框架和強化學習的應用205
10.8.1智能算法的選擇207
10.9智能決策——部署和知識采集以及重用208
10.10基于案例的學習:人體情感檢測系統209
10.11復雜決策問題的整體視角211
10.12知識表示和資源查找213
10.13組件215
10.13.1范例215
10.14學習系統和智能系統的未來216
10.15小結217
附錄218
附錄a統計學習方法218
a.1概率218
a.1.1互斥事件218
a.1.2獨立事件218
a.2貝葉斯分類219
a.2.1樸素貝葉斯分類220
a.2.2貝葉斯分類器的優點和缺點221
a.3回歸221
a.3.1線性222
a.3.2非線性222
a.3.3回歸的其他方法222
a.4粗糙集223
a.4.1不可分辨關系223
a.4.2集近似224
a.4.3邊界區域224
a.4.4粗糙集和清晰集224
a.4.5約簡224
a.4.6可有可無和不可缺少的屬性224
a.5支持向量機224
參考文獻225
附錄b馬爾科夫過程225
b.1馬爾科夫過程225
b.1.1案例226
b.1.2解決步驟226
b.1.3長期227
b.1.4馬爾科夫過程示例228
b.2半馬爾科夫過程231
b.2.1建議231
b.2.2驗證232
b.2.3推論232
決策用強化與系統性機器學習 作者簡介
Parag Kulkarni博士是普納埃拉特研究所(EKLaT Research,Pune)的CEO和首席科學家。他在知識管理、電子商務、智能系統和機器學習咨詢、研究和產品建設等領域有超過20年的經驗。印度理工學院和加爾各答印度管理研究院的校友,Kulkarni博士是IIM的兼職教授、捷克馬薩里克大學訪問研究員和普納工程學院兼職教授。他領導的公司、研究實驗室和團體,其中包括很多IT公司,有艾蒂爾公司、西門子信息系統有限公司、普納的卡皮森公司和新加坡的ReasonEdge公司。他通過戰略創新和研究引領了很多公司成功創業。瑞士的UGSM皇家商業學校授予Kulkarni榮譽博士學位。他是三個專利的共同發明人,并合著了超過100篇研究論文并有著作若干本。
- >
二體千字文
- >
伊索寓言-世界文學名著典藏-全譯本
- >
上帝之肋:男人的真實旅程
- >
龍榆生:詞曲概論/大家小書
- >
隨園食單
- >
名家帶你讀魯迅:朝花夕拾
- >
小考拉的故事-套裝共3冊
- >
自卑與超越