不確定條件下的決策:理論和應用:theory and application 版權信息
- ISBN:9787560385068
- 條形碼:9787560385068 ; 978-7-5603-8506-8
- 裝幀:簡裝本
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
不確定條件下的決策:理論和應用:theory and application 內容簡介
《不確定條件下的決策:理論和應用》共12章,分為理論與應用兩大部分,圍繞設計決策智能體的兩種主要方法(規劃和強化學開。對不確定條件下的決策理論與應用的新研行了系統且全面的介紹,從計算的角度介紹了在不確定條件行決策的挑戰括決策模型和算法背后的理論,以及從語音識別到飛機避碰的一系列應用。
《不確定條件下的決策:理論和應用》既可作為計算機科學、航空航天、電子與電氣工程以及管理科學等專業高年級本科生和研究生的教材,也可作為相關領域研究人員的參考資料。
不確定條件下的決策:理論和應用:theory and application不確定條件下的決策:理論和應用:theory and application 前言
本書從計算的角度介紹了不確定條件下的決策問題及方法。書中**部分介紹了概率模型和決策理論的基礎,第二部分討論了上述理論在各種任務領域中的應用。不確定條件下的決策起源于幾個不同領域,其應用范圍相當廣泛。本書旨在盡可能簡單且廣泛地提供與應用相關的材料,以供讀者參考。
本書的目標讀括在工程領行學究的本科生、研究生以及相關專業人士,尤其是計算機科學、航空航天、電子與電氣工程和管理科學等學科。全書旨在介紹問題的本質,概述了算法,但省略了證明過程。本書的學一些數學基礎,并且假定讀者先行學率論和微積分。前5章可用作本科生或研究生課程的基礎讀物;第6章和第7章更適合研究生閱讀學8~pan style="font-family:宋體">章給出了前述理論的部分應用實例。
本書是作者在林肯實驗室工作期間歷時兩年完成的。林肯實驗室是麻省理工學院(MIT)下受聯邦資助的研發中心。作者在教授“不確定條件下的決策”這門課時,被“林肯實驗室系列叢書”的成員邀請出版該書。書中大部分材料來自于該課程。課程的后半部分括林肯實驗室及MIT校內研究人員的講稿,目的是向讀者展示如何應用課程**部分討論的原理和技術解決涉及的問題。
Mykel J. KochendeI!fer
于美國加州福
20pan style="font-family:宋體">年2月6日
不確定條件下的決策:理論和應用:theory and application 目錄
1.1 決策
1.2 應用實例
1.3 設計決策智能體的方法
1.4 結構安排
1.5 擴展閱讀
參考文獻
**部分 理論
第2章 概率模型
2.1 表示
2.2 推理
2.3 參數學
2.4 結構學
2.5 小結
2.6 擴展閱讀
參考文獻
第3章 決策問題
3.1 效用理論
3.2 決策網絡
3.3 博弈問題
3.4 小結
3.5 擴展閱讀
參考文獻
第4章 序貫問題
4.1 構想
4.2 動態規劃
4.3 結構化表示
4.4 線性表示
4.5似動態規劃
4.6 在線方法
4.7 直接策略搜索
4.8 小結
4.9 擴展閱讀
參考文獻
第5章 模型的不確定性
5.1 探索和利用
5.2 基于似然模型的方法
5.3 基于模型的貝葉斯方法
5.4 無模型方法
5.5 泛化
5.6 小結
5.7 擴展閱讀
參考文獻
第6章 狀態的不確定性
6.1 數學表達
6.2 狀態更新
6.3 求解方法
6.4 離線方法
6.5 在線方法
6.6 小結
6.7 擴展閱讀
參考文獻
第7章 協同決策
7.1 數學表達
7.2 性質
7.3 代表性子類
7.4 求解的方法
7.5 似解的方法
7.6 通信
7.7 小結
7.8 擴展閱讀
參考文獻
第二部分 應用
第8章 基于概率的檢測
8.1 基于特征的人員搜索
8.2 概率式的外表模型
8.3 學斷技術
8.4 性能
8.5 交互式搜索工具
8.6 小結
參考文獻
第9章 語音應用的動態模型
9.1 語音信號建模
9.2 語音識別
9.3 主題識別
9.4 語言識別
9.5 說話者識別
9.6 機器翻譯
9.7 小結
參考文獻
第10章 機載防撞優化系統
10.1 機載防撞系統
10.2 防撞問題的表達
10.3 狀態估計
10.4 實時執行
10.5 評價
10.6 小結
參考文獻
第11章 持續監測的多智能體規劃
11.1 任務描述
11.2 集中問題的表達
11.3 分散問題似表達
11.4 模型學
11.5 飛行測試
11.6 小結
參考文獻
第12章 人機自動化集成
12.1 人的能力及其應對
12.2 設計中人為因素的考量
12.3 實現的系統級視角
12.4 小結
參考文獻
名詞索引
附錄 部分彩圖
不確定條件下的決策:理論和應用:theory and application 節選
1-3設計決策智能體的方法
設計決策智能體有許多不同的方法。在特定的應用情形下,有些方法可能比其他方法更合適,這些方法會因設計者的任務和留給自動處理的任務而有所不同。本書主要探討規劃和強化學,有些技術也會涉及監督學化的元素。
pan style="font-family:宋體">.3.pan style="font-family:宋體">顯式編程
設計決策智能體的*直接方法是預測智能體可能所處的所有情況,然后顯式地對智能體編程使其執行預先期望的動作。顯式編程方法可能對簡單問題很有效,但想要提供一個完整的策略,會給設計者帶來很大的負擔。為使對智能體編程更輕松,已有相關研究提出了各種智能體編程語言和框架。
pan style="font-family:宋體">.3.2監督學span>
在一些問題中,向智能體展示要做什么比編寫一個供智能體遵循的程序更容易。設計者提供一組訓練實例,自動學則從這些實例中產生。這種方法稱為監督學已廣泛應用于分類問題。當應用于學測到動作的映射時,這種技術有時稱為行為克隆。當專家型設計者知道可適用于具有代表性的實例情境集合的動作方向時,行為克隆的效果會很好。盡管存在許多不同的學,但是通常在新的情況下它們比不上人類設計師的設計效果。
pan style="font-family:宋體">.3.3優化
另一種方法是讓設計者備選決策策略空間,并且使性能量測化。評估決策策略的性能通常涉及使用決策策略行一系列仿真,然后,優化算法在該空間中執行搜索,以獲得策略。如果備選策略空間是相對低維的,并且性能量測不具有多個局部解,那么各種局部或全局搜索策略都可能是合適的。雖然為了仿真通常會假設動態模型知識,但它不會用于指導搜索策略,在復雜的問題中,這是很重要的。
pan style="font-family:宋體">.3.4
規劃
規劃是一種優化方式,但它使用動態模型來指導搜索。規劃問題的大量文獻集中在確定性問題上。假設一個確定性模型允許使用一些易于擴展到高維的方法,那么對于某些問題,可以用確定性模型去估算動態特性。對于其他問題,考慮未來的不確定性則是至關重要的,因此本書專注于這些需要考慮不確定性的問題。
pan style="font-family:宋體">.3.5強化學span>
在強化學寬了模型已知這一假設。相反,智能體在與交互中學策略。設計者只需要提供一個性能量測,學就會優化智能體的行為。強化學雜性之所以有趣,是因為動作的選擇不僅影響智能體是否能實現當前的目標,還會影響智能體學的能力和識別可利用的問題特征的能力。
pan style="font-family:宋體">.4結構安排
本書分理論和應用兩部分。
pan style="font-family:宋體">.理論部分的安排
第2章:概率模型。概率模型討論了如何描述不確定性,引入貝葉斯網絡作為捕捉變量間概率關系的圖形化模型,介紹了從上述表示行推論的算法,解釋了如何學的結構和參數。
第3章:決策問題。決策問題以效用理論作為框架,用于了解不確定性條件下的決策。本章關注于單次決策、引入決策和效用節點,將決策網絡作為貝葉斯網絡的推廣。本章還討論了多個存在潛在競爭關系智能體的決策。
第4章:序貫問題。序貫問題討論了當動作的輸出是概率性變化時隨時間變化的決策問題,引入了馬爾可夫決策過程作為模擬這種問題的一種方法,展示了如何使用動態規劃來計算的解決方案。由于許多問題都過于復雜難以求解,因此本章還討論了各種不同似方法,如在線方法和直接搜索策略等。......
- >
伯納黛特,你要去哪(2021新版)
- >
莉莉和章魚
- >
上帝之肋:男人的真實旅程
- >
唐代進士錄
- >
隨園食單
- >
我從未如此眷戀人間
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
詩經-先民的歌唱