包郵隨機動態決策理論與應用

作者：胡奇英

出版社：西安電子科技大學出版社出版時間：2023-07-01

開本：其他頁數： 280

本類榜單：教材銷量榜

中圖價:¥33.4(7.1折) 定價 ~~¥47.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
闖進數學世界――探秘歷史名題

闖進數學世界――探秘歷史名題

¥20.7¥32.8
>
中醫基礎理論

中醫基礎理論

¥51.7¥59
>
當代中國政府與政治(新編21世紀公共管理系列教材)

當代中國政府與政治(新編21世紀公共管理系列教材)

¥31.2¥48
>
高校軍事課教程

高校軍事課教程

¥12.4¥38
>
思想道德與法治(2021年版)

思想道德與法治(2021年版)

¥8.5¥18
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)

毛澤東思想和中國特色社會主義理論體系概論(2021年版)

¥8.5¥25
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材

中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材

¥85.1¥99

商品詳情
商品評論(0條)

中圖價:¥33.4 加入購物車

版權信息
內容簡介
目錄

隨機動態決策理論與應用版權信息

ISBN：9787560667492
條形碼：9787560667492 ; 978-7-5606-6749-2
裝幀：平裝-膠訂
冊數：暫無
重量：暫無
所屬分類：
教材
>
研究生/本科/專科教材
>
工學

隨機動態決策理論與應用內容簡介

本書介紹隨機動態決策的理論與應用。全書共14章，分為理論篇和應用篇。第1章~第6章為理論篇，內容包括離散時間馬爾可夫決策過程(有限階段、無限階段折扣準則、無限階段平均準則），半馬爾可夫決策過程，連續時間馬爾可夫決策過程，強化學習與近似算法；第7章~第14章為應用篇，內容包括庫存管理，收益管理，網上拍賣，網上拍賣下的收益管理、庫存管理，技術的采用與選擇，排隊（服務）系統的*優控制，組合證券選擇與風險管理，供應鏈動態管理。
本書適合作為高等院校管理科學、運籌學、自動控制、計算機科學等專業的研究生教材，也可供對動態決策理論、人工智能諸方面感興趣的研究人員閱讀。

隨機動態決策理論與應用目錄

第1章有限階段 2 1.1 單階段決策 2 1.2 多階段動態決策：確定性 3 1.3 多階段馬爾可夫決策過程 8 1.3.1 模型 9 1.3.2 *優方程與*優策略 11 1.4 若干隨機動態決策問題 13 1.4.1 期權的購買與執行問題 13 1.4.2 *優選擇問題 15 1.4.3 產品定價問題 17 1.5 模函數與單調策略 18 1.5.1 *優策略的單調性 18 1.5.2 受罰款限制的*優分配問題 20 習題 22 參考文獻 23 第2章離散時間馬爾可夫決策過程：折扣準則 24 2.1 模型與折扣*優方程 24 2.1.1 模型 24 2.1.2 *優方程 25 2.2 算法 29 2.2.1 逐次逼近法(值迭代法) 29 2.2.2 策略迭代法 32 2.2.3 線性規劃法 34 2.3 應用 36 2.3.1 *優停止問題 36 2.3.2 項目管理：Bandit問題 40 2.4 MDP模型的推廣 43 2.4.1 一種無界報酬條件 43 2.4.2 非可數決策集 48 2.4.3 一般策略集 50 2.5 期望總報酬準則 51 2.5.1 模型縮減 52 2.5.2 報酬函數的有限性 53 2.5.3 *優值函數的有限性及*優方程 53 習題 55 參考文獻 56 第3章離散時間馬爾可夫決策過程：平均準則 57 3.1 平均準則的*優方程 57 3.1.1 平均準則的*優方程與*優策略 57 3.1.2 常返性條件 63 3.1.3 有限MDP 65 3.2 算法 66 3.2.1 逐次逼近法 66 3.2.2 策略迭代法 70 3.2.3 線性規劃法 72 3.3 *優不等式 75 本章附錄：若干引理 79 習題 81 參考文獻 82 第4章半馬爾可夫決策過程 83 4.1 半馬爾可夫決策過程模型 83 4.1.1 SMDP模型 83 4.1.2 正則性條件 84 4.1.3 準則函數 86 4.2 轉換為離散時間馬爾可夫決策過程 86 4.2.1 期望折扣總報酬準則 86 4.2.2 平均準則 88 4.3 馬爾可夫型SMDP 92 4.4 模型推廣：報酬函數的一般形式 93 習題 95 參考文獻 95 第5章連續時間馬爾可夫決策過程 96 5.1 時齊模型 96 5.2 期望折扣總報酬準則 98 5.2.1 折扣準則 98 5.2.2 期望折扣總報酬準則 102 5.3 平均準則 104 5.4 非時齊模型 106 習題 113 參考文獻 113 第6章強化學習與近似算法 114 6.1 強化學習：折扣準則 114 6.1.1 折扣目標函數值的估計 114 6.1.2 強化學習算法 115 6.1.3 TD(λ) 118 6.2 強化學習：平均準則 119 6.2.1 平均準則函數值的估計 119 6.2.2 平均準則的強化學習算法 120 6.3 近似算法 122 6.3.1 近似逐次逼近法 123 6.3.2 近似策略迭代法 124 習題 126 參考文獻 126 應用篇第7章庫存管理 128 7.1 多周期隨機庫存管理問題 128 7.1.1 多周期庫存管理問題 128 7.1.2 有限階段期望折扣總費用 130 7.1.3 短視策略 131 7.2 無限階段隨機存貯問題 132 7.2.1 無限階段折扣準則 132 7.2.2 無限階段平均準則 135 7.2.3 損失制 135 7.3 存貯與定價的聯合動態決策 137 7.3.1 有限階段 138 7.3.2 無限階段 140 習題 141 參考文獻 141 第8章收益管理 142 8.1 價格固定時的容量分配 142 8.1.1 靜態模型 142 8.1.2 動態模型 145 8.1.3 預訂和超訂 146 8.2 價格動態變化時的多階段容量分配 147 8.3 連續時間動態定價 151 8.4 基于Priceline的買方/賣方定價收益管理問題 156 8.4.1 買方定價 156 8.4.2 賣方定價 159 8.5 房地產市場的政府調控策略：基于收益管理 160 8.6 收益管理的進一步討論 163 習題 164 參考文獻 165 第9章網上拍賣 166 9.1 拍賣簡介 166 9.2 單物品網上拍賣中的顧客投標策略 167 9.2.1 問題與模型 168 9.2.2 IPV下硬性結束規則的一級價格網上拍賣 169 9.2.3 IPV下軟性結束規則的一級價格網上拍賣 174 9.2.4 其他類型的網上拍賣 175 9.3 單階段多物品網上拍賣的收益 177 習題 181 參考文獻 182 第10章網上拍賣下的收益管理、庫存管理 183 10.1 網上分批拍賣下的收益管理 183 10.1.1 問題與模型 183 10.1.2 *優分配策略的單調性 184 10.1.3 數值分析 189 10.2 網上拍賣下的庫存管理 191 10.2.1 有限階段 191 10.2.2 折扣準則 194 10.2.3 平均準則 197 10.2.4 *優保留價 198 10.2.5 數值分析 199 習題 202 參考文獻 203 第11章技術的采用與選擇 204 11.1 *優更換 204 11.1.1 有限階段 204 11.1.2 無限階段折扣準則 206 11.1.3 平均準則 208 11.2 技術采用 209 11.3 基于購買的技術更新問題 212 11.4 基于自行研發的技術更新問題 215 11.5 新產品策略與庫存管理 219 習題 221 參考文獻 221 第12章排隊(服務)系統的*優控制 222 12.1 排隊系統的到達控制 222 12.1.1 M/G/1排隊系統的靜態到達率控制 222 12.1.2 M/M/K排隊系統的動態到達率控制 224 12.1.3 一般動態到達控制 226 12.2 排隊系統服務控制 228 12.2.1 M/M/1: 隊長模型 229 12.2.2 M/PH/1: 隊長與工作量混合模型 233 12.3 排隊網絡控制 234 12.3.1 到達控制 234 12.3.2 服務控制 235 12.3.3 路徑控制 236 習題 237 參考文獻 237 第13章組合證券選擇與風險管理 239 13.1 動態資產定價 239 13.2 多階段組合證券的期望-方差分析 241 13.3 多階段風險管理：條件風險值CVaR 248 13.3.1 問題與模型 248 13.3.2 *小CVaR和*優策略 249 13.3.3 應用：組合證券優化 251 習題 255 參考文獻 255 第14章供應鏈動態管理 256 14.1 易腐產品的供應鏈多周期管理 256 14.2 連續時間收益供應鏈管理 259 14.2.1 集中決策 260 14.2.2 分散決策 267 習題 270 參考文獻 271 后記272

展開全部

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
大紅狗在馬戲團-大紅狗克里弗-助人
大紅狗在馬戲團-大紅狗克里弗-助人
[美] 諾爾曼·伯德韋爾著，杜可名譯
¥4.5~~¥10.0~~
>
名家帶你讀魯迅:朝花夕拾
名家帶你讀魯迅:朝花夕拾
魯迅著，陳漱渝主編
¥10.0~~¥21.0~~
>
朝聞道
朝聞道
劉慈欣
¥16.5~~¥23.8~~
>
羅曼·羅蘭讀書隨筆-精裝
羅曼·羅蘭讀書隨筆-精裝
[法]羅曼·羅蘭著,鄭克魯譯
¥32.9~~¥58.0~~
>
二體千字文
二體千字文
本書編委會
¥14.0~~¥40.0~~
>
名家帶你讀魯迅:故事新編
名家帶你讀魯迅:故事新編
魯迅著，陳漱渝主編
¥13.0~~¥26.0~~
>
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
易竹賢
¥9.9~~¥23.0~~
>
龍榆生：詞曲概論/大家小書
龍榆生：詞曲概論/大家小書
龍榆生
¥8.7~~¥24.0~~