-
>
宇宙、量子和人類心靈
-
>
氣候文明史
-
>
南極100天
-
>
考研數(shù)學(xué)專題練1200題
-
>
希格斯:“上帝粒子”的發(fā)明與發(fā)現(xiàn)
-
>
神農(nóng)架疊層石:10多億年前遠(yuǎn)古海洋微生物建造的大堡礁
-
>
聲音簡史
矩陣半張量積講義(卷3有限博弈的矩陣半張量積方法)(精) 版權(quán)信息
- ISBN:9787030731166
- 條形碼:9787030731166 ; 978-7-03-073116-6
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
矩陣半張量積講義(卷3有限博弈的矩陣半張量積方法)(精) 內(nèi)容簡介
矩陣半張量積是近二十年發(fā)展起來的一種新的矩陣?yán)碚摗=?jīng)典矩陣?yán)碚摰膬?yōu)選弱點(diǎn)是其維數(shù)局限,這極大了矩陣方法的應(yīng)用。矩陣半張量積是經(jīng)典矩陣?yán)碚摰陌l(fā)展,它克服了經(jīng)典矩陣?yán)碚搶S數(shù)的,因此,被稱為穿越維數(shù)的矩陣?yán)碚摚毒仃嚢霃埩糠e講義》的目的是對矩陣半張量積理論與應(yīng)用做一個(gè)基礎(chǔ)而全面的介紹。計(jì)劃出版五卷。卷一:矩陣半張量的基本理論與算法;卷二:邏輯動態(tài)系統(tǒng)的分析與控制;卷三:有限博弈的矩陣半張量積方法;卷四:有限與泛維動態(tài)系統(tǒng);卷五:工程及其他系統(tǒng),本書的目的是對這個(gè)快速發(fā)展的學(xué)科分支做一個(gè)階段性的小結(jié),以期對其進(jìn)一步發(fā)展及應(yīng)用提供一個(gè)規(guī)范化的基礎(chǔ)。本書是《矩陣半張量積講義》的第三卷,介紹有限博弈的矩陣半張量積方法。主要內(nèi)容包括:網(wǎng)絡(luò)演化博弈的建模與控制;勢博弈的檢驗(yàn)與應(yīng)用;有限博弈的向量空間結(jié)構(gòu)與正交分解;博弈的優(yōu)化與策略學(xué)習(xí)方法;若干合作博弈的特征函數(shù)與分配的矩陣表達(dá)等。基于可讀性的要求,在介紹矩陣半張量積有限博奔研究中的新進(jìn)展的同時(shí),也對博弈論的相關(guān)基礎(chǔ)知識做了自足自洽的介紹,本書所需要的預(yù)備知識僅為工科大學(xué)本科的數(shù)學(xué)知識,包括線性代數(shù)、微積分、常微分方程、初等概率論,相關(guān)的線性系統(tǒng)理論及點(diǎn)集拓?fù)洹⒊橄蟠鷶?shù)、微分幾何等的初步概念在卷一附錄中已給出。不感興趣的讀者亦可略過相關(guān)部分,這些不會影響對本書基本內(nèi)容的理解,本書可供離散數(shù)學(xué)、自動控制、計(jì)算機(jī)、系統(tǒng)生物學(xué)、博弈論及相關(guān)專業(yè)的高年級本科生、研究生、青年教師及科研人員使用
矩陣半張量積講義(卷3有限博弈的矩陣半張量積方法)(精) 目錄
前言
第1章 有限非合作博弈 1
1.1 有限博弈的數(shù)學(xué)模式 1
1.2 偽邏輯函數(shù) 3
1.3 納什均衡 6
1.4 混合策略與納什定理 8
1.5 納什定理的證明 9
第2章 矩陣博弈 14
2.1 Rn中的凸集 14
2.2 矩陣博弈及其納什均衡點(diǎn) 17
2.3 混合納什均衡的存在 21
2.4 矩陣博弈的等價(jià)性 22
2.5 計(jì)算納什均衡 23
第3章 網(wǎng)絡(luò)演化博弈 29
3.1 演化博弈與受控演化博弈 29
3.2 網(wǎng)絡(luò)演化博弈的數(shù)學(xué)模型 34
3.3 結(jié)點(diǎn)的基本演化方程 40
3.4 依賴于狀態(tài)的演化博弈 45
3.4.1 確定型時(shí)變演化博弈 46
3.4.2 混合型時(shí)變演化博弈 50
3.5 策略演化與局勢演化 53
3.6 網(wǎng)絡(luò)演化博弈的控制 58
3.7 基于網(wǎng)絡(luò)圖的演化博弈 60
3.7.1 網(wǎng)絡(luò)的局勢演化方程 61
3.7.2 猜硬幣的網(wǎng)絡(luò)演化博弈 65
3.8 網(wǎng)絡(luò)演化博弈的拓?fù)浣Y(jié)構(gòu) 68
3.8.1 不動點(diǎn)與極限環(huán) 69
3.8.2 純納什均衡點(diǎn) 70
第4章 演化穩(wěn)定策略 76
4.1 生物系統(tǒng)中演化策略的穩(wěn)定性 76
4.2 有限博弈的演化穩(wěn)定策略 78
4.3 網(wǎng)絡(luò)拓?fù)渑c策略演化 86
4.3.1 非對稱網(wǎng)絡(luò)演化博弈 86
4.3.2 齊次網(wǎng)絡(luò)演化博弈 92
4.4 策略的收斂性 96
4.4.1 有限演化博弈策略的拓?fù)浣Y(jié)構(gòu) 96
4.4.2 齊次網(wǎng)絡(luò)的策略收斂性 99
4.5 博弈的演化等價(jià) 106
第5章 受限邏輯系統(tǒng)與智能系統(tǒng)的控制 109
5.1 受限邏輯動態(tài)系統(tǒng) 110
5.2 系統(tǒng)的能控性分析 111
5.2.1 受限邏輯動態(tài)系統(tǒng)的能控性 113
5.2.2 受限周期邏輯動態(tài)系統(tǒng)的能控性 114
5.3 智能規(guī)劃問題的控制 115
5.3.1 農(nóng)夫-狼-羊-白菜的渡河問題 115
5.3.2 傳教士與食人族的渡河問題 117
第6章 勢博弈 122
6.1 勢博弈及其基本性質(zhì) 122
6.2 勢方程 124
6.3 勢方程的結(jié)構(gòu)與解 128
6.4 網(wǎng)絡(luò)演化勢博弈 135
6.5 加權(quán)勢博弈 141
6.5.1 加權(quán)勢博弈方程的雙線性表示 141
6.5.2 權(quán)重的計(jì)算 144
6.6 余集加權(quán)勢博弈 148
6.6.1 余集加權(quán)勢博弈的代數(shù)結(jié)構(gòu) 148
6.6.2 余集加權(quán)兩個(gè)玩家布爾勢博弈 151
6.7 從布爾博弈到勢博弈 152
6.7.1 布爾博弈與對稱博弈 153
6.7.2 對稱布爾博弈 154
6.7.3 檢驗(yàn)布爾博弈的對稱性 156
6.7.4 從對稱博弈到勢博弈 161
6.7.5 加權(quán)布爾博弈 165
6.7.6 重置名布爾博弈 168
6.7.7 翻轉(zhuǎn)對稱布爾博弈 170
第7章 不完全信息博弈 173
7.1 靜態(tài)貝葉斯博弈 173
7.2 貝葉斯-納什均衡 178
7.3 貝葉斯博弈的轉(zhuǎn)換 180
7.4 貝葉斯勢博弈 183
7.5 動態(tài)貝葉斯博弈 190
第8章 有限博弈的向量空間 199
8.1 勢博弈的子空間結(jié)構(gòu) 199
8.2 非策略子空間 202
8.3 純勢博弈子空間 207
8.4 純調(diào)和子空間 208
8.5 有限博弈的結(jié)構(gòu)分解 214
8.5.1 子空間投影 214
8.5.2 正交分解 215
8.6 演化與博弈空間分解 220
8.6.1 空間分解與演化等價(jià) 220
8.6.2 網(wǎng)絡(luò)演化博弈的子空間分解 222
8.7 近似勢博弈 225
第9章 對稱與反對稱博弈 229
9.1 反對稱博弈和非對稱博弈 229
9.1.1 線性表示 230
9.1.2 反對稱博弈的存在性 236
9.2 基于對稱性的有限博弈空間分解 238
9.2.1 一個(gè)低維博弈空間的例 238
9.2.2 兩人博弈空間 240
9.2.3 子空間基底 242
9.2.4 子空間正交性 245
9.2.5 有限博弈分解公式 247
第10章 基于學(xué)習(xí)的博弈演化 249
10.1 博弈學(xué)習(xí)的一般框架 249
10.2 常見的博弈學(xué)習(xí)規(guī)則 251
10.2.1 短視*優(yōu)響應(yīng)學(xué)習(xí) 252
10.2.2 邏輯響應(yīng)學(xué)習(xí) 252
10.2.3 虛擬學(xué)習(xí) 254
10.3 狀態(tài)演化博弈 255
10.3.1 狀態(tài)演化博弈的數(shù)學(xué)模型 255
10.3.2 狀態(tài)勢博弈及其學(xué)習(xí)規(guī)則 258
10.4 基于狀態(tài)勢博弈設(shè)計(jì)的多個(gè)體系統(tǒng)優(yōu)化 259
10.4.1 局部信息依賴的收益函數(shù)設(shè)計(jì) 260
10.4.2 狀態(tài)演化過程設(shè)計(jì) 261
10.5 一般狀態(tài)演化博弈的學(xué)習(xí)規(guī)則 265
10.5.1 基于兩步記憶的較優(yōu)響應(yīng)學(xué)習(xí)規(guī)則 266
10.5.2 收斂性分析 268
10.5.3 應(yīng)用舉例 275
第11章 基于博弈的優(yōu)化與控制 281
11.1 博弈系統(tǒng)的優(yōu)化控制問題描述 281
11.1.1 人機(jī)博弈 281
11.1.2 常見的性能指標(biāo)函數(shù) 282
11.2 純策略模型的拓?fù)浣Y(jié)構(gòu) 282
11.3 平均支付的*優(yōu)策略 287
11.4 混合演化策略模型 293
11.5 有限次混合策略*優(yōu)控制 294
11.6 無限次混合策略*優(yōu)控制 300
第12章 零行列式策略 304
12.1 矩陣博弈中的零行列式策略 304
12.2 從個(gè)體策略到局勢轉(zhuǎn)移矩陣 306
12.3 有限博弈中的零行列式策略 309
12.4 在網(wǎng)絡(luò)演化博弈中的應(yīng)用 313
12.4.1 虛擬對手玩家 314
12.4.2 網(wǎng)絡(luò)演化博弈的零行列式策略 315
第13章 連續(xù)策略勢博弈的量化方法 318
13.1 連續(xù)博弈 318
13.2 有限勢子博弈 320
13.3 n元線性插值算法 320
13.4 合并插值算法 323
13.5 *勢博弈 327
第14章 合作博弈的矩陣方法 331
14.1 特征函數(shù) 331
14.2 常和博弈的特征函數(shù) 336
14.3 兩種特殊的合作博弈 339
14.3.1 無異議博弈 339
14.3.2 規(guī)范博弈 343
14.4 分配 345
14.5 核心 349
14.6 核心的存在性 353
14.6.1 簡單博弈 353
14.6.2 凸合作博弈 355
14.6.3 對稱合作博弈 356
14.7 穩(wěn)定集 357
14.8 Shapley值 362
14.9 Shapley值與核心的關(guān)系 372
參考文獻(xiàn) 374
索引 382
矩陣半張量積講義(卷3有限博弈的矩陣半張量積方法)(精) 節(jié)選
第1章有限非合作博弈 博弈論也稱對策論,它研究參與者在對抗或合作中的*優(yōu)策略。在人類社會的發(fā)展過程中,博弈論的思想源遠(yuǎn)流長。自古以來,人們自覺不自覺地在社會生活和生產(chǎn)斗爭中使用博弈的思想做出自己的決策。在中國歷史上典型的博弈例子包括戰(zhàn)國時(shí)代的田忌賽馬、三國時(shí)代的華容道等。古代猶太人的法典中規(guī)定在有爭議的情況下財(cái)產(chǎn)的分割,是合作博弈很好的例子。19世紀(jì)描述雙寡頭壟斷競爭的古諾模型,已經(jīng)開始將嚴(yán)格的數(shù)學(xué)方法引入博弈的決策分析。真正用近代科學(xué)的方法研究它們,從而形成當(dāng)代重要學(xué)科分支,則都大體始于第二次世界大戰(zhàn)之后,以馮 諾伊曼等的《博弈論與經(jīng)濟(jì)行為》[121]為標(biāo)志。 近代的博弈理論大體包含兩個(gè)部分:非合作博弈與合作博弈。在非合作博弈中,玩家之間主要是競爭關(guān)系。這里尋找的解是各玩家利益的一種均衡。*著名的或者說應(yīng)用*廣的就是納什均衡,它是美國數(shù)學(xué)家J.Nash(納什)在1950年提出來的[101],納什因此在1994年獲得諾貝爾經(jīng)濟(jì)學(xué)獎。其他的還有Pareto均衡等。粗略地說,非合作博弈的解就是尋找合適的均衡。 合作博弈則不同,它探討因合作得到的利益應(yīng)如何分配才是合理的。因此,合理的分配方案才是合作博弈的*優(yōu)解。例如,由L.S.Shapley提出的一種分配方案,后來被稱為Shapley值。Shapley是2012年諾貝爾經(jīng)濟(jì)學(xué)獎獲得者。 本書以有限博弈為主。有限博弈指的是在一個(gè)博弈中,一共只有有限個(gè)玩家,而每個(gè)玩家可供選擇的策略也是有限的。我們之所以選擇有限博弈,除了有限博弈自身的重要性外,還因?yàn)榫仃嚢霃埩糠e是描述和分析有限博弈的方便而有效的工具。例如,兩個(gè)人玩石頭-剪刀-布,這時(shí),每個(gè)人都有三個(gè)策略可選,不妨設(shè)石頭對應(yīng)、剪刀對應(yīng)、布對應(yīng),那么,策略演化過程就可以用三值邏輯網(wǎng)絡(luò)來刻畫它了。于是,本叢書第二卷中發(fā)展起來的邏輯網(wǎng)絡(luò)的分析與控制的方法就可以方便地用到這類博弈過程了。 關(guān)于博弈論的書非常多。我們對初學(xué)者推薦以下兩本入門書:,它們提供的基本概念與結(jié)論足夠本書的需要了。是對博弈論半張量積方法的一個(gè)較全面的綜述,它有助于了解該方向的研究進(jìn)展。 1.1有限博弈的數(shù)學(xué)模式 定義1.1.1一個(gè)有限非合作博弈G由一個(gè)三元組(N,S,C)決定,這里 (i)為玩家集合,即該游戲有n個(gè)玩家; (ii)為局勢(profile)集,這里 是玩家i的策略集,即第i個(gè)玩家有ki個(gè)可選策略。 (iii) 因?yàn)楸菊轮挥懻摲呛献鞑┺模园延邢薹呛献鞑┺暮喎Q為有限博弈。 通常二人博弈可以用一個(gè)支付雙矩陣表示。設(shè)G為一個(gè)二人博弈,玩家P1有m個(gè)策略,即,玩家P2有n個(gè)策略,即,那么,支付雙矩陣見表1.1.1。 在表1.1.1中,不同的行代表玩家P1的不同策略,不同的列代表玩家P2的不同策略,在雙矩陣中 例1.1.1考慮二人玩石頭-剪刀-布,記石頭為1,剪刀為2,布為3,且贏者得一分,輸者失一分。那么,支付雙矩陣可表示為表1.1.2。 一個(gè)局勢可表示為,這里。設(shè),則s可以用,表示,這里。因此,S是一個(gè)多指標(biāo)集。下面我們構(gòu)造一個(gè)矩陣,稱為支付矩陣。支付矩陣可通過構(gòu)造支付表而得到。 表1.1.2中**行以字典順序列出所有局勢,以下每行對應(yīng)一位玩家在對應(yīng)局勢下的支付。例如,當(dāng)n=2時(shí),表1.1.2可等價(jià)地表示表1.1.3的支付函數(shù)。 支付矩陣的一個(gè)優(yōu)勢是,它可以應(yīng)用到n>2的情況,而支付雙矩陣只能用于n=2的情況。 1.2偽邏輯函數(shù) 定義1.2.1設(shè)。稱函數(shù)為一個(gè)偽邏輯函數(shù)。如果,則稱偽邏輯函數(shù)為偽布爾函數(shù)。 利用向量表達(dá)式,我們有,并且,偽邏輯函數(shù)有一個(gè)矩陣表示形式,這在下面的命題中給出。 命題1.2.1設(shè)為一偽邏輯函數(shù),則存在唯一的行向量,這里,稱為f的結(jié)構(gòu)向量,使在向量形式下有 (1.2.1) 證明 這跟邏輯函數(shù)的結(jié)構(gòu)矩陣的道理是一樣的,只是將每一列所對應(yīng)的邏輯函數(shù)值改成對應(yīng)的偽邏輯函數(shù)值。 給定一個(gè)有限博弈,這里。那么,每一個(gè)就是局勢的偽邏輯函數(shù)。根據(jù)命題,對每個(gè)都存在一個(gè)它的結(jié)構(gòu)向量,使得 這里 (1.2.2) 實(shí)際上,如果G的支付矩陣的第i行表示玩家i的收益信息,那么該行就是ci的結(jié)構(gòu)向量。 下面舉幾個(gè)簡單的例子。 例1.2.1以下是幾個(gè)常見的簡單博弈的例子。 (i)性別之戰(zhàn):一對情侶準(zhǔn)備一次約會,男士(玩家1)喜歡去看足球賽,女士(玩家2)想去聽音樂會。當(dāng)然他們都希望能在一起。于是,這場博弈的支付雙矩陣可表示為表1.2.1 如果表示成偽邏輯函數(shù),則有 (ii)智豬博弈:豬圈里有個(gè)控制器,每按一下可提供10千克食物,控制器離食槽較遠(yuǎn),去按控制器者必然后吃。設(shè)大豬先吃,則大、小豬各吃9千克與1千克,小豬先吃,各吃6千克與4千克,同時(shí)開始吃,則各吃7千克與3千克,又按一下要消耗2千克食物。那么,支付雙矩陣如表1.2.2所示。 表示成偽邏輯函數(shù),則有 (1.2.4) (iii)獵鹿博弈:兩獵人正圍堵一只鹿時(shí),突然出現(xiàn)一群兔子。如果二人合作,則可抓到鹿,賣鹿后每人可得10元。若兩人都去抓兔子,則每人可得4元。若一人去抓兔子,一個(gè)去獵鹿,則抓兔子者可得4元,獵鹿者一無所獲,得0元。那么,支付雙矩陣如表1。2。3所示。 表示成偽邏輯函數(shù),則有 (1.2.5) (iv)田忌賽馬:田忌與齊王賽馬,各有上、中、下三種等級的馬,分別記作t1,t2,t3和q1,q2,q3。已知q1>t1>q2>t2>q3>t3(這里“>”表示速度快),共賽三場,二人可分別選擇出場順序。每場千金,于是有支付雙矩陣如表1。2。4(其中單位為千金)。 表示成偽邏輯函數(shù),則有 (1.2.6) 考察有限博弈且,n。則所有這種博弈的集合記作。當(dāng)時(shí),這類集合簡記為。 考察一個(gè)博弈。設(shè)其支付函數(shù)的結(jié)構(gòu)向量為,將所有結(jié)構(gòu)向量依順序排成一行,定義為 (1.2.7) 那么,VG稱為博弈G的結(jié)構(gòu)向量。 因?yàn)槊總(gè)博弈都是由其支付函數(shù)唯一確定的,所以每個(gè)博弈都由其博弈的支付函數(shù)的結(jié)構(gòu)向量唯一確定。因此,我們可以給博弈集合一個(gè)向量空間結(jié)構(gòu),它同構(gòu)于Rκ。 例1.2.2回憶例1.2.1: (i)性別之戰(zhàn)(G1)、智豬博弈(G2)和獵鹿博弈(G3)均屬于G[2;2],其結(jié)構(gòu)向量分別為 (ii)田忌賽馬(G4)屬于,其結(jié)構(gòu)向量為 1.3納什均衡 納什均衡是非合作博弈理論中*重要的一個(gè)概念,有的教科書直接將納什均衡稱為非合作博弈的解,如[9]。 先介紹納什均衡的概念。 定義1.3.1考察一個(gè)有限博弈。一個(gè)局勢稱為G的一個(gè)純納什均衡點(diǎn),如果 (1.3.1) 注意,這里。 與優(yōu)化問題不同,非合作博弈中的每一個(gè)玩家都很難達(dá)到自己支付的*優(yōu)值(為簡單計(jì),約定為*大值),因此,非合作博弈的目標(biāo)并不是尋找每一個(gè)玩家的*優(yōu)解,而是尋找大家都能接受的解。納什均衡就是這樣一種解。由定義不難看出,如果其他人的策略不變,則沒有人能夠通過單獨(dú)改變自己的策略而獲利。因此,它成為一種局勢的平衡點(diǎn),或者說,在某種“妥協(xié)”下的共同次優(yōu)解。 我們給一個(gè)例子說明什么是納什均衡。 例1.3.1(囚徒困境(Prisoner’s Dilemma))兩個(gè)共犯的囚徒,分別受審。各有兩種策略:招供、拒供。其結(jié)果表示在支付雙矩陣(表1.3.1)中。
- >
巴金-再思錄
- >
月亮與六便士
- >
史學(xué)評論
- >
中國歷史的瞬間
- >
朝聞道
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
詩經(jīng)-先民的歌唱
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述