-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
人工智能與博弈對抗 版權信息
- ISBN:9787030740007
- 條形碼:9787030740007 ; 978-7-03-074000-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
人工智能與博弈對抗 內容簡介
本書以優選人工智能方法解決各類典型復雜博弈對抗問題為主線,系統闡述智能博弈對抗領域的前沿技術,為從事相關知識學習和科學研究提供指導與參考。全書分為十章,主要內容包括:博弈問題的基本概念與典型智能博弈技術、經典棋類博弈問題與博弈樹樹搜索方法、Artari游戲與深度強化學習方法、圍棋博弈與AphaGo系列技術、不接近信息博弈與撲克博弈求解技術、星際爭霸博弈及技術、兵棋博弈與軍事應用、機甲大師與團隊對抗博弈技術、機器人集群對抗技術、足球比賽等體育競技對抗、對手建模技術等。本書為全面了解智能博弈對抗相關理論與前沿技術提供了較為全面的介紹,為后續研究奠定了良好基礎。
人工智能與博弈對抗 目錄
前言
第1章 緒論 1
1.1 相關概念與理解 1
1.1.1 智能 1
1.1.2 人工智能 3
1.1.3 機器智能 5
1.1.4 人機混合智能 6
1.1.5 群體智能 8
1.1.6 智能相關概念之間的關系 12
1.1.7 博弈對抗 13
1.2 人機對抗的興起與發展 14
1.2.1 棋牌類游戲人機對抗 14
1.2.2 電子競技中的AI玩家 21
1.2.3 無人系統人機對抗 25
參考文獻 28
第2章 策略搜索與機器博弈 31
2.1 策略搜索技術 31
2.1.1 狀態空間和搜索樹的概念 31
2.1.2 無信息搜索 33
2.1.3 啟發式搜索 35
2.1.4 極小極大搜索 35
2.1.5 蒙特卡羅樹搜索 38
2.2 國際象棋 41
2.2.1 國際象棋求解技術 43
2.2.2 國際象棋引擎當前發展 46
2.3 西洋跳棋 46
2.3.1 西洋跳棋的復雜度 47
2.3.2 西洋跳棋的“破解” 47
2.4 《吃豆人》游戲 49
參考文獻 51
第3章 機器學習與數據對抗 53
3.1 機器學習基礎 53
3.1.1 基本術語 54
3.1.2 典型任務形式 57
3.2 深度神經網絡與對手行為預測 61
3.2.1 深度神經網絡 61
3.2.2 對手行為預測 64
3.3 聚類算法與對手風格預測 65
3.3.1 聚類算法 65
3.3.2 對手風格聚類 66
3.4 深度偽造與應對反制 68
3.4.1 深度偽造技術發展 68
3.4.2 深度偽造應對與反制 72
3.5 對抗機器學習 74
3.5.1 對抗機器學習分類 75
3.5.2 主要技術分析 76
參考文獻 85
第4章 強化學習與對抗決策 87
4.1 強化學習 87
4.1.1 基于馬爾可夫決策過程的強化學習建模 87
4.1.2 模型求解方法 90
4.2 深度強化學習 94
4.2.1 DQN分析 95
4.2.2 DDPG分析 96
4.3 多智能體深度強化學習 97
4.3.1 隨機博弈建模 97
4.3.2 研究進展 102
4.4 Atari游戲博弈 104
4.4.1 Atari游戲與AI 104
4.4.2 Atari游戲AI主要技術分析 106
4.5 圍棋博弈 109
4.5.1 AlphaGo分析 .110
4.5.2 AlphaGoZero分析 112
4.6 《星際爭霸》游戲對抗 116
4.6.1 全流程對戰主要技術分析:AlphaStar 119
4.6.2 微觀管理主要技術分析 124
4.7 兵棋博弈對抗 126
4.7.1 兵棋AI興起與發展 127
4.7.2 智能兵棋系統 130
4.7.3 全國兵棋推演大賽智能體博弈賽及系統 136
參考文獻 138
第5章 博弈論與均衡策略計算 141
5.1 博弈論基礎 141
5.1.1 博弈論基本概念 141
5.1.2 博弈論基本假設 143
5.1.3 博弈問題分類 144
5.2 典型博弈模型與解概念 145
5.2.1 策略型博弈 145
5.2.2 展開型博弈 149
5.2.3 貝葉斯博弈 152
5.3 均衡策略計算方法 153
5.3.1 虛擬博弈系列技術 153
5.3.2 基于Q學習的均衡策略計算 154
5.3.3 虛擬遺憾值昀小化 156
5.4 德州撲克博弈 157
5.4.1 德州撲克基本規則 158
5.4.2 撲克博弈樹 159
5.4.3 德州撲克AI的技術路線 160
5.4.4 先進德州撲 AI介紹 164
5.5 追逃博弈與微分對策 167
5.5.1 追逃博弈的例子 168
5.5.2 微分對策的基本概念 170
5.5.3 微分對策的解概念 171
參考文獻 173
第6章 人工智能對軍事博弈對抗的影響 176
6.1 人工智能技術的優勢與挑戰 176
6.2 人工智能對當前軍事領域的滲透 177
6.2.1 情報偵察監視 177
6.2.2 指揮決策 178
6.2.3 任務執行 178
6.2.4 網絡空間 179
6.2.5 后勤保障 180
6.3 人工智能對未來戰爭形態的改變 181
6.3.1 新型作戰概念 182
6.3.2 新型作戰樣式 186
6.4 人工智能武器 189
6.4.1 人工智能武器在全球的發展 189
6.4.2 人工智能武器的風險與挑戰 192
參考文獻 193
人工智能與博弈對抗 節選
第1章 緒論 1.1 相關概念與理解 博弈對抗在現實中所涉及的智能范疇十分廣泛,往往并不局限于人工智能(artificial intelligence,AI)。本節首先分別從智能、人工智能、機器智能、人機混合智能與群體智能等概念與研究范疇進行分析,然后對博弈對抗的概念進行簡要介紹。 1.1.1 智能 1. 語言學中智能的定義 在語言學領域,表征人類精神活動的詞語很多。英語中除了intelligence,還有mentality、mind、intellect、wisdom、insight等;漢語中除了智能,還有智力、智慧、思維、認知、意識等。 《不列顛百科全書》中將intelligence表述為“是有效適應環境的能力”、“不是單一的心理過程,而是達成環境有效適應性的心理過程的綜合”[1]。維基百科上的表述為“指邏輯、理解、自我意識、學習、情感知識、推理、規劃、創造和解決問題的能力,可以更廣泛地定義為感知或推斷信息,并將其作為知識應用于特定環境下自適應行為的能力”[2]。從語源學角度看,intelligence源自拉丁語intelligentia,意為“理解、知識、洞察力、文藝、技能、體驗”,其組成為inter+legere,inter意為“在 之間”,legere意為“搜集、選擇”[3]。 在中文中,智能被闡述為“智”+“能”,亦即智力和能力。《荀子》正名篇中提到“所以知之在人者謂之知,知有所合謂之智”,意思是說在人身上所具有的用來認識事物的能力,稱為“知”;知覺與所認識的事物能夠符合,稱為“智”[4]。 2. 心理學中智能的定義 在心理學領域存在著很多關于智能的表述。認知發展理論創始人讓 皮亞杰(Jean Piaget)認為智能是在人不知道怎么做的時候才會動用的一種能力。心理學家大衛 韋克斯勒 (David Wechsler)認為智能是有目的行動、理性思考、有效處理環境的能力。教育學家和心理學家霍華德 加德納 (Howard Gardner)提出的多元智能理論認為人類智能包括八個方面(圖1.1):語言、數理邏輯、視覺 /空間、身體 /運動、音樂、人際、內省、自然探索[5]。由心理學家路易斯 瑟斯頓(Louis Thurstone)和哈羅德 凱利(Harold Kelley)提出的基本心理能力理論,認為有七種昀基本的、相互關聯的智力能力:言語理解、言語流暢性、歸納推理、空間視覺化、數字、記憶、知覺速度。約翰 卡羅爾(John Carroll)認為智力由三個層次水平的因素組成。昀高水平層由一種因素構成,即一般智力因素;中間水平層由七種因素構成,即流體智力、晶體智力、一般記憶容量、一般流暢性、一般視知覺、一般加工速度、一般聽知覺;昀低水平層由許多特殊的因素構成。 圖1.1人類智能的八個方面 3. 如何理解智能和智能科學 智能是人類和部分生物體神經系統特有的一種能力,這種能力使得生物個體在進化選擇和生存競爭中,能夠實現感知環境,并進行判斷、預測和行為決策,以及開展群體合作等功能,從而在生存競爭中取得優勢。智能是一種動態過程,不僅需要逐步進化的神經系統作為其依存的基本生理結構,還需要與環境和其他生命體進行對抗或合作,在動態環境中通過學習、交流等手段不斷拓展和提升。在人工智能出現以后,智能的范疇從生物智能向人造物智能方向擴展。 從狹義上講,通常描述中提到的智能指的是生物智能或者人類智能。從廣義上講,特別是隨著人工智能的發展,智能的范圍不僅局限于人類智能和生物智能,同時也將包括人工智能和機器智能等新形式的智能。 智能科學、腦科學、認知科學、控制科學、計算機科學、人工智能相互之間有著緊密聯系。在學術研究上,智能科學研究智能的本質和實現技術,是由腦科學、認知科學、控制科學及人工智能等綜合形成的交叉學科。腦科學從分子水平、細胞水平、行為水平研究自然智能機理,建立腦模型,揭示人腦的本質;認知科學是研究人類感知、學習、記憶、思維、意識等人腦心智活動過程的科學;控制科學是研究機器、生命社會中控制和通信的一般規律的科學,是研究動態系統在變化環境條件下如何保持平衡狀態或穩定狀態的科學;人工智能模仿、延伸和擴展人的智能,實現機器智能、群體智能和人機混合智能。智能科學是用科學的方法和手段來研究智能及其應用過程的一門學科[6]。 博弈對抗一直是經濟學和社會學的主要研究議題,在智能科學中也有著廣泛的研究。人類社會中的博弈對抗往往可以看成人類高水平智能之間的博弈對抗。這也和我們通常的認識是一致的。人們在解決博弈對抗問題時,常常需要綜合運用邏輯、理解、意識、學習、推理、規劃、解決問題的這些智能方面的能力,有時自我意識和創造性也發揮著重要作用。 1.1.2 人工智能 1. 人工智能主流學派 經過六十余年的發展,人工智能三起兩落,形成了多個學派,可以歸納出三個主流學派。 (1)符號主義學派(邏輯主義、心理學派、計算機學派),認為人工智能源于數理邏輯,用機器的符號操作來模擬人的認知過程,強調功能模擬和符號推演。從啟發式算法到專家系統,再到知識工程,符號主義學派曾長期一枝獨秀,從宏觀上模擬人的思維過程。 (2)連接主義學派(仿生學派或生理學派),認為人工智能源于仿生學,特別是對人腦模型的研究,人的思維基元是神經元,而不是符號處理過程,連接主義的思路主要是進行結構模擬、神經計算。連接主義學派試圖探索認知過程的微觀結構。 (3)行為主義學派(進化主義、控制論學派),認為人工智能源于控制論,智能取決于感知和行動,在“感知-動作”模式中,人工智能可以像人類智能一樣進化。智能行為只能通過現實世界與周圍環境的交互作用表現出來。 2. 人工智能定義的四種角度 對于人工智能存在的一些定義,可以通過兩個維度進行歸納:思考/行動,類人/理性。其中理性是指在思考和行動過程中以理想的性能評價為支持。從歷史上看,這四類定義均由不同的研究人員通過不同的方式進行描述。以人為中心的定義主要源于實驗科學,涉及對人的行為的觀察和假設;理性主義定義主要綜合數學和工程學。不同觀點的研究人員互相爭論又互相促進。 (1)類人思考的觀點認為人工智能是“新的令人激動的努力,要使計算機能夠思考 從字面上完整的意思就是:有頭腦的機器”[7]、“使與人類思維相關的活動自動化,如決策、問題求解、學習等活動”[8]。 (2)類人行動的觀點認為人工智能是“一種技藝,創造機器來執行人需要智能才能完成的功能”[9]、“研究如何讓計算機能夠做到那些目前人比計算機做得更好的事情”[10]。 (3)理性思考的觀點認為人工智能是“通過對計算模型的使用來進行心智能力的研究”[11]、“對使得知覺、推理和行動成為可能的計算的研究”[12]。 (4)理性行動的觀點認為人工智能是“一門通過計算過程力圖理解和模仿智能行為的學科”[13]、“計算機科學中與智能行為的自動化有關的一個分支”[10]。 可以看出,強調思考的觀點注重于大腦內部發生的事;強調行動的觀點注重于環境,關注感知和行動,其概念范圍更大;強調類人的觀點注重于模仿人的思維和行動過程;強調理性的觀點注重于理想的性能評價。 3. 如何理解人工智能 人工智能包括弱人工智能和強人工智能。弱人工智能是指能夠使機器在特定任務中達到或者超越人的智能;強人工智能是指機器能夠全面滿足在任意任務中原本需要的人的能力。當前科學界的研究集中于弱人工智能。 關于人工智能的定義有很多。斯坦福大學尼爾森教授對人工智能的定義為[14]:廣義地講,人工智能是關于人造物的智能行為,而智能行為包括知覺、推理、學習、交流和在復雜環境中的行為。人工智能具有科學和工程雙重目標,人工智能的一個長期目標是發明出可以像人類一樣或能更好地完成以上行為的機器;另一個目標是理解這種智能行為是否存在于機器、人類或其他動物中。加利福尼亞大學斯圖爾特 羅素(Stuart Russell)教授對人工智能的定義為[15]:人工智能是采用計算機、機器人等現代人造工具,對生物智能進行延伸或者替代的各種嘗試,由此形成的理念、理論、技術和體系的統稱。 1.1.3 機器智能 1. 對機器智能的理解 相對于人工智能,人們較少使用機器智能一詞。維基百科上對機器智能的定義包括兩個方面:人工智能和機器學習。前者指讓機器模仿實現人類的智能;后者看中機器自身的主動學習能力[16]。 2019年英國Nature雜志的子刊Nature Machine Intelligence正式上線,用于發表機器學習、機器人技術和人工智能領域的高質量原創研究論文和評論文章。目前普遍認為機器學習是體現機器智能的主要方面。例如,阿里巴巴集團技術委員會主席王堅提出:只要創造出關于動物和人的智能,都可以叫作人工智能。但人與動物不具備的智能,如果機器具備了,那就是機器智能[17,18]。美國斯坦福大學人工智能與倫理學教授杰瑞 卡普蘭(Jerry Kaplan)認為:機器智能不應該是讓機器變得像人一樣有智慧,應該是新一代的自動化;它不是來取代人,而是來輔助人的;現在就有很多工作崗位不能靠自動化來取代,而是讓我們工作變得更加高效,同時也會創造出新的工作崗位[18]。從這個視角來看,可以認為機器智能是機器自動化的延伸。北京大數據研究院院長鄂維南也認為:機器智能的核心是研究會學習的機器,它將會把我們帶入智能化社會,就像當年造出了會勞動的機器把我們帶入了工業化社會一樣。 2. 機器智能的內涵與外延 從廣義上講,機器模擬人類的行為、思考方式,通過攝像頭、話筒等傳感器接收外界數據,與存儲器的數據進行對比、識別,從而判斷、分析,以便控制機械的行為,就表現為機器智能。這里的“機器”主要指計算機、自動化裝置、通信設備等。 智能機器人和智能制造是機器智能的核心體現。機器人是人工智能技術與載體和任務的結合體,可以分為以計算機和網絡空間為主的軟件機器人,具有感知、思考和移動能力的智能機器人,具有感知、分析、推理、決策、控制和制造功能或加入了智能算法的智能化裝備或設備。圖1.2給出了幾種典型機器人的例子。 圖1.2機器人例子 機器智能主要是依靠機器(而非人)這一載體實現一些智能行為。機器智能也分為若干層次,如昀簡單的應激反射算法,到較為基礎的控制模式生成算法,再到復雜神經網絡和深度學習算法,機器智能也有智能高低之分。因此,也可以認為機器智能是囊括人工智能技術、虛擬現實技術、增強現實技術、物聯網技術等方面的大集合。 1.1.4 人機混合智能 1. 人機混合智能的內涵 與機器相比,人腦能夠整合理解復雜環境中的多重信息并快速作出決策,同時對外界環境變化有很強的適應性。而機器在數值計算、快速檢索、海量存儲等方面具有明顯優勢。人機混合智能可以從兩個方面理解:人類智能(行為或決策)與人工智能的交互或整合;用智能設備和人體進行集成,形成一個人機合一的超級實體。
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
姑媽的寶刀
- >
朝聞道
- >
經典常談
- >
苦雨齋序跋文-周作人自編集
- >
回憶愛瑪儂
- >
羅庸西南聯大授課錄
- >
人文閱讀與收藏·良友文學叢書:一天的工作