-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
深度學習 版權信息
- ISBN:9787111776109
- 條形碼:9787111776109 ; 978-7-111-77610-9
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
深度學習 本書特色
本書遵循教指委相關指導文件和高等院校學生學習規律編寫而成。踐行四新理念,融入思政元素,注重理論與實踐相結合。
深度學習 內容簡介
本書主要介紹深度學習方面的基本理論和方法,具體包括基礎內容、提高性內容和應用三個部分。其中,基礎性內容是深度學習*核心部分,具體包括:機器學習基本概念及數學知識、全連接網絡、卷積網絡、循環網絡、以及優化算法。第二部分是提高性內容,主要是闡述*新發展的一些技術,可供課時充足的專業進行學習。這部分主要包括:GAN生成對抗網絡、圖神經網絡、Transformer與注意力機制,以及深度強化學習。本書第三部分是應用部分,具體包括:計算機視覺、自然語言處理,以及大語言模型。
深度學習深度學習 前言
前言
近年來,以深度學習為代表的新一代人工智能技術得到了快速發展,并在諸多領域展現出明顯的優勢。作為輻射性非常強的高科技、應用性學科,人工智能技術可以很好地服務于國家與區域經濟建設,在這種情況下,發展人工智能技術也成為一些國家和地區的戰略性選擇,因此,對人才培養等提出了很高的要求。為了加快智能類人才培養,2018年4月,制定《高等學校人工智能創新行動計劃》,力圖為我國新一代人工智能發展提供戰略支撐。近期建設目標主要包括建設“人工智能 X”復合特色專業和相應的人工智能學院、研究院或交叉研究中心。
深度學習是智能科學與技術、人工智能等專業的必修課程,對于計算機科學與技術、自動化等專業而言,深度學習也是一門非常重要的專業選修課程。因此,近年來,全國不少高校都開設了深度學習方面的課程,急需編寫合適的教材用于課堂教學。目前,深度學習方面的一些書籍主要是翻譯自國外的教材和專著,或者是一些網上的學習心得,相比教材,它們更適合作為學習參考書和資料。因此,對于深度學習教學而言,編寫一本與課時數相匹配,且非常適合本科生知識體系的教材尤為迫切,這也是當前全國智能類相關專業教師的迫切需求。可以預見,本書的出版將會很好地服務于我國智能類本科人才培養,因此它具有很好的市場前景。
深度學習 目錄
前言
第1章 深度學習基礎1
1.1 深度學習應用舉例1
1.1.1 ChatGPT1
1.1.2 圖像及視頻生成4
1.1.3 古卷軸破譯5
1.2 機器學習基礎6
1.2.1 機器學習簡介與基本概念6
1.2.2 機器學習問題分類7
1.2.3 數據準備和預處理10
1.2.4 構建機器學習模型11
1.2.5 模型訓練與評估13
1.2.6 模型泛化能力15
1.3 微積分基礎15
1.3.1 微分與導數16
1.3.2 函數近似與泰勒展開16
1.3.3 多元函數及其偏導數16
1.3.4 復合函數及鏈式法則17
1.4 線性代數基礎17
1.4.1 向量17
1.4.2 矩陣18
1.4.3 梯度20
1.4.4 特征分解與奇異值分解20
1.5 概率統計基礎21
1.5.1 隨機變量21
1.5.2 概率分布21
1.5.3 期望與方差22
1.5.4 條件概率與貝葉斯法則23
1.5.5 極大似然估計23
本章小結24
思考題與習題24
參考文獻24
第2章 全連接網絡25
2.1 網絡結構25
2.1.1 生物神經結構26
2.1.2 隱藏層26
2.2 激活函數27
2.2.1 ReLU函數28
2.2.2 SoftPlus函數28
2.2.3 Sigmoid函數29
2.2.4 tanh函數30
2.2.5 GeLU函數31
2.2.6 其他激活函數31
2.3 損失函數31
2.3.1 均方誤差損失32
2.3.2 平均絕對誤差損失32
2.3.3 平滑L1損失33
2.3.4 交叉熵損失33
2.3.5 KL散度損失35
2.3.6 其他損失函數35
2.4 反向傳播36
2.4.1 標量形式的反向傳播36
2.4.2 梯度消失與梯度爆炸37
2.4.3 計算圖38
2.4.4 向量形式的反向傳播42
2.5 異或問題44
本章小結45
思考題與習題45
參考文獻46
第3章 卷積神經網絡47
3.1 卷積層47
3.1.1 卷積運算47
3.1.2 卷積的特點50
3.1.3 卷積的數學性50
3.2 其他卷積類型51
3.2.1 轉置卷積51
3.2.2 空洞卷積53
3.2.3 分組卷積54
3.2.4 可分離卷積55
3.3 池化層57
3.3.1 平均池化57
3.3.2 *大池化58
3.3.3 *大池化和平均池化的區別59
3.3.4 PyTorch實現59
3.4 卷積層與全連接層比較60
3.5 經典網絡結構60
3.5.1 LeNet60
3.5.2 AlexNet61
3.5.3 VGG62
3.5.4 GoogleNet63
3.5.5 ResNet63
3.6 卷積神經網絡代碼實現64
本章小結65
思考題與習題65
參考文獻65
第4章 循環神經網絡67
4.1 序列問題67
4.2 循環神經網絡結構68
4.2.1 隱狀態69
4.2.2 權值共享69
4.2.3 輸入與輸出編碼70
4.2.4 深度循環網絡71
4.2.5 雙向循環網絡72
4.2.6 梯度消失與爆炸73
4.2.7 PyTorch實現74
4.3 門控循環單元74
4.3.1 GRU單元74
4.3.2 PyTorch實現76
4.4 長短時記憶網絡76
4.4.1 長短時記憶網絡中的門控單元76
4.4.2 LSTM的歷史和相關變體78
4.4.3 PyTorch實現79
4.5 編碼器-解碼器架構81
本章小結81
思考題與習題82
參考文獻82
第5章 優化算法83
5.1 訓練深度網絡的挑戰83
5.1.1 凸函數與非凸函數83
5.1.2 局部極小值點與鞍點84
5.1.3 深度學習訓練中的其他挑戰85
5.2 隨機梯度下降85
5.2.1 梯度下降85
5.2.2 隨機梯度下降86
5.2.3 小批量SGD88
5.2.4 初始化88
5.2.5 學習率89
5.2.6 梯度截斷91
5.3 動量法92
5.3.1 重球法94
5.3.2 指數移動平均94
5.3.3 Nesterov加速法95
5.3.4 PyTorch實現96
5.4 自適應學習率算法97
5.4.1 AdaGrad97
5.4.2 RMSProp98
5.4.3 Adam99
5.4.4 AdamW101
5.5 批量規范化和層規范化102
本章小結104
思考題與習題105
參考文獻105
第6章 生成對抗網絡與擴散模型107
6.1 生成對抗網絡107
6.1.1 什么是生成對抗網絡107
6.1.2 生成對抗網絡的應用范圍108
6.2 生成對抗網絡的原理110
6.2.1 生成模型110
6.2.2 判別模型112
6.2.3 訓練過程113
6.3 生成對抗網絡的可視化與實踐114
6.3.1 生成對抗網絡訓練過程可視化114
6.3.2 生成對抗網絡的衍生結構115
6.4 擴散模型116
6.4.1 什么是擴散模型116
6.4.2 擴散模型的使用范圍117
6.5 擴散模型的原理117
6.5.1 擴散模型的基礎117
6.5.2 擴散模型的核心思想119
6.5.3 擴散模型的數學原理119
6.6 生成對抗網絡與擴散模型的結合123
6.6.1 結合的優勢123
6.6.2 結合的改進策略124
6.6.3 擴散模型與AIGC應用124
本章小結126
思考題與習題126
參考文獻126
第7章 圖神經網絡127
7.1 圖嵌入向量127
7.1.1 節點嵌入127
7.1.2 邊嵌入128
7.1.3 圖嵌入128
7.1.4 圖嵌入方法128
7.2 圖生成模型129
7.2.1 一種圖生成網絡IDGL129
7.2.2 GAN在圖上的應用131
7.2.3 基于VAE的圖生成模型(GraphVAE)132
7.2.4 基于GAN的圖生成模型(GraphGAN)132
7.3 圖神經網絡方法133
7.3.1 圖卷積神經網絡133
7.3.2 圖注意力網絡136
7.3.3 動態圖神經網絡138
7.3.4 異構圖神經網絡139
7.3.5 大規模圖神經網絡訓練策略141
7.4 圖神經網絡設計——以GCN為例142
7.4.1 模型構建142
7.4.2 基于PyTorch的GCN模型實現142
7.4.3 網絡訓練143
7.5 典型應用舉例144
7.5.1 圖神經網絡用于節點分類144
7.5.2 圖神經網絡用于鏈接預測145
7.5.3 圖神經網絡用于圖分類145
7.5.4 圖神經網絡在推薦系統中的應用145
7.5.5 圖神經網絡在交通預測中的應用145
7.5.6 圖神經網絡在計算化學和藥物發現中的應用146
7.5.7 圖神經網絡在社交網絡分析中的應用146
本章小結146
思考題與習題146
參考文獻147
第8章 Transformer與Mamba架構148
8.1 自注意力機制148
8.1.1 自注意力機制的定義148
8.1.2 自注意力機制的數學邏輯149
8.1.3 多頭自注意力149
8.2 Transformer150
8.2.1 定義與原理150
8.2.2 模型結構151
8.2.3 架構分析156
8.3 Vision Transformer157
8.3.1 定義與原理157
8.3.2 模型結構158
8.3.3 架構分析160
8.4 Mamba架構161
8.4.1 定義與原理161
8.4.2 模型結構161
8.4.3 架構分析162
8.5 Vision Mamba163
8.6 性能對比167
8.6.1 Transformer性能分析167
8.6.2 Mamba架構性能分析167
8.6.3 對比與展望168
本章小結168
思考題與習題168
參考文獻169
第9章 強化學習170
9.1 有限馬爾可夫決策過程170
9.1.1 形式化定義170
9.1.2 策略與值函數171
9.1.3 *優策略與*優值函數172
9.2 深度值函數強化學習172
9.2.1 Q學習算法172
9.2.2 深度Q網絡173
9.2.3 DQN的改進算法175
9.3 直接策略搜索方法176
9.3.1 策略梯度算法176
9.3.2 近端策略優化算法177
9.3.3 深度確定性策略梯度算法178
9.4 多智能體強化學習180
9.4.1 多智能體系統的挑戰性180
9.4.2 MADDPG算法181
9.4.3 值分解強化學習算法183
9.4.4 MAPPO算法184
9.5 典型應用舉例185
9.5.1 可控核聚變185
9.5.2 AlphaGo系列機器人186
9.5.3 AlphaStar187
本章小結188
思考題與習題188
參考文獻188
第10章 計算機視覺190
10.1 概述190
10.2 圖像分類191
10.2.1 基本概念191
10.2.2 圖像分類基本方法195
10.2.3 應用場景200
10.2.4 發展趨勢201
10.3 目標檢測202
10.3.1 基本概念203
10.3.2 常用數據集204
10.3.3 R-CNN系列模型205
10.3.4 YOLO系列模型207
10.3.5 評價指標209
10.3.6 應用場景209
10.3.7 發展趨勢210
10.4 語義分割211
10.4.1 基本概念211
10.4.2 常用數據集211
10.4.3 經典語義分割模型212
10.4.4 評價指標215
10.4.5 應用場景216
10.4.6 發展趨勢217
本章小結218
思考題與習題218
參考文獻218
第11章 自然語言處理220
11.1 概述220
11.2 NLP問題簡介223
11.2.1 自然語言理解223
11.2.2 自然語言生成225
11.3 詞嵌入226
11.3.1 預訓練226
11.3.2 Word2Vec228
11.3.3 負采樣229
11.4 情感分析230
11.4.1 情感分析及數據預處理231
11.4.2 使用循環神經網絡233
11.4.3 使用卷積神經網絡236
11.4.4 使用Transformer238
11.5 NLP應用——聊天機器人240
11.5.1 問答系統簡介240
11.5.2 基于大語言模型的聊天機器人實踐242
本章小結249
思考題與習題249
參考文獻250
第12章 大語言模型251
12.1 BERT模型 251
12.1.1 BERT模型架構251
12.1.2 BERT預訓練技術253
12.1.3 用BERT表示文本253
12.2 GPT模型254
12.2.1 GPT模型架構254
12.2.2 GPT預訓練254
12.2.3 GPT1到GPT4的聯系與區別255
12.3 大語言模型微調方法255
12.3.1 提示詞調優256
12.3.2 前綴調優256
12.3.3 LoRA257
12.3.4 適配器調優257
12.4 多模態語言大模型258
12.4.1 模型架構259
12.4.2 多模態大模型訓練260
12.4.3 多模態語言大模型實例260
12.5 大語言模型驅動的智能體系統261
12.5.1 AI Agent架構262
12.5.2 推理關鍵技術262
12.5.3 智能系統實例266
本章小結267
思考題與習題267
參考文獻268
深度學習 作者簡介
2013年,獲得國家自然科學基金杰出青年基金資助;2017年,入選長江學者特聘教授。2019年,入選國家百千萬人才工程;2020年,獲得國務院政府特殊津貼;2022年,獲得天津市(研究生)教學成果一等獎(排名第1);2023年,獲得國家(本科)教學成果二等獎(排名第1)。
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
唐代進士錄
- >
朝聞道
- >
巴金-再思錄
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
自卑與超越
- >
月亮虎
- >
我與地壇