-
>
貨幣大歷史:金融霸權與大國興衰六百年
-
>
(精)方力鈞作品圖錄
-
>
《藏書報》2021合訂本
-
>
(精)中國當代書畫名家作品集·范碩:書法卷+繪畫卷(全2卷)
-
>
(噴繪樓閣版)女主臨朝:武則天的權力之路
-
>
書里掉出來一只狼+狼的故事-全2冊
-
>
奇思妙想創意玩具書(精裝4冊)
DEEPSEEK大模型高性能核心技術與多模態融合開發 版權信息
- ISBN:9787302684893
- 條形碼:9787302684893 ; 978-7-302-68489-3
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:
DEEPSEEK大模型高性能核心技術與多模態融合開發 本書特色
1)DeepSeek多模態大模型正備受矚目,而其背后的高性能注意力機制與多模態融合技術更是成為了深度學習研究領域的熱點。
(2)《DeepSeek大模型高性能核心技術與多模態融合開發》致力于成為讀者全面掌握DeepSeek核心技術的寶典,通過深入淺出的原理講解與實例分析,引導讀者系統學習DeepSeek的核心原理、架構及應用開發方法。
(3)《DeepSeek大模型高性能核心技術與多模態融合開發》深入剖析DeepSeek的核心技術多頭潛在注意力MLA與混合專家模型MoE,詳細闡述它們的工作原理與技術優勢。
(4)《DeepSeek大模型高性能核心技術與多模態融合開發》詳細探討DeepSeek中的多模態融合方法,結合豐富的應用實例,為讀者提供全面的理論與實踐指導,助力讀者深入理解高性能大模型的運行機制。
(5)實戰項目涵蓋情感分類、圖像識別、語音識別、文本生成、圖像生成、圖文問答、視頻分類、智能客服等應用場景。
(6)配套示例源碼、數據文件、PPT課件、配圖PDF文件與讀者微信交流群。
DEEPSEEK大模型高性能核心技術與多模態融合開發 內容簡介
"《DeepSeek大模型高性能核心技術與多模態融合開發》深入剖析國產之光DeepSeek多模態大模型的核心技術,從高性能注意力機制切入,深入揭示DeepSeek的技術精髓與獨特優勢,詳細闡述其在人工智能領域成功的技術秘訣。《DeepSeek大模型高性能核心技術與多模態融合開發》循序漸進地講解深度學習注意力機制的演進,從經典的多頭注意力(MHA)逐步深入DeepSeek的核心技術—多頭潛在注意力(MLA)與混合專家模型(MoE)。此外,《DeepSeek大模型高性能核心技術與多模態融合開發》還將詳細探討DeepSeek中的多模態融合策略、技術及應用實例,為讀者提供全面的理論指導與應用實踐。《DeepSeek大模型高性能核心技術與多模態融合開發》配套所有示例源碼、PPT課件、配圖PDF文件與讀者微信技術交流群。 《DeepSeek大模型高性能核心技術與多模態融合開發》共分15章,內容涵蓋高性能注意力與多模態融合概述、PyTorch深度學習環境搭建、DeepSeek注意力機制詳解(包括基礎篇、進階篇、高級篇及調優篇)、在線與本地部署的DeepSeek實戰(如旅游特種兵迪士尼大作戰、廣告文案撰寫與微調、智能客服等),以及多模態融合技術與實戰應用(如Diffusion可控圖像生成、多模態圖文理解與問答、交叉注意力語音轉換、端到端視頻分類等)。 《DeepSeek大模型高性能核心技術與多模態融合開發》既適合DeepSeek核心技術初學者、注意力機制初學者、大模型應用開發人員、多模態融合開發人員、大模型研究人員,也適合高等院校及高職高專院校人工智能大模型方向的師生。"
DEEPSEEK大模型高性能核心技術與多模態融合開發DEEPSEEK大模型高性能核心技術與多模態融合開發 前言
多模態大模型DeepSeek以其卓越的技術與出色的性能,在人工智能領域熠熠生輝,成為一顆璀璨的明珠。其成功的秘訣在于對注意力機制的突破性創新與MoE創新架構的巧妙運用,為人工智能領域帶來了前所未有的變革。
DeepSeek不僅在理論上取得了顯著突破,更在實際應用中展現出其強大的能力。通過高效融合多種模態的數據,DeepSeek在圖像識別、自然語言處理、語音識別等領域均取得了令人矚目的成果,為人工智能的多元化應用提供了強大的支持。
在此背景下,本書深入剖析注意力機制與多模態融合的基本原理,全面展示它們的技術概況,并結合豐富的應用案例,展望這兩大技術的未來發展趨勢。通過搭建PyTorch深度學習環境,讀者可以親自動手實踐書中的豐富案例,從而在實踐中更深入地理解這兩大技術的精髓,并提高大模型應用開發能力。
本書不僅適合深度學習初學者、工程師、研究者、學校的師生閱讀,也適合想要掌握*新注意力機制與多模態融合技術的高等院校師生閱讀。
本書配套資源
DEEPSEEK大模型高性能核心技術與多模態融合開發 目錄
第1章 高性能注意力與多模態融合 1
1.1 從涌現到飛躍:高性能大模型的崛起 1
1.1.1 大模型的“涌現” 2
1.1.2 大模型的發展歷程 3
1.1.3 高性能大模型的崛起 4
1.2 大模型的內功:高性能注意力機制的崛起 5
1.2.1 注意力機制的基本原理 5
1.2.2 注意力機制的變革與發展 6
1.2.3 高性能注意力機制崛起:GQA與MLA 6
1.3 大模型的外拓:多模態融合 7
1.3.1 多模態外拓及其挑戰 7
1.3.2 融合策略與技術概覽 7
1.3.3 深度學習在多模態融合中的應用場景 9
1.4 高性能注意力與多模態融合的未來展望 10
1.4.1 融合技術的創新方向 11
1.4.2 注意力機制的前沿探索 11
1.5 本章小結 12
第2章 PyTorch深度學習環境搭建 13
2.1 安裝Python開發環境 13
2.1.1 Miniconda的下載與安裝 13
2.1.2 PyCharm的下載與安裝 16
2.1.3 計算softmax函數練習 20
2.2 安裝PyTorch 2.0 21
2.2.1 NVIDIA 10/20/30/40系列顯卡選擇的GPU版本 21
2.2.2 PyTorch 2.0 GPU NVIDIA運行庫的安裝 21
2.2.3 Hello PyTorch 24
2.3 多模態大模型DeepSeek初探與使用 24
2.3.1 DeepSeek模型簡介 25
2.3.2 DeepSeek帶來的技術創新 26
2.3.3 DeepSeek的第三方服務與使用示例 27
2.4 本章小結 29
第3章 注意力機制詳解之基礎篇 30
3.1 注意力機制與模型詳解 30
3.1.1 注意力機制詳解 31
3.1.2 自注意力(Self-Attention)機制 32
3.1.3 自注意力的代碼實現 37
3.1.4 ticks和Layer Normalization 38
3.1.5 多頭自注意力 39
3.2 注意力機制的應用實踐:編碼器 42
3.2.1 自編碼器的總體架構 42
3.2.2 回到輸入層:初始詞向量層和位置編碼器層 43
3.2.3 前饋層的實現 46
3.2.4 將多層模塊融合的TransformerBlock層 47
3.2.5 編碼器的實現 48
3.3 基礎篇實戰:自編碼架構的拼音漢字生成模型 53
3.3.1 漢字拼音數據集處理 54
3.3.2 搭建文本與向量的橋梁—Embedding 56
3.3.3 自編碼模型的確定 58
3.3.4 模型訓練部分的編寫 59
3.4 本章小結 60
第4章 注意力機制詳解之進階篇 62
4.1 注意力機制的第二種形態:自回歸架構 62
4.1.1 自回歸架構重大突破:旋轉位置編碼 63
4.1.2 添加旋轉位置編碼的注意力機制與現有庫包的實現 64
4.1.3 新型的激活函數SwiGLU詳解 66
4.1.4 “因果掩碼”與“錯位”輸入輸出格式詳解 67
4.2 進階篇實戰1:無須位置表示的酒店評論情感判斷 69
4.2.1 數據集的準備與讀取 69
4.2.2 使用sentencepiece建立文本詞匯表 70
4.2.3 編碼情感分類數據集 71
4.2.4 基于新架構文本分類模型設計 72
4.2.5 情感分類模型的訓練與驗證 75
4.3 進階篇實戰2:基于自回歸模型的酒店評論生成 77
4.3.1 數據集的準備與讀取 77
4.3.2 基于自回歸文本生成模型的設計 78
4.3.3 評論生成模型的訓練 82
4.3.4 使用訓練好的模型生成評論 83
4.4 本章小結 83
第5章 注意力機制詳解之高級篇 85
5.1 替代前饋層的混合專家模型詳解 86
5.1.1 混合專家模型的基本結構 86
5.1.2 混合專家模型中的“專家”與“調控”代碼實現 87
5.2 高級篇實戰1:基于混合專家模型的情感分類實戰 91
5.2.1 基于混合專家模型的MoE評論情感分類實戰 91
5.2.2 混合專家模型中負載平衡的實現 94
5.2.3 修正后的MoE門控函數 96
5.3 帶有MoE的注意力模型 97
5.3.1 注意力機制中的前饋層不足 98
5.3.2 MoE天然可作為前饋層 101
5.3.3 結合MoE的注意力機制 104
5.4 高級篇實戰2:基于通道注意力的圖像分類 105
5.4.1 數據集的準備 105
5.4.2 圖像識別模型的設計 107
5.4.3 結合通道注意力圖像分類模型 108
5.4.4 圖像識別模型SENet的訓練與驗證 110
5.5 高級篇實戰3:基于MoE與自注意力的圖像分類 111
5.5.1 基于注意力機制的ViT模型 112
5.5.2 Patch和Position Embedding 114
5.5.3 可視化的V-MoE詳解 116
5.5.4 V-MoE模型的實現 118
5.5.5 基于圖像識別模型V-MoE的訓練與驗證 119
5.5.6 使用已有的庫包實現MoE 121
5.6 本章小結 122
第6章 注意力機制詳解之調優篇 124
6.1 注意力模型優化方案講解 124
6.1.1 注意力模型優化1:MQA模型 125
6.1.2 注意力模型優化2:MLA模型 127
6.1.3 注意力模型優化3:GQA模型 129
6.1.4 注意力模型優化4:差分注意力模型 134
6.2 調優篇實戰1:基于MLA的人類語音情感分類 140
6.2.1 情緒數據的獲取與標簽的說明 140
6.2.2 情緒數據集的讀取 141
6.2.3 語音情感分類模型的設計和訓練 143
6.3 本章小結 144
第7章 旅游特種兵迪士尼大作戰:DeepSeek API調用與高精準路徑優化 146
7.1 基于在線API的大模型調用 147
7.1.1 DeepSeek的注冊與API獲取 147
7.1.2 帶有特定格式的DeepSeek的API調用 149
7.1.3 帶有約束的DeepSeek的API調用 150
7.2 智能化DeepSeek工具調用詳解 153
7.2.1 Python使用工具的基本原理 154
7.2.2 在DeepSeek中智能地使用工具 154
7.2.3 在DeepSeek中選擇性地使用工具 157
7.2.4 DeepSeek工具調用判定依據 165
7.3 旅游特種兵迪士尼大作戰:DeepSeek高精準路徑優化 170
7.3.1 游樂場數據的準備 170
7.3.2 普通大模型的迪士尼游玩求解攻略 173
7.3.3 基于動態規劃算法的迪士尼游玩求解攻略 174
7.3.4 基于DeepSeek的旅游特種兵迪士尼大作戰 176
7.4 本章小結 178
第8章 廣告文案撰寫實戰:多模態DeepSeek本地化部署與微調 179
8.1 多模態DeepSeek-VL2本地化部署與使用 180
8.1.1 Linux版本DeepSeek-VL2代碼下載與圖像問答 180
8.1.2 Windows版本DeepSeek-VL2代碼下載 182
8.2 廣告文案撰寫實戰1:PEFT與LoRA詳解 183
8.2.1 微調的目的:讓生成的結果更聚焦于任務目標 183
8.2.2 微調經典方法LoRA詳解 185
8.2.3 適配DeepSeek微調的輔助庫PEFT詳解 187
8.3 廣告文案撰寫實戰2:本地化DeepSeek-VL2微調 190
8.3.1 數據的準備 190
8.3.2 微調模型的訓練 192
8.3.3 微調模型的使用與推斷 194
8.4 本章小結 196
第9章 注意力與特征融合范式1:Diffusion可控圖像生成 197
9.1 Diffusion生成模型精講 197
9.1.1 Diffusion Model的精講 198
9.1.2 直接運行的經典DDPM的模型訓練實戰 199
9.1.3 DDPM的模型基本模塊說明 202
9.1.4 DDPM加噪與去噪詳解:結合成功運行的擴散模型代碼 205
9.1.5 DDPM的損失函數:結合成功運行的Diffusion Model代碼 210
9.2 可控圖像生成實戰:融合特征的注意力機制 211
9.2.1 擴散模型可控生成的基礎:特征融合 212
9.2.2 注意力MQA中的可控特征融合 212
9.2.3 基于注意力的擴散模型的設計 214
9.2.4 圖像的加噪與模型訓練 217
9.2.5 基于注意力模型的可控圖像生成 220
9.3 本章小結 223
第10章 注意力與特征融合范式2:多模態圖文理解與問答 224
10.1 多模態圖文問答實戰 224
10.1.1 一種新的多模態融合方案 225
10.1.2 數據集的設計與使用 228
10.1.3 多模態融合數據集的訓練 229
10.1.4 多模態圖文問答的預測 230
10.2 更多的多模態融合方案 231
10.2.1 一種截斷的多模態融合方案 231
10.2.2 截斷后多模態模型的訓練與預測 234
10.2.3 一種加法基礎的多模態融合方案 235
10.3 本章小結 237
第11章 注意力與特征融合范式3:交叉注意力語音轉換 239
11.1 端到端語音識別任務簡介 239
11.1.1 端到端的語音識別 240
11.1.2 中文語音文本數據集說明 241
11.2 端到端音頻特征提取庫librosa的使用 243
11.2.1 音頻信號的基本讀取方法 243
11.2.2 多特征音頻抽取 246
11.3 端到端語音識別任務簡介 248
11.3.1 全中文音頻數據集的準備 248
11.3.2 音頻特征的提取與融合 250
11.3.3 基于生成模型的端到端語音識別任務 253
11.3.4 端到端語音識別任務的訓練與預測 255
11.4 基于PyTorch的數據處理與音頻特征融合 257
11.4.1 THCHS30數據集的處理 257
11.4.2 基于torchaudio的音頻預處理 258
11.4.3 基于不同角度的音頻特征獲取和簡單融合 260
11.4.4 關于特征融合的講解 261
11.5 用于特征融合的交叉注意力 262
11.5.1 交叉注意力詳解 262
11.5.2 帶有掩碼的交叉注意力 265
11.5.3 完整的帶有掩碼的交叉注意力端到端語音識別 267
11.5.4 基于交叉注意力的端到端語音識別的訓練與預測 269
11.5.5 基于連接concat的端到端語音識別模型 269
11.6 本章小結 271
第12章 多模態特征token壓縮 272
12.1 圖像特征壓縮的多種實現 272
12.1.1 Pixel-Shuffle的token壓縮 272
12.1.2 Cross-layer Token Fusion壓縮 274
12.1.3 AvgPool的token壓縮 277
12.2 基于AvgPool與自編碼器的語音識別 278
12.2.1 修改后的AvgPool函數 278
12.2.2 自編碼器語音識別模型1:數據準備 279
12.2.3 自編碼器語音識別模型2:模型設計 280
12.2.4 自編碼器語音識別模型3:模型的訓練與預測 281
12.3 本章小結 282
第13章 從二維到一維:圖像編碼器詳解與圖形重建實戰 283
13.1 圖像編碼器 284
13.1.1 從自然語言處理講起 284
13.1.2 圖像的編碼與解碼VQ-VAE 285
13.1.3 為什么VQ-VAE采用離散向量 285
13.1.4 VQ-VAE的核心實現 287
13.2 基于VQ-VAE的手寫體生成 289
13.2.1 圖像的準備與超參數設置 289
13.2.2 VQ-VAE的編碼器與解碼器 291
13.2.3 VQ-VAE的模型設計 295
13.2.4 VQ-VAE的訓練與預測 297
13.2.5 獲取編碼后的離散token 299
13.3 基于FSQ的人臉生成 300
13.3.1 FSQ算法簡介與實現 301
13.3.2 人臉數據集的準備 303
13.3.3 基于FSQ的人臉重建方案 304
13.3.4 基于FSQ的人臉輸出與離散token 306
13.4 基于FSQ算法的語音存儲 307
13.4.1 無監督條件下的語音存儲 307
13.4.2 可作為密碼機的離散條件下的語音識別 308
13.5 本章小結 309
第14章 基于PyTorch的端到端視頻分類實戰 310
14.1 視頻分類數據集的準備 310
14.1.1 HMDB51數據集的準備 311
14.1.2 視頻抽幀的處理 312
14.1.3 基于PyTorch的數據輸入 314
14.2 注意力視頻分類實戰 315
14.2.1 對于視頻的Embedding編碼器 316
14.2.2 視頻分類模型的設計 317
14.2.3 視頻分類模型的訓練與驗證 320
14.3 使用預訓練模型的視頻分類 321
14.3.1 torchvision簡介 321
14.3.2 基于torchvision的端到端視頻分類實戰 324
14.4 本章小結 326
第15章 基于DeepSeek的跨平臺智能客服開發實戰 328
15.1 智能客服的設計與基本實現 328
15.1.1 智能客服搭建思路 329
15.1.2 商品介紹數據的格式與說明 329
15.1.3 基于DeepSeek的智能客服設計 334
15.2 帶有跨平臺客戶端的智能客服開發實戰 337
15.2.1 跨平臺客戶端Gradio使用詳解 337
15.2.2 一個簡單的Gradio示例 343
15.2.3 基于DeepSeek的跨平臺智能客服實現 343
15.3 本章小結 346
DEEPSEEK大模型高性能核心技術與多模態融合開發 作者簡介
王曉華,高校計算機專業講師,研究方向為云計算、大數據與人工智能。其著作包括《深入探索Mamba模型架構與應用》《PyTorch深度學習與計算機視覺實踐》《PyTorch語音識別實戰》《ChatGLM3大模型本地化部署、應用開發與微調》《從零開始大模型開發與微調:基于PyTorch與ChatGLM》《PyTorch 2.0深度學習從零開始學》《Spark 3.0大數據分析與挖掘:基于機器學習》《TensorFlow深度學習應用實踐》《OpenCV TensorFlow深度學習與計算機視覺實戰》《TensorFlow語音識別實戰》《TensorFlow 2.0卷積神經網絡實戰》《深度學習的數學原理與實現》。
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
名家帶你讀魯迅:故事新編
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
朝聞道
- >
隨園食單
- >
上帝之肋:男人的真實旅程
- >
月亮虎
- >
自卑與超越