中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
深入探索MAMBA模型架構與應用

包郵 深入探索MAMBA模型架構與應用

作者:王曉華 著
出版社:清華大學出版社出版時間:2025-03-01
開本: 其他 頁數: 0
中 圖 價:¥92.8(7.8折) 定價  ¥119.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

深入探索MAMBA模型架構與應用 版權信息

  • ISBN:9787302681571
  • 條形碼:9787302681571 ; 978-7-302-68157-1
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

深入探索MAMBA模型架構與應用 本書特色

(1)《深入探索Mamba模型架構與應用》旨在為讀者提供一本全面、深入的Mamba深度學習架構實戰指南。作者精心組織了全書的內容,從基礎理論到實戰應用,循序漸進地引導讀者掌握Mamba架構的核心技術與應用實戰技巧。
(2)《深入探索Mamba模型架構與應用》詳細剖析了Mamba的核心組件和工作原理,讓讀者能夠清晰把握其與傳統深度學習架構的區別與優勢。
(3)《深入探索Mamba模型架構與應用》結合豐富的案例和實戰經驗,展示了Mamba在文本生成、圖像分類、天氣預測、圖像生成、知識圖譜、語音喚醒、多模態視覺問答等多個領域的應用場景。
(4)配套示例源碼、數據文件、PPT課件、配圖PDF文件與讀者微信交流群。

深入探索MAMBA模型架構與應用 內容簡介

"Mamba是一種新型的深度學習架構,在保持對序列長度近似線性擴展性的同時,提供了與Transformers相當的建模能力。《深入探索Mamba模型架構與應用》旨在幫助讀者探索Mamba在不同領域實現卓越性能的潛力,并深入理解和應用這一新興的模型架構。本書配套示例源碼、PPT課件、配圖PDF文件與讀者微信交流群服務。 《深入探索Mamba模型架構與應用》共分16章,內容包括Mamba概述、Mamba架構詳解、Mamba組件詳解、基于PyTorch的彈簧振子動力學Mamba實戰、Mamba文本情感分類實戰、Mamba的文本轉換實戰、VisionMamba圖像分類實戰、多方案的Mamba文本生成實戰、讓Mamba更強的模塊、循環神經網絡詳解與切片時間序列預測、基于Jamba的天氣預測實戰、統一了注意力與Mamba架構的Mamba2模型、Mamba結合Diffusion的圖像生成實戰、知識圖譜的構建與展示實戰、基于特征詞的語音喚醒實戰、多模態視覺問答實戰。 《深入探索Mamba模型架構與應用》既適合Mamba架構初學者,以及人工智能、深度學習方向的從業人員閱讀,也適合作為高等院校或高職高專院校相關專業學生的參考書。"

深入探索MAMBA模型架構與應用深入探索MAMBA模型架構與應用 前言

在科技的浩瀚星海中,人工智能已經成為引領時代前行的璀璨明星。而深度學習作為人工智能領域的重要分支,更是推動了無數科技創新與突破。在這個波瀾壯闊的歷史進程中,我們有幸見證并參與了Mamba這一新興深度學習架構的誕生與發展。今天,我們將這份寶貴的經歷與知識凝結成書,希望能夠助力更多有志之士在深度學習的道路上探索與前行。
本書構思
本書旨在為讀者提供一本全面、深入的Mamba深度學習架構實戰指南。我們精心組織了全書的內容,從基礎理論到實戰應用,循序漸進地引導讀者掌握Mamba架構的核心技術與實戰技巧。無論你是深度學習的初學者,還是希望進一步提升技能的專業人士,相信本書都能為你提供寶貴的幫助。
在撰寫本書的過程中,我們始終秉持著嚴謹、務實的態度。書中的每一章都經過了反復的打磨與驗證,確保內容的準確性與實用性。同時,我們也注重理論與實踐的結合,通過大量的實戰案例,幫助讀者將所學知識轉變為實際應用能力。
本書通過系統而全面的介紹,帶領讀者從Mamba架構的基礎理論出發,逐步深入各種實戰應用的開發與實現。我們詳細剖析了Mamba的核心組件和工作原理,幫助讀者清晰把握其與傳統深度學習架構的區別與優勢。同時,我們還結合豐富的案例和實戰經驗,展示了Mamba在序列生成、圖像識別、自然語言處理等多個領域的應用場景和前景。

深入探索MAMBA模型架構與應用 目錄

第1章 橫空出世的Mamba 1
1.1 深度學習的前世今生 1
1.1.1 深度學習的發展歷程 2
1.1.2 深度學習與人工智能 3
1.2 深度學習中的主要模型 4
1.2.1 深度學習中的代表性模型和應用 4
1.2.2 CNN、RNN與Transformer 5
1.2.3 劍指王者的Mamba帶來了新的突破 7
1.3 本章小結 8
第2章 挑戰注意力機制地位的Mamba架構詳解 9
2.1 Mamba的優勢 10
2.1.1 Transformer模型存在的不足 10
2.1.2 循環神經網絡 12
2.1.3 結合Transformer與RNN優點的SSM 14
2.2 環境搭建1:安裝Python 15
2.2.1 Miniconda的下載與安裝 15
2.2.2 PyCharm的下載與安裝 17
2.3 環境搭建2:安裝PyTorch 2.0 20
2.3.1 Nvidia 10/20/30/40系列顯卡選擇的GPU版本 20
2.3.2 PyTorch 2.0 GPU Nvidia運行庫的安裝 21
2.4 **次使用Mamba 24
2.4.1 Hello Mamba:使用預訓練Mamba模型生成實戰 24
2.4.2 了解Mamba:構建Mamba的三大模塊說明 25
2.5 本章小結 26
第3章 Mamba組件詳解 28
3.1 Mamba組件1:狀態空間模型 28
3.1.1 經典狀態空間詳解 29
3.1.2 什么是狀態空間 31
3.1.3 狀態空間模型影響模型的學習過程與Python實現 33
3.2 Mamba組件2:連續信號轉換成離散信號的方法 38
3.2.1 將連續信號轉換成離散信號詳解與Python實現 38
3.2.2 離散狀態空間的Python實現 41
3.2.3 離散狀態空間的循環計算(類似于RNN的計算方法) 44
3.3 Mamba組件3:HiPPO算法初始化的狀態轉移矩陣 46
3.3.1 SSM中的狀態轉移矩陣 47
3.3.2 HiPPO算法的Python實現與可視化講解 49
3.4 本章小結 51
第4章 基于PyTorch的彈簧振子動力學Mamba實戰 52
4.1 從狀態空間模型SSM到結構化狀態空間模型S4 52
4.1.1 從狀態空間模型SSM開始(PyTorch具體實現) 53
4.1.2 連續信號轉換為離散信號的PyTorch實現 54
4.1.3 離散信號循環計算的PyTorch實現 55
4.1.4 狀態空間模型SSM的PyTorch實現 55
4.1.5 HiPPO算法初始化狀態矩陣 57
4.1.6 基于S4架構的Mamba模型 58
4.2 基于狀態空間模型模擬彈簧振子動力學 59
4.2.1 加速度的求解:詳細講解的經典彈簧-阻尼系統公式 59
4.2.2 彈簧-阻尼微分方程的SSM分解與PyTorch實現 61
4.2.3 使用空間狀態方程模擬彈簧-阻尼方程 63
4.2.4 阻尼微分方程參數的物理解釋(選學) 64
4.3 基于SSM的模擬彈簧振子輸出的神經網絡實戰 65
4.3.1 數據的準備 66
4.3.2 對數空間中切分步數的準備 67
4.3.3 基于SSM的模型構建 68
4.3.4 SSM模型的訓練實戰 73
4.3.5 使用HiPPO算法初始化狀態轉移矩陣 74
4.4 本章小結 78
第5章 Mamba文本情感分類實戰 80
5.1 有趣的詞嵌入 80
5.1.1 什么是詞嵌入 81
5.1.2 PyTorch中詞嵌入處理函數詳解 82
5.2 基于進階SSM架構的情感分類Mamba實戰 83
5.2.1 數據的準備 84
5.2.2 SSM進階的S6架構的設計與手把手實現 84
5.2.3 Mamba堆疊Block的設計與完整實現 88
5.2.4 完整Mamba的實現 90
5.2.5 基于Mamba的情感分類實戰 94
5.3 本章小結 98
第6章 Mamba文本轉換實戰 99
6.1 基于Mamba的拼音漢字轉換模型 99
6.1.1 拼音漢字數據集詳解與實戰處理方法 99
6.1.2 Mamba模型的設計詳解 101
6.1.3 模型的訓練與預測 102
6.2 PyTorch對數據集的封裝與可視化訓練步驟 105
6.2.1 使用torch.utils.data. Dataset封裝自定義數據集 106
6.2.2 批量輸出數據的DataLoader類詳解 108
6.3 本章小結 111
第7章 含有位置表示的雙向VisionMamba模型圖像分類實戰 112
7.1 使用PyTorch自帶的圖像管理工具與圖像增強技術 112
7.1.1 PyTorch自帶的圖像管理工具 113
7.1.2 圖片數據增強 115
7.2 基于雙向VisionMamba的模塊講解 119
7.2.1 數據的準備 119
7.2.2 將圖像轉換為Mamba可用的Embedding處理方法 120
7.2.3 能夠雙向計算的VisionMamba模型 123
7.2.4 初始旋轉位置編碼RoPE 126
7.3 VisionMamba圖像分類實戰 129
7.3.1 VisionMamba模型的構建 129
7.3.2 VisionMamba圖像分類實戰 131
7.4 本章小結 132
第8章 多方案的Mamba文本生成實戰 133
8.1 Mamba的經典文本生成實戰 133
8.1.1 數據的準備與錯位輸入方法 134
8.1.2 基于經典Mamba的文本生成模型 136
8.1.3 基于Mamba的文本生成模型的訓練與推斷 138
8.1.4 生成函數中的注意事項:temperature與“模型尺寸” 140
8.2 微調:在原有Mamba模型上進行重新訓練 142
8.2.1 什么是微調 142
8.2.2 預訓練的Mamba生成模型 144
8.2.3 對預訓練模型進行微調 144
8.2.4 使用微調的預訓練模型進行預測 146
8.3 低硬件資源微調預訓練Mamba模型的方法 147
8.3.1 使用凍結模型參數的微調方法 147
8.3.2 通過替換特定層的方式完成微調 151
8.3.3 對模型參數進行部分保存和載入的方法 153
8.4 本章小結 154
第9章 能夠讓Mamba更強的模塊 155
9.1 What Kan I Do 155
9.1.1 從多層感知機的數學原理開始 156
9.1.2 KAN中的樣條函數 157
9.1.3 KAN的數學原理 159
9.1.4 KAN的PyTorch實現 163
9.1.5 結合KAN的Mamba文本生成實戰 168
9.2 xLSTM讓老架構再現生機 169
9.2.1 LSTM背景介紹 169
9.2.2 LSTM實戰演示 170
9.2.3 xLSTM簡介 175
9.2.4 xLSTM的PyTorch實現 177
9.2.5 基于xLSTM的文本生成實戰 188
9.3 本章小結 192
第10章 循環神經網絡詳解與切片時間序列預測 193
10.1 基于時間序列的溫度預測實戰 193
10.1.1 時間序列一維數據的準備與切片 194
10.1.2 基于GRU的時間序列模型設計 197
10.1.3 時間序列模型的訓練與預測 198
10.1.4 時間序列常用的損失函數詳解 200
10.2 循環神經網絡理論講解 201
10.2.1 什么是GRU 201
10.2.2 單向不行,那就雙向 203
10.3 融合Mamba與KAN架構的時間序列預測模型實戰 204
10.3.1 適配2D時間序列的MambaBlock模型設計 204
10.3.2 Mamba架構的時間序列模型訓練與預測 206
10.4 本章小結 206
第11章 明天下雨嗎:基于Jamba的天氣預測實戰 207
11.1 注意力機制與模型詳解 208
11.1.1 注意力機制詳解 208
11.1.2 自注意力機制 210
11.1.3 ticks和Layer Normalization 216
11.1.4 多頭自注意力 217
11.2 注意力機制的應用實踐:編碼器Encoder 220
11.2.1 編碼器的總體架構 220
11.2.2 回到輸入層:初始詞向量層和位置編碼器層 221
11.2.3 前饋層的實現 224
11.2.4 將多層模塊融合的TransformerBlock層 226
11.2.5 編碼器的實現 227
11.3 給注意力添加相對位置編碼RoPE 233
11.3.1 給注意力添加相對位置編碼RoPE 233
11.3.2 添加旋轉位置編碼的注意力機制 235
11.3.3 基于現有庫包的旋轉位置編碼RoPE的使用 236
11.4 明天下雨嗎:基于Jamba的天氣預測實戰 237
11.4.1 Jamba模型的基本架構 237
11.4.2 Jamba架構的實現1:修正后的Transformer模塊 238
11.4.3 Jamba架構的實現2:Mamba模塊 242
11.4.4 Jamba架構的實現3:Jamba模型的實現 245
11.4.5 基于Jamba的天氣預測實戰 246
11.4.6 基于時間序列的天氣預報任務 253
11.5 本章小結 254
第12章 統一了注意力與Mamba架構的Mamba2模型 255
12.1 Mamba2模型的實現 256
12.1.1 Mamba2核心組件SSD詳解 256
12.1.2 基于SSD的Mamba2模型 259
12.2 基于Mamba2的文本生成實戰 263
12.2.1 文本生成Mamba2模型的完整實現 263
12.2.2 基于Mamba2的文本生成 264
12.3 本章小結 265
第13章 Mamba結合Diffusion的圖像生成實戰 266
13.1 Diffusion原理精講以及經典實現 267
13.1.1 Diffusion Model的傳播流程 267
13.1.2 直接運行的經典DDPM的模型訓練實戰 269
13.1.3 DDPM模型的基本模塊說明 272
13.1.4 DDPM加噪與去噪詳解:結合成功運行的Diffusion Model代碼 275
13.1.5 DDPM的損失函數:結合成功運行的Diffusion Model代碼 281
13.2 基于注意力的可控Diffusion實現 281
13.2.1 Diffusion Model可控生成的基礎:特征融合 282
13.2.2 DiT中的可控特征融合 282
13.2.3 DiT模型的設計 285
13.2.4 圖像的加噪與模型訓練 289
13.2.5 基于DiT模型的可控圖像生成 293
13.3 基于Mamba的可控Diffusion實現 295
13.3.1 基于Mamba架構的模塊生成 296
13.3.2 基于Mamba的Dim模型的設計 299
13.4 本章小結 303
第14章 Mamba實戰1:知識圖譜的構建與展示 305
14.1 什么是知識圖譜 305
14.1.1 知識圖譜的應用 306
14.1.2 知識圖譜中的三元組 307
14.2 知識圖譜的可視化展示 308
14.2.1 數據的準備與處理 308
14.2.2 知識圖譜的可視化展示 309
14.3 分詞與數據的編碼與解碼 312
14.3.1 分詞器Tokenizer的構建與使用 312
14.3.2 數據的編碼處理 315
14.3.3 數據的解碼處理 319
14.4 基于Mamba的知識圖譜模型構建 321
14.4.1 基于Mamba的知識圖譜模型構建 321
14.4.2 基于Mamba的知識圖譜模型訓練與預測 322
14.4.3 命名實體識別在預測時的補充說明 325
14.5 本章小結 326
第15章 Mamba實戰2:基于特征詞的語音喚醒 327
15.1 音頻特征工具Librosa包的基礎使用 327
15.1.1 基于Librosa的音頻信號讀取 328
15.1.2 基于Librosa的音頻多特征提取 331
15.2 Mamba實戰:基于特征詞的語音喚醒 333
15.2.1 數據的準備 333
15.2.2 數據的處理 334
15.2.3 模型的設計 337
15.2.4 模型的數據輸入方法 338
15.2.5 模型訓練 338
15.2.6 模型結果展示 340
15.3 本章小結 340
第16章 Mamba實戰3:多模態視覺問答 341
16.1 視覺問答數據集的準備 341
16.1.1 VQA數據集介紹 342
16.1.2 VQA數據集的下載與預處理 342
16.1.3 VQA數據集的準備 346
16.2 Mamba架構的多模態視覺問答模型的訓練與推斷 348
16.2.1 Mamba架構的多模態視覺問答模型的設計 348
16.2.2 多模態視覺問答模型的訓練與推斷 351
16.3 本章小結 353

展開全部

深入探索MAMBA模型架構與應用 作者簡介

王曉華,高校計算機專業講師,研究方向為云計算、大數據與人工智能。其著作包括《深入探索Mamba模型架構與應用》《DeepSeek大模型高性能核心技術與多模態融合開發》《PyTorch深度學習與計算機視覺實踐》《PyTorch語音識別實戰》《ChatGLM3大模型本地化部署、應用開發與微調》《從零開始大模型開發與微調:基于PyTorch與ChatGLM》《PyTorch 2.0深度學習從零開始學》《Spark 3.0大數據分析與挖掘:基于機器學習》《TensorFlow深度學習應用實踐》《OpenCV TensorFlow深度學習與計算機視覺實戰》《TensorFlow語音識別實戰》《TensorFlow 2.0卷積神經網絡實戰》《深度學習的數學原理與實現》。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 塑料脸盆批发,塑料盆生产厂家,临沂塑料广告盆,临沂家用塑料盆-临沂市永顺塑业 | 济南品牌包装设计公司_济南VI标志设计公司_山东锐尚文化传播 | 骨灰存放架|骨灰盒寄存架|骨灰架厂家|智慧殡葬|公墓陵园管理系统|网上祭奠|告别厅智能化-厦门慈愿科技 | 金属管浮子流量计_金属转子流量计厂家-淮安润中仪表科技有限公司 | 江苏密集柜_电动_手动_移动_盛隆柜业江苏档案密集柜厂家 | 滑板场地施工_极限运动场地设计_滑板公园建造_盐城天人极限运动场地建设有限公司 | 神超官网_焊接圆锯片_高速钢锯片_硬质合金锯片_浙江神超锯业制造有限公司 | 济南保安公司加盟挂靠-亮剑国际安保服务集团总部-山东保安公司|济南保安培训学校 | 事迹材料_个人事迹名人励志故事| 拉伸膜,PE缠绕膜,打包带,封箱胶带,包装膜厂家-东莞宏展包装 | ICP备案查询_APP备案查询_小程序备案查询 - 备案巴巴 | 上海律师咨询_上海法律在线咨询免费_找对口律师上策法网-策法网 广东高华家具-公寓床|学生宿舍双层铁床厂家【质保十年】 | 宝元数控系统|对刀仪厂家|东莞机器人控制系统|东莞安川伺服-【鑫天驰智能科技】 | 肉嫩度仪-凝胶测试仪-国产质构仪-气味分析仪-上海保圣实业发展有限公司|总部 | atcc网站,sigma试剂价格,肿瘤细胞现货,人结肠癌细胞株购买-南京科佰生物 | 安徽千住锡膏_安徽阿尔法锡膏锡条_安徽唯特偶锡膏_卡夫特胶水-芜湖荣亮电子科技有限公司 | 环氧乙烷灭菌器_压力蒸汽灭菌器_低温等离子过氧化氢灭菌器 _低温蒸汽甲醛灭菌器_清洗工作站_医用干燥柜_灭菌耗材-环氧乙烷灭菌器_脉动真空压力蒸汽灭菌器_低温等离子灭菌设备_河南省三强医疗器械有限责任公司 | 陶瓷砂磨机,盘式砂磨机,棒销式砂磨机-无锡市少宏粉体科技有限公司 | 厚壁钢管-厚壁无缝钢管-小口径厚壁钢管-大口径厚壁钢管 - 聊城宽达钢管有限公司 | 上海租奔驰_上海租商务车_上海租车网-矢昂汽车服务公司 | CE认证_FCC认证_CCC认证_MFI认证_UN38.3认证-微测检测 CNAS实验室 | 头条搜索极速版下载安装免费新版,头条搜索极速版邀请码怎么填写? - 欧远全 | 土壤检测仪器_行星式球磨仪_土壤团粒分析仪厂家_山东莱恩德智能科技有限公司 | 杰福伦_磁致伸缩位移传感器_线性位移传感器-意大利GEFRAN杰福伦-河南赉威液压科技有限公司 | SRRC认证_电磁兼容_EMC测试整改_FCC认证_SDOC认证-深圳市环测威检测技术有限公司 | 电车线(用于供电给电车的输电线路)-百科| 行吊_电动单梁起重机_双梁起重机_合肥起重机_厂家_合肥市神雕起重机械有限公司 | 拉力机-拉力试验机-万能试验机-电子拉力机-拉伸试验机-剥离强度试验机-苏州皖仪实验仪器有限公司 | 数显恒温培养摇床-卧式/台式恒温培养摇床|朗越仪器 | 东风体检车厂家_公共卫生体检车_医院体检车_移动体检车-锦沅科贸 | 珠海白蚁防治_珠海灭鼠_珠海杀虫灭鼠_珠海灭蟑螂_珠海酒店消杀_珠海工厂杀虫灭鼠_立净虫控防治服务有限公司 | 短信通106短信接口验证码接口群发平台_国际短信接口验证码接口群发平台-速度网络有限公司 | 仿古瓦,仿古金属瓦,铝瓦,铜瓦,铝合金瓦-西安东申景观艺术工程有限公司 | 自动化改造_智虎机器人_灌装机_贴标机-上海圣起包装机械 | 分类168信息网 - 分类信息网 免费发布与查询 | 不锈钢水箱生产厂家_消防水箱生产厂家-河南联固供水设备有限公司 | 双舌接地线-PC68数字式高阻计-ZC36|苏海百科 | 行吊_电动单梁起重机_双梁起重机_合肥起重机_厂家_合肥市神雕起重机械有限公司 | 综合管廊模具_生态,阶梯护坡模具_检查井模具制造-致宏模具厂家 | 洗地机_全自动洗地机_手推式洗地机【上海滢皓环保】 | 福建自考_福建自学考试网 |