中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
>
DeepSeek大模型實戰指南 架構、部署與應用

包郵 DeepSeek大模型實戰指南 架構、部署與應用

出版社:化學工業出版社出版時間:2025-05-01
開本: 16開 頁數: 316
中 圖 價:¥52.6(5.9折) 定價  ¥89.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

DeepSeek大模型實戰指南 架構、部署與應用 版權信息

  • ISBN:9787122475718
  • 條形碼:9787122475718 ; 978-7-122-47571-8
  • 裝幀:平裝
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:

DeepSeek大模型實戰指南 架構、部署與應用 內容簡介

本書系統闡述了DeepSeek大模型架構、部署及應用實戰的相關內容。從人工智能和大模型的基礎理論出發,深入剖析了DeepSeek的底層技術,如Transformer架構、混合專家、動態任務分配、稀疏激活及歸一化等關鍵技術,并詳細介紹了模型訓練、優化和推理的前沿方法。書中不僅展示了DeepSeek在多模態模型和推理系統中的技術優勢,還提供了豐富的實戰案例,涵蓋了從本地部署到云端應用,再到與辦公軟件、開發工具和Web交互系統的無縫集成。通過理論解析與實踐演示,讀者將獲得從模型設計到實際應用全流程的詳細指導。
本書非常適合人工智能領域的技術開發者、系統架構師,以及初探大模型應用的愛好者學習,也可用作高等院校相關專業的教材及參考書。

DeepSeek大模型實戰指南 架構、部署與應用DeepSeek大模型實戰指南 架構、部署與應用 前言

DeepSeek作為大模型與多模態技術領域的一項前沿創新,正以前所未有的速度推動著人工智能的發展與應用。從智能問答、跨平臺協作到多模態內容生成,DeepSeek不僅在理論上實現了架構設計的突破,更在實際場景中展現了強大的適應性和高效性能。隨著算法優化、算力提升和數據智能化的不斷演進,傳統生成模型在面對海量信息和復雜任務時的局限性逐漸顯現,而DeepSeek憑借其混合專家架構、動態任務分配及稀疏激活機制等核心技術,為解決這一挑戰提供了全新的思路和方法。
本書系統地介紹了DeepSeek的基礎理論、底層架構及關鍵技術,從Transformer原理、混合專家到多模態模型和推理系統,全方位解析了DeepSeek在模型訓練、優化和應用部署中的創新實踐。書中不僅詳細闡述了從本地部署到云端應用的全流程解決方案,還通過豐富的實際案例,展示了DeepSeek在智能對話、辦公自動化、代碼生成與補全等多領域的成功落地應用。
本書的特色
本書以DeepSeek的核心技術為主線,結合理論分析與實踐案例,系統講解了大模型的架構、優化及應用,旨在幫助讀者快速掌握DeepSeek的開發與落地。以下是本書的主要特色:
1.全面解析DeepSeek底層架構

DeepSeek大模型實戰指南 架構、部署與應用 目錄

第1章 人工智能和DeepSeek概述 001
1.1 人工智能 002
1.1.1 什么是人工智能 002
1.1.2 人工智能的起源與發展歷程 003
1.2 大模型 003
1.2.1 大模型的原理和作用 004
1.2.2 大模型的興起與現狀 004
1.2.3 主流大模型介紹 005
1.3 DeepSeek 006
1.3.1 DeepSeek簡介 007
1.3.2 DeepSeek對人工智能市場的影響 007
1.3.3 DeepSeek的產品 008
1.3.4 DeepSeek的應用場景 009
1.3.5 DeepSeek與其他模型的技術對比 010

第2章 DeepSeek底層架構技術 014
2.1 Transformer架構技術 015
2.1.1 Transformer簡介 015
2.1.2 Transformer的核心組件 015
2.1.3 多頭注意力機制 017
2.1.4 多頭潛在注意力 017
2.2 動態任務分配 018
2.2.1 動態任務分配的特點和原理 018
2.2.2 動態任務分配的應用場景 019
2.3 稀疏激活機制 022
2.3.1 稀疏激活機制簡介 022
2.3.2 稀疏激活機制的實現方式 023
2.3.3 稀疏激活機制的應用領域 026
2.4 混合專家架構技術 027
2.4.1 混合專家架構簡介 028
2.4.2 MoE的特點 028
2.4.3 MoE的應用 030
2.4.4 DeepSeek中的MoE 031
2.5 歸一化技術 032
2.5.1 歸一化技術的必要性 032
2.5.2 LayerNorm技術 032
2.5.3 RMSNorm技術 033
2.6 模型訓練與優化技術 034
2.6.1 多令牌預測(MTP)技術 034
2.6.2 高效并行策略 035
2.6.3 混合精度訓練與量化策略 036
2.6.4 EMA顯存優化 037
2.6.5 頭尾參數共享 038

第3章 DeepSeekMoE架構 039
3.1 DeepSeekMoE架構簡介 040
3.1.1 背景 040
3.1.2 DeepSeekMoE架構策略 041
3.1.3 DeepSeekMoE與傳統MoE架構的區別 041
3.2 DeepSeekMoE架構詳解 042
3.2.1 細粒度專家細分 042
3.2.2 共享專家隔離 043
3.2.3 負載平衡 043
3.3 DeepSeekMoE的微調 045
3.3.1 DeepSeekMoE微調技術介紹 045
3.3.2 ZeRO優化 046
3.3.3 具體實現 047
3.4 性能評估 051
3.4.1 訓練數據和分詞 051
3.4.2 硬件基礎設施 052
3.4.3 設置超參數 052
3.4.4 評估基準 053
3.4.5 評估結果 054
3.4.6 和稠密模型的對比 056
3.4.7 DeepSeekMoE 2B模型測試 057
3.5 消融研究 058
3.5.1 消融研究介紹 058
3.5.2 消融研究在大模型中的應用 059
3.5.3 DeepSeekMoE的消融研究 059
3.6 DeepSeekMoE 16B測試 060
3.6.1 訓練數據和分詞 060
3.6.2 設置超參數 061
3.6.3 評估基準 062
3.7 DeepSeekMoE 16B的對齊 063
3.7.1 測試設置 063
3.7.2 評估結果 064

第4章 DeepSeek多模態大模型架構 067
4.1 DeepSeek多模態大模型的發展歷程 068
4.2 Janus模型架構 069
4.2.1 架構簡介 069
4.2.2 多模態理解 070
4.2.3 視覺生成路徑 073
4.2.4 自回歸Transformer 076
4.2.5 三階段訓練策略(Three-Stage Training Procedure) 078
4.2.6 Janus模型的推理與擴展性 078
4.3 Janus-Pro架構 079
4.3.1 解耦視覺編碼 079
4.3.2 訓練策略 080
4.3.3 優化訓練策略 082
4.3.4 數據擴展策略 083
4.3.5 模型規模擴展 084
4.4 JanusFlow架構 085
4.4.1 實現多模態模型 086
4.4.2 結合自回歸語言模型與Rectified Flow 090
4.4.3 采用任務解耦的編碼器 (Decoupled Encoder Design) 091
4.4.4 U-ViT模型 091
4.4.5 三階段訓練策略 092
4.4.6 實驗結果 092
4.5 DeepSeek-VL2多模態視覺模型 094
4.5.1 模型架構 094
4.5.2 技術創新與亮點 096
4.5.3 模型訓練 097
4.5.4 和Janus項目的對比 098

第5章 DeepSeek推理模型架構 100
5.1 背景 101
5.2 DeepSeek-R1模型簡介 101
5.2.1 DeepSeek-R1模型演進 101
5.2.2 DeepSeek-R1模型的基本架構 102
5.2.3 訓練方案 103
5.2.4 開源信息 104
5.3 推理模型的相關技術 105
5.3.1 混合專家(MoE)架構 105
5.3.2 多頭潛在注意力 106
5.3.3 強化學習 107
5.4 DeepSeek-R1-Zero訓練方案 108
5.4.1 強化學習算法 109
5.4.2 獎勵建模 110
5.4.3 訓練模板 112
5.4.4 DeepSeek-R1-Zero的自我進化過程 112
5.4.5 在DeepSeek-R1-Zero的“頓悟時刻” 114
5.4.6 DeepSeek-R1-Zero性能測試 115
5.5 DeepSeek-R1訓練方案 115
5.5.1 冷啟動 116
5.5.2 推理導向的強化學習 117
5.5.3 拒絕采樣和監督微調 118
5.5.4 全場景強化學習 120
5.6 蒸餾處理 122
5.6.1 AI大模型中的蒸餾處理 122
5.6.2 基礎模型的選擇與蒸餾過程 124
5.6.3 模型蒸餾的技術原理 125
5.6.4 評估蒸餾模型 126
5.6.5 小結 127

第6章 DeepSeek模型的本地部署 128
6.1 本地部署的優勢與常見挑戰 129
6.2 Ollama本地部署 130
6.2.1 安裝Ollama 130
6.2.2 DeepSeek模型的安裝與配置 132
6.2.3 基于本地DeepSeek模型的對話程序 134
6.3 LM Studio本地可視化部署 137
6.3.1 LM Studio的特點與安裝 137
6.3.2 安裝并配置DeepSeek模型 139
6.3.3 LM Studio API 142
6.3.4 使用Dify調用LM Studio模型 144
6.4 Chatbox本地部署 146
6.4.1 Chatbox簡介 146
6.4.2 Chatbox Ollama的本地部署 147
6.5 基于Ollama Docker Open WebUI的本地部署 151
6.5.1 Open WebUI簡介 151
6.5.2 Docker簡介 152
6.5.3 使用Docker部署OpenWebUI容器 153

第7章 DeepSeek接入實戰 157
7.1 DeepSeek API基礎知識 158
7.1.1 DeepSeek API簡介 158
7.1.2 DeepSeek API基本教程 158
7.1.3 基于DeepSeek API的對話程序 161
7.2 DeepSeek的基本接入實戰 162
7.2.1 接入Chatbox 162
7.2.2 NextChat接入實戰 165
7.3 社交媒體工具接入實戰 170
7.3.1 基于茴香豆 DeepSeek打造微信聊天機器人 170
7.3.2 基于LangBot DeepSeek打造QQ機器人 174
7.4 將DeepSeek接入到Office 179
7.4.1 OfficeAI簡介 179
7.4.2 將DeepSeek接入Word 181
7.4.3 將DeepSeek接入Excel 185
7.5 將DeepSeek接入VS Code 189
7.5.1 Continue基礎 189
7.5.2 接入DeepSeek 191
7.5.3 調用DeepSeek生成代碼 192
7.5.4 DeepSeek代碼智能生成和補全 193

第8章 DeepSeek遠程和云端部署 194
8.1 使用騰訊云部署DeepSeek 195
8.1.1 創建DeepSeek-R1應用 195
8.1.2 通過OpenWebUI使用DeepSeek模型 197
8.1.3 通過ChatbotUI使用DeepSeek模型 199
8.1.4 通過終端連接命令行使用DeepSeek模型 200
8.1.5 基于騰訊云和DeepSeek的個人知識庫 201
8.2 使用百度云部署DeepSeek 203
8.2.1 體驗已部署好的DeepSeek 203
8.2.2 部署自己的DeepSeek 206
8.2.3 基于DeepSeek模型的Agent 208
8.3 使用阿里云部署DeepSeek 212
8.3.1 開通人工智能平臺PAI 212
8.3.2 一鍵部署DeepSeek模型 213
8.3.3 基于DeepSeek打造釘釘聊天機器人 216

第9章 基于DeepSeek的Web聊天交互系統 221
9.1 項目背景 222
9.2 項目概況 222
9.2.1 主要功能 222
9.2.2 技術棧 223
9.2.3 安裝Node.js 224
9.3 配置文件和基礎工具函數 228
9.3.1 導航菜單配置 228
9.3.2 基礎工具函數 229
9.3.3 API交互工具函數 230
9.3.4 狀態管理邏輯函數 252
9.4 組件 261
9.4.1 頁面布局組件 262
9.4.2 設置組件 267
9.4.3 聊天組件 286
9.5 調試運行 297

參考文獻 299

展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 石家庄装修设计_室内家装设计_别墅装饰装修公司-石家庄金舍装饰官网 | 带式压滤机_污泥压滤机_污泥脱水机_带式过滤机_带式压滤机厂家-河南恒磊环保设备有限公司 | 南京雕塑制作厂家-不锈钢雕塑制作-玻璃钢雕塑制作-先登雕塑厂 | 2025黄道吉日查询、吉时查询、老黄历查询平台- 黄道吉日查询网 | 高压油管,液压接头,液压附件-烟台市正诚液压附件 | 开锐教育-学历提升-职称评定-职业资格培训-积分入户 | 环保袋,无纺布袋,无纺布打孔袋,保温袋,环保袋定制,环保袋厂家,环雅包装-十七年环保袋定制厂家 | 缠绕机|缠绕膜包装机|缠绕包装机-上海晏陵智能设备有限公司 | 罗茨真空机组,立式无油往复真空泵,2BV水环真空泵-力侨真空科技 | 深圳货架厂_仓库货架公司_重型仓储货架_线棒货架批发-深圳市诺普泰仓储设备有限公司 | 深圳宣传片制作-企业宣传视频制作-产品视频拍摄-产品动画制作-短视频拍摄制作公司 | 中国品牌门窗网_中国十大门窗品牌_著名门窗品牌 | 郑州水质检测中心_井水检测_河南废气检测_河南中环嘉创检测 | 乐考网-银行从业_基金从业资格考试_初级/中级会计报名时间_中级经济师 | 精准猎取科技资讯,高效阅读科技新闻_科技猎 | 煤棒机_增碳剂颗粒机_活性炭颗粒机_木炭粉成型机-巩义市老城振华机械厂 | 注浆压力变送器-高温熔体传感器-矿用压力传感器|ZHYQ朝辉 | 成都租车_成都租车公司_成都租车网_众行宝 | 飞行者联盟-飞机模拟机_无人机_低空经济_航空技术交流平台 | 鹤壁创新仪器公司-全自动量热仪,定硫仪,煤炭测硫仪,灰熔点测定仪,快速自动测氢仪,工业分析仪,煤质化验仪器 | 通用磨耗试验机-QUV耐候试验机|久宏实业百科 | 高防护蠕动泵-多通道灌装系统-高防护蠕动泵-www.bjhuiyufluid.com慧宇伟业(北京)流体设备有限公司 | 今日娱乐圈——影视剧集_八卦娱乐_明星八卦_最新娱乐八卦新闻 | 口信网(kousing.com) - 行业资讯_行业展会_行业培训_行业资料 | 北京翻译公司-专业合同翻译-医学标书翻译收费标准-慕迪灵 | 集菌仪_智能集菌仪_全封闭集菌仪_无菌检查集菌仪厂家-那艾 | DAIKIN电磁阀-意大利ATOS电磁阀-上海乾拓贸易有限公司 | 免费B2B信息推广发布平台 - 推发网 | 带式过滤机厂家_价格_型号规格参数-江西核威环保科技有限公司 | 手术示教系统-数字化手术室系统-林之硕医疗云智能视频平台 | 合肥仿石砖_合肥pc砖厂家_合肥PC仿石砖_安徽旭坤建材有限公司 | 哈希PC1R1A,哈希CA9300,哈希SC4500-上海鑫嵩实业有限公司 | 云南成人高考_云南成考网| 整车VOC采样环境舱-甲醛VOC预处理舱-多舱法VOC检测环境仓-上海科绿特科技仪器有限公司 | 中高频感应加热设备|高频淬火设备|超音频感应加热电源|不锈钢管光亮退火机|真空管烤消设备 - 郑州蓝硕工业炉设备有限公司 | 全自动包装机_灌装机生产厂家-迈驰包装设备有限公司 | 手术室净化厂家_成都实验室装修公司_无尘车间施工单位_洁净室工程建设团队-四川华锐16年行业经验 | 铝合金线槽_铝型材加工_空调挡水板厂家-江阴炜福金属制品有限公司 | 诗词大全-古诗名句 - 古诗词赏析 | 成都治疗尖锐湿疣比较好的医院-成都治疗尖锐湿疣那家医院好-成都西南皮肤病医院 | 高通量组织研磨仪-多样品组织研磨仪-全自动组织研磨仪-研磨者科技(广州)有限公司 |