中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
大模型原理與技術

包郵 大模型原理與技術

作者:魏明強
出版社:電子工業出版社出版時間:2024-10-01
開本: 16開
本類榜單:教材銷量榜
中 圖 價:¥47.9(6.9折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大模型原理與技術 版權信息

大模型原理與技術 內容簡介

大模型作為人工智能技術的重要發展方向,逐漸成為未來科技發展的重要方向之一。基于此,本書重點介紹與大模型相關的基礎知識、原理與技術。本書分為14章,內容包括深度學習基礎、自然語言處理、大模型網絡結構、大模型訓練與優化、大模型微調及相關應用案例等。全書強調內容的科學性與系統性,從大模型歷史發展脈絡、理論基礎、構建方法到應用場景,循序漸進地全面講解大模型技術。本書聚焦于大模型在不同領域的擴展應用,提供了應用案例的全方位學習路徑,旨在培養和提升學生的實踐和創造能力。每章都提供了相應的習題,供學生練習和鞏固知識。同時,本書通過介紹開源框架"計圖”、華為芯片、航空航天裝備制造等知識,可以讓學生了解更多國產技術。 本書提供了電子課件及習題參考答案等配套資源,可登錄華信教育資源網(www.hxedu.com.cn)下載。本書適合作為科研院所和本科院校計算機、人工智能、機械制造與自動化等相關專業的教材,也可以作為高職高專院校的教學參考書。

大模型原理與技術 目錄

目 錄第1章 緒論 11.1 大模型基本概念 21.2 大模型發展歷程 41.2.1 從技術架構看發展歷程 51.2.2 從參數規模看發展歷程 61.2.3 從模態支持看發展歷程 61.2.4 從應用領域看發展歷程 61.3 大模型關鍵技術及訓練流程 71.3.1 大模型關鍵技術 71.3.2 大模型訓練流程 91.4 本書內容安排 111.5 思考 12習題1 13目 錄 第1章 緒論 1 1.1 大模型基本概念 2 1.2 大模型發展歷程 4 1.2.1 從技術架構看發展歷程 5 1.2.2 從參數規模看發展歷程 6 1.2.3 從模態支持看發展歷程 6 1.2.4 從應用領域看發展歷程 6 1.3 大模型關鍵技術及訓練流程 7 1.3.1 大模型關鍵技術 7 1.3.2 大模型訓練流程 9 1.4 本書內容安排 11 1.5 思考 12 習題1 13 第2章 深度學習基礎 14 2.1 神經網絡基礎 14 2.1.1 神經網絡 14 2.1.2 卷積神經網絡 18 2.2 損失函數和優化算法 24 2.2.1 損失函數 24 2.2.2 優化算法 26 2.3 神經網絡訓練 29 2.3.1 梯度和鏈式法則 29 2.3.2 前向傳播與反向傳播 30 2.3.3 訓練神經網絡示例 32 2.4 深度學習框架 34 2.4.1 主流深度學習框架 34 2.4.2 框架選擇和優缺點比較 36 2.5 思考 37 習題2 38 第3章 自然語言處理 40 3.1 自然語言處理概述 40 3.1.1 基本任務 40 3.1.2 發展歷程 42 3.1.3 應用領域 43 3.2 詞嵌入 44 3.2.1 獨熱向量 44 3.2.2 Word2vec 45 3.2.3 代碼示例 48 3.3 循環神經網絡 50 3.3.1 循環神經網絡介紹 50 3.3.2 循環神經網絡訓練 51 3.3.3 循環神經網絡梯度問題 52 3.3.4 雙向循環神經網絡 53 3.4 長短期記憶網絡 54 3.4.1 長短期記憶網絡介紹 55 3.4.2 長短期記憶網絡應用 57 3.5 門控循環單元 61 3.5.1 門控循環單元介紹 62 3.5.2 門控循環單元應用 63 3.6 思考 67 習題3 68 第4章 大模型網絡結構 69 4.1 Transformer 69 4.1.1 注意力機制 71 4.1.2 編碼器-解碼器結構 80 4.1.3 大模型中的編碼器-解碼器結構 84 4.2 編碼器結構—BERT家族 87 4.2.1 BERT結構 87 4.2.2 預訓練策略 89 4.2.3 BERT的變體 92 4.3 解碼器結構—GPT家族 95 4.3.1 GPT結構 96 4.3.2 自回歸預訓練 98 4.3.3 后續改進 100 4.4 思考 104 習題4 105 第5章 大模型訓練與優化 106 5.1 訓練數據準備 106 5.1.1 數據獲取 106 5.1.2 數據預處理 109 5.1.3 數據增強 111 5.1.4 數據配比與課程設置 114 5.1.5 開源數據集 115 5.2 并行化和分布式訓練 118 5.2.1 大模型訓練的挑戰 118 5.2.2 并行策略 118 5.2.3 節點間數據通信 120 5.2.4 分布式訓練框架 123 5.3 模型壓縮 126 5.3.1 量化 127 5.3.2 剪枝 132 5.3.3 知識蒸餾 136 5.4 華為芯片助力大模型訓練與部署 138 5.4.1 Ascend AI芯片 139 5.4.2 Atlas系列硬件 139 5.4.3 異構計算架構CANN 139 5.4.4 深度學習框架MindSpore 140 5.4.5 應用使能與行業應用 140 5.5 思考 140 習題5 142 第6章 大模型微調 144 6.1 大模型微調概述 144 6.2 參數高效微調 146 6.2.1 增量式微調 146 6.2.2 指定式微調 150 6.2.3 重參數化微調 151 6.2.4 混合微調 156 6.2.5 小結 157 6.3 指令微調 158 6.3.1 指令數據集構建 159 6.3.2 指令微調階段 160 6.4 基于人類反饋的強化學習微調 161 6.4.1 獎勵建模 162 6.4.2 強化學習微調 163 6.4.3 案例講解 164 6.5 思考 166 習題6 166 第7章 大模型提示工程 168 7.1 提示工程簡介 168 7.2 零樣本提示 169 7.3 少樣本提示 176 7.4 鏈式思考提示 177 7.4.1 思維鏈提示工程概述 177 7.4.2 零樣本思維鏈 180 7.4.3 思維鏈拓展 180 7.5 思維樹提示 181 7.6 檢索增強生成 185 7.7 自動提示工程 185 7.8 思考 187 習題7 188 第8章 高效大模型策略 190 8.1 大模型效率概述 190 8.1.1 大模型效率面臨的問題 190 8.1.2 大模型效率及其評估指標 190 8.2 預算效率策略:縮放定律 192 8.3 數據效率策略 193 8.3.1 數據過濾 193 8.3.2 主動學習/重要性采樣 194 8.3.3 課程學習 194 8.4 架構效率策略 195 8.4.1 高效注意力 195 8.4.2 高效位置編碼 196 8.4.3 稀疏模型 197 8.4.4 無注意力模型 197 8.5 訓練效率策略 197 8.5.1 穩定訓練策略 198 8.5.2 混合精度訓練 198 8.5.3 并行訓練技術 199 8.5.4 內存優化 200 8.6 推理效率策略 200 8.6.1 剪枝 201 8.6.2 知識蒸餾 201 8.6.3 量化 202 8.6.4 低秩分解 202 8.7 微調效率策略 203 8.7.1 參數高效微調 203 8.7.2 數據高效調整 204 8.8 思考 204 習題8 205 第9章 單模態通用大模型 206 9.1 LLaMA:一種自然語言處理大模型 206 9.1.1 模型結構 206 9.1.2 預訓練 209 9.1.3 微調 209 9.1.4 使用方法 211 9.2 SAM:一種圖像分割大模型 211 9.2.1 概述 212 9.2.2 提示下的圖像分割任務 212 9.2.3 SAM模型架構 212 9.2.4 SA-1B:大規模掩碼數據集 216 9.2.5 SAM在各視覺任務中的應用 217 9.2.6 SAM的使用方法 218 9.3 AudioLM:讓AI為你譜曲寫歌 219 9.3.1 概述 219 9.3.2 AudioLM的組件構成 219 9.3.3 AudioLM的訓練方式 220 9.3.4 AudioLM的安裝與使用 225 9.3.5 AudioLM的推理應用 225 9.4 Zero-1-to-3:二生三維 226 9.4.1 概述 226 9.4.2 Zero-1-to-3模型結構 227 9.4.3 Zero-1-to-3的使用 229 9.5 思考 231 習題9 231 第10章 多模態通用大模型 232 10.1 多模態數據集介紹 232 10.1.1 GQA數據集 232 10.1.2 HowTo100M數據集 233 10.1.3 Conceptual-12M數據集 234 10.1.4 YT-Temporal-180M數據集 234 10.1.5 WebVid-2M數據集 234 10.1.6 ModelNet數據集 234 10.1.7 ShapeNet數據集 235 10.1.8 ScanObjectNN數據集 235 10.1.9 KITTI數據集 236 10.1.10 nuScenes數據集 236 10.1.11 Waymo數據集 237 10.2 CLIP:探索圖文結合的奧秘 238 10.2.1 概述 238 10.2.2 模型架構 239 10.2.3 訓練過程 242 10.2.4 CLIP相關應用 244 10.2.5 CLIP的不足 247 10.3 GPT-4V:大模型視覺能力的新篇章 248 10.3.1 輸入模式 248 10.3.2 工作方式 249 10.3.3 視覺語言能力 251 10.4 ImageBind:多感官統一 255 10.4.1 概述 255 10.4.2 多模態特征編碼與對齊 256 10.4.3 數據集的靈活應用 257 10.4.4 相關應用 257 10.4.5 使用方法 258 10.5 3D-LLM:將三維世界注入大模型 260 10.5.1 三維語言數據生成 260 10.5.2 3D-LLM訓練方式 261 10.5.3 3D-LLM安裝與實現細節 263 10.5.4 3D-LLM應用圖譜 264 10.6 Sora:文生視頻 265 10.6.1 Sora為視頻生成帶來的改變 266 10.6.2 Sora的局限性與爭議 268 10.7 思考 268 習題10 269 第11章 大模型評測 271 11.1 大模型評測概述 271 11.2 知識和能力評測 272 11.2.1 問答能力 272 11.2.2 知識補全能力 272 11.2.3 推理能力 272 11.2.4 工具學習能力 274 11.3 對齊評測 274 11.3.1 倫理道德 275 11.3.2 偏見 275 11.3.3 有害內容 276 11.3.4 真實性 276 11.4 安全評測 277 11.4.1 魯棒性評測 277 11.4.2 風險評測 278 11.5 行業大模型評測 278 11.5.1 醫學 278 11.5.2 教育學 279 11.5.3 計算機科學 279 11.5.4 金融學 280 11.6 思考 280 習題11 281 第12章 大模型主要應用場景 283 12.1 大模型產業圖譜 283 12.2 大模型軍事智能應用 284 12.3 大模型教育教學應用 286 12.4 大模型醫療健康應用 288 12.5 大模型工業應用 289 12.6 大模型氣象預報應用 292 12.7 大模型測繪應用 294 12.8 思考 295 習題12 296 第13章 基于大模型的智能軟件研發 297 13.1 基于大模型的智能軟件研發框架 297 13.2 智能軟件研發中的大模型技術 298 13.2.1 常用大模型 298 13.2.2 預訓練范式 299 13.3 智能軟件研發中的下游任務 300 13.3.1 程序語言相關任務 301 13.3.2 自然語言相關任務 308 13.3.3 程序語言與自然語言交互任務 311 13.4 常用數據集 317 13.4.1 預訓練數據集 317 13.4.2 下游任務數據集 318 13.5 思考 320 習題13 321 第14章 基于大模型的航空航天裝備制造 323 14.1 大模型在大飛機制造中的應用 323 14.1.1 大飛機制造概述 323 14.1.2 設計和優化中的應用 324 14.2 大模型在航空發動機中的應用 327 14.2.1 航空發動機概述 327 14.2.2 具體應用場景 328 14.3 大模型在航空機載設備與系統中的應用 330 14.3.1 航空機載設備與系統概述 330 14.3.2 具體應用場景 330 14.4 大模型在無人機智能集群中的應用 332 14.4.1 無人機智能集群概述 332 14.4.2 具體應用場景 334 14.4.3 典型應用案例 334 14.5 思考 337 習題14 338 參考文獻 339
展開全部

大模型原理與技術 作者簡介

魏明強,國家優青、教授、博士生導師。博士畢業于香港中文大學并獲最佳博士畢業論文獎(2014)。近年來,圍繞大飛機3D掃描與測量、幾何深度學習和三維視覺等研究方向,主持國防基礎科研、國家重點研發計劃子課題、國自然優青/面上/青年以及聯合主持國自然重點項目等10余項;發表學術論文150余篇,如IEEE TPAMI、CVPR等CCF A類期刊和會議,相關技術用在多個國家重點型號工程。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 粉丝机械,粉丝烘干机,粉丝生产线-招远市远东粉丝机械有限公司 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 土壤水分自动监测站-SM150便携式土壤水分仪-铭奥仪器 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | 海外仓系统|国际货代系统|退货换标系统|WMS仓储系统|海豚云 | 技德应用| 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 防爆电机生产厂家,YBK3电动机,YBX3系列防爆电机,YBX4节防爆电机--河南省南洋防爆电机有限公司 | 江苏齐宝进出口贸易有限公司 | 真空干燥烘箱_鼓风干燥箱 _高低温恒温恒湿试验箱_光照二氧化碳恒温培养箱-上海航佩仪器 | SDG吸附剂,SDG酸气吸附剂,干式酸性气体吸收剂生产厂家,超过20年生产使用经验。 - 富莱尔环保设备公司(原名天津市武清县环保设备厂) | 国标白水泥,高标号白水泥,白水泥厂家-淄博华雪建材有限公司 | RO反渗透设备_厂家_价格_河南郑州江宇环保科技有限公司 | 成都治疗尖锐湿疣比较好的医院-成都治疗尖锐湿疣那家医院好-成都西南皮肤病医院 | 合肥活动房_安徽活动板房_集成打包箱房厂家-安徽玉强钢结构集成房屋有限公司 | 上海小程序开发-上海小程序制作公司-上海网站建设-公众号开发运营-软件外包公司-咏熠科技 | 蔬菜清洗机_环速洗菜机_异物去除清洗机_蔬菜清洗机_商用洗菜机 - 环速科技有限公司 | 大型低温冷却液循环泵-低温水槽冷阱「厂家品牌」京华仪器_京华仪器 | BESWICK球阀,BESWICK接头,BURKERT膜片阀,美国SEL继电器-东莞市广联自动化科技有限公司 | YJLV22铝芯铠装电缆-MYPTJ矿用高压橡套电缆-天津市电缆总厂 | 施工电梯_齿条货梯_烟囱电梯_物料提升机-河南大诚机械制造有限公司 | 合肥网络推广_合肥SEO网站优化-安徽沃龙First | ★塑料拖链__工程拖链__电缆拖链__钢制拖链 - 【上海闵彬】 | 上海璟文空运首页_一级航空货运代理公司_机场快递当日达 | 粒米特测控技术(上海)有限公司-测功机_减速机测试台_电机测试台 | TPE塑胶原料-PPA|杜邦pom工程塑料、PPSU|PCTG材料、PC/PBT价格-悦诚塑胶 | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 油漆辅料厂家_阴阳脚线_艺术漆厂家_内外墙涂料施工_乳胶漆专用防霉腻子粉_轻质粉刷石膏-魔法涂涂 | 广州冷却塔维修厂家_冷却塔修理_凉水塔风机电机填料抢修-广东康明节能空调有限公司 | 蜘蛛车-高空作业平台-升降机-高空作业车租赁-臂式伸缩臂叉装车-登高车出租厂家 - 普雷斯特机械设备(北京)有限公司 | 丝印油墨_水性油墨_环保油墨油漆厂家_37国际化工 | 西宁装修_西宁装修公司-西宁业之峰装饰-青海业之峰墅级装饰设计公司【官网】 | 锤式粉碎机,医药粉碎机,锥式粉碎机-无锡市迪麦森机械制造有限公司 | 吲哚菁绿衍生物-酶底物法大肠菌群检测试剂-北京和信同通科技发展有限公司 | 成都办公室装修-办公室设计-写字楼装修设计-厂房装修-四川和信建筑装饰工程有限公司 | 论文查重_免费论文查重_知网学术不端论文查重检测系统入口_论文查重软件 | loft装修,上海嘉定酒店式公寓装修公司—曼城装饰 | 河南卓美创业科技有限公司-河南卓美防雷公司-防雷接地-防雷工程-重庆避雷针-避雷器-防雷检测-避雷带-避雷针-避雷塔、机房防雷、古建筑防雷等-山西防雷公司 | 上海公众号开发-公众号代运营公司-做公众号的公司企业服务商-咏熠软件 | 3d打印服务,3d打印汽车,三维扫描,硅胶复模,手板,快速模具,深圳市精速三维打印科技有限公司 | hdpe土工膜-防渗膜-复合土工膜-长丝土工布价格-厂家直销「恒阳新材料」-山东恒阳新材料有限公司 ETFE膜结构_PTFE膜结构_空间钢结构_膜结构_张拉膜_浙江萬豪空间结构集团有限公司 |