中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大語言模型:原理與工程實踐

包郵 大語言模型:原理與工程實踐

作者:楊青
出版社:電子工業出版社出版時間:2024-03-01
開本: 16開 頁數: 260
中 圖 價:¥83.3(7.0折) 定價  ¥119.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大語言模型:原理與工程實踐 版權信息

  • ISBN:9787121473043
  • 條形碼:9787121473043 ; 978-7-121-47304-3
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

大語言模型:原理與工程實踐 本書特色

作者知名:軒轅大模型負責人:真正的大語言模型實踐者,擁有十億、百億、千億等不同參數規模大語言模型的訓練經驗 系統性強:從數據處理的基礎工作(如數據清洗與去重)講起,逐步深入,探討預訓練、微調技術和強化對齊技術等核心技術環節。同時,書中對大語言模型評估策略及其應用技術架構,包括推理引導技術和動態交互技術,進行了全面且深入的探討,確保讀者能夠從理論和技術角度全面理解大語言模型。 實踐性強:精心設計了從零開始的教學章節,提供大語言模型微調的詳細指導,逐步引領讀者掌握關鍵技能。 本書不僅有助于初學者迅速上手,也為有經驗的開發者提供了深入學習的機會 全彩印刷

大語言模型:原理與工程實踐 內容簡介

本書用10章對大語言模型進行全面且深入的介紹。 首先對大語言模型的基本概念進行介紹。其次,從大語言模型的基礎技術、預訓練數據構建、預訓練技術等方面展開討論,幫助讀者深入了解大語言模型的構建和訓練過程。然后,詳細介紹有監督微調和強化對齊等技術,以及如何評估大語言模型的性能。此外,介紹提示工程和工程實踐等方面的內容,幫助讀者了解大語言模型的應用和實際操作過程。*后,介紹如何從零開始微調大語言模型,輔以代碼示例,幫助讀者更好地應用這些技術。 通過閱讀本書,讀者可以獲得全面且深入的大語言模型的知識框架。

大語言模型:原理與工程實踐 目錄

目 錄
1 解鎖大語言模型1
1.1 什么是大語言模型·1
1.2 語言模型的發展·2
1.3 GPT 系列模型的發展·3
1.4 大語言模型的關鍵技術·4
1.5 大語言模型的涌現能力·5
1.6 大語言模型的推理能力·5
1.7 大語言模型的縮放定律·6
參考文獻·7
2 大語言模型基礎技術·8
2.1 語言表示介紹·8
2.1.1 詞表示技術·8
2.1.2 分詞技術·9
2.2 經典結構 Transformer·14
2.2.1 輸入模塊·15
2.2.2 多頭自注意力模塊·16
2.2.3 殘差連接與層歸一化·19
2.2.4 前饋神經網絡·19
2.2.5 解碼器·19
2.3 預訓練語言模型·21
2.3.1 Decoder 的代表:GPT 系列·21
2.3.2 Encoder 的代表:BERT·23
2.4 初探大語言模型·24
2.4.1 InstructGPT·24
2.4.2 LLaMA 系列·28
參考文獻·30
3 預訓練數據構建·32
3.1 數據的常見類別及其來源·32
3.1.1 網頁數據·33
3.1.2 書籍數據·34
3.1.3 百科數據·34
3.1.4 代碼數據·34
3.1.5 其他數據·36
3.2 數據的預處理方式·36
3.2.1 正文提取·37
3.2.2 質量過濾·37
3.2.3 文檔去重·38
3.2.4 數據集凈化·39
3.3 常用數據集的完整構建方式 ·40
3.3.1 C4·40
3.3.2 MassiveText·40
3.3.3 RefinedWeb·41
3.3.4 ROOTS·42
3.4 難點和挑戰·43
3.4.1 數據收集的局限性·43
3.4.2 數據質量評估的挑戰·43
3.4.3 自動生成數據的風險·44
參考文獻·44
4 大語言模型預訓練·46
4.1 大語言模型為什么這么強·46
4.2 大語言模型的核心模塊·49
4.2.1 核心架構·49
4.2.2 組成模塊選型·51
4.3 大語言模型怎么訓練·60
4.3.1 訓練目標·60
4.3.2 數據配比·62
4.4 預訓練還有什么沒有解決·65
參考文獻·66
5 挖掘大語言模型潛能:有監督微調·67
5.1 揭開有監督微調的面紗·67
5.1.1 什么是有監督微調·67
5.1.2 有監督微調的作用與意義·68
5.1.3 有監督微調的應用場景·68
5.2 有監督微調數據的構建·69
5.2.1 有監督微調數據的格式·69
5.2.2 有監督微調數據的自動化構建·70
5.2.3 有監督微調數據的選擇·75
5.3 大語言模型的微調方法·76
5.3.1 全參數微調·76
5.3.2 適配器微調·76
5.3.3 前綴微調·77
5.3.4 提示微調·78
5.3.5 低秩適配·79
5.4 大語言模型的微調和推理策略·79
5.4.1 混合微調策略·80
5.4.2 基于上下文學習的推理策略·81
5.4.3 基于思維鏈的推理策略·82
5.5 大語言模型微調的挑戰和探索·83
5.5.1 大語言模型微調的幻覺問題·83
5.5.2 大語言模型微調面臨的挑戰·84
5.5.3 大語言模型微調的探索與展望 ·84
參考文獻·85
6 大語言模型強化對齊·87
6.1 強化學習基礎 ·87
6.1.1 強化學習的基本概念·87
6.1.2 強化學習中的隨機性·88
6.1.3 強化學習的目標·89
6.1.4 Q 函數與 V 函數·89
6.2 DQN 方法·91
6.2.1 DQN 的結構·91
6.2.2 DQN 訓練:基本思想·92
6.2.3 DQN 訓練:目標網絡·94
6.2.4 DQN 訓練:探索策略·94
6.2.5 DQN 訓練:經驗回放·95
6.2.6 DQN 訓練:完整算法·95
6.2.7 DQN 決策·96
6.3 策略梯度方法·96
6.3.1 策略網絡的結構·96
6.3.2 策略網絡訓練:策略梯度·97
6.3.3 策略網絡訓練:優勢函數·99
6.3.4 PPO 算法·100
6.4 揭秘大語言模型中的強化建模·101
6.4.1 Token-level 強化建模·101
6.4.2 Sentence-level 強化建模·102
6.5 獎勵模型·103
6.5.1 獎勵模型的結構·103
6.5.2 獎勵模型的訓練·104
6.5.3 獎勵模型損失函數分析·106
6.6 RLHF·108
6.6.1 即時獎勵·108
6.6.2 RLHF 算法·109
6.7 RLHF 實戰框架·111
6.8 RLHF 的難點和問題·111
6.8.1 數據瓶頸·112
6.8.2 硬件瓶頸·113
6.8.3 方法瓶頸·114
參考文獻·115
7 大語言模型的評測·117
7.1 基座語言模型的評測·117
7.1.1 主要的評測維度和基準概述·118
7.1.2 具體案例:LLaMA 2 選取的評測基準·118
7.2 大語言模型的對話能力評測·120
7.2.1 評測任務·120
7.2.2 評測集的構建標準·131
7.2.3 評測方式·132
7.3 大語言模型的安全性評測·132
7.3.1 評測任務·133
7.3.2 評測方式和標準·134
7.4 行業大語言模型的評測:以金融行業大語言模型為例·134
7.4.1 金融行業大語言模型的自動化評測集·135
7.4.2 金融行業大語言模型的人工評測集·136
7.5 整體能力的評測·137
7.6 主流評測數據集及基準·138
參考文獻·142
8 大語言模型的應用·143
8.1 大語言模型為什么需要提示工程·143
8.1.1 人類和大語言模型進行復雜決策的對比·144
8.1.2 提示工程的作用·144
8.2 什么是提示詞·145
8.2.1 提示詞的基礎要素·146
8.2.2 提示詞設計的通用原則·146
8.3 推理引導·147
8.3.1 零樣本提示·147
8.3.2 少樣本提示·148
8.3.3 思維鏈提示·149
8.3.4 自我一致性提示·150
8.3.5 思維樹提示·151
8.4 動態交互·155
8.4.1 檢索增強生成技術·155
8.4.2 推理和行動協同技術·159
8.5 案例分析·161
8.5.1 案例介紹·161
8.5.2 工具設計·161
8.5.3 提示詞設計·165
8.5.4 案例運行·167
8.6 局限和發展·172
8.6.1 目前的局限·172
8.6.2 未來的發展·173
參考文獻·173
9 工程實踐·175
9.1 大語言模型訓練面臨的挑戰·175
9.2 大語言模型訓練綜述·176
9.2.1 數據并行·176
9.2.2 模型并行·179
9.2.3 ZeRO 并行·181
9.3 大語言模型訓練技術選型技巧·184
9.4 大語言模型訓練優化秘籍·186
9.4.1 I/O 優化·186
9.4.2 通信優化·187
9.4.3 穩定性優化·190
9.5 大語言模型訓練工程實踐·190
9.5.1 DeepSpeed 架構·191
9.5.2 DeepSpeed 訓練詳解·191
9.5.3 DeepSpeed 訓練調優實踐·194
9.6 強化學習工程實踐·196
9.6.1 DeepSpeed-Chat 混合引擎架構·196
9.6.2 DeepSpeed-Chat 訓練詳解·197
9.6.3 DeepSpeed-Chat 訓練調優實踐·199
9.7 大語言模型推理工程·201
9.7.1 提升規模:模型量·202
9.7.2 提高并行度:張量并行·205
9.7.3 推理加速:算子優化·207
9.7.4 降低計算量:KV-Cache·208
9.7.5 推理工程綜合實踐·210
參考文獻·212
10 手把手教你訓練 7B 大語言模型·214
10.1 自動化訓練框架·214
10.1.1 自動化訓練框架介紹·214
10.1.2 主要模塊介紹·215
10.2 動手訓練 7B 大語言模型·237
10.2.1 語料預處理·238
10.2.2 預訓練實踐·240
10.2.3 指令微調實踐·245
10.3 小結·247
展開全部

大語言模型:原理與工程實踐 作者簡介

楊青
度小滿金融技術委員會執行主席、數據智能應用部總經理,度小滿AI Lab負責人,碩士畢業于清華大學計算機系,曾就職于百度、阿里巴巴,從事自然語言處理、搜索、推薦、大數據架構等相關方向的研發工作。

2018年年初加入度小滿金融,組建數據智能部和AI Lab團隊,從0到1構建度小滿金融的智能引擎核心算法,深耕計算機視覺、自然語言處理、圖模型、機器學習、因果推斷等技術領域,多篇文章被EMNLP、ACL、CIKM等國際會議收錄,“智能化征信解讀中臺”工程榮獲吳文俊人工智能科技進步獎。相關技術廣泛應用于度小滿營銷、經營、風控、反欺詐全流程業務場景,為上千萬客戶提供穩定、安全的金融服務。
楊青 度小滿金融技術委員會執行主席、數據智能應用部總經理,度小滿AI Lab負責人,碩士畢業于清華大學計算機系,曾就職于百度、阿里巴巴,從事自然語言處理、搜索、推薦、大數據架構等相關方向的研發工作。 2018年年初加入度小滿金融,組建數據智能部和AI Lab團隊,從0到1構建度小滿金融的智能引擎核心算法,深耕計算機視覺、自然語言處理、圖模型、機器學習、因果推斷等技術領域,多篇文章被EMNLP、ACL、CIKM等國際會議收錄,“智能化征信解讀中臺”工程榮獲吳文俊人工智能科技進步獎。相關技術廣泛應用于度小滿營銷、經營、風控、反欺詐全流程業務場景,為上千萬客戶提供穩定、安全的金融服務。 目前,專注于AIGC相關研究及產品落地工作,基于度小滿模型即服務(MaaS)的模式積極探索文生圖、數字人與生成式大語言模型的應用轉化。于2023年年初帶領團隊發布千億參數規模的中文大語言模型“軒轅”。2023年9月, “軒轅-70B”大語言模型在C-Eval和CMMLU兩大權威榜單上位列所有開源模型榜首。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 南京租车,南京汽车租赁,南京包车,南京会议租车-南京七熹租车 | 电气控制系统集成商-PLC控制柜变频控制柜-非标自动化定制-电气控制柜成套-NIDEC CT变频器-威肯自动化控制 | 铝合金电阻-无源谐波滤波器-上海稳达电讯设备厂| 除甲醛公司-甲醛检测-广西雅居环境科技有限公司| 酒水灌装机-白酒灌装机-酒精果酒酱油醋灌装设备_青州惠联灌装机械 | 二手Sciex液质联用仪-岛津气质联用仪-二手安捷伦气质联用仪-上海隐智科学仪器有限公司 | 企业微信营销_企业微信服务商_私域流量运营_艾客SCRM官网 | 合肥废气治理设备_安徽除尘设备_工业废气处理设备厂家-盈凯环保 合肥防火门窗/隔断_合肥防火卷帘门厂家_安徽耐火窗_良万消防设备有限公司 | 网架支座@球铰支座@钢结构支座@成品支座厂家@万向滑动支座_桥兴工程橡胶有限公司 | 宜兴紫砂壶知识分享 - 宜兴壶人| 宝宝药浴-产后药浴-药浴加盟-艾裕-专注母婴调养泡浴 | KBX-220倾斜开关|KBW-220P/L跑偏开关|拉绳开关|DHJY-I隔爆打滑开关|溜槽堵塞开关|欠速开关|声光报警器-山东卓信有限公司 | 彭世修脚_修脚加盟_彭世修脚加盟_彭世足疗加盟_足疗加盟连锁_彭世修脚技术培训_彭世足疗 | 扒渣机,铁水扒渣机,钢水扒渣机,铁水捞渣机,钢水捞渣机-烟台盛利达工程技术有限公司 | 无锡网站建设-做网站-建网站-网页设计制作-阿凡达建站公司 | 防渗膜厂家|养殖防渗膜|水产养殖防渗膜-泰安佳路通工程材料有限公司 | 智能气瓶柜(大型气瓶储存柜)百科| 鑫达滑石-辽宁鑫达滑石集团 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 骨密度仪-骨密度测定仪-超声骨密度仪-骨龄测定仪-天津开发区圣鸿医疗器械有限公司 | 重庆波纹管|重庆钢带管|重庆塑钢管|重庆联进管道有限公司 | 美侍宠物-专注宠物狗及宠物猫训练|喂养|医疗|繁育|品种|价格 | EDLC超级法拉电容器_LIC锂离子超级电容_超级电容模组_软包单体电容电池_轴向薄膜电力电容器_深圳佳名兴电容有限公司_JMX专注中高端品牌电容生产厂家 | IWIS链条代理-ALPS耦合透镜-硅烷预处理剂-上海顶楚电子有限公司 lcd条形屏-液晶长条屏-户外广告屏-条形智能显示屏-深圳市条形智能电子有限公司 | NBA直播_NBA直播免费观看直播在线_NBA直播免费高清无插件在线观看-24直播网 | 集装箱展厅-住人集装箱住宿|建筑|房屋|集装箱售楼处-山东锐嘉科技工程有限公司 | 雨水收集系统厂家-雨水收集利用-模块雨水收集池-徐州博智环保科技有限公司 | 深圳宣传片制作-企业宣传视频制作-产品视频拍摄-产品动画制作-短视频拍摄制作公司 | 气动隔膜泵厂家-温州永嘉定远泵阀有限公司 | 注浆压力变送器-高温熔体传感器-矿用压力传感器|ZHYQ朝辉 | 六维力传感器_六分量力传感器_模腔压力传感器-南京数智微传感科技有限公司 | 高光谱相机-近红外高光谱相机厂家-高光谱成像仪-SINESPEC 赛斯拜克 | 上海办公室设计_办公楼,写字楼装修_办公室装修公司-匠御设计 | 高防护蠕动泵-多通道灌装系统-高防护蠕动泵-www.bjhuiyufluid.com慧宇伟业(北京)流体设备有限公司 | 东莞爱加真空科技有限公司-进口真空镀膜机|真空镀膜设备|Polycold维修厂家 | 陕西自考报名_陕西自学考试网| 磷酸肌酸二钠盐,肌酐磷酰氯-沾化欣瑞康生物科技 | 高低温老化试验机-步入式/低温恒温恒湿试验机-百科 | 干粉砂浆设备-干粉砂浆生产线-干混-石膏-保温砂浆设备生产线-腻子粉设备厂家-国恒机械 | 多物理场仿真软件_电磁仿真软件_EDA多物理场仿真软件 - 裕兴木兰 | 高尔夫球杆_高尔夫果岭_高尔夫用品-深圳市新高品体育用品有限公司 |