中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
開啟智能對話新紀元:大規模語言模型的探索與實踐

包郵 開啟智能對話新紀元:大規模語言模型的探索與實踐

出版社:清華大學出版社出版時間:2024-12-01
開本: 其他 頁數: 392
中 圖 價:¥72.3(7.3折) 定價  ¥99.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

開啟智能對話新紀元:大規模語言模型的探索與實踐 版權信息

開啟智能對話新紀元:大規模語言模型的探索與實踐 本書特色

本書深度探討了當今科技領域*引人注目的大語言模型相關技術,內容主要圍繞大規模語言模型構建、評估和應用展開

開啟智能對話新紀元:大規模語言模型的探索與實踐 內容簡介

本書深度探討了當今科技領域*引人注目的大語言模型相關技術,內容主要圍繞大規模語言模型構建、評估和應用展開為下面的四個主要部分:**部分主要介紹 大規模語言模型的發展歷程以及預訓練相關內容, 包括語言模型基本架構、大規模語言模型的高效微調技術、人類反饋的強化學 習和分布式模型訓練; 第二個部分主要介紹大規模語言模型的推理優化技術、推理加速框架和模型的評估; 第 三個部分主要介紹大規模語言模型擴展和應用, 包括大規模語言模型和知識的融合、多模態大規模語言模型以 及大規模語言模型的垂直領域應用;第四個部分主要介紹大規模語言模型研究的困難、挑戰和未來潛在研究方向。 本書的一些亮點特色包括:深度解析技術原理: 本書通過通俗易懂的語言,對大語言模型的相關技術進行深入解析,使讀者能夠理解模型的工作機制,訓練優調和指標評估方法,從而更好地應用于實際項目中;擴展應用和案例: 本書介紹了大語言模型和知識融合,以及多模態大語言模型的兩種常見擴展應用,而且通過了豐富的實際案例,書中展示了大語言模型在各行各業中的成功應用,讀者可以了解到它如何改變傳統業務流程,提高工作效率;關注社會影響與倫理問題: 除了技術層面,書中還關注大語言模型對社會的深遠影響,涵蓋創作權、隱私等方面的倫理問題,引導讀者深思技術發展對社會的影響。未來趨勢與開放性問題: 書籍不僅著眼于已有成果,還展望了大語言模型領域的未來趨勢,提出了一系列開放性問題,鼓勵讀者參與到這一領域的探索中。 本書讀者對象包括:技術愛好者:為人工智能和自然語言處理感興趣的技術人員提供相對全面的大語言模型的介紹資料;相關從業者:提供給相關從業人員了解大語言模型應用以及深入了解大語言模型技術原理和*新研究趨勢的資料;以及一些對人工智能社會影響感興趣的一般讀者:通過通俗的語言介紹大語言模型,讓其更好地理解這一技術,以及這個技術給我們生活帶來的影響。

開啟智能對話新紀元:大規模語言模型的探索與實踐開啟智能對話新紀元:大規模語言模型的探索與實踐 前言

當我完成這本書的時候,回首走過的路,不禁感慨萬分。本書是在我與算法組成員培訓分享和知識交流的過程中孕育而成的。團隊中的同事們有著不同的學習背景、思維方式和個體經驗,這些不同的聲音和力量聚在一起,凝結成了這部思想智慧的結晶。我們毫無保留地分享著彼此的見解,相互啟發,共同成長。我相信,如果能夠系統地整理出這些共享資源,將會讓更多的人受益。
我的靈感不僅來自團隊內的經驗交流,還受到了大規模語言模型( LLM)研究的啟發,這一研究熱潮如同一陣清風,吹散了我對“自然語言處理”這個領域的傳統認知,大規模語言模型的研究熱潮點燃了我思維的火花,讓我重新審視并深刻理解了這一領域所蘊含的無限潛力。大規模語言模型不僅為我們提供了強大的自然語言處理工具,也激發了我對創新和實踐的渴望。

開啟智能對話新紀元:大規模語言模型的探索與實踐 目錄

第 1章大規模語言模型的背景介紹 1

11語言建模的發展階段 2

12大規模語言模型帶來的機遇 3

第 2章從統計語言模型到預訓練語言模型 5

21統計語言模型 6

22神經網絡語言模型 7

221前饋神經網絡語言模型 7

222循環神經網絡語言模型 8

223長短期記憶神經網絡語言模型 9

224 Word2Vec詞向量表示模型 10

23 預訓練語言模型 12
ELMo 12

231 Transformer13
232 BERT 22
233 ELECTRA 23
234 GPT 1-325
235 BART 29
236 T5 31
237

第 3章大規模語言模型的框架結構 34

31編碼器結構36

32 編碼器-解碼器結構 36
GLM36

321 UL2 41
322
33 解碼器結構43
PaLM43

331 BLOOM45
332 InstructGPT47
333
34 LLaMA家族 50

341預訓練數據 52

342模型架構 53

343中文 LLaMA 62

344中文 Alpaca66

第 4章大規模語言模型的訓練方法 69

41模型的訓練成本 71

411算力估算 71

412費用和能耗 72

42有監督微調74

421提示學習 75

422上下文學習 76

423指令微調 77

43參數高效微調 78

431部分參數的高效微調79

432參數增加的高效微調80

433重參數化的高效微調91

434混合高效微調系列 97

44人類反饋強化學習100

441強化學習 101

442近端策略優化104

443人類反饋對齊111

45大模型災難性遺忘123

第 5章大模型分布式并行技術125

51分布式系統125

52數據并行 129

521輸入數據切分130

522模型參數同步131

523數據并行優化132


53模型并行 134

531 張量并行 134

532 流水線并行 139

533 優化器相關并行 141

54其他并行 146

541 異構系統并行146

542 專家并行 147

543 多維混合并行148

544 自動并行 149

55并行訓練框架 149

551 Megatron-LM152

552 DeepSpeed159
Colossal-AI163

553
第 6章大規模語言模型解碼推理優化相關技術 168

61解碼方法 168

611 基于搜索的解碼方法169

612 基于采樣的解碼方法171

62推理優化方法 174

621 推理原理 177

622 推理加速 177

63模型壓縮技術 179

631 量化 181

632 剪枝 184

633 蒸餾 186

64顯存優化技術 187

641 鍵值緩存 187

642 注意力優化 188

65算子優化技術 195

651 算子融合 195

652 高性能算子 195

66推理加速框架 195

661 HuggingFace TGI196
vLLM197

662
663 LightLLM200

第 7章大規模語言模型的評估203

71評估概述 205

72評估體系 206


721知識與能力 207

722倫理與安全 209

73評估方法 212

731自動評估 213

732人工評估 217

733其他評估 221

74評估領域 223

741通用領域 223

742特定領域 226

743綜合評測 227

75評估挑戰 232

第 8章大規模語言模型與知識的結合233

81知識和知識表示 233

82知識圖譜簡介 236

83大規模語言模型和知識圖譜的結合 238

84知識圖譜增強大規模語言模型 240

841 LLM預訓練階段240

842 LLM評估階段 245

843 LLM推理階段 247

85大規模語言模型增強知識圖譜 249

851知識圖譜嵌入249

852知識圖譜補全251

853知識圖譜構建257

854知識圖譜到文本生成263

855知識圖譜問答265

86大規模語言模型和知識圖譜協同267

861知識表示 267

862知識推理 268

87知識檢索增強大規模語言模型工程應用268

871結構化數據 269

872結構化和非結構化數據 270

873向量數據庫 272

874 LangChain知識庫問答276

88未來的發展方向 279

第 9章多模態大規模語言模型技術應用 281

91多模態指令調節 285

911模態對齊 286


912數據收集 287

913模態橋接 290

914模型評估 292

92多模態上下文學習296

93多模態思維鏈 299

931模態連接 299

932學習范式 300

933鏈的配置和形式 301

94 LLM輔助視覺推理 301

941訓練范式 303

942功能角色 305

943模型評估 307

95 LLM擴展智能體 307

951智能體308

952記憶模塊 312

953任務規劃 314

954動作模塊 317

955評估策略 319

96多模態語言模型挑戰 323

961技術問題 323

962成本問題 323

963社會問題 324

第 10章大規模語言模型應用 326

101法律領域 328

1011法律提示研究329

1012法律綜合評估332

102教育領域 336

1021能力評估 336

1022倫理問題 340

1023問答應用 341

103金融領域 342

1031智能應用場景346

1032困難和挑戰 347

104生物醫療 348

1041潛力和價值 348

1042應用的場景 351

1043困難和挑戰 355

105代碼生成 356


1051代碼生成問題356

1052代碼大規模語言模型357

1053發展趨勢 361

第 11章展望和結論 363

111局限和挑戰 363

1111局限 363

1112挑戰 364

112方向和建議 365

1121數據方面 365

1122技術方面 365

1123應用方面 366

1124方向建議 366

113值得探索的研究 368

1131基礎理論研究369

1132高效計算研究370

1133安全倫理研究371

1134數據和評估研究 372

1135認知學習問題373

1136高效適配研究374

參考文獻 376



展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 低温柔性试验仪-土工布淤堵-沥青车辙试验仪-莱博特(天津)试验机有限公司 | 神马影院-实时更新秒播| 档案密集架_电动密集架_移动密集架_辽宁档案密集架-盛隆柜业厂家现货批发销售价格公道 | 生物风-销售载体,基因,质粒,ATCC细胞,ATCC菌株等,欢迎购买-百风生物 | 撕碎机,撕破机,双轴破碎机-大件垃圾破碎机厂家 | 艺术漆十大品牌_艺术涂料加盟代理_蒙太奇艺术涂料厂家品牌|艺术漆|微水泥|硅藻泥|乳胶漆 | 安德建奇火花机-阿奇夏米尔慢走丝|高维|发那科-北京杰森柏汇 | 一体化污水处理设备,一体化污水设备厂家-宜兴市福源水处理设备有限公司 | 智慧物联网行业一站式解决方案提供商-北京东成基业 | 房间温控器|LonWorks|海思| 山西3A认证|太原AAA信用认证|投标AAA信用证书-山西AAA企业信用评级网 | 818手游网_提供当下热门APP手游_最新手机游戏下载 | 懂研帝_专业SCI论文润色机构_SCI投稿发表服务公司 | 建筑消防设施检测系统检测箱-电梯**检测仪器箱-北京宇成伟业科技有限责任公司 | 厦门ISO认证|厦门ISO9001认证|厦门ISO14001认证|厦门ISO45001认证-艾索咨询专注ISO认证行业 | 医学动画公司-制作3d医学动画视频-医疗医学演示动画制作-医学三维动画制作公司 | 应急灯_消防应急灯_应急照明灯_应急灯厂家-大成智慧官网 | 国际线缆连接网 - 连接器_线缆线束加工行业门户网站 | 网站优化公司_北京网站优化_抖音短视频代运营_抖音关键词seo优化排名-通则达网络 | 民用音响-拉杆音响-家用音响-ktv专用音响-万昌科技 | 生产自动包装秤_颗粒包装秤_肥料包装秤等包装机械-郑州鑫晟重工科技有限公司 | 书法培训-高考书法艺考培训班-山东艺霖书法培训凭实力挺进央美 | 制氮设备_PSA制氮机_激光切割制氮机_氮气机生产厂家-苏州西斯气体设备有限公司 | 宜兴紫砂壶知识分享 - 宜兴壶人 医用空气消毒机-医用管路消毒机-工作服消毒柜-成都三康王 | 锡膏喷印机-全自动涂覆机厂家-全自动点胶机-视觉点胶机-深圳市博明智控科技有限公司 | 奇酷教育-Python培训|UI培训|WEB大前端培训|Unity3D培训|HTML5培训|人工智能培训|JAVA开发的教育品牌 | 南京蜂窝纸箱_南京木托盘_南京纸托盘-南京博恒包装有限公司 | 爱科技iMobile-专业的科技资讯信息分享网站 | 矿用履带式平板车|探水钻机|气动架柱式钻机|架柱式液压回转钻机|履带式钻机-启睿探水钻机厂家 | 英国公司注册-新加坡公司注册-香港公司开户-离岸公司账户-杭州商标注册-杭州优创企业 | 储气罐,真空罐,缓冲罐,隔膜气压罐厂家批发价格,空压机储气罐规格型号-上海申容压力容器集团有限公司 | 防锈油-助焊剂-光学玻璃清洗剂-贝塔防锈油生产厂家 | 能耗监测系统-节能监测系统-能源管理系统-三水智能化 | 长江船运_国内海运_内贸船运_大件海运|运输_船舶运输价格_钢材船运_内河运输_风电甲板船_游艇运输_航运货代电话_上海交航船运 | 超声波反应釜【百科】-以马内利仪器| 伺服电机_直流伺服_交流伺服_DD马达_拓达官方网站 | 三板富 | 专注于新三板的第一垂直服务平台 | 运动木地板厂家,篮球场木地板品牌,体育场馆木地板安装 - 欧氏运动地板 | 接地电阻测试仪[厂家直销]_电缆故障测试仪[精准定位]_耐压测试仪-武汉南电至诚电力设备 | 有机肥设备生产制造厂家,BB掺混肥搅拌机、复合肥设备生产线,有机肥料全部加工设备多少钱,对辊挤压造粒机,有机肥造粒设备 -- 郑州程翔重工机械有限公司 | 聚丙烯酰胺_厂家_价格-河南唐达净水材料有限公司 |