中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)

包郵 預(yù)訓(xùn)練語言模型

作者:邵浩
出版社:電子工業(yè)出版社出版時(shí)間:2021-05-01
開本: 16開 頁數(shù): 216
中 圖 價(jià):¥53.3(4.9折) 定價(jià)  ¥109.0 登錄后可看到會(huì)員價(jià)
加入購物車 收藏
開年大促, 全場(chǎng)包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個(gè)別圖書品相8-9成新、切口
有劃線標(biāo)記、光盤等附件不全詳細(xì)品相說明>>
本類五星書更多>

預(yù)訓(xùn)練語言模型 版權(quán)信息

預(yù)訓(xùn)練語言模型 本書特色

適讀人群 :人工智能領(lǐng)域從業(yè)人員,自然語言處理領(lǐng)域新入門人員。√梳理預(yù)訓(xùn)練語言模型的發(fā)展歷史、基本概念 √剖析具有代表性的預(yù)訓(xùn)練語言模型的實(shí)現(xiàn)細(xì)節(jié),配代碼 √預(yù)訓(xùn)練語言模型的評(píng)測(cè)、應(yīng)用及趨勢(shì)分析

預(yù)訓(xùn)練語言模型 內(nèi)容簡介

預(yù)訓(xùn)練語言模型屬于人工智能領(lǐng)域中自然語言處理領(lǐng)域的一個(gè)細(xì)分。 本書主要介紹預(yù)訓(xùn)練語言模型。預(yù)訓(xùn)練語言模型是自然語言處理領(lǐng)域的重要突破,得到了越來越廣泛的關(guān)注,相關(guān)研究者和從業(yè)人員在實(shí)際應(yīng)用的過程中,亟需一本理論翔實(shí)、代碼細(xì)節(jié)充分的參考書。本書詳細(xì)梳理了預(yù)訓(xùn)練語言模型的基本概念和理論基礎(chǔ),并通過實(shí)際代碼的講解, 闡述了具有代表性的預(yù)訓(xùn)練語言模型的實(shí)現(xiàn)細(xì)節(jié),很好適合需要快速、全面掌握預(yù)訓(xùn)練語言模型的從業(yè)者閱讀。

預(yù)訓(xùn)練語言模型 目錄

第 1 章 預(yù)訓(xùn)練語言模型簡介 1
1.1自然語言處理研究進(jìn)展 1
1.2預(yù)訓(xùn)練語言模型:為什么要預(yù)訓(xùn)練 4
1.2.1預(yù)訓(xùn)練 4
1.2.2自然語言表示 5
1.2.3預(yù)訓(xùn)練語言模型發(fā)展史及分類 8
第 2 章 預(yù)訓(xùn)練語言模型基礎(chǔ)知識(shí) 13
2.1統(tǒng)計(jì)語言模型 14
2.2神經(jīng)網(wǎng)絡(luò)語言模型 17
2.3詞向量:解決相似單詞的距離問題 19
2.4RNN 和 LSTM 基礎(chǔ) 25
2.5基于 RNN 的語言模型 29
2.6ELMo:解決多義詞的表示問題 32
第 3 章 Transformer 與 Attention 37
3.1Transformer 的結(jié)構(gòu) 37
3.2Self-Attention:從全局中找到重點(diǎn) 43
3.3位置編碼:為什么有效 54
3.4單向掩碼:另一種掩碼機(jī)制 58
3.5代碼解讀:模型訓(xùn)練技巧 61
3.5.1訓(xùn)練技巧 1:歸一化層前置 62
3.5.2訓(xùn)練技巧 2:梯度累積 64
第 4 章 GPT 系列模型 69
4.1GPT 的結(jié)構(gòu):基于 Transformer Decoder 69
4.2GPT 任務(wù)改寫:如何在不同任務(wù)中使用 GPT 71
4.3GPT 核心代碼解讀 74
4.4GPT-2:Zero-shot Learning 的潛力 79
4.4.1N-shot Learning 79
4.4.2核心思想 80
4.4.3模型結(jié)構(gòu) 81
4.5GPT-3:Few-shot Learning 的優(yōu)秀表現(xiàn) 82
4.5.1看詞造句 84
4.5.2語法糾錯(cuò) 84
4.5.3GPT-3 的爭(zhēng)議 85
第 5 章 BERT 模型 87
5.1BERT:公認(rèn)的里程碑 87
5.2BERT 的結(jié)構(gòu):強(qiáng)大的特征提取能力 88
5.3無監(jiān)督訓(xùn)練:掩碼語言模型和下句預(yù)測(cè) 91
5.3.1MLM 91
5.3.2NSP 93
5.3.3輸入表示 94
5.4微調(diào)訓(xùn)練:適應(yīng)下游任務(wù) 95
5.4.1句對(duì)分類 95
5.4.2單句分類 96
5.4.3文本問答 97
5.4.4單句標(biāo)注 99
5.5核心代碼解讀:預(yù)訓(xùn)練和微調(diào) 100
5.5.1BERT 預(yù)訓(xùn)練模型 101
5.5.2BERT 微調(diào)模型 110
5.6BERT 總結(jié) 117
第 6 章 后 BERT 時(shí)代的模型 119
6.1XLM:跨語言模型 119
6.1.1優(yōu)化方向 119
6.1.2算法細(xì)節(jié) 120
6.1.3 小結(jié) 121
6.2MT-DNN:多任務(wù)融合 121
6.2.1優(yōu)化方向 121
6.2.2算法細(xì)節(jié) 122
6.2.3 小結(jié) 124
6.3UniLM:獲得文本生成能力 124
6.3.1優(yōu)化方向 124
6.3.2算法細(xì)節(jié) 125
6.3.3 小結(jié) 127
6.4SpanBERT:擴(kuò)大掩碼范圍 127
6.4.1優(yōu)化方向 127
6.4.2算法細(xì)節(jié) 128
6.4.3 小結(jié) 129
6.5XLNet:置換自回歸 130
6.5.1優(yōu)化方向 130
6.5.2算法細(xì)節(jié) 130
6.5.3 小結(jié) 135
6.6ERNIE:知識(shí)圖譜 136
6.6.1優(yōu)化方向 136
6.6.2算法細(xì)節(jié) 136
6.6.3 小結(jié) 139
6.7VideoBERT:多模態(tài)融合 139
6.7.1優(yōu)化方向 139
6.7.2算法細(xì)節(jié) 140
6.7.3 小結(jié) 141
6.8ALBERT:參數(shù)共享 142
6.8.1優(yōu)化方向 142
6.8.2算法細(xì)節(jié) 143
6.8.3 小結(jié) 145
6.9RoBERTa:更大的模型 145
6.9.1優(yōu)化方向 145
6.9.2算法細(xì)節(jié) 146
6.9.3 小結(jié) 146
6.10BART:編解碼結(jié)構(gòu) 146
6.10.1優(yōu)化方向 146
6.10.2算法細(xì)節(jié) 147
6.10.3 小結(jié) 149
6.11T5:大一統(tǒng)模型 149
6.11.1優(yōu)化方向 149
6.11.2算法細(xì)節(jié) 150
6.11.3 小結(jié) 153
6.12 總結(jié) 154
第 7 章 評(píng)測(cè)和應(yīng)用 157
7.1評(píng)測(cè)任務(wù) 157
7.1.1通用評(píng)測(cè)任務(wù) 157
7.1.2領(lǐng)域評(píng)測(cè)任務(wù) 162
7.1.3其他評(píng)測(cè)任務(wù) 167
7.2模型應(yīng)用:Transformers 代碼實(shí)戰(zhàn) 168
7.2.1 安裝 168
7.2.2快速上手指南 170
7.2.3微調(diào)訓(xùn)練 172
7.2.4BERT 應(yīng)用 175
7.3模型壓縮:量化、剪枝和蒸餾 179
7.3.1BERT 模型分析 179
7.3.2 量化 181
7.3.3 剪枝 181
7.3.4 蒸餾 182
7.3.5 結(jié)構(gòu)無損壓縮 187
7.4模型擴(kuò)展:多模態(tài)預(yù)訓(xùn)練 188
7.4.1單流模型 189
7.4.2雙流模型 191
第 8 章 總結(jié)和展望 195
8.1預(yù)訓(xùn)練語言模型的發(fā)展現(xiàn)狀 195
8.2預(yù)訓(xùn)練語言模型的未來展望 199
參考文獻(xiàn) 203

展開全部

預(yù)訓(xùn)練語言模型 作者簡介

邵 浩日本國立九州大學(xué)工學(xué)博士,現(xiàn)就職于vivo。曾任狗尾草智能科技AI研究院院長,帶領(lǐng)團(tuán)隊(duì)打造了AI虛擬生命產(chǎn)品的交互引擎。曾是上海對(duì)外經(jīng)貿(mào)大學(xué)副教授,碩士生導(dǎo)師。是上海市靜安區(qū)首屆優(yōu)秀人才,上海市人才發(fā)展基金獲得者,杭州市高層次人才。任中國中文信息學(xué)會(huì)青年工作委員會(huì)委員,語言與知識(shí)計(jì)算專委會(huì)委員,中國計(jì)算機(jī)學(xué)會(huì)語音對(duì)話與聽覺專業(yè)組委員,中文信息技術(shù)專委會(huì)委員。發(fā)表論文50余篇,獲專利10余項(xiàng),主持多項(xiàng)***及省部級(jí)課題,曾在聯(lián)合國、世界貿(mào)易組織、亞利桑那州立大學(xué)、香港城市大學(xué)等機(jī)構(gòu)任訪問學(xué)者。劉一烽全國中學(xué)生物理競(jìng)賽保送生,清華大學(xué)電子系碩士,曾獲學(xué)習(xí)成績優(yōu)異獎(jiǎng)學(xué)金。現(xiàn)任vivo人工智能研究院AI算法工程師,主要研究方向?yàn)閺?qiáng)化學(xué)習(xí)、自然語言處理,主導(dǎo)游戲AI和機(jī)器翻譯核心算法研發(fā)工作。

商品評(píng)論(0條)
暫無評(píng)論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 山东彩钢板房,山东彩钢活动房,临沂彩钢房-临沂市贵通钢结构工程有限公司 | Pos机办理_个人商户免费POS机申请-拉卡拉办理网 | 洛阳防爆合格证办理-洛阳防爆认证机构-洛阳申请国家防爆合格证-洛阳本安防爆认证代办-洛阳沪南抚防爆电气技术服务有限公司 | 危废处理系统,水泥厂DCS集散控制系统,石灰窑设备自动化控制系统-淄博正展工控设备 | 二手注塑机回收_旧注塑机回收_二手注塑机买卖 - 大鑫二手注塑机 二手光谱仪维修-德国OBLF光谱仪|进口斯派克光谱仪-热电ARL光谱仪-意大利GNR光谱仪-永晖检测 | 桥架-槽式电缆桥架-镀锌桥架-托盘式桥架 - 上海亮族电缆桥架制造有限公司 | ZHZ8耐压测试仪-上海胜绪电气有限公司 | 无菌实验室规划装修设计-一体化实验室承包-北京洁净净化工程建设施工-北京航天科恩实验室装备工程技术有限公司 | 智慧农业|农业物联网|现代农业物联网-托普云农物联网官方网站 | 废水处理-废气处理-工业废水处理-工业废气处理工程-深圳丰绿环保废气处理公司 | 国标白水泥,高标号白水泥,白水泥厂家-淄博华雪建材有限公司 | 鼓风干燥箱_真空烘箱_高温干燥箱_恒温培养箱-上海笃特科学仪器 | 广州小程序开发_APP开发公司_分销商城系统定制_小跑科技 | 翻斗式矿车|固定式矿车|曲轨侧卸式矿车|梭式矿车|矿车配件-山东卓力矿车生产厂家 | 广东教师资格网-广东教师资格证考试网 | 烽火安全网_加密软件、神盾软件官网 | 定制/定做衬衫厂家/公司-衬衫订做/订制价格/费用-北京圣达信 | 上海阳光泵业制造有限公司 -【官方网站】| 二次元影像仪|二次元测量仪|拉力机|全自动影像测量仪厂家_苏州牧象仪器 | 氧化锆陶瓷_氧化锆陶瓷加工_氧化锆陶瓷生产厂家-康柏工业陶瓷有限公司 | 仿真茅草_人造茅草瓦价格_仿真茅草厂家_仿真茅草供应-深圳市科佰工贸有限公司 | IHDW_TOSOKU_NEMICON_EHDW系列电子手轮,HC1系列电子手轮-上海莆林电子设备有限公司 | 无轨电动平车_轨道平车_蓄电池电动平车★尽在新乡百特智能转运设备有限公司 | 奥因-光触媒除甲醛公司-除甲醛加盟公司十大品牌 | 搜活动房网—活动房_集装箱活动房_集成房屋_活动房屋 | 定制奶茶纸杯_定制豆浆杯_广东纸杯厂_[绿保佳]一家专业生产纸杯碗的厂家 | 大白菜官网,大白菜winpe,大白菜U盘装系统, u盘启动盘制作工具 | 江苏全风,高压风机,全风环保风机,全风环形高压风机,防爆高压风机厂家-江苏全风环保科技有限公司(官网) | 塑料托盘厂家直销-吹塑托盘生产厂家-力库塑业【官网】 | 丙烷/液氧/液氮气化器,丙烷/液氧/液氮汽化器-无锡舍勒能源科技有限公司 | 深圳标识制作公司-标识标牌厂家-深圳广告标识制作-玟璟广告-深圳市玟璟广告有限公司 | 远程会诊系统-手术示教系统【林之硕】医院远程医疗平台 | 密度电子天平-内校-外校电子天平-沈阳龙腾电子有限公司 | 气弹簧定制-气动杆-可控气弹簧-不锈钢阻尼器-工业气弹簧-可调节气弹簧厂家-常州巨腾气弹簧供应商 | TwistDx恒温扩增-RAA等温-Jackson抗体-默瑞(上海)生物科技有限公司 | 执业药师报名条件,考试时间,考试真题,报名入口—首页 | 走心机厂家,数控走心机-台州博城智能科技有限公司| 自清洗过滤器,浅层砂过滤器,叠片过滤器厂家-新乡市宇清净化 | 哈希余氯测定仪,分光光度计,ph在线监测仪,浊度测定仪,试剂-上海京灿精密机械有限公司 | 防腐储罐_塑料储罐_PE储罐厂家_淄博富邦滚塑防腐设备科技有限公司 | 砂石生产线_石料生产线设备_制砂生产线设备价格_生产厂家-河南中誉鼎力智能装备有限公司 |