-
>
貨幣大歷史:金融霸權(quán)與大國(guó)興衰六百年
-
>
(精)方力鈞作品圖錄
-
>
《藏書報(bào)》2021合訂本
-
>
(精)中國(guó)當(dāng)代書畫名家作品集·范碩:書法卷+繪畫卷(全2卷)
-
>
(噴繪樓閣版)女主臨朝:武則天的權(quán)力之路
-
>
書里掉出來(lái)一只狼+狼的故事-全2冊(cè)
-
>
奇思妙想創(chuàng)意玩具書(精裝4冊(cè))
CHATGPT的基本原理與核心算法 版權(quán)信息
- ISBN:9787302682639
- 條形碼:9787302682639 ; 978-7-302-68263-9
- 裝幀:平裝-膠訂
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:
CHATGPT的基本原理與核心算法 本書特色
u 各種大型語(yǔ)言模型及其相關(guān)基礎(chǔ)方法、實(shí)現(xiàn)工具等,從文本單模態(tài)、視聽(tīng)覺(jué)多模態(tài)、具身智能到交互式智能體,幾乎都可以完全使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行系統(tǒng)闡述。這充分表明,自2012年AlexNet問(wèn)世以來(lái),各種基于端到端數(shù)據(jù)驅(qū)動(dòng)的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,已走了多遠(yuǎn),不僅將自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音處理等領(lǐng)域,進(jìn)行了徹底改變,而且還正在讓這些學(xué)科之間的邊界消融,并邁向統(tǒng)一。
u 本書從深度神經(jīng)網(wǎng)絡(luò)的角度切入,體系化地介紹了ChatGPT的基本原理與核心算法,既包括了深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)與大演化脈絡(luò),Transformer興起的緣由,也涉及ChatGPT等大型語(yǔ)言模型的預(yù)訓(xùn)練、微調(diào)、安全及價(jià)值對(duì)齊以及思維鏈提示應(yīng)用等重點(diǎn)內(nèi)容的介紹。
u 作者對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)、LSTM、Transformer和強(qiáng)化學(xué)習(xí)方法進(jìn)行了深入細(xì)致的剖析,其中對(duì)視覺(jué)Transformer相關(guān)基礎(chǔ)大模型和GPT思想之旅的介紹,特色鮮明。
u 通用人工智能將給人類帶來(lái)輝煌的未來(lái)。推動(dòng)、掌握并有能力充分利用更多大型語(yǔ)言模型與通用人工智能相關(guān)基礎(chǔ)知識(shí)的人,必將在這個(gè)快速發(fā)展與進(jìn)化的世界中,獲得更加強(qiáng)大的競(jìng)爭(zhēng)力。
CHATGPT的基本原理與核心算法 內(nèi)容簡(jiǎn)介
"能夠模仿人類語(yǔ)言智能與思維,具有世界一般性知識(shí)的ChatGPT,開(kāi)啟了通用人工智能的新時(shí)代,正成為引爆第四次工業(yè)革命的火種。本書是**本體系化介紹ChatGPT基本原理與核心算法的教材及專業(yè)圖書。全書共分5章: 第1章為人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ);第2章詳細(xì)剖析了Transformer及其緣起,分析了視覺(jué)領(lǐng)域的Transformer算法;第3章綜述了各種大型語(yǔ)言模型框架,分享了創(chuàng)建GPT系列模型的思想之旅;第4章重點(diǎn)介紹了ChatGPT的預(yù)訓(xùn)練方法與微調(diào)算法,系統(tǒng)地闡述了強(qiáng)化學(xué)習(xí)基礎(chǔ)與基于人類反饋的強(qiáng)化學(xué)習(xí);第5章為ChatGPT的應(yīng)用,包括上下文學(xué)習(xí)提示與思維鏈提示,并討論了智能涌現(xiàn)。本書體系嚴(yán)謹(jǐn)、系統(tǒng)性強(qiáng)、邏輯嚴(yán)密、內(nèi)容豐富,不僅深入淺出、圖文并茂、特色鮮明,而且具有引領(lǐng)性、前瞻性和思想啟迪性。 本書可作為高等院校人工智能、智能科學(xué)與技術(shù)、計(jì)算機(jī)科學(xué)與技術(shù)、大數(shù)據(jù)、自動(dòng)駕駛、新一代機(jī)器人及相關(guān)專業(yè)高年級(jí)本科生與研究生教材,也可供上述專業(yè)的研究人員、算法工程師及從事AI產(chǎn)品研發(fā)、產(chǎn)業(yè)發(fā)展與決策咨詢等的工程技術(shù)人員、投資者、戰(zhàn)略研究者和廣大科技工作者參考。"
CHATGPT的基本原理與核心算法CHATGPT的基本原理與核心算法 前言
ChatGPT作為一個(gè)可通過(guò)圖靈測(cè)試且達(dá)到某種人類智能水平的聊天智能體,于2022年年底率先在自然語(yǔ)言處理(NLP)領(lǐng)域獲得突破。以深度學(xué)習(xí)為代表的弱人工智能在經(jīng)歷十年大發(fā)展之后,艱難地實(shí)現(xiàn)了自我超越,一個(gè)全新的通用人工智能時(shí)代清晰可見(jiàn),正在撲面而來(lái)。
在20世紀(jì)90年代初,作者在博士后期間就主要從事人工神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)方法的研究。自2009年以來(lái),則主要在面向自動(dòng)駕駛與移動(dòng)機(jī)器人的計(jì)算機(jī)視覺(jué)(CV)領(lǐng)域深耕。2017年6月,谷歌的Transformer模型一經(jīng)推出,作者就特別留意到這種基于自注意力學(xué)習(xí)機(jī)制的新一代神經(jīng)網(wǎng)絡(luò),并積極開(kāi)展計(jì)算機(jī)視覺(jué)中Transformer方法的研究。但ChatGPT之類的大型語(yǔ)言模型解決的大部分任務(wù),畢竟大都發(fā)生在NLP領(lǐng)域,作者去體系化寫作這樣一部基礎(chǔ)書籍,是否合適?
幸運(yùn)的是,通過(guò)收集并閱讀大量的相關(guān)文獻(xiàn),發(fā)現(xiàn)各種大型語(yǔ)言模型及其相關(guān)基礎(chǔ)方法、實(shí)現(xiàn)工具等,除了其中涉及的NLP任務(wù)與性能評(píng)測(cè)外,幾乎都可以完全使用神經(jīng)網(wǎng)絡(luò)進(jìn)行系統(tǒng)闡述,這讓作者驚訝不已。這其實(shí)也表明,自2012年AlexNet問(wèn)世及其帶來(lái)以深度學(xué)習(xí)為代表的第三次人工智能的蓬勃發(fā)展以來(lái),各種基于端到端數(shù)據(jù)驅(qū)動(dòng)的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法已走了很遠(yuǎn)!不僅將NLP、CV、語(yǔ)音識(shí)別與合成等領(lǐng)域進(jìn)行了徹底改變,成為各個(gè)研究方向的主導(dǎo)方法,而且還正在讓這些學(xué)科之間的邊界逐步消融,并邁向統(tǒng)一。
CHATGPT的基本原理與核心算法 目錄
第1章人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)1
1.1引言1
1.2人工神經(jīng)元模型3
1.2.1基準(zhǔn)神經(jīng)元模型: MP模型3
1.2.2**代神經(jīng)元模型: WSN模型4
1.2.3第二代神經(jīng)元模型: RBF模型7
1.2.4第三代神經(jīng)元模型: 發(fā)放模型7
1.3人工神經(jīng)網(wǎng)絡(luò)模型8
1.3.1神經(jīng)網(wǎng)絡(luò)的基本概念與方法8
1.3.2前饋神經(jīng)網(wǎng)絡(luò)模型18
1.3.3深度卷積神經(jīng)網(wǎng)絡(luò)模型25
1.3.4反饋神經(jīng)網(wǎng)絡(luò)模型37
1.3.5遞歸神經(jīng)網(wǎng)絡(luò)模型49
1.4本章小結(jié)50
第2章從LSTM到Transformer51
2.1引言51
2.2遞歸神經(jīng)網(wǎng)絡(luò): 編碼器解碼器框架52
2.2.1從前饋神經(jīng)網(wǎng)絡(luò)到遞歸神經(jīng)網(wǎng)絡(luò)53
2.2.2Elman網(wǎng)絡(luò): 經(jīng)典遞歸神經(jīng)網(wǎng)絡(luò)56
2.2.3長(zhǎng)短期記憶網(wǎng)絡(luò)60
2.2.4遞歸神經(jīng)網(wǎng)絡(luò)的編碼器解碼器框架71
2.3遞歸神經(jīng)網(wǎng)絡(luò)的注意力與點(diǎn)積相似性74
2.3.1長(zhǎng)短期記憶網(wǎng)絡(luò)的注意力74
2.3.2點(diǎn)積相似性75
2.4Transformer模型77
2.4.1傳統(tǒng)編碼器解碼器框架下的Transformer網(wǎng)絡(luò)結(jié)構(gòu)77
2.4.2嵌入向量與位置編碼82
2.4.3殘差直連結(jié)構(gòu)及前置歸一化層82
2.4.4Transformer的核心結(jié)構(gòu)單元: 多頭注意力機(jī)制與逐位置前饋
神經(jīng)網(wǎng)絡(luò)84
2.4.5學(xué)習(xí)機(jī)制: 層堆疊自監(jiān)督學(xué)習(xí)與基于誤差反向傳播的監(jiān)督微調(diào)87〖1〗〖2〗ChatGPT的基本原理與核心算法〖1〗目錄2.4.6Transformer的主要特性87
2.4.7與遞歸神經(jīng)網(wǎng)絡(luò)的聯(lián)系與區(qū)別88
2.5應(yīng)用領(lǐng)域: 從NLP擴(kuò)展到CV89
2.5.1CV領(lǐng)域的Transformer90
2.5.2視覺(jué)目標(biāo)檢測(cè)與分割任務(wù): DETR91
2.5.3圖像分類任務(wù): ViT93
2.5.4三維點(diǎn)云處理任務(wù): Point Transformer96
2.5.5對(duì)比式語(yǔ)言圖像預(yù)訓(xùn)練模型: CLIP101
2.5.6其他視覺(jué)任務(wù)及展望107
2.6本章小結(jié)107
第3章GPT系列預(yù)訓(xùn)練大型語(yǔ)言模型109
3.1引言109
3.2大型語(yǔ)言模型的Transformer框架112
3.2.1前綴(編碼器)解碼器架構(gòu)的Transformer框架113
3.2.2編碼器架構(gòu)的Transformer框架114
3.2.3解碼器架構(gòu)的Transformer框架115
3.3混合式預(yù)訓(xùn)練大型語(yǔ)言模型118
3.3.1T5模型118
3.3.2GLM模型119
3.4判別式預(yù)訓(xùn)練大型語(yǔ)言模型121
3.4.1BERT模型121
3.4.2RoBERTa模型123
3.5GPT系列生成式預(yù)訓(xùn)練大型語(yǔ)言模型124
3.5.1GPT1: 利用生成式預(yù)訓(xùn)練改善語(yǔ)言理解126
3.5.2GPT2: 無(wú)監(jiān)督多任務(wù)學(xué)習(xí)的語(yǔ)言模型129
3.5.3GPT3: 少樣本學(xué)習(xí)的大型語(yǔ)言模型132
3.5.4GPT4: 圖文多模態(tài)大型語(yǔ)言模型137
3.6本章小結(jié)141
第4章ChatGPT的大規(guī)模預(yù)訓(xùn)練與微調(diào)143
4.1引言143
4.2大型語(yǔ)言模型的大規(guī)模預(yù)訓(xùn)練145
4.2.1預(yù)訓(xùn)練任務(wù)與模型選擇145
4.2.2大規(guī)模預(yù)訓(xùn)練方法149
4.2.3生成式Transformer大型語(yǔ)言模型的對(duì)比式自監(jiān)督學(xué)習(xí)152
4.3ChatGPT預(yù)訓(xùn)練模型的微調(diào)154
4.3.1強(qiáng)化學(xué)習(xí)基礎(chǔ)154
4.3.2預(yù)訓(xùn)練大型語(yǔ)言模型的指令調(diào)優(yōu)與RLHF調(diào)優(yōu)170
4.3.3初始動(dòng)作器: SFT模型的監(jiān)督訓(xùn)練173
4.3.4初始評(píng)判器: RM模型的監(jiān)督訓(xùn)練174
4.3.5A2C框架下的PPOptx強(qiáng)化學(xué)習(xí): 策略更新與價(jià)值對(duì)齊175
4.4性能評(píng)估183
4.4.1與人類意圖及價(jià)值觀對(duì)齊的性能評(píng)估183
4.4.2定量評(píng)測(cè)184
4.5ChatGPT規(guī)模化與工程化中的關(guān)鍵技術(shù)186
4.5.1大規(guī)模高質(zhì)量數(shù)據(jù)資源的準(zhǔn)備187
4.5.2大規(guī)模分布式預(yù)訓(xùn)練與微調(diào)所需的AI算力支撐190
4.6本章小結(jié)192
第5章ChatGPT的應(yīng)用194
5.1引言194
5.2提示工程195
5.2.1預(yù)訓(xùn)練提示微調(diào)范式195
5.2.2零樣本提示與少樣本提示196
5.3上下文學(xué)習(xí)提示196
5.3.1語(yǔ)言模型的元學(xué)習(xí)196
5.3.2上下文學(xué)習(xí)提示198
5.4思維鏈提示199
5.4.1思維鏈提示的兩種方式199
5.4.2少樣本思維鏈提示200
5.4.3零樣本思維鏈提示202
5.4.4自動(dòng)少樣本思維鏈提示204
5.5思維樹(shù)提示207
5.5.1思維樹(shù)提示的基本思想207
5.5.2思維樹(shù): 大型語(yǔ)言模型深思熟慮的問(wèn)題求解方法208
5.5.3分析與討論210
5.6智能涌現(xiàn)能力212
5.6.1智能涌現(xiàn)能力的定義213
5.6.2涌現(xiàn)能力發(fā)生的幾種情形214
5.6.3涌現(xiàn)能力的分析與展望217
5.7本章小結(jié)218
- >
我與地壇
- >
莉莉和章魚
- >
龍榆生:詞曲概論/大家小書
- >
巴金-再思錄
- >
自卑與超越
- >
名家?guī)阕x魯迅:故事新編
- >
月亮與六便士
- >
煙與鏡