包郵 語(yǔ)義解析:自然語(yǔ)言生成SQL與知識(shí)圖譜問(wèn)答實(shí)戰(zhàn)
-
>
全國(guó)計(jì)算機(jī)等級(jí)考試最新真考題庫(kù)模擬考場(chǎng)及詳解·二級(jí)MSOffice高級(jí)應(yīng)用
-
>
決戰(zhàn)行測(cè)5000題(言語(yǔ)理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(shū)(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
語(yǔ)義解析:自然語(yǔ)言生成SQL與知識(shí)圖譜問(wèn)答實(shí)戰(zhàn) 版權(quán)信息
- ISBN:9787111736899
- 條形碼:9787111736899 ; 978-7-111-73689-9
- 裝幀:平裝-膠訂
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>
語(yǔ)義解析:自然語(yǔ)言生成SQL與知識(shí)圖譜問(wèn)答實(shí)戰(zhàn) 本書(shū)特色
1)領(lǐng)域?qū)<衣?lián)袂推薦,語(yǔ)義解析大賽獲獎(jiǎng)?wù)咦珜懀瑵M足工業(yè)級(jí)應(yīng)用安全、精準(zhǔn)需求,彌合大模型的不足。 2)剖析語(yǔ)義解析技術(shù)原理與實(shí)踐,涵蓋機(jī)器翻譯、模板填充、強(qiáng)化學(xué)習(xí)、GNN、中間表達(dá)五大技術(shù)方向,并隨書(shū)提供案例代碼。
語(yǔ)義解析:自然語(yǔ)言生成SQL與知識(shí)圖譜問(wèn)答實(shí)戰(zhàn) 內(nèi)容簡(jiǎn)介
全書(shū)分為3個(gè)部分: 1.**部分主要介紹了NL2SQL技術(shù)的相關(guān)背景知識(shí),包括對(duì)NL2SQL任務(wù)的描述和價(jià)值探討、國(guó)內(nèi)外相關(guān)數(shù)據(jù)集的對(duì)比分析以及相關(guān)前置技術(shù)的介紹與實(shí)現(xiàn) 2.第二部分深入解構(gòu)當(dāng)前NL2SQL技術(shù)領(lǐng)域的若干主流技術(shù)路線,并著重分析了各個(gè)技術(shù)方案的優(yōu)勢(shì)與不足,為開(kāi)發(fā)者提供模型選擇的參考依據(jù) 3.第三部分包含NL2SQL實(shí)踐指導(dǎo)相關(guān)篇章,結(jié)合相關(guān)代碼,以單表無(wú)嵌套和多表有嵌套為例,從數(shù)據(jù)預(yù)處理、模型的構(gòu)建,模型優(yōu)化技巧等方面為讀者構(gòu)建了完整的NL2SQL技術(shù)實(shí)現(xiàn)流程 讀者通過(guò)對(duì)本書(shū)的閱讀,可以對(duì)自然語(yǔ)言處理語(yǔ)義解析領(lǐng)域新興的子任務(wù)——NL2SQL有一個(gè)清晰地認(rèn)識(shí)。本書(shū)充分介紹了語(yǔ)義解析任務(wù)相關(guān)研究進(jìn)展,對(duì)主流技術(shù)方案進(jìn)行了詳細(xì)闡述與分析,并從實(shí)踐的角度展示了NL2SQL完整的技術(shù)實(shí)現(xiàn)流程,希望幫助讀者深入理解并高效搭建起語(yǔ)義解析框架,同時(shí)對(duì)語(yǔ)義解析領(lǐng)域的發(fā)展起到一定的促進(jìn)作用。
語(yǔ)義解析:自然語(yǔ)言生成SQL與知識(shí)圖譜問(wèn)答實(shí)戰(zhàn) 目錄
目錄序
前言
第1章NL2SQL和KBQA中的語(yǔ)義
解析技術(shù)1
11人機(jī)交互應(yīng)用與語(yǔ)義解析
難點(diǎn)分析1
12主流的語(yǔ)義解析技術(shù)5
121NL2SQL任務(wù)及方法5
122KBQA任務(wù)及方法12
123語(yǔ)義解析技術(shù)方案對(duì)比17
13語(yǔ)義解析的預(yù)訓(xùn)練模型和
數(shù)據(jù)集19
131語(yǔ)義解析中的預(yù)訓(xùn)練模型19
132NL2SQL數(shù)據(jù)集19
133KBQA數(shù)據(jù)集21
14本章小結(jié)23第2章基于機(jī)器翻譯的語(yǔ)義解析
技術(shù)24
21機(jī)器翻譯原理淺析24
211常見(jiàn)機(jī)器翻譯技術(shù)路線24
212神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯基本框架26
22NL2SQL翻譯框架的構(gòu)建27
221Seq2Seq模型原理27
222將Seq2Seq模型應(yīng)用于
NL2SQL28
23從序列到集合:SQLNet
模型的解決方案28
231序列到集合29
232列名注意力29
233SQLNet模型預(yù)測(cè)及其訓(xùn)練
細(xì)節(jié)30
24T5預(yù)訓(xùn)練模型在NL2SQL中的
應(yīng)用31
241T5模型簡(jiǎn)介31
242T5模型架構(gòu)32
243T5模型訓(xùn)練方式32
244T5模型在NL2SQL中的
應(yīng)用33
25NL2SQL的T5模型實(shí)踐33
26本章小結(jié)43第3章基于模板填充的語(yǔ)義解析
技術(shù)44
31意圖識(shí)別和槽位填充44
311意圖識(shí)別和槽位填充的
步驟45
312如何進(jìn)行意圖識(shí)別和槽位
填充46
32基于X-SQL的模板定義與子
任務(wù)分解48
33本章小結(jié)49第4章基于強(qiáng)化學(xué)習(xí)的語(yǔ)義解析
技術(shù)50
41Seq2Seq中的強(qiáng)化學(xué)習(xí)
知識(shí)50
42SCST模型51
421SCST模型簡(jiǎn)介52
422SCST模型框架52
423SCST代碼實(shí)現(xiàn)52
43MAPO模型62
431MAPO模型簡(jiǎn)介62
432MAPO代碼實(shí)現(xiàn)63
44本章小結(jié)67第5章基于GNN的語(yǔ)義解析
技術(shù)68
51使用GNN對(duì)數(shù)據(jù)庫(kù)模式進(jìn)行
編碼68
511匹配可能模式項(xiàng)的集合69
512GNN編碼表示69
52關(guān)注模式的Global GNN71
521Global GNN的改進(jìn)71
522Gating GCN模塊詳解72
523Re-ranking GCN模塊詳解75
53關(guān)注模式鏈接的RATSQL79
531Relation-Aware Self-Attention
模型80
532考慮更復(fù)雜的連接關(guān)系80
533模式鏈接的具體實(shí)現(xiàn)81
54關(guān)注模式鏈接拓?fù)浣Y(jié)構(gòu)的
LGESQL83
541LGESQL模型簡(jiǎn)介83
542LGESQL模型框架86
55本章小結(jié)87第6章基于中間表達(dá)的語(yǔ)義解析
技術(shù)88
61中間表達(dá):IRNet88
62引入中間表達(dá)層SemQL90
63IRNet代碼精析92
631模式鏈接代碼實(shí)現(xiàn)92
632SemQL的生成95
633SQL語(yǔ)句的生成101
64本章小結(jié)107第7章面向無(wú)嵌套簡(jiǎn)單SQL查詢的
原型系統(tǒng)構(gòu)建108
71語(yǔ)義匹配解決思路108
72任務(wù)簡(jiǎn)介109
73任務(wù)解析110
731列名解析110
732輸入整合111
733輸出子任務(wù)解析111
734模型整體架構(gòu)112
74代碼示例113
741QueryTokenizer類的構(gòu)造113
742SqlLabelEncoder類的
構(gòu)造115
743生成批量數(shù)據(jù)115
744模型搭建117
745模型訓(xùn)練和預(yù)測(cè)118
75本章小結(jié)120第8章面向復(fù)雜嵌套SQL查詢的
原型系統(tǒng)構(gòu)建121
81復(fù)雜嵌套SQL查詢的難點(diǎn)
剖析121
811復(fù)雜嵌套SQL語(yǔ)句121
812難點(diǎn)與對(duì)策分析122
82型模型解析123
821構(gòu)建復(fù)雜SQL語(yǔ)句的中間
表達(dá)形式123
822型模型的搭建與訓(xùn)練124
83列模型解析127
831嵌套信息的編碼設(shè)計(jì)127
832列模型的搭建與訓(xùn)練127
84值模型解析130
841值與列的關(guān)系解析130
842值模型的搭建與訓(xùn)練130
85完整系統(tǒng)演示132
851解碼器132
852完整流程演示133
86本章小結(jié)134第9章面向SPARQL的原型系統(tǒng)
構(gòu)建135
91T5、BART、UniLM模型
簡(jiǎn)介135
92T5、BART、UniLM方案136
93T5、BART、UniLM生成
SPARQL語(yǔ)句實(shí)現(xiàn)141
94T5、BART、UniLM模型結(jié)果
合并156
95路徑排序160
96SPARQL語(yǔ)句修正和再次
排序172
97本章小結(jié)185第10章預(yù)訓(xùn)練優(yōu)化186
101預(yù)訓(xùn)練技術(shù)的發(fā)展186
1011掩碼語(yǔ)言建模187
1012去噪自動(dòng)編碼器189
102定制預(yù)訓(xùn)練模型:
TaBERT192
1021信息的聯(lián)合表示192
1022預(yù)訓(xùn)練任務(wù)設(shè)計(jì)192
103TAPAS194
1031附加Embedding編碼表
結(jié)構(gòu)194
1032預(yù)訓(xùn)練任務(wù)設(shè)計(jì)195
104GRAPPA195
1041表格數(shù)據(jù)增強(qiáng):解決數(shù)據(jù)
稀疏難題195
1042預(yù)訓(xùn)練任務(wù)設(shè)計(jì)195
105本章小結(jié)197第11章語(yǔ)義解析技術(shù)落地思考198
111研究與落地的差別198
112產(chǎn)品視角的考慮200
113潛在的落地場(chǎng)景200
114實(shí)踐技巧201
1141數(shù)據(jù)增強(qiáng)在NLP領(lǐng)域的
應(yīng)用201
1142數(shù)據(jù)增強(qiáng)策略202
1143方案創(chuàng)新點(diǎn)204
115本章小結(jié)205
語(yǔ)義解析:自然語(yǔ)言生成SQL與知識(shí)圖譜問(wèn)答實(shí)戰(zhàn) 相關(guān)資料
這是一本探討NLP技術(shù)實(shí)踐的書(shū),其核心內(nèi)容是語(yǔ)義解析技術(shù)的多種技術(shù)路線,涵蓋了機(jī)器翻譯、模板填充、強(qiáng)化學(xué)習(xí)、GNN以及中間表達(dá)等多個(gè)方向。作者顯維是一位多次在算法競(jìng)賽中獲獎(jiǎng)的專家,在NLP技術(shù)領(lǐng)域有著豐富的實(shí)踐經(jīng)驗(yàn)。本書(shū)也是基于其多年實(shí)踐經(jīng)驗(yàn)和技術(shù)思考編寫而成。本書(shū)包含了眾多的代碼實(shí)現(xiàn),讓讀者能夠深入了解語(yǔ)義解析技術(shù)的原理和應(yīng)用。此外,本書(shū)還探討了技術(shù)的落地思考和原型系統(tǒng)構(gòu)建,幫助讀者更好地將技術(shù)應(yīng)用于實(shí)踐中。總之,這本書(shū)是一本深入淺出、實(shí)用性極高的技術(shù)參考書(shū),對(duì)想要深入了解語(yǔ)義解析技術(shù)和將其應(yīng)用于實(shí)踐的讀者來(lái)說(shuō),是一本不容錯(cuò)過(guò)的好書(shū)。 ——蘇海波,百分點(diǎn)科技首席算法科學(xué)家 本書(shū)著眼于特定領(lǐng)域或不開(kāi)放知識(shí)庫(kù)的問(wèn)答系統(tǒng)構(gòu)建,該項(xiàng)研究與通用知識(shí)問(wèn)答具有很強(qiáng)的互補(bǔ)性,可能會(huì)成為下一個(gè)階段的研發(fā)和創(chuàng)業(yè)熱點(diǎn)。本書(shū)的推出非常及時(shí),有利于讀者迅速進(jìn)入該領(lǐng)域并進(jìn)行產(chǎn)品研發(fā)。本書(shū)主要作者易顯維在機(jī)器學(xué)習(xí)、知識(shí)圖譜和強(qiáng)化學(xué)習(xí)等領(lǐng)域都進(jìn)行過(guò)大量的工程實(shí)踐,同時(shí)他也十分樂(lè)于分享自己的心得體會(huì)和最新進(jìn)展。本書(shū)完整地記載了他和團(tuán)隊(duì)科研突破的實(shí)戰(zhàn)經(jīng)驗(yàn),既有深度又有廣度,干貨滿滿。無(wú)論是正在從事這方面研究的同行,還是NLP和知識(shí)圖譜的初學(xué)者,本書(shū)都具有非常好的閱讀價(jià)值。 ——虞凡,東風(fēng)暢行科技首席技術(shù)官 如果你正在找有關(guān)NL2SQL的中文教程,這本書(shū)可能是不錯(cuò)的選擇。全書(shū)介紹了5種主要語(yǔ)義解析技術(shù)在NL2SQL任務(wù)上的應(yīng)用,并通過(guò)無(wú)嵌套SQL、復(fù)雜嵌套SQL、知識(shí)圖譜問(wèn)答、表格預(yù)訓(xùn)練、競(jìng)賽方案解析等示例,翔實(shí)地介紹了NL2SQL落地實(shí)踐技巧。全書(shū)配套了大量實(shí)現(xiàn)代碼,具有高度的實(shí)踐指導(dǎo)性。 ——張嘯宇,三次NL2SQL挑戰(zhàn)賽冠軍
語(yǔ)義解析:自然語(yǔ)言生成SQL與知識(shí)圖譜問(wèn)答實(shí)戰(zhàn) 作者簡(jiǎn)介
易顯維:碩士畢業(yè)于中國(guó)地質(zhì)大學(xué),曾任職中國(guó)建設(shè)銀行、科大訊飛研究院、百分點(diǎn)認(rèn)知智能實(shí)驗(yàn)室。10余年算法研發(fā)經(jīng)驗(yàn),在涉及機(jī)器學(xué)習(xí)技術(shù)的各個(gè)方向均有產(chǎn)品落地實(shí)踐經(jīng)驗(yàn),并長(zhǎng)期為武漢各企業(yè)的算法研發(fā)工作提供咨詢與支持。主要研究方向?yàn)檎Z(yǔ)義解析、機(jī)器視覺(jué)、組合導(dǎo)航,在國(guó)內(nèi)外算法競(jìng)賽中累計(jì)獲獎(jiǎng)20余次。 寧星星:容聯(lián)云AI研究院NLP算法專家,華南理工大學(xué)碩士。深耕NLP領(lǐng)域,從事語(yǔ)義解析、文本理解、文本校對(duì)、大模型(LLM)等方向的研究與應(yīng)用。曾獲CCKS(2020、2022)、百度千言(2022)、WAIC(2022)、CCF-BDCI(2021)、百度AI創(chuàng)新大賽(2021)、NLPCC(2020)等在內(nèi)的多項(xiàng)Top3競(jìng)賽獎(jiǎng)項(xiàng),并參與研發(fā)容聯(lián)云赤兔大模型。
- >
自卑與超越
- >
名家?guī)阕x魯迅:故事新編
- >
煙與鏡
- >
我從未如此眷戀人間
- >
龍榆生:詞曲概論/大家小書(shū)
- >
苦雨齋序跋文-周作人自編集
- >
巴金-再思錄
- >
月亮與六便士