-
>
公路車寶典(ZINN的公路車維修與保養秘籍)
-
>
晶體管電路設計(下)
-
>
基于個性化設計策略的智能交通系統關鍵技術
-
>
花樣百出:貴州少數民族圖案填色
-
>
山東教育出版社有限公司技術轉移與技術創新歷史叢書中國高等技術教育的蘇化(1949—1961)以北京地區為中心
-
>
鐵路機車概要.交流傳動內燃.電力機車
-
>
利維坦的道德困境:早期現代政治哲學的問題與脈絡
數據驅動的機器翻譯技術 版權信息
- ISBN:9787121483073
- 條形碼:9787121483073 ; 978-7-121-48307-3
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據驅動的機器翻譯技術 內容簡介
機器翻譯是由計算機自動將一種自然語言翻譯成另一種自然語言的過程。隨著語言資源規模的持續增長和計算機硬件技術的大幅提高,數據驅動的機器翻譯方法逐漸獲得了研究者的青睞,翻譯效果取得了顯著的提升。本書梳理了機器翻譯的基礎理論和研究進展,指出了數據驅動的機器翻譯方法所面臨的問題,詳細介紹了具有代表性的改進方法。這些方法既包括對句法語義、詞形和零代詞、翻譯記憶等先驗知識的建模及融合,也涉及深度神經網絡、無監督樹學習、生成對抗訓練、聯合學習、因果推斷等前沿技術,可供希望深入了解機器翻譯研究進展的讀者參考。本書的*后對數據驅動的機器翻譯技術進行了總結,并對未來的研究方向進行了展望。
數據驅動的機器翻譯技術 目錄
1.1 研究背景及意義1
1.2 機器翻譯發展簡史2
1.3 研究內容及全書總覽4
參考文獻8
第2章 基礎理論9
2.1 基于規則的機器翻譯9
2.2 基于實例的機器翻譯10
2.3 統計機器翻譯11
2.3.1 噪聲信道模型11
2.3.2 對數線性模型12
2.3.3 基于短語的統計機器翻譯模型12
2.3.4 基于句法的統計機器翻譯模型14
2.3.5 語言模型16
2.3.6 統計機器翻譯存在的問題20
2.4 神經機器翻譯20
2.4.1 基于循環神經網絡的神經機器翻譯模型21
2.4.2 基于卷積神經網絡的神經機器翻譯模型24
2.4.3 基于注意力網絡的神經機器翻譯模型27
2.4.4 束搜索30
2.4.5 神經機器翻譯存在的問題及發展趨勢31
參考文獻34
第3章 基于句法語義知識的統計機器翻譯44
3.1 引言44
3.2 基于句法和語義的統計機器翻譯基礎方法45
3.2.1 基于句法的統計機器翻譯模型46
3.2.2 語義角色標注47
3.2.3 語義角色標注在統計機器翻譯中的應用48
3.2.4 串到樹模型49
3.3 基于淺層語義結構的統計機器翻譯52
3.3.1 謂詞-論元增強型句法樹52
3.3.2 句法補充的謂詞-論元樹54
3.3.3 翻譯規則的學習55
3.3.4 實驗與分析56
3.4 基于句法語言模型的統計機器翻譯62
3.4.1 句法語言建模的基礎方法62
3.4.2 融合淺層句法特征的循環神經網絡語言模型63
3.5 本章小結70
參考文獻71
第4章 句法知識與神經機器翻譯聯合學習模型82
4.1 引言82
4.2 樹結構學習的基礎方法83
4.2.1 樹結構的神經網絡編碼器84
4.2.2 樹結構的神經網絡解碼器85
4.2.3 無監督樹學習85
4.2.4 利用統計機器翻譯短語表87
4.2.5 在神經機器翻譯中學習短語87
4.2.6 基于句法的神經機器翻譯88
4.2.7 對齊學習89
4.3 源端句法信息與神經機器翻譯聯合學習模型89
4.3.1 無監督樹編碼器90
4.3.2 無監督樹與神經機器翻譯聯合學習92
4.3.3 實驗分析97
4.3.4 實例分析101
4.4 雙語句法成分對齊與神經機器翻譯聯合學習模型105
4.4.1 概述105
4.4.2 無監督樹編碼器107
4.4.3 對齊樣本構建107
4.4.4 深度度量損失108
4.4.5 實驗分析109
4.5 基于跨語言句法互信息的機器翻譯114
4.5.1 概述114
4.5.2 雙語句法對齊117
4.5.3 優選化雙語句法相互依存120
4.5.4 實驗分析121
4.6 本章小結126
參考文獻126
第5章 基于句子對齊信息的機器翻譯訓練138
5.1 引言138
5.2 問題分析141
5.3 基于自注意力機制的對齊判別器143
5.3.1 基于門控自注意力網絡的句子編碼器144
5.3.2 句子對齊得分計算與判別器損失函數145
5.3.3 判別器訓練數據構建與預訓練146
5.4 基于對齊信息的神經機器翻譯對抗訓練147
5.4.1 判別損失函數147
5.4.2 Gumbel-Softmax 采樣148
5.4.3 教師強制步驟149
5.4.4 固定的判別器與對抗的判別器149
5.5 基于對齊感知的神經機器翻譯解碼方法150
5.5.1 融合判別器得分的解碼得分151
5.5.2 融合基于對齊的價值網絡解碼151
5.6 本章小結152
參考文獻157
第6章 融合翻譯記憶的神經機器翻譯方法163
6.1 引言163
6.2 問題分析163
6.3 融合翻譯記憶相似度的文本預處理方法165
6.3.1 模板165
6.3.2 相關工作166
6.3.3 基于多維相似度的機器翻譯測試集預處理策略167
6.4 融合翻譯記憶的機器翻譯訓練方法170
6.4.1 引言170
6.4.2 相關工作171
6.4.3 基于多維相似度的機器翻譯訓練方法172
6.4.4 實驗分析174
6.5 融合模板翻譯記憶的神經機器翻譯方法178
6.5.1 概述178
6.5.2 相關工作179
6.5.3 翻譯模板的定義與構建180
6.5.4 融合模板翻譯記憶的神經機器翻譯187
6.5.5 實驗分析191
6.6 本章小結197
參考文獻198
第7章 詞形預測與神經機器翻譯聯合模型202
7.1 引言202
7.2 問題分析204
7.2.1 拉丁字符大小寫對神經機器翻譯的影響204
7.2.2 單詞陰陽性對機器翻譯的影響206
7.3 大小寫敏感的神經機器翻譯207
7.3.1 神經機器翻譯模型207
7.3.2 引入大寫標注的神經機器翻譯208
7.3.3 神經機器翻譯與大寫預測聯合學習209
7.4 性別敏感的神經機器翻譯212
7.4.1 性別平衡偽數據構建方法213
7.4.2 插入性別標注214
7.4.3 性別預測與機器翻譯聯合建模214
7.5 本章小結215
參考文獻218
第8章 融合零代詞信息的機器翻譯方法225
8.1 引言225
8.2 零代詞推斷的基礎方法227
8.2.1 基于規則的方法227
8.2.2 序列標注法228
8.2.3 融入語義特征的方法229
8.3 基于特征的零代詞推斷方法232
8.3.1 融入雙語信息的語料重構232
8.3.2 零代詞處理方法235
8.4 基于CRF和SVM的零代詞信息構建方法236
8.4.1 基于CRF的零代詞位置標注236
8.4.2 基于SVM的零代詞分類238
8.5 基于深度學習的零代詞信息構建方法242
8.5.1 基于LSTM的零代詞位置標注243
8.5.2 基于LSTM的零代詞分類245
8.5.3 基于編碼器-解碼器架構的零代詞重構模型245
8.6 融合零代詞信息的統計機器翻譯247
8.6.1 概述247
8.6.2 語料預處理方法247
8.6.3 概率特征方法248
8.6.4 譯文重排序方法250
8.6.5 實驗分析251
8.6.6 實驗結果及分析254
8.7 基于無監督樹學習和零代詞重構的神經機器翻譯258
8.7.1 概述258
8.7.2 基于零代詞重構的口語機器翻譯模型259
8.7.3 實驗及分析263
8.8 本章小結271
參考文獻271
第9章 基于因果推斷的譯文評分去噪聲方法274
9.1 引言274
9.2 相關工作和背景知識278
9.2.1 NMT譯文長度偏置問題278
9.2.2 句子級譯文質量直接估計任務281
9.3 基于HSR的譯文評分降噪方法283
9.3.1 基于HSR的NMT解碼長度偏置修正283
9.3.2 討論285
9.3.3 譯文質量估計系統輸出降噪方法287
9.4 NMT長度偏置消除實驗290
9.4.1 回歸模型的選擇292
9.4.2 方法自適應性294
9.5 譯文質量估計系統去噪聲實驗296
9.6 本章小結299
參考文獻299
第10章 機器翻譯評價及相關評測會議306
10.1 機器翻譯評價指標307
10.1.1 準確率和召回率307
10.1.2 BLEU評價指標308
10.1.3 詞錯誤率WER308
10.1.4 翻譯編輯率TER309
10.1.5 NIST評價指標309
10.1.6 METEOR評價指標310
10.2 機器翻譯大會WMT310
10.3 全國機器翻譯大會CCMT312
10.4 國際口語翻譯大會IWSLT313
10.5 NIST機器翻譯公開評測314
10.6 亞洲語言機器翻譯研討會WAT315
參考文獻316
第11章 總結與展望319
11.1 本書總結319
11.2 未來研究方向展望320
數據驅動的機器翻譯技術 作者簡介
黃河燕,1963年10月生,籍貫湖南。1986年1月加入中國共產黨,1989年3月參加工作。1983年畢業于武漢測繪科技大學計算機系獲學士學位,1986年畢業于國防科技大學計算機系獲碩士學位,1989年畢業于中國科學院計算技術研究所獲博士學位,后留所工作,先后任助理研究員、副研究員、研究員;1997年至2009年在中科院計算機語言信息工程研究中心任副主任、研究員并先后兼任中科院華建集團黨委委員、副書記,2009年至今任北京理工大學計算機學院院長、教授,兼北京市海量語言信息處理與云計算應用工程技術研究中心主任及中-德語言信息處理聯合實驗室主任;現為國家"863計劃”主題專家組成員、中國人工智能學會及中國中文信息學會副理事長、教育部計算機教學指導委員會委員、北京市學位委員會委員。主持承擔了國家自科基金重點項目、"973計劃”課題、"863計劃”項目等20多項國家級科研攻關項目,獲得了國家科技進步一等獎等8項國家級和省部級獎勵,1997年享受國務院政府特殊津貼,2014年當選全國優秀科技工作者。
- >
中國歷史的瞬間
- >
推拿
- >
苦雨齋序跋文-周作人自編集
- >
隨園食單
- >
自卑與超越
- >
史學評論
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
二體千字文