-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
神經機器翻譯:基礎、原理、實踐與進階 版權信息
- ISBN:9787121437526
- 條形碼:9787121437526 ; 978-7-121-43752-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
神經機器翻譯:基礎、原理、實踐與進階 本書特色
適讀人群 :本書適合高等院校計算機專業高年級本科生,以及人工智能、自然語言處理方向的研究生閱讀,也可供機器翻譯研究者、實踐者、使用者,以及機器翻譯行業的管理者、人工翻譯研究人員等對機器翻譯技術感興趣的讀者參考。√ 探索神經機器翻譯的理論基礎、經典算法、原理技術、實踐方法與前沿進展 √ 揭示隱藏于不同機器翻譯研究范式背后的科學問題 √ 開啟理解機器翻譯技術的全新視角 √ 技術與短評雙主線敘事,不止于技術 除了算法、模型、公式,本書特別撰寫了20 篇短評,串起神經機器翻譯技術背后的歷史、故事、思想、哲學、爭議和規范等。例如: 統計與規則的競爭 - 自然語言處理之經驗主義與理性主義 - 卷積神經機器翻譯——實用性倒逼技術創新 - 超參數設置——自動優化與實驗可復現性 - 機器翻譯工業部署 - 神經機器翻譯達到人類同等水平了嗎? - 神經機器翻譯是瘋子嗎?兼談其‘幻想’ - 預訓練技術爭議與語言符號奠基問題 短評串聯不同技術及同一技術的不同發展階段,更好地介紹技術背后的思想、爭議及發展原因。為機器翻譯研究者、實踐者、使用者、愛好者和旁觀者等提供理解機器翻譯技術的新視角!
神經機器翻譯:基礎、原理、實踐與進階 內容簡介
本書旨在對現階段的神經機器翻譯技術和開放問題進行介紹,力求以通俗易懂的語言向讀者系統化展現神經機器翻譯的內涵和外延。本書內容主要包括三部分:基礎篇主要介紹神經機器翻譯的基本原理,發展脈絡、核心技術及若干改進方法,本篇也提供了必要的神經網絡和自然語言處理基礎知識;實踐篇旨在激發讀者更多的實戰興趣,將神經機器翻譯基本技術轉為璀璨的場景應用,內容包括如何訓練一個神經機器翻譯系統、如何在不同計算環境下部署神經機器翻譯以及如何動手實現一個神經機器翻譯系統;進階篇則主要為有興趣進一步探索和推動神經機器翻譯技術發展的讀者準備的,該篇概述了神經機器翻譯面臨的幾個主要挑戰、開放問題以及近期新的研究進展,如篇章級神經機器翻譯、低資源神經機器翻譯、多模態和魯棒性神經機器翻譯等近期新研究主題。
神經機器翻譯:基礎、原理、實踐與進階 目錄
推薦序
前言
數學符號
第1 章緒論/1
1.1 引言/ 2
1.2 基本思想/ 6
1.3 解碼/ 12
1.4 神經機器翻譯與統計機器翻譯對比/18
1.5 發展歷史/27
1.6 應用現狀/29
1.7 本書組織/33
1.8 閱讀材料/35
1.9 短評:統計與規則的競爭/36
第I 部分基礎篇
第2 章神經網絡基礎/41
2.1 神經網絡/42
2.2 神經網絡訓練/48
2.3 常用神經網絡簡介/61
2.4 閱讀材料/70
2.5 短評:神經網絡與自然語言處理關系演變/71
第3 章自然語言處理基礎/75
3.1 語言模型/ 76
3.2 詞嵌入/82
3.3 對齊/ 90
3.4 語言分析/ 93
3.5 閱讀材料/99
3.6 短評:自然語言處理之經驗主義與理性主義/100
第II 部分原理篇
第4 章經典神經機器翻譯/105
4.1 編碼器-解碼器結構/106
4.2 序列到序列學習/112
4.3 訓練/114
4.4 解碼/114
4.5 閱讀材料/116
4.6 短評:神經機器翻譯之獨立同發現——編碼器-解碼器vs. 序列到序列/117
第5 章基于注意力的神經機器翻譯/119
5.1 經典神經機器翻譯模型的瓶頸/120
5.2 注意力機制/120
5.3 注意力機制的改進/124
5.4 基于注意力的多層神經機器翻譯模型GNMT/127
5.5 閱讀材料/128
5.6 短評:注意力機制與認知注意/129
第6 章基于卷積神經網絡的神經機器翻譯模型/131
6.1 卷積編碼器/132
6.2 全卷積序列到序列模型/133
6.3 ByteNet/137
6.4 閱讀材料/139
6.5 短評:卷積神經機器翻譯——實用性倒逼技術創新/140
第7 章基于自注意力的神經機器翻譯/142
7.1 自注意力機制/143
7.2 Transformer 模型/144
7.3 自注意力改進方法/149
7.4 閱讀材料/152
7.5 短評:Transformer 帶來的自然語言處理技術革新/153
第8 章神經機器翻譯若干基礎問題及解決方案/156
8.1 開放詞匯表/157
8.2 深度模型/161
8.3 快速解碼/162
8.4 模型融合/166
8.5 領域適應/169
8.6 閱讀材料/172
8.7 短評:再談神經機器翻譯新思想新技術的誕生/173
第III 部分實踐篇
第9 章數據準備/176
9.1 平行語料/177
9.2 語料獲取/179
9.3 數據過濾與質量評估/183
9.4 數據處理/186
9.5 閱讀材料/188
9.6 短評:淺談數據對機器翻譯的重要性 /188
第10 章訓練/191
10.1 mini-batch 設置/192
10.2 學習速率設置/195
10.3 隨機梯度下降算法選擇/197
10.4 其他超參數選擇/200
10.5 分布式訓練/202
10.6 Transformer 訓練設置/207
10.7 閱讀材料/209
10.8 短評:超參數設置——自動優化與實驗可復現性/ 210
第11 章測試/213
11.1 解碼/214
11.2 解碼和訓練不一致/218
11.3 機器翻譯評測方法/ 220
11.4 錯誤分析/ 223
11.5 閱讀材料 /225
11.6 短評:評測驅動機器翻譯研究/ 225
第12 章部署/233
12.1 GPU 環境下的部署/234
12.2 CPU 環境下的部署/237
12.3 智能終端部署/240
12.4 模型壓縮與計算加速/244
12.5 閱讀材料/245
12.6 短評:機器翻譯工業部署 /246
第13 章系統設計與實現/251
13.1 總體設計/252
13.2 功能設計/254
13.3 開源系統/ 257
13.4 FAIRSEQ 解析/259
13.5 閱讀材料/264
13.6 短評:機器翻譯開源之路/ 264
第IV 部分進階篇
第14 章語篇級神經機器翻譯/271
14.1 什么是語篇/272
14.2 語篇級機器翻譯面臨的挑戰/274
14.3 語篇級機器翻譯形式化定義/275
14.4 語篇級神經機器翻譯方法 /276
14.5 面向語篇現象的機器翻譯評測數據集/288
14.6 語篇級機器翻譯評測方法/288
14.7 未來方向/289
14.8 閱讀材料/290
14.9 短評:神經機器翻譯達到人類同等水平了嗎/292
第15 章低資源及無監督神經機器翻譯/296
15.1 低資源語言與資源稀缺挑戰/297
15.2 低資源神經機器翻譯/298
15.3 無監督機器翻譯/305
15.4 未來方向/311
15.5 閱讀材料/312
15.6 短評:無監督機器翻譯之美及挑戰/ 312
第16 章融合知識的神經機器翻譯/315
16.1 知識與機器翻譯 /316
16.2 語言學知識融合/318
16.3 非語言學知識融合/324
16.4 雙語知識融合/328
16.5 內部知識遷移/332
16.6 未來方向/337
16.7 閱讀材料/337
16.8 短評:淺談基于知識的機器翻譯/ 338
第17 章魯棒神經機器翻譯/342
17.1 魯棒性概述/343
17.2 對抗魯棒性/346
17.3 對抗樣本生成/347
17.4 對抗訓練/355
17.5 數據集/356
17.6 未來方向/358
17.7 閱讀材料/359
17.8 短評:神經機器翻譯是瘋子嗎?兼談其“幻想”/ 360
第18 章多語言神經機器翻譯/363
18.1 基本思想與形式化定義/364
18.2 多語言機器翻譯vs. 雙語機器翻譯/365
18.3 多語言神經機器翻譯模型/367
18.4 訓練數據采樣方法/ 375
18.5 大規模多語言神經機器翻譯/376
18.6 多語言神經機器翻譯向雙語神經機器翻譯遷移/ 384
18.7 未來方向/386
18.8 閱讀材料/389
18.9 短評:多語言機器翻譯之美/390
第19 章語音與視覺多模態神經機器翻譯/393
19.1 文本模態之外的機器翻譯 /394
19.2 端到端語音翻譯/ 395
19.3 視覺引導的多模態神經機器翻譯/ 407
19.4 閱讀材料/ 417
19.5 短評:預訓練技術爭議與符號奠基問題/ 419
第20 章發展趨勢與展望/427
20.1 展望/ 428
20.2 本書未覆蓋內容/ 429
20.3 短評:科幻中的機器翻譯與未來機器翻譯/ 433
參考文獻/439
索引/482
神經機器翻譯:基礎、原理、實踐與進階 作者簡介
熊德意 天津大學智能與計算學部教授、博士生導師、自然語言處理實驗室負責人,天津大學“語言智能與技術”中外聯合研究中心主任,天津大學-中譯語通自然語言處理聯合實驗室主任、中譯語通人工智能首席科學家。主要研究方向為自然語言處理,特別專注于機器翻譯、對話、問答、自然語言生成、常識推理、認知計算等方向的研究。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等國際著名期刊和會議上發表論文100余篇,在Springer出版英文專著一部。獲得國家自然科學基金優秀青年科學基金、國家重點研發計劃“政府間國際科技合作創新合作”重點專項、英國皇家學會牛頓高級學者基金等資助。獲得新加坡資訊通信研究院2008年年度研究貢獻獎、北京市科學技術獎二等獎、中文信息學會“錢偉長中文信息處理科學技術獎-漢王青年創新獎”一等獎等獎項。曾是亞洲自然語言處理聯合會AFNLP干事、新加坡中文與東方語文信息處理學會理事會成員,目前是中國中文信息學會理事。擔任IALP 2012&2021程序委員會共同主席,CWMT 2017程序委員會共同主席,歐盟多國聯合項目QTLeap咨詢專家,ACL、EMNLP、NAACL、COLING等多個知名國際會議領域主席,以及TACL和ARR的Action Editor等。 李良友 華為諾亞FANGZHOU實驗室研究員、機器翻譯團隊負責人。在歐盟瑪麗居里項目資助下,于2017年獲得都柏林城市大學計算機博士學位。主要研究方向為自然語言處理,特別專注于機器翻譯相關技術領域的研發。在ACL、EMNLP等多個國際著名會議和期刊上發表論文10余篇,并擔任ACL、EMNLP等國際會議領域主席和會議審稿人。 張 檬 華為諾亞FANGZHOU實驗室研究員。于2018年獲得清華大學計算機科學與技術系博士學位。主要研究方向為機器翻譯和跨語言自然語言處理。在ACL、EMNLP、AAAI、TASLP等國際著名會議和期刊上發表論文10余篇。曾獲中國中文信息學會優秀博士學位論文提名獎。擔任ACL、EMNLP、AAAI、IJCAI等多個知名國際會議審稿人。
- >
李白與唐代文化
- >
姑媽的寶刀
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
莉莉和章魚
- >
伊索寓言-世界文學名著典藏-全譯本
- >
二體千字文
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)