基于知識本體的俄漢可比語料庫建設與應用研究 版權信息
- ISBN:9787519261450
- 條形碼:9787519261450 ; 978-7-5192-6145-0
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
基于知識本體的俄漢可比語料庫建設與應用研究 本書特色
可比語料庫作為近年來語料庫研究的熱點方向之一,可廣泛應用于語言學研究和自然語言處理領域。本體是一種基于語義網技術的知識表示方法,它與可比語料庫的融合式研究是對可比語料獲取、組織和應用方法的一次革新,將更好地發揮可比語料庫的效能并擴展其應用領域。經過前期調查分析,國內外鮮有俄漢可比語料庫相關研究,未見基于本體的俄漢可比語料庫相關成果。
本研究首先在理論層面分析了可比語料庫研究的現存問題,提出將本體引入可比語料庫研究的思路,并以此為基礎提出了基于本體的可比語料庫理論構想。隨后在實踐層面將該理論構想運用到了面向俄漢可比語料庫的多語言復合型本體構建、基于該本體的俄漢可比語料獲取、語料庫構建和語料庫應用等核心問題的研究中。
基于知識本體的俄漢可比語料庫建設與應用研究 內容簡介
本書是一本個人學術專著。可比語料庫作為近年來語料庫研究的熱點方向之一,可廣泛應用于語言學研究和自然語言處理領域。本體是一種基于語義網技術的知識表示方法,它與可比語料庫的融合式研究是對可比語料獲取、組織和應用方法的一次革新,將更好地發揮可比語料庫的效能并擴展其應用領域。經過前期調查分析,靠前外鮮有俄漢可比語料庫相關研究,未見基于本體的俄漢可比語料庫相關成果。本研究首先在理論層面分析了可比語料庫研究的現存問題,提出將本體引入可比語料庫研究的思路,并以此為基礎提出了基于本體的可比語料庫理論構想。隨后在實踐層面將該理論構想運用到了面向俄漢可比語料庫的多語言復合型本體構建、基于該本體的俄漢可比語料獲取、語料庫構建和語料庫應用等核心問題的研究中。
基于知識本體的俄漢可比語料庫建設與應用研究 目錄
緒論
0.1 研究背景
0.2 研究意義
0.3 研究現狀
0.4 研究內容
0.5 研究方法
0.6 創新點和難點
0.7 研究架構
**章 可比語料庫研究綜論
1.0 本章引言
1.1 可比與類比的術語界定
1.2 定義重構與分類研究
1.2.1 定義的分析與重構
1.2.2 分類的標準與方法
1.3 可比語料庫構建方法
1.3.1 基于現存語料庫的構建方法
1.3.2 基于網絡資源的構建方法
1.3.2.1 基于新聞網站的可比語料庫構建
1.3.2.2 基于維基百科的可比語料庫構建
1.3.2.3 基于網絡的領域可比語料庫構建
1.3.3 基于混合數據的構建方法
1.4 語料的可比度及其計算
1.4.1 單語種語料的可比度計算
1.4.2 多語種語料的可比度計算
1.5 俄語可比語料庫研究現狀
1.6 本章小結
第二章 基于本體的可比語料庫理論構想
2.0 本章引言
2.1 本體和語料庫融合式研究的理論前提
2.1.1 本體的定義
2.1.2 本體的構建方法
2.1.3 多語種本體的構建
2.1.3.1 衍生拓展法
2.1.3.2 扣介語映射法
2.1.3.3 關系注釋法
2.1.4 基于語料的本體研究
2.1.4.1 基于語料的概念抽取
2.1.4.2 基于語料的概念關系抽取
2.1.5 基于本體的語料庫研究
2.2 基于本體的可比語料庫理論體系
2.2.1 吾言信息層面語料與本體的理論關系
2.2.2 面向單語料知識描述的理論模型
2.2.3 基于本體的可比語料庫結構模型
2.2.4 面向可比語料庫的本體構建問題
2.2.4.1 構建目標
2.2.4.2 構建方法
2.2.4.3 其他重要問題
2.2.5 基于本體的可比語料獲取問題
2.2.5.1 基于本體獲取領域種子詞
2.2.5.2 基于本體獲取可比語料
2.2.6 基于本體的可比語料庫構建問題
2.2.7 基于本體的可比語料庫應用問題
2.3 本章小結
第三章 面向俄漢可比語料庫的烏克蘭事件復合型本體(MOлKYC)
3.0 本章引言
3.1 MOлKYC概覽與總體設計
3.1.1 MOлKYC的定義與結構
3.1.2 MOлKYC的構建目標
3.1.3 MOлKYC的構建方法
3.1.4 MOлKYC其他重要問題
3.2 MOлKYC領域知識類
3.2.1 領域知識類需求分析與結構設計
3.2.2 基于烏克蘭事件領域語料的知識獲取
3.2.3 MOлKYC人物子類
3.2.4 MOлKYC地點子類(place)
3.2.5 MOлKYC組織子類(organization)
3.2.6 MOлKYC寸間子類(time)
3.2.7 MOлKYC客體子類(object)
3.2.8 MOлKYC行為子類(action)
3.3 MOлKYC語料描述類
3.3.1 語料描述類需求分析與結構設計
3.3.2 MOлKYC單語料描述方法
3.3.3 MOлKYC可比語料描述方法
3.3.4 MOлKYC原始語料子類(original corpora)
3.3.5 MOлKYC可比語料子類(comparable corpora)
3.4 MOлKYC中俄實例關聯
3.5 本章小結
第四章 基于MOлKYC的俄漢可比語料獲取與語料庫構建
4.0 本章引言
4.1 基于MOлKYC的俄漢可比語料獲取
4.1.1 基于MOлKYC的俄漢種子詞獲取
4.1.1.1 基于Jena的本體解析方法
4.1.1.2 基于本體獲取種子詞的程序實現
4.1.1.3 基于MOлKYC的種子詞獲取結果
4.1.2 基于MOлKYC的俄漢維基語料獲取
4.1.2.1 核心問題分析與討論
4.1.2.2 俄漢維基可比語料獲取的方法
4.1.2.3 俄漢維基可比語料獲取的程序實現
4.1.2.4 維基百科語料獲取結果
4.1.3 基于MOлKYC的俄漢新聞語料獲取
4.1.3.1 面向新聞語料獲取的種子詞選取
4.1.3.2 新聞語料獲取工具與過程
4.1.3.3 俄漢新聞語料獲取結果
4.2 基于MOлKYC的俄漢可比語料庫構建
4.2.1 MOлKYC俄漢原始語料實例的處理與導入
4.2.1.1 中文文原始語料的處理方法
4.2.1.2 俄文原始語料的處理方法
4.2.1.3 語料處理與導入程序實現
4.2.1.4 中俄文語料處理與導入結果
4.2.2 MOлKYC俄漢可比語料實例的處理與導入
4.2.2.1 核心問題的分析討論
4.2.2.2 可比語料實例的關系建立
4.2.2.3 可比語料實例的數據屬性
4.2.2.4 俄漢跨語言相似度計算
4.2.2.5 可比語料實例處理導入結果
4.3 本章小結
第五章 基于MOлKYC的俄漢可比語料庫應用
5.0 本章引言
5.1 應用一:語料復雜查詢與語義檢索系統
5.1.1 基于詞匯的檢索
5.1.2 基于句子的檢索
5.1.3 跨語言語料檢索
5.1.4 語料可比性推理
5.1.5 程序實現
5.2 應用二:基于多維特征的語料可比度評估系統
5.2.1 思路來源
5.2.2 概念定義
5.2.3 實施方法
5.2.4 具體算法
5.2.5 多維可比度示例
5.2.6 多維可視化分析
5.2.7 程序實現
5.2.8 應用優勢
5.3 應用三:跨語言文本推薦與信息整合系統
5.3.1 思路來源
5.3.2 概念定義
5.3.3 實施方法
5.3.4 程序實現
5.3.5 應用優勢
5.4 本章小結
結論
參考文獻
展開全部
基于知識本體的俄漢可比語料庫建設與應用研究 作者簡介
原偉,博士,副教授,上海外國語大學在站博士后,信息工程大學教師,多年從事俄語及中亞非通用語教學工作,研究方向為計算語言學和語料庫語言學。近年來已編撰出版詞典3部、編寫大學本科教材9部,出版專著1部,發表學術論文30余篇。作為課題負責人主持國家社科基金項目2項、中國博士后科學基金項目2項、省部級項目2項、地市級重點項目4項,參與國防973項目、國家社科基金重大項目、一般項目在內的各類課題7項。