中文科研領域命名實體知識圖譜的構建與應用 版權信息
- ISBN:9787509587201
- 條形碼:9787509587201 ; 978-7-5095-8720-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
中文科研領域命名實體知識圖譜的構建與應用 本書特色
本書以互聯網Web2.0為背景分析了科研領域命名實體知識圖譜基于語義網技術的構建與應用。首先,梳理了國內外語義網的研究框架與重要應用技術的文獻;其次分析中文命名實體在圖書期刊、科研會議、專利管理和商業網絡知識庫等領域的應用現狀、取得成果及其存在的問題;第三,針對上述問題,分析借用國外網絡知識技術方法和應用,借鑒國外知識庫聯合協作的開發運營理念;第四,研究中文命名實體知識圖譜的頂層框架,主要的實體類別和實體間的關系;第五在前面研究的基礎上提出基于異質網絡聚合的知識圖譜構建方法和應用策略。
中文科研領域命名實體知識圖譜的構建與應用 內容簡介
本書以互聯網Web2.0為背景分析了科研領域命名實體知識圖譜基于語義網技術的構建與應用。首先,梳理了國內外語義網的研究框架與重要應用技術的文獻;其次分析中文命名實體在圖書期刊、科研會議、專利管理和商業網絡知識庫等領域的應用現狀、取得成果及其存在的問題;第三,針對上述問題,分析借用國外網絡知識技術方法和應用,借鑒國外知識庫聯合協作的開發運營理念;第四,研究中文命名實體知識圖譜的頂層框架,主要的實體類別和實體間的關系;第五在前面研究的基礎上提出基于異質網絡聚合的知識圖譜構建方法和應用策略。
中文科研領域命名實體知識圖譜的構建與應用 目錄
第1章 緒論
1.1 知識圖譜與命名實體
1.1.1 知識圖譜的概念
1.1.2 命名實體的知識圖譜構建
1.1.3 國內外命名實體的知識圖譜構建
1.2 中文網絡知識庫存在的問題與研究的意義
1.2.1 海量信息與“信息孤島”的問題
1.2.2 本書的研究意義
1.3 關聯數據語義化聚簇研究綜述
1.3.1 虛擬國際規范檔VIAF關聯數據研究
1.3.2 Wikipedia及其系列項目知識庫研究
1.3.3 語義化基礎工具的研究
1.3.4 LDA主題模型
1.4 本書的研究內容和研究路線
第2章 基礎理論
2.1 語義Web的構成
2.1.1 RDF與關系數據庫
2.1.2 網絡本體語言OWL與本體的構建與應用
2.1.3 語義推理應用
2.1.4 基于數學關系的本體定義和邏輯公式
2.2 規范數據和關聯數據
2.2.1 規范數據的描述格式
2.2.2 規范數據的關聯
2.2.3 跨語言的一體化關聯數據Wikidata
2.3 語義聚簇
2.3.1 VIAF初期項目分析一連接德意志圖書館和美國國會
圖書館的規范文檔
2.3.2 VIAF周期性關聯實踐的算法流程及歧義處理
2.3.3 VIAF獨立網站服務開通的運營分析
2.3.4 VIAF與Wikidata的結合實踐與發展趨勢
2.4 基于主題模型的語義化
2.4.1 LDA輸入
2.4.2 LDA的假設
2.4.3 LDA的圖形表示與生成模型表示
2.4.4 LDA的參數估計
2.4.5 LDA的新樣本推斷
2.5 異構知識庫的實體定義與識別
2.5.1 使用RDF模式定義知識庫的實體、屬性及實體問的關系
2.5.2 命名實體知識圖譜的類層次定義與實例構建
2.5.3 中文命名實體的對齊
2.5.4 中文命名實體的識別困難
2.6 小結
第3章 基于個人屬性表的中文個人名稱規范記錄聚簇
3.1 名稱規范記錄與規范控制
3.1.1 CNASS結果集記錄未聚簇的問題分析
3.1.2 國內學者對名稱記錄聚簇的研究
3.1.3 VIAF匹配算法的參考
3.2 規范記錄實體匹配分析
3.2.1 CNASS檢索結果集總體特征
3.2.2 中文名稱規范記錄的各級表示方法
3.2.3 VIAF聚簇內詳細內容和結構分析
3.2.4 不同中文規范數據庫的特征比較
3.2.5 中文名稱規范記錄的匹配槍索點的構建
3.3 自動聚簇方法與實現
3.3.1 數據庫表的構建
3.3.2 數據預處理
3.3.3 名稱實體匹配和聚簇算法
3.3.4 聚簇結果分析
3.3.5 聚簇結果與VIAF匹配聚簇驗證
3.4 小結
第4章 基于作品關系擴展的中文個人名稱規范記錄聚簇
4.1 名稱規范記錄的FRBR語義化表示
4.2 中文個人名稱規范記錄聚簇的E—R分析
4.2.1 中文個人名稱規范記錄的實體分析
4.2.2 中文個人名稱規范記錄的實體關系分析
4.3 基于作品關系擴展的中文個人名稱規范記錄聚簇算法
4.3.1 基于外部關聯記錄的作品關系屬性擴展
4.3.2 基于作品關系擴展的中文個人名稱記錄識別與聚簇算法
4.4 中文個人名稱規范記錄聚簇實驗
4.4.1 實驗聚簇結果的評價指標和描述統計分析
4.4.2 聚簇的綜合效果分析
4.4.3 聚簇實驗結果分析
4.5 利用虛擬國際規范檔的Ccs記錄進行關聯擴展
4.5.1 CCS規范記錄號能否重定向到VIAF聚簇
4.5.2 VIAF聚簇中的ccs記錄的特征研究
4.6 小結
第5章 基于WiKidata的個人職業本體構建
5.1 中文名稱規范檢索系統結果集附加信息識別問題
5.2 wikidata個人名稱數據的職業表示方法
5.3 基于準馬爾可夫過程的職業層次關系分析
5.3.1 職業條目數據的獲取
5.3.2 職業上位關系的矩陣表示與特征研究
5.3.3 職業上位關系矩陣的準馬爾可夫轉化
5.3.4 結果分析
5.4 中文個人職業本體的推導
5.5 小結與展望
第6章 基于主題模型識別的個人名稱規范記錄聚簇
6.1 基于主題模型的記錄語義結構化問題
6.2 中文個人名稱規范記錄的主題模型構建
6.2.1 中文個人名稱規范記錄的主題特征分析
6.2.2 主題框架構建
6.2.3 主題詞抽取方法
6.2.4 基于主題詞方法的案例
6.3 實驗和結果分析
6.4 小結
第7章 機構實體知識庫構建研究
7.1 基于名稱的機構識別方法
7.1.1 名稱文本近似度識別
7.1.2 曾用名表簡稱表識別
7.1.3 分段識別
7.1.4 總體分支語義關聯識別
7.2 參考知識庫的機構
7.2.1 中文名稱規范數據庫的機構查詢分析
7.2.2 虛擬國際規范檔的機構
7.2.3 百度百科的機構分析
7.2.4 維基數據的機構
7.3 機構實體的分析與構建
7.3.1 機構的概念
7.3.2 機構的分類及類層次關系
7.3.3 機構實例庫的初步構建
7.3.4 機構庫實體結點構建
7.3.5 機構庫實例結點與外部知識庫的實例等同關系構建
7.4 命名實體知識圖譜概念層次定義和實例構建
7.5 小結
第8章 研究結論、局限與展望
8.1 研究結論
8.2 研究局限與展望
附錄A 個人名稱檢索語料
附錄B 示例:Amarc3—005.XML文件內容
附錄C 初步收集科研實體機構一總體機構名稱表
附錄D 本書術語的中英文對應表
參考文獻
后記
展開全部
中文科研領域命名實體知識圖譜的構建與應用 作者簡介
王瑞云,主要研究特長:語義網知識管理與信息經濟。山西省太原市塢城路92號山西大學經濟與管理學院。講師。