**部分 知識庫構建
第1章 知識庫構建技術概況 3
1.1 知識庫構建背景及意義 3
1.2 知識庫構建研究現狀 4
1.2.1 大規模網絡數據采集 4
1.2.2 網絡信息抽取 6
1.2.3 RDF數據存儲與查詢技術 7
1.2.4 實體對齊研究 9
本章小結 10
第2章 知識庫構建基礎知識 11
2.1 RDF簡介 11
2.2 SPARQL簡介 13
2.3 開源爬取框架Scrapy 14
2.3.1 Scrapy框架簡述 14
2.3.2 優缺點分析 17
2.4 NoSQL數據庫MongoDB 17
2.5 圖數據庫介紹 18
本章小結 19
第3章 數據采集技術 20
3.1 數據源采集 20
3.1.1 數據選擇依據 20
3.1.2 數據的采集格式 20
3.1.3 數據獲取方式 21
3.2 數據集的挑戰 21
3.2.1 目標數據的高速采集 21
3.2.2 目標網站的反爬取機制與速率限制 22
3.3 大規模數據采集系統的設計與實現 22
3.3.1 采集框架 23
3.3.2 數據采集系統的具體實現 23
3.4 代理IP信息獲取 24
3.4.1 XPath表達式 25
3.4.2 代理IP獲取方式 25
3.4.3 正則表達式獲取 25
3.4.4 XPath模板生成 26
3.4.5 候選表達式 26
3.4.6 排序及抽取 28
3.4.7 信息驗證 28
本章小結 29
第4章 數據處理 30
4.1 實體數據 30
4.1.1 網頁內容抽取 30
4.1.2 RDF轉化 31
4.2 信息抽取、轉化、存儲與查詢的挑戰 32
4.2.1 信息抽取與數據轉化 32
4.2.2 信息的存儲與查詢 32
4.3 實體信息抽取與轉化 32
4.3.1 信息抽取 32
4.3.2 數據轉化 35
4.3.3 RDF數據規范化 35
4.4 數據存儲和查詢 36
4.4.1 整體框架 36
4.4.2 關鍵技術 36
4.5 非結構化知識抽取 39
4.5.1 實體關系抽取簡介 39
4.5.2 面向非結構化數據的知識抽取 39
4.5.3 弱監督學習的關系抽取 42
4.5.4 NFTritraining弱監督關系抽取算法 42
本章小結 45
第5章 異構數據源實體對齊 46
5.1 實體對齊的研究方向 46
5.2 實體對齊算法簡介 47
5.2.1 LCS算法 47
5.2.2 網絡語義標簽實體對齊算法 47
5.2.3 基于屬性權重的實體對齊算法 50
5.3 基于主題模型的中文異構百科實體對齊方法 51
5.3.1 實體對齊框架 51
5.3.2 實體上下文建模 52
5.3.3 基于LCS的屬性相似度計算 53
5.3.4 基于主題特征的相似度計算方法 53
本章小結 54
第6章 面向知識圖譜的知識推理 55
6.1 常見的知識庫 55
6.2 推理的概念及分類 56
6.2.1 推理的概念 56
6.2.2 推理的分類 57
6.3 知識推理的任務 58
6.3.1 知識圖譜補全 58
6.3.2 知識圖譜去噪 60
6.4 基于邏輯的知識推理 60
6.5 基于統計的知識推理 64
6.5.1 基于隱特征的實體關系學習 64
6.5.2 基于圖特征的實體關系學習 65
6.5.3 實體類型推理 66
6.6 基于神經網絡的知識推理 66
6.6.1 基于語義的推理 67
6.6.2 基于結構的推理 68
6.6.3 基于輔助存儲的推理 69
6.7 知識推理應用 70
本章小結 70
第2部分 智能問答技術
第7章 智能問答技術概況 75
7.1 智能問答背景及意義 75
7.2 智能問答研究現狀 77
7.3 智能問答關鍵技術 79
7.4 智能問答系統框架及流程 80
7.4.1 智能問答系統框架 80
7.4.2 問句理解 80
7.4.3 答案檢索 82
本章小結 82
第8章 智能問答基礎知識 83
8.1 句法分析 83
8.2 機器學習算法 84
8.2.1 CRF算法 84
8.2.2 熵算法 85
本章小結 87
第9章 問句理解 88
9.1 語料收集 88
9.2 問句介紹 88
9.3 詞法分析 90
9.3.1 中文分詞 90
9.3.2 詞性標注 90
9.4 問句分類 95
9.4.1 問句分類流程及原理 95
9.4.2 問句分類實驗結果與分析 96
9.5 主體識別 97
9.5.1 人物類問句的主體識別 97
9.5.2 非人物類問句的主體識別 97
9.5.3 主體識別實驗結果與分析 98
9.6 謂詞識別 99
9.6.1 謂詞詞典構建 99
9.6.2 基于謂詞詞典和句法分析結合的謂詞識別 100
9.6.3 謂詞識別實驗結果與分析 101
9.7 謂詞消歧 102
9.8 問句元轉換 103
9.8.1 問句元轉換規則 103
9.8.2 問句元轉換實驗結果與分析 104
本章小結 105
第3部分 基于知識庫的智能問答系統
0章 答案檢索 109
10.1 知識獲取 109
10.2 基于RDF知識庫的答案檢索 110
10.2.1 SPARQL簡介 111
10.2.2 SPARQL結構化查詢語句 111
10.2.3 SPARQL結構化查詢模板 112
10.2.4 答案提取 115
10.3 基于Web的答案檢索方法 117
本章小結 118
1章 智能問答系統部署與演示 119
11.1 系統部署 119
11.2 答案檢索過程 119
本章小結 122
參考文獻 123