-
>
妙相梵容
-
>
基立爾蒙文:蒙文
-
>
我的石頭記
-
>
心靈元氣社
-
>
女性生存戰爭
-
>
縣中的孩子 中國縣域教育生態
-
>
(精)人類的明天(八品)
知識圖譜(精)/新一代人工智能創新平臺建設及其關鍵技術叢書 版權信息
- ISBN:9787030727503
- 條形碼:9787030727503 ; 978-7-03-072750-3
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
知識圖譜(精)/新一代人工智能創新平臺建設及其關鍵技術叢書 內容簡介
本書系統介紹了知識圖譜的概念、發展歷程、技術體系、前沿技術與應用實踐。在基礎知識方面,本書囊括了知識圖譜從源數據到產生決策的全生命周期的各個環節,分析了數據圖譜和知識圖譜的核心區別,介紹了圖譜構建和知識表示等相關關鍵技術。在前沿技術方面,全面介紹了知識圖譜自動構建、知識圖譜融合和智能推理等問題和挑戰。在應用實踐方面,結合營銷智能國家新一代人工智能開放創新平臺建設,介紹了知識圖譜在信息檢索、推薦系統、可視化、問答機器人等場景下的實際操作案例。 本書適合高等院校人工智能、大數據、知識工程等專業本科生、研究生及教師等教學和科研使用。
知識圖譜(精)/新一代人工智能創新平臺建設及其關鍵技術叢書 目錄
“新一代人工智能創新平臺建設及其關鍵技術叢書”序
前言
**篇 基礎知識篇
第1章 知識圖譜概述 3
1.1 知識圖譜簡介 3
1.1.1 圖、圖譜與知識圖譜 3
1.1.2 知識圖譜的價值 4
1.1.3 知識圖譜的挑戰 5
1.2 知識圖譜的發展歷程 6
1.2.1 傳統的知識庫 6
1.2.2 現代的知識圖譜 7
1.2.3 人工智能時代的知識圖譜 8
1.2.4 數據圖譜與知識圖譜的對比 9
1.3 知識圖譜的組成 9
1.3.1 知識圖譜中的實體 10
1.3.2 知識圖譜中的關系 11
1.3.3 知識圖譜中的事件 12
1.4 知識圖譜構建技術流程 13
1.4.1 知識獲取 13
1.4.2 知識存儲 14
1.4.3 知識表示 15
1.4.4 知識抽取 16
1.4.5 知識融合 17
1.4.6 知識補全 18
1.5 知識圖譜的典型應用 19
1.5.1 知識圖譜可視化分析 19
1.5.2 知識圖譜與知識推理 20
1.5.3 知識圖譜與語義檢索 22
1.5.4 知識圖譜與智能問答 23
1.5.5 知識圖譜與推薦系統 25
1.6 本章小結 26
第2章 知識表示 27
2.1 知識表示簡介 27
2.1.1 知識表示的定義 27
2.1.2 知識表示與知識圖譜 28
2.2 知識表示的發展歷程 28
2.2.1 知識的邏輯符號表示 30
2.2.2 知識的框架表示 34
2.2.3 知識的語義網表示 39
2.2.4 知識的嵌入表示 43
2.3 知識圖譜的知識表示 47
2.3.1 知識圖譜中知識的框架表示 48
2.3.2 知識圖譜中知識的嵌入表示 50
2.4 本章小結 57
第3章 知識圖譜中的實體 58
3.1 實體的定義 58
3.1.1 實體的類型描述 58
3.1.2 實體的組織形式 59
3.2 實體抽取技術 60
3.2.1 實體抽取任務定義 60
3.2.2 實體抽取流程 60
3.3 命名實體識別技術 61
3.3.1 任務定義 61
3.3.2 實體的命名實體識別方法 61
3.3.3 基于深度學習的命名實體識別 66
3.4 實體集合擴展技術 71
3.4.1 任務定義 71
3.4.2 實體集合擴展方法 71
3.5 命名實體消歧技術 73
3.5.1 任務定義 74
3.5.2 基于傳統特征的命名實體消歧 75
3.5.3 基于任務優化的命名實體消歧 79
3.5.4 基于深度學習的命名實體消歧 81
3.6 實體抽取評測 82
3.6.1 評測指標 82
3.6.2 評測數據 87
3.6.3 評測比賽 91
3.7 本章小結 92
第4章 知識圖譜中的關系 93
4.1 關系的定義 93
4.1.1 關系的類型描述 93
4.1.2 關系的組織形式 95
4.2 關系抽取技術 95
4.2.1 關系抽取任務 95
4.2.2 關系抽取方法分類 96
4.2.3 基于模式的關系抽取 97
4.2.4 基于特征的關系抽取 102
4.2.5 基于深度學習的關系抽取 105
4.3 關系抽取評測 113
4.3.1 評測指標 113
4.3.2 評測數據 116
4.3.3 評測比賽 117
第5章 知識圖譜中的事件 119
5.1 事件的定義 119
5.1.1 事件的類型描述 120
5.1.2 事件的組織形式 120
5.2 事件抽取技術 122
5.2.1 事件抽取任務定義 122
5.2.2 事件抽取方法分類 123
5.2.3 基于簡單模式匹配的事件抽取 123
5.2.4 基于機器學習的事件抽取 126
5.2.5 開放域事件抽取 132
5.3 事件抽取評測 135
5.3.1 評測指標 135
5.3.2 相關評測會議及數據 136
第二篇 前沿技術篇
第6章 知識圖譜融合 143
6.1 融合任務的定義 143
6.1.1 融合任務描述 143
6.1.2 數據融合與知識圖譜融合的對比 145
6.1.3 實體融合 145
6.1.4 關系融合 146
6.1.5 本體融合 146
6.2 知識圖譜融合技術 147
6.2.1 實體對齊 147
6.2.2 關系對齊 150
6.2.3 本體對齊 154
6.3 知識圖譜融合評測 157
6.3.1 評測指標 158
6.3.2 評測數據 159
6.3.3 評測比賽 163
6.4 知識圖譜融合典型應用 164
6.4.1 常用外部資源 164
6.4.2 從數據倉庫到主題域圖譜 172
6.5 本章小結 174
第7章 知識圖譜推理 176
7.1 推理任務的定義 176
7.1.1 推理任務描述 176
7.1.2 推理任務分類 176
7.1.3 數據推理與知識圖譜推理的對比 178
7.2 知識圖譜推理技術 179
7.2.1 基于演繹的推理技術 180
7.2.2 基于規則的推理技術 188
7.2.3 基于模型的推理技術 192
7.2.4 線性推理方法 195
7.3 知識圖譜推理評測 198
7.3.1 評測指標 198
7.3.2 評測數據 199
7.3.3 評測比賽 200
7.4 知識圖譜推理典型應用 201
7.4.1 知識補全 201
7.4.2 知識問答 202
7.4.3 多事件因果推理 206
7.5 本章小結 207
第8章 知識圖譜搜索與推薦 208
8.1 搜索任務的定義 208
8.1.1 搜索任務描述 209
8.1.2 搜索任務分類 209
8.1.3 傳統搜索與知識圖譜搜索的對比 210
8.2 知識圖譜搜索技術 212
8.2.1 搜索流程框架 212
8.2.2 基于存儲結構的數據搜索 215
8.2.3 基于語義的數據搜索 217
8.2.4 基于深度學習的搜索 219
8.3 知識圖譜搜索評測 220
8.3.1 評測指標 220
8.3.2 評測數據 222
8.3.3 評測比賽 222
8.4 知識圖譜搜索典型應用 223
8.4.1 智能推薦 223
8.4.2 基于圖譜的信息檢索 227
8.4.3 知識庫問答 229
8.5 本章小結 230
第9章 知識圖譜的自動構建 231
9.1 知識圖譜構建的流程和核心要素 231
9.1.1 知識建模 232
9.1.2 知識存儲與知識表示 233
9.1.3 知識抽取 234
9.1.4 知識融合 240
9.2 知識圖譜構建的方法 240
9.2.1 自頂向下的構建方式 241
9.2.2 自底向上的構建方式 242
9.3 知識圖譜自動構建的困境 243
9.4 本章小結 244
第10章 事理圖譜 246
10.1 事理圖譜的概念和案例 246
10.1.1 事理圖譜的概念 246
10.1.2 事理圖譜的案例 248
10.2 事理圖譜的作用 251
10.3 事理圖譜的挑戰 253
10.4 本章小結 256
第三篇 應用實踐篇
第11章 企業級知識圖譜 259
11.1 企業級知識圖譜的作用 259
11.1.1 企業級知識圖譜構建的核心目標 259
11.1.2 企業級知識圖譜的難點 261
11.2 結構化數據治理 262
11.2.1 元數據管理 263
11.2.2 數據質量監控 265
11.3 非結構化數據的預處理 267
11.3.1 正則表達式 268
11.3.2 中文分詞問題 268
11.3.3 停用詞、標點的去除 269
11.3.4 特征提取 270
11.4 數據存儲和圖數據庫選擇 271
11.4.1 分布式存儲與分布式文件系統 271
11.4.2 圖數據庫的選擇 274
11.5 知識構建和維護的生命周期 276
11.5.1 知識建模 276
11.5.2 知識獲取 276
11.5.3 知識存儲 277
11.5.4 知識融合 277
11.5.5 知識計算 277
11.5.6 知識應用 277
11.6 本章小結 277
第12章 圖譜可視化 279
12.1 可視化概述 279
12.1.1 數據、信息和知識的定義 279
12.1.2 可視化分類 280
12.2 圖譜可視化表達 284
12.2.1 空間填充 284
12.2.2 節點鏈接圖 285
12.2.3 熱圖 286
12.2.4 鄰接矩陣 287
12.2.5 其他可視化表達 288
12.3 圖譜可視化方法 289
12.3.1 知識圖譜構圖 290
12.3.2 知識圖譜度量方法 291
12.3.3 知識圖譜布局方法 294
12.4 圖譜可視化實踐 295
12.4.1 D3 295
12.4.2 知識圖譜數據可視化實踐 296
12.5 本章小結 300
參考文獻 301
知識圖譜(精)/新一代人工智能創新平臺建設及其關鍵技術叢書 節選
**篇 基礎知識篇 第1章 知識圖譜概述 1.1 知識圖譜簡介 在過去的10~15年,知識圖譜及其相關應用已經在各個方面改變了人們的生活。無論是從搜索引擎中得到更直觀的搜索結果、在網上購物時借助推薦系統獲取更加個性化的購物體驗,還是近年來問世的種類繁多的語音助手,如Siri、Google Assistant以及小愛同學等,人們每天都在與知識圖譜進行無數次的交互。知識圖譜把復雜的知識領域通過數據挖掘、信息處理、知識計量和圖形繪制而顯示出來,揭示知識領域的動態發展規律,為科學研究和實際應用提供有價值的數據和智能支撐。本節從知識圖譜的概念、常見的知識圖譜以及知識圖譜的價值與應用三個方面對知識圖譜進行簡單的介紹。 1.1.1 圖、圖譜與知識圖譜 一個圖(graph)由節點和邊組成。當節點和邊有了語義標簽時,這個圖里就有了圖譜:可以按照邊的標簽來搜索和顯示分類(如is-a或part-of)連接的相關節點集合(圖集),如華譜系統里由 father-of關系連接的一份份家譜譜系圖。圖譜具有分類編輯的系統性和邏輯性,而不同的語義標簽可以在一個圖中連接不同的圖譜。當節點和邊的語義標簽有了領域知識對其進行解釋時,這個圖才能成為一個知識圖譜(knowledge graph)。 知識圖譜是一種語義圖譜。盡管“知識圖譜”這一專有名詞是Google公司于2012年提出的,但與知識圖譜這一概念相關的研究早已出現[1,2]。 知識圖譜由節點和邊組成,其中節點用于表示語義符號,而邊則表示語義符號之間的語義關系。知識圖譜中的節點可以是一個具體的實體,如人名“馬克龍”、地名“法國”等,也可以是某些抽象概念,如“總統”、“人工智能”等。知識圖譜中的邊代表了實體之間的各種關系,如親屬、合作等。知識圖譜中的邊還可以代表實體的屬性,如書籍的標題、城市的位置等。總體而言,知識圖譜是由學科專家借助人工智能技術和機器學習算法創建的知識領域模型,是一種揭示實體之間關系的語義網。圖1.1展示了一個知識圖譜的基本結構。 圖1.1 知識圖譜的基本結構 一般地,知識圖譜可以形式化地定義為由結構化三元組組成的有向圖,表示為,其中為實體集,;為關系集,;為三元組集合,。 以三元組(巴黎,位于,法國)為例,其中“巴黎”稱為頭實體,其類型為“城市”,“法國”稱為尾實體,其類型為“國家”,頭實體和尾實體之間的關系為“位于”。在某些三元組中,關系代表實體的某種屬性,相應地,此時尾實體也稱為屬性值,如(史蒂夫 喬布斯,出生于,1955年)。目前大多數知識圖譜都以三元組的形式來表示各種類型的知識,但知識圖譜中的知識表示(knowledge representation)除了這種以三元組表示的二元關系以外,也包括類別、屬性等不同粒度、不同層次的語義關系。 互聯網上存在海量的知識資源,這些知識資源大多數以非結構化的形式表示,如文本、音頻、圖片等。對于計算機,處理非結構化數據通常是非常困難的。知識圖譜對互聯網錯綜復雜的非結構化數據進行加工、處理和整合,將其轉化為清晰、簡潔的“實體-關系-實體”三元組和“實體-屬性”對,從而實現知識提取和知識整合,*終形成圖結構的知識庫,使得計算機可以輕松處理。 1.1.2 知識圖譜的價值 知識圖譜通過節點和關系對真實世界的各種場景進行直觀的建模,使用“圖”這種基礎的數據結構直觀、自然、高效地表達世界上的各種實體和關系。在表達能力方面,相比于傳統數據庫,知識圖譜表達關系的方式更加多樣,基于圖論等背景知識可以進行更加復雜多樣的關聯分析,滿足企業的分析和管理需求;在推理能力方面,可以基于知識圖譜的圖結構設計相應的業務規則,通過本體推理輔助業務決策;在時間和空間開銷方面,知識圖譜通常采用圖數據庫進行存儲,相比于傳統數據庫響應時間更短,計算能力更強,向用戶返回結果的速度更快。 自1984年Cyc①項目啟動以來,陸續出現了一系列的知識庫和知識圖譜項目,如通過專家知識構建的Cyc、WordNet②,通過互聯網資源及群體智能構建的Freebase③、DBpedia④、Wikidata⑤、YAGO[3]、BabelNet[4],以及使用機器學習技術自動構建的NELL[5]和Knowledge Vault[6]等。知識圖譜在多個領域都展現出了廣泛的應用價值。例如,美團公司構建了大規模餐飲娛樂知識圖譜“美團大腦”⑥,實現了對商家和消費者的多維度精準刻畫。當消費者在美食類目下以“魚”為關鍵字進行搜索時,可以通過知識圖譜得知“魚”是一種“食材”,進而在提供搜索結果時除了提供“清蒸魚”、“糖醋魚”等傳統的搜索結果外,還能夠提供“賽螃蟹”這樣的將魚肉作為主料的菜品,從而豐富了搜索結果,提升了用戶體驗。在金融領域,可以通過用戶在網絡的通信信息構建知識圖譜的關聯關系,對用戶在信貸行為上高頻交互過的人員和群組進行溯源,從而精準定位騙貸團伙,實現反欺詐領域的監控和預警。 總之,知識圖譜因其對現實世界進行建模的特點,已經成功俘獲了大批客戶,涉及金融、廣告、信息技術(IT)、社交網絡甚至傳統制造業等多個領域。在未來,隨著人工智能逐漸滲透到每一個人的生活中,知識圖譜勢必會得到更加廣泛的應用。 1.1.3 知識圖譜的挑戰 盡管知識圖譜已經在許多方面得到了廣泛的應用,但其目前仍有一些亟待解決的問題。其一是知識來源的缺失,或稱為知識的確定性問題。目前知識圖譜中的知識多是從維基百科(Wikipedia)等互聯網資源中經過清洗和處理得到的,而很難對這些知識進行溯源,進而證實或證偽。《華盛頓郵報》曾報道稱,通過Google得到的搜索結果缺少消息來源,“削弱了人們核實信息的能力”。其二是如何區分同名的不同實體,如網球運動員李娜和演員李娜。其三是如何通過知識圖譜進行推理,如某人的長子和次子之間的關系就是兄弟。 另外,目前絕大多數的知識圖譜并不包含圖譜中的實體和關系的任何背景信息,換句話說,大多數“知識圖譜”只是通過自然語言處理等技術從非結構化數據中生成的“數據圖譜”,這些圖譜提煉了原始數據中的信息,但并不具備推理能力。目前有一些工作致力于解決這些方面的問題[7,8],如何使知識圖譜具有更強大的智能,仍然是非常具有挑戰性的問題。 1.2 知識圖譜的發展歷程 知識圖譜技術由歷史上的許多相關技術,如語義網、本體論、人工智能等多個方面繼承和發展而來。知識圖譜的發展歷程可以追溯到20世紀70年代問世的專家系統,該系統依據領域專家的知識和經驗模擬人類的決策過程進行推理和判斷,以解決需要人類專家處理的復雜問題。如圖1.2所示,20世紀80年代開始,依賴專家知識構建的Cyc、WordNet等本體知識庫問世,這類知識庫是知識圖譜的早期雛形。進入21世紀,出現了**個大規模的現代開放域知識圖譜DBpedia,隨著人工智能技術的發展又出現了能夠自動構建的知識圖譜,如NELL和Knowledge Vault等。本節將從傳統的知識庫、現代的知識圖譜、人工智能時代的知識圖譜三個方面進行介紹。 圖1.2 知識圖譜的發展歷程 1.2.1 傳統的知識庫 Cyc和WordNet是較為典型的依賴專家知識構建的早期知識庫項目。Cyc項目開始于1984年,其*初的目標是建立人類*大的常識知識庫,并在此基礎上完成知識推理等任務。Cyc目前包含50萬個實體、約3萬個關系以及500萬條事實,主要由術語(term)和斷言(assertion)進行表示。Cyc項目還開放了一個可以免費使用的子集,即OpenCyc。早期的Cyc項目大多采用人工構建的方法來推進,近年來Cyc也開始嘗試使用自然語言理解工具從互聯網的非結構化數據中抽取知識。自2008年起,Cyc的資源開始被映射到Wikipedia、DBpedia等資源上,這使得Cyc與現代知識庫項目建立鏈接變得更加容易。Cyc的一大特點是其采用了形式化的方式描述知識,這使得Cyc可以進行復雜推理。
- >
我與地壇
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
羅庸西南聯大授課錄
- >
二體千字文
- >
我從未如此眷戀人間
- >
推拿
- >
名家帶你讀魯迅:朝花夕拾
- >
中國歷史的瞬間