-
>
妙相梵容
-
>
基立爾蒙文:蒙文
-
>
我的石頭記
-
>
心靈元氣社
-
>
女性生存戰爭
-
>
縣中的孩子 中國縣域教育生態
-
>
(精)人類的明天(八品)
數字人文領域知識圖譜構建方法與實踐 版權信息
- ISBN:9787300300382
- 條形碼:9787300300382 ; 978-7-300-30038-2
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數字人文領域知識圖譜構建方法與實踐 本書特色
數字人文與知識圖譜是當今世界兩個正在蓬勃發展的研究領域。本書站在這兩個領域的交叉地帶,探索數字人文領域的知識圖譜構建方法,為數字人文領域知識的重構和研究范式的改變奠定基礎。 本書的主要目標是結合數字人文領域的研究場景和數據特點,分析數字人文領域知識圖譜構建在不同階段所面臨的特殊問題,提出數字人文領域知識圖譜的構建方法,并進行實踐驗證。
數字人文領域知識圖譜構建方法與實踐 內容簡介
新興的知識圖譜技術對于數字人文資源組織有著重要而獨特的價值。使用知識圖譜重構數字人文資源,改變信息的獲取、處理與表現方式,可使研究人員更加便捷地發現和驗證人文世界的規律、脈絡、趨勢,在與史學、地理等領域的關聯中獲得更加宏觀的學術視野。本書首先介紹了數字資源組織與表示的基礎知識,以及知識圖譜的概念、起源和發展;其次,針對數字人文領域的問題和數據的特點,提出數字人文領域知識圖譜構建的一般性方法,既包括在圖譜構建中涉及的多種智能信息處理技術,也包括需要特別關注的基于眾包的人機協作模式和全過程質量管理問題;*后,展示了相關方法在浙江高遷吳氏西宅宗譜的知識圖譜構建實踐中的應用。相關工作既是對領域知識圖譜構建研究的擴展,也是對數字人文研究范式的創新探索。
數字人文領域知識圖譜構建方法與實踐 目錄
第1章緒論
1大數據與知識圖譜
2數字人文
3本書概述
第2章數字資源組織與表示
1語義網
2關聯數據
3本體
4知識圖譜
第3章數字人文領域知識圖譜構建方法
1概述
2領域本體構建
3知識抽取
4知識融合
5知識推理
6基于眾包的人機協作模式
7全過程質量控制
第4章家譜知識圖譜構建實踐
1家譜資源組織現狀
2家譜數據集
3家譜本體構建
4基于深度學習的家譜信息抽取
5基于小規模標注數據的家譜信息抽取
6家譜知識融合
第5章家譜可視化應用
1中西方家譜可視化
2中華傳統家譜可視化
3中華傳統家譜可視化平臺
4小結
第6章 結語
參考文獻
后記
數字人文領域知識圖譜構建方法與實踐 節選
第1章緒論 社會經濟生活的方方面面以更細粒度的數據形式呈現出來,通過數據世界,人們可以更加清晰地觀察和了解社會經濟活動情境。數據在眾多行業展示出具大的經濟價值,對海量數據和信息進行快速收集、挖掘、研判與共享,對于提高生產力、競爭力、創新能力起到關鍵的作用。傳統的管理轉向或正在轉向基于數據的管理,傳統的決策轉向或正在轉向基于數據的決策[4]。作為集成了社會、經濟、文化、政治等多維“鏡像”的數據,也為社會治理提供了重要的數據基礎,能夠助力社會治理和治理模式創新,通過開放政府數據將進一步促進數據價值的有效釋放,產生更大的社會效益和經濟效益。數據不僅改善了各行各業的數據資源利用能力和管理決策水平,也為科技創新帶來了更加旺盛的生命力,大數據在改變傳統生產經營模式、驅動傳統產業轉型升級方面發揮著至關重要的作用。數據作為一種新的生產要素,已經成為推動經濟發展、社會治理和科技創新的一類重要基礎性戰略資源。 如今,數字競爭力已經成為國家綜合競爭力的重要內容,世界各國政府對此都高度重視,密集出臺支持大數據的各項行動計劃,積極應對大數據環境下的各類挑戰。我國在2014年首次將“大數據”寫入政府工作報告后,系統部署大數據發展工作,將發展大數據上升為國家戰略,政府數據開放共享、數據流通與交易、利用大數據保障和改善民生等概念已深入人心。特別是2020年以來的新冠肺炎疫情為各產業和全社會加速數字化轉型提供了特殊的契機,在全民共同參與構建社會治理新格局的大背景下,新興數字科技手段在疫情監測、診斷治療、防控救治、資源調配等諸多方面顯示了巨大的應用價值,同時帶動了在線教育、在線娛樂、遠程辦公、在線醫療、生鮮電商等新業態的創新發展。 大數據作為社會經濟生活的片段記錄,蘊含著極為豐富和有用的信息。當然,數據的超大規模及其新的特征也使得從中獲取有用的知識極具挑戰性[5]。**,是割裂的多源異構數據。需要處理的數據可能來自領域數據庫、知識庫或者Web頁面的開放信息,具有多源異構的特點。并且,這些數據在物理上分散存放于不同的系統中,造成了各種數據孤島,給大數據分析處理帶來巨大挑戰。第二,從數據規模來看,數據的規模越大,提供的有價值的信息通常越多,但是對數據的存儲和處理的要求也就越高,甚至可能超出了數據存儲和處理的能力范圍。第三,是跨媒體、跨語言的關聯。比如,圖片、視頻、音頻數據與文本數據之間存在著關聯,不同語種的數據之間存在著關聯,如何自動識別和利用這些跨媒體、跨語言的關聯是有待探索的問題。第四,實體和關系具有動態演化性,這一特性給實體和關系的判別增加了難度,容易帶來數據不一致的問題,這對實體和關系的建模提出了更高的要求。第五,是知識的隱含性。大量的知識不是顯式的,而是隱含在海量的信息中,需要對相應數據和信息進行深入理解、抽象和歸納,才能獲得具有一般性的知識。 大數據知識服務是大數據生態系統的核心。知識服務對知識組織有很高的要求,強調數據間的有機聯系,尤其要求通過數據間的聯系形成相關知識。面對多源異構、組織松散的數據,需要根據大數據環境下的知識組織原則,去探索既符合網絡信息資源發展變化又適應人類認知需求的知識互聯方法。隨著互聯網數據的規模和復雜性的快速增長,人們開發了各種知識庫用來實現智能化語義檢索,使用計算機幫助人們自動地、智能化地組織和管理信息。DBpedia、YAGO、Freebase都是典型的以互聯網資源為基礎的大規模知識庫,它們利用語義網技術與眾多知識庫建立關聯,構成了規模巨大的關聯數據網絡。 伴隨著關聯數據的迅速增長,知識圖譜(knowledge graph)應運而生。知識圖譜吸收了語義網、本體在知識組織和表達方面的理念,使知識更易于在計算機之間、計算機與人之間交換和流通。知識圖譜作為一種技術體系,是指大數據時代知識工程的一系列代表性技術的綜合[6]。知識圖譜使用本體對領域知識進行語義知識表示,同時使用機器學習、自然語言處理技術等對資源中的知識要素進行提取,實現數據化及語義化,促成知識的共享與重用,并使與其他各種來源的知識相融合成為可能。在基于語義的數據融合的基礎上,獲取新的概念或認識,進行對比與統計分析,揭示各實體之間的關系,發掘隱含在其背后的規律。目前,知識圖譜在學術界和產業界已經成為一個熱門的研究領域,國務院2017年頒布的《新一代人工智能發展規劃》中也特別強調將知識圖譜列作重點攻關方向。作為人們訪問知識和信息的接口,知識圖譜在智能時代必將扮演越來越重要的角色。如何根據業務需求設計實現知識圖譜應用,并基于數據特點進行優化調整,是知識圖譜應用研究的關鍵內容。目前,知識圖譜在互聯網、金融、醫療和電子商務等領域得到了較多的關注和探索,通過快速檢索信息、發現關聯,提供有價值的決策支持。各行業正在試圖通過積累的大數據,借助知識圖譜來完成數據價值的變現,時代發展賦予了知識圖譜助力行業智能化升級與轉型的歷史使命。
數字人文領域知識圖譜構建方法與實踐 作者簡介
任明,中國人民大學信息資源管理學院副教授、博導。清華大學管理學博士,印第安納大學布魯明頓分校訪問學者。數據工程與知識工程教育部重點實驗室研究員、中國人民大學數字人文研究中心研究員。科技情報學會知識組織專委會委員等。研究領域包括知識工程、信息分析、系統建模及其在數字人文等領域的應用,主持完成包括國家自然科學基金在內的多項研究課題,在信息科學領域一流學術期刊上發表多篇成果,已出版學術專著1部?蒲谐晒@國家檔案局優秀科技成果二等獎。
- >
李白與唐代文化
- >
經典常談
- >
有舍有得是人生
- >
小考拉的故事-套裝共3冊
- >
龍榆生:詞曲概論/大家小書
- >
羅曼·羅蘭讀書隨筆-精裝
- >
名家帶你讀魯迅:故事新編
- >
苦雨齋序跋文-周作人自編集