-
>
妙相梵容
-
>
基立爾蒙文:蒙文
-
>
我的石頭記
-
>
心靈元氣社
-
>
女性生存戰爭
-
>
縣中的孩子 中國縣域教育生態
-
>
(精)人類的明天(八品)
網絡的社團 版權信息
- ISBN:9787030748775
- 條形碼:9787030748775 ; 978-7-03-074877-5
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
網絡的社團 內容簡介
本書圍繞網絡社團分析方法在情報分析,特別是在合作網絡和引文網絡兩大科學計量學研究熱點領域的應用這一核心問題,對相關理論、方法和實踐應用進行了研究,具體包括:網絡社團的概念、典型社團劃分算法的理論基礎及其在科學結構和科研范式研究等方面的應用。
網絡的社團 目錄
前言 i
**章 網絡社團的概念 1
**節 網絡社團的定義 2
第二節 典型社團劃分算法 4
第三節 社團劃分效果評估指標 10
第二章 合作網絡的社團 13
**節 合作網絡社團結構研究進展 14
第二節 合作網絡社團揭示科學結構 16
第三章 引文網絡的社團 21
**節 引文網絡社團研究進展 22
第二節 加權引文網絡的社團 25
第三節 基于引文網絡的科研范式研究 45
第四章 混合網絡的社團 49
**節 混合網絡的概念與類型 50
第二節 單節點多關系網絡的社團研究 51
第三節 多節點多關系網絡的社團研究 92
第四節 多節點單關系網絡的社團研究 144
第五節 小結 145
第五章 社團劃分算法的選擇 147
**節 主要社團劃分算法應用比較 148
第二節 如何選擇合適的網絡開展社團研究 157
第六章 討論與展望 163
參考文獻 166
彩圖
網絡的社團 節選
**章 網絡社團的概念 **節 網絡社團的定義 在討論網絡社團的概念前,首先要了解圖論、社會網絡分析、復雜網絡、異構網絡、同構網絡等相關概念。圖論本身是數學的概念,利用節點和節點之間的邊所構成的網絡來表示現實世界中的各類復雜系統,與網絡相關的主要概念如表1-1所示。 社會網絡或復雜網絡具有社團結構是網絡非常重要的性質,是在生物網絡、萬維網、社交網絡、合作網絡、引文網絡等網絡中常見的特征(Fortunato and Castellano,2007)。社團可以看作是在網絡中擁有相似屬性或扮演相似角色的節點集合,通常社團內部的節點之間連接緊密,而社團之間的節點連接稀疏。為了鑒別網絡中的社團結構,研究人員開發了大量的方法,如KL算法(Kernighan and Lin,1970)、譜分解法(Fildler,1973;Pothen et al.,1990)和分層聚類算法(Boccaletti et al.,2006)等。其中,KL算法通過基于貪婪優化的啟發式過程將網絡分解為兩個社團;譜分解法誕生于20世紀70年代,通過分析網絡(對稱矩陣)拉普拉斯(Laplacian)算子的特征向量來挖掘社團結構;分層聚類算法的總體思路是基于距離*近、相似度*高的社團開始合并,直到所有元素都歸于一個社團為止。然而,這些傳統的算法存在準確度不高、時間復雜度大以及需要事先知道網絡中社團規模大小等缺點(Shi,2011)。 為此,過去二十多年中涌現出了大量可用于檢測網絡社團結構的工具,其中以2002年Girvan和Newman提出GN算法*具有里程碑意義(Girvan and Newman,2002)。GN算法的提出掀起了新社團研究的熱潮,但該算法依然存在時間復雜度高、不考慮社團劃分的真實意義等缺點。隨后,Newman于2004年又提出FN貪婪算法(Newman,2004),并基于模塊度函數(Q函數)(Newman and Girvan,2004)值*大化來進行社團劃分,可得到與GN算法相似的結果,但計算時間大大縮短。然而,由于以上算法的時間復雜度較高,所以僅適用于數據規模較小的網絡。為此,Blondel等提出了Louvain算法(Blondel et al.,2008),該算法可以相對快速地處理數以億計的節點網絡。隨后Rotta和Noack在Louvain算法的基礎上提出了Louvain算法的多級細分算法(Rotta and Noack,2011)。Waltman和van Eck在上述兩種算法的基礎上提出了SLM算法(Waltman and van Eck,2013),后又將其升級為Leiden算法(Traag et al.,2019)。 對網絡進行社團劃分研究有助于理解其拓撲結構,具有重要的理論意義和應用價值。當前,科學研究的日益復雜性與交叉性使學科邊界變得日益模糊,進而使科學結構越來越難以被清晰地認識。如何有效地發現科學結構已成為知識發現研究長期關注的焦點問題,對探索學科演化、發現學科交叉滲透、挖掘前沿方向具有重要價值。在網絡中,社團內部節點之間具有很高的相似度,實際上標志著有共同興趣或背景的成員集合,表示具有某種特性的社會團體,對網絡的社團結構的分析有助于理解社會組織的構成及社會的演變;對生物網絡中社團結構的分析可以揭示生物功能的模塊、位置和作用等;對引文網絡中社團結構的分析可以對相關學科主題進行探索,通過引入時間節點,可以分析學科主題的演變、預測學科主題的發展,還能對某一學科的產生背景、發展概貌等進行分析,從而揭示科學動態結構和發展規律。挖掘作者合作網絡的社團結構,可以發現全球范圍內科學家共同體的科研活動格局,揭示科學結構特征。 第二節 典型社團劃分算法 本節對圖書情報領域常用的Q函數、GN算法、FN算法、Louvain算法、Louvain多級細分算法、SLM算法、Leiden算法、Kernighan-Lin算法等社團劃分算法的原理和方法逐一進行介紹。 一、Q函數 Q函數由Newman和Girvan于2004年提出(Newman and Girvan,2004)。其含義是:網絡中連接社團內部頂點的邊所占的比例與另外一個隨機網絡中連接社團內部頂點的邊所占的比例的期望值相減得到的差值。這個隨機網絡的構造方法為:保持每個頂點的社團屬性不變,頂點間的邊根據頂點的度隨機連接,如果社團結構劃分得好,則社團內部連接的稠密程度高于隨機連接網絡的期望水平。一般認為,模塊度值越大,所得到的劃分越好。Q函數已成為當前衡量社團劃分效果所采用的*廣泛的方法(Blondel et al.,2008),可用于任何類型網絡的社團劃分(Chen and Redner,2010)。 二、GN算法 GN算法的基本流程是:首先計算網絡中所有邊的介數(Newman,2001),然后找到介數*高的邊并將其從網絡中移除,不斷重復第二步,直到每個節點成為一個獨立的社團為止(Janssens et al.,2009)。在執行該算法的過程中,若不提前給定社團數目,則算法無法確定*佳社團,也會導致算法提前結束。GN算法有利有弊,優勢是對一些簡單的中小規模的網絡,執行效率相對較高;劣勢是對網絡結構復雜且規模較大的網絡,該算法執行效率較低。究其原因:GN算法在社團劃分過程中以計算邊介數為主,而邊介數的計算耗時較長。在形成社團的過程中,需要不斷地計算邊介數,移除網絡邊,再計算邊介數,循環往復,導致運行時間較長。因此,對于巨型網絡,GN 算法執行時間久,效率較低。 三、FN算法 由于GN算法在沒有確定聚類數目的前提下無法找到*佳社團,因此紐曼等提出了模塊度的概念,并利用FN貪婪算法開展社團劃分。模塊度對于社團劃分質量的評估具有一定的說服力,在一定程度上是評估社團劃分好壞的相對標準。FN算法的基本流程是:首先將每個節點視為一個社團,然后將社團不斷進行合并計算Q值的變化,每次合并都按照Q值增加*大的方向進行,直到所有節點都并入同一個社團。在此過程中,Q值*大時得到*佳的社團劃分(Newman,2004)。紐曼提出的FN貪婪算法在時間復雜度和速率方面都有較大提升,利用模塊度的變化來確定社團的數量,在一定程度上可以取得很好的劃分效果。因此,該算法被廣泛應用于大規模網絡。 四、Louvain算法 Louvain算法及其多級細分算法、SLM算法的基礎都是LMH(局域啟發式移除)算法,其思想是按照Q值增加的方向,將一個社團的節點不斷移至另一個社團,直至Q函數達到峰值后停止移動。LMH算法采取隨機的方式進行迭代,其特點在于效率高,可以處理大規模網絡。 Louvain算法(Blondel et al.,2008)以Q函數為衡量指標,執行過程分為兩個階段并反復迭代(圖1-1)。①運行LMH算法。每個節點i視為一個社團,其所在社團為C,U為與節點i鄰接的社團,如果將i從C移到U后模塊度增量*大,則執行此次移動,否則i不移動。對網絡中的每個節點都重復以上過程,直到Q值不再增加。②社團合并。將上述劃分好的社團作為一個新的節點(即簡化網絡),新節點之間的權重為社團內節點間的權重和。步驟②結束后則返回步驟①進行迭代計算,直到模塊度不再發生變化,算法結束。 五、Louvain多級細分算法 Louvain多級細分算法的特點在于除了利用LMH算法來產生社團進行不斷合并外,還可以在劃分好的社團間按照增加Q值的方向來移動節點,直到無法移動為止(Blondel et al.,2008)。 六、SLM算法 SLM算法的**步與Louvain算法的步驟①相同,然后也要運行類似步驟②的構建簡化網絡的步驟,區別在于:在構建簡化網絡前,還需要增加幾個步驟(圖1-2)。SLM算法的特點在于允許已經被劃分社團的節點被重新劃分,因此無須再運行Louvain算法的多級細分而實現社團劃分,同時解決了社團合并和單個節點在社團間移動的問題(Blondel et al.,2008)。對于三個基于LMH的算法而言,盡管每運行一次SLM算法需要進行更多的迭代次數,但SLM算法運行一次獲得的社團劃分效果已經優于多次運行Louvain算法及其多級細分算法的社團劃分效果,這意味著利用SLM算法進行社團劃分無須多次重復運行。通常SLM算法運行2~5次迭代已經可以超過Louvain算法及其多級細分算法的效果。 七、Leiden算法 Leiden算法基于智能局部移動算法、加速節點局部移動的思想對Louvain
- >
羅曼·羅蘭讀書隨筆-精裝
- >
小考拉的故事-套裝共3冊
- >
莉莉和章魚
- >
名家帶你讀魯迅:故事新編
- >
伊索寓言-世界文學名著典藏-全譯本
- >
羅庸西南聯大授課錄
- >
詩經-先民的歌唱
- >
煙與鏡