-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
網絡社區發現與搜索 版權信息
- ISBN:9787030740526
- 條形碼:9787030740526 ; 978-7-03-074052-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
網絡社區發現與搜索 本書特色
對于致力于社區搜索研究的學者,本書希望通過與新的網絡分析和數據挖掘模型結合*新發展來激發新的研究方向。
網絡社區發現與搜索 內容簡介
本書將介紹必要的背景材料以幫助理解網絡社區,并提供有關近期新方法的全面概述。此外,本書旨在提供一個新的視角,即使對于具有該領域更多經驗的研究人員而言,該視角也將是有趣而有價值的。對于那些從事經典社區檢測和圖聚類工作的人,本書將展示社區搜索問題如何在算法效率和網絡動力學方面與常用模型交互,并與社區檢測相比提出新的挑戰。對于致力于研究查詢社區的學術者,本書希望通過與新的網絡分析和數據挖掘模型結合近期新發展來激發新的研究方向。
網絡社區發現與搜索 目錄
前言
第1章 緒論 1
1.1 引言 1
1.2 基本術語 3
1.3 網絡可視化 8
1.4 本章小結 11
參考文獻 11
第2章 社區分析基本知識 13
2.1 社區發現與社區搜索概述 13
2.1.1 社區的定義 13
2.1.2 社區分析常用技術 15
2.1.3 社區發現方法 17
2.1.4 社區搜索方法 20
2.2 數據集與評價指標 21
2.2.1 數據集 21
2.2.2 評價指標 24
2.3 本章小結 27
參考文獻 28
第3章 經典社區發現方法 29
3.1 基于模塊度優化的社區發現方法 29
3.1.1 貪心算法 31
3.1.2 傳統譜方法 32
3.2 基于聚類的社區發現方法 40
3.2.1 層次聚類 40
3.2.2 圖劃分聚類 41
3.2.3 模糊聚類 45
3.3 其他社區發現方法 50
3.3.1 基于隨機塊模型的社區發現方法 50
3.3.2 基于統計建模模型的社區發現方法 53
3.4 本章小結 58
參考文獻 58
第4章 基于深度學習的社區發現方法.60
4.1 深度學習概述 60
4.1.1 深度學習介紹與常用框架 60
4.1.2 注意力機制 61
4.2 基于深度圖嵌入的社區發現方法 63
4.2.1 面向普通網絡的深度圖嵌入 63
4.2.2 面向屬性網絡的深度圖嵌入 66
4.2.3 深度嵌入式圖聚類方法 70
4.3 基于圖神經網絡的社區發現方法 74
4.3.1 基于深度圖神經網絡的聚類 74
4.3.2 聯合社區發現和節點表示學習的生成模型 79
4.4 本章小結 83
參考文獻 83
第5章 拓撲圖上的社區搜索方法 85
5.1 基于內聚子圖的社區搜索模型 85
5.1.1 內聚子圖的度量指標 85
5.1.2 基于內聚子圖度量指標的社區搜索算法 88
5.2 基于優化評價指標的社區搜索模型 91
5.2.1 局部模塊度社區搜索模型 91
5.2.2 查詢偏向密度社區搜索模型 94
5.3 其他社區搜索模型 96
5.3.1 基于隨機游走及其變種的社區搜索模型 96
5.3.2 基于鄰域擴展的社區搜索模型 100
5.3.3 基于譜子空間的社區搜索模型 102
5.4 基于異構圖的社區搜索模型 104
5.4.1 異構圖簡介 104
5.4.2 面向異質信息網絡的社區搜索模型 105
5.5 本章小結 111
參考文獻 111
第6章 屬性圖上的社區搜索方法 113
6.1 結合結構約束的屬性社區搜索方法 113
6.1.1 基于k-core的屬性社區搜索方法 113
6.1.2 基于k-truss的屬性社區搜索方法.114
6.2 特定屬性圖上的社區搜索方法 117
6.2.1 面向畫像圖的屬性社區搜索方法 117
6.2.2 面向時序圖的屬性社區搜索方法 120
6.2.3 面向地理社交圖的屬性社區搜索方法 121
6.3 基于圖神經網絡的社區搜索方法 126
6.3.1 基于查詢驅動圖卷積網絡的社區搜索 127
6.3.2 基于圖神經網絡的輕量級交互式社區搜索 131
6.4 本章小結 134
參考文獻 134
第7章 總結與展望 136
7.1 社區發現總結與展望 136
7.2 社區搜索總結與展望 139
7.3 本章小結 142
參考文獻 142
網絡社區發現與搜索 節選
第1章緒論 1.1引言 網絡的研究始于1736年歐拉的哥尼斯堡七橋問題,那時人們對網絡及其數學性質開始感興趣并開展了各種研究。20世紀60年代,兩位匈牙利數學家Erdos和Renyi提出的隨機圖理論被公認為是數學上復雜網絡理論的首創性的系統研究。近年來,計算機技術的不斷發展為學者們提供了豐富的計算資源來處理和分析網絡數據,人們能處理的真實網絡規模也有了相當大的增長,達到了數百萬甚至數十億個節點的規模。正因如此,大規模網絡的處理方式發生了巨大變化。此外,關于網絡的科學研究融合了數學、物理學、生物學、計算機科學、社會科學和許多其他領域的思想,其發展也得益于不同學科研究人員的貢獻。本節用一致的語言和符號整合網絡知識,使其串聯為一個整體。 1.網絡概述 網絡中包含若干節點和連接這些節點的邊,表示諸多對象及其之間的相互聯系[1]。進入21世紀之前,一般認為網絡的結構是隨機的。Barabasi等[2]和Watts等[3]在1999年和1998年分別發現了網絡的無標度和小世界特性,并分別在世界著名期刊《科學》和《自然》上發表了研究成果之后,人們才認識到網絡所具有的復雜性。圖1.1為一個由6個節點和9條邊組成的小網絡示例。 數學上,網絡是一種圖,不失一般性地又專指加權圖。除了數學上的定義外,網絡還有其具體的物理含義,即網絡是從某種相同類型的實際問題中抽象出來的模型。在計算機領域中,網絡是信息傳輸、接收、共享的虛擬平臺,能夠把各個點、面、體的信息聯系到一起,實現資源共享的目標。網絡是人類發展史上*重要的發明之一,促進了科技的進步和人類社會的發展。作為一種簡化表示,網絡將一個系統簡化為一個抽象結構,只捕獲連接模式的基本信息,而很少涉及其他方面。網絡中的節點和邊可以用附加信息標記,以獲取系統的更多細節。 許多領域的科學家已經提出了用于分析、建模和理解網絡的數學計算和統計工具,這些工具中大多數是從一個簡單的網絡表示開始的,即一組節點和邊,如圖1.1所示。經過計算,可以獲取關于網絡的一些有用信息,如從一個節點到另一個節點的路徑長度。其他工具采用網絡模型的形式,這些模型可以對網絡上發生的過程進行數學預測,如互聯網上的流量流動方式或疾病在社區中的傳播方式。 因為這些工具以抽象的形式處理網絡,所以理論上它們幾乎可以應用于任何以網絡表示的系統。因此,如果對某個系統感興趣,并且它可以被有效地表示為一個網絡,那么就有上百種不同的工具,可以立即應用到系統分析中。當然,并不是所有的測量或計算都能得到有意義的結果。因此,網絡是表示系統各部分之間連接或交互模式通用且強大的手段。 2.真實網絡概述 網絡*簡單的形式就是由節點和邊組成的集合。在網絡中,點稱為“節點”或“頂點”,線稱為“邊”。在許多學科分支中,網絡被定義為表示復雜系統各組成部分之間連接模式的一種數據結構。自然界中存在著大量的復雜系統,都可以通過各種形式的網絡進行描述。一個典型的網絡包含許多節點與連接兩個節點之間的邊。節點表示不同的個體,邊表示不同個體間的關系,其存在于具有某種特定關系的兩個節點之間。如果網絡中兩個節點之間存在邊,則這兩個節點存在相鄰關系。例如,社交網絡中的節點表示人,邊表示各種不同類型的社會交互,包括友誼、協作、業務關系或其他。 為了更直觀地了解真實網絡,下面介紹兩個真實網絡案例。 Internet網絡:又稱互聯網絡,指的是網絡與網絡串連成的龐大網絡,這些網絡以一組通用的協議相連,形成邏輯上的單一巨大國際網絡,如圖1.2所示。在Internet網絡中,節點代表計算機,邊代表數據連接,如光纜之間的信號傳輸。通常internet泛指互聯網,而Internet則特指因特網。一般將計算機網絡互相關聯在一起的方法稱為“網絡互聯”,而在此基礎上發展出的覆蓋全世界的全球性互聯網絡則稱為互聯網,即互相連接在一起的網絡結構。互聯網與萬維網并不等同,萬維網是基于超文本而相互連接的全球性系統,且是互聯網所能提供的服務之一。 在線社交網絡:在互聯網的推動下,Facebook、Google+、Twitter新浪微博、知乎和豆瓣等大型在線社交網站的出現,刺激了對在線社交網絡上社區發現的不斷研究,見圖1.3。隨著大規模社交網絡數據的大幅增長,帶動社區發現領域發展出許多令人興奮的應用,如社交圈發現和有影響力的社區搜索。此外,隨著智能手機設備的興起,在線社交網絡帶動了地理社交網絡(也稱為“基于位置的社交網絡”)的快速增長,如Foursquare、Yelp、Google+和FacebookPlaces。在地理社交網絡中,用戶與位置信息(如家鄉和辦理登機手續的地點)相關聯,而社區由在社交層中緊密聯系的用戶以及在空間層上距離較近的用戶組成。 1.2基本術語 1.網絡分類 本部分描述并定義一些社區發現與搜索中的常用網絡,分為四類,即技術網絡[4]、社交網絡[5]、信息網絡[6]和生物網絡[7],列出每類網絡中常見的示例,并介紹用于檢測這些網絡結構的基本技術。 1)技術網絡 技術網絡是指在20世紀成長起來并構成現代技術社會支柱的物理基礎設施網絡。技術網絡中*具代表性的是因特網,因特網是計算機和相關設備之間物理數據連接的世界性網絡。因特網是一個分組交換的數據網絡,這意味著通過它發送的信息被分解成分組、小塊數據,分別通過網絡發送,并在另一端重新組合成完整的信息。數據包的格式遵循因特網協議(internet protocol,IP)的標準,并且需要在每個數據包中指定數據包目的地的IP地址,以便可以在網絡中正確地路由。因特網*簡單的網絡表示法是用網絡中的節點表示計算機和其他設備,而邊表示其內部的物理連接,如光纖線路。事實上,普通的計算機大多只占據網絡“外部”的節點,即數據往來的節點,并不充當其他計算機之間數據流動的中間點(實際上,大多數計算機只有一個網絡連接,所以它們不可能位于其他計算機之間的路徑上)。因特網的“內部”節點主要是路由器,它是功能強大的專用計算機,位于數據線之間的連接處,接收數據包并將其朝一個方向或另一個方向轉發到預定目的地。 2)社交網絡 社交網絡中的節點是一個人或一群人,節點間的邊代表了他們之間某種形式的社交互動。社交網絡中十分重要的一點是網絡中的邊可能有許多不同的定義,如個人之間的友誼,但也可能代表職業關系、商品或金錢交換、溝通模式,或許多其他類型的聯系。例如,如果用戶對財富五百強公司董事會之間的專業互動感興趣,那么由Facebook頁面組成的網絡相對于用戶可能就沒有多大用處。此外,人們用來探索不同類型社交互動的技術也可能有很大不同,因此通常需要不同類型的社交網絡研究來解決不同類型的問題。 3)信息網絡 信息網絡是通過某種方式連接在一起的數據項所形成的網絡。據目前研究可知,信息網絡是人為設計的,而其中*著名的就是萬維網。萬維網中的節點是由文本、圖片或其他信息組成的Web頁面,而邊是允許從一個頁面導航到另一個頁面的超鏈接。由于超鏈接只在一個方向上運行,因此Web是一個有向網絡。此外還有許多其他網絡值得研究,如各種引文網絡。通常在論文末尾的參考文獻中,如果論文A在其參考文獻中引用B,則可以構造一個節點為論文的網絡,存在從A指向B的有向邊。 4)生物網絡 網絡在生物學的許多分支中被廣泛應用,作為適當生物元素之間相互作用模式的方便表示。例如,分子生物學家用網絡來表示細胞內化學物質之間的化學反應模式,神經科學家用網絡來表示腦細胞之間的聯系模式,生態學家則研究生態系統中物種之間的相互作用網絡,如捕食或合作。近年來*受關注的生物網絡中,有生物化學網絡以及代表生物細胞內分子水平相互作用模式和控制機制的網絡。 該領域研究的主要網絡類型是代謝網絡、蛋白質–蛋白質相互作用網絡和遺傳調控網絡。 2.網絡描述形式 本部分介紹用于描述和分析網絡的基本理論工具,其中大部分來自圖論。圖論是一個包含許多研究內容的大領域,在這里只描述了其中的部分內容,重點關注與現實網絡研究*相關的內容。網絡是由邊和節點構成的集合。節點和邊在計算機科學中也稱為節點和鏈接,在物理學中稱為站點和紐帶。表1.1為特定網絡中節點和邊的一些示例。 在本書中,通常用n表示網絡中的節點數,用m表示邊數。本書中介紹的大多數網絡在任何一對節點之間*多只有一條邊。在極少數情況下,節點對之間可能有多條邊,將這些邊統稱為多邊。在將要討論的大多數網絡中,沒有將節點連接到自身的邊,盡管在少數情況下會出現這樣的邊,這種邊稱為自邊或自循環。 一個既沒有自邊又沒有多邊的網絡稱為簡單網絡或簡單圖,具有多邊的網絡稱為多圖。圖1.4和圖1.5分別為簡單圖示例以及具有多邊和自邊的非簡單圖示例。 1)鄰接矩陣 網絡的一個*基礎的表示是鄰接矩陣,其中簡單圖的鄰接矩陣A由式(1.1)計算: (1.1) 圖1.4的鄰接矩陣如式(1.2)所示: (1.2) 需要注意的是,對于沒有自環的網絡,如簡單網絡,其鄰接矩陣對角元素都為零。另外,鄰接矩陣是對稱的,即節點vi和vj的邊關系是對等的,同時鄰接矩陣也可以用來表示多邊和自邊。通過將對應的矩陣元素設置為邊的多重性來表示多邊,如節點vi和vj之間的雙邊由表示。 圖1.5的鄰接矩陣如式(1.3)所示: (1.3) 2)加權網絡 在某些情況下,將邊表示為具有強度或權重(通常為實數)是有意義的[8]。例如,在因特網中,邊表示沿其流動的數據量的權重;在食物網絡中,捕食者和被捕食者之間的相互作用可能是衡量被捕食者和捕食者之間總能量流的權重;在社交網絡中,連接可能具有表示參與者之間接觸頻率的權重。這種加權網絡可以通過給出鄰接矩陣值的元素等于相應連接的權重來表示。式(1.4)的鄰接矩陣表示一個加權網絡,其中節點1和2之間的連接強度是節點1和3之間的兩倍,而
- >
羅曼·羅蘭讀書隨筆-精裝
- >
伊索寓言-世界文學名著典藏-全譯本
- >
回憶愛瑪儂
- >
李白與唐代文化
- >
史學評論
- >
朝聞道
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
【精裝繪本】畫給孩子的中國神話