互聯網大數據挖掘與分類 版權信息
- ISBN:9787564161965
- 條形碼:9787564161965 ; 978-7-5641-6196-5
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
互聯網大數據挖掘與分類 本書特色
近年來,互聯網的快速發展、新應用的不斷出現 、網絡帶寬的不斷提高和網絡數據流的急劇增加給互 聯網數據分析研究帶來了技術挑戰,互聯網數據挖掘 和分類對于網絡計費、流量工程、網絡安全等領域具 有廣泛應用價值。程光、周愛平、吳樺*的《互聯網 大數據挖掘與分類》主要針對互聯網大數據挖掘與分 類問題,系統介紹了作者在互聯網數據分析處理方面 的理論及實踐的研究成果,主要介紹兩個互聯網大數 據的挖掘和分類平臺:基于hadoop集群網絡被動測量 數據分析平臺和基于覆蓋網的主動測量網絡故障診斷 平臺,同時本書分別探討了基于這兩個平臺的超點抽 樣檢測方法、并行長持續時間流檢測方法、面向 mapreduce的大流識別方法、基于信息熵靈敏度的異 常檢測方法、http流量的頁面關聯、網絡流的分類方 法等六個方面的互聯網大數據挖掘和分類問題。本書 的內容對深入研究互聯網數據測量和分析方法具有重 要的借鑒意義,為網絡安全和網絡管理,特別是校園 網的管理提供了參考。本書可供計算機科學、信息科 學、網絡工程及流量工程等學科的科研人員、大學教 師和相關專業的研究生和本科生,以及從事計算機網 絡管理領域、網絡工程及網絡安全保護的技術人員閱 讀參考。
互聯網大數據挖掘與分類 內容簡介
系統介紹了互聯網大數據研究領域涉及的海量流量數據的挖掘與分類內容,包括活躍節點檢測、超點檢測、長持續時間數據流檢測、大流識別、異常檢測、流關聯分析、流量聚合分析以及流量分類等。本書的成果對深入研究大數據挖掘具有重要的參考價值,為網絡安全管理提供參考。
互聯網大數據挖掘與分類 目錄
1 緒論 1.1 背景知識 1.1.1 研究背景 1.1.2 研究意義 1.2 網絡測量技術 1.2.1 網絡測量常見對象 1.2.2 網絡測量分析的問題 1.2.3 單點測量常用方法 1.2.4 單點網絡測量常用工具 1.2.5 分布式網絡測量技術 1.3 分類算法 1.3.1 決策樹 1.3.2 貝葉斯分類 1.3.3 支持向量機 1.4 c4.5算法 l.4.1 算法概述 1.4.2 決策樹的分割 1.4.3 決策樹的剪枝 1.4.4 剪枝實例 1.4.5 十折交叉驗證方法 1.4.6 測度子集選擇方法 1.5 數據挖掘方法 1.5.1 聚類方法 1.5.2 k-近鄰算法 1.6 流數據結構 1.6.1 bitmap 1.6.2 混合counter 1.6.3 count-min sketch 1.6.4 bloom filter 1.6.5 counter braids 1.6.6 brick 1.7 流量測量的評價指標 1.7.1 誤報率和漏報率 1.7.2 相對誤差 1.7.3 相對差 1.7.4 熵 1.8 小結 參考文獻2 互聯網大數據分析系統 2.1 系統設計 2.1.1 總體設計 2.1.2 數據收集層設計 2.1.3 并行算法層設計 2.1.4 查詢層設計 2.2 測度定義 2.2.1 輸入測度 2.2.2 用戶行為測度 2.2.3 輸出測度 2.3 基于mapreduce測度的計算方法 2.3.1 單點tcp測度 2.3.2 并行tcp測度 2.3.3 流聚合并行方法 2.3.4 用戶行為測度 2.3.5 并行算法優化 2.4 系統實現 2.4.1 存儲模塊實現 2.4.2 測度計算模塊實現 2.4.3 用戶行為分析模塊實現 2.4.4 查詢模塊實現 2.5 實驗分析 2.5.1 實驗環境 2.5.2 實驗平臺布署 2.5.3 實驗數據集 2.5.4 實驗結果分析 2.5.5 可擴展性分析 2.5.6 性能瓶頸分析 2.6 小結 參考文獻3 超點數據流檢測方法 3.1 引言 3.2 并行數據流方法 3.2.1 方法描述 3.2.2 相關定義 3.2.3 數據結構 3.2.4 更新歸并過程 3.2.5 鏈接度估計 3.2.6 超點檢測 3.3 性能分析 3.3.1 存儲開銷 3.3.2 準確性 3.3.3 計算性能 3.4 實驗分析 3.4.1 實驗數據 3.4.2 評價標準 3.4.3 鏈接度估計 3.4.4 參數評估 3.4.5 算法對比 3.5 小結 參考文獻4 長持續時間流檢測方法 4.1 引言 4.2 問題定義 4.3 數據結構 4.4 基于共享數據結構的檢測方法 4.4.1 方法描述 4.4.2 方法流程 4.4.3 實驗結果分析 4.5 基于獨立數據結構的檢測方法 4.5.1 方法描述 4.5.2 方法流程 4.5.3 性能分析 4.5.4 實驗結果分析 4.6 小結 參考文獻5 大流的自適應抽樣識別方法 5.1 引言 5.2 大流識別方法 5.2.1 問題定義 5.2.2 方法描述 5.2.3 自適應抽樣 5.2.4 數據劃分 5.2.5 大流識別 5.3 實驗結果分析 5.3.1 實驗環境 5.3.2 估計精度 5.3.3 負載均衡 5.3.4 可擴展性 5.3.5 數據更新 5.3.6 reducer數量 5.4 小結 參考文獻6 流量異常的信息熵檢測方法 6.1 引言 6.1.1 研究背景 6.1.2 研究意義 6.1.3 相關研究 6.1.4 本章內容 6.2 信息熵靈敏度分析 6.2.1 理論分析 6.2.2 實驗分析 6.2.3 分析結論 6.3 流量異常檢測方法 6.3.1 測度定義 6.3.2 基于kmeans的閾值選擇 6.3.3 正常流量bid學習 6.3.4 驗證方案 6.4 實驗結果分析 6.4.1 實驗環境 6.4.2 攻擊流量獲取 6.4.3 攻擊檢測能力評估 6.4.4 檢測準確性 6.5 小結 參考文獻7 網頁關聯分析方法 7.1 概述 7.1.1 研究背景 7.1.2 研究意義 7.1.3 相關研究 7.2 網頁關聯概念 7.2.1 定義 7.2.2 問題描述 7.2.3 輸入輸出描述 7.2.4 分類 7.2.5 網頁引用方法 7.3 基于dpi的網頁關聯方法 7.3.1 方法概述 7.3.2 基于http頭信息的引用發現方法 7.3.3 請求網頁父引用提取方法 7.3.4 http網頁解碼算法 7.3.5 基于網頁內容的引用發現算法 7.3.6 父子引用關聯方法 7.4 dpi關聯方法實驗分析 7.4.1 在線采集數據分析 7.4.2 被動測量數據關聯分析 7.5 網頁關聯存在的問題 7.5.1 頁面懸浮廣告 7.5.2 彈出窗口廣告 7.5.3 link href 7.5.4 廣告關聯問題分析 7.6 算法改進對比 7.6.1 測試一 7.6.2 測試二 7.6.3 測試三 7.7 基于dfi的網頁關聯方法 7.7.1 主流識別規則 7.7.2 輔流關聯方法 7.7.3 實驗結果分析 7.8 小結 參考文獻8 面向網絡流的分類方法 8.1 引言 8.1.1 測度定義 8.1.2 背景研究 8.1.3 研究意義 8.2 流特征選擇方法 8.2.1 特征選擇方法 8.2.2 混合特征選擇 8.2.3 實驗結果分析 8.3 代價敏感分類方法 8.3.1 數據重采樣 8.3.2 代價敏感學習 8.3.3 基于adacost的分類算法 8.3.4 實驗結果分析 8.5 集成學習分類方法 8.5.1 集成學習基本概念 8.5.2 基于均值決策的集成學習方法 8.5.3 基于精度權重的集成學習方法 8.5.4 基于代價敏感的集成學習方法 8.5.5 實驗結果分析 8.6 小結 參考文獻9 基于覆蓋網監測的故障推理 9.1 研究背景及意義 9.2 基本概念 9.2.1 社區的概念 9.2.2 覆蓋網 9.2.3 chord 9.3 數據處理 9.3.1 集中式處理的問題 9.3.2 負載均衡 9.3.3 癥狀數據存取索引 9.3.4 癥狀數據預處理 9.4 故障推理算法 9.4.1 客戶端故障判斷算法 9.4.2 現有方法 9.4.3 故障推理算法 9.4.4 算法設計 9.5 系統設計實現 9.5.1 系統設計 9.5.2 實驗工具 9.5.3 實驗環境 9.5.4 實驗結果分析 9.6 小結 參考文獻彩插
展開全部
互聯網大數據挖掘與分類 作者簡介
程光,男,1973年2月生,安徽黃山人,工學博士,東南大學計算機科學與工程學院教授、博導,東南大學計算機網絡和信息集成教育部重點實驗室主任,2005—2006年期間在美國佐治亞理工大學從事博士后研究,2012年在美國亞利桑那大學從事高級訪問學者研究工作。目前研究興趣在網絡安全、網絡測量、網絡行為學、網絡管理和科學可視化等。先后主持參加國家973項目、國家科技支撐項目、國家自然基金、教育部科技重點項目、江蘇省自然基金等20多項縱向課題研究。發表學術論文80余篇,出版專*及教材共5部,申請和授權專利20余項。