掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
高性能數(shù)據(jù)挖掘(快速項集挖掘算法及性能研究) 版權信息
- ISBN:9787517066910
- 條形碼:9787517066910 ; 978-7-5170-6691-0
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
高性能數(shù)據(jù)挖掘(快速項集挖掘算法及性能研究) 內容簡介
《高性能數(shù)據(jù)挖掘:快速項集挖掘算法及性能研究》主要探討數(shù)據(jù)挖掘中的項集挖掘問題,詳細介紹了頻繁項集、高可用項集、頻繁項集、頻繁閉項集的定義、挖掘算法、搜索空間剪枝技術、性能優(yōu)化等方面的內容。《高性能數(shù)據(jù)挖掘:快速項集挖掘算法及性能研究》的重點在于介紹如何提高挖掘速度、提升挖掘時的內存使用效率;《高性能數(shù)據(jù)挖掘:快速項集挖掘算法及性能研究》的特色在于不僅對這些挖掘方法與技術在理論上進行描述,同時作者執(zhí)行了嚴格的實驗用以佐證結論。 《高性能數(shù)據(jù)挖掘:快速項集挖掘算法及性能研究》可作為高年級本科生、數(shù)據(jù)挖掘方向的研究生、有興趣青年學者的參考書。
高性能數(shù)據(jù)挖掘(快速項集挖掘算法及性能研究) 目錄
前言
第1章 概述
1.1 項集:數(shù)據(jù)挖掘研究領域的焦點之一
1.2 頻繁項集挖掘問題的研究歷史
1.3 高可用項集挖掘問題的研究歷史
1.4 本書的主要內容
第2章 頻繁項集挖掘問題
2.1 概述
2.1.1 問題形式化定義
2.1.2 搜索空間與方法
2.2 基礎頻繁項集挖掘算法介紹
2.2.1 經典的候選生成Apriori算法
2.2.2 以垂直視角處理數(shù)據(jù)庫的Eclat算法
2.2.3 基于前綴樹結構的FP-growth算法
2.3 性能測試的軟硬件環(huán)境
2.3.1 數(shù)據(jù)庫描述
2.3.2 參照算法介紹
2.3.3 其他軟硬件設施
2.4 實驗一:三種基礎算法的性能測試
2.4.1 實驗結果
2.4.2 性能評價
第3章 BFP-growth:快速模式增長算法
3.1 經典模式增長算法的性能分析
3.1.1 影響FP-growth性能的三個因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增長算法:BFP-growth
3.2.1 性能提升的途徑
3.2.2 核心步驟:兩次前綴樹遍歷
3.2.3 算法偽代碼
3.3 BFP-growth算法的性能分析
3.3.1 更少的遍歷花費
3.3.2 FP-array技術應該集成在BFP-growth中嗎
3.3.3 無修飾的前綴樹結構
3.4 實驗二:BFP-growth的性能測試及討論
3.4.1 BFP-growth及FPgrowth*與基礎算法的對比
3.4.2 實驗結果討論
3.5 小結
第4章 基于結點集合結構的NS算法
4.1 Eclat及FP-growth算法的優(yōu)缺點
4.2 結點集合結構(Node-set)
4.2.1 條件結點
4.2.2 結點拓撲序號
4.2.3 使用結點集合結構表示前綴樹
4.3 NS算法
4.3.1 映射前綴樹到結點集合結構
4.3.2 從結點集合結構中挖掘頻繁項集
4.3.3 一個例子
4.3.4 NS算法的原子操作
4.4 實驗三:NS算法與其他快速挖掘算法的性能對比
4.4.1 實驗結果
4.4.2 結果討論:NS算法的性能優(yōu)勢
4.5 小結
第5章 用Patricia*結構挖掘頻繁項集
5.1 研究動機
5.2 Patricia*結構
5.2.1 單孩子結點
5.2.2 構造:Patricia*結構
5.3 用Patricia*結構挖掘頻繁項集
5.3.1 先前的挖掘流程
5.3.2 改進的挖掘流程
5.3.3 PatriciaMine*算法
5.4 實驗結果
5.4.1 結點數(shù)量統(tǒng)計
5.4.2 性能對比
5.5 小結
第6章 頻繁項集挖掘算法的內存耗費
6.1 BFP-growth算法內存使用情況分析
6.2 NS算法內存使用情況分析
6.3 實驗四:快速挖掘算法的內存耗費
6.4 SP算法
6.4.1 研究動機
6.4.2 基礎知識
6.4.3 挖掘頻繁項集
6.4.4 實驗結果與結論
第7章 高可用項集挖掘問題
7.1 從頻繁項集到高可用項集
7.2 問題的形式化定義
7.3 已有挖掘算法概述
第8章 非候選生成高可用項集挖掘算法
8.1 項集有用性列表結構
8.1.1 初始有用性列表
8.1.2 2-項集的有用性列表
8.1.3 缸項集有用性列表(k≥3)
8.2 HUI-Miner算法
8.2.1 剪枝策略
8.2.2 算法偽代碼
8.3 HUI-Miner算法的實現(xiàn)細節(jié)
8.3.1 有用性列表表頭
8.3.2 重新標注tid
8.3.3 交易權重有用性增加的順序
8.4 實驗五:HUI-Miner性能測試
8.4.1 實驗設置
8.4.2 HUI-Miner及對比算法的運行時間
8.4.3 HUI-Miner及對比算法的內存耗費
8.4.4 項處理順序對HUI-Miner性能的影響
8.4.5 可擴展性
8.4.6 實驗結果討論
8.5 小結
第9章 快速識別高可用項集
9.1 先前算法的性能瓶頸
9.2 基本識別算法(BIA)
9.3 基于候選樹的快速識別算法(FIA)
9.3.1 候選樹結構
9.3.2 快速識別算法
9.4 算法分析:BIA與FIA
9.5 實驗六:BIA與FIA的性能對比
9.5.1 高可用項集識別時間
9.5.2 候選項集生成時間
9.5.3 內存耗費
9.5.4 實驗結果分析
9.6 實驗七:FIA-UP-Growth+和HUI-Miner的性能對比
9.6.1 運行時間&內存耗費
9.6.2 實驗結果分析
9.7 小結
第10章 *大頻繁項集挖掘
10.1 介紹
10.2 基本概念
10.3 MAFIA算法
10.3.1 深度優(yōu)先遍歷
10.3.2 搜索空間剪枝
10.3.3 有效的MFI超集檢查
10.4 挖掘非*大頻繁項集
10.4.1 挖掘所有的頻繁項集
10.4.2 挖掘所有的頻繁閉項集
10.5 實施細節(jié)
10.6 結論
第11章 頻繁閉項集挖掘
11.1 介紹
11.2 頻繁項集挖掘
11.2.1 基本定義
11.2.2 先前的解決方案
11.3 項集-記錄標識符集合搜索樹與等價類
11.4 CHARM算法設計與實現(xiàn)
11.4.1 快速的閉項集子集合檢查
11.4.2 使用差異集合快速進行頻繁計數(shù)
11.4.3 其他優(yōu)化及正確性
11.5 實驗結果
11.6 結論
參考文獻
第1章 概述
1.1 項集:數(shù)據(jù)挖掘研究領域的焦點之一
1.2 頻繁項集挖掘問題的研究歷史
1.3 高可用項集挖掘問題的研究歷史
1.4 本書的主要內容
第2章 頻繁項集挖掘問題
2.1 概述
2.1.1 問題形式化定義
2.1.2 搜索空間與方法
2.2 基礎頻繁項集挖掘算法介紹
2.2.1 經典的候選生成Apriori算法
2.2.2 以垂直視角處理數(shù)據(jù)庫的Eclat算法
2.2.3 基于前綴樹結構的FP-growth算法
2.3 性能測試的軟硬件環(huán)境
2.3.1 數(shù)據(jù)庫描述
2.3.2 參照算法介紹
2.3.3 其他軟硬件設施
2.4 實驗一:三種基礎算法的性能測試
2.4.1 實驗結果
2.4.2 性能評價
第3章 BFP-growth:快速模式增長算法
3.1 經典模式增長算法的性能分析
3.1.1 影響FP-growth性能的三個因素
3.1.2 ICDM*佳算法:FPgrowth
3.2 批量模式增長算法:BFP-growth
3.2.1 性能提升的途徑
3.2.2 核心步驟:兩次前綴樹遍歷
3.2.3 算法偽代碼
3.3 BFP-growth算法的性能分析
3.3.1 更少的遍歷花費
3.3.2 FP-array技術應該集成在BFP-growth中嗎
3.3.3 無修飾的前綴樹結構
3.4 實驗二:BFP-growth的性能測試及討論
3.4.1 BFP-growth及FPgrowth*與基礎算法的對比
3.4.2 實驗結果討論
3.5 小結
第4章 基于結點集合結構的NS算法
4.1 Eclat及FP-growth算法的優(yōu)缺點
4.2 結點集合結構(Node-set)
4.2.1 條件結點
4.2.2 結點拓撲序號
4.2.3 使用結點集合結構表示前綴樹
4.3 NS算法
4.3.1 映射前綴樹到結點集合結構
4.3.2 從結點集合結構中挖掘頻繁項集
4.3.3 一個例子
4.3.4 NS算法的原子操作
4.4 實驗三:NS算法與其他快速挖掘算法的性能對比
4.4.1 實驗結果
4.4.2 結果討論:NS算法的性能優(yōu)勢
4.5 小結
第5章 用Patricia*結構挖掘頻繁項集
5.1 研究動機
5.2 Patricia*結構
5.2.1 單孩子結點
5.2.2 構造:Patricia*結構
5.3 用Patricia*結構挖掘頻繁項集
5.3.1 先前的挖掘流程
5.3.2 改進的挖掘流程
5.3.3 PatriciaMine*算法
5.4 實驗結果
5.4.1 結點數(shù)量統(tǒng)計
5.4.2 性能對比
5.5 小結
第6章 頻繁項集挖掘算法的內存耗費
6.1 BFP-growth算法內存使用情況分析
6.2 NS算法內存使用情況分析
6.3 實驗四:快速挖掘算法的內存耗費
6.4 SP算法
6.4.1 研究動機
6.4.2 基礎知識
6.4.3 挖掘頻繁項集
6.4.4 實驗結果與結論
第7章 高可用項集挖掘問題
7.1 從頻繁項集到高可用項集
7.2 問題的形式化定義
7.3 已有挖掘算法概述
第8章 非候選生成高可用項集挖掘算法
8.1 項集有用性列表結構
8.1.1 初始有用性列表
8.1.2 2-項集的有用性列表
8.1.3 缸項集有用性列表(k≥3)
8.2 HUI-Miner算法
8.2.1 剪枝策略
8.2.2 算法偽代碼
8.3 HUI-Miner算法的實現(xiàn)細節(jié)
8.3.1 有用性列表表頭
8.3.2 重新標注tid
8.3.3 交易權重有用性增加的順序
8.4 實驗五:HUI-Miner性能測試
8.4.1 實驗設置
8.4.2 HUI-Miner及對比算法的運行時間
8.4.3 HUI-Miner及對比算法的內存耗費
8.4.4 項處理順序對HUI-Miner性能的影響
8.4.5 可擴展性
8.4.6 實驗結果討論
8.5 小結
第9章 快速識別高可用項集
9.1 先前算法的性能瓶頸
9.2 基本識別算法(BIA)
9.3 基于候選樹的快速識別算法(FIA)
9.3.1 候選樹結構
9.3.2 快速識別算法
9.4 算法分析:BIA與FIA
9.5 實驗六:BIA與FIA的性能對比
9.5.1 高可用項集識別時間
9.5.2 候選項集生成時間
9.5.3 內存耗費
9.5.4 實驗結果分析
9.6 實驗七:FIA-UP-Growth+和HUI-Miner的性能對比
9.6.1 運行時間&內存耗費
9.6.2 實驗結果分析
9.7 小結
第10章 *大頻繁項集挖掘
10.1 介紹
10.2 基本概念
10.3 MAFIA算法
10.3.1 深度優(yōu)先遍歷
10.3.2 搜索空間剪枝
10.3.3 有效的MFI超集檢查
10.4 挖掘非*大頻繁項集
10.4.1 挖掘所有的頻繁項集
10.4.2 挖掘所有的頻繁閉項集
10.5 實施細節(jié)
10.6 結論
第11章 頻繁閉項集挖掘
11.1 介紹
11.2 頻繁項集挖掘
11.2.1 基本定義
11.2.2 先前的解決方案
11.3 項集-記錄標識符集合搜索樹與等價類
11.4 CHARM算法設計與實現(xiàn)
11.4.1 快速的閉項集子集合檢查
11.4.2 使用差異集合快速進行頻繁計數(shù)
11.4.3 其他優(yōu)化及正確性
11.5 實驗結果
11.6 結論
參考文獻
展開全部
書友推薦
- >
二體千字文
- >
朝聞道
- >
唐代進士錄
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
羅庸西南聯(lián)大授課錄
- >
姑媽的寶刀
- >
苦雨齋序跋文-周作人自編集
- >
龍榆生:詞曲概論/大家小書
本類暢銷