中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
21世紀高等學校計算機專業(yè)核心課程規(guī)劃教材數(shù)據(jù)挖掘原理與算法(第3版)/毛國君

包郵 21世紀高等學校計算機專業(yè)核心課程規(guī)劃教材數(shù)據(jù)挖掘原理與算法(第3版)/毛國君

出版社:清華大學出版社出版時間:2015-11-01
開本: 其他 頁數(shù): 334
本類榜單:教材銷量榜
中 圖 價:¥32.8(6.7折) 定價  ¥49.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

21世紀高等學校計算機專業(yè)核心課程規(guī)劃教材數(shù)據(jù)挖掘原理與算法(第3版)/毛國君 版權(quán)信息

21世紀高等學校計算機專業(yè)核心課程規(guī)劃教材數(shù)據(jù)挖掘原理與算法(第3版)/毛國君 本書特色

《數(shù)據(jù)挖掘原理與算法(第3版)》在經(jīng)典教材的基礎上,重點增加了大數(shù)據(jù)挖掘等新的數(shù)據(jù)挖掘的需求和技術分析,對Web挖掘的內(nèi)容進行了重新編排,并增加了必要的新方法。近年來出現(xiàn)的公認的典型算法和技術也得到加強,使之很好地適應讀者在教學或者學習中的新需求。 本書內(nèi)容相對全面,各章之間耦合度小。作為教材,教師可以根據(jù)學生類型、學時安排等進行選擇性教學。作為參考書,讀者可以根據(jù)自己的基礎進行選擇性學習或查閱。在每章后面都設置專門一節(jié)來對本章內(nèi)容和文獻引用情況進行歸納,它不僅可以幫助讀者對相關內(nèi)容進行整理,而且對讀者,特別是研究人員,也起到文獻的注釋性索引功能。

21世紀高等學校計算機專業(yè)核心課程規(guī)劃教材數(shù)據(jù)挖掘原理與算法(第3版)/毛國君 內(nèi)容簡介

本書是一本全面介紹數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術的專業(yè)書籍,系統(tǒng)地闡述了數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術的產(chǎn)生、發(fā)展、應用以及相關概念、原理和算法,對數(shù)據(jù)挖掘中的主要技術分支,包括關聯(lián)規(guī)則、分類、聚類、序列、空間以及Web挖掘等進行了理論剖析和算法描述。本書的許多內(nèi)容是作者們在攻讀博士學位期間的工作總結(jié),一方面,對于相關概念和技術的闡述盡量先從理論分析入手,在此基礎上進行技術歸納; 另一方面,為了保證技術的系統(tǒng)性,所有的挖掘模型和算法描述都在統(tǒng)一的技術歸納框架下進行。同時,為了避免抽象算法描述給讀者帶來的理解困難,本書的所有典型算法都通過具體跟蹤執(zhí)行實例來進一步說明。 全書共分8章,各章相對獨立成篇,以利于讀者選擇性學習。在每章后面都設置專門一節(jié)來對本章內(nèi)容和文獻引用情況進行歸納,它不僅可以幫助讀者對相關內(nèi)容進行整理,而且也起到對本章內(nèi)容相關文獻的注釋性索引功能。 本書可作為計算機專業(yè)研究生或高年級本科生教材,也可以作為從事計算機研究和開發(fā)人員的參考資料。作為教材,教師可以根據(jù)課時安排進行選擇性教學。為了更好地讓教師進行選擇性教學,本書配有專門的教師用書,對內(nèi)容的重點、難點和課時分配給出了對應的建議,對重要的和難度較大的習題進行了分析和解答。對于研究人員,本書是一本高參考價值的專業(yè)書籍。對于軟件技術人員,可以把它當作提高用書或參考資料,一些算法可以通過改造用于實際的應用系統(tǒng)中。

21世紀高等學校計算機專業(yè)核心課程規(guī)劃教材數(shù)據(jù)挖掘原理與算法(第3版)/毛國君 目錄

第1章 緒論
1.1 數(shù)據(jù)挖掘技術的產(chǎn)生與發(fā)展
1.1.1 數(shù)據(jù)挖掘技術的商業(yè)需求分析
1.1.2 數(shù)據(jù)挖掘產(chǎn)生的技術背景分析
1.1.3 大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術需求分析
1.2 數(shù)據(jù)挖掘研究的發(fā)展趨勢
1.3 數(shù)據(jù)挖掘概念
1.3.1 從商業(yè)角度看數(shù)據(jù)挖掘技術
1.3.2 數(shù)據(jù)挖掘的技術含義
1.3.3 數(shù)據(jù)挖掘研究的理論基礎
1.4 數(shù)據(jù)挖掘技術的分類問題
1.5 數(shù)據(jù)挖掘常用的知識表示模式與方法
1.5.1 廣義知識挖掘
1.5.2 關聯(lián)知識挖掘
1.5.3 類知識挖掘
1.5.4 預測型知識挖掘
1.5.5 特異型知識挖掘
1.6 不同數(shù)據(jù)存儲形式下的數(shù)據(jù)挖掘問題
1.6.1 事務數(shù)據(jù)庫中的數(shù)據(jù)挖掘
1.6.2 關系型數(shù)據(jù)庫中的數(shù)據(jù)挖掘
1.6.3 數(shù)據(jù)倉庫中的數(shù)據(jù)挖掘
1.6.4 在關系模型基礎上發(fā)展的新型數(shù)據(jù)庫中的數(shù)據(jù)挖掘
1.6.5 面向應用的新型數(shù)據(jù)源中的數(shù)據(jù)挖掘
1.6.6 Web數(shù)據(jù)源中的數(shù)據(jù)挖掘
1.7 粗糙集方法及其在數(shù)據(jù)挖掘中的應用
1.7.1 粗糙集的一些重要概念
1.7.2 粗糙集應用舉例
1.7.3 粗糙集方法在KDD中的應用范圍
1.8 數(shù)據(jù)挖掘的應用分析
1.8.1 數(shù)據(jù)挖掘與CRM
1.8.2 數(shù)據(jù)挖掘與社會網(wǎng)絡
1.8.3 數(shù)據(jù)挖掘應用的成功案例分析
1.9 本章小結(jié)和文獻注釋
習題1

第2章 知識發(fā)現(xiàn)過程與應用結(jié)構(gòu)
2.1 知識發(fā)現(xiàn)的基本過程
2.1.1 數(shù)據(jù)抽取與集成技術要點
2.1.2 數(shù)據(jù)清洗與預處理技術要點
2.1.3 數(shù)據(jù)的選擇與整理技術要點
2.1.4 數(shù)據(jù)挖掘技術要點
2.1.5 模式評估技術要點
2.2 數(shù)據(jù)庫中的知識發(fā)現(xiàn)處理過程模型
2.2.1 階梯處理過程模型
2.2.2 螺旋處理過程模型
2.2.3 以用戶為中心的處理模型
2.2.4 聯(lián)機KDD模型
2.2.5 支持多數(shù)據(jù)源多知識模式的KDD處理模型
2.3 知識發(fā)現(xiàn)軟件或工具的發(fā)展
2.3.1 獨立的知識發(fā)現(xiàn)軟件
2.3.2 橫向的知識發(fā)現(xiàn)工具集
2.3.3 縱向的知識發(fā)現(xiàn)解決方案
2.3.4 KDD系統(tǒng)介紹
2.4 知識發(fā)現(xiàn)項目的過程化管理
2.5 數(shù)據(jù)挖掘語言介紹
2.5.1 數(shù)據(jù)挖掘語言的分類
2.5.2 數(shù)據(jù)挖掘查詢語言
2.5.3 數(shù)據(jù)挖掘建模語言
2.5.4 通用數(shù)據(jù)挖掘語言
2.5.5 DMQL挖掘查詢語言介紹
2.6 本章小結(jié)和文獻注釋
習題2

第3章 關聯(lián)規(guī)則挖掘理論和算法
3.1 基本概念與解決方法
3.2 經(jīng)典的頻繁項目集生成算法分析
3.2.1 項目集空間理論
3.2.2 經(jīng)典的發(fā)現(xiàn)頻繁項目集算法
3.2.3 關聯(lián)規(guī)則生成算法
3.3 Apriori算法的性能瓶頸問題
3.4 Apriori的改進算法
3.4.1 基于數(shù)據(jù)分割的方法
3.4.2 基于散列的方法
3.4.3 基于采樣的方法
3.5 項目集空間理論的發(fā)展
3.5.1 Close算法
3.5.2 FP-tree算法
3.6 項目集格空間和它的操作
3.7 基于項目集操作的關聯(lián)規(guī)則挖掘算法
3.7.1 關聯(lián)規(guī)則挖掘空間
3.7.2 三個實用算子
3.7.3 *大頻繁項目集格的生成算法
3.7.4 ISS-DM算法執(zhí)行示例
3.8 改善關聯(lián)規(guī)則挖掘質(zhì)量問題
3.8.1 用戶主觀層面
3.8.2 系統(tǒng)客觀層面
3.9 約束數(shù)據(jù)挖掘問題
3.9.1 約束在數(shù)據(jù)挖掘中的作用
3.9.2 約束的類型
3.10 時態(tài)約束關聯(lián)規(guī)則挖掘
3.11 關聯(lián)規(guī)則挖掘中的一些更深入的問題
3.11.1 多層次關聯(lián)規(guī)則挖掘
3.11.2 多維關聯(lián)規(guī)則挖掘
3.11.3 數(shù)量關聯(lián)規(guī)則挖掘
3.12 數(shù)量關聯(lián)規(guī)則挖掘方法
3.12.1 數(shù)量關聯(lián)規(guī)則挖掘問題
3.12.2 數(shù)量關聯(lián)規(guī)則的分類
3.12.3 數(shù)量關聯(lián)規(guī)則挖掘的一般步驟
3.12.4 數(shù)值屬性離散化問題及算法
3.13 本章小結(jié)和文獻注釋
習題3

第4章 分類方法
4.1 分類的基本概念與步驟
4.2 基于距離的分類算法
4.3 決策樹分類方法
4.3.1 決策樹基本算法概述
4.3.2 ID3算法
4.3.3 C4.5 算法
4.4 貝葉斯分類
4.4.1 貝葉斯定理
4.4.2 樸素貝葉斯分類
4.4.3 EM算法
4.5 規(guī)則歸納
4.5.1 AQ算法
4.5.2 CN2算法
4.5.3 FOIL算法
4.6 與分類有關的其他問題
4.6.1 分類數(shù)據(jù)預處理
4.6.2 分類器性能的表示與評估
4.7 本章小結(jié)和文獻注釋
習題4
……

第5章 聚類方法
第6章 時間序列和序列模式挖掘
第7章 Web挖掘技術
第8章 空間挖掘

參考文獻
展開全部

21世紀高等學校計算機專業(yè)核心課程規(guī)劃教材數(shù)據(jù)挖掘原理與算法(第3版)/毛國君 節(jié)選

  《數(shù)據(jù)挖掘原理與算法(第3版)》:  2.1.1 數(shù)據(jù)抽取與集成技術要點  在弄清源數(shù)據(jù)的信息和結(jié)構(gòu)的基礎上,首先需要準確地界定所選取的數(shù)據(jù)源和抽取原則。將多數(shù)據(jù)庫運行環(huán)境中的數(shù)據(jù)進行合并處理達到數(shù)據(jù)集成的目的。然后設計存儲新數(shù)據(jù)的結(jié)構(gòu)和準確定義它與源數(shù)據(jù)的轉(zhuǎn)換和裝載機制,以便正確地從每個數(shù)據(jù)源中抽取所需的數(shù)據(jù)。這些結(jié)構(gòu)和轉(zhuǎn)換信息應該作為元數(shù)據(jù)(Metadata)被存儲起來。在數(shù)據(jù)抽取過程中,必須要全面掌握源數(shù)據(jù)的結(jié)構(gòu)特點,任何疏忽都可能導致數(shù)據(jù)抽取的失敗。在抽取多個異構(gòu)數(shù)據(jù)源的過程中,可能需要將不同的源數(shù)據(jù)格式轉(zhuǎn)換成一種中間模式,再把它們集成起來。數(shù)據(jù)抽取與集成是知識發(fā)現(xiàn)的關鍵性工作。早期的數(shù)據(jù)抽取是依靠手工編程來實現(xiàn)的,現(xiàn)在可以通過高效的抽取工具來實現(xiàn)。即使是使用抽取工具,數(shù)據(jù)抽取和裝載仍然是一件很艱苦的工作。應用領域的分析數(shù)據(jù)通常來自多個數(shù)據(jù)源,所以必須進行數(shù)據(jù)集成。來自不同源的數(shù)據(jù)可能有模式定義上的差異,也可能存在因數(shù)據(jù)冗余而無法確定有效數(shù)據(jù)的情形。此外,還要考慮數(shù)據(jù)庫系統(tǒng)本身可能存在不兼容的情況。  2.1.2 數(shù)據(jù)清洗與預處理技術要點  如前所述,在開始一個知識發(fā)現(xiàn)項目之前必須清晰地定義挖掘目標。雖然挖掘的*后結(jié)果是不可預測的,但是要解決或探索的問題應該是可預見的。盲目性地挖掘是沒有任何意義的。在弄清業(yè)務問題后就可以進行數(shù)據(jù)的準備。數(shù)據(jù)預處理是進行數(shù)據(jù)分析和挖掘的基礎,如果所集成的數(shù)據(jù)不正確,數(shù)據(jù)挖掘算法輸出的結(jié)果也必然不正確,這樣形成的決策支持是不可靠的。因此,要提高挖掘結(jié)果的準確率,數(shù)據(jù)預處理是不可忽視的一步。對數(shù)據(jù)進行預處理,一般需要對源數(shù)據(jù)進行再加工,檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性,對其中的噪聲數(shù)據(jù)進行平滑,對丟失的數(shù)據(jù)進行填補,清除“臟”數(shù)據(jù),清除重復記錄等。常見的數(shù)據(jù)預處理方法有:數(shù)據(jù)清洗、數(shù)據(jù)變換和數(shù)據(jù)歸約等。  數(shù)據(jù)清洗是指去除或修補源數(shù)據(jù)中的不完整、不一致、含噪聲的數(shù)據(jù)。在源數(shù)據(jù)中,可能由于疏忽、懶惰甚至為了保密使系統(tǒng)設計人員無法得到某些數(shù)據(jù)項的數(shù)據(jù)。假如這個數(shù)據(jù)項正是知識發(fā)現(xiàn)系統(tǒng)所關心的,那么這類不完整的數(shù)據(jù)就需要修補。  常見的不完整數(shù)據(jù)的修補辦法有:  使用一個全局值來填充(如unknown、估計的*大數(shù)或*小數(shù))。  統(tǒng)計該屬性的所有非空值,并用平均值來填充空缺項。  只使用同類對象的屬性平均值填充。  利用回歸或工具預測*可能的值,并用它來填充。  數(shù)據(jù)不一致可能是由于源數(shù)據(jù)庫中對相同屬性數(shù)據(jù)所使用的數(shù)據(jù)類型、度量單位等不同而導致的。因此需要定義它們的轉(zhuǎn)換規(guī)則,并在挖掘前統(tǒng)一成一個形式。噪聲數(shù)據(jù)是指那些明顯不符合邏輯的偏差數(shù)據(jù)(如某雇員200歲),這樣的數(shù)據(jù)往往影響挖掘結(jié)果的正確性。  目前討論*多的處理噪聲數(shù)據(jù)的方法是數(shù)據(jù)平滑(DataSmoothing)技術。1999年,Pyle系統(tǒng)地歸納了利用數(shù)據(jù)平滑技術消除噪聲數(shù)據(jù)的方法。主要有:  利用分箱(Binning)方法檢測周圍相應屬性的值來進行局部數(shù)據(jù)平滑。  利用聚類技術檢測孤立點數(shù)據(jù),對它們進行修正。  利用回歸函數(shù)探測和修正噪聲數(shù)據(jù)。  2.1.3 數(shù)據(jù)的選擇與整理技術要點  沒有高質(zhì)量的數(shù)據(jù)就不可能有高質(zhì)量的挖掘結(jié)果。為了得到一個高質(zhì)量的適合挖掘的數(shù)據(jù)子集,一方面需要通過數(shù)據(jù)清洗來消除干擾性數(shù)據(jù),另一方面也需要針對挖掘目標進行數(shù)據(jù)選擇。數(shù)據(jù)選擇的目的是辨別出需要分析的數(shù)據(jù)集合,縮小處理范圍,提高數(shù)據(jù)挖掘的質(zhì)量。數(shù)據(jù)選擇可以使后面的數(shù)據(jù)挖掘工作聚焦到和挖掘任務相關的數(shù)據(jù)子集中。不僅提高了挖掘效率,而且也保證了挖掘的準確性。我們認為,數(shù)據(jù)選擇可以通過對目標數(shù)據(jù)加以正面限制或條件約束,挑選那些符合條件的數(shù)據(jù)。也可以通過對不感興趣的數(shù)據(jù)加以排除,只保留那些可能感興趣的數(shù)據(jù)。必須深入分析應用目標對數(shù)據(jù)的要求,確定合適的數(shù)據(jù)選擇或數(shù)據(jù)過濾策略,才能保證目標數(shù)據(jù)的質(zhì)量。被挑選的數(shù)據(jù)必須整理成合適的存儲形式才能被挖掘算法所使用。  利用數(shù)據(jù)變換或歸約等技術可以將數(shù)據(jù)整理成適合進一步挖掘的數(shù)據(jù)格式。數(shù)據(jù)變換可以根據(jù)需要構(gòu)造出新的屬性以幫助理解分析數(shù)據(jù)的特點,或者將數(shù)據(jù)規(guī)范化,使之落在一個特定的數(shù)據(jù)區(qū)間中。數(shù)據(jù)歸約則是在盡可能保證數(shù)據(jù)完整性的基礎上,將數(shù)據(jù)以其他方式進行表示,以減少數(shù)據(jù)存儲空間,使挖掘過程更有效。常用的歸約策略有:數(shù)據(jù)立方體聚集、維歸約、數(shù)據(jù)壓縮、數(shù)值壓縮和離散化等。  ……

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 丹佛斯压力传感器,WISE温度传感器,WISE压力开关,丹佛斯温度开关-上海力笙工业设备有限公司 | 广东恩亿梯电源有限公司【官网】_UPS不间断电源|EPS应急电源|模块化机房|电动汽车充电桩_UPS电源厂家(恩亿梯UPS电源,UPS不间断电源,不间断电源UPS) | 医用空气消毒机-医用管路消毒机-工作服消毒柜-成都三康王 | 深圳货架厂_仓库货架公司_重型仓储货架_线棒货架批发-深圳市诺普泰仓储设备有限公司 | 在线PH计-氧化锆分析仪-在线浊度仪-在线溶氧仪- 无锡朝达 | 今日扫码_溯源二维码_产品防伪一物一码_红包墙营销方案 | 质检报告_CE认证_FCC认证_SRRC认证_PSE认证_第三方检测机构-深圳市环测威检测技术有限公司 | 物联网卡_物联网卡购买平台_移动物联网卡办理_移动联通电信流量卡通信模组采购平台? | 全自动五线打端沾锡机,全自动裁线剥皮双头沾锡机,全自动尼龙扎带机-东莞市海文能机械设备有限公司 | 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 智能气瓶柜(大型气瓶储存柜)百科 | 成都LED显示屏丨室内户外全彩led屏厂家方案报价_四川诺显科技 | 智慧农业|农业物联网|现代农业物联网-托普云农物联网官方网站 | 袋式过滤器,自清洗过滤器,保安过滤器,篮式过滤器,气体过滤器,全自动过滤器,反冲洗过滤器,管道过滤器,无锡驰业环保科技有限公司 | PCB设计,PCB抄板,电路板打样,PCBA加工-深圳市宏力捷电子有限公司 | 温室大棚建设|水肥一体化|物联网系统 | 高温热泵烘干机,高温烘干热泵,热水设备机组_正旭热泵 | 芜湖厨房设备_芜湖商用厨具_芜湖厨具设备-芜湖鑫环厨具有限公司 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | 土壤有机碳消解器-石油|表层油类分析采水器-青岛溯源环保设备有限公司 | 注塑机-压铸机-塑料注塑机-卧式注塑机-高速注塑机-单缸注塑机厂家-广东联升精密智能装备科技有限公司 | 别墅图纸超市|别墅设计图纸|农村房屋设计图|农村自建房|别墅设计图纸及效果图大全 | 金属切削液-脱水防锈油-电火花机油-抗磨液压油-深圳市雨辰宏业科技发展有限公司 | [官网]叛逆孩子管教_戒网瘾学校_全封闭问题青少年素质教育_新起点青少年特训学校 | 合肥卓创建筑装饰,专业办公室装饰、商业空间装修与设计。 | 二手色谱仪器,十万分之一分析天平,蒸发光检测器,电位滴定仪-湖北捷岛科学仪器有限公司 | 环境模拟实验室_液体-气体控温机_气体控温箱_无锡双润冷却科技有限公司 | 无线讲解器-导游讲解器-自助讲解器-分区讲解系统 品牌生产厂家[鹰米讲解-合肥市徽马信息科技有限公司] | 收录网| 细胞染色-流式双标-试剂盒免费代做-上海研谨生物科技有限公司 | 分光色差仪,测色仪,反透射灯箱,爱色丽分光光度仪,美能达色差仪维修_苏州欣美和仪器有限公司 | 北京普辉律师事务所官网_北京律师24小时免费咨询|法律咨询 | 药品仓库用除湿机-变电站用防爆空调-油漆房用防爆空调-杭州特奥环保科技有限公司 | 哈尔滨治「失眠/抑郁/焦虑症/精神心理」专科医院排行榜-京科脑康免费咨询 一对一诊疗 | 拉力机-万能试验机-材料拉伸试验机-电子拉力机-拉力试验机厂家-冲击试验机-苏州皖仪实验仪器有限公司 | 郑州巴特熔体泵有限公司专业的熔体泵,熔体齿轮泵与换网器生产厂家 | CCE素质教育博览会 | CCE素博会 | 教育展 | 美育展 | 科教展 | 素质教育展 | 驾驶式洗地机/扫地机_全自动洗地机_工业洗地机_荣事达工厂官网 | 电气控制系统集成商-PLC控制柜变频控制柜-非标自动化定制-电气控制柜成套-NIDEC CT变频器-威肯自动化控制 | 广州冷却塔维修厂家_冷却塔修理_凉水塔风机电机填料抢修-广东康明节能空调有限公司 | 东莞海恒试验仪器设备有限公司| 碳纤维复合材料制品生产定制工厂订制厂家-凯夫拉凯芙拉碳纤维手机壳套-碳纤维雪茄盒外壳套-深圳市润大世纪新材料科技有限公司 |