-
>
闖進(jìn)數(shù)學(xué)世界――探秘歷史名題
-
>
中醫(yī)基礎(chǔ)理論
-
>
當(dāng)代中國政府與政治(新編21世紀(jì)公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學(xué)·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
數(shù)據(jù)挖掘:方法與應(yīng)用 版權(quán)信息
- ISBN:9787302369011
- 條形碼:9787302369011 ; 978-7-302-36901-1
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
數(shù)據(jù)挖掘:方法與應(yīng)用 本書特色
這本《數(shù)據(jù)挖掘--方法與應(yīng)用》主要根據(jù)作者徐華近幾年在清華大學(xué)面向研究生和本科生開設(shè)的“ 數(shù)據(jù)挖掘:方法與應(yīng)用”課程的教學(xué)實踐與積累,參考近幾年國外著名大學(xué)相關(guān)課程的教學(xué)體系,系統(tǒng)地介紹數(shù)據(jù)挖掘的基本概念和基本原理方法;結(jié)合一些典型的應(yīng)用實例展示用數(shù)據(jù)挖掘的思維方法求解問題的一般性模式與思路。 本書可作為有一定數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫和程序設(shè)計基礎(chǔ)的研究生或本科生開展數(shù)據(jù)挖掘知識學(xué)習(xí)和研究的入門性教材與參考讀物。
數(shù)據(jù)挖掘:方法與應(yīng)用 內(nèi)容簡介
本書主要根據(jù)作者近幾年在清華大學(xué)面向研究生和本科生開設(shè)的“數(shù)據(jù)挖掘:方法與應(yīng)用”課程的教學(xué)實踐與積累,參考近幾年國外著名大學(xué)相關(guān)課程的教學(xué)體系,系統(tǒng)的介紹數(shù)據(jù)挖掘的基本概念和基本原理方法;結(jié)合一些典型的應(yīng)用實例展示用數(shù)據(jù)挖掘的思維方法求解問題的一般性模式與思路。 本書可作為有一定數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫和程序設(shè)計基礎(chǔ)的研究生或本科生開展數(shù)據(jù)挖掘知識學(xué)習(xí)和研究的入門性教材與參考讀物。
數(shù)據(jù)挖掘:方法與應(yīng)用 目錄
1.1 應(yīng)用背景
1.1.1 商業(yè)上的驅(qū)動
1.1.2 科學(xué)研究上的驅(qū)動
1.1.3 數(shù)據(jù)挖掘伴隨著數(shù)據(jù)庫技術(shù)而出現(xiàn)
1.2 什么是數(shù)據(jù)挖掘
1.2.1 基本描述
1.2.2 關(guān)于知識發(fā)現(xiàn)
1.3 數(shù)據(jù)挖掘的主要技術(shù)
1.4 數(shù)據(jù)挖掘的主要研究內(nèi)容
1.5 數(shù)據(jù)挖掘面臨的主要問題
1.6 數(shù)據(jù)挖掘相關(guān)的資料
1.7 本書的總體章節(jié)安排
1.8 小結(jié)
參考文獻(xiàn)
第2章 數(shù)據(jù)預(yù)處理
2.1 前言
2.2 數(shù)據(jù)預(yù)處理的基本概念
2.2.1 數(shù)據(jù)的基本概念
2.2.2 為什么要進(jìn)行數(shù)據(jù)預(yù)處理
2.2.3 數(shù)據(jù)預(yù)處理的任務(wù)
2.3 數(shù)據(jù)的描述
2.3.1 描述數(shù)據(jù)的中心趨勢
2.3.2 描述數(shù)據(jù)的分散程度
2.3.3 描述數(shù)據(jù)的其他方式
2.4 數(shù)據(jù)清洗
2.4.1 數(shù)據(jù)缺失的處理
2.4.2 數(shù)據(jù)清洗
2.5 數(shù)據(jù)集成和轉(zhuǎn)換
2.5.1 數(shù)據(jù)集成
2.5.2 數(shù)據(jù)冗余性
2.5.3 數(shù)據(jù)轉(zhuǎn)換
2.6 數(shù)據(jù)歸約和變換
2.6.1 數(shù)據(jù)歸約
2.6.2 數(shù)據(jù)離散化
2.6.3 概念層次生成
2.7 小結(jié)
參考文獻(xiàn)
第3章 數(shù)據(jù)倉庫
3.1 前言
3.2 數(shù)據(jù)庫基本概念回顧
3.2.1 數(shù)據(jù)庫簡介
3.2.2 表、記錄和域
3.2.3 數(shù)據(jù)庫管理系統(tǒng)
3.3 數(shù)據(jù)倉庫簡介
3.3.1 數(shù)據(jù)倉庫特點
3.3.2 數(shù)據(jù)倉庫概念
3.3.3 數(shù)據(jù)倉庫作用
3.3.4 數(shù)據(jù)倉庫與dbms對比
3.3.5 分離數(shù)據(jù)倉庫的原因
3.4 多維數(shù)據(jù)模型
3.4.1 數(shù)據(jù)立方體
3.4.2 概念模型
3.4.3 概念分層
3.4.4 典型olap操作
3.4.5 星型網(wǎng)絡(luò)的查詢模型
3.5 數(shù)據(jù)倉庫結(jié)構(gòu)
3.5.1 數(shù)據(jù)倉庫設(shè)計
3.5.2 多層體系結(jié)構(gòu)
3.6 數(shù)據(jù)倉庫的功能
3.6.1 數(shù)據(jù)立方體的有效計算
3.6.2 索引olap數(shù)據(jù)
3.6.3 olap查詢的有效處理
3.7 從數(shù)據(jù)倉庫到數(shù)據(jù)挖掘
3.7.1 數(shù)據(jù)倉庫應(yīng)用
3.7.2 從olap到
3.8 小結(jié)
參考文獻(xiàn)
第4章 相關(guān)性與關(guān)聯(lián)規(guī)則
4.1 基本概念
4.1.1 潛在的應(yīng)用
4.1.2 購物籃問題
4.1.3 頻繁模式分析、閉項集和關(guān)聯(lián)規(guī)則
4.2 頻繁項集挖掘方法
4.2.1 apriori算法
4.2.2 由頻繁項集產(chǎn)生關(guān)聯(lián)規(guī)則
4.2.3 提高apriori的效率
4.2.4 挖掘頻繁項集的模式增長方法
4.3 多種關(guān)聯(lián)規(guī)則挖掘
4.3.1 挖掘多層關(guān)聯(lián)規(guī)則
4.3.2 挖掘多維關(guān)聯(lián)規(guī)則
4.3.3 挖掘量化關(guān)聯(lián)規(guī)則
4.4 從關(guān)聯(lián)分析到相關(guān)分析
4.4.1 相關(guān)分析
4.4.2 強(qiáng)規(guī)則不一定是有價值的
4.4.3 挖掘高度關(guān)聯(lián)的模式
4.5 基于約束的頻繁模式挖掘
4.5.1 關(guān)聯(lián)規(guī)則的元規(guī)則制導(dǎo)挖掘
4.5.2 基于約束的模式生成: 模式空間剪枝和數(shù)據(jù)空間剪枝
4.6 小結(jié)
參考文獻(xiàn)
第5章 分類和預(yù)測
5.1 前言
5.2 基本概念
5.2.1 什么是分類
5.2.2 什么是預(yù)測
5.3 關(guān)于分類和預(yù)測的問題
5.3.1 準(zhǔn)備分類和預(yù)測的數(shù)據(jù)
5.3.2 評價分類和預(yù)測方法
5.4 決策樹分類
5.4.1 決策樹歸納
5.4.2 屬性選擇度量
5.4.3 提取分類規(guī)則
5.4.4 基本決策樹歸納的增強(qiáng)
5.4.5 在大數(shù)據(jù)集中的分類
5.5 貝葉斯分類
5.5.1 貝葉斯定理
5.5.2 樸素貝葉斯分類
5.5.3 貝葉斯信念網(wǎng)絡(luò)
5.5.4 貝葉斯網(wǎng)絡(luò)學(xué)習(xí)
5.6 神經(jīng)網(wǎng)絡(luò)
5.6.1 神經(jīng)網(wǎng)絡(luò)簡介
5.6.2 多層神經(jīng)網(wǎng)絡(luò)
5.6.3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練
5.6.4 后向傳播
5.6.5 網(wǎng)絡(luò)剪枝和規(guī)則抽取
5.7 支持向量機(jī)
5.7.1 數(shù)據(jù)線性可分的情況
5.7.2 數(shù)據(jù)線性不可分的情況
5.7.3 支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)的對比
5.8 關(guān)聯(lián)分類
5.8.1 為什么有效
5.8.2 常見關(guān)聯(lián)分類算法
5.9 分類準(zhǔn)確率
5.9.1 估計錯誤率
5.9.2 裝袋和提升
5.10 小結(jié)
參考文獻(xiàn)
第6章 聚類分析
6.1 聚類分析的定義和數(shù)據(jù)類型
6.1.1 聚類的定義
6.1.2 聚類分析和主要應(yīng)用
6.1.3 聚類分析方法的性能指標(biāo)
6.1.4 聚類分析使用的數(shù)據(jù)類型
6.2 流聚類方法分類與相似性質(zhì)量
6.2.1 聚類分析方法分類
6.2.2 連續(xù)變量的距離與相似性度量
6.2.3 二元變量與標(biāo)稱變量的相似性度量
6.2.4 序數(shù)和比例標(biāo)度變量的相似性度量
6.2.5 混合類型變量的相似性度量
6.3 基于分割的聚類
6.4 基于層次的聚類
6.5 基于密度的聚類
6.6 基于網(wǎng)格的聚類
6.7 基于模型的聚類
6.8 離群點檢測
6.9 小結(jié)
參考文獻(xiàn)
第7章 數(shù)據(jù)挖掘應(yīng)用
7.1 前言
7.2 應(yīng)用研發(fā)思路
7.3 預(yù)處理方法
7.3.1 基礎(chǔ)數(shù)據(jù)說明
7.3.2 數(shù)字化方法說明
7.3.3 深入一步的預(yù)處理方法
7.3.4 基本數(shù)據(jù)分布情況說明
7.3.5 初步分析結(jié)果
7.3.6 小結(jié)
7.4 特征提取方法
7.4.1 8種特征提取方法
7.4.2 特征總體排名策略
7.4.3 *終關(guān)鍵特征
7.4.4 特征提取與分析結(jié)論
7.4.5 小結(jié)
7.5 皮膚特征預(yù)測模型
7.5.1 預(yù)測方法回顧
7.5.2 預(yù)測結(jié)果分析與結(jié)論
7.5.3 小結(jié)
7.6 小結(jié)
參考文獻(xiàn)
附錄
附錄a 插圖索引
附錄b 表格索引
附錄c 算法索引
附錄d 關(guān)鍵詞索引
數(shù)據(jù)挖掘:方法與應(yīng)用 作者簡介
徐華,博士,清華大學(xué)計算機(jī)系副研究員。主要研究興趣領(lǐng)域包括數(shù)據(jù)挖掘、智能信息處理和特殊裝備的先進(jìn)工藝控制等。作為項目負(fù)責(zé)人、首席技術(shù)專家或研發(fā)骨干,負(fù)責(zé)完成國家科技重大專項課題3項,國家自然科學(xué)基金項目4項,國家973項目二級課題1項,國家863項目(課題)5項。國際500強(qiáng)企業(yè)(寶潔、西門子、安捷倫等)合作項目10項。目前已在本專業(yè)領(lǐng)域權(quán)威期刊和會議上發(fā)表學(xué)術(shù)論文60余篇;參與編寫學(xué)術(shù)專著2部。作為第一完成人獲得國家發(fā)明專利10項。國際PCT發(fā)明專利4項,軟件著作權(quán)7項。作為清華大學(xué)方面的第一完成人,獲得國家科技進(jìn)步二等獎1項,北京市科學(xué)技術(shù)一等獎1項和二等獎1項,重慶市科學(xué)技術(shù)三等獎1項,行業(yè)協(xié)會科學(xué)技術(shù)一等獎1項等。
- >
小考拉的故事-套裝共3冊
- >
李白與唐代文化
- >
我從未如此眷戀人間
- >
有舍有得是人生
- >
回憶愛瑪儂
- >
上帝之肋:男人的真實旅程
- >
詩經(jīng)-先民的歌唱
- >
姑媽的寶刀