-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數(shù)據(jù)挖掘 版權信息
- ISBN:9787111771579
- 條形碼:9787111771579 ; 978-7-111-77157-9
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
數(shù)據(jù)挖掘 本書特色
本書遵循教指委相關指導文件和高等院校學生學習規(guī)律編寫而成。踐行四新理念,融入思政元素,注重理論與實踐相結(jié)合。
數(shù)據(jù)挖掘 內(nèi)容簡介
全書共9 章,主要內(nèi)容如下:第1 章介紹了數(shù)據(jù)挖掘的基本知識,講解了數(shù)據(jù)獲取的關鍵環(huán)節(jié)以及數(shù)據(jù)挖掘流程;第2 章講解了數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換與規(guī)范化,以及數(shù)據(jù)規(guī)約等數(shù)據(jù)預處理方法,重視數(shù)據(jù)挖掘的數(shù)據(jù)準備工作,強調(diào)數(shù)據(jù)質(zhì)量對數(shù)據(jù)挖掘算法性能的影響;第3 章講解了數(shù)據(jù)倉庫和數(shù)據(jù)立方體的基本概念和系統(tǒng)架構(gòu),為處理和分析大規(guī)模數(shù)據(jù)集提供有效工具;第4 章講解了關聯(lián)規(guī)則挖掘的相關知識;第5 章講解了經(jīng)典的分類算法、回歸預測算法、性能評估指標和模型調(diào)優(yōu)方法;第6 章講解了經(jīng)典的聚類算法;第7 章講解了圖數(shù)據(jù)挖掘、時間序列數(shù)據(jù)挖掘、大數(shù)據(jù)與分布式數(shù)據(jù)挖掘等高級數(shù)據(jù)挖掘技術,展示了該領域的*新進展;第8 章介紹了數(shù)據(jù)可視化的基本概念、常用工具與技術;第9 章介紹了自然語言智能挖掘、醫(yī)療大數(shù)據(jù)智能挖掘、遙感圖像智能挖掘等案例,培養(yǎng)學生數(shù)據(jù)挖掘理論與實踐結(jié)合的技能。 本書適合作為人工智能、計算機科學與技術、自動化等相關專業(yè)本科生相關課程的配套教材或參考書,也可作為相關領域技術人員的參考書。本書有以下配套教學資源:PPT 課件、習題答案、教學視頻、教學大綱、配套實驗,歡迎選用本書作教材的教師登錄www.cmpedu.com 注冊后下載,或發(fā)郵件至jinacmp@163.com 索取。
數(shù)據(jù)挖掘數(shù)據(jù)挖掘 前言
前言
【編寫目的】數(shù)據(jù)挖掘是計算機科學領域中一門重要的課程,它位于數(shù)據(jù)科學、統(tǒng)計學、機器學習和人工智能的交匯點。這門課程不僅教授學生如何從大量數(shù)據(jù)中提取有價值的信息和知識,還涉及數(shù)據(jù)預處理、關聯(lián)規(guī)則挖掘、數(shù)據(jù)倉庫、識別預測和結(jié)果評估等關鍵技術。數(shù)據(jù)挖掘課程的地位之所以重要,是因為它為學生提供了解決現(xiàn)實世界復雜數(shù)據(jù)分析問題所需的工具和方法,使他們能夠在商業(yè)智能、金融分析、醫(yī)療診斷、社會科學研究等多個領域發(fā)揮重要作用。此外,隨著大數(shù)據(jù)時代的到來,掌握數(shù)據(jù)挖掘的知識和技能變得越來越重要,這對于培養(yǎng)能夠適應未來數(shù)據(jù)驅(qū)動型經(jīng)濟的人才具有不可替代的作用。
【教材特點】本教材以數(shù)據(jù)挖掘基礎知識、經(jīng)典算法、應用案例為基礎,介紹了工業(yè)界數(shù)據(jù)挖掘*新發(fā)展趨勢,注重學生實踐技能的培養(yǎng)。具體來說,本教材通過介紹業(yè)務背景、數(shù)據(jù)獲取與處理、模型選擇、模型評估與調(diào)優(yōu)、結(jié)果分析應用等環(huán)節(jié),使學生系統(tǒng)、全面地掌握數(shù)據(jù)挖掘的基本知識,具備一定的對數(shù)據(jù)挖掘相關實際應用問題進行建模并編程實現(xiàn)的能力。
本教材的主要特點如下。
數(shù)據(jù)挖掘 目錄
前言
第1章緒論
1.1數(shù)據(jù)挖掘概述
1.1.1數(shù)據(jù)挖掘的定義
1.1.2數(shù)據(jù)挖掘的基本任務
1.1.3數(shù)據(jù)挖掘的應用領域
1.1.4數(shù)據(jù)挖掘的學習資源
1.1.5數(shù)據(jù)挖掘的常用工具
1.1.6數(shù)據(jù)挖掘的主要算法
1.2數(shù)據(jù)獲取
1.2.1數(shù)據(jù)類型與來源
1.2.2數(shù)據(jù)采集技術
1.2.3數(shù)據(jù)標注技術
1.2.4數(shù)據(jù)存儲與管理
1.2.5數(shù)據(jù)質(zhì)量評估
1.3數(shù)據(jù)挖掘的流程
1.3.1業(yè)務理解與問題定義
1.3.2數(shù)據(jù)獲取與預處理
1.3.3數(shù)據(jù)挖掘
1.3.4結(jié)果分析與應用
1.4本章小結(jié)
第2章數(shù)據(jù)預處理
2.1數(shù)據(jù)清洗
2.1.1數(shù)據(jù)缺失值處理
2.1.2冗余去重
2.1.3數(shù)據(jù)去噪
2.1.4異常值處理
2.2數(shù)據(jù)集成
2.2.1實體識別
2.2.2冗余和相關性分析
2.3數(shù)據(jù)轉(zhuǎn)換與規(guī)范化
2.3.1離散化、標準化
2.3.2二值化、歸一化
2.3.3正則化
2.3.4特征編碼
2.4數(shù)據(jù)歸約
2.4.1子空間法
2.4.2粗糙集規(guī)約
2.4.3流形學習
2.5本章小結(jié)
第3章數(shù)據(jù)倉庫與數(shù)據(jù)立方體
3.1數(shù)據(jù)倉庫概述
3.1.1數(shù)據(jù)倉庫產(chǎn)生的背景
3.1.2數(shù)據(jù)倉庫的定義與特征
3.1.3數(shù)據(jù)倉庫與數(shù)據(jù)庫
3.2數(shù)據(jù)倉庫的系統(tǒng)架構(gòu)
3.2.1數(shù)據(jù)倉庫系統(tǒng)基本架構(gòu)
3.2.2數(shù)據(jù)倉庫系統(tǒng)分層的意義
3.2.3數(shù)據(jù)倉庫的分層結(jié)構(gòu)
3.3數(shù)據(jù)立方體
3.3.1數(shù)據(jù)立方體的基本概念
3.3.2數(shù)據(jù)立方體的組成元素
3.3.3多維數(shù)據(jù)模型的模式
3.4在線分析處理
3.4.1在線分析處理的基本概念
3.4.2在線分析處理的基本操作
3.4.3在線分析處理系統(tǒng)的實現(xiàn)
3.5本章小結(jié)
第4章關聯(lián)規(guī)則挖掘
4.1關聯(lián)規(guī)則挖掘的基本概念
4.2頻繁項集挖掘算法
4.2.1格結(jié)構(gòu)
4.2.2樸素法
4.2.3先驗算法
4.2.4頻繁模式增長算法
4.3關聯(lián)規(guī)則挖掘方法
4.3.1基于置信度的剪枝
4.3.2從關聯(lián)分析到相關性分析
4.4高級關聯(lián)規(guī)則挖掘
4.4.1多層模式挖掘
4.4.2非頻繁模式挖掘
4.5推薦系統(tǒng)中的關聯(lián)規(guī)則挖掘
4.5.1召回層的作用和意義
4.5.2基于內(nèi)容的召回層挖掘
4.5.3基于協(xié)同過濾的召回層挖掘
4.5.4排序?qū)拥淖饔煤鸵饬x
4.5.5排序?qū)拥耐诰蛩惴?br />4.5.6基于邏輯回歸的排序?qū)油诰?br />4.6本章小結(jié)
第5章分類與回歸預測
5.1分類算法
5.1.1分類的基本概念
5.1.2決策樹分類器
5.1.3貝葉斯分類法
5.1.4人工神經(jīng)網(wǎng)絡方法
5.1.5支持向量機
5.1.6文本分類算法
5.2回歸預測算法
5.2.1回歸分析的基本概念
5.2.2線性回歸
5.2.3非線性回歸
5.2.4邏輯回歸
5.3性能評估指標
5.3.1分類模型評估
5.3.2預測模型評估
5.4模型調(diào)優(yōu)
5.4.1組合方法
5.4.2類不平衡優(yōu)化
5.5本章小結(jié)
第6章聚類分析
6.1大數(shù)據(jù)聚類分析
6.2性能度量
6.2.1外部指標
6.2.2內(nèi)部指標
6.3距離計算
6.4聚類算法
6.4.1劃分聚類算法
6.4.2層次聚類算法
6.4.3密度聚類算法
6.4.4譜聚類算法
6.5大數(shù)據(jù)挖掘中的聚類拓展學習
6.6本章小結(jié)
第7章高級數(shù)據(jù)挖掘
7.1圖數(shù)據(jù)挖掘
7.1.1圖數(shù)據(jù)
7.1.2凝聚子圖挖掘
7.1.3圖模式挖掘
7.2時間序列數(shù)據(jù)挖掘
7.2.1時間序列數(shù)據(jù)介紹
7.2.2時間序列異常檢測
7.2.3時間序列的分類與聚類
7.3大數(shù)據(jù)與分布式數(shù)據(jù)挖掘
7.3.1分布式文件系統(tǒng)
7.3.2MapReduce大數(shù)據(jù)處理框架
7.3.3Spark大數(shù)據(jù)處理框架
7.4本章小結(jié)
第8章數(shù)據(jù)可視化與分析
8.1數(shù)據(jù)可視化的基本概念
8.1.1數(shù)據(jù)可視化的背景
8.1.2數(shù)據(jù)可視化的定義及基本步驟
8.1.3數(shù)據(jù)可視化的常用圖表類型
8.1.4數(shù)據(jù)可視化實例
8.2可視化工具與技術
8.2.1Python可視化常用類庫
8.2.2JavaScript可視化開發(fā)工具
8.2.3軟件類可視化工具
8.3本章小結(jié)
第9章數(shù)據(jù)挖掘案例分析
9.1自然語言智能挖掘
9.1.1文本挖掘
9.1.2語音數(shù)據(jù)挖掘
9.1.3文本-視覺多模態(tài)挖掘
9.2醫(yī)療大數(shù)據(jù)智能挖掘
9.2.1電子病歷數(shù)據(jù)挖掘
9.2.2醫(yī)學影像數(shù)據(jù)挖掘
9.3遙感圖像智能挖掘
9.3.1地理信息數(shù)據(jù)挖掘
9.3.2無人機遙感數(shù)據(jù)挖掘
9.3.3衛(wèi)星數(shù)據(jù)挖掘
9.4本章小結(jié)
參考文獻
- >
隨園食單
- >
上帝之肋:男人的真實旅程
- >
龍榆生:詞曲概論/大家小書
- >
【精裝繪本】畫給孩子的中國神話
- >
伊索寓言-世界文學名著典藏-全譯本
- >
月亮虎
- >
二體千字文
- >
山海經(jīng)