-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據倉庫與數據挖掘技術 版權信息
- ISBN:9787302281665
- 條形碼:9787302281665 ; 978-7-302-28166-5
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據倉庫與數據挖掘技術 本書特色
《數據倉庫與數據挖掘技術》特色: 《數據倉庫與數據挖掘技術》對數據倉庫概念及其技術的介紹,在于突出數據倉庫進行決策支持的本質。該書內容組織的思路為:數據倉庫基本概念、數據倉庫技術、數據倉庫開發構建案例、實際應用。 在內容介紹上力求深入淺出,通俗易懂。具有結構清晰,內容簡明,方便實用的特點。 既重視理論知識的講解,又強調應用技能的培養,使用了大量的案例,備案例均使用Microsoft SQLServer 2005圖示及實例進行實際操作,通過實例來解釋數據倉庫與數據挖掘技術的原理,使該書有較強的可讀性,便于讀者學習和掌握,適于作為本科生教材使用。
數據倉庫與數據挖掘技術 內容簡介
《數據倉庫與數據挖掘技術》主要介紹數據倉庫和數據挖掘技術的基本概念、相關技術和應用案例及方法。全書共分為9章,主要內容包括:數據倉庫與數據挖掘的概念和體系結構、數據倉庫開發模型、ETL技術、OLAP技術、商務智能系統、數據預處理技術、數據挖掘技術、數據倉庫開發實例、報表設計等內容。該書各章節的案例均使用Microsoft SQL Server 2005進行操作實踐講解。通過對具體實例的學習和實踐,使讀者掌握數據倉庫和數據挖掘中必要的知識點,達到學以致用的目的。 《數據倉庫與數據挖掘技術》適合作為高等院校本科學生的教材,也可供企業信息化管理人員、技術人員以及軟件開發人員閱讀參考。
數據倉庫與數據挖掘技術 目錄
第1章 數據倉庫與數據挖掘概述1
1.1 數據倉庫的產生與發展1
1.1.1 數據倉庫的產生1
1.1.2 數據倉庫的發展2
1.1.3 數據倉庫的研究與開發現狀2
1.1.4 數據倉庫的作用4
1.2 數據倉庫的基本概念4
1.2.1 數據倉庫的定義與基本特性5
1.2.2 數據倉庫與數據庫的區別6
1.2.3 數據倉庫數據的組織架構7
1.3 數據倉庫的體系結構8
1.3.1 虛擬的數據倉庫體系結構9
1.3.2 單獨的數據倉庫體系結構9
1.3.3 單獨的數據集市體系結構10
1.3.4 分布式數據倉庫結構10
1.4 數據倉庫的相關概念11
1.4.1 數據源11
1.4.2 數據的存儲層12
1.4.3 OLAP服務器14
1.4.4 前端工具14
1.5 數據挖掘技術概述15
1.5.1 數據挖掘技術產生的背景15
1.5.2 數據挖掘的基本概念16
1.5.3 數據挖掘的對象17
1.5.4 數據挖掘功能18
1.5.5 數據挖掘與傳統分析方法的區別21
1.5.6 數據倉庫與數據挖掘的關系21
1.5.7 數據挖掘的發展趨勢22
1.6 數據挖掘過程23
1.6.1 Fayyad過程模型23
1.6.2 CRISP-DM過程模型25
1.6.3 其他數據挖掘過程模型26
1.7 常用的數據挖掘技術27
1.8 小結29
1.9 習題29
第2章 數據倉庫開發模型31
2.1 數據倉庫開發模型概述31
2.2 數據倉庫的概念模型32
2.2.1 企業模型的建立32
2.2.2 規范的數據模型34
2.2.3 常見的概念模型38
2.3 數據倉庫的邏輯模型42
2.3.1 事實表模型設計43
2.3.2 維度表模型設計44
2.4 數據倉庫的物理模型46
2.4.1 物理模型的設計要點46
2.4.2 數據倉庫物理模型的存儲結構47
2.4.3 數據倉庫物理模型的索引構建49
2.4.4 數據倉庫物理模型的優化問題49
2.5 數據倉庫的元數據模型51
2.5.1 元數據的類型51
2.5.2 元數據的作用53
2.5.3 元數據的收集與維護54
2.5.4 元數據的使用57
2.5.5 元數據管理模型57
2.6 數據倉庫的粒度和聚集模型59
2.6.1 數據倉庫粒度模型59
2.6.2 數據倉庫聚集模型與數據分割60
2.7 小結61
2.8 習題61
第3章 ETL技術63
3.1 ETL相關概念64
3.1.1 數據理解64
3.1.2 數據抽取64
3.1.3 數據清洗65
3.1.4 數據轉換65
3.1.5 數據加載66
3.2 ETL過程建模66
3.2.1 ETL系統面臨的挑戰66
3.2.2 ETL過程描述67
3.2.3 ETL概念模型67
3.2.4 ETL邏輯模型68
3.3 ETL增量抽取機制69
3.4 ETL過程數據質量控制71
3.4.1 數據質量問題分類71
3.4.2 數據質量控制技術72
3.5 ETL并行處理技術74
3.6 小結76
3.7 習題76
第4章 OLAP技術78
4.1 OLAP概述78
4.1.1 OLAP的定義78
4.1.2 數據倉庫與數據分析的關系79
4.1.3 多維分析的基本概念80
4.1.4 OLAP的多維數據分析83
4.1.5 OLAP與OLTP的比較85
4.2 多維數據庫及其存儲86
4.2.1 多維數據庫86
4.2.2 多維數據庫的數據存儲88
4.2.3 多維數據庫與數據倉庫88
4.3 OLAP的類型89
4.3.1 多維OLAP90
4.3.2 關系OLAP91
4.3.3 混合型OLAP96
4.3.4 MOLAP與ROLAP的比較96
4.4 OLAP的體系結構97
4.5 OLAP中的索引技術98
4.5.1 B-Tree索引98
4.5.2 位圖索引99
4.5.3 位圖索引的擴展--標識符索引102
4.5.4 索引性能比較103
4.5.5 索引的選擇104
4.6 OLAP的評價標準104
4.6.1 OLAP的衡量標準104
4.6.2 OLAP服務器和工具的評價標準106
4.7 OLAP的前端展現108
4.7.1 OLAP工具108
4.7.2 OLAP結果的展現方法109
4.8 小結111
4.9 習題111
第5章 商務智能系統113
5.1 商務智能概述113
5.1.1 商務智能的概念113
5.1.2 商務智能的發展歷程114
5.1.3 商務智能的商業效益114
5.2 商務智能系統架構115
5.2.1 商務智能系統的核心技術115
5.2.1 商務智能的體系結構116
5.3 商務智能系統的功能117
5.4 商務智能系統的應用118
5.4.1 商務智能系統特點118
5.4.2 我國商務智能系統應用現狀分析118
5.5 小結119
5.6 習題120
第6章 數據預處理技術121
6.1 數據預處理概述121
6.1.1 數據預處理的必要性121
6.1.2 數據預處理的基本方法122
6.1.3 數據預處理的研究現狀124
6.2 數據清理124
6.2.1 填充缺失值125
6.2.2 光滑噪聲數據125
6.2.3 數據清理過程126
6.3 數據集成127
6.4 數據變換128
6.5 數據歸約130
6.5.1 數據立方體聚集130
6.5.2 屬性子集選擇130
6.5.3 維度歸約131
6.5.4 數值歸約132
6.5.5 數據離散化與概念分層134
6.6 小結136
6.7 習題136
第7章 數據挖掘技術138
7.1 概念描述138
7.1.1 概念描述的生成過程138
7.1.2 概念分層與數據泛化139
7.1.3 概念分層方法139
7.1.4 數據泛化方法142
7.1.5 泛化的表示145
7.1.6 屬性相關分析146
7.1.7 區別性描述146
7.2 關聯規則147
7.2.1 關聯規則相關概念147
7.2.2 關聯規則挖掘步驟148
7.2.3 關聯規則分類149
7.2.4 關聯規則的算法150
7.3 數據分類156
7.3.1 數據分類的基本步驟與評價準則156
7.3.2 決策樹158
7.3.3 貝葉斯分類164
7.3.4 神經網絡方法165
7.3.5 近鄰分類方法171
7.4 數據聚類173
7.4.1 聚類分析概述173
7.4.2 聚類算法的分類及其典型算法174
7.4.3 聚類分析中的相似度度量方法176
7.4.4 聚類分析中的聚類準則函數177
7.4.5 k-means聚類算法178
7.5 遺傳算法181
7.5.1 遺傳算法的基本術語181
7.5.2 遺傳算法的執行過程182
7.5.3 遺傳算法應用舉例184
7.5.4 遺傳算法的基本要素185
7.5.5 遺傳算法的特點及應用領域188
7.6 粗糙集190
7.6.1 粗糙集理論的相關概念190
7.6.2 粗糙集的應用舉例191
7.6.3 粗糙集理論研究的對象及特點192
7.7 小結193
7.8 習題194
第8章 數據倉庫開發實例196
8.1 SQL Server 2005所提供的數據倉庫功能196
8.1.1 SQL Server 2005 Integration Services197
8.1.2 SQL Server 2005 Analysis Services197
8.1.3 SQL Server 2005 DW工具197
8.2 福馬特商店銷售分析數據倉庫系統的分析與設計198
8.3 數據倉庫的實現199
8.3.1 SQL Server的數據倉庫創建199
8.3.2 OLAP的實施204
8.3.3 數據倉庫中的數據挖掘209
8.4 數據倉庫的應用與管理213
8.4.1 數據倉庫的用戶213
8.4.2 數據倉庫應用案例213
8.4.3 數據倉庫的運行技術管理224
8.4.4 數據倉庫應用中的法律問題227
8.4.5 數據倉庫的成本與效益分析227
8.5 小結228
8.6 習題228
第9章 報表設計230
9.1 報表概述230
9.1.1 報表結構230
9.1.2 傳遞報表232
9.1.3 Report Server功能結構233
9.1.4 Report Services的組成部分234
9.2 報表向導制作報表236
9.2.1 向導制作報表237
9.2.2 報表設計器246
9.2.3 部署報表247
9.3 編輯制作報表248
9.3.1 新建報表項目248
9.3.2 新建數據集248
9.3.3 報表格式設計250
9.3.4 分組251
9.3.5 鉆取功能254
9.3.6 文檔結構圖254
9.4 矩陣式報表255
9.4.1 數據集建立256
9.4.2 矩陣布局257
9.4.3 矩形布局258
9.4.4 折疊結構259
9.5 統計圖表260
9.5.1 圖表元素260
9.5.2 柱形圖260
9.5.3 折線圖266
9.5.4 餅圖270
9.5.5 圓環圖270
9.6 主體的多列271
9.7 小結272
9.8 實驗272
參考文獻273
- >
姑媽的寶刀
- >
有舍有得是人生
- >
回憶愛瑪儂
- >
我與地壇
- >
伊索寓言-世界文學名著典藏-全譯本
- >
伯納黛特,你要去哪(2021新版)
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
【精裝繪本】畫給孩子的中國神話