數據倉庫(原書第4版) 版權信息
- ISBN:9787111191940
- 條形碼:9787111191940 ; 978-7-111-19194-0
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據倉庫(原書第4版) 本書特色
數據倉庫為企業和組織提供了收集、存儲和分析海量業務數據的必要策略!稊祿䝼}庫(原書第4版)》被譽為數據倉庫的“圣經”,第4版涵蓋了數據倉庫新技術,保持了在這一領域的先鋒地位,詳盡地講述了數據倉庫的基本概念、基本原理,以及建立數據倉庫的方法和過程。內容主要包括:決策支持系統的發展、數據倉庫環境結構、數據倉庫設計、數據倉庫粒度劃分、數據倉庫技術、分布式數據倉庫、EIS系統和數據倉庫的關系、外部和非結構化數據與數據倉庫的關系、數據裝載問題、數據倉庫與Web、ERP與數據倉庫以及數據倉庫的復查要目等。《數據倉庫(原書第4版)》適合開發人員、管理人員、設計人員、數據管理員、數據庫管理員,以及其他在現代數據處理環境中進行系統建造的人員閱讀。另外,本書也很適用于學習信息處理技術的學生。
數據倉庫(原書第4版) 內容簡介
《數據倉庫(原書第4版)》詳盡地講述了數據倉庫的基本概念、基本原理,以及建立數據倉庫的方法和過程。主要內容包括:決策支持系統的發展、數據倉庫環境結構、數據倉庫設計、數據倉庫粒度劃分、數據倉庫技術、分布式數據倉庫、EIS系統和數據倉庫的關系、外部和非結構化數據與數據倉庫的關系、數據裝載問題、數據倉庫與Web、ERP與數據倉庫以及數據倉庫的復查要目。
《數據倉庫(原書第4版)》是數據倉庫的創始人撰寫的關于數據倉庫的著作,這個新版本收錄了該領域的經典理論和前沿發展。本書既可以作為相關專業的研究生教材,也是數據倉庫的研究、開發和管理人員的**指南。
數據倉庫(原書第4版) 目錄
專家指導委員會
譯者序
第2版前言
第3版前言
第4版前言
第1章 決策支持系統的發展
1.1 演化
1.1.1 直接存取存儲設備的出現
1.1.2 個人計算機/第四代編程語言技術
1.1.3 進入抽取程序
1.1.4 蜘蛛網
1.2.自然演化式體系結構的問題
1.2.1 數據缺乏可信性
1.2.2 生產率問題
1.2.3 從數據到信息
1.2.4 方法的變遷
1.2.5 體系結構化環境
1.2.6 體系結構化環境中的數據集成
1.2.7 用戶是誰
1.3 開發生命周期
1.4 硬件利用模式
1.5 為重建工程創造條件
1.6 監控數據倉庫環境
1.7 小結
第2章 數據倉庫環境
2.1 數據倉庫的結構
2.2 面向主題
2.3 第1天到第n天的現象
2.4 粒度
2.4.1 粒度帶來的好處
2.4.2 粒度的一個例子
2.4.3 雙重粒度
2.5 探查與數據挖掘
2.6 活樣本數據庫
2.7 分區設計方法
2.8 數據倉庫中的數據組織
2.9 審計與數據倉庫
2.10 數據的同構/異構
2.11 數據倉庫中的數據清理
2.12 報表與體系結構化環境
2.13 各種環境中的操作型窗口
2.14 數據倉庫中的錯誤數據
2.15 小結
第3章 設計數據倉庫
3.1 從操作型數據開始
3.2 數據/過程模型與體系結構化環境
3.3 數據倉庫與數據模型
3.3.1 數據倉庫的數據模型
3.3.2 中間層數據模型
3.3.3 物理數據模型
3.4 數據模型與迭代式開發
3.5 規范化/反向規范化
3.6 元數據
3.7 數據周期——時間間隔
3.8 轉換和集成的復雜性
3.9 數據倉庫記錄的觸發
3.9.1 事件
3.9.2 快照的構成
3.9.3 一些例子
3.10 概要記錄
3.11 管理大量數據
3.12 創建多個概要記錄
3.13 從數據倉庫環境到操作型環境
3.14 數據倉庫數據的直接操作型訪問
3.15 數據倉庫數據的間接訪問
3.15.1 航空公司的傭金計算系統
3.15.2 零售個性化系統
3.15.3 信用審核
3.16 數據倉庫數據的間接使用
3.17 星形連接
3.18 支持操作型數據存儲
3.19 需求和Zachman框架
3.20 小結
第4章 數據倉庫中的粒度
4.1 粗略估算
4.2 規劃過程的輸入
4.3 溢出存儲器中的數據
4.4 確定粒度級別
4.5 一些反饋循環技巧
4.6 確定粒度級別的幾個例子
4.6.1 銀行環境中的粒度級別
4.6.2 制造業環境中的粒度級別
4.6.3 保險業環境中的粒度級別
4.7 填充數據集市
4.8 小結
第5章 數據倉庫和技術
5.1 管理大量數據
5.2 管理多種介質
5.3 索引和監控數據
5.4 多種技術的接口
5.5 程序員/設計者對數據存放位置的控制
5.6 數據的并行存儲和管理
5.7 語言接口
5.8 數據的有效裝載
5.9 有效利用索引
5.10 數據壓縮
5.11 復合主鍵
5.12 變長數據
5.13 加鎖管理
5.14 只涉及索引的處理
5.15 快速恢復
5.16 其他的技術特征
5.17 DBMS類型和數據倉庫
5.18 改變DBMS技術
5.19 多維DBMS和數據倉庫
5.20 在多種存儲介質上構建數據倉庫
5.21 數據倉庫環境中元數據的角色
5.22 上下文和內容
5.22.1 上下文信息的三種類型
5.22.2 捕獲和管理上下文信息
5.22.3 回顧上下文信息管理歷史
5.23 刷新數據倉庫
5.24 測試問題
5.25 小結
第6章 分布式數據倉庫
6.1 分布式數據倉庫的類型
6.1.1 局部數據倉庫和全局數據倉庫
6.1.2 技術分布式數據倉庫
6.1.3 獨立開發的分布式數據倉庫
6.2 開發項目的本質特征
6.3 分布式數據倉庫的開發
6.3.1 在分布的地理位置間協調開發
6.3.2 企業數據的分布式模型
6.3.3 分布式數據倉庫中的元數據
6.4 在多種層次上構建數據倉庫
6.5 多個小組建立當前細節級
6.5.1 不同層的不同需求
6.5.2 其他類型的細節數據
6.5.3 元數據
6.6 公共細節數據采用多種平臺
6.7 小結
第7章 主管信息系統和數據倉庫
7.1 EIS概述
7.2 一個簡單例子
7.3 向下鉆取分析
7.4 支持向下鉆取處理
7.5 作為EIS基礎的數據倉庫
7.6 到哪里取數據
7.7 事件映射
7.8 細節數據和EIS
7.9 在EIS扣只保存匯總數據
7.10 小結
第8章 外部數據與數據倉庫
8.1 數據倉庫中的外部數據
8.2 元數據和外部數據
8.3 存儲外部數據
8.4 外部數據的不同部件
8.5 建模與外部數據
8.6 輔助報告
8.7 外部數據存檔
8.8 內部數據與外部數據的比較
8.9 小結
第9章 遷移到體系結構化環境
9.1 一種遷移方案
9.2 反饋循環
9.3 策略方面的考慮
9.4 方法和遷移
9.5 數據驅動的開發方法
9.5.1 概念
9.5.2 系統開發生命周期
9.5.3 智者觀點
9.6 小結
第10章 數據倉庫和Web
10.1 支持電子商務環境
10.2 將數據從Web移動到數據倉庫
10.3 將數據從數據倉庫移動到Web
10.4 對Web的支持
10.5 小結
第11章 非結構化數據和數據倉庫
11.1 兩個領域的集成
11.1.1 文本——公共聯接
11.1.2 基本錯誤匹配
11.1.3 環境間文本匹配
11.1.4 概率匹配
11.1.5 匹配所有信息
11.2 主題匹配
11.2.1 產業特征主題
11.2.2 自然事件主題
11.2.3 通過主題和主題詞關聯
11.2.4 通過抽象和元數據關聯
11.3 兩層數據倉庫
11.3.1 非結構化數據倉庫分類
11.3.2 非結構化數據倉庫中的文檔
11.3.3 非結構化數據可視化
11.4 自組織圖(SOM)
11.4.1 非結構化數據倉庫
11.4.2 數據量和非結構化數據倉庫
11.5 適用于兩個環境
11.6 小結
第12章 大型數據倉庫
12.1 快速增長的原因
12.2 龐大數據量的影響
12.2.1 基本數據管理活動
12.2.2 存儲費用
12.2.3 實際存儲費用
12.2.4 大型數據量中的數據使用模式
12.2.5 一個簡單計算
12.2.6 兩類數據
12.2.7 數據分類涉及的問題
12.3 數據在不同介質的存儲
12.3.1 近線存儲
12.3.2 訪問速度和磁盤存儲
12.3.3 存檔存儲
12.3.4 透明的意義
12.4 環境間數據轉移
12.4.1 CMSM方法
12.4.2 數據倉庫使用監控器
12.4.3 不同存儲介質下數據倉庫的擴展
12.5 數據倉庫轉換
12.6 總費用
12.7 *大容量
12.8 小結
第13章 關系模型和多維模型數據庫設計基礎
13.1 關系模型
13.2 多維模型
13.3 雪花結構
13.4 兩種模型的區別
13.4.1 區別的起源
13.4.2 重建關系型數據
13.4.3 數據的直接訪問和間接訪問
13.4.4 支持將來未知的需求
13.4.5 支持適度變化的需求
13.5 獨立數據集市
13.6 建立獨立數據集市
13.7 小結
第14章 數據倉庫高級話題
14.1 *終用戶的需求和數據倉庫
14.1.1 數據倉庫和數據模型
14.1.2 關系型的基礎
14.1.3 數據倉庫和統計處理
14.2 數據倉庫內的資源競爭
14.2.1 探查型數據倉庫
14.2.2 數據挖掘型數據倉庫
14.2.3 凍結探查型數據倉庫
14.2.4 外部數據和探查型數據倉庫
14.3 同一個處理器處理數據集市和數據倉庫
14.4 數據的生命周期
14.5 測試和數據倉庫
14.6 追蹤數據倉庫中的數據流
14.6.1 數據倉庫中的數據速率
14.6.2 “推”和“拉”數據
14.7 數據倉庫和基于網絡的電子商務環境
14.7.1 兩種環境之間的界面
14.7.2 粒度管理器
14.7.3 概要記錄
14.7.4 ODS,概要記錄以及性能
14.8 財務數據倉庫
14.9 記錄系統
14.10 結構體系的概要歷史——演化為公司信息工廠
14.10.1 CIF的進化
14.10.2 障礙
14.11 CIF的未來
14.11.1 分析
14.11.2 ERP/SAP
14.11.3 非結構化數據
14.11.4 數據量
14.12 小結
第15章 數據倉庫的成本論證和投資回報
15.1 應對競爭
15.2 宏觀上的成本論證
15.3 微觀上的成本論證
15.4 來自遺留環境的信息
15.4.1 新信息的成本
15.4.2 用數據倉庫收集信息
15.4.3 成本比較
15.4.4 建立數據倉庫
15.4.5 完整的情況圖
15.4.6 得到數據的障礙
15.5 數據的時間價值
15.6 集成的信息
15.6.1 歷史數據的價值
15.6.2 歷史數據和客戶關系模型
15.1 小結
第16章 數據倉庫和ODS
16.1 互補的結構
16.1.1 ODS中的升級
16.1.2 歷史數據與ODS
16.1.3 概要記錄
16.2 不同種類的ODS
16.3 數據庫設計——一種混合的方式
16.4 按比例畫圖
16.5 ODS中的事務集成
16.6 對ODS處理日進行分片
16.7 多個ODS
16.8 ODS和網絡環境
16.9 ODS的一個例子
16.10 小結
第17章 企業信息依從準則和數據倉庫.
17.1 兩個基本行為
17.2 財務依從準則
17.2.1 “是什么”
17.2.2 “為什么”
17.3 審計公司的交流信息
17.4 小結
第18章 *終用戶社區
18.1 農民
18.2 探險者
18.3 礦工
18.4 旅行者
18.5 整個社區
18.6 不同的數據類型
18.7 成本論證和ROI分析
18.8 小結
第19章 數據倉庫設計的復查要目
19.1 何時進行設計復查
19.2 誰負責設計復查
19.3 有哪些議事日程
19.4 結果
19.5 復查管理
19.6 典型的數據倉庫設計復查
19.7 小結
術語表
參考文獻
展開全部
數據倉庫(原書第4版) 作者簡介
王志海博士,特聘教授。1985年畢業于鄭州大學計算機科學系,獲理學學士學位,1987年畢業于哈爾濱船舶工程學院計算機與信息科學系,獲工學碩士學位,1998年畢業于合肥工業大學計算機與信息學院,獲博士學位。先后在澳大利亞Monash大學計算機科學與軟件工程學院進行博士后研究工作,Deakin大學信息技術學院任研究員,Monash大學計算機科學與軟件工程學院任高級研究員。曾任中國計算機學會人工智能與模式識別專業委員會委員,中國人工智能學會機器學習委員會委員,2003年國際軟件工程大會數據挖掘技術在軟件工程中應用研討會(:DMSE'2003,uSA)等程序委員會委員,2004~2007年歷屆亞太數據庫知識發現與數據挖掘會議(PAKDD)程序委員會委員,2005年中國分類技術及其應用研討會程序委員會委員等。在國際學術刊物,國際學術會議和國內學術刊物上發表論文約30多篇。