Informatida Powercenter權威指南 版權信息
- ISBN:9787121270451
- 條形碼:9787121270451 ; 978-7-121-27045-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
Informatida Powercenter權威指南 本書特色
在大數據時代,掌控數據首先需要掌握數據的處理能力。俗話說:“工欲善其事,必先利其器。”informatica powercenter作為業界廣泛使用的數據處理工具之一,被全球多數大型機構、組織認可并采用。__eol__本書全面地介紹了informatica powercenter的主要功能及高級特性。__eol__本書分為3個部分:**部分為基礎篇,包括第1~4章,系統介紹了powercenter的基礎組件和常用功能,并在其中穿插了大量實踐案例;第二部分為高級篇,包括第5~8章,系統介紹了powercenter并行、集群、性能調優和字符集管理等高級內容;第三部分為擴展篇,包括第9章,簡要介紹了cdc的相關知識,powercenter與sap、mpp、hadoop集成,以及非結構化和半結構化數據處理能力。__eol__
Informatida Powercenter權威指南 內容簡介
informatica大中國區專家力作,內容權威、可靠;
全面而系統地講解了informatica powercenter,并輔以大量案例以輔助讀者實踐;
提供與作者在線交流的機會(扣扣群:212017946)
Informatida Powercenter權威指南 目錄
第1章 powercenter hello world世界 1.1 informatica hello world 1.2 powercenter架構和客戶端簡介 1.2.1 powercenter架構 1.2.2 powercenter客戶端 1.3 powercenter hello world 第2章 powercenter基礎組件 2.1 source 2.1.1 數據庫源 2.1.2 文本文件源 2.2 target 2.2.1 數據庫目標 2.2.2 文本文件目標 2.3 expression表達式 expression中的變量端口(variable port) 2.4 filter 2.5 source qualifier 2.5.1 source qualifier的作用 2.5.2 數據庫數據源的source qualifier 2.5.3 source qualifier自定義sql 2.5.4 source qualifier復雜關聯 2.6 sorter 2.7 joiner 2.7.1 關聯類型 2.7.2 sorted joiner 2.7.3 joiner有什么獨特作用 2.7.4 自關聯(self-join) 2.8 lookup 2.8.1 lookup caching enabled 2.8.2 非連接的lookup 2.8.3 lookup sql override 2.8.4 共享lookup cache 2.8.5 dynamic lookup 2.8.6 lookup、source qualifier和joiner的對比 2.9 stored procedure 2.9.1 connected stored procedure 2.9.2 unconnected stored procedure 2.9.3 pre- or post-session stored procedure 2.10 union 2.11 transaction control 2.11.1 transaction control有效性問題 2.11.2 transaction control組件 2.12 sequence 2.12.1 sequence的常規用法 2.12.2 共享sequence 2.12.3 可重用的sequence 2.13 aggregator 2.13.1 條件聚合 2.13.2 使用aggregator進行行列轉換 2.14 rank 2.15 update strategy 2.15.1 treat source rows as屬性的使用 2.15.2 update strategy使用 2.15.3 如何實現update else insert 2.15.4 update stagety案例:緩慢變化維 2.16 sql transformation 2.16.1 script mode 2.16.2 static query mode 2.16.3 dynamic query mode 2.17 java transformation 2.17.1 java transformation簡介 2.17.2 passive java transformation 2.17.3 active java transformation 2.17.4 常見錯誤說明 2.18 normalizer 2.19 router 2.20 custom tranformation 2.21 http transformation 2.22 xml組件組 2.23 transformation中的一些概念 2.23.1 connect與unconnect 2.23.2 active與passive 第3章 workflow執行、監控 3.1 session 3.1.1 reusable session 3.1.2 非reusable session 3.2 *簡單、*常用的workflow 3.2.1 并行執行 3.2.2 串行執行 3.2.3 調度 3.3 worklet 3.4 command 3.5 control 3.6 發送e-mail 3.6.1 配置發送e-mail 3.6.2 workflow中使用e-mail 3.7 event tasks 3.7.1 用戶自定義事件使用 3.7.2 預定義事件使用 3.8 timer 3.9 decision 3.10 assignment 第4章 常用功能匯集 4.1 debugger 4.2 mapplet/reusable transformation 4.2.1 reusable transformation 4.2.2 mapplet 4.3 使用shortcut 4.3.1 local shortcut 4.3.2 global shortcut 4.4 session相關屬性 4.4.1 properties tab相關屬性 4.4.2 config object tab相關屬性 4.5 參數和變量 4.5.1 mapping參數 4.5.2 mapping變量 4.5.3 系統/session參數與變量 4.5.4 workflow/worklet變量 4.5.5 local 變量(local variables) 第5章 powercenter高級應用 5.1 任務分區(partition) 5.1.1 database partitioning 5.1.2 hash partitioning 5.1.3 key range partitioning 5.1.4 pass through partitioning 5.1.5 round-robin partitioning 5.2 內存管理 5.2.1 dtm內存 5.2.2 transformation cache 5.3 網格計算 5.3.1 grid架構 5.3.2 grid負載均衡 5.3.3 grid與任務分區(partition) 5.4 高可用性(ha) 5.4.1 powercenter自帶的ha方案 5.4.2 依托第三方廠商的ha方案 5.4.3 兩種ha方案對比 5.5 web service 應用 5.5.1 web service hub 5.5.2 web service調度/監控接口 5.5.3 web service provider 5.5.4 web service consumer 5.6 pushdown optimization 5.6.1 pushdown優化是什么 5.6.2 pushdown優化類型 5.7 版本控制及部署 5.7.1 check in/check out 5.7.2 team-based開發的一些有用功能 5.7.3 label與deployment group 5.7.4 復制對象從開發repository到生產repository 第6章 powercenter實戰匯總 6.1 powercenter字符集 6.1.1 oracle數據庫 6.1.2 db2字符集 6.1.3 as/400字符集 6.1.4 odbc字符集 6.1.5 文本文件字符集 6.1.6 repository service字符集 6.1.7 integration service字符集 6.1.8 data movement mode 6.2 unix odbc配置 6.2.1 odbc常規配置 6.2.2 my sql社區版odbc配置 6.3 使用mapping動態分發文件 6.4 超越edw,商品自動價格跟蹤 6.5 pmcmd命令 6.6 pmrep命令 6.7 infasetup命令 6.8 mapping architect for visio 6.9 mx view語句 6.10 powercenter與其他工具集成 第7章 性能調優 7.1 性能調優過……第8章 powercenter troubleshooting第9章 powercenter擴展能力
展開全部
Informatida Powercenter權威指南 相關資料
推薦序
猶豫了很久,以我現今的職位給作者寫序,是否有些自吹自擂?但讀完書稿,我決定了:一本好書,介紹一個好產品,既然與我受用,何不推薦給更多的人呢?
“it”是信息(information)和技術(technology)的縮寫,它的發展不過三十多年的時間。在it發展前期的大部分時間里,其所有進步大部分體現在“t”上,例如計算性能、存儲容量、網絡拓展及打印效果等。直到近些年“大數據時代”的出現,人們才開始了對于信息數據,也就是“i”的關注。我相信,這個變化是it發展的必然,是一個破繭成蝶的過程,并且這個關注也一定會延續很多年。
同樣,正是因為“大數據”日益深入人心,企業的it 規劃和發展越來越與“大數據”相關聯,powercenter才得以從一個it人員得心應手的工具,蛻變為大數據應用的一個重要環節。記得在2014年國務院工業和信息化部頒布的大數據白皮書中,就明確地將“數據準備”定義為大數據發展的第一個環節。由此,作為在數據集成領域里歷年排名第一的powercenter,也就承擔起了“幫助企業實現大數據應用的第一步”的重要使命。
本書前6章中規中矩,如同一本深入淺出的教科書,將具備一些基本it知識的人士引進數據遷移的奇妙世界,加上作者風趣的調侃,學來絲毫不覺得枯燥單調。第7章開始是實戰描述,實際上是一系列的應用經驗分享,這些寶貴的經驗之談,可以讓初學者在未來的實踐中少走彎路,還可以將本書作為可以隨時受教的參考書。更值得一提的是,不同于普通的產品手冊,本書作者以其十幾年的理論研究和教育培訓,以及主導或參與諸多中外企業“數據集成項目”實施的經驗,將powercenter的很多功能細節描述得淋漓盡致。本書對于有意進行etl教學的教育培訓機構,不失為一本經典的教材;而對于有意培養自己成為etl應用高手的it人士,則是一本有益而又有趣的讀物。
曾經有不少朋友問我:當成了etl的行家里手以后,下一個職業目標會有哪些發展方向?所以,我想借此序的一角,分享一些我的認知,供大家參考。
第一,云數據集成和管理。根據idc的預測,2017年全球saas和云軟件模式將占軟件開支的1/6。越來越多的云應用系統承諾并交付更簡單、更快捷和更智能的業務營運方法,所以,掌握云數據集成,會讓你在不可阻擋的云服務趨勢下游刃有余。
第二,下一代數據洞察。不同于第一代商業智能(bi)對展示形態和分析過去的重視,大數據時代的數據洞察,更加關注數據的質量而不是數據的展現形式,更重視預測未來的行為模式而非過去的行為分析。所以,要想成為大數據分析專家,你必須懂得數據質量管理和前瞻性的分析。當然,保障分析結果正確的前提是確保數據的統一性、完整性,并找到數據的關聯性。
第三,數據治理。大數據時代,越來越多的企業將數據納入其固定資產;在金融和醫療行業,數據相關的合規性成為政府監管的重要指標;為了應對客戶需求和市場業務模式的變化,許多企業開始考慮應用整合和遷移……這些巨大的變化,不斷催生出數據治理的高手,他們必須在行業規范、企業應用系統、數據的關聯性和安全性方面具備獨特的技能。因此,了解行業特性、行業應用,使之與數據集成相結合,便成為你進行數據治理的更高境界。
近年來,關于大數據的定義一直在調整,而大數據應用的目標卻始終沒變,那就是:發現數據價值,幫助企業降低成本并實現業務創新。在過去短短的兩三年里,中國作為自然的大數據國家,已經在大數據的理論研究和實際應用方面取得了巨大的進展。大數據的應用會推動各行各業誕生越來越多的數據科學家,那是行業知識和數據治理兼備的卓越人才。it的發展已經實現了由“計算機科學”向“數據科學”的轉換,近年來,“數據科學”又開始向行業應用進行大規模遷移。所以,數據科學家既是數據價值的挖掘者,更是行業產品和流程的創新者,他們的價值不是向企業的高管提供分析報表,他們本身就是企業的高管,他們在用數據作為依據,實現企業面向客戶、市場、產品和流程方面的創新。
千里之行,始于足下。與各位讀者共勉。
informatica大中國區總經理王晨杰
Informatida Powercenter權威指南 作者簡介
杜紹森,任Informatica大中國區資深顧問。從PowerMart 5開始使用Informatica產品,自PowerCenter 8.1.1版本發布就一直任職于Informatica公司,服務于Informatica近10年時間,幫助Informatica用戶設計和構建系統,或者對系統進行重構和調優。之前曾作為系統架構師、項目經理等服務于惠普及本地公司,從事電信行業計費及數據倉庫項目。