powerCenter开发流程



powerCenter开发流程。

Informatica是基于元数据驱动的,所有的元数据都保存在Repository(知识库)中,该知识库可以创建在所有主流数据库当中,充分体现了它元数据的开放性。

Repository Server用来管理所有客户端以及Informatica Server跟Repository的交互, 并且一个Repository Server可以管理多个Repository,而Repository Server可为每个Repository分配一个Repository Agent来处理所对有元数据操作的响应。

Informatica Server是实际处理ETL任务的后台服务,它是基于内存运行、高效的ETL服务,不需要产生任何的代码,每次执行任务之前都会从Repository中读取最新的ETL规则。

Informatica的客户端提供了无编码、完全图形化的设计和管理调度界面,可实现快速开发和部署。

一个基本的ETL任务设计和部署的大致步骤如下:

(1) 使用Designer客户端,获取源数据表的元数据。

(2) 使用Designer客户端,获取目标数据表的元数据。


(3) 使用Designer客户端,设计一个Mapping,其中就是源->目标的ETL规则。

 

(4) 使用Workflow Manager客户端,针对上面实现的Mapping,实例化为一个Session,为其指定实际的数据源、目标连接,以及其他属性。

(5) 使用Workflow Manager客户端,创建一个Workflow,其中包含上述的Session以及其他的Task,在Workflow中可实现复杂的流程控制。

(6) 运行上述Workflow,使用Workflow Monitor客户端,监测最终的任务运行结果。

ETL工具最近用的是Informatica PowerCenter 8.1.1。总体来说,Informaitca有四个开发管理组件,初学者可能不知道如何下手,所以关键先要了解PowerCenter的开发流程。