1. February 15
2012
ODI
Tutorial
Uso da ferramenta Oracle Data Integrator (ODI) para a
construção de processos ETL (Extract, Transform and Load).
Glossário e
Nesta série de tutoriais, utilizaremos o ODI para integrar Termos
dados de diferentes origens (bancos de dados diferentes e
arquivos texto) para uma base de destino Oracle. Técnicos
2. Glossário e Termos Técnicos
Terminologia mais utilizada em projetos de Oracle Data Integrator.
Action Action são modelos para comandos de Data Definition
Language (DDL)
Agent Componentes de software Java, que permitem trabalhos
ODI para ser executado em uma máquina remota
Common Format Designer Common Format Designer (CFM) é usado para
rapidamente desenvolver um modelo de dados a partir da
interface de usuário do Designer.
Connection Connection ODI é como se conecta a um servidor de
dados. Exige (na maioria dos casos) um nome de
usuário (login) e uma senha. A ligação pode ser gerida
através de um diretório LDAP. A única conexão
permite o acesso a vários esquemas armazenados no
servidor de dados mesmo.
Context Um contexto é um conjunto de recursos que permitam o
funcionamento ou a simulação de uma ou mais
aplicações de processamento de dados .
Data Server Um servidor de dados é um recurso de processamento de
dados que armazena e reproduz dados na forma
de tabelas. Pode ser um banco de dados, uma MOM, um
conector ou um servidor de arquivos.
Data Type Categoria ou a natureza dos dados. As tecnologias de
cada um deles um tipo que define a sua natureza.
Datastore Um armazenamento de dados é uma estrutura que
permite que dados sejam armazenados. Pode ser uma
tabela, um arquivo, uma fila de mensagens ou qualquer
outra estrutura de dados acessíveis por middleware
compatível com ODI (JDBC / ODBC, JMS ou JNDI).
Diagram Um diagrama é uma visão gráfica de um subconjunto de
armazenamentos de dados contidos em um submodelo
(ou modelo de dados).
Driver Componente de software fornecido como um conjunto de
classes Java, permitindo o acesso a dados externos.
Flow ODI Entity permitindo um armazenamento de dados para
carga de fonte diversos Datastore.
Folder Uma pasta é um grupo de pacotes, interfaces e
procedimentos específicos. Pastas e sub-pastas permitir
que esses objetos sejam agrupados e organizados de
acordo com critérios específicos. Sub-pastas podem ser
criadas para um número ilimitado de níveis.
Graphical Synonym Um sinônimo é uma representação gráfica de um
armazenamento de dados. Sinônimos gráficos são
utilizados para tornar o diagrama mais legível. Em um
diagrama, um armazenamento de dados pode
aparecer várias vezes como um sinônimo gráfica.
Integrity Constraints Regra que define os limites de validade da informação. As
3. restrições de integridade são anexados ao datastores.
Existem vários tipos de restrições: Referências, chaves
primárias, chaves alternativas, o ODI Controls.
Interface Uma interface consiste de um conjunto de regras que
definem o carregamento de um armazenamento de
dados ou de uma estrutura temporária alvo de um ou
mais armazenamentos de dados de origem. O módulo
Designer permite que as interfaces sejam definidas e
testadas.
Interface IN Essas interfaces de integração geradas são usadas para
carregar datastores do modelo montado a partir de
outros armazenamentos de dados / colunas. Eles estão no
processo de integração de dados a partir da fusão
datastores original no datastores composto.
Interface OUT Essas interfaces de integração são utilizados para extrair
dados de armazenamentos de dados do modelo.
Eles são gerados usando as interfaces (incluindo as
interfaces IN) já armazenamento de dados de carga do
modelo. Eles revertem o processo de integração para
propagar os dados do armazenamento de dados
composta para o datastores original.
JDBC JDBC (Java Database Connectivity) um padrão API Java
que dá acesso aos dados contidos em um RDBMS.
Ela exige a instalação de um driver JDBC, se este não é
fornecido com o ODI.
JMS Java Message Service uma API Java padrão criado pela
Sun Microsystems para prover acesso à MOM.
JVM Java Virtual Machine
LDAP "Lightweight Directory Access Protocol" é um protocolo de
acesso de um directório de recursos corporativos.
Estes recursos são organizados em hierarquias e
representar os funcionários, departamentos, máquinas,
bancos de dados locais. O acesso a um diretório LDAP é
assegurada por nomes de usuário e senhas.
Meta-data Conjunto de dados que descrevem outros dados. É uma
descrição da estrutura das tabelas e colunas em um
banco de dados contidos em um servidor de dados.
Utilizado também para representar as dimensões no caso
de bancos de dados multi-dimensional.
Middleware Componente de software que permite a comunicação
entre dois programas no modo cliente / servidor. Esse
tipo de software é geralmente baseado em um padrão
(JDBC, ODBC, JMS), ligado ao tipo do servidor de
tecnologia.
Model Data Physical Model. Seria o dicionário de dados físico
utilizado pelo ODI.
Module Software fornecido pelo ODI para conectar os repositórios
e fornecendo um conjunto de características úteis
para um grupo de pessoas. Exemplo: Designer, agente,
Security Manager.
MOM Message Oriented MiddleWare: Ferramentas de eventos
que permitam o transporte de informações em um
4. formato estruturado (texto, XML, objetos) ou não à
distância entre sistemas heterogêneos. Conjunto de
informações gerenciadas por uma MOM são filas e tópicos.
ODBC ODBC (Open Database Connectivity) é uma API que dá
acesso aos dados contidos em um RDBMS. Ela exige
a instalação de um driver ODBC, específico para o RDBMS
acessado e o sistema operacional do cliente.
Package Um pacote é um conjunto de postos de trabalho
seqüenciado, também chamado de etapas, projetado para
ser executado em uma ordem pré-definida.
Physical Schema The physical schema é uma decomposição do servidor de
dados, permitindo o armazenamento e recuperação de
informações, tais como tabelas, imagens, etc.
Pooling Ação que consiste em interrogar repetidamente um
aplicativo para recuperar os novos eventos.
Project Um projeto é um grupo de objetos desenvolvidos usando
o ODI.
Queue Conjunto de informações gerenciadas por uma MOM
permitindo a publicação de um tipo de evento por uma
aplicação e consumo deste mesmo evento. A fila é
utilizada para comunicação ponto a ponto
assíncrono entre as aplicações.
RDBMS Relational Data Base Management System. É um
servidor de dados como Oracle, Sybase, DB2, etc...
Reference Ligação funcional entre dois datastores.
Repository Repositório contém todas as informações necessárias para
o desenvolvimento de interfaces e operacional. O
repositório é armazenado em um banco de dados
acessível por vários usuários simultaneamente.
Reverse A engenharia reversa consiste em recuperar os meta-
dados de um servidor de repositório de dados para
armazená-las no repositório do ODI.
Sequence Uma sequence é uma variável numérica que é
incrementada cada vez que ela é usada. Muito
utilizada para gerar números sequências de chaves
em tabelas.
Session Uma sessão é uma execução (de um cenário, uma
interface, um pacote ou um procedimento, etc ..)
realizados por um agente de execução ODI. Uma sessão é
composta de etapas, que são constituídos por tarefas.
Solution A solução é um conjunto abrangente e consistente de
versões de objetos interdependentes ODI. Ela pode ser
verificada, em um determinado momento e em uma
versão que pode ser restaurada em data posterior. As
soluções são salvos em ODI Master Repository. A solução
reúne um grupo de versões chamados elementos da
solução.
Sub-model Um sub-model é um grupo de datastores funcionalmente
homogêneas dentro de um modelo.
Technology Na terminologia do ODI, representa um tipo de tecnologia
acessível por JDBC, ODBC, JMS, JNDI, JCA ou qualquer
5. outro sistema operacional.
Topic Conjunto de informações gerenciadas por uma MOM
permitindo a comunicação através do método “publicar e
assinar”. Um aplicativo que deseja consumir um tipo de
evento devem inscrever-se neste tipo de evento. Cada
evento é consumido por todos os inscritos para o tipo de
evento.
URL “Uniform Resource Locator”. Sintaxe de elemento que
permite localizar um recurso acessível pelo TCP/IP. Cada
URL começa com o nome do protocolo utilizado, o mais
comum é “http”.
Version A versão é uma cópia de backup de um objeto ODI. É
verificado em um determinado momento e podem ser
restaurados depois. As versões são salvas no ODI Master
Repository.
Virtual Machine Ambiente que permita a compilação e execução de
programas JAVA. Todos os componentes do ODI requer
uma JVM para executar.