SlideShare a Scribd company logo
1 of 25
Download to read offline
Pentaho Data Integration
               Pedro José




© 2009, Pentaho. All Rights Reserved.
Quem sou

          Pedro José
          Técnico em desenvolvimento de sistemas
          Graduando em ciências da computação
          Sócio da empresa Moobi
          Programador do Tribunal de Justiça




© 2009, Pentaho. All Rights Reserved.
Roteiro

          O que é ETL?
          Algumas ferramentas para ETL
          Por que usar o pentaho?
          Um pouco mais sobre o pentaho
          Desmistificando o pentaho data integration
          Interface gráfica
          Demonstração
          Problemas?




© 2009, Pentaho. All Rights Reserved.
O que é ETL?




              “Extração, transformação e carga(ETL), é o núcleo do processo de
        integração de dados. É tipicamente associado com data warehousing.”




© 2009, Pentaho. All Rights Reserved.
Ferramentas de ETL

          Integration services(Microsoft)
          Talend
          Oracle warehouse builder
          DataStage (IBM)
          Pentaho Data Integration
          Programador/DBA




© 2009, Pentaho. All Rights Reserved.
Por que usar o PDI?

          Alternativa livre
          Multiplataforma
          Pequena curva de aprendizado
          Extensível
          Integrada com diversas outras ferramentas do mercado
                 Access
                 Excel
                 LDAP
                 SAP
                 Salesforce
                 Json, Yaml, RSS, etc...



© 2009, Pentaho. All Rights Reserved.
Por que comecei a usar o PDI?

          Treinamento
          Suíte Pentaho
          Dores de cabeça de todo programador
                 Migração entre servidores
                 Migração entre diferentes versões de sistema
                 Rotinas de carga em bases de dados




© 2009, Pentaho. All Rights Reserved.
Um pouco mais sobre o PDI

          Inicialmente chamado de Kettle(Kettle Tranformation Transportation
          Loading Environment)
          Criada em 2001 a partir da frustação com outras ferramentas de ETL,
          com foco na facilidade de utilização e na facilidade de manutenção
          Em 2005 tornou-se open source ganhando colaboradores
          Adquirida pela Pentaho em 2006
          “Boom” em 2007. Adição de novos recursos, suporte a processamento
          paralelo e diversos outros recursos para programadores




© 2009, Pentaho. All Rights Reserved.
Componentes do PDI

          Spoon – interface gráfica para criação de tranformations e jobs
          Pan – ferramenta de linha de comando para execução de
          tranformations
          Kitchen – ferramenta de linha de comando para execução de jobs
          Carte – servidor web para execução remota de tranformations e jobs




© 2009, Pentaho. All Rights Reserved.
Instalação

          Instale o Java Runtime Environment(JRE) versão 5.0 ou superior
     http://www.java.com/pt_BR/download/
          Faça o download da versão comunitária do PDI
     http://sourceforge.net/projects/pentaho/files/Data%20Integration/
          Descompacte o arquivo do PDI
          Execute o Spoon
     caso windows => spoon.bat
     caso linux                         => spoon.sh
     OBS: Alguns bancos de dados não possuem seus respectivos drivers no
          pacote básico. Caso queria adicionar um driver que esteja faltando ou
          substituir um existente, acesse a pasta “libextJDBC”

© 2009, Pentaho. All Rights Reserved.
Conceitos básicos

          Tranformations - Sequência lógica de passos para realizar alguma
          tranformação.




© 2009, Pentaho. All Rights Reserved.
Conceitos básicos

          Jobs - Forma de chamar e controlar a execução de uma sequência de
          tranformations. Geralmente, jobs são agendados e executados em lote
          de forma automática.




© 2009, Pentaho. All Rights Reserved.
Conceitos básicos

          Repositórios
                     Local onde as informações sobre as tranformations/jobs ficarão
                     armazenadas.
          Steps
                     Corresponde a um passo de uma determinada transformação. Este
                     passo poderá ser a criação, leitura, escrita ou manipulação de
                     alguma informação. Uma transformation é composta de um ou
                     mais steps.




© 2009, Pentaho. All Rights Reserved.
Tipos de step (Tranformation)
                                        Input – entrada de dados
                                        Output – saída de dados
                                        Tranform – transformações nos
                                        dados
                                        Flow – fluxo da informações
                                        Utility – utilitários
                                        Scripting – execução de scripts
                                        Lookup – consulta de dados
                                        Joins – junções entre fontes
                                        Validation – validação
                                        Data warehouse – armazém de
                                        dados
© 2009, Pentaho. All Rights Reserved.
Steps básicos (Tranformation) - INPUT

          Input
                     Access input
                     CSV input
                     Excel input
                     Generate random values
                     Generate rows
                     Json input
                     LDAP input
                     RSS input
                     Table input




© 2009, Pentaho. All Rights Reserved.
Steps básicos (Tranformation) - OUTPUT

          Output
                     Access output
                     Delete
                     Excel output
                     Json output
                     LDAP output
                     RSS output
                     Table output
                     SQL output
                     XML output




© 2009, Pentaho. All Rights Reserved.
Steps básicos (Tranformation) - TRANSFORM
     •Tranform
                     Add constants
                     Replace in string
                     Unique rows
                     Value mapper
                     Split fields
                     Add sequence
                     Strings cut
                     Calculator




© 2009, Pentaho. All Rights Reserved.
Steps básicos (Tranformation) - UTILITY

          Utility
                     Change file encoding
                     Run SSH commands
                     Write to log
                     Execute a process
                     Send message to syslog
                     Mail




© 2009, Pentaho. All Rights Reserved.
Steps básicos (Tranformation) - FLOW

          Flow
                     Blocking step
                     Filter rows
                     Abort
                     Dummy (do nothing)
                     Java filter
                     Switch / case




© 2009, Pentaho. All Rights Reserved.
Steps básicos (Tranformation) - SCRIPTING

          Scripting
                     Execute SQL script
                     Execute row SQL script
                     Modified Java script value
                     Regex Evaluation
                     User defined Java class




© 2009, Pentaho. All Rights Reserved.
Steps básicos (Tranformation) - LOOKUP

          Lookup
                     Web services lookup
                     Check if ws is available
                     Call DB procedure
                     Database join
                     Database lookup
                     Table exists
                     File exists
                     HTTP Post




© 2009, Pentaho. All Rights Reserved.
Interface gráfica / Demonstrações




© 2009, Pentaho. All Rights Reserved.
Links e livros

          Site da comunidade [ http://kettle.pentaho.org/ ]
          Fórum [ http://forums.pentaho.org/forumdisplay.php?f=69 ]
          Mais informação [ http://pentahobrasil.blogspot.com ]
          Mais informação [ http://blog.professorcoruja.com/ ]




© 2009, Pentaho. All Rights Reserved.
Problemas?




© 2009, Pentaho. All Rights Reserved.
Dúvidas



                                        Pedro José <pjneto@gmail.com>




© 2009, Pentaho. All Rights Reserved.

More Related Content

Viewers also liked

Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
 
Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...
Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...
Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...Ambiente Livre
 
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na SagePentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na SageVinicius Elyseu
 
Aula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDIAula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDIJarley Nóbrega
 
Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3
Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3 Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3
Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3 Vinicius Elyseu
 

Viewers also liked (7)

Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
 
Marcelo Brito Arrieta
Marcelo Brito ArrietaMarcelo Brito Arrieta
Marcelo Brito Arrieta
 
Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...
Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...
Pentaho Data Integration (Kettle) Integração e Migração de Dados com ETL Open...
 
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na SagePentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
Pentaho Day 2015 - Universidade Positivo - Multi Tenancy com Pentaho na Sage
 
Aula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDIAula 02-Tutorial ETL com PDI
Aula 02-Tutorial ETL com PDI
 
Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3
Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3 Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3
Pentaho Day 2015 - Universidade Positivo - Preparação de ambiente pentaho 5.3
 
Árvores de Decisão
Árvores de Decisão Árvores de Decisão
Árvores de Decisão
 

Similar to Pentaho data integration

Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...Ricardo Ferreira
 
Navegando em um mar de siglas do mundo java
Navegando em um mar de siglas do mundo javaNavegando em um mar de siglas do mundo java
Navegando em um mar de siglas do mundo javaAndrei Tognolo
 
04 - Felipe Oliveira - Think Decoupled! (SOA)
04 - Felipe Oliveira - Think Decoupled! (SOA)04 - Felipe Oliveira - Think Decoupled! (SOA)
04 - Felipe Oliveira - Think Decoupled! (SOA)DNAD
 
Novidades do Universo MySQL Maio 2014
Novidades do Universo MySQL Maio 2014Novidades do Universo MySQL Maio 2014
Novidades do Universo MySQL Maio 2014MySQL Brasil
 
Palestra DataFlow - II São Paulo Perl Workshop
Palestra DataFlow - II São Paulo Perl WorkshopPalestra DataFlow - II São Paulo Perl Workshop
Palestra DataFlow - II São Paulo Perl WorkshopAlexei Znamensky
 
Qconsp 2016 escalando uma plataforma de e-mail transacional- aprendizado da...
Qconsp 2016   escalando uma plataforma de e-mail transacional- aprendizado da...Qconsp 2016   escalando uma plataforma de e-mail transacional- aprendizado da...
Qconsp 2016 escalando uma plataforma de e-mail transacional- aprendizado da...fabio perrella
 
Escalando uma plataforma de e-mail transacional- aprendizado das trincheiras
Escalando uma plataforma de e-mail transacional- aprendizado das trincheirasEscalando uma plataforma de e-mail transacional- aprendizado das trincheiras
Escalando uma plataforma de e-mail transacional- aprendizado das trincheirasCelso Crivelaro
 
Dream Report com InduSoft Web Studio
Dream Report com InduSoft Web StudioDream Report com InduSoft Web Studio
Dream Report com InduSoft Web StudioAVEVA
 
Tendências do Mercado de Internet
Tendências do Mercado de InternetTendências do Mercado de Internet
Tendências do Mercado de InternetVanessa Oliveira
 
ODI Series - Treinamento
ODI Series - TreinamentoODI Series - Treinamento
ODI Series - TreinamentoCaio Lima
 
ApresentaçãO Final Campus Party
ApresentaçãO Final   Campus PartyApresentaçãO Final   Campus Party
ApresentaçãO Final Campus PartyCampus Party Brasil
 
Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0Andre Bretas
 
Aula 01-Tutorial ETL com PDI
Aula 01-Tutorial ETL com PDIAula 01-Tutorial ETL com PDI
Aula 01-Tutorial ETL com PDIJarley Nóbrega
 
TDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFiTDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFiEliézer Zarpelão
 
Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...
Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...
Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...Adriano Tavares
 
Produtividade em Integração de Aplicações com Apache Camel
Produtividade em Integração de Aplicações com Apache CamelProdutividade em Integração de Aplicações com Apache Camel
Produtividade em Integração de Aplicações com Apache CamelAlessandro Kieras
 
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Caio Moreno
 
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...IT4biz IT Solutions
 

Similar to Pentaho data integration (20)

Pentaho JUG Vale 2012
Pentaho JUG Vale 2012Pentaho JUG Vale 2012
Pentaho JUG Vale 2012
 
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
Blueprints & Patterns de Arquitetura para Sistemas que Escalam Linearmente (p...
 
Navegando em um mar de siglas do mundo java
Navegando em um mar de siglas do mundo javaNavegando em um mar de siglas do mundo java
Navegando em um mar de siglas do mundo java
 
04 - Felipe Oliveira - Think Decoupled! (SOA)
04 - Felipe Oliveira - Think Decoupled! (SOA)04 - Felipe Oliveira - Think Decoupled! (SOA)
04 - Felipe Oliveira - Think Decoupled! (SOA)
 
Novidades do Universo MySQL Maio 2014
Novidades do Universo MySQL Maio 2014Novidades do Universo MySQL Maio 2014
Novidades do Universo MySQL Maio 2014
 
Palestra DataFlow - II São Paulo Perl Workshop
Palestra DataFlow - II São Paulo Perl WorkshopPalestra DataFlow - II São Paulo Perl Workshop
Palestra DataFlow - II São Paulo Perl Workshop
 
Java Servlets
Java ServletsJava Servlets
Java Servlets
 
Qconsp 2016 escalando uma plataforma de e-mail transacional- aprendizado da...
Qconsp 2016   escalando uma plataforma de e-mail transacional- aprendizado da...Qconsp 2016   escalando uma plataforma de e-mail transacional- aprendizado da...
Qconsp 2016 escalando uma plataforma de e-mail transacional- aprendizado da...
 
Escalando uma plataforma de e-mail transacional- aprendizado das trincheiras
Escalando uma plataforma de e-mail transacional- aprendizado das trincheirasEscalando uma plataforma de e-mail transacional- aprendizado das trincheiras
Escalando uma plataforma de e-mail transacional- aprendizado das trincheiras
 
Dream Report com InduSoft Web Studio
Dream Report com InduSoft Web StudioDream Report com InduSoft Web Studio
Dream Report com InduSoft Web Studio
 
Tendências do Mercado de Internet
Tendências do Mercado de InternetTendências do Mercado de Internet
Tendências do Mercado de Internet
 
ODI Series - Treinamento
ODI Series - TreinamentoODI Series - Treinamento
ODI Series - Treinamento
 
ApresentaçãO Final Campus Party
ApresentaçãO Final   Campus PartyApresentaçãO Final   Campus Party
ApresentaçãO Final Campus Party
 
Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0
 
Aula 01-Tutorial ETL com PDI
Aula 01-Tutorial ETL com PDIAula 01-Tutorial ETL com PDI
Aula 01-Tutorial ETL com PDI
 
TDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFiTDC POA 2020 - Digerindo dados com Apache NiFi
TDC POA 2020 - Digerindo dados com Apache NiFi
 
Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...
Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...
Produtividade em integração de aplicações com apache camel tdc2012-são paulo-...
 
Produtividade em Integração de Aplicações com Apache Camel
Produtividade em Integração de Aplicações com Apache CamelProdutividade em Integração de Aplicações com Apache Camel
Produtividade em Integração de Aplicações com Apache Camel
 
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
 
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
 

More from Pedro Neto

MySQL - copiando, movendo e restaurando dados
MySQL - copiando, movendo e restaurando dadosMySQL - copiando, movendo e restaurando dados
MySQL - copiando, movendo e restaurando dadosPedro Neto
 
FreeBSD para leigos
FreeBSD para leigosFreeBSD para leigos
FreeBSD para leigosPedro Neto
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para LeigosPedro Neto
 
Sistemas de arquivos
Sistemas de arquivosSistemas de arquivos
Sistemas de arquivosPedro Neto
 
Desenvolvimento web seguro para leigos
Desenvolvimento web seguro para leigosDesenvolvimento web seguro para leigos
Desenvolvimento web seguro para leigosPedro Neto
 
Fundamentos de linux
Fundamentos de linuxFundamentos de linux
Fundamentos de linuxPedro Neto
 

More from Pedro Neto (6)

MySQL - copiando, movendo e restaurando dados
MySQL - copiando, movendo e restaurando dadosMySQL - copiando, movendo e restaurando dados
MySQL - copiando, movendo e restaurando dados
 
FreeBSD para leigos
FreeBSD para leigosFreeBSD para leigos
FreeBSD para leigos
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para Leigos
 
Sistemas de arquivos
Sistemas de arquivosSistemas de arquivos
Sistemas de arquivos
 
Desenvolvimento web seguro para leigos
Desenvolvimento web seguro para leigosDesenvolvimento web seguro para leigos
Desenvolvimento web seguro para leigos
 
Fundamentos de linux
Fundamentos de linuxFundamentos de linux
Fundamentos de linux
 

Pentaho data integration

  • 1. Pentaho Data Integration Pedro José © 2009, Pentaho. All Rights Reserved.
  • 2. Quem sou Pedro José Técnico em desenvolvimento de sistemas Graduando em ciências da computação Sócio da empresa Moobi Programador do Tribunal de Justiça © 2009, Pentaho. All Rights Reserved.
  • 3. Roteiro O que é ETL? Algumas ferramentas para ETL Por que usar o pentaho? Um pouco mais sobre o pentaho Desmistificando o pentaho data integration Interface gráfica Demonstração Problemas? © 2009, Pentaho. All Rights Reserved.
  • 4. O que é ETL? “Extração, transformação e carga(ETL), é o núcleo do processo de integração de dados. É tipicamente associado com data warehousing.” © 2009, Pentaho. All Rights Reserved.
  • 5. Ferramentas de ETL Integration services(Microsoft) Talend Oracle warehouse builder DataStage (IBM) Pentaho Data Integration Programador/DBA © 2009, Pentaho. All Rights Reserved.
  • 6. Por que usar o PDI? Alternativa livre Multiplataforma Pequena curva de aprendizado Extensível Integrada com diversas outras ferramentas do mercado Access Excel LDAP SAP Salesforce Json, Yaml, RSS, etc... © 2009, Pentaho. All Rights Reserved.
  • 7. Por que comecei a usar o PDI? Treinamento Suíte Pentaho Dores de cabeça de todo programador Migração entre servidores Migração entre diferentes versões de sistema Rotinas de carga em bases de dados © 2009, Pentaho. All Rights Reserved.
  • 8. Um pouco mais sobre o PDI Inicialmente chamado de Kettle(Kettle Tranformation Transportation Loading Environment) Criada em 2001 a partir da frustação com outras ferramentas de ETL, com foco na facilidade de utilização e na facilidade de manutenção Em 2005 tornou-se open source ganhando colaboradores Adquirida pela Pentaho em 2006 “Boom” em 2007. Adição de novos recursos, suporte a processamento paralelo e diversos outros recursos para programadores © 2009, Pentaho. All Rights Reserved.
  • 9. Componentes do PDI Spoon – interface gráfica para criação de tranformations e jobs Pan – ferramenta de linha de comando para execução de tranformations Kitchen – ferramenta de linha de comando para execução de jobs Carte – servidor web para execução remota de tranformations e jobs © 2009, Pentaho. All Rights Reserved.
  • 10. Instalação Instale o Java Runtime Environment(JRE) versão 5.0 ou superior http://www.java.com/pt_BR/download/ Faça o download da versão comunitária do PDI http://sourceforge.net/projects/pentaho/files/Data%20Integration/ Descompacte o arquivo do PDI Execute o Spoon caso windows => spoon.bat caso linux => spoon.sh OBS: Alguns bancos de dados não possuem seus respectivos drivers no pacote básico. Caso queria adicionar um driver que esteja faltando ou substituir um existente, acesse a pasta “libextJDBC” © 2009, Pentaho. All Rights Reserved.
  • 11. Conceitos básicos Tranformations - Sequência lógica de passos para realizar alguma tranformação. © 2009, Pentaho. All Rights Reserved.
  • 12. Conceitos básicos Jobs - Forma de chamar e controlar a execução de uma sequência de tranformations. Geralmente, jobs são agendados e executados em lote de forma automática. © 2009, Pentaho. All Rights Reserved.
  • 13. Conceitos básicos Repositórios Local onde as informações sobre as tranformations/jobs ficarão armazenadas. Steps Corresponde a um passo de uma determinada transformação. Este passo poderá ser a criação, leitura, escrita ou manipulação de alguma informação. Uma transformation é composta de um ou mais steps. © 2009, Pentaho. All Rights Reserved.
  • 14. Tipos de step (Tranformation) Input – entrada de dados Output – saída de dados Tranform – transformações nos dados Flow – fluxo da informações Utility – utilitários Scripting – execução de scripts Lookup – consulta de dados Joins – junções entre fontes Validation – validação Data warehouse – armazém de dados © 2009, Pentaho. All Rights Reserved.
  • 15. Steps básicos (Tranformation) - INPUT Input Access input CSV input Excel input Generate random values Generate rows Json input LDAP input RSS input Table input © 2009, Pentaho. All Rights Reserved.
  • 16. Steps básicos (Tranformation) - OUTPUT Output Access output Delete Excel output Json output LDAP output RSS output Table output SQL output XML output © 2009, Pentaho. All Rights Reserved.
  • 17. Steps básicos (Tranformation) - TRANSFORM •Tranform Add constants Replace in string Unique rows Value mapper Split fields Add sequence Strings cut Calculator © 2009, Pentaho. All Rights Reserved.
  • 18. Steps básicos (Tranformation) - UTILITY Utility Change file encoding Run SSH commands Write to log Execute a process Send message to syslog Mail © 2009, Pentaho. All Rights Reserved.
  • 19. Steps básicos (Tranformation) - FLOW Flow Blocking step Filter rows Abort Dummy (do nothing) Java filter Switch / case © 2009, Pentaho. All Rights Reserved.
  • 20. Steps básicos (Tranformation) - SCRIPTING Scripting Execute SQL script Execute row SQL script Modified Java script value Regex Evaluation User defined Java class © 2009, Pentaho. All Rights Reserved.
  • 21. Steps básicos (Tranformation) - LOOKUP Lookup Web services lookup Check if ws is available Call DB procedure Database join Database lookup Table exists File exists HTTP Post © 2009, Pentaho. All Rights Reserved.
  • 22. Interface gráfica / Demonstrações © 2009, Pentaho. All Rights Reserved.
  • 23. Links e livros Site da comunidade [ http://kettle.pentaho.org/ ] Fórum [ http://forums.pentaho.org/forumdisplay.php?f=69 ] Mais informação [ http://pentahobrasil.blogspot.com ] Mais informação [ http://blog.professorcoruja.com/ ] © 2009, Pentaho. All Rights Reserved.
  • 24. Problemas? © 2009, Pentaho. All Rights Reserved.
  • 25. Dúvidas Pedro José <pjneto@gmail.com> © 2009, Pentaho. All Rights Reserved.