SlideShare a Scribd company logo
1 of 47
Download to read offline
Banco de Dados, Integração 
e Qualidade de Dados 
Ceça Moraes 
cecafac@gmail.com
Sobre a professora 
Ceça Moraes 
Doutora em Computação (UFPE) 
Áreas de atuação 
Desenvolvimento de SSooffttwwaarree ee 
Banco de Dados 
Experiência (~25 anos): 
Várias empresas 
2010 até hoje -> UFRPE 
Pesquisadora ISI-TICS (Senai)
Conteúdo 
Apresentação 
Banco de Dados 
Introdução 
Conceitos Básicos 
MMooddeellooss 
Aplicações 
Fundamentos 
Integração de Dados 
Qualidade da Informação
Estruturando Informações... 
Informações 
Fontes
Estruturando informações... 
Informações Nível Abstrato 
Modelagem 
Dados Nível Físico
Estruturando informações... 
Dados 
Instruções 
de 
programas 
Processamento 
Coletar, organizar, armazenar e 
recuperar informações de 
forma eficiente 
Como fazer ????
Banco de Dados (BD) 
Conjunto de dados inter-relacionados 
para atender necessidades de um 
conjunto de usuários e/ou aplicações 
Conjunto de programas de acesso 
aos dados 
Sistema de Gerenciamento de 
Banco de Dados (SGBD)
Antes... 
No início, aplicações usavam 
sistemas de arquivos 
Dados de diferentes aplicações não 
integradointegradoss 
Dados projetados para atender a uma 
aplicação específica
Antes... 
Problemas: 
Redundância e inconsistência 
Dificuldades nnoo aacceessssoo aaooss ddaaddooss 
Problemas de compartilhamento 
Segurança
Processamento sem BD 
Exemplo: empresa hipotética 
implementa sistemas para 
Vendas 
PPrroodduuççããoo 
Compras 
Onde ficam os dados de produtos?
Processamento sem BD 
Problema de Redundância de dados
Processamento com BD 
Dados armazenados uma única vez: 
Eventual redundância controlada pelo 
SGBD e invisível às aplicações
SGBD – o que é isso ? 
SGBD = Sistema Gerenciador de Banco 
de Dados (Database Management 
System) 
Um software sofisticado para: 
Armazenar dados ddee ffoorrmmaa eeffiicciieennttee 
Consultar dados obtendo respostas rápidas 
Modificar dados concorrentemente 
Exemplos: DB2 – IBM; Oracle Server – 
Oracle; SQL Server – Microsoft; MySQL; 
PostgreSQL
Características de um SGBD 
Integridade / Consistência 
Restrições 
Segurança / Privacidade 
Restauração 
Reorganização 
Eficiência
Modelos de SGBDs 
Modelo 
Descrição formal dos dados armazenados 
em um banco de dados 
HHiieerráárrqquuiiccooss 
Em Rede 
Relacional 
OO/OR
Modelo Relacional 
Dados e relacionamentos representados 
por tabelas 
Tabelas possuem múltiplas colunas 
e linhas
Exemplo BD Relacional 
Colunas 
Campos ou 
Atributos 
Linhas 
Registros (dados)
SQL (Structured Query Language) 
Linguagem padrão de interação com 
banco de dados relacionais 
Reconhecida por quase todos os produtos 
Padrão ANSI (American National Standard 
IInnssttiittuuttee)) 
Comandos para: 
Inserção, modificação, remoção de 
dados, consultas 
Manipulação de estruturas
Várias Aplicações e Tipos de SGBD 
Business Inteligence 
Bancos de Dados Geográficos 
Bancos de Dados Móveis 
Bancos de Dados Biológicos 
CClloouudd CCoommppuuttiinngg 
BIG DATA!!!!!!!!!!!!
Dados, dados e mais dados... 
Quantidades gigantescas de 
dados são coletados e 
armazenados em empresas, 
corporações 
Dados de comércio eletrônico 
Dados de navegação na 
Ponto de Vista Comercial 
internet 
Dados de compras de clientes 
em grandes lojas de 
departamentos,supermercados 
Dados de transações bancárias 
ou de cartão de crédito
Dados, dados e mais dados... 
Dados coletados e 
armazenados a 
velocidades enormes 
(GB/hora) 
Sensores remotos em 
satélites 
Ponto de Vista Científico: 
Medicina, Biologia, 
Engenharia 
Telescópios 
Microarrays gerando dados 
de expressões de genes 
Simulações científicas 
gerando terabytes de 
dados
Matemática!!! 
SQL foi originalmente 
baseada na álgebra 
relacional, uma forma de 
cálculo sobre conjuntos e 
relações 
SELECT * 
FROM TabelaA 
INNER JOIN TabelaB 
ON A.id = B.id
Motivação 
Web: enorme banco de dados 
Sem (ou com pouca) estrutura 
Documentos são gerados para serem 
disponibilizados para leitura 
Alguns documentos foram gerados a 
partir de consultas a BD 
Dados podem ser extraídos das 
páginas web para serem utilizados por 
outros programas
Web X Banco de Dados 
Onde a Web é diferente de BD: 
não tem estrutura uniforme 
não tem restrição ddee iinntteeggrriiddaaddee 
não tem uma linguagem de consulta ou 
um modelo de dados padrão 
Mas a Web é rica em DADOS!!!!!
Integração de Dados 
Problema: A Web contém um número 
crescente de fontes de informação 
autônomas que podem ser vistas como 
um grande repositório de dados 
Tarefa: Responder consultas que podem 
requerer extração e combinação de 
dados de várias fontes de dados na WEB
Integração de Dados 
Exemplo: Considere um repositório de 
Cinema na Internet contendo dados sobre 
elenco, gênero e diretores. Informações 
sobre críticas de filmes podem ser 
encontradas em outras fontes wweebb 
(ex: revistas) e muitas outras fontes 
provêem horários dos cinemas. 
Combinando dados de todas estas fontes, 
podemos responder a: 
“Quais os filmes com Julia Roberts, suas críticas e 
horários de exibição, em cartaz hoje a noite em Paris”
Sistemas de Integração de Dados 
Duas abordagens: 
1. Warehousing: os dados das diversas 
fontes Web são carregados 
(materializados) em um repositório 
(data warehouse) e as consultas são 
submetidas aa eessttee rreeppoossiittóórriioo 
Vantagem: performance garantida no 
momento da consulta 
Desvantagem: atualização do 
repositório sempre que houver 
mudança nos dados
Arquitetura com Data Warehouse 
cliente cliente cliente 
consulta 
resposta 
servidor 
dados 
warehouse 
dados 
servidor 
dados 
servidor 
dados 
atualização 
dados
Sistemas de Integração de Dados 
2. Enfoque Virtual: os dados são mantidos 
nas fontes Web e as consultas são 
submetidas diretamente às diversas fontes 
Vantagem: os dados não são replicados e 
tem-se a garantia de eessttaarreemm aattuuaalliizzaaddooss 
no momento da consulta 
Desvantagem: como as fontes de dados 
são autônomas, são necessários métodos 
para otimização de consultas para garantir 
uma performance adequada
Arquitetura com Mediador 
cliente cliente cliente 
consulta 
resposta 
servidor 
dados 
servidor 
dados 
servidor 
dados 
mediador 
consulta 
resposta
Motivação 
Alguns aspectos em BD como 
integridade e segurança, vêm sendo 
estudados desde a introdução da 
tecnologia relacional 
41 
O conceito de qualidade de dados 
emergiu nos últimos anos
Motivação 
Qualidade da informação (QI) tornou-se 
um ponto crítico em empresas e em 
pesquisas 
Ainda mais com o volume/velocidade/ 
variedade 
42 
A falta de qualidade nas informações 
pode impactar severamente a 
efetividade de uma organização 
O crescimento do uso de tecnologias de 
data warehouse e acesso direto a fontes 
de dados distribuídas
Qualidade da Informação (QI) 
Informações de boa qualidade são 
informações que podem ser “usadas 
pelos consumidores” 
Fitness for use 
43 
Conceito multidimensional: 
Assinalar valores de escores para 
critérios de qualidade associados à 
informação
Qualidade da Informação (QI) 
Critérios de qualidade ou dimensões. 
Exemplos: 
Precisão 
Grau de corretude e precisão que reflete o 
domínio da aplicação 
Completude 
Todos dados relevantes para a aplicação estão 
disponíveis 
44 
Atualidade 
A “idade” do dado 
Disponibilidade 
O tempo que uma fonte fica disponível 
....
Critérios 
de QI 
45
Qualidade da Informação 
Em sistemas de Integração de Dados 
Seleção de fontes 
Esquemas das fontes 
Esquemas do mediador 
Processamento ddee ccoonnssuullttaass 
Resultados das consultas 
...
Banco de Dados, Integração 
e Qualidade de Dados 
Ceça Moraes 
cecafac@gmail.com

More Related Content

What's hot (20)

Banco de Dados Conceitos
Banco de Dados ConceitosBanco de Dados Conceitos
Banco de Dados Conceitos
 
Metadados: dados a respeito de dados
Metadados: dados a respeito de dadosMetadados: dados a respeito de dados
Metadados: dados a respeito de dados
 
Fundamentos de banco de dados 01 indrodução
Fundamentos de banco de dados   01 indroduçãoFundamentos de banco de dados   01 indrodução
Fundamentos de banco de dados 01 indrodução
 
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
Universidade Federal do Amazonas - Banco de dados - Apresentação 1 - Renan M....
 
Ebook - Metadados para estratégias de conteúdo
Ebook - Metadados para estratégias de conteúdoEbook - Metadados para estratégias de conteúdo
Ebook - Metadados para estratégias de conteúdo
 
Metadados
MetadadosMetadados
Metadados
 
Modelo orientado a objetos
Modelo orientado a objetosModelo orientado a objetos
Modelo orientado a objetos
 
Apresentação Final de Banco de Dados
Apresentação Final de Banco de DadosApresentação Final de Banco de Dados
Apresentação Final de Banco de Dados
 
Banco De Dados
Banco De DadosBanco De Dados
Banco De Dados
 
Modelos de base de dados
Modelos de base de dadosModelos de base de dados
Modelos de base de dados
 
Bancodedados
BancodedadosBancodedados
Bancodedados
 
Banco dados i prof ivan (acesse www.portalgsti.com.br)
Banco dados i prof ivan (acesse  www.portalgsti.com.br)Banco dados i prof ivan (acesse  www.portalgsti.com.br)
Banco dados i prof ivan (acesse www.portalgsti.com.br)
 
Banco de Dados
Banco de DadosBanco de Dados
Banco de Dados
 
Metadados
MetadadosMetadados
Metadados
 
Introdução a Bancos de Dados
Introdução a Bancos de DadosIntrodução a Bancos de Dados
Introdução a Bancos de Dados
 
Ver
VerVer
Ver
 
Metadados
MetadadosMetadados
Metadados
 
Metadados com XML
Metadados com XMLMetadados com XML
Metadados com XML
 
Apostila banco de dados
Apostila banco de dadosApostila banco de dados
Apostila banco de dados
 
Aula metadados 2012
Aula metadados 2012Aula metadados 2012
Aula metadados 2012
 

Viewers also liked

Integracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e SempreIntegracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e SempreBerna Lóscio
 
Case 011 INTEGRAÇÃO DE DADOS
Case 011   INTEGRAÇÃO DE DADOSCase 011   INTEGRAÇÃO DE DADOS
Case 011 INTEGRAÇÃO DE DADOSFabio Viana
 
Integração dados prática ppt
Integração dados prática pptIntegração dados prática ppt
Integração dados prática pptRodrigo Ribeiro
 
Dados Informacao Conhecimento Saber
Dados Informacao Conhecimento SaberDados Informacao Conhecimento Saber
Dados Informacao Conhecimento Saberblogspheregroup
 
Integração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e SaberIntegração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e Saberigorpsoares
 
O Poder dos Softwares Livres para Geoprocessamento
O Poder dos Softwares Livres para GeoprocessamentoO Poder dos Softwares Livres para Geoprocessamento
O Poder dos Softwares Livres para GeoprocessamentoAnderson Medeiros
 
Sistemas NoSQL, surgimento, características e exemplos
Sistemas NoSQL, surgimento, características e exemplosSistemas NoSQL, surgimento, características e exemplos
Sistemas NoSQL, surgimento, características e exemplosAricelio Souza
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dadosvini_campos
 
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERBanco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERRangel Javier
 
Aula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosAula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosRafael Albani
 

Viewers also liked (15)

Qualidade da informação (banco de dados)
Qualidade da informação (banco de dados)Qualidade da informação (banco de dados)
Qualidade da informação (banco de dados)
 
Integracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e SempreIntegracao dados Ontem Hoje e Sempre
Integracao dados Ontem Hoje e Sempre
 
Case 011 INTEGRAÇÃO DE DADOS
Case 011   INTEGRAÇÃO DE DADOSCase 011   INTEGRAÇÃO DE DADOS
Case 011 INTEGRAÇÃO DE DADOS
 
Integração dados prática ppt
Integração dados prática pptIntegração dados prática ppt
Integração dados prática ppt
 
Dados Informacao Conhecimento Saber
Dados Informacao Conhecimento SaberDados Informacao Conhecimento Saber
Dados Informacao Conhecimento Saber
 
Integração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e SaberIntegração de Dados, Informação, Conhecimento e Saber
Integração de Dados, Informação, Conhecimento e Saber
 
Bancos de dados NoSQL
Bancos de dados NoSQLBancos de dados NoSQL
Bancos de dados NoSQL
 
Banco de Dados Espaciais
Banco de Dados EspaciaisBanco de Dados Espaciais
Banco de Dados Espaciais
 
Supply chain laranja
Supply chain   laranjaSupply chain   laranja
Supply chain laranja
 
O Poder dos Softwares Livres para Geoprocessamento
O Poder dos Softwares Livres para GeoprocessamentoO Poder dos Softwares Livres para Geoprocessamento
O Poder dos Softwares Livres para Geoprocessamento
 
Sistemas NoSQL, surgimento, características e exemplos
Sistemas NoSQL, surgimento, características e exemplosSistemas NoSQL, surgimento, características e exemplos
Sistemas NoSQL, surgimento, características e exemplos
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dados
 
Banco de Dados - Conceitos Básicos
Banco de Dados - Conceitos BásicosBanco de Dados - Conceitos Básicos
Banco de Dados - Conceitos Básicos
 
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERBanco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
 
Aula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosAula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de Dados
 

Similar to Banco de Dados, Integração e Qualidade de Dados

Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5Leandro Rezende
 
Banco de dados aula 2
Banco de dados   aula 2Banco de dados   aula 2
Banco de dados aula 2danitrani
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 
Bdii aula01 apresentacao
Bdii aula01 apresentacaoBdii aula01 apresentacao
Bdii aula01 apresentacaosamuel1562314
 
Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...
Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...
Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...Leonardo Roberto Marinho Farias
 
Introdução a Banco de Dados (Parte 1)
Introdução a Banco de Dados (Parte 1)Introdução a Banco de Dados (Parte 1)
Introdução a Banco de Dados (Parte 1)Mario Sergio
 
1 - BD - Introdução.pdf
1 - BD - Introdução.pdf1 - BD - Introdução.pdf
1 - BD - Introdução.pdfEgnaldo Paulino
 
Bancos de Dados Pós-Relacionais
Bancos de Dados Pós-RelacionaisBancos de Dados Pós-Relacionais
Bancos de Dados Pós-Relacionaiselliando dias
 
Banco de Dados Banco de Dados Banco de Dados
Banco de Dados Banco de Dados Banco de DadosBanco de Dados Banco de Dados Banco de Dados
Banco de Dados Banco de Dados Banco de DadosDanielRibeiro136663
 
modelo relacional.ppt
modelo relacional.pptmodelo relacional.ppt
modelo relacional.pptritaporfrio
 
Governança de dados - Power Bi Talks 3ª Edição
Governança de dados - Power Bi Talks 3ª EdiçãoGovernança de dados - Power Bi Talks 3ª Edição
Governança de dados - Power Bi Talks 3ª EdiçãoClaudio Bonel
 
Congresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco AquinoCongresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco AquinoFernando Botafogo
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxdataRain
 
Banco de Dados - Part01
Banco de Dados - Part01Banco de Dados - Part01
Banco de Dados - Part01Rangel Javier
 
Sistemas de apoio à decisão - SAD
Sistemas de apoio à decisão - SADSistemas de apoio à decisão - SAD
Sistemas de apoio à decisão - SADJosé Luiz Wollinger
 

Similar to Banco de Dados, Integração e Qualidade de Dados (20)

Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5Sistemas de Informações Gerenciais - Aula5
Sistemas de Informações Gerenciais - Aula5
 
PSI - SIBC, SGBD
PSI - SIBC, SGBDPSI - SIBC, SGBD
PSI - SIBC, SGBD
 
Banco de dados aula 2
Banco de dados   aula 2Banco de dados   aula 2
Banco de dados aula 2
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 
Bdii aula01 apresentacao
Bdii aula01 apresentacaoBdii aula01 apresentacao
Bdii aula01 apresentacao
 
Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...
Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...
Entenda como as grandes empresas utilizam múltiplas abordagens de armazenamen...
 
bd.ppt
bd.pptbd.ppt
bd.ppt
 
Introdução a Banco de Dados (Parte 1)
Introdução a Banco de Dados (Parte 1)Introdução a Banco de Dados (Parte 1)
Introdução a Banco de Dados (Parte 1)
 
1 - BD - Introdução.pdf
1 - BD - Introdução.pdf1 - BD - Introdução.pdf
1 - BD - Introdução.pdf
 
Bancos de Dados Pós-Relacionais
Bancos de Dados Pós-RelacionaisBancos de Dados Pós-Relacionais
Bancos de Dados Pós-Relacionais
 
PFTI (2).ppt
PFTI (2).pptPFTI (2).ppt
PFTI (2).ppt
 
Banco de Dados Banco de Dados Banco de Dados
Banco de Dados Banco de Dados Banco de DadosBanco de Dados Banco de Dados Banco de Dados
Banco de Dados Banco de Dados Banco de Dados
 
modelo relacional.ppt
modelo relacional.pptmodelo relacional.ppt
modelo relacional.ppt
 
Governança de dados - Power Bi Talks 3ª Edição
Governança de dados - Power Bi Talks 3ª EdiçãoGovernança de dados - Power Bi Talks 3ª Edição
Governança de dados - Power Bi Talks 3ª Edição
 
Congresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco AquinoCongresso AE Rio 2011 - Petrobras Francisco Aquino
Congresso AE Rio 2011 - Petrobras Francisco Aquino
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
 
Banco de Dados - Part01
Banco de Dados - Part01Banco de Dados - Part01
Banco de Dados - Part01
 
BDI_1_conceitos
BDI_1_conceitosBDI_1_conceitos
BDI_1_conceitos
 
Modelagem de dados
Modelagem de dadosModelagem de dados
Modelagem de dados
 
Sistemas de apoio à decisão - SAD
Sistemas de apoio à decisão - SADSistemas de apoio à decisão - SAD
Sistemas de apoio à decisão - SAD
 

Banco de Dados, Integração e Qualidade de Dados

  • 1. Banco de Dados, Integração e Qualidade de Dados Ceça Moraes cecafac@gmail.com
  • 2. Sobre a professora Ceça Moraes Doutora em Computação (UFPE) Áreas de atuação Desenvolvimento de SSooffttwwaarree ee Banco de Dados Experiência (~25 anos): Várias empresas 2010 até hoje -> UFRPE Pesquisadora ISI-TICS (Senai)
  • 3. Conteúdo Apresentação Banco de Dados Introdução Conceitos Básicos MMooddeellooss Aplicações Fundamentos Integração de Dados Qualidade da Informação
  • 5. Estruturando informações... Informações Nível Abstrato Modelagem Dados Nível Físico
  • 6. Estruturando informações... Dados Instruções de programas Processamento Coletar, organizar, armazenar e recuperar informações de forma eficiente Como fazer ????
  • 7.
  • 8.
  • 9. Banco de Dados (BD) Conjunto de dados inter-relacionados para atender necessidades de um conjunto de usuários e/ou aplicações Conjunto de programas de acesso aos dados Sistema de Gerenciamento de Banco de Dados (SGBD)
  • 10. Antes... No início, aplicações usavam sistemas de arquivos Dados de diferentes aplicações não integradointegradoss Dados projetados para atender a uma aplicação específica
  • 11. Antes... Problemas: Redundância e inconsistência Dificuldades nnoo aacceessssoo aaooss ddaaddooss Problemas de compartilhamento Segurança
  • 12. Processamento sem BD Exemplo: empresa hipotética implementa sistemas para Vendas PPrroodduuççããoo Compras Onde ficam os dados de produtos?
  • 13. Processamento sem BD Problema de Redundância de dados
  • 14. Processamento com BD Dados armazenados uma única vez: Eventual redundância controlada pelo SGBD e invisível às aplicações
  • 15. SGBD – o que é isso ? SGBD = Sistema Gerenciador de Banco de Dados (Database Management System) Um software sofisticado para: Armazenar dados ddee ffoorrmmaa eeffiicciieennttee Consultar dados obtendo respostas rápidas Modificar dados concorrentemente Exemplos: DB2 – IBM; Oracle Server – Oracle; SQL Server – Microsoft; MySQL; PostgreSQL
  • 16. Características de um SGBD Integridade / Consistência Restrições Segurança / Privacidade Restauração Reorganização Eficiência
  • 17. Modelos de SGBDs Modelo Descrição formal dos dados armazenados em um banco de dados HHiieerráárrqquuiiccooss Em Rede Relacional OO/OR
  • 18. Modelo Relacional Dados e relacionamentos representados por tabelas Tabelas possuem múltiplas colunas e linhas
  • 19.
  • 20. Exemplo BD Relacional Colunas Campos ou Atributos Linhas Registros (dados)
  • 21. SQL (Structured Query Language) Linguagem padrão de interação com banco de dados relacionais Reconhecida por quase todos os produtos Padrão ANSI (American National Standard IInnssttiittuuttee)) Comandos para: Inserção, modificação, remoção de dados, consultas Manipulação de estruturas
  • 22. Várias Aplicações e Tipos de SGBD Business Inteligence Bancos de Dados Geográficos Bancos de Dados Móveis Bancos de Dados Biológicos CClloouudd CCoommppuuttiinngg BIG DATA!!!!!!!!!!!!
  • 23. Dados, dados e mais dados... Quantidades gigantescas de dados são coletados e armazenados em empresas, corporações Dados de comércio eletrônico Dados de navegação na Ponto de Vista Comercial internet Dados de compras de clientes em grandes lojas de departamentos,supermercados Dados de transações bancárias ou de cartão de crédito
  • 24. Dados, dados e mais dados... Dados coletados e armazenados a velocidades enormes (GB/hora) Sensores remotos em satélites Ponto de Vista Científico: Medicina, Biologia, Engenharia Telescópios Microarrays gerando dados de expressões de genes Simulações científicas gerando terabytes de dados
  • 25.
  • 26. Matemática!!! SQL foi originalmente baseada na álgebra relacional, uma forma de cálculo sobre conjuntos e relações SELECT * FROM TabelaA INNER JOIN TabelaB ON A.id = B.id
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32. Motivação Web: enorme banco de dados Sem (ou com pouca) estrutura Documentos são gerados para serem disponibilizados para leitura Alguns documentos foram gerados a partir de consultas a BD Dados podem ser extraídos das páginas web para serem utilizados por outros programas
  • 33. Web X Banco de Dados Onde a Web é diferente de BD: não tem estrutura uniforme não tem restrição ddee iinntteeggrriiddaaddee não tem uma linguagem de consulta ou um modelo de dados padrão Mas a Web é rica em DADOS!!!!!
  • 34. Integração de Dados Problema: A Web contém um número crescente de fontes de informação autônomas que podem ser vistas como um grande repositório de dados Tarefa: Responder consultas que podem requerer extração e combinação de dados de várias fontes de dados na WEB
  • 35. Integração de Dados Exemplo: Considere um repositório de Cinema na Internet contendo dados sobre elenco, gênero e diretores. Informações sobre críticas de filmes podem ser encontradas em outras fontes wweebb (ex: revistas) e muitas outras fontes provêem horários dos cinemas. Combinando dados de todas estas fontes, podemos responder a: “Quais os filmes com Julia Roberts, suas críticas e horários de exibição, em cartaz hoje a noite em Paris”
  • 36. Sistemas de Integração de Dados Duas abordagens: 1. Warehousing: os dados das diversas fontes Web são carregados (materializados) em um repositório (data warehouse) e as consultas são submetidas aa eessttee rreeppoossiittóórriioo Vantagem: performance garantida no momento da consulta Desvantagem: atualização do repositório sempre que houver mudança nos dados
  • 37. Arquitetura com Data Warehouse cliente cliente cliente consulta resposta servidor dados warehouse dados servidor dados servidor dados atualização dados
  • 38. Sistemas de Integração de Dados 2. Enfoque Virtual: os dados são mantidos nas fontes Web e as consultas são submetidas diretamente às diversas fontes Vantagem: os dados não são replicados e tem-se a garantia de eessttaarreemm aattuuaalliizzaaddooss no momento da consulta Desvantagem: como as fontes de dados são autônomas, são necessários métodos para otimização de consultas para garantir uma performance adequada
  • 39. Arquitetura com Mediador cliente cliente cliente consulta resposta servidor dados servidor dados servidor dados mediador consulta resposta
  • 40.
  • 41. Motivação Alguns aspectos em BD como integridade e segurança, vêm sendo estudados desde a introdução da tecnologia relacional 41 O conceito de qualidade de dados emergiu nos últimos anos
  • 42. Motivação Qualidade da informação (QI) tornou-se um ponto crítico em empresas e em pesquisas Ainda mais com o volume/velocidade/ variedade 42 A falta de qualidade nas informações pode impactar severamente a efetividade de uma organização O crescimento do uso de tecnologias de data warehouse e acesso direto a fontes de dados distribuídas
  • 43. Qualidade da Informação (QI) Informações de boa qualidade são informações que podem ser “usadas pelos consumidores” Fitness for use 43 Conceito multidimensional: Assinalar valores de escores para critérios de qualidade associados à informação
  • 44. Qualidade da Informação (QI) Critérios de qualidade ou dimensões. Exemplos: Precisão Grau de corretude e precisão que reflete o domínio da aplicação Completude Todos dados relevantes para a aplicação estão disponíveis 44 Atualidade A “idade” do dado Disponibilidade O tempo que uma fonte fica disponível ....
  • 46. Qualidade da Informação Em sistemas de Integração de Dados Seleção de fontes Esquemas das fontes Esquemas do mediador Processamento ddee ccoonnssuullttaass Resultados das consultas ...
  • 47. Banco de Dados, Integração e Qualidade de Dados Ceça Moraes cecafac@gmail.com