O capítulo discute fundamentos da inteligência de negócios, gestão da informação e bancos de dados. Aborda como bancos de dados relacionais e orientados a objetos organizam dados, princípios de sistemas de gestão de bancos de dados e como extrair informações dos bancos de dados para melhorar o desempenho e tomada de decisão das empresas.
1. Capítulo 5
Fundamentos da inteligência de negócios:
gestão da informação e de bancos de
dados
5.1
2. Objetivos de estudo
• Como um banco de dados relacional organiza os dados e compara essa
abordagem ao banco de dados orientado a objetos?
• Quais os princípios de um sistema de gestão de banco de dados?
• Quais as principais ferramentas e tecnologias para extrair informações de
bancos de dados e melhorar o desempenho da empresa e a tomada de
decisão?
5.2
3. Objetivos de estudo
• Qual o papel da política de informação e da gestão de dados na
organização dos recursos de dados empresariais?
• Por que é importante para a empresa garantir a qualidade dos dados?
5.3
4. A R.R. Donnelley tenta
controlar seus dados
• Problema: o crescimento explosivo criou desafios na gerência de
informações.
• Soluções: usar um MDM para criar um conjunto de dados que
abarque toda a empresa, previnindo a duplicação desnecessária
dos mesmos.
5.4
5. A R.R. Donnelley tenta
controlar seus dados
• A gestão de dados mestres (MDM) permite que empresas como a R.R.
Donnelley eliminem dados desatualizados, incompletos ou incorretos.
• Demonstra o papel da TI na gestão bem-sucedida de dados.
• Ilustra o papel da tecnologia digital no armazenamento e organização dos
dados.
5.5
7. A abordagem de banco
de dados para gestão de dados
• Banco de dados:
• Conjunto de arquivos relacionados entre si com registros sobre pessoas,
lugares ou coisas.
• Antes do desenvolvimento dos bancos de dados digitais, as empresas
usavam grandes arquivos de metal, cheios de arquivos de papel.
• Entidade:
• Categoria genérica que representa uma pessoa, um lugar ou uma coisa
sobre a qual você armazena e mantém informações.
• Exemplos: fornecedor, peça.
• Atributos:
• Características específicas de cada entidade:
• Fornecedor: nome, endereço
• Peça: descrição, preço unitário, fornecedor
5.7
8. A abordagem de banco
de dados para gestão de dados
• Banco de dados relacional:
• Organizam os dados em tabelas bidimensionais (denominadas relações)
com colunas e linhas.
• Uma tabela para cada entidade:
• Exemplo: CLIENTE, FORNECEDOR, PEÇA, VENDAS
• Campos (colunas) armazenam dados que representam um atributo.
• Linhas armazenam dados para registros, ou tuplas.
• Campo-chave: identifica um registro de forma única.
• Chave primária:
• Um campo em cada tabela
• Não pode ser duplicada
• Funciona como uma identificação única para todas as informações
em uma linha
5.8
9. A abordagem de banco
de dados para gestão de dados
Tabela de banco de dados relacional
Um banco de dados relacional organiza os dados na forma de tabelas
bidimensionais. Temos aqui uma tabela para a entidade
FORNECEDOR e vemos como ela representa a entidade e seus
atributos. Número_Fornecedor é o campo-chave.
5.9
10. A abordagem de banco
de dados para gestão de dados
A tabela PEÇA
Dados da entidade
PEÇA têm sua própria
tabela individual.
Número_Peça é a
chave primária e
Número_Fornecedor é
a chave estrangeira,
que permite aos
usuários achar, na
tabela FORNECEDOR,
informações correlatas
sobre o fornecedor de
cada peça.
5.10
11. A abordagem de banco
de dados para gestão de dados
• Estabelecendo relacionamentos
• Diagrama entidade/relacionamento
• Usado para esclarecer relações entre as tabelas de um banco de
dados relacional.
• Tabelas de um banco de dados relacional podem apresentar
relacionamentos:
• Um-para-um
• Um-para-muitos
• Muitos-para-muitos
• Demanda a criação de uma tabela (tabela concatenada ou
relação de intersecção) que interliga as duas tabelas e
concatena informações.
5.11
12. A abordagem de banco
de dados para gestão de dados
Um diagrama entidade/relacionamento básico
Este diagrama mostra a relação entre as
entidades FORNECEDOR e PEÇA.
5.12
13. A abordagem de banco
de dados para gestão de dados
• Normalização
• Processo de simplificar grupos complexos de dados a fim de:
• minimizar elementos de dados redundantes;
• minimizar relações muitos-para-muitos inadequadas; e
• aumentar a estabilidade e a flexibilidade.
• Regras de integridade referencial
• Usadas pelos bancos de dados para garantir que os
relacionamentos entre as tabelas permaneçam consistentes.
• Exemplo: quando uma tabela possui uma chave estrangeira que
aponta para outra tabela, você pode só conseguir incluir um
registro na tabela com a chave estrangeira se houver um
correspondente na tabela relacionada.
5.13
14. A abordagem de banco
de dados para gestão de dados
Amostra de relatório de pedido
As áreas sombreadas mostram quais dados vêm das tabelas FORNECEDOR, PEDIDO e
ITEM. O banco de dados não mantém dados sobre Preço Total nem Pedido Total porque
eles podem ser derivados a partir de outros dados das tabelas.
5.14
15. A abordagem de banco
de dados para gestão de dados
Projeto final do banco de dados com amostras de registros
O projeto final do
banco de dados
referente a
fornecedores,
peças e pedidos
tem quatro tabelas.
A tabela ITEM é
uma tabela
concatenada
que elimina a
relação muitos-
para-muitos entre
PEDIDO e PEÇA.
5.15
16. A abordagem de banco
de dados para gestão de dados
Diagrama entidade/relacionamento para o banco de dados de
quatro tabelas
Este diagrama mostra o relacionamento entre as
entidades FORNECEDOR, PEÇA, ITEM e PEDIDO.
5.16
17. Sistemas de gestão
de banco de dados
Sistema de gestão de banco de dados
(database management system — DBMS)
• Tipo específico de software para criação, armazenamento,
organização e acesso a dados de bancos de dados
• Separa as visões lógica e física dos dados
• Visão lógica: como os usuários finais veem os dados
• Visão física: como os dados estão, de fato, estruturados e organizados
• Exemplos de DBMS: Microsoft Access, DB2, Oracle Database, Microsoft
SQL Server, MySQL
5.17
18. Sistemas de gestão
de banco de dados
Banco de dados de recursos humanos com múltiplas visões
Um único banco de dados de recursos humanos oferece muitas visões dos dados, conforme
as necessidades de informação do usuário. Exemplificamos aqui duas visões possíveis, uma
que interessa a um especialista em benefícios, e outra que interessa a um funcionário do
departamento responsável pela folha de pagamentos da empresa.
5.18
19. Sistemas de gestão
de banco de dados
Operações de um DBMS relacional
• Select:
• Cria um subconjunto de todos os registros que atendam a um critério.
• Join:
• Combina tabelas relacionais de modo a apresentar ao servidor um
número maior de informações do que o disponível em tabelas individuais.
• Project:
• Cria um subconjunto formado por colunas de uma tabela
• Permite que o usuário crie novas tabelas contendo somente as
informações desejadas.
5.19
20. Sistemas de gestão
de banco de dados
As três operações básicas de um DBMS relacional
As operações select, project e join (selecionar, projetar e vincular)
permitem que dados de duas tabelas diferentes sejam combinados e
que apenas os atributos selecionados sejam apresentados.
5.20
21. Sistemas de gestão
de banco de dados
Recursos dos sistemas de gestão de banco de dados
• Definição de dados:
• Especifica a estrutura do conteúdo do banco de dados.
• Dicionário de dados:
• Arquivo automático ou manual que contém a definição dos elementos de
dados e suas características.
• Consulta e relatório:
• Linguagem de manipulação de dados
• Linguagem estruturada de consulta (SQL)
• Ferramentas para construção de consultas do Microsoft Access
• Geração de relatório. Exemplo: Crystal Reports
5.21
22. Sistemas de gestão
de banco de dados
Recurso de dicionário de dados do Access
O Microsoft Access traz um
recurso rudimentar de dicionário
de dados que apresenta
informações quanto a tamanho,
formato e outras características
de cada campo em um banco
de dados. Aqui, vemos as
informações mantidas na tabela
FORNECEDOR. O pequeno
ícone representando uma
chave, à esquerda de
Número_Fornecedor indica que
se trata de um campo-chave.
Figura 5.9
5.22
23. Sistemas de gestão
de banco de dados
Exemplo de uma consulta SQL
Vemos aqui os comandos SQL para uma consulta que selecionará
fornecedores das peças 137 ou 150. Eles produzem uma lista com os
mesmos resultados da Figura 5.8.
5.23
24. Sistemas de gestão
de banco de dados
Uma consulta no Access
Vemos aqui como a
consulta da Figura
ao lado seria
elaborada com as
ferramentas de
formulação de
consultas do Access.
A tela mostra as
tabelas, os campos e
os critérios de
seleção usados para
a consulta.
5.24
25. Sistemas de gestão
de banco de dados
Bancos de dados orientados a objeto (OODBMS)
• Armazena dados e procedimentos como se fossem objetos que
podem ser automaticamente extraídos e compartilhados.
• Mais indicados para o armazenamento de objetos gráficos,
desenhos e vídeos do que o DBMS projetado para a estruturação
de dados.
• Usados para gerenciar os vários componentes multimídia ou
applets Java utilizados em aplicativos da Web.
• Relativamente lentos se comparados aos DBMSs relacionais.
• DBMSs relacionais orientados a objeto: oferecem recursos de
DBMSs orientados a objeto e relacionais.
5.25
26. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
• Os bancos de dados oferecem informações que ajudam a empresa na
administração mais eficiente do negócio, e ajuda os administradores e
empregados a tomar melhores decisões.
• Ferramentas para análise de grandes volumes de dados:
• armazenamento de dados (data warehousing);
• análise de dados multidimensional;
• mineração de dados (data mining); e
• utilização de interfaces Web com os bancos de dados.
5.26
27. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Armazéns de dados
• Armazém de dados (data warehouse):
• Banco de dados que armazena dados correntes e históricos de
potencial interesse para os tomadores de decisão de toda a empresa.
• Consolida e padroniza as informações oriundas de diferentes bancos
de dados operacionais e de transações.
• Os dados podem ser acessados, mas não podem ser alterados.
• Repositório de dados (data mart):
• Subconjunto de um armazém de dados altamente focalizado dos
dados da organização é colocado em um banco separado destinado a
uma população específica de usuários.
5.27
28. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Componentes de um data warehouse
Dados correntes e históricos
são extraídos de sistemas
operacionais internos à
organização. Esses dados são
combinados com dados de
fontes externas e
reorganizados em um banco
central projetado para análise
gerencial e produção de
relatórios. O diretório de
informações fornece aos
usuários informações sobre os
dados disponíveis no data
warehouse.
5.28
29. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Seção interativa: Organizações
A Receita Federal descobre fraude nos impostos
com data warehouse
• Leia a Seção interativa e discuta as seguintes questões:
• Por que era tão difícil para a Receita Federal analisar os dados coletados
dos contribuintes?
• Quais desafios a Receita Federal encontrou durante a implementação de
seu data warehouse de compliance?
• De que maneira o CDW aprimorou a tomada de decisão e as operações
na Receita Federal? Existem benefícios aos contribuintes?
• Você acha que os armazéns de dados poderiam ser úteis em outras
áreas do setor federal? Quais? Explique.
5.29
30. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Inteligência empresarial, análise multidimensional de
dados e mineração de dados
• Inteligência empresarial: ferramentas que consolidam, analisam e
acessam vastas quantidades de dados para ajudar os usuários a decidir
melhores escolhas empresariais.
• Softwares para consulta e relatórios de bancos de dados
• Ferramentas para análise multidimensional de dados
• Mineração de dados
• Exemplo: a Harrah’s Entertainment coleta e analisa dados de clientes
para criar um perfil de apostas e identificar os clientes mais lucrativos.
5.30
31. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Inteligência empresarial
Uma série de ferramentas
analíticas trabalha com os
dados armazenados nos
bancos de dados,
encontrando padrões e
insights que ajudam
gerentes e funcionários a
tomar melhores decisões
e, assim, aprimorar o
desempenho
organizacional.
5.31
32. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Processamento analítico on-line
(on-line-analytical processing — OLAP)
• Permite a análise multidimensional de dados, de forma que os usuários
vejam os mesmos dados de diferentes maneiras, pois usa múltiplas
dimensões
• Cada aspecto da informação — produto, preço, custo, região ou
período de tempo — representa uma dimensão diferente.
• Exemplo: comparação das vendas da região leste em junho com as
vendas de maio e junho do ano anterior.
• Permite que os usuários obtenham respostas on-line sobre questões
específicas em velocidade razoável
5.32
33. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Modelo multidimensional de dados
A visão mostrada é
produto x região.
Girando o cubo 90 graus,
a face que aparecer
mostrará produto x
vendas projetadas e reais.
Girando novamente o
cubo 90 graus, pode-se
ver região x vendas reais
e projetadas. Outras
visões também são
possíveis.
5.33
34. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Mineração de dados
• Descobre padrões e relacionamentos ocultos em grandes bancos de
dados e infere regras a partir deles para prever comportamentos
futuros.
• Tipos de informações obtidas a partir de mineração de dados:
• Associações: ocorrências ligadas a um único evento.
• Sequências: eventos estão ligados ao longo do tempo.
• Classificações: padrões que descrevem o grupo ao qual o item
pertence.
• Aglomerações: semelhante à classificação quando ainda não foram
definidos grupos.
• Prognósticos: partem de uma série de valores existentes para prever
quais serão os outros valores.
5.34
35. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Mineração de dados
• É comum usar mineração de dados para analisar detalhadamente padrões
em dados sobre consumidores e, a partir disso, montar campanhas de
marketing um-a-um ou identificar clientes lucrativos.
• Análise preditiva:
• Usa técnicas de mineração de dados, dados históricos e suposições
sobre condições futuras para predizer resultados de eventos, tais como
a probabilidade de um cliente responder a uma oferta ou comprar um
produto específico.
• Mineração de dados versus questões de privacidade
• Usado para criar uma imagem de dados detalhada para cada indivíduo.
5.35
36. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
• Mineração de texto (text mining)
• Dados não estruturados, em sua maioria na forma de arquivos de texto,
representam mais de 80% das informações úteis de uma empresa.
• A mineração de texto permite que as empresas extraiam elementos-
chave de grandes conjuntos de dados não estruturados, descubram
padrões e relacionamentos e resumam informações.
• Mineração na Web (web mining)
• Descoberta e análise de padrões e informações úteis na World Wide
Web.
• Mineração de conteúdo, de estrutura e de uso.
5.36
37. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Bancos de dados e a Web
• As empresas estão usando a Web para disponibilizar algumas
informações de seus bancos de dados internos a clientes e parceiros de
negócios.
• O middleware e outros softwares viabilizam essa possibilidade.
• servidor Web;
• servidor de aplicativo ou CGI; e
• servidor de banco de dados.
• Interfaces da Web promovem a familiaridade com os usuários e
permitem a economia no reprojeto e reconstrução de um sistema legado.
5.37
38. Como usar bancos de dados para
melhorar o desempenho e a tomada
de decisão na empresa
Ligando bancos de dados internos à Web
Usando seus PCs e software de navegação da Web, os
usuários acessam o banco de dados interno de uma
organização por meio da Internet.
5.38
39. Gestão dos recursos de dados
Estabelecendo uma política de informação
• Política de informação
• Especifica as regras para compartilhar, disseminar, adquirir, padronizar,
classificar e inventariar a informação.
• Administração de dados
• Responsável pelas políticas e procedimentos específicos pelos quais as
informações podem ser gerenciadas como recurso organizacional.
• Gestão de banco de dados
• Grupo de gestão e projeto de bancos de dados dentro da divisão
corporativa de sistemas de informação responsável por definir e
organizar a estrutura e o conteúdo do banco de dados, e também por
sua manutenção.
5.39
40. Gestão dos recursos de dados
Assegurando a qualidade de dados
• Baixa qualidade de dados: principal obstáculo para a gestão bem-sucedida
do relacionamento com o cliente.
• Problemas na qualidade de dados: causados por
• dados redundantes e inconsistentes produzidos por diferentes sistemas;
• erros na entrada dos dados.
• Auditoria de qualidade de dados: levantamento estruturado da precisão e
do nível de integridade dos dados.
• Limpeza de banco de dados (data cleansing): detecta e corrige, dentro do
banco de dados, informações incorretas, incompletas, formatadas
inadequadamente ou redundantes.
5.40
41. Gestão dos recursos de dados
Seção interativa: Pessoas
Erros no bureau de Crédito — Problemas de gente grande
• Leia a Seção interativa e responda as seguintes questões:
• Avalie o impacto sobre os negócios dos problemas de qualidade dos
dados das agências de crédito.
• Existem questões éticas levantadas pelos problemas de qualidade dos
dados das agências de crédito? Explique.
• Analise os fatores humanos, organizacionais e tecnológicos responsáveis
pelos problemas de qualidade dos dados das agências de crédito.
• O que pode ser feito para resolver esses problemas?
5.41
Editor's Notes
Peça aos alunos que façam uma lista de todos os bancos de dados que utilizam ou com os quais interagem. A ideia é conscientizá-los sobre a ubiquidade e a importância dos sistemas de manutenção de registros (bancos de dados). Os bancos de dados são o coração do profissional de SIG.
Pergunte aos alunos se já viram erros em bancos de dados. Uma identidade equivocada, um endereço errado, um saldo incorreto em um extrato. Por que os erros de dados são tão importantes para as empresas? E para os indivíduos?
Em uma era de crescimento corporativo não orgânico, na qual as empresas crescem por meio da aquisição de outras empresas, as organizações empresariais rapidamente se tornam uma coleção de centenas de bancos de dados, sistemas de e-mail, sistemas de pessoal, sistemas contábeis e sistemas de manufatura e a comunicação entre eles é impossível. Tal situação cria uma demanda por bancos de dados integrados poderosos que possam organizar o caos.
Peça aos alunos que identifiquem as entidades e os atributos de uma faculdade. Dentre as entidades podem estar alunos, professores, salas de aula, prédios, administradores etc. Os atributos podem ser nome, endereço, cargo, turmas nas quais já trabalhou etc.
Os gráficos deste slide e do próximo ilustram duas tabelas em um DBMS. Pergunte aos alunos quais são as entidades apresentadas nos slides. O campo-chave na tabela Fornecedor é o número do mesmo. Qual a finalidade desse campo?
Este slide mostra a segunda parte do gráfico do slide anterior. Observe que a chave estrangeira nesta tabela é a chave primária na tabela Fornecedores. Qual a finalidade da chave estrangeira? Múltiplos registros podem ter a mesma chave estrangeira?
Este slide descreve as atividades envolvidas no projeto de um banco de dados. Para criar um banco de dados eficiente, é preciso saber quais os relacionamentos entre os diversos elementos de dados, os tipos de dados a serem armazenados e de que maneira a empresa precisará gerenciar os dados. Observe que o projeto de banco de dados conceitual preocupa-se com a forma como os elementos de dados serão agrupados, ou seja, com qual organização de dados nas tabelas fará com que a organização se torne mais eficiente.
Este gráfico mostra um exemplo de um diagrama de entidade-relacionamento. Ele mostra que uma entidade PEDIDO pode conter muitos ITEM. (Uma PEÇA pode ser solicitada muitas vezes e aparecer muitas vezes como uma linha de item em um único pedido.) Cada ITEM pode conter somente uma PEÇA. Cada PEÇA pode pertencer a somente um FORNECEDOR, mas, mais de uma PEÇA podem ser fornecidas pelo mesmo FORNECEDOR.
Um dos bancos de dados de código-fonte aberto mais populares é o MySQL (comprado pela SUN Computer, mas que agora pertence à Oracle). Visite o site http://www.mysql.com/customers/ durante a aula para mostrar algumas empresas que utilizam o MySQL. Esse sistema gerenciador de banco de dados não é tão sofisticado quanto os sistemas de bancos de dados integrados, mas atendem às necessidades de muitas empresas.
Este gráfico ilustra o que significa oferecer diferentes visões lógicas dos dados. Os retângulos à direita representam duas visões distintas em um banco de dados de RH: uma para rever benefícios dos empregados e outra para acesso aos registros da folha de pagamento. O cilindro pode ser considerado como a visão física que mostra como os dados estão, de fato, organizados e armazenados no meio físico. Os dados físicos não são alterados, mas um DBMS pode criar muitas visões lógicas diferentes que se adéquem a diferentes necessidades dos usuários.
Este gráfico ilustra o resultado da combinação das operações de select , join e project para a criação de um subconjunto de dados. A operação SELECT recupera somente as peças da tabela PEÇA cujo atributo Número_Peça seja 137 ou 150. A operação JOIN utiliza a chave estrangeira Número_Fornecedor armazenada na tabela PEÇA para localizar dados de fornecedores na tabela FORNECEDOR somente para os registros resultantes da operação SELECT. Por fim, a operação PROJECT define as colunas a serem exibidas; neste exemplo, Número_Peça, Descrição_Peça, Número_Fornecedor, Descrição_Fornecedor.
Uma função importante dos bancos de dados é formalizar definições comuns de entidades e atributos, como o que é um ano fiscal, como descrever a data de contratação e como definir “localização da empresa”. Em ambientes que antecedem o do banco de dados, e até mesmo em empresas globais, essas definições variam de um lugar para outro.
Este gráfico mostra o recurso de dicionário de dados do Microsoft Access. Para o campo Nome_Fornecedor, selecionado no topo do painel, as definições podem ser configuradas na guia “Geral”, no painel inferior. As características gerais são tamanho do campo, formato, máscara de entrada, legenda, valor padrão, regra de validação, texto de validação, requerido, permitir comprimento zero, indexado, compactação Unicode, modo IME, modo de frase IME e marcas inteligentes.
Este slide mostra um exemplo de uma declaração em SQL que poderia ser utilizada na recuperação de dados de um banco de dados. Neste caso, a declaração está recuperando os registros da tabela PEÇA, apresentada na Figura 5.6, cujo atributo Número_Peça seja igual a 137 ou 150. Peça aos alunos que definam o que cada parte da declaração está fazendo. (Por exemplo, a declaração diz que sejam exibidas as colunas Número_Peça, Descrição_Peça, Número_Fornecedor, Nome_Fornecedor armazenadas nas tabelas PEÇA e FORNECEDOR, quando as seguintes condições forem verdadeiras...)
Este gráfico ilustra uma consulta no Microsoft Access que executa a mesma operação que a declaração em SQL do slide anterior. A parte inferior da tela mostra os campos requeridos (Campo), as tabelas relevantes (Tabela), os campos a serem mostrados no resultado (Mostrar) e os critérios utilizados para seleção – Número_Peça igual a 137 ou 150 (Critérios).
Os bancos de dados modernos podem armazenar enormes volumes de informação. O PhotoBucket, por exemplo, possui 80 bilhões de fotos armazenadas! Extrair informações significativas de um volume tão grande de dados é um desafio para os administradores. São necessárias ferramentas para organizar, analisar e descrever o que está acontecendo no mundo real com base nos dados.
Armazéns de dados e repositórios de dados são ferramentas que agrupam dados e os armazenam off-line em áreas nas quais eles podem ser analisados sem causar interferências nos sistemas de processamento de transações que produzem esses dados. Não fosse assim, a análise dos dados e os aplicativos de inteligência gerencial atrasariam o processamento das transações.
Este gráfico ilustra os componentes de um sistema de armazém de dados (data warehouse). Ele mostra que o armazém de dados obtém dados de múltiplas fontes, tanto internas quanto externas, e os transforma para os sistemas de armazém de dados conforme a necessidade. Para extrair informações significativas do armazém de dados, são necessárias ferramentas adicionais — como consultas e relatórios, processamento analítico on-line (OLAP) e mineração de dados. O diretório de informações oferece aos usuários informações sobre quais dados estão no armazém de dados.
O setor de hospitalidade é um dos usuários mais sofisticados de software de inteligência empresarial. Eles mantêm programas de recompensas e oferecem serviços especiais aos clientes fiéis como forma de otimizar a receita. Durante a aula, visite o site http://www.harrahs.com para ver como os clientes são atraídos com programas de recompensas e para descobrir quais serviços são oferecidos aos clientes fiéis. Os programas de fidelidade demandam altos investimentos em sistemas de bancos de dados e software de inteligência computacional.
Este gráfico ilustra o processo de transformação dos dados em inteligência empresarial. As ferramentas de inteligência empresarial não encontram, necessariamente, respostas claras, mas podem descobrir padrões e relacionamentos nos dados que podem ampliar sobremaneira a tomada de decisões e oferecer visões que viabilizem reflexões sobre o ambiente empresarial.
Este gráfico ilustra um cubo de dados composto por três dimensões: vendas reais/projetadas, produtos e regiões. É óbvio que o objetivo é tentar explicar as diferenças entre as vendas reais e as vendas projetadas através da análise de região e produto. Esse é um problema ideal para as tabelas dinâmicas do Excel, pois há duas variáveis categóricas (produto e região) e um intervalo.
Com a mídia falando em terrorismo a todo instante, você pode perguntar aos alunos como imaginam que os oficiais federais utilizam mineração de dados para identificar terroristas reais e potenciais. Se estivessem procurando por terroristas, por exemplo, que tipos de associações, sequências, classificações e aglomerações buscariam?
Este gráfico ilustra o percurso dos dados do banco de dados até o usuário através de um navegador. Peça aos alunos que descrevam os tipos de transformação que ocorrem entre os diferentes dispositivos. O que acontece com os dados, por exemplo, entre o banco de dados e o servidor de banco de dados?
Os bancos de dados são muito mais do que hardware e software. Na verdade, as partes mais complexas envolvem considerações de pessoas e organizacionais. Algumas vezes, as carreiras das pessoas e o destino de departamentos inteiros estão envolvidos com os dados que coletam. Quando você instala um DBMS, está potencialmente modificando quem coleta quais informações sobre quem, onde, quando e como.
Em geral, bancos de dados são coleções de dados sujos, ou seja, dados ambíguos, imprecisos ou incompletos. Antes que um DBMS possa ser instalado, costuma ser necessário limpar todos os dados antigos dos sistemas legados. O tamanho dos problemas de qualidade dos dados varia de um banco de dados a outro, mas os bancos de dados de crédito costumam apresentar uma taxa de problemas de qualidade de 25%, sendo 10% dos registros considerado errados. Pergunte aos alunos se conhecem exemplos nos quais um banco de dados estava errado com relação a uma pessoa ou entidade.