O documento discute os principais tópicos relacionados a Business Intelligence, Big Data, NoSQL, Data Mining e Business Analytics. Ele fornece definições e exemplos destes conceitos, discute as tendências atuais e como esses campos estão interligados para extrair conhecimento dos dados e apoiar a tomada de decisão nas organizações.
3. Business Intelligence
"Um termo guarda-chuva que encobre ferramentas,
arquiteturas, metodologias, bancos de dados, etc.
integradas em um suíte de software"
(Turban et al., 2007 apud Chee, 2009)
● Objetivos
○ Auxiliar o processo de tomada de decisão gerencial;
○ Gerar Diferencial competitivo;
4. Business Intelligence
● ERP - Enterprise Resource Planning
● DSS - Decision Support Systems
● EIS - Executive Information Systems
● CRM - Customer Relationship Management
6. O macro processo da informação
Sistemas de
DADOS Produção DADOS BD
OLTP Operacional
Clientes Funcionários
CICLO DO BI
Ofertas Planejamento
Promoções Metas
etc Promoções
CONHECIMENTO
Relatórios
Gerentes Cubos Data
INFORMAÇÃO INFORMAÇÃO
Dashboards Warehouse
Data Mining
DECISÃO
7. O macro processo da informação
Sistemas de
DADOS Produção DADOS BD
OLTP Operacional
Clientes Funcionários
Ofertas Planejamento
Promoções Metas
etc Promoções
CONHECIMENTO
Relatórios
Gerentes Cubos Data
INFORMAÇÃO INFORMAÇÃO
Dashboards Warehouse
Data Mining
DECISÃO
8. Business Intelligence
● KPI - Key Performance Indicators
● Data Warehouse
● Integration Process / ETL
● Reporting
● OLAP
● Dashboards
9. Processo Pentaho
BI Server Data
Warehouse
Clientes
R
E
Q
U
I
S PDI
T
O
S
PRD
Schema BD
Workbench Operacional
Analistas de BI
Spoon
10. Processo Pentaho
SGDB
Servidor de Aplicação BD
Clientes Operacional
BI Server
PUC JReport Data
R Warehouse
E Documentos
Q PAC JPivot
U
I CDE Repositorios
S Meta Dados
T PDI
O PAN, KITCHEN, Web
S Mondrian CARTE
FERRAMENTAS ADMINISTRATIVAS
Analistas PRD PME PDI
PSW SPOON PDS CDE PAD
de BI
12. Business Intelligence
● Data Warehouses
○ (Inmon, 2002) e (Kimball, 2002)
○ Conjunto de dados orientado à assunto, integrados,
não voláteis, variáveis em relação ao tempo;
○ Dados agregados/sintetizados;
○ Estruturado;
13. Business Intelligence
● De onde vêm os dados?
○ ERP's
○ Planilhas
○ Arquivos de Texto
○ Em sua maioria os dados são estruturados
16. Business Intelligence
● Novas fontes de dados
○ Monitoramento da marca;
○ Monitoramento de campanhas de marketing;
○ Relacionamento com o consumidor;
○ Análise de tendências;
17. Business Intelligence
● Novas fontes de dados
○ Dados estruturados/semi estruturados e não
estruturados;
○ Fluxo contínuo;
○ Alta dimensionalidade;
○ Esquema flexível;
20. Big Data
● Buzzword da moda...
● Quando o tamanho do dados faz parte do
problema!
● Alta Dimensionalidade
○ Entidades / Atributos / Instâncias
21. Big Data
● 4 V's (Stapleton, 2011)
○ Volume
■ Terabytes para Petabytes de dados
○ Velocidade
■ Fluxo contínuo e rápido de novos dados
○ Variedade
■ Dados estruturados, semi e não estruturados
○ Veracidade
■ Governança de dados e qualificação entre
Consistente, Inconsistente, Incompleto, Ambíguo, ...
23. Big Data
● Exemplos
○ Social Media
○ Web Logs
○ Sensor Networks
○ Cadeias de DNA
○ LHC
24. Big Data
● SGBD's relacionais (Codd, 1970) têm
capacidade de lidar com esse problema?
● ACID x BASE (Pritchett, 2008)
● Teorema CAP (Brewer, 2000)
○ Consistency / Availability / Partition Tolerant
○ Escolha apenas 2!
25. NoSql
● Esquemas de dados não relacionais
○ Key-Value Store
○ Document Store
○ Graph Databases
○ Wide Column / Column Oriented
○ ...
32. Data Science
● Indo além do KDD...
● Espectro mais amplo do que o KDD;
● Enquando a DM é uma metodologia
específica, a DS é a aplicação do método
científico
34. Data Science
● Banco de Dados
● Simulação
● Inteligência Artificial
● Otimização
● Inferência Estatística
● Análise Multivariada
● Séries Temporais
● ...
35. Data Science
● Descritive
○ Descreve e modela os dados
● Diagnostic
○ Identifica uma ou mais CAUSAS nos dados
● Preditive
○ Modela as tendências apontadas pelos dados
● Prescritive
○ Indica a melhor tendência a seguir
36. Business Analytics
● Data Science dentro do Business Intelligence
● O BI tem um foco mais informativo e
descritivo;
○ Acompanhamento da situação do negócio
● O BA tem um foco mais preditivo e
diagnóstico;
○ Projeção do negócio
37. BI vs BA
Business Intelligence Business Analytics
Relatórios Projeções
Métodos Gráficos Modelos
Indicadores Cenários
O que aconteceu? Por que aconteceu?
Quando ? Acontecerá
novamente?
Perguntas Onde?
Quando?
Como?
O que mais poderá
Quem? acontecer?
39. Tendências
● Genética
● Séries Espaço-Temporais
○ Trajetórias
○ Wireless Sensor Networks
● Data Warehouses Multimídia
● Ubiquitous
● Real Time Analysis
40. Conclusão Intelligence
ERP's
Data
Warehouse
Logs
Arquivos
E-mail Big Data Analytics
NoSQL
Web
Social
Media
INFORMAÇÃO
DADO CONHECIMENTO
41. Referências
● Azevedo, A.; Santos, M.F. KDD, SEMMA, and CRISP-DM: A Parallel Overview.
Proceedings of the IADIS European Conference on Data Mining, Amsterdam,
2008, pp. 182-185. Disponível em http://recipp.ipp.pt/handle/10400.22/136.
Acesso em 28/01/2013.
● Brewer, Eric A.: Towards Robust Distributed Systems. Portland, Oregon, July
2000. – Keynote at the ACM Symposium on Principles of Distributed Computing
(PODC). Disponível em http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC-
keynote.pdf Acesso em 27/01/2013.
● Chapman, P. et al. CRISP-DM 1.0 - Step-by-step data mining guide. 2000.
Disponível em http://www.crisp-dm.org/CRISPWP-0800.pdf. Acesso em
27/01/2013.
● Chee, Timothy; Chan, Lee-Kwun et al. Business Intelligence Systems: State-of-
the-art review and contemporary applications. In Symposium on Progress in
Information & Communication Technology 2009. p. 96-101.
● Codd, Edgar F.: A Relational Model of Data for Large Shared Data Banks. In:
Communications of the ACM 13 (1970), June, No. 6, p. 377–387
● Dean, J. and Ghemawat, S. MapReduce: simplified data processing on large
clusters. Communications of the ACM. p. 107-113. 2008.
42. Referências
● Fayyad, U. M. et al. From data mining to knowledge discovery: an overview.
In Fayyad, U. M.et al (Eds.), Advances in knowledge discovery and data mining.
AAAI Press / The MIT Press.
● Fayyad, U. and Piatetsky-Shapiro, G. and Smyth, P. The KDD process for
extracting useful knowledge from volumes of data. Communications of the
ACM v. 39, n. 11, p. 27-34. 1996.
● Inmon, W.H. Building the data warehouse. J. Wiley. 2002.
● MacVittie, Lori. The Four V’s of Big Data. Disponível em https://devcentral.f5.
com/blogs/us/the-four-v-rsquos-of-big-data. Acesso em 27/01/2013.
● Pritchett, Dan. BASE: An ACID alternative. ACM Queue. 2008. Disponível em
http://queue.acm.org/detail.cfm?id=1394128. Acesso em 27/01/2013.
● Kimball, R.; Ross, M. et al. The data warehouse toolkit: the complete guide to
dimensional modelling. New York: 2002.
● SAS Institute. SAS Enterprise Miner – SEMMA. Disponível em http://www.sas.
com/technologies/analytics/datamining/miner/semma.html. Acessado em
27/01/2013.
● Stapleton, Lisa K. Taming big data. Disponível em http://www.ibm.
com/developerworks/data/library/dmmag/DMMag_2011_Issue2/BigData/index.
html?cmp=dw&cpb=dwinf&ct=dwnew&cr=dwnen&ccy=zz&csr=051211. Acesso
em 27/01/2013.