O documento discute as tendências e tecnologias emergentes em machine learning, incluindo como machine learning se conecta a temas como internet das coisas, cidades inteligentes e saúde. Também aborda conceitos como deep learning, aplicações de machine learning e desafios éticos emergentes.
2. Como ML se conecta aos
temas desse Big Data Week
Internet das Coisas
Segurança patrimonial
Edifícios inteligentes
Consumo de eletricidade
Monitoramento ativo em processos produtivos
Em Refinarias pode gerenciar flares e outras partes do processo
Quantified Self
Administração dos níveis glicêmicos para diabéticos
Monitoramento ativo e intervenção em pacientes de risco
Frequência cardíaca, arritmias
Smart Cities
Distribuição de água
Mobilidade urbana
Administração de áreas de risco
Prevenção de catástrofes naturais (deslizamento de terra, sismos, enchentes, tsunamis
etc)
5. • Google inicia projeto Google Brain com apoio do
professor Andrew NG, da Stanford University
• Google compra DeepMind (US$ 650-800 Milhões)
• Facebook forma sua equipe de Deep Learning liderada pelo
professor Yan LeCum, da New York University
• Netflix cria sua equipe de Deep Learning para melhorar
recomendações
• Yahoo compra Lookflow para adicionar inteligência ao Flickr
• Bill Gates diz que se tivesse 20 anos estaria estudando Deep
Learning
• New York Times monta equipe de Deep Learning para manter
assinantes
Alguns eventos recentes
6. Disposição de investimento
Senseta, uma empresa colombiana de Big Data,
venceu em 2013 o último rally da TNW.COM para a
América Latina. Competiu com outras 16 startups
Cloudera obteve US$ 900 Mil em investimento e
aliou-se a Intel em 2014
MongoDB captou US$ 150 Mil em 2013
http://thenextweb.com/voice/2013/08/29/and-the-winner-of-
tnws-startup-rally-in-latin-america-is-senseta/
7. Machine Learning
• Ramo da Inteligência Artificial
• algoritmo que a partir de uma experiência (E) resolve uma
tarefa (T) com uma regra de mensuração (M)
• A medida que resolve com sucesso a tarefa (T), através de
das regras de mensuração (M), melhora a sua experiência
(E)
• Tipos de aprendizado
• Supervisionado – Tipos de informação são ’explicados’
• Não supervisionado – ‘Aprende’ sozinho
• Semi supervisionado
• Recompensa
8. ML X algoritmos tradicionais
Machine Learning
Opera com uma base de
conhecimento
Infere uma resposta
comparando e mensurando
dados desconhecidos com
sua base de conhecimento
Conforme sua base de
conhecimento se ajusta
(fitting) as respostas se
tornam mais precisas. A
resposta muda
Tradicional
Regras predefinidas
Reage de acordo com o que
o desenvolveu programou,
sempre da mesma forma
diante dos dados (if/else)
Muda de reação aos dados
através de alterações no
código. (alto custo $)
9. Machine Learning - Aplicações
• Sistemas de recomendação (RecSys)
• Search Engine (Google Hummingbird / pageRank)
• Análise de Sentimento e Monitoramento de Redes Sociais
• Prevenção ao cancelamento de assinaturas (customer churn)
• Promoções e anúncios em tempo real (Omni Channel
Marketing)
• Visão de máquina
• Intepretação da linguagem natural (NLP)
• Classificação e categorização de textos e informações
• Diagnóstico de anomalias ou mudanças de padrões
10. Machine Learning
• A partir de um aprendizado prévio, o algoritmo dá uma
reposta sem intervenção humana:
• Timming Correto
• Efetiva
• Pertinente
• Adequada
• Inteligente
12. Deep Learning
• Uma nova geração de algoritmos de Machine Learning
• Deep neural networks, convolutional deep neural networks e deep
belief networks
• Em grande parte, evoluções do conceito de redes neurais que
funcionam imitando o funcionamento do cérebro humano e sua
rede de neurônios
• Algoritmos que aprendem sozinhos (não supervisionados)
• Resultados surpreendentes em:
• Processamento linguístico (interpretação de ambiguidades)
• Reconhecimento da fala
• Tradução
• Visão de máquina (expressões humanas, humor, sentimento)
• ‘Compreensão’ e interação com sistemas com regras finitas (jogo
pong ou games)
13. Ferramentas de modelagem e
formulação de algoritmos
R e Rstudio
Octave / MathLab
iPython (bibliotecas scikit learn, nltk, pandas etc.)
Gephi – Grafos e análise de redes – Open Source
Neo4J - Grafos e análise de redes –
Comercial/Comunidade
14. ML em Produção
Mahout: Biblioteca Open Source, faz parte do
ecossistema Hadoop (Java)
Spark Mlib: Open Source, faz ecossistema Spark (API
Scala, Java e Python)
GraphLab: Open Source e comercial (API para Python)
Prediction.IO: Open Source Machine Learning Server
(API)
Mortar é FreeMiun (SaaS - Freemium)
15. Favorecem Deep/Machine
Learning nesse momento
• Grandes volumes de dados para formar o aprendizado dos
modelos
• Fácil formação de clusters com computadores de prateleira
• Computação em nuvem e sua característica elástica
• Avanços em performance no harwdare com o uso de GPU-
Graphic Processor Unity, discos SSD, multíplos cores etc
• Ampla gama de softwares e ferramentas disponíveis com
muitas opções open-source
• Aprendizado (humano) on-line com Mooc’s, tutoriais,
comunidades etc
16.
17. Oportunidades Deep Learning
• Data Rental para treinamento de modelos (DaaS)
• Serviços de análise de base de clientes produzindo
acurados perfis e hábitos de consumo
• Pesquisas de sentimento e reação sensorial com
análise de expressões faciais
• Etc
18. Mercado no Brasil
Operação Chaordic na AWS
~5TB de Banco de Dados
Mais de 1 Bi requisições/mês na API
67 mil RPM – Black Friday
4 milhões de produtos
34 milhões de recomendações geradas/dia
27 milhões de usuários
250GB de DS comprimidos servidor/dia
19. Mercado no Brasil
..”Adam Burgh, da baby.com.br, revela que a empresa investe em um
sistema de inteligência e monitoramento das compras. Com essa
tecnologia, a loja procura se adiantar às necessidades de cada cliente.
"Estamos sempre coletando os dados para identificar o perfil da mamãe e
a idade do bebê. Se a mãe está comprando uma fralda 'G', conseguimos
saber que a próxima compra é uma cadeira de alimentação", conta.”
http://bit.ly/17Chl6d
21. Roadmap
• Criação de laboratórios de pesquisa e inovação
Estatísticos / Físicos / Astrônomos / Músicos
Engenheiros de software
Arquitetos de solução
Formação interna e criação de expertise
• Acompanhamento de papers e evolução do conceito no
meio acadêmico e comercial
22. Promessas do Deep Learning
Compartilhamento e transferência de atividades
intelectuais entre homem e máquina
Novos níveis de personalização da experiência do
consumidor
Novas oportunidades de ofertas, anúncios e promoções
Engajamento 2.0
A personalização das lojas físicas em função do seu
público
Personalização do ensino
24. Mais informações
Linkedin: Grupo Big Data e Machine Learning no Brasil
MOOC’s do Coursera
Machine Learning – Stanford – Andrew NG
Neural Networks for Machine Learning – Univ. Toronto
Computing for Data Analysis – Johns Hopkins University
Social Network Analysis – Univ. Michingan
Core concepts in Data Analysis – Higher School of Economics
Unicamp
UFSCar
Prof.: Estevam Rafael Hruschka Junior
(http://www2.dc.ufscar.br/~estevam/)
Rio de janeiro contratou a IBM para um projeto de Smart City (copa e jogos olímpicos)
Até 1977 – computadores centralizados (Main Frames)
1977 Lançamento do Apple II
1981 lançamento do IBM-PC
1990 – Com a Internet operações alcançam rapidamente escala mundial.
2010 – Explosão do big data, da Analise de dados, Cloud, respostas inteligentes (google, recSys,etc).
2020 – Aumento da inteligencia das máquinas
Google 2012 - 16,000 Processors Can Identify a Cat for 10 million thumbnails from YouTube videos
Deep Mind entra na area de search
ArthurSamuel(1959).MachineLearning:Fieldof study that gives computers the ability to learn without being explicitly programmed.
• TomMitchell(1998)Well-posedLearning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
Recsys – amazon, Chaordic,
A equipe da DeepMind veio para a área de Search Engine do Google
Cancelamento de assinaturas – Thew New york Times
The “brain” simulation was exposed to 10 million randomly selected YouTube video thumbnails over the course of three days and, after being presented with a list of 20,000 different items, it began to recognize pictures of cats using a “deep learning” algorithm.
Seriado Lie To me = Micro expressões faciais
Stephen Hawkings coloca novas questões éticas para a humanidade no desenvolvimento de sistemas inteligentes.