O documento introduz o conceito de machine learning, definindo-o como um método de análise de dados que permite que computadores encontrem padrões ocultos nos dados sem programação explícita. Explica os conceitos de regressão e classificação usando exemplos práticos de previsão de peso de gado e análise de sentimento em texto.
2. Quem sou?
● Rubens Pinheiro
● Bacharel em Ciências da Computação (UECE)
● Desenvolvedor Front End
● Entusiasta Python
● Sempre aprendendo!
3. Sobre a apresentação
● Introdução
● Ideia e definição básica sobre machine learning
● Exemplo prático
● Regressão
● Classificação
● Ferramentas
● Dúvidas
4. O que é?
“Aprendizagem de máquina é um método de análise de
dados que automatiza a construção de modelos analíticos.
Usando algoritmos que iterativamente aprendem a partir de
dados, o aprendizado de máquina permite que os
computadores encontrem 'insights' ocultos sem ser
explicitamente programados para onde olhar.” - SAS
6. Francis Galton
Vox Populi - 1907
543,4 Kg
552kG
510kG
490kG
Média de 787 tickets547,4 Kg
Menos de 1% de erro!
Paper disponível em: http://galton.org/essays/1900-1911/galton-1907-vox-populi.pdf
7. Quanto mais experiência, mais próximo do acerto
543,4 Kg
552kG510kG
490kG
Dados baseado em experiência!
11. Treinando o modelo
Dados de
aprendizado
400 Kg
Todas vaquinhas tem o valor de nosso
“prediction target”, que é o peso.
Importante:
Durante o treino são utilizados como referências,
features dos “dados” (as vacas), como a raça da
vaca, sua idade, se está prenha, além de outros
aspectos que podem ser externos, como a época do
ano ou o bioma local. Pode ser usado tudo que
influencie no nosso target, o peso.
18. Soma do quadrado residual (RSS)
yi` (Valor previsto)
yi (Valor real)
Resíduo/Erro
Target
Feature
19. E daí?
● O que queremos?
– Minimizar o erro → Min(RSS)
● Como fazermos?
– Derivando o RSS
Tendo que a derivada da soma residual dos quadrados ...
… dará a função de previsão f(x)` = ax + b
30. Testando o modelo (erro)
ruim
-2
Eu com esse carro? Pense em
uma vida ruim...
Pontuação total: -2 (Negativo)
5 estrelas
ERRO
Corrige o modelo
(Recalculo da pontuação das palavras)
31. Testando o modelo (erro)
páia
-2
Eu com esse carro? Pense em
uma vida ruim...
Pontuação total: -2 (Negativo)
5 estrelas
ERRO
32. Outras técnicas de classificação
● Decision Trees
● Clustering
● Deep learning