O documento apresenta informações sobre machine learning, incluindo: 1) uma breve definição de machine learning; 2) exemplos de técnicas como recomendações, classificação, clusterização e deep learning; 3) linguagens populares para machine learning como Python, R e Java/Scala.
2. ABOUT ME
• System Architect na Ericsson
• Engenheiro de Computação ITA 2003
• MBA Gerência de Projetos FGV 2008
• SCJA, SCJP 5, 6, SCBCD 5, SCDJWS 5
• EMC Data Science Associate
9. ERICSSON CONSUMERLAB
• 100.000 pessoas / 40 países
• https://www.ericsson.com/re
s/docs/2015/consumerlab/er
icsson-consumerlab-10-hot-
consumer-trends-2016-
report.pdf
10. O QUE É MACHINE LEARNING?
• A aprendizagem automática ou aprendizado de máquina (em
inglês: "machine learning") é um sub-campo da inteligência
artificial dedicado ao desenvolvimento de algoritmos e técnicas
que permitam ao computador aprender, isto é, que permitam
ao computador aperfeiçoar seu desempenho em alguma tarefa.
• Aprendizado de máquina – Wikipédia, a enciclopédia livre
• https://pt.wikipedia.org/wiki/Aprendizado_de_máquina
11.
12. O QUE CONSEGUIMOS FAZER?
• Recomendações
• Classificação
• Regressão
• Clusterização
• Extração de Regras
Dados numéricos, textos, fotos etc.
• Aprendizado Supervisionado
• Aprendizado Não supervisionado
• Aprendizado por reforço
• Deep Learning
21. LINGUAGENS
• Java, Python, R e Scala
• http://spectrum.ieee.org/computing/software/top-
programming-languages-tre
• http://www.infoworld.com/article/3049672/application-
development/which-freaking-big-data-programming-
language-should-i-use.htmlnds-the-rise-of-big-data
22. R
• “Uma linguagem para estatísticos feita por estatísticos”
• Excelente para análise de dados e construção de modelos
• Normalmente não usada em produção, apesar de possível
• Biblioteca: CRAN (Comprehensive R Archive Network)
23. PYTHON
• A linguagem mais popular em Machine Learning
• Menor curva de aprendizado para cientistas
• Quantidade impressionante de grandes frameworks: NumPy,
Theano, TensorFlow, scikit, Juypter/iPython
• Pode ser usado de forma secundária com outros frameworks
big data como Hadoop e Spark
24. JVM – JAVA E SCALA
• Plataforma principal dos principais frameworks de Big Data
• Apache Hadoop (MapReduce / HDFS), Spark (Streaming / Machine
Learning), Kafka, Storm, DeepLearning4J
• Plataforma amplamente usada no mundo corporativo
• Scala é uma das linguagens que mais cresce nesse segmento
• Twitter, Linkedin
25. SHOW ME THE CODE!
• Recomendação de Filmes
• https://databricks-training.s3.amazonaws.com/movie-
recommendation-with-mllib.html