SlideShare a Scribd company logo
1 of 40
Ya eres parte de la evolución
Solid Day
#MachineLearning para
Organizaciones
Jesus Ramos
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos
#sgnext
Y éste qué?
- Ingeniero de Software de nacimiento (ITESM).
- Econometrista Financiero por azar (Unottingham +
UWashington).
- Estadístico Computacional por convicción (Coursera, a mucha
honra).
- Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc)
para levantar sus capacidades analíticas.
- Co fundador de @TheDataPub, comunidad dedicada a reventar
la burbuja y detener el tren del m*** del ML y del Pig Data.
- Gamer los sábados (PSN: xuxoramos).
- Foodie los domingos.
En qué ando?
Lo feo del
#MachineLearning…
#MachineLearning Bubble
Machine
Learning
Montaña rusa sin freno…
$232mmdd
Gran Inversión
4%
Stats/Maths/Prog
Poco skill Mala cultura
Governance:
Datos rehenes
de cabal de IT
…y sin cinturón!
El freno para esta montaña
rusa…
Roadmap+Riesgos para la
banda
Skill
Si eres dev,
métele a stats+maths.
Si eres de maths+stats,
métele a dev.
Biz Intimacy
Olvídate de la
Herramienta.
Enfócate en el
lenguaje de negocio.
Operational
No entregues reportes,
entrega APIs.
Sin contexto
==
Hacer la pregunta
equivocada
No hay
escalamiento
Mala predicción +
Alto sesgo
==
Perder dinero/
lastimar personas
Etapa
Riesgo
Roadmap+Riesgos para orgs
Etapa
Riesgo
DWH
Todos los datos
en 1 solo lugar.
Gov’nance
Total apertura y
con conexiones
SelfServ-BI
Que gente de negocio
se sirva reportes sola.
Mayor sesgo
+
sin
observer
effect
DataScience
==
Reporteo/BI
Correlación
==
Causalidad
Cómo desaceleramos?
Con definiciones (ni peiper).
#MachineLearning para todos
SW Dev
Máquina
(de estados, no la
compu)
Datos
Función/
Programa
Salida
Machine/Statistical Learning Supervisado
Máquina
(de estados, no la
compu)
Salida*
Datos
Función/
Programa**
Contexto
Contexto
* No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
#MachineLearning para todos
Objetivo 1: identificar patrones
Error Total
#MachineLearning para todos
Objetivo 2: reducir el error de la función
Error de Predicción
Error del Fenómeno
(Varianza)
Sesgo/Bias
Reducción: más/menos
variables
Reducción: más datos/
observaciones.
Reducción:
CONTEXTO!
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Varianza vs Sesgo
#MachineLearning para todos
Tipos: Clasificación
#MachineLearning para todos
Tipos: Regresión
#MachineLearning para todos
Tipos: Clustering == Clasificación Sin Output
#MachineLearning para todos
Tipos: Dimensionality Redux/Feature Engineering
#MachineLearning para todos
Y cuál uso?
(Los que me den menos varianza y menos bias)
#MachineLearning para todos
Metodología
Describir
Qué me parece
interesante de
mi dataset?
Explorar
Qué research
question quiero
Hacerle a mi
dataset?
Inferir
La respuesta
puede
generalizarse?
Predecir
La respuesta
aplica a nuevas
observaciones?
- Distribuciones
- Media
- Moda
- Kurtosis
- Clustering
- Kohonen
- DBSCAN
- Multidim
Scaling
- Hypo Test
- GLM
- ANOVA
- MSE
- Random
Forest
- Boosting
- Bagging
- Deep
Learning
ML ML
Cross Validation
Data
Training Test Validation
70% 20% 10%
N veces: TestValidation TestValidation TestValidation
Ya le quitamos el m*me al
tren. Ahora...?
Aplicaciones!
B*n*m*x
• Conversión de cliente de nómina a TC en 29%.
• $2.7mmdp en revenue al año desde 2010.
• Cómo lo hizo?
• Clasificación!
f(edad, género, monto, antigüedad, …) = tiene TC
Predictores / variables independientes variable respuesta /
dependiente
UPS
• Ahorro de combustible haciendo que camiones
sólo den vuelta a la derecha.
• Ahorro de $47mdd al año.
• Cómo lo hicieron?
• Diseño de experimentos!
Exploratorio -> Recolección de datos -> Hypothesis
Testing -> GLMs -> Clasificación
T*lc*l
• Identificación de usrs consumiendo $7K MXN
semanales de tiempo aire en prepago.
• Creación de producto de crédito de tiempo aire
de hasta $2K.
• $4mmdp al año de revenue.
• Cómo lo hicieron?
• Clustering!
Multidimensional Scaling + K-means/DBSCAN
Western Union
• Prevención de fraude en remesas en
automático y personalizado.
• $32mdd en ahorro operativo en 2012. $21mdd
son de transacciones detenidas al momento.
• Cómo le hicieron?
• Clasificación!
• Similar a algoritmos de spam/ham.
Gr*p* *xp*ns**n
• Bajar bounce rate y mantener al visitante en
sitios de las marcas del grupo.
• Aumentar ad impressions.
• Cómo lo están haciendo?
• Recommender Systems!
Clasif 1 + Clasif 2 + … + Clasif N
Qué
música
prefiere?
Qué
comida
prefiere?
Qué
pelis
ha visto?
Y las startups?
En la delantera!
• Konfio, Kueski, Prestadero + ensemble
learning = credit scoring.
• Piggo + multidimensional scaling + DBSCAN =
recomendación de inversiones.
• Klustera + Filtros Kalman (un tipo de
regresión) = ubicación exacta de gente en
centros comerciales.
• HolaGus + deep convolutional neural networks
= clasificación de texto.
Caso interesante: FullHarvest
• Time Series de granjas y huertos en tiempo de
cosecha.
• Clasificación para planeación de recolecciones.
• Optimización heurística para trazo de rutas.
• Regresión múltiple para planeación de demanda y
pricing.
• Ensemble para transformación y saber qué
producir.
• Optimización para ruta de entrega.
Bottomline:
El ML ayuda a escalar
servicios para el 99%!
Qué puede salir mal?
Todo!
#MachineLearning Flops
• Google Flu Trends – Contexto = predicción
fallida de AH1N1 en Francia.
• Google Image Classifier – Contexto = 2
afroamericanos taggeados como ‘gorilas’.
• Walmart + Modelo complejo de alta varianza =
productos en mal estado vendidos a clientes.
• Wall Street + Model simple de alto bias = crisis
hipotecaria de 2008
• T*lc*l – Contexto = Préstamos a sospechosos.
Concluyendo…
Soy dev…cómo le entro al
ML?
• Comienza por prepararte en mates y estadística. Leete
“Think Stats” de Allen Downey.
• Acércate al depto de mates de tu universidad. Seguro
encuentras diplomados en mates.
• MOOCs: “Data Science Specialization” de Coursera es la
opción.
• Síguele con el de Andrew Ng de Stanford. Piérdele el miedo
a la notación formal.
• No te cases ni con Python ni con R. Usa ambos.
• No te cases con ningún algoritmo. Primero pregunta “qué
quiero lograr?”
• Context is KING!
Y si ya le se al ML?
• Platícanos tu proyecto en ramos.cardona@gmail.com
para que lo presentes en @thedatapub.
• Mándame un correo. Andamos reclutando!
• Sé humilde ante lo que te falta por aprender.
• Acércate a disciplinas complementarias de la ciencia
de datos: topología, diseño de experimentos,
optimización, visualización y storytelling.
• Comparte tu conocimiento. Ojalá seas tú el próximo
acá arriba!
¿Preguntas?
Grax!
@xuxoramos
ramos.cardona@gmail.com
linkedin.com/in/xuxoramos

More Related Content

Viewers also liked

Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosPatrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Hector Cuesta Arvizu
 

Viewers also liked (10)

Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big Disappointment
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithms
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AI
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis Applications
 
Coursera_MachineLearning
Coursera_MachineLearningCoursera_MachineLearning
Coursera_MachineLearning
 
Articulo de cuda
Articulo de cudaArticulo de cuda
Articulo de cuda
 
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a ObjetosPatrones del Modelo de Dominio en el Paradigma Orientado a Objetos
Patrones del Modelo de Dominio en el Paradigma Orientado a Objetos
 
Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)Dana Clinic Management System (DCMS)
Dana Clinic Management System (DCMS)
 
A CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling OrganizationsA CTO's Guide to Scaling Organizations
A CTO's Guide to Scaling Organizations
 
Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?Leading the Data Asset Management Team: CDO or Top Data Job?
Leading the Data Asset Management Team: CDO or Top Data Job?
 

Similar to Machine Learning For Organizations

Similar to Machine Learning For Organizations (20)

Machine Learning para Organizaciones
Machine Learning para OrganizacionesMachine Learning para Organizaciones
Machine Learning para Organizaciones
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizaciones
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AI
 
EMBD2018 | Autotuning en modelos de Machine Learning
EMBD2018 | Autotuning en modelos de Machine LearningEMBD2018 | Autotuning en modelos de Machine Learning
EMBD2018 | Autotuning en modelos de Machine Learning
 
Data Mining
Data MiningData Mining
Data Mining
 
Ultrapersonalización en la Web
Ultrapersonalización en la WebUltrapersonalización en la Web
Ultrapersonalización en la Web
 
Intl
IntlIntl
Intl
 
Big data centrologic 2016
Big data centrologic 2016Big data centrologic 2016
Big data centrologic 2016
 
El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)El futuro de marketing an america latina (16 9)
El futuro de marketing an america latina (16 9)
 
With Big Data comes Great Power
With Big Data comes Great PowerWith Big Data comes Great Power
With Big Data comes Great Power
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...Alex Sanchez  - eRetail Day México Blended [Professional] Experience - Web 3 ...
Alex Sanchez - eRetail Day México Blended [Professional] Experience - Web 3 ...
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
 
Globalstar simplex services (logistic summit)
Globalstar   simplex services (logistic summit)Globalstar   simplex services (logistic summit)
Globalstar simplex services (logistic summit)
 
El Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligenceEl Big Data en la dirección comercial: market(ing) intelligence
El Big Data en la dirección comercial: market(ing) intelligence
 
Transformación de datos_RaulSao - MaratónVirtualPP.pptx
Transformación de datos_RaulSao - MaratónVirtualPP.pptxTransformación de datos_RaulSao - MaratónVirtualPP.pptx
Transformación de datos_RaulSao - MaratónVirtualPP.pptx
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414Machine Learning en Inversiones 20210414
Machine Learning en Inversiones 20210414
 

Recently uploaded

metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 

Recently uploaded (20)

P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf02 protocolo en caso de robo o asalto.pdf
02 protocolo en caso de robo o asalto.pdf
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdf
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 

Machine Learning For Organizations

  • 1. Ya eres parte de la evolución Solid Day #MachineLearning para Organizaciones Jesus Ramos @xuxoramos ramos.cardona@gmail.com linkedin.com/in/xuxoramos #sgnext
  • 2. Y éste qué? - Ingeniero de Software de nacimiento (ITESM). - Econometrista Financiero por azar (Unottingham + UWashington). - Estadístico Computacional por convicción (Coursera, a mucha honra). - Consultado con 6 firmas (BMV, GBM, ConCredito, Movistar, etc) para levantar sus capacidades analíticas. - Co fundador de @TheDataPub, comunidad dedicada a reventar la burbuja y detener el tren del m*** del ML y del Pig Data. - Gamer los sábados (PSN: xuxoramos). - Foodie los domingos.
  • 6. Montaña rusa sin freno… $232mmdd Gran Inversión 4% Stats/Maths/Prog Poco skill Mala cultura Governance: Datos rehenes de cabal de IT
  • 8. El freno para esta montaña rusa…
  • 9. Roadmap+Riesgos para la banda Skill Si eres dev, métele a stats+maths. Si eres de maths+stats, métele a dev. Biz Intimacy Olvídate de la Herramienta. Enfócate en el lenguaje de negocio. Operational No entregues reportes, entrega APIs. Sin contexto == Hacer la pregunta equivocada No hay escalamiento Mala predicción + Alto sesgo == Perder dinero/ lastimar personas Etapa Riesgo
  • 10. Roadmap+Riesgos para orgs Etapa Riesgo DWH Todos los datos en 1 solo lugar. Gov’nance Total apertura y con conexiones SelfServ-BI Que gente de negocio se sirva reportes sola. Mayor sesgo + sin observer effect DataScience == Reporteo/BI Correlación == Causalidad
  • 12. #MachineLearning para todos SW Dev Máquina (de estados, no la compu) Datos Función/ Programa Salida Machine/Statistical Learning Supervisado Máquina (de estados, no la compu) Salida* Datos Función/ Programa** Contexto Contexto * No Supervisado = Sin Salida, ** Reinforcement = Función regresa a datos
  • 13. #MachineLearning para todos Objetivo 1: identificar patrones
  • 14. Error Total #MachineLearning para todos Objetivo 2: reducir el error de la función Error de Predicción Error del Fenómeno (Varianza) Sesgo/Bias Reducción: más/menos variables Reducción: más datos/ observaciones. Reducción: CONTEXTO!
  • 19. #MachineLearning para todos Tipos: Clustering == Clasificación Sin Output
  • 20. #MachineLearning para todos Tipos: Dimensionality Redux/Feature Engineering
  • 21. #MachineLearning para todos Y cuál uso? (Los que me den menos varianza y menos bias)
  • 22. #MachineLearning para todos Metodología Describir Qué me parece interesante de mi dataset? Explorar Qué research question quiero Hacerle a mi dataset? Inferir La respuesta puede generalizarse? Predecir La respuesta aplica a nuevas observaciones? - Distribuciones - Media - Moda - Kurtosis - Clustering - Kohonen - DBSCAN - Multidim Scaling - Hypo Test - GLM - ANOVA - MSE - Random Forest - Boosting - Bagging - Deep Learning ML ML
  • 23. Cross Validation Data Training Test Validation 70% 20% 10% N veces: TestValidation TestValidation TestValidation
  • 24. Ya le quitamos el m*me al tren. Ahora...? Aplicaciones!
  • 25. B*n*m*x • Conversión de cliente de nómina a TC en 29%. • $2.7mmdp en revenue al año desde 2010. • Cómo lo hizo? • Clasificación! f(edad, género, monto, antigüedad, …) = tiene TC Predictores / variables independientes variable respuesta / dependiente
  • 26. UPS • Ahorro de combustible haciendo que camiones sólo den vuelta a la derecha. • Ahorro de $47mdd al año. • Cómo lo hicieron? • Diseño de experimentos! Exploratorio -> Recolección de datos -> Hypothesis Testing -> GLMs -> Clasificación
  • 27. T*lc*l • Identificación de usrs consumiendo $7K MXN semanales de tiempo aire en prepago. • Creación de producto de crédito de tiempo aire de hasta $2K. • $4mmdp al año de revenue. • Cómo lo hicieron? • Clustering! Multidimensional Scaling + K-means/DBSCAN
  • 28. Western Union • Prevención de fraude en remesas en automático y personalizado. • $32mdd en ahorro operativo en 2012. $21mdd son de transacciones detenidas al momento. • Cómo le hicieron? • Clasificación! • Similar a algoritmos de spam/ham.
  • 29. Gr*p* *xp*ns**n • Bajar bounce rate y mantener al visitante en sitios de las marcas del grupo. • Aumentar ad impressions. • Cómo lo están haciendo? • Recommender Systems! Clasif 1 + Clasif 2 + … + Clasif N Qué música prefiere? Qué comida prefiere? Qué pelis ha visto?
  • 31. En la delantera! • Konfio, Kueski, Prestadero + ensemble learning = credit scoring. • Piggo + multidimensional scaling + DBSCAN = recomendación de inversiones. • Klustera + Filtros Kalman (un tipo de regresión) = ubicación exacta de gente en centros comerciales. • HolaGus + deep convolutional neural networks = clasificación de texto.
  • 32. Caso interesante: FullHarvest • Time Series de granjas y huertos en tiempo de cosecha. • Clasificación para planeación de recolecciones. • Optimización heurística para trazo de rutas. • Regresión múltiple para planeación de demanda y pricing. • Ensemble para transformación y saber qué producir. • Optimización para ruta de entrega.
  • 33. Bottomline: El ML ayuda a escalar servicios para el 99%!
  • 34. Qué puede salir mal? Todo!
  • 35. #MachineLearning Flops • Google Flu Trends – Contexto = predicción fallida de AH1N1 en Francia. • Google Image Classifier – Contexto = 2 afroamericanos taggeados como ‘gorilas’. • Walmart + Modelo complejo de alta varianza = productos en mal estado vendidos a clientes. • Wall Street + Model simple de alto bias = crisis hipotecaria de 2008 • T*lc*l – Contexto = Préstamos a sospechosos.
  • 37. Soy dev…cómo le entro al ML? • Comienza por prepararte en mates y estadística. Leete “Think Stats” de Allen Downey. • Acércate al depto de mates de tu universidad. Seguro encuentras diplomados en mates. • MOOCs: “Data Science Specialization” de Coursera es la opción. • Síguele con el de Andrew Ng de Stanford. Piérdele el miedo a la notación formal. • No te cases ni con Python ni con R. Usa ambos. • No te cases con ningún algoritmo. Primero pregunta “qué quiero lograr?” • Context is KING!
  • 38. Y si ya le se al ML? • Platícanos tu proyecto en ramos.cardona@gmail.com para que lo presentes en @thedatapub. • Mándame un correo. Andamos reclutando! • Sé humilde ante lo que te falta por aprender. • Acércate a disciplinas complementarias de la ciencia de datos: topología, diseño de experimentos, optimización, visualización y storytelling. • Comparte tu conocimiento. Ojalá seas tú el próximo acá arriba!

Editor's Notes

  1. fdsfds