SlideShare a Scribd company logo
1 of 37
Download to read offline
1
Historias de DS
desde la trinchera
Historias malas, buenas, y feas, mexicanas, y del mundo.
Copyright © @xuxoramos 2017
"All models are wrong, but
some are useful"
- George E.P. Box
2
Objetivo
Identificar
patrones
equivocándose
lo menor posible.
3Copyright © @xuxoramos 2017
Cómo lo logra?
Balanceando
componentes del
error
4Copyright © @xuxoramos 2017
X1 X2 Y
X1 X2 YX3
X1 X2 YX3 X4
X1 X2 YX3 X4 X5 X6
X1 X2 YX3 X4 X5 X6 X7 X8
¡Aquí es donde se concentran mates,
estadística, lógica y ética!
- Lógica para tener higiene argumentativa y hacer la pregunta correcta
- Estadística para evaluar la aportación de información de éstas
- Mates para modelar este conjunto y reflejar fielmente la realidad
- Ética para reconocer sesgos y tratarlos
11
...Y donde más se equivoca
la gente.
A veces a propósito...
12
13
Historias Buenas
"DS done right"
14Copyright © @xuxoramos 2017
15
Historias Malas
Google Img Classifier
16Copyright © @xuxoramos 2017
Microsoft's TweetBot Tay
17Copyright © @xuxoramos 2017
Google Flu Trends
18Copyright © @xuxoramos 2017
Solid Gold Bomb
19Copyright © @xuxoramos 2017
Score de reincidencia
20Copyright © @xuxoramos 2017
2008 Subprime Mortgage Crisis
21Copyright © @xuxoramos 2017
Cambridge Analytica
22Copyright © @xuxoramos 2017
Y México?
23Copyright © @xuxoramos 2017
- Telcel identifica con clustering un grupo de usrs que
consume $7,000 MXN de tiempo aire en prepago.
- Con aprendizaje supervisado crea un producto de crédito
para estos clientes.
- Le trae 4mdp anuales en facturación.
- Luego hacen georeferenciación de estos clientes.
- Todos están en Sinaloa y Tamaulipas.
- ¿Qué tipo de personas creen que eran?
Y México?
24Copyright © @xuxoramos 2017
- Durante el sismo del 19S, Codeando México atrae un
grupo de programadores que quieren entrenar una red
neuronal para detectar daño estrucural con fotos de TW.
- Todas las fotos están taggeadas con #RevisaMiGrieta,
pero son solo 600.
- Las redes neuronales necesitan decenas de miles de
fotos, de lo contrario arrojarán muchos falsos positivos y
falsos negativos.
- ¿Qué costo social pueden tener estas equivocaciones?
¿Cómo anda MX en análisis de
datos?
113K Ingenieros de Software al año.
350 Matemáticos, físicos y estadísticos.
No se conoce la diferencia entre Data Scientist (DS) y Data Engineer
(DE).
Tenemos miles de Data Engineers talentosos.
No tenemos casi Data Scientists.
Tenemos muchos DE queriendo ser DS sin las bases de mates o proba.
+
25Copyright © @xuxoramos 2017
¿Cómo anda MX en análisis de
datos?
En 1982 México le entró al modelo neoliberal con la economía de maquila.
La SEP instruyó al sistema educativo eliminar la filosofía y mates de las
ingenierías. Era más importante producir gente con capacidades
secundarias, repetibles y transferibles, que crear conocimiento.
La ingeniería en compu es la más afectada. La reducen a recetas de cocina.
Algunas universidades autónomas se salvan.
Fast forward a 2018: 11 generaciones de ingenieros que razonan con
falacias, y cuyas matemáticas más avanzadas llegan solo a cálculo.
+
26Copyright © @xuxoramos 2017
Con todo esto, ¿debemos
convertirnos en hub de
talento para DS?
27
¿Qué tenemos en contra?
La frontera norte se cierra a nuestros productos y servicios.
Poco petróleo, y a precio muy bajo.
Corrupción rampante.
Mercado interno débil.
Variables macroeconómicas malas.
La "mano de obra barata" no será relevante en la era de la
automatización.
28Copyright © @xuxoramos 2017
Debe México convertirse en un
hub de Ciencia de Datos?
Sí.
29Copyright © @xuxoramos 2017
Cómo pueden ayudar?
Entra a un programa académico completo.
Regresa a la escuela a aprender mates.
Usa la educación abierta en internet para hacer tu propia maestría.
Únete a grupos profesionales.
Únete a comunidades.
30Copyright © @xuxoramos 2017
Mates aplicadas @ ITAM, UNAM, IPN
Física @ UNAM
Economía @ ITAM, UNAM
MSc Ciencia de Datos @ ITAM
MSc Inteligencia Analítica @ UAnáhuac
MSc Ciencia de Datos @ CIMAT
Programas académicos en MX*
+
* Evaluación de 63 candidatos para posiciones de Ciencia de Datos en Bolsa
Mexicana de Valores, GBM, TERAN/TBWA, Klustera, Globant, OPI y ConCrédito.
31Copyright © @xuxoramos 2017
Intro to Mathematical Thinking: Stanford + Coursera
Intro to Logic: Stanford + Coursera
Business Analytics: Wharton + Coursera
Data Science Specialization: JHU + Coursera
Machine Learning: Stanford + Coursera
Executive Data Science: JHU + Coursera
"Hága su propia maestría"*
* Ver ratings de cursos en https://www.class-central.com/ 32Copyright © @xuxoramos 2017
The Data Pub (FB: /thedatapub, TW: @thedatapub)
+1800 miembros. Meetups cada último Jueves del mes.
Cursos de Stats & Machine Learning para Developers.
Job posting - porque las empresas están perdidas.
Badges - porque los endorsements de LinkedIn son "la hoguera de las
vanidades".
Hackathones: Walmart, Grupo Modelo.
Grupos Profesionales
33Copyright © @xuxoramos 2017
El Juramento del Científico de Datos
34
Discusiones pendientes:
¡Machine Learning Ethics!
35
36
Grax!
@xuxoramos
jesus@datank.ai
LinkedIn
Github
FB
37Copyright © @xuxoramos 2017

More Related Content

What's hot

generative-ai-fundamentals and Large language models
generative-ai-fundamentals and Large language modelsgenerative-ai-fundamentals and Large language models
generative-ai-fundamentals and Large language models
AdventureWorld5
 

What's hot (20)

ChatGPT - AI.pdf
ChatGPT - AI.pdfChatGPT - AI.pdf
ChatGPT - AI.pdf
 
The Rise of the LLMs - How I Learned to Stop Worrying & Love the GPT!
The Rise of the LLMs - How I Learned to Stop Worrying & Love the GPT!The Rise of the LLMs - How I Learned to Stop Worrying & Love the GPT!
The Rise of the LLMs - How I Learned to Stop Worrying & Love the GPT!
 
LLMOps for Your Data: Best Practices to Ensure Safety, Quality, and Cost
LLMOps for Your Data: Best Practices to Ensure Safety, Quality, and CostLLMOps for Your Data: Best Practices to Ensure Safety, Quality, and Cost
LLMOps for Your Data: Best Practices to Ensure Safety, Quality, and Cost
 
Blockchain Enabled Distributed Storage and Sharing of Personal Data Assets
Blockchain Enabled Distributed Storage and Sharing of Personal Data AssetsBlockchain Enabled Distributed Storage and Sharing of Personal Data Assets
Blockchain Enabled Distributed Storage and Sharing of Personal Data Assets
 
BigQuery ML - Machine learning at scale using SQL
BigQuery ML - Machine learning at scale using SQLBigQuery ML - Machine learning at scale using SQL
BigQuery ML - Machine learning at scale using SQL
 
FinTech, AI, Machine Learning in Finance
FinTech, AI, Machine Learning in FinanceFinTech, AI, Machine Learning in Finance
FinTech, AI, Machine Learning in Finance
 
Optimizing Your Supply Chain with Neo4j
Optimizing Your Supply Chain with Neo4jOptimizing Your Supply Chain with Neo4j
Optimizing Your Supply Chain with Neo4j
 
Threat Hunting Platforms (Collaboration with SANS Institute)
Threat Hunting Platforms (Collaboration with SANS Institute)Threat Hunting Platforms (Collaboration with SANS Institute)
Threat Hunting Platforms (Collaboration with SANS Institute)
 
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
 
Intelligent Banking: AI cases in Retail and Commercial Banking
Intelligent Banking: AI cases in Retail and Commercial BankingIntelligent Banking: AI cases in Retail and Commercial Banking
Intelligent Banking: AI cases in Retail and Commercial Banking
 
Generative-AI-in-enterprise-20230615.pdf
Generative-AI-in-enterprise-20230615.pdfGenerative-AI-in-enterprise-20230615.pdf
Generative-AI-in-enterprise-20230615.pdf
 
Generative AI and ChatGPT - Scope of AI and advance Generative AI
Generative AI and ChatGPT - Scope of AI and advance Generative AIGenerative AI and ChatGPT - Scope of AI and advance Generative AI
Generative AI and ChatGPT - Scope of AI and advance Generative AI
 
Large Language Models - Chat AI.pdf
Large Language Models - Chat AI.pdfLarge Language Models - Chat AI.pdf
Large Language Models - Chat AI.pdf
 
Cavalry Ventures | Deep Dive: Generative AI
Cavalry Ventures | Deep Dive: Generative AICavalry Ventures | Deep Dive: Generative AI
Cavalry Ventures | Deep Dive: Generative AI
 
Modern security using graphs, automation and data science
Modern security using graphs, automation and data scienceModern security using graphs, automation and data science
Modern security using graphs, automation and data science
 
Big data project management
Big data project managementBig data project management
Big data project management
 
Unlocking the Power of Generative AI An Executive's Guide.pdf
Unlocking the Power of Generative AI An Executive's Guide.pdfUnlocking the Power of Generative AI An Executive's Guide.pdf
Unlocking the Power of Generative AI An Executive's Guide.pdf
 
generative-ai-fundamentals and Large language models
generative-ai-fundamentals and Large language modelsgenerative-ai-fundamentals and Large language models
generative-ai-fundamentals and Large language models
 
Data monetization pov
Data monetization   povData monetization   pov
Data monetization pov
 
Chat GPT and Generative AI in Higher Education - Empowering Educators and Lea...
Chat GPT and Generative AI in Higher Education - Empowering Educators and Lea...Chat GPT and Generative AI in Higher Education - Empowering Educators and Lea...
Chat GPT and Generative AI in Higher Education - Empowering Educators and Lea...
 

Similar to Historias de Ciencia de Datos desde la Trinchera

Profesiones en matemáticas
Profesiones en matemáticas Profesiones en matemáticas
Profesiones en matemáticas
Rosa E Padilla
 

Similar to Historias de Ciencia de Datos desde la Trinchera (20)

Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AI
 
Entrepreneurship with Data, Machine Learning and AI
Entrepreneurship with Data, Machine Learning and AIEntrepreneurship with Data, Machine Learning and AI
Entrepreneurship with Data, Machine Learning and AI
 
WTF with Big Data?
WTF with Big Data?WTF with Big Data?
WTF with Big Data?
 
Estadistica y Machine Learning para Todos
Estadistica y Machine Learning para TodosEstadistica y Machine Learning para Todos
Estadistica y Machine Learning para Todos
 
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
El futuro del trabajo En la Era de la Singularidad Tecnológica
El futuro del trabajo En la Era de la Singularidad TecnológicaEl futuro del trabajo En la Era de la Singularidad Tecnológica
El futuro del trabajo En la Era de la Singularidad Tecnológica
 
Transformación Digital y Redes Sociales
Transformación Digital y Redes SocialesTransformación Digital y Redes Sociales
Transformación Digital y Redes Sociales
 
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...
 
Inteligencia Artificial en las aulas de los institutos
Inteligencia Artificial en las aulas de los institutosInteligencia Artificial en las aulas de los institutos
Inteligencia Artificial en las aulas de los institutos
 
Profesiones en matemáticas
Profesiones en matemáticas Profesiones en matemáticas
Profesiones en matemáticas
 
Sesion 2 gerencia de ti cs u de m abril-2015
Sesion 2   gerencia de ti cs  u de m   abril-2015Sesion 2   gerencia de ti cs  u de m   abril-2015
Sesion 2 gerencia de ti cs u de m abril-2015
 
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
 
Retos y desafíos del Big Data
Retos y desafíos del Big Data Retos y desafíos del Big Data
Retos y desafíos del Big Data
 
De la Inteligencia Artificial a la sabiduría humana
De la Inteligencia Artificial a la sabiduría humanaDe la Inteligencia Artificial a la sabiduría humana
De la Inteligencia Artificial a la sabiduría humana
 
Big Data y el ERP en México
Big Data y el ERP en MéxicoBig Data y el ERP en México
Big Data y el ERP en México
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizaciones
 
Charla CADE - IA: hacia un uso responsable
Charla CADE - IA: hacia un uso responsableCharla CADE - IA: hacia un uso responsable
Charla CADE - IA: hacia un uso responsable
 
Nestor Marquez Transformación Digital, Conferencista, México,
Nestor Marquez Transformación Digital, Conferencista, México, Nestor Marquez Transformación Digital, Conferencista, México,
Nestor Marquez Transformación Digital, Conferencista, México,
 
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectivaAntonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
 

More from Jesus Ramos

More from Jesus Ramos (11)

Formando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de DatosFormando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de Datos
 
Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019
 
Inferencia Estadística para Periodistas
Inferencia Estadística para PeriodistasInferencia Estadística para Periodistas
Inferencia Estadística para Periodistas
 
Data Quality for Data Science Projects
Data Quality for Data Science ProjectsData Quality for Data Science Projects
Data Quality for Data Science Projects
 
Algorithmic Transparency
Algorithmic TransparencyAlgorithmic Transparency
Algorithmic Transparency
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AI
 
Machine Learning For Organizations
Machine Learning For OrganizationsMachine Learning For Organizations
Machine Learning For Organizations
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis Applications
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithms
 
Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)
 
Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big Disappointment
 

Recently uploaded

REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
CelesteRolon2
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
ssuserbdc329
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
MANUELVILELA7
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 

Recently uploaded (20)

REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdf
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 

Historias de Ciencia de Datos desde la Trinchera

  • 1. 1 Historias de DS desde la trinchera Historias malas, buenas, y feas, mexicanas, y del mundo. Copyright © @xuxoramos 2017
  • 2. "All models are wrong, but some are useful" - George E.P. Box 2
  • 4. Cómo lo logra? Balanceando componentes del error 4Copyright © @xuxoramos 2017
  • 8. X1 X2 YX3 X4 X5 X6
  • 9. X1 X2 YX3 X4 X5 X6 X7 X8
  • 10.
  • 11. ¡Aquí es donde se concentran mates, estadística, lógica y ética! - Lógica para tener higiene argumentativa y hacer la pregunta correcta - Estadística para evaluar la aportación de información de éstas - Mates para modelar este conjunto y reflejar fielmente la realidad - Ética para reconocer sesgos y tratarlos 11
  • 12. ...Y donde más se equivoca la gente. A veces a propósito... 12
  • 14. "DS done right" 14Copyright © @xuxoramos 2017
  • 16. Google Img Classifier 16Copyright © @xuxoramos 2017
  • 18. Google Flu Trends 18Copyright © @xuxoramos 2017
  • 19. Solid Gold Bomb 19Copyright © @xuxoramos 2017
  • 20. Score de reincidencia 20Copyright © @xuxoramos 2017
  • 21. 2008 Subprime Mortgage Crisis 21Copyright © @xuxoramos 2017
  • 23. Y México? 23Copyright © @xuxoramos 2017 - Telcel identifica con clustering un grupo de usrs que consume $7,000 MXN de tiempo aire en prepago. - Con aprendizaje supervisado crea un producto de crédito para estos clientes. - Le trae 4mdp anuales en facturación. - Luego hacen georeferenciación de estos clientes. - Todos están en Sinaloa y Tamaulipas. - ¿Qué tipo de personas creen que eran?
  • 24. Y México? 24Copyright © @xuxoramos 2017 - Durante el sismo del 19S, Codeando México atrae un grupo de programadores que quieren entrenar una red neuronal para detectar daño estrucural con fotos de TW. - Todas las fotos están taggeadas con #RevisaMiGrieta, pero son solo 600. - Las redes neuronales necesitan decenas de miles de fotos, de lo contrario arrojarán muchos falsos positivos y falsos negativos. - ¿Qué costo social pueden tener estas equivocaciones?
  • 25. ¿Cómo anda MX en análisis de datos? 113K Ingenieros de Software al año. 350 Matemáticos, físicos y estadísticos. No se conoce la diferencia entre Data Scientist (DS) y Data Engineer (DE). Tenemos miles de Data Engineers talentosos. No tenemos casi Data Scientists. Tenemos muchos DE queriendo ser DS sin las bases de mates o proba. + 25Copyright © @xuxoramos 2017
  • 26. ¿Cómo anda MX en análisis de datos? En 1982 México le entró al modelo neoliberal con la economía de maquila. La SEP instruyó al sistema educativo eliminar la filosofía y mates de las ingenierías. Era más importante producir gente con capacidades secundarias, repetibles y transferibles, que crear conocimiento. La ingeniería en compu es la más afectada. La reducen a recetas de cocina. Algunas universidades autónomas se salvan. Fast forward a 2018: 11 generaciones de ingenieros que razonan con falacias, y cuyas matemáticas más avanzadas llegan solo a cálculo. + 26Copyright © @xuxoramos 2017
  • 27. Con todo esto, ¿debemos convertirnos en hub de talento para DS? 27
  • 28. ¿Qué tenemos en contra? La frontera norte se cierra a nuestros productos y servicios. Poco petróleo, y a precio muy bajo. Corrupción rampante. Mercado interno débil. Variables macroeconómicas malas. La "mano de obra barata" no será relevante en la era de la automatización. 28Copyright © @xuxoramos 2017
  • 29. Debe México convertirse en un hub de Ciencia de Datos? Sí. 29Copyright © @xuxoramos 2017
  • 30. Cómo pueden ayudar? Entra a un programa académico completo. Regresa a la escuela a aprender mates. Usa la educación abierta en internet para hacer tu propia maestría. Únete a grupos profesionales. Únete a comunidades. 30Copyright © @xuxoramos 2017
  • 31. Mates aplicadas @ ITAM, UNAM, IPN Física @ UNAM Economía @ ITAM, UNAM MSc Ciencia de Datos @ ITAM MSc Inteligencia Analítica @ UAnáhuac MSc Ciencia de Datos @ CIMAT Programas académicos en MX* + * Evaluación de 63 candidatos para posiciones de Ciencia de Datos en Bolsa Mexicana de Valores, GBM, TERAN/TBWA, Klustera, Globant, OPI y ConCrédito. 31Copyright © @xuxoramos 2017
  • 32. Intro to Mathematical Thinking: Stanford + Coursera Intro to Logic: Stanford + Coursera Business Analytics: Wharton + Coursera Data Science Specialization: JHU + Coursera Machine Learning: Stanford + Coursera Executive Data Science: JHU + Coursera "Hága su propia maestría"* * Ver ratings de cursos en https://www.class-central.com/ 32Copyright © @xuxoramos 2017
  • 33. The Data Pub (FB: /thedatapub, TW: @thedatapub) +1800 miembros. Meetups cada último Jueves del mes. Cursos de Stats & Machine Learning para Developers. Job posting - porque las empresas están perdidas. Badges - porque los endorsements de LinkedIn son "la hoguera de las vanidades". Hackathones: Walmart, Grupo Modelo. Grupos Profesionales 33Copyright © @xuxoramos 2017
  • 34. El Juramento del Científico de Datos 34
  • 36. 36