SlideShare a Scribd company logo
1 of 19
Download to read offline
Inferencia
Estadística para
Periodistas
El enfoque científico para reporteo más ético y blindado
Copyright © @xuxoramos 2017
Objetivos
Que sepan cómo desmenuzar estadísticamente una
aseveración.
Que sepan qué es el aprendizaje automático y sus partes.
Que sepan para qué sirve el aprendizaje automático.
Que sepan por qué es importante para México ponerse
chingón en aprendizaje automático.
2Copyright © @xuxoramos 2017
Las noticias
Declaración típica de político:
3Copyright © @xuxoramos 2017
https://www.animalpolitico.com/elsabueso/anaya-alianza-pan-prd-economia/
El enfoque periodísitico
● Identificar estados donde
gobierna coalición.
● Comparar PIB. ¿Cuál
bajó y cuál subió?
● Si no todos subieron
durante la gestión de la
coalición, entonces:
4Copyright © @xuxoramos 2017
¿Cuál es el problema con esto?
¿Cómo sabemos si esto no fue por actividad antes de la
coalición?
¿O efectos macroeconómicos?
¿O externos?
¿O una baja en el tipo de cambio?
¿Cómo probamos estos efectos?
5
Pruebas de Hipótesis
El corazón del método científico.
Establece una hipótesis para explicar un fenómeno de la
realidad.
Muy usado en farmacéutica para comprobar efectos de
medicinas en padecimientos.
Muy poco usado en periodismo.
6
Una historia de periodismo...
Periodistas llega a CDMX huyendo de Veracruz con documentos sobre la
bursatilización de la deuda por el gobierno de Fidel Herrera.
En el Open Data Day 2016 piden ayuda para validar si dicha
bursatilización ayudó o no a elevar el PIB de Veracruz.
Se hace una prueba de hipótesis y resulta que si, el PIB veracruzano se
elevó gracias al ingreso por la bursatilización de la deuda.
Periodistas deciden ignorar este resultado y publican historia diciendo que
la bursatilización no hizo crecer la economía de Veracruz.
7
¿En qué consiste?
Planteamos una hipótesis:
"Gobiernos de coalición PRD+PAN crean políticas que estimulan la economía"
Esta hipótesis argumenta que sí hay efecto. Se llama "hipótesis alterna" (Ha
)
Pero por definición se genera otra: la hipótesis nula (H0
).
La hipótesis nula argumenta que el factor que se está explorando no tiene
efecto sobre el fenómeno.
En este caso: "El estímulo de la economía no tiene que ver con el partido
gobernante."
8
IMPORTANTE!
¡La hipótesis nula se toma como cierta automáticamente!
Es el "abogado del diablo", actuando siempre en nuestra contra.
La labor de la prueba de hipótesis es tratar de rechazar la hipótesis nula.
Al rechazarla, no significa que la hipótesis alterna se pruebe, solo que debemos
seguir investigando otros factores que resulten en el efecto investigado.
Si no podemos rechazarla, tampoco significa que nuestra hipótesis alterna
carezca de fundamento, solo que quizá no tenemos datos suficientes.
"Inocente hasta demostrar lo contrario".
9
H0
: El crecimiento económico de Oaxaca no depende de
gobiernos de coalición.
Ha
: El gobierno de coalición PAN-PRD estimular el
crecimiento económico de Oaxaca.
Ver repo en esta liga: https://github.com/xuxoramos/stat-infer-journalists
* https://www.sheffield.ac.uk/mash/what_test
Ejemplo en R*
10
¿Cómo anda MX en análisis de
datos?
113K Ingenieros de Software al año.
350 Matemáticos, actuarios, físicos y estadísticos.
No se conoce la diferencia entre Data Scientist (DS) y Data Engineer
(DE).
Tenemos miles de Data Engineers talentosos.
No tenemos casi Data Scientists.
Tenemos muchos DE queriendo ser DS sin las bases de mates o proba.
+
11Copyright © @xuxoramos 2017
Qué puede salir mal?
Telco importante dando créditos a sospechosos criminales.
Empresa importante de internet no le atina a predicción de AH1N1.
Gran empresa de software crea un bot sexualmente cargado y racista.
Empresa de internet clasifica foto de 2 afroamericanos como gorilas.
Crisis financiera de 2008.
Victoria de Trump.
12Copyright © @xuxoramos 2017
Debe México convertirse en un
hub de Ciencia de Datos?
La frontera norte se cierra a nuestros productos y servicios.
Poco petróleo, y a precio muy bajo.
Corrupción rampante.
Mercado interno débil.
Variables macroeconómicas malas.
La "mano de obra barata" no será relevante en la era de la
automatización.
13Copyright © @xuxoramos 2017
Cómo pueden ayudar?
Entra a un programa académico completo.
Regresa a la escuela a aprender mates.
Usa la educación abierta en internet para hacer tu propia maestría.
Únete a grupos profesionales.
Únete a comunidades.
14Copyright © @xuxoramos 2017
Intro to Mathematical Thinking: Stanford + Coursera
Intro to Logic: Stanford + Coursera
Business Analytics: Wharton + Coursera
Data Science Specialization: JHU + Coursera
Machine Learning: Stanford + Coursera
Executive Data Science: JHU + Coursera
"Hága su propia maestría"*
* Ver ratings de cursos en https://www.class-central.com/ 15Copyright © @xuxoramos 2017
Sociedad de Científicos de Datos de México
Grupo más académico.
SocialTIC
Menos Ciencia, más visualización, periodismo e infoactivismo.
Instituto Internacional de Ciencia de Datos
Más governance y proyectos "empresariales".
Grupos Profesionales
16Copyright © @xuxoramos 2017
The Data Pub (FB: /thedatapub, TW: @thedatapub)
1800 miembros. Meetups cada último Jueves del mes.
Presentamos 2 proyectos donde el negocio o la vida humana sean
primero, las mates segundo, y la tecnología tercero.
Cursos de Stats & Machine Learning para Developers.
Job posting - porque sigue habiendo confusión entre DS y DE.
Badges - porque los endorsements de LinkedIn son "la hoguera de las
vanidades".
Comunidades
17Copyright © @xuxoramos 2017
18
Grax!
@xuxoramos
jesus@datank.ai
LinkedIn
Github
FB
19Copyright © @xuxoramos 2017

More Related Content

Similar to Inferencia Estadística para Periodistas

www.sinpermiso.info CRECE LA DESIGUALDAD
www.sinpermiso.info CRECE LA DESIGUALDADwww.sinpermiso.info CRECE LA DESIGUALDAD
www.sinpermiso.info CRECE LA DESIGUALDAD
Gardapeiraos Máximus
 
Presentacion elecciones 2012
Presentacion elecciones 2012Presentacion elecciones 2012
Presentacion elecciones 2012
Oscaryeyo17
 

Similar to Inferencia Estadística para Periodistas (20)

www.sinpermiso.info CRECE LA DESIGUALDAD
www.sinpermiso.info CRECE LA DESIGUALDADwww.sinpermiso.info CRECE LA DESIGUALDAD
www.sinpermiso.info CRECE LA DESIGUALDAD
 
Conceptos centrales de una teoria para la acción - Chubut
Conceptos centrales de una teoria para la acción - ChubutConceptos centrales de una teoria para la acción - Chubut
Conceptos centrales de una teoria para la acción - Chubut
 
Mitos, leyendas y verdades sobre el vínculo dinero y política en Chile
Mitos, leyendas y verdades sobre el vínculo dinero y política en ChileMitos, leyendas y verdades sobre el vínculo dinero y política en Chile
Mitos, leyendas y verdades sobre el vínculo dinero y política en Chile
 
Otra vuelta a la economía y economia a contramano
Otra vuelta a la economía y economia a contramanoOtra vuelta a la economía y economia a contramano
Otra vuelta a la economía y economia a contramano
 
Economía del bien común
Economía del bien comúnEconomía del bien común
Economía del bien común
 
Presentacion elecciones 2012
Presentacion elecciones 2012Presentacion elecciones 2012
Presentacion elecciones 2012
 
El mercado no puede marcar el rumbo
El mercado no puede marcar el rumboEl mercado no puede marcar el rumbo
El mercado no puede marcar el rumbo
 
La ruta del progreso (programa amlo)
La ruta del progreso (programa amlo)La ruta del progreso (programa amlo)
La ruta del progreso (programa amlo)
 
La economía de los primeros cien días de Milei
La economía de los primeros cien días de MileiLa economía de los primeros cien días de Milei
La economía de los primeros cien días de Milei
 
AMLO y Trump, hacia una nueva alianza para el progreso
AMLO y Trump, hacia una nueva alianza para el progresoAMLO y Trump, hacia una nueva alianza para el progreso
AMLO y Trump, hacia una nueva alianza para el progreso
 
KTN09-MODELOS EN LA DINÁMICA DE SISTEMAS Y EL PROCESO DE CONSTRUCCIÓN
KTN09-MODELOS EN LA DINÁMICA DE SISTEMAS Y EL PROCESO DE CONSTRUCCIÓNKTN09-MODELOS EN LA DINÁMICA DE SISTEMAS Y EL PROCESO DE CONSTRUCCIÓN
KTN09-MODELOS EN LA DINÁMICA DE SISTEMAS Y EL PROCESO DE CONSTRUCCIÓN
 
Nuevos liderazgos para tiempos convulsos
Nuevos liderazgos para tiempos convulsosNuevos liderazgos para tiempos convulsos
Nuevos liderazgos para tiempos convulsos
 
170509 populismo y los mercados (1)
170509 populismo y los mercados (1)170509 populismo y los mercados (1)
170509 populismo y los mercados (1)
 
Economía
EconomíaEconomía
Economía
 
FLASH LABORAL ARGENTINA - Enero 2016
FLASH LABORAL ARGENTINA - Enero 2016FLASH LABORAL ARGENTINA - Enero 2016
FLASH LABORAL ARGENTINA - Enero 2016
 
EconomiaColaborativa_OpinionPública_España
EconomiaColaborativa_OpinionPública_EspañaEconomiaColaborativa_OpinionPública_España
EconomiaColaborativa_OpinionPública_España
 
Economia colaborativa
Economia colaborativaEconomia colaborativa
Economia colaborativa
 
Liderazgos políticos con valores en tiempo de fátiga democrática.pptx
Liderazgos políticos con valores en tiempo de fátiga democrática.pptxLiderazgos políticos con valores en tiempo de fátiga democrática.pptx
Liderazgos políticos con valores en tiempo de fátiga democrática.pptx
 
EL ESTADO EMPRENDEDOR MITOS Y REALIDADES ¿Realmente es el Estado el impulsor ...
EL ESTADO EMPRENDEDOR MITOS Y REALIDADES ¿Realmente es el Estado el impulsor ...EL ESTADO EMPRENDEDOR MITOS Y REALIDADES ¿Realmente es el Estado el impulsor ...
EL ESTADO EMPRENDEDOR MITOS Y REALIDADES ¿Realmente es el Estado el impulsor ...
 
Política social y asistencial
Política  social y asistencialPolítica  social y asistencial
Política social y asistencial
 

More from Jesus Ramos

More from Jesus Ramos (9)

Formando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de DatosFormando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de Datos
 
Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019
 
Data Quality for Data Science Projects
Data Quality for Data Science ProjectsData Quality for Data Science Projects
Data Quality for Data Science Projects
 
WTF with Big Data?
WTF with Big Data?WTF with Big Data?
WTF with Big Data?
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AI
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis Applications
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithms
 
Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)
 
Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big Disappointment
 

Recently uploaded

Recently uploaded (20)

PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
PRESENTACION SOBRE LA HOJA DE CALCULO ⠀⠀
 
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
Imágenes-de La-Inteligencia-Artificial-AnaliticayDatos-Beatriz-Garcia-Abril2024
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,MARCO TEORICO, SEMINARIO DE INVESTIGACION,
MARCO TEORICO, SEMINARIO DE INVESTIGACION,
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
Crecimiento del PIB real revisado sexenios neoliberales y nueva era del sober...
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docxAMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
AMNIOS Y CORDON UMBILICAL en el 3 embarazo (1).docx
 
data lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdfdata lista de ingresantes de la universidad de ucayali 2024.pdf
data lista de ingresantes de la universidad de ucayali 2024.pdf
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
Las familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdfLas familias más ricas del medio oriente (2024).pdf
Las familias más ricas del medio oriente (2024).pdf
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
ROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANASROMA Y EL  IMPERIO, CIUDADES  ANTIGUA ROMANAS
ROMA Y EL IMPERIO, CIUDADES ANTIGUA ROMANAS
 
aine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificaciónaine-2014.pdf/tipos de aines-clasificación
aine-2014.pdf/tipos de aines-clasificación
 

Inferencia Estadística para Periodistas

  • 1. Inferencia Estadística para Periodistas El enfoque científico para reporteo más ético y blindado Copyright © @xuxoramos 2017
  • 2. Objetivos Que sepan cómo desmenuzar estadísticamente una aseveración. Que sepan qué es el aprendizaje automático y sus partes. Que sepan para qué sirve el aprendizaje automático. Que sepan por qué es importante para México ponerse chingón en aprendizaje automático. 2Copyright © @xuxoramos 2017
  • 3. Las noticias Declaración típica de político: 3Copyright © @xuxoramos 2017 https://www.animalpolitico.com/elsabueso/anaya-alianza-pan-prd-economia/
  • 4. El enfoque periodísitico ● Identificar estados donde gobierna coalición. ● Comparar PIB. ¿Cuál bajó y cuál subió? ● Si no todos subieron durante la gestión de la coalición, entonces: 4Copyright © @xuxoramos 2017
  • 5. ¿Cuál es el problema con esto? ¿Cómo sabemos si esto no fue por actividad antes de la coalición? ¿O efectos macroeconómicos? ¿O externos? ¿O una baja en el tipo de cambio? ¿Cómo probamos estos efectos? 5
  • 6. Pruebas de Hipótesis El corazón del método científico. Establece una hipótesis para explicar un fenómeno de la realidad. Muy usado en farmacéutica para comprobar efectos de medicinas en padecimientos. Muy poco usado en periodismo. 6
  • 7. Una historia de periodismo... Periodistas llega a CDMX huyendo de Veracruz con documentos sobre la bursatilización de la deuda por el gobierno de Fidel Herrera. En el Open Data Day 2016 piden ayuda para validar si dicha bursatilización ayudó o no a elevar el PIB de Veracruz. Se hace una prueba de hipótesis y resulta que si, el PIB veracruzano se elevó gracias al ingreso por la bursatilización de la deuda. Periodistas deciden ignorar este resultado y publican historia diciendo que la bursatilización no hizo crecer la economía de Veracruz. 7
  • 8. ¿En qué consiste? Planteamos una hipótesis: "Gobiernos de coalición PRD+PAN crean políticas que estimulan la economía" Esta hipótesis argumenta que sí hay efecto. Se llama "hipótesis alterna" (Ha ) Pero por definición se genera otra: la hipótesis nula (H0 ). La hipótesis nula argumenta que el factor que se está explorando no tiene efecto sobre el fenómeno. En este caso: "El estímulo de la economía no tiene que ver con el partido gobernante." 8
  • 9. IMPORTANTE! ¡La hipótesis nula se toma como cierta automáticamente! Es el "abogado del diablo", actuando siempre en nuestra contra. La labor de la prueba de hipótesis es tratar de rechazar la hipótesis nula. Al rechazarla, no significa que la hipótesis alterna se pruebe, solo que debemos seguir investigando otros factores que resulten en el efecto investigado. Si no podemos rechazarla, tampoco significa que nuestra hipótesis alterna carezca de fundamento, solo que quizá no tenemos datos suficientes. "Inocente hasta demostrar lo contrario". 9
  • 10. H0 : El crecimiento económico de Oaxaca no depende de gobiernos de coalición. Ha : El gobierno de coalición PAN-PRD estimular el crecimiento económico de Oaxaca. Ver repo en esta liga: https://github.com/xuxoramos/stat-infer-journalists * https://www.sheffield.ac.uk/mash/what_test Ejemplo en R* 10
  • 11. ¿Cómo anda MX en análisis de datos? 113K Ingenieros de Software al año. 350 Matemáticos, actuarios, físicos y estadísticos. No se conoce la diferencia entre Data Scientist (DS) y Data Engineer (DE). Tenemos miles de Data Engineers talentosos. No tenemos casi Data Scientists. Tenemos muchos DE queriendo ser DS sin las bases de mates o proba. + 11Copyright © @xuxoramos 2017
  • 12. Qué puede salir mal? Telco importante dando créditos a sospechosos criminales. Empresa importante de internet no le atina a predicción de AH1N1. Gran empresa de software crea un bot sexualmente cargado y racista. Empresa de internet clasifica foto de 2 afroamericanos como gorilas. Crisis financiera de 2008. Victoria de Trump. 12Copyright © @xuxoramos 2017
  • 13. Debe México convertirse en un hub de Ciencia de Datos? La frontera norte se cierra a nuestros productos y servicios. Poco petróleo, y a precio muy bajo. Corrupción rampante. Mercado interno débil. Variables macroeconómicas malas. La "mano de obra barata" no será relevante en la era de la automatización. 13Copyright © @xuxoramos 2017
  • 14. Cómo pueden ayudar? Entra a un programa académico completo. Regresa a la escuela a aprender mates. Usa la educación abierta en internet para hacer tu propia maestría. Únete a grupos profesionales. Únete a comunidades. 14Copyright © @xuxoramos 2017
  • 15. Intro to Mathematical Thinking: Stanford + Coursera Intro to Logic: Stanford + Coursera Business Analytics: Wharton + Coursera Data Science Specialization: JHU + Coursera Machine Learning: Stanford + Coursera Executive Data Science: JHU + Coursera "Hága su propia maestría"* * Ver ratings de cursos en https://www.class-central.com/ 15Copyright © @xuxoramos 2017
  • 16. Sociedad de Científicos de Datos de México Grupo más académico. SocialTIC Menos Ciencia, más visualización, periodismo e infoactivismo. Instituto Internacional de Ciencia de Datos Más governance y proyectos "empresariales". Grupos Profesionales 16Copyright © @xuxoramos 2017
  • 17. The Data Pub (FB: /thedatapub, TW: @thedatapub) 1800 miembros. Meetups cada último Jueves del mes. Presentamos 2 proyectos donde el negocio o la vida humana sean primero, las mates segundo, y la tecnología tercero. Cursos de Stats & Machine Learning para Developers. Job posting - porque sigue habiendo confusión entre DS y DE. Badges - porque los endorsements de LinkedIn son "la hoguera de las vanidades". Comunidades 17Copyright © @xuxoramos 2017
  • 18. 18