15. Big Data en las Oficinas Nacionales de
Estadística
http://www1.unece.org/stat/platform/download/attachments/58492100/Big+Data+HLG+Final.docx?version=1&modificationDate=1362939424184
Comisión Económica de las Naciones Unidas para Europa
@abxda
16. • It is clear that during the next two years there is
a need to identify a few pilot projects that will
serve as proof of concept.
• Statistical organisations are, therefore,
encouraged to address formally Big data issues
in their annual and multi-annual work
programmes by undertaking research and pilot
projects in selected areas and by allocating
appropriate resources for that purpose.
Big Data en las Oficinas Nacionales de
Estadística
@abxda
17. • 'new' exploration and analysis methods are
required: Visualization methods, Text mining, and
High Performance Computing.
• To use Big data, statisticians are needed with a
different mind-set and new skills. The
processing of more and more data for official
statistics requires statistically aware people with an
analytical mind-set, an affinity for IT (e.g.
programming skills)
Big Data en las Oficinas Nacionales de
Estadística
@abxda
19. Experto en
computación y
desarrollo
avanzados
(Big Data)
Experto en
Modelado
Estadístico
Experto en
el dominio de
datos
Unicornio
Zona
peligrosa!
Investigación
tradicional
Machine
learning
CIENCIA
DE
DATOS
http://www.anlytcs.com/2014/01/data-science-venn-diagram-v20.html
@abxda
20. Internet de las cosas
Internet de las personas
Internet de las ideas
Internet del todo
Datos
Crudos
hdfs://
Información
(Significado)
Tomar
Decisiones
Actuar
¿quién?
¿cuántos?
¿por qué?
¿qué?¿Dónde?
Análisis de Datos
Estadística Machine Learning
Estratificaciones
Análisis de Regresión
Muestreo
Mucho más…
Análisis de Redes (Grafos)
Minería de Datos
Volumen
Ciencia de Datos
(Transforma/Modela)
Cómputo Distribuido y Paralelo
Arquitectura
Big Data & Ciencia de Datos
@abxda
21.
22. ¿Qué clase de #BigData es esta?
En operaciones de Machine Learning, una sola tarjeta de Video, es 45 veces
mas poderosa que el XEON mas rápido.
2560 CUDA CORES
@abxda
34. Proceso de Machine Learning
Muestra de Tuits
Etiquetado Manual
Representación numérica
http://scikit-learn.org/
http://www.r-project.org/
Machine Learning
Tuits en Tiempo Real
Clasificador
Indicador
de sentimiento
@abxda
Entrenamiento
Producción
49. Proceso de Machine Learning
Imágenes de Satélite
Imágenes
Etiquetado
por Expertos
Representación numérica
http://scikit-learn.org/
http://www.r-project.org/
Machine Learning
Aprendizaje Estadístico
Imágenes Continuas
Clasificador
Automático
Clases de Cobertura
De Suelo
@abxda
Entrenamiento
Producción
51. Siguientes Pasos
• Colaboraciones Internacionales con ONU, para
explorar el uso de Big Data en el calculo de los
Indicadores de Desarrollo Sostenible.
• Ampliar los trabajos a mas Fuentes de Big Data:
Datos de Telefonía Móvil, Imágenes de Satélite, etc.
• Salud Mental en Adolescentes con Data2x y
Instituto Nacional de Psiquiatría
@abxda
Academia, Supercomputadoras, Ciencias Naturales, Aquí se proponen 2 ideas fundamentales de Big Data: que los algoritmos de procesamiento sean los que viajen (Computo Distribuido) y dividir los consuntos masivos en pedazos mas pequeños (Sistemas de Archivos Distribuidos). Que las maquinas que tienen los datos los procesen en lugar de transferir los datos para procesarlos en otro lugar, data locality.