El documento habla sobre la publicación y reutilización de datos abiertos del sector público. Explica que hay una explosión de datos disponibles y las razones para publicarlos, como facilitar la investigación y la transparencia. Luego describe cómo publicar los datos siguiendo el modelo de estrellas, desde formatos no estructurados hasta enlazarlos usando RDF para identificarlos con URIs. Concluye mencionando iniciativas españolas de datos abiertos y nuevos retos como la legalidad, privacidad y semántica.
DIGNITAS INFINITA - DIGNIDAD HUMANA; Declaración del dicasterio para la doctr...
Datos abiertos: Reutilización de información en el sector público
1. Datosabiertos: Reutilización de información en el sector público Jose Emilio LabraGayo Universidad of Oviedo, Spain http://www.di.uniovi.es/~labra
2. Esquema Explosión de datos Razones para publicar los datos ¿Cómo publicar los datos? Datos abiertos vs datos enlazados
3. Explosión de datos Contenido generado por usuarios Información de los gobiernos Internet de las cosas
4. Razones para liberar datos Facilitan la investigación Tasa de descubrimiento se acelera con mejores accesos a los datos Por el bien común de la humanidad
5. Razones para liberar datos Los sistemas abiertos facilitan las contribuciones externas
6. Razones para liberar datos Datos = base para la cooperación Para realizar tareas comunitarias se requiere acceso a datos comunes
7. Razones para liberar datos Eficiencia y calidad de los sistemas Hay muchos datos comunes que no están publicados Ej. ¿Lista de municipios?
8. Razones para liberar datos Trasparencia Fomentar participación Generar confianza Evaluar al gobierno
9. Razones para liberar datos Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los datos parcial o totalmente abiertos de Google, Flickr, Wikipedia, Slideshare y muchos otros proyectos…
16. El mayor reto = Integración En general, el problema no es informatizar algo El problema es integrar los sistemas Interoperabilidad No basta con publicar datos…
17. Modelo de Estrellas* * Enunciado por TimBerners Lee en Gov 2.0 Expo 2010 http://www.youtube.com/watch?v=ga1aSJXCFe0
18. Formatos no estructurados Formatos “caja negra”: Imágenes, vídeos, música, etc. Formatos binarios: PDF, PS, etc. Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc. ★
19. Ejemplo: Servicio Público de Empleo ★ http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/
20. ★ ★ Formatos estructurados Los datos tienen una estructura Ejemplo: Hojas de cálculo Problema con formatos propietarios Requieren herramientas que no son públicas
21. Ejemplo: Servicio Público de empleo ★ ★ http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9
22. ★ ★ ★ Formatos no propietarios Utilizar formatos abiertos estructurados Ejemplos: CSV, HTML Problema: Contenido depende del contexto
23. CSV ★ ★ ★ “Commaseparatedvalues” valores delimitados por comas
24. HTML ★ ★ ★ HTML está pensado para representar información que se visualiza en el navegador El procesamiento puede requerir “screenscrapping”
25. ★ ★ ★ ★ URIs para identificar datos Utilizar una URI para identificar un dato Diferentes representaciones para cada tipo de dato Negociación de contenido http://puzzles.org/pieza23471
26. XML ★ ★ ★ ★ XML permite representar información estructurada Los documentos pueden validarse (XML Schema) El significado de las etiquetas depende de la aplicación
27. ★ ★ ★ ★ Negociación de contenido El protocolo de comunicación permite que el navegador informe al servidor del tipo de contenido que prefiere El servidor devuelve una representación diferente según las preferencias del cliente servidor cliente
28. ★ ★ ★ ★ ¿2 representaciones para lo mismo? Ejemplo: Códigos de barras
29. ★ ★ ★ ★ ★ Enlazar con otros datos Enlazar datos identificados mediante URIs Objetivo: Facilitar la identificación de nuevos conjuntos de datos Nuevo conocimiento
30. ★ ★ ★ ★ ★ RDF RDF es un modelo de representación en forma de grafo RDF (ResourceDescription Framework) Las propiedades tienen valores globales (URIs) http://obs.org#totalDesempleados 4530 dato http://obs.org#año http://obs.org#municipio 2009 Oviedo
31. ★ ★ ★ ★ ★ RDF es composicional 2 grafos independientes pueden componerse El lenguaje SPARQL permite realizar consultas a grafos
32. ★ ★ ★ ★ ★ RDF como representación Negociación de contenido HTML: información para navegadores RDF: información para sistemas automáticos URI http://tiempo.com/prevision/oviedo 303 SeeOther http://tiempo.com/prevision/Oviedo/informe.html 303 SeeOther http://tiempo.com/prevision/Oviedo/informe.rdf
42. Conclusiones Publicación de datos abiertos De datos abiertos a datos enlazados Nuevos retos: Legalidad: licencias, copyrights, patentes… Privacidad Temporalidad Semántica e inferencia
43. Fin de la presentación Másinformación: http://www.di.uniovi.es/~labra
44. Agradecimientos Algunas ideas o partes de esta presentación han sido tomadas de otras presentaciones similares de: IvanHermann, Jacco van Ossenbruggen, Nova Spivak, IanHorrocks, Tim Berners-Lee, Jose Manuel Alonso, Svein-Magnus Sørensen, Jose Luis Marín. También se hanutilizadodatosaccesibles en Google, Flickr, Wikipedia, Slideshare, etc. a cuyosautoresoriginales me hubieragustadocitar.