Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Administración Pública y Linked Data: oportunidades y riesgos
1. La Web de Datos:
Oportunidades y Riesgos
Oscar Corcho, Boris Villazón-Terrazas, Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
{ocorcho,bvillazon,asun}@fi.upm.es
@ocorcho, @linkeddataspain
Agradecimientos: Luis M. Vilches, Victor Saquicela, Guillermo
Alvaro Rey, Olaf Hartig, Juan Sequeda, and many others that we
may have omitted.
Disponible en: http://www.slideshare.net/ocorcho/
Trabajo distribuido bajo la licencia Creative Commons
Attribution-Noncommercial-Share Alike 3.0
2. Administración Pública y la
Web de Datos:
Oportunidades y Riesgos
Oscar Corcho, Boris Villazón-Terrazas, Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
{ocorcho,bvillazon,asun}@fi.upm.es
@ocorcho, @linkeddataspain
Agradecimientos: Luis M. Vilches, Victor Saquicela, Guillermo
Alvaro Rey, Olaf Hartig, Juan Sequeda, and many others that we
may have omitted.
Disponible en: http://www.slideshare.net/ocorcho/
Trabajo distribuido bajo licencia Creative Commons
Attribution-Noncommercial-Share Alike 3.0
3. Contenido
• Datos Abiertos Gubernamentales (Open Government
Data)
• Marco legal
• Retos, oportunidades y limitaciones
• La Web de Datos (Linked Data)
• Contexto
• Principios y tecnologías
• Linked Open Data
• La Web de Datos Abiertos Gubernamentales (Linked
Open Government Data)
• En el mundo y en España
• Revisitando el Real Decreto 1495/2011
• Conclusiones
3
4. Contexto de esta charla…
• Las fechas de estas jornadas no podían ser más acertadas…
• BOE, Martes 8 de noviembre de 2011 (¡¡hace dos días!!)
• http://boe.es/boe/dias/2011/11/08/pdfs/BOE-A-2011-17560.pdf
• Real Decreto 1495/2011, de 24 de octubre, por el que se
desarrolla la Ley 37/2007, de 16 de noviembre, sobre reutilización
de la información del sector público, para el ámbito del sector
público estatal
• Algunas preguntas que me gustaría explorar hoy…
• ¿Qué significa, en términos de coste y esfuerzo, para una administración
pública?
• ¿Cuáles son los retos sociales y tecnológicos asociados a este decreto?
• ¿Cuáles son las principales oportunidades para las administraciones
públicas, los negocios y los investigadores?
• ¿Cómo aseguro que mis datos se utilizan adecuadamente?
4
5. Marco legal e iniciativas Open Data
• Open Access Initiative (2001)
• Información científica en la red; > 510 organizaciones
• Convención de Aarhus (1998)
• Derecho de participación y acceso; 41 países y la UE
• Directiva PSI
• Reutilización de la PSI
• Convención sobre el acceso a documentos oficiales (2009)
• Firmada por 12 países
• Bélgica, Finlanda, Noruega, Suecia, Hungría, Estonia, Lituania, Eslovenia, Georgia,
Montenegro, Serbia y Macedonia
• Ley 37/2007. Reutilización de la PSI
• Ley 11/2007. Acceso de los ciudadanos a los servicios públicos, y Derecho a la
calidad de los servicios
• RD 4/2010 Esquema Nacional de Interoperabilidad
• Estándares abiertos
• Principio de neutralidad tecnológica
• Software de fuentes abiertas
• RD 1495/2011 Desarrolla la Ley 37/2007
Adaptado de: Antonio Rodríguez Pascual (IGN)
6. Ley 37/2007 y RD 1495/2011 Reutilización Datos
Públicos
7. Open Data y Open Government
• 8/11/2011 - http://www.deri.ie/about/open-data
Fuente: Antonio Rodríguez Pascual (IGN)
8. ¿Cómo publicar datos (en la red)?
• 1) En un tablón de anuncios
• Para los que tienen mucho tiempo libre
• 2) En una página
• Para usuarios humanos
• 3) En un fichero
• Para ser cargados en un Sistema de Información (XML, HTML,
CSV, etc.)
• Con suerte, no es un PDF escaneado
• 4) Mediante un servicio web
• Para ser consultados por SI y personas
• Permite generar servicios de valor añadido
• Integrarlo en la lógica de la aplicación del usuario
Adaptado de: Antonio Rodríguez Pascual (IGN)
11. Web clásica. Limitaciones
• La publicación de datos se puede hacer en páginas HTML,
ficheros (CSV, HTML, XML, etc.), o servicios
• Limitaciones
• Los datos no están enlazados y no están siempre preparados para
la Web
• Los datos deben ser obligatoriamente descargados para poderlos
consumir (cuando son muy grandes generan problemas)
• Estos datos son difíciles de integrar si proceden de la misma o
distintas instituciones
• Ejemplo: Rioja, La frente a La Rioja en algunos campos
• Ejemplo: código INE frente a código IGN frente a códigos de
Catastro
• Un trabajador de la sociedad del conocimiento (periodista,
político, analista, etc.):
• ¿Hay correlación entre cuánto llovió este año en Adeje, el número
de turistas recibidos y la evolución de la tasa de desempleo?
11
14. Ejemplos con datos reales…
• ¿Cuántos embalses hay en España?
select COUNT(distinct ?x)
WHERE {?x a <http://geo.linkeddata.es/ontology/Embalse>}
1644
• ¿Cuál es el número máximo de desempleados en los
últimos cinco años en alguna Comunidad Autónoma?
14
15. Contenido
• Datos Abiertos Gubernamentales (Open Government
Data)
• Marco legal
• Retos, oportunidades y limitaciones
• La Web de Datos (Linked Data)
• Contexto
• Principios y tecnologías
• Linked Open Data
• La Web de Datos Abiertos Gubernamentales (Linked
Open Government Data)
• En el mundo y en España
• Revisitando el Real Decreto 1495/2011
• Conclusiones
15
17. ¿Qué es la Web de Linked Data?
• Una extensión de la Web actual donde se publican datos
de acuerdo a cuatro principios (a modo de best practice)
• http://www.w3.org/DesignIssues/LinkedData.html
• Se utilizan URIs para hacer referencia a cosas (estación
meteorológica, observación, punto de interés, embalse,
etc.)
• http://aemet.linkeddata.es/resource/WeatherStation/id08363
• http://geo.linkeddata.es/resource/Embalse/Burguillo%2C%20E
mbalse%20del
• Se usa el protocolo HTTP para acceder
a la información de las URIs
• Cuando se obtienen datos de una URI o se
utiliza un lenguaje de consulta (SPARQL),
se obtienen datos en un formato
estándar (RDF)
• Se incluyen enlaces a otras URIs
http://www.ted.com/talks/tim_berners_lee_on
18. RDF y RDF Schema
Base de datos XML RDF(S)
Esquema RDF Schema
Datos RDF
• Estándares del W3C
18
19. RDF – Resource Description Framework
• RDF es un lenguaje basado en tripletas para expresar
datos y metadatos
• Las tripletas consisten en sujeto, predicado y objeto
property
Subject Object
Statement
“San Cristobal de la Laguna”
rdfs:label
geo:formaParteDe
ign:LaLaguna ign:SantaCruzdeTenerife
geo:formaParteDe dbpedia:población
ign:Adeje 1.027.914
19
20. SPARQL
“San Cristobal de la Laguna”
rdfs:label
geo:formaParteDe
ign:LaLaguna ign:SantaCruzdeTenerife
geo:formaParteDe dbpedia:población
ign:Adeje 1.027.914
• Consulta: “Dame los municipios que pertenecen a la provincia
de Santa Cruz de Tenerife”
SELECT ?s
WHERE { ?s geo:formaParteDe ign:SantaCruzdeTenerife.}
geo:formaParteDe
?s ign:SantaCruzdeTenerife
• Resultado: ign:LaLaguna and ign:Adeje
20
25. Contenido
• Datos Abiertos Gubernamentales (Open Government
Data)
• Marco legal
• Retos, oportunidades y limitaciones
• La Web de Datos (Linked Data)
• Contexto
• Principios y tecnologías
• Linked Open Data
• La Web de Datos Abiertos Gubernamentales (Linked
Open Government Data)
• En el mundo y en España
• Revisitando el Real Decreto 1495/2011
• Conclusiones
25
26. Iniciativas Open Government
• Actividad W3C eGovernment
• Mejorar el acceso al Gobierno a través de un mejor uso de la Web
• Publicar Open Government Data
• Grupo de trabajo W3C Government Linked Data WG
• Open Knowledge Foundation
• Manual Open Data
• Las cinco estrellas del Linked Open Government Data
26
35. http://aemet.linkeddata.es/visualizer
1. Especificación 2. Modelado
250 estaciones automáticas (presión, humedad, etc.)
Datos de las estaciones en ficheros CSV en un servidor FTP
4. Pûblicación y Explotación
3. Generación
Python scritps
35
36. http://webenemasuno.linkeddata.es
1. Especificación 2. Modelado
Escenario en el contexto del turismo y los viajes, donde
el contenido se agrega de distintas plataformas.
Contenidos heterogéneos (imágenes, guías de viaje,
vídeos, noticias)
4. Publicación y Explotación
3. Generación
36
37. Contenido
• Datos Abiertos Gubernamentales (Open Government
Data)
• Marco legal
• Retos, oportunidades y limitaciones
• La Web de Datos (Linked Data)
• Contexto
• Principios y tecnologías
• Linked Open Data
• La Web de Datos Abiertos Gubernamentales (Linked
Open Government Data)
• En el mundo y en España
• Revisitando el Real Decreto 1495/2011
• Conclusiones
37
38. Analicemos el Real Decreto 1495/2011. Documentos
Metadatos generales el documento
dc:title
dc:author
dc:description
…
Datos del documento
Asunción Gómez Pérez 38
39. Identificadores. Adendo a RD 4/2010
http://www.cabinetoffice.gov.uk/media/301253/public_sector_uri.pdf
39
42. Contenido
• Datos Abiertos Gubernamentales (Open Government
Data)
• Marco legal
• Retos, oportunidades y limitaciones
• La Web de Datos (Linked Data)
• Contexto
• Principios y tecnologías
• Linked Open Data
• La Web de Datos Abiertos Gubernamentales (Linked
Open Government Data)
• En el mundo y en España
• Revisitando el Real Decreto 1495/2011
• Conclusiones
42
43. Conclusiones
• La apertura de datos es una gran oportunidad…
• Para aumentar la interoperabilidad dentro y fuera de nuestra
organización
• Para incrementar la transparencia
• Para incrementar la productividad, evitando la duplicación de
esfuerzos y grandes costes para los negocios que usan tus datos
• Para aumentar la creatividad entre tus ciudadanos y negocios
• Los datos abiertos son obligatorios…
• Las leyes actuales nos obligan cada vez más a unirnos al club
• Linked Open Government Data es una de las mejores opciones
para abrir tus datos
• Formatos estándar
• Facilidad de uso para desarrolladores (infomediarios)
• No se reemplaza lo que tienes actualmente
Asunción Gómez Pérez 43
44. Conclusiones
• La apertura de datos tiene riesgos importantes…
• Sobre todo si no lo haces ;-)
• Tu administración pública continuará siendo cara
• Tus ciudadanos comenzarán a pedir datos abiertos
• Tus negocios no crecerán ni serán competitivos
Asunción Gómez Pérez 44
45. Administración Pública y la
Web de Datos:
Oportunidades y Riesgos
Oscar Corcho, Boris Villazón-Terrazas, Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
{ocorcho,bvillazon,asun}@fi.upm.es
@ocorcho, @linkeddataspain
Agradecimientos: Luis M. Vilches, Victor Saquicela, Guillermo
Alvaro Rey, Olaf Hartig, Juan Sequeda, and many others that we
may have omitted.
Disponible en: http://www.slideshare.net/ocorcho/
Trabajo distribuido bajo licencia Creative Commons
Attribution-Noncommercial-Share Alike 3.0
46. (@linkeddataspain ,http://red.linkeddata.es/)
• Facilitar el intercambio y transferencia de conocimientos
• Aumentar la visibilidad internacional de la investigación española
• Aumentar la cohesión interna y explorar sinergias (más de 300 personas)
• Solicitar nuevos proyectos
• Unir esfuerzos en proyectos en curso
• Evangelizar a la industria, a las Administraciones Públicas y a otros grupos de investigación
• Instalación y mantenimiento de infraestructura
• Listas de correo (https://listas.fi.upm.es/mailman/listinfo/redlinkeddata), website, blog,
repositorios y hosting de datos (linkeddata.es), software y material docente.
• Creación de itinerarios formativos
• Fomento de la movilidad de investigadores
• Organización de eventos
• Reuniones plenarias y workshops
• Talleres y cursos de formación
• voCamps temáticos, Linked Data meetups y desayunos de trabajo
46