1. ¿De qué hablaremos?
Deyanira y Zaida Sequeira Ortiz
Universidad de Costa Rica
Escuela de Bibliotecología y Ciencias de la Información
26 de mayo de 2016
2. Qué es la WS?
De qué se trata?
Componentes
3. Semántica =
significado (del
griego)
Conjunto de prácticas
y normas
Sinónimos:
• Web of data
• Linked data (cloud)
• Giant Global Graph (GGG)
• Web 3.0
• Open Data
• Big Data
2012-11-28Introduction to the Semantic Web
4. La WS es “muchas cosas” para “mucha gente”...
Conjunto de tecnologías para la organización y representación del
conocimiento digital que añaden semántica interpretable por las máquinas.
Objetivos:
• Proporcionar un acceso inteligente a la información heterogénea y distribuida en la WWW,
posibilitando a los agentes de software mediar entre las necesidades de los usuarios y los
recursos de información disponibles.
• Creación de una Web de datos con significado (información/conocimiento), de tal forma que un
programa de ordenador pueda aprender tanto acerca de lo que quieren decir los datos, como
acerca de la información necesaria para procesarlos.
Procesamiento global e interoperable de la información Web (marcado
semántico XML + estructuras de metadatos).
5. Los datos en la WS
Almacenar y publicar datos semánticos
Búsquedas en la WS
Tareas para desarrolladores
Aplicaciones
¿Quiénes la usan?
2012-11-28Introduction to the Semantic Web
6. Permitir que las máquinas
comprendan los datos
Mezclar y compartir datos
Ampliar la WWW, no
reemplazarla
2012-11-28Introduction to the Semantic Web
7.
8. Identificador
Representación
El recurso
URI (URL?)
HTML, RDF
Objeto descrito
2012-11-28Introduction to the Semantic Web
El identificador URI distinto a su representación
Los identificadores no cambian
9. Uso extenso de URIs
(o URLs)
Casi todo tiene un URI
• Ejemplos de URIs:
• http://infusion.com/people/tpluskiew
icz
• urn:isbn:1898432023
• http://xmlns.com/foaf/0.1/firstName
2012-11-28Introduction to the Semantic Web
10. El recurso y su representación URIs
Hash URIs
•http://www.example.com/about#alice
•http://www.example.com/about.html
„Normal” URIs
•http://www.example.com/id/bob
•http://www.example.com/people/bob.html
2012-11-28Introduction to the Semantic Web
11. Define el lenguaje universal con
el cual podemos expresar
diferentes ideas en la Web
Semántica.
RDF es un lenguaje simple
mediante el cual definimos
sentencias en el formato de una
TRIPLETA
Sujeto: el recurso al que
nos referimos;
Predicado: el recurso que
indica qué es lo que
estamos definiendo; y
Objeto: puede ser el recurso
o un literal que podría
considerarse el valor de lo
que acabamos de definir
13. Este método para descomponer
cualquier conocimiento en
piezas pequeñas, se llama
TRIPLES o TRIPLETA
El objetivo de los triples o
tripletas es representar
conocimiento, ya no solo datos,
sino conocimientos hechos.
14. Los datos y sus
relaciones se
organizan en
tripletas
Las tripletas
simulan frases
Hay gráficos
que
representan las
tripletas
Mi nombre es
Tomasz
Pluskiewicz.
Tengo 26 años
Trabajo en PGS
Software.
2012-11-28Introduction to the Semantic Web
16. RDF no es más
que un método
general para
descomponer
información en
piezas.
17. Conceptos y estructuras fundamentales
• Descripción del significado
• Semántica
• Metadatos
• Ontologías
• Manipulación de estas descripciones
• Lógica
• Motores de inferencia
• Áreas de aplicación para tecnologías de la WS
• Dublin Core
• Biblioteca Digital Semántica
• MEDLARS y otros ejemplos Web
18. Disciplina, ciencia que estudia el significado de las palabras
con relación a los signos.
La semántica estudia el origen y el significado de las palabras y de otros tantos símbolos
con relación a los objetos que representan .
A instancias de un texto la semántica se ocupará de estudiar la relación que se entabla
entre las diversas palabras del discurso para así desentrañar lo que el mismo nos quiere
comunicar, no centrándose solamente en la literalidad que ostenta cada elemento
lingüístico sino también considerando y teniendo en cuenta el contexto en el que se
encuentra y los recursos literarios empleados en el mismo.
Es decir, aquí hará un abordaje más general, no qué significa tal o cual palabra
aisladamente, sino que todas se analizarán con relación a los factores mencionados para
lograr la comprensión satisfactoria del texto.
19. Vinculada al
significado
Sentido e
Interpretación
Expresiones o
símbolos
Estudia la codificación del
significado
• La denotación:
• relación entre palabra y
aquello a lo que se
refiere.
• La connotación:
• relación entre una
palabra y su significado
de acuerdo a ciertas
experiencias y al
contexto.
24. La representación del
conocimiento bajo el cual está la
identificación de las relaciones
semánticas entre unidades o
grupos de conocimiento.
Para poder convertirnos en seres
más inteligentes, tenemos que
entender de alguna manera el
significado de la información.
25. Para lograrlo necesitamos forjar
conexiones entre los datos para ver
cómo cada pieza de conocimiento se
relaciona con las otras.
Todo signo lingüístico tiene dos caras.
el significante o parte material del
signo y el significado o imagen
mental que sugiere el significante. Aún
hemos de añadir un nuevo elemento:
el referente o elemento real, existente,
al que se refieren tanto significado
como significante. No es lo mismo la
palabra que designa un referente que
el referente mismo.
26. Todo esto sirvió para
articular la
manipulación
automática de estas
estructuras y para
pensar en una web
con significado.
Así pues, el desarrollo de la
Web semántica requiere la
utilización de otros lenguajes
como el lenguaje estructurado
XML y el lenguaje RDF, que
puedan dotar a cada página, a
cada archivo y a cada recursos
o contenido de la red, de una
lógica y un significado, y que
permitan a los ordenadores
conocer el significado de la
información que manejan con el
fin de que esta información
pueda no sólo ser presentada
en pantalla, sino también que
pueda ser integrada y
reutilizada.
27. Para poder explotar la Web semántica, se necesitan lenguajes
semánticos más potentes, esto es, lenguajes de marcado
capaces de representar el conocimiento basándose en el uso de
metadatos y ontologías. Utilizando anotaciones RDF y RDF
Schema se pueden presentar algunas facetas sobre conceptos
de un dominio del conocimiento y se puede, mediante relaciones
taxonómicas, crear una jerarquía de conceptos. Pero se precisan
lenguajes de marcado (basados en RDF) con una mayor
expresividad y capacidad de razonamiento para representar los
conocimientos que contienen las ontologías.
Además, estos lenguajes deben ser estandarizados y
formalizados para que su uso sea universal, reutilizable y
compartido a lo largo y ancho de la Web. Se necesita un
lenguaje común basado en web, con suficiente capacidad
expresiva y de razonamiento para representar la semántica de
las ontologías. De esta forma, la utilización de lenguajes tales
como OWL son una paso más en la consecución de la Web
Semántica.
28. Las palabras que usamos dentro de una página
pueden enviarle a los buscadores señales
acerca del contenido de tu página, lo cual
influencia cómo la interpretan.
29. Por ejemplo, si estamos hablando de
“ejercicio” no basta con añadir
sinónimos como “entrenamiento” y
“acondicionamiento físico”. Hay que
darle un contexto a esta información.
Hay que crear “cubetas semánticas”.
Por ejemplo, si estamos hablando de
como crear una rutina para el gimnasio,
podemos tener una cubeta con
términos como:
• Ejercicio
• Entrenamiento
• Gimnasio
• Cardio
• Press
• Tonificar
30. ERUPCIONES VOLCÁNICAS
• NA Una erupción volcánica es una emisión
violenta en la superficie terrestre de materias
procedentes del interior del volcán.
Exceptuando los géiseres, que emiten agua
caliente, y los volcanes de lodo, cuya materia,
en gran parte orgánica, proviene de
yacimientos de hidrocarburos relativamente
cercanos a la superficie, las erupciones
terrestres se deben a los volcanes.
31. TA
• Manto
terrestre
• Volcanes
TE
• Ceniza
• Lava
• Magma
TR
• Lluvia ácida
• Temblores y
terremotos
• Prevención a
la población
• Volcán
Turrialba
32. Tesauros y
vocabularios
controlados
Dublin core calificado
Taxonomías basadas en
DMoz y DDC
SKOS, WordNet y otros
tesauros
Mapas
semánticos /
Cruces
MarcOnt Ontology –
cubre conceptosde
MARC21, BibTeX y
DublinCore
Servicios de mediación
de MarcOnt – una
estructura abierta de
mediación entre los
legados corrientes y las
normas de metadatos
Integración
de
metadatos
El RDF como modelo
común de datos para
integrar metadatos de
varias fuentes
OWL para trabajar la
semántica de las fuentes
SPARQL : un lenguaje
común para preguntas
33. Una ontología es el resultado de
seleccionar un dominio, y aplicar
sobre el mismo un método para
obtener una representación
formal de los conceptos que
contiene y de las relaciones que
existen entre los mismos.
La ontología se construye en
función del contexto de utilización
38. Esta información está segmentada, pero no aislada dentro de compartimentos exclusivos. La idea
de crear ontologías tiene como objetivo organizar toda esta información, en forma coherente, de
manera que exista un vocabulario común que se generaría a partir de éstas, y un conocimiento
compartido, que permita representarlo, crear nuevo conocimiento, establecer conexiones entre
conceptos que no están explícitos y poder usar estos dominios en todo tipo de fuentes de
información.
Mapeo de una Taxonomía a una ontología.bvs.sld.cu/revistas/aci/vol13_6_05/aci030605.htm
39. De igual manera habrá
que enfatizar los
procesos centrados ya
no en la forma sino en
el contenido. De ahí
que la Construcción de
ontologías, como
herramientas de
adquisición de
conocimiento sean
esenciales para la
creación de Bases de
Conocimiento, Bases
Semánticas.
41. Un desarrollo que
mejorará el acceso y
difusión de la
información y,
reflejará de una
manera más
evidente, la memoria
de la institución.
A través de una
ontología, el
conocimiento de
la Institución se
verá reflejado
integralmente
Esto posibilitará
un mejor
desarrollo de los
sistemas de
información
existentes.
42. Si los metadatos sirven para la
estructuración del contenido,
tanto los tesauros como las
ontologías hacen posible una
semántica para construírlos.
Una ontología ha de entenderse
como un entendimiento común y
compartido de un dominio, que
puede comunicarse entre
científicos y sistemas
computacionales, entre personas
y sistemas heterogéneos.
Una ONTOLOGÍA define el
vocabulario de un área mediante
un conjunto de términos básicos y
relaciones entre dichos
conceptos, así como las reglas
que combinan términos y
relaciones.
43. Las ontologías tratan de
capturar conocimiento
consensuado en un modo
genérico y formal de tal
manera que puedan ser
reutilizadas y compartidas
por distintas aplicaciones
SW y grupos de personas.
44. El objetivo de la Web
Semántica es que toda la
información sea
comprensible por humanos y
computadoras.
Para conseguir esto se
deberá codificar la semántica
de los documentos web
mediante el lenguaje de
metadatos y ontologías.
46. Es toda aquella información descriptiva sobre el contexto, calidad, condición o
características de un recurso, dato u objeto que tiene la finalidad de facilitar su
recuperación, autentificación, evaluación, preservación y/o interoperabilidad. (Eva
Méndez y José A. Senso.)
La Web semántica persigue una Web más inteligente, pretende, ni más ni menos,
convertir la información en conocimiento, algo en lo que llevamos trabajando los
documentalistas durante siglos. Para ello, se basa fundamentalmente en el
marcado semántico y descriptivo no sólo de los documentos, sino también de los
datos, a través de metadatos, información estructurada y legible automáticamente,
sobre la información distribuida en la WWW, que proporcionan a los ordenadores
una mayor capacidad para gestionar y recuperar esos datos.
47. Modelo de metadatos elaborado y auspiciado
por la DCMI (Dublin Core Metadata Initiative),
organización dedicada a fomentar la
adopción extensa de los estándares
interoperables de los metadatos y promover
el desarrollo de los vocabularios
especializados de metadatos para describir
recursos para permitir sistemas más
inteligentes el descubrimiento del recurso.
Las implementaciones de Dublin Core usan
generalmente XML y se basan en el
Resource Description Framework. Dublin
Core se define por ISO en su norma ISO
15836 del año 2009, y la norma NISO
Z39.85-2012.
48.
49. 1. NOMBRE DEL ELEMENTO: TITLE (TÍTULO)
2. NOMBRE DEL ELEMENTO: CREATOR (CREADOR)
3. NOMBRE DEL ELEMENTO: SUBJECT (MATERIA)
4. NOMBRE DEL ELEMENTO: DESCRIPTION ( DESCRIPCIÓN)
5. NOMBRE DEL ELEMENTO: PUBLISHER (EDITOR)
6. NOMBRE DEL ELEMENTO: CONTRIBUTOR (COLABORADOR)
7. NOMBRE DEL ELEMENTO: DATE (FECHA)
8. NOMBRE DEL ELEMENTO: TYPE (TIPO DE RECURSO)
9. NOMBRE DEL ELEMENTO: FORMAT (FORMATO)
10. NOMBRE DEL ELEMENTO: IDENTIFIER (IDENTIFICADOR)
11. NOMBRE DEL ELEMENTO: SOURCE (FUENTE)
12. NOMBRE DEL ELEMENTO: LANGUAGE (IDIOMA)
13. NOMBRE DEL ELEMENTO: RELATION (RELACIÓN)
14. NOMBRE DEL ELEMENTO: COVERAGE (COBERTURA)
15. NOMBRE DEL ELEMENTO: RIGHTS (DERECHOS)
16. NOMBRE DEL ELEMENTO: AUDIENCE (AUDIENCIA) .
17. NOMBRE DEL ELEMENTO: PROVENANCE (PROCEDENCIA) .
18. NOMBRE DEL ELEMENTO: RIGHTSHOLDER (TITULARES DE LOS DERECHOS)
19. NOMBRE DEL ELEMENTO: INSTRUCTIONALMETHOD (MÉTODO DE ENSEÑANZA)
20. NOMBRE DEL ELEMENTO: ACCRUALMETHOD (MÉTODO DE INCREMENTO) (DE
UNA COLECCIÓN)
21. NOMBRE DEL ELEMENTO: ACCRUALPERIODICITY (PERIODICIDAD DEL
INCREMENTO)
22. NOMBRE DEL ELEMENTO: ACCRUALPOLICY (POLÍTICA DE INCREMENTO).
51. Aquella que integra los recursos y tecnologías de una biblioteca digital y utiliza las
herramientas y recursos de la WS.
52. Los dos
beneficios
principales de las
BDS
Nuevos
paradigmas de
búsqueda en el
espacio informativo
Búsqueda basada
en ontologías /
búsqueda
facetada
Búsqueda
apoyada por la
comunidad
Ofrece
interoperabilidad a
nivel de los datos
Integra
metadatos de
fuentes
heterogénea
Interconecta
diferentes
sistemas de B
digitales
53. Jorge E. Giraldo Plaza
Revista Facultad de
Ingeniería, UPTC, I
Semestre 2011, vol.
20, No. 30
54. Explicación gradual:
• La Web es un conjunto de recursos y enlaces
• Estos recursos y enlaces están identificados por URIs
• Los recursos pueden tipificarse
• Para un usuario, esto convierte a la web en algo más
interesante
• Las máquinas, por su parte tienen que ser capaces de
procesar información legible por máquina, permitiendo
trabajar personas y máquinas a al vez e intercambiar
el conocimiento de una forma más eficaz.
Dra. Eva Méndez emendez@bib.uc3m.es
55. Con una Web Semántica +
Todo el conocimiento de un bibliotecario.
WEB SEMÁNTICA BIBLIOTECARIO
Dra. Eva Méndez emendez@bib.uc3m.es
56. La creación y aplicación
de metadatos.
Organización de la
información.
Creación de estándares
terminológicos (Tesauros,
ontologías, etc.)
Lenguajes formales
Procesamiento
automático de la
información.
Inteligencia Artificial.
Dra. Eva Méndez emendez@bib.uc3m.es
58. Lo que Internet
necesita es un/a
bibliotecario/a
Encontrar lo que
queremos en la Web
debería de ser igual
de fácil que
encontrar un libro en
una biblioteca.
Así será, si Laura
consigue lo que
quiere.
Dra. Eva Méndez emendez@bib.uc3m.es
59. Cada vez más las
organizaciones se
dan cuenta de que
necesitan bibliotecas
digitales…
• …aunque no las
llamen así.
La representación
común de los datos y
una arquitectura
común reduce los
costes (técnicos y
sociales) y es más
eficaz.
Las “organizaciones
de la memoria digital”
(bibliotecas, archivos
y museos) deben ser
una fundamento
clave para apoyar el
desarrollo de la Web
Semántica (E. Miller)
Demostrar la validez
de los servicios de
agregación y/o
sindicación de
contenidos (RSS,
OAI).
60. Convergencia inminente de bibliotecas, museos y archivos
digitales como “organizaciones de la memoria” (EDL)
Convergencia de tecnologías facilitadoras (RDF, ontologías,
etc.) para apoyar la convergencia de bibliotecas digitales,
museos digitales y archivos digitales
Desarrollo y uso de estándares de definición terminológica
Web (SKOS, Zthes, etc.) “webización” de tesauros y
sistemas de organización y representación del conocimiento.
Las “BD” (Sistemas y servicios de información digital)
necesitan identificar las áreas técnicas y sociales donde se
solapan la WS y las Bibliotecas digitales.
61. En qué se aplica?
Quiénes están a cargo?
Dónde se aplica?
Dónde se aprende?
Enlaces
Libros
62. Para qué sirve la WS?
2012-11-28Introduction to the Semantic Web
63. Dbpedia
Freebase
Geonames
Social data
Media
Government data
Publications
Many many other
datahub.io
lod.openlinksw.com
data.gov
data.gov.uk
datadotgc.ca
openlibrary.org
bnb.data.bl.uk
http://richard.cyganiak.de/2007/10/lod/lod-datasets_2011-09-19_colored.html
64. Heterogeneidad sintáctica
(microisis, Marc, DC)
Recomendación: XML
Heterogeneidad estructural
(Excel, Word, ppt)
Recomendación : XML,
XPath, Xquery
Heterogeneidad semántica
(el significado de los
datos se expresa de distintas
formas) Recomendación:
RDF, OWL
65. La creación de ontologías
Anotación semántica
Sistema de preguntas/búsquedas
66. La WS maneja paquetes dinámicos que determinan
cuáles servicios o combinaciones de servicios se
requieren o permiten, mediante reglas específicas que
determinan un precio final (en el caso del turismo y el
transporte).
en el campo del turismo, de la bioinformática y de las
bibliotecas digitales.
La WS se usa para acercar servicios heterogéneos de la
web, los procesos, aplicaciones, datos y componentes
que residen en ambientes distribuidos.
67. “La computación en grid o en
malla es un nuevo paradigma de
computación distribuida en el cual
todos los recursos de un número
indeterminado
de computadoras son englobados
para ser tratados como un
único superordenador de manera
transparente.
68. La grid semántica es la
solución adecuada para que
las comunidades científicas
puedan intercambiar sus
datos y trabajar en
colaboración..
La información, los recursos
y los servicios
computacionales se
describen de modo
normalizado para poder
compartirlos mediante
máquinas
69. Las empresas se enfrentan a tres
obstáculos para integrar sus sistemas
complejos: de contenidos en formatos
diversos, la naturaleza variada de los
contenidos, y la necesidad de extraer
“inteligencia” de esos contenidos.
contenidos en formatos
diversos
naturaleza variada de los
contenidos
necesidad de extraer
"inteligencia" de esos contenidos
70. Aquí entran en juego
los datos semánticos
que agregan valor a
las informaciones,
porque ofrecen datos
contextualizados e
informan sobre sus
posibles usos.
71. lo encuentran en la WS
Deberán trabajar en
las siguientes áreas:
Extraer, organizar y
normalizar la información
proveniente de fuentes
diversas con recursos
heterogéneos
Identificar conocimiento
relevante en ciertos
dominios de la web (la
curaduría de contenidos)
con formatos y recursos
heterogéneos.
72. Permitir mayores niveles
de automatización de los
procesos de extracción,
normalización y
mantenimiento del
conocimiento y los
contenidos, para lograr la
eficiencia que produce la
escala.
Las empresas han de
trabajar esto:
Analizar y establecer
correlaciones entre la
información extraída, para
descubrir nuevas
relaciones entre los
documentos, basándose
en la semántica, no en la
sintaxis, para potenciar la
toma de mejores
decisiones.
73. Hacer un uso eficiente de
los contenidos y el
conocimiento extraídos,
mediante el uso de
herramientas que
permitan búsquedas
(preguntas)
contextualizadas, y el
análisis de información
relevante y útil.
74. IBM DB2
Open Services
Lifecycle
Collaboration
Linked Data
Platform
Oracle 11g
Triplestore
Reasoner
IBM Oracle
75. Miles de datos
Algunos en RDF
El proyecto open data
del gob de USA con 200
conjuntos de datos
Open Government
Partnership (50+
countries)
Investigación en
genes
Procesamiento del
lenguaje
Wiki de medios
semánticos
Government/public data Academic work
76. Semantic Technology & Business
Conference
European Semantic Web
Symposium
International Semantic Web
Conference
International World Wide Web
Conference
International Conference on
Semantic Web and Web Services
Semantic Web Applications and
Tools for Life Sciences
• Berlin, London, New York,
San Francisco
78. David Wood, Linked Data, Manning
Bob DuCharme, Learning SPARQL, O’Reilly
Toby Segaran, Programming the Semantic Web,
O’Reilly
John Hebeler, Semantic Web Programming,
Wiley
David Siegel, Pull: The Power of the Semantic
Web to Transform Your Business, Portfolio