SAPIENZA UNIVERSITA’ DI ROMA
DIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE E GEOGRAFICHE
SCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARI
Anno accademico 2012-2013
Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHE
Prof. Giovanni Solimine
Modulo integrativo
INFORMATICA PER LE BIBLIOTECHE
Prof. Maurizio Caminito
1. WEB SEMANTICO:
Ontologie e RDF
SAPIENZA UNIVERSITA’ DI ROMA
DIPARTIMENTO DI SCIENZE DOCUMENTARIE, LINGUISTICO-FILOLOGICHE E
GEOGRAFICHE
SCUOLA DI SPECIALIZZAZIONE IN BENI ARCHIVISTICI E LIBRARI
Anno accademico 2012-2013
Insegnamento: INFORMATICA PER GLI ARCHIVI E LE BIBLIOTECHE
Prof. Giovanni Solimine
Modulo integrativo
INFORMATICA PER LE BIBLIOTECHE
Prof. Maurizio Caminito
1
2. Il Web Semantico
ha una architettura a livelli
Il Web Semantico è un sistema controllato di organizzazione di dati.
Adotta una serie di standard:
Al livello superiore si pone il livello ontologico.
Una ontologia descrive le relazioni tra i tipi di elementi
• lo standard URI (Uniform Resource Identifiers), per la definizione
univoca di indirizzi Internet
• l’RDF (Resource Description Framework) e RDF Schema, che
costituiscono il linguaggio per descrivere le risorse e i loro tipi
(derivano da XML).
2
3. La piramide del WEB SEMANTICO
L’architettura del Web Semantico si compone di vari livelli:
• i dati
• i metadati
• i concetti che esprimono le relazioni fra i dati
• un linguaggio che descriva la struttura dei dati
3
4. L’architettura del WEB SEMANTICO
E’ importante lo schema utilizzato per archiviare le informazioni.
Lo schema RDF è un insieme di regole sull'organizzazione dei dati.
Definisce relazioni fra i dati.
I metadati devono mappare i dati rispetto a classi, o concetti, di
questo schema.
In questo modo si hanno strutture in grado di descrivere e
automatizzare i collegamenti esistenti fra i dati.
Il Web Semantico è, come l'XML, un ambiente dichiarativo,
in cui si specifica il significato dei dati.
La semantica dei dati consiste nel dare alla macchina delle informazioni
utili in modo che essa possa utilizzare i dati nel modo corretto.
4
5. Gli standard del WEB SEMANTICO
Il consorzio W3C
ha prodotto una serie di standard
per descriver e organizzare
i metadati semantici:
l’RDF e l’OWL. 5
6. Il Web Semantico
e i livelli di controllo
Prevede dei livelli di controllo e validazione interna:
• Adotta la firma digitale
• Prevede un livello di “proof”
• Porta ad un risultato univoco e credibile (livello
“trust”)
6
8. URI: il primo mattone
L’architettura del Web Semantico si basa su una pila di
tecnologie, primo concetto delle quali è il fatto che in
rete è possibile assegnare un riferimento univoco – URI
- a qualsiasi cosa.
Anche una persona può essere rappresentata tramite
l’indirizzo della sua pagina web o quello della sua
casella di posta elettronica (o un quadro può essere
rappresentato da una foto o dalla documentazione
pubblicata sul sito del museo che lo conserva).
8
9. MEMO: cos’è l’URI
URI è acronimo di Uniform Resource Identifier: un
indirizzo che, in forma compatta, consente di
identificare una qualsiasi risposta come una pagina
web, un documento, un'immagine, un indirizzo e-
mail e così via. Gli URI sono definiti utilizzando una
specifica sintassi, facente riferimento all'uso di
differenti protocolli. URL (Uniform Resource
Locator) e URN (Uniform Resource Name) possono
essere considerati sottoinsiemi di URI.
9
10. L’ONTOLOGIA
• ONTOLOGIA in filosofia:
si riferisce alla struttura, all’essenza e alle
proprietà dell’ESSERE (ontos + logos), di ciò
che esiste.
• ONTOLOGIA in informatica:
una descrizione formale di un insieme di
concetti e delle relazioni che intercorrono tra
essi. 10
11. Ontologia: alcune definizioni 1
Un’ONTOLOGIA è una struttura dati
gerarchica che contiene tutte le entità
rilevanti, le relazioni esistenti fra di esse, le
regole, gli assiomi ed i vincoli specifici del
dominio. 11
12. Ontologia: alcune definizioni 2
“L’ontologia e’ come un vocabolario (tassonomia) di
concetti, che rappresenta un determinato dominio di
interesse, dotato di un insieme di relazioni tra i
concetti
stessi che consentono di capire come sono legati fra
loro” [Josephson&other, 99]
«Un’ontologia e’ una collezione di frasi che
definiscono
le relazioni tra concetti e specificano le regole logiche»
[Tim Berners-Lee, 99]
12
13. WEB SEMANTICO:
un esempio di applicazione di ontologie
Si può fare una ricerca del tipo: quali sono…
le aziende (soggetto)
che hanno come servizio (predicato)
la fornitura di scarpe (oggetto)?
N.B. Questa query è diversa da quella che si potrebbe
fare ad un motore di ricerca, a cui si propongono le
tre parole: azienda, servizio e scarpe, ma senza mai
esprimere il legame fra di essi. Da qui derivano
appunto le imprecisioni dei motori di ricerca. 13
14. WEB SEMANTICO: le Ontologie
ONTOLOGIE
(descritte con l’OWL Web Ontology Language)
sono collezioni di informazioni.
I più comuni tipi di ontologia per il Web:
• tassonomia (definisce classi e sottoclassi di oggetti)
• regole di inferenza (definisce relazioni tra di entità)
14
15. ONTOLOGIE: Proprieta’ e attributi
Es.: FAMIGLIA Rappresentare le relazioni esistenti tra le classi del
dominio (es. “le MADRI sono GENITORI”, “i GENITORI hanno figli
che sono PERSONE”…)
FEMMINA PERSONA
ha_figli
DONNA GENITORE
(1,n)
is_a
MADRE PADRE
15
16. Elementi delle ontologie
Il contenuto di un’ontologia è rappresentato da:
Un insieme di classi (concetti – astrazioni
del mondo reale).
Un insieme di relazioni (tra 2 classi); un
esempio è la relazione IS_A
Un insieme di assiomi
Un insieme di individui
16
17. Ontologie: metodologia per la loro
“costruzione”
Steps [1]
Determinare il dominio e lo scopo dell’ontologia
Elencare i termini principali dell’ontologia
Definire le classi e la gerarchia tra le classi
Definire le proprietà delle classi
Definire vincoli sulle proprietà
Creare le istanze
[1]Noy, McGuinness, “Ontology Development 101: A Guide to Creating Your First Ontology
”,2001
17
18. Creare una ontologia
Es.: creare una ontologia del mondo universitario.
Supporre che l’ontologia verrà utilizzata da una
segreteria didattica, per tener traccia dei corsi, dei
professori che insegnano i corsi e degli studenti che li
seguono. Devono essere quindi rappresentate le entità
più importanti del mondo (personale docente,
professori, professori ordinari, professori associati,
ricercatori, studenti, corsi, …) e le relazioni che
intercorrono tra di essi
18
20. WEB SEMANTICO
Linguaggi di gestione delle ontologie
Principali linguaggi formali per la definizione di ontologie,
per supportare il ragionamento su di esse ed interrogarle:
OWL (Web Ontology Language) è un linguaggio di markup
per rappresentare esplicitamente ontologie
(semantica formale di termini e relazioni tra i termini).
RDF produce specifiche di contenuto grazie alle triple
(soggetto-predicato-oggetto)
20
21. OWL: Web Ontology Language
Il Web Ontology Language (OWL)
è un linguaggio di markup
per rappresentare esplicitamente le ontologie
(ovvero il significato dei termini e relazioni tra i termini).
L'obiettivo è supportare l’elaborazione automatica del
contenuto delle informazioni dei documenti scritti in OWL
21
OWL è un linguaggio di rappresentazione della conoscenza
22. Principali caratteristiche di OWL
Classi
subClassOf, intersectionOf, unionOf, complementOf,
enumeration, equivalence, disjoint
Proprietà
symmetric, transitive, functional, inverse Functional
range, domain, subPropertyOf, inverseOf,
equivalentProperty
Affermazioni sulle istanze
sameIndividualAs, differentFrom, AllDifferent
22
23. WEB SEMANTICO: la struttura dei dati
lo standard
Resource Description Framework (RDF)
è una struttura organizzativa dei dati
che standardizza la definizione
di relazioni tra informazioni 23
24. WEB SEMANTICO: cos’è l’RDF
RDF ovvero Resource Description Framework
RDF (Resource Description Framework) è uno standard proposto dal W3C
come set di linguaggi dichiarativi basato su sintassi XML ed adatto a descrivere
la struttura di una parte della realtà.
Per realtà intendiamo qualsiasi risorsa sia possibile identificare sulla rete con
un indirizzo univoco, mentre per descrizione indichiamo l'insieme delle
proprietà, degli attributi e delle relazioni con altre realtà.
RDF è lo strumento base per la codifica, lo scambio e il riutilizzo di metadati
strutturati, e consente l'interoperabilità tra applicazioni che si scambiano
sul Web informazioni machine-understandable.
24
25. RDF
Resource Description Framework
Uno schema per definire l’informazione.
RDF fornisce la tecnologia per esprimere il
significato di termini e concetti in una forma che
i computer possono elaborare. RDF utilizza il
linguaggio XML per la sua sintassi e gli URI per le
specifiche entità, concetti, proprietà e relazioni.
25
26. Le “triple” RDF
L’RDF è un linguaggio che rappresenta delle relazioni.
La rappresentazione più semplice di una relazione è
data dalla “tripla” soggetto/predicato/oggetto. Ciò che
rende speciale le triple RDF è che ogni loro elemento è
associato a un URI.
26
27. WEB SEMANTICO. Il modello RDF
RDF (Resource Description Framework) e RDF Schema
costituiscono il modello più utile per descrivere le risorse e i
loro tipi nel web semantico.
Un RDF-based data model è più idoneo ad esprimere certi
tipi di rappresentazione della conoscenza di quanto non lo
siano il modello relazionale ed altri modelli ontologici.
27
28. I tre principi dell’RDF
Il Resource Description Framework (RDF) è un framework per la
descrizione della conoscenza sul web. Esso è stato
specificatamente creato per la descrizione dei metadati
relativi alle risorse. RDF è sostanzialmente un modello
formale di dati dotato di sintassi di interscambio, un sistema
di schemi di tipo ed un linguaggio d’interrogazione
L’RDF si basa su tre principi chiave:
• Qualunque cosa può essere identificata da un URI (Universal
Resource Identifier)
• The least power: utilizzare il linguaggio meno espressivo per
definire qualunque cosa
• Qualunque cosa può dire qualunque cosa su qualunque cosa
28