SlideShare a Scribd company logo
1 of 53
Atvērtie saistītie dati
(Linked Open Data)
Uldis Bojārs
uldis.bojars@gmail.com
LU Datorikas fakultāte
29-Apr-2013
Saistīto datu “ģimene”
• Linked Data (saistītie dati)
– principi datu publicēšanai tīmeklī
• Open Data (atvērtie dati)
– informācija, kas ir brīvi un publiski izmantojama
– publiskā sektora (valsts, ...) atvērtie dati
• Linked Open Data (atvērtie saistītie dati)
– a) atvērtie dati + saistītie dati
– b) Linking Open Data [community] project
"Linked Data is the Semantic Web done
right, and the Web done right”
Tim Berners-Lee – LDoW 2008
Proposal
http://www.w3.org/History/1989/proposal.html
Tim Berners-Lee. „Weaving the Web”
http://www.w3.org/People/Berners-Lee/Weaving/
URI
• Uniform Resource Identifier (URI)
– vienota formāta teksta virkne, kas ļauj identificēt
resursus (tīmekļa lapas, u.c.)
– veidi = URL un URN
– ietver protokolu (URL gadījumā) vai URN shēmu
http://www.df.lu.lv/par/
http://www.w3.org/People/Berners-Lee/card#i
HTTP
• HyperText Transfer Protocol (HTTP)
– klienta-servera datu apmaiņas protokols,
kas ir tīmekļa uzbūves pamatā
– izmantojam ikdienā, par to daudz nedomājot 
> GET /par/ HTTP/1.1
> Host: www.df.lu.lv
< HTTP/1.0 200 OK
< ...
Web of Data
( Datu tīmeklis )
• datoram saprotami dati
– ne tikai tīmekļa lapas
• globāli un publiski pieejami
– to nodrošina tīmeklis
• saistīti savā starpā (linked)
Linked Data Principles
1. Use URIs as names for things
2. Use HTTP URIs so that people can look up
those names.
3. When someone looks up a URI, provide
useful information, using the standards
- RDF, SPARQL
4. Include links to other URIs. so that they can
discover more things.
http://www.w3.org/DesignIssues/LinkedData.html
10
Pamati
• URI – Uniform Resource Identifier
– Vienota norāžu (identifikatoru) sistēma – lietojot
vienu URI mēs varam būt droši, ka runājam par vienu
un to pašu lietu / jēdzienu
• RDF – Resource Description Framework
– Resursu apraksta ietvars (formāts) – ļauj izteikt
apgalvojumus vienkāršu teikumu (“trijnieku”) formā
– “Trijnieki” kas sastāv no teikuma priekšmeta
(subject), īpašības (property) un vērtības / objekta
(object)
RDF izteikumi
Subject Predicate Object
Vienkārši, nepaplašināti teikumi.
RDF grafs
13
RDF vārdnīcas / ontoloģijas
• Lai mēs varētu izteikt apgalvojumus par pasauli un
lietām tajā, ir nepieciešami vārdi – lietām, darbībām, ...
• RDF vārdnīcas un ontoloģijas apraksta pasaules modeli
un dod lietām vārdus (URI), kas ļauj uz tām
viennozīmīgi atsaukties veidojot RDF “trijniekus”
• Klases – rdfs:Class; rdf:type; rdfs:subClassOf
• Predikāti – rdf:Property; rdfs:subPropertyOf;
rdfs:range; rdfs:domain
14
Ontoloģiju piemēri
• Dublin Core Metadata Terms
– http://dublincore.org/documents/dcmi-terms/
– Objektu metadatu informācija
• Friend of a Friend (FOAF) Vocabulary
– http://xmlns.com/foaf/spec/
– Informācija par cilvēkiem un to sociālajiem tīkliem
• Semantically-Interlinked Online Communities
(SIOC)
– http://rdfs.org/sioc/spec/
– Informācija par cilvēku radīto saturu (sociālajā tīmeklī)
Plašāka informācija
• Short introduction to the Semantic Web
– Ivan Herman, 2010-06-04
– http://www.w3.org/People/Ivan/CorePresentatio
ns/IntroThroughExample/
• Linked Data
– http://linkeddata.org/
“Data is a 21st century commodity:
it’s the new oil.
There’s almost no limit to the economic and
social wonders it can generate: ...”
Neelie Kroes (at OKFN 2012),
VP of the European Commission and
Commissioner for the Digital Agenda
“A piece of data or content is open
if anyone is free to use, reuse, and
redistribute it
—
subject only, at most, to the requirement to
attribute and/or share-alike.”
The Open Definition:
http://opendefinition.org/
Motivācija datu atvērtībai
• Publiskā sektora informācijas (PSI) atvērtība
• Mērķi:
– publiskā sektora (valdības, ...) iestāžu darbības
caurspīdīgums, atklātība
– veicināt iedzīvotāju aktivitāti un iesaistīšanos
– uzlabot publiskā sektora iestāžu efektivitāti un
iekšējo komunikāciju
– veicināt inovācijas un ekonomisko aktivitāti
ES PSI direktīva
• 2003. gada ES PSI (Public Sector Information)
direktīvas revīzija
1. “If you make it public, it should be open
for everyone to reuse”
2. Includes cultural heritage
(libraries, museums, archives) data
3. Explicit mention of “machine readable” formats and
metadata
4. Where charges exist, they will be capped at "marginal
costs incurred for their reproduction and
dissemination".
ES PSI direktīva
• The best way to get value from data is to give it
away
– The Guardian
– http://www.guardian.co.uk/world/datablog/
2011/dec/13/eu-open-government-data
• The new PSI Directive – as good as it seems?
– Open Knowledge Foundation
– http://blog.okfn.org/2013/04/19/the-new-psi-
directive-as-good-as-it-seems/
http://open-data.europa.eu/en
UK Open Data Institute
• Non-profit, est. 2012
• 10 million GBP funding from
the UK Technology Strategy Board
... will catalyse an open data culture that has
economic, environmental and social benefits.
...will convene world-class experts to
collaborate, incubate, nurture and mentor new ideas, and
promote innovation.
... will enable anyone to learn and engage with open
data, and empower our teams to help others through
professional coaching and mentoring.
http://datahub.io
http://opendata.lv
Atvērtie dati Latvijā
• Atvērto datu interešu grupa
– http://groups.google.com/group/opendata_lv
• OpenData.LV
– Atvērto datu kopas: http://data.opendata.lv/
• Valsts līmenī notiek konsultācijas par PSI
direktīvas ieviešanu (bet pagaidām nav
“taustāmi” rezultāti = atvērti dati)
Saeimas balsojumu dati
• Dati tika “atvērti” (savākti no Saeimas
lapas, apstrādāti un vizualizēti) 2. Latvijas
atvērto datu “hakatona” laikā
• Exploring the Networks in Open Public Data
– Uldis Bojārs, Valdis Krebs, Pēteris Ručevskis
– http://www.slideshare.net/CaptSolo/exploring-
the-networks-in-open-public-data-13391338
Atvērto datu veidi
• Valdības dati
• Pašvaldību dati
• Kultūras mantojuma dati
• Izglītības un zinātnes organizāciju dati
• Portālu un ziņu aģentūru dati
– ar rakstiem saistītā informācija
• “Crowdsourced” dati
– cilvēki, sociālais tīmekli
• ... citu organizāciju un cilvēku apkopoti dati ...
University of Southampton
• universitātes atvērtie dati
– http://data.southampton.ac.uk/
– publicē atvērtos datus kopš 2006. gada
• piemēram:
– universitātes kursu informācija
– ēku elektrības patēriņš
• data.ac.uk launched in March 2013.
– It will provide a hub for linked data in .ac.uk
open data services, and aggregate open data
from UK academia.
Lielveikalu produktu cenas
• “A bill to allow shoppers instant, online access
to supermarket prices, product by product and
store by store will be introduced to Parliament
this week”
– http://www.theodi.org/news/gains-opening-
supermarket-pricing-information-
%E2%80%9Cshould-not-be-under-
estimated%E2%80%9D-says-odi
http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
LOD project
• Linking Open Data community project
– http://www.w3.org/wiki/SweoIG/TaskForces/CommunityP
rojects/LinkingOpenData
– (sk. jaunumus News sadaļā)
• Sākumā: entuziastu grupas projekts esošo datu kopu
“atvēršanai” un “linkošanai”
– DBPedia - http://dbpedia.org/About
• Pilnībā atbilst saistīto datu definīcijai
– 1) URI, HTTP, RDF, ...
– 2) saites datu kopu starpā
http://inkdroid.org/journal/2010/06/04/the-5-stars-of-open-linked-data/
Linking Open Data cloud diagram (Sept 2011),
by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
• Virtual Internet Authority File
– saites no Wikipedia
– Jānis Rainis: http://viaf.org/viaf/77113948/
• => http://libris.kb.se/auth/85912 => DBPedia
• DBPedia
– Jānis Rainis: http://dbpedia.org/page/Rainis
• => http://dbpedia.org/page/Category:Latvian_poets
The Europeana library
• Metadata for all Europeana objects is
open, available under a CC0 license
– http://pro.europeana.eu/linked-open-data
• Large subset of this data was transformed to and
published as linked data
– http://pro.europeana.eu/datasets
• Data is represented using the Europeana Data
Model (EDM) [ontology]
Saistīto datu izmantošana
• SPARQL vaicājumu valoda
– RDF grafiem paredzēta valoda, līdzīga SQL
– http://www.w3.org/TR/sparql11-overview/
– ļauj uzdot RDF (saistītajiem) datiem dažāda
veida vaicājumus
• DBPedia
– Online Access: http://dbpedia.org/OnlineAccess#h28-
6
– piem.: “cilvēki, kas dzimuši Rīgā pirms 1900 gada”
SPARQL piemērs
PREFIX dbo: <http://dbpedia.org/ontology/>
SELECT ?name ?birth ?death ?person WHERE {
?person dbo:birthPlace :Riga .
?person dbo:birthDate ?birth .
?person foaf:name ?name .
?person dbo:deathDate ?death .
FILTER (?birth < "1900-01-01"^^xsd:date) .
}
ORDER BY ?name
Atvērtie + saistītie dati
Kā atvērto datu projekti izmanto
saistīto datu tehnoloģijas?
• “The UK government is convinced linked data
is the best approach available
– for publishing data in a hugely diverse and
distributed environment,
– in a gradual and sustainable way.”
• source: “Why Linked Data for data.gov.uk?”
– http://www.jenitennison.com/blog/node/140
Atvērtie + saistītie dati
1. Datu kopu metadatu katalogi
– metadatu shēmas / vārdnīcas / ontoloģijas
2. URI = objektu identifikatori
– vienota objektu identifikācijas kārtība
3. Pilnvērtīgi saistīto datu avoti
– RDF dati (+ citi datu veidi)
– saites datu kopu starpā
URI = objektu identifikatori
• Lielbritānijā:
– URI veidošanas kārtība noteikta valsts līmenī
• Designing URI Sets for the UK Public Sector
– http://www.cabinetoffice.gov.uk/resource-
library/designing-uri-sets-uk-public-sector
• Piemērs:
– http://{domain}/doc/{concept}/{reference}
– http://data.archiveshub.ac.uk/id/person/ncarules/skinner
beverley1938-1999artist
– Dažādi URI veidi:
• Identifier URI, Document URI, Representation URI
Datu kopu katalogi
• data.gov.uk
– izmanto CKAN.org programmatūru
– datu kopu katalogam ir JSON API
• http://data.gov.uk/dataset/england-national-
crime-mapping
• EU open data portal
– Dataset catalogue = SPARQL endpoint
• http://open-data.europa.eu/en/linked-data
Linking Open Data cloud diagram (Sept 2011),
by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Southampton University
• Where possible we aim to provide the data as
full ★★★★★ data. Most datasets are
available as RDF+XML and Turtle.
– http://data.southampton.ac.uk/faq.html
• However, that may be a long process, and we
would rather make good data available
now, than perfect data the day after
tomorrow.
Piemērs
• Dataset: Southampton Bus Information
– http://data.southampton.ac.uk/dataset/
bus-info.html
• datu kopas metadati
• URI identifikatori: pieturām, maršrutiem
• dati RDF formā (RDF/XML, Turtle)
Piemērs
• Dataset: BBC Music data
– http://datahub.io/dataset/bbc-music
• datu kopas metadati (datahub.io)
• datu piemēri (SPARQL endpoint, RDF/XML)
• URI identifikatori: izpildītāji, albumi, ...
• dati RDF formā (RDF/XML)
Kopsavilkums
• Saistītie dati
– tehnoloģija [saistītu] datu publicēšanai tīmeklī
• Atvērtie dati
– informācija, kas ir brīvi un publiski izmantojama
– publiskā sektora atvērtie dati ir aktuāla tēma
• Atvērtie saistītie dati
– LOD projekts
– atvērtie + saistītie dati
• URI identifikatori, datu kopu metadati, saistītie dati
Diskusija
1. Kādi atvērto datu veidi jūs interesē
vai būtu jums vajadzīgi?
2. Kas nepieciešams atvērto datu attīstībai
Latvijā?
3. Kādas (jūsuprāt) ir sakarības starp
atvērtajiem datiem un saistītajiem datiem?

More Related Content

What's hot

A Big Data Timeline
A Big Data TimelineA Big Data Timeline
A Big Data TimelineBig Cloud
 
Data Stewards – Defining and Assigning
Data Stewards – Defining and AssigningData Stewards – Defining and Assigning
Data Stewards – Defining and AssigningDATAVERSITY
 
Data sharing: How, what and why?
Data sharing: How, what and why?Data sharing: How, what and why?
Data sharing: How, what and why?dancrane_open
 
Big data Presentation
Big data PresentationBig data Presentation
Big data PresentationAswadmehar
 
ADG S1000D Series - S1000D Information Sets & Publications
ADG S1000D Series - S1000D Information Sets & PublicationsADG S1000D Series - S1000D Information Sets & Publications
ADG S1000D Series - S1000D Information Sets & PublicationsAbsolute Data Group
 
An overview of methods for data anonymization
An overview of methods for data anonymizationAn overview of methods for data anonymization
An overview of methods for data anonymizationarx-deidentifier
 
Tietosuoja perusopetuksessa ja toisella asteella
Tietosuoja perusopetuksessa ja toisella asteellaTietosuoja perusopetuksessa ja toisella asteella
Tietosuoja perusopetuksessa ja toisella asteellaHarto Pönkä
 
Research Lifecycles and RDM
Research Lifecycles and RDMResearch Lifecycles and RDM
Research Lifecycles and RDMMarieke Guy
 
Teoria i metodologia informatologii 16_17
Teoria i metodologia informatologii 16_17Teoria i metodologia informatologii 16_17
Teoria i metodologia informatologii 16_17Sabina Cisek
 
You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?Precisely
 
Interview Your Stakeholders Like a Librarian
Interview Your Stakeholders Like a LibrarianInterview Your Stakeholders Like a Librarian
Interview Your Stakeholders Like a LibrarianAnne Haines
 
What it means to be FAIR
What it means to be FAIRWhat it means to be FAIR
What it means to be FAIRSarah Jones
 
The future of FAIR
The future of FAIRThe future of FAIR
The future of FAIRSarah Jones
 
The Case for Graphs in Supply Chains
The Case for Graphs in Supply ChainsThe Case for Graphs in Supply Chains
The Case for Graphs in Supply ChainsNeo4j
 

What's hot (20)

A Big Data Timeline
A Big Data TimelineA Big Data Timeline
A Big Data Timeline
 
Big data
Big dataBig data
Big data
 
Data Stewards – Defining and Assigning
Data Stewards – Defining and AssigningData Stewards – Defining and Assigning
Data Stewards – Defining and Assigning
 
Data sharing: How, what and why?
Data sharing: How, what and why?Data sharing: How, what and why?
Data sharing: How, what and why?
 
Big data Presentation
Big data PresentationBig data Presentation
Big data Presentation
 
Big data
Big dataBig data
Big data
 
ADG S1000D Series - S1000D Information Sets & Publications
ADG S1000D Series - S1000D Information Sets & PublicationsADG S1000D Series - S1000D Information Sets & Publications
ADG S1000D Series - S1000D Information Sets & Publications
 
DPO for dummies
DPO for dummies DPO for dummies
DPO for dummies
 
An overview of methods for data anonymization
An overview of methods for data anonymizationAn overview of methods for data anonymization
An overview of methods for data anonymization
 
Tietosuoja perusopetuksessa ja toisella asteella
Tietosuoja perusopetuksessa ja toisella asteellaTietosuoja perusopetuksessa ja toisella asteella
Tietosuoja perusopetuksessa ja toisella asteella
 
Research Lifecycles and RDM
Research Lifecycles and RDMResearch Lifecycles and RDM
Research Lifecycles and RDM
 
Teoria i metodologia informatologii 16_17
Teoria i metodologia informatologii 16_17Teoria i metodologia informatologii 16_17
Teoria i metodologia informatologii 16_17
 
Gestión de datos de investigación: trabajo cooperativo en las bibliotecas de ...
Gestión de datos de investigación: trabajo cooperativo en las bibliotecas de ...Gestión de datos de investigación: trabajo cooperativo en las bibliotecas de ...
Gestión de datos de investigación: trabajo cooperativo en las bibliotecas de ...
 
Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación Introducción a la Gestión de Datos de Investigación
Introducción a la Gestión de Datos de Investigación
 
You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?You Need a Data Catalog. Do You Know Why?
You Need a Data Catalog. Do You Know Why?
 
Interview Your Stakeholders Like a Librarian
Interview Your Stakeholders Like a LibrarianInterview Your Stakeholders Like a Librarian
Interview Your Stakeholders Like a Librarian
 
What it means to be FAIR
What it means to be FAIRWhat it means to be FAIR
What it means to be FAIR
 
Presentation on Big Data
Presentation on Big DataPresentation on Big Data
Presentation on Big Data
 
The future of FAIR
The future of FAIRThe future of FAIR
The future of FAIR
 
The Case for Graphs in Supply Chains
The Case for Graphs in Supply ChainsThe Case for Graphs in Supply Chains
The Case for Graphs in Supply Chains
 

Similar to Linked Open Data / Atvērtie saistītie dati

Semantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie datiSemantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie datiUldis Bojars
 
Web Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked DataWeb Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked DataUldis Bojars
 
OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012
OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012
OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012OpenAIRE
 
Web Science - 1. lekcija
Web Science - 1. lekcijaWeb Science - 1. lekcija
Web Science - 1. lekcijaUldis Bojars
 
Izglītībai noderīgi resursi
Izglītībai noderīgi resursiIzglītībai noderīgi resursi
Izglītībai noderīgi resursiGatis Sersnevs
 
Open Data Support onsite training in Latvia (Latvian)
Open Data Support onsite training in Latvia (Latvian)Open Data Support onsite training in Latvia (Latvian)
Open Data Support onsite training in Latvia (Latvian)Open Data Support
 
Biblioteku Pakalpojumi Muzikas Akad 2009 June
Biblioteku Pakalpojumi Muzikas Akad 2009 JuneBiblioteku Pakalpojumi Muzikas Akad 2009 June
Biblioteku Pakalpojumi Muzikas Akad 2009 Junekriic
 
Inovācijas bibliotēkās (Jānis Briedis)
Inovācijas bibliotēkās (Jānis Briedis)Inovācijas bibliotēkās (Jānis Briedis)
Inovācijas bibliotēkās (Jānis Briedis)LBB JSS
 
Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...
Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...
Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...Bibliotēku portāls
 
Lielie dati-planētas-nervu-sistēma
Lielie dati-planētas-nervu-sistēmaLielie dati-planētas-nervu-sistēma
Lielie dati-planētas-nervu-sistēmaJuris Rats
 
Bibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitāti
Bibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitātiBibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitāti
Bibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitātinacionalaidentitate
 

Similar to Linked Open Data / Atvērtie saistītie dati (13)

Semantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie datiSemantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie dati
 
Web Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked DataWeb Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked Data
 
OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012
OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012
OpenAIRE at the 15th conference of Latvian librarians, April 14, 2012
 
Web Science - 1. lekcija
Web Science - 1. lekcijaWeb Science - 1. lekcija
Web Science - 1. lekcija
 
Atvērto datu potenciāls
Atvērto datu potenciālsAtvērto datu potenciāls
Atvērto datu potenciāls
 
Izglītībai noderīgi resursi
Izglītībai noderīgi resursiIzglītībai noderīgi resursi
Izglītībai noderīgi resursi
 
Open Data Support onsite training in Latvia (Latvian)
Open Data Support onsite training in Latvia (Latvian)Open Data Support onsite training in Latvia (Latvian)
Open Data Support onsite training in Latvia (Latvian)
 
Biblioteku Pakalpojumi Muzikas Akad 2009 June
Biblioteku Pakalpojumi Muzikas Akad 2009 JuneBiblioteku Pakalpojumi Muzikas Akad 2009 June
Biblioteku Pakalpojumi Muzikas Akad 2009 June
 
Inovācijas bibliotēkās (Jānis Briedis)
Inovācijas bibliotēkās (Jānis Briedis)Inovācijas bibliotēkās (Jānis Briedis)
Inovācijas bibliotēkās (Jānis Briedis)
 
Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...
Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...
Kultūras informācijas sistēmu centra projekta "Elektroniskās publikācijas Lat...
 
RESTful tīmekļa risinājumi
RESTful tīmekļa risinājumiRESTful tīmekļa risinājumi
RESTful tīmekļa risinājumi
 
Lielie dati-planētas-nervu-sistēma
Lielie dati-planētas-nervu-sistēmaLielie dati-planētas-nervu-sistēma
Lielie dati-planētas-nervu-sistēma
 
Bibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitāti
Bibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitātiBibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitāti
Bibliotēku gatavība saskarsmei ar Google paaudzes pārstāvju digitālo identitāti
 

More from Uldis Bojars

Linked Digital Collection "Rainis and Aspazija"
Linked Digital Collection "Rainis and Aspazija"Linked Digital Collection "Rainis and Aspazija"
Linked Digital Collection "Rainis and Aspazija"Uldis Bojars
 
Case study: Towards a linked digital collection of Latvian Cultural Heritage
Case study: Towards a linked digital collection of Latvian Cultural HeritageCase study: Towards a linked digital collection of Latvian Cultural Heritage
Case study: Towards a linked digital collection of Latvian Cultural HeritageUldis Bojars
 
OWLGrEd Ontology Visualizer
OWLGrEd Ontology VisualizerOWLGrEd Ontology Visualizer
OWLGrEd Ontology VisualizerUldis Bojars
 
Library Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 posterLibrary Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 posterUldis Bojars
 
Linked Data from a Digital Object Management System
Linked Data from a Digital Object Management SystemLinked Data from a Digital Object Management System
Linked Data from a Digital Object Management SystemUldis Bojars
 
Exploring the Networks in Open Public Data
Exploring the Networks in Open Public DataExploring the Networks in Open Public Data
Exploring the Networks in Open Public DataUldis Bojars
 
Envisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked DataEnvisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked DataUldis Bojars
 
Web Science 29.09.2011
Web Science 29.09.2011Web Science 29.09.2011
Web Science 29.09.2011Uldis Bojars
 
Web Science 15.09.2011
Web Science 15.09.2011Web Science 15.09.2011
Web Science 15.09.2011Uldis Bojars
 
Web Science seminārs - intro
Web Science seminārs - introWeb Science seminārs - intro
Web Science seminārs - introUldis Bojars
 
Weaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked DataWeaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked DataUldis Bojars
 
Data Portability with SIOC and FOAF
Data Portability with SIOC and FOAFData Portability with SIOC and FOAF
Data Portability with SIOC and FOAFUldis Bojars
 
FOAF for Social Network Portability
FOAF for Social Network PortabilityFOAF for Social Network Portability
FOAF for Social Network PortabilityUldis Bojars
 
SIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media SitesSIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media SitesUldis Bojars
 
XUL - Mozilla Application Framework
XUL - Mozilla Application FrameworkXUL - Mozilla Application Framework
XUL - Mozilla Application FrameworkUldis Bojars
 

More from Uldis Bojars (15)

Linked Digital Collection "Rainis and Aspazija"
Linked Digital Collection "Rainis and Aspazija"Linked Digital Collection "Rainis and Aspazija"
Linked Digital Collection "Rainis and Aspazija"
 
Case study: Towards a linked digital collection of Latvian Cultural Heritage
Case study: Towards a linked digital collection of Latvian Cultural HeritageCase study: Towards a linked digital collection of Latvian Cultural Heritage
Case study: Towards a linked digital collection of Latvian Cultural Heritage
 
OWLGrEd Ontology Visualizer
OWLGrEd Ontology VisualizerOWLGrEd Ontology Visualizer
OWLGrEd Ontology Visualizer
 
Library Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 posterLibrary Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 poster
 
Linked Data from a Digital Object Management System
Linked Data from a Digital Object Management SystemLinked Data from a Digital Object Management System
Linked Data from a Digital Object Management System
 
Exploring the Networks in Open Public Data
Exploring the Networks in Open Public DataExploring the Networks in Open Public Data
Exploring the Networks in Open Public Data
 
Envisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked DataEnvisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked Data
 
Web Science 29.09.2011
Web Science 29.09.2011Web Science 29.09.2011
Web Science 29.09.2011
 
Web Science 15.09.2011
Web Science 15.09.2011Web Science 15.09.2011
Web Science 15.09.2011
 
Web Science seminārs - intro
Web Science seminārs - introWeb Science seminārs - intro
Web Science seminārs - intro
 
Weaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked DataWeaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked Data
 
Data Portability with SIOC and FOAF
Data Portability with SIOC and FOAFData Portability with SIOC and FOAF
Data Portability with SIOC and FOAF
 
FOAF for Social Network Portability
FOAF for Social Network PortabilityFOAF for Social Network Portability
FOAF for Social Network Portability
 
SIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media SitesSIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media Sites
 
XUL - Mozilla Application Framework
XUL - Mozilla Application FrameworkXUL - Mozilla Application Framework
XUL - Mozilla Application Framework
 

Linked Open Data / Atvērtie saistītie dati

  • 1. Atvērtie saistītie dati (Linked Open Data) Uldis Bojārs uldis.bojars@gmail.com LU Datorikas fakultāte 29-Apr-2013
  • 2. Saistīto datu “ģimene” • Linked Data (saistītie dati) – principi datu publicēšanai tīmeklī • Open Data (atvērtie dati) – informācija, kas ir brīvi un publiski izmantojama – publiskā sektora (valsts, ...) atvērtie dati • Linked Open Data (atvērtie saistītie dati) – a) atvērtie dati + saistītie dati – b) Linking Open Data [community] project
  • 3.
  • 4. "Linked Data is the Semantic Web done right, and the Web done right” Tim Berners-Lee – LDoW 2008
  • 5. Proposal http://www.w3.org/History/1989/proposal.html Tim Berners-Lee. „Weaving the Web” http://www.w3.org/People/Berners-Lee/Weaving/
  • 6. URI • Uniform Resource Identifier (URI) – vienota formāta teksta virkne, kas ļauj identificēt resursus (tīmekļa lapas, u.c.) – veidi = URL un URN – ietver protokolu (URL gadījumā) vai URN shēmu http://www.df.lu.lv/par/ http://www.w3.org/People/Berners-Lee/card#i
  • 7. HTTP • HyperText Transfer Protocol (HTTP) – klienta-servera datu apmaiņas protokols, kas ir tīmekļa uzbūves pamatā – izmantojam ikdienā, par to daudz nedomājot  > GET /par/ HTTP/1.1 > Host: www.df.lu.lv < HTTP/1.0 200 OK < ...
  • 8. Web of Data ( Datu tīmeklis ) • datoram saprotami dati – ne tikai tīmekļa lapas • globāli un publiski pieejami – to nodrošina tīmeklis • saistīti savā starpā (linked)
  • 9. Linked Data Principles 1. Use URIs as names for things 2. Use HTTP URIs so that people can look up those names. 3. When someone looks up a URI, provide useful information, using the standards - RDF, SPARQL 4. Include links to other URIs. so that they can discover more things. http://www.w3.org/DesignIssues/LinkedData.html
  • 10. 10 Pamati • URI – Uniform Resource Identifier – Vienota norāžu (identifikatoru) sistēma – lietojot vienu URI mēs varam būt droši, ka runājam par vienu un to pašu lietu / jēdzienu • RDF – Resource Description Framework – Resursu apraksta ietvars (formāts) – ļauj izteikt apgalvojumus vienkāršu teikumu (“trijnieku”) formā – “Trijnieki” kas sastāv no teikuma priekšmeta (subject), īpašības (property) un vērtības / objekta (object)
  • 11. RDF izteikumi Subject Predicate Object Vienkārši, nepaplašināti teikumi.
  • 13. 13 RDF vārdnīcas / ontoloģijas • Lai mēs varētu izteikt apgalvojumus par pasauli un lietām tajā, ir nepieciešami vārdi – lietām, darbībām, ... • RDF vārdnīcas un ontoloģijas apraksta pasaules modeli un dod lietām vārdus (URI), kas ļauj uz tām viennozīmīgi atsaukties veidojot RDF “trijniekus” • Klases – rdfs:Class; rdf:type; rdfs:subClassOf • Predikāti – rdf:Property; rdfs:subPropertyOf; rdfs:range; rdfs:domain
  • 14. 14 Ontoloģiju piemēri • Dublin Core Metadata Terms – http://dublincore.org/documents/dcmi-terms/ – Objektu metadatu informācija • Friend of a Friend (FOAF) Vocabulary – http://xmlns.com/foaf/spec/ – Informācija par cilvēkiem un to sociālajiem tīkliem • Semantically-Interlinked Online Communities (SIOC) – http://rdfs.org/sioc/spec/ – Informācija par cilvēku radīto saturu (sociālajā tīmeklī)
  • 15. Plašāka informācija • Short introduction to the Semantic Web – Ivan Herman, 2010-06-04 – http://www.w3.org/People/Ivan/CorePresentatio ns/IntroThroughExample/ • Linked Data – http://linkeddata.org/
  • 16.
  • 17. “Data is a 21st century commodity: it’s the new oil. There’s almost no limit to the economic and social wonders it can generate: ...” Neelie Kroes (at OKFN 2012), VP of the European Commission and Commissioner for the Digital Agenda
  • 18. “A piece of data or content is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.” The Open Definition: http://opendefinition.org/
  • 19. Motivācija datu atvērtībai • Publiskā sektora informācijas (PSI) atvērtība • Mērķi: – publiskā sektora (valdības, ...) iestāžu darbības caurspīdīgums, atklātība – veicināt iedzīvotāju aktivitāti un iesaistīšanos – uzlabot publiskā sektora iestāžu efektivitāti un iekšējo komunikāciju – veicināt inovācijas un ekonomisko aktivitāti
  • 20. ES PSI direktīva • 2003. gada ES PSI (Public Sector Information) direktīvas revīzija 1. “If you make it public, it should be open for everyone to reuse” 2. Includes cultural heritage (libraries, museums, archives) data 3. Explicit mention of “machine readable” formats and metadata 4. Where charges exist, they will be capped at "marginal costs incurred for their reproduction and dissemination".
  • 21. ES PSI direktīva • The best way to get value from data is to give it away – The Guardian – http://www.guardian.co.uk/world/datablog/ 2011/dec/13/eu-open-government-data • The new PSI Directive – as good as it seems? – Open Knowledge Foundation – http://blog.okfn.org/2013/04/19/the-new-psi- directive-as-good-as-it-seems/
  • 23.
  • 24.
  • 25. UK Open Data Institute • Non-profit, est. 2012 • 10 million GBP funding from the UK Technology Strategy Board ... will catalyse an open data culture that has economic, environmental and social benefits. ...will convene world-class experts to collaborate, incubate, nurture and mentor new ideas, and promote innovation. ... will enable anyone to learn and engage with open data, and empower our teams to help others through professional coaching and mentoring.
  • 28. Atvērtie dati Latvijā • Atvērto datu interešu grupa – http://groups.google.com/group/opendata_lv • OpenData.LV – Atvērto datu kopas: http://data.opendata.lv/ • Valsts līmenī notiek konsultācijas par PSI direktīvas ieviešanu (bet pagaidām nav “taustāmi” rezultāti = atvērti dati)
  • 29. Saeimas balsojumu dati • Dati tika “atvērti” (savākti no Saeimas lapas, apstrādāti un vizualizēti) 2. Latvijas atvērto datu “hakatona” laikā • Exploring the Networks in Open Public Data – Uldis Bojārs, Valdis Krebs, Pēteris Ručevskis – http://www.slideshare.net/CaptSolo/exploring- the-networks-in-open-public-data-13391338
  • 30. Atvērto datu veidi • Valdības dati • Pašvaldību dati • Kultūras mantojuma dati • Izglītības un zinātnes organizāciju dati • Portālu un ziņu aģentūru dati – ar rakstiem saistītā informācija • “Crowdsourced” dati – cilvēki, sociālais tīmekli • ... citu organizāciju un cilvēku apkopoti dati ...
  • 31. University of Southampton • universitātes atvērtie dati – http://data.southampton.ac.uk/ – publicē atvērtos datus kopš 2006. gada • piemēram: – universitātes kursu informācija – ēku elektrības patēriņš • data.ac.uk launched in March 2013. – It will provide a hub for linked data in .ac.uk open data services, and aggregate open data from UK academia.
  • 32.
  • 33. Lielveikalu produktu cenas • “A bill to allow shoppers instant, online access to supermarket prices, product by product and store by store will be introduced to Parliament this week” – http://www.theodi.org/news/gains-opening- supermarket-pricing-information- %E2%80%9Cshould-not-be-under- estimated%E2%80%9D-says-odi
  • 34.
  • 36. LOD project • Linking Open Data community project – http://www.w3.org/wiki/SweoIG/TaskForces/CommunityP rojects/LinkingOpenData – (sk. jaunumus News sadaļā) • Sākumā: entuziastu grupas projekts esošo datu kopu “atvēršanai” un “linkošanai” – DBPedia - http://dbpedia.org/About • Pilnībā atbilst saistīto datu definīcijai – 1) URI, HTTP, RDF, ... – 2) saites datu kopu starpā
  • 38. Linking Open Data cloud diagram (Sept 2011), by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  • 39. • Virtual Internet Authority File – saites no Wikipedia – Jānis Rainis: http://viaf.org/viaf/77113948/ • => http://libris.kb.se/auth/85912 => DBPedia • DBPedia – Jānis Rainis: http://dbpedia.org/page/Rainis • => http://dbpedia.org/page/Category:Latvian_poets
  • 40. The Europeana library • Metadata for all Europeana objects is open, available under a CC0 license – http://pro.europeana.eu/linked-open-data • Large subset of this data was transformed to and published as linked data – http://pro.europeana.eu/datasets • Data is represented using the Europeana Data Model (EDM) [ontology]
  • 41. Saistīto datu izmantošana • SPARQL vaicājumu valoda – RDF grafiem paredzēta valoda, līdzīga SQL – http://www.w3.org/TR/sparql11-overview/ – ļauj uzdot RDF (saistītajiem) datiem dažāda veida vaicājumus • DBPedia – Online Access: http://dbpedia.org/OnlineAccess#h28- 6 – piem.: “cilvēki, kas dzimuši Rīgā pirms 1900 gada”
  • 42. SPARQL piemērs PREFIX dbo: <http://dbpedia.org/ontology/> SELECT ?name ?birth ?death ?person WHERE { ?person dbo:birthPlace :Riga . ?person dbo:birthDate ?birth . ?person foaf:name ?name . ?person dbo:deathDate ?death . FILTER (?birth < "1900-01-01"^^xsd:date) . } ORDER BY ?name
  • 43. Atvērtie + saistītie dati Kā atvērto datu projekti izmanto saistīto datu tehnoloģijas?
  • 44. • “The UK government is convinced linked data is the best approach available – for publishing data in a hugely diverse and distributed environment, – in a gradual and sustainable way.” • source: “Why Linked Data for data.gov.uk?” – http://www.jenitennison.com/blog/node/140
  • 45. Atvērtie + saistītie dati 1. Datu kopu metadatu katalogi – metadatu shēmas / vārdnīcas / ontoloģijas 2. URI = objektu identifikatori – vienota objektu identifikācijas kārtība 3. Pilnvērtīgi saistīto datu avoti – RDF dati (+ citi datu veidi) – saites datu kopu starpā
  • 46. URI = objektu identifikatori • Lielbritānijā: – URI veidošanas kārtība noteikta valsts līmenī • Designing URI Sets for the UK Public Sector – http://www.cabinetoffice.gov.uk/resource- library/designing-uri-sets-uk-public-sector • Piemērs: – http://{domain}/doc/{concept}/{reference} – http://data.archiveshub.ac.uk/id/person/ncarules/skinner beverley1938-1999artist – Dažādi URI veidi: • Identifier URI, Document URI, Representation URI
  • 47. Datu kopu katalogi • data.gov.uk – izmanto CKAN.org programmatūru – datu kopu katalogam ir JSON API • http://data.gov.uk/dataset/england-national- crime-mapping • EU open data portal – Dataset catalogue = SPARQL endpoint • http://open-data.europa.eu/en/linked-data
  • 48. Linking Open Data cloud diagram (Sept 2011), by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  • 49. Southampton University • Where possible we aim to provide the data as full ★★★★★ data. Most datasets are available as RDF+XML and Turtle. – http://data.southampton.ac.uk/faq.html • However, that may be a long process, and we would rather make good data available now, than perfect data the day after tomorrow.
  • 50. Piemērs • Dataset: Southampton Bus Information – http://data.southampton.ac.uk/dataset/ bus-info.html • datu kopas metadati • URI identifikatori: pieturām, maršrutiem • dati RDF formā (RDF/XML, Turtle)
  • 51. Piemērs • Dataset: BBC Music data – http://datahub.io/dataset/bbc-music • datu kopas metadati (datahub.io) • datu piemēri (SPARQL endpoint, RDF/XML) • URI identifikatori: izpildītāji, albumi, ... • dati RDF formā (RDF/XML)
  • 52. Kopsavilkums • Saistītie dati – tehnoloģija [saistītu] datu publicēšanai tīmeklī • Atvērtie dati – informācija, kas ir brīvi un publiski izmantojama – publiskā sektora atvērtie dati ir aktuāla tēma • Atvērtie saistītie dati – LOD projekts – atvērtie + saistītie dati • URI identifikatori, datu kopu metadati, saistītie dati
  • 53. Diskusija 1. Kādi atvērto datu veidi jūs interesē vai būtu jums vajadzīgi? 2. Kas nepieciešams atvērto datu attīstībai Latvijā? 3. Kādas (jūsuprāt) ir sakarības starp atvērtajiem datiem un saistītajiem datiem?

Editor's Notes

  1. To-Do: - pieliktTimBLTEd-talk
  2. http://blog.okfn.org/2012/09/20/rest-assured-the-eu-is-behind-you-says-european-commissioner-neelie-kroes-to-okfestival-participants/
  3. http://blog.okfn.org/2012/09/20/rest-assured-the-eu-is-behind-you-says-european-commissioner-neelie-kroes-to-okfestival-participants/
  4. https://ec.europa.eu/digital-agenda/en/blog/open-data-and-re-use-of-public-sector-information
  5. http://www.theodi.org/sites/default/files/360s/Office/office.htmlhttp://www.theodi.org/faq
  6. Neo (workshops, Japāna)
  7. nākamāsaktivitātes / virzieni: - atvieglotinformācijasapstrādi (= data journalist’s workflow)
  8. http://www.guardian.co.uk/news/datablog/2011/may/19/train-stations-listed-rail#datacilvēkikāsensori
  9. atvērtodatuieguvumi: unexpected re-use - nekadnevarzinātkāduspielietojumuscilvēkiizgudrosizmantojot linked data, tie paširīkistrādāarīarcituuniversitāšudatiem
  10. https://twitter.com/JeniT/status/326992015856377856Tesco Open Data: want to expose customers, places, products, orders, journeys, rewards as open data &amp; link to other sources
  11. http://richard.cyganiak.de/2007/10/lod/šiedatiirinteresantāki
  12. http://europeana.ontotext.com/
  13. varuzdotbagātākusvaicājumuskānezināmaformāta CSV datiem
  14. kādažādosatvērtodatuprojektosizmantosaistītosdatus
  15. skat. JeniTblogaierakstu
  16. metadatukatalogi
  17. Nepieciešamairdatukopuatklāšanasfunkcija + datukopuaprakstufederēšana(oriģinālipublicēkopāarvisiemmetadatiem, tad apkopo)
  18. http://lod-cloud.net/versions/2011-09-19/lod-cloud_colored.html
  19. http://lod-cloud.net/versions/2011-09-19/lod-cloud.html