1. Universidade de São Paulo
Instituto de Matemática e Estatística
Departamento de Ciências da Computação
Linked Data
Rafael Brito de Oliveira
São Paulo, 26 de Novembro de 2014
2. Sumário
➔ Introdução
➔ Linked Data
➔ Publicando Linked Data na Web
➔ Aplicações que utilizam Linked Data
➔ Desafios
➔ Conclusões
RAFAEL BRITO DE OLIVEIRA 2/45
3. Sumário
➔ Introdução
➔ Linked Data
➔ Publicando Linked Data na Web
➔ Aplicações que utilizam Linked Data
➔ Desafios
➔ Conclusões
RAFAEL BRITO DE OLIVEIRA 3/45
5. Introdução
O que é uma informação?
.JPG
.JPEG
.PNG
.MP4
.AVI
.MKV
.XLS
.TXT
.HTML
Existem em diversos formatos e diferentes tipos de
arquivos que podem expressar uma informação.
RAFAEL BRITO DE OLIVEIRA 5/45
6. Introdução
A Web atual
Vantagens
➔ Páginas com textos e vídeos etc;
➔ Navegação de uma página para outra por meio de hyperlinks;
Desvantagens
➔ Computadores não entendem essas páginas;
➔ Os hyperlinks não possuem tipos;
INTERNET + HYPERLINKS +
DOCUMENTOS
RAFAEL BRITO DE OLIVEIRA 6/45
7. Sumário
➔ Introdução
➔ Linked Data
➔ Publicando Linked Data na Web
➔ Aplicações que utilizam Linked Data
➔ Desafios
➔ Conclusões
RAFAEL BRITO DE OLIVEIRA 7/45
8. Linked Data
O que é Linked Data?
"A evolução de uma Web baseada em
documentos para uma Web baseada em
dados interconectados".
RAFAEL BRITO DE OLIVEIRA 8/45
9. Linked Data
Objetivo do Linked Data
Restruturar a informação na Web de tal maneira que
seja entendível por seres humanos e computadores.
THING
Nome
Idade
Sexo
RAFAEL BRITO DE OLIVEIRA 9/45
10. ➔ Como representar e conectar os dados entre si?
➔ Que formato comum, utilizar para representar uma
informação na Web?
Ex.: JSON, XML, CSV
Linked Data
Necessidades
RAFAEL BRITO DE OLIVEIRA 10/45
11. Linked Data
Representação de uma Informação
ISBN Título Autor PublicadorID Páginas
9992158107 Animal Farm George Orwell 1 320
9971502100 1889 Laurentino
Gomes
2 330
... ... ... ... ...
Propriedade
Indivíduo
Animal Farm 1
PublicadorID Nome
1 Rocco
... ...
RAFAEL BRITO DE OLIVEIRA 11/45
13. Linked Data
Formato Padrão para Linked Data
RDF -> Resource Description Framework
Berlin Berlin
sameAs
{SUJEITO}
{PREDICADO}
{OBJETO}
➔ Descreve relações entre indivíduos;
➔ Utiliza triplas para representar qualquer informação;
➔ Pode ser serializado em diferentes formatos (RDF/XML, RDFa, N3,
Turtle)
RAFAEL BRITO DE OLIVEIRA 13/45
14. Linked Data
Identificando Indivíduos (HTTP + URI)
Uri - Uma sequência de caracteres que identificam um
recurso abstrato ou físico
http://www.mysite.com/Berlin
http://en.wikipedia.org/wiki/Berlin
Http
Protocolo de transferência
RAFAEL BRITO DE OLIVEIRA 14/45
15. http://www.
mysite.
com/Berlin
RAFAEL BRITO DE OLIVEIRA 15/45
Linked Data
Identificando Indivíduos (HTTP + URI)
http://en.
wikipedia.
org/wiki/Ber
lin
http://www.w3.org/2002/07/owl#sameAs
16. Linked Data
Consultas com Sparql
Mecanismo de consulta padrão para dados em
formato RDF.
PREFIX mysite: <http://www.mysite.com>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
SELECT ?city
WHERE {
mysite:Berlin owl:sameAs ?city
}
RAFAEL BRITO DE OLIVEIRA 16/45
17. Linked Data
Os Princípios do Linked Data
Tim Berners-Lee em 2006, definiu os 4 princípios do Linked Data
que permitem que todo dado publicado na Web seja parte de um
grande espaço global de informação.
1. Utilize URIs para dar nome as coisas;
2. Utilize URIs HTTP, assim as pessoas podem encontrar esse
nomes;
3. Proveja informação útil, por meio de padrões (RDF e SPARQL);
4. Inclua links para outras URIs, assim será possível descobrir muito
mais coisas;
RAFAEL BRITO DE OLIVEIRA 17/45
18. Sumário
➔ Introdução
➔ Linked Data
➔ Publicando Linked Data na Web
➔ Aplicações que utilizam Linked Data
➔ Desafios
➔ Conclusões
RAFAEL BRITO DE OLIVEIRA 18/45
19. Publicando Linked Data na WEB
5 Passos
Open Linked Data
✩
Linked Data
✩✩
✩✩✩
✩✩✩✩
✩✩✩✩✩
RAFAEL BRITO DE OLIVEIRA 19/45
20. Publicando Linked Data na WEB
Linking Open Data Project
Fundada em 2007 e suportada pelo W3C.
Missão
"Alavancar a Web dos dados identificando bases de dados com dados abertos
e converte-los para RDF segundo os princípios do Linked Data".
Projeto desenvolvido pelo Linking Open Data Project, as informações do Wikipédia foram
convertidas em RDF e disponibilizada no DBpedia.
RAFAEL BRITO DE OLIVEIRA 20/45
21. Publicando Linked Data na WEB
Linking Open Data Project
2008
RAFAEL BRITO DE OLIVEIRA 21/45
22. Publicando Linked Data na WEB
Linking Open Data Project
2009
RAFAEL BRITO DE OLIVEIRA 22/45
23. Publicando Linked Data na WEB
Linking Open Data Project
2014
RAFAEL BRITO DE OLIVEIRA 23/45
24. Dados legados em base relacionais
➔ D2R Server
➔ Virtuoso Universal Server
➔ Tripify
Bancos de dados para triplas (RDF)
➔ Sesame, AllegroGraph, Virtuoso;
HTML
➔ RDFa: extensão do HTML5, anota páginas HTML identificando
unicamente os indivíduos;
API's Web
➔ JSON-LD: extensão do JSON, adiciona conceitos de Linked Data em um
arquivo JSON comum;
Publicando Linked Data na WEB
Ferramentas para publicação
RAFAEL BRITO DE OLIVEIRA 24/45
26. Criando o Contexto
"@context": {
"@base": "http://bigbluehat.cloudant.com/foaf/",
"_id": "@id",
"first_name": "http://xmlns.com/foaf/0.1/givenName",
"last_name": "http://xmlns.com/foaf/0.1/familyName",
"knows": {
"@id": "http://xmlns.com/foaf/0.1/knows",
"@type": "@id"
}}}
Publicando Linked Data na WEB
JSON-LD
RAFAEL BRITO DE OLIVEIRA 26/45
27. {
"_id": "BenjaminYoung",
"_rev": "2-c81a120b45cdb4330673d4ff615cc020",
"first_name": "Benjamin",
"last_name": "Young",
"knows": [
"SimonMetson",
"MaxThayer",
"MikeMiller"
],
"@context": {
"@base": "http://bigbluehat.cloudant.com/foaf/",
"_id": "@id",
"first_name": "http://xmlns.com/foaf/0.1/givenName",
"last_name": "http://xmlns.com/foaf/0.1/familyName",
"knows": {
"@id": "http://xmlns.com/foaf/0.1/knows",
"@type": "@id"}}}
Publicando Linked Data na WEB
JSON-LD
RAFAEL BRITO DE OLIVEIRA 27/45
28. <html version="HTML+RDFa 1.1" lang="en"
xmlns="http://www.w3.org/1999/xhtml"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
…
<p about="dbr:Albert_Einstein">
<span property="foaf:name">Albert Einstein</span>
<span rel="foaf:depiction"><img width="20%" src="http://upload.
wikimedia.
org/wikipedia/commons/thumb/d/d3/Albert_Einstein_Head.
jpg/460px-Albert_Einstein_Head.jpg" alt="Einstein's photo"
/></span>
</p>
</html>
Publicando Linked Data na WEB
RDFa
RAFAEL BRITO DE OLIVEIRA 28/45
29. Sumário
➔ Introdução
➔ Linked Data
➔ Publicando Linked Data na Web
➔ Quem esta usando Linked Data?
➔ Desafios
➔ Conclusões
RAFAEL BRITO DE OLIVEIRA 29/45
30. Quem esta usando Linked Data?
Empresas & Órgãos Governamentais
RAFAEL BRITO DE OLIVEIRA 30/45
31. Quem esta usando Linked Data?
Google (Knowledge Graph)
2010 - google compra Metaweb, criadora do Freebase
"Hoje, nós adquirimos a Metaweb, empresa que criou um banco de dados
sobre diversos fatos do mundo (Freebase). Trabalhando juntos iremos
melhorar as buscas e torna las mas significativas para todo mundo".
Jack Menzel - Director of product Management
2012 - google lança Knowledge Graph
"O futuro das buscas irá envolver: Respostas, Convergência e Antecipação"
Amit Singhal - Senior Vice President
RAFAEL BRITO DE OLIVEIRA 31/45
32. Quem esta usando Linked Data?
Google (Knowldge Graph)
knowledge Graph
RAFAEL BRITO DE OLIVEIRA 32/45
33. Quem esta usando Linked Data?
Google (Knowldge Graph)
RAFAEL BRITO DE OLIVEIRA 33/45
34. Sumário
➔ Introdução
➔ Linked Data
➔ Publicando Linked Data na Web
➔ Aplicações que utilizam Linked Data
➔ Desafios
➔ Conclusões
RAFAEL BRITO DE OLIVEIRA 34/45
41. Sumário
➔ Introdução
➔ Linked Data
➔ Publicando Linked Data na Web
➔ Aplicações que utilizam Linked Data
➔ Desafios
➔ Conclusões
RAFAEL BRITO DE OLIVEIRA 41/45
43. Referências
Bizer, C., Heath, T., & Berners-Lee, T. (2009). Linked data-the story so far.
International journal on semantic web and information systems, 5(3), 1-22.
Linked Data Tools, For the Semantic Web. Disponível em: <http://www.
linkeddatatools.com/semantic-web-basics> Acesso em 16 de Novembro de
2014.
W3C, Linked Data. Disponível em: <http://www.w3.
org/standards/semanticweb/data> Acesso em 16 de Novembro de 2014.
Wikipedia, Linked Data. Disponível em: <http://en.wikipedia.
org/wiki/Linked_data> Acesso em 16 de Novembro de 2014.
RAFAEL BRITO DE OLIVEIRA 43/45
44. Referências
RDFa, Linked Data in HTML. Disponível em: <http://rdfa.info/> Acesso em 16
de Novembro de 2014.
Lanthaler, Markus, and Christian Gütl. "Model your application domain, not
your JSON structures." In Proceedings of the 22nd international conference on
World Wide Web companion, pp. 1415-1420. International World Wide Web
Conferences Steering Committee, 2013.
Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a
Global Data Space (1st edition). Synthesis Lectures on the Semantic Web:
Theory and Technology, 1:1, 1-136. Morgan & Claypool.
RAFAEL BRITO DE OLIVEIRA 44/45