SlideShare a Scribd company logo
1 of 135
Download to read offline
LES FICHIERS D’AUTORITÉ ET
LEUR FONCTION DANS LES BASES
DE DONNÉES
Modélisation des données et humanités
numériques
13 octobre 2015
Normalisation de
notices pour se les
échanger
Structuration de
données pour se
les partager
LES DONNÉES D’AUTORITÉ ET
LEURS FONCTIONS DANS LES
BASES DE DONNÉES
Modélisation des données et humanités
numériques
13 octobre 2015
sommaire
• Le contrôle d’autorité : qu’est-ce que c’est ?
• Données d’autorité / web de données
• Des réservoirs de données d’autorité en évolution
• BnF / VIAF
• Le rôle des identifiants
• Identifiant local / identifiant communautaire / identifiant international (ISNI)
• La récupération des données
• Données BnF / Data.bnf.fr
• Exemples de bases de données
• Berlin intellectuel des années 1800
• SNAC (social network and archival context)
• American numismatic society
LE CONTRÔLE
D’AUTORITÉ
Partons d’un exemple : Jean Gerson
Statue de Jean
Gerson par Joseph
Félon (1818-1896)
dans une niche de la
façade de la Chapelle
de la Sorbonne à Paris
http://commons.wikime
dia.org/wiki/File:Jean_
Gerson_Sorbonne_sta
tue.jpg
Jean Gerson à la BnF
Tractatus Johannis Gersonis,
Cancellarii Parisiensis, contra
superstitiosam dierum observationem,
praesertim innocentum
Publié par Michael Hering, Hambourg,
1624
Numérisé dans Gallica
http://gallica.bnf.fr/ark:/12148/bpt6k104048
80
Jean Gerson à la BnF
Cy commence ung traictié compilé et fait
par homme de grant science maistre Jehan Jarson,
maistre en theologie, chancelier de Nostre Dame de Paris,
contre aucunes erreurs et mauvaises doctrines et exemples
qui sont contenues ou Roumant de la Rouse en plusieurs lieux
comme cy aprés est contenu
Jean Gerson à la BnF
Collection Michel Hennin.
Estampes relatives à l'Histoire de France
Portrait de J. Gerson
http://gallica.bnf.fr/ark:/12148/btv1b8400155c
Jean Gerson à la BnF
Collection Michel Hennin.
Estampes relatives à l'Histoire de France
Portrait de J. Gerson, en pied,
se dirigeant vers la gauche
et suivi d'un chien
http://gallica.bnf.fr/ark:/12148/btv1b84001576
Besoins
• Identification de
manière univoque
des entités
cataloguées : de qui,
de quoi parle-t-on?
• Explicitation de
l’implicite des notices
bibliographiques
11
Besoins
• Outil de navigation
dans les ressources de
la BnF, pour la
recherche
• Centralisation des
différentes formes du
nom
12
Besoins
• Outil de navigation dans les ressources de la
BnF
• Par les liens entre notices descriptives (bibliographiques,
archivistiques) et les notices d’autorité
13
Une « notice d’autorité »
• Un « fichier d’autorité »
Cocteau, Jean (1889-1963)
Personne physique
Hahn, Reynaldo (1874-1947)
[le dieu bleu (ballet)]
Titre musical
La belle et la bête (film)
Titre conventionnel
Groupe des Six
[Les mariés de la Tour Eiffel]
Titre musical
Groupe des Six
Collectivité
Les objectifs du contrôle d’autorité
(FRAD : functional requirements for authority data)
• trouver
• des informations sur les entités décrites par les données d’autorité
• identifier
• confirmer que l’entité trouvée correspond bien à la recherche
• distinguer entre des entités analogues
• contextualiser
• expliciter les relations entre les entités, ou entre une entité et un
nom (par exemple : nom d’alliance, pseudonyme…)
• justifier
• les choix du catalogueur (par exemple : justifier par une source une
forme rejetée)
Une notice d’autorité n’est pas une notice biographique mais
fournit des données « noyau », fondamentales, réutilisables pour
des usages différents
Importance des identifiants pérennes (ARK)
Importance des identifiants internationaux (ISNI)
19
FRBR : le rôle central des autorités
21
Œuvre
Expression
Manifestation
Item
Personne
Collectivité
Concept
Objet
Événement
Lieu
réalisée dans
matérialisée dans
exemplifiée par
Famille
Entités
Groupe 1
Entités
Groupe 2
Entités
Groupe 3
FRBR : le rôle central des autorités
22
Œuvre
Expression
Manifestation
Item
Personne
Collectivité
Concept
Objet
Événement
Lieu
réalisée dans
matérialisée dans
exemplifiée par
Famille
Entités
Groupe 1
Entités
Groupe 2
Entités
Groupe 3
Œuvre
Expression
Manifestation
Item
Personne
Collectivité
Concept
Objet
Événement
Lieu
créée par
réalisée par
produite par
possédé par
Famille
Entités
Groupe 1
Entités
Groupe 2
Entités
Groupe 3
Les relations dans le modèle FRBR
23
Relations Groupe 1 / Groupe 2
Relations de responsabilité
Après le modèle FRBR
• 1999 : création d’un autre groupe de travail pour étendre
le modèle FRBR aux données d’autorité
• 2009 : publication du Rapport final sur les fonctionnalités
requises des données d’autorité (FRAD, Functional
requirements for authority data)
• le modèle FRAD n’en est qu’une partie
DEV 10 - 2013 24
Le Rapport final FRAD
• Objectifs :
• Définir les fonctionnalités requises des données
indispensables au contrôle d’autorité
• gestion des points d’accès dans un catalogue
• identification des entités représentées par ces points d’accès
• pour permettre
• de répondre aux besoins des utilisateurs des données d’autorité
• de partager et de réutiliser les données d’autorité
• Le modèle met l’accent sur les données, non sur leur
organisation dans des notices
DEV 10 - 2013 25
FRAD : un « modèle
Conceptuel »
Que met-on dans
une notice d’autorité
Avec quelles
données?
Notion de données
d’autorité
Personne/nom/point d’accès contrôlé
Entité bibliographique
personne / collectivité
Nom
et/ou
Identifiant
Point d’accès contrôlé
Gerson, Jean (1363-1429)
Connue
par
Base
pour
Jean Gerson
ISNI :
0000 0001 2145 048X
De la notice aux données (FRAD) :
les attributs d’une personne
28
Une personne
Date Titre Sexe
Lieu de
naissance
Lieu de
mort Pays Lieu de
résidence
Affiliation Adresse Langue
Domaine
d’activité
Professio
n/
occupatio
n
Biographi
e/histoire
Autre
informatio
n
Les données d’autorité après FRBR et
FRAD
• Des données d’autorité acquièrent une importance
nouvelle
• Pas simplement une notice d’autorité fournissant un point d’accès
à une notice bibliographique
• La « notice » est un assemblage de données
• Les données circulent et sont visibles par tous : enjeu du Web
• FRBR et FRAD sont des documents de référence
internationaux : une première pour les autorités
• Ce ne sont pas des normes mais des modèles
conceptuels
• Appellent à la rédaction de nouvelles normes, portant sur
l’ensemble des données d’autorité et pas uniquement sur les
formes retenues
Les enjeux posés par le Web et le Web de données
Le contexte du Web : les autorités
et les moteurs de recherche
Importance des référentiels
• Désambiguisation
• Panachage
33
• Découverte
• Importance
des entités :
informations
regroupées
autour d’un
concept
Pratiques de recherche en mutation
• Seule la première page de résultats est
consultée, si pas pertinent, on reformule sa
requête
• Mots-clés associés à une recherche
• Un environnement gratuit par défaut
• Économie de l’abondance
• Moins de passage par des portails
• Accès direct au document
Le lecteur souhaite accéder à des…
36
auteurs
éditeurs
organisations
notions
œuvres personnes
 des contenus
et des informations
objets
événements
lieux
livres
films
œuvres musicales
sites web…
www
L’économie appliquée au web :
le modèle de la longue traîne
37
Le web a ouvert l’ère des marchés de niche et des « non-
succès »
Article Chris Anderson The Wire
http://www.internetactu.net/2005/04/12/la-longue-traine/
Les catalogues constituent des silos :
pour trouver les ressources liées à un centre
d’intérêt
L’usager souhaite s’en servir pour fiabiliser sa
recherche
Dépasser une contradiction
D’une part…
Mais….
Les métadonnées : un trésor sur le web
• Des données validées
• Créées par un professionnel de la
description de ressources
• Des données contextualisées
• Les informations sont précisées par
une source et une date
• Pérennité des accès et citations
• ARK, autres identifiants
• Généralement l’identifiant est envisagé
sur le très long terme
• Utilisateurs tiers
• Tradition d’une offre de services
• Désintéressement financier
Le projet data.bnf.fr
Catalogue général (15,3
M)
Collections numérisées (2,4 M) Des pages web
pour les humains
Des données structurées
pour les machines
BnF Archives et
manuscrits
Des pages web
pour les moteurs de recherche
et pour les humains
Traitements automatiques :
alignements, regroupements
Ouverture technique et juridique des
données
1/ Des données visibles sur le web
Rendre visibles ces données en les rendant indexables
par les moteurs du Web
+80 % des visiteurs viennent des moteurs de recherche
Une porte d’entrée vers les applications existantes
60 % des visiteurs de data.bnf.fr vont ensuite vers Gallica
et les catalogues
Recherche : exemple Baldus de Ubaldis, Exquemelin,
stanze de politien, proverbes mandingues, cesare beccaria
des delits et des peines ed 1821
christine de pisan
2/ Regrouper les données sur des pages
simples
> Organiser des
pages « pivots » sur
les œuvres, les
auteurs, les thèmes
/
http://data.bnf.fr/ark:/12148/cb11970307j
Données existantes : des liens, des autorités
et des identifiants
Any black Magic?
1xx
(creator of)
0070
(author)
WORK
MANIFESTATION
PERSON
INTERMARC
INTERMARC
INTERMARC
FRBNF11896956
FRBNF11967514
FRBNF37465618
Links
Persistent identifiers
Codes for roles
EAD
Any black Magic?
dc:creator
WORK
PUBLICATION
PERSON
http://catalogue.bnf.fr/ark:/12148/cb118969563
http://catalogue.bnf.fr/ark:/12148/cb11967514v
http://catalogue.bnf.fr/ark:/12148/cb374656186
dc:creator
RDF triples
RDF triples
RDF triples rdarelationships:workManifested
André Malraux
dans le catalogue
de la BnF
http://catalogue.bnf.fr/ark:/12148/cb11914
167k

André Malraux
(décrit dans
Wikipédia)
http://fr.dbpedia.org/resource/Andr%C3%A9_Malr
aux
Paris
Paris décrit dans
geonames
(coordonnées…)
http://www.geonames.org/2988507
PRINCIPES DU WEB DE DONNÉES
La
Condition
humaine
archives
publiques
Principes du Linked Data
• Utiliser des URIs
• Utiliser des URIs accessibles via
HTTP
• Donner l’accès aux données utiles
en utilisant les standards SPARQL et
RDF
• Exprimer l’URI des objets liés
http://thedatahub.org
51
En d’autres termes :
• Des identifiants pour les choses
qu’on décrit
• Qui renvoient une page
• Décrire ces ressources selon les
standards du web sémantique
• Relier nos données à d’autres
données présentes ailleurs
http://thedatahub.org
52
(< http://catalogue.bnf.fr/ark:/12148/cb118900414 >, <http://www.w3.org/1999/02/22-rdf-syntax-
ns#type>, <http://xmlns.com/foaf/0.1/Person>)
(<http://catalogue.bnf.fr/ark:/12148/cb119349138/>, <http://purl.org/dc/elements/1.1/creator>, <
http://catalogue.bnf.fr/ark:/12148/cb118900414 >)
Structure d’un triplet RDF = Structure d’une phrase
simple
Sujet Verbe Complément
Honoré de Balzac est une personne
Une oeuvre a pour créateur un auteur
Le modèle RDF
http://catalogue.bnf.fr/ark:/12148/cb38935131d
1956
Chansons
possibles et
impossibles
a pour
auteur
a pour
titre http://catalogue.bnf.fr/ark:/12148/cb13091689x
Le déserteur
http://catalogue.bnf.fr/ark:/12148/cb147208654
J'irai cracher sur vos tombes
Vian, Boris (1920-1959)
Sullivan, Vernon (1920-1959)
nom
pseudonyme
a pour auteur
http://catalogue.bnf.fr/ark:/12148/cb37471336j
a pour
titre
a pour
auteur
3/Se lier sur le web
 Lier ces données à d’autres jeux de
données du Web
LCSH, GND, Agrovoc,
Geonames, archives thesaurus
Se lier à des entités extérieures
VIAF, ISNI, idRef.fr, Dbpedia
Geonames,
INSEE
Dbpedia
works
persons
corporate bodies
dates places
subjects
families
http://data.bnf.fr/ark:/12148/cb11888473k
4/Encourager les utilisations
 Par les bibliothèques
 et bien au-delà : recherche, tourisme,
édition…
grâce à l’ouverture juridique et technique
des métadonnées.
Réutiliser les données : au détail
• data.bnf.fr/12101638/wacl
aw_potocki/rdf.xml
• data.bnf.fr/12101638/wacl
aw_potocki/rdf.nt
• data.bnf.fr/12101638/wacl
aw_potocki/rdf.n3
click on the RDF icon, at the
bottom of the pages
Add the following suffixes to the URL: NT, N3,
RDF-XML, according to the format needed
Réutiliser les données : en gros
• A dump of all data in data.bnf.fr
• This dump is split in specific dumps
• All documents (complete description)
• Authors-persons = including authority data for persons
• Authors-organizations = including authority data for corporate bodies
• Works, in the FRBR sense
• Subjects (RAMEAU) and their related documents
• Places (geographic records)
• Documents about an author or a work
• External data sets matched to data.bnf.fr
• Descriptions of performances
• Periodicals (series)
• Dumps for dates (years)
• BnF ontology
• Dumps for country codes
• Codes for geographic areas
• Codes for musical genres
• Codes for roles
In RDF-nt
RDF-n3
RDF-xml
Réutliser les données : produits à façon
Sparql
Sample queries in data
http://data.bnf.fr/docs/doc_requetes_data_en.pd
f
•
http://www.ifverso.com/fr/content/robur-le-conquerant-14
http://www.rechercheisidore.fr/
Ils récupèrent nos données
http://data.abuledu.org
Fédération
Des ensembles
Vocaux et
Instrumentaux
Spécialisés
De l’échange de notices au partage des
données
• Ouverture technique et juridique des données =>
évolution dans le partage international du travail
• Éviter la redondance du travail
• Plus facile d’identifier les entités nationales (proximité des sources)
= mais cette notion est à revoir dans le contexte du Web
• => notion de confiance, de champ d’expertise
• De la normalisation des notices pour pouvoir les
échanger à la structuration des données pour pouvoir
les partager
• Non, la normalisation et l’expertise ne sont pas mis à mort par le
Web
Any black Magic?
1xx
(creator of)
0070
(author)
WORK
MANIFESTATION
PERSON
INTERMARC
INTERMARC
INTERMARC
FRBNF11896956
FRBNF11967514
FRBNF37465618
Links
Persistent identifiers
Codes for roles
EAD
Any black Magic?
dc:creator
WORK
PUBLICATION
PERSON
http://catalogue.bnf.fr/ark:/12148/cb118969563
http://catalogue.bnf.fr/ark:/12148/cb11967514v
http://catalogue.bnf.fr/ark:/12148/cb374656186
dc:creator
RDF triples
RDF triples
RDF triples rdarelationships:workManifested
Structured data… since
1380
vintage linked data since
1987
Trusted identifiers
BEHIND THIS
IS:
CATALOGERS AND
CATALOGUE QA
TEAM
- INTELLIGENT
DATA
- CONSISTENCY
- LINK CURATION
https://www.flickr.com/photos/bohman/4394901689
Work-manifestation links: machine
calculated
dc:creator
WORK
PUBLICATION
http://catalogue.bnf.fr/ark:/12148/cb118969563
http://catalogue.bnf.fr/ark:/12148/cb11967514v
http://catalogue.bnf.fr/ark:/12148/cb374656186
dc:creator
RDF triples
RDF triples
RDF triples rdarelationships:workManifested
PERSON
LES IDENTIFIANTS
Identifier les ressources : les URI
Uniform resource identifier
Identifier et localiser une ressource sur le réseau
Respectant une syntaxe particulière
Attribué par une autorité enregistrée
• Pérennité de l’accès à une ressource
• ARK à la BnF (California digital library)
• Identifiants internationaux fiables : ISNI, ISSN
• Pérennité, unicité, engagement
http://www.flickr.com/photos/jenwaller/22079182
46/
Un exemple, les identifiants Ark
ark:/12148/bpt6k103039f
__/____/____________/
Schème
Numéro d’autorité nommante
Nom (attribué par
l’autorité nommante)
Le monde La BnF Une ressource> >
Une Uri à partir des identifiants Ark
http://gallica.bnf.fr/ark:/12148/bpt6k103039f/f122
Partie obligatoire
L’identifiant proprement
dit
Donne accès à la
ressource
Optionnel
Sous ensemble
d’un identifiant
Autorité d’accès Nom ARK Qualificatif
IDs
Internationaux
Communités
spécifiqus
d’utilisateurs
IDs locaux
(chaque
institution –
son ID
système,
GND
(Allemagne
DNB +
cooperative
)
IdRef
(ABES
Universités
françaises)
International
Standard
Mondial
Inter-domaine
IPI
Internationa
l CISAC
auteurs/com
positeurs
IPD
Internation
al
interprètes
Les différents types d’identifiants /
pont entre les données
IDs operant
au niveau
regional/
consortium
DAI
Pays Bas
Chercheu
rs
VIAF ID
Bibliothèqu
es et +
Gestion droits
(interprètes)
Universités
françaises
bibliothèques
Institutions de
recherche
Bibliothèques
publiques
France
ARK ID
(fichiers
autorité)
NACO
(LC +
cooperative)
Institutions
danoises
Gestion droits
(auteurs,
compositeurs)Allemagne
bibliothèques + Editeurs
Gestion droits
(textes)
NACO
bibliothèque
s
membres
E
X
E
M
P
L
E
S
(ARK ID)
Archives
(US+)
z
Archives
ISO 27729 International Standard Name Identifier
Identités publiques
Personnes et collectivités
Permet d’identifier au niveau international « les individus et les organismes qui contribuent
aux œuvres de création, notamment les écrivains, artistes , créateurs, interprètes,
chercheurs, producteurs, éditeurs etc. »
e.g.: ISNI 0000 0001 2133 4104
 Périmètre universel
 Unique
 Pérenne
 Administré de manière centralisée
 Exprimé comme une URI : http://isni.org/isni/0000000121334104
pour
www.isni.org
Les notices de VIAF
constituent le socle de
la base ISNI.
Elles sont confrontées
aux données des autres
contributeurs d’ISNI
41 institutions partenaires
En France : la BnF et le
SUDOC
Les notices sur les
personnes et les
collectivités des
partenaires sont
regroupées en grappes
LA BASE ISNI,
CONSTRUITE À PARTIR DE VIAF
Autres
contributeurs
Novembre 2013 74
http://www.isni.org/
7,98 millions ISNI assignés
6,74 millions
Clusters VIAF
contiennent un ISNI
Périmètre de VIAF et d’ISNI
- Clusters VIAF ne remplissant pas les critères
d’assignation des ISNI
(clusters avec une seule source…)
Image from: http://kids.britannica.com/comptons/art-149833/John-le-Carre
ISNI Quality Team
Cornwell, David John Moore (vrai nom)Le Carré, John (pseudonyme)
Identités publiques
1 personne, 2 identités publiques 2 ISNI séparés
La relation est
publique
Pour les
personnes
décédées
après 1900
Bibliothèques
Droits textes
Droits Musique
Sourcescommerciales
Encyclopédies
Recherche
Les contributeurs d’ISNI : un croisement de
multiples domaines (liste non exhaustive)
Autres sources
domaine culture
(archives, art
contemporain, etc.)
78
L’ÉVOLUTION DES
FICHIERS D’AUTORITÉ
Un fichier évolutif :
avoir des données fiables et sourcées
• Mises à jour, corrections incessantes
• Importance des sources primaires, y compris
archivistiques
Que veut-on faire dire à une notice
d’autorité du catalogue?
81
+ Contexte … etc.
+ Contexte
Archives
+ Contexte
Enluminures
+ Contexte
Manuscrits
+ Contexte
Reliures
Info
noyau
Ou bien, si besoin …
82
Info
noyau
+ Contexte
… etc.
+
Contexte
Archives
+ Contexte
Enluminures
+ Contexte
Manuscrits
+ Contexte
Reliures
+
Contexte
Objet
+ Contexte
Archives
sonores
+
Contexte
Médailles
83
Contexte
Reliures
François Ier (roi de France ; 1494-1547)
forme internationale français
Informations
« noyau »,
valables pour
tout contexte
Lien
ARK spécifique
BnF Autorités
Info « noyau »
(MARC)
Reliures
Autorités
Contextuelles
<XML TEI>
Globes
contexte
MARC
<MARC-XML>
BnF archives
institutionelles
Autorités
Contextuelles
<EAC-CPF>??
Données d’autorité
contextuelles en réseau
Reseau
bibliophilie
Autres bases
Reliures
Monnaies
???
et autres
archives
, " & # "
Entités nommées:
Personnes
Collectivités
Familles
…
noeuds communs
entre ressources
Un nouveau contexte normatif
international
• Nouveau code de
catalogage :
• Ambition de prendre en
compte FRBR, FRAD et
enjeux du Web
• Pas seulement la
construction des noms
mais l’ensemble des
données d’autorité
• RDA comme référence
hors du monde des
bibliothèques
• Un code unique :
traite de toutes les
entités FRBR et de
leurs relations
• Entités du Groupe 2
FRBR (les Agents)
en font partie
intégrante
Contexte normatif - international
• Normalisation
ISAAR (CPF) : Norme Internationale sur les notices
d’autorité utilisées pour les Archives relatives aux
collectivités, aux personnes ou aux familles, 2e éd
– 2004 (1e éd 1996)
• Norme sur le contenu des notices d’autorité
• Pour la structuration des points d’accès 
renvoie vers les normes et bonnes pratiques
spécifiques appliquées dans des contextes
locaux
Archives
• Modélisation
Ŕ travaux en cours ICA par
Groupe d’experts sur la description archivistique
(EGAD)
Ŕ But : appréhender l’information archivistique
dans son ensemble (y compris les producteurs
Contexte normatif - international
• Norme sur les Thésaurus ISO 25964
Thésaurus et interopérabilité avec d'autres
vocabulaires
• cadre englobant Ŕ fait référence aux entités nommées et
listes d’autorités (y compris personnes, collectivités,
familles) dans la partie sur l’interopérabilité
Communauté documentation et
KOS (Knowledge Organization Systems)
• Mais aussi …
codes de catalogage et bonnes pratiques
utilisés par de producteurs de données d’autorité
sur les personnes et les collectivités
Ex :
Ŕ ULAN (Union List of Artists’ Names) de Getty
Au niveau national : initiatives en cours
• Groupe technique AFNOR GC 46 CN46-9/GE 6
RDA en France
• Projet de norme en cours
porte sur le Groupe 2 des entités FRBR
(Personnes, Collectivités, Familles)
• But : faire évoluer les règles de catalogage
• Les adapter au nouveau contexte
• Favoriser la FRBRisation des catalogues
• Porter les données des bibliothèques sur le Web
Sémantique
Bibliothèques
Au niveau national : initiatives en cours
• Groupe de travail AAF/SIAF
Notices d’autorité Producteurs
ISAAR(CPF)
depuis 2010
Archives
http://www.archivistes.org/Notices-d-autorite-producteurs-
1781
But : Réaliser un Référentiel national
proposant
Ŕ des formes autorisées du nom pour
l’administration territoriale (1800 à nos jours)
Ŕ des descriptions normalisées des
organismes types, selon la norme
ISAAR(CPF)
Au niveau national : initiatives en cours
• Cadre: programme HADOC
(Harmonisation des données culturelles)
• Modèle harmonisé pour la production des données
culturelles
(références: Norme ISO 25964, modèles CRM et
FRBRoo)
• Comprend : Modèle « Acteur »
• Cadre d’action:
« Référentiel des acteurs historiques »
Ministère de la Culture et de la Communication
http://passes-present.eu/sites/default/files/projets/intervention_hadoc_briatte.pdf
Briatte, Katell. Atelier « Passées dans le présents », 10 avril 2014
Vers une norme française des
« agents » ? oui, c’est possible
 Parce que les normes existantes sont obsolètes
besoin de les réviser
Parce qu’il y a besoin d’une démarche globale
sur tout ce qui a trait aux Agents (Personnes,
Collectivités, Familles)
Pour faire le lien avec le contexte international
« Agir local Ŕ Penser global »
Parce que l’environnement technologique le permet
Parce qu’il y a besoin de rassembler l’ensemble de
la profession info doc pour répondre aux besoins
d’interopérabilité
Agents Ŕ point commun entre jeux de données
• 1978 : premières discussions sur
un fichier d’autorité international
• 2003 : Research
prototype (LC, DNB)
• 2007 : BnF rejoint VIAF
• 2012 : Nouvelle organisation
• service
• VIAF Council
• 2012 : Open data
• 2014 : Nouveaux critères
d’adhésion
Virtual international authority file
www.viaf.org
41 institutions et projets
26 millions de clusters
Tout est gratuit !
Les partenaires VIAF : les BN
Les réseaux nationaux et régionaux
DES DONNEES
DE NICHE
La « philosophie » de viaf
« Car aucune chose ne
devient ni ne périt, mais elle se
mêle ou se sépare de choses
qui sont.
Ainsi on dirait à bon droit « se
composer » au lieu de «
devenir » et « se décomposer
» au lieu de « périr »
Fragments d’Anaxagore, « sur
la nature », 17
http://viaf.org/viaf/294235617
Ἀναξαγόρας
http://viaf.org/viaf/24645587
• Aucune donnée n’est créée dans VIAF
• Toutes les données traitées par VIAF proviennent des partenaires de
VIAF
• VIAF c’est un appariement de données
• On parle de grappe ou de « cluster » VIAF : rapprochement entre
les différentes notices des différents partenaires
• Les données viennent du fichier d’autorité et du fichier
bibliographique qui y est lié
• VIAF ne choisit pas entre les « bonnes » et les « mauvaises »
données, il reste neutre entre les différents partenaires (sauf cas
particuliers)
• Plus les données sont complètes et justes, plus les algorithmes
de VIAF sont performants
• Importance du travail sur les données à la source
Récupération des données de VIAF
• En gros :
- Un dump RDF
- Marc 21 XML
• Au détail :
• RDF/XML
« neutre »/Marc 21 XML
/ JSON
- Un service SRU
- Possibilité de
construire de petites
applications web
d’interrogation
Le RDF de VIAF
• Elaboré en 2011,
totalement revu
• Parti pris de la
simplicité
• Pour une interopérabilité très
large
• Deux parties :
• Chaque contibuteur
distingué (skos)
• Le cluster en soit
(schema.org)
- Fédère et compare les données
Bilan :
VIAF et le contrôle d’autorité
international
Toutes les données
sont visibles
☛ Question centrale de la qualité des données
☛ Les partenaires sont responsables de ce qu’ils fournissent
Interconnect
e
- Visibilité sur le Web
- Partage de la
connaissance
- Linked Open Data
- Partage de
l’expertise
La qualité des données
est aussi visible
QUELQUES PROJETS
UTILISANT LES DONNÉES
D’AUTORITÉ
Data mining à partir des données de la
BnF
• Frédéric Glorieux, LABEX
OBVIL (Paris IV)
• Auteurs français, éléments de
démographie historique
(data.bnf.fr 2015-04)
• https://resultats.hypotheses.org/
author/resultats
• A partir du dump auteurs
personnes d’avril 2015
Data mining
Data mining
Data mining
Un exemple d’utilisation de VIAF
EAD
(données décrivant
le producteur d’un
fonds)
Autorités
(formes du
nom)
Une application
Description EAD
contenant des notes
biographiques
VIAF
Fichier d’autorité
international
40 institutions
25 millions de notices
Notices biographiques
dans SNAC
Données disponibles en
RDF
Web de données
Nettoyage et enrichissement d’un set de données
REGROUPEMENT FONDÉ SUR LASIMILITUDE
DES CHAÎNES DE CARACTÈRES
Regroupement fondé sur l’identifiant ark BnF
Regroupement fondé sur l’identifiant VIAF
Requête SPARQL pour extraire la forme retenue d’une
personne
Forme retenue en français
Requête SPARQL pour extraire les formes rejetées
d’une personne
Formes rejetées en plusieurs langues
Requête SPARQL pour extraire les identifiants d’une
personne propres à d’autres référentiels
Les URIs d’une personne alignée par data.bnf.fr vers
d’autres référentiels
Application des requêtes SPARQL sur des ensembles
de données
Pour extraire les formes retenues des noms
Pour extraire les formes rejetées des noms
Pour extraire les URIs d’autres référentiels
Extraire d’autres types d’infos
Note biographique
Sources utilisées pour rédiger
la notice d’autorité

More Related Content

What's hot

Application Web sémantique sur des manuscrits médiévaux - Retour d'expérience
Application Web sémantique sur des manuscrits médiévaux - Retour d'expérienceApplication Web sémantique sur des manuscrits médiévaux - Retour d'expérience
Application Web sémantique sur des manuscrits médiévaux - Retour d'expérienceEquipex Biblissima
 
Présentation du portail Biblissima
Présentation du portail BiblissimaPrésentation du portail Biblissima
Présentation du portail BiblissimaEquipex Biblissima
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Equipex Biblissima
 
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Equipex Biblissima
 
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"ABES
 
L'évolution des catalogues
L'évolution des cataloguesL'évolution des catalogues
L'évolution des cataloguesMarc Maisonneuve
 
L'évolution des catalogues
L'évolution des cataloguesL'évolution des catalogues
L'évolution des cataloguesMarc Maisonneuve
 
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Lesticetlart Invisu
 
Baromètre d’accessibilité des bibliothèques
Baromètre d’accessibilité des bibliothèques Baromètre d’accessibilité des bibliothèques
Baromètre d’accessibilité des bibliothèques Marc Maisonneuve
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web SémantiqueYves Otis
 
Biblissima, un observatoire de la transmission des textes anciens
Biblissima, un observatoire de la transmission des textes anciensBiblissima, un observatoire de la transmission des textes anciens
Biblissima, un observatoire de la transmission des textes anciensEquipex Biblissima
 
Quelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesQuelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesBe_Sa
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Cairn.info
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesnonue12
 
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...Equipex Biblissima
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Bibliotheque Université de Provence
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Y. Nicolas
 

What's hot (19)

Application Web sémantique sur des manuscrits médiévaux - Retour d'expérience
Application Web sémantique sur des manuscrits médiévaux - Retour d'expérienceApplication Web sémantique sur des manuscrits médiévaux - Retour d'expérience
Application Web sémantique sur des manuscrits médiévaux - Retour d'expérience
 
Présentation du portail Biblissima
Présentation du portail BiblissimaPrésentation du portail Biblissima
Présentation du portail Biblissima
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
 
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
 
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
 
L'évolution des catalogues
L'évolution des cataloguesL'évolution des catalogues
L'évolution des catalogues
 
L'évolution des catalogues
L'évolution des cataloguesL'évolution des catalogues
L'évolution des catalogues
 
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
 
Le web sémantique - Sylvie Fayet
Le web sémantique - Sylvie FayetLe web sémantique - Sylvie Fayet
Le web sémantique - Sylvie Fayet
 
Baromètre d’accessibilité des bibliothèques
Baromètre d’accessibilité des bibliothèques Baromètre d’accessibilité des bibliothèques
Baromètre d’accessibilité des bibliothèques
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
 
Biblissima, un observatoire de la transmission des textes anciens
Biblissima, un observatoire de la transmission des textes anciensBiblissima, un observatoire de la transmission des textes anciens
Biblissima, un observatoire de la transmission des textes anciens
 
Quelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesQuelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de données
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de données
 
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
Je biblissima
Je biblissimaJe biblissima
Je biblissima
 

Viewers also liked

1 mbc 2008-f28a à f28c -gaz parfaits_
1 mbc 2008-f28a à f28c  -gaz parfaits_1 mbc 2008-f28a à f28c  -gaz parfaits_
1 mbc 2008-f28a à f28c -gaz parfaits_clairerichoz
 
PAC 3 Origen i vigència de la Multimèdia
PAC 3 Origen i vigència de la MultimèdiaPAC 3 Origen i vigència de la Multimèdia
PAC 3 Origen i vigència de la MultimèdiaNúria Escudé
 
Presentación1 (software libre y propietario)
Presentación1 (software libre y propietario)Presentación1 (software libre y propietario)
Presentación1 (software libre y propietario)Luis Gustavo
 
Le binding en wpf
Le binding en wpfLe binding en wpf
Le binding en wpfChinouchi
 
Gaz parfait et stoechiométrie 2
Gaz parfait et stoechiométrie 2Gaz parfait et stoechiométrie 2
Gaz parfait et stoechiométrie 2clairerichoz
 
Principe de compétence compétence
Principe de compétence compétencePrincipe de compétence compétence
Principe de compétence compétenceRabah HELAL
 
Responsabilite et-obligation resume
    Responsabilite et-obligation resume    Responsabilite et-obligation resume
Responsabilite et-obligation resumeRabah HELAL
 
Projet carrière i.s
Projet carrière i.sProjet carrière i.s
Projet carrière i.sEric Hebert
 
Introduction aux évaluations en milieu de travail
Introduction aux évaluations en milieu de travailIntroduction aux évaluations en milieu de travail
Introduction aux évaluations en milieu de travailMedCouncilCan
 
Mi abuela por noelia torreño roldán
Mi abuela por noelia torreño roldánMi abuela por noelia torreño roldán
Mi abuela por noelia torreño roldánmoronad45
 
Tarjetas Inteligentes (Smarth card)
Tarjetas Inteligentes (Smarth card)Tarjetas Inteligentes (Smarth card)
Tarjetas Inteligentes (Smarth card)Erick Estrada
 
Dossier sur le_conteneur
Dossier sur le_conteneurDossier sur le_conteneur
Dossier sur le_conteneurRabah HELAL
 
Facebook en bibliothèque utbm. bibliest 1.04.2014
Facebook en bibliothèque utbm. bibliest 1.04.2014Facebook en bibliothèque utbm. bibliest 1.04.2014
Facebook en bibliothèque utbm. bibliest 1.04.2014Estelle Munoz
 
Le chemin vers l'agilité et les équipes produits
Le chemin vers l'agilité et les équipes produitsLe chemin vers l'agilité et les équipes produits
Le chemin vers l'agilité et les équipes produitsGourmelon Loic
 

Viewers also liked (20)

1 mbc 2008-f28a à f28c -gaz parfaits_
1 mbc 2008-f28a à f28c  -gaz parfaits_1 mbc 2008-f28a à f28c  -gaz parfaits_
1 mbc 2008-f28a à f28c -gaz parfaits_
 
PAC 3 Origen i vigència de la Multimèdia
PAC 3 Origen i vigència de la MultimèdiaPAC 3 Origen i vigència de la Multimèdia
PAC 3 Origen i vigència de la Multimèdia
 
Impedimento corporal
Impedimento corporalImpedimento corporal
Impedimento corporal
 
Presentación1 (software libre y propietario)
Presentación1 (software libre y propietario)Presentación1 (software libre y propietario)
Presentación1 (software libre y propietario)
 
Le binding en wpf
Le binding en wpfLe binding en wpf
Le binding en wpf
 
Gaz parfait et stoechiométrie 2
Gaz parfait et stoechiométrie 2Gaz parfait et stoechiométrie 2
Gaz parfait et stoechiométrie 2
 
Itesm liderazgo-herramienta
Itesm  liderazgo-herramientaItesm  liderazgo-herramienta
Itesm liderazgo-herramienta
 
Principe de compétence compétence
Principe de compétence compétencePrincipe de compétence compétence
Principe de compétence compétence
 
Taller word 4
Taller word 4Taller word 4
Taller word 4
 
Responsabilite et-obligation resume
    Responsabilite et-obligation resume    Responsabilite et-obligation resume
Responsabilite et-obligation resume
 
Projet carrière i.s
Projet carrière i.sProjet carrière i.s
Projet carrière i.s
 
Introduction aux évaluations en milieu de travail
Introduction aux évaluations en milieu de travailIntroduction aux évaluations en milieu de travail
Introduction aux évaluations en milieu de travail
 
Caminant amb machado
Caminant amb machadoCaminant amb machado
Caminant amb machado
 
Mi abuela por noelia torreño roldán
Mi abuela por noelia torreño roldánMi abuela por noelia torreño roldán
Mi abuela por noelia torreño roldán
 
O pantanal
O pantanalO pantanal
O pantanal
 
Tarjetas Inteligentes (Smarth card)
Tarjetas Inteligentes (Smarth card)Tarjetas Inteligentes (Smarth card)
Tarjetas Inteligentes (Smarth card)
 
Dossier sur le_conteneur
Dossier sur le_conteneurDossier sur le_conteneur
Dossier sur le_conteneur
 
Plateforme claro amel
Plateforme  claro amelPlateforme  claro amel
Plateforme claro amel
 
Facebook en bibliothèque utbm. bibliest 1.04.2014
Facebook en bibliothèque utbm. bibliest 1.04.2014Facebook en bibliothèque utbm. bibliest 1.04.2014
Facebook en bibliothèque utbm. bibliest 1.04.2014
 
Le chemin vers l'agilité et les équipes produits
Le chemin vers l'agilité et les équipes produitsLe chemin vers l'agilité et les équipes produits
Le chemin vers l'agilité et les équipes produits
 

Similar to Les fichiers d’autorite et leur fonction dans les bases de données

JABES 2017 - Intégrer IdRef à l'exemple de Persée
JABES 2017 - Intégrer IdRef à l'exemple de PerséeJABES 2017 - Intégrer IdRef à l'exemple de Persée
JABES 2017 - Intégrer IdRef à l'exemple de PerséeABES
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
 
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...ABES
 
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...ABES
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Charles Ruelle
 
Les catalogues sur le Web
Les catalogues sur le WebLes catalogues sur le Web
Les catalogues sur le WebFigoblog
 
Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? chessmu
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifiquelazoumi ouarfli
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataGroupe EEIE
 
Interopérabilité de l'information bibliographique et muséologique
Interopérabilité de l'information bibliographique et muséologiqueInteropérabilité de l'information bibliographique et muséologique
Interopérabilité de l'information bibliographique et muséologiquePatrick Le Boeuf
 
La netnographie, quelles évolutions ?
La netnographie, quelles évolutions ? La netnographie, quelles évolutions ?
La netnographie, quelles évolutions ? Maria Mercanti-Guérin
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDAnonue12
 
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2BELVEZE Damien
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011Y. Nicolas
 
Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010Alexandre Serres
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Fabien Gandon
 
Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...
Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...
Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...ABES
 
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ? RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ? ADBS
 

Similar to Les fichiers d’autorite et leur fonction dans les bases de données (20)

JABES 2017 - Intégrer IdRef à l'exemple de Persée
JABES 2017 - Intégrer IdRef à l'exemple de PerséeJABES 2017 - Intégrer IdRef à l'exemple de Persée
JABES 2017 - Intégrer IdRef à l'exemple de Persée
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
 
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
 
Les catalogues sur le Web
Les catalogues sur le WebLes catalogues sur le Web
Les catalogues sur le Web
 
Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services?
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Veille et production de la norme juridique
Veille et production de la norme juridiqueVeille et production de la norme juridique
Veille et production de la norme juridique
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
 
Interopérabilité de l'information bibliographique et muséologique
Interopérabilité de l'information bibliographique et muséologiqueInteropérabilité de l'information bibliographique et muséologique
Interopérabilité de l'information bibliographique et muséologique
 
La netnographie, quelles évolutions ?
La netnographie, quelles évolutions ? La netnographie, quelles évolutions ?
La netnographie, quelles évolutions ?
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDA
 
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
Cours magistral Internet et Recherche documentaire, SCD Université de Rennes 2
 
Cm internet 2010 2011
Cm internet 2010 2011Cm internet 2010 2011
Cm internet 2010 2011
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...
Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...
Jabes 2008 - Session 1 : indexation sociale et folksonomies : le monde comme ...
 
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ? RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
 

More from Equipex Biblissima

Da Biblissima a Biblissima+ : per un osservatorio delle culture scritte
Da Biblissima a Biblissima+ : per un osservatorio delle culture scritteDa Biblissima a Biblissima+ : per un osservatorio delle culture scritte
Da Biblissima a Biblissima+ : per un osservatorio delle culture scritteEquipex Biblissima
 
eScriptorium: An Open Source Platform for Historical Document Analysis
eScriptorium: An Open Source Platform for Historical Document AnalysiseScriptorium: An Open Source Platform for Historical Document Analysis
eScriptorium: An Open Source Platform for Historical Document AnalysisEquipex Biblissima
 
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...Equipex Biblissima
 
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...Equipex Biblissima
 
Représentations du chant du Moyen Âge dans les images IIIF
Représentations du chant du Moyen Âge dans les images IIIFReprésentations du chant du Moyen Âge dans les images IIIF
Représentations du chant du Moyen Âge dans les images IIIFEquipex Biblissima
 
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...Equipex Biblissima
 
Mise en œuvre de IIIF pour la reconnaissance automatique de documents
Mise en œuvre de IIIF pour la reconnaissance automatique de documentsMise en œuvre de IIIF pour la reconnaissance automatique de documents
Mise en œuvre de IIIF pour la reconnaissance automatique de documentsEquipex Biblissima
 
Actualités et perspectives de IIIF
Actualités et perspectives de IIIFActualités et perspectives de IIIF
Actualités et perspectives de IIIFEquipex Biblissima
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFEquipex Biblissima
 
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...Equipex Biblissima
 
IIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in FranceIIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in FranceEquipex Biblissima
 
The Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical NamesThe Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical NamesEquipex Biblissima
 
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Equipex Biblissima
 
Biblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts CollectionsBiblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts CollectionsEquipex Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaEquipex Biblissima
 
Browse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIFBrowse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIFEquipex Biblissima
 
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...Equipex Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaEquipex Biblissima
 

More from Equipex Biblissima (20)

Da Biblissima a Biblissima+ : per un osservatorio delle culture scritte
Da Biblissima a Biblissima+ : per un osservatorio delle culture scritteDa Biblissima a Biblissima+ : per un osservatorio delle culture scritte
Da Biblissima a Biblissima+ : per un osservatorio delle culture scritte
 
eScriptorium: An Open Source Platform for Historical Document Analysis
eScriptorium: An Open Source Platform for Historical Document AnalysiseScriptorium: An Open Source Platform for Historical Document Analysis
eScriptorium: An Open Source Platform for Historical Document Analysis
 
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
 
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
 
Représentations du chant du Moyen Âge dans les images IIIF
Représentations du chant du Moyen Âge dans les images IIIFReprésentations du chant du Moyen Âge dans les images IIIF
Représentations du chant du Moyen Âge dans les images IIIF
 
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
 
Mise en œuvre de IIIF pour la reconnaissance automatique de documents
Mise en œuvre de IIIF pour la reconnaissance automatique de documentsMise en œuvre de IIIF pour la reconnaissance automatique de documents
Mise en œuvre de IIIF pour la reconnaissance automatique de documents
 
Nakala et IIIF
Nakala et IIIFNakala et IIIF
Nakala et IIIF
 
Actualités et perspectives de IIIF
Actualités et perspectives de IIIFActualités et perspectives de IIIF
Actualités et perspectives de IIIF
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
 
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
 
IIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in FranceIIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in France
 
The Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical NamesThe Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical Names
 
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
 
Biblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts CollectionsBiblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts Collections
 
IIIF et Biblissima
IIIF et BiblissimaIIIF et Biblissima
IIIF et Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 
Browse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIFBrowse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIF
 
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 

Recently uploaded

666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipM2i Formation
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxlamourfrantz
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxpopzair
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 
Guide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étudeGuide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étudeBenamraneMarwa
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 

Recently uploaded (15)

666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadership
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptx
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptx
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 
Guide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étudeGuide Final de rédaction de mémoire de fin d'étude
Guide Final de rédaction de mémoire de fin d'étude
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 

Les fichiers d’autorite et leur fonction dans les bases de données

  • 1. LES FICHIERS D’AUTORITÉ ET LEUR FONCTION DANS LES BASES DE DONNÉES Modélisation des données et humanités numériques 13 octobre 2015
  • 2. Normalisation de notices pour se les échanger Structuration de données pour se les partager
  • 3. LES DONNÉES D’AUTORITÉ ET LEURS FONCTIONS DANS LES BASES DE DONNÉES Modélisation des données et humanités numériques 13 octobre 2015
  • 4. sommaire • Le contrôle d’autorité : qu’est-ce que c’est ? • Données d’autorité / web de données • Des réservoirs de données d’autorité en évolution • BnF / VIAF • Le rôle des identifiants • Identifiant local / identifiant communautaire / identifiant international (ISNI) • La récupération des données • Données BnF / Data.bnf.fr • Exemples de bases de données • Berlin intellectuel des années 1800 • SNAC (social network and archival context) • American numismatic society
  • 6. Partons d’un exemple : Jean Gerson Statue de Jean Gerson par Joseph Félon (1818-1896) dans une niche de la façade de la Chapelle de la Sorbonne à Paris http://commons.wikime dia.org/wiki/File:Jean_ Gerson_Sorbonne_sta tue.jpg
  • 7. Jean Gerson à la BnF Tractatus Johannis Gersonis, Cancellarii Parisiensis, contra superstitiosam dierum observationem, praesertim innocentum Publié par Michael Hering, Hambourg, 1624 Numérisé dans Gallica http://gallica.bnf.fr/ark:/12148/bpt6k104048 80
  • 8. Jean Gerson à la BnF Cy commence ung traictié compilé et fait par homme de grant science maistre Jehan Jarson, maistre en theologie, chancelier de Nostre Dame de Paris, contre aucunes erreurs et mauvaises doctrines et exemples qui sont contenues ou Roumant de la Rouse en plusieurs lieux comme cy aprés est contenu
  • 9. Jean Gerson à la BnF Collection Michel Hennin. Estampes relatives à l'Histoire de France Portrait de J. Gerson http://gallica.bnf.fr/ark:/12148/btv1b8400155c
  • 10. Jean Gerson à la BnF Collection Michel Hennin. Estampes relatives à l'Histoire de France Portrait de J. Gerson, en pied, se dirigeant vers la gauche et suivi d'un chien http://gallica.bnf.fr/ark:/12148/btv1b84001576
  • 11. Besoins • Identification de manière univoque des entités cataloguées : de qui, de quoi parle-t-on? • Explicitation de l’implicite des notices bibliographiques 11
  • 12. Besoins • Outil de navigation dans les ressources de la BnF, pour la recherche • Centralisation des différentes formes du nom 12
  • 13. Besoins • Outil de navigation dans les ressources de la BnF • Par les liens entre notices descriptives (bibliographiques, archivistiques) et les notices d’autorité 13
  • 14. Une « notice d’autorité »
  • 15.
  • 16.
  • 17.
  • 18. • Un « fichier d’autorité » Cocteau, Jean (1889-1963) Personne physique Hahn, Reynaldo (1874-1947) [le dieu bleu (ballet)] Titre musical La belle et la bête (film) Titre conventionnel Groupe des Six [Les mariés de la Tour Eiffel] Titre musical Groupe des Six Collectivité
  • 19. Les objectifs du contrôle d’autorité (FRAD : functional requirements for authority data) • trouver • des informations sur les entités décrites par les données d’autorité • identifier • confirmer que l’entité trouvée correspond bien à la recherche • distinguer entre des entités analogues • contextualiser • expliciter les relations entre les entités, ou entre une entité et un nom (par exemple : nom d’alliance, pseudonyme…) • justifier • les choix du catalogueur (par exemple : justifier par une source une forme rejetée) Une notice d’autorité n’est pas une notice biographique mais fournit des données « noyau », fondamentales, réutilisables pour des usages différents Importance des identifiants pérennes (ARK) Importance des identifiants internationaux (ISNI) 19
  • 20.
  • 21. FRBR : le rôle central des autorités 21 Œuvre Expression Manifestation Item Personne Collectivité Concept Objet Événement Lieu réalisée dans matérialisée dans exemplifiée par Famille Entités Groupe 1 Entités Groupe 2 Entités Groupe 3
  • 22. FRBR : le rôle central des autorités 22 Œuvre Expression Manifestation Item Personne Collectivité Concept Objet Événement Lieu réalisée dans matérialisée dans exemplifiée par Famille Entités Groupe 1 Entités Groupe 2 Entités Groupe 3
  • 23. Œuvre Expression Manifestation Item Personne Collectivité Concept Objet Événement Lieu créée par réalisée par produite par possédé par Famille Entités Groupe 1 Entités Groupe 2 Entités Groupe 3 Les relations dans le modèle FRBR 23 Relations Groupe 1 / Groupe 2 Relations de responsabilité
  • 24. Après le modèle FRBR • 1999 : création d’un autre groupe de travail pour étendre le modèle FRBR aux données d’autorité • 2009 : publication du Rapport final sur les fonctionnalités requises des données d’autorité (FRAD, Functional requirements for authority data) • le modèle FRAD n’en est qu’une partie DEV 10 - 2013 24
  • 25. Le Rapport final FRAD • Objectifs : • Définir les fonctionnalités requises des données indispensables au contrôle d’autorité • gestion des points d’accès dans un catalogue • identification des entités représentées par ces points d’accès • pour permettre • de répondre aux besoins des utilisateurs des données d’autorité • de partager et de réutiliser les données d’autorité • Le modèle met l’accent sur les données, non sur leur organisation dans des notices DEV 10 - 2013 25
  • 26. FRAD : un « modèle Conceptuel » Que met-on dans une notice d’autorité Avec quelles données? Notion de données d’autorité
  • 27. Personne/nom/point d’accès contrôlé Entité bibliographique personne / collectivité Nom et/ou Identifiant Point d’accès contrôlé Gerson, Jean (1363-1429) Connue par Base pour Jean Gerson ISNI : 0000 0001 2145 048X
  • 28. De la notice aux données (FRAD) : les attributs d’une personne 28 Une personne Date Titre Sexe Lieu de naissance Lieu de mort Pays Lieu de résidence Affiliation Adresse Langue Domaine d’activité Professio n/ occupatio n Biographi e/histoire Autre informatio n
  • 29. Les données d’autorité après FRBR et FRAD • Des données d’autorité acquièrent une importance nouvelle • Pas simplement une notice d’autorité fournissant un point d’accès à une notice bibliographique • La « notice » est un assemblage de données • Les données circulent et sont visibles par tous : enjeu du Web • FRBR et FRAD sont des documents de référence internationaux : une première pour les autorités • Ce ne sont pas des normes mais des modèles conceptuels • Appellent à la rédaction de nouvelles normes, portant sur l’ensemble des données d’autorité et pas uniquement sur les formes retenues
  • 30. Les enjeux posés par le Web et le Web de données
  • 31. Le contexte du Web : les autorités et les moteurs de recherche
  • 32.
  • 33. Importance des référentiels • Désambiguisation • Panachage 33
  • 34. • Découverte • Importance des entités : informations regroupées autour d’un concept
  • 35. Pratiques de recherche en mutation • Seule la première page de résultats est consultée, si pas pertinent, on reformule sa requête • Mots-clés associés à une recherche • Un environnement gratuit par défaut • Économie de l’abondance • Moins de passage par des portails • Accès direct au document
  • 36. Le lecteur souhaite accéder à des… 36 auteurs éditeurs organisations notions œuvres personnes  des contenus et des informations objets événements lieux livres films œuvres musicales sites web… www
  • 37. L’économie appliquée au web : le modèle de la longue traîne 37 Le web a ouvert l’ère des marchés de niche et des « non- succès » Article Chris Anderson The Wire http://www.internetactu.net/2005/04/12/la-longue-traine/
  • 38. Les catalogues constituent des silos : pour trouver les ressources liées à un centre d’intérêt L’usager souhaite s’en servir pour fiabiliser sa recherche Dépasser une contradiction D’une part…
  • 39. Mais…. Les métadonnées : un trésor sur le web • Des données validées • Créées par un professionnel de la description de ressources • Des données contextualisées • Les informations sont précisées par une source et une date • Pérennité des accès et citations • ARK, autres identifiants • Généralement l’identifiant est envisagé sur le très long terme • Utilisateurs tiers • Tradition d’une offre de services • Désintéressement financier
  • 41. Catalogue général (15,3 M) Collections numérisées (2,4 M) Des pages web pour les humains Des données structurées pour les machines BnF Archives et manuscrits Des pages web pour les moteurs de recherche et pour les humains Traitements automatiques : alignements, regroupements
  • 42. Ouverture technique et juridique des données
  • 43. 1/ Des données visibles sur le web Rendre visibles ces données en les rendant indexables par les moteurs du Web +80 % des visiteurs viennent des moteurs de recherche Une porte d’entrée vers les applications existantes 60 % des visiteurs de data.bnf.fr vont ensuite vers Gallica et les catalogues Recherche : exemple Baldus de Ubaldis, Exquemelin, stanze de politien, proverbes mandingues, cesare beccaria des delits et des peines ed 1821 christine de pisan
  • 44. 2/ Regrouper les données sur des pages simples > Organiser des pages « pivots » sur les œuvres, les auteurs, les thèmes /
  • 46. Données existantes : des liens, des autorités et des identifiants
  • 47. Any black Magic? 1xx (creator of) 0070 (author) WORK MANIFESTATION PERSON INTERMARC INTERMARC INTERMARC FRBNF11896956 FRBNF11967514 FRBNF37465618 Links Persistent identifiers Codes for roles EAD
  • 49. André Malraux dans le catalogue de la BnF http://catalogue.bnf.fr/ark:/12148/cb11914 167k  André Malraux (décrit dans Wikipédia) http://fr.dbpedia.org/resource/Andr%C3%A9_Malr aux Paris Paris décrit dans geonames (coordonnées…) http://www.geonames.org/2988507 PRINCIPES DU WEB DE DONNÉES La Condition humaine archives publiques
  • 50. Principes du Linked Data • Utiliser des URIs • Utiliser des URIs accessibles via HTTP • Donner l’accès aux données utiles en utilisant les standards SPARQL et RDF • Exprimer l’URI des objets liés http://thedatahub.org
  • 51. 51 En d’autres termes : • Des identifiants pour les choses qu’on décrit • Qui renvoient une page • Décrire ces ressources selon les standards du web sémantique • Relier nos données à d’autres données présentes ailleurs http://thedatahub.org
  • 52. 52 (< http://catalogue.bnf.fr/ark:/12148/cb118900414 >, <http://www.w3.org/1999/02/22-rdf-syntax- ns#type>, <http://xmlns.com/foaf/0.1/Person>) (<http://catalogue.bnf.fr/ark:/12148/cb119349138/>, <http://purl.org/dc/elements/1.1/creator>, < http://catalogue.bnf.fr/ark:/12148/cb118900414 >) Structure d’un triplet RDF = Structure d’une phrase simple Sujet Verbe Complément Honoré de Balzac est une personne Une oeuvre a pour créateur un auteur
  • 53. Le modèle RDF http://catalogue.bnf.fr/ark:/12148/cb38935131d 1956 Chansons possibles et impossibles a pour auteur a pour titre http://catalogue.bnf.fr/ark:/12148/cb13091689x Le déserteur http://catalogue.bnf.fr/ark:/12148/cb147208654 J'irai cracher sur vos tombes Vian, Boris (1920-1959) Sullivan, Vernon (1920-1959) nom pseudonyme a pour auteur http://catalogue.bnf.fr/ark:/12148/cb37471336j a pour titre a pour auteur
  • 54. 3/Se lier sur le web  Lier ces données à d’autres jeux de données du Web
  • 55. LCSH, GND, Agrovoc, Geonames, archives thesaurus Se lier à des entités extérieures VIAF, ISNI, idRef.fr, Dbpedia Geonames, INSEE Dbpedia works persons corporate bodies dates places subjects families
  • 57. 4/Encourager les utilisations  Par les bibliothèques  et bien au-delà : recherche, tourisme, édition… grâce à l’ouverture juridique et technique des métadonnées.
  • 58. Réutiliser les données : au détail • data.bnf.fr/12101638/wacl aw_potocki/rdf.xml • data.bnf.fr/12101638/wacl aw_potocki/rdf.nt • data.bnf.fr/12101638/wacl aw_potocki/rdf.n3 click on the RDF icon, at the bottom of the pages Add the following suffixes to the URL: NT, N3, RDF-XML, according to the format needed
  • 59. Réutiliser les données : en gros • A dump of all data in data.bnf.fr • This dump is split in specific dumps • All documents (complete description) • Authors-persons = including authority data for persons • Authors-organizations = including authority data for corporate bodies • Works, in the FRBR sense • Subjects (RAMEAU) and their related documents • Places (geographic records) • Documents about an author or a work • External data sets matched to data.bnf.fr • Descriptions of performances • Periodicals (series) • Dumps for dates (years) • BnF ontology • Dumps for country codes • Codes for geographic areas • Codes for musical genres • Codes for roles In RDF-nt RDF-n3 RDF-xml
  • 60. Réutliser les données : produits à façon Sparql Sample queries in data http://data.bnf.fr/docs/doc_requetes_data_en.pd f
  • 61. • http://www.ifverso.com/fr/content/robur-le-conquerant-14 http://www.rechercheisidore.fr/ Ils récupèrent nos données http://data.abuledu.org Fédération Des ensembles Vocaux et Instrumentaux Spécialisés
  • 62. De l’échange de notices au partage des données • Ouverture technique et juridique des données => évolution dans le partage international du travail • Éviter la redondance du travail • Plus facile d’identifier les entités nationales (proximité des sources) = mais cette notion est à revoir dans le contexte du Web • => notion de confiance, de champ d’expertise • De la normalisation des notices pour pouvoir les échanger à la structuration des données pour pouvoir les partager • Non, la normalisation et l’expertise ne sont pas mis à mort par le Web
  • 63. Any black Magic? 1xx (creator of) 0070 (author) WORK MANIFESTATION PERSON INTERMARC INTERMARC INTERMARC FRBNF11896956 FRBNF11967514 FRBNF37465618 Links Persistent identifiers Codes for roles EAD
  • 65. Structured data… since 1380 vintage linked data since 1987 Trusted identifiers BEHIND THIS IS: CATALOGERS AND CATALOGUE QA TEAM - INTELLIGENT DATA - CONSISTENCY - LINK CURATION https://www.flickr.com/photos/bohman/4394901689
  • 68. Identifier les ressources : les URI Uniform resource identifier Identifier et localiser une ressource sur le réseau Respectant une syntaxe particulière Attribué par une autorité enregistrée
  • 69. • Pérennité de l’accès à une ressource • ARK à la BnF (California digital library) • Identifiants internationaux fiables : ISNI, ISSN • Pérennité, unicité, engagement
  • 70. http://www.flickr.com/photos/jenwaller/22079182 46/ Un exemple, les identifiants Ark ark:/12148/bpt6k103039f __/____/____________/ Schème Numéro d’autorité nommante Nom (attribué par l’autorité nommante) Le monde La BnF Une ressource> >
  • 71. Une Uri à partir des identifiants Ark http://gallica.bnf.fr/ark:/12148/bpt6k103039f/f122 Partie obligatoire L’identifiant proprement dit Donne accès à la ressource Optionnel Sous ensemble d’un identifiant Autorité d’accès Nom ARK Qualificatif
  • 72. IDs Internationaux Communités spécifiqus d’utilisateurs IDs locaux (chaque institution – son ID système, GND (Allemagne DNB + cooperative ) IdRef (ABES Universités françaises) International Standard Mondial Inter-domaine IPI Internationa l CISAC auteurs/com positeurs IPD Internation al interprètes Les différents types d’identifiants / pont entre les données IDs operant au niveau regional/ consortium DAI Pays Bas Chercheu rs VIAF ID Bibliothèqu es et + Gestion droits (interprètes) Universités françaises bibliothèques Institutions de recherche Bibliothèques publiques France ARK ID (fichiers autorité) NACO (LC + cooperative) Institutions danoises Gestion droits (auteurs, compositeurs)Allemagne bibliothèques + Editeurs Gestion droits (textes) NACO bibliothèque s membres E X E M P L E S (ARK ID) Archives (US+) z Archives
  • 73. ISO 27729 International Standard Name Identifier Identités publiques Personnes et collectivités Permet d’identifier au niveau international « les individus et les organismes qui contribuent aux œuvres de création, notamment les écrivains, artistes , créateurs, interprètes, chercheurs, producteurs, éditeurs etc. » e.g.: ISNI 0000 0001 2133 4104  Périmètre universel  Unique  Pérenne  Administré de manière centralisée  Exprimé comme une URI : http://isni.org/isni/0000000121334104 pour www.isni.org
  • 74. Les notices de VIAF constituent le socle de la base ISNI. Elles sont confrontées aux données des autres contributeurs d’ISNI 41 institutions partenaires En France : la BnF et le SUDOC Les notices sur les personnes et les collectivités des partenaires sont regroupées en grappes LA BASE ISNI, CONSTRUITE À PARTIR DE VIAF Autres contributeurs Novembre 2013 74 http://www.isni.org/
  • 75. 7,98 millions ISNI assignés 6,74 millions Clusters VIAF contiennent un ISNI Périmètre de VIAF et d’ISNI - Clusters VIAF ne remplissant pas les critères d’assignation des ISNI (clusters avec une seule source…)
  • 76. Image from: http://kids.britannica.com/comptons/art-149833/John-le-Carre ISNI Quality Team Cornwell, David John Moore (vrai nom)Le Carré, John (pseudonyme) Identités publiques 1 personne, 2 identités publiques 2 ISNI séparés La relation est publique Pour les personnes décédées après 1900
  • 77. Bibliothèques Droits textes Droits Musique Sourcescommerciales Encyclopédies Recherche Les contributeurs d’ISNI : un croisement de multiples domaines (liste non exhaustive) Autres sources domaine culture (archives, art contemporain, etc.)
  • 78. 78
  • 80. Un fichier évolutif : avoir des données fiables et sourcées • Mises à jour, corrections incessantes • Importance des sources primaires, y compris archivistiques
  • 81. Que veut-on faire dire à une notice d’autorité du catalogue? 81 + Contexte … etc. + Contexte Archives + Contexte Enluminures + Contexte Manuscrits + Contexte Reliures Info noyau
  • 82. Ou bien, si besoin … 82 Info noyau + Contexte … etc. + Contexte Archives + Contexte Enluminures + Contexte Manuscrits + Contexte Reliures + Contexte Objet + Contexte Archives sonores + Contexte Médailles
  • 83. 83 Contexte Reliures François Ier (roi de France ; 1494-1547) forme internationale français Informations « noyau », valables pour tout contexte Lien ARK spécifique
  • 84. BnF Autorités Info « noyau » (MARC) Reliures Autorités Contextuelles <XML TEI> Globes contexte MARC <MARC-XML> BnF archives institutionelles Autorités Contextuelles <EAC-CPF>?? Données d’autorité contextuelles en réseau Reseau bibliophilie Autres bases Reliures Monnaies ??? et autres archives
  • 85. , " & # " Entités nommées: Personnes Collectivités Familles … noeuds communs entre ressources
  • 86. Un nouveau contexte normatif international • Nouveau code de catalogage : • Ambition de prendre en compte FRBR, FRAD et enjeux du Web • Pas seulement la construction des noms mais l’ensemble des données d’autorité • RDA comme référence hors du monde des bibliothèques • Un code unique : traite de toutes les entités FRBR et de leurs relations • Entités du Groupe 2 FRBR (les Agents) en font partie intégrante
  • 87. Contexte normatif - international • Normalisation ISAAR (CPF) : Norme Internationale sur les notices d’autorité utilisées pour les Archives relatives aux collectivités, aux personnes ou aux familles, 2e éd – 2004 (1e éd 1996) • Norme sur le contenu des notices d’autorité • Pour la structuration des points d’accès  renvoie vers les normes et bonnes pratiques spécifiques appliquées dans des contextes locaux Archives • Modélisation Ŕ travaux en cours ICA par Groupe d’experts sur la description archivistique (EGAD) Ŕ But : appréhender l’information archivistique dans son ensemble (y compris les producteurs
  • 88. Contexte normatif - international • Norme sur les Thésaurus ISO 25964 Thésaurus et interopérabilité avec d'autres vocabulaires • cadre englobant Ŕ fait référence aux entités nommées et listes d’autorités (y compris personnes, collectivités, familles) dans la partie sur l’interopérabilité Communauté documentation et KOS (Knowledge Organization Systems) • Mais aussi … codes de catalogage et bonnes pratiques utilisés par de producteurs de données d’autorité sur les personnes et les collectivités Ex : Ŕ ULAN (Union List of Artists’ Names) de Getty
  • 89. Au niveau national : initiatives en cours • Groupe technique AFNOR GC 46 CN46-9/GE 6 RDA en France • Projet de norme en cours porte sur le Groupe 2 des entités FRBR (Personnes, Collectivités, Familles) • But : faire évoluer les règles de catalogage • Les adapter au nouveau contexte • Favoriser la FRBRisation des catalogues • Porter les données des bibliothèques sur le Web Sémantique Bibliothèques
  • 90. Au niveau national : initiatives en cours • Groupe de travail AAF/SIAF Notices d’autorité Producteurs ISAAR(CPF) depuis 2010 Archives http://www.archivistes.org/Notices-d-autorite-producteurs- 1781 But : Réaliser un Référentiel national proposant Ŕ des formes autorisées du nom pour l’administration territoriale (1800 à nos jours) Ŕ des descriptions normalisées des organismes types, selon la norme ISAAR(CPF)
  • 91. Au niveau national : initiatives en cours • Cadre: programme HADOC (Harmonisation des données culturelles) • Modèle harmonisé pour la production des données culturelles (références: Norme ISO 25964, modèles CRM et FRBRoo) • Comprend : Modèle « Acteur » • Cadre d’action: « Référentiel des acteurs historiques » Ministère de la Culture et de la Communication
  • 93. Vers une norme française des « agents » ? oui, c’est possible  Parce que les normes existantes sont obsolètes besoin de les réviser Parce qu’il y a besoin d’une démarche globale sur tout ce qui a trait aux Agents (Personnes, Collectivités, Familles) Pour faire le lien avec le contexte international « Agir local Ŕ Penser global » Parce que l’environnement technologique le permet Parce qu’il y a besoin de rassembler l’ensemble de la profession info doc pour répondre aux besoins d’interopérabilité Agents Ŕ point commun entre jeux de données
  • 94. • 1978 : premières discussions sur un fichier d’autorité international • 2003 : Research prototype (LC, DNB) • 2007 : BnF rejoint VIAF • 2012 : Nouvelle organisation • service • VIAF Council • 2012 : Open data • 2014 : Nouveaux critères d’adhésion Virtual international authority file www.viaf.org 41 institutions et projets 26 millions de clusters Tout est gratuit !
  • 96. Les réseaux nationaux et régionaux
  • 98.
  • 99. La « philosophie » de viaf « Car aucune chose ne devient ni ne périt, mais elle se mêle ou se sépare de choses qui sont. Ainsi on dirait à bon droit « se composer » au lieu de « devenir » et « se décomposer » au lieu de « périr » Fragments d’Anaxagore, « sur la nature », 17 http://viaf.org/viaf/294235617 Ἀναξαγόρας http://viaf.org/viaf/24645587
  • 100. • Aucune donnée n’est créée dans VIAF • Toutes les données traitées par VIAF proviennent des partenaires de VIAF • VIAF c’est un appariement de données • On parle de grappe ou de « cluster » VIAF : rapprochement entre les différentes notices des différents partenaires • Les données viennent du fichier d’autorité et du fichier bibliographique qui y est lié • VIAF ne choisit pas entre les « bonnes » et les « mauvaises » données, il reste neutre entre les différents partenaires (sauf cas particuliers) • Plus les données sont complètes et justes, plus les algorithmes de VIAF sont performants • Importance du travail sur les données à la source
  • 101. Récupération des données de VIAF • En gros : - Un dump RDF - Marc 21 XML • Au détail : • RDF/XML « neutre »/Marc 21 XML / JSON - Un service SRU - Possibilité de construire de petites applications web d’interrogation
  • 102. Le RDF de VIAF • Elaboré en 2011, totalement revu • Parti pris de la simplicité • Pour une interopérabilité très large • Deux parties : • Chaque contibuteur distingué (skos) • Le cluster en soit (schema.org)
  • 103. - Fédère et compare les données Bilan : VIAF et le contrôle d’autorité international Toutes les données sont visibles ☛ Question centrale de la qualité des données ☛ Les partenaires sont responsables de ce qu’ils fournissent Interconnect e - Visibilité sur le Web - Partage de la connaissance - Linked Open Data - Partage de l’expertise La qualité des données est aussi visible
  • 104. QUELQUES PROJETS UTILISANT LES DONNÉES D’AUTORITÉ
  • 105. Data mining à partir des données de la BnF • Frédéric Glorieux, LABEX OBVIL (Paris IV) • Auteurs français, éléments de démographie historique (data.bnf.fr 2015-04) • https://resultats.hypotheses.org/ author/resultats • A partir du dump auteurs personnes d’avril 2015
  • 110.
  • 111. EAD (données décrivant le producteur d’un fonds) Autorités (formes du nom)
  • 112. Une application Description EAD contenant des notes biographiques VIAF Fichier d’autorité international 40 institutions 25 millions de notices Notices biographiques dans SNAC Données disponibles en RDF Web de données
  • 113.
  • 114.
  • 115.
  • 116.
  • 117.
  • 118.
  • 119.
  • 120.
  • 121. Nettoyage et enrichissement d’un set de données
  • 122. REGROUPEMENT FONDÉ SUR LASIMILITUDE DES CHAÎNES DE CARACTÈRES
  • 123. Regroupement fondé sur l’identifiant ark BnF
  • 124. Regroupement fondé sur l’identifiant VIAF
  • 125. Requête SPARQL pour extraire la forme retenue d’une personne
  • 126. Forme retenue en français
  • 127. Requête SPARQL pour extraire les formes rejetées d’une personne
  • 128. Formes rejetées en plusieurs langues
  • 129. Requête SPARQL pour extraire les identifiants d’une personne propres à d’autres référentiels
  • 130. Les URIs d’une personne alignée par data.bnf.fr vers d’autres référentiels
  • 131. Application des requêtes SPARQL sur des ensembles de données
  • 132. Pour extraire les formes retenues des noms
  • 133. Pour extraire les formes rejetées des noms
  • 134. Pour extraire les URIs d’autres référentiels
  • 135. Extraire d’autres types d’infos Note biographique Sources utilisées pour rédiger la notice d’autorité