Communication présentée lors de la journée d'étude "Outils, méthodes, corpus : la modélisation des données en SHS" (Paris, Institut national d'histoire de l'art, 17 novembre 2014).
Anila Angjeli : ISNI - Les enjeux d’un identifiant international pour les personnes et les organismes
1. Les enjeux d’un identifiant international
pour les personnes et les organismes
Anila ANGJELI
Bibliothèque nationale de France
Département Information bibliographique et numérique
ISNI 0000 0004 2755 4724
InVisu (USR 3103 CNRS/INHA)
Outils, méthodes, corpus : la modélisation des données en SHS
journée d’étude sur le web de données et les sciences humaines et sociales
17 novembre 2014, INHA
2. Identités publiques
Individus ou Organisations
“acteurs” dans n’importe quel domaine d’intérêt pour la recherche ou la création, ou en lien avec les contenus créatifs, indépendement de leur rôle
ex.: ISNI 0000 0001 2133 4104
ISO 27729 International Standard Name Identifier
pour
www.isni.org
Porté mondiale, Tout-domaine
Unique, Pérenne,
Publique - licence ouverte,
voir http://www.isni.org/content/isni-international-agency-information-license
Identifiant exprimé comme HTTP URI, ex.: http://isni.org/isni/0000000121334104
Gestion centralisée / Largement diffusé
3. IDs Internationaux
Communités spécifiqus d’utilisateurs
IDs locaux
(chaque institution –son ID système, en local)
GND
(Allemagne
DNB + cooperative)
IdRef
(ABES Universités françaises)
International
Standard
Mondial
Inter-domaine
IPI
International CISAC
auteurs/compositeurs
IPD
International
interprètes
Un pont entre données
IDs operant au niveau regional/ consortium
DAI
Pays Bas
Chercheurs
VIAF ID
Bibliothèques et +
Gestion droits
(interprètes)
Universités françaises
bibliothèques
Institutions de recherche
Bibliothèques publiques France
ARK ID (fichiers autorité)
NACO
(LC + cooperative)
Institutions danoises
Gestion droits (auteurs, compositeurs)
Allemagne bibliothèques +
Editeurs
Gestion droits (textes)
NACO bibliothèques membres
E
X
E
M
P
L
E
S
(ARK ID)
Archives
(US+)
z
Archives
4. Il y a 1 an
ISNI International Agency
Il y a 4 ans
Bibliothèque nationale de France
Membre fondateur représenté par
Autres membres: ProQuest, CISAC, IFRRO, SCAPR
ISNI Agence d’attribution
du projet au dispositif opérationnel
Publication de la base de données www.isni.org (1 million d’identités)
6 million ISNIs attribués
8 + million ISNIs Attribués et diffusés dans les jeux de données
Il y a 3 ans
Aujourd’hui
5. Un « hub » de liens
HTTP URI
Cliquables si disponibles comme HTTP URIs
Liens via les ID locaux
Lien via un ID utilisé par une communauté d’utilisateurs
Données non couvertes par les fichiers d’autorités des bibliothèques
“crowdsourcing” contrôlé
≈16 million liens entre les sources de données
6. Données en RDF et en format ISNI XML via des pages de négociation de contenu
API de recherche via SRU
http://isni.oclc.nl/sru/DB=1.2/
7. + confiance
- confiance
Equipe qualité
ISNI Agence d’attribution
Consolider identités, interconnecter domaines
8+ million
Attribués
Politique de données Travail qualité
Droit musique
Droit interprètes
Droit de textes
Recherche
Sociétés professionnelles
Commerce
Encyclopédique
Données de bibliothèques non couvertes par les fichiers d’autorité
~ 10,3 Million
Non attribués
Match possibles
et
provisoires
Archives
(bientôt)
8. infrastructure de contrôle
Equipe Qualité
Agence internationale
Politique
de données
Utilisateur final
Gestion de la base
Contrôle & travail qualité
Contributeurs
(Agences d’enregistrement
Membres)
•match,
•fusion,
•scission,
•vérification anomalies,
•retraitement,
•échantillonnage,
•…
•notifications
Algorithmes
•échantillonnage,
•analyses,
•Recommandations:
•au système,
•sur la politique des données,
•corrections
•fusions, scissions, enrichissements,
•réponses aux utilisateurs finaux,
•emails aux contributeurs pour correction d’erreurs à la source
Expertise humaine
Agence d’attribution
9. ①
③
⑥
Search: Bethmann-Hollweg, Moritz
② erreur de date
Intelligence algorithmique
Exemple
de clustérisation …
… à l’attribution d’un
10. ①
③
⑥
Search: Bethmann-Hollweg, Moritz
② erreur de date
Intelligence algorithmique
Rejeté
Rejeté
Rejeté
Exemple
attribué
de clustérisation …
… à l’attribution d’un
11. Demandes des utilisateurs à l’Equipe qualité de l’ISNI
Dear Sir / Madam,
The ISNI 0000000117488848 refers to
"Marco Antonio Casanova", Professor at the Catholic University of Rio de Janeiro.
I am not the author of "Fragmentos póstumos. - Nietzsche uma introdução filosófica" or "Segunda consideração intempestiva da utilidade e desvantagem da história para a vida".
The author of these works is
"Marco Antonio dos Santos Casa Nova".
You may confirm this information by consulting our CVs at the Brazilian Research Council:
•Marco Antonio Casanova (me): http://lattes.cnpq.br/0400232298849115 Marco Antonio dos Santos Casa Nova
•(the other author): http://lattes.cnpq.br/3409704326617178
Exemple
Travail qualité
12. Corrige la base de données
Répond à l’utilisateur
Envoie message à la source de l’erreur
Travail qualité
Exemple
I am part of the the ISNI Quality Team (experts from the British Library and Bibliothèque nationale de France in charge of the quality of the ISNI database). We perform manual checking and corrections in the ISNI database such as splits, merges/deduplications and data corrections.
ISNI Quality team received a request from an enduser about ISNI records 0000 0001 1748 8848 and 0000 0004 3077 6045, VIAF 19998588 and their related
Authority record XXX 109895029 mixes 2 identities (see the snapshot below) :
1/ Marco Antonio Casanova (ISNI 0000 0001 1748 8848)
2/ Nova, Marco Antonio dos Santos Casa
(ISNI 0000 0004 3077 6045)
Philosoph, and author of "Segunda consideração intempestiva da utilidade e desvantagem da história para a vida"
I hope this information will be useful.
Thank you for using the ISNI database and suggesting improvements to your record. There is now another ISNI record for Marco Antonio dos Santos Casa Nova
(ISNI 0000 0004 3077 6045).
I have corrected your record, removed the erroneous titles and added a link to your online CV (Lattes database).
If you have any further queries, please let me know.
14. ISNI 0000 0000 3427 9776
ISNI est inclu dans les données standard (autorités + bibliographiques)
ISNI est inclu dans les données en RDF + SPARQL endpoint
BnF – diffusion de l’ISNI
ISNI 0000 0000 3427 9776
15. How to get all the links related to
a specific person in VIAF, ISNI, IDREF, DBPEDIA ?
select distinct ?person ?name ?viaf ?isni ?idref ?dbpedia
where { person rdf:type foaf:Person .
?resource owl:sameAs ?isni .
?resource owl:sameAs ?idref .
?resource owl:sameAs ?dbpedia .
?resource foaf:focus ?y .
?y rdf:type foaf:Person; owl:sameAs ?viaf .
?y foaf:name ?name .
?y owl:sameAs ?viaf
FILTER REGEX (?isni, ".*isni.*")
FILTER REGEX (?idref, ".*idref.*")
FILTER REGEX (?viaf, ".*viaf.*")
FILTER REGEX (?dbpedia, ".*dbpedia.*") }
+ doc en ligne: requêtes pré-formulées
2014/11/18
BnF – SPARQL
17. Linked data
ISNI 0000 0000 3427 9776
ISNI 0000 0000 3427 9776
Fourniture des données bibliographiques
Numériser dans le respect de PI
Gestion de droits
•Identifier chercheurs
•Identifier « acteurs »
•Interconnecter fichiers d’autorité et autres jeux de données
Domaine Recherche
Editeurs
•Identifier auteurs avant publication
•Faciliter workflows
BnF et ISNI en France – une stratégie nationale
Données culturelles dans le Web
•Interconnecter jeux de données
•Notoriété des identités françaises sur le Web
20. Identification fiable, visibilité sur le Web de données,
une seule clé de liage
Architectes des édifices classés Monuments Historiques (projet en cours de montage)
(archives, plans et tirages photographiques de la Médiathèque de l’architecture et du patrimoine)
ex.: Perret, Auguste (12 février 1874 - 25 février 1954)
http://www.isni.org/isni/0000000083692380
inventaires d'archives d'architectes en ligne
Procès-verbaux de la Commission des Monuments historiques de 1848 à 1950, conservés à la Médiathèque de l'architecture et du patrimoine (Charenton-le-Pont)
BASE DE DONNEES Léonore
sources de données dans ISNI
etc…
21. Archives en France sur la voie de l’adoption de l’ ISNI
Archives territoriales et autres services d’archives
coordonnées par
Fichier d’autorité (personnes, collectivités, familles)
Portail archivistique français (en construction)
Coordonner l’engagement des services d’archives français dans ISNI
Motivation pour un ID international:
-Se connecter à d’autres archives et ressources patrimoniales
-Faciliter les transactions avec des organismes versants dans l’archivage électronique
-Maîtriser au niveau international l’identification des entités qui sont dans le champ d’expertise des archives
Deviennent Membre ISNI
23. http://en.wikipedia.org/wiki/Bernardo_Navagero
Connecter les données de la recherche en SH à d’autres jeux de données
Pas encore dans data.bnf.fr
ISNI 0000 0000 6300 6654
Faire valoir la richesse et la profondeur des données de la recherche
24.
25. Données échappant au contrôle d’autorité
Connecter les données de la recherche en SH à d’autres jeux de données
Apporter des niveaux de précision
Contribuer à la « consolidation » des identités à l’échelle internationale
26. site web www.isni.org
(avec accès public à la base de données)
Search Now
Contact Agence internationale ISNI info@isni.org
Contact Agence d'enregistrement ISNI-BnF isni@bnf.fr