SlideShare a Scribd company logo
1 of 39
Download to read offline
Service sémantique de découverte
de données géospatiales

Serge Kéna-Cohen et Yvan Bédard

Conférence Géomatique 2009
Menu

 1. Introduction
 2. Besoins
 3. Domaines d’application envisagés
 4. Solution
 5. Enjeux et orientations
 6. Environnement technologique
 7. Conclusion
Introduction
      •   Contexte
      •   Problématique
      •   But
      •   Objectifs
      •   Besoins
Contexte- Projet GéoConnexions

• Partenaires:
   – Ministère des Ressources naturelles et de la Faune du
     Québec, Secteur du territoire
   – Ministère des Ressources naturelles et de la Faune du
     Québec, Secteur des mines
   – Défense nationale du Canada – RDDC-V
   – Ressources naturelles Canada, GéoConnexions

• Développeurs
   – DMR
   – Université Laval – Centre de recherche en géomatique
Contexte

• On veut découvrir et accéder aux jeux de
  données géospatiales (et aux services
  géospatiaux)
   – Spécifier les critères de recherche
   – Découvrir les données pertinentes
Problématique

• Aucune idée du nombre de résultats

• Les résultats ne sont pas triés par ordre
  d’importance

• On doit utiliser un vocabulaire spécifique

• On doit chercher dans la langue des données

• Certains termes ont une portée géographique
Buts

• Mettre au point un système de recherche
  interactif et ontologique pour la recherche de
  services et de jeux de données géospatiales.
   – Capacité de raisonnement sémantique
   – Environnement conforme aux normes OGC et ISO
Objectifs

• Réviser les besoins reliés à la découverte des données
  dans un concept d’utilisation d’ontologies, de services Web
  et de cube multidimensionnel spatial

• Identifier les fonctions et les opérations de services pour
  répondre à ces besoins

• Définir les protocoles Web pour les services

• Développer les fonctions

• Valider avec les partenaires

• Intégrer au portail des partenaires.
Besoins
     • Besoins fonctionnels
     • Besoins non-fonctionnels
Besoins fonctionnels

•   Identifier l’information à l’aide des concepts métiers:
     –   Identification par concepts
     –   Indépendance de la langue.
•   Naviguer selon la modélisation du domaine:
     –   Structuration des concepts
     –   Permettre de comprendre, assimiler et exploiter la modélisation
•   Examiner les données de manière plus dynamique:
     –   Naviguer selon la sémantique.
•   Assister l’utilisateur dans l’expression de ses besoins:
     –   Choisir les bons éléments
     –   Exploiter les connaissances du domaine et leur organisation.
•   Présenter les résultats:
     –   Afficher selon l’ordre d’importance des résultats.
•   Avoir une vision globale:
     –   Vision globale et synthétique de l’information.
Besoins non-fonctionnels
     Volumes            Plus de 1,000,000 d’enregistrements
     Chargements        Chargement générique, chaque partenaire a son
                        format de métadonnées respectif

                        Mise-à-jour régulière

     Performance        Très rapide dû à la technologie OLAP
     Sécurité           Usagers authentifiés

                        Pas de restriction d’accès pour les données
                        individuelles

     Disponibilité      7 jours par semaine, 20 heures par jour

                        4 heures de nuit réservées aux mise-à-jour

     Flexibilité        Doit accommoder les différents partenaires
     Interopérabilité   Fonctions implantées comme services Web
     Bases de données   Interface JDBC
     Environnement de   Open Source (Java)
     développement
Solution
Domaines de solutions
     •   Ontologies
     •   Ontologies et Web sémantique
     •   Services Web sémantiques
     •   Systèmes décisionnels
     •   SOLAP – Spatial On-Line Analytical
         Processing
Domaines de solutions

• Les Ontologies

• Les Ontologies et le Web sémantique

• Le Spatial On-Line Analytical Processing (SOLAP)

• Les CRM
Enjeux et Orientations
      •   Portée des ontologies            • Dimensions du cube
      •   Accès aux ontologies             • Intégration des aspects spatiaux
      •   Inconsistances et incohérences   • Intégration des ontologies
      •   Concepts ou termes               • Conversion générique
      •   Contenu des ontologies           • Rafraichissement du cube
      •   Services d’ontologie             • Ordre d’importance
                                           • Perfomance
      •   Contenu des ontologies
Solution fonctionnelle
Enjeux – Portée des ontologies

•   Restreint à l’information géospatiale
•   Pas gérer toute la connaissance d’un domaine
•   Offrir les opérations les plus importantes nécessaires pour répondre aux
    besoins exprimés
•   Information documentée par des métadonnées normées
•   La langue des informations est connue
•   Limitée aux:
     – Termes
     – Descriptions
     – Traductions
     – Relations
          •   Termes apparentés
          •   Synonymes
          •   Termes englobés (hiérarchie ou classes et sous-classes)
Enjeux – Accès aux ontologies

• Chacun décrit sa propre ontologie

• Modèle commun de données ontologiques

• Serveur d’ontologie centralisé

• Accessible en utilisant des services Web.
Enjeux – Inconsistances et incohérences

• Ontologies limitées aux domaines d’intérêt

• Ontologies ne sont pas volumineuses

• Risque d’incohérences est minime

• Élimination des références circulaires.
Enjeux – Concepts ou termes

• Concepts

• Énoncés simples RDF (Resource Description
  Framework)

• Multilingue
Enjeux – Services d’ontologie
• Récupérer les services OGM3:
Enjeux – Services d’ontologie

• Récupérer les services OGM3:
  – GetCapabilities – retourne les capacités du service
  – GetOntology – retourne l'ontologie
  – GetDefinition- retourne la définition d'un terme
  – GetPrefered – retourne le terme de préférence
  – GetSimilar – retourne les termes similaires
  – GetTranslation – retourne la traduction d'un terme
  – GetGraph – retourne le graphe d'un terme dans
    l'ontologie
Enjeux – Contenu des ontologies

• Canadian Core Subjects Thesaurus – CCST (Thesaurus des sujets
  de base du gouvernement du Canada – TSB)
• OpenDirectory
• Getty Thesaurus of Geographical Names (TGN)
• Library of Congres Subject Headings
• Center for International Earth Science Information Network
  (CIESIN)
• Global Change Master Directory (GCMD)
• Dictionnaire des entités géographiques du Québec
• Constitution à partir des métadonnées
Enjeux – Dimension du cube de données

• Dimensions sont les critères de recherche
• Sept plus ou moins deux
• Différentes représentations
   – Étoile
   – Flocon
   – Parent-enfant

• Différents types
   – Numérique
   – Date
   – Spatial
   – Nominal
Enjeux – Conversion générique

• Critères de recherche paramétrisés
• Utilisés lors de la création du cube
• Utilisés lors de la recherche
• Dimensions pas nécessairement dans la métadonnée
• Interprétation humaine requise dans la conception d’un
  cube
• Besoin de spécifier les niveaux d’agrégation
• Définir une structure fixe avec dimensions typiques
• Choisir les critères parmi les dimensions potentielles
Enjeux – Intégration des aspects spatiaux

• Structure matricielle

• Territoire découpé en petites régions régulières

• Forment la cellule de base pour l’indexation

• Sélection d’un groupe de cellules détermine le
  nombre de documents
Enjeux – Intégration des ontologies

• Trois possibilités:
   – Au moment de la constitution du cube
      • Permet la représentation généralisée (termes englobant) ou
        étendue (termes englobés)
      • Réponse instantanée
      • Cube plus volumineux

   – Au moment de la recherche
      • Choisir l’ontologie lors de la recherche
      • Volume du cube limité aux métadonnées
      • Réponse moins rapide

   – Mixte:
      • Plus grande latitude de recherche
Enjeux – Ordre d’importance des résultats

• Priorisation de l’affichage des résultats en
  fonction:
   – Du nombre de critères respectés
   – Du type et pourcentage de relation sémantique
     respectés
   – De l’utilisation de critères de popularité (ventes)
Enjeux - Performance

• Création du cube

• Requêtes de découverte

• Services d’ontologie

• Priorisation des résultats
Enjeux - Normes
Enjeux - Normes

  – ISO 639 pour la définition des langages et le codage en
    UTF8 pour les caractères.
  – Thésaurus monolingues (ISO 2788) et multilingues
    (ISO 5964) pour la codification des liens sémantiques.
  – Les normes W3C :
     • DAML-OIL et OWL, pour décrire les ontologies
     • SVG, pour afficher les liens graphiques entre concepts
       d’ontologies
     • XML, pour coder les protocoles d’échange inter-service
     • WSDL pour décrire les services
     • SOAP pour les protocoles d’accès
     • UDDI pour publiciser les services
Enjeux - Normes

  – Les normes géomatiques:
     • le profil nord américain des métadonnées d’ISO 19115 pour la
       source des métadonnées à extraire par l’ETL
     • ISO 19115 et CSDGM de FGDC pour la définition des types de
       mots-clés de contenu à conserver dans les ontologies (thème,
       entité, attribut, catégories, etc.)
     • ISO 19110 pour définir les critères de contenu
     • ISO 19112 pour définir les critères géographiques
     • WMS pour l’identification des critères d’étendues géographiques
       lors de recherches et d’affichage géographique de résultats
     • CAT 2.0 pour l’interface normalisée au cube de données
Protocoles

• Protocoles d’accès aux services d’ontologie
   – Basés sur les protocoles HTTP et XML
   – Requête de description des capacités (GetCapabilities)
       •   Opérations supportées
       •   Domaines de l’ontologie
       •   Langages
       •   Données géographiques

   – Requête pour obtenir les ontologies
   – Requête pour obtenir:
       •   Terme préféré
       •   Termes similaires
       •   Traduction
       •   Définition
Environnement technologique
Environnement technologique - Services


• Intégrés à l'environnement technologique du
  client.

• Facilité par une architecture orientée services.
   – Services autonomes
   – Accessibles via un protocole Web normalisé basé sur
     XML et décrit avec la norme WSDL.
   – Inscrits dans un registre UDDI.
   – Adaptation du progiciel Protégé-2000
Environnement technologique


• Open Source, Développement en Java
• Permet de récupérer des composantes existantes (API
  Java de Protégé 2000)
• Connexion au SGBD à travers une couche indépendante
  JDBC
   – MS SQL Server
   – Oracle

• Affichage géographique OpenLayers
• Affichage graphique JFreeChart
• Site Web permettant de démontrer la technologie
Conclusion
Conclusion

• L’architecture s’est terminée en février 2009

• Le module d’extraction et de constitution du cube est
  terminé

• Le module sémantique est en tests, nous avons encore 2
  enjeux: la performance et le contenu

• Le module de recherche est en développement

• Le développement du module de priorisation n’a pas
  débuté

• Fin prévue février 2010
Service sémantique de découverte de données géospatiales

More Related Content

Viewers also liked

Habilidades Sociales - Administrativas - Tècnicas
Habilidades Sociales - Administrativas - TècnicasHabilidades Sociales - Administrativas - Tècnicas
Habilidades Sociales - Administrativas - TècnicasKressy94
 
Obama Sante
Obama SanteObama Sante
Obama Santeroutj
 
L’Atlas des quartiers : un outil collectif de connaissance et de diffusion
L’Atlas des quartiers : un outil collectif de connaissance et de diffusionL’Atlas des quartiers : un outil collectif de connaissance et de diffusion
L’Atlas des quartiers : un outil collectif de connaissance et de diffusionACSG Section Montréal
 
Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...
Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...
Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...Vih.org
 
Actividad integradora. Práctica educativa y trabajo colaborativo.
Actividad integradora. Práctica educativa y trabajo colaborativo.Actividad integradora. Práctica educativa y trabajo colaborativo.
Actividad integradora. Práctica educativa y trabajo colaborativo.Manuel Ponce Rascón
 
Grand m pouvoir-intro
Grand m pouvoir-introGrand m pouvoir-intro
Grand m pouvoir-introÉric Rivest
 
Obama Education
Obama EducationObama Education
Obama Educationroutj
 
Publi bike présentation_def
Publi bike présentation_defPubli bike présentation_def
Publi bike présentation_defalineisoz.ch
 
Gazette Du 24 Novembre 2009 Au 7 Janvier 2010
Gazette Du 24 Novembre 2009 Au 7 Janvier 2010Gazette Du 24 Novembre 2009 Au 7 Janvier 2010
Gazette Du 24 Novembre 2009 Au 7 Janvier 2010Ciné-Club Atmosphères
 
Journée De Recyclage Des déchets d'équipements électriques et électroniques
Journée De Recyclage Des déchets d'équipements électriques et électroniquesJournée De Recyclage Des déchets d'équipements électriques et électroniques
Journée De Recyclage Des déchets d'équipements électriques et électroniquesArt'site
 
Map mycost présentationjury
Map mycost présentationjuryMap mycost présentationjury
Map mycost présentationjuryLaurent MEURISSE
 
Witness curriculum 10-rouleau b-2011
Witness curriculum 10-rouleau b-2011Witness curriculum 10-rouleau b-2011
Witness curriculum 10-rouleau b-2011WITNESS
 
10R - CNED : un réseau social pour préparer un concours
10R - CNED : un réseau social pour préparer un concours10R - CNED : un réseau social pour préparer un concours
10R - CNED : un réseau social pour préparer un concoursFFFOD
 

Viewers also liked (20)

Habilidades Sociales - Administrativas - Tècnicas
Habilidades Sociales - Administrativas - TècnicasHabilidades Sociales - Administrativas - Tècnicas
Habilidades Sociales - Administrativas - Tècnicas
 
Obama Sante
Obama SanteObama Sante
Obama Sante
 
L’Atlas des quartiers : un outil collectif de connaissance et de diffusion
L’Atlas des quartiers : un outil collectif de connaissance et de diffusionL’Atlas des quartiers : un outil collectif de connaissance et de diffusion
L’Atlas des quartiers : un outil collectif de connaissance et de diffusion
 
Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...
Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...
Casablanca 2010 - Toxicomanie et infection à VIH en Afrique Sub-saharienne: u...
 
Taghrid DIAB : Carrefour d'échanges 2009 : L'éducation à l'environnement et s...
Taghrid DIAB : Carrefour d'échanges 2009 : L'éducation à l'environnement et s...Taghrid DIAB : Carrefour d'échanges 2009 : L'éducation à l'environnement et s...
Taghrid DIAB : Carrefour d'échanges 2009 : L'éducation à l'environnement et s...
 
Actividad integradora. Práctica educativa y trabajo colaborativo.
Actividad integradora. Práctica educativa y trabajo colaborativo.Actividad integradora. Práctica educativa y trabajo colaborativo.
Actividad integradora. Práctica educativa y trabajo colaborativo.
 
Autobiografía
AutobiografíaAutobiografía
Autobiografía
 
Grand m pouvoir-intro
Grand m pouvoir-introGrand m pouvoir-intro
Grand m pouvoir-intro
 
Obama Education
Obama EducationObama Education
Obama Education
 
Publi bike présentation_def
Publi bike présentation_defPubli bike présentation_def
Publi bike présentation_def
 
Presentation Famille Madrid
Presentation Famille MadridPresentation Famille Madrid
Presentation Famille Madrid
 
reglamento estudiantil upc
reglamento estudiantil upc reglamento estudiantil upc
reglamento estudiantil upc
 
Gazette Du 24 Novembre 2009 Au 7 Janvier 2010
Gazette Du 24 Novembre 2009 Au 7 Janvier 2010Gazette Du 24 Novembre 2009 Au 7 Janvier 2010
Gazette Du 24 Novembre 2009 Au 7 Janvier 2010
 
Gazette du 31 janvier au 8 mars 2012
Gazette du 31 janvier au 8 mars 2012Gazette du 31 janvier au 8 mars 2012
Gazette du 31 janvier au 8 mars 2012
 
E-tourisme
E-tourismeE-tourisme
E-tourisme
 
Journée De Recyclage Des déchets d'équipements électriques et électroniques
Journée De Recyclage Des déchets d'équipements électriques et électroniquesJournée De Recyclage Des déchets d'équipements électriques et électroniques
Journée De Recyclage Des déchets d'équipements électriques et électroniques
 
Map mycost présentationjury
Map mycost présentationjuryMap mycost présentationjury
Map mycost présentationjury
 
Autobiografía
AutobiografíaAutobiografía
Autobiografía
 
Witness curriculum 10-rouleau b-2011
Witness curriculum 10-rouleau b-2011Witness curriculum 10-rouleau b-2011
Witness curriculum 10-rouleau b-2011
 
10R - CNED : un réseau social pour préparer un concours
10R - CNED : un réseau social pour préparer un concours10R - CNED : un réseau social pour préparer un concours
10R - CNED : un réseau social pour préparer un concours
 

Similar to Service sémantique de découverte de données géospatiales

Apport des thésaurus pour le catalogage et la localisation des données enviro...
Apport des thésaurus pour le catalogage et la localisation des données enviro...Apport des thésaurus pour le catalogage et la localisation des données enviro...
Apport des thésaurus pour le catalogage et la localisation des données enviro...Desconnets Jean-Christophe
 
MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...Desconnets Jean-Christophe
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesDesconnets Jean-Christophe
 
Quand utiliser MongoDB … Et quand vous en passer…
Quand utiliser MongoDB	… Et quand vous en passer…Quand utiliser MongoDB	… Et quand vous en passer…
Quand utiliser MongoDB … Et quand vous en passer…MongoDB
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022François-Xavier Boffy
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?mondeca
 
Enib cours c.a.i. web - séance #1 - html5 css3-js - 1
Enib   cours c.a.i. web - séance #1 - html5 css3-js - 1Enib   cours c.a.i. web - séance #1 - html5 css3-js - 1
Enib cours c.a.i. web - séance #1 - html5 css3-js - 1Horacio Gonzalez
 
RESTful API - Retour d'expérience
RESTful API - Retour d'expérienceRESTful API - Retour d'expérience
RESTful API - Retour d'expérienceChristophe Laprun
 
ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3
ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3
ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3Horacio Gonzalez
 
Formation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFFormation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFBoubker ABERWAG
 
Comprendre, utiliser et créer une API
Comprendre, utiliser et créer une APIComprendre, utiliser et créer une API
Comprendre, utiliser et créer une APIOlivia Reaney
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech
 
infrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeuxinfrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeuxDesconnets Jean-Christophe
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Desconnets Jean-Christophe
 
Cloud design patterns
Cloud design patternsCloud design patterns
Cloud design patternsPascal Laurin
 

Similar to Service sémantique de découverte de données géospatiales (20)

Apport des thésaurus pour le catalogage et la localisation des données enviro...
Apport des thésaurus pour le catalogage et la localisation des données enviro...Apport des thésaurus pour le catalogage et la localisation des données enviro...
Apport des thésaurus pour le catalogage et la localisation des données enviro...
 
MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...
 
Hibernate
HibernateHibernate
Hibernate
 
spatial data infrastructure
spatial data infrastructurespatial data infrastructure
spatial data infrastructure
 
L'accès unifié à l'information: retour d'expérience Locarchives
L'accès unifié à l'information: retour d'expérience LocarchivesL'accès unifié à l'information: retour d'expérience Locarchives
L'accès unifié à l'information: retour d'expérience Locarchives
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
 
Esiea - 5A - Archi 1/3
Esiea - 5A - Archi 1/3Esiea - 5A - Archi 1/3
Esiea - 5A - Archi 1/3
 
Quand utiliser MongoDB … Et quand vous en passer…
Quand utiliser MongoDB	… Et quand vous en passer…Quand utiliser MongoDB	… Et quand vous en passer…
Quand utiliser MongoDB … Et quand vous en passer…
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?Données Ouvertes : mode d'emploi ?
Données Ouvertes : mode d'emploi ?
 
Enib cours c.a.i. web - séance #1 - html5 css3-js - 1
Enib   cours c.a.i. web - séance #1 - html5 css3-js - 1Enib   cours c.a.i. web - séance #1 - html5 css3-js - 1
Enib cours c.a.i. web - séance #1 - html5 css3-js - 1
 
RESTful API - Retour d'expérience
RESTful API - Retour d'expérienceRESTful API - Retour d'expérience
RESTful API - Retour d'expérience
 
ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3
ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3
ENIB 2013-2014 - CAI Web #1: Côté navigateur 1/3
 
Formation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFFormation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPF
 
Liste des fonctionnalités du CMS Rubedo
Liste des fonctionnalités du CMS RubedoListe des fonctionnalités du CMS Rubedo
Liste des fonctionnalités du CMS Rubedo
 
Comprendre, utiliser et créer une API
Comprendre, utiliser et créer une APIComprendre, utiliser et créer une API
Comprendre, utiliser et créer une API
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
 
infrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeuxinfrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeux
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...
 
Cloud design patterns
Cloud design patternsCloud design patterns
Cloud design patterns
 

More from ACSG Section Montréal

Centralisation, transformation et distribution de l’imagerie aérienne des vil...
Centralisation, transformation et distribution de l’imagerie aérienne des vil...Centralisation, transformation et distribution de l’imagerie aérienne des vil...
Centralisation, transformation et distribution de l’imagerie aérienne des vil...ACSG Section Montréal
 
Inventaire informatisé et intelligent d’arbres
Inventaire informatisé et intelligent d’arbresInventaire informatisé et intelligent d’arbres
Inventaire informatisé et intelligent d’arbresACSG Section Montréal
 
Une librairie de développement cartographique en libre service
Une librairie de développement cartographique en libre serviceUne librairie de développement cartographique en libre service
Une librairie de développement cartographique en libre serviceACSG Section Montréal
 
German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...
German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...
German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...ACSG Section Montréal
 
Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...
Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...
Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...ACSG Section Montréal
 
Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11
Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11
Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11ACSG Section Montréal
 
Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...
Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...
Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...ACSG Section Montréal
 
Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...
Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...
Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...ACSG Section Montréal
 
Centre expertise géomatique Montréal
Centre expertise géomatique MontréalCentre expertise géomatique Montréal
Centre expertise géomatique MontréalACSG Section Montréal
 
Ville de Montréal - Dendrometrie arbres 3d ville montreal_geomtl
Ville de Montréal - Dendrometrie arbres 3d ville montreal_geomtlVille de Montréal - Dendrometrie arbres 3d ville montreal_geomtl
Ville de Montréal - Dendrometrie arbres 3d ville montreal_geomtlACSG Section Montréal
 
Gabriel Damant-Sirois (Local Logic) | Données géospatiales et technologies:...
Gabriel Damant-Sirois (Local Logic)   | Données géospatiales et technologies:...Gabriel Damant-Sirois (Local Logic)   | Données géospatiales et technologies:...
Gabriel Damant-Sirois (Local Logic) | Données géospatiales et technologies:...ACSG Section Montréal
 
Vincent Sarago (Mapbox) | Traitement d’imagerie satellitaires de masse en ut...
Vincent Sarago (Mapbox)  | Traitement d’imagerie satellitaires de masse en ut...Vincent Sarago (Mapbox)  | Traitement d’imagerie satellitaires de masse en ut...
Vincent Sarago (Mapbox) | Traitement d’imagerie satellitaires de masse en ut...ACSG Section Montréal
 
Tim Elrick (McGill- GIC) | Creating Open Data – the Building Canada 2020 Ini...
Tim Elrick (McGill- GIC)  | Creating Open Data – the Building Canada 2020 Ini...Tim Elrick (McGill- GIC)  | Creating Open Data – the Building Canada 2020 Ini...
Tim Elrick (McGill- GIC) | Creating Open Data – the Building Canada 2020 Ini...ACSG Section Montréal
 
Act 00063 les objets connectés en complément à la géolocalisation
Act 00063 les objets connectés en complément à la géolocalisationAct 00063 les objets connectés en complément à la géolocalisation
Act 00063 les objets connectés en complément à la géolocalisationACSG Section Montréal
 
Act 00085 i towns, nouveau framework pour la visualisation 3d web
Act 00085 i towns, nouveau framework pour la visualisation 3d webAct 00085 i towns, nouveau framework pour la visualisation 3d web
Act 00085 i towns, nouveau framework pour la visualisation 3d webACSG Section Montréal
 
Act 00018 architecture ouverte pour une gestion optimale de l’information géo...
Act 00018 architecture ouverte pour une gestion optimale de l’information géo...Act 00018 architecture ouverte pour une gestion optimale de l’information géo...
Act 00018 architecture ouverte pour une gestion optimale de l’information géo...ACSG Section Montréal
 
Présentation du Keynote du jeudi 20 octobre 2016 - M. Paul Ramsey
Présentation du Keynote du jeudi 20 octobre 2016 - M. Paul RamseyPrésentation du Keynote du jeudi 20 octobre 2016 - M. Paul Ramsey
Présentation du Keynote du jeudi 20 octobre 2016 - M. Paul RamseyACSG Section Montréal
 

More from ACSG Section Montréal (20)

Centralisation, transformation et distribution de l’imagerie aérienne des vil...
Centralisation, transformation et distribution de l’imagerie aérienne des vil...Centralisation, transformation et distribution de l’imagerie aérienne des vil...
Centralisation, transformation et distribution de l’imagerie aérienne des vil...
 
Inventaire informatisé et intelligent d’arbres
Inventaire informatisé et intelligent d’arbresInventaire informatisé et intelligent d’arbres
Inventaire informatisé et intelligent d’arbres
 
Une librairie de développement cartographique en libre service
Une librairie de développement cartographique en libre serviceUne librairie de développement cartographique en libre service
Une librairie de développement cartographique en libre service
 
German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...
German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...
German Gonzalez - Consortech - Exemples d’utilisation d’API avec FME - Meetup...
 
Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...
Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...
Geoffroy Richer-Lalonde - Hydro-Québec - Plateforme de coordination des Proje...
 
Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11
Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11
Martin Chevrier - Survol de 20 ans de géomatique - Meetup - GeoMTL - 2021-03-11
 
Dronautique Laval
Dronautique LavalDronautique Laval
Dronautique Laval
 
Cartographie d'un jeu de type voxel
Cartographie d'un jeu de type voxelCartographie d'un jeu de type voxel
Cartographie d'un jeu de type voxel
 
Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...
Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...
Samuel Mehenni - Covid, mobilité et narratif géospatial - Meetup - GéoMTL - 2...
 
Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...
Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...
Julien Belvisi - État des lieux sur la géomatique en temps de pandémie - Meet...
 
Fabmob Meetup GeoMTL
Fabmob Meetup GeoMTLFabmob Meetup GeoMTL
Fabmob Meetup GeoMTL
 
Centre expertise géomatique Montréal
Centre expertise géomatique MontréalCentre expertise géomatique Montréal
Centre expertise géomatique Montréal
 
Ville de Montréal - Dendrometrie arbres 3d ville montreal_geomtl
Ville de Montréal - Dendrometrie arbres 3d ville montreal_geomtlVille de Montréal - Dendrometrie arbres 3d ville montreal_geomtl
Ville de Montréal - Dendrometrie arbres 3d ville montreal_geomtl
 
Gabriel Damant-Sirois (Local Logic) | Données géospatiales et technologies:...
Gabriel Damant-Sirois (Local Logic)   | Données géospatiales et technologies:...Gabriel Damant-Sirois (Local Logic)   | Données géospatiales et technologies:...
Gabriel Damant-Sirois (Local Logic) | Données géospatiales et technologies:...
 
Vincent Sarago (Mapbox) | Traitement d’imagerie satellitaires de masse en ut...
Vincent Sarago (Mapbox)  | Traitement d’imagerie satellitaires de masse en ut...Vincent Sarago (Mapbox)  | Traitement d’imagerie satellitaires de masse en ut...
Vincent Sarago (Mapbox) | Traitement d’imagerie satellitaires de masse en ut...
 
Tim Elrick (McGill- GIC) | Creating Open Data – the Building Canada 2020 Ini...
Tim Elrick (McGill- GIC)  | Creating Open Data – the Building Canada 2020 Ini...Tim Elrick (McGill- GIC)  | Creating Open Data – the Building Canada 2020 Ini...
Tim Elrick (McGill- GIC) | Creating Open Data – the Building Canada 2020 Ini...
 
Act 00063 les objets connectés en complément à la géolocalisation
Act 00063 les objets connectés en complément à la géolocalisationAct 00063 les objets connectés en complément à la géolocalisation
Act 00063 les objets connectés en complément à la géolocalisation
 
Act 00085 i towns, nouveau framework pour la visualisation 3d web
Act 00085 i towns, nouveau framework pour la visualisation 3d webAct 00085 i towns, nouveau framework pour la visualisation 3d web
Act 00085 i towns, nouveau framework pour la visualisation 3d web
 
Act 00018 architecture ouverte pour une gestion optimale de l’information géo...
Act 00018 architecture ouverte pour une gestion optimale de l’information géo...Act 00018 architecture ouverte pour une gestion optimale de l’information géo...
Act 00018 architecture ouverte pour une gestion optimale de l’information géo...
 
Présentation du Keynote du jeudi 20 octobre 2016 - M. Paul Ramsey
Présentation du Keynote du jeudi 20 octobre 2016 - M. Paul RamseyPrésentation du Keynote du jeudi 20 octobre 2016 - M. Paul Ramsey
Présentation du Keynote du jeudi 20 octobre 2016 - M. Paul Ramsey
 

Service sémantique de découverte de données géospatiales

  • 1. Service sémantique de découverte de données géospatiales Serge Kéna-Cohen et Yvan Bédard Conférence Géomatique 2009
  • 2. Menu 1. Introduction 2. Besoins 3. Domaines d’application envisagés 4. Solution 5. Enjeux et orientations 6. Environnement technologique 7. Conclusion
  • 3. Introduction • Contexte • Problématique • But • Objectifs • Besoins
  • 4. Contexte- Projet GéoConnexions • Partenaires: – Ministère des Ressources naturelles et de la Faune du Québec, Secteur du territoire – Ministère des Ressources naturelles et de la Faune du Québec, Secteur des mines – Défense nationale du Canada – RDDC-V – Ressources naturelles Canada, GéoConnexions • Développeurs – DMR – Université Laval – Centre de recherche en géomatique
  • 5. Contexte • On veut découvrir et accéder aux jeux de données géospatiales (et aux services géospatiaux) – Spécifier les critères de recherche – Découvrir les données pertinentes
  • 6. Problématique • Aucune idée du nombre de résultats • Les résultats ne sont pas triés par ordre d’importance • On doit utiliser un vocabulaire spécifique • On doit chercher dans la langue des données • Certains termes ont une portée géographique
  • 7. Buts • Mettre au point un système de recherche interactif et ontologique pour la recherche de services et de jeux de données géospatiales. – Capacité de raisonnement sémantique – Environnement conforme aux normes OGC et ISO
  • 8. Objectifs • Réviser les besoins reliés à la découverte des données dans un concept d’utilisation d’ontologies, de services Web et de cube multidimensionnel spatial • Identifier les fonctions et les opérations de services pour répondre à ces besoins • Définir les protocoles Web pour les services • Développer les fonctions • Valider avec les partenaires • Intégrer au portail des partenaires.
  • 9. Besoins • Besoins fonctionnels • Besoins non-fonctionnels
  • 10. Besoins fonctionnels • Identifier l’information à l’aide des concepts métiers: – Identification par concepts – Indépendance de la langue. • Naviguer selon la modélisation du domaine: – Structuration des concepts – Permettre de comprendre, assimiler et exploiter la modélisation • Examiner les données de manière plus dynamique: – Naviguer selon la sémantique. • Assister l’utilisateur dans l’expression de ses besoins: – Choisir les bons éléments – Exploiter les connaissances du domaine et leur organisation. • Présenter les résultats: – Afficher selon l’ordre d’importance des résultats. • Avoir une vision globale: – Vision globale et synthétique de l’information.
  • 11. Besoins non-fonctionnels Volumes Plus de 1,000,000 d’enregistrements Chargements Chargement générique, chaque partenaire a son format de métadonnées respectif Mise-à-jour régulière Performance Très rapide dû à la technologie OLAP Sécurité Usagers authentifiés Pas de restriction d’accès pour les données individuelles Disponibilité 7 jours par semaine, 20 heures par jour 4 heures de nuit réservées aux mise-à-jour Flexibilité Doit accommoder les différents partenaires Interopérabilité Fonctions implantées comme services Web Bases de données Interface JDBC Environnement de Open Source (Java) développement
  • 13. Domaines de solutions • Ontologies • Ontologies et Web sémantique • Services Web sémantiques • Systèmes décisionnels • SOLAP – Spatial On-Line Analytical Processing
  • 14. Domaines de solutions • Les Ontologies • Les Ontologies et le Web sémantique • Le Spatial On-Line Analytical Processing (SOLAP) • Les CRM
  • 15. Enjeux et Orientations • Portée des ontologies • Dimensions du cube • Accès aux ontologies • Intégration des aspects spatiaux • Inconsistances et incohérences • Intégration des ontologies • Concepts ou termes • Conversion générique • Contenu des ontologies • Rafraichissement du cube • Services d’ontologie • Ordre d’importance • Perfomance • Contenu des ontologies
  • 17. Enjeux – Portée des ontologies • Restreint à l’information géospatiale • Pas gérer toute la connaissance d’un domaine • Offrir les opérations les plus importantes nécessaires pour répondre aux besoins exprimés • Information documentée par des métadonnées normées • La langue des informations est connue • Limitée aux: – Termes – Descriptions – Traductions – Relations • Termes apparentés • Synonymes • Termes englobés (hiérarchie ou classes et sous-classes)
  • 18. Enjeux – Accès aux ontologies • Chacun décrit sa propre ontologie • Modèle commun de données ontologiques • Serveur d’ontologie centralisé • Accessible en utilisant des services Web.
  • 19. Enjeux – Inconsistances et incohérences • Ontologies limitées aux domaines d’intérêt • Ontologies ne sont pas volumineuses • Risque d’incohérences est minime • Élimination des références circulaires.
  • 20. Enjeux – Concepts ou termes • Concepts • Énoncés simples RDF (Resource Description Framework) • Multilingue
  • 21. Enjeux – Services d’ontologie • Récupérer les services OGM3:
  • 22. Enjeux – Services d’ontologie • Récupérer les services OGM3: – GetCapabilities – retourne les capacités du service – GetOntology – retourne l'ontologie – GetDefinition- retourne la définition d'un terme – GetPrefered – retourne le terme de préférence – GetSimilar – retourne les termes similaires – GetTranslation – retourne la traduction d'un terme – GetGraph – retourne le graphe d'un terme dans l'ontologie
  • 23. Enjeux – Contenu des ontologies • Canadian Core Subjects Thesaurus – CCST (Thesaurus des sujets de base du gouvernement du Canada – TSB) • OpenDirectory • Getty Thesaurus of Geographical Names (TGN) • Library of Congres Subject Headings • Center for International Earth Science Information Network (CIESIN) • Global Change Master Directory (GCMD) • Dictionnaire des entités géographiques du Québec • Constitution à partir des métadonnées
  • 24. Enjeux – Dimension du cube de données • Dimensions sont les critères de recherche • Sept plus ou moins deux • Différentes représentations – Étoile – Flocon – Parent-enfant • Différents types – Numérique – Date – Spatial – Nominal
  • 25. Enjeux – Conversion générique • Critères de recherche paramétrisés • Utilisés lors de la création du cube • Utilisés lors de la recherche • Dimensions pas nécessairement dans la métadonnée • Interprétation humaine requise dans la conception d’un cube • Besoin de spécifier les niveaux d’agrégation • Définir une structure fixe avec dimensions typiques • Choisir les critères parmi les dimensions potentielles
  • 26. Enjeux – Intégration des aspects spatiaux • Structure matricielle • Territoire découpé en petites régions régulières • Forment la cellule de base pour l’indexation • Sélection d’un groupe de cellules détermine le nombre de documents
  • 27. Enjeux – Intégration des ontologies • Trois possibilités: – Au moment de la constitution du cube • Permet la représentation généralisée (termes englobant) ou étendue (termes englobés) • Réponse instantanée • Cube plus volumineux – Au moment de la recherche • Choisir l’ontologie lors de la recherche • Volume du cube limité aux métadonnées • Réponse moins rapide – Mixte: • Plus grande latitude de recherche
  • 28. Enjeux – Ordre d’importance des résultats • Priorisation de l’affichage des résultats en fonction: – Du nombre de critères respectés – Du type et pourcentage de relation sémantique respectés – De l’utilisation de critères de popularité (ventes)
  • 29. Enjeux - Performance • Création du cube • Requêtes de découverte • Services d’ontologie • Priorisation des résultats
  • 31. Enjeux - Normes – ISO 639 pour la définition des langages et le codage en UTF8 pour les caractères. – Thésaurus monolingues (ISO 2788) et multilingues (ISO 5964) pour la codification des liens sémantiques. – Les normes W3C : • DAML-OIL et OWL, pour décrire les ontologies • SVG, pour afficher les liens graphiques entre concepts d’ontologies • XML, pour coder les protocoles d’échange inter-service • WSDL pour décrire les services • SOAP pour les protocoles d’accès • UDDI pour publiciser les services
  • 32. Enjeux - Normes – Les normes géomatiques: • le profil nord américain des métadonnées d’ISO 19115 pour la source des métadonnées à extraire par l’ETL • ISO 19115 et CSDGM de FGDC pour la définition des types de mots-clés de contenu à conserver dans les ontologies (thème, entité, attribut, catégories, etc.) • ISO 19110 pour définir les critères de contenu • ISO 19112 pour définir les critères géographiques • WMS pour l’identification des critères d’étendues géographiques lors de recherches et d’affichage géographique de résultats • CAT 2.0 pour l’interface normalisée au cube de données
  • 33. Protocoles • Protocoles d’accès aux services d’ontologie – Basés sur les protocoles HTTP et XML – Requête de description des capacités (GetCapabilities) • Opérations supportées • Domaines de l’ontologie • Langages • Données géographiques – Requête pour obtenir les ontologies – Requête pour obtenir: • Terme préféré • Termes similaires • Traduction • Définition
  • 35. Environnement technologique - Services • Intégrés à l'environnement technologique du client. • Facilité par une architecture orientée services. – Services autonomes – Accessibles via un protocole Web normalisé basé sur XML et décrit avec la norme WSDL. – Inscrits dans un registre UDDI. – Adaptation du progiciel Protégé-2000
  • 36. Environnement technologique • Open Source, Développement en Java • Permet de récupérer des composantes existantes (API Java de Protégé 2000) • Connexion au SGBD à travers une couche indépendante JDBC – MS SQL Server – Oracle • Affichage géographique OpenLayers • Affichage graphique JFreeChart • Site Web permettant de démontrer la technologie
  • 38. Conclusion • L’architecture s’est terminée en février 2009 • Le module d’extraction et de constitution du cube est terminé • Le module sémantique est en tests, nous avons encore 2 enjeux: la performance et le contenu • Le module de recherche est en développement • Le développement du module de priorisation n’a pas débuté • Fin prévue février 2010