L'agrégation de données géodécisionnelles : questions pour mieux la définir

L’agrégation de données
géodécisionnelles :
questions pour mieux la définir

Eve Grenier
Université Laval

Yvan Bédard
Université Laval

Nicholas Chrisman
Réseau GEOIDE, Université Laval

Géomatique 2011
13 octobre 2011

Plan de la présentation

Approche analytique

Agrégation de données

Questions

Approche analytique
Type de
véhicule
Cause

Date
Secteur
et
heure

Position
Nb de
passagers
Nb de Nb de
blessés décès

Approche analytique
Axes d’analyse Type de
véhicule
Cause

Date
Secteur
et
heure

Position
Nb de
passagers
Nb de Nb de
blessés décès
Données recherchées

Approche analytique
• Axes d’analyse
– Thématique 2005 – 2010
– Temporel
Année

Causes
Mois

Mécanique … Météo
Jour

Crevaison … Panne Neige … Pluie Heure

Approche analytique
• Axes d’analyse
– Spatial géométrique
Québec

Province

01 – Bas-St-Laurent … 17 – Centre-du-Québec
Régions administratives

MRC 070 – La Matapédia … 140 - Kamouraska

Municipalités
Kamouraska … Saint-Carmel

Approche analytique
• Données recherchées
– Données numériques ou géométriques
– Opérateurs d’agrégation

Passagers Blessés Décès Position

Somme Somme Somme Regroupement
487
2 68
1 4
0

• Processus d’agrégation Blessés
– Donnée recherchée
Somme
– Opérateur d’agrégation
– Axes d’analyse

• Spécificités de l’agrégation géodécisionnelle
– Type de géométrie
– Définition sémantique
– Interrelations spatiales
– Comportement temporel

• Validation du résultat
Option 1 Option 2

Moyenne (A1)
Population Moyenne Somme
Somme (A2, A3, A4)

Années Occupation Age Région

Question – Donnée recherchée
• Données géospatiales
– Données géométriques
– Données descriptives Superficie : 15 ha
– Métadonnées Superficie estimée en ha

• Représentation multiple
Feu no 325

Jour 1 Jour 2 Jour 3 Étendue totale

Question – Donnée recherchée
• Données géospatiales
– Données géométriques
– Données descriptives Superficie : 15 ha
– Métadonnées Superficie estimée en ha

Quelle représentation géométrique doit-on choisir?
• Représentation multiple
Feu no 325
Convient-elle pour l’échelle de l’affichage souhaitée?

Doit-on privilégier la donnée descriptive ou géométrique?
Jour 1 Jour 2 Jour 3 Étendue totale

Question – Opérateur d’agrégation

Position d’accident routier

Enveloppe convexe Ellipse de distribution

Question – Opérateur d’agrégation

Quel opérateur/algorithme peut-on choisir pour
mettre en valeur les données et répondre aux besoins?

Est-ce que la nature de l’opérateur implique de
traiter seulement les données détaillées?

Est-ce que le résultat de l’agrégation est significatif?

Question – Axe d’analyse

Option 1 1 maladie/personne

Option 2 toutes les maladies nb personnes

Maladie Option 3 règle d’agrégation spécifique par niveau

Règle d’agrégation
spécifique
Région socio-sanitaire Médecin

Question – Axe d’analyse

Est-ce qu’il existe une relation unique entre la donnée
recherchée et l’axe d’analyse?

Est-ce que le type d’axe d’analyse nécessite
des règles spécifiques afin d’agréger correctement?

Conclusion
• Agrégation de données géodécisionnelles adéquate
– Pas de solution unique
– Traitement des données géospatiales plus complexe
– Réflexions nécessaire
– Impacts directs sur les décisions

Remerciements

• Chaire industrielle CRSNG en bases
de données géospatiales décisionnelles

• CRSNG pour son financement

Merci de votre attention!

Questions?

Types de donnée recherchée
• Types de données numériques [Lenz et Shoshani, 1997]
– Inventaire (stock ) : inventaire d’auto, nombre de citoyens
– Cumul (flow ) : naissance mensuelle, revenu annuel
– Valeur par unité (value-per-unit ) : coût par unité produite,
taux de change

• Types de données géospatiales
– Phénomène ponctuel : position accident routier
– Phénomène durable : segment de travaux routiers
– Instantané de phénomène évolutif à fréquence temporelle fixe :
feux de forêt évalué quotidiennement
– Instantané de phénomène évolutif à fréquence temporelle
variable suivant l’évolution

Classes opérateurs d’agrégation
• 3 classes d’opérateurs [Gray et al., 1997]
– Distributive
Peut diviser les données à traiter en plusieurs ensembles
disjoints sans affecter le résultat final
Ex. somme, minimum, maximum

– Algébrique
Peut être exprimé comme une fonction d’opérateurs distributifs
Ex. moyenne (somme / dénombrement)

– Holistique
Doit absolument être utilisé sur la totalité des données à évaluer
pour obtenir le bon résultat
Ex. médiane

Catégories opérateur agrégation
• Opérateurs mathématiques
(somme, moyenne, minimum, maximum)

• Opérateurs géométriques
(fusion, intersection, centroïde, enveloppe convexe)

• Opérateurs combinant un opérateur mathématiques avec
un opérateur d’analyse géospatiale
(moyenne superficie, maximum intersection, somme-
distance, densité surfacique)

Références
• [Gray et al., 1997]
Gray, J., S. Chaudhuri, et al. (1997). Data Cube: A
relational aggregation operator generalizing group-
by, cross-tab, and sub-totals, Data Mining and
Knowledge Discovery, 1(1), pp. 29-53.

• [Lenz et Shoshani, 1997]
Lenz, H. & A. Shoshani (1997). Summarizability in OLAP
and Statistical Data Bases. Proceedings of the 9th
International Conference on Scientific and Statistical
Database Management, Olympia, USA, pp. 132-143.

L'agrégation de données géodécisionnelles : questions pour mieux la définir

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (20)

More from ACSG Section Montréal

More from ACSG Section Montréal (20)

L'agrégation de données géodécisionnelles : questions pour mieux la définir