SlideShare a Scribd company logo
1 of 35
19/04/2015 Taches du dataMining Spatial1
Membres de groupe:
ACHER Hichem BOUZIDI Rokia
BEKKOUCHE Selma LANASRI Dihia
Proposé par: Mme. HAMDAD
2013-2014
19/04/2015 Taches du dataMining Spatial2
Introduction
La donnée spatiale
Le data mining spatial
Les taches de data mining spatial
Implémentation d’une tache
Conclusion
19/04/2015 Taches du dataMining Spatial3
Les données spatiales,
décrivent la forme et les
caractéristiques de l'entité
géographique ainsi que les
objets situés sur la surface de
la terre .Elles sont définies
par leur localisation.
19/04/2015 Taches du dataMining Spatial4
Donnée spatiale
alphanumérique Vecteur
Le Data Mining Spatial (DMS),
fouille de données spatiale, est
l’exploration de données ou
encore extraction de
connaissances implicite de
relations spatiales ou autre
propriétés non explicitement
stockés dans les bases de données
spatiale, à partir d’une grande
masse de données géographiques
19/04/2015 Taches du dataMining Spatial5
Tâche du data mining
spatial
Descriptives prédictives
19/04/2015 Taches du dataMining Spatial6
• Tâche prédictives
• L’association DMS permet de trouver des relations(X Y) entre les
propriétés des objets et celles de leurs voisins d’une BDD spatiale, selon le
thème choisi, avec une certaine probabilité selon deux métriques(S & C).
X & Y sont des ensembles de prédicats .
S : Support de la règle.
C : La confiance.
19/04/2015 Taches du dataMining Spatial7
Est-un(X, “école”) & proche de(X, “station de bus”) ' proche-de (X,
“marché”) [20%; 80%]
Problème
le nombre d’association possible entre attribut.
k attributs  nombre maximal d’association: K*2k-1
19/04/2015 Taches du dataMining Spatial8
calculer la distance entre deux entités
géo-spatiales ponctuelle sur la base
des coordonnées
Raisonnement
quantitatif
Extraire différents types de relations
spatiales.
Raisonnement
qualitatif
Catégoriesd’algorithmes
19/04/2015 Taches du dataMining Spatial9
Algorithme APRIORI.
Algorithme Kosperski
19/04/2015 Taches du dataMining Spatial10
Elaboration des règles d’association entre les ensembles des items
fréquents de tous les niveaux
Définition de l’ensemble des règles d’associations fortes dans le niveau L.
Evaluation du support et de la confiance de chacune des règles établies.
Elaboration des règles d’association entre tous les éléments de l’ensemble
des items fréquents
Extraire le sous-ensemble des items fréquents du niveau L
Définir l’ensemble de tous les items de l’étude
19/04/2015 Taches du dataMining Spatial11
19/04/2015 Taches du dataMining Spatial12
• la prédiction de l’emplacement d’un objet dans des
classes préexistantes en examinant certaines propriétés.
• Regrouper les éléments géographiques par classes selon
les propriétés en commun.
19/04/2015 Taches du dataMining Spatial13
• Déterminer (prédire) la classe d’un nouvel objet.
• Décrire les liens entre les propriétés de l’objet et la classe
à laquelle il appartient.
19/04/2015 Taches du dataMining Spatial14
• La recherche de règles de classement  structurer un ensemble
d'objets en classes d'objets ayant des propriétés communes.
• Réalisation par apprentissage supervisé qui, à partir de classes
fournies partiellement en extension  classer les prochaines
données.
19/04/2015 Taches du dataMining Spatial15
Les arbres de décision
Principe:
• Diviser récursivement la population d’apprentissage en des populations plus
homogènes, en appliquant un critère de subdivision.
• Les résultats de cette classification sont présentés sous forme d’arbres de
connaissances.
19/04/2015 Taches du dataMining Spatial16
Les paramètres en entrée
• Table_Cible : table des objets à analyser.
• Table_Voisin : table des objets de voisinage.
• Index_Jointure_Spatial : contient les relations spatiales entre les
objets.
Paramètre en sortie
• Arbre de décision spatial binaire.
19/04/2015 Taches du dataMining Spatial17
Appliquer l’opérateur croisement, qui permet de compléter (au lieu de
joindre) la Table_cible, par les données présentes dans les autres tables.
Mettre les relations spatiales exactes entre les objets, et les sauvegarder
dans une table relationnelle sous forme (objet1, relation spatiale, objet2).
Pour chaque objet voisin, cet opérateur génère un attribut (une colonne)
dans la table résultante.
Initialement, tous les objets de la Table_cible sont affectés à la racine
A chaque étape du processus de division d’un nœud, on calcule le gain informationnel de tous les attributs
explicatifs. Si cet attribut provient de la Table_voisin, alors une formule spécifique est utilisée pour le calcul de
ce gain. On retient l’attribut de segmentation, correspondant au meilleur gain informationnel de tous les
attributs explicatifs. Si le nœud courant n’est pas saturé, alors on fait appel à la procédure d’affectation.
19/04/2015 Taches du dataMining Spatial18
• Le géo-clustering consiste à regrouper les entités similaires dans les mêmes
classes.
• Cela revient à maximiser la similarité intra classes et à minimiser la
similarité inter classes
• En tenant compte de la particularité des données géo-spatiales, qui se
caractérisent par l’interdépendance sous forme de relations géo-spatiales tel
que le voisinage
19/04/2015 Taches du dataMining Spatial19
Le clustering est utilisé pour déterminer les "points chauds" dans
l'analyse de criminalité et le suivi de maladies.
19/04/2015 Taches du dataMining Spatial20
Méthodes du clustering spacial
Partitionnement
k-means
k-médoids
Hiérachiquer
CAH
CDH
Basée densité
Connectivité
Fonction
Basée grille
19/04/2015 Taches du dataMining Spatial21
Le principe de ces méthodes est de chercher les k meilleurs clusters
d’un ensemble N, parmi ces méthodes on cite : l’algorithme k-
Means, la méthode de Nuée dynamique, Algorithme K-Medoids,
Algorithme EM
19/04/2015 Taches du dataMining Spatial22
Algorithme K-means
On définit ou l'on tire au hasard k points
À chaque itération:
• Constitution de classes: chaque élément est associé au centre dont
il est le plus proche.
• Calcul des nouveaux centres: centres de gravité des classes.
19/04/2015 Taches du dataMining Spatial23
Les méthodes hiérarchiques se devisent en deux approches, elles
peuvent être soient :
Agglomératives (approche bottom-up) .
Divisives (approche Top-down).
Parmi ces méthodes on site par exemple les méthodes DIANA et
AGNES Caméléon.
19/04/2015 Taches du dataMining Spatial24
CURE
Parmi ses avantages on note :
• La découverte de clusters de taille intéressante ;
• Le non-sensitivité aux données déviées ;
• Le partitionnement et l’échantillonnage réduisent la taille des données sans
influer sur la qualité des clusters ;
• Temps d’exécution réduit.
19/04/2015 Taches du dataMining Spatial25
Parmi ces méthodes nous citons : Algorithme DBSCAN,
Algorithme DENCLUE, Algorithme DBCLASD
19/04/2015 Taches du dataMining Spatial26
Algorithme DBCLASD
Contrairement aux algorithmes de même type DBCLASD n’a pas
besoin de paramètres en entrée et traite efficacement les données
inconsistantes, car il est fondé sur une probabilité basée sur le
facteur distance mais cette indépendance des paramètres d’entrée
lui coûte une grande consommation de ressources.
19/04/2015 Taches du dataMining Spatial27
• Ces méthodes permettent d’utiliser des grilles pour faire la
classification non supervisée,
• son principe est de partitionner l’espace de données en un
ensemble de cellules. Parmi ces
• méthodes on peut citer : l’algorithme STING et l’algorithme
CLIQUE.
19/04/2015 Taches du dataMining Spatial28
Algorithme CLIQUE
L’identification des clusters au niveau de CLIQUE est réalisée en trois (3) grandes
phases :
• Identification des sous espaces contenant les clusters : cette opération est
réalisée en utilisant un algorithme ascendant de recherche d’unités denses.
• Identification des clusters : consiste à trouver les composants connectés en
utilisant les sommets des unités denses. L’identification des clusters est bien entendue
fonction du nombre d’unités denses.
• Génération d’une description minimale des clusters grâce aux composants
déterminés dans la phase précédente.
19/04/2015 Taches du dataMining Spatial29
Relation entre les méthodes du géo-clustering
19/04/2015 Taches du dataMining Spatial30
Evaluation de la qualité d’un cluster
• Dans le clustering, l’évaluation des résultats ainsi que la comparaison entre
les différentes méthodes et algorithmes, est une problématique
importante. En pratique il existe plusieurs méthodes pour évaluer les
groupements obtenus. L’une des méthodes consiste à utiliser des mesures
numériques, qui sont l’inertie interclasses et inertie intra-classes. Il
s’agit d’une évaluation interne.
19/04/2015 Taches du dataMining Spatial31
• La tendance spatiale : C’est un changement régulier d'un ou de plusieurs
attributs non-spatiales lors d’un déplacement géographique.
• Les techniques
la régression
l'analyse de corrélations.
Exemple 1
• Analyser la tendance du taux de chômage selon la distance par rapport à une
métropole ou une capitale
Exemple 2
la tendance du changement du climat ou de la végétation selon la distance par
rapport à la côte.
19/04/2015 Taches du dataMining Spatial32
• Les cas singuliers( valeurs aberrantes et extrêmes) : sont des objets qui
ne respectent pas le comportement général ou le modèle de données
[Han et Kamber 2006].
un objet spatialement référencé dont les valeurs des attributs non-spatiaux sont
inconsistants avec celles des autres objets à l'intérieur d'un certains voisinage
spatial.
[Shekhar et al 2004]
Exemple
• Un taudis (gourbi) dans un cartier de villas est considéré comme un objet
spatial aberrant en se basant sur l'attribut non spatial «type de maison ».
19/04/2015 Taches du dataMining Spatial33
• C’est la visualisation de l’information géographique pour visualiser les
connaissances ainsi que les relations implicites entre ce type de données.
• Ça concerne la mise en œuvre d'outils visuels pour extraire des
connaissances, les synthétiser , les communiquer et les utiliser
La cartographie :C’est la conception et l'utilisation des cartes de
communication de l'information et la consommation publique.
La géo visualisation : C’est le développement de cartes hautement interactifs
et des outils associés à l'exploration des données , la formulation d'hypothèses
et la construction de la connaissance.
19/04/2015 Taches du dataMining Spatial34
Les techniques de data mining spacial sont très
puissantes car elles offrent la possibilité de décrire un
domaine d’application et même prédire des résultats
en future.
19/04/2015 Taches du dataMining Spatial35

More Related Content

What's hot

Réseaux des neurones
Réseaux des neuronesRéseaux des neurones
Réseaux des neuronesMed Zaibi
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-miningSawsen Larbi
 
Clustering: Méthode hiérarchique
Clustering: Méthode hiérarchiqueClustering: Méthode hiérarchique
Clustering: Méthode hiérarchiqueYassine Mhadhbi
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction généraleMohamed Heny SELMI
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'imagesAbdelouahed Abdou
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesGiorgio Pauletto
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionMohamed Heny SELMI
 
La prédiction du churn client dans le domaine du telecom
La prédiction du churn client dans le domaine du telecomLa prédiction du churn client dans le domaine du telecom
La prédiction du churn client dans le domaine du telecomIsmail Sanni
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning Niji
 
Algorithmes machine learning/ neural network / deep learning
Algorithmes machine learning/ neural network / deep learningAlgorithmes machine learning/ neural network / deep learning
Algorithmes machine learning/ neural network / deep learningBassem Brayek
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisionsMariem Chaaben
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels Oussama Werfelli
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Mohamed Heny SELMI
 
regression_logistique.pdf
regression_logistique.pdfregression_logistique.pdf
regression_logistique.pdfSidiAbdallah1
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentationDonia Hammami
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docxkhalil Ismail
 

What's hot (20)

Réseaux des neurones
Réseaux des neuronesRéseaux des neurones
Réseaux des neurones
 
Rapport data-mining
Rapport data-miningRapport data-mining
Rapport data-mining
 
Clustering: Méthode hiérarchique
Clustering: Méthode hiérarchiqueClustering: Méthode hiérarchique
Clustering: Méthode hiérarchique
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'images
 
Introduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes StatistiquesIntroduction au Data Mining et Méthodes Statistiques
Introduction au Data Mining et Méthodes Statistiques
 
Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
 
La prédiction du churn client dans le domaine du telecom
La prédiction du churn client dans le domaine du telecomLa prédiction du churn client dans le domaine du telecom
La prédiction du churn client dans le domaine du telecom
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning
 
Algorithmes machine learning/ neural network / deep learning
Algorithmes machine learning/ neural network / deep learningAlgorithmes machine learning/ neural network / deep learning
Algorithmes machine learning/ neural network / deep learning
 
Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
Data mining - Associativité
Data mining - AssociativitéData mining - Associativité
Data mining - Associativité
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
Knn
KnnKnn
Knn
 
regression_logistique.pdf
regression_logistique.pdfregression_logistique.pdf
regression_logistique.pdf
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentation
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docx
 

Viewers also liked

Marek - Spatial analyses of health data: From points to models
Marek - Spatial analyses of health data: From points to modelsMarek - Spatial analyses of health data: From points to models
Marek - Spatial analyses of health data: From points to modelsswenney
 
Big Data in Ecology: Volume, Variety, and Velocity in Environmental Data
Big Data in Ecology: Volume, Variety, and Velocity in Environmental DataBig Data in Ecology: Volume, Variety, and Velocity in Environmental Data
Big Data in Ecology: Volume, Variety, and Velocity in Environmental DataTanner Jessel
 
Spatial clusters hiv texas
Spatial clusters hiv texasSpatial clusters hiv texas
Spatial clusters hiv texasguest7c3c6c1
 
Photographies Historiques
Photographies HistoriquesPhotographies Historiques
Photographies Historiquessuetens
 
4 annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arret
4  annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arret4  annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arret
4 annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arretVille d'Ergué-Gabéric
 
rapport_stage_issame
rapport_stage_issamerapport_stage_issame
rapport_stage_issameAMAL Issame
 
Le Must du décisionnel avec l'ensemble de l'offre Microsoft BI
Le Must du décisionnel avec l'ensemble de l'offre Microsoft BILe Must du décisionnel avec l'ensemble de l'offre Microsoft BI
Le Must du décisionnel avec l'ensemble de l'offre Microsoft BIMicrosoft Technet France
 
Bases de données Spatiales - POSTGIS
Bases de données Spatiales - POSTGISBases de données Spatiales - POSTGIS
Bases de données Spatiales - POSTGISOmar El Kharki
 
Tp système écoulement
Tp système écoulementTp système écoulement
Tp système écoulementdihiaselma
 
Présentation sécurité open_ssl
Présentation sécurité open_sslPrésentation sécurité open_ssl
Présentation sécurité open_ssldihiaselma
 
Le commerce électronique
Le commerce électroniqueLe commerce électronique
Le commerce électroniquedihiaselma
 
Base NoSql et Python
Base NoSql et PythonBase NoSql et Python
Base NoSql et Pythonyboussard
 
Team lab présentation
Team lab présentationTeam lab présentation
Team lab présentationdihiaselma
 

Viewers also liked (20)

Ar mv7
Ar mv7Ar mv7
Ar mv7
 
Final
FinalFinal
Final
 
Marek - Spatial analyses of health data: From points to models
Marek - Spatial analyses of health data: From points to modelsMarek - Spatial analyses of health data: From points to models
Marek - Spatial analyses of health data: From points to models
 
Big Data in Ecology: Volume, Variety, and Velocity in Environmental Data
Big Data in Ecology: Volume, Variety, and Velocity in Environmental DataBig Data in Ecology: Volume, Variety, and Velocity in Environmental Data
Big Data in Ecology: Volume, Variety, and Velocity in Environmental Data
 
Spatial clusters hiv texas
Spatial clusters hiv texasSpatial clusters hiv texas
Spatial clusters hiv texas
 
The Spatial Analysis of Health Data: Health Disparities and the Development o...
The Spatial Analysis of Health Data: Health Disparities and the Development o...The Spatial Analysis of Health Data: Health Disparities and the Development o...
The Spatial Analysis of Health Data: Health Disparities and the Development o...
 
Photographies Historiques
Photographies HistoriquesPhotographies Historiques
Photographies Historiques
 
4 annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arret
4  annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arret4  annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arret
4 annexe3 etudeoa_hypotheses_amenagement_2013-06-03_arret
 
rapport_stage_issame
rapport_stage_issamerapport_stage_issame
rapport_stage_issame
 
Le Must du décisionnel avec l'ensemble de l'offre Microsoft BI
Le Must du décisionnel avec l'ensemble de l'offre Microsoft BILe Must du décisionnel avec l'ensemble de l'offre Microsoft BI
Le Must du décisionnel avec l'ensemble de l'offre Microsoft BI
 
Php & My Sql
Php & My SqlPhp & My Sql
Php & My Sql
 
Bases de données spatiales
Bases de données spatialesBases de données spatiales
Bases de données spatiales
 
Bases de données Spatiales - POSTGIS
Bases de données Spatiales - POSTGISBases de données Spatiales - POSTGIS
Bases de données Spatiales - POSTGIS
 
Tp système écoulement
Tp système écoulementTp système écoulement
Tp système écoulement
 
Présentation sécurité open_ssl
Présentation sécurité open_sslPrésentation sécurité open_ssl
Présentation sécurité open_ssl
 
Le commerce électronique
Le commerce électroniqueLe commerce électronique
Le commerce électronique
 
Base NoSql et Python
Base NoSql et PythonBase NoSql et Python
Base NoSql et Python
 
Cell process
Cell processCell process
Cell process
 
Cell process
Cell processCell process
Cell process
 
Team lab présentation
Team lab présentationTeam lab présentation
Team lab présentation
 

Similar to Data Mining Spatial

Automatic Subspace Clustering of High Dimensional Data for Data Mining Applic...
Automatic Subspace Clustering of High Dimensional Data for DataMining Applic...Automatic Subspace Clustering of High Dimensional Data for DataMining Applic...
Automatic Subspace Clustering of High Dimensional Data for Data Mining Applic...Hajer Trabelsi
 
La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce Nour El Houda Megherbi
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning Novagen Conseil
 
Formation métadonnées 150512
Formation métadonnées 150512Formation métadonnées 150512
Formation métadonnées 150512Marc Leobet
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4jBoris Guarisma
 

Similar to Data Mining Spatial (9)

Automatic Subspace Clustering of High Dimensional Data for Data Mining Applic...
Automatic Subspace Clustering of High Dimensional Data for DataMining Applic...Automatic Subspace Clustering of High Dimensional Data for DataMining Applic...
Automatic Subspace Clustering of High Dimensional Data for Data Mining Applic...
 
mars2005_BD
mars2005_BDmars2005_BD
mars2005_BD
 
La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce
 
Cours datamining
Cours dataminingCours datamining
Cours datamining
 
Introduction au Machine Learning
Introduction au Machine Learning Introduction au Machine Learning
Introduction au Machine Learning
 
Formation métadonnées 150512
Formation métadonnées 150512Formation métadonnées 150512
Formation métadonnées 150512
 
Data Mining
Data MiningData Mining
Data Mining
 
Bi
BiBi
Bi
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4j
 

More from dihiaselma

La business Intelligence Agile
La business Intelligence AgileLa business Intelligence Agile
La business Intelligence Agiledihiaselma
 
Les systèmes d'information décisionnel pour les assurances
Les systèmes d'information décisionnel pour les assurancesLes systèmes d'information décisionnel pour les assurances
Les systèmes d'information décisionnel pour les assurancesdihiaselma
 
Rapport sécurité
Rapport sécuritéRapport sécurité
Rapport sécuritédihiaselma
 
Exposé imprimante 3 d
Exposé imprimante 3 dExposé imprimante 3 d
Exposé imprimante 3 ddihiaselma
 
Le commerce électronique
Le commerce électroniqueLe commerce électronique
Le commerce électroniquedihiaselma
 
VGI as BIG DATA
VGI as BIG DATAVGI as BIG DATA
VGI as BIG DATAdihiaselma
 
Réalité augmentée
Réalité augmentéeRéalité augmentée
Réalité augmentéedihiaselma
 
Les imprimanres 3 d
Les imprimanres 3 dLes imprimanres 3 d
Les imprimanres 3 ddihiaselma
 
Formation JasperSoft
Formation JasperSoftFormation JasperSoft
Formation JasperSoftdihiaselma
 
Les web services
Les web servicesLes web services
Les web servicesdihiaselma
 
Présentation des TIC dans la communication
Présentation des TIC dans la communication Présentation des TIC dans la communication
Présentation des TIC dans la communication dihiaselma
 
Projet Urbanisation
Projet UrbanisationProjet Urbanisation
Projet Urbanisationdihiaselma
 
Organisation administrative
Organisation administrativeOrganisation administrative
Organisation administrativedihiaselma
 

More from dihiaselma (17)

La business Intelligence Agile
La business Intelligence AgileLa business Intelligence Agile
La business Intelligence Agile
 
Les systèmes d'information décisionnel pour les assurances
Les systèmes d'information décisionnel pour les assurancesLes systèmes d'information décisionnel pour les assurances
Les systèmes d'information décisionnel pour les assurances
 
Rapport sécurité
Rapport sécuritéRapport sécurité
Rapport sécurité
 
Exposé imprimante 3 d
Exposé imprimante 3 dExposé imprimante 3 d
Exposé imprimante 3 d
 
Le commerce électronique
Le commerce électroniqueLe commerce électronique
Le commerce électronique
 
VGI as BIG DATA
VGI as BIG DATAVGI as BIG DATA
VGI as BIG DATA
 
Réalité augmentée
Réalité augmentéeRéalité augmentée
Réalité augmentée
 
Les imprimanres 3 d
Les imprimanres 3 dLes imprimanres 3 d
Les imprimanres 3 d
 
Formation JasperSoft
Formation JasperSoftFormation JasperSoft
Formation JasperSoft
 
Les web services
Les web servicesLes web services
Les web services
 
Veille- ERP
Veille- ERPVeille- ERP
Veille- ERP
 
Présentation des TIC dans la communication
Présentation des TIC dans la communication Présentation des TIC dans la communication
Présentation des TIC dans la communication
 
Projet Urbanisation
Projet UrbanisationProjet Urbanisation
Projet Urbanisation
 
My SQL
My SQLMy SQL
My SQL
 
Organisation administrative
Organisation administrativeOrganisation administrative
Organisation administrative
 
ISO 27500
ISO 27500ISO 27500
ISO 27500
 
GPS
GPSGPS
GPS
 

Data Mining Spatial

  • 1. 19/04/2015 Taches du dataMining Spatial1 Membres de groupe: ACHER Hichem BOUZIDI Rokia BEKKOUCHE Selma LANASRI Dihia Proposé par: Mme. HAMDAD 2013-2014
  • 2. 19/04/2015 Taches du dataMining Spatial2 Introduction La donnée spatiale Le data mining spatial Les taches de data mining spatial Implémentation d’une tache Conclusion
  • 3. 19/04/2015 Taches du dataMining Spatial3
  • 4. Les données spatiales, décrivent la forme et les caractéristiques de l'entité géographique ainsi que les objets situés sur la surface de la terre .Elles sont définies par leur localisation. 19/04/2015 Taches du dataMining Spatial4 Donnée spatiale alphanumérique Vecteur
  • 5. Le Data Mining Spatial (DMS), fouille de données spatiale, est l’exploration de données ou encore extraction de connaissances implicite de relations spatiales ou autre propriétés non explicitement stockés dans les bases de données spatiale, à partir d’une grande masse de données géographiques 19/04/2015 Taches du dataMining Spatial5 Tâche du data mining spatial Descriptives prédictives
  • 6. 19/04/2015 Taches du dataMining Spatial6 • Tâche prédictives • L’association DMS permet de trouver des relations(X Y) entre les propriétés des objets et celles de leurs voisins d’une BDD spatiale, selon le thème choisi, avec une certaine probabilité selon deux métriques(S & C). X & Y sont des ensembles de prédicats . S : Support de la règle. C : La confiance.
  • 7. 19/04/2015 Taches du dataMining Spatial7 Est-un(X, “école”) & proche de(X, “station de bus”) ' proche-de (X, “marché”) [20%; 80%] Problème le nombre d’association possible entre attribut. k attributs  nombre maximal d’association: K*2k-1
  • 8. 19/04/2015 Taches du dataMining Spatial8 calculer la distance entre deux entités géo-spatiales ponctuelle sur la base des coordonnées Raisonnement quantitatif Extraire différents types de relations spatiales. Raisonnement qualitatif Catégoriesd’algorithmes
  • 9. 19/04/2015 Taches du dataMining Spatial9 Algorithme APRIORI. Algorithme Kosperski
  • 10. 19/04/2015 Taches du dataMining Spatial10 Elaboration des règles d’association entre les ensembles des items fréquents de tous les niveaux Définition de l’ensemble des règles d’associations fortes dans le niveau L. Evaluation du support et de la confiance de chacune des règles établies. Elaboration des règles d’association entre tous les éléments de l’ensemble des items fréquents Extraire le sous-ensemble des items fréquents du niveau L Définir l’ensemble de tous les items de l’étude
  • 11. 19/04/2015 Taches du dataMining Spatial11
  • 12. 19/04/2015 Taches du dataMining Spatial12 • la prédiction de l’emplacement d’un objet dans des classes préexistantes en examinant certaines propriétés. • Regrouper les éléments géographiques par classes selon les propriétés en commun.
  • 13. 19/04/2015 Taches du dataMining Spatial13 • Déterminer (prédire) la classe d’un nouvel objet. • Décrire les liens entre les propriétés de l’objet et la classe à laquelle il appartient.
  • 14. 19/04/2015 Taches du dataMining Spatial14 • La recherche de règles de classement  structurer un ensemble d'objets en classes d'objets ayant des propriétés communes. • Réalisation par apprentissage supervisé qui, à partir de classes fournies partiellement en extension  classer les prochaines données.
  • 15. 19/04/2015 Taches du dataMining Spatial15 Les arbres de décision Principe: • Diviser récursivement la population d’apprentissage en des populations plus homogènes, en appliquant un critère de subdivision. • Les résultats de cette classification sont présentés sous forme d’arbres de connaissances.
  • 16. 19/04/2015 Taches du dataMining Spatial16 Les paramètres en entrée • Table_Cible : table des objets à analyser. • Table_Voisin : table des objets de voisinage. • Index_Jointure_Spatial : contient les relations spatiales entre les objets. Paramètre en sortie • Arbre de décision spatial binaire.
  • 17. 19/04/2015 Taches du dataMining Spatial17 Appliquer l’opérateur croisement, qui permet de compléter (au lieu de joindre) la Table_cible, par les données présentes dans les autres tables. Mettre les relations spatiales exactes entre les objets, et les sauvegarder dans une table relationnelle sous forme (objet1, relation spatiale, objet2). Pour chaque objet voisin, cet opérateur génère un attribut (une colonne) dans la table résultante. Initialement, tous les objets de la Table_cible sont affectés à la racine A chaque étape du processus de division d’un nœud, on calcule le gain informationnel de tous les attributs explicatifs. Si cet attribut provient de la Table_voisin, alors une formule spécifique est utilisée pour le calcul de ce gain. On retient l’attribut de segmentation, correspondant au meilleur gain informationnel de tous les attributs explicatifs. Si le nœud courant n’est pas saturé, alors on fait appel à la procédure d’affectation.
  • 18. 19/04/2015 Taches du dataMining Spatial18 • Le géo-clustering consiste à regrouper les entités similaires dans les mêmes classes. • Cela revient à maximiser la similarité intra classes et à minimiser la similarité inter classes • En tenant compte de la particularité des données géo-spatiales, qui se caractérisent par l’interdépendance sous forme de relations géo-spatiales tel que le voisinage
  • 19. 19/04/2015 Taches du dataMining Spatial19 Le clustering est utilisé pour déterminer les "points chauds" dans l'analyse de criminalité et le suivi de maladies.
  • 20. 19/04/2015 Taches du dataMining Spatial20 Méthodes du clustering spacial Partitionnement k-means k-médoids Hiérachiquer CAH CDH Basée densité Connectivité Fonction Basée grille
  • 21. 19/04/2015 Taches du dataMining Spatial21 Le principe de ces méthodes est de chercher les k meilleurs clusters d’un ensemble N, parmi ces méthodes on cite : l’algorithme k- Means, la méthode de Nuée dynamique, Algorithme K-Medoids, Algorithme EM
  • 22. 19/04/2015 Taches du dataMining Spatial22 Algorithme K-means On définit ou l'on tire au hasard k points À chaque itération: • Constitution de classes: chaque élément est associé au centre dont il est le plus proche. • Calcul des nouveaux centres: centres de gravité des classes.
  • 23. 19/04/2015 Taches du dataMining Spatial23 Les méthodes hiérarchiques se devisent en deux approches, elles peuvent être soient : Agglomératives (approche bottom-up) . Divisives (approche Top-down). Parmi ces méthodes on site par exemple les méthodes DIANA et AGNES Caméléon.
  • 24. 19/04/2015 Taches du dataMining Spatial24 CURE Parmi ses avantages on note : • La découverte de clusters de taille intéressante ; • Le non-sensitivité aux données déviées ; • Le partitionnement et l’échantillonnage réduisent la taille des données sans influer sur la qualité des clusters ; • Temps d’exécution réduit.
  • 25. 19/04/2015 Taches du dataMining Spatial25 Parmi ces méthodes nous citons : Algorithme DBSCAN, Algorithme DENCLUE, Algorithme DBCLASD
  • 26. 19/04/2015 Taches du dataMining Spatial26 Algorithme DBCLASD Contrairement aux algorithmes de même type DBCLASD n’a pas besoin de paramètres en entrée et traite efficacement les données inconsistantes, car il est fondé sur une probabilité basée sur le facteur distance mais cette indépendance des paramètres d’entrée lui coûte une grande consommation de ressources.
  • 27. 19/04/2015 Taches du dataMining Spatial27 • Ces méthodes permettent d’utiliser des grilles pour faire la classification non supervisée, • son principe est de partitionner l’espace de données en un ensemble de cellules. Parmi ces • méthodes on peut citer : l’algorithme STING et l’algorithme CLIQUE.
  • 28. 19/04/2015 Taches du dataMining Spatial28 Algorithme CLIQUE L’identification des clusters au niveau de CLIQUE est réalisée en trois (3) grandes phases : • Identification des sous espaces contenant les clusters : cette opération est réalisée en utilisant un algorithme ascendant de recherche d’unités denses. • Identification des clusters : consiste à trouver les composants connectés en utilisant les sommets des unités denses. L’identification des clusters est bien entendue fonction du nombre d’unités denses. • Génération d’une description minimale des clusters grâce aux composants déterminés dans la phase précédente.
  • 29. 19/04/2015 Taches du dataMining Spatial29 Relation entre les méthodes du géo-clustering
  • 30. 19/04/2015 Taches du dataMining Spatial30 Evaluation de la qualité d’un cluster • Dans le clustering, l’évaluation des résultats ainsi que la comparaison entre les différentes méthodes et algorithmes, est une problématique importante. En pratique il existe plusieurs méthodes pour évaluer les groupements obtenus. L’une des méthodes consiste à utiliser des mesures numériques, qui sont l’inertie interclasses et inertie intra-classes. Il s’agit d’une évaluation interne.
  • 31. 19/04/2015 Taches du dataMining Spatial31 • La tendance spatiale : C’est un changement régulier d'un ou de plusieurs attributs non-spatiales lors d’un déplacement géographique. • Les techniques la régression l'analyse de corrélations. Exemple 1 • Analyser la tendance du taux de chômage selon la distance par rapport à une métropole ou une capitale Exemple 2 la tendance du changement du climat ou de la végétation selon la distance par rapport à la côte.
  • 32. 19/04/2015 Taches du dataMining Spatial32 • Les cas singuliers( valeurs aberrantes et extrêmes) : sont des objets qui ne respectent pas le comportement général ou le modèle de données [Han et Kamber 2006]. un objet spatialement référencé dont les valeurs des attributs non-spatiaux sont inconsistants avec celles des autres objets à l'intérieur d'un certains voisinage spatial. [Shekhar et al 2004] Exemple • Un taudis (gourbi) dans un cartier de villas est considéré comme un objet spatial aberrant en se basant sur l'attribut non spatial «type de maison ».
  • 33. 19/04/2015 Taches du dataMining Spatial33 • C’est la visualisation de l’information géographique pour visualiser les connaissances ainsi que les relations implicites entre ce type de données. • Ça concerne la mise en œuvre d'outils visuels pour extraire des connaissances, les synthétiser , les communiquer et les utiliser La cartographie :C’est la conception et l'utilisation des cartes de communication de l'information et la consommation publique. La géo visualisation : C’est le développement de cartes hautement interactifs et des outils associés à l'exploration des données , la formulation d'hypothèses et la construction de la connaissance.
  • 34. 19/04/2015 Taches du dataMining Spatial34 Les techniques de data mining spacial sont très puissantes car elles offrent la possibilité de décrire un domaine d’application et même prédire des résultats en future.
  • 35. 19/04/2015 Taches du dataMining Spatial35

Editor's Notes

  1. Dans cet algorithme, deux paramètres, support minimum (minSup) et confiance minimale (minConf) considérés comme les seuils respectifs de support et de confiance pour le niveau de granularité L,