SlideShare a Scribd company logo
1 of 23
Download to read offline
Arbres de
décision
Motivation
Pour certains domaines d’application, il est essentiel de produire des
classifications compréhensibles pour l’utilisateur
Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron
multi-couches), l’information est perdue dans les classes
Arbres de décision
Arbres de
décision
Exemple
Décider si un patient est malade ou bien portant selon sa température et s’il a la
gorge irritée
Arbre de décision
2 classes (malade, bien portant)
2 variables (température, gorge irritée)
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Arbres de
décision
Généralités
Arbre de décision :
Algorithme de classification supervisée
Méthode statistique non-paramétrique
Permet de classer un ensemble d’individus décrits par des variables qualitatives
et quantitatives
Produit des classes les plus homogènes possibles
Arbres de
décision
Un peu de vocabulaire
malade portant
bien
malade
temperature < 37,5
gorge irritee
OUI NON
OUI NON
Noeud terminal ou feuille
Noeud intermediaire ou test
(chaque noeud intermediaire
est defini par un test construit
a partir d’une variable)
Arbres de
décision
Données et notations
Algorithme CART ←→ Algorithme d’apprentissage
Entrées :
n individus
p variables continues ou discrètes
une variable supplémentaire contenant la classe de chaque individu (c classes)
Sortie :
l’arbre de décision T
Arbres de
décision
Données et notations
N (p) = nombre d’individus associés à la position (noeud) p
N (k|p) = nombre d’individus appartenant à la classe k en sachant
qu’ils sont associés à la position p
P (k|p) =
N(k|p)
N(p)
= proportion des individus appartenant à la classe k
parmi ceux de la position p
Remarque :
Un noeud est pur si tous les individus associés appartiennent à la même classe !
Arbres de
décision
Construction de l’algorithme - exemple
But → construire un arbre de décision qui classe et détermine les caractéristiques des
clients qui consultent leurs comptes sur internet
Variables
M : moyenne des montants sur le compte
A : âge du client
R : lieu de résidence du client
E : le client à des études supérieures ?
I : le client consulte ses comptes sur internet ?
Arbres de
décision
Construction de l’algorithme - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
Arbres de
décision
Construction de l’algorithme - exemple
La construction est descendante
Au début tous les individus sont regroupés
Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut
construire un test sur une variable qui permettra de mieux discriminer les
individus ?
Quatre constructions possibles, suivant les variables Montant (M), Age (A),
Résidence (R) et Etudes (E)
Arbres de
décision
Construction de l’algorithme - exemple
1. Construction selon la variable Montant (M)
Client M I
1 moyen oui
2 élevé non
3 faible non
4 faible oui
5 moyen oui
6 élevé non
7 moyen non
8 faible non
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Arbres de
décision
Construction de l’algorithme - exemple
2. Construction selon la variable Age (A)
Client A I
1 moyen oui
2 moyen non
3 âgé non
4 moyen oui
5 jeune oui
6 âgé non
7 âgé non
8 moyen non
(3,5)
Moyen
Age
Jeune Age
(1,0) (2,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
3. Construction selon la variable Résidence (R)
Client R I
1 village oui
2 bourg non
3 bourg non
4 bourg oui
5 ville oui
6 ville non
7 ville non
8 village non
(3,5)
Residence
Ville Bourg Village
(1,2) (1,2) (1,1)
Arbres de
décision
Construction de l’algorithme - exemple
4. Construction selon la variable Etudes (E)
Client E I
1 oui oui
2 non non
3 non non
4 oui oui
5 oui oui
6 oui non
7 oui non
8 non non
(3,5)
Oui Non
Etudes
(3,2) (0,3)
Arbres de
décision
Construction de l’algorithme - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,2),(2,1),(0,2)
Age (A) (1,0),(2,2),(0,3)
Résidence (R) (1,2),(1,2),(1,1)
Etudes (E) (3,2),(0,3)
Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce
test !
Sur A, deux noeuds sur trois sont “purs” !
Comment tout écrire mathématiquement ?
Arbres de
décision
Degré de mélangeance
On a besoin de comparer les différents choix possibles
On introduit des fonctions qui permettent de mesurer le degré de mélangeance
dans les différentes classes
Propriétés des fonctions :
Le minimum est atteint lorsque tous les noeuds sont “purs”
Le maximum est atteint lorsque les individus sont équirepartis entre les classes
Arbres de
décision
Degré de mélangeance
Exemples de fonctions
Fonction d’entropie :
Entropie (p) = −
C
k=1
P (k|p) ln P (k|p)
Fonction de Gini :
Gini (p) = 1 −
C
k=1
P2
(k|p) = 2
k<k′
P (k|p) P k′
|p
Arbres de
décision
Degré de mélangeance
p p. . .
p
p
1 2 n
Test t a n modalites
t = le test (la variable)
n = le nombre de modalités
de t
i = la fonction pour mesurer
le degré de mélangeance
On introduit la fonction de gain :
Gain (p, t) = i (p) −
n
j=1
Pj i pj
Pj = la proportion des individus de la position p qui vont en position pj
La position p est fixée !
On cherche le test qui maximise le gain !
Arbres de
décision
Calcul du degré de mélangeance - exemple
Tester sur la variable Montant (M)
On considère le noeud 0 : (3,5)
Montant
(3,5)
(1,2)
Faible
(2,1) (0,2)
EleveMoyen
Gain (0, M) = i (0) − 3
8
i (1) + 3
8
i (2) + 2
8
i (3)
On choisit i = l’entropie !
Entropie (1) = −
1
3
ln
1
3
−
2
3
ln
2
3
= 0.64
Entropie (2) = −
2
3
ln
2
3
−
1
3
ln
1
3
= 0.64
Entropie (3) = −
2
2
ln
2
2
= 0
Arbres de
décision
Calcul du degré de mélangeance - exemple
On considère le noeud 0 : (3,5)
Variable test Gain
Montant (M) Gain (0, M) = Entropie (0) − 0.48
Age (A) Gain (0, A) = Entropie (0) − 0.35
Résidence (R) Gain (0, R) = Entropie (0) − 0.65
Etudes (E) Gain (0, R) = Entropie (0) − 0.42
Arbres de
décision
Calcul du degré de mélangeance - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
On continue!
(2,2)
(3,5)
Arbres de
décision
Suite de la construction - exemple
Client M A R E I
1 moyen moyen village oui oui
2 élevé moyen bourg non non
3 faible âgé bourg non non
4 faible moyen bourg oui oui
5 moyen jeune ville oui oui
6 élevé âgé ville oui non
7 moyen âgé ville oui non
8 faible moyen village non non
⇓
Client M R E I
1 moyen village oui oui
2 élevé bourg non non
4 faible bourg oui oui
8 faible village non non
Arbres de
décision
Suite de la construction - exemple
Quel test choisir ?
Variable test Composition noeuds
Montant (M) (1,1),(1,0),(0,1)
Résidence (R) (1,1),(1,1)
Etudes (E) (2,0),(0,2)
Calculer le gain pour chaque test ?
Arbres de
décision
Suite de la construction - exemple
(1,0)
Age
jeune moyen age
(0,3)
OUI NON
(2,2)
(3,5)
(2,0) (0,2)
Etudes
oui non
OUI NON

More Related Content

What's hot

Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdfimane26
 
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfChapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfZizoAziz
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Mohamed Heny SELMI
 
Algorithmique et Structures de Données II
Algorithmique et Structures de Données IIAlgorithmique et Structures de Données II
Algorithmique et Structures de Données IIRiadh Bouslimi
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentationDonia Hammami
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learningQuentin Ambard
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningHakim Nasaoui
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite completChahrawoods Dmz
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels Oussama Werfelli
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesMohamed Heny SELMI
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMJaouad Dabounou
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_amanMehdi Aman
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage AutomatiqueNizar Bechir
 
La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce Nour El Houda Megherbi
 

What's hot (20)

Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
 
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfChapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
Algorithmique et Structures de Données II
Algorithmique et Structures de Données IIAlgorithmique et Structures de Données II
Algorithmique et Structures de Données II
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentation
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learning
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTM
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Prez PFE
Prez PFEPrez PFE
Prez PFE
 
Présentation pfe
Présentation pfePrésentation pfe
Présentation pfe
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage Automatique
 
La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce La classification des Emails utilisant le modèle MapReduce
La classification des Emails utilisant le modèle MapReduce
 
Algorithme knn
Algorithme knnAlgorithme knn
Algorithme knn
 

Viewers also liked

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Pierrick REVOL
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexitéSana Aroussi
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshopaymenli
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintesOrochi Krizalid
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql Yassine Badri
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionARIJ BenHarrath
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercisePeter Antman
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigéshadhoum
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Thiga
 

Viewers also liked (11)

Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)Mission to Mars - Agile Tour 2012 (en)
Mission to Mars - Agile Tour 2012 (en)
 
Methodes agile
Methodes agileMethodes agile
Methodes agile
 
Rédiger des User Stories
Rédiger des User StoriesRédiger des User Stories
Rédiger des User Stories
 
Chapitre 2 complexité
Chapitre 2 complexitéChapitre 2 complexité
Chapitre 2 complexité
 
Cours d'initiation à Photoshop
Cours d'initiation à PhotoshopCours d'initiation à Photoshop
Cours d'initiation à Photoshop
 
Programmation par contraintes
Programmation par contraintesProgrammation par contraintes
Programmation par contraintes
 
exercices base de données - sql
exercices  base de données - sql exercices  base de données - sql
exercices base de données - sql
 
Benharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décisionBenharratharijtp4 arbre de décision
Benharratharijtp4 arbre de décision
 
Facilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exerciseFacilitating the Elephant carpaccio exercise
Facilitating the Elephant carpaccio exercise
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
 
Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ? Search sur mobile : Quels enjeux ?
Search sur mobile : Quels enjeux ?
 

Similar to Arbre de décision

Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdfOuailChoukhairi
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaXL Formation
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Jean-Michel POU
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016ibtissam el hassani
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big DataJeremy Greze
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringFranck Dernoncourt
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlibebiznext
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfnesrinetaamallah
 
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptsphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptMohamed EL KIHEL
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfFootballLovers9
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreGroupe ARTICQUE
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...Adad Med Chérif
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et FiabiliteRémi Bachelet
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisionsJean-Michel POU
 

Similar to Arbre de décision (20)

Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Data Mining (Partie 3).pdf
Data Mining (Partie 3).pdfData Mining (Partie 3).pdf
Data Mining (Partie 3).pdf
 
L’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 SigmaL’apport des techniques statistiques dans les projets Lean 6 Sigma
L’apport des techniques statistiques dans les projets Lean 6 Sigma
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
arbres de decision.ppt
arbres de decision.pptarbres de decision.ppt
arbres de decision.ppt
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
 
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
Amélioration continue - 6 sigma - ibtissam el hassani-chapitre 2015-2016
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big Data
 
Presentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type ClusteringPresentation - Automated Variable Weighting in k-Means Type Clustering
Presentation - Automated Variable Weighting in k-Means Type Clustering
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
 
Machine Learning - Spark / MLlib
Machine Learning - Spark / MLlibMachine Learning - Spark / MLlib
Machine Learning - Spark / MLlib
 
Ch6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdfCh6 Introduction à la Science de Données.pdf
Ch6 Introduction à la Science de Données.pdf
 
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.pptsphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
sphinxddfdsfsqdfdsfsdfdfdsfdsf_ofppt.ppt
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
 
Vincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritèreVincent T'KINDT - Aide à la décision multicritère
Vincent T'KINDT - Aide à la décision multicritère
 
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...Evaluation poste occupationnelle (EPO)  dans le cas d'un quartier  à logement...
Evaluation poste occupationnelle (EPO) dans le cas d'un quartier à logement...
 
Methodologie Validite et Fiabilite
Methodologie Validite et FiabiliteMethodologie Validite et Fiabilite
Methodologie Validite et Fiabilite
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Des mesures pour des décisions
Des mesures pour des décisionsDes mesures pour des décisions
Des mesures pour des décisions
 

More from Yassine Badri

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de donnéesYassine Badri
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationellesYassine Badri
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du meriseYassine Badri
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesYassine Badri
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours Yassine Badri
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentationYassine Badri
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock Yassine Badri
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php Yassine Badri
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EEYassine Badri
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock Yassine Badri
 
cours base de données
cours base de donnéescours base de données
cours base de donnéesYassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatiqueYassine Badri
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatiqueYassine Badri
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Yassine Badri
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2Yassine Badri
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1Yassine Badri
 

More from Yassine Badri (19)

Théorie de normalisation-base de données
Théorie de normalisation-base de donnéesThéorie de normalisation-base de données
Théorie de normalisation-base de données
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationelles
 
exercices Corrigées du merise
exercices Corrigées du  meriseexercices Corrigées du  merise
exercices Corrigées du merise
 
La theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de donnéesLa theorie des dependances et la normalisation des relations-base de données
La theorie des dependances et la normalisation des relations-base de données
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
 
cours j2ee -présentation
cours  j2ee -présentationcours  j2ee -présentation
cours j2ee -présentation
 
exercices gestion de stock
exercices gestion de stock exercices gestion de stock
exercices gestion de stock
 
script site e-commerce -php
script site e-commerce -php script site e-commerce -php
script site e-commerce -php
 
les servlets-java EE
les  servlets-java EEles  servlets-java EE
les servlets-java EE
 
.logistique gestion des stock
.logistique gestion des stock .logistique gestion des stock
.logistique gestion des stock
 
cours base de données
cours base de donnéescours base de données
cours base de données
 
Cours php
Cours php Cours php
Cours php
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
les métiers d'informatique
les métiers d'informatiqueles métiers d'informatique
les métiers d'informatique
 
Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]Java chap 04 surcharge des méthodes [mode de compatibilité]
Java chap 04 surcharge des méthodes [mode de compatibilité]
 
Chap 03 poo en java partie2
Chap 03 poo en java partie2Chap 03 poo en java partie2
Chap 03 poo en java partie2
 
Chap 03 poo en java partie1
Chap 03 poo en java partie1Chap 03 poo en java partie1
Chap 03 poo en java partie1
 
Chap 02 poo en java
Chap 02 poo en javaChap 02 poo en java
Chap 02 poo en java
 
Ch 01 poo
Ch 01 pooCh 01 poo
Ch 01 poo
 

Recently uploaded

Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesMohammedAmineHatoch
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxabdououanighd
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesUnidad de Espiritualidad Eudista
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxShinyaHilalYamanaka
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkRefRama
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdftrendingv83
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxikospam0
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...Universidad Complutense de Madrid
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKNassimaMdh
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxrajaakiass01
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Technologia Formation
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLElebaobabbleu
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcourshalima98ahlmohamed
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 

Recently uploaded (19)

Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 

Arbre de décision

  • 1. Arbres de décision Motivation Pour certains domaines d’application, il est essentiel de produire des classifications compréhensibles pour l’utilisateur Dans les méthodes classiques (hiérarchique, k-means, Kohonen, perceptron multi-couches), l’information est perdue dans les classes Arbres de décision
  • 2. Arbres de décision Exemple Décider si un patient est malade ou bien portant selon sa température et s’il a la gorge irritée Arbre de décision 2 classes (malade, bien portant) 2 variables (température, gorge irritée) malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON
  • 3. Arbres de décision Généralités Arbre de décision : Algorithme de classification supervisée Méthode statistique non-paramétrique Permet de classer un ensemble d’individus décrits par des variables qualitatives et quantitatives Produit des classes les plus homogènes possibles
  • 4. Arbres de décision Un peu de vocabulaire malade portant bien malade temperature < 37,5 gorge irritee OUI NON OUI NON Noeud terminal ou feuille Noeud intermediaire ou test (chaque noeud intermediaire est defini par un test construit a partir d’une variable)
  • 5. Arbres de décision Données et notations Algorithme CART ←→ Algorithme d’apprentissage Entrées : n individus p variables continues ou discrètes une variable supplémentaire contenant la classe de chaque individu (c classes) Sortie : l’arbre de décision T
  • 6. Arbres de décision Données et notations N (p) = nombre d’individus associés à la position (noeud) p N (k|p) = nombre d’individus appartenant à la classe k en sachant qu’ils sont associés à la position p P (k|p) = N(k|p) N(p) = proportion des individus appartenant à la classe k parmi ceux de la position p Remarque : Un noeud est pur si tous les individus associés appartiennent à la même classe !
  • 7. Arbres de décision Construction de l’algorithme - exemple But → construire un arbre de décision qui classe et détermine les caractéristiques des clients qui consultent leurs comptes sur internet Variables M : moyenne des montants sur le compte A : âge du client R : lieu de résidence du client E : le client à des études supérieures ? I : le client consulte ses comptes sur internet ?
  • 8. Arbres de décision Construction de l’algorithme - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non
  • 9. Arbres de décision Construction de l’algorithme - exemple La construction est descendante Au début tous les individus sont regroupés Est-ce que le noeud initial (3, 5) c’est un noeud terminal ou est-ce qu’on peut construire un test sur une variable qui permettra de mieux discriminer les individus ? Quatre constructions possibles, suivant les variables Montant (M), Age (A), Résidence (R) et Etudes (E)
  • 10. Arbres de décision Construction de l’algorithme - exemple 1. Construction selon la variable Montant (M) Client M I 1 moyen oui 2 élevé non 3 faible non 4 faible oui 5 moyen oui 6 élevé non 7 moyen non 8 faible non Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen
  • 11. Arbres de décision Construction de l’algorithme - exemple 2. Construction selon la variable Age (A) Client A I 1 moyen oui 2 moyen non 3 âgé non 4 moyen oui 5 jeune oui 6 âgé non 7 âgé non 8 moyen non (3,5) Moyen Age Jeune Age (1,0) (2,2) (0,3)
  • 12. Arbres de décision Construction de l’algorithme - exemple 3. Construction selon la variable Résidence (R) Client R I 1 village oui 2 bourg non 3 bourg non 4 bourg oui 5 ville oui 6 ville non 7 ville non 8 village non (3,5) Residence Ville Bourg Village (1,2) (1,2) (1,1)
  • 13. Arbres de décision Construction de l’algorithme - exemple 4. Construction selon la variable Etudes (E) Client E I 1 oui oui 2 non non 3 non non 4 oui oui 5 oui oui 6 oui non 7 oui non 8 non non (3,5) Oui Non Etudes (3,2) (0,3)
  • 14. Arbres de décision Construction de l’algorithme - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,2),(2,1),(0,2) Age (A) (1,0),(2,2),(0,3) Résidence (R) (1,2),(1,2),(1,1) Etudes (E) (3,2),(0,3) Sur R, aucune discrimination sur aucune branche ⇒ On ne gagne rien avec ce test ! Sur A, deux noeuds sur trois sont “purs” ! Comment tout écrire mathématiquement ?
  • 15. Arbres de décision Degré de mélangeance On a besoin de comparer les différents choix possibles On introduit des fonctions qui permettent de mesurer le degré de mélangeance dans les différentes classes Propriétés des fonctions : Le minimum est atteint lorsque tous les noeuds sont “purs” Le maximum est atteint lorsque les individus sont équirepartis entre les classes
  • 16. Arbres de décision Degré de mélangeance Exemples de fonctions Fonction d’entropie : Entropie (p) = − C k=1 P (k|p) ln P (k|p) Fonction de Gini : Gini (p) = 1 − C k=1 P2 (k|p) = 2 k<k′ P (k|p) P k′ |p
  • 17. Arbres de décision Degré de mélangeance p p. . . p p 1 2 n Test t a n modalites t = le test (la variable) n = le nombre de modalités de t i = la fonction pour mesurer le degré de mélangeance On introduit la fonction de gain : Gain (p, t) = i (p) − n j=1 Pj i pj Pj = la proportion des individus de la position p qui vont en position pj La position p est fixée ! On cherche le test qui maximise le gain !
  • 18. Arbres de décision Calcul du degré de mélangeance - exemple Tester sur la variable Montant (M) On considère le noeud 0 : (3,5) Montant (3,5) (1,2) Faible (2,1) (0,2) EleveMoyen Gain (0, M) = i (0) − 3 8 i (1) + 3 8 i (2) + 2 8 i (3) On choisit i = l’entropie ! Entropie (1) = − 1 3 ln 1 3 − 2 3 ln 2 3 = 0.64 Entropie (2) = − 2 3 ln 2 3 − 1 3 ln 1 3 = 0.64 Entropie (3) = − 2 2 ln 2 2 = 0
  • 19. Arbres de décision Calcul du degré de mélangeance - exemple On considère le noeud 0 : (3,5) Variable test Gain Montant (M) Gain (0, M) = Entropie (0) − 0.48 Age (A) Gain (0, A) = Entropie (0) − 0.35 Résidence (R) Gain (0, R) = Entropie (0) − 0.65 Etudes (E) Gain (0, R) = Entropie (0) − 0.42
  • 20. Arbres de décision Calcul du degré de mélangeance - exemple (1,0) Age jeune moyen age (0,3) OUI NON On continue! (2,2) (3,5)
  • 21. Arbres de décision Suite de la construction - exemple Client M A R E I 1 moyen moyen village oui oui 2 élevé moyen bourg non non 3 faible âgé bourg non non 4 faible moyen bourg oui oui 5 moyen jeune ville oui oui 6 élevé âgé ville oui non 7 moyen âgé ville oui non 8 faible moyen village non non ⇓ Client M R E I 1 moyen village oui oui 2 élevé bourg non non 4 faible bourg oui oui 8 faible village non non
  • 22. Arbres de décision Suite de la construction - exemple Quel test choisir ? Variable test Composition noeuds Montant (M) (1,1),(1,0),(0,1) Résidence (R) (1,1),(1,1) Etudes (E) (2,0),(0,2) Calculer le gain pour chaque test ?
  • 23. Arbres de décision Suite de la construction - exemple (1,0) Age jeune moyen age (0,3) OUI NON (2,2) (3,5) (2,0) (0,2) Etudes oui non OUI NON