SlideShare a Scribd company logo
1 of 30
Download to read offline
Apprentissage automatique pour
l'extraction de réseaux de régulation
géniques à partir d'articles
DigiCosme ‐ Groupe de travail D2K
Dialekti VALSAMOU ‐ 8 juin 2015
0
Plan de la présentation
1.  Du texte aux connaissances
Un cas typique d'IE : du texte à l'ontologie
2.  Le cas d'IE pour l'extraction d'un réseau, exemples de la vraie
vie
Challenge BioNLP '13, ma thèse, ...
3.  Approfondir en IE
Un système complet : du 0 au réseau (ou presque)
Apprentissage pour l'extraction de relations
Du texte aux connaissances
Un exemple sur les bacteries
Du texte aux connaissances
Un exemple sur les bacteries
Du texte aux connaissances
Un exemple sur les bacteries
IE pour l'extraction d'un réseau
Challenge BioNLP '13 : Tâche GRN, extraction d'un réseau
de régulation génique
IE pour l'extraction d'un réseau
Challenge BioNLP '13 : Tâche GRN, extraction d'un réseau
de régulation génique
IE pour l'extraction d'un réseau
Challenge BioNLP '13 : Tâche PC, Pathway curation
Réseau de régulation ailleurs :
IE pour l'extraction d'un réseau
Arabidopsis thaliana
Gene regulatory network for secondary cell wall biosynthesis in Arabidopsis root xylem. (Interactions)
IE pour l'extraction d'un réseau
Arabidopsis thaliana
Modèle de connaissance pour le réseau de régulation de la phase
de développement de la graine
Un cycle complet d' IE
Composantes
Un cycle complet d'IE
Architecture de la suite Alvis
Un cycle complet d'IE
Editeur en ligne d'annotations
Un cycle complet d'IE
Schéma et Modèle A.thaliana
Modèle de connaissance pour le réseau de régulation de la phase
de développement de la graine
Un cycle complet d'IE
Apprentissage Automatique
1.  Traitement linguistique :
lemmmatisation,
segmentation,
POS tagging
analyse syntactique,
...
2.  Extraction d'Entités Nommées
3.  Résolution d'anaphores et coréférences
4.  Extraction de relations (binaire) et événements (n‐naire)
Un cycle complet d'IE
Apprentissage Automatique
1.  Traitement linguistique
2.  Extraction d'Entités Nommées :
terminologies (source ou résultat),
ontologies, (source, alignement..)
règles,
apprentissage, ...
3.  Résolution d'anaphores et coréférences
4.  Extraction de relations (binaire) et événements (n‐naire)
Un cycle complet d'IE
Apprentissage Automatique
1.  Traitement linguistique
2.  Extraction d'Entités Nommées
3.  Résolution d'anaphores et coréférences :
systèmes de règles
4.  Extraction de relations (binaire) et événements (n‐naire)
Un cycle complet d'IE
Apprentissage Automatique
1.  Traitement linguistique
2.  Extraction d'Entités Nommées
3.  Résolution d'anaphores et coréférences
4.  Extraction de relations (binaire) et événements (n-naire) :
rel. binaires : entre deux arguments (entités)
événements : relations plus complèxes
approches à features ou à noyau (fonctions de similarité)
plusieurs type d'informations exploitées
pre‐traitement des données : syntaxe, surface, ..
sources et outils externes (semantique distributionnelle)
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Approche à noyau, basée sur informations syntaxiques et
sémantiques
1.  Preparation de la représentation
Calcul de co‐occurrences
Chemin entre arguments sur le graphe de dépencences
syntaxiques
2.  Calcul de matrice de similarité
Fonction de similarité: alignement global de séquence
3.  Classification
SVM linéaire (Empirical Kernel Map)
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Combine l'intuition d'une fonction de similarité...
Pas besoin de feature engineering
.. avec une représentation vectorielle
compatible avec les features supplémentaires
Chaque instance est représentée par
Un vecteur composé de la similarité entre cette instance et
tous les instances d'entraînement
Représentation
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Représentation
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Représentation
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Représentation
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Représentation
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Représentation
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Alignement
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Results on Benchmarks
Un cycle complet d'IE
Extraction de Relations par AlvisRE
Corpus "Concurrence" AlvisRE
‐‐ PRE REC F1 PRE REC F1
LLL 70,9 95,4 79,7 63,3 77,1 69,5
BB 28 82 42 70 51 59
Un cycle complet d'IE
Moteur de recherche sémantique
merci!

More Related Content

Viewers also liked

Cazadores De Serpientes En Africa
Cazadores De Serpientes En AfricaCazadores De Serpientes En Africa
Cazadores De Serpientes En Africacentrowebs
 
OpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-AntidotOpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-AntidotFing
 
Chloé Mariette, Fédération de bailleurs sociaux Delphis
Chloé Mariette, Fédération de bailleurs sociaux DelphisChloé Mariette, Fédération de bailleurs sociaux Delphis
Chloé Mariette, Fédération de bailleurs sociaux DelphisFing
 
Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG
Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG
Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG France MIREMONT
 
Confiance numerique synthese finale fevrier 2011
Confiance numerique synthese finale fevrier 2011Confiance numerique synthese finale fevrier 2011
Confiance numerique synthese finale fevrier 2011Fing
 
REGULAMENTO DISCIPLINAR CUBANO
REGULAMENTO DISCIPLINAR CUBANO REGULAMENTO DISCIPLINAR CUBANO
REGULAMENTO DISCIPLINAR CUBANO augustodefranco .
 
Lletres i Números
Lletres i NúmerosLletres i Números
Lletres i Númeroslaurajofre
 
OpenDataGarage-Session3A-JeanBaptisteIngold-Drupal
OpenDataGarage-Session3A-JeanBaptisteIngold-DrupalOpenDataGarage-Session3A-JeanBaptisteIngold-Drupal
OpenDataGarage-Session3A-JeanBaptisteIngold-DrupalFing
 
Ptitrenaultslide
PtitrenaultslidePtitrenaultslide
Ptitrenaultslidepat16
 
Activitats pdi
Activitats pdiActivitats pdi
Activitats pdiCoraGrau
 
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranéeOpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranéeFing
 

Viewers also liked (20)

400 Ans
400 Ans400 Ans
400 Ans
 
Muysensual
MuysensualMuysensual
Muysensual
 
Pc hardware
Pc hardwarePc hardware
Pc hardware
 
Cazadores De Serpientes En Africa
Cazadores De Serpientes En AfricaCazadores De Serpientes En Africa
Cazadores De Serpientes En Africa
 
Los Perritos
Los PerritosLos Perritos
Los Perritos
 
OpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-AntidotOpenDataGarage-Session 3A-Antidot
OpenDataGarage-Session 3A-Antidot
 
Chloé Mariette, Fédération de bailleurs sociaux Delphis
Chloé Mariette, Fédération de bailleurs sociaux DelphisChloé Mariette, Fédération de bailleurs sociaux Delphis
Chloé Mariette, Fédération de bailleurs sociaux Delphis
 
Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG
Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG
Présentation Pinterest à Paris, 11 juin 13 par Enid HWANG
 
Confiance numerique synthese finale fevrier 2011
Confiance numerique synthese finale fevrier 2011Confiance numerique synthese finale fevrier 2011
Confiance numerique synthese finale fevrier 2011
 
Para mi bloguera invisible
Para mi bloguera invisiblePara mi bloguera invisible
Para mi bloguera invisible
 
Pablo And Edwin
Pablo And EdwinPablo And Edwin
Pablo And Edwin
 
Fiches evaluation
Fiches evaluationFiches evaluation
Fiches evaluation
 
REGULAMENTO DISCIPLINAR CUBANO
REGULAMENTO DISCIPLINAR CUBANO REGULAMENTO DISCIPLINAR CUBANO
REGULAMENTO DISCIPLINAR CUBANO
 
1m12 artes musicales
1m12 artes musicales1m12 artes musicales
1m12 artes musicales
 
Lletres i Números
Lletres i NúmerosLletres i Números
Lletres i Números
 
OpenDataGarage-Session3A-JeanBaptisteIngold-Drupal
OpenDataGarage-Session3A-JeanBaptisteIngold-DrupalOpenDataGarage-Session3A-JeanBaptisteIngold-Drupal
OpenDataGarage-Session3A-JeanBaptisteIngold-Drupal
 
Ptitrenaultslide
PtitrenaultslidePtitrenaultslide
Ptitrenaultslide
 
Activitats pdi
Activitats pdiActivitats pdi
Activitats pdi
 
Power Tesina
Power TesinaPower Tesina
Power Tesina
 
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranéeOpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
OpenDataGarage-Session3B-PascalPeuchot-ToulonProvenceMéditerranée
 

Dialekti VALSAMOU - Presentation - 08 juin 2015