3. Un contexte se représente par un graphe
Exemple : réalité augmentée
4. Pouvez-vous prédire si une personne va voter
en fonction de son entourage ?
Les graphes peuvent le faire.
5. Les relations
Sont les +puissants prédicteurs du comportement
“Increasingly we're learning that you can make better
predictions about people by getting all the information
from their friends and their friends’ friends than you
can from the information you have about the person
themselves”
James Fowler David Burkus
Albert-László
Barabási
5
6. Les plates-formes de graphe natives sont
spécialement conçues pour les données connectées
PLATES-FORMES
TRADITIONNELLES
TECHNOLOGIE
BIG DATA
Stocker et récupérer des données Agréger et filtrer les données Connections dans les données
Stockage et extraction
en temps réel
Connaissances connectées en
temps réel
Agrégation et filtrage
des requêtes longues
“Our Neo4j solution is literally thousands of times
faster than the prior MySQL solution, with queries that
require 10-100 times less code”
Volker Pacher, Senior Developer
# maxi de sauts ~3
Millions
6
10. De Meilleures Prédictions Avec Les Graphes
Utilisez les Données Dont Vous Disposez Déjà
• Les modèles actuels en science des données négligent la structure réseau
• Les Graphes apportent des caractéristiques fortement prédictibles aux modèles ML, améliorant leur
précision
• Les prédictions basées sur les relations sont irréalisables sans le contexte graphe
Pipeline d’Apprentissage Automatisé
10
12. Construction d’un modèle ML orienté graphe
Graph
Transactions
Graph
Analytics
Agrégation & nettoyage de
données hétérogènes
Création de modèles
prédictifs
Unification des graphes
Ingénierie des caractéristiques
SQL
Parquet
JSON
CSV
FILE
and more...
12
Sources de
Données
Plate-forme de Graphe
native
Apprentissage
automatisé
13. Exploration des graphes
Construire une solution
graphe
Passage à l’échelle
Pipelines de données performants
Bibliothèques robustes de ML
Graphes non persistants, non-natifs
Graphes persistants et dynamiques
Requêtes graphe natives et algorithmes
performants
Liste croissante d’algorithmes de graphe et
de graphes embarqués
13
15. Les apports de la science des données orientée
graphe
Meilleures
décisions
Graphes de
connaissance
Précision
accrue
Ingénierie des
caractéristiques
connectées
Plus de confiance et
de pertinence
Apprentissage
orienté graphe
nativement
15
16. Science des données orientée graphe - Trajectoire
Graphes de
connaissance
axés recherche
Ingénierie des
caractéristiques
axée recherche
Ingénierie des
caractéristiques
augmentée par les
algorithmes de
graphe
Projections de
graphes
Réseaux de neurones
orientés graphe
Graphes de
connaissance
Ingénierie des
caractéristiques
orientée graphe
Apprentissage
nativement
orienté graphe
16
17. Science des données orientée graphe - Trajectoire
Graphes de
connaissance
axés recherche
Ingénierie des
caractéristiques
axée recherche
Ingénierie des
caractéristiques
augmentée avec les
algorithmes de
graphe
Projections de
graphe
Réseaux de neurones
orientés graphes
17
18. Graphes de connaissance axés recherche
Relier les points
Plusieurs graphes d’information financière
superposés
Inclut des données d’entreprise avec
relations internes, des fils d’information
externes, et une pondération personnalisable
Tableaux de bord et outils
• Risques de crédit
• Risques liés aux placements
• Recommandations portefeuille
personnalisées
renommée...
18
19. Science des données orientée graphe - Trajectoire
Graphes de
connaissance
axés recherche
Ingénierie des
caractéristiques
axée recherche
Graph Algorithm
Feature
Engineering
Projections de
graphes
Réseaux de neurones
orientés graphe
19
20. Les réseaux de télécommunications sont facilement représentés sous forme de graphes.
Ingénierie des caractéristiques axée recherche
Prédiction d’attrition - Telecom
21. Requêtes performantes dans un graphe natif
Ingénierie des caractéristiques axée recherche
Prédiction d’attrition - Telecom
Prédiction d’attrition.
La recherche a montré que des
caractéristiques simples conçues à la
main sont fortement prédictives
• Combien d'appels ou de SMS un
compte a-t-il effectués ?
• Combien parmi ses contacts ont
résilié leur contrat ?
22. 22
Ingénierie des caractéristiques axée recherche
Prédiction d’attrition - Telecom
Ajout aux données tabulaires de caractéristiques connectées
Ces caractéristiques sont les résultats de requêtes dans le graphe
Raw Data:
Call Detail Records
Input Data:
CDR Sample
Call Stats by:
Incoming
Outgoing
Per day
Short durations
In-network
Centrality
SMS’s
…
Test/Training Data
Caller ID
Receiver ID
Time
Duration
Location
…
Caller ID
Receiver ID
Time
Duration
Location
…
Identify Early Predictors:
Select simple, interpretable metrics
that are highly correlated w/churn
Churn Score:
Supervised learning to predict binary
& continuous measures of churn
Output/Results
Random
Sample
Selection
Feature
Engineering
Feature
Selection
Machine
Learning
23. 23
Ingénierie des caractéristiques axée recherche
Prédiction d’attrition - Telecom
Précision de 89.4% dans la prédiction
d’attrition d’un abonné !
Raw Data:
Call Detail Records
Input Data:
CDR Sample
Call Stats by:
Incoming
Outgoing
Per day
Short durations
In-network
Centrality
SMS’s
…
Test/Training
Data
Caller ID
Receiver ID
Time
Duration
Location
…
Caller ID
Receiver ID
Time
Duration
Location
…
Identify Early Predictors:
Select simple, interpretable metrics
that are highly correlated w/churn
Churn Score:
Supervised learning to predict binary
& continuous measures of churn
Output/Results
Random
Sample
Selection
Feature
Engineering
Feature
Selection
Machine
Learning
Source: Behavioral Modeling for Churn Prediction by Khan et al, 2015
24. Science des données orientée graphe - Trajectoire
Graphes de
connaissance
axés recherche
Ingénierie des
caractéristiques
axée recherche
Ingénierie des
caractéristiques
augmentée par les
algorithmes de
graphe
Projections de
graphes
Réseaux de
neurones orientés
graphe
24
25. Algorithmes de graphe, kézako ?
• Un sous-ensemble d’algorithmes de science des données provenant de la science des
réseaux ; les algorithmes de graphe permettent d’analyser la structure des réseaux
• Les algorithmes de graphe sont très demandés, neo4j est la 1ère solution pour les
exécuter de façon industrielle
• Des recherches approfondies montrent que les algorithmes de graphe rendent les
modèles de machine learning plus précis dans des cas d'utilisation clés
• Les algorithmes de graphe sont généralement non supervisés et divisés en catégories :
Recherche de
chemins
Centralité
Détection de
communautés
Prédiction de lien Similarité
26. 26
Algorithmes de graphe - utilisation
Explorer, Planifier, Mesurer
Déterminer des modèles significatifs et
planifier des structures optimales
Évaluer les résultats et fixer un seuil pour
une prédiction
Sélection de variables pour
le Machine Learning
Les mesures deviennent des variables
à entraîner
1st
Node
2nd
Node
Common
Neighbors
Preferential
Attachment
Label
1 2 4 15 1
3 4 7 12 1
5 6 1 1 0
27. Ingénierie des caractéristiques
orientée graphe
L’ingénierie des caractéristiques est la façon dont nous combinons et
traitons les données pour créer de nouvelles caractéristiques plus
significatives, comme des agrégats ou des mesures de connectivité
Apport de caractéristiques +descriptives
Influence, Relations, Communautés
EXTRACTION
27
28. Ingénierie des caractéristiques orientée graphe
Catégories et Algorithmes
Recherche de
chemin
Trouve les chemins optimaux ou
évalue la disponibilité” et la qualité
des itinéraires
Centralité /
Importance
Détermine l’importance de
noeuds spécifiques du graphe
Détection de
communauté
Détecte les possibilités de
partition ou d’agrégation de
groupes
Prediction heuristique
de lien
Estime la probabilité que des
noeuds forgent une relation
Évalue à quel point les
noeuds se ressemblent
Similarité
28
30. Les caractéristiques “graphe”
améliorent la précision
Connected components pour identifier les
graphes disjoints qui partagent des identifiants
PageRank pour mesurer l’influence et le
volume des transactions
Louvain pour identifier les communautés qui
interagissent fréquemment
Jaccard pour mesurer la similarité des
comptes
Ingénierie des caractéristiques augmentée par les algorithmes de graphe
Détection de la fraude financière
Les grandes institutions financières disposent de mécanismes pour identifier la
fraude par le biais d’heuristiques et de modèles
30
31. Science des données orientée graphe - Trajectoire
Graphes de
connaissance
axés recherche
Ingénierie des
caractéristiques
axée recherche
Ingénierie des
caractéristiques
augmentée par les
algorithmes de
graphe
Projections de
graphes
Réseaux de neurones
orientés graphe
31
32. Les projections transforment les graphes en vecteurs de caractéristiques, ou
ensemble de vecteurs, qui décrivent la topologie, la connectivité ou les propriétés
des noeuds et des relations dans le graphe
Projections de graphes
• Projection Vertex/node : décrit la connectivité de chaque noeud
• Projection Path: traversées dans le graphe
• Projections Graph : encoder un graphe entier en un unique vecteur
Phases of Deep Walk Approach
32
33. Projections de graphe RECOMMANDATIONS
Raisonnement explicite utilisant les graphes de
connaissance pour la recommandation de musique
33
Pop
Folk
Castle on the Hill
÷ Album
Ed Sheeran
I See FireTony
Shape of You
SungBy IsSingerOf
ContainSongIsSongOf
Interact
IsSingerOf
Genre
Genre
Genre
InteractedBy
Produce
WrittenBy
ListenedTo
Derek
Recommendations
for Derek
0.06
0.24
0.24
0.26
0.03
0.30
.63
34. Science des données orientée graphe - Trajectoire
Graphes de
connaissance
axés recherche
Ingénierie des
caractéristiques
axée recherche
Ingénierie des
caractéristiques
augmentée par les
algorithmes de
graphe
Projections de
graphes
Réseaux de neurones
orientés graphe
34
35. “The idea is that graph networks are bigger than any
one machine-learning approach.
Graphs bring an ability to generalize about structure
that the individual neural nets don't have.”
"La cognition humaine part
du principe que le monde est
composé d’objets et de
relations”
35
"Les calculs sur les graphes
offrent un potentiel inductif
bien supérieur aux couches
convolutives et récurrentes”
36. Apprentissage nativement orienté graphe:
La prochaine révolution de l’IA
36
Implémenter l’apprentissage automatisé dans un environnement de graphes
permet de créer des solutions d’IA +précises, +flexibles et +fiables
Relational inductive biases, deep learning, and graph networks
L’apprentissage nativement orienté graphe fait sortir l’IA de ses boîtes noires rigides
pour créer des modèles extrêmement flexibles et transparents.
Permet aux utilisateurs
d’ingérer des données
connectées
Apprend tout en
sauvegardant les
états transitoires
Produit les résultats
sous forme de
graphes
Permet aux experts de
suivre, comprendre et
valider les chemins de
prise de décision de l’IA
Apprentissage + précis
avec - de données basé
sur les caractéristiques
importantes
37. Science des données orientée graphe - trajectoire
Graphes de
connaissance
axés recherche
Ingénierie des
caractéristiques
axée recherche
Ingénierie des
caractéristiques
augmentée par les
algorithmes de graphe
Projections de
graphes
Réseaux de neurones
orientés graphe
Graphes de
connaissance
Ingénierie des
caractéristiques
orientée graphe
37
Apprentissage
nativement
orienté graphe
48. Query-Based Knowledge Graphs
Connecting the Dots at NASA
MISSION TO
MARS
“Using Neo4j, someone from our Orion
project found information from the
Apollo project that prevented an issue,
saving well over two years of work and
one million dollars of taxpayer funds.”
David Meza
Chief Knowledge Architect
NASA
48
50. het.io - HetioNet
Knowledge graph integrating
50+ years of biomedical data
Leveraged to predict new uses
for drugs by using the graph
topology to create features to
predict new links
Query-Based Feature Engineering
Mining Data for Drug Discovery
50
51. Query-Based Feature Engineering
Mining Data for Drug Discovery
het.io - HetioNet
Knowledge graph integrating
50+ years of biomedical data
Leveraged to predict new uses
for drugs by using the graph
topology to create features to
predict new links
51
53. Example: electron path prediction
Bradshaw et al, 2019
Graph Native Learning
Given reactants and reagents, what will the
products be?
Given reactants and reagents, what will the
products be?
53