SlideShare a Scribd company logo
1 of 89
Download to read offline
Machine Learning &
Régulation Numérique
Didier Girard / Guillaume Laforge
SPAM
RECOMMENDATIONS
2011 rank Company 2009 2010 2011
1 Netflix 0.0 % 0.5 % 44.0 %
2 Apple 71.5 % 60.8 % 32.3 %
3 Microsoft 11.2 % 16.7 % 7.6 %
4 Vudu (Walmart) 0.5 % 2.7 % 4.2 %
5 Sony 5.4 % 6.8 % 2.4 %
Others 11.4 % 12.6 % 9.5 %
Total 89 % 87 % 90 %
“Voici mon catalogue” vs “J’ai une video pour vous.”
Yup, NSA
does!
Toutes les données,
tu récolteras
#MixIT14
data
machine
learning
Définition
Définition
Une branche de l’intelligence
artificielle qui s’occupe de la
construction et l’étude de systèmes
quiapprennentàpartirdedonnées
Le parallèle de l’accordeur de piano
Data
Accordeur
Modèle
Les grandes familles
Supervisé vs non-supervisé
Supervisé
Régression, classification...
Régression
http://en.wikipedia.org/wiki/Regression_analysis
Un modèle de regression relie Y à une fonction de X et ß
Son Touches Accordeur
Régression linéaire
http://en.wikipedia.org/wiki/Linear_regression
Régression linéaire
Régression linéaire
Régression linéaire
Régression linéaire
Régression linéaire
ATTENTION
corrélation
≠ causalité
:-)
Ta fonction de coût,
tu minimiseras
#MixIT14
Fonction de coût
Régression
Régression — ordre premier
Régression — ordre premier
?
Régression — ordre second
Régression — ordre second
?
Classification
La classification est le problème
d'identifier à quel ensemble de
catégories (sous-population) une
nouvelle observation correspond
http://en.wikipedia.org/wiki/Statistical_classification
Classification
Classification
Non-supervisé
Clusterisation, séparation de sources...
Clusterisation
Clusterisation
Clusterisation
Séparation de sources
Source 1
Source 2
Séparation de sources
Source 1
Source 2
Observation
Séparation de sources
Source 1
Source 2
Observation
Source séparée 1
Source séparée 2
Tes données,
tu visualiseras
#MixIT14
Visualiser
N’apprends pas
ce que tu sais déjà
#MixIT14
Ne pas apprendre ce que l’on sait
Ne pas apprendre ce que l’on sait
Ne pas apprendre ce que l’on sait
Ne pas apprendre ce que l’on sait
Tes données, tu
segmenteras
#MixIT14
Segmenter
Problème :
● Je vous donne la latitude et la
longitude
● Vous devez coder un systeme
qui me donne l’altitude
1. un modèle pour toute la France ?
2. un modèle par type de relief ?
3. un modèle par région ?
Segmenter
Segmenter
Tes données, tu
pré-traiteras
#MixIT14
Exemple : Normaliser/Centrer
Exemple : Face Recognition
http://bitsearch.blogspot.com/2013/02/unsupervised-face-clustering-with-opencv.html
Que faire des données manquantes ?
● Supprimer la dimension ?
● Signaler au système apprenant ?
Données aberrantes
● Erreur d’
observation ?
● Cas exceptionnel ?
Ton algorithme,
tu choisiras
#MixIT14
k-nearest neighbors
Wikipedia
Support Vector Machine
Wikipedia
Random tree forest
Neural Networks
Wikipedia
De l’intuition,
tu auras
#MixIT14
https://www.flickr.com/photos/hills_alive/3368257480/
Comment
caractériser l’
intuition ?
Chasse aux
champignons ?
Sélectionner les bonnes variables
Sélectionner les bonnes variables
Consommation
● jour de la semaine
● vacances scolaires
● jours fériés
● température
Reconnaissance d’image
● histogramme de
couleur
Ton système,
tu entraineras
#MixIT14
Apprendre et généraliser
Apprentissage : 60% Généralisation : 40%
Par coeur, tu n’
apprendras pas
#MixIT14
Régression — ordre supérieur ?
?
Capacité d’apprentissage d’un système
Capacité d’apprentissage
Complexité
des systèmes
modélisables
Risque de sur-
apprentissage
Pour aller plus loin : VC-Dimension
Trois choses entrent en jeu :
● taille de l’échantillon
● nombre de paramètres d’ajustement du
modèle
● nombre de dimensions de l’espace d’entrée
Intuition : capacité de généralisation
#MixIT14
Ton modèle,
tu valideras
#MixIT14
Apprendre, Généraliser et Valider
Apprentissage : 60% Généralisation : 20% Validation : 20%
Ton modèle,
tu exécuteras
#MixIT14
A un moment ou un autre… il faut se lancer !
Les recettes de tonton Moïse pour le ML
1. Enregistrez toutes les données que vous pourrez
2. Observez et visualisez vos données
3. Segmentez vos données
4. Pré-traitez et normalisez vos données
5. Choisissez bien votre algorithme
6. Entrainez votre système
7. Validez votre système
8. Et… exécutez !
Quelques outils
● R
http://www.r-project.org/
● Octave
https://www.gnu.org/software/octave/
● SciKit Learn
http://scikit-learn.org/
● Apache Mahout
https://mahout.apache.org/
● Weka
http://www.cs.waikato.ac.nz/ml/weka/
● Google Prediction
https://developers.google.com/prediction
● Prediction.IO
http://prediction.io/
● MADlib
http://madlib.net/
Conclusion
Machine Learning et Régulation Numérique
Le Data Scientist de demain est le Physicien Nucléaire d’hier
BIG DATA IS SCORING YOU
#MixIT14
http://money.cnn.com/2014/04/02/pf/consumer-scores/index.html
Consumer
profitability
score
Churn score
Job security
score
Medication
adherence
score
Fraud scoreCustomer
score
Law
enforcement
score
On ne peut pas arrêter la machine...
Apprendre et comprendre comment marche le Machine Learning
Etre au coeur du système, pour le réguler
Les gens éduqués sont les garde-fous des dérives du Machine Learning
#MixIT14
Le monde est entre vos mains ! A vous de jouer !
Didier Girard / Guillaume Laforge
@didiergirard @glaforge
Merci
Didier Girard / Guillaume Laforge
@didiergirard @glaforge
Questions —
réponses

More Related Content

Viewers also liked

Machine intelligente d’analyse financiere
Machine intelligente d’analyse financiereMachine intelligente d’analyse financiere
Machine intelligente d’analyse financiereSabrine MASTOURA
 
Machine learning
Machine learningMachine learning
Machine learningebiznext
 
Introduction au Machine Learning
Introduction au Machine LearningIntroduction au Machine Learning
Introduction au Machine LearningMathieu Goeminne
 
Analyse financière
Analyse financièreAnalyse financière
Analyse financièreAbdo attar
 
Mahout classification presentation
Mahout classification presentationMahout classification presentation
Mahout classification presentationNaoki Nakatani
 
Machine learning pour tous
Machine learning pour tousMachine learning pour tous
Machine learning pour tousDamien Seguy
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Antidot
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage AutomatiqueNizar Bechir
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkAmal Abid
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBaseAmal Abid
 
Machine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An IntroductionMachine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An IntroductionVarad Meru
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 

Viewers also liked (12)

Machine intelligente d’analyse financiere
Machine intelligente d’analyse financiereMachine intelligente d’analyse financiere
Machine intelligente d’analyse financiere
 
Machine learning
Machine learningMachine learning
Machine learning
 
Introduction au Machine Learning
Introduction au Machine LearningIntroduction au Machine Learning
Introduction au Machine Learning
 
Analyse financière
Analyse financièreAnalyse financière
Analyse financière
 
Mahout classification presentation
Mahout classification presentationMahout classification presentation
Mahout classification presentation
 
Machine learning pour tous
Machine learning pour tousMachine learning pour tous
Machine learning pour tous
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage Automatique
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
TP2 Big Data HBase
TP2 Big Data HBaseTP2 Big Data HBase
TP2 Big Data HBase
 
Machine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An IntroductionMachine Learning and Apache Mahout : An Introduction
Machine Learning and Apache Mahout : An Introduction
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 

Similar to Mix it2014 - Machine Learning et Régulation Numérique

Intelligence artificielle etroite introduction
Intelligence artificielle etroite introductionIntelligence artificielle etroite introduction
Intelligence artificielle etroite introductionSmals
 
Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data businessVincent de Stoecklin
 
Meetup_FGVA_Prédiction et prévention du churn @ Ankama
Meetup_FGVA_Prédiction et prévention du churn @ Ankama Meetup_FGVA_Prédiction et prévention du churn @ Ankama
Meetup_FGVA_Prédiction et prévention du churn @ Ankama Johan-André Jeanville
 
Introduction Azure machine learning
Introduction Azure machine learningIntroduction Azure machine learning
Introduction Azure machine learningsana khiari
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la sciencehabib200
 
Euratech'trends : Machine Learning
Euratech'trends : Machine LearningEuratech'trends : Machine Learning
Euratech'trends : Machine LearningEuraTechnologies
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesOCTO Technology Suisse
 
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelmanslides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelmanshuai wang
 
BIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon Gervaise
BIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon GervaiseBIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon Gervaise
BIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon GervaiseYvon Gervaise
 
Intelligence artificielle, l'avènement du marketing augmenté
Intelligence artificielle, l'avènement du marketing augmentéIntelligence artificielle, l'avènement du marketing augmenté
Intelligence artificielle, l'avènement du marketing augmentéFrederic CAVAZZA
 
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...Philippe Beraud
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesGautier Poupeau
 
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..YvonGervaise
 
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...TelecomValley
 
Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?BigBrain Evolution
 
Programmation en technologie (C.Blin)
Programmation en technologie (C.Blin)Programmation en technologie (C.Blin)
Programmation en technologie (C.Blin)APMEPIledeFrance
 
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestIA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestMimoun Kissi 🤖
 
Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...
Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...
Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...Jochen (Thomas) Grünbeck ◁
 

Similar to Mix it2014 - Machine Learning et Régulation Numérique (20)

Intelligence artificielle etroite introduction
Intelligence artificielle etroite introductionIntelligence artificielle etroite introduction
Intelligence artificielle etroite introduction
 
Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data business
 
Meetup_FGVA_Prédiction et prévention du churn @ Ankama
Meetup_FGVA_Prédiction et prévention du churn @ Ankama Meetup_FGVA_Prédiction et prévention du churn @ Ankama
Meetup_FGVA_Prédiction et prévention du churn @ Ankama
 
Introduction Azure machine learning
Introduction Azure machine learningIntroduction Azure machine learning
Introduction Azure machine learning
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la science
 
Euratech'trends : Machine Learning
Euratech'trends : Machine LearningEuratech'trends : Machine Learning
Euratech'trends : Machine Learning
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
 
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelmanslides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
slides_conf_sur_AI_big_data_par_Françoise_Soulié-Fogelman
 
test
testtest
test
 
BIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon Gervaise
BIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon GervaiseBIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon Gervaise
BIPEA 2023 L'IA Matrice du Laboratoire du Futur par Yvon Gervaise
 
Intelligence artificielle, l'avènement du marketing augmenté
Intelligence artificielle, l'avènement du marketing augmentéIntelligence artificielle, l'avènement du marketing augmenté
Intelligence artificielle, l'avènement du marketing augmenté
 
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
Le Machine Learning pour lutter contre les menaces en termes de Cybersécurité...
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des données
 
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
BIPEA 2023 Yvon Gervaise : L'IA Matrice du Laboratoire du Futur ..
 
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
Soirée du Test Logiciel - Intelligence Artificielle dans le test - J. VAN QUA...
 
Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?Comprenez-vous l’intelligence artificielle ?
Comprenez-vous l’intelligence artificielle ?
 
Programmation en technologie (C.Blin)
Programmation en technologie (C.Blin)Programmation en technologie (C.Blin)
Programmation en technologie (C.Blin)
 
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4TestIA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
IA et Test - MeetUp MoT - Julien Van Quackebeke - CEO All4Test
 
Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...
Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...
Neuromarketing - Comment convaincre et persuader en ligne avec les neuroscien...
 
Debuteraveclesmls
DebuteraveclesmlsDebuteraveclesmls
Debuteraveclesmls
 

More from Didier Girard

Cloud Platform Qualification Training Intro - LinkedIn
Cloud Platform Qualification Training Intro - LinkedInCloud Platform Qualification Training Intro - LinkedIn
Cloud Platform Qualification Training Intro - LinkedInDidier Girard
 
Mobile App Trucs Et Astuces Dig
Mobile App Trucs Et Astuces DigMobile App Trucs Et Astuces Dig
Mobile App Trucs Et Astuces DigDidier Girard
 
Smartphone et Web : pourquoi, comment ?
Smartphone et Web : pourquoi, comment ?Smartphone et Web : pourquoi, comment ?
Smartphone et Web : pourquoi, comment ?Didier Girard
 
Widgets : Le coeur du 2.0
Widgets : Le coeur du 2.0Widgets : Le coeur du 2.0
Widgets : Le coeur du 2.0Didier Girard
 
GWT + Gears : The browser is the platform
GWT + Gears : The browser is the platformGWT + Gears : The browser is the platform
GWT + Gears : The browser is the platformDidier Girard
 
Introduction to Google Web Toolkit
Introduction to Google Web ToolkitIntroduction to Google Web Toolkit
Introduction to Google Web ToolkitDidier Girard
 
Javapolis GWT Gadget OpenSocial
Javapolis GWT Gadget OpenSocialJavapolis GWT Gadget OpenSocial
Javapolis GWT Gadget OpenSocialDidier Girard
 
Bureau Metier - Version 20061010
Bureau Metier - Version 20061010Bureau Metier - Version 20061010
Bureau Metier - Version 20061010Didier Girard
 

More from Didier Girard (11)

Cloud Platform Qualification Training Intro - LinkedIn
Cloud Platform Qualification Training Intro - LinkedInCloud Platform Qualification Training Intro - LinkedIn
Cloud Platform Qualification Training Intro - LinkedIn
 
Mobile App Trucs Et Astuces Dig
Mobile App Trucs Et Astuces DigMobile App Trucs Et Astuces Dig
Mobile App Trucs Et Astuces Dig
 
Smartphone et Web : pourquoi, comment ?
Smartphone et Web : pourquoi, comment ?Smartphone et Web : pourquoi, comment ?
Smartphone et Web : pourquoi, comment ?
 
Widgets : Le coeur du 2.0
Widgets : Le coeur du 2.0Widgets : Le coeur du 2.0
Widgets : Le coeur du 2.0
 
GWT + Gears : The browser is the platform
GWT + Gears : The browser is the platformGWT + Gears : The browser is the platform
GWT + Gears : The browser is the platform
 
Introduction to Google Web Toolkit
Introduction to Google Web ToolkitIntroduction to Google Web Toolkit
Introduction to Google Web Toolkit
 
Javapolis GWT Gadget OpenSocial
Javapolis GWT Gadget OpenSocialJavapolis GWT Gadget OpenSocial
Javapolis GWT Gadget OpenSocial
 
Gdd07 Gwt Dig
Gdd07 Gwt DigGdd07 Gwt Dig
Gdd07 Gwt Dig
 
RIA - RDA - ROA
RIA - RDA - ROARIA - RDA - ROA
RIA - RDA - ROA
 
Bureau Metier - Version 20061010
Bureau Metier - Version 20061010Bureau Metier - Version 20061010
Bureau Metier - Version 20061010
 
Les limites du web
Les limites du webLes limites du web
Les limites du web
 

Mix it2014 - Machine Learning et Régulation Numérique