Le machine learning est la science qui permet à un algorithme d’apprendre sans avoir été explicitement programmé pour cela. Elle est utilisée par les acteurs de la nouvelle économie pour le traitement de gros volumes de données, dans la traduction automatique, la reconnaissance de la parole, la classification de consommateur, la construction de réputation, ou la prévision des trafics. C’est la “régulation numérique”.
Nous parlerons des champs d’application du machine learning par les gros acteurs du numérique, de ses fondements mathématiques, des grands familles d’algorithmes et des outils disponibles pour mettre en pratique.
Découvrez les bases pour comprendre cette science et mesurer le potentiel des possibilités de son utilisation.
30. Classification
La classification est le problème
d'identifier à quel ensemble de
catégories (sous-population) une
nouvelle observation correspond
http://en.wikipedia.org/wiki/Statistical_classification
48. Segmenter
Problème :
● Je vous donne la latitude et la
longitude
● Vous devez coder un systeme
qui me donne l’altitude
1. un modèle pour toute la France ?
2. un modèle par type de relief ?
3. un modèle par région ?
64. Sélectionner les bonnes variables
Consommation
● jour de la semaine
● vacances scolaires
● jours fériés
● température
Reconnaissance d’image
● histogramme de
couleur
69. Capacité d’apprentissage d’un système
Capacité d’apprentissage
Complexité
des systèmes
modélisables
Risque de sur-
apprentissage
70. Pour aller plus loin : VC-Dimension
Trois choses entrent en jeu :
● taille de l’échantillon
● nombre de paramètres d’ajustement du
modèle
● nombre de dimensions de l’espace d’entrée
77. Les recettes de tonton Moïse pour le ML
1. Enregistrez toutes les données que vous pourrez
2. Observez et visualisez vos données
3. Segmentez vos données
4. Pré-traitez et normalisez vos données
5. Choisissez bien votre algorithme
6. Entrainez votre système
7. Validez votre système
8. Et… exécutez !
78. Quelques outils
● R
http://www.r-project.org/
● Octave
https://www.gnu.org/software/octave/
● SciKit Learn
http://scikit-learn.org/
● Apache Mahout
https://mahout.apache.org/
● Weka
http://www.cs.waikato.ac.nz/ml/weka/
● Google Prediction
https://developers.google.com/prediction
● Prediction.IO
http://prediction.io/
● MADlib
http://madlib.net/