La femme japonaise - Traits communs et statut social
Data Science : Entre modèle économique et industrie d'avenir - DevFest Agadir 2018
1. DEVFEST AGADIR 2018
DATA SCIENCE : ENTRE
MODÈLE ÉCONOMIQUE
ET INDUSTRIE D'AVENIR
Mehdi Reghai
Synergie Media Agence Interactive
2. QUE REPRÉSENTENT
AUJOURD'HUI LES DONNÉES ?
2,5MILLIARDS
de données sont actuellement créées
chaque jour
90%
des données existantes ont été créées
durant les 2 dernières années
2012 2014 2016 201720152013 2018
2 M
2,5 M
3 M
3,5 M
4 M
Sources : domo.com (2017) et forbes.com (2017) Nombre d’internautes
3. IL FAUT SAVOIR QUE
CHAQUE MINUTE
45.000 CLIENTS
effectuent une course sur un véhicule Uber
46.000PUBLICATIONS
sont mises en ligne sur Instagram
51.000 UTILISATEURS
regardent des vidéos Buzzfeed
Source : domo.com (2017)
70.000 HEURES
de vidéos sont regardées sur Netflix
154.000 UTILISATEURS
effectuent des appels sur Skype
259.000 DOLLARS
sont dépensés sur Amazon
4. IL FAUT SAVOIR QUE
CHAQUE MINUTE
Source : domo.com (2017)
456.000 UTILISATEURS
publient des tweets sur Twitter
528.000 PHOTOS
sont partagées sur Snapchat
3,6 MILLIONS
de recherches sont effectuées sur Google
4,1 MILLIONS
d'utilisateurs regardent des vidéos sur YouTube
103 MILLIONS
d'emails“spams”sont envoyés
5. LES TROIS GRANDES
PROBLÉMATIQUES
Un tel volume de données, généré continuellement, et en progression
exponentielle, soulève un certain nombre de questions...
PROBLÉMATIQUE
01ÈRE STOCKAGE DES DONNÉES
Alors que les capacités de stockage sont limitées, quel est
l’avenir du“web storage”et du“local storage”?
PROBLÉMATIQUE
02ÈME TRAITEMENT DES DONNÉES
Ces données appelées également Big Data doivent être
classées, triées, analysées... pour qu’elles aient une“valeur”.
PROBLÉMATIQUE
03ÈME EXPLOITATION DES DONNÉES
Quels modèles économiques reposeront sur ces données et
quels sont les métiers d’avenir liés à la Data Science ?
6. L’ÉVOLUTION DU STOCKAGE
DE MES DONNÉES PERSONNELLES
4 GO
5 GO
2 GO
1 GO
JEUX VIDÉO WINDOWS
ET LOGICIELS
MUSIQUE
VIDÉOS
2 GO
AUTRES
FICHIERS
2001 - PC Windows
Capacité de stockage : 20 Go
2011 - PC Windows
Capacité de stockage : 750 Go
40 GO
JEUX VIDÉO
55 GO
WINDOWS
ET LOGICIELS
35 GO
MUSIQUE
200 GO
VIDÉOS
2 GO
AUTRES
FICHIERS
350 GO
2018 - MacBook Pro OS X
Capacité de stockage : 128 Go
25 GO
WINDOWS
ET LOGICIELS
4 GO
MUSIQUE
30 GO
AUTRES
FICHIERS
VIDÉOS
JEUX VIDÉO
7. L’ÉVOLUTION DU STOCKAGE
DE MES DONNÉES PERSONNELLES
4 GO
5 GO
2 GO
1 GO
JEUX VIDÉO WINDOWS
ET LOGICIELS
MUSIQUE
VIDÉOS
2 GO
AUTRES
FICHIERS
2001 - PC Windows
Capacité de stockage : 20 Go
2011 - PC Windows
Capacité de stockage : 750 Go
40 GO
JEUX VIDÉO
55 GO
WINDOWS
ET LOGICIELS
35 GO
MUSIQUE
200 GO
VIDÉOS
2 GO
AUTRES
FICHIERS
350 GO
2018 - MacBook Pro OS X
Capacité de stockage : 128 Go
25 GO
WINDOWS
ET LOGICIELS
4 GO
MUSIQUE
30 GO
AUTRES
FICHIERS
VIDÉOS
JEUX VIDÉO
8. L’ÉVOLUTION DU STOCKAGE
DE MES DONNÉES PERSONNELLES
4 GO
5 GO
2 GO
1 GO
JEUX VIDÉO WINDOWS
ET LOGICIELS
MUSIQUE
VIDÉOS
2 GO
AUTRES
FICHIERS
2001 - PC Windows
Capacité de stockage : 20 Go
2011 - PC Windows
Capacité de stockage : 750 Go
40 GO
JEUX VIDÉO
55 GO
WINDOWS
ET LOGICIELS
35 GO
MUSIQUE
200 GO
VIDÉOS
2 GO
AUTRES
FICHIERS
350 GO
2018 - MacBook Pro OS X
Capacité de stockage : 128 Go
25 GO
OS X
ET LOGICIELS
4 GO
MUSIQUE
30 GO
AUTRES
FICHIERS
VIDÉOS
JEUX VIDÉO
9. CE QUI A CHANGÉ AU COURS
DES 20 DERNIÈRES ANNÉES
NETFLIX
Première plateforme de
streaming légale de films,
séries et documentaires
SPOTIFY / SOUNDCLOUD
Deux plateformes
(respectivement payante et
gratuite) de streaming musical
STEAM
Plateforme de distribution et de
streaming de jeux vidéo
GOOGLE DRIVE
Service de stockage et de
partage de fichiers à travers le
Cloud
FACEBOOK / INSTAGRAM
Deux réseaux sociaux qui
permettent le partage
d’images et de vidéos
L’apparition de nouveaux services web, l’accès au paiement électronique et l’amélioration
du débit internet ont enclenché un changement drastique chez l’utilisateur lambda.
10. LE MODÈLE ÉCONOMIQUE DU
GÉANT AMAZON.COM
Amazon une entreprise de commerce électronique créée en 1994 et valorisée
aujourd’hui à plus de 1.000 milliards de dollars.
AMAZON WEB SERVICES
Les données des utilisateurs, leurs habitudes d’achats, leurs
comportements ... constituent la vraie force d’Amazon.
Amazon a donc lancé en 2006 AWS, division dédiée aux services
de cloud computing à la demande pour les entreprises et les
particuliers. Les revenus du service ont dépassé en 2017 les 17
milliards de dollars.
AWS a compte (ou a compté) parmi ses clients : Dow Jones, Airbnb,
Adobe, Spotify, Netflix, State Department, CIA...
11. APPLICATIONS
Analyser et comprendre le comportement des utilisateurs
pour proposer des actions d’amélioration dans les domaines
de l’industrie, du transport public, du sport, de la santé, de la
sécurité, etc.
CHALLENGE
Récolter, traiter et sécuriser ces données efficacement dans
un écosystème loin d’être optimal : fragmentation des
systèmes d’exploitation, éthique douteuse de certains
constructeurs, différences juridiques entre les pays...
INTERNET OF THINGS : ENCORE PLUS
DE DONNÉES COLLECTÉES
Les estimation d’IHS Markit et d’Intel situent le nombre d’objets connectés en
circulation en 2025 entre 75 et 200 milliards appareils.
12. DATA SCIENCE : LES DÉFIS
DE DEMAIN
TRAITEMENT
Parier sur le développement de nouveaux
algorithmes et sur le progrès de l’intelligence
artificielle est une des réponses à la nécessité
de traiter rapidement les données récoltées.
COMPRÉHENSION
Il est nécessaire de déchiffrer les données
stockées en vrac pour en ressortir avec des
modèles de comportement et une réaction
appropriée à chaque situation et/ou utilisateur.
ENCODAGE / COMPRESSION
L’heure n’est plus seulement à la création de
nouvelles technologies et capacités de
stockage, mais à au développement de
nouvelles méthodes de compression et de
réencodage.
SÉCURITÉ
Chaque utilisateur partage un nombre
incalculable de données sensibles : mots de
passe, localisation, coordonnées bancaires,
codes d’accès, etc. ce qui impose des normes
de sécurité encore plus rigoureuses.
13. DATA SCIENCE : LES MÉTIERS
DE DEMAIN
DATA ANALYSIS
Discipline qui consiste à inspecter, nettoyer,
transformer et modéliser les données afin de
faire ressortir les relations entre les différentes
“datas”et faciliter la prise de décision.
MACHINE LEARNING
Développement d’outils d’analyse dotés de la
capacité à automatiser certaines tâches (en se
basant sur des modèles préprogrammés) et à
s’améliorer grâce à l’intelligence artificielle.
DATA VISUALIZATION
Représentation des données sous une forme
plus facile à comprendre et à appréhender via
des textes, des schémas et des infographies.
Principales applications : la communication, les
médias, la presse, le marketing...
DATA PROTECTION
L’importance de la sécurité informatique n’a
jamais été aussi importante, compte tenu du
volume et de la sensibilité des informations
partagées (aujourd’hui et à l’avenir) par les
utilisateurs.
14. DATA SCIENCE : OÙ
COMMENCER ?
Bonne maîrise des langages
Python, R et Scala, du SAS
(Statistical Analysis System), etc.
Bonne maîrise des Multiple Analytical
Functions : gestion et organisation
des bases de données
Notions en Machine Learning : automatisation de l’analyse
et amélioration progressive des performances
COMPÉTENCES DE
BASE EN DATA
SCIENCE
Apptitude à traiter des données non
structurées de différentes sources :
vidéos, réseaux sociaux, etc.
Expérience en gestion et
développement de bases de
données, et en programmation SQL
15. Mehdi Reghai
Synergie Media Agence Interactive
DEVFEST AGADIR 2018
DATA SCIENCE : ENTRE
MODÈLE ÉCONOMIQUE
ET INDUSTRIE D'AVENIR