SlideShare une entreprise Scribd logo
1  sur  54
Télécharger pour lire hors ligne
Thèse Professionnelle
Présentée par :
Thibault PAILLIER
En vue d’obtenir le titre Certifié Niveau I :
Manager de la Stratégie Commerciale
Spécialité : Management de la Stratégie de marque, de l'innovation et du
lancement de nouveaux produits et services
COMMENT LES BIG DATA VONT
AMELIORER LE MARKETING DANS
LES ENTREPRISES EN B2B ?
THÈSE Professionnelle dirigée par :
François GONNET
Entreprise :
Cofely Ineo Digital, Groupe ENGIE Tuteur : Mme KOUADRIA Laetitia
Résumé
Dans cette thèse nous allons nous intéresser aux avantages de l’utilisation des big
data dans une entreprise située sur un marché B2B.
Nous analyserons dans un premier temps via des études d’ouvrages comment les big
data s’appliquent dans divers domaines tels que l’énergie, la télécommunication ou
encore la santé et dans un second temps plus particulièrement dans différents services
d’une entreprise tels que la logistique ou les ressources humaines.
Nous étudierons plus en détail l’application des big data dans le marketing et nous
confronterons nos recherches par des interviews de professionnels spécialisés en big
data ainsi que l’interview d’une personne travaillant au sein de l’entreprise Cofely Ineo
Digital qui n’utilise pas les big data.
Nous nous attarderons sur le cas de cette société et nous étudierons comment les big
data peuvent apporter de différentes manières des améliorations au marketing dans
cette société.
Résumé en anglais
In this thesis we will look at the advantages of the use of big data in a company in a
B2B market.
At first we will analyze through studies of books how big data apply in various fields
such as energy, telecommunications or health and in a second time especially in
different company services such as logistics or human resources.
We will study in detail the application of big data in marketing and we will confront our
research by the interviews of specialized professionals in big data and an interview
with a person working in the company Cofely Ineo Digital that does not use the big
data.
We will focus on the case of this company and we will study how big data can bring in
different ways improvements to the marketing in this company.
Table des matières
INTRODUCTION .........................................................................................................................................................................1
PREMIERE PARTIE : CONCEPT DE « BIG DATA » .................................................................................................................2
I. L’ERE DEL’INFORMATION..................................................................................................................................................3
A. La généralisation d’internet .................................................................................................................................3
B. La révolution du smartphone...............................................................................................................................4
C. La règle des 3 V ......................................................................................................................................................5
1. Volume ................................................................................................................................................................. 6
2. Vélocité................................................................................................................................................................. 8
3. Variété .................................................................................................................................................................. 8
D. Les outils des big data .........................................................................................................................................10
1. Infrastructure réseau.......................................................................................................................................... 10
2. Les bases de données......................................................................................................................................... 11
3. Hadoopet les outils de découverte des données.............................................................................................. 13
4. Machine learning................................................................................................................................................ 15
5. Les outils de visualisation................................................................................................................................... 16
6. Les compétences humaines............................................................................................................................... 17
7. Benchmark des solutions ................................................................................................................................... 18
II. LES DIFFERENTS USAGES DU BIG DATA..............................................................................................................................20
A. Le secteur des télécommunications ..................................................................................................................20
B. Le secteur de l’énergie.........................................................................................................................................21
C. Le secteur bancaire ..............................................................................................................................................22
D. Le secteur du commerce .....................................................................................................................................24
E. Le secteur public...................................................................................................................................................25
F. 4 V et 5 V et…........................................................................................................................................................27
G. Le secteur de la santé ..........................................................................................................................................27
H. Ressources humaines ..........................................................................................................................................29
I. Production et logistique ......................................................................................................................................31
III. BIG DATAET MARKETING ................................................................................................................................................33
A. Le marketing prédictif et fidélisation................................................................................................................33
B. Real-time marketing et native advertising..........................................................................................................35
C. Le ciblage...............................................................................................................................................................38
SECONDE PARTIE : LES BIG DATA FACE AUX PROFESSIONNELS....................................................................................39
IV. METHODOLOGIEDERECHERCHE.....................................................................................ERROR! BOOKMARK NOTDEFINED.
V. INTERVIEWS..................................................................................................................ERROR! BOOKMARK NOTDEFINED.
A. Collaborateur d’Ineo Digital..............................................................................Error! Bookmark not defined.
a. Présentation......................................................................................................Error! Bookmark not defined.
b. Questions / réponses ........................................................................................Error! Bookmark not defined.
c. Synthèse............................................................................................................Error! Bookmark not defined.
B. Spécialiste big data.............................................................................................Error! Bookmark not defined.
a. Présentation......................................................................................................Error! Bookmark not defined.
b. Questions / réponses ........................................................................................Error! Bookmark not defined.
c. Synthèse............................................................................................................Error! Bookmark not defined.
C. Spécialiste marketing .........................................................................................Error! Bookmark not defined.
a. Présentation......................................................................................................Error! Bookmark not defined.
b. Questions / réponses ........................................................................................Error! Bookmark not defined.
c. Synthèse............................................................................................................Error! Bookmark not defined.
VI. SYNTHESEDES INTERVIEWS ............................................................................................ERROR! BOOKMARK NOTDEFINED.
TROISIEME PARTIE : L’UTILISATION DES BIG DATA DANS L’ENTREPRISE COFELY INEO ..........................................40
VII. PRESENTATION DE COFELY INEO................................................................................ERROR! BOOKMARK NOTDEFINED.
A. Activité..................................................................................................................Error! Bookmark not defined.
B. Organisation ........................................................................................................Error! Bookmark not defined.
C. Clients....................................................................................................................Error! Bookmark not defined.
VIII. LECAS DE LASOCIETE INEO DIGITAL...........................................................................ERROR! BOOKMARK NOTDEFINED.
A. Présentation d’Ineo Digital................................................................................Error! Bookmark not defined.
B. Ineo Digital et la donnée....................................................................................Error! Bookmark not defined.
1. Le commerce..........................................................................................................Error! Bookmark not defined.
2. Les achats ...............................................................................................................Error! Bookmark not defined.
3. Le service facturation.............................................................................................Error! Bookmark not defined.
4. Le service SAV.........................................................................................................Error! Bookmark not defined.
C. Le service marketing chez Ineo Digital ............................................................Error! Bookmark not defined.
1. Le service marketing créateur de données............................................................Error! Bookmark not defined.
2. Les actions marketing chezIneo Digital.................................................................Error! Bookmark not defined.
a. Le service marketing direct...............................................................................Error! Bookmark not defined.
b. Le service marketing des offres.........................................................................Error! Bookmark not defined.
IX. APPLICATIONDESBIGDATAAUSERVICEDUMARKETINGCHEZINEODIGITAL...................................ERROR! BOOKMARK NOTDEFINED.
A. L’acquisition clients : ciblage.............................................................................Error! Bookmark not defined.
B. La fidélisation.......................................................................................................Error! Bookmark not defined.
C. Développer de nouvelles offres et prévoir leurs potentiels..........................Error! Bookmark not defined.
D. La vente de services complémentaires aux clients........................................Error! Bookmark not defined.
E. Client à risque ......................................................................................................Error! Bookmark not defined.
F. Définir les prix des contrats de maintenance .................................................Error! Bookmark not defined.
X. MISEEN PLACED’UN PROJETBIG DATADANS LASOCIETE INEO DIGITAL............................ERROR! BOOKMARK NOTDEFINED.
A. Les ressources nécessaires ................................................................................Error! Bookmark not defined.
1. Généralités .............................................................................................................Error! Bookmark not defined.
2. Ineo digital..............................................................................................................Error! Bookmark not defined.
a. Solutions logicielles...........................................................................................Error! Bookmark not defined.
b. Compétences humaines....................................................................................Error! Bookmark not defined.
c. Coût global.........................................................................................................Error! Bookmark not defined.
B. ROI.........................................................................................................................Error! Bookmark not defined.
C. Conclusion ............................................................................................................Error! Bookmark not defined.
BIBLIOGRAPHIE........................................................................................................................................................................42
TABLE DES ILLUSTRATIONS...................................................................................................................................................47
ANNEXES ...................................................................................................................................................................................48
ANNEXE 1 – GUIDE D’ENTRETIEN DE M. ROLAND KOLTCHAKIAN.....................ERROR! BOOKMARK NOT DEFINED.
ANNEXE 2 – GUIDE D’ENTRETIEN DE M. HERVE DHELIN .....................................ERROR! BOOKMARK NOT DEFINED.
ANNEXE 3 – GUIDE D’ENTRETIEN DE MME LAETITIA KOUADRIA ......................ERROR! BOOKMARK NOT DEFINED.
1
Introduction
90% de toutes les données dans le monde ont été créés durant les deux dernières
années. De nos jours la donnée est de partout, et elle est créée constamment, sur
internet, via les smartphones, via les objets connectés, lorsque l’on paye par carte…
et son rythme de croissance est exponentiel. Si cette croissance engendre des coûts
de stockage faramineux pour les entreprises du web que sont Google, Amazon, Apple,
et encore Facebook, ces données sont aussi une de leur plus grande richesse. La
donnée d’hier est la richesse d’aujourd’hui. Les technologies de stockage et surtout
les puissances de calcul de nos jours ont permis de créer des solutions capables
d’analyser ces données afin de pouvoir en tirer des informations précieuses. Les big
data sont nés.
Big data, ce terme anglo-saxon est apparu il y a quelques années déjà et fait son
apparition régulièrement lorsqu’éclate un scandale sur l’espionnage par les Etats Unis.
S’il est très connu comme une des techniques pour combattre le terrorisme ses
domaines d’application sont illimités. Astronomie, agriculture, météo, traffic, sécurité,
gestion de l’énergie, amélioration des défaillances des chaines de production,
recherche scientifique, médecine… il est impossible de citer toutes les utilisations qu’il
en est fait car elles ne cessent d’augmenter.
Il y a toutefois un domaine où l’on ne parle que de ça, c’est le marketing. Les
marketeurs ne jurent que par ça tant le potentiel des big data est immense. En effet
les big data sont le fait d’utiliser énormément de données afin de pouvoir en quelque
sorte prédire l’avenir, ou du moins anticiper les actions des consommateurs. Et qui
n’aurait pas rêvé de pouvoir savoir à l’avance à quel endroit du rayon du supermarché
les yeux du client vont se poser et quelle couleur va l’inciter à choisir le produit, en
fonction de la météo du jour, du résultat du match de foot de l’équipe locale et du trafic
en ville. Si cet exemple reste irréaliste il est représentatif de ce que les big data sont
capables de faire pour le marketing, à savoir donner toutes les clés aux marketeurs
afin de pouvoir vendre à la bonne personne, au bon moment, via le bon canal.
C’est ce que nous allons étudier dans cette thèse à savoir comment en utilisant les big
data, les marketeurs vont-ils pouvoir améliorer le marketing dans une entreprise sur
un marché en B2B et de ce fait apporter de la valeur à leur entreprise.
2
Première partie :
Concept de « big data »
3
I. L’ère de l’information
A. La généralisation d’internet
Aujourd’hui internet fait partie du quotidien de millions, voire de milliard de personnes
dans le monde. En 2015, « 42% de la population mondiale est connectée à Internet1»,
cela représente près de « 3,025 milliards d’internautes 1». Sur cette population 70%
se connecte quotidiennement avec un temps de connexion moyen de « 4,8 heures par
jour via un ordinateur, et 2,1 heures via un mobile 1 ». Si ces chiffres peuvent sembler
impressionnants, ils ne sont rien comparés à la quantité de données que cela
représente. En effet, si la quantité de données présentes sur internet à ce jour n’est
pas quantifiable – 2,5 exabyte, soit 2,5 milliards de gigabytes (GB) été créées par jour
en 2012 d’après le géant de l’informatique IBM 2 - elle ne cesse de croître à chaque
action d’un individu, et ce sur internent et en dehors. Car « chacun et chacune d’entre
nous produit et transmet des données sur nous-mêmes. Nous faisons cela en nous
déplaçant passivement – notre comportement étant enregistré par des caméras ou
l’utilisation de notre carte – ou en nous connectant sur notre ordinateur ou en surfant
sur le net 3» sur notre smartphone. Cette augmentation de données ou data a été très
fortement accentuée par l’émergence des réseaux sociaux. Comme le déclare Jean-
Charles Cointot dans son ouvrage La révolution Big Data « fin 2013, Facebook,
Twitter, Google + et LinkedIn totalisaient à eux seuls près de 2,5 milliards d’abonnés
et YouTube fait état de plus d’un milliard de visiteurs uniques chaque mois. 4». Lorsque
l’on sait que pour une durée d’une minute chaque jour, près de 277 000 tweets sont
publiés, que les utilisateurs Facebook partagent 2 460 000 contenus et qu’environ 72
heures de vidéos sont chargées sur YouTube 5 et que l’ensemble de ces informations
sont entièrement stockées et analysées par ces géants du web on comprend mieux
1 BLOG DU MODERATEUR [en ligne]. [Consulté le02/06/15]. Disponible sur Internet :
http://www.blogdumoderateur.com/chiffres-internet/
2 BBC [en ligne]. [Consulté le02/06/15]. Disponiblesur Internet : http://www.bbc.com/news/business -
26383058
3 SCIENCE DAILY [en ligne].[Consulté le03/06/15]. Disponiblesur Internet :
http://www.sciencedaily.com/releases/2013/05/130522085217.htm
4 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 10. ISBN: 978-2-10-071142-0
5 DOMO [en ligne]. [Consultéle 03/06/15].Disponiblesur Internet : https://www.domo.com/learn/da ta-never-
sleeps-2
4
pourquoi d’après une étude d’Oracle, comme le montre le graphique suivant, le volume
de données dans le monde va passer de 7 zettabytes (ZB) en 2015 soit sept mille
milliards de gigabytes, à près de 44 zettabytes en 2020.
Figure 1 - l'augmentation des data de 40% par an - d'après le site internet ATKearney [en ligne] [consulté le 03/06/2015]
disponible sur internet http://www.atkearney.fr/strategic-it/ideas-insights/article/-
/asset_publisher/LCcgOeS4t85g/content/big-data-and-the-creative-destruction-of-today-s-business-models/10192
B. La révolution du smartphone
D’après l’ITU (International Telecommunication Union), en 2015 le taux de pénétration
du mobile dans le monde était de 97% pour atteindre près de 7 milliards de mobile
contre 738 millions en 2000 6. En France, « le taux d’équipement est de l’ordre de
112% et en Île-de-France de l’ordre de 175%. Grâce à la baisse des prix, de plus en
plus de gens ont deux téléphones, l’un privé et l’autre professionnel par exemple.7 ».
Cette inexorable croissance du mobile à travers le monde est une cause principale de
6 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne].[Consulté le03/06/15]. Disponiblesur
Internet : http://www.itu.int/en/ITU-D/Statistics/Documents/facts/ICTFactsFigures2015.pdf
7 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 19. ISBN: 978-2-10-071142-0
5
l’augmentation exponentielle du volume de données. En France, un mobile sur deux
est un smartphone8, les Français sont constamment connectés à internet : envoi et
réception d’emails, réseaux sociaux, itinéraires, téléchargement de jeux, lecture de
vidéos, achats en ligne… sont autant d’actions rendues possibles pour quiconque
possède un smartphone à portée de main. Si Big Brother n’est qu’un fantasme pour
certains ou une réalité pour d’autres, la réalité de la mémorisation automatique de
chaque action de chaque utilisateur est une réalité. Lorsque une personne interagit sur
un réseau social tel que Facebook ou Twitter tous les tweets, statuts, partage
d’informations avec sa communauté ou " Like " sur une page d’une marque sont
enregistrés. Si la majorité des utilisateurs ne prêtent que peu d’importance aux
informations qu’ils rendent ainsi disponibles, ce n’est pas le cas des géants d’internet
qui exploitent et analysent ces données afin de définir le profil de l’utilisateur, de
pouvoir le cibler et lui proposer les contenus et les publicités les plus adaptés.
C. La règle des 3 V
Comme le rappelle Jean-Charles COINTOT dans son ouvrage La Révolution Big data,
le big data c’est bien évidement le traitement de très gros volumes de données. Mais
le big data est avant tout chose le traitement de très grosses données qui proviennent
surtout de différentes sources. « Analyser les millions d’enregistrements stockés dans
un entrepôt de données traditionnel, ce n’est pas du big data, c’est une analyse
volumineuse 9 ». C’est uniquement lorsque l’on croise diverses sources d’informations
dans des volumes de données importants que l’on peut parler de big data. Par
exemple : « Combiner les informations de consommation des clients stockées dans
un entrepôt de données avec les logs de navigation sur les sites Web et les
enregistrements de discussions d’un centre d’appel pour essayer d’anticiper le départ
d’un client, c’est du big data quelle que soit la taille des sources d’information.9 »
8 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le03/06/15]. Disponiblesur
Internet : http://www.cbnews.fr/etudes/toujours-plus-de-smartphones-et-tablettes-selon-mma-france-
a1013528
9 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 36. ISBN: 978-2-10-071142-0
6
D’après des spécialistes d’IBM, les big data se définissent par 3 propriétés qui les
caractérisent à divers degrés. On les appelle les 3 V pour : volume, vélocité, variété et
qui sont représentés dans le schéma suivant :
Figure 2– les 3V des big data - d'après le site internet blog.sqlauthority.com [en ligne] [consulté le 15/06/15] disponible
sur internet http://blog.sqlauthority.com/2013/10/02/big-data-what-is-big-data-3-vs-of-big-data-volume-velocity-and-
variety-day-2-
1. Volume
Le terme anglais « Big data » se traduit par grosses données en français ou
« mégadonnées 10» plus exactement comme cela a été décidé par la commission
générale de terminologie et de néologie le 22 août 2014 dernier. L’important volume
10 JOURNAL DU NET [en ligne]. [Consultéle 01/06/15].Disponiblesur Internet :
http://www.journaldunet.com/solutions/dsi/big-data-megadonnees-0814.shtml
7
de données est la caractéristique première des big data et également la première
caractéristique qui vient à l’esprit lorsque l’on en parle. La capacité de traiter de très
larges quantités de données est l’un des principaux avantages des big data. Comme
le déclare Forbes11, avoir plus de données bat avoir des meilleurs modèles : si vous
deviez prévoir la météo, auriez-vous de meilleurs résultats en prenant en compte 300
facteurs ou seulement 6 facteurs. La réponse semble évidente. « Dans une approche
statistique basée sur l’échantillonnage, il faut savoir ce que l’on cherche pour que
l’échantillon soit représentatif. Dans une approche big data, il n’est pas besoin de
faire des hypothèses préconçues puisqu’on a toutes les données. L’important n’est
pas de réduire la taille des données à analyser mais au contraire d’associer le plus de
données possibles relatives de près ou de loin au phénomène que l’on souhaite
analyser. Plus il y aura de données, plus on a de chance de trouver une information
passée jusque-là totalement inaperçue. 12»
Le volume représente également l’un des principaux challenges pour les services IT
des sociétés. Avec l’apparition de nouveaux formats de données telles que les
données des réseaux sociaux, les données de navigation sur les sites internet, les
mobiles, la géolocalisation, les vidéos… etc de nombreuses entreprises ont acquis des
Terabytes voire des Petabytes de données dans leurs serveurs. Beaucoup de sociétés
possèdent parfois sans le savoir de vastes quantités de données archivées, parfois
sous forme de log mais peu d’entre elles possèdent les capacités de les traiter. La
problématique des sociétés face aux big data n’est donc pas de créer des données
mais plutôt de les regrouper et de les exploiter entièrement afin de pouvoir extraire
l’information qui sera passée jusque-là inaperçue.
Pour la plupart des données comme les informations relatives à l’identité d’une
entreprise ou d’une personne, elles sont statiques. D’autres, comme les échanges
entre les membres d’un forum ou d’un blog ont une fréquence de rafraîchissement
« assez faible allant de l’heure à la journée, d’autres enfin, comme les tweets, les
données de géolocalisation sont très dynamiques. Il faut pouvoir les traiter au fil de
l’eau. C’est la vélocité, deuxième caractéristique du big data.12 »
11 JOURNAL DU NET [en ligne]. [Consultéle 01/06/15].Disponiblesur Internet :
http://www.forbes.com/sites/oreillymedia/2012/01/19/volume-velocity-variety-what-you-need-to-know-
about-big-data/2/
12 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 45. ISBN: 978-2-10-071142-
8
2. Vélocité
Dans le passé, la vitesse de création des données ne nécessitait une mise à jour de
la base que tous les jours, voire toutes les semaines. Aujourd’hui, avec l’émergence
d’internet, sont apparus les réseaux sociaux et avec l’apparition des smartphones, sont
apparues les applications mobiles, ces deux vecteurs sont les principales causes de
la création en continu et en quantité importante de données. Les sociétés qui sont
capables de traiter et d’analyser en temps réel ce qui se passe et réagir en fonction
possèdent un avantage concurrentiel certain. C’est le cas du secteur de la finance qui
a depuis longtemps déjà mis des outils pour traiter l’information des marchés en temps
réel. Aujourd’hui des sociétés telles que Amazon ont également mis en place des outils
pour analyser en temps réel la navigation de leurs clients afin de leurs préconiser des
produits susceptibles de les intéresser en se basant sur les produits visités par d’autres
clients ayant le même profil.
3. Variété
Dans l’ouvrage récompensé du titre Bestseller par le Wall Street Journal et The New
York Time de Viktor Mayer-Schönberger et Kenneth Cukier intitulé Big Data: A
Revolution That Will Transform How We Live, Work, and Think 13 les auteurs
expliquent comment tout devient donnée. Ils appellent ce phénomène la datafication.
En effet avec le big data on ne se contente plus de traiter uniquement des données
mesurables et quantifiables bien organiser dans les lignes et colonnes de tableaux
Excel. Avec le big data le format des données n’a plus d’importance, texte, vidéos,
emails, sms, tweet, pdf, données brutes depuis un capteur… etc, toutes les données
peuvent être traitées. Si la donnée est un texte qui n’est pas tapé directement par un
outil de saisie alors il faudra lire l’image numérique avec des outils de reconnaissance
optique. « Par cette opération de traitement du texte brut, celui- ci est devenu une
donnée analysable, réutilisable, agrégeable à d’autres données pour tout type de
traitement. C’est ainsi que les blogs, les forums, les réseaux sociaux sont devenus de
vrais gisements d’informations sur les sentiments, les envies, les irritants, les
13 Viktor MAYER-SCHÖNBERGER ; Kenneth CUKIER. BIG DATA: A REVOLUTION THAT WILL TRANSFORM HOW
WE LIVE, WORK, AND THINK. John Murray.2013. ASIN: B00GOHL9H6
9
préférences, les intentions d’achat de leurs abonnés. 14 » Ce processus peut
également être adapté à d’autres formats de données, Jean Charles COINTOT donne
un exemple concret de la manière dont une donnée telle que le son peut être
numérisée grâce à des outils de reconnaissance vocale comme le sont par exemple
Siri sur l’Iphone ou Google Voice Search. « On peut imaginer un abonné à un service
de télévision connectée qui se plaint de n’avoir pas pu regarder correctement un film
loué en vidéo à la demande, parce que la qualité de l’image était très mauvaise. La
reconnaissance vocale pourra déterminer qu’il n’est pas content, qu’il y a un problème
de qualité d’image et de le codifier sous forme de données. Ces données seront
combinées avec celles du réseau de l’opérateur pour vérifier qu’il y a bien un problème
de qualité et, grâce aux informations du client pour vérifier qu’il a bien loué la vidéo
dont il parle. On accédera peut-être également à son historique, pour savoir si c’est
la première fois que cela lui arrive, ou si c’est un problème récurrent sur cette ligne.
Ces recherches permettront au conseiller clientèle de savoir s’il s’agit d’un fraudeur et
donc de l’éconduire ou, à l’opposé, de reconnaître un client malchanceux et lui
proposer d’éventuelles compensations. Aujourd’hui, en général, le conseiller sait qui
vous êtes et connaît vos abonnements, mais n’a aucun moyen de savoir si ce que vous
dites est vrai – sauf s’il y a une panne générale de secteur. Si la mauvaise qualité de
votre expérience est due à un phénomène plus fin, il ne le sait pas.15 »
Le big data comporte trois types de données :
- Les données structurées qui correspondent à « l'ensemble des valeurs
possibles est déterminé et connu à l'avance. Par exemple, dans une base de
données rassemblant les résultats d'une enquête d'opinion, l'âge ou la catégorie
socioprofessionnelle des individus interrogés sont des données structurées, car
les tranches d'âges ou la liste des catégories socioprofessionnelles possibles
sont déterminées a priori. 16»
- Les données semi structurées qui regroupent les structures de description de
contenu comme le HTML ou le SGML qui n’ont pas de champ rigide mais qui
14 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 49. ISBN: 978-2-10-071142-0
15 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 51. ISBN: 978-2-10-071142-0
16
SYNOMIA [en ligne]. [Consultéle 02/06/15]. Disponiblesur Internet : http://www.synomia.fr/fr/vision-et-
techno/synomia-menu-la-data-non-structuree
10
possèdent des balises délimitant des champs. L’information n’est pas organisée
mais possède toutefois une structure identifiable.
- Les données non structurées, ou données complexes. Ce sont l’ensemble des
données comme le texte ou les images ou encore les enregistrements sonores
qui ne possèdent aucune structure identifiable et aucune logique d’organisation
d’un point de vue d’un ordinateur.
D. Les outils des big data
Nous avons étudié les différents bénéfices que pouvaient tirer chaque société en
fonction de leur industrie, nous avons également analysé les avantages des big data
pour les différents services d’une entreprise. Nous allons maintenant nous attarder sur
les différents outils qui compose le big data. En effet nous avons pu commencer à
apercevoir que le big data n’est pas uniquement un logiciel ou un moteur de recherche
qu’on lancerait et qui nous donnerait la réponse à toutes nos problématiques, les big
data sont complexes, lourds à mettre en place et les solutions qui le composent sont
aussi diverses que variées.
1. Infrastructure réseau
Dans les big data nous l’avons vu, le premier V est volume. C’est-à-dire que la quantité
de données est imposante. « Les avantages potentiels du Big Data côtoient la
nécessité d’accomplir des progrès significatifs sur le plan des infrastructures de
stockage et réseau nécessaires pour accompagner son essor. C’est le cas des
caméras de sécurité. Dans les aéroports, les responsables de la sécurité commencent
à envisager la possibilité de passer au format UltraHD ou 4K. Une telle résolution
permet de rechercher facilement des informations précises et détaillées dans les flux
vidéo, remplaçant les images noir et blanc granuleuses tout en réduisant les risques
de sécurité.
11
Tout en respectant les données de confidentialité et l’anonymat des personnes, il est
également possible d’utiliser des caméras 4K pour analyser le comportement des
consommateurs ou la circulation des piétons. Car ce format n’est pas réservé aux
téléviseurs XXXL présentés au salon au salon CES de Las Vegas !
Or, la résolution 4K exige un socle particulièrement solide. Une seule minute au format
4K représente environ 5,3 Go ! À Londres par exemple, 7 000 caméras de
vidéosurveillance en 4K généreraient chaque jour quelque 52 pétaoctets, soit plusieurs
fois le volume de données stockées dans la bibliothèque du Congrès de
Washington. 17»
Avec les big data la problématique du stockage des masses de données rentrent donc
en compte. Mais ce n’est pas la seule problématique, même si aujourd’hui les solutions
de stockage à bas coût existent, telles que la sauvegarde sur des serveurs, les
technologies du big data nécessitent aussi des systèmes d’infrastructures réseaux
agiles avec des capacités d’écriture et de calcul élevées.
2. Les bases de données
Avec l’apparition des big data nous l’avons vu, est également apparu une très grande
variété de données. Ces données peuvent provenir de différentes sources, comme les
réseaux sociaux, des capteurs, les forums, mais aussi des conversations qui sont
numérisées. Ces données brutes sont donc dites non structurées, c’est-à-dire qu’elles
n’ont pas d’organisation, et ne peuvent pas être ordonnées afin de faciliter leur
traitement. Afin de pouvoir les analyser il a alors été nécessaire de créer d’autres
formats de stockage. Initialement, les données étaient stockées dans des bases de
données dites classique en SQL.
« SQL est l’acronyme de Structured Query Language. Il est connu depuis longtemps
de tous les acteurs de l’informatique qui ont eu à rechercher rapidement des
informations dans de grosses bases de données relationnelles (SGBD). Dans les
années 90, certains commerciaux dans des compagnies de logistique n’avaient ni
17 JOURNAL DU NET [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet :
http://www.journaldunet.com/solutions/expert/61369/big-data--la-3eme-phase.shtml
12
souris ni écran graphique, ni interface utilisateur pour rechercher certaines
informations stockées sur des serveurs souvent distants et reliés par des lignes
spécialisées : ils entraient au clavier des commandes SQL et étaient capables de
répondre à leur client sur la disponibilité de tel ou tel camion ou train en quelques
secondes. SQL est aujourd’hui largement utilisé, car étant un des dispositifs
d’organisation et d’interrogation de bases de données le plus structuré et le plus rapide
; il se décline sous différentes appellations qui montrent qu’il y a des adaptations
diverses comme c’est notamment le cas de MySQL d’Oracle qui est le plus gros
concurrent de SQL de Microsoft. 18»
Pour les utiliser les données non structurées du big data, est apparu à partir de 2009
le terme NoSQL qui ne signifie pas "non SQL" mais plutôt "not only SQL".
« Les bases de données NoSQL adressent des enjeux différents de ceux des bases
de données relationnelles historiques. Ces bases de données de type NoSQL viennent
compléter (et non pas remplacer) les bases de données relationnelles qui se heurtaient
à des limites d’évolutivité et de performances dans des environnements de données
massives.
Avec la prolifération annoncée des objets connectés qui vont être autant de sources
de nouvelles données, la gestion de bases de données massives se posera de
manière accrue.
Les bases de données NoSQL se différencient du modèle SQL par une logique de
représentation de données non relationnelle qui se caractérise en général par : 38»
 « D’importants volumes de données structurées et non structurées 38»
 « Une multitude de requêtes simultanées 38»
 « Une forte évolutivité de type scale out (évolution horizontale par rajout de
serveurs) 38»
 « De hautes performances 38»
18 JOURNAL DU NET [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet : http://blog.ontrack.fr/big-data-
pourquoi-nosql/
13
 « Pas de schéma (schema less). La base de données n’impose pas de
définition des éléments au sein d’un ensemble de données. 19»
Ce format beaucoup plus flexible c’est aujourd’hui imposé dans le domaine des big
data, comme un des formats de référence pour traiter les données complexes dans de
grand volume. D’autres formats de données ont également étaient développés par des
géants de l’informatique tel que le NewSQL développé par Google.
3. Hadoop et les outils de découvertedes
données
Les problèmes d’infrastructures résolus et les difficultés de stockage des données non
structurées traitées il a fallu également développer des outils capables d’aller organiser
et analyser ces vastes données. Pour les géants du web tels que Google, Yahoo,
Facebook, Ebay… il est très vite devenu primordial pour eux de trouver une solution
rapide et peu coûteuse capable d’aller organiser leurs données et d’en retirer les
informations voulues.
Il existe de nombreuses solutions sur le marché des big data, mais la solution la plus
commune est l’outil développé en Open Source : Hadoop.
Hadoop est une solution développée par Yahoo se basant sur des recherches de
Google. Hadoop n’est pas une solution en elle-même c’est davantage une plate-forme
composée de différents programmes comme on peut le voir sur le schéma suivant :
19 DATA BLOG [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet :
http://entreprisesnumeriques.co/2015/02/12/le-big-data-exigera-des-bases-de-donnees-nosql-quelles-
repoussent-encore-leurs-limites/
14
Figure 3 - Vue synthétique de l'outil Hadoop - d'après le site internet DATACONOMY [en ligne] [consulté le 19/06/15]
disponible sur internet - http://dataconomy.com/hadoop-components-need-know/
Les 4 modules principaux qui composent l’outil sont :
- Hadoop Distributed File System (HDFS) : « HDFS est comme son nom
l’indique un système de fichiers distribué, c’est-à-dire que chaque machine
composant la grille Hadoop (cluster en anglais) va héberger une partie des
fichiers. Pour simplifier, on peut comparer HDFS à un RAID logiciel distribué
sur plusieurs serveurs. Ce système de fichiers possède une capacité
d’hébergement parfaitement linéaire (chaque octet de disque ajouté à la grille
peut participer à l’hébergement des fichiers), une forte tolérance à la panne, par
défaut, chaque fichier est présent en trois exemplaires distribués sur des
machines, des racks, voire des data-centers différents. De la même façon,
chaque machine apporte ses capacités en I/O au cluster et la grille est donc
capable d’absorber rapidement de grandes quantités d’écriture. 20»
- MapReduce 21 : cet outil trouve son nom d’après les deux opérations qu’il
réalise. La lecture des informations dans la base de données, et la mise en
forme dans un format adapté pour l’analyse (Map), puis le rassemblement des
informations et leurs analyses pour donner un résultat simplifié (Reduce).
20 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet:
http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert-magazine/
21 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet:
https://www.linkedin.com/pulse/20140709061649-64875646-what-the-heck-is-hadoop-and-why-you-should-
know-about-it?trk=mp-author-card
15
- Hadoop Common 40: un outil permettant aux utilisateurs de lire les données
stockées sous le système Hadoop files.
- YARN 40: ce logiciel gère les ressources du système de stockage des données
et des analyses.
Hadoop est un outil utilisé par la plupart des sociétés traitant des grandes quantités de
données car c’est un outil très flexible et très peu coûteux comme il est en open source,
c’est-à-dire que tout le monde peut le modifier librement, et qu’il fonctionne sur tous
les serveurs informatiques, mêmes les bas de gamme.
4. Machine learning
En 1959, Arthur Samuel a défini le machine learning comme un champ d’étude qui
donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés.22
Si le machine learning est bien antérieur aux big data c’est bien grâce au
développement de ces derniers qu’il a retrouvé tout son intérêt. « Le machine learning
consiste à construire des systèmes qui apprennent les données qu’ils reçoivent.
Autrement dit, à partir d’un comportement initial, les algorithmes de machine learning
sont capables de se corriger et d’évoluer en fonction des faits dont on les alimente.
Ces systèmes sont le plus souvent basés sur des modèles mathématiques, comme
les réseaux bayésiens naïfs ou les réseaux neuronaux, pour lesquels on va chercher
un paramétrage optimal. La construction d’un système comporte ainsi deux phases.
La phase initiale consiste à entraîner la machine, à partir d’un jeu de données connu.
Une fois le système entraîné, il faut le confronter au monde réel et l’évaluer
régulièrement afin qu’il se corrige et s’améliore à chaque nouvelle donnée reçue.23»
Parmi les utilisateurs du machine learning couplé aux big data on retrouve notamment
Amazon. Son moteur de recommandation qui suggère les articles les plus pertinents
22 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet:
http://dataconomy.com/understanding-big-data-machine-learning/
23 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet:
http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert-magazine/
16
pour l’internaute en fonction de ses articles précèdent visionnés "apprend" au fur et à
mesure qu’il propose des articles et suivant les actions de l’internaute.
Si le machine learning trouve tout son intérêt avec les big data c’est parce qu’avec la
masse de données, et l’évolution des puissances de calcul, le machine learning permet
d’améliorer avec signification la pertinence des prévisions des systèmes apprenant.
5. Les outils de visualisation
Les big data n’ont aucun intérêt si l’analyse des résultats qu’ils fournissent n’est pas
compréhensible par une personne humaine. Comme l’explique Jean-Charles
COINTOT dans son ouvrage, « les représentations classiques de l’analyse descriptive
par des courbes, pour les séries temporelles, par des histogrammes pour les variables
continues, bâton pour les variables discrètes, camemberts pour les pourcentages ne
sont plus suffisantes. Elles étaient prévues pour des modèles à deux voire trois
dimensions maximum. 24». Avec les big data la quantité d’informations à communiquer
est beaucoup plus complexe. C’est pourquoi de nouveaux modèles de visualisation
des informations ont dû être développé tel que les étoiles, les cubes ou encore les
heatmap. Les heatmap sont des cartes qui représentent les zones où les données
analysées sont les plus élevées. Les heatmap sont particulièrement utiles pour
représenter du parcours client dans les rayons des magasins comme c’est le cas sur
l’image suivante. En utilisant les big data on peut ainsi représenter de façon concrète
le parcours des clients étant également actifs sur les réseaux sociaux et ayant une
carte de fidélité dans le magasin.
24 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 70. ISBN: 978-2-10-071142-0
17
Figure 4 - Heatmapdu parcours client dans un magasin - d'après le site internet TYCO RETAIL SOLUTIONS [en ligne]
[consulté le 24/06/15] disponible sur internet -
http://www.tycoretailsolutions.com/Pages/ArticleDetail.aspx?ItemId=639
6. Les compétences humaines
Les big data nécessitent des compétences en mathématique et en statistiques
avancées. Il est également nécessaire d’avoir des compétences avec les outils
informatiques, mais également comprendre les enjeux marketing afin de pouvoir
produire des analyses permettant aux directions de l’entreprise de prendre des
décisions. Un nouveau profil de spécialiste des big data est apparu, le data scientist.
D’après IBM, le data scientist est une évolution des postes de data analyst, c’est-à-
dire que son rôle est d’analyser des données pour faire apparaitre des modèles et de
corrélations entre des évènements qui n’étaient pas identifiables à une petite échelle
mais qui sont significatifs. La différence, selon IBM, entre un data analyst et un data
scientist réside dans la capacité de ce dernier d’explorer les données de différentes
18
bases de données tandis que le data analyst tirera ses analyses d’une seule base tel
qu’un CRM 25.
Si le data scientist est au cœur des enjeux du big data c’est l’ensemble des
collaborateurs autour des projets big data qui doivent posséder des compétences en
la matière. En effet même si le data scientist doit être capable de communiquer avec
les dirigeants de l’entreprise et leurs fournir des analyses compréhensibles, ces
derniers doivent être en adéquation avec la stratégie big data afin de pouvoir utiliser
tous les avantages qu’ils offrent.
7. Benchmark des solutions
Il existe aujourd’hui une multitude de solutions sur le marché en France. Certaines clés
en main, d’autres en open source, ou encore en mode SaaS, c’est-à-dire que toute la
solution est dématérialisée et passe par le cloud. Dans le mapping suivant, extrait
d’une étude réalisée par le cabinet Markess International, on distingue clairement les
différentes catégories de solutions correspondants aux différents outils qui composent
les projets de big data.
On retrouve logiquement tous les géants de l’IT qui ont très rapidement créé ou acquis,
par l’achat de startup prometteuses, des solutions dédiées aux big data dans ce
marché qui est un marché d’avenir et représentant un chiffre d’affaire très important.
Dans les acteurs incontournables on retrouve notamment IBM, le géant des solutions
informatiques qui propose des solutions à tous les niveaux du projet, de l’infrastructure
réseau, à la business intelligence en passant par la gestion des données. La société
Apache avec sa technologie Hadoop est également très présente tout comme SAP,
Oracle, Microsoft ou encore Capgemini et même Amazon avec son offre hébergé dans
le cloud.
25 IBM [en ligne].[Consulté le 24/06/15].Disponiblesur Internet : http://www-
01.ibm.com/software/data/infosphere/data-scientist/
19
Figure 5 - d'après une étude de Markess International : Meilleures approches pour tirer parti du Big Data [en ligne]
[consulté le 24/06/15] disponible sur internet : http://blog.markess.fr/2014/09/referentiel-de-pratiques-big-data-
strategies-de-gouvernance-des- donnees.html
20
II. Les différents usages du big data
Nous avons vu qu'une stratégie big data une fois implémentée dans une entreprise
devait lui permettre de gagner de la valeur. Cela ne signifie pas que les big data
peuvent uniquement servir dans une stratégie visant à augmenter le chiffre d’affaire
de l’entreprise. En effet l’utilisation des big data peut avoir lieu à tous les niveaux d’une
entreprise de la chaîne de production au marketing et surtout pour toutes les industries
du secteur de la santé à l’agriculture en passant par le monde de la finance.
A. Le secteur des télécommunications
Le secteur des télécommunications est au cœur du digital. Les opérateurs
téléphoniques ont accès à des bases presque illimitées de données. Bien que la
plupart ne soit pas exploitable notamment pour des questions d’ordre juridique sur les
données privées, la plupart des données qui transitent par les téléphones, télévisions
sur IP et antennes relais sont stockées et analysées. Les opérateurs ont pendant
longtemps été en retard sur la connaissance de leurs clients car ils ont vécu pendant
les vingt dernières années sur un marché en croissance constante, générant de fortes
marges et avec une concurrence faible. Aujourd’hui, de nouveaux entrants ont fait leur
apparition et les clients sont beaucoup plus attentifs aux prix du marché. C’est pourquoi
les opérateurs ont mis à profit les bases de données comportant toutes les
informations sur les clients afin de chercher à comprendre leurs attentes.
« Fidélisation, connaissance client, système d’engagement sont devenus le crédo de
la profession. Au-delà de la fidélisation, les opérateurs cherchent à prédire la
probabilité qu’un client décide de passer chez un concurrent et à réagir
en conséquence. Ils ont un avantage sur les autres industries dans la mesure où
toutes nos communications passent par leur réseau et génèrent des CDR ( call detail
records ) dont ils ont connaissance. Ainsi grâce aux technologies big data, il est
possible de croiser l’analyse de ces enregistrements pour un abonné, sa
navigation sur les sites Web, l’enregistrement éventuel de ses conversations avec le
centre d’appel et de support et les « posts » envoyés sur des réseaux sociaux, afin de
les combiner avec des analyses plus traditionnelles de type sociodémographique pour
21
en déduire des comportements « à risque » du point de vue de l’opérateur26», c’est-à-
dire le risque qu’un client ne quitte l’opérateur pour aller chez un concurrent. En
analysant le profil du client, l’opérateur est alors capable de mettre en place des
actions marketing personnalisées afin de retenir le client chez lui.
Outre les avantages marketing du big data pour les opérateurs de télécommunication,
le big data permet aussi aux acteurs de ce secteur de gérer plus efficacement
l’optimisation du réseau, et plus exactement la qualité du service et l’optimisation
automatique des réseaux. Auparavant les opérateurs disposaient uniquement des
informations transmises par les antennes qu’ils possédaient. Avec les big data, ils sont
désormais capables de traiter en temps réel des informations semi structurées telles
que celles fournies par les terminaux des utilisateurs ainsi que celle de leur propre
réseau. Le big data permet même d’aller encore plus loin. En utilisant les informations
concernant les pannes passées et les actions humaines qu’il a été nécessaire de
réaliser pour réparer le problème les machines "apprennent", et sont capables de
réaliser elles-mêmes les actions correctives sans qu’un humain n’est besoin
d’intervenir. Les pannes sont ainsi évitées ou réparées instantanément avec un taux
d’erreurs très faible fournissant ainsi une qualité de service optimale et constante à
l’ensemble des usagers.
B. Le secteur de l’énergie
Le secteur de l’énergie est un des secteurs les plus stratégiques tant par la
dépendance de la population mondiale à l’électricité au quotidien mais également par
la prise de conscience mondiale quant aux dangers d’une surexploitation des
ressources énergétiques fossiles et nucléaires. Depuis plusieurs années déjà, les
gouvernements ont pris conscience de l’enjeu énergétique et déploient des efforts
importants afin de réduire la production des gaz à effet de serre et de développer
l’utilisation des énergies renouvelables. L’un des principaux défis énergétiques est de
réguler la production d’électricité afin qu’elle soit le plus proche possible des besoins
réels. Actuellement l’électricité est produite en fonction de prévisions et des analyses
26 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 149. ISBN: 978-2-10-071142-0
22
plus ou moins précises des besoins de la population. De l’électricité est envoyée sur
le réseau et tout ce qui n’est pas consommé est perdu. Afin de réduire ces pertes et
de diminuer la production d’énergie des réseaux dit intelligents ont été mis en place,
on les appelle également « smart grid ». Ces réseaux ont la particularité d’être dotés
de capteurs qui transmettent en temps réel des données sur la consommation et la
distribution de l’énergie. « Les données captées sont remontées à un niveau local,
régional ou central et analysées avec des technologies de big data pour réguler
manuellement ou automatiquement le réseau et ses différents niveaux.27»
L’utilisation des big data permet donc d’optimiser la production, les grosses centrales
électriques produisent de l’électricité en continu et leur production ne peut pas être
modifiée instantanément mais la production locale de l’énergie renouvelable peut plus
facilement être modulée et redirigée vers d’autres réseaux si besoin. Grâce à l’analyse
des besoins et contraintes des tous les acteurs l’acheminement, le transport et la
distribution seront également améliorés. En utilisant les données météorologiques il
est possible de calculer les capacités de production en énergie solaire et éolienne au
niveau local, et les besoins en énergie en fonction de la connaissance de la
consommation locale et ainsi d’améliorer la répartition des unités de production en
incluant les productions des particuliers.
De plus en plus de compteurs intelligents, c’est-à-dire qui remontent l’information
presque instantanément aux fournisseurs sont installés chez les consommateurs. Ces
données permettent aux fournisseurs de mieux comprendre la consommation des
clients et en croisant ces informations avec d’autres informations d’adapter leurs offres
tarifaires.
C. Le secteur bancaire
A l’instar du secteur des télécoms, les banques possèdent énormément de données
sur les clients. Mais leur avantage avec les opérateurs téléphoniques est qu’elles
possèdent des données relatives aux habitudes et aux comportements de
consommations des clients, règlement par carte ou par chèque, retrait, emprunt,
27 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 157. ISBN: 978-2-10-071142-0
23
assurance, épargne, mais aussi les grandes étapes dans la vie des clients telles que
la construction d’une maison, la naissance d’un enfant, le mariage… autant de
données dites privées qui sont disponibles aux banques. D’après certains analystes,
les sociétés gérants les cartes de paiement telles que Visa, ou American express
« surveillent désormais les transactions pour savoir si vous présentez le profil de
quelqu’un qui s’apprête à divorcer. 28»
Si le secteur bancaire regroupe une vaste communauté de métiers très divers et variés
tels que les investissements, les banques privées ou publiques, les banques de détails,
nous allons nous intéresser principalement aux banques de détails.
Le premier avantage des big data pour les banques est la meilleure compréhension
de leur clients. Aujourd’hui plus encore les banques n’offrent pas uniquement un
moyen de protéger son argent. Les banques offrent des services personnalisés qui
répondent à de nombreux besoin de leurs clients, prêts à la consommation et à moyen
et long terme : assurances, compte courant, différents moyens de paiement (carte de
crédit, carte de paiement, chéquier, paiement en ligne sécurisé,…) mais également
différents moyens d’interactions tels que les agences, les centres d’appels, les
distributeurs automatiques, les sites internet… En analysant l’ensemble des
informations recueillies sur les habitudes de leurs clients, les banques sont capables
de fournir un service adapté avec des offres adaptées aux besoins des clients.
D’après Gartner 29, les big data sont une des clés pour permettre aux banques de
résoudre leurs problèmes de fraudes et de sécurité. Toujours selon eux, l’analyse des
big data permet aux sociétés de combiner et croiser des données internes et externes
afin de pouvoir voir une image plus large des menaces contre leur entreprise. Pour les
banques il est essentiel de pouvoir le plus rapidement possible, accepter ou refuser
une transaction, en identifiant correctement s’il y a fraude ou non sans mettre en place
des contrôles trop lourds qui rebuteraient les bon clients. En utilisant les capacités des
28 REINFORMATION.TV [en ligne].[Consulté le17/06/15]. Disponiblesur Internet : http://reinformation.tv/big-
data-surveiller-achats-predire-divorce-reve-visa/
29 GARTNER [en ligne].[Consulté le 16/06/15].Disponiblesur Internet :
http://www.gartner.com/newsroom/id/2663015
24
big data les banques pourraient ainsi réduire considérablement les risques de fraudes
bancaires qui coûtent près de 100 milliards de dollars par an 30.
D. Le secteur du commerce
Pour l’auteur de l’ouvrage La révolution du big data, « Le commerce est sans doute le
secteur où le big data va le plus révolutionner les pratiques. Que ce soit pour la gestion
des magasins ou des sites marchands, la gestion du programme de fidélité, des
promotions, des réassorts, ou encore de la logistique, son usage impacte toutes les
activités du commerce. Cette révolution est en marche aux États- Unis, et démarre en
France. 31»
Pour les distributeurs, l’utilisation des big data impacte leur secteur sur trois axes
essentiellement :
- La gestion des stocks
- Le ciblage des produits pour les clients
- L’assortiment des magasins et des rayons
Le premier point, la gestion des stocks, se rapproche des avantages que tire
également le secteur de la logistique car tous comme les acteurs de ce secteur il est
très important pour les distributeurs d’avoir suffisamment de produits en stock pour ne
pas avoir de pénurie, ce qui peut entraîner le mécontentement des clients, sans non
plus avoir trop de stock, ce qui engendre des coûts supplémentaires. Grâce aux big
data, les distributeurs peuvent désormais analyser les données de diverses sources
afin de prévoir les ventes. Ils peuvent par exemple mettre en corrélation leurs propres
actions marketing ainsi que celles des concurrents, prendre en compte les
informations glanées sur les réseaux sociaux sur les humeurs et les tendances
30 THE GUARDIAN [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet :
http://www.theguardian.com/technology/2013/oct/30/online-fraud-costs-more-than-100-billion-dollars
31 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 181. ISBN: 978-2-10-071142-0
25
d’achats des clients, tenir également compte de la météo qui influe sur les achats des
consommateurs et incorporer les facteurs locaux tels que les matchs ou les festivals.
L’autre avantage des big data est, tout comme pour les secteurs que nous avons
étudié précédemment, la connaissance client. A l’inverse du secteur bancaire qui
possède des informations sur l’ensemble des habitudes d’achat des consommateurs,
les chaînes de magasins possèdent uniquement des informations sur les achats
effectués dans leurs rayons. Toutefois le niveau de détail de ces informations est
beaucoup plus détaillé car les distributeurs ont accès aux tickets de caisse et donc, au
détail des produits qui composent le chariot de leurs clients. Grâce aux cartes de
fidélités, les magasins ont également la possibilité d’identifier les clients, ils peuvent
ainsi réaliser des offres promotionnelles ciblées. Avec l’avènement du e-commerce, le
client s’identifie pour faire ses courses en ligne ou les cookies de son ordinateur
permettent de l’identifier précisément. Pour le reste le principe est le même, à savoir
identifier le profil du client afin de mettre en avant les produits qui seront le plus
susceptibles de les intéresser afin de leurs faire consommer d’avantage.
Dernière utilisation pour les distributeurs des big data, l’analyse des déplacements des
clients dans les rayons, le temps passé devant chaque rayon, ses arrêts, ses achats.
Depuis toujours les magasins tentent de trouver le meilleur arrangement de leurs
rayons afin que le client puisse passer devant les produits qu’ils souhaitent mettre en
avant. En utilisant les données de géolocalisation de leur smartphone par exemple ou
grâce à des caméras et des capteurs situés dans les magasins les géants de la
distribution peuvent désormais analyser les données des déplacements et croiser ces
informations avec la composition des achats des clients.
E. Le secteur public
Le secteur public entend également tirer parti des avantages des big data. Dans une
étude de Markess, cinquante-trois décideurs d’organisations publiques interrogés
26
déclarent avoir des projets en cours sur l’utilisation des big data32. Si les contraintes
sont nombreuses, protections des données publiques, contraintes juridiques sur les
données personnelles, harmonisation des échanges entre les services, les avantages
de la mise en pratique de l’analyse des big data pourraient permettre au gouvernement
de faire des économies importantes. Les administrations ont accès à des sources
d’informations riches et variées, des données socio-démographiques de leur ville, aux
informations de la sécurité sociale en passant aux trafics routiers et les transports en
commun. Le gouvernement entend également ouvrir ces informations aux citoyens
afin d’offrir des possibilités de développement de solutions s’appuyant sur ces « open
data 33 ». Pour le gouvernement les avantages sont multiples : Identification des
fraudes fiscales ; Amélioration du système scolaire ; Organisation des territoires, des
systèmes de transport, des services aux citoyens ; mais aussi Diminution de la
criminalité. Les big data sont donc une priorité pour l’état français, comme le prouve le
"plan big data34" amorcée en juillet 2013 par Fleur Pellerin, alors ministre en charge
de l’économie numérique.
L’autre avantage retirer des big data par le gouvernement est indéniablement la
sécurité du territoire. Les Etats Unis en ont fait un fonds de commerce de leur sécurité
et lutte contre le terrorisme, ils exploitent toutes les informations qu’ils peuvent
récupérer sur les citoyens dans le monde entier. D’après un article du monde, « aux
Etats-Unis, avec les trois données que sont le code postal, la date de naissance et le
sexe, 90 % des personnes sont désormais identifiables.35 ». De nombreux scandales
ont démontré que les informations récoltées par les gouvernements ne s’arrêtaient pas
uniquement aux états civils des citoyens : sms, appels, emails, mais aussi profil sur
les réseaux sociaux, géolocalisation, les informations laissées sur la toile par les
citoyens sont une mine d’or pour les services de renseignement et si certaines lois
32 SYNOMIA [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet :
http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-secteur-public-des-
avancees-sensibles/
33 DATA.GOUV.FR [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet :
http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-secteur-public-des-
avancees-sensibles/https://www.data.gouv.fr/fr/
34 01NET.COM [en ligne]. [Consultéle 17/06/15].Disponiblesur Internet :
http://pro.01net.com/editorial/599331/fleur-pellerin-detaille-son-plan-big-data/
35 LEMONDE.FR [en ligne].[Consulté le 17/06/15].Disponiblesur Internet:
http://www.lemonde.fr/idees/article/2015/06/17/faisons-du-big-data-une-chance-pour-l-
europe_4655737_3232.html
27
doivent protéger les données personnelles beaucoup sont franchies au nom de la
sécurité nationale.
F. 4 V et 5 V et…
Les 3 V sont à la base des big data, mais d’autres caractéristiques cruciales des big
data sont apparues avec un quatrième puis un cinquième puis un sixième voire même
un septième V selon certains spécialistes. Parmi les « autres V » que l’on retrouve en
plus des 3 qui forment la base nous pouvons mentionner :
- Véracité (Veracity) qui définit la qualité des données, bien qu'avec les big data
le volume prime sur le manque de qualité, cet aspect reste important afin d’avoir
des analyses justes et précises.
- Variabilité (Variability) à ne pas confondre avec la variété, la variabilité
correspond à la signification des données. Cela est le cas avec l’analyse
d’informations provenant des réseaux sociaux ou des forums, suivant le
contexte un même mot dans un tweet peut avoir une signification différente et
changer complètement le sentiment exprimé.
- Visualisation (Visualization), si la lecture des résultats n’est pas simplifiée et
clarifiée alors l’étude des résultats ne peut avoir lieu.
- Valeur (Value), avoir des big data et les exploiter ne fait pas tout pour une
entreprise c’est une perte de temps et de ressources à moins que l’entreprise
arrive à transformer ses big data en valeur pour son business.
G. Le secteur de la santé
Le secteur de la santé n’échappe pas non plus aux big data. D’après le « docteur Eric
Baseilhac, directeur des Affaires Economiques du Leem, l’un des principaux syndicats
de fabricants de médicaments, l’usage des Big Data dans la santé est une révolution,
28
qui va s’imposer et avoir un impact extrêmement structurant sur le système de santé
en général 36 ». Pour les acteurs de la santé les bénéfices sont nombreux :
- Prévention des épidémies : comme le relate Viktor MAYER-SCHÖNBERGER et
Kenneth CUKIER, en 2009, quelques temps avant la crise sanitaire mondiale du
H1N1, des chercheurs de Google ont publié leurs recherches. Leurs recherches
visaient à développer un outil qui permettrait d’identifier en temps réel l’évolution
d’épidémiesen se basant sur les recherches Google des gens infectés. L’avantage
de cet outil par rapport aux méthodes traditionnelles est le résultat en temps réel
de la propagation des épidémies alors qu’il faut près de 2 semaines pour les
organismes de santé pour recenser les maladies et dresser une carte, déjà périmée
donc, des personnes infectées. Aujourd’hui toujours, leur outil fonctionne est
permet de suivre l’état de la grippe dans le monde sur le site internet dédié :
google.org Flu Trends (http://www.google.org/flutrends).
Si cet outil n’est qu’un prototype de ce qu’il est possible de réaliser en utilisant de
vastes quantités de recherches comme celles que Google possèdent, on imagine
tout le potentiel des prédictions en utilisant les big data et en combinant différentes
sources d’information telles que les réseaux sociaux, les achats de médicaments
en pharmacie, les arrêts de travail, les appels téléphoniques aux urgences. Avec
un algorithme assez puissant et un accès à toutes les informations il est tout à fait
concevable de pouvoir identifier les débuts d’épidémies le plus tôt possible et ainsi
déployer les moyens nécessaires pour les contenir.
- Diagnostiques médicaux : à une échelle plus réduite mais faisant appel à des
données tout aussi nombreuses on retrouve l’utilisation des big data pour soigner
des patients au cas par cas. C’est déjà le cas aux USA, à New York au Memorial
Sloan Kettering Cancer Center plus exactement. Dans cet institut médical les
médecins utilisent un outil créé par IBM, Watson, qui permet d’assister les
spécialistes dans leurs diagnostiques des patients et dans le choix des
traitements.37 Cette technologie repose sur l’analyse de millions de données de
cas passés de patients qui ont été traités. Bien plus qu’un simple assistant, la
36 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://frenchweb.fr/e-sante-
jusquou-ira-le-big-data-pour-nous-soigner/186343#5hLErJ2kvUxMmkgG.99
37 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : https://www.mskcc.org/blog/msk-
trains-ibm-watson-help-doctors-make-better-treatment-choices
29
machine apprend en fonction des nouvelles découvertes médicales du domaine et
améliore ses décisions.
- Prévention médicale : la compréhension du corps humain bien qu’elle ait
énormément évolué depuis le siècle dernier reste encore complexe et de
nombreuses maladies bien qu’elles puissent être traitées une fois identifiées ne
peuvent pas être anticipées. Avec les big data les chercheurs sont capables d’aller
puiser dans des milliards de données patients, du détail de leur génomes jusqu’aux
différents événements de leur vie et trouver des modèles récurrents. C’est ce
qu’explique le docteur Eric Baseilhac « Avec les données, on va être capable de
cibler les bonnes personnes en fonction du risque qu’elles ont de développer telle
ou telle maladie 38»
Le secteur des télécommunications, de l’énergie, bancaire, du commerce, et public ne
sont pas les seules industries d’application des big data. Le big data peut en réalité
s’appliquer à toutes les industries, de l’agriculture au sport, l’étendue de ses
applications n’a pas de limite et il ne serait pas surprenant de trouver les big data dans
toutes les entreprises dans quelques décennies.
De la même manière que chaque industrie pourra trouver des avantages qui lui sont
propres de l’utilisation des big data, le même procédé s’applique aux différents
services d’une entreprise. C’est pourquoi les ressources humaines d’une entreprise
pourront trouver des avantages aux big data qui ne seront pas les mêmes que ceux
que pourra trouver le département marketing ou le service logistique et transport.
H. Ressources humaines
Les ressources humaines sont un des domaines où l’usage de l’IT avait peu sa place.
Pourtant les mœurs sont en train de changer malgré le fait que « La culture IT des
38 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://frenchweb.fr/e-sante-
jusquou-ira-le-big-data-pour-nous-soigner/186343#5hLErJ2kvUxMmkgG.99
30
populations RH frise le zéro absolu 39», comme le déclare le spécialiste d’un cabinet
de conseil en transition numérique. Le capital humain d’une société est la clé de son
succès, sans collaborateurs efficaces et adaptés la plupart des sociétés se verraient
mettre la clé sous la porte rapidement. Le recrutement, la promotion interne, et le taux
de turnover sont trois facteurs essentiels qui peuvent être amélioré par l’utilisation des
big data.
Dans un article du Wall Street Journal de 201240, le journaliste rapporte le cas de la
société Xerox. La société possédait un call center et recrutait les candidats en portant
beaucoup d’importance sur les candidats qui possédaient une expérience similaire. La
société avait un taux de turnover très élevé ce qui lui posait problème car
l’investissement en formation des nouvelles recrues était de $5000 et il fallait que le
nouvel arrivant reste au minimum 6 mois pour que sa formation soit amortie. En
utilisant les big data, la société à découvert que les candidats avec une expérience
similaire n’était pas ceux qui démissionnaient le moins, bien au contraire. L’analyse
des résultats montraient que des candidats avec une personnalité créative été ceux
qui convenaient le mieux au profil du poste. En testant leur nouvelle théorie pendant 6
mois, la société a ainsi réduit de 20% le taux de turn over de ses effectifs. Cet exemple
démontre que en utilisant les big data et en recueillant suffisamment de données sur
le profil des candidats et le profil du poste, le choix des candidats lors d’un entretien
d’embauche peux améliorer le recrutement et donc les performances d’une entreprise.
Certaines sociétés appliquent également les big data pour la promotion et la formation
de leurs employés. En croisant les informations sur les employés, leurs profils
psychologiques, leurs résultats dans l’entreprise, les informations externes à
l’entreprise telles que les réseaux sociaux… etc les sociétés peuvent déterminer quel
candidat est le mieux adapté pour évoluer sur tel ou tel poste ou encore quel employé
a besoin de recevoir telle ou telle formation afin d’être plus performant dans ses
missions.
En France, l’utilisation des big data pour la sélection, ou la promotion des employés
restent encore taboue. Pourtant aux USA, de nombreuses sociétés utilisent déjà ces
39 MYRHLINE [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://www.myrhline.com/dossier-
rh/big-data-et-ressources-humaines/article/le-big-data-en-rh-ca-sert-a-quoi.html
40 WALL STREET JOURNAL [en ligne].[Consulté le 18/06/15].Disponiblesur Internet :
http://www.wsj.com/articles/SB10000872396390443890304578006252019616768
31
technologies41. Même si de nombreux recruteurs ont peur que la machine prenne leur
place dans le recrutement des employés de demain ou s’ils doutent que des chiffres
peuvent remplacer leur intuition, la réalité a prouvé que même les performances des
hommes peuvent être prévisibles et quantifiable grâce à l’analyse de données. Ce
modèle s’applique même au domaine du recrutement de joueurs sportif. Ce fut le cas
dans le monde du baseball aux USA comme le relate le film de Brad Pitt, Moneyball42,
l’histoire des Red Sox de Boston qui ont utilisé l’analyse de données sur les joueurs
afin de constituer l’équipe la plus performante alors même qu’ils ne possédaient pas
un gros budget.
I. Production et logistique
Aujourd’hui de plus en plus de chaînes de production et de logistique sont en partie
voire totalement informatisées. Afin de contrôler le fonctionnement des chaînes de
production et de logistique et d’identifier les défaillances des machines, de nombreux
capteurs, puces RFID, systèmes de localisations sont installés afin de fournir en temps
réel des informations aux opérateurs. Les données sont donc d’ores et déjà présentes
dans les services production et logistique des entreprises. En production, les
directeurs d’usines peuvent utiliser les analyses avancées afin de creuser les
historiques des données des chaînes, identifier des récurrences et relations entre les
différentes étapes des procédés et ensuite optimiser les facteurs qui semblent avoir
les meilleurs effets sur le rendement43 . Pour Jean-Charles COINTOT « dans les
usines, le big data permet de trouver les meilleurs réglages à partir de données réelles
collectées en masse dans le processus de production. Grâce aux outils de
visualisation, il devient possible d’observer ce qu’il se passe lorsque les réglages de
la chaîne de production varient ensemble.44 » Le lancement de nouveaux produits peut
alors être simulé et modélisé et ainsi prévenir de toutes les erreurs de conception que
41 WORK FORCE [en ligne].[Consulté le18/06/15]. Disponiblesur Internet :
http://www.workforce.com/articles/companies-making-hr-big-data-work
42 WIKIPEDIA[en ligne]. [Consultéle 18/06/15].Disponiblesur Internet :
https://en.wikipedia.org/wiki/Moneyball_(film)
43 MCKINSEY [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet :
http://www.mckinsey.com/insights/operations/how_big_data_can_improve_manufacturing
44 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 124. ISBN: 978-2-10-071142-0
32
cela pourrait engendrer. Les big data permettent également de prévenir le
remplacement de pièces, c’est le cas pour Airbus qui utilisent les centaines de capteurs
présents dans ses avions afin d’analyser quelles pièces sont susceptibles de devoir
être changées en fonction de tous les facteurs extérieurs qui peuvent rentrer en
compte, on parle ici de maintenance préventive 45.
Les ressources humaines et la production et logistique ne sont pas les seuls services
de l’entreprise qui peuvent tirer profit des big data. Les services risques et fraudes sont
également amenés à utiliser cette technologie afin de détecter les mauvais payeurs et
d’anticiper les risques liés à leur entreprise. Autre département de l’entreprise très
demandeur des big data, le marketing et vente. C’est dans ce domaine que le
marketing est aujourd’hui le plus utilisé et nous évoquerons ses bénéfices dans un
autre chapitre.
45 L’USINE DIGITALE [en ligne]. [Consultéle 16/06/15].Disponiblesur Internet : http://www.usine-
digitale.fr/article/les-big-data-ouvrent-l-ere-de-l-aeronautique-de-service.N334101
33
III. Big data et marketing
A. Le marketing prédictif et fidélisation
Parmi les avantages liés aux big data pour le marketing on distingue le marketing
prédictif. Si on devait résumer le marketing prédictif dans le monde de l’entreprise, on
le définirait comme l’analyse poussée des comportements actuels des clients ayant
pour objectif final d’anticiper leurs actions et de leurs suggérer des solutions ultra
adaptées.
D’après Yohan Stern, directeur général de Key Performance Group, « la magie du
marketing prédictif, c'est de faire passer les marketeurs de la prédiction basée sur
l'intuition et l'irrationnel à la prévision basée sur des données et des probabilités de
réussite. Traditionnellement, un marketeur utilise son intuition et sélectionne
arbitrairement quelques facteurs, qui doivent, selon toute vraisemblance, permettre de
créer des segments ou des scoring pertinents : l'âge pour tel vêtement de mode, ou,
encore, le sexe pour l'achat de tel produit au chocolat. 46»
Aujourd’hui, le marketeur n’est plus obligé de se baser uniquement sur son intuition
car il a accès aux données internes et externes sur ses clients et prospects en
provenance de différentes sources (réseaux sociaux, email, application mobile, site
web, forum…). En utilisant les puissances de calcul des big data et la capacité de faire
ressortir des corrélations entre des signaux faibles, le marketeur peut s’appuyer sur
des informations concrètes, basées sur des données en temps réel.
Avec un tel outil entre les mains il n’a pas été compliqué pour les marketeurs de trouver
des applications concrètes à leur métier tel que la fidélisation.
46 EMARKETING.FR [en ligne]. [Consultéle 25/06/15].Disponiblesur Internet : http://www.e-
marketing.fr/Thematique/digital-data-1004/Big-Data-10021/Breves/Tribune-Marketing-predictif-quand-Big-
Data-anticipe-actions-consommateurs-252194.htm
34
La fidélisation
Le taux d’attrition, c’est-à-dire le taux de clients qui quittent leur fournisseur pour se
tourner vers un concurrent, a toujours été une des préoccupations principales du
département marketing. Les raisons d’une rupture entre un client et un fournisseur
peuvent être multiples, le client peut trouver un prix plus attractif chez la concurrence
par exemple, il peut aussi ne plus être satisfait par le produit ou le service proposé par
son fournisseur, la relation client peut également s’être détériorée du fait d’une
mauvaise entente encore le client et son commercial, ou encore le client peut avoir
subi de nombreuses pannes ou désagrément avec les produits de la société… Il est
très compliqué de prédire si un client va rester fidèle ou non à son fournisseur et bien
souvent lorsqu’une entreprise s’aperçoit que son client veut la quitter pour la
concurrence il est déjà trop tard et même les actions marketing pour le retenir qu’elle
peut mettre en place ne peuvent réparer une décision d’un client de partir.
Le graal des entreprises serait d’être capable de prédire la perte d’un client et
d’anticiper si un client a prévu de les quitter afin, avant qu’il ne soit trop tard, de mettre
en place des actions marketing pour l’inciter à rester chez son fournisseur.
Malheureusement les boules de cristal n’ont toujours pas prouvées leur efficacité et
les machines à remonter le temps n’ont pas encore été inventées.
Toutefois avec les big data les entreprises ont découvert qu’il leur était maintenant
possible d’analyser les comportements de leurs clients non plus uniquement en se
basant uniquement sur les retours des commerciaux mais en utilisant l’ensemble des
points d’interaction entre le client et son fournisseur.
Une entreprise de télécom suisse, avait un taux d’attrition de 19 % alors que la
moyenne de leur secteur était située autour de 12%. Chaque année les équipes
marketing étaient obligées de déployer des efforts considérables afin de combler cette
perte de clientèle. Le directeur marketing décida de se tourner vers les big data afin
trouver une solution à ce problème. La première étape fut de collecter et rassembler
l’ensemble des données clients éparpiller entres les différents services de l’entreprise
tel que le service marketing, le service client et SAV ou encore le service facturation.
Lorsque ces données ont pu être analysées, les big data ont permis de constater que
la majorité des clients qui résiliait leur abonnement étaient des clients qui partaient 11
35
mois après leur engagement. Plus important encore il était possible en utilisant toutes
les informations collectées par l’entreprise de trouver des signaux faibles, c’est-à-dire
des évènements dans les actions des clients uniquement visible lorsque l’on croise
l’ensemble des différentes données sur le client et ce pour des milliers de clients,
identifiable quelques mois avant que celui-ci résilie son contrat. En mettant en place
une série d’actions marketing chez ses clients qui possédaient les signaux d’une
probabilité élevée de rompre leur contrat, l’entreprise a ainsi pu réduire son taux
d’attrition de 19 % à 2 %.
Cet exemple est un exemple concret d’application des big data à la fidélisation client.
Les big data en utilisant des masses d’informations importantes sur des milliers de
clients arrivent à détecter des similitudes entre des profils de clients. En utilisant
également l’historique de clients déjà perdus on peut définir les indicateurs qui ont
précédé la perte d’un client et ainsi identifier les clients possédant ces signaux et donc
d’anticiper leur fuite.
B. Real-time marketing et native advertising
Le marketeur le sait, plus il est réactif plus son action aura d’impact sur le
consommateur. Cette théorie est aujourd’hui aisément vérifiable sur les réseaux
sociaux. Les marques cherchent à être le plus proche de leurs clients possible. En
adaptant leur communication en fonction de l’actualité récente les marques cherchent
à surfer sur les buzz du moment mais surtout à montrer aux consommateurs qu’elles
sont comme eux, connecté à la réalité du moment et qu’elles peuvent réagir
instantanément sur importe quel sujet. Les campagnes de publicité couteuses et créés
par des grandes agences de communication existent toujours et continueront d’être
diffusées sur les grandes chaines télévisées aux heures de grandes écoute, mais les
marques l’ont bien compris, une campagne de publicité sur TF1 à 20h00 peut avoir
autant d’impact qu’un Tweet ou un post ciglant au bon moment, à la différence que le
coût varie d’un extrême à un autre.
Cette action aujourd’hui de plus en plus populaire sur Twitter et Facebook « a connu
un essor fulgurant en 2013 lorsque la marque Oreo, en pleine finale du Super Bowl, a
36
rebondi quasi-instantanément à une coupure d’électricité durant le match avec un
tweet devenu un vrai cas d’école : Power Out? No Problem. You can still dunk in the
dark. En capitalisant sur un événement sportif planétaire, la marque a obtenu plus de
15 000 retweets. Pour un investissement minime, comparativement au coût de
diffusion d’un spot TV sur les chaînes américaines durant cet événement, qui s’élève
en moyenne à 4 millions de dollars. 47» Tweet que l’on retrouve sur l’image suivante.
Figure 6 - Un tweet de la marque OREO en plein Super Bowl- d'après le site internet E-MARKETING.FR [enligne] [consulté
le 07/07/15] disponible sur internet - http://www.e-marketing.fr/Thematique/Direct-Digital-1003/Tribunes/le-real-time-
marketing-a-lheure-des-medias-sociaux-246136.htm
47 WEBMARKETING-COM.COM [en ligne]. [Consultéle 07/07/15].Disponiblesur Internet :
http://www.webmarketing-com.com/2015/04/03/36983-big-data-5-exemples-de-son-utilisation-marketing
37
Si poster des statuts ou tweet instantanément ne requiert pas l’utilisation des big data
ce n’est pas le cas des annonces display. Elles sont partout, sous forme d’image, de
GIF ou encore de vidéos, les sont présentes sur les blogs, ou les sites internet et
mêmes au début des vidéos YouTube.
La bannière ou annonce display reste un moyen efficace de capter l’attention du
consommateur et de communiquer pour une marque et/ou de ramener le client vers le
site web désiré.
Depuis fort longtemps déjà les marketeurs ont mis en place des cookies, ces balises
internet chargées de collecter les informations de navigation sur l’internaute afin de
pouvoir le définir et ainsi lui proposer de la publicité ciblé par exemple. Ainsi lorsque
l’on navigue sur Amazon à la recherche de la dernière paire de bottes tendance par
exemple, il n’est pas rare de voir réapparaitre ces mêmes bottes dans une bannière
publicité alors qu’on est en train de lire un article sur un blog de jardinage. De très
nombreux site de e-commerce tel que Amazon, Cdiscount, La FNAC, ou encore EBay
utilisent les bannières web afin de promouvoir leurs produits qu’ils affichent sur des
sites à fort trafic tel que Facebook, Google, ou LeMonde.fr.
Si les cookies réalisent parfaitement leur travail de tracking et de collecte
d’informations sur les visiteurs, les big data apportent l’analyse de l’ensemble des
paramètres de l’environnement. En effet le contenu publicitaire d’une annonce display
aura beaucoup plus d’impact sur un visiteur si son contenu prend en compte
premièrement le profil du visiteur en utilisant son historique de navigation comme les
cookies le font actuellement mais également le site internet sur lequel la bannière va
être mise en avant. En analysant le contenu d’une page web d’un article de presse par
exemple, c’est-à-dire en utilisant la capacité d’analyse de texte des big data, la
publicité peut cibler le visiteur et promouvoir une annonce en rapport avec l’information
qu’il recherche au même moment ce qui aura un effet beaucoup plus important dans
l’esprit de l’internaute que si il voyait apparaitre ses bottes d’Amazon qu’il a vu la veille
alors qu’il est concentré pour rechercher des informations sur la culture de son potager.
38
C. Le ciblage
Toutes les entreprises, à l’exception peut-être de certaines sociétés et start-ups,
possèdent de multiples clients depuis plusieurs années. Chaque client est unique et
différent. Toutefois, les clients d’une entreprise ont des besoins similaires et possèdent
donc des similitudes dans leur profil.
La majorité des sociétés ont accumulé au fil des années beaucoup d’informations sur
leurs clients. Le service marketing par exemple possède des informations sur le
portefeuille client de l’entreprise, le service commercial possède également des
informations sur les prospects et clients contenues dans son CRM qui est rempli par
les commerciaux. Le service facturation également, tout comme le service achat dans
sa relation avec les fournisseurs possède des informations sur les factures et
paiements des clients. Si toutes ses données sont rassemblées et analysées il est
alors possible de dresser un profil type de client de l’entreprise et même de définir des
profils de client avec des potentiels de chiffre d’affaire important.
En utilisant les big data, les entreprises cherchent à retrouver des caractéristiques
entres leurs clients existants et les prospects qui composent leur base. Cette méthode
semblable à du scoring, déjà utilisé dans de nombreuses entreprises, utilise les
capacités des big data d’extraire de l’information de sources qui n’étaient pas
exploitables auparavant tel que les commentaires mis dans le CRM ou encore les
informations laissées sur internet par le prospect.
Les entreprises peuvent ainsi cibler plus précisément encore les prospects qui
représentent les plus gros potentiels de chiffre d’affaire dans l’avenir mais également
les solutions et produits qui seront susceptibles de les intéresser d’avantage.
Avec les big data le marketeur possède une vision à 360° du client pour comprendre
comment il raisonne afin de réaliser la bonne action, au bon moment, vers la bonne
cible et qui va permettre au consommateur de réaliser un acte d’achat. Les big data
ne sont pas une révolution des pratiques marketing déjà existantes. C’est davantage
une évolution des techniques actuelles avec des outils permettant d’être plus précis,
d’anticiper, et d’être plus réactif afin d’améliorer les recettes de l’entreprise.
39
Seconde partie :
Les big data face
aux professionnels
40
****CONFIDENTIEL****
41
Troisième partie :
L’utilisation des big data
dans l’entreprise Cofely
Ineo
&
42
****CONFIDENTIEL****
43
Bibliographie
Ouvrages :
COINTOT, Jean-Charles. LA RÉVOLUTION BIG DATA. Dunod. 2014. ISBN: 978-2-
10-071142-0
Viktor MAYER-SCHÖNBERGER ; Kenneth CUKIER. BIG DATA: A REVOLUTION
THAT WILL TRANSFORM HOW WE LIVE, WORK, AND THINK. John Murray. 2013.
ASIN: B00GOHL9H6
Sources web :
01NET.COM [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet :
http://pro.01net.com/editorial/599331/fleur-pellerin-detaille-son-plan-big-data/
BBC [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet :
http://www.bbc.com/news/business-26383058
BLOG DU MODERATEUR [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet :
http://www.blogdumoderateur.com/chiffres-internet/
blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet :
http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert-
magazine/
blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet :
http://dataconomy.com/understanding-big-data-machine-learning/
blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet :
https://www.linkedin.com/pulse/20140709061649-64875646-what-the-heck-is-
hadoop-and-why-you-should-know-about-it?trk=mp-author-card
BLOG.TERADATA [en ligne]. [Consulté le 08/07/15]. Disponible sur Internet :
http://blogs.teradata.com/data-points/evaluating-and-planning-for-the-real-costs-of-
big-data/
44
data blog [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet :
http://entreprisesnumeriques.co/2015/02/12/le-big-data-exigera-des-bases-de-
donnees-nosql-quelles-repoussent-encore-leurs-limites/
DATA.GOUV.FR [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet :
http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-
secteur-public-des-avancees-sensibles/https://www.data.gouv.fr/fr/
DOMO [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet :
https://www.domo.com/learn/data-never-sleeps-2
EMARKETING.FR [en ligne]. [Consulté le 25/06/15]. Disponible sur Internet :
http://www.e-marketing.fr/Thematique/digital-data-1004/Big-Data-
10021/Breves/Tribune-Marketing-predictif-quand-Big-Data-anticipe-actions-
consommateurs-252194.htm
frenchweb [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet :
http://frenchweb.fr/e-sante-jusquou-ira-le-big-data-pour-nous-
soigner/186343#5hLErJ2kvUxMmkgG.99
frenchweb [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet :
https://www.mskcc.org/blog/msk-trains-ibm-watson-help-doctors-make-better-
treatment-choices
GARTNER [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet :
http://www.gartner.com/newsroom/id/2663015
IBM [en ligne]. [Consulté le 24/06/15]. Disponible sur Internet : http://www-
01.ibm.com/software/data/infosphere/data-scientist/
ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le
03/06/15]. Disponible sur Internet : http://www.cbnews.fr/etudes/toujours-plus-de-
smartphones-et-tablettes-selon-mma-france-a1013528
ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le
03/06/15]. Disponible sur Internet : http://www.itu.int/en/ITU-
D/Statistics/Documents/facts/ICTFactsFigures2015.pdf
45
JOURNAL DU NET [en ligne]. [Consulté le 01/06/15]. Disponible sur Internet :
http://www.forbes.com/sites/oreillymedia/2012/01/19/volume-velocity-variety-what-
you-need-to-know-about-big-data/2/
JOURNAL DU NET [en ligne]. [Consulté le 01/06/15]. Disponible sur Internet :
http://www.journaldunet.com/solutions/dsi/big-data-megadonnees-0814.shtml
journal du net [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet :
http://blog.ontrack.fr/big-data-pourquoi-nosql/
journal du net [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet :
http://www.journaldunet.com/solutions/expert/61369/big-data--la-3eme-phase.shtml
L’USINE DIGITALE [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet :
http://www.usine-digitale.fr/article/les-big-data-ouvrent-l-ere-de-l-aeronautique-de-
service.N334101
LEMONDE.FR [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet :
http://www.lemonde.fr/idees/article/2015/06/17/faisons-du-big-data-une-chance-pour-
l-europe_4655737_3232.html
LEMONDEINFORMATIQUE.FR [en ligne]. [Consulté le 19/07/15]. Disponible sur
Internet : http://www.lemondeinformatique.fr/actualites/lire-les-salaires-des-8-
competences-les-plus-recherchees-en-big-data-56610-page-1.html
MCKINSEY [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet :
http://www.mckinsey.com/insights/operations/how_big_data_can_improve_manufact
uring
myrhline [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet :
http://www.myrhline.com/dossier-rh/big-data-et-ressources-humaines/article/le-big-
data-en-rh-ca-sert-a-quoi.html
REINFORMATION.TV [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet :
http://reinformation.tv/big-data-surveiller-achats-predire-divorce-reve-visa/
SCIENCE DAILY [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet :
http://www.sciencedaily.com/releases/2013/05/130522085217.htm
46
SITE INTERNET DE COFELY [en ligne]. [Consulté le 15/07/15]. Disponible sur
Internet : http://cofely-gdfsuez.com/profil
SYNOMIA [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet :
http://www.synomia.fr/fr/vision-et-techno/synomia-menu-la-data-non-structuree
SYNOMIA [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet :
http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-
secteur-public-des-avancees-sensibles/
THE GUARDIAN [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet :
http://www.theguardian.com/technology/2013/oct/30/online-fraud-costs-more-than-
100-billion-dollars
wall street journal [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet :
http://www.wsj.com/articles/SB10000872396390443890304578006252019616768
WEBMARKETING-COM.COM [en ligne]. [Consulté le 07/07/15]. Disponible sur
Internet : http://www.webmarketing-com.com/2015/04/03/36983-big-data-5-exemples-
de-son-utilisation-marketing
Wikipedia [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet :
https://en.wikipedia.org/wiki/Moneyball_(film)
work force [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet :
http://www.workforce.com/articles/companies-making-hr-big-data-work
Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER
Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER
Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER

Contenu connexe

Tendances

Memoire - MBA management et marketing digital
Memoire - MBA management et marketing digitalMemoire - MBA management et marketing digital
Memoire - MBA management et marketing digitalEmilieThoorens
 
[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...
[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...
[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...Adrien Bourzat
 
Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)Adrien Tilhet-Prat
 
Mémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et PersonnalisationMémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et PersonnalisationPamela Desvignes
 
Ch&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assuranceCh&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assuranceBetito Yan
 
Ppt memoire de fin d'étude Marketing de contenu Master 1
Ppt memoire de fin d'étude Marketing de contenu Master 1Ppt memoire de fin d'étude Marketing de contenu Master 1
Ppt memoire de fin d'étude Marketing de contenu Master 1rokaya lachgar
 
“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...
“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...
“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...MBA ESG
 
Mémoire Professionnel - En quoi l’utilisation du marketing digital peut perm...
Mémoire Professionnel  - En quoi l’utilisation du marketing digital peut perm...Mémoire Professionnel  - En quoi l’utilisation du marketing digital peut perm...
Mémoire Professionnel - En quoi l’utilisation du marketing digital peut perm...Thibault PAILLIER
 
mémoire sur les enjeux de la transformation digitale
mémoire sur les enjeux de la transformation digitalemémoire sur les enjeux de la transformation digitale
mémoire sur les enjeux de la transformation digitaleSamir Kaid
 
Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...
Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...
Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...Marine Escande
 
Plan de communication digitale 7RH
Plan de communication digitale 7RHPlan de communication digitale 7RH
Plan de communication digitale 7RHDorian Pitiot
 
Mémoire professionnel : les métiers de communicants, quand compétences et évo...
Mémoire professionnel : les métiers de communicants, quand compétences et évo...Mémoire professionnel : les métiers de communicants, quand compétences et évo...
Mémoire professionnel : les métiers de communicants, quand compétences et évo...Matthieu de Vergezac
 
Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)NRB
 
l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...
l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...
l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...Fethi Ferhane
 
Présentation digitalisation des entreprises, évolution ou révolution
Présentation digitalisation des entreprises, évolution ou révolutionPrésentation digitalisation des entreprises, évolution ou révolution
Présentation digitalisation des entreprises, évolution ou révolutiontpillon
 

Tendances (20)

Memoire - MBA management et marketing digital
Memoire - MBA management et marketing digitalMemoire - MBA management et marketing digital
Memoire - MBA management et marketing digital
 
[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...
[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...
[MÉMOIRE] Améliorer l'image de marque d'une entreprise sur les médias sociaux...
 
Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)Mémoire communication digitale (extrait)
Mémoire communication digitale (extrait)
 
Big data
Big dataBig data
Big data
 
Mémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et PersonnalisationMémoire Marketing Digital - E-Commerce et Personnalisation
Mémoire Marketing Digital - E-Commerce et Personnalisation
 
Ch&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assuranceCh&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assurance
 
Ppt memoire de fin d'étude Marketing de contenu Master 1
Ppt memoire de fin d'étude Marketing de contenu Master 1Ppt memoire de fin d'étude Marketing de contenu Master 1
Ppt memoire de fin d'étude Marketing de contenu Master 1
 
“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...
“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...
“MODELE DE MARKETING EXPERIENTIEL 2.0 FONDE SUR L'INTEGRATION DES NOUVELLES T...
 
Le mix marketing a l'heure du digital
Le mix marketing a l'heure du digitalLe mix marketing a l'heure du digital
Le mix marketing a l'heure du digital
 
Mémoire Professionnel - En quoi l’utilisation du marketing digital peut perm...
Mémoire Professionnel  - En quoi l’utilisation du marketing digital peut perm...Mémoire Professionnel  - En quoi l’utilisation du marketing digital peut perm...
Mémoire Professionnel - En quoi l’utilisation du marketing digital peut perm...
 
mémoire sur les enjeux de la transformation digitale
mémoire sur les enjeux de la transformation digitalemémoire sur les enjeux de la transformation digitale
mémoire sur les enjeux de la transformation digitale
 
Exposé Marketing digital
Exposé Marketing digitalExposé Marketing digital
Exposé Marketing digital
 
Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...
Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...
Mémoire : Relation Marque Consommateur et Web 2.0 : La révolution induite par...
 
Plan de communication digitale 7RH
Plan de communication digitale 7RHPlan de communication digitale 7RH
Plan de communication digitale 7RH
 
Marketing digital, lesfondamentaux
Marketing digital, lesfondamentauxMarketing digital, lesfondamentaux
Marketing digital, lesfondamentaux
 
Mémoire professionnel : les métiers de communicants, quand compétences et évo...
Mémoire professionnel : les métiers de communicants, quand compétences et évo...Mémoire professionnel : les métiers de communicants, quand compétences et évo...
Mémoire professionnel : les métiers de communicants, quand compétences et évo...
 
Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)Transformation Digitale - Menaces et opportunités (D. Eycken)
Transformation Digitale - Menaces et opportunités (D. Eycken)
 
l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...
l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...
l'impact du marketing digital sur la performance des entreprises: Cas d'un ec...
 
Présentation digitalisation des entreprises, évolution ou révolution
Présentation digitalisation des entreprises, évolution ou révolutionPrésentation digitalisation des entreprises, évolution ou révolution
Présentation digitalisation des entreprises, évolution ou révolution
 
Analyse spatiale en Big data
Analyse spatiale en Big dataAnalyse spatiale en Big data
Analyse spatiale en Big data
 

Similaire à Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER

Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ? Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ? Christina Galouzis
 
Mémoire moi 2010 e réputation benjamin vever
Mémoire moi 2010  e réputation  benjamin veverMémoire moi 2010  e réputation  benjamin vever
Mémoire moi 2010 e réputation benjamin veverMaster MOI
 
Memoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion PelouzetMemoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion PelouzetPelouzet
 
Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...
Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...
Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...Alban Jarry (Bibliothèque de Documents)
 
Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...
Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...
Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...Julie MONNOT
 
Memoire Carine Currit Iscom
Memoire Carine Currit IscomMemoire Carine Currit Iscom
Memoire Carine Currit IscomCarine Currit
 
Tendancesveille2011 ebook
Tendancesveille2011 ebookTendancesveille2011 ebook
Tendancesveille2011 ebookRebecca Bory
 
INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...
INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...
INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...Ninon Gregoire
 
Projet de fin D'études1..pdf
Projet de fin D'études1..pdfProjet de fin D'études1..pdf
Projet de fin D'études1..pdfssuserec47c4
 
These professionnelle MBA E-Business Bono Fish spa
These professionnelle MBA E-Business Bono Fish spaThese professionnelle MBA E-Business Bono Fish spa
These professionnelle MBA E-Business Bono Fish spaKaothar MEZIANE
 
Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y Julia Marras
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision Amal Brioual
 
La réalité augmentée et le grand public : enjeux, limites et perspectives
La réalité augmentée et le grand public : enjeux, limites et perspectivesLa réalité augmentée et le grand public : enjeux, limites et perspectives
La réalité augmentée et le grand public : enjeux, limites et perspectivesJimmy Hanafi
 
Geoffroy de la rochebrochard mémoire gmde 2012 cmi
Geoffroy de la rochebrochard mémoire gmde 2012 cmiGeoffroy de la rochebrochard mémoire gmde 2012 cmi
Geoffroy de la rochebrochard mémoire gmde 2012 cmiGeoffroy de La Rochebrochard
 
Chaire Machine Learning for Big Data
Chaire Machine Learning for Big DataChaire Machine Learning for Big Data
Chaire Machine Learning for Big DataTélécom Paris
 
Le trading media - Livre blanc - IAB 2012
Le trading media - Livre blanc - IAB 2012Le trading media - Livre blanc - IAB 2012
Le trading media - Livre blanc - IAB 2012Romain Fonnier
 
Le trading media
Le trading mediaLe trading media
Le trading mediaAd6 Media
 
E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...
E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...
E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...Marlene Page
 

Similaire à Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER (20)

Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ? Le Big data à Bruxelles aujourd'hui. Et demain ?
Le Big data à Bruxelles aujourd'hui. Et demain ?
 
Mémoire moi 2010 e réputation benjamin vever
Mémoire moi 2010  e réputation  benjamin veverMémoire moi 2010  e réputation  benjamin vever
Mémoire moi 2010 e réputation benjamin vever
 
Les geants-du-web
Les geants-du-webLes geants-du-web
Les geants-du-web
 
Memoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion PelouzetMemoire web 3.0 Marion Pelouzet
Memoire web 3.0 Marion Pelouzet
 
Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...
Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...
Livre Blanc "L'humain dans le numérique et le big data" du comité scientifiqu...
 
Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...
Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...
Social CRM : l'impact des réseaux sociaux dans la stratégie relation client d...
 
Memoire Carine Currit Iscom
Memoire Carine Currit IscomMemoire Carine Currit Iscom
Memoire Carine Currit Iscom
 
Tendancesveille2011 ebook
Tendancesveille2011 ebookTendancesveille2011 ebook
Tendancesveille2011 ebook
 
INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...
INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...
INTERNET : nouvelle circulation de l’information, nouveaux comportements, nou...
 
Projet de fin D'études1..pdf
Projet de fin D'études1..pdfProjet de fin D'études1..pdf
Projet de fin D'études1..pdf
 
These professionnelle MBA E-Business Bono Fish spa
These professionnelle MBA E-Business Bono Fish spaThese professionnelle MBA E-Business Bono Fish spa
These professionnelle MBA E-Business Bono Fish spa
 
Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y Communiquer sur les réseaux sociaux auprès de la génération Y
Communiquer sur les réseaux sociaux auprès de la génération Y
 
Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision Business Intelligence au coeur de la décision
Business Intelligence au coeur de la décision
 
La réalité augmentée et le grand public : enjeux, limites et perspectives
La réalité augmentée et le grand public : enjeux, limites et perspectivesLa réalité augmentée et le grand public : enjeux, limites et perspectives
La réalité augmentée et le grand public : enjeux, limites et perspectives
 
Geoffroy de la rochebrochard mémoire gmde 2012 cmi
Geoffroy de la rochebrochard mémoire gmde 2012 cmiGeoffroy de la rochebrochard mémoire gmde 2012 cmi
Geoffroy de la rochebrochard mémoire gmde 2012 cmi
 
Chaire Machine Learning for Big Data
Chaire Machine Learning for Big DataChaire Machine Learning for Big Data
Chaire Machine Learning for Big Data
 
Le trading media - Livre blanc - IAB 2012
Le trading media - Livre blanc - IAB 2012Le trading media - Livre blanc - IAB 2012
Le trading media - Livre blanc - IAB 2012
 
Le Trading Media
Le Trading MediaLe Trading Media
Le Trading Media
 
Le trading media
Le trading mediaLe trading media
Le trading media
 
E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...
E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...
E-réputation et entreprise - Mémoire M2 IDEMM - Marlène Page - Version diffus...
 

Thèse professionnelle - COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? - Thibault PAILLIER

  • 1. Thèse Professionnelle Présentée par : Thibault PAILLIER En vue d’obtenir le titre Certifié Niveau I : Manager de la Stratégie Commerciale Spécialité : Management de la Stratégie de marque, de l'innovation et du lancement de nouveaux produits et services COMMENT LES BIG DATA VONT AMELIORER LE MARKETING DANS LES ENTREPRISES EN B2B ? THÈSE Professionnelle dirigée par : François GONNET Entreprise : Cofely Ineo Digital, Groupe ENGIE Tuteur : Mme KOUADRIA Laetitia
  • 2. Résumé Dans cette thèse nous allons nous intéresser aux avantages de l’utilisation des big data dans une entreprise située sur un marché B2B. Nous analyserons dans un premier temps via des études d’ouvrages comment les big data s’appliquent dans divers domaines tels que l’énergie, la télécommunication ou encore la santé et dans un second temps plus particulièrement dans différents services d’une entreprise tels que la logistique ou les ressources humaines. Nous étudierons plus en détail l’application des big data dans le marketing et nous confronterons nos recherches par des interviews de professionnels spécialisés en big data ainsi que l’interview d’une personne travaillant au sein de l’entreprise Cofely Ineo Digital qui n’utilise pas les big data. Nous nous attarderons sur le cas de cette société et nous étudierons comment les big data peuvent apporter de différentes manières des améliorations au marketing dans cette société.
  • 3. Résumé en anglais In this thesis we will look at the advantages of the use of big data in a company in a B2B market. At first we will analyze through studies of books how big data apply in various fields such as energy, telecommunications or health and in a second time especially in different company services such as logistics or human resources. We will study in detail the application of big data in marketing and we will confront our research by the interviews of specialized professionals in big data and an interview with a person working in the company Cofely Ineo Digital that does not use the big data. We will focus on the case of this company and we will study how big data can bring in different ways improvements to the marketing in this company.
  • 4. Table des matières INTRODUCTION .........................................................................................................................................................................1 PREMIERE PARTIE : CONCEPT DE « BIG DATA » .................................................................................................................2 I. L’ERE DEL’INFORMATION..................................................................................................................................................3 A. La généralisation d’internet .................................................................................................................................3 B. La révolution du smartphone...............................................................................................................................4 C. La règle des 3 V ......................................................................................................................................................5 1. Volume ................................................................................................................................................................. 6 2. Vélocité................................................................................................................................................................. 8 3. Variété .................................................................................................................................................................. 8 D. Les outils des big data .........................................................................................................................................10 1. Infrastructure réseau.......................................................................................................................................... 10 2. Les bases de données......................................................................................................................................... 11 3. Hadoopet les outils de découverte des données.............................................................................................. 13 4. Machine learning................................................................................................................................................ 15 5. Les outils de visualisation................................................................................................................................... 16 6. Les compétences humaines............................................................................................................................... 17 7. Benchmark des solutions ................................................................................................................................... 18 II. LES DIFFERENTS USAGES DU BIG DATA..............................................................................................................................20 A. Le secteur des télécommunications ..................................................................................................................20 B. Le secteur de l’énergie.........................................................................................................................................21 C. Le secteur bancaire ..............................................................................................................................................22 D. Le secteur du commerce .....................................................................................................................................24 E. Le secteur public...................................................................................................................................................25 F. 4 V et 5 V et…........................................................................................................................................................27 G. Le secteur de la santé ..........................................................................................................................................27 H. Ressources humaines ..........................................................................................................................................29 I. Production et logistique ......................................................................................................................................31 III. BIG DATAET MARKETING ................................................................................................................................................33 A. Le marketing prédictif et fidélisation................................................................................................................33 B. Real-time marketing et native advertising..........................................................................................................35 C. Le ciblage...............................................................................................................................................................38 SECONDE PARTIE : LES BIG DATA FACE AUX PROFESSIONNELS....................................................................................39 IV. METHODOLOGIEDERECHERCHE.....................................................................................ERROR! BOOKMARK NOTDEFINED. V. INTERVIEWS..................................................................................................................ERROR! BOOKMARK NOTDEFINED. A. Collaborateur d’Ineo Digital..............................................................................Error! Bookmark not defined. a. Présentation......................................................................................................Error! Bookmark not defined. b. Questions / réponses ........................................................................................Error! Bookmark not defined. c. Synthèse............................................................................................................Error! Bookmark not defined. B. Spécialiste big data.............................................................................................Error! Bookmark not defined. a. Présentation......................................................................................................Error! Bookmark not defined. b. Questions / réponses ........................................................................................Error! Bookmark not defined. c. Synthèse............................................................................................................Error! Bookmark not defined. C. Spécialiste marketing .........................................................................................Error! Bookmark not defined. a. Présentation......................................................................................................Error! Bookmark not defined. b. Questions / réponses ........................................................................................Error! Bookmark not defined. c. Synthèse............................................................................................................Error! Bookmark not defined. VI. SYNTHESEDES INTERVIEWS ............................................................................................ERROR! BOOKMARK NOTDEFINED.
  • 5. TROISIEME PARTIE : L’UTILISATION DES BIG DATA DANS L’ENTREPRISE COFELY INEO ..........................................40 VII. PRESENTATION DE COFELY INEO................................................................................ERROR! BOOKMARK NOTDEFINED. A. Activité..................................................................................................................Error! Bookmark not defined. B. Organisation ........................................................................................................Error! Bookmark not defined. C. Clients....................................................................................................................Error! Bookmark not defined. VIII. LECAS DE LASOCIETE INEO DIGITAL...........................................................................ERROR! BOOKMARK NOTDEFINED. A. Présentation d’Ineo Digital................................................................................Error! Bookmark not defined. B. Ineo Digital et la donnée....................................................................................Error! Bookmark not defined. 1. Le commerce..........................................................................................................Error! Bookmark not defined. 2. Les achats ...............................................................................................................Error! Bookmark not defined. 3. Le service facturation.............................................................................................Error! Bookmark not defined. 4. Le service SAV.........................................................................................................Error! Bookmark not defined. C. Le service marketing chez Ineo Digital ............................................................Error! Bookmark not defined. 1. Le service marketing créateur de données............................................................Error! Bookmark not defined. 2. Les actions marketing chezIneo Digital.................................................................Error! Bookmark not defined. a. Le service marketing direct...............................................................................Error! Bookmark not defined. b. Le service marketing des offres.........................................................................Error! Bookmark not defined. IX. APPLICATIONDESBIGDATAAUSERVICEDUMARKETINGCHEZINEODIGITAL...................................ERROR! BOOKMARK NOTDEFINED. A. L’acquisition clients : ciblage.............................................................................Error! Bookmark not defined. B. La fidélisation.......................................................................................................Error! Bookmark not defined. C. Développer de nouvelles offres et prévoir leurs potentiels..........................Error! Bookmark not defined. D. La vente de services complémentaires aux clients........................................Error! Bookmark not defined. E. Client à risque ......................................................................................................Error! Bookmark not defined. F. Définir les prix des contrats de maintenance .................................................Error! Bookmark not defined. X. MISEEN PLACED’UN PROJETBIG DATADANS LASOCIETE INEO DIGITAL............................ERROR! BOOKMARK NOTDEFINED. A. Les ressources nécessaires ................................................................................Error! Bookmark not defined. 1. Généralités .............................................................................................................Error! Bookmark not defined. 2. Ineo digital..............................................................................................................Error! Bookmark not defined. a. Solutions logicielles...........................................................................................Error! Bookmark not defined. b. Compétences humaines....................................................................................Error! Bookmark not defined. c. Coût global.........................................................................................................Error! Bookmark not defined. B. ROI.........................................................................................................................Error! Bookmark not defined. C. Conclusion ............................................................................................................Error! Bookmark not defined. BIBLIOGRAPHIE........................................................................................................................................................................42 TABLE DES ILLUSTRATIONS...................................................................................................................................................47 ANNEXES ...................................................................................................................................................................................48 ANNEXE 1 – GUIDE D’ENTRETIEN DE M. ROLAND KOLTCHAKIAN.....................ERROR! BOOKMARK NOT DEFINED. ANNEXE 2 – GUIDE D’ENTRETIEN DE M. HERVE DHELIN .....................................ERROR! BOOKMARK NOT DEFINED. ANNEXE 3 – GUIDE D’ENTRETIEN DE MME LAETITIA KOUADRIA ......................ERROR! BOOKMARK NOT DEFINED.
  • 6. 1 Introduction 90% de toutes les données dans le monde ont été créés durant les deux dernières années. De nos jours la donnée est de partout, et elle est créée constamment, sur internet, via les smartphones, via les objets connectés, lorsque l’on paye par carte… et son rythme de croissance est exponentiel. Si cette croissance engendre des coûts de stockage faramineux pour les entreprises du web que sont Google, Amazon, Apple, et encore Facebook, ces données sont aussi une de leur plus grande richesse. La donnée d’hier est la richesse d’aujourd’hui. Les technologies de stockage et surtout les puissances de calcul de nos jours ont permis de créer des solutions capables d’analyser ces données afin de pouvoir en tirer des informations précieuses. Les big data sont nés. Big data, ce terme anglo-saxon est apparu il y a quelques années déjà et fait son apparition régulièrement lorsqu’éclate un scandale sur l’espionnage par les Etats Unis. S’il est très connu comme une des techniques pour combattre le terrorisme ses domaines d’application sont illimités. Astronomie, agriculture, météo, traffic, sécurité, gestion de l’énergie, amélioration des défaillances des chaines de production, recherche scientifique, médecine… il est impossible de citer toutes les utilisations qu’il en est fait car elles ne cessent d’augmenter. Il y a toutefois un domaine où l’on ne parle que de ça, c’est le marketing. Les marketeurs ne jurent que par ça tant le potentiel des big data est immense. En effet les big data sont le fait d’utiliser énormément de données afin de pouvoir en quelque sorte prédire l’avenir, ou du moins anticiper les actions des consommateurs. Et qui n’aurait pas rêvé de pouvoir savoir à l’avance à quel endroit du rayon du supermarché les yeux du client vont se poser et quelle couleur va l’inciter à choisir le produit, en fonction de la météo du jour, du résultat du match de foot de l’équipe locale et du trafic en ville. Si cet exemple reste irréaliste il est représentatif de ce que les big data sont capables de faire pour le marketing, à savoir donner toutes les clés aux marketeurs afin de pouvoir vendre à la bonne personne, au bon moment, via le bon canal. C’est ce que nous allons étudier dans cette thèse à savoir comment en utilisant les big data, les marketeurs vont-ils pouvoir améliorer le marketing dans une entreprise sur un marché en B2B et de ce fait apporter de la valeur à leur entreprise.
  • 7. 2 Première partie : Concept de « big data »
  • 8. 3 I. L’ère de l’information A. La généralisation d’internet Aujourd’hui internet fait partie du quotidien de millions, voire de milliard de personnes dans le monde. En 2015, « 42% de la population mondiale est connectée à Internet1», cela représente près de « 3,025 milliards d’internautes 1». Sur cette population 70% se connecte quotidiennement avec un temps de connexion moyen de « 4,8 heures par jour via un ordinateur, et 2,1 heures via un mobile 1 ». Si ces chiffres peuvent sembler impressionnants, ils ne sont rien comparés à la quantité de données que cela représente. En effet, si la quantité de données présentes sur internet à ce jour n’est pas quantifiable – 2,5 exabyte, soit 2,5 milliards de gigabytes (GB) été créées par jour en 2012 d’après le géant de l’informatique IBM 2 - elle ne cesse de croître à chaque action d’un individu, et ce sur internent et en dehors. Car « chacun et chacune d’entre nous produit et transmet des données sur nous-mêmes. Nous faisons cela en nous déplaçant passivement – notre comportement étant enregistré par des caméras ou l’utilisation de notre carte – ou en nous connectant sur notre ordinateur ou en surfant sur le net 3» sur notre smartphone. Cette augmentation de données ou data a été très fortement accentuée par l’émergence des réseaux sociaux. Comme le déclare Jean- Charles Cointot dans son ouvrage La révolution Big Data « fin 2013, Facebook, Twitter, Google + et LinkedIn totalisaient à eux seuls près de 2,5 milliards d’abonnés et YouTube fait état de plus d’un milliard de visiteurs uniques chaque mois. 4». Lorsque l’on sait que pour une durée d’une minute chaque jour, près de 277 000 tweets sont publiés, que les utilisateurs Facebook partagent 2 460 000 contenus et qu’environ 72 heures de vidéos sont chargées sur YouTube 5 et que l’ensemble de ces informations sont entièrement stockées et analysées par ces géants du web on comprend mieux 1 BLOG DU MODERATEUR [en ligne]. [Consulté le02/06/15]. Disponible sur Internet : http://www.blogdumoderateur.com/chiffres-internet/ 2 BBC [en ligne]. [Consulté le02/06/15]. Disponiblesur Internet : http://www.bbc.com/news/business - 26383058 3 SCIENCE DAILY [en ligne].[Consulté le03/06/15]. Disponiblesur Internet : http://www.sciencedaily.com/releases/2013/05/130522085217.htm 4 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 10. ISBN: 978-2-10-071142-0 5 DOMO [en ligne]. [Consultéle 03/06/15].Disponiblesur Internet : https://www.domo.com/learn/da ta-never- sleeps-2
  • 9. 4 pourquoi d’après une étude d’Oracle, comme le montre le graphique suivant, le volume de données dans le monde va passer de 7 zettabytes (ZB) en 2015 soit sept mille milliards de gigabytes, à près de 44 zettabytes en 2020. Figure 1 - l'augmentation des data de 40% par an - d'après le site internet ATKearney [en ligne] [consulté le 03/06/2015] disponible sur internet http://www.atkearney.fr/strategic-it/ideas-insights/article/- /asset_publisher/LCcgOeS4t85g/content/big-data-and-the-creative-destruction-of-today-s-business-models/10192 B. La révolution du smartphone D’après l’ITU (International Telecommunication Union), en 2015 le taux de pénétration du mobile dans le monde était de 97% pour atteindre près de 7 milliards de mobile contre 738 millions en 2000 6. En France, « le taux d’équipement est de l’ordre de 112% et en Île-de-France de l’ordre de 175%. Grâce à la baisse des prix, de plus en plus de gens ont deux téléphones, l’un privé et l’autre professionnel par exemple.7 ». Cette inexorable croissance du mobile à travers le monde est une cause principale de 6 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne].[Consulté le03/06/15]. Disponiblesur Internet : http://www.itu.int/en/ITU-D/Statistics/Documents/facts/ICTFactsFigures2015.pdf 7 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 19. ISBN: 978-2-10-071142-0
  • 10. 5 l’augmentation exponentielle du volume de données. En France, un mobile sur deux est un smartphone8, les Français sont constamment connectés à internet : envoi et réception d’emails, réseaux sociaux, itinéraires, téléchargement de jeux, lecture de vidéos, achats en ligne… sont autant d’actions rendues possibles pour quiconque possède un smartphone à portée de main. Si Big Brother n’est qu’un fantasme pour certains ou une réalité pour d’autres, la réalité de la mémorisation automatique de chaque action de chaque utilisateur est une réalité. Lorsque une personne interagit sur un réseau social tel que Facebook ou Twitter tous les tweets, statuts, partage d’informations avec sa communauté ou " Like " sur une page d’une marque sont enregistrés. Si la majorité des utilisateurs ne prêtent que peu d’importance aux informations qu’ils rendent ainsi disponibles, ce n’est pas le cas des géants d’internet qui exploitent et analysent ces données afin de définir le profil de l’utilisateur, de pouvoir le cibler et lui proposer les contenus et les publicités les plus adaptés. C. La règle des 3 V Comme le rappelle Jean-Charles COINTOT dans son ouvrage La Révolution Big data, le big data c’est bien évidement le traitement de très gros volumes de données. Mais le big data est avant tout chose le traitement de très grosses données qui proviennent surtout de différentes sources. « Analyser les millions d’enregistrements stockés dans un entrepôt de données traditionnel, ce n’est pas du big data, c’est une analyse volumineuse 9 ». C’est uniquement lorsque l’on croise diverses sources d’informations dans des volumes de données importants que l’on peut parler de big data. Par exemple : « Combiner les informations de consommation des clients stockées dans un entrepôt de données avec les logs de navigation sur les sites Web et les enregistrements de discussions d’un centre d’appel pour essayer d’anticiper le départ d’un client, c’est du big data quelle que soit la taille des sources d’information.9 » 8 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le03/06/15]. Disponiblesur Internet : http://www.cbnews.fr/etudes/toujours-plus-de-smartphones-et-tablettes-selon-mma-france- a1013528 9 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 36. ISBN: 978-2-10-071142-0
  • 11. 6 D’après des spécialistes d’IBM, les big data se définissent par 3 propriétés qui les caractérisent à divers degrés. On les appelle les 3 V pour : volume, vélocité, variété et qui sont représentés dans le schéma suivant : Figure 2– les 3V des big data - d'après le site internet blog.sqlauthority.com [en ligne] [consulté le 15/06/15] disponible sur internet http://blog.sqlauthority.com/2013/10/02/big-data-what-is-big-data-3-vs-of-big-data-volume-velocity-and- variety-day-2- 1. Volume Le terme anglais « Big data » se traduit par grosses données en français ou « mégadonnées 10» plus exactement comme cela a été décidé par la commission générale de terminologie et de néologie le 22 août 2014 dernier. L’important volume 10 JOURNAL DU NET [en ligne]. [Consultéle 01/06/15].Disponiblesur Internet : http://www.journaldunet.com/solutions/dsi/big-data-megadonnees-0814.shtml
  • 12. 7 de données est la caractéristique première des big data et également la première caractéristique qui vient à l’esprit lorsque l’on en parle. La capacité de traiter de très larges quantités de données est l’un des principaux avantages des big data. Comme le déclare Forbes11, avoir plus de données bat avoir des meilleurs modèles : si vous deviez prévoir la météo, auriez-vous de meilleurs résultats en prenant en compte 300 facteurs ou seulement 6 facteurs. La réponse semble évidente. « Dans une approche statistique basée sur l’échantillonnage, il faut savoir ce que l’on cherche pour que l’échantillon soit représentatif. Dans une approche big data, il n’est pas besoin de faire des hypothèses préconçues puisqu’on a toutes les données. L’important n’est pas de réduire la taille des données à analyser mais au contraire d’associer le plus de données possibles relatives de près ou de loin au phénomène que l’on souhaite analyser. Plus il y aura de données, plus on a de chance de trouver une information passée jusque-là totalement inaperçue. 12» Le volume représente également l’un des principaux challenges pour les services IT des sociétés. Avec l’apparition de nouveaux formats de données telles que les données des réseaux sociaux, les données de navigation sur les sites internet, les mobiles, la géolocalisation, les vidéos… etc de nombreuses entreprises ont acquis des Terabytes voire des Petabytes de données dans leurs serveurs. Beaucoup de sociétés possèdent parfois sans le savoir de vastes quantités de données archivées, parfois sous forme de log mais peu d’entre elles possèdent les capacités de les traiter. La problématique des sociétés face aux big data n’est donc pas de créer des données mais plutôt de les regrouper et de les exploiter entièrement afin de pouvoir extraire l’information qui sera passée jusque-là inaperçue. Pour la plupart des données comme les informations relatives à l’identité d’une entreprise ou d’une personne, elles sont statiques. D’autres, comme les échanges entre les membres d’un forum ou d’un blog ont une fréquence de rafraîchissement « assez faible allant de l’heure à la journée, d’autres enfin, comme les tweets, les données de géolocalisation sont très dynamiques. Il faut pouvoir les traiter au fil de l’eau. C’est la vélocité, deuxième caractéristique du big data.12 » 11 JOURNAL DU NET [en ligne]. [Consultéle 01/06/15].Disponiblesur Internet : http://www.forbes.com/sites/oreillymedia/2012/01/19/volume-velocity-variety-what-you-need-to-know- about-big-data/2/ 12 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 45. ISBN: 978-2-10-071142-
  • 13. 8 2. Vélocité Dans le passé, la vitesse de création des données ne nécessitait une mise à jour de la base que tous les jours, voire toutes les semaines. Aujourd’hui, avec l’émergence d’internet, sont apparus les réseaux sociaux et avec l’apparition des smartphones, sont apparues les applications mobiles, ces deux vecteurs sont les principales causes de la création en continu et en quantité importante de données. Les sociétés qui sont capables de traiter et d’analyser en temps réel ce qui se passe et réagir en fonction possèdent un avantage concurrentiel certain. C’est le cas du secteur de la finance qui a depuis longtemps déjà mis des outils pour traiter l’information des marchés en temps réel. Aujourd’hui des sociétés telles que Amazon ont également mis en place des outils pour analyser en temps réel la navigation de leurs clients afin de leurs préconiser des produits susceptibles de les intéresser en se basant sur les produits visités par d’autres clients ayant le même profil. 3. Variété Dans l’ouvrage récompensé du titre Bestseller par le Wall Street Journal et The New York Time de Viktor Mayer-Schönberger et Kenneth Cukier intitulé Big Data: A Revolution That Will Transform How We Live, Work, and Think 13 les auteurs expliquent comment tout devient donnée. Ils appellent ce phénomène la datafication. En effet avec le big data on ne se contente plus de traiter uniquement des données mesurables et quantifiables bien organiser dans les lignes et colonnes de tableaux Excel. Avec le big data le format des données n’a plus d’importance, texte, vidéos, emails, sms, tweet, pdf, données brutes depuis un capteur… etc, toutes les données peuvent être traitées. Si la donnée est un texte qui n’est pas tapé directement par un outil de saisie alors il faudra lire l’image numérique avec des outils de reconnaissance optique. « Par cette opération de traitement du texte brut, celui- ci est devenu une donnée analysable, réutilisable, agrégeable à d’autres données pour tout type de traitement. C’est ainsi que les blogs, les forums, les réseaux sociaux sont devenus de vrais gisements d’informations sur les sentiments, les envies, les irritants, les 13 Viktor MAYER-SCHÖNBERGER ; Kenneth CUKIER. BIG DATA: A REVOLUTION THAT WILL TRANSFORM HOW WE LIVE, WORK, AND THINK. John Murray.2013. ASIN: B00GOHL9H6
  • 14. 9 préférences, les intentions d’achat de leurs abonnés. 14 » Ce processus peut également être adapté à d’autres formats de données, Jean Charles COINTOT donne un exemple concret de la manière dont une donnée telle que le son peut être numérisée grâce à des outils de reconnaissance vocale comme le sont par exemple Siri sur l’Iphone ou Google Voice Search. « On peut imaginer un abonné à un service de télévision connectée qui se plaint de n’avoir pas pu regarder correctement un film loué en vidéo à la demande, parce que la qualité de l’image était très mauvaise. La reconnaissance vocale pourra déterminer qu’il n’est pas content, qu’il y a un problème de qualité d’image et de le codifier sous forme de données. Ces données seront combinées avec celles du réseau de l’opérateur pour vérifier qu’il y a bien un problème de qualité et, grâce aux informations du client pour vérifier qu’il a bien loué la vidéo dont il parle. On accédera peut-être également à son historique, pour savoir si c’est la première fois que cela lui arrive, ou si c’est un problème récurrent sur cette ligne. Ces recherches permettront au conseiller clientèle de savoir s’il s’agit d’un fraudeur et donc de l’éconduire ou, à l’opposé, de reconnaître un client malchanceux et lui proposer d’éventuelles compensations. Aujourd’hui, en général, le conseiller sait qui vous êtes et connaît vos abonnements, mais n’a aucun moyen de savoir si ce que vous dites est vrai – sauf s’il y a une panne générale de secteur. Si la mauvaise qualité de votre expérience est due à un phénomène plus fin, il ne le sait pas.15 » Le big data comporte trois types de données : - Les données structurées qui correspondent à « l'ensemble des valeurs possibles est déterminé et connu à l'avance. Par exemple, dans une base de données rassemblant les résultats d'une enquête d'opinion, l'âge ou la catégorie socioprofessionnelle des individus interrogés sont des données structurées, car les tranches d'âges ou la liste des catégories socioprofessionnelles possibles sont déterminées a priori. 16» - Les données semi structurées qui regroupent les structures de description de contenu comme le HTML ou le SGML qui n’ont pas de champ rigide mais qui 14 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 49. ISBN: 978-2-10-071142-0 15 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 51. ISBN: 978-2-10-071142-0 16 SYNOMIA [en ligne]. [Consultéle 02/06/15]. Disponiblesur Internet : http://www.synomia.fr/fr/vision-et- techno/synomia-menu-la-data-non-structuree
  • 15. 10 possèdent des balises délimitant des champs. L’information n’est pas organisée mais possède toutefois une structure identifiable. - Les données non structurées, ou données complexes. Ce sont l’ensemble des données comme le texte ou les images ou encore les enregistrements sonores qui ne possèdent aucune structure identifiable et aucune logique d’organisation d’un point de vue d’un ordinateur. D. Les outils des big data Nous avons étudié les différents bénéfices que pouvaient tirer chaque société en fonction de leur industrie, nous avons également analysé les avantages des big data pour les différents services d’une entreprise. Nous allons maintenant nous attarder sur les différents outils qui compose le big data. En effet nous avons pu commencer à apercevoir que le big data n’est pas uniquement un logiciel ou un moteur de recherche qu’on lancerait et qui nous donnerait la réponse à toutes nos problématiques, les big data sont complexes, lourds à mettre en place et les solutions qui le composent sont aussi diverses que variées. 1. Infrastructure réseau Dans les big data nous l’avons vu, le premier V est volume. C’est-à-dire que la quantité de données est imposante. « Les avantages potentiels du Big Data côtoient la nécessité d’accomplir des progrès significatifs sur le plan des infrastructures de stockage et réseau nécessaires pour accompagner son essor. C’est le cas des caméras de sécurité. Dans les aéroports, les responsables de la sécurité commencent à envisager la possibilité de passer au format UltraHD ou 4K. Une telle résolution permet de rechercher facilement des informations précises et détaillées dans les flux vidéo, remplaçant les images noir et blanc granuleuses tout en réduisant les risques de sécurité.
  • 16. 11 Tout en respectant les données de confidentialité et l’anonymat des personnes, il est également possible d’utiliser des caméras 4K pour analyser le comportement des consommateurs ou la circulation des piétons. Car ce format n’est pas réservé aux téléviseurs XXXL présentés au salon au salon CES de Las Vegas ! Or, la résolution 4K exige un socle particulièrement solide. Une seule minute au format 4K représente environ 5,3 Go ! À Londres par exemple, 7 000 caméras de vidéosurveillance en 4K généreraient chaque jour quelque 52 pétaoctets, soit plusieurs fois le volume de données stockées dans la bibliothèque du Congrès de Washington. 17» Avec les big data la problématique du stockage des masses de données rentrent donc en compte. Mais ce n’est pas la seule problématique, même si aujourd’hui les solutions de stockage à bas coût existent, telles que la sauvegarde sur des serveurs, les technologies du big data nécessitent aussi des systèmes d’infrastructures réseaux agiles avec des capacités d’écriture et de calcul élevées. 2. Les bases de données Avec l’apparition des big data nous l’avons vu, est également apparu une très grande variété de données. Ces données peuvent provenir de différentes sources, comme les réseaux sociaux, des capteurs, les forums, mais aussi des conversations qui sont numérisées. Ces données brutes sont donc dites non structurées, c’est-à-dire qu’elles n’ont pas d’organisation, et ne peuvent pas être ordonnées afin de faciliter leur traitement. Afin de pouvoir les analyser il a alors été nécessaire de créer d’autres formats de stockage. Initialement, les données étaient stockées dans des bases de données dites classique en SQL. « SQL est l’acronyme de Structured Query Language. Il est connu depuis longtemps de tous les acteurs de l’informatique qui ont eu à rechercher rapidement des informations dans de grosses bases de données relationnelles (SGBD). Dans les années 90, certains commerciaux dans des compagnies de logistique n’avaient ni 17 JOURNAL DU NET [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet : http://www.journaldunet.com/solutions/expert/61369/big-data--la-3eme-phase.shtml
  • 17. 12 souris ni écran graphique, ni interface utilisateur pour rechercher certaines informations stockées sur des serveurs souvent distants et reliés par des lignes spécialisées : ils entraient au clavier des commandes SQL et étaient capables de répondre à leur client sur la disponibilité de tel ou tel camion ou train en quelques secondes. SQL est aujourd’hui largement utilisé, car étant un des dispositifs d’organisation et d’interrogation de bases de données le plus structuré et le plus rapide ; il se décline sous différentes appellations qui montrent qu’il y a des adaptations diverses comme c’est notamment le cas de MySQL d’Oracle qui est le plus gros concurrent de SQL de Microsoft. 18» Pour les utiliser les données non structurées du big data, est apparu à partir de 2009 le terme NoSQL qui ne signifie pas "non SQL" mais plutôt "not only SQL". « Les bases de données NoSQL adressent des enjeux différents de ceux des bases de données relationnelles historiques. Ces bases de données de type NoSQL viennent compléter (et non pas remplacer) les bases de données relationnelles qui se heurtaient à des limites d’évolutivité et de performances dans des environnements de données massives. Avec la prolifération annoncée des objets connectés qui vont être autant de sources de nouvelles données, la gestion de bases de données massives se posera de manière accrue. Les bases de données NoSQL se différencient du modèle SQL par une logique de représentation de données non relationnelle qui se caractérise en général par : 38»  « D’importants volumes de données structurées et non structurées 38»  « Une multitude de requêtes simultanées 38»  « Une forte évolutivité de type scale out (évolution horizontale par rajout de serveurs) 38»  « De hautes performances 38» 18 JOURNAL DU NET [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet : http://blog.ontrack.fr/big-data- pourquoi-nosql/
  • 18. 13  « Pas de schéma (schema less). La base de données n’impose pas de définition des éléments au sein d’un ensemble de données. 19» Ce format beaucoup plus flexible c’est aujourd’hui imposé dans le domaine des big data, comme un des formats de référence pour traiter les données complexes dans de grand volume. D’autres formats de données ont également étaient développés par des géants de l’informatique tel que le NewSQL développé par Google. 3. Hadoop et les outils de découvertedes données Les problèmes d’infrastructures résolus et les difficultés de stockage des données non structurées traitées il a fallu également développer des outils capables d’aller organiser et analyser ces vastes données. Pour les géants du web tels que Google, Yahoo, Facebook, Ebay… il est très vite devenu primordial pour eux de trouver une solution rapide et peu coûteuse capable d’aller organiser leurs données et d’en retirer les informations voulues. Il existe de nombreuses solutions sur le marché des big data, mais la solution la plus commune est l’outil développé en Open Source : Hadoop. Hadoop est une solution développée par Yahoo se basant sur des recherches de Google. Hadoop n’est pas une solution en elle-même c’est davantage une plate-forme composée de différents programmes comme on peut le voir sur le schéma suivant : 19 DATA BLOG [en ligne]. [Consultéle 19/06/15].Disponiblesur Internet : http://entreprisesnumeriques.co/2015/02/12/le-big-data-exigera-des-bases-de-donnees-nosql-quelles- repoussent-encore-leurs-limites/
  • 19. 14 Figure 3 - Vue synthétique de l'outil Hadoop - d'après le site internet DATACONOMY [en ligne] [consulté le 19/06/15] disponible sur internet - http://dataconomy.com/hadoop-components-need-know/ Les 4 modules principaux qui composent l’outil sont : - Hadoop Distributed File System (HDFS) : « HDFS est comme son nom l’indique un système de fichiers distribué, c’est-à-dire que chaque machine composant la grille Hadoop (cluster en anglais) va héberger une partie des fichiers. Pour simplifier, on peut comparer HDFS à un RAID logiciel distribué sur plusieurs serveurs. Ce système de fichiers possède une capacité d’hébergement parfaitement linéaire (chaque octet de disque ajouté à la grille peut participer à l’hébergement des fichiers), une forte tolérance à la panne, par défaut, chaque fichier est présent en trois exemplaires distribués sur des machines, des racks, voire des data-centers différents. De la même façon, chaque machine apporte ses capacités en I/O au cluster et la grille est donc capable d’absorber rapidement de grandes quantités d’écriture. 20» - MapReduce 21 : cet outil trouve son nom d’après les deux opérations qu’il réalise. La lecture des informations dans la base de données, et la mise en forme dans un format adapté pour l’analyse (Map), puis le rassemblement des informations et leurs analyses pour donner un résultat simplifié (Reduce). 20 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert-magazine/ 21 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: https://www.linkedin.com/pulse/20140709061649-64875646-what-the-heck-is-hadoop-and-why-you-should- know-about-it?trk=mp-author-card
  • 20. 15 - Hadoop Common 40: un outil permettant aux utilisateurs de lire les données stockées sous le système Hadoop files. - YARN 40: ce logiciel gère les ressources du système de stockage des données et des analyses. Hadoop est un outil utilisé par la plupart des sociétés traitant des grandes quantités de données car c’est un outil très flexible et très peu coûteux comme il est en open source, c’est-à-dire que tout le monde peut le modifier librement, et qu’il fonctionne sur tous les serveurs informatiques, mêmes les bas de gamme. 4. Machine learning En 1959, Arthur Samuel a défini le machine learning comme un champ d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés.22 Si le machine learning est bien antérieur aux big data c’est bien grâce au développement de ces derniers qu’il a retrouvé tout son intérêt. « Le machine learning consiste à construire des systèmes qui apprennent les données qu’ils reçoivent. Autrement dit, à partir d’un comportement initial, les algorithmes de machine learning sont capables de se corriger et d’évoluer en fonction des faits dont on les alimente. Ces systèmes sont le plus souvent basés sur des modèles mathématiques, comme les réseaux bayésiens naïfs ou les réseaux neuronaux, pour lesquels on va chercher un paramétrage optimal. La construction d’un système comporte ainsi deux phases. La phase initiale consiste à entraîner la machine, à partir d’un jeu de données connu. Une fois le système entraîné, il faut le confronter au monde réel et l’évaluer régulièrement afin qu’il se corrige et s’améliore à chaque nouvelle donnée reçue.23» Parmi les utilisateurs du machine learning couplé aux big data on retrouve notamment Amazon. Son moteur de recommandation qui suggère les articles les plus pertinents 22 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: http://dataconomy.com/understanding-big-data-machine-learning/ 23 BLOG XEBIA[en ligne].[Consulté le 19/06/15].Disponiblesur Internet: http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert-magazine/
  • 21. 16 pour l’internaute en fonction de ses articles précèdent visionnés "apprend" au fur et à mesure qu’il propose des articles et suivant les actions de l’internaute. Si le machine learning trouve tout son intérêt avec les big data c’est parce qu’avec la masse de données, et l’évolution des puissances de calcul, le machine learning permet d’améliorer avec signification la pertinence des prévisions des systèmes apprenant. 5. Les outils de visualisation Les big data n’ont aucun intérêt si l’analyse des résultats qu’ils fournissent n’est pas compréhensible par une personne humaine. Comme l’explique Jean-Charles COINTOT dans son ouvrage, « les représentations classiques de l’analyse descriptive par des courbes, pour les séries temporelles, par des histogrammes pour les variables continues, bâton pour les variables discrètes, camemberts pour les pourcentages ne sont plus suffisantes. Elles étaient prévues pour des modèles à deux voire trois dimensions maximum. 24». Avec les big data la quantité d’informations à communiquer est beaucoup plus complexe. C’est pourquoi de nouveaux modèles de visualisation des informations ont dû être développé tel que les étoiles, les cubes ou encore les heatmap. Les heatmap sont des cartes qui représentent les zones où les données analysées sont les plus élevées. Les heatmap sont particulièrement utiles pour représenter du parcours client dans les rayons des magasins comme c’est le cas sur l’image suivante. En utilisant les big data on peut ainsi représenter de façon concrète le parcours des clients étant également actifs sur les réseaux sociaux et ayant une carte de fidélité dans le magasin. 24 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 70. ISBN: 978-2-10-071142-0
  • 22. 17 Figure 4 - Heatmapdu parcours client dans un magasin - d'après le site internet TYCO RETAIL SOLUTIONS [en ligne] [consulté le 24/06/15] disponible sur internet - http://www.tycoretailsolutions.com/Pages/ArticleDetail.aspx?ItemId=639 6. Les compétences humaines Les big data nécessitent des compétences en mathématique et en statistiques avancées. Il est également nécessaire d’avoir des compétences avec les outils informatiques, mais également comprendre les enjeux marketing afin de pouvoir produire des analyses permettant aux directions de l’entreprise de prendre des décisions. Un nouveau profil de spécialiste des big data est apparu, le data scientist. D’après IBM, le data scientist est une évolution des postes de data analyst, c’est-à- dire que son rôle est d’analyser des données pour faire apparaitre des modèles et de corrélations entre des évènements qui n’étaient pas identifiables à une petite échelle mais qui sont significatifs. La différence, selon IBM, entre un data analyst et un data scientist réside dans la capacité de ce dernier d’explorer les données de différentes
  • 23. 18 bases de données tandis que le data analyst tirera ses analyses d’une seule base tel qu’un CRM 25. Si le data scientist est au cœur des enjeux du big data c’est l’ensemble des collaborateurs autour des projets big data qui doivent posséder des compétences en la matière. En effet même si le data scientist doit être capable de communiquer avec les dirigeants de l’entreprise et leurs fournir des analyses compréhensibles, ces derniers doivent être en adéquation avec la stratégie big data afin de pouvoir utiliser tous les avantages qu’ils offrent. 7. Benchmark des solutions Il existe aujourd’hui une multitude de solutions sur le marché en France. Certaines clés en main, d’autres en open source, ou encore en mode SaaS, c’est-à-dire que toute la solution est dématérialisée et passe par le cloud. Dans le mapping suivant, extrait d’une étude réalisée par le cabinet Markess International, on distingue clairement les différentes catégories de solutions correspondants aux différents outils qui composent les projets de big data. On retrouve logiquement tous les géants de l’IT qui ont très rapidement créé ou acquis, par l’achat de startup prometteuses, des solutions dédiées aux big data dans ce marché qui est un marché d’avenir et représentant un chiffre d’affaire très important. Dans les acteurs incontournables on retrouve notamment IBM, le géant des solutions informatiques qui propose des solutions à tous les niveaux du projet, de l’infrastructure réseau, à la business intelligence en passant par la gestion des données. La société Apache avec sa technologie Hadoop est également très présente tout comme SAP, Oracle, Microsoft ou encore Capgemini et même Amazon avec son offre hébergé dans le cloud. 25 IBM [en ligne].[Consulté le 24/06/15].Disponiblesur Internet : http://www- 01.ibm.com/software/data/infosphere/data-scientist/
  • 24. 19 Figure 5 - d'après une étude de Markess International : Meilleures approches pour tirer parti du Big Data [en ligne] [consulté le 24/06/15] disponible sur internet : http://blog.markess.fr/2014/09/referentiel-de-pratiques-big-data- strategies-de-gouvernance-des- donnees.html
  • 25. 20 II. Les différents usages du big data Nous avons vu qu'une stratégie big data une fois implémentée dans une entreprise devait lui permettre de gagner de la valeur. Cela ne signifie pas que les big data peuvent uniquement servir dans une stratégie visant à augmenter le chiffre d’affaire de l’entreprise. En effet l’utilisation des big data peut avoir lieu à tous les niveaux d’une entreprise de la chaîne de production au marketing et surtout pour toutes les industries du secteur de la santé à l’agriculture en passant par le monde de la finance. A. Le secteur des télécommunications Le secteur des télécommunications est au cœur du digital. Les opérateurs téléphoniques ont accès à des bases presque illimitées de données. Bien que la plupart ne soit pas exploitable notamment pour des questions d’ordre juridique sur les données privées, la plupart des données qui transitent par les téléphones, télévisions sur IP et antennes relais sont stockées et analysées. Les opérateurs ont pendant longtemps été en retard sur la connaissance de leurs clients car ils ont vécu pendant les vingt dernières années sur un marché en croissance constante, générant de fortes marges et avec une concurrence faible. Aujourd’hui, de nouveaux entrants ont fait leur apparition et les clients sont beaucoup plus attentifs aux prix du marché. C’est pourquoi les opérateurs ont mis à profit les bases de données comportant toutes les informations sur les clients afin de chercher à comprendre leurs attentes. « Fidélisation, connaissance client, système d’engagement sont devenus le crédo de la profession. Au-delà de la fidélisation, les opérateurs cherchent à prédire la probabilité qu’un client décide de passer chez un concurrent et à réagir en conséquence. Ils ont un avantage sur les autres industries dans la mesure où toutes nos communications passent par leur réseau et génèrent des CDR ( call detail records ) dont ils ont connaissance. Ainsi grâce aux technologies big data, il est possible de croiser l’analyse de ces enregistrements pour un abonné, sa navigation sur les sites Web, l’enregistrement éventuel de ses conversations avec le centre d’appel et de support et les « posts » envoyés sur des réseaux sociaux, afin de les combiner avec des analyses plus traditionnelles de type sociodémographique pour
  • 26. 21 en déduire des comportements « à risque » du point de vue de l’opérateur26», c’est-à- dire le risque qu’un client ne quitte l’opérateur pour aller chez un concurrent. En analysant le profil du client, l’opérateur est alors capable de mettre en place des actions marketing personnalisées afin de retenir le client chez lui. Outre les avantages marketing du big data pour les opérateurs de télécommunication, le big data permet aussi aux acteurs de ce secteur de gérer plus efficacement l’optimisation du réseau, et plus exactement la qualité du service et l’optimisation automatique des réseaux. Auparavant les opérateurs disposaient uniquement des informations transmises par les antennes qu’ils possédaient. Avec les big data, ils sont désormais capables de traiter en temps réel des informations semi structurées telles que celles fournies par les terminaux des utilisateurs ainsi que celle de leur propre réseau. Le big data permet même d’aller encore plus loin. En utilisant les informations concernant les pannes passées et les actions humaines qu’il a été nécessaire de réaliser pour réparer le problème les machines "apprennent", et sont capables de réaliser elles-mêmes les actions correctives sans qu’un humain n’est besoin d’intervenir. Les pannes sont ainsi évitées ou réparées instantanément avec un taux d’erreurs très faible fournissant ainsi une qualité de service optimale et constante à l’ensemble des usagers. B. Le secteur de l’énergie Le secteur de l’énergie est un des secteurs les plus stratégiques tant par la dépendance de la population mondiale à l’électricité au quotidien mais également par la prise de conscience mondiale quant aux dangers d’une surexploitation des ressources énergétiques fossiles et nucléaires. Depuis plusieurs années déjà, les gouvernements ont pris conscience de l’enjeu énergétique et déploient des efforts importants afin de réduire la production des gaz à effet de serre et de développer l’utilisation des énergies renouvelables. L’un des principaux défis énergétiques est de réguler la production d’électricité afin qu’elle soit le plus proche possible des besoins réels. Actuellement l’électricité est produite en fonction de prévisions et des analyses 26 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 149. ISBN: 978-2-10-071142-0
  • 27. 22 plus ou moins précises des besoins de la population. De l’électricité est envoyée sur le réseau et tout ce qui n’est pas consommé est perdu. Afin de réduire ces pertes et de diminuer la production d’énergie des réseaux dit intelligents ont été mis en place, on les appelle également « smart grid ». Ces réseaux ont la particularité d’être dotés de capteurs qui transmettent en temps réel des données sur la consommation et la distribution de l’énergie. « Les données captées sont remontées à un niveau local, régional ou central et analysées avec des technologies de big data pour réguler manuellement ou automatiquement le réseau et ses différents niveaux.27» L’utilisation des big data permet donc d’optimiser la production, les grosses centrales électriques produisent de l’électricité en continu et leur production ne peut pas être modifiée instantanément mais la production locale de l’énergie renouvelable peut plus facilement être modulée et redirigée vers d’autres réseaux si besoin. Grâce à l’analyse des besoins et contraintes des tous les acteurs l’acheminement, le transport et la distribution seront également améliorés. En utilisant les données météorologiques il est possible de calculer les capacités de production en énergie solaire et éolienne au niveau local, et les besoins en énergie en fonction de la connaissance de la consommation locale et ainsi d’améliorer la répartition des unités de production en incluant les productions des particuliers. De plus en plus de compteurs intelligents, c’est-à-dire qui remontent l’information presque instantanément aux fournisseurs sont installés chez les consommateurs. Ces données permettent aux fournisseurs de mieux comprendre la consommation des clients et en croisant ces informations avec d’autres informations d’adapter leurs offres tarifaires. C. Le secteur bancaire A l’instar du secteur des télécoms, les banques possèdent énormément de données sur les clients. Mais leur avantage avec les opérateurs téléphoniques est qu’elles possèdent des données relatives aux habitudes et aux comportements de consommations des clients, règlement par carte ou par chèque, retrait, emprunt, 27 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 157. ISBN: 978-2-10-071142-0
  • 28. 23 assurance, épargne, mais aussi les grandes étapes dans la vie des clients telles que la construction d’une maison, la naissance d’un enfant, le mariage… autant de données dites privées qui sont disponibles aux banques. D’après certains analystes, les sociétés gérants les cartes de paiement telles que Visa, ou American express « surveillent désormais les transactions pour savoir si vous présentez le profil de quelqu’un qui s’apprête à divorcer. 28» Si le secteur bancaire regroupe une vaste communauté de métiers très divers et variés tels que les investissements, les banques privées ou publiques, les banques de détails, nous allons nous intéresser principalement aux banques de détails. Le premier avantage des big data pour les banques est la meilleure compréhension de leur clients. Aujourd’hui plus encore les banques n’offrent pas uniquement un moyen de protéger son argent. Les banques offrent des services personnalisés qui répondent à de nombreux besoin de leurs clients, prêts à la consommation et à moyen et long terme : assurances, compte courant, différents moyens de paiement (carte de crédit, carte de paiement, chéquier, paiement en ligne sécurisé,…) mais également différents moyens d’interactions tels que les agences, les centres d’appels, les distributeurs automatiques, les sites internet… En analysant l’ensemble des informations recueillies sur les habitudes de leurs clients, les banques sont capables de fournir un service adapté avec des offres adaptées aux besoins des clients. D’après Gartner 29, les big data sont une des clés pour permettre aux banques de résoudre leurs problèmes de fraudes et de sécurité. Toujours selon eux, l’analyse des big data permet aux sociétés de combiner et croiser des données internes et externes afin de pouvoir voir une image plus large des menaces contre leur entreprise. Pour les banques il est essentiel de pouvoir le plus rapidement possible, accepter ou refuser une transaction, en identifiant correctement s’il y a fraude ou non sans mettre en place des contrôles trop lourds qui rebuteraient les bon clients. En utilisant les capacités des 28 REINFORMATION.TV [en ligne].[Consulté le17/06/15]. Disponiblesur Internet : http://reinformation.tv/big- data-surveiller-achats-predire-divorce-reve-visa/ 29 GARTNER [en ligne].[Consulté le 16/06/15].Disponiblesur Internet : http://www.gartner.com/newsroom/id/2663015
  • 29. 24 big data les banques pourraient ainsi réduire considérablement les risques de fraudes bancaires qui coûtent près de 100 milliards de dollars par an 30. D. Le secteur du commerce Pour l’auteur de l’ouvrage La révolution du big data, « Le commerce est sans doute le secteur où le big data va le plus révolutionner les pratiques. Que ce soit pour la gestion des magasins ou des sites marchands, la gestion du programme de fidélité, des promotions, des réassorts, ou encore de la logistique, son usage impacte toutes les activités du commerce. Cette révolution est en marche aux États- Unis, et démarre en France. 31» Pour les distributeurs, l’utilisation des big data impacte leur secteur sur trois axes essentiellement : - La gestion des stocks - Le ciblage des produits pour les clients - L’assortiment des magasins et des rayons Le premier point, la gestion des stocks, se rapproche des avantages que tire également le secteur de la logistique car tous comme les acteurs de ce secteur il est très important pour les distributeurs d’avoir suffisamment de produits en stock pour ne pas avoir de pénurie, ce qui peut entraîner le mécontentement des clients, sans non plus avoir trop de stock, ce qui engendre des coûts supplémentaires. Grâce aux big data, les distributeurs peuvent désormais analyser les données de diverses sources afin de prévoir les ventes. Ils peuvent par exemple mettre en corrélation leurs propres actions marketing ainsi que celles des concurrents, prendre en compte les informations glanées sur les réseaux sociaux sur les humeurs et les tendances 30 THE GUARDIAN [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet : http://www.theguardian.com/technology/2013/oct/30/online-fraud-costs-more-than-100-billion-dollars 31 COINTOT, Jean-Charles.LA REVOLUTION BIG DATA. Dunod. 2014. Page : 181. ISBN: 978-2-10-071142-0
  • 30. 25 d’achats des clients, tenir également compte de la météo qui influe sur les achats des consommateurs et incorporer les facteurs locaux tels que les matchs ou les festivals. L’autre avantage des big data est, tout comme pour les secteurs que nous avons étudié précédemment, la connaissance client. A l’inverse du secteur bancaire qui possède des informations sur l’ensemble des habitudes d’achat des consommateurs, les chaînes de magasins possèdent uniquement des informations sur les achats effectués dans leurs rayons. Toutefois le niveau de détail de ces informations est beaucoup plus détaillé car les distributeurs ont accès aux tickets de caisse et donc, au détail des produits qui composent le chariot de leurs clients. Grâce aux cartes de fidélités, les magasins ont également la possibilité d’identifier les clients, ils peuvent ainsi réaliser des offres promotionnelles ciblées. Avec l’avènement du e-commerce, le client s’identifie pour faire ses courses en ligne ou les cookies de son ordinateur permettent de l’identifier précisément. Pour le reste le principe est le même, à savoir identifier le profil du client afin de mettre en avant les produits qui seront le plus susceptibles de les intéresser afin de leurs faire consommer d’avantage. Dernière utilisation pour les distributeurs des big data, l’analyse des déplacements des clients dans les rayons, le temps passé devant chaque rayon, ses arrêts, ses achats. Depuis toujours les magasins tentent de trouver le meilleur arrangement de leurs rayons afin que le client puisse passer devant les produits qu’ils souhaitent mettre en avant. En utilisant les données de géolocalisation de leur smartphone par exemple ou grâce à des caméras et des capteurs situés dans les magasins les géants de la distribution peuvent désormais analyser les données des déplacements et croiser ces informations avec la composition des achats des clients. E. Le secteur public Le secteur public entend également tirer parti des avantages des big data. Dans une étude de Markess, cinquante-trois décideurs d’organisations publiques interrogés
  • 31. 26 déclarent avoir des projets en cours sur l’utilisation des big data32. Si les contraintes sont nombreuses, protections des données publiques, contraintes juridiques sur les données personnelles, harmonisation des échanges entre les services, les avantages de la mise en pratique de l’analyse des big data pourraient permettre au gouvernement de faire des économies importantes. Les administrations ont accès à des sources d’informations riches et variées, des données socio-démographiques de leur ville, aux informations de la sécurité sociale en passant aux trafics routiers et les transports en commun. Le gouvernement entend également ouvrir ces informations aux citoyens afin d’offrir des possibilités de développement de solutions s’appuyant sur ces « open data 33 ». Pour le gouvernement les avantages sont multiples : Identification des fraudes fiscales ; Amélioration du système scolaire ; Organisation des territoires, des systèmes de transport, des services aux citoyens ; mais aussi Diminution de la criminalité. Les big data sont donc une priorité pour l’état français, comme le prouve le "plan big data34" amorcée en juillet 2013 par Fleur Pellerin, alors ministre en charge de l’économie numérique. L’autre avantage retirer des big data par le gouvernement est indéniablement la sécurité du territoire. Les Etats Unis en ont fait un fonds de commerce de leur sécurité et lutte contre le terrorisme, ils exploitent toutes les informations qu’ils peuvent récupérer sur les citoyens dans le monde entier. D’après un article du monde, « aux Etats-Unis, avec les trois données que sont le code postal, la date de naissance et le sexe, 90 % des personnes sont désormais identifiables.35 ». De nombreux scandales ont démontré que les informations récoltées par les gouvernements ne s’arrêtaient pas uniquement aux états civils des citoyens : sms, appels, emails, mais aussi profil sur les réseaux sociaux, géolocalisation, les informations laissées sur la toile par les citoyens sont une mine d’or pour les services de renseignement et si certaines lois 32 SYNOMIA [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-secteur-public-des- avancees-sensibles/ 33 DATA.GOUV.FR [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le-secteur-public-des- avancees-sensibles/https://www.data.gouv.fr/fr/ 34 01NET.COM [en ligne]. [Consultéle 17/06/15].Disponiblesur Internet : http://pro.01net.com/editorial/599331/fleur-pellerin-detaille-son-plan-big-data/ 35 LEMONDE.FR [en ligne].[Consulté le 17/06/15].Disponiblesur Internet: http://www.lemonde.fr/idees/article/2015/06/17/faisons-du-big-data-une-chance-pour-l- europe_4655737_3232.html
  • 32. 27 doivent protéger les données personnelles beaucoup sont franchies au nom de la sécurité nationale. F. 4 V et 5 V et… Les 3 V sont à la base des big data, mais d’autres caractéristiques cruciales des big data sont apparues avec un quatrième puis un cinquième puis un sixième voire même un septième V selon certains spécialistes. Parmi les « autres V » que l’on retrouve en plus des 3 qui forment la base nous pouvons mentionner : - Véracité (Veracity) qui définit la qualité des données, bien qu'avec les big data le volume prime sur le manque de qualité, cet aspect reste important afin d’avoir des analyses justes et précises. - Variabilité (Variability) à ne pas confondre avec la variété, la variabilité correspond à la signification des données. Cela est le cas avec l’analyse d’informations provenant des réseaux sociaux ou des forums, suivant le contexte un même mot dans un tweet peut avoir une signification différente et changer complètement le sentiment exprimé. - Visualisation (Visualization), si la lecture des résultats n’est pas simplifiée et clarifiée alors l’étude des résultats ne peut avoir lieu. - Valeur (Value), avoir des big data et les exploiter ne fait pas tout pour une entreprise c’est une perte de temps et de ressources à moins que l’entreprise arrive à transformer ses big data en valeur pour son business. G. Le secteur de la santé Le secteur de la santé n’échappe pas non plus aux big data. D’après le « docteur Eric Baseilhac, directeur des Affaires Economiques du Leem, l’un des principaux syndicats de fabricants de médicaments, l’usage des Big Data dans la santé est une révolution,
  • 33. 28 qui va s’imposer et avoir un impact extrêmement structurant sur le système de santé en général 36 ». Pour les acteurs de la santé les bénéfices sont nombreux : - Prévention des épidémies : comme le relate Viktor MAYER-SCHÖNBERGER et Kenneth CUKIER, en 2009, quelques temps avant la crise sanitaire mondiale du H1N1, des chercheurs de Google ont publié leurs recherches. Leurs recherches visaient à développer un outil qui permettrait d’identifier en temps réel l’évolution d’épidémiesen se basant sur les recherches Google des gens infectés. L’avantage de cet outil par rapport aux méthodes traditionnelles est le résultat en temps réel de la propagation des épidémies alors qu’il faut près de 2 semaines pour les organismes de santé pour recenser les maladies et dresser une carte, déjà périmée donc, des personnes infectées. Aujourd’hui toujours, leur outil fonctionne est permet de suivre l’état de la grippe dans le monde sur le site internet dédié : google.org Flu Trends (http://www.google.org/flutrends). Si cet outil n’est qu’un prototype de ce qu’il est possible de réaliser en utilisant de vastes quantités de recherches comme celles que Google possèdent, on imagine tout le potentiel des prédictions en utilisant les big data et en combinant différentes sources d’information telles que les réseaux sociaux, les achats de médicaments en pharmacie, les arrêts de travail, les appels téléphoniques aux urgences. Avec un algorithme assez puissant et un accès à toutes les informations il est tout à fait concevable de pouvoir identifier les débuts d’épidémies le plus tôt possible et ainsi déployer les moyens nécessaires pour les contenir. - Diagnostiques médicaux : à une échelle plus réduite mais faisant appel à des données tout aussi nombreuses on retrouve l’utilisation des big data pour soigner des patients au cas par cas. C’est déjà le cas aux USA, à New York au Memorial Sloan Kettering Cancer Center plus exactement. Dans cet institut médical les médecins utilisent un outil créé par IBM, Watson, qui permet d’assister les spécialistes dans leurs diagnostiques des patients et dans le choix des traitements.37 Cette technologie repose sur l’analyse de millions de données de cas passés de patients qui ont été traités. Bien plus qu’un simple assistant, la 36 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://frenchweb.fr/e-sante- jusquou-ira-le-big-data-pour-nous-soigner/186343#5hLErJ2kvUxMmkgG.99 37 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : https://www.mskcc.org/blog/msk- trains-ibm-watson-help-doctors-make-better-treatment-choices
  • 34. 29 machine apprend en fonction des nouvelles découvertes médicales du domaine et améliore ses décisions. - Prévention médicale : la compréhension du corps humain bien qu’elle ait énormément évolué depuis le siècle dernier reste encore complexe et de nombreuses maladies bien qu’elles puissent être traitées une fois identifiées ne peuvent pas être anticipées. Avec les big data les chercheurs sont capables d’aller puiser dans des milliards de données patients, du détail de leur génomes jusqu’aux différents événements de leur vie et trouver des modèles récurrents. C’est ce qu’explique le docteur Eric Baseilhac « Avec les données, on va être capable de cibler les bonnes personnes en fonction du risque qu’elles ont de développer telle ou telle maladie 38» Le secteur des télécommunications, de l’énergie, bancaire, du commerce, et public ne sont pas les seules industries d’application des big data. Le big data peut en réalité s’appliquer à toutes les industries, de l’agriculture au sport, l’étendue de ses applications n’a pas de limite et il ne serait pas surprenant de trouver les big data dans toutes les entreprises dans quelques décennies. De la même manière que chaque industrie pourra trouver des avantages qui lui sont propres de l’utilisation des big data, le même procédé s’applique aux différents services d’une entreprise. C’est pourquoi les ressources humaines d’une entreprise pourront trouver des avantages aux big data qui ne seront pas les mêmes que ceux que pourra trouver le département marketing ou le service logistique et transport. H. Ressources humaines Les ressources humaines sont un des domaines où l’usage de l’IT avait peu sa place. Pourtant les mœurs sont en train de changer malgré le fait que « La culture IT des 38 FRENCHWEB [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://frenchweb.fr/e-sante- jusquou-ira-le-big-data-pour-nous-soigner/186343#5hLErJ2kvUxMmkgG.99
  • 35. 30 populations RH frise le zéro absolu 39», comme le déclare le spécialiste d’un cabinet de conseil en transition numérique. Le capital humain d’une société est la clé de son succès, sans collaborateurs efficaces et adaptés la plupart des sociétés se verraient mettre la clé sous la porte rapidement. Le recrutement, la promotion interne, et le taux de turnover sont trois facteurs essentiels qui peuvent être amélioré par l’utilisation des big data. Dans un article du Wall Street Journal de 201240, le journaliste rapporte le cas de la société Xerox. La société possédait un call center et recrutait les candidats en portant beaucoup d’importance sur les candidats qui possédaient une expérience similaire. La société avait un taux de turnover très élevé ce qui lui posait problème car l’investissement en formation des nouvelles recrues était de $5000 et il fallait que le nouvel arrivant reste au minimum 6 mois pour que sa formation soit amortie. En utilisant les big data, la société à découvert que les candidats avec une expérience similaire n’était pas ceux qui démissionnaient le moins, bien au contraire. L’analyse des résultats montraient que des candidats avec une personnalité créative été ceux qui convenaient le mieux au profil du poste. En testant leur nouvelle théorie pendant 6 mois, la société a ainsi réduit de 20% le taux de turn over de ses effectifs. Cet exemple démontre que en utilisant les big data et en recueillant suffisamment de données sur le profil des candidats et le profil du poste, le choix des candidats lors d’un entretien d’embauche peux améliorer le recrutement et donc les performances d’une entreprise. Certaines sociétés appliquent également les big data pour la promotion et la formation de leurs employés. En croisant les informations sur les employés, leurs profils psychologiques, leurs résultats dans l’entreprise, les informations externes à l’entreprise telles que les réseaux sociaux… etc les sociétés peuvent déterminer quel candidat est le mieux adapté pour évoluer sur tel ou tel poste ou encore quel employé a besoin de recevoir telle ou telle formation afin d’être plus performant dans ses missions. En France, l’utilisation des big data pour la sélection, ou la promotion des employés restent encore taboue. Pourtant aux USA, de nombreuses sociétés utilisent déjà ces 39 MYRHLINE [en ligne]. [Consulté le17/06/15]. Disponiblesur Internet : http://www.myrhline.com/dossier- rh/big-data-et-ressources-humaines/article/le-big-data-en-rh-ca-sert-a-quoi.html 40 WALL STREET JOURNAL [en ligne].[Consulté le 18/06/15].Disponiblesur Internet : http://www.wsj.com/articles/SB10000872396390443890304578006252019616768
  • 36. 31 technologies41. Même si de nombreux recruteurs ont peur que la machine prenne leur place dans le recrutement des employés de demain ou s’ils doutent que des chiffres peuvent remplacer leur intuition, la réalité a prouvé que même les performances des hommes peuvent être prévisibles et quantifiable grâce à l’analyse de données. Ce modèle s’applique même au domaine du recrutement de joueurs sportif. Ce fut le cas dans le monde du baseball aux USA comme le relate le film de Brad Pitt, Moneyball42, l’histoire des Red Sox de Boston qui ont utilisé l’analyse de données sur les joueurs afin de constituer l’équipe la plus performante alors même qu’ils ne possédaient pas un gros budget. I. Production et logistique Aujourd’hui de plus en plus de chaînes de production et de logistique sont en partie voire totalement informatisées. Afin de contrôler le fonctionnement des chaînes de production et de logistique et d’identifier les défaillances des machines, de nombreux capteurs, puces RFID, systèmes de localisations sont installés afin de fournir en temps réel des informations aux opérateurs. Les données sont donc d’ores et déjà présentes dans les services production et logistique des entreprises. En production, les directeurs d’usines peuvent utiliser les analyses avancées afin de creuser les historiques des données des chaînes, identifier des récurrences et relations entre les différentes étapes des procédés et ensuite optimiser les facteurs qui semblent avoir les meilleurs effets sur le rendement43 . Pour Jean-Charles COINTOT « dans les usines, le big data permet de trouver les meilleurs réglages à partir de données réelles collectées en masse dans le processus de production. Grâce aux outils de visualisation, il devient possible d’observer ce qu’il se passe lorsque les réglages de la chaîne de production varient ensemble.44 » Le lancement de nouveaux produits peut alors être simulé et modélisé et ainsi prévenir de toutes les erreurs de conception que 41 WORK FORCE [en ligne].[Consulté le18/06/15]. Disponiblesur Internet : http://www.workforce.com/articles/companies-making-hr-big-data-work 42 WIKIPEDIA[en ligne]. [Consultéle 18/06/15].Disponiblesur Internet : https://en.wikipedia.org/wiki/Moneyball_(film) 43 MCKINSEY [en ligne]. [Consulté le16/06/15]. Disponiblesur Internet : http://www.mckinsey.com/insights/operations/how_big_data_can_improve_manufacturing 44 COINTOT, Jean-Charles.LA RÉVOLUTION BIG DATA. Dunod. 2014. Page : 124. ISBN: 978-2-10-071142-0
  • 37. 32 cela pourrait engendrer. Les big data permettent également de prévenir le remplacement de pièces, c’est le cas pour Airbus qui utilisent les centaines de capteurs présents dans ses avions afin d’analyser quelles pièces sont susceptibles de devoir être changées en fonction de tous les facteurs extérieurs qui peuvent rentrer en compte, on parle ici de maintenance préventive 45. Les ressources humaines et la production et logistique ne sont pas les seuls services de l’entreprise qui peuvent tirer profit des big data. Les services risques et fraudes sont également amenés à utiliser cette technologie afin de détecter les mauvais payeurs et d’anticiper les risques liés à leur entreprise. Autre département de l’entreprise très demandeur des big data, le marketing et vente. C’est dans ce domaine que le marketing est aujourd’hui le plus utilisé et nous évoquerons ses bénéfices dans un autre chapitre. 45 L’USINE DIGITALE [en ligne]. [Consultéle 16/06/15].Disponiblesur Internet : http://www.usine- digitale.fr/article/les-big-data-ouvrent-l-ere-de-l-aeronautique-de-service.N334101
  • 38. 33 III. Big data et marketing A. Le marketing prédictif et fidélisation Parmi les avantages liés aux big data pour le marketing on distingue le marketing prédictif. Si on devait résumer le marketing prédictif dans le monde de l’entreprise, on le définirait comme l’analyse poussée des comportements actuels des clients ayant pour objectif final d’anticiper leurs actions et de leurs suggérer des solutions ultra adaptées. D’après Yohan Stern, directeur général de Key Performance Group, « la magie du marketing prédictif, c'est de faire passer les marketeurs de la prédiction basée sur l'intuition et l'irrationnel à la prévision basée sur des données et des probabilités de réussite. Traditionnellement, un marketeur utilise son intuition et sélectionne arbitrairement quelques facteurs, qui doivent, selon toute vraisemblance, permettre de créer des segments ou des scoring pertinents : l'âge pour tel vêtement de mode, ou, encore, le sexe pour l'achat de tel produit au chocolat. 46» Aujourd’hui, le marketeur n’est plus obligé de se baser uniquement sur son intuition car il a accès aux données internes et externes sur ses clients et prospects en provenance de différentes sources (réseaux sociaux, email, application mobile, site web, forum…). En utilisant les puissances de calcul des big data et la capacité de faire ressortir des corrélations entre des signaux faibles, le marketeur peut s’appuyer sur des informations concrètes, basées sur des données en temps réel. Avec un tel outil entre les mains il n’a pas été compliqué pour les marketeurs de trouver des applications concrètes à leur métier tel que la fidélisation. 46 EMARKETING.FR [en ligne]. [Consultéle 25/06/15].Disponiblesur Internet : http://www.e- marketing.fr/Thematique/digital-data-1004/Big-Data-10021/Breves/Tribune-Marketing-predictif-quand-Big- Data-anticipe-actions-consommateurs-252194.htm
  • 39. 34 La fidélisation Le taux d’attrition, c’est-à-dire le taux de clients qui quittent leur fournisseur pour se tourner vers un concurrent, a toujours été une des préoccupations principales du département marketing. Les raisons d’une rupture entre un client et un fournisseur peuvent être multiples, le client peut trouver un prix plus attractif chez la concurrence par exemple, il peut aussi ne plus être satisfait par le produit ou le service proposé par son fournisseur, la relation client peut également s’être détériorée du fait d’une mauvaise entente encore le client et son commercial, ou encore le client peut avoir subi de nombreuses pannes ou désagrément avec les produits de la société… Il est très compliqué de prédire si un client va rester fidèle ou non à son fournisseur et bien souvent lorsqu’une entreprise s’aperçoit que son client veut la quitter pour la concurrence il est déjà trop tard et même les actions marketing pour le retenir qu’elle peut mettre en place ne peuvent réparer une décision d’un client de partir. Le graal des entreprises serait d’être capable de prédire la perte d’un client et d’anticiper si un client a prévu de les quitter afin, avant qu’il ne soit trop tard, de mettre en place des actions marketing pour l’inciter à rester chez son fournisseur. Malheureusement les boules de cristal n’ont toujours pas prouvées leur efficacité et les machines à remonter le temps n’ont pas encore été inventées. Toutefois avec les big data les entreprises ont découvert qu’il leur était maintenant possible d’analyser les comportements de leurs clients non plus uniquement en se basant uniquement sur les retours des commerciaux mais en utilisant l’ensemble des points d’interaction entre le client et son fournisseur. Une entreprise de télécom suisse, avait un taux d’attrition de 19 % alors que la moyenne de leur secteur était située autour de 12%. Chaque année les équipes marketing étaient obligées de déployer des efforts considérables afin de combler cette perte de clientèle. Le directeur marketing décida de se tourner vers les big data afin trouver une solution à ce problème. La première étape fut de collecter et rassembler l’ensemble des données clients éparpiller entres les différents services de l’entreprise tel que le service marketing, le service client et SAV ou encore le service facturation. Lorsque ces données ont pu être analysées, les big data ont permis de constater que la majorité des clients qui résiliait leur abonnement étaient des clients qui partaient 11
  • 40. 35 mois après leur engagement. Plus important encore il était possible en utilisant toutes les informations collectées par l’entreprise de trouver des signaux faibles, c’est-à-dire des évènements dans les actions des clients uniquement visible lorsque l’on croise l’ensemble des différentes données sur le client et ce pour des milliers de clients, identifiable quelques mois avant que celui-ci résilie son contrat. En mettant en place une série d’actions marketing chez ses clients qui possédaient les signaux d’une probabilité élevée de rompre leur contrat, l’entreprise a ainsi pu réduire son taux d’attrition de 19 % à 2 %. Cet exemple est un exemple concret d’application des big data à la fidélisation client. Les big data en utilisant des masses d’informations importantes sur des milliers de clients arrivent à détecter des similitudes entre des profils de clients. En utilisant également l’historique de clients déjà perdus on peut définir les indicateurs qui ont précédé la perte d’un client et ainsi identifier les clients possédant ces signaux et donc d’anticiper leur fuite. B. Real-time marketing et native advertising Le marketeur le sait, plus il est réactif plus son action aura d’impact sur le consommateur. Cette théorie est aujourd’hui aisément vérifiable sur les réseaux sociaux. Les marques cherchent à être le plus proche de leurs clients possible. En adaptant leur communication en fonction de l’actualité récente les marques cherchent à surfer sur les buzz du moment mais surtout à montrer aux consommateurs qu’elles sont comme eux, connecté à la réalité du moment et qu’elles peuvent réagir instantanément sur importe quel sujet. Les campagnes de publicité couteuses et créés par des grandes agences de communication existent toujours et continueront d’être diffusées sur les grandes chaines télévisées aux heures de grandes écoute, mais les marques l’ont bien compris, une campagne de publicité sur TF1 à 20h00 peut avoir autant d’impact qu’un Tweet ou un post ciglant au bon moment, à la différence que le coût varie d’un extrême à un autre. Cette action aujourd’hui de plus en plus populaire sur Twitter et Facebook « a connu un essor fulgurant en 2013 lorsque la marque Oreo, en pleine finale du Super Bowl, a
  • 41. 36 rebondi quasi-instantanément à une coupure d’électricité durant le match avec un tweet devenu un vrai cas d’école : Power Out? No Problem. You can still dunk in the dark. En capitalisant sur un événement sportif planétaire, la marque a obtenu plus de 15 000 retweets. Pour un investissement minime, comparativement au coût de diffusion d’un spot TV sur les chaînes américaines durant cet événement, qui s’élève en moyenne à 4 millions de dollars. 47» Tweet que l’on retrouve sur l’image suivante. Figure 6 - Un tweet de la marque OREO en plein Super Bowl- d'après le site internet E-MARKETING.FR [enligne] [consulté le 07/07/15] disponible sur internet - http://www.e-marketing.fr/Thematique/Direct-Digital-1003/Tribunes/le-real-time- marketing-a-lheure-des-medias-sociaux-246136.htm 47 WEBMARKETING-COM.COM [en ligne]. [Consultéle 07/07/15].Disponiblesur Internet : http://www.webmarketing-com.com/2015/04/03/36983-big-data-5-exemples-de-son-utilisation-marketing
  • 42. 37 Si poster des statuts ou tweet instantanément ne requiert pas l’utilisation des big data ce n’est pas le cas des annonces display. Elles sont partout, sous forme d’image, de GIF ou encore de vidéos, les sont présentes sur les blogs, ou les sites internet et mêmes au début des vidéos YouTube. La bannière ou annonce display reste un moyen efficace de capter l’attention du consommateur et de communiquer pour une marque et/ou de ramener le client vers le site web désiré. Depuis fort longtemps déjà les marketeurs ont mis en place des cookies, ces balises internet chargées de collecter les informations de navigation sur l’internaute afin de pouvoir le définir et ainsi lui proposer de la publicité ciblé par exemple. Ainsi lorsque l’on navigue sur Amazon à la recherche de la dernière paire de bottes tendance par exemple, il n’est pas rare de voir réapparaitre ces mêmes bottes dans une bannière publicité alors qu’on est en train de lire un article sur un blog de jardinage. De très nombreux site de e-commerce tel que Amazon, Cdiscount, La FNAC, ou encore EBay utilisent les bannières web afin de promouvoir leurs produits qu’ils affichent sur des sites à fort trafic tel que Facebook, Google, ou LeMonde.fr. Si les cookies réalisent parfaitement leur travail de tracking et de collecte d’informations sur les visiteurs, les big data apportent l’analyse de l’ensemble des paramètres de l’environnement. En effet le contenu publicitaire d’une annonce display aura beaucoup plus d’impact sur un visiteur si son contenu prend en compte premièrement le profil du visiteur en utilisant son historique de navigation comme les cookies le font actuellement mais également le site internet sur lequel la bannière va être mise en avant. En analysant le contenu d’une page web d’un article de presse par exemple, c’est-à-dire en utilisant la capacité d’analyse de texte des big data, la publicité peut cibler le visiteur et promouvoir une annonce en rapport avec l’information qu’il recherche au même moment ce qui aura un effet beaucoup plus important dans l’esprit de l’internaute que si il voyait apparaitre ses bottes d’Amazon qu’il a vu la veille alors qu’il est concentré pour rechercher des informations sur la culture de son potager.
  • 43. 38 C. Le ciblage Toutes les entreprises, à l’exception peut-être de certaines sociétés et start-ups, possèdent de multiples clients depuis plusieurs années. Chaque client est unique et différent. Toutefois, les clients d’une entreprise ont des besoins similaires et possèdent donc des similitudes dans leur profil. La majorité des sociétés ont accumulé au fil des années beaucoup d’informations sur leurs clients. Le service marketing par exemple possède des informations sur le portefeuille client de l’entreprise, le service commercial possède également des informations sur les prospects et clients contenues dans son CRM qui est rempli par les commerciaux. Le service facturation également, tout comme le service achat dans sa relation avec les fournisseurs possède des informations sur les factures et paiements des clients. Si toutes ses données sont rassemblées et analysées il est alors possible de dresser un profil type de client de l’entreprise et même de définir des profils de client avec des potentiels de chiffre d’affaire important. En utilisant les big data, les entreprises cherchent à retrouver des caractéristiques entres leurs clients existants et les prospects qui composent leur base. Cette méthode semblable à du scoring, déjà utilisé dans de nombreuses entreprises, utilise les capacités des big data d’extraire de l’information de sources qui n’étaient pas exploitables auparavant tel que les commentaires mis dans le CRM ou encore les informations laissées sur internet par le prospect. Les entreprises peuvent ainsi cibler plus précisément encore les prospects qui représentent les plus gros potentiels de chiffre d’affaire dans l’avenir mais également les solutions et produits qui seront susceptibles de les intéresser d’avantage. Avec les big data le marketeur possède une vision à 360° du client pour comprendre comment il raisonne afin de réaliser la bonne action, au bon moment, vers la bonne cible et qui va permettre au consommateur de réaliser un acte d’achat. Les big data ne sont pas une révolution des pratiques marketing déjà existantes. C’est davantage une évolution des techniques actuelles avec des outils permettant d’être plus précis, d’anticiper, et d’être plus réactif afin d’améliorer les recettes de l’entreprise.
  • 44. 39 Seconde partie : Les big data face aux professionnels
  • 46. 41 Troisième partie : L’utilisation des big data dans l’entreprise Cofely Ineo &
  • 48. 43 Bibliographie Ouvrages : COINTOT, Jean-Charles. LA RÉVOLUTION BIG DATA. Dunod. 2014. ISBN: 978-2- 10-071142-0 Viktor MAYER-SCHÖNBERGER ; Kenneth CUKIER. BIG DATA: A REVOLUTION THAT WILL TRANSFORM HOW WE LIVE, WORK, AND THINK. John Murray. 2013. ASIN: B00GOHL9H6 Sources web : 01NET.COM [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://pro.01net.com/editorial/599331/fleur-pellerin-detaille-son-plan-big-data/ BBC [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet : http://www.bbc.com/news/business-26383058 BLOG DU MODERATEUR [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet : http://www.blogdumoderateur.com/chiffres-internet/ blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://blog.xebia.fr/2013/11/13/panorama-des-technologies-big-data-it-expert- magazine/ blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://dataconomy.com/understanding-big-data-machine-learning/ blog xebia[en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : https://www.linkedin.com/pulse/20140709061649-64875646-what-the-heck-is- hadoop-and-why-you-should-know-about-it?trk=mp-author-card BLOG.TERADATA [en ligne]. [Consulté le 08/07/15]. Disponible sur Internet : http://blogs.teradata.com/data-points/evaluating-and-planning-for-the-real-costs-of- big-data/
  • 49. 44 data blog [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://entreprisesnumeriques.co/2015/02/12/le-big-data-exigera-des-bases-de- donnees-nosql-quelles-repoussent-encore-leurs-limites/ DATA.GOUV.FR [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le- secteur-public-des-avancees-sensibles/https://www.data.gouv.fr/fr/ DOMO [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : https://www.domo.com/learn/data-never-sleeps-2 EMARKETING.FR [en ligne]. [Consulté le 25/06/15]. Disponible sur Internet : http://www.e-marketing.fr/Thematique/digital-data-1004/Big-Data- 10021/Breves/Tribune-Marketing-predictif-quand-Big-Data-anticipe-actions- consommateurs-252194.htm frenchweb [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://frenchweb.fr/e-sante-jusquou-ira-le-big-data-pour-nous- soigner/186343#5hLErJ2kvUxMmkgG.99 frenchweb [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : https://www.mskcc.org/blog/msk-trains-ibm-watson-help-doctors-make-better- treatment-choices GARTNER [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.gartner.com/newsroom/id/2663015 IBM [en ligne]. [Consulté le 24/06/15]. Disponible sur Internet : http://www- 01.ibm.com/software/data/infosphere/data-scientist/ ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : http://www.cbnews.fr/etudes/toujours-plus-de- smartphones-et-tablettes-selon-mma-france-a1013528 ITU : INTERNATIONAL TELECOMMUNICATION UNION [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : http://www.itu.int/en/ITU- D/Statistics/Documents/facts/ICTFactsFigures2015.pdf
  • 50. 45 JOURNAL DU NET [en ligne]. [Consulté le 01/06/15]. Disponible sur Internet : http://www.forbes.com/sites/oreillymedia/2012/01/19/volume-velocity-variety-what- you-need-to-know-about-big-data/2/ JOURNAL DU NET [en ligne]. [Consulté le 01/06/15]. Disponible sur Internet : http://www.journaldunet.com/solutions/dsi/big-data-megadonnees-0814.shtml journal du net [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://blog.ontrack.fr/big-data-pourquoi-nosql/ journal du net [en ligne]. [Consulté le 19/06/15]. Disponible sur Internet : http://www.journaldunet.com/solutions/expert/61369/big-data--la-3eme-phase.shtml L’USINE DIGITALE [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.usine-digitale.fr/article/les-big-data-ouvrent-l-ere-de-l-aeronautique-de- service.N334101 LEMONDE.FR [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://www.lemonde.fr/idees/article/2015/06/17/faisons-du-big-data-une-chance-pour- l-europe_4655737_3232.html LEMONDEINFORMATIQUE.FR [en ligne]. [Consulté le 19/07/15]. Disponible sur Internet : http://www.lemondeinformatique.fr/actualites/lire-les-salaires-des-8- competences-les-plus-recherchees-en-big-data-56610-page-1.html MCKINSEY [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.mckinsey.com/insights/operations/how_big_data_can_improve_manufact uring myrhline [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://www.myrhline.com/dossier-rh/big-data-et-ressources-humaines/article/le-big- data-en-rh-ca-sert-a-quoi.html REINFORMATION.TV [en ligne]. [Consulté le 17/06/15]. Disponible sur Internet : http://reinformation.tv/big-data-surveiller-achats-predire-divorce-reve-visa/ SCIENCE DAILY [en ligne]. [Consulté le 03/06/15]. Disponible sur Internet : http://www.sciencedaily.com/releases/2013/05/130522085217.htm
  • 51. 46 SITE INTERNET DE COFELY [en ligne]. [Consulté le 15/07/15]. Disponible sur Internet : http://cofely-gdfsuez.com/profil SYNOMIA [en ligne]. [Consulté le 02/06/15]. Disponible sur Internet : http://www.synomia.fr/fr/vision-et-techno/synomia-menu-la-data-non-structuree SYNOMIA [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://blog.administrationnumerique.markess.com/2014/07/projets-big-data-dans-le- secteur-public-des-avancees-sensibles/ THE GUARDIAN [en ligne]. [Consulté le 16/06/15]. Disponible sur Internet : http://www.theguardian.com/technology/2013/oct/30/online-fraud-costs-more-than- 100-billion-dollars wall street journal [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet : http://www.wsj.com/articles/SB10000872396390443890304578006252019616768 WEBMARKETING-COM.COM [en ligne]. [Consulté le 07/07/15]. Disponible sur Internet : http://www.webmarketing-com.com/2015/04/03/36983-big-data-5-exemples- de-son-utilisation-marketing Wikipedia [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet : https://en.wikipedia.org/wiki/Moneyball_(film) work force [en ligne]. [Consulté le 18/06/15]. Disponible sur Internet : http://www.workforce.com/articles/companies-making-hr-big-data-work