1. La révolution du Big Data: une interview de Stéfan Galissié, Chief Data
Officer d’Ogilvy Paris
Aloïs Kirner
Janvier 2015
Des assurances aux sites de rencontres en passant par le sport, la science politique ou la
santé publique, aucun champ d’activité humaine ne semble aujourd’hui échapper au Big Data –
ce phénomène d’accumulation massive des données en tous genres. Les agences ne sont pas en
reste. J’ai rencontré Stéfan Galissié, Chief Data Officer d’Ogilvy Paris, pour comprendre ce
qu’un mathématicien pouvait bien faire dans une agence créative, et discuter de l’incroyable
potentiel du Big Data.
L’usage de l’expression « Big Data » semble avoir explosé dans les trois dernières années
(un postulat confirmé par Google Trends). Le phénomène est-il si récent ?
La collecte des informations n’a rien de nouveau, et l’analyse des données est elle-même une
science ancienne. Si les méthodes et le type de données analysées ont fortement évolué au cours
du temps, le Big Data s’inscrit ainsi dans une longue tradition scientifique et statistique.
Au XIXème siècle par exemple, on pratiquait déjà le traitement de grands ensembles de
données quantitatives de manière particulièrement sophistiquée. L’ingénieur français Charles
Joseph Minard (1781 – 1870) constitue un véritable pionnier de la data. Ses analyses statistiques
et économiques sur la rentabilité des canaux navigables, l’usage des routes et la consommation de
viandes ont permis une meilleure compréhension des besoins et une optimisation des
investissements publics. Sa Carte figurative des pertes successives en hommes de l’Armée
française dans la campagne de Russie en 1812-1813, une représentation graphique de
l’hécatombe de la campagne de Russie, lui valut le respect des statisticiens. Telles les
infographies d’aujourd’hui, sa Carte figurative fournit une réponse précoce au défi de tout Data
Modelist: comment visualiser les données pour mieux les analyser?
2. La « Carte figurative » de Joseph Minard : du Big Data avant l’heure ?
Derrière l’expression « Big Data », héritière des concepts de Data Mining et Web Mining en
vogue dans les années 90, se cache donc une vraie tendance de fond. Ce qui change aujourd’hui,
c’est la magnitude des ensembles de données collectés, couplée à des capacités de stockage sans
précédent et une analyse toujours plus fluide et rapide de l’information. Là réside la vraie
révolution.
La data semble aujourd’hui omniprésente. Qu’en est-il vraiment, et quel est son véritable
potentiel ?
Parce que toute activité humaine génère une certaine quantité d’informations, le Big Data est
un phénomène qui concerne tous types d’organisations. Les exemples d’usages abondent et
varient – mais permettent à chaque fois d’optimiser les ressources, de gagner en efficacité et en
réactivité.
Les géants de la grande distribution, comme Walmart ou Kohl’s, croisent leurs chiffres de
ventes avec des données démographiques, économiques et climatiques pour adapter leur sélection
de produits à la clientèle de certains magasins et programmer les rabais. Les sites de rencontres
passent au crible les profils de leurs utilisateurs pour nourrir de puissants algorithmes qui
rendront la découverte de l’âme sœur (mathématiquement) plus probable. La police de New York
associe les statistiques de criminalité passée avec des données plus surprenantes comme les
bulletins météorologiques, les dates d’évènements sportifs, les jours fériés et les jours de paie
pour anticiper les points chauds et optimiser le déploiement des forces de l’ordre.
Des exemples moins évidents, mais tout aussi parlants, témoignent de l’impressionnant
potentiel de la data. Le journaliste américain Michael Lewis explique dans son livre Moneyball
3. (2003) comment un club de baseball de second rang, les Oakland A’s, a trituré des statistiques de
matchs pour identifier les joueurs les plus sous-estimés (et qui auraient donc offert un rapport
qualité-prix intéressant). Lady Gaga passe au crible les caractéristiques et les conversations de ses
millions de fans sur les réseaux sociaux pour analyser l’impact de ses chansons. En bref, pas un
domaine n’est épargné par la data.
Le Big Data, c’est avant tout de gros serveurs, comme ici au siège de Facebook en Californie.
Data Analyst, Data Modeler, Chief Data Officer,…: ces nouveaux métiers en vogue dans les
agences semblent trancher fortement avec l’importance traditionnelle accordée aux
compétences créatives. Alors comment expliquer l’importance croissante des expertises
« data » dans les agences créatives?
Qui a-t-il de plus fiable pour définir les comportements et attentes des consommateurs, que
leurs données ? A travers l’analyse précise des consommateurs, les marques peuvent aujourd’hui
cibler, programmer et personnaliser leurs actions. Elles obtiennent ainsi des insights plus précis,
permettant de meilleurs briefs et donc de meilleures pistes de décollage pour la création. Les
marques peuvent également analyser l’impact réel d’une campagne à postériori. Autant de
possibilités qui expliquent l’importance croissante des compétences « data » dans les agences.
Mais les algorithmes seuls ne font pas tout : c’est en combinant ces expertises « data » avec
une démarche créative que nous parvenons à créer de nouveaux usages. Il faut un œil créatif pour
détecter dans le flot illimité de données les quelques tendances qui émergeront demain. En ce
sens, les chiffres et l’imagination sont complémentaires.
De manière générale, le Chief Data Officer s’assure de la qualité et de la cohérence des
données qui circulent dans l’organisation. Il a donc un rôle central dans le traitement des données
récoltées chaque jour par tous les services. Afin de pouvoir les exploiter, il faut avant tout qu’il
4. les qualifie: de « données brutes », elles deviennent des « données contextualisées ». Elles sont
alors d’une qualité suffisante pour constituer la matière première de la prise de décision.
Nous recevons mercredi 11 février Henri Verdier, Chief Data Officer de l’administration
française. Comment le CDO de l’Etat pourrait-il travailler avec un CDO du secteur privé ?
La force du Big Data repose sur la possibilité de croisement de données de toutes natures et
origines. C’est en mélangeant des informations économiques, sociologiques, comportementales,
etc qu’on peut obtenir un vaste ensemble descriptif dans lequel on puise des corrélations et des
tendances significatives. En ce sens, les entreprises travaillent déjà avec les données des
administrations publiques ou des instituts statistiques comme l’INSEE.
Cependant, il ne s’agit pas d’une véritable coopération : si la plupart des administrations
pratiquent l’open data, les entreprises, elles, n’ont ni le désir ni l’habitude de partager leurs
données (soient-elles des plus insignifiantes). Le droit européen demeure par ailleurs très strict
sur la question de la publication de données privées.
Pourtant, les grandes entreprises possèdent une immense richesse de données de grande
qualité, qui, si elles étaient exploitées, pourraient servir à améliorer l’action publique.
Réciproquement, une plus grande coopération profiterait également aux entreprises, dans la
mesure où une meilleure compréhension des tendances aiguiserait leur compétitivité.
Que peut-on faire pour aller plus loin?
Pour les plus studieux, le Mooc (Massive Open Online Course) «Introduction to Data
Science» de l’Université de Washington vous donnera une bonne compréhension des notions de
base. Il dure 8 semaines et est disponible sur Coursera.