3. datavizLa data visualization : encore un terme
commercial à la mode ou bien une réalité dans
les entreprises ? Pour le savoir, nous avons mené
l’enquête auprès d’un vaste panel de sociétés,
tous secteurs confondus (industrie, médias,
transport, distribution, services, etc.). Résultat :
plus de 30 entreprises nous ont décrit, non pas
les avantages théoriques de la représentation
visuelle des données, mais des projets concrets,
produisant déjà des résultats.
Leurs retours d’expérience, comme il se doit
richement illustrés, et des mises en perspective
d’experts, vous aideront à comprendre ce
qu’est la "dataviz" et comment en tirer parti
dans votre métier.
4. 4
6
7
16
32
44
58
59
73
75
77
80
82
84
87
96
117
122
123
127
130
132
introduction
1. la dataviz et vous : présentations
1.1 définition(s) de la dataviz
1.2 à quoi sert la dataviz ?
1.3 une innovation ou une révolution ?
1.4 à qui s’adresse la dataviz ?
2. les bénéfices de la data visualization
2.1 2.1 la dataviz facilite la compréhension des données
2.2 2.2 la dataviz améliore la communication
2.3 2.3 la dataviz optimise et accélere la prise de decision
2.42.4 la dataviz contribue à la motivation des collaborateurs
2.5 2.5 la dataviz favorise l’innovation
3 3. caractéristiques des projets dataviz
3.1 3.1 des projets rapides et légers
3.23.2 impact de la dataviz sur les relations entre l’IT et les métiers
3.33.3 facteurs clés de succès
3.4 3.4 écueils à éviter
4. perspectives
4.14.1 le futur des projets
4.24.2 tentative de prospective
conclusion
contributeurs
page
sommaire
5. 5
1.1 définition(s) de la dataviz
fig 1 - sommaire
comprendre
la data visualization
au travers de
30 cas concrets
introduction
contributeurs
conclusion
1 .1
4 .1
1.2
6
16
32
44
58
7275778082
87
96
117
123
127
130
132
1.3
1.4
2 .1
3 .1 2.22.32.42.5
3.2
3.3
3.4
4.2
4146
6. uand on s’arrête un peu sur le terme "données",
on s’aperçoit qu’il est particulièrement ambigu.
Qu’est-ce qui est ainsi donné dans l’entreprise ?
Chiffres, indicateurs, tableaux… Il est vrai que les
data sont aujourd’hui omniprésentes et apparaissent
comme une évidence. Pourtant, elles sont très difficiles
à appréhender, tel le sable disponible à profusion,
mais qui toujours vous glisse entre les doigts.
Les données qui s’offrent ainsi aux professionnels
pour les guider dans leurs décisions sont de plus
en plus nombreuses et variées. Mais comment ne pas
être submergé et en faire un réel outil pour la réflexion
et la prise de décision ? C’est face à cette nécessité
que la data visualization apparaît comme une solution.
La représentation des données sous forme d’images
pourrait permettre de mieux les comprendre.
Le monde des chiffres et celui des images sont a priori
très éloignés. Mais comme souvent, c’est en abattant
des a priori que l’on progresse. C’est ce qu’ont su faire
les trente entreprises interrogées dans le cadre de cet
ouvrage, qui font figure de pionnières dans l’usage
concret de la data visualization. Elles vont nous guider,
grâce à leurs expériences pratiques, pour découvrir
ce qu’est la data visualization et comment s’en servir.
Chemin faisant, des experts de SAS, mais aussi des
acteurs et des observateurs du marché éclaireront
certains aspects de la "dataviz", en les replaçant dans
le contexte plus général de la Business Intelligence.
Q
introduction
7. La première partie de ce livre sera consacrée à un tour
d’horizon de la data visualization. Nous tâcherons
de la définir et examinerons ses origines. Nous verrons
que ses usages sont multiples et qu’elle s’adresse à un
vaste panel d’acteurs, dans des secteurs diversifiés.
La deuxième partie s’attachera à mettre en lumière
les bénéfices de la data visualization, notamment
sous ses trois aspects de la découverte et de l’analyse
des données, et de la communication de l’information.
Nous verrons également comment elle se place
par rapport à la business intelligence traditionnelle.
En troisième lieu, nous examinerons la manière
de mener un projet de data visualization. Nous
passerons en revue les principaux critères de réussite
et identifierons les chausse-trappes à éviter.
Enfin, nous élargirons le spectre pour envisager
le futur de la dataviz et la manière dont les entreprises
utilisatrices interrogées ici prévoient de faire
évoluer leurs usages.
Prêts à embarquer et à découvrir la terra incognita
des données ? Alors, hissez les voiles !
L’exploration commence.
introduction
7
9. 9
1.1 définition(s) de la dataviz
Qu’on l’écrive à l’américaine data visualization,
en franglais "datavisualisation" ou familièrement sous
son petit nom de "dataviz", la représentation graphique
de données statistiques est incontestablement à la
mode. Et comme tous les mots à la mode, elle devient
un terme fourre-tout, dont on finit par ne plus très bien
savoir ce qu’il signifie. Commençons donc par tenter
une définition. Fort heureusement, dans cette gageure,
nous ne serons pas seuls, car les contributeurs de
l’ouvrage ont bien voulu nous prêter main-forte.
SAS définit la data visualization comme "l’exploration
visuelle et interactive et la représentation graphique
des données, quelles qu’en soient la volumétrie
(des small data aux big data), la nature ou la provenance.
Elle permet aux utilisateurs métier de détecter
des phénomènes ou des tendances invisibles
de prime abord."
1.1 définition(s) de la dataviz
10. 11
Nos contributeurs se retrouvent assez bien dans
cette vision, à en juger par leurs propres définitions :
Nous considérons la Data Visualization
comme un moyen de mettre à la disposition
de l’utilisateur une information sous forme
visuelle, de manière à en faciliter l’accès.
Caroline Denil, Data Warehouse Program Manager,
SPF Economie
La Data Visualization est l’art
de représenter visuellement,
et ce pour favoriser la meilleure
compréhension possible.
Jérôme Tharaud,
Responsable des études et
développement,
Prisma Media
Nous avons mis
en gras les termes
qui nous paraissent
les plus intéressants :
"forme visuelle"
aussi évident que cela puisse
paraître, c’est le fondement
de la dataviz : il s’agit de
représenter les données
de manière visuelle, graphique ;
"faciliter l’accès"
la représentation graphique
n’est pas gratuite, elle est au service
d’objectifs, dont le premier est de
permettre d’accéder plus facilement
à l’information véhiculée par
les données. Il est en effet plus
aisé et agréable de considérer un
graphique qu’une série de chiffres.
Ce que Guillaume Deschamps de
STMicroelectronics formule ainsi :
la dataviz "est un moyen de traduire
un ensemble de données abstraites
et sèches en une information que
l’on puisse appréhender" ;
"Data visualization" :
petit florilège de définitions
11. 11
Nous définissons la Data Visualization
comme le fait de visualiser des données pour mieux
les exploiter et en tirer des insights qui, autrement,
prendraient plus de temps. Elle permet d’avoir une
compréhension plus rapide et meilleure.
Charles du Réau,
Consumer & Market Knowledge Director, Ubisoft
La Data Visualisation est un système
permettant, via le support de
représentations graphiques, une prise
de décision factuelle et plus rapide.
Guillaume Deschamps,
Engineering Data Analysis Manager,
STMicroelectronics
La Data Visualization est un outil au service
du partage de l’information.
Ils’agit donc d’un procédé qui marque une rupture
avec le reporting classique : un tableau se distribue...
alors qu’un graphe se partage avec d’autres.
François Nguyen,
Directeur SI décisionnel et marketing relationnel, SFR
"compréhension"
il s’agit de donner du sens
aux données, pour en tirer
de l’information ;
"exploiter",
"prise de décision"
la dataviz ne permet pas
seulement une compréhension
intellectuelle, elle transforme
un ensemble de données
brutes en une information
permettant d’agir ;
"plus rapide"
la dataviz accélère la
compréhension, la décision
et l’action que nous venons
d’évoquer ;
"partage de l’information"
elle est également un mode de
communication, permettant
que les données ne restent pas
cantonnées à l’univers de la BI
ou de la statistique mais infusent
toute l’organisation et deviennent
un support de décision et de
travail collaboratif.
1.1 définition(s) de la dataviz
12. 1
La DataViz n'est pas une fin en soi, c'est
un moyen mis au service de la production
de sens, au service d'une meilleure
compréhension des phénomènes.
Autrement dit, nous donnons aux Métiers
la possibilité de mieux appréhender
une réalité qu'ils connaissent déjà,
en leur proposant de la considérer
sous d’autres angles de vue.
Maguelonne Chandesris,
Responsable de l’équipe Statistique,
Économétrie et Datamining,
Direction Innovation & Recherche
SNCF
J’ai été Directrice de projet sur les KPI
et j’ai donc conduit la rationalisation
et l’optimisation des indicateurs de pilotage.
Ce qui est important sur ce projet, qui sera
à terme généralisé et déployé aux équipes
de ventes, ce sont les leviers d’actions
et l’aide à la décision qu’apporte la data
visualization aux managers.
En d’autres termes :
Que puis-je faire pour performer ?
Sur quels leviers intensifier
les efforts pour obtenir rapidement
des résultats concrets ?
Sandrine Noail,
Responsable Analyse et Pilotage
Coliposte
On voit donc que la data visualization répond à une
approche très opérationnelle, comme le résument
Maguelonne Chandesris, de SNCF Innovation
et Sandrine Noail, de Coliposte :
Un moyen,
pas une fin en soi
13. 13
La valeur de la datavisualisation
réside dans sa capacité à répondre
à trois impératifs principaux :
être interprétable,
être pertinente
et être novatrice.
être interprétable
Dans un contexte où le volume des données
explose avec le développement exponentiel
de l’usage d’internet et notamment de Google,
les données dites "non structurées" connaissent
la même évolution. Or une datavisualisation
partant de ces données qui ne seraient
pas interprétables, c’est-à-dire claires, ne
servirait à rien.
être pertinente
La pertinence est liée au caractère interprétable.
La datavisualisation doit permettre de répondre
à des questions dans un contexte défini et visant
des objectifs précis.
être novatrice
Enfin, la datavisualisation n’a d’intérêt que
si elle apporte une information nouvelle,
une originalité, si elle donne une perspective
inédite sur un sujet.
Dorina Ghiliotto-Young,
Head of Innovation,
Ingenico
Pour terminer cette définition de la dataviz, il nous
paraît intéressant de relever les trois caractéristiques
principales qu’elle doit impérativement avoir, pour
pouvoir justement être utilisable pratiquement :
Les 3 caractéristiques
de la data visualization
1.1 définition(s) de la dataviz
14. 1
Les prémices de la représentation graphique
de données statistiques remontent aux
travaux du statisticien écossais William Playfair (1759-1823).
Il est l’inventeur d’outils qui nous paraissent désormais familiers :
le graphique circulaire (le fameux "camembert"), le diagramme
en bâtons, le diagramme linéaire. Surtout, il a mis au premier plan
l’importance des graphiques pour représenter les données,
à une époque où la tradition cartésienne des représentations sous
formes de fonctions mathématiques régnait en maître. Playfair,
au contraire, mettait en avant que le simple fait de coucher les
données sous la forme de points et de formes sur un graphique
pouvait nous aider à mieux les comprendre. Ironie de l’Histoire,
Playfair, lui, est resté largement incompris par ses contemporains.1
Au XIXe
siècle, le nom d’un autre précurseur se détache, Charles-
Joseph Minard. Il est entré dans la postérité pour sa "carte figurative
des pertes successives en hommes de l’armée française dans la
campagne de Russie 1812-1813", publiée en 1869.
Cette représentation réussit l’exploit de représenter en un seul
schéma des données de nature aussi différente que des effectifs
en hommes, des indications géographiques (distances, villes,
cours d’eau), des températures et des directions (vers la Russie
ou dans le sens opposé).
1. Ce paragraphe est inspiré de l’article d’Howard Wainer :
"William Playfair" (version 3). StatProb: The Encyclopedia Sponsored by Statistics and Probability Societies.
Freely available at http://statprob.com/encyclopedia/WilliamPLAYFAIR.html
Brève histoire de la
data visualization
15. 15
2. Sources :
http://en.wikipedia.org/w/index.php?title=Box_plot&oldid=551581640
et http://fr.wikipedia.org/w/index.php?title=Bo%C3%AEte_%C3%A0_moustaches&oldid=90308055
Mais il fallut attendre les années 60 et les travaux du statisticien
John Tukey, de l’université de Princeton, pour que la visualisation
des données soit enfin reconnue à sa juste valeur. Entre autres
apports, on lui doit notamment l’invention de la boîte à moustaches
(aussi appelée diagramme en boîte, boîte de Tukey ou box plot).
Cette représentation permet de représenter graphiquement des
séries numériques au travers de cinq caractéristiques principales :
la valeur minimale, le premier quartile (Q1), la médiane, le troisième
quartile (Q3) et la valeur maximale. On y ajoute souvent la moyenne
pour illustrer la dissymétrie d’une distribution lorsque médiane
et moyenne ne sont pas confondues. La boîte à moustaches peut
aussi faire figurer les données aberrantes.2
- Un exemple de "boîte à moustaches" utilisée dans l’industrie,
chez STMicroelectronics : `
1.1 définition(s) de la dataviz
16. 1
Dans les années 70, John Tukey a travaillé avec un professeur
à Princeton, Edward Tufte, lors d’une série de séminaires sur la
représentation graphique des données. Ces séminaires seront
repris par Tufte dans un livre qui fera date en matière de data
visualization, The visual display of quantitative information.
Plus récemment, c’est au Suédois Hans Rosling que l’on doit
la poussée d’enthousiasme pour la représentation graphique
de données statistiques, grâce à son graphe à bulles animé.
La conférence lors de laquelleil l’a présentée en 2006 a déjà été
visionnée plus de 5 millions de fois sur le site TED.com.3
Hans Rosling à la conférence TED
3. http://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen.html
17. 17
Le quartet d’Anscombe est
une parfaite démonstration
de ce qu’un graphique peut
mieux rendre compte de la
réalité derrière les données
que les données elles-mêmes.
Classiquement, il prend la forme
de 4 ensembles de données
X et Y, tels que ceux-ci :
Déjà, si l’on se contente
de regarder ces tableaux
de chiffres, on a du mal à
détecter quoi que ce soit. Quels
phénomènes, quelles régularités
peuvent-ils bien traduire ?
Pour y voir plus clair, on peut
effectuer certains calculs
statistiques, pour déceler des
propriétés. Et là, ô surprise,
on s’aperçoit que les quatre
ensembles ont des propriétés
identiques !
On serait donc tenté de
croire que les 4 ensembles
représentent des données
similaires.
Pourtant, si on les place
simplement sous forme
de points sur un graphique
à deux axes, on se rend
compte qu’ils reflètent
des réalités bien différentes !
La data visualization permet
donc de se poser de nouvelles
questions sur des séries
de données dont les
particularités passeraient
autrement inaperçues.
I II
III IV
Pourquoi un graphique
parle mieux des données que
les données elles-mêmes ?
I II III IV
1.1 définition(s) de la dataviz
18. 11
Remarquons tout d’abord que la data visualization concerne un vaste
éventail de secteurs d’activité. Si l’on s’en tient à notre panel, les domaines
suivants sont représentés :
• biens de consommation grand public (L’Oréal, Ubisoft)
• services aux entreprises (Accenture)
• industrie (Ingenico, Philips, Schlumberger, STMicroelectronics)
• médias (BFM Business, France Télévisions, InfoPro, Prisma Media)
• marketing et publicité (IFR-GfK, Lagardère Active, PagesJaunes,
SM-Marketing Convergence)
• recherche scientifique (IMEC)
• service public (SPF Économie)
• télécom (Alcatel-Lucent, Orange, SFR)
• transport et logistique (Aéroports de Paris, ID Logistics, SNCF,
Voyages-sncf.com)
Toutes ces entreprises utilisent la data visualization soit pour faire mieux
certaines choses qu’elles faisaient déjà (optimisation), soit pour enrichir
leur activité de tâches à valeur ajoutée (innovation). Dans le registre de
l’optimisation, la dataviz permet, par exemple, à Lagardère Active d’accélérer
la production de ses états et à STMicroelectronics de rendre son processus
de fabrication plus performant ; dans celui de l’innovation, PagesJaunes
découvre et rectifie, grâce à la data visualization, les lacunes de son
indexation, Voyages-sncf.com met sur le marché un nouveau service
innovant (Mytripset), Alcatel Lucent imagine les applications mobiles
de demain, etc.
Dans les pages qui suivent, nous allons étudier
plus particulièrement 5 cas d’usage illustrant cette double finalité
d’optimisation et d’innovation : l’utilisation de la data visualization pour…
> améliorer le pilotage de l'entreprise,
> améliorer la relation client,
> définir l’offre même de l’entreprise,
> contribuer directement au business de cette dernière
> donner du pouvoir aux citoyens.
Maintenant que nous comprenons mieux ce qu’est
la data visualization, examinons ses usages.
Ce sera l’occasion, au passage, d’évoquer certaines
des réalisations les plus pertinentes qui nous ont été
présentées par les contributeurs à cet ouvrage.
1.2 à quoi sert la dataviz ?
19. 19
1.2 à quoi sert la dataviz ?
> améliorer le pilotage de l’entreprise
L’un des premiers usages de la data visualization
est de contribuer à un pilotage plus efficace de l’activité
et de la performance, orienté vers l’action.
On retrouve là le côté très opérationnel de la démarche.
Notre entreprise était
bousculée par la concurrence.
Nous devions utiliser des outils décisionnels
plus modernes pour être capables d'anticiper les
positions de nos concurrents et l’attrition sur notre
portefeuille clients.
Nous avons voulu faire de la datavisualisation un
outil décisionnel, stratégique, utilisable par un
manager de proximité pour piloter sa performance.
Sandrine Noail, Responsable Analyse et Pilotage
Coliposte
La data visualization au service
du pilotage de l’entreprise
Nous voulions doter le board d’un véritable outil
de pilotage, autrement dit d’un tableau de bord avec
tous les indicateurs stratégiques pour permettre la
prise de décision. L’objectif était de remettre
les utilisateurs dans un processus de management
et non pas dans un processus itératif d’analyse
comme on peut le faire avec des bases
de données ou des tableaux interactifs.
Laurence Kerjean, Global Digital Manager,
L’Oréal
S’il fallait donc absolument trouver un élément
déclencheur à notre démarche, ce serait bien ce
véritable besoin commun d’améliorer les exigences du
reporting classique que nous avions déjà, de manière
à l’orienter vers le pilotage, l’action et la décision
François Nguyen,
Directeur SI décisionnel et marketing relationnel
SFR
20. 1
Les principaux composants de l’infrastructure
réseau d’un opérateur téléphonique ont un impact
sur la qualité des appels et, plus globalement,
sur la qualité de services et le revenu.
Les switches jouent un rôle clef dans le routage
des appels, l’analyse et la surveillance du trafic
et la qualité de service des différents équipements
sont primordiales.
Ce graphique présente les indicateurs de trafic
(volume d’appels et appels interrompus)
pour différents constructeurs et équipements.
Un exemple de data visualization
dans le secteur des télécoms
≥ Analyse des appels par équipements - Source : SAS®
21. 21
Le cas du centre de recherche en micro et nanoélectro-
nique flamand IMEC en fournit un exemple significatif.
Nous utilisons SAS depuis des
années pour des projets scientifiques.
Il y a quelques années, nous avons
commencé à l’utiliser aussi pour
nos rapports d’entreprise.
Nous avons commencé par un premier périmètre simple (les
consommations téléphoniques de nos collaborateurs) puis nous avons
ajouté de nouveaux domaines, l’un après l’autre, de manière à entrer
progressivement toutes les informations dans l’environnement BI.
Nous utilisons la solution principalement pour représenter les indicateurs
que nous devons produire pour le gouvernement flamand, par exemple
en ce qui concerne le nombre de publications réalisées par nos
chercheurs, le nombre de nos doctorants ou encore nos activités donnant
lieu à la création d’entreprises (spin-offs).
Par ailleurs, nous produisons également des rapports
pour visualiser nos plannings et notre performance
en termes d’utilisation de nos ressources.
Yves Daelmans, ICT Project Manager
IMEC
La data visualization
comme outil de pilotage
≤ IMEC coût en téléphonie pour un employé
1.2 à quoi sert la dataviz ?
22. 11
≥ talent magnet (répartition par nationalité des salariés chez IMEC pour un mois donné)
≥ récapitulatif sur 12 mois du temps passé par un employé par grands groupes de tâches
23. 23
Enfin, qui dit pilotage dit prise de recul. C’est ce que
permet la data visualization, en complément d’autres
outils à horizon plus court terme.
Le sujet de la data visualization
arrive chez L’Oréal à un
moment où toutes les équipes digitales, aussi bien
dans les marques que dans les pays, s’organisent
pour avoir des tableaux de bord tactiques ;
notre projet de tableau stratégique vient donc
fédérer toutes les actions locales et nous permet
d’avoir une réelle vision stratégique.
Laurence Kerjean, Global Digital Manager,
L’Oréal
La dataviz ou la pensée visuelle
au service de la stratégie
≤ Un tableau de bord stratégique chez L’Oréal
1.2 à quoi sert la dataviz ?
24. Notre activité s'articule
autour de trois principaux
canaux : les points de vente,
les centres d'appels clients et
notre boutique en ligne sur sfr.fr.
Nous développons nos
solutions dataviz dans l'optique
d'optimiser la gestion de ces
canaux. Nos efforts visent avant
tout à améliorer le pilotage et la
compréhension de nos KPI.
En ce sens, nos projets sont très
orientés "indicateurs d’activité"...
Nos développements en data
visualization s'attachent donc
à rapprocher de nombreuses
sources de données afin
d’y trouver des relations
et des causalités.
François Nguyen,
Directeur SI décisionnel
et marketing relationnel
SFR
11
> améliorer la relation client
Le marketing et la gestion de la relation
client sont deux fonctions de choix
pour la data visualization, comme le
montrent les exemples de SFR et de
Lagardère Active.
Visualiser les données clients pour
améliorer le CRM multicanal
25. 25
Source:SAS®
Dataviz et relation
client multicanal
≥ Analyse des Centres de Relation Client
La multiplication des canaux
de communication est un challenge supplémentaire pour les Centres
de Relation Client pour préserver la satisfaction client. Le volume et la
complexité des données (souvent compartimentées en silos) entravent
la capacité d’analyse pour accroître l’efficience et optimiser les coûts.
Ce graphique présente les principaux indicateurs de performance (qualité
de service, temps de prise en charge et taux d’abandon) avec un détail sur
le taux de résolution au premier contact.
Une bonne relation client passe aussi par une bonne
connaissance de ces derniers : quels sont leurs
caractéristiques et leurs comportements ? Comment les
segmenter ? À ce titre, les capacités d’exploration dans les
données permises par la data visualization trouvent tout
leur sens. Nous y reviendrons dans la deuxième partie.
Nous avons chez Lagardère Active
une des plus grosses bases d’abonnés à
nos magazines, avec près de 3 millions de
clients. Nous souhaiterions étoffer les capacités d'analyse
de notre CRM en y intégrant les outils de la dataviz afin
de bénéficier d'une vision affinée de notre parc clients.
Pierre-Olivier Sicamois, Responsable du domaine
Régie publicitaire, Direction des Technologies
Lagardère Active
La dataviz pour mieux
qualifier la base clients
1.2 à quoi sert la dataviz ?
26. 1
> mieux définir son offre
À l’opposé du spectre, la data visualization fournit aux
entreprises des outils pour mieux définir leurs offres.
L’exploration des données recueillies sur les clients et
la possibilité de tester différentes hypothèses s’avèrent
particulièrement précieuses.
≥ Une dataviz pour représenter la consommation électrique des trains
Les sources de données sont très
diverses à la SNCF, constituant
autant de champs d’applications
possibles. Nos premiers travaux dataviz datent de 2010
et aujourd'hui, nous avons à notre actif plusieurs projets
aboutis sur des thématiques diverses : information,
régularité voyageurs et impacts économiques, yield
management
et aspects
énergétiques.
Maguelonne Chandesris,
Responsable de l’équipe Statistique,
Économétrie et Datamining,
Direction Innovation & Recherche
SNCF
La dataviz pour faire évoluer
l’offre de la SNCF dans
différents domaines
Application de la data visualization au yield management ≥
27. 27
> contribuer au business
En définitive, c’est directement sur le business même
d’une entreprise que la data visualization peut avoir
un impact. Par exemple, Charles du Réau (Ubisoft)
nous explique comment elle a permis à l’éditeur
de jeux de mieux comprendre son marché :
≥ Le radar d’Ubisoft pour comparer ses marques à la concurrence
Nous avons réalisé un projet
permettant de comparer
nos marques à celles de la
concurrence selon plus d’une centaine de critères.
Nous nous appuyons pour cela sur des données
réalisées par un institut d'études externe sur des
panels de milliers de joueurs.
Là où avant nous ne pouvions comparer nos
marques qu'à une "marque moyenne" théorique,
nous pouvons désormais les comparer
instantanément à l'ensemble des autres marques
du panel, de manière graphique, selon des critères
qui sont notés par les consommateurs..
Charles du Réau,
Consumer & Market Knowledge Director, Ubisoft
Mieux comprendre son
positionnement concurrentiel
1.2 à quoi sert la dataviz ?
28. La géolocalisation associée à la dataviz est un atout
marketing indéniable. Elle nous permet notamment
de mettre en exergue nos zones de chalandise ou
d'établir une cartographie des groupes et entreprises
que nous ciblons. C'est sans conteste un instrument
de poids que nous mettons au service de notre
démarche d'analyse concurrentielle.
Clément Delpirou,
Associé, InfoPro Digital
1
Dans mon métier,
le journalisme économique,
j’ai deux sources d’information
principales : d’une part les données chiffrées (études,
rapports, bases de données, statistiques officielles)
et les dépêches d’agences, qui sont de l’ordre du
factuel et sont disponibles pour toute la profession ;
d’autre part, les personnes que nous recevons sur le
plateau, dont les propos, exclusifs, nous donnent une
matière plus qualitative. L’intérêt d’outils d’analyse
et d’exploration comme la data visualization est de
procurer le même caractère exclusif et qualitatif
que nous pouvons avoir dans les interviews,
mais cette fois à partir de données. Autrement
dit, dans la mouvance du datajournalisme, la data
visualization est un moyen de repérer des sujets,
d’offrir de nouveaux angles au journaliste pour traiter
l’actualité, voire de créer l’événement.
En ce sens, elle est un outil à forte valeur ajoutée
pour la profession, amené à se développer.
Emmanuel Lechypre,
Éditorialiste,
Responsable pôle Analyse et prévisions,
BFM Business
La data visualization, source
de valeur et de différenciation
Emmanuel Lechypre, quant à lui, nous explique
comment la dataviz contribue directement
à la proposition de valeur pour les journalistes
et des médias tels que BFM Business :
29. 29
La dataviz peut également mettre en exergue
les modifications dans le comportement de sa clientèle,
de manière à s’y adapter au mieux. Il en va ainsi
des investissements publicitaires des annonceurs
sur les supports de Lagardère Active :
Identifier immédiatement les
reports d’achats de ses clients
Nous avions pour projet de représenter l'investissement
de nos annonceurs par thématique sous la forme d'un radar.
Ce dernier pourrait notamment permettre de comparer les
tendances d'une année N vs l'année N-1.
La visualisation par annonceur donnerait également la
possibilité d'obtenir une vision plus fine de l’évolution des
investissements de ce dernier, c'est-à-dire des changements
réalisés en termes d'orientation thématique (ex. : abandon
d'une thématique d'une année sur l'autre) et de
bénéficier d'un aperçu plus aiguisé des tendances.
Pierre-Olivier Sicamois,
Responsable du domaine Régie publicitaire,
Direction des Technologies
Lagardère Active
1.2 à quoi sert la dataviz ?
≥ Radars représentant l’investissement des annonceurs chez Lagardère Active
30. 1
Cette contribution au business peut s’exprimer très
directement sur le modèle économique même de
l’entreprise. Philippe Nieuwbourg prend l’exemple de la
vente à distance pour nous le faire comprendre :
Si on prend l’exemple de la vente
à distance, des entreprises comme
La Redoute ou 3 Suisses réalisent
aujourd’hui la majeure partie de leur
chiffre d’affaires en ligne.
Or, si la Redoute n’avait aucun moyen
de savoir quelles pages de son catalogue
papier retenaient le plus l’attention de ses
clients, ou combien de temps ils passaient
en moyenne sur une page, elle peut
désormais avoir ce genre d’information
pour les visiteurs de son site e-commerce.
Grâce aux logs de connexion, elle peut
savoir quelles sont les pages les plus
visitées, combien de temps un internaute
passe sur une page, quel est son parcours
d’une page à l’autre, etc.
Tout ceci constitue potentiellement un
trésor, à condition de savoir exploiter ces
logs, les faire parler.
La data visualization peut justement être
un moyen d’extraire la valeur de ces logs.
Philippe Nieuwbourg,
Analyste-journaliste indépendant
en informatique décisionnelle
Quand la data visualization influe directement
sur le modèle économique d’une entreprise
31. 31
> donner du pouvoir aux citoyens
La data visualization trouve aussi son utilité en dehors
des murs de l’entreprise. Elle peut contribuer à mieux
informer le citoyen et donc à lui donner les moyens
d’agir. Deux exemples que nous avons étudiés l’illustrent
parfaitement : les dataviz mises à disposition du grand
public par le Ministère belge de l’économie, via le
Service Public Fédéral (SPF) Économie, et "le pariteur"
mis en ligne par France Télévisions.
Nos projets dataviz se présentent
sous trois formes distinctes :
• Be Stat, qui mobilise des données disponibles depuis plus de
quatre ans, et permet la création de tableaux multidimensionnels
(cubes SAS). Dans ce cadre, nous proposons une interface
dynamique alliant Java et SAS, permettant au citoyen de réaliser
lui-même son tableau, en choisissant les mesures à montrer,
les dimensions selon lesquelles il souhaite voir les données
et les filtres à appliquer aux données. Be Stat permet un export
ultérieur des données, notamment aux formats CSV et PDF.
• un dashboard orienté "économie", qui génère une vision
statique de graphiques interchangeables, regroupés au sein
d'un ensemble intitulé EcoZoom. Ces graphes sont susceptibles
d’indiquer l’évolution des indices des prix du pétrole,
par exemple.
• un système de cartographie, ou de graphiques dynamiques,
actuellement en phase de pilotage. C'est un système particulièrement
efficace pour visualiser les densités (populations, prix...), lesquelles
sont visibles par le biais de dégradés de couleurs. Nous en voyons
une application probante dans la visualisation de l'évolution des
prix de l'immobilier dans le temps.
La mise en chantier de ces projets dataviz est
pour nous l'occasion de présenter différemment
les données que nous avons collectées et que
nous utilisons déjà, afin de permettre aux citoyens
de réaliser leurs propres analyses.
Caroline Denil, Data Warehouse Program Manager
SPF Économie
Donner matière
à penser aux citoyens
1.2 à quoi sert la dataviz ?
32. 1
Les projets de "dataviz citoyenne" peuvent prendre
un tour plus militant. C’est le cas par exemple
du "pariteur" de France Télévisions.
Aujourd'hui, une femme touche 25% de moins qu'un homme dans
le privé et 18% dans le public, poste pour poste et à temps de travail
équivalent. C'est une moyenne calculée par l'Insee à partir de données
statistiques de 2010 (DADS 2010, Déclaration Annuelle de Données
Sociales) sur les salaires recensés par âge, par sexe, par région et par
poste (nomenclature standardisée des postes).
En s’appuyant sur ces données, France Télévisions Nouvelles Écritures
et Francetv info ont réalisé une application Web et mobile inédite et
ludique, "Le Pariteur", permettant d’évaluer sa propre disparité salariale :
"et si j'étais payée comme un homme ?" "Combien gagnerait une femme
à ma place ?" En quelques clics, le Pariteur vous donne la réponse.
Une fois cette disparité salariale calculée, l’utilisateur peut communiquer
cette information sous différentes formes et vers différentes cibles : via
un "diplôme d'écart salarial" et des affiches à partager avec ses amis
et collègues sur les réseaux sociaux ; ou via une lettre pré remplie et
personnalisée à envoyer à son DRH !
Cette dataviz a été mise en ligne le 4 mars 2013 à l'adresse suivante :
http://appli-parite.nouvelles-ecritures.francetv.fr/
Elle cumule à l’heure où sont écrites ces lignes plus de 100 000 visites.
Surfant sur le mouvement de l’open data, cette Web app met à
disposition des citoyens des données auxquelles ils n'ont pas facilement
accès, et qui pourtant, sont publiques.
C’est également un outil qui révèle le débat passionné
et tabou autour de la parité salariale et, plus largement,
autour de la question des droits des femmes. Un débat
qui irradie l’ensemble de la société, avec au premier
rang les 29 millions d’actifs (et d’actives) français.
Antoine Allard,
Chargé de communication & marketing Social Media
France Télévisions
Le "pariteur" de France Télévisions ≥
33. 33
Si l’on fait le bilan, les usages de la data visualization
peuvent se regrouper en trois grandes catégories, comme
nous l’explique Dorina Ghiliotto-Young,
Head of Innovation chez Ingenico :
Trois raisons
principales expliquent le recours
à la data visualization :
• confirmer ou infirmer
des hypothèses sur un marché
La data visualization peut alors prendre
la forme d’un dashboard, permettant
de prendre une décision en ayant
une vision globale du marché étudié.
• éduquer
En interne, Ingenico utilise notamment
la datavisualisation pour des travaux de
reporting ou des sessions de brainstorming.
Elle peut être un bon complément de
démarches créatives de type "gamification"
car elle développe l'intuition.
• explorer
C'est l'aspect le plus futuriste de la
datavisualisation, qui est certainement
amené à se développer. La dataviz peut aider
à construire des modèles prédictifs. On est
alors dans le domaine de la data analysis.
Dorina Ghiliotto-Young,
Head of Innovation,
Ingenico
Pourquoi recourir à la
data visualization ?
1.2 à quoi sert la dataviz ?
34. 11
La représentation graphique de données
statistiques n’est pas, à proprement parler,
nouvelle puisque, comme nous l’avons vu plus
haut, on peut faire remonter son apparition au
XVIIIe
siècle. Forts de ce constat, les sceptiques
auront beau jeu d’arguer que la dataviz n’est
en rien une révolution. Toutefois, Claude-
Henri Mélédo, cofondateur d’Aldecis - cabinet
d’experts en tableaux de bord et en systèmes de
pilotage d’organisations, nous faisait remarquer
en entretien que le terme "révolution" contient
en lui-même l’idée de retour. Et l’on peut fort
bien soutenir que si l’utilisation des graphiques
pour représenter les données n’est pas nouvelle
en soi, nous y retournons aujourd’hui avec une
puissance et des potentialités jamais atteintes.
On peut donc dire que la data visualization
introduit une rupture dans l’histoire de la
business intelligence. Pour cela, elle s’appuie sur
toute une série de changements majeurs, qu’elle
fédère pour leur donner toute leur portée.
On peut notamment citer les big data,
les progrès dans la compréhension
du fonctionnement du cerveau et la mise
au point de nouveaux terminaux et de nouvelles
interfaces d’accès à l’information.
1.3 une innovation
ou une révolution ?
35. 35
1.3 une innovation ou une révolution ?
> Les big data
Les big data désignent à la fois le phénomène
de l’explosion des quantités de données
disponibles et les technologies pour les traiter.
Il se distingue par trois caractéristiques principales souvent reprises sous
l’expression des "3V" : le Volume des données, leur Variété et la Vitesse à
laquelle elles sont produites. Depuis trois ans, plusieurs travaux ont bien
mis en lumière ces dimensions.
On peut penser, notamment, aux études Big Data Analytics (TDWI
Research, août 2010), Big Data : The next frontier for innovation,
competition, and productivity (McKinsey, juin 2011), ou encore The
Deciding Factor: Big Data & Decision Making (Capgemini, juin 2012).
SAS ajoute deux caractéristiques supplémentaires4
que sont la variabilité
des données (avec des effets de pics ou de creux, de saisonnalité,
dans la quantité de données produites) et leur complexité (par exemple,
le nombre de sources dont elles proviennent, la diversité de leur nature
– chiffres, schémas, ensembles de relations, texte - ou de leurs formats).
D’après IDC, l’information totale
produite chaque année par
les entreprises a connu de 2007
à 2011 une croissance annuelle
de 67%, passant de 75 exaoctets
à 580 exaoctets .
Mais cette progression n’est rien
en regard de ce qui nous attend.
La quantité d’information
numérique créée ou répliquée
annuellement (ce qu’IDC appelle
l’univers numérique), va être
multiplié par 44 en 2020 par
rapport à son niveau de 2009,
pour atteindre 35 zettaoctets .
Nombre d'exaoctets produits/an
Source IDC 2008
1 exaoctet = 1 milliard de gigaoctets
1 zettaoctet = 1 000 milliards de gigaoctets
l'Univers numérique 2009/2020
Source IDC Digital Universe Study,
sponsored by EMC, May 2010
4. http://www.sas.com/big-data/
La croissance exponentielle
de la quantité de données
Source : Qualité des données,
quelle(s) vérité(s) pour les entreprises,
EBG, 2012
36. 1
Ce genre de données peut à la limite être stocké et traité
par des outils de BI traditionnels, mais ces derniers ne
suffisent plus pour les comprendre.
La data visualization permet de dépasser cette limitation,
faisant intervenir un 4e
"V", celui de Valeur.
Ce que Philippe Nieuwbourg énonce en une formule :
Les solutions de data visualization
sont une réponse à la complexité
rencontrée dans le traitement
de grosses masses de données.
En ce sens, la visualisation elle-même
permet une analyse pointue, laquelle
passe par la détection de patterns
(ces schémas récurrents reflétant
des tendances), impossibles à déceler
par le biais des outils de reporting
classique (ex. : tableau de bord Excel).
Autrement dit, la dataviz permet
d'explorer visuellement de grands
volumes de données et de dégager des
tendances qui ne sont pas forcément
visibles à travers une simple
énumération de chiffres.
Frédérique Pain,
Experience Strategy Director,
Alcatel-Lucent Bell Labs
La data visualization à la rescousse
pour le traitement des big data
x Visualisation = Valeur
Vitesse
+
Volume
+
Variété
37. 37
Comme on le voit dans ces exemples, c’est l’analyse
qui est au cœur de la création de valeur par les big data.
C’est parce qu’elle permet l’analyse (et l’exploration)
de ces quantités faramineuses de données que la data
visualization permet de tirer la valeur des big data.
Nous avons un challenge de big data, avec une information de plus
en plus volumineuse et dont nous devons absolument adresser la
complexité pour nous différencier ; nous avons aussi un challenge
de big data dans l’usage, pour enrichir l’analyse. La visualisation doit
permettre justement de tirer tout le profit de cette
volumétrie disponible, en permettant l’émergence de
questionnements nouveaux sur la donnée.
Fabrice Benaut,
CIO global IFR, Head of IS and Operations,
IFR Monitoring
Dans nos métiers, le terme
"analytique" renvoie aux méthodes
statistiques d’analyse des données : statistique descriptive, analyse
prédictive, optimisation, prévision, théorie des tests... Quant à la
business analytics, elle désigne l'application de l'analytique au monde
de l'entreprise. Elle recourt plus particulièrement à des outils tels que
le calcul de corrélations, de régressions, l'analyse en composantes
principales, l'analyse factorielle, les réseaux de neurones...
La business analytics concerne tous les métiers. Prenons simplement
deux exemples.
En étudiant la typologie des acheteurs et leurs comportements, une
analyse prédictive permettra à une entreprise de marketing direct de
calculer la probabilité pour un individu donné qu’un certain courrier
déclenche un acte d'achat. Ainsi, la marque pourra sélectionner les
personnes à qui elle enverra le courrier en question.
Autre exemple : la commercialisation de nouveaux médicaments.
De la mise au point d'une substance active à la mise sur le marché
du médicament proprement dit, plusieurs cycles de tests sont
effectués. Le but est de s'assurer que le nouveau produit apporte
réellement un "plus", que ce soit en termes d'efficacité, de tolérance,
de confort d'utilisation, etc. C'est alors la théorie des tests qui est
mise à contribution.
La dataviz, un outil qui
démocratise l’analytique
1.3 une innovation ou une révolution ?
38. 1
Il faut noter que l’analytique ne concerne pas uniquement les
grandes entreprises : elle concerne toutes les entreprises et tous
les métiers dans lesquels la donnée joue un rôle majeur. Par
exemple, l'analytique sera fondamentale pour une PME travaillant
dans le domaine du social gaming (jeux sur les médias sociaux) :
l'analyse des logs d'utilisation de ses jeux est sa seule manière de
comprendre ses clients et donc son marché.
Toutefois, les entreprises peuvent rencontrer des difficultés ou
des enjeux lorsqu’elles se lancent pour la première fois dans
l'analytique. Le premier enjeu est de faire en sorte que les
connaissances issues de l'analytique se traduisent de manière
opérationnelle dans le business de l'entreprise, pour apporter de
la valeur. Pour cela, il faut que les profils pointus qui prennent en
charge l'analytique (des statisticiens) soient bien intégrés dans les
processus de l'entreprise et sachent communiquer.
Une deuxième difficulté est que les statisticiens ont des besoins
informatiques particuliers, que ce soit en termes de puissance de
traitement, d'espace de stockage ou de vélocité, entre autres. Ces
besoins se traduisent par des demandes atypiques, inhabituelles
pour une DSI.
La data visualization constitue une réponse à ces difficultés en
démocratisant l'accès à l'analytique auprès de publics qui ne sont ni
des statisticiens, ni des data miners.
Pour y parvenir, la solution SAS®
Visual Analytics intègre,
par exemple, plusieurs méthodes analytiques et choisit
automatiquement la meilleure pour répondre à une demande
de l'utilisateur. D'un simple clic, par exemple, ce dernier pourra
obtenir une prévision sur 6 mois sur un indicateur, sans besoin
de compétences particulières en statistiques. Le temps
de traitement sera d'une à deux secondes et l'utilisation
se veut réellement intuitive.
Autrement dit, la data visualization permet d'accéder à l'analytique
sans connaissances statistiques pointues et accélère la prise de
connaissance et la compréhension des données. Elle favorise
également la diffusion de cette connaissance dans la société.
Visual Analytics permet par exemple de la transmettre sous forme
de fichiers pdf ou d'états interactifs sur tablettes. La possibilité de
collaborer sur les données, en commentant les
états, est également un moyen pour que celles-ci
deviennent un véritable outil de travail, à tous les
niveaux de l'entreprise.
Jérôme Cornillet,
Responsable de l’offre Business Analytics,
SAS France
39. 39
Les questions de santé et de sécurité des patients requièrent
une forte vigilance afin d’identifier des risques éventuels et éviter
des problèmes de santé publique. Le niveau de surveillance
demandée est en augmentation : la validation des médicaments
en phase d’approbation et après mise sur le marché est critique.
Les mesures terrain nécessitent des analyses approfondies.
Ce graphique analyse la fréquence et la sévérité de certains effets
indésirables. La matrice de corrélation montre en particulier une
corrélation forte entre un médicament spécifique, le Thiazolidinedione,
et les douleurs de poitrine. Pour illustrer l’importance de l’analytique dans
le domaine pharmaceutique et le rôle que la data visualization peut jouer,
nous remarquerons que les questions de santé et de sécurité des patients
requièrent une forte vigilance afin d’identifier des risques éventuels
et éviter des problèmes de santé publique. Le niveau de surveillance
demandé est d’ailleurs en augmentation : la validation des médicaments
en phase d’approbation et après mise sur le marché est critique. C’est
pourquoi les mesures terrain nécessitent des analyses approfondies.
≤ Analyse d’effets indésirables
Source:SAS®
un exemple de data visualization dans
le domaine de la recherche pharmaceutique
1.3 une innovation ou une révolution ?
40. 1
Cette valeur ajoutée permise par la data visualization
dans le domaine de l’analytique appliquée aux big data
est confirmée par Andrew Musselman d’Accenture :
Le département "data visualization"
a collaboré sur des travaux et des
propositions commerciales avec le département
analytique très bien implanté d’Accenture, qui inclut
désormais un aspect plus nouveau concernant
les big data. Il nous semble que ces deux facettes
sont plus liées que par le passé, pas uniquement pour
supprimer les tâches en doublon, mais aussi, plus
fondamentalement, pour tirer profit des avantages de
chaque facette. L’aspect big data a beaucoup à offrir à
l’analytique, et vice-versa.
Andrew Musselman,
Data scientist, ingénieur et architecte
dans le département Big Data d’Accenture
Analytique, dataviz
et big data : le trio gagnant
≥ L’empreinte de mouvement,
telle qu’elle a été exposée à la Cité de l’Architecture
et du Patrimoine, d’avril à août 20127
7. http://www.orange.com/m_fr/sponsoring/culture/Cite-de-l-architecture-et-du-patrimoine
41. 41
Notre démarche de data visualization s'inscrit
dans la perspective plus globale des big data.
Dans ce contexte, la mise en place d'outils dédiés
vient servir une démarche générale de traitement des
gros volumes de données (et des données spécifiques
opérateurs). Même si la data visualization est un
outil de valorisation des données qui peut être utilisé
indépendamment des big data, il nous apparaît
clairement que les deux sont assez liés.
Nos projets s'adressent à nos clients, dans l'optique
de leur proposer, à terme, des offres ou des services
en adéquation avec leurs besoins. Une initiative
développée au niveau du groupe, l’’empreinte de
mouvement’, analyse et restitue de façon valorisée
les informations de déplacement collectées pour un
ou plusieurs individus. Dans cette approche, nous
partons de points physiques, en intégrant une gestion
de la temporalité à court terme dans un premier temps,
avec une captation des données effectuée à intervalles
réguliers (par exemple toutes les sept minutes) :
il en ressort une sorte de "surface au sol" ou empreinte
cartographique que nous sommes en mesure de
représenter visuellement.
Cette visualisation reflète le degré de sédentarité
(c’est une lecture possible) et met au jour le périmètre
géographique parcouru, mais également restitue
les habitudes de l'individu, visibles à travers ses
différents trajets. L'outil fait appel à une représentation
logarithmique de manière à ne pas écraser les détails.
En augmentant les temps d'observation (sur plusieurs
jours ou plusieurs semaines) et en incluant
une gestion temporelle à plus long terme,
nous augmentons la pertinence de l'empreinte
individuelle en question ; l’analyse qui s’en suit
s’enrichira parallèlement.
Catherine Ramus,
Chef de projet Équipe design, Orange
L’empreinte de mouvement,
à la croisée de l’art, du business et des big data
1.3 une innovation ou une révolution ?
42. 1
L’essor des big data a largement fait émerger le besoin
en data visualization. En retour, les capacités d’analyse
et d’exploration que celle-ci autorise suscitent encore
plus d’intérêt pour les big data.
"Au final, explique Mouloud Dey, Directeur des Solutions et Marchés
Émergents chez SAS, dataviz et big data apparaissent souvent disjoints,
mais notre conception est autre : ces deux secteurs ont bel et bien partie
liée. La data visualization est en effet particulièrement intéressante
lorsque l’on dispose de gros volumes de données que l’on a besoin
de mettre en relation, pour leur donner du sens."
> Les progrès dans la compréhension
du fonctionnement du cerveau
La science nous a permis d’atteindre aujourd’hui
une compréhension beaucoup plus fine du cerveau
humain. Elle révèle que la data visualization est une
méthode particulièrement efficace pour représenter,
analyser et interpréter des données.
La vue, qui est gérée
par le cortex visuel situé
à l’arrière du cerveau, est très rapide et efficace. Nous voyons
immédiatement, avec peu d’efforts. La pensée (la cognition), qui
est gérée principalement par le cortex cérébral à l’avant du cerveau,
est beaucoup plus lente et moins efficace. La manière traditionnelle
de représenter et de donner du sens aux données nécessite une
pensée consciente pour presque l’ensemble du processus. La data
visualization fait au contraire pencher la balance du côté d’un plus
grand recours à la perception visuelle, tirant profit de la puissance de
nos yeux autant que possible.
Source :
Few, Stephen (2013): Data Visualization for Human Perception.
In: Soegaard, Mads and Dam, Rikke Friis (eds.).
The Encyclopedia of Human-Computer Interaction, 2nd Ed.
Aarhus, Denmark: The Interaction Design Foundation. Available online at
http://www.interaction-design.org/encyclopedia/data_visualization_for_human_perception.html
La data visualization, un outil
sur-mesure pour votre cerveau
43. 43
Comme l’explique Noah Iliinsky8
dans une conférence
LinkedIn Talks9
mise en ligne en avril 2012, "le cerveau humain
est habitué à reconnaître des schémas récurrents. Il agit donc
sur le mode d’une machine à détecter des motifs (patterns).
Ces motifs visibles à travers les graphes, par exemple, sont un moyen
de comparer les différentes informations, par le biais des contrastes
qui s’en dégagent. De fait, l’esprit humain est alors beaucoup plus
à même de saisir des tendances, des écarts ou des évolutions." 10
8. Doté d’un Master en Communication Technique obtenu à l’Université de Washington et d’une Licence de
Physique de la Faculté de Reed, Noah Iliinski (@noahi) est un développeur informatique qui s’emploie à réflé-
chir à des approches efficaces en matière de conception visuelle dédiée à la représentation de l’information.
9. http://www.youtube.com/watch?v=R-oiKt7bUU8
10. Le compte rendu complet de cette conférence est accessible ici :
http://fr.slideshare.net/Cooperatique/noah-iliinsky-prsente-la-dataviz
11. http://www.01net.com/ editorial/592687/chute-historique-des-ventes-mondiales-de-pc-au-1er-tri-
mestre-2013/.
12. http://www.journaldunet.com/ebusiness/internet-mobile/les-ventes-de-tablettes-depasseraient-celles-des-
pc-0413.shtml
> Les nouveaux terminaux
et les nouvelles interfaces d’accès
à l’information
La data visualization est sans doute
le mode d’analyse et d’exploration des données
de l’ère post-PC dans laquelle nous entrons.
Alors que selon IDC les ventes mondiales
d’ordinateurs ont plongé de 14% au premier
trimestre 201311
, Gartner prévoit que les ventes
de tablettes dépasseront celles de PC en 201712
.
Dans ce contexte, les outils de data visualization tirent tout le parti
de l’interface tactile des tablettes pour permettre de manipuler en direct
les graphiques, sélectionner différentes vues, appliquer des filtres, etc.
C’est d’ailleurs une attente forte de la part des utilisateurs de dataviz,
comme en témoigne l’anecdote édifiante relevée par Pierre-Olivier
Sicamois, de Lagardère Active : "La Présidente de la régie nous a imposé
une contrainte unique : il fallait que la solution fonctionne sur iPad."
1.3 une innovation ou une révolution ?
44. 1
Dans certains cas, le fait même qu’une partie du personnel
soit équipée de certains matériels pousse à la diffusion
de la data visualization dans l’entreprise.
C’est ce qui s’est passé, par exemple, chez ID Logistics.
11. http://www.01net.com/ editorial/592687/chute-historique-des-ventes-mondiales-de-pc-au-1er-trimestre-2013/.
12. http://www.journaldunet.com/ebusiness/internet-mobile/les-ventes-de-tablettes-depasseraient-celles-des-pc-0413.shtml
Dans les faits, dès que
nous montrons aux
directions générales SAS®
Visual Analytics sur tablette, elles disent
unanimement que c'est ce dont elles avaient besoin. En effet, les DG
n'ont pas l'utilité à rentrer en profondeur dans le détail des données ;
ce qui les intéresse, c'est d'avoir à disposition des tableaux de bord
intelligents, qui soient utilisables partout, à tout moment.
Je citerai l'exemple de notre Comité de Direction. Ce dernier
disposait auparavant d'un portail avec l'ensemble des tableaux de
bord disponibles : avancement des ventes, CA, qualité du service
au client... Aujourd'hui, nous avons accès à tous ces indicateurs
sur iPad. Les mises à jour sur le serveur Visual Analytics sont
synchronisées automatiquement sur mon iPad. Si je veux analyser
les états depuis chez moi, le soir, dans de bonnes conditions en
termes de confort et d'ergonomie, j'en ai la possibilité.
Nous sommes désormais tout à fait libres et mobiles,
tout en restant parfaitement connectés aux données
permettant de piloter l'entreprise.
Serge Boulet, Directeur Marketing & Communication,
SAS France
Le périmètre d'application de nos solutions dataviz
s'est établi de manière un peu "triviale" à destination
d'un cercle restreint (que nous envisageons d'élargir) :
les utilisateurs de l'iPad, et plus précisément les
membres de la Direction des Opérations et de la
Direction Générale.
Emmanuel Vexlard, DSI,
ID Logistics
Quand l’iPad sert de porte
d’entrée à la dataviz
La data visualization sur tablette,
l’outil d’analyse des données
que les DG attendaient
45. 45
≥ Exemple de data visualization sur iPad chez ID Logistics
Et ce n’est probablement que le début. Les progrès des
interfaces homme-machine (IHM), de plus en plus intuitives,
ouvrent en effet de nouveaux horizons à la dataviz.
La data visualization est selon
nous promise à un bel avenir, en
particulier avec l'arrivée prochaine des dalles tactiles,
promesse de représentations graphiques encore plus
interactives, et le boom que devraient connaître les
tablettes et la 3D. Or, ces avancées technologiques
sont synonymes de changement dans les modes de
représentations. Pour preuve, l'INRIA expérimente
actuellement des visualisations multi-écrans,
impliquant la gestuelle de l'utilisateur.
Frédérique Pain, Experience Strategy Director,
Alcatel-Lucent Bell Labs
Le renouvellement
des IHM, vivier d’innovations
pour la dataviz
1.3 une innovation ou une révolution ?
46. 11
1.4 à qui s’adresse la dataviz ?
Tout d’abord, levons une confusion possible liée au fait
que la data visualization s’inscrit souvent dans le cadre
des big data. Si la dataviz trouve effectivement tout
son sens dès lors qu’il s’agit d’exploiter un volume de
données conséquent, il serait faux de croire qu’elle est
réservée aux grandes entreprises. Comme le soulignait
Jérôme Cornillet de SAS dans la partie 1.3, des
organisations de taille réduite peuvent tout à fait être
amenées à traiter des volumes de données importants
et trouveront un grand intérêt à pouvoir le faire de
manière simple, sans recourir à des spécialistes de
l’analyse statistique.
Si l’on s’intéresse aux profils des utilisateurs de
dataviz, on s’aperçoit qu’ils sont variés, mais peuvent
être regroupés en trois grandes catégories : le grand
public, les parties prenantes internes de l’entreprise
(direction, collaborateurs voire prestataires), et enfin des
partenaires extérieurs à l’entreprise.
Concernant les usages grand public de la dataviz, nous en
avons déjà évoqué certains dans les pages précédentes,
au travers du "pariteur" de France Télévisions ou encore
de la mise à disposition de données pour les citoyens
de la part du Ministère belge de l’ Économie. On notera
simplement ici qu’une même application peut s’adresser
à différents publics. C’est notamment le cas des données
fournies par le SPF Économie belge : "Nos données
sont disponibles d'une part pour le grand public, qui y
accède via un portail open data, et d'autre part pour des
utilisateurs à l'Institut National de la Statistique" explique
ainsi Caroline Denil. Il convient alors de mettre en
œuvre les modalités d’accès et les visualisations les plus
appropriées (nous y reviendrons).
47. 47
1.4 à qui s’adresse la dataviz ?
Un autre exemple de dataviz
grand public : Social Ecorama
≥ Social Ecorama13
Le projet Social Ecorama consiste à mettre à disposition des
visiteurs du site Web de BFM-Business un indicateur de l’humeur
des ménages et du moral des entreprises. Cet indicateur a plusieurs
originalités.
Tout d’abord, il est construit en analysant les messages postés par
les internautes sur les médias sociaux, de type Twitter et Facebook.
Les partenaires technologiques du projet, SAS et Inbox, analysent
ces messages, collectent cette grande quantité de données textuelles
et les analysent pour savoir si elles reflètent un sentiment positif
ou négatif, selon différents critères. Sont ainsi observés, pour les
ménages, les messages ayant trait au chômage, à la consommation,
au logement, au pouvoir d’achat, etc. Du côté des entreprises, ce
sont la croissance, les profits, les embauches, les exportations, entre
autres, qui sont passés au crible. Pour chaque item, un indicateur de
"positivité" est calculé, pour estimer si le climat sur le sujet est plutôt à
l’optimisme ou au pessimisme sur les médias sociaux.
13. http://ecorama.inbox.fr/
48. 1 La deuxième spécificité est que ces indicateurs sont suivis
quotidiennement, alors que les enquêtes d’opinion classiques par
sondages sont réalisées à des fréquences de l’ordre du mois.
Enfin, la troisième grande originalité de Social Ecorama
est le rendu sous forme de data visualization des résultats.
Les internautes peuvent visualiser l’évolution de la positivité
des ménages et des entreprises, sous forme de courbes,
en sélectionnant les mots-clés qui les intéressent, ainsi que la
période. Le projet a été lancé le 3 avril 2013 et déjà plus de trois
mois de données sont disponibles pour l’exploration.
La combinaison de ces trois originalités
fait de Social Ecorama une première mondiale..
Emmanuel Lechypre,
Éditorialiste, Responsable pôle Analyse et Prévisions
BFM Business
Même constat du côté de Clément Delpirou,
associé chez InfoPro Digital :
La data visualization permet bien sûr d'exploiter et de valoriser
nos contenus, mais j'y vois surtout une valeur sûre pour répondre
à trois objectifs essentiels.
En termes d'audience d'abord, c'est le moyen de mettre nos
contenus à la disposition de tous (ex. : notre classement des écoles
d'ingénieurs), ou notre cartographie des BTS.
C'est deuxièmement la possibilité d'apporter une réelle valeur
ajoutée à la gestion de nos abonnements, ce qui n'est pas
négligeable au vu du paysage médiatique chahuté auquel nous
sommes confrontés. D'ailleurs, il ne s'agit plus d'abonnements
classiques à des revues, mais de véritables abonnements à des
systèmes d'information : avec Industry Explorer, par exemple,
nous offrons un accès aux magazines, mais également une
consultation fiche par fiche des informations sur les entreprises.
C'est ainsi que nous sommes en mesure d’enrichir notre offre
éditoriale tout en développant les revenus de nos abonnements.
Enfin, la dataviz est le moyen pour nous de développer des
lignes business spécifiques. Avec la cartographie notamment,
nous touchons du doigt une valeur allant au delà de la valeur de
l'abonnement seul, ce qui était impossible avec les
moyens technologiques traditionnels (ex. : on peut
consulter une carte de toutes les usines d'Aquitaine
ayant déclaré investir plus de 10 millions d'euros
l'année prochaine).
Clément Delpirou,
Associé, InfoPro Digital
49. 49
En interne, la data visualization est utilisée à tous les niveaux
de l’entreprise, de la Direction générale aux équipes terrains,
en passant par les directions Métiers. Son usage est même
parfois très répandu, y compris dans de vastes organisations,
telle qu’une multinationale comme Philips. C’est ce que
nous confirme Menno Haijma, Senior Global Manager chez
Philips : "la plupart des personnes concernées sont des
managers et des business leaders, que ce soit dans les pays
ou au niveau central."
En ce qui concerne la DG ou la Présidence d’une entreprise,
comme nous l’avons déjà évoqué, c’est la capacité à obtenir
en temps réel, y compris en mobilité, une vision synthétique
des grands indicateurs de l’entreprise, alimentés par des
données actualisées en temps réel, qui séduit.
Dans une perspective
Business Intelligence,
nous avons mis en place
une solution sur iPad.
Celle-ci répond aux
attentes de la Direction,
dans la mesure où
son action de pilotage
nécessite d'avoir à
disposition des tableaux
de bord dotés d'indicateurs
clés qui puissent favoriser
l'analyse et optimiser
la prise de décision.
Jérôme Tharaud,
Responsable des études
et développement,
Prisma Media
≥ Dataviz sur iPad chez Prisma Media
Décider à l’aide
d’indicateurs clés
1.4 à qui s’adresse la dataviz ?
50. L’arrivée de notre
nouveau Directeur Général, il y a quatre ou
cinq mois, a été l’occasion pour la Présidente
de la Régie Publicitaire et le DG d'organiser
une réunion du Comité de Direction, au
cours de laquelle nous avons réalisé un "tour
d'horizon" des projets en cours. Voici ce qui
nous a été remonté :
"la régie publicitaire est plurimédia, mais les
statistiques ne remontent aucune donnée
plurimédia". Cette remarque nous a quelque
peu étonnés dans la mesure où, justement,
notre système de reporting était capable de
remonter de telles données, à travers les cubes
que nous avions mis en place ! Quoi qu'il en
soit, nous nous sommes engagés auprès de la
Présidente et au DG à mettre à leur disposition
sous un mois de telles statistiques
plurimédia.
Pierre-Olivier Sicamois,
Responsable du domaine Régie publicitaire,
Direction des Technologies
Lagardère Active
1
La data visualization pour diffuser
une information disponible,
mais qui passait inaperçue
Et il arrive que les chefs de projets dataviz aient
des surprises ! On s’aperçoit parfois que des
informations mises à disposition de longue date
sous forme d’états classiques sont totalement
ignorées par la Direction. La dataviz est alors un
moyen de les remettre en évidence pour qu’elles
soient enfin utilisées.
51. 51
Concernant les directions métiers, elles sont
doublement intéressées par la data visualization.
Tout d’abord, parce qu’elles en sont les premières
utilisatrices. Mais aussi parce que, sans elles, ces
solutions ne pourraient pas être mises en place.
Ce sont les Métiers qui connaissent les besoins, la
signification des chiffres, et qui sont seuls à même
d’interpréter les visualisations. Ils sont donc à la fois
consommateurs et coproducteurs de la dataviz.
À terme, une fois
le système industrialisé, c'est à la
fois aux équipes techniques et aux
équipes Métiers qu'il s'adressera.
En effet, ces dernières contribuent
largement aux processus de
développement, dans la mesure
où ce sont elles qui sont chargées
de paramétrer, de qualifier les
données, et d'alimenter le moteur.
Le système leur servira dans
une visée de reporting et de suivi
de la qualité du service proposé
aux internautes.
Eric Lajarige,
Responsable de projets search,
PagesJaunes
Le Métier, à la fois utilisateur
et co-constructeur
de la dataviz
1.4 à qui s’adresse la dataviz ?
52. 1
PagesJaunes
détecter de manière automatique et via
la donnée les requêtes mal catégorisées
Le moteur de recherches PagesJaunes permet
aux internautes de rechercher un professionnel
dans toute la France, en renseignant deux champs :
"Quoi/qui" et "Où".
La catégorisation d’une requête en "Quoi" ou "Qui"
est donc particulièrement importante.
Une mauvaise catégorisation des requêtes diminue
sensiblement les chances pour un professionnel
d’être trouvé lors d’une recherche. Si un visiteur
tape "acacias, Toulouse", on peut penser qu’il veut
acheter des acacias. Cela signifie qu’on catégorise
"acacias" en objet ("Quoi ?").
Et si l’utilisateur cherchait en fait l’adresse
d’un restaurant appelé "Les Acacias" à Toulouse ?
Il faut comprendre "Les Acacias" comme le nom
d’une entreprise ("Qui ?"). Dans un cas, la réponse
attendue est une liste de pépinières, dans l’autre,
l’adresse d’un restaurant bien identifié.
Sachant que la proposition de valeur du groupe
PagesJaunes est justement d’offrir de la visibilité
aux professionnels et aux entreprises, cela peut
être dramatique. Mais comment détecter les
requêtes n’aboutissant pas à cause d’une mauvaise
catégorisation dans le flot des requêtes quotidiennes ?
Pour y parvenir, l’agence 55 | fifty-five.com
a développé pour PagesJaunes une interface
d’exploration des requêtes, permettant de filtrer
une liste de requêtes selon différents critères
interdépendants. Grâce à cette interface,
il devient possible de détecter visuellement
les requêtes pour lesquelles la présomption
d’erreur de catégorisation est la plus forte.
Martin Daniel,
Chef de projet Data Visual,
fifty-five
53. 53
≥ L’interface de Search Analytics de PagesJaunes
(Plus les chiffres dans les colonnes affinage ou localité
sont proches de 1, plus la probabilité que le professionnel
ait été mal labélisé dans la base de données est forte.)
1.4 à qui s’adresse la dataviz ?
54. 1 La plupart des fonctions de l’entreprise peuvent
bénéficier de la data visualization : marketing,
commercial, finance, fabrication industrielle, R&D…
Laurence Kerjean, de L’Oréal, nous le confirme :
On retrouve souvent des métiers très en contact avec
le terrain. Jusqu’ici, ces métiers ne disposaient pas
nécessairement des bons outils de reporting ou d’analyse,
et la dataviz vient à propos combler ce manque.
Dès lors que la donnée "de base" est
quantitative, la data visualization est
un vrai vecteur pour son exploitation. Tous les métiers ou domaines
sont donc concernés. D’ailleurs, même les données qualitatives peuvent
être mises en images, il suffit de les convertir en valeurs numériques
(ex. : pas content = 1 point / très satisfait = 7 points).
Pour le marketing en particulier, la data visualization
est très efficace, car elle permet de présenter
à des personnels créatifs (par nature) des données
quantitatives sous forme visuelle, donc plus simples
et rapides à digérer.
Laurence Kerjean,
Global Digital Manager L’Oréal
La solution est accessible à
l'ensemble des salariés mais, dans les
faits, ce sont surtout les départements
Marketing en Europe et en Amérique qui l'utilisent, ainsi
que les studios de développement dans le monde.
Charles du Réau
Consumer & Market Knowledge Director, Ubisoft
À des fins d'analyse concurrentielle, nos outils
s'adressent aux départements Achats, Vente et Marketing
essentiellement. Dans cette visée, ils fournissent
une intelligence sectorielle poussée utile à la définition
de notre stratégie.
Clément Delpirou
Associé, Infopro Digital
La dataviz,
c’est pour tous les métiers
La dataviz, un outil pour
comprendre l’environnement
concurrentiel de l’entreprise
55. 55
D’autres contributeurs insistent moins sur cet aspect
reporting et mettent davantage en exergue la meilleure
compréhension du métier lui-même. La représentation
visuelle permet en effet de rendre compte de la cohérence
des processus composant le métier, ce qui n’était pas
toujours possible auparavant.
Enfin, grâce à son aspect pratique, la dataviz sort des
bureaux et porte la puissance de l’analytique au plus près
du terrain. Les équipes opérationnelles peuvent s’en servir
pour prendre des décisions rapidement, comme
c’est le cas chez STMicroelectronics.
La réalisation de reporting n’est pas,
pour nous, ce qu’il y a de plus novateur dans la data visualization. Même
s’ils permettent aujourd’hui de filtrer plus finement et d’offrir une synthèse,
les reportings existaient déjà dans les outils d’informatique décisionnelle
(BI) classiques. Notre approche de la data visualization se concentre
plutôt sur la récupération, à n’importe quel moment du cycle d’achats,
sous forme visuelle et collaborative, de l’ensemble des informations du
référentiel de données (comptes fournisseurs, prix des articles, catalogues
par fournisseurs et familles de produits, recommandations achats,
informations en provenance de la supply chain, etc.).
Nous obtenons ainsi sous la forme d’un tableau de bord
une vision synoptique de plusieurs processus métiers qui
étaient jusqu’alors disjoints. C’est là que réside pour nous
la véritable innovation.
Franck Jouenne,
Director, IT & Services Strategic Sourcing, Alcatel-Lucent
Nous implémentons nos solutions
DataViz à l'intention de l'ensemble
de nos salariés : de l'ouvrier au chef
de service, en passant par le technicien.
Dans ce cadre, un ouvrier recourra plus fréquemment
aux cartes de contrôle et graphes d'état des machines,
par exemple, tandis que le chef de service s'intéressera
aux tendances du rendement.
Guillaume Deschamps, FMT / Central Functions YTI / EDA,
ST Microelectronics
Mieux comprendre et piloter
le métier, grâce à la dataviz
La dataviz, un outil de
choix dans l’industrie
1.4 à qui s’adresse la dataviz ?
56. 1
Toujours dans le domaine de l’industrie,
la data visualization permet de
comprendre certaines situations
techniques complexes et de prendre les
bonnes décisions. Un public d’ingénieurs
y trouvera donc son avantage.
Je considère que l'apport
de la dataviz peut être particulièrement
intéressant pour les ingénieurs sur des points
nécessitant une expertise pointue, mais
également pour les décideurs. La gestion
de la restitution de l'énergie produite par les
différents trains l'illustre particulièrement
bien : un train qui freine produit une énergie
conséquente et difficilement stockable. C'est
pourquoi il vaut mieux l'utiliser dès qu'elle est
produite, en la réinjectant sur un autre train.
La possibilité de localiser sur une carte ces
points de restitution n'est pas négligeable :
visualiser précisément la récupération
énergétique à l’œuvre contribue à calculer
la consommation électrique, à établir les
coûts associés, ainsi qu'à définir les actions à
conduire en conséquence. En l'occurrence, la
data visualization permet ici à nos ingénieurs
experts de mieux visualiser à quel endroit
ou en quelle zone faire figurer un stockeur...
C'est également le moyen pour les décideurs
d'appréhender les secteurs où il est intéressant
d'investir.
Maguelonne Chandesris,
Responsable de l’équipe Statistique,
Économétrie et Datamining,
Direction Innovation & Recherche
SNCF
La data visualization
au service des ingénieurs
57. 57
Un autre secteur industriel
dans lequel la data visualization se révèle
très utile est celui de l’énergie.
Le déploiement des compteurs intelligents
doit permettre d’optimiser la distribution d’énergie
dans le réseau grâce à un suivi fin (tendance, profils) et
l’anticipation de la demande (prévision maintenance).
La volumétrie des données à analyser est un enjeu
crucial, la rapidité et la capacité d’analyse primordiale.
Ce graphique illustre la consommation électrique selon
différents profils (horaire, journalier) ainsi que le suivi en
continu de la tendance. Le graphique à bulles présente la
consommation par zone géographique.
Source:SAS®
La data visualization appliquée
au secteur de l’énergie
≥ Gestion des Compteurs Intelligents
1.4 à qui s’adresse la dataviz ?
58. 1
Pour clore cet aperçu des différentes fonctions pouvant
mettre à profit la data visualization, nous pouvons dire
que l’éventail est très large. Des directions ou secteurs
d’activité les plus classiques à d’autres que l’on attendrait
moins, la dataviz se fraye de plus en plus un passage
dans les entreprises.
Il arrive que certains professionnels
aient des comportements frauduleux ou contribuent à
une fraude généralisée, voire carrément organisée en
réseau (détournement ou abus de prestations sociales,
fraude à l’assurance…). Ce genre de fraude est difficile
à détecter lorsqu'on considère une transaction isolée,
de type réparation de véhicule ou vente d'une paire de
lunettes, par exemple. En revanche, à partir du moment
où l'on arrive à mettre en relation un grand nombre
d'assurés bénéficiant de la même complaisance ou de
la même fraude, il est possible de mettre en évidence
des réseaux collusoires entre assurés et professionnels.
Cela est difficile, sinon impossible, par la seule étude
de tableaux chiffrés. Une représentation graphique
peut permettre de repérer des schémas ou des points
anormaux du premier coup d’œil, qui peuvent signaler
une fraude possible.
À noter que la dataviz est utilisée dans la détection
des fraudes aussi bien par des assureurs privés que
dans le cas des indemnisations publiques (indemnités
chômage, allocations familiales, etc.). Je vous en
donnerai d'ailleurs une illustration flagrante avec une
référence parmi nos clients. Le Comté de Los Angeles
a eu l'idée de superposer le graphe des données
représentant la distribution des prestations sociales
avec les coordonnées géographiques correspondantes :
il a eu alors la surprise de constater qu'une zone de forte
distribution de prestations sociales coïncidait avec des
secteurs résidentiels !
C'est grâce à une telle combinaison de dimensions
multiples (données sociales, données des assureurs,
coordonnées géographiques, voire conversations sur
les médias sociaux) qu'une présomption de fraude peut
gagner en force et finir par s'imposer d'elle-même.
Mouloud Dey, Directeur des Solutions
et Marchés Émergents, SAS France
Quand la dataviz fait
trembler… les fraudeurs !
59. 59
Enfin, dernier public de la data visualization, et non des
moindres : les clients de l’entreprise. L’exemple d’IFR GfK
est particulièrement représentatif. Le groupe réalise
des enquêtes liées à la distribution de biens de grande
consommation à travers trois méthodes principales :
des panels détaillants, des études ad hoc (questionnaires)
et le recensement des produits disponibles sur étagères.
Le produit qu’il commercialise à ses clients, issus de ces
recherches, c’est de la donnée. Or, si certains clients restent
fidèles au reporting classique, un nouveau segment apparaît
d’une clientèle friande d’outils plus visuels.
On le voit, la data visualization se prête à une grande variété
d’usages. Ceux-ci peuvent faire l’objet de regroupements, tels
que celui proposé par Frédérique Pain d’Alcatel-Lucent :
Si la dataviz apparaît aussi transverse,
c’est parce qu’elle présente toute une série
d’avantages, que nous allons détailler
dans la deuxième partie de l’ouvrage…
D'un point de vue général, la data visualization
a quatre champs d'application principaux :
• l’analyse des données à des fins de reporting ;
• l’exploitation des données pour expliquer le monde
(ex. : études médicales) ;
• l'optimisation des processus (ex. : logistique) ;
• la prédiction, faisant intervenir l'étude poussée de
patterns, pour anticiper les phénomènes à venir.
Frédérique Pain, Experience Strategy Director,
Alcatel-Lucent Bell Labs
grandes
familles
4 d’usages
1.4 à qui s’adresse la dataviz ?
60. 12
Par delà l’
extrême variété de leurs secteurs
d’activités et de leurs usages, nos contributeurs
s’accordent sur une série de bénéfices de la data
visualization, tant pour l’entreprise que pour les
utilisateurs eux-mêmes. De manière synthétique,
nous pouvons dire que la dataviz améliore :
la compréhension des données,
la communication des données,
la prise de décision,
la motivation des utilisateurs,
la capacité à innover.
2 Les bénéfices
de la data
visualization
2
61. 61
2.1 la dataviz facilite la
compréhension des données
L’exemple du quartet d’Anscombe, dans la partie 1,
illustrait d’un point de vue théorique qu’un tableau
de chiffres n’était pas toujours facile à interpréter
et qu’un graphique pouvait être bien plus éloquent.
D’un point de vue pratique, les contributeurs
que nous avons interrogés font cette constatation :
lorsqu’il s’agit d’analyser les données pour leur
donner un sens, la représentation graphique
est un allié de taille. C’est par exemple ce
que nous confirme Pierre-Olivier Sicamois
de Lagardère Active :
Nous avons choisi
de recourir à la dataviz
pour simplifier l’accès à l'information et pour
combler nos lacunes dans l'appréhension
de certaines données.
En effet, la lecture de tableaux est utile lorsque le
chiffre en lui-même est primordial (ex. : CA). Mais
autrement, un camembert est bien plus parlant :
il permet de visualiser précisément la répartition
des différents médias, la prédominance d'un
média sur un autre ou bien le panachage de ces
médias par annonceur...
Pierre-Olivier Sicamois,
Responsable du domaine Régie publicitaire,
Direction des Technologies,
Lagardère Active
La data visualization pour mieux
comprendre le comportement
des annonceurs
62. 1
Cet avantage de la dataviz sur les tableaux
de chiffres bruts est renforcé par la conjonction
de deux phénomènes. D’une part, l’environnement
de l’entreprise est de plus en plus complexe, et met
en jeu des données de natures très différentes.
Il n'est pas rare qu'une
requête client retourne
jusqu’à 80 combinaisons d'itinéraires différentes !
À nous de définir les bons leviers pour que le
client arrive à s'y retrouver, et ce selon différentes
dimensions. Par exemple, nous devons nous
interroger sur la meilleure manière de représenter
à la fois les grilles horaires, les prix et les données
géographiques.
Frédérique Ville,
Directrice de l'Innovation, Voyages-sncf.com
Visualiser simultanément
et intelligemment des données
de natures différentes
2
≥ Mytripset, Voyages-sncf.com
63. 63
Nous avons rendu disponible de l’information
qui ne l’était pas auparavant, rien qu’en
combinant différentes sources.
Yves Daelmans,
ICT Project Manager, IMEC
La data visualization permet justement de
représenter simplement cette complexité,
donc de la rendre assimilable pour en tirer
de la valeur. C’est ce que nous explique
Bernard Lebelle, fondateur de l’agence
Bleu-Cobalt et auteur de Convaincre avec
des graphiques efficaces (Eyrolles, 2009)
et Dites-le en images : des idées ? Un crayon !
(Eyrolles, 2013) :
1. Pour plus de détails et exemples, on se reportera au site http://senseable.mit.edu/trainsofdata/
L'originalité, ici, c'est de montrer
que l'on peut agréger et visualiser
simultanément des données de structures
différentes : des données de production
(les trains) et des données commerciales
(comment sont remplis les trains ?). Nous
donnons à voir la complexité du système1
.
Maguelonne Chandesris,
Responsable de l’équipe Statistique,
Économétrie et Datamining,
Direction Innovation Recherche SNCF
Mytripset,
Voyages-sncf.com
2.1 la dataviz facilite la compréhension des données
64. 12
Rendre visuelles les dimensions complexes
(temporelles, géographiques, relationnelles)
permet de mieux identifier les gisements de
productivité, de compétitivité ou de marge. Dans
l’exemple suivant, nous avons 4 dimensions
(CA, parts de marché, évolution temporelle et
2 acteurs différents) représentées sur un seul
graphique. Par ailleurs, en enrichissant et en
optimisant le traitement graphique des données,
on évite le syndrome d’information overload
(lorsque l’ajout d’une trop grande volumétrie de
données chiffrées sur de nouvelles dimensions
vient saturer les capacités de traitement de
l’esprit humain). D’importants volumes de
données multidimensionnelles deviennent
soudain facilement assimilables.
Bernard Lebelle,
Fondateur de Bleu-Cobalt
Source :Bleu-Cobalt®
≥ Maîtriser le complexe pour identifier les gisements de croissance
65. 65
D’autre part, l’économie s’accélère
et il faut réussir à appréhender
cette complexité rapidement.
Face à cette double contrainte, les
entreprises se rendent à l’évidence :
il est illusoire de vouloir tout mettre
en équations, de tout rationaliser.
Leur monde n’est pas soluble dans
des modèles théoriques. Elles se
convertissent donc à une autre manière,
plus empirique, de considérer leurs
données, pour que puisse émerger leur
signification. La data visualization se
prête bien à cette observation sans a
priori. Ainsi, pour reprendre les termes
de Claude-Henri Mélédo, Une grande
nouveauté qu'introduit la data
visualization, notamment dans un
contexte big data, est l'apparition
de graphiques qui ne viennent pas
en aval d'une analyse, pour expliquer
ou communiquer, mais en amont,
pour explorer.
Comprendre
plus vite Dans un contexte où tout s'accélère et où
nous n'avons plus le temps de lire de grands
rapports pleins de détails, la data visualization
est un moyen de comprendre et d'analyser plus
vite. Elle nous permet de bénéficier tout
de suite, en un coup d’œil, d'une vue globale
sur les indicateurs clés de l'entreprise.
Emmanuel Vexlard,
DSI, ID Logistics
2.1 la dataviz facilite la compréhension des données
66. 12
Avec la BI traditionnelle, l'utilisateur est
en mode requêtage (sélection, puis récupération
des données) et doit se poser les questions a priori.
En ce sens, d'une certaine façon, la BI traditionnelle
réduit la donnée et coupe peut-être l'utilisateur
d'une information qu'il aurait vue en récupérant
toute la donnée de façon visuelle. Ainsi, avec les
outils classiques, une invraisemblance ne saute
pas nécessairement aux yeux et risque de nous
échapper. Si nous envisageons les choses dans
un contexte Big Data, c'est d'autant plus frappant.
Avec la dataviz, en revanche, l'utilisateur est dans
un mode de découverte totale des données. Il a la
possibilité d'entreprendre une analyse exploratoire,
de se promener dans les données.
Imaginons une série de données comportant
une donnée aberrante, soit liée à un problème
de qualité des données, soit au contraire reflétant
une exception digne d'intérêt. Je vous défie
de la repérer avec un outil de BI traditionnel, sauf
à multiplier les requêtes. Avec une interface
visuelle, vous serez tout de suite alerté par cette
donnée particulière.
En définitive, le côté visuel apporte beaucoup.
Nombre de nos clients sont déjà rompus
aux mécanismes de la BI ou des statistiques,
mais les outils de data visualization sont pour
eux l’occasion de se demander s'il n'y a pas des
questions – qu'ils avaient éclipsées avec la BI
classique – qu'ils pourraient envisager sous un
angle nouveau. C'est tout un univers d'horizons
qui s'offre à eux.
Serge Boulet,
Directeur Marketing Communication,
SAS France
À la découverte
des données
67. 67
≥ Source : SAS®
Ce graphique fait partie d’un tableau de bord de pilotage achat.
Il montre l’évolution dans le temps de la marge brute et du coût.
Le treemap montre la répartition des montants par fournisseur.
Data visualization et pilotage des fournisseurs
Deux exemples de pilotage enrichi
par la Data Visualization :
2.1 la dataviz facilite la compréhension des données
68. 12
Deux exemples de pilotage enrichi
par la Data Visualization :
Ce graphique fait partie d’un tableau de bord de
pilotage financier. Il illustre l’évolution du revenu
sur deux ans (réalisé et prévu). L’histogramme
montre l’évolution du profit mensuel sur la
même période.
Data visualisation et tableau de bord financier
≥ Source : SAS®
Plusieurs entreprises nous ont d’ailleurs fait
part de leurs actions concrètes ou de leurs intentions
d’utiliser la data visualization à des fins d’exploration.
69. 69
Par sa capacité à faire ressortir de manière
graphique très parlante des données aberrantes,
la data visualization en mode exploratoire
est aussi un excellent moyen de repérer des
problèmes, et donc d’y remédier.
L’idéal serait pour nous de réussir à révéler une
information jusqu'alors invisible, au moyen de la
data visualization. Notre outil vise ainsi, à terme,
à dégager d'un volume de données phénoménal
des tendances difficiles à appréhender sans
représentation visuelle. C'est un point que nous
souhaiterions approfondir, et plus précisément
pour nos données marketing.
Pierre-Olivier Sicamois,
Responsable du domaine Régie publicitaire,
Direction des Technologies, Lagardère Active
La dataviz est, à n'en pas douter,
un moyen d'explorer les données de manière
poussée, ce qui, dans une visée marketing,
s'avère des plus intéressants : le filtrage ou
la possibilité de zoomer sur un instant t, par
exemple, sont des moyens mis au service de
l'exploration de tendances. Ils permettent de
valider des hypothèses, mais également de
procéder à des expérimentations en termes
d'expérience utilisateur.
Frédérique Pain,
Experience Strategy Director,
Alcatel-Lucent Bell Labs
La data visualisation pour
explorer des tendances
2.1 la dataviz facilite la compréhension des données
70. 12
Enfin, la dataviz permet l’exploration
de données jusqu’alors inexploitées et mal
comprises, les données non structurées.
C’est d’autant plus important que le volume
de celles-ci explose, notamment sous la
poussée des médias sociaux.
Notre besoin était d'explorer notre data
set, pour mieux appréhender la pertinence
des résultats que nous renvoyons aux
internautes. En effet, pour améliorer la
qualité de notre indexation, nous n'avions
jusqu'alors à notre disposition que des
remontées statistiques difficiles à exploiter
lorsque l'on sait que nous traitons des
dizaines de millions de requêtes par mois.
Dans ce volume, il est particulièrement
difficile de détecter les requêtes sur lesquelles
notre moteur répond mal. Un outil comme
la data visualization va nous donner un
autre levier pour déceler plus rapidement les
dysfonctionnements.
Éric Lajarige,
Responsable de projets search,
PagesJaunes
Explorer
pour corriger
71. 71
En définitive, la data visualization nous invite
à reprendre la distinction classique entre
données, information et connaissance.
Si les données sont des éléments unitaires,
bruts, reflétant une réalité, l’information est leur
mise en cohérence pour leur donner du sens.
Le cas des contenus publiés sur
la Toile est éloquent : l'analyse et
la mise en relation des thématiques,
des mots, des phrases, des documents
(et éventuellement, derrière, des liens entre
les individus) constituent une formidable
mine d'or pour les directions Marketing,
mais également pour les acteurs
de l'intelligence économique en général.
Plus spécifiquement, il y a des relations que
nous ne pouvons percevoir à l’œil nu, mais
que nous sommes à même d'appréhender par
le biais d’analyses graphiques sophistiquées.
C'est le cas notamment des analyses de graphes
sociaux qui permettent de mettre en évidence
des relations non triviales entre les individus.
C'est pour moi un apport majeur de la data
visualization.
Pour dire les choses autrement, nous avons
besoin de la dataviz pour révéler ce qui
n'est pas immédiatement perceptible,
et la problématique des Big Data vient
renforcer ce besoin.
Mouloud Dey, Directeur des Solutions
et Marchés Émergents, SAS France
La dataviz pour explorer
les contenus du Web
et du Web social
2.1 la dataviz facilite la compréhension des données
72. 12
Très simplificateur,
l’exemple d’Anscombe1
illustre toutefois
parfaitement les
apports de la data visualization dans une approche
qu’on pourrait qualifier d’analytique et la nécessaire
complémentarité des solutions à mettre en œuvre
dans un processus de décision basé sur des données.
Dans ce cas précis, la data visualization invite
à remettre en cause le modèle très (trop) simple
d’ajustement linéaire, évidemment insuffisant pour
décrire et expliquer de manière pertinente les données
observées, et à rechercher des modèles alternatifs plus
précis et plus adaptés.
Les Anglo-saxons disposent de termes simples pour
exprimer ces approches complémentaires. Disposer
d’un recul suffisant (HINDSIGHT), apporter des
éclairages sous différents angles (INSIGHT), enfin
se doter d’une réelle clairvoyance, pour ne pas dire
prévoyance (FORESIGHT), forment les trois principaux
piliers d’une démarche expérimentale appropriée
à un processus de décision centré sur l’analytique,
visant à donner du sens aux données et à justifier
des décisions optimales.
Une étude récente a montré que sur les 10 dernières
années, les entreprises du SP 500 qui utilisent
l’analytique au cœur de leurs processus de décision
surperforment leurs concurrents d’environ 64%.
L’utilisation d’approches analytiques centrées sur les
données trouve en effet sa légitimité dans un nombre
croissant de processus métiers, qui en retirent des
bénéfices impressionnants.
Mouloud Dey,
Directeur des Solutions et Marchés Émergents,
SAS France
La dataviz au cœur du processus
de décision : les bienfaits d’une
démarche analytique
1. Voir I.1, Définitions de la dataviz
73. 73
On peut dire que la dataviz achève le cheminement
en permettant aux utilisateurs de s’approprier cette
information, de la manipuler, pour faire ressortir sa
valeur dans son contexte. Mais pour que cette valeur
trouve tout son potentiel, il convient qu’elle se diffuse
dans l’organisation. C’est ce que nous allons voir
au chapitre suivant.
Le revenue management ou yield management
largement utilisé par les compagnies aériennes, les
grandes chaînes hôtelières (mais aussi par la SNCF2
)
depuis de nombreuses années est un exemple
concret d’approche business analytics. Des décisions
optimales (fixation des prix) sont prises en fonction de
modèles de prévision de la demande (forecasting) et
d’hypothèses d’écoulement du stock des prestations
à offrir (sièges d’avion ou de train, chambres d’hôtel).
Ce genre d’approche se décline aujourd’hui à grande
échelle pour fixer les prix des articles, des démarques
et optimiser les marges chez les acteurs les plus
avancés de la grande distribution.
Dans des domaines aussi variés que le marketing
(mais aussi la prévention de la fraude, les octrois
de crédit, etc.), l’observation historique de
caractéristiques individuelles permet aujourd’hui de
segmenter, de modéliser, de profiler et d’anticiper
assez précisément les comportements de chacun
d’entre nous.
Enfin, dans le domaine industriel, la maintenance
d’équipements critiques (plates-formes de forage,
centrales électriques…) justifie également, au vu
des enjeux financiers, une réelle prévention
des risques de défaillance, que la modélisation
prédictive permet d’affiner.
La data visualization, au cœur de ces approches
analytiques, apporte le recul et les éclairages préalables
à la modélisation dans ces différents processus
métiers, mais aussi les analyses d’impacts relatives
à la mise en œuvre effective de ces modèles.
2. Voir I.2, encadré La dataviz pour faire évoluer l’offre de la SNCF dans différents domaines
2.1 la dataviz facilite la compréhension des données
74. 1
2.2 la dataviz améliore
la communication
Les données ne reflètent pas seulement la réalité,
elles ne sont pas uniquement un levier de pilotage.
Elles sont également un outil de communication.
Malheureusement, peu d’entre nous parlent
couramment leur langage. Nous avons, pour la
plupart, besoin d’un interprète pour nous faire
pénétrer dans l’intelligence de la donnée.
C’est là que la data visualization intervient.
Cet usage de la dataviz à des fins de
communication concerne autant l’intérieur
des organisations que leur rapport avec leur
environnement, aussi bien les entreprises
que les services publics ou l’administration.
C’est ainsi que le SPF Économie en fait
usage dans sa communication en direction
des citoyens belges.
Les bénéfices de notre
programme dataviz sont conséquents pour
l'ensemble des citoyens : ces derniers ont non
seulement besoin de graphes représentant
les évolutions (ex. : évolution des assujettis à
la TVA), mais aussi de pouvoir exporter leurs
données comme bon leur semble.
C'est ce qu'aujourd'hui nous sommes
en mesure de leur proposer.
Caroline Denil, Data Warehouse
Program Manager, SPF Économie
Améliorer la communication
vers les citoyens
2
75. 75
2.2 la dataviz améliore la communication
1. http://economie.fgov.be/fr/statistiques/chiffres/economie/construction_industrie/
immo/prix_moyen_appartements/
L’appétence pour les tableaux
de chiffres complexes n’est
pas plus grande dans les
entreprises que dans le
grand public. En particulier,
le top management ne
souhaitera pas, en général,
fouiller des états volumineux
et compliqués. Ce dont il a
besoin, c’est d’une représentation claire et élégante
de l’information pour lui permettre de prendre
ses décisions. Dans ce contexte, la représentation
graphique des données trouve tout son sens.
Data visualization permettant de naviguer sur une
carte pour découvrir le prix moyen ou médian des
appartements et d’exporter les résultats au format csv.1
Nos démarches
en matière de data visualization s'inscrivent dans
la continuité des efforts que nous avons entrepris
en matière de Business Intelligence. Elles font
appel à une composante forte : la volonté de rendre
les rapports et les données plus sexy, autrement
dit, plus simples à comprendre. Actuellement,
nos efforts visent essentiellement à rendre les
données plus esthétiques, plus abordables, in fine
plus accessibles aux gens qui ont peu de temps
à disposition pour appréhender réellement la
teneur de l'information. Nous pouvons donc dire
que notre dataviz est aujourd'hui principalement
orientée reporting.
Pierre-Olivier Sicamois, Responsable du
domaine Régie publicitaire Direction des
Technologies, Lagardère Active
Des états plus faciles à appréhender
pour des décideurs ayant peu de temps
76. 1
Enfin, l’entreprise se doit de faire le même effort
lorsqu’elle communique vers ses clients, confrontés
aux mêmes problèmes de ressources et de
disponibilité. En ce sens, la data visualization n’est
que le prolongement logique de l’histoire de la BI.
Comprises, communiquées, les données
deviennent un levier d’action. C’est ce que le chapitre
2.3 s’emploie à montrer.
2
La data visualization
est l’aboutissement d’une
longue histoire en matière de reporting. À une époque pas si
lointaine, les données que nous collections étaient stockées sous
forme papier et nous envoyions des classeurs à nos clients. Une
salle entière était réservée à nos archives.
La deuxième étape a consisté à communiquer ces données au
format numérique, sous forme de fichiers. Dès lors, nous avons
commencé à transformer les données en graphiques, pour les
rendre plus comestibles.
La troisième étape, celle que nous vivons aujourd’hui, est une étape
dans laquelle nous nous devons de collecter une information de
plus en plus complexe et volumineuse. Dans le même temps, nos
clients ont de moins en moins de temps, et des équipes de plus en
plus réduites, pour traiter l’information que nous leur fournissons.
C’est ce qui nous a amenés, depuis 3 ans et surtout depuis 2013, à
déployer un nouveau mode d’accès à nos données
sous forme de data visualization. Cette offre est
d’ores et déjà disponible pour l’ensemble de nos
clients dans le monde.
Fabrice Benaut, CIO global IFR,
Head of IS and Operations, IFR Monitoring
La datavisualisation, évolution
naturelle de la communication
des données à ses clients