SlideShare a Scribd company logo
1 of 31
Download to read offline
Comment intégrer les Big Data à votre Système d’Information
et gérer leur qualité ?
Jeudi 1er décembre 2016
Fateh Naili
Enterprise Solutions Manager, Information Builders
Agenda
02 03
Intégrez les Big Data Gérez la qualité
des données
Information Builders
01
Agenda
02 03
Intégrez les Big Data Gérez la qualité
des données
Information Builders
01
90%Of all the data in the
world has been generated
over the last 2 years
Data Output is growing rapidly
2009 2010 2011 2012 2013 2014 2015
A quelle vitesse vos données augmentent ?
Avec les réseaux sociaux…
5
Cisco Systems
D’ici 2020, le traffic
généré sur le web
667 ExaBytes / an
Google
+1 mille milliards
de pages indéxées
24 PetaBytes / jour
Facebook
2,7 milliards
de “J’aime”
+500 TB / jour
Twitter
400 millions
de tweets
12 TB / jour
… mais pas seulement !
6
Transactions
D’ici 2020, les transactions
B2B et B2C sur le web
450 milliards / jour
NASA
Les données météo et
climatiques stockées
32 PetaBytes
Boeing
Un Boeing 737
génère en moyenne
240 TeraBytes / vol
Walmart
+1 million
de transactions
2,5 PetaBytes / heure
Les 4V
7
Volume
Variété
Véracité
Vélocité
Volumes plus importants de transactions issues d’Internet,
des machines...
Impact sur l’ensemble des technologies et déploiements
• Cloud, Business Intelligence, Data Warehouse
• Faire toujours plus, plus rapidement et à moindre coût
Ensembles de données volumineux, difficiles à gérer en
utilisant des bases de données relationnelles:
• Stockage/Coût
• Recherche/Performance
• Analyse et visualisation
Traitements parallèles sur des centaines de machines qui ne
peuvent pas être réalisés dans un délai raisonnable
• Outils traditionnels (ETL,...)
Les enjeux du Big Data
Transition vers des technologies innovantes
9
Données d’entreprise et données non structurées
Fewer
use cases
More
use cases
ModernTraditional
OLTP
OLAP
Data warehouses
Data marts
Point-to-point
Integration
EII
Architecture Big Data de Information Builders
10
Sqoop,Flume…
Avro,JSON…
Applications
traditionnelles
et data stores
iWay Big Data Integrator
Intégration native, innovante
et simplifiée à Hadoop
Big Data Apache Hadoop
Toute distribution,
tout type de données
BI &
Analytics Plateforme de BI & Analytique WebFOCUS
Self-service for Everyone
WebFOCUS access,
ETL, metadata
WebFOCUS access,
ETL, metadata
1. Data Hub/Data Lake.
2. Augmentation du Data Warehouse.
3. Archives de données/
Capacité de stockage supplémentaire.
4. Qualité des données.
5. Data Discovery.
6. Business Intelligence.
7. Optimisation.
8. Modèles prédictifs.
11
Interface
Simplifiée
Génération native
de script Hadoop
Gouvernance et
gestion des processus
Sqoop,Flume…
Avro,JSON…
Data Sources
Big Data
Native: Runs in Hadoop cluster
Purpose-built: Fully Exploits all Hadoop Services
Simple: Replaces coding with mapping
Simplified, easy-to-use interface
to integrate in Hadoop
Marshals Hadoop resources
and standards
Takes advantage of performance
and resource negotiation
Includes sophisticated process
management & governance
iWay Big Data Integrator
iWay Big Data Integrator
12
• Interface Utilisateur basée sur Eclipse.
• Ingestion des données utilisant l’abstraction au-dessus de Sqoop, Flume, Hive, Spark,
et tout contenu de canal de streaming propriétaire.
• Transformation & Mapping – MapReduce et Spark.
• Nettoyage, mise en correspondance et fusion.
• Publication aux sources de données non-Hadoop.
• Scripts auto-générés/Tâches et code compilés pour soumission de tâches.
• Déploiement d’intégration, tests, création Spark de bout-en-bout.
• Adapté à Kerberos.
• Sécurité basée sur la gestion des rôles via l’intégration de Apache Sentry.
Agenda
02 03
Intégrez les Big Data Gérez la qualité
des données
Information Builders
01
L’impact de la qualité des données sur votre business
14
Faits et chiffres
• La mauvaise qualité des données coûte aux entreprises au moins 10% de leur chiffre d'affaires;
20% est probablement une meilleure estimation. DM Review
• Pour les assurances, le coût (des mauvaises données) est estimé entre 15 et 20% de leur
revenu d'exploitation. Insurance Data Management Association
• Gartner estime que plus de 25% des données critiques au sein des grandes entreprises sont
inexactes ou incomplètes. InformationWeek
• 50% des projets de Data Warehouse échoueront pour ne pas avoir traité de façon proactive les
problèmes de qualité des données. Thomas Redman – Data-Driven
Avec le Big Data, le problème ne va pas disparaître mais s’amplifier ...
Qu’est ce que la qualité des données?
15
Des données exactes, complètes, cohérentes, uniques, à jour, valides...
Sur cette base, une stratégie de qualité des données doit être définie et appliquée!
Exacte
Complète
Cohérente
Unique
A jour
Valide
Solution iWay Data Quality Edition
Une solution conçue pour optimiser
l’intégrité de l’information au sein
de l’entreprise ou d’un département.
Mise à disposition de règles
de gestion entièrement
personnalisées et d’un portfolio
de dictionnaires de données.
ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
Règles de validation
Analyses statistiques
Minimum
Maximum
Moyenne
Nombre d’occurrences
Rapport et recommandations:
Rapport statistique
détaillé sur la qualité de vos données
Actions nécessaires à mettre en place.
Etape 1: Profilage de la qualité des données
Parsing des données
Validation des règles métier.
Fonctions de Scoring et d’explication
des traitements natifs.
Traitements en temps réel et en différé.
Dictionnaires intégrés.
ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
Etape 2: Nettoyage des données
Etape 3: Enrichissement des données
Utilisation de librairies prêtes a l’emploi
Utilisation de librairies personnalisées
Utilisation de référentiels (Look up)
Référentiel de société
Nom standard de la société
Numéro SIREN
Adresse officielle
Compte bancaire
Classification
Loqate
Référentiel et validation d’adresse
Ajout d’informations manquantes:
Rue
Code Postal
Ville
Validation d’adresses existantes
Ajout de noms, prénoms, titres…
ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
Etape 4: Réconciliation et Fusion des données
Objectif
Identifier des groupes
d’enregistrements de nature
identique provenant de
différentes sources
pour homogénéiser les données.
Remarque
Exercice assez complexe.
Gestion des données manquantes,
erronées, en conflit.
Solution
Le Matching est un algorithme
en deux étapes:
Groupes Candidats
Tous les enregistrements sont assemblés
en groupes selon des règles au sens large.
Groupes Clients
Consiste à diviser les groupes candidats
en utilisant des règles à granularité
plus fine.
ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
Réconciliation
Etape 4: Réconciliation et Fusion des données
Fusion
Utilisation des règles métier pour déterminer
le meilleur champ ou enregistrement.
Exemples
Enregistrement provenant d’un système de référence.
Enregistrement le plus récent.
Enregistrement de meilleure qualité (Scoring).
Utilisation de fonctions d’agrégation.
SQL-like: count, sum, minimum, maximum, average.
L’objectif… Créer le Golden Record!
ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
Etape 5: Suivi et contrôle de la qualité de l’information
ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
La qualité des données dans le contexte Big Data
Data Preparation
Unstructured
Semi-
Structured
Structured
External
23
Data Lake
Raw Data
Data Ponds
BI Apps
Raw Data Actionable Data World Class Analytics
Data Marts
Operational
System
Operational
System
Data Marts
Profile,
cleanse,
master, etc.
Profile,
cleanse,
master, etc.
Ingest
without
coding
Ingest
without
coding
Create
w/relevant
data
Create
w/relevant
data
Data Swamp
Architecture Technique
Data in Motion
Data at Rest
Flume
Other Process
Sqoop
Agent 2
Agent 1
Agent 3
Producers Data
Preparation
Data
Quality
HDFS
Hive
RDBMS
Data
Kafka
Topics
0 1 2
0 1 2
0 1 2
Job 1
Job 2
Job 3
Streaming
Content, IoT,
Application Data
Spark Processing
Data
Storing
Agenda
02 03
Intégrez les Big Data Gérez la qualité
des données
Information Builders
01
Information Builders, en quelques chiffres
41
ans d’innovation
60
bureaux
1 400
collaborateurs
30 000
clients
Aider nos clients à développer leur activité,
grâce à la puissance de l’information !
Gerry Cohen, Président Fondateur, Information Builders Inc.
Aider nos clients à développer leur activité,
grâce à la puissance de l’information !
Gerry Cohen, Président Fondateur, Information Builders Inc.
Plateforme 3i complète et modulaire
Portal Embedded InfoApps™
ApplicationsLegacy Systems Relational/Cubes Big Data Columnar/In Memory Unstructured Social Media Web Services Trading Partners
Intégration
Mobile Write-Back
Data Discovery Reporting Dashboards
High-Performance
Data Store
Data
Quality
Data
Governance
Master Data
Management
Batch
ETL
Real-Time
ESB
Intégrité
Intelligence
Location
Analytics
In-Document
Analytics
Casting
and Archiving
SearchPredictive
Analytics
Sentiment and
Word Analytics
Performance
Management
SSSSocialocialocialocial
HotHotHotHot
BBBBadadadad
FFFFeedbackeedbackeedbackeedback
Big Data
Integrator
Une expertise reconnue
En conclusion
Une intégration des Big Data:
Rapide, facile, sécurisée.
Capitalisant sur les technologies Hadoop.
Certifiée par les acteurs majeurs Big Data.
Gestion de la qualité des données de bout-en-bout:
Analyse et profilage des données.
Validation, enrichissement et fusion.
Monitoring.
Architecture et processus intégrés à la plateforme Hadoop.
29
Questions / Réponses
30
Merci pour votre attention
Fateh Naili
Enterprise Solutions Manager, Information Builders
Tél : +33 (0)1 49 00 66 11 | fateh_naili@ibi.com

More Related Content

What's hot

Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Jean-Michel Franco
 
Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014Micropole Group
 
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...Jean-Michel Franco
 
Atelier Informatica MDM Forum micropole 2014
Atelier Informatica MDM Forum micropole 2014Atelier Informatica MDM Forum micropole 2014
Atelier Informatica MDM Forum micropole 2014Micropole Group
 
Être à jour en logiciels de gestion stratégique
Être à jour en logiciels de gestion stratégiqueÊtre à jour en logiciels de gestion stratégique
Être à jour en logiciels de gestion stratégiqueDynacomTechnologies
 
Maximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data VirtualizationMaximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data VirtualizationDenodo
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Jean-Michel Franco
 
Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Jean-Michel Franco
 
Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurJean-Michel Franco
 
Etablir une collaboration durable entre les équipes informatiques et les méti...
Etablir une collaboration durable entre les équipes informatiques et les méti...Etablir une collaboration durable entre les équipes informatiques et les méti...
Etablir une collaboration durable entre les équipes informatiques et les méti...Jean-Michel Franco
 
Présentation de Talend Winter 2017
Présentation de Talend Winter 2017 Présentation de Talend Winter 2017
Présentation de Talend Winter 2017 Jean-Michel Franco
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationDenodo
 
Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Micropole Group
 
Bi et partage des données financières en libre -service
Bi et partage des données financières en libre -serviceBi et partage des données financières en libre -service
Bi et partage des données financières en libre -serviceJean-Michel Franco
 
Dévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendDévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendJean-Michel Franco
 
Talend Summer 16 (version française) : la Préparation des Données à la Portée...
Talend Summer 16 (version française) : la Préparation des Données à la Portée...Talend Summer 16 (version française) : la Préparation des Données à la Portée...
Talend Summer 16 (version française) : la Préparation des Données à la Portée...Jean-Michel Franco
 
Créer la vue 360° des employés
Créer la vue 360° des employés Créer la vue 360° des employés
Créer la vue 360° des employés Jean-Michel Franco
 
Micropole Data Forum 2017 - Atelier Informatica
Micropole Data Forum 2017 - Atelier InformaticaMicropole Data Forum 2017 - Atelier Informatica
Micropole Data Forum 2017 - Atelier InformaticaMicropole Group
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSJean-Michel Franco
 

What's hot (20)

Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
 
Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014Présentation Micropole 3eme Forum MDM - 19 novembre 2014
Présentation Micropole 3eme Forum MDM - 19 novembre 2014
 
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
Piloter l'entreprise par ses données (présentation Talend pour la matinale ED...
 
Atelier Informatica MDM Forum micropole 2014
Atelier Informatica MDM Forum micropole 2014Atelier Informatica MDM Forum micropole 2014
Atelier Informatica MDM Forum micropole 2014
 
Être à jour en logiciels de gestion stratégique
Être à jour en logiciels de gestion stratégiqueÊtre à jour en logiciels de gestion stratégique
Être à jour en logiciels de gestion stratégique
 
Maximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data VirtualizationMaximisez les bénéfices de votre BI self-service avec la Data Virtualization
Maximisez les bénéfices de votre BI self-service avec la Data Virtualization
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
Réussir le projet MDM depuis son business case jusqu'à son exploitation au q...
 
Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?Master Data Management : quels outils ? quelles bonnes pratiques ?
Master Data Management : quels outils ? quelles bonnes pratiques ?
 
Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeur
 
Etablir une collaboration durable entre les équipes informatiques et les méti...
Etablir une collaboration durable entre les équipes informatiques et les méti...Etablir une collaboration durable entre les équipes informatiques et les méti...
Etablir une collaboration durable entre les équipes informatiques et les méti...
 
Présentation de Talend Winter 2017
Présentation de Talend Winter 2017 Présentation de Talend Winter 2017
Présentation de Talend Winter 2017
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
 
Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017Matinée Découverte Big Data & Data Science - 24012017
Matinée Découverte Big Data & Data Science - 24012017
 
Bi et partage des données financières en libre -service
Bi et partage des données financières en libre -serviceBi et partage des données financières en libre -service
Bi et partage des données financières en libre -service
 
Dévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendDévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec Talend
 
Talend Summer 16 (version française) : la Préparation des Données à la Portée...
Talend Summer 16 (version française) : la Préparation des Données à la Portée...Talend Summer 16 (version française) : la Préparation des Données à la Portée...
Talend Summer 16 (version française) : la Préparation des Données à la Portée...
 
Créer la vue 360° des employés
Créer la vue 360° des employés Créer la vue 360° des employés
Créer la vue 360° des employés
 
Micropole Data Forum 2017 - Atelier Informatica
Micropole Data Forum 2017 - Atelier InformaticaMicropole Data Forum 2017 - Atelier Informatica
Micropole Data Forum 2017 - Atelier Informatica
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWS
 

Viewers also liked

Public, private and hybrid blockchains: what makes sense where
Public, private and hybrid blockchains: what makes sense wherePublic, private and hybrid blockchains: what makes sense where
Public, private and hybrid blockchains: what makes sense whereEY
 
Lean Startup Day - Atelier - Ce que veulent vraiment vos clients - Les probl...
Lean Startup Day  - Atelier - Ce que veulent vraiment vos clients - Les probl...Lean Startup Day  - Atelier - Ce que veulent vraiment vos clients - Les probl...
Lean Startup Day - Atelier - Ce que veulent vraiment vos clients - Les probl...Pragmatic Giraffe
 
Synthese des propositions et actions du medef
Synthese des propositions et actions du medefSynthese des propositions et actions du medef
Synthese des propositions et actions du medefAdm Medef
 
My personal VC manifesto
My personal VC manifestoMy personal VC manifesto
My personal VC manifestoBoris Golden
 
Online-Lebensmittelhandel nimmt Fahrt auf
Online-Lebensmittelhandel nimmt Fahrt aufOnline-Lebensmittelhandel nimmt Fahrt auf
Online-Lebensmittelhandel nimmt Fahrt aufEY
 
Pourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOL
Pourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOLPourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOL
Pourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOLEstelle Burget
 
Health 4.0 wird unsere Welt verändern, die Art, wie wir denken und leben
Health 4.0 wird unsere Welt verändern, die Art, wie wir denken und lebenHealth 4.0 wird unsere Welt verändern, die Art, wie wir denken und leben
Health 4.0 wird unsere Welt verändern, die Art, wie wir denken und lebenEY
 
Trendbarometer Immobilien-Investmentmarkt 2017
Trendbarometer Immobilien-Investmentmarkt 2017Trendbarometer Immobilien-Investmentmarkt 2017
Trendbarometer Immobilien-Investmentmarkt 2017EY
 
Raising external capital to drive NOC transformation
Raising external capital to drive NOC transformationRaising external capital to drive NOC transformation
Raising external capital to drive NOC transformationEY
 
How to properly fail your startup (in 10 steps)
How to properly fail your startup (in 10 steps)How to properly fail your startup (in 10 steps)
How to properly fail your startup (in 10 steps)Boris Golden
 
16th Global Capital Confidence Barometer
16th Global Capital Confidence Barometer16th Global Capital Confidence Barometer
16th Global Capital Confidence BarometerEY
 
EY Jobstudie 2017
EY Jobstudie 2017EY Jobstudie 2017
EY Jobstudie 2017EY
 
CONTENTSERV - PIM le noyau central d'un ecosysteme digital - Data forum MIC...
CONTENTSERV -  PIM le noyau central d'un ecosysteme digital -  Data forum MIC...CONTENTSERV -  PIM le noyau central d'un ecosysteme digital -  Data forum MIC...
CONTENTSERV - PIM le noyau central d'un ecosysteme digital - Data forum MIC...Micropole Group
 
Vous avez une vision ? Nous vous offrons la une !
Vous avez une vision ? Nous vous offrons la une !Vous avez une vision ? Nous vous offrons la une !
Vous avez une vision ? Nous vous offrons la une !EY
 
DigiData Novembre 2016
DigiData Novembre 2016DigiData Novembre 2016
DigiData Novembre 2016Digitools.io
 
Comment s'articule l'écosystème de l'innovation en France ?
Comment s'articule l'écosystème de l'innovation en France ?Comment s'articule l'écosystème de l'innovation en France ?
Comment s'articule l'écosystème de l'innovation en France ?Justine Fradin
 
DigiData Octobre 2016
DigiData Octobre 2016DigiData Octobre 2016
DigiData Octobre 2016Digitools.io
 
RSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PME
RSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PMERSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PME
RSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PMEAdm Medef
 
Weltmärkte bereiten dem Maschinenbau Sorgen
Weltmärkte bereiten dem Maschinenbau SorgenWeltmärkte bereiten dem Maschinenbau Sorgen
Weltmärkte bereiten dem Maschinenbau SorgenEY
 

Viewers also liked (20)

Public, private and hybrid blockchains: what makes sense where
Public, private and hybrid blockchains: what makes sense wherePublic, private and hybrid blockchains: what makes sense where
Public, private and hybrid blockchains: what makes sense where
 
Lean Startup Day - Atelier - Ce que veulent vraiment vos clients - Les probl...
Lean Startup Day  - Atelier - Ce que veulent vraiment vos clients - Les probl...Lean Startup Day  - Atelier - Ce que veulent vraiment vos clients - Les probl...
Lean Startup Day - Atelier - Ce que veulent vraiment vos clients - Les probl...
 
Comment bien gérer ses RP ?
Comment bien gérer ses RP ?Comment bien gérer ses RP ?
Comment bien gérer ses RP ?
 
Synthese des propositions et actions du medef
Synthese des propositions et actions du medefSynthese des propositions et actions du medef
Synthese des propositions et actions du medef
 
My personal VC manifesto
My personal VC manifestoMy personal VC manifesto
My personal VC manifesto
 
Online-Lebensmittelhandel nimmt Fahrt auf
Online-Lebensmittelhandel nimmt Fahrt aufOnline-Lebensmittelhandel nimmt Fahrt auf
Online-Lebensmittelhandel nimmt Fahrt auf
 
Pourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOL
Pourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOLPourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOL
Pourquoi être customer-centric c’est être Data-Driven ! JNE 2017 - AOL
 
Health 4.0 wird unsere Welt verändern, die Art, wie wir denken und leben
Health 4.0 wird unsere Welt verändern, die Art, wie wir denken und lebenHealth 4.0 wird unsere Welt verändern, die Art, wie wir denken und leben
Health 4.0 wird unsere Welt verändern, die Art, wie wir denken und leben
 
Trendbarometer Immobilien-Investmentmarkt 2017
Trendbarometer Immobilien-Investmentmarkt 2017Trendbarometer Immobilien-Investmentmarkt 2017
Trendbarometer Immobilien-Investmentmarkt 2017
 
Raising external capital to drive NOC transformation
Raising external capital to drive NOC transformationRaising external capital to drive NOC transformation
Raising external capital to drive NOC transformation
 
How to properly fail your startup (in 10 steps)
How to properly fail your startup (in 10 steps)How to properly fail your startup (in 10 steps)
How to properly fail your startup (in 10 steps)
 
16th Global Capital Confidence Barometer
16th Global Capital Confidence Barometer16th Global Capital Confidence Barometer
16th Global Capital Confidence Barometer
 
EY Jobstudie 2017
EY Jobstudie 2017EY Jobstudie 2017
EY Jobstudie 2017
 
CONTENTSERV - PIM le noyau central d'un ecosysteme digital - Data forum MIC...
CONTENTSERV -  PIM le noyau central d'un ecosysteme digital -  Data forum MIC...CONTENTSERV -  PIM le noyau central d'un ecosysteme digital -  Data forum MIC...
CONTENTSERV - PIM le noyau central d'un ecosysteme digital - Data forum MIC...
 
Vous avez une vision ? Nous vous offrons la une !
Vous avez une vision ? Nous vous offrons la une !Vous avez une vision ? Nous vous offrons la une !
Vous avez une vision ? Nous vous offrons la une !
 
DigiData Novembre 2016
DigiData Novembre 2016DigiData Novembre 2016
DigiData Novembre 2016
 
Comment s'articule l'écosystème de l'innovation en France ?
Comment s'articule l'écosystème de l'innovation en France ?Comment s'articule l'écosystème de l'innovation en France ?
Comment s'articule l'écosystème de l'innovation en France ?
 
DigiData Octobre 2016
DigiData Octobre 2016DigiData Octobre 2016
DigiData Octobre 2016
 
RSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PME
RSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PMERSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PME
RSE : le Medef et EcoVadis publient un guide pratique pour accompagner les PME
 
Weltmärkte bereiten dem Maschinenbau Sorgen
Weltmärkte bereiten dem Maschinenbau SorgenWeltmärkte bereiten dem Maschinenbau Sorgen
Weltmärkte bereiten dem Maschinenbau Sorgen
 

Similar to INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data forum MICROPOLE 2016

Track 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelTrack 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelAmazon Web Services
 
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Excelerate Systems
 
IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...Nicolas Desachy
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneCedric CARBONE
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jNeo4j
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Denodo
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
IBM Software & Information Management - Décembre 2010
IBM Software & Information Management - Décembre 2010IBM Software & Information Management - Décembre 2010
IBM Software & Information Management - Décembre 2010Nicolas Desachy
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesConverteo
 
Neo4j et ses cas d'usages
Neo4j et ses cas d'usagesNeo4j et ses cas d'usages
Neo4j et ses cas d'usagesNeo4j
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Jean-Michel Franco
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Denodo
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Wiiisdom
 
Gestion des données d'entreprise à l'ère de MongoDB et du Data Lake
Gestion des données d'entreprise à l'ère de MongoDB et du Data LakeGestion des données d'entreprise à l'ère de MongoDB et du Data Lake
Gestion des données d'entreprise à l'ère de MongoDB et du Data LakeMongoDB
 
Business Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingBusiness Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingSamia NACIRI
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jNeo4j
 

Similar to INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data forum MICROPOLE 2016 (20)

Track 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec IntelTrack 2 - Atelier 1 - Big data analytics présenté avec Intel
Track 2 - Atelier 1 - Big data analytics présenté avec Intel
 
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
Enterprise Data Hub - La Clé de la Transformation de la Gestion de Données d'...
 
IBM Data lake
IBM Data lakeIBM Data lake
IBM Data lake
 
IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...IBM Information Management - Pas de décision de qualité sans informations de ...
IBM Information Management - Pas de décision de qualité sans informations de ...
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric CarboneTalend, Leading Open Source DataIntegration plateform. Cedric Carbone
Talend, Leading Open Source DataIntegration plateform. Cedric Carbone
 
GraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4jGraphTour Paris - Cas d'usages populaires Neo4j
GraphTour Paris - Cas d'usages populaires Neo4j
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
IBM Software & Information Management - Décembre 2010
IBM Software & Information Management - Décembre 2010IBM Software & Information Management - Décembre 2010
IBM Software & Information Management - Décembre 2010
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
Neo4j et ses cas d'usages
Neo4j et ses cas d'usagesNeo4j et ses cas d'usages
Neo4j et ses cas d'usages
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...Découvrez le parcours de vos données : lignage de données de bout en bout ...
Découvrez le parcours de vos données : lignage de données de bout en bout ...
 
Gestion des données d'entreprise à l'ère de MongoDB et du Data Lake
Gestion des données d'entreprise à l'ère de MongoDB et du Data LakeGestion des données d'entreprise à l'ère de MongoDB et du Data Lake
Gestion des données d'entreprise à l'ère de MongoDB et du Data Lake
 
Business Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarkingBusiness Intelligence : Offres du marché et benchmarking
Business Intelligence : Offres du marché et benchmarking
 
Les cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4jLes cas d’usages populaires de Neo4j
Les cas d’usages populaires de Neo4j
 

More from Micropole Group

Micropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney BowesMicropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney BowesMicropole Group
 
Micropole Data Forum 2017 - Atelier Oracle
Micropole Data Forum 2017 - Atelier OracleMicropole Data Forum 2017 - Atelier Oracle
Micropole Data Forum 2017 - Atelier OracleMicropole Group
 
DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018
DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018
DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018Micropole Group
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCGMicropole Group
 
ORCHESTRA - Gouvernance des donnees et MDM - Data forum MICROPOLE 2016
ORCHESTRA -  Gouvernance des donnees et MDM -  Data forum MICROPOLE 2016 ORCHESTRA -  Gouvernance des donnees et MDM -  Data forum MICROPOLE 2016
ORCHESTRA - Gouvernance des donnees et MDM - Data forum MICROPOLE 2016 Micropole Group
 
HARLAY Avocats big ou smart, les nouveaux enjeux juridiques de la gouvernan...
HARLAY Avocats   big ou smart, les nouveaux enjeux juridiques de la gouvernan...HARLAY Avocats   big ou smart, les nouveaux enjeux juridiques de la gouvernan...
HARLAY Avocats big ou smart, les nouveaux enjeux juridiques de la gouvernan...Micropole Group
 
Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016
Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016
Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016Micropole Group
 
Presentation Matinée Gouvernance des donnees
Presentation Matinée Gouvernance des donneesPresentation Matinée Gouvernance des donnees
Presentation Matinée Gouvernance des donneesMicropole Group
 
Wide Coffee La Connaissance Client en mode digital
Wide Coffee La Connaissance Client en mode digitalWide Coffee La Connaissance Client en mode digital
Wide Coffee La Connaissance Client en mode digitalMicropole Group
 
Présentation Evénement Datavisualisation
Présentation Evénement DatavisualisationPrésentation Evénement Datavisualisation
Présentation Evénement DatavisualisationMicropole Group
 
DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015Micropole Group
 
DATA FORUM MICROPOLE 2015 - Atelier Semarchy
 DATA FORUM MICROPOLE 2015 - Atelier Semarchy DATA FORUM MICROPOLE 2015 - Atelier Semarchy
DATA FORUM MICROPOLE 2015 - Atelier SemarchyMicropole Group
 
DATA FORUM MICROPOLE 2015 - Atelier Talend
 DATA FORUM MICROPOLE 2015 - Atelier Talend DATA FORUM MICROPOLE 2015 - Atelier Talend
DATA FORUM MICROPOLE 2015 - Atelier TalendMicropole Group
 
DATA FORUM MICROPOLE 2015 - Information Builders
 DATA FORUM MICROPOLE 2015 -  Information Builders DATA FORUM MICROPOLE 2015 -  Information Builders
DATA FORUM MICROPOLE 2015 - Information BuildersMicropole Group
 
DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance Valuation
 DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance Valuation DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance Valuation
DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance ValuationMicropole Group
 
DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
 DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
DATA FORUM MICROPOLE 2015 - Atelier Stibo SystemsMicropole Group
 
Votre application métier en 3 mois !
Votre application métier en 3 mois !Votre application métier en 3 mois !
Votre application métier en 3 mois !Micropole Group
 

More from Micropole Group (19)

API Management
API ManagementAPI Management
API Management
 
Micropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney BowesMicropole Data Forum 2017 - Atelier Pitney Bowes
Micropole Data Forum 2017 - Atelier Pitney Bowes
 
Micropole Data Forum 2017 - Atelier Oracle
Micropole Data Forum 2017 - Atelier OracleMicropole Data Forum 2017 - Atelier Oracle
Micropole Data Forum 2017 - Atelier Oracle
 
DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018
DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018
DATA FORUM 2017 - Présentation Micropole - Les tendances Data 2018
 
Matinée Micropole GDPR
Matinée Micropole GDPRMatinée Micropole GDPR
Matinée Micropole GDPR
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCG
 
ORCHESTRA - Gouvernance des donnees et MDM - Data forum MICROPOLE 2016
ORCHESTRA -  Gouvernance des donnees et MDM -  Data forum MICROPOLE 2016 ORCHESTRA -  Gouvernance des donnees et MDM -  Data forum MICROPOLE 2016
ORCHESTRA - Gouvernance des donnees et MDM - Data forum MICROPOLE 2016
 
HARLAY Avocats big ou smart, les nouveaux enjeux juridiques de la gouvernan...
HARLAY Avocats   big ou smart, les nouveaux enjeux juridiques de la gouvernan...HARLAY Avocats   big ou smart, les nouveaux enjeux juridiques de la gouvernan...
HARLAY Avocats big ou smart, les nouveaux enjeux juridiques de la gouvernan...
 
Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016
Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016
Matinée Micropole DE LA BI A LA DATA INTELLIGENCE 18-10-2016
 
Presentation Matinée Gouvernance des donnees
Presentation Matinée Gouvernance des donneesPresentation Matinée Gouvernance des donnees
Presentation Matinée Gouvernance des donnees
 
Wide Coffee La Connaissance Client en mode digital
Wide Coffee La Connaissance Client en mode digitalWide Coffee La Connaissance Client en mode digital
Wide Coffee La Connaissance Client en mode digital
 
Présentation Evénement Datavisualisation
Présentation Evénement DatavisualisationPrésentation Evénement Datavisualisation
Présentation Evénement Datavisualisation
 
DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015DATA FORUM MICROPOLE - 2015
DATA FORUM MICROPOLE - 2015
 
DATA FORUM MICROPOLE 2015 - Atelier Semarchy
 DATA FORUM MICROPOLE 2015 - Atelier Semarchy DATA FORUM MICROPOLE 2015 - Atelier Semarchy
DATA FORUM MICROPOLE 2015 - Atelier Semarchy
 
DATA FORUM MICROPOLE 2015 - Atelier Talend
 DATA FORUM MICROPOLE 2015 - Atelier Talend DATA FORUM MICROPOLE 2015 - Atelier Talend
DATA FORUM MICROPOLE 2015 - Atelier Talend
 
DATA FORUM MICROPOLE 2015 - Information Builders
 DATA FORUM MICROPOLE 2015 -  Information Builders DATA FORUM MICROPOLE 2015 -  Information Builders
DATA FORUM MICROPOLE 2015 - Information Builders
 
DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance Valuation
 DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance Valuation DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance Valuation
DATA FORUM MICROPOLE 2015 - Forrester - Data Gouvernance Valuation
 
DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
 DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
DATA FORUM MICROPOLE 2015 - Atelier Stibo Systems
 
Votre application métier en 3 mois !
Votre application métier en 3 mois !Votre application métier en 3 mois !
Votre application métier en 3 mois !
 

INFORMATION BUILDERS - Comment integrer les big data a votre SI - Data forum MICROPOLE 2016

  • 1. Comment intégrer les Big Data à votre Système d’Information et gérer leur qualité ? Jeudi 1er décembre 2016 Fateh Naili Enterprise Solutions Manager, Information Builders
  • 2. Agenda 02 03 Intégrez les Big Data Gérez la qualité des données Information Builders 01
  • 3. Agenda 02 03 Intégrez les Big Data Gérez la qualité des données Information Builders 01
  • 4. 90%Of all the data in the world has been generated over the last 2 years Data Output is growing rapidly 2009 2010 2011 2012 2013 2014 2015 A quelle vitesse vos données augmentent ?
  • 5. Avec les réseaux sociaux… 5 Cisco Systems D’ici 2020, le traffic généré sur le web 667 ExaBytes / an Google +1 mille milliards de pages indéxées 24 PetaBytes / jour Facebook 2,7 milliards de “J’aime” +500 TB / jour Twitter 400 millions de tweets 12 TB / jour
  • 6. … mais pas seulement ! 6 Transactions D’ici 2020, les transactions B2B et B2C sur le web 450 milliards / jour NASA Les données météo et climatiques stockées 32 PetaBytes Boeing Un Boeing 737 génère en moyenne 240 TeraBytes / vol Walmart +1 million de transactions 2,5 PetaBytes / heure
  • 8. Volumes plus importants de transactions issues d’Internet, des machines... Impact sur l’ensemble des technologies et déploiements • Cloud, Business Intelligence, Data Warehouse • Faire toujours plus, plus rapidement et à moindre coût Ensembles de données volumineux, difficiles à gérer en utilisant des bases de données relationnelles: • Stockage/Coût • Recherche/Performance • Analyse et visualisation Traitements parallèles sur des centaines de machines qui ne peuvent pas être réalisés dans un délai raisonnable • Outils traditionnels (ETL,...) Les enjeux du Big Data
  • 9. Transition vers des technologies innovantes 9 Données d’entreprise et données non structurées Fewer use cases More use cases ModernTraditional OLTP OLAP Data warehouses Data marts Point-to-point Integration EII
  • 10. Architecture Big Data de Information Builders 10 Sqoop,Flume… Avro,JSON… Applications traditionnelles et data stores iWay Big Data Integrator Intégration native, innovante et simplifiée à Hadoop Big Data Apache Hadoop Toute distribution, tout type de données BI & Analytics Plateforme de BI & Analytique WebFOCUS Self-service for Everyone WebFOCUS access, ETL, metadata WebFOCUS access, ETL, metadata 1. Data Hub/Data Lake. 2. Augmentation du Data Warehouse. 3. Archives de données/ Capacité de stockage supplémentaire. 4. Qualité des données. 5. Data Discovery. 6. Business Intelligence. 7. Optimisation. 8. Modèles prédictifs.
  • 11. 11 Interface Simplifiée Génération native de script Hadoop Gouvernance et gestion des processus Sqoop,Flume… Avro,JSON… Data Sources Big Data Native: Runs in Hadoop cluster Purpose-built: Fully Exploits all Hadoop Services Simple: Replaces coding with mapping Simplified, easy-to-use interface to integrate in Hadoop Marshals Hadoop resources and standards Takes advantage of performance and resource negotiation Includes sophisticated process management & governance iWay Big Data Integrator
  • 12. iWay Big Data Integrator 12 • Interface Utilisateur basée sur Eclipse. • Ingestion des données utilisant l’abstraction au-dessus de Sqoop, Flume, Hive, Spark, et tout contenu de canal de streaming propriétaire. • Transformation & Mapping – MapReduce et Spark. • Nettoyage, mise en correspondance et fusion. • Publication aux sources de données non-Hadoop. • Scripts auto-générés/Tâches et code compilés pour soumission de tâches. • Déploiement d’intégration, tests, création Spark de bout-en-bout. • Adapté à Kerberos. • Sécurité basée sur la gestion des rôles via l’intégration de Apache Sentry.
  • 13. Agenda 02 03 Intégrez les Big Data Gérez la qualité des données Information Builders 01
  • 14. L’impact de la qualité des données sur votre business 14 Faits et chiffres • La mauvaise qualité des données coûte aux entreprises au moins 10% de leur chiffre d'affaires; 20% est probablement une meilleure estimation. DM Review • Pour les assurances, le coût (des mauvaises données) est estimé entre 15 et 20% de leur revenu d'exploitation. Insurance Data Management Association • Gartner estime que plus de 25% des données critiques au sein des grandes entreprises sont inexactes ou incomplètes. InformationWeek • 50% des projets de Data Warehouse échoueront pour ne pas avoir traité de façon proactive les problèmes de qualité des données. Thomas Redman – Data-Driven Avec le Big Data, le problème ne va pas disparaître mais s’amplifier ...
  • 15. Qu’est ce que la qualité des données? 15 Des données exactes, complètes, cohérentes, uniques, à jour, valides... Sur cette base, une stratégie de qualité des données doit être définie et appliquée! Exacte Complète Cohérente Unique A jour Valide
  • 16. Solution iWay Data Quality Edition Une solution conçue pour optimiser l’intégrité de l’information au sein de l’entreprise ou d’un département. Mise à disposition de règles de gestion entièrement personnalisées et d’un portfolio de dictionnaires de données. ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
  • 17. ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring Règles de validation Analyses statistiques Minimum Maximum Moyenne Nombre d’occurrences Rapport et recommandations: Rapport statistique détaillé sur la qualité de vos données Actions nécessaires à mettre en place. Etape 1: Profilage de la qualité des données
  • 18. Parsing des données Validation des règles métier. Fonctions de Scoring et d’explication des traitements natifs. Traitements en temps réel et en différé. Dictionnaires intégrés. ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring Etape 2: Nettoyage des données
  • 19. Etape 3: Enrichissement des données Utilisation de librairies prêtes a l’emploi Utilisation de librairies personnalisées Utilisation de référentiels (Look up) Référentiel de société Nom standard de la société Numéro SIREN Adresse officielle Compte bancaire Classification Loqate Référentiel et validation d’adresse Ajout d’informations manquantes: Rue Code Postal Ville Validation d’adresses existantes Ajout de noms, prénoms, titres… ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
  • 20. Etape 4: Réconciliation et Fusion des données Objectif Identifier des groupes d’enregistrements de nature identique provenant de différentes sources pour homogénéiser les données. Remarque Exercice assez complexe. Gestion des données manquantes, erronées, en conflit. Solution Le Matching est un algorithme en deux étapes: Groupes Candidats Tous les enregistrements sont assemblés en groupes selon des règles au sens large. Groupes Clients Consiste à diviser les groupes candidats en utilisant des règles à granularité plus fine. ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring Réconciliation
  • 21. Etape 4: Réconciliation et Fusion des données Fusion Utilisation des règles métier pour déterminer le meilleur champ ou enregistrement. Exemples Enregistrement provenant d’un système de référence. Enregistrement le plus récent. Enregistrement de meilleure qualité (Scoring). Utilisation de fonctions d’agrégation. SQL-like: count, sum, minimum, maximum, average. L’objectif… Créer le Golden Record! ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
  • 22. Etape 5: Suivi et contrôle de la qualité de l’information ProfilingProfiling CleansingCleansing EnrichmentEnrichment Match & MergeMatch & Merge MonitoringMonitoring
  • 23. La qualité des données dans le contexte Big Data Data Preparation Unstructured Semi- Structured Structured External 23 Data Lake Raw Data Data Ponds BI Apps Raw Data Actionable Data World Class Analytics Data Marts Operational System Operational System Data Marts Profile, cleanse, master, etc. Profile, cleanse, master, etc. Ingest without coding Ingest without coding Create w/relevant data Create w/relevant data Data Swamp
  • 24. Architecture Technique Data in Motion Data at Rest Flume Other Process Sqoop Agent 2 Agent 1 Agent 3 Producers Data Preparation Data Quality HDFS Hive RDBMS Data Kafka Topics 0 1 2 0 1 2 0 1 2 Job 1 Job 2 Job 3 Streaming Content, IoT, Application Data Spark Processing Data Storing
  • 25. Agenda 02 03 Intégrez les Big Data Gérez la qualité des données Information Builders 01
  • 26. Information Builders, en quelques chiffres 41 ans d’innovation 60 bureaux 1 400 collaborateurs 30 000 clients Aider nos clients à développer leur activité, grâce à la puissance de l’information ! Gerry Cohen, Président Fondateur, Information Builders Inc. Aider nos clients à développer leur activité, grâce à la puissance de l’information ! Gerry Cohen, Président Fondateur, Information Builders Inc.
  • 27. Plateforme 3i complète et modulaire Portal Embedded InfoApps™ ApplicationsLegacy Systems Relational/Cubes Big Data Columnar/In Memory Unstructured Social Media Web Services Trading Partners Intégration Mobile Write-Back Data Discovery Reporting Dashboards High-Performance Data Store Data Quality Data Governance Master Data Management Batch ETL Real-Time ESB Intégrité Intelligence Location Analytics In-Document Analytics Casting and Archiving SearchPredictive Analytics Sentiment and Word Analytics Performance Management SSSSocialocialocialocial HotHotHotHot BBBBadadadad FFFFeedbackeedbackeedbackeedback Big Data Integrator
  • 29. En conclusion Une intégration des Big Data: Rapide, facile, sécurisée. Capitalisant sur les technologies Hadoop. Certifiée par les acteurs majeurs Big Data. Gestion de la qualité des données de bout-en-bout: Analyse et profilage des données. Validation, enrichissement et fusion. Monitoring. Architecture et processus intégrés à la plateforme Hadoop. 29
  • 31. Merci pour votre attention Fateh Naili Enterprise Solutions Manager, Information Builders Tél : +33 (0)1 49 00 66 11 | fateh_naili@ibi.com