SlideShare a Scribd company logo
1 of 83
Download to read offline
Cartographie du big data
29 septembre 2015
Arnaud Cogoluègnes
Data Science
Hadoop
MapReduce
HDFS
Spark
Machine Learning
Hive
Pig
Architecture
lambda
Cascading
Flink
Tez
Big Data
Fondamentaux du Big Data
Retour vers le futur : SGBDR
Les garanties ACID
Standard, portable
SQL-86 ... SQL:2011
select * from Book
Un point d’intégration
Image : http://www.eaipatterns.com/SharedDataBaseIntegration.html
Une fausse bonne idée ?
Image : http://www.eaipatterns.com/SharedDataBaseIntegration.html
?
Casser le monolithe
Services
Application A Application B Application C
Le web, comment scaler ?
IoT
Data
Corrélation
Prédiction
Adaptabilité
Stockage
Plus de données
Temps réel
Exploitation
Réactivité
Extraction
Technologies Big Data
http://crimsonrain.org/hawaii/index.php?title=File:Google-datacenter_2.jpg
Hadoop, un système distribué
Système de fichiers distribué : HDFS
API de programmation : MapReduce, YARN
Hadoop
HDFS
MapReduce, YARN
Votre application
HDFS
HDFS
MapReduce, YARN
Votre application
Tolérant aux pannes
Scalable
Formats de fichiers
Compression
Blocs, datanodes, namenode
file.csv B1 B2 B3 fichier composé de 3 blocs (taille par défaut d’un bloc : 128 Mo)
B1 B2 B1 B3
B1 B2 B2 B3
DN 1 DN 2
DN 4DN 3
les datanodes stockent les blocs
(le bloc 3 est ici sous-répliqué)
B1 : 1, 2, 3 B2 : 1, 3, 4
B3 : 2, 4
Namenode
le namenode gère les méta-données et s’assure de la réplication
HDFS, les limitations
Fichiers “append-only”
Bien pour “write once, read many times”
Peu de gros fichiers, bien
Plein de petits fichiers, pas bien
MapReduce
HDFS
MapReduce
Votre application
Simple
Batch
Scalable
Jointure, distinct, group by
MapReduce
file.csv B1 B2 B3
Mapper
Mapper
Mapper
B1
B2
B3
Reducer
Reducer
k1,v1
k1,v2
k1 [v1,v2]
Le code va à la donnée
file.csv B1 B2 B3
Mapper
Mapper
Mapper
B1
B2
B3
Reducer
Reducer
k1,v1
k1,v2
k1 [v1,v2]
B1 B2 B1 B3
B1 B2 B2 B3
DN 1 DN 2
DN 4DN 3
DN 1
DN 3
DN 4
Hadoop 1
HDFS
MapReduce
Hadoop 2
HDFS
YARN
MapReduce
Votre
application
MapReduce, les limitations
Code bas niveau
Ré-utilisation difficile
Préférer les abstractions comme Cascading
Peu flexible et limité
Les successeurs de MapReduce
Flink
Spark
Tez
Plus flexibles
Plus “simples”
Comment stocker ?
Formats de fichiers
Compression
Parquet
SequenceFile
Texte
Avro
Pas de compression
Snappy
Deflate
GZIP
ORC
La panoplie
YARN/MapReduce/Tez
API-based
(Spark, Cascading, Flink)
Hive
SQL
Pig
Script ETL
Votre application
Spark
Spark
Votre application
YARN Mesos Cluster natif
Tez
Apache Tez
MapReduce nouvelle génération
Cascading
API Java
Hive
SQL
Pig
Script ETL
Votre application
YARN
Cascading
Cascading
Votre application
MapReduce Tez Flink Hazelcast
Production-ready En cours
Big Data in Action
Architecture lambda : objectifs
● Tolérant aux pannes
● Latence faible
● Scalable
● Générique
● Extensible
● Requêtes “ad hoc”
● Maintenance minimale
● Debuggable
Layers
Speed layer
Serving layer
Batch layer
Batch layer
Speed layer
Serving layer
Batch layer
Stockage des données.
Création des vues.
Serving layer
Speed layer
Serving layer
Batch layer
Accès aux vues batch.
Speed layer
Speed layer
Serving layer
Batch layer
Accès temps réel.
Architecture lambda
Flux de
données
Broker
Traitement
temps réel
Données
(append-only)
Traitement
batch
Vues batch
Vues temps
réel
Application
Batch
Serving
Speed
Batch layer
Speed layer
Serving layer
Batch layer
Hadoop (MapReduce, HDFS).
Thrift, Cascalog.
Serving layer
Speed layer
Serving layer
Batch layer
ElephantDB, BerkeleyDB.
Speed layer
Speed layer
Serving layer
Batch layer
Cassandra, Storm, Kafka.
Architecture lambda complète
Flux de
données
Broker
Traitement
temps réel
Données
(append-only)
Traitement
batch
Vues batch
Vues temps
réel
Application
Batch
Serving
Speed
Application ETL - reporting
Flux de
données
Données
(append-only)
Traitement
batch
Vues batch
Application
Batch
Serving
Application temps réel
Flux de
données
Broker
Traitement
temps réel
Vues temps
réel
Application
Speed
Jointure flux et référentiel
Hadoop
Traitement
(jointures, transformation)
Flux
Reporting,
exploration
Données de référence
Gestion de données
Données brutes
Données
parsées
Traitement et
insertion
Archives Vues Transformations
Avro, GZIP
Rétention permanente
Parquet, Snappy
Rétention 2 ans glissants
Traitement (Cascading)
HDFS BD temps réel
Hive, Pig, API-based
UDF : User Defined Function
Hive
+
SQL (non-standard)
Prise en main rapide
Extensible avec UDF
-
Testabilité médiocre
Réutilisabilité médiocre
Pas de contrôle du flot
Logique disséminée
Programmation par UDF
Pig
+
Pig Latin
Prise en main rapide
Extensible avec UDF
-
Testabilité médiocre
Réutilisabilité médiocre
Logique disséminée
Programmation par UDF
API-based
(Spark, Cascading, Flink)
+
API Java
Testable unitairement
Contrôle du flot
Bonne réutilisabilité
-
Programmation nécessaire
Les outils SQL (Hive, Spark SQL)
A utiliser une fois les données traitées
Bien pour l’exploration
Ou pour les traitements très simples
Connecteurs JDBC (pour le reporting)
Outils intermédiaires (Pig)
Peut contenir de la logique
Pig Latin simple d’accès
Adapté à des traitements “one-shot”...
(ex. : rapports)
API-based (Spark, Cascading, Flink)
Pour les traitements plus complexes
Parsing, jointure, nettoyage, dé-duplication, etc
En amont de l’exploration, du reporting
Temps réel
Temps réel
“Stream processing”
Flux d’événements
Traitements parallélisés
Ecriture dans une BD
Latence ~ 1 seconde
Temps réel - approche “classique”
Queues et consommateurs (“workers”)
Coordination des workers
Failover à implémenter
Consommateur
Consommateur
Consommateur
Consommateur
Topologie Storm
spout
spout
bolt
bolt
bolt
bolt
bolt
Source de données
(ex. : Kafka)
Traitement
(ex. : filtre, aggrégation,
count, etc)
Topologie
Source : https://storm.incubator.apache.org/
Parallèle et tolérant à la panne
Temps réel - outils et considérations
Samza
Delivery semantics
One-at-a-time
Storm
Spark Streaming
Flink
Micro batch
Déploiement
Langages supportés
Maturité
Monitoring
Datacenter abstrait
Abstrait, mon datacenter?
Additionner les serveurs/VM
Avoir un ensemble de ressources (CPU, RAM)
Demander de la ressource pour une application
Le système se charge de la distribution
Les solutions techniques
YARN
Mesos
Kubernetes
Optimisation des ressources
Grande maturité de déploiement nécessaire
Mesos
Projet open source, fondation Apache
Mature
Utilisateurs : Twitter, Apple, Viadeo, Airbnb
Adapté au Big Data et aux Microservices
Architecture de Mesos
Source : http://mesos.apache.org/documentation/latest/mesos-architecture/
Architecture de Mesos
Source : http://mesos.apache.org/documentation/latest/mesos-architecture/
“Frameworks” Mesos
Jenkins
Hadoop
Storm
Marathon
Spark
ElasticSearch
Chronos
Cassandra
Cluster Mesos
Marathon sur Mesos
Mesos and co, warning
Travail en amont nécessaire !
Packaging automatique
Déploiement automatique
Data Science
Statistiques
Médiane
Distribution
Ecart-type
Tendances
Moyenne
arithmétique
Five-number summary
“Scatterplot matrix”
Source : http://cdn-ak.f.st-hatena.com/images/fotolife/t/triadsou/20130124/20130124110747.png
Machine learning
Clustering
k-Nearest Neighbors
(k-NN)
Classification
Modèles
Prédiction
Régression linéaire
k-means
Arbre de décisions
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Utilisateurs,
capteurs, ...
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
JSON, XML,
messages,
etc...
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Parsées, dé-
doublonnées,
triées, jointées, ...
Spark,
Cascading,
Python
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Faire
connaissance
avec les données
R, Python, Spark, Hive,
Notebooks (IPython,
Zeppelin)
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Spark MLib,
Python SciKit, R,
Weka, ...
Classification,
prédiction, ...
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Reporting,
visualisation, ...
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Filtre anti-spam, moteur
de recommandations, ...
Big data, data science, etc!
Données
brutes
Données
traitées
Nouveau
produit
Communication
Exploration
Modèle,
statistiques
Décisions
Influence sur les
données
Conclusion
Pour résumer
Pensez au cloud pour le prototypage
Hadoop n’est pas un SGBDR
Adoptez une approche agile et itérative
Ne négligez pas l’industrialisation des dév.
Merci !
Questions ?

More Related Content

What's hot

Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkAmal Abid
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystèmeKhanh Maudoux
 
Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?Victor Coustenoble
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop QuébecMathieu Dumoulin
 
DataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysDataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysVictor Coustenoble
 
Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...
Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...
Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...OCTO Technology
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentariesRima Jamli Faidi
 
Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009Olivier Grisel
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
Hadoop Introduction in Paris
Hadoop Introduction in ParisHadoop Introduction in Paris
Hadoop Introduction in ParisTed Drake
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5Amal Abid
 
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigDataPetit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigDataMarc Bojoly
 
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopCasablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopBenoît de CHATEAUVIEUX
 
Spark Streaming
Spark StreamingSpark Streaming
Spark StreamingPALO IT
 
DataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudDataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudVictor Coustenoble
 

What's hot (20)

Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
 
Tech day hadoop, Spark
Tech day hadoop, SparkTech day hadoop, Spark
Tech day hadoop, Spark
 
Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?Quelles stratégies de Recherche avec Cassandra ?
Quelles stratégies de Recherche avec Cassandra ?
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop Québec
 
DataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysDataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft Techdays
 
Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...
Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...
Softshake 2013 - Yarn dans la vraie vie, retour d'expérience et bonnes pratiq...
 
Chapitre 3 spark
Chapitre 3 sparkChapitre 3 spark
Chapitre 3 spark
 
Les technologies big data avec speech commentaries
Les technologies big data avec speech commentariesLes technologies big data avec speech commentaries
Les technologies big data avec speech commentaries
 
Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009
 
Introduction spark
Introduction sparkIntroduction spark
Introduction spark
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Hadoop Introduction in Paris
Hadoop Introduction in ParisHadoop Introduction in Paris
Hadoop Introduction in Paris
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5
 
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigDataPetit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
 
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopCasablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
 
Spark - Ippevent 19-02-2015
Spark - Ippevent 19-02-2015Spark - Ippevent 19-02-2015
Spark - Ippevent 19-02-2015
 
Hadoop
HadoopHadoop
Hadoop
 
Spark Streaming
Spark StreamingSpark Streaming
Spark Streaming
 
DataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudDataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le Cloud
 

Viewers also liked

Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataMicrosoft
 
IBM Counter Financial Crimes Management
IBM Counter Financial Crimes ManagementIBM Counter Financial Crimes Management
IBM Counter Financial Crimes ManagementVirginia Fernandez
 
Various Solutions to the Problem of Points
Various Solutions to the Problem of PointsVarious Solutions to the Problem of Points
Various Solutions to the Problem of Pointswgyn
 
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME
 
Caracal pitch deck FR
Caracal pitch deck FRCaracal pitch deck FR
Caracal pitch deck FRJean Latiere
 
Atelier Pitch l'UX à ta grand-mère...et sois convaincant !
Atelier Pitch l'UX à ta grand-mère...et sois convaincant !Atelier Pitch l'UX à ta grand-mère...et sois convaincant !
Atelier Pitch l'UX à ta grand-mère...et sois convaincant !Benjamin Richy
 
201411203 goto night on graphs for fraud detection
201411203 goto night on graphs for fraud detection201411203 goto night on graphs for fraud detection
201411203 goto night on graphs for fraud detectionRik Van Bruggen
 
IBM Counter Fraud Management
IBM Counter Fraud ManagementIBM Counter Fraud Management
IBM Counter Fraud ManagementAngela Tuminello
 
Fortify Your Enterprise with IBM Smarter Counter-Fraud Solutions
Fortify Your Enterprise with IBM Smarter Counter-Fraud SolutionsFortify Your Enterprise with IBM Smarter Counter-Fraud Solutions
Fortify Your Enterprise with IBM Smarter Counter-Fraud SolutionsPerficient, Inc.
 
Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013
Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013
Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013Bruno M. Wattenbergh
 
Real-Time Fraud Detection with Storm and Kafka
Real-Time Fraud Detection with Storm and KafkaReal-Time Fraud Detection with Storm and Kafka
Real-Time Fraud Detection with Storm and KafkaAlexey Kharlamov
 
Spark (v1.3) - Présentation (Français)
Spark (v1.3) - Présentation (Français)Spark (v1.3) - Présentation (Français)
Spark (v1.3) - Présentation (Français)Alexis Seigneurin
 
Guide du pitch Startup Comédie French Tech Montpellier
Guide du pitch Startup Comédie French Tech MontpellierGuide du pitch Startup Comédie French Tech Montpellier
Guide du pitch Startup Comédie French Tech MontpellierPierre Alzingre
 
Real time fraud detection at 1+M scale on hadoop stack
Real time fraud detection at 1+M scale on hadoop stackReal time fraud detection at 1+M scale on hadoop stack
Real time fraud detection at 1+M scale on hadoop stackDataWorks Summit/Hadoop Summit
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsMICHRAFY MUSTAFA
 
Le pitch qui nous a permis de lever 500 000 €
Le pitch qui nous a permis de lever 500 000 €Le pitch qui nous a permis de lever 500 000 €
Le pitch qui nous a permis de lever 500 000 €Swapcard
 
Detecting fraud with Python and machine learning
Detecting fraud with Python and machine learningDetecting fraud with Python and machine learning
Detecting fraud with Python and machine learningwgyn
 

Viewers also liked (20)

Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big DataAzure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
Azure Camp 9 Décembre 2014 - slides session développeurs IOT Big Data
 
Le Perfect pitch
Le Perfect pitchLe Perfect pitch
Le Perfect pitch
 
IBM Counter Financial Crimes Management
IBM Counter Financial Crimes ManagementIBM Counter Financial Crimes Management
IBM Counter Financial Crimes Management
 
Various Solutions to the Problem of Points
Various Solutions to the Problem of PointsVarious Solutions to the Problem of Points
Various Solutions to the Problem of Points
 
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
 
Caracal pitch deck FR
Caracal pitch deck FRCaracal pitch deck FR
Caracal pitch deck FR
 
Atelier Pitch l'UX à ta grand-mère...et sois convaincant !
Atelier Pitch l'UX à ta grand-mère...et sois convaincant !Atelier Pitch l'UX à ta grand-mère...et sois convaincant !
Atelier Pitch l'UX à ta grand-mère...et sois convaincant !
 
201411203 goto night on graphs for fraud detection
201411203 goto night on graphs for fraud detection201411203 goto night on graphs for fraud detection
201411203 goto night on graphs for fraud detection
 
IBM Counter Fraud Management
IBM Counter Fraud ManagementIBM Counter Fraud Management
IBM Counter Fraud Management
 
Devox
DevoxDevox
Devox
 
Fortify Your Enterprise with IBM Smarter Counter-Fraud Solutions
Fortify Your Enterprise with IBM Smarter Counter-Fraud SolutionsFortify Your Enterprise with IBM Smarter Counter-Fraud Solutions
Fortify Your Enterprise with IBM Smarter Counter-Fraud Solutions
 
Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013
Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013
Comment réussir son pitch dimanche soir - Startup Week-end Liège 2013
 
Real-Time Fraud Detection with Storm and Kafka
Real-Time Fraud Detection with Storm and KafkaReal-Time Fraud Detection with Storm and Kafka
Real-Time Fraud Detection with Storm and Kafka
 
Spark (v1.3) - Présentation (Français)
Spark (v1.3) - Présentation (Français)Spark (v1.3) - Présentation (Français)
Spark (v1.3) - Présentation (Français)
 
Guide du pitch Startup Comédie French Tech Montpellier
Guide du pitch Startup Comédie French Tech MontpellierGuide du pitch Startup Comédie French Tech Montpellier
Guide du pitch Startup Comédie French Tech Montpellier
 
Pitch Or Elevator Pitch
Pitch Or Elevator PitchPitch Or Elevator Pitch
Pitch Or Elevator Pitch
 
Real time fraud detection at 1+M scale on hadoop stack
Real time fraud detection at 1+M scale on hadoop stackReal time fraud detection at 1+M scale on hadoop stack
Real time fraud detection at 1+M scale on hadoop stack
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & Actions
 
Le pitch qui nous a permis de lever 500 000 €
Le pitch qui nous a permis de lever 500 000 €Le pitch qui nous a permis de lever 500 000 €
Le pitch qui nous a permis de lever 500 000 €
 
Detecting fraud with Python and machine learning
Detecting fraud with Python and machine learningDetecting fraud with Python and machine learning
Detecting fraud with Python and machine learning
 

Similar to Cartographie du big data

Avenir des grilles - F. Desprez
Avenir des grilles - F. DesprezAvenir des grilles - F. Desprez
Avenir des grilles - F. DesprezFrederic Desprez
 
ProActive Workflows & Scheduling
ProActive Workflows & Scheduling ProActive Workflows & Scheduling
ProActive Workflows & Scheduling Activeeon
 
INSA - Java in da Cloud - 06/2016
INSA - Java in da Cloud - 06/2016INSA - Java in da Cloud - 06/2016
INSA - Java in da Cloud - 06/2016Alexis Hassler
 
INSA Lyon - Java in da Cloud - 06/2016
INSA Lyon - Java in da Cloud - 06/2016INSA Lyon - Java in da Cloud - 06/2016
INSA Lyon - Java in da Cloud - 06/2016Alexis Hassler
 
Les clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie scienceLes clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie scienceFrederic Desprez
 
AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...
AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...
AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...Amazon Web Services
 
Développez votre application Facebook avec Windows Azure
Développez votre application Facebook avec Windows AzureDéveloppez votre application Facebook avec Windows Azure
Développez votre application Facebook avec Windows AzureMicrosoft
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessingPierre-Marie Brunet
 
Xamarin day - Xamarin et le cloud
Xamarin day - Xamarin et le cloudXamarin day - Xamarin et le cloud
Xamarin day - Xamarin et le cloudMichel HUBERT
 
INSA - Java in ze Cloud (2013)
INSA - Java in ze Cloud (2013)INSA - Java in ze Cloud (2013)
INSA - Java in ze Cloud (2013)Alexis Hassler
 
Les Clouds: Buzzword ou révolution technologique
Les Clouds: Buzzword ou révolution technologiqueLes Clouds: Buzzword ou révolution technologique
Les Clouds: Buzzword ou révolution technologiqueFrederic Desprez
 
Architecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.KArchitecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.KJulien Anguenot
 
NoSQL User Group Paris - 21 Juin 2011 - GigaSpaces
NoSQL User Group Paris - 21 Juin 2011 - GigaSpacesNoSQL User Group Paris - 21 Juin 2011 - GigaSpaces
NoSQL User Group Paris - 21 Juin 2011 - GigaSpacesFastConnect
 
Le Cloud IaaS & PaaS, OpenStack réseau et sécurité
Le Cloud IaaS & PaaS, OpenStack réseau et sécuritéLe Cloud IaaS & PaaS, OpenStack réseau et sécurité
Le Cloud IaaS & PaaS, OpenStack réseau et sécuritéNoureddine BOUYAHIAOUI
 
Xebicon2019 m icroservices
Xebicon2019   m icroservicesXebicon2019   m icroservices
Xebicon2019 m icroservicesCédrick Lunven
 
Realtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et MesosRealtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et Mesosebiznext
 

Similar to Cartographie du big data (20)

NoSQL et Big Data
NoSQL et Big DataNoSQL et Big Data
NoSQL et Big Data
 
Avenir des grilles - F. Desprez
Avenir des grilles - F. DesprezAvenir des grilles - F. Desprez
Avenir des grilles - F. Desprez
 
ProActive Workflows & Scheduling
ProActive Workflows & Scheduling ProActive Workflows & Scheduling
ProActive Workflows & Scheduling
 
INSA - Java in da Cloud - 06/2016
INSA - Java in da Cloud - 06/2016INSA - Java in da Cloud - 06/2016
INSA - Java in da Cloud - 06/2016
 
INSA Lyon - Java in da Cloud - 06/2016
INSA Lyon - Java in da Cloud - 06/2016INSA Lyon - Java in da Cloud - 06/2016
INSA Lyon - Java in da Cloud - 06/2016
 
Les clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie scienceLes clouds, du buzz à la vraie science
Les clouds, du buzz à la vraie science
 
AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...
AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...
AWS Summit Paris - Track 3 - Session 2 - IoT Partie 2 - Mettez en place l'inf...
 
Développez votre application Facebook avec Windows Azure
Développez votre application Facebook avec Windows AzureDéveloppez votre application Facebook avec Windows Azure
Développez votre application Facebook avec Windows Azure
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing
 
Xamarin day - Xamarin et le cloud
Xamarin day - Xamarin et le cloudXamarin day - Xamarin et le cloud
Xamarin day - Xamarin et le cloud
 
Google App Engine
Google App EngineGoogle App Engine
Google App Engine
 
INSA - Java in ze Cloud (2013)
INSA - Java in ze Cloud (2013)INSA - Java in ze Cloud (2013)
INSA - Java in ze Cloud (2013)
 
Les Clouds: Buzzword ou révolution technologique
Les Clouds: Buzzword ou révolution technologiqueLes Clouds: Buzzword ou révolution technologique
Les Clouds: Buzzword ou révolution technologique
 
Architecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.KArchitecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.K
 
NoSQL User Group Paris - 21 Juin 2011 - GigaSpaces
NoSQL User Group Paris - 21 Juin 2011 - GigaSpacesNoSQL User Group Paris - 21 Juin 2011 - GigaSpaces
NoSQL User Group Paris - 21 Juin 2011 - GigaSpaces
 
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka StreamsTraitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
 
Le Cloud IaaS & PaaS, OpenStack réseau et sécurité
Le Cloud IaaS & PaaS, OpenStack réseau et sécuritéLe Cloud IaaS & PaaS, OpenStack réseau et sécurité
Le Cloud IaaS & PaaS, OpenStack réseau et sécurité
 
HADOOP + R
HADOOP + RHADOOP + R
HADOOP + R
 
Xebicon2019 m icroservices
Xebicon2019   m icroservicesXebicon2019   m icroservices
Xebicon2019 m icroservices
 
Realtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et MesosRealtime Web avec Kafka, Spark et Mesos
Realtime Web avec Kafka, Spark et Mesos
 

More from acogoluegnes

What's up, RabbitMQ?
What's up, RabbitMQ?What's up, RabbitMQ?
What's up, RabbitMQ?acogoluegnes
 
Modern messaging with RabbitMQ, Spring Cloud and Reactor
Modern messaging with RabbitMQ, Spring Cloud and ReactorModern messaging with RabbitMQ, Spring Cloud and Reactor
Modern messaging with RabbitMQ, Spring Cloud and Reactoracogoluegnes
 
Microservices with Netflix OSS and Spring Cloud - Dev Day Orange
Microservices with Netflix OSS and Spring Cloud -  Dev Day OrangeMicroservices with Netflix OSS and Spring Cloud -  Dev Day Orange
Microservices with Netflix OSS and Spring Cloud - Dev Day Orangeacogoluegnes
 
Microservices with Netflix OSS and Spring Cloud
Microservices with Netflix OSS and Spring CloudMicroservices with Netflix OSS and Spring Cloud
Microservices with Netflix OSS and Spring Cloudacogoluegnes
 
Hadoop introduction
Hadoop introductionHadoop introduction
Hadoop introductionacogoluegnes
 
Cascading at the Lyon Hadoop User Group
Cascading at the Lyon Hadoop User GroupCascading at the Lyon Hadoop User Group
Cascading at the Lyon Hadoop User Groupacogoluegnes
 

More from acogoluegnes (6)

What's up, RabbitMQ?
What's up, RabbitMQ?What's up, RabbitMQ?
What's up, RabbitMQ?
 
Modern messaging with RabbitMQ, Spring Cloud and Reactor
Modern messaging with RabbitMQ, Spring Cloud and ReactorModern messaging with RabbitMQ, Spring Cloud and Reactor
Modern messaging with RabbitMQ, Spring Cloud and Reactor
 
Microservices with Netflix OSS and Spring Cloud - Dev Day Orange
Microservices with Netflix OSS and Spring Cloud -  Dev Day OrangeMicroservices with Netflix OSS and Spring Cloud -  Dev Day Orange
Microservices with Netflix OSS and Spring Cloud - Dev Day Orange
 
Microservices with Netflix OSS and Spring Cloud
Microservices with Netflix OSS and Spring CloudMicroservices with Netflix OSS and Spring Cloud
Microservices with Netflix OSS and Spring Cloud
 
Hadoop introduction
Hadoop introductionHadoop introduction
Hadoop introduction
 
Cascading at the Lyon Hadoop User Group
Cascading at the Lyon Hadoop User GroupCascading at the Lyon Hadoop User Group
Cascading at the Lyon Hadoop User Group
 

Cartographie du big data