SlideShare a Scribd company logo
1 of 19
Download to read offline
— Shake '17, 11/05/17
Dr Thomas Gerbaud
propulsé par OceanData.io
PLANTER
SON PROJET
QUELQUES
REGLES
SIMPLES
#DATA
“Big Data is like teenage sex:
everyone talks about it,
nobody really knows how to do it,
everyone thinks everyone else is doing it,
so everyone claims they are doing it !”
— Dan Ariely, Duke University (2013)
Les BigData désignent des ensembles de données qui
deviennent tellement volumineux qu'ils en sont difficiles à
appréhender avec des outils classiques de gestion de base
de données ou de gestion de l'information.
Mouvement global et englobant qui recouvre des réalités très
diverses, et qui fait s’interpénétrer des mondes différents.
Mot-valise qui recouvre une réalité objective (==mesurable) et
subjective (==trop de données). Il apparait quand la masse de
données à traiter par les outils classiques devient problématique
Tech Bubble? Unicorn Bubble? #data Bubble?
Billion $ club
Uber: 68G$ AirBnB: 31G$ Slack: 3.8G$ SnapChat: 25G$
BMW: 53G$ GM: 52G$ Hilton: 25G$ Accor: 9G$
Total: 111G€ GE: 278G$ Samsung: 196G$
Date: 27 Avril 2017
∑: 773 G$
Organiser le désordre ?
La #data ? Quatre types d’acteurs
● ceux qui parlent;
● ceux qui vendent;
● ceux qui ont les besoins;
● ceux qui ont les données.
… médias, boites de communication,
boites de conseil & stratégie,
startups, institutionnels
… éditeurs de software,
d’infrastructure, de plateforme,
profils techniques
… entreprises classiques
… services publics
… profils opérationnels
… possesseurs de bases de
données historiques,
d’informations uniques.
I. data IT, IT data⊂ ⊄
II. Over-engineering
III. Un data scientist n'est pas la solution
data IT, IT data⊂ ⊄
Un projet data doit passer par une phase
où on ne sait pas ce que le programme va
fournir comme résultats.
Un projet data doit inclure une base
de données trop grosse pour être
visualisée de manière exhaustive et,
quelque part dans le code, des lignes
du genre model.fit, model.predict et
model.score.
Le reste n'est que littérature.
IT data, data IT⊂ ⊄
“Big data is not actually about the data.
The revolution is not that there’s more
data available. The revolution is that we
know what to do with it now. That’s
really the amazing thing.“
[...]
The revolution is not about the data. It’s
about the analytics that we can come up
with and that we now have to be able to
understand what these data say.”
— Gary King, Harvard (2016)
“Les modèles et algorithmes deviennent
l'infrastructure fondamentale pour la disruption
digitale de l’économie tout entière, à la fois en
tant qu’actifs stratégiques, en tant
qu’infrastructure décisive.”
“Tout converge pour montrer le rôle décisif que jouent les
technologies de modèles et algorithmes dans les bouleversements de
l’économie actuelle.”
“Au sein de ces usages digitaux en
rupture, l’actif technologique déterminant
est l’algorithmique.”
– BPI France (2015)
Over-engineering
Over-engineering
Projet data== projet IT + data science.
● des maths compliquées;
● des statistiques balaises;
● des algorithmes écrits par des chercheurs;
● des bases de données;
● des performances.
Utiliser ces outils ? :
● la peinture autour des libraires n'est pas toujours fraîche;
● le risque de raconter n'importe quoi "parce que l'algorithme l'a
dit" est grand;
● il faudra parler à des gens qui ont fait beaucoup trop de
maths ou d'informatique pour être sains d'esprit.
Un data scientist n'est pas la solution
"Arguing with an engineer is like fighting
a pig in mud. After the first few hours,
you realise they enjoy it"?
Un data scientist est un scientifique.
Donc quelqu'un aime les problèmes
techniques compliqués et qui voudra les
résoudre.
Comment les arrêter sans les frustrer?
Comment obtenir des solutions
perfectibles, temporaires, et
fonctionnelles ?
Un data scientist n'est pas la solution
“I keep saying the sexy job in the next ten
years will be statisticians. People think I’m
joking, but who would’ve guessed that
computer engineers would’ve been the sexy
job of the 1990s?”
— Hal Varian, Chief economist,
Google (2009)
— Shake '17, 11/05/17
PLANTER
SON PROJET
QUELQUES
REGLES
SIMPLES
#DATA
Thomas Gerbaud, Ph.D
http://OceanData.io
thomas@oceandata.io
Les GAFA ...
1480 G$ CAC 40
2875 G$ EURO STOXX 50
∑: 468G$ ∑: 2200+ G$ ∑: 469k
Google (Alphabet Inc.)
Larry Page, Sergey Brin – 1996
CA: 90G$ cap: 608 G$ empl: 70k
Mountain View, CA, USA
Apple Inc.
Steve Jobs et al (Tim Cook) – 1976
CA: 215G$ cap: 749 G$ empl: 115k
Cupertino, CA, USA
Facebook
Mark Zuckerberg et al – 2004
CA: 27G$ cap: 424 G$ empl: 15k
Menlo Park, CA, USA
Amazon
Jeff Bezos – 1994
CA: 136G$ cap: 435 G$ empl: 269k
Seattle, Washington, USA
Date: 27 Avril 2017
Blockchain & Bitcoin
Blockchain
1. You do not talk about Bitcoin
2. You do not talk about Bitcoin
3. It is a fully distributed database with no central authority
4. Instant, global transactional capability.
5. Control is enforced by quite strong cryptography..
6. Very strong potential for disruption
Apprentissage …
… supervisé
Mots de mathématiciens
Comment prendre des décisions adaptées,
personnalisées et sur-mesure ?
Comment représenter les données ? Quel point de
vue adopter ? Comment extraire de la
connaissance de grandes masses de données ?
Quelle connaissance extraire d’un ensemble de données,
partir d’un modèle de données ou de règles métiers ?
L’humain guide la machine.
Quelle connaissance extraire d’un ensemble de
données sans a priori ? La machine n’est pas guidée,
les mathématiques agissent seules.
Comment structurer, extraire, découvrir ?
Que peut-on anticiper, à partir de données brutes ou de
modèles de connaissances ? Avec quelle confiance ?
Statistiques
Modélisation
Apprentissage …
… non-supervisé
Recommendation
Profilage
Data-mining
Prédiction
Mots d’informaticiens
Langages Python/R/Scala + base de données + visualisations
+ outils spécialisés en machine learning et data processing
Intrinsèquement du sur-mesure.
Design pattern destiné à faciliter la création d’applications
distribuées (stockage/traitement) et échelonnables.
Google, 2004
Framework. Implémentation de MapReduce.
HDFS, Hbase; Hive, Pig; MS Azure, Amazon EC2
Apache, 2008
~Hadoop travaillant en mémoire vive + plateforme
incluant des outils d’analyse. Perfs x10-x100.
Berkeley (CA, USA)/Apache, 2014
not-only SQL : bases de données répondant à des besoins très
spécifiques, dont la gestion de très grosses bases de données.
Ex: MongoDB, Cassandra, Redis, ElasticSearch, CouchDB
Editeurs de plateforme de données basées sur Hadoop.
Sociétés privées, 2008/2011
Cloudera
HortonWorks
noSQL
Spark
Hadoop
MapReduce
● médiatique. omniprésence d'internet & réseaux sociaux
● conceptuelle. client == user == data => valorisation
● technologique. forte offre logicielle & plateformes
TROIS RUPTURES
Would it take a long time to make the story it short ?
La #data a d'abord été un problème purement technique pour les nouveaux
acteurs du net (GAFA), qui ont du concevoir et bâtir des outils ad-hoc.
Ils en ont tiré une grande richesse commerciale et technique, qu'ils exploitent
depuis comme une rente de situation. La puissance financière des GAFA
devient dangereuse pour les acteurs classiques, qui, en réaction, se lancent
dans la #data pour ne pas disparaitre. En découle un impératif stratégique
d'exploitation des données.
En parallèle, les acteurs classiques disposant de beaucoup de données (bases
ou flux) s'interrogent sur de possibles pivots.
La question à résoudre pour les acteurs classiques est de savoir où positionner
le curseur entre, d'un côté, du business intelligence/analytics ou aide à la
décision et, de l'autre, véritable mutation.

More Related Content

What's hot

Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data businessVincent de Stoecklin
 
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungenGalsungen
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCGMicropole Group
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Aleph Technologies
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big DataJocelyn Muret
 
BIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceBIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceJulien DEMAUGÉ-BOST
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big dataAbdelghani Azri
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applicationsAffinity Engine
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesKezhan SHI
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataNicolas Peene
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGMargarita Zlatkova
 

What's hot (20)

Introduction à la Data Science l data business
Introduction à la Data Science l data businessIntroduction à la Data Science l data business
Introduction à la Data Science l data business
 
Etude sur le Big Data
Etude sur le Big DataEtude sur le Big Data
Etude sur le Big Data
 
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
 
01 xavier-dalloz big data
01 xavier-dalloz big data01 xavier-dalloz big data
01 xavier-dalloz big data
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCG
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
 
Big data
Big dataBig data
Big data
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big Data
 
Big data
Big dataBig data
Big data
 
BIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceBIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligence
 
Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)Parcours Big Data @ Cetic (6 mai 2014)
Parcours Big Data @ Cetic (6 mai 2014)
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
Big data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuairesBig data analytics focus technique et nouvelles perspectives pour les actuaires
Big data analytics focus technique et nouvelles perspectives pour les actuaires
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
 
Livre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBGLivre blanc "Big Data" de l'EBG
Livre blanc "Big Data" de l'EBG
 
Conférence big data
Conférence big dataConférence big data
Conférence big data
 

Similar to Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io

EuraTech Trends : Big Data
EuraTech Trends : Big DataEuraTech Trends : Big Data
EuraTech Trends : Big DataEuraTechnologies
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Spad big data - sfds - 2016
Spad   big data - sfds - 2016Spad   big data - sfds - 2016
Spad big data - sfds - 2016Julien BLAIZE
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceExcelerate Systems
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 OCTO Technology
 
Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft
Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft
Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft Aline Custodio
 
L'Encyclopédie des Big Data 2016
L'Encyclopédie des Big Data 2016L'Encyclopédie des Big Data 2016
L'Encyclopédie des Big Data 201655 | fifty-five
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldoradoKarim Baïna
 
Web predictif-ertzscheid
Web predictif-ertzscheidWeb predictif-ertzscheid
Web predictif-ertzscheidolivier
 
Open datasoft platform designed for open data & big data issues v3
Open datasoft platform designed for open data & big data issues v3Open datasoft platform designed for open data & big data issues v3
Open datasoft platform designed for open data & big data issues v3OpenDataSoft
 
Compte rendu AI Paris 2017
Compte rendu AI Paris 2017Compte rendu AI Paris 2017
Compte rendu AI Paris 2017FacilisPro
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurMicrosoft Ideas
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdfZkSadrati
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdfZkSadrati
 
Les big data à l'heure de l'open data
Les big data à l'heure de l'open dataLes big data à l'heure de l'open data
Les big data à l'heure de l'open dataOpenDataSoft
 
First step about IA and business
First step about IA and businessFirst step about IA and business
First step about IA and businessDavid Argellies
 
Pourquoi le big data open source ?
Pourquoi le big data open source ?Pourquoi le big data open source ?
Pourquoi le big data open source ?Stefane Fermigier
 
1 Systhematic - Data Tuesday 26 fev 2013
1  Systhematic - Data Tuesday 26 fev 20131  Systhematic - Data Tuesday 26 fev 2013
1 Systhematic - Data Tuesday 26 fev 2013Data Tuesday
 

Similar to Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io (20)

EuraTech Trends : Big Data
EuraTech Trends : Big DataEuraTech Trends : Big Data
EuraTech Trends : Big Data
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Spad big data - sfds - 2016
Spad   big data - sfds - 2016Spad   big data - sfds - 2016
Spad big data - sfds - 2016
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Hadoop et le big data
Hadoop et le big dataHadoop et le big data
Hadoop et le big data
 
La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
 
Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft
Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft
Conférence Open Data par où commencer ? Intervention J.M.Lazard Open datasoft
 
L'Encyclopédie des Big Data 2016
L'Encyclopédie des Big Data 2016L'Encyclopédie des Big Data 2016
L'Encyclopédie des Big Data 2016
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldorado
 
Web predictif-ertzscheid
Web predictif-ertzscheidWeb predictif-ertzscheid
Web predictif-ertzscheid
 
Open datasoft platform designed for open data & big data issues v3
Open datasoft platform designed for open data & big data issues v3Open datasoft platform designed for open data & big data issues v3
Open datasoft platform designed for open data & big data issues v3
 
Compte rendu AI Paris 2017
Compte rendu AI Paris 2017Compte rendu AI Paris 2017
Compte rendu AI Paris 2017
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
 
Introduction au BigData.pdf
Introduction au BigData.pdfIntroduction au BigData.pdf
Introduction au BigData.pdf
 
Les big data à l'heure de l'open data
Les big data à l'heure de l'open dataLes big data à l'heure de l'open data
Les big data à l'heure de l'open data
 
First step about IA and business
First step about IA and businessFirst step about IA and business
First step about IA and business
 
Pourquoi le big data open source ?
Pourquoi le big data open source ?Pourquoi le big data open source ?
Pourquoi le big data open source ?
 
1 Systhematic - Data Tuesday 26 fev 2013
1  Systhematic - Data Tuesday 26 fev 20131  Systhematic - Data Tuesday 26 fev 2013
1 Systhematic - Data Tuesday 26 fev 2013
 

More from Hervé Bourdon

Comment rater son networking en 10 leçons Hervé Bourdon @Valvert #shake18
Comment rater son networking en 10 leçons   Hervé Bourdon @Valvert #shake18Comment rater son networking en 10 leçons   Hervé Bourdon @Valvert #shake18
Comment rater son networking en 10 leçons Hervé Bourdon @Valvert #shake18Hervé Bourdon
 
Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...
Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...
Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...Hervé Bourdon
 
10 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake17
10 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake1710 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake17
10 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake17Hervé Bourdon
 
Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17
Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17
Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17Hervé Bourdon
 
Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17
Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17
Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17Hervé Bourdon
 
Stratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNum
Stratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNumStratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNum
Stratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNumHervé Bourdon
 
Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...
Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...
Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...Hervé Bourdon
 
L’e-commerce à l’international, par Damien JACOB - @retis #shake17
L’e-commerce à l’international, par Damien JACOB - @retis #shake17L’e-commerce à l’international, par Damien JACOB - @retis #shake17
L’e-commerce à l’international, par Damien JACOB - @retis #shake17Hervé Bourdon
 
Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...
Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...
Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...Hervé Bourdon
 
Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17
Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17
Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17Hervé Bourdon
 
Atelier Webmecanik - Homeserve #shake17
Atelier Webmecanik - Homeserve #shake17Atelier Webmecanik - Homeserve #shake17
Atelier Webmecanik - Homeserve #shake17Hervé Bourdon
 
E-commerçants, comment faire la différence avec le marketing automation ? Her...
E-commerçants, comment faire la différence avec le marketing automation ? Her...E-commerçants, comment faire la différence avec le marketing automation ? Her...
E-commerçants, comment faire la différence avec le marketing automation ? Her...Hervé Bourdon
 
Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...
Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...
Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...Hervé Bourdon
 
#WetSàAix 6 Visibilité, marketing web comment générer des contacts comme...
#WetSàAix  6 Visibilité, marketing web comment générer  des contacts comme...#WetSàAix  6 Visibilité, marketing web comment générer  des contacts comme...
#WetSàAix 6 Visibilité, marketing web comment générer des contacts comme...Hervé Bourdon
 
3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZES
3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZES3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZES
3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZESHervé Bourdon
 
5 La mutation numérique, les entreprises du Pays d'Aix - Vincent Richet
5 La mutation numérique, les entreprises du Pays d'Aix - Vincent Richet5 La mutation numérique, les entreprises du Pays d'Aix - Vincent Richet
5 La mutation numérique, les entreprises du Pays d'Aix - Vincent RichetHervé Bourdon
 
1 - überisation - mythe ou réalité pour le commerce
1 - überisation - mythe ou réalité pour le commerce1 - überisation - mythe ou réalité pour le commerce
1 - überisation - mythe ou réalité pour le commerceHervé Bourdon
 
À la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvert
À la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvertÀ la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvert
À la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvertHervé Bourdon
 
Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...
Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...
Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...Hervé Bourdon
 
Les clés du tunnel d’achat parfait - Masterclass Visiplus Hervé Bourdon
Les clés du tunnel d’achat parfait - Masterclass Visiplus Hervé BourdonLes clés du tunnel d’achat parfait - Masterclass Visiplus Hervé Bourdon
Les clés du tunnel d’achat parfait - Masterclass Visiplus Hervé BourdonHervé Bourdon
 

More from Hervé Bourdon (20)

Comment rater son networking en 10 leçons Hervé Bourdon @Valvert #shake18
Comment rater son networking en 10 leçons   Hervé Bourdon @Valvert #shake18Comment rater son networking en 10 leçons   Hervé Bourdon @Valvert #shake18
Comment rater son networking en 10 leçons Hervé Bourdon @Valvert #shake18
 
Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...
Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...
Comment recruter son équipe pour digitaliser son entreprise ? - Samuel Masson...
 
10 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake17
10 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake1710 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake17
10 règles d'or pour créer sa marketplace - Eric ALESSANDRI Wizaplace #shake17
 
Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17
Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17
Lendopolis, prêts de particuliers à entrepreneurs / KissKissBankBank #shake17
 
Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17
Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17
Docker : les fondamentaux, par Fabien AMICO de Treeptik #shake17
 
Stratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNum
Stratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNumStratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNum
Stratégies web BtoB to C - CCI Bayonne Pays Basque @PerformanceNum
 
Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...
Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...
Dopez vos ventes avec une
 stratégie "payment friendly" Sibylle Denis - LYRA/...
 
L’e-commerce à l’international, par Damien JACOB - @retis #shake17
L’e-commerce à l’international, par Damien JACOB - @retis #shake17L’e-commerce à l’international, par Damien JACOB - @retis #shake17
L’e-commerce à l’international, par Damien JACOB - @retis #shake17
 
Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...
Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...
Facebook Ads Dynamiques un retargeting plus pertinent pour un ROI plus élevé ...
 
Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17
Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17
Rendre son PrestaShop plus intelligent - Collectif ecommerce #shake17
 
Atelier Webmecanik - Homeserve #shake17
Atelier Webmecanik - Homeserve #shake17Atelier Webmecanik - Homeserve #shake17
Atelier Webmecanik - Homeserve #shake17
 
E-commerçants, comment faire la différence avec le marketing automation ? Her...
E-commerçants, comment faire la différence avec le marketing automation ? Her...E-commerçants, comment faire la différence avec le marketing automation ? Her...
E-commerçants, comment faire la différence avec le marketing automation ? Her...
 
Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...
Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...
Comment exploser votre taux de conversion avec un tunnel d'achat parfait ? He...
 
#WetSàAix 6 Visibilité, marketing web comment générer des contacts comme...
#WetSàAix  6 Visibilité, marketing web comment générer  des contacts comme...#WetSàAix  6 Visibilité, marketing web comment générer  des contacts comme...
#WetSàAix 6 Visibilité, marketing web comment générer des contacts comme...
 
3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZES
3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZES3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZES
3 Quel potentiel pour les marketplaces en 2016 - Iziflux - Guilhem GLEIZES
 
5 La mutation numérique, les entreprises du Pays d'Aix - Vincent Richet
5 La mutation numérique, les entreprises du Pays d'Aix - Vincent Richet5 La mutation numérique, les entreprises du Pays d'Aix - Vincent Richet
5 La mutation numérique, les entreprises du Pays d'Aix - Vincent Richet
 
1 - überisation - mythe ou réalité pour le commerce
1 - überisation - mythe ou réalité pour le commerce1 - überisation - mythe ou réalité pour le commerce
1 - überisation - mythe ou réalité pour le commerce
 
À la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvert
À la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvertÀ la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvert
À la recherche de la Landing Page qui tue #Recom15 @webetsolutions @valvert
 
Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...
Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...
Avez-vous les CRO ? Donnez enfin du mordant à votre conversion #Recom15 @webe...
 
Les clés du tunnel d’achat parfait - Masterclass Visiplus Hervé Bourdon
Les clés du tunnel d’achat parfait - Masterclass Visiplus Hervé BourdonLes clés du tunnel d’achat parfait - Masterclass Visiplus Hervé Bourdon
Les clés du tunnel d’achat parfait - Masterclass Visiplus Hervé Bourdon
 

Comment planter son projet data ? Par Thomas GERBAUD PhD OceanData.io

  • 1. — Shake '17, 11/05/17 Dr Thomas Gerbaud propulsé par OceanData.io PLANTER SON PROJET QUELQUES REGLES SIMPLES #DATA “Big Data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it !” — Dan Ariely, Duke University (2013)
  • 2. Les BigData désignent des ensembles de données qui deviennent tellement volumineux qu'ils en sont difficiles à appréhender avec des outils classiques de gestion de base de données ou de gestion de l'information.
  • 3. Mouvement global et englobant qui recouvre des réalités très diverses, et qui fait s’interpénétrer des mondes différents. Mot-valise qui recouvre une réalité objective (==mesurable) et subjective (==trop de données). Il apparait quand la masse de données à traiter par les outils classiques devient problématique
  • 4.
  • 5. Tech Bubble? Unicorn Bubble? #data Bubble? Billion $ club Uber: 68G$ AirBnB: 31G$ Slack: 3.8G$ SnapChat: 25G$ BMW: 53G$ GM: 52G$ Hilton: 25G$ Accor: 9G$ Total: 111G€ GE: 278G$ Samsung: 196G$ Date: 27 Avril 2017 ∑: 773 G$
  • 6. Organiser le désordre ? La #data ? Quatre types d’acteurs ● ceux qui parlent; ● ceux qui vendent; ● ceux qui ont les besoins; ● ceux qui ont les données. … médias, boites de communication, boites de conseil & stratégie, startups, institutionnels … éditeurs de software, d’infrastructure, de plateforme, profils techniques … entreprises classiques … services publics … profils opérationnels … possesseurs de bases de données historiques, d’informations uniques.
  • 7. I. data IT, IT data⊂ ⊄ II. Over-engineering III. Un data scientist n'est pas la solution
  • 8. data IT, IT data⊂ ⊄ Un projet data doit passer par une phase où on ne sait pas ce que le programme va fournir comme résultats. Un projet data doit inclure une base de données trop grosse pour être visualisée de manière exhaustive et, quelque part dans le code, des lignes du genre model.fit, model.predict et model.score. Le reste n'est que littérature.
  • 9. IT data, data IT⊂ ⊄ “Big data is not actually about the data. The revolution is not that there’s more data available. The revolution is that we know what to do with it now. That’s really the amazing thing.“ [...] The revolution is not about the data. It’s about the analytics that we can come up with and that we now have to be able to understand what these data say.” — Gary King, Harvard (2016)
  • 10. “Les modèles et algorithmes deviennent l'infrastructure fondamentale pour la disruption digitale de l’économie tout entière, à la fois en tant qu’actifs stratégiques, en tant qu’infrastructure décisive.” “Tout converge pour montrer le rôle décisif que jouent les technologies de modèles et algorithmes dans les bouleversements de l’économie actuelle.” “Au sein de ces usages digitaux en rupture, l’actif technologique déterminant est l’algorithmique.” – BPI France (2015) Over-engineering
  • 11. Over-engineering Projet data== projet IT + data science. ● des maths compliquées; ● des statistiques balaises; ● des algorithmes écrits par des chercheurs; ● des bases de données; ● des performances. Utiliser ces outils ? : ● la peinture autour des libraires n'est pas toujours fraîche; ● le risque de raconter n'importe quoi "parce que l'algorithme l'a dit" est grand; ● il faudra parler à des gens qui ont fait beaucoup trop de maths ou d'informatique pour être sains d'esprit.
  • 12. Un data scientist n'est pas la solution "Arguing with an engineer is like fighting a pig in mud. After the first few hours, you realise they enjoy it"? Un data scientist est un scientifique. Donc quelqu'un aime les problèmes techniques compliqués et qui voudra les résoudre. Comment les arrêter sans les frustrer? Comment obtenir des solutions perfectibles, temporaires, et fonctionnelles ?
  • 13. Un data scientist n'est pas la solution “I keep saying the sexy job in the next ten years will be statisticians. People think I’m joking, but who would’ve guessed that computer engineers would’ve been the sexy job of the 1990s?” — Hal Varian, Chief economist, Google (2009)
  • 14. — Shake '17, 11/05/17 PLANTER SON PROJET QUELQUES REGLES SIMPLES #DATA Thomas Gerbaud, Ph.D http://OceanData.io thomas@oceandata.io
  • 15. Les GAFA ... 1480 G$ CAC 40 2875 G$ EURO STOXX 50 ∑: 468G$ ∑: 2200+ G$ ∑: 469k Google (Alphabet Inc.) Larry Page, Sergey Brin – 1996 CA: 90G$ cap: 608 G$ empl: 70k Mountain View, CA, USA Apple Inc. Steve Jobs et al (Tim Cook) – 1976 CA: 215G$ cap: 749 G$ empl: 115k Cupertino, CA, USA Facebook Mark Zuckerberg et al – 2004 CA: 27G$ cap: 424 G$ empl: 15k Menlo Park, CA, USA Amazon Jeff Bezos – 1994 CA: 136G$ cap: 435 G$ empl: 269k Seattle, Washington, USA Date: 27 Avril 2017
  • 16. Blockchain & Bitcoin Blockchain 1. You do not talk about Bitcoin 2. You do not talk about Bitcoin 3. It is a fully distributed database with no central authority 4. Instant, global transactional capability. 5. Control is enforced by quite strong cryptography.. 6. Very strong potential for disruption
  • 17. Apprentissage … … supervisé Mots de mathématiciens Comment prendre des décisions adaptées, personnalisées et sur-mesure ? Comment représenter les données ? Quel point de vue adopter ? Comment extraire de la connaissance de grandes masses de données ? Quelle connaissance extraire d’un ensemble de données, partir d’un modèle de données ou de règles métiers ? L’humain guide la machine. Quelle connaissance extraire d’un ensemble de données sans a priori ? La machine n’est pas guidée, les mathématiques agissent seules. Comment structurer, extraire, découvrir ? Que peut-on anticiper, à partir de données brutes ou de modèles de connaissances ? Avec quelle confiance ? Statistiques Modélisation Apprentissage … … non-supervisé Recommendation Profilage Data-mining Prédiction
  • 18. Mots d’informaticiens Langages Python/R/Scala + base de données + visualisations + outils spécialisés en machine learning et data processing Intrinsèquement du sur-mesure. Design pattern destiné à faciliter la création d’applications distribuées (stockage/traitement) et échelonnables. Google, 2004 Framework. Implémentation de MapReduce. HDFS, Hbase; Hive, Pig; MS Azure, Amazon EC2 Apache, 2008 ~Hadoop travaillant en mémoire vive + plateforme incluant des outils d’analyse. Perfs x10-x100. Berkeley (CA, USA)/Apache, 2014 not-only SQL : bases de données répondant à des besoins très spécifiques, dont la gestion de très grosses bases de données. Ex: MongoDB, Cassandra, Redis, ElasticSearch, CouchDB Editeurs de plateforme de données basées sur Hadoop. Sociétés privées, 2008/2011 Cloudera HortonWorks noSQL Spark Hadoop MapReduce
  • 19. ● médiatique. omniprésence d'internet & réseaux sociaux ● conceptuelle. client == user == data => valorisation ● technologique. forte offre logicielle & plateformes TROIS RUPTURES Would it take a long time to make the story it short ? La #data a d'abord été un problème purement technique pour les nouveaux acteurs du net (GAFA), qui ont du concevoir et bâtir des outils ad-hoc. Ils en ont tiré une grande richesse commerciale et technique, qu'ils exploitent depuis comme une rente de situation. La puissance financière des GAFA devient dangereuse pour les acteurs classiques, qui, en réaction, se lancent dans la #data pour ne pas disparaitre. En découle un impératif stratégique d'exploitation des données. En parallèle, les acteurs classiques disposant de beaucoup de données (bases ou flux) s'interrogent sur de possibles pivots. La question à résoudre pour les acteurs classiques est de savoir où positionner le curseur entre, d'un côté, du business intelligence/analytics ou aide à la décision et, de l'autre, véritable mutation.