SlideShare a Scribd company logo
1 of 44
Fast Data Platforms
@HUG_Italy Meetup (17/4/2015)
@andrea_gioia
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
FASE 1: ONE SIZE FIT ALL
FASE 2: OLAP vs OLTP
FASE 2: ARCHITETTURA DATI
…MA I VOLUMI CRESCONO VELOCEMENTE
PROBLEMA: SCALABILITA’ SOLO VERTICALE
SOLUZIONE: CODE + SHARDING
SOLUZIONE: CODE + SHARDING
Partition-1 Partition-2 Partition-3 Partition-4 Partition-5 Partition-6
…MA I VOLUMI CRESCONO VELOCEMENTE
Problemi
PROBLEMI
1. Gestione dei
fault
2. Gestione
applicativa
del cluster
3. Ricalcolo
massivo
FASE 3: HADOOP 1.0
Componenti
1. Dati distribuiti (HDFS)
2. Computazione distribuita (Map-Reduce)
Vantaggi
1. Maschera la complessità della gestione
del cluster
2. Minimizza gli spostamenti dei dati
3. Scala orizzontalmente su commodity
hardware
FASE 3: ARCHITETTURA
FASE 3: DATA LAKE
Caratteristiche
1. Tutti i dati al massimo livello di
dettaglio (Volume)
2. Dati strutturati e non (Varietà)
3. Dati aggiunti appena disponibili
(Velocità)
4. Dati processabili in modalità
distribuita (Valore)
DATA LAKE != DWH
PROBLEMA: BIG MA NON FAST
COLLECT EXPLORE
ANALYZEACT
RISULTATI
1. Scoperta
2. Interrogazione
3. Ottimizzazione
FASE 4: SQL on HADOOP
FASE 4: ARCHITETTURA
PROBLEMA: VELOCE MA NON ABBASTANZA
…PERCHE’ I DATI CRESCONO IN VOLUME E IN VELOCITA’
FASE 5: SPECIALIZZAZIONE
FASE 5: LAMBDA ARCHITECTURE
Marged View
(QUERY)
LAMBDA ARCHITECTURE: PAIN POINTS
Problematiche
1. Duplicazione della logica di calcolo
2. Integrazione viste effettuata a livello
applicativo
3. Molte componenti software da
gestire
4. Molte componenti hardware
esposte a possibili fault
5. Velocità del fast layer limitata dal
sistema di storage dello stato
utilizzato
FAST LAYER SEMPLIFICATO
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
VoltDB è un database…
1. In memory
2. Partitioned
3. Single-threaded
4. Distributed
5. ACID compliant
COS’E’?
A tutte quelle applicazioni che
hanno bisogno di processare
grosse quantità di dati in
modo affidabile e veloce (fast
data)
Requisiti chiave per queste
applicazioni sono…
1. Altissimo throughput
2. Scalabilità
3. Affidabilità
4. High Availability
A CHI SERVE
A CHI NON SERVE
A tutte quelle applicazioni che
hanno bisogno di immagazzinare e
confrontare grosse quantità di dati
storici suddivisi su più tabelle (dwh
e bi)
DATA PARTITIONING
DATA REPLICATION
DISTRIBUTED PROCESSING
Garantita per mezzo di …
1. Replica delle partizioni
(K-SAFETY)
HIGH AVAILABILITY
DURABILITY
Garantita per mezzo di …
1. Snapshots periodici
2. Command logging (sincrono o
asincrono)
3. Replication (business continuity)
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
DATA PLATFORM 1
DATA PLATFORM 2
DATA PLATFORM 2
DATA PLATFORM 2
DATA PLATFORM 2
APP APP
GRAZIE!
DOMANDE?
BIBLIOGRAFIA
1. How to beat the CAP (Nathan Marz)
2. Questioning the Lambda Architecture (Jay Kreps)
3. The Log: What every software engineer should know about real-
time data's unifying abstraction (Jay Kreps)
4. Polyglot Persistence (Martin Fowler)
5. Fast Data and the New Enterprise Data Architecture (Scott Jarr)
6. Simplifying the (complex) Lambda architecture (John Piekos)
@andrea_gioia
andrea.gioia@quantyca.it
@quantycabi
www.quantyca.it

More Related Content

Similar to Fast data platforms - Hadoop User Group (Italy)

Consolidamento e virtualizzazione
Consolidamento e virtualizzazione Consolidamento e virtualizzazione
Consolidamento e virtualizzazione
S.info Srl
 
Modernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesModernize Legacy Systems with Kubernetes
Modernize Legacy Systems with Kubernetes
Giulio Roggero
 
Oracle Application Server 10g
Oracle Application Server 10gOracle Application Server 10g
Oracle Application Server 10g
Paolo Campegiani
 
Smart Technology 3 novembre
Smart Technology 3 novembreSmart Technology 3 novembre
Smart Technology 3 novembre
canaleenergia
 

Similar to Fast data platforms - Hadoop User Group (Italy) (20)

Cesvip 20110127
Cesvip 20110127Cesvip 20110127
Cesvip 20110127
 
20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp
 
Ha solutions su power i
Ha solutions su power iHa solutions su power i
Ha solutions su power i
 
Consolidamento e virtualizzazione
Consolidamento e virtualizzazione Consolidamento e virtualizzazione
Consolidamento e virtualizzazione
 
Db2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBMDb2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBM
 
Ottimizzazione della gestione dei dati sul cloud
Ottimizzazione della gestione dei dati sul cloudOttimizzazione della gestione dei dati sul cloud
Ottimizzazione della gestione dei dati sul cloud
 
Modernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesModernize Legacy Systems with Kubernetes
Modernize Legacy Systems with Kubernetes
 
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle OpenstackMySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
 
Presentazione bd2
Presentazione bd2Presentazione bd2
Presentazione bd2
 
Oracle Application Server 10g
Oracle Application Server 10gOracle Application Server 10g
Oracle Application Server 10g
 
Multitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL DatabaseMultitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL Database
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
 
Nagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open sourceNagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open source
 
Evento 18 giugno - ibm sicurezza - parte b - soluzioni
Evento 18 giugno - ibm sicurezza - parte b - soluzioni Evento 18 giugno - ibm sicurezza - parte b - soluzioni
Evento 18 giugno - ibm sicurezza - parte b - soluzioni
 
VMUGIT Roma 2016 - vROps Design - Pietro Piutti
VMUGIT Roma 2016 - vROps Design - Pietro PiuttiVMUGIT Roma 2016 - vROps Design - Pietro Piutti
VMUGIT Roma 2016 - vROps Design - Pietro Piutti
 
Smart Technology 3 novembre
Smart Technology 3 novembreSmart Technology 3 novembre
Smart Technology 3 novembre
 
VMUGIT UC 2013 - 05b Telecom Italia View
VMUGIT UC 2013 - 05b Telecom Italia ViewVMUGIT UC 2013 - 05b Telecom Italia View
VMUGIT UC 2013 - 05b Telecom Italia View
 
VMUGIT UC 2013 - 05b Telecom Italia View
VMUGIT UC 2013 - 05b Telecom Italia ViewVMUGIT UC 2013 - 05b Telecom Italia View
VMUGIT UC 2013 - 05b Telecom Italia View
 
2014 04-10 Presentazione Plenaria SIAT_short
2014 04-10 Presentazione Plenaria SIAT_short2014 04-10 Presentazione Plenaria SIAT_short
2014 04-10 Presentazione Plenaria SIAT_short
 
MySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQL
MySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQLMySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQL
MySQL Day Milano 2017 - Dalla replica a InnoDB Cluster: l’HA secondo MySQL
 

More from Andrea Gioia

Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdfKafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Andrea Gioia
 
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdfKAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
Andrea Gioia
 
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdfRipartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Andrea Gioia
 

More from Andrea Gioia (11)

DATA & DRINKS: Data Management Trends.pdf
DATA & DRINKS: Data Management Trends.pdfDATA & DRINKS: Data Management Trends.pdf
DATA & DRINKS: Data Management Trends.pdf
 
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdfKafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
 
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdfKAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
 
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdfRipartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
 
I Software passano, i Dati restano.pdf
I Software passano, i Dati restano.pdfI Software passano, i Dati restano.pdf
I Software passano, i Dati restano.pdf
 
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdfTHE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
 
How to integrate legacy systems within a modern polyglot and event driven arc...
How to integrate legacy systems within a modern polyglot and event driven arc...How to integrate legacy systems within a modern polyglot and event driven arc...
How to integrate legacy systems within a modern polyglot and event driven arc...
 
IT matters once again
IT matters once againIT matters once again
IT matters once again
 
Framework tecnologici per i Big Data: Data Lake & Data River
Framework tecnologici per i Big Data: Data Lake & Data RiverFramework tecnologici per i Big Data: Data Lake & Data River
Framework tecnologici per i Big Data: Data Lake & Data River
 
Open Source Location Intelligence with SpagoBI
Open Source Location Intelligence with SpagoBIOpen Source Location Intelligence with SpagoBI
Open Source Location Intelligence with SpagoBI
 
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
 

Fast data platforms - Hadoop User Group (Italy)