SlideShare a Scribd company logo
1 of 71
Download to read offline
Introducción a BigData
Universidad de Palermo 2015
Gabriel Eisbruch
Developer | Arquitecto | Data Nerd
gabrieleisbruch@gmail.com
@geisbruch
Que es BigData?
“
“Conjunto de herramientas destinadas a la
manipulación, gestión y análisis de
grandes volúmenes de datos y de tipos
variados
Entonces…
que son Grandes
Volúmenes de
Datos?
~455 PBEn todo su potencial
40000 NodosCluster mas grande 4500
113 Veces
30+ PBSon 61400 notebooks
2000+ Nodos
3.1 PBSon 100000 IPhones
180 Nodos
~ 4300 Cpu’s
Algo de Historia
Algo de
Historia
Aparición de
Internet
1995
Algo de
Historia
Aparición de
Internet
1995
Internet Boom
1998
Algo de
Historia
Aparición de
Internet
1995
Internet Boom
1998
Google Map
Reduce
2004
Algo de
Historia
Aparición de
Internet
1995
Internet Boom
1998
Google Map
Reduce
2004
Hadoop
2005
Algo de
Historia
Aparición de
Internet
1995
Internet Boom
1998
Google Map
Reduce
2004
Hadoop
2005
Netflix Prize
2009
Algo de
Historia
Aparición de
Internet
1995
Internet Boom
1998
Google Map
Reduce
2004
Hadoop
2005
Netflix Prize
2009
Nuevos
paradigmas e
IOT
2011 -> Hoy
Cuales fueron los FACTORES que ayudaron a este crecimiento?
Cuales fueron los FACTORES que ayudaron a este crecimiento?
Incremento de Usuarios e
información
Al aumentar la cantidad de
usuarios de internet y la
cantidad de acciones que
estos realizan sobre la web,
hubo una explosión de
información disponible que
no se estaba capitalizando
Cuales fueron los FACTORES que ayudaron a este crecimiento?
Incremento de Usuarios e
información
Al aumentar la cantidad de
usuarios de internet y la
cantidad de acciones que
estos realizan sobre la web,
hubo una explosión de
información disponible que
no se estaba capitalizando
Disminución de costos
Los costos de la tecnología
tienden usualmente a bajar,
en particular la disminución
de costos de
almacenamiento y
procesamiento impulsó a
BigData
Cuales fueron los FACTORES que ayudaron a este crecimiento?
Cuales fueron los FACTORES que ayudaron a este crecimiento?
Year
Average Cost Per
Gigabyte
2014 $0.03
2013 $0.05
2010 $0.09
2005 $1.24
2000 $11.00
Porque se volvio esto tan relevante para las Empresas?
Experiencia de usuario
Entender mejor al usuario
ayudar a mejorar las
experiencias de estos en las
empresas
Porque se volvio esto tan relevante para las Empresas?
Experiencia de usuario
Entender mejor al usuario
ayudar a mejorar las
experiencias de estos en las
empresas
Porque se volvio esto tan relevante para las Empresas?
Predicción
El aumento de los volúmenes
de datos y procesamientos
ayuda a las empresas a poder
hacer más y mejores
predicciones
Experiencia de usuario
Entender mejor al usuario
ayudar a mejorar las
experiencias de estos en las
empresas
Porque se volvio esto tan relevante para las Empresas?
Predicción
El aumento de los volúmenes
de datos y procesamientos
ayuda a las empresas a poder
hacer más y mejores
predicciones
Nuevos Mercados
Bigdata a generado nuevas
oportunidades y con esto
nuevos mercados para
empresas existentes o nuevas
Experiencia de usuario
Entender mejor al usuario
ayudar a mejorar las
experiencias de estos en las
empresas
Porque se volvio esto tan relevante para las Empresas?
Predicción
El aumento de los volúmenes
de datos y procesamientos
ayuda a las empresas a poder
hacer más y mejores
predicciones
Nuevos Mercados
Bigdata a generado nuevas
oportunidades y con esto
nuevos mercados para
empresas existentes o nuevas
Personalización
Ahora se puede lograr
personalizar mucho más los
productos basado en la
experiencia de los clientes de
una empresa
Experiencia de usuario
Entender mejor al usuario
ayudar a mejorar las
experiencias de estos en las
empresas
Porque se volvio esto tan relevante para las Empresas?
Predicción
El aumento de los volúmenes
de datos y procesamientos
ayuda a las empresas a poder
hacer más y mejores
predicciones
Nuevos Mercados
Bigdata a generado nuevas
oportunidades y con esto
nuevos mercados para
empresas existentes o nuevas
Personalización
Ahora se puede lograr
personalizar mucho más los
productos basado en la
experiencia de los clientes de
una empresa
Mejor comprensión del
negocio
Entender el negocio de la
compañía con la mayor
claridad posible es una clara
ventaja competitiva de las
organizaciones
Experiencia de usuario
Entender mejor al usuario
ayudar a mejorar las
experiencias de estos en las
empresas
Porque se volvio esto tan relevante para las Empresas?
Predicción
El aumento de los volúmenes
de datos y procesamientos
ayuda a las empresas a poder
hacer más y mejores
predicciones
Nuevos Mercados
Bigdata a generado nuevas
oportunidades y con esto
nuevos mercados para
empresas existentes o nuevas
Personalización
Ahora se puede lograr
personalizar mucho más los
productos basado en la
experiencia de los clientes de
una empresa
Mejor comprensión del
negocio
Entender el negocio de la
compañía con la mayor
claridad posible es una clara
ventaja competitiva de las
organizaciones
Surgimiento de “Data Lakes”
Las empresas ahora pueden
guardar información que a
priori no es importante para
que esté disponible en futuros
procesamientos
Porque se volvio esto tan relevante para las Empresas?
Porque se volvio esto tan relevante para las Empresas?
Porque se volvio esto tan relevante para las Empresas?
Porque se volvio esto tan relevante para las Empresas?
Cuál fue el
cambio
Tecnológico ?
Framework MapReduce
Paper publicado por google en
2004 que sentó las bases para
poder generar procesamiento
en paralelo de forma simple
MapReduce se basa en la estrategia de dividir y conquistar
MapReduce se basa en la estrategia de dividir y conquistar
Data
MapReduce se basa en la estrategia de dividir y conquistar
Data Map
MapReduce se basa en la estrategia de dividir y conquistar
Data Map
Candidato 1 -> 1
Candidato 2 -> 1
Candidato 1 -> 1
Candidato 4 -> 1
Candidato 1 -> 1
Candidato 4 -> 1
Candidato 4 -> 1
.
.
.
MapReduce se basa en la estrategia de dividir y conquistar
Candidato 1 = 100
Candidato 2 = 130
Candidato 3 = 200
Candidato 4 = 330
Data Map Reduce
Tecnologías de BigData a
nuestra disposición
ASPECTOS A
TENER EN
CUENTA
ASPECTOS A
TENER EN
CUENTA
Procesamiento
ASPECTOS A
TENER EN
CUENTA
Procesamiento
Almacenamiento
ASPECTOS A
TENER EN
CUENTA
Procesamiento
Tiempo
Almacenamiento
Almacenamiento
Distribuido
Hadoop HDFS brinda la
posibilidad de almacenar
archivos en forma
distribuida y redundante
Almacenamiento
Distribuido
Hadoop HDFS brinda la
posibilidad de almacenar
archivos en forma
distribuida y redundante
Procesamiento
Distribuido
Hadoop MapReduce
implementa la teoría de
mapreduce para poder dar
una forma simple de
procesar de forma
distribuida los datos
almacenados
Entorno
Sobre hadoop se han
formado construido
distintas herramientas que
permiten explotar explotar
nuevos dominios de los
datos y simplificar los
accesos
Almacenamiento
Distribuido
Hadoop HDFS brinda la
posibilidad de almacenar
archivos en forma
distribuida y redundante
Procesamiento
Distribuido
Hadoop MapReduce
implementa la teoría de
mapreduce para poder dar
una forma simple de
procesar de forma
distribuida los datos
almacenados
Simple Streaming
Storm está diseñado para
permitir procesar datos en
streaming de forma
distribuida liberando al
desarrollador de las
complejidades
subyacentes
Simple Streaming
Storm está diseñado para
permitir procesar datos en
streaming de forma
distribuida liberando al
desarrollador de las
complejidades
subyacentes
Arquitecturas Lambda
El creador de storm creó el
concepto conocido como
arquitectura lambda, que
tiene por concepto poder
trabajar con datos en
realtime y batch en forma
combinada y veloz de
forma escalable y tolerante
a fallas
Integración
Storm es una capa de
procesamiento muy
potente diseñada para
poder integrarse con
diversos sub-sistemas,
entre ellos sistemas de
queue streaming y hadoop
Simple Streaming
Storm está diseñado para
permitir procesar datos en
streaming de forma
distribuida liberando al
desarrollador de las
complejidades
subyacentes
Arquitecturas Lambda
El creador de storm creó el
concepto conocido como
arquitectura lambda, que
tiene por concepto poder
trabajar con datos en
realtime y batch en forma
combinada y veloz de
forma escalable y tolerante
a fallas
Simplicidad
Spark trae con sigo un
nuevo modelo de consultar
la información el cual
permite simplificar y
acelerar los
procesamientos que
usualmente llevan varias
etapas, haciendo esto en
un lenguaje simplificado
Hadoop
Spark se integra de forma
efectiva con el sistema de
almacenamiento de
hadoop y con el sistema
YARN de distribución de
tareas de hadoop
Simplicidad
Spark trae con sigo un
nuevo modelo de consultar
la información el cual
permite simplificar y
acelerar los
procesamientos que
usualmente llevan varias
etapas, haciendo esto en
un lenguaje simplificado
Streaming
Spark permite con el
mismo lenguaje que se
procesa información en
batch procesar datos en
streaming, separando para
esto la información
entrante en pequeños
“bloques”
Hadoop
Spark se integra de forma
efectiva con el sistema de
almacenamiento de
hadoop y con el sistema
YARN de distribución de
tareas de hadoop
Simplicidad
Spark trae con sigo un
nuevo modelo de consultar
la información el cual
permite simplificar y
acelerar los
procesamientos que
usualmente llevan varias
etapas, haciendo esto en
un lenguaje simplificado
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015

More Related Content

What's hot

Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsMundo Contact
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para DummiesStratebi
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big DataDavid Alayón
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales.. ..
 
69 claves para conocer Big Data
69 claves para conocer Big Data69 claves para conocer Big Data
69 claves para conocer Big DataStratebi
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Fernando Santamaría
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negociosnnakasone
 
Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Peter Kroll
 
Cómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónCómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónBEEVA_es
 
Jornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataJornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataUrko Zurutuza
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigDataKEEDIO
 

What's hot (20)

Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)Tendencias en Big Data (2015-2016)
Tendencias en Big Data (2015-2016)
 
Big data
Big dataBig data
Big data
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Big Data & RRHH
Big Data & RRHHBig Data & RRHH
Big Data & RRHH
 
Big Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big ResultsBig Data, Big Customer Value, Big Results
Big Data, Big Customer Value, Big Results
 
"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas"Casos de uso del Big Data" por Wolfram Rozas
"Casos de uso del Big Data" por Wolfram Rozas
 
Big Data para Dummies
Big Data para DummiesBig Data para Dummies
Big Data para Dummies
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Big data presentación
Big data presentaciónBig data presentación
Big data presentación
 
1 big data y redes sociales
1 big data y redes sociales1 big data y redes sociales
1 big data y redes sociales
 
69 claves para conocer Big Data
69 claves para conocer Big Data69 claves para conocer Big Data
69 claves para conocer Big Data
 
Big Data
Big DataBig Data
Big Data
 
Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)Educación y datos masivos (Big Data)
Educación y datos masivos (Big Data)
 
Iniciación al BiG Data - español
Iniciación al BiG Data - españolIniciación al BiG Data - español
Iniciación al BiG Data - español
 
Big data y la inteligencia de negocios
Big data y la inteligencia de negociosBig data y la inteligencia de negocios
Big data y la inteligencia de negocios
 
Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015
 
Cómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organizaciónCómo empezar a implementar proyectos Big Data en tu organización
Cómo empezar a implementar proyectos Big Data en tu organización
 
Jornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big DataJornada en enpresa digitala: Mitos y Realidades del Big Data
Jornada en enpresa digitala: Mitos y Realidades del Big Data
 
Obtención de Datos en #BigData
Obtención de Datos en #BigDataObtención de Datos en #BigData
Obtención de Datos en #BigData
 
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - BigData
 

Viewers also liked

Los nuevos retos: BigData, Internet of Things (IoT) y Deep Web
Los nuevos retos: BigData, Internet of Things (IoT) y Deep WebLos nuevos retos: BigData, Internet of Things (IoT) y Deep Web
Los nuevos retos: BigData, Internet of Things (IoT) y Deep WebEmilio del Prado
 
Evolucion de big data @ mercadolibre.com
Evolucion de big data @ mercadolibre.comEvolucion de big data @ mercadolibre.com
Evolucion de big data @ mercadolibre.comGabriel Eisbruch
 
Analítica avanzada y Big Data en el sector Transporte
Analítica avanzada y Big Data en el sector TransporteAnalítica avanzada y Big Data en el sector Transporte
Analítica avanzada y Big Data en el sector TransporteCLARA CAMPROVIN
 
Tecnocom Utilities
Tecnocom UtilitiesTecnocom Utilities
Tecnocom Utilitiesnovpatricio
 
Scientific Writing Barbara Janssens 2012
Scientific Writing Barbara Janssens 2012Scientific Writing Barbara Janssens 2012
Scientific Writing Barbara Janssens 2012Barbara Janssens
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata
 
Llegando a la Industria 4.0 a través del IoT
Llegando a la Industria 4.0 a través del IoTLlegando a la Industria 4.0 a través del IoT
Llegando a la Industria 4.0 a través del IoTBruno Cendón
 
NoSQL databases, the CAP theorem, and the theory of relativity
NoSQL databases, the CAP theorem, and the theory of relativityNoSQL databases, the CAP theorem, and the theory of relativity
NoSQL databases, the CAP theorem, and the theory of relativityLars Marius Garshol
 
Internet de las cosas y Big Data. Los pilares de la cuarta revolución industrial
Internet de las cosas y Big Data. Los pilares de la cuarta revolución industrialInternet de las cosas y Big Data. Los pilares de la cuarta revolución industrial
Internet de las cosas y Big Data. Los pilares de la cuarta revolución industrialLuis Joyanes
 
Protocolos de comunicación para PLCs
Protocolos de comunicación para PLCsProtocolos de comunicación para PLCs
Protocolos de comunicación para PLCsUDO Monagas
 
Introducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistIntroducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistCarlos Toxtli
 
Magento scalability from the trenches (Meet Magento Sweden 2016)
Magento scalability from the trenches (Meet Magento Sweden 2016)Magento scalability from the trenches (Meet Magento Sweden 2016)
Magento scalability from the trenches (Meet Magento Sweden 2016)Divante
 
The Gartner IAM Program Maturity Model
The Gartner IAM Program Maturity ModelThe Gartner IAM Program Maturity Model
The Gartner IAM Program Maturity ModelSarah Moore
 
50 Powerful Statistics About Tech Mega Trends Affecting Every Business
50 Powerful Statistics About Tech Mega Trends Affecting Every Business50 Powerful Statistics About Tech Mega Trends Affecting Every Business
50 Powerful Statistics About Tech Mega Trends Affecting Every BusinessVala Afshar
 
Big Data - 25 Amazing Facts Everyone Should Know
Big Data - 25 Amazing Facts Everyone Should KnowBig Data - 25 Amazing Facts Everyone Should Know
Big Data - 25 Amazing Facts Everyone Should KnowBernard Marr
 

Viewers also liked (19)

Los nuevos retos: BigData, Internet of Things (IoT) y Deep Web
Los nuevos retos: BigData, Internet of Things (IoT) y Deep WebLos nuevos retos: BigData, Internet of Things (IoT) y Deep Web
Los nuevos retos: BigData, Internet of Things (IoT) y Deep Web
 
Evolucion de big data @ mercadolibre.com
Evolucion de big data @ mercadolibre.comEvolucion de big data @ mercadolibre.com
Evolucion de big data @ mercadolibre.com
 
Analítica avanzada y Big Data en el sector Transporte
Analítica avanzada y Big Data en el sector TransporteAnalítica avanzada y Big Data en el sector Transporte
Analítica avanzada y Big Data en el sector Transporte
 
Tecnocom Utilities
Tecnocom UtilitiesTecnocom Utilities
Tecnocom Utilities
 
¿Qué es IB LOGISTIC?
¿Qué es IB LOGISTIC?¿Qué es IB LOGISTIC?
¿Qué es IB LOGISTIC?
 
Scientific Writing Barbara Janssens 2012
Scientific Writing Barbara Janssens 2012Scientific Writing Barbara Janssens 2012
Scientific Writing Barbara Janssens 2012
 
Big data
Big dataBig data
Big data
 
Exploradata - A new BigData Company
Exploradata - A new BigData CompanyExploradata - A new BigData Company
Exploradata - A new BigData Company
 
Llegando a la Industria 4.0 a través del IoT
Llegando a la Industria 4.0 a través del IoTLlegando a la Industria 4.0 a través del IoT
Llegando a la Industria 4.0 a través del IoT
 
NoSQL databases, the CAP theorem, and the theory of relativity
NoSQL databases, the CAP theorem, and the theory of relativityNoSQL databases, the CAP theorem, and the theory of relativity
NoSQL databases, the CAP theorem, and the theory of relativity
 
Internet de las cosas y Big Data. Los pilares de la cuarta revolución industrial
Internet de las cosas y Big Data. Los pilares de la cuarta revolución industrialInternet de las cosas y Big Data. Los pilares de la cuarta revolución industrial
Internet de las cosas y Big Data. Los pilares de la cuarta revolución industrial
 
Protocolos de comunicación para PLCs
Protocolos de comunicación para PLCsProtocolos de comunicación para PLCs
Protocolos de comunicación para PLCs
 
Introducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientistIntroducción a data science, la guía práctica para volverse data scientist
Introducción a data science, la guía práctica para volverse data scientist
 
Magento scalability from the trenches (Meet Magento Sweden 2016)
Magento scalability from the trenches (Meet Magento Sweden 2016)Magento scalability from the trenches (Meet Magento Sweden 2016)
Magento scalability from the trenches (Meet Magento Sweden 2016)
 
The Gartner IAM Program Maturity Model
The Gartner IAM Program Maturity ModelThe Gartner IAM Program Maturity Model
The Gartner IAM Program Maturity Model
 
50 Powerful Statistics About Tech Mega Trends Affecting Every Business
50 Powerful Statistics About Tech Mega Trends Affecting Every Business50 Powerful Statistics About Tech Mega Trends Affecting Every Business
50 Powerful Statistics About Tech Mega Trends Affecting Every Business
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 
Big Data - 25 Amazing Facts Everyone Should Know
Big Data - 25 Amazing Facts Everyone Should KnowBig Data - 25 Amazing Facts Everyone Should Know
Big Data - 25 Amazing Facts Everyone Should Know
 

Similar to Introducción a BigData - up - 2015

Azure | Digital Transformation with Azure Overview - 16/11/2017
Azure | Digital Transformation with Azure Overview - 16/11/2017Azure | Digital Transformation with Azure Overview - 16/11/2017
Azure | Digital Transformation with Azure Overview - 16/11/2017Pablo Ariel Di Loreto
 
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Dell EMC
 
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...COIICV
 
¿Cuál es el futuro de la estrategia de datos?
¿Cuál es el futuro de la estrategia de datos?¿Cuál es el futuro de la estrategia de datos?
¿Cuál es el futuro de la estrategia de datos?Denodo
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)pmluque
 
Consultor de Negocios
Consultor de NegociosConsultor de Negocios
Consultor de NegociosDiana García
 
CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosJohn Bulla
 
Simplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel GonzálezSimplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel GonzálezBusinessConnect2017
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Joseph Lopez
 
Cloud Computing & Big Data
Cloud Computing & Big DataCloud Computing & Big Data
Cloud Computing & Big DataGlobant
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 
NetApp permite que la TI sea más flexible, eficiente y que esté más preparad...
 NetApp permite que la TI sea más flexible, eficiente y que esté más preparad... NetApp permite que la TI sea más flexible, eficiente y que esté más preparad...
NetApp permite que la TI sea más flexible, eficiente y que esté más preparad...elcontact.com
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesStratebi
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerEduardo Castro
 

Similar to Introducción a BigData - up - 2015 (20)

Azure | Digital Transformation with Azure Overview - 16/11/2017
Azure | Digital Transformation with Azure Overview - 16/11/2017Azure | Digital Transformation with Azure Overview - 16/11/2017
Azure | Digital Transformation with Azure Overview - 16/11/2017
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
Cbs big data-fundamentals-1
Cbs big data-fundamentals-1Cbs big data-fundamentals-1
Cbs big data-fundamentals-1
 
BigData
BigDataBigData
BigData
 
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
 
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
 
¿Cuál es el futuro de la estrategia de datos?
¿Cuál es el futuro de la estrategia de datos?¿Cuál es el futuro de la estrategia de datos?
¿Cuál es el futuro de la estrategia de datos?
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
BIG DATA en CLOUD PaaS para Internet de las Cosas (IoT)
 
Consultor de Negocios
Consultor de NegociosConsultor de Negocios
Consultor de Negocios
 
CloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datosCloudCamp - Big Data – La revolución de los datos
CloudCamp - Big Data – La revolución de los datos
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
 
Simplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel GonzálezSimplificando el uso de los datos para la era cognitiva - Daniel González
Simplificando el uso de los datos para la era cognitiva - Daniel González
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
 
Cloud Computing & Big Data
Cloud Computing & Big DataCloud Computing & Big Data
Cloud Computing & Big Data
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
NetApp permite que la TI sea más flexible, eficiente y que esté más preparad...
 NetApp permite que la TI sea más flexible, eficiente y que esté más preparad... NetApp permite que la TI sea más flexible, eficiente y que esté más preparad...
NetApp permite que la TI sea más flexible, eficiente y que esté más preparad...
 
BIG DATA SAP
BIG DATA SAPBIG DATA SAP
BIG DATA SAP
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 
SQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight ServerSQL Saturday Bogota - Big Data HDInsight Server
SQL Saturday Bogota - Big Data HDInsight Server
 

Recently uploaded

Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptMiguelAtencio10
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELmaryfer27m
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..RobertoGumucio2
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaarkananubis
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxAlexander López
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxMariaBurgos55
 

Recently uploaded (20)

Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
dokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.pptdokumen.tips_36274588-sistema-heui-eui.ppt
dokumen.tips_36274588-sistema-heui-eui.ppt
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
El uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFELEl uso delas tic en la vida cotidiana MFEL
El uso delas tic en la vida cotidiana MFEL
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..Plan Sarmiento - Netbook del GCBA 2019..
Plan Sarmiento - Netbook del GCBA 2019..
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
R1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en minaR1600G CAT Variables de cargadores en mina
R1600G CAT Variables de cargadores en mina
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptx
 

Introducción a BigData - up - 2015

  • 2. Gabriel Eisbruch Developer | Arquitecto | Data Nerd gabrieleisbruch@gmail.com @geisbruch
  • 4.
  • 5. “Conjunto de herramientas destinadas a la manipulación, gestión y análisis de grandes volúmenes de datos y de tipos variados
  • 7. ~455 PBEn todo su potencial 40000 NodosCluster mas grande 4500
  • 9. 30+ PBSon 61400 notebooks 2000+ Nodos
  • 10. 3.1 PBSon 100000 IPhones 180 Nodos ~ 4300 Cpu’s
  • 14. Algo de Historia Aparición de Internet 1995 Internet Boom 1998 Google Map Reduce 2004
  • 15. Algo de Historia Aparición de Internet 1995 Internet Boom 1998 Google Map Reduce 2004 Hadoop 2005
  • 16. Algo de Historia Aparición de Internet 1995 Internet Boom 1998 Google Map Reduce 2004 Hadoop 2005 Netflix Prize 2009
  • 17. Algo de Historia Aparición de Internet 1995 Internet Boom 1998 Google Map Reduce 2004 Hadoop 2005 Netflix Prize 2009 Nuevos paradigmas e IOT 2011 -> Hoy
  • 18. Cuales fueron los FACTORES que ayudaron a este crecimiento?
  • 19. Cuales fueron los FACTORES que ayudaron a este crecimiento? Incremento de Usuarios e información Al aumentar la cantidad de usuarios de internet y la cantidad de acciones que estos realizan sobre la web, hubo una explosión de información disponible que no se estaba capitalizando
  • 20. Cuales fueron los FACTORES que ayudaron a este crecimiento? Incremento de Usuarios e información Al aumentar la cantidad de usuarios de internet y la cantidad de acciones que estos realizan sobre la web, hubo una explosión de información disponible que no se estaba capitalizando Disminución de costos Los costos de la tecnología tienden usualmente a bajar, en particular la disminución de costos de almacenamiento y procesamiento impulsó a BigData
  • 21. Cuales fueron los FACTORES que ayudaron a este crecimiento?
  • 22. Cuales fueron los FACTORES que ayudaron a este crecimiento? Year Average Cost Per Gigabyte 2014 $0.03 2013 $0.05 2010 $0.09 2005 $1.24 2000 $11.00
  • 23. Porque se volvio esto tan relevante para las Empresas?
  • 24. Experiencia de usuario Entender mejor al usuario ayudar a mejorar las experiencias de estos en las empresas Porque se volvio esto tan relevante para las Empresas?
  • 25. Experiencia de usuario Entender mejor al usuario ayudar a mejorar las experiencias de estos en las empresas Porque se volvio esto tan relevante para las Empresas? Predicción El aumento de los volúmenes de datos y procesamientos ayuda a las empresas a poder hacer más y mejores predicciones
  • 26. Experiencia de usuario Entender mejor al usuario ayudar a mejorar las experiencias de estos en las empresas Porque se volvio esto tan relevante para las Empresas? Predicción El aumento de los volúmenes de datos y procesamientos ayuda a las empresas a poder hacer más y mejores predicciones Nuevos Mercados Bigdata a generado nuevas oportunidades y con esto nuevos mercados para empresas existentes o nuevas
  • 27. Experiencia de usuario Entender mejor al usuario ayudar a mejorar las experiencias de estos en las empresas Porque se volvio esto tan relevante para las Empresas? Predicción El aumento de los volúmenes de datos y procesamientos ayuda a las empresas a poder hacer más y mejores predicciones Nuevos Mercados Bigdata a generado nuevas oportunidades y con esto nuevos mercados para empresas existentes o nuevas Personalización Ahora se puede lograr personalizar mucho más los productos basado en la experiencia de los clientes de una empresa
  • 28. Experiencia de usuario Entender mejor al usuario ayudar a mejorar las experiencias de estos en las empresas Porque se volvio esto tan relevante para las Empresas? Predicción El aumento de los volúmenes de datos y procesamientos ayuda a las empresas a poder hacer más y mejores predicciones Nuevos Mercados Bigdata a generado nuevas oportunidades y con esto nuevos mercados para empresas existentes o nuevas Personalización Ahora se puede lograr personalizar mucho más los productos basado en la experiencia de los clientes de una empresa Mejor comprensión del negocio Entender el negocio de la compañía con la mayor claridad posible es una clara ventaja competitiva de las organizaciones
  • 29. Experiencia de usuario Entender mejor al usuario ayudar a mejorar las experiencias de estos en las empresas Porque se volvio esto tan relevante para las Empresas? Predicción El aumento de los volúmenes de datos y procesamientos ayuda a las empresas a poder hacer más y mejores predicciones Nuevos Mercados Bigdata a generado nuevas oportunidades y con esto nuevos mercados para empresas existentes o nuevas Personalización Ahora se puede lograr personalizar mucho más los productos basado en la experiencia de los clientes de una empresa Mejor comprensión del negocio Entender el negocio de la compañía con la mayor claridad posible es una clara ventaja competitiva de las organizaciones Surgimiento de “Data Lakes” Las empresas ahora pueden guardar información que a priori no es importante para que esté disponible en futuros procesamientos
  • 30. Porque se volvio esto tan relevante para las Empresas?
  • 31. Porque se volvio esto tan relevante para las Empresas?
  • 32. Porque se volvio esto tan relevante para las Empresas?
  • 33. Porque se volvio esto tan relevante para las Empresas?
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47. Framework MapReduce Paper publicado por google en 2004 que sentó las bases para poder generar procesamiento en paralelo de forma simple
  • 48. MapReduce se basa en la estrategia de dividir y conquistar
  • 49. MapReduce se basa en la estrategia de dividir y conquistar Data
  • 50. MapReduce se basa en la estrategia de dividir y conquistar Data Map
  • 51. MapReduce se basa en la estrategia de dividir y conquistar Data Map Candidato 1 -> 1 Candidato 2 -> 1 Candidato 1 -> 1 Candidato 4 -> 1 Candidato 1 -> 1 Candidato 4 -> 1 Candidato 4 -> 1 . . .
  • 52. MapReduce se basa en la estrategia de dividir y conquistar Candidato 1 = 100 Candidato 2 = 130 Candidato 3 = 200 Candidato 4 = 330 Data Map Reduce
  • 53. Tecnologías de BigData a nuestra disposición
  • 58.
  • 59. Almacenamiento Distribuido Hadoop HDFS brinda la posibilidad de almacenar archivos en forma distribuida y redundante
  • 60. Almacenamiento Distribuido Hadoop HDFS brinda la posibilidad de almacenar archivos en forma distribuida y redundante Procesamiento Distribuido Hadoop MapReduce implementa la teoría de mapreduce para poder dar una forma simple de procesar de forma distribuida los datos almacenados
  • 61. Entorno Sobre hadoop se han formado construido distintas herramientas que permiten explotar explotar nuevos dominios de los datos y simplificar los accesos Almacenamiento Distribuido Hadoop HDFS brinda la posibilidad de almacenar archivos en forma distribuida y redundante Procesamiento Distribuido Hadoop MapReduce implementa la teoría de mapreduce para poder dar una forma simple de procesar de forma distribuida los datos almacenados
  • 62.
  • 63. Simple Streaming Storm está diseñado para permitir procesar datos en streaming de forma distribuida liberando al desarrollador de las complejidades subyacentes
  • 64. Simple Streaming Storm está diseñado para permitir procesar datos en streaming de forma distribuida liberando al desarrollador de las complejidades subyacentes Arquitecturas Lambda El creador de storm creó el concepto conocido como arquitectura lambda, que tiene por concepto poder trabajar con datos en realtime y batch en forma combinada y veloz de forma escalable y tolerante a fallas
  • 65. Integración Storm es una capa de procesamiento muy potente diseñada para poder integrarse con diversos sub-sistemas, entre ellos sistemas de queue streaming y hadoop Simple Streaming Storm está diseñado para permitir procesar datos en streaming de forma distribuida liberando al desarrollador de las complejidades subyacentes Arquitecturas Lambda El creador de storm creó el concepto conocido como arquitectura lambda, que tiene por concepto poder trabajar con datos en realtime y batch en forma combinada y veloz de forma escalable y tolerante a fallas
  • 66.
  • 67. Simplicidad Spark trae con sigo un nuevo modelo de consultar la información el cual permite simplificar y acelerar los procesamientos que usualmente llevan varias etapas, haciendo esto en un lenguaje simplificado
  • 68. Hadoop Spark se integra de forma efectiva con el sistema de almacenamiento de hadoop y con el sistema YARN de distribución de tareas de hadoop Simplicidad Spark trae con sigo un nuevo modelo de consultar la información el cual permite simplificar y acelerar los procesamientos que usualmente llevan varias etapas, haciendo esto en un lenguaje simplificado
  • 69. Streaming Spark permite con el mismo lenguaje que se procesa información en batch procesar datos en streaming, separando para esto la información entrante en pequeños “bloques” Hadoop Spark se integra de forma efectiva con el sistema de almacenamiento de hadoop y con el sistema YARN de distribución de tareas de hadoop Simplicidad Spark trae con sigo un nuevo modelo de consultar la información el cual permite simplificar y acelerar los procesamientos que usualmente llevan varias etapas, haciendo esto en un lenguaje simplificado