SlideShare a Scribd company logo
1 of 37
Download to read offline
Big Data –La revolución de los datos 
John Alexander Bulla Torres 
SQL Server MVP 
Microsoft Azure
Big Data Insights 
@johnbulla 
bit.ly/johnbulla 
linkedin.com/in/johnbulla
Agenda 
¿Por que Big Data? 
Conceptos Básicos 
Microsoft y Hadoop
¿Por que Big Data? 
Microsoft Azure
Tendencias Claves 
Microsoft Azure
Big Data –La revolución en los datos 
6 
Los datosdigitalescrecerán40xpróximadécada 
En 2015, serviciosde nubepúblicatendrán46% de crecimientonetoen gastode ti 
Microsoft Azure
Big Data analytics 
Microsoft Azure
¿Qué es Big Data? 
"Big data" es un término aplicado a conjuntos de datos que superan la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable. 
Microsoft Azure
¿Qué es Big Data? 
Big data es una colección de conjuntos de datos tan grande y complejo que se vuelve difícil para trabajar con el uso de herramientas de gestión de base de datos tradicionales. Las dificultades incluyen la captura, almacenamiento, búsqueda, intercambio, análisis y visualización. 
Fuente: Eduardo Castro MVP –SQL Saturday #247 Bogotá 
Microsoft Azure
¿Qué es Big Data? 
Big Data: “ Barreras para que una organización o equipo puedan almacenar, procesar y acceder todos los datos que necesitan para operar con eficiencia, tomar decisiones, reducir riesgos, etc.” 
Fuente: SolidQ 
Microsoft Azure
¿Qué es Big Data? 
Volumen 
Velocidad 
Variedad 
Variabilidad 
Microsoft Azure
Internet of Things 
Audio / Video 
Log Files 
Text/Image 
Social Sentiment 
Data Market Feeds 
eGov Feeds 
Weather 
Wikis / Blogs 
Click Stream 
Sensors / RFID / Devices 
Spatial & GPS Coordinates 
Modern Web 
Mobile 
Advertising 
Collaboration 
eCommerce 
Digital Marketing 
Search Marketing 
Web Logs 
Recommendations 
ERP / CRM 
Sales Pipeline 
Payables 
Payroll 
Inventory 
Contacts 
Deal Tracking 
Terabytes 
(10e12) 
Gigabytes 
(10e9) 
Exabytes 
(10e18) 
Petabytes 
(10e15) 
Velocidad | Variedad | Variabilidad 
Volumen 
ERP / CRM 
Modern Web 
Internet of Things 
¿Qué es Big Data? 
Microsoft Azure 
(kB)10e3 
(MB)10e6 
(GB)10e9 
(TB)10e12 
(PB)10e15 
(EB)10e18 
(ZB)10e21 
(YB)10e24
Ejemplos de Big Data 
12 Tb 
día 
21 Pb 
Hadoop 
cluster 
7 Pb 
mes 
1 Tb 
tweets/dia 
75 Million 
scores/day 
14 Tb 
Hadoop 
cluster 
4 Billion 
Graph edg/day 
7 Tb 
datos/dia 
Microsoft Azure
Escenariosde Business Analytics 
•Análisis sencillo de gran cantidad de datos no estructurados: Microsoft HDInsight 
•Análisis sencillo de datos en memoria: Microsoft StreamInsight 
•Análisis en profundidad: SQL Server y Self-Service BI 
16 
Microsoft Azure
Flujodedatos de un tradicionalE-Commerce
Nuevo flujo de Big Data de un E-Commerce 
¿Cuántasvistasparaciertos 
productosaumentancuando 
nuestros 
anunciosse ven en TV?
Conceptos básicos 
Microsoft Azure
Características de Big Data
¿Qué es Hadoop? 
•Plataforma de almacenamiento de datos y análisis para Big Data 
•Open Source 
•Optimizado para manejar 
•Datos masivos a través de paralelismo 
•Variedad de datos (Estructurados, No-estructurados, Menos estructurados) 
•Uso de hardware económico 
•No para OLTP / OLAP 21
¿Qué es HDInsight? 
•Proyecto Isotope 
•HDInsight es la distribución de Microsoft de Apache Hadoop que se ejecuta en Windows. 
•On premise: Instalación en Windows Server 
•Cloud: Despliegue en la nube Microsoft Azure 
22
RDBMS vs. Hadoop
Distributed Storage 
(HDFS) 
Query 
(Hive) 
Distributed Processing 
(MapReduce) ODBC 
Legend 
■Core Hadoop 
■Data processing 
■Data Movement 
■Packages 
EcosistemaHadoop
Hadoop Core + 
Hive, Pig, HBase 
C#, F#, .NET 
Azure Storage (WASB) 
Office 365 Power BI (Excel, PowerQuery, PowerView, 
BI Sites) 
World's Data (Azure Data Marketplace) 
HDInsighty Hadoop 
ODBC 
Sqoopfor SQL Server 
PowerShell
HDInsight y Hadoop 
HDFS 
Map Reduce 
Pig Hive 
Sqoop 
Mahout Pegasus Flume 
JDBC 
Hive ODBC 
Microsoft Azure & Windows Server 
Microsoft 
BI 
Platform
Ofertas detalladas
Programando HDInsight 
Hive, Pig, Mahout, Pegasus… 
C#, F# Map/Reduce, Microsoft .NET management clients 
PowerShell, cross-platform CLI tools
Ejemplos HiveQL 
•Crear una Tabla Externa 
31 
Microsoft Azure 
CREATE EXTERNAL TABLE iislogs( 
sdatestring, stimestring, ssitenamestring, csmethodstring, csuristemstring, csuriquerystring, sport int, scstatusint, scbytesint, sbytesint, timetakenint) 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ' ' 
LOCATION 
'wasb://iis-logs@myapp.blob.core.windows.net/' selectsdate,stime,csmethod,scuristem,query_params['api-version'] asapi_version, query_params['search_value'] assearch_valuefrom (select*,str_to_map(csuriquery,'&','=')asquery_paramsfromiislogs) version_logswherequery_params['api-version'] isnotnull 
•Ejecutar un query para retornar datos
Demo 
HDInsightenMicrosoft Azure
LibroGratis de Microsoft Azure HDInsight 
•Download the PDF (6.37 MB; 130 pages) 
http://aka.ms/IntroHDInsight/PDF 
•Download the EPUB (8.46 MB) 
http://aka.ms/IntroHDInsight/EPUB 
•Download the MOBI (12.8 MB) 
http://aka.ms/IntroHDInsight/MOBI 
Recursos
24 Horas PASS en Español 
http://bit.ly/24hopes2014 
40
41
Big Data Insights 
@johnbulla 
bit.ly/johnbulla 
linkedin.com/in/johnbulla
CloudCamp - Big Data – La revolución de los datos

More Related Content

What's hot

Arquitectura a escala
Arquitectura a escalaArquitectura a escala
Arquitectura a escalaElasticsearch
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIsBig Data Spain
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Eduardo Castro
 
Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905
Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905
Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905Germán Cayo Morales
 
DocumentDB la base de datos NoSql de Microsoft Azure
DocumentDB la base de datos NoSql de Microsoft AzureDocumentDB la base de datos NoSql de Microsoft Azure
DocumentDB la base de datos NoSql de Microsoft AzureGustavo Alzate Sandoval
 
Enterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudEnterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudRaul Martin Sarachaga Diaz
 
Bases NoSQL y su implementación con Azure DocumentDB
Bases NoSQL y su implementación con Azure DocumentDBBases NoSQL y su implementación con Azure DocumentDB
Bases NoSQL y su implementación con Azure DocumentDBJulito Avellaneda
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataSpanishPASSVC
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryRaul Martin Sarachaga Diaz
 
Presentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datos
Presentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datosPresentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datos
Presentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datosImma Valls Bernaus
 
Primeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid MeetupPrimeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid Meetupdhiguero
 
Seminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con AtlasSeminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con AtlasMongoDB
 
Azure CosmosDB @ NETConf AR 2017
Azure CosmosDB @ NETConf AR 2017Azure CosmosDB @ NETConf AR 2017
Azure CosmosDB @ NETConf AR 2017Matias Quaranta
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseJoseph Lopez
 

What's hot (20)

Arquitectura a escala
Arquitectura a escalaArquitectura a escala
Arquitectura a escala
 
Big Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data LakeBig Data en Azure: Azure Data Lake
Big Data en Azure: Azure Data Lake
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2Que hay de nuevo en el Azure Data Lake Storage Gen2
Que hay de nuevo en el Azure Data Lake Storage Gen2
 
Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905
Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905
Arquitectura Data Warehousing PaaS de Azure #sqlsatbi905
 
DocumentDB la base de datos NoSql de Microsoft Azure
DocumentDB la base de datos NoSql de Microsoft AzureDocumentDB la base de datos NoSql de Microsoft Azure
DocumentDB la base de datos NoSql de Microsoft Azure
 
Enterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the CloudEnterprise Ready Data Warehousing in the Cloud
Enterprise Ready Data Warehousing in the Cloud
 
Big data, Hadoop, HDInsight
Big data, Hadoop, HDInsightBig data, Hadoop, HDInsight
Big data, Hadoop, HDInsight
 
Bases NoSQL y su implementación con Azure DocumentDB
Bases NoSQL y su implementación con Azure DocumentDBBases NoSQL y su implementación con Azure DocumentDB
Bases NoSQL y su implementación con Azure DocumentDB
 
Trabajo bdl
Trabajo bdlTrabajo bdl
Trabajo bdl
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big data
 
Presentación taller aplicaciones
Presentación  taller aplicacionesPresentación  taller aplicaciones
Presentación taller aplicaciones
 
AWS en Español
AWS en EspañolAWS en Español
AWS en Español
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data Factory
 
Presentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datos
Presentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datosPresentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datos
Presentación de Kibana Lens: Una forma fácil e intuitiva de visualizar los datos
 
Primeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid MeetupPrimeros pasos con Apache Spark - Madrid Meetup
Primeros pasos con Apache Spark - Madrid Meetup
 
Seminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con AtlasSeminario web: Simplificando el uso de su base de datos con Atlas
Seminario web: Simplificando el uso de su base de datos con Atlas
 
Azure CosmosDB @ NETConf AR 2017
Azure CosmosDB @ NETConf AR 2017Azure CosmosDB @ NETConf AR 2017
Azure CosmosDB @ NETConf AR 2017
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
Html5 Java Script Apis
Html5 Java Script ApisHtml5 Java Script Apis
Html5 Java Script Apis
 

Viewers also liked

4 organizacija-i-vlasnicka-struktura
4 organizacija-i-vlasnicka-struktura4 organizacija-i-vlasnicka-struktura
4 organizacija-i-vlasnicka-strukturaVladimir Stanković
 
VRとわたし
VRとわたしVRとわたし
VRとわたしJun Iio
 
Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017)
Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017) Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017)
Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017) Alexander Litvinenko
 
Definitive casts and dies
Definitive casts and diesDefinitive casts and dies
Definitive casts and dieshesham1964
 
Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...
Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...
Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...Alexander Litvinenko
 
How to find User Intent Changes for Google SEO
How to find User Intent Changes for Google SEOHow to find User Intent Changes for Google SEO
How to find User Intent Changes for Google SEOJameson (Jack) Treseler
 
Azure sql database escalabilidad
Azure sql database escalabilidadAzure sql database escalabilidad
Azure sql database escalabilidadEduardo Castro
 
Beyond the Gig Economy
Beyond the Gig EconomyBeyond the Gig Economy
Beyond the Gig EconomyJon Lieber
 
Recovery: Job Growth and Education Requirements Through 2020
Recovery: Job Growth and Education Requirements Through 2020Recovery: Job Growth and Education Requirements Through 2020
Recovery: Job Growth and Education Requirements Through 2020CEW Georgetown
 
3 hard facts shaping higher education thinking and behavior
3 hard facts shaping higher education thinking and behavior3 hard facts shaping higher education thinking and behavior
3 hard facts shaping higher education thinking and behaviorGrant Thornton LLP
 
African Americans: College Majors and Earnings
African Americans: College Majors and Earnings African Americans: College Majors and Earnings
African Americans: College Majors and Earnings CEW Georgetown
 
Game Based Learning for Language Learners
Game Based Learning for Language LearnersGame Based Learning for Language Learners
Game Based Learning for Language LearnersShelly Sanchez Terrell
 
What's Trending in Talent and Learning for 2016?
What's Trending in Talent and Learning for 2016?What's Trending in Talent and Learning for 2016?
What's Trending in Talent and Learning for 2016?Skillsoft
 
SXSW 2016 takeaways
SXSW 2016 takeawaysSXSW 2016 takeaways
SXSW 2016 takeawaysHavas
 
SXSW 2016: The Need To Knows
SXSW 2016: The Need To KnowsSXSW 2016: The Need To Knows
SXSW 2016: The Need To KnowsOgilvy Consulting
 
The French Revolution of 1789
The French Revolution of 1789The French Revolution of 1789
The French Revolution of 1789Tom Richey
 
Digitized Student Development, Social Media, and Identity
Digitized Student Development, Social Media, and IdentityDigitized Student Development, Social Media, and Identity
Digitized Student Development, Social Media, and IdentityPaul Brown
 
8 Tips for Scaling Mobile Users in China by Edith Yeung
8 Tips for Scaling Mobile Users in China by Edith Yeung8 Tips for Scaling Mobile Users in China by Edith Yeung
8 Tips for Scaling Mobile Users in China by Edith YeungEdith Yeung
 

Viewers also liked (20)

4 organizacija-i-vlasnicka-struktura
4 organizacija-i-vlasnicka-struktura4 organizacija-i-vlasnicka-struktura
4 organizacija-i-vlasnicka-struktura
 
VRとわたし
VRとわたしVRとわたし
VRとわたし
 
Why cuba trade delegation
Why cuba trade delegationWhy cuba trade delegation
Why cuba trade delegation
 
Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017)
Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017) Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017)
Low-rank methods for analysis of high-dimensional data (SIAM CSE talk 2017)
 
Definitive casts and dies
Definitive casts and diesDefinitive casts and dies
Definitive casts and dies
 
Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...
Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...
Tensor Completion for PDEs with uncertain coefficients and Bayesian Update te...
 
02 brojni sistemi
02 brojni sistemi02 brojni sistemi
02 brojni sistemi
 
How to find User Intent Changes for Google SEO
How to find User Intent Changes for Google SEOHow to find User Intent Changes for Google SEO
How to find User Intent Changes for Google SEO
 
Azure sql database escalabilidad
Azure sql database escalabilidadAzure sql database escalabilidad
Azure sql database escalabilidad
 
Beyond the Gig Economy
Beyond the Gig EconomyBeyond the Gig Economy
Beyond the Gig Economy
 
Recovery: Job Growth and Education Requirements Through 2020
Recovery: Job Growth and Education Requirements Through 2020Recovery: Job Growth and Education Requirements Through 2020
Recovery: Job Growth and Education Requirements Through 2020
 
3 hard facts shaping higher education thinking and behavior
3 hard facts shaping higher education thinking and behavior3 hard facts shaping higher education thinking and behavior
3 hard facts shaping higher education thinking and behavior
 
African Americans: College Majors and Earnings
African Americans: College Majors and Earnings African Americans: College Majors and Earnings
African Americans: College Majors and Earnings
 
Game Based Learning for Language Learners
Game Based Learning for Language LearnersGame Based Learning for Language Learners
Game Based Learning for Language Learners
 
What's Trending in Talent and Learning for 2016?
What's Trending in Talent and Learning for 2016?What's Trending in Talent and Learning for 2016?
What's Trending in Talent and Learning for 2016?
 
SXSW 2016 takeaways
SXSW 2016 takeawaysSXSW 2016 takeaways
SXSW 2016 takeaways
 
SXSW 2016: The Need To Knows
SXSW 2016: The Need To KnowsSXSW 2016: The Need To Knows
SXSW 2016: The Need To Knows
 
The French Revolution of 1789
The French Revolution of 1789The French Revolution of 1789
The French Revolution of 1789
 
Digitized Student Development, Social Media, and Identity
Digitized Student Development, Social Media, and IdentityDigitized Student Development, Social Media, and Identity
Digitized Student Development, Social Media, and Identity
 
8 Tips for Scaling Mobile Users in China by Edith Yeung
8 Tips for Scaling Mobile Users in China by Edith Yeung8 Tips for Scaling Mobile Users in China by Edith Yeung
8 Tips for Scaling Mobile Users in China by Edith Yeung
 

Similar to CloudCamp - Big Data – La revolución de los datos

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Joseph Lopez
 
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATAExpert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATAJohn Bulla
 
Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!Joseph Lopez
 
Análisis de datos con HD Insight
Análisis de datos con HD InsightAnálisis de datos con HD Insight
Análisis de datos con HD InsightEduardo Castro
 
Microsoft Business Analytics 2013
Microsoft Business Analytics 2013Microsoft Business Analytics 2013
Microsoft Business Analytics 2013Joseph Lopez
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQSolidQ
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big DataStratebi
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Gabriel Eisbruch
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big datamateo luquez
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Pedro Contreras Flores
 
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Dell EMC
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Joseph Lopez
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopEduardo Castro
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Denodo
 
Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Peter Kroll
 
Microsoft Azure Data Environment
Microsoft Azure Data EnvironmentMicrosoft Azure Data Environment
Microsoft Azure Data EnvironmentJoseph Lopez
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesStratebi
 

Similar to CloudCamp - Big Data – La revolución de los datos (20)

Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de datos empresariales (EDW) y Windows Azure (SQL Databas...
 
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
 
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATAExpert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
 
Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!Inteligencia de negocio en la nube, una realidad palpable!!!
Inteligencia de negocio en la nube, una realidad palpable!!!
 
Análisis de datos con HD Insight
Análisis de datos con HD InsightAnálisis de datos con HD Insight
Análisis de datos con HD Insight
 
Microsoft Business Analytics 2013
Microsoft Business Analytics 2013Microsoft Business Analytics 2013
Microsoft Business Analytics 2013
 
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQIntroducción a Big Data. HDInsight - Webcast Technet SolidQ
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Presentación big data
Presentación big dataPresentación big data
Presentación big data
 
Introducción a BigData - up - 2015
Introducción a BigData - up - 2015Introducción a BigData - up - 2015
Introducción a BigData - up - 2015
 
Exposicion big data
Exposicion big dataExposicion big data
Exposicion big data
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0
 
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
Data lake y virtualización. Ejes para una arquitectura abierta en big data v6
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
 
Que debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre HadoopQue debe saber un DBA de SQL Server sobre Hadoop
Que debe saber un DBA de SQL Server sobre Hadoop
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015Presentación semana académica unam big data abril 2015
Presentación semana académica unam big data abril 2015
 
Microsoft Azure Data Environment
Microsoft Azure Data EnvironmentMicrosoft Azure Data Environment
Microsoft Azure Data Environment
 
Big Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones realesBig Data, casos, tecnologias y aplicaciones reales
Big Data, casos, tecnologias y aplicaciones reales
 

More from John Bulla

Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba CloudCertificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba CloudJohn Bulla
 
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataIntroducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataJohn Bulla
 
Inteligencia de Negocios con Microsoft
Inteligencia de Negocios con MicrosoftInteligencia de Negocios con Microsoft
Inteligencia de Negocios con MicrosoftJohn Bulla
 
Servicios de datos en Microsoft Azure
Servicios de datos en Microsoft AzureServicios de datos en Microsoft Azure
Servicios de datos en Microsoft AzureJohn Bulla
 
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL ServerJohn Bulla
 
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...John Bulla
 
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8John Bulla
 
Utilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos deUtilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos deJohn Bulla
 
Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012John Bulla
 
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...John Bulla
 
Windows Azure SQL Reporting
Windows Azure SQL ReportingWindows Azure SQL Reporting
Windows Azure SQL ReportingJohn Bulla
 
Integración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorerIntegración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorerJohn Bulla
 

More from John Bulla (20)

Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba CloudCertificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
 
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big DataIntroducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
 
Inteligencia de Negocios con Microsoft
Inteligencia de Negocios con MicrosoftInteligencia de Negocios con Microsoft
Inteligencia de Negocios con Microsoft
 
Servicios de datos en Microsoft Azure
Servicios de datos en Microsoft AzureServicios de datos en Microsoft Azure
Servicios de datos en Microsoft Azure
 
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
 
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
 
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
 
Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8
 
Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8
 
Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8
 
Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8
 
Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8
 
Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8
 
Utilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos deUtilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos de
 
Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012
 
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
 
Windows Azure SQL Reporting
Windows Azure SQL ReportingWindows Azure SQL Reporting
Windows Azure SQL Reporting
 
Integración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorerIntegración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorer
 

Recently uploaded

Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 

Recently uploaded (10)

Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 

CloudCamp - Big Data – La revolución de los datos

  • 1. Big Data –La revolución de los datos John Alexander Bulla Torres SQL Server MVP Microsoft Azure
  • 2. Big Data Insights @johnbulla bit.ly/johnbulla linkedin.com/in/johnbulla
  • 3. Agenda ¿Por que Big Data? Conceptos Básicos Microsoft y Hadoop
  • 4. ¿Por que Big Data? Microsoft Azure
  • 6. Big Data –La revolución en los datos 6 Los datosdigitalescrecerán40xpróximadécada En 2015, serviciosde nubepúblicatendrán46% de crecimientonetoen gastode ti Microsoft Azure
  • 7.
  • 8.
  • 9. Big Data analytics Microsoft Azure
  • 10. ¿Qué es Big Data? "Big data" es un término aplicado a conjuntos de datos que superan la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable. Microsoft Azure
  • 11. ¿Qué es Big Data? Big data es una colección de conjuntos de datos tan grande y complejo que se vuelve difícil para trabajar con el uso de herramientas de gestión de base de datos tradicionales. Las dificultades incluyen la captura, almacenamiento, búsqueda, intercambio, análisis y visualización. Fuente: Eduardo Castro MVP –SQL Saturday #247 Bogotá Microsoft Azure
  • 12. ¿Qué es Big Data? Big Data: “ Barreras para que una organización o equipo puedan almacenar, procesar y acceder todos los datos que necesitan para operar con eficiencia, tomar decisiones, reducir riesgos, etc.” Fuente: SolidQ Microsoft Azure
  • 13. ¿Qué es Big Data? Volumen Velocidad Variedad Variabilidad Microsoft Azure
  • 14. Internet of Things Audio / Video Log Files Text/Image Social Sentiment Data Market Feeds eGov Feeds Weather Wikis / Blogs Click Stream Sensors / RFID / Devices Spatial & GPS Coordinates Modern Web Mobile Advertising Collaboration eCommerce Digital Marketing Search Marketing Web Logs Recommendations ERP / CRM Sales Pipeline Payables Payroll Inventory Contacts Deal Tracking Terabytes (10e12) Gigabytes (10e9) Exabytes (10e18) Petabytes (10e15) Velocidad | Variedad | Variabilidad Volumen ERP / CRM Modern Web Internet of Things ¿Qué es Big Data? Microsoft Azure (kB)10e3 (MB)10e6 (GB)10e9 (TB)10e12 (PB)10e15 (EB)10e18 (ZB)10e21 (YB)10e24
  • 15. Ejemplos de Big Data 12 Tb día 21 Pb Hadoop cluster 7 Pb mes 1 Tb tweets/dia 75 Million scores/day 14 Tb Hadoop cluster 4 Billion Graph edg/day 7 Tb datos/dia Microsoft Azure
  • 16. Escenariosde Business Analytics •Análisis sencillo de gran cantidad de datos no estructurados: Microsoft HDInsight •Análisis sencillo de datos en memoria: Microsoft StreamInsight •Análisis en profundidad: SQL Server y Self-Service BI 16 Microsoft Azure
  • 17. Flujodedatos de un tradicionalE-Commerce
  • 18. Nuevo flujo de Big Data de un E-Commerce ¿Cuántasvistasparaciertos productosaumentancuando nuestros anunciosse ven en TV?
  • 21. ¿Qué es Hadoop? •Plataforma de almacenamiento de datos y análisis para Big Data •Open Source •Optimizado para manejar •Datos masivos a través de paralelismo •Variedad de datos (Estructurados, No-estructurados, Menos estructurados) •Uso de hardware económico •No para OLTP / OLAP 21
  • 22. ¿Qué es HDInsight? •Proyecto Isotope •HDInsight es la distribución de Microsoft de Apache Hadoop que se ejecuta en Windows. •On premise: Instalación en Windows Server •Cloud: Despliegue en la nube Microsoft Azure 22
  • 24.
  • 25. Distributed Storage (HDFS) Query (Hive) Distributed Processing (MapReduce) ODBC Legend ■Core Hadoop ■Data processing ■Data Movement ■Packages EcosistemaHadoop
  • 26. Hadoop Core + Hive, Pig, HBase C#, F#, .NET Azure Storage (WASB) Office 365 Power BI (Excel, PowerQuery, PowerView, BI Sites) World's Data (Azure Data Marketplace) HDInsighty Hadoop ODBC Sqoopfor SQL Server PowerShell
  • 27. HDInsight y Hadoop HDFS Map Reduce Pig Hive Sqoop Mahout Pegasus Flume JDBC Hive ODBC Microsoft Azure & Windows Server Microsoft BI Platform
  • 29. Programando HDInsight Hive, Pig, Mahout, Pegasus… C#, F# Map/Reduce, Microsoft .NET management clients PowerShell, cross-platform CLI tools
  • 30. Ejemplos HiveQL •Crear una Tabla Externa 31 Microsoft Azure CREATE EXTERNAL TABLE iislogs( sdatestring, stimestring, ssitenamestring, csmethodstring, csuristemstring, csuriquerystring, sport int, scstatusint, scbytesint, sbytesint, timetakenint) ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' LOCATION 'wasb://iis-logs@myapp.blob.core.windows.net/' selectsdate,stime,csmethod,scuristem,query_params['api-version'] asapi_version, query_params['search_value'] assearch_valuefrom (select*,str_to_map(csuriquery,'&','=')asquery_paramsfromiislogs) version_logswherequery_params['api-version'] isnotnull •Ejecutar un query para retornar datos
  • 32.
  • 33. LibroGratis de Microsoft Azure HDInsight •Download the PDF (6.37 MB; 130 pages) http://aka.ms/IntroHDInsight/PDF •Download the EPUB (8.46 MB) http://aka.ms/IntroHDInsight/EPUB •Download the MOBI (12.8 MB) http://aka.ms/IntroHDInsight/MOBI Recursos
  • 34. 24 Horas PASS en Español http://bit.ly/24hopes2014 40
  • 35. 41
  • 36. Big Data Insights @johnbulla bit.ly/johnbulla linkedin.com/in/johnbulla