SlideShare a Scribd company logo
1 of 40
Download to read offline
Abril 23, 2016
San José, Costa Rica
Introducción a U-SQL lenguaje que hace fácil
el procesamiento de Big Data
John Alexander Bulla Torres
Data Platform MVP
Synergy TPC
Director BDotNet
MVP | MCS | MCSA | MCP | MCTS
Blog: http://geeks.ms/johnbulla
Twitter: @johnbulla
Introducción a U-SQL lenguaje que hace fácil el
procesamiento de Big Data
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20163 |
@johnbulla
geeks.ms/johnbulla
linkedin.com/in/johnbulla
Organiza
http://tinyurl.com/ComunidadWindows
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20164 |
Patrocinadores del SQL Saturday
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20165 |
Platinum Sponsor
Diamond Sponsor
Bronze Sponsor
Agenda
Fundamentos Big Data
U-SQL
Azure Data Lake Store
Azure Data Lake Analytics
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20166 |
Big Data – La revolución en los datos
Los datos digitales crecerán 40x próxima década
En 2016, servicios de nube pública tendrán 46% de crecimiento neto en gasto de ti
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20167 |
Qué es Big Data?
"Big data" es un término aplicado a
conjuntos de datos que superan la
capacidad del software habitual para ser
capturados, gestionados y procesados en
un tiempo razonable.
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20168 |
Qué es Big Data?
Big data es una colección de conjuntos de
datos tan grande y complejo que se vuelve
difícil para trabajar con el uso de
herramientas de gestión de base de datos
tradicionales. Las dificultades incluyen la
captura, almacenamiento, búsqueda,
intercambio, análisis y visualización.
Fuente: Eduardo Castro MVP – SQL Saturday #247 Bogotá
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20169 |
Big Data – Las 4 V’s
Volumen
Velocidad
Variedad
Veracidad
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201610 |
Big Data – Las 4 V’s
12 Tb
día
21 Pb
Hadoop
cluster
7 Pb
mes
1 Tb
tweets/dia
75
Million
scores/day
14 Tb
Hadoop
cluster
4 Billion
Graph
edg/day
7 Tb
datos/dia
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201611 |
U-SQL
?
Características de Big Data
Analytics
• Requiere procesamiento de
cualquier tipo de datos.
• Permite el uso de algoritmos
personalizados
• Escala a cualquier tamaño y es
eficiente
Algunos ejemplos
• Unidad de Crimen Digital - Analizar los patrones de ataques
complejos para entender los botnets y poder predecir y prevenir
los ataques en el futuro mediante el análisis de los logs de registro
con algoritmos complejos personalizados
• Procesamiento de Imágenes - extracción de características de
imagen a gran escala y la clasificación de acuerdo con el código
personalizado
• Recomendación de compras - Complejo análisis de patrones y la
predicción sobre los registros de compras utilizando algoritmos
propietarios
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201612 |
U-SQL
?
SQL para Big Data
 Declarativamente hace escalamiento y paralelización por usted
 Extensibilidad no es “nativa”
 Difícil de operar en los datos no estructurados
 Difícil extender con código personalizado
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201613 |
U-SQL
?
Lenguajes de programación para Big Data
 Declarativamente no es “nativo”
 Extensibilidad a través de un código personalizado que es “nativa”
 El usuario a menudo tiene que preocuparse acerca de la escalabilidad y
el rendimiento
 Sin reutilización de código / compartir a través de consultas
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201614 |
U-SQL
?
 Declarativo y Extensivo nativamente en el lenguaje
 Hace que sea fácil para usted mediante la unificación:
 Procesamiento de datos estructurados y no estructurados
 SQL declarativo y código personalizado imperativo
 Consultas locales y remotas
 Aumentar la productividad y la agilidad desde el día 1
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201615 |
Alcance – Lenguaje de Big Data interno de Microsoft
• Modelo de integración SQL y C#
• Modelo de Optimización y Escalamiento
• Ejecuta 100000 Jobs diariamente
Hive
• Tipos de datos complejos (Mapas, Arrays)
• Alineación de formato de datos para archivos de texto
T-SQL/ANSI SQL
• Muchas de las capacidades de SQL (Funciones Windows, modelo
de metadatos, etc.)
U-SQL
Orígenes de U-SQL
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201616 |
U-SQL
Extender U-SQL con C# / .Net
Operadores internos,
funciones, agregados
C# expresiones (en expresiones SELECT)
User-defined aggregates (UDAGGs)
User-defined functions (UDFs)
User-defined operators (UDOs)
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201617 |
Filosofía del Lenguaje
U-SQL
REFERENCE MyDB.MyAssembly;
CREATE TABLE T( cid int, first_order DateTime
, last_order DateTime, order_count int
, order_amount float );
@o = EXTRACT oid int, cid int, odate DateTime, amount float
FROM "/input/orders.txt"
USING Extractors.Csv();
@c = EXTRACT cid int, name string, city string
FROM "/input/customers.txt"
USING Extractors.Csv();
@j = SELECT c.cid, MIN(o.odate) AS firstorder
, MAX(o.date) AS lastorder, COUNT(o.oid) AS ordercnt
, AGG<MyAgg.MySum>(c.amount) AS totalamount
FROM @c AS c LEFT OUTER JOIN @o AS o ON c.cid == o.cid
WHERE c.city.StartsWith("New")
&& MyNamespace.MyFunction(o.odate) > 10
GROUP BY c.cid;
OUTPUT @j TO "/output/result.txt"
USING new MyData.Write();
INSERT INTO T SELECT * FROM @j;
Query Declarativo y Transformación del lenguaje:
• Utiliza SQL’s SELECT FROM WHERE con GROUP BY/Aggregation,
Joins, Funciones Analíticas SQL
• Optimizable, Escalable
Expresión - estilo de programación de flujo:
• Fácil de usar la composición de funciones lambda
• Globalmente optimizable
Funciona con datos estructurados y no estructurados
• Esquema de lectura sobre los archivos
• Objetos de metadatos relacionales (Ej. base de datos, tablas)
Extensible desde cero:
• Tipo de Dato basado en C#
• Lenguaje de Expresión C#
• User-defined functions (U-SQL and C#)
• User-defined Aggregators (C#)
• User-defined Operators (UDO) (C#)
U-SQL provides the Parallelization and Scale-out Framework for
Usercode
EXTRACTOR, OUTPUTTER, PROCESSOR, REDUCER, COMBINER, APPLIER
Federated query across distributed data sources
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201618 |
U-SQL
Escribiendo Scripts U-SQL
Extracción de la información desde la fuente
de datos origen usando instrucciones
integradas o personalizadas
Transformación / Análisis de los datos
usando sintaxis SQL y llamadas a métodos
C#
Salida o Envío del resultado a una fuente de
datos destino usando instrucciones
integradas o personalizadas
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201619 |
U-SQL
Escribiendo Scripts U-SQL
Apoyado por
IntelliSense
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201620 |
U-SQL
Escribiendo Scripts U-SQL
Code behind
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201621 |
Data Lake
El concepto puede ser comparado a un cuerpo de agua, un lago, donde el agua fluye en, llenar un depósito
y fluye hacia fuera.
El flujo de entrada representa múltiples
archivos de datos en bruto que van
desde mensajes de correo electrónico,
hojas de cálculo, el contenido de las
redes sociales, etc.
La salida de agua son los datos
analizados
A través de este proceso, se
debe seleccionar los datos
correctos de forma rápida para
obtener información clave del
negocio.
El depósito de agua es un conjunto de
datos, donde usted realiza el análisis
de todos los datos.
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201622 |
DATOS ESTRUCTURADOS
1. La información en filas y columnas
2. Fácilmente ordenados y procesados
con herramientas de minería de datos
DATOS NO ESTRUCTURADOS
1. Filas, los datos no organizados
2. Los correos electrónicos
3. Archivos PDF
4. Imágenes, vídeo y audio
5. Redes sociales
Azure Data Lake
Analytics
Storage
HDInsight
(“managed clusters”)
Azure Data Lake Analytics
Azure Data Lake Storage
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201623 |
Azure Data Lake
WebHDFS
YARN
U-SQL
Analytics Service HDInsight
(managed Hadoop Clusters)
Analytics
Store
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201624 |
Azure Data Lake Store
Un repositorio de gran escala para grandes cargas de trabajo de
análisis de datos
• No hay límites para escalar
• Almacenamiento ilimitado
• Almacena todos los datos en su formato nativo
• Los tamaños de archivos pueden ser de Gigabytes de petabytes
• Sistema de archivo de Hadoop (HDFS) para la nube
• Control de acceso listo para la empresa, cifrado en reposo
• Optimizado para el rendimiento de carga de trabajo analítico
• Se integra con HDInsight, Hortonworks y Cloudera
• Soporta archivos y objetos de carpeta y operaciones
• Se integra con Azure Active Directory
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201625 |
Azure Data Lake Store
Cualquier dato
• Datos no estructurados
• Datos semi-estructurados
• Datos estructurados
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201626 |
Azure Data Lake Analytics
Un servicio de análisis elástico construido con Apache YARN que
procesa todos los datos, en cualquier tamaño
• No hay límites para escalar
• Incluye T-SQL, un lenguaje que une los beneficios de SQL con el poder
expresivo de C #
• Optimizado para trabajar con la tienda de ADL
• Consultas federadas a través de fuentes de datos Azure
• Control de acceso basado en roles listo para la empresa y Auditoria
• Se paga por Job y escala por Job
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201627 |
Azure Data Lake Analytics
Grado -
Empresarial
Escala sin
limites
Productividad
desde el
primer día
Preparación
de datos fácil
y potente
Todos los
Datos
0100101001000101010100101001000
10101010010100100010101010010100
10001010101001010010001010101001
0100100010101010010100100010101
0100101001000101010100101001000
10101010010100100010101010010100
10001010101001010010001010101001
0100100010101010010100100010101
0100101001000101010100101001000
10101010010100100010101010010100
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201628 |
Azure Data Lake – Visual Studio
Un servicio de análisis elástico construido con Apache YARN que
procesa todos los datos, en cualquier tamaño
• No hay límites para escalar
• Incluye T-SQL, un lenguaje que une los beneficios de SQL con el poder
expresivo de C #
• Optimizado para trabajar con la tienda de ADL
• Consultas federadas a través de fuentes de datos Azure
• Control de acceso basado en roles listo para la empresa y Auditoria
• Se paga por Job y escala por Job
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201629 |
Azure Data Lake – Visual Studio
Disponible Tipos
de Proyecto
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201630 |
Azure Data Lake – Visual Studio
• Monitorear y administrar los
Jobs
• Explorar y gestionar el
almacenamiento
• Explorar catálogo U-SQL
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201631 |
Azure Data Lake – Visual Studio
Ejecución con paralelismo
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201632 |
Paralelismo Solicitado = 1
(Reserva suficiente para hacer 1 vértice a la vez)
Paralelismo Solicitado = 4
(Reserva suficiente para hacer 4 vértices a la vez)
Azure Data Lake – Visual Studio
Etapa de detalles
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201633 |
252 Piezas de trabajo
AVG Tiempo de ejecución del
Vertex
4.3 Billones de Filas
Información Leida & Escrita
Azure Data Lake – Visual Studio
Programación estilo flujo
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201634 |
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201635 |
Microsoft Azure Data Centers
North America Region Europe Region Asia Pacific Region
Major datacenter
Chicago, IL
Singapore, SG
Hong Kong, HK
Dublin, IE Amsterdam, NL
San Antonio, TX
Virginia
Los Angeles, CA
Melbourne, AU Sydney, AU
Oceania Region
Saitama, JP
Sao Paulo, BR
Osaka, JP
Iowa
South America Region
Beijing, CN New Shanghai, CN New
Mumbai, IN New
Pune, IN New
Chennai, IN New
Toronto, ON
Coming Soon
Quebec City, QC
Coming Soon
To be announced
Magdeburg, DE
Coming Soon
To be announced
Frankfurt, DE
Coming Soon
https://azure.microsoft.com/en-gb/regions/#services
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201636 |
Microsoft Azure Data Centers
Major datacenter
US Gov Virginia
Virginia
São Paulo, BR
US Gov Iowa
Iowa
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201637 |
To be announced
To be announced
North America Region Europe Region Asia Pacific Region Oceania RegionSouth America Region
Recursos
 Blog John Bulla
 http://geeks.ms/johnbulla
 Documentación Azure
 http://azure.microsoft.com/es-es/
 Portal Azure
 https://portal.azure.com
 U-SQL
 http://usql.io/
 Twitter: @JohnBulla
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201638 |
Comunidad de Desarrolladores
http://meetup.com/bdotnet
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201639 |
Muchas Gracias …..
@johnbulla
geeks.ms/johnbulla
linkedin.com/in/johnbulla
23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201640 |

More Related Content

What's hot

AnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web ServicAnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web ServicSoftware Guru
 
Azure Databricks
Azure DatabricksAzure Databricks
Azure Databricksnnakasone
 
Diseñando un Big Pipeline para Big Data
Diseñando un Big Pipeline para Big DataDiseñando un Big Pipeline para Big Data
Diseñando un Big Pipeline para Big DataSoftware Guru
 
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Joseph Lopez
 
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Joseph Lopez
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL ServerEduardo Castro
 
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4Julián Castiblanco
 
Sql azure data warehouse gab jorge muchaypina
Sql azure data warehouse gab   jorge muchaypinaSql azure data warehouse gab   jorge muchaypina
Sql azure data warehouse gab jorge muchaypinaMUG Perú
 
Introducción a Azure DocumentDB
Introducción a Azure DocumentDBIntroducción a Azure DocumentDB
Introducción a Azure DocumentDBJoseph Lopez
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIsBig Data Spain
 
Introducción a R - Primeros pasos en R
Introducción a R - Primeros pasos en RIntroducción a R - Primeros pasos en R
Introducción a R - Primeros pasos en RSolidQ
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryRaul Martin Sarachaga Diaz
 
Arquitectura para seguridad punto a punto en la empresa
Arquitectura para seguridad punto a punto en la empresaArquitectura para seguridad punto a punto en la empresa
Arquitectura para seguridad punto a punto en la empresaAmazon Web Services LATAM
 
Introducción a Análisis de Datos SqlServer Power BI
Introducción a Análisis de Datos SqlServer Power BIIntroducción a Análisis de Datos SqlServer Power BI
Introducción a Análisis de Datos SqlServer Power BIFreddy Angarita
 
Power BI UG Lima webcast enero 22 - Seguridad
Power BI UG Lima   webcast enero 22 - SeguridadPower BI UG Lima   webcast enero 22 - Seguridad
Power BI UG Lima webcast enero 22 - SeguridaddbLearner
 

What's hot (20)

AnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web ServicAnalyticZ … De la A a la Z con Amazon Web Servic
AnalyticZ … De la A a la Z con Amazon Web Servic
 
Azure Databricks
Azure DatabricksAzure Databricks
Azure Databricks
 
Diseñando un Big Pipeline para Big Data
Diseñando un Big Pipeline para Big DataDiseñando un Big Pipeline para Big Data
Diseñando un Big Pipeline para Big Data
 
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
 
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
 
Introducción Azure Synapse Analytics
Introducción Azure Synapse AnalyticsIntroducción Azure Synapse Analytics
Introducción Azure Synapse Analytics
 
Python dentro de SQL Server
Python dentro de SQL ServerPython dentro de SQL Server
Python dentro de SQL Server
 
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
Global Azure Bootcamp 2016 Bogota SQL2016 dba IaaS PaaS v4
 
Sql azure data warehouse gab jorge muchaypina
Sql azure data warehouse gab   jorge muchaypinaSql azure data warehouse gab   jorge muchaypina
Sql azure data warehouse gab jorge muchaypina
 
Azure Data Factory: From A to Z
Azure Data Factory: From A to ZAzure Data Factory: From A to Z
Azure Data Factory: From A to Z
 
Introducción a Azure DocumentDB
Introducción a Azure DocumentDBIntroducción a Azure DocumentDB
Introducción a Azure DocumentDB
 
El mundo Big Data y las APIs
El mundo Big Data y las APIsEl mundo Big Data y las APIs
El mundo Big Data y las APIs
 
Introducción a R - Primeros pasos en R
Introducción a R - Primeros pasos en RIntroducción a R - Primeros pasos en R
Introducción a R - Primeros pasos en R
 
Migrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data FactoryMigrando mis datos a la nube con Azure Data Factory
Migrando mis datos a la nube con Azure Data Factory
 
Explorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data FactoryExplorando los Sabores de Azure Data Factory
Explorando los Sabores de Azure Data Factory
 
SQL Azure Datawarehouse
SQL Azure DatawarehouseSQL Azure Datawarehouse
SQL Azure Datawarehouse
 
Arquitectura para seguridad punto a punto en la empresa
Arquitectura para seguridad punto a punto en la empresaArquitectura para seguridad punto a punto en la empresa
Arquitectura para seguridad punto a punto en la empresa
 
Introducción a Análisis de Datos SqlServer Power BI
Introducción a Análisis de Datos SqlServer Power BIIntroducción a Análisis de Datos SqlServer Power BI
Introducción a Análisis de Datos SqlServer Power BI
 
Power BI UG Lima webcast enero 22 - Seguridad
Power BI UG Lima   webcast enero 22 - SeguridadPower BI UG Lima   webcast enero 22 - Seguridad
Power BI UG Lima webcast enero 22 - Seguridad
 
Anatomía de un proyecto de Big Data
Anatomía de un proyecto de Big DataAnatomía de un proyecto de Big Data
Anatomía de un proyecto de Big Data
 

Similar to Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data

Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerSpanishPASSVC
 
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIEjemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIAbel Alejandro Coronado Iruegas
 
Global Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalakeGlobal Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalakeJulián Castiblanco
 
Presentación base de datos bautista marquez_asalia
Presentación base de datos bautista marquez_asaliaPresentación base de datos bautista marquez_asalia
Presentación base de datos bautista marquez_asaliaAsalia Bautista Márquez
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Denodo
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. GustavoMartin46
 
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningArquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningDenodo
 
Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...
Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...
Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...Software Guru
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Ángel Rayo
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data ScienceSpanishPASSVC
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016jorge Muchaypiña
 
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian MirandaEscalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian MirandaSpanishPASSVC
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseJoseph Lopez
 
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...Pepi Pedrero Rojo
 
Data Librarian ¿de qué va?
Data Librarian ¿de qué va?Data Librarian ¿de qué va?
Data Librarian ¿de qué va?Lourdes Feria
 
Obtención de datos de redes sociales
Obtención de datos de redes socialesObtención de datos de redes sociales
Obtención de datos de redes socialesAragón Open Data
 
Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogotajorge Muchaypiña
 

Similar to Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data (20)

Mejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint ServerMejores Prácticas de SQL Server para implementar SharePoint Server
Mejores Prácticas de SQL Server para implementar SharePoint Server
 
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGIEjemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
 
Global Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalakeGlobal Azure Cloud Camp Bogota Introduccion Azure datalake
Global Azure Cloud Camp Bogota Introduccion Azure datalake
 
Presentación base de datos bautista marquez_asalia
Presentación base de datos bautista marquez_asaliaPresentación base de datos bautista marquez_asalia
Presentación base de datos bautista marquez_asalia
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
Sergio cano a
Sergio cano aSergio cano a
Sergio cano a
 
S cano a actividad 4 4b
S cano a actividad 4 4bS cano a actividad 4 4b
S cano a actividad 4 4b
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero.
 
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine LearningArquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
Arquitectura de Data Fabric: Clave en proyectos de Big Data y Machine Learning
 
Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...
Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...
Cómo construir una plataforma poderosa de datos en un ambiente con recursos r...
 
Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016Big data con Hadoop y SSIS 2016
Big data con Hadoop y SSIS 2016
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data Science
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016
 
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian MirandaEscalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
Escalando con SQL Server hasta la nube, un trayecto necesario - Adrian Miranda
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
 
Explorando los Sabores de Azure DW
Explorando los Sabores de Azure DWExplorando los Sabores de Azure DW
Explorando los Sabores de Azure DW
 
Data Librarian ¿de qué va?
Data Librarian ¿de qué va?Data Librarian ¿de qué va?
Data Librarian ¿de qué va?
 
Obtención de datos de redes sociales
Obtención de datos de redes socialesObtención de datos de redes sociales
Obtención de datos de redes sociales
 
Azure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday BogotaAzure SQL DataLake - SQL Saturday Bogota
Azure SQL DataLake - SQL Saturday Bogota
 

More from John Bulla

Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba CloudCertificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba CloudJohn Bulla
 
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL ServerJohn Bulla
 
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...John Bulla
 
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?John Bulla
 
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATAExpert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATAJohn Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8John Bulla
 
Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8John Bulla
 
Utilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos deUtilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos deJohn Bulla
 
Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012John Bulla
 
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...John Bulla
 
Windows Azure SQL Reporting
Windows Azure SQL ReportingWindows Azure SQL Reporting
Windows Azure SQL ReportingJohn Bulla
 
Integración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorerIntegración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorerJohn Bulla
 
SQL Server 2008 R2 StreamInsight
SQL Server 2008 R2 StreamInsightSQL Server 2008 R2 StreamInsight
SQL Server 2008 R2 StreamInsightJohn Bulla
 
WorkShop SQL Server 2008 Spatial Data
WorkShop SQL Server 2008 Spatial DataWorkShop SQL Server 2008 Spatial Data
WorkShop SQL Server 2008 Spatial DataJohn Bulla
 

More from John Bulla (20)

Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba CloudCertificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
Certificaciones Técnicas Profesionales y Oferta Académica de Alibaba Cloud
 
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
24 Horas Español 2014 - ALM para el desarrollo de base de datos SQL Server
 
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...Sql server data tools la nueva generación de herramientas de desarrollo de ba...
Sql server data tools la nueva generación de herramientas de desarrollo de ba...
 
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
Expert Day 2013 - ¿Y Las Bases de Datos en Azure?
 
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATAExpert Day 2013 - Trabaja al tope con tus datos BIG DATA
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
 
Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8Diplomado Técnico SQL Server 2012 - Sesión 8/8
Diplomado Técnico SQL Server 2012 - Sesión 8/8
 
Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8Diplomado Técnico SQL Server 2012 - Sesión 7/8
Diplomado Técnico SQL Server 2012 - Sesión 7/8
 
Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8Diplomado Técnico SQL Server 2012 - Sesión 6/8
Diplomado Técnico SQL Server 2012 - Sesión 6/8
 
Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8Diplomado Técnico SQL Server 2012 - Sesión 5/8
Diplomado Técnico SQL Server 2012 - Sesión 5/8
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8Diplomado Técnico SQL Server 2012 - Sesión 3/8
Diplomado Técnico SQL Server 2012 - Sesión 3/8
 
Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8Diplomado Técnico SQL Server 2012 - Sesión 2/8
Diplomado Técnico SQL Server 2012 - Sesión 2/8
 
Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8Diplomado Técnico SQL Server 2012 - Sesión 1/8
Diplomado Técnico SQL Server 2012 - Sesión 1/8
 
Utilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos deUtilizando el plan cache para optimizar procesos de
Utilizando el plan cache para optimizar procesos de
 
Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012Descubriendo los datos espaciales en sql server 2012
Descubriendo los datos espaciales en sql server 2012
 
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
24 Horas Español 2012 - Desarrollando Base de Datos con .Net 4.0 y SQL Server...
 
Windows Azure SQL Reporting
Windows Azure SQL ReportingWindows Azure SQL Reporting
Windows Azure SQL Reporting
 
Integración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorerIntegración de datos de multiples origenes con data explorer
Integración de datos de multiples origenes con data explorer
 
SQL Server 2008 R2 StreamInsight
SQL Server 2008 R2 StreamInsightSQL Server 2008 R2 StreamInsight
SQL Server 2008 R2 StreamInsight
 
WorkShop SQL Server 2008 Spatial Data
WorkShop SQL Server 2008 Spatial DataWorkShop SQL Server 2008 Spatial Data
WorkShop SQL Server 2008 Spatial Data
 

Recently uploaded

LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.241514949
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxAlexander López
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramDIDIERFERNANDOGUERRE
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxMariaBurgos55
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel tallerValentinaTabares11
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 

Recently uploaded (20)

LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.El uso de las TIC's en la vida cotidiana.
El uso de las TIC's en la vida cotidiana.
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptxGoogle-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
Google-Meet-como-herramienta-para-realizar-reuniones-virtuales.pptx
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ram
 
Segunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptxSegunda ley de la termodinámica TERMODINAMICA.pptx
Segunda ley de la termodinámica TERMODINAMICA.pptx
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel taller
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 

Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data

  • 1. Abril 23, 2016 San José, Costa Rica
  • 2. Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data John Alexander Bulla Torres Data Platform MVP Synergy TPC Director BDotNet MVP | MCS | MCSA | MCP | MCTS Blog: http://geeks.ms/johnbulla Twitter: @johnbulla
  • 3. Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20163 | @johnbulla geeks.ms/johnbulla linkedin.com/in/johnbulla
  • 4. Organiza http://tinyurl.com/ComunidadWindows 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20164 |
  • 5. Patrocinadores del SQL Saturday 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20165 | Platinum Sponsor Diamond Sponsor Bronze Sponsor
  • 6. Agenda Fundamentos Big Data U-SQL Azure Data Lake Store Azure Data Lake Analytics 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20166 |
  • 7. Big Data – La revolución en los datos Los datos digitales crecerán 40x próxima década En 2016, servicios de nube pública tendrán 46% de crecimiento neto en gasto de ti 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20167 |
  • 8. Qué es Big Data? "Big data" es un término aplicado a conjuntos de datos que superan la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable. 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20168 |
  • 9. Qué es Big Data? Big data es una colección de conjuntos de datos tan grande y complejo que se vuelve difícil para trabajar con el uso de herramientas de gestión de base de datos tradicionales. Las dificultades incluyen la captura, almacenamiento, búsqueda, intercambio, análisis y visualización. Fuente: Eduardo Castro MVP – SQL Saturday #247 Bogotá 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 20169 |
  • 10. Big Data – Las 4 V’s Volumen Velocidad Variedad Veracidad 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201610 |
  • 11. Big Data – Las 4 V’s 12 Tb día 21 Pb Hadoop cluster 7 Pb mes 1 Tb tweets/dia 75 Million scores/day 14 Tb Hadoop cluster 4 Billion Graph edg/day 7 Tb datos/dia 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201611 |
  • 12. U-SQL ? Características de Big Data Analytics • Requiere procesamiento de cualquier tipo de datos. • Permite el uso de algoritmos personalizados • Escala a cualquier tamaño y es eficiente Algunos ejemplos • Unidad de Crimen Digital - Analizar los patrones de ataques complejos para entender los botnets y poder predecir y prevenir los ataques en el futuro mediante el análisis de los logs de registro con algoritmos complejos personalizados • Procesamiento de Imágenes - extracción de características de imagen a gran escala y la clasificación de acuerdo con el código personalizado • Recomendación de compras - Complejo análisis de patrones y la predicción sobre los registros de compras utilizando algoritmos propietarios 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201612 |
  • 13. U-SQL ? SQL para Big Data  Declarativamente hace escalamiento y paralelización por usted  Extensibilidad no es “nativa”  Difícil de operar en los datos no estructurados  Difícil extender con código personalizado 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201613 |
  • 14. U-SQL ? Lenguajes de programación para Big Data  Declarativamente no es “nativo”  Extensibilidad a través de un código personalizado que es “nativa”  El usuario a menudo tiene que preocuparse acerca de la escalabilidad y el rendimiento  Sin reutilización de código / compartir a través de consultas 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201614 |
  • 15. U-SQL ?  Declarativo y Extensivo nativamente en el lenguaje  Hace que sea fácil para usted mediante la unificación:  Procesamiento de datos estructurados y no estructurados  SQL declarativo y código personalizado imperativo  Consultas locales y remotas  Aumentar la productividad y la agilidad desde el día 1 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201615 |
  • 16. Alcance – Lenguaje de Big Data interno de Microsoft • Modelo de integración SQL y C# • Modelo de Optimización y Escalamiento • Ejecuta 100000 Jobs diariamente Hive • Tipos de datos complejos (Mapas, Arrays) • Alineación de formato de datos para archivos de texto T-SQL/ANSI SQL • Muchas de las capacidades de SQL (Funciones Windows, modelo de metadatos, etc.) U-SQL Orígenes de U-SQL 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201616 |
  • 17. U-SQL Extender U-SQL con C# / .Net Operadores internos, funciones, agregados C# expresiones (en expresiones SELECT) User-defined aggregates (UDAGGs) User-defined functions (UDFs) User-defined operators (UDOs) 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201617 |
  • 18. Filosofía del Lenguaje U-SQL REFERENCE MyDB.MyAssembly; CREATE TABLE T( cid int, first_order DateTime , last_order DateTime, order_count int , order_amount float ); @o = EXTRACT oid int, cid int, odate DateTime, amount float FROM "/input/orders.txt" USING Extractors.Csv(); @c = EXTRACT cid int, name string, city string FROM "/input/customers.txt" USING Extractors.Csv(); @j = SELECT c.cid, MIN(o.odate) AS firstorder , MAX(o.date) AS lastorder, COUNT(o.oid) AS ordercnt , AGG<MyAgg.MySum>(c.amount) AS totalamount FROM @c AS c LEFT OUTER JOIN @o AS o ON c.cid == o.cid WHERE c.city.StartsWith("New") && MyNamespace.MyFunction(o.odate) > 10 GROUP BY c.cid; OUTPUT @j TO "/output/result.txt" USING new MyData.Write(); INSERT INTO T SELECT * FROM @j; Query Declarativo y Transformación del lenguaje: • Utiliza SQL’s SELECT FROM WHERE con GROUP BY/Aggregation, Joins, Funciones Analíticas SQL • Optimizable, Escalable Expresión - estilo de programación de flujo: • Fácil de usar la composición de funciones lambda • Globalmente optimizable Funciona con datos estructurados y no estructurados • Esquema de lectura sobre los archivos • Objetos de metadatos relacionales (Ej. base de datos, tablas) Extensible desde cero: • Tipo de Dato basado en C# • Lenguaje de Expresión C# • User-defined functions (U-SQL and C#) • User-defined Aggregators (C#) • User-defined Operators (UDO) (C#) U-SQL provides the Parallelization and Scale-out Framework for Usercode EXTRACTOR, OUTPUTTER, PROCESSOR, REDUCER, COMBINER, APPLIER Federated query across distributed data sources 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201618 |
  • 19. U-SQL Escribiendo Scripts U-SQL Extracción de la información desde la fuente de datos origen usando instrucciones integradas o personalizadas Transformación / Análisis de los datos usando sintaxis SQL y llamadas a métodos C# Salida o Envío del resultado a una fuente de datos destino usando instrucciones integradas o personalizadas 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201619 |
  • 20. U-SQL Escribiendo Scripts U-SQL Apoyado por IntelliSense 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201620 |
  • 21. U-SQL Escribiendo Scripts U-SQL Code behind 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201621 |
  • 22. Data Lake El concepto puede ser comparado a un cuerpo de agua, un lago, donde el agua fluye en, llenar un depósito y fluye hacia fuera. El flujo de entrada representa múltiples archivos de datos en bruto que van desde mensajes de correo electrónico, hojas de cálculo, el contenido de las redes sociales, etc. La salida de agua son los datos analizados A través de este proceso, se debe seleccionar los datos correctos de forma rápida para obtener información clave del negocio. El depósito de agua es un conjunto de datos, donde usted realiza el análisis de todos los datos. 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201622 | DATOS ESTRUCTURADOS 1. La información en filas y columnas 2. Fácilmente ordenados y procesados con herramientas de minería de datos DATOS NO ESTRUCTURADOS 1. Filas, los datos no organizados 2. Los correos electrónicos 3. Archivos PDF 4. Imágenes, vídeo y audio 5. Redes sociales
  • 23. Azure Data Lake Analytics Storage HDInsight (“managed clusters”) Azure Data Lake Analytics Azure Data Lake Storage 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201623 |
  • 24. Azure Data Lake WebHDFS YARN U-SQL Analytics Service HDInsight (managed Hadoop Clusters) Analytics Store 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201624 |
  • 25. Azure Data Lake Store Un repositorio de gran escala para grandes cargas de trabajo de análisis de datos • No hay límites para escalar • Almacenamiento ilimitado • Almacena todos los datos en su formato nativo • Los tamaños de archivos pueden ser de Gigabytes de petabytes • Sistema de archivo de Hadoop (HDFS) para la nube • Control de acceso listo para la empresa, cifrado en reposo • Optimizado para el rendimiento de carga de trabajo analítico • Se integra con HDInsight, Hortonworks y Cloudera • Soporta archivos y objetos de carpeta y operaciones • Se integra con Azure Active Directory 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201625 |
  • 26. Azure Data Lake Store Cualquier dato • Datos no estructurados • Datos semi-estructurados • Datos estructurados 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201626 |
  • 27. Azure Data Lake Analytics Un servicio de análisis elástico construido con Apache YARN que procesa todos los datos, en cualquier tamaño • No hay límites para escalar • Incluye T-SQL, un lenguaje que une los beneficios de SQL con el poder expresivo de C # • Optimizado para trabajar con la tienda de ADL • Consultas federadas a través de fuentes de datos Azure • Control de acceso basado en roles listo para la empresa y Auditoria • Se paga por Job y escala por Job 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201627 |
  • 28. Azure Data Lake Analytics Grado - Empresarial Escala sin limites Productividad desde el primer día Preparación de datos fácil y potente Todos los Datos 0100101001000101010100101001000 10101010010100100010101010010100 10001010101001010010001010101001 0100100010101010010100100010101 0100101001000101010100101001000 10101010010100100010101010010100 10001010101001010010001010101001 0100100010101010010100100010101 0100101001000101010100101001000 10101010010100100010101010010100 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201628 |
  • 29. Azure Data Lake – Visual Studio Un servicio de análisis elástico construido con Apache YARN que procesa todos los datos, en cualquier tamaño • No hay límites para escalar • Incluye T-SQL, un lenguaje que une los beneficios de SQL con el poder expresivo de C # • Optimizado para trabajar con la tienda de ADL • Consultas federadas a través de fuentes de datos Azure • Control de acceso basado en roles listo para la empresa y Auditoria • Se paga por Job y escala por Job 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201629 |
  • 30. Azure Data Lake – Visual Studio Disponible Tipos de Proyecto 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201630 |
  • 31. Azure Data Lake – Visual Studio • Monitorear y administrar los Jobs • Explorar y gestionar el almacenamiento • Explorar catálogo U-SQL 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201631 |
  • 32. Azure Data Lake – Visual Studio Ejecución con paralelismo 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201632 | Paralelismo Solicitado = 1 (Reserva suficiente para hacer 1 vértice a la vez) Paralelismo Solicitado = 4 (Reserva suficiente para hacer 4 vértices a la vez)
  • 33. Azure Data Lake – Visual Studio Etapa de detalles 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201633 | 252 Piezas de trabajo AVG Tiempo de ejecución del Vertex 4.3 Billones de Filas Información Leida & Escrita
  • 34. Azure Data Lake – Visual Studio Programación estilo flujo 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201634 |
  • 35. 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201635 |
  • 36. Microsoft Azure Data Centers North America Region Europe Region Asia Pacific Region Major datacenter Chicago, IL Singapore, SG Hong Kong, HK Dublin, IE Amsterdam, NL San Antonio, TX Virginia Los Angeles, CA Melbourne, AU Sydney, AU Oceania Region Saitama, JP Sao Paulo, BR Osaka, JP Iowa South America Region Beijing, CN New Shanghai, CN New Mumbai, IN New Pune, IN New Chennai, IN New Toronto, ON Coming Soon Quebec City, QC Coming Soon To be announced Magdeburg, DE Coming Soon To be announced Frankfurt, DE Coming Soon https://azure.microsoft.com/en-gb/regions/#services 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201636 |
  • 37. Microsoft Azure Data Centers Major datacenter US Gov Virginia Virginia São Paulo, BR US Gov Iowa Iowa 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201637 | To be announced To be announced North America Region Europe Region Asia Pacific Region Oceania RegionSouth America Region
  • 38. Recursos  Blog John Bulla  http://geeks.ms/johnbulla  Documentación Azure  http://azure.microsoft.com/es-es/  Portal Azure  https://portal.azure.com  U-SQL  http://usql.io/  Twitter: @JohnBulla 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201638 |
  • 39. Comunidad de Desarrolladores http://meetup.com/bdotnet 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201639 |
  • 40. Muchas Gracias ….. @johnbulla geeks.ms/johnbulla linkedin.com/in/johnbulla 23/04/2016 | SQL Saturday #490 – San José, Costa Rica 201640 |