SlideShare a Scribd company logo
1 of 14
Automatizando la generación
de datawarehouses a través de
metadatos
Miguel Egea Gómez
#24HOP
@Miguel Egea
2
¿Por qué patrones?
Desarrollo aprendiendo cada vez
¿Qué es ETL?
 Tareas de Extracción
 Tareas de Transformación
 Tareas de Load
Automatización
Automatización
Lógica de negocio
Para automatizar usamos patrones
3
Staging vs Data integration
Volatil vs no volátil
Variables que determinan que es idóneo (que no óptimo)
 Número de registros ( o tamaño de tablas)
 Tipos de datos y tipos de origen
 Claves tipo texto
 Campos timestamp
 Orden y páginas de código
 Requisitos de disponibilidad, tiempo.
¿Cómo elegir?
 Presupuesto
 Tiempo de desarrollo
 Tiempo total hasta destino
 Requisitos de negocio. ¿Qué hay de la detección de cambios?
4
Patrón de staging
Truncar tabla
de staging
Proceso normal en producción
Leer origen
Escribir en
destino
Inferir esquema de origen
y cambiar tipos de datos
Tiempo de desarrollo
Crear tablas y añadir
metadatos
5
Demostración
Antes de empezar ¿Qué metadatos necesitamos?
6
Patrones de data integration
Preguntas importantes a responder antes de elegir un patrón
 ¿Cuántos registros hay en origen? ¿Cuánto tardo en leerlos y escribirlos
 ¿existe algún campo que me permita detectar solo cambios?
 ¿se producen eliminados en origen?
 ¿Con que frecuencia hay que cargar?
 ¿Cuanto tiempo dispongo para hacerlo?
Opciones más comunes
 Leer todo el origen, comparar con el destino
 A través de lookup ¿Cuántas filas vienen? ¿cacheo o no cacheo?
 A través de Merge join
 Necesita orden!
7
Patrones de data integration
Leer destino para comparar con origen
 ¿Cómo comparo 140 campos de tabla sin cortarme las venas ?
 ¿algoritmos de hash?
 Componentes de hash
8
Demostración
Hash y lookups
Hash y merge
9
Fase de Transformación
¿Cómo lo hacemos?
10
Fase L
Carga de dimensiones
 ¿podemos hacer carga incremental?
 Opciones
 Timestamp
 Execution id
Tipos de atributos
 Tipo 1
 Tipo 2
 Tipo 1 con historia
 Tipo 0
11
Fase L
Carga de hechos
 Lookups a dimensiones
 Miembros por defecto cuando no encontrado
 Miembros inferidos
 Compensaciones y ejercicios cerrados
Cada situación da lugar a un patrón.
12
Tables
HEADING HEADING HEADING HEADING HEADING
Body text Body text Body text Body text Body text
Body text Body text Body text Body text Body text
Body text Body text Body text Body text Body text
Body text Body text Body text Body text Body text
12
Questions?
Thank You for Attending
Follow @pass24hop
Share your thoughts with hashtags
#pass24hop & #sqlpass

More Related Content

Viewers also liked

Viewers also liked (19)

SQL Server rápido y furioso
SQL Server rápido y furiosoSQL Server rápido y furioso
SQL Server rápido y furioso
 
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
 
Query Store en SQL 2016
Query Store en SQL 2016Query Store en SQL 2016
Query Store en SQL 2016
 
SQL como un servicio en la nube
SQL como un servicio en la nubeSQL como un servicio en la nube
SQL como un servicio en la nube
 
Procesando XML de estruturas complejas con SSIS
Procesando XML de estruturas complejas con SSISProcesando XML de estruturas complejas con SSIS
Procesando XML de estruturas complejas con SSIS
 
SQL Server 2016 - Row Level Security
SQL Server 2016 - Row Level SecuritySQL Server 2016 - Row Level Security
SQL Server 2016 - Row Level Security
 
Prácticas recomendadas para SQL Server en Microsoft Azure
Prácticas recomendadas para SQL Server en Microsoft AzurePrácticas recomendadas para SQL Server en Microsoft Azure
Prácticas recomendadas para SQL Server en Microsoft Azure
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data Science
 
SQL Server 2016 new features
SQL Server 2016 new featuresSQL Server 2016 new features
SQL Server 2016 new features
 
JSON Support en SQL Server 2016
JSON Support en SQL Server 2016JSON Support en SQL Server 2016
JSON Support en SQL Server 2016
 
SQL Monitoring
SQL MonitoringSQL Monitoring
SQL Monitoring
 
Introducción a Azure Machine Learning
Introducción a Azure Machine LearningIntroducción a Azure Machine Learning
Introducción a Azure Machine Learning
 
VMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y AzureVMs de alto rendimiento para SQL Server en AWS y Azure
VMs de alto rendimiento para SQL Server en AWS y Azure
 
Planeando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft AzurePlaneando e implementando servicios de datos con Microsoft Azure
Planeando e implementando servicios de datos con Microsoft Azure
 
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizadosMejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas para SQL Server en ambientes virtualizados
 
Conociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big dataConociendo los servicios adicionales en big data
Conociendo los servicios adicionales en big data
 
Analizando la performance del subsistema de IO
Analizando la performance del subsistema de IOAnalizando la performance del subsistema de IO
Analizando la performance del subsistema de IO
 
Como leer planes de ejecución
Como leer planes de ejecuciónComo leer planes de ejecución
Como leer planes de ejecución
 
Mejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación TransaccionalMejoras de Rendimiento para Replicación Transaccional
Mejoras de Rendimiento para Replicación Transaccional
 

Similar to Automatizando la generación de Datawarehouses a través de metadatos

Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Titiushko Jazz
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Titiushko Jazz
 
slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...
slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...
slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...
SALAZARCOLLASABELANG
 
Consulta (Access, Base de datos, html)
Consulta (Access, Base de datos, html)Consulta (Access, Base de datos, html)
Consulta (Access, Base de datos, html)
Lina Perez
 

Similar to Automatizando la generación de Datawarehouses a través de metadatos (20)

Programación en C#.pptx
Programación en C#.pptxProgramación en C#.pptx
Programación en C#.pptx
 
Cuida tu código: Clean Code
Cuida tu código: Clean CodeCuida tu código: Clean Code
Cuida tu código: Clean Code
 
Conceptos básicos y aplicaciones prácticas de programación para SEO
Conceptos básicos y aplicaciones prácticas de programación para SEOConceptos básicos y aplicaciones prácticas de programación para SEO
Conceptos básicos y aplicaciones prácticas de programación para SEO
 
Indices columnares | SolidQ Summit 2012
Indices columnares | SolidQ Summit 2012Indices columnares | SolidQ Summit 2012
Indices columnares | SolidQ Summit 2012
 
Ps2 u5
Ps2 u5Ps2 u5
Ps2 u5
 
293378727-Lista-de-Chequeos.doc
293378727-Lista-de-Chequeos.doc293378727-Lista-de-Chequeos.doc
293378727-Lista-de-Chequeos.doc
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
Unidad vii esp parte 3 clase de inteligencia de negocios (datawarehouse)
 
ETL: Nuestras experiencias con Excel en procesos ETL. SolidQ 1 – Excel 0
ETL: Nuestras experiencias con Excel en procesos ETL. SolidQ 1 – Excel 0ETL: Nuestras experiencias con Excel en procesos ETL. SolidQ 1 – Excel 0
ETL: Nuestras experiencias con Excel en procesos ETL. SolidQ 1 – Excel 0
 
Reconocimiento del curso
Reconocimiento del cursoReconocimiento del curso
Reconocimiento del curso
 
Fundamentos dw
Fundamentos dwFundamentos dw
Fundamentos dw
 
slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...
slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...
slides-del-curso-de-analisis-de-datos-con-power-bi_cf66119b-6f4c-4e91-9eab-72...
 
Dts y analysis services 2000
Dts y analysis services 2000Dts y analysis services 2000
Dts y analysis services 2000
 
Pruueba
PruuebaPruueba
Pruueba
 
Optimizacion De Consultas
Optimizacion De ConsultasOptimizacion De Consultas
Optimizacion De Consultas
 
data_collection-es.pptx
data_collection-es.pptxdata_collection-es.pptx
data_collection-es.pptx
 
Complejidad de-los-algoritmos
Complejidad de-los-algoritmosComplejidad de-los-algoritmos
Complejidad de-los-algoritmos
 
Webinar – Introducción al manejo de datos
Webinar – Introducción al manejo de datosWebinar – Introducción al manejo de datos
Webinar – Introducción al manejo de datos
 
Webinar – Introducción al uso de datos
Webinar – Introducción al uso de datosWebinar – Introducción al uso de datos
Webinar – Introducción al uso de datos
 
Consulta (Access, Base de datos, html)
Consulta (Access, Base de datos, html)Consulta (Access, Base de datos, html)
Consulta (Access, Base de datos, html)
 

More from SpanishPASSVC

More from SpanishPASSVC (8)

Creación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nubeCreación de un modelo de análisis predictivo en la nube
Creación de un modelo de análisis predictivo en la nube
 
AlwaysON Lecciones Aprendidas
AlwaysON Lecciones AprendidasAlwaysON Lecciones Aprendidas
AlwaysON Lecciones Aprendidas
 
Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016Data Science con Microsoft R Server y SQL Server 2016
Data Science con Microsoft R Server y SQL Server 2016
 
AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016AlwaysOn en SQL Server 2016
AlwaysOn en SQL Server 2016
 
Tecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreoTecnicas avanzadas de monitoreo
Tecnicas avanzadas de monitoreo
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
Mejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL ServerMejores prácticas de Data Warehouse con SQL Server
Mejores prácticas de Data Warehouse con SQL Server
 
Minería de datos / Machine Learning
Minería de datos / Machine LearningMinería de datos / Machine Learning
Minería de datos / Machine Learning
 

Recently uploaded

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Recently uploaded (15)

Presentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilPresentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmeril
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
presentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxpresentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 

Automatizando la generación de Datawarehouses a través de metadatos

  • 1. Automatizando la generación de datawarehouses a través de metadatos Miguel Egea Gómez #24HOP @Miguel Egea
  • 2. 2 ¿Por qué patrones? Desarrollo aprendiendo cada vez ¿Qué es ETL?  Tareas de Extracción  Tareas de Transformación  Tareas de Load Automatización Automatización Lógica de negocio Para automatizar usamos patrones
  • 3. 3 Staging vs Data integration Volatil vs no volátil Variables que determinan que es idóneo (que no óptimo)  Número de registros ( o tamaño de tablas)  Tipos de datos y tipos de origen  Claves tipo texto  Campos timestamp  Orden y páginas de código  Requisitos de disponibilidad, tiempo. ¿Cómo elegir?  Presupuesto  Tiempo de desarrollo  Tiempo total hasta destino  Requisitos de negocio. ¿Qué hay de la detección de cambios?
  • 4. 4 Patrón de staging Truncar tabla de staging Proceso normal en producción Leer origen Escribir en destino Inferir esquema de origen y cambiar tipos de datos Tiempo de desarrollo Crear tablas y añadir metadatos
  • 5. 5 Demostración Antes de empezar ¿Qué metadatos necesitamos?
  • 6. 6 Patrones de data integration Preguntas importantes a responder antes de elegir un patrón  ¿Cuántos registros hay en origen? ¿Cuánto tardo en leerlos y escribirlos  ¿existe algún campo que me permita detectar solo cambios?  ¿se producen eliminados en origen?  ¿Con que frecuencia hay que cargar?  ¿Cuanto tiempo dispongo para hacerlo? Opciones más comunes  Leer todo el origen, comparar con el destino  A través de lookup ¿Cuántas filas vienen? ¿cacheo o no cacheo?  A través de Merge join  Necesita orden!
  • 7. 7 Patrones de data integration Leer destino para comparar con origen  ¿Cómo comparo 140 campos de tabla sin cortarme las venas ?  ¿algoritmos de hash?  Componentes de hash
  • 10. 10 Fase L Carga de dimensiones  ¿podemos hacer carga incremental?  Opciones  Timestamp  Execution id Tipos de atributos  Tipo 1  Tipo 2  Tipo 1 con historia  Tipo 0
  • 11. 11 Fase L Carga de hechos  Lookups a dimensiones  Miembros por defecto cuando no encontrado  Miembros inferidos  Compensaciones y ejercicios cerrados Cada situación da lugar a un patrón.
  • 12. 12 Tables HEADING HEADING HEADING HEADING HEADING Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text Body text 12
  • 14. Thank You for Attending Follow @pass24hop Share your thoughts with hashtags #pass24hop & #sqlpass