SlideShare a Scribd company logo
1 of 38
Download to read offline
Gestión del Disaster Recovery
Open Source en sistemas
GNU/Linux
Didac Oliveira
DRLM Chief Architect & Core Developer
1
¿Quién soy?
Didac Oliveira Garcia
Owner & Founder - Brain Updaters, S.L.L.
Founder & Maintainer – DRLM Project
Contribuciones OpenSource:
Relax-and-Recover (ReaR)
www.relax-and-recover.org
Config-to-HTML (cfg2html v6.x)
www.cfg2html.com
2
¿Qué es un Desastre?
Tipos de desastre
3
¿Qué es un Desastre?
Tipos de desastre
4
¿Qué es un Desastre?
Tipos de desastre
5
¿Qué es un Desastre?
Tipos de desastre
6
¿Qué es un Desastre?
Tipos de desastre
# rm -rf /
# chmod -R 000 /
7
¿Qué es un Desastre?
Principales causas de pérdida de servicio
**The State Of Business Technology Resiliency, Q2 2014 (FORRESTER)
8
Algunos conceptos básicos
BIA, RPO & RTO
Recovery Point Objective (RPO)
El objetivo de tiempo de recuperación (RTO) es la máxima cantidad
de tiempo que un sistema, aplicación o red puede estar inactiva
después de que ocurra un desastre o fallo.
.
Recovery Time Objective (RTO)
El objetivo de punto de recuperación (RPO) es el punto máximo
asumible de pérdida de datos después de un desastre. El RPO
determina la frecuencia con la que se deben realizar las copias de
seguridad.
El análisis de impacto de negocio (BIA) es el proceso que identifica
y evalúa los efectos potenciales de los eventos causados por
desastres naturales y/o artificiales en las operaciones.
.
Business Impact Analysis (BIA)
9
Algunos conceptos básicos
Disaster Recovery & Business Continuity
Disaster Recovery (DR)
La continuidad del negocio (BC) describe los procesos y
procedimientos para garantizar que una funcion de negocio pueda
continuar durante un desastre y hasta recuperar un estado estable.
.
Business Continuity (BC)
La recuperación ante desastres (DR) se refiere al proceso de
recuperación de una función del negocio a un estado estable
después de un desastre.
10
High
Availability
Data Backup
& Replication
Disaster
Recovery
Business Continuity
3 factores muy importantes
Business
Continuity
11
High
Availability
Data Backup
& Replication
Disaster
Recovery
Garantiza la disponibilidad del
servicio eliminando los puntos únicos
de fallo, normalmente duplicando la
infrastructura.
Garantiza la restauación de manera
rápida y eficaz de los servicios en
caso de desastre.
Garantiza los datos y su
consisténcia junto con su
disponibilidad en diferentes
localizaciones.
High Availability Disaster RecoveryData Backup & Replication
Business Continuity
3 factores muy importantes
Business
Continuity
12
High
Availability
Data Backup
& Replication
Disaster
Recovery
Garantiza la disponibilidad del
servicio eliminando los puntos únicos
de fallo, normalmente duplicandoo la
infrastructura.
Garantiza la restauación de manera
rápida y eficaz de los servicios en
caso de desastre.
Garantiza los datos y su
consisténcia junto con su
disponibilidad en diferentes
localizaciones.
High Availability Disaster RecoveryData Backup & Replication
Bussiness Continuity
3 factores muy importantes
Bussiness
Continuity
13
High
Availability
Data Backup
& Replication
Disaster
Recovery
Garantiza la disponibilidad del
servicio eliminando los puntos únicos
de fallo, normalmente duplicando la
infrastructura.
Garantiza la restauación de manera
rápida y eficaz de los servicios en
caso de desastre.
Garantiza los datos y su
consisténcia junto con su
disponibilidad en diferentes
localizaciones.
High Availability Disaster RecoveryData Backup & Replication
Bussiness Continuity
3 factores muy importantes
Business
Continuity
14
High
Availability
Data Backup
& Replication
Disaster
Recovery
Garantiza la disponibilidad del
servicio eliminando los puntos únicos
de fallo, normalmente duplicando la
infrastructura.
Garantiza la restauación de manera
rápida y eficaz de los servicios en
caso de desastre.
Garantiza los datos y su
consisténcia junto con su
disponibilidad en diferentes
localizaciones.
High Availability Disaster RecoveryData Backup & Replication
Bussiness Continuity
3 factores muy importantes
Business
Continuity
Business Continuity
15
Sistema Operativo Datos de aplicación
OS vs App Data
Diferencias entre backups de sistema y datos
Requisitos restore:
- HW (Phys-Virt)
- Red
RPO vs RTORTO vs RPO
Requisitos restore:
- Sistema configurado
- Agente instalado
SysAdmin Backup Admin
16
GNU/Linux Disaster Recovery
Open Source Software
17
¿Qué es ReaR?
Relax-and-Recover
18
¿Qué es DRLM?
Disaster Recovery Linux Manager
19
DRLM
¿Cómo funciona?
20
DRLM
Proceso de backup
Validar
cliente
Registrar
Backup
Registrar
Backup
Backup
Habilitar
Backup
Generar
imagen DR
Calcular
uso en disco
del cliente
Ejecutar
Backup
cliente
Failure
Report
ERROR
21
DRLM
Proceso de recover
Net Boot
Restaurar
Backup
Recover
Reboot
Modo
Rescue
Load
kernel &
initrd
Recrear
Layout
22
Arquitecura DRLM
Protocolos y servicios
DHCP
NFS
SSH
DRLM
STORE
TFTP
HTTPs
23
Network
operations
Backup
operations
Client
operations
DRLM CLI
Command Line Interface
24
Network
operations
Backup
operations
Client
operations
DRLM CLI
Network Operations
●
Add Networks
●
Delete Networks
●
Modify Networks
●
List Networks
25
Network
operations
Backup
operations
Client
operations
DRLM CLI
Client Operations
●
Add Clients
●
Delete Clients
●
Modify Clients
●
List Clients
●
Install Clients ( NEW!! )
26
Network
operations
Backup
operations
Client
operations
DRLM CLI
Backup Operations
●
Run Backups
●
Delete Backups
●
Manage Backups
●
List Backups
27
Migraciones con DRLM
Physical to Virtual (P2V)
Physical Server
VM
Hypervisor
28
Migraciones con DRLM
Virtual to Virtual (V2V)
VM
Hypervisor B
VM
Hypervisor A
29
Migraciones con DRLM
Physical to Physical (P2P)
Physical Server A Physical Server B
30
Migraciones con DRLM
Virtual to Physical (V2P)
VM
Hypervisor
Physical Server
31
DRLM
Features
●
Gestión centralizada
●
Reporte de errores automático en caso de fallo
●
Migración de sistemas GNU/Linux
●
Recuperación completamente por red
●
Debugging/Troubleshooting integrado en la DRLM CLI
●
Desarrollado completamente en Bash
●
Open Source
32
DRLM
Roadmap
●
Implementación GRUB2 para homogenización del netboot (multiarch)
●
Mejoras en automatización
●
Logs de ReaR en DRLM
●
Export/Import de imágenes DR
●
Backups incrementales
●
Añadir soporte para CIFS, ISO, RSYNC, ...
●
Integración con APIs de Virtualización y Cloud
●
Mejoras en instalador y configuración DRLM
●
Etc, etc, etc ...
33
DRLM
Un poco de historia...
Ago 2013: Arranca el proyecto DRLM (aka DRLS)
Oct 2013: Primera publicación del código DRLM en Github.
Dic 2013: Primera versión estable de DRLM (v1.0.0)
Dic 2014: Integración completa de DLRM con ReaR
(issue #522) – ReaR 1.17
Ene 2015: Publicadas las webs del proyecto DRLM
www.drlm.org y docs.drlm.org
34
DRLM
Un poco de historia...
Mar 2015: Publicada la versión 1.1.1 de DRLM
May 2015: Se define Roadmap para DRLM versión 2
Ene 2016: DRLM presente en el FOSDEM’16
Jun 2016: Congelado el código DRLM v2.0.0
- pendientes los últimos tests
- cerrar nueva versión de la documentación
Jun 2016: DRLM presente en OpenExpo’16
35
DRLM
Caso de éxito: GRIFOLS
GRIFOLS es la tercera empresa del mundo en el sector de los
hemoderivados y la primera en Europa.
El proyecto DRLM nace de la necesidad de GRIFOLS para gestionar el
DR de sus sistemas GNU/Linux.
Como empresa del sector farmacéutico debe cumplir con estrictos
controles que agencias como la FDA (USA) y EMEA (Europa) les exigen
para todo sistema y/o servicio relacionado con medicamentos.
En Marzo de 2014 se finaliza la implementación de DLRM para la gestión
del DR en Linux en los centros de datos de GRIFOLS.
Además de la gestión de DR también lo usan como herramienta para las
migraciones de sistemas P2P, P2V, V2P, V2V, despliegues de sistemas
con una imagen template y clonación de entornos..
Ruegos y preguntas
Didac Oliveira
Phone: +34 629 078 369
E-Mail: didac@brainupdaters.net
Web: www.brainupdaters.net
Copyright © 2016 - Brain Updaters, S.L.L. Licensed under Creative Commons (CC BY-NC-SA 4.0). DRLM and DRLM logo are registered
trademarks of Brain Updaters, S.L.L.
DRLM at Github: github.com/brainupdaters/drlm
DRLM website: drlm.org
DRLM Docs: docs.drlm.org

More Related Content

Similar to Linux OS Disaster Recovery - OpenExpo2016 (Madrid)

Rosario evento a clientes de RMDM Octubre 2009 - RM
Rosario evento a clientes de RMDM Octubre 2009 - RMRosario evento a clientes de RMDM Octubre 2009 - RM
Rosario evento a clientes de RMDM Octubre 2009 - RMCA RMDM Latam
 
Plan de recuperación de desastres .pptx
Plan de recuperación de desastres .pptxPlan de recuperación de desastres .pptx
Plan de recuperación de desastres .pptxLuis Flores
 
Auditoria de sistemas víctor reyes
Auditoria de sistemas víctor reyesAuditoria de sistemas víctor reyes
Auditoria de sistemas víctor reyesVictor Reyes
 
RECUPERACIÓN ANTE DESASTRES
RECUPERACIÓN ANTE DESASTRESRECUPERACIÓN ANTE DESASTRES
RECUPERACIÓN ANTE DESASTRESMiguel Cabrera
 
Estrategias de administración de desastres informáticos - Luciano Fain
Estrategias de administración de desastres informáticos - Luciano FainEstrategias de administración de desastres informáticos - Luciano Fain
Estrategias de administración de desastres informáticos - Luciano FainForo Global Crossing
 
Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...
Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...
Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...Gustavo Arjones
 
Modelos de alta disponibilidad
Modelos de alta disponibilidadModelos de alta disponibilidad
Modelos de alta disponibilidadDavid Herrero
 
Clase 4 it management.
Clase 4 it management.Clase 4 it management.
Clase 4 it management.Javier Juliac
 
Clase 4 it management.
Clase 4 it management.Clase 4 it management.
Clase 4 it management.Javier Juliac
 
Protocolo de mantenimiento de hardware y software
Protocolo de mantenimiento de hardware y softwareProtocolo de mantenimiento de hardware y software
Protocolo de mantenimiento de hardware y softwaregrupo6monica
 
Protocolo y mantenimineto de software y hadrware
Protocolo y mantenimineto de software y hadrwareProtocolo y mantenimineto de software y hadrware
Protocolo y mantenimineto de software y hadrwaregrupo6monica
 
Herramientas usadas para definir el ambiente
Herramientas usadas para definir el ambienteHerramientas usadas para definir el ambiente
Herramientas usadas para definir el ambienteAlejandra Apeleister
 

Similar to Linux OS Disaster Recovery - OpenExpo2016 (Madrid) (20)

Rosario evento a clientes de RMDM Octubre 2009 - RM
Rosario evento a clientes de RMDM Octubre 2009 - RMRosario evento a clientes de RMDM Octubre 2009 - RM
Rosario evento a clientes de RMDM Octubre 2009 - RM
 
Desayunos Tecnológicos
Desayunos TecnológicosDesayunos Tecnológicos
Desayunos Tecnológicos
 
Plan de recuperación de desastres .pptx
Plan de recuperación de desastres .pptxPlan de recuperación de desastres .pptx
Plan de recuperación de desastres .pptx
 
Auditoria de sistemas víctor reyes
Auditoria de sistemas víctor reyesAuditoria de sistemas víctor reyes
Auditoria de sistemas víctor reyes
 
Base de Dato Oracle
Base de Dato OracleBase de Dato Oracle
Base de Dato Oracle
 
RECUPERACIÓN ANTE DESASTRES
RECUPERACIÓN ANTE DESASTRESRECUPERACIÓN ANTE DESASTRES
RECUPERACIÓN ANTE DESASTRES
 
Smbd
SmbdSmbd
Smbd
 
Estrategias de administración de desastres informáticos - Luciano Fain
Estrategias de administración de desastres informáticos - Luciano FainEstrategias de administración de desastres informáticos - Luciano Fain
Estrategias de administración de desastres informáticos - Luciano Fain
 
Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...
Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...
Nerdear.la 2018 | Journey to Stability - Cómo reducimos costos y aumentamos l...
 
Perfil ait v15
Perfil ait v15Perfil ait v15
Perfil ait v15
 
Acti1 guia8jhonfredyduque
Acti1 guia8jhonfredyduqueActi1 guia8jhonfredyduque
Acti1 guia8jhonfredyduque
 
Modelos de alta disponibilidad
Modelos de alta disponibilidadModelos de alta disponibilidad
Modelos de alta disponibilidad
 
Clase 4 it management.
Clase 4 it management.Clase 4 it management.
Clase 4 it management.
 
Clase 4 it management.
Clase 4 it management.Clase 4 it management.
Clase 4 it management.
 
Protocolo de mantenimiento de hardware y software
Protocolo de mantenimiento de hardware y softwareProtocolo de mantenimiento de hardware y software
Protocolo de mantenimiento de hardware y software
 
Escenarios migración a la nube
Escenarios migración a la nubeEscenarios migración a la nube
Escenarios migración a la nube
 
Protocolo y mantenimineto de software y hadrware
Protocolo y mantenimineto de software y hadrwareProtocolo y mantenimineto de software y hadrware
Protocolo y mantenimineto de software y hadrware
 
Aporte grupal momento 3
Aporte grupal momento 3Aporte grupal momento 3
Aporte grupal momento 3
 
DICOM y modalidades
DICOM y modalidadesDICOM y modalidades
DICOM y modalidades
 
Herramientas usadas para definir el ambiente
Herramientas usadas para definir el ambienteHerramientas usadas para definir el ambiente
Herramientas usadas para definir el ambiente
 

Linux OS Disaster Recovery - OpenExpo2016 (Madrid)

  • 1. Gestión del Disaster Recovery Open Source en sistemas GNU/Linux Didac Oliveira DRLM Chief Architect & Core Developer
  • 2. 1 ¿Quién soy? Didac Oliveira Garcia Owner & Founder - Brain Updaters, S.L.L. Founder & Maintainer – DRLM Project Contribuciones OpenSource: Relax-and-Recover (ReaR) www.relax-and-recover.org Config-to-HTML (cfg2html v6.x) www.cfg2html.com
  • 3. 2 ¿Qué es un Desastre? Tipos de desastre
  • 4. 3 ¿Qué es un Desastre? Tipos de desastre
  • 5. 4 ¿Qué es un Desastre? Tipos de desastre
  • 6. 5 ¿Qué es un Desastre? Tipos de desastre
  • 7. 6 ¿Qué es un Desastre? Tipos de desastre # rm -rf / # chmod -R 000 /
  • 8. 7 ¿Qué es un Desastre? Principales causas de pérdida de servicio **The State Of Business Technology Resiliency, Q2 2014 (FORRESTER)
  • 9. 8 Algunos conceptos básicos BIA, RPO & RTO Recovery Point Objective (RPO) El objetivo de tiempo de recuperación (RTO) es la máxima cantidad de tiempo que un sistema, aplicación o red puede estar inactiva después de que ocurra un desastre o fallo. . Recovery Time Objective (RTO) El objetivo de punto de recuperación (RPO) es el punto máximo asumible de pérdida de datos después de un desastre. El RPO determina la frecuencia con la que se deben realizar las copias de seguridad. El análisis de impacto de negocio (BIA) es el proceso que identifica y evalúa los efectos potenciales de los eventos causados por desastres naturales y/o artificiales en las operaciones. . Business Impact Analysis (BIA)
  • 10. 9 Algunos conceptos básicos Disaster Recovery & Business Continuity Disaster Recovery (DR) La continuidad del negocio (BC) describe los procesos y procedimientos para garantizar que una funcion de negocio pueda continuar durante un desastre y hasta recuperar un estado estable. . Business Continuity (BC) La recuperación ante desastres (DR) se refiere al proceso de recuperación de una función del negocio a un estado estable después de un desastre.
  • 11. 10 High Availability Data Backup & Replication Disaster Recovery Business Continuity 3 factores muy importantes Business Continuity
  • 12. 11 High Availability Data Backup & Replication Disaster Recovery Garantiza la disponibilidad del servicio eliminando los puntos únicos de fallo, normalmente duplicando la infrastructura. Garantiza la restauación de manera rápida y eficaz de los servicios en caso de desastre. Garantiza los datos y su consisténcia junto con su disponibilidad en diferentes localizaciones. High Availability Disaster RecoveryData Backup & Replication Business Continuity 3 factores muy importantes Business Continuity
  • 13. 12 High Availability Data Backup & Replication Disaster Recovery Garantiza la disponibilidad del servicio eliminando los puntos únicos de fallo, normalmente duplicandoo la infrastructura. Garantiza la restauación de manera rápida y eficaz de los servicios en caso de desastre. Garantiza los datos y su consisténcia junto con su disponibilidad en diferentes localizaciones. High Availability Disaster RecoveryData Backup & Replication Bussiness Continuity 3 factores muy importantes Bussiness Continuity
  • 14. 13 High Availability Data Backup & Replication Disaster Recovery Garantiza la disponibilidad del servicio eliminando los puntos únicos de fallo, normalmente duplicando la infrastructura. Garantiza la restauación de manera rápida y eficaz de los servicios en caso de desastre. Garantiza los datos y su consisténcia junto con su disponibilidad en diferentes localizaciones. High Availability Disaster RecoveryData Backup & Replication Bussiness Continuity 3 factores muy importantes Business Continuity
  • 15. 14 High Availability Data Backup & Replication Disaster Recovery Garantiza la disponibilidad del servicio eliminando los puntos únicos de fallo, normalmente duplicando la infrastructura. Garantiza la restauación de manera rápida y eficaz de los servicios en caso de desastre. Garantiza los datos y su consisténcia junto con su disponibilidad en diferentes localizaciones. High Availability Disaster RecoveryData Backup & Replication Bussiness Continuity 3 factores muy importantes Business Continuity Business Continuity
  • 16. 15 Sistema Operativo Datos de aplicación OS vs App Data Diferencias entre backups de sistema y datos Requisitos restore: - HW (Phys-Virt) - Red RPO vs RTORTO vs RPO Requisitos restore: - Sistema configurado - Agente instalado SysAdmin Backup Admin
  • 19. 18 ¿Qué es DRLM? Disaster Recovery Linux Manager
  • 21. 20 DRLM Proceso de backup Validar cliente Registrar Backup Registrar Backup Backup Habilitar Backup Generar imagen DR Calcular uso en disco del cliente Ejecutar Backup cliente Failure Report ERROR
  • 22. 21 DRLM Proceso de recover Net Boot Restaurar Backup Recover Reboot Modo Rescue Load kernel & initrd Recrear Layout
  • 23. 22 Arquitecura DRLM Protocolos y servicios DHCP NFS SSH DRLM STORE TFTP HTTPs
  • 25. 24 Network operations Backup operations Client operations DRLM CLI Network Operations ● Add Networks ● Delete Networks ● Modify Networks ● List Networks
  • 26. 25 Network operations Backup operations Client operations DRLM CLI Client Operations ● Add Clients ● Delete Clients ● Modify Clients ● List Clients ● Install Clients ( NEW!! )
  • 27. 26 Network operations Backup operations Client operations DRLM CLI Backup Operations ● Run Backups ● Delete Backups ● Manage Backups ● List Backups
  • 28. 27 Migraciones con DRLM Physical to Virtual (P2V) Physical Server VM Hypervisor
  • 29. 28 Migraciones con DRLM Virtual to Virtual (V2V) VM Hypervisor B VM Hypervisor A
  • 30. 29 Migraciones con DRLM Physical to Physical (P2P) Physical Server A Physical Server B
  • 31. 30 Migraciones con DRLM Virtual to Physical (V2P) VM Hypervisor Physical Server
  • 32. 31 DRLM Features ● Gestión centralizada ● Reporte de errores automático en caso de fallo ● Migración de sistemas GNU/Linux ● Recuperación completamente por red ● Debugging/Troubleshooting integrado en la DRLM CLI ● Desarrollado completamente en Bash ● Open Source
  • 33. 32 DRLM Roadmap ● Implementación GRUB2 para homogenización del netboot (multiarch) ● Mejoras en automatización ● Logs de ReaR en DRLM ● Export/Import de imágenes DR ● Backups incrementales ● Añadir soporte para CIFS, ISO, RSYNC, ... ● Integración con APIs de Virtualización y Cloud ● Mejoras en instalador y configuración DRLM ● Etc, etc, etc ...
  • 34. 33 DRLM Un poco de historia... Ago 2013: Arranca el proyecto DRLM (aka DRLS) Oct 2013: Primera publicación del código DRLM en Github. Dic 2013: Primera versión estable de DRLM (v1.0.0) Dic 2014: Integración completa de DLRM con ReaR (issue #522) – ReaR 1.17 Ene 2015: Publicadas las webs del proyecto DRLM www.drlm.org y docs.drlm.org
  • 35. 34 DRLM Un poco de historia... Mar 2015: Publicada la versión 1.1.1 de DRLM May 2015: Se define Roadmap para DRLM versión 2 Ene 2016: DRLM presente en el FOSDEM’16 Jun 2016: Congelado el código DRLM v2.0.0 - pendientes los últimos tests - cerrar nueva versión de la documentación Jun 2016: DRLM presente en OpenExpo’16
  • 36. 35 DRLM Caso de éxito: GRIFOLS GRIFOLS es la tercera empresa del mundo en el sector de los hemoderivados y la primera en Europa. El proyecto DRLM nace de la necesidad de GRIFOLS para gestionar el DR de sus sistemas GNU/Linux. Como empresa del sector farmacéutico debe cumplir con estrictos controles que agencias como la FDA (USA) y EMEA (Europa) les exigen para todo sistema y/o servicio relacionado con medicamentos. En Marzo de 2014 se finaliza la implementación de DLRM para la gestión del DR en Linux en los centros de datos de GRIFOLS. Además de la gestión de DR también lo usan como herramienta para las migraciones de sistemas P2P, P2V, V2P, V2V, despliegues de sistemas con una imagen template y clonación de entornos..
  • 38. Didac Oliveira Phone: +34 629 078 369 E-Mail: didac@brainupdaters.net Web: www.brainupdaters.net Copyright © 2016 - Brain Updaters, S.L.L. Licensed under Creative Commons (CC BY-NC-SA 4.0). DRLM and DRLM logo are registered trademarks of Brain Updaters, S.L.L. DRLM at Github: github.com/brainupdaters/drlm DRLM website: drlm.org DRLM Docs: docs.drlm.org