1. MAD · NOV 22-23 · 2019
@Christianhxc
Diferencias Entre DevOps y SRE
¿Enemigos? ¿Amigos? ¿Que Rayos?
Christian Melendez
Cloud Architect | Equinix
2. MAD · NOV 22-23 · 2019
@Christianhxc
$whoami
Christian Melendez
Cloud Architect at Equinix
Technical Writter: InfoQ, dev.to, HitSubscribe
Kubernetes, Docker, Cloud, DevOps
Developer at Heart!
3. MAD · NOV 22-23 · 2019
@Christianhxc
¿Genesis de la charla?
https://dev.to/scalyr/devops-vs-sre-4-important-differences-1fa2
4. MAD · NOV 22-23 · 2019
@Christianhxc
En el episodio de hoy …
Primero: Definamos
Quitando “silos” en la organizacion
Midiendo una implementacion existosa
Alcanzar practicas de CI/CD
Aceptando los fallos
¿Entonces? ¿Amigos o no?
5. MAD · NOV 22-23 · 2019
@Christianhxc
Primero: Definamos
Asi tenemos claros los conceptos
6. MAD · NOV 22-23 · 2019
@Christianhxc
¿Quien ha dicho esto?
7. MAD · NOV 22-23 · 2019
@Christianhxc
¿Cuando empezamos a escuchar DevOps?
https://www.youtube.com/watch?v=LdOe18KhtT4
8. MAD · NOV 22-23 · 2019
@Christianhxc
¿Que es DevOps?
”DevOps is [the] set of cultural norms and technology practices that [enables]
the fast flow of planned work from, among others, development, through tests
into operations while preserving world-class reliability, operation and security.
DevOps isn't about what you do, but what your outcomes are.”
Gene Kim
9. MAD · NOV 22-23 · 2019
@Christianhxc
“Lo perfecto es enemigo de lo bueno"
Voltaire
10. MAD · NOV 22-23 · 2019
@Christianhxc
¿Que es SRE?
” SRE is what happens when you ask a software engineer to design an
operations team.”
Ben Treynor
A medida que el sistema escala, menos interaccion humana (toil)
11. MAD · NOV 22-23 · 2019
@Christianhxc
Responsabilidades de SRE
Disponibilidad (Tolerante a fallos)
Latencia (Tiempo de respuesta)
Rendimiento (Tiempo adecuado de respuesta)
Eficiencia (Maximo uso de los recursos)
Conformidad (Velocidad)
Monitoreo, Alertas, Tickets
Emergencias (MTTR, MTTF)
Plan de Capacidad (Autoscaling, Reservas, etc.)
12. MAD · NOV 22-23 · 2019
@Christianhxc
Quitando “Silos” en la organizacion
¿Developers contra Sysadmins?
13. MAD · NOV 22-23 · 2019
@Christianhxc
¿Como lo hace DevOps?
14. MAD · NOV 22-23 · 2019
@Christianhxc
¿Automatizar?
15. MAD · NOV 22-23 · 2019
@Christianhxc
¿Como lo hace SRE?
Responsabilidad Compartida
Mismas herramientas y perspectiva
16. MAD · NOV 22-23 · 2019
@Christianhxc
¿Como lo hace SRE?
Time
17. MAD · NOV 22-23 · 2019
@Christianhxc
“We were drawn to the SRE model because it fully embraces and accepts
the differences between operations and development while encouraging
teams to work toward a common goal. It does not try to transform operations
engineers into application developers, or vice versa. Instead, it gives both a
common frame of reference.”
SRE Book
18. MAD · NOV 22-23 · 2019
@Christianhxc
Midiendo una implementacion exitosa
Si no mides, ¿Como sabes que has mejorado?
21. MAD · NOV 22-23 · 2019
@Christianhxc
SRE
SLIs, SLOs, SLAs
Service Level Indicator: latencia, tasa de errores, throughput
Service Level Objective: limite al que deberian llegar los SLIs
Service Level Agreement: acuerdo entre cliente y empresa (€€€)
Actividades del dia a dia son orientadas por estas metricas
22. MAD · NOV 22-23 · 2019
@Christianhxc
Presupuesto de Errores
¿Cuantos 9s de disponibilidad tenemos?
¿Cuanto estas dispuesto a gastar?
¿Estas seguro de querer desplegar ahora?
Promueven la conversacion
23. MAD · NOV 22-23 · 2019
@Christianhxc
SRE
https://techbeacon.com/enterprise-it/why-you-need-error-budget-how-make-it-work
How Reliable? Speed & Quality
24. MAD · NOV 22-23 · 2019
@Christianhxc
SLOs
”SLOs are a tool to help determine what engineering work to prioritize. For
example, consider the engineering tradeoffs for two reliability projects:
automating rollbacks and moving to a replicated data store. By calculating the
estimated impact on our error budget, we can determine which project is
most beneficial to our users”
25. MAD · NOV 22-23 · 2019
@Christianhxc
Alcanzar practicas de CI/CD
Herramientas y automatizacion
26. MAD · NOV 22-23 · 2019
@Christianhxc
DevOps
Automatizar cuanto se pueda*
Deployments y releases aburridos
Production-like
Proposito: Velocidad y Calidad
27. MAD · NOV 22-23 · 2019
@Christianhxc
SRE
¿Automatizar todo? Hmm
Reducir tareas manuales y aburridas
Enfocarse en cosas mas importantes
50% del tiempo en reducir “toil”
Proposito: Reducir el costo de fallo
32. MAD · NOV 22-23 · 2019
@Christianhxc
Vamos concluyendo entonces …
Yo ya estoy muriendo del hambre
33. MAD · NOV 22-23 · 2019
@Christianhxc
SRE es mas dogmatico en como operar, tiene
sugerencias mas concretas de como cambiar
tus practicas de trabajo, por lo tanto requiere
ADAPTACION
34. MAD · NOV 22-23 · 2019
@Christianhxc
DevOps es un poco mas complicado de definir,
traducirlo a pasos mas concretos, es muy
amplio … pero por eso mismo es menos
probable que se le tenga RESISTENCIA
35. MAD · NOV 22-23 · 2019
@Christianhxc
class SRE implements interface DevOps
36. MAD · NOV 22-23 · 2019
@Christianhxc
Libros: Tareas para llevar a casa
Al final, se trata de profundizar mas
38. MAD · NOV 22-23 · 2019
@Christianhxc
SRE
https://landing.google.com/sre/books/
39. MAD · NOV 22-23 · 2019
@Christianhxc
“Al final del dia, todos enfrentamos el mismo
problema: produccion, y como hacerlo mejor …
no importa como lo llamemos”
The Site Reliability Workbook
40. MAD · NOV 22-23 · 2019
@Christianhxc
¡Gracias!
Christian Melendez
Cloud Architect at Equinix
cmelendeztech.com
https://devopsdays.org/events/2020-madrid/welcome/