Desde el equipo de SREs de Payvision hemos creado una prueba de concepto para incorporar Open MCT en nuestro stack de observabilidad y queremos compartir la experiencia con otros desarrolladores, estudiantes y analistas que tengan interés en conocer las herramientas que utilizamos para analizar y optimizar el comportamiento de nuestros sistemas en producción.
¿Cuántos recursos consume un servicio que no está recibiendo tráfico? ¿Cómo impacta la actualización de una librería en términos de rendimiento? ¿Dispones de la información necesaria para determinar quién actúa como cuello de botella? ¿Qué capacidad necesitas para sobrevivir a un pico de tráfico inesperado? ¿Por qué necesitas responder a tantas preguntas? Intentaré responder a estas y otras con ejemplos concretos de incidentes reales.