Presentamos una interrupción del servicio durante 1 minuto, el sistema tardó un par de minutos en recuperarse completamente de las instancias que fallaron y todos los servicios están de vuelta a la normalidad. El problema principal estaba relacionado con el consumo del RDS y las instancias que se estaban refrescando se debían a que el RDS no estaba en buen estado. Estamos planeando actualizar la capacidad de la infraestructura para evitar esto en un futuro próximo.
We presented a service interruption for 1 minute, it took the system couple minutes for the instances that failed to recover completely and all services are operational now. The main issue was related to the RDS consumption and those instances being refreshed are due to the RDS being unhealthy. We are planning to upgrade the capacity of the infrastructure to avoid this in the near future.