Políticas de respaldo

Introducción

Actualmente los discos duros de las máquinas primarias de MySQL y MongoDB son respaldados cada 10 minutos. Para este procedimiento se realizan snapshots del disco duro completo en la plataforma de Google Cloud.

Intervalo de tiempo disponible para recuperación

Se mantienen simultáneamente las últimas 12 copias de seguridad realizadas a cada disco duro cada 10 minutos, teniendo posibilidad de recuperación respecto a las últimas 2 horas.

Además de lo anterior, se mantiene un snapshot por hora durante las últimas 12 horas previas a las copias cada 10 minutos y finalmente se mantiene una copia diaria los últimos 7 días previos a las copias por hora.

Lo anterior suma un total de 31 copias de seguridad simultáneas para cada base de datos, permitiendo levantar el servicio ante fallas catastróficas a puntos que van desde los últimos 10 minutos de ocurrida la falla hasta los últimos 7 días de operación.

Tabla resumen:

Intervalo Cantidad Cobertura Tipo
10 minutos   12 2 horas Disco Completo
1 hora 12 12 horas Disco Completo
1 día 7 7 días Disco Completo

Asegurando la operación de los respaldos

La instrucción de copias de seguridad es ejecutada por una máquina automatizada en la nube dedicada a este propósito, distinta a las máquinas utilizadas para PostCenter, de tal manera que siempre se encuentre operando.

Levantando la infraestructura ante fallas catastróficas

Gracias a que PostCenter opera en la nube, el tiempo que toma recuperar la plataforma utilizando las copias de seguridad puede ser sumamente breve puesto que se crea una nueva maquina nueva utilizando una copia de disco completo que ya se encuentra preparado para iniciar el servicio.

En caso de un problema en alguna de las bases de datos, el equipo de desarrollo determinará el punto en el tiempo en el cual los datos se encuentran sin corrupción y utilizará esa copia para recrear toda la infraestructura.

Por norma general la recuperación puede tomar menos de 30 minutos ante un buen pronóstico.

Informando sobre fallas

Una falla de este tipo será notificada en nuestro sitio de Estado de Servicio, donde se especificará el tiempo estimado de solución y se dará a conocer el estado de avance de la solución en tiempo real.