15 conmutación por error, Qué es la conmutación por error, Conmutación por error controlada – HP Copia de seguridad HP StoreOnce Manual del usuario

Página 180: Conmutación por error descontrolada

Advertising
background image

15 Conmutación por error

En esta sección:

¿Qué es la conmutación por error? (página 180)

¿Qué sucede durante la conmutación por error? (página 181)

¿Qué es lo que debe hacer el usuario? (página 182)

Ejecución de reserva (página 182)

¿Qué es la conmutación por error?

La conmutación por error se produce cuando las sesiones de software activas dejan de ejecutarse
en un nodo de un pareado dentro de un clúster y se mueven y reinician en el otro nodo dentro
del pareado. Todos los dispositivos VTL configurados, los recursos compartidos de NAS, las
asignaciones de replicación y los almacenamientos StoreOnce Catalyst quedan disponibles dentro
de los 15 minutos de fallar en el nodo original. El Estado de conmutación por error del conjunto
de servicios se muestra en la página HP StoreOnce.

Existen dos tipos de conmutación por error: la controlada y la descontrolada.

NOTA:

La conmutación por error se produce solo entre nodos de un pareado y no entre pareados

de un clúster.

Conmutación por error controlada

Una conmutación por error controlada es cuando un nodo que está fallando todavía se encuentra
en un estado en el que puede administrar de forma activa cualquier conexión abierta en el punto
de fallo. Puede completar un apagado correcto de todos los dispositivos virtuales que se ejecutan
en el nodo antes de que el nodo se quite de su uso en el clúster.

El modelo actual para una conmutación por error controlada es para algunas instancias de
mantenimiento del sistema, tales como la actualización de mantenimiento a uno de los elementos
de hardware, por ejemplo, el controlador de almacenamiento. En este caso, los dispositivos
virtuales en un nodo con fallo están disponibles para causar condiciones de errores conocidos o
de comprobación que se informarán a la aplicación de copia de seguridad a través de la interfaz
adecuada. Cuando el conjunto de servicio del nodo fallado se reinicie en el nodo pareado, la
energía en las comprobaciones será más rápida y simple, dado que se detuvo de manera
controlada

Conmutación por error descontrolada

Una conmutación por error descontrolada es cuando un nodo activo sufre un fallo de hardware
rápida y catastrófica u otros eventos provocados que causan que la Consola de administración
StoreOnce invoque su capacidad de apagar el nodo con falla.

Algunos ejemplos son:

La consola de administración de StoreOnce no recibe el latido del nodo del conjunto de
servicios.

El servidor del nodo se comporta como si estuviera apagado, por ejemplo, con el botón de
encendido.

Todas las comunicaciones de red internas del nodo fallan, lo que provoca la pérdida de
latido.

Pánico de núcleo del software, lo que provoca la pérdida de latido.

Las dos conexiones SAS al almacenamiento local del nodo, fallan.

180 Conmutación por error

Advertising