Eventos relacionados – HP Software HP Matrix Operating Environment Manual del usuario

Página 42

Advertising
background image

el concepto de un clúster para los nodos de un SRD. En un clúster, hay un nodo maestro y los
demás nodos son no maestros. Si el nodo maestro pierde el contacto con el resto del SRD, el resto
del SRD puede continuar sin él, como un clúster parcial, acordando un nuevo maestro de forma
unánime. Si un no maestro pierde la comunicación con el resto del SRD, el clúster parcial resultante
continúa su operación sin el nodo perdido. El maestro simplemente omite el nodo que falta hasta
que vuelve a estar disponible.

Puede utilizar el comando gwlmstatus para supervisar la disponibilidad. Puede indicarle si
algún host no puede reincorporarse al SRD de un nodo, así como si los hosts del SRD no responden.
Para obtener más información, consulte gwlmstatus(1M).

NOTA:

Los intentos de reformar los SRD pueden exceder el tiempo de espera, sin dejar ningún

SRD implementado y, por consiguiente, sin gestión de las asignaciones de recursos. Si ocurre
esto, consulte Notas de la versión de HP Matrix Operating Environment y siga las acciones
sugeridas en la sección titulada “Data Missing in Real-time Monitoring” (Falta de datos en la
supervisión de tiempo real).

Eventos relacionados

Puede configurar los siguientes eventos de System Insight Manager relativos a esta característica
de reinicio automático:

El nodo no ha podido volver a unirse al SRD en el inicio

El SRD se ha reformado con un conjunto de nodos parcial

Problema de comunicación del SRD

Para obtener información sobre la activación y visualización de estos eventos, consulte
Optimize

→Global Workload Manager→Events.

Después puede ver estos eventos utilizando el elemento Event Lists en el panel izquierdo de System
Insight Manager.

Las secciones siguientes explican cómo gestionar algunos de los eventos.

Evento “Node Failed to Rejoin SRD on Start-up” (El nodo no ha podido reincorporarse al SRD en
el inicio)

Evento “Node Failed to Rejoin SRD on Start-up” (El nodo no ha podido reincorporarse al SRD en
el inicio):
1.

Reinicie gwlmagent en cada nodo gestionado del SRD afectado:

#/opt/gwlm/bin/gwlmagent --restart

2.

Verifique que el agente ha reincorporado el SRD mediante la supervisión de la vista Shared
Resource Domain (Dominio de recursos compartidos) en System Insight Manager o utilizando
el comando gwlm monitor.

3.

Si el problema persiste, compruebe los archivos /var/opt/gwlm/gwlmagent.log.0 y
/var/opt/gwlm/gwlmcmsd.log.0

para ver mensajes de diagnóstico adicionales.

Eventos “SRD Communication Issue” (Problema de comunicación del SRD) y “SRD Reformed with
Partial Set of Nodes” (SRD reformado con conjunto de nodos parcial)

NOTA:

La reforma con un conjunto de nodos parcial requiere un mínimo de tres nodos

gestionados en el SRD.

NOTA:

Los eventos “SRD Communication Issue” no están activados de forma predeterminada.

Para ver estos eventos, configure los eventos en System Insight Manager mediante la barra de
menús de HP Matrix OE Visualization utilizando Tools

→Global Workload Manager→Events.

Si tiene un SRD que contiene n nodos y obtiene n - 1 de los eventos “SRD Communication Issue”
(Problema de comunicación del SRD) y ningún evento “SRD Reformed with Partial Set of Nodes”

42

Tareas adicionales de configuración y administración

Advertising