Tolerancia a fallos comprometida – HP Blade de almacenamiento HP SB40c Manual del usuario

Página 24

Advertising
background image

Solución de problemas 24

Tolerancia a fallos comprometida

Si fallan más unidades de disco duro de las que permite el método de tolerancia a fallos, éste se ve

comprometido y la unidad lógica falla. En tal caso, todas las solicitudes efectuadas desde el sistema

operativo se rechazan con errores irrecuperables. Lo más probable es que se pierdan datos, aunque

en ocasiones pueden recuperarse.
Un ejemplo de una situación en la que puede comprometerse la tolerancia a fallos es cuando falla la

unidad de un array mientras se reconstruye la otra unidad de dicho array. Si el array no tiene repuesto

en línea, fallan todas las unidades del array que estén configuradas con tolerancia a fallos de RAID 5.
La tolerancia a fallos comprometida también la suelen causar los problemas no relacionados con

unidades, como la pérdida temporal de alimentación en un sistema de almacenamiento o un cable

defectuoso. En tales casos, no tiene que sustituir las unidades físicas. No obstante, es posible que

haya perdido datos, especialmente si el sistema estaba ocupado cuando ocurrió el problema.

Recuperación tras comprometer la tolerancia a fallos

Si la tolerancia a fallos está comprometida y se insertan unidades de repuesto, la condición del volumen

lógico no mejora. Para recuperar datos, realice el procedimiento siguiente:

1.

Apague el SB40c (“

Apagado

” en la página

9

).

2.

Encienda el SB40c (“

Encendido

” en la página

9

).

En algunos casos, una unidad marginal se mantiene operativa el tiempo suficiente como para

permitir la realización de una copia de seguridad de los archivos importantes.

3.

Siempre que sea posible, realice copias de los datos importantes.

4.

Sustituya las unidades que han fallado.

Factores que deben considerarse antes de sustituir

las unidades de disco duro

Asegúrese de que el blade de servidor es la primera unidad que se apaga y la última que se enciende.

De esta manera se asegura que el sistema no marca erróneamente las unidades como fallidas cuando

se enciende el blade de servidor.
Antes de sustituir una unidad degradada:

Abra HP SIM y examine la ventana Error Counter (Contador de errores), donde aparecen

las unidades físicas de cada array para confirmar que ninguna otra unidad tiene errores.

(Para obtener más detalles, consulte la documentación de HP SIM en el CD de gestión.)

Asegúrese de que el array dispone de una copia de seguridad actual y válida.

Utilice las unidades de repuesto que tienen al menos una capacidad similar a la de la unidad más

pequeña del array. El controlador desconectará inmediatamente las unidades que no tengan una

capacidad suficiente.

Al extraer unidades que han fallado, tenga en cuenta las siguientes precauciones para reducir al mínimo

la probabilidad de que se produzcan errores graves del sistema:

No extraiga una unidad degradada si cualquier otra unidad del array está fuera de línea

(el LED en línea está apagado). En esta situación, ninguna otra unidad del array se puede

quitar sin perder datos.

Advertising