Efectos de un fallo de la unidad de disco duro, Tolerancia a fallos comprometida – HP Controladora HP Smart Array E200 Manual del usuario

Página 26

Advertising
background image

Sustitución, traslado o adición de unidades de disco duro 26

Para obtener más información sobre el diagnóstico de problemas con unidades de disco duro, consulte
la HP Servers Troubleshooting Guide (Guía de solución de problemas de los servidores de HP).

PRECAUCIÓN: en ocasiones, una unidad que ha fallado anteriormente con el controlador puede parecer

funcionalmente correcta después de volver a arrancar el sistema o (si es una unidad de conexión en
caliente) tras su extracción y reinserción. Sin embargo, el uso continuado de dichas unidades marginales
puede provocar la pérdida de datos. Sustituya cuanto antes la unidad marginal.

Efectos de un fallo de la unidad de disco duro

Cuando falla una unidad de disco duro, todas las unidades lógicas situadas en el mismo array se ven
afectadas. Las unidades lógicas del array pueden utilizar métodos distintos de tolerancia a fallos, por lo
que cada unidad lógica puede verse afectada de manera diferente.

Las configuraciones de RAID 0 no toleran el fallo de una unidad. Si falla alguna unidad física del
array, también fallan todas las unidades lógicas sin tolerancia a fallos (RAID 0) de dicho array.

Las configuraciones de RAID 1+0 pueden tolerar varios fallos de unidad siempre y cuando las
unidades fallidas no estén duplicadas entre sí.

Las configuraciones de RAID 5 toleran un fallo de unidad.

Tolerancia a fallos comprometida

Si fallan más unidades de disco duro de las que permite el método de tolerancia a fallos, éste se ve
comprometido y la unidad lógica falla. En tal caso, todas las solicitudes efectuadas desde el sistema
operativo se rechazan con errores irrecuperables. Es probable que pierda datos, aunque algunas veces
pueden recuperarse (consulte “

Recuperación tras comprometer la tolerancia a fallos

” en la página

26

).

Un ejemplo de una situación en la que puede comprometerse la tolerancia a fallos es cuando falla la
unidad de un array mientras se reconstruye la otra unidad de dicho array. Si el array no tiene repuesto
en línea, fallan todas las unidades del array que estén configuradas con tolerancia a fallos de RAID 5.

La tolerancia a fallos comprometida también la suelen causar los problemas no relacionados con
unidades, como la pérdida temporal de alimentación en un sistema de almacenamiento o un cable
defectuoso. En tales casos, no tiene que sustituir las unidades físicas. No obstante, es posible que haya
perdido datos, especialmente si el sistema estaba ocupado cuando ocurrió el problema.

Recuperación tras comprometer la tolerancia a fallos

Si la tolerancia a fallos está comprometida y se insertan unidades de repuesto, la condición del volumen
lógico no mejora. En su lugar, si aparecen mensajes de error irrecuperable en la pantalla, pruebe el
siguiente procedimiento para recuperar los datos.

1.

Apague todo el sistema y, a continuación, vuelva a encenderlo. En algunos casos, una unidad
marginal vuelve a funcionar durante el tiempo suficiente como para poder realizar copias de los
ficheros importantes.
Si aparece un mensaje 1779 POST, pulse F2 para activar de nuevo los volúmenes lógicos.
Recuerde que lo más probable es que se hayan perdido datos y que la integridad de los datos del
volumen lógico no sea fiable.

2.

Siempre que sea posible, realice copias de los datos importantes.

3.

Sustituya las unidades que han fallado.

4.

Una vez sustituidas las unidades que han fallado, es posible que vuelva a comprometerse la
tolerancia a fallos. Si es así, apague y vuelva a encender de nuevo el suministro de alimentación.
Si aparece el mensaje POST 1779:

a.

Pulse la tecla F2 para volver a activar las unidades lógicas.

Advertising