Efectos de un fallo de la unidad de disco duro, Tolerancia a fallos comprometida – HP Controladora HP Smart Array P400 Manual del usuario

Página 28

Advertising
background image

Sustitución, traslado o adición de unidades de disco duro 28

Systems Insight Manager puede detectar remotamente, a través de una red, las unidades que han
fallado (para obtener más información sobre Systems Insight Manager, consulte la documentación
del CD de gestión).

ADU enumerará todas las unidades fallidas.

Para obtener más información sobre el diagnóstico de problemas con unidades de disco duro, consulte la
HP Servers Troubleshooting Guide (Guía de solución de problemas de los servidores de HP).

PRECAUCIÓN: en ocasiones, una unidad que ha fallado anteriormente con el controlador puede parecer

funcionalmente correcta después de volver a arrancar el sistema o (si es una unidad de conexión en caliente)
tras su extracción y reinserción. Sin embargo, el uso continuado de dichas unidades marginales puede
provocar la pérdida de datos. Sustituya cuanto antes la unidad marginal.

Efectos de un fallo de la unidad de disco duro

Cuando falla una unidad de disco duro, todas las unidades lógicas situadas en el mismo array se ven
afectadas. Cada unidad lógica del array puede estar utilizando un método distinto de tolerancia a fallos,
por lo que puede verse afectada de manera diferente.

Las configuraciones de RAID 0 no toleran el fallo de una unidad. Si falla alguna unidad física del
array, también fallan todas las unidades lógicas sin tolerancia a fallos (RAID 0) de dicho array.

Las configuraciones de RAID 1+0 pueden tolerar varios fallos de unidad siempre y cuando las
unidades fallidas no estén duplicadas entre sí.

Las configuraciones de RAID 5 toleran un fallo de unidad.

Las configuraciones de RAID 6 (ADG) toleran el fallo simultáneo de dos unidades.

Tolerancia a fallos comprometida

Si fallan más unidades de disco duro de las que permite el método de tolerancia a fallos, éste se ve
comprometido y la unidad lógica falla. En tal caso, todas las solicitudes efectuadas desde el sistema
operativo se rechazan con errores irrecuperables. Es probable que pierda datos, aunque algunas veces
pueden recuperarse (consulte “

Recuperación tras comprometer la tolerancia a fallos

” en la página

28

).

Un ejemplo de una situación en la que puede comprometerse la tolerancia a fallos es cuando falla la
unidad de un array mientras se reconstruye la otra unidad de dicho array. Si el array no tiene repuesto
en línea, fallan todas las unidades del array que estén configuradas con tolerancia a fallos de RAID 5.

La tolerancia a fallos comprometida también la suelen causar los problemas no relacionados con
unidades, como la pérdida temporal de alimentación en un sistema de almacenamiento o un cable
defectuoso. En tales casos, no tiene que sustituir las unidades físicas. No obstante, es posible que
haya perdido datos, especialmente si el sistema estaba ocupado cuando ocurrió el problema.

Recuperación tras comprometer la tolerancia a fallos

Si la tolerancia a fallos está comprometida y se insertan unidades de repuesto, la condición del volumen
lógico no mejora. En su lugar, si aparecen mensajes de error irrecuperable en la pantalla, pruebe el
siguiente procedimiento para recuperar los datos.

1.

Apague todo el sistema y, a continuación, vuelva a encenderlo. En algunos casos, una unidad
marginal vuelve a funcionar durante el tiempo suficiente como para poder realizar copias de los
ficheros importantes.
Si aparece un mensaje 1779 POST, pulse F2 para activar de nuevo los volúmenes lógicos. Recuerde
que lo más probable es que se hayan perdido datos y que la integridad de los datos del volumen
lógico no sea fiable.

2.

Siempre que sea posible, realice copias de los datos importantes.

Advertising
Este manual se refiere a los siguientes productos: