Efectos de un fallo de la unidad de disco duro, Tolerancia a fallos comprometida – HP Controladora HP Smart Array P700m Manual del usuario

Página 21

Advertising
background image

Sustitución, traslado o adición de unidades de disco duro 21

El servicio de notificación de eventos envía un evento al registro de eventos del sistema

Microsoft® Windows® y al IML.

ADU enumerará todas las unidades fallidas.

Para obtener información adicional sobre el diagnóstico de problemas en unidades de disco duro,

consulte la HP Servers Troubleshooting Guide (Guía de solución de problemas de servidores de HP).

PRECAUCIÓN:

en ocasiones, una unidad que ha fallado anteriormente con el controlador

puede parecer funcionalmente correcta después de volver a arrancar el sistema o (si es

una unidad de conexión en caliente) tras su extracción y reinserción. Sin embargo, el uso
continuado de dichas unidades marginales puede provocar la pérdida de datos. Sustituya

cuanto antes la unidad marginal.

Efectos de un fallo de la unidad de disco duro

Cuando falla una unidad de disco duro, todas las unidades lógicas situadas en el mismo array se ven

afectadas. Cada unidad lógica del array puede estar utilizando un método distinto de tolerancia a fallos,

por lo que puede verse afectada de manera diferente.

Las configuraciones de RAID 0 no toleran el fallo de una unidad. Si falla alguna unidad física del

array, también fallan todas las unidades lógicas sin tolerancia a fallos (RAID 0) de dicho array.

Las configuraciones de RAID 1+0 pueden tolerar varios fallos de unidad siempre y cuando las

unidades fallidas no estén duplicadas entre sí.

Las configuraciones de RAID 5 toleran un fallo de unidad.

Las configuraciones de RAID 6 (ADG) toleran el fallo simultáneo de dos unidades.

Tolerancia a fallos comprometida

Si fallan más unidades de disco duro de las que permite el método de tolerancia a fallos, éste se ve

comprometido y la unidad lógica falla. En tal caso, todas las solicitudes efectuadas desde el sistema

operativo se rechazan con errores irrecuperables. Es probable que pierda datos, aunque algunas veces

pueden recuperarse (consulte “

Recuperación tras comprometer la tolerancia a fallos

” en la página

21

).

Un ejemplo de una situación en la que puede comprometerse la tolerancia a fallos es cuando falla la

unidad de un array mientras se reconstruye la otra unidad de dicho array. Si el array no tiene repuesto

en línea, fallan todas las unidades del array que estén configuradas con tolerancia a fallos de RAID 5.
La tolerancia a fallos comprometida también la suelen causar los problemas no relacionados con
unidades, como la pérdida temporal de alimentación en un sistema de almacenamiento o un cable

defectuoso. En tales casos, no tiene que sustituir las unidades físicas. No obstante, es posible que

haya perdido datos, especialmente si el sistema estaba ocupado cuando ocurrió el problema.

Recuperación tras comprometer la tolerancia a fallos

Si la tolerancia a fallos está comprometida y se insertan unidades de repuesto, la condición del volumen

lógico no mejora. En su lugar, si aparecen mensajes de error irrecuperable en la pantalla, pruebe el

siguiente procedimiento para recuperar los datos.

1.

Apague todo el sistema y, a continuación, vuelva a encenderlo. En algunos casos, una unidad

marginal vuelve a funcionar durante el tiempo suficiente como para poder realizar copias de los
ficheros importantes.

Advertising