Tolerancia a fallos comprometida – HP Blade de almacenamiento HP SB40c Manual del usuario
Página 24

Solución de problemas 24
Tolerancia a fallos comprometida
Si fallan más unidades de disco duro de las que permite el método de tolerancia a fallos, éste se ve
comprometido y la unidad lógica falla. En tal caso, todas las solicitudes efectuadas desde el sistema
operativo se rechazan con errores irrecuperables. Lo más probable es que se pierdan datos, aunque
en ocasiones pueden recuperarse.
Un ejemplo de una situación en la que puede comprometerse la tolerancia a fallos es cuando falla la
unidad de un array mientras se reconstruye la otra unidad de dicho array. Si el array no tiene repuesto
en línea, fallan todas las unidades del array que estén configuradas con tolerancia a fallos de RAID 5.
La tolerancia a fallos comprometida también la suelen causar los problemas no relacionados con
unidades, como la pérdida temporal de alimentación en un sistema de almacenamiento o un cable
defectuoso. En tales casos, no tiene que sustituir las unidades físicas. No obstante, es posible que
haya perdido datos, especialmente si el sistema estaba ocupado cuando ocurrió el problema.
Recuperación tras comprometer la tolerancia a fallos
Si la tolerancia a fallos está comprometida y se insertan unidades de repuesto, la condición del volumen
lógico no mejora. Para recuperar datos, realice el procedimiento siguiente:
1.
Apague el SB40c (“
” en la página
2.
Encienda el SB40c (“
En algunos casos, una unidad marginal se mantiene operativa el tiempo suficiente como para
permitir la realización de una copia de seguridad de los archivos importantes.
3.
Siempre que sea posible, realice copias de los datos importantes.
4.
Sustituya las unidades que han fallado.
Factores que deben considerarse antes de sustituir
las unidades de disco duro
Asegúrese de que el blade de servidor es la primera unidad que se apaga y la última que se enciende.
De esta manera se asegura que el sistema no marca erróneamente las unidades como fallidas cuando
se enciende el blade de servidor.
Antes de sustituir una unidad degradada:
•
Abra HP SIM y examine la ventana Error Counter (Contador de errores), donde aparecen
las unidades físicas de cada array para confirmar que ninguna otra unidad tiene errores.
(Para obtener más detalles, consulte la documentación de HP SIM en el CD de gestión.)
•
Asegúrese de que el array dispone de una copia de seguridad actual y válida.
•
Utilice las unidades de repuesto que tienen al menos una capacidad similar a la de la unidad más
pequeña del array. El controlador desconectará inmediatamente las unidades que no tengan una
capacidad suficiente.
Al extraer unidades que han fallado, tenga en cuenta las siguientes precauciones para reducir al mínimo
la probabilidad de que se produzcan errores graves del sistema:
•
No extraiga una unidad degradada si cualquier otra unidad del array está fuera de línea
(el LED en línea está apagado). En esta situación, ninguna otra unidad del array se puede
quitar sin perder datos.