1En el interior del disco duro del logotipoProblemas de hardware RAID y de disco duro de los consumidores

Hace un par de años tuve la suerte de tener la opor-tun-dad de com-pra de una segunda mano incursión hardware 5 tarjeta (una Areca 1220) por un precio muy bajo. Desde entonces, he utilizado la tarjeta junto con varios conjuntos de unidades (300gig ori-gen-te, entonces 750gig y 1 TB actual-mente) en un PC servidor dedicado como una gran red archivo-almacén para la música de la familia, fotos, videos y copias de seguridad.

Antes de obtener la tarjeta de hardware He intentado utilizar la incursión del software, pero encontró que los resultados muy decepcionante. El servidor tiene un bajo poder, CPU de un solo núcleo que no es realmente hasta la tarea de actuar como un motor de RAID-5. Mientras que he oído un montón de veces que RAID No es una copia de seguridad, este es un caso en el que sólo una solución barata va a hacer. RAID-5 protección de las ofertas de fallo del disco sola, que es lo suficientemente bueno para mis propósitos. La tarjeta dedicada ofrece una enorme ventaja en el rendimiento, pero en la práctica esto no es muy importante. Las características que añade sin embargo, son! La tarjeta ofrece una Areca LA solución RAID independiente que cuenta mucho. También ofrece la capacidad de expansión y migración de nivel RAID en línea (así, por ejemplo, Podría actualizar a RAID-6). Ambas características son mucho menos simples con soluciones más económicas..

Asi que, se podría pensar, ¿cuál es el problema. La respuesta: la falta de opciones de los fabricantes de disco duro ...

Desde que el uso de la tarjeta de Areca He sufrido de la unidad de vez en cuando “fallos”. Una vez apagado y el encendido reaparece como unidad completamente funcional. Entonces tengo que pasar muchas horas reconstrucción de la matriz de degradado de nuevo a normal. Después de mucho buscar he diagnosticado el problema, pero soy incapaz de resolver adecuadamente.

Fabricantes de discos duros ofrecen una gama de unidades para diferentes propósitos. Las unidades típicas de la mayoría de nosotros compra son unidades de nivel de consumo. Los fabricantes también unidades de clase empresarial ofrecen diseñados para servidores que tienen patrones de uso intensivo y 24.7 el tiempo de actividad. Estas unidades son a menudo físicamente idénticos, pero tienen pruebas adicionales sufrido y se suministran con un poco diferente firmware, optimizado para cargas de trabajo de servidor.

Una de estas características es el control de recuperación de errores (ERC). Esta función también se llama CCLT (Límite de tiempo de finalización de comandos) por Samsung y Hitachi y TLER (Errores en tiempo limitado recuperación) por Western Digital. Todas las unidades sufren el error de vez en cuando a nivel físico, que podrían ser causados ​​por cosas como los rayos cósmicos callejeros. Estos errores son manejados por redundancia incorporada en la forma en que los datos de las tiendas de unidad, pero de vez en cuando uno puede ser lo suficientemente grave como para causar problemas de lectura de datos. unidades de consumo normales pasarán un periodo prolongado de intentar leer los datos dañados para recuperarla. A continuación, asignan a una nueva parte de la unidad y todo sigue como de costumbre. Sin embargo, esta demora puede causar graves problemas en entornos empresariales, por lo que las unidades de la empresa tendrán tiempo de espera sus intentos de auto-reparación después de un corto período (en general 7 segundos o menos) y reportar el error a la controladora RAID. El controlador RAID entonces controla el error recalculando los datos utilizando las otras unidades de la matriz. Esto evita grandes retrasos en el envío de datos, pero requiere la presencia de otras unidades y un controlador RAID.

Asi que, Tengo una tarjeta de hardware RAID adecuado. Se espera volver a escuchar de unidades dentro de no más de 7-8 segundos, independientemente de un error. También tengo los discos duros de los consumidores, que tratan de reparar sus propios errores durante un largo periodo. Así que cuando se produce un error de la unidad trata de arreglarlo, no responde dentro de 7-8 segundos, y el regulador de la incursión que asume la unidad ha fallado y lo patea fuera de la matriz.

Asi que, las soluciones obvias serían en decir el regulador de la incursión que esperar más tiempo sin dar patadas a un viaje en coche, O decirle a la unidad a renunciar después 7 segundo, como una unidad de la empresa ... exasperantemente, tampoco es posible!

He buscado extensivamente, pero no puedo encontrar ningún RAID 5-tarjetas adecuadas que permiten al usuario cambiar cuánto tiempo van a esperar por una unidad. En el pasado hubo algunas unidades WD que podrían tener la característica TLER habilitado con una utilidad publicado por WD llamado WD-TLER, pero recientemente WD haya desactivado esta opción, presumiblemente para "proteger" el margen de beneficio enorme en sus unidades para empresas (que son el doble por el mismo hardware)

Algunas personas han encontrado maneras de activar temporalmente ERC en algunas unidades que utilicen cualquiera HDAT2, Smartctl o hdparm, sin embargo, estos no son compatibles con mi RAID tarjeta de bajo Windows, y el cambio se pierde si el PC se realiza un ciclo de potencia.

Para los usuarios como yo que necesitan una gran capacidad de almacenamiento, y las características ofrecidas por una solución de hardware RAID-5, pero que no necesitan 24.7 el tiempo de actividad, garantías largas o unidades diseñados para uso pesado actualmente no existe una solución adecuada. Ya es tiempo, ya sea un fabricante de la unidad dirigida a este mercado (mediante la liberación de una unidad de consumidor con ERC permitido para una pequeña, e.g. 15%, prima) o un fabricante raid-tarjeta se dirigió al mercado ofreciendo una tarjeta con la opción de aumentar el tiempo antes de que las unidades se miden el tiempo hacia fuera. La creación de cualquiera de estas soluciones es trivial, un simple cambio de firmware haría el trabajo.

Hasta entonces, Aconsejo a otros a evitar el uso de tarjetas de hardware RAID con unidades de consumo, y dada la prima de precio de las unidades empresariales, recomiendo evitar las incursiones de hardware por completo.

Deja una respuesta

Uno Comentario

JSJon Scaife

¿Tiene Hitachi CCLT apoyo a través de su herramienta de funciones? Una respuesta de correo electrónico publicado en el HardForum parece sugerir lo. Tiempo para obtener una confirmación ...

Respuesta