1Inside Logo HDDproblèmes de disque dur RAID de consommation et du matériel

Il y a quelques années j'ai eu la chance d'avoir la possibilité d'acheter un second raid matériel main 5 carte (un Areca 1220) pour un prix très bas. Depuis, je l'ai utilisé la carte ainsi que plusieurs séries de disques (à l'origine 300gig, puis 750gig et actuellement 1To) dans un PC serveur dédié en tant que grand magasin de fichiers réseau pour la musique de la famille, les photos, des vidéos et des back-ups.

Avant d'obtenir la carte matérielle, j'ai essayé d'utiliser un raid logiciel, mais j'ai trouvé les résultats très décevants. Le serveur a une faible puissance, processeur monocœur qui n'est pas vraiment à la hauteur de la tâche d'agir comme un moteur de raid-5. Bien que j'aie entendu maintes fois que RAID n'est pas une sauvegarde, c'est un cas où seule une solution bon marché fera l'affaire. RAID-5 offre une protection contre les pannes d'un seul disque, ce qui est assez bon pour mes besoins. La carte dédiée offre un énorme avantage de performance, mais en pratique ce n'est pas très important. Les fonctionnalités qu'il ajoute sont cependant! La carte Areca offre un LA solution de raid indépendante qui compte pour beaucoup. Il offre également une extension de capacité en ligne et une migration au niveau du raid (si, par exemple, Je pourrais passer au raid-6). Ces deux fonctionnalités sont beaucoup moins simples avec des solutions moins chères.

Si, tu pourrais penser, quel est le problème. La réponse: le manque d'options des fabricants de disques durs…

Depuis que j'utilise la carte Areca, je souffre de « pannes » occasionnelles de lecteur. Lors de la mise hors tension et sous tension, le lecteur réapparaît comme entièrement fonctionnel. Je dois ensuite passer de nombreuses heures à reconstruire le tableau de dégradé à la normale. Après de nombreuses recherches, j'ai diagnostiqué le problème, mais je suis incapable de le résoudre correctement.

Les fabricants de disques durs proposent une gamme de disques à des fins différentes. Les lecteurs typiques que la plupart d'entre nous achètent sont des lecteurs de niveau consommateur. Les fabricants proposent également des disques de classe entreprise conçus pour les serveurs qui ont des modèles d'utilisation intensifs et 24.7 disponibilité. Ces disques sont souvent physiquement identiques, mais ont subi des tests supplémentaires et sont fournis avec un firmware légèrement différent, optimisé pour les charges de travail du serveur.

L'une de ces fonctionnalités est le contrôle de récupération d'erreur (CER). Cette fonctionnalité est également appelée CCTL (Limite de temps d'exécution de la commande) par Samsung et Hitachi et TLER (Récupération d'erreur limitée dans le temps) par Western Digital. Tous les lecteurs souffrent d'erreurs occasionnelles au niveau physique, qui pourrait être causé par des choses comme les rayons cosmiques parasites. Ces erreurs sont gérées par la redondance intégrée dans la façon dont le lecteur stocke les données, mais parfois on peut être assez grave pour causer des problèmes de lecture des données. Les disques grand public normaux passeront une période prolongée à essayer de lire les données endommagées pour les récupérer. Ils le mappent ensuite sur une nouvelle partie du lecteur et tout continue normalement. Cependant, ce retard peut causer de graves problèmes dans les environnements d'entreprise, ainsi les disques d'entreprise expireront leurs tentatives d'auto-réparation après une courte période (habituellement 7 seconds or so) et signaler l'erreur au contrôleur de raid. Le contrôleur RAID gère ensuite l'erreur en recalculant les données à l'aide des autres lecteurs de la matrice. Cela évite des retards importants dans l'envoi de données, mais nécessite la présence d'autres disques et d'un contrôleur RAID.

Si, J'ai une carte raid matérielle appropriée. Il s'attend à recevoir une réponse des disques dans un délai maximum de 7 à 8 secondes, indépendamment d'une erreur. j'ai aussi des disques durs grand public, qui tentent de réparer leurs propres erreurs pendant une longue période. Ainsi, lorsqu'une erreur se produit, le lecteur essaie de la réparer, ne répond pas dans les 7 à 8 secondes, et le contrôleur RAID suppose que le lecteur est en panne et l'expulse de la matrice.

Si, les solutions évidentes seraient soit de dire au contrôleur de raid d'attendre plus longtemps sans expulser un lecteur, OU dites au lecteur d'abandonner après 7 secondes comme un disque d'entreprise… Exaspérant, ni l'un ni l'autre n'est possible!

j'ai beaucoup cherché, mais je ne trouve aucune carte raid-5 appropriée permettant à l'utilisateur de modifier le temps d'attente d'un lecteur. Dans le passé, certains disques WD pouvaient avoir la fonction TLER activée avec un utilitaire publié par WD appelé WD-TLER, mais récemment WD a désactivé cette option, probablement pour « protéger » l'énorme marge sur leurs disques d'entreprise (qui sont le double du prix pour le même matériel)

Certaines personnes ont trouvé des moyens d'activer temporairement l'ERC sur certains disques en utilisant soit HDAT2, SmartCTL ou hdparm, cependant ceux-ci ne prennent pas en charge mon RAID carte sous Windows, et la modification est perdue si le PC est redémarré.

Pour les utilisateurs comme moi qui ont besoin d'un stockage de grande capacité, et les fonctionnalités offertes par une solution matérielle RAID-5, mais cela n'a pas besoin 24.7 disponibilité, de longues garanties ou des lecteurs conçus pour un usage intensif, il n'y a actuellement AUCUNE solution appropriée. Il est grand temps qu'un fabricant de variateurs s'adresse à ce marché (en libérant un lecteur grand public avec ERC activé pour un petit, par exemple. 15%, prime) ou un fabricant de cartes de raid s'est adressé au marché en proposant une carte avec la possibilité d'augmenter le délai avant l'expiration des disques. Créer l'une ou l'autre de ces solutions est trivial, un simple ajustement du firmware ferait l'affaire.

Jusque là, Je conseille aux autres d'éviter d'utiliser des cartes RAID matérielles avec des lecteurs grand public, et compte tenu du prix plus élevé des disques d'entreprise, je recommande d'éviter complètement le raid matériel.

Laisser un commentaire

Un Commentaire