1Dentro HDD LogoProblemas de RAID de hardware e HDD consumidor

Um par de anos atrás, eu tive a sorte de ter a oportunidade de comprar um raid de hardware de segunda mão 5 cartão (uma Areca 1220) por um preço muito baixo. Since then I have used the card along with sev­er­al sets of drives (ori-gem-aliado 300gig, então 750gig e 1TB correntemente) in a ded­ic­ated serv­er PC as a large net­work file-store for the fam­ily’s music, Pho-tos, vídeos e back-ups.

Before I obtained the hard­ware card I tried using soft­ware raid, but found the res­ults very dis­ap­point­ing. The serv­er has a low power, single core cpu which isn’t really up to the task of act­ing as a raid‑5 engine. Whilst I’ve heard plenty of times that RAID isn’t a back-up, this is a case where only a cheap solu­tion will do. RAID-5 offers pro­tec­tion from single drive fail­ure, which is good enough for my pur­poses. The ded­ic­ated card offers an enorm­ous per­form­ance advant­age, but in prac­tice this isn’t very import­ant. The fea­tures it adds how­ever are! The Areca card offers an OS inde­pend­ent raid solu­tion which counts for a lot. It also offers online capa­city expan­sion and raid-level migra­tion (assim, por exemplo, I could upgrade to raid‑6). Both of these fea­tures are much less simple with cheap­er solutions.

Assim, você poderia pensar, qual é o pro-blema. A resposta: a falta de opções de fabricantes de disco rígido ...

Ever since using the Areca card I have suffered from occa­sion­al drive “fail­ures”. Upon power­ing off and on the drive reappears as fully func­tion­al. Eu, então, tem que passar muitas horas a reconstrução da matriz de degradada volta ao normal. Depois de muito procurar eu ter diagnosticado o problema, mas sou incapaz de sustentar-mente resolvê-lo.

Fabricantes de disco rígido fornecem uma gama de unidades para fins diferentes. The typ­ic­al drives most of us buy are con­sumer level drives. The man­u­fac­tur­ers also offer enter­prise-class drives designed for serv­ers which have intens­ive use pat­terns and 24.7 uptime. These drives are often phys­ic­ally identic­al, but have under­gone addi­tion­al test­ing and are sup­plied with slightly dif­fer­ent firm­ware, optim­ised for serv­er workloads.

Um desses recursos é o Controle de Recuperação de Erros (ERC). Este FEA-estrutura também é chamado CCTL (Com­mand Com­ple­tion Time Lim­it) por Sam-sung e Hita-chi e TLER (Time-Lim­ited Error Recov­ery) by West­ern Digit­al. All drives suf­fer the occa­sion­al error at a phys­ic­al level, que poderia ser causado por coisas como raios cósmicos vadios. Esses erros são manipulados por redundância incorporada à forma como os dados armazena o acionamento, mas ocasionalmente pode ser grave o suficiente para causar problemas na leitura de dados. Nor­mal con­sumer drives will spend a pro­longed peri­od attempt­ing to read the dam­aged data to recov­er it. Eles, então, mapeá-lo para uma nova parte da unidade e tudo continua como normal. No entanto, esse atraso pode causar problemas graves em ambientes corporativos, so enter­prise drives will time-out their self-repair attempts after a short peri­od (usualmente 7 segundos ou menos) e relatar o erro para o ataque con-trole-ler. The raid con­trol­ler then handles the error by recal­cu­lat­ing the data using the oth­er drives in the array. Esta pré-aberturas grandes atrasos na data-ção de envio, but requires the pres­ence of oth­er drives and a raid controller.

Assim, I have a prop­er hard­ware raid card. It expects to hear back from drives with­in no more than 7–8 seconds regard­less of an error. Eu também tenho os discos rígidos de consumo, which attempt to repair their own errors for a long peri­od. Assim, quando ocorre um erro na unidade tenta corrigi-lo, does­n’t respond with­in 7–8 seconds, eo controlador RAID que assume a unidade falhou e chuta para fora da matriz.

Assim, as soluções óbvias seria de dizer o controlador RAID que esperar mais tempo sem chutar uma unidade para fora, Ou dizer a unidade para desistir depois 7 segundo, como uma unidade empresarial ... Infuriatingly, nem é possível!

Tenho pesquisado extens-mente, but I can­’t find any prop­er raid‑5 cards which allow the user to change how long they will wait for a drive. No passado houve algumas unidades WD que podem ter o recurso TLER habilitado com um utilitário lançado pela WD chamado WD-TLER, mas recentemente WD ter desabilitada esta opção, presumivelmente para "proteger" a enorme marcação em seus discos corporativos (que são o dobro do preço para o mesmo hardware)

Algumas pessoas descobriram maneiras de permitir temporariamente ERC em algumas unidades que utilizam ou HDAT2, Smart-CTL ou hdparm, no entanto estes não sup-port minha RAID cartão sob Win-dows, ea alteração é perdida se o PC é desligado e ligado novamente.

Para os usuários, como eu, que precisam de um armazenamento de grande capacidade, and the fea­tures offered by a hard­ware raid‑5 solu­tion, mas que não precisa 24.7 uptime, garantias longas ou unidades concebidas para uso pesado não há atualmente nenhuma solução adequada. Seu tempo de cerca de um ou outro fabricante de carro abordado neste mercado (pela liberação de uma unidade de consumo com ERC habilitado para uma pequena, e.g. 15%, premi­um) ou um fabricante raid-card abordou o mercado através da oferta de um cartão com a opção de aumentar o tempo antes unidades são expirou. Cre­at­ing either of these solu­tions is trivi­al, um simples puxão firme-ware iria fazer o trabalho.

Até então, Eu aconselho os outros a evitar o uso de cartões de hardware RAID com unidades de consumo, and giv­en the price premi­um of enter­prise drives I recom­mend­ing avoid­ing hard­ware raid altogether.

Leave a Reply

1 Comente