1Innerhalb HDD LogoHardware-RAID-Festplatten-und Verbraucherprobleme

Eine vor einigen Jahren hatte ich das Glück, die Gelegenheit ein Gebraucht Hardware-RAID zu kaufen 5 Karte (ein Areca 1220) für einen sehr niedrigen Preis. Seitdem habe ich die Karte zusammen mit mehreren Sätzen von Antrieben (ori-gin-Verbündeten 300gig, dann 750gig und derzeit 1 TB) in einem dedizierten Server-PC als großes Netzwerk Datei-Speicher für die Musik der Familie, Fotos, Videos und Back-ups.

Bevor ich die Hardware-Karte erhalten habe ich versucht, Software-RAID mit, fand aber die Ergebnisse sehr enttäuschend. Der Server verfügt über eine Low-Power, Single-Core-CPU, die wirken als RAID-5-Motor nicht wirklich bis zur Aufgabe ist. Während ich habe viele Male gehört, dass RAID ist kein Back-up, dies ist ein Fall, in dem nur eine billige Lösung tun. RAID-5 bietet Schutz vor einzelnen Laufwerksausfall, das ist gut genug für meine Zwecke. Die dedizierte Karte bietet einen enormen Leistungsvorteil, aber in der Praxis ist dies nicht sehr wichtig. Die Features, die es jedoch ergänzt werden! Die Areca-Karte bietet eine OS unabhängige RAID-Lösung, die für eine Menge zählt. Es bietet auch Online-Kapazitätserweiterung und RAID-Level-Migration (so, beispielsweise, Ich konnte ein Upgrade auf RAID-6). Both of these fea­tures are much less simple with cheap­er solutions.

So, du denkst vielleicht, Was ist das Problem. Die Antwort: der Mangel an Optionen von Festplatten-Hersteller ...

Seit der Areca-Karte ich von gelegentlicher Fahrt gelitten habe „Ausfälle“. Nach dem Ausschalten und auf dem Laufwerk erscheint wieder als voll funktionsfähig. Ich muss dann viele Stunden damit verbringen, das Array wieder aufzubauen normal von degradierten zurück. Nach langem Suchen habe ich das Problem diagnostiziert, aber ich bin nicht in der Lage, um es richtig zu lösen.

Festplatten-Hersteller bieten eine breite Palette von Antrieben für verschiedene Zwecke. Die typischen Antriebe die meisten von uns kaufen, sind Verbraucherebene Antriebe. Die Hersteller bieten auch Enterprise-Class-Laufwerke für Server entwickelt, die intensive Nutzung Muster haben und 24.7 Betriebszeit. Diese Laufwerke sind oft baugleichen, sondern haben zusätzliche Tests unterzogen und sind mit leicht unterschiedlichen Firmware ausgeliefert, optim­ised for serv­er workloads.

Eines dieser Merkmale ist Error Recovery Steuerung (ERC). Diese Funktion wird auch CCTL genannt (Command Completion Time Limit) von Samsung und Hitachi und TLER (Zeitlich begrenzte Error Recovery) von Western Digital. Alle Laufwerke leiden gelegentlich Fehler auf der physikalischen Ebene, die durch Dinge verursacht wie Streu kosmische Strahlung werden könnte. Diese Fehler werden durch Redundanz in die Art und Weise der Antrieb speichert Daten gebaut behandelt, aber gelegentlich kann man schwer genug sein, um Probleme verursachen Lesen von Daten. Normale Verbraucher-Laufwerke werden über einen längeren Zeitraum versucht, verbringen die beschädigten Daten zu lesen, sie zurückzugewinnen. Sie bildet es dann zu einem neuen Teil des Antriebs und alles wird normal fortgesetzt. Jedoch, Diese Verzögerung kann schwerwiegende Probleme in Enterprise-Umgebungen verursachen, so Enterprise-Laufwerke ihre Selbstreparatur wird versucht nach kurzer Zeit zeit out (in der Regel 7 Sekunden oder so) und meldet den Fehler an den RAID-Controller. Der RAID-Controller übernimmt dann den Fehler, indem die Daten neu zu berechnen, die anderen Laufwerke in dem Array unter Verwendung von. Dies verhindert, dass große Verzögerungen bei der Datenübersendung, but requires the pres­ence of oth­er drives and a raid controller.

So, Ich habe eine richtige Hardware-RAID-Karte. Er erwartet, zurück von Laufwerken innerhalb von nicht mehr als 7-8 Sekunden zu hören, unabhängig von einem Fehler. Ich habe auch Festplatten Verbraucher, die versuchen, ihre eigenen Fehler für einen langen Zeitraum zu reparieren. Also, wenn ein Fehler auftritt, versucht der Antrieb, es zu beheben, reagiert nicht innerhalb von 7-8 Sekunden, und der RAID-Controller als übernimmt der Antrieb ausgefallen ist und es tritt aus dem Array.

So, die offensichtlichen Lösungen wären entweder dem RAID-Controller zu sagen, länger zu warten, ohne einen Antrieb heraus zu treten, Oder das Laufwerk sagen zu geben nach 7 Sekunden wie ein Unternehmen Laufwerk ... aufreizend, weder möglich!

Ich habe ausführlich gesucht, aber ich kann keine richtigen RAID-5-Karten finden, die den Benutzer zu ändern lassen, wie lange sie für eine Fahrt warten. In der Vergangenheit gab es einige WD-Laufwerke, die die TLER Funktion mit einem Dienstprogramm veröffentlicht von WD genannt WD-TLER aktiviert haben könnten, aber vor kurzem WD diese Option deaktiviert haben, vermutlich zu „schützen“ der großen Aufschlag auf ihren Enterprise-Laufwerken (welche den doppelten Preis für die gleiche Hardware)

Einige Leute haben Wege gefunden, um vorübergehend ERC zu ermöglichen auf einige Laufwerke entweder mit HDAT2, smartctl oder hdparm, jedoch werden diese nicht unterstützen meine RAID Karte unter Windows, und die Änderung verloren geht, wenn der PC Aus- und Wiedereinschalten.

Für wie ich Benutzer, die eine große Speicherkapazität benötigen, und die Merkmale von einer Hardware-RAID-5-Lösung angeboten, aber das muss nicht 24.7 Betriebszeit, lange Garantien oder Antriebe für den harten Einsatz dort ausgelegt ist zur Zeit noch keine geeignete Lösung. Es geht um Zeit entweder ein Antriebshersteller adressiert diesen Markt (durch einen Verbraucher-Laufwerk mit ERC Freigabe freigegeben für eine kleine, z.B. 15%, Prämie) oder ein RAID-Kartenhersteller adressiert den Markt durch eine Karte mit der Option anbieten, die Zeit zu erhöhen, bevor Laufwerke sind abgelaufen. eine dieser Lösungen zu schaffen, ist trivial, eine einfache Firmware zwicken würde den Job.

Bis dann, Ich rate andere mit Hardware-RAID-Karten mit Verbraucher-Laufwerken zu vermeiden, and giv­en the price premi­um of enter­prise drives I recom­mend­ing avoid­ing hard­ware raid altogether.

Hinterlasse eine Antwort

Ein Kommentar