Hoe uw gegevens te beschermen met ZFS
Een vraag die vaak gesteld wordt in de server industrie is, ‘wat is beter – software RAID of hardware RAID?’ Als je dit onderwerp onderzoekt, suggereert veel van de informatie over RAID dat een hardware RAID kaart te verkiezen is boven het gebruik van een Software RAID. Maar ik ben het daar niet mee eens. Mijn mening is dat, voor de meeste toepassingen, Software RAID veel beter is dan hardware RAID. Hardware RAID heeft een plaats onder bepaalde OS’en, maar ik ga je vertellen waarom Software over het algemeen veel beter is.
De voorkeur voor hardware RAID boven software RAID komt uit een tijd dat hardware gewoon niet krachtig genoeg was om de verwerking van Software RAID aan te kunnen, samen met alle andere taken waar het voor werd gebruikt. In die tijd was de oplossing het gebruik van een hardware RAID kaart met een ingebouwde processor die de RAID berekeningen “offline” afhandelde. Hij presenteerde zich aan het OS van de computer als een enkele schijf, en intern verwerkte hij de gegevens die in en uit de meervoudige opslagapparaten (harde schijven) gingen. Dit zorgde ervoor dat alles soepel verliep, terwijl het profiteerde van de veiligheid van RAID.
Hardware RAID is nog steeds populair bij sommige mensen en veel van de huidige hardware RAID-kaarten bieden geweldige prestaties terwijl ze de CPU ontlasten, maar er zijn nog steeds enkele serieuze problemen en nadelen:
- Problemen met het herstellen van gegevens als er grote storingen optreden
- Particuliere/niet-standaardprotocollen die betekenen dat uw array alleen werkt met dezelfde hardware raid-kaart. U kunt uw harde schijven niet op een willekeurige RAID-kaart aansluiten en verwachten dat deze uw gegevens leest.
- Hardware RAID heeft de mogelijkheid om een groep schijven te laten lijken op één enkele schijf. Deze architectuur is elegant in haar eenvoud. Het is echter ook fundamenteel onmogelijk om functies in het besturingssysteem en het bestandssysteem te integreren. Dankzij deze integratie heeft Software RAID de hardware RAID ver achter zich gelaten.
Waar we volgens mij vandaag staan
Twee dingen zijn gebeurd die Software RAID in het voordeel stelden ten opzichte van hardware RAID en waardoor het de leiding kon nemen. De rekenkracht is zo radicaal gegroeid dat de rekenbelasting die RAID met zich meebrengt niet langer significant is. Ten tweede zijn de kracht, de mogelijkheden en de integratie van RAID-software dramatisch gegroeid.
Hardware RAID blijft solide en eenvoudige architecturale oplossingen bieden voor het combineren van meerdere schijven in RAID-arrays en ze aan het OS te presenteren als een enkel apparaat. Dit is vooral nuttig met MS Windows dat een pijnlijk trage implementatie van software RAID heeft. Het blijft echter een risico voor de veiligheid van gegevens, omdat je een identieke (of compatibele) controller moet gebruiken om gegevens te herstellen in geval van hardware falen.
Aan de software kant, is de huidige software RAID supersnel (tenminste met Linux en BSD), extreem flexibel, en sterk geïntegreerd in OS’en. Het is ook veel capabeler en krachtiger in herstel situaties dan hardware RAID. Om je gegevens te herstellen, heb je alleen een andere opslag server nodig met hetzelfde OS. Daarna zijn de stappen eenvoudig, sluit de schijven aan en ga aan de slag – je zou in staat moeten zijn om te herstellen van zowat elke situatie waarin je gegevensverlies de fundamentele grenzen niet heeft overschreden.
Het is duidelijk dat computers en software een lange weg hebben afgelegd en het wordt steeds duidelijker dat software-gedefinieerde RAID meer en meer zal voorkomen naarmate de tijd verstrijkt.
ZFS Bestandssysteem en Volume Manager
Nu gaan we ons verdiepen in een van onze favoriete bestandssystemen en volume managers, ZFS. We gaan het hebben over enkele van de kenmerken die ZFS uniek maken en geven u dan een voorbeeld van een van onze klanten die veel geld bespaarde omdat hij ZFS gebruikte met software RAID.
We houden van ZFS omdat het veel van de problemen kan omzeilen die zich kunnen voordoen bij het gebruik van traditionele RAID kaarten. Bijvoorbeeld, in plaats van dat een hardware RAID kaart de eerste slag naar uw schijven krijgt, gebruikt ZFS een JBOD kaart die de schijven neemt en ze verwerkt met zijn ingebouwde volume manager en bestandssysteem. Dit geeft ZFS een grotere controle om enkele van de uitdagingen te omzeilen die hardware RAID kaarten gewoonlijk hebben. Door deze controle en de functionele eigenschappen kan ZFS extreem goed omgaan met fouten. Deze functies, waaronder Copy on Write, Snapshots, praktisch oneindig schalen, zelf-herstellend met controle sommen, en ingebouwde virtualisatie voor uw opslag pool, geven ZFS een extra niveau van robuustheid.
ZFS heeft zijn eigen manier om nieuwe schrijven te structureren, genaamd Copy on Write. Dit is anders dan de manier waarop de meeste volumebeheerders nieuwe schrijven structureren. Normaal gesproken, wanneer een wijziging of nieuwe gegevens worden geschreven, worden deze over de oude gegevens heen geschreven. Als er echter tijdens het schrijven een stroomstoring optreedt, kunnen de gegevens verloren gaan. In plaats van over de oude gegevens heen te schrijven, schrijft ZFS gegevens naar een nieuwe locatie en kopieert het pad daarheen. Dit betekent dat uw gegevens niet verloren gaan als u tijdens het schrijven de stroom verliest. Het geeft ZFS ook de mogelijkheid voor een andere van zijn meest nuttige functies; Snapshots.
Snapshots zijn in wezen tijdstempels die laten zien wat het pad voor gegevens was op een specifiek punt in het verleden, deze worden opgeslagen in hun eigen tabel, gescheiden van gegevens. Omdat ZFS gegevens niet overschrijft en ze in plaats daarvan naar een nieuwe locatie schrijft, kunt u terugkeren naar een eerdere tijdstempel, het werkt bijna als een back-up. Snapshots hebben echter veel minder overhead dan een echte back-up, aangezien een volledige back-up het kopiëren van uw gegevens vereist. Snapshots kunnen in vergelijking daarmee snel en gemakkelijk worden gemaakt.
ZFS heeft ook een ongelooflijk vermogen om zichzelf te genezen tegen schrijffouten, datacorruptie of bitrot. Het analyseert gegevens die zijn opgeslagen op redundante locaties met behulp van checksums en herstelt zichzelf op basis van inconsistenties. Het heeft ook traditionele RAID-functionaliteit – gebruikmakend van spiegeling, striping en pariteitscontroles. Wanneer een hardware RAID kaart wordt gebruikt, wordt de disk health checker gemaskeerd wanneer de schijven erop worden aangesloten. Dit is een probleem omdat je niet de dreigende tekenen ziet dat een van je schijven het loodje gaat leggen. ZFS omzeilt dit omdat het geen operaties naar de schijven laat schrijven voordat ze aan het OS worden gepresenteerd.
Voorbeeld van een klant
We maken allemaal fouten, sommige kunnen duurder zijn dan andere. Een van onze klanten die ZFS op zijn Storinator gebruikt, moest verhuizen en had de harde schijven er niet uitgehaald voor de verhuizing en beschadigde de schijven op een of andere manier tijdens de verhuizing.
Toen de klant probeerde de Storinator op te starten en de ZFS pool te importeren, waren sommige schijven beschadigd en sommige waren verkeerd geplaatst – er was zelfs beschadigde metadata. Omdat de klant ZFS gebruikte, kon hij de pool echter redelijk eenvoudig opnieuw opbouwen.
Het ondersteuningsteam hier bij 45Drives was in staat om de pool handmatig te importeren als zijnde gedegradeerd. Toen de pool eenmaal was ingevoerd, konden we nieuwe schijven toevoegen, de pool opschonen en alles werd weer normaal.
We konden dit alleen doen dankzij de veerkracht van ZFS, maar dit zou niet mogelijk zijn geweest als onze klant hardware RAID had gebruikt, omdat deze veel gevoeliger is voor storingen van componenten. Als ze hardware RAID zouden gebruiken, was de kans groot dat hun gegevens verloren zouden zijn gegaan – zonder een soort duur herstel.
Samenvatting
Als u het uiterste nodig hebt op het gebied van beveiliging, mogelijkheden en prestaties, is software RAID het antwoord. Merk op dat u een hoog-performant OS zoals Linux of BSD moet gebruiken; en als u dat doet, zou u echt ZFS moeten overwegen. De prestaties zijn uitstekend op de machines van vandaag, het tilt gegevensbeveiliging naar een ongekend niveau en als bonus is het echt eenvoudig te gebruiken als je eenmaal de leercurve te boven bent gekomen.
- Categories: Uncategorized
admin12:03 pm