Sådan beskytter du dine data ved hjælp af ZFS
Et spørgsmål, der ofte stilles i serverbranchen, er: “Hvad er bedst – software RAID eller hardware RAID? Hvis du undersøger dette emne, tyder mange af oplysningerne om RAID på, at et hardware-RAID-kort er at foretrække frem for at bruge et software-RAID. Men jeg er ikke enig. Min mening er, at til de fleste applikationer er Software RAID langt bedre end hardware RAID. Hardware RAID har en plads under visse OS’er, men jeg vil fortælle dig, hvorfor Software generelt er langt bedre.
Favoritering af hardware RAID frem for software RAID stammer fra en tid, hvor hardwaren bare ikke var kraftig nok til at håndtere Software RAID-behandling sammen med alle de andre opgaver, den blev brugt til. Dengang var løsningen at bruge et hardware RAID-kort med en indbygget processor, der håndterede RAID-beregningerne “offline”. Det præsenterede sig selv for computerens operativsystem som en enkelt disk, og internt behandlede det data, der flyttede ind og ud af de flere lagerenheder (harddiske). Dette fik tingene til at køre gnidningsløst, samtidig med at man nød godt af sikkerheden ved RAID.
Hardware-RAID er stadig populært hos nogle mennesker, og mange af nutidens hardware-RAID-kort giver en fantastisk ydeevne, samtidig med at de letter belastningen af CPU’en, men der er stadig nogle alvorlige problemer og ulemper:
- Udfordringer med at gendanne data, når der sker større fejl
- Proprietære/non-standardprotokoller, som betyder, at dit array kun fungerer med det samme hardware-RAID-kort. Du kan ikke sætte dit sæt harddiske i et hvilket som helst RAID-kort og forvente, at det kan læse dine data.
- Hardware RAID har evnen til at tage en gruppe af drev og få den til at fremstå som et enkelt drev. Denne arkitektur er elegant i sin enkelhed. Men det udelukker også grundlæggende set integration af funktioner i operativsystemet og filsystemet. Denne integration er i virkeligheden det, der har gjort det muligt for Software RAID at overhale hardware RAID dramatisk.
Hvor jeg mener, at vi er i dag
Der skete to ting, der gav Software RAID fordele i forhold til hardware RAID og gjorde det muligt for det at overtage føringen. Datakraften voksede så radikalt, at den databehandling, som RAID medfører, ikke længere er væsentlig. For det andet er styrken, funktionerne og integrationen af RAID-software vokset dramatisk.
Hardware-RAID tilbyder fortsat solide og enkle arkitektoniske løsninger til at kombinere flere drev i RAID-arrays og præsentere dem for operativsystemet som en enkelt enhed. Dette er især nyttigt med MS Windows, som har en smerteligt langsom implementering af software-RAID. Det indebærer dog fortsat en risiko for datasikkerheden, fordi man skal bruge en identisk (eller kompatibel) controller for at gendanne data i tilfælde af hardwarefejl.
På softwaresiden er dagens software-RAID superhurtig (i det mindste med Linux og BSD), ekstremt fleksibel og stærkt integreret i operativsystemer. Det er også meget mere kompetent og kraftfuldt i recovery-situationer end hardware-RAID. For at gendanne dine data skal du blot bruge en anden lagringsserver med det samme operativsystem. Derefter er trinene enkle, du skal bare tilslutte drevene og gå i gang – du burde kunne gendanne fra stort set alle situationer, hvor dit datatab ikke har overskredet de grundlæggende grænser.
Det er klart, at computere og software er kommet rigtig langt, og det bliver tydeligere og tydeligere, at softwaredefineret RAID vil blive mere og mere udbredt efterhånden som tiden går.
ZFS File System and Volume Manager
Nu vil vi grave i et af vores foretrukne filsystemer og volume managers, ZFS. Vi vil tale om nogle af de funktioner, der gør ZFS unikt, og derefter give dig et eksempel fra en af vores kunder, der sparede mange penge, fordi han brugte ZFS med software-RAID.
Vi elsker ZFS, fordi det kan omgå mange af de problemer, der kan opstå, når man bruger traditionelle RAID-kort. I stedet for at et hardware-RAID-kort får første chance for at få adgang til dine drev, bruger ZFS f.eks. et JBOD-kort, der tager drevene og behandler dem med sin indbyggede volumenhåndtering og sit indbyggede filsystem. Dette giver ZFS en større kontrol til at omgå nogle af de udfordringer, som hardware-RAID-kort normalt har. På grund af denne kontrol og dets funktionelle egenskaber – kan ZFS håndtere fejl ekstremt godt. Disse funktioner, herunder Copy on Write, Snapshots, praktisk talt uendelig skalering, selvhelbredende med check sums og indbygget virtualisering for din storage pool, giver ZFS et ekstra niveau af robusthed.
ZFS har sin egen måde at strukturere nye skrivninger på, kaldet Copy on Write. Dette er forskelligt fra den måde, som de fleste volumenadministratorer strukturerer nye skrivninger på. Normalt, når en ændring eller nye data skrives, skrives de over de gamle data. Men hvis der sker en strømafbrydelse under denne skrivning – kan dataene gå tabt. I stedet for at skrive over de gamle data skriver ZFS data til en ny placering og kopierer stien over. Det betyder, at dine data ikke går tabt, hvis du mister strømmen, mens den skriver. Det giver også ZFS mulighed for en anden af dets mest nyttige funktioner; Snapshots.
Snapshots er i det væsentlige tidsstempler, der viser, hvad stien for data var på et bestemt tidspunkt i fortiden, disse gemmes i deres egen tabel adskilt fra data. Fordi ZFS ikke overskriver data og i stedet skriver dem til en ny placering, kan du vende tilbage til et tidligere tidsstempel, det fungerer næsten som en sikkerhedskopi. Snapshots har dog langt mindre overhead end en rigtig backup, da en fuld backup kræver, at du kopierer dine data. Snapshots kan til sammenligning tages hurtigt og nemt.
ZFS har også en utrolig evne til at helbrede sig selv mod skrivefejl, datakorruption eller bitrot. Den analyserer data, der er gemt på redundante steder ved hjælp af kontrolsummer, og reparerer sig selv på baggrund af inkonsistenser. Den har også traditionel RAID-funktionalitet – ved hjælp af spejling, striping og paritetskontrol. Når du bruger et hardware-RAID-kort, bliver disktilstandskontrollen maskeret, når diskene er tilsluttet til kortet. Dette er et problem, fordi du ikke kan se de truende tegn på, at en af dine diske er på vej til at gå i stykker. ZFS omgår dette, fordi det ikke har nogen operationer skrevet til diskene, før de præsenteres for OS.
Kundesag Eksempel
Vi begår alle fejl, nogle kan være mere dyre end andre. En af vores kunder, der bruger ZFS på sin Storinator, skulle flytte kontor og tog ikke harddiskene ud før flytningen og beskadigede på en eller anden måde diskene under flytningen.
Når kunden forsøgte at starte Storinator op og importere ZFS-puljen – var nogle af diskene beskadiget og nogle var fejlplaceret – der var endda beskadigede metadata. Men fordi kunden brugte ZFS, var han i stand til at genopbygge poolen rimelig nemt.
Vores supportteam her hos 45Drives var i stand til manuelt at importere poolen som nedbrudt. Da puljen var inde, kunne vi tilføje nye drev, skrubbe puljen, og tingene gik tilbage til det normale.
Vi var kun i stand til at gøre dette på grund af ZFS’ modstandsdygtighed, men dette ville ikke have været muligt, hvis vores kunde brugte hardware-RAID, fordi det er meget mere følsomt over for fejl i komponenterne. Hvis de havde brugt hardware-RAID, var der en god chance for, at deres data ville være gået tabt – uden en eller anden form for dyr genopretning.
Summary
Hvis du har brug for det yderste inden for sikkerhed, funktioner og ydeevne, er software-RAID løsningen. Bemærk, at du skal bruge et højtydende operativsystem som Linux eller BSD; og hvis du gør det, bør du virkelig overveje ZFS. Dets ydeevne er fremragende på nutidens maskiner, det tager datasikkerheden til et hidtil uset niveau, og som en bonus er det virkelig nemt at bruge, når først du kommer op ad læringskurven.
- Kategorier: Ikke kategoriseret
admin12:03 pm