Sunteți pe pagina 1din 3

Despre RAID

Acronimul RAID provine de la "Redundant Array of Independent Disks" i desemneaz o tehnologie de stocare care grupeaz mai multe medii de stocare de tip disc, dispuse ntr-o matrice de discuri, ntr-o singur unitate de disc virtual. Aa cum arat denumirea, scopul iniial urmrit a fost creterea siguranei i disponibilitii datelor, dar mai trziu aceeai tehnologie a fost folosit i pentru creterea performanei de intrare-ieire. De aceea, acum, termenul RAID este folosit ca un termen generic, pentru toate schemele de virtualizare a stocrii datelor n computere, care presupun distribuirea i replicarea datelor pe mai multe medii de stocare fizice.

Nivele RAID
Un numr de scheme/strategii de distribuire i replicare a datelor au fost standardizate de Storage Networking Industry Association, i au primit numele de nivele RAID standard. Acestea sunt: RAID 0 - o schem simpl de distribuire a blocurilor de date pe discuri (striping), fr nici un mecanism de replicare. Obiectivul acesteia este creterea performanei de intrare-ieire i a capacitii de stocare dar acest lucru este obinut cu preul creterii riscului de pierdere a datelor (defectarea unui singur disc din matrice determin pierderea datelor). Numrul minim de discuri este 2, capacitatea este suma capacitii discurilor, iar rata de transfer i riscul pierderii datelor sunt direct proporionale cu numrul de discuri. RAID 1 - o schem simpl de replicare a blocurilor de date, fr nici un mecanism de distribuire. Pentru c implementarea tipic utilizeaz 2 discuri, fiecare coninnd o copie integrala a datelor, mai este cunoscut sub denumirea de mirroring. Obiectivul acesteia este creterea siguranei datelor, acestea fiind intacte att timp ct supravieuiete unul dintre hardiscurile ce formeaz matricea. Acest securitate este obinut cu preul limitrii capacitii de stocare a matricei la capacitatea unui singur disc i a unei deteriorri a ratei de transfer la scriere. RAID 2 - este o schem de distribuire a datelor pe discuri la nivel de bit, toate discurile trebuind s fie sincronizate. Pentru asigurarea siguranei datelor este folosit codul de control Hamming, stocat pe un disc dedicat. Numrul minim de discuri este 3, 2 de stocare i 1 pentru paritate. Capacitatea de stocare este egala cu suma capacitii discurilor de stocare iar datele nu sunt pierdute la defectarea unui disc. RAID 3 - este o schem de distribuire a datelor pe discuri la nivel de octet, toate discurile trebuind s fie sincronizate. Pentru asigurarea siguranei datelor este folosit un cod de paritate, stocat pe un disc dedicat. Numrul minim de discuri este 3, 2 de stocare i 1 pentru paritate. Capacitatea de stocare este egala cu suma capacitii discurilor de stocare iar datele nu sunt pierdute la defectarea unui disc. RAID 4 - este o schem de distribuire a datelor pe discuri n blocuri, care permite ca discurile s funcioneze independent, eliminnd necesitatea sincronizrii lor. Pentru asigurarea siguranei datelor este folosit un cod de paritate, stocat pe un disc dedicat. Numrul minim de discuri este 3, 2 de stocare i 1 pentru paritate. Capacitatea de stocare este egala cu suma capacitii discurilor de stocare iar datele nu sunt pierdute la defectarea unui disc. Problema conceptual a acestei scheme este legat de faptul c performana este determinat de performana discului care stocheaz codul de paritate (pentru fiecare bloc de date scris pe unul dintre discurile matricei trebuie scris codul de paritate pe discul dedicat). RAID 5 - este o schem similar celei de la RAID 4 dar care elimin discul dedicat pentru codul de paritate, acesta fiind scris pe discurile matricei la fel ca blocurile de date (paritate distribuit). Astfel se elimin gtuirea de performan asociat acestuia. Numrul minim de discuri este 3 iar capacitatea rezultat este cea echivalent a n-1 discuri. Datele nu sunt pierdute n cazul defectrii unui singur disc. Dup nlocuirea discului defect, performanele sunt sever diminuate pe perioada reconstruirii datelor. RAID 6 - este o schem similar RAID 5, dar cu o dubl distribuire a paritii. Aceasta face ca datele s nu fie pierdute n cazul defectrii a dou discuri i reduce timpul necesar reconstruirii datelor n cazul defectrii unui disc (dar pe parcursul acestei perioade performanele sunt mult diminuate). Numrul minim de discuri este 4 iar capacitatea rezultat este cea a n-2 discuri. n practic sunt foarte rspndite RAID 0, 1, 5. Necesitile unor capaciti de stocare din ce n ce mai

1/3

mari fac tot mai atractiv RAID 6. Mult mai rar este ntlnit RAID 3 i n general nu de sine stttor. O simpl deducie logic: dac elementele matricii RAID nu sunt discuri ci discuri virtuale rezultat al unei alte matrice RAID? Atunci obinem aa numitele nivele RAID ncapsulate, folosind caracteristicile nivelelor RAID pentru a acoperi ct mai bine necesitile. Cele mai rspndite nivele RAID ncapsulate sunt: RAID 10 - RAID 1 avnd ca elemente ale matricii discuri virtuale RAID 0 RAID 50 - RAID 5 avnd ca elemente ale matricii discuri virtuale RAID 0 RAID 53 - RAID 5 avnd ca elemente ale matricii discuri virtuale RAID 3 (foarte rar, n unele SAN) ncapsularea a mai mult de dou nivele RAID nu este uzual.

Implementri ale sistemelor RAID


Sistem RAID bazat pe hardware
Acest tip de controlere RAID folosesc formate de date proprietare, nu utilizeaz procesorul i memoria computerului iar BIOS permite bootarea de pe ele. Sunt cele mai scumpe, dar i cele mai performante.

Sistem RAID bazat pe un driver specific sistemului de operare


Numite i fake-RAID, se bazeaz n funcionare pe procesorul i memoria computerului dar i pe un hardware specific. Utilizarea lor este posibil doar dac exist driverul specific sistemului de operare folosit iar bootarea de pe discul virtual nu este posibil n toate situaiile. Performanele sunt inferioare controlerelor RAID hardware dar preul lor este mult mai mic.

Sistem RAID bazat pe software


n principiu exist trei abordri distincte n realizarea RAID bazat pe software: prin intermediul unui strat de abstractizare (exemplu: md) prin intermediul managerului de volume logice (exemplu: LVM) prin intermediul sistemului de fiiere (exemplu: ZFS sau Btrfs) Sistemul RAID bazat pe software are dezavantajul faptului c software care asigur RAID trebuie s ruleze pe serverul la care sunt ataate discurile, folosind procesorul i memoria acestuia. Aceasta limiteaz numrul de discuri, necesit o surs de alimentare de putere sporit, ridic probleme suplimentare de rcire. Procesul de bootare se complic mult iar performanele sunt inferioare celorlalte dou soluii.

Mecanisme suplimentare
Toate cele trei tipuri de implementri RAID pot implementa mecanisme suplimentare pentru a crete disponibilitatea i rezisten la dezastre. Cele mai rspndite sunt: Hot spares - este vorba despre unul sau dou discuri fizice, montate n matricea RAID, dar inactive pn n momentul n care unul dintre discurile active se defecteaz. n acest caz el devine automat activ, nlocuind discul defectat i declannd mecanismul de reconstruire a datelor. Consistency check - este vorba despre o procedur prin care sunt citite i verificate toate blocurile de date din RAID, inclusiv cele nefolosite. Aceasta permite identificarea blocurilor defecte nainte de a fi folosite. De asemenea procedura permite, n cazul nivelelor RAID ce asigur redundan, recuperarea datelor din blocurile nesigure i realocarea lor n blocuri libere. Unele implementri numesc aceast

2/3

procedur "data scrubbing" sau "patrol read".

Evaluarea siguranei datelor oferit de RAID


Teoria aflat n spatele corectrii erorilor n RAID presupune evenimentele care pot afecta datele ca fiind aleatoare i independente. n realitate nu sunt aa i n continuare vom trece n revist cteva probleme care pot determina pierderea datelor n ciuda implementrii unei soluii RAID. Discurile care populeaz matricea RAID sunt de acelai tip i, n general, din acelai lot. Acest fapt face ca probabilitatea ca dou discuri din matricea RAID s se defecteze ntr-un interval de 10 ore s fie de 24 ori mai mare dect cea evaluat teoretic. Defectarea simultan a mai multor discuri i/sau altor componente ca i consecin a funcionrii defectuoase a unui sistem comun (de exemplu a alimentrii). Lipsa de siguran a write cache, faptul c, din dorina creterii performanelor, unele controlere confirm scrierea din momentul n care datele ajung n cache i nu cnd sunt scrise fizic. Lipsa compatibilitii controlerelor RAID, care la randul lor se pot defecta. Majoritatea productorilor de controlere RAID folosesc formate proprii, complet nedocumentate. Degeaba datele sunt intacte pe discuri dac nu mai gsim un controler identic cu cel defect. Capacitatea mare a sistemelor RAID actuale duce la timpi extrem de lungi pentru reconstruirea datelor (excepie fcnd RAID 1, care menine o copie complet a datelor). n acest timp, pe lng o sever deteriorare a performanei, sistemul este complet expus i incapabil s supravieuiasc unui nou incident. Probleme conceptuale a algoritmilor de reconstruire a datelor (cum este, de exemplu, RAID 5 write hole). Reaua voin sau nepriceperea utilizatorilor. Sistemele RAID nu protejeaz mpotriva tergerilor de date intenionate sau accidentale. nchei aceast scurt expunere spunnd c sistemele RAID i strategiile de backup a datelor sunt tehnologii complementare care nu se exclud reciproc.

3/3

S-ar putea să vă placă și