Documente Academic
Documente Profesional
Documente Cultură
Cuprins............................................................................................................................ 1
Fiabilitatea datelor ........................................................................................................... 2
1 Fiabilitatea hardware ............................................................................................... 3
1.1 Metode de protectie cu timp de reactie ............................................................. 3
1.1.1 Backup ..................................................................................................... 3
1.2 Metode de protectie fara timp de reactie ........................................................... 3
1.2.1 RAID ....................................................................................................... 3
1.2.2 Redundant Servers ................................................................................... 5
1.2.3 SAN ......................................................................................................... 6
1.3 Alte metode de protectie ................................................................................ 11
1.3.1 Securitate secundara ............................................................................... 11
2 Fiabilitate software ................................................................................................ 11
2.1 Sisteme de fisiere ........................................................................................... 11
2.2 Backup........................................................................................................... 12
3 Solutii software de backup ..................................................................................... 13
4 Bibliografie: .......................................................................................................... 15
Fiabilitatea datelor
2
1 Fiabilitatea hardware
1.2.1 RAID
Unul dintre primele concepte care a realizat partial acest deziderat a fost
conceptul de RAID 1 care presupune utilizarea a 2 sau mai multe hdd intr-o functionare
de tip mirroring. In teorie, daca unul din discurile ce alcatuiesc matricea de raid 1 cade,
atunci functionarea este automat translatata pe una din oglinzile acestuia. Mai exact hdd-
3
urile fiind identice, de pe fiecare porneste un flux de date iar aceste fluxuri sunt
comparate si se transforma intr-un singur flux. In cazul in care apar diferente la
comparare, hdd-ul care a generat diferenta este refacut dupa unul din celelalte. Astfel
datele sunt in permanenta in siguranta. Au mai aparut si alte tipuri de RAID care ofera o
atentie sporita si maximizarii spatiului utilizat dar care nu ofera acelasi grad de siguranta
ca si RAID 1. De mentionat ca RAID 1 este cel mai costisitor sistem RAID din punct de
vedere al spatiului de stocare (se folosesc n HDD iar dimensiunea vizibila este aceea a
unui HDD)
Figure 3 – RAID 3
Figure 1 – RAID 0
Figure 4 – RAID 4
Figure 2 – RAID 1
4
Figure 6 – RAID 6
Figure 5 – RAID 5
5
2 sau mai multe servere redundante. De vreme ce hdd-urile ce functioneaza in raid 1 se
afla in aceeasi incinta, pot fi supravegheate mai usor si sincronizarea este mult mai usor
de pastrat decat in cazul serverelor. Se pun probleme de latime de banda la transfer,
securitatea acestui transfer pentru a preveni interceptia fluxurilor de date si de asemenea
toate locatiile ar trebui sa ofere aceleasi conditii beneficiarilor ceea ce limiteaza oarecum
aria de raspandire a serverelor redundante: etaje diferite ale aceleasi cladiri, cladiri
apropiate sau orase apropiate cel mult. Orice altfel de mecanism ce permite cresterea
distantei deja presupune costuri enorme din punct de vedere al transferului de date si
mentinere a sincronizarii.
1.2.3 SAN
6
Figure 7 – DAS vs NAS vs SAN
Structura unui SAN presupune existenta unui backbone de retea prin care sunt
conectate serverele ce alcatuiesc SAN-ul si o multitudine de switch-uri de inalta
performanta ce permit conectivitatea SAN cu restul sistemelor din retea. Evolutia SAN-
urilor merge in directia separarii cat mai puternice intre echipamentul fizic de stocare si
entitatile virtuale puse la dispozitia beneficiarilor. Aceasta separare puternica a fost
incurajata si de conceptul de virtualizare care a permis o creeare cat mai usoara si un
management cat mai bun al sistemelor si entitatilor virtuale ce ruleaza pe platformele deja
existente. Aceasta virtualizare a permis deci si emularea de protocoale concepute pentru
mediul local peste protocoale de retea. Descoperim astfel in SAN-uri interfete SCSI over
ethernet, ATA over Ethernet, Fiber Chanel over Ethernet, sau chiar iSCSI over TCP/IP.
Asadar, din punct de vedere al beneficiarului, SAN-ul reprezinta chiar hardisk-ul,
un harddisk insa mult mai sigur si mai fiabil. Datorita performantelor atinse de SAN-uri
unele firme prefera sa isi boot-eze propriile servere de pe partitii din SAN.
7
Figure 8 – Diferente de concet intre SAN, NAS si DAS
8
Figure 9 – Mediu de lucru hibrid
Un SAN este deci o metoda de a unifica medii de stocare spre realizarea unei
entitati de date virtuale. Avantajul major al sistemelor SAN este acela ca pun la dispozitia
mai multor utilizatori datele din interiorul hdd-ului virtual (daca il putem numi astfel)
simultan. SAN este deci un sistem ce permite performanta in domeniul accesului
concurent la date. Acest aspect este dat in general de prezenta unor conexiuni de tipul
fiber channel intre utilizatori si locul de stocare al datelor spre deosebire de NAS si DAS
care foloseau protocoale bazate pe ethernet.
Deoarece datele sunt stocate intr-un singur loc, sharing-ul acestora se poate
realiza mult mai usor tinand cont de posibilitatile de acces oferite de sistemele SAN. De
asemenea se elimina si asa numitele single point of failure. Este vorba de acele noduri
cruciale din retea care reprezinta cosmarul oricarui administrator de sistem sau de retea.
Intregul ansamblu nu mai depinde de un element. Iesirea se face prin switch-uri de fibra
optica legate la mai multe servere de acces ce comunica intre ele. Tot din acest motiv se
poate realiza si un management mai facil al accesului la datele din SAN si al drepturilor
utilizatorilor.
9
Stim cu totii ca tehnologia este in continua dezvoltare si de aceea, este foarte
important ca SAN-urile sa permita aceasta evolutie fara costuri majore sau downtime. De
aceea SAN este foarte flexibil. Se pot scoate si adauga matrici RAID (module RAID)
foarte simplu si acestea sunt apoi usor configurate in general printr-o interfata de
configurare a mediului SAN (toti marii producatori pun la dispozitie un soft proprietate
pentru a realiza acest lucru). De asemenea prin cresterea numarului de servere se poate
creste numarul de functii si numarul de utilizatori de pe mediul SAN. Totodata se poate
permite si inlocuirea facila a dispozitivelor de legatura (switch-uri) intre servere si mediul
de stocare prin permiterea functionarii in paralel a acestora pe timpul introducerii noii
tehnologii. Astfel, mediul SAN are un up-time teoretic nelimitat si este totodata un mediu
foarte dinamic de lucru.
Lipsa de transparenta a modului in care sunt gestionate fisierele pentru utilizatorii
care acceseaza aceste fisiere este o norma importanta de securitate in SAN. Fiecare SAN
in parte are regulile proprii stabilite si utilizeaza diferiti algoritmi de criptare a datelor.
Transferul se face numai prin linii de fibra optica sau poate pe viitor prin dispozitive
similare dar mai rapide si niciodata nu se vor alege solutii wireless care pot fi
interceptate. Accesul utilizatorilor de asemenea este limitat pana in serverele SAN.
Acestea la randul lor acceseaza fisierele si le pun la dispozitie (realizeaza munca unui
controller de HDD) si deci nici macar utilizatorii nu isi pot vedea locatia fisierelor.
Multi producatori pun la dispozitia beneficiarilor de sisteme SAN si niste solutii
de avarie in cazul defectarii instalatiei de fibra optica ce realizeaza transferul de date.
Aceste solutii sunt mult mai lente dar sigure (gigabit ethernet in general sau mai rapid) si
mentin dezideratul de 0 downtime al SAN.
De remarcat ca pe SAN-uri se folosesc sisteme UNIX-like acestea fiind capabile
de gestiunea sistemelor de fisiere jurnalizate. Acest tip de sisteme de fisiere sunt mult mai
sigure si cu posibilitatea avansata de recuperare a datelor decat in cazul sistemelor
nejurnalizate.
Odata cu aparitia Windows 2008, Microsoft a introdus si primele variante de SAN
ce poarta numele de Microsoft Cluster Server. Acest sisteme este relativ diferit de
topologia SAN prezentata dar rezultatele sale vor fi similare. Au aparut producatori care
propun si asemenea solutii dar ele fiind foarte noi, inca nu se cunosc parametrii de
10
eficienta si rentabilitate ai unei astfel de solutii si de asemenea va mai dura pana cand va
fi pus la punct sistemul Active Directory pentru a conlucra eficient cu aceasta tehnologie.
Din punct de vedere hardware, ca punct comun de constructie al SAN-urilor mai
intalnim magistralele de date din matricele RAID care sunt de regula High Speed SCSI
sau SAS. Tehnologia S-ATA, desi ofera viteze foarte mari nu confera siguranta necesara
si posibilitatile de extensie ale magistralelor mai sus mentionate.
Un al treilea aspect mai putin important insa al fiabilitatii datelor din punct de
vedere hardware il reprezinta echipamentele periferice aditionale si numeroasele
tehnologii noi de asamblare si deployment al serverelor de mare capacitate. Prin toate
aceste masuri si echipamente aditionale, ne referim la camere special amenajate cu
protectie speciala impotriva incendiului (de regula pompe de vidare), utilizarea de
generatoare de curent electric proprii sau de solutii de tip UPS care sa asigure
functionarea in caz de avarie a retelei electrice, utilizarea de surse redundante in sistemele
server ce pot fi schimbate in timpul functionarii atunci cand este nevoie si de asemenea
imbunatatirea tehnologiei de realizare a sasiurilor serverelor care mai nou sunt proiectate
in vederea disiparii cat mai eficiente a radiatiei electromagnetice emisa de circuitele din
interior, a temperaturii si chiar si a vibratiilor mecanice ce pot afecta in timp dispozitivele
de stocare.
2 Fiabilitate software
2.1 Sisteme de fisiere
11
fisierele respective. In general, cand vine vorba de baze de date, acestea sunt platform
independent in marea lor majoritate (mai putin produsele Microsoft care sunt dependente
de sistemul de operare Windows). Asadar din acest punct de vedere avem o redundanta a
protectiei datelor. Mai exact baza de date isi asigura singura integritatea prin numeroase
procese de verificare si diagnoza in timp ce sistemul de fisiere face aproximativ aceeasi
operatie dar din exteriorul bazei de date, el fiind singurul care se ocupa de integritatea
componentelor aplicatiilor adiacente bazei de date (serverul care lanseaza baza, clienti,
etc)
2.2 Backup
Toate solutiile hardware de backup trebuiesc sprijinite de niste solutii software
adecvate care sa poata fata tuturor cerintelor si care totodata sa fie capabile sa utilizeze la
potential maxim hardware-ul aflat la dispozitie. Primele astfel de aplicatii au fost
aplicatiile de backup care la inceput foloseau unitati floppy sau benzi magnetice dar in
ziua de azi pot folosi orice mijloc de stocare aflat la dispozitie.
Backup-ul poate fi de mai multe feluri:
- backup clasic
- backup incremental.
Backup-ul clasic presupune salvarea datelor in alta locatie decat aceea din care se
lucreaza. Aceasta operatie poate fi realizata manual de catre utilizator (administrator de
sistem, etc) fie prin copiere directa fie prin utilizarea unui soft de arhivare sau poate fi
realizata cu ajutorul unui soft dedicat. Softul dedicat ofera in general cateva facilitati
foarte importante:
Este autonom prin faptul ca poate fi configurat de asa natura incat sa execute
operatiuni de backup la intervale regulate sau momente de timp prestabilite, este capabil
sa comunice cu administratorul prin intermediul serviciului de e-mail, informandu-l pe
acesta cu privire la starea datelor si a job-urilor de backup executate sau ce urmeaza a fi
executate, si de asemenea poate lucra in cooperare cu diverse aplicatii de arhivare ce ii
permit sa reduca dimensiunile informatiei stocate. Softurile de backup din gama
profesionala permit de asemenea si managementul lor la distanta astfel incat operatiuni
simple se pot realiza fara sa fie necesara interventia la fata locului. Pe masinile echipate
cu sisteme de operare UNIX – Like, managementul se poate face si prin intermediul
12
remote shell care poate controla intre sistemul de la distanta. De asemenea managementul
se poate face si cu ajutorul unei interfete web pe care unele aplicatii de backup o pun la
dispozitie. In general aceasta interfata web lucreaza in combinatie cu aplicatii de genul
Apache (cu extensia Tomcat unde este nevoie de suport java) sau IIS (Internet
Information Server).
Problemele ce apar in cazul efectuarii operatiunii de backup sunt legate, odata de
dimensiunea largimii de banda a conexiunii intre locatia de backup si sursa datelor, si in
al doilea rand de accesul concurent al datelor. Daca cineva acceseaza spre modificare un
fisier, acesta nu poate fi copiat deoarece sistemul de operare nu permite. Din aceasta
cauza se prefera de multe ori realizarea de backup in momente in care utilizarea
serverului este extrem de redusa pentru a reduce riscul unui astfel de conflict.
Pentru a evita aceasta problema a accesului concurent, dezvoltatorii de SGBD
(sitemelor de gestiune a bazelor de date) implementeaza in aplicatiile lor solutii proprii de
realizare de backup a bazelor de date, chiar si in timpul accesului la acestea. In general o
asemenea facilitate este oferita de dezvoltatorii mari de SGBD cum este Oracle care
integreaza un soft complet de backup in suita lor de aplicatii. Solutiile opensource de
tipul MySQL au de regula posibilitatea de a conlucra cu aplicatii third-party care sa
realizeze aceasta operatie.
13
cand nu vorbim de informatii critice. Acestea au intotdeauna locuri
rezervate.
- Central configuration administration – toate aplicatiile au o anumita
forma de administrare globala a aplicatiei fie ca aceasta presupune o
interfata web, fie ca presupune utilizarea unui client si realizarea unei
conexiuni de tip remote conection. Desi marea majoritate a aplicatiilor
profesionale suporta si administrare prin consola, tendinta este de a se
oferi clienti web-based si lightweight
- Centralized monitoring for backup status – presupune pastrarea de
loguri si oferirea posibilitatii de monitorizare la nivel centralizat a
situatiei backup-urilor facute. In general se prefera interfetele web aici
ele fiind cel mai usor de accesat. O mica atentie la acest capitol, unele
aplicatii risca sa incarce inutil procesoarele prin calculul a tot felul de
statistici care nu se dovedesc a fi intotdeauna utile
- Open-File/Database Replication care presupune posibilitatea de
replicare a fisierelor respectiv bazelor de date
- Byte-Level replication. Este o functie mai rara printre aplicatiile de
backup dar care are avantajul ca aduce datele in backup exact in forma
lor. Este foarte utila pentru backup foarte des deoarece, chiar daca un
fisier sau o baza de date sunt accesate, nu toti bytes din el/ea sunt
modificati. Dezavantajos ar fi ca in cazul intreruperii conexiunii din
varii motive sfarsim cu date inutilizabile (data streams fara sens).
- E-mail reporting care asigura instiintarea administratorului despre
evenimentele ce au avut loc in timpul backup-ului si semnalarea de
probleme. Daca luam in considerare posibilitatile de acces la internet
prin telefoanele mobile din ziua de azi, realizam ca acest serviciu este
foarte important si poate fi considerat ca fiind time critical.
14
4 Bibliografie:
http://www.dell.com/content/topics/topic.aspx/global/products/landing/en/storage?c=us&
l=en&ref=hmpgwn2&s=gen
http://www.apple.com/xsan/resources/
http://images.apple.com/xsan/docs/L363053A_Xsan2_TO.pdf
http://en.wikipedia.org/wiki/Storage_Area_Network_(SAN)
http://www.emc.com/collateral/software/solution-overview/h4215-ms-windows-server-
so.pdf
http://www-03.ibm.com/systems/deepcomputing/bluegene/index.html
http://en.wikipedia.org/wiki/Blue_Gene
http://searchstorage.techtarget.com/news/article/0,289142,sid5_gci1121697,00.html
http://www.peersoftware.com/solutions/data_retention/server_backup.aspx?&utm_source
=google&utm_medium=cpc&utm_campaign=Backup%2BSoftware&gclid=CMvb1dflg5
cCFQtJtAodHUrLZA
15