Sunteți pe pagina 1din 15

Cuprins

Cuprins............................................................................................................................ 1
Fiabilitatea datelor ........................................................................................................... 2
1 Fiabilitatea hardware ............................................................................................... 3
1.1 Metode de protectie cu timp de reactie ............................................................. 3
1.1.1 Backup ..................................................................................................... 3
1.2 Metode de protectie fara timp de reactie ........................................................... 3
1.2.1 RAID ....................................................................................................... 3
1.2.2 Redundant Servers ................................................................................... 5
1.2.3 SAN ......................................................................................................... 6
1.3 Alte metode de protectie ................................................................................ 11
1.3.1 Securitate secundara ............................................................................... 11
2 Fiabilitate software ................................................................................................ 11
2.1 Sisteme de fisiere ........................................................................................... 11
2.2 Backup........................................................................................................... 12
3 Solutii software de backup ..................................................................................... 13
4 Bibliografie: .......................................................................................................... 15
Fiabilitatea datelor

Fiabilitatea datelor reprezinta un aspect foarte important in lumea moderna a


calculatorului. Deoarece, cu fiecare zi ce trece, pretul echipamentelor hardware scade iar
performanta acestuia creste, balanta trece de parte software-ului care trebuie sa
completeze cat mai corespunzator solutiile hardware aflate la dispozitia marilor
constructori de sisteme de calcul de tip enterprise. De asemenea trebuie remarcat faptul
ca nu mai vorbim de fiabilitate a datelor numai in domeniul enterprise ci si in domeniul
de advanced home user.
Advanced home userul este acea persoana care utilizeaza calculatorul pentru
dezvoltarea de aplicatii, realizarea de simulari sau chiar design la scara mai mica (un
architect sau un inginer care se familiarizeaza cu o aplicatie noua). De asemenea si
dezvoltatorii web intra in aceasta categorie, in special cei care au nevoie de baze de date
performante si sigure manevrate cu unelte de programare web din cele mai diverse.
Fiabilitatea inseamna siguranta in exploatare. Siguranta in exploatare presupune
deci accesul la date in situatiile in care apar defectiuni. Defectiunile pot fi de tip hardware
sau software. O defectiune software survine in urma unui atac asupra sistemului ce
contine datele sau a unei erori de programare din aplicatia care manipuleaza datele.
Erorile de programare in acest gen de aplicatii sunt in general reduse deoarece
dezvoltarea aplicatiilor presupune trecerea prin mai multe faze alpha si beta pana la
versiunea finala si de asemenea, pe masura ce sunt descoperite erori, acestea sunt
indreptate prin intermediul diferite-lor patch-uri si update-uri. Tot aceste patch-uri si
update-uri corecteaza si vulnerabilitati pentru a face aplicatia mai sigura din punct de
vedere al accesului neautorizat. De mentionat insa ca din totalitatea defectiunilor
survenite in astfel de aplicatii, intre 3% – 5% se situeaza numarul erorilor cauzate de
atacuri externe.

2
1 Fiabilitatea hardware

1.1 Metode de protectie cu timp de reactie


1.1.1 Backup

Fiabilitatea din punct de vedere hardware o putem clasifica in functie de timpul de


raspuns oferit. Securitatea cu timp de raspuns ridicat este reprezentata de solutiile de
backup. Backup presupune salvarea datelor din locatia principala in alta locatie sau pe
medii externe de stocare. Avantajul principal al operatiunii de backup il prezinta faptul ca
se pot arhiva informatiile si astfel se reduce spatiul necesar pentru depozitarea datelor. De
asemenea arhivarea si depozitarea diferitelor versiuni de backup permite intoarcerea la o
versiune anterioara a datelor daca se constata ca s-au facut niste modificari eronate si ca
s-a pierdut informatia initiala. Partea de hardware care tine de backup s-a redus
considerabil in ultima perioada, astfel incat daca mai vb de hardware specializat pentru
backup mai vb doar de medii de stocare si solutii integrate oferite de marii producatori,
solutii care insa nu sunt nimic altceva decat medii de stocare insotite de un soft adecvat
care sa profite de toate facilitatile oferite de acest sistemul de backup. Asadar nu exista
solutie de backup pur hardware.

1.2 Metode de protectie fara timp de reactie

Al doilea tip de fiabilitate, este fiabilitatea cu raspuns 0. Aceasta presupune ca


datele sa fie in permanenta in siguranta si la dispozitia beneficiarului. Intr-o descriere
scurta, acest aspect presupune ca indiferent ce se intampla si din ce motive, datele sunt in
continuare accesibile la aceeasi parametrii ca si intr-o functionare normala a instalatiei.

1.2.1 RAID

Unul dintre primele concepte care a realizat partial acest deziderat a fost
conceptul de RAID 1 care presupune utilizarea a 2 sau mai multe hdd intr-o functionare
de tip mirroring. In teorie, daca unul din discurile ce alcatuiesc matricea de raid 1 cade,
atunci functionarea este automat translatata pe una din oglinzile acestuia. Mai exact hdd-

3
urile fiind identice, de pe fiecare porneste un flux de date iar aceste fluxuri sunt
comparate si se transforma intr-un singur flux. In cazul in care apar diferente la
comparare, hdd-ul care a generat diferenta este refacut dupa unul din celelalte. Astfel
datele sunt in permanenta in siguranta. Au mai aparut si alte tipuri de RAID care ofera o
atentie sporita si maximizarii spatiului utilizat dar care nu ofera acelasi grad de siguranta
ca si RAID 1. De mentionat ca RAID 1 este cel mai costisitor sistem RAID din punct de
vedere al spatiului de stocare (se folosesc n HDD iar dimensiunea vizibila este aceea a
unui HDD)

Figure 3 – RAID 3
Figure 1 – RAID 0

Figure 4 – RAID 4
Figure 2 – RAID 1

4
Figure 6 – RAID 6

Figure 5 – RAID 5

O problema care se ridica atunci cand se utilizeaza solutii cu timp 0 de recovery


este sincronizarea datelor. Deoarece acestea sunt accesate aleator, aplicatia de backup
trebuie sa faca o monitorizare permanenta a fiecarui fisier si sa realizeze copia de
siguranta atunci cand fisierul nu este accesat. A doua problema se afla in faza de acces al
mediului de siguranta deoarece in clipa in care apare defectiunea in serverul principal, cel
secundar trebuie sa fie indentic cu el pentru a putea prelua lucrul instantaneu. Din aceasta
cauza, cand apar defectiuni de multe ori se intarzie trecerea responsabilitatilor de pe un
sistem pe altul cu cateva secunde sau chiar un minut pentru a permite realizarea de
verificari din punct de vedere al sincronizarii datelor, dupa care se reia lucrul in mod
normal. In cazul RAID timpul este cu adevarat 0 dar daca folosim alte solutii cum ar fi
redundant servers prezentata mai jos, vom vedea ca aceasta perioada de asteptare este
strict necesara deoarece comunica mai greu intre ele decat HDD-urile intr-un sistem.

1.2.2 Redundant Servers

Un alt principiu de fiabilitate este acela de redundant servers. Serverele principale


au niste copii absolut identice ori in aceeasi locatie ori de preferat in alta locatie pentru a
asigura si protectii in caz de calamitate naturala (ex: cutremur). Daca serverul principal
cade, indiferent de motiv, serverul secundar care functiona in paralel cu acesta preia
instantaneu sarcinile de lucru astfel ca pentru beneficiar, problema aparuta este
insesizabila. Avantajul principal al acestui sistem este acela ca ofera cel mai mare grad de
siguranta la ora actuala. Dezavantajul principal este legat de mentinerea sincrona a celor

5
2 sau mai multe servere redundante. De vreme ce hdd-urile ce functioneaza in raid 1 se
afla in aceeasi incinta, pot fi supravegheate mai usor si sincronizarea este mult mai usor
de pastrat decat in cazul serverelor. Se pun probleme de latime de banda la transfer,
securitatea acestui transfer pentru a preveni interceptia fluxurilor de date si de asemenea
toate locatiile ar trebui sa ofere aceleasi conditii beneficiarilor ceea ce limiteaza oarecum
aria de raspandire a serverelor redundante: etaje diferite ale aceleasi cladiri, cladiri
apropiate sau orase apropiate cel mult. Orice altfel de mecanism ce permite cresterea
distantei deja presupune costuri enorme din punct de vedere al transferului de date si
mentinere a sincronizarii.

1.2.3 SAN

Fiabilitatea datelor presupune si viteza. De multe ori daca intervenim pe server cu


prea multe aplicatii care sa introduca controale de securitate si sa ia masuri de protectie,
incetinim accesul la date in mod considerabil si acest lucru poate creea probleme, mai
ales cand se lucreaza cu aplicatii in timp real (time critical aplictations). Asadar ar fi
nevoie de o solutie care sa imbunatateasca viteza serverelor redundante. Solutia se
numeste SAN – Storage Area Network si care, asa cum ii spune si numele presupune
existenta unui „depozit” de date in retea. Aceasta zona asigura independent stocarea
datelor incat utilizatorii care beneficiaza de accesul la datele din SAN nu sunt interesati
de cum functioneaza aceasta retea. Managementul ei se face separat fata de cel al
retelelor la care este legata si tot in cadrul ei se asigura si fiabilitatea si siguranta datelor.
Pe serverele din SAN sunt puse in functiune programele de tip antivirus, firewall,
sistemele de backup si alte sisteme necesare care sa asigure accesul la date in conditii
optime.

6
Figure 7 – DAS vs NAS vs SAN

Structura unui SAN presupune existenta unui backbone de retea prin care sunt
conectate serverele ce alcatuiesc SAN-ul si o multitudine de switch-uri de inalta
performanta ce permit conectivitatea SAN cu restul sistemelor din retea. Evolutia SAN-
urilor merge in directia separarii cat mai puternice intre echipamentul fizic de stocare si
entitatile virtuale puse la dispozitia beneficiarilor. Aceasta separare puternica a fost
incurajata si de conceptul de virtualizare care a permis o creeare cat mai usoara si un
management cat mai bun al sistemelor si entitatilor virtuale ce ruleaza pe platformele deja
existente. Aceasta virtualizare a permis deci si emularea de protocoale concepute pentru
mediul local peste protocoale de retea. Descoperim astfel in SAN-uri interfete SCSI over
ethernet, ATA over Ethernet, Fiber Chanel over Ethernet, sau chiar iSCSI over TCP/IP.
Asadar, din punct de vedere al beneficiarului, SAN-ul reprezinta chiar hardisk-ul,
un harddisk insa mult mai sigur si mai fiabil. Datorita performantelor atinse de SAN-uri
unele firme prefera sa isi boot-eze propriile servere de pe partitii din SAN.

7
Figure 8 – Diferente de concet intre SAN, NAS si DAS

Inainte de SAN a fost conceptul de NAS – Network Area Storage. Diferenta


principala intre cele doua o reprezinta pozitia sistemului de fisiere in schema de
functionare. De bine ce la SAN, acesta este activat inainte de trecerea prin retea, la NAS
este activat dupa. Sistemul de fisiere se afla deci la destinatie ceea ce presupune o
organizare mai complexa si mai dificil de intretinut in cadrul NAS-ului. Sa nu uitam ca
utilizatori diferiti necesita partitii de tip diferit lucru ce complica si mai tare organizarea
serverelor NAS si de asemenea nu permite amestecarea datelor pentru ca altfel acestea s-
ar corupe. In SAN insa, nu se afla decat un amalgam de date al carui management este
facut de aplicatia de monitorizare a instalatiei respective, date care sunt ulterior cerute de
echipamentele de retea. Acestea strabat reteaua iar la destinatie sunt traduse de un sistem
de fisiere care le face sa apara asemenea fisierelor de pe o partitie standard.

8
Figure 9 – Mediu de lucru hibrid

1.2.3.1 Ce este un SAN file system?

Un SAN este deci o metoda de a unifica medii de stocare spre realizarea unei
entitati de date virtuale. Avantajul major al sistemelor SAN este acela ca pun la dispozitia
mai multor utilizatori datele din interiorul hdd-ului virtual (daca il putem numi astfel)
simultan. SAN este deci un sistem ce permite performanta in domeniul accesului
concurent la date. Acest aspect este dat in general de prezenta unor conexiuni de tipul
fiber channel intre utilizatori si locul de stocare al datelor spre deosebire de NAS si DAS
care foloseau protocoale bazate pe ethernet.
Deoarece datele sunt stocate intr-un singur loc, sharing-ul acestora se poate
realiza mult mai usor tinand cont de posibilitatile de acces oferite de sistemele SAN. De
asemenea se elimina si asa numitele single point of failure. Este vorba de acele noduri
cruciale din retea care reprezinta cosmarul oricarui administrator de sistem sau de retea.
Intregul ansamblu nu mai depinde de un element. Iesirea se face prin switch-uri de fibra
optica legate la mai multe servere de acces ce comunica intre ele. Tot din acest motiv se
poate realiza si un management mai facil al accesului la datele din SAN si al drepturilor
utilizatorilor.

9
Stim cu totii ca tehnologia este in continua dezvoltare si de aceea, este foarte
important ca SAN-urile sa permita aceasta evolutie fara costuri majore sau downtime. De
aceea SAN este foarte flexibil. Se pot scoate si adauga matrici RAID (module RAID)
foarte simplu si acestea sunt apoi usor configurate in general printr-o interfata de
configurare a mediului SAN (toti marii producatori pun la dispozitie un soft proprietate
pentru a realiza acest lucru). De asemenea prin cresterea numarului de servere se poate
creste numarul de functii si numarul de utilizatori de pe mediul SAN. Totodata se poate
permite si inlocuirea facila a dispozitivelor de legatura (switch-uri) intre servere si mediul
de stocare prin permiterea functionarii in paralel a acestora pe timpul introducerii noii
tehnologii. Astfel, mediul SAN are un up-time teoretic nelimitat si este totodata un mediu
foarte dinamic de lucru.
Lipsa de transparenta a modului in care sunt gestionate fisierele pentru utilizatorii
care acceseaza aceste fisiere este o norma importanta de securitate in SAN. Fiecare SAN
in parte are regulile proprii stabilite si utilizeaza diferiti algoritmi de criptare a datelor.
Transferul se face numai prin linii de fibra optica sau poate pe viitor prin dispozitive
similare dar mai rapide si niciodata nu se vor alege solutii wireless care pot fi
interceptate. Accesul utilizatorilor de asemenea este limitat pana in serverele SAN.
Acestea la randul lor acceseaza fisierele si le pun la dispozitie (realizeaza munca unui
controller de HDD) si deci nici macar utilizatorii nu isi pot vedea locatia fisierelor.
Multi producatori pun la dispozitia beneficiarilor de sisteme SAN si niste solutii
de avarie in cazul defectarii instalatiei de fibra optica ce realizeaza transferul de date.
Aceste solutii sunt mult mai lente dar sigure (gigabit ethernet in general sau mai rapid) si
mentin dezideratul de 0 downtime al SAN.
De remarcat ca pe SAN-uri se folosesc sisteme UNIX-like acestea fiind capabile
de gestiunea sistemelor de fisiere jurnalizate. Acest tip de sisteme de fisiere sunt mult mai
sigure si cu posibilitatea avansata de recuperare a datelor decat in cazul sistemelor
nejurnalizate.
Odata cu aparitia Windows 2008, Microsoft a introdus si primele variante de SAN
ce poarta numele de Microsoft Cluster Server. Acest sisteme este relativ diferit de
topologia SAN prezentata dar rezultatele sale vor fi similare. Au aparut producatori care
propun si asemenea solutii dar ele fiind foarte noi, inca nu se cunosc parametrii de

10
eficienta si rentabilitate ai unei astfel de solutii si de asemenea va mai dura pana cand va
fi pus la punct sistemul Active Directory pentru a conlucra eficient cu aceasta tehnologie.
Din punct de vedere hardware, ca punct comun de constructie al SAN-urilor mai
intalnim magistralele de date din matricele RAID care sunt de regula High Speed SCSI
sau SAS. Tehnologia S-ATA, desi ofera viteze foarte mari nu confera siguranta necesara
si posibilitatile de extensie ale magistralelor mai sus mentionate.

1.3 Alte metode de protectie


1.3.1 Securitate secundara

Un al treilea aspect mai putin important insa al fiabilitatii datelor din punct de
vedere hardware il reprezinta echipamentele periferice aditionale si numeroasele
tehnologii noi de asamblare si deployment al serverelor de mare capacitate. Prin toate
aceste masuri si echipamente aditionale, ne referim la camere special amenajate cu
protectie speciala impotriva incendiului (de regula pompe de vidare), utilizarea de
generatoare de curent electric proprii sau de solutii de tip UPS care sa asigure
functionarea in caz de avarie a retelei electrice, utilizarea de surse redundante in sistemele
server ce pot fi schimbate in timpul functionarii atunci cand este nevoie si de asemenea
imbunatatirea tehnologiei de realizare a sasiurilor serverelor care mai nou sunt proiectate
in vederea disiparii cat mai eficiente a radiatiei electromagnetice emisa de circuitele din
interior, a temperaturii si chiar si a vibratiilor mecanice ce pot afecta in timp dispozitivele
de stocare.

2 Fiabilitate software
2.1 Sisteme de fisiere

Tot in capitolul fiabilitatii datelor din punct de vedere software se incadreaza si


sistemele de fisiere moderne de tipul NTFS 5, ext3, reiserfs la nivel local si structurile de
tip NFS la nivelul sharingului de fisiere in retea. De mentionat ca aceste sisteme ajuta mai
mult la securizarea si mentinerea integritatii fisierelor, indiferent de continutul acestora,
oferind in acelasi tip si viteze mai mari de lucru pentru utilizatorii care necesita acces la

11
fisierele respective. In general, cand vine vorba de baze de date, acestea sunt platform
independent in marea lor majoritate (mai putin produsele Microsoft care sunt dependente
de sistemul de operare Windows). Asadar din acest punct de vedere avem o redundanta a
protectiei datelor. Mai exact baza de date isi asigura singura integritatea prin numeroase
procese de verificare si diagnoza in timp ce sistemul de fisiere face aproximativ aceeasi
operatie dar din exteriorul bazei de date, el fiind singurul care se ocupa de integritatea
componentelor aplicatiilor adiacente bazei de date (serverul care lanseaza baza, clienti,
etc)

2.2 Backup
Toate solutiile hardware de backup trebuiesc sprijinite de niste solutii software
adecvate care sa poata fata tuturor cerintelor si care totodata sa fie capabile sa utilizeze la
potential maxim hardware-ul aflat la dispozitie. Primele astfel de aplicatii au fost
aplicatiile de backup care la inceput foloseau unitati floppy sau benzi magnetice dar in
ziua de azi pot folosi orice mijloc de stocare aflat la dispozitie.
Backup-ul poate fi de mai multe feluri:
- backup clasic
- backup incremental.
Backup-ul clasic presupune salvarea datelor in alta locatie decat aceea din care se
lucreaza. Aceasta operatie poate fi realizata manual de catre utilizator (administrator de
sistem, etc) fie prin copiere directa fie prin utilizarea unui soft de arhivare sau poate fi
realizata cu ajutorul unui soft dedicat. Softul dedicat ofera in general cateva facilitati
foarte importante:
Este autonom prin faptul ca poate fi configurat de asa natura incat sa execute
operatiuni de backup la intervale regulate sau momente de timp prestabilite, este capabil
sa comunice cu administratorul prin intermediul serviciului de e-mail, informandu-l pe
acesta cu privire la starea datelor si a job-urilor de backup executate sau ce urmeaza a fi
executate, si de asemenea poate lucra in cooperare cu diverse aplicatii de arhivare ce ii
permit sa reduca dimensiunile informatiei stocate. Softurile de backup din gama
profesionala permit de asemenea si managementul lor la distanta astfel incat operatiuni
simple se pot realiza fara sa fie necesara interventia la fata locului. Pe masinile echipate
cu sisteme de operare UNIX – Like, managementul se poate face si prin intermediul

12
remote shell care poate controla intre sistemul de la distanta. De asemenea managementul
se poate face si cu ajutorul unei interfete web pe care unele aplicatii de backup o pun la
dispozitie. In general aceasta interfata web lucreaza in combinatie cu aplicatii de genul
Apache (cu extensia Tomcat unde este nevoie de suport java) sau IIS (Internet
Information Server).
Problemele ce apar in cazul efectuarii operatiunii de backup sunt legate, odata de
dimensiunea largimii de banda a conexiunii intre locatia de backup si sursa datelor, si in
al doilea rand de accesul concurent al datelor. Daca cineva acceseaza spre modificare un
fisier, acesta nu poate fi copiat deoarece sistemul de operare nu permite. Din aceasta
cauza se prefera de multe ori realizarea de backup in momente in care utilizarea
serverului este extrem de redusa pentru a reduce riscul unui astfel de conflict.
Pentru a evita aceasta problema a accesului concurent, dezvoltatorii de SGBD
(sitemelor de gestiune a bazelor de date) implementeaza in aplicatiile lor solutii proprii de
realizare de backup a bazelor de date, chiar si in timpul accesului la acestea. In general o
asemenea facilitate este oferita de dezvoltatorii mari de SGBD cum este Oracle care
integreaza un soft complet de backup in suita lor de aplicatii. Solutiile opensource de
tipul MySQL au de regula posibilitatea de a conlucra cu aplicatii third-party care sa
realizeze aceasta operatie.

3 Solutii software de backup


Asa cum era de asteptat, toti marii producatori de hardware ofera si diferite solutii
software capabile sa interactioneze la un nivel cat mai bun cu echipamentele lor.
Deoarece numarul de aplicatii este foarte mare nu ne putem opri nici macar asupra
catorva pentru analiza. Numarul lor de functii a crescut extrem de mult, devenind
adevarate solutii de enterprise data management. Cel mai simplu ar fi sa trecem in revista
cateva din elementele comune avute de toate aceste aplicatii:
- one to one or many to one server backup – unele aplicatii pot sa
salveze date in copii identice sau pot stoca intr-o singura locatie datele
din mai multe sisteme. Cea de-a doua varianta se foloseste atunci cand
datele sunt de dimensiuni reduse dar foarte raspandite si de asemenea

13
cand nu vorbim de informatii critice. Acestea au intotdeauna locuri
rezervate.
- Central configuration administration – toate aplicatiile au o anumita
forma de administrare globala a aplicatiei fie ca aceasta presupune o
interfata web, fie ca presupune utilizarea unui client si realizarea unei
conexiuni de tip remote conection. Desi marea majoritate a aplicatiilor
profesionale suporta si administrare prin consola, tendinta este de a se
oferi clienti web-based si lightweight
- Centralized monitoring for backup status – presupune pastrarea de
loguri si oferirea posibilitatii de monitorizare la nivel centralizat a
situatiei backup-urilor facute. In general se prefera interfetele web aici
ele fiind cel mai usor de accesat. O mica atentie la acest capitol, unele
aplicatii risca sa incarce inutil procesoarele prin calculul a tot felul de
statistici care nu se dovedesc a fi intotdeauna utile
- Open-File/Database Replication care presupune posibilitatea de
replicare a fisierelor respectiv bazelor de date
- Byte-Level replication. Este o functie mai rara printre aplicatiile de
backup dar care are avantajul ca aduce datele in backup exact in forma
lor. Este foarte utila pentru backup foarte des deoarece, chiar daca un
fisier sau o baza de date sunt accesate, nu toti bytes din el/ea sunt
modificati. Dezavantajos ar fi ca in cazul intreruperii conexiunii din
varii motive sfarsim cu date inutilizabile (data streams fara sens).
- E-mail reporting care asigura instiintarea administratorului despre
evenimentele ce au avut loc in timpul backup-ului si semnalarea de
probleme. Daca luam in considerare posibilitatile de acces la internet
prin telefoanele mobile din ziua de azi, realizam ca acest serviciu este
foarte important si poate fi considerat ca fiind time critical.

14
4 Bibliografie:
http://www.dell.com/content/topics/topic.aspx/global/products/landing/en/storage?c=us&
l=en&ref=hmpgwn2&s=gen

http://www.apple.com/xsan/resources/

http://images.apple.com/xsan/docs/L363053A_Xsan2_TO.pdf

http://en.wikipedia.org/wiki/Storage_Area_Network_(SAN)

http://www.emc.com/collateral/software/solution-overview/h4215-ms-windows-server-
so.pdf

http://www-03.ibm.com/systems/deepcomputing/bluegene/index.html

http://en.wikipedia.org/wiki/Blue_Gene

http://searchstorage.techtarget.com/news/article/0,289142,sid5_gci1121697,00.html

http://www.peersoftware.com/solutions/data_retention/server_backup.aspx?&utm_source
=google&utm_medium=cpc&utm_campaign=Backup%2BSoftware&gclid=CMvb1dflg5
cCFQtJtAodHUrLZA

15

S-ar putea să vă placă și