Documente Academic
Documente Profesional
Documente Cultură
7.1. Introducere
n acest capitol se prezint arhitectura echipamentelor de calcul dintr-un
singur punct de vedere, i anume cel al fiabilit ii. Prezentarea nu va fi
exhaustiv i nici matematizat ; se vor folosi mai ales exemple pentru a
ilustra cum felurite considera ii despre fiabilitate influen eaz structura
echipamentelor de calcul.
Metoda evit rii defectelor este cu adev rat extrem . ntruct s-a constatat
c oricare dintre componente se poate defecta, se utilizeaz proceduri de
men inere a echipamentului n func ionare prin implementarea toleran ei
la defectare (fault-tolerance).
Foarte interesant este faptul c o arhitectur DIVA poate tolera chiar erori
de proiectare n procesorul foarte complicat, pentru c acestea sunt
detectate i corectate de procesorul lent i simplu. Poate fi chiar avantajos
ca procesorul rapid s fie proiectat incorect, dar extrem de rapid, n cazul
n care nu produce rezultate eronate prea frecvent. De exemplu, ntr-un
procesor normal foarte multe circuite suplimentare sunt introduse pentru a
trata corect cazul programelor care se auto-modific . n realitate, practic
nici un program modern nu folose te aceast tehnic n mod curent;
procesorul rapid f r aceste circuite poate fi f cut mult mai eficient, iar
corectitudinea calculelor va fi asigurat de c tre procesorul lent.
S-au prezentat deja mai multe exemple de folosire a redundan ei spa iale
pentru detectarea i corectarea erorilor. Costul schemelor prezentate mai
nainte este substan ial: ele cer o multiplicare identic a unui ntreg
echipament. De exemplu, redundan a modular tripl are o eficien de
33%, pentru c hardware-ul este multiplicat de trei ori.
n figura 7.2 este prezentat formatul unui sector de disc. Informa ia servo
este folosit pentru controlul mi c rii capului, identificatorul indic
num rul sectorului curent, iar informa ia de sincronizare este folosit
pentru a sincroniza pozi ia capului cu nceputul sectorului.
ntr-o aplica ie tipic , memoria Flash este de 2-10 ori mai rapid dect
hard-diskul. Aplica ie tipic este cea n care datele sunt citite de 4-5 ori
mai des dect sunt scrise, iar transferurile de date tind s fie scurte i nu
foarte frecvente. Debitul de date n cazul unui transfer continuu este mai
redus: 0,7-1 Moctet pe secund la citire i 2-300 Kocte i pe secund la
scriere, fa de valoarea de 5 Mocteti pe secund n mod rafal (burst).
Alte avantaje ale FlashDisk-urilor sunt nivelul sonor foarte redus n timpul
func ion rii (unele hard-diskuri pot fi destul de zgomotoase) i posibilitatea
lucrului la altitudini foarte ridicate. Hard-diskurile au nevoie de o presiune
atmosferic minim pentru a realiza perna de aer pe care plutesc capetele.
Cel mai important lucru este c ofer o stabilitate mult mai bun a
aplica iilor, n medii de lucru dure, cu ocuri i vibra ii. n astfel de medii,
unit ile de hard-disk clasice chiar dac nu se defecteaz , prezint erori de
c utare, astfel c r spunsul devine lent, iar comportarea - aleatoare.
Consumul redus de energie contribuie la cre terea duratei de via a
ntregului sistem.
Func ionare normal : opera iile de citire extrag date de pe cele patru
discuri cu date. O opera ie de scriere ns strnge patru blocuri de
informa ie i calculeaz un al cincilea bloc de paritate; fiecare bloc este
stocat pe alt disc. Acest mod de scriere se nume te striping, adic
feliere, pentru c datele sunt scrise n paralel, cte o felie pe fiecare disc.
168 Cap. 7. Fiabilitatea echipamentelor de calcul
Reconstruc ia: este nceput cnd un disc defect este nlocuit. Un proces
secundar recalculeaz informa ia lips i o scrie pe noul disc.
ntr-o prim aproxima ie, circuitele digitale obi nuite sunt compuse din
elemente computa ionale simple, numite por i logice, conectate ntre ele
prin srme. Por ile logice sunt construite din tranzistori. Fiecare poart
logic face calcule pe mai multe valori de 1 bit. Por ile logice sunt
universale, n sensul c orice proces calcul poate fi exprimat n termeni de
opera ii ale por ilor logice.
a) b)
Figura 7.3. Structura unui circuit reconfigurabil
n figura 7.3-a procesul de plasare asociaz fiecare poart logic din circuitul
de implementat cu o poart universal . Procesul de rutare conecteaz por ile
universale folosind segmente de srm legate cu comutatoare. n cazul defect rii
unora dintre por ile universale plasarea i rutarea le pot ocoli, sintetiznd un
circuit perfect func ional, situa ie ilustrat n figura 7.3-b.
170 Cap. 7. Fiabilitatea echipamentelor de calcul
Un fenomen legat de acest ciclu permanent de nnoiri este cel cunoscut sub
denumirea putrezirea bi ilor (bit rot). Acest fenomen se manifest pe
dou planuri: datele stocate cu mult timp n urm nu mai pot fi folosite n
noile echipamente de calcul, pentru c dispozitivele periferice nvechite nu
mai sunt suportate de fabrican i, i programe vechi, care mergeau foarte
bine, ncep s manifeste erori. Boala programelor este legat de mediul
n care programele se execut , i care este n continu schimbare. De
exemplu, multe programe vechi f ceau anumite presupuneri despre ct de
mari vor fi seturile de date pe care le vor prelucra. Cea mai faimoas astfel
de presupunere este cea care a cauzat bug-ul Y2K: programatorii din anii
60 au presupus c programele lor nu vor manipula niciodat date
calendaristice al c ror an nu va ncepe cu cifrele 19. Chiar dac Y2K a
f cut mai mult zgomot dect pagube, astfel de presupuneri se ntlnesc la
tot pasul n programele de ast zi. De exemplu, pot apare dificult i n a
transporta programe de la procesoare pe 32 de bi i la procesoare pe 64 de
bi i. Din moment ce orice valoare pe 32 de bi i se poate reprezenta exact
atunci cnd folosim 64 de bi i, teoretic nu ar trebui s fie nici o problem ,
i vechile programe ar trebui s func ioneze corect. n realitate multe
programe depind n feluri subtile de precizia datelor pe care le
manipuleaz . Cnd un astfel de program este mutat pe o platform nou
toate aceste dependin e se transform n bug-uri.
adev ruri. Verificarea formal studiaz aceste deriv ri, i verific faptul c
sunt corecte.
Una dintre cele mai uimitoare tehnologii ale secolului dou zeci este cu
siguran Internetul. Acesta este o re ea de calculatoare, proiectat ini ial
pentru a conecta re ele militare de calculatoare i de a le permite s opereze
chiar i n condi iile distrugerii unui mare num r de echipamente din re ea,
de exemplu n cazul unei conflagra ii nucleare. Internetul a evoluat ast zi
ntr-o re ea comercial care acoper toate continentele, cu mai mult de 125
de milioane de calculatoare i peste 1 miliard de utilizatori.
probleme din re ea. Re eaua telefonic va permite stabilirea unei leg turi
numai dup ce a rezervat toate resursele necesare pentru transmisiunea
prompt a semnalelor vocale pe ntregul traseu dintre cele dou puncte care
comunic . Standarde stricte dicteaz ct de mult timp poate dura faza de
construc ie a leg turii; dac nu pot fi ob inute toate resursele utilizatorul
prime te un ton de ocupat. Capacitatea re elei este planificat atent pe baza
unor statistici detaliate despre comportarea vorbitorilor, astfel nct n
condi ii normale, ansa ob inerii unui ton de ocupat din cauza resurselor
insuficiente din re ea s fie extrem de redus .
diferit pn la destina ie. Unele pachete se pot pierde, alte pot fi duplicate,
i ele pot sosi la destina ie n alt ordine dect au fost emise, sau chiar
sparte n pachete mai mici.
ntrziate sunt pur i simplu ignorate. Acest lucru este acceptabil pentru c
utilizatorul final, omul, tolereaz semnale cu zgomot.
7.5. Concluzii
Num rul de nivele abstracte trebuie s fie mic orat n mod dramatic,
pentru a reduce costul suplimentar pl tit, care cre te exponen ial.
Trebuie folosite n mod constant tehnici care descoper defecte i
folosesc rezerve pentru a ocoli defectele de fabrica ie.
Calculele trebuie s fie efectuate folosind date codificate utiliznd
coduri robuste, pentru a preveni efectele erorilor tranzitorii.
Utilizarea pe scar larg a metodelor de verificare formal pentru a ne
asigura c echipamentele de calcul pe care le folosim sunt corect
construite.