Sunteți pe pagina 1din 238

Cap. 4.

Echipamente tolerante la defectări 1

CAPITOLUL 1

INTRODUCERE

Fiabilitatea este o disciplină din domeniul ingineriei care utilizează cunoştinţe


ştiinţifice pentru asigurarea unor performanţe ridicate ale funcţiilor unui
echipament, într-un anumit interval de timp şi condiţii de exploatare bine
precizate. Aceasta include proiectarea, abilitatea de a întreţine, de a testa şi a
menţine echipamentul la parametri acceptabili pe toată durata ciclului de viaţă.
Fiabilitatea unui echipament este descrisă cel mai bine de păstrarea
performanţelor acestuia în timp. Performanţele de fiabilitate ale unui
echipament sunt concretizate în faza de proiectare prin alegerea judicioasă a
arhitecturii echipamentului, a materialelor, a procesului de fabricaţie, a
componentelor – atât soft cât şi hard – urmate de verificarea rezultatelor
obţinute în urma simulărilor şi a testelor de laborator.

Pentru a obţine echipamente fiabile sunt necesare cunoştinţe şi deprinderi din


următoarele domenii:

 analiză statistică
 modelarea fiabilităţii echipamentelor
 studii de marketing
 metode de predicţie a fiabilităţii
 proiectare prin metoda cazului cel mai defavorabil
 analiza fizică a defecţiunilor
 analiza modurilor de defectare şi a defectelor
 planificarea şi realizarea încercărilor de fiabilitate / încercări accelerate
2 Cap. 4. Echipamente tolerante la defectări

 definirea conceptului de mentenanţă


 analiza mentenabilităţii
 planificarea şi realizarea mentenanţei
 analiza siguranţei echipamentelor
 fiabilitate / mentenabilitate / siguranţa echipamentului / calitate /
suport logistic / factorii umani / software performant pentru
monitorizare.

Fiabilitatea este un atribut al echipamentelor care nu trebuie ignorat.


Caracteristicile de fiabilitate reprezintă ”ingredientele” critice pentru orice
activitate de proiectare a echipamentelor industriale. Este de preferat să se
ţină cont de aspectele legate de fiabilitate încă din faza de proiectare decât să
nu se facă acest lucru în speranţa că lucrurile vor merge bine.

Apariţia unei teorii a fiabilităţii a fost determinată de creşterea complexităţii


echipamentelor şi de caracterul de masă al producţiei moderne. Domeniul
care a impulsionat dezvoltarea acestei discipline a fost, ca şi în alte cazuri, cel
militar întrucât în timpul celui de-al doilea război mondial s-a constatat că
echipamentele electronice complexe (echipamente de radiocomunicaţii,
sonare etc.) se aflau în stare de defectare un timp sensibil mai mare decât
timpul de funcţionare normală. Pe baza soluţiilor oferite de către această
nouă disciplină – fiabilitatea – au fost posibile progrese mari şi în alte domenii
de activitate, precum centralele nucleare, transporturile (navale, terestre,
aeriene şi în ultimul timp spaţiale), prelucrarea şi transmisia datelor,
producţia bunurilor de larg consum etc.

După trecerea de la producţia manufacturieră la producţia de masă s-a


constatat o mărire a dispersiei parametrilor echipamentelor datorată atât
creşterii complexităţii cât şi micşorării posibilităţilor de control interfazic pe
liniile de producţie. În cazul producţiei de masă, datorită modificărilor rapide
ale cerinţelor tehnice, se constată că nu este necesar întotdeauna să se obţină
un nivel maxim posibil de fiabilitate, ci este esenţial să se cunoască cu precizie
care este nivelul real de fiabilitate, luându-se măsuri pentru deplasarea
Cap. 4. Echipamente tolerante la defectări 3

acestuia către o valoare optimă. În decursul timpului s-a constat că, în cazul
sistemelor şi echipamentelor complexe, oricât s-ar investi pentru a obţine o
fiabilitate ideală, nu se poate obţine un echipament care să nu se degradeze
în timp. Din această cauză este util să se cunoască nivelul real al fiabilităţii,
astfel încât, în funcţie de acesta, să se stabilească durata misiunii, intervalele
de revizie, structura echipamentului etc.

Fiabilitatea este unul dintre parametrii determinanţi pentru competitivitatea


unui produs, întrucât gradul de vandabilitate creşte semnificativ pentru
produsele fiabile. Este de subliniat faptul ca în programul de acţiuni lansate
de Guvernul României la sfârşitul lunii august 2001 pentru creşterea
exporturilor (şi reducerea deficitului comercial al ţării), una dintre măsurile
propuse se referă la creşterea fiabilităţii produselor. Se poate aprecia că
fiabilitatea a devenit o preocupare la nivel naţional. În microelectronică,
studiul fiabilităţii dispozitivelor are o istorie mai veche, de circa 30 de ani, dar
– în primii 10 ani – doar la nivelul de încercări constatative, cu evaluarea post-
factum a fiabilităţii loturilor şi transmiterea rezultatelor către secţia de
fabricaţie. Din 1980 începe pentru domeniul fiabilităţii dispozitivelor
electronice cu semiconductoare o perioadă de succese ale cercetării de profil,
fiind propuse şi implementate metode accelerate de evaluare a fiabilităţii,
precum şi de asigurare a acesteia. Cercetarea românească are contribuţii
însemnate, fiabilitatea dispozitivelor cu semiconductoare fiind unul dintre
domeniile cele mai dinamice ale fiabilităţii româneşti [2].

Pe plan mondial, după anul 1990 s-a intrat într-o nouă etapă de dezvoltare a
domeniului fiabilităţii. Dacă în anii ’60 fiabilitatea se referea la
Control/Verificare, iar în anii ’70 - ‘80 la Asigurare, acum cuvântul de ordine îl
reprezintă Managementul fiabilităţii, cu tot ce implică el: metode adecvate de
predicţie, proiectare pentru fiabilitate, fiabilitatea proceselor, inginerie
convergentă, controlul calităţii totale etc. Dacă pentru tipuri de produse
aflate de mai mult timp în fabricaţie (cum sunt dispozitivele microelectronice)
această preocupare pentru fiabilitate pare justificată, fiind vorba despre
produse care îşi caută un loc pe pieţe din ce în ce mai exigente, în cazul unor
4 Cap. 4. Echipamente tolerante la defectări

produse relativ noi, cum sunt microsistemele, fiabilitatea pare mai degrabă
un lux. Nimic mai greşit, după cum arată ultimele lucrări ale celui mai
prestigios simpozion de profil pe plan mondial, Annual Reliability and
Maintainability Symposium (ARMS), ţinut anual în SUA, alternativ pe coasta
de Vest / Est. Mai ales la produsele foarte noi (cum sunt microstructurile şi
microsistemele – în general, produsele microtehnologiilor) este important ca
fiabilitatea să fie luată în considerare chiar din primul moment (ca un
parametru al ingineriei convergente). În acest mod se câştigă timp şi sume
importante de bani, pentru că punerea la punct a unui nou dispozitiv este
mult mai rapidă decât prin modul tradiţional de lucru (inginerie serială).
Acesta este motivul pentru care fiabilitatea devine acum un parametru
important al proiectării unui dispozitiv. Şi nu este vorba numai de produsele
cu cerinţe speciale de utilizare (echipamente spaţiale sau militare, centrale
nucleare etc.), ci chiar de dispozitivele destinate unor bunuri de larg consum,
care au acum niveluri ale parametrilor de fiabilitate mult mai mari decât cele
militare de acum câţiva ani. Tendinţa actuală este de a se trece de la
certificarea produselor la certificarea tehnologiilor, cu avantaje evidente în
ceea ce priveşte simplificarea procedurilor de livrare.

Principalele obiective ale fiabilităţii sunt:

 studiul defecţiunilor echipamentelor (al cauzelor, al proceselor de apariţie


şi dezvoltare şi al metodelor de combatere a defecţiunilor);
 aprecierea cantitativă a comportării echipamentelor în timpul exploatării
în condiţii normale, ţinând seama de influenţa pe care o exercită asupra
acestora factorii interni şi externi;
 determinarea modelelor şi metodelor de calcul şi prognoză ale fiabilităţii,
pe baza încercărilor de laborator şi a urmăririi comportării în exploatare a
echipamentelor;
 analiza fizică a defecţiunilor;
 stabilirea metodelor de proiectare, constructive, tehnologice şi de
exploatare pentru asigurarea, menţinerea şi creşterea fiabilităţii
echipamentelor, dispozitivelor şi elementelor componente;
Cap. 4. Echipamente tolerante la defectări 5

 stabilirea metodelor de selectare şi prelucrare a datelor privind analiza


fiabilităţii echipamentelor.

Definită din punct de vedere calitativ, fiabilitatea reprezintă capacitatea unui


sistem de a funcţiona fără defecţiuni, la parametri acceptabili, în decursul unui
anumit interval de timp, în condiţii de exploatare bine precizate. Definită din
punct de vedere cantitativ, fiabilitatea unui sistem reprezintă probabilitatea ca
acesta să-şi îndeplinească funcţiile sale cu anumite performanţe şi fără
defecţiuni, într-un anumit interval de timp şi în condiţii de exploatare
specificate.

În cazul echipamentelor a căror perioadă de fabricaţie este suficient de mare


(luni, ani), performanţele de fiabilitate pot fi îmbunătăţite utilizând o structură
cu reacţie negativă de tipul celei prezentate în figura 1.1, [3].

Fig. 1.1. Controlul nivelului de fiabilitate

Pentru realizarea unei îmbunătăţiri a performanţelor de fiabilitate este necesar


să existe instrumente pentru exprimarea cantitativă a fiabilităţii astfel încât să
se poate face o evaluare a nivelului real de fiabilitate al echipamentului. Cu cât
evaluarea nivelului real de fiabilitate se poate face într-un timp mai redus, cu
atât mai repede se va ajunge la nivelul dorit al fiabilităţii. Nivelul optim al
fiabilităţii poate fi stabilit utilizând diferite criterii, dintre care cel economic
este utilizat în cele mai multe cazuri. Există însă şi domenii în care aspectul
economic se află în planul secund, pe primul plan fiind siguranţa în exploatare
a echipamentelor (centrale nucleare, secţii de terapie intensivă, transport aerian
etc).
Separând cheltuielile legate de echipament în costuri de producţie şi costuri
de întreţinere şi reprezentându-le în funcţie de nivelul de fiabilitate, se obţine
o dependenţă între costuri şi fiabilitate de tipul celei prezentate în graficul din
6 Cap. 4. Echipamente tolerante la defectări

figura 1.2. Din grafic se observă că nivelul optim de fiabilitate, din punct de
vedere economic, corespunde unui minim al cheltuielilor totale.

Fig. 1.2. Determinarea nivelului optim de fiabilitate

Analiza fiabilităţii unui echipament se poate face fie la nivel global, fie la nivel
structural, utilizându-se pentru aceasta limbajul teoriei sistemelor. Dacă nu
ţinem cont de structura echipamentului, acesta se poate descrie matematic la
nivel global prin dependenţa funcţională a vectorului de ieşire faţă de vectorul
de intrare:
Y  AU  (1.1)

Atunci când se cunoaşte, chiar şi parţial structura echipamentului se poate pune


în evidenţă un număr de variabile interne, care formează vectorul de stare:
X   x1 , x2 ...xn  .

Fig.1.3. Descrierea pe stare a echipamentului

În această situaţie echipamentul poate fi descris matematic utilizând relaţiile:


Cap. 4. Echipamente tolerante la defectări 7


X  f t , x ,u  (1.2)
Y  g t , x 

Aceste modele, furnizate de teoria sistemelor, pot fi utilizate în scopul


descrierii unui echipament real sub diferite aspecte, depinzând de interpretarea
fizică dată variabilelor de intrare, ieşire şi stare.
Exemplu: Se consideră o reţea formată din rezistenţe, inductanţe, capacităţi,
surse independente şi surse controlate de tensiune şi curent. Dacă se identifică
variabilele de intrare cu sursele independente şi variabilele de ieşire cu valorile
curenţilor şi tensiunilor în diferite puncte ale reţelei, sistemul abstract va fi
caracterizat, din punct de vedere funcţional, printr-o relaţie globală de tip (1.1),
iar dacă alegem drept variabile de stare valorile curenţilor prin inductanţe şi
ale tensiunilor de pe capacităţi, reţeaua va fi descrisă prin ecuaţii canonice de
stare (1.2), [3] .
Modelarea fiabilităţii reţelei va pretinde o cu totul altă interpretare a
variabilelor, astfel încât să se urmărească evoluţia performanţelor
echipamentului în condiţii de solicitare precizate. Astfel variabilele de intrare
se identifică cu solicitările aplicate asupra echipamentului, fie că acestea sunt
solicitări utile, esenţiale în vederea îndeplinirii funcţiei acestuia, cum ar fi
tensiunile, curenţii, puterile disipate, fie că sunt solicitări perturbatoare, ca
temperatura ambiantă, umiditate, vibraţii, şocuri, interferenţe
electromagnetice, câmpuri electrice etc. Variabilele de ieşire vor fi identificate
cu performanţele echipamentului: durata regimului tranzitoriu, rezerva de
stabilitate, banda de frecvenţă, eroarea staţionară etc.
O analiză la nivel global a fiabilităţii unui echipament conduce la o relaţie
funcţională de tipul (1.1) între performanţe şi solicitări, iar o analiză structurală
conduce la sistemul de ecuaţii (1.2) care leagă performanţele de solicitări prin
intermediul parametrilor elementelor componente.
O particularitate fundamentală a modelului abstract al fiabilităţii unui
echipament este dependenţa stohastică între variabilele care definesc modelul.
Chiar dacă solicitările aplicate echipamentului sunt riguros deterministe şi
controlabile, cum se întâmplă în condiţii de laborator, evoluţia performanţelor
8 Cap. 4. Echipamente tolerante la defectări

globale ale echipamentului nu este întru totul previzibilă, astfel încât vectorul
de ieşire trebuie considerat un proces aleator p - dimensional.
Admiţând necesitatea modelului aleator pentru analiza fiabilităţii
echipamentelor, este de remarcat faptul că analiza cantitativă a modelului prin
prisma proceselor aleatoare asociate parametrilor şi performanţelor este extrem
de laborioasă, deoarece constă în analiza simultană a celor p – procese
aleatoare, care formează vectorul de ieşire (vectorul performanţelor).
Metodele utilizate în teoria fiabilităţii au evitat calculul complicat al
caracteristicilor proceselor aleatoare, preferându-se ca, prin utilizarea noţiunii
de defectare, să se restrângă spaţiul performanţelor la o singură dimensiune.
Defectarea este definită convenţional, ea presupunând existenţa unui domeniu
admisibil Da , în spaţiul p – dimensional, astfel încât dacă vectorul
performanţelor aparţine lui Da , atunci echipamentul se comportă satisfăcător,
în caz contrar echipamentul fiind considerat defect.
Se presupune că în starea iniţială vectorul performanţelor îndeplineşte condiţia
de apartenenţă la Da, însă ulterior performanţele sistemului evoluează aleator,
defectarea producându-se atunci când cel puţin una dintre performanţe
intersectează frontiera domeniului admisibil Da. Pentru un vector de ieşire
unidimensional procesul de defectare poate arăta ca în figura 1.4.

Fig.1.4. Proces de defectare în cazul unidimensional

Se observă că fiabilitatea echipamentului poate fi exprimată fie cu ajutorul


procesului aleator y(t), fie cu ajutorul timpului de funcţionare până la defectare
(T), interpretat ca variabilă aleatoare. Oricare ar fi dimensiunea vectorului de
ieşire, analiza globală a fiabilităţii poate fi efectuată prin prisma timpului de
Cap. 4. Echipamente tolerante la defectări 9

funcţionare până la defectare, ceea ce conduce la o micşorare a dificultăţilor de


calcul.

Exprimarea influenţei solicitărilor asupra parametrilor componentelor şi deci


asupra performanţelor echipamentului este imposibil de realizat în cadrul unei
teorii generale. Studiul bazelor fizico-chimice ale degradării, elucidarea
mecanismelor şi a modurilor de defectare sunt etape necesare, care pot fi
parcurse numai în cadrul analizei aprofundate a unor tipuri particulare de
echipamente.

CAPITOLUL 2
10 Cap. 4. Echipamente tolerante la defectări

FIABILITATEA ECHIPAMENTELOR

2.1. Indicatori de fiabilitate

Pentru caracterizarea fiabilităţii unui echipament se poate utiliza limbajul


teoriei probabilităţilor. Durata de funcţionare până la defectare a unui
echipament (T – figura 1.4) este o variabilă aleatoare continuă a cărei funcţie
de repartiţie o notăm cu F(t), [3]. În conformitate cu definiţia unei funcţii de
repartiţie a unei variabile aleatoare, F(t) reprezintă probabilitatea ca durata T
să fie mai mică decât valoarea t, adică reprezintă probabilitatea ca
echipamentul să se defecteze în intervalul de timp (0, t).
Probabilitatea ca în intervalul (0,t) să nu se producă defectarea echipamentului
reprezintă funcţia de fiabilitate R(t) şi este complementara probabilităţii de
defectare F(t). Cele două funcţii F(t) şi R(t) se referă la evenimente care se
produc sau nu în intervalul de timp scurs de la punerea în funcţiune a
echipamentului la momentul t=0 şi până în momentul curent t, şi nu la
evenimente care au loc la momentul t, aşa cum ar reieşi din notaţii. De fapt
notaţiile F(t) şi R(t) reprezintă o formă simplificată pentru funcţiile F(0, t) şi
R(0, t).
Pentru un interval de timp oarecare, asociat unei misiuni de durată x iniţializată
la momentul t, probabilitatea de defectare a unui echipament poate fi
determinată utilizând relaţia următoare:
F  t , t  x   P t  T  t  x   F  t  x   F  t  (2.1)

În relaţia (2.1) apare o probabilitate totală, care însă nu reflectă în totalitate


realitatea. Echipamentul, considerat fără reînnoire (prima defectare înseamnă
şi sfârşitul ”vieţii” echipamentului), se poate defecta în intervalul (t, t+x)
numai dacă nu s-a defectat în intervalul (0, t). Rezultă că probabilitatea de
defectare F(t, t+x) în intervalul (t, t+x) şi funcţia de fiabilitate R(t, t+x) sunt
probabilităţi condiţionate de buna funcţionare a echipamentului în intervalul
(0, t). Astfel, se poate scrie:
Cap. 4. Echipamente tolerante la defectări 11

P t  T  t  x  F  t  x   F  t 
F t, t  x    (2.2)
P T  t  Rt 

P T  t  x  R t  x 
R t , t  x    (2.3)
P T  t  Rt 

Comportarea locală a echipamentului în jurul unui moment dat, poate fi


descrisă cu ajutorul densităţii de probabilitate a variabilei aleatoare T, definită
astfel:
F  t   t   F t  dF t 
f  t   lim  (2.4)
 t 0 t dt

Densitatea de probabilitate f(t) reprezintă limita raportului dintre


probabilitatea totală de defectare în intervalul  t , t  t  şi mărimea acestui
interval când aceasta tinde către zero. Densitatea de probabilitate f(t) este
numită şi lege de repartiţie a timpului de funcţionare până la defectare a
echipamentului şi are semnificaţia unei probabilităţi totale de defectare în jurul
momentului t, indiferent de comportarea anterioară a echipamentului.
Pentru a descrie pericolul de defectare în jurul unui moment dat al unui
echipament aflat în bună stare până la acel moment, se defineşte un alt indicator
care descrie comportarea locală a echipamentului din punct de vedere al
fiabilităţii. Acest indicator, numit rată de defectare, este o probabilitate
condiţionată analogă ratei mortalităţii din studiile demografice şi se defineşte
ca probabilitatea de defectare în jurul unui moment dat, condiţionată de buna
funcţionare a echipamentului până în acel moment.
F  t   t   F t  f t 
z  t   lim  (2.5)
t 0 Rt    t Rt 

Din relaţiile (2.4) şi (2.5) se obţine:


1 dRt 
z t     (2.6)
Rt  dt

iar prin integrarea ecuaţiei diferenţiale (2.6) în condiţia iniţială R(0)=1 se


obţine:
12 Cap. 4. Echipamente tolerante la defectări

t
  z u du
Rt   e 0 şi F(t)=1-R(t) (2.7)

În afara indicatorilor prezentaţi, fiabilitatea unui echipament poate fi descrisă


şi prin caracteristicile numerice ale variabilei aleatoare care a stat la baza
caracterizării acestuia şi anume timpul de funcţionare până la defectare, T.
Aceste caracteristici sunt: media, abaterea medie pătratică, dispersia şi cuantila
timpului de funcţionare.
Media timpului de bună funcţionare se defineşte utilizând relaţia:

m   t  f t dt , t  0 ,  (2.8)
0


sau: m   Rt  dt (2.9)
0

În lucrările de specialitate se folosesc notaţiile următoare:


 MTBF – Mean Time Between Failures (media timpului de funcţionare
între defectări);
 MTTF – Mean Time To Failures (media timpului de funcţionare până la
defectare, pentru echipamente fără reînnoire );
 MTTFF – Mean Time To First Failures (media timpului de funcţionare până
la prima defectare).
Abaterea medie pătratică şi dispersia timpului de funcţionare se definesc cu
ajutorul relaţiilor următoare:
  0 t  m 2  f t  dt (2.10)

  (2.11)
Mărimile Δ şi σ caracterizează gradul de uniformitate al performanţelor
individuale ale unor echipamente de acelaşi tip din punct de vedere al
fiabilităţii. Dacă procesul tehnologic de realizare a echipamentelor este bine
controlat, valorile indicatorilor Δ şi σ vor fi mici. De asemenea, creşterea
valorilor indicatorilor Δ şi σ, determinaţi în timpul derulării procesului de
Cap. 4. Echipamente tolerante la defectări 13

fabricaţie, reprezintă un indiciu în evaluarea gradului de uzură a liniei de


fabricaţie.
Un alt indicator, independent de timp, este cuantila timpului de funcţionare t
, definită ca rădăcină a ecuaţiei:
F t    (2.12)

Din ultima relaţie se poate observa că t poate fi interpretat ca un timp de


garanţie, adică timpul în care proporţia de echipamente defectate dintr-o
anumită colectivitate nu depăşeşte valoarea prestabilită α.

2.2. Modelarea uzurii echipamentelor

În teoria fiabilităţii, noţiunea de uzură are un sens mai larg decât în limbajul
obişnuit. În fiabilitate prin uzură se înţelege orice alterare în timp a
caracteristicilor de fiabilitate, în sensul înrăutăţirii sau ameliorării acestora. La
baza acestei interpretări stă constatarea empirică conform căreia, în general,
orice echipament parcurge trei perioade în evoluţia sa:

 o perioadă a defectărilor timpurii, când caracteristicile de fiabilitate se


îmbunătăţesc în timp;
 o perioadă a duratei utile de viaţă, când performanţele echipamentului
rămân constante;
 perioadă a uzurii propriu-zise, când are loc o înrăutăţire rapidă a
caracteristicilor de fiabilitate.
Pentru a putea caracteriza uzura echipamentelor este necesar să se prezinte
definiţiile următoare [3]:

Definiţia 1. Se consideră funcţia de fiabilitate a unui echipament pentru o


misiune de durată x, iniţializată la momentul t:
14 Cap. 4. Echipamente tolerante la defectări

PT  t  x  Rt  x 
Rt , t  x    (2.13)
PT  t  Rt 

Echipamentul este caracterizat de uzură pozitivă dacă funcţia de fiabilitate


R t , t  x  este descrescătoare în intervalul t  [ 0 , ) pentru orice valoare a
lui x  0 . Uzura pozitivă implică faptul că pentru orice misiune a
echipamentului, fiabilitatea acestuia scade odată cu vârsta.

Echipamentul este caracterizat de uzură negativă dacă funcţia de fiabilitate


R t , t  x  creşte cu t, oricare ar fi x  0 , adică pentru orice misiune a
echipamentului, fiabilitatea acestuia creşte odată cu vârsta sa.

Din punct de vedere matematic, uzura se poate exprima şi prin rata de


defectare a unui echipament. Din relaţia de definire a ratei de defectare se
obţine:

Rt   Rt  x  Rt , t  x 


z t   lim  lim (2.14)
x 0 x  Rt  x 0 x

Rata de defectare a unui echipament cu uzură pozitivă este crescătoare, iar


rata de defectare a unui echipament cu uzură negativă este descrescătoare în
timp. Această dependenţă este ilustrată şi de relaţia:

 tt  x z u du
Rt , t  x   e (2.15)

din care se observă că pentru z(u) crescătoare argumentul exponenţialei


rezultă crescător în valoare absolută şi deci funcţia Rt , t  x  este
descrescătoare cu t, iar pentru rata de defectare descrescătoare rezultă
Cap. 4. Echipamente tolerante la defectări 15

argumentul descrescător pentru exponenţială (în valoare absolută) şi deci


funcţia Rt , t  x  creşte cu t.

Definiţia 2. Se numeşte echipament cu uzură medie pozitivă, echipamentul la


1 1
care funcţia  ln este crescătoare în timp, iar un echipament cu uzură
t R
1 1
medie negativă are funcţia  ln descrescătoare în timp.
t R

Această definiţie este mai puţin restrictivă decât prima, astfel încât un
echipament care este cu uzură negativă este şi cu uzură medie negativă, iar
dacă este cu uzură pozitivă este şi cu uzură medie pozitivă, reciprocele acestor
afirmaţii nu sunt adevărate întotdeauna.

Definiţia 3. Un echipament este degradabil dacă funcţia de fiabilitate asociată


unei misiuni de durată x, iniţializată la vârsta t a echipamentului, este mai
mică decât funcţia de fiabilitate în intervalul (0, t), oricare ar fi vârsta t a
acestuia şi durata misiunii x. Matematic, echipamentul degradabil poate fi
definit prin relaţia:

Rt , t  x   Rt ; t , x  0 (2.16)

Din definiţia anterioară rezultă că un echipament degradabil care a fost folosit


este inferior unui echipament nou.

Noţiunea de echipament degradabil este mai puţin restrictivă decât aceea de


echipament cu uzură pozitivă, care presupunea caracterul descrescător al
funcţiei Rt , t  x  cu vârsta t a echipamentului.

Echipamentele nedegradabile se definesc prin relaţia:


16 Cap. 4. Echipamente tolerante la defectări

Rt , t  x   Rt ; t , x  0 (2.17)

Conform acestei relaţii, echipamentele nedegradabile îşi îmbunătăţesc


performanţele de fiabilitate în timpul funcţionării, astfel încât un echipament
care a fost folosit este mai bun decât unul nou.

Definiţia 4. Un echipament este în medie degradabil dacă media timpului de


funcţionare rămas este mai mică decât media timpului de funcţionare a
echipamentului:
m(t)<m (2.18)

sau 0 Rt , t  x dx  0 R x dx (2.19)

Relaţia (2.19) reprezintă de fapt integrarea relaţiei (2.16) de definire a


echipamentelor degradabile.

Un echipament este în medie nedegradabil dacă media timpului de


funcţionare rămas este mai mare decât media de funcţionare a
echipamentului:

 
0 Rt , t  x dx  0 Rx dx (2.20)

Recapitulând cele patru definiţii, care sunt din ce în ce mai puţin restrictive,
se poate afirma că dacă un echipament este cu uzură pozitivă, atunci el este
şi cu uzură medie pozitivă, este degradabil şi degradabil în medie. De
asemenea, dacă un echipament este cu uzură negativă, atunci el este şi cu
uzură medie negativă, este nedegradabil şi nedegradabil în medie.
Cap. 4. Echipamente tolerante la defectări 17

Există însă şi echipamente care nu se încadrează în nici unul din tipurile


prezentate, şi anume echipamentele fără uzură. Lipsa uzurii se defineşte cu
relaţia: Rt , t  x   Rt ; t , x  0 (2.21)

Există o singură lege de repartiţie a timpului de funcţionare până la defectare


care verifică relaţia (2.21), anume legea de repartiţie exponenţială, pentru care
funcţia de fiabilitate este:
Rt   e   t (2.22)
Ceilalţi indicatori de fiabilitate sunt daţi de relaţiile următoare:
Probabilitatea de defectare: F t   1  e t
Densitatea de probabilitate: f t     e   t
Rata de defectare: z t   
1
Media timpului de funcţionare: mt   m  (2.23)

1
Dispersia: D  2 
2
1 1
Cuantila timpului de funcţionare: t   ln
 1 
Reprezentarea grafică a acestor indicatori este dată în figura 2.1.

Fig. 2.1. Indicatori de fiabilitate pentru un echipament fără uzură

Se constată că media timpului de funcţionare este aceeaşi, indiferent de vârsta


echipamentului, fiind egală cu inversul ratei de defectare. Astfel de
18 Cap. 4. Echipamente tolerante la defectări

echipamente, caracterizate de o distribuţie exponenţială a timpului de


funcţionare sunt numite echipamente fără memorie.
În practică, distribuţia exponenţială este folosită pentru modelarea
echipamentelor în perioada utilă de funcţionare, în care rata de defectare este
stabilă. Această perioadă este mai mare în cazul echipamentelor care nu conţin
piese în mişcare, exemplu: echipamentele electronice, la care uzura este practic
inexistentă în toată perioada utilizării lor. Lipsa uzurii nu trebuie să conducă la
ideea că procesul tehnologic de fabricaţie ar fi deosebit de bine pus la punct.
Există în acest caz o dispersie mare a timpului de funcţionare, care indică o
diversitate mare a echipamentelor individuale, caracteristică echipamentelor
electronice, la care procesele tehnologice, utilajele şi materialele folosite sunt
mai complexe. O dispersie mică ar arăta că avem un proces tehnologic foarte
bine controlat, caracteristic echipamentelor mecanice de mică complexitate.
Echipamentele fără memorie, caracterizate de legea de distribuţie
exponenţială, sunt destinate de regulă unor misiuni repetate, ele fiind
caracterizate de performanţe medii superioare, chiar dacă pe anumite intervale
de timp comportarea lor lasă de dorit.
O problemă deosebită constă în identificarea tipului de uzură pentru un
echipament. Se consideră funcţia următoare:

t S F   0F Rt  dt
t
(2.24)

unde tF este cuantila de ordinul F a timpului de funcţionare. Ordinul cuantilei


F reprezintă probabilitatea de defectare a echipamentului, având valori între 0
şi 1.

Pentru: F  0  t F  0  t S F   0
Pentru: F  1  t F    t S F   m (2.25)

Funcţia t S F  poate fi normată prin împărţire la media timpului de funcţionare


a echipamentului. Rezultă:
t S F  0 Rt  dt 1 t F
t F
TS F       Rt  dt (2.26)
t S 1   Rt  dt m 0
0
Cap. 4. Echipamente tolerante la defectări 19

Această funcţie are graficul înscris într-un pătrat de latură 1, din primul cadran.
Funcţia TS F  este:
 concavă pentru echipamente cu uzură pozitivă;
 convexă pentru echipamente cu uzură negativă;
 prima bisectoare pentru echipamente caracterizate de lipsa uzurii.
Verificarea experimentală a tipului de uzură ce caracterizează un echipament
se efectuează prin estimarea funcţiei TS F  pe baza rezultatelor obţinute în
urma încercărilor de fiabilitate sau a rezultatelor obţinute în exploatare. Funcţia
TS F  se reprezintă grafic (figura 2.2), concluziile trăgându-se pe baza
caracterului ei concav, convex sau liniar.

Fig. 2.2. Reprezentarea grafică


a funcţiei TS F 

Rezultatele experimentale, fie că sunt obţinute prin încercări de laborator, fie


că sunt obţinute în exploatare, constau din momentele de defectare ale unui
eşantion de echipamente de acelaşi tip, urmărite în funcţionare în condiţii bine
precizate, până la defectarea tuturor. Momentele de defectare
 ti , i  1,2 ,3,...,n , ordonate crescător, formează o serie variaţională. La
momentul fiecărei defectări, se poate estima probabilitatea de defectare F prin
raportul dintre numărul de ordine al defectării şi volumul eşantionului. Între
două momente de defectare consecutive, probabilitatea de defectare F
estimată rămâne constantă. Se obţine:
20 Cap. 4. Echipamente tolerante la defectări

 0 t  t1
 1
 t1  t  t 2
 n
 .

 .
  i
F t    ti  t  ti  1 (2.27)
 n
 .
 .

n  1
 tn 1  t  tn
 n
 1 t  tn

Probabilitatea de defectare estimată se mai numeşte funcţie de repartiţie


empirică a timpului de funcţionare. În continuare se poate obţine estimaţia
funcţiei de fiabilitate:
 1 t  t1

 1 1 t1  t  t 2
 n
 .

 .
  i
Rt    1  ti  t  ti  1 (2.28)
 n
 .
 .

 n1
1  tn 1  t  tn
 n
 0 t  tn
Această funcţie se poate reprezenta grafic ca în figura 2.3. Se poate estima apoi
 i
funcţia TS F  la un moment de defectare oarecare, t i , la care F  .
n
 i 1 t 
Se poate scrie: TS      0i Rt dt (2.29)
n m
Cap. 4. Echipamente tolerante la defectări 21

Estimaţia mediei timpului de funcţionare se obţine ca medie aritmetică a


duratei de funcţionare până la defectare a echipamentelor urmărite:
 1 n
m    ti (2.30)
n i 1

Fig.2.3. Funcţia de fiabilitate estimată

Pornind de la relaţiile (2.28), (2.29) şi (2.30) se poate construi, pe baza


rezultatelor experimentale, funcţia TS F  , din reprezentarea ei grafică
deducându-se caracterul uzurii echipamentului analizat. Procesul de verificare
poate fi însoţit de erori ce pot apare datorită caracterului aleator al rezultatelor
experimentale.
De exemplu, pentru un
echipament fără uzură, din
rezultatele experimentale se
poate obţine o estimaţie neliniară

a lui TS F  , care oscilează în jurul
primei bisectoare ca în figura 2.4.
Ipoteza privind caracterul fără
uzură al echipamentului
considerat este acceptată dacă 
Fig.2.4. Funcţia TS F  pentru un
numărul de intersecţii dintre
echipament fără uzură
22 Cap. 4. Echipamente tolerante la defectări

funcţia TS F  estimată şi prima bisectoare depăşeşte o anumită limită, impusă


de riscul de ordinul I, adică de probabilitatea de respingere a ipotezei când
acesta este adevărată.

2.3. Legi de repartiţie asociate mecanismelor de defectare

Exprimarea analitică a funcţiei de fiabilitate, constituie o problemă centrală în


teoria fiabilităţii. Legile de repartiţie utilizate de statistica matematică sau de
alte domenii cum ar fi statistica descriptivă, economia, demografia, nu pot fi
folosite în fiabilitate decât atunci când se cunosc foarte bine bazele fizice ale
fenomenului de defectare, astfel încât domeniul de aplicare al legii respective
să poată fi delimitat cât mai exact.
Utilizând raţionamente de ordin fizic şi în urma prelucrării unui volum foarte
mare de date experimentale, s-au elaborat unele legi de repartiţie specifice
aplicaţiilor legate de teoria fiabilităţii: legea Birnbaum-Saunders, legea valorii
extreme (Gumbel), Weibull, alfa etc. În acelaşi timp au fost elaborate
interpretări fizice intuitive pentru unele legi de repartiţie clasice: legea
normală, gama, Rayleigh etc., precizându-se care sunt domeniile în care se pot
aplica aceste legi de repartiţie.
Asocierea dintre o lege de repartiţie teoretică şi un echipament concret se face
printr-un raţionament care combină interpretarea fizică şi verificarea
experimentală, cel mai important argument fiind cel dat de confruntarea cu
rezultatele experimentale. Construcţia unei legi de repartiţie unice, specifică
unui anumit mecanism de defectare este practic imposibilă, de aceea, în mod
obişnuit se recurge la selecţia unei legi de repartiţie dintre cele uzuale, lege
care să fie adecvată mecanismului de defectare respectiv.
Criteriul fundamental în adoptarea legii de repartiţie este corespondenţa dintre
legea teoretică şi rezultatele obţinute pe cale experimentală. Procedeul de
verificare este bazat pe teoria generală a verificării ipotezelor statistice. Astfel,
se formulează ipoteza nulă Ho privind natura legii de repartiţie a timpului de
funcţionare şi ipoteza alternativă H1, care exclude valabilitatea tipului de lege
propus.
Cap. 4. Echipamente tolerante la defectări 23

Decizia între ipotezele formulate se face pe baza rezultatelor experimentale


obţinute prin urmărirea unui eşantion din echipamentele care urmează să fie
caracterizate, adică prin efectuarea unui test statistic de concordanţă.
Decizia care se ia poate fi afectată de cele două riscuri de eroare:
 riscul de ordinul I, α: probabilitatea de respingere a ipotezei nule când
aceasta este adevărată;
 riscul de ordinul II, β: probabilitatea acceptării ipotezei nule, când
aceasta este falsă.
Criteriul de decizie trebuie ales astfel încât riscurile α şi β să nu depăşească
anumite valori impuse iniţial.
Criteriul utilizat cel mai frecvent este Kolmogorov-Smirnov, care presupune
cunoaşterea momentelor de defectare ale tuturor echipamentelor din eşantion
supus analizei. Cu ajutorul acestor momente,  ti , i  1,2 ,3,...,n  ordonate

crescător, se poate estima funcţia de repartiţie F t  . Dacă F(t) este funcţia de
repartiţie teoretică, propusă pentru caracterizarea fiabilităţii echipamentului
respectiv, teorema Kolmogorov-Smirnov arată că ecartul maxim

sup F t   F t  , dintre funcţia de repartiţie teoretică şi estimaţia ei este o
t
variabilă aleatoare a cărei lege de repartiţie depinde numai de volumul
eşantionului, nu şi de natura legii care se verifică. Criteriul de decizie pentru
acceptarea sau respingerea ipotezei formulate este dat de cuantila de ordinul
1   a distribuţiei Kolmogorov-Smirnov, care este tabelată. Ipoteza este
acceptată dacă ecartul maxim dintre funcţia de repartiţie estimată şi cea
teoretică nu depăşeşte valoarea cuantilei. Testul Kolmogorov-Smirnov are
dezavantajul că presupune o încercare de fiabilitate prelungită până la
defectarea tuturor elementelor eşantionului. Testul Kolmogorov-Smirnov se
poate aplica şi la încercări trunchiate şi cenzurate. Prin micşorarea cantităţii de
informaţie, rezultată din trunchiere şi cenzurare, puterea testului de
concordanţă scade, astfel încât de multe ori testul lasă să se accepte mai multe
ipoteze privind caracterul repartiţiei timpului de funcţionare (ex. Weibull,
normală şi exponenţială).
Pe lângă faptul că au o putere redusă, testele de concordanţă bazate pe încercări
trunchiate mai pot fi afectate de o eroare. Se face ipoteza că legea adoptată şi
24 Cap. 4. Echipamente tolerante la defectări

acceptată de test este valabilă şi dincolo de intervalul de timp în care s-a


efectuat testul de concordanţă. Se poate întâmpla însă ca, în timp, legea de
distribuţie să-şi schimbe caracterul într-un mod care nu poate fi prevăzut pe
baza încercărilor trunchiate efectuate.
O altă modalitate de verificare a concordanţei dintre o lege teoretică şi datele
experimentale este dată de statistica informaţională. Astfel, dacă se consideră
două legi de repartiţie discrete T şi S, care asociază unei aceleaşi variabile
aleatoare sistemele de probabilităţi p1 , p2 , p3 ,..., pn şi respectiv q1 , q2 , q3 , ... , qn ,
astfel încât:
n n
 pi   q i 1 (2.31)
i 1 j 1

Se defineşte corelaţia informaţională între cele două distribuţii S şi T prin:


n
C S ,T   pi  q i (2.32)
i 1

Corelaţia dintre distribuţie şi ea însăşi se numeşte energie informaţională:


n
C S , S  E S   pi
2

i 1
n
(2.33)
CT ,T  ET   qi
2

i 1

Coeficientul de corelaţie informaţională între repartiţiile S şi T rezultă prin


normarea relaţiei (2.32):
C S ,T
E S ,T  (2.34)
E S  ET

Din ultima relaţie rezultă că valoarea coeficientului de corelaţie informaţională


între două legi identice de repartiţie este maximă şi egală cu unitatea.
Să presupunem că S este o lege de repartiţie empirică, estimată pe baza unui
eşantion de date experimentale, iar T este legea de repartiţie teoretică ce
caracterizează echipamentul analizat. Cu cât volumul de date experimentale
creşte, cu atât repartiţia empirică se apropie de cea teoretică, iar coeficientul de
Cap. 4. Echipamente tolerante la defectări 25

corelaţie informaţională tinde către unitate. Pentru un anumit volum de date


experimentale, coeficientul va fi cu atât mai aproape de unitate cu cât legea de
repartiţie teoretică adoptată este mai aproape de realitate.
O alternativă faţă de alegerea unei legi de repartiţie anumite dintr-o mulţime
de posibilităţi este construcţia unei legi de repartiţie generale, valabilă pentru
toate echipamentele şi care se particularizează prin precizarea valorilor
numerice ale parametrilor care intervin în expresia ei analitică. O astfel de lege
de repartiţie atât de flexibilă, încât să includă toate legile particulare posibile –
dacă ar exista – ar avea un număr foarte mare de parametri astfel încât
dificultatea ar fi translatată de la problema stabilirii naturii legii, la evaluarea
parametrilor săi. Soluţia constă în utilizarea legii de repartiţie exponenţială,
care poate aproxima orice lege de repartiţie printr-o combinaţie sau printr-o
succesiune de legi de repartiţie exponenţiale.
Această aproximare prin combinaţii de exponenţiale se mai numeşte şi
aproximare continuă. Modelele fundamentale ale aproximării continue sunt de
tip serie, paralel sau triunghi.
În primul caz, aproximarea de tip serie se obţine printr-o combinaţie liniară de
repartiţii exponenţiale. Astfel, o repartiţie oarecare f t  poate fi scrisă:

n n
f t     i    e   i t ; cu   i  1 (2.35)
i 1 i 1

Exemplu: Se consideră un echipament (o diodă semiconductoare) cu două


moduri de defectare incompatibile: scurtcircuit şi întrerupere. Se presupune că
fiecărui mod de defectare i se asociază o repartiţie exponenţială de parametru
 i , iar  i este probabilitatea ca defectarea să se producă prin modul particular
i, rezultând o repartiţie a timpului de funcţionare dată de relaţia (2.35).
Conform modelului paralel, timpul de funcţionare până la defectare este o
sumă a unor durate aleatoare repartizate după legi exponenţiale de parametri
diferiţi. Echipamentul trece deci prin stări intermediare, de la starea iniţială de
bună funcţionare până la starea de defectare. Aceste stări intermediare pot
reprezenta uzura pozitivă a echipamentului.
26 Cap. 4. Echipamente tolerante la defectări

Al treilea model elementar al aproximării continue este modelul triunghi.


Conform acestui model, echipamentul poate trece prin mai multe stări
intermediare, ca în cazul modelului paralel, dar nu trebuie neapărat să le
parcurgă pe toate pentru a atinge starea de defectare, aceasta fiind accesibilă
din orice stare intermediară.
Reprezentând prin nodurile unui graf stările echipamentului şi prin arce
posibilităţile de tranziţie, se obţine modelul din figura 2.5, în care starea iniţială
este notată cu “0”, iar starea de defectare este notată cu “k”. Starea de defectare
“k” este accesibilă din toate celelalte stări, cu probabilităţile de tranziţie
respective  k  t ,  k 1 t , ... , k 1 t . Probabilităţile de tranziţie între stările
de bună funcţionare sunt:  1 t ,  2 t , ... , k 1 t . Analiza cantitativă a
acestui model se poate efectua prin metoda lanţurilor Markov.
Modelele elementare de tip serie, paralel şi triunghi pot fi combinate între ele,
rezultând o multitudine de legi de repartiţie exprimate sub forma unei
combinaţii de exponenţiale şi de repartiţii gama de diferite ordine.

Figura 2.5. Modelul triunghi al aproximării continui

Deşi nu înlătură dificultăţile asociate testelor de concordanţă, modelul


aproximării continue a repartiţiilor, este deosebit de elegant şi util prin aceea
că oferă o modalitate generală şi comodă de exprimare a legilor de repartiţie,
care poate fi utilizată cu succes în analiza echipamentelor cu uzură prin metoda
lanţurilor Markov.
Cap. 4. Echipamente tolerante la defectări 27

2.4. Reînnoirea echipamentelor

2.4.1. Procese de reînnoire

Analiza fiabilităţii echipamentelor trebuie să ţină seama şi de faptul că asupra


acestora se exercită intervenţii exterioare care se opun degradării prin
recondiţionarea totală sau parţială a echipamentului. Aceste intervenţii sunt
posibile în cazul echipamentelor reparabile, acestea putând fi aduse, prin
intervenţii exterioare, în starea de funcţionare “ca noi” sau într-o stare de bună
funcţionare, caracterizată însă de o anumită uzură, pornind din starea de
“defectare”. Sunt însă şi echipamente a căror evoluţie se termină odată cu
prima defectare, cum este cazul componentelor şi echipamentelor nereparabile.
În cazul echipamentelor cu posibilităţi de reînnoire, eficienţa lor în exploatare
este determinată atât de caracteristicile lor intrinseci, cât şi de cele ale
intervenţiilor exterioare. În acest sens, se lărgeşte sensul noţiunii de fiabilitate
ca fiind capacitatea echipamentului de a-şi îndeplini misiunea. Este esenţial
faptul că la asigurarea fiabilităţii unui echipament reparabil concură
capacitatea echipamentului de a-şi menţine performanţele în timp (fiabilitatea
în sens restrâns) şi capacitatea de restabilire a acestor performanţe. Aceasta
din urmă, numită mentenabilitate, ţine atât de echipament, în măsura în care
arhitectura acestuia uşurează activităţile de diagnoză tehnică şi depanare, cât şi
de modul de organizare a întreţinerii echipamentului: aprovizionarea cu piese
de schimb, volumul şi calificarea personalului de întreţinere etc. Mentenanţa
poate fi definită ca ansamblul tuturor acţiunilor efectuate în scopul menţinerii
sau restabilirii unui echipament în stare normală de funcţionare. Mentenanţa
poate fi preventivă sau corectivă. Mentenanţa preventivă reprezintă
intervenţiile sistematice care au loc de regulă după un plan, în vederea
asigurării corecte a echipamentului. Mentenanţa corectivă reprezintă
intervenţiile, necesare în urma unor defectări accidentale, care au drept scop
restabilirea capacităţii de funcţionare a echipamentului la parametri nominali.
În scopul analizei proceselor de reînnoire se admite faptul că orice intervenţie
exterioară asupra unui echipament în vederea restabilirii performanţelor
acestuia are loc la momentul unei defectări a echipamentului şi este efectuată
într-un timp neglijabil.
28 Cap. 4. Echipamente tolerante la defectări

O asemenea intervenţie, capabilă să pună echipamentul în stare de funcţionare,


va fi numită reînnoire, indiferent de amploarea influenţei sale asupra
echipamentului. Evoluţia unui echipament va fi reprezentată deci de
succesiunea unor momente de reînnoire t1 ,t2 , ... ,tn , şi a intervalelor dintre
acestea: x1 , x2 , ... , xn ... (figura 2.6).

Fig. 2.6. Evoluţia unui echipament cu reînnoire

Dacă se consideră un interval de timp oarecare (0, t), numărul de reînnoiri N t


, efectuate în acest interval, este un proces aleator discret, numit proces de
reînnoire. Dacă acest proces este complet cunoscut se pot face previziuni
asupra comportării echipamentului cu reînnoire, utilizate în elaborarea
programului de mentenanţă.
Cunoaşterea procesului aleator de reînnoire presupune calculul funcţiei de
repartiţie P N t  r ; t , r , sau cel puţin al unor valori medii ale procesului
aleator N t . Pentru aceasta se consideră anumite ipoteze asupra reînnoirilor,
legate atât de caracteristicile operaţiei de intervenţie cât şi de cele ale
echipamentului.
Prima ipoteză priveşte caracterul independent al variabilelor aleatoare
x1 , x2 , ... , xn ... care reprezintă duratele de funcţionare ale echipamentului.

Se presupune deci că modul de comportare a echipamentului între două


reînnoiri succesive nu este corelat cu comportarea sa în intervalul dintre alte
două reînnoiri. În cazul cel mai general, prin operaţia de reînnoire
echipamentul este complet transformat astfel încât, după fiecare reînnoire
avem de-a face cu un echipament nou din punct de vedere al fiabilităţii. În
aceste condiţii, echipamentul va fi caracterizat în fiecare interval de
funcţionare x1 , x2 , ... , xn ... de indicatorii generali de fiabilitate.

În realitate, reînnoirea nu schimbă cu totul caracteristicile echipamentului prin


trecerea sa din starea de defectare în starea de bună funcţionare. Influenţa
reînnoirii asupra echipamentului este orientată fie în sensul îmbunătăţirii, fi în
Cap. 4. Echipamente tolerante la defectări 29

sensul înrăutăţirii fiabilităţii acestuia, în funcţie de performanţele activităţii de


intervenţie asupra echipamentului. Peste această influenţă se suprapune efectul
uzurii acumulate în timp, uzură care poate fi pozitivă sau negativă. Din
combinaţia dintre proprietăţile intrinseci ale echipamentului cu cele ale
operaţiilor de intervenţie rezultă modul de variaţie al funcţiei de fiabilitate.
Notăm cu Ri  x  funcţia de fiabilitate a echipamentului în intervalul dintre
reînnoirea i  1 şi reînnoirea i. Ţinând seama de ordonarea funcţiilor Ri  x  , se
poate face o clasificare a reînnoirilor.
Se numesc reînnoiri propriu-zise acele reînnoiri care aduc echipamentul mereu
în aceeaşi stare, eliminându-se uzura acumulată de la reînnoirea precedentă. În
acest caz este valabilă relaţia:
R1 x   R2 x   R3 x   ...... Rn  x   R x  (2.36)

iar procesul de reînnoire se numeşte simplu.


Atunci când în urma efectuării unei reînnoiri echipamentul este adus într-o
stare diferită de starea sa la momentul t  0 , relaţia (2.36) se poate scrie:
R2 x   R3 x   ...... Rx 
(2.37)
R1x   Rx 
În acest caz procesul de reînnoire se numeşte general.
În procesele simple, toţi indicatorii de fiabilitate sunt identici în toate
intervalele dintre reînnoiri succesive. În cazul proceselor generale există două
tipuri de indicatori: cei definiţi pe primul interval de funcţionare (până la prima
defectare – MTTF) şi cei definiţi pentru intervale dintre două defectări
succesive (MTBF).
Procesele de reînnoire propriu-zise sunt caracteristice echipamentelor formate
din elemente fără uzură, la care reînnoirea constă din înlocuirea sau repararea
elementelor defecte.
Se definesc reînnoirile pozitive prin:
R1  x   R2  x   R3  x   ......  Rn  x   ...... (2.38)
30 Cap. 4. Echipamente tolerante la defectări

În cazul unui echipament fără uzură sau cu uzură negativă reînnoirile pozitive
sunt datorate unei calităţi necorespunzătoare a operaţiilor de intervenţie, în
timp ce, în cazul echipamentelor cu uzură pozitivă, reînnoirile pot fi pozitive,
chiar dacă ele contribuie la ameliorarea fiabilităţii echipamentului, acţiunea lor
fiind contracarată de efectul uzurii acestuia.
Reînnoirile negative se definesc prin relaţia următoare:
R1 x   R2 x   R3 x   ......  Rn x   ...... (2.39)

Pentru echipamentele cu uzură pozitivă, reînnoirile negative se datorează unei


calităţi deosebite ale operaţiilor de întreţinere. Reînnoirile pot fi negative chiar
dacă ele contribuie la înrăutăţirea caracteristicilor de fiabilitate ale
echipamentului, acest lucru putându-se întâmpla datorită efectului de
ameliorare al uzurii negative.
Încadrarea reînnoirilor într-una dintre cele trei categorii este oarecum
restrictivă, întrucât nu toate reînnoirile efectuate asupra unui echipament pot fi
de acelaşi tip, chiar dacă sunt efectuate de către aceeaşi echipă de mentenanţă.
Pentru a lua în considerare posibilităţile ca printre reînnoiri pozitive să se
includă şi unele reînnoiri negative sau invers, se consideră reînnoirile
stohastic pozitive, respectiv stohastic negative, definite prin relaţiile:
st st st st
R1  x   R2  x   ......  Rn  x   ......
(2.40)
st st st st
R1  x   R2  x   ......  Rn  x   ......

Considerăm un echipament fără uzură, asupra căruia se aplică o reînnoire


propriu-zisă, procesul de reînnoire fiind simplu [3]. Ne interesează
caracteristicile procesului aleator N t , definit ca numărul de reînnoiri în
intervalul 0,t  . Pentru aceasta se consideră un interval mic t ,t  t  şi se
evaluează probabilitatea ca până la momentul t+Δt să se producă r reînnoiri:

Pr t   t   P  N t   t  r  (2.41)

În intervalul 0,t  t  , cele r reînnoiri se pot produce astfel:


Cap. 4. Echipamente tolerante la defectări 31

- r reînnoiri în 0 , t  şi nici o reînnoire în t , t   t  ;


- r - 1 reînnoiri în 0, t  şi o reînnoire în t ,t   t  ;
- r - 2 reînnoiri în 0 , t  şi 2 reînnoiri în t ,t   t  ;
- şi aşa mai departe.

Probabilitatea defectării unui echipament fără uzură într-un interval de timp


t ,t  t  este dată de t   t  , unde  t  este un infinit mic superior lui
t , iar probabilităţile asociate defectărilor repetate în acest interval sunt
infiniţi mici superiori lui t . Se poate scrie următoarea relaţie de recurenţă:

Pr t  t   Pr 1 t     t   t   Pr t   1    t   t  (2.42)

Prin diferenţierea relaţiei (2.42) se obţine:


dPr t 
   Pr t     Pr 1 t  (2.43)
dt

Pentru a rezolva ecuaţia (2.43) se adoptă forma următoare pentru


probabilitatea Pr t  :

Pr t   vr t   e   t (2.44)

Înlocuind relaţia (2.44) în relaţia (2.43) se obţine:


dvr t 
   vr 1 t  (2.45)
dt

Rezolvând ecuaţia (2.45) în condiţiile iniţiale:


32 Cap. 4. Echipamente tolerante la defectări

v0 t   1
vr 0  0 se obţine: vr t   t r / r! (2.46)
r  2,3,...
astfel încât procesul aleator este dat de:

P t  
t  r  t
e (2.47)
r
r!

Relaţia (2.47) reprezintă un proces aleator de tip Poisson, cel mai simplu
proces de reînnoire. Procesul de reînnoire poate fi caracterizat în mod sintetic
prin media şi dispersia numărului de reînnoiri în intervalul 0,t  . Media
numărului de reînnoiri în intervalul 0,t  se numeşte funcţie de reînnoire şi
are expresia următoare:

H t   M  N t   t (2.48)
Relaţia (2.48) arată faptul că numărul mediu de reînnoiri propriu-zise ale unui
echipament fără uzură este proporţional cu mărimea intervalului de timp
considerat.

Prin derivarea funcţiei de reînnoire se obţine densitatea de reînnoire ht  ,


interpretată ca probabilitatea producerii unei reînnoiri în jurul momentului t,
indiferent de ordinul acesteia:
 dH t 
ht    (2.49)
dt
Rezultă în acest caz o valoarea constantă şi egală cu rata de defectare a
echipamentului.
Considerând acum un echipament cu uzură, negativă sau pozitivă, asupra
căruia se efectuează reînnoiri care nu modifică gradul de uzură al
echipamentului, se pot obţine funcţia şi densitatea de reînnoire prin
generalizarea relaţiilor (2.48) şi (2.49):
Cap. 4. Echipamente tolerante la defectări 33

t
H t    z t  , ht   z t  (2.50)
0

Se observă că funcţia de reînnoire este egală cu logaritmul inversului funcţiei


de fiabilitate. Determinarea tipului reînnoirilor se poate face pe baza unei
metode care analizează primele trei durate de funcţionare x1 , x2 , x3 ,
înregistrate la un eşantion de n elemente. Pentru a alege între reînnoirile
propriu-zise şi cele pozitive, se formulează ipotezele nulă (H0) şi alternativă
(H1):
H 0 : R1 x   R2 x   R3 x 
(2.51)
H1 : R1 x   R2 x   R3 x 
Se notează cu xi1 , xi 2 , xi3 , duratele de funcţionare până la a treia reînnoire,
corespunzătoare echipamentului i din eşantion i  1, 2, 3, ..., n  . Se defineşte
variabila aleatoare zi , pentru fiecare element al eşantionului:

1 , pentru xi1  xi 2  xi3


zi  
0 , în caz contrar (2.52)
i  1,2,3,...,n 
Valorile zi  1 reprezintă argumentele împotriva caracterului pozitiv al
reînnoirilor, astfel încât dacă în eşantion există numeroase valori zi egale cu
unitatea, se acceptă ipoteza H 0 şi se infirmă ipoteza H1 .
n
În vederea adoptării unei decizii se consideră variabila S   zi şi se acceptă
i 1
ipoteza H1 dacă S  k , în caz contrar acceptându-se ipoteza H 0 . Valoarea
limitei de acceptare k se determină pe baza riscului  de respingere a ipotezei
H 0 atunci când ea este adevărată.

Se presupune că în urma verificării s-a stabilit că reînnoirile efectuate sunt


reînnoiri propriu-zise, adică prin reînnoire echipamentul este adus mereu în
aceeaşi stare, starea de la momentul t  0 . Se obţine astfel un proces simplu de
reînnoire descris de relaţia:
34 Cap. 4. Echipamente tolerante la defectări

P N t  r   PTr  t  (2.53)

relaţie ilustrată în figura 2.7:

Fig. 2.7. Proces de reînnoire simplu

Numărul de reînnoiri produse în intervalul 0,t  este mai mare decât r dacă şi
numai dacă durata scursă până la reînnoirea cu numărul de ordine r este mai
mică decât t. Fie K r t  funcţia de repartiţie a variabilei aleatoare Tr şi k r t 
densitatea de probabilitate. Se observă distribuţia discretă la un moment dat a
procesului aleator N t , care poate fi exprimată cu ajutorul funcţiei de repartiţie
continuă a variabilei Tr .

PNt  r   PNt  r   PNt  r  1  K r t   K r 1t 


(2.54)
r  1,2, ..., K 0 t   1

Procesul de reînnoire este complet caracterizat dacă funcţia de repartiţie K r t 


poate fi exprimată cunoscând indicatorii de fiabilitate ai echipamentului.
Întrucât toate intervalele de funcţionare între reînnoiri consecutive sunt identic
distribuite, cu densitatea de probabilitate f  x  , se poate scrie conform teoremei
privind distribuţia sumei de variabile aleatoare independente:
Tr  x1  x2  ...  xr
k r t   f t   f t   ...  f t  (2.55)
  
r

unde  reprezintă produsul de convoluţie.


Pornind de la relaţia (2.55) se poate calcula densitatea de probabilitate a duratei
scurse până la reînnoirea r, prin integrarea căreia se obţine funcţia de repartiţie
utilizată în relaţia (2.54).
Cap. 4. Echipamente tolerante la defectări 35

Folosind transformata Laplace:



g* s   Lg t    g t   e st dt (2.56)
0

se obţine: 
k*r s   f * s  r (2.57)

şi K *r s  
1 *
s

f s 
r
 (2.58)

Cu aceasta procesul simplu de reînnoire este complet caracterizat. Dacă


procesul de reînnoire este general, atunci trebuie făcută distincţie între
densitatea de probabilitate corespunzătoare primului interval f1  x  şi
densitatea f(x) corespunzătoare tuturor celorlalte intervale. În acest caz funcţia
de repartiţie trebuie calculată cu ajutorul relaţiilor:


k*r s   f1* s   f * s 
r 1
 (2.59)

1

K *r s    f1* s   f * s 
s
r 1
 (2.60)

Un proces general de reînnoire poate fi interpretat ca un proces simplu care


începe să fie observat de la un moment oarecare al evoluţiei sale (figura 2.8).
Indiferent de tipul procesului, relaţia fundamentală (2.54) rămâne valabilă,
distincţia între procesul simplu şi cel general făcându-se prin modul de calcul
al funcţiei de repartiţie K r t  .

Fig. 2.8. Reprezentarea unui proces de reînnoire

Utilizarea practică a relaţiei (2.54) nu este însă prea comodă, de aceea se


preferă caracterizarea procesului de reînnoire cu ajutorul funcţiei de reînnoire
36 Cap. 4. Echipamente tolerante la defectări

H(t), care reprezintă numărul mediu de reînnoiri produse în intervalul 0,t  .


Pornind de la definiţia mediei se obţine:
 
H t    rP  N t  r    r K r t   K r 1 t  
r 1 r 1
 K1 t   K 2 t  
 2  K 2 t   2  K 3 t  
(2.61)
 3  K 3 t   3  K 4 t  
....................................................

 K1 t   K 2 t   ......  K r t 
r 1

Prin derivare se obţine densitatea de reînnoire:

dH t  
ht     k r t  (2.62)
dt r 1

Această relaţie reprezintă probabilitatea producerii unei reînnoiri în jurul unui


moment dat, indiferent de ordinul acesteia. Aplicând transformata Laplace
relaţiilor (2.57) – (2.62) se obţine densitatea şi funcţia de reînnoire pentru
procesul de reînnoire simplu:


 r  1 f f *ss
*
h* s    f * s  (2.63)
r 1

H s  
* f
*
s  (2.64)
s  1  f ( s )
*
 

În cazul unui proces general de reînnoire relaţiile (2.63) şi (2.64) devin:

*  r 1 f1 s 
 *
h s   
* * 
f1 s   f s   (2.65)
  
r 1 1 f
*
s 
Cap. 4. Echipamente tolerante la defectări 37

f1 s 
*
H
*
s   (2.66)
s  1  f s 
*
 

Se analizează în continuare cazul unui proces general. Trecând în domeniul


timp se obţine pentru densitatea de reînnoire:
t
ht   f1 t   ht   f t   f1 t    h   f t   d (2.67)
0

Ecuaţia (2.67) se numeşte ecuaţia reînnoirii.

Fig. 2.9. Explicativă la ecuaţia reînnoirii

În jurul momentului t se poate produce prima reînnoire, probabilitatea acestui


eveniment fiind f1 t  . Fie acum o reînnoire de ordin oarecare produsă în jurul
momentului t şi fie  momentul reînnoirii precedente (figura 2.9). Produsul
h   f t    reprezintă probabilitatea ca în jurul momentului  să fi avut loc o
reînnoire oarecare, iar proxima reînnoire să se producă în jurul momentului t.
Însumând aceste probabilităţi pentru toate valorile   0 ,t  şi adăugând pe
f1 t  se obţine probabilitatea unei reînnoiri în jurul momentului t, indiferent de
ordinul acesteia, adică se obţine densitatea de reînnoire.
Exemplu de mod de calcul al densităţii şi funcţiei de reînnoire [3]:
Se consideră un echipament format dintr-un element de bază şi o rezervă pasivă
care preia funcţionarea în caz de defectare a elementului de bază. Se presupune
că elementele echipamentului sunt fără uzură. Rezultă că durata de funcţionare
până la defectare a echipamentului se obţine însumând duratele de funcţionare
ale celor două elemente.
Repartiţia timpului de funcţionare va fi convoluţia a două repartiţii
exponenţiale identice:
38 Cap. 4. Echipamente tolerante la defectări

  t   t
f t     e  e


2 (2.68)
f
*
s  
s   2
Trecând în domeniul timp, rezultă repartiţia timpului de funcţionare a
echipamentului de tip gama, cu parametrii   2 şi    :

  t
f t       t   e (2.69)

Media timpului de funcţionare este egală cu dublul mediei timpului de


2
funcţionare a unui element, adică va fi . Dacă echipamentul este urmărit de

la punerea în funcţiune, procesul de reînnoire este simplu, iar funcţia şi
densitatea de reînnoire se obţin din:

h
*
s    s
f

*

2
(2.70)
1  f s  s  s  2   
*

2

H
*
s   (2.71)
s  s  2   
2

Aplicând transformata inversă Laplace, se obţine :


   2   t 
ht    1  e  (2.72)
2  

 t  2   t 
  1  e
1
H t    (2.73)
2 4  

Se observă că densitatea de reînnoire tinde asimptotic către o valoare constantă,


care este inversul mediei timpului de funcţionare, iar funcţia de reînnoire are
ca asimptotă o dreaptă cu panta egală cu inversul mediei timpului de
funcţionare. Aceasta arată că, după trecerea unui timp suficient de îndelungat,
probabilitatea producerii unei reînnoiri în jurul unui moment dat este constantă
Cap. 4. Echipamente tolerante la defectări 39

iar numărul mediu de reînnoiri într-un interval de timp este proporţional cu


lungimea acestuia, aspecte reflectate în figura 2.10.

Fig. 2.10. Evoluţia densităţii şi a funcţiei de reînnoire

2.4.2. Strategii de reînnoire

O metodă de creştere a eficienţei echipamentelor în exploatare este planificarea


unor revizii care să asigure reînnoirea echipamentelor înainte de defectarea
acestora. Momentele efectuării acestor revizii, numite şi reînnoiri profilactice
sau preventive, constituie o strategie de reînnoire. Ca şi reînnoirile propriu-zise
(efectuate în cazul defectărilor accidentale), reînnoirile preventive elimină
complet uzura echipamentului, aducându-l în starea iniţială.

Dacă reînnoirile analizate până acum erau evenimente aleatoare, generate de


defectările echipamentului, reînnoirile preventive pot fi evenimente
aleatoare sau deterministe, după modelul în care sunt concepute strategiile
de reînnoire. Astfel, peste procesul aleator al reînnoirilor propriu-zise se
suprapune strategia aleatoare sau deterministă a reînnoirilor preventive.
Strategiile de reînnoire pot fi clasificate în două categorii [3]:

 periodice;
 neperiodice.
Strategiile neperiodice pot fi elaborate ţinând seama de vârsta echipamentului,
de uzura acestuia sau de alte mărimi ce evoluează aleator. Ele sunt deci strategii
ce au un caracter aleator.
40 Cap. 4. Echipamente tolerante la defectări

Strategiile de reînnoire periodice sunt caracterizate de o durată constantă între


două reînnoiri preventive consecutive. Această durată fiind cunoscută, rezultă
că aceste strategii au un caracter determinist.
Proiectarea strategiilor de reînnoire se poate face pe baza unor criterii diferite.
Indiferent de criteriul adoptat în elaborarea strategiei, este important să se
evalueze pentru fiecare strategie, costul mediu de întreţinere a echipamentului
în unitatea de timp. În acest scop se consideră costul unei reînnoiri propriu-zise
egal cu unitatea şi se exprimă costurile reînnoirilor preventive cu fracţiuni din
costul reînnoirii propriu-zise.
Trebuie precizat faptul că abordarea strategiilor prin prisma costului mediu nu
implică neapărat o viziune pur economică, deoarece costurile individuale
reprezintă în general expresii numerice ale dificultăţii, de orice natură ar fi,
întâmpinate în efectuarea unei reînnoiri.
Cea mai simplă strategie de reînnoire periodică constă în reînnoirea
echipamentului fie la defectarea sa, fie la momentele de timp egal distanţate
 kT ,k  1,2, .... Această strategie este cunoscută în literatură sub numele de
BRP (Block Replacement Policy).
Un prim criteriu de proiectare a acestei strategii, respectiv de calcul al
perioadei T, constă în impunerea unui anumit nivel minim al funcţiei de
fiabilitate în intervalul dintre două reînnoiri succesive:
RT   R0 (2.74)
Costul mediu de întreţinere a echipamentului într-o perioadă de timp T este
format din costul unei reînnoiri preventive b, şi costul mediu al reînnoirilor
efectuate la defectarea echipamentului, numeric egal cu numărul mediu al
acestor reînnoiri.
Dacă se neglijează duratele de reînnoire, numărul mediu al reînnoirilor
neprevăzute dintr-o perioadă este dat de funcţia de reînnoire H(T), astfel încât
costul mediu al întreţinerii echipamentului în unitatea de timp prin strategia
BRP este dat de relaţia următoare:
1  H T   b
CBRP  (2.75)
T
Cap. 4. Echipamente tolerante la defectări 41

Costul dat de relaţia (2.75) trebuie comparat cu costul mediu de întreţinere a


echipamentului în unitatea de timp în absenţa reînnoirilor preventive. Situaţia
în care nu se execută reînnoiri preventive este numită strategie FRP (Failure
Replacement Policy). În acest caz o reînnoire se execută în medie la un interval
de timp egal cu media timpului de funcţionare m, astfel încât costul mediu în
unitatea de timp va fi:
1
C FRP  (2.76)
m
Expresia (2.76) se obţine din (2.75) pentru o perioadă T tinzând spre infinit.
Exemplu: Se consideră un echipament având funcţia de fiabilitate următoare
[3]:
  t  2 t
Rt   2  e e
(2.77)
4 1
  10 ore
Un astfel de echipament este cu redundanţă activă, care se defectează atunci
când se defectează ambele elemente care îl compun. Strategia de reînnoire
periodică trebuie calculată din condiţia ca funcţia de fiabilitate în intervalul
dintre două reînnoiri preventive consecutive să nu scadă sub nivelul impus,
R0  0,99 . Din relaţiile (2.74) şi (2.77) se obţine:

e  2 T  2  e   T  0 ,99  0
1 1
 T ln  1053,6 ore (2.78)
 0 ,9

Pentru a calcula costul mediu al întreţinerii echipamentului în unitatea de timp


se evaluează funcţia de reînnoire a echipamentului pornind de la expresia
funcţiei de fiabilitate (2.77). Se obţine succesiv:
42 Cap. 4. Echipamente tolerante la defectări

dRt    t  2  t 
f t     2 e  2 e 
dt

2 2 2
2 
f s  
*
  
s   s  2   s     s  2    

f s 
* 2
2 
h s  
*
 
1  f s  s   s  3   
*

2   3 t  
ht    1  e  
3   
t 2    t 2  3 t 2
 H t    ht dt   e  (2.79)
0 3 9 9

Dacă se adoptă un cost b al reînnoirii preventive periodice egal cu 20% din


costul unei reînnoiri propriu-zise (b=0.2), folosind relaţia (2.75) se obţine
costul mediu în unitatea de timp al strategiei BRP, cu perioada T dată de
condiţia (2.78):
2    T 2  3 T 2
 e   0,2
3 9 9 4 1
C BRP   3,08  10 ore (2.80)
T
În absenţa reînnoirilor preventive, costul mediu de întreţinere a echipamentului
în unitatea de timp poate fi calculat utilizând relaţia (2.76):
 3
m   Rt dt 
0 2
(2.81)
2 4 1
C FRP   0,66  10 ore
3
Analizând rezultatele obţinute în relaţiile (2.80) şi (2.81) rezultă că întreţinerea
echipamentului prin strategia BRP este mai costisitoare dar are avantajul
asigurării unei fiabilităţi mai ridicate. Dacă analiza se limitează la un punct de
vedere pur economic, atunci este clar că în perioada staţionară a procesului de
reînnoire, adoptarea unei strategii de reînnoire de tip BRP nu poate prezenta
Cap. 4. Echipamente tolerante la defectări 43

avantaje. În cazul unui proces de reînnoire staţionarizat avem H T  


T
, astfel
m
încât:
1  H T   b 1 b 1
C BRP      C FRP (2.82)
T m T m
Din ultima relaţie rezultă că strategia de reînnoire periodică poate prezenta
avantaje economice numai în perioada tranzitorie a procesului de reînnoire,
respectiv în perioada incipientă a întreţinerii echipamentului în exploatare.

În proiectarea strategiilor de reînnoire se urmăreşte minimizarea costului


mediu de întreţinere a echipamentului în unitatea de timp, astfel încât punând
condiţia de minim expresiei (2.75) se obţine:

T  h T   H  T   b
* * *
(2.83)
   
*
O condiţie suficientă de existenţă a soluţiei T pentru ecuaţia (2.83) este
caracterul crescător al densităţii de reînnoire h(t), sau, cu alte cuvinte caracterul
*
pozitiv al uzurii echipamentului. Înlocuind valoarea T , în relaţia (2.74), se
obţine costul mediu minim al întreţinerii echipamentului în unitatea de timp
atunci când se aplică strategia BRP.

C BRP  h T 
* *
(2.84)
 

unde C BRP este o funcţie crescătoare de b, prin intermediul lui T * .


*

Pentru echipamentul cu funcţia de fiabilitate dată de relaţia (2.77) perioada


optimă se obţine introducând expresia lui H(T) dată de relaţia (2.79) în ecuaţia
(2.83):
*
 9  y * * *
1   b   e  y  1 ; y  3    T (2.85)
 2 
Ultima ecuaţie fiind transcendentă, se rezolvă grafic. Condiţia de existenţă a
2
perioadei optime de reînnoire este b  . Cum s-a presupus b=0.2 această
9
44 Cap. 4. Echipamente tolerante la defectări

condiţie este îndeplinită. Valoarea minimă a costului strategiei BRP se obţine


introducând soluţia ecuaţiei (2.85) în expresia (2.84) şi ţinând seama de
relaţiile (2.79):

* 2   3 T
* 
C BRP   1  e  (2.86)
3  
Aşa cum se observă din exemplul anterior, elaborarea strategiei periodice
optime din punct de vedere al costului mediu în unitatea de timp nu este
dificilă, dacă este posibil calculul funcţiei şi densităţii de reînnoire. Acest
calcul este uneori dificil datorită imposibilităţii obţinerii analitice a
transformatei Laplace pentru anumite legi de repartiţie a tipului de funcţionare
(ex. legea Weibull).
Strategia periodică descrisă (BRP) are inconvenientul planificării inflexibile,
astfel încât este posibil ca, la scurt timp după efectuarea unei reînnoiri propriu-
zise a echipamentului, să urmeze o reînnoire preventivă planificată. Pentru
evitarea unor asemenea situaţii, s-a recurs la modificarea strategiei periodice.
Reînnoirile preventive se execută la momentele de timp k  T , k  1, 2, ... .
După orice defectare apărută în intervalele k  T  TD , k  T  , k  1,2, ...  ,
echipamentul nu este reînnoit, aşteptându-se momentul proximei reînnoiri
preventive. Defectările apărute în intervalele
k  1  T , k  T  TD , k  1, 2, ...  se remediază în mod obişnuit, rezultând
reînnoiri propriu-zise. Strategia de reînnoire se numeşte DRP ( Delayed
Replacement Policy).
Pentru evaluarea costului mediu al întreţinerii echipamentului în unitatea de
timp este necesar să se considere alături de costul b al reînnoirii preventive şi
costul d al stagnării echipamentului ( sau al funcţionării sale incorecte ) în
unitatea de timp. Costul mediu într-o perioadă T este format din:
a) costul reînnoirii preventive b;
b) costul reînnoirii propriu-zise (al reparărilor în caz de defectare).
1  H T  TD 
c) costul duratei medii de stagnare:
TD
d   x  h  T  x dx
0
Cap. 4. Echipamente tolerante la defectări 45

Se obţine costul mediu în unitatea de timp:


1  
TD
C DRP T ,TD    b  H  T  TD   d   x  h  T  x dx (2.87)
T  
 0
Prin minimizarea expresiei (2.87) după TD , se obţine valoarea optimă:
* 1
TD  (2.88)
d
*
Înlocuind expresia (2.88) în (2.87), pentru TD  T se obţine:
hT 
C DRP  T ,TD   C BRP T  
*
(2.89)
  2  dt
Considerând acum perioada optimă a reînnoirilor preventive, dată de relaţia
(2.83) T  h T   H  T   b , se poate obţine costul minim al strategiei DRP
* * *
   
utilizând relaţia (2.89):

h T 
*
C DRP  C DRP  T ,TD   C BRP  T     
* * * *
    2  d  T*
(2.90)
*    TD 
*

 h T   1 
1  * 
 h T   1 
   2  d  T *     2  T* 
 
Trecând la analiza strategiilor neperiodice de reînnoire vom considera cea mai
simplă strategie, la care reînnoirea preventivă este determinată de atingerea de
către echipament a unei anumite vârste, x. Această strategie este cunoscută în
literatură sub denumirea ARP (Age Replacement Policy).
Datorită caracterului neperiodic al reînnoirilor preventive, realizarea efectivă
a strategiei este mai dificilă, fapt care se exprimă printr-un cost asociat unei
reînnoiri preventive de tip ARP mai mare decât cel corespunzător reînnoirii
preventive periodice (a>b).
În vederea determinării vârstei echipamentului la care trebuie efectuată
reînnoirea preventivă se pot utiliza diverse criterii:
 asigurarea unui anumit nivel de fiabilitate;
 condiţia de extrem pentru o mărime dependentă de x;
46 Cap. 4. Echipamente tolerante la defectări

 minimizarea costului mediu al întreţinerii echipamentului în unitatea


de timp.
În continuare se va utiliza criteriul de minimizare a costului mediu de
întreţinere. Pentru stabilirea acestui cost se neglijează duratele în care se
efectuează reînnoirea echipamentului. Costul întreţinerii echipamentului în
toată durata vieţii sale va fi egal cu unitatea dacă echipamentul se defectează
în intervalul 0, x  şi cu costul a al reînnoirii preventive dacă echipamentul nu
se defectează în acest interval. Rezultă costul mediu al întreţinerii
echipamentului F(x)+a*R(x). Împărţind expresia costului mediu la durata
medie de viaţă a echipamentului rezultă costul mediu în unitatea de timp dat
de relaţia următoare:
F  x   a  R x 
C ARP  x   (2.91)
x
 Rt dt
0
Minimizând relaţia (2.91), rezultă ecuaţia vârstei optime la care trebuie să se
execute reînnoirea preventivă a echipamentului:
*
 C ARP x  x
 0  z x    Rt d t  R x  
 * * 1
(2.92)
x   0   1 a

Condiţia suficientă de existenţă a valorii optime x* este ca rata de defectare să


fie crescătoare (echipamentul să fie caracterizat de uzură pozitivă). Valoarea
medie minimă a costului se obţine înlocuind soluţia x* a ecuaţiei (2.92) în
relaţia (2.91):

C ARP  C ARP  x   1  a   z x 


* * *
(2.93)
   
Costul mediu minim dat de relaţia (2.93) este o funcţie crescătoare de costul a
al unei reînnoiri preventive.

Exemplu: Se consideră acelaşi echipament descris de ecuaţia (2.77):

Rt   2  e t  e 2 t


Cap. 4. Echipamente tolerante la defectări 47

Înlocuind indicatorii de fiabilitate ai acestui echipament în expresia (2.92) se


obţine:
2
1  a   R *
 2  3  a   R  1  3  a  0
*
(2.94)
*
*   x
R e
Ecuaţia (2.94) are soluţii reale pentru orice a  0, 1. Soluţiile sunt pozitive
1
pentru a  şi în acest caz cea mai mică este subunitară, deci acceptabilă. Ca
3
urmare, vârsta optimă a reînnoirii preventive se obţine din relaţiile:
*2  3  a  a  4  3  a 
R 
2  1  a 
(2.95)
* 1 1 1 2  1  a 
x  ln  ln
 R*  2  3  a  a  4  3  a 

1
Condiţia de existenţă a strategiei optime ARP este deci a  . Dacă această
3
condiţie este îndeplinită, costul mediu minim rezultă conform relaţiei (2.93):
*
 
C ARP  1  a   7  x  2    1  a 
* a  a  4  3  a 
2  a  a  4  3  a 
(2.96)

4 1
Pentru a=25% şi   10 ore se obţin valorile numerice:

* 1 6
x  ln  14552 ore
 5  13
(2.97)
* 3  13  1 4 1
C ARP  2     0,65  10 ore
4 13  7
Dacă nu s-ar efectua reînnoiri preventive, costul mediu de întreţinere în
unitatea de timp ar fi 0,66 10  4 ore1 . Strategia optimă ARP este deci
avantajoasă faţă de absenta oricărei strategii de reînnoire.
Alegerea între diferite strategii de reînnoire trebuie făcută prin prisma unui
criteriu unitar şi având în vedere variantele optime ale diverselor strategii.
Astfel, se consideră strategiile ARP, BRP şi FRP, [3]. Criteriul de comparaţie
48 Cap. 4. Echipamente tolerante la defectări

între aceste strategii este costul mediu minim al întreţinerii echipamentului în


unitatea de timp. Pentru a arăta procedeul de decizie trebuie reamintit faptul că
expresiile costurilor C ARP şi C BRP sunt funcţii crescătoare de costul
individual al reînnoirilor preventive. Există deci două valori unice a0 , b0 de la
care începând, sunt adevărate inegalităţile următoare:
C ARP a   C FRP
*
a  a0
(2.98)
C BRP b   C FRP
*
b  b0

Din aceste inegalităţi rezultă că pentru a  a0 şi b  b0 trebuie adoptată


strategia FRP, pentru a  a0 şi b  b0 trebuie adoptată strategia BRP, iar pentru
a  a0 şi b  b0 trebuie adoptată strategia ARP. Rămâne cazul a  a0 şi b  b0
când trebuie făcută o alegere între strategiile ARP şi BRP. Întrucât funcţiile
costurilor C ARP şi C BRP sunt crescătoare, există o valoare unică b* a  pentru
care C BRP  b   C ARP a  . Cunoscând funcţia b* a  se poate decide uşor
* * *
 
asupra strategiei de adoptat, ţinând seama de monotonia funcţiei C BRP b  .
*

Dacă b  b* se adoptă strategia ARP şi dacă b  b* se adoptă strategia BRP.


Algoritmul de alegere a strategiei optime este prezentat în figura 2.11:

Fig. 2.11. Alegerea strategiei optime de reînnoire


Cap. 4. Echipamente tolerante la defectări 49

În literatura de specialitate mai sunt prezentate şi alte strategii utilizate în


reînnoirea echipamentelor. În cadrul capitolului 6 se va prezenta o strategie
evolutivă de reînnoire care face parte din categoria strategiilor de tip CRP
(Continuous Replacement Policy). Implementarea strategiei tip CRP necesită
o supraveghere continuă a echipamentului prin intermediul mărimilor
măsurate, iar determinarea momentului proximei reînnoiri preventive se face
în funcţie de evoluţia parametrilor echipamentului, determinaţi prin tehnici
de diagnoză.

CAPITOLUL 3

FIABILITATEA STRUCTURALĂ

3.1. Modelul funcţional

Analiza fiabilităţii prin intermediul modelelor statistice globale necesită


asocierea echipamentului cu un obiect abstract, descris de un grup de variabile
accesibile, care constituie singurele legături ale echipamentului cu exteriorul.

Variabilele de intrare U  u1 ,u2 ... um  constituie vectorul cauză, iar vectorul
efect este vectorul de ieşire Y  y1 , y2 ... y p  , ambii vectori fiind în general
procese aleatoare [3]. Atunci când nu se cunoaşte nimic despre structura
echipamentului, acesta este descris matematic de dependenţa funcţională (3.1):
Y  AU  (3.1)
Atunci când se cunoaşte măcar parţial structura echipamentului se poate pune
în evidenţă un număr de variabile interne prin intermediul cărora se manifestă
influenţa variabilelor de intrare asupra celor de ieşire. Prin evidenţierea
50 Cap. 4. Echipamente tolerante la defectări

variabilelor interne (variabile de stare) echipamentul iniţial poate fi descompus


în două subsisteme ca în figura 3.1.

Fig. 3.1. Reprezentarea unui echipament când se cunoaşte structura sa.

Prin alegerea convenabilă a vectorului de stare echipamentul poate fi descris


cu ajutorul relaţiilor:
  B ,U 
(3.2)
Y  D 

Conform acestor relaţii vectorul de stare determină complet vectorul ieşirilor.


Analiza fiabilităţii unui echipament presupune o interpretare fizică adecvată a
variabilelor de intrare, ieşire şi stare. Ca variabile de intrare se iau solicitările
datorate interacţiunii cu alte echipamente şi cu mediul ambiant, iar ca variabile
de ieşire se consideră performanţele echipamentului.
Exemplu: În cazul unui sistem de reglare: vectorul de intrare: solicitările
electrice ale componentelor(tensiuni, curenţi, puteri disipate), temperatură
ambiantă, umiditatea, nivelul perturbaţiilor; vectorul de ieşire: suprareglajul,
durata regimului tranzitoriu, rezerva de stabilitate. Vectorul de stare se alege
pe baza observaţiei că performanţele echipamentului depind nemijlocit de
parametrii componentelor, care depind de rândul lor de solicitări. Parametrii
componentelor reprezintă în acest caz variabilele de stare ale echipamentului
în cazul unei analize de fiabilitate.
Analiza este completă dacă se descrie matematic influenţa solicitărilor asupra
parametrilor componentelor, respectiv a acestora din urmă asupra
performanţelor echipamentului. Analiza structurală a fiabilităţii îşi propune să
elaboreze modele structurale care să exprime dependenţa dintre performanţele
echipamentului şi parametrii componentelor sale.
Aceste modele trebuie să ţină seama de evoluţia variabilelor, astfel încât să
permită calculul indicatorilor de fiabilitate pornind de la indicatorii de
Cap. 4. Echipamente tolerante la defectări 51

fiabilitate care caracterizează componentele. Modelele se bazează pe relaţia


generală dintre performanţele echipamentului şi parametrii componentelor.
Y  D  (3.3)
Această dependenţă funcţională mai poate fi scrisă:
 1  2  l  1  2  l  1  2  l j  1  2  l  
yi  f i  1 , 1 , ... 1 1 ,  2 ,  2 , ...  2 2 ...  j ,  j , ...  j ...  n ,  n , ...  n n 
 
i  1 , 2 , ... p
(3.4)
Relaţiile (3.4) constituie modelul funcţional al echipamentului. Se observă că
fiecare componentă este descrisă de l j parametri  j  1, 2 , ... n  , iar
performanţele echipamentului  yi , i  1 , 2 , ... p  depind de toţi cei N parametri
ai componentelor, unde:
N  l1  l2  ... ln (3.5)
Pentru a caracteriza fiabilitatea echipamentului este necesar să se definească
domeniul de bună funcţionare al acestuia ca mulţimea valorilor Y din spaţiul p
– dimensional, pentru care echipamentul îşi îndeplineşte funcţia în mod
satisfăcător. Delimitarea domeniului de bună funcţionare se poate face
utilizând relaţiile următoare:
yi min  yi  yi max
(3.6)
i  1 , 2 , .... p

Intervalul [ yi min , yi max ] reprezintă un interval de toleranţă pentru performanţa


i a echipamentului. Acest interval poate fi şi unilateral, adică este posibil ca
yi min  0 sau yi max   .

Utilizând intervalele de toleranţă se pot exprima indicatorii de fiabilitate la


nivelul echipamentului pornind de la performanţele acestuia. Funcţia de
fiabilitate R E este probabilitatea ca în intervalul 0 , t , vectorul de ieşire să
aparţină domeniului de bună funcţionare.
p
R E  P   yi  min  yi  yi max  (3.7)
i 1 
52 Cap. 4. Echipamente tolerante la defectări

Pornind de la specificaţiile impuse performanţelor echipamentului prin


condiţiile (3.6) se proiectează toleranţele care trebuie impuse parametrilor
componentelor pentru a asigura încadrarea vectorului de ieşire în domeniul de
bună funcţionare. Se stabilesc astfel domeniile de bună funcţionare asociate
fiecărui parametru:
 k  k  k
 j min   j   j max
k  1 , 2 , .... l j (3.8)
j  1 , 2 , .... n

Funcţia de fiabilitate asociată unei componente este probabilitatea ca, în


intervalul 0 , t  , toţi cei l j parametri ai acesteia să fie cuprinşi în intervalele
de toleranţă respective:
 lj  k  k  k 
R j  P     j min   j   j max 
k 1  (3.9)
j  1 , 2 , ... n

Analiza structurală a fiabilităţii are drept prim scop stabilirea unei relaţii între
funcţia de fiabilitate a echipamentului (3.7) şi funcţiile de fiabilitate ale
elementelor componente (3.9). Analiza trebuie precedată de o evaluare cât mai
precisă a funcţiilor de fiabilitate individuale {Rj , j=1, 2, ... n}, care să ţină
seama de criteriile de defectare reale, impuse de structura echipamentului.
Rezolvarea problemei presupune cunoaşterea în fiecare moment de timp a
densităţilor de probabilitate asociate parametrilor
  k

 j , k  1, 2 ... l j , j  1, 2 , ... n , care caracterizează elementele compo-nente
ale echipamentului. Cu ajutorul acestor densităţi de probabilitate se calculează
funcţiile individuale de fiabilitate (3.9), iar utilizând relaţiile (3.4) se obţin
densităţile de probabilitate asociate performanţelor echipamentului:
 yi , i  1 , 2 , ... p  . Introducând aceste densităţi în expresia lui R E se obţine
funcţia de fiabilitate a echipamentului (3.7). Repetând această operaţie la
diferite momente de timp, se stabileşte dependenţa funcţională dintre R E şi {Rj
, j=1, 2, ... n}, astfel încât analiza structurală a fiabilităţii este încheiată.
Cap. 4. Echipamente tolerante la defectări 53

În vederea înlăturării dificultăţilor ce decurg din calculul densităţii de


probabilitate asociată performanţelor echipamentului, se poate utiliza
simularea Monte Carlo. Se generează astfel valori posibile ale parametrilor în
conformitate cu legile de repartiţie asociate, obţinându-se prin simulări
repetate densităţile de probabilitate asociate performanţelor şi de aici, funcţia
de fiabilitate a echipamentului.
Această analiză se efectuează pe sisteme de calcul şi este strâns legată de
analiza funcţionării echipamentului, fiind posibilă efectuarea ei odată cu
proiectarea acestuia. Dezavantajul constă în consumul mare de timp şi
memorie, fiind necesare numeroase valori ce trebuie calculate la intervale
scurte de timp, pentru a putea obţine indicatorii de fiabilitate ca funcţii de timp.

Analiza structurală directă a fiabilităţii echipamentului, bazată pe modelul


funcţional (3.4), este de regulă evitată din cauza dificultăţilor legate de
cunoaşterea completă a proceselor aleatoare asociate componentelor
   , k  1, 2 ... l , j  1, 2 , ... n  la diferite momente de timp.
j
k
j

3.2. Modelul logic

Pornind de la relaţiile (3.4) dintre performanţele echipamentului şi parametrii


componentelor şi de la domeniile de funcţionare respective (3.6) şi (3.8), se
poate construi un model structural cu ajutorul căruia analiza fiabilităţii
echipamentului este mult simplificată. Acest model, numit model logic, se
obţine prin reducerea dimensiunii vectorilor de ieşire şi stare după cum
urmează. În locul celor p variabile de ieşire se defineşte o singură variabilă S,
astfel încât, la fiecare moment de timp:
S  1 pentru  i  1, 2 , ... p ; yi min  yi  yi max
(3.10)
S  0 daca i  1, 2 , ... p ; yi  yi max sau yi  yi min

În conformitate cu ultima relaţie, vectorul performanţelor echipamentului este


înlocuit cu o singură variabilă binară, care ia valoarea “1” dacă vectorul de
ieşire aparţine domeniului de bună funcţionare şi valoarea “0” în caz contrar.
54 Cap. 4. Echipamente tolerante la defectări

Echipamentul se consideră fără reînnoire, fiabilitatea sa în intervalul 0 , t  fiind


egală cu probabilitatea ca la un moment dat, variabila S să ia valoarea 1.
RE  PS  1 (3.11)

În locul vectorului de stare cu l j dimensiuni asociat unei componente j, se


consideră o variabilă binară x j , care ia valoarea 1 dacă toţi cei l j parametri ai
componentei sunt cuprinşi între limitele de toleranţă respective, şi valoarea 0
în caz contrar:

x j  1 pentru
 k  k    k
 k  1 , 2 , ... l j ;  j min   j j max
(3.12)
 k  k  k  k
x j  0 daca i  1 , 2 , ... l j ;  j   j min sau  j   j max

Funcţia de fiabilitate a unei componente este dată de:


Rj=P(xj=1) (3.13)
Utilizând variabilele binare {xj , j=1, 2, ...n} şi S, relaţia stare-ieşire se poate
exprima printr-o funcţie booleană, numită funcţie de structură.
S    x1 , x2 , ... xn  (3.14)
Analiza structurală trebuie să determine o relaţia funcţională între funcţia de
fiabilitate R E a sistemului şi funcţiile de fiabilitate {Rj, j=1, 2, ... n} ale
elementelor componente:
RE  R1 , R2 , ... Rn  (3.15)
Utilizarea modelului logic presupune cunoaşterea funcţiilor de fiabilitate
R1 , R2 , ... Rn care caracterizează elementele echipamentului. Modelul logic
diferă de cel funcţional şi prin faptul că structura echipamentului este descrisă
de funcţia booleană (3.14), în locul relaţiilor (3.4) care sunt mult mai
complicate. Diferenţa de complexitate provine din faptul că relaţiile (3.4)
realizează o descriere a echipamentului din toate punctele de vedere, în timp
ce funcţia booleană (3.14) reflectă exclusiv fiabilitatea structurală, punând în
evidenţă combinaţiile logice ale stărilor elementelor componente care implică
buna funcţionare a echipamentului. Cele două modele, funcţional şi logic se
Cap. 4. Echipamente tolerante la defectări 55

vor compara în cazul concret al unui echipament asimilat cu un sistem automat


cu reacţie negativă.

Fig. 3.2. Structură cu reacţie


negativă

Întrucât misiunea acestei structuri este să menţină mărimea de ieşire z la o


valoare constantă, performanţa echipamentului poate fi definită ca variaţia
relativă a acestei mărimi:
z
y (3.16)
z
Incluzând regulatorul şi instalaţia tehnologică într-un singur element
caracterizat de funcţia de transfer H d s  , iar traductorul fiind considerat
separat, descris de funcţia de transfer H r s  echipamentul analizat se poate
descompune astfel:

Fig. 3.3. Reprezentarea simpli-


ficată a structurii din figura 3.2.

Mărimea de referinţă (z0) se consideră riguros constantă. Din punct de vedere


al fiabilităţii structura din figura 3.3 poate fi reprezentată prin sistemul abstract
din figura 3.4:

Fig. 3.4. Reprezentarea structurii din figura 3.3,


din punct de vedere al fiabilităţii
56 Cap. 4. Echipamente tolerante la defectări

Solicitările u1 , u 2 , ... u n datorate mediului ambiant şi interacţiunilor cu alte


echipamente acţionează asupra parametrilor caracteristici H d şi H r ai
elementelor componente, care la rândul lor, influenţează performanţa y a
echipamentului.
Pentru a obţine un model structural se porneşte de la funcţia de transfer a
echipamentului în regim staţionar:
z Hd
 (3.17)
z0 1  H d H r

Prin logaritmare şi derivare, din relaţia (3.17) se obţine:


dz 1 dH d Hd Hr dH r
    (3.18)
z 1  Hd Hr Hd 1  Hd Hr Hr

Trecând la diferenţe finite, din relaţia (3.18) se obţine:


z 1 H d Hd Hr H r
y     (3.19)
z 1  Hd Hr Hd 1  Hd Hr Hr

Relaţia (3.19) defineşte modelul funcţional al fiabilităţii echipamentului


analizat.
Pentru a exprima fiabilitatea se delimitează domeniul de bună funcţionare prin
condiţia y   , astfel încât:
RE  P y    (3.20)

În continuare se pot proiecta toleranţele parametrilor elementelor componente


prin metoda cazului cel mai favorabil. Se pune condiţia:
z 1 H d Hd Hr H r
y       (3.21)
z 1  Hd Hr Hd 1  Hd Hr Hr

Dacă se consideră  d   r   , se obţine în continuare:

H d H r 1  H d H r 
  d  1  H d H r   r   r (3.22)
Hd Hr Hd Hr
Cap. 4. Echipamente tolerante la defectări 57

Relaţiile (3.22) sunt analoge cu (3.8), funcţiile de fiabilitate individuale ale


componentelor fiind date de:
 H d   H r 
Rd  P    d  1  H d H r  ; Rr  P   r  (3.23)
 Hd   Hr 
Pentru a stabili, cu ajutorul modelului funcţional, relaţia dintre funcţia de
fiabilitate a echipamentului (3.20) şi funcţiile de fiabilitate (3.23) ale
elementelor componente se foloseşte următorul algoritm [3]:
1. Se determină densităţile de probabilitate f H d H d  şi f H r H r  asociate
parametrilor H d , H r .
2. Se calculează funcţiile de fiabilitate ale elementelor cu relaţiile (3.23).
3. Folosind densităţile de probabilitate de la punctul 1 se stabileşte cu
relaţia (3.19) densitatea de probabilitate a performanţei
echipamentului.
4. Utilizând rezultatul de la punctul 3 se calculează cu relaţia (3.20)
funcţia de fiabilitate a echipamentului.
5. Se repetă punctele 1 – 4 pentru diferite momente de timp.
Din analiza algoritmului se observă că el nu poate fi realizat analitic,
dificultatea esenţială fiind legată de punctul 3. Se poate recurge la simularea
Monte Carlo, dar consumul de memorie şi timp calculator este mare, rezultând
concluzia că analiza fiabilităţii pe baza modelului funcţional nu este o operaţie
prea comodă.
În cazul modelului logic, se defineşte variabila binară S, astfel încât:
S  1 pentru y 

S  0 pentru y 

Pentru componentele H d şi H r se definesc variabilele binare xd şi xr care iau


valori egale cu 1 sau 0 după cum inegalităţile corespunzătoare (3.22) sunt sau
nu îndeplinite. Se observă că îndeplinirea egalităţilor (3.22) asigură în mod
acoperitor încadrarea performanţei echipamentului în domeniul de bună
funcţionare.
58 Cap. 4. Echipamente tolerante la defectări

Pentru ca echipamentul să fie în bună stare este necesar ca ambele componente


să fie în bună stare, ceea ce conduce la funcţia logică de structură:
S  xd  xr (3.24)
Funcţia de structură este mult mai simplă decât relaţia (3.19) care defineşte
modelul funcţional, deoarece nu descrie modul în care echipamentul îşi
îndeplineşte misiunea, ci exprimă doar relaţia logică dintre stările
componentelor şi starea echipamentului. Dacă se admite independenţa
defectărilor elementelor, relaţia dintre funcţia de fiabilitate a echipamentului
R E şi funcţiile de fiabilitate ale elementelor, Rd şi Rr , presupuse cunoscute,
se deduce prin calcule elementare:
RE  PS  1  P xd  1  P xr  1  Rd  Rr (3.25)
Exemplul considerat pune în evidenţă simplitatea analizei bazată pe modelul
logic.

3.2.1. Metode de analiză a fiabilităţii sistemelor descrise prin


modele logice

Scopul acestor metode este ca pornind de la funcţia de structură


S    x1 , x2 ,...xn  să se obţină relaţia dintre fiabilitatea echipamentului şi
fiabilităţile componentelor sale RE  R1 , R2 ,...Rn  .

Se va utiliza în continuare o reprezentare a funcţiei logice de structură a unui


echipament, cu ajutorul grafurilor de semnal. Se consideră că semnalul
introdus în graf ajunge la ieşire dacă şi numai dacă echipamentul este în bună
stare, adică S=1. Fiecărei variabile xj îi corespunde un arc care se consideră
întrerupt dacă xj =0, respectiv dacă elementul j este defect.

Se consideră o funcţie de structură de forma produsului logic:


Cap. 4. Echipamente tolerante la defectări 59

S  x1  x2   xn (3.26)

Graful de semnal corespunzător este următorul:

Fig. 3.5. Graful de semnal pentru funcţia de structură (3.26).

Datorită formei grafului de semnal, aceste echipamente se numesc de tip


serie, oricare ar fi structura lor din punct de vedere funcţional. Sub raportul
fiabilităţii, un echipament care se defectează la defectarea oricăruia din
elementele sale este de tip serie. Exemplu: structura cu reacţie studiată.

În ipoteza independenţei defectărilor elementelor componente, funcţia de


fiabilitate a echipamentului este:

n n
RE  PS  1   Pxi  1   Ri (3.27)
i 1 i 1

Din ultima relaţie rezultă că un echipament serie format din elemente fără
uzură este la rândul lui un echipament fără uzură. În cazul echipamentelor cu
structură serie avem:
n
n
t  i
 i  t i 1   E t
RE   e e e (3.28)
i 1

Rata de defectare constantă şi media timpului de funcţionare sunt date de


relaţiile:
n 1
E   i mE  (3.29)
i 1 E
60 Cap. 4. Echipamente tolerante la defectări

Din relaţiile (3.29) se observă că, dacă fiabilitatea uneia dintre componente
este mult inferioară fiabilităţii celorlalte, adică  j :  j  i ,i  1,2, ... ,n,
atunci această componentă determină fiabilitatea echipamentului ( E   j )
. Rezultă că este contraindicat să se sintetizeze echipamente de tip serie din
elemente cu fiabilităţi mult diferite.

Considerăm în continuare o funcţie de structură de tipul SAU logic:

S  x1  x2   xn (3.30)

Graful de semnal corespunzător este următorul:

Fig. 3.6. Graful corespunzător


funcţiei de structura dată de
relaţia 3.30

Astfel de echipamente se numesc de tip paralel, indiferent de structura lor


funcţională.

Analiza cantitativă a fiabilităţii echipamentului nu poate fi făcută imediat, ca


la echipamentul cu structură serie, deoarece probabilitatea reuniunii nu este
dată de suma probabilităţilor, decât pentru evenimente incompatibile, ceea
ce nu este cazul. În această situaţie se poate proceda la o reducere la cazul
anterior considerând variabila S negată:

S  x1  x2  ...  xn  x1  x2  ...  xn (3.31)


Cap. 4. Echipamente tolerante la defectări 61

În conformitate cu relaţia anterioară, probabilitatea de defectare a


echipamentului este dată de produsul probabilităţilor de defectare ale
elementelor componente:

   
n n n
FE  P S  1   P xi  1   Fi  RE  1  FE  1   1  Ri  (3.32)
i 1 i 1 i 1

Din relaţia anterioară se poate deduce că un echipament cu structură de tip


paralel, din punct de vedere al fiabilităţii, format din elemente fără uzură este
un echipament cu uzură medie pozitivă (tip IFRA). Fizic, uzura echipamentului
se explică prin faptul că, pe măsură ce unele elemente se defectează, pericolul
de defectare a echipamentului creşte.

Pornind de la structurile elementare de tip serie şi paralel şi utilizând relaţiile


(3.27) şi (3.32) s-ar putea realiza analiza oricărui echipament reductibil la o
combinaţie de astfel de structuri.

Funcţia de structură a unui echipament serie-paralel este, în general de forma


unei reuniuni de produse logice, o variabilă fiind prezentă numai în unul dintre
aceste produse reunite:


S   xi1  xi2   xi j
i

i (3.33)
xik  xl m , i ,l ,k ,m

În mod similar un echipament paralel-serie va fi descris de o funcţie de


structură de tipul produsului logic al unor reuniuni, o variabilă apărând într-o
singură reuniune:
62 Cap. 4. Echipamente tolerante la defectări

S    xi1  xi2   xi j 
i  i  (3.34)
xik  xl m , i ,l ,k ,m

Există însă şi echipamente a căror structură nu poate fi descrisă cu ajutorul


funcţiilor de tipul (3.33) sau (3.34), sau de combinaţii ale acestora. Pentru
exemplificare se consideră funcţia de structură dată de relaţia (3.35).

S   x1  x2  x5    x3 x4  x5  (3.35)

Funcţia prezentată în (3.35) nu este o structură reductibilă la combinaţii de


structuri serie şi paralel deoarece variabila x5 apare mai mult decât o singură
dată.

Se vor analiza în continuare echipamentele coerente, adică acele


echipamente ale căror performanţe se îmbunătăţesc odată cu creşterea
numărului de elemente aflate în bună stare. În toate metodele folosite se face
ipoteza independenţei defectării elementelor. Admiterea acestei ipoteze
conduce la o aproximare prin lipsă a fiabilităţii sistemului, deci la un calcul
acoperitor. De asemenea, nu se vor lua în consideraţie posibilităţile de
reînnoire ale echipamentului, modelul logic nefiind adecvat tratării unor
asemenea situaţii.

Una din metodele foarte utilizate în analizele efectuate fără mijloace


automate de calcul, este metoda probabilităţii totale. Această metodă constă
în reducerea structurii unui echipament la combinaţii de structuri elementare
de tip serie şi paralel prin ipoteze formulate asupra stării unor elemente ale
acestuia. Pentru a obţine reducerea este necesar ca ipotezele formulate să se
refere la variabilele care se repetă în funcţia de structură.
Cap. 4. Echipamente tolerante la defectări 63

Se consideră în continuare că variabila x j apare de mai multe ori în funcţia de


structură. Dacă se face ipoteza că elementul j este în bună stare, variabila x j
ia valoarea 1 iar funcţia de structură devine:

S
x j  1   x1 , x2 , ... x j 1 ,1, x j 1 , ... xn  (3.36)

În ipoteza că elementul j este defect, variabila x j  0 , iar funcţia de structură


va avea expresia următoare:

S
x j  0   x1 , x2 , ... x j 1 ,0, x j 1 , ... xn  (3.37)

Fiabilitatea echipamentului se obţine conform formulei probabilităţii totale:

    
RE  PS  1  P S  1 x j  1  P x j  1  P S  1 x j  0  
 Px j  0  R S j   R j  R S j   1  R j 
(3.38)

Dacă expresiile (3.36) şi (3.37) reprezintă combinaţii de structuri serie şi


paralel, probabilităţile condiţionate RS j  , R S j  pot fi calculate cu
ajutorul relaţiilor (3.27) şi (3.32), astfel încât funcţia de fiabilitate R E poate fi
calculată.

Dacă însă expresiile de tipul (3.36), (3.37) nu reprezintă combinaţii de tip serie
sau paralel, trebuie să se aplice încă o dată metoda probabilităţii totale.

Presupunând că expresia (3.36) nu este de tipul unei combinaţii serie-paralel,


datorită repetării variabilei x j , aplicând formula probabilităţii totale se obţine:

R( S / j )  R S / j  k   Rk  R S / j  k  1  Rk   (3.39)
64 Cap. 4. Echipamente tolerante la defectări

Metoda probabilităţii totale are avantajul că permite o evaluare comodă a


ponderii pe care o au elementele în asigurarea bunei funcţionări a
echipamentului.

Ponderea unei componente j în cadrul modelului logic se defineşte ca derivata


funcţiei de fiabilitate a echipamentului în raport cu funcţia de fiabilitate a
componentelor respective. Plecând de la relaţia (3.38) ponderea
componentei j poate fi determinată cu ajutorul relaţiei următoare:

RE
R j

 RS j   R S j  (3.40)

Aplicarea metodei probabilităţii totale necesită evaluarea funcţiilor de


fiabilitate condiţionate, astfel încât evaluarea ponderilor componentelor se
poate face cu minimum de efort de calcul.

Modelul logic – exemplificare metoda probabilităţii totale

Se consideră un echipament format din patru surse de informaţii, fiecare


aflându-se în legătură cu celelalte trei (figura 3.7). Se acceptă ipoteza că sursele
nu se defectează, însă canalele de transmitere a informaţiei pot fi afectate de
perturbaţii în mod independent unul de altul, devenind inutilizabile.

Fig. 3.7. Echipamentul analizat şi graful asociat


Cap. 4. Echipamente tolerante la defectări 65

Funcţia de fiabilitate a unui canal este presupusă cunoscută şi se notează cu


R, fiind aceeaşi pentru toate canalele. Misiunea echipamentului este de a
realiza transferul informaţiei între două surse în mod direct sau prin
intermediul celorlalte surse.

Echipamentul având o structură simetrică, se poate considera transmiterea


informaţiei între oricare două surse, de exemplu a şi b. Analizând logic relaţia
dintre performanţa echipamentului şi stările elementelor - operaţie pentru
care nu se poate da o regulă generală - se obţine următoarea funcţie de
structură:

S  x1  x2  x6  x4  x5  x2  x3  x4  x3  x5  x6 (3.41)

cu graful corespunzător în figura 3.7.

Analizând graful asociat funcţiei de structură se constată că echipamentul nu


este reductibil la combinaţii de tip paralel şi serie. Acest lucru este datorat
oricăruia dintre elementele 2 – 6 deoarece toate variabilele corespunzătoare
x2  x6 se repetă în expresia funcţiei de structură (3.41).

În vederea analizei cantitative a fiabilităţii se aplică metoda probabilităţii


totale, făcându-se ipoteze asupra stării unuia dintre elementele 2 – 6. Se
optează pentru elementul 3, alegerea făcându-de în urma analizei grafului din
figura 3.7. Presupunând că elementul 3 este în bună stare de funcţionare se
obţine funcţia de structură dată de relaţia (3.42):

S x3  1  x1  x2  x6  x4  x5  x2  x4  x5  x6 
(3.42)
 x1  x2  x5   x4  x6 
66 Cap. 4. Echipamente tolerante la defectări

Graful de semnal asociat acestei funcţii de structură este prezentat în figura


3.8.

Fig. 3.8. Graful de semnal asociat


funcţiei de structură (3.42).

Echipamentul cu funcţia de structură (3.42) este o combinaţie de structuri


serie şi paralel, după cum rezultă din figura 3.8. Funcţia de fiabilitate a acestei
structuri se obţine aplicând din aproape în aproape, relaţiile (3.27) şi (3.32):

  
RS 3  PS  1 x3  1  1  1  R   1  1  1  R 2  1  1  R 2  


 
2 2
 1  1  R   1  2 R  R    R  5R  8R  4 R  R

5 4 3 2 (3.43)

Se consideră în continuare ipoteza că elementul 3 este defect. Se obţine


funcţia de structură următoare:

S  x3  0  x1  x2  x6  x4  x5 (3.44)
Graful de semnal asociat funcţiei de structură (3.44) este prezentat în figura
3.9. Acest graf de semnal se obţine din cel iniţial (figura 3.7) prin întreruperea
arcului corespunzător elementului 3.

Fig. 3.9. Graful de semnal asociat


funcţiei de structură (3.44).
Cap. 4. Echipamente tolerante la defectări 67

Funcţia de fiabilitate asociată acestei structuri se obţine aplicând din aproape


în aproape, relaţiile (3.27) şi (3.32):

 
R S 3  PS  1 x3  0  1  1  R   1  R  1  R   2
 2
 (3.45)
5 4 3 2
 R  R  2R  2R  R

Se aplică apoi formula probabilităţii totale (3.38), obţinând funcţia de


fiabilitate a echipamentului:

 
RE  RS 3  R  R S 3  1  R    R  5R  8R  4 R  R 
6 5 4 3 2

5 4 3 2 6 5 4 3 2
 R  R  2R  2R  R  R  R  2R  2R  R  (3.46)
6 5 4 2
 2 R  7 R  7 R  2 R  R

Calculul ponderilor va fi exemplificat pentru elementul 3. Conform relaţiei


(3.40) şi ţinând seama de relaţiile (3.43) şi (3.45) se obţine:

RE
R3
 
 RS 3  R S 3   R  5R  8R  4 R  R  R  R 
5 4 3 2 5 4

(3.47)
 2 R  2 R  R  2 R  6 R  6 R  2 R  2 R 1  R 3
3 2 5 4 3 2 2

Din ultima relaţie se observă că


ponderea elementului 3 în asigurarea
performanţei echipamentului depinde de
funcţia de fiabilitate a elementelor
acestuia şi deci implicit de timp.
Reprezentând grafic ponderea elemen-
tului 3 în raport cu R se observă că
aceasta este nulă pentru R  0 şi R  1 şi
2 Fig. 3.10. Ponderea elementului 3
are un maxim pentru R  . în asigurarea fiabilităţii
5
echipamentului.
68 Cap. 4. Echipamente tolerante la defectări

Din analiza efectuată rezultă că, în contextul metodei probabilităţii totale,


modelul logic se exprimă mai comod prin graful de semnal decât prin funcţia
de structură. De aceea în aplicaţii, modelul logic este de regulă elaborat sub
forma grafului de semnal, fără a mai fi necesară scrierea explicită a funcţiei
de structură.

Acest fapt a sugerat elaborarea unor metode de analiză analoge cu cele


aplicabile reţelelor electrice (transfigurări triunghi-stea), care la rândul lor pot
fi reprezentate prin grafuri de semnal.

Metoda probabilităţii totale, alături de formulele de calcul al fiabilităţii


structurilor elementare de tip serie şi paralel, rămâne cea mai utilizată şi mai
comodă metodă pentru analiza unor echipamente de complexitate redusă.
Creşterea complexităţii echipamentelor a impus însă elaborarea unor metode
de analiză mai sistematice, uşor de implementat sub forma unor algoritmi
programabili pe calculator. Există mai multe metode care satisfac acest
deziderat, ele fiind înglobate sub denumirea de metode algebrice.

3.2.2. Metode algebrice de analiză a fiabilităţii echipamentelor


descrise prin modele logice

Aceste metode se bazează pe faptul că funcţia de structură a echipamentului


poate fi pusă sub forma S-O-P (“Sum-Of-Products”) [3]:
S   xi1  xi2 ... xi j (3.48)
i
i

Termenii reuniţi cu expresia anterioară se numesc căi. O cale reprezintă o


mulţime de elemente a căror bună funcţionare implică buna funcţionare a
echipamentului.
Cap. 4. Echipamente tolerante la defectări 69

Dacă forma canonică (3.48) a funcţiei de structură este minimizată, termenii


reuniunii vor reprezenta căi minime pentru echipament. O cale minimă este
o mulţime de elemente a căror bună funcţionare implică funcţionarea
echipamentului, proprietate pe care nu o are nici o submulţime a căii minime.

Dacă evenimentele care se produc atunci când termenii reuniunii (căile


minime), iau valoarea 1 şi sunt evenimente incompatibile două câte două,
atunci se poate determina funcţia de fiabilitate a echipamentului astfel:
ji
RE  P( S  1 )    P( xik  1 ) (3.49)
i k 1

În realitate, condiţia de incompatibilitate între căile minime nu este


îndeplinită întotdeauna. De aceea este necesar să se modifice forma (3.48)
astfel încât termenii să fie incompatibili între ei. Funcţia de structură trebuie
pusă sub forma unei reuniuni de produse logice mutual incompatibile.

În continuare se prezintă cea mai reprezentativă metodă, ce poate fi utilizată


atât pentru echipamente simple cât şi pentru echipamente complexe.

Se consideră o funcţie de structură formată din reuniunea a două căi minime,


S1 şi S 2 . Cu ajutorul tabelului de adevăr se poate arăta că relaţia următoare
este adevărată:

S  S1 S 2  S1 S1  S 2 (3.50)

S1 S1  S 2 S1  S1  S 2
S2 S1  S 2

0 0 0 0 0
0 1 1 1 1
70 Cap. 4. Echipamente tolerante la defectări

1 0 1 0 1
1 1 1 0 1

Cu ajutorul relaţiei (3.50), o reuniune a doi termeni oarecare poate fi


transformată într-o reuniune de termeni incompatibili. Prin generalizarea
relaţiei (3.50) se obţine:

m
S   Si  S1  S1  S 2  S1  S 2  S3  S1  S 2  S3  S 4  ...  S1  S 2  S3 ... S m 1  S m
i 1
(3.51)

Se observă că în expresia (3.51) oricare doi termeni sunt incompatibili între


ei. Termenii Si , i  1,2..m sunt de forma:

Si  xi1 , xi2 ... xi ji


(3.52)
i  1,2m

Dacă se introduc expresiile (3.52) în (3.51) şi se dezvoltă produsele logice S i


după regulile lui De Morgan, caracterul mutual incompatibil al termenilor se
poate pierde.

Exemplu: Fie S  S1 S 2 S1 S1  S 2 unde: S1  x11  x12 şi S 2  x21 .

Înlocuind pe S 1 şi S 2 în funcţia de structură şi aplicând regulile lui De Morgan


se obţine:


S  x11  x12  x11  x12  x21  x11  x12  x11 x12  x21 
 x11  x12  x11  x21  x12  x21
Cap. 4. Echipamente tolerante la defectări 71

Se observă că ultimii doi termeni nu sunt incompatibili între ei. Rezultă


observaţia următoare: atunci când expresiile (3.52) ale căilor minime sunt
înlocuite în funcţia de structură (3.51), produsele logice Si nu trebuie
dezvoltate ca reuniuni de variabile negate. Dacă nu există variabile comune
în căile minime, se poate calcula direct funcţia de fiabilitate a echipamentului
analizat. Dacă însă există variabile comune, ele trebuie eliminate pentru a
asigura independenţa termenilor intersectaţi în produsele logice.

Se consideră o funcţie de structură cu două căi minime care au un element


comun: S  S1 S 2  xy xz  x y xy  xz . Cei doi termeni ai reuniunii sunt
incompatibili între ei, dar al doilea termen conţine variabila x de două ori ceea
ce conduce la o dependenţă între termenii xy şi xz . Rezultă că probabilitatea
intersecţiei nu poate fi calculată direct. Pentru eliminarea variabilelor comune
între diferite căi, se utilizează egalitatea următoare:

AB  A  B  A  AB (3.53)

Aplicând relaţia (3.53) în toate situaţiile în care există variabile comune


diferitelor căi minime, se obţin relaţiile (3.54):

  
xy  xz  x  x y  x  x z  x x y z
xy  xz  x  x y   xz  x yz (3.54)
x  xy  xx  y   x  x  x y   x

După eliminarea variabilelor comune, funcţia de fiabilitate a echipamentului


se poate obţine direct din forma finală a funcţiei de structură prin înlocuirea
variabilelor cu funcţiile de fiabilitate corespunzătoare, după modelul relaţiei
(3.49).

Pentru ca prelucrarea funcţiei de structură să fie eficientă, este recomandabil


ca în forma ei iniţială căile minime să se succedă în ordinea crescândă a
72 Cap. 4. Echipamente tolerante la defectări

numărului de elemente, şi pe cât posibil, căile cu mai multe elemente


comune să ocupe poziţii succesive. Metoda expusă va fi aplicată în continuare
pentru analiza fiabilităţii echipamentului format din patru surse de semnal,
având graful din figura 3.7. Căile minime sunt:
S1  x1
S 2  x2  x6
S3  x4  x5 (3.55)
S 4  x2  x3  x4
S5  x3  x5  x6

iar funcţia de structură a echipamentului este: S  S1  S 2  S3  S 4  S5 .

În conformitate cu (3.51), funcţia de structură se poate pune sub forma:

S  S1  S1  S 2  S1  S 2  S3  S1  S 2  S3  S 4  S1  S 2  S3  S 4  S5
(3.56)
  
 S1  S1  S 2  S 2  S3  S3  S 4  S 4 S5 

Se poate utiliza şi notaţia prescurtată:

S   S 4  S 4 S5 (3.57)
3

unde reprezintă expresia (3.56) până la S3 inclusiv.


3

Prin înlocuirea în expresia (3.57) a expresiilor căilor minime S 4 şi S 5 , date de


relaţiile (3.55), se obţine:

S   x2 x3 x4  x2 x3 x4 x3 x5 x6 (3.58)
3
Cap. 4. Echipamente tolerante la defectări 73

Variabila x3 care apare de două ori în termenul al doilea se poate elimina


folosind cea de-a doua relaţie din (3.54). Se obţine:

S   x2 x3 x4  x2 x4 x3 x5 x6 (3.59)
3

Înlocuind în continuare expresia căii minime S 3 şi utilizând relaţiile (3.54) se


obţine:

S
2
 
 x4 x5  x4 x5 x2 x3 x4  x2 x4 x3 x5 x6 

  x4 x5  x4 x5 x2 x3 x4  x4 x5  x2 x4 x3 x5 x6  (3.60)
2
  x4 x5  x5 x2 x3 x4  x4 x3 x5 x6
2

În continuare, înlocuind şi expresia căii minime S 2 şi utilizând relaţiile (3.54)


se obţine:


S   x2 x6  x2 x6 x4 x5  x5 x2 x3 x4  x4 x3 x5 x6 
1

(3.61)
  x2 x6  x2 x6 x4 x5  x6 x5 x2 x3 x4  x2 x4 x3 x5 x6
1

În final, înlocuind şi expresia lui S 1 se obţine după calcule:


S  x1  x1 x2 x6  x2 x6 x4 x5  x6 x5 x2 x3 x4  x2 x4 x3 x5 x6   (3.62)
S  x1  x1 x2 x6  x1 x2 x6 x4 x5  x1 x5 x6 x2 x3 x4  x1 x2 x4 x3 x5 x6

Forma funcţiei de structură S-O-P este o reuniune de termeni mutual


incompatibili, iar fiecare termen este o intersecţie de variabile aleatoare
independente. Independenţa factorilor este asigurată de faptul că variabilele
individuale nu se repetă în cadrul unei aceluiaşi produs logic. Repetarea
74 Cap. 4. Echipamente tolerante la defectări

variabilelor în produse logice diferite nu are importanţă, datorită îndeplinirii


condiţiei de incompatibilitate între aceste produse logice.

Funcţia de fiabilitate a echipamentului rezultă acum din simpla înlocuire în


expresia (3.62) a fiabilităţilor componentelor, punând R j  Px j  1 în locul
lui xi . Se obţine:

RE  R1  1  R1 R2 R6  1  R1 1  R2 R6 R4 R5 


(3.63)
 1  R1 1  R5 1  R6 R2 R3 R4  1  R1 1  R2 1  R4 R3 R5 R6

Dar, întrucât toate elementele au aceeaşi fiabilitate R, se obţine:

 2

RE  R  1  R   R  1  R   1  R  R  2  1  R 3  R 
2 2 3
(3.64)
6 5 4 2
 2 R  7 R  7 R  2 R  R

Se constată că rezultatul obţinut este identic cu cel obţinut prin metoda


probabilităţii totale (3.46).

O altă metodă algebrică de analiză a fiabilităţii se bazează pe transformarea


funcţiei logice de structură a echipamentului într-o funcţie algebrică, ţinând
seama de echivalenţele dintre funcţiile logice şi funcţiile algebrice:

Funcţie Logic Algebric


ŞI xy xy

SAU x y x  y  xy

NU x 1 x
SAU x y x  y  2 xy
Cap. 4. Echipamente tolerante la defectări 75

exclusiv
Dacă în expresia funcţiei algebrice apar numai produse de variabile
independente, rezultă:

RE  R1 , R2 ,......Rn  (3.65)

Metoda va fi exemplificată pentru acelaşi echipament format din patru surse


de informaţie (figura 3.7). În prima etapă se deduce funcţia algebrică
 x1 , x2 , ... xn  asociată echipamentului. În acest scop se pleacă de la:

S  x1  x2 x6  x4 x5  x2 x3 x4  x3 x5 x6 , relaţie care se neagă:

S  x1  x2 x6  x4 x5  x2 x3 x4  x3 x5 x6 
Rezultă: (3.66)
 x1  x2 x6  x4 x5  x2 x3 x4  x3 x5 x6

Utilizând echivalentele dintre funcţiile logice şi cele algebrice se obţine:

S  1  1  x1   1  x4 x5  x2 x6  x2 x3 x4  x3 x5 x6  x2 x3 x4 x5 
(3.67)
 x3 x4 x5 x6  x2 x4 x5 x6  x2 x3 x4 x6  x2 x3 x5 x6  2  x2 x3 x4 x5 x6 

Ţinând seama de faptul că funcţiile de fiabilitate ale componentelor sunt


egale, se obţine:


RE  1  1  R   1  2 R  2 R  5R  2 R 
2 3 4 5
 (3.68)
6 5 4 2
 RE  2 R  7 R  7 R  2 R  R

Se constată că şi în acest caz rezultatul coincide cu cele obţinute prin


metodele anterioare (3.46), (3.64).
76 Cap. 4. Echipamente tolerante la defectări

În cazul în care structura echipamentului este foarte complicată, studiul


analitic al funcţiei de fiabilitate prin metodele descrise devine foarte
anevoios.

Evaluarea numerică aproximativă a funcţiei de fiabilitate poate fi realizată în


asemenea cazuri printr-o metodă experimentală. Metoda constă din
generarea unor stări posibile ale elementelor echipamentului, în
conformitate cu funcţiile de fiabilitate individuale, şi din evaluarea
performanţei realizată de echipament în fiecare din situaţiile realizate.
Raportul dintre numărul de cazuri când un echipament se comportă
satisfăcător şi numărul total de încercări va reprezenta o estimaţie punctuală
a funcţiei de fiabilitate a acestuia, cu atât mai precisă cu cât numărul de
încercări este mai mare.

Dacă funcţia de structură  x1 , x2 , ... xn  este cunoscută, experimentarea


efectivă nu este necesară, stările posibile ale componentelor echipamentului
fiind obţinute prin simulare. În acest scop, se generează valori posibile ale
vectorului de stare, în conformitate cu probabilităţile asociate variabilelor
binare xi , probabilităţi care reprezintă funcţiile de fiabilitate individuale ale
componentelor. Pentru fiecare realizare particulară a vectorului de stare se
calculează, cu ajutorul funcţiei de structură, valoarea mărimii de ieşire S.
Estimaţia punctuală a funcţiei de fiabilitate a echipamentului este dată de
relaţia următoare:

  Sk
RE  k 1 (3.69)
N

unde N este numărul de simulări realizate.


Cap. 4. Echipamente tolerante la defectări 77

3.3. Modelul proceselor Markov

Considerând un echipament coerent descris de funcţia de structură


(x1,x2,…xn) şi asociind fiecărui vector de stare (x1,x2,…xn) un număr real care
să indice sintetic starea echipamentului, se obţine un proces aleator discret,
w(t), cu anumite proprietăţi remarcabile [3].

Prima proprietate constă în faptul că valorile particulare ale procesului


formează o mulţime finită şi numărabilă. Acest lucru este generat de faptul că
echipamentul are un număr finit de elemente, iar combinaţiile stărilor acestora,
care reprezintă stările sunt în număr finit şi distincte, întrucât diferă între ele
prin starea cel puţin a unui element.

A doua proprietate se referă la modificarea valorii w(t) a procesului. Această


modificare se produce fie prin defectare fie prin punerea în funcţiune a unui
element al echipamentului, evenimente care se pot produce într-un interval
de timp (t, t+t), cu precizarea că în acest interval infinit mic nu se poate
defecta sau pune în funcţiune decât un singur element, astfel încât tranziţiile
se pot face numai între stări adiacente, care diferă între ele prin starea unei
singure componente.

Considerând o valoare w0 particulară a procesului la momentul t0,


probabilitatea ca sistemul să se găsească într-o stare particulară w la un
moment t, tt0, depinde de w0, deoarece starea w se atinge din w0 prin
tranziţii discrete, dar nu depinde de stările anterioare lui w0. Altfel spus
procesul este fără memorie sau este caracterizat de absenţa postacţiunii. Un
astfel de proces poate fi modelat de un proces Markov omogen şi cu un număr
finit şi numărabil de stări.

Cu ajutorul proceselor Markov se pot descrie echipamentele atât la nivel


global, cât şi la nivel structural, ţinând seama de posibilităţile de reînnoire ale
elementelor.
78 Cap. 4. Echipamente tolerante la defectări

a) Considerăm în continuare un echipament caracterizat la nivel global ca


având două stări:
 starea “0” de bună funcţionare;
 starea “1” de defectare.

Dacă echipamentul este fără reînnoire atunci procesul Markov ce îl descrie se


reprezintă astfel: trecerea din starea “0” în starea “1” se produce într-un
interval de timp (t, t+t) cu probabilitatea z(t)t, unde z(t) reprezintă rata de
defectare a sistemului.

Fig. 3.11. Graful asociat unui


echipament fără reînnoire.

În scopul unei analize cantitative a procesului se poate scrie ecuaţia:


P0(t+t)=P0(t)(1-z(t)t) (3.70)

dP0 ( t )
Ecuaţia (3.70) se transformă în:   z( t )  P0 ( t ) (3.71)
dt
t
  z( u )du
În condiţiile iniţiale P0(0)=1 se obţine din (3.71): P0 ( t )  e 0
(3.72)

Se observă că în ipoteza absenţei reînnoirilor, probabilitatea ca echipamentul


să fie în bună stare la momentul t coincide cu funcţia de fiabilitate R(t).

b) Considerăm acum că echipamentul este supus unei operaţii de reînnoire


de fiecare dată când se defectează, iar durata de reînnoire este o variabilă
aleatoare distribuită după o lege oarecare, cu rata de reînnoire (t). În
această situaţie echipamentul poate reveni din starea “1” în starea “0” cu
probabilitatea (t)t. Graful asociat este prezentat în figura 3.12.
Cap. 4. Echipamente tolerante la defectări 79

Fig. 3.12. Graful asociat


unui echipament cu
reînnoire.

Procesul Markov asociat acestui echipament este caracterizat de ecuaţiile:

P0 ( t  t )  P0 ( t )[1  z( t ) t ]  P1( t ) ( t ) t
(3.73)
P0 ( t )  P1( t )  1

dP0 ( t )
Din (3.73) se obţine:  [ z( t )  ( t )]  P0 ( t )   ( t ) (3.74)
dt

Rezolvarea ecuaţiei (3.74) în cazul general este dificilă şi de aceea se consideră


cazul particular în care durata de funcţionare şi durata de reînnoire sunt
distribuite exponenţial, adică:
z( t )   şi  ( t )   (3.75)
Ipoteza formulată mai sus este adevărată în cazul în echipamentelor fără
uzură. În aceste condiţii, pentru P0(0)=1, se obţine:

  (    )t
P0 ( t )   e (3.76)
 

Relaţia (3.76) reprezintă probabilitatea ca echipamentul să fie în bună stare


de funcţionare la momentul t. Rezultă că modelul procesului Markov este
foarte util în cazul analizei structurale, îndeosebi în cazul echipamentelor cu
reînnoire.

Se consideră un echipament descris de un model logic de tip serie, format din


n elemente cu rate de defectare şi de reînnoire constante şi egale, respectiv
cu i şi i (i=1,2,…n). Duratele medii de funcţionare şi funcţionare şi de
reînnoire ale elementelor sunt:
80 Cap. 4. Echipamente tolerante la defectări

1 1
m1i  , m2i  i=1,2,…n (3.77)
i i

Analiza fiabilităţii acestui echipament se face în două etape [3]:


1. se calculează indicatorii generali de fiabilitate;
2. se calculează indicatorii specifici sistemelor cu reînnoire.

Pentru prima etapă, funcţia de fiabilitate se poate calcula direct cu ajutorul


modelului logic, ţinând seama de faptul că reînnoirile elementelor
echipamentului nu influenţează comportarea acestuia până la defectare.
Buna funcţionare a echipamentului presupune buna funcţionare a tuturor
elementelor sale. Funcţia de fiabilitate şi media timpului de funcţionare au
fost deja prezentate anterior şi sunt date de:

E t n 1
R( t )  e ; E   i ; m (3.78)
i 1 E

Funcţia de fiabilitate poate fi calculată şi cu ajutorul modelului Markov, al


cărui graf este prezentat în continuare. Ecuaţia cu diferenţe ce caracterizează
procesul este:
n
P0 ( t   t )  P0 ( t )[1  E  t ] ; unde E   i (3.79)
i 1

Prin diferenţiere se obţine:

dP0 ( t )
 E P0 ( t ) (3.80)
dt

ecuaţie care integrată în condiţiile


 t
P0(0)=1 conduce la P0 ( t )  e E ,
adică chiar la funcţia de fiabilitate
dată de relaţia (3.78).
Cap. 4. Echipamente tolerante la defectări 81

Fig. 3.13. Graful asociat unui


echipament fără reînnoire cu
structură de tip serie.

Analizând rezultatele obţinute se constată că modelul procesului Markov nu


prezintă avantaje în analiza structurală a fiabilităţii echipamentelor fără
reînnoire. Pentru etapa a doua ţinem seama de posibilităţile de revenire ale
echipamentului din stările de defectare în starea de bună funcţionare.

Probabilităţile stărilor procesului se


determină cu ajutorul sistemului de
ecuaţii următor:

Pi ( t  t )  P0 ( t )i t  Pi ( t )[1  i t ]
i  1,2,3,.....n
(3.81)
la care se adaugă relaţia:
n
P0 ( t )   Pi ( t )  1 (3.82)
i 1
care rezultă din condiţia de comple-
mentaritate a stărilor echipamentului.
Prin diferenţierea relaţiei (3.81) se
obţine:
Fig. 3.14. Graful asociat unui
echipament cu reînnoire având
structură de tip serie.
dPi ( t )
  i  Pi ( t )  i P0 ( t ) , i  1, n (3.83)
dt

Presupunând că la momentul iniţial echipamentul se află în stare de bună


funcţionare (P0(0)=1) şi utilizând transformata Laplace, din relaţiile (3.82) şi
(3.83) se obţine:
82 Cap. 4. Echipamente tolerante la defectări

n * 1 * n  *
 Pi ( s )   P0 ( s )   i P0 ( s ) (3.84)
i 1 s i 1s  i

de unde rezultă:
* 1
P0 ( s )  (3.85)
 n  
s1   i 
 i 1s   i 

ecuaţie ce reprezintă disponibilitatea echipamentului.

Transformatele Laplace ale probabilităţilor stărilor de defectare sunt:

i
* i * s  i
Pi ( s )  P0 ( s )  (3.86)
s  i  n  
s1   i 
 i 1s   i 

Aceste probabilităţi reprezintă indisponibilitatea echipamentului datorată


elementului i. Valoarea asimptotică a acesteia este dată de:
i
* i
lim ( Pi ( t ))  lim ( sPi ( s ))  (3.87)
t  s 0 n 
1  i
i 1 i

Considerăm acum un echipament cu structură de tip paralel format din două


elemente. În acest caz apare o deosebire esenţială faţă de echipamentul cu
structură serie: reînnoirea elementului defect se poate face în timpul
funcţionării echipamentului, care este asigurată de către celălalt element
aflat în bună stare de funcţionare.
Cap. 4. Echipamente tolerante la defectări 83

Fig. 3.15. Graful asociat


unui echipament cu
structură de tip paralel.

În consecinţă, comportarea echipamentului până la defectare, respectiv


funcţia de fiabilitate, vor fi influenţate de probabilităţile de reînnoire ale
elementelor. Analiza fiabilităţii poate fi efectuată numai cu ajutorul modelului
procesului Markov. Mulţimea stărilor echipamentului este S={0, 1, 2} în care
”0” reprezintă starea în care ambele componente funcţionează, ”1”
reprezintă starea în care funcţionează doar o componentă, iar ”2” reprezintă
starea în care nu funcţionează nici o componentă. Stările ”0” şi ”1” sunt stări
de funcţionare ale echipamentului în ansamblu, iar starea ”2” este stare de
defectare. Se face presupunerea că cele două elemente ale echipamentului
sunt caracterizate de distribuţii exponenţiale ale duratelor de funcţionare şi
reînnoire, cu parametrii  şi respectiv . Probabilităţile stărilor se obţin din
ecuaţiile cu diferenţe finite:

P0 ( t   t )  P0 ( t )[1  2 t ]  P1( t )  t



 (3.88)
P1( t   t )  P0 ( t )  2  t  P1( t )[1  (    ) t ]

Prin diferenţiere se obţine:

 dP0 ( t )
  2P0 ( t )  P1( t )
dt
 dP ( t ) (3.89)
 1
 dt  2P0 ( t )  (    )P1( t )

Pentru rezolvarea sistemului (3.89) se alege ca stare iniţială una dintre stările
de bună funcţionare. Considerând ca stare iniţială starea “1” avem P0(0)=0 şi
P1(0)=1. Aplicând transformata Laplace sistemului (3.89) se obţine:
84 Cap. 4. Echipamente tolerante la defectări

 * *
 ( s  2 )P 0( s )  P 1( s )  0
 * *
(3.90)
 2 P0 ( s )  ( s     )P 1( s )  1

Rezolvând sistemul (3.90) se obţine transformata Laplace a funcţiei de


fiabilitate, care este egală cu probabilitatea ca la momentul t echipamentul să
fie într-o stare de funcţionare.

* * * s  2  
R ( s )  P0 ( s )  P 1( s )  2 2
(3.91)
s  ( 3   )s  2

Din expresia (3.91) se poate obţine imediat media timpului de funcţionare:

 2  
*
m1   R( t )dt  R ( s ) s 0  2
(3.92)
0 2

Considerând acum şi cazul în care echipamentul revine prin reînnoire, din


starea de defectare în starea de bună funcţionare (figura 3.16).

Fig. 3.16. Graful asociat


unui echipament cu
reînnoire având structură
de tip paralel.

Pentru exemplul considerat dacă există doi reparatori, atunci tranziţia din
starea ”2” în starea ”1” se face cu probabilitatea 2 t , întrucât punerea în
funcţiune a oricărui dintre cele două elemente conduce la reluarea
funcţionării echipamentului. Dacă însă există un singur reparator atunci
probabilitatea tranziţiei va fi t . Pentru situaţia din figura 3.16 se obţin
următoarele ecuaţiile cu diferenţe finite:
Cap. 4. Echipamente tolerante la defectări 85

 P0 ( t   t )  P0 ( t )[1  2 t ]  P1( t ) t


 (3.93)
 P1( t   t )  2P0 ( t ) t  [ 1  (    ) t ] P1( t )  P2 ( t ) t

Prin diferenţiere şi ţinând cont de P0 ( t )  P1( t )  P2 ( t )  1, se obţine:

 dP 0( t )
 dt  2P 0( t )  P 1( t )
 (3.94)
 dP 1( t )  ( 2   )P ( t )  (   2  )P ( t )  
 dt 0 1

În continuare se aplică transformata Laplace şi se obţine:

 * *
( s  2 )P 0( s )   P 1( s )  0

 * * s (9.95)
 ( 2   )P 0( s )  ( s    2  )P 1( s ) 
 s

* *
Se calculează apoi P0 ( s ) şi P 1( s ) :

* ( s   )
P 0( s )  (3.96)
2 2 2
s( s  ( 3  2  )s  2  2   )

( s   )( s  2 )
P *1( s )  (3.97)
s( s 2  ( 3  2  )s  22  2   2 )

* *
Prin însumarea P0 ( s ) şi P 1( s ) se obţine transformata Laplace a probabilităţii
ca echipamentul să fie în stare de funcţionare:

* * * ( s   )( s  2   )
R ( s )  P 0( s )  P 1( s )  (3.98)
2 2 2
s( s  ( 3  2  )s  2  2   )
86 Cap. 4. Echipamente tolerante la defectări

În cazul în care cele două elemente ale echipamentului ar avea ratele de


defectare şi de reparare diferite, procesul Markov ar fi descris de un graf de
tipul celui prezentat în figura 3.17.

Fig.3.17. Graful Markov asociat unui


echipament de tip paralel format din
două componente distincte.

3.4. Modelul arborelui de defectare

Metoda arborilor de defectare pentru studiul fiabilităţii previzionale a


echipamentelor complexe, porneşte de la ideea că procesul de defectare poate
fi cuantificat la nivelul structural astfel încât orice defecţiune a echipamentului
este rezultatul unei secvenţe cuantificate de stări ale procesului de defectare.
Nivelul de cuantificare este ales de analist, conform scopului urmărit şi
preciziei dorite, putându-se merge până la nivelul componentelor, rezultatele
obţinute fiind cu atât mai apropiate de realitate cu cât nivelul de cuantificare
va fi mai detaliat.
Cap. 4. Echipamente tolerante la defectări 87

În figura 3.18 se prezintă schema


principială a unui arbore de
defectare, care conţine o serie de
evenimente primare independente,
interconectate prin intermediul unei
structuri logice booleene, care indică
multitudinea posibilităţilor în care
aceste evenimente se pot combina
pentru a genera în final avaria
echipamentului studiat. Din punct de
vedere structural, arborele de
defectare utilizează următoarele
Fig.3.18. Modelul arborelui de
concepte: defectare
 Elementele primare – reprezintă componentele sau blocurile care
stau la nivelul de bază al cuantificării defectării (avariei)
echipamentului;
 Defecţiunile primare – reprezintă defectele elementelor primare;
 Evenimentul critic – reprezintă starea de defect a echipamentului;
 Modul de defectare – reprezintă setul de elemente defecte simultan
care scot din funcţiune echipamentul;
 Modul minim de defectare – reprezintă setul cel mai mic de elemente
primare care fiind defecte simultan, conduc la defectarea
echipamentului;
 Nivelul ierarhic – reprezintă totalitatea elementelor care sunt
echivalente structural şi care ocupă poziţii echivalente în structura
arborelui de defectare.
Metoda are la bază logica binară, în mod formal o funcţie a echipamentului
cere este asimilată unei funcţii binare, ale cărei variabile sunt defecţiunile
primare şi care poate fi sintetizată cu elemente ŞI, SAU, NU.
Pe baza analizei prin metoda arborelui de defectare, se pot obţine fie
probabilitatea de defectare, fie rata de defectare:
a) Evaluarea probabilităţii de defectare foloseşte proprietăţile porţilor
logice ŞI, SAU, NU (figura 3.19).
88 Cap. 4. Echipamente tolerante la defectări

Fig. 3.19. Porţi logice utilizate în


construcţia arborelui de defectare.

Astfel, la ieşirea celor trei porţi logice, probabilitatea de a avea un defect


este:
- ieşirea porţii ŞI = probabilitatea (A defect şi B defect) =
P A  PB ; cazul A si B independente
= P A  B   
P A / B   PB   P A  PB / A; cazul evenimentelor dependente
(3.99)
- ieşirea porţii SAU = probabilitatea (A sau B defect) = =
P A  PB   P A  B ; cazul evenimentelor dependente
P A  B   
P A  PB   P A  PB ; cazul evenimentelor independente
(3.100)
- ieşirea porţii NU =
= probabilitatea (A să nu fie defect) =P( A )= 1- P(A). (3.101)
b) Evaluarea intensităţii de defectare a echipamentului, ( E ), se face pe baza
ipotezei că defectările elementelor componente sunt evenimente independente
şi legea de defectare este de tip exponenţial (z(t) =  =ct.). Pentru a stabili
valoarea ratei de defectare a echipamentului se porneşte de la următoarele
considerente:
- probabilitatea ca elementul A să se defecteze în intervalul (0,t) este
P(A)=FA (t);
- probabilitatea ca elementul B să se defecteze în intervalul (0,t) este
P(B)=FB(t).
În aceste condiţii, la ieşirea unei porţi SAU se obţine probabilitatea ca
echipamentul să se defecteze în intervalul (0,t) din cauza elementului A, sau a
elementului B:
P(A  B)=P(A)+P(B) -P(A)P(B)=FA(t)+FB(t)-FA(t)FB(t)= FE(t) (3.102)
Se obţine în continuare funcţia de fiabilitate a echipamentului:
RE(t)=1- FE(t)=1- FA(t)- FB(t)+ FA(t) FB(t) => (3.103)
RE(t)= 1  FA (t)1  FB (t)  RA(t)RB(t) (3.104)
Cum: RA(t)= exp   A t  şi RB(t)= exp   B t  se obţine pentru fiabilitatea
echipamentului expresia următoare:
Cap. 4. Echipamente tolerante la defectări 89

RE(t)= exp  A t   B t  (3.105)


De unde se obţine la ieşirea porţii logice SAU :
E   A  B (3.106)
Pentru a determina rata de defectare la ieşirea porţii logice ŞI, se consideră N
elemente şi se reia corespunzător raţionamentul de mai sus:
N
 i  i  1
E  i 1N (3.107)
 i  1
i 1
unde:
1
i  (3.108)
1  exp  i t 
Exemplu: Se consideră funcţia de structură S=(x1, x2, …x6) dată de relaţia
(3.41) şi se doreşte obţinerea unei relaţii dintre probabilitatea de defectare a
echipamentului şi probabilităţile de defectare ale componentelor sale:
FE=(F1, F2, … F6). Funcţia de structură corespunzătoare modelului arborelui
de defectare se poate obţine direct din funcţia de structură corespunzătoare
modelului logic (3.41), ţinând seama de raportul de dualitate dintre aceste
două modele:

S=x1  x2 x6  x4 x5  x2 x3 x4  x3 x5 x6=

=x1(x2 x6)(x4 x5)(x2 x3 x4)(x3 x5x6)

SL=x1[ x2 x5  x4 x6  x2 x3 x4  x3 x5 x6 ] (3.109)

Arborele de defectare este următorul:


90 Cap. 4. Echipamente tolerante la defectări

Fig. 3.20. Arborele de defectare pentru exemplul din figura 3.7.

Când o intrare devine egală cu “1” se spune că s-a produs un eveniment


primar, iar când ieşirea devine egală cu “1” se produce evenimentul ”TOP”
(defectarea echipamentului).

CAPITOLUL 4

ECHIPAMENTE TOLERANTE LA DEFECTĂRI

4.1. Introducere
Cap. 4. Echipamente tolerante la defectări 91

Dezvoltarea tehnologică din ultimele decenii a condus la apariţia unor


domenii de activitate ce necesită echipamente care să nu se defecteze pe
durata misiunii (centrale nucleare, sateliţi de telecomunicaţii, transport
aerian şi cosmic etc). În unele cazuri, starea de defectare poate avea
consecinţe catastrofale, iar în altele, odată cu prima defectare, se termină şi
durata de viaţă a echipamentului, datorită faptului că intervenţia operatorului
uman nu este posibilă (ex. sateliţii de telecomunicaţii, sondele spaţiale etc).
Rezolvarea problemei defectărilor în aceste cazuri a condus la elaborarea
unor structuri de echipamente tolerante la defectări. Un echipament tolerant
la defectări este acel echipament care îşi poate continua execuţia corectă a
funcţiilor sale de intrare / ieşire, fără o intervenţie din exterior, în prezenţa
unei anumite mulţimi de defectări ce apar în timpul funcţionării sale.

Prin execuţie corectă se înţelege că rezultatele obţinute (mărimile de ieşire)


nu sunt afectate de erori, iar timpul de execuţie nu depăşeşte o limită
precizată.

O defectare ce apare în timpul funcţionării operaţionale a unui echipament


este o schimbare în valoarea uneia sau a mai multor variabile de ieşire sau de
stare ce caracterizează echipamentul, defectarea fiind consecinţa imediată a
evenimentului “defect”. Evenimentul fizic “defect” poate fi o imperfecţiune
fizică a unui element al echipamentului, care conduce la o funcţionare
permanent, temporar sau intermitent eronată sau poate fi un factor extern
(variaţii necontrolabile ale parametrilor mediului ambiant: temperatură,
umiditate, vibraţii, şocuri etc; perturbaţii prin câmp electric sau
electromagnetic etc.) care pot conduce la nefuncţionarea echipamentului.
Defectările se clasifică după durată în permanente sau temporare, iar după
extindere pot fi singulare sau multiple.
Defectările permanente sunt cauzate de defectele permanente ale
componentelor echipamentului. Protecţia împotriva acestor defectări se
poate face fie prin utilizarea de componente de rezervă care vor fi puse în
92 Cap. 4. Echipamente tolerante la defectări

funcţiune în locul celor defecte, fie prin măsuri de reconfigurare în urma


cărora componenta defectă este izolată, iar funcţiile ei sunt preluate de altă
componentă aflată în rezervă.

Defectele temporare sunt de durată limitată, fiind cauzate de nefuncţionări


temporare ale componentelor sau de interferenţe externe, echipamentul
revenind la parametrii normali de funcţionare fără o intervenţie externă.

Defectările pseudo-temporare sunt defectări determinate de defectele


permanente ale componentelor echipamentului, pentru a căror manifestare
este necesară o anumită combinaţie a valorilor semnalelor de intrare.

Defectările singulare (locale) afectează o singură variabilă corespunzătoare


unui semnal de ieşire sau unei stări interne, în timp ce defectările multiple
(distribuite) afectează mai multe variabile de ieşire sau de stare ale
echipamentului.

Eroarea este un simptom al unui defect, fiind cauzată de prezenţa unei


defectări. Se consideră că în momentul utilizării unui echipament au fost deja
eliminate erorile de proiectare şi de fabricaţie. Eliminarea acestor
erori/defecte se realizează în timpul testelor de laborator efectuate în
vederea omologării echipamentului respectiv.

O interpretare mai generală dată toleranţei la defectări presupune ca aceasta


să includă şi totalitatea erorilor de proiectare, nedetectate înainte de
utilizarea operaţională a echipamentului. Prin tolerarea defectelor nu se
înţelege o amânare a defectării echipamentului, ci posibilitatea localizării
automate a elementelor defecte şi a dezactivării elementului afectat de erori,
Cap. 4. Echipamente tolerante la defectări 93

echipamentul continuând să funcţioneze corect pe baza elementelor


redundante.

Defectările de proiectare sunt de regulă consecinţa unor specificaţii de


proiectare incomplete sau incorecte şi se pot manifesta atât pe partea de
hardware cât şi pe partea de software a unui echipament. Toleranţa la
defectări este un aspect esenţial al realizării echipamentelor fiabile şi, în
sensul cel mai general, înseamnă execuţia corectă a unui set de operaţii
specificate în prezenţa unui anumit număr de defecte.

Pentru ca echipamentul să fie considerat tolerant la defectări este necesar ca


dezactivarea elementului defect să se execute automat de către
echipamentul în cauză.

Atunci când se utilizează forme ale redundanţei de tip static pentru a


implementa toleranţa la defectări a unui echipament, se spune că
echipamentul are o toleranţă statică la defectări, iar când se utilizează
procedee de detecţie a defectărilor elementelor echipamentului urmate de
înlocuirea modului defect cu unul de rezervă, sau se realizează reconfigurarea
automată a acestuia, echipamentul va fi cu toleranţă dinamică la defectări.

Pentru implementarea toleranţei la defectări a echipamentelor se pot utiliza


următoarele trei tipuri de strategii:

 strategii bazate pe diagnosticarea defectărilor şi înlocuirea elementelor


defecte;
 strategii bazate pe mascarea defectărilor;
 strategii hibride bazate pe mascarea defectărilor, diagnosticarea şi
înlocuirea elementelor defecte.
94 Cap. 4. Echipamente tolerante la defectări

În toate strategiile intervine “redundanţa”: fie la nivel hardware sau software,


fie o redundanţă a funcţiilor echipamentului. Metodologia de implementare
a toleranţei la defectări implică parcurgerea următoarelor etape:
 specificarea cerinţelor de fiabilitate pentru echipament;
 selectarea metodelor de diagnosticare a defectărilor şi a algoritmilor
de mascare a defectărilor sau de reconfigurare a echipamentului;
 evaluarea toleranţei la defectări;
 calculul performanţelor de fiabilitate;
 determinarea avantajelor obţinute din punct de vedere economic.

4.2. Algoritmi de detecţie şi diagnosticare a defectărilor

Detecţia şi diagnosticarea defectărilor constituie punctul de pornire a oricărei


implementări a toleranţei la defectări, atunci când aceasta este realizată prin
reconfigurarea echipamentului. Algoritmul de diagnosticare a defectărilor
conţine de regulă şi toate acţiunile de localizare a acestora.

Într-un algoritm de diagnosticare a defectărilor se disting mai multe abordări


[2]:
 Testarea iniţială, care are loc înaintea utilizării normale a
echipamentului. În această etapă se pot identifica erorile de proiectare
sau de fabricaţie, elementele defecte (hardware şi software).
 Testarea ”on-line” ce are loc simultan cu funcţionarea normală a
echipamentului. Aceasta se poate realiza fie cu mijloace hardware fie
cu mijloace software. Se pot utiliza circuite autotestabile, coduri
detectoare de erori, module redundante etc. Această testare are
avantajul că detecţia sau diagnosticarea defectării se poate face înainte
de a se produce pierderi importante în echipament.
Cap. 4. Echipamente tolerante la defectări 95

 Testarea echipamentelor în vederea detecţiei sau diagnosticării


defectărilor atunci când operarea normală este întreruptă. Această
metodă de testare se realizează prin programe speciale de test sau prin
execuţii repetate ale aceleiaşi secvenţe, pentru a se compara
rezultatele obţinute. Această testare se desfăşoară în timpul operaţiilor
de mentenanţă preventivă, sau când s-a constatat defectarea
echipamentului.

 Testarea modulelor redundante constă în verificarea dacă modulele de


rezervă sunt în bună stare de funcţionare. Se pot utiliza metode on-line
(pentru echipamentele autotestabile) sau metode off-line ce utilizează
programe de diagnoză, în funcţie de tipul redundanţei folosite.

4.2.1. Algoritmi de reconfigurare a echipamentelor

Implementarea toleranţei la defectări a echipamentelor utilizând tehnici de


reconfigurare presupune în primul rând diagnosticarea defectelor. Toate
acţiunile întreprinse din momentul diagnosticării defectului şi până la
repunerea în funcţiune, la parametri nominali, constituie algoritmul
reconfigurării echipamentului [2].

Metodele de reconfigurare se pot clasifica în funcţie de starea echipamentului


după reconfigurare astfel:

 Metode ce realizează o reconfigurare totală a echipamentului, atunci


când echipamentul este adus în starea anterioară defectării prin
înlocuirea elementelor defecte.

 Metode ce realizează o reconfigurare parţială, adică aduc


echipamentul într-o stare de funcţionare, dar cu o restrângere a
96 Cap. 4. Echipamente tolerante la defectări

funcţiilor sale anterioare. Aceasta se realizează prin înlăturarea


elementului defectat şi prin preluarea funcţiilor sale de către alte
elemente din structura echipamentului.

 Metode de deconectare automată a echipamentului. Acestea au drept


scop evitarea unor pierderi sau avarii mai mari decât cele produse prin
defectarea elementelor în cauză.

Algoritmii de reconfigurare a echipamentelor pot fi implementaţi atât la nivel


hardware cât şi la nivel software

4.2.2. Algoritmi de mascare a defectărilor

Aceşti algoritmi se implementează utilizând structuri redundante statice


(logică majoritară, logică cuadruplă, logică cablată etc). În cazul acestor
algoritmi defectările componentelor nu sunt prezente la ieşirea
echipamentului, decât numai atunci când ele afectează în totalitate, sau în
majoritate elementele de rezervă.

Elementele de rezervă sunt conectate permanent, astfel încât mascarea


defectărilor se realizează instantaneu. Folosirea tehnicilor de mascare a
defectărilor se bazează pe presupunerea că defectările modulelor de rezervă
sunt evenimente independente.

4.3. Structuri redundante pentru implementarea


toleranţei la defectări
Cap. 4. Echipamente tolerante la defectări 97

Teoria redundanţei foloseşte câteva “teoreme-limită” care ghidează


proiectarea echipamentelor cu structură redundantă [2].

 Redundanţa este o metodă comodă de creştere a fiabilităţii


echipamentelor dacă defectările elementelor din componenţa
echipamentului sunt evenimente independente.

 Probabilitatea de defectare a unui echipament cu structură


redundantă, scade exponenţial cu creşterea costului alocat
echipamentului.

Implementarea redundanţei se poate face prin tehnici de tip static, numite şi


tehnici de “mascare” a defectărilor şi prin tehnici de tip dinamic sau de
comutaţie.
Realizarea echipamentele tolerante la defectări utilizând tehnicile de tip static
prezintă următoarele avantaje:

 corecţia defectării se face instantaneu;


 nu este necesară diagnosticarea defectărilor;
 trecerea pe la proiectarea unui echipament fără redundanţe la
proiectarea unui echipament cu redundanţe este relativ simplă.

Redundanţa de tip dinamic implică existenţa în componenţa echipamentului


a mai multor module identice, din care doar o parte sunt operaţionale,
celelalte fiind în aşteptare pentru a fi comutate în momentul diagnosticării
unui defect. Acest tip de redundanţă este utilizat pentru a realiza
echipamente autoreparabile, când comutarea rezervelor se face în mod
automat, sau în realizarea echipamentelor reconfigurabile.
98 Cap. 4. Echipamente tolerante la defectări

Redundanţa de tip dinamic presupune îndeplinirea condiţiilor următoare


(uneori considerate dezavantaje):

 echipamentul trebuie să tolereze întreruperile şi să poată executa o


reluare a operaţiilor pentru a corecta erorile;

 se presupune existenţa unui comutator sigur care să conecteze


rezervele sau să execute reconfigurarea în caz de defectare a unui
element;

 diagnoza se desfăşoară în timpul funcţionării normale a


echipamentului, ceea ce presupune utilizarea unor metode şi tehnici
de diagnosticare mai complicate.

Avantajele utilizării redundanţei de tip dinamic sunt următoarele:

 se alimentează electric numai o rezervă a echipamentului;

 comutatorul realizează o izolare a defectului;

 numărul de rezerve poate fi ajustat fără a fi nevoie de modificarea


proiectării echipamentului;

 nu apar probleme de cuplare intrare / ieşire a modulelor redundante.

Implementarea redundanţei, în scopul alegerii schemei convenabile,


presupune precizarea apriorică a nivelului la care aceasta trebuie aplicată:
componentă, modul funcţional sau la nivelul întregului echipament.

În continuare sunt prezentate exemple de structuri redundante statice de tip


individual şi global rezultate prin multiplicare (figura 4.1):
Cap. 4. Echipamente tolerante la defectări 99

a). Echipament cu structură neredundantă

b). Echipament cu redundanţă la nivel individual

c). Echipament cu redundanţă la nivel global

Fig. 4.1. Structuri redundante statice realizate prin multiplicare

Modul de conectare fizică a elementelor de rezervă poate să coincidă sau nu


cu modelul logic de fiabilitate. Un exemplu de aplicare a redundanţei la nivel
global este prezentat în figura 4.2.
100 Cap. 4. Echipamente tolerante la defectări

Fig. 4.2. Echipament cu redundanţă la nivel global

Echipamentul iniţial format din unităţile A, B, a fost dublat, ambele


echipamente lucrând on-line şi executând sarcini identice pentru a putea
compara ieşirile. Echipamentul va fi în bună stare de funcţionare chiar dacă
unul dintre module se va defecta, identificarea şi izolarea elementului defect
urmând a fi făcută de un modul suplimentar de verificare a funcţionării
corecte.

Dacă se consideră ipotezele următoare:


 modulele funcţionale sunt nereparabile;
 circuitele care asigură conectarea modulelor sunt perfecte;
 defectările elementelor funcţionale sunt independente şi staţionare,
atunci se pot scrie în continuare expresiile funcţiilor de fiabilitate pentru
structurile redundante de tip individual şi global (figura 4.1). Pentru prima
structură avem:

n

RSI t    1  1  Ri t ki  (4.1)
i 1

iar pentru structura redundantă la nivel global:


Cap. 4. Echipamente tolerante la defectări 101

K
 n 
RSG t   1  1   Ri ( t ) (4.2)
 i 1 

unde Ri t  este funcţia de fiabilitate a elementului i, iar ki - 1 , numărul de


rezerve utilizate pentru elementul i.

Pentru acelaşi număr de rezerve, funcţia de fiabilitate a structurii redundante


individuale are o valoare mai mare decât funcţia de fiabilitate a structurii
redundante globale, ceea ce rezultă uşor din analiza calitativă a celor două
structuri. În cazul structurii redundante la nivel global, defectarea unui
element oarecare scoate din funcţiune şi celelalte n-1 elemente aflate în serie
cu el, ceea ce nu se constată la structura redundantă individuală, şansele de
bună funcţionare fiind mai mari pentru structura redundantă de tip individual.

Aplicarea redundanţei individuale sau globale se poate face relativ simplu în


cazul echipamentelor de tip analogic.

În cazul echipamentelor digitale aplicarea de redundanţe trebuie făcută luând


măsuri speciale, în caz contrar putându-se observa o înrăutăţire a
performanţelor de fiabilitate.

Exemplu: Se consideră un circuit basculant monostabil (CBM) căruia i se aplică


redundanţa prin multiplicare, obţinând schema din figura 4.3.

Dacă unul dintre circuite se defectează astfel încât nu va da impuls de ieşire,


schema funcţionează în continuare în mod normal, iar dacă circuitul defect va
genera impulsuri cu durată incorectă (mai mare decât constanta de timp a
102 Cap. 4. Echipamente tolerante la defectări

CBM) sau va funcţiona ca astabil, funcţionarea echipamentului va fi eronată.


Rezultă de aici că este necesar să se cunoască toate modurile posibile de
defectare ale echipamentului şi să se ia măsuri speciale de protecţie, specifice
fiecărui caz în parte.

Fig. 4.3. Circuit basculant monostabil cu structură redundantă statică

Trebuie precizat faptul că dublarea componentelor unui echipament nu


conduce întotdeauna la o creştere a fiabilităţii acestuia. Se poate exemplifica
acest lucru cu ajutorul echipamentelor autotestabile realizate prin dublare
(figura 4.4).
Cap. 4. Echipamente tolerante la defectări 49

Fig.4.4. Echipament cu structură autotestabilă

Comparatorul evidenţiază defectarea unuia din cele două module identice


prin formarea semnalului de STOP. Prezenţa unui defect în echipament este
sesizată numai dacă cele două module nu sunt afectate simultan de aceleaşi
erori (defecte).
50 Cap. 1. Introducere

4.3.1. Structuri redundante statice de tip individual şi global rezultate


prin multiplicare

Pentru realizarea unei structuri tolerante la defectări, pornind de la


echipamentul autotestabil din figura 4.4 se poate utiliza structura din figura
4.5. Defectarea unui modul M nu va mai produce apariţia semnalului de
"STOP", informaţia eronată fiind blocată spre ieşire de una din porţile G1 .
Semnalul de ieşire va fi dat doar de grupul de module aflate în bună stare de
funcţionare.

În cazul echipamentului prezentat se poate evidenţia o defectare doar dacă


se defectează în acelaşi mod sau în moduri diferite două module din cele două
grupe. Dacă se defectează cele două unităţi ale unei grupe, iar semnalele de
ieşire ale lor sunt identice şi eronate, comparatorul nu va putea bloca trecerea
semnalului eronat spre ieşire [2].

Fig.4.5. Structură tolerantă la defectări


Cap. 1. Introducere 51

Circuitele introduse suplimentar, C1 ,C 2 ,G1 3 cu o structură simplă trebuie


să aibă o fiabilitate foarte ridicată, astfel încât echipamentul obţinut să fie de
înaltă fiabilitate.

4.3.1.1. Structura redundantă logica majoritară


NMR –N Modular Redundancy

Această structură este implementată prin divizarea echipamentului


neredundant în module funcţionale, multiplicarea acestor module de N ori (
N  2  n - 1 , n=2, 3, ...) şi introducerea între aceste module funcţionale a unor
module de decizie numite ”votere”, care funcţionează după o logică
majoritară.

Structura cea mai utilizată şi cea mai simplă este structura redundantă logică
majoritară de tip ”2 din 3”, cunoscută în literatura de specialitate sub numele
de TMR (Triple Modular Redundancy), prezentată în figura 4.6.

Modulele M 1 , M 2 , M 3 sunt identice din punct de vedere fizic şi funcţional,


având la intrare semnale identice I1 , I 2 , I 3 . Modulul de decizie format de
voterul V, urmăreşte semnalele de ieşire E1 , E 2 , E3 ale modulelor, ieşirea Eo
fiind dată prin regula majorităţii. Dacă E1  E 2  E3 atunci Eo va fi egal cu
acestea, iar pentru două semnale Ei , i  1,2,3 egale şi al treilea diferit,
semnalul de ieşire Eo va fi dat de cele două semnale identice.
52 Cap. 1. Introducere

Fig. 4.6. Structura redundantă logică majoritară de tip ”2 din 3”.

Structura prezentată maschează defectarea unuia dintre modulele


funcţionale M, dar nu poate corecta mai mult de o eroare. Pentru a corecta
două sau mai multe erori (defectări) este necesar să se crească gradul
redundanţei (”3 din 5”, ”4 din 7” etc).

Structura TMR asigură buna funcţionare a echipamentului atât timp cât cel
puţin două module funcţionează corect. Generalizând pentru structura logică
majoritară n din 2  n - 1 , se poate preciza că un astfel de echipament
funcţionează corect atât timp cât este asigurată buna funcţionare a oricărei
combinaţii de module cuprinsă între n şi 2  n - 1 , celelalte module putând fi
defecte. Este necesar, în plus, ca blocul de decizie (voterul) să fie în bună stare
de funcţionare. Funcţia de fiabilitate pentru un astfel de echipament este dată
de relaţia următoare:

2n 1 j 
RTMR t     C2n 1  Rt  j  1  Rt 2n 1 j   RV t  (4.3)
 j  n 

unde Rt  este funcţia de fiabilitate a unui modul funcţional, iar RV t  funcţia
de fiabilitate a voterului. Întrucât la nivelul voterului nu este tolerată nici o
Cap. 1. Introducere 53

defectare, pentru îmbunătăţirea performanţelor de fiabilitate se poate face o


multiplicare a voterelor ca în figura 4.7.

Structura NMR se poate aplica global echipamentului sau la nivel de


subsisteme / module funcţionale.

O problemă deosebită în proiectarea echipamentelor ca structură


redundantă logică majoritară este dimensiunea modulelor cărora li se aplică
redundanţa, aceasta putând varia de la un simplu circuit cu câteva
componente, până la întregul echipament. Complexitatea blocului de decizie
(voter) este funcţie de nivelul la care se aplică redundanţa.

Fig.4.7.Structură redundantă cu
multiplicarea voterelor.

O altă modalitate de creştere a fiabilităţii structurilor de tip TMR constă în


introducerea unor detectoare de defecte ale modulelor, ceea ce permite
identificarea automată a modulului defect şi apoi înlocuirea acestuia cu un alt
modul în stare de bună funcţionare, echipamentul fiind readus la
performanţele iniţiale (figura 4.8).
54 Cap. 1. Introducere

Figura 4.8. Structură TMR autotestabilă

O astfel de abordare este utilă pentru echipamentele ce permit acţiuni de


mentenanţă, oferind o disponibilitate foarte ridicată dacă remedierea
primului defect se face în timp util, adică înaintea producerii unui nou defect
care ar conduce la defectarea echipamentului.

În cazul echipamentelor de calcul reparabile, cu redundanţă de tip logică


majoritară, redundanţa NMR se poate aplica la nivelul întregului calculator,
voterul fiind introdus în sistemul de comunicaţii între calculatoare. O altă
posibilitate constă în aplicarea redundanţei la nivel de module mici -
procesoare, unităţi de memorie, unităţi ce pot fi reparate individual, în acest
caz voterul fiind situat pe traseul magistralelor interne ale echipamentului de
calcul.
Trebuie precizat faptul că propagarea semnalelor prin diverse circuite se
poate face cu viteze diferite. De aici rezultă necesitatea ca voterul să fie
proiectat astfel încât să introducă o întârziere a răspunsului, sau, pentru a
alinia la intrare toate semnalele, de exemplu, o perioada de tact. Acest lucru
conduce la introducerea unei întârzieri a răspunsului echipamentului de
calcul, ceea ce determină o micşorare a performanţelor.
Cap. 1. Introducere 55

Modulele de decizie sunt implementate de regulă, hardware. Pentru a se


evita întârzierile introduse de diferitele module se poate folosi un timp de
referinţă comun, adică utilizarea unui generator de tact pentru toate
elementele structurii. Acest lucru influenţează performanţele de fiabilitate,
întrucât generatorul de tact devine punctul slab al structurii. Problema se
poate rezolva utilizând generatoare de tact redundante. În figura 4.9 este
prezentată o structură de echipament de calcul tolerant la defectări [2]:

Fig. 4.9. Echipament de calcul tolerant la defectări

Blocul de decizie este format din două părţi: voterul pentru sincronizare şi
voterul de date. Voterul pentru date furnizează decizia asupra datelor
prezente pe trei magistrale de date, iar voterul de sincronizare determină
decizia asupra semnalelor de control. Structura unui voter de sincronizare
este prezentată în figura 4.10.
56 Cap. 1. Introducere

Fig. 4.10. Structura unui voter de sincronizare

4.3.1.2. Structuri redundante statice cu logică cvadruplă

Acest tip de structură se aplică echipamentelor construite cu circuite logice şi


constă în multiplicarea de patru ori a circuitelor logice, conectate astfel încât
semnalele eronate sunt mixate cu semnalele corecte provenite de la circuitele
de rezervă, realizându-se astfel mascarea unui defect. Metoda se bazează pe
proprietăţile unor echipamente cu circuite logice de a masca intrinsec unele
defectări de blocare în ”1” sau ”0”.

Analizând schema din figura 4.11 se constată că o eroare la ieşirea porţii SI 1


se va propaga la ieşirea porţii SAU dacă, combinaţiile semnalelor la intrările
porţilor SI 1 , SI 2 nu sunt toate egale cu ”1”.

Fig. 4.11. Circuit logic neredundant


care maschează unele defectări.

Dacă intrările sunt la ”1” logic, atunci poarta SI 2 maschează defectarea porţii
SI 1 , semnalul de la ieşirea porţii SAU apărând corect. Prin dublarea porţilor
într-o reţea cu astfel de porţi logice, după modelul din figura 4.11, se obţine
un echipament care tolerează defectările (figura 4.12). Eroarea apăruta la
Cap. 1. Introducere 57

ieşirea porţii SI 1 este corectată de poarta SAU prin mixarea semnalului eronat
cu semnalul corect dat de poarta SI 2 . Circuitul redundant cu logică cvadruplă
este prezentat în figura 4.13.

Fig. 4.12. Circuit logic


redundant.

Fig. 4.13. Structură redundantă logică cvadruplă.


Erorile apărute la nivelul 1 sunt corectate instantaneu de logica circuitului la
nivelul 2 pentru semnale ”1” la intrare sau la nivelul 3 pentru semnale ”0” la
intrările porţilor SI 1 ... SI 4 .

4.3.2. Structuri redundante dinamice

Aceste structuri redundante utilizează mai multe module identice din punct
de vedere funcţional. Funcţionarea echipamentului este asigurată utilizând
numărul minim de module funcţionale, celelalte module fiind în rezervă, dar
58 Cap. 1. Introducere

urmând a fi conectate în structura echipamentului atunci când unul din


modulele active se va defecta. Structurile de acest tip se mai numesc şi
structuri redundante de comutaţie.

Înlocuirea modulului defect se face în mod automat cu unul de rezervă,


decizia fiind luată de către un bloc de supraveghere care va comanda
elementele de comutaţie după ce va identifica o defectare într-unul dintre
modulele active. Prin înlocuirea automată a elementului defect cu unul bun,
structura redundantă dinamică realizează un echipament autoreparabil.
Acest tip de structură este indicat pentru echipamentele cu misiuni de lungă
durată şi la care intervenţia operatorului uman pentru reparare nu este
posibilă/permisă (ex. sateliţi de telecomunicaţii, relee de transmisiuni izolate
etc).

Echipamentele reconfigurabile, adică acelea care îşi modifică structura la


apariţia unei defectări, astfel încât echipamentul să poată funcţiona în
continuare dar cu o capacitate de operare redusă, prezintă tot o structură
redundantă de tip dinamic (Exemplu: un sistem multiprocesor).

Cele două metode presupun existenţa unei proceduri automate de diagnoză,


care va identifica o defectare în structura echipamentului urmată de
localizarea acesteia la nivelul unui modul înlocuibil. De asemenea, este
necesar să existe un comutator automat, care realizează înlocuirea modului
defect cu unul în bună stare de funcţionare sau efectuează reconfigurarea
echipamentului.

Problema de bază pentru un echipament cu structură redundantă de


comutaţie, constă în revenirea acestuia la starea de bună funcţionare.
Aceasta presupune detecţia defectării şi prevenirea propagării datelor
eronate peste anumite limite geometrice şi/sau controlul informaţiilor
Cap. 1. Introducere 59

obţinute, autorepararea hardware-ului, dacă este necesar, reconstituirea


informaţiei afectate de eroare, reluarea funcţionării la parametri nominali a
echipamentului. Această structură se poate aplica cu uşurinţă
echipamentelor organizate modular. Modulele trebuie alese astfel încât să se
poată diagnostica cu uşurinţă modulul defect.

În figura 4.14 este prezentat un echipament de calcul cu structură redundantă


de comutaţie. Echipamentul format din unităţile Procesor 1, Memorie 1
funcţionează on-line iar cel format din Procesor 2, Memorie 2 funcţionează
off-line. Utilizând aceleaşi resurse se poate realiza un echipament
reconfigurabil, ca în figura 4.15. Iniţial toate cele patru unităţi funcţionează
on-line, iar când una din unităţile Procesor i sau Memorie i (i=1,2) se
defectează, echipamentul îşi continuă funcţionarea fără unitatea defectă,
reconfigurându-se într-un echipament cu performanţe mai reduse, însă
superioare unui echipament format dintr-un procesor şi o memorie.
Echipamentul se defectează dacă se defectează simultan două unităţi
Procesor i sau Memorie i (i=1,2). Acest tip de echipament necesită un software
şi un hardware complexe, dar prezintă performanţe de fiabilitate ridicate.

Fig. 4.14. Structură redundantă dinamică la nivel de echipament


60 Cap. 1. Introducere

Fig. 4.15. Structură redundantă dinamică la nivel de modul.


4.3.2.1. Structuri redundante hibride

Aceste structuri îmbină caracteristicile structurilor redundante cu logică


majoritară şi cele ale structurilor de comutaţie. De la structura redundantă
logică majoritară se preia mascarea instantanee a defectărilor, iar de la
structura redundantă de comutaţie sunt preluate funcţiile de diagnosticare
automată a defectărilor şi de înlocuire a modului defect cu unul de rezervă.
Schema reprezentativă a unei structuri de acest tip este prezentată în figura
4.16.

Structura are la bază un nucleu de 2n-1, n=2, 3, ... module funcţionale


identice, conectate prin intermediul unei reţele de interconectare pentru a
forma o structură logică majoritară de tip n din 2n-1 şi un număr de r module
de rezervă care urmează a fi conectate în momentul detecţiei unor defecţiuni
la cele 2n-1 module funcţionale.
Cap. 1. Introducere 61

Fig. 4.16. Structură redundantă hibridă

Detectorul de eroare compară ieşirea voterului cu ieşirile celor 2n-1 module


identice ale nucleului, evidenţiind defectarea unui modul. Reţeaua de
interconectare este astfel realizată încât deconectează modulul defect,
introducând în locul acestuia o rezervă, atunci când una din cele 2n-1 ieşiri
testate este eronată (este diferită de ieşirea voterului).

Această structură poate avea o fiabilitate foarte ridicată dacă echipamentul


de interconectare, voterul şi detectorul de eroare sunt foarte fiabile. Aceasta
implică necesitatea implementării acestor componente utilizând structuri cât
mai simple şi cât mai fiabile.

4.3.2.2. Structuri redundante pentru interconexiunile


unui echipament
62 Cap. 1. Introducere

Pentru realizarea unui echipament de înaltă fiabilitate cu structură tolerantă


la defectări, ale cărui elemente sunt protejate la apariţia defectărilor prin
tehnici de redundanţă, este necesar ca şi interconexiunile dintre elementele
echipamentului să admită o toleranţă la defectările posibile, chiar dacă, de
regulă, ele sunt considerate mult mai fiabile decât celelalte elemente ale
echipamentului. Acest lucru este în particular necesar pentru echipamentele
care utilizează o magistrală (bus) comună de date între modulele sale [2].

Se pot distinge trei tipuri diferite, dar complementare, de structuri


redundante ce pot fi utilizate în cazul magistralelor de date:

 Structuri redundante de tip static, când informaţia redundantă rezultată


prin utilizarea codurilor detectoare şi corectoare de erori este transmisă
pe linii de date redundante. Redundanţa apare ca intrinsecă, iar
defectările sunt mascate prin utilizarea tehnicilor de corecţie a erorilor.

 Structuri redundante de tip dinamic, care necesită utilizarea unor


circuite de detecţie a defectărilor pe linie, evidenţiind liniile defecte şi
înlocuindu-le cu linii de rezervă, cu ajutorul unor circuite de comutaţie
specifice. Se obţine astfel autorepararea sau reconfigurarea
echipamentului în vederea tolerării defectărilor.

 Structura redundantă distribuită, care este o redundanţă topologică


intrinsecă a sistemului de linii de informaţie, permiţând o tolerare
perfectă a defectărilor prin utilizarea unor rute alternante. Totuşi,
aceasta conduce la o oarecare reducere a performanţelor de operare
ale echipamentului, prin introducerea unor întârzieri în propagarea
informaţiilor.
Cap. 1. Introducere 63

Primele două structuri sunt comune cu structurile redundante aplicate


modulelor funcţionale, iar a treia este tipică pentru sistemele de
interconectare a echipamentelor/modulelor.

Exemplu: Structură redundantă dinamică aplicată BUS-urilor de date [2].

O abordare posibilă pentru implementarea acestei structuri redundante este


considerarea celor l linii de informaţie a unui bus de date, ca l module
funcţionale, cărora li se aplică tehnicile clasice de redundanţă pentru
protecţie la defectări. Această abordare este incomodă din cauza numărului
mare de linii cerute. Dacă se prevăd k linii de rezervă şi se cere ca fiecare linie
activă să fie înlocuită de oricare dintre cele k rezerve, atunci comutatoarele
ce asigură reconfigurarea vor trebui să aibă caracteristici de fan-in, fan-out şi
de putere excesive. Dacă însă se cere celor l linii de informaţie l j să fie
conectate la una dintre liniile de bus B j , B j1 , B j k , va rezulta un sistem de
comutaţie mai simplu.

Creşterea de fiabilitate în cele două cazuri este aceeaşi dar cerinţele de fan-
in, fan-out şi putere sunt reduse de la l în primul caz, la k în cel de-al doilea,
unde l este de regulă cu un ordin de mărime mai mare decât k.
64 Cap. 1. Introducere

Fig. 4.17. Structură redundantă dinamică aplicată unui BUS de date

Informaţia este transmisă de la cele două linii E1 , E 2 ale unui modul emiţător
la un modul receptor, cu liniile R1 , R 2 . Conectarea liniilor emiţătorului,
respectiv receptorului la liniile magistralei de comunicaţie se face prin
intermediul unor comutatoare (modul-BUS, BUS-modul). Pentru a se obţine
o structură tolerantă la defectări se prevede o linie de rezervă, astfel încât
fiecare linie de informaţie va avea două stări.

Aceste două stări vor fi memorate de un registru


al stărilor bus-ului, care în acest caz poate fi Stări Linie bus
implementat cu un circuit basculant bistabil.
S1 S2 neconectată
Comutatorul modul-BUS va comuta linia de
informaţie E1 la linia de bus B1 sau B2, iar linia 0 0 B3
de informaţie E2 la bus B2 sau B3, în funcţie de
starea de defect detectată. 0 1 B2
1 1 B1

Un defect al circuitelor basculante bistabile poate conduce la defectarea


întregului echipament. O soluţie este aplicarea de redundanţe pentru aceste
Cap. 1. Introducere 65

circuite, ceea ce conduce însă la o structură mai complicată şi mai costisitoare,


cu cerinţe de fan-in, fan-out mai mari, dar cu o fiabilitate mai ridicată.

CAPITOLUL 5

TEHNICI DE DETECŢIE A ERORILOR

5.1. Introducere

Evidenţierea stării eronate a unui echipament, stare care se datorează fie


erorilor de proiectare, fie defectărilor elementelor componente, se realizează
prin introducerea în structura echipamentului a unor componente suplimentare
(hardware sau software) urmând ca ulterior, celelalte faze ale toleranţei la
defectare să mascheze aceste erori sau defecte fizice. Astfel un echipament
testabil conţine pe lângă elementele funcţionale de bază o serie de elemente
pentru testabilitate (figura 5.1).
66 Cap. 1. Introducere

Fig. 5.1. Structura unui echipament testabil

În funcţie de scopul urmărit, testele aplicate echipamentelor se pot clasifica


astfel:

 Teste pentru verificarea funcţionării, orientate spre o verificare de


conformitate cu specificarea funcţională a echipamentului.

 Teste de încredere, pentru verificarea diferitelor funcţii ale


echipamentului în scopul obţinerii datelor asupra stării echipamentului.
Aceste teste sunt utilizate de regulă după o intervenţie corectivă în
echipament, sau una periodică, în cazul programului de mentenanţă
preventivă.

 Teste de diagnostic, în vederea operaţiilor de înlocuire sau reglare


necesare, după detectarea unei defectări a echipamentului.
Pentru realizarea în bune condiţii a unei testări, elementele suplimentare
introduse pentru asigurarea testabilităţii echipamentului, trebuie să
îndeplinească condiţiile următoare:

 să se bazeze pe specificaţiile echipamentului;

 să testeze toate specificaţiile posibile ale echipamentului, pentru a se


realiza o testare completă a acestuia;

 defectările echipamentului să nu conducă la defectarea elementelor care


realizează testarea.

În cazul echipamentelor tolerante la defectări detecţia stărilor eronate se poate


face în două moduri:

 Aplicând blocului S un test după generarea semnalelor de ieşire, dar


înainte ca acestea să fie evidenţiate le ieşirea blocului S’ (figura 5.1),
urmând ca apoi să se aplice una din tehnicile de tolerare a defectărilor.
Cap. 1. Introducere 67

 Dând echipamentului o structură de tip autotestabil care va însemna o


testare continuă în timpul funcţionării normale a acestuia, fiind astfel
înlăturate activităţile echipamentului scurse între tranziţia eronată şi
aplicarea testului, rezultând şi un timp mai redus de restabilire a
echipamentului.

În funcţie de principiile care stau la baza generării lor, aceste teste se pot
clasifica astfel:

 Teste sincrone, care se aplică atât modulelor hardware cât şi software.

 Teste de diagnostic, care se aplică de regulă prin excitarea unei


componente cu un set de semnale pentru care sunt cunoscute semnalele
de ieşire corecte, semnalele obţinute fiind comparate cu valorile
aşteptate.

 Teste prin multiplicare, care constau în multiplicarea activităţii


echipamentului testat. (Dublarea echipamentului original, copia
funcţionând simultan. Rezultatul testului se obţine prin compararea
ieşirile obţinute).

 Teste prin inversarea funcţiilor echipamentului. Acestea se pot utiliza


pentru acele echipamente cu relaţii intrare - ieşire simple. (Ex. banda
magnetică – se citesc apoi datele înscrise pe bandă şi se compară cu cele
originale, codificatoare-decodificatoare).

 Teste de paritate, utilizate pentru transmisii de date.

5.2. Metode de generare a secvenţelor de test utilizate


în diagnoza defectelor

Un test de diagnoză reprezintă succesiunea vectorilor (semnalelor) de intrare,


aplicaţi la intrările primare, împreună cu vectorii (semnalele) de ieşire, prezenţi
la ieşirile primare ale echipamentului. Testele de diagnoză se pot clasifica în:
68 Cap. 1. Introducere

 Teste parametrice, care implică verificarea caracteristicilor parametrice


(tensiuni, impedanţe etc).
 Teste funcţionale, care implică verificarea funcţiilor logice ale
circuitelor, utilizând dicţionare de defectări care permit verificarea
conformităţii funcţiilor răspuns.
Testele funcţionale pot fi:
 exhaustive – când verifică toate combinaţiile posibile;
 parţiale – verificarea făcându-se numai pentru combinaţiile cele mai
probabile în funcţionarea curentă a echipamentului;
 statistice – secvenţele de test fiind date aleator cu o lege de repartiţie
uniformă.
 Teste dinamice, care implică şi verificarea timpului de răspuns şi de
comutaţie în condiţii reale de utilizare.

5.2.1. Metode de generare a secvenţelor de test


pentru circuite logice

În cazul echipamentelor compuse din module logice se pot utiliza următoarele


tipuri de metode pentru generarea secvenţelor de test:
 Metode analitice şi funcţionale – după cum generarea secvenţelor de test
ţine seama de structura circuitelor sau numai de funcţia lor logică.
 Metode deterministe şi probabilistice – după principiul utilizat.

Metode deterministe: generarea secvenţelor de test prin analiza şi simularea


funcţiilor logice. Combinaţia semnalelor de test la intrările primare este impusă
pe baza analizei structurii circuitului, iar prin schimbarea comportării acestuia
în prezenţa anumitor defectări se determină defectările susceptibile de a fi puse
în evidenţă cu secvenţa de test respectivă la intrările primare.

A) Simularea deductivă. Aplicarea acestei metode constă în partiţionarea


echipamentul în circuite elementare şi disjuncte funcţional, dezvoltând în
continuare o combinaţie de teste pentru fiecare dintre circuitele elementare, pe
Cap. 1. Introducere 69

baza logicii circuitului. Metoda este utilă pentru circuitele simple, dar nu este
indicată pentru circuitele complexe.

Exemplu: Metoda căii sensibile. Această metodă constă în alegerea câtorva căi
de propagare de la un punct de manifestare a defectului spre ieşirile circuitului.

Fig. 5.2. Cale sensibilă la propagarea unui defect

Dacă se consideră că defectul se manifestă la ieşirea porţii P0 , atunci calea


sensibilă va fi formată din porţile P1 , P2 , ... Pn , astfel stabilite încât semnalele
de la ieşirea oricărei porţi P j să fie determinate numai de către semnalul de
intrare care vine de la poarta P j1 (figura 5.2). În acest fel, semnalul de la
ieşirea porţii P0 va fi dedus doar din observarea semnalului de la ieşirea porţii
Pn . Semnalele de intrare pentru poarta P0 se deduc în funcţie de semnalele
impuse ieşirii porţii P0 .

Problema testării în cazul în acestei metode se poate formula astfel: având un


set de căi sensibile trebuie găsită o combinaţie de semnale la intrările primare
care va realiza toate intrările necesare acestei căi de porţi.

Se consideră că ieşirea porţii P2 (figura 5.3) este blocată, în “1”. Semnalul


x 3  1 va pune în evidenţă defectarea porţii P2 . Ieşirea y P2  0 dacă defectul
este absent şi y P2  1 dacă defectul este prezent.
70 Cap. 1. Introducere

Fig.5.3.Circuit utilizat pentru exemplificarea metodei căii sensibile

În prima etapă se alege arbitrar calea de porţi logice P2 , P5 , P6 , P8 de la P2 la


ieşire. Pentru ca această cale să fie o cale sensibilă la propagarea defectului
trebuie îndeplinite condiţiile:
x 4  1 , pentru a sensibiliza poarta P5 ;

x 5  0 , pentru a sensibiliza poarta P6 ;

y P3  1 , pentru a sensibiliza poarta P8 .

În etapa a doua se găseşte vectorul test la nivelul intrărilor primare, astfel:


- din etapa I avem: x 3  1, x 4  1 şi x 5  0 ;
- pentru ca y P3  1 trebuie ca x1=1 şi x2=0, sau x1=0 şi x2=1, sau x1=1 şi
x2=1.

Se obţine vectorul de test: T1  x1 , x 2 , x 3 , x 4 , x 5 , y 2   1, 0 , 1, 1, 0 , 1  , care


identifică defectarea.

Pentru y 2  1 defectul este prezent, y 2  0 indicând absenţa defectării


considerate. Defectarea nu se observă la ieşirea y1 , deoarece calea P2 , P4 , P7
nu este sensibilă la propagarea defectării considerate. Pentru y P4  0 şi y P6  1
Cap. 1. Introducere 71

rezultă y1  1 atunci când defectul este prezent şi pentru y P4  1 şi y P6  0


rezultă y1  1 , când defectul nu este prezent.

Metoda căii sensibile nu conduce întotdeauna şi pentru orice tip de circuit logic
la un test de diagnostic.

B) Generarea secvenţelor de test pe principii probabilistice

Detectarea erorilor/defectelor se bazează în acest caz pe natura aleatoare şi pe


numărul foarte mare al vectorilor de test.

Metoda generării aleatoare a testelor

Fig. 5.4. Structura utilizată pentru realizarea testării cu secvenţe aleatoare.


Intrările circuitului testat şi cele ale unui circuit martor sunt baleiate în paralel
în momentul efectiv al testării de către secvenţele de test generate aleator.
Semnalele de ieşire ale celor două circuite sunt comparate: în caz de divergenţă
a celor doi vectori ai semnalelor de ieşire, circuitul testat este considerat defect.
Secvenţele de detecţie obţinute permit stabilirea unui dicţionar al defectărilor
pentru circuitul respectiv şi, de aceea, procedeul poate fi considerat
autoinstruibil.

Metoda simulării Monte-Carlo


72 Cap. 1. Introducere

Metoda constă într-o analiză cu ajutorul unei simulări a defectărilor de detectat.


Semnalele de intrare sunt obţinute aleator, cu o subrutină de generare aleatoare
a numerelor 0 şi 1.

Se determină apoi, cu ajutorul unui simulator de circuite logice cu injecţie de


defectări, abilitatea fiecărui vector de test de a detecta diferitele defectări din
circuit, conform unei liste de defectări. Se consideră N circuite ce sunt simulate
şi care sunt comparate cu un circuit martor. La fiecare neconcordanţă a
semnalelor de ieşire se evidenţiază combinaţia semnalelor test necesară
diagnosticării unui defect.

Această metodă de generare a secvenţelor de test poate consuma foarte mult


timp atunci când se cere detectarea tuturor defectărilor posibile într-un
echipament, iar în unele cazuri nu este posibilă diagnosticarea tuturor
defectărilor. De aceea este indicat să se combine metodele aleatoare de
generare a secvenţelor de test cu metodele deterministe.

5.2.2. Strategii de elaborare a secvenţelor de test


pentru echipamentele mari

În cazul echipamentelor mari, datorită volumului foarte mare de informaţie ce


trebuie prelucrat la un moment dat şi eterogenităţii echipamentelor, nu se pot
utiliza aceleaşi teste ca în cazul circuitelor logice. Echipamentele mari au de
regulă o structură complexă, conţinând unităţi diferite: electronice,
electromecanice, unităţi de adaptare etc.

Datorită eterogenităţii, în cazul echipamentelor mari se pot aplica doar teste


de tip funcţional. Echipamentul complex este partiţionat în module funcţionale,
pentru fiecare modul se generează secvenţele de test şi apoi se compun aceste
secvenţe pentru ansamblul general.
Cap. 1. Introducere 73

Este necesar ca generarea testelor să se realizeze la nivelul fiecărui modul şi să


ia în considerare compunerea acestor module în structura echipamentului,
deoarece nu este întotdeauna posibilă propagarea spre ieşire a oricărei secvenţe
de semnale care conţin o informaţie în vederea diagnosticării unui defect.
Rezultă că eficacitatea testului este determinată de modul alegerii modulelor
componente ale echipamentului considerat.

Partiţionarea unui echipament se poate face în două moduri:


 printr-un decupaj funcţional al echipamentului, ce facilitează
compunerea modulelor în echipament;
 printr-un decupaj structural al echipamentului, ce utilizează proprietăţi
ca simetria, repetitivitatea etc., de natură să faciliteze şi să optimizeze
cercetările cu privire la generarea testelor, atât la nivelul modulelor cât
şi la nivelul echipamentului în ansamblu.

În generarea secvenţelor de test pot fi evidenţiate strategiile de mai jos.

I. Elaborarea de teste după principiul start-small


74 Cap. 1. Introducere

În acest caz testarea începe cu cel mai mic


modul posibil din echipament, fiecare test
suplimentar adăugând apoi un nou modul
pentru testare (figura 5.5). Cu toate că
procedura stabilirii succesiunii testelor
individuale este complexă, există însă
două avantaje:
 localizarea rapidă a defectărilor,
dacă se consideră că o defectare
detectată nu se mai poate găsi într-
un circuit nou testat, deoarece nu
este posibilă trecerea la pasul
următor decât după înlăturarea
defectării respective;
 este rezolvată problema defectărilor
multiple atunci când partiţionarea
echipamentului este realizată în
modele suficient de mici.

Fig. 5.5. Principiul start-small


Dificultăţile care apar sunt legate de găsirea decupajului adecvat şi de
ordonarea circuitelor rezultate în vederea optimizării testării lor.

II. Elaborarea de teste după principiul start-big

Testul se aplică la început unei porţiuni mari din echipament şi în caz de bună
funcţionare se continuă cu o altă unitate mare. În caz de detecţie a unei defectări
se procedează la o ramificare a testelor pentru a se diagnostica module din ce
în ce mai mici în scopul de a se putea ajunge la identificarea defectării.
Avantajul acestei abordări constă în aceea că nu este necesar un decupaj strict
al echipamentului, nici o ordonare precisă a testelor, însă algoritmii de
Cap. 1. Introducere 75

diagnosticare sunt mai complicaţi. Ramificarea testelor se face până se ajunge


la cea mai mică parte sau componentă înlocuibilă sau reparabilă.

Fig. 5.6. Algoritmul de testare start-big.


5.3. Metode de derulare a testelor

Metodele de derulare a testelor pentru echipamentele digitale se pot clasifica


în secvenţiale şi combinaţionale. În cazul metodei de testare secvenţială, cel
de-al i - lea vector de test este determinat pe baza răspunsurilor la cei i – 1
76 Cap. 1. Introducere

vectori de test anteriori. În cazul testării combinaţionale, cel de-al i - lea vector
de test este independent de vectorii test anteriori [2].

I. Metoda testării secvenţiale

Se consideră un echipament partiţionat în şapte module identice S1 ... S7 , cărora


li se aplică trei secvenţe de test T1 , T2 , T3 , rezultând patru tipuri de semnale
răspuns: y1, y2 , y3, y4 (tabelul 5.1).

Se obţine un arbore de diagnostic în care fiecare defectare corespunde unei


ramuri, dar nu în mod necesar şi invers, terminaţiile ramurilor corespund
locurilor unde s-a oprit testarea, când s-a identificat o defectare (figura 5.7).

În cazul analizat s-a cunoscut apriori faptul că modulul S1 este în stare bună de
funcţionare şi, prin convenţie, a fost plasat pe ramura superioară a arborelui.
Tabelul 5.1

Răspuns
Test
y1 y2 y3 y4
T1 S1S2S3 S5 S4S6 S7
T2 S1S2S3 S5S7 S6 S4
S2S4S5
T3 S1 S3 ---
S6S7

Prin aplicarea testului T1 s-a obţinut o partiţionare în patru clase a celor şapte
module în funcţie de semnalele de ieşire Yi . Pentru repartizarea ulterioară a
claselor S1S2S3 şi S 4S 6 este necesar să se utilizeze testele T2 şi T3 . Se ajunge
astfel la identificarea într-un mod unic a unui echipament, deci la un procedeu
Cap. 1. Introducere 77

de testare cu rezoluţie de diagnosticare maximă. După fiecare test, aplicarea


testului următor se face în funcţie de rezultatele obţinute anterior. În mod uzual
se adoptă testul care furnizează cea mai mare cantitate de informaţie.

Fig. 5.7. Arborele de diagnostic în cazul testării secvenţiale

II. Metoda testării combinaţionale

Această metodă conduce la o creştere a numărului de teste, dar necesită o


memorie mai redusă pentru stocarea datelor obţinute. Redundanţa proprie
acestei metode de testare poate conduce la detectarea unor defectări care nu au
fost considerate printre defectările posibile la generarea testelor, ceea ce
compensează timpul mai mare necesar testării.

Aplicarea testelor într-o ordine prestabilită conduce la un dicţionar al


defectărilor. Se consideră exemplul anterior şi se aplică succesiv testele
T1 , T2 , T3 , rezultând graful din figura 5.8:
78 Cap. 1. Introducere

Fig. 5.8. Arborele de diagnostic în cazul testării combinaţionale


În urma aplicării tuturor testelor de diagnoză într-o ordine prestabilită, se
obţine un arbore de diagnoză, iar dicţionarul de defectări rezultat este prezentat
în tabelul 5.2.

Tabelul 5.2
Cap. 1. Introducere 79

Echipa Răspunsuri la testele:


Obs.
mente T1 T2 T3
S1 y1 y1 y1 S1- bun
S2 y1 y1 y2 S2- defect
S3 y1 y1 y3 S3- defect
S4 y3 Y4 y2 S4- defect
S5 y2 y2 y2 S5- defect
Deoarece S6 y3 y3 y2 S6- defect numărul
de
S7 y4 y2 y2 S7- defect
combinaţii ale semnalelor care detectează defectările variază de la o defectare
la alta, prin ordonarea combinaţiilor semnalelor de test în sensul descreşterii
numărului de defectări detectate, devine posibilă terminarea testării într-un
timp mai scurt.

Cu toate că are inconvenientul necesităţii de a memora rezultatele


intermediare, metoda testării secvenţiale are avantajul de a fi mai rapidă
întrucât sunt aplicate numai combinaţiile de test necesare. Metoda testării
combinaţionale nu necesită memorarea rezultatelor testelor însă este de durată
mai lungă întrucât trebuie executate toate testele, chiar dacă a fost identificată
o defectare.

5.4. Echipamente autotestabile


80 Cap. 1. Introducere

Procedeul autotestării constituie baza implementării tolerării dinamice a


defectărilor. Funcţia de autotestabilitate trebuie să fie inclusă atât în
echipamentele autoreparabile, cât şi în cele reconfigurabile [2].

Implementarea echipamentelor tolerante la defectări presupune realizarea unor


structuri autotestabile cu o siguranţă în funcţionare foarte ridicată. Se defineşte
echipamentul total autotestabil ca fiind echipamentul autotestabil şi sigur în
prezenţa defectărilor.

Un echipament autotestabil total, relativ la o anumită mulţime de defectări are


proprietăţile următoare:
 toate defectările acestei mulţimi sunt detectate în timpul funcţionării
normale a echipamentului;
 orice defectare este detectată de îndată ce a apărut.

Supravegherea unui echipament autotestabil poate fi realizată de un


echipament de detecţie a defectărilor conectat la ieşirile de test (figura 5.9).

Acest echipament de supraveghere va forma semnalul de alarmă sau STOP şi


va acţiona comutarea rezervelor echipamentului sau reconfigurarea sa, atunci
când echipamentul are o structură redundantă dinamică, sau va acţiona asupra
altui echipament de decizie.

Fig. 5.9. Echipament


autotestabil
Cap. 1. Introducere 81

Structura unui circuit de detecţie a defectărilor este cu atât mai complicată cu


cât numărul variabilelor de test yTi este mai mare. Schema bloc prezentată în
figura 5.10 este compusă dintr-un circuit de control (CC) şi un circuit pentru
formarea semnalelor de ALARMĂ sau STOP.

Fig.5.10. Circuit de detecţie a defectărilor

Circuitul de control trebuie să îndeplinească condiţiile următoare:


 toate semnalele de test ale echipamentului autotestabil controlat trebuie să
fie observabile la ieşirea sa;
 orice defectare care apare în funcţionare trebuie să fie detectată în cursul
funcţionării sale normale.
Circuitul de formare a semnalului de ALARMĂ sau STOP trebuie să aibă în
compunere următoarele elemente:
 un circuit de detecţie D, care să detecteze configuraţia semnalelor de test
care nu aparţin unei stări de bună funcţionare;
 un filtru F, pentru a fi eliminate eventualele configuraţii tranzitorii;
 un circuit care să asigure memorarea erorii detectate de circuitul D, de
exemplu un circuit basculant bistabil de tip RS.

Utilizarea filtrului F nu mai este necesară atunci când circuitul de detecţie este
sincronizat de un semnal de tact. Realizarea unui echipament autotestabil poate
fi condiţionată de apariţia anumitor tipuri de defectări apriori considerate,
funcţie de tipul de aplicaţie avut în vedere pentru echipamentul respectiv şi
tehnologia de fabricaţie folosită.
82 Cap. 1. Introducere

Echipamentele total autotestabile pot fi clasificate după tipul redundanţei


utilizate, în:
 echipamente total autotestabile cu structură redundantă separabilă;
 echipamente total autotestabile cu structură redundantă neseparabilă.

A) Echipamentele total autotestabile cu structură redundantă separabilă, se pot


împărţi la rândul lor astfel:

a1) Echipamente autotestabile cu structură dublată (figura 5.11).

Fig. 5.11. Echipament autotestabil cu structură dublată

Modulul redundant este identic cu cel funcţional. Semnalele de ieşire sunt


trimise la circuitul de control, care în caz de necoincidenţă va genera semnalul
de ALARMĂ sau STOP. Structura este simplă şi se poate aplica oricărui
echipament. Pentru a evita erorile de proiectare care ar putea afecta în acelaşi
mod cele două module este de preferat ca modulul redundant să fie realizat cu
o altă schemă dar să îndeplinească aceleaşi funcţii ca modulul funcţional. Apar
probleme de sincronizare între cele două module şi probleme legate de costul
ridicat al soluţiei.
Cap. 1. Introducere 83

a2) Echipamente autotestabile cu inversarea funcţiei intrare/ieşire


(figura 5.12).

Fig. 5.12. Echipament autotestabil cu inversarea funcţiei intrare/ieşire

Această soluţie nu se poate aplica decât pentru echipamente cu funcţii I/E


simple, pentru care se poate determina funcţia inversă a modulului funcţional
(ex. codificatoare - decodificatoare etc).

Costul unui astfel de echipament poate depăşi dublul costului echipamentului


de bază. Apar probleme de sincronizare, întrucât timpii de propagare prin cele
două module sunt diferiţi.

a3) Echipamente autotestabile cu coduri detectoare de erori (figura 5.13).


84 Cap. 1. Introducere

Fig. 5.13. Echipament autotestabil cu coduri detectoare de erori


Modulul redundant (reprezentat cu linie întreruptă) al echipamentului
autotestabil considerat realizează o codare a semnalelor de intrare şi ieşire ale
modulului funcţional.

În figura 5.13 este prezentat un echipament cu intrările a , b , c n 1 şi ieşirile


s n , c n . Blocul de formare a semnalelor de test formează semnalele YT1 , YT2
astfel încât YT1 , YT2  0 , 1  sau 1, 0  pentru o funcţionare normală şi

Y T1 
, YT2   0 , 0  sau 1, 1  în prezenţa unor defectări în echipamentul
funcţional.

B) Echipamente autotestabile cu structură redundantă neseparabilă. Acestea


includ echipamentele autotestabile sintetizate pe baza utilizării codurilor
redundante de tip neseparabil pentru codarea informaţiilor de intrare/ieşire.
Exemplu: echipamentele ce utilizează codul k din n. Aceste echipamente vor
avea un preţ de cost mai redus faţă de echipamentele autotestabile cu structură
dublă.

5.5. Metode de asigurare a unei testabilităţi facile


Cap. 1. Introducere 85

Testabilitatea unui echipament constituie aptitudinea acestuia de detectare şi


localizare uşoara a defectărilor posibile. Aceasta înseamnă că echipamentul
posedă o colecţie de teste uşor de generat, aplicat şi evaluat, care permit
obţinerea unei localizai precise a defectărilor. Testabilitatea se realizează în
faza de proiectare, regulile de proiectare urmărind să crească controlabilitatea
şi observabilitatea echipamentelor respective.

O metodă generală de a produce programe de test pentru circuitele electronice


constă în a verifica funcţional fiecare bloc identificabil în circuitul respectiv.
Fie un circuit logic complex de tip integrat, reprezentat în figura 5.14:

Fig. 5.14. Circuit integrat complex


Dacă se consideră blocul BL1, stabilirea unor configuraţii de semnale pentru
testare pe intrările sale presupune posibilitatea controlării valorilor logice ale
nodurilor de reţea din regiunea A prin intermediul vectorilor de test aplicaţi pe
intrările primare I1 ... In.

Măsura în care este posibilă asigurarea de valori logice bine definite unui nod
al reţelei, prin intermediul vectorilor aplicaţi pe intrările primare, poartă
numele de controlabilitate a nodului respectiv.

Dacă se rezolvă problema configuraţiilor logice necesare pentru intrările


blocului logic testat, rămâne în continuare să se rezolve problema observării
ieşirilor acestuia, întrucât nu întotdeauna acestea pot fi în contact direct cu
ieşirile primare. Rezolvarea acestei probleme presupune stabilirea unor căi de
86 Cap. 1. Introducere

comunicaţie prin zona B între ieşirile blocului testat şi ieşirile primare ale
echipamentului.

Măsura în care comportarea unui nod al reţelei logice poate fi transmisă către
una dintre ieşirile primare se numeşte observabilitatea nodului respectiv.

Proiectarea circuitelor testabile se bazează pe două metode:

 Prima metodă porneşte de la proiectarea existentă şi introduce elemente


logice adiţionale, ceea ce conduce la o creştere a complexităţii circuitului,
dar reduce numărul de teste necesare pentru diagnoză. Această metodă se
poate aplica pentru rezolvarea problemelor de testabilitate la nivelul de plăci
de circuite imprimate echipate cu componente şi echipamente, prin
introducerea unor puncte de test suplimentare.

 A doua metodă constă în proiectarea circuitelor astfel încât să fie uşor


testabile. Această metodă poate introduce întârzieri mari în propagarea
semnalelor şi o creştere a numărului de porţi logice.

În cazul circuitelor integrate, unde numărul terminalelor este limitat nu se pot


introduce puncte de test suplimentare decât, cel mult, în faza de fabricaţie.

Pentru implementarea primei metode în cazul circuitelor LSI sau VSLI se


poate opta pentru generarea în circuit a unor secvenţe de test pseudoaleatoare
[2].

Generarea vectorilor de test poate fi făcută utilizând un registru de deplasare


cu bucle de reacţie ce extrag informaţia din diferite puncte ale registrului şi o
transportă la intrarea acestuia, structura unui astfel de registru fiind prezentată
în figura 5.15. (LFSR – Linear Feedback Shift Register).
Cap. 1. Introducere 87

Fig. 5.15. Generarea vectorilor de test utilizând registre de deplasare.

Metoda este simplă, uşor de implementat şi permite obţinerea prin metode


nedeterministe a unui număr mare de vectori de test, de = 2n-1.

Metodele de analiză a rezultatelor aplicării secvenţei de test constau fie în


numărarea tranziţiilor, fie în analiza de semnătură (figura 5.16).

Fig. 5.16. Implementarea metodei analizei de semnătură


utilizând un registru de tip LSFR

În cazul metodei analizei de semnătura, elementul constructiv fundamental


este un LFSR, căruia i se aplică la intrare printr-o poartă SAU-EXCLUSIV două
surse de informaţie: şirul de m biţi rezultaţi în urma aplicării secvenţei de test
88 Cap. 1. Introducere

şi şirul de semnale de pe bucla de reacţie realizată cu prize de semnal în diferite


puncte ale registrului. La terminarea secvenţei de test, LFSR conţine un cuvânt
de n biţi care poartă denumirea de semnătură a şirului de m biţi prelucraţi.

Cea de a doua metodă presupune utilizarea tehnicii de proiectare LSSD (Level


Sensitive Scan Design), folosită cu precădere pentru circuitele electronice
integrate de tip LSI sau VLSI. Implementarea acestei metode se bazează pe
următoarele concepte:

1. Circuitul funcţionează sincron. Toate schimbările de stare a circuitului sunt


determinate de nivelul logic al semnalului de test şi nu de fronturile acestuia.
De asemenea, stările stabile apărute ca răspuns la modificările semnalelor de
intrare sunt independente de intrările datorate propagărilor pe căile de transfer
(interconexiuni, porţi etc.).

Răspunsul este independent de ordinea în care se produc schimbările


semnalelor de intrare în cadrul aceleiaşi perioade de tact. Această proprietate
de sensibilitate la nivel reduce dependenţa circuitului de parametrii săi de
curent alternativ: degradarea fronturilor, întârzieri de propagare etc.

2. Circuitul trebuie să posede căi de acces serial. Pentru aceasta se folosesc


structuri logice special proiectate în acest scop, de tip SRL (polarity – Hold
Shift Register Latch), a căror schemă bloc este prezentată în figura 5.17, iar
schema electrică la nivel de porţi logice este dată în figura 5.18.
Cap. 1. Introducere 89

Fig. 5.17. Schema bloc a unei structuri SRL

În figura 5.17, blocurile B1 şi B2 reprezintă două circuite bistabile conectate în


configuraţie master-slave.

Bistabilul B1 constituie dispozitivul de memorare a stării echipamentului în


funcţionare normală, având intrarea de date pe D, semnalul de tact al
echipamentului pe intrarea C şi ieşirea pe L1. Pe perioada funcţionării normale,
semnalele “Scan Clock A” şi semnalele de tact pe B sunt fixate în “0”.
Memorarea datelor din echipament se realizează la revenirea în “0” a
semnalului de tact.
Pentru a configura această structură ca element al unei căi de acces serial
semnalul de tact pe intrarea C trebuie blocat în “0” acţionându-se asupra intrării
A. Ca urmare, valoarea logică existentă pe intrarea SDI se încarcă în bistabilul
L1, la revenirea în “0” a intrării A. Transferarea acestei informaţii în bistabilul
L2 se realizează la revenirea în “0” a semnalului de tact aplicat pe intrarea B.
90 Cap. 1. Introducere

Fig. 5.18. Schema electrică a structurii SRL, la nivel de porţi logice

Realizarea unei testări automate în tehnica LSSD presupune următoarele etape:


a) se testează registrele SRL, transferându-se în mod serial o secvenţa logică
cunoscută.
b) se testează blocurile combinaţionale, transferându-se la intrarea lor
vectorii de test necesari prin intermediul unui registru de deplasare.
c) se citeşte vectorul semnalelor rezultate la ieşirea blocului combinaţional,
extrăgându-se informaţia în mod serial prin intermediul registrului de
deplasare.
d) se repetă acţiunile de la punctele b şi c până la expirarea programului de
test.

Exemplu de utilizare a tehnicii LSSD pentru implementarea autotestabilităţii.


În figura 5.19 este prezentat modul în care se poate descompune un circuit
complex în vederea testării automate, iar în figura 5.20 este prezentată
utilizarea structurilor de tip SRL.
Cap. 1. Introducere 91

Fig. 5.19. Structura unui circuit complex

Fig. 5.20. Utilizarea structurilor SRL pentru implementarea autotestabilităţii


92 Cap. 1. Introducere

Avantajele tehnicii de proiectare ce utilizează structuri LSSD:

 elimină dependenţa bunei funcţionari a echipamentului de variabilele


dinamice (timpii de creştere şi de cădere a nivelurilor de semnal, timpii
de propagare etc);
 există posibilitatea de a întrerupe bucla de reacţie prin trecerea circuitului
în regim de deplasare, eliminându-se o cauză majoră a dificultăţilor
întâmpinate în activitatea de diagnoză pentru circuitele logice
secvenţiale.

Dezavantajele tehnicii de proiectare ce utilizează structuri LSSD:

 creşterea numărului de porţi logice necesare implementării funcţiei


logice;
 obligaţia de a folosi o logică sincronă, care impune o serie de restricţii
de proiectare;
 imposibilitatea de a executa teste la viteză mare a circuitului investigat,
deci de a pune în evidenţă defecte dinamice.

Această tehnică de proiectare permite creşterea observabilităţii şi


controlabilităţii circuitelor integrate de tip LSI şi VLSI, ceea ce permite
utilizarea acestor structuri în echipamentele de înaltă fiabilitate şi, în special,
în echipamentele tolerante la defectări.

5.6. Probleme specifice ale tehnicilor de implementare a


toleranţei la defectări

În implementarea toleranţei la defectări au fost prezentate două strategii de


bază: redundanţă statică şi redundanţă dinamică.
Cap. 1. Introducere 93

Tehnicile de redundanţă statică, aplicate la nivel hardware, se referă la


utilizarea unor componente suplimentare care formează o parte permanentă a
echipamentului şi servesc la mascarea semnalelor eronate generate de prezenţa
unor defectări.

Tehnicile de redundanţă dinamice tolerează defectările prin reorganizarea


activă a echipamentului la apariţia acestora, astfel încât o componentă defectă
este înlocuită efectiv de o componentă aflată în bună stare de funcţionare.
Această operaţie este realizată în trei etape, aşa cum rezultă şi din diagrama din
figura 5.21, [2].

În prima etapă se realizează detecţia defectării echipamentului. Procedeele de


test folosite urmăresc să detecteze defectul şi să-l izoleze la o unitate
înlocuibilă sau reparabilă.

În etapa a doua se produce înlăturarea defectului prin repararea, înlocuirea


modulului defect cu unul de rezervă sau reconfigurarea echipamentului în
jurul modulului defect.
94 Cap. 1. Introducere

Fig. 5.21. Etapele tolerării dinamice a defectărilor

În etapa a treia se realizează revenirea echipamentului la o stare funcţională


parcursă de acesta înainte de manifestarea defectului, după care operarea
echipamentului este reluată din acel punct.

În general, orice procedeu de restabilire a funcţionării unui echipament constă


din următoarele etape:

 detecţia unui defect / erori;


 recunoaşterea defectului / erorii;
 restabilirea funcţionării echipamentului;
 diagnosticarea defectului / erorii şi repararea.

De cele mai multe ori, detecţia defectului / erorii este o funcţie realizată integral
de o varietate de procedee implementate cu mijloace hardware. În toate
cazurile, testele de detecţie sunt examinate de programe care asigură validarea
lor.
Cap. 1. Introducere 95

Obiectivul recunoaşterii defectului / erorii constă în identificarea modulului


funcţional la nivelul căruia s-a produs defectul / eroarea, precum şi în
discriminarea defectelor hardware permanente de cele tranzitorii.

Desfăşurarea pasului următor are în vedere existenţa sau nu a unei rezerve a


modulului funcţional identificat ca defect. În cazul în care nu există o rezervă
disponibilă, se iniţializează acţiunile de diagnosticare şi reparare a modulului
defect.

Operarea normală a echipamentului, întreruptă în momentul detecţiei


defectului / erorii, este suspendată şi pe perioada de diagnoză şi reparare. După
terminarea reparării se execută restabilirea funcţiilor echipamentului şi se reia
funcţionarea normală.

Evenimentele ce se derulează în acest caz sunt prezentate în diagrama din


figura 5.22.

Fig. 5.22. Etapele procesului de restabilire a funcţionării unui echipament


de calcul neredundant în cazul apariţiei unei defectări

În cazul în care există o rezervă disponibilă, atunci după recunoaşterea


defectării se procedează la reconfigurarea echipamentului prin înlocuirea
96 Cap. 1. Introducere

modulului defect cu cel de rezervă şi apoi se iniţiază un procedeu de restabilire


a funcţionarii echipamentului, reluându-se funcţionarea normală.

Diagnoza şi repararea modulelor funcţionale defecte se poate face mai târziu,


în timpul funcţionării normale a echipamentului. Evenimentele ce se succed în
acest caz sunt reprezentate în diagrama din figura 5.23.

O analiză a secvenţelor prezentate în figurile 5.22 şi 5.23 pune în evidenţă o


serie de avantaje în ceea ce priveşte mentenanţa echipamentelor tolerante la
defectări.

În primul rând, diagnosticarea unei defectări, care consumă mai mult timp
decât toate etapele procedeului de restabilire a funcţionării, poate fi amânată şi
intercalată cu funcţionarea normală a echipamentului. În al doilea rând,
disponibilitatea unei rezerve permite abordarea unei metode de diagnosticare
prin comparaţie cu avantajul unui timp de diagnoză şi cost scăzut.

Fig. 5.23. Etapele procesului de restabilire a funcţionării unui echipament


de calcul redundant în cazul apariţiei unei defectări
Cap. 1. Introducere 97

Fiind mai complexe decât metodele redundanţei statice, procedeele


redundanţei dinamice prezintă avantajul că modulele defecte, după ce au fost
localizate sunt rapid eliminate, fiind înlocuite cu modulele bune, în timp ce în
cazul redundanţei statice, defectările nedetectate se acumulează până ce
echipamentul se defectează complet.

Echipamentele de calcul moderne sunt proiectate ca echipamente distribuite,


de tip multiprocesor, oferind performanţe superioare din punct de vedere al
tolerării defectărilor şi al vitezei de calcul. În cazul defectării unui calculator,
calculatoarele rămase în echipamentul distribuit, detectează erorile cu ajutorul
echipamentului software disponibil şi reconfigurează corespunzător
echipamentul. Dacă echipamentul este uniprocesor, detecţia şi restabilirea se
realizează cu mijloace hardware auxiliare, întrucât nu este indicat ca astfel de
operaţii să fie executate de software-ul calculatorului defect.

În cazul echipamentelor multiprocesor apar probleme legate de sincronizarea


semnalelor, datorită întârzierilor diferite introduse.

Exemplu: Dacă un procesor este deconectat datorită identificării unei defectări,


celelalte procesoare din structura echipamentului vor “şti” acest lucru numai
după recepţionarea mesajului de întrerupere de către fiecare dintre ele, astfel
încât în timpul tranziţiei mesajului respectiv celelalte procesoare pot trimite
mesaje către procesorul deja deconectat.

5.7. Tehnici de reconfigurare a echipamentelor


la apariţia defectărilor
98 Cap. 1. Introducere

Aceste tehnici au rolul de a asigura localizarea elementelor defecte, eliminarea


sau izolarea acestora şi introducerea automată a unor rezerve. De regulă aceste
tehnici sunt implementate hardware.

În cazul echipamentelor tolerante la defectări, localizarea defectărilor se face


cel mai adesea utilizând teste de diagnoză.

Aceste teste implică aplicarea la intrările primare a unor seturi de semnale


pentru care sunt cunoscute seturile de semnale de ieşire corecte.
Neconcordanţa dintre vectorul semnalelor de ieşire obţinut şi cel aşteptat pune
în evidentă un anume defect în echipament.

Testele de diagnoză se folosesc de regulă pentru localizarea defectelor de tip


hardware, dar se pot folosi şi pentru produsele software.

În cazul unui echipament tolerant la defectări pentru comutaţie electronică ESS


No 1A (Electronic Switching System) realizat de firma Bell se utilizează două
procesoare, unul activ şi unul de rezervă. Detecţia iniţială a unei defectări se
face prin evidenţierea unor neconcordanţe între ieşirile celor două procesoare.
În etapa următoare se determină care procesor este defect printr-un test de
diagnoză, unitatea defectă fiind eliminată din echipament. Se aplică apoi teste
de diagnoză unităţii defecte până ce se izolează defectul la cea mai mică
componentă înlocuibilă, după care se trimite un mesaj către operatorul uman
care va efectua înlocuirea componentei / modulului specificate, cu una de
rezervă [2].

În cazul altor echipamente tolerante la defectări, proiectarea a fost astfel făcută


încât permite scoaterea unor componente din funcţionarea curentă, aplicarea
unor teste de diagnoză şi, în caz de bună funcţionare, reintroducerea lor în
echipament.

Pentru a reduce costul realizării testelor de diagnostic în echipamentele cu


structură redundantă se pot folosi comparaţiile între semnalele de ieşire ale
Cap. 1. Introducere 99

diferitelor componente din structura echipamentului care realizează aceleaşi


funcţii. Rezultatele obţinute pentru un element al echipamentului suspectat a fi
defect sunt comparate cu rezultatele elementului identic din altă copie a
echipamentului considerat în bună stare de funcţionare.

În urma etapei de localizare a defectărilor, una sau mai multe componente ale
echipamentului vor fi considerate ca defecte. Pentru a preveni ca aceste
componente suspecte să influenţeze viitoarea funcţionare a echipamentului
trebuie luate măsuri de “reparare” a echipamentului. Se consideră că
“repararea” echipamentului nu implică operaţii de “reparare” propriu-zisă a
componentelor (modulelor) defecte ci numai acţiuni de reconfigurare a
echipamentului care să conducă la aducerea echipamentului într-o stare de
bună funcţionare.

Tehnicile de reconfigurare se pot clasifica în:

 manuale, când toate acţiunile sunt realizate de factorii umani;


 dinamice, când toate acţiunile de reconfigurare sunt realizate de către
echipament, dar numai ca răspuns la instrucţiuni din afara
echipamentului;
 spontane, când toate acţiunile sunt iniţiate şi realizate de către
echipamentul însuşi.

Reconfigurarea manuală constă din modificarea manuală a conexiunilor între


componente sau înlocuirea pe aceeaşi cale a componentelor defecte.

Tehnicile de reconfigurare dinamică şi spontană folosesc în acest scop reţele


de comutaţie care au rolul de a modifica interconexiunile dintre componente.

Cea mai simplă strategie de reconfigurare a echipamentului, făcută în general


pentru echipamente hardware, este plasarea componentelor într-o configuraţie
de tip stand-by ca în figura 5.24.
100 Cap. 1. Introducere

Fig. 5.24. Reconfigurarea unui echipament prin tehnici de comutaţie


Comutatorul prezintă interfeţe cu ambele componente. Comutaţia de la o
componentă la alta modifică ansamblul de interacţiuni ale echipamentului, dar
echipamentul însuşi rămâne neschimbat.

Dacă erorile de proiectare nu sunt considerate ca fiind esenţiale, elementul de


rezervă poate fi identic cu elementul funcţional. Dacă se doreşte eliminarea
erorilor de proiectare, atunci elementul funcţional şi cel de rezervă sunt
proiectate în mod independent.

În unele echipamente tolerante la defectări, în scopul obţinerii unor avantaje


din prezenţa elementelor de rezervă, se adoptă strategia următoare: din start
toate componentele, active şi de rezervă, sunt disponibile să asigure servicii,
iar în momentul identificării unui defect, componenta suspectă este înlăturată.
În acest mod echipamentul are o capacitate mărită de a suporta suprasolicitări
şi un grad de tolerare a defectărilor superior celui specificat iniţial. Acest mod
de operare conduce la o degradare lentă a serviciilor asigurate de echipament,
datorită faptului că serviciile componentelor defecte sunt preluate de cele
rămase în stare de funcţionare.

Dimensiunile unităţilor înlocuibile influenţează atât efortul necesar localizării


defectelor, cât şi costul întregului echipament şi depind de mai mulţi factori.
Cap. 1. Introducere 101

Unităţile mari permit o localizare mai uşoară a defectării dar impun în mod
corespunzător o redundanţă la nivel superior de unde poate rezulta un cost mai
ridicat al echipamentului.

Unităţile mici conţin mai puţine componente, putând fi proiectate pentru a avea
facilităţi cât mai mari, dar în schimb necesită o reţea de comutaţie mai
complexă.

Un alt factor care influenţează mărimea unităţilor înlocuibile îl constituie


nivelul la care este posibilă reparaţia.

CAPITOLUL 6

STRATEGII EVOLUTIVE DE REÎNNOIRE


102 Cap. 1. Introducere

6.1. Reînnoirea echipamentelor în context evolutiv

Performanţele de fiabilitate a unui echipament sunt concretizate în faza de


proiectare prin alegerea judicioasă a arhitecturii echipamentului, a
materialelor, a procesului de fabricaţie, a componentelor, iar în faza de
exploatare prin adoptarea unei strategii optimale de mentenanţă care să
asigure o cât mai mare disponibilitate a echipamentului, la un cost cât mai
redus în unitatea de timp. În cazul echipamentelor reparabile, unul dintre
principalii factori care contribuie la asigurarea unei disponibilităţi cât mai
ridicate îl constituie efectuarea de reînnoiri preventive. Aceste reînnoiri
operează la anumite momente de timp prestabilite şi conduc la eliminarea
totală sau parţială a uzurii acumulate, aducând echipamentul de fiecare dată
într-o stare de funcţionare caracterizată de lipsa uzurii sau cu o uzură
neglijabilă. Stabilirea momentului reînnoirii se poate face utilizând fie
modelul de fiabilitate al echipamentului, bazat pe informaţiile apriori
referitoare la comportarea echipamentului în condiţiile de exploatare date,
fie utilizând o strategie evolutivă de reînnoire care predictează momentul
proximei reînnoiri, utilizând modelul de fiabilitate al echipamentului,
actualizat în timp real în funcţie de evoluţia reală a parametrilor
echipamentului. Utilizarea unei strategii evolutive de reînnoire poate
conduce atât la creşterea disponibilităţii echipamentului cât şi la minimizarea
costului mediu de întreţinere în unitatea de timp.

În continuare se prezintă o strategie de reînnoire ameliorată, din clasa


strategiilor CRP (Continuous Replacement Policy), care vizează:
- utilizarea cât mai completă a informaţiilor apriori, privind echipamentul
monitorizat, şi elaborarea – pe baza acestor informaţii – a unui model
Markov iniţial de fiabilitate;
- utilizarea tehnicilor de diagnoză pentru obţinerea de informaţii curente
privind starea echipamentului;
- ajustarea automată a parametrilor modelului Markov, pe baza informaţiilor
furnizate de subsistemul de diagnoză;
Cap. 1. Introducere 103

- utilizarea tehnicilor de instruire pentru ajustarea modelului Markov, cât şi


corecţia subsistemului de diagnoză în cadrul operaţiilor de
reînnoire/restabilire.

Această strategie poate sta la baza realizării unui echipament de monitorizare,


care să furnizeze în timp real strategia optimală aferentă stării curente a
utilajului.

6.1.1. Premizele strategiei evolutive de reînnoire

I. Premize privind elaborarea modelelor de fiabilitate

Cercetările îndelungate şi aprofundate privind fiabilitatea elementelor şi


echipamentelor industriale au dus la creşterea sensibilă a bazei de cunoştinţe
pe care se pot dezvolta modelele structural-funcţionale de fiabilitate, cum sunt
cele de tipul modelelor Markov. Aceste modele de fiabilitate sunt
fundamentate de:
- structura echipamentului;
- procesele care conduc la modificarea în timp a proprietăţilor funcţionale ale
echipamentului modelat.

Ca urmare a cercetărilor efectuate în ultimii ani, s-au acumulat cunoştinţe


variate, privind următoarele aspecte esenţiale ce privesc fiabilitatea
echipamentelor:
1- caracterizarea şi modelarea solicitărilor mixte, de tip: mecanic + termic
+ electromagnetic. În acest scop sunt utilizate proceduri care îmbină
investigaţia experimentală cu modelarea numerică, utilizând metode de
tipul elementului finit;
2- caracterizarea şi modelarea solicitărilor produse în maşinile electrice, la
utilizarea noilor generaţii de convertoare de frecvenţă. În cazul maşinilor
de curent alternativ, alimentate atât de la convertoarele comandate
vectorial, cât şi în sistemele de comandă directă a fluxului (DTC – Direct
Torque Control), frecvenţele înalte de lucru ale invertoarelor, cât şi
104 Cap. 1. Introducere

gradienţii ridicaţi de tensiune pun probleme noi privind solicitările


maşinilor, ca de exemplu:
- apariţia unor efecte mecanice specifice induse de funcţionarea
convertorului: oscilaţii de cuplu, rezonanţe pe frecvenţe ridicate în
sistemul mecanic;
- accelerarea procesului de degradare a izolaţiei, ca urmare a
frecvenţei ridicate de comutare şi a gradienţilor mari de tensiune, în
cadrul invertoarelor din compunerea echipamentelor electrice de
putere.

Rezultatele acumulate din studiile de tribologie, cât şi din practica


inginerească, oferă date suficiente pentru estimarea evoluţiei proceselor de
uzură, în funcţie de condiţiile (solicitările) de exploatare curente. Aceste
condiţii se referă la solicitările mecanice, regimul de ungere, solicitările
termice etc.

Rezultatele privind evoluţia proceselor de uzură/îmbătrânire, sub acţiunea


solicitărilor, oferă şi informaţiile privitoare la mărimile observabile
(măsurabile), care reflectă – direct sau indirect – gradul de uzură/îmbătrânire:
vibraţii, temperaturi, nivelul descărcărilor parţiale etc.

Elaborarea modelului Markov de fiabilitate a echipamentului (figura 6.1) are


la bază următoarele operaţii:
- analiza structurii echipamentului, cu reliefarea componentelor şi
proceselor asociate, stabilirea factorilor de solicitare, evidenţierea
interacţiunilor, întrucât comportarea unei componente modifică “mediul”
celorlalte componente;
Cap. 1. Introducere 105

Fig. 6.1. Elaborarea modelului Markov de fiabilitate

- stabilirea structurii de stare (numărul de stări şi semnificaţia acestora);


- fundamentarea politicii de instrumentaţie, care vizează discernerea
“stării” echipamentului în regimul curent de exploatare.

II. Premize privind diagnoza stării echipamentului

Domeniul diagnozei tehnice a avut, în ultimul timp, o dezvoltare deosebită,


fiind conturat şi susţinut de un considerabil suport teoretic şi procedural.
Principalele metode de diagnoză se pot încadra în două abordări:

A. Abordarea bazată pe analiza de semnal

Prelucrarea seriilor de timp şi analiza spectrală în special sunt utilizate de mult


timp pentru detectarea nuanţată a defectelor, întrucât metodele numerice de
prelucrare a semnalelor oferă posibilităţi reale de caracterizare a defectelor sau
imperfecţiunilor din cadrul echipamentului diagnosticat. În prezent aceste
metode utilizează pe scară largă algoritmi neuronali, în toate etapele lanţului
de prelucrare, respectiv la:
 modelarea spectrală a semnalului;
106 Cap. 1. Introducere

 extragerea trăsăturilor pe baza cărora se face diagnoza;


 recunoaşterea stării echipamentului diagnosticat.

B. Abordarea bazată pe metode de model

Metodele din această categorie, de dată mai recentă, au numeroase variante şi


apelează la rezultatele cunoscute din teoria sistemelor şi din domeniul
identificării sistemelor. În principiu, diferenţele dintre echipamentul
diagnosticat şi modelul său (diferenţe legate de existenţa defectelor sau
imperfecţiunilor) stau la baza generării reziduurilor. În problematica
generatoarelor de reziduuri sunt avute în vedere şi aspectele care introduc
limitările de metodă: incidenţa perturbaţiilor nemodelate asupra reziduurilor şi
problema insensibilizării generatorului de reziduuri în raport cu aceste
perturbaţii. În ceea ce priveşte prelucrarea reziduurilor, există diverse abordări:
 compararea cu praguri fixe sau cu praguri adaptive (acestea putând fi
obţinute şi prin instruire);
 aplicarea de metode multicriteriale fuzzy etc.

Cele două abordări în diagnoza stării echipamentului pot fi îmbinate într-o


structură în care evaluarea probabilităţilor aferente stărilor diagnosticate are la
bază criterii ce ţin cont de totalitatea informaţiilor detectabile din echipamentul
monitorizat.

6.1.2. Principiul strategiei evolutive de reînnoire

Scopul urmărit este de a evalua în timp real “dinamica” timpului optimal de


reînnoire T*(t). Această ”dinamică” trebuie să reflecte efectele condiţiilor
curente de exploatare, care determină caracterul variant al modelului de
fiabilitate. Principiul strategiei evolutive de reînnoire este ilustrat în figura
6.2. Structura propusă în [10] conţine 3 canale de prelucrare a informaţiei, după
cum urmează:

1. Calea directă. Aceasta are ca punct de plecare modelul Markov de


fiabilitate, având parametrii iniţializaţi pe baza datelor menţionate
anterior. Dacă se utilizează un model Markov cu parametri prestabiliţi,
Cap. 1. Introducere 107

se calculează o valoare a timpului optimal de reînnoire. Această valoare


se aplică efectiv la ciclul curent al procesului de reînnoire, obţinându-se
strategia de mentenanţă clasică, în care se presupune că modelul de
fiabilitate este invariant (neafectat de condiţiile de exploatare inerent
variabile).

Fig. 6.2. Principiul strategiei evolutive de reînnoire

Un aspect important în conceperea căii directe îl constituie adoptarea


structurii modelului Markov de fiabilitate. În funcţie de natura şi
structura echipamentului considerat, trebuie aleasă dimensiunea
vectorului de stare şi semnificaţia stărilor. Variabilele de stare din model
trebuie să reprezinte probabilităţile Pi(t), i=1, n , ca, la momentul curent
t, echipamentul să se afle în “stările” prestabilite, Si, i=1, n ( “echipament
nou/reînnoit”, “uzură incipientă” etc). Aceste stări (ale căror probabilităţi
sunt descrise de model) trebuie astfel adoptate, încât un sistem de
diagnoză să le poată discerne.

2. O cale de reacţie rapidă, care include un sistem de diagnoză şi un bloc


de ajustare a parametrilor modelului Markov. Sistemul de diagnoză este
special conceput pentru a estima măsura probabilistică cu care “regimul
108 Cap. 1. Introducere

curent de fiabilitate” – definit printr-un ansamblu de criterii – aparţine


stărilor prestabilite, Si, i=1, n , admise la construcţia modelului Markov.

Sistemul de diagnoză este conceput în abordare statistică şi furnizează


ciclic valori estimate ale probabilităţilor stărilor pe baza măsurării unor
mărimi caracteristice ale echipamentului supervizat. În esenţă sistemul
de diagnoză este un sistem de recunoaştere a claselor (stărilor) Si, i=1, n
, pe baza prelucrării unor vectori ai mărimilor măsurate, reprezentând
variabilele-criteriu pentru diagnoză. Abordarea statistică a recunoaşterii
stărilor Si, i=1, n , face din sistemul de diagnoză un estimator al
probabilităţilor ~pi , ca – la ciclul curent de diagnoză – echipamentul să
se afle efectiv în stările prestabilite Si.

Dacă probabilităţile Pi(t) din modelul Markov se modifică în


conformitate cu parametrii modelului Markov şi cu iniţializarea
vectorului de stare, probabilităţile ~p( t ) dau evoluţia “regimului de
fiabilitate” a echipamentului, aşa cum acesta este reflectat de sistemul de
diagnoză. Dacă diagnoza s-ar face fără erori, atunci ~pi ( t ) ar fi
probabilităţile efective (conform realităţii fizice) ale stărilor Si, i=1, n .

La fiecare ciclu de diagnoză, blocul de ajustare a modelului Markov


modifică parametrii acestuia, astfel încât – la momentul respectiv –
probabilităţile Pi să fie “cât mai apropiate” (în sensul unui criteriu
prestabilit) de probabilităţile ~pi , estimate în cadrul operaţiei de
diagnoză.
Fie iTdac , i=1,2,…, momentele discrete în care se realizează operaţiile de
diagnoză + ajustare parametri + calcul actualizat al timpului optimal de
reînnoire, T*. Diagrama temporală care ilustrează efectul căii de reacţie
rapidă asupra timpului optimal de reînnoire, T*, este prezentată în figura
6.3. La momentul t=0, modelul Markov stă la baza determinării
intervalului de funcţionare fără reînnoire [0, T*(0)]. Evident, calculul are
la bază ipoteza că în acest interval parametrii modelului de fiabilitate nu
se modifică. La momentul Tdac se reactualizează modelul Markov, pe
baza informaţiilor obţinute de la sistemul de diagnoză, şi se recalculează
timpul optimal de reînnoire, T*(Tdac). Calculul are la bază ipoteza că în
Cap. 1. Introducere 109

intervalul [Tdac, T*(Tdac)] nu se modifică parametrii de fiabilitate a


echipamentului. În general, pe măsură ce creşte indicele i al ciclului de
diagnoză+ajustare+calcul al timpului de reînnoire, se reduce durata
intervalului [iTdac, T*(Tdac)] în care modelul de fiabilitate se consideră
invariant.

Fig. 6.3. Calculul ciclic al timpului de reînnoire

În figura 6.3, evoluţia mărimii intervalelor [0, T*(0)], [Tdac, T*(Tdac)], [2Tdac,
T*(2Tdac)] … este strict descrescătoare. În principiu, este însă posibilă şi o
evoluţie nemonotonă a mărimii intervalelor menţionate.

3. O cale de reacţie lentă. Structura care ar conţine numai căile directă şi


de reacţie rapidă, descrise anterior, admite că sistemul de diagnoză – de
tip “pattern recognition” – a fost complet instruit într-un regim
preliminar, pe baza unor date culese din regimurile anterioare de
funcţionare a echipamentului. Succesiunea reînnoirilor, realizate pe baza
strategiei analizate, oferă informaţii noi care permit continuarea
procesului de instruire a sistemului de diagnoză.

La fiecare reînnoire se poate compara răspunsul sistemului de diagnoză


cu situaţia stării fizice a echipamentului, constatată în cursul operaţiei de
reînnoire. Pe această bază se completează “lotul de instruire” şi – în
110 Cap. 1. Introducere

consecinţă – se continuă procesul de instruire a sistemului de diagnoză.


Aceeaşi operaţie se efectuează în cazul restabilirilor, adică al reînnoirilor
efectuate în caz de defectare.

Întrucât ajustarea sistemului de diagnoză se face numai în urma


reînnoirilor şi restabilirilor, frecvenţa acestora este mult mai redusă decât
în cazul reacordării modelului Markov pe calea de reacţie rapidă.

6.2. Structura sistemului evolutiv de reînnoire

Schema de principiu a sistemului evolutiv de reînnoire care are la bază


principiile menţionate în paragraful anterior este dată în figura 6.4.

Fig. 6.4. Structura sistemului evolutiv de reînnoire

Principalele subsisteme din cadrul acestei scheme sunt următoarele:


1. Subsistemul de reînnoire (SR). Acesta conţine modelul Markov (MM)
de fiabilitate, care furnizează evoluţia probabilităţilor stărilor, p( t ) , pe
baza integrării ecuaţiilor de stare, în care intervin parametrii MM, incluşi
în vectorul p MM . Blocul MM furnizează densitatea de probabilitate a
Cap. 1. Introducere 111

timpului de funcţionare f(t) şi funcţia de fiabilitate a echipamentului, R(t).


Blocul MR implementează modelul de reînnoire al echipamentului.
Primind la intrare funcţiile R(t) şi f(t), blocul MR oferă la ieşire funcţia de
reînnoire H(t) şi funcţia intensităţii reînnoirilor, h(t), ambele aceste
funcţii fiind implicate în determinarea soluţiei optimale de reînnoire.
Această soluţie se obţine în blocul de decizie D, căruia i se impune
criteriul de optimizare I. Rezultatul furnizat de acest bloc este intervalul
de timp optimal T*, până la următoarea reînnoire.

2. Subsistemul de adaptare a modelului de fiabilitate (SAMF), care


furnizează parametrii curenţi ai modelului de tip Markov, prin ajustarea
acestora la momentele discrete iTdac. El conţine un sistem instruibil de
diagnoză (SID). Pe baza semnalelor xi(t), date de senzorii Si, analizoarele
Ai realizează o serie de prelucrări pentru extragerea trăsăturilor necesare
detectării situaţiilor de diagnoză. Blocul C selectează trăsăturile şi
formează vectorul v k [i]= v k ( iTdac ) , care – reflectând “regimul curent de
fiabilitate” – trebuie clasificat la stările (clasele) Si, i  1, n . Indicele k
denotă ciclul curent de funcţionare dintre două reînnoiri.

Structura SID şi algoritmul de instruire sunt încadraţi abordării statistice,


astfel încât rezultatele clasificării vectorilor v reprezintă estimaţii ale
probabilităţilor stărilor ( ~pi , i  1, n ), conform datelor reale din
~
echipamentul diagnosticat. La momentele iTdac, vectorul p al acestor

probabilităţi trebuie să fie impus modelului Markov, ca “răspuns” pe stare,
adică starea p a MM trebuie adusă – prin ajustarea parametrilor p MM -
~
“cât mai apropiată” de vectorul p . Figura 6.5 ilustrează principiul de

adaptare a modelului Markov, pe baza informaţiilor primite de la sistemul
de diagnoză.
112 Cap. 1. Introducere

Fig. 6.5. Principiul de adaptare a modelului Markov

3. Subsistemul de instruire (SI) fructifică informaţiile care se obţin, privind


starea efectivă a echipamentului, la fiecare reînnoire sau restabilire a
acestuia. Aceste informaţii sunt utilizate pentru completarea lotului de
date, pe baza căruia se realizează instruirea sistemului de diagnoză. La
fiecare reînnoire/restabilire, se reţin datele:
- vectorul v kf , care reprezintă ultimul vector transmis la intrarea sistemului
de diagnoză, în cadrul ciclului k de reînnoire;
- vectorul p k , reprezentând “răspunsul ideal” pe care ar fi trebuit să-l dea
sistemul de diagnoză, răspuns obţinut pe baza examinării stării fizice a
echipamentului, în cursul operaţiei de reînnoire (răspunsul efectiv al
sistemului de diagnoză este ~p kf ).

Vectorul v kf şi vectorul p k sunt mărimea de intrare, respectiv mărimea


“ţintă”, în procesul de instruire care se desfăşoară în cadrul blocului BISD.
Cap. 1. Introducere 113

Răspunsul efectiv, ~p kf , al sistemului de diagnoză la aplicarea vectorului de


intrare v kf , se compară cu mărimea ţintă p k şi – în funcţie de eroarea
rezultată – se ajustează vectorul parametrilor, p SID , al sistemului instruibil de
diagnoză (SID).

6.3. Metode de evaluare a stării echipamentelor în strategia


evolutivă de reînnoire, prin sisteme de diagnoză

6.3.1. Etapele evaluării stării echipamentelor

În scopul realizării unei predicţii cât mai exacte a momentului proximei


reînnoiri este necesar ca parametrii modelului Markov să fie ajustaţi periodic
(§ 6.1.2), astfel încât să fie cunoscută evoluţia reală a stărilor de uzură a
echipamentului. Pentru realizarea acestui lucru, este necesar să se definească
stările de uzură a echipamentului în corelare cu stările admise de modelul
Markov. Stările ce vor caracteriza echipamentul trebuie să fie în acelaşi număr
cu cele admise de modelul Markov şi să aibă aceeaşi succesiune. Evaluarea
stării reale a echipamentului considerat se poate face într-unul dintre modurile
următoare:
a) Analizând mărimile măsurate din proces, mărimi caracterizate de
evoluţii lente în timp.

b) Utilizând tehnicile “clasice” de diagnoză, bazate pe metode de


prelucrare a spectrelor semnalelor măsurate din proces.

c) Utilizând metode de diagnoză pe bază de model. În acest caz, se


consideră că parametrii identificaţi în timp real au variaţii lente,
conforme cu evoluţia “stării” din modelul Markov de fiabilitate a
echipamentului.
114 Cap. 1. Introducere

d) Prin tehnici specifice unui echipament / subansamblu dat, cum este


de exemplu, metoda impulsurilor de şoc, în cazul lagărelor de
rostogolire.

Indiferent de metodologia aleasă pentru evaluarea stării reale a


echipamentului, este necesar să se precizeze care este modalitatea de
definire a stărilor echipamentului precum şi cum se estimează probabilităţile
~
pi ( t ) ale acestor stări pe baza datelor măsurate de setul de traductoare
adoptat.

În cele ce urmează se va prezenta prima modalitate de evaluare a stării


echipamentului: analiza evoluţiilor lente ale unor mărimi măsurate din proces.
În principiu, procedura care va fi prezentată în continuare poate fi aplicată nu
numai mărimilor fizice lent variabile măsurate direct din proces, dar şi
mărimilor rezultate prin aplicarea altor modalităţi de diagnoză (mărimi de tip
“criteriu”, în raport cu care se face diagnoza, abaterile parametrilor identificaţi,
faţă de cei “normaţi” – la metode bazate pe model, mărimi rezultate prin
analiza reziduurilor etc).

Etapele care trebuie parcurse pentru evaluarea stării echipamentului sunt


următoarele:
Etapa 1. Se stabilesc mărimile din proces care se vor utiliza în acest scop.
Aceste mărimi se aleg astfel încât să reflecte cât mai bine evoluţia uzurii
echipamentului respectiv.
Exemplu: Pentru un lagăr se pot măsura: temperatura acestuia,
amplitudinea vibraţiilor şi/sau nivelul zgomotului produs. În
conformitate cu specificaţiile tehnice ale echipamentului, pentru fiecare
mărime selectată se stabilesc limitele care definesc starea de bună
funcţionare şi fiecare stare de uzură.
Cap. 1. Introducere 115

Etapa 2. Definirea stărilor ce caracterizează echipamentul. În esenţă, trebuie


să se precizeze combinaţiile mărimilor măsurate care definesc o anumită
stare. Această operaţie se poate realiza numai cu o cunoaştere foarte exactă
a echipamentului, a cerinţelor tehnice şi tehnologice impuse şi a
performanţelor pe care trebuie să le realizeze echipamentul. Problema
definirii stărilor este cu atât mai complexă, cu cât numărul mărimilor
măsurate este mai mare şi cu cât numărul domeniilor de variaţie considerate
la aceste mărimi, pentru caracterizarea stării de uzură, este mai mare. Cazul
cel mai simplu, când există o singură mărime măsurată, x, se rezolvă imediat,
definindu-se stările cu relaţiile următoare:

dacă xi min  x  xi max  starea Si , i=0, 1, 2, ... m (6.1)

Numărul de subdomenii în care se împarte domeniul mărimii măsurate, x, va


fi egal cu numărul stărilor modelului Markov. În cazul în care avem deja două
mărimi măsurate, problema definirii stărilor se complică. În ipoteza că fiecare
dintre cele două mărimi sunt caracterizate de câte trei domenii de
funcţionare:

D1 - funcţionare corectă;
D2 - funcţionare cu uzură;
D3 - stare de defectare,

atunci, stările echipamentului se pot defini astfel:


- starea S0 - de funcţionare corectă – pentru:

x1 D11 şi x2 D12 (6.2)

- starea S1 - de funcţionare cu uzură gradul I – pentru:


116 Cap. 1. Introducere

x1 D12 şi x2 D12 sau x1 D11 şi x2 D 22 (6.3)

- starea S2 - de funcţionare cu uzură gradul II – pentru:

x1 D12 şi x2 D 22 (6.4)

- starea S3 - de defectare, pentru:

x1 D13 şi x2 D i2 , i=1,2,3 sau x1 D1i , i=1,2,3 şi x2 D 32 (6.5)

În cazul prezentat este necesar ca şi modelul Markov să admită acelaşi număr


de stări şi în aceeaşi ordine. Dacă modelul Markov ar admite o singură stare
de uzură, atunci stările S1 şi S2 de mai sus ar fuziona, modelul Markov
rezultând mai simplu.

Etapa 3. Evaluarea probabilităţilor aferente stărilor echipamentului, pe baza


mărimilor măsurate, şi în conformitate cu definirea stărilor de la punctul
anterior. Pentru realizarea acestei operaţii, în cele ce urmează se propun
proceduri bazate fie pe reţele neurale, fie pe tehnici fuzzy.

6.3.2. Tehnici neuronale de evaluare a stării echipamentelor

Scopul urmărit este obţinerea unor estimări ale probabilităţilor aferente fiecărei
stări a modelului Markov. Aceste probabilităţi se estimează printr-o reţea
neuronală, având următoarele proprietăţi:
 numărul de intrări este egal cu numărul de mărimi măsurate;
 numărul de ieşiri este egal cu numărul stărilor corespunzătoare
modelului Markov;
Cap. 1. Introducere 117

 funcţiile de activare ale stratului de ieşire trebuie să permită evaluarea


nuanţată a gradelor de apartenenţă la stările Si. În acest sens, soluţia
firească o reprezintă stratul de ieşire cu funcţii de activare liniare;
 straturile ascunse trebuie să aibă funcţii de activare sigmoidale, pentru
a permite reducerea erorilor de aproximare a densităţilor de
probabilitate, p( x | Si ). Eroarea de aproximare depinde şi de arhitectura
reţelei neuronale, adică de numărul de straturi ascunse şi numărul de
neuroni din fiecare strat.
Funcţionarea reţelei neuronale în regimul de instruire este ilustrată în figura
6.6. Fiecare vector xk din lotul de instruire are drept componente mărimile
măsurate din proces, stabilite conform etapei 1 prezentate în § 6.3.1. Vectorul
ţintă tk, aferent intrării xk, are structura:

tk = (0, 0, ... , 0, 1, 0, ... , 0)T (6.6)


  
0 i n-1

dacă xk corespunde stării Si. Corespondenţa vectorilor xk, din secvenţa de


instruire, la stările Si, se face conform procedurii aferente etapei 2, prezentate
în § 6.3.1.

Fig. 6.6. Instruirea reţelei neuronale


118 Cap. 1. Introducere

O problemă importantă o reprezintă generarea secvenţei de instruire. Pentru


estimarea funcţiilor p( x | Si ), cu niveluri apropiate de eroare, este necesar ca
numărul vectorilor din secvenţa de instruire, aferenţi fiecărei stări Si, să nu
difere foarte mult. În consecinţă, o soluţie simplă de formare a secvenţei de
instruire constă în realizarea următoarelor operaţii:
 generarea aleatoare, cu distribuţie uniformă, a unor valori numerice
cuprinse în domeniile D mj ale mărimilor xj, j=1, ..., n, domenii ce definesc
starea curentă Si;
 formarea numărului propus de vectori din starea Si;
 repetarea operaţiilor pentru toate stările din modelul Markov;
 organizarea secvenţei de instruire { xk, tk; k=1, ..., n}, într-o succesiune
aleatoare a vectorilor generaţi.

După cum este cunoscut, calitatea procesului de instruire - evaluată prin


dinamica erorii - se obţine, de regulă, prin încercarea mai multor variante de
structură a reţelelor neuronale. În regim de funcţionare (diagnoză), pentru
estimarea probabilităţilor ~pi , i  0,n  1, este necesar să se realizeze
normarea ieşirilor reţelei neuronale, astfel încât suma valorilor normate ale
ieşirilor să fie egală cu unitatea. Schema de principiu a estimatorului neuronal
pentru probabilităţile pik  p (Si | xk ), este dată în figura 6.7.

Fig. 6.7. Schema de principiu a estimatorului neuronal


Cap. 1. Introducere 119

Pentru exemplificarea metodologiei de estimare neuronală a probabilităţilor


stărilor din modelul Markov, a fost considerat cazul unui echipament ce poate
admite două stări de funcţionare:

S0 = starea de bună funcţionare, caracterizată prin apartenenţa tuturor


mărimilor caracteristice la domeniile de funcţionare fără uzură;
S1 = starea de funcţionare cu uzură, când cel puţin una dintre mărimile
caracteristice aparţine domeniului de uzură.

Observaţie: Stările de funcţionare cu uzură sunt acceptate atât timp cât ele
nu conduc la o alterare a performanţelor echipamentului, încât mărimile de
ieşire să iasă din intervalele de toleranţă. Starea de defectare a
echipamentului, notată cu S2, corespunde depăşirii limitelor de către cel puţin
una din mărimile caracteristice. Pentru exemplificare, a fost considerat un
echipament caracterizat de două mărimi caracteristice x1 şi x2. Mărimile
măsurate, x1 şi x2, sunt considerate cu variaţii lente în timp (temperaturi,
amplitudini, deplasări etc). S-a considerat că mărimile măsurate se încadrează
în limitele:

0  x1  60 şi 20  x2  80 (6.7)

Pentru fiecare mărime au fost definite intervalele de funcţionare fără uzură şi


de defectare. Astfel, pentru x1, intervalul 0 - 60 a fost împărţit astfel:

Domeniul de variaţie Codificare domeniu Observaţii


0 – 20 D11 Funcţionare fără uzură

20 – 40 D12 Funcţionare cu uzură


120 Cap. 1. Introducere

40 – 60 D13 Defectare

iar pentru mărimea x2 a rezultat:

Domeniul de variaţie Codificare domeniu Observaţii


20 – 40 D12 Funcţionare fără uzură

40 – 60 D 22 Funcţionare cu uzură

60 – 80 D 32 Defectare

Stările ce caracterizează echipamentul considerat pot fi definite astfel:

S0 : x1  D11 şi x2  D12

S1 : ( x1 D11 şi x2 D 22 ) sau ( x1 D12 şi x2 D12 )

sau ( x1 D12 şi x2  D 22 ) (6.8)

S2 : ( x1 D13 şi  x2 ) sau ( x2 D 32 şi x1 )

Reţeaua neuronală utilizată are două straturi ascunse, un strat de intrare


format din doi neuroni şi un strat de ieşire format din trei neuroni. Instruirea
s-a realizat în 5000 de paşi, obţinându-se o eroare de instruire cu o evoluţie
dată în figura 6.8.
Cap. 1. Introducere 121

Fig. 6.8. Eroarea de instruire a clasificatorului neuronal

Răspunsul clasificatorului pentru diferite combinaţii ale mărimilor x1 şi x2, este


prezentat în figurile 6.9-a … 6.9-f. Valorile corespunzătoare ale mărimilor de
intrare x1 şi x2, corespunzătoare situaţiilor a, b, …, f din figura 6.9, sunt cele
din tabelul 6.1. Se constată că sistemul de diagnoză răspunde printr-un
răspuns nuanţat, oferind evaluări ale probabilităţilor stărilor ~p0 , ~p1 , ~p2 .
122 Cap. 1. Introducere

Fig. 6.9. Răspunsul clasificatorului neuronal

Tabelul 6.1
Fig.6.9
Intrare a b c d e f
x1 5 15 15 20 30 45
x2 25 35 45 50 55 70

6.3.3. Tehnici fuzzy de evaluare a stării echipamentelor


Cap. 1. Introducere 123

Diagnosticarea stării echipamentului, caracterizată de vectorul x al


trăsăturilor, se poate face printr-o procedură similară celei din paragraful
anterior, cu deosebirea că extrapolarea informaţiilor nu se realizează prin
procese de instruire, ci are la bază tehnici fuzzy. Conform metodologiei
prezentate în § 6.3.1, mulţimile care se introduc în cadrul primei etape nu se
definesc în sens crisp, ci ca mulţimi fuzzy. În consecinţă, pentru fiecare
mărime măsurată, xi, i=1, m , trebuie stabilite următoarele elemente:

 numărul de valori lingvistice, VLj, j=1, Ni , prin care se evaluează mărimea


respectivă;
 suportul mulţimilor fuzzy, aferente valorilor lingvistice considerate:
S i j = { x i | x i j min  x i  x i j max } , j=1, N i , i=1, m
 forma şi parametrii funcţiilor de apartenenţă  j ( xi ), j=1, Ni .

În cadrul etapei a doua din metodologie, pe lângă definirea stărilor din MM al


echipamentului, trebuie realizată evaluarea lingvistică a probabilităţii ca
echipamentul să se afle în starea Sk , k  0,n  1 . Se adoptă acelaşi număr de
valori lingvistice, pentru evaluarea tuturor probabilităţilor P(Sk|x), universul
de discurs fiind mulţimea numerelor din intervalul [0,1]. Se adoptă:

 valorile lingvistice, VL l , l=1,r ;


 suportul mulţimilor fuzzy , aferente valorilor lingvistice considerate:
k ; Ml = { p k | p k l min  p k l  p k l max } , l=1, r , k  0,n  1 ;
 forma şi parametrii funcţiilor de apartenenţă  l ( pk ) , l=1,r , unde r
este numărul valorilor lingvistice prin care se face evaluarea
probabilităţilor pk  P ( S k | x ).

Problema cea mai dificilă o constituie deducerea valorilor lingvistice ale


probabilităţilor stărilor, în funcţie de mulţimile fuzzy considerate la evaluarea
lingvistică a mărimilor măsurate xi. Această problemă se rezolvă prin
124 Cap. 1. Introducere

elaborarea - pe baza cunoştinţelor apriorice - a n seturi de reguli, prin care se


face evaluarea tuturor celor n probabilităţi din MM. Astfel, pentru variabila
de stare pk , setul de reguli are forma:
.
regula s: IF x 1 =VL  AND x 2 =VL  AND ... AND x m =VL  THEN
pk =VL 
.

Evaluarea fiecărui set de reguli se poate face prin metodele de inferenţă


uzuale( MAX-MIN; MAX-PROD; SUM-PROD ) şi are ca rezultat deducerea
funcţiilor de apartenenţă aferente concluziei globale din cadrul setului
respectiv de reguli.

Defuzzificarea permite deducerea valorilor crisp, ~p k , k  0, n  1,


reprezentând “răspunsul” evaluatorului fuzzy privind estimarea
probabilităţilor pk.

Pentru a obţine ieşiri care să poată fi tratate ca estimări ale probabilităţilor


P(Sk|x), privind apartenenţa vectorului x la stările Sk, se realizează normarea
ieşirilor evaluatorului fuzzy, ca şi în cazul evaluatorului neuronal. Schema de
principiu, care ilustrează metoda propusă pentru estimarea stării
echipamentului, este prezentată în figura 6.10.
Cap. 1. Introducere 125

Fig. 6.10. Schema de principiu a clasificatorului fuzzy

Exemplu: Se consideră situaţia prezentată în paragraful anterior: un


echipament caracterizat de două mărimi, x1 şi x2, cu domeniile de variaţie
(6.7). Se realizează normarea variabilelor de intrare în domeniile [-1,+1] astfel:
X1=0.03333x1 –1 şi X2=0.03333(x2 – 20) –1.

Fie cazul când se adoptă N1=N2=5, adică evaluarea mărimilor de intrare se face
prin cinci valori lingvistice. Suporturile variabilelor lingvistice NB, NS, Z, PS şi
PB, prin care se evaluează variabilele normate se aleg, de exemplu, de forma:

[ -1.0, -a ] ; [ -b, 0.0 ] ; [-c, +c] ; [0.0, +b] ; [ +a, +1.0 ] pentru x1
[ -1.0, -a ] ; [ -b, 0.0 ] ; [-c, +c] ; [0.0, +b] ; [ +a, +1.0 ] pentru x2

Funcţiile de apartenenţă se pot adopta sub diverse forme: triunghiulare,


trapezoidale, bazate pe funcţii S şi , singleton etc. De exemplu, în figura
6.11-a şi 6.11-b sunt ilustrate funcţii de apartenenţă de formă trapezoidală,
respectiv de formă triunghiulară, iar în figura 6.11-c – prin funcţii singleton.
Evaluarea probabilităţilor de apartenenţă la stările S0 .. S2 se poate face prin
126 Cap. 1. Introducere

valorile lingvistice Z, Z+, S, M şi B, definite prin funcţii de apartenenţă de tip


singleton.

Pentru determinarea valorilor lingvistice aferente probabilităţilor ca MM să


se afle în starea S0 , se poate utiliza tabelul de adevăr 6.2. Pentru stările S1 şi
S2, tabelele de adevăr se întocmesc ţinând cont de combinaţiile mărimilor
măsurate x1 şi x2.

Fig. 6.11. Funcţii de apartenenţă

Tabelul 6.2
x1
x2 NB NS Z PS PB
NB B M S Z+ Z
NS M M S Z+ Z
Z S S S Z+ Z
Cap. 1. Introducere 127

PS Z+ Z+ Z+ Z+ Z
PB Z Z Z Z Z

Pentru calculul estimărilor probabilităţilor p̂k ,k  0,n  1 , se pot utiliza


facilităţile oferite de mediul “fuzzy” din cadrul MATLAB-ului:

 procesarea simultană, prin tehnici fuzzy, a două mărimi de intrare;

 utilizarea unui număr maxim de 7 valori lingvistice, pentru fiecare


mărime de intrare, cât şi pentru evaluarea probabilităţilor stărilor;

 selectarea următoarelor forme pentru funcţiile de apartenenţă:


triunghiulară, trapezoidală, bazate pe funcţii S şi ;

 selectarea următoarelor metode de inferenţă: MAX–MIN, MAX–PROD,


SUM–PROD;
 afişarea “reliefului” variabilei de ieşire, ~pk , precum şi a “liniilor de nivel”
aferente;
 încadrarea blocurilor de estimare fuzzy în mediul MATLAB, permiţând
generarea unor scheme SIMULINK.

În cazul exemplului considerat, schema de principiu pentru deducerea


estimărilor ~p1 , ~p2 şi ~p3 este dată în figura 6.12.
128 Cap. 1. Introducere

Fig. 6.12. Schema clasificatorului fuzzy

Notaţiile din figură au următoarele semnificaţii:


GF – generator de funcţii, care va furniza evoluţia mărimii măsurate;
BF1, BF2, BF3 – blocuri fuzzy care furnizează valorile variabilelor p̂k .

Implementarea schemei din figura 6.12 a condus la schema SIMULINK


din figura 6.13. Pentru mărimile de intrare s-au considerat variaţii de tip
rampă, peste care s-a suprapus un zgomot. Blocurile fuzzy au fost definite
pe baza datelor cuprinse în tabelele de forma 6.2, fiecare bloc conţinând
câte 25 de reguli de tipul “IF..…THEN..…”.

Fig. 6.13. Schema SIMULINK a clasificatorului fuzzy


Pentru îmbunătăţirea răspunsului dat de clasificatorul fuzzy, se poate proceda
la mărirea numărului de valori lingvistice prin care sunt caracterizate mărimile
de intrare. În acest caz va creşte numărul de reguli de tipul IF..THEN aferente
fiecărui bloc fuzzy, însă probabilităţile de apartenenţă, ~pk , k  1,3 , la stările
de uzură ale echipamentului, vor putea fi determinate cu o precizie mai bună.
Cap. 1. Introducere 129

6.4. Reinstruirea sistemului de diagnoză

Fiecare intervenţie de tipul: reînnoire sau restabilire prilejuieşte confruntarea


stării reale a echipamentului/subansamblului, cu starea prezisă de către
subsistemul de diagnoză. În practică pot apare diferenţe semnificative,
generatoare de reînnoiri premature sau de avarii. Cauzele care determină
apariţia acestor diferenţe sunt:

1 – modelul utilizat de operatorul uman, în baza căruia acesta


interpretează datele măsurate şi stabileşte proprietăţile sistemului de
diagnoză (loturile de instruire - la utilizarea reţelelor neuronale,
respectiv procedura de fuzzificare şi baza de reguli – la utilizarea
tehnicilor fuzzy), nu corespunde în întregime realităţii;

2 – modelul iniţial utilizat de operatorul uman a fost corect, însă în


succesiunea reînnoirilor se produce o derivă a parametrilor modelului
de diagnoză. Această derivă poate fi cauzată de un proces de uzură
(obţinută pe un orizont de timp mai larg) a echipamentului ce conţine
subansamblul analizat.
Principalii parametri care intervin în modelul decizional de diagnoză, inclusiv
în situaţia când diagnoza este realizată de către un operator uman, au
semnificaţia de praguri impuse unor mărimi fizice sau unor parametri.

Exemple:
 pragurile mărimilor fizice cu variaţii lente în timp, pe baza cărora se
definesc stările de fiabilitate (în § 6.3.2, aceste praguri delimitau
domeniile notate prin D ij , i  1,3 , j  1,2 );
130 Cap. 1. Introducere

 pragurile impuse nivelurilor impulsurilor, în cadrul metodei


impulsurilor de şoc;
 pragurile impuse mărimilor de similaritate a spectrelor, la diagnoza
pe baza analizei spectrale a semnalelor;
 praguri ale variaţiilor parametrilor sistemului identificat sau ai
modelului reziduului etc.

Fie pi, i  1,m , pragurile care intervin în cadrul modelului decizional adoptat
pentru diagnoză. Prin intermediul acestui model decizional, poate fi conceput
subsistemul de diagnoză, în varianta neuronală sau în varianta fuzzy. Astfel,
în studiile de caz analizate, parametrii pi determină distribuţia datelor din lotul
de instruire a reţelei neuronale – la diagnoza neuronală, iar în cazul utilizării
logicii fuzzy, ei afectează procedura de fuzzificare (definirea suportului
mulţimilor fuzzy aferente valorilor lingvistice considerate).

La constatarea unei neconcordanţe a răspunsului subsistemului de diagnoză,


faţă de realitatea constatată în timpul operaţiei de reînnoire/restabilire,
trebuie ajustate pragurile pi, ale modelului de diagnoză, pentru ca răspunsul
acestuia să concorde cu realitatea fizică. Se vor examina, în cele ce urmează,
trei situaţii care pot apare la sfârşitul unui ciclu de reînnoire:

I. Cazul când evaluarea stării fizice la reînnoirea echipamentului corespunde


cu răspunsul subsistemului de diagnoză. În acest caz parametrii pi, i  1,m nu
se modifică şi se continuă ciclul următor de reînnoire, cu aceiaşi parametri ai
subsistemului de diagnoză.

II. Cazul când diagnoza a furnizat o evaluare prea “pesimistă” şi – la ciclul


respectiv – s-a realizat o reînnoire prematură. Parametrii pi trebuie ajustaţi,
astfel încât răspunsul subsistemului de diagnoză să corespundă stării reale a
echipamentului. De exemplu, în cadrul studiilor de caz analizate, pragurile
care delimitează domeniile D ij , i  1,3 , j  1,2 , trebuie ridicate.
Cap. 1. Introducere 131

III. Cazul când s-a produs o restabilire, deci diagnoza a fost prea “optimistă”.
Parametrii pi trebuie ajustaţi în sens invers faţă de cazul anterior.

În cazurile II şi III, modificarea parametrilor pi trebuie făcută în cadrul unui


ciclu iterativ, fiecare iteraţie realizând următoarele operaţii:

 corecţia parametrilor pi;

 reacordarea subsistemului de diagnoză. Această operaţie este foarte


simplă în cazul utilizării variantei ce utilizează logica fuzzy, întrucât
pragurile pi intră ca parametri în procedura de fuzzificare. În cazul
variantei neuronale, pe baza noilor valori ale pragurilor, se
corectează vectorii t din lotul de instruire. Apoi se realizează o
ajustare a reţelei neuronale, prin intermediul unui regim de instruire
care porneşte de la parametrii curenţi ai reţelei.

 testarea concordanţei răspunsului subsistemului de diagnoză, cu


starea fizică a echipamentului, constatată la operaţia de
reînnoire/restabilire. Dacă se constată această concordanţă, ciclul
iterativ este întrerupt, sistemul fiind pregătit pentru următorul pas
din succesiunea reînnoirilor.

La pasul r al ciclului iterativ menţionat, corecţia parametrilor pi se poate face


conform relaţiei:

pir  L { pir } (6.9)

unde L {  } şi L {  } sunt operatori liniari de “stimulare” (reinforcement),


utilizaţi în domeniul sistemelor instruibile. Aceşti operatori se pot defini
astfel:
132 Cap. 1. Introducere

L { pir }  pir 1  ( 1   ) pir 1 (6.10)

L { pir }  pir 1 (6.11)

unde parametrul  se alege în domeniul (0,1). Operatorul L {  } determină


creşterea valorii pragului pi iar operatorul L {  } realizează reducerea acestui
prag. Parametrul  determină dinamica procesului de instruire: cu cât  este
mai mare, cu atât viteza de ajustare a pragurilor este mai redusă.

CAPITOLUL 7

FIABILITATEA ECHIPAMENTELOR DE CALCUL

7.1. Introducere

În acest capitol se prezintă arhitectura echipamentelor de calcul dintr-un


singur punct de vedere, şi anume cel al fiabilităţii. Prezentarea nu va fi
exhaustivă şi nici matematizată; se vor folosi mai ales exemple pentru a ilustra
cum felurite consideraţii despre fiabilitate influenţează structura
echipamentelor de calcul.
Cap. 1. Introducere 133

Principalul subiect al teoriei fiabilităţii constă în construirea de echipamente


cât mai fiabile din componente nefiabile. Dacă un echipament ar funcţiona
numai atunci când toate componentele sale ar fi funcţionale, ar fi virtual
imposibil de construit un echipament complex, pentru că fiabilitatea ar
descreşte exponenţial cu numărul de componente din structura sa.

Principala unealtă folosită în construirea echipamentelor complexe este


abstracţia. Un echipament este construit pe nivele: nivelul B este alcătuit din
componente de nivel A. La rândul lor, componente de nivel B sunt folosite ca
şi cum ar fi atomice, indivizibile, pentru a construi nivelul C, şi aşa mai departe.
Acest proces este inspirat din matematică, unde lemele şi teoremele sunt
folosite drept componente elementare în demonstraţiile altor leme şi
teoreme. În acest capitol se prezintă alcătuirea unor nivele din arhitectura
echipamentelor de calcul din punctul de vedere al fiabilităţii pe care o oferă
nivelelor superioare. Astfel putem distinge:

 Nivele care măresc fiabilitatea, construind un echipament mai fiabil din


componente mai puţin fiabile. Acest lucru este obţinut folosind
redundanţă în stocarea sau calculul informaţiei. Acest tip de nivel este cel
mai adesea folosit în construcţia calculatoarelor contemporane.

 Nivele care expun lipsa de fiabilitate nivelelor superioare, lăsându-le pe


acestea să rezolve imperfecţiunile. Nivelele superioare au adesea
informaţii suplimentare despre cerinţele reale de fiabilitate ale
echipamentului şi ca atare pot construi fiabilitatea pe măsura necesităţilor.
 Anumite nivele partiţionează resursele în părţi oarecum independente,
izolate una de alta. Partiţionarea are drept efect izolarea defectelor (fault
isolation), astfel încât o defecţiune într-o parte să nu afecteze celelalte
părţi. În calculatoare această tehnică este folosită în sistemele de operare
şi clustere-le de calculatoare.
134 Cap. 1. Introducere

La ora actuală circuitele integrate pe scară largă (Very Large Scale Integrated
circuits, VLSI) au ajuns la nivele incredibile de fiabilitate. Ca atare arhitecţii
calculatoarelor privesc în general nivelul hardware ca fiind ”perfect” şi
folosesc această abstracţie foarte convenabilă în proiectarea nivelelor
superioare. Anumite clase de aplicaţii au nevoie însă de o fiabilitate foarte
ridicată (de exemplu, controlul de trafic aerian, supervizarea centralelor
nucleare sau a echipamentelor militare). În astfel de misiuni critice
proiectanţii echipamentelor de calcul iau în considerare şi posibilitatea
defectelor hardware, pe care le tratează în software.

Miniaturizarea continuă a circuitelor integrate va conduce la schimbări în


această stare de fapt, astfel încât trebuie să ne aşteptăm ca în viitor circuitele
să conţină din ce în ce mai multe defecţiuni şi să fie din ce în ce mai sensibile
la fluctuaţii termodinamice şi particule de înaltă energie din radiaţia cosmică
sau chiar din degradarea radioactivă a circuitului integrat respectiv. Astfel de
schimbări vor necesita o reproiectare completă a arhitecturii echipamentelor
de calcul.

Ingredientul cel mai folosit pentru a construi echipamente fiabile este


redundanţa. În cazul echipamentelor de calcul putem distinge două genuri de
redundanţă, spaţială şi temporală:

 Redundanţa spaţială foloseşte mai multe componente decât strictul


necesar pentru a implementa un anumit echipament de calcul. Resursele
adiţionale fac calcule suplimentare şi rezultatele sunt comparate între ele.
În general, cu cât redundanţa unui echipament de calcul este mai mare, cu
atât poate detecta sau tolera mai multe erori.

 Redundanţa temporală constă în folosirea aceluiaşi dispozitiv pentru a


calcula acelaşi lucru în mod repetat, după care rezultatele sunt comparate
între ele.
Cap. 1. Introducere 135

Defectele ce afectează componenta soft a unui echipament de calcul se pot


clasifica în două mari categorii:

 Erori tranzitorii, care se manifestă printr-o funcţionare temporar eronată


a unei componente, dar nu prin defectarea ei definitivă. În echipamentele
de calcul contemporane, cea mai mare parte a erorilor sunt tranzitorii.
 Erori permanente care se produc la un moment dat şi persistă până când
echipamentul este reparat. În această categorie includem şi defectele din
faza de proiectare sau din fabricaţie.

Rezultă că redundanţa temporală poate fi folosită numai pentru a tolera


defectele tranzitorii. Pentru a tolera efecte permanente trebuie să avem o
formă de redundanţă spaţială.

7.2. Proiectarea echipamentelor de calcul

Când proiectăm un echipament complex este foarte important să


”echilibrăm” fiabilitatea părţilor. De exemplu, dacă memoria unui
echipament de calcul are o fiabilitate mult mai mare decât procesorul, atunci
echipamentul se va defecta cel mai adesea cu probleme de procesor. Faptul
că memoria este de foarte bună calitate nu ne ajută cu nimic, dimpotrivă
probabil că am plătit un preţ mai mare pentru memorie decât ar fi fost strict
necesar. În general, o componentă este ”destul de bună” dacă nu are cea mai
mare probabilitate de defectare.

În cazul analizei fiabilităţii unui echipament trebuie să socotim nu numai


costul componentelor fiabile, ci şi costul întreţinerii echipamentului în timpul
misiunii sale (vezi figura 1.2). Dacă utilizăm componente foarte fiabile plătim
prea mult pentru construcţia echipamentului, iar dacă utilizăm componente
136 Cap. 1. Introducere

cu fiabilitate prea redusă, ne va costa prea mult întreţinerea echipamentului.


Numai contextul poate dicta cât de fiabil trebuie să fie un echipament: de
exemplu, în aplicaţiile critice descrise mai sus, costul ne-funcţionării
echipamentului este uriaş, aşa încât are sens să investim în componente
extrem de fiabile.

Evitarea defectelor echipamentelor de calcul este o metodologie idealizată,


care presupune că toate componentele sunt perfecte. Pentru că hardware-ul
actual are o calitate excepţională, nivelul software în calculatoarele obişnuite
adoptă o astfel de viziune idealizată. Programatorii presupun că echipamentul
pe care se rulează programele lor este lipsit de defecţiuni.

Fiabilitatea excelentă a dispozitivelor hardware este obţinută printr-o


combinaţie de tehnici, cum ar fi felurite forme de redundanţă, proiectare şi
fabricaţie cu precizie foarte ridicată, şi o fază agresivă de testare şi ”ardere”
(burn-in).

Empiric s-a observat că echipamentele de calcul tind să aibă o mortalitate care


urmăreşte o curbă în formă de cadă de baie, echivalentă ratei mortalităţii din
studiile demografice. Echipamentele foarte tinere şi cele foarte uzate se strică
mult mai des decât echipamentele ”mature”. ”Burn-in” este o fază de testare
care foloseşte componentele până devin mature şi în acest fel, componentele
cu mortalitate infantilă ridicată sunt eliminate în această etapă.

În plus fabricanţii proiectează şi testează echipamentele de calcul în condiţii


mai nefavorabile decât cele specificate. De exemplu, pe acest fapt se bazează
cei care fac ”overclocking”: specificaţiile unui procesor indică frecvenţa de
ceas la care acesta poate opera, însă în mod frecvent un procesor cu
specificaţie de ceas de 1Ghz poate opera la 1.2Ghz, datorită marginilor de
toleranţă din fabricaţie.
Cap. 1. Introducere 137

Metoda evitării defectelor este cu adevărat extremă. Întrucât s-a constatat că


oricare dintre componente se poate defecta, se utilizează proceduri de
menţinere a echipamentului în funcţionare prin implementarea ”toleranţei
la defectare” (fault-tolerance).

7.2.1. Structuri tolerante la defectări

O metodă foarte simplă, dar scumpă, de a tolera erori este de a multiplica


fiecare componentă. De exemplu, dacă duplicăm întreg echipamentul de
calcul, apariţia unui defect poate fi detectată comparând rezultatele celor
două echipamente cu structură identică.

O altă modalitate de a tolera defectele constă în utilizarea structurilor TMR (§


4.3.1.1). În această structură trei module fac aceeaşi operaţie şi un modul de
decizie (”voter”) alege rezultatul majoritar. Structura va avea performanţe
net superioare unui singur modul, însă cu un preţ considerabil mai ridicat.
Întrucât voterul devine elementul ”slab” al structurii, există şi scheme în care
echipamentul de votare este multiplicat, pentru ca decizia să nu depindă de
o singură componentă.

Un astfel de echipament de votare este folosit în calculatoarele care


controlează navetele spaţiale: echipamentul este compus din cinci
calculatoare, din care patru fac aceleaşi calcule şi al cincilea este folosit pentru
operaţiuni ne-critice. Rezultatele celor patru calculatoare se duc până la
echipamentele controlate (exemplu: motoare de propulsie), care calculează
local rezultatul votului. În plus, fiecare calculator compară rezultatele cu
138 Cap. 1. Introducere

celelalte trei, iar atunci când unul dintre ele dă rezultate diferite este scos din
funcţiune.
Dacă două calculatoare se defectează, echipamentul intră într-un mod de
funcţionare în care rezultatele sunt comparate şi recalculate atunci când
diferă. Al cincilea calculator conţine un echipament de control complet
separat, dezvoltat de altă companie, care intră în funcţiune când un bug
identic este detectat în celelalte patru programe.

În continuare vor fi prezentate o serie de structuri de echipamente de calcul


tolerante la defectări:

A) Procesorul IBM G5 din echipamentul S/390. În cazul acestui procesor se


foloseşte un tip de redundanţă hibridă, care utilizează redundanţa spaţială
pentru a detecta erori tranzitorii şi redundanţa temporală pentru a le
remedia. Acest echipament este asemănător cu modul de funcţionare cu
două defecţiuni folosit de naveta spaţială, descris mai înainte.

Microprocesorul G5 conţine două benzi de execuţie identice, care sunt


controlate de acelaşi ceas. Toate instrucţiunile sunt executate în mod sincron
de ambele benzi, iar la sfârşitul execuţiei rezultatele sunt comparate. Dacă
rezultatele sunt identice, rezultatul instrucţiunii este scris în registrul
destinaţie sau în memorie. Dacă nu, se generează o excepţie software, care
de obicei se soldează cu re-execuţia instrucţiunii-problemă. Erorile tranzitorii
sunt astfel reparate în mod transparent. Această schemă este funcţională
pentru că probabilitatea ca o eroare tranzientă să afecteze ambele benzi în
acelaşi mod este una foarte mică.

B) Procesor superscalar tolerant la erori tranzitorii. O schemă foarte originală


care foloseşte doar redundanţă temporală pentru a tolera erori tranzitorii a
fost propusă în anul 2001 la conferinţa de microarhitectură MICRO 2001 de
Cap. 1. Introducere 139

un grup de cercetători de la universitatea Carnegie Mellon. În această schemă


unui procesor superscalar obişnuit i se fac câteva modificări simple, astfel
încât fiecare instrucţiune citită să fie lansată în execuţie în mod repetat.
Metodele de redenumire a regiştrilor folosite în procesorul superscalar fac
din executarea unor instrucţiuni suplimentare, care nu afectează
echipamentul, un lucru foarte simplu. La sfârşitul benzii de asamblare
rezultatele copiilor lansate în execuţie sunt comparate între ele. Robusteţea
depinde de gradul de redundanţă: dacă fiecare instrucţiune este executată de
două ori, o eroare se manifestă prin rezultate diferite şi instrucţiunea trebuie
re-executată; dacă o instrucţiune este executată de mai mult de două ori, se
poate folosi o schemă de votare cu majoritate.

Un astfel de procesor poate fi proiectat să lucreze fie în mod normal, fie în


mod cu fiabilitate crescută, depinzând de tipul de program executat.
Performanţa în modul cu fiabilitate ridicată este invers proporţională cu
gradul de redundanţă; de exemplu, dacă fiecare instrucţiune este executată
de două ori, ar putea rezulta o scădere a vitezei de calcul la 50%. În realitate,
penalizarea este ceva mai mică, din cauză că un program nu foloseşte toate
resursele computaţionale. De exemplu, dacă un program foloseşte 80% din
resurse, când executam programul duplicând fiecare instrucţiune avem
nevoie de 160% resurse, ceea ce se traduce într-o degradare a performanţei
cu 37,5% (100/160 = 62,5 = 100 - 37,5).

C) Echipament de calcul tolerant la defectări având arhitectură cu verificare


dinamică. Această structură, propusă în anul 1999 de către cercetătorii de la
universitatea Michigan este cunoscută sub numele de DIVA, de la Dynamic
Implementation Verification Architecture (arhitectură cu verificare
dinamică).

Spre deosebire de schemele anterioare, structura DIVA e proiectată pentru a


tolera atât erori tranzitorii, cât şi permanente (cele din urmă doar în anumite
140 Cap. 1. Introducere

părţi ale echipamentului). Observaţia centrală pe care se bazează DIVA rezidă


din faptul că este că e mai uşor de verificat dacă rezultatul unui calcul e corect
decât este de efectuat calculul însuşi. Ca atare, arhitectura DIVA este
compusă din două procesoare diferite, fiind prezentată în figura 7.1.

Fig.7.1. Structura echipamentului de calcul DIVA

Această structură conţine:

 Un procesor complex, superscalar, foarte optimizat, care face calculele în


mod normal.

 Un procesor extrem de simplu, mai lent, dar foarte fiabil, care execută
instrucţiunile în ordine, şi este construit folosind tehnici de evitare a
defectelor.

Echipamentul de calcul DIVA funcţionează astfel:


Cap. 1. Introducere 141

 Procesorul complex execută toate instrucţiunile şi calculează rezultatele


lor. Rezultatele însă nu sunt scrise, ci sunt transmise procesorului simplu
(lent şi fiabil).

 Procesorul simplu merge ceva mai încet, şi verifică în paralel toate detaliile
rezultatelor primite. Deşi acest procesor este mai simplu, are o treabă mai
uşoară, şi ca atare poate atinge aceeaşi performanţă ca cel rapid
(exprimată în instrucţiuni procesate pe secundă). Când verificarea
descoperă o eroare, procesorul simplu calculează rezultatul corect şi re-
porneşte procesorul complex de la instrucţiunea următoare.

Foarte interesant este faptul că o arhitectură DIVA poate tolera chiar erori de
proiectare în procesorul foarte complicat, pentru că acestea sunt detectate şi
corectate de procesorul lent şi simplu. Poate fi chiar avantajos ca procesorul
rapid să fie proiectat ”incorect”, dar extrem de rapid, în cazul în care nu
produce rezultate eronate prea frecvent. De exemplu, într-un procesor
normal foarte multe circuite suplimentare sunt introduse pentru a trata
corect cazul programelor care se auto-modifică. În realitate, practic nici un
program modern nu foloseşte această tehnică în mod curent; procesorul
rapid fără aceste circuite poate fi făcut mult mai eficient, iar corectitudinea
calculelor va fi asigurată de către procesorul lent.

7.2.2. Coduri detectoare şi corectoare de erori

S-au prezentat deja mai multe exemple de folosire a redundanţei spaţiale


pentru detectarea şi corectarea erorilor. Costul schemelor prezentate mai
înainte este substanţial: ele cer o multiplicare identică a unui întreg
echipament. De exemplu, redundanţa modulară triplă are o eficienţă de 33%,
pentru că hardware-ul este multiplicat de trei ori.
142 Cap. 1. Introducere

E interesant de explorat dacă nu putem obţine aceleaşi beneficii cheltuind


mai puţine resurse suplimentare. Deschizători de drumuri au fost în această
privinţă Claude Shannon şi Richard Hamming, spre sfârşitul anilor ’40. În
continuare se prezintă metodele propuse de ei pentru a stoca informaţie
utilizând structuri tolerante la defectări.

Să presupunem că dorim să stocăm nişte informaţii codificate în baza doi într-


un mod fiabil. Putem atunci de pildă face două copii ale informaţiei. Dar o
defecţiune a unui singur bit va face informaţia de nerecuperat, pentru că acel
bit va fi diferit în cele două copii, şi nu putem deduce care este valoarea
originală. Slăbiciunea acestei metode constă în faptul că biţii stocaţi nu sunt
”robuşti”: fiecare bit din mesaj este reprezentat în doar doi biţi din cod.

Pentru a obţine toleranţă la erori trebuie să adăugăm redundanţă în cod;


astfel, vom codifica n biţi de informaţie folosind m > n biţi de cod. Cu cât m e
mai mare ca n, cu atât mai robust va fi codul nostru. Cuvintele de m biţi care
reprezintă coduri corecte se numesc ”cuvinte de cod” (code words). Se
observă că nu toate cuvintele de m biţi sunt cuvinte de cod, ci numai 2n dintre
ele.

Se poate defini distanţa Hamming între două şiruri de biţi ca fiind numărul de
diferenţe între cele două şiruri. De exemplu, distanţa Hamming dintre 1111 şi
1010 este 2, pentru că cele două şiruri diferă în poziţiile a doua şi a patra. Cea
mai mică distanţă Hamming dintre cuvintele unui cod este o măsură foarte
bună a robusteţii codului. De exemplu, dacă distanţă Hamming între oricare
două cuvinte este mai mare decât 3, atunci o schimbare de 1 bit poate fi
întotdeauna corectată: cel mai apropiat cuvânt de cod este cel care a fost
modificat de eroare, pentru că toate celelalte cuvinte de cod se vor afla la o
distanţă mai mare de 2 de cuvântul eronat. Astfel, un cod cu distanţă
Hamming 3 poate corecta orice eroare de 1 bit, şi poate detecta orice eroare
de doi biţi. Un astfel de cod va detecta şi alte erori, de exemplu va detecta
Cap. 1. Introducere 143

unele erori de trei biţi, dar nu orice eroare de trei biţi. Există efectiv zeci de
coduri diferite, fiecare potrivit în alte circumstanţe.

Codurile detectoare şi corectoare de erori sunt folosite pe larg în reţelele de


calculatoare. Depinzând de caracteristicile canalului de comunicaţii (distanţă,
cost de transmisiune, viteza semnalului, zgomot) se pot folosi coduri mai mult
sau mai puţin robuste. În anumite cazuri e preferabil ca erorile să fie detectate
şi datele incorecte să fie retransmise, în alte cazuri costul retransmisiei este
prea mare, şi ca atare se folosesc coduri corectoare. Folosirea unui cod
corector în transmisiunea de date se mai numeşte şi codare preventivă
(Forward Error Correction).

Pentru comunicaţia cu sondele spaţiale se folosesc coduri corectoare de erori


extrem de robuste, pentru că la astfel de distanţe semnalul electromagnetic
are nevoie de multe minute pentru a se propaga. În 1993 un grup de
cercetători francezi a inventat o clasă de coduri extrem de robuste numite
Turbo-coduri care, folosind o redundanţă relativ redusă de 200%, obţin o
rezilienţă excepţională la zgomot, fiind foarte aproape de limitele maxime
teoretice.

Turbo-codurile ilustrează un nou tip de compromis pe care proiectantul îl


poate face în relaţia robusteţe/cost: costul cel mare al unui turbo-cod nu este
în cantitatea mare de informaţie suplimentară, ci în algoritmul de
decodificare, care este foarte complicat şi necesită multe iteraţii. După cum
am văzut şi în cazul memoriilor, cu aceeaşi redundanţă putem obţine garanţii
diferite de fiabilitate, în funcţie de algoritmul de codificare folosit. În cazul
comunicaţiei interplanetare costul transmisiunii face costul decodificării
insignifiant, deci turbo-codurile sunt potrivite.
144 Cap. 1. Introducere

7.2.3. Memorii tolerante la defectări

În funcţie de modalităţile utilizate în scopul protecţiei împotriva erorilor,


memoriile în structura unui echipament de calcul se pot clasifica astfel:

Memoriile neprotejate. Aceste memorii stochează fiecare bit de date în mod


separat şi nu oferă nici o protecţie împotriva erorilor. Ca atare sunt cele mai
ieftine. Cum însă dimensiunea memoriilor a crescut foarte repede, la ora
actuală această soluţie este riscantă, căci probabilitatea ca nici un bit să nu se
defecteze este foarte redusă.

Memoriile cu paritate. Aceste memorii folosesc o metodă foarte simplă


pentru a detecta erori de un bit în fiecare octet (şi, în general, erori care
schimbă un număr impar de biţi). Pentru fiecare 8 biţi de date aceste memorii
stochează un al nouălea bit de paritate, a cărui valoare este calculată astfel
încât oricare cuvânt de nouă biţi are un număr par de biţi ”1” (de aici şi numele
schemei).

Când hardware-ul accesează memoria, automat verifică şi paritatea. Dacă


paritatea nu este corectă se declanşează o excepţie şi echipamentul de
operare decide cum trebuie să acţioneze. O soluţie este de a opri programul
care folosea acea memorie şi de a marca memoria ca fiind defectă, astfel încât
alte programe să nu o poată refolosi. Verificarea parităţii este o operaţie
foarte rapidă, care se poate face foarte simplu folosind structuri hardware,
în paralel cu transferul informaţiei.

Memoriile ECC. Acestea sunt protejate cu un cod sofisticat de corecţie a


erorilor (Error Corecting Code). Acest cod poate corecta automat orice eroare
de 1 bit care apare într-un cuvânt de 64 de biţi. Pentru acest scop memoria
Cap. 1. Introducere 145

stochează fiecare cuvânt de 64 de biţi folosind cuvinte de cod de 72 de biţi.


Se observă că ”risipa” (overhead) acestei scheme este aceeaşi cu cea a
parităţii (9/8 = 72/64). Această schemă oferă corecţie cu o robusteţe mai
mică, pentru că poate corecta o eroare la 64 de biţi, spre deosebire de cealaltă
schemă care poate detecta o eroare la 8 biţi.

La fiecare acces la memorie hardware-ul verifică dacă cuvântul de cod este


corect, iar dacă nu, calculează automat cel mai apropiat cuvânt de cod pe care
apoi îl decodifică. Aceste operaţii sunt destul de complicate, astfel încât un
echipament cu memorii ECC funcţionează cu aproximativ 5% mai lent decât
unul cu memorii ce utilizează principiul parităţii.

Discuri. Cel mai comun suport permanent de informaţie este discul, în


multiplele lui implementări: hard-disc, dischetă, disc optic, compact-disc,
flash-disk etc. Informaţiile din această secţiune sunt valabile pentru multe
dintre aceste tipuri de discuri.

Discurile folosesc simultan două metode diferite de redundanţă spaţială; o


protecţie sporită este necesară din cauză că discurile funcţionează într-un
mediu mult mai aspru decât memoriile: unele discuri au părţi mecanice în
mişcare, care se uzează şi se pot strica mai uşor.

Informaţia este stocată pe discurile clasice în sectoare. Un sector este relativ


mare (comparat cu un cuvânt de memorie), fiind de ordinul a jumătate de
kilooctet (512 octeţi). Discurile folosesc sectoare mari pentru că la viteza lor
de rotaţie (peste 5000 de rotaţii pe minut) capetele de citire/scriere nu se pot
plasa foarte precis pe suprafaţă. Astfel, unitatea elementară în care se scrie
pe un disc este sectorul: chiar dacă vrem să modificăm un singur bit, trebuie
să rescriem tot sectorul.
146 Cap. 1. Introducere

În figura 7.2 este prezentat formatul unui sector de disc. Informaţia servo este
folosită pentru controlul mişcării capului, identificatorul indică numărul
sectorului curent, iar informaţia de sincronizare este folosită pentru a
sincroniza poziţia capului cu începutul sectorului.

Fig. 7.2. Formatul unui sector


de disc

Datele sunt stocate într-un şir compact şi codificate folosind un cod detector
de erori. Între două sectoare consecutive este un blanc (spaţiu liber), care-i
dă capului ceva libertate când rescrie sectorul (niciodată nu va rescrie
începând chiar din acelaşi loc).

Codurile folosite pentru discuri se numesc CRC, de la Cyclic Redundancy


Check: coduri ciclice. Un cuvânt de cod constă din chiar cuvântul de date
urmat de informaţii de control. Decodificarea codurilor CRC este foarte
simplă: se extrage direct cuvântul de date, după care codul de control verifică
dacă vreunul dintre biţii stocaţi e incorect. Un cod ciclic are proprietatea că
orice permutare a datelor este protejată de acelaşi cuvânt de control.

Când codul de control indică defectarea unui sector, discurile folosesc în mod
automat a doua formă de redundanţă spaţială: sectoare de rezervă. Pe disc
sunt ascunse sectoare invizibile, care sunt folosite atunci când sectoarele de
date încep să dea rateuri. În mod transparent software-ul alocă un sector de
Cap. 1. Introducere 147

rezervă în locul unuia defect. Identificatorul de sector este folosit pentru a


indica cine pe cine înlocuieşte.

Discurile stochează o hartă de defecte care indică sectoarele înlocuite, acest


lucru permiţând o funcţionare corectă şi după ce apar defecţiuni, şi permite,
de asemenea, un proces de fabricaţie mai imperfect şi mai ieftin.

Pentru stocarea de înaltă fiabilitate a datelor se utilizează Flash Disk-uri.


Aceste dispozitive au apărut din necesitatea ca în aplicaţiile industriale sau
de comunicaţii portabile, să fie nevoie de o capacitate de memorie de numai
80 MB sau mai puţin, fiind necesară şi o foarte bună rezistenţă la şocuri şi
vibraţii. În astfel de cazuri, soluţia folosirii unor unităţi de hard-disk
convenţionale este improprie, fie şi numai pentru motivul că astăzi nu se mai
fabrică HDD-uri cu capacităţi aşa de mici. Până acum singura soluţie era
utilizarea unui hard-disk cu o capacitate minimă de 3-4 GB. În pofida
excedentului de memorie, se putea întâmpla ca acesta să se defecteze în mai
puţin de o lună de funcţionare efectivă, datorită mediului de lucru sever în
care se desfăşura misiunea. În mod normal, hard-diskurile au o fiabilitate
ridicată în mediul de birou sau laborator, MTBF fiind de ordinul a multe zeci
de mii de ore (echivalent a 8 ani de funcţionare continuă sau 30 ani de utilizare
normală). Însă acestea nu suportă lovituri sau şocuri puternice, care le pot
scoate definitiv din funcţiune, iar dacă mediul de lucru prezintă vibraţii,
capetele se vor poziţiona eronat pe pistă, generând erori soft (de citire) sau
crescând considerabil timpul de acces (durează până când se repoziţionează
pe pista corectă).
O soluţie parţială ar fi HDD-rile pentru notebook-uri, deoarece prezintă o
rezistenţă mecanică considerabil sporită, fiind compacte şi special proiectate
pentru o utilizare în medii cu şocuri şi vibraţii. Însă capacitatea este tot
excedentară, iar preţul este foarte ridicat.
148 Cap. 1. Introducere

Odată cu apariţia Flash Disk-urilor, problema pare a fi soluţionată. Ideea


înlocuirii mediilor magnetice cu memorii semiconductoare nu este nouă, dar
la început preţul era prohibitiv, iar capacitatea redusă. Au apărut apoi
memoriile reprogramabile Flash. Iniţial, acestea erau doar un fel de EEPROM-
uri mai performante, nu puteau fi şterse decât de un număr limitat de ori (de
circa 10.000). Desigur, această valoare este excelentă pentru o memorie
programabilă, dar cu totul insuficientă pentru a înlocui un disk magnetic.
Ulterior au fost perfecţionate, iar acum rezistă la un milion de cicluri de
scriere/citire. De asemenea, dacă la început erau disponibile doar sub forma
de cartele de memorie, acum emulează perfect o unitate de disk IDE, astfel
că oferă o soluţie de stocare a datelor cu o mare fiabilitate hardware şi
software.

Absenţa totală a componentelor în mişcare face modulele de memorie Flash


mai rapide şi mai robuste decât mediile magnetice rotative, respectiv unităţile
de hard-disk. Principalul dezavantaj îl reprezintă preţul mai ridicat, dar pentru
capacităţi de stocare mici, ele reprezintă o alternativă convenabilă la HDD.
Termenul ”mici” este ceva relativ: dacă la începutul anului 1993 însemna 1-
2MB, acum se referă la 100-400MB. În momentul de faţă sunt disponibile şi
Flash Disk-uri de peste 500MB, dar odată cu sporirea capacităţii, preţul creste
considerabil.

În continuare se prezintă o comparaţie între Flash Disk-uri şi unităţile de hard-


disk miniatură (de 1,3 sau 2,5 inch). La capacităţi mici, până la 100MB,
modulele Flash sunt categoric competitive. De fapt, la aceste valori mici,
principalul concurent al Flash Disk-urilor îl reprezintă memoria RAM statică,
nu hard-diskurile. Preţul memoriei Flash este proporţional cu capacitatea,
deoarece capacitatea de stocare este direct proporţională cu numărul de
circuite integrate Flash folosite. Unităţile de disk magnetic au un preţ de bază
ce include preţul componentelor mecanice şi al controlerului. Preţul hard-
diskului nu poate scade sub această valoare de pornire, dar, mărind suprafaţa
mediului magnetic sau numărul de feţe, se poate mări capacitatea cu o
creştere de preţ foarte mică.
Cap. 1. Introducere 149

În privinţa rezistentei la şocuri fizice, (cum ar fi simpla cădere a aparatului),


modulele Flash sunt clar superioare hard-diskurilor. Gama de temperaturi de
lucru este similară la cele două categorii. Intervine însă, din nou, conceptul de
fiabilitate software: în cazul unor variaţii rapide de temperatură, HDD-urile
clasice nu sunt disponibile imediat. Când este adus de la o temperatură
scăzută într-o încăpere încălzită, unitatea de hard-disk trebuie lăsată să se
aclimatizeze, pentru a nu apare probleme cu condensarea umidităţii. Dacă
temperatura ambiantă se modifică rapid şi frecvent, sistemul de urmărire a
pistelor pierde un timp considerabil cu operaţiile de recalibrare. În aceste
cazuri, disponibilitatea unităţii de disk este redusă. Flash Disk-urile nu prezintă
asemenea probleme.

O comparaţie directă a vitezelor este greu de realizat. Scrierea efectivă este


mai lentă la Flash, dar hard-diskul necesită un timp pentru atingerea vitezei
de rotaţie de regim şi prezintă întârzieri de rotaţie şi în trecerea de la o pistă
la alta.

Într-o aplicaţie tipică, memoria Flash este de 2-10 ori mai rapidă decât hard-
diskul. ”Aplicaţie tipică” este cea în care datele sunt citite de 4-5 ori mai des
decât sunt scrise, iar transferurile de date tind să fie scurte şi nu foarte
frecvente. Debitul de date în cazul unui transfer continuu este mai redus: 0,7-
1 Moctet pe secundă la citire şi 2-300 Kocteţi pe secundă la scriere, faţă de
valoarea de 5 Mocteti pe secundă în mod rafală (burst).
Alte avantaje ale FlashDisk-urilor sunt nivelul sonor foarte redus în timpul
funcţionării (unele hard-diskuri pot fi destul de zgomotoase) şi posibilitatea
lucrului la altitudini foarte ridicate. Hard-diskurile au nevoie de o presiune
atmosferică minimă pentru a realiza perna de aer pe care plutesc capetele.

Caracteristicile generale ale Flash Disk-urilor sunt prezentate în continuare:


150 Cap. 1. Introducere

 au dimensiunile clasice ale HDD-urilor obişnuite;


 sunt Disk-uri cu interfaţa IDE, bazate pe o tehnologie Flash;
 au capacităţi de stocare extrem de flexibile: între 4MB şi 512 MB;
 sunt mult mai stabile decât HDD-urile convenţionale. Ele pot rezista la
şocuri şi vibraţii fiind astfel foarte potrivite pentru aplicaţii ce se desfăşoară
în medii cu cerinţe severe;
 au un consum redus de energie;
 sunt 100% compatibile IDE, nefiind necesară instalarea vreunui driver;
 folosesc algoritmul de detecţie şi corecţie al erorilor Reed Solomon pe 16
biti;
 cu o interfaţă de 3,3V sau 5V, Flash Disk-urile suportă gestiunea automată
a consumului de energie (APM) precum şi comenzi ATA de întrerupere a
alimentării şi mod ”sleep” (aţipire).
Cel mai important lucru este că oferă o stabilitate mult mai bună a aplicaţiilor,
în medii de lucru dure, cu şocuri şi vibraţii. În astfel de medii, unităţile de hard-
disk clasice chiar dacă nu se defectează, prezintă erori de căutare, astfel că
răspunsul devine lent, iar comportarea - aleatoare. Consumul redus de
energie contribuie la creşterea duratei de viaţă a întregului sistem.

Capacitatea de stocare flexibilă înseamnă că se poate utiliza un model cu


capacitate foarte apropiată de cea necesară pentru aplicaţie, pentru a nu
creşte costurile aferente cu memoria suplimentară ce nu va fi niciodată
folosită. Comenzile interfeţei IDE sunt conforme cu standardului industrial
ATA-4.

Flash-Disk-urile au fost verificate cu succes sub următoarele sisteme de


operare: MS-DOS, Windows 95/98/NT, Windows CE, OS2 Warp, Linux, QNX,
Unix Ware. Media timpului de bună funcţionare (MTBF) este de peste
1.000.000 de ore. Fiabilitatea datelor memorate este asigurată prin funcţii
încorporate de detectare şi corecţie a erorilor.

Flash-Disk-urile au performanţe foarte bune în ceea ce priveşte anduranţa:


pentru operaţii de scriere/citire sunt garantate pentru circa un milion de
Cap. 1. Introducere 151

cicluri, iar pentru operaţii de citire se prevede un număr nelimitat de astfel de


operaţii.

În ceea ce priveşte viteza de transfer pe magistrală, aceasta este de peste 700


KB/sec în caz de citire susţinută şi de peste 250 KB/sec la operaţii de scriere
susţinută. Flash-Disk-urile se remarcă, de asemenea, prin gama
temperaturilor de lucru (de la -25oC la +85oC) şi prin altitudinea maximă la
care pot funcţiona corect (16.000m).

Valorile prezentate mai înainte sunt valabile pentru FlashDisk-urile tipice.


Realizările de vârf, ”state of the art”, au performanţe net superioare, însă şi
costurile de producţie sunt mai ridicate. Astfel, firma BiT Microsystems
produce seria E-Disk cu performanţe deosebite şi cu o capacitate de stocare
foarte ridicată. Se urmăreşte înlocuirea unităţilor de hard-disk cu module
semiconductoare cu viteza de lucru mare, fiabilitate, longevitate şi
scalabilitate superioare. Rata de transfer este de 40 MB/sec în mod şi de 34
MB/sec în mod susţinut, iar capacitatea poate ajunge până la valoarea de
13.312 MB. Aceste dispozitive nu conţin componente în mişcare, care
reprezintă principala cauza a defectărilor şi întârzierilor electromecanice la
HDD-urile clasice.

Ca dovadă suplimentară a performanţelor ridicate, E-Disk sunt prevăzute nu


cu obişnuita interfaţă EIDE, ci cu variante avansate de SCSI: SCA Ultra Wide
SCSI cu tensiune diferenţială redusă.

Media timpului de bună funcţionare ajunge la 1,9 milioane de ore, se folosesc


coduri detectoare şi corectoare de erori foarte performante, astfel că rata
erorilor nedetectate este foarte scăzută. Astfel de dispozitive de stocare de
înaltă fiabilitate sunt ideale pentru telecomunicaţii, transporturi, aplicaţii
industriale, aerospaţiale sau militare, unde sistemele sunt supuse unor
condiţii de temperaturi extreme, câmpuri magnetice puternice, vibraţii, praf,
152 Cap. 1. Introducere

mizerie şi vapori corosivi. Sunt de asemenea potrivite pentru aplicaţiile unde


este esenţial un coeficient foarte ridicat de disponibilitate şi o viteză mare:
depozite de date, multimedia, financiare, furnizori de servicii Internet, comerţ
electronic, servere proxy etc.

În continuare se prezintă un alt tip de echipament fiabil redundant, care, spre


deosebire de alte soluţii prezentate, are o performanţă mai bună decât
echipamentul de bază. În plus, acest echipament adaugă o dimensiune nouă
în spaţiul opţiunilor fiabilităţii, şi anume capacitatea de a fi reparat în timp ce
funcţionează (maintainability).

Structura este cunoscută sub numele de RAID, care este o prescurtare de la


Redundant Array of Inexpensive Disks, sau set redundant de discuri ieftine.
Ideea a fost introdusă în 1987 de cercetători de la universitatea Berkeley din
California.

Ideea centrală a structurii RAID este de a stoca informaţie pe mai multe discuri
simultan. Informaţia este codificată redundant, astfel încât să poată fi
recuperată dacă oricare dintre discuri se defectează. Această proprietate este
foarte utilă pentru echipamentele care trebuie să funcţioneze continuu.

Există mai multe tipuri de echipamente RAID, însă în continuare se prezintă


unul singur, în care informaţia este scrisă pe 5 discuri, din care 4 conţin date
şi unul paritate. Un astfel de echipament RAID se poate afla într-unul dintre
trei moduri de funcţionare:

Funcţionare normală: operaţiile de citire extrag date de pe cele patru discuri


cu date. O operaţie de scriere însă strânge patru blocuri de informaţie şi
calculează un al cincilea bloc de paritate; fiecare bloc este stocat pe alt disc.
Cap. 1. Introducere 153

Acest mod de scriere se numeşte ”striping”, adică ”feliere”, pentru că datele


sunt scrise în paralel, câte o felie pe fiecare disc.

Funcţionarea degradată: este începută când un disc se defectează. Atunci


citirile şi scrierile de pe discul stricat trebuie să acceseze celelalte patru discuri
şi să calculeze informaţia lipsă. Avantajul parităţii este că oricare din biţii lipsă
poate fi recalculat ca paritate a celorlalţi patru biţi.

Reconstrucţia: este începută când un disc defect este înlocuit. Un proces


secundar recalculează informaţia lipsă şi o scrie pe noul disc.

În continuare se prezintă un echipament de calcul dezvoltat de cercetători de


la Hewlett-Packard, care demonstrează o metodologie extremă în
tratamentul fiabilităţii echipamentelor. Acest echipament, cunoscut sub
numele de Teramac, este construit din componente defecte: mai mult de 70%
dintre circuitele sale componente au o malfuncţie oarecare. Cu toate acestea,
echipamentul funcţionează corect şi poate efectua calcule extrem de
performante.

Arhitectura echipamentului Teramac tolerează numai defecţiuni


permanente, care sunt prezente încă de la fabricaţie. Componentele Teramac
sunt circuite hardware de un tip anume, numit hardware reconfigurabil.
Înainte de a prezenta echipamentul Teramac se va face o prezentare succintă
a structurii hardware-ului reconfigurabil, arătând cum un echipament fiabil
poate fi construit din componente reconfigurabile nefiabile.

Într-o primă aproximaţie, circuitele digitale obişnuite sunt compuse din


elemente computaţionale simple, numite porţi logice, conectate între ele prin
sârme. Porţile logice sunt construite din tranzistori. Fiecare poartă logică face
154 Cap. 1. Introducere

calcule pe mai multe valori de 1 bit. Porţile logice sunt universale, în sensul că
orice proces calcul poate fi exprimat în termeni de operaţii ale porţilor logice.

În hardware-ul reconfigurabil porţile logice nu au o funcţionalitate fixată, iar


sârmele formează o grilă. Fiecare poartă este configurabilă, adică poate fi
forţată să efectueze orice operaţie logică. La fiecare intersecţie de sârme se
află un mic comutator configurabil, care poate fi, de asemenea, programat să
conecteze sârmele. Configurarea porţilor şi a sârmelor se face prin semnale
electrice. Fiecare poartă şi fiecare comutator are o mică memorie asociată, în
care-şi stochează configurarea. Pentru că schimbând conţinutul acestor
memorii putem schimba funcţionalitatea hardware-ului, circuitele acestea se
numesc ”reconfigurabile” (figura 7.3).

a) b)
Cap. 1. Introducere 155

Figura 7.3. Structura unui circuit reconfigurabil

Hardware-ul reconfigurabil este echivalent cu cel obişnuit, în sensul că orice


circuit poate fi implementat folosind ambele tehnologii. Hardware-ul
reconfigurabil tinde însă să fie ineficient: memoriile şi porţile configurabile
ocupă mult mai mult loc decât porţile obişnuite. Pe de altă parte, semnalele
electrice care traversează doar sârme într-un circuit obişnuit, trebuie să
treacă printr-o serie de comutatoare în hardware-ul reconfigurabil, ceea ce
face circuitele mai lente. Un factor de 10, diferenţă în viteză şi densitate, este
de aşteptat între un hardware obişnuit şi cel configurabil de aceeaşi
generaţie.

Pentru a programa un circuit reconfigurabil cu funcţiunea unui circuit


obişnuit, trebuie să asociem fiecare poartă din circuit cu o poartă
configurabilă; acest proces se numeşte ”plasare”; de asemenea, fiecare sârmă
trebuie asociată cu succesiuni de segmente legate prin comutatoare, în
procesul de ”rutare”.

În figura 7.3-a procesul de plasare asociază fiecare poartă logică din circuitul de
implementat cu o poartă universală. Procesul de rutare conectează porţile
universale folosind segmente de sârmă legate cu comutatoare. În cazul defectării
unora dintre porţile universale plasarea şi rutarea le pot ocoli, sintetizând un circuit
perfect funcţional, situaţie ilustrată în figura 7.3-b.
Calitatea circuitelor reconfigurabile exploatată de Teramac pentru a obţine
fiabilitate este faptul că porţile logice configurabile sunt esenţialmente
interschimbabile. Cercetătorii proiectului Teramac au dezvoltat un program
de plasare care foloseşte o hartă de defecte ale circuitelor reconfigurabile.
Această program ocoleşte porţiunile inutilizabile şi rutează conexiunile în
jurul defectelor, exploatând doar porţiunile funcţionale ale fiecărui circuit
(figura 7.3-b). Cercetătorii au creat şi o serie de programe, care descoperă şi
cataloghează defectele. Programele acestea folosesc chiar programabilitatea
156 Cap. 1. Introducere

circuitelor pentru a le configura ca dispozitive care se auto-testează. Fiecare


porţiune din fiecare circuit este programată să efectueze calcule simple şi să
verifice corectitudinea rezultatelor. Micile programe de test sunt ”plimbate”
pe suprafaţa circuitului, acoperind toate porţile logice. Proiectarea unor
programe de auto-testare este o sarcină mai complicată decât ar putea părea
la prima vedere. Programele trebuie să descopere o mulţime de defecte
posibile şi trebuie să nu poată fi păcălite de defecţiuni (de exemplu, dacă chiar
partea care compară rezultatele cu cele corecte este defectă). Programele de
testare aplică în mod repetat calcule care amestecă toţi biţii: astfel, apariţia
unei singure erori se va propaga rapid la toţi biţii din rezultat, fiind uşor de
depistat.

Proiectul Teramac a avut un succes enorm, principala sa contribuţie a constat


în a demonstra că defectele din hardware pot fi expuse nivelelor superioare,
şi pot fi tratate în întregime în software, fără ca costul plătit în performanţă
să fie prohibitiv. Această metodologie este o schimbare completă de
paradigmă în arhitectura calculatoarelor, care probabil va avea din ce în ce
mai multe aplicaţii în viitor.

7.3. Fiabilitatea programelor

Ne-am putea aştepta ca spre deosebire de hardware, software-ul să nu aibă


nici un fel de probleme de fiabilitate deoarece programele nu se uzează, şi
sunt executate într-un mediu foarte specializat; în plus, programele sunt
obiecte deterministe, deci ar trebui să se comporte de fiecare dată în acelaşi
fel când procesează aceleaşi date de intrare. Cu toate acestea, de fapt
fiabilitatea programelor este mult mai scăzută decât a echipamentelor
Cap. 1. Introducere 157

hardware; este potrivit să modelăm deci programele ca echipamente cu


fiabilitate imperfectă. În această secţiune se prezintă în mod superficial unele
dintre motivele lipsei de fiabilitate a programelor şi se menţionează unele
tehnici care pot fi folosite pentru a realiza programe fiabile.

Cea mai importantă cauză a defectelor programelor sunt bug-urile, adică


implementări incorecte. Chiar şi programatori foarte pricepuţi produc
programe cu defecte. Complexitatea componentelor software este pur şi
simplu prea mare, în momentul de faţă, pentru a putea fi stăpânită de către
oameni. Cu tot progresul în tehnici de programare, cum ar fi descompunerea
programelor în module mici, folosirea unor limbaje de programare evoluate
şi a unor scule complexe pentru dezvoltarea, testarea şi analiza programelor,
rezultatele sunt încă foarte departe de perfecţiune, iar productivitatea
programatorilor nu a crescut substanţial în ultimele două decenii.

Cel mai adesea problemele rezolvate în software sunt atât de complicate încât
nici nu pot fi specificate în mod precis. În consecinţă programatorii întâlnesc
tot felul de incertitudini când încearcă să implementeze soluţiile. O cauză
fundamentală a lipsei de fiabilitate a programelor este deci specificaţia de
proiectare incompletă şi imprecisă.

Cele mai imprevizibile defecţiuni software se manifestă numai cu ocazia unor


anumite combinaţii de valori pentru datele de intrare sau pentru anumite
succesiuni de evenimente externe, care nu au fost prevăzute de programator.
Asemenea combinaţii apar cu probabilitate foarte mică în timpul procedurilor
normale de testare, deci adesea supravieţuiesc până în faza operaţională.

A vedea programele software ca pe o entitate monolitică este o aproximare


grosolană a realităţii: un program trece prin nenumărate revizii şi
îmbunătăţiri. Versiunile noi sunt construite pe scheletul celor vechi, reparând
158 Cap. 1. Introducere

defecţiunile descoperite şi adăugând noi funcţionalităţi. Cu toate acestea,


procesul reparării defecţiunilor introduce adesea noi defecţiuni, pentru că
efectele unei reparaţii au uneori consecinţe imprevizibile.

Creşterea continuă a performanţelor hardware-ului este o motivaţie


constantă pentru reînnoirea echipamentelor software. Pe măsură ce
dispozitivele hardware devin mai ieftine şi mai compacte, ele pot fi integrate
în dispozitive electronice mai ”deştepte”. Toate aceste noi dispozitive au
nevoie de un nou software, care să le manipuleze. Pe măsură ce costul
dispozitivelor de stocare a informaţiei scade, din ce în ce mai complexe şi mai
bogate tipuri de informaţie pot fi stocate şi prelucrate. De exemplu, imagini şi
muzică sunt tipuri curent manipulate de PC-urile contemporane, iar
capacitatea lor de prelucrare a devenit de curând suficient de puternică
pentru a manipula în mod interactiv chiar filme.

Un fenomen legat de acest ciclu permanent de înnoiri este cel cunoscut sub
denumirea ”putrezirea biţilor” (bit rot). Acest fenomen se manifestă pe două
planuri: datele stocate cu mult timp în urmă nu mai pot fi folosite în noile
echipamente de calcul, pentru că dispozitivele periferice învechite nu mai
sunt suportate de fabricanţi, şi programe vechi, care mergeau foarte bine,
încep să manifeste erori. ”Boala” programelor este legată de mediul în care
programele se execută, şi care este în continuă schimbare. De exemplu, multe
programe vechi făceau anumite presupuneri despre cât de mari vor fi seturile
de date pe care le vor prelucra. Cea mai faimoasă astfel de presupunere este
cea care a cauzat bug-ul Y2K: programatorii din anii ’60 au presupus că
programele lor nu vor manipula niciodată date calendaristice al căror an nu
va începe cu cifrele 19. Chiar dacă Y2K a făcut mai mult zgomot decât pagube,
astfel de presupuneri se întâlnesc la tot pasul în programele de astăzi. De
exemplu, pot apare dificultăţi în a transporta programe de la procesoare pe
32 de biţi la procesoare pe 64 de biţi. Din moment ce orice valoare pe 32 de
biţi se poate reprezenta exact atunci când folosim 64 de biţi, teoretic nu ar
Cap. 1. Introducere 159

trebui să fie nici o problemă, şi vechile programe ar trebui să funcţioneze


corect. În realitate multe programe depind în feluri subtile de precizia datelor
pe care le manipulează. Când un astfel de program este mutat pe o platformă
nouă toate aceste dependinţe se transformă în bug-uri.

7.3.1. Creşterea fiabilităţii produselor software

Domeniul ingineriei programelor (software engineering) se ocupă de metode


prin care se poate cuantifica şi îmbunătăţi calitatea programelor. Una dintre
soluţiile studiate este foarte înrudită cu tehnicile de votare folosite pentru
toleranţa erorilor hardware. Numele acestei soluţii în lumea software este
”programare cu N versiuni”. Votarea foloseşte redundanţă spaţială:
dispozitivul de calcul este replicat de N ori şi rezultatul final este obţinut prin
votul majoritar al rezultatelor individuale.

Bug-urile software sunt persistente: aflat în aceleaşi condiţii programul se va


comporta în acelaşi fel. Tehnicile de votare sunt neputincioase dacă toate
componentele fac aceeaşi eroare în acelaşi timp. Votarea este utilă pentru
tratamentul erorilor tranzitorii. Programarea cu N versiuni se face deci prin
executarea în paralel a N programe diferite, scrise de echipe diferite de
programatori, dacă e posibil, folosind scule şi tehnologii diferite. Toate cele N
programe rezolvă aceeaşi problemă, dar în moduri diferite. Numai folosind o
astfel de strategie tehnica votării poate funcţiona în cazul programelor.
Specificaţii imprecise ale problemei pot fi detectate cu uşurinţă de această
tehnică, pentru că implementările diferite pot lua decizii diferite pentru
cazurile nespecificate clar. Din nefericire, programarea cu N versiuni este o
metodologie foarte scumpă, folosită numai pentru aplicaţii critice, unde
siguranţa este fundamentală.
160 Cap. 1. Introducere

Diferenţa fundamentală între hardware şi software este aceea că un program


poate avea o stare internă arbitrar de complicată. În general, dispozitivele
hardware pot fi aproximate ca fiind automate finite (adică spaţiul stărilor în
care se pot afla, chiar dacă este foarte mare, este totuşi finit). Chiar şi cele mai
simple programe au un spaţiu de stări infinit, mai exact, nu putem pune nici
o limită arbitrară dimensiunii spaţiului lor.

Această diferenţă este foarte importantă şi din punct de vedere teoretic:


foarte multe proprietăţi interesante ale automatelor finite se pot decide,
adică se pot scrie algoritmi care atunci când primesc descrierea unui automat
finit, pot răspunde în mod exact la întrebări legate de orice evoluţie viitoare
a automatului. Din păcate, aceleaşi întrebări pentru un echipament cu stare
infinită adesea nu pot fi decise. Într-adevăr, matematicienii au arătat în anii
’30 că foarte multe dintre proprietăţile unui echipament software, în general,
nu pot fi calculate de un alt echipament software.

O consecinţă practică a dimensiunii infinite a spaţiului de stări ale


programelor este că, pe măsură ce un program se execută mai mult timp, cu
atât mai complicată poate deveni starea sa internă. Dacă un program nu îşi
întrerupe execuţia, chiar dacă va primi aceleaşi date la intrare, ar putea
calcula un răspuns diferit. Un bug în program poate corupe starea internă, dar
efectele acestei defectări pot deveni vizibile mult mai târziu în execuţia
programului, când programul ia o decizie bazată pe elementele de stare
incorecte. Un tip faimos de problemă, în mod normal benignă, asociată cu
programele care se execută un timp îndelungat, este scurgerea de memorie
(memory leak).

Adesea programele alocă spaţiu temporar de memorie, pe care îl eliberează


după ce au terminat calculele care aveau nevoie de el. Dacă programatorul
uită să elibereze această memorie se spune că memoria se scurge (leak).
Aceasta este o eroare frecvent întâlnită în programare, relativ greu de
Cap. 1. Introducere 161

descoperit. În mod normal o astfel de eroare nu afectează corectitudinea


programului: rezultatele produse la final sunt corecte. Când programul îşi
termină execuţia, echipamentul de operare recuperează automat memoria
scursă. În cazul programelor care se execută timp îndelungat, cum ar fi
echipamentele de operare sau serverele de web, dacă o scurgere se
întâlneşte în interiorul unei bucle, cu timpul memoria pierdută va creşte până
când toată memoria echipamentului este pierdută. În astfel de cazuri de
obicei echipamentul îşi încetează execuţia, sau funcţionarea sa devine extrem
de lentă din cauză că resursele rămase sunt insuficiente.

Utilizatorii echipamentului de operare Windows de la Microsoft au descoperit


şi o soluţie pentru această problemă: reboot-area calculatorului. Numele
ştiinţific pentru această soluţie este ”reîntinerirea programelor” (software
rejuvenation). Reîntinerirea este cauzată de repornirea periodică a
programelor. Repornirea cauzează iniţializarea stării interne la o aceeaşi
valoare iniţială. Tehnica aceasta este aplicabilă numai dacă starea internă a
programului nu este importantă şi poate fi pierdută; altfel, întinerirea trebuie
să fie combinată cu ”checkpoint”-uri. Un checkpoint salvează informaţia
importantă pe un mediu de memorie persistent, şi o restaurează după ce
programul este repornit.

Reîntinerirea se aplică cu precădere programelor de tip server, care execută


tot timpul o buclă, acceptând cereri de la clienţi şi răspunzându-le. Multe
servere sunt lipsite de stare (stateless), adică nu păstrează nici un fel de
informaţii despre o tranzacţie cu un client după ce tranzacţia s-a consumat.
Reîntinerirea este eficace dacă costul repornirilor periodice este mai redus
decât costul repornirii după o cădere catastrofică, care poate să implice o
procedură sofisticată de recuperare a datelor pierdute. Reîntinerirea este de
asemenea folosită cu succes când serverele care oferă serviciul au rezerve,
astfel încât serverele de rezervă pot răspunde clienţilor în timp ce altele se
reiniţializează.
162 Cap. 1. Introducere

O altă modalitate de creştere a fiabilităţii programelor de calcul constă în


utilizarea unei tehnici numită verificare formală. Acesta este un nume generic
pentru o serie întreagă de tehnici sofisticate care certifică corectitudinea, mai
ales a echipamentelor hardware, dar în ultima vreme şi a unor echipamente
software. Verificarea formală se ocupă de descoperirea şi eliminarea bug-
urilor, şi în acest sens este o tehnică de creştere a fiabilităţii programelor.

Cheia metodelor de verificare formală este specificarea foarte precisă a


comportării componentelor echipamentului de analizat (folosind formule
matematice) şi verificarea automată a proprietăţilor echipamentului în
întregime. Dacă ştim cum este construit echipamentul, şi dacă ştim
comportarea fiecăreia dintre componente, putem raţiona despre
comportarea ansamblului. Raţionamentele pot fi făcute foarte precise
folosind diferite variante de logici matematice. Fiecare raţionament este o
serie de derivări, în care din fapte ştiute ca fiind adevărate deducem alte
adevăruri. Verificarea formală studiază aceste derivări, şi verifică faptul că
sunt corecte.

Două aspecte fac din verificarea formală o tehnică foarte puternică:


1) calculele minuţioase sunt efectuate de către calculatoare, a căror
atenţie nu oboseşte niciodată;
2) certitudinea nu vine din faptul că demonstrăm ceva, ci din faptul că
putem verifica dacă demonstraţia este corectă.

Când s-a descris echipamentul DIVA s-a făcut menţiunea că a verifica


corectitudinea unui rezultat este mult mai simplu decât a demonstra
rezultatul însuşi. Acest fapt este extrem de folositor în contextul verificării
formale, în care programul care face demonstraţiile este extrem de complicat,
şi ca atare poate conţine erori (ca orice alt program complex) şi deci poate
Cap. 1. Introducere 163

genera demonstraţii eronate. Un program care verifică dacă o demonstraţie


este corectă însă este mult mai simplu, şi ca atare ne oferă mai multă
încredere.

7.4. Reţeaua internet

Una dintre cele mai uimitoare tehnologii ale secolului douăzeci este cu
siguranţă Internetul. Acesta este o reţea de calculatoare, proiectată iniţial
pentru a conecta reţele militare de calculatoare şi de a le permite să opereze
chiar şi în condiţiile distrugerii unui mare număr de echipamente din reţea,
de exemplu în cazul unei conflagraţii nucleare. Internetul a evoluat astăzi într-
o reţea comercială care acoperă toate continentele, cu mai mult de 125 de
milioane de calculatoare şi peste 1 miliard de utilizatori.

Internetul nu este prima reţea de dimensiune globală; cu mai mult de un secol


înainte de crearea Internetului a apărut telefonul; reţelele telefonice au cu
siguranţă întâietatea în acoperirea planetei. Ne-am aştepta ca proiectanţii
Internetului să fi folosit multe din tehnologiile folosite în construcţia reţelelor
telefonice, despre care există o cantitate mare de informaţii şi o experienţă
substanţială. În realitate, nimic nu poate fi mai departe de adevăr: arhitectura
Internetului pare a fi în mod deliberat opusă reţelei de telefonie. Nicăieri nu
se vede mai bine diferenţa dintre cele două reţele decât în felul în care
tratează fiabilitatea.

Reţeaua telefonică a fost proiectată de la început pentru o fiabilitate


excepţională. O centrală telefonică trebuie să însumeze mai puţin de trei
minute de indisponibilitate în fiecare an. Numai în circumstanţe absolut
excepţionale o conversaţie iniţiată poate fi întreruptă datorită unor probleme
din reţea. Reţeaua telefonică va permite stabilirea unei legături numai după
164 Cap. 1. Introducere

ce a rezervat toate resursele necesare pentru transmisiunea promptă a


semnalelor vocale pe întregul traseu dintre cele două puncte care comunică.
Standarde stricte dictează cât de mult timp poate dura faza de construcţie a
legăturii; dacă nu pot fi obţinute toate resursele utilizatorul primeşte un ton
de ocupat. Capacitatea reţelei este planificată atent pe baza unor statistici
detaliate despre comportarea vorbitorilor, astfel încât în condiţii normale,
şansa obţinerii unui ton de ocupat din cauza resurselor insuficiente din reţea
să fie extrem de redusă.

Un factor crucial care garantează calitatea conexiunilor telefonice este


prealocarea tuturor resurselor necesare înainte ca legătura să fie stabilită.
Pornind de la numărul format, prima centrală telefonică calculează o secvenţă
de centrale prin care semnalul trebuie să treacă pentru a lega apelantul cu
apelatul; acest calcul se bazează pe tabele de rutare pre-calculate cu mare
grijă şi stabilite de către proiectanţii reţelei. Fiecare centrală negociază apoi
cu cea succesivă folosind un protocol sofisticat de semnalizare, şi alocă
capacitate pentru transportul datelor şi pentru comutarea acestora (care în
centrală leagă circuitul de intrare cu cel de ieşire). Când toate conexiunile
punct-la-punct între centrale sunt stabilite se generează un ton de ”apel”.
Când conversaţia a fost iniţiată, semnalul vocal este eşantionat şi digitizat în
prima centrală. Pentru fiecare bit din acest semnal s-a prealocat deja o cuantă
periodică de timp pe fiecare dintre circuitele pe care le va traversa. Biţii sunt
transmişi unul câte unul şi traversează toate trunchiurile în aceeaşi ordine în
care au fost generaţi, sosind la destinaţie la timp pentru a fi reasamblaţi şi
convertiţi la loc într-un semnal auditiv. Din cauza prealocării, de îndată ce un
bit intră în reţea, cu o probabilitate extrem de ridicată el va ajunge la celălalt
capăt exact când trebuie. Când unul dintre vorbitori închide telefonul,
protocolul de semnalizare intră din nou într-o fază complicată, prin care
eliberează toate resursele alocate la momentul apelului.
Cap. 1. Introducere 165

Reţeaua Internet are o arhitectură fundamental diferită. Nu numai că nu


există garanţii despre timpul necesar pentru a ajunge de la emiţător la
receptor, dar nu există nici o garanţie că datele nu sunt pierdute sau
modificate în timpul transferului. Utilizatorii Internetului obţin un serviciu
extrem de ”slab”, care poate fi enunţat pe scurt astfel: ”tu pui date în reţea şi
zici unde vrei să ajungă, iar reţeaua o să încerce să livreze datele acolo”.

Felul în care informaţia circulă în reţeaua Internet este complet diferit de


reţeaua telefonică: datele sunt divizate în pachete care sunt introduse în
reţea în ordinea sosirii. Fiecare pachet poate călători pe o rută complet
diferită până la destinaţie. Unele pachete se pot pierde, alte pot fi duplicate,
şi ele pot sosi la destinaţie în altă ordine decât au fost emise, sau chiar sparte
în pachete mai mici.

Pachetele sunt plimbate prin Internet de un protocol numit IP, Internet


Protocol. IP funcţionează aproximativ astfel: când un calculator intermediar
primeşte un pachet se uită întâi la adresa destinaţie înscrisă. Apoi el face nişte
calcule simple pentru a decide în ce direcţie pachetul trebuie trimis, mai
precis, căruia dintre vecinii săi trebuie să-i dea pachetul. Pachetul este apoi
trimis vecinului. Dacă la un calculator intermediar pachetele vin mai repede
decât apucă să le trimită mai departe, şi dacă nici nu are unde să le stocheze
pentru o vreme, are dreptul să le facă pierdute. Aceasta este principala cauză
pentru care datele se pot pierde în Internet.

Spre deosebire de reţeaua telefonică, structura Internetului nu este


controlată de un număr mic de companii, ci este în continuă schimbare, de la
zi la zi şi de la oră la oră, pe măsură ce noi calculatoare se conectează, noi
utilizatori sună folosind modemuri şi noi linii de transmisiune sunt instalate.
Calculatoarele responsabile pentru transmiterea datelor, numite rutere,
discută între ele permanent pentru a afla care este forma curentă
aproximativă a reţelei. Aceste informaţii sunt utilizate în procesul de decizie
166 Cap. 1. Introducere

care selectează vecinul folosit pentru transmisiunea fiecărui pachet spre


destinaţie.

Dată fiind această infrastructură, este uimitor că Internetul funcţionează


câtuşi de puţin, şi că informaţia ajunge câteodată neperturbată la destinaţie.
Fiabilitatea aplicaţiilor din Internet este construită pe baza acestui mediu
extrem de nefiabil, folosind două ingrediente:

1) Lipsa de stare. Ruterele din Internet nu stochează nici un fel de informaţii


despre traficul care le parcurge. Prin contrast, în reţeaua telefonică,
comutatoarele ştiu despre fiecare bit care le traversează de unde vine, unde
se duce, şi când va sosi succesorul lui. Un ruter primeşte un pachet, calculează
vecinul căruia să-i dea pachetul şi livrează pachetul. Starea internă a ruterului
după livrarea pachetului este aceeaşi cu cea de dinainte. Aşa cum am văzut în
cazul reîntineririi programelor, lipsa stării interne face mult mai simplă
repornirea unui ruter după o defecţiune. O defecţiune nu pierde informaţii
vitale, care nu pot fi recuperate prin alte metode. De asemenea, lipsa stării
face relativ uşoară sarcina altor rutere de a prelua traficul în cazul defectării
unuia.

2) Protocolul TCP. Realizarea unei transmisii fiabile prin reţeaua Internet se


face utilizând un protocol numit Transmission Control Protocol (TCP), care se
execută deasupra protocolului IP. Dacă într-o reţea toate nodurile din interior
execută IP, numai sursa şi destinaţia execută TCP. TCP este protocolul care
construieşte o transmisiune fiabilă: el asigură că toate pachetele trimise ajung
la destinaţie, fără lipsuri sau duplicate, în ordinea în care au fost trimise. TCP
reuşeşte această performanţă folosind următoarele mecanisme:
 numerotează pachetele trimise;
 foloseşte pachete de confirmare pentru a anunţa sosirea datelor la capătul
celălalt;
Cap. 1. Introducere 167

 foloseşte alarme pentru a detecta pachetele care nu sunt confirmate


pentru un timp îndelungat;
 foloseşte retransmisii pentru a retrimite pachetele care se pierd în reţea.

Din cauză că pachetele cu confirmări se pot pierde la rândul lor, unele pachete
sunt injectate în mod repetat în reţea, ceea ce poate duce la livrarea unor
duplicate; TCP trebuie să le elimine folosind numerele de serie ale pachetelor.

Întregul Internet este construit pe nucleul nefiabil oferit de IP: nu numai


datele şi confirmările sunt trimise în mod nefiabil, dar chiar şi mesajele de
control schimbate între rutere, prin care află despre schimbările din topologia
reţelei şi traficul folosit pentru monitorizarea şi mentenanţa reţelei folosesc
aceleaşi mecanisme nefiabile de transmisiune.

În pofida structurii sale aparent şubrede, Internetul este un competitor


formidabil al altor forme de distribuţie a informaţiei: radio, televiziune şi
telefonie. Costul transmisiunii vocii prin Internet este mult mai scăzut decât
folosind reţelele specializate de telefonie. Multe companii importante de
telefonie investesc în mod serios în echipamente care transportă voce peste
protocolul IP.

Internetul mută problema fiabilităţii la un nivel superior, de la IP la TCP. TCP


oferă o fiabilitate perfect adecvată pentru multe aplicaţii. TCP este executat
numai de către calculatoarele terminale implicate în comunicaţie, şi nu de
către rutere. Ca atare algoritmii complicaţi folosiţi de acest protocol nu
taxează resursele reţelei, care scalează în mod natural la dimensiuni globale.

Mai mult, unele aplicaţii care nu au nevoie de livrarea fiabilă a datelor nu sunt
obligate să folosească protocolul TCP. De exemplu, protocoalele folosite
pentru posturile de radio din Internet folosesc coduri puternice de corecţie a
168 Cap. 1. Introducere

erorilor şi nu au nevoie de retransmisii. Pachete pierdute sau întârziate sunt


pur şi simplu ignorate. Acest lucru este acceptabil pentru că utilizatorul final,
omul, tolerează semnale cu zgomot.

7.5. Concluzii

În acest capitol au fost prezentate unele consideraţii privind modul cum


fiabilitatea influenţează construcţia echipamentelor de calcul. O concluzie
foarte importantă care rezultă din analiza făcută este că deşi fiabilitatea
ridicată este dezirabilă, un proiectant trebuie întotdeauna să ia în
consideraţie şi costul plătit pentru a o obţine.

Calculatoarele moderne sunt construite dintr-o serie de nivele abstracte, care


oferă funcţionalităţi din ce în ce mai puternice. Fiecare nivel are o fiabilitate
diferită şi foloseşte tehnici diferite pentru a oferi nivelelor superioare
imaginea unei fiabilităţi sporite. În general hardware-ul oferă lumii software
aparenţa perfecţiunii în această privinţă, adică o fiabilitate excepţional de
ridicată.

Tendinţele tehnologiei indică însă că arhitectura calculatoarelor viitorului va


fi supusă unor schimbări radicale, unul dintre motive fiind chiar schimbarea
majoră a fiabilităţii unora dintre nivele. De exemplu, miniaturizarea continuă
a componentelor electronice va fi însoţită de o degradare a fiabilităţii însoţită
de apariţia tot mai frecventă a defecţiunilor permanente şi tranzitorii. Costul
plătit pentru a masca aceste defecte prin tehnici tradiţionale creşte extrem
de rapid: costul extrem de ridicat al unei fabrici de semiconductoare din
ultima generaţie, de ordinul a câteva miliarde de dolari, este doar primul
simptom al acestui fenomen.
Cap. 1. Introducere 169

În prezent, departamentele de cercetare ale firmelor producătoare de


echipamente de calcul lucrează în mod activ pentru a defini arhitecturile
structurilor de calcul al viitorului. Direcţiile urmărite sunt prezentate în
continuare:

 Iluzia unui hardware perfect trebuie eliminată, imperfecţiunile din nivelul


hardware trebuie să fie expuse nivelului software şi rezolvate de acesta.
Pentru a face acest lucru, baza echipamentelor de calcul trebuie să fie
hardware-ul reconfigurabil, care este suficient de flexibil pentru a fi
reprogramat după nevoi.

 Microprocesorul trebuie să fie redus la un rol secundar şi înlocuit cu


hardware generat specific, pentru fiecare aplicaţie, cu ajutorul
compilatoarelor.

 Numărul de nivele abstracte trebuie să fie micşorat în mod dramatic,


pentru a reduce costul suplimentar plătit, care creşte exponenţial.

 Trebuie folosite în mod constant tehnici care descoperă defecte şi folosesc


rezerve pentru a ocoli defectele de fabricaţie.

 Calculele trebuie să fie efectuate folosind date codificate utilizând coduri


robuste, pentru a preveni efectele erorilor tranzitorii.

 Utilizarea pe scară largă a metodelor de verificare formală pentru a ne


asigura că echipamentele de calcul pe care le folosim sunt corect
construite.

Ştiinţa calculatoarelor este relativ tânără şi, cu siguranţă, viitorul ne rezervă o


mulţime de surprize în ceea ce priveşte tehnologiile, arhitectura şi algoritmii
cei mai eficienţi.
170 Cap. 1. Introducere

CAPITOLUL 8

ÎNCERCĂRI DE FIABILITATE

8.1. Introducere

Indicatorii de fiabilitate a echipamentelor pot fi determinaţi dacă se cunosc


repartiţiile timpilor de funcţionare fără defecţiuni şi de reparare (reînnoire).

Determinarea funcţiilor de repartiţie şi a parametrilor acestora pot fi făcute


numai prin măsurători asupra variabilelor examinate în cadrul unor încercări
pe eşantioane alcătuite de regulă prin sondaje pur aleatoare. În cazul seriilor
mici, măsurătorile sunt efectuate de regulă în timpul exploatării curente,
informaţiile obţinute fiind utilizate pentru reglarea controlului de calitate.

În cazul echipamentelor cu timpi medii de bună funcţionare mari, apare o


problemă deosebită ce constă în durata mare a încercărilor, durată ce poate fi
redusă prin mărirea eşantionului supus încercării. Întrucât indicatorii de
fiabilitate depind de multe solicitări (sarcină, putere disipată, tensiune aplicată,
interacţiuni cu factorii de mediu etc.) rezultă că încercările de fiabilitate sunt
Cap. 1. Introducere 171

mari consumatoare de timp şi presupun un efort considerabil, atât din punct de


vedere tehnic cât şi financiar. Este necesară o clasificare a încercărilor de
fiabilitate după câteva criterii, ca mai jos.

1. După scopul încercării

1.1. Încercări de determinare a indicatorilor de fiabilitate prin care se


stabilesc legile de repartiţie a timpilor de funcţionare.
1.2. Controlul indicatorilor de fiabilitate prin care se verifică dacă aceştia
se încadrează în limitele prestabilite.
1.3. Încercări de cunoaştere a fiabilităţii operaţionale.
1.4. Încercări de investigare - obţinerea într-un timp scurt a unor informaţii
cu privire la indicatorii de fiabilitate.
2. După mărirea solicitărilor aplicate, încercările de fiabilitate pot fi:

2.1. Încercări simple - la care solicitările sunt constante la diferite nivele,


dar sub nivelul nominal şi de regulă sunt solicitări de sarcină sau
termice.
2.2. Încercări normale - la care solicitările sunt aceleaşi ca în exploatare.
2.3. Încercări accelerate - la care solicitările sunt peste cele normale, în
scopul reducerii timpului de încercare.

3. După procedura de încercare, clasificarea se face în funcţie de factorul


ales apriori, la atingerea căruia se adoptă decizia cu privire la fiabilitatea
echipamentului încercat. Dacă acest factor este o durată, încercările se numesc
trunchiate, iar dacă acesta este un număr prestabilit de defectări, încercările se
numesc cenzurate. Dacă decizia pate fi adoptată în fiecare moment în funcţie
de numărul de defecte şi de durata cunoscută, încercările se numesc secvenţiale
sau progresive (progresiv trunchiate şi progresiv cenzurate).
172 Cap. 1. Introducere

Cele mai răspândite încercări de fiabilitate sunt următoarele:


 încercări trunchiate sau cenzurate pentru determinarea intensităţilor
defecţiunilor, timpul mediu de funcţionare fără defecţiuni, a legii de
repartiţie a timpului de funcţionare fără defecţiuni;
 încercări progresiv trunchiate;
 încercări accelerate, pentru investigaţii, în special asupra componentelor
echipamentelor tehnice.

Toate încercările se pot face cu sau fără înlocuirea echipamentelor defecte în


cadrul eşantionului supus testelor. Simbolizarea încercărilor este prezentată în
continuare:
NCr - încercări cenzurate cu înlocuire;
NFr - încercări cenzurate fără înlocuire;
NCT - încercări trunchiate cu înlocuire;
NFT- încercări trunchiate fără înlocuire,
unde - N este volumul eşantionului;
- r este numărul de echipamente la a căror defectare se opreşte
experimentul;
- T este timpul la care se opreşte experimentul.

Oricare ar fi tipul de încercare, rezultatul obţinut este un şir de măsurători (serie


statistică), t1, t2 ... .tn care reprezintă valorile variabilei examinate (de exemplu
timpul de funcţionare fără defecţiuni sau timpul de reparare). Pe baza acestor
date se calculează funcţia empirică de repartiţie şi se formulează o ipoteză
statistică asupra repartiţiei variabilei, ipoteză care se verifică printr-un test de
concordanţă ( ex. Kolmogorov).

8.2. Încercări cenzurate


Cap. 1. Introducere 173

A) - Încercări cenzurate fără înlocuire – (NFr). Sunt supuse încercării N


echipamente identice, care sunt puse în funcţiune în acelaşi moment şi
funcţionează simultan în acelaşi regim. Se constată că unele echipamente se
defectează la momentele t1, t2,... tr, experimentul încetând în momentul
constatării celei de-a r-a defectări. O estimaţie absolut corectă pentru timpul
mediu de bună funcţionare este:

1 r T r
T̂   ti  2 ; T   ti (8.1)
r i 1 r i 1

B) - Încercări cenzurate cu înlocuire – (NCr). Încercarea începe cu N


echipamente identice care sunt puse în funcţiune în acelaşi moment şi
funcţionează simultan. În momentul în care unul dintre echipamente se
defectează, acesta este înlocuit cu altul nou. Încercarea se termină când se
constată a r-a defecţiune. Rezultă că în încercare se folosesc N+ (r-1)
echipamente. Şi în acest caz un estimator al timpului mediu de funcţionare este:

1 r
T̂   ti (8.2)
r i 1

Durata totală a experimentului este mai mică decât în cazul anterior, deoarece
la încercările fără înlocuire probabilitatea de defectare scade pe măsură ce se
defectează unele echipamente, însă costul experimentului este mai ridicat
datorită numărului mai mare de echipamente supuse testatelor.

8.3. Încercări trunchiate (NCT, NFT)

În cazul acestor încercări experimentul încetează la un moment t* fixat


dinainte. Sunt puse simultan în funcţiune N echipamente iar experimentul se
174 Cap. 1. Introducere

opreşte la momentul t*, în intervalul (0, t*) constatându-se apariţia a r -


defecţiuni, unde r este o variabilă aleatoare.
8.4. Încercări accelerate

Încercările accelerate de determinare a indicatorilor de fiabilitate (de regulă


intensitatea defectărilor sau timpul mediu de bună funcţionare) se realizează
prin creşterea solicitărilor peste limitele nominale, cu condiţia menţinerii
mecanismelor de producere a defecţiunilor.

În încercările accelerate se pleacă de la ipoteza că viteza de desfăşurare a


proceselor de uzură creşte odată cu creşterea solicitărilor.

Limitele impuse solicitărilor corespund regiunilor în care apar tipuri noi de


defecte, care nu au nici o şansă să apară în condiţiile unor solicitări normale.

Ca parametri de solicitare se pot folosi: temperatura, tensiunea, umiditatea,


puterea disipată, solicitări mecanice (şocuri, vibraţii etc.).

Regimul normal de funcţionare este regimul în care solicitările nu depăşesc


valorile limită cuprinse în norma internă a echipamentului.

Regimul în care cel puţin o solicitare depăşeşte valoarea limită prestabilită, este
un regim forţat.

Chiar în condiţii normale de funcţionare, solicitările pot fi diferite, în


consecinţă şi parametrii de fiabilitate sunt diferiţi. Se pune în acest caz
problema corespondenţei dintre parametrii de fiabilitate şi solicitări.

Fie x0 şi x1 două nivele de solicitare a unui echipament. Prin încercări se


determină seria statistică t1, t2, …, tn, de solicitare x0 şi t1 ,t 2 ,...,t n la nivelul de
Cap. 1. Introducere 175

solicitare x1. Se calculează funcţiile empirice de repartiţie Fn* ti  pentru cele
două nivele de solicitare şi se verifică ipoteza cu privire la legea de repartiţie
(test Kolmogorov). Dacă testul este trecut se adoptă funcţia de repartiţie
teoretică. Corespunzător celor două nivele de solicitare se obţin funcţiile de
repartiţie Fx0 t  şi Fx1 t  , reprezentate în figura 8.1.

Dacă Fx1 t > Fx0 t  pentru orice t, atunci x1 este o suprasolicitare în raport cu
x0. Pentru aceeaşi probabilitate de defectare q, avem:

Fx1 t1  = Fx0 t0  = q (8.3)

relaţie care stabileşte legătura între timpii de funcţionare la diferite solicitări.


Dând lui q diferite valori între 0 şi 1 obţinem o relaţie de forma t0 = q(t1) care
se numeşte funcţie de accelerare.

Fig.8.1. Evoluţia funcţiei de repartiţie în raport cu nivelul solicitărilor

În particular relaţia (8.3) stabileşte legătura între timpul mediu de bună


funcţionare la solicitarea x0 funcţie de timpul mediu de bună funcţionare la
solicitarea x1.

Din nefericire, funcţia de accelerare se cunoaşte în prea puţine cazuri ca să


poată fi utilizată. În această situaţie este necesar să se determine direct
176 Cap. 1. Introducere

dependenţa dintre parametrul de fiabilitate şi solicitare, de exemplu


dependenţa T̂  f x  , unde x este nivelul de solicitare.

Acest lucru se face punct cu punct, la câteva nivele de suprasolicitare. Se


formulează apoi o ipoteză cu privire la funcţia f(x) care se verifică printr-un
test statistic (Kolmogorov-Smirnov) pe baza aceloraşi date experimentale.
Dacă testul este trecut, funcţia adoptată poate fi utilizată pentru determinarea
parametrului de fiabilitate la solicitarea nominală. Există două moduri de
realizare a încercărilor pentru determinarea dependenţei T̂  f x  :
1. Metoda solicitărilor constante;
2. Metoda solicitărilor în trepte (la timp constant).

În primul caz se supune încercărilor un lot de echipamente la nivelele de


suprasolicitare x1, x2,…, xk. Pentru fiecare nivel de solicitare se determină timpii
la care apar defectările iar pe baza lor se verifică ipoteza cu privire la repartiţia
mediei timpului de bună funcţionare şi se determină timpul mediu T̂xi .
 
Cunoscând punctele xi ,T̂xi , funcţia f(x) se aproximează cu o funcţie oarecare
(de regulă exponenţială sau combinaţii de exponenţiale), care trece prin aceste
puncte, timpul mediu de bună funcţionare la solicitarea nominală fiind:
T̂  f  x0  . Indiferent de metoda de încercare se pun două probleme:

1. Care este nivelul maxim admis pentru suprasolicitare?


2. Care este cea mai bună funcţie ce aproximează pe T̂  f x  ?

După cum am precizat de la început, suprasolicitarea nu trebuie să schimbe


mecanismul de producere a defecţiunilor. Este uşor de intuit că, odată cu
schimbarea acestui mecanism, se modifică şi legea de repartiţie a timpului de
funcţionare fără defecţiuni. În consecinţă se poate alege drept criteriu de
limitare a suprasolicitărilor, schimbarea legii de repartiţie a acestuia.

În ceea ce priveşte a doua întrebare, răspunsul este mai complicat, depinzând


de natura suprasolicitării. Dacă, de exemplu solicitarea este temperatura  ,
Cap. 1. Introducere 177

degradarea mai rapidă a echipamentului odată cu creşterea temperaturii


reflectă modificarea structurii fizico-chimice, care urmează de regulă o lege
exponenţială (aşa cum în chimie, viteza de reacţie chimică creşte exponenţial
cu temperatura – legea S. Arrhenius). În acest caz se poate adopta o lege de
forma:

T̂  A  e  B (8.4)

constantele A şi B urmând a fi determinate.

Bineînţeles că legea adoptată trebuie verificată experimental, de exemplu cu


ajutorul unei reţele probabilistice logaritmice, pentru care lnT̂   B  ln A ,
punctele  i ,T̂i  trebuind să se plaseze sensibil pe o dreaptă.

Dacă se schimbă factorul de solicitare, modelul legii de degradare se schimbă


şi în consecinţă şi funcţia T̂  f x  . O alegere raţională a acestei funcţii se poate
face numai pe baza unei analize profunde a mecanismului de defectare, funcţie
de fiecare solicitare în parte. Alegerea acestei funcţii constituie de fapt cheia
succesului încercărilor accelerate.

Alte tipuri de legi de degradare sunt prezentate în continuare:

a) Ţinând seama de reacţiile care conduc la îmbătrânirea unui material,


Bussing a determinat relaţia:
B
T̂  A  e  (8.5)
A şi B fiind constante de material.
b) Pentru rulmenţi, la care defectările se datorează încălzirilor locale şi
globale provenite din frecări nedorite (inclusiv cele datorate ungerii
incorecte):
178 Cap. 1. Introducere

b
a
T̂  e  c (8.6)

unde  este temperatura absolută, iar a, b, c sunt constante ce depind de


material şi de tipul constructiv al rulmentului.

c) Degradarea termică a materialelor izolante este descrisă de o lege de


forma f  ,T̂ ,r   0 , unde r = r(t) este rezistenţa materialului izolant.
Degradarea se manifestă prin scăderea în timp a rezistenţei de izolaţie (la
solicitare termică constantă). Pentru degradarea rezistenţei de izolaţie se
verifică o lege de tip Arrhenius şi după unele raţionamente se ajunge la:
b
a
T̂  e  c (8.7)
unde a şi b sunt constante de material.

O lege de degradare similară este valabilă şi pentru echipamentele de


automatizări şi calcul, la care solicitările electrice sunt mici.

Exemplu de organizare a încercărilor accelerate

1. Obiectul supus încercării – conector pentru circuite integrate.


2. Volumul lotului – 6 grupuri a câte 65 conectori.
3. Condiţii nominale – clasa de temperatură a conectorului este de
+1250C.
4. Scopul încercării – deducerea timpului mediu de bună funcţionare.
5. Factorul de accelerare – temperatura.
6. Criteriul de defectare – creşterea rezistenţei de contact peste o valoare
stabilită.
Cap. 1. Introducere 179

7. Ipoteza repartiţiei timpului de funcţionare fără defecţiuni – legea


exponenţială negativă.
8. Modul accelerării – solicitări în trepte de temperatură, în timp
constant, în conformitate cu tabelul 8.1:
9. Criteriul solicitării maxime – schimbarea legii de repartiţie.
1 1
10. Ipoteza uzurii    ln T̂  ln A (tip Arrhenius).
B B
11. Observaţii:
- Precizia măsurătorii rezistenţei de contact 0.5%.
- Precizia menţinerii temperaturii pe palier  10 C .
- Măsurătorile se fac continuu.

Tabelul 8.1
Durata palierului (ore)
Temp.
A B C
palier
1 2 1 2 1 2
1000
1200
1400 160
1600 24 160
1800 24 160
2000 4 24
2200 4
2400 4

Grupurile de conectori A2, B2, C2 sunt supuse la două trepte de solicitare.


Această grupare este necesară şi pentru o analiză factorială a defectării,
grupurile supuse probelor putând proveni din loturi diferite, de pe maşini
180 Cap. 1. Introducere

diferite etc. În general planul de încercări se alcătuieşte cunoscând tehnologia


de fabricaţie a produsului şi materialele folosite.

Rezultatele obţinute: Pentru fiecare temperatură se înregistrează timpii de


defectare  i : t1i , t 2i ,... t ni , i = 1,8. Cu aceste date, se calculează funcţiile
empirice de repartiţie şi se reprezintă pe o reţea probabilistică exponenţială
negativă. Se constată că pentru   2400 C legea de repartiţie diferă de cea
exponenţială negativă, rezultând că solicitările la această temperatură nu sunt
justificate şi deci nu vor fi luate în considerare. Pentru fiecare nivel de
temperatură se determină apoi valoarea lui T̂i .

 0C 220 200 180 160

T̂ h 10 30 162 800

Fig. 8.2. Timpul mediu de bună


funcţionare pentru conectorii
supuşi încercărilor

Se verifică ipoteza cu privire la legea uzurii, pe cale grafică. Se observă că


punctele sunt sensibil plasate pe o dreaptă, deci se poate accepta ipoteza
exponenţială a uzurii funcţie de solicitarea considerată. Din grafic se poate
aprecia valoarea lui T̂ la temperatura de 1250C (valoarea maximă a
temperaturii la care poate fi supus conectorul în exploatarea curentă). Rezultă
o estimaţie a timpului mediu de bună funcţionare, T̂  6.000 h, valoare obţinută
Cap. 1. Introducere 181

într-un timp considerabil mai scurt decât ar fi durat o estimaţie bazată pe


informaţiile culese în timpul exploatării curente a conectorilor supuşi încercării
accelerate.
CUPRINS
pag.

Cap.1. Introducere………………………………………………………….7

Cap.2. Fiabilitatea
echipamentelor.............................................................15
2.1. Indicatori de
fiabilitate.................................................................15
2.2. Modelarea uzurii echipamentelor.................................................18
2.3. Legi de repartiţie asociate mecanismelor de defectare.................25
2.4. Reînnoirea echipamentelor...........................................................29
2.4.1. Procese de reînnoire...............................................................29
2.4.2. Strategii de reînnoire............................................................40

Cap.3. Fiabilitatea structurală.....................................................................49


3.1. Modelul funcţional.......................................................................49
3.2. Modelul logic...............................................................................52
3.2.1. Metode de analiză a fiabilităţii echipamentelor
descrise prin modele
logice………..……………………….57
3.2.2. Metode algebrice de analiză a fiabilităţii echipamentelor
descrise prin modele logice....................................................64
3.3. Modelul proceselor Markov.........................................................70
3.4. Modelul arborelui de defectare....................................................77
182 Cap. 1. Introducere

Cap.4. Echipamente tolerante la defectări..................................................81


4.1. Introducere...................................................................................81
4.2. Algoritmi de detecţie şi diagnosticare a defectărilor...................83
4.2.1. Algoritmi de reconfigurare a echipamentelor........................84
4.2.2. Algoritmi de mascare a defectărilor.......................................85
4.3. Structuri redundante pentru implementarea
toleranţei la defectări....................................................................85
4.3.1. Structuri redundante statice de tip individual
şi global rezultate prin multiplicare........................................89
4.3.1.1. Structura redundantă logică majoritară.........................90
4.3.1.2. Structuri redundante statice cu logică cvadruplă..........94
4.3.2. Structuri redundante dinamice..............................................95
4.3.2.1. Structuri redundante hibride...........................................97
4.3.2.2. Structuri redundante pentru interconexiunile
unui echipament..............................................................98

Cap.5. Tehnici de detecţie a erorilor.........................................................101


5.1. Introducere.................................................................................101
5.2. Metode de generare a secvenţelor de test
utilizate în diagnoza defectelor..................................................103

5.2.1. Metode de generare a secvenţelor de test


pentru circuite logice............................................................103
Cap. 1. Introducere 183

5.2.2. Strategii de elaborare a secvenţelor de test


pentru echipamentele mari..........................................................106
5.3. Metode de derulare a testelor
....................................................109
5.4. Sisteme autotestabile..................................................................111
5.5. Metode de asigurare a unei testabilităţi facile............................115
5.6. Probleme specifice ale tehnicilor de implementare a
toleranţei la
defectări.................................................................121
5.7. Tehnici de reconfigurare a echipamentelor
la apariţia
defectărilor................................................................125

Cap.6. Strategii evolutive de reînnoire.....................................................129


6.1. Reînnoirea echipamentelor în context evolutiv..........................129
6.1.1. Premizele strategiei evolutive de reînnoire......................130
6.1.2. Principiul strategiei evolutive de reînnoire......................133
6.2. Structura sistemului evolutiv de reînnoire..............................136
6.3. Metode de evaluare a stării echipamentelor în strategia
evolutivă de reînnoire, prin sisteme de diagnoză..................139
6.3.1. Etapele evaluării stării echipamentelor.............................139
6.3.2. Tehnici neuronale de evaluare a stării echipamentelor..141
6.3.3.Tehnici fuzzy de evaluare a stării echipamentelor..........145
6.4. Reinstruirea sistemului de diagnoză.............................................150

Cap.7. Fiabilitatea echipamentelor de calcul............................................153


7.1. Introducere.................................................................................153
184 Cap. 1. Introducere

7.2. Proiectarea echipamentelor de calcul.........................................155


7.2.1. Structuri tolerante la defectări.............................................156
7.2.2. Coduri detectoare şi corectoare de erori.............................159
7.2.3. Memorii tolerante la defectări.............................................161
7.3. Fiabilitatea programelor..............................................................170
7.3.1. Creşterea fiabilităţii produselor software.............................172
7.4. Reţeaua internet ..........................................................................175
7.5. Concluzii.....................................................................................179

Cap.8. Încercări de fiabilitate....................................................................181


8.1. Introducere.................................................................................181
8.2. Încercări cenzurate.....................................................................183
8.3. Încercări trunchiate....................................................................183
8.4. Încercări accelerate....................................................................184

Bibliografie...............................................................................................190

S-ar putea să vă placă și