Sunteți pe pagina 1din 31

3. Estimri statistice. Testarea tipului funciei de repartiie a unei variabile aleatoare 3.1.

Scop
Aprofundarea cunostinelor de estimare statistica a parametrilor funciilor de repartiie, utiliznd metode de estimare punctuale sau continue.

3.2. Bazele teoretice


In multe din fenomenele tehnice, economice i sociale care sunt cercetate cu ajutorul statisticii matematice, exista motive practice i teoretice pentru a afirma c forma analitica (tipul) funciei de repartiie este cunoscuta. n fiecare dintre expresiile analitice ale funciile de repartiie (vezi tabelul 1-1) intervin o serie de parametrii, cum ar fi pentru funcia exponeniala, , , pentru funcia Weibull, etc. Cunoaterea valorilor numerice ale acestor parametrii ar permite cunoaterea completa a funciei de repartiie. Operaia prin care se evalueaz parametrii necunoscui ai unei funcii de repartiie poarta numele de estimare. Ea se efectueaz pe seama tratrii seleciei datelor rezultate n urma observrii experimentale, simulate sau n realitate a fenomenului tehnic, economic sau social analizat. Fie {X 1 , X 2 , K , X n } o selecie de volum n, extrasa din populaia pe care este definita variabila X avnd legea de repartiie presupusa cunoscuta i coninnd parametrii ce trebuie estimai. Valorile obinute cu ajutorul seleciei, care aproximeaz parametrii legilor de repartiie, poarta numele de estimaii punctuale ale acestor parametrii. Un al doilea gen de estimare statistica se bazeaz pe estimaii pe intervale; n acest caz, se indica un interval, despre care se afirm cu o probabilitate cunoscuta - c acoper valoarea parametrului estimat. Estimarea parametrilor unei legi de repartiie prin intervale de ncredere (sau de estimaie) constituie o generalizare a estimrii punctuale. Oricare ar fi metoda aleas de estimare, dorim s obinem date ct mai relevante n urma prelucrrii eantioanelor pe care le avem la dispoziie. De exemplu, dorim s verificm dac o moned are aceeai probabilitate p de apariie a oricrei dintre fee (pA=pB=0,5). Aruncm moneda de n=20 de ori i obinem de Na=14 ori faa `A`, respectiv de Nb=6 ori faa `B`. Ipoteza iniial pe care o putem formula este urmtoarea: Moneda are pA=pB=0,5. Dac prelucrm datele n aceast ipotez cel mai probabil ne-am fi ateptat s obinem n urma testului de 10 ori faa `A`, respectiv de 10 ori faa `B`. Ori moneda este fals, respectiv p A pB , ori moneda este adevrat i rezultatul obinut este pus pe seama ntmplrii . Pe baza acestor date, se poate respinge ipoteza iniial ? Datele nclin ctre varianta moned fals p A pB ? Pentru a putea rspunde la aceast ntrebare trebuie fixat mai nti un nivel / prag de semnificaie , respectiv de putea tii cnd acceptm astfel de rezultate observate - puse numai pe seama ntmplrii / ansei.

- 19 -

Exemple de valori tehnice posibile pentru sunt: =0,05 In acest caz, ne ateptm ca la o rat de 1 la 20 de eantioane pentru care s-au observat N a 14 sau N a 6 - dar acceptm c moneda este `corect` , un rezultat deci pus pe seama ntmplrii / ansei; =0,01 In acest caz, ne ateptm ca la o rat de 1 la 100 de eantioane pentru care s-au observat N a 14 sau N a 6 - dar acceptm c moneda este `corect`, un rezultat deci pus pe seama ntmplrii / ansei;

n condiiile n care ipoteza iniial este adevrat, distribuia v.a. Na este binomial Bin(n=20,p=0.5) . Paii necesari sunt urmtorii: 1. Se evalueaz probabilitatea evenimentului { N a 14 sau N a 6 }. Pentru evenimentul N a 6 avem probabilitatea egal cu valoarea funciei de repartiie binomiale n punctul Na=6, respectiv 0,057659; pentru evenimentul N a 14 sau echivalent N a > 13 avem probabilitatea egal cu valoarea complementar a funciei de repartiie binomiale n punctul N a 13. , respectiv 0,057659. Rezult probabilitatea evenimentului { N a 14 sau N a 6 } ca fiind egal cu 0,11532; 2. Dac aceast probabilitate este mai mic dect pragul de semnificaie , atunci ipoteza iniial poate fi respins, un asemenea rezultat observat nu poate fi acceptat numai pe seama ntmplrii; 3. Dac aceast probabilitate este mai mare dect pragul de semnificaie , atunci ipoteza iniial nu poate fi respins, un asemenea rezultat ar putea fi pus pe seama ntmplrii, nu avem motive s credem c moneda nu este `corect` - numai pe baza datelor prelucrate n aceast etap a experimentului. Putem afirma c datele observate nu sunt statistic importante pentru un nivel de semnificaie =0,05. Putem, de asemenea, afirma c datele observate nu sunt statistic importante nici pentru un nivel de semnificaie =0,01.

Dac ns presupunem acum c am observat N a = 15 , atunci la pasul 1 se obine o probabilitate egal cu 0,041389. n condiiile n care am fixa apriori un nivel de semnificaie =0,05, acest rezultat nu ar mai putea fi pus pe seama ntmplrii, se poate respinge ipoteza iniial n acest context. n aceasta situaie, faptul c am

- 20 -

semnificaie = 0,05 .

observat N a = 15 devine

statistic

important

pentru

un

nivel

de

Orice test statistic si propune s evalueze probabilitatea de la pasul 1. (in limba englez este denumit `p-value`), astfel nct s o putem compara cu nivelul de semnificaie fixat apriori.

Figura 2-1. Exemplu de zone critice n aplicarea unui test statistic Aflarea pragului critic de la care se poate respinge ipoteza iniial - revine la identificarea n prim etap a acelei cuantile `n` pentru care probabilitatea de a avea N a n , respectiv N a n are o valoare egal cu nivelul de semnificaie , respectiv n figura 2-1 aflarea lui `n` pentru care aria haurat este numeric egal cu valoarea fixat a nivelului de semnificaie. Un al doilea exemplu const ntr-o estimare pe baz de intervale de ncredere. Fie `m` echipamente independente i identice urmrite n acelai interval de timp i fie nivelul de semnificaie propus / fixat. Fie N o v.a. discret semnificnd numrul de echipamente care s-au defectat n intervalul de timp propus, avnd o distribuie binomial N ~ Bin(m, q ) , unde `q` este probabilitatea de defect la nivelul unui echipament, mrime pe care dorim s o estimm: q (qinf , qsup ) . Fie funcia de repartiie a v.a. N:
k k F (n m, q ) = Cm q (1 q ) m k k =0 n

(2.1)

pentru orice numr ntreg n m . n condiiile n care `n` este observat, limita superioar a intervalului de ncredere este soluia ecuaiei:

- 21 -

k m F (n | m, qsup ) = Cm qsup (1 qsup ) m k = k =0

(2.2)

respectiv limita inferioar a intervalului de ncredere este soluia ecuaiei:

C
k =n

k m m inf

q (1 qinf ) m k = 1 F (n 1 m, qinf ) =

(2.3)

n practic pentru aflarea limitelor intervalului de ncredere n acest caz se apeleaz la funcia beta incomplet, definit pentru orice 0 x 1 i a 0 ; b 0 prin integrala:

I x ( a, b) =

1 z a 1 (1 z )b 1 dz B ( a, b) 0

(2.4)

unde B(a,b) este integrala beta complet (funcia integral Euler de prima spe):

B (a, b) = z a1 (1 z )b1 dz
0

(2.5)

Pentru aproximarea cozii distribuiei binomiale (zona haurat din figura 2-1), se poate utiliza relaia :

C
k =n

k m

q m (1 q ) m k = I q (n, m n + 1)

(2.6)

De asemenea, se poate utiliza identitatea:

I x (a, b) 1 I1 x (b, a)
pentru orice 0 x 1 i a 0 ; b 0

(2.7)

n aceste condiii, limita superioar a intervalului de ncredere rezult din rezolvarea ecuaiei:

1 I qsup (n + 1, m n) =

(2.8) (2.9)
- 22 -

Limita inferioar a intervalului de ncredere rezult din rezolvarea ecuaiei:

I qinf (n, m n + 1) =

Soluiile se pot obine pe cale grafic (exemplificare n figura 2-2), respectiv numeric (exemplificare n Mathematica relaiile 2.10 i 2.11).

Figura 2-2. Calculul intervalului de ncredere al probabilitii de insucces (nivel de ncredere =0.05; numr iniial de echipamente m=20; numr de echipamente defecte n=5)

InverseBetaRegularized [0.05,5+1,15]=0,139594 InverseBetaRegularized [0.95,5,20-5+1]= 0,401028

(2.10) (2.11)

Este de dorit gsirea celor mai buni estimatori care s aproximeze ct mai bine valorile parametrilor, chiar n condiiile unui numr mai redus de observaii i avnd nivele de semnificaie fixate. Aceasta este o problem fundamental n teoria estimaiilor, rezolvarea acesteia necesitnd cunoaterea proprietilor de baza ale estimatorilor i clasificarea acestora n funcie de aceste proprieti. Tabelul 2-1 sintetizeaz principalele proprieti ale estimatorilor.

- 23 -

Proprietate estimator Deplasare

Definiie O statistic n ( X 1 , X 2 , K , X n ) este o

Relaii matematice

estimaie nedeplasat a unui parametru al unei funciei de repartiie, daca exist valoarea medie a statisticii Zn i este egala cu .

M ( Z n ) = , n N
Pentru n i > 0 , avem

P( Z n ( X 1 , X 2 ,K, X n ) < ) 1
O statistica n ( X 1 , X 2 , K , X n ) este o

Consisten

Condiiile necesare pentru ca statistica n ( X 1 , X 2 , K , X n ) sa fie consistent sunt: 1. S aib deplasare nula, adic M ( Z n ) = , n N , sau n cazul unei deplasri non-nule, s se respecte condiia: lim (M ( Z n ) ) = 0 .
n

- 24 -

estimaie consistent a unui parametru al unei funcii de repartiie, dac converge n probabilitate ctre acest parametru.

2. Dispersia estimaiei D(Zn) tinde la zero cnd n , adic lim(D( Z n ) ) = 0


n

Eficien

O statistic n ( X 1 , X 2 , K , X n ) este o estimaie eficient a unui parametru al unei funciei de repartiie, daca: Este nedeplasat Dispersia estimaiei D(Zn) este minim

M ( Z n ) = , n N

D(Z n ) = min = 1 (n ( ) ) , unde I() este


cantitatea de informaii per observaie:

Adic, dac statistica propus (analizat) d valori mai concentrate n jurul parametrului dect oricare alte estimaii.

ln f ( x, ) I ( ) = M =
+ ln f ( x, ) = f ( x, )dx. Daca n ( X 1 , X 2 , K , X n ) este o statistic oarecare, iar 2

n ( X 1 , X 2 , K , X n ) este statistic eficient, atunci raportul e n = D(Z n ) D(Tn ) (0,1) se numete eficiena estimaiei n ( X 1 , X 2 , K , X n ) .

Tabelul 2-1 Principale proprieti ale estimatorilor

- 25 -

- 25 -

Tabelul 2-2 prezint cei mai utilizai estimatori punctuali pentru parametrii principalelor funcii de repartiie. Se noteaz cu t1,t2,..,tn timpii de funcionare pana la defect a n echipamente identice monitorizate; de libertate);
2 a ,n

- cuantil de ordin a a distribuiei n (cu `n` grade


2

t a ,n

- cuantil de ordin a a distribuiei Student t(n) i

Fa ,m,n

cuantil de ordin a a distribuiei F(m,n).

- 26 -

Metoda Verosimilitate maxim; Momentelor Verosimilitate maxim

Funcia de repartiie Exp()

Estimatorii parametrilor funciei de repartiie

Observaii

=n

t
i =1

Weib(,)

n n + ln(t i ) = i =1

t
i =1 i

i =1

ti ln(ti ) ;

=
i =1

t n

Valoare iniiala (de start):

= (0)
CD =

1,05 CD

Se rezolv iterativ prima ecuaia, pornind de la valoarea iniial propus pentru parametrul .Valoarea finala obinut pentru se multiplic cu coeficientul :

1 n (t i t )2 t n i =1

- 27 Verosimilitate maxim LN(,)

G n = 1,0 1,346 n 0,8334 n 2


2 n ln ti 1 n 2 2 = (ln ti ) i=1 n ; n 1 i =1

, unde CD este coeficientul de dispersie.

1 n ln(t i ) n i =1

Tabelul 2-2. Estimatori pentru parametrii principalelor funcii de repartiie

Cele mai utilizate teste statistice n ingineria fiabilitii sunt: i) Testul Bartlett de evaluare a validitii utilizrii funciei exponeniale n modelare. Etapele aplicrii: - Se calculeaz statistica:

T 1 n 2n ln ln(t i ) n n i =1 Bn = , 1 + (n + 1) (6n )
2

unde T = t i
i =1

Se compara valoarea obinuta cu urmtoarele valoarea critica


2 Bn > , n 1 , atunci ipoteza de exponenialitate nu poate fi

, n 1 , unde este nivelul de semnificaie;


Dac
2 utilizata pentru modelare, intervalul V = fiind considerat deci , n1 ,+

regiunea critic.

ii) Testul 2 - pentru timpi de funcionare anormal de scuri Timpii de funcionare anormal de scuri pot apare datorit unor abateri foarte rare (excepionale) de la parametrii procesul de producie al echipamentelor. Aceti de timpi de funcionare nu pot fi considerai n evaluarea statistic, deoarece nu sunt reprezentativi. n acest caz, ei nu se iau n considerare n eantionul reprezentativ pentru determinarea parametrilor distribuiei timpului de funcionare. Fie t1,t2,..,tn o secven de "n" timpi independent i identic exponenial distribuii (de parametrul ), reprezentnd timpii intre primele "n" defecte ale unui echipament. Atunci, se demonstreaz ca doua grade de libertate. Deci, 2 2) grade de libertate. Dac se ordoneaz n ordine cresctoare secvena de timpi, atunci t1 devine cel mai scurt timp i (2n-2) i 2.
n

2t i

urmeaz o distribuie 2 (2), cu

t i urmeaz o distribuie
i=2

2 (2n 2) , cu (2n-

t
i =2

(n 1)t1

urmeaz o distribuie F(2n-2,2), cu gradele de libertate

- 28 -

ti
n consecin, se compar valoarea
i=2

(n 1) t 1

cu cuantila F , (2n-2), 2.

t
Dac avem
i=2

(n 1)t1

> F , (2 n 2 ), 2 atunci t1 nu este reprezentativ pentru restul

timpilor considerai i ipoteza anormalitii este adevrata, cu nivelul de semnificaie considerat ().

iii) Testul 3 - pentru timpi de funcionare anormal de lungi Urmnd acelai considerai ca mai sus, timpul de funcionare tan poate fi considerat anormal de lung dac :

(n 1)t an
i

ti an

> F , 2, (2 n 2 )
(2.12)

intervalul V = F , ( 2 n 2 ), 2 , + fiind considerat deci regiunea critic. iv) Testul Kolmogorov - Smirnov Este un test de concordan pentru verificarea ipotezei H0 conform creia funcia de repartiie a unei variabile aleatoare T este F0(t) . Presupunem c funcia de repartiie a v.a. T este de tip continuu i fie Fn (t i ) funcia empiric repartiie corespunztoare eantionului nregistrat (n modul):
*

{t1 , t 2 ,.., t n }

i fie Dn cea mai mare abatere

Fn (ti ) F (ti ) * Dn = sup Fn (t ) F (t ) = max tR 1i n + Fn (ti ) F (ti )


respectiv:

(2.13)

K n = Dn n
- 29 -

(2.14)

Teoreme importante:

Dac funcia de repartiie F(t) a v.a. T este continu, atunci distribuia v.a. Dn nu depinde de F(t); Pentru o abatere `x` dat i un eantion de volum mare (n>50, n cele mai multe cazuri), avem relaia
Pr ob{K n x} n FKS ( x)

(2.15)

unde FKS(x) este funcia de repartiie Kolmogorov Smirnov (prezentat n capitolul 1). Prin urmare, pentru n suficient de mare i un nivel de semnificaie propus (de exemplu =0,01; =0,05 ) se construiete un test bazat pe aflarea pragului critic `c` pentru care avem relaia:

Pr ob{K n > c} = 1 ,

(2.16)

Dac `n` are valori mai mici dect 50, atunci distribuia v.a. Kn se abate de la distribuia Kolmogorov Smirnov, fiind necesar cutarea pragului critic prin apelarea unui program de calcul adecvat de tipul Matlab, Octave, etc. Pentru a construi funcia empiric de repartiie F * (t i ) este necesar parcurgerea urmtoarelor etape: 1. ordonarea n ordine cresctoare a datelor din eantion t i i determinarea numrului de apariii pentru fiecare (frecvena absolut de apariie ni ; 2. determinarea numrului de valori distincte, k, a datelor din eantion i a frecvenei relative de apariie a acestora:

fi =

ni , n

unde n =

n
i =1

3. determinarea frecvenei cumulate de apariie (funcia empiric); 4. se reprezint grafic funcia empiric de repartiie, F * (t i ) , n funcie de datele din eantion, t i . Ipoteza funciei de repartiie este respins dac abaterea valoarea critic `c`

K n este mai mare dect

v) Testul Kolmogorov Smirnov (pentru dou eantioane) n acest caz, fie un eantion { X 1 , X 2 ,.., X m } provenit prin observarea realizrilor v.a. X ce urmeaz o distribuie continu F(x) i fie un al doilea eantion {Y1 , Y2 ,.., X n } provenit prin observarea realizrilor v.a. Y ce urmeaz o distribuie

- 30 -

continu G(y). Se formuleaz ipoteza iniial conform creia cele dou distribuii sunt identice F=G, respectiv ipoteza contrar FG i se fixeaz un nivel de semnificaie .
* * Dac Fm i Gn sunt funciile empirice construite la nivelul celor dou eantioane de date, atunci abaterile caracteristice sunt n acest caz:

* * Dmn = sup Fm (t ) Gn (t ) t R mn K mn = Dmn m+n


Similar, pentru un volum `echivalent`

(2.17) (2.18)

mn al datelor mai mare dect 50 i m+n

pentru nivelul de semnificaie propus (de exemplu =0,01; =0,05 ) se construiete un test bazat pe aflarea pragului critic `c` pentru care avem relaia:

Pr ob{K mn > c} = 1 ,

(2.19)

Dac abaterea caracteristic este mai mic dect pragul `c`, atunci se poate accepta ipoteza iniial F=G; Dac abaterea caracteristic este mai mare dect pragul `c`, atunci se poate respinge ipoteza iniial. (FG).

n tabelul 2-3 se prezint valorile pragului critic `c`, n acord cu valori uzuale ale nivelului de semnificaie.

- 31 -

n\m 1 2 3 4 5

3
* * * * * *

4
* * * * * * 16/16 *

5
* * * * 15/15 * 20/20 * * *

6
* * * * 18/18 * 20/24 24/24 24/30 30/30 30/36 36/36

7
* * * * 21/21 * 24/28 28/28 30/35 35/35 30/42 36/42 42/49 42/49

8
* * 16/16 * 21/24 24/24 28/32 32/32 30/40 35/40 34/48 40/48 40/56 48/56 48/64 56/64

9
* * 18/18 * 24/27 27/27 28/36 32/36 35/45 40/45 39/54 45/54 42/63 49/63 46/72 55/72 54/81 63/81

10
* * 20/20 * 27/30 30/30 30/40 36/40 40/50 45/50 40/60 48/60 46/70 53/70 48/80 60/80 53/90 70/90

11
* * 22/22 * 30/33 33/33 33/44 40/44 39/55 45/55 43/66 54/66 48/77 59/77 53/88 64/88 59/99 70/99

12
* * 24/24 * 30/36 36/36 36/48 44/48 43/60 50/60 48/72 60/72 53/84 60/84 60/96 68/96 63/108 75/108

- 32 -

6 7 8 9

Tabelul 2-4. Exemplu de valori critice n cazul testului Kolmogov-Smirnov pentru nivel de semnificaie =0,05 (valori de sus), respectiv pentru =0,01 (valori de jos).Valorile * - date insuficiente. Exemplu: pentru m=9;n=9;=0,05; c=54/81=0,666667. Se respinge ipoteza F=G dac abaterea Dmn este mai mare dect c / 81 (9 + 9) = 0,31427

n tabelul 2-5 se prezint valorile pragului critic `c`, n acord cu valori uzuale ale nivelului de semnificaie. c() 0,1 1,22 0,05 1,36 0,025 1,48 0,01 1,63 0,005 1,73 0,001 1,95

Tabelul 2-5. Valorile critice n cazul testului Kolmogov Smirnov (volum date n>50) vi) Teste secveniale (Wald) Toate problemele de testare a ipotezelor statistice, de estimare a parametrilor distribuiilor n care se utilizeaz metodelor de selecie presupun un volum n de probe bine determinat, prestabilit. Folosirea metodelor secveniale presupune o operare asupra termenilor succesivi ai irului de observaii, pe msura ce acestea sunt colectate din proces. Exist astfel trei variante posibile : Acceptarea ipotezei iniiale Respingerea ipotezei iniiale Continuarea colectrii de informaii din proces Fie eroarea de ordin nti a testului (de a da rezultate fals pozitive) i eroarea de ordinul doi a testului (de a da rezultate fals negative). Fie t1,t2,..tn rezultatele primelor n observaii asupra unei variabile aleatoare T (temperatur, timp, etc.), a crei densitate de probabilitate este f(t,). Asupra parametrului se face ipoteza iniial (nul) H0 : = 0 fa de ipoteza alternativ H1 : = 1 , cu 1 0 . Dac este adevrata ipoteza nul, atunci densitatea de probabilitate a variabilei aleatoare X este f(t,0) i probabilitatea ca dup n observaii independente sa se obin valorile t1,t2,..,tn este dat de relaia :

p 0 (n) = f (t i , 0 )
i =1

n ipoteza alternativ H1, probabilitatea ca dup n observaii independente sa se obin valorile t1,t2,..,tn este data de relaia :

p1 (n) = f (t i , 1 )
i =1

Cele trei variante posibile se rezum la :

- 33 -

Dac

p1 (n) 1 p 0 ( n) p1 (n) p 0 ( n) 1 1 p1 (n) < p 0 ( n) 1

atunci se accept ipoteza H0 ;

Dac

atunci se respinge ipoteza H0 (se

accepta H1) ; Dac

<

atunci este necesar obinerea de

noi observaii (mrit volumul `n` al eantionului. vii) Test privind procesul Poisson neomogen (PPN) Fie un PPN avnd intensitatea (t ) = t 1 . Presupunem c procesul este observat pe un interval de timp (0,T), evenimentele fiind nregistrate la momentele t1,t2,..,tn. Atunci estimatorii de verosimilitate maxim pentru parametrii i sunt:

n n ln T ln(ti )
i =1 n

= n ; T

viii)

Testarea ipotezei de omogenitate a unui proces Poisson

Dorim s testm dac datele observate de-a lungul unui interval de timp (0,T), cu evenimente nregistrate consecutiv la momentele t1,t2,..,tn provin de la un proces Poisson omogen de intensitate constant in timp (ipoteza nul / iniial H0) versus de la un proces Poisson ne-omogen (ipoteza contrar H1 ( 1 )). O statistic adecvat este V = 2

ln(T t ) .
i =1 i

Dac ipoteza nul este adevrata, atunci: Dac T=tn, respectiv intervalul de observare (0,T) se termin cu cea de-a `n`-a observaie, atunci V urmeaz o distribuie Chi2 Ptrat cu (2n) grade de libertate; in acest caz regiunea , 2 n ,+

2 este regiunea critic. Se accept ipoteza dac V < , 2 n i se

poate respinge n caz contrar. Daca T>tn, respectiv intervalul de observare (0,T) nu se termin cu cea de-a `n`-a observaie, atunci V urmeaz o distribuie ChiPtrat cu (2n-2) grade de libertate; in acest caz regiunea 2 este regiunea critic. Se accept ipoteza dac , 2 n 2 ,+

V < , 2 n2 i se poate respinge n caz contrar.


2

- 34 -

3.3. Analiza statistic a evenimentelor bazate pe riscuri competitive


Bazele de date moderne n domeniul fiabilitii, mentenanei i riscului sunt astfel proiectate nct s satisfac cerinele att ale proiectanilor, ct i ale inginerilor de fiabilitate i de mentenan. Se iau n considerare att evenimente legate de defecte incipiente, defecte datorate degradrii / uzurii, defecte de concepie, ct i de defecte critice. Pn recent, aceste date era analizate avnd la baz premiza independenei . Aceasta este, adesea, o premiza neplauzibil, atta vreme cat, de exemplu, evenimentele asociate defectelor datorate degradrii sunt n competiie /dependente cu / de cele critice. n general, astfel de evenimente pot fi descrise de un proces punctual colorat, fiecare eveniment putnd s aib un numr de proprieti. Gruparea acestor proprieti n clase mutual exclusive i exhaustive se traduce prin aciunea de colorare a procesului. n tabelul 2-6 este prezentat un exemplu de form de proiectare a bazei de date pentru dou grupuri turbogeneratoare monitorizate dintr-o central termoelectric.

- 35 -

Data / Grupul

Timp calendaristic [h] 0 160.6 269.3 1730.2 3276.9 4466.5 5697.1 7107.2

Timp de operare [h] 0 160.6 269.3 1730.2 3276.9 4466.5 R 5876.6

Eveniment

Criticitate eveniment

Aciune de mentenan realizat M1/M1a M2 M3 M4 / M1b M2 M M5

Timpul necesar aciunii de mentenan [h] 0.5 0.33 0.4 24 0.5 1410 0.2

01.01.06 / TG1,2 07.01.06 / TG1 11/1/6 13/3/6 16/5/6 6/7/6 25/8/6 23/10/6

V TC TA UG DA RP EX

C N N C C N

- 36 -

Tabelul 2-6. Exemplu de proiectare a bazei de date pentru analiza de

riscuri competitive

Legend: V vibraii crescute (mai mari de 60 m); TC diferen de temperatur carcasa superioar / inferioar depit (mai mare de 50 C); TA temperatur abur viu intrare turbin mai mic dect 480C; UG- presiune ulei ungere turbin mai mic dect 1 bar; DA deplasri axiale relative crescute; EX pierderea excitaiei generatorului electric RP revizie programat; M1- ajustarea viscozitii uleiului de ungere al turbinei (prin reglarea temperaturii acestuia la ieirea din rcitorii de ulei M1a / nlocuirea uleiului de ungere M1b); M2 ajustarea gradientului de cretere / scdere al temperaturii aburului viu la intrarea n turbin; M3- ajustarea debitului de ap injecii ntre SI3 / SI4 la cazanul de abur; M4 - ajustarea presiunii uleiului de ungere (prin nlocuirea uleiului de ungere M1b) M lucrri anuale de mentenan; C eveniment critic; N eveniment noncritic. Pentru o durat de operare T=18540 ore, la nivelul celor dou grupuri turbogeneratoare au fost nregistrate urmtoarele evenimente: Intervalul de timp [ore] [0, 9270] Eveniment C CC NC N NN CN C CC NC N NN CN Numr de evenimente 15 7 8 63 50 13 12 6 6 65 55 10 TG1 8 5 4 43 21 5 5 4 3 32 15 7 TG2 7 2 4 20 29 8 7 2 3 33 40 3

[9271, 18540]

Tabelul 2-7. Date nregistrate Legend: C eveniment critic; N eveniment non-critic; CC eveniment critic precedat la pasul anterior de un eveniment critic NC eveniment non-critic precedat la pasul anterior de un eveniment critic;

- 37 -

CN eveniment critic precedat la pasul anterior de un eveniment noncritic; NN eveniment non-critic precedat la pasul anterior de un eveniment noncritic. Premizele analizei statistice Premiza 1: procesul colorat este staionar n general, procesul colorat este staionar dac proporia de puncte de tip N, respectiv de tip C nu variaz semnificativ n raport cu timpul calendaristic. Pentru a verifica dac aceast premiz este plauzibil se construiete un test statistic care s valideze dac raportul evenimentele colorate (N, C) este constant n timp. Fie

PC (t ) = Prob{evenimentul aparut la momentul "t" sa fie colorat "C" } PN (t ) = Prob{evenimentul aparut la momentul "t" sa fie colorat "N" }

Se testeaz ipoteza

H 0 : PC (t ) = pC

(independent de timp)

Pentru a testa aceast ipotez, se divide intervalul de timp calendaristic (0,T) n doua pri egale. Fie N C ,1 numrul de evenimente de tip C n intervalul (0,T/2] i fie N C , 2 numrul de evenimente de tip C n intervalul (T/2,T). Dac se cunoate numrul total de evenimente

n1 = N (T / 2)

n 2 = N (T ) N (T / 2) , atunci N C ,1 i N C , 2 - n ipoteza H0 - sunt independente


sunt distribuite binomial cu probabilitatea pc. Utiliznd o aproximare normal i rezultatul potrivit cruia dac doua v.a. continue 2 Y ~ N ( 2 , 2 ), atunci sunt distribuite normal: X ~ N ( 1 , 12 ) i
2 X Y ~ N ( 1 2 , 12 + 2 ) , atunci:

Se respinge H0, cu o eroare de ordinul I, atunci cnd:

- 38 -

N C ,1 / n1 N C , 2 / n 2

(1 / n1 + 1 / n2 )(1 N C / n) N C / n
unde:

> U 1 / 2

U 1 / 2 este cuantil de ordin 1-/2 a distribuiei normale normate


N(0,1), n = n1 + n2 , N R = N C ,1 + N C , 2 , respectiv p R = N C / n .

Premiza 2: procesul fr memoria culorii n cazul general, procesul poate fi codat n n culori n acord cu tipul de eveniment realizat; de exemplu: culoarea 1 =V, culoarea 2=TA, culoarea 3=TC, culoarea 4=UG, etc. Aceste evenimente pot fi competitive, n sensul c la pasul i oricare dintre ele ar putea sa apar, dar se realizeaz acel eveniment care are min{Xi1,..,Xin}, unde Xi1, Xi2,..Xin sunt v.a. continue ce semnific timpul scurs de la pasul precedent i-1 pn la apariia culorii 1, 2, respectiv n, la pasul curent i. De remarcat c numai evenimentul care are min{Xi1,..,Xin} este / poate fi observat / perceput n realitate. Fie C(i) culoarea apruta / evenimentul realizat la pasul i. Dac distribuia cuplului (min{Xi1,..,Xin}, C(i)) este independent de culoarea aprut C(i-1) la pasul de timp i-1, atunci procesul este fr memoria colorii. Fie {Xi,k}- secvena timpilor asociai intervalelor care ncep cu culoarea k. Se poate formula urmtoarea ipoteza iniial referitoare la orice pereche de culori {k,j}: H0: {X i,k } i {X i, j } sunt realizri de procese identice. Aceasta ipoteza se poate reduce la doua sub-ipoteze i anume: H0,1: Ik(t)=Ij(t) (procesele asociate celor doua culori alese au aceeai intensitate); H0,2: PK(K)=PJ(K) (probabilitatea de apariie a unui eveniment de tip k este aceeai probabilitatea condiionat de apariia unui eveniment de tip k tiind c la pasul anterior s-a realizat un eveniment de tip j). Testarea sub-ipotezei H0,1 : H0,1: Ik(t)=Ij(t) (procesele asociate celor doua culori alese au aceeai intensitate) n cazul general se pot compara z procese de tip Poisson (z>2), testndu-se pentru egalitate parametrii 1,2,..,z.

- 39 -

Fie n1, n2,..,nz numrul de evenimente observate pe duratele de timp t1,t2,..,tz asociate celor z procese Poisson, fie t =

t
i =1

i fie * = (n1 + n2 + ..n z ) / t .

Se construiete - pe baza indicelui de dispersie - statistica d:

d =
i =1

(ni *t i ) 2 *t i

Se demonstreaz ca d tinde ctre o distribuie Chi-Ptrat cu z-1 grade de libertate. n cazul ipotezei H0,1 avem z=2, corespunztor celor dou culori alese. - Se respinge H0,1 , cu o eroare de ordinul I, dac:

D=

2 ( N k (Tk ) Tk ) 2 ( N j (T j ) T j ) + > Tk T j

12 ,1

unde

12 ,1

este cuantil de ordin 1- a distribuiei Chi-Ptrat cu un grad de

libertate, N k (Tk ) este numrul de evenimente de tip k, respectiv N j (T j ) este numrul de evenimente de tip j nregistrate pe orizontul de timp considerat, = ( N j (T j ) + N k (Tk )) /(T j + Tk ) . Testarea sub-ipotezei H0,2 : H0,2: PK(K)=PJ(K) (probabilitatea de apariie a unui eveniment de tip k este aceeai probabilitate condiionat de apariie a unui eveniment de tip k tiind c la pasul anterior s-a realizat un eveniment de tip j). Fie NJK - numrul de evenimente de tip k condiionat de realizarea unui eveniment de tip j la pasul anterior; NKK - numrul de evenimente de tip k condiionat de realizarea unui eveniment de tip k la pasul anterior; n K - numrul de evenimente de tip k realizate / observate pe orizontul de timp impus; n J numrul de apariii / realizri evenimente de tip j. Se respinge sub-ipoteza H0,2, cu o eroare de ordinul I, daca:

(1 / nK + 1 / nJ )(1 nK / n)nK / n

N KK / nK N JK / nJ

> U 1 / 2

- 40 -

unde:

N K = N KK + N JK ;

n = n K + n J ; U 1 / 2 este cuantil de ordin 1-

/2 a distribuiei normale normate N(0,1). Premiza 3: Omogenitatea datelor Omogenitatea datelor culese din exploatarea unei mulimi de echipamente se refera la similariti n privina: - proiectrii - condiiilor de exploatare - politicilor de mentenan. Fie w numrul de echipamente observate n intervalul de timp (0,t). Testarea omogenitii datelor culese se face plecnd de la procesele discrete {N i (t )} cu

i = 1,.., w.
Pentru echipamentul i, Ni(T) este numrul de evenimente observate n intervalul (0,T). Dac se noteaz cu Ii(t) intensitatea procesului Poisson (omogen / neomogen) asociat evenimentelor observate la nivelul echipamentului i, atunci se poate formula urmtoarea ipoteza iniial: H 0 : I 1 (t ) = I 2 (t ) = .. = I w (t ) , respectiv datele observate sunt omogene provenind de la procese cu intensiti egale. Se construiete statistica propusa de D. R. Cox i P.A.W. Lewis:

D( N ) =
i =1 w

(N (T ) N
i

(T ) )

N * (T ) w

unde N * (T ) =

N (T )
i =1 i

Se respinge H0 cu o eroare de ordinul I, atunci cnd

D( N ) > 12 ,w1 , unde

12 ,w1 este cuantil de ordin 1- a distribuiei Chi-Ptrat cu w-1 grade de


libertate.

3.4. Exemplu de aplicare


Premiza 1C: procesul colorat - n ceea ce privete culoarea C / eveniment critic la nivelul CTE - este staionar.

- 41 -

Pentru intervalul de tip (0,T/2) avem: n1=78, N C,1=15. Pentru intervalul de tip (T/2,T) avem: n2=77, N C,2=12.

Numrul total de evenimente n=n1+ n2=155.

Statistica S1C =

N C ,1 / n1 N C , 2 / n2

(1 / n1 + 1 / n2 )(1 N C / n) N C / n

are valoarea 0,59845

Premiza 1N: procesul colorat - n ceea ce privete culoarea N / eveniment non-critic la nivelul CTE - este staionar. Pentru intervalul de tip (0,T/2) avem: n1=78, N N,1=63. Pentru intervalul de tip (T/2,T) avem: n2=77, N N,2=65.

Numrul total de evenimente n=n1+ n2=155. Statistica S1N =

N N ,1 / n1 N N , 2 / n2

(1 / n1 + 1 / n2 )(1 N N / n) N N / n

are valoarea 0,59845

Premiza 2C: Probabilitatea de apariie a unui eveniment de tip critic C la nivelul CTE este aceeai cu probabilitatea condiionat de apariie a unui eveniment de tip C tiind c la pasul anterior s-a realizat un eveniment de tip non-critic N. Pentru intervalul de timp (0,T) avem: - NCN=13+10=23. - NCC=7+6=13. - NNN=50+55=105. - NNC=8+6=14. - nC=15+12=27. - nN=63+65=128. - Numrul total de evenimente: n=nC+nN=27+128=155. - Numrul total de evenimente critice: nC=NCC+NNC=13+14=27. Statistica S 2C =

(1 / nC + 1 / n N )(1 nC / n)nC / n

N CC / nC N NC / n N

are valoarea 4,63269

Premiza 2N: Probabilitatea de apariie a unui eveniment de tip non-critic N la nivelul CTE este aceeai cu probabilitatea condiionat de apariie a unui eveniment de tip N tiind c la pasul anterior s-a realizat un eveniment de tip critic C.

- 42 -

Pentru intervalul de timp (0,T) avem: - NCN=13+10=23. - NCC=7+6=13. - NNN=50+55=105. - NNC=8+6=14. - nC=15+12=27. - nN=63+65=128. - Numrul total de evenimente: n=nC+nN=27+128=155. - Numrul total de evenimente critice: nC=NCC+NNC=13+14=27. Statistica S 2 N =

(1 / n N

N NN / n N N CN / nC

+ 1 / nC )(1 n N / n)n N / n

are valoarea 0,39266

Premiza 3A: intensiti egale pentru procesele de tip Poisson asociate evenimentelor n operarea celor doua turbogeneratoare. Se construiesc
2

statisticile

D( N ) =
i =1

(N (T ) N
i

(T )

N * (T )

unde

N * (T ) = 0,5 N i (T ) , conform cu tipul de eveniment dorit a fi testat:


i =1

pentru evenimentele critice:

* NC (T ) = 27 / 2 = 13,5 ;

DC ( N ) =

(15 13,5) 2 (12 13,5) 2 + = 0,33333 13,5 13,5

pentru evenimentele non-critice: * NN (T ) = 128 / 2 = 64 ;

DN ( N ) =

(63 64) 2 (65 64) 2 + = 0,03125 64 64

pentru totalitatea evenimentele nregistrate (indiferent de culoare): N * (T ) = 155 / 2 = 77,5 ;

DN ( N ) =

(78 77,5) 2 (77 77,5) 2 + = 0,00645 77,5 77,5

3.5. Aplicaie
n urma observrii funcionarii a dou grupuri turbogeneratoare, s-au nregistrat urmtorii timpi de operare ntre dou evenimente critice (exprimai n ore i separai prin delimitatorul `;`) :

- 43 -

Pentru TG1: X={160,6; 108,7; 1460,9; 1546,7; 1189,6; 1230,6; 1410;1 174,2; 200,5}; Pentru TG2: Y={1835,3; 1961,6; 2914; 1951,4; 2219; 1577,9; 494;1 898,6; 794,1; 690,8; 1670,5}; Se consider nivelul de semnificaie =0,05. a) S se testeze dac aceti timpi provin de la o aceeai distribuie (F=G), utiliznd testul Kolmogorov-Smirnov; b) S se testeze dac eantionul Z=XUY verific sau nu ipoteza unei distribuii exponeniale; c) S se construiasc prin metod verosimilitii estimatorul n cazul distribuiei exponeniale.

Rezolvare a) :Avem m=10, respectiv n=10. Din extrapolarea datelor din tabelul 2-3, avem: c=60/100=0,6. Pragul critic -pentru v.a. Dmn este c / 100 (20) = 0,26832 . Din aplicarea relaiei (2.13), pentru funciile empirice de repartiie ale celor dou eantioane (reprezentate in figura 2-3) rezult abaterea realizat Dmn=0,5000. Rezult c pentru nivelul de semnificaie a=0,05, se poate respinge ipoteza F=G.

- 44 -

Figura 2-3. Exemplu de determinare grafic a abaterii Dmn n aplicarea testului Kolmogorov-Smirnov pentru dou eantioane de date b) Pentru a verifica dac timpii dai urmeaz sau nu o distribuie exponenial , se propun pentru utilizare dou teste Bartlett

Avem: T =

t
i =1

20

= 24489 ;

ln(t ) = 135,665
i =1 i

20

In consecina, statistica B20 este:

B20 =

2 20 [ln (24489 20 ) 1 20 135,665] = 11,131 1 + 21 (6 20 )

Pentru nivelul de semnificaie = 0,05 se obine

02,05; 19 = 5,49 .

Mathematica, aceast valoare se obine apelnd urmtoarele dou instruciuni: chi=ChiDistribution[19]; Prag=Quantile[chi,0.95]. Reprezentarea grafic este prezentat in figura 2-4. Pentru nivelul de semnificaie ales, B20 contrazice ipoteza potrivit creia timpii de operare urmeaz o distribuie exponenial, ntruct avem 2 B20 > 0 , 05;19 .

Figura 2-4. Calculul cuantilei pentru un nivel de semnificaie =0,05. Kolmogorov-Smirnov

n ipoteza unei distribuii exponeniale, parametrul acestei distribuii rezult (conform tabelului 2-2) :

= 0,00081669 ore-1 - 45 -

n tabelul 2-6 sunt prezentate valorile funciei empirice de repartiie

t . exponeniale F (ti ) = 1 exp i

* F20 (t i ) i

- 46 -

Timp ti (ore) 108,7 160,6 200,5 494,0 690,8 794,1 1174,2

* F20 (t i )

F (t i )

Abaterea

Timp ti (ore) 1460,9 1546,7 1577,9 1670,5 1835,3 1898,6 1951,4 1961,6 2219,0 2914,0

F (t ) F(ti )
* 20 i

* F20 (t i )

F (t i )

Abaterea

F (t i ) F (t i )
* 20

0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50

0,084948 0,122923 0,132611 0,151043 0,331986 0,431169 0,477189 0,519957 0,6215 0,633964

-0.034948 -0.022923 0.017389 0.048957 -0.081986 -0.131169 -0.127189 -0.119957 -0.1715 -0.133964

0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00

0,68385 0,696723 0,717246 0,72436 0,744437 0,776619 0,796827 0,798512 0,836712 0,907435

-0.13385 -0.096723 -0.067246 -0.02436 0.005563 0.023381 0.053173 0.101488 0.113288 0.092565

- 47 -

1189,6 1230,6 1410,0

Tabelul 2-6 Calcul abaterilor n cazul ipotezei distribuiei exponeniale

Rezult

abaterea

maxim

(n

modul)

D20=0,131169.

Pentru

= 0,05 ,

Dcr ( = 0,05) =

c( ) 1,36 = = 0,304105 . Cum 20 20

D20 < Dcr ( ) , nu se

contrazice ipoteza potrivit creia timpii de operare urmeaz o distribuie exponenial de parametru estimat prin metoda verosimilitii.

Exemplu de cod n Mathematica pentru aplicarea testului KolmogorovSmirnov pentru cele dou eantioane de date X i Y
<<Graphics`MultipleListPlot` X={160.6, 108.7, 1460.9, 1546.7, 174.2, 200.5,1835.3}; Y=Sort[X]

1189.6,

1230.6,

1410,1

Z={1961.6, 2914, 1951.4, 2219, 1577.9, 494,1 898.6, 794.1, 690.8, 1670.5}; Y=Sort[X]; n=10; Range[1.0,n]/n {0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.} Flatten[{0,Range[1,n]/n,Range[1,n]/n}]
:0,

1 1 3 2 1 3 7 4 9 1 1 3 2 1 3 7 4 9 , , , , , , , , , 1, , , , , , , , , ,1> 10 5 10 5 2 5 10 5 10 10 5 10 5 2 5 10 5 10

freq=Delete[Sort[Flatten[{0,Range[1,n]/n,Range[1,n]/n}]],2n+1 ]//N {0.,0.1,0.1,0.2,0.2,0.3,0.3,0.4,0.4,0.5,0.5,0.6,0.6,0.7,0.7,0 .8,0.8,0.9,0.9,1.} Sort[Join[Y,Y]] {108.7,108.7,160.6,160.6,174.2,174.2,200.5,200.5,1189.6,1189. 6,1230.6,1230.6,1410,1410,1460.9,1460.9,1546.7,1546.7,1835.3, 1835.3} EDF=Transpose[{Sort[Join[Y,Y]],freq}] {{108.7,0.},{108.7,0.1},{160.6,0.1},{160.6,0.2},{174.2,0.2},{ 174.2,0.3},{200.5,0.3},{200.5,0.4},{1189.6,0.4},{1189.6,0.5}, {1230.6,0.5},{1230.6,0.6},{1410,0.6},{1410,0.7},{1460.9,0.7}, {1460.9,0.8},{1546.7,0.8},{1546.7,0.9},{1835.3,0.9},{1835.3,1 .}} EDF2=Transpose[{Sort[Join[W,W]],freq}]; EDFplot = MultipleListPlot[EDF,EDF2,PlotJoinedTrue];

- 48 -

3.6. ntrebri, teme, probleme


B1) Fie X o v.a. uniform repartizat pe un interval necunoscut [a,b]. Care este estimatorul de verosimilitate maxim pentru b, dac se cunosc realizrile x1,x2,..,xn? B2) O component n ateptare refuz solicitarea de 2 ori n 5 teste. Construii estimatorul de verosimilitate maxim pentru probabilitatea `q` de refuz la solicitare i indicai un interval de ncredere pentru `q` (nivelul de semnificaie 90%) B3) Fie dou componente identice care pot refuza solicitarea. Probabilitatea de refuz la solicitare este necunoscut, dar aceeai pentru ambele componente. Pentru a modela incertitudinea n estimarea probabilitii `q`, se propune densitatea de probabilitate f(q). Componenta 1 este testat i refuz solicitarea. Artai c probabilitatea de refuz la solicitare a componentei 2 este, n acest condiii: Prob{C2 refuz solicitarea | C1 a refuzat}=M(q2)/M(q) , unde M(q) este valoarea ateptat (medie / nominal) a v.a. q, respectiv M(q2) este valoarea ateptat (medie / nominal) a produsului v.a. q cu ea nsi. Exemplu numeric: Fie f(q) egal cu 249 pentru pentru q [0;1 / 250] , respectiv 1/249 pentru 1/249 pentru q [1 / 250;1] . S se arate c probabilitatea de refuz apriori este M(q)=1/250, dar cea aposteriori (dup refuzul la solicitare al componentei 1) este mai mare dect 1/3. B4) Acelai enun propus pentru B3, dar densitatea de probabilitate este Be(,). (relaiile 1.23, 1.24 din capitolul 1) Aplicaie pentru dou grupuri Diesel in stand-by avnd: =10; =200.

- 49 -

S-ar putea să vă placă și