Documente Academic
Documente Profesional
Documente Cultură
Scop
Aprofundarea cunostinelor de estimare statistica a parametrilor funciilor de repartiie, utiliznd metode de estimare punctuale sau continue.
- 19 -
Exemple de valori tehnice posibile pentru sunt: =0,05 In acest caz, ne ateptm ca la o rat de 1 la 20 de eantioane pentru care s-au observat N a 14 sau N a 6 - dar acceptm c moneda este `corect` , un rezultat deci pus pe seama ntmplrii / ansei; =0,01 In acest caz, ne ateptm ca la o rat de 1 la 100 de eantioane pentru care s-au observat N a 14 sau N a 6 - dar acceptm c moneda este `corect`, un rezultat deci pus pe seama ntmplrii / ansei;
n condiiile n care ipoteza iniial este adevrat, distribuia v.a. Na este binomial Bin(n=20,p=0.5) . Paii necesari sunt urmtorii: 1. Se evalueaz probabilitatea evenimentului { N a 14 sau N a 6 }. Pentru evenimentul N a 6 avem probabilitatea egal cu valoarea funciei de repartiie binomiale n punctul Na=6, respectiv 0,057659; pentru evenimentul N a 14 sau echivalent N a > 13 avem probabilitatea egal cu valoarea complementar a funciei de repartiie binomiale n punctul N a 13. , respectiv 0,057659. Rezult probabilitatea evenimentului { N a 14 sau N a 6 } ca fiind egal cu 0,11532; 2. Dac aceast probabilitate este mai mic dect pragul de semnificaie , atunci ipoteza iniial poate fi respins, un asemenea rezultat observat nu poate fi acceptat numai pe seama ntmplrii; 3. Dac aceast probabilitate este mai mare dect pragul de semnificaie , atunci ipoteza iniial nu poate fi respins, un asemenea rezultat ar putea fi pus pe seama ntmplrii, nu avem motive s credem c moneda nu este `corect` - numai pe baza datelor prelucrate n aceast etap a experimentului. Putem afirma c datele observate nu sunt statistic importante pentru un nivel de semnificaie =0,05. Putem, de asemenea, afirma c datele observate nu sunt statistic importante nici pentru un nivel de semnificaie =0,01.
Dac ns presupunem acum c am observat N a = 15 , atunci la pasul 1 se obine o probabilitate egal cu 0,041389. n condiiile n care am fixa apriori un nivel de semnificaie =0,05, acest rezultat nu ar mai putea fi pus pe seama ntmplrii, se poate respinge ipoteza iniial n acest context. n aceasta situaie, faptul c am
- 20 -
semnificaie = 0,05 .
observat N a = 15 devine
statistic
important
pentru
un
nivel
de
Orice test statistic si propune s evalueze probabilitatea de la pasul 1. (in limba englez este denumit `p-value`), astfel nct s o putem compara cu nivelul de semnificaie fixat apriori.
Figura 2-1. Exemplu de zone critice n aplicarea unui test statistic Aflarea pragului critic de la care se poate respinge ipoteza iniial - revine la identificarea n prim etap a acelei cuantile `n` pentru care probabilitatea de a avea N a n , respectiv N a n are o valoare egal cu nivelul de semnificaie , respectiv n figura 2-1 aflarea lui `n` pentru care aria haurat este numeric egal cu valoarea fixat a nivelului de semnificaie. Un al doilea exemplu const ntr-o estimare pe baz de intervale de ncredere. Fie `m` echipamente independente i identice urmrite n acelai interval de timp i fie nivelul de semnificaie propus / fixat. Fie N o v.a. discret semnificnd numrul de echipamente care s-au defectat n intervalul de timp propus, avnd o distribuie binomial N ~ Bin(m, q ) , unde `q` este probabilitatea de defect la nivelul unui echipament, mrime pe care dorim s o estimm: q (qinf , qsup ) . Fie funcia de repartiie a v.a. N:
k k F (n m, q ) = Cm q (1 q ) m k k =0 n
(2.1)
pentru orice numr ntreg n m . n condiiile n care `n` este observat, limita superioar a intervalului de ncredere este soluia ecuaiei:
- 21 -
(2.2)
C
k =n
k m m inf
q (1 qinf ) m k = 1 F (n 1 m, qinf ) =
(2.3)
n practic pentru aflarea limitelor intervalului de ncredere n acest caz se apeleaz la funcia beta incomplet, definit pentru orice 0 x 1 i a 0 ; b 0 prin integrala:
I x ( a, b) =
1 z a 1 (1 z )b 1 dz B ( a, b) 0
(2.4)
unde B(a,b) este integrala beta complet (funcia integral Euler de prima spe):
B (a, b) = z a1 (1 z )b1 dz
0
(2.5)
Pentru aproximarea cozii distribuiei binomiale (zona haurat din figura 2-1), se poate utiliza relaia :
C
k =n
k m
q m (1 q ) m k = I q (n, m n + 1)
(2.6)
I x (a, b) 1 I1 x (b, a)
pentru orice 0 x 1 i a 0 ; b 0
(2.7)
n aceste condiii, limita superioar a intervalului de ncredere rezult din rezolvarea ecuaiei:
1 I qsup (n + 1, m n) =
(2.8) (2.9)
- 22 -
I qinf (n, m n + 1) =
Soluiile se pot obine pe cale grafic (exemplificare n figura 2-2), respectiv numeric (exemplificare n Mathematica relaiile 2.10 i 2.11).
Figura 2-2. Calculul intervalului de ncredere al probabilitii de insucces (nivel de ncredere =0.05; numr iniial de echipamente m=20; numr de echipamente defecte n=5)
(2.10) (2.11)
Este de dorit gsirea celor mai buni estimatori care s aproximeze ct mai bine valorile parametrilor, chiar n condiiile unui numr mai redus de observaii i avnd nivele de semnificaie fixate. Aceasta este o problem fundamental n teoria estimaiilor, rezolvarea acesteia necesitnd cunoaterea proprietilor de baza ale estimatorilor i clasificarea acestora n funcie de aceste proprieti. Tabelul 2-1 sintetizeaz principalele proprieti ale estimatorilor.
- 23 -
Relaii matematice
estimaie nedeplasat a unui parametru al unei funciei de repartiie, daca exist valoarea medie a statisticii Zn i este egala cu .
M ( Z n ) = , n N
Pentru n i > 0 , avem
P( Z n ( X 1 , X 2 ,K, X n ) < ) 1
O statistica n ( X 1 , X 2 , K , X n ) este o
Consisten
Condiiile necesare pentru ca statistica n ( X 1 , X 2 , K , X n ) sa fie consistent sunt: 1. S aib deplasare nula, adic M ( Z n ) = , n N , sau n cazul unei deplasri non-nule, s se respecte condiia: lim (M ( Z n ) ) = 0 .
n
- 24 -
estimaie consistent a unui parametru al unei funcii de repartiie, dac converge n probabilitate ctre acest parametru.
Eficien
O statistic n ( X 1 , X 2 , K , X n ) este o estimaie eficient a unui parametru al unei funciei de repartiie, daca: Este nedeplasat Dispersia estimaiei D(Zn) este minim
M ( Z n ) = , n N
Adic, dac statistica propus (analizat) d valori mai concentrate n jurul parametrului dect oricare alte estimaii.
ln f ( x, ) I ( ) = M =
+ ln f ( x, ) = f ( x, )dx. Daca n ( X 1 , X 2 , K , X n ) este o statistic oarecare, iar 2
n ( X 1 , X 2 , K , X n ) este statistic eficient, atunci raportul e n = D(Z n ) D(Tn ) (0,1) se numete eficiena estimaiei n ( X 1 , X 2 , K , X n ) .
- 25 -
- 25 -
Tabelul 2-2 prezint cei mai utilizai estimatori punctuali pentru parametrii principalelor funcii de repartiie. Se noteaz cu t1,t2,..,tn timpii de funcionare pana la defect a n echipamente identice monitorizate; de libertate);
2 a ,n
t a ,n
Fa ,m,n
- 26 -
Observaii
=n
t
i =1
Weib(,)
n n + ln(t i ) = i =1
t
i =1 i
i =1
ti ln(ti ) ;
=
i =1
t n
= (0)
CD =
1,05 CD
Se rezolv iterativ prima ecuaia, pornind de la valoarea iniial propus pentru parametrul .Valoarea finala obinut pentru se multiplic cu coeficientul :
1 n (t i t )2 t n i =1
1 n ln(t i ) n i =1
Cele mai utilizate teste statistice n ingineria fiabilitii sunt: i) Testul Bartlett de evaluare a validitii utilizrii funciei exponeniale n modelare. Etapele aplicrii: - Se calculeaz statistica:
T 1 n 2n ln ln(t i ) n n i =1 Bn = , 1 + (n + 1) (6n )
2
unde T = t i
i =1
regiunea critic.
ii) Testul 2 - pentru timpi de funcionare anormal de scuri Timpii de funcionare anormal de scuri pot apare datorit unor abateri foarte rare (excepionale) de la parametrii procesul de producie al echipamentelor. Aceti de timpi de funcionare nu pot fi considerai n evaluarea statistic, deoarece nu sunt reprezentativi. n acest caz, ei nu se iau n considerare n eantionul reprezentativ pentru determinarea parametrilor distribuiei timpului de funcionare. Fie t1,t2,..,tn o secven de "n" timpi independent i identic exponenial distribuii (de parametrul ), reprezentnd timpii intre primele "n" defecte ale unui echipament. Atunci, se demonstreaz ca doua grade de libertate. Deci, 2 2) grade de libertate. Dac se ordoneaz n ordine cresctoare secvena de timpi, atunci t1 devine cel mai scurt timp i (2n-2) i 2.
n
2t i
t i urmeaz o distribuie
i=2
2 (2n 2) , cu (2n-
t
i =2
(n 1)t1
- 28 -
ti
n consecin, se compar valoarea
i=2
(n 1) t 1
cu cuantila F , (2n-2), 2.
t
Dac avem
i=2
(n 1)t1
timpilor considerai i ipoteza anormalitii este adevrata, cu nivelul de semnificaie considerat ().
iii) Testul 3 - pentru timpi de funcionare anormal de lungi Urmnd acelai considerai ca mai sus, timpul de funcionare tan poate fi considerat anormal de lung dac :
(n 1)t an
i
ti an
> F , 2, (2 n 2 )
(2.12)
intervalul V = F , ( 2 n 2 ), 2 , + fiind considerat deci regiunea critic. iv) Testul Kolmogorov - Smirnov Este un test de concordan pentru verificarea ipotezei H0 conform creia funcia de repartiie a unei variabile aleatoare T este F0(t) . Presupunem c funcia de repartiie a v.a. T este de tip continuu i fie Fn (t i ) funcia empiric repartiie corespunztoare eantionului nregistrat (n modul):
*
{t1 , t 2 ,.., t n }
(2.13)
K n = Dn n
- 29 -
(2.14)
Teoreme importante:
Dac funcia de repartiie F(t) a v.a. T este continu, atunci distribuia v.a. Dn nu depinde de F(t); Pentru o abatere `x` dat i un eantion de volum mare (n>50, n cele mai multe cazuri), avem relaia
Pr ob{K n x} n FKS ( x)
(2.15)
unde FKS(x) este funcia de repartiie Kolmogorov Smirnov (prezentat n capitolul 1). Prin urmare, pentru n suficient de mare i un nivel de semnificaie propus (de exemplu =0,01; =0,05 ) se construiete un test bazat pe aflarea pragului critic `c` pentru care avem relaia:
Pr ob{K n > c} = 1 ,
(2.16)
Dac `n` are valori mai mici dect 50, atunci distribuia v.a. Kn se abate de la distribuia Kolmogorov Smirnov, fiind necesar cutarea pragului critic prin apelarea unui program de calcul adecvat de tipul Matlab, Octave, etc. Pentru a construi funcia empiric de repartiie F * (t i ) este necesar parcurgerea urmtoarelor etape: 1. ordonarea n ordine cresctoare a datelor din eantion t i i determinarea numrului de apariii pentru fiecare (frecvena absolut de apariie ni ; 2. determinarea numrului de valori distincte, k, a datelor din eantion i a frecvenei relative de apariie a acestora:
fi =
ni , n
unde n =
n
i =1
3. determinarea frecvenei cumulate de apariie (funcia empiric); 4. se reprezint grafic funcia empiric de repartiie, F * (t i ) , n funcie de datele din eantion, t i . Ipoteza funciei de repartiie este respins dac abaterea valoarea critic `c`
v) Testul Kolmogorov Smirnov (pentru dou eantioane) n acest caz, fie un eantion { X 1 , X 2 ,.., X m } provenit prin observarea realizrilor v.a. X ce urmeaz o distribuie continu F(x) i fie un al doilea eantion {Y1 , Y2 ,.., X n } provenit prin observarea realizrilor v.a. Y ce urmeaz o distribuie
- 30 -
continu G(y). Se formuleaz ipoteza iniial conform creia cele dou distribuii sunt identice F=G, respectiv ipoteza contrar FG i se fixeaz un nivel de semnificaie .
* * Dac Fm i Gn sunt funciile empirice construite la nivelul celor dou eantioane de date, atunci abaterile caracteristice sunt n acest caz:
(2.17) (2.18)
pentru nivelul de semnificaie propus (de exemplu =0,01; =0,05 ) se construiete un test bazat pe aflarea pragului critic `c` pentru care avem relaia:
Pr ob{K mn > c} = 1 ,
(2.19)
Dac abaterea caracteristic este mai mic dect pragul `c`, atunci se poate accepta ipoteza iniial F=G; Dac abaterea caracteristic este mai mare dect pragul `c`, atunci se poate respinge ipoteza iniial. (FG).
n tabelul 2-3 se prezint valorile pragului critic `c`, n acord cu valori uzuale ale nivelului de semnificaie.
- 31 -
n\m 1 2 3 4 5
3
* * * * * *
4
* * * * * * 16/16 *
5
* * * * 15/15 * 20/20 * * *
6
* * * * 18/18 * 20/24 24/24 24/30 30/30 30/36 36/36
7
* * * * 21/21 * 24/28 28/28 30/35 35/35 30/42 36/42 42/49 42/49
8
* * 16/16 * 21/24 24/24 28/32 32/32 30/40 35/40 34/48 40/48 40/56 48/56 48/64 56/64
9
* * 18/18 * 24/27 27/27 28/36 32/36 35/45 40/45 39/54 45/54 42/63 49/63 46/72 55/72 54/81 63/81
10
* * 20/20 * 27/30 30/30 30/40 36/40 40/50 45/50 40/60 48/60 46/70 53/70 48/80 60/80 53/90 70/90
11
* * 22/22 * 30/33 33/33 33/44 40/44 39/55 45/55 43/66 54/66 48/77 59/77 53/88 64/88 59/99 70/99
12
* * 24/24 * 30/36 36/36 36/48 44/48 43/60 50/60 48/72 60/72 53/84 60/84 60/96 68/96 63/108 75/108
- 32 -
6 7 8 9
Tabelul 2-4. Exemplu de valori critice n cazul testului Kolmogov-Smirnov pentru nivel de semnificaie =0,05 (valori de sus), respectiv pentru =0,01 (valori de jos).Valorile * - date insuficiente. Exemplu: pentru m=9;n=9;=0,05; c=54/81=0,666667. Se respinge ipoteza F=G dac abaterea Dmn este mai mare dect c / 81 (9 + 9) = 0,31427
n tabelul 2-5 se prezint valorile pragului critic `c`, n acord cu valori uzuale ale nivelului de semnificaie. c() 0,1 1,22 0,05 1,36 0,025 1,48 0,01 1,63 0,005 1,73 0,001 1,95
Tabelul 2-5. Valorile critice n cazul testului Kolmogov Smirnov (volum date n>50) vi) Teste secveniale (Wald) Toate problemele de testare a ipotezelor statistice, de estimare a parametrilor distribuiilor n care se utilizeaz metodelor de selecie presupun un volum n de probe bine determinat, prestabilit. Folosirea metodelor secveniale presupune o operare asupra termenilor succesivi ai irului de observaii, pe msura ce acestea sunt colectate din proces. Exist astfel trei variante posibile : Acceptarea ipotezei iniiale Respingerea ipotezei iniiale Continuarea colectrii de informaii din proces Fie eroarea de ordin nti a testului (de a da rezultate fals pozitive) i eroarea de ordinul doi a testului (de a da rezultate fals negative). Fie t1,t2,..tn rezultatele primelor n observaii asupra unei variabile aleatoare T (temperatur, timp, etc.), a crei densitate de probabilitate este f(t,). Asupra parametrului se face ipoteza iniial (nul) H0 : = 0 fa de ipoteza alternativ H1 : = 1 , cu 1 0 . Dac este adevrata ipoteza nul, atunci densitatea de probabilitate a variabilei aleatoare X este f(t,0) i probabilitatea ca dup n observaii independente sa se obin valorile t1,t2,..,tn este dat de relaia :
p 0 (n) = f (t i , 0 )
i =1
n ipoteza alternativ H1, probabilitatea ca dup n observaii independente sa se obin valorile t1,t2,..,tn este data de relaia :
p1 (n) = f (t i , 1 )
i =1
- 33 -
Dac
Dac
<
noi observaii (mrit volumul `n` al eantionului. vii) Test privind procesul Poisson neomogen (PPN) Fie un PPN avnd intensitatea (t ) = t 1 . Presupunem c procesul este observat pe un interval de timp (0,T), evenimentele fiind nregistrate la momentele t1,t2,..,tn. Atunci estimatorii de verosimilitate maxim pentru parametrii i sunt:
n n ln T ln(ti )
i =1 n
= n ; T
viii)
Dorim s testm dac datele observate de-a lungul unui interval de timp (0,T), cu evenimente nregistrate consecutiv la momentele t1,t2,..,tn provin de la un proces Poisson omogen de intensitate constant in timp (ipoteza nul / iniial H0) versus de la un proces Poisson ne-omogen (ipoteza contrar H1 ( 1 )). O statistic adecvat este V = 2
ln(T t ) .
i =1 i
Dac ipoteza nul este adevrata, atunci: Dac T=tn, respectiv intervalul de observare (0,T) se termin cu cea de-a `n`-a observaie, atunci V urmeaz o distribuie Chi2 Ptrat cu (2n) grade de libertate; in acest caz regiunea , 2 n ,+
poate respinge n caz contrar. Daca T>tn, respectiv intervalul de observare (0,T) nu se termin cu cea de-a `n`-a observaie, atunci V urmeaz o distribuie ChiPtrat cu (2n-2) grade de libertate; in acest caz regiunea 2 este regiunea critic. Se accept ipoteza dac , 2 n 2 ,+
- 34 -
- 35 -
Data / Grupul
Timp calendaristic [h] 0 160.6 269.3 1730.2 3276.9 4466.5 5697.1 7107.2
Eveniment
Criticitate eveniment
Timpul necesar aciunii de mentenan [h] 0.5 0.33 0.4 24 0.5 1410 0.2
01.01.06 / TG1,2 07.01.06 / TG1 11/1/6 13/3/6 16/5/6 6/7/6 25/8/6 23/10/6
V TC TA UG DA RP EX
C N N C C N
- 36 -
riscuri competitive
Legend: V vibraii crescute (mai mari de 60 m); TC diferen de temperatur carcasa superioar / inferioar depit (mai mare de 50 C); TA temperatur abur viu intrare turbin mai mic dect 480C; UG- presiune ulei ungere turbin mai mic dect 1 bar; DA deplasri axiale relative crescute; EX pierderea excitaiei generatorului electric RP revizie programat; M1- ajustarea viscozitii uleiului de ungere al turbinei (prin reglarea temperaturii acestuia la ieirea din rcitorii de ulei M1a / nlocuirea uleiului de ungere M1b); M2 ajustarea gradientului de cretere / scdere al temperaturii aburului viu la intrarea n turbin; M3- ajustarea debitului de ap injecii ntre SI3 / SI4 la cazanul de abur; M4 - ajustarea presiunii uleiului de ungere (prin nlocuirea uleiului de ungere M1b) M lucrri anuale de mentenan; C eveniment critic; N eveniment noncritic. Pentru o durat de operare T=18540 ore, la nivelul celor dou grupuri turbogeneratoare au fost nregistrate urmtoarele evenimente: Intervalul de timp [ore] [0, 9270] Eveniment C CC NC N NN CN C CC NC N NN CN Numr de evenimente 15 7 8 63 50 13 12 6 6 65 55 10 TG1 8 5 4 43 21 5 5 4 3 32 15 7 TG2 7 2 4 20 29 8 7 2 3 33 40 3
[9271, 18540]
Tabelul 2-7. Date nregistrate Legend: C eveniment critic; N eveniment non-critic; CC eveniment critic precedat la pasul anterior de un eveniment critic NC eveniment non-critic precedat la pasul anterior de un eveniment critic;
- 37 -
CN eveniment critic precedat la pasul anterior de un eveniment noncritic; NN eveniment non-critic precedat la pasul anterior de un eveniment noncritic. Premizele analizei statistice Premiza 1: procesul colorat este staionar n general, procesul colorat este staionar dac proporia de puncte de tip N, respectiv de tip C nu variaz semnificativ n raport cu timpul calendaristic. Pentru a verifica dac aceast premiz este plauzibil se construiete un test statistic care s valideze dac raportul evenimentele colorate (N, C) este constant n timp. Fie
PC (t ) = Prob{evenimentul aparut la momentul "t" sa fie colorat "C" } PN (t ) = Prob{evenimentul aparut la momentul "t" sa fie colorat "N" }
Se testeaz ipoteza
H 0 : PC (t ) = pC
(independent de timp)
Pentru a testa aceast ipotez, se divide intervalul de timp calendaristic (0,T) n doua pri egale. Fie N C ,1 numrul de evenimente de tip C n intervalul (0,T/2] i fie N C , 2 numrul de evenimente de tip C n intervalul (T/2,T). Dac se cunoate numrul total de evenimente
n1 = N (T / 2)
- 38 -
N C ,1 / n1 N C , 2 / n 2
(1 / n1 + 1 / n2 )(1 N C / n) N C / n
unde:
> U 1 / 2
Premiza 2: procesul fr memoria culorii n cazul general, procesul poate fi codat n n culori n acord cu tipul de eveniment realizat; de exemplu: culoarea 1 =V, culoarea 2=TA, culoarea 3=TC, culoarea 4=UG, etc. Aceste evenimente pot fi competitive, n sensul c la pasul i oricare dintre ele ar putea sa apar, dar se realizeaz acel eveniment care are min{Xi1,..,Xin}, unde Xi1, Xi2,..Xin sunt v.a. continue ce semnific timpul scurs de la pasul precedent i-1 pn la apariia culorii 1, 2, respectiv n, la pasul curent i. De remarcat c numai evenimentul care are min{Xi1,..,Xin} este / poate fi observat / perceput n realitate. Fie C(i) culoarea apruta / evenimentul realizat la pasul i. Dac distribuia cuplului (min{Xi1,..,Xin}, C(i)) este independent de culoarea aprut C(i-1) la pasul de timp i-1, atunci procesul este fr memoria colorii. Fie {Xi,k}- secvena timpilor asociai intervalelor care ncep cu culoarea k. Se poate formula urmtoarea ipoteza iniial referitoare la orice pereche de culori {k,j}: H0: {X i,k } i {X i, j } sunt realizri de procese identice. Aceasta ipoteza se poate reduce la doua sub-ipoteze i anume: H0,1: Ik(t)=Ij(t) (procesele asociate celor doua culori alese au aceeai intensitate); H0,2: PK(K)=PJ(K) (probabilitatea de apariie a unui eveniment de tip k este aceeai probabilitatea condiionat de apariia unui eveniment de tip k tiind c la pasul anterior s-a realizat un eveniment de tip j). Testarea sub-ipotezei H0,1 : H0,1: Ik(t)=Ij(t) (procesele asociate celor doua culori alese au aceeai intensitate) n cazul general se pot compara z procese de tip Poisson (z>2), testndu-se pentru egalitate parametrii 1,2,..,z.
- 39 -
Fie n1, n2,..,nz numrul de evenimente observate pe duratele de timp t1,t2,..,tz asociate celor z procese Poisson, fie t =
t
i =1
d =
i =1
(ni *t i ) 2 *t i
Se demonstreaz ca d tinde ctre o distribuie Chi-Ptrat cu z-1 grade de libertate. n cazul ipotezei H0,1 avem z=2, corespunztor celor dou culori alese. - Se respinge H0,1 , cu o eroare de ordinul I, dac:
D=
2 ( N k (Tk ) Tk ) 2 ( N j (T j ) T j ) + > Tk T j
12 ,1
unde
12 ,1
libertate, N k (Tk ) este numrul de evenimente de tip k, respectiv N j (T j ) este numrul de evenimente de tip j nregistrate pe orizontul de timp considerat, = ( N j (T j ) + N k (Tk )) /(T j + Tk ) . Testarea sub-ipotezei H0,2 : H0,2: PK(K)=PJ(K) (probabilitatea de apariie a unui eveniment de tip k este aceeai probabilitate condiionat de apariie a unui eveniment de tip k tiind c la pasul anterior s-a realizat un eveniment de tip j). Fie NJK - numrul de evenimente de tip k condiionat de realizarea unui eveniment de tip j la pasul anterior; NKK - numrul de evenimente de tip k condiionat de realizarea unui eveniment de tip k la pasul anterior; n K - numrul de evenimente de tip k realizate / observate pe orizontul de timp impus; n J numrul de apariii / realizri evenimente de tip j. Se respinge sub-ipoteza H0,2, cu o eroare de ordinul I, daca:
(1 / nK + 1 / nJ )(1 nK / n)nK / n
N KK / nK N JK / nJ
> U 1 / 2
- 40 -
unde:
N K = N KK + N JK ;
/2 a distribuiei normale normate N(0,1). Premiza 3: Omogenitatea datelor Omogenitatea datelor culese din exploatarea unei mulimi de echipamente se refera la similariti n privina: - proiectrii - condiiilor de exploatare - politicilor de mentenan. Fie w numrul de echipamente observate n intervalul de timp (0,t). Testarea omogenitii datelor culese se face plecnd de la procesele discrete {N i (t )} cu
i = 1,.., w.
Pentru echipamentul i, Ni(T) este numrul de evenimente observate n intervalul (0,T). Dac se noteaz cu Ii(t) intensitatea procesului Poisson (omogen / neomogen) asociat evenimentelor observate la nivelul echipamentului i, atunci se poate formula urmtoarea ipoteza iniial: H 0 : I 1 (t ) = I 2 (t ) = .. = I w (t ) , respectiv datele observate sunt omogene provenind de la procese cu intensiti egale. Se construiete statistica propusa de D. R. Cox i P.A.W. Lewis:
D( N ) =
i =1 w
(N (T ) N
i
(T ) )
N * (T ) w
unde N * (T ) =
N (T )
i =1 i
- 41 -
Pentru intervalul de tip (0,T/2) avem: n1=78, N C,1=15. Pentru intervalul de tip (T/2,T) avem: n2=77, N C,2=12.
Statistica S1C =
N C ,1 / n1 N C , 2 / n2
(1 / n1 + 1 / n2 )(1 N C / n) N C / n
Premiza 1N: procesul colorat - n ceea ce privete culoarea N / eveniment non-critic la nivelul CTE - este staionar. Pentru intervalul de tip (0,T/2) avem: n1=78, N N,1=63. Pentru intervalul de tip (T/2,T) avem: n2=77, N N,2=65.
N N ,1 / n1 N N , 2 / n2
(1 / n1 + 1 / n2 )(1 N N / n) N N / n
Premiza 2C: Probabilitatea de apariie a unui eveniment de tip critic C la nivelul CTE este aceeai cu probabilitatea condiionat de apariie a unui eveniment de tip C tiind c la pasul anterior s-a realizat un eveniment de tip non-critic N. Pentru intervalul de timp (0,T) avem: - NCN=13+10=23. - NCC=7+6=13. - NNN=50+55=105. - NNC=8+6=14. - nC=15+12=27. - nN=63+65=128. - Numrul total de evenimente: n=nC+nN=27+128=155. - Numrul total de evenimente critice: nC=NCC+NNC=13+14=27. Statistica S 2C =
(1 / nC + 1 / n N )(1 nC / n)nC / n
N CC / nC N NC / n N
Premiza 2N: Probabilitatea de apariie a unui eveniment de tip non-critic N la nivelul CTE este aceeai cu probabilitatea condiionat de apariie a unui eveniment de tip N tiind c la pasul anterior s-a realizat un eveniment de tip critic C.
- 42 -
Pentru intervalul de timp (0,T) avem: - NCN=13+10=23. - NCC=7+6=13. - NNN=50+55=105. - NNC=8+6=14. - nC=15+12=27. - nN=63+65=128. - Numrul total de evenimente: n=nC+nN=27+128=155. - Numrul total de evenimente critice: nC=NCC+NNC=13+14=27. Statistica S 2 N =
(1 / n N
N NN / n N N CN / nC
+ 1 / nC )(1 n N / n)n N / n
Premiza 3A: intensiti egale pentru procesele de tip Poisson asociate evenimentelor n operarea celor doua turbogeneratoare. Se construiesc
2
statisticile
D( N ) =
i =1
(N (T ) N
i
(T )
N * (T )
unde
* NC (T ) = 27 / 2 = 13,5 ;
DC ( N ) =
DN ( N ) =
DN ( N ) =
3.5. Aplicaie
n urma observrii funcionarii a dou grupuri turbogeneratoare, s-au nregistrat urmtorii timpi de operare ntre dou evenimente critice (exprimai n ore i separai prin delimitatorul `;`) :
- 43 -
Pentru TG1: X={160,6; 108,7; 1460,9; 1546,7; 1189,6; 1230,6; 1410;1 174,2; 200,5}; Pentru TG2: Y={1835,3; 1961,6; 2914; 1951,4; 2219; 1577,9; 494;1 898,6; 794,1; 690,8; 1670,5}; Se consider nivelul de semnificaie =0,05. a) S se testeze dac aceti timpi provin de la o aceeai distribuie (F=G), utiliznd testul Kolmogorov-Smirnov; b) S se testeze dac eantionul Z=XUY verific sau nu ipoteza unei distribuii exponeniale; c) S se construiasc prin metod verosimilitii estimatorul n cazul distribuiei exponeniale.
Rezolvare a) :Avem m=10, respectiv n=10. Din extrapolarea datelor din tabelul 2-3, avem: c=60/100=0,6. Pragul critic -pentru v.a. Dmn este c / 100 (20) = 0,26832 . Din aplicarea relaiei (2.13), pentru funciile empirice de repartiie ale celor dou eantioane (reprezentate in figura 2-3) rezult abaterea realizat Dmn=0,5000. Rezult c pentru nivelul de semnificaie a=0,05, se poate respinge ipoteza F=G.
- 44 -
Figura 2-3. Exemplu de determinare grafic a abaterii Dmn n aplicarea testului Kolmogorov-Smirnov pentru dou eantioane de date b) Pentru a verifica dac timpii dai urmeaz sau nu o distribuie exponenial , se propun pentru utilizare dou teste Bartlett
Avem: T =
t
i =1
20
= 24489 ;
ln(t ) = 135,665
i =1 i
20
B20 =
02,05; 19 = 5,49 .
Mathematica, aceast valoare se obine apelnd urmtoarele dou instruciuni: chi=ChiDistribution[19]; Prag=Quantile[chi,0.95]. Reprezentarea grafic este prezentat in figura 2-4. Pentru nivelul de semnificaie ales, B20 contrazice ipoteza potrivit creia timpii de operare urmeaz o distribuie exponenial, ntruct avem 2 B20 > 0 , 05;19 .
n ipoteza unei distribuii exponeniale, parametrul acestei distribuii rezult (conform tabelului 2-2) :
= 0,00081669 ore-1 - 45 -
* F20 (t i ) i
- 46 -
* F20 (t i )
F (t i )
Abaterea
Timp ti (ore) 1460,9 1546,7 1577,9 1670,5 1835,3 1898,6 1951,4 1961,6 2219,0 2914,0
F (t ) F(ti )
* 20 i
* F20 (t i )
F (t i )
Abaterea
F (t i ) F (t i )
* 20
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
0,084948 0,122923 0,132611 0,151043 0,331986 0,431169 0,477189 0,519957 0,6215 0,633964
-0.034948 -0.022923 0.017389 0.048957 -0.081986 -0.131169 -0.127189 -0.119957 -0.1715 -0.133964
0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00
0,68385 0,696723 0,717246 0,72436 0,744437 0,776619 0,796827 0,798512 0,836712 0,907435
-0.13385 -0.096723 -0.067246 -0.02436 0.005563 0.023381 0.053173 0.101488 0.113288 0.092565
- 47 -
Rezult
abaterea
maxim
(n
modul)
D20=0,131169.
Pentru
= 0,05 ,
Dcr ( = 0,05) =
contrazice ipoteza potrivit creia timpii de operare urmeaz o distribuie exponenial de parametru estimat prin metoda verosimilitii.
Exemplu de cod n Mathematica pentru aplicarea testului KolmogorovSmirnov pentru cele dou eantioane de date X i Y
<<Graphics`MultipleListPlot` X={160.6, 108.7, 1460.9, 1546.7, 174.2, 200.5,1835.3}; Y=Sort[X]
1189.6,
1230.6,
1410,1
Z={1961.6, 2914, 1951.4, 2219, 1577.9, 494,1 898.6, 794.1, 690.8, 1670.5}; Y=Sort[X]; n=10; Range[1.0,n]/n {0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.} Flatten[{0,Range[1,n]/n,Range[1,n]/n}]
:0,
1 1 3 2 1 3 7 4 9 1 1 3 2 1 3 7 4 9 , , , , , , , , , 1, , , , , , , , , ,1> 10 5 10 5 2 5 10 5 10 10 5 10 5 2 5 10 5 10
freq=Delete[Sort[Flatten[{0,Range[1,n]/n,Range[1,n]/n}]],2n+1 ]//N {0.,0.1,0.1,0.2,0.2,0.3,0.3,0.4,0.4,0.5,0.5,0.6,0.6,0.7,0.7,0 .8,0.8,0.9,0.9,1.} Sort[Join[Y,Y]] {108.7,108.7,160.6,160.6,174.2,174.2,200.5,200.5,1189.6,1189. 6,1230.6,1230.6,1410,1410,1460.9,1460.9,1546.7,1546.7,1835.3, 1835.3} EDF=Transpose[{Sort[Join[Y,Y]],freq}] {{108.7,0.},{108.7,0.1},{160.6,0.1},{160.6,0.2},{174.2,0.2},{ 174.2,0.3},{200.5,0.3},{200.5,0.4},{1189.6,0.4},{1189.6,0.5}, {1230.6,0.5},{1230.6,0.6},{1410,0.6},{1410,0.7},{1460.9,0.7}, {1460.9,0.8},{1546.7,0.8},{1546.7,0.9},{1835.3,0.9},{1835.3,1 .}} EDF2=Transpose[{Sort[Join[W,W]],freq}]; EDFplot = MultipleListPlot[EDF,EDF2,PlotJoinedTrue];
- 48 -
- 49 -