Sunteți pe pagina 1din 20

Statistica inferenial

Variabile aleatoare continue:


Distribuia Distribuia Distribuia Distribuia normal. Student. Fisher. 2 .

Statistic inferenial.
Media de selecie. Intervale de ncredere pentru media unei populaii cu dispersia cunoscut. Intervale de ncredere pentru media unei populaii cu dispersia necunoscut. Intervale de ncredere pentru dispersia unei populaii. Testarea ipotezelor statistice. Testul Testul Testul Testul Testul Testul Testul Testul Testul Z pentru media unei populaii cu dispersia cunoscut. t pentru media unei populaii cu dispersia necunoscut. Z pentru diferena mediilor unor populaii cu dispersii cunoscute. F asupra dispersiilor a dou populaii. t pentru diferena mediilor unor populaii cu dispersii necunoscute. 2 pentru dispersia unei populaii. proporiilor. semnelor. multinomial.

Testarea normalitii: Q-Q plot. Testul Cramr-von Mises .

Variabile aleatoare continue.


O variabil aleatoare X : R se numete continu dac X () este de cardinal continuu1 . Distribuia (repartiia) unei astfel de variabile este dat de - funcia de repartiie, F : R [0, 1] F (a) = P (X a)

- sau prin funcia de densitate (de mas), f : R [0, +), astfel nct funcia de repartiie F 2 poate descris astfel:
a

F (a) = P (X

a) =

f (t) dt

Funcia de repartiie este cresctoare, continu la dreapta3 i


x

lim F (x) = 0

x +

lim F (x) = 1.

Cu ajutorul funciei de densitate, pentru o variabil aleatoare continu:


+

Media este M (X ) =

tf (t) dt

Dispersia este D 2 (X ) =

[t M (X )]2 f (t) dt

Probabilitile asociate unei variabile aleatoare continue se calculeaz astfel:


b

P (a

b) = F (b) F (a) =

f (t) dt
a

Observaie: dac F este continu, P (X = a) = F (a) = 0 i probabilitile P (a P (a < X b), P (a < X < b) sunt toate egale.

X < b),

1. Distribuia (legea) normal. Este o distribuie notat N (, 2 ) cu funcia de densitate 1 f (t) = e 2


1 2

(t )2 2 2

Cteodat aceast deniie se restrnge la familia variabilelor cu funcie de repartiie continu. n acest caz F va continu. 3 lim F (x) = F (a).
x a

Dac X : N (, 2 ), atunci M (X ) = i D 2 (X ) = 2 Distribuia N (0, 1) se numete normal standard . Valorile unei variabile distribuite normal au urmtoarea mprtiere: %68 se gsesc la cel mult o deviaie standard fa de medie; %95 se gsesc la cel mult dou deviaii standard fa de medie; %99.7 se gsesc la cel mult trei deviaii standard fa de medie; 2. Distribuia Student4 . Este o distribuie notat t(r ) cu funcia de densitate ( r+1 ) f (x) = 2 r r ( 2 )
+ r +1 2

x2 1+ r

unde (y ) =
0

xy1 ex dx. Pentru o variabil aleatoare X distribuit Student cu r > 2 grade r r2

de libertate avem M (X ) = 0 i D 2 (X ) = 3. Distribuia Fisher-Snedecor5 . Este o distribuie notat F (r1 , r2 ) cu funcia de densitate r2 (r1 x)r1 r2 (r1 x + r2 )r1 +r2 , f (x) = r1 r2 , xB 2 2
1

unde B (x, y ) =
0

ux1 (1 u)y1 du. Pentru o variabil aleatoare X distribuit F (r1 , r2 ) avem


2 (r + r 2) 2r2 r2 1 2 , r2 > 2 i D 2 (X ) = , r2 > 4 r2 2 r1 (r2 2)2 (r2 4)

M (X ) =

4. Distribuia 2 . Este o distribuie notat 2 (n) (unde n N \ {1} cu funcia de densitate f (x) =
4 5

2
Numit i distribuia t. Numit i distribuia F.

n/2

n/21 n/2 e , n x 2

unde (y ) =
0

xy1 ex dx. Pentru o variabil aleatoare X distribuit 2 (n) avem

M (X ) = n i D 2 (X ) = 2n

Statistic Inferenial.
O populaie statistic este o mulime de indivizi6 al cror atribut (greutate, nalime etc) este supus unor variaii aleatoare. Statistica inferenial are drept scop determinarea cu un anumit grad de acuratee (aproximarea, n cele mai multe cazuri) a parametrilor unei populaii statistice (cum ar medie sau deviaie standard). Inferena asupra parametrilor populaiei se realizeaz astfel: - se alege un eantion aleator simplu (alegerea indivizilor se face n mod independent i ecare individ are aceeai probabilitate de a ales); - se calculeaz una sau mai multe statistici utiliznd eantionul; - utiliznd statistica matematic i teoria probabilitilor, cu ajutorul statisticilor calculate, se formuleaza o armaie (se infereaz) asupra unui parametru al populaiei. ** Estimarea mediei unei populaii: Media de selecie ** Considerm o populaie cu media i dispersia 2 , creia i se msoar atributul7 X . Din aceast populaie se extrage un eantion aleator simplu de dimensiune n: X1 , X2 , . . . , Xn . Aceste valori pot privite i ca variabile aleatoare independente i identic repartizate cu variabila X . Media de selecie se denete astfel: xn = X1 + X2 + + Xn n

i este o statistic, dar n acelai timp, pentru un eantion generic, poate vzut ca o variabil aleatoare. Proprieti ale mediei de selecie: - xn este un estimator (nedeplasat) al mediei populaiei, , din care provine eantionul. - privit ca variabil aleatoare: M (xn ) = , D2 (xn ) = 2 n

- dac populaia din care provine eationul este distribuit normal N (, 2 ), atunci media 2 de selecie urmeaz o distribuie normal N , ; n - dac dimensiunea eantionului este sucient de mare (n 30), atunci media de selecie 2 . urmeaz cu aproximaie o distribuie normal N , n Putem astfel considera c scorul z = xn este distribuit N (0, 1). / n

6 7

n sens larg. X este o variabil aleatoare cu media i dispersia 2 .

** Estimarea mediei unei populaii: Intervale de ncredere pentru media unei populaii cu dispersia cunoscut ** Se consider o populaie cu dispersia cunoscut 2 . Se caut un interval n care media , necunoscut a populaie s se gseasc cu probabilitate mare (0.9, 0.95 sau 0.99). Un astfel de interval este urmtorul: xn z , xn + z n n unde z , numit valoarea critic, se determin astfel z = N ORM SIN V = N ORM SIN V 1 2 2

iar este egal cu 1 nivelul de ncredere. Media de selecie, dac nu este dat, se poate calcula astfel: xn = AV ERAGE (date-eantion) ** Estimarea mediei unei populaii: Intervale de ncredere pentru media unei populaii cu dispersia necunoscut ** Se consider o populaie creia nu i se cunoate dispersia. Se folosete drept estimator al xn este deviaiei standard , deviaia standard a eantionului s. n acest caz, scorul t = s/ n distribuit Student cu n 1 grade de libertate: t(n 1). Se caut un interval n care media populaiei , necunoscut i ea, s se gseasc cu probabilitate prescris (0.9, 0.95 sau 0.99). Un astfel de interval este urmtorul: s s xn t , xn + t n n unde t , numit valoarea critic, se determin astfel t = T IN V (; n 1) este egal cu 1 nivelul de ncredere, iar s este deviaia standard a eantionului. n cazul n care sunt cunoscute valorile din eantion, xn i s se calculeaz astfel: xn = AV ERAGE (date-eantion), s = ST DEV (date-eantion)

** Estimarea dispersiei unei populaii: Intervale de ncredere pentru dispersia unei populaii ** Se consider o populaie statistic distribuit normal creia nu i se cunoate dispersia. Se caut un interval n care dispersia 2 populaiei s se gseasc cu probabilitate mare (0.9, 0.95 sau 0.99). Se folosete un eantion aleator simplu de dimensiune n i dispersie s2 . Deoarece (n 1)s2 cantitatea urmeaz o distribuie 2 cu (n 1) grade de libertate, un astfel de interval 2 este urmtorul: (n 1) unde valoarile critice se determin astfel
2 s = CHIIN V

s2 s2 , (n 1) 2 2 s d

, n 1 , 2 d = CHIIN V 2

,n 1 2

iar este egal cu 1 nivelul de ncredere. Dispersia eantionului, dac nu este dat, se poate calcula astfel: s2 = V AR(date-eantion)

** Testarea ipotezelor statistice** Avem o populaie statistic creia nu i se cunoate distribuia. Un test statistic asupra distribuiei8 populaiei urmeaz urmtoarea procedur general: - se formuleaz o ipotez, numit ipoteza nul H0 , care precizeaz complet distribuia populaiei. - ipoteza nul este "atacat" de o ipotez alternativ Ha , care susine o presupunere diferit asupra distribuiei populaiei. - n cazul n care exist dovezi suciente (statistic semnicative) ipoteza nul, H0 , este respins i se accept ipoteza alternativ Ha . - dac dovezile mpotriva ipotezei nule nu sunt statistic semnicative, atunci ipoteza nul H0 nu poate respins, iar ipoteza alternativ nu poate acceptat (niciodat un test statistic nu se termin prin acceptarea ipotezei nule). La efectuarea unui test statistic se poate face dou tipuri de erori: - eroare de tipul I: rezultatul testului impune respingerea ipotezei nule H0 , dei, n realitate, ea este adevrat - aceast eroare este cauzat de o ncredere excesiv. - eroare de tipul II: rezultatul testului nu cere respingerea ipotezei nule H0 , dei, n realitate, ea este nu adevrat - aceast eroare este cauzat de un scepticism excesiv. H0 nu este respins corect eroare de tip II H0 este respins eroare de tip I corect

H0 este adevrat Ha este adevrat

De exemplu asupra mediei sau dispersiei.

** Testarea ipotezelor statistice: Testul Z pentru media unei populaii cu dispersia cunoscut ** Se consider o populaie statistic creia i se cunoate dispersia 2 . Pentru un eantion aleator simplu cu media de selecie xn , dac populaia urmeaz o lege normal sau dimensiunea xn este distribuit normal standard: N (0, 1). eantionului este sucient de mare, scorul z = / n Testul Z decurge astfel: 1. se formuleaz ipoteza nul, care susine c media populaiei ia o valoare particular: H 0 : = 0 2. se formuleaz o ipotez alternativ care poate de trei feluri: H a : < 0 H a : > 0 (ipotez asimetric la stnga) sau (ipotez asimetric la dreapta) sau (ipotez simetric)

H a : = 0

3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%); 4. se calculeaz scorul testului: z= 5. se determin valoarea critic z : z = N ORM SIN V () z = N ORM SIN V (1 ) pentru ipotez Ha asimetric la stnga, pentru ipotez Ha asimetric la dreapta, pentru ipotez Ha simetric. xn 0 / n

z = N ORM SIN V (/2) 6. ipoteza nul H0 este respins dac z < z z > z

pentru ipotez Ha asimetric la stnga sau pentru ipotez Ha asimetric la dreapta sau

|z | > |z |

pentru ipotez Ha simetric,

dac nu suntem ntr-una din aceste situaii, atunci se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea ipotezelor statistice: Testul t pentru media unei populaii cu dispersia necunoscut ** Se consider o populaie statistic creia nu i se cunoate dispersia. Pentru un eantion xn este distribuit aleator simplu cu media de selecie xn i deviaia standard s, scorul t = s/ n Student cu n 1 grade de libertate: t(n 1). Testul t decurge astfel: 1. se formuleaz ipoteza nul, care susine c media populaiei ia o valoare particular: H 0 : = 0 2. se formuleaz o ipotez alternativ care poate de trei feluri: H a : < 0 H a : > 0 (ipotez asimetric la stnga) sau (ipotez asimetric la dreapta) sau (ipotez simetric)

H a : = 0

3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%); 4. se calculeaz scorul testului: t= 5. se determin valoarea critic z : t = T IN V (2, n 1) t = T IN V (2, n 1) pentru ipotez Ha asimetric la stnga, pentru ipotez Ha asimetric la dreapta, pentru ipotez Ha simetric. xn 0 s/ n

t = T IN V (, n 1) 6. ipoteza nul H0 este respins dac t < t t > t

pentru ipotez Ha asimetric la stnga sau pentru ipotez Ha asimetric la dreapta sau |t| > |t | pentru ipotez Ha simetric,

dac nu suntem ntr-una din aceste situaii, atunci se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea ipotezelor statistice: Testul Z pentru diferena mediilor unor populaii cu dispersii cunoscute **
2 i 2 . Se aleg dou Se consider o dou populaii statistice crora li se cunoasc dispersiile 1 2 eantioane aleatoare simple i independente ntre ele cu mediile de selecie xn1 i xn2 . Dac populaiile urmeaz o lege normal sau dimensiunea eantioanelor este sucient de mare, scorul

z=

(xn1 xn2 ) (1 2 )
2 1 2 + 2 n1 n2

este distribuit (eventual cu aproximaie) normal standard: N (0, 1). Testul Z decurge astfel: 1. se formuleaz ipoteza nul, care susine c diferena mediilor celor dou populaii ia o valoare particular: H 0 : 1 2 = m0 2. se formuleaz o ipotez alternativ care poate de trei feluri: H a : 1 2 < m0 H a : 1 2 > m0 (ipotez asimetric la stnga) sau (ipotez asimetric la dreapta) sau (ipotez simetric)

H a : 1 2 = m0

3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%); 4. se calculeaz scorul testului: (xn1 xn2 ) m0
2 2 1 + 2 n1 n2

5. se determin valoarea critic z : z = N ORM SIN V () z = N ORM SIN V (1 ) pentru ipotez Ha asimetric la stnga, pentru ipotez Ha asimetric la dreapta, pentru ipotez Ha simetric.

z = N ORM SIN V (/2) 6. ipoteza nul H0 este respins dac z < z z > z

pentru ipotez Ha asimetric la stnga sau pentru ipotez Ha asimetric la dreapta sau

|z | > |z |

pentru ipotez Ha simetric,

dac nu suntem ntr-una din aceste situaii, atunci se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea ipotezelor statistice: Testul F (simetric) asupra dispersiilor a dou populaii **


2 i 2 . Se aleg Se consider o dou populaii statistice crora nu li se cunosc dispersiile 1 2 dou eantioane aleatoare simple i independente ntre ele crora li se calculeaz dispersiile s2 1 s2 1 2 i s2 . scorul F = 2 este distribuit F (n1 1, n2 1). s2 Testul F decurge astfel:

1. se formuleaz ipoteza nul, care susine c dispersiile celor dou populaii sunt egale: H0 :
2 1 2 =1 2

2. se formuleaz ipoteza alternativ care susine c dispersiile sunt diferite: Ha :


2 1 2 =1 2

3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%); 4. se calculeaz scorul testului: F =
i F : 5. se determin valoarile critice Fs d = F IN V (1 ; n 1; n 1) Fs 1 2 = F IN V (; n 1; n 1) = 1/F Fd 2 1 s

s2 1 s2 2

6. ipoteza nul H0 este respins i se accept c dispersiile sunt diferite dac


, F ) F / (Fs d

dac nu, atunci nu exist suciente dovezi pentru a accepta c dispersiile sunt diferite.

** Testarea ipotezelor statistice: Testul t pentru diferena mediilor unor populaii cu dispersii necunoscute ** Se consider o dou populaii statistice crora nu li se cunosc dispersiile. Se aleg dou eantioane aleatoare simple i independente ntre ele cu mediile de selecie xn1 i xn2 i dispersiile 2 i 2 . naintea efecturii testului t se folosete testul F pentru a decide dac dispersiile celor 1 2 dou populaii sunt diferite. Dac dispersiile nu sunt diferite t = (xn1 xn2 ) m0 s2 s2 + n1 n2 urmeaz o

distribuie Student9 : t(n1 + n2 2). Dac dispersiile sunt diferite, atunci t = urmeaz o distribuie Student: t(min (n1 1, n2 1)). Testul t decurge astfel:

(xn1 xn2 ) m0

s2 s2 1 + 2 n1 n2

1. se formuleaz ipoteza nul, care susine c diferena mediilor celor dou populaii ia o valoare particular (de cele mai multe ori zero): H 0 : 1 2 = m0 2. se formuleaz o ipotez alternativ care poate de trei feluri: H a : 1 2 < m0 H a : 1 2 > m0 (ipotez asimetric la stnga) sau (ipotez asimetric la dreapta) sau (ipotez simetric)

H a : 1 2 = m0 4. se calculeaz scorul testului: a) dac dispersiile sunt diferite: t=

3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%);

(xn1 xn2 ) m0 s2 s2 1 + 2 n1 n2

iar numrul de grade de libertate este df = min (n1 1, n2 1). b) dac dispersiile sunt "egale" t= (xn1 xn2 ) m0 s2 s2 + n1 n2

unde s2 = n1 + n2 2.

2 (n1 1)s2 1 + (n2 1)s2 , iar numrul de grade de libertate este df = n1 + n2 2

n acest caz s =

2 (n1 1)s2 1 + (n2 1)s2 n1 + n2 2

5. se determin valoarea critic t : t = T IN V (2, df ) t = T IN V (2, df ) pentru ipotez Ha asimetric la stnga, pentru ipotez Ha asimetric la dreapta, pentru ipotez Ha simetric.

t = T IN V (, df ) 6. ipoteza nul H0 este respins dac t < t t > t

pentru ipotez Ha asimetric la stnga sau pentru ipotez Ha asimetric la dreapta sau |t| > |t | pentru ipotez Ha simetric,

dac nu suntem ntr-una din aceste situaii, atunci se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea ipotezelor statistice: Testul 2 pentru dispersia unei populaii ** Se consider o populaie statistic normal distribuit creia nu i se cunoate dispersia 2 . s2 Pentru un eantion aleator simplu cu dimensiunea n i dispersia s2 , scorul 2 = (n 1) 2 este distribuit 2 (n 1). Testul 2 decurge astfel: 1. se formuleaz ipoteza nul, care susine c dispersia populaiei ia o valoare particular:
2 H 0 : 2 = 0

2. se formuleaz o ipotez alternativ care poate de trei feluri:


2 H a : 2 < 0 2 H a : 2 > 0

(ipotez asimetric la stnga) sau (ipotez asimetric la dreapta) sau (ipotez simetric)

2 H a : 2 = 0

3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%); 4. se calculeaz scorul testului: 2 = (n 1) 5. se determin valorile critice: 2 = CHIIN V (1 , n 1) 2 = CHIIN V (, n 1)
2 s = CHIIN V 1

s2 2 0

pentru ipotez Ha asimetric la stnga, pentru ipotez Ha asimetric la dreapta, ,n 1 2 pentru Ha simetric.

, n 1 , 2 d = CHIIN V 2

6. ipoteza nul H0 este respins dac 2 < 2 2 > 2 pentru ipotez Ha asimetric la stnga sau pentru ipotez Ha asimetric la dreapta sau pentru ipotez Ha simetric,

2 2 / 2 s , d

dac nu suntem ntr-una din aceste situaii, atunci se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea ipotezelor statistice: Testul proporiilor ** Se consider o variabil X ce numr succesele din n ncercri. X este distribuit binomial X - X : B (n, p). Testul proporiilor infereaz asupra probabilitii p. Se noteaz cu p = n frecvena dat de eantion. Deoarece M (X ) = np i D2 (X ) = np(1 p), vom avea M (p ) = p i D 2 (p ) = p(1 p) . n

Pentru n sucient de mare (n 20 i np 5) p urmeaz aproximativ o distribuie normal. p p Statistica z = este distribuit normal standard: N (0, 1). p(1 p)/n Testul asupra proporiilor decurge astfel: 1. se formuleaz ipoteza nul, care susine c probabilitatea p ia o valoare particular: H 0 : p = p0 2. se formuleaz o ipotez alternativ care poate de trei feluri: H a : p < p0 H a : p > p0 (ipotez asimetric la stnga) sau (ipotez asimetric la dreapta) sau (ipotez simetric)

H a : p = p0

3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%); 4. se calculeaz scorul testului: z= 5. se determin valoarea critic z : z = N ORM SIN V () z = N ORM SIN V (1 ) pentru ipotez Ha asimetric la stnga, pentru ipotez Ha asimetric la dreapta, pentru ipotez Ha simetric. p0 (1 p0 )/n p p0

z = N ORM SIN V (/2) 6. ipoteza nul H0 este respins dac z < z z > z

pentru ipotez Ha asimetric la stnga sau pentru ipotez Ha asimetric la dreapta sau

|z | > |z |

pentru ipotez Ha simetric,

dac nu suntem ntr-una din aceste situaii, atunci se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea ipotezelor statistice: Testul semnelor ** Se consider o dou populaii din care se extrag dou eantioane de dimensiuni egale: Y1 , Y2 , . . . , Yk i Z1 , Z2 , . . . , Zk . Se testeaz ipoteza ca cele dou populaii au aceeai distribuie versus ipoteza c distribuiile sunt diferite (n sensul c valorile pentru a doua populaie sunt frecvent mai mari dect cele din prima populaie). Se noteaz cu n = |{i : Zi Yi = 0}| - numrul de perechi (Zi , Yi ) pentru care Zi = Yi . Statistica testului este m = W = |{i : Zi Yi > 0}| - numrul de perechi (Zi , Yi ) pentru care Zi > Yi . n ipoteza nul W este distribuit binomial: W : B (n, 0.5). Testul semnelor decurge astfel: 1. se formuleaz ipoteza nul, care susine c populaiile au aceeai distribuie H0 : p = 0.5 2. se formuleaz o ipotez alternativ care : Ha : p > 0.5 3. se xeaz nivelul de semnicaie: (care uzual poate 1% sau 5%); 4. se calculeaz probabilitatea testului: P = P (W m) = 1 P (W m 1)

P = 1 BIN OM DIST (m 1; n; 0.5; true) 5. ipoteza nul H0 este respins dac P < , altfel se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea ipotezelor statistice: Testul multinomial ** Se consider un experiment cu s rezultate posibile, cu probabiliti p1 , p2 , . . . , ps . Experimentul se repet n mod independent de n ori i se noteaz cu Oi numrul de realizri ale rezultatului i (Oi este o variabil aleatoare distribuit binomial B (n, pi )):
s

Oi = n.
i=1

Pentru rezultatul i numrul mediu de realizri este (media variabilei Oi ) Ei = npi . s (Oi Ei)2 Statistica urmeaz o distribuie 2 (s1). Testul multinomial infereaz asupra E i i=1 probabilitilor p1 , p2 , . . . , ps i decurge astfel: 1. se formuleaz ipoteza nul, care susine c probabilitile iau valori xate. H 0 : p i = i , i 2. se formuleaz o ipotez alternativ: Ha : pi = i , pentru un i 3. se xeaz nivelul de semnicaie: (1% sau 5%); 4. se calculeaz scorul testului:
s

2 =
i=1

(Oi Ei)2 Ei

5. se calculeaz valoarea critic: 2 = CHIIN V (, s 1) 6. ipoteza nul H0 este respins dac 2 > 2 , altfel se spune c nu exist suciente dovezi pentru a respinge ipoteza nul H0 i a accepta ipoteza alternativ Ha .

** Testarea normalitii ** Avem o populaie statistic creia nu i se cunoate distribuia. Dorim s tim dac populaia respectiv este repartizat normal. Fie X1 , X2 , . . . , Xn valorile unui eantion aleator simplu provenit din aceast populaie statistic. Denim 1 n
n n

, Xi ,

dac se cunoate media populaiei

altfel.

i=1
dac se cunoate deviaia standard a populaiei

2 , (Xi )2 ,

1 n1

altfel.

i=1

Valorile din eantion se standardizeaz: se construiesc valorile Y1 , Y2 , . . . , Yn , unde Yi = Apoi valorile sunt ordonate cresctor: Y(1) Y(2) ... Y(n) . Xi , i = 1, n .

** Testarea normalitii: Q-Q plot ** Aceasta este o metod grac de determinare aproximativ a normaitii unei populaii statistice. Metoda tinde s dea rezultate mai bune pe msur ce eantionul are o dimensiune mai mare. Se construiesc quantilele corespunztoare: 1 0.5 2 0.5 k 0.5 n 0.5 , ,..., ,..., . n n n n Se construiesc valorile normale corespunztoare quantilelor: z1 , z2 , . . . , zk , . . . , zn , k 0.5 . n Se reprezint grac perechile de puncte (Y(k) , zk ). Dac punctele acestea se gsesc (cu aproximaie) pe dreapta x = y (adic prima bisectoare), atunci putem trage concluzia ca populaia este repartizat (aproximativ) normal. unde zk = NORMSINV

** Testarea normalitii: Testul Cramr-von Mises ** Statistica (scorul) testului este


n 1 2i 1 T = + F (Y(i) ) 12n i=1 2n 2

unde F (x) este funcia de repartiie a unei distribuii teoretice cunoscute. De exemplu, n cazul distribuiei normale standard: 1 F (x) = 2
x

et dt.

n Microsoft Oce Excel sau OpenOce Spreadsheet F (x) se calculeaz cu NORMSDIST(x): F (Y(i) ) = N ORM SDIST Y(i) Ipoteza c populaia este repartizat normal este respins dac T este mai mare dect valoarea din tabel (corespunztoare dimensiunii eantionului):
n 4 5 6 7 8 9 10 12 14 16 18 20 30 60 100 0.1 0.155 0.160 0.162 0.165 0.165 0.167 0.167 0.169 0.169 0.171 0.171 0.172 0.172 0.173 0.173 0.05 0.191 0.199 0.204 0.208 0.210 0.212 0.212 0.214 0.214 0.216 0.217 0.217 0.218 0.220 0.220 0.01 0.28 0.30 0.31 0.32 0.32 0.32 0.32 0.32 0.32 0.32 0.33 0.33 0.33 0.33 0.33

S-ar putea să vă placă și