Sunteți pe pagina 1din 29

BAZELE STATISTICII

- anul universitar 2014-2015 -

6. Testarea statistic
6.1. Aspecte generale ale testrii statistice
6.1.1. Obiectivele testrii statistice
6.1.2. Demersul testrii statistice
6.1.3. Teste parametrice versus teste neparametrice
6.2. Testarea ipotezelor asupra unui eantion
6.2.1 Testarea ipotezelor asupra mediei: testul t, testul Z
6.2.2 Testarea ipotezelor asupra proporiei: testul t, testul Z

6. Testarea statistic
6.3. Testarea ipotezelor privind dou eantioane (cazul
eantioanelor independente)
- verificarea egalitii mediilor.
6.4. Testarea ipotezelor privind 3 i mai multe eantioane
independente (Testul Fisher ANOVA)

6.1. Aspecte generale ale testrii statistice


Necesitatea testrii
6.1.1. Obiectivele testrii statistice
verificarea ipotezelor asupra unui parametru al unei populaii;
verificarea ipotezelor privind legea de distribuie a unei
populaii;
verificarea ipotezelor privind dou sau mai multe populaii.
6.1.2. Demersul testrii statistice

6.1. Aspecte generale ale testrii statistice


a)

Formularea ipotezelor statistice


O ipotez este o presupunere cu privire la valoarea unui
parametru, legea de distribuie a variabilei studiate, etc.
H0 : egalitatea unui parametru cu o valoare fix; o
presupunere cu privire la legea de repartiie a unei variabile.
H1: este opusul ipotezei nule.

6.1. Aspecte generale ale testrii statistice


Test bilateral:
H 0 : = 0
H1 : 0
Test unilateral la dreapta:
H 0 : = 0
H1 : > 0

Test unilateral la stnga:


H 0 : = 0
H1 : < 0

6.1. Aspecte generale ale testrii statistice


b) Alegerea testului statistic
- exist dou categorii de teste statistice: teste parametrice i
teste neparametrice.
c) Alegerea pragului de semnificaie al testului i citirea
valorii critice (teoretice)
- riscul (pragul de semnificaie) reprezint probabilitatea de
a respinge ipoteza nul, atunci cnd aceasta este adevrat.
d) Calculul valorii statisticii test, folosind datele observate la
nivelul eantionului.

6.1. Aspecte generale ale testrii statistice


e) Regiunea de respingere/acceptare a ipotezei nule
Regiunea de respingere intervalul dintr-o distribuie de
probabilitate n care se respinge ipoteza nul, acest interval
este acoperit de probabilitatea
Regiunea de acceptare (interval de ncredere) intervalul n
care nu se respinge ipoteza nul i este acoperit de
probabilitatea 1-
f) Regula de decizie

Erori de testare
Decizia testului se ia cu o anumit eroare, care poate fi:
 eroare de tip I (eroare de prim spe, notat )
 eroare de tip II (eroare de a doua spe, notat )

6.1. Aspecte generale ale testrii statistice




1 msoar nivelul de siguran al testului (sigurana


statistic)
1 msoar puterea testului

6.1.3 Teste parametrice i teste neparametrice


Teste parametrice:
 presupun ipoteza de normalitate a distribuiei populaiei;
 variabila analizat este msurat pe o scal interval sau
raport;
 mrimea eantionului trebuie s fie suficient de mare (ex.
n>30).
Teste neparametrice:
 puine ipoteze restrictive privind legea de distribuie a
populaiei;
 se folosesc pentru variabile calitative.

6.2. Testarea ipotezelor asupra unui eantion


6.2.1. Testarea ipotezelor asupra mediei unei populaii
a)
Formularea ipotezelor H 0 : = 0
H1 : 0
b) Alegerea testului statistic
- dac se cunoate 2 se folosete statistica Z,
Z ~ N ( 0, 1 )
0
Z=
/ n
- dac nu se cunoate 2 , se folosete statistica t, t ~ t( n 1 )

t=

0
' / n

6.2.1. Testarea ipotezelor asupra mediei unei populaii


c). Alegerea pragului de semnificaie i citirea din tabel a
valorii critice a statisticii test.
d). Calculul valorii statisticii test pe baza datelor eantionului
z calculat =

x 0
/

t calculat =

x 0
s' / n

6.2.1. Testarea ipotezelor asupra mediei unei populaii


e). Regula de decizie
- dac t calculat > t / 2
pentru un risc
- dac
f).

, se respinge ipoteza nul,

t calculat t / 2 , nu se respinge ipoteza nul.

Compararea valorii calculate a statisticii testului cu


valoarea critic (teoretic)

Exemplu

Exemplu


n urma prelucrrii datelor privind veniturile familiilor dintr-o


regiune nregistrate la nivelul unui eantion de volum n=625,
s-au obinut urmtoarele rezultate:
x = 12 mil . lei , s2= 4. S se testeze dac exist diferene
semnificative ntre veniturile medii ale familiilor la nivelul
populaiei din care a fost extras eantionul i venitul mediu pe
ar, 0 = 13 mil . lei , considernd un risc de 5%.

6.2.2 Testarea ipotezelor asupra proporiei

a)

Demersul testrii:
Formularea ipotezelor statistice
H0 : = 0
H1 : 0

6.2.2 Testarea ipotezelor asupra proporiei


b)

Alegerea pragului de semnificaie

c)

Testul statistic
t calculat =

d)

p 0
p( 1 p ) / n

Regula de decizie

6.3. Testarea ipotezelor privind dou


eantioane (cazul eantioanelor independente)


n cazul eantioanelor independente, statistica test folosit n


testarea ipotezelor statistice este statistica Z sau t.
Ipoteze statistice
H 0 : 1 2 = 0

H 1 : 1 2 0


Aplicarea testului presupune testarea egalitii varianelor


populaiilor din care au fost extrase eantioanele (testul
Levene).

6.3. Testarea
eantioane


atunci cnd 12 22
t calculat =

ipotezelor

privind

, statistica test este:

x1 x 2
s' 12 s' 22
+
n1
n2

atunci cnd

12 = 22
x1 x2

t calculat =
s' p

1
1
+
n1 n2

, statistica test este:

dou

6.3. Testarea
eantioane


ipotezelor

privind

dou

unde:
s' p =

s' 12 ( n1 1 ) + s' 22 ( n 2 1 )
n1 + n 2 2

Exemplu
 Pentru dou eantioane extrase aleator simplu de volum
n1=n2=625 persoane s-a nregistrat vrsta i s-au obinut
urmtoarele rezultate:

x1 = 35 ani, x2 = 32 ani
s' 1 = 2 ani , s' 2 = 4 ani

6.3. Testarea
eantioane


ipotezelor

privind

dou

S se testeze ipoteza potrivit creia ntre vrstele medii ale


celor dou populaii din care au fost extrase eantioanele
observate exist diferene semnificative. Se consider un risc
de 0,05.

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente (ANOVA)
a) Obiectiv
procedeu de analiz a variaiei n funcie de sursa acesteia;
permite compararea mediilor a 3 sau mai multe grupe sau
populaii cu scopul de a verifica dac exist diferene
semnificative ntre acestea.
b) Condiii de aplicare
Condiia de independen
Condiia de normalitate
Condiia de homoscedasticitate

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente
-

Se bazeaz pe descompunerea variaiei totale pe componente:


variaia explicat sau intergrupe (variaia sub influena
factorilor eseniali);
variaia rezidual sau intragrupe (variaia sub influena
factorilor ntmpltori).

VT = V E + V R
-

La nivelul unui eantion: TSS=ESS+RSS.

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente (ANOVA)


Variaia total

TSS = ( xi x ) 2
i

Variaia explicat

ESS = ( x j x ) 2
i =1

Variaia rezidual

nj k

RSS = ( xij x j ) 2
i =1 j =1

c). Ipoteze statistice:

H 0 : 1 = 2 = K = k
H 1 : mediile a cel putin doua populatii sunt diferite

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente (ANOVA)
d. Statistica test Fisher

VE / k 1
F=
V / n k
R

unde: k numrul grupelor.

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente (ANOVA)
e. Se alege pragul de semnificaie i se citete valoarea
critic a testul F din tabelul repartiiei Fisher, pentru riscul
grade de libertate,
admis, i
v1 = k 1, v2 = n k
.
F
, v1 , v2

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente (ANOVA)
f. Calculul statisticii F:
Fcalculat =

ESS / k 1 ESS n k
=

RSS / n k RSS k 1

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente (ANOVA)
g. Regula de decizie:


Fcalculat > F , v1 , v2 sau Sig <

pentru riscul admis

Fcalculat F ,v1 ,v2 sau Sig

se respinge ipoteza nul H 0

nu se respinge ipoteza nul H 0

6.4 Testarea ipotezelor privind 3 i mai multe


eantioane independente (ANOVA)
ANOVA
venit

Between Groups
Within Groups
Total

Sum of
Squares
149.400
64.800
214.200

df
2
17
19

Mean Square
74.700
3.812

F
19.597

Sig.
.000