Sunteți pe pagina 1din 29

BAZELE STATISTICII

- anul universitar 2017-2018 -


6. Testarea statistică
6.1. Aspecte generale ale testării statistice
6.1.1. Obiectivele testării statistice
6.1.2. Demersul testării statistice
6.1.3. Teste parametrice versus teste neparametrice
6.2. Testarea ipotezelor asupra unui eşantion
6.2.1 Testarea ipotezelor asupra mediei: testul t, testul Z
6.2.2 Testarea ipotezelor asupra proporţiei: testul t, testul Z
6. Testarea statistică
6.3. Testarea ipotezelor privind două eşantioane (cazul
eşantioanelor independente)
- verificarea egalităţii mediilor.

6.4. Testarea ipotezelor privind 3 şi mai multe eşantioane


independente (Testul Fisher – ANOVA)
6.1. Aspecte generale ale testării statistice
Necesitatea testării

6.1.1. Obiectivele testării statistice


- verificarea ipotezelor asupra unui parametru al unei populaţii;
- verificarea ipotezelor privind legea de distribuţie a unei
populaţii;
- verificarea ipotezelor privind două sau mai multe populaţii.

6.1.2. Demersul testării statistice


6.1. Aspecte generale ale testării statistice
a) Formularea ipotezelor statistice
O ipoteză este o presupunere cu privire la valoarea unui
parametru, legea de distribuţie a variabilei studiate, etc.
H0 : egalitatea unui parametru cu o valoare fixă; o
presupunere cu privire la legea de repartiţie a unei variabile.
H1: este opusul ipotezei nule.
6.1. Aspecte generale ale testării statistice
Test bilateral:
H 0 : θ = θ0
H1 : θ ≠ θ 0

Test unilateral la dreapta:


H 0 :θ = θ0
H1 : θ > θ 0

Test unilateral la stânga:


H 0 :θ = θ0
H1 : θ < θ 0
6.1. Aspecte generale ale testării statistice
b) Alegerea testului statistic
- există două categorii de teste statistice: teste parametrice şi
teste neparametrice.

c) Alegerea pragului de semnificaţie α al testului şi citirea


valorii critice (teoretice)
- riscul (pragul de semnificaţie) α reprezintă probabilitatea de
a respinge ipoteza nulă, atunci când aceasta este adevărată.

d) Calculul valorii statisticii test, folosind datele observate la


nivelul eşantionului.
6.1. Aspecte generale ale testării statistice
e) Regiunea de respingere/acceptare a ipotezei nule
Regiunea de respingere – intervalul dintr-o distribuţie de
probabilitate în care se respinge ipoteza nulă, acest interval
este acoperit de probabilitatea α
Regiunea de acceptare (interval de încredere) – intervalul în
care nu se respinge ipoteza nulă şi este acoperit de
probabilitatea 1- α

f) Regula de decizie
Erori de testare
Decizia testului se ia cu o anumită eroare, care poate fi:
 eroare de tip I (eroare de primă speţă, notată α )
 eroare de tip II (eroare de a doua speţă, notată β )
6.1. Aspecte generale ale testării statistice

 1 – α măsoară nivelul de siguranţă al testului (siguranţa


statistică)
 1 – β măsoară puterea testului
6.1.3 Teste parametrice şi teste neparametrice
Teste parametrice:
 presupun ipoteza de normalitate a distribuţiei populaţiei;
 variabila analizată este măsurată pe o scală interval sau
raport;
 mărimea eşantionului trebuie să fie suficient de mare (ex.
n>30).
Teste neparametrice:
 puţine ipoteze restrictive privind legea de distribuţie a
populaţiei;
 se folosesc pentru variabile calitative.
6.2. Testarea ipotezelor asupra unui eşantion
6.2.1. Testarea ipotezelor asupra mediei unei populaţii
a) Formularea ipotezelor H 0 : µ = µ 0
H1 : µ ≠ µ 0
b) Alegerea testului statistic
- dacă se cunoaşte σ 2 se foloseşte statistica Z, Z ~ N ( 0, 1 )
µˆ − µ 0
Z=
σ/ n
- dacă nu se cunoaşte σ 2 , se foloseşte statistica t, t ~ t( n − 1 )
µˆ − µ 0
t=
σˆ ' / n
6.2.1. Testarea ipotezelor asupra mediei unei populaţii

c). Alegerea pragului de semnificaţie şi citirea din tabel a


valorii critice a statisticii test.

d). Calculul valorii statisticii test pe baza datelor eşantionului

x − µ0 x − µ0
z calculat = t calculat =
σ/ n s' / n
6.2.1. Testarea ipotezelor asupra mediei unei populaţii
e). Regula de decizie
- dacă t calculat > tα / 2 , se respinge ipoteza nulă,
pentru un risc α

- dacă t calculat ≤ tα / 2 , nu se respinge ipoteza nulă.

f). Compararea valorii calculate a statisticii testului cu


valoarea critică (teoretică)

Exemplu
Exemplu
 În urma prelucrării datelor privind veniturile familiilor dintr-o
regiune înregistrate la nivelul unui eşantion de volum n=625,
s-au obţinut următoarele rezultate:
x = 12 mil . lei , s‘2= 4. Să se testeze dacă există diferenţe
semnificative între veniturile medii ale familiilor la nivelul
populaţiei din care a fost extras eşantionul şi venitul mediu pe
ţară, µ 0 = 13 mil . lei , considerând un risc de 5%.
6.2.2 Testarea ipotezelor asupra proporţiei

Demersul testării:
a) Formularea ipotezelor statistice
H0 : π = π 0

H1 : π ≠ π0
6.2.2 Testarea ipotezelor asupra proporţiei
b) Alegerea pragului de semnificaţie α

c) Testul statistic
p − π0
t calculat =
p( 1 − p ) / n

d) Regula de decizie
6.3. Testarea ipotezelor privind două
eşantioane (cazul eşantioanelor independente)
 În cazul eşantioanelor independente, statistica test folosită în
testarea ipotezelor statistice este statistica Z sau t.
 Ipoteze statistice

H 0 : µ1 − µ 2 = 0

H 1 : µ1 − µ 2 ≠ 0

 Aplicarea testului presupune testarea egalităţii varianţelor


populaţiilor din care au fost extrase eşantioanele (testul
Levene).
6.3. Testarea ipotezelor privind două
eşantioane
 atunci când σ 12 ≠ σ 22 , statistica test este:
x1 − x 2
t calculat =
s' 12 s' 22
+
n1 n2

 atunci când σ 12 = σ 22 , statistica test este:


x1 − x2
t calculat =
1 1
s' p⋅ +
n1 n2
6.3. Testarea ipotezelor privind două
eşantioane
 unde:
s' 12 ( n1 − 1 ) + s' 22 ( n 2 − 1 )
s' p =
n1 + n 2 − 2

Exemplu
 Pentru două eşantioane extrase aleator simplu de volum
n1=n2=625 persoane s-a înregistrat vârsta şi s-au obţinut
următoarele rezultate:
x1 = 35 ani, x2 = 32 ani ;
s' 1 = 2 ani , s' 2 = 4 ani
6.3. Testarea ipotezelor privind două
eşantioane
 Să se testeze ipoteza potrivit căreia între vârstele medii ale
celor două populaţii din care au fost extrase eşantioanele
observate există diferenţe semnificative. Se consideră un risc
de 0,05.
6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente (ANOVA)
a) Obiectiv
- procedeu de analiză a variaţiei în funcţie de sursa acesteia;
- permite compararea mediilor a 3 sau mai multe grupe sau
populaţii cu scopul de a verifica dacă există diferenţe
semnificative între acestea.

b) Condiţii de aplicare
- Condiţia de independenţă
- Condiţia de normalitate
- Condiţia de homoscedasticitate
6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente
Se bazează pe descompunerea variaţiei totale pe componente:
- variaţia explicată sau intergrupe (variaţia sub influenţa
factorilor esenţiali);
- variaţia reziduală sau intragrupe (variaţia sub influenţa
factorilor întâmplători).

VT = V E + V R
- La nivelul unui eşantion: TSS=ESS+RSS.
6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente (ANOVA)
n
 Variaţia totală TSS =  ( xi − x ) 2
i

n
 Variaţia explicată ESS =  ( x j − x ) 2
i =1

 Variaţia reziduală nj k
RSS =   ( xij − x j ) 2
i =1 j =1

c). Ipoteze statistice:

H 0 : µ1 = µ 2 = K = µ k

H 1 : mediile a cel putin doua populatii sunt diferite


6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente (ANOVA)
d. Statistica test Fisher
VˆE / k − 1
F=
Vˆ / n − k
R

unde: k – numărul grupelor.


6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente (ANOVA)
e. Se alege pragul de semnificaţie α şi se citeşte valoarea
critică a testul F din tabelul repartiţiei Fisher, pentru riscul
α admis, şi v1 = k − 1, v2 = n − k grade de libertate,
F
.
α , v1 , v2
6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente (ANOVA)
f. Calculul statisticii F:

ESS / k − 1 ESS n − k
Fcalculat = = ⋅
RSS / n − k RSS k − 1
6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente (ANOVA)
g. Regula de decizie:
 Fcalculat > Fα , v1 , v2 sau Sig < α se respinge ipoteza nulă H 0
pentru riscul α admis

 Fcalculat ≤ Fα ,v1 ,v2 sau Sig ≥ α nu se respinge ipoteza nulă H 0


6.4 Testarea ipotezelor privind 3 şi mai multe
eşantioane independente (ANOVA)

ANOVA

venit
Sum of
Squares df Mean Square F Sig.
Between Groups 149.400 2 74.700 19.597 .000
Within Groups 64.800 17 3.812
Total 214.200 19

S-ar putea să vă placă și