Sunteți pe pagina 1din 23

Bazele Statisticii

Curs 12

Conf. dr. Mariana HATMANU

anul universitar 2021-2022

1
Tema 6: Testarea statistică
6.1. Aspecte generale ale testării statistice
6.1.1. Obiectivele testării statistice
6.1.2. Demersul testării statistice
6.1.3. Teste parametrice versus teste neparametrice
6.2. Testarea ipotezelor asupra unui eșantion
6.2.1 Testarea ipotezelor asupra mediei: testul t, testul Z
6.2.2 Testarea ipotezelor asupra proporţiei: testul t, testul Z
6.3. Testarea ipotezelor privind două eşantioane (cazul
eşantioanelor independente)
- verificarea egalităţii mediilor.
6.4. Testarea ipotezelor privind 3 şi mai multe eşantioane
independente (Testul Fisher – ANOVA)

2
6.1. Aspecte generale ale testării statistice

6.1.1. Obiectivele testării statistice


- verificarea ipotezelor asupra unui parametru al unei populaţii;
- verificarea ipotezelor privind legea de distribuţie a unei populaţii;
- verificarea ipotezelor privind două sau mai multe populaţii.

3
6.1. Aspecte generale ale testării statistice
6.1.2. Demersul testării statistice
a) Formularea ipotezelor statistice
b) Alegerea pragului de semnificație α
c) Alegerea testului statistic
d) Calculul valorii statisticii test
e) Valoarea critică (teoretică) a testului
f) Regula de decizie
g) Decizie și interpretare

4
6.1. Aspecte generale ale testării statistice
6.1.2. Demersul testării statistice
a) Formularea ipotezelor statistice
O ipoteză este o presupunere cu privire la valoarea unui
parametru, legea de distribuţie a variabilei studiate
etc.
Ipoteza nulă H0 : se presupune egalitatea unui
parametru cu o valoare fixă sau se face o
presupunere cu privire la legea de repartiţie a unei
variabile
Ipoteza alternativă H1: este opusul ipotezei nule

5
Test bilateral:
H 0 :   0
H1 :    0

Test unilateral dreapta


H 0 :   0
H1 :    0

Test unilateral stânga


H 0 :   0
H1 :    0

6
6.1.2. Demersul testării
b) Alegerea pragului de semnificaţie  al testului
- riscul (pragul de semnificaţie)  reprezintă
probabilitatea de a respinge ipoteza nulă atunci când
aceasta este adevărată; o valoare fixată a erorii de speţa I

7
6.1.2. Demersul testării

c) Alegerea testului statistic


- există două categorii de teste statistice: teste parametrice şi teste neparametrice

Alegerea testului statistic se face în funcţie de o serie de criterii, precum:


- natura populaţiei
- forma de prezentare a variabilei/variabilelor analizate
- metoda de eşantionare
- puterea testului

8
Forma variabilei

Cantitativă calitativă
(numerică) (nenumerică)

cu variaţie cu variaţie
nominală ordinală
discretă continuă

Teste parametrice Teste neparametrice


de verificare a ipotezelor de verificare a ipotezelor
statistice statistice

9
Condiţii ale aplicării metodelor parametrice

ipoteza de normalitate a distribuţiei populaţiei din care a fost extras eşantionul


analizat

 variabila dependentă este măsurată pe o scală interval sau raport

adesea, mărimea eşantionului trebuie să fie suficient de mare (n>30) pentru a


permite acceptarea ipotezei de normalitate

10
Avantaje ale aplicării metodelor neparametrice

puţine ipoteze privind legea de distribuţie a populaţiei din care a fost extras
eşantionul analizat (metode libere de distribuţie - distribution free methods)

variabila dependentă poate fi măsurată pe o scală nominală, ordinală, interval


sau raport

mărimea eşantionului poate fi mică

11
Limite ale testelor neparametrice

 În multe teste neparametrice, datele sunt transformate în ranguri sau


semne (pozitive, negative). Critici: nu se foloseşte toată informaţia de la
nivelul eşantionului.

 putere mai slabă decât cea a testelor parametrice.

12
6.1.2. Demersul testării
d) Calculul valorii statisticii test, folosind datele observate la nivelul eşantionului.
e) Valoarea critica a testului (se citește din tabelul repartiției
statisticii test – Z, t, F)
f) Regula de decizie.
Regiunea de respingere – intervalul dintr-o distribuţie de
probabilitate în care se respinge ipoteza nulă, acest interval este
acoperit de probabilitatea 
Regiunea de acceptare = interval de încredere – intervalul în care
nu se respinge ipoteza nulă şi este acoperit de probabilitatea 1- 
Regula de decizie pt. test bilateral, test unilateral stânga şi test
unilateral dreapta
g) Compararea valorii calculate a statisticii test cu valoarea
teoretică şi luarea deciziei de a respinge sau de a nu respinge
ipoteza nulă.
13
Erori de testare
Decizia testului se ia cu o anumită probabilitate de eroare, care
poate fi:
 eroare de tip I (eroare de primă speţă, notată  )
 eroare de tip II (eroare de a doua speţă, notată  )
Realitate
H0 adevărată H0 falsă
Nu se respinge Decizie corectă Eroare de tip II
H0 (1-) ()
Decizia Eroare de tip I Decizie corectă
Se respinge H0
() (1-)

1 –  măsoară nivelul de siguranţă al testului (siguranţa statistică)


1 –  măsoară puterea testului
14
6.2. Testarea ipotezelor asupra unui eșantion
6.2.1. Testarea ipotezelor asupra mediei unei populaţii
a) Formularea ipotezelor H 0 :   0
H1 :    0
b) Alegerea pragului de semnificație, α
c) Alegerea testului statistic
1. Dacă se cunoaşte  2 se foloseşte statistica Z, Z ~ N ( 0, 1 )
ˆ   0
Z
/ n
2. Dacă nu se cunoaşte  2 , se foloseşte statistica t, t ~ t( n  1 )
ˆ   0
t
ˆ ' / n
15
6.2.1. Testarea ipotezelor asupra mediei unei populaţii

d. Citirea din tabel a valorii critice a statisticii test


Pt test bilateral, poate fi / sau ;

e. Calculul valorii statisticii test pe baza datelor


eşantionului
x  0 x  0
z calculat  t calculat 
/ n s' / n

16
f. Regula de decizie

17
6.2.1. Testarea ipotezelor asupra mediei unei populaţii

f. Regula de decizie (grafic)


z calculat  z  / 2 sau Sig   se respinge ipoteza
nulă, pentru un risc 

z calculat  z  / 2 sau Sig   ipoteza nulă nu se


respinge
- Idem pt. testul t (Student)

g. Compararea valorii calculate a statisticii testului cu


valoarea critică (teoretică)

h. Interpretare

18
Exemplu:
• a) Se verifică calitatea unui lot de ciocolată privind greutatea unei
bucăţi. Se fac 25 de măsurători pentru care se obţine o greutate medie
de 95 g şi o abatere standard de 5g. În contractul de livrare se prevede
că greutatea medie a unei ciocolate este de 90 g. Să se verifice, pe baza
sondajului realizat, dacă lotul corespunde calitativ, în condiţiile unui
risc acceptat de 5%.

• b) Pt. pb. de mai sus, se consideră că în contractul de livrare este


prevăzută o greutatea medie a unei ciocolate de 100 g.
Exemplu:
Rezolvare varianta b)
t / 2; n 1  2,064
95  100
t calculat   5
5 / 25
• Interpretare: se respinge ipoteza nulă, greutatea
medie a unei ciocolate diferă semnificativ de
prevederile din contract, lotul nu corespunde
calitativ, în condiţiile unui risc acceptat de 5%.
6.2.2 Testarea ipotezelor asupra proporţiei

Demersul testării:
a) Formularea ipotezelor statistice
H0 :    0

H1 :   0
6.2.2 Testarea ipotezelor asupra proporţiei
b) Alegerea pragului de semnificaţie 

c) Testul statistic

p  0
t calculat 
p( 1  p ) / n

d) Regula de decizie...
Exemplu
• În vederea studierii opţiunii studenţilor din anul I de la FEAA privind
alegerea unei discipline opționale, se extrage aleator simplu repetat un
eşantion format din 25 studenţi şi se observă că proporţia celor care preferă
să urmeze disciplina X este de 20%. Să se verifice ipoteza potrivit căreia
proporţia acestei categorii de studenţi nu diferă semnificativ de proporţia
înregistrată în anul universitar precedent,  0  15% . Riscul asumat este   0,05
.

S-ar putea să vă placă și