Sunteți pe pagina 1din 21

Testarea statistica

Obiectivele testării statistice


- verificarea ipotezelor asupra unui parametru al unei populaţii
- verificarea ipotezelor privind două sau mai multe populaţii
- verificarea ipotezelor privind legea de distribuţie a unei populaţii

Demersul testării statistice

1. Formularea ipotezelor statistice


O ipoteză este o presupunere cu privire la valoarea unui parametru, legea de
distribuţie a variabilei studiate etc.
Ipoteza nulă H0 : se presupune egalitatea unui parametru cu o valoare fixă sau se face o
presupunere cu privire la legea de repartiţie a unei variabile.
Ipoteza alternativă H1: este opusul ipotezei nule.

2. Alegerea testului statistic

3. Alegerea pragului de semnificaţie α al testului şi citirea valorii critice din tabelul


repartiţiei statisticii test
- riscul (pragul de semnificaţie) α reprezintă probabilitatea de a respinge ipoteza nulă,
atunci când aceasta este adevărată.

4. Calculul valorii statisticii test, folosind datele observate la nivelul eşantionului.

5. Regiunea de respingere/acceptare a ipotezei nule

Regiunea de respingere – intervalul dintr-o distribuţie de probabilitate în care se respinge


ipoteza nulă, acest interval este acoperit de probabilitatea α
Regiunea de acceptare (interval de încredere) – intervalul în care nu se respinge ipoteza nulă
şi este acoperit de probabilitatea 1- α

Regiunea critica pentru:


a) test bilateral
b) test unilateral dreapta
c) test unilateral stanga
1
Aplicarea regulii de decizie folosind valoarea calculata si valoarea teoretica
a testului

2
Aplicarea regulii de decizie folosind p-value (Sig.) si α

3
Ca principiu, testarea statistica vizeaza verificarea unor presupuneri pe care
le facem cu privire la comportamentul populatiilor. Astfel:

 Mai intai, se presupune, prin reducere la absurd, ca ipoteza H0 este


adevarata.
 Apoi, folosind un instrument de analiza (testul statistic potrivit pentru
ipoteza H0), vedem ce dovezi in sprijinul ipotezei H0 aduc datele pe care
le avem la nivel de esantion (valoarea calculata a testului).
 Apoi verificam daca aceste dovezi inclina spre a confirma sau a infirma, cu
o anumita probabilitate, ipoteza H0 (prin compararea valorii calculate a
testului cu valoarea teoretica a testului)
 Daca datele de la nivelul esantionului produc suficiente dovezi pentru a
sustine afirmatia de la H0 (valoarea calculata a testului este mai mica decat
valoarea teoretica a testului), garantam, cu probabilitatea 1- α, ca ipoteza
H0 nu poate fi respinsa ca fiind falsa.
 In caz contrar (valoarea calculata a testului este mai mare decat valoarea
teoretica a testului), afirmam, cu un risc asumat α, ca ipoteza H0 este
respinsa.

4
Testarea ipotezelor asupra mediei unei populaţii

c) Alegerea pragului de semnificaţie şi citirea din tabel a valorii critice a statisticii test

d). Calculul valorii statisticii test pe baza datelor eşantionului

x  0 x  0
zcalculat  t calculat 
/ n s' / n

5
Testarea ipotezelor asupra proporţiei

Demersul testării:
a) Formularea ipotezelor statistice

H0 :    0

H1 :    0

b) Alegerea pragului de semnificaţie

c) Testul statistic

p 0
tcalculat 
p (1  p ) / n

c) Regula de decizie

d) Decizie si interpretare

Testarea ipotezelor privind două eşantioane (cazul eşantioanelor


independente)

În cazul eşantioanelor independente, statistica test folosită în testarea ipotezelor statistice este
statistica Z sau t.

Ipoteze statistice

H 0 : 1   2  0

H1 : 1   2  0

Statistica test:
- daca se cunoaste σ12 si σ22, se foloseste testul Z

x1  x2  '12 (n1  1)   '22 (n2  1)


z calculat   'p 
1 1 n1  n2  2
 ' p 
n1 n2

- daca nu se cunoaste σ12 si σ22, se foloseste testul t

x1  x 2
t calculat  s' 12 ( n1  1 )  s' 22 ( n2  1 )
1 1 s' p 
s' p  n1  n 2  2
n1 n 2 6
e) Regula de decizie

f) Decizie si interpretare

Testarea egalităţii a trei sau mai multe medii (ANOVA


unifactoriala)

Obiectiv
- procedeu de analiză a variaţiei în funcţie de sursa acesteia
- permite compararea mediilor a 3 sau mai multe grupe sau populaţii cu scopul de a
verifica dacă există diferenţe semnificative între acestea

Se bazează pe descompunerea variaţiei totale (VT sau TSS) pe componente:


- variaţia explicată (variaţia sub influenţa factorului de grupare): VE sau ESS
- variaţia reziduală (variaţia sub influenţa factorilor întâmplători ): VR sau RSS

VT  VE  VR

TSS  ESS  RSS

1. Ipoteze statistice:

H 0 : 1   2     k

H1 : mediile a cel putin doua populatii sunt diferite

Notatie: k reprezinta numarul grupurilor comparate

2. Se alege statistica test Fisher

3. Se alege pragul de semnificaţie şi se citeşte valoarea critică a testul F din tabelul


repartiţiei Fisher, pentru riscul α admis, şi v1 = k-1 si v2 = n-k grade de libertate,

4. Valoarea statisticii F se calculează astfel:

ESS n  k
Fcalculat  
RSS k  1

7
5. Regula de decizie

6. Decizia si interpretarea

8
APLICATII

1. Din totalul autoturismelor vandute intr-un an de o firma a fost extras un esantion de 1000
de autoturisme pentru care a fost inregistrat pretul (mii euro). Datele cunoscute sunt:
x  28,   4. Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente
semnificative intre pretul mediu al lotului de autoturisme vandute in anul curent si pretul
mediu inregistrat anul trecut, de 30 mii euro.

9
10
2. Din totalul autoturismelor vandute intr-un an de o firma a fost extras un esantion de 1000
de autoturisme pentru care a fost inregistrat pretul (mii euro). Datele cunoscute sunt:
x  28, s '  4. Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente
semnificative intre pretul mediu al lotului de autoturisme vandute in anul curent si pretul
mediu inregistrat anul trecut, de 30 mii euro.

11
3. Din totalul autovehiculelor vandute intr-un an de o firma a fost extras un esantion de 150
autovehicule pentru care a fost inregistrat tipul acestora (autoturism sau motocicleta). La
nivelul eşantionului s-au inregistrat 30 de motociclete vândute. Pentru un risc asumat de 5%,
se cere sa se testeze daca exista diferente semnificative intre ponderea autoturismelor vandute
de firma si ponderea autoturismelor vandute de principalul competitor, de 75%.

12
13
4. Pentru o cercetare prin sondaj asupra opiniei consumatorilor unui produs se cunoaşte că
media de vârstă a consumatorilor din eşantion este de 38 de ani. Pentru un risc asumat de 5%
şi o valoare Sig. de 0,008 se cere să se verifice dacă există diferenţe semnificative de vârstă
intre consumatorii produsului si o valoare stabilită prin strategia de marketing, de 40 de ani.

14
Tema

1. Din totalul localitatilor României se extrage aleator repetat un eşantion de 50 localitati,


care au fost observate după castigul salarial net. La nivelul eşantionului s-a obţinut xi=100,
  xi  x   8 . Se cere sa se verifice daca exista diferente semnificative intre castigul
2

salarial mediu al Romaniei si castigul salarial mediu al U.E., de 5 u.m.

2. Din totalul salariaţilor unei firme se extrage un eşantion de 23 de persoane. Salariaţii sunt
observaţi după educaţie (ani) si, pe baza datelor de eşantion, se obtine o valoare calculata a
testului de 10,58. Pentru un risc asumat de 5% se cere să se verifice dacă există diferenţe
semnificative de educaţie între firmă şi principalul concurent, cu un nivel medie de 13 ani de
şcoală.

15
Testarea diferentei dintre doua medii

1. Pentru două eşantioane extrase din două populaţii cu varianţe egale, se cunosc n1=n2=100,
x1  42, x 2  37, s1'  4, s 2'  7. Pentru un risc asumat de 5%, se cere să se verifice dacă există diferenţe
semnificative între mediile celor două populaţii.

Interpretare: Pentru un risc asumat de 5%, exista diferente semnificative intre cele doua medii ale populatiilor.

16
2. Din totalul angajatilor unei firme am extras un esantion de angajati observati dupa vechimea in munca (luni)
si sexul angajatului (M, F). Datele obţinute la nivelul eşantioanelor sunt: nM=50, nF=100,
xF  70, xM  30,  F  4, M  4. Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente
semnificative intre vechimea medie a angajatilor de sex ma sculin si vechimea medie a angajatilor de sex
feminin.

Interpretare: Pentru un risc asumat de 5%, exista diferente semnificative de vechime intre barbati si femei.

17
18
ANOVA

1. Un eşantion de 50 de consumatori de băuturi răcoritoare ale firmei Coca-Cola a fost observat după au
consumul înregistrat într-o lună. În urma observării a rezultat, pentru cele 5 mărci de băuturi răcoritoare, că ESS
= 5400 şi RSS = 1200. Considerând un risc de 5%, să se verifice dacă marca băuturii răcoritoare influenţează
semnificativ consumul.

n = 50
ESS = 5400
RSS = 1200
α = 0.05
k=5

1. Formularea ipotezelor
H0: μ1 = μ2 = ... = μ5 (Nu exista diferente semnificative intre mediile de consum pentru cele 5 marci, sau marca
nu influenteaza semnificativ consumul)

H1: Cel putin doua medii sunt diferite (exista diferente semnificative intre mediile de consum pentru cele 5
marci, sau marca influenteaza semnificativ consumul)

2. Alegerea testului: F

3. Valoarea teoretica a testului

Fteoretic = Fα, k-1, n-k= F0.05,4,45 = 2,606

4. Valoarea calculata a testului

ESS n  k 5400 45
Fcalculat      50.62
RSS k  1 1200 4

5. Luarea deciziei

Fcalculat = 50.62 > Fteoretic = 2.606 : Se respinge H0

6. Interpretare

Pentru un risc asumat de 5%, exista diferente semnificative de consum in functie de marca, adica marca
influenteaza semnificativ consumul.

19
2. Din totalul angajatilor unei firme am extras un esantion de angajati observati dupa vechimea in munca (luni)
si pozitia ierarhica ocupata (functionar, middle management, top management). Datele sunt prezentate in tabelul
de mai jos. Pentru un risc asumat de 5%, se cere sa se testeze daca vechimea este influentata de pozitia ierarhica
(daca exista diferente semnificative de vechime in functie de pozitia ierarhica ocupata in firma).

ANOVA

Months since Hire


Grade de Estimatori ai
Variatia libertate variantei F Sig.
Intergrupe 6,227 2 3,114 ,031 ,970
Intragrupe 47872,068 471 101,639
Total 47878,295 473

ANOVA

Months since Hire


Sum of
Squares df Mean Square F Sig.
Between Groups 6,227 2 3,114 ,031 ,970
Within Groups 47872,068 471 101,639
Total 47878,295 473

k-1 = 2, deci k = 3

n-k = 471

n – 1 = 473, deci n = 474

ESS = 6.227
RSS = 47872.068

Fcalculat = 0.031
α = 0.05

1. Formularea ipotezelor
H0: μ1 = μ2 = μ3 (Nu exista diferente semnificative de vechime in functie de pozitia ierarhica ocupata in firma,
sau vechimea nu este influentata de pozitia ierarhica)

H1: Cel putin doua medii sunt diferite (Exista diferente semnificative de vechime in functie de pozitia ierarhica
ocupata in firma, sau vechimea este influentata de pozitia ierarhica)

2. Alegerea testului: F

3. Valoarea teoretica a testului

Fteoretic = Fα, k-1, n-k= F0.05,2,471 = 2,996

4. Valoarea calculata a testului

ESS n  k 6.227 471


Fcalculat      0.031
RSS k  1 47872.068 2

5. Luarea deciziei

20
Fcalculat = 0.031 < Fteoretic = 2.996 : Se accepta H0

Sig = 0.97 < α = 0.05: se accepta H0

6. Interpretare

Pentru o probabilitate de 95%, garantam ca nu exista diferente semnificative de vechime in functie de pozitia
ierarhica ocupata in firma, adica vechimea nu este influentata de pozitia ierarhica.

21

S-ar putea să vă placă și