Sunteți pe pagina 1din 8

STATISTICĂ APLICATĂ – curs 4

Testarea ipotezelor statistice

În multe cazuri decizia se prezintă sub forma unor alternative, însoţite de formularea unor
ipoteze.

Ipoteza nulă, H0, este afirmaţia referitoare la valoarea cea mai nefavorabilă, faţă de valoarea
reală a parametrului.

Ipoteza alternativă, H1, este afirmaţia conform căreia parametrul ia alte valori decât cea
specificată de H0.

Un test statistic, numit şi test de semnificaţie, este format din două ipoteze H0 şi H1. Ipoteza nulă
este considerată întotdeauna adevărată.

Testarea ipotezelor sau testul statistic este evaluarea statistică a deciziei de respingere a ipotezei
nule.

Testele statistice pot fi:

 Univariate
o Bilaterale
o Unilaterale
o Pentru o caracteristică alternativă
 Bivariate

Teste statistice univariate

Etapele testului statistic sunt următoarele:

 Formularea ipotezelor H0 şi H1;


 Alegerea pragului de semnificaţie α;
 Stabilirea repartiţiei pentru testarea ipotezelor şi definirea regiunilor critice;
 Stabilirea regulii de decizie şi efectuarea calculelor.

Putem avea una din următoarele variante ale ipotezelor statistice:

𝑥0 = 𝑎, pentru test bilateral şi unilateral;


𝐻0 : ̅̅̅

𝐻1 : ̅̅̅
𝑥0 ≠ 𝑎, pentru test bilateral;
𝐻1 : ̅̅̅
𝑥0 < 𝑎, pentru test unilateral la stânga;

𝐻1 : ̅̅̅
𝑥0 > 𝑎, pentru test unilateral la dreapta.
𝑥̅ −𝑎 𝑥̅ −𝑎
Se va calcula raportul critic: 𝑅𝐶 = = 2
𝜇𝑥
√𝜎
𝑛

Testul bilateral

Pentru un eşantion cu dimensiunea mai mare sau egală cu 30 vom folosi distribuţia Normală.

Pentru un eşantion cu dimensiunea mai mic decât 30 vom folosi distribuţia Student.

Dacă RC este în intervalul [−𝑧𝛼 , 𝑧𝛼 ] atunci se acceptă ipoteza nulă. În caz contrar se va respinge
2 2
ipoteza nulă.

Testul unilateral la stânga

Dacă RC este mai mare ca −𝑧𝛼 atunci acceptăm ipoteza nulă.

Testul unilateral la dreapta

Dacă RC este mai mic decât 𝑧𝛼 atunci acceptăm ipoteza nulă.

Teste univariate pentru caracteristica alternativă

𝐻0 : 𝑝 = 𝑎, pentru test bilateral şi unilateral;

𝐻1 : 𝑝 ≠ 𝑎, pentru test bilateral;

𝐻1 : 𝑝 < 𝑎, pentru test unilateral la stânga;

𝐻1 : 𝑝 > 𝑎, pentru test unilateral la dreapta.


𝑤−𝑎 𝑤−𝑎
Se va calcula raportul critic: 𝑅𝐶 = =
𝜇𝑤 𝑤(1−𝑤)

𝑛

Teste statistice bivariate

Aceste teste caracterizează relaţiile dintre două eşantioane sau două grupe ale unui acelaşi
eşantion şi pot fi de independenţă sau de dependenţă.
Aplicaţie: Dispunem de datele privind un eşantion de 40 de salariaţi, provenit dintr-o populaţie
de 7000 de angajaţi ai firmei „X”, ce are sedii în Braşov (B), Cluj (C) şi Iaşi (I). Cunoaştem
salariul lunar exprimat în mii lei, vechimea exprimată în ani, genul şi studiile (S – studii
superioare, C – muncitori calificaţi, N – muncitori necalificaţi, T – tehnicieni):

Oraşul Salariul lunar Vechimea Genul Studiile


B 3.8 2 F C
C 3.75 1 F T
C 2.5 3 F S
C 2.46 5 F S
C 2.35 4 M C
I 3.8 5 M S
B 2.9 12 M N
C 3 10 F N
B 3.15 11 F C
B 3.05 16 F C
B 3.5 18 M C
C 3.65 24 M C
C 3.3 19 M C
I 2.3 25 M C
B 1.52 26 M C
B 3 26 M C
I 2.95 2 M T
C 2.28 4 M T
C 1.45 7 F S
I 1.75 8 F S
C 2.9 9 F N
B 2.46 4 F S
B 1.85 5 M S
C 1.9 1 M S
I 2.62 2 M N
C 2 1 M N
B 2.15 1 M N
B 2.4 1 M S
B 2.31 12 F C
C 2.38 2 F S
B 2.56 16 M T
B 3.12 2 F T
B 2.3 5 F S
C 2.12 18 F S
I 1.45 25 M S
C 2.65 24 M C
I 2.6 21 M T
C 2.7 4 F T
C 2.56 7 F T
C 2.8 7 M C

Pentru un prag de semnificaţie α = 0,05 (95% încredere) testaţi dacă există diferenţe între salariul
angajaţilor pe regiuni, gen şi studii.

Soluţie:

Pentru rezolvarea acestei probleme vom efectua calculele folosind Excel.

Pentru început vom rezuma datele:

Feminin Masculin
1.45 1.45
1.75 1.52
2.12 1.85
2.3 1.9
2.31 2
2.38 2.15
2.46 2.28
2.5 2.3
2.56 2.35
2.7 2.4
2.9 2.56
3 2.6
3.05 2.62
3.12 2.65
3.15 2.8
3.75 2.9
3.8 2.95
3
3.3
3.5
3.65
3.8
Brasov Cluj Iaşi
1.52 1.45 1.45
1.85 1.9 1.75
2.15 2 2.3
2.3 2.12 2.6
2.31 2.28 2.62
2.4 2.35 2.95
2.46 2.38 3.8
2.56 2.46
2.9 2.5
3 2.56
3.05 2.65
3.12 2.7
3.15 2.8
3.5 2.9
3.8 3
3.3
3.65
3.75

Muncitori calificaţi Muncitori necalificaţi Studii superioare Tehnicieni


1.52 2 1.45 2.28
2.3 2.15 1.75 2.56
2.31 2.62 1.85 2.6
2.35 2.9 1.9 2.7
2.65 3 2.12 2.95
2.8 2.3 3.12
3 2.38 3.75
3.05 2.4
3.15 2.46
3.3 2.5
3.5 3.8
3.65
3.8

Pentru testarea ipotezelor privind discriminarea de gen a salaraţilor vom folosi un test bivariat a
cărui ipoteze sunt următoarele:

𝐻0 : ̅̅̅̅ 𝑥02 în medie salariul femeilor este egal cu cel al bărbaţilor


𝑥01 = ̅̅̅̅,
𝐻0 : ̅̅̅̅ 𝑥02 în medie salariul femeilor nu este egal cu cel al bărbaţilor
𝑥01 ≠ ̅̅̅̅,

În Excel urmăm paşii: Data – Data Analysis – t-Test Two Sample Assuming Unequal Variances
– la Variable 1 selectăm un gen, la Variable 2 selectăm celălalt gen – bifăm Labels – ok.
Obţinem:

t-Test: Two-Sample Assuming Unequal Variances

feminin masculin
Mean 2.664705882 2.569545455
Variance 0.390988971 0.411328355
Observations 17 22
Hypothesized Mean Difference 0
Df 35
t Stat 0.466024443
P(T<=t) one-tail 0.322042688
t Critical one-tail 1.68957244
P(T<=t) two-tail 0.644085375
t Critical two-tail 2.030107915

Dacă valoarea lui t_stat este mai mic decât – t_critic sau t_stat este mai mare decât t_critic atunci
respingem ipoteza nulă. În acest caz valoarea lui t_stat = 0,466 şi valoarea t_critic = 2,030. Se
poate observa că 0,466 este în intervalul (– 2,030; 2,030) şi deci acceptăm ipoteza nulă. Aşadar
nu există o diferenţă suficient de mare între mediile salariului pentru cele două eşantioane 2,664
şi 2,569. Nu avem suficiente dovezi pentru a spune că în cadrul acelei companii se manifestă
discriminarea de gen în privinţa salariilor.

Procedura ANOVA

În cazul în care vrem să testăm ipotezele privind diferenţa a trei sau mai multe eşantioane vom
folosi procedura ANOVA.

Ipotezele pentru testarea diferenţei mediilor pentru cele 3 oraşe:

𝐻0 : ̅̅̅̅
𝑥01 = ̅̅̅̅ 𝑥03 în medie salariul angajaţilor din cele 3 oraşe este acelaşi
𝑥02 = ̅̅̅̅,

𝐻0 : 𝑛𝑢 𝑡𝑜𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑖𝑙𝑒 𝑒𝑔𝑎𝑙𝑒, în medie salariul angajaţilor din cele 3 oraşe nu este acelaşi

În Excel urmăm paşii: Data – Data Analysis – Aniva Single Factor – la Input range vom selecta
toate variabilele pe care le analizăm – bifăm Labels in first row – ok. Obţinem următorul output
pentru testarea diferenţei salariului în funcţie de oraş:
Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
Brasov 15 40.07 2.671333333 0.383269524
Cluj 18 46.75 2.597222222 0.344985948
Iasi 7 17.47 2.495714286 0.603628571

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.150491627 2 0.075245813 0.187452044 0.829851319 3.251923846
Within Groups 14.85230587 37 0.401413672

Total 15.0027975 39

Dacă F este mai mare decât F_critic respingem ipoteza nulă. În caz contrar o vom accepta.

În acest exemplu, 0,187 mai mic decât 3,25 deci acceptăm ipoteza nulă, mediile sunt egale.

Obţinem următorul output pentru testarea diferenţei salariului în funcţie de nivelul studiilor:

Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
muncitori calificati 13 37.38 2.875384615 0.413926923
muncitori necalificati 5 12.67 2.534 0.19778
studii superioare 11 24.91 2.264545455 0.373807273
Tehnicieni 7 19.96 2.851428571 0.231147619

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 2.639598482 3 0.879866161 2.587080381 0.070188963 2.901119588
Within Groups 10.88320152 32 0.340100047

Total 13.5228 35

F = 2,587 este mai mic dcât F_critic = 2,901 şi deci acceptăm ipoteza nulă. În medie salariul
angajaţilor nu diferă în funcţie de studii.
Bibliografie

Liliana Duguleană, Bazele statisticii economice, Editura CH Beck, 2012

Emilia Ţiţan, Statistică. Teorie. Aplicaţii în sectorul terţiar, Editura Meteor Press

http://www.excel-easy.com/data-analysis.html

https://onlinecourses.science.psu.edu/stat200/node/225

S-ar putea să vă placă și