Statistica Aplicata - Curs 4

STATISTICĂ APLICATĂ – curs 4
Testarea ipotezelor statistice
În multe cazuri decizia se prezintă sub forma unor alternative, însoţite de formularea unor
ipoteze.
Ipoteza nulă, H0, este afirmaţia referitoare la valoarea cea mai nefavorabilă, faţă de valoarea
reală a parametrului.
Ipoteza alternativă, H1, este afirmaţia conform căreia parametrul ia alte valori decât cea
specificată de H0.
Un test statistic, numit şi test de semnificaţie, este format din două ipoteze H0 şi H1. Ipoteza nulă
este considerată întotdeauna adevărată.
Testarea ipotezelor sau testul statistic este evaluarea statistică a deciziei de respingere a ipotezei
nule.
Testele statistice pot fi:
 Univariate
o Bilaterale
o Unilaterale
o Pentru o caracteristică alternativă
 Bivariate
Teste statistice univariate
Etapele testului statistic sunt următoarele:
 Formularea ipotezelor H0 şi H1;

 Alegerea pragului de semnificaţie α;
 Stabilirea repartiţiei pentru testarea ipotezelor şi definirea regiunilor critice;
 Stabilirea regulii de decizie şi efectuarea calculelor.
Putem avea una din următoarele variante ale ipotezelor statistice:
𝑥0 = 𝑎, pentru test bilateral şi unilateral;

𝐻0 : ̅̅̅
𝐻1 : ̅̅̅
𝑥0 ≠ 𝑎, pentru test bilateral;
𝐻1 : ̅̅̅
𝑥0 < 𝑎, pentru test unilateral la stânga;
𝐻1 : ̅̅̅
𝑥0 > 𝑎, pentru test unilateral la dreapta.
𝑥̅ −𝑎 𝑥̅ −𝑎
Se va calcula raportul critic: 𝑅𝐶 = = 2
𝜇𝑥
√𝜎
𝑛
Testul bilateral
Pentru un eşantion cu dimensiunea mai mare sau egală cu 30 vom folosi distribuţia Normală.
Pentru un eşantion cu dimensiunea mai mic decât 30 vom folosi distribuţia Student.
Dacă RC este în intervalul [−𝑧𝛼 , 𝑧𝛼 ] atunci se acceptă ipoteza nulă. În caz contrar se va respinge
2 2
ipoteza nulă.
Testul unilateral la stânga
Dacă RC este mai mare ca −𝑧𝛼 atunci acceptăm ipoteza nulă.
Testul unilateral la dreapta
Dacă RC este mai mic decât 𝑧𝛼 atunci acceptăm ipoteza nulă.
Teste univariate pentru caracteristica alternativă
𝐻0 : 𝑝 = 𝑎, pentru test bilateral şi unilateral;
𝐻1 : 𝑝 ≠ 𝑎, pentru test bilateral;
𝐻1 : 𝑝 < 𝑎, pentru test unilateral la stânga;
𝐻1 : 𝑝 > 𝑎, pentru test unilateral la dreapta.

𝑤−𝑎 𝑤−𝑎
Se va calcula raportul critic: 𝑅𝐶 = =
𝜇𝑤 𝑤(1−𝑤)
√
𝑛
Teste statistice bivariate
Aceste teste caracterizează relaţiile dintre două eşantioane sau două grupe ale unui acelaşi
eşantion şi pot fi de independenţă sau de dependenţă.
Aplicaţie: Dispunem de datele privind un eşantion de 40 de salariaţi, provenit dintr-o populaţie
de 7000 de angajaţi ai firmei „X”, ce are sedii în Braşov (B), Cluj (C) şi Iaşi (I). Cunoaştem
salariul lunar exprimat în mii lei, vechimea exprimată în ani, genul şi studiile (S – studii
superioare, C – muncitori calificaţi, N – muncitori necalificaţi, T – tehnicieni):
Oraşul Salariul lunar Vechimea Genul Studiile

B 3.8 2 F C
C 3.75 1 F T
C 2.5 3 F S
C 2.46 5 F S
C 2.35 4 M C
I 3.8 5 M S
B 2.9 12 M N
C 3 10 F N
B 3.15 11 F C
B 3.05 16 F C
B 3.5 18 M C
C 3.65 24 M C
C 3.3 19 M C
I 2.3 25 M C
B 1.52 26 M C
B 3 26 M C
I 2.95 2 M T
C 2.28 4 M T
C 1.45 7 F S
I 1.75 8 F S
C 2.9 9 F N
B 2.46 4 F S
B 1.85 5 M S
C 1.9 1 M S
I 2.62 2 M N
C 2 1 M N
B 2.15 1 M N
B 2.4 1 M S
B 2.31 12 F C
C 2.38 2 F S
B 2.56 16 M T
B 3.12 2 F T
B 2.3 5 F S
C 2.12 18 F S
I 1.45 25 M S
C 2.65 24 M C
I 2.6 21 M T
C 2.7 4 F T
C 2.56 7 F T
C 2.8 7 M C
Pentru un prag de semnificaţie α = 0,05 (95% încredere) testaţi dacă există diferenţe între salariul
angajaţilor pe regiuni, gen şi studii.
Soluţie:
Pentru rezolvarea acestei probleme vom efectua calculele folosind Excel.
Pentru început vom rezuma datele:
Feminin Masculin
1.45 1.45
1.75 1.52
2.12 1.85
2.3 1.9
2.31 2
2.38 2.15
2.46 2.28
2.5 2.3
2.56 2.35
2.7 2.4
2.9 2.56
3 2.6
3.05 2.62
3.12 2.65
3.15 2.8
3.75 2.9
3.8 2.95
3
3.3
3.5
3.65
3.8
Brasov Cluj Iaşi
1.52 1.45 1.45
1.85 1.9 1.75
2.15 2 2.3
2.3 2.12 2.6
2.31 2.28 2.62
2.4 2.35 2.95
2.46 2.38 3.8
2.56 2.46
2.9 2.5
3 2.56
3.05 2.65
3.12 2.7
3.15 2.8
3.5 2.9
3.8 3
3.3
3.65
3.75
Muncitori calificaţi Muncitori necalificaţi Studii superioare Tehnicieni

1.52 2 1.45 2.28
2.3 2.15 1.75 2.56
2.31 2.62 1.85 2.6
2.35 2.9 1.9 2.7
2.65 3 2.12 2.95
2.8 2.3 3.12
3 2.38 3.75
3.05 2.4
3.15 2.46
3.3 2.5
3.5 3.8
3.65
3.8
Pentru testarea ipotezelor privind discriminarea de gen a salaraţilor vom folosi un test bivariat a
cărui ipoteze sunt următoarele:
𝐻0 : ̅̅̅̅ 𝑥02 în medie salariul femeilor este egal cu cel al bărbaţilor

𝑥01 = ̅̅̅̅,
𝐻0 : ̅̅̅̅ 𝑥02 în medie salariul femeilor nu este egal cu cel al bărbaţilor
𝑥01 ≠ ̅̅̅̅,
În Excel urmăm paşii: Data – Data Analysis – t-Test Two Sample Assuming Unequal Variances
– la Variable 1 selectăm un gen, la Variable 2 selectăm celălalt gen – bifăm Labels – ok.
Obţinem:
t-Test: Two-Sample Assuming Unequal Variances
feminin masculin
Mean 2.664705882 2.569545455
Variance 0.390988971 0.411328355
Observations 17 22
Hypothesized Mean Difference 0
Df 35
t Stat 0.466024443
P(T<=t) one-tail 0.322042688
t Critical one-tail 1.68957244
P(T<=t) two-tail 0.644085375
t Critical two-tail 2.030107915
Dacă valoarea lui t_stat este mai mic decât – t_critic sau t_stat este mai mare decât t_critic atunci
respingem ipoteza nulă. În acest caz valoarea lui t_stat = 0,466 şi valoarea t_critic = 2,030. Se
poate observa că 0,466 este în intervalul (– 2,030; 2,030) şi deci acceptăm ipoteza nulă. Aşadar
nu există o diferenţă suficient de mare între mediile salariului pentru cele două eşantioane 2,664
şi 2,569. Nu avem suficiente dovezi pentru a spune că în cadrul acelei companii se manifestă
discriminarea de gen în privinţa salariilor.
Procedura ANOVA
În cazul în care vrem să testăm ipotezele privind diferenţa a trei sau mai multe eşantioane vom
folosi procedura ANOVA.
Ipotezele pentru testarea diferenţei mediilor pentru cele 3 oraşe:
𝐻0 : ̅̅̅̅
𝑥01 = ̅̅̅̅ 𝑥03 în medie salariul angajaţilor din cele 3 oraşe este acelaşi
𝑥02 = ̅̅̅̅,
𝐻0 : 𝑛𝑢 𝑡𝑜𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑖𝑙𝑒 𝑒𝑔𝑎𝑙𝑒, în medie salariul angajaţilor din cele 3 oraşe nu este acelaşi
În Excel urmăm paşii: Data – Data Analysis – Aniva Single Factor – la Input range vom selecta
toate variabilele pe care le analizăm – bifăm Labels in first row – ok. Obţinem următorul output
pentru testarea diferenţei salariului în funcţie de oraş:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Brasov 15 40.07 2.671333333 0.383269524
Cluj 18 46.75 2.597222222 0.344985948
Iasi 7 17.47 2.495714286 0.603628571
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.150491627 2 0.075245813 0.187452044 0.829851319 3.251923846
Within Groups 14.85230587 37 0.401413672
Total 15.0027975 39
Dacă F este mai mare decât F_critic respingem ipoteza nulă. În caz contrar o vom accepta.
În acest exemplu, 0,187 mai mic decât 3,25 deci acceptăm ipoteza nulă, mediile sunt egale.
Obţinem următorul output pentru testarea diferenţei salariului în funcţie de nivelul studiilor:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
muncitori calificati 13 37.38 2.875384615 0.413926923
muncitori necalificati 5 12.67 2.534 0.19778
studii superioare 11 24.91 2.264545455 0.373807273
Tehnicieni 7 19.96 2.851428571 0.231147619
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 2.639598482 3 0.879866161 2.587080381 0.070188963 2.901119588
Within Groups 10.88320152 32 0.340100047
Total 13.5228 35
F = 2,587 este mai mic dcât F_critic = 2,901 şi deci acceptăm ipoteza nulă. În medie salariul
angajaţilor nu diferă în funcţie de studii.
Bibliografie
Liliana Duguleană, Bazele statisticii economice, Editura CH Beck, 2012
Emilia Ţiţan, Statistică. Teorie. Aplicaţii în sectorul terţiar, Editura Meteor Press
http://www.excel-easy.com/data-analysis.html
https://onlinecourses.science.psu.edu/stat200/node/225

Statistica Aplicata - Curs 4

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Statistica Aplicata - Curs 4

Încărcat de

Drepturi de autor:

Formate disponibile

STATISTICĂ APLICATĂ – curs 4

Testarea ipotezelor statistice

Testele statistice pot fi:

Teste statistice univariate

Etapele testului statistic sunt următoarele:

 Formularea ipotezelor H0 şi H1;

Putem avea una din următoarele variante ale ipotezelor statistice:

𝑥0 = 𝑎, pentru test bilateral şi unilateral;

Testul unilateral la stânga

Dacă RC este mai mare ca −𝑧𝛼 atunci acceptăm ipoteza nulă.

Testul unilateral la dreapta

Dacă RC este mai mic decât 𝑧𝛼 atunci acceptăm ipoteza nulă.

Teste univariate pentru caracteristica alternativă

𝐻0 : 𝑝 = 𝑎, pentru test bilateral şi unilateral;

𝐻1 : 𝑝 ≠ 𝑎, pentru test bilateral;

𝐻1 : 𝑝 < 𝑎, pentru test unilateral la stânga;

𝐻1 : 𝑝 > 𝑎, pentru test unilateral la dreapta.

Teste statistice bivariate

Oraşul Salariul lunar Vechimea Genul Studiile

Pentru rezolvarea acestei probleme vom efectua calculele folosind Excel.

Pentru început vom rezuma datele:

Muncitori calificaţi Muncitori necalificaţi Studii superioare Tehnicieni

𝐻0 : ̅̅̅̅ 𝑥02 în medie salariul femeilor este egal cu cel al bărbaţilor

t-Test: Two-Sample Assuming Unequal Variances

Ipotezele pentru testarea diferenţei mediilor pentru cele 3 oraşe:

Anova: Single Factor

Liliana Duguleană, Bazele statisticii economice, Editura CH Beck, 2012

S-ar putea să vă placă și