Documente Academic
Documente Profesional
Documente Cultură
În multe cazuri decizia se prezintă sub forma unor alternative, însoţite de formularea unor
ipoteze.
Ipoteza nulă, H0, este afirmaţia referitoare la valoarea cea mai nefavorabilă, faţă de valoarea
reală a parametrului.
Ipoteza alternativă, H1, este afirmaţia conform căreia parametrul ia alte valori decât cea
specificată de H0.
Un test statistic, numit şi test de semnificaţie, este format din două ipoteze H0 şi H1. Ipoteza nulă
este considerată întotdeauna adevărată.
Testarea ipotezelor sau testul statistic este evaluarea statistică a deciziei de respingere a ipotezei
nule.
Univariate
o Bilaterale
o Unilaterale
o Pentru o caracteristică alternativă
Bivariate
𝐻1 : ̅̅̅
𝑥0 ≠ 𝑎, pentru test bilateral;
𝐻1 : ̅̅̅
𝑥0 < 𝑎, pentru test unilateral la stânga;
𝐻1 : ̅̅̅
𝑥0 > 𝑎, pentru test unilateral la dreapta.
𝑥̅ −𝑎 𝑥̅ −𝑎
Se va calcula raportul critic: 𝑅𝐶 = = 2
𝜇𝑥
√𝜎
𝑛
Testul bilateral
Pentru un eşantion cu dimensiunea mai mare sau egală cu 30 vom folosi distribuţia Normală.
Pentru un eşantion cu dimensiunea mai mic decât 30 vom folosi distribuţia Student.
Dacă RC este în intervalul [−𝑧𝛼 , 𝑧𝛼 ] atunci se acceptă ipoteza nulă. În caz contrar se va respinge
2 2
ipoteza nulă.
Aceste teste caracterizează relaţiile dintre două eşantioane sau două grupe ale unui acelaşi
eşantion şi pot fi de independenţă sau de dependenţă.
Aplicaţie: Dispunem de datele privind un eşantion de 40 de salariaţi, provenit dintr-o populaţie
de 7000 de angajaţi ai firmei „X”, ce are sedii în Braşov (B), Cluj (C) şi Iaşi (I). Cunoaştem
salariul lunar exprimat în mii lei, vechimea exprimată în ani, genul şi studiile (S – studii
superioare, C – muncitori calificaţi, N – muncitori necalificaţi, T – tehnicieni):
Pentru un prag de semnificaţie α = 0,05 (95% încredere) testaţi dacă există diferenţe între salariul
angajaţilor pe regiuni, gen şi studii.
Soluţie:
Feminin Masculin
1.45 1.45
1.75 1.52
2.12 1.85
2.3 1.9
2.31 2
2.38 2.15
2.46 2.28
2.5 2.3
2.56 2.35
2.7 2.4
2.9 2.56
3 2.6
3.05 2.62
3.12 2.65
3.15 2.8
3.75 2.9
3.8 2.95
3
3.3
3.5
3.65
3.8
Brasov Cluj Iaşi
1.52 1.45 1.45
1.85 1.9 1.75
2.15 2 2.3
2.3 2.12 2.6
2.31 2.28 2.62
2.4 2.35 2.95
2.46 2.38 3.8
2.56 2.46
2.9 2.5
3 2.56
3.05 2.65
3.12 2.7
3.15 2.8
3.5 2.9
3.8 3
3.3
3.65
3.75
Pentru testarea ipotezelor privind discriminarea de gen a salaraţilor vom folosi un test bivariat a
cărui ipoteze sunt următoarele:
În Excel urmăm paşii: Data – Data Analysis – t-Test Two Sample Assuming Unequal Variances
– la Variable 1 selectăm un gen, la Variable 2 selectăm celălalt gen – bifăm Labels – ok.
Obţinem:
feminin masculin
Mean 2.664705882 2.569545455
Variance 0.390988971 0.411328355
Observations 17 22
Hypothesized Mean Difference 0
Df 35
t Stat 0.466024443
P(T<=t) one-tail 0.322042688
t Critical one-tail 1.68957244
P(T<=t) two-tail 0.644085375
t Critical two-tail 2.030107915
Dacă valoarea lui t_stat este mai mic decât – t_critic sau t_stat este mai mare decât t_critic atunci
respingem ipoteza nulă. În acest caz valoarea lui t_stat = 0,466 şi valoarea t_critic = 2,030. Se
poate observa că 0,466 este în intervalul (– 2,030; 2,030) şi deci acceptăm ipoteza nulă. Aşadar
nu există o diferenţă suficient de mare între mediile salariului pentru cele două eşantioane 2,664
şi 2,569. Nu avem suficiente dovezi pentru a spune că în cadrul acelei companii se manifestă
discriminarea de gen în privinţa salariilor.
Procedura ANOVA
În cazul în care vrem să testăm ipotezele privind diferenţa a trei sau mai multe eşantioane vom
folosi procedura ANOVA.
𝐻0 : ̅̅̅̅
𝑥01 = ̅̅̅̅ 𝑥03 în medie salariul angajaţilor din cele 3 oraşe este acelaşi
𝑥02 = ̅̅̅̅,
𝐻0 : 𝑛𝑢 𝑡𝑜𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑖𝑙𝑒 𝑒𝑔𝑎𝑙𝑒, în medie salariul angajaţilor din cele 3 oraşe nu este acelaşi
În Excel urmăm paşii: Data – Data Analysis – Aniva Single Factor – la Input range vom selecta
toate variabilele pe care le analizăm – bifăm Labels in first row – ok. Obţinem următorul output
pentru testarea diferenţei salariului în funcţie de oraş:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Brasov 15 40.07 2.671333333 0.383269524
Cluj 18 46.75 2.597222222 0.344985948
Iasi 7 17.47 2.495714286 0.603628571
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.150491627 2 0.075245813 0.187452044 0.829851319 3.251923846
Within Groups 14.85230587 37 0.401413672
Total 15.0027975 39
Dacă F este mai mare decât F_critic respingem ipoteza nulă. În caz contrar o vom accepta.
În acest exemplu, 0,187 mai mic decât 3,25 deci acceptăm ipoteza nulă, mediile sunt egale.
Obţinem următorul output pentru testarea diferenţei salariului în funcţie de nivelul studiilor:
SUMMARY
Groups Count Sum Average Variance
muncitori calificati 13 37.38 2.875384615 0.413926923
muncitori necalificati 5 12.67 2.534 0.19778
studii superioare 11 24.91 2.264545455 0.373807273
Tehnicieni 7 19.96 2.851428571 0.231147619
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 2.639598482 3 0.879866161 2.587080381 0.070188963 2.901119588
Within Groups 10.88320152 32 0.340100047
Total 13.5228 35
F = 2,587 este mai mic dcât F_critic = 2,901 şi deci acceptăm ipoteza nulă. În medie salariul
angajaţilor nu diferă în funcţie de studii.
Bibliografie
Emilia Ţiţan, Statistică. Teorie. Aplicaţii în sectorul terţiar, Editura Meteor Press
http://www.excel-easy.com/data-analysis.html
https://onlinecourses.science.psu.edu/stat200/node/225