Sunteți pe pagina 1din 37

Proiect Statisitca - SPSS

2019

1
Cuprins

Cuprins
1. Introducere........................................................................................................................................3
2. Descrierea bazei de date si a variabilelor analizate.........................................................................4
3. Analiza statistica univariata a datelor.............................................................................................7
3.1. Descrierea statistica a variabilelor calitatative...........................................................................7
3.2 Descrierea statistica a variabilelor cantitative................................................................................11
4. Analiza statistica bivariata a variabilelor......................................................................................20
4.1. Analiza statistică a asocierii dintre doua variabile................................................................20
4.2 Analiza de regresie si corelatie................................................................................................22
5. Estimarea si testarea statistica........................................................................................................29
5.1. Estimarea unei medii prin interval de incredere......................................................................29
5.1.1. Estimarea prin interval de încredere a unei medii...........................................................29
5.1.2. Estimarea prin interval de incredere a diferentei dintre doua medii...............................30
5.2. Testarea statistică......................................................................................................................31
5.2.1. Testarea unei medii...........................................................................................................31
5.2.2. Testarea unei proporții.....................................................................................................33
5.2.3. Testarea diferenței dintre două medii și două (sau mai multe) proporții........................34
5.2.4. Testarea asocierii dintre doua variabile...........................................................................36
5.2.5. ANOVA - Testarea diferentelor dintre trei si mai multe medii........................................36
Concluzii:.................................................................................................................................................37

2
1. Introducere
Prin realizarea acestui proiect mi-am propus să analizez baza de date „Employee data.sav”.
Scopul meu este acela de a obseva variația salariului curent al angajaților din firmă în
concordanță cu factorii de influență ce acționează asupra acestuia.
În studiul meu am folosit trei variabile numerice (cantitative) și două variabile nenumerice
(calitative)
Variabilele ce urmează a fi analizate sunt: salary, salbegin,prevexp, gender, qualif_lvl.

3
2. Descrierea bazei de date si a variabilelor analizate

Baza de date pe care am folosit-o este „Employee data.sav”.

Figure 1 Employee data.sav -Mod vizualizare Data View

Figure 2Employee data.sav -Mod vizualizare Variable View

4
În studiul de față am ales spre analiză următoarele variabile:

 Variabile numerice:
o „Salary” - Current Salary (Salariul curent)
o „Salbegin” - Beginning Salary (Salariu de început)
o „Prevexp” - Previous Experience (months) (Experiența anterioară exprimată în
luni)
 Variabile nenumerice:
o „Gender” (Genul)
o „Qualif_lvl” - Qualification level ( Nivelul de calificare)

Am creat variabila qualif_lvl prin recodificarea variabilei prevexp (scalară) într-o nouă

variabilă, de această dată nominală.

Pentru a face asceastă operațiune am selesctat din meniul Transform - Recode into Different
Variables.

Am atribuit valori pentru variabila prevexp, formând trei grupuri distincte:

 < 48 ( mai puțină experiență decât 48 luni- 4 ani) - 1


 49- 108 (experiență între 4 ani și 9 ani) – 2
 > 109 ( experiență de peste 9 ani) – 3

Figure 3 Recodificarea variabilei: Recode into Different Variables


5
Figure 4 Atribuirea de valori pe intervale

Următorul pas a fost să atribui semnificații celor trei grupe nou create, astfel încât din modul

Variable View- Value Labels, și am denumit pe rând fiecare grup.


Figure 5 Denumirea subgrupelor

6
Tabelul de mai sus a fost obținut astfel: File – Display Data File Information- Working File

Acesta a fost creat pentru a vedea informațiile cu privire la variabilele ce se găsesc în baza
actuală de date.

3. Analiza statistica univariata a datelor


3.1.
Descrierea statistica a variabilelor calitatative
a. Gender:

Statistics
Gender

Valid 474
N
Missing 0

Gender

Frequency Percent Valid Percent Cumulative


Percent

Female 216 45.6 45.6 45.6

Valid Male 258 54.4 54.4 100.0

Total 474 100.0 100.0


Tabel 1 Descrierea variabilei calititative „gender”

După cum se poate observa, din totalul populației de 474 persoane (fără valori lipsă) sunt 216
femei, reprezentând un procent de 45.6%. Pe de altă parte, bărbații angajați din firmă sunt în număr de
258 de persoane și semnifică 54.4% din totalul populației.

7
Figure 6 Repartiția persoanelor în funcție de gen

Pentru a ajunge la aceste rezultate am urmat următorii pași: Analyze – Descriprive Statistics –
Frequencies.

Figure 7 Descrierea statistică a variabilei „gender”

Apoi am ales din meniul Charts- Pie charts.

8
Figure 8 Alegerea graficului Pie Charts pentru var. Gender

b. Qualif_lvl (Qualification level)


Pentru descrierea variabilei qualif_lvl am urmat aceeași pași ca în cazul variabilei gender. Mai
exact:

Statistics
qualification level

Valid 474
N
Missing 0

qualification level

Frequency Percent Valid Percent Cumulative


Percent

începător 217 45.8 45.8 45.8


mediu 110 23.2 23.2 69.0
Valid
avansat 147 31.0 31.0 100.0

Total 474 100.0 100.0


Tabel 2 Descrierea variabilei cantitative „qualif_lvl”

Din totalul populației de 474 persoane din firmă, sunt 217 persoane ce au gradul de
calificare începător ( până la 4 ani de experiență), ceea ce înseamnă 45.8% din total. De
asemenea sunt 110 persoane cu experiență medie (între 4 și 9 ani vechime), reprezentând 23.2%
din angajați. Pe de altă parte 69% din totalul angajaților au până la 9 ani de vechime. În cele din
urmă sunt 147 de angajați, cu un procent de 31.0% ce au statutul de avansat, experiența lor în
muncă totalizând peste 9 ani.

9
Figure 9 Repartiția persoanelor în funcție de nivelul de calificare

Informațiile au fost obținute astfel: Analyze – Descriprive Statistics – Frequencies

Figure 10Descrierea statistică a variabilei „qualif_lvl”

Apoi am ales din meniul Charts- Pie charts.

10
Figure 11Alegerea graficului Pie Charts pentru var. qualif_lvl

3.2 Descrierea statistica a variabilelor cantitative


 Prevexp

Statistics
Previous Experience (months)

Valid 474
N
Missing 0
Mean 95.86
Median 55.00
Mode 0
Std. Deviation 104.586
Variance 10938.281
Skewness 1.510
Std. Error of Skewness .112
Kurtosis 1.696
Std. Error of Kurtosis .224
Minimum 0
Maximum 476
11
25 19.00

Percentiles 50 55.00

75 140.00
Tabel 3 Descrierea variabilei cantitative „Prevexp”

Populația: 474 persoane, fără valori lipsă


Media(Mean): 95.86 ( în medie un angajat are 95.86 luni de experiență anterioară)
Mediana(Median): 55.00 (50% dintre angajați au până la 55 luni de experiență anterioară iar
50% dintre angajați au mai mult de 55 luni de experiență anterioară)
Modul(Mode): 0 ( cei mai mulți angajați nu au experiență anterioară)
Abaterea standard (Std. Deviation): 104.586 ( În medie, numărul de luni de experiență
anterioară a unei persoane se abate de la valoarea medie a experienței anterioare cu 104.586 luni
în ambele sensuri)
Coeficientul de asimetrie Pearson(Skewness): 1.510 (coeficientul este pozitiv și >0, ceea ce
înseamnă că distribuția este asimetrică la dreapta
Coeficientul de boltire Fisher(Kurtosis) : 1.696 (coeficientul este >0, ceea ce ne arată o curbă
leptocurtică)
Quartilele:
Q1: 19.00 ( 25% dintre angajați au până în 19 luni de experiență, iar 75% dintre angajați au
peste 19 luni de experiență anterioară.)
Q2: 55.00 (50% dintre persoane au până la 55 de luni de experiență anterioară iar, 50% au peste
55 luni de experiență anterioară)
Q3: 140.00 (75% dintre angajați au până la 140 de luni de experiență anterioară, iar 25% dintre
angajați au peste 140 de luni lucrate anterior).

12
Figure 12 Curba frecvențelor cu privire la experiența de muncă anterioară

Pentru a obține graficul și tabelul de mai sus am urmat următorii pași:Analyze- Descriprive
Statistics- Frequencies

Apoi, din submeniul Statistics, am selectat: Quartiles, Mean, Median, Mode, Std.
Deviation, Variance, Minimum, Maximum, Skewness și Kurtosis, indicatori pe care i-am
considerat semnificativi pentru variabila Prevexp.
În ceea ce privește reprezentarea grafică, am ales histograma.

13
 Salbegin

Statistics
Beginning Salary

Valid 474
N
Missing 0
Mean $17,016.09
Median $15,000.00
Mode $15,000
Std. Deviation $7,870.638
Variance 61946944.959
Skewness 2.853
Std. Error of Skewness .112
Kurtosis 12.390
Std. Error of Kurtosis .224
Minimum $9,000
Maximum $79,980
25 $12,450.00

Percentiles 50 $15,000.00

75 $17,617.50
Tabel 4 Descrierea variabilei cantitative „Salbegin”

Populația: 474 persoane, fără valori lipsă


Media(Mean): $17,016.09 ( În medie, salariul de început al unui angajat este de $17,016.09 )
Mediana(Median): $15,000.00 (50% dintre angajați au salariul de început de până la $15,000.00
iar 50% dintre angajați au mai mult de $15,000.00 salariu de început)
Modul(Mode): $15,000 ( cei mai mulți angajați au salariul de început $15,000)
Abaterea standard (Std. Deviation): $7,870.638 (Salariul de încadrare al angajaților se abate în
medie de la nivelul mediu cu $7,870.638 în ambele sensuri)
Coeficientul de asimetrie Pearson(Skewness): 2.853 (coeficientul este pozitiv și mult mai >0,
ceea ce înseamnă că distribuția este asimetrică la dreapta.
Coeficientul de boltire Fisher(Kurtosis) : 12.390 (coeficientul este cu mult >0, ceea ce ne arată
o curbă leptocurtică)
Minim (Minimum): $9,000 (Cel mai mic salariu de încadrare este de $9,000 )
Maxim (Maximum): $79,980 ( Cem mai mare salariu de încadrare este de $79,980)
Quartilele:
Q1: $12,450.00 ( 25% dintre angajați au până în $12,450.00 salariu de început, iar 75% dintre
angajați au peste $12,450.00 salariu de început.)
Q2: $15,000.00 (50% dintre persoane au până la $15,000.00 salariu de început, 50% au peste
$15,000.00 salariu de început)
14
Q3: $17,617.50 (75% dintre angajați au până la $17,617.50 salariu de încadrare, iar 25% dintre
angajați au peste $17,617.50 salariu de încadrare).

Figure 13 Curba frecvențelor cu privire la salariul de încadrare

Pentru a ajunge la aceste rezultate: Analyze- Descriprive Statistics- Frequencies

Am selectat aceiași indicatori pe care i-am folosit și în studiul variabilei anterioare.


15
De asemenea ma folosit histograma pentru reprezentarea grafică.

16
 Salary

Statistics
Current Salary

Valid 474
N
Missing 0
Mean $34,419.57
Median $28,875.00
Mode $30,750
Std. Deviation $17,075.661
Variance 291578214.453
Skewness 2.125
Std. Error of Skewness .112
Kurtosis 5.378
Std. Error of Kurtosis .224
Minimum $15,750
Maximum $135,000
25 $24,000.00

Percentiles 50 $28,875.00

75 $37,162.50
Tabel 5 Descrierea variabilei cantitative „Salary”

Populația: 474 persoane, fără valori lipsă


Media(Mean): $34,419.57 ( În medie, salariul actual al unui angajat este de $34,419.57 )
Mediana(Median): $28,875.00 (50% dintre angajați au salariul curent de până la $28,875.00 iar
50% dintre angajați au mai mult de $28,875.00 salariu curent)
Modul(Mode): $30,750 ( cei mai mulți angajați au salariul curent în valoare de $30,750)
Abaterea standard (Std. Deviation): $17,075.661 (Salariul actual al angajaților se abate în
medie de la nivelul mediu cu $17,075.661 în ambele sensuri)
Coeficientul de asimetrie Pearson(Skewness): 2.125 (coeficientul este pozitiv și mult mai >0,
ceea ce înseamnă că distribuția este asimetrică la dreapta.
Coeficientul de boltire Fisher(Kurtosis) : 5.378 (coeficientul este >0, ceea ce ne arată o curbă
leptocurtică)
Minim (Minimum): $15,750 (Cel mai mic salariu curent este de $15,750)
Maxim (Maximum): $135,000 ( Cem mai mare salariu curent este de $135,000)
Quartilele:
Q1: $24,000.00 ( 25% dintre angajați au până în $24,000.00 salariu curent, iar 75% dintre
angajați au peste $24,000.00 salariu curent.)
Q2: $28,875.00 (50% dintre persoane au până la $28,875.00 salariu actual, 50% au peste
$28,875.00 salariu actual)

17
Q3: $37,162.50 (75% dintre angajați au până la $37,162.50 salariu curent, iar 25% dintre
angajați au peste $37,162.50 salariu curent).

Figure 14 Curba frecvențelor cu privire la salariul curent al angajaților

Am urmat aceeași pași ca și în cazul variabilelor de mai sus.:


Analyze- Descriprive Statistics- Frequencies

18
Am selectat indicatorii staatistici potriviți pentru variabila analizată:

În cele din urmă, am ales graficul de tip histogramă

19
4. Analiza statistica bivariata a variabilelor

4.1. Analiza statistică a asocierii dintre doua variabile

Pentru analiza statistică a asocierii dintre două variabile am ales „Gender” (Genul) și
„Qualif_lvl” Qualification level ( Nivelul de calificare).

Astfel, voi analiza nivelul de calificare al angajaților (începător, mediu, avansat) în funcție de
gen (masculin, feminin). Voi verifica dacă există o asociere semnificativă între calificarea
angajaților în funcție de gen.

Obținerea tabelului presupune următorul demers: Analyze -Descriptive Statistics -Crosstabs

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

qualification level * Gender 474 100.0% 0 0.0% 474 100.0%

qualification level * Gender Crosstabulation


Count

Gender Total

Female Male

începător 122 95 217

qualification level mediu 35 75 110

avansat 59 88 147
Total 216 258 474
Tabel 6 Analiza statistică a asocierii dintre Gender și Qualif_lvl

Se observă că din totalul de 217 al angajaților cu nivel de calificare începător (4 ani de


experiență) , sunt 122 de femei și 95 de bărbați, în ceea ce privește nivelul mediu de calificare(4-
9 ani de experiență), numărul bărbaților,75, este mai mare decât cel al femeilor 35 din totalul de
110. În ceea ce privește angajații ce au peste 9 ani de experiență (avansat), numărul bărbaților,88,
se distanțează semnificativ de cel al femeilor,59, din totalul de 147.
 Testarea ipotezelor statistice:
H0 : variabilele sunt independente

H1 : variabilele sunt asociate

 Regula de decizie:

Sig< α – se respinge H0

Sig>α – se acceptă H0
20
Chi-Square Tests

Value df Asymp. Sig. (2-


sided)

Pearson Chi-Square 20.062a 2 .000


Likelihood Ratio 20.285 2 .000
N of Valid Cases 474

a. 0 cells (0.0%) have expected count less than 5. The minimum


expected count is 50.13.

Se constată că sig asociat coef Pearson este de 0,00< 0,05 (riscul asumat, α=0,05), se
respinge H0 și se acceptă ipoteza H1, rezultă faptul că cele două variabile sunt asociate.

21
4.2 Analiza de regresie si corelatie
Analiza de regresie studiază legătura statistică între două sau mai multe variabile statistice sub
aspectul formei acesteia.1
 Regresia liniară simplă
Ecuația modelului de regresie liniară simplă: Y= β0 + β1 X + εi
Y – variabila dependentă (salary- salariul curent)
X – variabila independentă (salbegin – salariul de încadrare)
ε – variabila reziduală sau eroare
β0 , β1 – parametrii modelului econometric, coeficienți de regresie

Pentru eșantion: y= b0 +b1x


Vom analiza legatura dintre variabila salary si salbegin.

Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 1928.206 888.680 2.170 .031


1
Beginning Salary 1.909 .047 .880 40.276 .000

a. Dependent Variable: Current Salary


Tabel 7 Coefficients- regresia liniară simplă

Ecuația modelului: Y= 1928.206 + 1.909X

β0: valoarea salariului curent este 1928.206$ atunci când salariul de încadrare este 0. (nu are sens
interpretarea, deoarece salariul de început nu poate fi 0)

β1 : valoarea salariului curent crește în medie cu 1.909$ atunci când valoarea salariului de
încadrare crește cu 1$.
β1>0 – există o legătură directă între salariul curent și salariul de început
Testarea parametrilor modelului liniar pentru un risc asumat de 0.05
Pentru β0,1 :
H0 : parametrii nu sunt semnificativi statistic

H1 : parametrii sunt semnificativi statistic

β0 : sig=3,1< α – se respinge H0 – parametrul este semnificativ statistic

β1 : sig= 0 < α – se respinge H0 - parametrul este semnificativ statistic

1
Suport curs econometrie 2018-2019
22
Model Summary

Model R R Square Adjusted R Std. Error of the


Square Estimate
a
1 .097 .009 .007 $17,012.353

a. Predictors: (Constant), Previous Experience (months)


Tabel 8 Model Summary pentru modelul liniar

Raportul de corelație R= 0.097 ceea ce arata ca legatura dintre cele doua variabile este
slabă.
Raportul de determinație R2=0.009 ceea ce ne arată că 0.9% din variația variabilei
salariului curent este explicata prin variatia salariului de încadrare, iar restul de pana la 100% se
datoreaza factorilor aleatori.

ANOVAa

Model Sum of Squares df Mean Square F Sig.

1310179340.33 1 1310179340.33 4.527 .034b


Regression
2 2

136606316096. 472 289420161.220


1 Residual
008

137916495436. 473
Total
340

a. Dependent Variable: Current Salary


b. Predictors: (Constant), Previous Experience (months)

Valoarea lui Sig pentru F calculat este de 3,4%<5% , prin urmare relația liniară dintre
cele doua variabile studiate este una semnificativa.

Figure 9 Modelul de regresie liniară simplă- Analize- Regression- Linear

23
 Regresia liniară multiplă

Ecuația modelului de regresie multiplă : Y= β0 + β1 X1 + β2X2 + εi


Y – variabila dependentă (salary- salariul curent)
X1 – variabila independentă (salbegin – salariul de încadrare)
X2 – variabila indepedentă ( prevexp – experiență anterioară)
ε – variabila reziduală sau eroare
β0 , β1 , β2 – parametrii modelului econometric, coeficienți de regresie
Vom analiza legatura dintre variabilele salary, salbegin și prevexp.

Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 3850.718 900.633 4.276 .000

Beginning Salary 1.923 .045 .886 42.283 .000


1
Previous Experience -22.445 3.422 -.137 -6.558 .000
(months)

a. Dependent Variable: Current Salary


Tabel 10 Coefficients- regresia liniară multiplă

Ecuația modelului: Y= 3850.718+ 1.923X1 – 22.445X2

β0: valoarea medie a salariului curent este de 3850.718$ atunci când valorile salariului de început
cât și ale experienței anterioare sunt egale cu 0.
β1: salariul curent crește în medie cu 1.923$ la o creștere cu 1$ a salariului de încadrare, în
condițiile în care influența experienței anterioare rămâne constantă.
β1>0 – există o legătură directă între salariul curent și salariul de început
β2: salariul curent scade în medie cu 22.445$ atunci când experiența anterioară crește cu o lună,
în condițiile în care influența salariului de încadrare rămâne constantă.
β2<0 - există o legătură inversă între salariul curent și experiența anterioară
Deoarece Sig asociat celor trei variabile este egal cu 0,00 rezultă că pentru un risc asumat de
0,05 cele trei variabile sunt semnificative statistic.

24
Model Summary

Model R R Square Adjusted R Std. Error of the


Square Estimate
a
1 .891 .793 .793 $7,776.652

a. Predictors: (Constant), Previous Experience (months), Beginning


Salary
Tabel 11Model Summary pentru modelul liniar multiplu

Raportul de corelație R= 0.891 arată că influența simultană a variabilelor independente


(salbegin și prevexp) asupra variabilei depensente salary (salariu curent) este puternică.
Raportul de determinație R2=0.793 ne arată că 79,3% din variația variabilei salariului
curent este influențată prin variația simultană a variabilelor independente.

ANOVAa

Model Sum of Squares df Mean Square F Sig.

109432147156. 2 54716073578.3 904.752 .000b


Regression
685 43

28484348279.6 471 60476323.311


1 Residual
54

137916495436. 473
Total
340

a. Dependent Variable: Current Salary


b. Predictors: (Constant), Previous Experience (months), Beginning Salary

Figure 15 Modelul de regresie liniară multiplă Analize- Regression- Linear

25
 Regresie neliniara – Modelul Growth

Ecuația modelului de regresie: Y=e β0 + β1X sau lnY = β0 + β1X.

Y – variabila dependentă (salary- salariul curent)


X1 – variabila independentă (salbegin – salariul de început)
β0 , β1– parametrii modelului econometric, coeficienți de regresie

Coefficients

Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

Beginning Salary 4.244E-005 .000 .841 33.722 .000


(Constant) 9.635 .024 408.429 .000

The dependent variable is ln(Current Salary).


Tabel 12 Regresie neliniară- Model Growth

Y=e9.635+4.244E-005*X1

β0 =9.635>0, există o legătură directă între salaril curent și cel de încadrare


Când valoarea Salariului de încadrare este 0, estimăm o valoare medie a salariului curent de 9.63
procente.
β 1=4.244E-005
La o crestere a salariului de încadrare cu 1$, salariul curent creste in medie cu 4.244E-005* 100%.

26
Model Summary

R R Square Adjusted R Std. Error of the


Square Estimate

.841 .707 .706 .215

The independent variable is Beginning Salary.

Raportul de corelatie R=0.841 arata o legatura puternică intre cele doua variabile studiate.
Raportul de determinatie R2=0.707 arată că 70,7% din variația variabilei dependente, salariu
curent este explicată prin variația variabilei salariu de început.

ANOVA

Sum of Squares df Mean Square F Sig.

Regression 52.772 1 52.772 1137.200 .000


Residual 21.903 472 .046
Total 74.675 473

The independent variable is Beginning Salary.

Se observa ca Sig e de 0.00< 0.05 ceea ce arata ca relatia dintre cele doua variabile este
semnificativa.
Pentru a ajunge la aceste rezultate: Analyze- Regression – Curve Estimation (Modelul Growth)

27
Figure 16 Regresie neliniară- Modelul Growth

Analiza de corelatie
Analiza de corelaţie studiază legătura statistică între două sau mai multe variabile statistice sub
aspectul intensităţii acesteia.

Correlations

Current Salary Beginning


Salary

Pearson Correlation 1 .880**

Current Salary Sig. (2-tailed) .000

N 474 474
**
Pearson Correlation .880 1

Beginning Salary Sig. (2-tailed) .000

N 474 474

**. Correlation is significant at the 0.01 level (2-tailed).


Tabel 13Corelația dintre Salariul curent și cel de început

Coeficientul de corelatie Pearson este egal cu 0.880 si arată că între cele două variabile există o
corelatie directa și puternică.
Valoarea lui Sig. este de 0.00<0.05 si arată că între cele două variabile legătura este
semnificativă.
Pașii urmați pentru a obține aceste rezultate: Analyze-Corelate-Bivariate

28
Figure 17 Analiza de corelație între două variabile

5. Estimarea si testarea statistica

5.1. Estimarea unei medii prin interval de incredere

5.1.1. Estimarea prin interval de încredere a unei medii


Pentru această operațiune selectăm: Analyze- Descriptive Statistics – Explore

Descriptives

Statistic Std. Error

Mean $34,419.57 $784.311

95% Confidence Interval for Lower Bound $32,878.40


Mean Upper Bound $35,960.73

5% Trimmed Mean $32,455.19

Median $28,875.00

Variance 291578214.453

Current Salary Std. Deviation $17,075.661

Minimum $15,750

Maximum $135,000

Range $119,250

Interquartile Range $13,162

Skewness 2.125 .112

Kurtosis 5.378 .224

29
Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

Current Salary 474 100.0% 0 0.0% 474 100.0%

Cu o probabilitate de 95% estimăm că salariul actual mediu se află în intervalul


[$32,878.40; $35,960.73].

5.1.2.
5.1.2.
5.1.2.
5.1.2.
5.1.2.
5.1.2.
5.1.2.
5.1.2.
5.1.2.
5.1.2.
5.1.2.
Figure 18 Estimarea unei medii prin interval de incredere 5.1.2.
E
stimarea prin interval de incredere a diferentei dintre doua medii

Variabilele analizate sunt salariul curent și genul angajaților.


Pentru a ajunge la rezultatele dorite am urmat următorii pași: Analyze- Compare Means-
Independent Samples T Test

30
Group Statistics

Gender N Mean Std. Deviation Std. Error Mean

Female 216 $26,031.92 $7,558.021 $514.258


Current Salary
Male 258 $41,441.78 $19,499.214 $1,213.968

Interpretare:
Pentru început ne uităm la nivelul de semnificație observat pentru acest test, care este
mai mic decat α=0.05 (Sig= 0.000), deci se vor folosi variante egale. Din această perspectivă,
testul t este egal cu -10.945, Sig=0< α=0.05. Garantăm cu o probabilitate de 95% că există
diferențe semnificative intre variatiile dintre grupe ($26,031.92 este media salariului curent pe
care îl au femeile, iar bărbații au în medie un salariu de $41,441.78).

Figure 19Estimarea prin interval de incredere a diferentei dintre doua medii

5.2. Testarea statistică

5.2.1. Testarea unei medii

Ne propunem să testăm dacă media salariului curent diferă semnificativ de 33000$.


Etape în analiză: Analyze – Compare Means – One Sample T Test

31
One-Sample Statistics

N Mean Std. Deviation Std. Error Mean

Current Salary 474 $34,419.57 $17,075.661 $784.311

One-Sample Test

Test Value = 33000

t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the


Difference

Lower Upper

Current Salary 1.810 473 .071 $1,419.568 -$121.60 $2,960.73

Formularea ipotezelor:
H 0:μ= 33000 (în medie salariul curent nu diferă semnificativ de 33000$)

H 1:μ ≠33000 (media salariului curent diferă semnificativ de 33000$)

Decizia statistică:
Pentru Sig.= 7,1%>5% , cu o probabilitate de 95% se acceptă ipoteza nula și se respinge
ipoteza alternativă. Prin urmare salariul curent al angajaților din firmă nu diferă semnificativ de
33000$ .

Figure 20 Testarea unei medii

32
5.2.2. Testarea unei proporții

În testarea unei proportii folosim Binomial Test pentru a testa ipotezele cu privire la o
variabilă distribuită binomial.
Pentru a putea realiza această analiză avem nevoie de o variabilă recodificată cu două
categorii.
Am ales variabila curent salary (salariul curent)

Pentru efectuarea
testării unei
proporții: Analyze – Nonparametrical Tests- Legagy Dialogs – Binomial

Binomial Test

Category N Observed Prop. Test Prop. Exact Sig. (2-


tailed)

Group 1 nivel scăzut 263 .55 .50 .019

salary categorial Group 2 nivel ridicat 211 .45

Total 474 1.00

33
Interpretare:
Sig=1.9% indică faptul că proportia de 50% difera semnificativ pentru un risc de 5%.

5.2.3. Testarea diferenței dintre două medii și două (sau mai multe) proporții
 Testarea diferentei dintre doua medii

Group Statistics

salary categorial N Mean Std. Deviation Std. Error Mean

nivel scăzut 263 $24,268.06 $3,554.300 $219.168


Current Salary
nivel ridicat 211 $47,072.87 $18,736.431 $1,289.869

Formularea ipotezelor:
H 0: μ1= μ2 ( nu există diferențe semnificative între cele două medii)

H 1: μ1 ≠ μ2 (există diferențe semnificative între cele două medii)

Interpretare: Nivelul de semnificație al testului este α=0.05> Sig= 0.000, se respinge ipoteza
nulă, se folosesc variante inegale. Astfel, testul t est egal cu -17.430, sig=0 < α=0.05. Garantăm
cu o probabilitate de 95% ca există diferente semnificative intre variatiile pentru cele doua
grupe($24,268.06 pentru categoria de salariu scăzut si $47,072.87 pentru categoria de salariu
ridicat)
34
Pași urmați: Analyze – Comapre Means – Independent Samples T Test
 Testarea diferentei dintre doua proporții

Figure 21Testarea diferentei dintre doua medii

Pentru a testa diferența dintre două proporții: Analyze – Nonparametrical Tests- Legagy – Chi-
Square

qualification level Test Statistics

Observed N Expected N Residual qualification


level
începător 217 158.0 59.0
mediu 110 158.0 -48.0 Chi-Square 37.380a

avansat 147 158.0 -11.0 df 2

Total 474 Asymp. Sig. .000

a. 0 cells (0.0%) have expected


frequencies less than 5. The
minimum expected cell
frequency is 158.0.

Formularea ipotezelor:

H0: μ1= μ2=μ 3 (nu există diferențe semnificative între distribuția teoretică și cea reală)

H1: μ1 ≠ μ2 ≠ μ 3 (nu există diferențe semnificative între distribuția teoretică și cea reală)
Se remarcă faptul ca sig = 0.00<0.05 . Cu probabilitate de 95% putem afirma ca exista diferente
semnificative intre grupele distribuției teoretice și a celei reale .

35
Figure 22Testarea diferentei dintre doua proporții

5.2.4. Testarea asocierii dintre doua variabile

5.2.5. ANOVA - Testarea diferentelor dintre trei si mai multe medii

ANOVA
salary categorial

Sum of Squares df Mean Square F Sig.

Between Groups .819 2 .409 1.659 .191


Within Groups 116.255 471 .247
Total 117.074 473

Formularea ipotezelor:
H 0: μ1= μ2=μ 3

H1: μ1 ≠ μ2 ≠ μ 3
Decizie:
Sig. = 19,1%>5% deci se acceptă ipoteza nula ceea ce inseamna ca garantăm o probabilitate de
95% faptul că nu exista diferente semnificative intre mediile de grupă.
Procedeul urmat: Analyze- Compare Means – One Way ANOVA

36
Figure 23 ANOVA - Testarea diferentelor dintre trei si mai multe medii

Concluzii:

După finalizarea studiului cu privire la salariului curent al angajaților din cadrul unei
firme, constatăm că variața acestuia este influențată de variația salariului de încadrare, de
asemenea există o legătură inversă între salariul curent și experiența anterioară.
Cunoaștem și faptul că în medie, salariul actual al unui angajat este de $34,419.57,
precum și faptul că cei mai mulți angajați au salariul curent în valoare de $30,750.
În urma analizei putem garanta cu o probabilitate de 95% că salariul actual mediu se află
în intervalul [$32,878.40; $35,960.73].

37