Sunteți pe pagina 1din 26

Capitolul 1.

Introducere

Obiectivul proiectului
Ancheta somajului este o metoda moderna pentru cercetarea statistica a
pietei si fortei de munca avand ca obiectiv principal masurarea populatiei active
ocupate si in somaj si a populatiei inactive la nivelul principalelor tari
europene.
Conceputa ca sursa importanta de informatii asupra fortei de munca,
ancheta furnizeaza, intr-o maniera coerenta, date esentiale asupra tuturor
segmentelor de populatie, cu numeroase posibilitati de corelare si structurare
dupa caracteristici demo-socio-economice, diverse, in conditii de
comparabilitate internationala.

1
Capitolul 2.
Construirea bazei de date

2.1 Alegerea variabilelor analizate


Pentru aceasta ancheta am considerat relevante urmatoarele variabile:
Tara
Populatia totala
Numarul de someri
Rata somajului
Numarul de locuri de munca disponibile
Nivelul de dezvoltare
Variabila tara reprezinta zona geografica la care ne referim.
Populatia totala face referire la numarul de locuitori aferent unei anumite
tari din cadrul Uniunii Europene.
Numarul de someri se refera la populatia care momentan este fara ocupatie
si care beneficiaza de un ajutor din partea statului.
Rata somajului este o variabila numerica care exprima procentul
persoanelor somere in decursul unui an aferent populatiei totale a unei tari.
Numarul de locuri de munca disponibile reprezinta oferta factorului de
productie munca.
Nivelul de dezvoltare se refera la gradul de dezvoltare al tarii.
In figura 1 se evidentiaza o macheta de ecran a variabilelor prezentate
anterior.

2
Figura 1. Variabile
Orice analiza statistica a datelor in SPSS presupune pregatirea setului de
date necesar anchetei.

2.2 Definirea variabilelor si introducerea datelor in SPSS

Acest proces presupune prezentarea datelor intr-un format care sa permita


organizarea si efectuarea analizei lor. Definirea si introducerea datelor sunt
operatii care se efectueaza folosind foile Data View si Variable View din
fereastra Data Editor. Astfel se alege tipul variabilei in coloana Type din foaia
Variable View din fereastra Data Editor. Ele pot fi de mai multe tipuri si anume:
Numerice (numeric, comma, dot, scientific notation);
Alfanumerice (string).
n acest proiect tipul predominant al variabilelor utilizate este cel numeric,
cu exceptia variabilei tara care este de tip string.
Numele variabilelor este limitat in general la 8 caractere, exceptie facand
prima variabila a carui nume este de 10 caractere.

3
Nu s-au utilizat valori ale variabilelor urmand ca acestea sa fie introduse
manual.
Datele se introduc in celulele foii Data View din fereastra Data Editor
deschisa prin comanda New Data din meniul File. Fiecare rand reprezinta un
subiect, iar fiecare coloana reprezinta o variabila.
In figura 2 este surprinsa o macheta in care este prezentata foaia Data
View privind modul de introducere a datelor.

Figura 2

4
Capitolul 3.
Verificarea bazei de date

3.1 Verificarea normalitatii distributiilor


Pentru verificarea normalitatii unei distributii in SPSS pot fi utilizate doua
cai, si anume:
Reprezentarea grafica folosind procedeele histograma, boxplot, P-P plot
si Q - Q plot;
Aprecierea numerica a abaterilor distributiei empirice de la distributia
teoretica.
Histograma

1
5
Acest procedeu presupune diagnosticarea unei distributii in vederea
stabilirii normalitatii. Luand in considerare variabilele alese anterior putem

1
2
evidentia procedeul histogramei astfel:
cy

9
un
req
F

6
3
0
01p
o
0
0u
la
2ti0o
0 ta M
e
a
n
l300400
S
t
d
.
D
N
=
1=
4
6
4
6
e
v
.
=
9
0
6.
7
5
8
1
.
2
41
5
4
Figura 3. Histograma pentru populatia totala
Se observa n figura 3 o distributie cu un grad mare de asimetrie,
normalitatea distributiei putand fi pusa sub semnul intrebarii.

3
y
n
c
u
2
Fq
re
1 M
e
an
=
9
.
8
3
.r
00ts
.a
o
m
a
ju
5
0lic
1
0a
lu
.a
tln
1
5
.
0iv
e
ld
ta
2
0
.r2
5
.
0S
t
d
.
N
1D
v
4
6
52
8
Figura 4. Histograma ratei somajului la nivel de fiecare tara

In figura 4 putem observa o distributie aproximativ simetrica rezultand


astfel o distributie normala.

6
1
5
1
2
9
Fy
n
c
u
q
re
6
3
00
.5
0u
.n
m
a
ru
ld
e
s
o
m
e
rix
1
0
.
0 s
te
n
i
1
5
0
. 2
0
.
0M
e
a
n
S
t
d
.
D
N
1
6=
2
7
5
.
9
v
.
47
26
Figura 5. Histograma numarului de someri existenti n fiecare tara
In aceasta histograma putem observa o distributie asimetrica, deci
distributia variabilei testate nu este normala.

7
1
4
1
2
Fy
n
c
u
q
re 1
0
8
6
4
2
000.n
.1 m
2a
ru
.u
0ld
e
o
c
u
rid
3
0
. s
p
o
n
ib
4
0
.le
5
0
.6
0.M
e
a
n
S
t
d
.
D
N
1=
6
4
9
.
5
2
v
17
.
1
8
3
Figura 6. Histograma numarului de locuri disponibile
La fel ca si in cazul anterior distributia are un grad mare de asimetrie,
fiind astefel considerata o distributie anormala.
Q-Q plot
Estimated Distribution Parameters

numarul de numarul de rata somajului


locuri populatia someri calculata la
disponibile totala existenti nivel de tara
Normal Distribution Location 649.525 46646.750 2275.900 9.893
Scale 1277.1831 90781.2410 4449.9726 4.6282

8
rmu
lV
e N
o
r32,,00m
a
lQ
-P
lo
tfn
u
m
a
ru
ld
e
o
c
u
rid
s
p
o
n
ib
le
c
p
E
e
xN
o
tda 1,00
--1
,20 ,00O
,0-2 s
erv
,bd
V
a
lu
2
0e
4
,
0 6
,
0
Figura 7. Q-Q plot pentru variabila numarul de locuri de munca disponibile

9
rmu
lV
e 2 N
o
r
m
0,0a
l
Q
-
Pl
o
t
fp
o
u
l
at
i
o
t
al
N
o
td
c
p
E
e
x a 1
0,00
-1
0,-2
0
0,0-1
0 O
b
s
e
rv
,00
1d
V
a
0
,
0lu
e
2
0
,
03
0
,0
4
0
,0
Figura 8. Q-Q plot pentru variabila populatia totala

10
rm
N
oau
lV
e N o
r1692,,,000m
a
lQ
-P
lo
tfn
u
m
a
ru
ld
e
s
o
m
e
rix
s
te
n
i
3,00
td
c
p
E
e
x
--3
,60
,0-1,0-5 O
b
s
e
rvd
,005
,V
a
lu
0e
1
0
,1
5
,0
2
0
,
Figura 9. Q-Q plot pentru variabila numarul de someri aferent fiecarei tari

11
rm
N u
lV
ae N
o
rm
a
l2105Q
-P
lo
tfra
ts
o
m
a
ju
lic
a
lu
a
tln
iv
e
ld
ta
r
1
0
p
E
eo
td
c
5
x
05O
b
s
e
rv
1
0d
V
a
lu
1e
52
02
5
Figura 10. Q-Q plot pentru variabila rata somajului.

Dupa cum am evidentiat in procedeul histogramei putem spune ca


distributia normala este intalnita doar in cazul variabilei rata somajul. In cazul
celorlalte variabile distributia este asimetrica, deci aceasta nu este normala.

12
Capitolul 4.
Analiza statistica univariata a datelor

4.1 Descrierea statistica a variabilelor nominale


Variabilele statistice numite si caracteristici statistice reprezinta siruri de
valori reale inregistrate la nivelul unitatilor statistice ale unei colectivitati bine
definite. Exprima insusiri, trasaturi esentiale purtate de unitatile statistice ale
unei colectivitati.
Dupa modul de exprimare variabilele pot fi numerice sau cantitative si
variabile nenumerice sau atributive care la randul lor pot fi nominale sau
nominal ordinale. Variabilele nominale sunt caracteristici ale caror modalitati
de manifestare sunt exprimate atributiv, in cuvinte, de exemplu variabila nivelul
de dezvoltare al tarii.
Cum putem observa si in exemplul nostru, cand numarul variantelor unei
caracteristici atributive este mare, acestea fac obiectul nomenclatoarelor
statistice, de exemplu, nomenclatorul tarilor Uniunii Europene.
Distributiile dupa o variabila nominala poate fi reprezentata in SPSS cu
ajutorul diagramelor BAR si PIE.

Statistics

nivelul de dezvoltare al tarii


N Valid 16
Missing 0
nivelul de dezvoltare al tarii

Cumulative
Frequency Percent Valid Percent Percent
Valid foarte dezvoltata 4 25.0 25.0 25.0
dezvoltata 7 43.8 43.8 68.8
slab dezvoltata 5 31.3 31.3 100.0
Total 16 100.0 100.0

13
7 n
i
v
e
l
ud
e
zv
o
l
t
a
r
el
t
a
r
i
Diagrama BAR

6
5
4
y
n
c
u
q
3
F
re
2
1
0fo
a
rte
d ltan
zvo iv
e
lu
d
ezv
de
z
vo
lta
o
l
t
a relta
ris
l
a
b
d
ez
v
o
lt
a
Figura 11. Diagrama BAR pentru variabila nivelul de dezvoltare al tarii

14
Digrama PIE

n
iv
e
lu
d
ezv
o
lta
relta
rifdsolazbrvteldazvolta
Figura 12. Diagrama PIE pentru variabila nivelul de dezvoltare al tarii

Interpretare
Cum se poate observa, in esantionul ales cea mai mare pondere o au tarile
dezvoltate, ele reprezentand 43.8% din totalul tarilor luate in calcul avand in
vedere nivelului de dezvoltare al acestora.

15
4.2 Descrierea statistica a variabilelor numerice
Variabilele numerice sunt numite si cantitative si pot fi numarabile sau
masurabile respectiv cu variatie discontinua (variabile discrete), sau cu variatie
continua(variabile continue).
In cazul caracteristicilor anchetei efectuate variabilelle discrete iau valori
numarabile de exemplu: populatia totala a tarii, numarul somerilor si locurile de

1
0
munca disponibile. Variabilele continue exprima dimensiuni numarabile cum ar
rata somajului. Ele pot fi reprezentate grafic prin intermediul histogramei, Q-Q

8
plot si Boxplot.
Histograma

6
Fy
n
c
u
q
re
4
2.51n
00 e lu
.iv
1d
ez
5v
o
lta
2 re
lta
2
.
5 ri
33
.
5M
e
a
S
t
d
.
Nn
=
2
.
0
6
D
e
v
7
1
62
Figura 13. Histograma variabilei nivelului de dezvoltare al tarii
Interpretare

16
Se observa o distribuite simetrica ceea ce ne duce la concluzia ca avem de-
a face cu o distributie normala.

Capitolul 5.
Analiza statistica bivariata a datelor

5.1 Analiza statistica a gradului de asociere intre doua variabile


O distributie bivariata (bidimensionala) repezinta variatia unitatilor unei
colectivitati simultan dupa doua caracteristici de grupare. In acest caz se pot lua
in considerare reprezentarea grafica simultana a unei variabile nominale si a
unei varibile numerici, a doua variabile numerice sau a doua nominale.

5.2 Analiza de regresie si corelatie

Analiza de corelatie

Correlations

rata
somajului numarul
calculata la de someri
nivel de tara existenti
rata somajului calculata Pearson Correlation 1 .482
la nivel de tara Sig. (2-tailed) .059
N 16 16
numarul de someri Pearson Correlation .482 1
existenti Sig. (2-tailed) .059
N 16 16

17
m m
rix
e n
te
s 4
0
.3
0
.2
0
.1
ru
a
u
n o
s
ld
e i
0.0
.02p
o
04
0u
la
Interpretare
tio
ta
l
6
0 8
01
00
Pentru exemplul considerat s-a obtinut un coeficient de corelatie Pearson
egal cu 0.482, ceea ce indica existenta unei corelatii directe intre cele doua
variabile. Nu este o legatura puternica si nici slaba, valoarea acestui coeficient
fiind la mijlocul intervalului.
Valoarea SIG este de 0.059 ceea ce inseamna ca legatura este directa, insa
foarte slaba.

18
Analiza de regresie
Statistics

nivelul de dezvoltare al tarii

n
i
v
e
l
ud
e
zv
o
l
t
a
r
el
t
a
r
i
N Valid 16
Missing 0

nivelul de dezvoltare al tarii

Cumulative
Frequency Percent Valid Percent Percent
Valid foarte dezvoltata 4 25.0 25.0 25.0
dezvoltata 7 43.8 43.8 68.8

7
slab dezvoltata 5 31.3 31.3 100.0
Total 16 100.0 100.0

6
5
4
n
y
c
u
q

3
F
re

2
1
0foartedzvoltan
ivelu
d
ezvo
de
z
voltareltari
l
t
a s
l
a
b
d
ez
v
o
lt
a
19
Descriptive Statistics

Mean Std. Deviation N


numarul de someri
existenti 1236.781 1327.4967 16
numarul de locuri
disponibile 371.825 414.1279 16

Model Summary(b)

Adjusted R Std. Error of


Model R R Square Square the Estimate
1 .859(a) .737 .718 704.4368
a Predictors: (Constant), numarul de locuri disponibile
b Dependent Variable: numarul de someri existenti

Interpretare

Valoarea R ia valori intre -1 si 1 si arata daca exista sau nu o corelatie


intre variabila dependenta (numarul de someri existenti) si variabile
independenta (numarul de locuri de munca dispobinibile la nivelul fiecarei tari).
In interpretarea modelului, se foloseste coeficientul de determinatie R 2 .
Valoarea R 2 ia valori intre 0 si 1. Acest indicator este folosit pentru stabilirea

20
carui model de regresie este cel mai bine de utilizat. In cazul variabilelor alese,
se observa ca valoarea este de 0.737 ceea ce indica faptul ca modelul de
aregresie ales explica aproximativ legatura dintre variabile. Acesta valoare
indica o legatura intre cele doua variabile destul de stransa si directa.

ANOVA(b)

Sum of
Model Squares df Mean Square F Sig.
1 Regression 19486474.
1 19486474.720 39.269 .000(a)
720
Residual 6947236.9
14 496231.209
25
Total 26433711.
15
644
a Predictors: (Constant), numarul de locuri disponibile
b Dependent Variable: numarul de someri existenti

a Dependent Variable: numarul de someri existenti

Residuals Statistics(a)

Minimum Maximum Mean Std. Deviation N


Predicted Value 239.025 4121.336 1236.781 1139.7799 16
Std. Predicted Value -.875 2.531 .000 1.000 16
Standard Error of
Predicted Value 177.035 492.852 237.907 76.098 16
Adjusted Predicted Value 268.937 4750.187 1274.433 1240.3752 16
Residual -704.5668 2173.5952 .0000 680.5506 16
Std. Residual -1.000 3.086 .000 .966 16
Stud. Residual -1.303 3.188 -.022 1.028 16
Deleted Residual -
2320.1326 -37.6518 783.9849 16
1284.6863
Stud. Deleted Residual -1.339 5.868 .146 1.629 16
Mahal. Distance .010 6.405 .938 1.545 16
Cook's Distance .000 .814 .086 .211 16
Centered Leverage Value .001 .427 .063 .103 16

21
D
e
pn
d
e
n
t
V
a
r
i
bH
i
s
t
o
l
e
:
n
u
mg
r
a
m
a
r
u
ld
e
s
o
m
e
r
ix
s
t
e
n
i
a Dependent Variable: numarul de someri existenti

8
6
y
n
c
u
q
4
re
F
2
0-2R
-e
g
rs
1io
n
S
ta
0n
d
a
riz
1 e
d
R
e
s
id
2u
a
l
34M
e
a
n
=
S
t
d
.
D
e
v
N
=
1
69
.
7
1
E
0
9-
7
6

22
m
Pb
ro
C
u
td N
o
rD
ma
le
P
-p
ln
d eo
t
t001...860V
afR
ribe
g
ler
s
i
o
n
:n
u
m
aS
rut
a
n
d
r
ld
e
s
o
m
ei
zed
R
e
rix
ss
i
d
u
a
l
te
n
i
0
.0
4
c
p
E
e
x
.0
2 .2O
.00 se
rv
.b
0d
C
u
m
4
0
.
6P
ro
b
0
.
81.
0
5.3 Analiza dispersionala ANOVA
Descriptives

numarul de someri existenti


Std. 95% Confidence Interval for Minim Maximu
N Mean Deviation Std. Error Mean um m
Upper
Lower Bound Bound
foarte dezvoltata 4 2634.975 845.4783 422.7392 1289.630 3980.320 1581.3 3465.5
dezvoltata 7 314.343 132.8486 50.2120 191.478 437.207 165.5 467.3
slab dezvoltata 5 1409.640 1601.3968 716.1664 -578.757 3398.037 5.6 3523.7
Total 16 1236.781 1327.4967 331.8742 529.408 1944.154 5.6 3523.7

Test of Homogeneity of Variances

numarul de someri existenti


Levene
Statistic df1 df2 Sig.
25.841 2 13 .000

ANOVA

23
numarul de someri existenti
Sum of
Squares df Mean Square F Sig.
Between Groups 13925431.
2 6962715.954 7.236 .008

2
50
.2
908
Within Groups 12508279.
13 962175.364
737
mTotal 26433711.
644
15

0
.1
M e
o
50
.1
fn
o
n
a
ers
ri
0
.5
0. fo
a
rte ltan
dzvo iv
e
lu
d
ezv
de
z
vo
lta
o
l
t
a relta
ri
sl
a
b
d
ez
v
o
lt
a
Ipoteza nula este respinsa pentru ca Sig este inferior valorii de 0.5.

24
Capitolul 6.
Estimarea si testarea statistica

6.1 Estimarea parametrilor prin interval de incredere a unei medii


sau a unei proportii
Calculul intervalului de incredere pentru o medie sau pentru o proportie
presupune efectuarea urmatorilor pasi:
Calculul valorii tipice de sondaj;
Determinarea variabilitatii estimatorului considerat;
Alegerea intervalului de incredere;
Calculul limitelor intervalului de incredere.
Estimarea prin interval de incredere a unei medii

Cases

Valid Missing Total

N Percent N Percent N Percent


rata somajului calculata
la nivel de tara 16 100.0% 0 .0% 16 100.0%

Descriptives

25
Statistic Std. Error
rata somajului calculata Mean
9.513 1.1809
la nivel de tara
95% Confidence Lower Bound
6.995
Interval for Mean
Upper Bound
12.030

5% Trimmed Mean 9.158


Median 9.250
Variance 22.313
Std. Deviation 4.7237
Minimum 3.3
Maximum 22.1
Range 18.8
Interquartile Range 5.5
Skewness 1.175 .564
Kurtosis 2.267 1.091

Interpretare
Putem spune cu o incredere de 95% ca rata somajului la nivelul de
dezvoltare al tarilor din Uniunea Europeana este intre 6.995% si 12.030%.

Estimarea prin interval de incredere a unei proportii


Statistics

nivelul de dezvoltare al tarii


N Valid 16
Missing 0

nivelul de dezvoltare al tarii

Cumulative
Frequency Percent Valid Percent Percent
Valid foarte dezvoltata 4 25.0 25.0 25.0
dezvoltata 7 43.8 43.8 68.8
slab dezvoltata 5 31.3 31.3 100.0
Total 16 100.0 100.0

Se poate observa ca ponderea cea mai mare n cadrul Uniunii Europe o


au tatile dezvoltate cu un procent de 43.8%.

26

S-ar putea să vă placă și