Documente Academic
Documente Profesional
Documente Cultură
Introducere
Obiectivul proiectului Ancheta somajului este o metoda moderna pentru cercetarea statistica a pietei si fortei de munca avand ca obiectiv principal masurarea populatiei active ocupate si in somaj si a populatiei inactive la nivelul principalelor tari europene. Conceputa ca sursa importanta de informatii asupra fortei de munca, ancheta furnizeaza, intr-o maniera coerenta, date esentiale asupra tuturor segmentelor de populatie, cu numeroase posibilitati de corelare si structurare dupa caracteristici demo-socio-economice, diverse, in conditii de comparabilitate internationala.
2.1 Alegerea variabilelor analizate Pentru aceasta ancheta am considerat relevante urmatoarele variabile: Tara Populatia totala Numarul de someri Rata somajului Numarul de locuri de munca disponibile Nivelul de dezvoltare Variabila tara reprezinta zona geografica la care ne referim. Populatia totala face referire la numarul de locuitori aferent unei anumite tari din cadrul Uniunii Europene. Numarul de someri se refera la populatia care momentan este fara ocupatie si care beneficiaza de un ajutor din partea statului. Rata somajului este o variabila numerica care exprima procentul persoanelor somere in decursul unui an aferent populatiei totale a unei tari. Numarul de locuri de munca disponibile reprezinta oferta factorului de productie munca. Nivelul de dezvoltare se refera la gradul de dezvoltare al tarii. In figura 1 se evidentiaza o macheta de ecran a variabilelor prezentate anterior.
Figura 1. Variabile Orice analiza statistica a datelor in SPSS presupune pregatirea setului de date necesar anchetei.
2.2 Definirea variabilelor si introducerea datelor in SPSS Acest proces presupune prezentarea datelor intr-un format care sa permita organizarea si efectuarea analizei lor. Definirea si introducerea datelor sunt operatii care se efectueaza folosind foile Data View si Variable View din fereastra Data Editor. Astfel se alege tipul variabilei in coloana Type din foaia Variable View din fereastra Data Editor. Ele pot fi de mai multe tipuri si anume: Numerice (numeric, comma, dot, scientific notation); Alfanumerice (string). n acest proiect tipul predominant al variabilelor utilizate este cel numeric, cu exceptia variabilei tara care este de tip string. Numele variabilelor este limitat in general la 8 caractere, exceptie facand prima variabila a carui nume este de 10 caractere.
Nu s-au utilizat valori ale variabilelor urmand ca acestea sa fie introduse manual. Datele se introduc in celulele foii Data View din fereastra Data Editor deschisa prin comanda New Data din meniul File. Fiecare rand reprezinta un subiect, iar fiecare coloana reprezinta o variabila. In figura 2 este surprinsa o macheta in care este prezentata foaia Data View privind modul de introducere a datelor.
Figura 2
12
Frequency
populatia totala
Figura 3. Histograma pentru populatia totala Se observa n figura 3 o distributie cu un grad mare de asimetrie, normalitatea distributiei putand fi pusa sub semnul intrebarii.
Frequency
Mean = 9.893 Std. Dev. = 4.6282 N = 15 0 5.0 25.0 Figura 0.0 Histograma ratei 10.0 4. somajului 15.0nivel de20.0 la fiecare tara
In figura 4 putem observa o distributie aproximativ simetrica rezultand astfel o distributie normala.
15
12
Frequency
Mean = 2275.9 Std. Dev. = 4449.9726 N = 16 0 0.0 5000.0 10000.0 15000.0 20000.0 Figura 5. Histograma numarului de someri existenti n fiecare tara
In aceasta histograma putem observa o distributie asimetrica, deci distributia variabilei testate nu este normala.
14
12
10
Frequency
2 Mean = 649.525 Std. Dev. = 1277.1831 N = 16 0 0.0Figura 6. Histograma 3000.0 1000.0 2000.0 4000.0 numarului de 5000.0 6000.0 locuri disponibile
La fel ca si in cazul anterior distributia are un grad mare de asimetrie, fiind astefel considerata o distributie anormala. Q-Q plot
Estimated Distribution Parameters
Normal Distribution
Location Scale
2,000
1,000
-1,000
-2,000 0 6,000 Figura 7. Q-Q plot pentru variabila numarul 2,000 de locuri de4,000 munca disponibile
-2,000
Observed Value
200,000
100,000
-100,000
Figura 8. Q-Q plot pentru variabila populatia totala -200,000 -100,000 0 100,000 200,000 300,000
Observed Value
400,000
10
9,000
6,000
3,000
-3,000
Observed Value Figura 9. Q-Q plot pentru variabila numarul de someri aferent fiecarei tari
11
15
10
0 0 5 10 15 20 25
Figura 10. Q-Q plot pentru variabila rata somajului. Dupa cum am evidentiat in procedeul histogramei putem spune ca distributia normala este intalnita doar in cazul variabilei rata somajul. In cazul celorlalte variabile distributia este asimetrica, deci aceasta nu este normala.
Observed Value
12
4.1 Descrierea statistica a variabilelor nominale Variabilele statistice numite si caracteristici statistice reprezinta siruri de valori reale inregistrate la nivelul unitatilor statistice ale unei colectivitati bine definite. Exprima insusiri, trasaturi esentiale purtate de unitatile statistice ale unei colectivitati. Dupa modul de exprimare variabilele pot fi numerice sau cantitative si variabile nenumerice sau atributive care la randul lor pot fi nominale sau nominal ordinale. Variabilele nominale sunt caracteristici ale caror modalitati de manifestare sunt exprimate atributiv, in cuvinte, de exemplu variabila nivelul de dezvoltare al tarii. Cum putem observa si in exemplul nostru, cand numarul variantelor unei caracteristici atributive este mare, acestea fac obiectul nomenclatoarelor statistice, de exemplu, nomenclatorul tarilor Uniunii Europene. Distributiile dupa o variabila nominala poate fi reprezentata in SPSS cu ajutorul diagramelor BAR si PIE.
Statistics nivelul de dezvoltare al tarii N Valid 16 Missing 0 nivelul de dezvoltare al tarii Cumulative Percent 25.0 68.8 100.0
Valid
Frequency 4 7 5 16
13
Diagrama BAR
Frequency
foarte dezvoltata dezvoltata slab al tarii Figura 11. Diagrama BAR pentru variabila nivelul de dezvoltare dezvoltata
14
Digrama PIE
Figura 12. Diagrama PIE pentru variabila nivelul de dezvoltare al tarii Interpretare Cum se poate observa, in esantionul ales cea mai mare pondere o au tarile dezvoltate, ele reprezentand 43.8% din totalul tarilor luate in calcul avand in vedere nivelului de dezvoltare al acestora. 4.2 Descrierea statistica a variabilelor numerice Variabilele numerice sunt numite si cantitative si pot fi numarabile sau masurabile respectiv cu variatie discontinua (variabile discrete), sau cu variatie continua(variabile continue). 15
In cazul caracteristicilor anchetei efectuate variabilelle discrete iau valori numarabile de exemplu: populatia totala a tarii, numarul somerilor si locurile de munca disponibile. Variabilele continue exprima dimensiuni numarabile cum ar rata somajului. Ele pot fi reprezentate grafic prin intermediul histogramei, Q-Q plot si Boxplot. Histograma
10
Frequency
Mean = 2.06 Std. Dev. = 0.772 N = 16 0 0.5 1 1.5 2 2.5 3 Figura 13. Histograma variabilei nivelului de dezvoltare 3.5 tarii al
Interpretare
Se observa o distribuite simetrica ceea ce ne duce la concluzia ca avem dea face cu o distributie normala.
16
17
4000.0
3000.0
2000.0
1000.0
Interpretare
populatia totala
Pentru exemplul considerat s-a obtinut un coeficient de corelatie Pearson egal cu 0.482, ceea ce indica existenta unei corelatii directe intre cele doua variabile. Nu este o legatura puternica si nici slaba, valoarea acestui coeficient fiind la mijlocul intervalului. Valoarea SIG este de 0.059 ceea ce inseamna ca legatura este directa, insa foarte slaba.
18
Analiza de regresie
Statistics nivelul de dezvoltare al tarii N Valid 16 Missing 0 nivelul de dezvoltare al tarii Cumulative Percent 25.0 68.8 100.0
Valid
Frequency 4 7 5 16
Frequency
19
Descriptive Statistics Mean numarul de someri existenti numarul de locuri disponibile 1236.781 371.825 Std. Deviation 1327.4967 414.1279 N 16 16
Model Summary(b) Adjusted R Std. Error of R R Square Square the Estimate .859(a) .737 .718 704.4368 a Predictors: (Constant), numarul de locuri disponibile b Dependent Variable: numarul de someri existenti
Model 1
Interpretare Valoarea R ia valori intre -1 si 1 si arata daca exista sau nu o corelatie intre variabila dependenta (numarul de someri existenti) si variabile independenta (numarul de locuri de munca dispobinibile la nivelul fiecarei tari). In interpretarea modelului, se foloseste coeficientul de determinatie R 2 . Valoarea R 2 ia valori intre 0 si 1. Acest indicator este folosit pentru stabilirea carui model de regresie este cel mai bine de utilizat. In cazul variabilelor alese,
20
se observa ca valoarea este de 0.737 ceea ce indica faptul ca modelul de aregresie ales explica aproximativ legatura dintre variabile. Acesta valoare indica o legatura intre cele doua variabile destul de stransa si directa.
ANOVA(b) Sum of Squares df Regression 19486474. 1 720 Residual 6947236.9 14 25 Total 26433711. 15 644 a Predictors: (Constant), numarul de locuri disponibile b Dependent Variable: numarul de someri existenti Model 1
F 39.269
Sig. .000(a)
a Dependent Variable: numarul de someri existenti Residuals Statistics(a) Minimum 239.025 -.875 177.035 268.937 -704.5668 -1.000 -1.303 1284.6863 -1.339 .010 .000 Maximum 4121.336 2.531 492.852 4750.187 2173.5952 3.086 3.188 2320.1326 5.868 6.405 .814 Mean 1236.781 .000 237.907 1274.433 .0000 .000 -.022 -37.6518 .146 .938 .086 .063 Std. Deviation 1139.7799 1.000 76.098 1240.3752 680.5506 .966 1.028 783.9849 1.629 1.545 .211 .103 N 16 16 16 16 16 16 16 16 16 16 16 16
Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value
21
Histogram
Frequency
0 -2 -1 0 1 2 3 4
22
0.8
0.6
0.4
0.2
0.0
0.0
0.2
0.4
0.6
0.8
1.0
Std. Error
4 7 5 16
Test of Homogeneity of Variances numarul de someri existenti Levene Statistic 25.841 df1 2 df2 13 Sig. .000 ANOVA
23
numarul de someri existenti Sum of Squares 13925431. 908 12508279. 737 26433711. 644 df 2 13 15 Mean Square 6962715.954 962175.364 F 7.236 Sig. .008
2500.0
2000.0
Mean of nrsomeri
1500.0
1000.0
500.0
foarte dezvoltata slab dezvoltata Ipoteza nula este respinsa pentru ca Sigdezvoltata este inferior valorii de 0.5.
24
Cases Valid N rata somajului calculata la nivel de tara 16 Percent 100.0% N 0 Missing Percent .0% N 16 Total Percent 100.0%
Descriptives
25
Statistic rata somajului calculata la nivel de tara Mean 95% Confidence Interval for Mean Lower Bound Upper Bound 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis 9.513 6.995 12.030 9.158 9.250 22.313 4.7237 3.3 22.1 18.8 5.5 1.175 2.267
.564 1.091
Interpretare Putem spune cu o incredere de 95% ca rata somajului la nivelul de dezvoltare al tarilor din Uniunea Europeana este intre 6.995% si 12.030%. Estimarea prin interval de incredere a unei proportii
Statistics nivelul de dezvoltare al tarii N Valid 16 Missing 0
Valid
Frequency 4 7 5 16
Se poate observa ca ponderea cea mai mare n cadrul Uniunii Europe o au tatile dezvoltate cu un procent de 43.8%.
26