Documente Academic
Documente Profesional
Documente Cultură
CU AJUTORUL CELOR
2 METODE
Coordonator:
Studente:
2
INTRODUCERE
Formarea și funcționarea pieței muncii sunt două din procesele fundamentale și complexe
ale tranziției la economia de piață în România.Tranziția a impus reconsiderarea bazelor teoretice
ale politicii de ocupare și folosire a forței de muncă, ale mecanismelor de reglare a cererii și
ofertei de forță de muncă datorită caracterului deosebit al mărfii care circulă pe această piață.
Aceste particularități o diferențiază de celelalte piețe și o face să îndeplinească funcții importante
în asigurarea și menținerea echilibrelor macroeconomice și a stabilității social-politice.
Prin acest proiect am vrut să realizăm o analiză din punct de vedere statistic a pieței
muncii la nivelul județelor României din perspectiva ocupării și șomajului.
Am ales această temă deoarece consider că piața muncii va fi mereu un subiect de
actualitate întrucât prin intermediul ei se tranzacționează cea mai importantă resursă și anume
forța de muncă.
Piața muncii reprezintă “ansamblul tuturor actelor de vânzare cumpărare a forței de
muncă, împreună cu spațiul economic și timpul în care au loc. Condițiile specifice ale pieței
muncii au la bază raportul dintre oferta și cererea de muncă. Reglarea ofertei cu cererea de muncă
se realizează prin salariul real, iar salariul apare ca prețul închirierii muncii unor oameni liberi
sub aspect juridic și economic, în condițiile reglementate ale pieței” (Știrbu, E., 2005, p. 297).
Piața forței de muncă mai poate fi definită ca sistem al tranzacțiilor care asigură, prin
mecanisme specifice- înainte de toate prin intermediul negocierilor și al salariului- echilibrarea
ofertei și cererii de forță de muncă (Crețoiu, Gh., 2007, p. 163).
3
Populația și variabilele studiate
Sursa din care am luat datele necesare analizei este site-ul INSSE
http://statistici.insse.ro/shop/?lang=ro, domeniul FORȚA DE MUNCĂ, CONTURI
NAȚIONALE, EDUCAȚIE și MIȘCAREA MIGRATORIE A POPULAȚIEI.
Analiza datelor a fost realizată cu ajutorul pachetului software SPSS versiunea 23.0
Sursa:SPSS
4
1. Analiza Cluster
Analiza cluster este o metodă multivariată a datelor care are ca scop formarea de grupe
omogene de unităţi statistice, în funcţie de gradul de asemănare (similaritate) dintre subiecţii
consideraţi.
Analiza cluster face, astfel, posibilă identificarea profilului unităţilor reunite într-o clasă,
caracterizarea grupelor, tipologiilor obţinute.
Analiza cluster se aplică în cazul variabilelor numerice, dar și nenumerice luate separat
pentru Hierarchical Cluster, numerice pentru K-Means Cluster și pentru Two-Step Cluster
numerice și categoriale luate împreună.
Analiza cluster are ca scop identificarea unui set de grupe omogene prin gruparea
elementelor astfel încât presupune maximizarea varianţei intergrupe şi minimizarea varianţei
intragrupe. (Pintilescu, C., 2007, p.194 ).
Din pachetele software dedicate acestui tip de analiză, am ales să folosim, software-ul
SPSS.
Demersul acestei analize se face astfel: accesăm programul SPSS, meniul
Analyze→Classify→Hierarchical Cluster.
5
1.3 Rezultatele clasificării ierarhice
a. Matricea proximităților
Conform matricei de proximitate se pot observa unitățile statistice între care există cele
mai mici sau cele mai mari distanțe.
Cea mai mică distanță care se regăsește în matricea proximităților este între județele
Bihor-Mureș, Bihor-Maramureș, iar cea mai mare distanță este între Iași-Bihor, Iași -Maramureș,
Iași-Mureș.
Agglomeration Schedule
Cluster Stage Cluster First
Combined Appears
Cluster Cluster Coefficie Next
Stage 1 2 nts Cluster 1 Cluster 2 Stage
1 26 29 .357 0 0 10
2 19 24 .992 0 0 9
3 6 10 1.670 0 0 7
4 34 36 2.427 0 0 17
5 9 23 3.285 0 0 16
6 4 14 4.223 0 0 13
7 6 37 5.247 3 0 24
8 7 40 6.312 0 0 15
6
9 19 39 7.522 2 0 16
10 26 28 8.822 1 0 30
11 21 30 10.270 0 0 31
12 1 11 11.748 0 0 25
13 4 16 13.245 6 0 28
14 13 17 15.305 0 0 31
15 2 7 17.448 0 8 27
16 9 19 19.934 5 9 24
17 27 34 22.589 0 4 26
18 8 12 25.246 0 0 29
19 5 20 27.979 0 0 22
20 25 33 31.173 0 0 25
21 3 41 34.383 0 0 36
22 5 38 37.904 19 0 27
23 18 31 41.680 0 0 26
24 6 9 46.203 7 16 30
25 1 25 50.958 12 20 29
26 18 27 56.419 23 17 33
27 2 5 62.291 15 22 28
28 2 4 69.537 27 13 35
29 1 8 77.540 25 18 32
30 6 26 86.574 24 10 33
31 13 21 98.590 14 11 32
32 1 13 113.468 29 31 36
33 6 18 128.506 30 26 35
34 32 35 146.729 0 0 37
35 2 6 166.376 28 33 39
36 1 3 193.617 32 21 38
37 22 32 223.052 0 34 39
38 1 15 263.099 36 0 40
39 2 22 303.814 35 37 40
40 1 2 440.000 38 39 0
7
c. Dendograma
Dendograma este rezultatul clasificării ierarhice și arată divizările clusterelor, dar oferă în
același timp și o sinteză în ceea ce privește clasificarea grupurilor. Această diagramă ne ajută să
alegem numărul de clustere care face cea mai bună clasificare a unităților statistice.
Potrivit dendogramei din figura 3, clusterele pe care le-am considerat în analiză sunt în
număr de 4. Acestea sunt formate din următoarele județe:
Clusterul 1 are 12 județe ( Bihor, Cluj, Brașov, Mureș, Sibiu, Bacău, Suceava,
Constanța, Argeș, Prahova, Dolj și Timiș);
Clusterul 2 are 25 de județe ( Banat, Maramureș, Satu Mare, Sălaj, Alba, Covasna,
Harghita, Botoșani, Neamț, Vaslui, Brăila, Buzău, Tulcea, Vrancea, Călărași, Dâmbovița,
Giurgiu, Ialomița, Teleorman, Gorj, Olt, Vâlcea, Arad, Caraș-Severin și Hunedoara);
Clusterul 3 are un județ (Iași);
Clusterul 4 are 3 județe (Galați, Ilfov, Mehedinți).
8
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
Cu ajutorul testului ANOVA am putut observa dacă sunt diferențe semnificative între
mediile grupurilor de județe. Pentru a verifica cele spuse am formulat următoarele ipoteze:
9
H0: µ1=µ2=µ3=µ4
H1: cel puțin două medii sunt egale
După cum putem observa din tabelul ANOVA valoarea Sig pentru toate variabilele
analizate este mai mică decât α care este egală cu 0,05, ceea ce ne duce la respingerea ipotezei
nule, respectiv a lui H0 și la acceptarea ipotezei alternative H1. Prin urmare putem afirma că între
mediile variabilelor (rata șomajului, rata de activitate a resurselor de muncă, rata de ocupare a
resurselor de muncă, Produsul Intern Brut, câștigul salarial nominal mediu net lunar, numărul de
migranți definitivi, nivelul de studii și cheltuielile pentru formarea profesională) există diferențe
semnificative între clustere.
Tabel 3: ANOVA
ANOVA
Sum of
Squares df Mean Square F Sig.
Rata șomajului Between .00
63.810 2 31.905 5.510
(procente) Groups 8
Within Groups 214.230 37 5.790
Total 278.040 39
Rata de activitate a Between .00
1574.987 2 787.494 7.161
resurselor de munca Groups 2
(procente) Within Groups 4068.760 37 109.966
Total 5643.748 39
Rata de ocupare a Between .00
1811.525 2 905.762 9.537
resurselor de muncă Groups 0
(procente) Within Groups 3513.955 37 94.972
Total 5325.480 39
Produsul Intern Brut Between 1538624832. 769312416.0 28.32 .00
2
(mil lei) Groups 183 92 0 0
Within Groups 1005100188. 27164869.95
37
497 9
Total 2543725020.
39
680
Câștigul salarial Between 12.66 .00
695962.673 2 347981.337
nominal mediu net lunar Groups 0 0
pe activități ale Within Groups 1016992.427 37 27486.282
10
economiei naționale, Total
1712955.100 39
(lei)
Emigranți definitivi Between 10.62 .00
427721.698 2 213860.849
(persoane) Groups 0 0
Within Groups 745102.677 37 20137.910
Total 1172824.375 39
Elevi înscriși în Between 4152795183. 2076397591. 32.68 .00
2
învățământul primar și Groups 218 609 5 0
gimnazial (persoane) Within Groups 2350521221. 63527600.58
37
557 3
Total 6503316404.
39
775
Elevi înscriși în Between 604875928.8 302437964.4 18.73 .00
2
învățământul liceal Groups 43 22 3 0
(persoane) Within Groups 597341976.7 16144377.75
37
57 0
Total 1202217905.
39
600
Elevi înscriși în Between 15.78 .00
9901756.868 2 4950878.434
învățământul Groups 9 0
profesional (persoane) Within Groups 11602087.10
37 313569.922
7
Total 21503843.97
39
5
Studenti și cursanți Between 2944679046. 1472339523. 15.35 .00
2
înscriși în învățământul Groups 043 022 8 0
superior (licență, Within Groups 3547215902. 95870700.06
37
master, cursuri 357 4
postuniversitare, Total
doctorat și programe 6491894948.
39
postdoctorale) 400
(persoane)
Cheltuieli pentru Between 51771635223 25885817611 .22
2 1.561
formarea profesională Groups .333 .667 3
(Lei RON) Within Groups 61350661136 16581259766
37
6.667 .667
11
Total 66527824659
39
0.000
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
2. Analiza Discriminant
Analiza discriminant este o metodă de analiză multivariată a datelor care are ca obiective:
Scopul analizei este acela de a clasifica una sau mai multe observații noi în grupuri.
Din pachetele software dedicate acestui tip de analiză, am ales să folosim, software-ul
SPSS.
Demersul acestei analize se face astfel: accesăm programul SPSS, meniul
Analyze→Classify→Discriminant.
12
2.3 Ipoteze formulate în Analiza Discriminant
Ipoteza de normalitate
Ipoteza de multicoliniaritate
Ipoteza de independență
Ipoteza de omogenitate (homoscedasticitate)
Ipoteza de normalitate
13
După cum putem observa, valoarea sig este mai mică decât riscul asumat (0,05), deci se respinge
ipoteza nulă, așadat ipoteza nu urmează o lege normală.
Această ipoteză o vom testa cu ajutorul testului Box test deoarece avem caz
multivariat.
Test Results
Box's M 152.484
F Approx. 3.951
df1 30
df2 2570.882
Sig. .000
14
Tests null hypothesis of equal
population covariance matrices.
Sig=0,000
α = 0,05 => Sig < 0,05. Se respinge H0, se acceptă ipoteza de heteroscedasticitate.
Datorită eșantionului mic și a nr. unităților inegal această ipoteză a fost încălcată.
În urma prelucrării datelor în SPSS, folosind AD, se obțin mediile variabilelor cantitative
pe cele trei grupe, testul de egalitate a mediilor pe grupe, valori proprii ale funcției discriminant,
testul Wilk’s Lambda, coeficienții funcției discriminant standardizați, coeficienții de corelație cu
fiecare ax discriminant, coeficienții funcției discriminant nestandardizați, scorul mediu
discriminant, ecuațiile de clasificare, grafice și rezultatele clasificării.
15
u Produsul Intern Brut
7725.3364 2277.77529 11 11.000
mil lei
Rata de ocupare a
resurselor de munca 59.6818 18.62476 11 11.000
procent
Emigranti definitivi
245.1818 116.08602 11 11.000
persoane
castig_sal_ridica Rata șomajului procent 4.7300 2.41511 20 20.000
t Produsul Intern Brut
16386.7100 9268.33554 20 20.000
mil lei
Rata de ocupare a
resurselor de munca 63.7750 8.34366 20 20.000
procent
Emigranti definitivi
390.8000 225.04517 20 20.000
persoane
Total Rata șomajului procent 5.0585 2.63799 41 41.000
Produsul Intern Brut
11841.5146 8096.95821 41 41.000
mil lei
Rata de ocupare a
resurselor de munca 63.0976 11.63206 41 41.000
procent
Emigranti definitivi
309.8537 190.33360 41 41.000
persoane
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
Conform tabelului de mai sus, PIB-ul din grupa 3 are media cea mai mare.
Sigrata șomaj=0,146 >0,05 => Nu se respinge ipoteza nulă. Nu există diferențe semnificative de rata
șomajului pe cele 3 grupe de câștig salarial. Aceasta arată că rata șomajului nu explică gruparea
unităților pe cele 3 grupe.
Eigenvalues
Functio Eigenvalu % of Cumulative Canonical
n e Variance % Correlation
a
1 .474 78.2 78.2 .567
a
2 .132 21.8 100.0 .342
a. First 2 canonical discriminant functions were used in the
analysis.
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
Prima funcție va explica 78,2% din varianța totală, iar a doua funcție explica 21,8 % din varianța
totală.
Funcția discriminant 1
Sig=0,017<0,05 => Se respinge ipoteza nulă. Prin urmare, funcția discriminant 1 este
semnificativ statistic.
18
Standardized Canonical Discriminant
Function Coefficients
Function
1 2
Rata șomajului procent .113 .881
Produsul Intern Brut
.877 .178
mil lei
Rata de ocupare a
resurselor de munca -.090 .544
procent
Emigranti definitivi
.266 -.059
persoane
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
f. Matricea de structură
Tabel 9 :Coeficientul de corelație cu fiecare ax discriminant
Structure Matrix
Function
1 2
Produsul Intern Brut .969* -.017
mil lei
Emigranti definitivi
.676* -.117
persoane
Rata șomajului procent -.200 .815*
Rata de ocupare a
resurselor de munca .078 .511*
procent
19
Pooled within-groups correlations between
discriminating variables and standardized
canonical discriminant functions
Variables ordered by absolute size of
correlation within function.
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
Factorii care influențează piața muncii din România, Pib-ul și Rata șomajului explică cel mai
mult formarea celor două axe.
Prima funcție discriminant este definită de variabila PIB și separă grupa de câștig salarial redus
pe deoparte de grupele de câștig salarial mediu și ridicat.
A doua funcție discriminant este definită de variabila rata șomajului și separă grupa de câștig
salarial mediu pe deoparte de grupele de câștig salarial redus și ridicat.
20
F1= -1,705+0,044*Rata șomajului+0,000*PIB-0,008*Rata de ocupare+0,002*Emigranți
F1: Dcâștig_sal_redus=-1,705+0,044*6,46+0,000*7278,92+0,008*65,5+0,002*219,1=-0,672
F1: Dcâștig_sal_mediu=-0,623
F1: Dcâștig_sal_ridicat=0,679
Diferența cea mai mare este pentru grupa cu un câștig salarial ridicat pe deoparte, și grupele cu
câștig salarial redus și mediu pe de altă parte.
h. Funcția de clasificare
21
castig_sal_re castig_sal_m castig_sal_ri
dus ediu dicat
Rata șomajului procent 1.266 .933 1.156
Produsul Intern Brut
9.886E-5 7.982E-5 .000
mil lei
Rata de ocupare a
resurselor de munca .472 .426 .439
procent
Emigranti definitivi
.005 .005 .007
persoane
(Constant) -21.553 -16.828 -21.329
Fisher's linear discriminant functions
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
22
j. Rezultatele clasificării
Classification Resultsa
Predicted Group Membership
castig_sal_re castig_sal_m castig_sal_ri
catig_sal dus ediu dicat Total
Original Count castig_sal_redus 8 1 1 10
castig_sal_medi
4 6 1 11
u
23
castig_sal_ridica
5 4 11 20
t
% castig_sal_redus 80.0 10.0 10.0 100.0
castig_sal_medi
36.4 54.5 9.1 100.0
u
castig_sal_ridica
25.0 20.0 55.0 100.0
t
a. 61.0% of original grouped cases correctly classified.
Sursa: Prelucrarea datelor în SPSS, versiunea 23.0
61 % din cazuri au fost clasificate corect. În urma clasificării, aceasta nu poate fi folosită în scop
predictiv, deoarece unitățile statistice sunt mai mici de 70 %.
3. Concluzii
În urma analizei efectuate, putem extrage câteva concluzii cu privire la rezultatele afișate
cu ajutorul analizei Cluster și Discriminant.
Conform matricei de proximitate se pot observa unitățile statistice între care există cele
mai mici sau cele mai mari distanțe.
Cea mai mică distanță care se regăsește în matricea proximităților este între județele
Bihor-Mureș, Bihor-Maramureș, iar cea mai mare distanță este între Iași-Bihor, Iași -Maramureș,
Iași-Mureș.
Creșterea valorii în ceea ce privește distanța începe cu etapa 38 ceea ce ne arată că
numărul clusterelor în care pot fi grupate unitățile statistice este de patru clustere.
Putem afirma că între mediile variabilelor (rata șomajului, rata de activitate a resurselor
de muncă, rata de ocupare a resurselor de muncă, Produsul Intern Brut, câștigul salarial nominal
mediu net lunar, numărul de migranți definitivi, nivelul de studii și cheltuielile pentru formarea
profesională) există diferențe semnificative între clustere.
Cu ajutorul analizei discriminant am observat că prima funcție discriminant va explica
78,2% din varianța totală, iar a doua funcție explica 21,8 % din varianța totală.
După cum am precizat mai sus, factorii care influențează piața muncii din România sunt
Pib-ul și Rata șomajului care explică cel mai mult formarea celor două axe.
24
4. Bibliografie
5. Anexe
25
Prior Probabilities for Groups
26