Sunteți pe pagina 1din 40

Facultatea:Cibernetica,Statistica si Informatica Economica

Specializarea:Cibernetica Economica

PROIECT ANALIZA DATELOR


IMPACTUL SISTEMULUI EDUCATIONAL ASUPRA ECONOMIEI

STUDENTI: Dimbu Bianca Andreea si

Budac Andrei Marius

GRUPA:1059

2018

BUCURESTI
INTRODUCERE

Am ales un set de date pentru anul 2015 ,date preluate de pe http://epp.eurostat.ec.europa.eu


care contine 14 variabile pentru 27 de tari .

Indicatorii principali sunt:

I1- numarul de elevi inscrisi la liceu in anul 2015 exprimati in mii elevi

I2- numarul de elevi inrolati la liceu in anul 2015 exprimati in mii elevi

I3- numar de someri in mii oameni

I4- numar de infractori in mii oameni

I5- procent persoane angajate ale caror cunostinte din facultate le folosesc la locul de munca

I6- procent persoane care se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6 luni

I7- nr absolventi facultate

I8- procentul elevilor de 15 ani care au abandonat scoala

I9- rata de angajare a tinerilor din categoria de varsta 19-25

I10- procent persoane care s-au angajat de la o varsta frageda

I11- cheltuieli cu educatia

I12- nr profesori din liceu

I13- gradul de saracie

I14- procent din cheltuiala publica totala alocata pentru ajutorarea studentilor si burse

Tarile analizate
sunt:Belgia,Bulgaria,Cehia,Danemarca,Estonia,Irlanda,Grecia,Spania,Croatia,Cipru,Letonia,Litu
ania,Luxemburg,Ungaria,Malta,Olanda,Austria,Polonia,Portugalia,Romania,Slovenia,Slovacia,F
inlanda,Suedia,Islanda,Norvegia,Elvetia.

Initial au fost introduce in setul de date si Germania,Italia,Marea Britanie,Turcia si Franta,insa


datorita faptului ca aceste tari sunt mult mai dezvolatate decat media celorlate tari,valoriile lor nu
se incadrau in intervalele quartiliene ale indicatoriilor ,ele reprezentand outlieri ce urmau sa ne
afecteze calculele statistice ,afectand media si abateriile standard.Astfel,am hotarat sa lucram pe
setul de date prezentat mai sus.
Scopul acestui proiect este reprezentat de extrarea unor concluzii referitoare la influenta
sistemului educational asupra economiei.

STATISTICI DESCRIPTIVE

1.Numarul de someri
Din primul output observam ca media somerilor este 293.100 oameni in cele 27 de tari analizate si se
regaseste in intervalul format de valoarea minima si cea maxima,adica [8000;670000],aceasta putand fi
reprezentativa.Mediana este 252.000,ceea ce arata ca jumatate din tarile analizate au numarul de
someri mai mic decat aceasta valoare,restul fiind mai mari. Abaterea standard este 221.6996,ceea ce
demonstreaza faptul ca numarul de someri ai tarilor analizate se abat de la valoare medie cu 221.6996
someri.Prima quartila ne arata faptul ca un sfert din tari au mai putin de 111000 someri,restul fiind mai
mare,iar cea de-a treia ne prezinta faptul trei sferturi din tari au un numar de someri mai mic 404500
someri,restul avand mai multi.Din histograma reiese faptul ca majoritatea tarilor au un numar de
someri care se regaseste in unul din urmatoarele interval:[0;100000],[200000;400000].Coeficientul de
variatie egal cu 75.636% reiese faptul ca media nu este reprezentativa.Boxplotul ne arata ca nu avem
outlieri.Boltirea si aplatizarea: coeficientul de asimetrie este 0.51>0,ceea ce inseamna asimetrie pozitiva
in care predomina valorile mici,iar coeficientul de boltire este 2.04<3,relevand o distributie platicurtica
cu valori departate de medie.
Din graficul de mai sus se poate observa ca numarul somerilor are o densitate mare in jurul valorii de
200000.

2.Procent personae ce se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6


luni
Observam ca media procentului care se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6
luni din cele 27 de tari analizate este de 16,06%,aceasta putand fi reprezentativa apartinand intervalului
format de valoarea minima si cea maxima,adica [8.00%;26%].Mediana are valoarea de 15.40%,ceea ce
arata ca in jumatate din tarile analizate procentul persoanelor care se gandesc ca ar putea fi concediate
este mai mic decat aceasta valoare,restul fiind mai mari.Prima quartila are valoarea de
13.45%,demonstrand faptul ca un sfert din tarile analizate au un procent al persoanelor care se gandesc
ca ar putea fi concediate mai mic decat aceasta valoare,restul avand valori mai mari,iar cea de-a treia
prezinta faptul ca trei sferturi din tari au o valoare mai mica 18.90%,restul fiind mai mari.Abaterea
standard este de 4,607,ceea ce arata ca tarile in care procentul persoanelor care presupun ca ar putea fi
concediate in urmatoarele 6 luni se abat de la medie cu aproximativ 4,607%.Histograma ne arata faptul
ca majoritatea valorilor din tarile analizare se afla in intervalul [10%-20%],destul de mare pentru tarile
din Uniunea Europeana.Din boxplot reiese ca nu avem outlieri.Coeficentul de variatie este de
28.69%<35%,ceea ce inseamna ca media este reprezentativa.Coeficientul de asimetrie este
0.44>0,relevand o asimetrie pozitiva in care predomina valorile mici ale procentelor din tarile
analizate,iar cel de boltire este 2.71<3,ce demonstreaza o distributie platicurtica cu valori departate de
medie.Densitatea de probabilitate a variabilelor prezinta faptul ca procentul persoanelor care se
gandesc ca si-ar putea pierde locul de munca in urmatoarele 6 luni este mare in jurul valorii de 15%,o
cifra destul de mare pentru tarile din Uniunea Europeana.

3.Procentul eleviilor de 15 ani care au abandonat scoala


Observam ca media elevilor de 15 ani care au abandonat scoala din cele 27 de tari analizate este de
23.71%,aceasta putand fi reprezentativa fiind in intervalul format de valoarea maxima si cea
minima,adica [11.20;42.60]. Mediana este 21.80% ceea ce semnifica faptul ca jumatate din tarile
analizate au procentul elevilor de 15 ani care au abandonat scoala mai mic de 21.80%,restul fiind mai
mare.Prima quartile arata ca un sfert din tari au un procent de abandon scolar mai mic de 16.90%,restul
fiind mai mare,iar cea de-a treia ne prezinta faptul ca trei sferturi au un procent de abandon scolar mai
mic de 27.85%,restul fiind mai mare.Abaterea standard este 8.70% ceea ce ne arata procentul
abandonului scolar in cele 27 de tari se abate de la medie cu aproximativ 8.70 procente.Histograma ne
arata ca majoritatea procentelor de abandon scolar se afla in intervalul [15%-30%],destul de mare
pentru tarile din Uniunea Europeana.Din boxplot reiese ca nu avem outlieri. Coeficientul de variatie este
de 36.71%,ceea ce demonstreaza ca media nu este reprezentativa.Coeficientul de asimetrie este
0.78>0,ceea ce inseamna asimetrie pozitiva in care predomina valorile mici,iar cel de boltire este
2.79<3,relevand o distributie platicurtica cu valori departate de medie.Densitatea de probabilitate ne
arata faptul ca procentul de abandon scolar are o densitate mare in jurul valorii de 20%,aici aflandu-se o
mare parte din valori.
ANALIZA COMPONENTELOR PRINCIPALE
Analiza componentelor principale este o tehnică de analiză multidimensională care are ca scop
generic sintetizarea informaţională (reducerea dimensionalităţii datelor) şi eliminarea
redundanţelor informaţionale (suprapunerilor informaţionale).

Dimensionalitatea datelor este justificată pe baza matricei de observaţii: 27 de observaţii cu 14


caracteristici, în total 378 de date.

Redundanţa datelor este justificată pe baza matricei de corelaţie calculate mai jos din care reiese
faptul că între variabile există corelaţii puternice (conţine valori apropiate de 1 sau -1) deci există
suprapunere informaţională pe care vom dorii sa le eliminăm.

Componentele principale notate wi, sunt combinaţii liniare de variabile originale care au 2
proprietăţi: - au varianţă maximală descrescătoare: Var(W1)>Var(W2)>...>Var(Wn);
- dunt necorelate două câte două: Cov(Wi, Wj)= 0, i≠j.
Mai jos putem observa statisticile descriptive pentru fiecare indicator in parte :
> summary(date_ACP)

Indicatori.2015 COD_TARA I1 I2

Austria :1 AT : 1 Min. : 79572 Min. : 4400

Belgium :1 BE : 1 1st Qu.: 403179 1st Qu.: 28019

Bulgaria :1 BG : 1 Median :1284910 Median : 65382

Croatia :1 CH : 1 Mean :1361269 Mean : 71881

Cyprus :1 CY : 1 3rd Qu.:1982811 3rd Qu.:102956

Czech Republic: 1 CZ : 1 Max. :4175715 Max. :196067

(Other) :21 (Other):21

I3 I4 I5 I6

Min. : 8.0 Min. : 3940 Min. :45.80 Min. : 8.00

1st Qu.:111.0 1st Qu.: 25030 1st Qu.:53.70 1st Qu.:13.45

Median :252.0 Median : 80340 Median :56.10 Median :15.40


Mean :293.1 Mean :119497 Mean :56.74 Mean :16.06

3rd Qu.:404.5 3rd Qu.:184239 3rd Qu.:60.45 3rd Qu.:18.90

Max. :670.0 Max. :398477 Max. :69.80 Max. :26.00

I7 I8 I9 I10

Min. : 1603 Min. :11.20 Min. : 1.70 Min. :0.300

1st Qu.: 22938 1st Qu.:16.90 1st Qu.: 9.65 1st Qu.:0.900

Median : 62718 Median :21.80 Median : 22.10 Median :1.700

Mean : 59945 Mean :23.71 Mean : 48.34 Mean :2.393

3rd Qu.: 80916 3rd Qu.:27.85 3rd Qu.: 79.70 3rd Qu.:3.900

Max. :148942 Max. :42.60 Max. :155.50 Max. :6.700

I11 I12 I13 I14

Min. : 502.2 Min. : 1825 Min. :12.50 Min. :3.300

1st Qu.: 1915.2 1st Qu.: 9469 1st Qu.:18.25 1st Qu.:4.100

Median : 8598.3 Median : 28192 Median :22.40 Median :4.600

Mean :17297.3 Mean : 32704 Mean :23.58 Mean :4.734

3rd Qu.:28541.2 3rd Qu.: 48969 3rd Qu.:28.75 3rd Qu.:5.450

Max. :55007.4 Max. :103930 Max. :41.30 Max. :6.130

Indicatorii principali sunt:

I1- numarul de elevi inscrisi la liceu in anul 2015 exprimati in mii elevi

I2- numarul de elevi inrolati la liceu in anul 2015 exprimati in mii elevi

I3- numar de someri in mii oameni

I4- numar de infractori in mii oameni

I5- procent persoane angajate ale caror cunostinte din facultate le folosesc la locul de munca

I6- procent persoane care se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6 luni

I7- nr absolventi facultate


I8- procentul elevilor de 15 ani care au abandonat scoala

I9- rata de angajare a tinerilor din categoria de varsta 19-25

I10- procent persoane care s-au angajat de la o varsta frageda

I11- cheltuieli cu educatia

I12- nr profesori din liceu

I13- gradul de saracie

I14- procent din cheltuiala publica totala alocata pentru ajutorarea studentilor si burse

Pentru I1 valorile se afla in intervalul [403179; 1982811],mediana este 1284910,ceea ce


inseamna ca 50% din scoruri au valori mai mici ca1284910 ,celelalte fiind mai mari.Intervalul
intercuartilic reprezinta jumatatea medie a 50% din scorurile de grup. Șaptezeci și cinci la sută
din scoruri se situează sub quartila superioară.

Pentru I2 valorile se afla in intervalul [28019; 102956],mediana este65382 ,ceea ce inseamna ca


50% din scoruri au valori mai mici ca 65382 ,celelalte fiind mai mari.Intervalul intercuartilic
reprezinta jumatatea medie a 50% din scorurile de grup. Șaptezeci și cinci la sută din scoruri se
situează sub quartila superioară.

Pentru I3 valorile se afla in intervalul [111.0 ; 404.5 ],mediana este 252.0 ,ceea ce inseamna
ca 50% din scoruri au valori mai mici ca 252.0 ,celelalte fiind mai mari.Intervalul intercuartilic
reprezinta jumatatea medie a 50% din scorurile de grup. Șaptezeci și cinci la sută din scoruri se
situează sub quartila superioară.

Pentru a arata daca informatiile au o medie semnificativa vom proiecta mai jos tabelul cu
deviatiile standard ale componentelor:

Standard deviations:

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8

2.2745031 1.5334763 1.3256336 1.1906041 0.9226456 0.8193907 0.7968830 0.6477528

Comp.9 Comp.10 Comp.11 Comp.12 Comp.13 Comp.14

0.5059224 0.4334538 0.3558375 0.3206696 0.1778646 0.1342993

14 variables and 27 observations.


Raportat la valoriile indicatorilor deviatiie sunt destul de mici,ceea ce insemana ca mediile
componentelor sunt semnificative.Mai departe vom urmari pe matricea de corelatie legaturile
dintre indicatori :

Observam ca exista corelatii puternice intre indici,spre exemplu I1 este influentat in proportie de 91% de
I2,corelatia este totodata pozitiva:daca I2 ar creste cu o unitate,I1 ar creste in proportie de 91%conform
trendului lui I2.
Mai departe vom analiza valoarea proprie a fiecarei componente,ponderea de informartie preluata de
fiecare componenta in parte in mod individual si procentul de acoperire pentru a decide ce criteriu
putem aplica:

valp procentA procentC

Comp.1 5.17336 19.16061 19.16061

Comp.2 2.35155 8.70944 27.87005

Comp.3 1.75730 6.50854 34.37859

Comp.4 1.41754 5.25014 39.62873

Comp.5 0.85127 3.15287 42.78160

Comp.6 0.67140 2.48667 45.26827

Comp.7 0.63502 2.35194 47.62020


Comp.8 0.41958 1.55401 49.17422

Comp.9 0.25596 0.94799 50.12221

Comp.10 0.18788 0.69586 50.81807

Comp.11 0.12662 0.46896 51.28703

Comp.12 0.10283 0.38085 51.66788

Comp.13 0.03164 0.11717 51.78505

Comp.14 0.01804 0.06680 51.85185

De asemenea, am realizat un tabel in SAS pentru a ne asigura de certitudinea estimariilor:


Observam in graficul de mai sus, ca panta curbei incepe sa sufere modificari semnificative, la
nivelul primelor patru componente. Observam in prima faza ca numarul elevilor inscrisi la liceu
in anul 2015, a inregistrat cea mai mare valoare, aroape de maxim am putea spune. Daca
comparam numarul elevilor inrolati in invatamantul liceal, cu numarul de someri, observam o
diferenta semnificativa, acest lucru fiind imbucurator pentru tara noastra. Putem avea in vedere si
componenta 4, care ne indica numarul de infractori, un aspect destul de important daca facem
referire la educatie si la nivelul de trai.

Conform criteriului pantei ar trebui retinute in analiza 4 componente principale,


deoarece in cazul retinerii unei a 5-a putem observa in al-doilea grafic de mai sus tendinta
asimptotica spre zero a dreptei valoriilor proprii. Daca aplicam criteriul lui Kaiser avem
deasemenea 4 componente principale retinute in analiza , deoarece a cincea valoare proprie
devine subunitara, iar acest lucru ne spune sa nu acceptam o a cincea componenta principala. In
schimb daca ne luam dupa criteriul procentului de acoperire ar trebui sa admitem un numar de
componente principale in analiza astfel incat sa avem un procent cumulativ de informatie captata
de peste 85%, in acest caz va trebui sa consideram in analiza 5 componente princpiale.
Adesea, procentul variatiei principale , deriva din variabilele analizate, valoarea fiind in jur de
80%. Avand in vedere ca pentru aceasta analiza, s-au folosit 14 variabile,observam ca toate cele
4 cumulate, ne explica 76.427 din variatia modelului. Prin urmare, acestea vor fi interpretate in
continuare.
Descresterea cantitatii de informatie continute in fiecare component principala este
ilustrata in graficul de mai sus.
Calculam si retinem vectorii proprii in R pentru a putea determina mai departe
componentele :
Loadings:

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9 Comp.10

I1 0.366 0.123 0.258 0.143 0.162 0.247 0.267

I2 0.414 0.136 0.143 0.120

I3 0.375 0.223 -0.196 -0.140

I4 0.339 -0.207 0.271 -0.308 -0.172 -0.489 -0.479

I5 0.221 -0.241 0.579 0.212 0.167 -0.596 0.140 0.137 0.171

I6 0.219 -0.501 -0.285 0.392 0.158 -0.240 -0.237

I7 0.380 0.174 0.243 0.385 -0.440 -0.206

I8 0.552 -0.273 -0.358 0.148 0.336 -0.365

I9 0.235 -0.321 0.296 -0.189 -0.480 -0.315 -0.177 -0.129 0.360

I10 -0.147 -0.603 -0.488 0.293 0.392 0.282

I11 0.173 -0.361 -0.156 -0.605 0.178 -0.325 0.356 0.131 -0.391

I12 0.392 -0.166 0.216 0.133 -0.220 0.553 0.351

I13 0.534 -0.163 -0.421 -0.264 -0.140 -0.369 0.253

I14 -0.106 0.708 -0.373 0.333 -0.268 -0.354

Comp.11 Comp.12 Comp.13 Comp.14

I1 0.420 0.269 0.153 0.570

I2 0.161 0.495 -0.698

I3 -0.324 -0.642 0.359 0.301

I4 0.388

I5 -0.124 0.206

I6 -0.332 0.443 0.138

I7 -0.212 -0.559

I8 -0.314 0.313 -0.102

I9 -0.271 0.310 0.183

I10 0.168 -0.108


I11

I12 -0.126 -0.476 -0.170

I13 0.417 -0.163

I14 -0.116 -0.121

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9

SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000

Proportion Var 0.071 0.071 0.071 0.071 0.071 0.071 0.071 0.071 0.071

Cumulative Var 0.071 0.143 0.214 0.286 0.357 0.429 0.500 0.571 0.643

Comp.10 Comp.11 Comp.12 Comp.13 Comp.14

SS loadings 1.000 1.000 1.000 1.000 1.000

Proportion Var 0.071 0.071 0.071 0.071 0.071

Cumulative Var 0.714 0.786 0.857 0.929 1.000

Ne intereseaza primele 4 componente:

W1= -0.366x1-0.414x2-0.375x3-0.339x4-0.219x6-0.38x7-0.235x9-0.173x11-0.392x12

W2= -0.123x1-0.136x2-0.223x3-0.221x5-o.552x8+0.321x9+0.147x10+0.361x11-
0.534x13+0.106x14

W3= -0.258x1-0.143x2+0.196x3+0.207x4+0.241x5+0.501x6-0.174x7-
0.296x9+0.603x10+0.156x11+0.163x13-0.708x14

W4= -0.143x1-0.271x4-0.579x5+0.285x6+0.273x8+0.166x12+0.421x13+0.373x14

Vom reprezenta scorurile principale pentru a le putea calcula :


W1(BE)= -2.487= -0.366x1-0.414x2-0.375x3-0.339x4-0.219x6-0.38x7-0.235x9-0.173x11-
0.392x12

W2(BE)=0.129=-0.123x1-0.136x2-0.223x3-0.221x5-o.552x8+0.321x9+0.147x10+0.361x11-
0.534x13+0.106x14

W3(BE)=0.116=-0.258x1-0.143x2+0.196x3+0.207x4+0.241x5+0.501x6-0.174x7-
0.296x9+0.603x10+0.156x11+0.163x13-0.708x14

W4(BE)=-1.490=-0.143x1-0.271x4-0.579x5+0.285x6+0.273x8+0.166x12+0.421x13+0.373x14
Unde x1=1.507,x2=0.64,x3=0.58,x4=1.032,x5=0.678,x6= -0.163,x7=1.239,x8=-0.414,x9= -0.34,
x10=0.450,x11=0.492,x12=1.36,x13=-0.333,x14=0.898 ; date preluate din date_std(date
standardizate)

Mai jos putem observa cu ajutorul lui corrplot coeficientul de corelatie ale factorilor:

Observam ca avem corelatii pozitive si puternice intre factorii componentelor.

Calculam matricea factor:


Matricea factor prezinta coeficienţii de corelaţie între variabilele originale şi componentele
principale.Cu ajutorul acestei matrici putem determina factorii componentelor principale ,ne
intereseaza primele 4 componente si vom alege factorii astfel:

Observam ca pentru prima componenta cele mai mari corelatii sunt cu I1,I2,I3,I4,I7,I12

respectiv:

i1=numarul de elevi inscrisi la liceu in anul 2015 exprimati in mii elevi(i)83%

i2=numarul de elevi inrolati la liceu in anul 2015 exprimati in mii elevi(i)94%

i3=numar de someri in mii oameni(i)85%

i4=numar de infractori in mii oameni(i)77%

i7=nr absolventi facultate (i)86%

i12=nr profesori din liceu (i)89%

Vom denumi astfel W1=Componenta indicatoriilor de previziune a bunastarii populatiei

W2 va contine :I8,I9,I11,I13:

i8=procentul elevilor de 15 ani care au abandonat scoala-84%

i9=rata de angajare a tinerilor din categoria de varsta 19-25( ) – (- 49%)

i11=cheltuieli cu educatia(i)- (- 55%)

i13=gradul de saracie -81%

Aceasta se va numi:Componenta impactului educatiei precare asupra economiei


W3=I6,I10

i6=procent persoane care se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6 luni-
(- 66%)

i10=procent persoane care s-au angajat de la o varsta frageda- (- 79%)

Acesata se va numi:Componenta gradului de pesimism al populatiei asupra fortei de munca

W4=I5,I14

i5=procent persoane angajate ale caror cunostinte din facultate le folosesc la locul de munca-
68%

i14=procent din cheltuiala publica totala alocata pentru ajutorarea studentilor si burse-84%

Aceasta se va numi:Componenta impactului invatamantului superior asupra economiei

Comp 1:

Pentru prima componenta, avem influenta doar in sens pozitiv dupa cum observam. Aceasta se
remarca pentru variabile precum: numarul elevilor inrolati in invatamant, precum si cei inscrisi,
numarul celor care au absolvit o facultate, numarul somerilor dar si al infractorilor, precum si
numarul profesorilor ce-si desfasoara activitatea in cadrul liceelor.

Comp 2:

In cea de-a doua componenta, regasim in sens pozitiv procentul elevilor de 15 ani care au
abandonat scoala, precum si gradul de saracie. Iar in sens negativ, rata de angajare a tinerilor cu
varste cuprinse intre 19-25 de ani si cheltuielile cu educatia.

Comp 3:

Dupa cum am observant in componenta 1, in sens negativ intalnim procentul persoanelor care se
gandesc ca un urmatoarele 6 luni, ar putea ramane fara un loc de munca, dar si procentul
persoanelor care s-au angajat de la o varsta frageda.

Comp 4:

Regasim doua variabile care in sens pozitiv, fac referire la procentul din cheltuiala publica totala,
alocata pentru ajutorarea studentilor, precum si procent persoane angajate, ale caror cunostinte
din facultate le folosesc la locul de munca.

Cu ajutorul unui grafic putem evidentia corelatia dintre componentele principale si factori:
Putem observa ca I11 care face parte din a doua componenta are o corelatie pozitiva in raport cu
prima componenta de aproximativ 45%,deci componenta indicatorilor de previziune este are o
stransa legatura pozitiva cu cheltuielile cu educatia,in termeni economici cu cat vor creste
cheltuielile cu educatia cu atat bunastarea populatiei va creste ,urmand un trend pozitiv.I6 are o
corelatie de aproximativ 50% cu prima componenta,aceasta indicand gradul personelor care cred
ca si-ar putea pierde locul de munca,deci pesimismul populatiei si totodata constientizarea lipsei
unei specializari intr-un domeniu vor conduce la afectarea bunastarii populatiei prin remuneratii
scazute si consum scazut de bunuri.I5 reprezinta procentul personelor ce folosesc cunostiintele
din facultate la locul de munca,raportat la prima componenta putem observa o corelatie aproape
negativa,de unde deducem faptul ca daca gradul de specializare este scazut si afecteaza viitorul
populatiei.De asemenea gradul de saracie,procentul alocat pentru bursele studentiilor,procentul
persoanelor care s-au angajat de la o varsta frageda se afla in corelatie cu bunastarea
populatiei.Daca ar fi sa ne raportam la factorii primei coponente, un grad de saracie mare ar duce
la cresterea nr de someri si al infractorilor,iar acestia din urma vor atrage scaderea ratei de
angajare a tineriilor din componenta 2.Procentul eleviilor care abandoneaza scoala afecteaza in
mod indirect si negativ bunasatarea populatiei,intrucat odata ce vor creste vor atrage dupa sine
crestera nr de someri,deci scaderea bunastarii populatiei.

Gradul de pesimism al populatiei asupra fortei de munca este influentat de gradul de saracie
,procentul persoanelor angajate de la o varsta frageda si de poderea persoanelor ce utilizeaza
informatiile acumulate pe timpul facultatii la locul de munca ,exact asa cum ne asteptam
cresterea primului factor va conduce la cresterea gradului de pesimism,in timp ce o crestere a
celorlalti doi indicatori vor duce la scaderea acestuia.Observam ca majoritatea factorilor primei
componente se afla in corelatie pozitiva cu gradul de pesimism ,insa odata cu scaderea nr de
someri si al infractorilor,gradul de pesimism va creste.,intrucat I4 si I3 se afla in corelatie
negativa.
Observam in cel de-al treilea grafic ca procentul de corelatie dintre cheltuiala publica alocata
pentru ajutorarea studentiilor ,ponderea persoanelor ce-si folosesc cunostiintele din facultate la
locul de munca si componenta impactului invatamantului superior este pozitiv,deci odata cu
cresterea celor doi indicatori putem obtine un impact pozitiv.De asemena,procentul eleviilor care
au abandonat scoala,gradul de saracie,nr someriilor,procentul persoanelor ce se gandesc ca si-ar
putea pierde locul de munca au un impact negativ asupra componentei 4.
Observam ca o crestere considerabila a nr de infractori afecteaza in mod indirect impactul
educatiei precare asupra economiei,odata cu cresterea acestui indicativ vom obtine un impact
negativ.Totodata procentul eleviilor ce abandoneaza scoala afecteaza in mod direct gradul de
pesimism al populatiei asupra fortei de munca,ceea ce este un eveniment demonstrat
economic,deoarece odata cu cresterea abandonului scade rata de scolarizare ceea ce va conduce
la scaderea capitalului uman si implicit la scaderea fortei de munca.Procentul persoanelor care
se gandesc ca si-ar putea pierde locul de munca afecteaza in mod direct impactul educatiei
precare asupra economiei,fapt ce putea fi previzionat,deoarece persoanele nespecializate mereu
vor avea incertitudinea stabilitatii asupra postului ocupat.
Observam ca gradul de imprastiere al factorilor este mult mai mic in cazul componentelor 2 si
4,intrucat impactul educatiei precare asupra economiei are o legatura indirecta cu impactul
invatamantului superior asupra economiei.Rata de angajare a tineriilor din categoria 19-25 de ani
are un procent de corelare negativ cu impactul invatamantului superior asupra
economiei,deoarece odata cu cresterea persoanelor angajate din aceasta categorie de varsta
,evident, gradul de scolarizare al acestora scade,acestia ajungand sa prefere un job in schimbul
unei facultati ce i-ar ajuta sa devina munncitori calificati.De asemenea nr someriilor si gradul de
saracie afecteaza in mod indirect,negativ componenta 4,fapt demonstrat economic :cu cat nr de
someri si gradul de saracie va fi mai mare cu atat impactul invatamantului superior va fi unul
negativ.
Observam ca cheltuielile cu educatia afecteaza in mod indirect componenta W3,adica gradul de
pesimism al populatiei asupra fortei de munca,deci odata cu cresterea cheltuielor in scopul
educatiei va scadea pesimismul populatiei asupra capitalului de munca al pietei.Gradul de
abandon se afla in corelatie indirecta cu componenta 4,cea a impactului invatamantului superior
asupra economiei ,deci odata ce creste acest indicator w4 va avea o scadere brusca,la fel se va
comporta si in cazul i2,i3 respectiv numarul eleviilor inscrisi ,inrolati la liceu.
Observam in graficul de mai sus corelatiile tariilor cu componentele principale:putem spune
despre Romania,Grecia si Bulgaria ca impactul educatiei precare este destul de ridicat ceea ce va
conduce la niste indicatori de previziune a bunastarii populatiei,negativi,cum era si de asteptat
acestea fiind niste tari mult mai putin dezvoltate in comparatie cu Belgia,Spania,Danemarca care
sunt corelate pozitiv cu indicatorii de previziune a bunastarii populatiei si negativ cu impactul
educatiei precare.
Olanda si Danemarca au o corelatie negativa cu gradul de pesimism al populatiei asupra fortei
de munca si o corelatie pozitiva in raport cu indicatorii de previziune a bunastarii populatiei .
Putem observa ca Islanda are o legatura negativa cu componentele W1 si W4,de unde deducem
ca impactul invatamantului superior asupra economiei este unul negativ,predominand ratele
negative ce conduc la niste indicatori de previziune a bunastarii populatiei asemeni,astfel putem
sa evidentiem impactul sistemului educational asupra economiei.
Islanda are o coreltie negativa cu gradul de pesimism al populatiei asupre fortei de munca si
totodata cu impactul invatamantului superior asupra economiei,de unde deducem ca pesimismul
populatiei asupra fortei de munca va conduce la un impact negativ al invatamantului superior
prin rate scazute ce vor afecta in mod direct atat capitalul uman cat si gradul de scolarizare si
implicit numarul muncitorilor calificati.
ANEXA
date_ACP<-read.csv(file="date_proiect_ACPBUNE12345678.csv", header=TRUE, sep=",")

library(moments)

summary(dateACP$I8)

sd(dateACP$I8)

hist(dateACP$I8)

melevi<-mean(dateACP$I8)

sdelevi<-sd(dateACP$I8)

cvelevi<-sdelevi/melevi*100

boxplot(dateACP$I8)

skewness(dateACP$I8)

kurtosis(dateACP$I8)

summary(dateACP$I3)

sd(dateACP$I3)

hist(dateACP$I3)

msomeri<-mean(dateACP$I3)

sdsomeri<-sd(dateACP$I3)

cvsomeri<-sdsomeri/msomeri*100

View(cvsomeri)

boxplot(dateACP$I3)

skewness(dateACP$I3)

kurtosis(dateACP$I3)

summary(dateACP$I6)

sd(dateACP$I6)

hist(dateACP$I6)

mpersoane<-mean(dateACP$I6)

sdpersoane<-sd(dateACP$I6)

cvpersoane<-sdpersoane/mpersoane*100
View(cvpersoane)

boxplot(dateACP$I6)

skewness(dateACP$I6)

kurtosis(dateACP$I6)

###############################ACP#########

date_ACP<-read.csv(file="date_proiect_ACPBUNE12345678.csv", header=TRUE, sep=",")

View(date_ACP)

attach(date_ACP)

summary(date_ACP)

# COMPONENTE PRINCIPALE

date<-date_ACP[,3:16]

View(date)

date_std<-scale(date, scale=TRUE)

View(date_std)

pca<-princomp(date_std,cor=TRUE)

pca

######Matricea de corelatie

cor(date)

ts.plot(cor(date),col=rainbow(4),main="Corelatia dintre cele 14 serii de date(fig.1)")

legend("topleft",

col=rainbow(4), lty=1, cex=0.8)

mean(cor(date))

sdev<-pca$sdev

sdev

valp<-sdev*sdev

procentA<-valp*100/27 #n=27

procentC<-cumsum(procentA) #pk

V<-zapsmall(data.frame(valp, procentA, procentC))


V

# procentA e ponderea de informatie preluata de fiecare componenta principala

# in mod individual

# procentC e pk care ne trebuie la criteriul procentului de acoperire

# putem aplica criteriul Kaiser -> vom retine in analiza cate componente

# cu valp peste 1 si sunt 8 care preiau 79% de informatie din X

#Proiect:avem 4 componenete cu valp>1 si care preiau 38% din informatie

scree_plot<-prcomp(date_std)

plot(scree_plot, type="l", main="Screeplot")

# se face taietura pe grafic unde e panta mai aproape de 0 (pare a fi intre 8 si 9)(in paint)

#round(pca$loadings)

ceva<-zapsmall(pca$loadings)

ceva

# ne ajuta sa scriem forma principala a componentelor principale

# forma generala: W1 = 0.264x1 ceva (round in loc de zapsmall cu 3-4 zecimale) x2 ceva x3 -0.232x4 etc (coef de
pe prima coloana)

# si scriem pana la W8 in cazul asta

altceva<-zapsmall(pca$scores)

View(altceva)

nume_obs<-date_ACP[,2]

nume_obs

altceva2<-cbind(altceva,nume_obs) #scoruri principale

altceva2

View(altceva2)

# W1 pt EU date profa = -0.8147 = -0.19x1EU -0.16x2EU - ... - 0.218x26EU - 0.087x27EU


# x1EU = 0.33, x2EU = -0.26 din date_std linia 1

#Proiect:w1=BG=-2.086-0.244x1-0.70x3,undex1,x2,x3 sunt pe prima linie din date standardizate

library(corrplot)

M<-cor(date)

corrplot(M, methid="circle")

c=zapsmall(pca$scores)

corFact<-zapsmall(cor(date_std, c))

View(corFact)

#ne intereseaza pana la k=4

#ne uitam in corFact sa vedem la primele 4 componente pe coloana

#unde este corelatia mai mare si ne alegem I-urile pt cele 4 componente

#w1-w4 sunt componente principale

#le denumin si dupa facem asocieri intre ele luam w1 cu w2 si asa mai dep

dev.new()

cerc<-seq(0,2*pi,length=100) #cercul trigonometric

plot(cos(cerc), sin(cerc), type="l", col="blue", xlab="W1", ylab="W2")

text(corFact[,1], corFact[,2], rownames(corFact), col="red", cex=0.7)

dev.new()

cerc<-seq(0,2*pi,length=100) #cercul trigonometric

plot(cos(cerc), sin(cerc), type="l", col="blue", xlab="W1", ylab="W3")

text(corFact[,1], corFact[,3], rownames(corFact), col="red", cex=0.7)

dev.new()

cerc<-seq(0,2*pi,length=100) #cercul trigonometric

plot(cos(cerc), sin(cerc), type="l", col="blue", xlab="W1", ylab="W4")

text(corFact[,1], corFact[,4], rownames(corFact), col="red", cex=0.7)

dev.new()

cerc<-seq(0,2*pi,length=100) #cercul trigonometric

plot(cos(cerc), sin(cerc), type="l", col="blue", xlab="W2", ylab="W3")


text(corFact[,2], corFact[,3], rownames(corFact), col="red", cex=0.7)

dev.new()

cerc<-seq(0,2*pi,length=100) #cercul trigonometric

plot(cos(cerc), sin(cerc), type="l", col="blue", xlab="W2", ylab="W4")

text(corFact[,2], corFact[,4], rownames(corFact), col="red", cex=0.7)

dev.new()

cerc<-seq(0,2*pi,length=100) #cercul trigonometric

plot(cos(cerc), sin(cerc), type="l", col="blue", xlab="W3", ylab="W4")

text(corFact[,3], corFact[,4], rownames(corFact), col="red", cex=0.7)

x=data.frame(c)

View(x)

c2=cbind(x[1:4],nume_obs)

View(c2)

dev.new()

plot(c2[,1],c2[,2], main="Plotcomp. W1 si W2", xlab="W1", ylab="W2")

text(c2[,1], c2[,2], labels=c2[,5], col="red", pos=3, cex=0.7)

dev.new()

plot(c2[,1],c2[,3], main="Plotcomp. W1 si W3", xlab="W1", ylab="W3")

text(c2[,1], c2[,2], labels=c2[,5], col="red", pos=3, cex=0.7)

dev.new()

plot(c2[,1],c2[,4], main="Plotcomp. W1 si W4", xlab="W1", ylab="W4")

text(c2[,1], c2[,2], labels=c2[,5], col="red", pos=3, cex=0.7)

dev.new()

plot(c2[,2],c2[,3], main="Plotcomp. W2 si W3", xlab="W2", ylab="W3")

text(c2[,1], c2[,2], labels=c2[,5], col="red", pos=3, cex=0.7)

dev.new()

plot(c2[,2],c2[,4], main="Plotcomp. W2 si W4", xlab="W2", ylab="W4")

text(c2[,1], c2[,2], labels=c2[,5], col="red", pos=3, cex=0.7)


dev.new()

plot(c2[,3],c2[,4], main="Plotcomp. W3 si W4", xlab="W3", ylab="W4")

text(c2[,1], c2[,2], labels=c2[,5], col="red", pos=3, cex=0.7)

#interpretam tarile care nu fac parte dintr-o grupare comuna

S-ar putea să vă placă și