Documente Academic
Documente Profesional
Documente Cultură
Specializarea:Cibernetica Economica
GRUPA:1059
2018
BUCURESTI
INTRODUCERE
I1- numarul de elevi inscrisi la liceu in anul 2015 exprimati in mii elevi
I2- numarul de elevi inrolati la liceu in anul 2015 exprimati in mii elevi
I5- procent persoane angajate ale caror cunostinte din facultate le folosesc la locul de munca
I6- procent persoane care se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6 luni
I14- procent din cheltuiala publica totala alocata pentru ajutorarea studentilor si burse
Tarile analizate
sunt:Belgia,Bulgaria,Cehia,Danemarca,Estonia,Irlanda,Grecia,Spania,Croatia,Cipru,Letonia,Litu
ania,Luxemburg,Ungaria,Malta,Olanda,Austria,Polonia,Portugalia,Romania,Slovenia,Slovacia,F
inlanda,Suedia,Islanda,Norvegia,Elvetia.
STATISTICI DESCRIPTIVE
1.Numarul de someri
Din primul output observam ca media somerilor este 293.100 oameni in cele 27 de tari analizate si se
regaseste in intervalul format de valoarea minima si cea maxima,adica [8000;670000],aceasta putand fi
reprezentativa.Mediana este 252.000,ceea ce arata ca jumatate din tarile analizate au numarul de
someri mai mic decat aceasta valoare,restul fiind mai mari. Abaterea standard este 221.6996,ceea ce
demonstreaza faptul ca numarul de someri ai tarilor analizate se abat de la valoare medie cu 221.6996
someri.Prima quartila ne arata faptul ca un sfert din tari au mai putin de 111000 someri,restul fiind mai
mare,iar cea de-a treia ne prezinta faptul trei sferturi din tari au un numar de someri mai mic 404500
someri,restul avand mai multi.Din histograma reiese faptul ca majoritatea tarilor au un numar de
someri care se regaseste in unul din urmatoarele interval:[0;100000],[200000;400000].Coeficientul de
variatie egal cu 75.636% reiese faptul ca media nu este reprezentativa.Boxplotul ne arata ca nu avem
outlieri.Boltirea si aplatizarea: coeficientul de asimetrie este 0.51>0,ceea ce inseamna asimetrie pozitiva
in care predomina valorile mici,iar coeficientul de boltire este 2.04<3,relevand o distributie platicurtica
cu valori departate de medie.
Din graficul de mai sus se poate observa ca numarul somerilor are o densitate mare in jurul valorii de
200000.
Redundanţa datelor este justificată pe baza matricei de corelaţie calculate mai jos din care reiese
faptul că între variabile există corelaţii puternice (conţine valori apropiate de 1 sau -1) deci există
suprapunere informaţională pe care vom dorii sa le eliminăm.
Componentele principale notate wi, sunt combinaţii liniare de variabile originale care au 2
proprietăţi: - au varianţă maximală descrescătoare: Var(W1)>Var(W2)>...>Var(Wn);
- dunt necorelate două câte două: Cov(Wi, Wj)= 0, i≠j.
Mai jos putem observa statisticile descriptive pentru fiecare indicator in parte :
> summary(date_ACP)
Indicatori.2015 COD_TARA I1 I2
I3 I4 I5 I6
I7 I8 I9 I10
1st Qu.: 22938 1st Qu.:16.90 1st Qu.: 9.65 1st Qu.:0.900
3rd Qu.: 80916 3rd Qu.:27.85 3rd Qu.: 79.70 3rd Qu.:3.900
1st Qu.: 1915.2 1st Qu.: 9469 1st Qu.:18.25 1st Qu.:4.100
I1- numarul de elevi inscrisi la liceu in anul 2015 exprimati in mii elevi
I2- numarul de elevi inrolati la liceu in anul 2015 exprimati in mii elevi
I5- procent persoane angajate ale caror cunostinte din facultate le folosesc la locul de munca
I6- procent persoane care se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6 luni
I14- procent din cheltuiala publica totala alocata pentru ajutorarea studentilor si burse
Pentru I3 valorile se afla in intervalul [111.0 ; 404.5 ],mediana este 252.0 ,ceea ce inseamna
ca 50% din scoruri au valori mai mici ca 252.0 ,celelalte fiind mai mari.Intervalul intercuartilic
reprezinta jumatatea medie a 50% din scorurile de grup. Șaptezeci și cinci la sută din scoruri se
situează sub quartila superioară.
Pentru a arata daca informatiile au o medie semnificativa vom proiecta mai jos tabelul cu
deviatiile standard ale componentelor:
Standard deviations:
Observam ca exista corelatii puternice intre indici,spre exemplu I1 este influentat in proportie de 91% de
I2,corelatia este totodata pozitiva:daca I2 ar creste cu o unitate,I1 ar creste in proportie de 91%conform
trendului lui I2.
Mai departe vom analiza valoarea proprie a fiecarei componente,ponderea de informartie preluata de
fiecare componenta in parte in mod individual si procentul de acoperire pentru a decide ce criteriu
putem aplica:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8 Comp.9 Comp.10
I11 0.173 -0.361 -0.156 -0.605 0.178 -0.325 0.356 0.131 -0.391
I4 0.388
I5 -0.124 0.206
I7 -0.212 -0.559
SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
Proportion Var 0.071 0.071 0.071 0.071 0.071 0.071 0.071 0.071 0.071
Cumulative Var 0.071 0.143 0.214 0.286 0.357 0.429 0.500 0.571 0.643
W1= -0.366x1-0.414x2-0.375x3-0.339x4-0.219x6-0.38x7-0.235x9-0.173x11-0.392x12
W2= -0.123x1-0.136x2-0.223x3-0.221x5-o.552x8+0.321x9+0.147x10+0.361x11-
0.534x13+0.106x14
W3= -0.258x1-0.143x2+0.196x3+0.207x4+0.241x5+0.501x6-0.174x7-
0.296x9+0.603x10+0.156x11+0.163x13-0.708x14
W4= -0.143x1-0.271x4-0.579x5+0.285x6+0.273x8+0.166x12+0.421x13+0.373x14
W2(BE)=0.129=-0.123x1-0.136x2-0.223x3-0.221x5-o.552x8+0.321x9+0.147x10+0.361x11-
0.534x13+0.106x14
W3(BE)=0.116=-0.258x1-0.143x2+0.196x3+0.207x4+0.241x5+0.501x6-0.174x7-
0.296x9+0.603x10+0.156x11+0.163x13-0.708x14
W4(BE)=-1.490=-0.143x1-0.271x4-0.579x5+0.285x6+0.273x8+0.166x12+0.421x13+0.373x14
Unde x1=1.507,x2=0.64,x3=0.58,x4=1.032,x5=0.678,x6= -0.163,x7=1.239,x8=-0.414,x9= -0.34,
x10=0.450,x11=0.492,x12=1.36,x13=-0.333,x14=0.898 ; date preluate din date_std(date
standardizate)
Mai jos putem observa cu ajutorul lui corrplot coeficientul de corelatie ale factorilor:
Observam ca pentru prima componenta cele mai mari corelatii sunt cu I1,I2,I3,I4,I7,I12
respectiv:
W2 va contine :I8,I9,I11,I13:
i6=procent persoane care se gandesc ca si-ar putea pierde locul de munca in urmatoarele 6 luni-
(- 66%)
W4=I5,I14
i5=procent persoane angajate ale caror cunostinte din facultate le folosesc la locul de munca-
68%
i14=procent din cheltuiala publica totala alocata pentru ajutorarea studentilor si burse-84%
Comp 1:
Pentru prima componenta, avem influenta doar in sens pozitiv dupa cum observam. Aceasta se
remarca pentru variabile precum: numarul elevilor inrolati in invatamant, precum si cei inscrisi,
numarul celor care au absolvit o facultate, numarul somerilor dar si al infractorilor, precum si
numarul profesorilor ce-si desfasoara activitatea in cadrul liceelor.
Comp 2:
In cea de-a doua componenta, regasim in sens pozitiv procentul elevilor de 15 ani care au
abandonat scoala, precum si gradul de saracie. Iar in sens negativ, rata de angajare a tinerilor cu
varste cuprinse intre 19-25 de ani si cheltuielile cu educatia.
Comp 3:
Dupa cum am observant in componenta 1, in sens negativ intalnim procentul persoanelor care se
gandesc ca un urmatoarele 6 luni, ar putea ramane fara un loc de munca, dar si procentul
persoanelor care s-au angajat de la o varsta frageda.
Comp 4:
Regasim doua variabile care in sens pozitiv, fac referire la procentul din cheltuiala publica totala,
alocata pentru ajutorarea studentilor, precum si procent persoane angajate, ale caror cunostinte
din facultate le folosesc la locul de munca.
Cu ajutorul unui grafic putem evidentia corelatia dintre componentele principale si factori:
Putem observa ca I11 care face parte din a doua componenta are o corelatie pozitiva in raport cu
prima componenta de aproximativ 45%,deci componenta indicatorilor de previziune este are o
stransa legatura pozitiva cu cheltuielile cu educatia,in termeni economici cu cat vor creste
cheltuielile cu educatia cu atat bunastarea populatiei va creste ,urmand un trend pozitiv.I6 are o
corelatie de aproximativ 50% cu prima componenta,aceasta indicand gradul personelor care cred
ca si-ar putea pierde locul de munca,deci pesimismul populatiei si totodata constientizarea lipsei
unei specializari intr-un domeniu vor conduce la afectarea bunastarii populatiei prin remuneratii
scazute si consum scazut de bunuri.I5 reprezinta procentul personelor ce folosesc cunostiintele
din facultate la locul de munca,raportat la prima componenta putem observa o corelatie aproape
negativa,de unde deducem faptul ca daca gradul de specializare este scazut si afecteaza viitorul
populatiei.De asemenea gradul de saracie,procentul alocat pentru bursele studentiilor,procentul
persoanelor care s-au angajat de la o varsta frageda se afla in corelatie cu bunastarea
populatiei.Daca ar fi sa ne raportam la factorii primei coponente, un grad de saracie mare ar duce
la cresterea nr de someri si al infractorilor,iar acestia din urma vor atrage scaderea ratei de
angajare a tineriilor din componenta 2.Procentul eleviilor care abandoneaza scoala afecteaza in
mod indirect si negativ bunasatarea populatiei,intrucat odata ce vor creste vor atrage dupa sine
crestera nr de someri,deci scaderea bunastarii populatiei.
Gradul de pesimism al populatiei asupra fortei de munca este influentat de gradul de saracie
,procentul persoanelor angajate de la o varsta frageda si de poderea persoanelor ce utilizeaza
informatiile acumulate pe timpul facultatii la locul de munca ,exact asa cum ne asteptam
cresterea primului factor va conduce la cresterea gradului de pesimism,in timp ce o crestere a
celorlalti doi indicatori vor duce la scaderea acestuia.Observam ca majoritatea factorilor primei
componente se afla in corelatie pozitiva cu gradul de pesimism ,insa odata cu scaderea nr de
someri si al infractorilor,gradul de pesimism va creste.,intrucat I4 si I3 se afla in corelatie
negativa.
Observam in cel de-al treilea grafic ca procentul de corelatie dintre cheltuiala publica alocata
pentru ajutorarea studentiilor ,ponderea persoanelor ce-si folosesc cunostiintele din facultate la
locul de munca si componenta impactului invatamantului superior este pozitiv,deci odata cu
cresterea celor doi indicatori putem obtine un impact pozitiv.De asemena,procentul eleviilor care
au abandonat scoala,gradul de saracie,nr someriilor,procentul persoanelor ce se gandesc ca si-ar
putea pierde locul de munca au un impact negativ asupra componentei 4.
Observam ca o crestere considerabila a nr de infractori afecteaza in mod indirect impactul
educatiei precare asupra economiei,odata cu cresterea acestui indicativ vom obtine un impact
negativ.Totodata procentul eleviilor ce abandoneaza scoala afecteaza in mod direct gradul de
pesimism al populatiei asupra fortei de munca,ceea ce este un eveniment demonstrat
economic,deoarece odata cu cresterea abandonului scade rata de scolarizare ceea ce va conduce
la scaderea capitalului uman si implicit la scaderea fortei de munca.Procentul persoanelor care
se gandesc ca si-ar putea pierde locul de munca afecteaza in mod direct impactul educatiei
precare asupra economiei,fapt ce putea fi previzionat,deoarece persoanele nespecializate mereu
vor avea incertitudinea stabilitatii asupra postului ocupat.
Observam ca gradul de imprastiere al factorilor este mult mai mic in cazul componentelor 2 si
4,intrucat impactul educatiei precare asupra economiei are o legatura indirecta cu impactul
invatamantului superior asupra economiei.Rata de angajare a tineriilor din categoria 19-25 de ani
are un procent de corelare negativ cu impactul invatamantului superior asupra
economiei,deoarece odata cu cresterea persoanelor angajate din aceasta categorie de varsta
,evident, gradul de scolarizare al acestora scade,acestia ajungand sa prefere un job in schimbul
unei facultati ce i-ar ajuta sa devina munncitori calificati.De asemenea nr someriilor si gradul de
saracie afecteaza in mod indirect,negativ componenta 4,fapt demonstrat economic :cu cat nr de
someri si gradul de saracie va fi mai mare cu atat impactul invatamantului superior va fi unul
negativ.
Observam ca cheltuielile cu educatia afecteaza in mod indirect componenta W3,adica gradul de
pesimism al populatiei asupra fortei de munca,deci odata cu cresterea cheltuielor in scopul
educatiei va scadea pesimismul populatiei asupra capitalului de munca al pietei.Gradul de
abandon se afla in corelatie indirecta cu componenta 4,cea a impactului invatamantului superior
asupra economiei ,deci odata ce creste acest indicator w4 va avea o scadere brusca,la fel se va
comporta si in cazul i2,i3 respectiv numarul eleviilor inscrisi ,inrolati la liceu.
Observam in graficul de mai sus corelatiile tariilor cu componentele principale:putem spune
despre Romania,Grecia si Bulgaria ca impactul educatiei precare este destul de ridicat ceea ce va
conduce la niste indicatori de previziune a bunastarii populatiei,negativi,cum era si de asteptat
acestea fiind niste tari mult mai putin dezvoltate in comparatie cu Belgia,Spania,Danemarca care
sunt corelate pozitiv cu indicatorii de previziune a bunastarii populatiei si negativ cu impactul
educatiei precare.
Olanda si Danemarca au o corelatie negativa cu gradul de pesimism al populatiei asupra fortei
de munca si o corelatie pozitiva in raport cu indicatorii de previziune a bunastarii populatiei .
Putem observa ca Islanda are o legatura negativa cu componentele W1 si W4,de unde deducem
ca impactul invatamantului superior asupra economiei este unul negativ,predominand ratele
negative ce conduc la niste indicatori de previziune a bunastarii populatiei asemeni,astfel putem
sa evidentiem impactul sistemului educational asupra economiei.
Islanda are o coreltie negativa cu gradul de pesimism al populatiei asupre fortei de munca si
totodata cu impactul invatamantului superior asupra economiei,de unde deducem ca pesimismul
populatiei asupra fortei de munca va conduce la un impact negativ al invatamantului superior
prin rate scazute ce vor afecta in mod direct atat capitalul uman cat si gradul de scolarizare si
implicit numarul muncitorilor calificati.
ANEXA
date_ACP<-read.csv(file="date_proiect_ACPBUNE12345678.csv", header=TRUE, sep=",")
library(moments)
summary(dateACP$I8)
sd(dateACP$I8)
hist(dateACP$I8)
melevi<-mean(dateACP$I8)
sdelevi<-sd(dateACP$I8)
cvelevi<-sdelevi/melevi*100
boxplot(dateACP$I8)
skewness(dateACP$I8)
kurtosis(dateACP$I8)
summary(dateACP$I3)
sd(dateACP$I3)
hist(dateACP$I3)
msomeri<-mean(dateACP$I3)
sdsomeri<-sd(dateACP$I3)
cvsomeri<-sdsomeri/msomeri*100
View(cvsomeri)
boxplot(dateACP$I3)
skewness(dateACP$I3)
kurtosis(dateACP$I3)
summary(dateACP$I6)
sd(dateACP$I6)
hist(dateACP$I6)
mpersoane<-mean(dateACP$I6)
sdpersoane<-sd(dateACP$I6)
cvpersoane<-sdpersoane/mpersoane*100
View(cvpersoane)
boxplot(dateACP$I6)
skewness(dateACP$I6)
kurtosis(dateACP$I6)
###############################ACP#########
View(date_ACP)
attach(date_ACP)
summary(date_ACP)
# COMPONENTE PRINCIPALE
date<-date_ACP[,3:16]
View(date)
date_std<-scale(date, scale=TRUE)
View(date_std)
pca<-princomp(date_std,cor=TRUE)
pca
######Matricea de corelatie
cor(date)
legend("topleft",
mean(cor(date))
sdev<-pca$sdev
sdev
valp<-sdev*sdev
procentA<-valp*100/27 #n=27
procentC<-cumsum(procentA) #pk
# in mod individual
# putem aplica criteriul Kaiser -> vom retine in analiza cate componente
scree_plot<-prcomp(date_std)
# se face taietura pe grafic unde e panta mai aproape de 0 (pare a fi intre 8 si 9)(in paint)
#round(pca$loadings)
ceva<-zapsmall(pca$loadings)
ceva
# forma generala: W1 = 0.264x1 ceva (round in loc de zapsmall cu 3-4 zecimale) x2 ceva x3 -0.232x4 etc (coef de
pe prima coloana)
altceva<-zapsmall(pca$scores)
View(altceva)
nume_obs<-date_ACP[,2]
nume_obs
altceva2
View(altceva2)
library(corrplot)
M<-cor(date)
corrplot(M, methid="circle")
c=zapsmall(pca$scores)
corFact<-zapsmall(cor(date_std, c))
View(corFact)
#le denumin si dupa facem asocieri intre ele luam w1 cu w2 si asa mai dep
dev.new()
dev.new()
dev.new()
dev.new()
dev.new()
dev.new()
x=data.frame(c)
View(x)
c2=cbind(x[1:4],nume_obs)
View(c2)
dev.new()
dev.new()
dev.new()
dev.new()
dev.new()