Sunteți pe pagina 1din 27

ACADEMIA DE ȘTIINȚE ECONOMICE

FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Analiza datelor
Analiza calității vieții la nivelul țărilor din UE

Profesor: Monica Mihaela Maer Matei

Student: Pavel Andreea-Mădălina


Grupa: 1062

BUCUREȘTI 2016-2019
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Cuprins

Introducere.........................................................................................3
1. Descrierea problemei și a datelor.....................................................4
2. Analiza distribuțiilor variabilelor....................................................5
2.1 Boxplot.Histogramă................................................................5
2.2 Statistici descriptive...............................................................10
2.3 Abatere standard. Asimetrie. Boltire.....................................11
3. Analiza Componentelor Principale................................................13
3.1 Analiza corelațiilor................................................................13
3.2 Soluția oferită de Analiza Componentelor Principale...........15
Bibliografie
Anexe

2
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Introducere

Calitatea vieții se referă la caracterul mai mult sau mai puțin bun sau satisfăcător al
vieții oamenilor. Calitatea vieții nu este doar o tema, este o perspectivă distinctă asupra ariei
mari de fenomene sociale. Tot ceea ce este social și uman sau afectează într-un fel sau altul
omul, intră în aria de preocupări privind calitatea vieții. Calitatea vieţii este un concept
evaluativ, fiind rezultanta raportării condiţiilor de viaţa şi a activităţilor care compun viaţa
umana, la necesitatea, valorile,aspiraţiile umane. Se refera atât la evaluarea globala a vieţii cat
şi la evaluarea diferitelor condiţiisau sfere ale vieţii.
Asigurarea unei calități a vieții cât mai ridicate pentru populație devine scopul ultim al
dezvoltării sociale.
Semnificaţia pentru om a vieţii sale este rezultat al evaluării globale din punct de
vedereal persoanei umane, a propriei vieţi. Calitatea vieţii este un concept evaluativ, fiind
rezultantaraportării condiţiilor de viaţa şi a activităţilor care compun viaţa umana, la
necesitatea, valorile, aspiraţiile umane. Se refera atât la evaluarea globala a vieţii cat şi
la evaluarea diferitelor condiţii sau sfere ale vieţii.
După cum arată o serie de cercetări la nivel european, comparativ cu ţările UE,
România se situează pe ultimul sau penultimul loc, în privinţa multor indicatori referitori la
condiţiile de viaţă ale populaţiei (Alber, Jens, Tony, Fahey Perception of Living Condition in
an Enlarged Europe, Fundaţia pentru Îmbunătăţirea Condiţiilor de Viaţă şi de Muncă,
Luxembourg, 2004).
Motivul pentru care am optat să analizez și să cercetez calitatea vieții este acela de a
evidenția importanța indicatorilor care influențează calitatea vieții persoanelor.
În primul capitol, am descris problema analizată și în același timp am definit
variabilele alese pentru acest studiu, variabile care descriu calitatea vieții în Uniunea
Europeană.
În cel de-al doilea capitol, am evidențiat distribuția variabilele folosite, am realizat
tabelul statisticilor descriptive și de asemenea, am interpretat fiecare indicator în parte. Am
analizat totodată și boxplot-ul pentru fiecare variabilă pentru a obține calitatea indicatorilor.
În al treilea capitol denumit „Analiza componentelor principale”, am studiat analiza
componentelor principale. Acest capitol este structurat în doua subcapitole denumite “Analiza
corelațiilor” în care au fost obținute matricele de corelație si reprezentarea lor grafică, și
“Soluțiile oferite de Analiza Componentelor Principale” în care am prezentat soluțiile oferite
de ACP cu ajutorul criteriului lui Kaiser, dar și a altor criterii, am obținut matricea factor a
acestora, și am reprezentat variabilele în noul spațiu.
Astfel tema propusă prezintă interes atât la nivel național, cât și internațional deoarece
calitatea vieții reflectă nivelul de trai, de bunăstare, dar și facilitățile oferite de către stat
cetățenilor.

3
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

1. Descrierea problemei

Conceptul de „calitatea vieții” a fost lansat în anii ‘60 de societățile cu un nivel ridicat
de dezvoltare și care urmăreau creșterea mult mai rapidă a bunăstării. Termenul de „calitate a
vieţii” cuprinde cea mai importantă componentă a acesteia, aceea de „nivel de trai”.
Asigurarea unui nivel de trai decent depinde de gradul de dezvoltare a societăţii
cuantificat în PIB şi a modului de repartizare a acestuia.
Nivelul de trai reprezintă ansamblul condiţiilor economice şi noneconomice, sociale,
culturale şi politice pe care societatea le creează membrilor săi, dar şi capacitatea, aptitudinile
indivizilor de a-şi satisface cât mai bine nevoile cu venitul lor. Aspectele definitorii ale
nivelului de trai sunt legate de: nivelul şi evoluţia veniturilor; nivelul şi evoluţia preţurilor
bunurilor şi serviciilor ce alcătuiesc consumul populaţiei; nivelul şi structura consumului de
bunuri şi servicii; condiţii de muncă şi petrecerea timpului liber; condiţii de locuit; starea de
sănătate şi acces la serviciile de asigurare; educaţie şi accesul la cultură şi artă.
Nivelul de trai are un caracter obiectiv, pentru că, se poate realiza numai în anumiţi
parametrii. Pe măsură ce a evoluat ştiinţa şi tehnica, parametrii luaţi în considerare (mediul
natural, cadrul social, educaţie, sănătate, cadrul politic, economic) au suferit o serie de
modificări, conferindu-i în acest sens conceptului de nivelului de trai un caracter social-
istoric. Astfel, odată cu evoluţia umanităţii s-au modificat condiţiile de viaţă, aspiraţiile şi
nevoile oamenilor.
Pentru studiul calității vieții am decis să analizez 30 țări din Uniunea Europeană, care
sunt descrise prin următorii 10 indicatori:
 PIB per capita exprimat în milioane euro-este un indicator macroeconomic
care reflectă suma valorii de piață a tuturor mărfurilor și serviciilor destinate
consumului final, produse pe toate ramurile economiei în interiorul unei țări, în
decursul unui an, raportat la individ---I1;
 Nevoi nesatisfăcute de examinarea medicală exprimate în procente—I2;
 Venituri ---I3;
 Standardul de putere pe cap de locuitor (Consum individual real) reprezentat
de cheluielile personale pe bunuri si servicii---I4;
 Rata angajarii (%)-rata persoanelor care se angajează după terminare
studiilor---I5;
 Participări în ativități sportive si culturale (%)---I6
 Restanțe (chirie, utilitate, facturi sau cumpărare în rate)(%)-datoriile pe care
indivizii nu reușesc să le achite la timp---I7;
 Persoanele expuse riscului sărăciei sau excluziunii sociale (%)---I8
 Persoane care suferă de depresie (%)-persoane care suferă de depresie din
diferite motive---I9;
 Persoane care au abandonat studiile (%)-copiii care au abandonat școala
foarte devreme---I10;
Pentru prelucrarea în RStudio considerăm variabilele în ordinea de mai sus,
numerotate astfel:{I1,I2,I3,I4,I5,I6,I7,I8,I9,I10}.
4
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Capitol 2. Analiza distribuțiilor variabilelor

Pentru a analiza indicatorii ce reflectă calitatea vieții sunt necesare statisticile


descriptive și diverși coeficienți statistici.
2.1. Boxplot . Histogramă
Boxplot-ul este un grafic care înglobează cele mai importante caracteristici statistice ale
unor distribuții de frecvență pentru a oferi o mai bună înțelegere și comparație:
 PIB per capita (fig.2.1.1.)-din boxplot-ul acestei variabile putem afirma faptul că
aceasta are un outlier, ceea ce înseamnă că sunt anumite valori îndepărtate de medie,
însă nu este cazul să le eliminăm. Totodată se observă faptul că există o asimetrie la
dreapta;

Figura 2.1.1. Boxplot pentru variabila ce indică PIB per capita

 Nevoi nesatisfăcute de examinarea medicală exprimate în procente (fig.2.1.2)-din


boxplot-ul acestei variabile reiese faptul că variabila prezintă outlieri, valori
îndepărtate de medie, iar asimetria este la dreapta;

Figura 2.1.2. Boxplot pentru variabila ce indică nevoile medicale nesatisfăcute

5
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

 Venituri (fig.2.1.3)-din boxplot, se observă faptul că variabila nu prezintă outlieri,


adică toate valorile acesteia sunt împrăștiate în jurul mediei și că distribuția este ușor
asimetrică la dreapta;

Figura 2.1.3 Boxplot pentru variabila ce indică veniturile

 Consumul individual real (fig.2.1.4)-variabila nu prezintă outlieri, toate valorile sunt


împrăștiate în jurul mediei, asimetria este ușor către dreapta;

Figura 2.1.4 Boxplot pentru variabila ce indică


standardul de putere pe cap de locuitor

 Rata angajării (fig.2.1.5)-această variabilă nu prezintă outlieri, iar distribuția este


simetrică;

6
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Figura 2.1.5 Boxplot pentru variabila ce indică rata angajării

 Participări în activități sportive și culturale (fig.2.1.6)-variabila nu prezintă outlieri, iar


asimetria este la stânga;

Figura 2.1.6 Boxplot pentru variabila ce indică procentul participărilor în activități


sportive si culturale

 Restanțe (fig.2.1.7)-variabila prezintă outlieri, valori îndepărtate de medie, iar


asimetria este la dreapta;

Figura 2.1.7 Boxplot pentru variabila ce indică restanțele de plată

7
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

 Persoanele expuse riscului sărăciei sau excluziunii sociale (fig.2.1.8)-variabila nu


prezintă outlieri, nu are valori îndepărtate de la medie, iar asimetria este la dreapta;

Figura 2.1.8 Boxplot pentru variabila ce indică persoanele expuse sărăciei

 Persoane care sufera de depresie (fig.2.1.9)-variabila menționată nu prezintă outlieri,


iar distribuția este aproape simetrică;

Figura 2.1.9 Boxplot pentru variabila ce indică procentul persoanelor


care suferă de depresie

 Persoane care au abandonat studiile (fig.2.1.10)-variabila prezintă doi outlieri, care


nu vor fi eliminați din analiza, asimetria fiind ușor la dreapta;

8
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Figura 2.1.10 Boxplot pentru variabila ce indică procentul


persoanelor care au abandonat școala

O histogramă este reprezentarea grafică a unei distribuţii de frecvenţe, aparţinând


unui un set de date, ce are un anumit număr de înregistrări numere reale.

Din primul set de histograme se observă că histogramă verifică informațiile extrase din
coeficientul de asimetrie și aplatizare și anume: pentru indicatorul I1 și I2 existp asimetrie la
dreapta, adica predomină valorile mici, iar pentru indicatorul I3 și I4 se observă că
distribuțiile sunt aproximativ simetrice, valori împrăștiate în jurul mediei.

Figura 2.1.11 Histograme pentru I1, I2, I3, I4

În figura 2.1.12 am reprezentat următoarele 4 variabile și a rezultat faptul că I7 și I8


sunt distribuții asimetrice la dreapta, predominînd valorile mici, I5 urmărește o distribuție
aproape simetrică, valorile acesteia fiind împrăștiate în jurul mediei, iar pentru I6 asimetria
este la stanga, predominând valorile mari.

Figura 2.1.12 Histograme pentru I5, I6, I7, I8

9
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Din histogramele pentru următoarele 2 variabile reiese o asimetrie la dreapta pentru


I10, indicatorul care conține valori mari pentru ceole 30 țări, iar I9 prezintă o asimetrie ușor la
dreapta. În cele din urmă histograma redă în totalitate însemnătatea coeficientului de asimetrie
și boltire.

Figura 2.1.13 Histograme pentru I9, I10

2.2 Statistici descriptive


În continuare vom analiza aceștia indicatori calculând statisticile descriptive prin
intermediul funcției “summary”. În urma prelucrării în programul RStudio am obținut
următoarele date sintetizate în tabelul 2.2.1.

Statistica
Media Q1 Q2 Q3 Max Min
Indicator

PIB/capita 100.51 45.77 72.75 135.78 311.40 19.50

Nevoi
medicale 0.7176 0.025 0.3 1.1 3.6 0
nesatisfăcute
Venit 15015 9089 15162 19912 29285 4357
Consum ind. 18437 13875 17400 23000 31400 8900
real
Rata angajării 69.82 67.33 69.10 74.67 81.70 50.86
Participari în
activități 67.17 55.23 70.20 79.85 89.50 29.60
culturale și
sportive
Restanțe 14.720 6.525 10.250 18.900 49.300 4.5
Persoane
expuse riscului 23.64 18.32 21.75 28.68 41.30 14
de sărăcie
Persoane care
suferă de
10
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

depresie 6.69 5.70 5.80 8.95 12.10 1.50


Persoane care
au abandonat 9.807 6.925 8.700 11.250 20.200 5.200
școala

Tabel 2.2.1 Statistici descriptive

Interpretare:
 PIB-ul înregistrează maximul de 311.40 mil euro pe cap de locuitor pentru țara
Louxemburg, iar cea mai mică valoare (19.50) o înregistrează în Serbia. De
asemenea, putem preciza că 25% din țări au un PIB per capita sub 45.77 mil
euro și 75% peste această valoare (Q1), iar 75% dintre țări au un PIB mai mic
decât 135.78, iar 25% peste această valoare (Q3). PIB-ul înregistrează o medie
de 100.51 mil euro pentru cele 30 țări analizate din Uniunea Europeana;
 Cel mai mare procent în ceea ce privește nevoile medicale nesatisfăcute au fost
înregistrate în Grecia, iar în medie s-a obținut un procent de 0.7176 pentru
acest indicator;
 Cel mai mare venit este câștigat în Louxemburg, iar cel mai mic este asociat cu
țara România;
 De asemenea putem preciza faptul că țara cu cei mai mulți angajați este
Elveția, iar țara cu cele mai multe persoane care abandonează școala este
Malta;
 Bulgaria este țara care înregistrează cel mai mare procent al persoanelor expuse
sărăciei din diverse motive, cu un procent de 41.30;
 Daca analizăm participările la diverse activități, putem afirma faptul că
Norvegia și Elveția înregistrează cel mai mare procent (89.50) pentru acest
indicator;
 Un alt indicator analizat este cel al datoriilor neplătite, în acest caz țara cu
persoane care dețin cele mai multe datorii este Grecia, iar țara cu cele mai
puține este Cehia care are un procent de 4.5.

2.3 Abatere standard. Asimetrie. Boltire.


Abaterea standard este un indicator care reprezintă o măsură a dispersiei valorilor
variabilelor în jurul unei medii. Analizând tabelul 2.3.1, putem spune că:
 Valorile individuale ale PIB-ului se abat de la media de 100.51 cu 73.412;
 Valorile individuale ale indicatorului ce indică nevoile medicale nesatisfăcute
se abat de la media de 0.7176 cu 0.934 ;
 Valorile individuale ale venitului se abat de la media de 15015 cu 6834.561;
 Valorile individuale ale standardului de putere se abat de la media de 18437
cu 5897.31;

11
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

 Valorile individuale ale ratei angajării se abat de la media de 69.82 cu


7.13253;
 Valorile individuale ale indicatorului ce reflectă participările în activități
culturale și sportive se abat de la media de 67.17cu 17.31;
 Valorile individuale ale datoriilor neplătite la timp se abat de la media de
14.72 cu 11.27;
 Valorile individuale ale indicatorului ce reflectă persoanele expuse riscului
de sărăcie se abat de la media de 9.807cu 7.005;
 Valorile individuale ale indicatorului ce reflectă persoanele care au
abandonat școala se abat de la media de 6.69 cu 4.208.
Asimetria se definește prin antinomie cu simetria sau prin opoziție cu distribuția
normal. Astfel din tabelul 2.3.1, reies următoarele aspecte:
->Rata angajării si participările în activitățile culturale și sportive au coeficientul de
asimetrie negtiv=>distribuție asimetrică la stânga, predominând valorile mari, iar
ceilalți 8 indicatori prezintă distribuție asimetrică la dreapta, predominând valorile
mici.
Boltirea este un indicator statistic care ne arată tipul distribuției. Din tabelul 2.3.1
reiese:
-> PIB/capita, nevoile medicale nesatisfăcute, rata angajării, restanțele și persoanele cu
abandon școlar au o distribuție leptocurtică, ceea ce înseamnă că valorile sunt foarte
grupate și apropiate de medie. Celelalte 5 variabile au coeficientul de boltire mai mic
decât 3=> au distribuție mezocurtică, cu valori împrăștiate față de medie.

Variabila cu cea mai mare împrăștire este reprezentată de nevoile medicale


nesatisfăcute, având un coeficient de aplatizare de 5.9.

Indicator Abaterea Standard Asimetrie Boltire


PIB/capita 73.412 1.198759 3.843074

Nevoi medicale 0.9340617 1.818369 5.936158


nesatisfăcute
Venit 6834.561 0.3578231 2.245593

Standard de 5897.31 0.3144127 2.197839


putere/capita
Rata angajării 7.13253 -0.6651749 3.439162

Participari în activități 17.31538 -0.5459239 2.398469


culturale și sportive
Restanțe 11.27247 1.50111 4.520569

12
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Persoane expuse 7.005637 0.7502617 2.80954


riscului de sărăcie
Persoane care suferă 2.755352 0.3166314 2.141022
de depresie
Persoane care au 4.208361 1.260053 3.753913
abandonat școala

Tabel 2.3.1 Abaterea standard, asimetrie, boltire

3. Analiza componentelor principale

3.1Analiza corelațiilor
În acest capitol se urmărește reducerea dimensionalității, adică aflarea unor indicatori
relevanți pentru această analiză, indicatori sintetici reduși din cei inițiali, pe baza cărora datele
pot fi interpretate mai ușor. Pentru acestea se folosește tehnica analizei componentelor
principale pe baza matricei de corelație.
Pentru prelucrarea datelor în R, datele vor fi standardizate prin funcția “scale”, iar
pentru realizarea matricei de corelație este necesar să rotunjim datele la doua zecimale. În
urma standardizării, variabilele, anterior exprimate în unități de măsură diferite, sunt perfect
comparabile între ele. Odată cu standardizarea datelor, matricea de corelație devine aceeași cu
cea de covarianță.
Pentru a realiza scopul propus în acest capitol, se calculeaza mai întâi matricea
corelațiilor variabilelor, o matrice pătratică de dimensiune 10x10. Matricea de corelație
obținută prin funcția “cor” este prezentată în tabelul 3.1.1.
Corelatie I1 I2 I3 I4 I5 I6 I7 I8 I9 I10
I1 1 -0.23 0.93 0.94 0.52 0.73 -0.5 -0.55 0.51 -0.21
I2 -0.23 1 -0.3 -0.22 -0.62 -0.49 0.58 0.55 -0.22 0.16
I3 0.93 -0.3 1 0.96 0.58 0.8 -0.58 -0.67 0.51 -0.17
I4 0.94 -0.22 0.96 1 0.56 0.8 -0.58 -0.59 0.54 -0.2
13
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

I5 0.52 -0.62 0.58 0.56 1 0.75 -0.74 -0.5 0.33 -0.21


I6 0.73 -0.49 0.8 0.8 0.75 1 -0.72 -0.8 0.62 -0.41
I7 -0.5 0.58 -0.58 -0.58 -0.74 -0.72 1 0.66 -0.39 -0.02
I8 -0.55 0.55 -0.67 -0.59 -0.5 -0.8 0.66 1 -0.37 0.41
I9 0.51 -0.22 0.51 0.54 0.33 0.62 -0.39 -0.37 1 -0.09
I10 -0.21 0.16 -0.17 -0.2 -0.21 -0.41 -0.02 0.41 -0.09 1

Tabel 3.1.1 Matricea de corelație

Matricea de corelație oferă informații cu privire la legătura dintre variabile astfel:


 Cea mai puternică legătură cu un coeficient de 0.96 este între variabila
venitului și a consumului;
 De asemenea, o legătură foarte puternică este între variabila produsului intern
brut și a venitului;
 O legătură puternică cu un coeficient de 0.8 este prezentă între variabila venit
și participările la diferite activități culturale și sportive;
 Variabila care reflectă numărul abandonului școlar este cel mai corelat cu
variabila care reflectă numărul persoanelor cu risc la săracie;
 Variabila care exprima rata angajării este străns legată de variabila privind
numărul persoanelor expuse la săracie, dar în sens invers și tot în sens invers și
cu restanțele de plată;
 Numărul persoanelor care suferă de depresie este corelat moderat de standardul
de putere per capita.
Aceleași informații pot fi observate ușor analizând și figura 3.1.1 și figura 3.1.2.
Figura 3.1.2 prezintă mai multe informații:conține histogramele variabilelor, coeficienții de
corelație dintre variabile și totodată și gradul de împrăștiere față de medie.

Figura 3.1.1 Corelația dintre variabile

14
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Figura 3.1.2 Corelația dintre variabile

De asemenea, folosind funcția “rcorr” obținem probabilitățile (tabel 3.1.2) necesare


pentru testare corelației dintre variabilele alese pentru analiza calității vieții la nivelul Uniunii
Europene. Astfel testăm următoarele ipoteze:

H0-coeficientii de corelație=0
H1-coeficienții de corelație≠0

 Pvalue(I12,I10), pvalue(I9,I10), pvalue(I3,I10)>35%=>șansele ca acestea să fie greșite


sunt moderate, vom accepta H0, ceea ce înseamnă că coeficienții nu sunt semnificativi
statistic;
 Celelalte valori ale lui pvalue<35% =>șansele ca acestea să fie greșite sunt foarte mici,
vom accepta H1, ceea ce înseamnă că coeficienții sunt semnificativi din punct de
vedere statistic;

P I1 I2 I3 I4 I5 I6 I7 I8 I9 I10
I1 0.22 0.00 0.00 0.00 0.00 0.00 0.00 0.004 0.27
3 5 2
I2 0.22 0.11 0.24 0.00 0.006 0.00 0.00 0.23 0.38
1
0 2 1 2
I3 0.00 0.111 0.00 0.00 0.00 0.00 0.00 0.004 0.357
1 1
I4 0.00 0.24 0.00 0.00 0.00 0.00 0.00 0.002 0.299
0
1 1 5
I5 0.00 0.002 0.001 0.001 0.00 0.00 0.00 0.073 0.255
3
15
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

5
I6 0.00 0.006 0.00 0.00 0.00 0.00 0.00 0.003 0.026
I7 0.00 0.001 0.001 0.00 0.00 0.00 0.00 0.035 0.92
5
1
I8 0.00 0.002 0.00 0.00 0.00 0.00 0.00 0.043 0.025
2
5 5
I9 0.00 0.23 0.004 0.00 0.07 0.003 0.03 0.043 0.654
4
2 3 5
I1 0.27 0.38 0.357 0.29 0.25 0.026 0.92 0.02 0.654
0 9 5 5

Tabel 3.1.2. Probabilități pentru testarea corelației

Având în vedere rezultatele obținute mai sus, putem concluziona justificarea analizei
componentelor principale deoarece s-au identificat corelații puternice și semnificative pentru
majoritatea variabilelor din analiza calității vieții.

3.1 Soluția oferită de Analiza Componentelor Principale


Pentru a stabili numărul de componente principale necesare se folosesc informațiile
obținute în programul RStudio prin funcția “princomp”. Pentru aceasta se pot folosi două
metode și anume:
1. Metoda graficului. Prin realizarea unui scree plot se poate observa numărul
componentelor principale în funcție de descreșterea valoriilor proprii.
Analizând figura 3.2.1 observăm că după a treia valoare proprie, panta urmează să fie
nesemnificativă. Astfel putem concluziona că în urma analizei componentelor principale,
putem alege primele trei componente astfel încât să nu avem pierdere de informație.

Figura 3.2.1 Scree Plot

Din tabelul 3.2.1 putem extrage următoarele informații:


16
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

 Componenta 1 preia 59% din informație, componenta 2 preia 13% din


informație, iar componenta 3 preia 11% din informație;
 Valorile proprii sunt date atât de funcția “eigen”, cât și de ridicarea la pătrat a
deviației standard;
 Proporțile cumulate sunt calculate ca sumă a procentului ce indică preluarea de
informție.
Com Com Com Com Com Com Com Com Com Com
p1 p2 p3 p4 p5 p6 p7 p8 p9 p 10
Standard 2,42 1,15 1,04 0,81 0,67 0,60 0,36 0,25 0,23 0,13
deviation

Proportion 0,59 0,13 0,11 0,07 0,05 0,04 0,01 0,01 0,01 0,01
of
Variance

Cumulative 0,59 0,72 0,83 0,89 0,94 0,97 0,98 0,99 0,99 1
Proportion

Tabel 3.2.1 Importanța componentelor

1. Criteriul lui Kaiser. Conform acestui criteriu se vor păstra în analiza atâtea
componente principale, cate valorii proprii peste 1 am. Criteriul este valabil
când se lurează pe date centrate și standardizate.
Analizând tabelul 3.2.2 observăm faptul că avem 3 valori proprii peste 1:

 Comp 1->2.42;
 Comp 2->1.15;
 Comp 3->1.04,
Vom alege primele 3 componente principale
Comp Comp Comp Comp Comp Comp Comp Comp Comp Comp
1 2 3 4 5 6 7 8 9 10
2.42 1.15 1.04 0.81 0.67 0.59 0.36 0.25 0.23 0.13

Tabel 3.2.2 Valorile proprii


Tot prin intermediul funcției “princomp” se obțin informații cu privire noile valori ale
țărilor din UE cu privire la noile componente (loadings).
Soluția finală se identifică cu ajutorul funcției “eigen”, iar aceasta este:

Z1=0,34*x1+0,22*X2+0,37*x3+0,36*X4+0,32*x5+0,39*x6+0,32*x7+0,33*x8+

17
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

+0,25*x9+0,12*x10;

Z2=0,36*x1+0,60*X2+0,29*x3+0,35*X4+0,31*x5+0,03*x6+0,27*x7+0,19*x8+
+0,22*x9+0,12*x10;

Z3=0,002*x1+0,1*X2+0,03*x3+0,02*X4+0,13*x5+0,11*x6+0,34*x7+0,21*x8+
+0,11*x9+0,88*x10.

O altă informație pe care o putem extrage din analiza componentelor principale se


referă la scoruri. Acestea reprezintă noile caracteristici ale țărilor din Uniunea Europeană.
Matricea factor este o matrice cu elementele egale cu corelația dintre componentele
principale și variabilele inițiale. Din tabelul 3.2.3 reiese:
 Componenta 1 preia maxim de informație, și anume 95% din variabila inițială
I6, aceasta este foarte puternic corelată cu toate variabilele mai puțin cu I10,
care semnifică persoanele care au abandonat școala;
 Componenta 2 preia maxim de informație, și anume 70% din variabila inițială
I2, aceasta are un coeficient foarte mic de corelație cu indicatorul I6, care
semnifică numărul participărilor în activitățile sportive și culturale;
 Componenta 3 reflectă cu precădere informația conținută de I10, în schimb nu
au o corelație puternică cu celelalte variabile.
Matricea
factor Comp. 1 Comp.2 Comp.3
I1 0,85 0,42 0,01
I2 -0,55 0,7 0,11
I3 0,9 0,34 -0,04
I4 0,89 0,4 -0,03
I5 0,78 -0,36 -0,14
I6 0,95 -0,04 0,12
I7 -0,78 0,32 0,36
I8 -0,81 0,22 -0,22
I9 0,61 0,26 -0,12
I10 -0,31 0,14 -0,92
Tabel 3.2.3 Matricea factor
Cercul corelațiilor reprezintă graficul elementelor matricei factor. Din acesta se poate
observa legătura dintre indicatori și componente, conținând criteriile inițiale.
Având trei componente principale vom construi cercul corelațiilor prin combinarea
celor trei ca în figurile de mai jos.
Analizând cercul corelațiilor dintre componenta 1 și componenta 2 (fig. 3.2.3) se
identifică corelație puternică a indicatorilor I9, I5, I6, I1, I3, I4 cu componenta 1, iar
indicatoriul I2 este legat puternic de componenta 2, indicatorii I7 și I8 sunt corelați moderat
18
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

de componenta 2, iar indicatorul I10 este slab corelat. De asemenea I8 și I7 sunt corelați
puternic, dar indirect de componenta 1.

Figura 3.2.3 Cercul corelațiilor pentru componentele 1 și 2


În figura 3.2.4 este reprezentat cercul corelațiilor dintre componenta 1 și componenta
3. De aici reiese faptul că indicatorul I2 este slab corelat cu componenta 3, și moderat corelat
indirect cu componenta 1, indicatorul 10 este puternic corelat cu componenta 3, in sens invers.
În ceea ce privește componentele I9, I5, I1, I3, I4 și I6 nu sunt corelate cu componenta 3, dar
sunt puternic corelate cu componenta 1. Astfel, putem spune că componenta 1 își ia informație
din cei 6 indicatori.

Figura 3.2.4 Cercul corelațiilor pentru componentele 1 și 3


În figura 3.2.5 am realizat cercul corelațiilor pentru componentele 2 și 3. Din
acesta rezultă o corelație puternică a indicatorul I2 cu componenta 2, o corelație puternică,
inversă a indicatorului I10 cu a treia componentă și o corelație moderată între componenta 2 și
3 cu indicatorul I7. Ceilalți indicatori au o corelație slabă spre nulă cu aceste doua
componente prezentate in cercul de corelație.

19
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Figura 3.2.5 Cercul corelațiilor pentru componentele 2 și 3

Reprezentarea entităților în noul spațiu presupune aranjarea țărilor cu noile valori,


valori luate în funcție de cele trei componente principale.
Din figura 3.2.6 se observă faptul că România are valori foarte mici atât pentru
componenta 1, cât și pentru componenta 3. Valori mari pentru ambele componente
înregistrează țările Elveția și Luxembourg. Ungaria are valori ridicate pentru componenta 2,
dar valori scăzute pentru componenta 1. Tot din acest grafic se evidențiază asemănarea
ridicată dintre Norvegia și Luxembourg.

Figura 3.2.6 Reprezentarea în noul spațiu pentru comp 1 și comp 3

Din figura 3.2.7 reiese că Italia are valori foarte mari pentru componenta 2, dar
moderate pentru componenta 3. Norvegia și Finlanda au valori asemănătoare, Serbia are
valori mari pentru componenta 3, iar Cehia valori foarte mici pentru componenta 2. Estonia,
România și Malta au valori apropiate, fiind situate una lângă cealaltă.
20
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Figura 3.2.7 Reprezentarea în noul spațiu pentru comp 2 și comp 3

În figura 3.2.8. am reprezentat componentele 1 și 2. Observăm că Bulgaria, România


și Serbia au valori apropiate, Italia are valori ridicate pentru componenta 2, Luxembourg și
Norvegia prezintă valori mari pentru componenta 1, Franța are valori medii pentru ambele
componente, iar Cehia înregistrează valori foarte mici pentru componenta 2.

Figura 3.2.8 Reprezentarea în noul spațiu pentru comp 1 și comp 2

În continuare vom construi un grafic 3D pentru a putea observa mai bine legătura
dintre entități, dar și influența componentelor asupra valorilor entităților. Astfel putem preciza
faptul că nu există o mare diferență între țări, cu excepția Luxembourg-ului care este mai
îndepărtată față de celelalte țări pentru cele 3 componentte.

21
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

Figura 3.2.2 Grafic 3D pentru cele 3 componente

Bibliografie

22
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

https://ec.europa.eu/eurostat/data/database
https://ro.wikipedia.org/wiki/Calitatea_vie%C8%9Bii
http://www.creeaza.com/referate/psihologie-psihiatrie/sociologie/CALITATEA-VIETII-
INDICATORI-OB993.php

Anexa
Tabel 1.Indicatori asociați calității vieții în Uniununea Europeană

Standardul
Restante Persoane
Nevoi de putere Participari Persoane
PIB/ Venituri (chirie, expuse
nesatisfă- pe cap de Rata in activitati care Abandon
capita (standard de utilitate, riscului
T cute de locuitor angajarii sportive si sufera de școalar
(mil putere de facturi sau sărăciei sau
examinare (Consum (%) culturale depresie (%)
euro) cumpărare) cumpărare în excluziunii
medicală individual (%) (%)
rate)(%) sociale(%)
real)

23.000,00
BE 125,7 1,80 19.921,00 67,20 72,50 6,90 21,10 6,70 10,10
BG 21,7 1,80 6.882,00 9.700,00 67,10 32,00 33,60 41,30 3,20 13,40
CZ 54,9 0,00 11.652,00 14.400,00 74,80 75,60 4,50 14,00 3,90 6,20
DK 164,5 0,00 20.384,00 24.000,00 76,50 87,90 6,30 17,70 8,00 7,80
DE 128,3 0,00 20.365,00 23.900,00 78,00 77,20 5,20 20,00 10,60 10,10
EE 54,1 0,00 10.432,00 13.700,00 76,50 72,10 9,30 24,20 4,80 12,20
IE 192,2 1,00 17.704,00 21.500,00 68,90 77,20 15,90 26,00 12,10 7,00
EL 56,3 3,60 8.802,00 15.800,00 54,90 51,20 49,30 35,70 4,70 7,90
ES 80,1 0,20 14.463,00 18.200,00 62,00 62,20 11,80 28,60 7,80 20,00
FR 113,5 1,10 19.885,00 21.300,00 69,50 80,50 8,90 17,70 5,90 9,20
HR 36,5 0,10 8.253,00 11.700,00 60,60 43,70 29,90 29,10 5,70 5,80
IT 93,5 3,40 15.395,00 19.900,00 60,50 49,60 14,90 28,70 5,50 14,70
CY 72,0 0,70 15.313,00 18.400,00 67,90 56,80 31,60 28,90 3,60 6,20
LV 42,3 1,20 8.092,00 12.800,00 72,50 66,90 18,00 30,90 9,10 9,90
LT 44,3 0,00 8.251,00 15.700,00 73,30 63,80 9,80 29,30 4,70 6,50
LU 311,4 0,30 29.285,00 31.400,00 70,90 82,70 5,20 18,50 9,50 9,30
HU 38,7 0,50 7.919,00 11.800,00 68,90 54,70 21,70 28,20 4,90 11,60
M
T 73,5 0,10 16.681,00 15.900,00 69,00 54,60 10,80 22,40 5,40 20,20
NL 140,1 0,00 19.387,00 23.400,00 76,40 88,00 5,70 16,40 7,90 8,20
AT 137,2 0,00 21.981,00 24.500,00 74,30 77,90 6,40 18,30 7,70 7,30
PL 38,5 0,80 9.950,00 13.600,00 67,80 57,90 11,00 23,40 4,20 5,30
PT 59,7 1,10 10.317,00 16.600,00 69,10 66,00 10,20 26,60 11,90 13,70
RO 27,8 1,10 4.357,00 11.100,00 66,00 29,60 19,60 37,40 1,50 19,10
SI 64,8 0,20 15.012,00 15.400,00 69,10 73,80 19,20 19,20 8,80 6,00
SK 50,2 0,40 10.220,00 14.600,00 67,70 68,30 7,50 18,40 4,20 6,90
FI 131,5 0,00 19.430,00 22.800,00 72,90 86,50 10,30 16,80 10,50 9,20
SE 157,6 0,30 20.154,00 23.000,00 80,50 88,10 6,00 18,60 9,60 7,00

23
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

NO 230,8 0,20 28.323,00 27.600,00 79,10 89,50 5,80 14,70 9,00 10,20
CH 254,1 0,30 26.590,00 28.500,00 81,70 89,50 8,50 17,00 4,70 5,20
RS 19,5 1,30 5.042,00 8.900,00 50,86 38,70 37,80 20,00 4,60 8,00

Tabel 2. Scoruri pentru variabile


Comp. Comp. Comp. Comp. Comp. Comp. Comp. Comp. Comp. Comp.1
1 2 3 4 5 6 7 8 9 0
BE 0.76 1,19 -0.07 0.48 -0.57 -0.92 0.26 -0.21 -0.14 0.09
BG -4.43 0.41 -0.56 0.52 1,42 0.24 -0.13 0.24 -0.27 0.19
CZ 0.56 -2.21 0.78 0.59 -0.6 -0.73 -0.13 0.23 0.1 0,00
DK 2,64 -0.25 0.17 0.07 0.13 0.05 -0.08 -0.09 0.19 -0.08
DE 2,37 -0.16 -0.63 -0.77 0.35 0.05 -0.01 -0.04 -0.53 -0.24
EE -0.3 -1.72 -0.75 0.27 0.39 -0.29 -0.41 0.04 0.36 0.08
IE 1,35 1,45 0.43 -1.47 0.57 0.23 0.48 0.31 0.3 0.16
EL -4.21 2,94 1,74 0.05 0.38 -0.28 -0.64 -0.3 0.32 -0.12
ES -0.86 0.34 -2.4 -0.5 -0.78 0.74 0.08 -0.61 0.39 0.11
FR 1,11 0.3 0.26 0.56 -0.68 -0.62 -0.24 -0.26 0.04 0.19
HR -2.59 -0.65 1,22 -0.55 -0.04 1,23 0.53 -0.07 -0.21 0.09
IT -1.93 2,50 -0.8 0.7 -0.6 -1.38 0.31 0.08 -0.28 -0.01
CY -1.37 0.16 1,23 0.81 0.64 0.85 -0.26 -0.45 -0.31 -0.03
LV -1.25 -0.25 -0.18 -1.34 1,04 -0.68 -0.17 0.14 0.13 0.12
LT -0.77 -1.61 0.34 0.17 0.91 -0.16 0.67 -0.37 0.13 -0.11
LU 3,95 1,97 -0.24 0.51 -0.21 1,01 0.74 0.23 0.24 0.03
H
U -2.03 -0.9 -0.25 -0.03 0.26 0.24 -0.22 0.15 0.14 -0.01
M
T -0.64 -0.49 -2.39 0.5 -0.91 0.57 -0.5 0.14 -0.24 0.12
NL 2,48 -0.5 0.12 0,00 -0.07 -0.13 -0.21 -0.16 0.13 -0.16
AT 2,25 -0.19 0.24 0.19 -0.07 0.2 0.19 -0.29 -0.39 -0.06
PL -1.18 -1.11 0.99 0.33 -0.18 -0.59 0.62 0.03 -0.19 0.13
PT -0.38 0.29 -1.2 -1.97 0.08 -0.64 0.12 0.11 -0.07 -0.19
R
O -4.12 -0.43 -2.09 1,18 0.44 0.24 0.3 0.22 0.12 -0.24
SI 0.28 -0.64 1,02 -1.08 -0.29 0.21 -0.35 -0.02 -0.19 0.24
SK -0.42 -1.44 0.71 0.36 -0.79 -0.57 0.34 -0.04 0.21 0.02
FI 2,27 -0.04 -0.01 -0.99 -0.31 0.2 -0.33 -0.18 0.03 -0.13
SE 2,78 -0.21 0.21 -0.42 0.65 -0.36 -0.21 0.19 -0.07 -0.04
N
O 3,91 0.73 -0.38 0.42 0,00 0.32 -0.43 0.27 -0.14 0.08
CH 3,64 0.39 0.85 1,86 0.72 0.26 -0.16 0.24 0.18 -0.05
RS -3.85 0.12 1,63 -0.45 -1.89 0.71 -0.15 0.47 0.04 -0.2

Cod Rstudio
„path<-"C:\\Users\\andre\\Desktop"
24
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

datepr<-read.table(file.path(path,"dateProiect.txt"),sep="\t",dec=".",header=TRUE,row.names=1)
attach(datepr)
View(datepr)
boxplot(I1,col="red")
boxplot(I2,col="green")
boxplot(I3,col="blue")
boxplot(I4,col="yellow")
boxplot(I5,col="brown")
boxplot(I6,col="red")
boxplot(I7,col="green")
boxplot(I8,col="blue")
boxplot(I9,col="yellow")
boxplot(I10,col="brown")
b<-data.frame(datepr$I1,datepr$I2, datepr$I3, datepr$I4)
hist(b)
t<-data.frame(datepr$I5,datepr$I6, datepr$I7, datepr$I8)
hist(t)
p<-data.frame(datepr$I9,datepr$I10)
hist(p)
summary(datepr)
sd(I10)
install.packages("moments")
library(moments)
skewness(I1)
kurtosis(I1)
skewness(I2)
kurtosis(I2)
skewness(I3)
kurtosis(I3)
skewness(I4)
kurtosis(I4)
skewness(I5)
kurtosis(I5)
skewness(I6)
kurtosis(I6)
skewness(I7)
kurtosis(I7)
skewness(I8)
kurtosis(I8)
skewness(I9)
kurtosis(I9)
skewness(I10)

25
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

kurtosis(I10)
mr<-round(datepr,2)
View(mr)
install.packages("corrplot")
install.packages("Hmisc")
library(Hmisc)
library(corrplot)
cor<-cor(mr)
cor
c<-rcorr(as.matrix(mr))
c
write.table(cor,file="corelatie.xls",col.names=TRUE, sep="\t")
corrplot(c$r, type="upper", p.mat=c$p,sig.level=0.01,insig="blank")
#interpretari,concluzii(se justifica ACP)
#standardizare
sd<-scale(mr,center=TRUE,scale=TRUE)
sd
corelatie<-cor(sd)
corelatie
corelatiee<-round(corelatie,2)
write.table(corelatiee,file="corelatieSdd.xls",col.names=TRUE, sep="\t")
install.packages("PerformanceAnalytics")
library(PerformanceAnalytics)
chart.Correlation(sd,histogram=TRUE,pch=19)

acp<-princomp(sd,cor=TRUE,scores=TRUE)
acp
summary(acp)
eigen(cor(sd))
ponderi<-acp$loadings
ponderi
scoruri<-acp$scores
scoruri
sc<-round(scoruri,2)
sc
write.table(sc,file="scorproiect.xls",col.names=TRUE, sep="\t")
plot(acp,type="l")
e<-eigen(corelatiee)
e
matriceaf<-cor(sd,scoruri[,1:3])
matriceaf
write.table(matriceaf,file="matrice.xls",col.names=TRUE, sep="\t")

26
ACADEMIA DE STUDII ECONOMICE
FACULTATEA DE CIBERNETICĂ, STATISTICĂ ȘI INFORMATICĂ ECONOMICĂ

val<-seq(0,2*3.14,length=100)
val
plot(cos(val),sin(val),type="l", xlab="Comp1",ylab="Comp2")
text(matriceaf[,1],matriceaf[,2],rownames(matriceaf))
abline(h=0)
abline(v=0)
plot(cos(val),sin(val),type="l", xlab="Comp1",ylab="Comp3")
text(matriceaf[,1],matriceaf[,3],rownames(matriceaf))
abline(h=0)
abline(v=0)
plot(cos(val),sin(val),type="l", xlab="Comp2",ylab="Comp3")
text(matriceaf[,2],matriceaf[,3],rownames(matriceaf))
abline(h=0)
abline(v=0)
plot(scoruri[,1],scoruri[,2],xlab="axa1",ylab="axa2")
text(scoruri[,1],scoruri[,2],labels=rownames(scoruri), pos=3)
plot(scoruri[,1],scoruri[,3],xlab="axa1",ylab="axa2")
text(scoruri[,1],scoruri[,3],labels=rownames(scoruri), pos=3)
plot(scoruri[,3],scoruri[,2],xlab="axa1",ylab="axa2")
text(scoruri[,3],scoruri[,2],labels=rownames(scoruri), pos=3)
install.packages('scatterplot3d')
library(scatterplot3d)
grafic3d<-scatterplot3d(sd[,1:3],pch=15,angle=60)
text(grafic3d$xyz.convert(sd[,1:3]),labels=rownames(sd))”

27

S-ar putea să vă placă și