Sunteți pe pagina 1din 8

Isaila Adriana

Seria B
Grupa 1070

Studiul Legaturii dintre speranta de viata si


cheluieli

Proiectul vizeaza evidentierea legaturii dintre un set de 7 variabile avant fiecare


cate 17 observatii. Obiectele au fost luate de pe http://epp.eurostat.ec.europa.eu si
reprezinta 17 tari europene.

RAF->rata angajarii pentru femei avand varste cuprinse inte 20-64 ani
RAB->rata angajarii pentru barbate avand varste cuprinse intre 20-64 ani
SVF->speranta de viata pentru femei trecute de 65 de ani
SVB->speranta de viata pentru barbate trecuti de 65 de ani
CE->cheltuieli cu educatia
CPS->cheltuieli cu protectia sociala
CC->cheltuieli de cercetare

Obiectele sunt reprezentate de urmatoarele tari: Belgia, Bulgaria, Republica Ceha,


Danemarca,Germania, Estonia, Irlanda, Grecia, Spania, Franta, Italia, Cipru, Letonia,
Lituania, Luxemburg,Ungaria, Malta.

Scopul analizei datelor este acela de a afla cativa indicatori relevanti pe baza carora
sa poate obtine o ierarhizare cat mai corecta a tarilor. Acest lucru va fi realizat folosindu-ne
de analiza in componente principale.
Analiza Componentelor Principale este o tehnica de analiza a datelor care
are drept scop descompunerea variabilitati totale din spatiul cauzal initial sub forma
unui numar redus de componente, fara ca aceasta forma sa contina redundante
informationale.Aceste componente exprima atribute noi si sunt construite in asa fel incat sa
fie necorelate intre ele, fiecare fiind o combinatie liniara de variabilele originale. (sursa:
http://documents.tips/documents/analiza-datelor)

1
Isaila Adriana
Seria B
Grupa 1070

Setul initial de date :

1. Distributia variantei:

Daca valorile sunt apropiate de 0 acestea tind sa fie omogene.

2
Isaila Adriana
Seria B
Grupa 1070

2. Componentele principale

Pentru a vedea daca indicatorii calculati sunt independenti sau nu, vom
analiza matricea coeficientilor de corelatie. Matricea de corelatii este simetrica si descrie
legaturile dintre variabilele initiale si determina componentele pricipale.

Prin intermediul matricei de corelatie ne putem da seama de cat de puternica este


legatura dintre doua variabile dar si de cate componente principale este nevoie in analiza.
Conform matricei de corelatie, cele mai puternice legaturi sunt intre speranta de
viata pentru barbati trecute de 65 de ani(SVB) si speranta de viata pentru femei trecute de
65 de ani(SVF), prin urmare, avem nevoie de doua variabile artificiale pentru a putea
caracteriza datele.

Conform principiului lui Kaiser se recomanda alegerea componentelor principale


care au o abatere standard mai mare sau egala cu 1; pentru aceasta, vom verifica abaterile
standard prin aplicarea metodei princomp().

In urma aplicarii metodei princomp(), se poate observa ca abaterile standard cele


mai mari sunt ale Comp.1, Comp.2.
Pentru a putea vedea care este ponderea de date influentata de acestea doua vom
utiliza o sumarizare a datelor.

3
Isaila Adriana
Seria B
Grupa 1070

Componentele sunt reprezentative astfel: Prima component este reprezentativa


pentru 45,7%, a doua pentru 20,81% dintre date.

3. Scorurile

Scorurile reprezinta dependenta componentelor fata de tarile de referinta.

4. Corelatii Factoriale

4
Isaila Adriana
Seria B
Grupa 1070

Prima componenta este puternic infulentata atat de speranta de viata pentru


barbate peste 65 de ani cat si de speranta de viata pentru femei de peste 65.

A doua componenta este negativ influentata de speranta de viata atat la barbatii cat
si la femeile de peste 65 de ani ceea conduce la ideea scaderii mortalitatii.

5. Contributiile, cosinusurile, comunalitațile

Cosinusurile

5
Isaila Adriana
Seria B
Grupa 1070

Unghiul dintre doua variabile masurat de cosinusul dintre acestea este egal cu
coeficientul de corelatie liniara dintre acestea.
 Daca unghiul dintre cele doua variabile este de 0 grade, respectiv cosinusul
este egal cu 1, atunci acestea doua sunt puternic corelate.
 Daca unghiul dintre cele doua variabile este de 90, respectiv cosinusul este
egal cu 0, atunci nu exista corelatie intre cele doua.
 Daca unghiul este de 180 de grade, respective cosinusul este egal cu -1,
atunci cele doua variabile sunt negative corelate.

Contributiile

Comunalitati

Comunalitatiile reprezinta cantitatea de varianta explicata in comun de catre un grup


de componente principale care poate fi interpretată ca siguranța indicatorului reprezentat
de acea variabila.

6
Isaila Adriana
Seria B
Grupa 1070

6. Cercul Corelatiilor

Cu cat variabilele sunt mai apropiate intre ele, cu atat corelatia este mai puternica. Se
poate observa din nou, si din graphic, corelatia puternica dintre speranta la viata a
barbatiilor cu varste de peste 65 de ani si speranta la viata a femeilor cu varste de peste 65
de ani.

7. Grafice

7
Isaila Adriana
Seria B
Grupa 1070

Pentru a putea fi stabilit numarul de componente principale se poate utiliza si


metoda grafica. Metoda pe care noi am ales-o, este Screen Plot. Pe baza acestui graphic se
pot observa 2 diferente de nivel ceea ce conduce la ipoteza a doua componente principale.

Valori proprii si vectori proprii:

Conform rezultatului in urma caruia sunt vizibile valorile proprii, se poate deduce,
din nou, faptul ca exista doua componente principale, deoarece doar doua dintre valori
sunt mai mari decat 1.

S-ar putea să vă placă și