Sunteți pe pagina 1din 14

Academia de Studii Economice din București

Facultatea de Cibernetică, Statistică și Informatică Economică


Specializarea Cibernetică Economică

Tema 3 Analiza Datelor


Utilizarea analizei corespondențelor pentru
analiza activitātilor realizate în cālātoriile
într-o tarā strāinā

Cadru didactic coordonator:


Bala Denisa Elena
Student:
Filip Adriana-Ioana

Anul 2021
Filip Adriana-Ioana

Cuprins

Introducere..........................................................................................................................................3
1.Graficul BalloonPlot...........................................................................................................................3
2.Valorile Proprii...................................................................................................................................4
3.Statistica Chi-patrat............................................................................................................................4
4.Valorile asteptate................................................................................................................................5
5.Valorile singulare...............................................................................................................................6
6.Scree Plot............................................................................................................................................7
7.Coordonatele varibilelor de pe coloane, contributia si calitatea acestora............................................7
8.Contributia variabilelor de pe coloana la formarea dimensiunilor......................................................8
9.Contributia coloanelor la dimensiunea 1 si 2......................................................................................9
10.Coordonatele varibilelor de pe linii, contributia si calitatea acestora................................................9
11.Contributia variabilelor de pe linii la formarea dimensiunilor........................................................10
12.Contributia liniilor la dimensiunea 1 si 2........................................................................................11
13.Grafic simetric................................................................................................................................11
14.Grafic Biplot Asimetric..................................................................................................................12
Anexe..................................................................................................................................................13
Codul:..............................................................................................................................................13

2
Filip Adriana-Ioana

Introducere

Pentru realizarea acestei teme am ales 10 activitati la care oamenii aleg sa participe
atunci cand fac o calatorie intr-o tara straina, si anume: relaxare, experienta unui alt nivel de
trai, vizitarea muzeelor, cumparaturi, mersul la concerte, petrecerea sarbatorilor, invatarea
unei limbi straine, gustarea mancarilor traditionale, plimbari cu bicicleta, mersul in parcuri de
distractii, sub diferite contexte sociale: in familie, cu prietenii,cu partenerul, singur sau deloc.
Am creat un chestionar in urma caruia sa pot contoriza variantele de raspuns a mai
multor persoane ( 47 de persoane) :

Fig 1. Setul de date

1.Graficul BalloonPlot
Astfel, se pot observa cele 10 activitati pe linie, cele 5 variante de raspuns pe
coloana.Pentru o ilustrare mai buna a frecventei variantelor alese pentru diferitele activitati,
am creat o forma grafica a tabelului:

Fig 2. Graficul Balloonplot

Dupa cum se observa din figura 2, activitatile care se efectueaza preponderent in


calatoriile intr-o tara straina:

3
Filip Adriana-Ioana

-in familie sunt: relaxare, vizitare muzeu, gustarea mancarurilor traditionale si mersul
in parcurile de distractie;
-cu prietenii : mersul la concerte, experienta unui alt nivel de trai;
-cu partenerul :petrecerea sarbatorilor;
-singur:invatarea unei limbi straine;
-deloc:cumparaturi;

2.Valorile Proprii

Fig 3. Valorile proprii

Valorile proprii reprezinta cantitatea de informatie retinuta de fiecare axa. Acestea


sunt folosite pentru a determina numarul de axe care trebuie luate in continuare. Dupa cum se
observa, in dimensiunea 1 se explica cea mai mare varianta a solutiei, reprezentata de un
procent de 50.19%. Aceasta este urmata de catre dimensiunea 2 cu un procent de 28.32%, iar
dimensiunile 3 si 4 explica procente de 13.38% si 8.08% din varianta totala.
Procentele dimensiunilor 1 si 2 cumulate inregistreaza o valoare de 78.52% si este
foarte apropiata de valoarea optima.

3.Statistica Chi-patrat

Fig 4. Output statistica Chi-patrat

4
Filip Adriana-Ioana

Statistica Chi- patrat reprezinta statistica pe baza careia se testeaza semnificatia


asocierii intre categoriile reprezentate pe coloane si cele reprezentate pe linii.
Testul Chi-patrat este un test statistic ce arata daca exista vreo legatura (influenta
reciproca) intre variabilele exprimate pe randuri si pe coloane.
#Ipoteza nula (H0): Verifica daca variabilele de pe randurile si de pe coloanele
tabelului de contingenta sunt independente.
#Ipoteza alternativa (H1): Verifica daca exista asociere intre variabilele de pe
randurile si de pe coloanele tabelului de contingenta.
Ipoteza alternativa este acceptata deoarece p-value are valoarea mai mica de 0.05,
deci inseamna este reprezentativ din punct de vedere statistic, iar ipoteza alternativa are
valoarea de 293.04 cu 36 de grade de libertate.
De asemenea, in urma aplicarii testului Pearson se remarca faptul ca rezulta aceleasi
valori.

4.Valorile asteptate

Fig 5. Valorile asteptate

Aceasta se calculeaza: (∑i *∑j)/ ∑ij


Spre exemplu, pentru vizitatea muzeelor in familie, valoarea asteptata este:
(106*47)/470=10.6
Datorita faptului ca toti studentii au raspuns la toate intrebarile din chestionar, valoarea
asteptata pe fiecare coloana este aceasi.

5
Filip Adriana-Ioana

5.Valorile singulare

Fig 6. Valorile singulare

Valorile singulare ale modelului sunt afisate mai sus, prima atingand 0.31 preluand astfel cel
mai mult din inertia totala, care reprezinta 50.20%.
Cea de a doua dimiensiune preia 28.33% din inertia totala .
Dimensiunea 3 preia 13.39% din inertia totala, iar dimensiunea 4 preia 8.09%.
Valorile singulare corespund cantitatii de informatie retinuta de fiecare axa si sunt ordonate
in functie de varianta cu care contribuie la cele 2 axe.

6
Filip Adriana-Ioana

6.Scree Plot

Fig 7. Scree plot

Graficul scree plot arata de asemenea numarul de dimensiuni. Dimensiunile sunt ordonate
crescator in functie de cantitatea de inertie explicata.
Punctul in care graficul se indoaie este punctul in care cantitatea de informatie este optima. In
figura se poate observa ca dupa a doua dimensiune cantitatea de informatie este suficienta,
adica 78.52%.

7.Coordonatele varibilelor de pe coloane, contributia si calitatea


acestora

Fig 8. Coordonatele varibilelor de pe coloane, contributia si calitatea acestora

7
Filip Adriana-Ioana

Outputul de mai sus arata coordonatele variabilelor de pe coloane asociate fiecarei


dimensiuni, contributia acestora, dar si calitatea, ce masoara asocierea intre coloane si axe. In
partea de jos este inertia pe care variabilele o ocupa.
Spre exemplu, pentru variabila/coloana “Singur”, aceasta are coordonata asociata dimensiunii
3: -0.2952 si contributia de 14.4485.

8.Contributia variabilelor de pe coloana la formarea dimensiunilor

Fig 9. Contributia variabilelor de pe coloana la formarea dimensiunilor

La formarea dimensiunii 1 contribuie cel mai mult variabilele „Singur” si „In familie”.
La formarea dimensiunii 2 contribuie cel mai mult variabila „Cu prietenii” .
La formarea dimensiunii 3 contribuie cel mai mult variabila „Deloc”
La formarea dimensiunii 4 contribuie cel mai mult variabila „Cu partenerul”

8
Filip Adriana-Ioana

9.Contributia coloanelor la dimensiunea 1 si 2

Fig 10. Contributia coloanelor la dimensiunea 1 si 2

Se observa la outputul din fig 10, faptul ca cel mai mult contribuie coloanele cu variantele de
raspuns „Singur” si „In familie”.

10.Coordonatele varibilelor de pe linii, contributia si calitatea acestora

Fig 11. Coordonatele varibilelor de pe linii, contributia si calitatea acestora

9
Filip Adriana-Ioana

Outputul de mai sus arata coordonatele variabilelor de pe linii asociate fiecarei


dimensiuni, contributia acestora, dar si calitatea. In partea de jos este inertia pe care
variabilele o ocupa.
Spre exemplu, pentru variabila/linia “Vizitare muzee”, aceasta are coordonata asociata
dimensiunii 2: -0.2632 si contributia de 3.9244.

11.Contributia variabilelor de pe linii la formarea dimensiunilor

Fig 12. Contributia variabilelor de pe linii la formarea dimensiunilor

La formarea dimensiunii 1 contribuie cel mai mult variabila „Invatarea unei limbi straine”.
La formarea dimensiunii 2 contribuie cel mai mult variabila ”Concerte”.
La formarea dimensiunii 3 contribuie cel mai mult variabila „Cumparaturi”.
La formarea dimensiunii 4 contribuie cel mai mult variabila „Experienta unui alt nivel de
trai”.

10
Filip Adriana-Ioana

12.Contributia liniilor la dimensiunea 1 si 2

Fig 13. Contributia liniilor la dimensiunea 1 si 2

Se observa la outputul din fig 13, faptul ca cel mai mult contribuie liniile cu variantele de
raspuns „Invatarea unei limbi straine” si „Concerte”, „Mersul in parc de distractii” si
„Cumparaturi”.

13.Grafic simetric

Fig 14. Grafic simetric

Graficul bi-plot simetric in care atat variabilele exprimate pe randuri(punctele


albastre),cat si variabilele exprimate pe coloane(triungiurile rosii), sunt prezentate in acelasi

11
Filip Adriana-Ioana

spatiu folosind coordonatele principale si arata o reprezentare grafica standard in analiza


corespondentelor.
Se observa gruparea activitatilor de pe linii cu variantele de raspuns de pe coloane.
Spre exemplu, se observa ca activitatea realizata „Singur” este „Invatarea unei limbi straine”
De asemenea se poate observa in jurul optiunii” Cu prietenii” sunt destul de
apropriate:”Vizitare muzee” si „ Experinta unui alt nivel de trai”.

14.Grafic Biplot Asimetric

Fig 15. Grafic Biplot Asimetric

O modalitate mai simpla de a putea interpreta distanta dintre punctele de coloana si


punctele de linie este graficul Biplot asimetric.
Figura se interpreteaza in functie de distanta unghiului formata de 2 sageti.
Spre exemplu, se remarca o asociere puternica intre activitatea „Concerte” si varianta
„Cu prietenii”, intre varianta „cu partenerul” si „Petrecerea sarbatorilor”.

12
Filip Adriana-Ioana

Anexe
Codul:
t=read.table("proiectad3.txt",header=T)
t
dt <- as.table(as.matrix(t))
dt
# 2. Graph
quartz()
balloonplot(t(dt), main ="Activitati", xlab ="", ylab="",
            label = FALSE, show.margins = TRUE,text.size=0.6)

rez=CA(t, graph = F)
eig=get_eigenvalue(rez)
eig

s <- sum(eig[,1])
s
chi2 <- s*sum(as.matrix(t))
chi2
#Nr. gradelor de libertate asociate statisticii chi-patrat :
df <- (nrow(t) - 1) * (ncol(t) - 1)
df
#Valoarea critica pentru nr. de grade de libertate stabilit
p <- pchisq(chi2, df, lower.tail = F)
p

X2 <- chisq.test(t)
X2
X2$observed
round(X2$expected,3)

rez <- CA(t, graph = F)


print(rez)
summary(rez, nb.dec = 2, ncp = 2)
rez$eig

quartz()
fviz_screeplot(rez)

library(corrplot)
rez$col

quartz()
corrplot(rez$col$contrib, is.corr=FALSE)

quartz()

13
Filip Adriana-Ioana

fviz_contrib(rez, choice = "col", axes = 1:2)

rez$row

quartz()
fviz_contrib(rez, choice = "row", axes = 1:2)
quartz()
corrplot(rez$row$contrib, is.corr=FALSE)

quartz()
fviz_ca_biplot(rez)

quartz()
fviz_ca_biplot(rez, map ="rowprincipal", arrow = c(TRUE, TRUE),repel = TRUE)

14

S-ar putea să vă placă și