Sunteți pe pagina 1din 6

1.

n urma aplicrii analizei componentelor principale, s-au obinut urmtoarele


rezultate:
Matricea de covarian
x1 x2 x3 x4
x1 1 0,96 0,87 0,89
x2 0,96 1 0,92 0,81
x3 0,87 0,92 1 0,74
x4 0,89 0,81 0,74 1

Vectorii proprii (loadings)


Variabile PC 1 PC 2 PC 3 PC 4
x1 0,52 0,11 -0,53 -0,66
x2 0,51 -0,28 -0,42 0,69
x3 0,49 -0,56 0,63 -0,21
x4 0,48 0,77 0,38 0,19

Valorile proprii
Nr. Valoare proprie Proporie
1 3,590
2 0,290
3 0,100
4 0,020

a. Comentai rezultatele obinute, menionnd numrul de componente


principale reinute i criteriile pe baza crora au fost selectate.
Calculati proportia din varianta retinuta de fiecare primele doua
componente principale.

- Dup cum reiese din matricea de cov, variabilele au fost


standardizate inainte de aplicarea acp, aadar valorile din matrice
sunt egale cu coef de corelaie. Se observ existena unei legaturi
intense ntre toate variabilele (cel mai mic coef. de corelaie fiind
de 0.74)
- Valorile proprii (variante ale componentelor principale) sunt
distribuite descresctor, prima component avnd variana cea
mai ridicat.
- Proportia din varian retinut de componenetele principale este=
3.59/4 pt prima component i 0.29/4 pentru cea de-a doua.
- Am selectat o componenta principal: criteriul continutului
informational si criteriul lui Kaiser (desenati si screeplot). De
asemenea, plusul de informatie pe care il aduce a doua
componenta este nesemnificativ
b. Scriei forma estimat a componentelor principale reinute. Calculai
scorul unui obiect pe acestea, tiind c valorile sale pe variabilele
iniiale sunt: (10; 1;2;3).
- PC1=0.52X1+0.51X2+0.49X3+0.48X4
- SC1=0.52*10+0.51*1+0.49*2+0.48*3

c. Menionai i demonstrai dou proprieti ale componentelor


principale.

- Vectorii sunt ortonormali


0.52

0.51
pc1 0.52 0.51 0.49 0.48 1
0.49

0.48

-
0.11

0 .28
pc1t pc 2 0.52 0.51 0.49 0.48 0
0.56

0.77

-

- Conserv variana total


VTinitiala=1+1+1+1 (Suma elementelor de pe diagonala matricei de
covariant)
Var(PC)= 1+ 2+ 3+ 4=4

2. Rezultatele efecturii unei analize a componentelor principale pe un


numr de 4 variabile cauzele iniiale, utiliznd matricea de corelaie,
sunt urmtoarele:
Valoare proprie Valoare
1 2.03
2 1.89
3 0.07
4 0.01

Matr. A Vect. Pr1 Vect. Pr2 Vect.Pr3 Vect.Pr4


1 -0.69 -0.12 -0.12 0.70
2 -0.67 -0.22 -0.08 -0.71
3 -0.27 0.66 0.70 -0.03
4 -0.08 0.71 -0.69 -0.07
Variabile o1
x1 978
X2 51
X3 347
X4 290

Se cer urmatoarele:
a. S se interpreteze rezultatele prezentate n primele dou tabele
- n urma aplicrii ACP au fost obinute CP de varian maximal,
distribuit descresctor, variana primei cp fiind de 2.03 si a celei
de-a doua de 1.98
- Forma estimat a componentelor principale este:
PC1=-0.69x1-0.67x-0.27x3-0.08x4; Pc2=..., PC3..., PC4=...
Acestea sunt necorelate nre ele, cp sunt ortonormale si pstreaza
integral informaia din variabilele iniiale
b. S se determine numrul de componente principae reinute n
analiz
- Calculati proportia din varian reinut de fiecare component
(pt prima component 2.03/4=0.51, 1.89/4=0.47 pt a doua, in
total 0.98, deci conserv 98% din variana total)
- Screeplot
- Kaiser 2 componente au valoare proprie mai mare de 1
c. S se calculeze scorurile principale pentru obiectul o1
- Sc1=-0.69*978-0.67*51-0.27*347-0.08*290

3. Matricea vectorilor proprii A i matricea factor (corespunztoare


primelor dou componente principale) rezultate n urma efecturii
unei analize a componentelor principale pe un numr de patru
variabile iniiale utiliznd matrice a de corelaie sunt urmtoarele:
A a1 a2
x1 -0.472 -0.487
X2 -0.524 -0.434
X3 0.660 -0.614
X4 -0.259 0.354

W1 W2
x1 -0.684 -0.632
X2 -0.759 -0.560
X3 0.956 -0.796
X4 -0374 0.459

O
x1 0.50
X2 1.10
X3 0.75
X4 0.25

Se cer urmtoarele:
a. S se calculeze si sa se interpreteze primele dou valori proprii;

-0.684=-0.472* 1
-0,759=-0.525* 1
.....
1=2.1 (descrie 2.1/4, aprox 53% din inf totala)
prima PC are o varianta egala cu 2.1
-0.632=-0.487* 2
-0.560=-0.434* 2
....
2=1.68 (descrie 1.68/4, aprox 42% din inf totala)
cea de-a doua componenta are varianta de 1.68

b. S se determine procentul de acoperire corespunztor primelor dou


componente principale reinute n analiz;

1+ 2=3.78- descrie 3.78/4 din informatia totala (aprox 95)

c. S se calculeze scorurile principale pentru obiectul O i s se


reprezinte grafic acest obiect n spaiul principal;

Sc1=-0,472*0.5-0.524*1.10+0,66*0.75-0.259*0.25
Sc2=-0,487*0.5.....

Indicaie: Coloanele matricii factor sunt vectorii proprii denormalizai,


adic vectorii proprii nmulii cu rdcina ptrat a valorii proprii
asociate

4. Pentru a sintetiza informaia disponibil ntr-o matrice X40x5 s-a apelat


la ACP. Stiind ca cele 40 de forme sunt reprezentate de regiuni din
Europa i c cele 5 variabile reflect: valoarea adugat brut (X1),
consumul gospodriilor (X2), numrul absolvenilor de studii
superioare (X3), numrul firmelor nou nfiinate (X4), numrul
universitilor (X5), folosind outputul din tabelul de mai jos
rspundei la urmtoarele cerine:

Eigenvalues of the correlation matrix


Eigenvalues Differences Proportion Cumulative
1 2.94 0.588 0.588
2 1.76 0.352 0.94
3 0.2 0.04 0.98
4 0.08 0.016 0.996
5 0.02 0.004 1

Eigenvectors
Prin1 Prin2 Prin3 Prin4 Prin5
X1 0.566 -0.12 0.20 -0.43 0.66
X2 0.57 -0.10 0.13 -0.31 -0.74
X3 0.16 0.69 -0.66 -0.26 0.02
X4 0.56 -0.14 -0.30 0.76 0.08
X5 0.13 0.70 0.65 0.28 0.002

a. Care este a doua valoare proprie a matricei de corelaie?


Reprezentai grafic screeplotul. Ce reprezint aceste valori proprii
n contextul analizei componentelor principale?
- A doua valoare proprie=5-2,94-0.2-0.08-0.02=1.76
- Varianele componetelor principale

b. Apelai la dou criterii studiate pentru a stabili numrul de


componente principale reinute n analiz. Care este procentul
total de informaie preluat?
- Screeplot
- Kaiser (2 componete >1)
- Procentul de acoperire al lui 1=2.94/5=0.59, al lui 2=0.35, in
total 94%
Deci 2 PC

c. Folosind decizia luat la b, calculai valorile noilor caracteristici


care definesc regiunea care era iniial caracterizat de
urmtoarele valori:
X1 X2 X3 X4 X5
17 19 8 20 10

SC1=0.566*17+0.57*19+0.16*8+0.56*20+0.13*10
SC2=....

d. Completai elementele lips din matricea factor de mai jos.


Folosii informaiile pentru a da o interpretare componentei
principale W2.
X1 X2 X3 X4 X5
W1 0.97 0.98 0.28 0.95 0.23
W2 -0.16 -0.14 -0.19
W3 0.07 0.04 -0.22 -0.10 0.22
W4 -0.2 -0.09 -0.07 0.21 0.08
W5 0.10 -0.11 0.00 0.01 0.00

X1 X2 X3 X4 X5
W =0.566*s =0.57*sq =0.16*sqrt( =0.56*sq =0.13*sqrt(
1 qrt(2.94) rt(2.94) 2.94) rt(2.94) 2.94)
W = = = = =
2 -0.12*sqrt -0.10*sqr 0.69*sqrt(1. -0.14*sqr -0.70*sqrt(1
(1.76) t(1.76) 76)=0.92 t(1.76) .76)=0.93
W 0.07 0.04 -0.22 -0.10 0.22
3
W -0.2 -0.09 -0.07 0.21 0.08
4
W 0.10 -0.11 0.00 0.01 0.00
5

Cea de doua component principala este cel mai puternic corelat


cu variabile X3 i x5, deci este o componenta care surpinde
situaia invamantului superior, cele doua variabile fiind nr
absolventilor de studii superioare i nr.universitatilor

S-ar putea să vă placă și