Documente Academic
Documente Profesional
Documente Cultură
1
http://statistici.insse.ro/shop/index.jsp?page=tempo2&lang=ro&context=11
1.2 Analiza valorilor proprii. Varianța componentelor principale
Rezultatele modelului pornesc de la calculul vectorilor și valorilor proprii ale matricei de corelație.
Valorile proprii reprezintă varianțele componentelor iar vectorii proprii reprezintă coeficienții
legăturii liniare dintre variabilele observate și componentele principale. În tabelul 2 este prezentată
varianța componentelor principale, individual, cumulat și procentual. Conform criteriilor Cattell
și Kaiser sunt semnificative primele trei componente, aspect scos în evidență și de graficul
distribuției varianței este prezentat in figura 2.
Prima componentă principală este mult mai semnificativă decât celelalte două, acoperind peste
40% din variabilitate.
Aceste corelații numite și corelații factoriale (eng. factor loadings) se calculează pornind de la
vectorii proprii ai matricei de corelație (vezi curs). Ele reprezintă coeficienții de corelație liniară
dintre variabilele observate și componentele principale. Fiind calculate din vectorii proprii ele
reflectă saturațiile componentelor în fiecare variabilă observată sau altfel spus, contribuția fiecărei
variabile observate la constituirea unei componente principale. În tabelul 3 sunt prezentate aceste
corelații pentru cele mai semnificative trei componente principale. Aceste corelații sunt importante
în încercarea de a denomina componentele principale. Acțiunea de denominare constă în asocierea
unei semnificații concrete componentelor principale, semnificație exprimată prin câteva cuvinte
care să dea un sens generic componentei. Denominarea mai este denumită și etichetare, "eticheta"
asociată fiind legată de ceea ce au în comun variabilele puternic corelate cu componenta respectivă.
Astfel, se poate observa că prima componentă principală este puternic corelată cu rata natalității,
rata fertilității, rata mortalității și rata sporului natural, adică acei indicatori de bază ai sporului
natural. Cu alte cuvinte prima componentă principală poate fi asociată cu sporul natural în sensul
generic. Componenta 2 este legată în principal de rata mortinatalității dar și de rata mortalității
infantile și durata medie a vieții. Mortinatalitatea și mortalitatea infantilă influențează durata vieții
și sunt indicatori care reflectă aspecte calitative în mișcarea naturală a populației, aspecte care țin
mai degrabă de starea de sănătate a populației. Componenta 2 este o componentă care ține de
mortalitatea precoce și durata vieții. Componenta 3 este legată în principal de rata divorțialității.
Are o corelație relativ mare și cu vârsta medie. Rata divorțialității reflectă un aspect social specific.
Având în vedere corelația slabă dintre rata divorțialității și vârsta medie (figura 1), asocierea unui
sens generic componentei 3 este mai dificilă. Referirea la această componentă se va face prin cele
două variabile. Corelațiile din tabelul 3 sunt prezentate grafic prin cercul corelațiilor (pentru
primele două componente) și prin corelogramă (figurile 3 și 4).
În ceea ce privește componenta 2 putem observa în figura 5 opoziția dintre județe precum Vâlcea,
București, Cluj, Dolj etc. și Satu Mare în special. În Satu Mare se înregistrează rate mari ale
mortalității precoce.
Figura 6. Reprezentare județe in axele 1 și 3
4. Valorile cosinus
Valorile cosinus reflectă importanța relativă a unui județ pentru o componentă în raport cu celelalte
componente. În anexa 2 sunt prezentate valorile cosinus pentru primele trei componente. Sunt
marcate cu verde mai intens valorile semnificative. Se poate observa că pe lângă județele
evidențiate anterior în figurile 5 și 6, mai sunt evidențiate județe care au o importanță relativă mare
pentru anumite componente, cum ar fi Bihor (componenta 2), Sibiu (componenta 1) sau Timiș
(componenta 1).
6. Comunalitățile
Comunalitățile scot în evidență "transferul" gradual de informație din variabilele observate la
componentele principale. Comunalitățile sunt prezentate prin corelograma din figura 7. Se pot
observa pe grafic variabilele care au legături mai puternice cu componentele mai puțin
semnificative (rata divorțialității, vârsta medie, rata mortinatalității).
Figura 7. Corelogramă comunalități
Regiune C1 C2 C3
Regiunea NORD-VEST 0.573141 1.471511 -0.46398
Regiunea CENTRU 0.829643 0.325387 -0.3459
Regiunea NORD-EST 0.227293 0.441985 -0.99483
Regiunea SUD-EST -0.88985 0.500451 0.675952
Regiunea SUD-MUNTENIA -1.1286 0.31958 -0.01942
Regiunea BUCURESTI - ILFOV 1.810254 -1.59442 1.678781
Regiunea SUD-VEST OLTENIA -1.24857 -1.6172 -1.54182
Regiunea VEST -0.17332 0.15271 1.011223