Sunteți pe pagina 1din 11

Mișcarea naturală a populației României

Prezentul studiu realizează o analiză în componente principale a mișcării naturale a


populației României la nivelul anului 2016. Mișcarea naturală a populației este descrisă cu ajutorul
a 10 indicatori prezentați în tabelul 1, indicatori aflați în panelul de date INSSE referitoare la acest
aspect1. Datele prelucrate sunt preluate din două fișiere text de tip csv anexate studiului,
MiscNatAPop_Judete.csv și MiscNatAPop_Regiuni.csv.

Tabelul 1. Variabilele observate


Cod Denumire Unitate de măsura
RN Rata de natalitate Născuți vii la 1000 locuitori
RF Rata de fertilitate Născuți vii la 1000 femei in vârsta fertila
RMN Rata mortinatalității Născuți morți la 1000 născuți
RM Rata mortalității Decedați la 1000 locuitori
RMI Rata mortalității infantile Decedați sub 1 an la 1000 născuți vii
RNUP Rata de nupțialitate Casatorii la 1000 locuitori
RDIV Rata de divorțialitate Divorțuri la 1000 locuitori
RSN Rata sporului natural Spor natural la 1000 locuitori
VM Vârsta medie a soților la căsătorie Ani
DV Durata medie a vieții Ani

1. Analiza variabilității datelor

1.1 Analiza matricei de corelații


O primă imagine asupra variabilității este dată de matricea de corelații dintre variabilele observate.
Corelațiile puternice sunt cele care indică variabile între care există strânsă legătură, deci aduc
redundanță informațională în setul de date. Aceste variabile sunt cele din care se vor construi
componentele principale. În figura
1 este prezentată corelograma
variabilelor observate. Din analiza
graficului rezultă că rata natalității,
rata fertilității, rata mortalității și
rata sporului natural generează cele
mai mari corelații, deci aceste
variabile vor contribui cel mai mult
la constituirea componentelor
principale.

Figura 1. Corelogramă variabile observate

1
http://statistici.insse.ro/shop/index.jsp?page=tempo2&lang=ro&context=11
1.2 Analiza valorilor proprii. Varianța componentelor principale
Rezultatele modelului pornesc de la calculul vectorilor și valorilor proprii ale matricei de corelație.
Valorile proprii reprezintă varianțele componentelor iar vectorii proprii reprezintă coeficienții
legăturii liniare dintre variabilele observate și componentele principale. În tabelul 2 este prezentată
varianța componentelor principale, individual, cumulat și procentual. Conform criteriilor Cattell
și Kaiser sunt semnificative primele trei componente, aspect scos în evidență și de graficul
distribuției varianței este prezentat in figura 2.

Tabelul 2. Distribuția varianței


Componenta Varianta Varianta. Procent. Proc.Cumulat.
Cumulata Varianta Varianta
Comp1 4.086858 4.086858 40.86858 40.86858
Comp2 1.809834 5.896692 18.09834 58.96692
Comp3 1.353976 7.250667 13.53976 72.50667
Comp4 0.861584 8.112252 8.615843 81.12252
Comp5 0.703905 8.816156 7.039047 88.16156
Comp6 0.474926 9.291083 4.749263 92.91083
Comp7 0.41829 9.709373 4.182905 97.09373
Comp8 0.232216 9.941589 2.322157 99.41589
Comp9 0.049995 9.991584 0.499949 99.91584
Comp10 0.008416 10 0.084163 100

Prima componentă principală este mult mai semnificativă decât celelalte două, acoperind peste
40% din variabilitate.

Figura 2. Graficul valorilor proprii

2 Calculul corelațiilor dintre variabilele observate și componentele principale

Aceste corelații numite și corelații factoriale (eng. factor loadings) se calculează pornind de la
vectorii proprii ai matricei de corelație (vezi curs). Ele reprezintă coeficienții de corelație liniară
dintre variabilele observate și componentele principale. Fiind calculate din vectorii proprii ele
reflectă saturațiile componentelor în fiecare variabilă observată sau altfel spus, contribuția fiecărei
variabile observate la constituirea unei componente principale. În tabelul 3 sunt prezentate aceste
corelații pentru cele mai semnificative trei componente principale. Aceste corelații sunt importante
în încercarea de a denomina componentele principale. Acțiunea de denominare constă în asocierea
unei semnificații concrete componentelor principale, semnificație exprimată prin câteva cuvinte
care să dea un sens generic componentei. Denominarea mai este denumită și etichetare, "eticheta"
asociată fiind legată de ceea ce au în comun variabilele puternic corelate cu componenta respectivă.
Astfel, se poate observa că prima componentă principală este puternic corelată cu rata natalității,
rata fertilității, rata mortalității și rata sporului natural, adică acei indicatori de bază ai sporului
natural. Cu alte cuvinte prima componentă principală poate fi asociată cu sporul natural în sensul
generic. Componenta 2 este legată în principal de rata mortinatalității dar și de rata mortalității
infantile și durata medie a vieții. Mortinatalitatea și mortalitatea infantilă influențează durata vieții
și sunt indicatori care reflectă aspecte calitative în mișcarea naturală a populației, aspecte care țin
mai degrabă de starea de sănătate a populației. Componenta 2 este o componentă care ține de
mortalitatea precoce și durata vieții. Componenta 3 este legată în principal de rata divorțialității.
Are o corelație relativ mare și cu vârsta medie. Rata divorțialității reflectă un aspect social specific.
Având în vedere corelația slabă dintre rata divorțialității și vârsta medie (figura 1), asocierea unui
sens generic componentei 3 este mai dificilă. Referirea la această componentă se va face prin cele
două variabile. Corelațiile din tabelul 3 sunt prezentate grafic prin cercul corelațiilor (pentru
primele două componente) și prin corelogramă (figurile 3 și 4).

Tabelul 3. Corelațiile factoriale


Comp1 Comp2 Comp3
RN 0.86647 0.3676 -0.093743
RF 0.78158 0.40075 -0.194998
RMN -0.165503 0.70497 0.29053
RM -0.821134 0.05959 0.02489
RMI -0.586396 0.5764 0.01881
RNUP 0.69112 0.07441 0.43036
RDIV 0.15469 0.23775 0.76096
RSN 0.90773 0.13115 -0.057852
VM -0.105165 -0.425394 0.67294
DV 0.58575 -0.648933 0.0364

Figura 3. Cercul corelațiilor Figura 4. Corelograma variabile - comp.


3. Calculul scorurilor
Scorurile sunt proiecțiile normalizate ale județelor în axele principale (axele componentelor
principale). Proiecțiile în primele două axe sunt prezentate în figura 5. Valorile mari pe axa
componentei 1 înseamnă valori mari pentru RN, RSN, RF deoarece sunt puternic și direct corelate
cu componenta 1 și valori mici pentru RM deoarece aceasta este invers corelată cu componenta 1.
Tabelul scorurilor pentru primele 3 componente este prezentat în Anexa 1. În tabel putem urmării
și distribuția pe componenta 3. Astfel se înregistrează valori mari la componenta 3 pentru
București, Brăila, Hunedoara etc județe cu rata divorțialității mare, și valori mici pentru Vâlcea,
Bistrița-Năsăud, Dolj, Harghita etc acolo unde rata divorțialității este mică.

Figura 5. Reprezentare județe in axele 1 și 2

În ceea ce privește componenta 2 putem observa în figura 5 opoziția dintre județe precum Vâlcea,
București, Cluj, Dolj etc. și Satu Mare în special. În Satu Mare se înregistrează rate mari ale
mortalității precoce.
Figura 6. Reprezentare județe in axele 1 și 3

4. Valorile cosinus
Valorile cosinus reflectă importanța relativă a unui județ pentru o componentă în raport cu celelalte
componente. În anexa 2 sunt prezentate valorile cosinus pentru primele trei componente. Sunt
marcate cu verde mai intens valorile semnificative. Se poate observa că pe lângă județele
evidențiate anterior în figurile 5 și 6, mai sunt evidențiate județe care au o importanță relativă mare
pentru anumite componente, cum ar fi Bihor (componenta 2), Sibiu (componenta 1) sau Timiș
(componenta 1).

5. Contribuția instanțelor la varianța componentelor


Contribuția instanțelor la varianța componentelor reflectă importanța relativă a unui județ pentru
o componentă în raport cu ceilalți indivizi. Tabelul contribuțiilor pentru primele 3 componente
este prezentat în anexa 3. Se poate observa evidențierea mai clară a valorilor extreme luate de
unele județe pentru primele 3 componente: Ilfov, Teleorman, Tulcea, Brăila etc. pentru
componenta 1 ("sporul natural"), Vâlcea, Satu Mare, București, Bihor etc pentru componenta 2
("mortalitatea precoce și durata vieții "), București, Vâlcea, Bistrița-Năsăud, Brăila, Hunedoara etc
pentru componenta 3 ("rata divorțialității și vârsta medie ").

6. Comunalitățile
Comunalitățile scot în evidență "transferul" gradual de informație din variabilele observate la
componentele principale. Comunalitățile sunt prezentate prin corelograma din figura 7. Se pot
observa pe grafic variabilele care au legături mai puternice cu componentele mai puțin
semnificative (rata divorțialității, vârsta medie, rata mortinatalității).
Figura 7. Corelogramă comunalități

7. Extinderea modelului pe noi instanțe


Setul suplimentar este constituit de indicatorii mișcării naturale ai populației înregistrați la nivel
de regiuni (fișierul MiscNatAPop_Regiuni.csv). Datele sunt prezente în același panel de date al
INSSE (nu sunt obținuți prin sumarizare). În figura 8 este prezentată reprezentarea simultană a
județelor și regiunilor în axele primelor două componente principale. În general punctele
reprezentând regiunile se află în proximitatea celor reprezentând județele de care aparțin. Graficul
scoate în evidență însă și excepțiile, județele care sunt mai apropiate de alte regiuni decât de
regiunea din care fac parte. De exemplu punctele reprezentând județele Cluj, Brașov, Timiș, Iași
se află mai aproape de punctul reprezentând regiunea București-Ilfov. Alte excepții: Botoșani,
Hunedoare, Mureș etc. Tabelul scorurilor pentru setul suplimentar este prezentat în anexa 4.
Figura 8. Plot instanțe set suplimentar - axele 1 și 2

Figura 9. Plot instanțe set suplimentar - axele 1 și 3


ANEXE
Anexa 1. Tabela scorurilor
Cod C1 C2 C3
bh 0.277958 1.381268 0.584737
bn 1.252368 0.610451 -1.94006
cj 1.40076 -1.29759 -0.22013
mm 0.465889 0.808548 -0.24395
sm -0.35339 2.937453 0.296387
sj 0.807905 1.268793 -1.1448
ab 0.181291 -0.81301 0.048741
bv 1.139737 -0.9148 0.885548
cv 0.589758 0.359842 -0.97579
hr 0.669134 -0.03585 -1.32364
ms 0.259285 0.730866 -0.54734
sb 1.140802 0.05221 0.273744
bc -0.35232 -0.27724 -0.12788
bt -0.59363 0.826653 -0.65997
is 1.244137 -0.43343 -1.18111
nt -0.40412 -0.39348 0.013425
sv 1.290226 1.076979 -1.02696
vs -0.14254 0.457897 -0.54966
br -1.4611 0.034043 1.795756
bz -0.98644 -0.44629 -0.37248
ct 0.737278 0.569807 1.343989
gl -0.46624 -0.5523 1.216284
tl -1.51739 0.129664 -0.72566
vn -0.22447 -0.16292 0.058169
ag 0.115421 -0.21113 -0.13543
cl -0.9787 0.971568 -0.1719
db -0.01914 -0.298 0.011439
gr -1.20354 0.68235 -0.64289
il -0.92998 1.370467 0.429836
ph -0.24938 -0.67556 0.679595
tr -2.00957 -0.98694 -0.00698
if 2.765891 0.623541 0.994061
b 1.384462 -1.89568 2.396498
dj -0.61833 -1.22161 -1.47537
gj -0.24884 -0.2998 0.535028
mh -0.91557 0.814726 -0.13639
ot -1.13781 -1.18813 -0.65556
vl -0.28098 -2.96703 -2.09614
ar 0.04327 -0.17315 0.289544
cs -0.94792 0.093759 1.489526
hd -1.13882 -0.01067 1.772574
tm 1.414651 -0.54627 1.245215
Anexa 2. Valorile cosinus
Județe Comp1 Comp2 Comp3
Bihor 0.07034 0.76918 0.10312
Bistrita-Nasaud 0.46954 0.0494 0.3733
Cluj 0.62834 0.23878 0.00514
Maramures 0.18382 0.24519 0.0167
Satu Mare 0.02362 0.72272 0.0055
Salaj 0.30753 0.33589 0.20457
Alba 0.04044 0.36017 0.00097
Brasov 0.45455 0.12968 0.09091
Covasna 0.22093 0.03642 0.20038
Harghita 0.24158 0.00031 0.31318
Mures 0.08564 0.30133 0.12643
Sibiu 0.89837 0.00083 0.01714
Bacau 0.23655 0.06486 0.01032
Botosani 0.36755 0.31563 0.15051
Iasi 0.57826 0.03108 0.17266
Neamt 0.24648 0.10348 9.01E-05
Suceava 0.45825 0.1414 0.09618
Vaslui 0.04932 0.2254 0.24298
Braila 0.58167 0.00014 0.29109
Buzau 0.66114 0.05993 0.03123
Constanta 0.34733 0.09187 0.38238
Galati 0.15482 0.09621 0.34905
Tulcea 0.45519 0.00147 0.03449
Vrancea 0.13835 0.03228 0.00308
Arges 0.04762 0.07057 0.02172
Calarasi 0.3465 0.15121 0.00354
Dambovita 0.00155 0.16605 0.00018
Giurgiu 0.52797 0.07515 0.04991
Ialomita 0.40477 0.38927 0.02865
Prahova 0.05755 0.18701 0.14159
Teleorman 0.62471 0.06673 2.49E-06
Ilfov 0.85612 0.01927 0.03664
Municipiul
Bucuresti 0.30845 0.2561 0.3062
Dolj 0.14732 0.25465 0.27788
Gorj 0.04949 0.03181 0.0758
Mehedinti 0.46084 0.1616 0.00339
Olt 0.52164 0.25189 0.05737
Valcea 0.01034 0.51049 0.19062
Arad 0.00202 0.01434 0.02999
Caras-Severin 0.44363 0.00192 0.36291
Hunedoara 0.51569 2.01E-05 0.41391
Timis 0.7206 0.04758 0.18497
Anexa 3. Contribuțiile instanțelor
Comp1 Comp2 Comp3
Bihor 0.18395369 4.542623 0.8140888
Bistrita-Nasaud 3.73434907 0.887262 8.9614972
Cluj 4.67173358 4.008874 0.1153742
Maramures 0.51679101 1.556547 0.1416966
Satu Mare 0.29733946 20.54435 0.209156
Salaj 1.554072 3.832944 3.1203881
Alba 0.07825342 1.573763 0.0056564
Brasov 3.09285888 1.992517 1.8671321
Covasna 0.82812851 0.308301 2.2670612
Harghita 1.06604715 0.00306 4.1714901
Mures 0.16006794 1.271821 0.7132866
Sibiu 3.09864282 0.00649 0.1784179
Bacau 0.2955544 0.183004 0.0389363
Botosani 0.83903668 1.627035 1.0370401
Iasi 3.68542229 0.447286 3.321494
Neamt 0.38883584 0.368635 0.0004291
Suceava 3.96352954 2.761628 2.5110718
Vaslui 0.04837198 0.499213 0.7193423
Braila 5.08286836 0.002759 7.6779475
Buzau 2.31683465 0.474234 0.3303338
Constanta 1.29423533 0.773047 4.3007288
Galati 0.51756244 0.726276 3.5222524
Tulcea 5.48210614 0.04003 1.2537556
Vrancea 0.11997184 0.063198 0.0080563
Arges 0.03171893 0.106132 0.0436716
Calarasi 2.28062642 2.247486 0.0703558
Dambovita 0.00087185 0.211437 0.0003115
Giurgiu 3.44885727 1.108574 0.9840768
Ialomita 2.05917938 4.471856 0.4399019
Prahova 0.14807826 1.086623 1.0996419
Teleorman 9.61520739 2.319181 0.0001159
Ilfov 18.2146547 0.925722 2.3527567
Municipiul Bucuresti 4.56365157 8.556183 13.674289
Dolj 0.91032219 3.553155 5.1826887
Gorj 0.14742789 0.214005 0.6815597
Mehedinti 1.99585696 1.580427 0.0442932
Olt 3.08242328 3.361085 1.0232345
Valcea 0.18797617 20.96014 10.46146
Arad 0.00445791 0.071384 0.1996091
Caras-Severin 2.13939448 0.02093 5.2825903
Hunedoara 3.08787915 0.000271 7.4810002
Timis 4.76484917 0.710508 3.69181
Anexa 4. Scoruri set suplimentar

Regiune C1 C2 C3
Regiunea NORD-VEST 0.573141 1.471511 -0.46398
Regiunea CENTRU 0.829643 0.325387 -0.3459
Regiunea NORD-EST 0.227293 0.441985 -0.99483
Regiunea SUD-EST -0.88985 0.500451 0.675952
Regiunea SUD-MUNTENIA -1.1286 0.31958 -0.01942
Regiunea BUCURESTI - ILFOV 1.810254 -1.59442 1.678781
Regiunea SUD-VEST OLTENIA -1.24857 -1.6172 -1.54182
Regiunea VEST -0.17332 0.15271 1.011223

S-ar putea să vă placă și