Sunteți pe pagina 1din 23

Analiza socio-demografica a

judetelor din Romania in anul


2014

Realizator:Sandica Paraschiva Bianca


Grupa 1045

Cuprins:
Cap1:Descrierea Datelor..................................................................................................3
Cap 2.Statistici Descriptive..........................................................................................5
2.1 Descrierea
variabilelor...........................................................................................................................5
2.2 Descrierea
unitatilor.................................................................................................. ............................8
Cap 3.Analiza componentelor principale.............................................8

Cap1.Descrierea datelor
In cele ce urmeaza am realizat o analiza socio-demografica, indeosebi o analiza a gradului de
sanatate, pe fiecare judet din Romania.Analiza se va face pe baza informatiilor luate din Anuarul
Statistic al Romaniei si cu ajutorul a 10 indicator,i care stau la baza calcului gradului de
sanatate , vom identifica judetele cu un nivel de trai ridicat si vom incerca sa facem o clasificare
a acestora.
Primul indicator masurat pentru cele 42 de judete ale Romaniei este populatia. Acest indicator
reprezinta totalitatea locuitorilor unui judet.
Al doilea indicator este produsul intern brut -PIB/loc (Ron) reprezinta suma valorii de piata a
tuturor marfurilor si serviciilor destinate consumului final, produse in tote ramurile economiei in
interiorul unui judet in decurs de un an.Pentru a fi mai usor de observat comparabilitatea dintre
observatii am considerat pibul pe cap de locuitor exprimat in Ron.
Al treilea indicator este castigul salarial brut lunar(Ron) si reprezinta suma de bani pe
care o castiga , in medie, un cetatean al unui judet, intr-o luna.
Indicatorul 4 este rata somajului(%)-reprezinta procentul din populatie ce este inregistrat in
somaj din numarul total al populatiei active. Somajul este termenul folosit in cazul lipsei
ocupatiei platite (locurilor de munca) pentru fortele apte si calificate corespunzator pentru munca.
Indicatorul 5 este durata medie de viata(ani).Durata medie a vietii reprezinta numarul mediu de
ani pe care ii are de trait un nou nascut, daca ar trai tot restul vietii in conditiile mortalitatii pe
varste din perioada de referinta.
Indicatorul 6-Unitati sanitare-numarul de spitale dintr-un judet.
Indicatorul 7- Unitati sanitare-numarul de farmacii dintr-un judet
Indicatorul 8-Numarul de paturi din spitale-totalitaea paturilor din toate spitalele de pe
teritoriul unui judet.
Indicatorul 9-Personalul medico-sanitar(nr de medici) nr de doctori activi din fiecare judet al
romaniei.
Indicatorul 10-Numarul de absolventi-superior populatia care absolvit studii superioare( ca
procent din populatia peste 25 de ani).
Scopul final este acela de a afla care din indicatorii de mai sus au cea mai mare importanta in
exprimarea unui anumit nivel al sanatatii si ce judete au un grad al sanatatii ridicat.

Cap 2.Statistici Descriptive


2.1 Descrierea variabilelor
Mai nti constatm c toate caracteristicile urmarite (anume indicatorii socio-demografici) sunt
variabile continue, scara lor de msur fiind usor de identificat. Prin urmare, intr-o prima analiza
putem calcula pentru fiecare dintre aceste variabile indicatorii de centrare si de mprastiere,
cum ar fi media, valoarea minima i valoarea maxima, precum si abaterea standard (vezi tabelul
2)
Tabel 2:Indicatorii de centrare si de
I1
I2
I3
I4
imprastiere

I5

I6

I7

I8

I9

I10

Media

511189.50

4596.90

1679.83

8.54

73.07

11.17

177.07

3307.50

1352.26

5378.43

StDEV

280347.29

7518.33

232.25

2.44

0.92

8.47

153.93

3087.16

1850.32

13643.50

max

1944226.00

50157.75

2506.00

14.10

75.29

54.00

1048.00

20653.00

10871.00

88093.00

Min

222710.00

1063.08

1378.00

2.00

70.34

4.00

55.00

871.00

283.00

0.00

Sum

21469959.00

193070.00

70553.00

358.70

3068.86

469.00

7437.00

138915.00

56795.00

225894.00

CV

54.84

163.55

13.83

28.57

1.26

75.86

86.93

93.34

136.83

253.67

Kurtosis

17.31

33.72

6.07

3.76

3.98

16.75

25.69

25.05

18.36

33.78

Skewness

3.25

5.49

1.52

-0.44

-0.15

3.3

4.46

4.4

3.7

5.5

Indicatorul I1
Se refera la populatia unui judet in functie de caz, si se masoara in nr-locuitori . Se observa din
tabel ca, in medie, populatia unui judet este de 511190 loc.Valoarea maxima se inregistreaza in
Bucuresti, avand o populatie de 1944226loc, iar judetul cu cea mai mica populatie este Covasna,
cu o populatie de 222710 loc.
Dupa cum se observa si din valoarea coeficentului de variatie(54,84%) avem o variatie mare a
datelor, putand spune ca esantionul nu este omogen iar 50%(21 judete) din judete au o populatie
mai mare de 453110 loc, pe cand doar 25%(app 11 judete) din judete au o populatie mai mare de
606470 loc si tot 25% din judete au o populatie mai mica de 333526 loc.Totodata , acestea
rezultate arata ca 50%din judetele Romaniei au intre 333526 loc si 606470.

Pentru a afla quartilele rulam urmatoarea comanda in R:quantile(I1)


0%

25%

50%

75%

100%

222710.0 333526.2 453110.5 606469.8 1944226.0


Fig 1: Grafic Boxplot
4

Analizand indicele de asimetrie(skewness) si de boltire (kurtosis), se observa ca datele au o


distributie asimetrica pozitiva leptokurtica, ceea ce inseamna ca cele mai multe judete au o
populatie apropiata de medie(511190 loc).Unul dintre lucrurile care se observa din graficul
boxplot(Fig 1) este faptul ca avem un punct considerat outlines care este Bucuresti, avand o
populatie de 1 944 226loc, fiind mult mai mare decat 1.5(Q3-Q1)+Q3=742 941.6
Rulam comanda hist(I1) in R pentru a ne afisa histograma indicatorului I1.
Fig
2:

Conform histogramei cele mai multe judete(peste jumatate)au o populatie


cuprinsa intre 22370loc si 50000de locuitori , iar in intervalul 100000loc si
1500000loc nu se situeaza nici un judet.Peste 15000, nu este decat un judet
-Mun.Bucuresti.

Densitatea de probabilitate
Pentru a afla densitatea de probabilitate rulam in R comanda: d<-density(I1)
plot(d)
Fig 3:Densitatea de

Din graficul alaturat putem deduce ca


variabila I1 are o asimetrie pozitiva ,
distributia de probabilitate fiind inclinata
spre stanga, cele mai multe judete avand
o populatie mai mica sau apropiata de
medie.

Fig 4: Grafic Vioplot

Ruland comanda vioplot(I1) in R se


obtine graficul vioara , o combinatie intre
densitatea de probabilitate si boxplot.
De aici putem deduce ca avem putine
judete cu o populatie pese 100000loc , iar
majoritatea judetelor au o populatie sub
500000loc.

2.2 Descrierea unitatilor

Analiza este realizata pe cele 42 de judete ale Roamaniei , sursa datelor in legatura cu populatia ,
rata somajului si ceilalti indicatori care reflecta analiza socio-demografica a Romaniei este
Anuarul Statistic al Romaniei . .Scopul analizei datelor pe cazul particular prezentat mai sus este
acela de a afla cativa indicatori relevanti pe baza carora sa pot obtine o ierarhizare cat mai corecta
a judetelor din punctul de vedere a gradului de sanatate.
Deoarece ordinul de marime al datelor si unitatile de masura este foarte diferit, vom efectua
AnalizaComponentelor Principale pe date standardizate.
Operatia de standardizare a valorilor unei variabile consta in substituirea valorilor fiecarei
operatii cuo noua valoare reprezentand raportul dintre valoarea centrata a respectivei operatii si
abaterea standard arespectivei variabile, obtinand datele din tabelul 3.

Cap 3.Analiza componentelor principale


Aa cum am mai mentionat, datele multivariate sunt greu de vizualizat. Din acest motiv ar fi
necesara reducerea dimensiunilor matricei lor. De cele mai multe ori este dorit reducerea
numrului de coloane.
Tehnica numit Analiza componentelor principale (Principal Component Analysis PCA) are
ca scop reducerea controlata a numarului de variabile (coloane) ale matricei de date, pe cat
posibil la doua sau trei. Astfel, n loc de 10 variabile corelate ntre ele am dori s avem doar
doua sau trei variabile noi, numite componente. Acestea exprima atribute noi ale indivizilor si
sunt construite n asa fel ncat sa fie necorelate ntre ele, fiecare dintre aceste noi variabile fiind o
combinatie liniara de variabilele originale.
Tot ceea ce trebuie sa facem este sa gasim coordoantele noilor valori, cu ajutorul vectorilor
proprii, sa aflam informatia detinuta de fiecare componenta principala, si in functie de varianta
fiecarei comonente vom extrage primele 3 componente cu varianta cea mai mare. Vom afla
informatia detinuta din variabilel initiale de fiecare componenta in parte
Astfel vom continua analiza judetelor din punct de vedere socio-demografic cu ajutorul a 3
Tabel 3: Date standardizate
variabile.
I1st

I2st

0.7311
88
0.2238
9
1.1371
02

0.1962
2
0.4348
9
0.1147

I3st
0.7111
61
0.2188
7
0.4786
52

I4st
0.3035
0.0243
97
0.1473
57

I5st
0.6910
1
0.3011
6
0.7817
67

I6st

I7st

0.0983
79
0.1377
3
1.1608
7

0.3837
6
0.4552
3
1.0389
91

I8st

I9st

I10st

0.0471
31
0.2278
8
1.1261
16

0.1914
6
0.4157
5
0.7699
96

0.0376
42
0.1408
3
0.1226
64

0.6974
58

6
0.3585
9
0.2668
2

0.2173
0.5386
1
0.1016
8

0.4521
0.2967
6
0.2678
3

0.4355
95
0.9379
3
0.4298
5
0.4686
1

0.7532
46

0.3242
02

0.9221
41

0.9183

0.3506
03
0.9407
8
0.4301
6

0.1482
0.4301
1
0.3661
6

0.0696
09
0.3480
5

1.0490
63

0.4625
74
0.7073
7

0.7671
35
0.7355
6
0.0681
7

0.7969

0.1538
93
0.4274
6
0.2638
2
0.4700
3
0.4276
3

1.0860
37
0.3878
3
0.6925

0.1701
78
0.3828
3
0.1346

0.9221
41

0.1883
43

0.6925
0.4183

1.2539
97
1.0900

0.1829
86

0.0683
6
0.8203
6

0.7700
1

0.9164

0.1600
29
0.6709
7

0.5084
3
0.5084
3
0.2215
2
0.2215
2
0.3932
77

0.1063
7
0.4674
4
0.3522
9
0.2703
17
0.0243
97
0.5494
2
1.2539
97

0.5002
07
1.2907
4
0.2944
52
0.1861
59
0.5760
11
0.5502
3
0.1495
5
1.2108
1
0.8900
59
0.6518
16
1.3624
2
0.4460
61
1.5898
3
0.8859
3
0.5326
95
0.5502
3
-

0.4918
9
0.0196
8
0.4918
9

0.1823
7

0.1967
8

0.3373
59
0.4682
2
0.2863
1
0.2408
4

0.0040
49
0.2447
2
0.3927
6
0.1773
5

0.6886
52
0.0196
8
0.8460
6
0.3738
4

0.6362
02

0.3406
04

0.0060
33
0.5201
9
0.5007

0.0024
29
0.7244
5
0.5592
5

0.9247
61
0.6099
5
0.3738
4

0.3308
62
0.6501
2

0.1809
11
0.6480
1

-0.728
0.8460
6

0.1034
81
0.6241
4
0.5656
7

0.2376
0.7892
4
0.7827
6

0.5705
97
0.3738
4
0.3344

0.5582
43
0.4487
3
0.7856

0.3451
39
0.3778
6
0.3807

-0.728
0.3738
4

0.3222
5
0.3222
5
0.4460
1
0.4595
2
0.4200
7

0.0634
3

0.3587
15
0.2849
6
0.5422
1
0.4568
2
0.0152
7

0.2139
9
0.0119
1
0.3942
1
0.3883
5

0.5768
0.3779
1
0.5768
0.5778
8
0.1055
3
0.4454
7
0.3992
8

0.1130
63
0.0962
7
0.3508
9
0.3843
2

0.0712
0.3817
5
0.2373
6
0.3942
1
0.3942
1
0.2487
2
0.3879
1
0.2335

54
0.4760
9
0.7785
8
0.1582
6
0.3689
2
0.7093
8

28
0.0760
1
0.3527
1
0.2309
8
0.2003
1
0.1380
82

2.8080
45

5.1116
47
0.4902
3

6.0599
66
0.1620
3

3.5572
4
0.5805
5

0.3076
52
1.0290
1
0.6654
3

0.2571
87
0.4200
1
0.3146
4
0.1054
5
0.0421
7

0.4657
35
1.2996
1
0.9551
5
0.2447
1

0.2483
54
0.3069
6
0.2920
15
0.6919
4
0.6388
84
0.0004
33
0.5216

0.0170
14
0.3518
0.4027
88
0.2426
3
0.3279

72

0.3553

1.4861
9

0.9670
9

0.5976
7

0.3322
58

2.2786
63

0.1428
06
0.4040
2

0.1063
7
0.1805
4
2.6807
2
2.5167
8

0.9834
0.9509
1

0.3710
09
1.2350
2
0.8087
6
0.8704
73
1.1747
4
1.1403

2.1570
78
0.3444
7
2.4061
5

1.6638
63

0.8359
13

0.0653
83

0.2294
76

1.0490
63

0.2619
64

0.8441
3
0.1805
4
0.1395
5
1.0822
4
0.0575
8
0.9183
0.8363
2
0.8363

0.4135
73
0.2403
06
0.2294
76
0.9400
8
0.6951
33
1.5723
0.1603
8
2.9543

88
0.3738
4
0.6099
5
0.6099
5
0.2557
8
0.4918
9

24
0.3837
6
0.4422
3
0.5201
9
0.4357
4
0.5786
6

5.0566
72
0.1377
3

5.6580
67
0.2083
5

5.6185
97
0.2515
3

0.9247
61
0.4918
9

0.2334
13
0.7930
5
0.3837
6

0.1190
42
0.4303
3
0.3551
8

0.2204
2

0.2988
18
0.1332
9

0.2722
44

0.3734
0.3597
6
0.2111
9

0.1493

0.0341
97

0.3344
5

0.1468
6
0.5135
7

0.0188
05

-0.728
0.2557
8
0.1377
3
0.5705
97
0.8460
6
1.7511
43
0.0196
8
-0.728

0.3188
0.4737
87
0.4357
4
0.4802
84
0.1888
7
0.2148

71
0.3189
0.5352
8

49
0.3784
5
0.4665
5

-0.35
0.3305
6
0.5495
3

0.3563
0.3476
5
0.4384
4

0.5586
1.2320
39
0.0056
7
0.4672

5.1443
74
0.3595
4
0.0498
6
0.5324
8
0.5000
6

1.1375
0.3044
1
0.4497
9

6
0.2536
3
0.3127
8
0.3773
5
0.3047
2
0.3901
8
6.0625
64
0.2889
6
0.7555
67

0.3712
0.6260
54
0.2419
0.3478

8
0.9607
7
0.1970
3
0.6714
8
0.1656
9

4
0.4186
2

0.0445
12

-0.615
0.1758
2
0.5891
7
0.1026
2

0.5952
56

0.9121
22

0.6637
98

0.1477
71
0.2128
2

1
0.9617
4
0.3336
4
0.6801
8
0.3444
7

0.8031
43
0.7133
6
0.7621
57
0.8441
3
1.6970
4

0.5110
36

5
0.4918
9

0.5007

0.3344
88
0.3738
4
0.0196
8

0.1239
0.5331
8
0.0199
5

0.5705
97

0.5452
5

6
0.5861
4
0.2301
5
0.3976
1

9
0.5470
7
0.1876
8

2
0.3865
2

0.3933
04

0.0359
56
0.3053
1

0.0652
7

1.1656
03

0.2658

0.7633
23

2.3302
66

0.4820
3

Pentru a vedea dac indicatorii calculai sunt independeni sau nu, vom analiza matricea
coeficienilor de corelatie din tabelul urmtor:
Column 1

Column 2

Column 3

Column 4

Column 5

Column 6

Column 7

Column 8

Column 9

Column 1

Column 2

0.876455

Column 3

0.643755

0.675992

Column 4

-0.4637

-0.48758

-0.44302

Column 5

0.498634

0.43644

0.344676

-0.18086

Column 6

0.927789

0.895018

0.651928

-0.44927

0.512353

Column 7

0.954368

0.94446

0.626188

-0.43785

0.460431

0.932904

Column 8

0.951747

0.945805

0.627913

-0.45745

0.512781

0.957578

0.975445

Column 9

0.848653

0.912943

0.600184

-0.46282

0.427005

0.879739

0.898219

0.930742

Column 10

0.892483

0.977629

0.625338

-0.45792

0.443193

0.906727

0.946494

0.951989

0.884944

Tabel 4: Matricea de corelatie.

Dupa cum se observa , avem o legatura puternica ( 0,9776 )intre PIB/loc (I2) si Nr de absolventi
superior I10,si putem spune ca acesti indicatori evolueaza in acelasi sens. Pe ansamblu,
majoritatea indicatoriilor sunt corelati intre ei avand un coeficent de corelatie mai mare decat
0.Doar indicatorul rata somajului (I4) are indici de corelatie negativi , ceea ce inseamna ca
evolueaza in sens invers fata de ceilalti indicatori, insa neavand o legatura atat de puternica cu
ceilalti, cel mai mare coeficent de corelatie fiind in raport cu numarul de paturi din
spitale.cov(I8,I4)=0,46.
In continuare se va aplica metoda analizei componentelor principale asupra setului initial de date
cu 10 variabile cu ajutorul SAS.
10

Column
10

Mai intai voi rula comanda considerand numarul de componente principale egal cu numarul de
variabile.
ods graphics on;
proc princomp data=judete out=rezultate oustat=statistici n=10;
var I1 I2 I3 I4 I5 I6 I7 I8 I9 I10;
run;
Vom obtine 10 vecori proprii, 10 valorii proprii si 10 componente principale. Mai jos sunt
reprezentate doar valoriile proprii pentru cele 10 componente.

Tabel 5:Valori Proprii

Eigenvalue Difference Proportion


1
2
3
4
5
6
7
8
9
10

7.53731003
0.84592546
0.68759288
0.49271658
0.17914559
0.13112376
0.07341512
0.02674058
0.01479730
0.01123270

6.69138457
0.15833258
0.19487630
0.31357100
0.04802182
0.05770865
0.04667454
0.01194328
0.00356460

Cumulative

0.7537
0.7537
0.0846
0.8383
0.0688
0.9071
0.0493
0.9564
0.0179
0.9743
0.0131
0.9874
0.0073
0.9947
0.0027
0.9974
0.0015
0.9989
0.0011
1.0000

In prima coloana sunt valoriile proprii ce exprima varianta explicata prin fiecare componenta
principala in parte. Informatia totala fiind de 10, reprezentand suma valoriilor proprii.
In coloana 2 avem diferenta dintre 2 componente consecutive, iar in coloana a 3 a avem
procentul din informatia totala preluata de o componenta in parte. Exemplu: pentru afla cat la
suta preia prima componenta principala folosim relatia Var(W1)/var totala* 100=75,37%, deci
prima componenta principala preia 75, 37% din informatia totala.
In ultima coloana din fig 2 este exprimat procentul cumulativ al componente dinainte .
Deoarece prima valoare proprie este mai mare decat 1 (Criteriul lui Kaiser), putem spune ca
avem o singura componenta principala care sintetizeaza din punct de vedere informational toate
cele 10 variabile originale.Astfel prin intermediul primei componente principale se asigura
conservarea a 75,37% din varianta totala .
Analizand Fig
graficul alaturat si conform criteriului procentului de acoperire am putea retine 2 sau 3
componente principale. Daca am alege 2 componete principale am prelua 83,83% din informatia
totala, respectiv 90,71% retinand 3 componente principale.

11

Pe grafic am identificat diferentele semnificative existente intre valorilie proprii si am trasat o


paralela verticala
in Scree Plot ,astfel incat la dreapta taieturii sa ramana
o
dreapta cu panta aproximativ egala cu 0.
Fig 6:

Conform
criteriului panta
:numarul de
factori ce se vor
retine
n model este
determinat de punctul de pe grafic n dreapta
caruia panta curbei devine neglijabil, numarul de
ordine al valorii proprii corespunzatoare acestui punct determinnd numarul de factori ce se vor
retine.
Prin urmare, ar trebui retinute in analiza 4 componente principale.

Chiar daca criteriul kaiser si criteriul pantei dau doua rezultate diferite, voi continua analiza
componentelor principale conform criteriului procentului de acoperire.astefel vom lua in analiza
3 componente principale preluand o informatie totala de 90,71 din informatia totala.
Acum vom rula in SAS comanda pentru cele 3 componente principale si solicitam toate graficele
reprezentative.
ods graphics on;
proc princomp data=judete out=rezultate oustat=statistici n=3 plots=all;
var I1 I2 I3 I4 I5 I6 I7 I8 I9 I10;
12

run;

In tabelul X avem reprezentate valoriile proprii pentru cele 3 componente principale.


Tabelul 6:Valorile proprii pentru cele 3 componente
principale

Eigenvalues of the Correlation Matrix


Eigenvalue Difference Proportion
1
2
3

7.53731003
0.84592546
0.68759288

Cumulative

6.69138457
0.7537
0.7537
0.15833258
0.0846
0.8383
0.0688
0.9071

Valoriile proprii arata cata informatie detine fiecare componenta in parte.Adtfel, componenta 1
are o varianta de 7.5373, preluand 75,37 %din varianta variabilele initiale ,componenta 2 are o
varianta de 0,8459 preluand din varianta totala 8,459 %.Cumulativ, cele doua comopnente
principale cuprind 83,83% din varianta totala. Componenta 3 are o varianta de0,688 si
explica6,88 %din varianta totala.Cele 3 componente preiau 90,71%din informatia continuta in
variabilele initiale.
Tabelul 7:Vectorii proprii pentru cele 3
componente principale

Eigenvectors
Prin1
I1
I2
I3
I4
I5
I6
I7
I8
I9

0.346550
0.351323
0.261560
-.195091
0.195236
0.349031
0.353587
0.358326
0.338491

Prin2
0.054374
-.038801
-.226199
0.726604
0.634121
0.074765
0.052026
0.076312
-.009746

Prin3
0.060761
0.140099
-.255567
0.526579
-.727691
0.064563
0.178671
0.116594
0.157623
13

I10

0.349378

0.009635

0.173248

Coloana unui factor din figura 1 ne ofer informaii despre ponderile (coeficientii) cu care
participa fiecare indicator (I1, , I10) la descrierea factorului respectiv.Analizand vectorii
proprii putem trage concluzii asupra directiei si puterea legaturii dintre variabilele initiale si
componentele principale. Astfel,intre I4-rata somajului si prima component principala exista o
legatura inversa , iar indicatorul I8 numarul de paturi din spitale este reprezentat cel mai
puternic in componenta principala 1.Pe cand I4-rata somajului este reprezentat cel mai puternic in
componenta principala 2,existand o legatura puternica intre acestea.
Intrucat componentele principale pot fi scrise ca combinatii liniare a variabilelor originale, cu
ajutorul vectoriilor proprii putem indentifica coordonaltele noilor variabile.De exemplu:
W1=0,35*x1+0,35*x2+0,26*x30,20*x4+0,20*x5+0,35*x6+0,35*x7+0,36*x8+0,34*x9+0,34*x10,
unde Xi, i=1,10 reprezinta valoriile initiale.Astfel se obtin coordonatele noilor variabile din
tabelul 7.
Cu ajutorul componentelor principale putem caracteriza gradul de sanatate a judetelor din
Romania prin doar 3 variabile , in loc de cele 10 variabile pastrand 90,71% din informatia
continuta in datele initiale.
Tabelul 7:Coordonatele noilor valori
Prin1
0.158641566
-0.831798654
2.082385248
-0.505044273
0.657380602
-0.988297552
-1.09798888
-0.771812994
1.471403854
-0.250695462
-1.885399748
-1.050665433
0.948089713
-1.910019948
-0.394376795
-1.701333183
-2.128644044
1.142202734
-1.512953774
0.862420435
-0.472114393
-1.771630118

Prin2
-0.778982119
-0.167708772
0.781277155
0.08705081
0.419423203
0.167251203
-0.061651071
0.708256628
-1.087214787
0.678182707
-0.790367182
0.326899091
0.614583695
-0.649953468
0.290656032
-1.615228498
0.323820413
0.415180589
0.633131642
0.597826388
0.651567343
0.820362752

Prin3
0.097835963
0.006673815
-0.026097759
-0.623125266
-1.285042685
-0.398686203
-0.49373522
-0.356646482
0.063819289
0.597101634
0.522841593
-1.055155561
-0.310029538
0.830734827
-0.461171201
0.301251077
0.961820796
-0.317199759
0.874718567
1.09632037
-0.578549152
1.425337381

14

-1.0797262
-0.433472033
0.134942169
15.42993226
-0.974594034
1.045893816
-1.91459696
-1.486929886
0.18125221
-0.19927388
0.354544268
-1.381037827
2.902974793
-0.523746823
-1.779153142
-1.864311548
-0.048816127
-1.178080317
0.010589552
2.753860803

-0.657187054
1.249205189
-2.953673916
0.044725353
1.810380686
0.192557626
1.073403626
0.967592663
0.104611911
-0.090128506
-0.996325544
0.4308051
0.39687798
-0.445303202
-2.339009676
-0.029124756
-0.703405976
0.134679002
0.395938528
-0.950982784

0.374840003
-1.852477537
-2.238272349
1.027954468
0.181573769
0.041469708
0.200308204
0.005009568
-0.143046872
-0.458852327
0.636852464
-0.763665522
-1.124640268
-0.182994591
1.65219429
0.820161368
-0.129917426
0.819590164
0.858016562
-0.597120162

In figura urmatoare este prezentata Component Score Matrix, care pe diagonala principala
contine histogramele celor 3 componente principale.Prima comonenta principala are o inclinatie
spre stanga , o asimetrie pozitiva,iar frecvente mai mari ale valorilor extreme.
Componenta 2 are o distributie aproape de normala si , cu frecvente mai mari in jurul mediei si
frecvente reduse ale valorilor extreme. Componenta 3 are o distributie inclinata spre dreapt
asimetrie pozitiva, preponderand valorile mari .
Fig
7:

15

In celelalte
cadrane este reprezentat norul de puncte a celor 42 de judete in spatiul a cate 2 componente
principale.
Scater plot-urile arata legatura intre componentele principale. Astfel, componenta 1 are o stransa
legatura directa cu componeta 2 si W3, pe cand intre W2 si W3 nu putem spune ca exista
legatura a variabilelor intrucat norul de puncte nu se grupeaza in jurul unei drepte.

Fig
8:

16

In figura de mai sus, Component Pattern Profiles , se arata corelatia dintre componentele initiale
si cele 10 variabile initiale.Datorita acestui grafic putem grupa cele 10 variabile initiale in jurul
componrntelor principale in functie de componenta cu care are o corelatie maxima, indiferent
daca este pozitiva sau negativa. Putem afirma ca cele 3 componente principale isi preiua mai
multa informatie de la variabilelle cu care au un coeficent de corelatie mare.Prin urmare:
W1 este puternic corelata cu I1Populatia
I2Pib/loc (ron)
I3-Castigul salarial lunar brut
I6-Unitati sanitare-Nr. de spitale
I7-Unitati sanitare-Nr de farmacii
I8-Nr de paturi din spitale
I9-Nr de medici
I10-Nr de absolventi-studii superioare
W2 esteputernic corelata cu I4-Rata somajului
W3 este puternic corelata cu I5-durata medie de viata(ani)
Putem sintetiza W1 ca reprezentand nivelul gradului de sanatate , totodata poate fi numit si
nivelul de trai. W2 ca fiind rata somajului , W3 durata medie de viata. Astfel putem caracteriza
judetele roamaniei in functie de aceste 3 variabile(nivel de trai, rata somajului, durata medie de
viata)
17

In figurile ce urmeaza sunt reprezentate detalii a preluarii informatiei din variabilele initiale a
celor 3 compnente principale.
.
Fig 8:

Variabilele I1, I2 I3 I5 I6 I7 I8 I9 I10au o corelatie


puternica pozitiva cu W1, avand un coeficent de
corelatie apropiat de 1, pe cand variabila I4,I5 au o
corelatie puternica pozitiva cu W2,

Fig 9:

Variabilele I1, I2,I6,I7,I8,I9,i10 au o corelatie


puternica pozitiva cu W1. Variabila I5 are o
corelatie puternica negativa cu W3, cu un
coeficent de corelatie mai mare decat -0.6. I4 are o
corelatie puternica negativa cu W1.(fig9 )
Componenta 2Fig
este influentata direct si puternic de
I5,I4, si invers de catre I3.Componenta 3 este
influentata direct de catre I4, si invers de catre I5. Cu
celelalte variabile atat comp 1 cat si comp 2 sunt aproape
necorelate(coeficent de corelatie <0.2).

18

Fig

Mai departe vom face analiza judetelor din Romania cu ajutorul celor 3 noi variabile:nivel de
trai(W1), rata somajului(W2), durata medie de viata (W3).Dupa cum se observa si in graficul de
mai sus , judetele au o distributie apropae normala atat din punctul de vedere a nivelului de trai
cat si a ratei somajului .

19

Putem face o
grupare a
judetelor in
functie de
nivelul de
trai si nivelui ratei
somajului . Judetul care se
remarca din grafic este Mun Bucuresti cu o rata a somajului foarte mica si cu un nivel de trai
foarte ridicat: Mun-Bucuresti.In schimb avem urmatoarele tipuri de judete:
judete cu o rata a somajului mica si cu un nivel de trai sub medie:Braila, Calarasi, CarasSeverin,Satu Mare, Salaj, Tulcea.
judete cu un nivel de trai ridicat si cu o rata a somajului mica: Ilfov, Arges, Timis, Bihor,
Mures, Arad, Cluj.
judete cu un nivel ridicat de trai si cu rata a somajului mare: Dolj, Hunedoara, Galati,
Prahova, Iasi, Valcea.
judete cu un nivel de trai sub medie si cu o rata a somajului mare:Olt,Bistrita-Nasaud,
Harghita, Covasna, Alba, Teleorman, Neamt.
Celelalte judete neprecizate au un nivel mediu de trai cu o rata a somajului medie.

Fig

20

Cam acelasi lucru se intampla cu judetele din punctul de vedere a nivelului de trai in comparatie
cu durata medie de viata. Se observa ca multe judete care au un nivel de trai peste medie au o
durata medie de viata ridicata . Printre acestea se numara:Bihor,Dolj,Maramures,Galati. De
asemenea se remarca Bucurestiul cu un nivel de trai ridicat si o durata medie de viata peste
medie.
Vrancea,Buzau,Giugiu,Botosani sunt judetele cu un nivel de trai scazut si o durata medie de viata
sub medie.Din grafic se remarca Timis , care avand un nivel ridicat de trai are totusi o durata
medie de viata mica.

21

Fig
13:

Din punctul de vedere a duratei medie de viata in comparatie cu rata somajului ,logic ar fi ca
judetele care au o rata a somajului mare sa detina o durata medie de viata mica.
In schimb conform graficului mai sus, sunt judete care desi au o rata a somajului mare , durata
medie de viata este tot mare , cum este cazul judetului Mehedinti, judetului Covasna, ai a judetlui
Alba.Dar exista si urmatoarele tipri de judete
judete cu o durata medie de viata mica , si o rata a somajului mica precum:Jud Timis,
Jud Arad.
judete cu durata medie de viata sub medie si o rata a somajului mare: jud Valcea ,
Suceava Gorj.
judete cu o durata medie de viata mare si o rata a somajului mica:Satu Mare, Calarasi.

22

Fig

In figura de mai sus se incearca o reprezentare tridimensionala a judetelor. Judetele reprezentate


cu rosu au un grad ridicat a nivelului de trai, iar cele reprezenttae cu albastru sunt judetele care au
un nivel de trai scazut.Se observa ca jud Ilfov desi are o rata a somajului foarte mica are o durata
medie de viata scazuta , cu un nivel de trai scazut.
Judetele precum Cluj, Timis au un nivel de trai ridicat, dar o durata medie de viata mica cu o rata
a somajului mica.
Putem remarca ca se formeaza grupuri de judete precum Dolj, Ialomita, Caras-Severin,
Teleorman,Galati,Salaj, care au o rata a somajului mare , dar o durata medie de viata ridicata cu
un nivel de trai scazut.
In concluzie , analiza componentelor principale ne-a permis sa analizam cele 42 de judete ale
Romaniei si sa realizam sintetizarea informationala prin 3 caracteristici in loc de 10. Astfel, am
putut fcae comparatii intre observatii.

23

S-ar putea să vă placă și