Sunteți pe pagina 1din 5

Descrierea datelor

- ”Rep_Country” reprezintă țara de referință, locul unde s-au produs nașterile.


Totodata, mamele au cetățenia în concordanță cu țara respecitvă.
- ”For_Country” reprezintă numărul mamelor care au născut pe teritoriul țării
de referință, dar nu au cetațenia respectivă. Aceasta se va împarții în două
categorii: EU28 si NonEU28.
- ”EU28” reprezintă orice altă țară ce se află în Uniunea Europeană, cu
excepția țării de referință.
- ”NonEU28” reprezintă orice altă țară care nu se află în Uniunea Europeană,
cu excepția țării de referință.

Fig. 1 Summary

In urma analizei prin comanda summary, deducem cateva observatii:


Media numarului de copii nascuti in Romania de catre mame cu cetatenie
romana este de 5451, in timp ce media numarului de copii nascuti in
Germania, de catre mame cu catatenie germana este de 15290, o natalitate de
aproape 3 ori mai mare in comparatie cu tara noastra.
Media numarului de copii nascuti in Romania de catre mame cu alte cetatenii
este de 143.8 , in timp ce media numarului de copii nascuti in Germania, de
catre mame cu alte catatenii este de 6431.8, de unde deducem faptul ca
numarul famililor imigrante in Germania este mult mai mare decat in
Romania

Fig. 2 Describe

Fig. 2 Describe

Folosind functia describe putem vizualiza abaterea standard (sd),


amplitudinea (range), mediana (median) etc.
Coeficientul de asimetrie( Skewness) se caracterizeaza prin gradul de
asimetrie a unei repartitii, si alaturi de coeficientul de aplatizare (Kurtosis),
indica forma repartitiei (prezentata sub forma unei histograme).

Din figura de mai sus, se poate deduce ca valoarea coeficientului de asimetrie


pozitiv, atat pentru Romania cat si pentru Germania, ceea ce inseamna o
usoara inclinatie a distributiei spre stanga, avand mai multe valori extreme
spre dreapta. Coeficientul de aplatizare are valori negative, astfel putem
spune ca setul de date are o forma platicurtica, care ne face sa credem ca ar
putea exista outlier, dar asta vom observa clar in boxplot si totodata că media
nu este reprezentativă.

Fig. 3 Distributia nasterilor

In figura 3 putem observa evolutia nasterilor in Romania si in Germania. In


Romania trendul este unul crescator, maximul numarului de nasteri fiind atins
in intervalul varstei de 28 – 30 ani, fiind inregistrate peste 10 000 de nasteri,
dupa care urmeaza un trend descrescator.
In Germania exista totodata un trend crescator, dar maximul este atins in
intervalul varstei de 30- 32 ani, fiind inregistrate peste 40 000 de nasteri,
dupa care urmeaza un trend descrescator.
Fig. 4 Histograme

Histogramele nasterilor in Romania prezinta distributii inclinate catre stanga,


cu valori extreme in partea dreapta, fapt dovedit si de coeficientul de
asimetrie (Skewness > 0). Totodata distributia este platicurtica ( Kurtosis <
3).

Fig. 5 Boxplot

Diagrama Boxplot ofera informatii privind forma distributiei. De


asemenea, un Boxplot se rezuma la cinci aspecte: valoarea minima, valoarea
maxima, prima quartile, mediana si a 3a quartile. Totodata, exista si valori
outside the box, denumite outlier.
Boxplot-urile de mai sus sustin rezultatele obtinute anterior despre
coeficientul de aplatizare pentru indicatorii de analizati. Se observa faptul ca
nu avem outlieri.

S-ar putea să vă placă și