Sunteți pe pagina 1din 8

Seminar 5 - Analiza unei serii univariate - continuare

I. Variabile cantitative

1. Pentru 10 convorbiri telefonice s-au inregistrat duratele (in minute):


3,6; 4,8; 5,2; 8,3; 8,5; 9,1; 2,5; 1,6; 9,7; 5,8.

a. Sa se determine durata medie a unei convorbiri telefonice;


b. Sa se determine si sa se interpreteze mediana si modul;
c. Media este reprezentativa?

a. Pentru ca este vorba de durata medie, calculam media simpla


3,6+4,8+ 5,2+ 8,3+8,5+9,1+2,5+1,6+ 9,7+5,8 59.1
x́ = = =5,91
10 10
Intrepretare :Durata medie a unei convorbiri este de 5,91 ~ 6 minute.

b. Avem serie simpla, deci primul pas in calcularea medianei este ordanarea seriei crescator.
1,6; 2,5; 3,6; 4,8; 5,2; 5,8; 8,3; 8,5; 9,1; 9,7.
Dupa ordonarea seriei trebuie sa avem in vedere daca seria este cu nr. par de termeni sau
impar. Fiind serie para mediana va fi media valorilor din mijloc, adica 5,2 si 5,8.
5.2+ 5.8 11
Me= 2
= 2 =5,5

Interpretare: Jumatate dintre convorbiri au o durata de pana la 5,5 minute, iar jumatate
peste 5,5 minute.
Pentru ca nu avem o valoare care sa se repete de cel putin 2 ori, nu exista mod.

c. Pentru a sti daca media este reprezentativa trebuie sa calculam coeficientul de variatie
S
(v), ( v = * 100).

Insa pana a putea calcula coeficientul de variatie trebuie sa calculam varianta (s 2) si
abaterea standard (s).

∑( x i− x́) 2
S2= =
n
(1.6−5.91)2 +(2.5−5.91)2+(3.6−5.91)2 (4.8−5.91)2 (5.2−5.91)2 (5.8−5.91)2 ( 8.3−5.91)2( 8.5−5.91)2 (9.1
10
18.57+11.62+5.33+1.23+0.50+ 0.01+ 5.71+ 6.70+10.17+14.36 74.2
= = =7.42 ( nu se
10 10
interpreteaza!!!)

S=√ s 2 =√ 7.42=2.72.
Interpretare: Durata convorbirilor variaza in medie fata de nivelul mediu cu
± 2,72minute . (2,72 minute nu inseamna 3 minute si 12 secunde!!, daca ar fi sa
transformam corect inmultim 0.72 cu 60 secunde si vom obtine 43 secunde. Prin urmare
durata convorbirilor dupa transformare in minute si secunde ar varia cu ± 2minute si 43
secunde).
S 2.72
v= * 100 = * 100 = 46.02 < 50%=> distributia este omogena, iar media
x́ 5.91
reprezentativa.

2. Repartiţia salariaţilor unei întreprinderi după prima obţinută la sfârşitul anului este
prezentată în tabelul următor:
Prima (lei) Nr. salariati
50-100 5
100-150 25
150-200 17
200-250 10
250-300 12
300-350 9
350-400 7
Total 85

a. Determinati si interpretati Q1, Q2, Q3;

Prima (lei) Nr. salariati x’ Ni↓


(xi-1-xi) (ni)
50-100 5 75 5
100-150 25 125 30
150-200 17 175 47
200-250 10 225 57
250-300 12 275 69
300-350 9 325 78
350-400 7 375 85
Total 85
n+1 85+1 86
UQ1= = = =21.5 => cautam Ni↓ ≥ decat UQ1
4 4 4
 Q1= 100-150 -> Interpretare: 25% dintre salariati au obtinut o prima de pana la
100-150 lei, iar 75% peste 100-150 lei.
n+1 85+1 86
UQ2= = = =43 => cautam Ni↓ ≥ decat UQ2
2 2 2
 Q2=150-200 -> Interpretare: Jumatate dintre salariati au primit o prima de pana la
150-200 lei, iar jumatate peste 150-200 lei.

!Q2=Me

3(n+1) 3(85+1) 258


UQ3= = = =64.5=> cautam Ni↓ ≥ decat UQ3
4 4 4
 Q3= 250-300 -> Interpretare: 75% dintre salariati au obtinut o prima de pana la
250-300 lei, iar 25% peste 250-300 lei.

b. Determinati si interpretati D1 si D9;

n+1 86
UD1= = =8.6 => ca si in cazul quartilelor cautam Ni↓ ≥ decat UD1
10 10
 D1= 50-100 => Interpretare: 10% dintre salariati au primit o prima de pana la 50-
100 lei, iar 90% peste 50-100 lei.

9(n+1) 774
UD9= = =77.4 => ca si in cazul quartilelor cautam Ni↓ ≥ decat UD9
10 10
 D9= 300-350 => Interpretare: 90% dintre salariati au primit o prima de pana la
300-350 lei, iar 10% peste 300-350 lei.

c. Cu cat se abate in medie de la nivelul mediu prima in lei?


Pentru a vedea cu cat se abate prima in lei trebuie sa calculam abaterea standard (s).
Pentru a putea incepe calculele trebuie sa calculam media .

75∗5+125∗25+175∗17+225∗10+275∗12+ 325∗9+ 375∗7 17575


Asadar: x́ = = 85
85
=206.76

Prima (lei) ( Nr. salariati(ni ¿ Ni ↓ ∑( x i−x ̅ )2 ∑( x i−x ̅ )2∗ni


xi ¿ ¿
50-100 5 5 (75-206.76)2=17360.69 17360.69*5=86803.45
100-150 25 30 (125-206.76)2=6684.69 6684.69*25=167117.25
150-200 17 47 (175-206.76)2=1008.69 1008.69*17=17147.73
200-250 10 57 (225-206.76)2=332.69 332.69*10=3326.9
250-300 12 69 (275-206.76)2=4656.69 4656.69*12=55880.28
300-350 9 78 (325-206.76)2=13980.69 13980.69*9=125826.21
350-400 7 85 (375-206.76)2=28304.69 28304.69*7198132.83
Total 85 Total = 654234.65

Stim ca formula pentru abaterea standard atunci cand avem serie cu frecvente diferite
este:
2
∑ ( x i−x́ ) ∗ni 654234.65
S=
√ ∑ ni
=
85√ =√ 7696.87=87.73

Interpretare: Prima obtinuta se abate in medie de la nivelul mediu cu ± 87.73lei .

d. Distributia este eterogena?


Pentru a vedea daca distributia este eterogena trebuie sa calculam coeficientul de variatie.
S 87.73
v= * 100= *100 = 42.43 <50% => distributia este omogena, deoarece
x́ 206.76
coeficientul este mai mic de 50%.

e. Realizati box- plotul si caracterizati distributia.

D1 Q1 Q2 Q3 D9

50- 100- 150- 200- 250- 300- 350-


100 150 200 250 300 350 400

Distributia este asimetrica la stanga.

3. Indicatorii statisticii descriptive cu privire la distrbuția unui eșantion de județe din


România, în funcție de suprafață (km2) sunt prezentați în tabelul de mai jos:

Suprafaţa totală [km2]


Mean 5808,61
Median 5602,00
Mode 1583
Std. Deviation 1529,527
Variance 2339451,494
Skewness -1,200
Kurtosis 1,347
Range 7114
Minimum 1583
Maximum 8697
Sum 238153
Percentiles 25 4811,50
50 5602,00
75 6770,00

Pe baza informațiilor din tabelul de mai sus, să se interpreteze:

a. indicatorii tendintei centrale (media, mediana si modul);


Mean =Media = x́= 5808,61- Interpretare: in medie judetele din esantion au o suprafata de
5808,61 km2.
Median= Mediana = Me = 5602,00 – Interpretare: Jumatate din judetele din esantion au o
suprafata de pana la 5602,00 km2, iar jumatate au peste 5602,00 km2.
Mode = Mod = 1583 – Interpretare: Cele mai multe judete au o suprafata de 1583 km2.

b. indicatorii dispersiei (varianta, abaterea standard, coeficientul de variatie, intervalul


interquartilic);
Variance = Varianta = S 2 = 2339451,494 – Interpretare: Nu se interpreteaza!!!!
Std. Deviation = Abaterea standard = S = 1529,527- Interpretare: Suprafata judetelor se
abate in medie fata de nivelul mediu cu ± 1529.527 km2.
Coeficientul de variatie = v = nu se regaseste in tabel insa il putem calcula pentru ca
avem tot ceea ce ne trebuie, respectiv abaterea standard si media.
S 1529.527
v= * 100= *100 = 26.33 <50% -> Distributia este omogena, iar media
x́ 5808.61
reprezentativa.

c. indicatorii formei (Skewness-pt asimetrie, Kurtosis-pt boltire).


Dupa cum stiti forma unei distributii poate fi identificata atat prin intermediul graficelor, cat
si prin intermediul unor indicatori. Asadar:
- pentru asimetrie avem coeficientul Skewness = -1,200(din tabel) (intrucat SK < 0 =>
distributia noastra este asimetrica la stanga, daca SK > 0- distributia este asimetrica la
dreapta, iar daca Sk= 0 – distributia este simetrica);
- pentru boltire avem coefiecientul de boltire Kurtosis = 1.347 (K>0 -> distributia este
leptocurtica, daca k<0 – distributia este platicurtica, iar k=0 -> distributia este
mezocurtica).
!!!! In tabel, la final, mai aveti Percentiles 25, 50, 75, aceste percentile sunt, de fapt, quartila 1,
quartila 2, si quartila 3.
I. Variabile calitative

În cazul unei distribuții după o variabilă categorială ordinală, mărimile medii care pot fi
calculate sunt modul și mediana, iar pentru o variabila categoriala nominala singura marime
medie care poate fi calculata este modul.

1. Distributia salariatilor unei firme dupa nivelul de studii (primar, gimnazial, liceal,
universitar, postuniversitar) este prezentata in tabelul de mai jos:

Nivel studii (xi) Nr. Ni Ni fi Fi Fi


persoane(ni)
Primar 7 7 101 6.93 6.93 100
Gimnazial 19 26 94 18.81 25.74 93.07
Liceal 25 51 75 24.75 50.49 74.26
Universitar 38 89 50 37.62 88.11 49.51
Postuniversitar 12 101 12 11.88 100 11.88
Total 101

Se cere:
a. sa se calculeze modul si mediana;
M0= Universitar - > Cele mai multe persoane au studii universitare.
n+1 101+1 102
UMe= = = =51 => cautam Ni↓ ≥ decat UMe
2 2 2
Me= Liceal-> Jumatate dintre persoane au cel mult studii liceale, iar jumatate au cel
putin studii liceale.

b. să se calculeze și să se interpreteze frecvențele absolute si relative, simple si


cumulate.
n1= 7 - > 7 persoane au studii primare.
Ni = 26 -> 26 de persoane au cel mult studii gimnaziale.
Ni = 94 -> 94 de persoane au cel putin studii gimnaziale.
fi = 24.75 -> 24.75% dintre persoane au studii liceale.
Fi = 88.11 -> 88.11% dintre persoane au cel mult sutii universitare.
Fi = 77.26 - > 74.26 % dintre persoane au cel putin studii liceale.

Reprezentarea grafica a unei variabile nominale se realizeaza folosind diagrame prin bare (bar
chart) sau cercul de structura (pie chart).

S-ar putea să vă placă și