Sunteți pe pagina 1din 9

Aplicatii Statistica Sociala

I. In cadrul unei gospodarii formata din 7 membri se inregistreaza urmatoarele venituri nete, exprimate in lei:
250, 200, 750, 1004, 1520, 1800, 2300.
Sa se calculeze:
1) Venitul mediu net pe membru de familie;
2) Mediana.

1) X= (250, 200, 750, 1004, 1520, 1800, 2300)

• Observam ca avem distributii simple: f1=f2=f3=….fi=7, deci formula de calcul pentru medie (M sau X barat)
este:
M (X barat)= ∑xi /fi

Unde:
M (X barat) = media
∑= suma
xi= caracteristica, variabila
fi= frecventa relativa, nr. observatiilor

X barat = (250+200+750+1004+1520+1800+2300) / 7= 1117, 71 lei

Interpretare: Venitul mediu net pe membru de familie este de 1117,71 lei.

2) Pentru calcularea medianei (Me), in cazul distributiilor simple:


• mai intai ordonam termenii in sens crescator sau descrescator:
200,250,750,1004,1520,1800,2300
• apoi, suntem atenti sa vedem daca avem nr. par sau impar de termeni:
La noi este numar impar de termeni (7). In acest caz, Me este valoarea termenului din mijlocul seriei: 1004.
Interpretare: Jumatate dintre membrii familiei au un venit mai mare de 1004 lei, iar jumatate dintre ei au mai putin
de 1004 lei.

II. In urma unui sondaj de opinie desfasurat intr-o localitate rurala, satenii chestionati au acordat urmatoarele
punctaje pentru implicarea comunitatii in ecologizarea spatiilor publice: 7, 5, 7, 8, 4, 9, 8, 10, 5 3, 8, 10, 8,
7, 9, 6, 4, 7, 6, 1, 8, 6, 8, 7, 5, 7, 4, 7, 1, 9, 5, 8, 6, 7, 7.
Care este punctajul mediu obtinut in urma acestui sondaj?

Rezolvare:
• Observam ca in total sunt 35 de date strânse, de la cele 35 de persoane chestionate, deci N= 35.
• Pentru a organiza datele, utilizând o distributie simpla a frecventei, sunt necesari urmatorii pasi:
1. Transcriem seria:
X = (7, 5, 7, 8, 4, 9, 8, 10, 5 3, 8, 10, 8, 7, 9, 6, 4, 7, 6, 1, 8, 6, 8, 7, 5, 7, 4, 7, 1, 9, 5, 8, 6, 7, 7)
2. Se cauta valorile extreme din sirul de date (valoarea cea mai mare: 10; si cea mai mica: 1);
3. Se scriu toate valorile cuprinse între cele doua extreme într-o ordine descendenta pe o coloana;
4. Se numara de câte ori apare fiecare valoare în sirul de date;
5. Se trece apoi în tabel, frecventa de aparitie a fiecarui numar.
În cazul de fata vom avea:
Caracteristica frecventa f*x
Xi fi
1 2 2
2 0 0
3 1 3
4 3 12
5 4 20
6 4 24
7 9 63
8 7 56
9 3 27
10 2 20
∑f=35 ∑f*x=227

• Observam ca f1#f2#f3#......#fi, deci formula de calcul pentru medie va fi:

• In tabel mai adaugam o rubrica si calculam produsul f*x, pentru a obtine ∑f*x
• Atunci, media:
M (X barat) = 227 / 35 = 6,48 pct.

Interpretare: Punctajul mediu acordat gradului de implicare a comunitatii in ecologizarea spatiului public de catre
satenii chestionati din localiatea rurala “…” este de 6,48 puncte.

III. Intr-un bloc se inregistreaza urmatoarea distributie a familiilor dupa numarul de copii pe care ii are fiecare
familie: 6 familii nu au copii; 18 familii au un singur copil; 23 familii au 2 copii; 20 familii au 3 copii; 14
familii au 4 copii; 6 familii au 5 copii; 2 familii au 6 copii si o familie are 7 copii.

1) Sa se determine nr. mediu de copii pe familie, pentru blocul respectiv.


2) Sa se calculeze dominanta (Do) si mediana (Me).

Rezolvare:
1) Observam ca avem o distributie ponderata (cu frecvente), pe variante, unde variabila (X) este reprezentata de
numarul de copii;
• Construim tabelul si se scriu toate valorile lui X, de la valoarea cea mai mica aparuta in enuntul problemei
(0 copii), pana la valoarea cea mai mare (7 copii), dupa care se trec si frecventele aparitiei fiecarei valori
in parte;
În cazul de fata vom avea:

Caracteristica frecventa f*x Fi


Xi fi
0 6 0 6
1 18 18 24
2 23 46 47
3 20 60 67
4 14 56 81
5 6 30 87
6 2 12 89
7 1 7 90
∑f=90 ∑f*x=229

In acest caz, vom calcula media (X barat) utilizand formula:

= 229 / 50 = 2,54

Interpretare: Nr. mediu de copii pe familie in acel bloc este de 2,54.

2) Pentru a afla valoarea dominantei (Do) sau modului (Mo):


• Fiindca avem distributie ponderata (cu frecvente), pe variante, identificam in tabel frecventa maxima a
caracteristicii (f max=23)
• Apoi, pe aceeasi linie cu ea, vom gasi in coloana din stanga valoarea dominantei - Do (acea valoare a
caracteristicii corespunzatoare frecventei maxime): Do=2.
Interpretare: Cele mai multe familii (majoritatea familiilor) din acel bloc au cate 2 copii.

3) Pentru a afla valoarea medianei (Me):

• Fiindca avem distributie ponderata (cu frecvente), mai intai trebuie sa calculam Unitatea mediana (U Me):

U Me= ∑fi / 2 = 90 / 2 = 45
• Stiind ca Me este acea valoare a caracteristicii (X) pentru care este indeplinita conditia:

Fi≥UMe, avem nevoie sa calculam frecventa relativa cumulata (Fi)

Fi=Fi-1+fi
Unde:
Fi-1=frecventa relativa cumulata inferioara

• Conform conditiei de mai sus (Fi≥UMe) si stiind ca la noi UMe=45, ne ducem in tabel si din coloana lui Fi
alegem valoarea mai mare sau egala cu 45, aceasta fiind 47.
• Apoi, mergand pe aceeasi linie cu aceasta valoare a lui Fi, vom gasi in coloana caracteristicii (X) valoarea
medianei (Me), in cazul nostru Me=2.

Interpretare: Jumatate dintre familiile care locuiesc in blocul respectiv au mai mult de 2 copii, iar jumatate dintre
ele au mai putin de 2 copii.

IV. Distributia, dupa timpul de deplasare spre o anumita locatie a unui esantion de 200 de persoane, este
urmatoarea: 25 pers. ajung in maxim 30 minute; 50 pers. intre 30 minute si o ora; 60 pers. intre o ora si o
ora jumatate, 45 persoane intre o ora jumatate si 2 ore; 15 persoane intre 2 ore si 2 ore jumatate si 5 pers.
intre 2,5 ore si 3 ore.
Sa se calculeze:
a) Media
b) Dominanta
c) Mediana
d) Sa

Rezolvare:
a) Observam ca avem o distributie ponderata (cu frecvente), pe intervale, unde caracteristica/variabila (X) este
reprezentata de intervalul de timp, iar noi alegem ca unitate de masura minutele, deci vom transforma orele in
minute, pentru a transcribe intervalele;
• Construim tabelul si se scriu toate valorile lui X, pe intervalele de timp corespunzatoare datelor din
problema, dupa care se trec si frecventele (fi) aparitiei fiecarui interval in parte;
În cazul de fata vom avea:
Caracteristica frecventa x’i x’i*fi
xi-1, xi fi
0-30 25 15 375
30-60 50 45 225
60-90 60 75 450
90-120 45 105 4725
120-150 15 135 2025
150-180 5 165 825
∑fi=200 ∑x’i*fi=8625

• Deoarece avem o distributie cu frecvente, pe intervale, pentru a calcula media (X barat) vom folosi
formula:

X barat= ∑x’i*fi / ∑fi

• Observam ca avem nevoie sa calculam mijlocul intervalului (x’i):

x’i= xi-1+xi / 2

Unde: Xi-1= limita inferioara a intervalului

Xi= limita superioara a intervalului

La noi: x’1=0+30/2=15

x’2=30+60/2=45 s.a.m.d.

• Pentru a ne usura munca, trecem in tabel X’i, apoi produsul dintre frecventele relative si mijloacele
intervalelor, pentru a putea calcula suma lor (∑x’i*fi).

• Acum avem toate datele necesare calcularii mediei:

X barat= ∑x’i*fi / ∑fi

=8625/200=43,12 minute

Interpretare: Timpul mediu de deplasare a persoanelor respective spre locatie este de 43,12 minute.

b) Pentru calcularea dominantei (Do) sau modului (Mo), in cazul distributiilor cu frecvente, pe intervale, mai
intai identificam intervalul modal, care corespunde frecventei maxime (fi):

Caracteristica frecventa Frecv.


cumulata
xi-1, xi fi
Fi
0-30 25 25
30-60 50 (fi-1) 75 (Fi-1)
60-90 60(fimax) 135
90-120 45 (fi+1) 180
120-150 15 195
150-180 5 200

La noi, f max=60, deci intervalul modal este 60-90. Formula de calcul pt. Do va fi:

Do= xi-1+d(Δ1/ Δ1+ Δ2)

Unde:

xi-1= limita inferioara a intervalului modal (la noi: xi-1= 60)

d=marimea intervalului modal si

d= xi-xi-1

= 90-60=30

Δ1= fi max-fi-1

=60-50=10

Δ2= fi max-fi+1

=60-45=15

Do= xi-1+[d(Δ1/ Δ1+ Δ2)]

=60+[30(10/(10+15)]=60+(30*0,4)=60+12=72 minute

Conditie: valoarea lui Do trebuie sa fie cuprinsa intre limitele intervalului modal.

La noi: 72∈[60,90]

Interpretare: Majoritatea persoanelor (cele mai multe dintre ele) se deplaseaza spre locatia respectiva in 72 minute
( 1h si 12 minute).

c) Pentru calcularea medianei (Me) (a se vedea tabelul de la punctul b)

• Fiindca avem distributii cu frecvente, pe intervale, formula de calcul a medianei este:

Me= xi-1+d[(UMe-Fi-1)/fi]

• Identificam intervalul median, corespunzator frecventei relative maxime (fi max)


La noi, f max=60, deci intervalul median este 60-90 (din tabelul de la punctul b)

iar UMe=∑fi/2; unde Fi≥UMe, deci avem nevoie sa calculam frecventa relativa cumulata (Fi) in tabel (a se
vedea tabelul de la punctul b):

Fi=Fi-1+fi
Unde:
Fi-1=frecventa relativa cumulata inferioara
• Cum la noi UMe=200/2=100, din coloana frecventelor relative cumulate, pentru Fi≥UMe identificam
valoarea Fi=135

• Acum, putem calcula mediana

Me= xi-1+d[(UMe-Fi-1)/fi]

xi-1=limita inferioara a intervalului median, la noi: xi-1=60

d=marimea intervalului median; la noi: d=x-xi-1=90-60=30

Fi-1= frecventa relativa cumulata inferioara; la noi: Fi-1=75


fi=60

Me=60+30[(100-75)/60]=60+(30*0,41)=60+12,3=72,3 ≈72 minute (1h si 12 minute)


Conditie: valoarea Me trebuie sa fie cuprinsa intre limitele intervalului median.

La noi: 72∈[60,90]

Interpretare: Jumatate dintre persoane (cele mai multe dintre ele) se deplaseaza spre locatia respectiva in mai mult de
72 minute, iar jumatate dintre ele in mai putin de 72 minute.

V. Calculati cate zile au absentat in medie studentii unui an de studii:

Caracteristica frecventa x’i x’i*fi


xi-1, xi fi
1-5 25 3 75
6-10 30 8 240
11-15 30 13 390
16-20 20 18 260
21-25 10 23 230
26-30 5 28 140
31- 35 4 33 132

∑fi=124 ∑x’i*fi=1467

• Observam ca avem distributii cu frecvente, pe intervale, in acest caz formula de calculare a mediei M
(X barat) fiind:
M (X barat)= ∑x’i*fi / ∑fi

• Calculam mijloacele intervalelor (x’i): x’i= xi-1+xi / 2 si trecem rezultatele direct in rubrica din tabel,
pentru a putea calcula suma mijloacelor intervalelor (∑x’i*fi)

La noi: M (X barat)= 1467/124=11,83≈12 zile


Interpretare: Studentii respectivi au absentat in medie 12 zile.

VI. Calculati dispersia unei populatii pornind de la un sir de date provenite de la un esantion si coeficientul de
variatie (v).

X= (13,11,15,12,11)

Caracteristica x patrat
Xi
13 169
11 121
15 225
12 144
11 121
∑xi=62 ∑x patrat = 780

1) Calculam si media, deoarece stim ca Dispersia reprezinta gradul de imprastiere, de variatie, a


elementelor individuale in jurul valorii medii M:

M (X barat)= ∑xi / n= 62/5=12,4


• Stiind ca Dispersia, e notata cu:

σ patrat (σ = sigma) – pentru dispersia populatiei;


s patrat – pentru dispersia esantionului

Pentru a calcula dispersia unei populatii pornind de la un sir de date provenite de la un esantion folosim formula
comuna:

σ patrat = s patrat =[∑x patrat – (∑x) patrat /n] / n-1


n= volumul esantionului (cand esantionul n<30, folosim n-1; cand n≥30, folosim n)

/ = semnul impartirii

In cazul nostru, n= 5, deci:

σ patrat = (780 – 3844 /5) / 4= [ (3900-3844)/5 ] / 4= (56/5) / 4= 11,2 / 4= 2,8


Interpretare: Populatia noastra prezinta o abatere de variatie (grad de imprastiere) de 2,8 in jurul valorii medii de
12,4.

2) Calculam coeficientul de variatie (v), stiind ca el este un test al reprezentativitatii mediei, utilizand formula:

v = (σ / x barat)*
100
In conditiile in care:

• Cand v<17% : colectivitatea este omogena si media aritmetica M (x barat) este strict
reprezentativa;
• Cand 17 < v <35-40%: media aritmetica M (x barat) este moderat reprezentativa;

• Cand v >40%: colectivitatea este eterogena si media aritmetica M (x barat) nu mai este
reprezentativa.

La noi: v = (σ / x barat)* 100 = (1,67 / 12,4)*100 =0,13*100 = 13,46

• Observam ca v =13,46; v<17%, deci: colectivitatea este omogena si media aritmetica M (x barat)
este strict reprezentativa;

VII. Estimati abaterea standard (σ ) a unei populatii pornind de la un sir de date provenite de la un
esantion.

X= (13,11,15,12,11,12)

Abaterea standard se noteaza cu:


• σ − abaterea standard a unei populatii;

• s – abaterea standard a unui esantion

Fiindca noi trebuie sa calculam abaterea standard pornind de la un sir de date provenite de la un esantion,
vom folosi formula:

σ = s = radical din [∑x patrat – (∑x) patrat /n] / n-


1
• Deci, daca stiu valoarea dispersiei, voi extrage radicalul din acea valoare pentru a afla valoarea abaterii
standard:
σ = radical din 2,8 = 1,67

VIII. Plecand de la datele din tabel, sa se calculeze:


1) abaterea medie liniara
2) abaterea standard
3) dispersia
4) coeficientul de variatie

Caracteristica frecventa x’i x’i*fi xi-M |xi-M | |xi-M |*fi (xi-M) patrat (xi-M) patrat *
fi
xi-1, xi fi
1-5 25 3 75 -6,83 6,83 170,75 46,64 1166,22
6-10 30 8 240 -1,83 1,83 54,9 3,34 100,46
11-15 30 13 390 3,17 3,17 95,1 10,04 301,46
16-20 20 18 260 8,17 8,17 163,4 66,74 1334,97
21-25 10 23 230 13,17 13,17 131,7 173,44 1734,48
26-30 5 28 140 18,17 18,17 90,85 330,14 1650,74
31- 35 4 33 132 23,17 23,17 92,68 536,84 2147,39

∑fi=124 799,38 8435,72

1) Abaterea medie liniara (d barat), pt. distributiile cu frecvente pe interval, se calculeaza cu formula:

d barat = [∑|xi – x barat|*fi ] /


∑ fi

| |= modul din …

• Trebuie sa calculam media M ( x barat):


M (X barat)= ∑x’i*fi / ∑fi = 1467/124 = 11,83 zile

• Apoi, calculam pe rand toti termenii din formula de calcul pt. d barat
x1-M= 5-11,83= - 6,83; deci |x1 – x barat|= |-6,83|= 6,83
x2-M=……s.a.m.d.
• Apoi: d barat = [∑|xi – x barat|*fi ] / ∑ fi = 799,38/124=6,44

2) Pentru a calcula abaterea standard avem formula:

σ = radical din [∑(xi – x barat) la patrat


* fi ] / ∑ fi

σ = radical din 8435,72/ 124 = radical din 68,03 = 8,24

3) Pentru calcularea gradului de dispersie (variatie) folosim formula:

σ patrat = [∑(xi – x barat) la patrat


* fi ] / ∑ fi

La noi: σ patrat = 8435,72/ 124 = 68,03


4) Pentru calcularea coeficientului de variatie (v):

v = (σ / x barat)*
100

La noi v = (8,24/ 11,83)*100 = 0,69*100= 69,65


Observam ca v > 40%, deci: colectivitatea este eterogena si media aritmetica M (x barat) nu mai este
reprezentativa.