Documente Academic
Documente Profesional
Documente Cultură
---------------------------------------------------------------------
1) Se consideră distribuţia firmelor dintr-o localitate după numărul de
salariaţi înregistraţi în luna ianuarie 2018. Variabila statistica, în acest
caz, este reprezentată de
a) ansamblul firmelor
b) o firmă
c) numărul de salariaţi
---------------------------------------------------------------------
2) Care din următoarele variabile sunt variabile numerice (cantitative)?
a) talia, greutatea, salariul
b) sexul persoanelor, starea civilă, domiciliul
c) nivelul de studii absolvite
---------------------------------------------------------------------
3) Sunt discrete următoarele variabile:
a) sexul persoanelor, starea civilă, domiciliul
b) numărul de membri ai unei gospodării, numărul de angajaţi ai unei
firme
c) salariul lunar, venitul gospodăriilor, PIB/locuitor
---------------------------------------------------------------------
4) Pentru un eşantion de angajaţi repartizaţi după variabila salariul anual ($)
s-au obţinut rezultatele din tabelul de mai jos.
Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00
Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,419.57
Std. Error of Mean
$784.311
Median $28,875.00
Mode $30,750
Std. Deviation
$17,075.661
Variance 291578214,453
Skewness 2,125
Std. Error of Skewness
,112
Kurtosis 5,378
Std. Error of Kurtosis
,224
Range $119,250
Minimum $15,750
Maximum $135,000
Sum $16,314,875
Percentiles 25 $24,000.00
50 $28,875.00
75 $37,162.50
judetul_B
judetul_A
4 6 8 10 12 14 16 18 20 22
TOTAL 210
Numărul studenţilor care au obţinut cel mult nota 8 la examen este:
a) 130 studenţi
b) 190 studenţi
c) 80 studenţi
5 25 25/210*10 83,33+11,
0=11,91 91=95,24
6 40 40/210*10 64,28+19,
0=19,05 05=83,33
7 55 55/210*10 38,09+26,
0=26,19 19=64,28
8 60 60/210*10 9,52+28,5
0=28,57 7=38,09
9 15 15/210*10 2,38+7,14
0=7,14 =9,52
10 5 5/210*100 2,38
=2,38
TOTAL 210 100
Ponderea studenţilor care au obţinut peste nota 7 la examen este
a) 64,28%
b) 28,57%
c) 38,09%
afirmaţiile:
a) distribuţia este asimetrică la dreapta(Mo<Me<x)
b) media distribuţiei este reprezentativă(v=s/x=3/17*100=17.64<50%)
10) Distribuţiile studenţilor din două serii (seria 1 şi seria 2) după nota obţinută
la un examen în sesiunea ianuarie 2012 se prezintă astfel:
NOTA_1
NOTA_2
3 4 5 6 7 8 9 10 11
b) 75% din numărul total al studenţilor din a doua serie au obţinut o notă de
până la 8
c) distribuţia studenţilor din prima serie se caracterizează printr-o dispersie
mai mare
d) 50% din studenţii din prima serie au luat note între 5 şi 9.
Mean 23.57
Standard Error 0.45
Median 23.00
Mode 22.00
Standard Deviation 2.46
Sample Variance 6.05
Kurtosis(K) -1.06
Skewness(Sk) 0.33
Range 8.00
Minimum 20.00
Maximum 28.00
Sum 707.00
Count 30.00
Current Salary
N Valid 474
Missing 0
Mean $34,000.00
Median $28,000.00
Mode $30,500
Std. Deviation $17,000.000
Percentiles 25 $24,000.00
50 $28,000.00
75 $37,000.00
13. Pentru două judeţe, A şi B, s-a înregistrat rata şomajului (%) în perioada
1990-2011. Rezultatele sunt reprezentate in figura de mai jos.
judetul_B
judetul_A
4 6 8 10 12 14 16 18 20 22
Mediul Salariu
9 12 15 20
Urban 1 5 7 15
Rural 6 4 2 1
Mediul Salariu
8-10 10-12 12-14 14-16
Urban 1 5 7 15
Rural 6 4 2 1
Nr.copii 0 1 2 3 4
Nr. familii 9 7 10 0 4
Rezolvare
Rezolvare
Media este mai mare decat mediana, deci distributia este asimetrica la dreapta.
Rezolvare
D1 = 2.5
10% din studenti au obtinut note de cel mult 2.5, iar restul de 90% au obtinut note de
cel putin 2.5 puncte.
Q1 = 4
25% din studenti au obtinut note de cel mult 4, iar restul de 75% au obtinut note de
cel putin 4 puncte.
Me = 6.5
50% din studenti au obtinut note de cel mult 6.5, iar restul de 50% au obtinut note de
cel putin 6.5 puncte.
Q3 = 7
75% din studenti au obtinut note de cel mult 7, iar restul de 25% au obtinut note de
cel putin 7 puncte.
1
D9 = 8
90% din studenti au obtinut note de cel mult 8, iar restul de 10% au obtinut note de
cel putin 8 puncte.
xi ni fi %
Masculin 70 45
Feminin 85 55
Total 155 100
Sa se interpreteze modul.
Rezolvare
Modul este Feminin (valoarea variabilei cu cea mai mare frecventa de apartiei, 85).
Cele mai multe persoane sunt de sex feminin.
2
Female
Respondent's Sex
Male
75 244
0 5 10 15 20
Rezolvare
Evaluarea asimetriei
Ambele distributii ale nivelului de educatie sunt asimetrice la dreapta.
6. Valoarea cifrei de afaceri (mld. lei) înregistrată de un eşantion de firme se prezintă astfel:
10, 12, 15, 18, 9. Sa se calculeze si sa se interpreteze mediana si coeficientul de variatie.
Mediana
50% din firme au o cifra de afaceri de cel mult 12 mld. lei, iar 50% din firme au cifra
de afaceri de cel putin 12 mld. lei.
Coeficientul de variatie
3
Media aritmetica
64
x 12.8
5
(9 12.8) 2 (10 12.8) 2 (12 12.8) 2 15 12.8 18 12.8
2 2
s =3.31
5
v=(3.31/12.8)*100=25.85%
1, 5, 6, 3, 4, 5, 7, 5, 300
care este cel mai potrivit indicator pentru a caracteriza tendinta centrala?
Rezolvare
Mediana este mai potrivita, deoarece sirul de valori prezinta o valoare atipica si
media aritmetica ar fi influentata de aceasta valoare.
22
20
18
16
14
12
10
4
D1=8 ani
Q1=12 ani
Q2=15 ani
Q3=16 ani
D9=21 ani
xi-1, xi ni
2-4 10
4-6 12
6-8 20
8-10 8
Total 50
Rezolvare
302
x 6.04 puncte
50
10. Se considera distributia studentilor unei serii dupa mediul de rezidenta si numarul
de frati/surori.
Se cere:
1. Sa se precizeze variabila X si variabila Y
2. Sa se determine care din cele doua grupuri este mai omogen
3. Sa se calculeze media totala la nivelul seriei de studenti
4. Sa se calculeze varianta inter-grupe si varianta intra-grupe
5. Sa se calculeze varianta totala la nivelul seriei
5
6. Sa se precizeze cat % din variatia variabilei X este explicata prin factorul de
grupare.
Rezolvare
2. vU=(0.46/1.7)*100=27.05%
vR=(1.55/2.3)*100=67.39%
Coeficientul de variatie este mai mic pentru mediul urban, deci grupul studentilor din
urban este mai omogen decat cel al studentilor din rural.
1.7 * 50 2.3 * 30
3. x 1.92
80
4.
Varianta inter-grupe
(1.7 1.92) 2 * 50 2.3 1.92 * 30
2
sx j
2
0.084
80
Varianta intra-grupe
0.462 * 50 1.552 * 30
s
2
1.03
80
5. Varianta totala
k1=(0.084/1.114)*100=7.54%
6
11. Se considera distributia notelor unei grupe de studenti pe sexe.
Se cere:
1. Cat % din totalul studentilor sunt de sex feminin si au nota 6? Ce tip de
frecventa este aceasta?
(6/62)*100=9.67%
Aceasta este o frecventa relativa partiala.
2. Cat % din totalul studentilor de sex feminin au nota 6? Ce tip de frecventa este
aceasta?
(6/35)*100=17.14%
Aceasta este o frecventa relativa conditionata, de tipul fi|j
3. Cat % din totalul studentilor cu nota 6 sunt de sex feminin? Ce tip de frecventa
este aceasta?
(6/14)*100=42.85%
Aceasta este o frecventa relativa conditionata, de tipul fj|i
4. Cat % din totalul studentilor sunt de sex feminin? Ce tip de frecventa este
aceasta?
(35/62)*100=56.45%
Aceasta este o frecventa relativa marginala, de tipul f.j.
(14/62)*100=22.58%
Aceasta este o frecventa relativa marginala, de tipul fi..
7
12. Se considera distribuţia unui eşantion de 150 de angajaţi ai unei firme A după nr
de ore suplimentare facute zilnic la locul de munca
xi fi (%)
1 13.34
2 53.34
3 24.66
4 8.66
Total 100
Se cere sa se determine:
1. Câţi angajaţi fac zilnic 3 ore suplimentare?
0.2466*150=37 angajati
2. Câţi angajaţi fac cel mult 3 ore suplimentare?
((13.44+53.34+24.66)*150)/100=137 angajati
xi fi (%)
ni (fi*150) xi*ni Ni↓ xi x x i x x x n
2
i
2
i
Media aritmetica
343
x 2.28 ~ 2ore
150
Mediana
UMe=151/2=75.5
Ni=100, deci Me=2 ore
8
50% din angajati fac cel mult 2 ore suplimentare, iar restul de 50% fac cel putin 2 ore
suplimentare.
Modul
ni maxim = 80, deci Mo=2 ore
Coeficientul de variatie
v=(0.802/2.28)*100=35.17%
Q3
UQ3=3*(151/4)=113.25
Ni=137, deci Q3=3 ore
75% din angajati fac cel mult 3 ore suplimentare, iar restul de 25% fac cel putin 3 ore
suplimentare.
D6
UD6=6*(151/10)=90.6
Ni=100, deci D6=2 ore
60% din angajati fac cel mult 2 ore suplimentare, iar restul de 40% fac cel putin 2 ore
suplimentare.
9
Seminar 6 - Distribuții bidimensionale
Distribuția unui eșantion de 750 de firme din Iași după cifra de afaceri, X, și tipul
firmei, Y, (mici, mijlocii și mari) este prezentată în tabelul de mai jos.
Tabelul 6.1. Distribuția firmelor din Iași după cifra de afaceri și tipul firmei
Q: Ce trebuie sa imi arate datele astfel incat eu sa zic ca dimensiunea firmei influenteaza cifra
de afaceri (adica Y este factor de influenta pentru X)?
A: DIFERENTELE DIN INTERIORUL GRUPELOR TREBUIE SA FIE MAI MICI DECAT
DIFERENTELE DINTRE GRUPURI!!!
AM DOI INDICATORI CARE IMI ARATA DACA CELE DOUA CONDITII SUNT
INDEPLINITE:
- varianta intra-grupe, care imi arata cat de omogene sunt grupele in interior, adica cat
de omogene sunt firmele de aceeasi dimensiune;
- varianta inter-grupe, care imi arata cat de diferit se comporta grupurile intre ele, adica
cat de diferite sunt fimele de dimensiune diferita intre ele.
DECI, TREBUIE CA VARIANTA INTRA-GRUPE SA FIE MAI MICA DECAT
VARIANTA INTER-GRUPE!!!
Se cere:
1. Puneți în evidență distribuția marginală a variabilei X și distribuția marginală a
variabilei Y
2. Puneți în evidență distribuțiile condiționate. Câte distribuții condiționate sunt?
3. Să se interpreteze frecvențele absolute parțiale
1
4. Să se interpreteze frecvențele absolute marginale
5. Să se calculeze și să se interpreteze frecvențele relative parțiale
6. Să se calculeze și să se interpreteze frecvențele relative marginale
7. Să se calculeze și să se interpreteze frecvențele relative condiționate
8. Să se calculeze și să se interpreteze mediile condiționate (mediile pe grupe) -
OPTIONAL
9. Să se calculeze varianțele condiționate (varianțele de grupă) - OPTIONAL
10. Să se calculeze și să se interpreteze media pe total
11. Să se calculeze media varianțelor de grupă (varianta intragrupe)
12. Să se calculeze varianța între grupe (varianța intergrupe)
13. Să se calculeze varianța generală
14. Să se calculeze coeficientul de influență a factorului de grupare și coeficientul de
influență a factorilor aleatori/întâmplători
2
În cazul problemei noastre, avem:
xi yj y1 y2 y3
TOTAL
(ni.)
x1 n11 n12 n13 n1.
x2 n21 n22 n23 n2.
x3 n31 n32 n33 n3.
x4 n41 n42 n43 n4.
TOTAL
n.1 n.2 n.3 n..
(n.j)
3
1. Puneți în evidență distribuția marginală a variabilei X și distribuția marginală a variabilei
Y
O distribuție a unei variabile empirice poate fi pusă în evidență prin prezentarea
valorilor variabilei și a frecvențelor lor de apariție.
Sunt două distribuții marginale constituite din valorile variabilei și frecvențele marginale.
Tabelul 6.2. Distribuția firmelor din Iași după cifra de afaceri
xi ni.
(mii lei)
10 170
20 115
30 150
40 315
TOTAL 750
Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie” X / Y y2
xi ni 2
(mii lei)
10 30
20 60
30 90
40 70
TOTAL 250
4
Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare” X / Y y3
xi ni 3
(mii lei)
10 8
20 13
30 40
40 239
TOTAL 300
Distribuțiile prezentate în tabelele 6.2, 6.4, 6.5 și 6.6 sunt distribuții ale unei variabile
cantitative, discrete. Prin urmare pentru acestea putem determina nivelul mediu prin media
aritmetică, dispersia prin abaterea standard etc.
Tabelul 6.7 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 10 mii lei Y / X x1
yj n1 j
mici 132
mijlocii 30
mari 8
TOTAL 170
Tabelul 6.8 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 20 mii lei Y / X x1
yj n2 j
mici 42
mijlocii 60
mari 13
TOTAL 115
Tabelul 6.9 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 30 mii lei Y / X x1
yj n3 j
mici 20
mijlocii 90
mari 40
TOTAL 150
Tabelul 6.10 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 40 mii lei Y / X x1
yj n4 j
mici 6
mijlocii 70
mari 239
TOTAL 315
5
3. Să se interpreteze frecvențele absolute parțiale
n11 132 . 132 de firme sunt mici și au cifra de afaceri egală cu 10 mii lei
n21 42 . 42 de firme sunt mici și au cifra de afaceri egală cu 20 mii lei
n31 20 . 20 de firme sunt mici și au cifra de afaceri egală cu 30 mii lei
n41 6 . 6 firme sunt mici și au cifra de afaceri egală cu 40 mii lei
n12 30 . 30 de firme sunt mijlocii și au cifra de afaceri egală cu 10 mii lei
n22 60 . 60 de firme sunt mijlocii și au cifra de afaceri egală cu 20 mii lei
n32 90 . 90 de firme sunt mijlocii și au cifra de afaceri egală cu 30 mii lei
n42 70 . 70 de firme sunt mijlocii și au cifra de afaceri egală cu 40 mii lei
n13 8 . 8 firme sunt mari și au cifra de afaceri egală cu 10 mii lei
n23 13 . 13 firme sunt mari și au cifra de afaceri egală cu 20 mii lei
n33 40 . 40 de firme sunt mari și au cifra de afaceri egală cu 30 mii lei
n43 239 . 239 de firme sunt mari și au cifra de afaceri egală cu 40 mii lei
6
Tabelul 6.3. Distribuția firmelor din Iași după tipul firmelor
yj n.j
mici 200
mijlocii 250
mari 300
TOTAL 750
nij
fij 100
n
Tabelul initial
xi yj mici mijlocii mari TOTAL
(mii lei)
10 132 30 8 170
20 42 60 13 115
30 20 90 40 150
40 6 70 239 315
TOTAL 200 250 300 750
n11 132
f11 100 100 17,6% . 17,6% din firme sunt mici și au cifra de afaceri egală cu 10 mii lei
n 750
n 42
f 21 21 100 100 5,6% . 5,6% din firme sunt mici și au cifra de afaceri egală cu 20 mii lei
n 750
n 20
f31 31 100 100 2,67% . 2,67% din firme sunt mici și au cifra de afaceri egală cu 30 mii lei
n 750
n 6
f 41 41 100 100 0,8% . 0,8% din firme sunt mici și au cifra de afaceri egală cu 40 mii lei
n 750
7
n12 30
f12 100 100 4,00% . 4,00% din firme sunt mijlocii și au cifra de afaceri egală cu 10 mii
n 750
lei
n22 60
f 22 100 100 8,00% . 8,00% din firme sunt mijlocii și au cifra de afaceri egală cu 20 mii
n 750
lei
n32 90
f32 100 100 12,00% . 12,00% din firme sunt mijlocii și au cifra de afaceri egală cu 30
n 750
mii lei
n 70
f 42 42 100 100 9,33% . 9,33% din firme sunt mijlocii și au cifra de afaceri egală cu 40 mii
n 750
lei
n13 8
f13 100 100 1,07% . 1,07% din firme sunt mari și au cifra de afaceri egală cu 10
n 750
mii lei
n23 13
f 23 100 100 1,73% . 1,73% din firme sunt mari și au cifra de afaceri egală cu 20
n 750
mii lei
n33 40
f33 100 100 5,33% . 5,33% din firme sunt mari și au cifra de afaceri egală cu 30
n 750
mii lei
n43 239
f 43 100 100 31,87% . 31,87% din firme sunt mari și au cifra de afaceri egală cu
n 750
40 mii lei
8
6. Să se calculeze și să se interpreteze frecvențele relative marginale
Tabelul 6.2. Distribuția firmelor din Iași după cifra de afaceri
xi ni.
(mii lei)
10 170
20 115
30 150
40 315
TOTAL 750
ni
fi 100
n
n1 170
f1 100 100 22, 67% . 22,67% dintre firme au cifra de afaceri de 10 mii lei
n 750
n 115
f 2 2 100 100 15,33% , 15,33% dintre firme au cifra de afaceri de 20 mii lei
n 750
n 150
f3 3 100 100 20, 00% , 20% dintre firme au cifra de afaceri de 30 mii lei
n 750
n 315
f 4 4 100 100 42, 00% , 42% dintre firme au cifra de afaceri de 40 mii lei
n 750
9
nj
fj 100
n
n1 200
f1 100 100 26, 67% , 26,67% dintre firme sunt mici
n 750
n 250
f 2 2 100 100 33,33% , 33,33% dintre firme sunt mijlocii
n 750
n 300
f 3 3 100 100 40, 00% , 40% dintre firme sunt mari
n 750
f1/1 reprezintă frecvența relativă a firmelor mici condiționate ca valoarea cifrei de afaceri să fie de
10 mii lei
n11 132
f1 1 100 100 66, 00% . 66% dintre firmele mici au cifra de afaceri egală cu 10 mii lei
n1 200
10
n21 42
f2 1 100 100 21, 00% . 21% dintre firmele mici au cifra de afaceri egală cu 20 mii lei
n1 200
n 20
f3 1 31 100 100 10, 00% . 10% dintre firmele mici au cifra de afaceri egală cu 30 mii lei
n1 200
n 6
f 4 1 41 100 100 3, 00% . 3% dintre firmele mici au cifra de afaceri egală cu 40 mii lei
n1 200
**********************************************************************************
Firme Mijlocii
Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie” X / Y y2
xi ni 2
(mii lei)
10 30
20 60
30 90
40 70
TOTAL 250
ni 2
fi 2 100
n2
f1/ 2 -reprezintă frecvența relativă a firmelor mijlocii condiționate ca valoarea cifrei de afaceri să fie
de 10 mii lei
n12 30
f1 2 100 100 12, 00% . 12% dintre firmele mijlocii au cifra de afaceri egală cu 10 mii
n2 250
lei
n22 60
f2 2 100 100 24, 00% . 24% dintre firmele mijlocii au cifra de afaceri egală cu 20
n2 250
mii lei
n32 90
f3 2 100 100 36, 00% . 36% dintre firmele mijlocii au cifra de afaceri egală cu 30
n2 250
mii lei
n42 70
f4 2 100 100 28, 00% . 28% dintre firmele mijlocii au cifra de afaceri egală cu 40
n2 250
mii lei
11
********************************************************************************
Firme Mari
ni 3
fi 3 100
n3
Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare” X / Y y3
xi ni 3
(mii lei)
10 8
20 13
30 40
40 239
TOTAL 300
n13 8
f1 3 100 100 2, 67% . 2,67% dintre firmele mari au cifra de afaceri egală cu 10 mii
n3 300
lei
n23 13
f2 3 100 100 4,33% . 4,33% dintre firmele mari au cifra de afaceri egală cu 20 mii
n3 300
lei
n33 40
f3 3 100 100 13,33% . 13,33% dintre firmele mari au cifra de afaceri egală cu 30 mii
n3 300
lei
n43 239
f4 3 100 100 79, 67% . 79,67% dintre firmele mari au cifra de afaceri egală cu 40
n3 300
mii lei
nij
fi j 100 , i valoare fixă (cifra de afaceri)
ni
**********************************************************************************
12
Firme cu cifra de afaceri de 10 mii lei
n1 j
f1 j 100
n1
Tabelul 6.7 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 10 mii lei Y / X x1
yj n1 j
mici 132
mijlocii 30
mari 8
TOTAL 170
n11 132
f1 1 100 100 77, 65% . 77,65% dintre firmele ce au cifra de afaceri egală cu 10 mii lei
n1 170
sunt mici
n12 30
f1 2 100 100 17, 65% . 17,65% dintre firmele ce au cifra de afaceri egală cu 10 mii lei
n1 170
sunt mijlocii
n13 8
f1 3 100 100 4, 70% . 4,70% dintre firmele ce au cifra de afaceri egală cu 10 mii lei
n1 170
sunt mari
*********************************************************************************
13
Firme cu cifra de afaceri de 20 mii lei
n2 j
f2 j 100
n2
Tabelul 6.8 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 20 mii lei Y / X x1
yj n2 j
mici 42
mijlocii 60
mari 13
TOTAL 115
n21 42
f2 1 100 100 36,52% . 36,52% dintre firmele ce au cifra de afaceri egală cu 20 mii lei
n2 115
sunt mici
n22 60
f2 2 100 100 52,17% . 52,17% dintre firmele ce au cifra de afaceri egală cu 20 mii
n2 115
lei sunt mijlocii
n23 13
f2 3 100 100 11,31% . 11,31% dintre firmele ce au cifra de afaceri egală cu 20 mii lei
n2 115
sunt mari
*********************************************************************************
14
Firme cu cifra de afaceri de 30 mii lei
n3 j
f3 j 100
n3
Tabelul 6.9 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 30 mii lei Y / X x1
yj n3 j
mici 20
mijlocii 90
mari 40
TOTAL 150
n31 20
f3 1 100 100 13,33% . 13,33% dintre firmele ce au cifra de afaceri egală cu 30 mii lei
n3 150
sunt mici
n32 90
f3 2 100 100 60, 00% . 60,00% dintre firmele ce au cifra de afaceri egală cu 30 mii lei
n3 150
sunt mijlocii
n33 40
f3 3 100 100 26, 67% . 26,67% dintre firmele ce au cifra de afaceri egală cu 30 mii
n3 150
lei sunt mari
*********************************************************************************
15
Firme cu cifra de afaceri de 40 mii lei
n4 j
f4 j 100
n4
Tabelul 6.10 Distribuția firmelor din Iași după tipul firmei condiționată ca cifra de afaceri să
fie 40 mii lei Y / X x1
yj n4 j
mici 6
mijlocii 70
mari 239
TOTAL 315
n41 6
f4 1 100 100 1,91% . 1,91% dintre firmele ce au cifra de afaceri egală cu 40 mii lei
n4 315
sunt mici
n42 70
f4 2 100 100 22, 22% . 22,22% dintre firmele ce au cifra de afaceri egală cu 40 mii
n4 315
lei sunt mijlocii
n43 239
f4 3 100 100 75,87% . 75,87% dintre firmele ce au cifra de afaceri egală cu 40 mii lei
n4 315
sunt mari
16
8. Să se calculeze și să se interpreteze mediile condiționate (mediile pe grupe)
Mediile condiționate pot fi calculate pentru fiecare din distribuțiile condiționate ale variabilei
cantitative, cifra de afaceri.
m m
x n i ij x n i ij
xj i 1
p
i 1
nj
n
j 1
ij
Tabelul 6.4 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mică” X / Y y1
xi ni1 xi ni1
(mii lei)
10 132 1320
20 42 840
30 20 600
40 6 240
TOTAL 200 3000
m m
x n i i1 x n i i1
3000
x1 i 1
p
i 1
15 mii lei
n1 200
n
j 1
ij
Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie” X / Y y2
xi ni 2 xi ni 2
(mii lei)
10 30 300
20 60 1200
30 90 2700
40 70 2800
TOTAL 250 7000
m m
x n i i2 x n i i2
7000
x2 i 1
p
i 1
28 mii lei
n2 250
n j 1
ij
17
Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare” X / Y y3
xi ni 3 xi ni 3
(mii lei)
10 8 80
20 13 260
30 40 1200
40 239 9560
TOTAL 300 11100
m m
xi ni 3 x n i i3
11100
x3 i 1
p
i 1
37 mii lei
n3 300
n
j 1
ij
x x j nij x x j nij
m m
i i
s 2j i 1
m
i 1
n
n j
ij
i 1
Tabelul 6.4 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mică” X / Y y1
xi ni1 xi ni1 xi x1 xi x1
2
xi x1
2
ni1
(mii lei)
10 132 1320 -5 25 3300
20 42 840 5 25 1050
30 20 600 15 225 4500
40 6 240 25 625 3750
TOTAL 200 3000 - - 12600
m m
xi x1 x x1 ni1
2 2
ni1 i
s12 i 1
m
i 1
n
n1
i1
i 1
12600
s12 63
200
18
Tabelul 6.5 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mijlocie” X / Y y2
xi ni 2 xi ni 2 xi x2 xi x2
2
xi x2
2
ni 2
(mii lei)
10 30 300 -18 324 9720
20 60 1200 -8 64 3840
30 90 2700 2 4 360
40 70 2800 12 144 10080
TOTAL 250 7000 - - 24000
m m
xi x2 x x2 ni 2
2 2
ni 2 i
s22 i 1
m
i 1
n
n2
i2
i 1
24000
s22 96
250
Tabelul 6.6 Distribuția cifrei de afaceri a firmelor din Iași condiționată de tipul firmei să fie
“mare” X / Y y3
xi ni 3 xi ni 3 xi x3 xi x3
2
xi x3
2
ni 3
(mii lei)
10 8 80 -27 729 5832
20 13 260 -17 289 3757
30 40 1200 -7 49 1960
40 239 9560 3 9 2151
TOTAL 300 11100 - - 13700
m m
x x3 ni 3 x x3 ni 3
2 2
i i
s32 i 1
m
i 1
n
n3
i3
i 1
13700
s32 45,67
300
xjn j
j 1
x n
j 1
j j
x p
n
n
j 1
j
19
Cifra medie de afaceri a tuturor firmelor este de 28.13 mii lei.
xi ni xn i i
x i 1
m
i 1
n
n
i
i 1
21100
x 28,13 mii lei
750
11. Să se calculeze media varianțelor de grupă (varianța intragrupe sau varianta datorata
factorilor intamplatori)
p p
s 2j n
j 1
j s n
j 1
2
j j
s2 p
n
n
j 1
j
Varianta intra-grupe trebuie sa-mi arate care e valoarea diferentelor de CA intre firmele de aceeasi
dimensiune.
20
12. Să se calculeze varianța între grupe (varianța intergrupe sau varianța datorata factorului
de grupare – tipul firmei)
x x n j x x n j
p p
2 2
j j
j 1 j 1
sx2j p
n
n
j 1
j
xj x x x x x n
2 2
xj n j j j j
s x2j
15 28.132 200 28 28.132 250 37 28.132 300
750
58086,67
sx2j 77,45
750
xi x x x ni
2 2
ni i
s X2 i 1
m
i 1
n
n
i
i 1
108386,67
sX2 144,52
750
21
Dar, daca avem deja cele doua componente ale variantei generale, varianta intergrupe si varianta
intragrupe, calculam varianta generala ca suma a celor doua.
sX2 sx2j s 2
144,52=77,45+67,07
sx2j 77, 45
k1 2
100 100 53,59%
s X 144,52
2
s 67,07
k2 2
100 100 46, 41%
sX 144,52
Deoarece coeficientul factorului de grupare k1 este mai mare decât coeficientul influenței factorilor
întâmplători k 2 , factorul de grupare, tipul firmelor (mici, mijlocii și mari) are influență asupra cifrei de
afaceri a firmelor din Iași.
53,59% din variatia totala a cifrei de afaceri este explicata de factorul de grupare, tipul firmelor.
Restul de 46.41% din variatia totala a cifrei de afaceri este datorata factorilor intamplatori (alti factori
decat factorul de grupare).
22
PROBLEME
1. Pentru lotul olimpic de sărituri în înălţime al unei ţări s-a înregistrat înălţimea săriturii (X) şi sexul atletului (Y).
S-au obţinut datele de mai jos.
Sexul persoanei
Înălţimea săriturii
Masculin Feminin
Se cere:
2. Se consideră distribuţia unui eşantion de persoane după statusul de fumator (Da sau Nu) şi greutate (kg.).
Se cere:
23
Seminar analiza descriptiva univariata a unei serii
I. Se inregistreaza numarul de zboruri in ultimul an pentru un esantion de 5 persoane: 6, 7, 10, 12, 15.
Sa se calculeze si sa se interpreteze media aritmetica si mediana.
Rezolvare
6 7 10 12 15 50
x 10 zboruri
5 5
Me= 10 zboruri
Jumatate din persoane au efectuat cel mult 10 zboruri in ultimul an, iar 50% au efectuat cel putin 10
zboruri in ultimul an.
II. Se considera distributia unui eşantion de angajaţi ai firmei X după numărul de mijloace de
transport în comun folosite zilnic până la locul de muncă. Datele sunt prezentate in tabelul de mai jos.
Tabelul 1. Distribuţia unui eşantion de angajaţi ai firmei X după numărul de mijloace de transport în
comun folosite zilnic până la locul de muncă
xi ni
1.00 5
2.00 75
3.00 27
4.00 3
Total 110
1
Rezolvare
xi ni xi*ni
1 5 5
2 75 150
3 27 81
4 3 12
Total 110 248
x
x n
i i
248
2.25 2 mijloace de transport
n i 110
In medie, un angajat foloseste zilnic 2 mijloace de transport pentru a ajunge la locul de munca.
Algoritm:
- se identifica frecventa maxima: nimax = 75
- in dreptul frecventei maxime se citeste, din coloana valorilor xi, valoarea modala: Mo=2
mijloace de transport
Cel mai frecvent, angajatii folosesc 2 mijloace de transport pentru a ajunge la locul de munca.
2
Calculul si interpretarea medianei
xi ni Ni
1.00 5 5
2.00 75 80
3.00 27 107
4.00 3 110
Total 110 -
Algoritm:
Prima valoare Ni care acopera valoarea 55.5, adica prima valoare Ni ≥ UMe este 80.
2.
xi ni Ni
1.00 5 5
2.00 75 80
3.00 27 107
4.00 3 110
Total 110 -
Prima valoare Ni care acopera valoarea 27.75, adica prima valoare Ni ≥ UQ1 este 80.
3
UQ3 = 3*(110+1)/4 = 83.25
Prima valoare Ni care acopera valoarea 83.25, adica prima valoare Ni ≥ UQ3 este 107.
Prima valoare Ni care acopera valoarea 77.7, adica prima valoare Ni ≥ UD7 este 80.
4
3. Sa presupunem distributia a 5 persoane dupa cantitatea de Cola (l) consumata intr-o saptamana.
Coeficientul de variatie
v = (s/medie)*100
v > 50%, atunci dispersia este mare, populatia este eterogena, media este nereprezentativa
v<= 50%, atunci dispersia este mica, populatia este omogena, media este reprezentativa
xi ni xi x ( xi x ) 2 ( x i x ) 2 ni
1.00 5 -1.25 1.5625 7.8125
2.00 75 -0.25 0.0625 4.6875
3.00 27 0.75 0.5625 15.1875
4.00 3 1.75 3.0625 9.1875
Total 110 - - 36.875
Varianţa
5
Abaterea medie patratica (abaterea standard)
Coeficientul de variatie
Daca v ≤ 50% (abaterea standard este cel mult jumatate din valoarea mediei) dispersia este mica,
populatia este omogena si media este reprezentativa.
Daca v > 50% (abaterea standard este peste jumatate din valoarea mediei) dispersia este mare,
populatia este eterogena si media este nereprezentativa.
In cazul nostru, v<50%, deci dispersia este mica, populatia este omogena si media este
reprezentativa.
4.
6
5.
7
8
Coeficientul de asimetrie γ1 este pozitiv, deci distributia este asimetrica la dreapta.
Coeficientul de boltire γ2 este pozitiv, deci distributia este leptocurtica.
III. Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa se
interpreteze asimetria distributiei folosind diagrama box-plot.
9
IV. Pentru doua serii de studenti s-au reprezentat grafic distributiile notelor obtinute la un test. Sa se
interpreteze quartilele si decilele. Sa se precizeze sensul asimetriei. Sa se specifice care serie a
obtinut note mai mari.
NOTA _1
NOTA _2
3 4 5 6 7 8 9 10 11
Distributia primei serii este asimetrica la dreapta, distributia celei de-a doua serii este asimetrica la
stanga.
Prin urmare, in urma analizarii tuturor acestor informatii, a doua serie a obtinut note ai mari decat
prima.
10
Variabila continua
I. Se considera distribuţia unui eşantion de reclame difuzate într-o zi la TV, observate după durata
reclamei în secunde. Datele sunt prezentate in tabelul urmator.
Tabelul 1. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi ni
8-12 20
12-16 55
16-20 15
20-24 10
Total 100
Se cere:
1. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
2. Sa se calculeze si sa se interpreteze media aritmetica
3. Sa se aprecieze reprezentativitatea mediei, stiind ca s=3.42.
Rezolvare
1.
Histogram
60
50
40
Frequency
30
20
10
Mean = 14.60
Std. Dev. = 3.42893
0 N = 100
5.00 10.00 15.00 20.00 25.00
Cases weighted by n
11
2.
Tabelul 2. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi
ni xi’ Ni xini xi x ( xi x ) ni ( xi x ) 2 ( x i x ) 2 ni
8-12
20 10 20.00 200 -4.60 -92.00 21.16 423.20
12-16
55 14 75.00 770 -0.60 -33.00 0.36 19.80
16-20
15 18 90.00 270 3.40 51.00 11.56 173.40
20-24
10 22 100.00 220 7.40 74.00 54.76 547.60
Pentru a calcula indicatorii descriptive in cazul unei serii continue, pentru care valorile acesteia sunt grupate
pe intervale de variatie, se va proceda mai intai la “discretizarea” seriei, adica la folosirea mijloacelor
intervalelor de variatie a variabilei, ca valoare considerate reprezentativa pentru tot intervalul.
Mijloacele intervalelor sunt calculate in coloanal a treia din table (coloana xi’).
Din acest punct, toate calculele se vor face folosind coloanele 2 si 3, deci se va urma exact acelasi
procedeu de calcul ca in cazul variabilelor discrete.
In software-urile de analiza statistica, rezultatele apar ca in tabelul prezentat mai jos, in care:
12
Statistics
X
N Valid 100
Missing 0
Mean 14.6000
Median 14.2857a
Mode 14.00
Std. Deviation 3.42893
Variance 11.758
Skewness .686
Kurtos is .086
Percentiles 10 10.0000b
20 11.0667
25 11.6000
28 11.9200
30 12.1333
40 13.2000
50 14.2857
60 15.4286
70 16.5714
75 17.1429
80 17.7143
90 20.4000
95 22.0000
a. Calculated from grouped data.
b. Percentiles are calculated from grouped data.
Valoarea coeficientului de variatie este inferioara pragului de 50%, deci dispersia este mica, populatia este
omogena iar media este reprezentativa.
13
Variabile calitative
I. Se consideră distribuţia după regiunea de provenienţă a angajaţilor unei firme, prezentată în tabelul
următor.
xi ni
Nord-Est 40
Sud 22
Vest 12
Centru 4
Total 78
Rezolvare
xi ni fi(%)
Nord-Est 40 51.28
Sud 22 28.21
Vest 12 15.38
Centru 4 5.13
Total 78 100
Modul este valoarea variabilei (regiunea) cel mai frecvent observata. Frecventa maxima este
inregistrata de regiunea de NE, deci modul este regiunea NE. Prin urmare, puteam afirma ca cel mai
frecvent, angajatii provin din regiunea de NE.
14
Reprezentarea grafica a unei variabile nominale se realizeaza folosind diagrame prin bare. Coloane
su diagrame de structura, cum ar fi cercul de structura.
II. Se consideră distribuţia după nivelul de studiu al angajaţilor unei firme, prezentată în tabelul
următor.
xi ni
Medii 72
Universitare 30
Post-universitare 15
Total 117
Rezolvare
15
Interpretare frecvente pentru nivelul de studii universitare (al doilea nivel de variatie a lui X):
30 de angajati au studii universitare
25.64% din angajati au studii universitare
102 angajati au cel mult studii universitare
45 angajati au cel putin studii universitare
87.18% din angajati au cel mult studii universitare
38.46% din angajati au cel putin studii universitare
Modul este studii medii, intrucat acesta este nivelul de studii cu cea mai mare frecventa de aparitie.
Prin urmare, cei mai multi angajati au studii medii.
UMe = (117+1)/2 = 59
Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 72.
4. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci mediana este studii medii. Prin urmare, 50% din angajati au cel mult studii
medii, iar 50% au cel putin studii medii.
16
Tema – optional 😊
1. Intr-o comuna cu 2300 de gospodarii s-a studiat suprafata de pamant arabil (ha) si numarul de
animale (bucati) detinute de fiecare gospodarie.
- Identificaţi populaţia studiată, unitatea statistică, variabila observată, tipul variabilei şi al
scalei.
- Precizaţi tipul cercetării (totală sau parţială).
3. Pentru ţările din U.E. s-a înregistrat rata de creştere a PIB-ului în 2012. Se cere:
- Identificaţi populaţia studiată, unitatea statistică, variabila observată si tipul acesteia.
17
Analiza statistica univariata a unei serii numerice
Analiza numerica
1. Indicatori medii: media aritmetica, modul, mediana, quartile, decile
2. Indicatori ai variatiei (dispersiei): varianţa, abaterea medie patratica, coeficientul de
variatie, amplitudinea intervalului interquartilic
3. Indicatori ai formei: asimetrie (coeficientul de asimetrie Fisher) şi boltire (coeficientul de
boltire Fisher)
Analiza grafica
- Histograma
- Poligonul frecventelor
- Curba frecventelor
- Diagrama box-plot
II. Se considera distributia unui eşantion de studenti după numărul de ore de voluntariat efectuate in
ultima saptamana. Datele sunt prezentate in tabelul de mai jos.
Tabelul 1. Distribuţia unui eşantion de student dupa numarul de ore de voluntariat efectuate in ultima
saptamana
xi ni
1.00 10
3.00 19
4.00 80
7.00 25
Total 134
III. Pentru o distribuţie a studenţilor după nota obţinută la Statistică se cunoaşte: D1= 2,5, Q1 = 4,
Me=6,5, Q3 = 7, D9=8. Se cere:
a. Să se construiască diagrama box-plot.
b. Să se precizeze sensul asimetriei.
c. Să se calculeze şi interpreteze intervalul interquartilic.
18
IV. Se considera distribuţia unui eşantion firme din judetul Iasi, observate după valoarea profitului
acestora (milioane lei). Datele sunt prezentate in tabelul urmator.
Tabelul 2. Distribuţia unui eşantion de firme după valoarea profitului (milioane lei) – elemente de
calcul
Se cere:
4. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
5. Sa se calculeze si sa se interpreteze media artimetica
6. Sa se interpreteze indicatorii prezentati in tabelul de mai jos. Apreciati gradul de
reprezentativitate al mediei.
Statistics
profit
Valid 120
N
Missing 0
Mean 21.2500
Median 20.0000
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skewness .442
Std. Error of Skewness .221
Kurtosis -.484
Std. Error of Kurtosis .438
Sum 2550.00
25 15.0000
Percentiles 50 20.0000
75 25.0000
19
V. Pentru o companie, s-a observat distributia salariului femeilor si a barbatilor. Sa se interpreteze
rezultatele obtinutwe in urma analizei.
20
Aplicaţii
Tipuri de variabile
1. Variabile numerice (cantitative):
- variabile discrete – variabila poate avea ca valori doar numere intregi, respectiv unitatea
de masura a variabilei nu admite subdiviziuni. De exemplu, numarul de copii ai unei
familii, numarul de angajati ai unei firme etc.;
- variabile continue – variabila poate avea ca valori orice fel de numar, respectiv unitatea
de masura a variabilei admite subdiviziuni. De exemplu, pretul unui produs, salariul unei
persoane, rata somajului unei tari, inaltimea unei persoane etc.
2. Variabile nenumerice (calitative):
- variabile nominale. Caz particular: variabile alternative (dummy), adica variabile care pot
avea doar doua valori posibile. Valorile variabilei nominale nu pot fi ordonate dupa un
criteriu de intensitate a raspunsurilor oferite. De exemplu, religia unei persoane, judetul
de rezidenta al unei persoane, domeniul de activitate a unei firme etc.
- variabile ordinale. Daca valorile variabilei trebuie insiruite intr-o anumita ordine data de
gradul de intensitate care face diferenta intre ele, atunci variabila este ordinala. De
exemplu, nivelul de studii al unei persoane, gradul de acord sau dezacord cu o afirmatie
etc.
OBS. In functie de cum se prezinta valorile variabilei, putem determina tipul variabilei.
- Scala de masurare
Scala este un continuum de cifre sau de simboluri, plasate ierarhic, de la inferior la
superior.
1
Tipuri de scale
1. Variabile calitative
Scala nominală presupune acordarea de numere (coduri) fiecărei categorii a unei populaţii
(doi indivizi care aparţin unor categorii distincte au valori diferite).
este caracteristică variabilelor nominale
Scala ordinală presupune ca atribuirea de coduri numerice pentru fiecare categorie să se
realizeze în ordine descrescătoare, după importanţa lor.
este caracteristică variabilelor ordinale.
2. Variabile cantitative
Scala interval are ca proprietăţi identitatea, ordinea şi faptul că intervalul între numere are
un sens.
se poate, astfel, compara diferenţa dintre două valori ale aceleiaşi variabile.
Exemplu:
- temperatura în sistemul Celsius şi în sistemul Fahrenheit: diferenţa dintre două temperaturi
are un sens;
- scorurile obţinute la testele de evaluare.
Scala raport
are aceleaşi proprietăţi ca scala interval şi, în plus, posedă un zero absolut (considerat punct
de referinţă).
diferenţa şi raportul dintre două valori au un sens.
Exemplu:
- Rata şomajului, PIB/locuitor, rata natalităţii, vârsta, înălţimea, greutatea ...
- Scala de masurare
2
APLICATII
1. Intr-o comuna cu 2300 de gospodarii s-a studiat suprafata de pamant arabil (ha) si numarul de
animale (bucati) detinute de fiecare gospodarie.
- Identificaţi populaţia studiată, unitatea statistică, variabila observată, tipul variabilei şi al
scalei.
- Precizaţi tipul cercetării (totală sau parţială).
3. Pentru ţările din U.E. s-a înregistrat rata de creştere a PIB-ului în 2012. Se cere:
- Identificaţi populaţia studiată, unitatea statistică, variabila observată si tipul acesteia.
3
Analiza statistica univariata a unei serii numerice
Analiza numerica
1. Indicatori medii: media aritmetica, modul, mediana, quartile, decile
2. Indicatori ai variatiei (dispersiei): varianţa, abaterea medie patratica, coeficientul de
variatie, amplitudinea intervalului interquartilic
3. Indicatori ai formei: asimetrie (coeficientul de asimetrie Fisher) şi boltire (coeficientul de
boltire Fisher)
Analiza grafica
- Histograma
- Poligonul frecventelor
- Curba frecventelor
- Diagrama box-plot
Rezolvare
Media aritmetica
Mediana
Mediana este valoarea variabilei care imparte in jumatate un sir ordonat de valori.
1. Ordonam seria
2, 7, 10, 15, 46
2. Identificam mediana ca fiind valoarea centrala din sir, adica Me=10 ore. Prin urmare, 50%
din elevi fac cel mult 10 ore de pregatire, iar 50% cel putin 10 ore de pregatire.
Coeficientul de variatie
Pentru a calcula valoarea coeficientului de variatie, trebuie sa calculam valoarea abaterii medii
patratice, s.
4
s 15.58
v *100 *100 97.37%
x 16
Daca v ≤ 50% (abaterea standard este cel mult jumatate din valoarea mediei) dispersia este mica,
populatia este omogena si media este reprezentativa.
Daca v > 50% (abaterea standard este peste jumatate din valoarea mediei) dispersia este mare,
populatia este eterogena si media este nereprezentativa.
In cazul nostru, v>50%, deci dispersia este mare, populatia este eterogena si media nu este
reprezentativa.
II. Se considera distributia unui eşantion de studenti după numărul de ore de voluntariat efectuate in
ultima saptamana. Datele sunt prezentate in tabelul de mai jos.
Tabelul 1. Distribuţia unui eşantion de student dupa numarul de ore de voluntariat efectuate in ultima
saptamana
xi ni
1.00 10
3.00 19
4.00 80
7.00 25
Total 134
5
1. Sa se calculeze media aritmetica, modul si mediana.
2. Sa se calculeze si sa se interpreteze Q1, Q3 si D9.
3. Sa se calculeze si sa se interpreteze varianta, abaterea medie patratica si coeficientul de variatie.
4. Stiind ca valoarea coeficientului de asimetrie este 0.38 si valoarea coeficientului de boltire este
0.31, sa se interpreteze forma distributiei.
Rezolvare
xi ni xi*ni Ni xi x ( xi x ) 2 ( x i x ) 2 ni
1.00 10 10 10 -3,19 10,1761 101,761
3.00 19 57 29 -1,19 1,4161 26,9059
4.00 80 320 109 -0,19 0,0361 2,888
7.00 25 175 134 2,81 7,8961 197,4025
Total 134 562 - - - 328,9574
1.
Media aritmetica
x
x n
i i
562
4.19 4ore
n i 134
Modul
Modul reprezinta valoarea variabilei cel mai frecvent intalnita intr-o distributie. Cea mai mare
frecventa de aparitie este 80, iar valoarea variabilei corespunzatoare acestei frecvente este 4. Prin
urmare, Mo = 4 ore, adica cel mai frecvent, studentii efectueaza 4 ore de voluntariat.
Mediana
Pentru mediana aplicam algoritmul de identificare a acesteia.
3. Aflam pozitia ocupata de mediana in sirul celor 134 valori.
Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 109.
4. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci Me = 4 ore. Prin urmare, 50% din studenti efectueaza cel putin 4 ore de
voluntariat, iar 50% cel mult 4 ore de voluntariat.
2.
Pentru Q1 aplicam algoritmul de identificare a acesteia.
6
1. Aflam pozitia ocupata de Q1 in sirul celor 134 valori
Prima valoare Ni care acopera valoarea 33.75, adica prima valoare Ni ≥ UQ1 este 109.
Prima valoare Ni care acopera valoarea 101.25, adica prima valoare Ni ≥ UQ3 este 109.
Prima valoare Ni care acopera valoarea 121.5, adica prima valoare Ni ≥ UD9 este 134.
3.
Varianta
x x
2
ni 328,9574
2,45
i
s2
n i 134
7
Abaterea medie patratica (abaterea standard)
Coeficientul de variatie
s 1,56
v *100 *100 37,23%
x 4,19
v ≤ 50% (abaterea standard este cel mult jumatate din valoarea mediei) dispersia este mica, populatia
este omogena si media este reprezentativa.
8
4.
9
10
Coeficientul de asimetrie γ1 este pozitiv, deci distributia este asimetrica la dreapta.
Coeficientul de boltire γ2 este pozitiv, deci distributia este leptocurtica.
III. Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa se
interpreteze asimetria distributiei folosind diagrama box-plot.
11
IV. Pentru doua serii de studenti s-au reprezentat grafic distributiile notelor obtinute la un test. Sa se
interpreteze quartilele si decilele. Sa se precizeze sensul asimetriei. Sa se specifice care serie a
obtinut note mai mari.
NOTA _1
NOTA _2
3 4 5 6 7 8 9 10 11
Distributia primei serii este asimetrica la dreapta, distributia celei de-a doua serii este asimetrica la
stanga.
Prin urmare, in urma analizarii tuturor acestor informatii, a doua serie a obtinut note mai mari decat
prima.
12
V. Se considera distribuţia unui eşantion firme din judetul Iasi, observate după valoarea profitului
acestora (milioane lei). Datele sunt prezentate in tabelul urmator.
Tabelul 2. Distribuţia unui eşantion de firme după valoarea profitului (milioane lei) – elemente de
calcul
Se cere:
1. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
2. Sa se calculeze si sa se interpreteze media aritmetica
3. Sa se interpreteze indicatorii prezentati in tabelul de mai jos. Apreciati gradul de
reprezentativitate al mediei.
Statistics
profit
Valid 120
N
Missing 0
Mean 21.2500
Median 20.0000
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skewness .442
Std. Error of Skewness .221
Kurtosis -.484
Std. Error of Kurtosis .438
Sum 2550.00
25 15.0000
Percentiles 50 20.0000
75 25.0000
13
Rezolvare
1.
2.
Pentru a calcula indicatorii descriptive in cazul unei serii continue, pentru care valorile acesteia sunt grupate
pe intervale de variatie, se va proceda mai intai la “discretizarea” seriei, adica la folosirea mijloacelor
intervalelor de variatie a variabilei, ca valoare considerate reprezentativa pentru tot intervalul.
Mijloacele intervalelor sunt calculate in coloana a treia din tabel (coloana xi’).
Din acest punct, toate calculele se vor face folosind coloanele 2 si 3, deci se va urma exact acelasi procedeu
de calcul ca in cazul variabilelor discrete.
x
x ni i
2550
21.25mil.lei
n i 129
3.
In software-urile de analiza statistica, rezultatele apar ca in tabelul prezentat mai jos, in care:
15
Variabile calitative
I. Se consideră distribuţia după regiunea de provenienţă a angajaţilor unei firme, prezentată în tabelul
următor.
xi ni
Nord-Est 40
Sud 22
Vest 12
Centru 4
Total 78
Rezolvare
xi ni fi(%)
Nord-Est 40 51.28
Sud 22 28.21
Vest 12 15.38
Centru 4 5.13
Total 78 100
Modul este valoarea variabilei (regiunea) cel mai frecvent observata. Frecventa maxima este
inregistrata de regiunea de NE, deci modul este regiunea NE. Prin urmare, puteam afirma ca cel mai
frecvent, angajatii provin din regiunea de NE.
16
Reprezentarea grafica a unei variabile nominale se realizeaza folosind diagrame prin bare, coloane
sau diagrame de structura, cum ar fi cercul de structura.
II. Se consideră distribuţia după nivelul de studiu al angajaţilor unei firme, prezentată în tabelul
următor.
xi ni
Medii 72
Universitare 30
Post-universitare 15
Total 117
Rezolvare
17
Interpretare frecvente pentru nivelul de studii universitare (al doilea nivel de variatie a lui X):
30 de angajati au studii universitare
25.64% din angajati au studii universitare
102 angajati au cel mult studii universitare
45 angajati au cel putin studii universitare
87.18% din angajati au cel mult studii universitare
38.46% din angajati au cel putin studii universitare
Modul este studii medii, intrucat acesta este nivelul de studii cu cea mai mare frecventa de aparitie.
Prin urmare, cei mai multi angajati au studii medii.
UMe = (117+1)/2 = 59
Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 72.
8. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci mediana este studii medii. Prin urmare, 50% din angajati au cel mult studii
medii, iar 50% au cel putin studii medii.
18
1. Pentru o companie, s-a observat distributia salariului femeilor si a barbatilor. Sa se interpreteze
rezultatele obtinute in urma analizei.
19