Documente Academic
Documente Profesional
Documente Cultură
II. Se considera distributia unui eşantion de angajaţi ai firmei X după numărul de mijloace de
transport în comun folosite zilnic până la locul de muncă. Datele sunt prezentate in tabelul de mai
jos.
Tabelul 1. Distribuţia unui eşantion de angajaţi ai firmei X după numărul de mijloace de transport în
comun schimbate zilnic până la locul de muncă
xi ni
1.00 5
2.00 75
3.00 27
4.00 3
Total 110
Rezolvare
4.
1
5.
2
3
Coeficientul de asimetrie γ1 este pozitiv, deci distributia este asimetrica la dreapta.
Coeficientul de boltire γ2 este pozitiv, deci distributia este leptocurtica.
III. Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa se
interpreteze asimetria distributiei folosind diagrama box-plot.
4
IV. Pentru doua serii de studenti s-au reprezentat grafic distributiile notelor obtinute la un test. Sa se
interpreteze quartilele si decilele. Sa se precizeze sensul asimetriei. Sa se specifice care serie a
obtinut note mai mari.
NOTA_1
NOTA_2
3 4 5 6 7 8 9 10 11
Distributia primei serii este asimetrica la dreapta, distributia celei de-a doua serii este asimetrica la
stanga.
Prin urmare, in urma analizarii tuturor acestor informatii, a doua serie a obtinut note ai mari decat
prima.
5
Variabila continua
I. Se considera distribuţia unui eşantion de reclame difuzate într-o zi la TV, observate după durata
reclamei în secunde. Datele sunt prezentate in tabelul urmator.
Tabelul 1. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi ni
8-12 20
12-16 55
16-20 15
20-24 10
Total 100
Se cere:
1. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
2. Sa se calculeze si sa se interpreteze media aritmetica
3. Sa se aprecieze reprezentativitatea mediei, stiind ca s=3.42.
Rezolvare
1.
Histogram
60
50
40
Frequency
30
20
10
Mean = 14.60
Std. Dev. = 3.42893
0 N = 100
5.00 10.00 15.00 20.00 25.00
Cases weighted by n
6
2.
Tabelul 2. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi xi x ( x i x ) ni ( xi x ) 2 ( x i x ) 2 ni
ni xi’ Ni xini
8-12
20 10 20.00 200 -4.60 -92.00 21.16 423.20
12-16
55 14 75.00 770 -0.60 -33.00 0.36 19.80
16-20
15 18 90.00 270 3.40 51.00 11.56 173.40
20-24
10 22 100.00 220 7.40 74.00 54.76 547.60
Pentru a calcula indicatorii descriptive in cazul unei serii continue, pentru care valorile acesteia sunt grupate
pe intervale de variatie, se va proceda mai intai la “discretizarea” seriei, adica la folosirea mijloacelor
intervalelor de variatie a variabilei, ca valoare considerate reprezentativa pentru tot intervalul.
Mijloacele intervalelor sunt calculate in coloanal a treia din table (coloana xi’).
Din acest punct, toate calculele se vor face folosind coloanele 2 si 3, deci se va urma exact acelasi
procedeu de calcul ca in cazul variabilelor discrete.
In software-urile de analiza statistica, rezultatele apar ca in tabelul prezentat mai jos, in care:
7
Statistics
X
N Valid 100
Missing 0
Mean 14.6000
Median 14.2857a
Mode 14.00
Std. Deviation 3.42893
Variance 11.758
Skewness .686
Kurtosis .086
Percentiles 10 10.0000b
20 11.0667
25 11.6000
28 11.9200
30 12.1333
40 13.2000
50 14.2857
60 15.4286
70 16.5714
75 17.1429
80 17.7143
90 20.4000
95 22.0000
a. Calculated from grouped data.
b. Percentiles are calculated from grouped data.
Valoarea coeficientului de variatie este inferioara pragului de 50%, deci dispersia este mica, populatia este
omogena iar media este reprezentativa.
8
Variabile calitative
I. Se consideră distribuţia după regiunea de provenienţă a angajaţilor unei firme, prezentată în tabelul
următor.
xi ni
Nord-Est 40
Sud 22
Vest 12
Centru 4
Total 78
Rezolvare
xi ni fi(%)
Nord-Est 40 51.28
Sud 22 28.21
Vest 12 15.38
Centru 4 5.13
Total 78 100
Modul este valoarea variabilei (regiunea) cel mai frecvent observata. Frecventa maxima este
inregistrata de regiunea de NE, deci modul este regiunea NE. Prin urmare, puteam afirma ca cel mai
frecvent, angajatii provin din regiunea de NE.
9
Reprezentarea grafica a unei variabile nominale se realizeaza folosind diagrame prin bare. Coloane
su diagrame de structura, cum ar fi cercul de structura.
II. Se consideră distribuţia după nivelul de studiu al angajaţilor unei firme, prezentată în tabelul
următor.
xi ni
Medii 72
Universitare 30
Post-universitare 15
Total 117
Rezolvare
10
Interpretare frecvente pentru nivelul de studii universitare (al doilea nivel de variatie a lui X):
30 de angajati au studii universitare
25.64% din angajati au studii universitare
102 angajati au cel mult studii universitare
45 angajati au cel putin studii universitare
87.18% din angajati au cel mult studii universitare
38.46% din angajati au cel putin studii universitare
Modul este studii medii, intrucat acesta este nivelul de studii cu cea mai mare frecventa de aparitie.
Prin urmare, cei mai multi angajati au studii medii.
UMe = (117+1)/2 = 59
Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 72.
2. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci mediana este studii medii. Prin urmare, 50% din angajati au cel mult studii
medii, iar 50% au cel putin studii medii.
11
Tema – optional 😊
1. Intr-o comuna cu 2300 de gospodarii s-a studiat suprafata de pamant arabil (ha) si numarul de
animale (bucati) detinute de fiecare gospodarie.
- Identificaţi populaţia studiată, unitatea statistică, variabila observată, tipul variabilei şi al
scalei.
- Precizaţi tipul cercetării (totală sau parţială).
3. Pentru ţările din U.E. s-a înregistrat rata de creştere a PIB-ului în 2012. Se cere:
- Identificaţi populaţia studiată, unitatea statistică, variabila observată si tipul acesteia.
12
Analiza statistica univariata a unei serii numerice
Analiza numerica
1. Indicatori medii: media artimetica, modul, mediana, quartile, decile
2. Indicatori ai variatiei (dispersiei): varianţa, abaterea medie patratica, coeficientul de
variatie, amplitudinea intervalului interquartilic
3. Indicatori ai formei: asimetrie (coeficientul de asimetrie Fisher) şi boltire (coeficientul de
boltire Fisher)
Analiza grafica
- Histograma
- Poligonul frecventelor
- Curba frecventelor
- Diagrama box-plot
II. Se considera distributia unui eşantion de studenti după numărul de ore de voluntariat efectuate in
ultima saptamana. Datele sunt prezentate in tabelul de mai jos.
Tabelul 1. Distribuţia unui eşantion de student dupa numarul de ore de voluntariat efectuate in ultima
saptamana
xi ni
1.00 10
3.00 19
4.00 80
7.00 25
Total 134
III. Pentru o distribuţie a studenţilor după nota obţinută la Statistică se cunoaşte: D1= 2,5, Q1 = 4,
Me=6,5, Q3 = 7, D9=8. Se cere:
a. Să se construiască diagrama box-plot.
b. Să se precizeze sensul asimetriei.
c. Să se calculeze şi interpreteze intervalul interquartilic.
13
IV. Se considera distribuţia unui eşantion firme din judetul Iasi, observate după valoarea profitului
acestora (milioane lei). Datele sunt prezentate in tabelul urmator.
Tabelul 2. Distribuţia unui eşantion de firme după valoarea profitului (milioane lei) – elemente de
calcul
Se cere:
4. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
5. Sa se calculeze si sa se interpreteze media artimetica
6. Sa se interpreteze indicatorii prezentati in tabelul de mai jos. Apreciati gradul de
reprezentativitate al mediei.
Statistics
profit
Valid 120
N
Missing 0
Mean 21.2500
Median 20.0000
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skewness .442
Std. Error of Skewness .221
Kurtosis -.484
Std. Error of Kurtosis .438
Sum 2550.00
25 15.0000
Percentiles 50 20.0000
75 25.0000
14
V. Pentru o companie, s-a observat distributia salariului femeilor si a barbatilor. Sa se interpreteze
rezultatele obtinutwe in urma analizei.
15