Documente Academic
Documente Profesional
Documente Cultură
Problema 1
Un student a primit urmatoarele note (de la 0 la 10) pentru 10 teste pe care le-a dat intr-un semestru:
6,7, 6, 8, 5, 7, 6, 9, 10, 6. Aceste note pot fi aranjate sub forma de distributii de frecventa si reprezentate
grafic.
1
Problema 2
Cutiile de conserve dintr-un esantion de 20 de cutii contin greutati nete de fructe variind intre 19.3 si
20.9 uncii (ounces-lb engleza, 1 uncie=0.03664g):
19.7, 19.9, 20.2, 19.9, 20.0, 20.6, 19.3, 20.4, 19.9, 20.3, 20.1, 19.5, 20.9, 20.3, 20.8, 19.9, 20.0, 20.6, 19.9,
19.8.
Rezolvare:
Vom grupa datele in 6 clase. Pentru simplitate, consideram 19.2 limita inferioara si 21 limita superioara
a intervalului in care se incadreaza greutatile cutiilor de conserve enumerate mai sus.
21 19.2
Marimea intervalului de grupare este: 0.3
6
Distributia frecventelor greutatilor este descrisa in tabelul:
2
Histograma frecventelor relative se traseaza similar.
3
4
Indicatorii tendintei centrale
Tendinta centrala se refera la locatia unei distributii. Cele mai importante masuri ale tendintei centrale
sunt:
1)media
2)mediana
3)abaterea standard
1)Media aritmetica
Populatie:
x
N
Esantion: x
x
n
5
Unde x =suma tuturor observatiilor, N=nr. observatiilor dn populatie, n=nr. observatiilor din
esantion.
Populatie:
fx
N
Esantion: x
fx
n
f=frecventa fiecarei clase
N 1
2)Mediana pentru datele negrupate este al -lea element din sirul de date ordonate fie crescator
2
fie descrescator.
n
F
Pentru datele grupate, Mediana=L+ 2 c
fm
3)Modul este valoarea care se repeta cel mai frecvent in setul de date (pentru date negrupate).
d1
Pentru date grupate, Modul=L+ c
d1 d 2
Media este cea mai uzuala masura a tendintei centrale. Media, totusi, este afectata de valorile extreme
din setul de date, in timp ce mediana si mediul nu sunt.
6
Pentru ambele probleme (problema 1: populatie, date negrupate; problema 2: esantion, date grupate)
determinam cei trei indicatori ai tendintei centrale:
Problema 1
Vom determina media pentru populatia din problema 1, folosind formula pentru datele negrupate:
x 6 7 6 8 5 7 6 9 10 6 70 7
N 10 10
Mediana pentru datele negrupate:
N 1 11 67
= 5.5 , deci determinam media artimetica dintre elementele 5 si 6 din sir: 6 .5
2 2 2
=Mediana.
Problema 2
7
n 20
F 3
Mediana=L+ 2 c =19.8+ 2 x0.3 20.08
fm 8
F=1+2=3
fm 8
d1 82
Modul= L+ c=19.8+ x0.3 19.98
d1 d 2 (8 2) (8 4)
Dispersia se refera la variabilitatea sau imprastirerea datelor. Cele mai importante masuri ale dispersiei
sunt:1) abaterea medie; 2) varianta; 3)abaterea standard.
Populatie: AD
| x |
N
Esantion: AD
| x x |
n
-pentru date grupate:
Populatie: AD
f |x|
N
Esantion: AD
f |xx|
n
f=frecventa clasei
2)Varianta
Populatie: 2
(x ) 2
Esantion: s 2
(x x) 2
n 1
8
-pentru date grupate:
Populatie: 2
f (x ) 2
Esantion: s 2
f (x x) 2
n 1
3)Abaterea standard
Populatie:
(x ) 2
Esantion: s
(x x) 2
n 1
-pentru date grupate:
Populatie:
f (x ) 2
Esantion: s
f (x x) 2
n 1
Cea mai utilizata masura a dispersiei este abaterea standard. Alte masuri sunt: amplitudinea si intervalul
intercuartilic.
A= x max x min
Intervalul intercuartilic= I Q Q3 Q1
Notam cuartilele cu Q1 , Q2 , Q3 .
Q2 =Mediana.
Q3 Q1
Coeficientul de variatie intercuartilica este definit de raportul q
Q2
Pentru populatii: cv
9
s
Pentru esantioane: c v
x
Coeficientul de variatie exprimat procentual exprima cate unitati in abaterea standard revin la 100
unitati de medie.
Exista cazurile:
• cv 5% serie foarte omogena, variatia ei este foarte mica, media este foarte reprezentativa, iar
gruparea este bine executata.
• cv 70 75% variatie foarte mare, media nu este seminificativa, seria are o structura eterogena
care necesita repetarea operatiei de grupare.
In consecinta, coeficientul de variatie este utilizat pentru a verifica reprezentativitatea mediei variabilei
respective si pentru a compara omogenitatea seriilor de date.
Tema Determinati abaterea medie, varianta, abaterea standard si coeficientul de variatie pentru datele
din problemele 1 si 2.
1)Simetria
10
Media=Mediana=Mod
O distributie este asimetrica la stanga (NEGATIVELY SKEWED) daca Media<Mediana<Mod si are graficul:
11
Asimetria poate fi masurata prin coeficientul Pearson de asimetrie:
-pentru populatie:
3( Med )
sk
-pentru esantion:
3( x Med )
sk
s
Media si mediana sunt primul si al doilea moment al unei distributii. Asimetria poate fi masurata si prin
al treilea moment (=numaratorul) impartit la abaterea standard la cub:
Populatie: s k
(x ) 3
3
Esantion: s k
(x x) 3
s3
-pentru date grupate:
Populatie: s k
f (x ) 3
3
12
Esantion: s k
f (x x) 3
s3
Pentru distributii simetrice, s k 0 .
2)aplatizarea=KURTOSIS
Aplatizarea se masoara prin al patrulea moment al unei distributii (=numaratorul) impartit la abaterea
standard la puterea a 4-a:
Populatie:
(x ) 4
4
Esantion:
(x x) 4
s4
-pentru date grupate:
13
Populatie:
f (x ) 4
4
Esantion:
f (x x) 4
s4
14