Sunteți pe pagina 1din 57

SEMINARUL 1

- Determinarea frecvențelor -


(1) Se dau datele din tabelul 1 privind nota la bacalaureat (X) pentru un grup
de elevi din orașul Sibiu. Se cere:
a) Să se precizeze care sunt conceptele de bază ale statisticii, respectiv care este
colectivitatea statistică, eșantionul, unitatea statistică (simplă) și caracteristica
statistică analizată.
Conceptele de bază ale statisticii sunt:
 colectivitatea statistică: elevii din orașul Sibiu care au dat bacalaureatul
 eşantionul: 40 elevi din cei care au dat bacalaureatul
 unitatea statistică (simplă): elevul
 caracteristica statistică: nota la bacalaureat (X).
b) Considerând gruparea datelor realizată pe intervale de variație (se va discuta la
Cursul 2) prezentată în tabelul 2, să se calculeze frecvenţa absolută şi relativă a
fiecărui interval (exprimată atât ca proporție cât și ca procent) precum şi
frecvenţa absolută cumulată crescător.
Tabelul 1
Elev Nota la Bacalaureat, X Elev Nota la Bacalaureat, X Elev Nota la Bacalaureat, X
1 10 15 9,25 29 8,76
2 8,03 16 8,77 30 8,47
3 9,37 17 8,13 31 9,22
4 9,25 18 8,26 32 7,85
5 8,9 19 8,84 33 7,27
6 7,05 20 8,59 34 9,78
7 9,1 21 9,62 35 9,00
8 9,34 22 8,48 36 8,83
9 8,52 23 8,34 37 10
10 8,85 24 8,06 38 8,69
11 9,12 25 9,13 39 8,11
12 8,6 26 9,48 40 8,5
13 8,65 27 7,75
14 7,88 28 9,33
Tabelul 2
Nr. Intervale de Frecvenţa Frecvenţa Frecvenţa Frecvenţa absolută
interv. variație absolută, ni relativă, ni* relativă, ni*% cumulată crescător, Fci
1 (7,00 – 7,50]
2 (7,50 – 8,00]
3 (8,00 – 8,50]
4 (8,50 – 9,00]
5 (9,00 – 9,50]
6 (9,50 – 10,00]
Suma n= 40 elevi 1,00 100% -

n∗ = n∗% = 100 (%)


Fci = n
n =n n∗ = 1 n∗% = 100 (%)
Tabelul este util pentru determinarea frecvențelor absolute pentru fiecare interval:
Elev Nota la Bacalaureat, X Elev Nota la Bacalaureat, X Elev Nota la Bacalaureat, X
1 10 15 9,25 29 8,76
2 8,03 16 8,77 30 8,47
3 9,37 17 8,13 31 9,22
4 9,25 18 8,26 32 7,85
5 8,9 19 8,84 33 7,27
6 7,05 20 8,59 34 9,78
7 9,1 21 9,62 35 9,00
8 9,34 22 8,48 36 8,83
9 8,52 23 8,34 37 10
10 8,85 24 8,06 38 8,69
11 9,12 25 9,13 39 8,11
12 8,6 26 9,48 40 8,5
13 8,65 27 7,75
14 7,88 28 9,33
Rezolvare:
Nr. Intervale de variație Frecvenţa Frecvenţa Frecvenţa Frecvenţa absolută
interv. absolută, ni relativă, ni* relativă, ni*% cumulată crescător, Fci
1 (7,00 – 7,50] 2 0,05 5% 2
2 (7,50 – 8,00] 3 0,075 7,5% 2+3=5
3 (8,00 – 8,50] 9 0,225 22,5% 5 + 9 = 14
4 (8,50 – 9,00] 12 0,3 30% 14 + 12 = 26
5 (9,00 – 9,50] 10 0,25 25% 26 + 10 = 36
6 (9,50 – 10,00] 4 0,1 10% 36 + 4 = 40
Suma n=40 elevi 1,00 100% -

n∗ = n∗% = 100 (%)


Fci = n
n =n n∗ = 1 n∗% = 100 (%)
(2) Se consideră reprezentările grafice (se va discuta la cursul 2) din figura de mai
jos, care prezintă distribuţia unor studenţi după notele la un examen. Se cere:
Graficul prin coloane
Poligonul frecvențelor

a) Să se prezinte tabelar distribuția studenților după notele (rezultatele) obținute la


examen și să se specifice care sunt frecvențele absolute.
b) Să se determine frecvenţele relative (ca proporție și procent) și frecvenţele
absolute și relative cumulate crescător.
ni ni ni ni
a+b) ni*  r

n
ni* %  r
100  100, %
n
i 1
i n i
n
i 1

r
Fci   ni
i 1
c) Cât la sută dintre (procentul de) studenți au obținut nota peste 7 ? Câţi studenți
îndeplinesc această condiţie?
Procentul studenților care au obținut nota peste 7 este de 55% =38%+9%+8% (col.
5) sau 55%=100%-45% (col. 6)
Această condiţie este îndeplinită de 42+10+9=61 studenți (coloana 2) sau 110-
49=61 studenți (coloana 3)
SEMINARUL 2
- Prelucrarea primară a datelor -


(1) Se consideră următoarele date privind rezultatele probei
“Săritura în lungime de pe loc“ (cm) la disciplina Educație
fizică și sport, pentru studenţii din anul I, grupa 11x.
Student Săritura în lungime (cm) Student Săritura în lungime (cm)
1 190 16 260
2 210 17 220
3 225 18 220
4 220 19 215
5 210 20 240
6 215 21 260
7 210 22 200
8 215 23 240
9 210 24 215
10 190 25 210
11 210 26 225
12 210 27 225
13 225 28 220
14 230 29 225
15 235 30 230
a) Să se precizeze care sunt conceptele de bază ale statisticii, în
acest exemplu:
 colectivitatea statistică: studenţii din anul I

 eșantionul: grupa 11x sau 30 studenți

 unitatea statistică (simplă): studentul

 caracteristica statistică analizată: săritura în lungime de pe loc

b) Să se facă gruparea datelor pe intervale de variație continuă.

 Amplitudinea, A= xmax-xmin = 260-190 = 70 cm

 Numărul de intervale (s-a folosit formula lui Sturges):


r (sau k)=1+3,322 lg 30 =5,907 6 intervale
 Mărimea intervalului:
A x −x 70
h= = = = 11,66 ≈ 12 cm
r r 6
Student Săritura în lungime Student Săritura în lungime
(cm) (cm)
1 190 16 260
2 210 17 220
3 225 18 220
4 220 19 215
5 210 20 240
6 215 21 260
7 210 22 200
8 215 23 240
9 210 24 215
10 190 25 210
11 210 26 225
12 210 27 225
13 225 28 220
14 230 29 225
15 235 30 230
c) Să se calculeze frecvenţa absolută şi relativă a fiecărui
interval, precum şi frecvenţa absolută, respectiv relativă
cumulată crescător.

Nr. Intervale Frecvenţa Frecvenţa Frecvenţa Frecvenţa Frecvenţa


Interv de grupare absolută, relativă, relativă, absolută relativă cumulată
ni ni* ni*% cumulată crescător, F*ci
crescător, Fci

1 [190 – 202) 3 0,10 10% 3 0,10


2 [202 – 214) 7 0,23 23% 10=3+7 0,33=0,10+0,23
3 214 - 226 13 0,43 43% 23=10+13 0,76=0,33+0.43
4 226 - 238 3 0,10 10% 26=23+3 0,86=0,76+0,10
5 238 – 250 2 0,07 7% 28=26+2 0,93=0,86+0,07
6 [250 – 262) 2 0,07 7% 30=28+2 1,00=0,93+0,07
Suma n=30 st. 1,00 100% - -

d) Să se traseze histograma, poligonul frecvenţelor şi poligonul


frecvenţelor absolute cumulate crescător (graficul funcţiei de
repartiţie).
Excel

Minitab

Nr. Intervale de Frecvenţa


Interv grupare absolută, ni
1 [190 – 202) 3
2 202 - 214 7
3 214 - 226 13
4 226 - 238 3
5 238 – 250 2
6 [250 – 262) 2
Suma n=30 st.
Excel

Minitab

Nr. Intervale de Frecvenţa Valoarea centrală


Interv. grupare absolută, ni xi
1 [190 – 202) 3 196
2 202 - 214 7 208
3 214 - 226 13 220
4 226 - 238 3 232
5 238 – 250 2 244
6 [250 – 262) 2 256
Suma n=30 studenţi -
Nr. Interv Intervale de grupare Frecvenţa absolută
cumulată crescător, Fci

1 [190 – 202) 3
2 202 - 214 10
3 214 - 226 23
4 226 - 238 26
5 238 – 250 28
6 [250 – 262) 30
Suma -
(2) Se consideră reprezentarea grafică din figura 1 privind
repartiția/distribuţia studenţilor din grupa 11x, anul I de la
Facultatea de Inginerie, după timpul necesar pentru
rezolvarea unui test la Statistică (minute).

Figura 1

a) Să se precizeze care sunt conceptele de bază ale statisticii în


acest exemplu, respectiv colectivitatea statistică, eșantionul,
unitatea statistică simplă și caracteristica statistică.
Colectivitatea statistică este formată din studenţii anului I de la
Facultatea de Inginerie, eşantionul este grupa 11x, unitatea
statistică (simplă) este studentul şi caracteristica statistică
este timpul necesar pentru rezolvarea unui test la Statistică.

b) Ce tip de distribuţie s-a reprezentat grafic?


În graficul din figura 1 s-a reprezentat o distribuţie de frecvenţe
relative cumulate decrescător, exprimate ca proporție, F*di.

c) Explicaţi de ce valoarea de pe axa Oy, corespunzătoare


primului interval este 1.
Deoarece întotdeauna frecvenţa cumulată descrescător a
primului interval coincide cu suma frecvenţelor din care s-au
calculat cumulatele.
În cazul nostru, frecvenţele fiind relative şi exprimate ca
proporție (prin coeficienţi), suma lor este 1.
d) Transformaţi distribuţia din fig. 1 într-o distribuţie de frecvenţe
relative exprimate ca proporție şi reprezentaţi-o grafic prin
intermediul histogramei.

Distribuţia de frecvenţe relative, exprimate ca proporție, este


evidenţiată în tabelul 1. Tabelul 1

Intervale de variație pentru Frecvența relativă Frecvența relativă, ni*


Timpul pentru rezolvare (min) cumulată descrescător, Fdi*
10 - 14 1,00 0,10 (0,10=1,00-0,90)
14 - 18 0,90 0,25 (0,25=0,90-0,65)
18 - 22 0,65 0,50 (0,50=0,65-0,15)
22 - 26 0,15 0,10 (0,10=0,15-0,05)
26 - 30 0,05 0,05 (0,05=0,10-0,05)
Histograma este reprezentată în figura 2.

Figura 2

e) Care este ponderea (procentul) studenţilor care au rezolvat


testul grilă în mai puţin de 18 minute? Dar în mai mult de 22
minute?
Ponderea studenţilor care au rezolvat testul în mai puţin de 18
minute este de 35%=0,35x100 (0,10+0,25=0,35).
Ponderea studenţilor care au rezolvat testul în mai mult de 22
minute este de 15%=0,15x100 (0,10+0,05=0,15) sau (1-
0,85=0,15).

Intervale de variație pentru Frecvența Frecvența relativă cumulată


timpul necesar rezolvării relativă, crescător, Fci*
testului, min ni*
10 - 14 0,10 0,10
14 - 18 0,25 0,35 (0,35=0,10+0,25)
18 - 22 0,50 0,85 (0,85=0,35+0,50)
22 - 26 0,10 0,95 (0,95=0,85+0,10)
26 - 30 0,05 1,00 (1,00=0,95+0,05)
Total 1,00 -
SEMINARUL 3
- Indicatorii tendinței centrale -


(1) Vechimea în muncă (în ani) pentru 20 de angajaţi a unei
organizații se prezintă astfel (date convenţionale): 7, 12, 5, 3,
2, 8, 10, 12, 6, 9, 4, 2, 7, 8, 3, 11, 14, 10, 9, 7.
a) Se cere să se calculeze media, mediana și moda fără a se
grupa datele (serii simple). n

 Media aritmetică  xi
i1
X
n
7 + 12 + 5 + 3 + 2 + 8 + 10 + 12 + 6 + 9 + 4 + 2 + 7 + 8 + 3 + 11 + 14 + 10 + 9 + 7
x= = 7.45 ani
20

 Mediana
- Se ordonează crescător datele statistice: 2, 2, 3, 3, 4, 5, 6, 7, 7,
7, 8, 8, 9, 9, 10, 10, 11, 12, 12, 14
- Se determină locul medianei:
n + 1 20 + 1
L Me = = = 10,5
2 2
Rezultă că locul medianei se află între cei doi termeni centrali ai
seriei, respectiv al 10-lea şi al 11-lea.
- Se determină valoarea medianei, ca medie aritmetică simplă a
celor doi termeni din centrul seriei:
x +x 7+8
Me = = = 7,5 ani
2 2
 Moda
Mo=7 ani deoarece această valoare apare de cele mai multe ori
sau altfel spus are cea mai mare frecvență absolută (ni),
nmax=3.

b) Se cere să se calculeze media, mediana și moda grupând


datele pe variante.
Vechimea în Număr Frecvența absolută xi x ni
muncă, xi angajați, ni cumulată crescător, Fci
2 2 2 2x2
3 2 4 3x2
4 1 5 4x1
5 1 6 5x1
6 1 7 6x1
7 3 10 7x3
8 2 12 8x2
9 2 14 9x2
10 2 16 10x2
11 1 17 11x1
12 2 19 12x2
14 1 20 14x1
Suma 20 - 149
 Media aritmetică
7, 12, 5, 3, 2, 8, 10, 12, 6, 9, 4, 2, 7, 8, 3, 11, 14, 10, 9, 7.
∑ x n
x=
∑ n
= = =7,45

 Mediana
 Se calculează frecvenţa absolută cumulată crescător, Fci
 Se identifică grupa (r) care conţine mediana, numită varianta
mediană în cazul grupării pe variante.
Pentru aceasta se determină care este grupa a cărei frecvenţă
absolută cumulată crescător, Fci este prima mai mare decât
locul medianei L(Me)
Frecvenţa absolută cumulată crescător mai mare decât
L(Me)=(20+1)/2 = 10.5 este Fci=12 şi prin urmare varianta
mediană este „8 ani“.
 Se determină valoarea efectivă a medianei
În cazul grupării pe variante, mediana este acea valoare care se
găsește în dreptul frecvenţei absolute cumulate crescător
care este prima mai mare decât locul medianei. Prin urmare,
valoarea efectivă a medianei este chiar varianta mediană deci
Me=8 ani.
 Moda
Pentru gruparea pe variante moda este acea variantă/valoare a
caracteristicii care prezintă frecvenţa absolută cea mai mare,
nmax, în acest caz Mo=7 ani.
(2) Se consideră reprezentările grafice din figura de mai jos, care
prezintă distribuţia unor studenţi după notele la un examen.

Graficul prin
Poligonul coloane
frecvențelor

Obs. Tabelul cu distribuția studenților după notele (rezultatele)


obținute la examen precum și frecvențele corespunzătoare au
fost determinate în Seminarul 1.
Se cere să se determine indicatorii tendinței centrale: media
aritmetică, mediana și moda.
Frecvența absolută
Nota obţinută la Nr. studenţi,
cumulată crescător,
examen, xi ni
Fci
4 2 2
5 12 14
6 13 27
7 22 49
8 42 91
9 10 101
10 9 110
Total n=110 -
 Media aritmetică
Formula pentru determinarea mediei aritmetice în cazul
datelor grupate pe variante este:

x= ∑
=

= = = 7,42

 Moda
Mo=8 deoarece are această valoare apare de cele mai multe
ori sau altfel spus are cea mai mare frecvență absolută,
nmax=42.
 Mediana
 Se determină locul medianei:
n + 1 110 + 1
L Me = = = 55,5
2 2
 Se determină frecvența absolută cumulată crescător, Fci
 Se identifică grupa care corespunde medianei, respectiv
varianta mediană: este acea grupă a cărei frecvenţă absolută
cumulată crescător, Fci este prima mai mare decât locul
medianei L(Me); Fci  L(Me), 91  55,5

 Se determină valoarea medianei, care la gruparea pe variante


este chiar varianta mediană: Me =8
(3) Se consideră datele statistice, prezentate în tabelul de mai
jos, referitoare la numărul de minute necesare unor studenți
din anul I de la facultatea de Inginerie, pentru rezolvarea unui
test grilă la disciplina Statistică.
Valoarea Frecvența
Numărul de minute Numărul de
centrală ni  xi absolută
necesare rezolvării studenți
xi cumulată
testului, xi ni
crescător, Fci
10 - 14 10 12 120 10
14 - 18 25 16 400 35
18 - 22 50 20 1000 85
22 - 26 10 24 240 95
26 - 30 5 28 140 100
Total n=100 - 1900 -

Obs. Numărul de intervale a fost ales la întâmplare.


Să se determine indicatorii statistici ai tendinței de centrare.

 Media aritmetică

 Mediana
- Se determină locul medianei:
- Se determină frecvența absolută cumulată crescător, Fci
- Se identifică grupa care corespunde medianei, respectiv
intervalul median: este acea grupă a cărei frecvenţă absolută
cumulată crescător, Fci este prima mai mare decât locul
medianei L(Me).
Intervalul median, I(Me) = 18 - 22 pentru că este prima grupă
care are Fci  L(Me), 85  50,5.
‒ Se determină valoarea medianei
⋅ ∑ ∑ ,
Me = x + h ⋅ = 18 + (22 − 18) ⋅

Me = 19,24
 Moda
‒ În dreptul frecvenței absolute maxime, nmax=50 se găsește
intervalul modal, I(Mo)=18-22
1
Mo  x 0  hMo 
1   2
‒ Se calculează Mo 1  nMo  nMo1
 2  nMo  nMo1
SEMINARUL 4
- Indicatorii variației și formei -


(1) Se consideră reprezentările grafice din figura de mai jos, care
prezintă distribuţia unor studenţi după rezultatele (notele)
obținute la un examen.
Se cere să se determine indicatorii variației și formei.

Graficul prin
Poligonul frecvențelor coloane
Observații:
1. Tabelul cu distribuția Nota obţinută la Nr. studenţi,
studenților după notele examen, xi ni
(rezultatele) obținute la 4 2
examen precum și 5 12
frecvențele 6 13
corespunzătoare se
7 22
găsesc în Seminarul 1.
8 42
2. Indicatorii tendinței de
9 10
centrare au fost
calculați în Seminarul 3: 10 9
media aritmetică=7,42; Total n=110
moda=8 și mediana=8.
Indicatorii variaţiei

 Amplitudinea absolută: A = xmax – xmin = 10 – 4 = 6

 Abaterea medie liniară (absolută):


r
 xi  x  ni 126,96
i 1
d r
  1,15
110
 ni
i 1

Valorile notei la examen se abat în medie cu 1,15 în ambele


sensuri (±1,15) faţă de nota medie. Având în vedere valoarea
mediei (7,42), abaterea este nesemnificativă.
 Varianţa/dispersia
Deoarece volumul eșantionului este n=110, adică este vorba
despre un eșantion de volum mare, pentru calculul dispersiei
și abaterii standard se va considera la numitor termenul ”n”.
∑ x −x n 222,81
σ = = = 2,03
∑ n 110

Nota Număr x −x x −x n x −x x −x n
obținută, xi studenți, ni
4 2 3,42 6,84 11,7 23,4
5 12 2,42 29,04 5,86 70,28
6 13 1,42 18,46 2,02 26,21
7 22 0,42 9,24 0,18 3,88
8 42 0,58 24,36 0,34 14,13
9 10 1,58 15,80 2,50 25,00
10 9 2,58 23,22 6,66 59,91
Total 110 - 126,96 - 222,81
 Abaterea standard/abaterea medie pătratică

∑ x −x n
σ= = 1,42
∑ n
 Coeficientul de variaţie:
σ 1,42
Cv = ⋅ 100 % = 100 = 19,14 %
x 7,42

Valoarea coeficientului de variaţie indică faptul că:


 variația datelor este relativ mică, pentru că 17% < Cν < 35%

 colectivitatea este omogenă, pentru că Cν < 35% (17% < Cν <


35%)
 media este moderat reprezentativă/semnificativă, pentru că
17% < Cν < 35%.
Indicatorii formei

 Asimetria
1) Coeficientul de asimetrie a lui Pearson
,
C = = = −0,41
,
Distribuţia este asimetrică negativ/spre stânga, adică coada
distribuţiei este mai lungă spre valorile mici, pentru că
coeficientul este negativ și Cas  (-0,3 ... +0,3).

2) Coeficientul de asimetrie Pearson β1  32


1  3
∑ x −x n 222,81 2
μ = = = 2,03
∑ n 110
∑ x −x n −86,6
μ = = = −0,79
∑ n 110
Nota Număr x −x x −x x −x n x −x x −x n
obținută, xi studenți, ni
4 2 -3,42 11,7 23,4 -40,01 -80,02
5 12 -2,42 5,86 70,28 -14,18 -170,16
6 13 -1,42 2,02 26,21 -2,86 -37,18
7 22 -0,42 0,18 3,88 -0,08 -1,76
8 42 0,58 0,34 14,13 0,20 8,4
9 10 1,58 2,50 25,00 3,95 39,5
10 9 2,58 6,66 59,91 17,18 154,62
Total 110 - - 222,81 - -86,6

În cazul unei distribuţii simetrice, 1=0, iar în cazul unei distribuţii


asimetrice, 1 0.
Sensul asimetriei este dat de semnul lui μ3 şi anume μ3  0 în
cazul distribuţiilor cu asimetrie la dreapta (pozitiv) şi μ3 < 0 în
cazul distribuţiilor cu asimetrie la stânga, deci în acest caz
este asimetrică negativ.
μ −0,79 0,62
β = = = = 0,06
μ 2,03 8,37
3) Coeficientul de asimetrie Fisher, γ1 (Skewness în Minitab)
μ μ μ −0,79 −0,79
γ = β = = = = = = −0,28
μ μ σ 1,42 2,86

Deoarece coeficientul de asimetrie al lui Fisher γ1 < 0 distribuția


este asimetrică negativ/spre stânga.
Observație: Analiza asimetriei se poate face și astfel:
Varianta 1 (orientativă): din analiza
graficului prin coloane/
poligonului de frecvențe se
observă că distribuția are “coada“
mai lungă spre valorile mici, deci
este asimetrică negativ sau
asimetrică spre stânga.
Varianta 2: Deoarece Mo > X distribuția este asimetrică
negativ sau asimetrică spre stânga.

X  7,42
Me  8

Mo  8

Prin urmare, distribuţia are mai multe valori extrem de mici şi


mai puţine extrem de mari comparativ cu distribuţia
normală (coada/brațul mai lungă a distribuţiei spre valorile
mici) care are aceeaşi medie şi dispersie.
 Aplatizarea
4
1) Coeficientul de aplatizare Pearson, β2 2 
 22

2) Coeficientul de aplatizare Fisher, γ2 (Kurtosis în Minitab)

4 
 x '
i  x  n
4
i
2 
 x '
i 
2
 x  ni
 ni 
 2   2  3  42  3
n i

2

∑ x −x n 1206,34
μ = = = 10,97
∑ n 110

4 10,97
2    2,66  2   2 - 3  2,66 - 3  - 0,34
 22 2,03 2
Nota Număr x −x x −x x −x n x −x x −x n
obținută, xi studenți, ni
4 2 -3,42 11,7 23,4 136,89 273,78
5 12 -2,42 5,86 70,28 34,34 412,08
6 13 -1,42 2,02 26,21 4,08 53,04
7 22 -0,42 0,18 3,88 0,03 0,66
8 42 0,58 0,34 14,13 0,12 5,04
9 10 1,58 2,50 25,00 6,25 62,5
10 9 2,58 6,66 59,91 44,36 399,24
Total 110 - - 222,81 - 1206,34

β2 < 3 (sau γ2 < 0) – distribuţia


este mai puţin boltită/ascuțită
decât cea normală şi se
numeşte platikurtică, având
un “vârf” mai aplatizat
(“turtit”) şi „cozi” mai subțiri
decât la cea normală.
(2) Se consideră datele din tabelul de mai jos reprezentând
gruparea pe intervale după “Vechimea în activitate” (ani),
pentru o selecție de 40 angajați din cadrul unei organizații.
Să se determine indicatorii variației și formei.
Grupe de angajați după Numărul de angajați
vechime (ani) (frecvența absolută), ni
2-8 6
8 - 14 5
14 - 20 8
20 - 26 14
26 - 32 4
32 - 38 3
Total 40
Indicatorii variaţiei

 Abaterea medie liniară (absolută), 𝐝̅ (tabelul 2):


Vechimea medie (tabelul 1) este:
r

x '
i
 ni
764
X i1
  19,1 ani
40
r

n
11
i

∑ x′ − x ⋅ n 283,8
d= = = 7,095 ani
∑ n 40

Valorile vechimei în activitate se abat în medie cu 7,095 în


ambele sensuri (± 7,095) faţă de vechimea medie. Având în
vedere valoarea mediei (19,1), abaterea este semnificativă.
Tabelul 1

x i inf  x i sup
x i' 
2

Tabelul 2
 Varianţa/dispersia (tabelul 3)
Deoarece volumul eșantionului este n=40, adică este vorba
despre un eșantion de volum mare, pentru calculul dispersiei
și abaterii standard se va considera la numitor termenul ”n”.
∑ x′ − x n 2919,6
σ = = = 72,99
∑ n 40
Tabelul 3
 Abaterea standard/abaterea medie pătratică
∑ x′ − x n
σ= = 72,99 = 8,54 ani
∑ ni

 Coeficientul de variaţie:
σ 8,54
Cv = ⋅ 100 % = 100 = 44.71 %
x 19,1

Valoarea coeficientului de variaţie indică faptul că:


 variația/împrăștierea/dispersarea datelor este mare, pentru
că 35%<Cv<50%;
 colectivitatea este eterogenă, pentru că 35%<Cv<50%;

 media este relativ reprezentativă/semnificativă, pentru că


35% < Cv < 50%.
Indicatorii formei

 Asimetria
1) Coeficientul de asimetrie a lui Pearson
, ,
C = = = −0,36
,
Distribuţia este asimetrică negativ/spre stânga, adică coada
distribuţiei este mai lungă spre valorile mici, pentru că
coeficientul este negativ și Cas  (-0,3 ... +0,3).

2) Coeficientul de asimetrie Pearson β1  32


1  3
∑ x′ − x n 2919,6 2
μ = = = 72,99
∑ n 40
∑ x′ − x n −2779,88
μ = = = −69,5
∑ n 40
Moda
În dreptul frecvenței absolute maxime, nmax=14 se găsește
intervalul modal, I(Mo)=20-26
Se calculează Mo Δ
Mo = x + h ⋅
Δ +Δ
Δ =n −n
Δ =n −n

14 − 8 6
Mo = 20 + (26 − 20) = 20 + 6 = 22,25
14 − 8 + 14 − 4 16
Tabelul 4

Tabelul 5
În cazul unei distribuţii simetrice, 1=0, iar în cazul unei distribuţii
asimetrice, 1 0.
Sensul asimetriei este dat de semnul lui μ3 şi anume μ3  0 în
cazul distribuţiilor cu asimetrie la dreapta (pozitiv) şi μ3 < 0 în
cazul distribuţiilor cu asimetrie la stânga, deci în acest caz
este asimetrică negativ.
μ −69,5 4830,25
β = = = = 0,012
μ 72.99 388857,15
3) Coeficientul de asimetrie Fisher, γ1 (Skewness în Minitab)
μ μ μ −69,5 −69,5
γ = β = = = = = = −0,11
μ μ σ 8, 54 622,83

Deoarece coeficientul de asimetrie al lui Fisher γ1 < 0 distribuția


este asimetrică negativ/spre stânga.
 Aplatizarea
4
2 
1) Coeficientul de aplatizare Pearson, β2  22
2) Coeficientul de aplatizare Fisher, γ2 (Kurtosis în Minitab)
4
 2  2  3  3
2
2

∑ x′ − x n 492232,8
μ = = = 12305,82
∑ n 40
, ,
β = = = = 2,31
, ,

γ = β − 3 = 2,1 − 3 = − 0,69
β2 < 3 (sau γ2 < 0) – distribuţia este mai puţin boltită/ascuțită
decât cea normală şi se numeşte platikurtică, având un “vârf”
mai aplatizat (“turtit”) şi „cozi” mai subțiri decât la cea normală.

S-ar putea să vă placă și