Documente Academic
Documente Profesional
Documente Cultură
Seminar 1-4
Seminar 1-4
- Determinarea frecvențelor -
(1) Se dau datele din tabelul 1 privind nota la bacalaureat (X) pentru un grup
de elevi din orașul Sibiu. Se cere:
a) Să se precizeze care sunt conceptele de bază ale statisticii, respectiv care este
colectivitatea statistică, eșantionul, unitatea statistică (simplă) și caracteristica
statistică analizată.
Conceptele de bază ale statisticii sunt:
colectivitatea statistică: elevii din orașul Sibiu care au dat bacalaureatul
eşantionul: 40 elevi din cei care au dat bacalaureatul
unitatea statistică (simplă): elevul
caracteristica statistică: nota la bacalaureat (X).
b) Considerând gruparea datelor realizată pe intervale de variație (se va discuta la
Cursul 2) prezentată în tabelul 2, să se calculeze frecvenţa absolută şi relativă a
fiecărui interval (exprimată atât ca proporție cât și ca procent) precum şi
frecvenţa absolută cumulată crescător.
Tabelul 1
Elev Nota la Bacalaureat, X Elev Nota la Bacalaureat, X Elev Nota la Bacalaureat, X
1 10 15 9,25 29 8,76
2 8,03 16 8,77 30 8,47
3 9,37 17 8,13 31 9,22
4 9,25 18 8,26 32 7,85
5 8,9 19 8,84 33 7,27
6 7,05 20 8,59 34 9,78
7 9,1 21 9,62 35 9,00
8 9,34 22 8,48 36 8,83
9 8,52 23 8,34 37 10
10 8,85 24 8,06 38 8,69
11 9,12 25 9,13 39 8,11
12 8,6 26 9,48 40 8,5
13 8,65 27 7,75
14 7,88 28 9,33
Tabelul 2
Nr. Intervale de Frecvenţa Frecvenţa Frecvenţa Frecvenţa absolută
interv. variație absolută, ni relativă, ni* relativă, ni*% cumulată crescător, Fci
1 (7,00 – 7,50]
2 (7,50 – 8,00]
3 (8,00 – 8,50]
4 (8,50 – 9,00]
5 (9,00 – 9,50]
6 (9,50 – 10,00]
Suma n= 40 elevi 1,00 100% -
r
Fci ni
i 1
c) Cât la sută dintre (procentul de) studenți au obținut nota peste 7 ? Câţi studenți
îndeplinesc această condiţie?
Procentul studenților care au obținut nota peste 7 este de 55% =38%+9%+8% (col.
5) sau 55%=100%-45% (col. 6)
Această condiţie este îndeplinită de 42+10+9=61 studenți (coloana 2) sau 110-
49=61 studenți (coloana 3)
SEMINARUL 2
- Prelucrarea primară a datelor -
(1) Se consideră următoarele date privind rezultatele probei
“Săritura în lungime de pe loc“ (cm) la disciplina Educație
fizică și sport, pentru studenţii din anul I, grupa 11x.
Student Săritura în lungime (cm) Student Săritura în lungime (cm)
1 190 16 260
2 210 17 220
3 225 18 220
4 220 19 215
5 210 20 240
6 215 21 260
7 210 22 200
8 215 23 240
9 210 24 215
10 190 25 210
11 210 26 225
12 210 27 225
13 225 28 220
14 230 29 225
15 235 30 230
a) Să se precizeze care sunt conceptele de bază ale statisticii, în
acest exemplu:
colectivitatea statistică: studenţii din anul I
Minitab
Minitab
1 [190 – 202) 3
2 202 - 214 10
3 214 - 226 23
4 226 - 238 26
5 238 – 250 28
6 [250 – 262) 30
Suma -
(2) Se consideră reprezentarea grafică din figura 1 privind
repartiția/distribuţia studenţilor din grupa 11x, anul I de la
Facultatea de Inginerie, după timpul necesar pentru
rezolvarea unui test la Statistică (minute).
Figura 1
Figura 2
(1) Vechimea în muncă (în ani) pentru 20 de angajaţi a unei
organizații se prezintă astfel (date convenţionale): 7, 12, 5, 3,
2, 8, 10, 12, 6, 9, 4, 2, 7, 8, 3, 11, 14, 10, 9, 7.
a) Se cere să se calculeze media, mediana și moda fără a se
grupa datele (serii simple). n
Media aritmetică xi
i1
X
n
7 + 12 + 5 + 3 + 2 + 8 + 10 + 12 + 6 + 9 + 4 + 2 + 7 + 8 + 3 + 11 + 14 + 10 + 9 + 7
x= = 7.45 ani
20
Mediana
- Se ordonează crescător datele statistice: 2, 2, 3, 3, 4, 5, 6, 7, 7,
7, 8, 8, 9, 9, 10, 10, 11, 12, 12, 14
- Se determină locul medianei:
n + 1 20 + 1
L Me = = = 10,5
2 2
Rezultă că locul medianei se află între cei doi termeni centrali ai
seriei, respectiv al 10-lea şi al 11-lea.
- Se determină valoarea medianei, ca medie aritmetică simplă a
celor doi termeni din centrul seriei:
x +x 7+8
Me = = = 7,5 ani
2 2
Moda
Mo=7 ani deoarece această valoare apare de cele mai multe ori
sau altfel spus are cea mai mare frecvență absolută (ni),
nmax=3.
Mediana
Se calculează frecvenţa absolută cumulată crescător, Fci
Se identifică grupa (r) care conţine mediana, numită varianta
mediană în cazul grupării pe variante.
Pentru aceasta se determină care este grupa a cărei frecvenţă
absolută cumulată crescător, Fci este prima mai mare decât
locul medianei L(Me)
Frecvenţa absolută cumulată crescător mai mare decât
L(Me)=(20+1)/2 = 10.5 este Fci=12 şi prin urmare varianta
mediană este „8 ani“.
Se determină valoarea efectivă a medianei
În cazul grupării pe variante, mediana este acea valoare care se
găsește în dreptul frecvenţei absolute cumulate crescător
care este prima mai mare decât locul medianei. Prin urmare,
valoarea efectivă a medianei este chiar varianta mediană deci
Me=8 ani.
Moda
Pentru gruparea pe variante moda este acea variantă/valoare a
caracteristicii care prezintă frecvenţa absolută cea mai mare,
nmax, în acest caz Mo=7 ani.
(2) Se consideră reprezentările grafice din figura de mai jos, care
prezintă distribuţia unor studenţi după notele la un examen.
Graficul prin
Poligonul coloane
frecvențelor
= = = 7,42
Moda
Mo=8 deoarece are această valoare apare de cele mai multe
ori sau altfel spus are cea mai mare frecvență absolută,
nmax=42.
Mediana
Se determină locul medianei:
n + 1 110 + 1
L Me = = = 55,5
2 2
Se determină frecvența absolută cumulată crescător, Fci
Se identifică grupa care corespunde medianei, respectiv
varianta mediană: este acea grupă a cărei frecvenţă absolută
cumulată crescător, Fci este prima mai mare decât locul
medianei L(Me); Fci L(Me), 91 55,5
Media aritmetică
Mediana
- Se determină locul medianei:
- Se determină frecvența absolută cumulată crescător, Fci
- Se identifică grupa care corespunde medianei, respectiv
intervalul median: este acea grupă a cărei frecvenţă absolută
cumulată crescător, Fci este prima mai mare decât locul
medianei L(Me).
Intervalul median, I(Me) = 18 - 22 pentru că este prima grupă
care are Fci L(Me), 85 50,5.
‒ Se determină valoarea medianei
⋅ ∑ ∑ ,
Me = x + h ⋅ = 18 + (22 − 18) ⋅
Me = 19,24
Moda
‒ În dreptul frecvenței absolute maxime, nmax=50 se găsește
intervalul modal, I(Mo)=18-22
1
Mo x 0 hMo
1 2
‒ Se calculează Mo 1 nMo nMo1
2 nMo nMo1
SEMINARUL 4
- Indicatorii variației și formei -
(1) Se consideră reprezentările grafice din figura de mai jos, care
prezintă distribuţia unor studenţi după rezultatele (notele)
obținute la un examen.
Se cere să se determine indicatorii variației și formei.
Graficul prin
Poligonul frecvențelor coloane
Observații:
1. Tabelul cu distribuția Nota obţinută la Nr. studenţi,
studenților după notele examen, xi ni
(rezultatele) obținute la 4 2
examen precum și 5 12
frecvențele 6 13
corespunzătoare se
7 22
găsesc în Seminarul 1.
8 42
2. Indicatorii tendinței de
9 10
centrare au fost
calculați în Seminarul 3: 10 9
media aritmetică=7,42; Total n=110
moda=8 și mediana=8.
Indicatorii variaţiei
Nota Număr x −x x −x n x −x x −x n
obținută, xi studenți, ni
4 2 3,42 6,84 11,7 23,4
5 12 2,42 29,04 5,86 70,28
6 13 1,42 18,46 2,02 26,21
7 22 0,42 9,24 0,18 3,88
8 42 0,58 24,36 0,34 14,13
9 10 1,58 15,80 2,50 25,00
10 9 2,58 23,22 6,66 59,91
Total 110 - 126,96 - 222,81
Abaterea standard/abaterea medie pătratică
∑ x −x n
σ= = 1,42
∑ n
Coeficientul de variaţie:
σ 1,42
Cv = ⋅ 100 % = 100 = 19,14 %
x 7,42
Asimetria
1) Coeficientul de asimetrie a lui Pearson
,
C = = = −0,41
,
Distribuţia este asimetrică negativ/spre stânga, adică coada
distribuţiei este mai lungă spre valorile mici, pentru că
coeficientul este negativ și Cas (-0,3 ... +0,3).
X 7,42
Me 8
Mo 8
4
x '
i x n
4
i
2
x '
i
2
x ni
ni
2 2 3 42 3
n i
2
∑ x −x n 1206,34
μ = = = 10,97
∑ n 110
4 10,97
2 2,66 2 2 - 3 2,66 - 3 - 0,34
22 2,03 2
Nota Număr x −x x −x x −x n x −x x −x n
obținută, xi studenți, ni
4 2 -3,42 11,7 23,4 136,89 273,78
5 12 -2,42 5,86 70,28 34,34 412,08
6 13 -1,42 2,02 26,21 4,08 53,04
7 22 -0,42 0,18 3,88 0,03 0,66
8 42 0,58 0,34 14,13 0,12 5,04
9 10 1,58 2,50 25,00 6,25 62,5
10 9 2,58 6,66 59,91 44,36 399,24
Total 110 - - 222,81 - 1206,34
x '
i
ni
764
X i1
19,1 ani
40
r
n
11
i
∑ x′ − x ⋅ n 283,8
d= = = 7,095 ani
∑ n 40
x i inf x i sup
x i'
2
Tabelul 2
Varianţa/dispersia (tabelul 3)
Deoarece volumul eșantionului este n=40, adică este vorba
despre un eșantion de volum mare, pentru calculul dispersiei
și abaterii standard se va considera la numitor termenul ”n”.
∑ x′ − x n 2919,6
σ = = = 72,99
∑ n 40
Tabelul 3
Abaterea standard/abaterea medie pătratică
∑ x′ − x n
σ= = 72,99 = 8,54 ani
∑ ni
Coeficientul de variaţie:
σ 8,54
Cv = ⋅ 100 % = 100 = 44.71 %
x 19,1
Asimetria
1) Coeficientul de asimetrie a lui Pearson
, ,
C = = = −0,36
,
Distribuţia este asimetrică negativ/spre stânga, adică coada
distribuţiei este mai lungă spre valorile mici, pentru că
coeficientul este negativ și Cas (-0,3 ... +0,3).
14 − 8 6
Mo = 20 + (26 − 20) = 20 + 6 = 22,25
14 − 8 + 14 − 4 16
Tabelul 4
Tabelul 5
În cazul unei distribuţii simetrice, 1=0, iar în cazul unei distribuţii
asimetrice, 1 0.
Sensul asimetriei este dat de semnul lui μ3 şi anume μ3 0 în
cazul distribuţiilor cu asimetrie la dreapta (pozitiv) şi μ3 < 0 în
cazul distribuţiilor cu asimetrie la stânga, deci în acest caz
este asimetrică negativ.
μ −69,5 4830,25
β = = = = 0,012
μ 72.99 388857,15
3) Coeficientul de asimetrie Fisher, γ1 (Skewness în Minitab)
μ μ μ −69,5 −69,5
γ = β = = = = = = −0,11
μ μ σ 8, 54 622,83
∑ x′ − x n 492232,8
μ = = = 12305,82
∑ n 40
, ,
β = = = = 2,31
, ,
γ = β − 3 = 2,1 − 3 = − 0,69
β2 < 3 (sau γ2 < 0) – distribuţia este mai puţin boltită/ascuțită
decât cea normală şi se numeşte platikurtică, având un “vârf”
mai aplatizat (“turtit”) şi „cozi” mai subțiri decât la cea normală.