Sunteți pe pagina 1din 12

LUCRU INDIVIDUAL

- REZOLVARE -
Statistica descriptivă
- Date grupate -


Se dau următoarele date privind nota la bacalaureat (X) pentru 40 de elevi din
orașul Sibiu.
Se cere:
Nr. Intervale de Frecvenţa Frecvenţa În urma prelucrării secundare s-au obţinut
interv grupare absolută, absolută următorii indicatori statistici derivați :
. ni cumulată
crescător, Fci - amplitudinea: 2,95
1 (7,00 – 7,50] 2 - abaterea medie liniară: 0,5
2 (7,50 – 8,00] 3
- varianța (dispersia): 0,4
- abaterea medie pătratică (abaterea
3 (8,00 – 8,50] 9
standard): 0,64.
4 (8,50 – 9,00] 12 - coeficientul de asimetrie Pearson, β1: 0,16
5 (9,00 – 9,50] 10
- coeficientul de asimetrie Fisher, γ1: -0,38
- coeficientul de aplatizare Pearson, β2:
6 (9,50 – 4 2,75
10,00]
Suma n=40 elevi - - coeficientul de aplatizare Fisher, γ2: -0,25
a) Să se precizeze care sunt conceptele de bază ale statisticii: colectivitatea
statistică, eşantionul, unitatea statistică simplă şi caracteristica statistică.
b) Să se reprezinte grafic datele sub formă de histogramă și poligonul frecvenţelor.
c) Să se determine nota medie obținută la bacalaureat.
d) Să se precizeze care este intervalul median şi de ce.
e) Să se determine nota la bacalaureat care îi imparte pe cei 40 de elevi în 2 părți
egale.
f) Să se precizeze care este intervalul modal şi de ce.
g) Să se determine nota cea mai frecvent întâlnită la bacalaureat.
h) Să se specifice dacă distribuția este simetrică sau asimetrică (şi tipul asimetriei) şi
să se explice de ce.
i) Ce se poate spune despre aplatizarea distribuției și de ce.
j) Ce se poate spune despre variaţia datelor statistice și de ce.
k) Este omogenă colectivitatea ? De ce da sau de ce nu ?
l) Ce se poate spune despre reprezentativitatea mediei și de ce ?
a) Să se precizeze care sunt conceptele de bază ale statisticii: colectivitatea
statistică este elevii din orașul Sibiu, eşantionul este 40 elevi, unitatea statistică
simplă este elevul şi caracteristica statistică este nota la bacalaureat (X).
b) Să se reprezinte grafic datele sub formă de histogramă sau poligonul frecvenţelor.

Histograma Poligonul frecventelor


12

12
12 12
10

10
10
10
9
9
8

8
6

6
4
4

4
4 3
3 2
2

2
2
0

0
7,00 7,50 8,00 8,50 9,00 9,50 10,00 7,25 7,75 8,25 8,75 9,25 9,75
c) Să se determine nota medie obținută la bacalaureat.
Nr. Intervale de grupare Frecvenţa Valoarea centrală Produsul
interv. absolută, ni xi xi  ni
1 (7,00 – 7,50] 2 7,25 14,5
2 (7,50 – 8,00] 3 7,75 23,25
3 (8,00 – 8,50] 9 8,25 74,25
4 (8,50 – 9,00] 12 8,75 105
5 (9,00 – 9,50] 10 9,25 92,5
6 (9,50 – 10,00] 4 9,75 39
Suma n=40 elevi - 348,5
r

 i ni
x '
348,5 x i inf + x i sup
X= i =1
r
= = 8,7125 x =
'
i
40 2
 nii =1

Nota medie la bacalaureat este 8,71.


d) Să se precizeze care este intervalul median şi de ce.
• Se determină locul medianei: r

n i +1
1 r n + 1 40 + 1
L(Me) = i =1
= ( n i + 1) = = = 20,5
2 2 i =1 2 2

• Se identifică intervalul median, I(Me), adică grupa în care este inclusă mediana:
este prima grupă a cărei frecvenţă absolută cumulată crescător (Fci) este prima
mai mare decât locul medianei:
Intervalul median, I(Me) = (8,50 – 9,00) pentru că este prima grupă care are
Fci = 26  L(Me) = 20,5

e) Să se determine nota la bacalaureat care îi imparte pe cei 40 de elevi în 2 părți


egale
Nota care îi imparte pe cei 40 de elevi în 2 părți egale este 8,77 (jumătate au
obținut la Bacalaureat o notă sub 8,77 și jumătate peste 8,77 ) .
Nr. Intervale de grupare Frecvenţa Frecvenţa absolută
interv. absolută, ni cumulată crescător, Fci
1 (7,00 – 7,50] 2 2
2 (7,50 – 8,00] 3 5
3 (8,00 – 8,50] 9 14
4 (8,50 – 9,00] 12 26
5 (9,00 – 9,50] 10 36
6 (9,50 – 10,00] 4 40
Suma n=40 elevi -

1 r  Me - 1
  n i + 1 -  n i
2  i =1  i =1 = 8,50 + (9,00 - 8,50) 20,5 - 14 = 8,77
Me = x 0 + h Me
n Me 12
f) Să se precizeze care este intervalul modal şi de ce.
• se găseşte frecvenţa absolută maximă, nmax= 12
• în dreptul frecvenţei absolute maxime se găsește intervalul modal care este
I(Mo)= (8,50 – 9,00).
g) Să se determine care este nota cea mai frecvent întâlnită.
1
Mo = x 0 + hMo 
1 +  2
1 = nMo − nMo−1
 2 = nMo − nMo+1

(12 - 9) 3
Mo = 8,50 + (9,00 - 8,50) = 8,50 + 0,5 = 8,8
(12 - 9) + (12 - 10) 5
Nota cea mai des întâlnită la bacalaureat este 8,8.
h) Să se specifice dacă distribuția este simetrică sau asimetrică (şi tipul asimetriei) şi să
se explice de ce.
Varianta 1 – din histogramă sau poligonul frecvențelor se observă că distribuția are
coada mai lungă în partea stângă prin urmare este asimetrică negativ (asimetrică spre
stânga)
Varianta 2 – comparând indicatorii tendinței centrale (indică doar tipul asimetriei)
Deoarece Xഥ (=8,71) < Mo (=8,8) distribuţia este asimetrică negativ (asimetrică spre
stânga), adică coada distribuţiei este mai lungă spre valorile mici.
Varianta 3 – calculând indicatorii asimetriei
▪ Coeficientul de asimetrie Pearson Cas (folosit uzual) este:
xlj − Mo 8,71 − 8,8
Cas = = = −0,14
σ
ഥ 0,64
Distribuţia este moderat asimetrică negativ, pentru că -0,3 < Cas < 0
▪ Coeficientul de asimetrie Pearson (dat), β1 = 0,16
Distribuţia este asimetrică deoarece coeficientul de asimetrie 1  0 și anume
asimetrică negativ (la stânga) deoarece sensul asimetriei este dat de semnul lui μ3
(momentul centrat de ordinul 3) care în acest caz este negativ, μ3 = -0,1 < 0.

3 =
 ' 3
( x i - X ) n i − 3,68
= = −0,1 2 =
( x '
i - X ) 2
n i 16,154
= = 0,40
n 40 n 40
2
3 − 0,12 0,01
1 = = = = 0,16
23 0,4 3 0,064
• Coeficientul de asimetrie Fisher (dat), γ1=-0,38
Coeficientul de asimetrie al lui Fisher γ1 are: valoare mai mare decât zero în cazul
asimetriei pozitive, valoare mai mică decât zero în cazul asimetriei negative şi
valoare egală cu zero în cazul seriei perfect simetrice.
Deoarece coeficientul de asimetrie al lui Fisher γ1are valoare mai mică decât zero,
rezultă că distribuția este asimetrică negativ.

i) Ce se poate spune despre aplatizarea distribuției și de ce.


Analizând valorile date ale celor doi coeficienţi de aplatizare coeficientul de
aplatizare Pearson, β2=2,75 și coeficientul de aplatizare Fisher, γ2=-0,25
deoarece indicatorul β2 < 3, respectiv indicatorul γ2 < 0 rezultă că distribuţia
este mai puţin boltită decât cea normală (este o distribuție platikurtică);
distribuția are deci un “vârf” mai aplatizat (turtit) şi „cozi” mai subțiri decât la
cea normală.
Pentru a se răspunde la ultimele 3 întrebări trebuie determinat coeficientul de
variație, Cv :
σ
ഥ 0,64
Coeficientul de variaţie: Cv = 100 = 100 = 7,35%
ഥX 8,71

j) Ce se poate spune despre variaţia datelor statistice și de ce.


Valoarea coeficientului de variaţie indică faptul că variația/împrăștierea datelor
este mică, pentru că 0% < Cν < 17%

k) Este omogenă colectivitatea ? De ce da sau de ce nu ?


Valoarea coeficientului de variaţie indică faptul că, colectivitatea este omogenă,
pentru că Cν < 35%, de fapt este foarte omogenă deoarece 0% < Cν < 17%

l) Ce se poate spune despre reprezentativitatea mediei și de ce.


Valoarea coeficientului de variaţie indică că media este foarte (strict)
reprezentativă/semnificativă, pentru că 0%<Cv<17%

S-ar putea să vă placă și