Sunteți pe pagina 1din 17

LUCRAREA INDIVIDUALĂ NR.

1. Să se prezinte sub formă tabelară datele primare extrase din colectivitatea general, cu
indicarea sursei.

Medie
Nr. Crt Sexul lic Punctaj
1 F 9.78 68
2 M 7.96 38
3 F 9.18 48
4 F 9.23 26
5 F 9.51 64
6 F 8.95 40
7 M 8.16 47
8 M 9.26 39
9 M 8.45 64
10 F 9.37 59
11 F 9.36 39
12 M 7.77 27
13 F 9.96 58
14 F 9.29 63
15 F 9.36 43
16 F 9.24 47
17 F 9.84 68
18 M 7.13 27
19 F 9.65 67
20 F 8.81 55
21 M 7.64 52
22 F 9.63 54
23 M 8.32 53
24 F 8.59 29
25 F 9.97 44
26 F 9.72 64
27 F 8.42 30
28 M 8.8 57
29 M 8.4 31
30 M 8.88 44
31 F 8.98 20
32 M 8.2 28
33 F 9.75 58
34 F 9.19 48
35 M 9.74 43
36 M 9.31 27
37 F 8.74 22
38 F 8.19 40
39 F 9.83 57
1
40 F 9.76 57

Sursa: evidenţa ASE

2. Să se afle valoarea medie, mediana, modul şi amplitudinea absolută şi relativă a variaţiei


pentru cele două caracteristici (variabile) numerice. Ce se poate afirma despre cele două
caracteristici, după compararea acestor indicatori?

Pentru media din liceu:


Medie
Nr. Crt Sexul lic Punctaj
18 M 7.13 27
21 M 7.64 52
12 M 7.77 27
2 M 7.96 38
7 M 8.16 47
38 F 8.19 40
32 M 8.2 28
23 M 8.32 53
29 M 8.4 31
27 F 8.42 30
9 M 8.45 64
24 F 8.59 29
37 F 8.74 22
28 M 8.8 57
20 F 8.81 55
30 M 8.88 44
6 F 8.95 40
31 F 8.98 20
3 F 9.18 48
34 F 9.19 48
4 F 9.23 26
16 F 9.24 47
8 M 9.26 39
14 F 9.29 63
36 M 9.31 27
11 F 9.36 39
15 F 9.36 43
10 F 9.37 59
5 F 9.51 64
22 F 9.63 54
19 F 9.65 67
26 F 9.72 64
35 M 9.74 43
2
33 F 9.75 58
40 F 9.76 57
1 F 9.78 68
39 F 9.83 57
17 F 9.84 68
13 F 9.96 58
25 F 9.97 44

∑ xi
Valoarea medie: X́ = = 9.008
n

n+1 41
Mediana: loc Me = 2 = 2 = 20.5

x20 + x 21
Me = = 9.21
2

Modul: Mo = 9.36

Amplitudinea absolută: A = x max - x min = 9.97 – 7.13 = 2.84


xmax −x min
Amplitudinea relativa: A% = ∙ 100 = 31.52 (31.52%)

Având în vedere că amplitudinea relativă este de 31.52%, destul de îndepărtată faţă de


100% (colectivitate omogenă), putem spune că această colectivitate raportată la media de liceu
este o colectivitate eterogenă.

Pentru punctajul obţinut la proba de concurs:


Medie
Nr. Crt Sexul lic Punctaj
31 F 8.98 20
37 F 8.74 22
4 F 9.23 26
18 M 7.13 27
12 M 7.77 27
36 M 9.31 27
32 M 8.2 28
24 F 8.59 29
27 F 8.42 30
29 M 8.4 31
2 M 7.96 38
8 M 9.26 39
3
11 F 9.36 39
38 F 8.19 40
6 F 8.95 40
15 F 9.36 43
35 M 9.74 43
30 M 8.88 44
25 F 9.97 44
7 M 8.16 47
16 F 9.24 47
3 F 9.18 48
34 F 9.19 48
21 M 7.64 52
23 M 8.32 53
22 F 9.63 54
20 F 8.81 55
28 M 8.8 57
40 F 9.76 57
39 F 9.83 57
33 F 9.75 58
13 F 9.96 58
10 F 9.37 59
14 F 9.29 63
9 M 8.45 64
5 F 9.51 64
26 F 9.72 64
19 F 9.65 67
1 F 9.78 68
17 F 9.84 68

∑ xi
Valoarea medie: X́ = = 46.125
n

n+1 41
Mediana: loc Me = 2 = 2 = 20.5

x20 + x 21
Me = = 47
2

Modul: Mo = 27 sau Mo = 57 sau Mo = 64

Amplitudinea absolută: A = x max - x min = 68 – 20 = 48


xmax −x min
Amplitudinea relativă: A% = ∙ 100 = 104.06 (104.06%)

4
Având în vedere ca amplitudinea relativă este de 104.06%, destul de apropiată faţă de 100%
(colectivitate omogenă), putem spune că această colectivitate raportată la punctajul obţinut la
proba de concurs este o colectivitate omogenă.

Comparând cele două amplitudini relative, a mediei de liceu şi a punctajului obţinut la


proba de concurs, putem spune: colectivitatea mediilor de liceu este mai puţin omogenă decât
colectivitatea punctajului obţinut la proba de concurs.

3. Să se observe numărul de candidaţi de sex feminin, respectiv, de sex masculin şi să se


reprezinte grafic distribuţia pe sexe a elementelor din eşantionul înregistrat.

Nr. candidaţi = 40
Nr. candidaţi de sex feminin = 26
Nr. candidaţi de sex masculin = 14
p
∙ 40 = 26 ; p = 65 (65%)
100
q
∙ 40 = 14; q = 35 (35%)
100

Distributia pe sexe

Sex feminin

Sex masculin

4. Să se comenteze mediile calculate separat pe fiecare sex.

∑ xi 242.3
Media de liceu a fetelor: X́ = = 26 = 9.31
n
5
∑ xi 118.02
Media de liceu a băieţilor: X́ = = 14 = 8.43
n

∑ xi 1268
Media punctajelor obţinute de fete: X́ = = 26 = 48,76
n

∑ xi 577
Media punctajelor obţinute de băieţi: X́ = = 14 = 41.21
n

Se observă o diferenţă considerabilă între media de liceu a fetelor şi media de liceu a


băieţilor (aprox. 1p din 10 maxim posibile), ceea ce demonstrează că fetele învaţă mai mult
decât băieţii pe perioada liceului. În ceea ce priveşte punctajele obţinute la proba de concurs,
diferenţa este una tot în favoarea fetelor (aprox. 7p din 70 maxim posibile ceea ce echivalează
diferenţa dintre mediile de liceu), astfel încât putem spune că băieţii nu reuşesc să recupereze
cunoştinţele pierdute în liceu.

5. Pentru fiecare variabilă numerică cercetată, să se stabilească 4-5 intervale egale de


grupare. Să se grupeze elementele colectivităţii (cei 40 de candidaţi) pe aceste intervale.
(Observaţie: Mărimea intervalelor poate fi astfel rotunjită încât să permită stabilirea unor centre
de interval uşor de întrebuinţat în calculul indicatorilor).

GRUPE MED. LICEU ni


[7.13 - 7.70) 2
[7.70 - 8.27) 5
[8.27 - 8.84) 8
[8.84 - 9.41) 13
[9.41 - 9.98) 12

GRUPE PUNCTAJ ni
(19.5 – 29.2] 8
(29.2 – 38.9] 3
(38.9 – 48.6] 12
(48.6 – 58.3] 9
(58.3 - 68] 8

6. Să se facă reprezentarea grafică a seriilor de repartiţie obţinute ca rezultat al acestor


grupări (de exemplu, diagramă cu coloane sau histogramă).

6
Grafic serii de repartitie medii liceu
14
12
10
8
Nr. studenti (ni)
6
4
2
0
)

)
0

8
7

1
.7

.2

.8

.4

.9
-7

-8

-8

-9

-9
3

1
.1

.7

.2

.8

.4
[7

[7

[8

[8

[9

Grafic serii de repartitie punctaj


12
10
8
6 Nr. studenti (ni)
4
2
0
] ] ] ] 8]
.2 .9 .6 .3
9 8 8 8 -6
-2 -3 -4 -5 .3
9 .5 9 .2 8 .9 8 .6 (5
8
(1 (2 (3 (4

7. Pentru fiecare variabilă, pe baza repartiţiei de frecvenţe obţinute la punctul 5 al lucrării,


să se stabilească indicatorii tendinţei centrale (media aritmetică ponderată, mediana şi modul),
indicatorii sintetici ai variaţiei şi indicatorii asimetriei.

Pentru media de liceu:

Indicatorii tendinţei centrale

7
Media aritmetică ponderată
x́ =
∑ ni ∙ x i 358.16
= 40 = 8.954
∑ ni
Mediana
n+1 41
Loc Me = 2 =
2
= 20.5; Me = [8.84 – 9.41)

loc Me−∑ npMe 20.5−15


Me = x 0 + k ∙ = 8.84 + 0.57 ∙ 13 = 9.081
nMe

Modul

Mo = [8.84 – 9.41)

1 ∆ 13−8
Mo = x 0 + k ∙ ∆ +∆ = 8.84 + 0.57 ∙ ( 13−8 )+(13−12) = 9.315
1 2

Indicatorii sintetici ai variaţiei:

Abaterea medie liniară

∑ │ x i−x́ │∙ ni 22.23
d́ = = 40 = 0.55
∑ ni
Dispersia

∑ ( x i− x́ )2 ∙ ni 17.672
σ 2
= = 40 = 0.441
∑ ni
Abaterea medie pătratică
σ = √ σ 2 = √ 0.441 = 0.664

Coeficientul de variaţie
σ 0.664
ν = x́ ∙ 100 = 8.954 ∙ 100 = 7.41 % < 30%

Indicatori asimetrici:
8
Asimetria

as = x́ - Mo = 8.954 – 9.315 = -0.361 < 0

Coeficientul de asimetrie Pearson


x́−Mo −0.361
C as = = 0.664 = -0.543
σ

Pentru punctajul obţinut la proba de concurs:

Indicatorii tendinţei centrale:

Media aritmetică ponderată

x́ =
∑ ni ∙ x i 1808.2
= 40
= 45.2
∑ ni
Mediana
n+1 41
Loc Me = 2 =
2
= 20.5; Me = (38.9 – 48.6]

loc Me−∑ npMe 20.5−11


Me = x 0 + k ∙ = 38.9 + 9.7 ∙ 12 = 46.57
nMe

Modul

Mo = (38.9 – 48.6]

1 ∆ 12−3
Mo = x 0 + k ∙ ∆ +∆ = 38.9 + 9.7 ∙ ( 12−3 ) +( 12−9) = 46.175
1 2

Indicatorii sintetici ai variaţiei:

Abaterea medie liniară

∑ │ x i−x́ │∙ ni 435.5
d́ = = 40 = 10.88
∑ ni
Dispersia

9
∑ ( x i− x́ )2 ∙ ni 7066.16
σ 2
= = 40 = 176.654
∑ ni
Abaterea medie pătratică
σ = √ σ 2 = √ 176.654 = 13.291

Coeficientul de variaţie
σ
ν = x́ ∙ 100 = 29.4 % < 30%

Indicatori asimetrici:

Asimetria

as = x́ - Mo = 45.2 – 46.175 = -0.975 < 0

Coeficientul de asimetrie Pearson


x́−Mo −0.975
C as = = 13.291 = -0.073
σ

8. Comparând indicatorii celor două repartiţii de frecvenţă, să se observe şi comenteze


asemănările şi/sau deosebirile dintre cele două variabile studiate.

Pentru media de liceu coeficientul de variaţie ν este de 7.41% < 30%, ceea ce
demonstrează că vorbim de o colectivitate omogenă şi o medie reprezentativă. În ceea ce
priveşte punctajul obţinut la concursul de admitere, coeficientul de variaţie este de 29.4% <
30%, rezultând că media este reprezentativă şi colectivitatea tinde să fie omogenă.
Comparând coeficienţii de variaţie ale celor două repartiţii de frecvenţă, 7.41% < 29.4%,
fapt care ne arată că în cazul mediei de liceu, colectivitatea este mai omogenă decât
colectivitatea punctajelor obţinute la proba de concurs.

9. Să se calculeze media şi indicatorii sintetici ai variaţiei pentru caracteristica punctajul


obţinut la concursul de admitere separate pentru candidaţii de sex feminin şi, respectiv pentru
candidaţii de sex masculin şi să se facă analiza comparativă a rezultatelor.

10
Pentru candidaţii de sex feminin:

Media
∑ ni ∙ x i 1244.2
X́ = = = 47.85
∑ ni 26

Abaterea medie liniară


∑ │ x i−x́ │∙ ni 0.1
d́ = = 26 = 0.003
∑ ni

Dispersia
∑ ( x i− x́ )2 ∙ ni 4360.71
σ 2
= = 26 = 167.71
∑ ni

Abaterea medie pătratică


σ = √ σ 2 = √ 167.71 = 12.95

Coeficientul de variaţie
σ
ν = x́ ∙ 100 = 27.06 % < 30%

Pentru candidaţii de sex masculin:

Media
∑ ni ∙ x i
X́ = = 40.28
∑ ni

Abaterea medie liniară


∑ │ x i−x́ │∙ ni
d́ = = 0.005
∑ ni

Dispersia

σ = 2 ∑ ( x i− x́ )2 ∙ ni = 2184.233 = 156.01
∑ ni 14

11
Abaterea medie pătratică
σ = √ σ 2 = √ 156.01 = 12.49

Coeficientul de variaţie
σ
ν = x́ ∙ 100 = 31 % > 30%

Făcând o comparaţie a rezultatelor obţinute de către candidaţii de sex feminin şi


candidaţii de sex masculin, putem spune că media punctajelor candidaţilor de sex feminin este
mai mare decât cea a candidaţilor de sex masculin (47.85 > 40.28). Pe de altă parte, abaterea
medie liniară a sexului feminin este mai mică decât abaterea medie liniară a sexului masculin
(0.003 < 0.005), ceea ce înseamnă că punctajele obţinute de sexul feminin se abat faţă de
medie în plus sau în minus cu 0.003, iar punctajele obţinute de sexul masculin se abat în plus
sau în minus cu 0.005. Analizând cele două dispersii, putem spune că gradul de împrăştiere a
punctajelor sexului feminin faţă de medie este mai mare decât gradul de împrăştiere a
punctajelor sexului masculin faţă de medie. Studiind coeficienţii de variaţie, spunem că media
este reprezentativă pentru fete şi colectivitatea lor este omogenă, pe când la băieţi, colectivitatea
este neomogenă şi media nereprezentativă.

10.Considerând intervalul cercetat ca fiind rezultat al unui sondaj simplu aleator


nerepetat, se cere să se estimeze cu o probabilitate de 0.95 (z = 1.96) limitele intervalului în
care se situează punctajul mediu al tuturor celor N = 1857 candidaţi prezenţi la examenul de
admitere din 2010.

σ 2i 176.654 40
❑x =

n−1
n
(1− ) =
N √
39
(1−
1857
D x = z ∙ ❑x = 1.96 ∙ 4.432 = 8.68672
) = 4.432

X́ - D x  X́ o  X́ + D x
45.2 – 8.68672  X́ o  45.2 + 8.68672
36.51  X́ o  53.88
Media punctajelor celor 1857 de candidaţi este cuprinsă între 36.51 şi 53.88 cu
probabilitatea ϕ ( z) = 0.95

11.Să se estimeze limitele intervalului în care se încadrează cu aceeaşi probabilitate


ponderea şi, respectiv, numărul absolut al candidaţilor de sex feminin în totalul de N = 1857,
menţionat mai sus.

12
Ponderea:
σ 2i 0.2275 40
❑x =
√ n−1
n
(1− ) =
N √ 39
(1−
1857
) = 0.075

nr . fete nr .băieţi 26 14
σ i2 = ∙ total = 40 ∙ 40 = 0.2275
total

D x = z ∙ ❑x = 1.96 ∙ 0.075 = 0.147


X́ - D x  X́ o  X́ + D x
nr . fete 26
X́ = = 40 = 0.65
total
0.65 – 0.147  X́ o  0.65 + 0.147
0.503  X́ o  0.797

Numărul absolut:
0.503 ∙ N   0.797 ∙ N
934.071   1480.029

12.Să se facă gruparea combinată a elementelor observate în funcţie de ambele


caracteristici/variabile analizate în lucrare, notând cu X media anilor de liceu, respectiv
variabila independentă cunoscută şi sub numele de variabilă factorială sau explicativă (grupele
se aşează în capetele de coloane ale matricei), iar cu Y punctajul obţinut la proba de concurs
de admitere, respectiv, variabila dependentă, numită în teoria şi practica statistică şi variabilă
rezultativă sau explicată (grupele se aşează în capetele de rânduri ale matricei). Cum comentaţi
această repartiţie bidimensională?

X/Y [7.13 - 7.70) [7.70 - 8.27) [8.27 - 8.84) [8.84 - 9.41) [9.41 - 9.98) Total
(58.3 - 68] 0 0 1 2 5 8
(48.6 - 58.3] 1 0 3 0 5 9
(38.9 - 48.6] 0 2 0 8 2 12
(29.2 - 38.9] 0 1 2 0 0 3
(19.5 - 29.2] 1 2 2 3 0 8
Total 2 5 8 13 12 40

13
Având în vedere distribuţia bidimensională de mai sus şi a faptului că frecvenţele tind să
se situeze în zona diagonalei secundare, rezultă că legătura dintre X şi Y este o legătură inversă.

13. Pentru fiecare grupă constituită după variabila factorială X (coloană), să se calculeze
media de grupă a punctajului obţinut şi dispersia în jurul mediei de grupă.

x´i 1 =
∑ ni ∙ x i 77.8
= 2 = 38.9
∑ ni
2 ∑ ( x i− x́ )2 ∙ ni 423.405
σi1 = = 2
= 211.7025
∑ ni

x´i 2 =
∑ ni ∙ x i 170.25
= 5
= 34.05 p
∑ ni

σ i 22 =
∑ ( x i− x́ )2 ∙ ni = 376.36 = 75.272
∑ ni 5

x´i 3 =
∑ ni ∙ x i 340.3
= 8
= 42.53
∑ ni
2 ∑ ( x i− x́ )2 ∙ ni 1587.7692
σi3 = = 8
= 198.47
∑ ni

x´i 4 =
∑ ni ∙ x i 549.35
= 13
= 42.25
∑ ni
2 ∑ ( x i− x́ )2 ∙ ni 1852.85
σi 4 = = 13 = 142.52
∑ ni

x´i 5 =
∑ ni ∙ x i 670.5
= 12 = 55.875
∑ ni
2 ∑ ( x i− x́ )2 ∙ ni 588.0625
σi5 = = 12
= 49
∑ ni

14. Să se calculeze dispersia explicată şi dispersia reziduală a variabilei rezultative Y.

Dispersia explicată:

14
2 ∑ ( x´i 1− x́)2 ∙ ni 79.38
δ1 = = 40 = 1.98
∑ ni
δ 22 =
∑ ( x´i 1− x́)2 ∙ ni = 621.6125 = 15.54
∑ ni 40

δ 32 =
∑ ( x´i 1− x́)2 ∙ ni = 57.0312 = 1.42
∑ ni 40

2 ∑ ( x´i 1− x́)2 ∙ ni 113.1325


δ4 = = 40 = 2.82
∑ ni
2 ∑ ( x´i 1− x́)2 ∙ ni 1367.46
δ5 = = 40 = 34.18
∑ ni
δ 2(total) = 55.94

Dispersia reziduală:

∑ σ 2i ∙n i 211.7 ∙ 2+ 75.27∙ 5+198.47 ∙ 8+142.52∙ 13+ 49∙ 12


σ́ 2
= = 40
= 120.7
∑ ni

15. Să se verifice regula de adunare a dispersiilor, să se calculeze şi comenteze coeficientul


de determinaţie pentru a putea arăta cât de importantă este influenţa lui X asupra variaţiei lui Y.

Relaţia dintre cele trei dispersii este:

σ 2 = δ 2+ σ́ 2 ⇒ 176.65 ≅ 55.94 + 120.7 = 176.64

Coeficientul de determinaţie:

δ2 55.94
D= 2 ∙ 100 =
176.64
= 0.3166; 31.66%
σ

Doar 31.66% din variaţia totală a punctajului obţinut la sală poate fi explicată prin
diferenţierea candidaţilor în funcţie de media liceului.

15
16. Pornind de la faptul că media anilor de liceu constituie una dintre cauzele care explică
punctajul obţinut la proba de concurs de admitere, să se estimeze şi comenteze parametrii
funcţiei liniare de regresie. Care este semnificaţia funcţiei de regresie astfel identificate? Cum
comentaţi diferenţele dintre valorile reale ale caracteristicii Y şi valorile estimate cu ajutorul
funcţiei de regresie?
Funcţia de regresie reprezintă modul în care variabila dependentă Y (punctajul obţinut la
proba de concurs de admitere) evoluează în raport cu modificarea variabilei independente X
(media anilor de liceu).

Ecuaţia funcţiei liniare de regresie se scrie:

Y x = a + b x i + ε i,
i

unde a şi b sunt parametrii necunoscuţi ai funcţiei, ce urmează a fi estimaţi.

n ∑ xi y i−∑ x i ∑ y i
b=
n ∑ x2i −¿ ¿ ¿

∑ y i ∑ x 2i −∑ x i ∑ x i y i
a= , a = ý−b x́
n ∑ x 2i −¿ ¿ ¿

40 ∙16816.31−360.32∙ 1845 672652.4−664790.4 7862


b= 2 = 130618.68−129830.5 = 788.18 = 9.97
40 ∙3265.467−360.32

1845∙ 3265.467−360.32∙ 16816.31 6024786.615−6059252.81 34466.195


a= 788.18
= 788.18
= - 788.18
= - 43.72

Parametrul a nu are semnificaţie economică. Din punct de vedere geometric este


ordonata punctului în care dreapta de regresie intersectează axa Oy.

Parametrul b reprezintă panta dreptei şi se mai numeşte şi coeficient de regresie. Prin


semn el exprimă direcţia legăturii dintre cele două variabile cercetate, în cazul de faţă legătura
dintre variabile fiind una direct (9.97 > 0). Prin mărime, coeficientul arată cuantumul influenţei,
adică la fiecare creştere cu o unitate a mediei de liceu, punctajul obţinut la admitere tinde să se
modifice cu 9.97 unităţi.

16
Funcţia liniară de regresie: f( x i ¿ = -43.72 + 9.97 x i exprimă pentru cei 40 de candidaţi
analizaţi, tendinţa medie de variaţie a punctajului obţinut la concursul de admitere sub influenţa
exclusivă a mediei de liceu.

∑ Y i = ∑ yi ⇒ 1845 ≅ 1843.59
Diferenţele dintre variabilele reale ale caracteristicii Y şi valorile estimate cu ajutorul
funcţiei de regresie sunt minime, iar suma diferenţelor este aproape nulă, cu o eroare de 1.4.

17. Să se determine şi comenteze coeficientul de corelaţie liniară dintre cele două variabile.

40∙ 16816.31−360.32 ∙1845


r x , y = n ∑ xi y i − ∑ x i ∑ y i = =
√ ¿¿ ¿ √( 40 ∙3265.467−360.322 ) (40 ∙ 92919−18452)
672652.4−664790.4 7862 7862
= = = 15700 = 0.500764
√( 130618.68−129830.5 ) (3716760−3404025) √788.18 ∙ 312735

r xy = 0.500764 ∈ (0.5; 0.75) rezultă că legătura este de intensitate medie.

18. Să se caracterizeze intensitatea legăturii dintre cele două variabile prin metode
neparametrice (coeficienţi de corelaţie a rangurilor).
Coeficientul Spearman:

6 ∑ d 2i 6 ∙ 4652
rs = 1 - 2 = 1 – 40 ∙1599 = 1 – 0.43 = 0.57 ∈ (0.5 ; 0.75)
n(n −1)

Legătura dintre media de liceu şi punctajul obţinut la concursul de admitere este o


legătură direct de intensitate medie.

17

S-ar putea să vă placă și