Sunteți pe pagina 1din 17

Proiect statistic

Student: Oana Lupea


Rei, Seria A, grupa 927

Bucuresti 2015

Inregistrati pentru cele n unitati, valorile specifice ale unei


perechi de caracteristici ( X si Y ) intre care exista o legatura
logica. Datele reprezentate sub forma tabelara fac parte din lucrare,
potrivit modelului.


Xi

295.2
34

= 8.68 reprezinta media notelor de la

Bacalaureat
=

Yi

2006
34

= 59 Reprezinta media punctajului la proba de

concurs

2. Sa se stabileasca amplitudinea absoluta si relativa, dispersia, abaterea

medie patratica si coeficientul de variatie pentru fiecare caracteristica; sa


se precizeze in functie de care din cele doua caracteristici este mai
omogena colectivitatea celor n unitati;

Pentru valorile notelor obtinute la Bacalaureat avem urmatorii indicatori sintetici:


Abaterea medie lineara este egala cu:

d=


|Xi|

19.7
34

= 0,61. Acest numar ne arata ca nota se abate de la

medie cu 0.58 puncte de nota.

Dispersia este egala cu:


=

( xi)

15.98
34

= 0.51. Dispersia este o valoare adimensionala

Abaterea medie patratica este egala cu:


== 0.51= 0.68 puncte de nota
Coeficientul de variatie este egal cu:
=

reprezentativa.

0.68
8.68

= 7.8% < 30%, colectivitatea este omogena iar media

Pentru punctajul obtinut la proba avem urmatorii indicatori:


Abaterea medie lineara este egala cu:

d=

|Xi|

374
34

= 11. Acest numar ne arata ca nota se abate de

la medie cu 11 puncte de nota.


Dispersia este egala cu:

( xi)

5984
34

= 181. Dispersia este o valoare adimensionala

Abaterea medie patratica este egala cu:


== 181= 13.26 puncte de nota
Coeficientul de variatie este egal cu:
=

13.26
59

= 22.4% < 30%, colectivitatea este omogena iar media

reprezentativa.
Indicatorii simpli
Amplitudinea absoluta reprezinta valoarea maxima dintre cel mai mic si cel
mai mare numar.
In cazul notei la bac, acesta este egala cu 2.55 puncte
In cazul punctajului la proba, acesta este de 48 puncte.
Amplitudinea relativa reprezinta abaterea termenului individual de la medie:
di% = (x1-)/ astfel,
amplitudinea relativa a notelor obtinute la bacalaureat este de 0.294 iar a
punctajelor de 0.81.
3.Sa se grupeze cele n unitati in functie de fiecare caracteristica pe 4-5
intervale egale si sa se prezinte repartitiile unidimensionale obtinute sub
forma de tabele si grafice statistice;

Pentru determinarea numarului intervalelor avem nevoia de formula Sturges,


astfel:

h=1+3,322* log 34=1+3.322*1.477= 6 intervale.

Vom grupa puntajul obtinut la BAC in urmatoarele intervale egale:

Astfel,
Media celor 30 de valori este

294
34

= 8.65, ceea ce inseamna ca valoarea

medie a notelor obtinute la bacalaureat este de 8,65.


Mediana=

+ 1
2

= 17,5 si are valoarea:

Mediana= x0+ k*

loc Me npindMe
nMe

=8.535+0.4235*

17,513
7

= 8.81

ceea ce ne arata faptul ca jumatate dintre cei ce au sustinut examenul de


bacalaureat au luat sub 8,81, jumatate peste
Modul=

d1
X0+k* d 1+d 2 = 8.96+0.425*

97
97+ 95

= 9.1. Aceasta valoare ne

arata ce cele mai multe note obtinute la examenul de Bacalaureat al esantionului


nostru sunt de 9.1

Astfel: Modul > Mediana > Media

Evolutia notelor la Bac

Nr. Elevi

10
8
6
4
2
0

intervale note bac

Vom grupa puntajul obtinut la admitere in urmatoarele interval egale:

Astfel,
Media celor 30 de valori este

1996
34

= 58.7, ceea ce inseamna ca

valoarea medie a punctajelor obtinute la admiterea la facultate este de


58.7
Mediana=

+ 1
2

= 17,5 si are valoarea:

Mediana= x0+ k*

loc Me npindMe
nMe

=54+8*

17.512
6

= 61 ce ne arata

faptul ca jumatate dintre cei ce au sustinut proba de admitere au luat sub


61, jumatate peste.
Modul=

d1
X0+k* d 1+d 2 = 62+8*

86
86+ 88

= 70 Aceasta valoare ne arata ce

cele mai multe note obtinute la examenul admitere al esantionului nostru sunt de 70.

Astfel,
Modul > Mediana > Media

Nr elevi
10
8
6
Nr. Elevi

Nr elevi

4
2
0

30-38 38-46 46-54 54-62 62-70 70-78


Note Punctaj

Pentru a continua calcularea abaterii medii patratice vom avea nevoie de


Dispersie. Dispersia este calculata in excel si are valoarea de 185, ceea ce
inseamna ca abaterea medie patratica este de 13.6, ceea ce ne arata faptul ca, in
medie, nota unui tanar ce a obtinut punctajul la admitere se abate cu 13.6 puncte
fata de medie.
Coeficientul de variatie ne arata omogenitatea grupului. Pentru cei care au
sustinut proba de bacalaureat, coeficientul este

13.6

= 58.7 = 25%<30%, ceea ce ne arata o colectivitate omogena

Coeficientul de asimetrie=

modul
58.770
= 13.6
= -0.83, apartine

intervalului (-3;3), este o valoarea negativa ce ne arata ca clopotul lui gauss e


inclinat in partea stanga.
5.Acceptand ca cele n unitati constituie un esantion reprezentativ de 3%
obtinut prin extragere simpla, aleatoare, nerepetata dintr-o colectivitate
generala, sa se calculeze pentru una dintre caracteristici, limitele intervalului de
estimare a mediei colectivitatii generale ( x si y ) cu o probabilitate de 95,45%
( z=2)

Cele 34 de valori reprezinta 3%, ceea ce inseamna ca sunt in total 1134 de valori
Media esantionului= 8.68
Dispersia esantionului=0.51
Probabilitate de 95,45%, z=2
Astfel avem relatia: x<0<+x
x=
x=

z*(dispersie/n*1z*x= (n/N)=
0.038

2*(0.51/34)*(134/1134)=

0.038

8.680.038<x0<8.68+0.038
8.642<x0<8.71
8
X0[8.642;8.718] cu o
probabilitate de 95,45%

X0 apartine intervalului[8.642;8.718] cu o probabilitate de 95,45%. Altfel spus,


pentru o colectivitate de 30 de ori mai mare decat cea de 34 de persoane, cu o
probabilitate de 95,45%, media ar fi fost in intervalul mai sus mentionat.
6. Sa se grupeze cele n unitati concomitant in functie de cele doua
caracteristici observate, folosind intervalele stabilite la punctul 3; repartitia

bidimensionala de frecventa se reprezinta sub forma unui table cu dubla intrare


dupa modelul:

Pentru fiecare grupa constituita dupa variabila factoriala X, sa se calculeze


mediile yj si dispersiile si sa se verifice daca si in ce masura explica factorul
X variatia caracteristicii Y, folosit coeficientul de determinatie si testul F.
Calculam mediile si dispersiile y dupa x
Intervalul nr. 1

Intervalul nr. 2

Intervalul nr. 3

Intervalul nr.4

Intervalul nr. 5

Intervalul nr. 6

Pentru a determina rezultatul final, un pas intermediar este de a afla


media dispersiilor:
Media dispersiilor este egala cu: =1+2++6= 78
Coeficientul de determinatie se calculeaza ca raport intre S si media
dispersiilor.
Astfel, S= =((B17-E30)^2*C11+(B22-E30)^2*1+(F20-E30)^2*E11+(F25E30)^2*G11+(J20-E30)^2*F11+(J25-E30)^2*H11)/32=3901

Din cele doua puncte de mai sus, coeficientul de determinatie este egal cu
3901
78 , adica 50.2, ceea ce inseamna ca variabila independenta X il

influenteaza pe Y in proportie de 50.2%


Testul F
F tabelat (=FINV(0.05,3,12) = 3,49
F calculat = 3.55
Din aceste doua ecuatii deducem ca F calculat > F tabelat, ceea ce
inseamna ca factorul X este semnificativ si ca x are o influenta
semnificativa asupra lui y.
9 & 10. Sa se preia din tabelul cu valori individuale ale observarii primele 15
perechi de valori ( in ordinea inregistrarii ) sis a se caracterizeze legatura dintre ( x
si y ) prin metode elementare de analiza; Sa se estimeze parametrii functiei de
regresie si sa se masoare intensitatea legaturii prin metode parametrice si
neparametrice pe cele 15 perechi de valori xi yi.

Functia de regresie conform tabelul si functiilor din excel cu ajutor data analysis:
Punctajul la proba de concurs= -18+ 8.86*proba mediei de bacalaureat
In aceasta ecuatie, valoarea de -18 nu reprezinta nimic din punct de vedere
economic, iar 8.86 arata faptul ca la o crestere cu 1 unitate a lui X, Y se modifica de
8.86ori in aceeasi directie.
In continuare, vom evidentia legatura dintre cele doua variabile printr-un
grafic.

Relatie de corelare dintre cele doua variabile este:

Bibliografie:
Prelucrare personala