Sunteți pe pagina 1din 16

Proiect statistic

Student:
Rei, Seria A, grupa 92

Bucuresti 2015

Inregistrati pentru cele n unitati, valorile specifice ale unei


perechi de caracteristici ( X si Y ) intre care exista o legatura
logica. Datele reprezentate sub forma tabelara fac parte din lucrare,
potrivit modelului.

=
Bacalaureat

Xi

263.7
30

= 8.79 Reprezinta media notelor de la

Y i

1593.9
30

= 53.13 Reprezinta media punctajul la proba

2. Sa se stabileasca amplitudinea absoluta si relativa, dispersia, abaterea

medie patratica si coeficientul de variatie pentru fiecare caracteristica; sa


se precizeze in functie de care din cele doua caracteristici este mai
omogena colectivitatea celor n unitati;

Pentru valorile notelor obtinute la Bacalaureat avem urmatorii indicatori sintetici:


Abaterea medie lineara este egala cu:

d=

|Xi|

15
30

= 0,50. Acest numar ne arata ca nota se abate de la

medie cu 0.50 puncte de nota.

Dispersia este egala cu:


=

( xi)

10.2
30

= 0.34. Dispersia este o valoare adimensionala

Abaterea medie patratica este egala cu:


== 0.34= 0.59 puncte de nota
Coeficientul de variatie este egal cu:
=

reprezentativa.

0.59
8.79

= 6.7% < 30%, colectivitatea este omogena iar media

Pentru punctajul obtinut la proba avem urmatorii indicatori:


Abaterea medie lineara este egala cu:

d=

|Xi|

330
30

= 11 . Acest numar ne arata ca nota se abate de la

medie cu 11puncte de nota.


Dispersia este egala cu:
=

( xi)

5310
30

= 177. Dispersia este o valoare adimensionala

Abaterea medie patratica este egala cu:


== 177= 13 puncte de nota
Coeficientul de variatie este egal cu:
=

13
53.13

= 24% < 30%, colectivitatea este omogena iar media

reprezentativa.
Indicatorii simpli
Amplitudinea absoluta reprezinta valoarea maxima dintre cel mai mic si cel mai
mare numar.
In cazul notei la bac, acesta este
=MAX(C5:C36)-MIN(C5:C36)= 2,31 puncte
In cazul punctajului la proba, acesta este
=MAX(D5:D36)-MIN(D5:D36)= 52 puncte.
Amplitudinea relativa reprezinta abaterea termenului individual de la medie:
di% = (x1-)/ astfel,
amplitudinea relativa a notelor obtinute la bacalaureat este de 0.263 iar a
punctajelor de 0.98.

3.Sa se grupeze cele n unitati in functie de fiecare caracteristica pe 4-5


intervale egale si sa se prezinte repartitiile unidimensionale obtinute sub forma
de tabele si grafice statistice;
Pentru determinarea numarului intervalelor avem nevoia de formula
Sturges, astfel:
h=1+3,322* log 30=1+3.322*1.477= 6 intervale.
Vom grupa puntajul obtinut la BAC in urmatoarele interval egale:

Astfel,
Media celor 30 de valori este

263.8
30

= 8.7935, ceea ce inseamna ca

valoarea medie a notelor obtinute la bacalaureat este de 8,7935.


Mediana=

+ 1
2

Mediana= x0+ k*

= 15,5 si are valoarea:


loc Me npindMe
nMe

=8.37+0.385*

15,57
10

= 8.697ceea

ce ne arata faptul ca jumatate dintre cei ce au sustinut examenul de


bacalaureat au luat sub 8,697, jumatate peste
Modul=

d1
X0+k* d 1+d 2 =

8.37+0.385*

105
( 105 ) +(104)

= 8.545. Aceasta

valoare ne arata ce cele mai multe note obtinute la examenul de Bacalaureat al


esantionului nostru sunt de 8.545.

Astfel: Media> Mediana> Modul

Dinamica numarului elevilor in functie de nota de BAC


12
10
8

Dinamica numarului
elevilor in functie de
nota de BAC

6
4
2
0

Vom grupa puntajul obtinut la admitere in urmatoarele interval egale:

Astfel,
Media celor 30 de valori este

1591
30

= 53, ceea ce inseamna ca valoarea

medie a punctajelor obtinute la admiterea la facultate este de 53


Mediana=

+ 1
2

Mediana= x0+ k*

= 15,5 si are valoarea:


loc Me npindMe
nMe

=46.99+8.66*

15,59
9

= 53.24 ceea

ce ne arata faptul ca jumatate dintre cei ce au sustinut proba de admitere


au luat sub 53.24, jumatate peste

Modul=

d1
X0+k* d 1+d 2 = 46.99+8.66*

94
( 94 ) +(93)

= 50.92Aceasta valoare

ne arata ce cele mai multe note obtinute la examenul admitere al esantionului nostru
sunt de 50.92.

Astfel,
Mediana > Media > Modul

Dinamica numarului elevilor in fuctie de Punctajul Probei


10
9
8
7
6
5
4
3
2
1
0

Dinamica numarului
elevilor in fuctie de
Punctajul Probei

Pentru a continua calcularea abaterii medii patratice vom avea nevoie de


Dispersie. Dispersia este calculata si ea in excel si are valoarea de 156, ceea ce
inseamna ca abaterea medie patratica este de 12.49, ceea ce ne arata faptul ca, in
medie, nota unui pusti ce a obtinut punctajul la admitere se abate cu 12.49 puncte
fata de medie.
Coeficientul de variatie ne arata omogenitatea grupului. Pentru cei care au
sustinut proba de bacalaureat, coeficientul este
=

=23%<30%, ceea ce ne arata o colectivitate omogena

Coeficientul de asimetrie=
se incadreaza in intervalul [-3;3].

modul
= -1.12, o valoarea negativa dar care

Diferentele obtinute intre intre rezultate sunt aproape inexistente, ceea ce


inseamna ca intervalele cat si rezultatele obtinute sunt corecte.
5.Acceptand ca cele n unitati constituie un esantion reprezentativ de 3%
obtinut prin extragere simpla, aleatoare, nerepetata dintr-o colectivitate
generala, sa se calculeze pentru una dintre caracteristici, limitele intervalului de
estimare a mediei colectivitatii generale ( x si y ) cu o probabilitate de 95,45%
( z=2)

Cele 30 de valori reprezinta 3%, ceea ce inseamna ca sunt in total 1000 de valori
Media esantionului= 8.79
Dispersia esantionului=0.34
Probabilitate de 95,45%, z=2
Astfel avem relatia: x<0<+x
x=

z*x=

z*(dispersie/n*1(n/N)=

2*(0.34/30)*(130/1000)=

2*0.01
1

0.022

8.79-0.022<x0<8.79+0.022
8.768<x0<8.812
X0 apartine intervalului[8.768;8.812] cu o probabilitate de 95,45%. Altfel spus,
pentru o colectivitate cu 3000% mai mare decat cea de 30 de persoane, cu o
probabilitate de 95,45%, media ar fi fost in intervalul mai sus mentionat.
6. Sa se grupeze cele n unitati concomitant in functie de cele doua
caracteristici observate, folosind intervalele stabilite la punctul 3; repartitia
bidimensionala de frecventa se reprezinta sub forma unui table cu dubla intrare
dupa modelul:

Pentru fiecare grupa constituita dupa variabila factoriala X, sa se calculeze


mediile yj si dispersiile si sa se verifice daca si in ce masura explica factorul
X variatia caracteristicii Y, folosit coeficientul de determinatie si testul F.
Calculam mediile si dispersiile y dupa x
Intervalul nr. 1

Pentru a determina rezultatul final, un pas intermediar este de a afla


media dispersiilor:
Media dispersiilor este egala cu 1231

Coeficientul de determinatie
dispersiilor.

se calculeaza ca raport intre S si media

Astfel, S= =((B17-E30)^2*C11+(B22-E30)^2*1+(F20-E30)^2*E11+(F25E30)^2*G11+(J20-E30)^2*F11+(J25-E30)^2*H11)/32= 6467

Din cele doua puncte de mai sus, coeficientul de determinatie este egal cu
6467
123 , adica 52.6, ceea ce inseamna ca variabila independenta X il

influenteaza pe Y in proportie de 52.6%


Testul F
F tabelat (=FINV(0.05,3,12) = 3,49
F calculat = 4,69
Din aceste doua ecuatii deducem ca F calculat > F tabelat, ceea ce
inseamna ca factorul X este semnificativ si ca x are o influenta
semnificativa asupra lui y.
9 & 10. Sa se preia din tabelul cu valori individuale ale observarii primele 15
perechi de valori ( in ordinea inregistrarii ) sis a se caracterizeze legatura dintre ( x
si y ) prin metode elementare de analiza; Sa se estimeze parametrii functiei de
regresie si sa se masoare intensitatea legaturii prin metode parametrice si
neparametrice pe cele 15 perechi de valori xi yi.

Functia de regresie conform tabelul si functiilor din excel cu ajutor data analysis:
Punctajul la proba de concurs= -32+ 10.08*proba mediei de bacalaureat
In aceasta ecuatie, valoarea de -32 nu reprezinta nimic din punct de vedere
economic, iar 10.08 arata faptul ca la o crestere cu 1 unitate a lui X, Y se modifica
de 10.08 ori in aceeasi directie.

Legatura dintre cele doua variabile este masurata prin R iar valoarea
de 53% ne arata ca exista o legatura de intensitate medie, dar pozitiva.

Bibliografie:
Datele primite de la professor
Tabele sunt integral prelucrate personal in
baza informatiilor primite

S-ar putea să vă placă și