Sunteți pe pagina 1din 12

Pe un esantion de 180 de persoane s-a efectuat un studiu privind corelarea venitului cu rata platita.

Coeficient
Grupe de Nr. pers ul de a) Analizati omogenitatea pe fiecare grupa si per total
venit (ni) Valoarea Valoarea variatie al
medie a medie a ratei (CV
rate(lei) rate(lei) %)
<2500 lei 20 450 ymed1 20 b) Care este dispersia valorii ratelor pentru persoanele
2500-4000
60 c)Calculati R2 si stabiliti in ce proportie factorul de gru
lei 600 ymed2 22
4000-6000
80 d)Testati daca influenta factorului este semnificativa d
lei 850 ymed3 24
>6000 20 1000 ymed4 26
Total 180 e) Calculati eroarea limita admisa daca cele 180 pers r

Cerinta a) a) Analizati omogenitatea pe fiecare grupa si per total

Folosim coeficientul de omogenitate (de variatie), CV=sigma/ medie


Cele 4 patru grupe de persoane in functie de venit sunt omogene din perspectiva marimii r
Mare atentie! Nu adunam, nu facem medie, nu impartim nu nimic!

CV= sigma/medie;===> per total sigma (y) per total / media lui y per total
σ2(y)
Ne folosim de 2 proprietati: (1) Media lui y per total este media aritmetica ponderata a me
y bara bara= sum(yi mediu*ni)/sum(ni) media totala=(y1med*n1+y2med*n2+y
y bara bara=y 738.9

(2). Regula adunarii dispersiilor /Analiza variatiei


Vy=Vy(x)+Vy(u)
σ2(y)=σ2(y/x)+σ2(y/u)
σ2(y)=σ2(y/x)+σ2(y/u)
σ2(y)=dispersia totala a lui y , adesea nu se poate calcula direct
Aici nu cunoastem nici date individuale referitoare la y, si nici date grupate in functie de va
Ca sa pot determina σ2(y) trebuie sa determin cele 2 componente
σ2(y/x)= delta^2= se calculeaza ca diferenta intre mediile de grupa si media per total
delta^2=Sum(yimed-y med total)^2 * ni/sum(ni)=Variatia lui y explicata de factorul de gru
sigma mediu ^2= sum (sigma^2 I *ni) /sum (ni) = Media aritmetica ponderata a dispersiilo

Coeficient
Grupe de Nr. pers ul de
venit (ni) Valoarea variatie al
medie a ratei (CV
rate(lei) %) delta^2=dispersia lui y (x)=(450-738.9)^
<2500 lei 20 450 20 3,821,888
2500-4000
60
lei 600 22 sigma mediu ^2= !!!!!!!!!!!!!!!!!!!!!
4000-6000 80
lei 850 24 Nu avem dispersiile de grupa ?! Avem C
>6000 20 1000 26 Dispersia=(CV* media)^2=
Total 180 sigma1^2=(CV1* y1med)^2=
sigma2^2=(CV2* y2med)^2=
sigma3^2=(CV3* y3med)^2=
sigma4^2=(CV4* y4med)^2=
sigma mediu ^2=sigma1^2*n1+sigma2^
sigma mediu^ 32,715.1
sigma^2(y)=28765+32715.1
Abaterea standard (sigma) lui y per total este
CV(y) per total= sigma (y) per total / y med per total
Distributia persoanelor in functie de rata platita este omogena pe fiecare grupa

b) Care este dispersia valorii ratelor pentru persoanele din categoria de venit <2
Raspuns => sigma1^2= vezi punctul anterior= 8100

c)Calculati R2 si stabiliti in ce proportie factorul de grupare explica rezultatul


R2= se numeste raport de determinare =coeficient de determinare= Raportul din
R2= arata in ce proportie factorul (X) explica rezultatul (Y)
R2=delta^2/ sigma^2 (y)=σ2(y/x)/σ2(y)=Vy(x)/Vy
R2=28765/61480 46.8%
Venitul explica in proportie de 46.8% marimea ratei
d)Testati daca influenta factorului este semnificativa din punct de vedere statisti

Extindere 1) H0 miu1=miu2=miu3=miu4 ==> factorul (Venitul) nu influenteaza re


a H1 cel putin 2 medii difera intre ele===> factorul venitul influenteaz
rezultatel
Inferenta statistica
or de la
esantion 2) Cele 2 ipoteze se testeaza folosind testul Fisher= delta^2/r-1/sigma^
la
populatie r=numarul de grupe/variante ale lui X (r=4) ; n= nr de obbservatii n=

Fisher=28765/(4-1) / (32715.1/180-4))=~

3) La un prag de semnificatie alfa= 5%===> P= 0.95 =95%==> Din distributia Fish

4) Se compara Fisher de la Pasul 2 cu F tabelat=Fcritic (de la pasul 3) ~4


Concl: Deoarece Fisher =55 >>>>> 4==>se respinge ipoteza nula===> Factorul in
Concl: Venitul este un factor cu influenta semnificativa asupra ratei platite

Obs: Acel F~4 din distributia Fisher este sinonimul lui z=2 din Distributia norma
d corelarea venitului cu rata platita.

genitatea pe fiecare grupa si per total

persia valorii ratelor pentru persoanele din categoria de venit <2500 lei?

stabiliti in ce proportie factorul de grupare explica rezultatul

nfluenta factorului este semnificativa din punct de vedere statistic

rea limita admisa daca cele 180 pers reprezinta un esantion extras aleator si repetat (P=0.95)

si per total

=sigma/ medie
nt omogene din perspectiva marimii ratei deoarece CV in fiecare caz este mai mic decat 35%
artim nu nimic!

media lui y per total

este media aritmetica ponderata a mediilor din fiecare grupa;


edia totala=(y1med*n1+y2med*n2+y3med*n3+y4med*n4)/(n1+n2+n3+n4)
lei

dispersiilor /Analiza variatiei

y, si nici date grupate in functie de valorile lui y (valorile ratei)


componente
diile de grupa si media per total
riatia lui y explicata de factorul de grupare (X)
dia aritmetica ponderata a dispersiilor din fiecare grupa= Variatia lui y explicata de alti factori /necunoscuti/ perturbatori

elta^2=dispersia lui y (x)=(450-738.9)^2*20+(600-738.9)^2*60+(850-738.9)^2*80+(1000-738.9)^2*20/ (20+60+80+20)


<===aici a disparut o paranteza!, 28,765
gma mediu ^2= !!!!!!!!!!!!!!!!!!!!!

u avem dispersiile de grupa ?! Avem CV= sigma=radical (dispersie)/ medie, si avem si media
spersia=(CV* media)^2=
gma1^2=(CV1* y1med)^2= 8,100.0
gma2^2=(CV2* y2med)^2= 17,424.0
gma3^2=(CV3* y3med)^2= 41,616.0
gma4^2=(CV4* y4med)^2= 67,600.0
gma mediu ^2=sigma1^2*n1+sigma2^2*n2+sigma3^2*n3+sigma4^2*n4/(n1+n2+n3+n4)
variatia lui y explicata de catre alti factori/ reziduali/necuscuti/perturbatori
61,480
per total este 247.9518
sigma (y) per total / y med per total 0.3355664
platita este omogena pe fiecare grupa de venit si PER TOTAL. Deoarece omogenitatea pe grupe este mai ridicata=> gruparea a fost utila,

u persoanele din categoria de venit <2500 lei?


ctul anterior= 8100

torul de grupare explica rezultatul


oeficient de determinare= Raportul dintre variatia lui y explicata de ex si variatia totala a lui y
ca rezultatul (Y)

mnificativa din punct de vedere statistic

> factorul (Venitul) nu influenteaza rezultatul (Rata)


e ele===> factorul venitul influenteaza rezultatul (Rata)

sind testul Fisher= delta^2/r-1/sigma^2 mediu/ (n-r) sau= Vy(x)/r-1/ Vy(u)/n-r

le lui X (r=4) ; n= nr de obbservatii n=180

55

> P= 0.95 =95%==> Din distributia Fisher se preia valoarea critica F~4

belat=Fcritic (de la pasul 3) ~4


respinge ipoteza nula===> Factorul influenteaza rezultatul semnificativ din punct de vedere statistic.
semnificativa asupra ratei platite

nonimul lui z=2 din Distributia normala


scuti/ perturbatori

0+60+80+20)
idicata=> gruparea a fost utila,
Nr crt Suma chelt de un student in ultima luna
1 12 1) Caracterizati distributia studentilor in functie de suma cheltuita in ultima luna ,folo
2 22 2) Construiti un interval de incredere pentru suma medie cheltuita de un student in
3 40 3) Estimati ce suma cheltuie in total toti studentii (N=2 mil de studenti) cu o Prob=0.
4 45
5 32
6 20 R: Deoarece datele sunt exprimate la nivel individual (la nivel de unitate o
7 90
8 77 Suma chelt de un student in ultima luna
9 40 Mean 65.64583 "x mediu, xmed==>valoarea medie
10 15 Standard Error 6.382148 "=radical (sigma^2(x)/n)"
11 22 Median 52 "50% dintre stud au cheltuit mai m
12 80 Mode 40 "Cei mai multi studenti au cheltuit
13 125 Standard Deviation 44.21682 sigma(x)
14 200 Sample Variance 1955.127 disperia (x)
15 30 Kurtosis 1.926358 Coeficientul de boltire
16 34 Skewness 1.397899 Coeficientul de asimetrie
17 50 Range 188 Amplitudinea=diferenta intre val m
18 90 Minimum 12
19 80 Maximum 200 Cea mai mare suma chelt de un stu
20 65 Sum 3151 suma valorilor
21 55 Count 48 nr valorilor=nr de observatii= volum
22 50 Confidence Level(95.0%) 12.83923 Eroarea maxim admisibila===Delt
23 190 12.7643
24 12
25 45
26 42
27 75
28 45
29 35
30 70
31 75
32 80
33 75
34 20
35 54
36 20
37 40
38 120
39 100
40 95
41 170
42 150
43 100
44 50
45 64
46 60
47 40
48 50
eltuita in ultima luna ,folosind indicatorii descriptivi
heltuita de un student in intreaga populatie
de studenti) cu o Prob=0.95

dual (la nivel de unitate observata) => datele nu sunt grupate

xmed==>valoarea medie". In medie in ultima luna un student a cheltuit 65. 6 lei.


(sigma^2(x)/n)"
re stud au cheltuit mai mult de 52 de lei, 50% au cheltuit mai putin de 52 lei in ultima luna"
multi studenti au cheltuit in ultima luna 40 de lei"

tul de boltire K=3 pt distributia normala


tul de asimetrie Sk=0 pt distributia normala
nea=diferenta intre val maxima si val minima

mare suma chelt de un student in ultiam luna este de 200 de lei

or=nr de observatii= volumul esantionului


maxim admisibila===Delta x =Dx
Nr crt Gen Suma chelt de un student in ultima luna
1B 12 1) Caracterizati distributia studentilor in functie de suma cheltuita in ultima luna ,folosind ind
2B 22 2) Stabiliti daca intre cele doua grupuri de persoane exista diferenta semnificativa
3F 40 3) Construiti un interval de incredere pentru suma medie cheltuita de un student la o P=0.95
4B 45
5B 32
6B 20
7F 90
8F 77
9B 40
10 B 15
11 B 22
12 B 80
13 F 125
14 F 200
15 F 30
16 F 34
17 F 50
18 F 90
19 B 80
20 F 65
21 F 55
22 F 50
23 F 190
24 F 12
25 F 45
26 B 42
27 F 75
28 F 45
29 B 35
30 F 70
31 F 75
32 F 80
33 F 75
34 F 20
35 F 54
36 F 20
37 F 40
38 F 120
39 F 100
40 F 95
41 F 170
42 B 150
43 B 100
44 B 50
45 B 64
46 F 60
47 B 40
48 B 50
ta in ultima luna ,folosind indicatorii descriptivi disponibili pentru fiecare grupa
enta semnificativa
ita de un student la o P=0.95

S-ar putea să vă placă și