Documente Academic
Documente Profesional
Documente Cultură
FacultadCienciasEconmicasyEmpresariales
DepartamentodeEconomaAplicada
Profesor:SantiagodelaFuenteFernndez
EJERCICIOS RESUELTOS DE
ESTADSTICA BIDIMENSIONAL
EJERCICIOSRESUELTOSDEVARIABLEESTADSTICABIDIMENSIONAL
1.Dadalavariableestadsticabidimensional(X,Y)conlatabladefrecuencias
X\Y
1
3
5
1
2
3
0
2
0
1
1
4
1
0
0
6
1
1
5
Sepide:
3
i=1
j =1
a) nij
c) ni y n j
e) a10 y a01
f) a11
g) sxy
i =1 j=1
d) f (xi / Y = 2) y f (y j / X = 3)
Solucin:
a)
3
nij = [ ni1 + ni2 + ni3 + ni4 ] = [ n11 + n12 + n13 + n14 ] + [ n21 + n22 + n23 + n24 ] + [ n31 + n32 + n33 + n34 ] =
i =1 j=1
i=1
= [ 2 + 0 + 1 + 1] + [ 3 + 1 + 0 + 1] + [ 0 + 1 + 0 + 5] = 15
donde N = nij = 15
i =1 j =1
f23 =
n23 0
= =0
N 15
f34 =
n34 5
=
N 15
f21 =
n21 3
=
N 15
c)
X\Y
1
3
5
n j
3
1
2
3
0
5
2
0
1
1
2
4
1
0
0
1
6
1
1
5
7
ni = [n1 + n2 + n3 ] = [4 + 5 + 6] = 15 = nij
i=1
4
i=1 j=1
n j = [n1 + n2 + n3 + n4 ] = [5 + 2 + 1 + 7] = 15 = nij
j =1
i =1 j = 1
ni
4
5
6
15
nij
N
d)
X\Y
1
3
5
1
2
3
0
2
0
1
1
4
1
0
0
6
1
1
5
ni
4
5
n3 = 6
n j
n2 = 2
15
Lasfrecuenciasrelativascondicionadas f (xi / Y = 2) y f (y j / X = 3) :
f (xi / Y = 2) =
n(xi / Y = 2)
1
2
3
0
1
1
n2 = 2
n(y j / X = 3)
1
2
4
6
0
1
0
5
n3 = 6
n(xi / Y = 2)
n2
0
1/2
1/2
1
f (y j / X = 3) =
n (y j / X = 3)
n3
0
1/6
0
5/6
1
e)
3
xi nij
a10 =
i=1 j=1
1
( [x1 n11 + x1 n12 + x1 n13 + x1 n14 ] +
N
+ [x2 n21 + x2 n22 + x2 n23 + x2 n24 ] + [x 3 n31 + x 3 n32 + x 3 n33 + x 3 n34 ] ) =
=
[1.2 + 1.0 + 1.1 + 1.1] + [3.3 + 3.1 + 3.0 + 3.1] + [5.0 + 5.1 + 5.0 + 5.5] = 49 = 3,26
15
otambin, a10 =
xi ni
i=1
y j n j
a01 =
j=1
f)
3
x i y j nij
a11 =
i=1 j=1
15
[1.1.2 + 1.2.0 + 1.4.1 + 1.6.1] + [3.1.3 + 3.2.1 + 3.4.0 + 3.6.1] + [5.1.0 + 5.2.1 + 5.4.0 + 5.6.5] = 205 = 13,66
15
15
2.LascalificacionesobtenidasporungrupodealumnosenEstadstica(E)yMacroeconoma(M):
3
5
E
M
4
5
6
8
7
7
5
7
8
9
7
10
3
4
5
7
4
4
8
10
5
5
5
7
8
9
8
10
8
5
5
7
a)Hallarlatabladefrecuencias
b)Hallarlasdistribucionesmarginales,mediayvarianzadelasmismas
c)Covarianza
Solucin:
a)LavariableE(Estadstica)tomaseisvaloresdiferentes.LavariableM(Macroeconoma)tomasiete
valoresdistintos,porloqueparaformarlatablabastarhacerelrecuentodelasvecesqueserepite
cadapar.
E\M
3
4
5
6
7
8
n j
4
1
1
5
1
1
1
10
2
2
1
2
3
ni
2
2
5
1
2
5
17
4
1
1
1
4
b)
Ei
ni
Ei ni
E2i ni
Mj
n j
Mj n j
M2j n j
3
4
5
6
7
8
2
2
5
1
2
5
17
6
8
25
6
14
40
99
18
32
125
36
98
320
629
4
5
6
7
8
9
10
2
4
0
5
1
2
3
17
8
20
0
35
8
18
30
119
32
100
0
245
64
162
300
903
DistribucinMarginaldeEstadstica:
6
E = a10 =
Ei ni
i =1
99
= 5,82 a20 =
17
E2i ni
i =1
629
2
= 37 sE2 = a20 a10
= 37 5,822 = 3,13
17
DistribucinMarginaldeMacroeconoma:
7
Mj n j
M = a01 =
j=1
119
= 7 a02 =
17
M2j n j
j =1
903
2
= 53,11 sM
= a02 a201 = 53,11 72 = 4 ,11
17
Ei Mj nij
3.4.1 + 3.5.1 + 4.4.1 + 4.5.1 + 5.5.1 + 5.7.4 + 6.8.1 + 7.7.1 + 7.10.1 + 8.5.1 + 8.9.2 + 8.10.2
17
a11 =
i =1 j =1
a11 =
739
= 43,47 sxy = a11 a10 a01 = 43,47 5,82 . 7 = 2,73
17
5
8
n21
7
4
6
Solucin:
X\Y
100
200
n j
5
8
n21
7
4
6
ni
12
n21 + 6
n21 + 8
10
n21 + 18
Porserindependientes:
4
12
10
120
=
4=
4 [n21 + 18] = 120
n21 + 18 n21 + 18 n21 + 18
n21 + 18
X\Y
100
200
n j
5
8
12
20
a10 = x =
2
i =1
i=1 j=1
ni n j
i, j
.
N N
n21 =
120 72
= 12
4
ni
12
18
30
7
4
6
10
100 . 12 + 200 . 18
=
= 160 a01 = y =
30
y j n j
j=1
5. 20 + 7.10
= 5,67
30
xi y j nij
a11 =
xi ni
nij
1
0
1
0
2
1
0
1
3
0
1
0
Solucin:
X\Y
1
0
1
n j
1
0
1
0
1
2
1
0
1
2
ni
1
2
1
4
3
0
1
0
1
LasvariablesXeYsonindependientes
n n n
cuandoseverifica ij = i j i, j
N N N
Nosonindependientesporquenoseverificalarelacin:
3
xi y j nij
a11 =
i = 1 j =1
1
[ 1.2.1 + 1.2.1] = 0
4
3
a10 = x =
xi ni
i=1
1
[ 1.1 + 0.2 + 1.1] = 0 a20 =
4
2
s2x = a20 a10
= 0,5 0 = 0,5 a sx =
x2i ni
i =1
2
1
(1)2 .1 + 0.2 + 12.1 = = 0,5
4
4
y j n j
y2j n j
1
[1.1 + 2.2 + 3.1] = 2 a02 = j=1
N
4
N
2
2
2
s y = a02 a01 = 4 ,5 2 = 0,5 a s y = 0,5 = 0,7
j=1
0,5 = 0,7
a01 = y =
0 2 2
n
n n
. 22 2 2
4 4 4
N N N
18
1 2
= 4 ,5
1 .1 + 22.2 + 32.1 =
4
4
5.Sehanobservado,duranteunmesdeterminado,elgastoeneltelfonomvilyelingresototalen
seisfamilias.Losresultadosobtenidos,expresadosenunidadesmonetariascorrientes,hansido:
Gastotelfonomvil
2
3
6
9
10
11
Familia1
Familia2
Familia3
Familia4
Familia5
Familia6
Ingresototal(mileseuros)
4
6
8
10
12
20
a)Calcularlacovarianzaentreelgastoyelingreso.Alavistadeesteresultado,puedeafirmarque
lasvariablesseandependienteseindependientes?
b)Paraestas6familiasQuvariablesedistribuyedeformamshomognea,elgastoenmviloen
losingresostotales?
Solucin:
a)
Gastotelfonomvil Ingresototal
yi
2
3
6
9
10
11
41
xi
x2i
y2i
xi . yi
4
6
8
10
12
20
60
16
36
64
100
144
400
760
4
9
36
81
100
121
351
8
18
48
90
120
220
504
Laprimeracolumna( yi ),gastodeltelfonomvil,
correspondealavariablequeseestudia,dependiendo
delavariableingresototaldelasfamilias( x i )
yi
41
a01 = y =
=
= 6,83
N
6
i=1
6
a02 =
y2i
i=1
351
=
= 58,5
6
xi
60
a10 = x =
=
= 10
N
6
i=1
x2i
2
s2x = a20 a10
= 126,67 102 = 26,67
760
a20 =
=
= 126,67
N
6
i=1
a11 =
x i . yi
i=1
504
= 84
6
b)
y = 6,83
s y = 11,85 = 3,44
x = 10
sx = 26,67 = 5,16
CVy =
sy
CVx =
3,44
= 0,5037 (50,37%dedispersin)
6,83
s x 5,16
=
= 0,516 (51,6%dedispersin)
x
10
Sedistribuyedeformamshomogneaelingresototaldelasfamilias.
6.Unpsiclogoafirma,basndoseenlosdatosobtenidos,queamedidaqueelniocrecemenores
sonlasrespuestasinadecuadasquedaeneltranscursodeunasituacinexperimental:
Edad
2
3
4
4
5
5
6
7
Nmerorespuestas
inadecuadas
11
12
10
13
11
9
10
7
Edad
7
9
9
10
11
11
12
Nmerorespuestas
inadecuadas
12
8
7
3
6
5
5
a)Determinarlavalidezdelasconclusionesdelpsiclogo
b)Mara,dediezaosymedio,participaenelexperimento,culeselnmeroderespuestas
inadecuadasquesepuedepredecirparaella?
c)Hallarlavarianzaresidual
Solucin:
a)Lavalidezdelaafirmacinseobtendrenfuncindelcoeficientedecorrelacin: r =
s xy
sx sy
xi
yi
2
11
3
12
4
10
4
13
5
11
5
9
6
10
7
7
7
12
15
a11 =
xi yi
i =1
15
a10 = x =
xi
i =1
2 + 3 + 4 + 4 + 5 + L + 11 + 11 + 12 105
=
=7
15
15
11 + 12 + 10 + 13 + L + 6 + 5 + 5 129
=
= 8,6
15
15
15
a01 = y =
yi
i =1
9
8
9
7
10
3
11
6
11
5
12
5
15
a20 =
x2i
i =1
15
a02 =
y2i
i=1
2
s2x = a20 a10
= 58,46 72 = 9,46 a s x = 9,46 = 3,07
s xy
sx sy
8,5 = 2,91
7,6
= 0,85 correlacininversadel85%
3,07 . 2,91
Lavalidezsolicitadaesdel85%encorrelacininversa,esdecir,amedidaqueaumentalaedaddel
nio(X)disminuyelasrespuestasinadecuadas(Y).
b)Parapoderpredecirelnmeroderespuestasparacadaedaddeterminada(casodeMara)ser
necesariohallarlaecuacinderegresindeY(nrespuestasinadecuadas)sobreX(edaddelnio):
yy =
sxy
s2x
(x x ) pendientedelarectacoeficientederegresin: b yx =
sxy
s2x
sxy
s2x
7,6
= 0,80 (rectaderegresindecreciente)
9,46
sr2
2,35875
= 100
= 27,75%
2
8,50
sy
7.Deunavariableestadsticabidimensional(X,Y)seconoce sx = 3 :
1
RectaderegresindeYsobreX: y = 2 + x
2
RectaderegresindeXsobreY: x = 4 + 2 y
a)Hallarelcoeficientedecorrelacin
b)Si x = 2 ,determinar y , a20 , a02 y a11
Solucin:
1
a)LarectaderegresindeYsobreX: y = 2 + x puedeescribirse:
2
1
1
1
y = 2 + x a y 0 = (4 + x) b yx =
2
2
2
Anlogamente,larectaderegresindeXsobreY: x = 4 + 2 y
x = 4 + 2 y a x 0 = 2 (2 + y) bxy = 2
s xy 1
sxy 1
b yx = 2 = 2 9 = 2 s xy = 4 ,5
sx
Sabemosque
sxy
4 ,5
4 ,5
bxy =
= 2 a 2 = 2 a s2y =
= 2,25 a s y =
2
2
sy
sy
r=
s xy
sx sy
2,25 = 1,5
4 ,5
= 1 conloqueexisteunadependenciafuncional,cosaquenoesdeextraarpor
3 . 1,5
y =2+ x
tratarsedenicarectaderegresin.Advirtasequelasrectas:
2 sonlamismarecta,
x = 4 + 2 y
bastaconmultiplicarlaprimerarectapor2ydespejarlax:
1
2 y = 2 2 + x = 4 + x a x = 4 + 2 y
2
x}
=2
1
1
1
b) y = 2 + x a y = 2 + x a y = 2 + 2 = 3
2
2
2
2
s2x = a20 a10
a 32 = a20 22 a a20 = 32 + 22 = 13
8.Enunaexperimentacinsobreelsectortursticosehanobservadodoscaracterescuantitativos(X,
Y),obtenindoselossiguientesresultados:
(0,2),(1,6),(3,14),(1,2),(2,10)
a)Hallarlasdistribucionesmarginales
b)Correlacinentreamboscaracteres
c)Cmocompletaramoslospares(3,),(,4)?.Utilizarparaellolarectaderegresinajustadaa
losdatosobservados.
Solucin:
a)Comonohayrepeticindelospares,latabladedobleentradadefrecuenciasabsolutasvendr
dadadelaforma:
X\Y
0
1
3
1
2
n j
2
1
14
ni
1
1
1
1
1
5
10
1
1
1
1
1
1
LasdistribucionesmarginalesdelaXeY,respectivamente,sern:
xi
yj
14
10
ni
n j
b)Paraestudiarlacorrelacinseformalatablaadjunta,dondenofiguralacolumnadelas
frecuenciasabsolutasporserlaunidadparatodoslospares
xi
yi
xi yi
0
1
3
1
2
5
2
6
14
2
10
30
0
6
42
2
20
70
x2i
0
1
9
1
4
15
y2i
4
36
196
4
100
340
a11 =
xi yi
i=1
70
= 14
5
x = a10 =
xi
i=1
5
=1
5
a20 =
x2i
i=1
15
=3
5
2
s2x = a20 a10
= 3 12 = 2
sx =
2 = 1,41
yi
30
y = a01 =
=
=6
N
5
i=1
a02 =
y2i
i =1
340
=
= 68
5
s xy
r=
s 2x s 2y
sy =
32 = 5,66
8
=1
2 . 32
Comoelcoeficientedecorrelacinesiguala1,indicaqueexisteunadependenciafuncionalentrelas
variables(X,Y)estudiadas.
c)Paracompletarelpar(3,)hayquehallarlaecuacindelarectaderegresindeYsobreX.
Anlogamente,paracompletarelpar(,4)hayquehallarlaecuacindelarectaderegresindeX
sobreY.
RectaderegresindeYsobreX:
yy =
sxy
s2x
(x x ) ,dondeelcoeficientederegresin b yx =
x = 1 y = 6 b yx =
s xy
s2x
sxy
s2x
(pendientedelarecta)
8
=4
2
yy =
s xy
s2x
(x x) a y 6 = 4 (x 1) a y = 2 + 4 x
xx =
sxy
s2y
(y y) ,dondeelcoeficientederegresin bxy =
x = 1 y = 6 bxy =
sxy
s2y
xx =
s2y
(pendientedelarecta)
8 1
=
32 4
sxy
Elpar(,4)secompleta: x =
sxy
s2y
(y y) a x 1 =
1
1
(y 6) a x = ( 2 + y)
4
4
1
[ 2 + 4] = 1 1 ,
2
4
2
9.SedeseaestudiarlarelacinqueexisteentrelavariableX(porcentajedelapoblacinurbanaen
lasdistintasprovincias)eY(rentamediaporhogar).Latablaadjuntacontienedatosreferentesa
treintaprovincias:
X\Y
1019
1928
2837
3745
116
1
1631
1
8
3
2
3146
1
3
7
3
4660
a)Calcularlasrectasderegresin
Solucin:
a)
X\Y
1019
1928
2837
3745
n j
116
1
1631
1
8
3
2
14
3146
1
3
7
3
14
ni
3
11
11
5
30
4660
1
1
LasdistribucionesmarginalesdeXeY,respectivamente:
Intervalos
xi
ni
xi ni
x2i ni
1019
1928
2837
3745
14,5
23,5
32,5
41
3
11
11
5
30
43,5
258,5
357,5
205
864,5
630,75
6074,75
11618,75
8405
26729,25
xi ni
864,5
= 28,81
N
30
2
s2x = a20 a10
= 890,975 28,812 = 60,959
x = a10 =
i=1
a20 =
sx =
Intervalos
yj
n j
y j n j
y2j n j
116
1631
3146
4660
8,5
23,5
38,5
53
1
14
14
1
30
8,5
329
539
53
929,5
72,25
7731,5
20751,5
2809
31364,25
j=1
26729,25
= 890,975
N
30
60,959 = 7,807
i =1
y j n j
y = a01 =
x2i ni
929,5
= 30,98
30
y2j n j
a02 =
j =1
31364,25
= 1045,475
30
sy =
85,7146 = 9,258
Ladistribucinconjunta
xi \ y j
8,5
23,5
38,5
14,5
23,5
32,5
41
1
8
3
2
1
3
7
3
53
a11 =
xi yi nii
i=1
14 ,5. 8,5. 1 + 14 ,5. 23,5.1 + 14 ,5. 38,5.1 + 23,5. 23, 5.8 + L + 41. 38,5. 3 27589,5
=
= 919,65
30
30
sxy
s2x
(x x) a y 30,98 =
Coeficientederegresin: b yx =
y = 18,30 + 0,44 x
m11 27,1162
=
= 0,44 > 0 (rectaderegresincreciente)
60,959
2x
9 RectaderegresindeXsobreY: x x =
sxy
s2y
(y y) a x 28,81 =
Coeficientederegresin: bxy =
27,1162
(x 28,81)
60,959
sxy
s2y
27,1162
(y 30,98)
85,7146
x = 19,20 + 0,31 y
27,1162
= 0,31 > 0 (rectaderegresincreciente)
85,7146
10.Justifiquelasrazonesporlascualesdebeaceptarseorechazarsequelasdosrectassiguientes
sean,respectivamente,laslneasderegresinmnimocuadrticasdeYsobreXydeXsobreYdeuna
seriedeobservaciones.
Y/X: Y = 2X + 1
X/Y: X = 5Y + 10
Solucin:
Y = 1 + 2X
X = 10 5 Y
byx = 2 > 0
bxy = 5 < 0
Loscoeficientesderegresindebentenerelmismosigno,al
dependerambosdelamismacovarianza.
Conlocual,nopuedenserrectasderegresin.
11.Justifiquelasrazonesporlascualesdebeaceptarseorechazarsequelasdosrectassiguientes
sean,respectivamente,laslneasderegresinmnimocuadrticasdeYsobreXydeXsobreYdeuna
seriedeobservaciones.
Y/X: Y = 2X + 1
X/Y: X = 5Y + 10
Solucin:
b yx = 2 > 0
Y = 1 + 2X
X = 10 + 5 Y bxy = 5 > 0
Loscoeficientesderegresintienenelmismosigno,loquees
lgicoaldependerambosdelamismacovarianza.
Deotraparte,elcoeficientedecorrelacin: r =
b yx . b xy =
2 . 5 = 3,16 ,resultadoabsurdocuando
elcoeficientedecorrelacin 1 r 1 ,concluyendoquenopuedenserrectasderegresin.
12.ElcoeficientedecorrelacinentredosvariablesXeYes0,6.Sabiendoademsque,
sx = 1,5 y = 20 s y = 2
x = 10
a)HallarlasrectasderegresindeY/XydeX/Y
b)Calcularlavarianzaresidualparalasdosregresionesanteriores
Solucin:
RectaderegresindeYsobreX: y y =
sxy
RectaderegresindeXsobreY: x x =
sxy
Elcoeficientedecorrelacin: r =
Enconsecuencia, byx =
sxy
s2x
s2x
s2y
b yx . b xy =
(x x) a byx =
(y y) a bxy =
s xy
sx .sy
a 0,6 =
sxy
s2x
sxy
s2y
(coeficienteregresin)
(coeficienteregresin)
s xy
1,5 . 2
a s xy = 1,8
s
1,8
1,8
= 0,8 bxy = xy
= 2 = 0,45
2
2
sy 2
1,5
Lasrectasderegresinsern:
1 r2
1 r2
Y/X s =s
Y / X s r2 = s 2y 1 r 2
r
y
b)Varianzaresidual
Errortpicoestimacin
X / Y s2 = s2 1 r2
X/Y s =s
r
x
r
x
Y / X sr2 = 22 1 0,62
a sr2 = 2,56 sr = 2,56 = 1,6
portanto,
X / Y s2 = 1,52 1 0,62 a s2 = 1,44 s = 1,44 = 1,2
r
r
r
13.Enunadistribucinbidimensionalseconoce:
R = 0,7
s x = 1,2
y=4
X / Y : X = 0,6 + 0,44 Y
Obtener:
a)MediadeX
b)RectaderegresindeY/X
c)VarianzadeY
d)Covarianzadeambasvariables
Solucin:
X = 0,6 + 0,44 Y
a)RectaderegresindeXsobreY: X = 0,6 + 0,44 Y a
X = 0,6 + 0,44 . 4 = 2,36
b)LarectaderegresindeY/X:
a = 0,6
siendo X = 0,6 + 0,44 Y a
bxy = 0,44
r 2 = b yx . b xy
a 0,72 = b yx . 0,44 a b yx =
0,72
= 1,114
0,44
b
conlocual,larectaderegresindeYsobreX: y y =
yx
}
sxy
c)VarianzadelaY:Sabemosque, s x = 1,2
b yx =
m11
a
2x
1,114 =
recurriendoa bxy =
sxy
s2y
sxy
2
1,2
bxy = 0,44
b yx = 1,114
a 0,44 =
1,604
a
s2y
s2y =
1,604
= 3,645
0,44
14.Seanlasvariablesestadsticasbidimensionales(X,Y),dondeX="PIBpercpita(enmilesde
dlares)eY="Tasanaturaldecrecimientodemogrficode162pasesdelmundo".Seconocenlos
datossiguientes:
x = 978,9
x2 = 17569,9
y = 2886,4
y2 = 172291,2
xy = 8938,4
a)Obtenerlarectaderegresinquepretendeexplicarlatasanaturaldecrecimientoenfuncindela
rentadelpas.
b)Interpretarloscoeficientesdelarectaestimada.
c)Obtenerunamedidadebondaddelajusteeinterpretarsisteesbueno.
Solucin:
b
a)SetratadeencontrarlarectaderegresindeYsobreX: y y =
yx
}
sxy
x 978,9
x2 17569,9
a10 = x = =
= 6,04 a20 = =
= 108,456
N
162
N
162
s2x
(x x )
2
s2x = a20 a10
= 108,456 6,042 = 71,97
y 2886,4
y2 172291,2
a01 = y = =
= 17,82 a02 = =
= 1063,526
N
162
N
162
s2y = a02 a201 = 1063,526 17,822 = 745,97
x y 8938,4
a11 = =
= 55,175 s xy = a11 a10 a01 = 55,175 6,04 . 17,82 = 52,46
N
162
ElcoeficientederegresindeYsobreX(pendientedelarecta): byx =
sxy
s2x
52,46
= 0,729
71,97
sxy
s2y
52,46
= 0,07
745,97
y = 22,22 0,729 x
Elcoeficientedecorrelacinlineal: r =
variables,pudiendoexistirotrotipodecorrelacin)
15.Lasiguientedistribucinbidimensionalseexpresaenlasiguientetabladecorrelaciones.La
variableXrepresentalosingresosfamiliaresmensualesenunidadesde10euros.LavariableY
representa,asuvez,losmetroscuadradosdelaviviendafamiliar.
X/Y
50100
100200
200350
350500
>500
<60
20
25
5
0
0
6080
18
40
10
5
1
80100
2
30
15
15
2
100150
1
2
25
20
7
>150
0
1
3
8
10
a)Calcularladistribucinmarginaldelasdosvariables.Sonindependienteslosingresosfamiliares
yeltamaodelaviviendadondehabitan?
b)Obtenerladistribucindelasuperficiedelaviviendacondicionadaalintervalomodaldelos
ingresosfamiliares.
c)Calcularladistribucindelosingresoscondicionadaalintervalomedianodelaviviendafamiliar.
Solucin:
a)
X/Y
<60
6080
80100
100150
>150
ni
50100
100200
200350
350500
>500
n j
20
25
5
0
0
50
18
40
10
5
1
74
2
30
15
15
2
64
1
2
25
20
7
55
0
1
3
8
10
22
41
98
58
48
20
N=265
0,189
0,279
0,242
0,208
0,083
f j =
n j
N
fi =
ni
N
0,155
0,370
0,219
0,181
0,075
1
Paraquelosingresosfamiliares(X)yeltamaodelaviviendafamiliar(Y)seanindependientesdebe
n n n
verificarse ij = i j i, j
N N N
n
n n
15
48 64
Nosonindependientesporque 43 4 3 a
N
4 N
265 265 265
DISTRIBUCINMARGINALDELAVARIABLEX
Intervalos
xi
ni
ci
50100
100200
200350
350500
>500
75
150
275
425
41
98
58
48
20
265
50
100
150
150
ni
N
0,155
0,370
0,219
0,181
0,075
1
fi =
Fi =
Ni
Ni
N
41
139
197
245
265
0,155
0,525
0,744
0,925
1
Nj
F j =
hi =
ni
ci
0,82
0,98
0,39
0,32
f j =
Intervalos
yj
n j
cj
<60
6080
80100
100150
>150
70
90
125
50
74
64
55
22
265
20
20
50
n j
N
0,189
0,279
0,242
0,208
0,083
1
50
124
188
243
265
N/2=132,
DISTRIBUCINMARGINALDELAVARIABLEY
N j
N
0,189
0,468
0,71
0,918
1
hj =
nj
cj
3,7
3,2
1,1
mediano
b)X="ingresosfamiliares"eY="metroscuadradosdelasuperficie"
yj
n j / 50 100
nj / 100 200
nj / 200 350
n j / 350 500
nj / > 500
<60
6080
80100
100150
>150
20
18
2
1
0
41
25
40
30
2
1
98
5
10
15
25
3
58
0
5
15
20
8
48
0
1
2
7
10
20
ConlosdatosdisponiblesnosepuedecalcularelintervalomodaldelavariableX,alnopodercalcular
todaslasdensidadesdefrecuenciasmarginales,esimposiblehacerloeneltramo(>500)quetiene
unaamplitudilimitada.
c)LadistribucincondicionadadelavariableXalintervalomedianodelaY(viviendafamiliar):
X /Y
50100
100200
200350
350500
>500
<60
20
25
5
0
0
6080
18
40
10
5
1
80100 100150
2
1
30
2
15
25
15
20
2
7
>150
0
1
3
8
10
Intervalos
50100
100200
200350
350500
>500
2
30
15
15
2
Y / X : Y = 3 + 2X
X / Y : X = 2 + 0,3 Y
= 3,2 .Obtenerlavarianzaresidualdelasdosrectasderegresin.
16.Seconocenlasregresiones
Sabiendoademsque s xy
Solucin:
xy = 3,2
b = s / s2 s
byx = 2
s xy = 3,2
2
X / Y : X = 2 + 0,3 Y
s2y = 3,2 / 0,3 = 10,67
bxy = 0,3
bxy = sxy / s y
Varianzaresidual
X / Y : s 2 = s 2 1 r 2 s 2 = 1,6 [ 1 0,6] = 0,64
r
x
r
Y/X: s =s
r
y
Errortpicoestimacin
X/Y: s =s
r
x
1 r2
sr =
4 ,268 = 2,066
1 r2
sr =
0,64 = 0,8
17.Seanlassiguientesecuacioneslasrectasderegresindeunavariablebidimensional(Y,X;nij)
X 2Y = 3
X 4Y = 2
a)CuldeestasrectascorrespondealaregresindeY/XyculalaregresindeX/Y?
b)HallarlasmediasaritmticasdeYsobreX
c)Cuntovaleelcoeficientedecorrelacinlineal?
Solucin:
a)
recta regresin X / Y
X 2Y = 3
Sea
recta regresin Y / X
X 4 Y = 2
a = 3
X = 3 + 2Y a
bxy = 2
a signo (bxy ) = signo (b yx )
a' = 1 / 2
1
1
Y = + X a
2 4
b yx = 1 / 4
1
Coeficientededeterminacin r 2 = b xy . b yx = 2 . = 0,5 < 1
4
recta regresin Y / X
X 2Y = 3
Sea
recta regresin X / Y
X 4 Y = 2
a = 3 / 2
3 1
Y = + X a
2 2
b yx = 1 / 2
a signo (b yx ) = signo (bxy )
'
X = 2+ 4Y a a = 2
bxy = 4
1
Coeficientededeterminacin r 2 = b yx . b xy = . 4 = 2 > 1 cosaquenoesposible (0 r 2 1)
2
X / Y : X = 3 + 2Y
Enconsecuencia
1 1
Y / X : Y = 2 + 4 X
regresinpasanporelpunto(0,0).Culeselgradodebondaddelajuste?.
Solucin:
Y = 10 + 0,45 X
r2 = 0,9
x = 20
CalcularlosparmetrosderegresindeXsobreY
Solucin:
Y = 10 + 0,45 X
a = 10
0,9
r2 = byx .bxy
= 2 (pendiente recta)
a
}
y = a + b. x
Deotraparte, y = a + b . x y = 10 + 0,45 . 20 = 19
bxy
}
}xy
x = a' + b'. y
Anlogamente, x = a'+ b' . y
a' = x b' . y a' = 20 2.19 = 18
LarectaderegresindeX/Y: Y = 18 + 2 X
20.CulesdelossiguientesparesdeposiblesrectasderegresindeY/XydeX/Yrealmente
puedenserlo?.Razonelarespuesta.
a) Y = 3 + 4X siendo X = 2 + Y
b) Y = 3 + 2X siendo X = 2 0,3 Y
c) Y = 3 + 2X siendo X = 2 + 0,2 Y
Solucin:
a=3
Y / X : Y = 3 + 4 X a
b yx = 4 > 0
X / Y : X = 2 + Y a a' = 2
b xy = 1 > 0
a=3
Y / X : Y = 3 + 2X a
byx = 2 > 0
X / Y : X = 2 0,3 Y a a' = 2
a=3
Y / X : Y = 3 + 2X a
b yx = 2 > 0
X / Y : X = 2 + 0,2 Y a a' = 2
b xy = 0,2 > 0
signo (b yx ) = signo (b xy )
a 2
coeficientes coherentes
r = b yx . b xy = 2 . 0,2 = 0,4 < 1
signo (b yx ) = signo (b xy )
a 2
r = b yx . b xy = 4.1 = 4 > 1 contradiccin
21.Comprobarsisoncoherenteslosresultadosobtenidosalajustarlarectaderegresin:
a) Y = A + b X a s xy = 20
s2x = 10
y =8
x =4
b) Y = A + b X a s2y = 4
s xy = 4
2
= 0,4
sry
s2x = 5
a=3
Solucin:
a)
s xy 20
b = b yx = 2 = 10 = 2
sx
Y = A + bX a
y = a + b x a a = y b x = 8 2. 4 = 0 3
b)Losdatosnocorrespondenaunarectaderegresincomopuedeobservarse.
2
sry = s2y (1 r2 ) a 0,4 = 4 (1 r2 ) a 0,1 = (1 r2 ) a r2 = 0,9 a r = 0,94
s xy 4
Y = a + b X a b = b yx = 2 = = 0,8
sx 5
2
2
2
2
s xy
sry
sry
42
0,4
2
a
r
=
=
1
r
=
=
0
,
8
= 1
= 0,9
2 2
2
2
5. 4
4
sy
sx .s y
sy
22.Enunadistribucinbidimensional(X,Y)sehaajustadounaregresinlinealentrelasdos
Solucin:
a)
RectaderegresindeXsobreY
Y = 4X
sxy
x x = 2 (y y)
sy
a' = 0
=a'+b'y
X = 1 Y x
4
b' = bxy = 1 / 4 (pendiente recta)
b }
b'
}
1
2
r = b yx .bxy a 0,82 = b yx .
a b yx = 2,56
4
covarianza (sxy ) b
}
b = sxy a s = b . s2 a s = (2,56). 42 = 40,96
xy
yx x
xy
yx s2x
VarianzaY (s2y )
MediaX (x)
b'
}
sxy
sxy
bxy = 2 a s2y =
bxy
sy
a s2y =
40,96
= 163,84
1/4
r
1
E[x ]=E[a'+b'y ] a x =a'+b'y
x = a'+b' y x = 0 + . 2 = 0,5
4
b)
RectaderegresindeYsobreX
c)
VarianzaresidualdeX:
b=byx
s
y y = xy (x x ) a y = a + b x
s2x
40,96
y 2 = 2 (x 0,5) a y = 0,72 + 2,56 x
4
2
2
srx
= s2x (1 r2 ) a srx
= 16 (1 0,64) = 5,76
23.Sedeseaestudiarlarepercusinquetienelosdasdelluviaenelnmerodevisitasalzoo.Para
ello,seobservaronlassiguientesvariables,durantelosltimosdiezaos,siendoY="nvisitas
anuales,enmiles"yX="ndedasdelluviaalao":
Ao
X
Y
1994
18
107
1995
26
105,5
1996
30
105
1997
33
104,4
1998
38
104,3
1999
39
104
2000
42
103,7
2001
44
103,4
2002
46
103,1
2003
49
103
a)Coeficientedecorrelacinlinealeinterpretarelresultado.
b)Rectaderegresinqueexpliqueelnmerodevisitasanualesenfuncindelnmerodelluvia.
c)QuprevisindevisitashabrparaelaoprximosielInstitutoMeteorolgicoinformaque
llover40das?.Qugradodefiabilidadtendrestaprediccin?.
d)Hallarlavarianzaresidualdelnmerodevisitasanuales.
e)ObtenerlarectaderegresinX/Y.
Solucin:
Ao
xi
yi
xi . yi
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
10
18
26
30
33
38
39
42
44
46
49
365
107
105,5
105
104,4
104,3
104
103,7
103,4
103,1
103
1043,4
1926
2743
3150
3445,2
3963,4
4056
4355,4
4549,6
4742,6
5047
37978,2
x2i
324
676
900
1089
1444
1521
1764
1936
2116
2401
14171
y2i
11449
11130,25
11025
10899,36
10878,49
10816
10753,69
10691,56
10629,61
10609
108881,96
DistribucinmarginaldeX
10
10
xi
365
= 36,5
a10 = x = i=1 =
N
10
x2i
14171
= 1417,1
a20 = i=1 =
N
10
2
s2x = a20 a10
= 1417,1 36,52 = 84 ,85
s x = 84 ,85 = 9,21
DistribucinmarginaldeY
10
a01 = y =
yi
i=1
10
1043,4
= 104,34
10
a02 =
s y = 1,36 = 1,17
y2i
i=1
108881,96
= 10888,196
10
CovarianzaCoeficientesregresinlinealCoeficientecorrelacinlineal
10
a11 =
xi . yi
i=1
37978,2
= 3797,82
10
sxy 10,59
Y / X : b yx = 2 =
= 0,125
84 ,85
sx
Coeficientesregresinlineal:
b'
}
X / Y : b = sxy = 10,59 = 7,79
xy
1,36
s2y
Coeficientedecorrelacinlineal:
Observandolagrficadelanubedepuntosamsdasdelluvia
menornmerodevisitas. Elgradodeajusteentrelanubede
puntosylarectaderegresinesdel98,6%.
b)RectaderegresindeYsobreX:
b=byx
y y =
}
s yx
s2x
c)Sien2007seestiman40dasdelluviaseestimanunnmerodevisitas:
y = 108,90 0,125 (40) 104 das
d)LavarianzaresidualdelaY:
2
2
sry
= s2y (1 r2 ) a sry
= 1,36 (1 0,9862 ) = 0,0378 (3,78%causasajenasalaregresin)
e)RectaderegresindeXsobreY:
b'=bxy
x x =
}
s yx
s2y
X / Y : x = 849,31 7,79 y a y =
849,31 x
7,79
NOTA.PararepresentarconjuntamenteenEXCELlasdosrectasderegresin(Y/X,X/Y)sehande
introducirdosseries:Serie1(X,Y),Serie2(X, Y)
24.LasnotasenEstadstica(X)yenMatemticas(Y)obtenidaspor10alumnoselegidosalazarenun
grupodeprimercursodelaFacultaddeCienciasEconmicasyEmpresarialeshansidolassiguientes,
segnelordendeseleccindelamuestra:
Norden
X
Y
1
9
8
2
7
5
3
3
4
4
6
2
5
7
9
6
5
6
7
10
10
8
8
9
9
3
1
10
5
5
a)Representarlanubedepuntoscorrespondienteaestadistribucin.Quhiptesispueden
hacersealavistadelarepresentacin?.
b)EstimarlosparmetrosdelarectaderegresinY/X.Interpretarloscoeficientescalculados.
c)EstimarlosparmetrosdelarectaderegresindeX/Yycompararambasrectas.
d)Representarlasdosrectasderegresinjuntoalanubedepuntos.
e)CalcularlavarianzaresidualenlaregresinY/X.Coincidirconlavarianzaresidualenla
regresinX/Y?
f)Paraunalumnoquehayaobtenidoun7enMatemticas,qunotaselepronosticaraen
Estadstica?
g)Paraunalumnoquehayaobtenidoun4enEstadstica,qunotaselepronosticaraen
Matemticas?
Solucin:
a)
Observandolanubedepuntos(diagramadedispersin)se
puedeestablecerlahiptesisdequeexistecorrelacinlineal
crecienteentrelasvariables.
b)EstimarlosparmetrosdelarectaderegresinY/X
Norden
xi
yi
xi . yi
x2i
1
9
8
72
81
2
7
5
35
49
3
3
4
12
9
4
6
2
12
36
5
7
9
63
49
6
5
6
30
25
7
10
10
100
100
8
8
9
72
64
9
3
1
3
9
10
5
5
25
25
63
59
424
447
y2i
64
25
16
81
36
100
81
25
433
DistribucinmarginaldeX
10
a10 = x =
xi
i=1
10
63
= 6,3
10
a20 =
x2i
i=1
447
= 44 ,7
10
2
s2x = a20 a10
= 44 ,7 6,32 = 5,01
sx = 5,01 = 2,24
DistribucinmarginaldeY
10
a01 = y =
yi
i=1
10
59
= 5,9
10
a02 =
y2i
i=1
433
= 43,3
10
s y = 8,49 = 2,91
CovarianzaCoeficientesregresinlinealCoeficientecorrelacinlineal
10
a11 =
xi . yi
i=1
424
= 42,4
10
ParmetrosregresinlinealY/X
Y = a + b X a Y = 0,677 + 1,044 X
s xy 5,23
= 1,044 > 0
b = b yx = 2 =
s x 5,01
Elcoeficientederegresinbespositivo,conlo
queamayornotaenestadsticamayornotaen
matemticas.Deotraparte,elcoeficientede
correlacinres0,80,conloquelafiabilidaddel
modeloesdel80%.
c)
ParmetrosregresinlinealX/Y
X = a' + b' Y a X = 2,665 + 0,616 Y
s xy 5,23
= 0,616 > 0
b' = bxy = 2 =
8
,
49
s
y
Elcoeficientederegresinb'espositivo,conloquea
mayornotaenmatemticasmayornotaenestadstica.
X 2,665
se
Deotraparte, X = 2,665 + 0,616 Y a Y =
0,616
utilizapararepresentarenExcellaserie (X , Y) ,quejunto
alaserie(X,Y),permitelagrficaconjuntadelanubede
puntosylasdosrectasderegresin.
d)PararepresentarenExcellasdosrectasderegresinjuntoalanubedepuntos.
X
Y
Y
9
8
10,28
7
5
7,04
3
4
0,54
6
2
5,41
7
9
7,04
5
6
3,79
10
10
11,91
8
9
8,66
3
1
0,54
5
5
3,79
Diagramadispersin:Series(X,Y),(X, Y)
Y = (X 2,665) / 0,616
e)Varianzasresiduales
VarianzaresidualdeY/X: r2 = 0,643 s2y = 8,49
2
2
sry
= s2y (1 r2 ) a sry
= 8,49 (1 0,643) = 3,03
2
2
srx
= s2x (1 r2 ) a srx
= 5,01 (1 0,643) = 1,79
f)Unalumnoconun7enMatemticas (, 7) parapronosticarlanotaenEstadsticahabraque
recurriralarectaderegresindeX/Y: X = 2,665 + 0,616 Y
X = 2,665 + 0,616.7 = 6,98 enestadstica
g)Unalumnoconun4enEstadstica (4 , ) parapronosticarlanotaenMatemticashabraque
recurriralarectaderegresindeY/X: Y = 0,677 + 1,044 X
Y = 0,677 + 1,044 . 4 = 3,50 enmatemticas