Sunteți pe pagina 1din 29

GradoAdministracinyGestin

FacultadCienciasEconmicasyEmpresariales
DepartamentodeEconomaAplicada
Profesor:SantiagodelaFuenteFernndez

EJERCICIOS RESUELTOS DE
ESTADSTICA BIDIMENSIONAL

EJERCICIOSRESUELTOSDEVARIABLEESTADSTICABIDIMENSIONAL
1.Dadalavariableestadsticabidimensional(X,Y)conlatabladefrecuencias
X\Y
1
3
5

1
2
3
0

2
0
1
1

4
1
0
0

6
1
1
5

Sepide:
3

i=1

j =1

a) nij

b) f23 , f34 , f21

c) ni y n j

e) a10 y a01

f) a11

g) sxy

i =1 j=1

d) f (xi / Y = 2) y f (y j / X = 3)

Solucin:

a)
3

nij = [ ni1 + ni2 + ni3 + ni4 ] = [ n11 + n12 + n13 + n14 ] + [ n21 + n22 + n23 + n24 ] + [ n31 + n32 + n33 + n34 ] =
i =1 j=1

i=1

= [ 2 + 0 + 1 + 1] + [ 3 + 1 + 0 + 1] + [ 0 + 1 + 0 + 5] = 15

b)Cada nij representalafrecuenciaabsolutadelpar (xi , y j ) ,lafrecuenciarelativasedefine fij =


3

donde N = nij = 15
i =1 j =1

f23 =

n23 0
= =0
N 15

f34 =

n34 5
=
N 15

f21 =

n21 3
=
N 15

c)
X\Y
1
3
5
n j
3

1
2
3
0
5

2
0
1
1
2

4
1
0
0
1

6
1
1
5
7

ni = [n1 + n2 + n3 ] = [4 + 5 + 6] = 15 = nij
i=1
4

i=1 j=1

n j = [n1 + n2 + n3 + n4 ] = [5 + 2 + 1 + 7] = 15 = nij
j =1

i =1 j = 1

ni
4
5
6
15

nij
N

d)
X\Y
1
3
5

1
2
3
0

2
0
1
1

4
1
0
0

6
1
1
5

ni
4
5
n3 = 6

n j

n2 = 2

15

Lasfrecuenciasrelativascondicionadas f (xi / Y = 2) y f (y j / X = 3) :
f (xi / Y = 2) =

n(xi / Y = 2)

1
2
3

0
1
1
n2 = 2

n(y j / X = 3)

1
2
4
6

0
1
0
5
n3 = 6

n(xi / Y = 2)
n2

0
1/2
1/2
1
f (y j / X = 3) =

n (y j / X = 3)
n3

0
1/6
0
5/6
1

e)
3

xi nij
a10 =

i=1 j=1

xi [ni1 + ni2 + ni3 + n14 ]


i =1

1
( [x1 n11 + x1 n12 + x1 n13 + x1 n14 ] +
N
+ [x2 n21 + x2 n22 + x2 n23 + x2 n24 ] + [x 3 n31 + x 3 n32 + x 3 n33 + x 3 n34 ] ) =
=

[1.2 + 1.0 + 1.1 + 1.1] + [3.3 + 3.1 + 3.0 + 3.1] + [5.0 + 5.1 + 5.0 + 5.5] = 49 = 3,26
15

otambin, a10 =

xi ni
i=1

1.4 + 3.5 + 5.6


49
==
= 3,26
15
15

y j n j
a01 =

j=1

1.5 + 2.2 + 4.1 + 6.7 55


=
= 3,6
15
15

f)
3

x i y j nij
a11 =

i=1 j=1

15

[1.1.2 + 1.2.0 + 1.4.1 + 1.6.1] + [3.1.3 + 3.2.1 + 3.4.0 + 3.6.1] + [5.1.0 + 5.2.1 + 5.4.0 + 5.6.5] = 205 = 13,66
15

15

g) sxy = a11 a10 a01 = 13,66 3,26 . 3,6 = 1,924

2.LascalificacionesobtenidasporungrupodealumnosenEstadstica(E)yMacroeconoma(M):
3
5

E
M

4
5

6
8

7
7

5
7

8
9

7
10

3
4

5
7

4
4

8
10

5
5

5
7

8
9

8
10

8
5

5
7

a)Hallarlatabladefrecuencias
b)Hallarlasdistribucionesmarginales,mediayvarianzadelasmismas
c)Covarianza
Solucin:

a)LavariableE(Estadstica)tomaseisvaloresdiferentes.LavariableM(Macroeconoma)tomasiete
valoresdistintos,porloqueparaformarlatablabastarhacerelrecuentodelasvecesqueserepite
cadapar.
E\M
3
4
5
6
7
8
n j

4
1
1

5
1
1
1

10

2
2

1
2
3

ni
2
2
5
1
2
5
17

4
1
1

1
4

b)

Ei

ni

Ei ni

E2i ni

Mj

n j

Mj n j

M2j n j

3
4
5
6
7
8

2
2
5
1
2
5
17

6
8
25
6
14
40
99

18
32
125
36
98
320
629

4
5
6
7
8
9
10

2
4
0
5
1
2
3
17

8
20
0
35
8
18
30
119

32
100
0
245
64
162
300
903

DistribucinMarginaldeEstadstica:
6

E = a10 =

Ei ni
i =1

99
= 5,82 a20 =
17

E2i ni
i =1

629
2
= 37 sE2 = a20 a10
= 37 5,822 = 3,13
17

DistribucinMarginaldeMacroeconoma:
7

Mj n j
M = a01 =

j=1

119
= 7 a02 =
17

M2j n j
j =1

903
2
= 53,11 sM
= a02 a201 = 53,11 72 = 4 ,11
17

c)Parahallarlacovarianza: sxy = a11 a10 a01


6

Ei Mj nij

3.4.1 + 3.5.1 + 4.4.1 + 4.5.1 + 5.5.1 + 5.7.4 + 6.8.1 + 7.7.1 + 7.10.1 + 8.5.1 + 8.9.2 + 8.10.2
17

a11 =

i =1 j =1

a11 =

739
= 43,47 sxy = a11 a10 a01 = 43,47 5,82 . 7 = 2,73
17

3.Dadalatabladecorrelaciones.Hallar n21 paraquelasdosvariablesseanestadsticamente


independientesycalcularsucovarianzaenestecaso.
X\Y
100
200

5
8
n21

7
4
6

Solucin:

X\Y
100
200
n j

5
8
n21

7
4
6

ni
12
n21 + 6

n21 + 8

10

n21 + 18

Porserindependientes:

4
12
10
120
=
4=
4 [n21 + 18] = 120
n21 + 18 n21 + 18 n21 + 18
n21 + 18

covarianza: sxy = a11 a10 a01

X\Y
100
200
n j

5
8
12
20

a10 = x =
2

i =1

i=1 j=1

ni n j
i, j
.
N N

n21 =

120 72
= 12
4

ni
12
18
30

7
4
6
10

100 . 12 + 200 . 18
=
= 160 a01 = y =
30

y j n j
j=1

5. 20 + 7.10
= 5,67
30

xi y j nij
a11 =

xi ni

nij

100 . 5. 8 + 100 . 7 . 4 + 200 . 5.12 + 200 . 7 . 6 27200


=
= 906,67
30
30

sxy = a11 a10 a01 = 906,67 160 . 5,67 = 0,53

4.Apartirdelasiguientedistribucinbidimensional (Xi , Yj ; nij ), calcular: x , y , s 2x , s 2y y s xy .Son


independienteslasvariablesXeY?
X\Y
1
0
1

1
0
1
0

2
1
0
1

3
0
1
0

Solucin:

X\Y
1
0
1
n j

1
0
1
0
1

2
1
0
1
2

ni
1
2
1
4

3
0
1
0
1

LasvariablesXeYsonindependientes
n n n
cuandoseverifica ij = i j i, j
N N N

Nosonindependientesporquenoseverificalarelacin:
3

xi y j nij
a11 =

i = 1 j =1

1
[ 1.2.1 + 1.2.1] = 0
4
3

a10 = x =

xi ni
i=1

1
[ 1.1 + 0.2 + 1.1] = 0 a20 =
4

2
s2x = a20 a10
= 0,5 0 = 0,5 a sx =

x2i ni
i =1

2
1
(1)2 .1 + 0.2 + 12.1 = = 0,5
4
4

y j n j

y2j n j

1
[1.1 + 2.2 + 3.1] = 2 a02 = j=1
N
4
N
2
2
2
s y = a02 a01 = 4 ,5 2 = 0,5 a s y = 0,5 = 0,7
j=1

0,5 = 0,7

a01 = y =

0 2 2
n
n n
. 22 2 2
4 4 4
N N N

18
1 2
= 4 ,5
1 .1 + 22.2 + 32.1 =
4
4

covarianza s xy = a11 a10 . a01 = 0 0 . 2 = 0


Advirtasequelacovarianzaesceroporlasimetradeladistribucin.
Si (X , Y) independie ntes a s yx = 0
Si s yx = 0
a (X , Y) No independie ntes

5.Sehanobservado,duranteunmesdeterminado,elgastoeneltelfonomvilyelingresototalen
seisfamilias.Losresultadosobtenidos,expresadosenunidadesmonetariascorrientes,hansido:
Gastotelfonomvil
2
3
6
9
10
11

Familia1
Familia2
Familia3
Familia4
Familia5
Familia6

Ingresototal(mileseuros)
4
6
8
10
12
20

a)Calcularlacovarianzaentreelgastoyelingreso.Alavistadeesteresultado,puedeafirmarque
lasvariablesseandependienteseindependientes?
b)Paraestas6familiasQuvariablesedistribuyedeformamshomognea,elgastoenmviloen
losingresostotales?
Solucin:

a)
Gastotelfonomvil Ingresototal

yi
2
3
6
9
10
11
41

xi

x2i

y2i

xi . yi

4
6
8
10
12
20
60

16
36
64
100
144
400
760

4
9
36
81
100
121
351

8
18
48
90
120
220
504

Laprimeracolumna( yi ),gastodeltelfonomvil,
correspondealavariablequeseestudia,dependiendo
delavariableingresototaldelasfamilias( x i )

yi

41
a01 = y =
=
= 6,83
N
6
i=1
6

a02 =

y2i
i=1

s2y = a02 a201 = 58,5 6,832 = 11,85

351
=
= 58,5
6

xi

60
a10 = x =
=
= 10
N
6
i=1

x2i

2
s2x = a20 a10
= 126,67 102 = 26,67

760
a20 =
=
= 126,67
N
6
i=1

a11 =

x i . yi
i=1

504
= 84
6

s xy = a11 a10 .a01 = 84 10. 6,83 = 15,7 covarianza

b)

y = 6,83

s y = 11,85 = 3,44

x = 10

sx = 26,67 = 5,16

CVy =

sy

CVx =

3,44
= 0,5037 (50,37%dedispersin)
6,83

s x 5,16
=
= 0,516 (51,6%dedispersin)
x
10

Sedistribuyedeformamshomogneaelingresototaldelasfamilias.

6.Unpsiclogoafirma,basndoseenlosdatosobtenidos,queamedidaqueelniocrecemenores
sonlasrespuestasinadecuadasquedaeneltranscursodeunasituacinexperimental:
Edad
2
3
4
4
5
5
6
7

Nmerorespuestas
inadecuadas
11
12
10
13
11
9
10
7

Edad
7
9
9
10
11
11
12

Nmerorespuestas
inadecuadas
12
8
7
3
6
5
5

a)Determinarlavalidezdelasconclusionesdelpsiclogo
b)Mara,dediezaosymedio,participaenelexperimento,culeselnmeroderespuestas
inadecuadasquesepuedepredecirparaella?
c)Hallarlavarianzaresidual
Solucin:

a)Lavalidezdelaafirmacinseobtendrenfuncindelcoeficientedecorrelacin: r =

s xy
sx sy

Comonohayparesrepetidosseentiendequeson15paresdelaforma (xi , y j ) querepresentar


xi : edad e yi : nmero respuestas inadecuada s demodoquelafrecuenciadecadapareslaunidad.

xi
yi

2
11

3
12

4
10

4
13

5
11

5
9

6
10

7
7

7
12

15

a11 =

xi yi
i =1

2.11 + 3.12 + 4.10 + L + 11.5 + 12.5 789


=
= 52,6
15
15

15

a10 = x =

xi
i =1

2 + 3 + 4 + 4 + 5 + L + 11 + 11 + 12 105
=
=7
15
15

11 + 12 + 10 + 13 + L + 6 + 5 + 5 129
=
= 8,6
15
15

15

a01 = y =

yi
i =1

Enconsecuencia, s xy = a11 a10 a01 = 52,6 7 . 8,6 = 7,6


Paraelclculodelasdesviacionestpicas (sx , s y ) :

9
8

9
7

10
3

11
6

11
5

12
5

15

a20 =

x2i
i =1

22 + 32 + 42 + 42 + 52 + L + 112 + 112 + 122 877


=
= 58,46
15
15

112 + 122 + 102 + 132 + L + 62 + 52 + 52 1237


=
= 82,46
15
15

15

a02 =

y2i
i=1

2
s2x = a20 a10
= 58,46 72 = 9,46 a s x = 9,46 = 3,07

s2y = a02 a201 = 82,46 8,62 = 8,5 a s y =


Elcoeficientedecorrelacin: r =

s xy
sx sy

8,5 = 2,91

7,6
= 0,85 correlacininversadel85%
3,07 . 2,91

Lavalidezsolicitadaesdel85%encorrelacininversa,esdecir,amedidaqueaumentalaedaddel
nio(X)disminuyelasrespuestasinadecuadas(Y).
b)Parapoderpredecirelnmeroderespuestasparacadaedaddeterminada(casodeMara)ser
necesariohallarlaecuacinderegresindeY(nrespuestasinadecuadas)sobreX(edaddelnio):
yy =

sxy
s2x

(x x ) pendientedelarectacoeficientederegresin: b yx =

sxy
s2x

Advirtasequelapendientedelarectaocoeficientederegresin byx vienedeterminado


porelsignodelacovarianza sxy
byx =

sxy
s2x

7,6
= 0,80 (rectaderegresindecreciente)
9,46

Laecuacindelarectaderegresinser: y 8,6 = 0,80 (x 7) a y = 14 ,2 0,80 x


Enconsecuencia,paralaedaddeMara (x = 10,5) elnmeroderespuestasinadecuadasquesepuede
predecirser:
y = 14,2 0,80 .10,5 = 5,8 6 respuestasinadecuadas.
c)Lavarianzaresidual sr2 = s 2y ( 1 r 2 )
CoeficientedeDeterminacin: r 2 = (0,85) 2 = 0,7225
s r2 = s 2y ( 1 r 2 ) = 8,50 (1 0,7225) = 2,35875
% var iaciones no exp licado = 100

sr2
2,35875
= 100
= 27,75%
2
8,50
sy

7.Deunavariableestadsticabidimensional(X,Y)seconoce sx = 3 :
1
RectaderegresindeYsobreX: y = 2 + x
2
RectaderegresindeXsobreY: x = 4 + 2 y
a)Hallarelcoeficientedecorrelacin
b)Si x = 2 ,determinar y , a20 , a02 y a11
Solucin:

1
a)LarectaderegresindeYsobreX: y = 2 + x puedeescribirse:
2
1
1
1
y = 2 + x a y 0 = (4 + x) b yx =
2
2
2
Anlogamente,larectaderegresindeXsobreY: x = 4 + 2 y
x = 4 + 2 y a x 0 = 2 (2 + y) bxy = 2
s xy 1
sxy 1

b yx = 2 = 2 9 = 2 s xy = 4 ,5
sx

Sabemosque
sxy
4 ,5
4 ,5
bxy =
= 2 a 2 = 2 a s2y =
= 2,25 a s y =
2
2

sy
sy
r=

s xy
sx sy

2,25 = 1,5

4 ,5
= 1 conloqueexisteunadependenciafuncional,cosaquenoesdeextraarpor
3 . 1,5

y =2+ x
tratarsedenicarectaderegresin.Advirtasequelasrectas:
2 sonlamismarecta,
x = 4 + 2 y
bastaconmultiplicarlaprimerarectapor2ydespejarlax:
1
2 y = 2 2 + x = 4 + x a x = 4 + 2 y
2
x}
=2
1
1
1
b) y = 2 + x a y = 2 + x a y = 2 + 2 = 3
2
2
2
2
s2x = a20 a10
a 32 = a20 22 a a20 = 32 + 22 = 13

s2y = a02 a201 a 2,25 = a02 32 a a02 = 2,25 + 32 = 11,25


sxy = a11 a11 a01 a 4 ,5 = a11 2 . 3 a a11 = 4 ,5 + 6 = 10,5

8.Enunaexperimentacinsobreelsectortursticosehanobservadodoscaracterescuantitativos(X,
Y),obtenindoselossiguientesresultados:
(0,2),(1,6),(3,14),(1,2),(2,10)
a)Hallarlasdistribucionesmarginales
b)Correlacinentreamboscaracteres
c)Cmocompletaramoslospares(3,),(,4)?.Utilizarparaellolarectaderegresinajustadaa
losdatosobservados.
Solucin:

a)Comonohayrepeticindelospares,latabladedobleentradadefrecuenciasabsolutasvendr
dadadelaforma:
X\Y
0
1
3
1
2
n j

2
1

14

ni
1
1
1
1
1
5

10

1
1
1
1

1
1

LasdistribucionesmarginalesdelaXeY,respectivamente,sern:
xi

yj

14

10

ni

n j

b)Paraestudiarlacorrelacinseformalatablaadjunta,dondenofiguralacolumnadelas
frecuenciasabsolutasporserlaunidadparatodoslospares
xi

yi

xi yi

0
1
3
1
2
5

2
6
14
2
10
30

0
6
42
2
20
70

x2i
0
1
9
1
4
15

y2i
4
36
196
4
100
340

a11 =

xi yi
i=1

70
= 14
5

x = a10 =

xi
i=1

5
=1
5

a20 =

x2i
i=1

15
=3
5

2
s2x = a20 a10
= 3 12 = 2

sx =

2 = 1,41

yi

30
y = a01 =
=
=6
N
5
i=1

a02 =

y2i
i =1

s2y = a02 a201 = 68 62 = 32

340
=
= 68
5

s xy

r=

s xy = a11 a10 a01 = 14 1. 6 = 8

s 2x s 2y

sy =

32 = 5,66

8
=1
2 . 32

Comoelcoeficientedecorrelacinesiguala1,indicaqueexisteunadependenciafuncionalentrelas
variables(X,Y)estudiadas.
c)Paracompletarelpar(3,)hayquehallarlaecuacindelarectaderegresindeYsobreX.
Anlogamente,paracompletarelpar(,4)hayquehallarlaecuacindelarectaderegresindeX
sobreY.
RectaderegresindeYsobreX:
yy =

sxy
s2x

(x x ) ,dondeelcoeficientederegresin b yx =

x = 1 y = 6 b yx =

s xy
s2x

sxy
s2x

(pendientedelarecta)

8
=4
2

yy =

s xy
s2x

(x x) a y 6 = 4 (x 1) a y = 2 + 4 x

Elpar(3,)secompleta: y = 2 + 4 (3) = 10 (3, 10)


RectaderegresindeXsobreY:

xx =

sxy
s2y

(y y) ,dondeelcoeficientederegresin bxy =

x = 1 y = 6 bxy =

sxy
s2y

xx =

s2y

(pendientedelarecta)

8 1
=
32 4

sxy

Elpar(,4)secompleta: x =

sxy

s2y

(y y) a x 1 =

1
1
(y 6) a x = ( 2 + y)
4
4

1
[ 2 + 4] = 1 1 ,
2
4
2

9.SedeseaestudiarlarelacinqueexisteentrelavariableX(porcentajedelapoblacinurbanaen
lasdistintasprovincias)eY(rentamediaporhogar).Latablaadjuntacontienedatosreferentesa
treintaprovincias:
X\Y
1019
1928
2837
3745

116
1

1631
1
8
3
2

3146
1
3
7
3

4660

a)Calcularlasrectasderegresin
Solucin:

a)
X\Y
1019
1928
2837
3745
n j

116
1

1631
1
8
3
2
14

3146
1
3
7
3
14

ni
3
11
11
5
30

4660

1
1

LasdistribucionesmarginalesdeXeY,respectivamente:
Intervalos

xi

ni

xi ni

x2i ni

1019
1928
2837
3745

14,5
23,5
32,5
41

3
11
11
5
30

43,5
258,5
357,5
205
864,5

630,75
6074,75
11618,75
8405
26729,25

xi ni

864,5
= 28,81
N
30
2
s2x = a20 a10
= 890,975 28,812 = 60,959
x = a10 =

i=1

a20 =

sx =

Intervalos

yj

n j

y j n j

y2j n j

116
1631
3146
4660

8,5
23,5
38,5
53

1
14
14
1
30

8,5
329
539
53
929,5

72,25
7731,5
20751,5
2809
31364,25

j=1

26729,25
= 890,975
N
30
60,959 = 7,807

i =1

y j n j
y = a01 =

x2i ni

929,5
= 30,98
30

y2j n j
a02 =

j =1

31364,25
= 1045,475
30

s2y = a02 a201 = 1045,475 30,982 = 85,7146

sy =

85,7146 = 9,258

Ladistribucinconjunta
xi \ y j

8,5

23,5

38,5

14,5
23,5
32,5
41

1
8
3
2

1
3
7
3

53

a11 =

xi yi nii
i=1

14 ,5. 8,5. 1 + 14 ,5. 23,5.1 + 14 ,5. 38,5.1 + 23,5. 23, 5.8 + L + 41. 38,5. 3 27589,5
=
= 919,65
30
30

s xy = a11 a10 a01 = 919,65 28,81. 30,98 = 27,1162


9 RectaderegresindeYsobreX: y y =

sxy
s2x

(x x) a y 30,98 =

Coeficientederegresin: b yx =

y = 18,30 + 0,44 x

m11 27,1162
=
= 0,44 > 0 (rectaderegresincreciente)
60,959
2x

9 RectaderegresindeXsobreY: x x =

sxy
s2y

(y y) a x 28,81 =

Coeficientederegresin: bxy =

27,1162
(x 28,81)
60,959

sxy
s2y

27,1162
(y 30,98)
85,7146

x = 19,20 + 0,31 y

27,1162
= 0,31 > 0 (rectaderegresincreciente)
85,7146

10.Justifiquelasrazonesporlascualesdebeaceptarseorechazarsequelasdosrectassiguientes
sean,respectivamente,laslneasderegresinmnimocuadrticasdeYsobreXydeXsobreYdeuna
seriedeobservaciones.
Y/X: Y = 2X + 1

X/Y: X = 5Y + 10

Solucin:
Y = 1 + 2X
X = 10 5 Y

byx = 2 > 0
bxy = 5 < 0

Loscoeficientesderegresindebentenerelmismosigno,al
dependerambosdelamismacovarianza.
Conlocual,nopuedenserrectasderegresin.

11.Justifiquelasrazonesporlascualesdebeaceptarseorechazarsequelasdosrectassiguientes
sean,respectivamente,laslneasderegresinmnimocuadrticasdeYsobreXydeXsobreYdeuna
seriedeobservaciones.
Y/X: Y = 2X + 1

X/Y: X = 5Y + 10

Solucin:
b yx = 2 > 0
Y = 1 + 2X

X = 10 + 5 Y bxy = 5 > 0

Loscoeficientesderegresintienenelmismosigno,loquees
lgicoaldependerambosdelamismacovarianza.

Deotraparte,elcoeficientedecorrelacin: r =

b yx . b xy =

2 . 5 = 3,16 ,resultadoabsurdocuando

elcoeficientedecorrelacin 1 r 1 ,concluyendoquenopuedenserrectasderegresin.
12.ElcoeficientedecorrelacinentredosvariablesXeYes0,6.Sabiendoademsque,
sx = 1,5 y = 20 s y = 2
x = 10
a)HallarlasrectasderegresindeY/XydeX/Y
b)Calcularlavarianzaresidualparalasdosregresionesanteriores
Solucin:
RectaderegresindeYsobreX: y y =

sxy

RectaderegresindeXsobreY: x x =

sxy

Elcoeficientedecorrelacin: r =

Enconsecuencia, byx =

sxy
s2x

s2x
s2y

b yx . b xy =

(x x) a byx =
(y y) a bxy =
s xy

sx .sy

a 0,6 =

sxy
s2x
sxy
s2y

(coeficienteregresin)
(coeficienteregresin)

s xy
1,5 . 2

a s xy = 1,8

s
1,8
1,8
= 0,8 bxy = xy
= 2 = 0,45
2
2
sy 2
1,5

Lasrectasderegresinsern:

Y / X : y 20 = 0,8 (x 10) y = 12 + 0,8 x


X / Y : x 10 = 0,45 (y 20) x = 1 + 0,45 y

1 r2

1 r2

Y/X s =s
Y / X s r2 = s 2y 1 r 2
r
y

b)Varianzaresidual
Errortpicoestimacin
X / Y s2 = s2 1 r2
X/Y s =s
r
x
r
x

Y / X sr2 = 22 1 0,62
a sr2 = 2,56 sr = 2,56 = 1,6

portanto,
X / Y s2 = 1,52 1 0,62 a s2 = 1,44 s = 1,44 = 1,2
r
r
r

13.Enunadistribucinbidimensionalseconoce:
R = 0,7

s x = 1,2

y=4

X / Y : X = 0,6 + 0,44 Y

Obtener:
a)MediadeX
b)RectaderegresindeY/X
c)VarianzadeY
d)Covarianzadeambasvariables
Solucin:
X = 0,6 + 0,44 Y
a)RectaderegresindeXsobreY: X = 0,6 + 0,44 Y a
X = 0,6 + 0,44 . 4 = 2,36

b)LarectaderegresindeY/X:
a = 0,6
siendo X = 0,6 + 0,44 Y a
bxy = 0,44

r 2 = b yx . b xy

a 0,72 = b yx . 0,44 a b yx =

0,72
= 1,114
0,44
b

conlocual,larectaderegresindeYsobreX: y y =

yx
}
sxy

(x x ) ser: y 4 = 1,114 (x 2,36)


s2x
y = 1,370 + 1,114 x

c)VarianzadelaY:Sabemosque, s x = 1,2
b yx =

m11
a
2x

1,114 =

recurriendoa bxy =

sxy
s2y

sxy
2

1,2

bxy = 0,44

b yx = 1,114

a s xy = 1,114 .1,22 = 1,604

a 0,44 =

1,604
a
s2y

s2y =

1,604
= 3,645
0,44

d)Lacovarianzadeambasyasehacalculado: sxy = 1,604

14.Seanlasvariablesestadsticasbidimensionales(X,Y),dondeX="PIBpercpita(enmilesde
dlares)eY="Tasanaturaldecrecimientodemogrficode162pasesdelmundo".Seconocenlos
datossiguientes:

x = 978,9
x2 = 17569,9

y = 2886,4
y2 = 172291,2

xy = 8938,4

a)Obtenerlarectaderegresinquepretendeexplicarlatasanaturaldecrecimientoenfuncindela
rentadelpas.
b)Interpretarloscoeficientesdelarectaestimada.
c)Obtenerunamedidadebondaddelajusteeinterpretarsisteesbueno.
Solucin:
b

a)SetratadeencontrarlarectaderegresindeYsobreX: y y =

yx
}
sxy

x 978,9
x2 17569,9
a10 = x = =
= 6,04 a20 = =
= 108,456
N
162
N
162

s2x

(x x )

2
s2x = a20 a10
= 108,456 6,042 = 71,97

y 2886,4
y2 172291,2
a01 = y = =
= 17,82 a02 = =
= 1063,526
N
162
N
162
s2y = a02 a201 = 1063,526 17,822 = 745,97
x y 8938,4
a11 = =
= 55,175 s xy = a11 a10 a01 = 55,175 6,04 . 17,82 = 52,46
N
162
ElcoeficientederegresindeYsobreX(pendientedelarecta): byx =

sxy
s2x

52,46
= 0,729
71,97

Advirtasequelapendientedelarecta ( 0,729) enelsignodependedelacovarianza (sxy ) ,alser


negativalarectaderegresinserdecreciente,estoes,amedidaqueaumentalosvaloresdela
variableX(PIBpercpita)disminuyenlosvaloresdelavariableY(tasanaturaldecrecimiento
demogrfico).
Larectaderegresinsolicitadaser: y 17,82 = 0,729 (x 6,04) a
c)ElCoeficientededeterminacinlineal: r 2 = b yx . b xy
bxy =

sxy
s2y

52,46
= 0,07
745,97

conloque, r 2 = (0,729) . (0,07) = 0,051 (5,1%gradodefiabilidad)

y = 22,22 0,729 x

Elcoeficientedecorrelacinlineal: r =

0,051 = 0,226 (noexisteapenascorrelacinlinealentrelas

variables,pudiendoexistirotrotipodecorrelacin)

15.Lasiguientedistribucinbidimensionalseexpresaenlasiguientetabladecorrelaciones.La
variableXrepresentalosingresosfamiliaresmensualesenunidadesde10euros.LavariableY
representa,asuvez,losmetroscuadradosdelaviviendafamiliar.
X/Y
50100
100200
200350
350500
>500

<60
20
25
5
0
0

6080
18
40
10
5
1

80100
2
30
15
15
2

100150
1
2
25
20
7

>150
0
1
3
8
10

a)Calcularladistribucinmarginaldelasdosvariables.Sonindependienteslosingresosfamiliares
yeltamaodelaviviendadondehabitan?
b)Obtenerladistribucindelasuperficiedelaviviendacondicionadaalintervalomodaldelos
ingresosfamiliares.
c)Calcularladistribucindelosingresoscondicionadaalintervalomedianodelaviviendafamiliar.
Solucin:

a)
X/Y

<60

6080

80100

100150

>150

ni

50100
100200
200350
350500
>500
n j

20
25
5
0
0
50

18
40
10
5
1
74

2
30
15
15
2
64

1
2
25
20
7
55

0
1
3
8
10
22

41
98
58
48
20
N=265

0,189

0,279

0,242

0,208

0,083

f j =

n j
N

fi =

ni

N
0,155
0,370
0,219
0,181
0,075
1

Paraquelosingresosfamiliares(X)yeltamaodelaviviendafamiliar(Y)seanindependientesdebe
n n n
verificarse ij = i j i, j
N N N
n
n n
15
48 64
Nosonindependientesporque 43 4 3 a

N
4 N
265 265 265

DISTRIBUCINMARGINALDELAVARIABLEX
Intervalos

xi

ni

ci

50100
100200
200350
350500
>500

75
150
275
425

41
98
58
48
20
265

50
100
150
150

ni
N
0,155
0,370
0,219
0,181
0,075
1

fi =

Fi =

Ni

Ni
N

41
139
197
245
265

0,155
0,525
0,744
0,925
1

Nj

F j =

hi =

ni
ci

0,82
0,98
0,39
0,32

f j =

Intervalos

yj

n j

cj

<60
6080
80100
100150
>150

70
90
125

50
74
64
55
22
265

20
20
50

n j

N
0,189
0,279
0,242
0,208
0,083
1

50
124
188
243
265

N/2=132,

DISTRIBUCINMARGINALDELAVARIABLEY
N j
N

0,189
0,468
0,71
0,918
1

hj =

nj
cj

3,7
3,2
1,1

mediano

b)X="ingresosfamiliares"eY="metroscuadradosdelasuperficie"
yj

n j / 50 100

nj / 100 200

nj / 200 350

n j / 350 500

nj / > 500

<60
6080
80100
100150
>150

20
18
2
1
0
41

25
40
30
2
1
98

5
10
15
25
3
58

0
5
15
20
8
48

0
1
2
7
10
20

ConlosdatosdisponiblesnosepuedecalcularelintervalomodaldelavariableX,alnopodercalcular
todaslasdensidadesdefrecuenciasmarginales,esimposiblehacerloeneltramo(>500)quetiene
unaamplitudilimitada.
c)LadistribucincondicionadadelavariableXalintervalomedianodelaY(viviendafamiliar):
X /Y
50100
100200
200350
350500
>500

<60
20
25
5
0
0

6080
18
40
10
5
1

80100 100150
2
1
30
2
15
25
15
20
2
7

>150
0
1
3
8
10

Intervalos
50100
100200
200350
350500
>500

ni3 (ni / 80 100)

2
30
15
15
2

Y / X : Y = 3 + 2X
X / Y : X = 2 + 0,3 Y
= 3,2 .Obtenerlavarianzaresidualdelasdosrectasderegresin.

16.Seconocenlasregresiones
Sabiendoademsque s xy
Solucin:

xy = 3,2
b = s / s2 s
byx = 2

s2x = 3,2 / 2 = 1,6


Y / X : Y = 3 + 2X
yx
xy
x
a
a

s xy = 3,2
2
X / Y : X = 2 + 0,3 Y
s2y = 3,2 / 0,3 = 10,67
bxy = 0,3
bxy = sxy / s y

Porotraparte,elcoeficientededeterminacin: R2 = b yx .bxy = 2. 0,3 = 0,6

Y / X : s r2 = s 2y 1 r 2 s r2 = 10,67 [ 1 0,6] = 4 ,268

Varianzaresidual
X / Y : s 2 = s 2 1 r 2 s 2 = 1,6 [ 1 0,6] = 0,64
r
x
r

Y/X: s =s
r
y

Errortpicoestimacin
X/Y: s =s
r
x

1 r2

sr =

4 ,268 = 2,066

1 r2

sr =

0,64 = 0,8

17.Seanlassiguientesecuacioneslasrectasderegresindeunavariablebidimensional(Y,X;nij)
X 2Y = 3

X 4Y = 2
a)CuldeestasrectascorrespondealaregresindeY/XyculalaregresindeX/Y?
b)HallarlasmediasaritmticasdeYsobreX
c)Cuntovaleelcoeficientedecorrelacinlineal?
Solucin:

a)

recta regresin X / Y
X 2Y = 3
Sea
recta regresin Y / X
X 4 Y = 2

a = 3
X = 3 + 2Y a

bxy = 2
a signo (bxy ) = signo (b yx )

a' = 1 / 2
1
1
Y = + X a

2 4
b yx = 1 / 4

1
Coeficientededeterminacin r 2 = b xy . b yx = 2 . = 0,5 < 1
4

recta regresin Y / X
X 2Y = 3
Sea
recta regresin X / Y
X 4 Y = 2

a = 3 / 2
3 1
Y = + X a
2 2

b yx = 1 / 2
a signo (b yx ) = signo (bxy )

'
X = 2+ 4Y a a = 2

bxy = 4

1
Coeficientededeterminacin r 2 = b yx . b xy = . 4 = 2 > 1 cosaquenoesposible (0 r 2 1)
2

X / Y : X = 3 + 2Y

Enconsecuencia

1 1
Y / X : Y = 2 + 4 X

18.Enunadistribucinbidimensional(Xi,Yj,nij)seconoce x = 10 y sxy = 10 .Ambasrectasde

regresinpasanporelpunto(0,0).Culeselgradodebondaddelajuste?.
Solucin:

LasrectasderegresindeY/XeX/Ysecortanen (x , y) ,enestecasoenelpunto (10, y) .


Porotraparte,segnelenunciadosecortanen(0,0),porloquesepuedeconcluirqueambasrectas
coincidenaltenerdospuntosdistintosencomn.
Enconsecuencia,R2=1R=1(100%gradodeajuste).
19.ApartirdeunconjuntodedatossobrelasvariablesXeYsehacalculadolaregresindeYsobre
X,obtenindoselossiguientesresultados:

Y = 10 + 0,45 X

r2 = 0,9

x = 20

CalcularlosparmetrosderegresindeXsobreY
Solucin:
Y = 10 + 0,45 X

a = 10
0,9
r2 = byx .bxy
= 2 (pendiente recta)
a

r2 = 0,9 = 0,45.bxy bxy =


0,45
b yx = 0,45
byx

}
y = a + b. x
Deotraparte, y = a + b . x y = 10 + 0,45 . 20 = 19
bxy

}
}xy
x = a' + b'. y
Anlogamente, x = a'+ b' . y
a' = x b' . y a' = 20 2.19 = 18

LarectaderegresindeX/Y: Y = 18 + 2 X

20.CulesdelossiguientesparesdeposiblesrectasderegresindeY/XydeX/Yrealmente
puedenserlo?.Razonelarespuesta.

a) Y = 3 + 4X siendo X = 2 + Y

b) Y = 3 + 2X siendo X = 2 0,3 Y

c) Y = 3 + 2X siendo X = 2 + 0,2 Y

Solucin:

a=3

Y / X : Y = 3 + 4 X a
b yx = 4 > 0

X / Y : X = 2 + Y a a' = 2

b xy = 1 > 0

a=3

Y / X : Y = 3 + 2X a
byx = 2 > 0

X / Y : X = 2 0,3 Y a a' = 2

bxy = 0,3 < 0

a signo (b yx ) signo (bxy ) contradiccin

a=3

Y / X : Y = 3 + 2X a
b yx = 2 > 0

X / Y : X = 2 + 0,2 Y a a' = 2

b xy = 0,2 > 0

signo (b yx ) = signo (b xy )
a 2
coeficientes coherentes
r = b yx . b xy = 2 . 0,2 = 0,4 < 1

signo (b yx ) = signo (b xy )
a 2
r = b yx . b xy = 4.1 = 4 > 1 contradiccin

21.Comprobarsisoncoherenteslosresultadosobtenidosalajustarlarectaderegresin:
a) Y = A + b X a s xy = 20

s2x = 10

y =8

x =4

b) Y = A + b X a s2y = 4

s xy = 4

2
= 0,4
sry

s2x = 5

a=3

Solucin:

a)
s xy 20

b = b yx = 2 = 10 = 2
sx

Y = A + bX a
y = a + b x a a = y b x = 8 2. 4 = 0 3

Los datos no corresponden


a la recta de regresin

b)Losdatosnocorrespondenaunarectaderegresincomopuedeobservarse.


2
sry = s2y (1 r2 ) a 0,4 = 4 (1 r2 ) a 0,1 = (1 r2 ) a r2 = 0,9 a r = 0,94

s xy 4
Y = a + b X a b = b yx = 2 = = 0,8
sx 5

2
2
2
2
s xy
sry
sry
42
0,4
2
a
r
=
=
1

r
=
=
0
,
8

= 1
= 0,9

2 2
2
2
5. 4
4
sy
sx .s y
sy

22.Enunadistribucinbidimensional(X,Y)sehaajustadounaregresinlinealentrelasdos

variables.Sesabeque r = 0,8, s x = 4 , y = 2 yquelarectaderegresindeXsobreYajustadaes


Y = 4X .Sepide:
a)Calcularlosvaloresde sxy , s2y y x
b)CalcularlarectaderegresindeYsobreX
c)CalcularlavarianzaresidualenlaregresindeXsobreY

Solucin:
a)

RectaderegresindeXsobreY
Y = 4X

sxy

x x = 2 (y y)
sy

a' = 0
=a'+b'y
X = 1 Y x

4
b' = bxy = 1 / 4 (pendiente recta)

b }
b'
}

1
2
r = b yx .bxy a 0,82 = b yx .
a b yx = 2,56

4
covarianza (sxy ) b
}
b = sxy a s = b . s2 a s = (2,56). 42 = 40,96
xy
yx x
xy
yx s2x

VarianzaY (s2y )

MediaX (x)

b'
}
sxy
sxy
bxy = 2 a s2y =
bxy
sy

a s2y =

40,96
= 163,84
1/4

r
1
E[x ]=E[a'+b'y ] a x =a'+b'y
x = a'+b' y x = 0 + . 2 = 0,5
4

b)

RectaderegresindeYsobreX

c)

VarianzaresidualdeX:

b=byx

s
y y = xy (x x ) a y = a + b x

s2x

40,96
y 2 = 2 (x 0,5) a y = 0,72 + 2,56 x
4

2
2
srx
= s2x (1 r2 ) a srx
= 16 (1 0,64) = 5,76

23.Sedeseaestudiarlarepercusinquetienelosdasdelluviaenelnmerodevisitasalzoo.Para
ello,seobservaronlassiguientesvariables,durantelosltimosdiezaos,siendoY="nvisitas
anuales,enmiles"yX="ndedasdelluviaalao":
Ao
X
Y

1994
18
107

1995
26
105,5

1996
30
105

1997
33
104,4

1998
38
104,3

1999
39
104

2000
42
103,7

2001
44
103,4

2002
46
103,1

2003
49
103

a)Coeficientedecorrelacinlinealeinterpretarelresultado.
b)Rectaderegresinqueexpliqueelnmerodevisitasanualesenfuncindelnmerodelluvia.
c)QuprevisindevisitashabrparaelaoprximosielInstitutoMeteorolgicoinformaque
llover40das?.Qugradodefiabilidadtendrestaprediccin?.
d)Hallarlavarianzaresidualdelnmerodevisitasanuales.
e)ObtenerlarectaderegresinX/Y.
Solucin:

Ao

xi

yi

xi . yi

1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
10

18
26
30
33
38
39
42
44
46
49
365

107
105,5
105
104,4
104,3
104
103,7
103,4
103,1
103
1043,4

1926
2743
3150
3445,2
3963,4
4056
4355,4
4549,6
4742,6
5047
37978,2

x2i
324
676
900
1089
1444
1521
1764
1936
2116
2401
14171

y2i
11449
11130,25
11025
10899,36
10878,49
10816
10753,69
10691,56
10629,61
10609
108881,96

DistribucinmarginaldeX
10

10

xi

365
= 36,5
a10 = x = i=1 =
N
10

x2i

14171
= 1417,1
a20 = i=1 =
N
10

2
s2x = a20 a10
= 1417,1 36,52 = 84 ,85

s x = 84 ,85 = 9,21

DistribucinmarginaldeY
10

a01 = y =

yi
i=1

10

1043,4
= 104,34
10

a02 =

s2y = a02 a201 = 10888,196 104,342 = 1,36

s y = 1,36 = 1,17

y2i
i=1

108881,96
= 10888,196
10

CovarianzaCoeficientesregresinlinealCoeficientecorrelacinlineal
10

a11 =

xi . yi
i=1

37978,2
= 3797,82
10

Covarianza: s xy = a11 a10 . a01 = 3797,82 36,5 . 104,34 = 10,59


b
}

sxy 10,59
Y / X : b yx = 2 =
= 0,125
84 ,85
sx

Coeficientesregresinlineal:
b'
}
X / Y : b = sxy = 10,59 = 7,79
xy

1,36
s2y

r = b yx .bxy = (0,125)(7,79) = 0,986

Coeficientedecorrelacinlineal:

Observandolagrficadelanubedepuntosamsdasdelluvia
menornmerodevisitas. Elgradodeajusteentrelanubede
puntosylarectaderegresinesdel98,6%.

b)RectaderegresindeYsobreX:
b=byx

y y =

}
s yx
s2x

(x x) a y 104,34 = 0,125 (x 36,5) a y = 108,90 0,125x

c)Sien2007seestiman40dasdelluviaseestimanunnmerodevisitas:
y = 108,90 0,125 (40) 104 das
d)LavarianzaresidualdelaY:
2
2
sry
= s2y (1 r2 ) a sry
= 1,36 (1 0,9862 ) = 0,0378 (3,78%causasajenasalaregresin)

e)RectaderegresindeXsobreY:
b'=bxy

x x =

}
s yx
s2y

(y y) a x 36,5 = 7,79 (y 104,34) a x = 849,31 7,79 y

X / Y : x = 849,31 7,79 y a y =

849,31 x

7,79

NOTA.PararepresentarconjuntamenteenEXCELlasdosrectasderegresin(Y/X,X/Y)sehande
introducirdosseries:Serie1(X,Y),Serie2(X, Y)

24.LasnotasenEstadstica(X)yenMatemticas(Y)obtenidaspor10alumnoselegidosalazarenun
grupodeprimercursodelaFacultaddeCienciasEconmicasyEmpresarialeshansidolassiguientes,
segnelordendeseleccindelamuestra:
Norden
X
Y

1
9
8

2
7
5

3
3
4

4
6
2

5
7
9

6
5
6

7
10
10

8
8
9

9
3
1

10
5
5

a)Representarlanubedepuntoscorrespondienteaestadistribucin.Quhiptesispueden
hacersealavistadelarepresentacin?.
b)EstimarlosparmetrosdelarectaderegresinY/X.Interpretarloscoeficientescalculados.
c)EstimarlosparmetrosdelarectaderegresindeX/Yycompararambasrectas.
d)Representarlasdosrectasderegresinjuntoalanubedepuntos.
e)CalcularlavarianzaresidualenlaregresinY/X.Coincidirconlavarianzaresidualenla
regresinX/Y?
f)Paraunalumnoquehayaobtenidoun7enMatemticas,qunotaselepronosticaraen
Estadstica?
g)Paraunalumnoquehayaobtenidoun4enEstadstica,qunotaselepronosticaraen
Matemticas?
Solucin:

a)
Observandolanubedepuntos(diagramadedispersin)se
puedeestablecerlahiptesisdequeexistecorrelacinlineal
crecienteentrelasvariables.

b)EstimarlosparmetrosdelarectaderegresinY/X
Norden
xi
yi
xi . yi
x2i

1
9
8
72
81

2
7
5
35
49

3
3
4
12
9

4
6
2
12
36

5
7
9
63
49

6
5
6
30
25

7
10
10
100
100

8
8
9
72
64

9
3
1
3
9

10
5
5
25
25

63
59
424
447

y2i

64

25

16

81

36

100

81

25

433

DistribucinmarginaldeX
10

a10 = x =

xi
i=1

10

63
= 6,3
10

a20 =

x2i
i=1

447
= 44 ,7
10

2
s2x = a20 a10
= 44 ,7 6,32 = 5,01

sx = 5,01 = 2,24

DistribucinmarginaldeY
10

a01 = y =

yi
i=1

10

59
= 5,9
10

a02 =

y2i
i=1

433
= 43,3
10

s2y = a02 a201 = 43,3 5,92 = 8,49

s y = 8,49 = 2,91

CovarianzaCoeficientesregresinlinealCoeficientecorrelacinlineal
10

a11 =

xi . yi
i=1

424
= 42,4
10

Covarianza: s xy = a11 a10 .a01 = 42,4 6,3 . 5,9 = 5,23

ParmetrosregresinlinealY/X
Y = a + b X a Y = 0,677 + 1,044 X

s xy 5,23
= 1,044 > 0
b = b yx = 2 =
s x 5,01

y = a + b x a a = y b x = 5,9 1,044 . 6,3 = 0,677


2 s xy s xy 5,23 5,23
.
= 0,643 a r = 0,643 = 0,80
r = 2 . 2 =
s x s y 5,01 8,49

Elcoeficientederegresinbespositivo,conlo
queamayornotaenestadsticamayornotaen
matemticas.Deotraparte,elcoeficientede
correlacinres0,80,conloquelafiabilidaddel
modeloesdel80%.

c)

ParmetrosregresinlinealX/Y
X = a' + b' Y a X = 2,665 + 0,616 Y

s xy 5,23

= 0,616 > 0
b' = bxy = 2 =
8
,
49
s
y

x = a' + b' y a a' = x b' y = 6,3 0,616 . 5,9 = 2,665


2 sxy sxy 5,23 5,23
.
= 0,643 a r = 0,643 = 0,80
r = 2 . 2 =
s x s y 5,01 8,49

Elcoeficientederegresinb'espositivo,conloquea
mayornotaenmatemticasmayornotaenestadstica.
X 2,665
se
Deotraparte, X = 2,665 + 0,616 Y a Y =
0,616
utilizapararepresentarenExcellaserie (X , Y) ,quejunto
alaserie(X,Y),permitelagrficaconjuntadelanubede
puntosylasdosrectasderegresin.

d)PararepresentarenExcellasdosrectasderegresinjuntoalanubedepuntos.
X
Y
Y

9
8
10,28

7
5
7,04

3
4
0,54

6
2
5,41

7
9
7,04

5
6
3,79

10
10
11,91

8
9
8,66

3
1
0,54

5
5
3,79

Diagramadispersin:Series(X,Y),(X, Y)
Y = (X 2,665) / 0,616

e)Varianzasresiduales
VarianzaresidualdeY/X: r2 = 0,643 s2y = 8,49

2
2
sry
= s2y (1 r2 ) a sry
= 8,49 (1 0,643) = 3,03

VarianzaresidualdeX/Y: r2 = 0,643 s2y = 5,01

2
2
srx
= s2x (1 r2 ) a srx
= 5,01 (1 0,643) = 1,79

f)Unalumnoconun7enMatemticas (, 7) parapronosticarlanotaenEstadsticahabraque
recurriralarectaderegresindeX/Y: X = 2,665 + 0,616 Y
X = 2,665 + 0,616.7 = 6,98 enestadstica
g)Unalumnoconun4enEstadstica (4 , ) parapronosticarlanotaenMatemticashabraque
recurriralarectaderegresindeY/X: Y = 0,677 + 1,044 X
Y = 0,677 + 1,044 . 4 = 3,50 enmatemticas