Sunteți pe pagina 1din 25

REGRESIÓN MÚLTIPLE

EJERCICIOS DE APLICACIÓN
MODELOS ESTADÍSTICOS

SHEILA DANESKA INFANTE RUJEL


MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

EJERCICIOS DE REGRESIÓN MÚLTIPLE


1. Usando los siguientes datos, consumo nacional ( 𝑪𝒕 ) y renta nacional
(𝑹𝒕 ) en España para el periodo 1995-2005 a precios corrientes
((𝟏𝟎𝟗 𝒆𝒖𝒓𝒐𝒔) , obtenga las estimaciones por MCO, así como las sumas
de cuadrados total, explicada y residual , y el coeficiente de
determinación, para el modelo de regresión 𝑪𝒕 = 𝜷𝟏 + 𝜷𝟐 𝑹𝒕 + 𝒖𝒕

AÑO Ct Rt
1995 349 388
1996 368 408
1997 388 433
1998 414 465
1999 444 498
2000 484 538
2001 518 574
2002 550 614
2003 586 656
2004 635 699
2005 686 748
SOLUCIÓN:

∑ 𝑋𝑖 = 6021 ∑ 𝑌𝑖 = 5422 ∑ 𝑋𝑖 2 = 3443083 𝑋̅ = 547.36364


𝑌̅ = 492.90909 ∑ 𝑋𝑖𝑌𝑖 = 3104015 2
∑ 𝑌𝑖 = 2798598 𝑁 = 11

1  
XY  nx y

X
2
2
 nx

(3104015) − (11)(547,36364)(492,90909)
𝛽1 =
3443083 − 11(547,36364)2
1 = 0.9240389525  0.92404
0 =y-1 x=(492.90909)-(0.92404)(547.036364)=-12.87680791

Interpretación:
𝛽0: Se puede estimar que cuando la renta nacional en España es cero el consumo
nacional es -12.87681.

𝛽1: Estimamos que el incremento de la renta nacional es de 0.92404 por unidad.

Página 1
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

La Ecuación General:

⏞ = −12.87681 + 0.92404𝑋𝑖
𝑌𝑖
Y=consumo nacional (t)
X=renta nacional (rt)

SCR=1  x i yi  nxy =0.92404(3104015-11(547.36364)(492.90909)=125862.8872

SCR=125862.8872

𝑆𝐶𝑇 = (𝑛 − 1)𝑆 2 𝑌 = 10(12604.49091) = 126044.4091

SCT= 126044.4091

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝑅 = 126044.4091 − 125862.8872 = 182.0218909


SCE=182.0218909

𝑆𝐶𝑅 125862.8872
𝑟2 = = = 0.9985558965 ≈ 0.99856
𝑆𝐶𝑇 126044.4091

El modelo de regresión lineal simple explica que el 99.9% de las variables renta
nacional con relación a la consumo nacional, tienen una relación muy buena al ser
el coeficiente de determinación muy cercana a la unidad.

MEDIANTE MATRICES:
𝛽=(𝑋 𝑡 𝑋)−1(𝑋 𝑡 𝑌)
 2.12343044 0.00371329   5422 
( X ' X )1    * ( X 'Y )   
 0.00371329 6.78396  06  3104015
 12.8761329 
  
 0.92403877 
𝐶𝑡 = −12.8761329 + 0.92403877𝑅𝑡 + 𝑢𝑡
FV GL SC CM F
Regresión 1 125862.733 125862.733 6217.981271
Residuos 9 182.175621 20.2417357
Total 10 126044.909

- SCT=126044.909
- SCE =182.175621

Página 2
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

- COEFICIENTE DE DETERMINACIÓN
182.175621
𝑅 2 = 1 − 126044.909 =0.99855468
El 99,86% de las variaciones del Consumo Nacional están explicadas por
las variable renta y el 0,14 % están explicadas por otras variables

2. Una desea estimar los gastos en alimentación de una familia Y en base


a la información que proporcionan las variables regresora 𝑿𝟏 =
"𝒊𝒏𝒈𝒓𝒆𝒔𝒐𝒔 𝒎𝒆𝒏𝒔𝒖𝒂𝒍𝒆𝒔" y 𝑿𝟐 =
"𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒎𝒊𝒆𝒎𝒃𝒓𝒐𝒔 𝒅𝒆 𝒍𝒂 𝒇𝒂𝒎𝒊𝒍𝒊𝒂”.Para ello se recoge una muestra
aleatoria simple de 15 familias cuyos resultados son los de la tabla
adjunta (El gasto e ingreso está dado en miles de dólares)

0.4 0.3 0.3 0.4 1.2 0.4 0.5 0.2 1.2 0.3 0.3 0.7 0.4 0.4 0.3
GASTO 3 1 2 6 5 4 2 9 9 5 5 8 3 7 8
INGRE
SO 2.1 1.1 0.9 1.6 6.2 2.3 1.8 1.0 8.9 2.4 1.2 4.7 3.5 2.9 1.4
TAMAÑ
O 3 4 5 4 4 3 6 5 3 2 4 3 2 3 4

a) Encontrar y estimar el modelo.


b) Interpretar los coeficientes
c) Calcular los intervalos de confianza de los parámetros del modelo al
90% , para la 𝜎 2
d) Encontrar la varianza de los estimadores del modelo
e) Los intervalos de confianza y pruebas de hipótesis para los coeficientes.

Solución (VER EXCEL ):


15 42 55 
( X ' X )   42 188.08 140.8

55 140.8 219 
 8.07 
( X ' Y )  32.063
 28.96 

Página 3
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

0.16045804 
  ( X ' X )*( X ' Y )  0.14872702 
0.07691519 
a) Encontrar y estimar el modelo :
𝛾 = −0.16045804 + 0.14872702𝑥1 + 0.07691519𝑥2
b) Interpretar los coeficientes
𝑏0= -0.16045804 nos indica los gastos en alimentación en miles de dólares,
cuando no hay ingresos mensuales y tampoco número de miembros de la
familia

𝑏1 = 0.14872702 Nos indica los gastos en alimentación en miles de dólares


por cada ingreso mensual, sin tener en cuenta el número de miembros de la
familia.

𝑏2 = 0.07691519Es el incremento en los gastos de alimentación en miles de


dólares por cada miembro de la familia sin tener en cuenta los ingresos
mensuales.

c) Calcular los intervalos de confianza de los parámetros del modelo al


90% , para la 𝝈𝟐

 (15  2  1)(0.006008154) (15  2  1)(0.006008154) 


IC   , 
 5.892 22,36 
IC  (0.01223656619, 0.003224411807)

d) Encontrar la varianza de los estimadores del modelo


 b20  0.095442667
 b2  4.698666667
1

 2
b2  1.155555556

Página 4
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

e) Los intervalos de confianza y pruebas de hipótesis para los


coeficientes.

-  j  t / 2,( nk 1)  2C jj     j t / 2,( n k 1)  2C jj


-0.160458043-2.179 0.006008154(0.095442667)  0  -0.160458043+2.160 0.006008154(0.095442667)

-0.357398981  0  0.036482895

- 0.127001389  1  0.170452656
0.033106092  2  0.120724296

GL SC CM F
Regresión 2 1.359542152 0.679771076 113.14142
Residuos 12 0.072097848 0.006008154
Total 14 1.43164
Ftab  3,89
Se rechaza la 𝐻0 de manera que el modelo en conjunto es bueno para
explicar la variable dependiente

3. La función de beneficios de los operadores de telefonía móvil en


nuestro país podría corresponder a una función del siguiente tipo:
̂𝒊 = −𝟎. 𝟐𝟕𝟔 + 𝟐. 𝟎𝟗𝟏𝑿𝟐𝒊 − 𝟎. 𝟔𝟑𝑿𝟑𝒊
𝜸 i=1,2,….,5
𝑫𝒐𝒏𝒅𝒆:
𝒀𝒊 = 𝑩𝒆𝒏𝒆𝒇𝒊𝒄𝒊𝒐𝒔 𝒐𝒃𝒕𝒆𝒏𝒊𝒅𝒐𝒔 𝒆𝒏 𝒆𝒍 ú𝒍𝒕𝒊𝒎𝒐 𝒕𝒓𝒊𝒎𝒆𝒔𝒕𝒓𝒆 𝒑𝒐𝒓 𝒍𝒂 𝒄𝒐𝒎𝒑𝒂ñ𝒊𝒂 𝒊
𝑿𝟐𝒊 = 𝑻𝒊𝒑𝒐𝒔 𝒅𝒆 𝒄𝒐𝒏𝒕𝒓𝒂𝒕𝒐𝒔 𝒒𝒖𝒆 𝒐𝒇𝒓𝒆𝒄𝒆 𝒂 𝒔𝒖𝒔 𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔 𝒍𝒂 𝒄𝒐𝒎𝒑𝒂ñ𝒊𝒂 𝒊
𝑿𝟑𝒊 = 𝑷𝒓𝒆𝒄𝒊𝒐 𝒎𝒆𝒅𝒊𝒐 𝒅𝒆𝒍 𝒄𝒐𝒔𝒕𝒆 𝒅𝒆 𝒍𝒍𝒂𝒎𝒂𝒅𝒂 𝒆𝒏 𝒍𝒂 𝒄𝒐𝒎𝒑𝒂ñ𝒊𝒂 𝒊
En relación con el modelo anterior se conoce la siguiente información:
 5 11 12 
 
X ' X   ¿? 29 
 32 

 14 
 
X ' Y   35 
 37 
 
2
∑ 𝑦 = 8.8 ∑ 𝑌 2 = 48

Se completa la matriz de :

Página 5
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

 0.276 

 
B   2.091 
 0.63 
 

Por fórmula sabemos que ( X T X ) B  X T Y
 5 11 12  0.276   14 
    
 11 27 29  2.091    35 
12 29 32  0.63   37 
    

Multiplicando matrices:
(11* 0.276)  (a *2.091)  (29* 0.63)  35
3.036  (a *2.091)  (18.27)  35
(a *2.091)  56.306
a  26.9278  27

Entonces X T Y
 5 11 12 
 
 11 27 29 
12 29 32 
 

4. Una empresa farmacéutica está interesada en retirar del mercado uno


de sus complejos vitamínicos. La decisión adoptada consistirá en
eliminarlo de su producción si los beneficios no se ven afectados y
mantenerlo en el caso de que estos varíen de forma significativa. Con
el fin de tomar una decisión se ha elaborado un modelo econométrico
para explicar los Beneficios (Y) a partir de los costes del complejo
vitamínico cuya exclusión se está planteando (X2) y los costes totales
de producción (X3).Acerca de estas variables se conoce la estimación
del siguiente modelo de regresión :
𝑦̂𝑡 = 1.8 − 0.32𝑥2𝑡 − 0.5𝑥3𝑡

Y la siguiente información: n=10


∑ 𝑌𝑡 = 15 ∑(𝑌𝑡 − 𝑌̅)2 = 2.5 ∑ 𝑌𝑡 𝑋2𝑡 = 2.8 ∑ 𝑌𝑡 𝑋3𝑡 =
4.1 Suponga que Vd. es el asesor económico del Director de la empresa
farmacéutica y debe aconsejarle acerca de la producción para el
próximo, para ello debe responder a las siguientes preguntas:

Página 6
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

a) ¿Contribuyen globalmente las variables selección en la explicación de la


variación de la variable beneficios?
b) Con la finalidad de analizar la sensibilidad de los beneficios a los costes
del mencionado complejo (𝑋2 ) se ha estimado este modelo alternativo
en el que se excluye esta variable .De este modelo se conoce el
coeficiente de bondad de ajuste 𝑅 2 = 0.97

SOLUCIÓN:
a) ¿Contribuyen globalmente las variables selección en la explicación
de la variación de la variable beneficios?

 15   1.8 
 
   0.32 

X Y   2.8 
T

 4.1   0.5  T
      1.8 0.32 0.5 
15
T
Y  1.5
 X T Y  24.054 10 2
nY  22.5
SCT   (Yt  Y )2  2.5 SCR  24.054  22.5  1.554
SCE  2.5 1.554  0.946
ANVA:
H 0 :  2  3  0
H1 :  2  3  0

F.V GL SC CME Fcal F(0.05,2,7)


Regresión 2 1.554 0.777 5.74947146 4.73741413
Residuos 7 0.946 0.135142857
Total 9 2.5
Fcal  F(0.05,2,7) Se rechaza H 0 Existe suficiente evidencia estadística para
concluir que los costes de complejo vitamínico y los costes totales
influyen significativamente en los beneficios.

b) Con la finalidad de analizar la sensibilidad de los beneficios a los costes del


mencionado complejo (𝑋2 ) se ha estimado este modelo alternativo en el
que se excluye esta variable .De este modelo se conoce el coeficiente de
bondad de ajuste 𝑅 2 = 0.97

Página 7
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

1.554
R2   0.6216
2.5
R 2 ajust  1  (1  R 2 )*( glT / glE )   1  (1  0.6216)*(2 / 7) 

5. El gerente de un polideportivo municipal ubicado en el interior d una


provincia situada en la costa por experiencia de los 5 años anteriores,
que el número de entradas vendidas al día (Y) depende del número de
kilómetro de distancia a la playa más cercana (𝑿𝟐 ) y del número de
piscinas particulares situadas en la zona (𝑿𝟑 )
Dispone además de la siguiente información:
 0.5625 0.6875 0.4375   20 
   
sbb  1.4375 1.0625  X ' Y   59 
 0.8125   88 
  
S y2  2 R 2  0.95
Donde el modelo:
Yi  1  2 . X 2i  3 . X 3i   i
a) Contraste las siguientes hipótesis:
H 0  3  1  35
2 2  180
c) ¿La suma de los efectos de la variable 𝑋2 𝑦 𝑋3 es nula?
3  1  35
- Contraste la siguiente hipótesis: H 0 :
2 2  180
Solución:

Y: Nº de entradas al día.
X2: nº de kilómetros de distancia a la playa más cercana.
X3: nº de piscinas particulares situadas en la zona.

 0.5625 -0.6875 0.4375 


( X ' X )  -0.6875 1.4375 -1.0625
1

 0.4375 -1.0625 0.8125 

Página 8
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

 20
( X ' Y )  59 
88 

9.1875 
  ( X X )*  X Y   -22.4375
T T

17.5625 

Entonces el modelo es:

Yi  1   2 . X 2i  3 . X 3i   i
Yi  9.1875  22.4375 X 2i  17.5625 X 3i   i

Hipótesis general

3  1  35
H0 :
2 2  180

-1 0
-1 1
K  0 2
0
K 
0 2 0
1 0 

 35 
m 
 180 

r=2 ;

Q  [ K T   m]T [ K T ( X T X )1 K ]1[ K T   m]

-1 0 1 9.1875
[ K T   m]T  -22.4375
35
0 2 0 -180
17.5625

[ K T   m]T  -26.625 135.125

Página 9
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

- -1 0
-1 0 1 0.5625 0.6875 0.4375 0 2
[ K T ( X T X )1 K ]1  0 2 0 - - 1 0
0.6875 1.4375 1.0625
-
0.4375 1.0625 0.8125

2.48648649 0.32432432
[ K T ( X T X )1 K ]1 
0.32432432 0.21621622

-26.625
[ K T   m] 
135.125

POR LO TANTO

Q  [ K T   m]T [ K T ( X T X )1 K ]1[ K T   m]

Q - 2.48648649 0.32432432 -26.625


26.625 135.125 0.32432432 0.21621622 135.125

Q  3376.84291

Q S Q
Fcal  2
 2
 S.

3376.84291
Fcal 
2* 2

Fcal  844.2107

Ftab  10.13

Decisión: Fcal  Ftab ; se rechaza la H 0 al 95% de confianza.


Por lo tanto como H 0 se rechaza no se puede construir un cuadro ANVA para el
modelo reducido.

Página 10
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

6. Para el modelo Yt  1  2t  3t  ut se tiene los siguientes datos:


n  12 SCT  104'9167
 0.6477 0.041 0.0639   91 

 X ' X    0.041 0.0071 0.0011  X 'Y   699 
 ,
1

 0.0639 0.0011 0.0152   448 


   
Se pide:
a) Ajustar el modelo por el método de MCO y calcular el coeficiente de
determinación
b) Contraste de significación para  2  3  1
c) Intervalo de predicción para E[Y] sabiendo que 0  2.5 0  0.3

VER EN EXCEL:
a) Ajustar el modelo por el método de MCO y calcular el coeficiente de
determinación

0.6477 −0.041 −0.0639 91 1.6545


𝛽̂ = (𝑋 𝑇 𝑋)−1 (𝑋 𝑇 𝑌) = [ −0.041 0.0071 −0.0011] [ 699] = [ 0.7391]
−0.06369 −0.0011 0.0152 448 0.2258

𝛽1 = 1.6545 𝛽2 = 0.7391 𝛽3 = 0.2258


Interpretación:
𝛽1: estimamos que la variable dependiente se incrementa en 1.6545 cuando las
variables independientes son cero.
𝛽2 :El incremento de Y es de 0.7391 por unidad cuando 𝛽3no se tiene en cuenta
𝛽3 :El incremento de Y es de 0.2258 por unidad cuando 𝛽2no se tiene en cuenta.
2 ∑ 𝑌 91
𝑆𝐶𝐸 = 𝛽̂ 𝑇 𝑋 𝑇 𝑌 − 𝑁𝑌 𝑁 = 12 𝑌 = = = 7.58333
𝑁 12
91
𝛽̂ 𝑇 𝑋 𝑇 𝑌 = [1.6545
0.7391 0.2258 ] × [ 699 ] = 768.3488
448
𝑆𝐶𝐸 = 768.3488 − 12(7.58333)2 = 𝟕𝟖. 𝟐𝟔𝟓𝟒𝟕
b) Contraste de significación para  2  3  1

Página 11
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

𝐻0 : 𝛽2 + 𝛽3 = 1
{ 𝛽2 + 𝛽3 − 1 = 0 𝑚=1 𝐾 = (0 1 1)
𝐻1 : 𝛽2 + 𝛽3 ≠ 1

1.6445
𝐾𝛽̂ − 𝑚 = [0 1 1] [0.7391] − 1 = −0.0351
0.2258

0.6477 −0.041 −0.0639 0


𝑇 −1 𝑇
𝐾(𝑋 𝑋) 𝐾 = [0 1 1] [ −0.041 0.0071 −0.0011] [1]=
−0.06369 −0.0011 0.0152 1
0
𝑇 −1 𝑇
𝐾(𝑋 𝑋) 𝐾 = [−0.1049 0.006 0.0141] [1] = 0.0201
1

𝐾(𝑋 𝑇 𝑋)−1 𝐾 𝑇 = 0.0201

𝑆𝐶𝑅 𝑆𝐶𝑇 − 𝑆𝐶𝐸 104.9167 − 78.2654


𝜎̂ 2 = = = = 2. .962
𝑁−𝐾 𝑁−𝐾 9

𝜎̂ 2 = 2.962

−0.03512
𝐹𝑐𝑎𝑙 = = 0.0207 𝐹𝑡𝑎𝑏 = 𝐹1,9,0.05 = 5.117
2.962 × 0.0201

𝐹𝑐𝑎𝑙 < 𝐹𝑡𝑎𝑏 𝑆𝐸 𝐴𝐶𝐸𝑃𝑇𝐴 𝐻0


Podemos concluir diciendo que 𝛽2 + 𝛽3 = 1 en el problema.
c) Intervalo de predicción para E[Y] sabiendo que 0  2.5 0  0.3

Intervalos de confianza
𝐸[𝑌]: 𝑉0 = 2.5 𝑊0 = −0.3

𝑌 = 1.6545 + 0.7391𝑉1 + 0.2458𝑊2 + 𝜇𝑡 = 3

𝑌 = 3.43451
𝑌̂0=± 𝜎 𝑡𝑛−𝑘−1 ,𝛼/2 √𝑋0 𝑇 (𝑋 𝑇 𝑋)−1 𝑋0

0.6477 −0.041 −0.0639 1


𝑋0 𝑇 (𝑋 𝑇 𝑋)−1 𝑋0 = [1 2.5 −0.3] [ −0.041 0.0071 −0.0011] [ 2.5 ] =
−0.06369 −0.0011 0.0152 −0.3

Página 12
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

𝑋0 𝑇 (𝑋 𝑇 𝑋)−1 𝑋0 = 0.52837
3.43451 ± (2.2622)(1.721)(0.727)
[0.60451; 6.26451]

𝑆𝐶𝐸 78.26547
𝑟2 =
= = 0.7459
𝑆𝐶𝑇 104.9167
El modelo de regresión múltiple explica que el ajuste realizado explica
aproximadamente un 74.59% de la variabilidad de la dependiente.

7. En un estudio de los determinantes de la inversión se usaron 20 datos


anuales, correspondientes a las siguientes variables: inversión anual
en billones de pesetas (Y), tipo de interés en porcentaje (𝑿𝟏 ) y
variación anual de PIB en billones de pesetas (𝑿𝟐 ).Se dispone de la
siguiente información:
∑ 𝑋1𝑡 = 100 ∑ 𝑋2𝑡 = 24 ∑ 𝑌𝑡 = 5
∑ 𝑋1𝑡 𝑌𝑡 = −255 ∑ 𝑋2𝑡 𝑌𝑡 = 146 ∑ 𝑋1𝑡 𝑌2𝑡 = 100

 X12t  680  X 22t  48'8  Y  Y 


2
t  1200
Se pide:
a) Obtenga las estimaciones por MCO de modelo Yt     X1t   X 2t  u2
b) Contraste la significación global del modelo a partir del porcentaje de
evolución temporal de la inversión que puede explicarse por la influencia
lineal del tipo de interés y la variación anual del PB.
c) Contraste la hipótesis nula:
1  1 

 2  2
SOLUCIÓN:
a) Obtenga las estimaciones por MCO de modelo Yt     X1t   X 2t  u2

20 100 24 5
̂
𝛽 = [100 680 100 ] [−255]
24 100 48.8 146

23184 −2480 −6320


𝑇 −1
(𝑋 𝑋) = [−2480 400 400 ] ÷ (20(23184) − 100(2480) + 24(6320))
−6320 400 3600
= (64000)

Página 13
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

23184 −2480 −6320


[−2480 400 400 ]
0.36225 −0.03875 −0.09875
(𝑋 𝑇 𝑋)−1 = −6320 400 3600 = [
−0.03875 0.00625 0.00625 ]
64000
−0.09875 0.00625 0.05625

0.36225 −0.03875 −0.09875 5 −2.725 𝛽0


𝛽̂ = [−0.03875 0.00625 ] [
0.00625 −255 ] = [−0.875 ] = [ 𝛽1 ]
−0.09875 0.00625 0.05625 146 6.125 𝛽2

𝑌 = −2.725 − 0.875𝑋1 + 6.125𝑋2 + 𝜇


Interpretación:
𝛽0: Inversión anual en billones de pesetas (Y), es de -2.725 cuando tipo de interés
en porcentaje (X1) y variación anual del PBI en billones de pesetas(X2) es cero.
𝛽1 :La inversión anual en billones de pesetas tiene una disminución de -0.875 por
unidad cuando no se tiene en cuenta la variación anual del PBI en billones de
pesetas sin tener en cuenta 𝛽2.
𝛽2 :Nos indica que la inversión anual en billones de pesetas se incrementa en
6.125 por unidad cuando no se tiene en cuenta 𝛽1.

b) Contraste la significación global del modelo a partir del porcentaje de evolución


temporal de la inversión que puede explicarse por la influencia lineal del tipo de
interés y la variación anual del PB.

SIGNIFICANCIA GLOBAL:
FV GL SC CME F calculado
𝑿𝟏 , 𝑿𝟐 K=2 1102.5 551.25 96.11545362
𝜺𝒊 n-K-1=17 97.5 5.73529
SCT n-1=20 1200

Tenemos entonces:
1102.5
𝑅2 = = 0.9187
1200
𝐸𝐿 𝑀𝑂𝐷𝐸𝐿𝑂 𝐸𝑋𝑃𝐿𝐼𝐶𝐴 𝐸𝐿 91.87% 𝐷𝐸 𝑉𝐴𝑅𝐼𝐴𝐵𝐼𝐿𝐼𝐷𝐴𝐷 𝐷𝐸 𝐿𝐴 𝐼𝑁𝑉𝐸𝑅𝑆𝐼𝑂𝑁 𝐴𝑁𝑈𝐴𝐿 𝐸𝑁 𝑃𝐸𝑆𝐸𝑇𝐴𝑆
Probar: 𝐻0 ∶ 𝛽1 = 1
𝛽2 = 2
2
𝑆𝐶𝑅 = 𝛽̂ 𝑇 𝑋 𝑇 𝑌 − 𝑁𝑌
5
𝛽̂ 𝑇 𝑋 𝑇 𝑌 = [−2.725 − 0.875 6.125] [−255] = 1103.75
146

𝑆𝐶𝑅 = 1103.75 − 20(0.25)2 = 1102.5 𝑆𝐶𝑇 = 1200

𝑆𝐶𝐸 = 1200 − 1102.5 = 97.5

Página 14
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

𝐹𝑡𝑎𝑏 = 𝐹,𝛼,𝐾,𝑛−𝑘−1 = 𝐹0.05,2,17 = 3.59

𝐹𝑡𝑎𝑏 (3.59) < 𝐹𝑐𝑎𝑙 (96.14545)

Se rechaza H0, el modelo en su conjunto si es significativo.


c) Contraste la hipótesis nula:
Finalmente para contrastar la hipótesis:
  1
H0 :  1
2  2

Se tiene que
0 1 0 1
K   m  s2
 0 0 1  2
En tal caso:
 2.725 
  0 1 0    1   1.875 
K m    *  0.875       
 0 0 1  6.125   2   4.125 
 
 0.8623 0.0388 0.0988   00 
1 0 1 0      0.0063 0.0063 
K(X X ) * K  
T T
 *  0.0388 0.0063 0.0063  *  1 0    
 0 0 1  0.0988 0.0063 0.0562   01   0.0063 0.0562 
   
Además:
97.55
SCE  SCT  SCR  97.55 2   5.7382
17
Por lo tanto:
 178.7702 20.0401 1.875 
 1.875 4.125   
 20.0401 20.0401  4.125 
Fcal   111.4597
2*5.7382
F(0.05,2.17)  3.59 Fcal  F(0.05,2.17)
Se rechaza la hipótesis nula.

Página 15
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

8. Se desea estudiar la influencia que sobre la demanda de carne de


vacuno ha tenido el precio de la carne de cerdo (𝑿𝟏 ) y de la ternera
(𝑿𝟐 ).Para ello se han tomado datos anuales desde 1979 a 2001 (ambos
inclusive), obteniéndose los siguientes resultados:
𝑌̂𝑡 = 2,1 + 0,7𝑋2𝑡 − 1,5𝑋2𝑡 𝑅 2 = 0,9 SCE=126
¿Se podría afirmar, para un nivel de confianza del 95% que los precios no
influyen sobre la demanda de ternera? Para saber si los precios de la carne
de cerdo y de ternera influyen en la demanda de la carne estudiaremos la
significación conjunta del modelo. Puesto que:
R2
Fexp  k  12 
0,9 / 2 0, 45
  90  3, 49  F2,20 (0,95)  Fk 1,n k (1   )
1 R 0,1/ 20 0, 005
nk

Solución:
Como se observa en el enunciado podemos darnos cuenta que nos pide que
demostremos o probemos si existe una relación significativa entre la variable
dependiente y las variables independientes ( X1 ; X2 )
Para saber si los precios de la carne de cerdo y de ternera influyen en la demanda
de la carne estudiaremos la significación conjunta del modelo. Es decir usaremos
la prueba “F”.

R2 /k−1
F = 1−R2 /n−k ; En donde aquí tomamos a k como el
número de variables, es decir; K =3 n=23

Entonces:
𝐻0 = 𝛽1 = 𝛽2 = 0 𝐻1 = 𝛽1 = 𝛽2 ≠ 0

0.9/3 − 1 0.45
𝐹= = = 90 > 3.49 = 𝐹0.05;2;20
0.10/ 20 0.005
Entonces rechazamos la hipótesis nula; por lo que afirmamos que los precios de la
carne cerdo y de ternera influyen sobre la demanda de carne de vacuno.

Página 16
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

9. Para estimar el modelo Yt  1  2 . X 2t  3 . X 3t  ut se ha obtenido una


muestra de la cual ha resultado:
14 7 14  10 
   
X ' X   7 4,5 7  X 'Y   6  Y ' Y  14
14 7 15  12 
   
Se pide:
a) Estimar los coeficientes del modelo por MCO
b) Estudiar la significación del modelo.
c) Contrastar el intervalo de predicción  2  1  3
d) Calcular el intervalo de predicción X 2  5, X 3  7 ∑ 𝑌 = 10 𝑌̅ =
10/14

Solución:
a) Las estimaciones de los coeficientes será de la siguiente forma:

Yˆ  1.7857  1X 2t  2 X 2t

1.3214 0.5 1 10   1.7857 


ˆ  ( X t X )1 X tY   0.5 1
   
0  6    1 

 1 1  12   2 
 0

Por tanto el modelo de regresión quedaría de la siguiente forma:

b) Para estudiar la significación del modelo recurrimos al contraste del ANVA,


de manera que el modelo será significativo si:

Página 17
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

Teniendo en cuenta que:

10
Y t  10  Y 
14
 0.7143

𝐻0 : 𝐵2 = 𝐵3 = 0
𝐻1 : 𝑎𝑙𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝐵𝑖 ≠ 0 𝑖 = 2,3

10 
 X Y   1.7857 1 2  *  6   12.1429
T 10
T
Y  0.7143
12  14
 

SCR  12.1429  14(0.7143)2  4.9998


SCT  14  14(0.7143)2  6.8569
SCE  6.8569  8074  1.8571

FV GL SC CME Fcal Ftab


REGRESION 3 5.0 1.66666667 9.87179487 3.59
ERROR 11 1.85714286 0.16883117
TOTAL 13 6.9
Fcal  F(0.05,3,11)
Se rechaza H 0 . El modelo es significativo.

a. Contrastar la hipótesis 𝐵2 + 1 = 𝐵3 VER EXCEL:


K   0 1 1 m  1 s 1
 1.7857 

 
K   m   0 1 1 * 
T
1  1  0
 2 

Fcal  0 F(0.05,1,11)  4.84 Fcal  F(0.05,1,11)
Por lo tanto no se rechaza a la hipótesis.
b. Intervalo de predicción:
1
  X 0T  1 5 7 
 
Y  X 0T   17.2143
X0   5
7
 

Página 18
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

1.8571
2   0.1688    0.4109
11
X 0T  X T X  X 0  56.3214
1

¨Por lo tanto:
17.2143  2.201*0.4109* 56.3214
P 10.3671   2  34.0625  95%

10. Al objetivo de determinar si existen o no diferencias en las


calificaciones obtenidas por hombres y mujeres en una determinada
asignatura, a partir de 20 observaciones se estimó el modelo:
notat  0  1notamedia BUPt  2 generot  ut , donde la variable genero
toma el valor 1 si se trata de una mujer y 0 para un varón. Los resultados de
la estimación fueron los siguientes:
̂𝑡 = 25 + 0,75𝑛𝑜𝑡𝑎𝑚𝑒𝑑𝑖𝑎
𝑛𝑜𝑡𝑎 𝐵𝑈𝑃𝑡 + 20,5𝑔𝑒𝑛𝑒𝑟𝑜𝑡 𝑅 2 = 0,72
(4,5) (7,1) (2,3)
¿Puede decirse que los resultados de unos y otros son distintos?

SOLUCIÓN:
Teniendo en cuenta que la nota esperada para un varón y una mujer son,
respectivamente:
E  notat / generot  0  0  1notamediaBUPt
E  notat / generot  1  0  1notamediaBUPt  2

Se tiene que, para una misma nota media en BUP, la diferencia esperada entre la
nota de una mujer y un hombre viene determinada por:
E  notat / generot  1  E  notat / generot  0  2

Como el contraste de significación individual para dicho parámetro es significativo:

 24.0615   y  10.3671  0.95

20.5
texp   8.913  2.0003  t60 (0.975)
2.3

Página 19
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

Se tiene que dicho parámetro es distinto de cero. Por tanto, puede afirmarse que
los resultados de unos y otros son distintos.
Además, como la estimación de dicho parámetro es positiva, la nota esperada
para una mujer es mayor que la de un hombre (siempre y cuando tengan la misma
nota media en BUP).
11. Con información muestral relativa a 14 observaciones, se pretende
estimar el modelo de regresión:
Yt  0  1. X1t  2 . X 2t  3 X 3t  ut
A partir de:
 14   248 
   
 85 631   1622 
X 'X  , X 'Y 
 532 3126 2066   9202 
   
 2094 13132 78683 317950   37592 
Se pide:
a) Calcular las estimaciones de los parámetros de modelo por MCO
b) Estimar 𝑉𝑎𝑟(𝛽̂ )
c) ¿Influye las variaciones de 𝑋2𝑡 en la variable dependiente?
d) Calcular el coeficiente de determinación corregido
e) Calcular un intervalo de confianza del 95% para la varianza del término
de perturbación
f) Contrastar la significación global del modelo al 95%.

SOLUCIÓN:

a) Calcular las estimaciones de los parámetros de modelo MCO:


- Completamos la matriz:

 14 85 532 2094 
 
 85 631 3126 13132 
X X
T
 532 3126 20666 78683 
 
 2094 13132 78683 317950 

- Hallamos la inversa de la matriz X T X :

 20.164 0.015065 0.23145 0.7617 


 
0.001194 0.00094 
 X X    0.23145
T 1 0.015065 0.013204
0.001194 0.003635 0.000575 
 
 0.7617 0.00094 0.000575 0.000401 
 
1
- Hallamos ˆ  X t X X tY

Página 20
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

 20.164 0.015065 0.23145 0.7617   248 


   
0.015065 0.013204 0.001194 0.00094   1622 
ˆ   *
 0.23145 0.001194 0.003635 0.000575   9202 
   
 0.7617 0.00094 0.000575 0.000401   37592 

 32.891    0
 
ˆ  0.80371   1

 0.3982    2
 
 0.03713    3

- El modelo de regresión:

Yˆt  32.891  0.80371X1t  0.3982 X 2t  0.03713X 3t

b) Estimar Var ˆ  
Solución:
Teniendo en cuenta (por construcción del vector X tY que:
248
 Yt  248  Y  14  17.714
Y que:
ˆ t . X tY  4552.552
Se tiene que:
SC R  ˆ t . X tY  n Y 
2

SCR  4552.552  14 17.714 


2

SCR  159.551
Entonces, puesto que el enunciado nos indica que SCT  226.86 , es inmediato
que:
SCE  SCT  SCR
SCE  226.86  159.551
SCE  67.309
Y por tanto:
SCE 67.309
ˆ 2    6.7309
n  k 14  4

Página 21
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

Luego, la estimación de Var ˆ :  


 1.3575 0.00101 0.0155 0.00512 
 
ˆ ˆ  ˆ 2 .  X t X 1   0.00101 0.000888 0.00008 0.000063 
Var    0.0155 0.00008 0.00024 0.000038 
 
 0.00512 0.000063 0.000038 0.000027 
c) ¿Influyen las variaciones de X 2t en la variable dependiente?
A partir de ambas estimaciones podremos determinar si las variaciones de X 2t
influyen en Yt :
0.3982
tcal   25.704
0.00024
ttab  t(0.05,10)  2.228
tcal  ttab
Se rechaza que 2  0 , por lo que X 2t influye en la variable dependiente.
d) Calcular el coeficiente de determinación corregido
Solución:
Para calcular el coeficiente de determinación corregido tendremos en cuenta la
siguiente expresión:
n 1
R 2  1  1  R 2  .
nk
Puesto que:
159.551
R2   0.7033
226.86
Entonces:
13
R 2  1  1  0.7033 .
10
R  0.6143
2

Podemos observar que al eliminar la influencia de las variables explicativas el


coeficiente de determinación ha disminuido alrededor del 9%.
e) Calcular un intervalo de confianza del 95% para la varianza del término de
perturbación
Solución:
 
  n  k  .ˆ 2  n  k  .ˆ 2 
IC 2   2 , 2 
  n  k ,1   X  n  k ,  
X
  2  2 

 10   6.7308  10   6.7308  
IC 2   , 
 20.483 3.247 
IC 2   3.286   2  20.73

Página 22
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

f) Contrastar la significación global del modelo al 95%


Para contrastar la significación del modelo construiremos la tabla ANOVA:
F.V GL SC CM Fcal Ftab
Regresión 3 159.551 53.18367 7.9014 3.71
Residuos 10 67.309 6.7309
Total 13 226.86

Ftab  F(0.05,3,10)  3.71


Decisión: Fcal  Ftab se rechaza la hipótesis nula de que todos los coeficientes son
nulos de forma simultánea, por tanto el modelo es significativo en su conjunto

12. Dado el modelo Yt  1  2 . X 2t  3 . X 3t  4 X 4t  ut ,utilizando una muestra


de 20 datos, se procedió a su estimación, obteniéndose:
̂𝒕 = 𝟖, 𝟑𝟒+0,7𝑿𝟐𝒕 − 𝟎, 𝟒𝑿𝟑𝒕 + 𝟎, 𝟏𝑿𝟒𝒕
𝒀 𝑅 2 = 0,96

0.7
texp   1.25  2.12  t16 (0.975)
0.56
0.4
texp   0.5714  2.12  t16 (0.975)
0.7
0.1
texp   0.2  2.12  t16 (0.975)
0.5

Además, el coeficiente de determinación es bastante alto y el modelo es


conjuntamente significativo:
R2
 k  12 
0.93 / 3 0.32
Fexp   128  3.24
1 R 0.04 /16 0.0025
nk

F3,16 (0,95)  Fk 1,n  k (1 )

Todo esto nos hace pensar en la posible existencia de multicolinealidad en el


modelo.

Página 23
MODELOS
[REGRESIÓN MÚLTIPLE] ESTADÍSTICOS

b) si hay algún problema, indique la forma más adecuada de solucionarlo:


La principal solución para eliminar la relación lineal entre las variables
independientes consiste en eliminar del modelo la variable que causa la
multicolinealidad.

Página 24

S-ar putea să vă placă și