Sunteți pe pagina 1din 11

10/02/2018

Regresión Múltiple

Objetivos
• Introducir el modelo de regresión múltiple.

• Objetivos específicos:
– Saber interpretar los coeficientes de regresión
– Conocer los supuestos en que se basa la regresión
múltiple
– Presentar alternativa del coeficiente de determinación
– Dominar detalles sobre estimación e interpretación de
la función de producción Cobb-Douglas

Modelo de Regresión Múltiple


• El modelo de regresión múltiple incluye dos o
más variables independientes que explican el
comportamiento de la variable dependiente.
El modelo de regresión múltiple de la población o
Función de Regresión Poblacional (FRP) es:

Yi   o  1 X 1i   2 X 2i  ...   k X ki  ui

Componente sistemático Componente aleatorio

1
10/02/2018

Modelo de Regresión Múltiple Cont.


• Y es la variable dependiente
• Xi i=1,…,k son las variables independientes o
explicativas
• ui es el término de error, el único componente
aleatorio del modelo.
• βo es el intercepto en Y de la superficie o plano de
regresión.
• βi es la pendiente del plano de regresión o superficie
de respuesta con respecto a la variable Xi. A estos se
les llama coeficientes de regresión parcial.

• La media condicional de Y es:

E (Y | X )   0  1 X 1   2 X 2  ...   k X k
4

Plano en Regresión Múltiple


x2
y
2

1
0

x1
y     x   x u
0 1 1 2 2

Fuente: McGrawHill/Irwin

Interpretación de Coeficientes

 i es la derivada parcial del valor esperado de Y dado todas las X,
E (Y | X ) 
con respecto a X i ,  i
X i

Esto quiere decir que  i es el cambio esperado en la variable


dependiente Y, por el cambio en una unidad de la variable X i ,
manteniendo constante las otras variables independientes (ceteris
paribus). Proporciona el efecto directo o neto de Xi (neto de
cualquier efecto de otras variables).


 0 es el intercepto en Y, es decir, el valor que toma Y
cuando todas las X i  0.

2
10/02/2018

Ejemplo para Interpretación


D=Bo+B1P+B2I

• Ejemplo: Se desea saber el cambio promedio


en la cantidad demandada de un articulo
debido al cambio en precio del articulo,
manteniendo constante el ingreso del
consumidor. En este caso la estimación del    

modelo se representa así: D     P   I o 1 2



,  es el cambio en demanda debido al
1

incremento en una unidad (e.g., $, L.) en el


precio, manteniendo constante el ingreso del
consumidor.
7

Supuestos
• Adicionalmente a los supuestos de la
regresión simple, se incluyen los siguientes
dos:
– No debe haber colinealidad (relación lineal) exacta
entre las variables X.
• Esto quiere decir que ninguna variable independiente
puede escribirse como combinación lineal exacta de las
regresoras restantes en el modelo.
– No hay sesgo o error de especificación
• Esto quiere decir que el modelo está especificado
correctamente.
8

Estimación y Varianzas de los Estimadores


• La estimación se puede realizar con el método de
MCO, MV, o método de momentos. Seguiremos
nuestro énfasis en MCO.
• MCO busca de igual manera a la regresión simple,
minimizar la suma de cuadrados de los residuos.
• Una fórmula muy útil de la varianza de los
estimadores es:
 2  1 
var( j )    donde R 2j es el R cuadrado
 1 R2 
(X  X ) 2
 j 
2
2
de la regresión de X j sobre las regresoras restantes, y el estimador de  2 es  
u i

n  (k  1)

3
10/02/2018

R2 y R2 ajustada
• Hay que tener cuidado con seleccionar un modelo
sobre otro basado en el R2.
• Debido a que el valor del coeficiente de
determinación no decrece al incluir más variables
independientes se introduce el estadístico R2
ajustada. Este toma en cuenta el número de
regresoras presentes en el modelo. Esta se obtiene
de la siguiente forma:

 u /(n  (k  1))
2
R  1 i
2

 ( y  y) /(n  1) 2

• Nota: este puede resultar negativo.


10

Función de Producción Cobb-Douglas (C-D)


• En su forma log-lineal, la función de
producción C-D de dos variables se representa
así:
ln Yi   0  1 ln X 1i   2 ln X 2i  ui
donde y es producción, X1 es el insumo trabajo y X 2 es
el insumo capital.

De esta forma, 1 y  2 son las elasticidades (parciales) de


la producción respecto al insumo trabajo y capital, respectivamente.
La suma ( 1   2 ) provee los rendimientos a escala
( 1, rendimiento a escala decrecientes,  1, rendimientos constantes
a escala, y  1 rendimientos a escala crecientes).

11

Coeficientes de Correlación Parcial


• El coeficiente de correlación visto hasta el
momento es el coeficiente de correlación bruta,
simple o de orden cero.
• Existe también el coeficiente de correlación
parcial que mide el grado de asociación entre dos
variables cuando existen otras variables que
pueden estar asociadas a las dos variables en
cuestión. El resultado, es un coeficiente de
correlación independiente de la influencia de las
otras variables.

12

4
10/02/2018

Objetivos de Esta Sección


• Conocer, aplicar e interpretar pruebas de
hipótesis de una restricción.
• Conocer, aplicar e interpretar pruebas de
hipótesis de varias restricciones.
• Conocer, aplicar e interpretar regresiones con
variables categóricas.

13

Ejemplo Regresión Múltiple


Año Demanda Precio Ingreso Modelo Coef Error tip. t
1991 40 9 400 intercepto 82.27 15.43 5.33
1992 45 8 500 Precio -5.11 1.42 -3.60
1993 50 9 600 Ingreso 0.017 0.007 2.54
1994 55 8 700
1995 60 7 800
1996 70 6 900
1997 65 6 1000
1998 65 8 1100
1999 75 5 1200
2000 75 5 1300
2001 80 5 1400
2002 100 3 1500
2003 90 4 1600
2004 95 3 1700
2005 85 4 1800
14
Fuente: McGrawHill

Prueba de Hipótesis Sobre Coeficiente Individual


• En regresión múltiple se puede realizar una prueba t para
demostrar una hipótesis sobre cualquier coeficiente. Las
hipótesis de diferencia de cero sería de la siguiente manera:
• H0: βi=0 H1: βi≠0 (Para otras pruebas, se especificaría el valor).
• El estadístico utilizado para realizar la prueba es:

i  i
t( / 2, n ( k 1))  
s( i )
Siguiendo el ejemplo de demanda sobre precio e ingreso,

   5.11  0
t(0.05 / 2, 15(21))  1 1   3.60
 1.42
s ( 1)
El valor t(0.025, 12) de la tabla es 2.179 por lo que rechazamos
la hipótesis nula y decimos que B 1 es diferente de cero.
15

5
10/02/2018

Prueba de Significancia General (F)


• Del análisis de varianza obtenemos el estadístico
F el cual nos sirve para probar si los coeficientes
conjuntamente son iguales a cero. De modo que
las hipótesis son las siguientes:
• H0: β1=β2=β3=…=βk=0
• H1: por lo menos uno de los Betas es diferente de
cero
• El valor F obtenido se compara con el valor F de la
tabla con (k, n-(k+1)) grados de libertad y la
confiabilidad deseada.
SS /k R2 / k
F  E 
(r,(n  (k  1)) SS /( n  ( k  1))
R
(1 R 2 ) /(n  (k 1))
16

Prueba F en Ejemplo de Demanda


Fuentes de Suma de Grados de
Cuadrado
variación Cuadrados Libertad Valor F
Medio
Regresion 4372.963 2 2186.482 115.566
Error 227.037 12 18.920
Total 4600.000 14

• El valor F(0.05, (2,12)) de la tabla es: 3.88. El valor F obtenido


es mayor al de la tabla por lo que se rechaza la hipótesis nula
y decimos que por lo menos un coeficiente es diferente de
cero.
• La prueba F parcial se utiliza para seleccionar entre modelos
completos y anidados. Ejemplo de este se ve en la siguiente
diapositiva. 17

Prueba F Parcial y la Selección de Variables


Modelo Completo:
Y =  0 +  1 X1 +  2 X2 +  3 X3 +  4 X4 + 
Modelo Restringido:
Y =  0 +  1 X1 +  2 X2 + 

Prueba F parcial:
H0: 3 = 4 = 0
H1: 3 y 4 no son ambos iguales a cero

Estadístico parcial F:

(SS  SS )/r ( Rc2  Rres


2 )/r
F  R res Rc 
(r,(n  (k  1))
(1 Rc2 ) /(n  (k 1))
SS Rc
n  ( k  1)

Donde r es el número de restricciones, o sea, el número de variables que se descartan del


modelo completo.

18

6
10/02/2018

Variables Categóricas
• La regresión además de incluir variables de razón
(como hemos visto hasta el momento), puede incluir
variables nominales o categóricas. Ahora veremos
como incluir este tipo de variables como variables
independientes.
• Las variables categóricas se incluyen en modelos de
regresión generalmente con una combinación de
ceros y unos, que indican la presencia o ausencia de
una característica.
• Las variables que adquieren valores de ceros o unos
se les llaman variables dicótomas.

19

Variables Dicótomas
• El número de variables dicótomas a incluir en
un modelo de regresión con intercepto por
cada variable categórica es (m-1) donde m es
el número de categorías.
• Si incluye m variables dicótomas, incurre en la
trampa de variables categóricas, que es un
problema de multicolinealidad perfecta.

20

Variables Independientes Categóricas en Regresión


Se hizo una regresión de los ingresos (en millones) por película
sobre los costos de producción y promoción (en millones) y la
variable dicótoma que indica si fue basada en un libro o no. Si era
basada en un libro se le daba un valor de 1, si no 0. La manera de
ingreso de los datos y el resultado de la regresión están abajo.
Pelicula Ingr COSTO PROMO Libro

1 28 4.2 1.0 0
Modelo Coef Error tip. t
2 35 6.0 3.0 1
3 50 5.5 6.0 1 Intercepto 7.83 2.33 3.35
4 20 3.3 1.0 0
5 75 12.5 11.0 1
6 60 9.6 8.0 1 Costo Prod. 2.85 0.39 7.26
7 15 2.5 0.5 0
8 45 10.8 5.0 0 (millones $)
9 50 8.4 3.0 1
10 34 6.6 2.0 0 Costo 2.27 0.25 8.99
11 48 10.7 1.0 1
12 82 11.0 15.0 1 Promoción
13 24 3.5 4.0 0
14 50 6.9 10.0 0 (millones $)
15 58 7.8 9.0 1
16 63 10.1 10.0 0 Libro 7.17 1.82 3.94
17 30 5.0 1.0 1
18 37 7.5 5.0 0
19 45 6.4 8.0 1
20 72 10.0 12.0 1
21

7
10/02/2018

Interpretación de Coeficientes de
Variables Categóricas
• El valor de 7.17 (millones de $) es el ingreso
adicional promedio de una película basada en un
libro comparada con una película que no los es.
• A este coeficiente se le llama coeficiente de
intercepto diferencial, debido a que indica como
cambia el intercepto debido a la categoría con
valor de 1, respecto a la categoría base (la que
tiene todos ceros en sus variables dicótomas).

22

Interacciones de Variables de Razón y


Variables Categóricas
• En algunas regresiones se incluyen las
interacciones.
• La interacción es el efecto diferencial que se
obtiene entre los niveles de una variable en
distintos niveles de otra variable.
• Por ejemplo, se hizo una regresión del logaritmo
de salario ($/hora) sobre educación (años),
experiencia (años), experiencia al cuadrado, sexo
(1=mujer, 0= hombre) y las interacciones de sexo
con educación, experiencia, y experiencia al
cuadrado, obtenemos el resultado de la siguiente
diapositiva.
23

Interpretación de las Interacciones


ln sal  0.085  0.089educ  0.067 exp 0.001exp2  0.199sexo  0.019sexoXeduc  0.039sexoX exp 0.001sexoX exp2

El coeficiente de sexo indica la proporción de salario por hora (-0.199)


reducido que tienen las mujeres comparado con el hombre cuando
los años de educación formal y experiencia son cero (o hacia el primer
año) . Es el coeficiente de intercepto diferencial.

El coeficiente de la interacción sexo y educación indica la diferencia


entre mujeres y hombres en el cambio de proporción de salario
debido al primer año de educación formal (0.019)(diferencia entre las
pendientes con respecto a educación entre mujeres y hombres). Este
es el coeficientes de pendiente diferencial (con respecto a educación).
24

8
10/02/2018

Interpretación de las Interacciones


ln sal  0.085  0.089 educ  0.067 exp  0.001 exp 2  0.199 sexo  0.019 sexoXeduc  0.039 sexoX exp  0.001sexoX exp 2

El coeficiente de la interacción “sexo por experiencia” (-0.039) indica


la diferencia entre mujeres y hombres en el cambio de proporción en
salario debido al primer año de experiencia (es decir, cuando no se
tiene experiencia). De otro modo, es la diferencia en la pendiente
con respecto a experiencia entre mujeres y hombres, cuando los años
de experiencia es cero.

El coeficiente de “experiencia al cuadrado” (-0.001) indica la mitad de


la diferencia en el cambio del cambio de proporción en salario debido
a un año más de experiencia para los hombres (mitad del cambio de
la pendiente de experiencia en hombres).
25

Interpretación de las Interacciones


ln sal  0.085  0.089 educ  0.067 exp  0.001 exp 2  0.199 sexo  0.019 sexoXeduc  0.039 sexoX exp  0.001sexoX exp 2

El coeficiente de la interacción “sexo por experiencia al cuadrado”


indica la diferencia entre mujeres y hombres de la mitad en el cambio
del cambio de proporción en salario debido a un año más de
experiencia (la mitad de la diferencia del cambio de la pendiente de
experiencia entre mujeres y hombres).

26

Modelos por Separado


• Si corremos la regresión de logaritmo de salario
sobre educación, experiencia y experiencia al
cuadrado para hombres y mujeres por separado,
obtenemos las siguientes resultados:
hombres  ln sal  0.085  0.089educ  0.067 exp 0.001exp 2

mujeres  ln sal  0.114  0.108educ  0.028 exp 0.000 exp 2

Note como la diferencia en los coeficientes de mujeres y


hombres corresponden al valor de la variable categórica
sola (para el intercepto) e interacciones para cada una de
las pendientes.

27

9
10/02/2018

Para Interpretar

efictrat  24  0.75edad  15TratA  7TratB  0.26edadXTratA  0.02edadXTratB

http://www3.wabash.edu/econometrics/EconometricsBook/Basic%20Tools/ExcelAddIns/OLS
Regression.htm

28

Pruebas de Restricciones Lineales


• Queremos probar si los incrementos en ventas en el
ejemplo de la película son iguales cuando se invierte
en promoción que en producción. Por lo tanto:
H 0 : 1   2 o 1   2  0
H 0 : 1   2 o 1   2  0
   
( 1   2 )  ( 1   2 ) 1   2
t( / 2, n ( k 1))   

   
s ( 1   2 ) var(1 )  var( 2 )  2 cov(1 ,  2 )

• Utilizando paquetes estadísticos:


2.85  2.27 0.58
t( 0.05 / 2, 20(31))    1.737
0.154  0.064  2(0.058) 0.334
El valor t(0.025, 16) de la tabla es 2.12 por lo que no rechazamos la hipótesis nula y
decimos que promoción y producción incrementan las ventas en igual cantidad.
29

Pruebas de Restricciones Lineales


• Si queremos probar si los rendimientos a escala son
constantes para dos factores de producción, en este
caso las hipótesis se plantean así:
H 0 : 1   2  1
H1 : 1   2  1
   
( 1   2 )  1 1   2  1
t( / 2, n ( k 1))   

   
s ( 1   2 ) var(1 )  var( 2 )  2 cov(1 ,  2 )

• Por ejemplo, si queremos saber los rendimientos a


escala de una función de producción con fertilizante
y labor como variables independientes, procedemos
como es mostrado en la siguiente diapositiva.
30

10
10/02/2018

Prueba de Rendimientos a Escala


• Corremos la regresión mencionada utilizando logaritmos
y obtenemos lo siguiente:
ln Re nd  0.231  .621ln Fertilizante  .263 ln Labor
• Si tenemos 23 observaciones y varianzas de los
coeficientes relacionados a fertilizante y labor son iguales
a 0.11 y 0.23, respectivamente, y la covarianza entre
estos coeficientes es de 0.04, el valor t para saber los
rendimientos a escala es el siguiente:
 
1   2  1 0.621  0.263 - 0.116
t( / 2, n ( k 1))     0.179
   
0.11  0.23  2 * 0.04 0.648
var(1 )  var( 2 )  2 cov(1 ,  2 )

El valor t tabular es de 2.086 por lo que no rechazo la


hipótesis nula y declaro que los rendimientos a escala son
constantes. 31

11

S-ar putea să vă placă și