Sunteți pe pagina 1din 16

MODELO CON TRES VARIABLES: NOTACIÓN

Y SUPUESTOS
• al generalizar la función de regresión poblacional (frp) de dos variables,
podemos escribir la frp de tres variables así

donde y es la variable dependiente, x2 y x3 las variables explicativas (o


regresoras), u es el término de perturbación estocástica, e i la i-ésima
observación; en caso de que los datos sean series de tiempo, el subíndice t
denotará la t-ésima observación
INTERPRETACIÓN DE LA ECUACIÓN DE
REGRESIÓN MÚLTIPLE
con los supuestos del modelo de regresión clásico, se cumple que, al tomar la
esperanza condicional de y en ambos lados de (7.1.1), obtenemos:

se obtiene la media condicional o el valor esperado de y condicionado a los valores dados


o fijos de las variables x2 y x3. por consiguiente, como en el caso de dos variables, el
análisis de regresión múltiple es el análisis de regresión condicional sobre los valores fijos
de las variables explicativas, y lo que obtenemos es el valor promedio o la media de y, o la
respuesta media de y a los valores dados de las regresoras x
SIGNIFICADO DE LOS COEFICIENTES DE
REGRESIÓN PARCIAL
como ya mencionamos, los coeficientes de regresión β2 y β3 se conocen como coeficientes de
regresión parcial o coeficientes parciales de pendiente. el significado del coeficiente de
regresión parcial es el siguiente: β2 mide el cambio en el valor de la media de y, e(y), por
unidad de cambio en x2, con x3 constante. expresado de otra forma, proporciona el efecto
“directo” o “neto” que tiene una unidad de cambio de x2 sobre el valor medio de y, neto de
cualquier efecto que x3 pueda ejercer en la media y
Donde uˆ2i representa el término residual de esta
regresión ,Ahora:

Donde uˆ1i representa el término residual de esta


Representa la parte de MI que queda
regresión
después de anular la influencia (lineal) de
TAM. De igual forma,
ESTIMACIÓN DE MCO Y MV DE LOS COEFICIENTES
DE REGRESIÓN PARCIAL
• ESTIMADORES DE MCO
Para encontrar los estimadores de MCO, escribamos primero la función de
regresión muestral (FRM) correspondiente a la FRP de de la siguiente
manera:

donde uˆi es el término residual, la contraparte muestral del término de


perturbación estocástico ui.
• Estimadores de MCO

Es el estimador de MCO del intercepto poblacional β1.


Conforme a la convención de permitir que las letras minúsculas
denoten desviaciones de las medias muestrales.

Se derivan las siguientes fórmulas de las


ecuaciones normales que dan los estimadores
de MCO de los coeficientes de regresión parcial
poblacionales, β2 y β3, respectivamente.
• VARIANZAS Y ERRORES ESTÁNDAR DE LOS ESTIMADORES DE MCO o, en forma equivalente

Igual que en el caso de dos variables, se necesitan Donde r23 es el coeficiente de


los errores estándar para dos fines principales: correlación muestral entre X2 y X3,
 establecer intervalos de confianza como se define en el capítulo
 probar hipótesis estadísticas.
Las fórmulas son las siguientes:

o, en forma equivalente,
ESTIMADORES MÁXIMA VEROSIMILITUD
El estimador de MV de σ2 es : ∑uiˆ2 /n ,sin importar el número de variables en el modelo, mientras que el
estimador de MCO de σ2 es

• ∑uiˆ2 /(n − 2) en el caso de dos variables,

• ∑uiˆ2 /(n − 3) en el caso de tres variables

• ∑uiˆ2 /(n − k) en el caso del modelo de k variables

En resumen, el estimador de MCO de σ2 tiene en cuenta el número de grados de libertad, mientras que el
estimador MV no lo hace.
COEFICIENTE MÚLTIPLE DE DETERMINACIÓN R2
• LA PROPORCIÓN DE LA VARIACIÓN EN Y EXPLICADA POR LAS VARIABLES X2 Y X3 CONJUNTAMENTE. LA
MEDIDA QUE DA ESTA INFORMACIÓN SE CONOCE COMO COEFICIENTE DE DETERMINACIÓN MÚLTIPLE, Y
SE DENOTA POR R2; CONCEPTUALMENTE SE ASEMEJA A R2.
• PARA OBTENER R2 : (7.5.1)

 donde 𝑦ො𝑖 es el valor estimado de Yi a partir de la línea


de regresión ajustada y es un estimador de la verdadera
𝐸 𝑦𝑖 𝑥2𝑖 ′ 𝑥3𝑖 . (7.5.2)

 Al sustituir las letras mayúsculas por minúsculas para


indicar desviaciones de sus medias
• ELEVAMOS AL CUADRADO (7.5.2) EN AMBOS LADOS Y SUMAMOS SOBRE LOS VALORES MUESTRALES
• SCT = SCE + SCR
• AHORA, SUSTITUIMOS EL EQUIVALENTE DE ∑ෝ𝒖𝟐𝒊 DADO EN LA ECUACIÓN (7.4.19) Y:

REORDENANDO:

• POR DEFINICIÓN: (7.5.5)

• COMPARE (7.5.5) CON (3.5.6) QUE ES:


R2, al igual que r2, se encuentra entre 0 y 1. Si es 1, la línea de regresión ajustada explica 100% de la variación en Y. Por
otra parte, si es 0, el modelo no explica nada de la variación en Y. Sin embargo, por lo general R2 se encuentra entre
estos dos valores extremos. El ajuste del modelo es “mejor” entre más cerca esté R2 de 1.
COEFICIENTE MÚLTIPLE DE CORRELACIÓN R
• Es una medida del grado de asociación • ෡ 𝒋 es el coeficiente de regresión parcial
Donde 𝜷
entre Y y todas las variables explicativas de la regresora xj y rj2 es el R2 en la regresión
en conjunto. Aunque r puede ser positivo de xj sobre las (k − 2) regresoras restantes.
o negativo, R siempre se considera
positivo. En la práctica, sin embargo, R (7.5.6)
tiene poca importancia. La medida de
mayor significado es R2.
• Establezcamos la siguiente relación entre R2 y
la varianza de un coeficiente de regresión
Nota: en el modelo de regresión con k
parcial en el modelo de regresión múltiple con k
variables hay (k − 1) regresoras]. Aunque
variables dado en (7.4.20): la utilidad de la ecuación (7.5.6) se verá
en el capítulo 10, sobre multicolinealidad,
observe que esta ecuación es sólo una
extensión de la fórmula dada en (7.4.12) o
(7.4.15) para el modelo de regresión con
tres variables, una regresada y dos
regresoras.
R Y R AJUSTADA
2 2

• R2 AJUSTADO ES UN MEDIDA DE BONDAD DE • R CUADRADO AJUSTAD SE CALCULA DIVIDIENDO EL


AJUSTE CORREGIDA (PRECISIÓN DE MODELO) PARA ERROR CUADRÁTICO DE LA MEDIA RESIDUAL POR
LOS MODELOS LINEALES. IDENTIFICA EL EL ERROR CUADRÁTICO PROMEDIO TOTAL (QUE ES
PORCENTAJE DE VARIANZA EN EL CAMPO LA VARIANZA MUESTRAL DEL CAMPO OBJETIVO). SE
OBJETIVO QUE SE EXPLICA MEDIANTE LA ENTRADA RESTA 1 DEL RESULTADO.
O ENTRADAS.
• R2 AJUSTADO SIEMPRE ES MENOR O IGUAL QUE R2.
• R2 TIENDE A ESTIMAR DE FORMA OPTIMISTA EL UN VALOR DE 1 INDICA UN MODELO QUE PREDICE
AJUSTE DE LA REGRESIÓN LINEAL. SIEMPRE PERFECTAMENTE VALORES DEL CAMPO OBJETIVO.
AUMENTA COMO EL NÚMERO DE EFECTOS QUE SE UN VALOR QUE ES MENOR O IGUAL QUE 0 INDICA
INCLUYEN EN EL MODELO. R2 AJUSTADO INTENTA UN MODELO QUE NO TIENE NINGÚN VALOR
CORREGIR ESTA ESTIMACIÓN EXCESIVA. PREDICTIVO. EN EL MUNDO REAL, R2 AJUSTADO SE
R2 AJUSTADO PODRÍA DISMINUIR SI UN EFECTO ENCUENTRA ENTRE ESTOS VALORES.
ESPECÍFICO NO MEJORA EL MODELO.
• PARA COMPARAR DOS TÉRMINOS R2 SE DEBE TENER EN CUENTA EL NÚMERO
DE VARIABLES X PRESENTES EN EL MODELO. ESTO SE VERIFICA CON
FACILIDAD SI CONSIDERAMOS UN COEFICIENTE DE DETERMINACIÓN
ALTERNO, QUE ES EL SIGUIENTE:
NOTA: La R2 definida así se conoce como R2
ajustada, designada por R¯ 2 . El término
ajustado significa ajustado por los gl asociados
a las sumas de cuadrados que se consideran en
(7.8.1): uˆ2 i tiene n − k gl en un modelo con k
parámetros, el cual incluye el término del
donde k = el número de parámetros en el modelo intercepto y uˆ2 i tiene n − 1 gl. (¿Por qué?)
incluyendo el término de intercepto. Para el caso de tres variables, sabemos que uˆ2
i tiene n – 3 gl
COMPARACIÓN DE DOS VALORES DE R2
• AL COMPARAR DOS MODELOS CON BASE EN EL COEFICIENTE DE
DETERMINACIÓN, AJUSTADO O NO, EL TAMAÑO DE LA MUESTRA N Y LA
VARIABLE DEPENDIENTE DEBEN SER LOS MISMOS; LAS VARIABLES
EXPLICATIVAS PUEDEN ADOPTAR CUALQUIER FORMA. ASÍ, PARA LOS
MODELOS

En (7.8.6), el R2 mide la proporción de la variación en ln Y


No pueden compararse los
explicada por X2 y X3, mientras que en (7.8.7), mide la
términos R2 calculados.
proporción de la variación en Y, y las dos no son la misma
variable
ASIGNACIÓN DE R2 ENTRE REGRESORAS
• EL MEJOR CONSEJO PRÁCTICO ES • PORQUE PUES LA ASIGNACIÓN
QUE NO TIENE MUCHO SENTIDO DEPENDE DEL ORDEN DE
TRATAR DE ASIGNAR EL VALOR R2 A INTRODUCCIÓN DE LAS REGRESORAS,
SUS REGRESORAS COMO ACABAMOS DE ILUSTRAR.
CONSTITUYENTES. PARTE DE ESTE PROBLEMA RADICA EN
QUE LAS DOS REGRESORAS ESTÁN
CORRELACIONADAS, PUES EL
COEFICIENTE DE CORRELACIÓN
ENTRE AMBAS ES IGUAL A 0.2685
EL “JUEGO” DE MAXIMIZAR R2
• ALGUNAS VECES, LOS INVESTIGADORES INTENTAN MAXIMIZAR R¯ 2 , ES DECIR,
ESCOGEN EL MODELO QUE DA LA R¯ 2 MÁS ELEVADA. PERO ESTO PUEDE SER
PELIGROSO, PUES, EN EL ANÁLISIS DE REGRESIÓN, EL OBJETIVO NO ES OBTENER
UNA R¯ 2 ELEVADA PER SE, SINO MÁS BIEN OBTENER ESTIMADOS CONFIABLES
DE LOS VERDADEROS COEFICIENTES DE REGRESIÓN POBLACIONAL QUE
PERMITAN REALIZAR INFERENCIA ESTADÍSTICA SOBRE ELLOS.
• SIEN ESTE PROCESO OBTENEMOS UNA R¯ 2 ELEVADA, MUY BIEN; POR OTRA
PARTE, SI R¯ 2 ES BAJA, ESTO NO SIGNIFICA QUE EL MODELO SEA
NECESARIAMENTE MALO.

S-ar putea să vă placă și