Sunteți pe pagina 1din 32

UNIVERSIDAD SANTO TORIBIO

DE MOGROVEJO
ESCUELA PROFESIONAL DE
ADMINISTRACIN
Docente: Luis Zapatel Arriaga
Curso: Estadstica Aplicada
Tema: Anlisis de Regresin Lineal Mltiple
AGENDA
Describir la relacin entre dos o ms variables independientes y una
variable dependiente utilizando la ecuacin de regresin mltiple.
Calcular e interpretar el error estndar mltiple de estimacin y el
coeficiente de determinacin.
Interpretar una matriz de correlacin.
Establecer y explicar una tabla ANOVA.
Realizar una prueba de hiptesis para determinar si los de coeficientes
de regresin son diferentes de cero.
Realizar una prueba de hiptesis para cada uno de los coeficientes de
regresin.
INTRODUCCIN
En el anlisis de regresin lineal simple buscamos la
relacin entre la variable dependiente Y y una sola
variable independiente, demostrando su empleo para
determinar una ecuacin que describa la relacin entre
dos variables. A continuacin presentaremos el estudio
del anlisis de regresin examinando casos en los que
intervienen dos o ms variables independientes.
INTRODUCCIN
El anlisis de regresin mltiple es el estudio de la forma en que una
variable dependiente, , se relaciona con dos o ms variables
independientes. En el caso general emplearemos k para representar la
cantidad de variables independientes.
Los conceptos de un modelo de regresin y una ecuacin de regresin
que presentamos en el tema anterior se pueden aplicar al caso de la
regresin mltiple. La ecuacin que describe la forma en que la
variable dependiente, , se relaciona con las variables independientes
_
1
, _
2
,...,_
k
y un trmino de error se llama modelo de regresin. El
modelo de regresin mltiple tiene la forma siguiente:


k k
x b x b x b b y + + + + = ...

2 2 1 1 0
EJEMPLOS
VARIABLE DEPENDIENTE (Y) VARIABLES INDEPENDIENTES
(X
1
,X
2,......
)
Volumen de ventas, en unidades Precio unitario
Gasto de Propaganda
Peso de los estudiantes Estatura
Edad
Consumo de bienes industriales por
ao
Ingreso disponible
Importacin de bienes de consumo
Unidades consumidas de un bien por
familia
Precio unitario del bien
Ingreso
Nmero de integrantes por familia
Precio de una vivienda N de habitaciones
N de pisos
rea construida
rea techada , etc.
Anlisis de regresin mltiple
para 2 variables independientes
Para dos variables independientes, la frmula general de la
ecuacin de regresin mltiple es:

X
1
y X
2
son las variables independientes.
a es la intercepcin en Y.
b
1
es el cambio neto en Y para cada cambio unitario en X
1
,
manteniendo X
2
constante. Se denomina coeficiente de regresin
parcial, coeficiente de regresin neta o bien coeficiente de
regresin.
b
2
es el cambio neto en Y para cada cambio unitario en X
2
,
manteniendo X
1
constante. Se denomina coeficiente de regresin
parcial o bien coeficiente de regresin.
El clculo de stos valores es por dems laborioso a mano
Y a b X b X ' = + +
1 1 2 2
. Por ejemplo para el caso de las dos variables
independientes, para poder resolver y obtener y en una
ecuacin de regresin mltiple el clculo se presenta
muy tediosa porque se tiene atender 3 ecuaciones que
se generan por el mtodo de mnimo de cuadrados:
Anlisis de regresin mltiple
con k variables independientes
La ecuacin general de regresin mltiple con
k variables independientes es:

El criterio de mnimos cuadrados se usa para
el desarrollo de esta ecuacin.
Como estimar b
1
, b
2
, etc. es muy tedioso,
existen muchos programas de cmputo que
pueden utilizarse para estimarlos.
Y a b X b X b X
k k
' ... = + + + +
1 1 2 2
Error estndar mltiple de la
estimacin
El error estndar mltiple de la estimacin es la
medida de la eficiencia de la ecuacin de
regresin.
Est medida en las mismas unidades que la
variable dependiente.
Es difcil determinar cul es un valor grande y cul
es uno pequeo para el error estndar.
Error estndar mltiple de la
estimacin
La frmula es:





Donde
Y es la observacin.
Y es el valor estimado en la ecuacin de
regresin.
n es el nmero de observaciones y k es el
nmero de variables independientes.
) 1 ( ) 1 (
) ' (
2
12
+
=
+

=


k n
SSE
k n
Y Y
S
k Y
Regresin y correlacin mltiples
(suposiciones)
Las variables independientes y dependientes tienen una
relacin lineal.
La variable dependiente debe ser continua y al menos
con escala de intervalo.
La variacin en (Y - Y) o residuo debe ser la misma para
todos los valores de Y. Cuando ste es el caso, se dice que
la diferencia presenta homoscedasticidad.
Los residuos deben tener distribucin normal con media
igual a 0.
Las observaciones sucesivas de la variable dependiente
no deben estar correlacionadas.
Matriz de correlacin
La matriz de correlacin se usa para mostrar
todos los posibles coeficientes de correlacin
simple entre todas las variables.
La matriz tambin es til para analizar localizar la correlacin
de las variables independientes.
En la matriz se muestra, qu tan fuerte estn correlacionadas
las variables independientes, con la variable dependiente.
Tambin es til para verificar si existe correlacin entre las
variables independientes Multicolinealidad, lo cul
distorsionara el error estndar y llevara a conclusiones
incorrectas (se tolera valores entre -0.7 y 0.7), de ser mayor se
elimina una variable y se recalcula la ecuacin de regresin.
ENFOQUE MATRICIAL PARA ENCONTRAR LOS
PARAMETROS DE LA ECUACION DE REGRESION
Al ajustar un modelo de regresin mltiple es mucho ms conveniente
expresar las operaciones matemticas en forma matricial. Supongamos que
existen k variables independientes y n observaciones (X
i1
,X
i2
,X
i3
,.,X
ik
,Y
i
),
i=1,2,3,4,,n, y que el modelo que relaciona las variables independientes y la
variable dependiente es:
ik k i i i
x b x b x b b y + + + + = ...

2 2 1 1 0
| X y =
Este modelo es un sistema de n ecuaciones que puede expresarse
en notacin matricial como:
ENFOQUE MATRICIAL
Donde:
1
3
2
1
.
.
.
x
n
n
y
y
y
y
y
(
(
(
(
(
(
(
(
(

=
p n
nk i i i
k
k
k
x
x x x x
x x x x
x x x x
x x x x
X
(
(
(
(
(
(
(
(
(

=
....... 1
.... .......... ..........
.... .......... ..........
.... .......... ..........
....... 1
....... 1
....... 1
3 2 1
3 33 32 31
2 23 22 21
1 13 12 11
1
2
1
0
.
.
.
x
p
k
b
b
b
b
(
(
(
(
(
(
(
(
(

= |
donde: p = k+1, nmero de parmetros
Una vez estimado el modelo es conveniente obtener
una medida acerca de la bondad del ajuste realizado.
Un estadstico que facilita esta medida es el
coeficiente de determinacin (R
2
), que se define:
Coeficiente de
Determinacin Mltiple r
2
Prueba global
Ayuda a determinar si es posible que todas las Variables
Independientes tengan coeficientes de regresin neta iguales
a 0.
En otras palabras podra la cantidad de variacin explicada
R
2
, ocurrir al azar?
La prueba global se usa para investigar si todas las variables
independientes tienen coeficientes significativos. Las
hiptesis son:


H
a
: al menos uno de los coeficientes de regresin no es cero.
0 ... :
3 2 1 0
= = = = =
k
H | | | |
Prueba global continuacin
El estadstico de prueba es la distribucin F con k
(nmero de variables independientes) y n - (k +
1) grados de libertad, donde n es el tamao de la
muestra.

El estadstico de prueba se calcula con:
F = [(SSR) /(k)] /[(SSE) /(n-k+1)].

Tabla ANOVA
La tabla ANOVA proporciona la variacin de la
variable dependiente (tanto de la que est
explicada por la ecuacin de regresin como de la
que no lo est).
Fuente de
Variacin
Suma de
cuadrados
Grados
de
libertad
Cuadro medio F
Regresin SSR K SSR/k= MSR
MSR
MSE
Error SSE n-(k+1) SSE/(n-(k+1))= MSE
Total SSTotal n-1
Ejemplo: El propietario de La cadena de cines CINE
PLANET desea estimar el ingreso semanal neto en
funcin de los gastos de publicidad. Los datos
histricos de una muestra de 8 semanas son los
siguientes:
Ingresos Brutos
semanales (en
miles de dlares)
Anuncios en TV
(en miles de dlares)
Anuncios en
peridicos
(en miles de dlares)
96 5.0 1.5
90 2.0 2.0
95 4.0 1.5
92 2.5 2.5
95 3.0 3.3
94 3.5 2.3
94 2.5 4.2
94 3.0 2.5
Planteando matricialmente los
datos
1 8
94
94
94
95
92
95
90
96
x
y
(
(
(
(
(
(
(
(
(
(
(

=
1 5.0 1.5
1 2.0 2.0
1 4.0 1.5
1 2.5 2.5
1 3.0 3.3
1 3.5 2.3
1 2.5 4.2
1 3.0 2.5
= X
1 3
2
1
0
x
b
b
b
(
(
(

= |
8
x
3
Determinando la ecuacin de
regresin
El modelo es:
2 2 1 1 0
x b x b b y + + =
y X X X
' '
=
1
) ( |
Entonces primero resolvemos las matrices para
encontrar los parmetros:
= |
0,2491 0,1313 -1,0353
0,1313 0,2239 -1,0389
-1,0353 -1,0389 5,9989
(
(
(

=
=
=
=
(
(
(

2
1
0
3010 . 1
2902 . 2
2301 . 83
1856
2401
750
b
b
b
1
) (

'
X X
y X
'
Interpretemos los parmetros estimados de las variables independientes:
Para b
1
: Cuando los gastos de anunciar en televisin varan una unidad y los
gastos de anunciar en peridicos se mantienen constantes, los ingresos
brutos semanales se incrementarn en 2.2902 miles de dlares.
Para b
2
: Cuando los gastos de anunciar en televisin se mantienen constantes
y los gastos de anunciar en peridicos varan una unidad, los ingresos
brutos semanales se incrementarn en 1.3010 miles de dlares.
Finalmente la ecuacin es:
2 1
3010 . 1 2902 . 2 2301 . 83 X X y + + =
Coeficientes
a
83.230 1.574 52.882 .000 79.184 87.276
2.290 .304 1.153 7.532 .001 1.509 3.072
1.301 .321 .621 4.057 .010 .477 2.125
(Constante)
Anunci os en TV (en
mil es de dl ares)
Anunci os en peri dicos
(en mil es de dl ares)
Modelo
1
B Error tp.
Coefi ci entes no
estandari zados
Beta
Coefi ci entes
estandari zad
os
t Si g. Lmi te i nferi or
Lmi te
superi or
Interval o de confi anza para
B al 95%
Vari abl e dependi ente: Ingresos Brutos semanal es (en mi l es de dl ares)
a.
Para lo cual usaremos la frmula abreviada para dos variables
independientes la cual se deriva de la forma general presentada
en las frmulas a utilizar. La frmula es la siguiente:
64 . 0
2 1
.
=
X X y
S
Hallando el error estndar de estimacin
3
2 2 1 1 0
2
.
2 1


=

n
y X b y X b y b y
S
X X y
Reemplazando los valores previamente encontrados y tomando el denominador al
valor 3 por ser el nmero de parmetros q intervienen en la ecuacin:
Interpretacin: La distancia promedio de los valores observados alrededor de la
ecuacin de regresin es de 0.64. Es decir la dispersin de los valores observados es 0.64.
Resumen del modelo
.959
a
.919 .887 .64259
Modelo
1
R R cuadrado
R cuadrado
corregi da
Error tp. de l a
estimaci n
Vari abl es predi ctoras: (Constante), Anunci os en peri di cos
(en mil es de dl ares), Anuncios en TV (en mil es de dl ares)
a.
Hallando el Coef. de Determinacin
919 . 0
959 . 0
2
=
=
r
r
Elevamos al cuadrado el coeficiente de correlacin y
encontraremos el coeficiente de determinacin:
Resumen del modelo
.959
a
.919 .887 .64259
Modelo
1
R R cuadrado
R cuadrado
corregi da
Error tp. de l a
estimaci n
Vari abl es predi ctoras: (Constante), Anunci os en peri di cos
(en mil es de dl ares), Anuncios en TV (en mil es de dl ares)
a.
Interpretacin: Aproximadamente el 91.9% de los cambios
producidos en los ingresos brutos semanales son explicados por los
cambios producidos en los gastos de publicidad (en televisin y
peridicos)
919 . 0
959 . 0
2
=
=
r
r
MATRIZ DE CORRELACION
Correlaciones
1.000 .808 -.021
.808 1.000 -.556
-.021 -.556 1.000
. .008 .481
.008 . .076
.481 .076 .
8 8 8
8 8 8
8 8 8
Ingresos Brutos
semanal es (en
mil es de dl ares)
Anunci os en TV (en
mil es de dl ares)
Anunci os en peri dicos
(en mil es de dl ares)
Ingresos Brutos
semanal es (en
mil es de dl ares)
Anunci os en TV (en
mil es de dl ares)
Anunci os en peri dicos
(en mil es de dl ares)
Ingresos Brutos
semanal es (en
mil es de dl ares)
Anunci os en TV (en
mil es de dl ares)
Anunci os en peri dicos
(en mil es de dl ares)
Correl aci n de Pearson
Si g. (uni l ateral )
N
Ingresos
Brutos
semanal es
(en mil es de
dl ares)
Anunci os en
TV (en mi l es
de dlares)
Anunci os en
peri di cos
(en mil es de
dl ares)
ANOVA
b
23.435 2 11.718 28.378 .002
a
2.065 5 .413
25.500 7
Regresi n
Resi dual
Total
Modelo
1
Suma de
cuadrados gl
Medi a
cuadrti ca F Si g.
Vari abl es predi ctoras: (Constante), Anunci os en peri di cos (en mil es de dl ares),
Anunci os en TV (en mi l es de dl ares)
a.
Vari abl e dependi ente: Ingresos Brutos semanal es (en mi l es de dl ares)
b.
Anova
0 :
1
=
i
un menos lo Por H |
0 ... :
3 2 1 0
= = = = =
k
H | | | |
En este caso p = 0.002 < 0.05, por lo que se rechaza Ho,
lo que ratifica la relacin entre las variables.
En la Facultad de Ciencias Contables, Econmicas
y Financieras de la Universidad Santo Toribio de
Mogrovejo quiere entender los factores de
aprendizaje de los alumnos que cursan la
asignatura de Gestin de Proyectos, para lo cual
se escoge al azar una muestra de 7 alumnos y
ellos registran notas promedios en las asignaturas
de Contabilidad Bsica, Doctrina Contable y
Macroeconoma como se muestran en el siguiente
cuadro.
Alumno
Gestin de
Proyectos
Contabilidad
Bsica
Doctrina
Contable
Macroeconoma
1 13 15 15 13
2 13 14 13 12
3 13 16 13 14
4 15 20 14 16
5 16 18 18 17
6 15 16 17 15
7 12 13 15 11
Determinar la dependencia que exista de aprendizaje
reflejada en las notas de la asignatura de Mtodos
Cuantitativos, conociendo las notas de las asignaturas
Contabilidad Bsica, Doctrina Contable II y
Macroeconoma, con un nivel de significancia del 5%
Calculamos los coeficientes de regresin utilizando las
frmulas de las ecuaciones o en el programa SPSS:
Coeficientes
a
3.140 2.529 1.241 .303
.054 .309 .088 .175 .872
.189 .189 .248 .999 .391
.501 .390 .739 1.284 .289
(Constante)
Contabilidad Basica
Doctrina Contable
Macroeconomia
Modelo
1
B Error tp.
Coef icientes no
estandarizados
Beta
Coef icientes
estandarizad
os
t Sig.
Variable dependiente: Metodos Cuantitativos
a.
Por lo tanto podemos construir la ecuacin de regresin
que buscamos:
= 3.140 + 0.054 X
1
+ 0.189 X
2
+ 0.501 X
3
En el anlisis de regresin mltiple la constante es el
valor de la ecuacin de regresin de la variable
dependiente Y dado que todas las variables
independientes sean iguales a cero.
Resumen del modelo
.967
a
.935 .869 .529
Modelo
1
R R cuadrado
R cuadrado
corregida
Error tp. de la
estimacin
Variables predictoras: (Constante), Macroeconomia,
Doctrina Contable, Contabilidad Basica
a.
En los resultados de SPSS se llama error tpico y
para explicar la relacin del aprendizaje de
Mtodos Cuantitativos que se viene desarrollando
es de 0.529
Calculando el coeficiente de Determinacin en el
ejercicio (con variable independiente).
12.018
=
0.934 = R
2..Interprete
12.857
R = ; Interprete
Trabajando con el ejemplo del curso de Gestin de
Proyectos, veremos que aplicando SPSS, nos saldra
como resultado:
ANOVA
b
12.018 3 4.006 14.314 .028
a
.840 3 .280
12.857 6
Regresin
Residual
Total
Modelo
1
Suma de
cuadrados gl
Media
cuadrtica F Sig.
Variables predictoras: (Constante), Macroeconomia, Doctrina Contable,
Contabilidad Basica
a.
Variable dependiente: Metodos Cuantitativos
b.
A que conclusin podemos llegar al 3% de error?

S-ar putea să vă placă și