Sunteți pe pagina 1din 23

ANALISIS DE CORRELACION Y

REGRESION MULTIPLE
ECUACION GENERAL DE REGRESION
MULTIPLE
Para dos o mas variables independientes, la forma
general de la ecuacin de la regresin mltiple es:


b
0
: Es la interseccin, el valor de Y cuando todas las
X
k
son ceros
b
j
: Es la cantidad en que Y cambia, cuando esa X
k
particular aumenta una unidad, con los valores de
todas de las dems variables independientes
mantenidas constantes
k: Es el numero de variables independientes
k k
X b X b X b b Y + + + + =
.
.....
2 2 1 1 0
La regresin mltiple y el anlisis de correlacin
mltiple consiste en estimar una variable
dependiente, utilizando dos o ms variables
independientes.
Los valores de los coeficientes en la ecuacin
lineal mltiple se determina mediante el
mtodo de mnimos cuadrados. Los clculos son
muy tediosos por lo tanto suelen realizarse
mediante un paquete de software estadstico
METODO DE MINIMOS CUADRADOS
El mtodo de mnimos cuadrados garantiza
que la suma de los cuadrados de los errores es
mnimo. Las ecuaciones normales sern




Donde b
o
, b
1
y b
2
son los coeficientes de
regresin estimados.




+ + =
+ + =
+ + =
2
2 2 2 1 1 2 0 2
2 1 2
2
1 1 1 0 1
2 2 1 1 0
X X X X Y X
X X X X Y X
X X Y
b b b
b b b
b b nb
ANALISIS DE CORRELACION MULTIPLE
Una vez que se tiene la ecuacin de regresin
mltiple, es natural preguntarse si la ecuacin
ajusta bien los datos, emplearemos los mismos
estadsticos de resumen que en el modelo de
regresin lineal anteriormente estudiado, tales
como el error estndar y el coeficiente de
determinacin.
ERROR ESTANDAR DE ESTIMACION
MULTIPLE
l


Y: Es la observacin actual
: Es el valor estimado calculado de la ecuacin
de regresin
n: Es el nmero de observaciones en la
muestra
k: Es el nmero de variables independientes

) 1 (
) (
2
.. 12 ,
+

=

.
k n
Y Y
S
k Y
.
Y
TABLA ANOVA
Los clculos de regresin mltiple son largos, se
obtienen mediante los software estadsticos, haciendo
un anlisis de la tabla de la varianza (ANOVA):

FUENTE
Grados de
Libertad
gl
Suma de
Cuadrados
SS
Error Medio
Cuadrtico
MS
F
Calculada
F
CAL

Regresin o
Variacin
Explicada

k

SSR

MSR=SSR/k

F=MSR/MSE
Residuo, Error,
o Variacin
Residual

n-(k+1)

SSE


MSE=SSE/n-(k+1)
Variacin Total n-1 SST
A continuacin se define las formulas de la
tabla ANOVA:
La suma de cuadrados total o variacin total:

La suma de cuadrados del error, error residual
o varianza del error:

La suma de cuadrados de regresin o
variacin de regresin:

=
.
2
) ( Y Y SST

.
=
2
) ( Y Y SSE
SSE SST SSR =

COEFICIENTE DE DETERMINACION
MULTIPLE R
2




El coeficiente de determinacin mltiple es el
porcentaje de la variacin en la variable dependiente
Y, explicada, por el conjunto de variables
independientes X
1
, X
2
.X
k

Si el coeficiente de determinacin mltiple es 0
indica poca asociacin entre el conjunto de variables
independientes y la variable dependiente. Un valor
cercano a 1 significa una asociacin fuerte


SST
SSR
R =
2
INFERENCIAS EN LA REGRESION
MULTIPLE
Sea la ecuacin de regresin mltiple de la
poblacin con parmetros poblacionales
desconocidos:

B
0
: Parmetro poblacional
B
j
: Parmetros poblacionales
k: Es el numero de variables independientes de la
poblacin
El coeficiente de regresin de la muestra b
2
es un
estimador puntual del parmetro poblacional B
2




k k
X B X B X B B Y + + + + =
.
.....
2 2 1 1 0
PRUEBA GLOBAL DEL MODELO DE
REGRESION MULTIPLE
Hiptesis:
Nivel de Significancia:
Estadgrafo: En la tabla ANOVA se obtiene el:

Regin Critica: Se rechaza H
O
si:


0 : ... :
1 2 1 0
= = = =
j k
B las todas No H vs B B B H
1) (0 < <o o
MSE
MSR
F
CAL
=
{ } )) 1 ( , ( + > = k n k F F C
CAL o
PRUEBAS DE LOS COEFICIENTES DE
REGRESION INDIVIDUALES
Hiptesis:
Nivel de Significancia:
Estadgrafo:

Regin Critica: Se rechaza H
O
si:


0 : 0 :
1 0
= =
j j
B H vs B H
1) (0 < <o o
j
b
j
S
b
T
0
=
{ } )
) 1 ( ( 2 / +
> =
k n
t T C
o
Ejemplo: Un investigador que trabaja para
una empresa de marketing est estudiando el
gasto anual que las familias conformada de
cuatro o ms destinan a alimentos. Tres
variables independientes se consideran para
ser relacionadas con los gastos anuales del
alimento (alimento). Esas variables son: renta
total de la familia (renta en $), tamao de la
familia (tamao), y si la familia tiene nios en
la universidad (universidad).
Los datos son:

Alimento Ingreso Tamao Estudiante
3900 376 4 0
5300 515 5 1
4300 516 4 0
4900 468 5 0
6400 538 6 1
7300 626 7 1
4900 543 5 0
5300 437 4 0
6100 608 5 1
6400 513 6 1
7400 493 6 1
5800 563 5 0
SOLUCION:

SALIDAS 1 DEL MINITAB:
Anlisis de regresin: Alimento vs. ingreso, tamao, estudiante
La ecuacin de regresin es:
Alimento = 954 + 1.09 ingreso + 748 tamao + 565 estudiante

Coef.
Predictor Coef de EE T P
Constante 954 1581 0.60 0.563
ingreso 1.092 3.153 0.35 0.738
tamao 748.4 303.0 2.47 0.039
estudiante 564.5 495.1 1.14 0.287

S = 572.687 R-cuad. = 80.4% R-cuad.(ajustado) = 73.1%

Anlisis de varianza
Fuente GL SC MC F P
Regresin 3 10762903 3587634 10.94 0.003
Error residual 8 2623764 327970
Total 11 13386667



Del anlisis proporcionado por MINITAB, en
salidas 1 tenemos la ecuacin de regresin
mltiple:
3 2 1
565 748 09 . 1 954 X X X Y + + + =
.
De la regresin de salida 1 observamos:
El coeficiente de determinacin es 80.4%. Esto
significa que ms de 80% de la variacin en la
cantidad gastada en alimento est
considerado por las variables renta, tamao
de familia y estudiante.
Cada $100 dlares adicionales de renta por
ao aumentarn la cantidad gastada en
alimento en $109 por ao.
Un miembro adicional de la familia aumentar
la cantidad gastada por ao en alimento en
$748.
Una familia con un estudiante de universidad
gastar $565 ms por ao en alimento que las
familias sin un estudiante de universidad.

Realizaremos una prueba global
Hiptesis:
Nivel de Significancia:
Estadgrafo: En la tabla ANOVA se obtiene el:


Regin Critica: Se rechaza H
O
entonces no
todos los coeficientes son iguales


0 : :
1 3 2 1 0
= = =
j
B las todas No H vs B B B H
0.05 = o
94 . 10
327970
3587634
= = =
MSE
MSR
F
CAL
{ } { }
07 . 4 ) 8 , 3 ( ) 1 ( , (
94 . 10
07 . 4 94 . 10 ) 1 ( , (
05 . 0
= = +
=
> = + > =
F k n k F
F
k n k F F C
CAL
CAL
o
o
Realizaremos una prueba individual para determinar si los
coeficientes no son ceros, mediante el Minitab:
SALIDA 2:
Regresin paso a paso: Alimento vs. ingreso, tamao,
estudiante
La respuesta es Alimento en 3 predictores, con N = 12

Paso 1 2 3
Constante 837.17 -44.54 339.66

ingreso 9.4 1.4
Valor T 2.29 0.42
Valor P 0.045 0.682

tamao 970 1031
Valor T 4.11 5.75
Valor P 0.003 0.000

S 937 582 558
R-cuad. 34.42 77.22 76.76
R-cuad.(ajustado) 27.86 72.15 74.44



Hiptesis:
Nivel de Significancia:
Estadgrafo:

Regin Critica: Se rechaza H
O
entonces el
tamao de familias es diferente de cero


0 : 0 :
2 1 2 0
= = B H vs B H
05 . 0 = o
47 . 2
303
0 4 . 748
=

= T
{ } { }
31 . 2
31 . 2 47 . 2
) 8 ( 025 . 0 ) 1 ( ( 2 /
) 1 ( ( 2 /
= =
> = > =
+
+
t t
t T C
k n
k n
o
o
Observando los resultados de salida 2, la nica
variable que consideramos es el tamao de
familia, las otras variables haciendo una
inferencia individual no se rechazan Ho, por lo
tanto se considera que los coeficientes son
ceros. El modelo de regresin seria
finalmente:

2
1031 66 . 339 X Y + =
.
Ejemplo: La empresa Salsberry Realty vende casa en la costa
este de Estados Unidos. Una de las preguntas que los posibles
compradores hacen con mas frecuencias es: si compramos
esta casa, Cunto gastaremos en calefaccin durante el
invierno?. Al departamento de investigacin de la compaa
se le pidi desarrollar algunas directrices respecto de los
costos de calefaccin de casas unifamiliares. Se considera que
tres variables se relacionan con los costos de calefaccin,
temperatura externa diaria, numero de pulgadas de
aislamiento en el tico y antigedad de los aos del
calentador . Para realizar esta investigacin, el departamento
en cuestin selecciono una muestra aleatoria de 20 casas
vendidas recientemente. Determino el costo de calefaccin
de cada casa en enero pasado as como la temperatura
exterior en enero en la regin. En el archivo costos.sav se
presenta la informacin.
Determine la ecuacin de regresin mltiple
Cuales son las variables independientes
Cual es la variable dependiente
Analice los coeficiente de regresin
Que indica si los coeficientes son negativos y
positivos
Cual es el valor de la interseccin
Cual es el costo de calefaccin estimado para una
casa si la temperatura externa media es de 30
grados, hay 5 pulgadas de aislamiento en el tico
y el calentador tiene 10 aos
Interprete el coeficiente de determinacin
Que variable son importantes para el modelo de
regresin

S-ar putea să vă placă și