Sunteți pe pagina 1din 22

1-1

Captulo trece

Anlisis de regresin y correlacin mltiples


OBJETIVOS
Al terminar este captulo podr:

UNO Describir la relacin entre dos o ms variables independientes y una variable dependiente utilizando la ecuacin de regresin mltiple. DOS Calcular e interpretar el error estndar mltiple de estimacin y el coeficiente de determinacin. TRES Interpretar una matriz de correlacin. CUATRO Establecer y explicar una tabla ANOVA.
2001 Alfaomega Grupo Editor

1-1

Captulo trece continuacin

Anlisis de regresin y correlacin mltiples


OBJETIVOS
Al terminar este captulo podr:

CINCO Realizar una prueba de hiptesis para determinar si los de coeficientes de regresin son diferentes de cero. SEIS Realizar una prueba de hiptesis para cada uno de los coeficientes de regresin.

2001 Alfaomega Grupo Editor

13-3

Anlisis de regresin mltiple

Para dos variables independientes, la frmula general de la ecuacin de regresin mltiple Y ' a b1 X 1 b2 X 2 es: X1 y X2 son las variables independientes. a es la intercepcin en Y. b1 es el cambio neto en Y por cada cambio unitario en X1, manteniendo X2 constante. Se denomina coeficiente de regresin parcial, coeficiente de regresin neta o bien coeficiente
2001 Alfaomega Grupo Editor

13-4

Anlisis de regresin mltiple

La ecuacin general de regresin mltiple con k varibles independientes es:


Y ' a b1 X 1 b2 X 2 ...bk X k

El criterio de mnimos cuadrados se usa para el desarrollo de esta ecuacin. Como estimar b1, b2, etc. es muy tedioso, existen muchos programas de cmputo que pueden utilizarse para estimarlos.
2001 Alfaomega Grupo Editor

13-5

Error estndar mltiple de la estimacin

El error estndar mltiple de la estimacin es la medida de la eficiencia de la ecuacin de regresin. Est medida en las mismas unidades que la variable dependiente. Es difcil determinar cul es un valor grande y cul es uno pequeo para el error estndar.
2001 Alfaomega Grupo Editor

13-6

Error estndar mltiple de la estimacin

La frmula es:

SY 12k

(Y Y ' )
n (k 1)

donde n es el nmero de observaciones y k es el nmero de variables independientes.


2001 Alfaomega Grupo Editor

13-7

Regresin y correlacin mltiples (suposiciones)

Las variables independientes y dependientes tienen una relacin lineal. La variable dependiente debe ser continua y al menos con escala de intervalo. La variacin en (Y - Y) o residuo debe ser la misma para todos los valores de Y. Cuando ste es el caso, se dice que la diferencia presenta homosedasticidad. Los residuos deben tener distribucin normal con media igual a 0. Las observaciones sucesivas de la varible dependiente no deben estar correlacionadas.
2001 Alfaomega Grupo Editor

13-8

Tabla ANOVA

La tabla ANOVA proporciona la variacin de la variable dependiente (tanto de la que est explicada por la ecuacin de regresin como de la que no lo est).

2001 Alfaomega Grupo Editor

13-9

Matriz de correlacin

La matriz de correlacin se usa para mostrar todos los posibles coeficientes de correlacin simple entre todas las variables.
La matriz tambin se til para localizar la correlacin de las variables independientes. En la matriz se muestra qu tan fuerte est correlacionada la variable independiente con la variable dependiente.

2001 Alfaomega Grupo Editor

13-10

Prueba global

La prueba global se usa para investigar si todas las variables independientes tienen coeficientes significativos. Las hiptesis son:

H 0 : 1 2 3 ... k 0

Ha : al menos uno de los coeficientes de regresin no es cero.


2001 Alfaomega Grupo Editor

13-11

Prueba global continuacin

El estadstico de prueba es la distribucin F con k (nmero de variables independientes) y n - (k + 1) grados de libertad, donde n es el tamao de la muestra.

2001 Alfaomega Grupo Editor

13-12

Prueba para variables individuales

La prueba se usa para determinar qu variable independiente tiene coeficientes de regresin diferentes de 0. Las variables que tiene coeficientes de regresin cero, suelen desaparecer del anlisis. El estadstico de prueba es la distribucin t con n - (k + 1) grados de libertad.
2001 Alfaomega Grupo Editor

13-13

EJEMPLO 1

Un estudio de mercado para la cadena de tiendas autoservicio Super Dollar analiza la cantidad anual que gastan en comida las familias de cuatro o ms miembros. Se iensa que tres variables independientes se relacionan con los gastos en comida. Esas variables son: ingreso familiar total, tamao de la familia y si la familia tiene hijos en la universidad.
2001 Alfaomega Grupo Editor

13-14

EJEMPLO 1

continuacin

Familia
1 2 3 4 5 6
7 8 9 10 11 12

Gastos en comida
3900 5300 4300 4900 6400 7300
4900 5300 6100 6400 7400 5800

Ingresos ($1000)
37.6 51.5 51.6 46.8 53.8 62.6
54.3 43.7 60.8 51.3 49.3 56.3

Tamao de la familia
4 5 4 5 6 7
5 4 5 6 6 5

Hijos en universidad
0 1 0 0 1 1
0 0 1 1 1 0

2001 Alfaomega Grupo Editor

13-15

EJEMPLO 1

continuacin

Use un software, como MINITAB o Excel, para desarrollar la matriz de correlacin. Del anlisis proporcionado por MINITAB, escriba la ecuacin de regresin:
Y ' 954 10.9 X 1 748 X 2 565 X 3

Qu gastos en comida estima para una familia de 4 integrantes, sin hijos en la universidad y con ingresos de $50,000?

2001 Alfaomega Grupo Editor

13-16

EJEMPLO 1

continuacin

Y=954 + 10.9(50) + 748(4) + 565 (0) = 4491. Realice una prueba global de hiptesis para determinar si alguno de los coeficientes de regresin es distinto de cero. H 0 : 1 2 3 0 H1 : al menos una 0 H0 se rechaza si F > 4.07 A partir de la salida de MINITAB, el valor del estadstico de prueba calculado es 10.94 Decisin: como F = 10.94 > 4.07, H0 se rechaza. Entonces, no todos los coeficientes de regresin son cero.
2001 Alfaomega Grupo Editor

13-17

EJEMPLO 1

continuacin

Realice una prueba individual para determinar qu coeficientes son distintos de cero. De la salida de MINITAB, la nica variable significativa es FSIZE (tamao de familia) al usar los valores p. Las otras variables pueden omitir del modelo. H1: 2 0 Entonces, H0 : 2 0 Para 5% de nivel de significancia, se rechaza H0 si el valor p < .05
2001 Alfaomega Grupo Editor

13-18

EJEMPLO 1

continuacin

Como el valor p =.039 <.05, se rechaza H0 2 0 . Esto es, el y se concluye que tamao de la familia y cantidad gastada en comida tienen una relacin significativa.

2001 Alfaomega Grupo Editor

13-19

Variables cualitativas y regresiones escalonadas

Las variables cualitativas son no numricas y tambin se llaman variables ficticias .


Para una variable cualitativa, slo existen dos condiciones posibles.

La regresin escalonada conduce a la ecuacin de regresin ms eficiente.


Slo las variables independientes con coeficientes de regresin significativos entran en el anlisis. Las variables se introducen en el orden en que hacen que R^2 aumente ms rpido.
2001 Alfaomega Grupo Editor

13-20

Anlisis de residuos

2001 Alfaomega Grupo Editor

Un residuo (o residual) es la diferencia entre el valor real de Y y el valor pronosticado Y. Los residuos deben tener una distribucin normal aproximada. Los histogramas y los diagramas de tallo y hoja sirven para verificar estos requisitos. Una grfica de residuos y los valores de Y correspondientes se usan para mostrar que no hay tendencias ni patrones en los residuos.

13-21

Grfica residual

1000

Residuos

500 0

-500
4500 6000 Y
2001 Alfaomega Grupo Editor

7500

13-22

Histogramas de residuos

8 7 6 5 4 3 2 1 0
-600 -200 200 Residuos 600 1000

2001 Alfaomega Grupo Editor

Frecuencia

S-ar putea să vă placă și