Documente Academic
Documente Profesional
Documente Cultură
Captulo trece
UNO Describir la relacin entre dos o ms variables independientes y una variable dependiente utilizando la ecuacin de regresin mltiple. DOS Calcular e interpretar el error estndar mltiple de estimacin y el coeficiente de determinacin. TRES Interpretar una matriz de correlacin. CUATRO Establecer y explicar una tabla ANOVA.
2001 Alfaomega Grupo Editor
1-1
CINCO Realizar una prueba de hiptesis para determinar si los de coeficientes de regresin son diferentes de cero. SEIS Realizar una prueba de hiptesis para cada uno de los coeficientes de regresin.
13-3
Para dos variables independientes, la frmula general de la ecuacin de regresin mltiple Y ' a b1 X 1 b2 X 2 es: X1 y X2 son las variables independientes. a es la intercepcin en Y. b1 es el cambio neto en Y por cada cambio unitario en X1, manteniendo X2 constante. Se denomina coeficiente de regresin parcial, coeficiente de regresin neta o bien coeficiente
2001 Alfaomega Grupo Editor
13-4
El criterio de mnimos cuadrados se usa para el desarrollo de esta ecuacin. Como estimar b1, b2, etc. es muy tedioso, existen muchos programas de cmputo que pueden utilizarse para estimarlos.
2001 Alfaomega Grupo Editor
13-5
El error estndar mltiple de la estimacin es la medida de la eficiencia de la ecuacin de regresin. Est medida en las mismas unidades que la variable dependiente. Es difcil determinar cul es un valor grande y cul es uno pequeo para el error estndar.
2001 Alfaomega Grupo Editor
13-6
La frmula es:
SY 12k
(Y Y ' )
n (k 1)
13-7
Las variables independientes y dependientes tienen una relacin lineal. La variable dependiente debe ser continua y al menos con escala de intervalo. La variacin en (Y - Y) o residuo debe ser la misma para todos los valores de Y. Cuando ste es el caso, se dice que la diferencia presenta homosedasticidad. Los residuos deben tener distribucin normal con media igual a 0. Las observaciones sucesivas de la varible dependiente no deben estar correlacionadas.
2001 Alfaomega Grupo Editor
13-8
Tabla ANOVA
La tabla ANOVA proporciona la variacin de la variable dependiente (tanto de la que est explicada por la ecuacin de regresin como de la que no lo est).
13-9
Matriz de correlacin
La matriz de correlacin se usa para mostrar todos los posibles coeficientes de correlacin simple entre todas las variables.
La matriz tambin se til para localizar la correlacin de las variables independientes. En la matriz se muestra qu tan fuerte est correlacionada la variable independiente con la variable dependiente.
13-10
Prueba global
La prueba global se usa para investigar si todas las variables independientes tienen coeficientes significativos. Las hiptesis son:
H 0 : 1 2 3 ... k 0
13-11
El estadstico de prueba es la distribucin F con k (nmero de variables independientes) y n - (k + 1) grados de libertad, donde n es el tamao de la muestra.
13-12
La prueba se usa para determinar qu variable independiente tiene coeficientes de regresin diferentes de 0. Las variables que tiene coeficientes de regresin cero, suelen desaparecer del anlisis. El estadstico de prueba es la distribucin t con n - (k + 1) grados de libertad.
2001 Alfaomega Grupo Editor
13-13
EJEMPLO 1
Un estudio de mercado para la cadena de tiendas autoservicio Super Dollar analiza la cantidad anual que gastan en comida las familias de cuatro o ms miembros. Se iensa que tres variables independientes se relacionan con los gastos en comida. Esas variables son: ingreso familiar total, tamao de la familia y si la familia tiene hijos en la universidad.
2001 Alfaomega Grupo Editor
13-14
EJEMPLO 1
continuacin
Familia
1 2 3 4 5 6
7 8 9 10 11 12
Gastos en comida
3900 5300 4300 4900 6400 7300
4900 5300 6100 6400 7400 5800
Ingresos ($1000)
37.6 51.5 51.6 46.8 53.8 62.6
54.3 43.7 60.8 51.3 49.3 56.3
Tamao de la familia
4 5 4 5 6 7
5 4 5 6 6 5
Hijos en universidad
0 1 0 0 1 1
0 0 1 1 1 0
13-15
EJEMPLO 1
continuacin
Use un software, como MINITAB o Excel, para desarrollar la matriz de correlacin. Del anlisis proporcionado por MINITAB, escriba la ecuacin de regresin:
Y ' 954 10.9 X 1 748 X 2 565 X 3
Qu gastos en comida estima para una familia de 4 integrantes, sin hijos en la universidad y con ingresos de $50,000?
13-16
EJEMPLO 1
continuacin
Y=954 + 10.9(50) + 748(4) + 565 (0) = 4491. Realice una prueba global de hiptesis para determinar si alguno de los coeficientes de regresin es distinto de cero. H 0 : 1 2 3 0 H1 : al menos una 0 H0 se rechaza si F > 4.07 A partir de la salida de MINITAB, el valor del estadstico de prueba calculado es 10.94 Decisin: como F = 10.94 > 4.07, H0 se rechaza. Entonces, no todos los coeficientes de regresin son cero.
2001 Alfaomega Grupo Editor
13-17
EJEMPLO 1
continuacin
Realice una prueba individual para determinar qu coeficientes son distintos de cero. De la salida de MINITAB, la nica variable significativa es FSIZE (tamao de familia) al usar los valores p. Las otras variables pueden omitir del modelo. H1: 2 0 Entonces, H0 : 2 0 Para 5% de nivel de significancia, se rechaza H0 si el valor p < .05
2001 Alfaomega Grupo Editor
13-18
EJEMPLO 1
continuacin
Como el valor p =.039 <.05, se rechaza H0 2 0 . Esto es, el y se concluye que tamao de la familia y cantidad gastada en comida tienen una relacin significativa.
13-19
13-20
Anlisis de residuos
Un residuo (o residual) es la diferencia entre el valor real de Y y el valor pronosticado Y. Los residuos deben tener una distribucin normal aproximada. Los histogramas y los diagramas de tallo y hoja sirven para verificar estos requisitos. Una grfica de residuos y los valores de Y correspondientes se usan para mostrar que no hay tendencias ni patrones en los residuos.
13-21
Grfica residual
1000
Residuos
500 0
-500
4500 6000 Y
2001 Alfaomega Grupo Editor
7500
13-22
Histogramas de residuos
8 7 6 5 4 3 2 1 0
-600 -200 200 Residuos 600 1000
Frecuencia