Documente Academic
Documente Profesional
Documente Cultură
El coeficiente de correlacin (r) es una medida de la intensidad de la relacin entre dos variables.
Requiere datos con escala de intervalo o de razn (variables). Puede tomar valores entre -1.00 y 1.00. Valores de -1.00 o 1.00 indican correlacin fuerte y perfecta. Valores cercanos a 0.0 indican correlacin dbil. Valores negativos indican una relacin inversa y valores positivos indican una relacin directa
COEFICIENTE DE CORRELACIN,r
Frmula para calcular el coeficiente r: n (xy) - ( x) ( y)
r = _______________________________
[n(x2) - ( x)2] [n(y)2 - (y)2 ]
10 9 8 7 6 5 4 3 2 1 0
0 1 2 3 4 5 6 7 X 8 9 10
Correlacin CERO
10
Ejemplo 1 El gerente de marketing de una gran cadena de supermercados le gustara utilizar el espacio en el estante para predecir las ventas de alimentos para mascotas, se selecciona una muestra de 12 tiendas. Existe alguna relacin entre las variables?
Espacio Ventas Estante (pies) Semanales ($) 5 160 5 220 5 140 10 190 10 240 10 260 15 230 15 270 15 280 20 260 20 290 20 310
Tienda 1 2 3 4 5 6 7 8 9 10 11 12
Diagrama de Dispersin
Ventas Semanales ($) Vs Espacio Estante (pies)
350
300
250
Ventas ($)
200
150
100
50
0 0 5 10 15 20 25
r= 0.83
El objetivo es establecer una relacin cuantitativa entre dos variables relacionadas, con la finalidad de Explicar el valor de una variable Y (dependiente) en funcin de otra variable X (independiente). * Esta relacin se obtiene ajustando una lnea entre los puntos 0bservados
La relacin entre las dos variables es una relacin lineal definida de la siguiente manera:
Intercepto con Y
Pendiente
Error Aleatorio
Yi 0 1 X i i
Variable Dependiente (Respuesta) Variable Independiente (Explicatoria)
1.
Mejor Ajuste Significa que las Diferencias entre el Valor Real (Yi) & el Valor Predecido Y
son Mnimas Pero Diferencias Positivas Anulan las Negativas,por lo que las elevamos al cuadrado. As, las diferencias se ponderan de acuerdo a su tamao.
) e2 (Y Y i i i
i 1 i 1
2. Mnimos Cuadrados Ordinarios, minimiza la Suma de los Cuadrados de las Diferencias (o Errores)
Y i b 0 b1 X i
b 1 SPXY SCX
Intercepto en Y muestral
b 0 Y b1 X
Aplicacin Prctica
Tomando el ejemplo 1, se puede predecir las ventas semanales ($) en funcin del espacio en el estante (pies)?
El modelo hallado es:
145 7.4 X i Y i
Bo = 145
B1= 7.4
SALIDA EXCELL
Coeficientes Error tpico Estadstico t Probabilidad Intercepcin Espacio Estante (pies) 145 21.7830209 6.65656066 7.4 1.59080692 4.6517273 5.66278E-05 0.000905656
Interpretacin: Pendiente b1: Las ventas semanales (Y) se incrementarn en 7.4 veces por cada unidad de espacio que se incremente en el estante. Intercepto bo: El promedio de las ventas es de 145, cuando no se incrementa el espacio de los estantes.
& Y.
2. Variacin NO explicada (SCE) Suma de Cuadrado del Error.Variacin debida a otros factores
Coeficiente de Determinacin
Mide el porcentaje de la variacin de la variable dependiente que probablemente es explicado por la variable independiente. Es un indicador del ajuste del modelo.
SCR SCT
Salida Excel
Estadsticas de la regresin Coeficiente de correlacin mltiple Coeficiente de determinacin R^2 R^2 ajustado Error tpico
Observaciones 0.82700064 0.68393006 0.65232306 30.8058436 12
ANLISIS DE VARIANZA Promedio S. de los Cuadrados cuadrados 1 10 11 20535 9490 30025 949 Valor crtico de F 0.000905656
20535 21.63856691
Y ' a b1 X 1 b2 X 2 ...bk X k
El criterio de mnimos cuadrados se usa para el desarrollo de esta ecuacin. * Como estimar b1, b2, etc. es muy tedioso, existen muchos programas de cmputo que pueden utilizarse para estimarlos.
Matriz de Correlaciones
La matriz de correlacin se usa para mostrar todos los posibles coeficientes de correlacin simple entre todas las variables.
. La matriz tambin se til para localizar la correlacin de las variables independientes. . En la matriz se muestra qu tan fuerte est correlacionada la variable independiente con la variable dependiente.
Prueba Global
La prueba global se usa para investigar si todas las variables independientes tienen coeficientes significativos. Las hiptesis son:
H 0 : 1 2 3 ... k 0
Ha : al menos uno de los coeficientes de regresin no es cero
El estadstico de prueba es la distribucin F con k (nmero de variables independientes) y n - (k + 1) grados de libertad, donde n es el tamao de la muestra
Pruebas Individuales
* La prueba se usa para determinar qu variable independiente tiene coeficientes de regresin diferentes de 0. * Las variables que tiene coeficientes de regresin cero, suelen desaparecer del anlisis. * El estadstico de prueba es la distribucin t con n - (k + 1) grados de libertad.
Aplicacin Prctica