Documente Academic
Documente Profesional
Documente Cultură
CORRELACIÓN
1. Coeficiente de Correlación.
n x y i i
xi yi i 1
n
i 1
rxy i 1
1
n
2
n
2
2
n xi n yi
x 2 i 1 y 2 i 1
i 1
i
n i 1
i
n
Propiedades del coeficiente de correlación
-1 rxy 1
- Correlación positiva
Cuando los valores de una variable
se incrementan, los de la otra
también lo hacen.
- Correlación negativa
Cuando los valores de una variable
se incrementan, los de la otra
disminuyen.
2
… Propiedades del coeficiente de correlación
y = b o + b 1x + e
… RLS
de donde:
ei = yi - bo - b1xi
n
con lo cual la suma de cuadrados de los errores ( SC) sería: SC i2
i 1
n 2
yi b0 b1 xi
i 1
… Ajuste de mínimos cuadrados
Escoger b0 y b1 tales que minimicen la suma de cuadrados de los errores; por lo
tanto es necesario:
SC SC
0 0
b0 b1
bˆ 0 bˆ1
xi yi x y
bˆ 0 y bˆ1 x
i i
bˆ1 n
x 2
i
x 2
n
i
R2 =
2
r =
( yˆ i y ) 2 SC (Re g )
xy
(y i y)
2
SC (total )
Supuestos de RLS
ri yi yˆ i
y se usan para:
1. Verificar normalidad ( 0, 2).
2. Verificar homogeneidad de varianzas.
3. Detectar la presencia de Outliers.
4. Determinar si la relación funcional es la adecuada.
5. Determinar la independencia de errores u observaciones.
1. Verificación de normalidad
k 1
2. Calcular Pk 2
n
Donde :
k Posición (orden) que ocupa el residual en el grupo ordenado.
n Número de datos.
3. Graficar los residuales vs. (1-pk)100 en un papel especial de probabilidad normal.
… Verificación de normalidad
NOTAS:
a) Si los residuales se distribuyen normalmente, la gráfica parecerá una
línea recta; es más importante que los valores centrales en la gráfica se
acerquen a la recta que lo que pueda ocurrir con los valores extremos,
siempre y cuando las desviaciones respecto a la recta en este último caso
no sean graves.
Y que a la mayor parte de los problemas de regresión que involucran series de tiempo
muestran una autocorrelación positiva, la hipótesis generalmente considerada en esta
prueba es:
Ho : 0
vs.
Ha : 0
Estadístic o de prueba :
n
(e t et 1 ) 2
d i 2
n
e
i 1
2
i
18
…Prueba de Durbin - Watson
Donde los e´s son los residuales del análisis de mínimos cuadrados aplicado a los
datos.
1. Si existe una relación de causalidad entre dos variables, las técnicas de regresión
ayudan a cuantificarla; pero a partir únicamente del análisis de regresión no se
puede inferir una relación de causalidad.
En ambos casos hay una tercera variable que influye sobre X y Y y ocasiona que aparentemente estas
dos variables guarden una fuerte relación.
Regresión y causalidad
Ejemplo:
- No. de nacimientos en una ciudad determinada y No. de cigüeñas en ese lugar.
- Muestras no representativas o atípicas de la población.
y 0 1 x1 2 x2 k xk
x2 x12
x3 x1 * x2
x5 log( x4 )