Documente Academic
Documente Profesional
Documente Cultură
rígido)
Análisis de residuos
o en forma matricial
-1 t
Como = H , siendo H = X X la matriz de proyección ortogonal. Es
fácil probar que la matriz H es idempotente y simétrica . En
base a esto
= - = -H = =
= X + -HX -H = ,
Como los residuos tienen varianza variable y son dimensionados (tienen las
unidades de la variable Y ), normalmente se tipifican
los residuos tipificados siguen una distribución normal estándar, pero como 2 es
desconocido, se sustituye por su estimador, la varianza residual R2 y se obtienen
los residuos estandarizados, definidos como
Por la hipótesis de normalidad los residuos estandarizados siguen una
distribución t con n- grados de libertad. Como ya se indicó en el estudio
del modelo de regresión lineal simple, en el cáluco de ri existe el problema de
que hay una relación de dependencia entre el numerador y el denominador de ri.
Para evitar ésto, con mayor esfuerzo computacional, se calcula para cada i, i =
1,...,n, el estimador R, , la varianza residual del modelo de regresión obtenido a
partir de la muestra en la que se ha eliminado la observación . Ahora se
definen los residuos estudentizados como
= -
Ahora se representa el gráfico de residuos de ek* frente a los residuos e ,k. Esto es,
el gráfico de los pares . Este gráfico da una idea de la relación entre la
variable Y y la variable xk una vez que se ha eliminado la influencia de las otras
variables regresoras.
En este gráfico también se puede observar si existe una relación lineal con
el índice y éste debe de incluirse en el modelo de regresión como variable
explicativa
Tipos de Residuos
Residuos ordinarios
Residuos estandarizados.
Son muchas las causas que dan origen a la existencia de datos atípicos. Entre
otras se pueden citar las siguientes:
Residuos estudentizados.
ei n 3
ti t n 3 i 1,2,....., n
n 2 s 2
R 1 hii ei2
Residuos eliminados.
ei y i y i i , i 1,..., n
Entre los residuos ordinarios y los residuos eliminados existe la siguiente
relación
ei
ei , i 1,..., n.
1 hii
Si la observación tiene una influencia grande en el cálculo de la recta de
regresión, los dos residuos ei y e son diferentes, en caso contrario, serán muy
parecidos.
Gráficos de residuos.
Análisis de influencia.
donde hti son unos pesos que en el modelo de regresión lineal simple
tienen la forma
hti
1 xt x x i x
n ,
t , i 1,...., n
n
xi x
2
i 1
— El valor de yi.
— El valor de hti.
.t
donde i es la fila i-ésima de la matriz X (datos de la observación i-ésima).
1 xi x
2
hii 1 , i 1,..., n
n s x2
k 1
hii E hii 3s h 3s h
n
de regresión lineal simple, entonces hii = 1 /(n - 1), i = 1,...,n - 1, puntos en los
que xi = x*, y hnn = 1, el mayor valor que puede tomar. En este caso la recta de
regresión pasa por los puntos x* , y n1 y xn , yn , siendo y n 1 = 1/ (n - 1)
n-1
i=1 yi
Residuos eliminados.
1
Y i X X ti X i X ti Y i
ei y i y i i , i 1,..., n
ei
ei , i 1,..., n.
1 hii
D = = =
= = = ,
siendo ri el i-ésimo residuo estandarizado y k el número de variables regresoras.
Bajo la hipótesis nula, la observación i-ésima no es una observación influyente
a posteriori, se verifica que