Documente Academic
Documente Profesional
Documente Cultură
Los valores que se han obtenido para el coeficiente R2 en los diferentes estudios
publicados, por ejemplo, sobre los puntos de funcin varan desde 0,44 hasta
0,87. Apoyndose en estos valores, algunos autores afirman la validez de la
tcnica de los puntos de funcin. Sin embargo, es una conclusin que no se
desprende directamente de esos datos. Fijmonos que son valores explicativos,
no predictivos. Tanto el R2 como el coeficiente de correlacin no son las medidas
ms adecuadas para evaluar la prediccin de un modelo; en el mejor de los casos
se trata de medidas del ajuste de la ecuacin a los datos, no de la capacidad
predictiva del modelo. En algunos casos la idea que nos transmite el R2 puede
coincidir con la de las variables que a continuacin se muestran, pero en otros no.
Prueba de shapiro
En estadstica, el Test de ShapiroWilk se usa para contrastar la normalidad de un
conjunto de datos. Se plantea como hiptesis nula que una muestra x1, ..., xn
proviene de una poblacin normalmente distribuida. Fue publicado en 1965 por
Samuel Shapiro y Martin Wilk.1 Se considera uno de los test ms potentes para el
contraste de normalidad, sobre todo para muestras pequeas (n<50).
Normalidad de residuos
Hiptesis de normalidad.
La hiptesis de normalidad afirma que los errores del modelo e siguen una
distribucin normal. Esta hiptesis se contrasta a partir de los residuos
estandarizados {ri}i = 1n . Se pueden aplicar los contrastes y grficos de
normalidad descritos en la seccin 4.3.bullet Grficos para observar la
normalidad son: el histograma, estimador ncleo de la densidad de Rosenblatt-
Parzen, grfico p - p y grfico q - q.bullet Contrastes de normalidad son:
contraste de asimetra y kurtosis, contraste chi-cuadrado, contraste de
Kolmogorov-Smirnov-Liliefors.En relacin con la utilizacin de los residuos para
contrastar la normalidad, debe de tenerse en cuenta que de la relacin e = (I- H)
Por tanto, si ei es pequeo, el trmino dominante en la relacin anterior es el
sumatorio que por el Teorema Central del Lmite es aproximadamente normal.
Entonces puede ocurrir que los ei sean aproximadamente normales aunque los ei
no lo sean. En cualquier caso, si n es grande en relacin con k + 1 se pueden
utilizar los residuos estandarizados ri para contrastar la hiptesis de normalidad.
La falta de normalidad influye en el modelo en:
Los estimadores mnimo-cuadrticos no son eficientes (de mnima varianza).
Los intervalos de confianza de los parmetros del modelo y los contrastes de
significacin son solamente aproximados y no exactos.
Causas que dan origen a la falta de normalidad son las siguientes:
* Existen observaciones heterogneas. En este caso se debe averiguar la causa
que origina estas observaciones: errores en la recogida de datos; el modelo
especificado no es correcto porque se han omitido variables regresoras (por
ejemplo, no se ha tenido en cuenta una variable de clasificacin cuando las
observaciones proceden de diferentes poblaciones).
Se debe hacer un estudio de influencia de las observaciones atpicas para
averiguar el grado de influencia en la estimacin del modelo. Si esta influencia es
muy grande puede ser conveniente recurrir a procedimientos de estimacin
robusta en el clculo del modelo.
ANOVA
Un anlisis de varianza (ANOVA) prueba la hiptesis de que las medias de dos o
ms poblaciones son iguales. Los ANOVA evalan la importancia de uno o ms
factores al comparar las medias de la variable de respuesta en los diferentes
niveles de los factores. La hiptesis nula establece que todas las medias de la
poblacin (medias de los niveles de los factores) son iguales mientras que la
hiptesis alternativa establece que al menos una es diferente.
Grafico q y q
En estadstica, un grfico Q-Q ("Q" viene de cuantil) es un mtodo grfico para el
diagnstico de diferencias entre la distribucin de probabilidad de una poblacin
de la que se ha extrado una muestra aleatoria y una distribucin usada para la
comparacin. Una forma bsica de grfico surge cuando la distribucin para la
comparacin es una distribucin terica.1 No obstante, puede usarse la misma
idea para comparar las distribuciones inferidas directamente de dos conjuntos de
observaciones, donde los tamaos de las muestras sean distintos.2
Un ejemplo del tipo de diferencias que pueden comprobarse es la no-normalidad
de la distribucin de una variable en una poblacin. Para una muestra de tamao
n, se dibujan n puntos con los (n+1)-cuantiles de la distribucin de comparacin,
por ejemplo, la distribucin normal, en el eje horizontal el estadstico de k-simo
orden, (para k = 1, ..., n) de la muestra en el eje vertical. Si la distribucin de la
variable es la misma que la distribucin de comparacin se obtendr,
aproximadamente, una lnea recta, especialmente cerca de su centro. En el caso
de que se den desviaciones sustanciales de la linealidad, los estadsticos
rechazan la hiptesis nula de similitud.
ndice [ocultar]
1 Representacin grfica
2 Relacin con grficas de probabilidad
3 Vase tambin
4 Notas
5 Referencias
6 Enlaces externos