Documente Academic
Documente Profesional
Documente Cultură
Correlacin
Si tenemos 2 datos x y y se
pueden graficar en un sistema
coordenado y as obtener su
representacin grfica y a esta
representacin se le llama
diagrama de dispersin.
Ejemplo:
x
5
7
11
15
20
25
30
35
40
y
10
15
20
25
30
35
40
45
50
Causa y efecto
Los anlisis de regresin y correlacin no
pueden, de ninguna manera, determinar
la causa y el efecto.
Variables de regresin
Las variables de regresin independientes
son las que representamos como los
valores que graficamos en el eje
horizontal (x).
Las variables de regresin dependientes
son las que representamos como los
valores que graficamos en el eje vertical
(y).
Diagramas de Dispersin
Consiste en representar los pares de
valores (xi , yi) como puntos en un
sistema de ejes cartesianos X y Y .
Diagramas de Dispersin
Diagramas de Dispersin
Diagramas de Dispersin
Relacin Parablica
Diagramas de Dispersin
Diagramas de Dispersin
Relacin Potencial
Diagramas de Dispersin
Relacin Exponencial
Diagramas de Dispersin
Sin relacin
Linealidad
La primera suposicin, linealidad,
establece que la relacin entre variables
es lineal. Las relaciones entre variables
pueden ser no lineales o sin relacin.
Independencia de errores
La segunda suposicin, independencia de
errores, requiere que los errores sean
independientes unos de otros. Esta
suposicin, es en especial importante
cuando los datos se recolectan los datos
a lo largo de un periodo de tiempo. En
esas situaciones, los errores para un
periodo especfico con frecuencia se
relacionan con los del periodo anterior.
Normalidad
La tercera suposicin, normalidad,
requiere que los errores se distribuyan
normalmente en cada valor de x, siempre
que la distribucin de los errores
alrededor de la recta de regresin en cada
nivel de x no sea en extremo diferente de
una distribucin normal, no habr efectos
serios en las inferencias acerca de la recta
de regresin y los coeficientes de
regresin.
Normalidad
Igual varianza
La cuarta suposicin, igual varianza o
homoscedasticidad, requiere que la
varianza de los errores sea constante
para todos los valores de x, es importante
para usar el mtodo de mnimos
cuadrados que determina los coeficientes
de regresin. Si hay desviaciones serias de
esta suposicin, se pueden aplicar
transformaciones de datos o mtodos de
mnimos cuadrados ponderados.
Anlisis de residual
Se utiliza para evaluar qu tan adecuado
es el modelo de regresin ajustado a los
datos.
El residual o error del valor estimado ei es
la diferencia entre los valores observados
(yi) y los valores pronosticados ( ) de la
variable dependiente para un valor dado
de xi.
Anlisis de residual
Grficamente, aparece un residuo en el
diagrama de dispersin como la distancia
vertical entre un valor observado de y y la
lnea de prediccin.
=
Linealidad
(e e
i 2
i 1
2
i
Donde:
i 1
ei = Residuo en el periodo de tiempo i.
Normalidad.
Se puede evaluar la suposicin de
normalidad en los errores agrupando los
residuos dentro de la distribucin de
frecuencias y mostrando los resultados en
un histograma. Tambin es factible
evaluarla comparando los valores reales
contra los valores tericos de los residuos,
o construyendo una grfica de
probabilidad normal (Minitab), un
Normalidad.
diagrama de tallo y hojas o una grfica de
caja y bigote para los residuos. Es difcil
evaluar la suposicin de normalidad con
pocos datos.
No Homocedasticidad
No Homocedasticidad
Homocedasticidad
Determinacin de la ecuacin de
regresin
Mtodo de Mnimos Cuadrados
Determinacin de la ecuacin de
regresin
y
i 1
x y
i 1
nb0 b1 xi
n
i 1
n
b0 xi b1 x
i 1
(1)
i 1
2
i
(2)