Documente Academic
Documente Profesional
Documente Cultură
REGRESION y
CORRELACION
CURSO DE ESTADISTICA Y
PROBABILIDADES
Y = f (X)
REGRESION
Expresin cuantitativa de la naturaleza
bsica de la relacin entre las variables
dependiente e independiente.
REGRESION MULTIPLE:
abarca dos o ms variables independientes.
Y = f (X, W, Z)
REGRESION
REGRESION LINEAL:
intenta reflejar la relacin entre X e Y
por medio de una recta.
REGRESION CURVILINEAL:
cuando la relacin se puede describir
mejor por medio de una curva.
ANALISIS DE REGRESION
Las relaciones entre variables son
deterministas o estocsticas (aleatorias).
Y 0 1 X
(Componente (Componente
Determinista) Aleatorio)
REGRESION y CORRELACION
DATOS DE PRODUCCION DE HARDWARE
PARA COMPUTADORAS
DIA N UNIDADES DE DISCO COSTO
1 50 $450
2 40 380
3 65 540
4 55 500
5 45 420
ANALISIS DE REGRESION
MODELO DETERMINISTA:
se expresa con
Y 0 1 X
Dado un valor cualquiera de X, el valor
de Y se puede determinar con precisin.
ANALISIS DE REGRESION
MODELO ESTOCASTICO:
Contiene dos o ms componentes
aleatorios que conducen al error de
prediccin. Se expresa as:
Y 0 1 X
ANALISIS DE REGRESION
Estimacin de la recta verdadera de regresin de
la poblacin:
Y b0 b1 X e
b0 y b1 son estimaciones de los parmetros
poblacionales 0 y 1
Se denominan constante de regresin y coeficiente
de regresin respectivamente. El ltimo trmino,
e, es el componente de error, el cual es necesario
porque no todas las observaciones de X e Y estn
en lnea recta.
ANALISIS DE REGRESION
500 Error
Error Y
450 Error
Valor estimado de Y
400 Error
Error Y cuando X = 55
350
40 45 50 55 60 65 70
Unidades de disco
METODO DE LOS MINIMOS CUADRADOS
El mtodo de los mnimos cuadrados para hallar la
recta de ajuste ptimo hace mnima la suma de
cuadrado de errores.
(Y i
Y) 2
min
Se puede demostrar mediante el clculo diferencial
que esta suma de errores al cuadrado ser mnima
si se calculan las sumas de los cuadrados
cruzados y de los productos cruzados.
METODO DE LOS MINIMOS CUADRADOS
Sumas de los cuadrados de X(SSx):
SSx ( X i X ) X
2 2 ( X ) 2
( Y ) 2
SSy (Yi Y ) Y
2 2
n
METODO DE LOS MINIMOS CUADRADOS
SSxy ( X i X )(Yi Y )
( X )( Y )
SSxy XY
n
METODO DE LOS MINIMOS CUADRADOS
SSxy
b1 y b0 Y b1 X
SSx
DATOS DE REGRESION DE LAN
Meses Publicidad(X) Pasajeros(Y) XY X2 Y2
En miles de N So les En miles de personas
Y b0 b1 X
SSx = 137.7333333
SSy = 171.733333
SSxy = 148.933333
b1= 1.0813166 o 1.08; b0= 4.3865 o 4.4
Y 4.40 1.08 X
DATOS DE REGRESION DE LAN
Interpretacin: Si X se incrementa
de 10 a 11, el nmero de pasajeros predicho
es de 16,280, es decir, 1,080 ms que los
15,200 pasajeros predichos si X=10. Esta
informacin es til para determinar si est
justificado un aumento del presupuesto de
publicidad.
ANALISIS DE CORRELACION
Mide la fuerza de la relacin, que viene
dada por el coeficiente de determinacin.
El coeficiente de determinacin es una de las
medidas de bondad de ajuste. Para ello
debemos considerar la desviacin total de Y.
La desviacin total es la cantidad en que un
valor real de Y, Yi difiere de Y ,media de
todos los valores de la variable dependiente.
ANALISIS DE CORRELACION
Desviacin explicada es la diferencia
entre el valor predicho por el modelo (Y )
y el valor medio de Y(Y ) : Y Y
no explicada
Desviacin total (Yi Y ) 1.32
(Yi Y ) 5.13 Y 21.68
Y 17.87
Desviacin explicada
(Y Y ) 3.81
4.4
JCM X
ANALISIS DE CORRELACION
Suma total de cuadrados (o suma cuadrtica
de la desviacin total, SST) es:
SST (Yi Y ) 2
( SSx)( SSy)
ANALISIS DE CORRELACION