Documente Academic
Documente Profesional
Documente Cultură
Regresin y correlacin
Contenidos:
Estadstica Econmica
2007-2008. Sara Mateo.
Independencia - Dependencia
Cuando se estudian dos caractersticas simultneamente sobre una muestra,
se puede considerar que una de ellas influye sobre la otra de alguna
manera. Por ejemplo la altura y el peso o las horas de estudio y la
calificacin en un examen.
El objetivo principal de la regresin es descubrir el modo en que se relacionan.
Dos variables pueden considerarse:
Independencia estadstica
Dependencia
estadstica
Dependencia funcional
Asociacin
positiva. Si
aumenta X
aumenta Y
Estadstica Econmica
2007-2008. Sara Mateo.
y = a + bx
Recta de regresin
Pendiente
yn
y i
yn 1
y3
u3
yi
y1
ui
yi
y2
Intercepto
x1
x2
x3
xn 1
xi
yi a bxi ui
xn
ui yi yi
Error
y i a bxi
La metodologa para la obtencin de la recta ser hacer MNIMA la suma de
los CUADRADOS de las perturbaciones. Por qu se elevan al cuadrado?
n
u ( yi yi ) 2
2
i
2
u
i
i 1
(
y
y
)
i i
i 1
n
2
n 2 n
2
min
ui ( yi yi ) yi aq bpxi
q, p
i 1
i 1
i 1
Estadstica Econmica
2007-2008. Sara Mateo.
En el modelo de regresin lineal simple la funcin elegida para aproximar la relacin entre las
variables es una recta, es decir y=a+bx, donde a,b son los parmetros. A esta recta la
llamaremos RECTA DE REGRESIN DE Y SOBRE X.
Vamos a deducir su ecuacin usando el mtodo de los mnimos cuadrados. Dado un valor de
X, tenemos los dos valores de Y, el observado, yi , y el terico, yi* = a + bxi. Hemos de
minimizar los errores cometidos:
y abx y abx
i
i 1
Errores cometidos al
aproximar por una recta
i 1
na
MINIMIZAR
y b x
a y bx
i
x y y bx x b x
y
x y
x bx nx b x
i i
2
a
yi a bxi 0
yi a bxi xi 0
2
b
y ab x
x y a x b x
i
i i
2
i
2
i
i i
xi yi ynx b
2
i
S xy bS x2
b
xi2 nx 2
S xy
S x2
y y
S xy
S x2
x x
b'
S xy
y a' x b' y
S y2
x x
Estadstica Econmica
2007-2008. Sara Mateo.
S xy
S y2
y y
Su2 S R2y
yi yi
N
2
Sy
2
Sx
Su2
S y2
VR
VTy
Ayuda a determinar la
asociacin pero en
sentido inverso. La
mejor medida es R.
Su2
R 1 2
SY
rxy R
R
S xy S xy S xy
2
R bb'
S x2 S y2 S x S y
2
2
r 2
xy
1 r 1
1 R 1 0 r 2 1 0 R2 1
R r R2 r 2
S
S
S
Recta de regresin: yi y XY2 x XY2 xi y XY2 xi x
SX SX
SX
yi y
S XY S X SY
S XY SY
SY
x
r
i
i
xi x
2
S X SY S X
S X SY S X
SX
r 1
Pendiente
Estadstica Econmica
2007-2008. Sara Mateo.
1 r 0
Negativa
r 0
Nula
0 r 1
r 1
Positiva
2
Y
Se descompone en:
S S VR
2
u
2
ry
S S S
2
R
2
Y
2
VE
u
2
2
2
2
VR VE
S
S
S
S
2
R
u
Y
u
1
R 1 2
2
VT VT
SY
SY
SY2
S S S
2
Y
2
R
2
u
VT VR VE
S XY
yi qa bpxi y 2 xi x
SX
El objetivo ltimo de la regresin es la prediccin de una variable para un
valor determinado de la otra. La prediccin de Y para X = x0 ser simplemente
el valor obtenido en la recta de regresin de Y sobre X al sustituir el valor de x
por x0. La fiabilidad de esta prediccin ser tanto mayor cuando mayor sea la
correlacin entre las variables (es decir mayor sea R2 )
Dado x0
estimar
S XY
0 aq bpx0 y 2
y
SX
y0
x0 x