Documente Academic
Documente Profesional
Documente Cultură
Regresin y correlacin
Estadstica Econ
mica 2007-2008. S
Independencia - Dependencia
Cuando se estudian dos caractersticas simultneamente sobre una muestra, se
puede considerar que una de ellas influye sobre la otra de alguna manera.
Por ejemplo la altura y el peso o las horas de estudio y la calificacin en un
examen.
Dependencia
Independencia estadstica Dependencia funcional
estadstica
-
Estadstica Econ
+
Grado de asociacin entre dos variables
mica 2007-2008. S
GRFICOS DE DISPERSIN: Permite ver si hay asociacin
Dadas dos variables X y Y tomadas sobre el mismo elemento de la
poblacin, el diagrama de dispersin es simplemente un grfico de
dos dimensiones, donde en un eje (la abscisa) se sita una
variable, y en el otro eje (la ordenada) se sita la otra variable. Si
las variables estn correlacionadas, el grfico mostrara algn nivel
de correlacin (tendencia) entre las dos variables. Si no hay
ninguna correlacin, el grfico presentara una figura sin forma,
una nube de puntos dispersos en el grfico.
Asociacin
positiva. Si
aumenta X
aumenta Y
Estadstica Econ
mica 2007-2008. S
GRFICOS DE DISPERSIN / RECTA DE REGRESIN
La relacin entre dos variables mtricas puede ser
representada mediante la lnea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresin,
regresin que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.
Estadstica Econ
mica 2007-2008. S
GRFICOS DE DISPERSIN / RECTA DE REGRESIN
Para el clculo de la recta de regresin se aplica el mtodo de
mnimos cuadrados entre dos variables. Esta lnea es la que
hace mnima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuacin de la
recta y los valores reales de la serie, son las menores posibles.
y = a + bx
Estadstica Econ
mica 2007-2008. S
Recta de regresin Pendiente
yn
yn -1 yi
y3
u3 ui
yi
y1 yi
y2
Intercepto
x1 x2 x3 xi xn -1 xn
yi = a bxi ui ui = yi - yi
Estadstica Econ Error
mica 2007-2008. S
Llamemos a u perturbacin o error, siendo la diferencia que hay entre el
valor observado de la variable exgena (y) y el valor estimado que
obtendremos a travs de la recta de regresin yi .
y i = a bxi
La metodologa para la obtencin de la recta ser hacer MNIMA la suma de
los CUADRADOS de las perturbaciones. Por qu se elevan al cuadrado?
n n
u = ( yi - yi ) 2
2
i i =
u 2
i =1
i i
( y
i =1
-
y ) 2
n 2 n n
2
min ui = ( yi - yi ) =
2
yi - (aq bpxi )
q, p i =1 i =1 i =1
Estadstica Econ
mica 2007-2008. S
En el modelo de regresin lineal simple la funcin elegida para aproximar la relacin entre las
variables es una recta, es decir y=a+bx, donde a,b son los parmetros. A esta recta la
llamaremos RECTA DE REGRESIN DE Y SOBRE X.
Vamos a deducir su ecuacin usando el mtodo de los mnimos cuadrados. Dado un valor de
X, tenemos los dos valores de Y, el observado, yi , y el terico, yi* = a + bxi. Hemos de
minimizar los errores cometidos:
n n
( y -( a bx ) ) = ( y -a -bx ) 2 2 MINIMIZAR
= i i i i
i =1 i =1
El valor que hemos
Errores cometidos al
aproximar por una recta
aproximado para y con
la recta de regresin y*
- na = - y b x
i
i
i
i a = y -bx
x y =( y -bx ) x b x
i
i i
i
i
i
2
i
x y =
y
x -bxnx b x
i
y = ab x
=- 2 ( yi - a -bxi ) =0 i i
i i
n
i i
a
i i i
i i i i
x y =a x b x
b
=- 2
i
( yi - a -bxi )xi =0
i
i i
i
i
i
2
i
i
xi yi - ynx =b
i
xi2 - nx 2
S xy
Estadstica Econ S xy =bS x2 b =
S x2
mica 2007-2008. S
y obtenemos que la recta de regresin de Y sobre X: y = a + bx con los
valores a y b anteriormente calculados, o bien la siguiente expresin:
S xy
y- y = ( x- x )
S x2
Aplicando el mismo razonamiento llegaramos a la expresin de la recta de
regresin de X sobre Y: x = a + by con los valores a y b calculados como:
S xy
b '= y a '= x - b ' y
S y2
S xy
x- x = ( y- y)
Estadstica Econ S y2
mica 2007-2008. S
Varianza residual: Ayuda a medir la dependencia.
( yi - yi )
2
Si es grande, los residuos, por trmino
VR = Su2 = S R2y = medio, sern grandes. Dependencia
N pequea y viceversa.
S S S
Recta de regresin: yi = y - XY2 x XY2 xi = y XY2 ( xi - x )
SX SX SX
S XY S X SY S XY SY SY
yi = y 2 ( i )
x - x = y ( i )
x - x = y r ( xi - x )
S X SY S X S X SY S X SX
Estadstica Econ
mica 2007-2008. S
2
S Y
Se descompone en:
S = S = VR
2
u
2
ry
S = S -S
2
R
2
Y
2
u
= VE
2
S S -
2
S S
2
R
2
VR VE
R = 1- =
2 u
= Y =1- u=
SY2 VT VT
22
S SY
Y
S =S S
2
Y
2
R
2
u VT = VR VE
2
R
SIRVE
Tanto por uno de la
PARA DETERMINAR
Estadstica Econ
Y que viene explicado por la X
S XY
y 0 = aq bpx0 = y 2 ( x0 - x )
SX
Estadstica Econ
mica 2007-2008. S