Sunteți pe pagina 1din 23

Regresin

Profesor
Juan Barile Sanhueza
Qu mide la regresin bivariada?

)Grado de dependencia de una variable


dependiente (Y) sobre una variable
independiente X entre dos variables (X e Y).

Es decir, cuanto cambio se espera en Y ante


una unidad de cambio en X, ms all de lo que
muestran los datos reales debido a la
capacidad de prediccin del anlisis de
regresin.

Este anlisis implica dependencia y por lo


tanto causalidad.
Como se mide la regresin?

)En forma numrica mediante una ecuacin. La


ms comn es la ecuacin de regresin lineal

y = a + bx., donde

Y es la variable aleatoria llamada respuesta o


dependiente.

X es la variable aleatoria (o no) llamada


explicativa, predictora o independiente.
Para describir la relacin de la regresin se requiere
responder las siguientes interrogantes:

Estn relacionadas las variables entre s?


Qu grado de dependencia tiene la variable
dependiente?
Segn la dispersin de los datos (nube de puntos)
en el plano cartesiano, pueden darse alguna de las
siguientes relaciones, lineal, logartmica,
exponencial, cuadrtica, entre otras.

REGRESIN ECUACIN
Lineal y = A + Bx
Logartmica y = A + BLn(x)
Exponencial y = Ae(Bx)
Cuadrtica y = A + Bx +Cx2
La recta de la regresin lineal
Se trata de encontrar una recta que ajuste a la nube
de puntos del diagrama entre las variables que
pueda ser utilizada para predecir los valores de Y a
partir de los de X. La ecuacin general de la recta
de regresin ser entonces de la forma: Y = a + bx .
El problema radica en encontrar aquella recta que
mejor ajuste a los datos. Tradicionalmente se ha
recurrido al mtodo de mnimos cuadrados, que elige
como recta de regresin a aquella desarrollada por
los matemticos que minimiza las distancias
verticales de las observaciones a la recta.
La recta de regresin lineal sirve para hacer
estimaciones, teniendo en cuenta que:

La fiabilidad es mayor cuanto ms fuerte sea


la correlacin.
La fiabilidad aumenta al aumentar el nmero
de datos.
La estimacin es ms fiable para los valores
de X prximos a la media.
Estimacin de los parmetros de la recta y = a + bx

Parmetro "a"
Valor que toma la variable dependiente "y", cuando
la variable independiente "x" vale 0, y es el punto
donde la recta cruza el eje vertical.

Parmetro "b"
Valor que determina la pendiente de la recta, su
grado de inclinacin.
El parmetro "b" viene determinado por la siguiente
frmula:

El parmetro "a" viene determinado por:


a = ym - (b * xm)
Que corresponde a la media de la variable "y",
menos la media de la variable "x" multiplicada por el
parmetro "b" ya calculado.
Interpretacin de los coeficientes de regresin y
la tabla ANOVA.
Estimados los coeficientes, en la mayora de las
aplicaciones el valor de no tendr una interpretacin
directa, mientras que el valor b servir como un indicador
del sentido de asociacin entre ambas variables as:

indicar una relacin directa entre ellas (a mayor valor de la


variable explicativa, el valor de la variable dependiente
Y aumentar),
delatar una relacin de tipo inversa a la anterior
indicar que no existe una relacin lineal clara entre ambas
variables.
Computo de la ecuacin de regresin

X Y
56,00 75,00
48,00 62,00
32,00 43,00
60,00 74,00
40,00 50,00
21,00 29,00
35,00 43,00
27,00 38,00
38,00 38,00
68,00 75,00
Paso 1. Grafica de dispersin

80,00

70,00

60,00

Y1

50,00

40,00

30,00

20,00

20,00 30,00 40,00 50,00 60,00 70,00


X1
Paso 2.
a) Estadsticos descriptivos
Desviacin
Media tp. N
Y1 52,7000 17,39764 10
X1 42,5000 15,14559 10

b) Calculo de a y b de la ecuacin de la recta


Coeficientes no estandarizados B
1,104

Error tp. ,113


Correlaciones Orden cero ,961
Parcial ,961
Semiparcial ,961
Estadsticos de colinealidad Tolerancia 1,000
FIV 1,000

b = [2278,5/2064,5] = 1,1037
a = 52,7-(1,1037 * 42,5)= 5,79
Ecuacin de la recta = y = 5,79 + 1,104 x
Paso 3.
a) Anlisis de varianza para la relacin. Se establece
H0: b = 0 y H1: b0
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 2514,683 1 2514,683 96,064 ,000(a)
Residual 209,417 8 26,177
Total 2724,100 9

Se deduce que una porcin significativa de la


varianza de Y es explicada por regresin sobre X, es
decir hay un incremento en peso en los peces
producto del tratamiento empleado.
b) Prueba de t-Student para el coeficiente de
regresin b= 1,104. Se establece
H0: b = 0 y H1: b0

Coeficientes estandarizados Beta ,961


t 9,801
Sig. ,000
Intervalo de confianza para B al Lmite inferior ,844
95%
Lmite superior 1,363

Se concluye que b se desva significativamente de


cero
c) Limites de confianza para b

Limites (L1 y L2) = b t (n-2) *Sb

L1 = 1,104 - (1,96*0,113) = 0,84


L2 = 1,104 -(1,96* 0,113) = 1,36

Donde Sb = 26,18/2064,5 = 0,1126


Paso 4
Grafica de la lnea de regresin
y = 5,79 + 1,104 x
Scatterplot: VAR1 by VAR2
85

75

65
VAR2

55

45

35

Regression
25
15 25 35 45 55 65 75 95% confid.

VAR1
Diseos experimentales en regresin

Modelo I. Los valores de X pueden ser manipulados


a voluntad.

Modelo II. Ambas variables se consideran aleatorias

Ambos modelos se basan en las siguientes hiptesis


bsicas.
1. La variable independiente se mide sin error. Esto
significa que est bajo el control del investigador y se
consideran fijos a los valores de X que eligi.

2. El valor esperado de la variable Y* para un dado


valor de X, se determina con la relacin:
Y* = + X

3. Para cualquier valor de X, los valores de Y se


distribuyen independiente y normalmente.
Y* = + X +

4. Todas las muestras a lo largo de la lnea de regresin


son homocedsticas.
Pasos a seguir en la Regresin Simple

1. Grfico de la variable dependiente respecto de


la independiente, buscar:
Si la relacin entre ambas es lineal o no.
Si la relacin es no-lineal. Considerar una
transformacin.
Datos atpicos. Si los hay, ver si est
justificado el eliminarlos.
2. Ajustar una recta a los datos y comprobar
las hiptesis del modelo respecto de la

HOMOCEDASTICIDAD grficos de
residuos (para ver si se cumple la hiptesis
de homocedasticidad)
NORMALIDAD ploteo de probabilidad
normal (para ver si se cumple la hiptesis
de normalidad).

Si estas condiciones no se satisfacen puede que


sea necesaria una transformacin.
3. Si es necesario, transformar los datos y
volver al paso 1.

4. Una vez que se ha determinado el modelo


adecuado, escribir la ecuacin de la recta,
los errores estndar de los coeficientes,
estadsticos t y el valor de r2.

5. Determinar si la variable explicativa es


significativa mediante un t-test o F-test y dar
un intervalo de confianza para la pendiente
de la recta.

S-ar putea să vă placă și