Sunteți pe pagina 1din 19

Regresin

Profesor
Juan Barile Sanhueza
qu mide la regresin ?
)Mide el grado de dependencia de una variable
dependiente (Y) sobre una variable independiente
X entre dos variables (X e Y). Es decir Este
anlisis implica dependencia y por lo tanto
causalidad.

Como se mide la regresin?


)En forma numrica mediante una ecuacin, la
ms comn es la ecuacin de regresin lineal
donde Y = a +bx
Para describir la relacin de la regresin se
requiere responder las siguientes
interrogantes:

vEstn relacionadas las variables entre


s?
vQu grado de dependencia tiene la
variable dependiente?
El anlisis de regresin permite conocer:

Cuanto cambio se puede esperar en Y ante


una unidad de cambio en X, ms all de lo
que muestran los datos reales debido a que,
el anlisis de regresin tiene capacidad de
prediccin
En el anlisis de regresin se tiene una relacin,
entre una variable x e y, donde :

Y que es la variable aleatoria llamada respuesta o


dependiente.
X que es la variable aleatoria (o no) llamada
explicativa, predictora o independiente.
Segn sea la dispersin de los datos (nube de
puntos) en el plano cartesiano, pueden darse
alguna de las siguientes relaciones, Lineal,
Logartmica, Exponencial, Cuadrtica, entre otras.

REGRESIN ECUACIN
Lineal y = A + Bx
Logartmica y = A + BLn(x)
Exponencial y = Ae(Bx)
Cuadrtica y = A + Bx +Cx2
La recta de la regresin lineal
Se trata de encontrar una recta que ajuste a la nube
de puntos del diagrama entre las variables que
pueda ser utilizada para predecir los valores de Y a
partir de los de X. La ecuacin general de la recta
de regresin ser entonces de la forma: Y = a + bx .
El problema radica en encontrar aquella recta que
mejor ajuste a los datos. Tradicionalmente se ha
recurrido para ello al mtodo de mnimos cuadrados,
que elige como recta de regresin a aquella
desarrollada por los matemticos que minimiza las
distancias verticales de las observaciones a la recta.
La recta de regresin sirve para hacer
estimaciones, teniendo en cuenta que:

La fiabilidad es mayor cuanto ms fuerte sea


la correlacin.
La fiabilidad aumenta al aumentar el nmero
de datos.
La estimacin es ms fiable para los valores
de X prximos a la media.
Una recta viene definida por la siguiente frmula:
y = a + bx
Donde "y" es la variable dependiente, es decir,
aquella que viene definida a partir de la otra
variable "x" (variable independiente). Para definir
la recta hay que determinar los valores de los
parmetros "a" y "b":
El parmetro "a" es el valor que toma la variable
dependiente "y", cuando la variable independiente
"x" vale 0, y es el punto donde la recta cruza el
eje vertical.
El parmetro "b" determina la pendiente de la
recta, su grado de inclinacin.
El parmetro "b" viene determinado por la siguiente
frmula:

El parmetro "a" viene determinado por:


a = ym - (b * xm)
Que corresponde a la media de la variable "y",
menos la media de la variable "x" multiplicada por el
parmetro "b" que hemos calculado.
Interpretacin de los coeficientes de
regresin y la tabla ANOVA.
Estimados los coeficientes, en la mayora de las
aplicaciones el valor de no tendr una
interpretacin directa, mientras que el valor servir
como un indicador del sentido de asociacin entre
ambas variables as:

indicar una relacin directa entre ellas (a mayor valor de la variable


explicativa, el valor de la variable dependiente Y aumentar),

delatar una relacin de tipo inversa a la anterior

indicar que no existe una relacin lineal clara entre ambas variables.
Computo de la ecuacin de regresin
Ejemplo se tomaron las siguientes medidas de ganancia en
peso despus de una droga en peces
Pi Pf
56,00 75,00
48,00 62,00
32,00 43,00
60,00 74,00
40,00 50,00
21,00 29,00
35,00 43,00
27,00 38,00
38,00 38,00
68,00 75,00
Paso 1. Grafica de dispersin

80,00

70,00

60,00

Y1

50,00

40,00

30,00

20,00

20,00 30,00 40,00 50,00 60,00 70,00


X1
Paso 2.
a) Estadsticos descriptivos
Desviacin
Media tp. N
Y1 52,7000 17,39764 10
X1 42,5000 15,14559 10

b) Calculo de a y b de la ecuacin de la recta


Coeficientes no estandarizados B
1,104

Error tp. ,113


Correlaciones Orden cero ,961
Parcial ,961
Semiparcial ,961
Estadsticos de colinealidad Tolerancia 1,000
FIV 1,000

b = [2278,5/2064,5] = 1,1037
a = 52,7-(1,1037 * 42,5) 5,79
Ecuacin de la recta = Y = 5,79 + 1,104 x
Paso 3.
a)Anlisis de varianza para la relacin. Se establece
H0: B = 0 y H1: B0
Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 2514,683 1 2514,683 96,064 ,000(a)
Residual 209,417 8 26,177
Total 2724,100 9

Se deduce que una porcin significativa de la


varianza de Y es explicada por regresin sobre X, es
decir hay un incremento en peso en los peces
producto del tratamiento empleado.
b) Prueba de t-Student para el coeficiente de
regresin b= 1,104. Se establece
H0: b = 0 y H1: b0

Coeficientes estandarizados Beta ,961


t 9,801
Sig. ,000
Intervalo de confianza para B al Lmite inferior ,844
95%
Lmite superior 1,363

Se concluye que b se desva significativamente de


cero
c) Limites de confianza para b

Limites (L1 y L2) = b t (n-2) *Sb

L1 = 1,104- (1,96*0,113) = 0,84


L2 = 1,104 ( 1,96* 0,113= 1,36

Donde Sb = 26,18/2064,5 = 0,1126


Paso 4
Trazado final de la lnea de regresin
Y = 5,79 + 1,104 x
Scatterplot: VAR1 by VAR2
85

75

65
VAR2

55

45

35

Regression
25
15 25 35 45 55 65 75 95% confid.

VAR1

S-ar putea să vă placă și