Documente Academic
Documente Profesional
Documente Cultură
Estadstica
ANLISIS DE REGRESIN Y
CORRELACIN
Todos los das se toman decisiones personales y profesionales basadas en predicciones
de sucesos futuros. Para hacer estas predicciones, se basan en la relacin (intuitiva o
calculada) entre lo que se sabe y lo que se debe estimar. Si se puede determinar como lo
conocido se relaciona con el evento futuro, puede ayudar considerablemente al proceso
de la toma de decisiones (relacin entre variables)
Diagramas de Dispersin
Para determinar si existe relacin entre dos variables se debe examinar la grfica de los
datos observados. Esta grfica o es quema se llama diagrama de dispersin.
Un diagrama de dispersin nos puede dar dos tipos de informacin. Visualmente
podemos buscar patrones que indiquen que las variables estn relacionadas. Entonces, si
esto sucede, podemos ver que tipo de lnea o ecuacin de estimacin, describe esta
relacin.
Regresin
Es un mtodo estadstico que investiga y define la relacin funcional entre dos ms
variables
Y = f (x)
La Regresin y los anlisis de correlacin se basan en la relacin o asociacin, entre dos
o ms variables. La(s) variable(s) conocida(s) se llaman variables independientes. La
variable que trataremos de predecir es la variable independiente. Solo podemos tener
una variable dependiente en nuestra ecuacin de estimacin. Sin embargo, podemos
usar ms de una variable independiente. A menudo cuando aadimos variables
independientes, mejoramos la exactitud de nuestra prediccin
Y=
Y=
Y=
Y=
Y=
a + bx
a + bx + cx2
a + bx + cx2 + dx3
a
bx
a
k+bx
Regresin y Correlacin
Estadstica
x
Y= ab
x
Y= k+ab
h) Hiprbola
Y=
i) Hiprbola equiltera
Y=
f) Curva exponencial
j) Hiprbola modificada
k) Curva logstica
a
x
k
a bx
1
Y =
a bcx
Y=
k
Y=
1 10a bx
1
Y=
x
k ab
Y=
n) Curva Gompertz
1
a bx
c
ab
d1 d2 d3 ... dk
2
Mn. d = mn. (Yi
i
- Y*)2
Y*
d1
dk
Regresin y Correlacin
Estadstica
LA RECTA
MTODOS DE LOS MNIMOS CUADRADOS
Y=A+ B X
LNEA DE REGRESIN
ECUACIONES NORMALES
+ B X
Y =AN
(2) XY = A X + B X 2
(1)
Donde:
N XY X Y
N X
X Y X Y
A=
N X X
Y B X
N
MTODO ABREVIADO
Sea:
y=Y- Y Y=y+ Y
x=X- X X=x+ X
Reemplazando en las frmulas de A y de B se obtienen:
B=
xy
2
x
y=Bx
Y - Y = B (X - X )
COEFICIENTE DE CORRELACIN
R=
2
S *
y
2
Sy
2
S * : Varianza explicada (parte de la
y
varianza total de Y explicada por la
lnea de regresin )
2
Sy :
Regresin y Correlacin
Varianza total
Estadstica
Sy
y * y
S *
y
y-y
2
2
Syx
y*y
Remplazando:
+ Varianza no explicada
yy
Varianza explicada
Desarrollando se obtiene
y y*
R2
R2
ay bxy n y
y2 n y
= 1-
2
Syx
2
Sy
nxy xy
n x 2 x 2 n y2 y
Si se utilizan
x = X- X
R=
y=Y- Y
xy
2
x2 y
PROPIEDADES
1.- El rango de variacin de r es de 1 a +1
-1 R 1
2.-Si R > 0, existe correlacin directa o positiva
3.-Si R < 0, existe correlacin inversa o negativa
4.-Si R2 = 0, los datos son incorrelacionables; es decir, que no hay afinidad entre
variables
Regresin y Correlacin
Estadstica
(2)
(3)
(4)
(5)
(6)
(7)
SYX =
y y *
n
Regresin y Correlacin
Estadstica
Calcular el error estndar S a partir de la definicin resulta muy laboriosa, puesto que se
requiere conocer los valores estimados Y*. Existe una frmula alternativa a partir de la
definicin, donde se sustituyen el valor Y* = a + b X
SYX =
y a bx
n
Desarrollando:
2
y a y b xy
n
SYX =
2
S YX
(1)
LC = Y* 2 SYX
X = x +
y=Y- Y Y =y + Y
se obtiene:
Regresin y Correlacin
Estadstica
2
S yx =
y b xy
n
LA FUNCIN POTENCIAL
La curva de regresin potencial se construye a partir de la funcin potencial, cuya
ecuacin es:
Y = b Xa
Si utilizamos logaritmos, esta funcin se asemeja
a la funcin lineal
Log Y* = Log b +
Log x
Log Y =
n Log b
+ a Log X
Log X Log Y = Log b lg. X + a (Log X) 2
Despejando para calcular a
Log b
a=
Log b =
Log.y a Log.x
n Logx.Logy Logx. Logy
n
2
2
nERROR
Log.xESTNDAR
Log.x
DE ESTIMACIN
2 = Log.y Log.y * 2
Syx
n
Syx
lg. Y* = Log b +
Log x
Regresin y Correlacin
Estadstica
Coeficiente de correlacin: R
R2 =
Logy n Logy
2
FUNCIN EXPONENCIAL
La curva de regresin exponencial se determina a partir de la funcin exponencial de la
forma:
Y= abX
Con los parmetros a y b
Esta funcin se utiliza cuando se quiere calcular
tasas de crecimiento, considerando todos los
puntos observados durante un periodo,
aqu se supone que existe un crecimiento no lineal
de tipo geomtrico
Observamos adems que la ecuacin
Y= abX
De la misma manera que la funcin potencial, aplicamos logaritmos para transformar la
funcin exponencial original en forma logartmica:
ECUACIONES NORMALES
Log Y =
X lg. Y =
n Log a
+ Log b
Log a X + Log b
Log b =
n xLogy x Logy
2
2
n
x de Estimacin: S2
Error Estndar
X
X2
Log a =
Logy Logb x
n
yx
Syx =
Regresin y Correlacin
Estadstica
Coeficiente de Correlacin: r
R2 =
Logy n Logy
2