Sunteți pe pagina 1din 8

MTODOS DE REGRESIN Y CORRELACIN

Las tcnicas de regresin y correlacin cuantifican la asociacin estadstica entre dos o ms


variables. La regresin lineal simple expresa la relacin entre una variable dependiente Y y
una variable independiente X, en trminos de la pendiente y la interseccin de la lnea que
mejor se ajuste a las variables.

La correlacin simple expresa el grado o la cercana de la relacin entre las dos variables en
trminos de un coeficiente de correlacin que proporciona una medida indirecta de la
variabilidad de los puntos alrededor de la mejor lnea de ajuste- Ni la regresin ni la
correlacin dan pruebas de relaciones causa efecto.

Regresin: El modelo de regresin lineal simple toma la forma

Y = a + bx,
donde
y = variable dependiente
x = variable independiente.
Los valores de la pendiente b y la interseccin a se obtienen usando las ecuaciones normales
escritas en la forma conveniente.



=
2
2
X n x
XY n xy
b

x b Y a =

Desviacin estndar de la regresin

Una lnea de regresin describe la relacin entre un valor dado de la variable independiente X
y la media y.x de la distribucin de probabilidad correspondiente de la variable dependiente
Y. El punto estimado, o pronstico, es la media de la distribucin para un valor dado X.

La desviacin estndar de la regresin S y.x es una medida de la dispersin de los datos
alrededor de la lnea de regresin.

2
2
.


=

n
XY b Y a Y
S
X y


Estimacin de intervalo

Se puede establecer una prediccin de intervalo para un valor pronosticado individual de Y
C

usando la expresin:

Intervalo de prediccin = Y
C

t
S
IND


Donde t = valor de la tabla de la distribucin t para el nivel de confianza especificado, y

Ing. Jorge Enrique Vargas Martnez; MAD
2

+ + =
2
2
.
) (
) ( 1
1
X X
X X
n
S S
x y IND


Para muestras grandes (n100), la ecuacin anterior puede ser aproximada. Usando la
distribucin normal (Z) ms que la , en la forma de Y
C
ZS
Y.X
Tambin la significancia de la
pendiente de la lnea de regresin (b) puede ser probada usando la siguiente expresin.

b
calc
S
b
t =


=
2
.
) (
1
X X
S S
X Y b


donde

Si el valor de t
calc
de la tabla t, la relacin entre X y Y es estadsticamente significativa.

Correlacin

El coeficiente de correlacin lineal simple r es un nmero entre -1 y 1 que indica qu tan bien
describe la ecuacin lineal la relacin entre las dos variables. Como se muestra en la siguiente
figura, r se designa como positiva si Y se incrementa cuando lo hace X, y negativa si Y
decrece al incrementarse X. Una r de cero indica una ausencia de relacin entre las dos
variables.





La desviacin de todos los puntos (Y) de la lnea de regresin (Yc) consiste en la desviacin
contabilizada por la lnea de regresin (explicada) y la variacin aleatoria (no explicada).


Ing. Jorge Enrique Vargas Martnez; MAD
3

Variacin total = explicada + no explicada


+ =
2 2 2
) ( ) ( ) (
c c
Y Y Y Y Y Y

El coeficiente de determinacin r
2
es la razn de la variacin explicada a la variacin total:

=
2
2
2
) (
) (
Y Y
Y Y
r
C


El coeficiente de correlacin r es la raz cuadrada del coeficiente de determinacin:

=
2
2
) (
) (
Y Y
Y Y
r
c


Cuando el tamao de la muestra es lo suficientemente grande (v.g., mayor de 50); el valor de
r puede ser calculado ms directamente con base en:

( ) | || |
2 2
2
2
) (




=
Y Y n X X n
Y X XY n
r

La significancia de cualesquier valor de r puede probarse estadsticamente con una hiptesis
para mostrar que no existe correlacin. Para probarlo, el valor de r es comparado con un valor
de tablas para un tamao de muestra y un nivel de significancia dados.

Ejemplo

El gerente general de una planta de produccin de materiales de construccin considera que
la demanda de embarques de aglomerado puede estar relacionado con el nmero de permisos
de construccin emitidos en el municipio durante el trimestre anterior.

El gerente ha recolectado los datos que se muestran en la tabla.

Permisos de Embarques de
construccin (X) conglomerado (Y)
15 6
Ing. Jorge Enrique Vargas Martnez; MAD
4
9 4
40 16
20 6
25 13
25 9
15 10
35 16

- Si se pide determinar una estimacin de los embarques cuando el nmero de permisos
de construccin es 30.

En el siguiente diagrama de dispersin se puede ver que los datos no son perfectamente
lineales; sin embargo, se puede hacer un enfoque lineal sobre este periodo corto.

Embarques de conglomerado
0
2
4
6
8
10
12
14
16
18
0 5 10 15 20 25 30 35 40 45
Permisos X
E
m
b
a
r
q
u
e
s

Y
Embarques de conglomerado (Y)


Se realizan los clculos como se muestra en la siguiente tabla

n X Y XY X
2
Y
2

1 15 6 90 225 36
2 9 4 36 81 16
3 40 16 640 1600 256
4 20 6 120 400 36
5 25 13 325 625 169
6 25 9 225 625 81
7 15 10 150 225 100
8 35 16 560 1225 256
Totales 184 80 2146 5006 950

Se calcula las medias aritmticas de X y Y

= X 23

Ing. Jorge Enrique Vargas Martnez; MAD
5
= Y 10

Se calculan los valores de la pendiente b y la interseccin a:



=
2
2
X n x
XY n xy
b

) 23 )( 23 ( 8 5006
) 10 )( 23 ( 8 2146

= b

b = 0.395

x b Y a =

a = 10 0.395(23)

a = 0.915

Se plantea la ecuacin de la regresin

Y = a + bx

Y = 0.915 + 0.395X

Recordemos que X = permisos; Y = embarques.

Entonces, el nmero de embarques cuando el nmero de permisos de construccin es 30 se
puede encontrar sustituyendo el valor en la ecuacin.

X = 30

Y = 0.915 + 0.395(30)

Y = 12.76 13

El nmero de embarques ser de 13 aproximadamente.

- Desviacin estndar de la regresin

Dados los datos de los permisos y embarques calclese la desviacin estndar de la regresin

En la siguiente grafica se muestra el comportamiento de la desviacin

Ing. Jorge Enrique Vargas Martnez; MAD
6




















Por lo tanto, la desviacin estndar de la regresin es

2
2
.


=

n
XY b Y a Y
S
X y


2 8
) 2146 )( 396 . 0 ( ) 80 )( 91 . 0 ( 950
.


=
X Y
S

=
X Y
S
.
2.2 embarques

- Estimacin del intervalo

Desarrllese una prediccin de intervalo estimada de 95% para el nmero especfico de
embarques que se realizar cuando son emitidos 30 permisos de construccin durante el
trimestre anterior.

Donde el valor de t (de la tabla estadstica) para n-2 = 8-2 = 6 grados de libertad, y dnde
segn tablas:

t = 2.447

Se debe calcular


2
) ( X X






Embarques de conglomerado
0
2
4
6
8
10
12
14
16
18
0 5 10 15 20 25 30 35 40 45
Permisos X
E
m
b
a
r
q
u
e
s

Y
Embarques de conglomerado
Ing. Jorge Enrique Vargas Martnez; MAD
7
X - X (X X)
2

-8.00 64
-14.00 196
17.00 289
-3.00 9
2.00 4
2.00 4
-8.00 64
12.00 144
0.00 774

X= 30 permisos

+ + =
2
2
.
) (
) ( 1
1
X X
X X
n
S S
x y IND


=

+ + =
774
) 23 30 (
8
1
1 2 . 2
2
IND
S 2.40

Intervalo de prediccin = Y
C

t
S
IND


Intervalo de prediccin = 13 2.447 (2.40)

Intervalo de prediccin (inferior) = 13 5.87 = 7.1

Intervalo de prediccin (superior) = 13 + 5.87 = 18.9

7.1< Embarques < 19

S
IND


- Coeficiente de correlacin

( ) | || |
2 2
2
2
) (




=
Y Y n X X n
Y X XY n
r

| || |
2 2
) 80 ( ) 950 ( 8 ) 184 ( ) 5006 ( 8
) 80 )( 184 ( ) 2146 ( 8


= r

= =
7430400
2448
r 0.90




BIBLIOGRAFA

Ing. Jorge Enrique Vargas Martnez; MAD
8
Monks Joseph G. Administracin de operaciones, serie Schaum., 1 edicin, Mxico D.F.,
Mc. Graw Hill., p.p. 170174.

S-ar putea să vă placă și