Documente Academic
Documente Profesional
Documente Cultură
=
2
2
X n x
XY n xy
b
x b Y a =
Desviacin estndar de la regresin
Una lnea de regresin describe la relacin entre un valor dado de la variable independiente X
y la media y.x de la distribucin de probabilidad correspondiente de la variable dependiente
Y. El punto estimado, o pronstico, es la media de la distribucin para un valor dado X.
La desviacin estndar de la regresin S y.x es una medida de la dispersin de los datos
alrededor de la lnea de regresin.
2
2
.
=
n
XY b Y a Y
S
X y
Estimacin de intervalo
Se puede establecer una prediccin de intervalo para un valor pronosticado individual de Y
C
usando la expresin:
Intervalo de prediccin = Y
C
t
S
IND
Donde t = valor de la tabla de la distribucin t para el nivel de confianza especificado, y
Ing. Jorge Enrique Vargas Martnez; MAD
2
+ + =
2
2
.
) (
) ( 1
1
X X
X X
n
S S
x y IND
Para muestras grandes (n100), la ecuacin anterior puede ser aproximada. Usando la
distribucin normal (Z) ms que la , en la forma de Y
C
ZS
Y.X
Tambin la significancia de la
pendiente de la lnea de regresin (b) puede ser probada usando la siguiente expresin.
b
calc
S
b
t =
=
2
.
) (
1
X X
S S
X Y b
donde
Si el valor de t
calc
de la tabla t, la relacin entre X y Y es estadsticamente significativa.
Correlacin
El coeficiente de correlacin lineal simple r es un nmero entre -1 y 1 que indica qu tan bien
describe la ecuacin lineal la relacin entre las dos variables. Como se muestra en la siguiente
figura, r se designa como positiva si Y se incrementa cuando lo hace X, y negativa si Y
decrece al incrementarse X. Una r de cero indica una ausencia de relacin entre las dos
variables.
La desviacin de todos los puntos (Y) de la lnea de regresin (Yc) consiste en la desviacin
contabilizada por la lnea de regresin (explicada) y la variacin aleatoria (no explicada).
Ing. Jorge Enrique Vargas Martnez; MAD
3
Variacin total = explicada + no explicada
+ =
2 2 2
) ( ) ( ) (
c c
Y Y Y Y Y Y
El coeficiente de determinacin r
2
es la razn de la variacin explicada a la variacin total:
=
2
2
2
) (
) (
Y Y
Y Y
r
C
El coeficiente de correlacin r es la raz cuadrada del coeficiente de determinacin:
=
2
2
) (
) (
Y Y
Y Y
r
c
Cuando el tamao de la muestra es lo suficientemente grande (v.g., mayor de 50); el valor de
r puede ser calculado ms directamente con base en:
( ) | || |
2 2
2
2
) (
=
Y Y n X X n
Y X XY n
r
La significancia de cualesquier valor de r puede probarse estadsticamente con una hiptesis
para mostrar que no existe correlacin. Para probarlo, el valor de r es comparado con un valor
de tablas para un tamao de muestra y un nivel de significancia dados.
Ejemplo
El gerente general de una planta de produccin de materiales de construccin considera que
la demanda de embarques de aglomerado puede estar relacionado con el nmero de permisos
de construccin emitidos en el municipio durante el trimestre anterior.
El gerente ha recolectado los datos que se muestran en la tabla.
Permisos de Embarques de
construccin (X) conglomerado (Y)
15 6
Ing. Jorge Enrique Vargas Martnez; MAD
4
9 4
40 16
20 6
25 13
25 9
15 10
35 16
- Si se pide determinar una estimacin de los embarques cuando el nmero de permisos
de construccin es 30.
En el siguiente diagrama de dispersin se puede ver que los datos no son perfectamente
lineales; sin embargo, se puede hacer un enfoque lineal sobre este periodo corto.
Embarques de conglomerado
0
2
4
6
8
10
12
14
16
18
0 5 10 15 20 25 30 35 40 45
Permisos X
E
m
b
a
r
q
u
e
s
Y
Embarques de conglomerado (Y)
Se realizan los clculos como se muestra en la siguiente tabla
n X Y XY X
2
Y
2
1 15 6 90 225 36
2 9 4 36 81 16
3 40 16 640 1600 256
4 20 6 120 400 36
5 25 13 325 625 169
6 25 9 225 625 81
7 15 10 150 225 100
8 35 16 560 1225 256
Totales 184 80 2146 5006 950
Se calcula las medias aritmticas de X y Y
= X 23
Ing. Jorge Enrique Vargas Martnez; MAD
5
= Y 10
Se calculan los valores de la pendiente b y la interseccin a:
=
2
2
X n x
XY n xy
b
) 23 )( 23 ( 8 5006
) 10 )( 23 ( 8 2146
= b
b = 0.395
x b Y a =
a = 10 0.395(23)
a = 0.915
Se plantea la ecuacin de la regresin
Y = a + bx
Y = 0.915 + 0.395X
Recordemos que X = permisos; Y = embarques.
Entonces, el nmero de embarques cuando el nmero de permisos de construccin es 30 se
puede encontrar sustituyendo el valor en la ecuacin.
X = 30
Y = 0.915 + 0.395(30)
Y = 12.76 13
El nmero de embarques ser de 13 aproximadamente.
- Desviacin estndar de la regresin
Dados los datos de los permisos y embarques calclese la desviacin estndar de la regresin
En la siguiente grafica se muestra el comportamiento de la desviacin
Ing. Jorge Enrique Vargas Martnez; MAD
6
Por lo tanto, la desviacin estndar de la regresin es
2
2
.
=
n
XY b Y a Y
S
X y
2 8
) 2146 )( 396 . 0 ( ) 80 )( 91 . 0 ( 950
.
=
X Y
S
=
X Y
S
.
2.2 embarques
- Estimacin del intervalo
Desarrllese una prediccin de intervalo estimada de 95% para el nmero especfico de
embarques que se realizar cuando son emitidos 30 permisos de construccin durante el
trimestre anterior.
Donde el valor de t (de la tabla estadstica) para n-2 = 8-2 = 6 grados de libertad, y dnde
segn tablas:
t = 2.447
Se debe calcular
2
) ( X X
Embarques de conglomerado
0
2
4
6
8
10
12
14
16
18
0 5 10 15 20 25 30 35 40 45
Permisos X
E
m
b
a
r
q
u
e
s
Y
Embarques de conglomerado
Ing. Jorge Enrique Vargas Martnez; MAD
7
X - X (X X)
2
-8.00 64
-14.00 196
17.00 289
-3.00 9
2.00 4
2.00 4
-8.00 64
12.00 144
0.00 774
X= 30 permisos
+ + =
2
2
.
) (
) ( 1
1
X X
X X
n
S S
x y IND
=
+ + =
774
) 23 30 (
8
1
1 2 . 2
2
IND
S 2.40
Intervalo de prediccin = Y
C
t
S
IND
Intervalo de prediccin = 13 2.447 (2.40)
Intervalo de prediccin (inferior) = 13 5.87 = 7.1
Intervalo de prediccin (superior) = 13 + 5.87 = 18.9
7.1< Embarques < 19
S
IND
- Coeficiente de correlacin
( ) | || |
2 2
2
2
) (
=
Y Y n X X n
Y X XY n
r
| || |
2 2
) 80 ( ) 950 ( 8 ) 184 ( ) 5006 ( 8
) 80 )( 184 ( ) 2146 ( 8
= r
= =
7430400
2448
r 0.90
BIBLIOGRAFA
Ing. Jorge Enrique Vargas Martnez; MAD
8
Monks Joseph G. Administracin de operaciones, serie Schaum., 1 edicin, Mxico D.F.,
Mc. Graw Hill., p.p. 170174.