Sunteți pe pagina 1din 28

Error estndar de estimacin

El error estndar es una medida que indica qu tan preciso es el pronstico de y


con base en x o, por el contrario, cun inexacta podra ser la prediccin. El error
estndar de la estimacin se refiere a que no todos los puntos coinciden o estn en
la lnea de regresin, de lo contrario, la prediccin sera perfecta y eso, es
imposible.

El siguiente proceso que se necesita en el anlisis de la regresin lineal simple es


cmo medir la confiabilidad de la ecuacin de estimacin que hemos desarrollado.
El error estndar de estimacin mide la variabilidad o dispersin de los valores
observados alrededor de la lnea de regresin y se representa como Se. Su frmula
es la siguiente:

Cuanto mayor sea el


error estndar de la estimacin, ms grande ser la dispersin (o esparcimiento)
de puntos alrededor de la lnea de regresin. Por el contrario, si Se= 0, se espera
que la ecuacin de estimacin sea un estimador perfecto de la variable
dependiente, en este caso todos los puntos caeran directamente sobre la lnea de
regresin y no habra puntos dispersos, como se muestra en la siguiente figura:

PROCEDIMIENTO PARA REALIZAR UN


ANLISIS DE REGRESIN LINEAL SIMPLE

1. Obtencin de los datos muestrales.

kevin Diaz V.
2. Los datos obtenidos se tabulan. (tener cuidado en determinar
correctamente quien es la variable independiente y dependiente) X Y

3. La informacin se grfica en un diagrama de dispersin, establecindose la


posible relacin entre las dos variables

4. Se calcula la pendiente.

b
kevin Diaz V.
xy nxy
n x 2
x
2

5. Se calcula la ordenada al origen.

a y bx

kevin Diaz V.
6. Se obtiene la ecuacin que mejor se ajusta a la informacin obtenida.

y a bx

7. Se traza la lnea estimada en el diagrama de dispersin.

8. Se calcula el error estndar de estimacin.

y a y b xy n 2
2
Se

Por ejemplo:

Una cadena de Pizzeras toma una muestra de diez de sus sucursales


para tratar de encontrar un modelo matemtico que le permita predecir sus
ventas y obtuvo los siguientes datos: la poblacin de personas en miles fue
de 2, 6, 8, 8, 12, 16, 20, 20, 22, 26; y las ventas trimestrales en miles de pesos
fue de: 58, 105, 88, 118, 117, 137, 157, 169, 169, 149, 202.

Realice una regresin para estimar las ventas de dos sucursales que tienen
14,000 y 30,000 personas como potenciales clientes respectivamente.

Solucin

Datos
n=10
X: Poblacin de personas en miles
Y: Ventas trimestrales en miles de pesos

1. Tabular los datos obtenidos:


Sucur X Y
sal
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 168
9 22 149
1 26 202
0

2. Graficar los datos en un diagrama de dispersin y determinar la posible


relacin entre las variables X Y.

Se puede observar una relacin lineal directa.


3. Realizar los clculos correspondientes

Sucur X Y X
X
2 Y
2
sal Y
1 2 58 116 4 3364
2 6 105 630 36 11025
3 8 88 704 64 7744
4 8 118 944 64 13924
5 12 117 140 144 13689
4
6 16 137 219 256 18769
2
7 20 157 314 400 24649
0
8 20 168 338 400 28224
0
9 22 149 327 484 22201
8
1 26 202 525 676 40804
0 2
140 1300 210 2528 184393
40
4. Calculo de la pendiente.
mi personas
140 14 l
x 10
1300
y 130 pesos
10
mil
Por lo tanto la pendiente es

21040 1014130
b 5
2528 1014
2

5. Calculo de la ordenada al origen.

a 130 514 60
6. Obtener la ecuacin que mejor se ajuste.

y
60 5x
7. Trazar la lnea estimada.

8. Calcular el error estndar de estimacin.

Se 184393 60 1300 5 21040


12.21
10 2

Tiene un error de estimacin de 12,210 pesos.

Para una N = 14,0001


y 60 514 130

14,130

Para una N = 30,000


y 60 530 210

30,210
Diagramas de dispersin con correlacin dbil y fuerte.

Existen dos medidas para describir la correlacin entre dos variables: el


coeficiente de determinacin y el coeficiente de correlacin.
COEFICIENTE MUESTRAL DE DETERMINACIN

La medida ms importante de que tambin ajusta la lnea de regresin


estimada en los datos muestrales en los que esta basada, es el coeficiente de
determinacin muestral, este es igual a la proporcin de la variacin total de
los valores de la variable dependiente, Y, que puede explicarse por medio
de la asociacin de Y con X medida por la lnea de regresin estimada.

El coeficiente de determinacin es la manera primaria de medir el


grado, o fuerza, de la relacin que existe entre dos variables, X y Y.

El coeficiente de determinacin muestral se representa como r2, y mide


exclusivamente la fuerza de una relacin lineal entre dos variables.

El Calculo del coeficiente de determinacin se lleva a cabo con la siguiente


formula:

a y b xy n y 2

r2
y 2

ny2

COEFICIENTE MUESTRAL DE CORRELACIN

La raz cuadrada del coeficiente de determinacin muestral, r 2 , es un


ndice alternativo comn del grado de asociacin entre dos variables
cuantitativas. Esta mediad se llama coeficiente de correlacin muestral (r) y
es un estimador puntual del coeficiente de correlacin poblacional ().

El coeficiente de correlacin muestral es la segunda medida con que


puede describirse la eficacia con que una variable es explicada por otra, as
pues el signo de r indica la direccin de la relacin entre las dos variables X y
Y.
El siguiente esquema representa adecuadamente la intensidad y la
direccin del coeficiente de correlacin muestral.

El calculo del coeficiente de correlacin muestral se lleva a cavo con la


siguiente formula:

r r2
INTERVALO DE CONFIANZA

Debido a que la recta estimada de regresin, no es del todo real, es


necesario elaborar un intervalo de confianza que le de seguridad a nuestros
clculos.

Como se ha visto, cuando se utilice el mtodo de mnimos cuadrados,


los coeficientes de regresin, a y b son estimadores insesgados, eficientes y
consistentes de y , tambin aqu es muchas ocasiones es deseable
establecer intervalos de confianza.

Los intervalos de confianza se calculan con la siguiente frmula:

yc S
y t / , n 2 e
2 gl n
INTERVALO DE PREDICCIN

El intervalo de prediccin, como su nombre lo indica, se utiliza para


predecir un intervalo de valores de Y, dado un valor de X.

El intervalo de prediccin se calcula con la siguiente frmula:



1 X x 2
1
y p y t 2 n 2 Se n x 2 n x 2

PROCEDIMIENTO PARA REALIZAR UN ANLISIS DE CORRELACIN LINEAL


SIMPLE

1. Obtencin y tabulacin de los datos muestrales.

2. La informacin se grfica en un diagrama de dispersin.

3. Calcular la pendiente y ordenada al origen.

4. Se obtiene la ecuacin que mejor se ajusta a la informacin obtenida.

5. Se traza la lnea estimada en el diagrama de dispersin.

6. Calcular el error estndar de estimacin.

7. Calcular el coeficiente de determinacin.

8. Determinar el coeficiente de correlacin.

9. Determinar el intervalo de confianza.

10. Determinar el intervalo de prediccin.


Por ejemplo:

Un gerente de ventas reuni los datos siguientes relacionados con las


ventas anuales en miles de pesos y los aos de experiencia de diez
vendedores. Estime las ventas anuales para un vendedor con 7 aos de
experiencia.

Solucin

1. Obtencin y tabulacin de los datos muestrales.

X: Aos de experiencia
Y: Ventas anuales en miles de pesos.

Vendedor X Y
1 1 8
0
2 3 9
7
3 4 9
2
4 4 1
0
2
5 6 103
6 8 11
1
7 10 11
9
8 10 1
2
3
9 11 1
1
7
10 13 136
70 1080

2. Diagrama de dispersin.
3. Realizar los clculos correspondientes y determinar la pendiente y
ordenada al origen.

Vended X Y XY 2
X Y
2
or
1 1 80 80 1 6400
2 3 97 29 9 9409
1
3 4 92 36 16 8464
8
4 4 10 40 16 10404
2 8
5 6 10 61 36 10609
3 8
6 8 111 88 64 12321
8
7 1 119 119 100 14161
0 0
8 1 123 12 100 15129
0 30
9 1 117 12 121 13689
1 87
10 1 13 17 169 18496
3 6 68
7 10 81 632 119082
0 80 28

1080
y 108
10
70
x 7
10
8128 107108
b 632 107
2

a 108 47 80

4. Ecuacin que mejor se ajusta.

y
80 4x
Para un vendedor con 7 aos de experiencia, sus ventas estimadas seran:

y 80 47 108 ventas anuales


5. Trazo de la lnea estimada en el diagrama de dispersin

6. Calcular el error estndar de estimacin.

Se 11908280 1080 4 8128


4.61
10 2

7. Calcular el Coeficiente de Determinacin.

2 80 1080 4 8128 10 1082


r
119082 10 108
2

2
r 93.03%
El 93% de las ventas anuales se deben a la experiencia de los vendedores y
el 7% restante de debe a otros factores.

8. Calcular el Coeficiente de Correlacin

r 0.9303 0.9645

Este nmero nos indica que las variables X Y tienen una correlacin positiva
intensa.
9. Determinar el intervalo de confianza al 95%.

Considerando
y 108 ventas anuales 4.61
y 108 2.306
c
10
108 3.3617 yc 108 3.3617

104.6383 yc 111.3617

Se puede asegurar con un nivel de confianza del 95% que las ventas de los
vendedores con 7 aos de experiencia estn entre 104.6 y 111.4 miles pesos
anuales.

10. Determinar el intervalo de prediccin para un vendedor con 9 aos


de experiencia se tiene

1 X x 2
y p y t 2 n 2 Se 1
n x 2 n x 2
Sustituyendo: 1 9 7 2

y p 108 2.306 1
10 632 10(7) 2
4.61
108 11.291 108 11.291
yp
96.709 y 119.291
p

Se puede asegurar con un nivel de confianza del 95% que las ventas
pronosticadas de un vendedor con 9 aos de experiencia estn entre 96.71
y 119.3 miles pesos anuales.
Ejercicios propuestos:

1. El jefe del departamento de aguas de una ciudad desea establecer una


relacin entre el consumo mensual domiciliario de agua Y, y el tamao de las
familias X, Dados los datos muestrales, determine:

Galon Tama
es de o
Agua de
familia
.
Y X
65 2
0
120 7
0
130 9
0
43 4
0
14 1
00 2
90 6
0
18 9
00
64 3
0
79 3
3
92 2
5

a) Elabora el diagrama de dispersin.


b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 99%.
i) Determina el intervalo de prediccin 99%
2. El gerente de una compaa de seguros desea establecer la relacin entre
el seguro de vida de las personas Y, y sus salarios X. Realice una regresin con
los datos muestrales:

Segu Salari
ro de o
vida Anual
.
Y X
50 10
80 29
100 30
130 31
150 36

a) Elabora el diagrama de dispersin.


b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 90%.
i) Determina el intervalo de prediccin 90%

3. Un economista desea establecer la relacin entre la tasa de desempleo Y, y


la tasa de cuentas vencidas de la Tesoreras, Determine la regresin y
correlacin con los datos muestrales.

Y X
6.7 9.7
7.3 9.8
8.9 7.6
9.1 6.1
7.2 10.2
5.2 12.7
6.9 14.3
6.9 7.9

7.1 8.9

1. Elabora el diagrama de dispersin.


2. Calcula la pendiente y ordenada al origen.
3. Obtener la ecuacin que mejor se ajusta a los datos.
4. Traza la lnea estimada en el diagrama de dispersin.
5. Calcula el error estndar de estimacin.
6. Calcula el coeficiente de determinacin.
7. Determina el coeficiente de correlacin.
8. Determina el intervalo de confianza al 95%.
9. Determina el intervalo de prediccin 95%

4. Un director de ventas desea establecer la relacin entre las ventas del


segundo ao de vendedores Y, y sus ventas del primer ao X. Realice un
anlisis de regresin.

Y 6 7 8 1 1 13
9 5 6 1 2 3
1 9
X 17 13 8 1 11 13
0 3 6 6 2 3
1

a) Elabora el diagrama de dispersin.


b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 95%.
i) Determina el intervalo de prediccin 95%

5. Un gerente de comercializacin desea establecer la relacin entre las


ventas Y, y el precio de un producto similar fabricado por la competencia
X, Realice un anlisis de correlacin.

Vent Precio de
as competenc
ia
Y X
520 13
550 13
600 15
610 15
620 16
724 21
680 21
300 14
962 40
270 12
1. Elabora el diagrama de dispersin.
2. Calcula la pendiente y ordenada al origen.
3. Obtener la ecuacin que mejor se ajusta a los datos.
4. Traza la lnea estimada en el diagrama de dispersin.
5. Calcula el error estndar de estimacin.
6. Calcula el coeficiente de determinacin.
7. Determina el coeficiente de correlacin.
8. Determina el intervalo de confianza al 99%.
9. Determina el intervalo de prediccin 99%

6. Se hizo una encuesta a una muestra de 10 los estudiantes de 3er. Semestre


de la carera de Lic. En administracin del grupo 1301 del semestre 2009-1 y se
encontraron los siguientes datos:

Estudian Altura Peso


te (mts) (Kg)
1 1.50 48
2 1.54 50
3 1.60 52
4 1.72 70
5 1.80 72
6 1.50 50
7 1.61 57
8 1.54 54
9 1.63 80
10 1.70 62
a) Elabora el diagrama de dispersin.
b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 95%.
i) Determina el intervalo de prediccin 95%
7. Los datos siguientes muestran las ventas (en miles de cajas) y los costos de
un anuncio publicitario para la televisin (en millones de pesos) para 7 marcas
principales de refrescos.
Marca Gastos de Ventas de
publicidad cajas
($) (miles)
Coca- 13.0 19.3
Cola
Pepsi- 9.4 13.8
Cola
Sprite 6.4 8.4
Diet 5.7 5.5
Coke
7-Up 4.2 5.9
Jarritos 2.9 5.3
Boing 1.6 2.5
a) Dibuje el diagrama de dispersin, que parece indicar este diagrama
acerca de la relacin entre las dos variables?
b) Trace una recta que pase por los datos, para aproximar una relacin
lineal entre los gastos del anuncio y las ventas.
c) Aplique el mtodo de los cuadrados mnimos para plantear la ecuacin
estimada de regresin.
d) Prediga las ventas para una marca que decida gastar $7 millones de
pesos en un anuncio publicitario.
e) Calcule el error estndar en la regresin.
f) Calcule el coeficiente de determinacin y correlacin e interprtelos.
g) Determina el intervalo de confianza al 95%.
h) Determina el intervalo de prediccin 95%

8. La revista del consumidor publico en su nmero 381 del mes de noviembre


del 2008 la siguiente informacin acerca del uso de los telfonos celulares:

A Usuarios que
o compran tiempo aire
en (miles de
usuario
s)
20 1628
00
20 1784
01
20 2006
02
20 2029
03
20 2508
04
20 3268
05
20 4035
06
20 5199
07
a) Trace un diagrama de dispersin para estos datos,
b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Trace una recta que pase por los datos, para aproximar una relacin
lineal entre la altura y el peso.
d) Prediga cuantos usuarios compraran tiempo aire para su telfono
celular para el ao 2009.
e) Calcule el error estndar en la regresin.
f) Calcule el coeficiente de correlacin y el coeficiente de determinacin e
interprtelos.
g) Determina el intervalo de confianza al 92%.
h) Determina el intervalo de prediccin 92%

9. Un vendedor de Century 21 desea establecer la relacin entre el tiempo en


meses que estn a la venta los departamentos antes de lograr su venta y el
precio pedido por ellos. Los datos de una muestra de 9 departamentos se
muestran a continuacin:

Meses en venta 6. 7.0 8. 1 9.0 9 8. 10 15.


5 6 2 . 6 .6 0
.1 5
Precio pedido (en 80 100 99 12 140 11 9 9 125
miles de pesos) 0 0 0 50 0 0 9 9 0
0 0 0

a) Trace un diagrama de dispersin para estos datos,


b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Prediga cuanto tiempo se tardara en vender un departamento que
cueste $ 1500,000 pesos.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin e
interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%
10. El Orgamismo Operador de agua en el Muncipio de cuautitln Izcalli
OPERAGUA quiere conocer la relacin entre en consumo mensual domiciliario
de agua y el tamao de las familias, toma una muestra de 10 familias elegidas
al azar y encuentra los siguientes datos:

Metros cbicos 6 12 13 4 14 9 18 6 7 9
consumidos 5 0 0 3 0 0 0 4 9 2
Tamao de la 2 7 9 4 12 6 9 3 3 4
familia
a) Trace un diagrama de dispersin para estos datos,
b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Prediga cuantos metros cbicos al mes consumir una familia que
tiene 10 miembros.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin e
interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%

11- El gerente de una mueblera FAMSA quiere conocer la relacin de las


ventas logradas por un vendedor en dos aos, toma una muestra de 8
vendedores que lograron la etiqueta de (vendedor del mes) y encontr los
siguientes datos:

Unidades vendidas en el ao 2007 17 1 8 16 11 1 1 8


0 3 6 1 2 3 3 2
3 3 6
Unidades vendidas en el ao 2006 9 9 5 8 9 8 1 1
9 5 0 0 2 8 3 0
0 0
a) Trace un diagrama de dispersin para estos datos,
b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Calcule el error estndar en la regresin.
d) Calcule el coeficiente de correlacin y el coeficiente de determinacin e
interprtelos.
e) Determina el intervalo de confianza al 95%.
f) Determina el intervalo de prediccin 95%
12. Segn el INEGI los nacimientos registrados en el pas en el 2007 fueron:

Nacimientos
Mes de Registrados
registro
1 Enero 220,670
2 Febrero 211,330
3 Marzo 213,299
4 Abril 270,819
5 Mayo 225,298
6 Junio 205,572
7 Julio 211,180
8 Agosto 249,626
9 Septiembre 220,666
10 Octubre 241,529
11 211,857
Noviembre
12 173,237
Diciembre
a) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
b) El INEGI reporto que en julio de 2007 se registraron 211,330
nacimientos, utiliza la ecuacin obtenida y predice cuantos debieron
de haberse registrado en ese mes, compara resultados y obtn tus
conclusiones.
c) Estime cuantos nacimientos se registraron en enero de 2008.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%

S-ar putea să vă placă și