Sunteți pe pagina 1din 49

Pronsticos

Segundo Parcial
Andrea Cujilema
Sangolqu 2015

Actividad de aprendizaje 2.1.


Del libro base, resuelva los siguientes problemas del captulo 6,
desde la pgina 254 hasta la 265:
# 1, #7, #13, #21

Problema 1:
Cul de las siguientes situaciones es inconsistente?
a) Y = 499 + 0,21X y r = 0,75
b) Y = 100 + 0,9X y r = -0,70
c) Y = -20 + 1X y r = 0,40
d) Y = -7 - 4X y r = -0,90
Como conocemos, existe relacin entre la pendiente b 1 y el coeficiente r si
sus signos son iguales, es decir, una relacin lineal existente entre las
variables X e Y que se est analizando, esto en un modelo de regresin
lineal Y = bo + b1X.
De acuerdo a lo anterior, de las alternativas planteadas, solo el caso (b) es
inconsistente, esto debido a que tenemos para b 1 = 0,9 y para r = -0,70 y
como podemos ver tienen signos diferentes, lo cual no es vlido y por esto
esta situacin es inconsistente.

Problema 7:
En la tabla P.7 se muestra la informacin proporcionada por un
negocio de rdenes por correo para 12 ciudades.
A continuacin se presenta la tabla de clculos.
Ciudad

N Recibidas

Repartidas

X.Y

24

144

36

576

16

32

256

23

115

25

529

15

15

225

32

10

320

100

1024

25

175

49

625

18

15

270

225

324

18

54

324

35

11

385

121

1225

34

13

442

169

1156

15

30

225

32

12

384

144

1024

Sumas:

287

87

2366

887

7513

a) Determine si existe una relacin lineal significativa entre estas 2


variables. (Prubalo con un nivel 0,05 de significancia).
Calculando el coeficiente de correlacin tenemos:

n. XY X . Y

n. X 2 X n. Y 2 Y
2

12 2366 87 287
12 887 87 12 7513 287
2

3423
3075 7787

r 0,6995

De acuerdo al resultado, se videncia una relacin lineal positiva existencia


de una moderada entre las variables analizadas.
A continuacin se realiza Prueba de significancia para el coeficiente r.
Primero se realiza el planteo de hiptesis:
Ho : 0
H1 : 0

Estadstico de prueba:
t

r. n 2
1 r

0,6995. 12 2
1 0,6995 2

3,095

Estadstico t crtico.
Para = 0,05 de 2 colas y n-2 = 10gl: tc = 2,228

Regla de decisin:
Rechazamos Ho si t esta fuera de 2,228, de lo contrario la aceptamos.

Debido a que t = 3,095 est fuera del intervalo de 2,228, rechazamos Ho,
concluimos entonces que al nivel de significancia del 5% existe una
correlacin lineal significativa entre las variables analizadas.

b) Determine la lnea de regresin ajustada.


Lnea de regresin: Y = bo + b1X

Clculo de la pendiente de la recta:

b1

n. XY X . Y
n. X 2 X

12 2366 87 287 3423

1,1132
3075
12 887 87 2

Ordenada al origen.

b0

Y b . X
1

287 1,1132 87

15,8462
12
12

Ecuacin de regresin:
Y = 15,8462 + 1,1132.X

c) Calcule el error estndar de estimacin.

S y.x

b0 . Y b1 . XY
n2

7513 15,8462 287 1,1132 2366


5,7559
12 2

De acurdo al resultado, existe un alto grado de dispersin de los datos.

d) Elabore una tabla ANOVA.


A continuacin se presenta la tabla de clculos.
Y

Y'

(Y-Y')

(Y-Ym)

24

22,53

2,1750

0,0069

16

18,07

4,2953

62,6736

23

21,41

2,5216

0,8403

15

16,96

3,8391

79,5069

32

10

26,98

25,2216

65,3403

25

23,64

1,8540

1,1736

18

15

32,54

211,5204

35,0069

18

19,19

1,4059

35,0069

35

11

28,09

47,7335

122,8403

34

13

30,32

13,5616

101,6736

15

18,07

9,4404

79,5069

32

12

29,20

7,8163

65,3403

331,3847

648,9167

Sumas:

Variacin total:
SST

Y Y

SSE

Y Y '

648,9167

Variacin de error:
2

331,3847

Variacin de la regresin:
SSR SST SSE 648,9167 331,3847 317,532

A continuacin se presenta la Tabla ANOVA:


Fuente
Regresin
Error
Total

gl
k=1
n-(k+1)= 10
n-1= 11

SS
SSR=317,532
SSE=331,3847
SST=648,9167

MS
SSR/k=317,532
SSE/10=33,138

Valor F
9,582

e) Qu porcentaje de la variacin en las rdenes por correo se


explica por el nmero de catlogos repartidos?
r 2 0,6995 2 0,4893

Concluimos que solo el 48,93% de la variacin en las rdenes por correo se


explica por el nmero de catlogos repartidos.

f) Realice la prueba de hiptesis para determinar si la pendiente o


coeficiente de regresin es significativamente diferente a cero.
(Utilice el nivel 0,01 de significancia).
Primero realzamos el planteo de hiptesis:
Ho : 1 0
H 1 : 1 0

Error estndar para el coeficiente de regresin.


S b1

S y.x

(X X )
S b1

S y. x

5,7559
887 87 2 / 12

X / n
2

0,3596

Estadstico de prueba:

b1
1,1132

3,096
S b1 0,3596

Estadstico t crtico:
Para = 0,01 de 2 colas y n-2 = 10gl: tc = 3,169

Regla de decisin:
Rechazamos Ho si t esta fuera del intervalo 3,169

Como t = 3,096, est dentro del intervalo 3,169 aceptamos Ho, entonces
al nivel de significancia del 1% se concluye que el coeficiente de regresin
no es diferente de cero en forma significativa.

g) Prueba la significancia de la regresin usando la estadstica F de


la tabla ANOVA. (Use el nivel de significancia de 0,01) Es el
resultado consistente en el punto f? Debe serlo?
Primero planteamos de hiptesis para la prueba global.
Ho: 1 0

La variable nmero de catlogos repartidos no es explicativa significativa.


Ha: 1 0 La variable X es explicativa.

Nivel de significancia: = 0,01

Para realizar la prueba global, aplicamos la distribucin F.


Estadstico de prueba (del literal d):
F

SSR / k
317,532 / 1

9,582
SSE /( n k 1) 331,3847 / 10

Estadstico F crtico:
Para k = 1gl en el numerador y n-k-1 = 10gl en el denominador: Fc = 10,0

Regla de decisin:
Si F > 10,0 se rechazamos Ho

El valor de es F = 9,582, y siendo menor que 10,0 aceptamos Ho, entonces


con un nivel de significancia del 1% concluimos que el nmero de catlogos
repartidos no es explicativa significativa.

h) Pronostique el nmero de rdenes por correo recibidas cuando se


han repartido 10 mil catlogos con un intervalo para la prediccin
de 90% de confianza.
Estimacin puntual:
Y = 15,8462 + 1,1132(10)
Y = 26,98 miles de rdenes.
Estimamos que se recibirn 26,98 miles de ordenes por correo.

Error estndar del pronstico:


Sf S y . x 1

X X
X X
2

10 87 / 12 6,0727
1

12 887 87 2 / 12
2

5,7566 . 1

Intervalo de prediccin:
IP = Y t.Sf
Para el 90% y n-2 = 10gl: t = 1,812
IP = 26,98 1,812 x 6,0727 = 26,98 11,00
LI = 26,98 11 = 15,98
LS = 26,98 + 11 = 37,98

Cuando se reparten 10 mil catlogos, tenemos la confianza de que el


nmero de rdenes recibidas estarn comprendidas entre 15,98 y 37,98
miles.

Problema 13:
Harry Daniels es un ingeniero de control de calidad de Specific
Electric Corporation, una empresa dedicada a fabricar motores
elctricos.
Uno de los pasos en el proceso de manufactura implica el uso de
una fresadora automtica para hacer las ranuras en el eje de los
motores.
Cada lote de ejes de motor se prueba y todos los ejes que no tengan
las dimensiones requeridas se desechan. La fresadora debe
reajustarse al comenzar a trabajar con cada nuevo lote porque su
cabeza cortadora se desgasta ligeramente durante la produccin.
A Harry se le asigna el trabajo de pronosticar cmo afecta el tamao
de un lote al nmero de ejes defectuosos en el lote, de manera que
pueda seleccionar el mejor tamao de lote.
l recopila los datos del tamao promedio del lote de los 13 lotes
considerados en la tabla P-13 y le pide a usted analizarla.
A continuacin se presenta la tabla de clculos.
Lote

N de defectos

Tamao

X.Y

25

100

625

16

50

400

2500

64

75

450

5625

36

16

100

1600

10000

256

22

125

2750

15625

484

27

150

4050

22500

729

36

175

6300

30625

1296

49

200

9800

40000

2401

53

225

11925

50625

2809

10

70

250

17500

62500

4900

11

82

275

22550

75625

6724

12

95

300

28500

90000

9025

13

109

325

35425

105625

11881

Sumas:

577

2275

141350

511875

40621

a) Diagrama de dispersin.

De acuerdo al grfico, podemos observar una relacin lineal positiva entre el


lote de produccin y el nmero de defectos.

b) Lnea de regresin lineal simple: Y = bo + b1X


Clculo de la pendiente de la recta de regresin.

b1

n. XY X . Y
n. X X
2

13 141350 2275 577


524875

0,3549
2
1478750
13 511875 2275

Clculo de la ordenada al origen.

b0

Y b . X
1

577 0,3549 2275

17,7308
13
13

Ecuacin de regresin:
Y = -17,7308 + 0,3549.X

c) Prueba de significancia con = 5% para la pendiente de la


regresin, b1.
Primero planteamos las hiptesis:
Ho : 1 0
H 1 : 1 0

Error estndar de estimacin:

S y.x

b0 . Y b1 . XY
n2

40621 17,7308 577 0,3549 141350


13 2

S y . x 7,9003

Error estndar para el coeficiente de regresin:


S b1

S y. x

X 2 X / n
2

7,9003
511875 2275 2 / 13

0,0234

Estadstico de prueba:

b1
0,3549

15,1509
S b1 0,0234

Estadstico t crtico.
Para = 0,05 de 2 colas y n-2 = 11gl: tc = 2,201

Regla de decisin:
Si t esta fuera del intervalo 2,201 rechazamos Ho.

Debido a que t = 15,15 y est fuera del intervalo 2,201, rechazamos Ho, y
concluimos que a nivel de significancia del 5% el coeficiente de regresin es
significativamente diferente de cero.
d) Examinar los residuales.

En el grfico se puede observar que tenemos arcos de residuales positivos,


seguidos por residuales negativos y seguidos finalmente por residuales
positivos, es decir que no hay una relacin lineal entre X e Y.

e) Desarrollar un modelo curvilneo y mediante transformacin de X


ajustar a un modelo de regresin lineal simple.
Al transformar X a X2, tenemos un nuevo grfico de dispersin.

Como podemos ver en el grfico, existe una relacin lineal positiva.

El modelo de regresin lineal simple ser: Y = bo + b 1X2


De acuerdo a los nuevos clculos tenemos: Y = 4,6973 + 0,001.X 2

f) Prueba de significancia con = 5% para la pendiente de la


variable transformada, b1.
Realizamos el planteamiento de las hiptesis:
Ho : 1 0
H 1 : 1 0

Error estndar del coeficiente de regresin:

S b1 1,93 10 5

Estadstico de prueba:

b1
0,001

51,813
S b1 1,93 10 5

Estadstico t crtico.
Para = 0,05 de 2 colas y n-2 = 11gl: tc = 2,201

Regla de decisin:
Si t esta fuera de 2,201 rechazamos Ho

Como t = 51,813 est fuera de 2,201 rechazamos Ho, y concluimos que a


un nivel de significancia del 5% el coeficiente de regresin es diferente de
cero significativamente, para el modelo lineal con variable transformada.

g) Examinar los residuales.

En el grfico se observa que la dispersin es constante, y la variabilidad del


error es constante y la relacin con X2 ahora es lineal.

h) Pronostico de defectuosos para un lote de produccin con X =


300 piezas.
Y = 4,6973 + 0,001(300)2
Y = 4,6973+90 = 94,6073 95

Como podemos ver, para un lote de produccin con X = 300 piezas, se


estima que habrn 95 piezas defectuosas, entonces preferimos el modelo
original por ser ms preciso el modelo con variable transformada a X.

i) Informe.
Del anlisis anterior, sabemos que la cantidad de piezas defectuosas
presenta una relacin curvilnea positiva respecto al tamao del lote de
produccin, y si se desea tener una mejor ecuacin de regresin para
pronsticos, podemos transformar X a X2.

Problema 21:
En el contexto del ejemplo 2-13 se presenta la tabla 2-8 con los
datos sobre el costo real (Y) y el costo estimado (X), en millones de
dlares, para n = 26 proyectos de construccin. La figura 2-17
muestra la grfica de la lnea ajustada para estos datos.
A continuacin se muestra la tabla de clculos.

Fila

Real

Estimado

XY

0,918

0,575

0,52785

0,330625

0,842724

7,214

6,127

44,20018

37,54013

52,0418

14,577

11,215

163,4811

125,7762

212,4889

30,028

28,195

846,6395

794,958

901,6808

38,173

30,1

1149,007

906,01

1457,178

15,32

21,091

323,1141

444,8303

234,7024

14,837

8,659

128,4736

74,97828

220,1366

51,284

40,63

2083,669

1650,797

2630,049

34,1

37,8

1288,98

1428,84

1162,81

10

2,003

1,803

3,611409

3,250809

4,012009

11

20,099

18,048

362,7468

325,7303

403,9698

12

4,324

8,102

35,03305

65,6424

18,69698

13

10,523

10,73

112,9118

115,1329

110,7335

14

13,371

8,947

119,6303

80,04881

178,7836

15

1,553

3,157

4,902821

9,966649

2,411809

16

4,069

3,54

14,40426

12,5316

16,55676

17

27,973

37,4

1046,19

1398,76

782,4887

18

7,642

7,65

58,4613

58,5225

58,40016

19

3,692

13,7

50,5804

187,69

13,63086

20

29,522

29,003

856,2266

841,174

871,5485

21

15,317

14,639

224,2256

214,3003

234,6105

22

5,292

5,292

28,00526

28,00526

28,00526

23

0,707

0,96

0,67872

0,9216

0,499849

24

1,246

1,24

1,54504

1,5376

1,552516

25

1,143

1,419

1,621917

2,013561

1,306449

26

21,571

38,936

839,8885

1516,012

465,308

376,498

388,958

9788,756

10325,3

10064,45

Sumas:

a) Reanalice los datos de costos usando un modelo de regresin


lineal simple. Elabore una grfica de los residuos contra los valores
ajustados.
Clculo de la pendiente de la recta de regresin.

b1

n. XY X . Y
n. X X
2

26 9788,756 388,958 376,498 108065,7469

0,9223
117169,4742
26 10325,3 388,958 2

Ordenada al origen.

b0

Y b . X
1

Ecuacin de regresin:

376,498 0,9223 388,958

0,6831
26
26

Y = 0,6831 + 0,9223.X

En el grafico se observa a los residuos distribuidos en forma aleatoria


alrededor del valor promedio cero, lo que indica que el modelo no tiene
problemas de autocorrelacin.
b) Es significativa la regresin del costo real sobre el costo
estimado? Justifique su respuesta.
Calculando en Excel tenemos:
Variacin total:
SST

Y Y

SSE

Y Y '

4612,493

Variacin de error:
2

779,057

Variacin de la regresin:
SSR SST SSE 4612,493 779,057 3833,436

A continuacin se muestra la tabla ANOVA.


Fuente
Regresin
Error
Total

Gl
k=1
n-(k+1)= 24
n-1= 25

SS
SSR=3833,436
SSE=779,057
SST=4612,493

MS
SSR/k=3833,436
SSE/10=32,461

Valor F
118,095

Se realiza el planteamiento de la hiptesis para la prueba global.


Ho: 1 0 El modelo de regresin no es explicativa significativa.
Ha: 1 0 El modelo de regresin es significativo.
Nivel de significancia: Sea = 0,05
Para realizar la prueba global, aplicamos la distribucin F.

Estadstico de prueba:
F

SSR / k
118,095
SSE /( n k 1)

Estadstico F crtico.
Para k = 1gl en el numerador y n-k-1 = 24gl en el denominador: Fc = 4,26

Regla de decisin:
Si F > 4,26 rechazamos Ho.
Como F = 118,095 es mayor que 4,26 rechazamos Ho, concluimos entonces
que a un nivel de significancia del 5% el modelo de regresin es
significativo.

c) Identifique e interprete r2.

n. XY X Y

n X X n Y Y
2

r
2

26 9788,756 388,958 376,498 2

26 10325,3 388,958 26 10064,45 376,498


2

108065,7469 2
117169 .4742 119924 ,956

r 2 0,831

Entonces el 83,1% de la variacin en los costos reales corresponden a las


variaciones en los costos estimados.

d) Cules son los valores apropiados de los coeficientes de la


pendiente y de la interseccin de la funcin de regresin de la
poblacin si el costo estimado es un factor de pre-diccin perfecto
del costo real esperado? Son congruentes los coeficientes
estimados en la ecuacin de la lnea recta ajustada con estos
valores? Disctalo.
Los coeficientes para la muestra permiten estimar los coeficientes de
regresin para la poblacin, as: b 0,6831 y b 0,9223 .
0

e) Considere la grfica de los residuos contra los valores ajustados.


Parece como si los costos estimados fueran, en general, factores
de prediccin ms exactos de los costos reales de los proyectos
relativamente baratos que de los proyectos de alto costo? Por qu?
Observando el grfico de residuos, podemos decir que los costos estimados
son pronsticos ms exactos de los costos reales en caso de proyectos ms
baratos que para proyectos de mayor costo, ya que sus niveles de error son
menos en el caso de costos bajos y mayores para costos reales altos.

Actividad de aprendizaje 2.2.


Del libro base, resuelva los siguientes problemas del captulo 7,
desde la pgina 313 hasta la 324:
# 5, #13, #15, #21

Problema 5:
La ecuacin de regresin mltiple es
Pronostique el valor de Y si X1 = 20 y X2 = 7.

Y 7,52 3 X 1 12,2 X 2 .

Y 7,52 3( 20) 12,2(7) 7,52 60 85,4 17,88

El valor estimado de Y para las condiciones dadas es -17,88.

Problema 13:
El gerente de ventas de Hartman Auto Supplies decide investigar
una nueva variable dependiente, la del ingreso personal por regin

(vea el problema 12). Los datos para esta nueva variable se


presentan en la tabla P.13.
a) El ingreso personal por regin tiene alguna contribucin en el
pronstico de ventas?
Modelo del problema 12 del libro gua:
Regin

Ventas Anuales

N Minoristas

N Automviles Registrados

X1

X2

52,3

2011

24,6

26

2850

22,1

20,2

650

7,9

16

480

12,5

30

1694

46,2

2302

11,5

35

2214

20,5

3,5

125

4,1

33,1

1840

8,9

10

25,2

1233

6,1

11

38,2

1699

9,5

Se presentan los resultados en Excel para la regresin lineal para ventas


con 2 variables independientes.

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0,74247
0,55126
0,43908
10,3051
11

Anlisis de Varianza
Regresin

Grados de
libertad
2

Suma de
cuadrados
1043,66474

Promedio de los
cuadrados
521,832369

F
4,913882

Residuos

849,564353

10

1893,22909

Coeficientes

Error tpico

Estadstico t

Probabilidad

Intercepcin

10,1092596

7,21955658

1,40026046

0,1990042

X1

0,01098889

0,00520014

2,11319237

0,067537

X2

0,19466034

0,63984403

0,30423093

0,7687152

Total

106,195544

La ecuacin de regresin mltiple es la siguiente:

El coeficiente para este modelo de regresin es:


r2 = 0,5513
Se concluye que solo el 55,13% de las variaciones en las ventas se explica
por el modelo analizado, el bajo valor del estadstico F = 4,91 seala que no
es un modelo confiable para realizar las estimaciones de las ventas.
Resolvemos entonces el planteamiento anterior con una nueva variable
aleatoria X3, que corresponde al ingreso personal por regiones:
Regin

Ventas
Anuales

N
Minoristas

N Autos
Registrados

Ingreso
Personal

X1

X2

X3

52,3

2011

24,6

98,5

26

2850

22,1

31,1

20,2

650

7,9

34,8

16

480

12,5

32,7

30

1694

68,8

46,2

2302

11,5

94,7

35

2214

20,5

67,6

3,5

125

4,1

19,7

33,1

1840

8,9

67,9

10

25,2

1233

6,1

61,4

11

38,2

1699

9,5

85,6

Se presentan los resultados en Excel para el nuevo modelo de regresin


lineal mltiple:

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Anlisis de la Varianza
Grados de
libertad
Regresin
3
Residuos
7
Total
10

Intercepcin
X1
X2
X3

Coeficiente
s
-3,9177
0,002384
0,457426
0,400576

0,98675
0,97368
0,9624
2,66798
11

Suma de
cuadrados
1843,40225
49,8268428
1893,22909

Promedio de
los cuadrados
614,467416
7,1181204

Error tpico

Estadstico t

Probabilidad

2,29017316
0,00157212
0,16749929
0,03779143

-1,71065744
1,51647668
2,73091448
10,5996389

0,13088453
0,17318193
0,02929997
0,000014555

F
86,3243921

La ecuacin de regresin lineal mltiple para el nuevo modelo es:

El coeficiente de determinacin para este nuevo modelo es:


r2 = 0,9737,
Esto nos indica que el 97,37% de las variaciones en las ventas se explican
por este nuevo modelo, el nuevo valor de F se ha incrementado
considerablemente, y concluimos que este es un modelo muy confiable para
estimar de las ventas adems de que el ingreso personal contribuye
considerablemente en el pronstico de ventas.
b) Pronostique las ventas anuales de la regin 12 con un ingreso
personal de 40 mil millones de dlares, usando las tres variables
independientes.
Procedemos a pronosticar las ventas anuales utilizando:
X1 = 2500 puntos de venta
X2 = 20,2 millones de autos registrados
X3 = 40 mil millones de dlares.

Y 3,9177 0,0024( 2500) 0,4574( 20,2) 0,4006( 40) 27,3458

La estimacin de ventas bajo los valores detallados es de 27,35 millones US$

c) Discuta sobre la exactitud del pronstico realizado en el inciso b.


De acuerdo al modelo de regresin lineal mltiple inicial, podemos afirmar
que el pronstico de ventas obtenido es bastante preciso.

d) Qu variables independientes
pronostico final? Por qu?

incluira

en

su

modelo

de

A continuacin se presentan los distintos coeficientes de regresiones de


acuerdo a cada variable:

Variables

Coeficiente r

X1

0,5461

X2

0,3008

X3

0,8768

X1 y X2

0,5513

X1 y X3

0,9456

X2 y X3

0,965

X1, X2 y X3

0,9737

De acurdo al cuadro presentado, concluimos que para una mayor precisin


en los pronsticos de las ventas, el modelo debe incluir las 3 variables
independientes, tambin se puede trabajar con dos variables y aunque los
resultados sern menos precisos, el modelo deber incluir necesariamente
las variables X2 y X3.

Problema 15:
Cabe esperar que las compras con tarjeta de crdito sean diferentes
de las compras en efectivo en la misma tienda. La tabla P-15 indica
las ventas diarias brutas y los artculos vendidos que se pagan en

efectivo, as como las ventas diarias brutas en efectivo y los


artculos vendidos que se pagan con tarjetas de crdito en la misma
tienda de consignacin por 25 das consecutivos.
Compras efectivo

Con tarjeta crdito

Da

Ventas

artculos

Ventas

Artculos

348

55

148

42

111

61

62

94

16

60

11

39

165

26

126

27

143

26

111

19

27

26

14

10

100

18

71

12

11

180

27

116

21

12

212

36

50

13

58

10

13

14

115

20

105

16

15

15

19

16

97

15

44

14

17

61

10

18

85

15

24

19

157

24

144

10

20

88

15

63

11

21

96

19

22

202

33

14

23

108

23

24

158

21

24

25

176

43

253

28

a) Elabore un diagrama de dispersin de las ventas brutas diarias,


Y, contra artculos vendidos que se pagan en efectivo. Usando otros
smbolos, o bien, colores diferentes, agregue las ventas brutas
diarias y los artculos vendidos que se pagan con tarjeta de crdito.
Compare visualmente la relacin entre las ventas y el nmero de

artculos vendidos que se pagan en efectivo con los pagados con


tarjeta de crdito.

Como podemos ver que las ventas en efectivo son similares a las ventas con
tarjeta aunque estas ltimas tienen una mayor dispersin de datos, para
cada situacin existe una relacin lineal.

b) Defina la variable ficticia.


1 si paga compras en efectivo
0 si paga compras con tarjeta

X2

Y ajuste el modelo de regresin.


Y 0 1 X 1 2 X 2

Se presentan los resultados de Excel.


Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2

0,91007
0,82822

R^2 ajustado
Error tpico
Observaciones

Anlisis de la Varianza
Grados de
libertad
Regresin
2
Residuos
47
Total
49
Coeficientes
Intercepcin
X1
X2

0,82091
30,9661
50

Suma de
Promedio de los
cuadrados
cuadrados
217295,146
108647,573
45068,3739
958,901572
262363,52
Error tpico

13,5777824 7,06864026
5,99768458 0,44365731
-19,01027
10,448106

Estadstico t
1,92084785
13,5187328
-1,81949436

F
113,304197

Probabilida
d
0,0608287
8,23E-18
0,07520897

Ecuacin de regresin:
Y 13,5778 5,9977 X 1 19,0103 X 2

La pendiente de X2 tienen un valor negativo, lo que se interpreta como que


una compra pagada en efectivo es 19,01 US$ menos costoso que cuando se
paga con tarjeta.

c) Analice el ajuste del inciso


El coeficiente de este modelo es:
r2 = 0,8282
Lo que indica que el 82,82% de las variaciones en las ventas se explican por
la ecuacin de regresin; el valor de F = 113,30 indica que podemos
realizar pronsticos confiables, pero si analizamos las pendientes de cada
variable podemos concluir que solo X1 es significativa en el modelo.
Al analizar los residuales, verificamos que las ventas pagadas con tarjeta de
crdito (X2 = 0) presentan un mayor grado de dispersin que las ventas
pagadas en efectivo, lo que ya se descubri en como ya se haba visto en el
literal (a).

El modelo no es satisfactorio en su totalidad.


d) Con base en el modelo ajustado del inciso b), elabore un
pronstico de las ventas diarias para un individuo que compra 25
artculos y paga en efectivo. Para una muestra grande, construya un
intervalo de prediccin del 95% para las ventas diarias.
El pronstico puntual para esta compra ser de:
Y 13,5778 5,9977( 25) 19,0103(1) 24,58

Para una prediccin del 95% para muestras grandes, el intervalo ser:
Sy.x = 30,9661
IP = Y t * Sy.x
Para el 90% y n-2 = 48gl: t = 2,01
IP = 24,58 2,01 x 30,9661 = 24,58 62,24
LI = 24,58 62,24 = -37,66 0
LS = 24,58 + 62,24 = 86,82
Existe el 90% de confianza que el valor de las compras para las condiciones
dadas estar comprendido entre 0 y 86,82 dlares.
e) Describa la naturaleza de la funcin ajustada del inciso b). Cree
usted que es mejor justar dos lneas rectas separadas, una para las
ventas en efectivo y otra para las ventas con tarjeta de crdito, para
los datos de la tabla P-15? Disctalo.
Este anlisis se desarroll previamente en el literal (c), donde se determin
que la variable ficticia X2 no es muy significativa para el modelo, por esto se
la puede eliminar, entonces resulta adecuado ajustar dos rectas separadas a
los datos, una para ventas en efectivo y otra para ventas con tarjeta de
crdito.
Problema 21:

La tabla P-21 contiene el numero de cuentas (en miles) y los activos


(en miles de millones de dolares) de 10 corredurias de bolsa online.
Grafique los activos contra el numero de cuentas. Investigue la
posibilidad de que la relacion sea curva elaborando una regresion
multiple para pronosticar los activos, considere el numero de
cuentas y el numero de cuentas elevado al cuadrado como variables
independientes.
Iniciamos con el diagrama de dispersin.

Podemos ver una relacin curvilnea entre las variables.

a)Proporcione la funcion de regresion ajustada. Es significativa la


regresion? Explique.
Y b0 b1 . X b2 . X 2

Presentamos los resultados de Excel.


Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Anlisis de la Varianza

0,98962
0,97935
0,97344
12,4117
10

Regresin
Residuos
Total

Intercepcin
X
X

Grados de
libertad
2
7
9

Suma de
cuadrados
51130,1
1078,35
52208,4

Promedio de
los cuadrados
25565,1
154,05

Coeficientes

Error tpico

Estadstico t

7,60831
-0,0046
3,36E-05

8,50317
0,02378
8,93E-06

0,89476
-0,1921
3,76354

Y 7,6083 0,0046. X 0,00003. X

F
165,953

Probabilida
d
0,40063
0,85309
0,00704

Para este modelo:


r2 = 0,9793
Indica que el 97,93% de las variaciones de los activos se explican en este
modelo, los valores F = 165,95 y t = 3,76 respaldan al modelo como
confiable para realizar los pronsticos a pesar de que el valor de r 2 es muy
pequeo.

b)Pruebe la significancia del coeficiente del termino elevado al


cuadrado. Resuma su conclusion.
De acuerdo a los resultados de Excel tenemos:
b2 = 0,0000336
Sb2 = 0,00000893
Planteamiento de hiptesis:
Ho : 2 0
H1 : 2 0

Estadstico de prueba:

b2
0,0000336

3,763
S b 2 8,93 10 6

Estadstico t crtico.
Sea = 0,05 de 2 colas y n-2 = 8gl: tc = 2,306

Regla de decisin:

Si t esta fuera del intervalo 2,306, rechazamos Ho

Como t = 3,763 est fuera del intervalo 2,306, rechazamos Ho; se


concluye que a un nivel de significancia del 5% el coeficiente de regresin
es diferente de cero significativamente para este modelo.
c)Corra otra vez el analisis sin el termino cuadratico (elevado al
cuadrado). Explique porque el coeficiente del numero de cuentas no
es el mismo que el que usted obtuvo en el inciso a).
Y b0 b1 X

Presentamos los resultados de Excel.


Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,96827
Coeficiente de determinacin R^2
0,93755
R^2 ajustado
0,92975
Error tpico
20,1877
Observaciones
10

Anlisis de la Varianza
Grados de
libertad
Regresin
1
Residuos
8
Total
9

Intercepcin
X

Coeficiente
s
-17,121
0,08321

Ecuacin de regresin simple:

Suma de
cuadrados
48948,1
3260,34
52208,4

Promedio de
los cuadrados
48948,1
407,542

Error tpico

Estadstico t

8,77821
0,00759

-1,9505
10,9593

F
120,106

Probabilida
d
0,08693
4,27E-06

Y 17,1215 0,0832 X

Como podemos ver en este modelo, los valores r 2 y F disminuyeron; el


coeficiente b1 y b0 cambian sus valores notoriamente por corresponder a
otro modelo de regresin, aunque resulta ms adecuado que el modelo
mltiple curvilneo para realizar los pronsticos de la cantidad de acciones
en forma ms confiable.

Actividad de aprendizaje 2.3.


Del libro base, captulo 8, pp. 369 378, resuelva los siguientes
problemas:
# 5, #13, #17, #21

Problema 5:
Usted realiza una prueba para saber si hay alguna correlacin serial
en el nivel 0,01 con 32 residuos de una regresin con dos variables
independientes. Si la estadstica Durbin-Watson que se ha calculado
es igual a 1.0 Cul es su conclusin?
Empezamos con el anlisis para determinar si existe una correlacin serial.

1 t 1 t
Planteamiento de hiptesis:
H0 : 0

H 1 : >0
Conocidos:
DW = 1; = 0,01; n = 32; k = 2.
Tomamos datos de la tabla C-6:
dL = 1,1 y dU = 1,35

Regla de decisin:

Si DW > dU se concluye que H 0 : 0


Si DW < dL se concluye que H 1 : >0
Si dL DW dU la prueba no es concluyente.
Como DW = 1 < dL, concluimos que H 1 : >0 y que existe autocorrelacin
positiva, por lo que en el modelo hay una correlacin serial, y que sus
perturbaciones no son independientes.

Problema 13:
La Thompson Airlines determin que el 5% del nmero total de
pasajeros nacionales estadounidenses vuela en los aviones de la
compaa. Se le asigna a usted la tarea de pronosticar el nmero de
pasajeros que volarn en la Thompson Airlines en 2007. Los datos
se presentan en la tabla P-13.
A continuacin se muestra la tabla de datos:
AO

N Pasajeros

Ao codificado

1979

22,8

1980

26,1

1981

29,4

1982

34,5

1983

37,6

1984

40,3

1985

39,5

1986

45,4

1987

46,3

1988

45,8

10

1989

48

11

1990

54,6

12

1991

61,9

13

1992

69,9

14

1993

79,9

15

1994

96,3

16

1995

109

17

1996

116

18

1997

117,2

19

1998

124,9

20

1999

136,6

21

2000

144,8

22

2001

147,9

23

2002

150,1

24

2003

151,9

25

a) Desarrolle un modelo de regresin de series de tiempo, usando el


tiempo como la variable independiente y el nmero de pasajeros
como la variable dependiente. Ajuste este modelo.
Y b0 b1 X

Tenemos el siguiente diagrama de dispersin:

Como podemos observar en el grfico de dispersin, existe una relacin


lineal positiva entre la cantidad de pasajeros y el tiempo, y los datos estn
distribuidos de forma que siguen un patrn.

A continuacin se presentan los resultados de Excel:


Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,97127

Coeficiente de determinacin R^2


R^2 ajustado
Error tpico
Observaciones

0,94338
0,94091
11,0171
25

Anlisis de la Variacin
Grados de
libertad
Regresin
1
Residuos
23
Total
24

Suma de
cuadrados
46508,9
2791,64
49300,5

Promedio de
los cuadrados
46508,9
121,376

Coeficientes
Intercepcin
1,311
X
5,98131

Error tpico
4,54245
0,30556

Estadstico t
0,28861
19,575

F
383,181

Probabilidad
0,77546
7,72E-16

Ecuacin de regresin:
Y 1,31 5,9813 X

Su coeficiente de determinacin:
r2 = 0,9434
Esto nos ayuda a determinar que el 94,34% de las variaciones de la
cantidad de pasajeros se explica e n este el modelo.
Los valores de F = 383,18 y t = 19,575 indican que el modelo es confiable
para realizar estimaciones confiables del nmero de pasajeros que viajan
anualmente.

b) Es viable el supuesto de errores independientes para este


modelo?
El grafico de residuales, indica que los trminos de error no estn dispersos
aleatoriamente, por lo tanto los datos no seran aleatorios, y que en general
responde a que los trminos de error no son independientes.

c) Ajuste el modelo del inciso a) con los logaritmos del nmero de


pasajeros como la variable dependiente.
Para este modelo es adecuado un modelo auto regresivo de primer orden.
Yt b0 b1Yt 1

El diagrama de dispersin del nuevo modelo sera el siguiente:

El diagrama permite ver una relacin lineal positiva en este nuevo modelo.

d) Repita el inciso a) con el tiempo representado por una tendencia


exponencial (vase la ecuacin 5.6).
A continuacin se presentan los resultados de Excel:

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Anlisis de la Varianza
Grados de
libertad
Regresin
1
Residuos
22
Total
23
Coeficiente
s
Intercepcin
3,82179
Variable X 1
1,02048

0,99547
0,99096
0,99055
4,3478
24

Suma de
cuadrados
45586,6
415,874
46002,5

Promedio de
los cuadrados
45586,6
18,9034

Error tpico

Estadstico t

1,8122
0,02078

2,10892
49,1077

F
2411,56

Probabilida
d
0,04656
5,57E-24

Yt 3,8218 1,0205Yt 1

Coeficiente de determinacin:
r2 = 0,991
Esto indica que el 99,1% de las variaciones de la cantidad de pasajeros se
explican por este modelo.
Los valores de F = 2411,56 y t = 49,108 indican que este es un modelo
confiable para realizar pronsticos sobre la cantidad de pasajeros que viajan
anualmente.
Diagrama para los nuevos trminos de error:

En este nuevo modelo los trminos de error estn distribuidas en forma


aleatoria, con lo cual se puede considerar que los trminos de error son
independientes y constantes.
e) Cul modelo prefiere usted, el del inciso c) o d)? Por qu?
Aunque ambos modelos son confiables, es preferible el modelo del literal c,
ya que al ver las grficas de los residuales, la grfica del modelo c muestra
datos menos dispersos y con un patrn definido.
f) Los errores de los modelos de los incisos c) y d) parecen ser
independientes? Si no es as, qu problema(s) podra(n) surgir
cuando se use uno (o ambos) de estos modelos ajustados para
pronosticar?
Para el modelo c, los trminos de error no son independientes y los del
modelo d estn ligeramente dispersos, lo que indica que son ligeramente
independientes
g) Con base en su modelo preferido, pronostique el nmero de
pasajeros para 2004 de la Thompson Airlines.
Para 2003: Yt-1 = 151,9 pasajeros.
Yt 3,8218 1,0205Yt 1
Y2004 3,8218 1,0205Y2003 3,8218 1,0205(151,9) 158,8357

Estimamos que en el ao 2004, el nmero de pasajeros de la empresa de


transporte areo manejar 158,8 miles de pasajeros.

Problema 17:
Usar los datos que aparecen en la tabla 8.5, convierta las ventas y
los valores de ingresos disponibles a diferencias simples. Es decir,
crear los nmeros Yt = Yt Yt-1 y Xt = Xt Xt-1. Ajuste un modelo
de regresin lineal simple. Compare sus resultados con los
resultados obtenidos por el mtodo de diferencias generalizadas en
el ejemplo 8.5. Esperaba que fueran distintos? Explique su
respuesta.
A continuacin presentamos los resultados para el mtodo del ejemplo 8.5:
Yt 54,483(1 0,997) 9,26 X
0,997

Yt ' Yt 0,997Yt 1 ; X t' X t 0,997 X t 1

b0 54,483; b1 9,26
S b1 7,241

t b1 / S b1 1,28
DW 1,12

Tenemos el siguiente diagrama de dispersin:

A continuacin se presentan los resultados de Excel:

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Anlisis de la Varianza
Grados de

Suma de

0,72774
0,52961
0,50347
239,721
20

Promedio de

Regresin
Residuos
Total

Intercepcin
Variable X 1

libertad
1
18
19

cuadrados
1164598
1034389
2198987

los cuadrados
1164598
57466

Coeficientes

Error tpico

Estadstico t

148,923
9,1554

97,7024
2,03374

1,52425
4,50176

20,2658

Probabilida
d
0,14482
0,00028

Yt 148, ,9233 9,1554 X

Se estima que:
1

Yt ' Yt Yt 1 ; X t' X t X t 1

b0 148,9233; b1 9,1554
S b1 2,0337

t b1 / S b1 4,5018

La mayora de los resultados de este nuevo modelo presentan diferencias


significativas, solo b1 mantiene el mismo valor, se esperaba que los
resultados fueran similares y que bo fuera similar a 0, y analizando el
diagrama de dispersin de este modelo identificamos que los ltimos 3
pares de datos presentan un comportamiento distinto a los dems datos,
esto ocasiona que bo sea mayor que cero, y si se quitan estos ltimos
valores del modelo, el coeficiente bo se aproxima a cero y se asemeja al
modelo de diferencias generalizadas.

Problema 21:
Repita los incisos b) y c) del problema 20 con los datos
transformados logartmicamente. Haga una interpretacin de los
coeficientes del ingreso y del precio del pollo en trminos de
elasticidades. Con base en su funcin de regresin ajustada final,
indique como se obtendra un pronstico del consumo de pollo para
los aos siguientes.

Problema 20:

La demanda de una mercanca depende generalmente del ingreso


del consumidor, el precio real de la mercanca y el precio real de los
accesorios o productos similares. La tabla P-19 indica el consumo
per cpita de pollo en Estados Unidos (en libras); el ingreso
disponible per cpita (en dlares); y los precios al menudeo del
pollo, puerco y carne de res (en centavos por libra) de varios aos.
a. Calcule la matriz de correlacin para todas las variables, usando
tanto las unidades originales como las unidades transformadas en
logaritmos. Comente sobre la fortaleza implicada de la asociacin
lineal entre el pollo consumido y cada una de las variables
restantes. Puede usted pensar una razn por la que se debe tener
cuidado al interpretar las magnitudes de los coeficientes de
correlacin obtenidos a partir de los datos de la serie de tiempo?
Se presenta Parmetros del modelo mltiple con las variables iniciales, a
continuacin se muestran los resultados en Excel:

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0,95521
0,91243
0,89297
2,12616
23

Anlisis de la Varianza

Regresin
Residuos
Total

Intercepcin
X1
X2
X3
X4

Grados de
libertad

Suma de
cuadrados

4
18
22

847,85
81,3704
929,22

Coeficiente
s
39,292
0,00463
-0,6249
0,16365
0,0805

Ecuacin de regresin mltiple:

Error tpico
4,04692
0,00533
0,17727
0,06936
0,0555

Promedio
de los
cuadrados
211,962
4,52058

Estadstic
ot
9,70911
0,86889
-3,5252
2,35928
1,45046

F
46,8884

Probabilida
d
1,40E-08
0,39635
0,00242
0,02981
0,16413

Y 39,29 0,0046 X 1 0,6249 X 2 0,1636 X 3 0,0805 X 4

Tenemos:
r2 = 0,9124
F = 46,888
El valor t es significativo solamente para X2.

b. Usando los datos originales, corra un programa de regresin por


pasos con el consumo de pollo como la variable dependiente y las
variables restantes como variables explicativas. Establezca alfa
para enter =.alpha to remove = .05
Tabla de coeficientes de determinacin r2 para los diferentes modelos, al
combinar las distintas variables independientes.
Variables

Coeficiente r

Significativos

ln(X1)

0,9071

ln(X2)

0,5788

ln(X3)

0,7917

ln(X4)

0,8317

ln(X1) y ln(X2)

0,9672

Ambos

ln(X1) y ln(X3)

0,9315

ln(X1)

ln(X1) y ln(X4)

0,9172

ln(X1)

ln(X2) y ln(X3)

0,8559

ln(X3)

ln(X2) y ln(X4)

0,8944

ln(X4)

ln(X3) y ln(X4)

0,8359

Ninguno

ln(X1, X2 y X3)

0,9673

ln(X1) y ln(X2)

ln(X1, X2 y X4)

0,9683

ln(X1) y ln(X2)

ln(X2, X3 y X4)

0,9477

Todos

Todos

0,9690

ln(X1) y ln(X2)

Para cada variable es ms significativo pronosticar la demanda del consumo


del pollo con la variable ln(X1), y le sigue en importancia la variable ln(X4).
Si combinamos 2 variables independientes el mejor modelo est formado
por ln(X1) y ln(X2), que mejoran significativamente el porcentaje anterior.

Si combinamos 3 variables independientes el mejor modelo est formado


por ln(X1); ln(X2) y ln(X4), y se mejora ligeramente el porcentaje anterior,
pero se mantienen como explicativas para este modelo solo los trminos de
variable ln(X1) y ln(X2).
Si combinamos 4 variables independientes, se mejora un poco ms el
porcentaje anterior, pero se mantienen como explicativas para este modelo
solo los trminos de variable ln(X1) y ln(X2).
Si sacrificamos el porcentaje, el mejor modelo ajustado es el que tiene 2
variable independiente con ln(X1) y ln(X2), que se presenta a continuacin
como resultados de Excel:
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,98349
Coeficiente de determinacin R^2
0,96725
R^2 ajustado
0,96397
Error tpico
0,03214
Observaciones
23

Anlisis de la Varianza
Grados de
libertad
Regresin
2
Residuos
20
Total
22

Intercepcin
ln(X1)
ln(X2)

Coeficiente
s
2,37479
0,43992
-0,4449

Suma de
cuadrados
0,61001
0,02066
0,63067

Promedio de
los cuadrados
0,305
0,00103

Error tpico

Estadstico t

0,1344
0,02857
0,07342

17,67
15,3999
-6,0601

F
295,303

Probabilida
d
1,13E-13
1,48E-12
6,35E-06

Modelo de regresin mltiple ajustado:


Y ln(Y ) b0 b1 . ln( X 1 ) b2 . ln( X 2 )

Y ln(Y ) 2,3748 0,4399. ln( X 1 ) 0,4449. ln( X 2 )

Parmetro del modelo:


r2 = 0,9672
Esto indica que el 96,72% de las variaciones del consumo de pollos se
explica en este modelo.

Los valores de F = 295,30 y t= 15,4 para la variable ln(X1) y t = -6,06 para


la variable ln(X2) califican a este como un modelo altamente significativo y
muy confiable para realizar los pronsticos del consumo de pollo.
Entonces b1 = 0,4399 indica el cambio porcentual de ln(Y) por cada $1 de
incremento en el ingreso disponible.
Para b2 = -0,4449 indica el cambio porcentual de ln(Y) por cada $1 de
incremento en el precio de la libra del pollo.
Para realizar pronsticos para este modelo ajustado, aplicamos logaritmos
al valor del ingreso disponible, y al precio de la libra del pollo y con este
modelo se calcula el valor de ln(Y), para finalmente estimar la cantidad de
pollo a consumir se aplica antilogaritmo natural al resultado obtenido
usando la ecuacin de regresin.
c. Corra una regresin completa del consumo de pollo sobre las
variables restantes. Asegrese de eliminar una por una las variables
que considere que no son significativas hasta que usted est
satisfecho con su modelo final. Es congruente su resultado con el
resultado del procedimiento por pasos del inciso b)? Es probable
que la correlacin serial sea un problema en este anlisis de
regresin?
A continuacin se muestra el modelo de regresin completa con las 4
variables, dada por Excel:

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Anlisis de la Varianza
Grados de

Suma de

0,98436
0,96897
0,96208
0,03297
23

Promedio

4
18
22

cuadrado
s
0,6111
0,01957
0,63067

de los
cuadrados
0,15277
0,00109

Coeficiente
s
2,47403
0,34974
-0,5417
0,07238
0,11871

Error
tpico
0,18608
0,0995
0,13252
0,11911
0,12036

Estadstic
ot
13,2954
3,5148
-4,0878
0,60766
0,98627

libertad
Regresin
Residuos
Total

Intercepcin
ln(X1)
ln(X2)
ln(X3)
ln(X4)

140,528

Probabilida
d
9,53E-11
0,00247
0,00069
0,551
0,33707

Modelo de regresin mltiple:

Y ln(Y ) b0 b1 . ln( X 1 ) b2 . ln( X 2 ) b3 . ln( X 3 ) b4 . ln( X 4 )


Y ln(Y ) 2,474 0,3497. ln( X 1 ) 0,5417. ln( X 2 ) 0,0724. ln( X 3 ) 0,1187 . ln( X 4 )

Parmetros del modelo:


r2 = 0,9690
F = 140,53
Estos valores clasifican al modelo como muy confiable para realizar los
pronsticos, sin embargo en el anlisis de significancia de cada trmino de
variable son explicativos solamente los trminos de ln(X1) y ln(X2), pero no
son explicativos para este modelo los trminos de variables ln(X3) y ln(X4),
tal que se decide eliminar de este modelo.
El anlisis del modelo reducido que consta solo de los 2 trminos de
variable ln(X1) y ln(X2) ya se realiz en el literal anterior, y por sus buenas
caractersticas nuevamente se elige como mejor a este modelo ajustado con
estos 2 trminos de variable.
As que concuerda completamente la seleccin del mejor modelo ajustado
de regresin mltiple del literal anterior. A que los modelos de regresin
mltiples presentan altos valores para el coeficiente de determinacin
mltiple r2 existe el riesgo que se presente problemas de correlacin serial.

Actividad de aprendizaje 2.4.

a. Del libro base, captulo 9 pp. 446 hasta la 457, resuelva los
siguientes problemas del # 1, #5,

Problema 1:
a) Para una muestra de 100 observaciones de datos aleatorios
calcule un intervalo de confianza de 95% para el coeficiente de auto
correlaciones en cualquier retraso.
Datos:
NC = 95% (Z = 2)
n = 100;
rk = 0
Intervalo de confianza:
IC rk

IC 0

2
100

Z
n

2
0,2
10

Para que el coeficiente no sea significativo, debe estar en el intervalo de


0,2.
b) Si todos los coeficientes de auto correlacin estn dentro de sus
intervalos individuales de confianza de 95% y no muestran un
patrn particular, qu conclusin se puede obtener acerca del
proceso?
Para este comportamiento, concluimos que no hay autocorrelacin, ya que
los errores son constantes y aleatorios, y estamos trabajando con una serie
estacionaria y es vlido aplicar algn modelo auto regresivo adecuado.

c)
Si
las
primeras
auto
correlaciones
son
positivas
significativamente distintas de cero y los patrones de auto
correlacin declinan a cero, qu conclusin puede obtener acerca
del proceso?
Como se puede ver, este proceso tiene una tendencia creciente significativa
y es una serie no estacionaria, que al aplicar diferencias de primer orden se
lograra transformar en una nueva serie estacionaria para poder aplicar

algn modelo auto regresivo apropiado para poder realizar pronsticos muy
precisos.

d) Se observa un proceso trimestralmente, si las auto correlaciones


r4, r8 y r12 son significativamente distintas de cero, qu conclusin
puede obtenerse?
Para el proceso trimestral, hay una componente estacional significativa,
que se puede corregir aplicando diferencias de orden k = 4 y si es necesario
k = 8 para transformarla a serie estacionaria con variaciones controladas
que facilitara usar un modelo auto regresivo adecuado.

Problema 5:
Dadas las grficas de la figura P-5 de las autocorrelaciones de la
muestra y las autocorrelaciones parciales de la muestra, identifique
tentativamente un modelo ARIMA para cada par de grficas.
Entre los modelos ARIMA (p, d, q) de acuerdo a la autocorrelacin y
basndonos en el principio de parsimonia, tenemos:

Cuando corresponde a una serie creciente no lineal, el modelo


adecuado es el auto regresivo ARIMA (2, 0, 2) o ARIMA (1, 1, 1), y se
elige la que proporcione los parmetros ms adecuados.

Cuando corresponde a una serie creciente lineal, el modelo adecuado


es el auto regresivo ARIMA (1, 0, 1) o ARIMA (1, 0, 0).

Cuando corresponde a una serie estacionaria no lineal, el modelo


adecuado es el auto regresivo ARIMA (1, 0, 1) o ARIMA (1, 0, 0).

b. Resuelva el Caso 9 - 1 (Ventas del restaurante), p. 457.

CASO 9-1 (Ventas del restaurante)


Este caso se refiere a los datos de ventas y a la situacin del
restaurante descrito en el caso 8-3. Jim Price concluy un curso de
pronsticos y est ansioso por aplicar la metodologa Box-Jenkins a
las ventas del restaurante.
Estos datos, presentados en la tabla 9-17A, inician en la semana
que termina el domingo 4 de enero de 1981 y contina hasta la
semana que termina el domingo 26 de diciembre de 1982. La tabla
9-17B contiene datos nuevos de la semana que termina el 2 de

enero de 1983, hasta la semana que termina el 30 de octubre de


1983.
Se muestra el diagrama de dispersin para datos originales:

Se observa que las ventas semanales corresponden a una serie


estacionaria, por lo que podemos aplicar un modelos autoregresivos
estacionales.

1.- Cul es el modelo Box-Jenkins apropiado para usarse con los


datos originales?
Para los datos de ventas semanales de un periodo de 2 aos, determinamos
que el modelo que aporta parametros adecuados es el siguinte:
Yt 0 1Yt 52 2Yt 53

Se presentan los resultados de Excel:


Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0,79557
0,63293
0,61763
684,661
51

Anlisis de la Varianza
Grados de
libertad

Suma de
cuadrados

Promedio de
los cuadrados

Valor
crtico de
F

Regresin
Residuos

2
48

3,9E+07
2,3E+07

Total

50

6,1E+07

Intercepcin
Variable X 1

1185,23
0,4852

Error
tpico
436,985
0,09327

Variable X 2

0,31124

0,09243

Coeficientes

1,9E+07
468761

41,3821

3,58E-11

2,71228
5,20235

Probabilida
d
0,00925
4,03E-06

Inferior
95%
306,61
0,29768

3,36731

0,0015

0,1254

Estadstico t

Modelo de pronostico:
Yt 1185,23 0,4852Yt 52 0,3112Yt 53

Como podemos ver en los diagramas de residuales, los residuos se


distribuyen alrededor del valor constante cero, aleatoriamente.

De acuerdo a los resultados, este modelo explica el 63,29% de las


variaciones de las ventas semanales.
Los valores de F = 41,38 y t de 5,20 para Yt-52 y 3,37 para Yt-53 nos
permiten concluir que este modelo es muy confiable para realizar
estimaciones de las ventas a futuro.

2.- Cules son sus pronsticos para las primeras cuatro semanas
de enero de 1983?
Los pronosticos de las ventas semanales se detallan en la segunda columna
de la tabla que se muestra a continuacin y se ajustan bastante bien con las
ventas reales correspondientes.

Semana

Yt'

Yt real

Error

% Error

1/2/83

2703,41

2431

-272,41

11,21

1/9/83

2683,29

2796

112,71

4,03

1/16/83

3689,61

4432

742,39

16,75

1/23/83

5316,47

5714

397,53

6,96

3.- De qu manera se comparan estos pronsticos con las ventas


reales?
Los pronosticos semanales para el mes de enero y los errores de pronstico
se relacionan aceptablemente, solo para la tercera semana se evidencia un
nivel importante de desvio.

4.- De qu manera se compara el modelo Box-Jenkins con los


modelos de regresin empleados en el captulo 8.
Los modelos de Box-Jenkins analizan parametros de correlaciones,
significancia y residuos para medir la calidad del modelo autoregresivo y/o
media movil apropiado para una serie de tiempo, y se diferencian de los
modelos del capitulo 8 ya que son funciones de una o mas variables
independientes X, y los modelos de Box-Jenkins son dependientes de la
misma serie con uno o mas ordenes de retrasos.
5.- Utilizara el mismo modelo Box-Jenkins si los datos nuevos se
combinaran con los anteriores?

En el diagrama de dispersin, se observa que el nuevo conjunto de datos


tienen un comportamiento similar al conjunto de datos originales, con un
comportamiento estacionario y presenta variaciones dentro del rango de
valores entre 2000 y 8000 dlares, tal que ser apropiado usar el mismo
modelo de pronsticos al combinar los dos conjuntos de datos.

S-ar putea să vă placă și