Sunteți pe pagina 1din 23

Pronsticos

Modelos de
regresin

Modelos de regresin
Una cosa es ajustar un modelo a una serie de tiempos;
otra, totalmente diferente, es proponer otras variables
que se relacionen a la serie de datos de inters y
desarrollar un modelo que exprese la forma en que se
relaciona diversas variables.

Regresin es un conjunto de tcnicas que son usadas para


establecer una relacin entre una variable cuantitativa
llamada variable dependiente (Y) y una o ms variables
independientes (X) llamadas variables predictoras. La
ecuacin que representa la relacin es llamada el modelo
de regresin.

Modelos de regresin

Los modelos de regresin los clasificaremos en dos


tipos:
Modelos de regresin simple
Y = f (X)
Modelos de regresin mltiple
Y = f ( X1, X2, ....., Xn)

Regresin simple
El anlisis de regresin simple es una herramienta
estadstica que nos permite estimar la relacin
matemtica existente entre una variable dependiente
(denominada generalmente Y) y una nica variable
independiente (expresada comnmente X).
La variable dependiente es aquella que queremos
realizar una previsin.
Si a la relacin entre las dos variables (X Y) es una
lnea, estamos hablando de modelos de regresin
lineal, que son los que se utilizan con mayor
frecuencia.

Regresin simple
El modelo matemtico que se ajusta a una recta, es el
siguiente:

Y = bo + b1 X + e
b1 seala la tasa de cambio de Y por unidad de X.
La interseccin bo es el valor que adquiere la variable
dependiente Y cuando X es cero.
e del modelo representa un trmino de error.

Regresin simple
Nuestro problema es determinar los valores de bo y b1
de manera que la ecuacin resultante se ajusten a los
datos de la mejor manera posible.
La tcnica que se utiliza con mayor frecuencia es MCO
(mnimos cuadrados ordinarios).
bo y b1 son parmetros de la poblacin que se estiman
tpicamente
mediante
datos
muestrales.
Los
estadsticos muestrales son bo y b1, en consecuencia el
modelo muestral es:

Y = bo + b1 X

Ejemplo
CONJUNTO A

CONJUNTO B

CONJUNTO C

CONJUNTO D

X
10
8
13
9
11
14
6
4
12
7
5

X
10
8
13
9
11
14
6
4
12
7
5

X
10
8
13
9
11
14
6
4
12
7
5

X
8
8
8
8
8
8
8
19
8
8
8

Y
8.04
6.95
7.58
8.81
8.33
9.96
7.24
4.26
10.84
4.82
5.68

Y
9.14
8.14
8.74
8.77
9.26
8.1
6.13
3.1
9.13
7.26
4.74

Y
7.46
6.77
12.74
7.11
7.81
8.84
6.08
5.39
8.15
6.42
5.73

Qu tienen de comn estos conjuntos de datos?

Y
6.58
5.76
7.71
8.84
8.47
7.04
5.25
12.5
5.56
7.91
6.89

Regresin simple

Que los resultados de la regresin de todas ellas se


expresan con la siguiente ecuacin de MCO:

Y = 3 + 0.5 X
ES POSIBLE ESTO?
Veamos la representacin grafica de cada uno de
ellas

12

12

10

10

Conjunto
A

Regresin simple

Conjunto

0
0

10

15

14

14

12

12

10

10

15

Conjunto

Conjunto

10
X

4
4

2
2

0
0

10
X

15

0
0

10
X

Qu opinan ahora?

15

20

Regresin simple

Una buena leccin:


La visualizacin de los datos nos permite percibir
notables diferencias que no aparecen en los
estadsticos descriptivos.

Pasos a seguir en una


regresin lineal
Diagrama de dispersin.

Calcular el coeficiente
determinacin.

de

Prueba de significancia
correlacin.

del

Anlisis de regresin.
Error estndar de estimacin

correlacin
coeficiente

y
de

Ejemplo
Suponga que el Sr. Juan observa el precio y volumen de
galones de leche de 10 semanas elegidas en forma
aleatoria. Podr el seor Jun pronosticar el volumen de
ventas a partir del precio de galn de la leche?
SEMANA
VENTAS
1
10
2
6
3
5
4
12
5
10
6
15
7
5
8
12
9
17
10
20
Ventas en miles de galones
Precio de venta por galon

PRECIO
1.3
2
1.7
1.5
1.6
1.2
1.6
1.4
1
1.1

Lo resuelven?

Ejemplo 20
El seor Juan se enfrenta al
problema de formular un
pronstico que no es del todo
preciso. El puede explicar casi
el 75% de la varianza total del
volumen de ventas de galones
de leche vendidos mediante el
uso
de
una
variable
independiente. Para ser mas
preciso, debe encontrar otra
variable de prediccin que le
permita explicar mas la
varianza total.

SEMANA
VENTAS
PRECIO
1
10
1.3
2
6
2
3
5
1.7
4
12
1.5
5
10
1.6
6
15
1.2
7
5
1.6
8
12
1.4
9
17
1
10
20
1.1
Ventas en miles de galones
Precio de venta por galon
Publicidad en ciento de dolares

MEJORO SU PRONOSTICO?

PUBLICIDAD
9
7
5
14
15
12
6
10
15
21

Pasos a seguir en una regresin


lineal mltiple
Diagrama de dispersin mltiple.
Calcular el coeficiente
determinacin.

de

Prueba de significancia
correlacin.

del

correlacin
coeficiente

y
de

Anlisis de regresin.
Error estndar de estimacin.
Prueba de significancia de los coeficientes de
regresin.

Regresin lineal mltiple

Observe usted, el
grafico de dispersin
mltiple

Regresin lineal mltiple

Model Summary
Model
1

R
R Square
.965 a
.932

Adjus ted
R Square
.912

Std. Error of
the Es tim ate
1.507

a. Predictors : (Constant), publicidad, precio

r=0.965, es un buen coeficiente de


correlacin, eso me indica que si
existe correlacin.
r2=0.932, es un buen coeficiente de
determinacin, eso me indica que la
correlacin es muy intensa.

ANOVAb
Model
1

Regress ion
Res idual
Total

Sum of
Squares
217.699
15.901
233.600

df
2
7
9

Mean Square
108.849
2.272

F
47.917

Sig.
.000 a

a. Predictors : (Constant), publicidad, precio


b. Dependent Variable: ventas

Como la probabilidad p es 0.000 y es menor que (0.05), entonces, la


correlacin es real.

Regresin lineal mltiple


La funcin de regresin es:

Ventas 16.406 8.248 Precio 0.585 Publicidad


Coefficientsa

Model
1

(Cons tant)
precio
publicidad

Uns tandardized
Coefficients
B
Std. Error
16.406
4.343
-8.248
2.196
.585
.134

Standardized
Coefficients
Beta
-.490
.571

t
3.778
-3.756
4.377

Sig.
.007
.007
.003

a. Dependent Variable: ventas

Observe usted, que la probabilidad p de las variables precio y


publicidad son 0.007 y 0.003 respectivamente y ambas son
menores que (0.05), por lo tanto, los coeficientes de estas
variables si son significativos. Dicho de otra manera, las variables
precio y publicidad si aportan en el modelo de regresin.

Regresin lineal mltiple


Model Summary

Model
1

R
R Square
.965a
.932

Adjust ed
R Square
.912

Los resultados del


anlisis de regresin
del SPSS

Std. Error of
the Estimate
1. 507

a. Predic tors : (Const ant), publicidad, precio

ANOVAb
Model
1

Regress ion
Res idual
Tot al

Sum of
Squares
217.699
15. 901
233.600

df
2
7
9

Mean Square
108.849
2. 272

F
47. 917

Sig.
.000a

t
3. 778
-3.756
4. 377

Sig.
.007
.007
.003

a. Predic tors: (Cons tant ), public idad, precio


b. Dependent Variable: v entas
Coeffici entsa

Model
1

(Const ant)
precio
public idad

Uns tandardized
Coef f icients
B
Std. Error
16. 406
4. 343
-8.248
2. 196
.585
.134

a. Dependent Variable: v entas

Standardized
Coef f icients
Beta
-. 490
.571

Ejemplo
Caso A - Elecciones en Florida
En las elecciones presidenciales norteamericanas
de Noviembre 2000 los contendientes principales,
George Bush y Al Gore, resultaron casi empatados
en trminos de votos electorales, por lo que el
resultado dependa crucialmente de los comicios
en el estado de Florida, donde el escrutinio inicial
no dio un resultado definitivo a favor de ninguno
de los candidatos. A medida que prosegua el
conteo, surgieron varias anomalas, una de las
cuales tuvo que ver con el condado de Palm
Beach.

Entre otras cosas, se aleg que en este condado muchos votantes que deseaban
votar por Gore se confundieron, debido al diseo de la papeleta electoral, y
votaron por error por un candidato marginal, Pat Buchanan, del Reform Party.
(El condado de Palm Beach tena una papeleta electoral un tanto confusa y con
un formato diferente a la de los dems condados en el estado.)
El cuadro adjunto muestra la votacin obtenida por Buchanan en todos los
condados del estado de Florida, y se aprecia claramente que la cantidad de votos
obtenidos por ese candidato en Palm Beach fue exageradamente grande en
comparacin al resto del estado. Presumiblemente, muchos de estos fueron
efectivamente votos errneos (y probablemente con la intencin de votar por
Gore, debido al diseo de la papeleta). La pregunta es si se puede obtener una
estimacin aproximada de la cantidad de estos votos errneos.

Como una primera aproximacin, se esperara que la votacin obtenida por Buchanan en
un condado determinado estara positivamente relacionada con la cantidad de personas
afiliadas al Reform Party residentes en ese condado. Este dato tambin se muestra en el
cuadro adjunto.
Con esta informacin,
(a) Construya un diagrama de dispersin, relacionando las dos variables.
(b) Calcule la lnea de regresin (excluyendo la observacin para Palm Beach), y con los
resultados obtenidos, haga una estimacin de la "votacin excedente" obtenida por
Buchanan en Palm Beach.
(c) Tomando en cuenta que segn los resultados oficiales, Bush gan a Gore en Florida por
una diferencia de 537 votos (sobre un total de ms de 6,100,000 votos emitidos),
comente sobre las implicaciones de este anlisis para el resultado final de las elecciones
presidenciales de ese ao.

Registrados

Votos por

Reform Party

Buchanan

Alachua
Baker
Bay
Bradford
Brevard
Broward
Calhoun
Charlotte
Citrus
Clay
Collier
Columbia
Dade
Desoto
Dixie
Duval
Escambia
Flagler
Franklin
Gadsden
Gilchrist
Glades
Gulf
Hamilton
Hardee
Hendry
Hernando
Highlands

91
4
55
3
148
332
2
41
44
40
118
35
217
7
0
150
130
30
0
11
6
2
3
3
4
10
43
24

263
73
248
65
570
788
90
182
270
186
122
89
560
36
29
652
502
83
33
38
29
9
71
23
30
22
242
127

Hillsborough
Holmes
Indian River

299
2
66
8
2
0

Condado

Jackson
Jefferson
Lafayette

Registrados

Votos por

Reform Party

Buchanan

Lake
Lee
Leon
Levy
Liberty
Madison
Manatee
Marion
Martin
Monroe
Nassau
Okaloosa
Okeechobe
Orange
Osceola
Pasco
Pinellas
Polk
Putnam
Santa Rosa
Sarasota
Seminole
St.Johns
St.Lucie
Sumter
Suwannee
Taylor
Union

80
113
80
17
0
2
140
108
48
62
13
96
27
199
62
167
425
119
27
55
154
81
59
25
21
7
3
1

289
305
282
67
39
29
271
563
112
47
90
267
43
446
145
570
1013
532
148
311
305
194
229
124
114
108
27
37

847
76
105

Volusia
Wakulla
Walton

176
7
22

496
46
120

102
29
10

Washington

88

337

3407

Condado

PALM BEACH

Fuentes:
Florida Dept. of State, Division of Elections,
"County Voter Registration by Party," Oct 10, 2000
http://election.dos.state.fl.us/pdf/2000voterreg/20
00genparty.pdf
ABC News, "Florida: Real-Time County
Returns"
(www.abcnews.go.com/sections/politics/2000vote/
general/FL_county.html), visited June 15, 2001.

S-ar putea să vă placă și