Sunteți pe pagina 1din 23

Pronósticos

Modelos de
regresión
Modelos de regresión

Una cosa es ajustar un modelo a una serie de tiempos;


otra, totalmente diferente, es proponer otras variables
que se relacionen a la serie de datos de interés y
desarrollar un modelo que exprese la forma en que se
relaciona diversas variables.

Regresión es un conjunto de técnicas que son usadas para


establecer una relación entre una variable cuantitativa
llamada variable dependiente (Y) y una o más variables
independientes (X) llamadas variables predictoras. La
ecuación que representa la relación es llamada el modelo
de regresión.
Modelos de regresión

Los modelos de regresión los clasificaremos en dos


tipos:

Modelos de regresión simple


Y = f (X)

Modelos de regresión múltiple


Y = f ( X1, X2, ....., Xn)
Regresión simple

El análisis de regresión simple es una herramienta


estadística que nos permite estimar la relación
matemática existente entre una variable dependiente
(denominada generalmente Y) y una única variable
independiente (expresada comúnmente X).
La variable dependiente es aquella que queremos
realizar una previsión.
Si a la relación entre las dos variables (X é Y) es una
línea, estamos hablando de modelos de regresión
lineal, que son los que se utilizan con mayor
frecuencia.
Regresión simple

El modelo matemático que se ajusta a una recta, es el


siguiente:

Y = bo + b1 X + e

b1 señala la tasa de cambio de Y por unidad de X.


La intersección bo es el valor que adquiere la variable
dependiente Y cuando X es cero.
e del modelo representa un término de error.
Regresión simple
Nuestro problema es determinar los valores de bo y b1
de manera que la ecuación resultante se ajusten a los
datos de la mejor manera posible.
La técnica que se utiliza con mayor frecuencia es MCO
(mínimos cuadrados ordinarios).
bo y b1 son parámetros de la población que se estiman
típicamente mediante datos muestrales. Los
estadísticos muestrales son bo y b1, en consecuencia el
modelo muestral es:

Y = bo + b1 X
Ejemplo
CONJUNTO A CONJUNTO B CONJUNTO C CONJUNTO D
X Y X Y X Y X Y
10 8.04 10 9.14 10 7.46 8 6.58
8 6.95 8 8.14 8 6.77 8 5.76
13 7.58 13 8.74 13 12.74 8 7.71
9 8.81 9 8.77 9 7.11 8 8.84
11 8.33 11 9.26 11 7.81 8 8.47
14 9.96 14 8.1 14 8.84 8 7.04
6 7.24 6 6.13 6 6.08 8 5.25
4 4.26 4 3.1 4 5.39 19 12.5
12 10.84 12 9.13 12 8.15 8 5.56
7 4.82 7 7.26 7 6.42 8 7.91
5 5.68 5 4.74 5 5.73 8 6.89

¿Qué tienen de común estos conjuntos de datos?


Regresión simple

Que los resultados de la regresión de todas ellas se


expresan con la siguiente ecuación de MCO:

Y = 3 + 0.5 X
¿ES POSIBLE ESTO?

Veamos la representación grafica de cada uno de


ellas
Regresión simple
12 12

10 10

8 8

Conjunto
Y

Y
6

Conjunto
A 4 4

2 2 B
0 0
0 5 10 15 0 5 10 15
X X

14 14

12 12

10 10

Conjunto 8 8
Conjunto
Y

Y
6
C
6

4
4
D
2
2
0
0 5 10 15 0
0 5 10 15 20
X
X

¿Qué opinan ahora?


Regresión simple

Una buena lección:

La visualización de los datos nos permite percibir


notables diferencias que no aparecen en los
estadísticos descriptivos.
Pasos a seguir en una
regresión lineal

 Diagrama de dispersión.
 Calcular el coeficiente de correlación y
determinación.
 Prueba de significancia del coeficiente de
correlación.
 Análisis de regresión.
 Error estándar de estimación
Ejemplo

Suponga que el Sr. Juan observa el precio y volumen de


galones de leche de 10 semanas elegidas en forma
aleatoria. Podrá el señor Jun pronosticar el volumen de
ventas a partir del precio de galón de la leche?
SEMANA VENTAS PRECIO
1 10 1.3
2 6 2
3 5 1.7
4 12 1.5

¿Lo resuelven?
5 10 1.6
6 15 1.2
7 5 1.6
8 12 1.4
9 17 1
10 20 1.1
Ventas en miles de galones
Precio de venta por galon
Ejemplo 20

El señor Juan se enfrenta al SEMANA VENTAS PRECIO PUBLICIDAD


problema de formular un 1 10 1.3 9
pronóstico que no es del todo 2 6 2 7
preciso. El puede explicar casi 3 5 1.7 5
el 75% de la varianza total del 4 12 1.5 14
volumen de ventas de galones 5 10 1.6 15
de leche vendidos mediante el 6 15 1.2 12
7 5 1.6 6
uso de una variable 8 12 1.4 10
independiente. Para ser mas 9 17 1 15
preciso, debe encontrar otra 10 20 1.1 21
variable de predicción que le Ventas en miles de galones
permita explicar mas la Precio de venta por galon
varianza total. Publicidad en ciento de dolares

¿MEJORO SU PRONOSTICO?
Pasos a seguir en una regresión
lineal múltiple

 Diagrama de dispersión múltiple.


 Calcular el coeficiente de correlación y
determinación.
 Prueba de significancia del coeficiente de
correlación.
 Análisis de regresión.
 Error estándar de estimación.
 Prueba de significancia de los coeficientes de
regresión.
Regresión lineal múltiple

Observe usted, el
grafico de dispersión
múltiple
Regresión lineal múltiple

Model Summary r=0.965, es un buen coeficiente de


Model R R Square
Adjus ted
R Square
Std. Error of
the Es tim ate
correlación, eso me indica que si
1 .965 a .932 .912 1.507 existe correlación.
a. Predictors : (Constant), publicidad, precio

r2=0.932, es un buen coeficiente de


determinación, eso me indica que la
correlación es muy intensa.

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regress ion 217.699 2 108.849 47.917 .000 a
Res idual 15.901 7 2.272
Total 233.600 9
a. Predictors : (Constant), publicidad, precio
b. Dependent Variable: ventas

Como la probabilidad p es 0.000 y es menor que  (0.05), entonces, la


correlación es real.
Regresión lineal múltiple

La función de regresión es:


Ventas  16.406  8.248 Precio  0.585 Publicidad

Coefficientsa

Uns tandardized Standardized


Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Cons tant) 16.406 4.343 3.778 .007
precio -8.248 2.196 -.490 -3.756 .007
publicidad .585 .134 .571 4.377 .003
a. Dependent Variable: ventas

Observe usted, que la probabilidad p de las variables precio y


publicidad son 0.007 y 0.003 respectivamente y ambas son
menores que  (0.05), por lo tanto, los coeficientes de estas
variables si son significativos. Dicho de otra manera, las variables
precio y publicidad si aportan en el modelo de regresión.
Regresión lineal múltiple

Model Summary

Model R R Square
Adjust ed
R Square
Std. Error of
the Estimate Los resultados del
1 .965a .932 .912 1. 507
análisis de regresión
del SPSS
a. Predic tors : (Const ant), publicidad, precio

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regress ion 217.699 2 108.849 47. 917 .000a
Res idual 15. 901 7 2. 272
Tot al 233.600 9
a. Predic tors: (Cons tant ), public idad, precio
b. Dependent Variable: v entas

Coeffici entsa

Uns tandardized Standardized


Coef f icients Coef f icients
Model B Std. Error Beta t Sig.
1 (Const ant) 16. 406 4. 343 3. 778 .007
precio -8.248 2. 196 -. 490 -3.756 .007
public idad .585 .134 .571 4. 377 .003
a. Dependent Variable: v entas
Ejemplo
Caso A - Elecciones en Florida
En las elecciones presidenciales norteamericanas
de Noviembre 2000 los contendientes principales,
George Bush y Al Gore, resultaron casi empatados
en términos de votos electorales, por lo que el
resultado dependía crucialmente de los comicios
en el estado de Florida, donde el escrutinio inicial
no dio un resultado definitivo a favor de ninguno
de los candidatos. A medida que proseguía el
conteo, surgieron varias anomalías, una de las
cuales tuvo que ver con el condado de Palm
Beach.
Entre otras cosas, se alegó que en este condado muchos votantes que deseaban
votar por Gore se confundieron, debido al diseño de la papeleta electoral, y
votaron por error por un candidato marginal, Pat Buchanan, del Reform Party.
(El condado de Palm Beach tenía una papeleta electoral un tanto confusa y con
un formato diferente a la de los demás condados en el estado.)
El cuadro adjunto muestra la votación obtenida por Buchanan en todos los
condados del estado de Florida, y se aprecia claramente que la cantidad de votos
obtenidos por ese candidato en Palm Beach fue exageradamente grande en
comparación al resto del estado. Presumiblemente, muchos de estos fueron
efectivamente votos erróneos (y probablemente con la intención de votar por
Gore, debido al diseño de la papeleta). La pregunta es si se puede obtener una
estimación aproximada de la cantidad de estos votos erróneos.
Como una primera aproximación, se esperaría que la votación obtenida por Buchanan en
un condado determinado estaría positivamente relacionada con la cantidad de personas
afiliadas al Reform Party residentes en ese condado. Este dato también se muestra en el
cuadro adjunto.

Con esta información,

(a) Construya un diagrama de dispersión, relacionando las dos variables.

(b) Calcule la línea de regresión (excluyendo la observación para Palm Beach), y con los
resultados obtenidos, haga una estimación de la "votación excedente" obtenida por
Buchanan en Palm Beach.

(c) Tomando en cuenta que según los resultados oficiales, Bush ganó a Gore en Florida por
una diferencia de 537 votos (sobre un total de más de 6,100,000 votos emitidos),
comente sobre las implicaciones de este análisis para el resultado final de las elecciones
presidenciales de ese año.
Registrados Votos por Registrados Votos por

Condado Reform Party Buchanan Condado Reform Party Buchanan

Alachua 91 263 Lake 80 289


Baker 4 73 Lee 113 305
Bay 55 248 Leon 80 282
Bradford 3 65 Levy 17 67
Brevard 148 570 Liberty 0 39
Broward 332 788 Madison 2 29
Calhoun 2 90 Manatee 140 271
Charlotte 41 182 Marion 108 563
Citrus 44 270 Martin 48 112
Clay 40 186 Monroe 62 47
Collier 118 122 Nassau 13 90
Columbia 35 89 Okaloosa 96 267
Fuentes:
Dade 217 560 Okeechobe 27 43
Florida Dept. of State, Division of Elections,
Desoto 7 36 Orange 199 446
"County Voter Registration by Party," Oct 10, 2000
Dixie 0 29 Osceola 62 145
http://election.dos.state.fl.us/pdf/2000voterreg/20
Duval 150 652 Pasco 167 570
00genparty.pdf
Escambia 130 502 Pinellas 425 1013
ABC News, "Florida: Real-Time County
Flagler 30 83 Polk 119 532
Returns"
Franklin 0 33 Putnam 27 148
(www.abcnews.go.com/sections/politics/2000vote/
Gadsden 11 38 Santa Rosa 55 311 general/FL_county.html), visited June 15, 2001.
Gilchrist 6 29 Sarasota 154 305
Glades 2 9 Seminole 81 194
Gulf 3 71 St.Johns 59 229
Hamilton 3 23 St.Lucie 25 124
Hardee 4 30 Sumter 21 114
Hendry 10 22 Suwannee 7 108
Hernando 43 242 Taylor 3 27
Highlands 24 127 Union 1 37
Hillsborough 299 847 Volusia 176 496
Holmes 2 76 Wakulla 7 46
Indian River 66 105 Walton 22 120
Jackson 8 102 Washington 9 88
Jefferson 2 29
Lafayette 0 10 PALM BEACH 337 3407

S-ar putea să vă placă și