Sunteți pe pagina 1din 5

Facultad de Ciencias Básicas – Departamento de Matemáticas – Área de Estadística

Análisis de Regresión Lineal Simple

PROBLEMAS DE REGRESION LINEAL SIMPLE

Aplicación1: Al dueño de una empresa de helados le gustaría estudiar el


efecto de la temperatura ambiente sobre las ventas diarias de sus productos
durante la temporada de verano. Se esta interesado en estudiar la relación
existente entre la variable de interés (Y) “Venta diaria” y la variable explicativa
(X) “Temperatura diaria”. Utilizando los siguientes datos de una muestra de 6
días se puede ajustar un modelo de regresión.

X Y
Temperatura Venta diaria
diaria ( F ) (en miles de pesos)

61 162
56 154
78 170
60 158
77 171
69 169

 En el siguiente gráfico se representa la nube de puntos y la recta


ajustada

Plot of Fitted Model


174

170

166
Y1

162

158

154

150
56 60 64 68 72 76 80

X1
 Se calculan los estadísticos básicos de las variables X e Y.

n 6,  X Y = 66074,  X
i i i
2
= 27231, Y i
2
= 161626

X i  401 , Y i  984 , X = 66.8333, Y = 164

 Las estimaciones de los parámetros B0 y B1 de la recta de regresión


son:
n

X Y i i  n( X )(Y )
66074  6(66,8333)(164) 310,0328
̂1  i 1    0,7195
n
27231  6(66,8333) 2 430,86
X
i 1
i
2
 n( X ) 2

Marco Antonio Triana 1


Docente área Estadística UAO
Facultad de Ciencias Básicas – Departamento de Matemáticas – Área de Estadística
Análisis de Regresión Lineal Simple

ˆ0  Y  ˆ1 X  164  0,7195(66,8333)  115,91

La ecuación para la mejor línea recta que se ajusta a estos datos es:

Yˆi = 115,911 + 0,7195* Xi


La pendiente ˆ1 es igual a +0,7195. Esto significa que para cada incremento
de una unidad en X se estima que el valor de Y aumenta en un promedio de
0,7195 unidades. Es decir, por cada aumento de la temperatura en 1 F , el
modelo ajustado predice una estimación de un aumento de las ventas diarias
de sus productos de $719,5. El intercepto ̂ 0 se calculó en +115,911(miles
de pesos), este valor $115.911 representa las ventas promedio diarias
ajustadas con la estimación de la temperatura promedio ambiente.

 El coeficiente de correlación es:

 X Y  n( X )(Y )
i i
66074  6(66,8333)(164)
R i 1

n n
(27231  6(66,8333) 2 )(161626  6(164) 2 )
( X i2  n X )( Yi 2  nY )
2 2

i 1 i 1

310,0328
R  0,9446 . El coeficiente de correlación +0,9446 indica que
(430,86)( 250)
existe una asociación muy fuerte (directamente proporcional) entre las ventas
diarias y la temperatura ambiente durante la temporada de verano. Es decir, a
mayor temperatura ambiente ( F ), las ventas diarias se incrementaran
significativamente.

 El coeficiente de Determinación es: R  (0,9446)  89,23% . Por


2 2

tanto, 89,23% de la variación entre las ventas diarias puede explicarse


mediante la variabilidad en la temperatura ambiente de un día y otro.

El modelo de regresión que ha sido ajustado a los datos puede utilizarse ahora
para predecir las ventas diarias. Por ejemplo, digamos que nos gustaría utilizar
el modelo para predecir las ventas en un día determinado con una temperatura
ambiente de 70 F . Podemos determinar el valor predicho si hacemos X = 70
en nuestra ecuación de regresión,

Yˆ = 115,911 + 0,7195*(70) = 166,276. Tenemos que, las ventas


diarias promedio predichas para un día determinado con una
temperatura ambiente de 70 F son de $166.276

Podemos determinar el valor estimado de X para un valor de Y, por ejemplo,


si hacemos Y = 175 en nuestra ecuación de regresión,
Marco Antonio Triana 2
Docente área Estadística UAO
Facultad de Ciencias Básicas – Departamento de Matemáticas – Área de Estadística
Análisis de Regresión Lineal Simple

Yˆ =175 = 115,911 + 0,7195*X  X = 82,12. Tenemos que, la


temperatura ambiente estimada para un día determinado con unas
ventas diarias de $175.000 es de 82,12 F .

A continuación aparecen los resultados del análisis llevado a cabo con las
variables (Temperatura, Ventas) utilizando el programa STATGRAPHICS.

Simple Regression - Y1 vs. X1

Regression Analysis - Linear model: Y = a + b*X


-----------------------------------------------------------------------------
Dependent variable: Y1
Independent variable: X1
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
Intercept 115,911 8,42368 13,7601 0,0002
Slope 0,719536 0,125039 5,75449 0,0045
-----------------------------------------------------------------------------
Esta salida nos ofrece las estimaciones de los coeficientes de la recta de
regresión, suponiendo que el valor medio de la distribución t-Student a la que
pertenecen dichas estimaciones es cero (Statistic-t).
Aplicación 2: Suponga que el administrador de una cadena de almacenes de
la ciudad de Cali le gustaría desarrollar un modelo para predecir las ventas
totales mensuales (unidades) televisores Sony de 29 pulg. de cada almacén.
Se esta interesado en estudiar la relación existente entre la variable de interés
(Y) “Ventas totales” y la variable explicativa (X) “Precio de venta”. Utilizando
los siguientes datos de una muestra de 10 almacenes se puede ajustar un
modelo de regresión.

X Y
Precio de Venta Ventas totales
(En millones de pesos) (Unidades)

1,2 30
1,34 26
1,45 21
1,13 32
1,07 31
1,49 18
1,02 29
1,28 24
1,51 17
1,43 22

Marco Antonio Triana 3


Docente área Estadística UAO
Facultad de Ciencias Básicas – Departamento de Matemáticas – Área de Estadística
Análisis de Regresión Lineal Simple

 En el siguiente gráfico se representa la nube de puntos y la recta


ajustada

Plot of Fitted Model


32

29

26
y

23

20

17
1 1,1 1,2 1,3 1,4 1,5 1,6

 Se calculan los estadísticos básicos de las variables X e Y.

n  10 ,  X Y = 314.87,  X
i i i
2
= 16.9838, Y
i
2
= 6516

X i  12.92 , Y i  250 , X = 1.292, Y = 25

 Las estimaciones de los parámetros B0 y B1 de la recta de regresión


son:
n

X Y i i  n( X )(Y )
314,87  10(1,292)( 25)  8,13
̂1  i 1
   27,9228
n
16,9838  10(1,292) 2

X
0,29116
i
2
 n( X ) 2
i 1

ˆ0  Y  ˆ1 X  25  (27,9228)(1,292)  61,0762

La ecuación para la mejor línea recta que se ajusta a estos datos es

Yˆi = 61,0762 – 27,9228* Xi

La pendiente ˆ1 es igual a -27,9228. Esto significa que para cada incremento
de una unidad en X se estima que el valor de Y disminuye en un promedio de
27,9228 unidades. Es decir, por cada aumento en el precio de venta de
$1.000.000 en cada televisor Sony de 29 pulg, el modelo ajustado predice una
estimación de una disminución de las ventas totales mensualmente de 28
televisores Sony de 29 pulg aproximadamente. Más claramente, por cada
aumento en el precio de venta de $100.000 en cada televisor Sony de 29 pulg,
el modelo ajustado predice una estimación de una disminución de las ventas
totales en el mes de 3 televisores Sony de 29 pulg aproximadamente. El
Marco Antonio Triana 4
Docente área Estadística UAO
Facultad de Ciencias Básicas – Departamento de Matemáticas – Área de Estadística
Análisis de Regresión Lineal Simple

intercepto ̂ 0 se calculó en +61,0762(unidades), este valor aproximado de


61(televisores Sony de 29 pulg) representa las ventas (valor esperado)
promedio mensuales ajustadas con la estimación del precio promedio de venta.

 El coeficiente de correlación es:

 X Y  n( X )(Y )
i i
314,87  10(1,292)( 25)
R i 1

(16,9838  10(1,292) 2 )(6516  10(25) 2 )
n n
( X i2  n X )( Yi 2  nY )
2 2

i 1 i 1
 8,13
R  0,9238 . El coeficiente de correlación -0,9238 indica
(0,29116)( 266)
que existe una asociación muy fuerte (inversamente proporcional) entre las
ventas totales y el precio de venta de los televisores Sony de 29 pulg en la
cadena de almacenes de la ciudad de Cali. Es decir, a mayor precio de venta,
las ventas totales disminuyen significativamente.

 El coeficiente de Determinación es: R  (0,9238)  85,34% . Por


2 2

tanto, 85,34% de la dispersión entre las ventas totales puede explicarse


mediante la dispersión en el precio de venta de un almacén y otro.

Este modelo de regresión se puede ajustar a los datos para predecir las ventas
totales mensuales. Por ejemplo, digamos que nos gustaría utilizar el modelo
para predecir las ventas totales en un almacén determinado cuando el precio
de venta de los televisores Sony de 29 pulg es de $1.231.000.

Entonces, si hacemos X = 1,231 en nuestra ecuación de regresión,

Yˆ = 61,0762 – 27,9228*(1,231) = 26,7. Tenemos que, las ventas


totales promedio predichas para un almacén determinado cuando el
precio de venta es de $1.231.000 es aproximadamente de 27
televisores Sony de 29 pulg.

Podemos estimar X, por ejemplo si hacemos Y = 36 en nuestra ecuación de


regresión,

Yˆ = 36 = 61,0762 – 27,9228*X  X = 0,8980546. Tenemos que,


el precio de venta estimado para estos televisores Sony de 29 pulg en
un almacén determinado con unas ventas totales en el mes de 36
unidades es de $898.054,6.

Marco Antonio Triana 5


Docente área Estadística UAO

S-ar putea să vă placă și