Sunteți pe pagina 1din 47

Métodos Cuantitativos para la Toma

de Decisiones
MA-100
Capítulo 1
Regresión en Excel
Juan Pablo Vargas Machuca Bueno, DEng
Facultad de Ingeniería Mecánica
Universidad Nacional de Ingeniería
Sumario
1. Introducción a regresión múltiple
2. Factores cualitativos en regresiones múltiples
3. Modelando no linealidades e iteraciones

2
1. Introducción a regresión múltiple

3
1. Motivación
En las secciones anteriores vimos cómo predecir
una variable (Y o dependiente) en función de
otra variable (X o independiente).
Sin embargo, muchas veces tenemos más de una
variable independiente para predecir la
variable dependiente.
En esos casos podemos usar la opción de
regresión múltiple o la función LINEST.
4
1. Motivación
Una regresión múltiple asume una relación entre
X1, X2, …, Xn e Y que tiene la forma:
Y = Constante + B1X1 + B2X2 + … + BnXn
Excel nos ayuda a calcular los valores de
Constante, B1, B2, …, Bn, para hacer
predicciones (lo más precisas posibles) usando
la ecuación dada.

5
1. Problema
Se muestran los valores del costo de operar una
planta durante 19 meses, así como la unidades
producidas (Ch57/Templates/Mrcostesttemp.xlsx).

6
1. Problema
En este caso, el costo operativo mensual podrá
ser predicho usando la fórmula:
Costo operativo mensual = Constante + B1*(Unidades
A producidas) + B2*(Unidades B producidas) + B3
(Unidades C producidas)

7
1. Solución
Seleccione Datos/Análisis de datos/Regresión e
ingrese lo siguiente:

8
1. Solución
Rango Y de entrada contiene la variable
dependiente (costo) que deseamos predecir.
Rango X de entrada contiene las variables
independientes. Excel tiene un límite de 15
variables independientes, las que deben estar
en celdas adyacentes.
Dado que los datos incluyen las etiquetas
debemos marcar Rótulos.
Los Residuos corresponden a la diferencia entre
el costo observado y el predicho.
9
1. Solución
Obtendremos los siguientes resultados:

10
1. Solución
Los coeficientes de la recta de mejor ajuste los
encontraremos en la columna B:

Para saber cuáles de las variables independientes


son más útiles para predecir el costo,
observamos el valor p (0…1), en la columna E.
Cuanto menor dicho valor, mayor el poder
predictivo de la variable respectiva.
11
1. Solución
Si usamos los productos B y C para predecir el
costo, tendremos 77% de chance (1-0.23) de
que A adicione poder predictivo.
Si usamos los productos A y C para predecir el
costo, tendremos 97.5% de chance (1-0.025)
de que B adicione poder predictivo.
Si usamos los productos A y B para predecir el
costo, tendremos 98.3% de chance (1-0.017)
de que C adicione poder predictivo.
12
1. Solución
Observamos que A no adiciona mucho poder
predictivo.
Es decir, si solo usamos B y C para predecir el
costo, obtendremos valores aceptables.
Seguidamente, eliminamos A de las variables
independientes y volvemos a calcular la
regresión.

13
1. Solución
Obtendremos los siguientes resultados:

14
1. Solución
En la celda B5 de la regresión sin A, el
Coeficiente de determinación R2 es 0.61.
Ello implica que B y C explican el 61% de la
variación de los costos mensuales.
En la regresión con A, R2 es 0.65, es decir que A
solo explica el 4% de la variación.
Al tener tan poca influencia, podemos eliminar A
como variable independiente.
15
1. Solución
En la celda B7 de la regresión sin A, el Error
típico es 1274.
Por tanto, deberemos esperar que el 68% de las
predicciones esté dentro de 1*Error típico y el
95% dentro de 2*Error típico.
Cualquier predicción que difiera en más de
$2548 (2*1274) del valor medido será
considerada un valor atípico.
16
2. Factores cualitativos en regresiones
múltiples

17
2. Motivación
En la sección anterior pudimos estimar el costo
de producción en función de variables
cuantitativas (cantidad producida de A, B y C).
Sin embargo, muchas veces, las variables
independientes no pueden fácilmente ser
cuantificadas.
A seguir veremos como incorporar variables
cualitativas en una regresión.
18
2. Problema
Se desea predecir la
venta trimestral de
autos para ver su
impacto en las ventas
anuales
(Ch58/Templates/
Autotemp.xlsx).
Las ventas están en
miles de carros y el
producto nacional
bruto (GNP) en miles
de millones de $.
19
2. Solución
Podríamos usar una variable independiente que
es igual a 1 en el primer trimestre, 2 en el
segundo, etc.
Pero esta elección daría al cuarto trimestre 4
veces más importancia que al primero.
Dado que el trimestre es una variable
independiente cualitativa, podremos crear una
variable independiente auxiliar.
20
2. Solución
Las variables auxiliares indican cuál de los
trimestres ocurre:
• La variable auxiliar del trimestre 1 es igual a 1, si
ocurre el trimestre 1, siendo 0 en otros casos.
• La variable auxiliar del trimestre 2 es igual a 1, si
ocurre el trimestre 2, siendo 0 en otros casos.
• La variable auxiliar del trimestre 3 es igual a 1, si
ocurre el trimestre 3, siendo 0 en otros casos.
• Si las variables anteriores son 0 ocurre el
trimestre 4.
21
2. Solución
Para crear una variable auxiliar para el trimestre
1, introducir =SI(B12=1;1;0) en G12 y copiarla
a G13:G42.
De manera similar podemos crear variables
auxiliares para los trimestres 2 y 3.

22
2. Solución
Además de la estacionalidad, deseamos usar
variables macroeconómicas, tales como,
producto nacional bruto (GNP), tasa de
desempleo (Unemp) y tasa de interés (Int).
Dado que no conocemos ninguno de esos
valores sino hasta que el trimestre en cuestión
haya ocurrido, deberemos usar valores
desfasados.

23
2. Solución
Para aplicar un desfase introducir =D11 en J12 y
copiarla a J13:J42.
Luego realizamos un procedimiento similar para
el desempleo e interés (columnas E y F).

Vista parcial

24
2. Solución
Seleccionamos Datos/Análisis de
datos/Regresión e ingresamos los datos:

25
2. Solución
Los resultados obtenidos, incluyendo la recta de la
regresión, se muestran a seguir:

26
2. Solución
Adicionalmente, en la columna E
correspondiente a los valores p, observamos
que todos los valores son menores a 0.15.

Por tanto, concluimos que todas las variables


independientes tienen un efecto significativo.
Recordando que las ventas están expresadas en
miles de unidades, interpretaremos los
coeficientes de la siguiente manera.
27
2. Solución
Considerando las variables cuantitativas:
• Si el GNP en el último trimestre aumenta en
$1000 millones, las ventas aumentan en 174.
• Si el desempleo en el último trimestre aumenta
en 1%, las ventas disminuyen en 93,832.
• Si el interés en el último trimestre aumenta en
1%, las ventas disminuyen en 73,917.
28
2. Solución
Considerando las variables cualitativas:
• En el trimestre 1, las ventas de carros
excedieron en 156,833 al trimestre 4.
• En el trimestre 2, las ventas de carros
excedieron en 379,784 al trimestre 4.
• En el trimestre 3, las ventas de carros
excedieron en 203,036 al trimestre 4.
29
5. Solución
En el sumario de resultados observamos las
Estadísticas de la regresión:
• La variación de las variables independientes
explica el 78% (R2) de la variación de la
variable dependiente.
• El Error típico es 190,524 carros. Por ello, el
68% de las predicciones deben estar dentro de
1*Error típico y el 95% dentro de 2*Error
típico.
30
2. Solución
En la tabla del Análisis de varianza, la única
cantidad de interés es el Valor crítico de F.
Al ser este igual a 0.00000068 implica que solo
hay 6.8 chances en 10 millones de que todas
las variables independientes sean innecesarias
para predecir las ventas de carros.

31
3. Modelando no linealidades e
interacciones

32
3. No linealidades
Si deseamos predecir las ventas de un producto,
podemos hacer uso de diversas relaciones.
Un ejemplo de una relación lineal podría ser:
ventas = 500-10*precio
Esta relación implica que un incremento en el
precio en 1 unidad (para cualquier nivel del
precio) reducirá las ventas en 10 unidades.

33
3. No linealidades
Un ejemplo de una relación no lineal podría ser:
ventas = 500+4*precio-0.4*precio2
El gráfico se puede ver en Ch59/Practice Files/
Interactions.xlsx, en la pestaña nonlinearity:

34
3. No linealidades
Para el caso no lineal, mayores incrementos en
el precio resultan en mayores reducciones en
la demanda.
En resumen, si el cambio en la variable
dependiente causado por un cambio unitario
en la variable independiente no es constante,
habrá una relación no lineal entre ambas.

35
3. Interacciones
Si el efecto de una variable independiente sobre una
variable dependiente depende del valor de otra
variable independiente, decimos que las variables
independientes interactúan.
Por ejemplo, deseamos predecir ventas usando el
precio y el gasto en publicidad.
Si el efecto de una variación en el gasto en
publicidad es grande cuando el precio es bajo y
pequeño cuando el precio es alto, hay interacción.
Si el efecto de una variación en el gasto en
publicidad es el mismo para cualquier nivel de
precio, no hay interacción.
36
3. Test de no linealidad e interacción
Para ver si una variable independiente tiene un
efecto no lineal, podemos sumar una variable
independiente a la regresión que es igual al
cuadrado de la variable independiente.
Si el término cuadrático tiene un valor p bajo
(menor a 0.05), hay evidencia de una relación
no lineal.

37
3. Test de no linealidad e interacción
Para ver si dos variables independientes
interactúan, podemos sumar un término a la
regresión que es igual al producto de las
variables independientes.
Si el término tiene un valor p bajo (menor a
0.05), hay evidencia de interacción.

38
3. Problema
Se desea determinar cómo el género y la
experiencia influencian los salarios en una en
una pequeña empresa manufacturera.
Para cada empleado tenemos los siguientes
datos:
• Salario anual (en miles de $)
• Años de experiencia en la industria
manufacturera
• Género (1=femenino, 0=masculino)
39
3. Problema
Usaremos los datos para predecir el salario (variable
dependiente) en base a los años de experiencia y al
género (Ch59/Templates/Interactionstemp.xlsx):

40
3. Solución
Para determinar si los años de experiencia
tienen un efecto no lineal en el salario,
adicionamos el término Experiencia2,
introduciendo B2^2 en D2 y copiándola a
D3:D98.
Para determinar si la experiencia y el género
presentan interacción significativa,
adicionamos el término Experiencia*Género,
introduciendo B2*C2 en E2 y copiándola a
E3:E98.
41
3. Solución
Luego seleccionamos Datos/Análisis de Datos/
Regresión e introducimos los datos a seguir:

42
3. Solución
Aparte del Género, cuyo valor p (columna E) es mayor
a 0.05, todas las otras variables son significativas:

43
3. Solución
Para recalcular la regresión sin considerar Género
primero copiamos la plantilla actual y pegamos solo
los números a una plantilla nueva.
Seguidamente eliminamos
la columna del Género e
introducimos a la regre-
sión lo siguiente:

44
3. Solución
Todas las variables independientes ahora son relevantes:

45
3. Solución
El término negativo EXP2 hace que cada año adicional
de experiencia tenga menos impacto.
De hecho, a partir de 13 años, el impacto es negativo:

46
3. Solución
Siendo que el Género es 1 para mujeres y 0 para
varones, luego de substituir dichos valores
podemos predecir los salarios de mujeres:

Y de varones:

La interacción entre género y experiencia muestra


que cada año adicional de experiencia beneficia a
una mujer en 0.78-(-1.29)=$2070 menos que a un
varón.
47

S-ar putea să vă placă și