Sunteți pe pagina 1din 14

Pontificia Universidad Javeriana

Maestra Ingeniera Industrial


Inteligencia de Mercados
Profesor: Jorge Alvarado
Presentado Por: Luis Bernal / Diego Daz
Taller 4: Miniproyecto4 Ventas por Catlogo.

Informe gerencial

El presente informe detalla la prediccin realizada sobre pronsticos de ventas de


productos para hombre, mujer y joyera de una tienda detallista que vende productos por
catlogo. La tienda cuenta con sucursales a nivel nacional, y para realizar el pronstico se
cuenta con una base de datos que describe el comportamiento de las ventas de la tienda
en 100 zonas, basado en la informacin de cada sucursal. Dentro de esta base de datos
se cuenta con variables que caracterizan las ventas anuales, como los datos de ventas
para cada lnea de producto, datos demogrficos de los clientes, inversiones en
publicidad, descripcin del mercado, etc.
Para iniciar con el anlisis de esta base de datos, se propone realizar un procedimiento de
regresin logstica sobre los datos, y mediante operaciones estadsticas tratar de
identificar posibles correlaciones entre los datos de las cuales se pueda derivar un
modelo predictivo. El objetivo con este procedimiento es saber si los recursos que se
asignan al proceso de ventas tienen poder para modelar la demanda de las zonas
respectivas.
Despus de ejecutar estas operaciones, he identificar varias correlaciones, se encontr
un modelo lineal que puede hacer pronsticos sobre la demanda requerida; en particular,
el modelo usa las variables predictoras hombre, mujer y joyeras, donde las mismas
son caracterizadas en funcin de los datos disponibles. Para la variable hombre, las
variables que usa para la prediccin son numero de catlogos enviados y nmero de
lneas abiertas para pedidos. La variable mujer usa numero de catlogos enviados, y la
variable joyera usa tambin numero de catlogos enviados. Este resultado brinda
algunas luces con respecto al comportamiento del mercado de la tienda detallista, en
especial de las estrategas de publicidad que puede desarrollar, dado que la variable
numero de catlogos enviados es comn a las tres variables predictoras del modelo
hallado, y en ltimas en la que define el comportamiento del modelo.
Verificando el comportamiento de este modelo hallado relacionado con el ajuste que
tiene en las predicciones, se observa que los residuales que arroja en las ltimas pruebas
son mnimos, por lo que es el mejor modelo hallado para los datos histricos
suministrados. Adicionalmente, este modelo ser usado sobre una base de datos fresca,
referente a 20 nuevas zonas, con el fin de pronosticar la demanda de las mismas basada
en los datos histricos del mercado.

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

Informe tcnico

Como punto de partida del anlisis se hace una inspeccin de la base de datos para
hallar en trminos generales valores atpicos y analizar normalidad de las variables. Se
inicia por un anlisis de las variables dependientes para saber cmo estn conformadas
con el fin de partir de las hiptesis validas que existen en la regresin lineal.

Lo cual nos permite observar que:


a. La variable de Ventas de prendas de Hombres posee una asimetra superior a uno
y una curtosis algo alejada de uno por lo cual podra determinar la presencia de
algunos valores extremos. En consecuencia es necesario toman en cuenta en los
anlisis que se realicen con esta variable.
b. Ventas de Joyera tiene una asimetra algo superior a uno pero el valor de la
curtosis se encuentra en el rango de valores.
c. La variable Ventas de prendas para mujer se encuentra entre los parmetros.
Ahora procederemos a realizar el anlisis descriptivo de las variables independiente

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

De lo cual sabemos a priori que las variables ID del mercado, Tamao del mercado, ID de
la ubicacin, Promocin son variables de tipo nominal y ordinal por lo cual los anlisis de
asimetra y curtosis no aplican muy bien. Por otra parte la variable Nmero de catlogos
enviados posee una alta curtosis convirtiendo a esta variable susceptible a la realizacin
de trasformaciones para poder linealizar su comportamiento e incluirlo en el anlisis de
regresin en el caso de que sea necesario en el futuro.
Teniendo los anlisis iniciales en cuenta en donde examinaremos en detalle las variables
que nos llamaron anteriormente la atencin procederemos a priori realizar un anlisis de
correlacin de las variables pero nos centraremos en la correlacin existente entre las
variables dependientes y las independientes con el fin de formarnos una idea de cmo se
puede construir el modelo.
De las variables dependientes tenemos:

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

Ventas prendas para Hombre est altamente correlacionada con: Nmero de


catlogos enviados, Nmero de lneas abiertas para pedidos, Nmero de
representantes del servicio al cliente, ID del mercado, nomina. Y en menor relacin
con Nmero de pginas del catlogo, Cantidad gastada en publicidad impresa,

Ventas prendas para Mujer est altamente correlacionada con: Nmero de


catlogos enviados, Nmero de lneas abiertas para pedidos, Nmero de
representantes del servicio al cliente y menor grado con ID del mercado, Nmero
de pginas del catlogo, Cantidad gastada en publicidad impresa,

Ventas de joyera est altamente correlacionada con: Cantidad gastada en


publicidad impresa Nmero de catlogos enviados y se encuentra en un menor
grado relacionada con Nmero de lneas abiertas para pedidos y Nmero de
representantes del servicio al cliente.

En trminos generales las variables Tamao de mercado, id de la ubicacin, edad de la


ubicacin del comercio y promocin no se deben tener en cuenta tanto como por su baja
correlacin con las variables dependientes asi como la informacin que aporta al anlisis
de la base de datos y de la informacin del negocio (en especial ID de la Ubicacin).
Ahora se revisara la correlacin existente entre las mismas variables independientes con
el fin de poder disminuir la multicolinealidad entre ellas

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

Desde ac podemos observar que las variables que estn ms altamente correlacionadas
con las variables dependientes y en contraposicin correlacionadas con variables ya
explicadas se encuentran correlacionadas haciendo que su informacin complemente el
modelo serian:

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

Nmero de catlogos enviados: recoge informacin de


Nmero de lneas abiertas para pedidos
ID del mercado
Cantidad gastada en publicidad impresa
Nmero de pginas del catlogo

A continuacin se procede a realizar el mtodo de pasos sucesivos (stepwise), con el fin


de corroborar estas suposiciones adems de contar con un algoritmo fuerte que pueda
analizar el comportamiento de las variables ya descartadas y confirmar nuestras
suposiciones iniciales. Por lo cual realizaremos el mismo proceso para las tres variables
dependientes a continuacin.

Ventas de Prendas para Hombre


Mediante el uso de pasos sucesivos con variable dependiente Ventas Hombre obtenemos.

Las cuales son las variables que seran ptimas para integrar en el modelo de regresin.
De lo cual podemos observar que los valores de los R ajustados para los diferentes
modelos creados se comportan:

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.
De lo cual concluimos que:

La ganancia entre el modelo 2 y el modelo tres aporta pero no lo suficiente, el Raj


solo mejora en 2%.

El valor estimado del error varia en tan solo un 7.5% con la inclusin de la tercera
Variable, mientras que la relacin del error estndar entre la primera variable y la
segunda fue del 26.68%

El valor de la prueba de Durbin Watson se encuentra un poco alta pero se puede


considerar en un rango normal de valores (1.491).

De forma complementaria al evaluar las variaciones mediante la anova de los modelos


obtenemos:

Lo cual se puede concluir de la siguiente forma que aunque la significancia en todos los
modelos es cero lo cual nos dice que funcionan como modelo explicativo de carcter de
regresin lineal.
El estimador F disminuye lo cual nos declara que el comportamiento no mejora sino que
tiende a desmejorar posiblemente por la presencia de una ligera no linealidad entre las
variables dependientes e independientes.

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

Por lo cual no es ptimo el trabajar con un modelo que incluya las variables desde la
tercera en adelante. En esta situacin lo recomendable seria modelar la variable de
Ventas de prendas hombre, nada ms utilizando las variables:

Numero de catlogos enviados.


Nmero de lneas abiertas para pedidos.

Para esto utilizaremos la regresin lineal con el modelo hacia adelante para logar la
inclusin de nada mas estas dos Variables.
De lo cual obtenemos:

Un Raj el cual puede explicar un 79% de la variable principal y un valor de la prueba


Durbin-Watson el cual nos mejora la relacin entre las variables dependientes e
independientes y no defina la independencia entre los mismos residuos los cuales se
puede observar que disminuye su auto correlacin.

Un modelo con una significancia de 0 lo cual nos muestra una alta explicacin de la
variable dependiente y un valor estadstico F mucho mejor que el esperado si se
integraran las 5 variables propuestas por pasos sucesivos.

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.
Podemos observar que las grficas de valores predichos contra residuos, los valores se
encuentran distribuidos a lo largo de la variable dependiente lo cual nos hacen confirmar
que tienen un comportamiento casi normal.

Igual nos confirma que entre los valores utilizados en la regresin no hay existencia de
valores atpicos los cuales deban ser analizados en detalle o influyan en el
comportamiento del modelo de alguna otra forma.
Con el fin de confirmar este comportamiento procederemos a realizar de forma resumida
las pruebas de Kolmogorov smikov.

El cual determina que el comportamiento


de los residuos tiene una significancia de
20% a la prueba lo cual no rechaza, y
acepta que la distribucin de valores se
comporta de manera normal.

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.
Modelo de Regresin para Ventas de prendas para Hombre.

El modelo que se debe aplicar para la prediccin.

Los residuales para este modelo se comportan de la forma,

Ventas de Prendas para Mujer


Mediante el uso de pasos sucesivos con variable dependiente Ventas prenda para
mujeres obtenemos.

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.
Las cuales son las variables que seran ptimas para integrar en el modelo de regresin.
De lo anterior podemos observar que los valores de los R ajustados para los diferentes
modelos creados se comportan:

Por lo tanto podemos concluir que:

El Raj de la primera variable es del 49% de las variables y la inclusin de ms


variables presenta un incremento porcentual menor al 10%.

El valor estimado del error varia en tan solo un 10.89% con la inclusin de la
segunda variable y decrece con la inclusin de las dems variables

El valor de la prueba de Durbin Watson se encuentra muy alta (1.796). Lo cual


nos hace concluir que si el modelo con estas 5 variables va a presentar una alta
auto correlacin entre los residuales lo que de entrada nos hace pensar en tener
menos variables para la regresin del modelo.

De forma complementaria al evaluar las variaciones mediante la anova de los modelos


obtenemos:

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

Lo cual se puede concluir de la siguiente forma:


Aunque la significancia en todos los modelos es cero lo cual nos dice que funcionan como
modelo explicativo de la regresin lineal. El estimador F disminuye lo que nos indica que
el comportamiento no mejora sino que tiende a desmejorar posiblemente por la
presencia de una fuerte no linealidad entre las variables dependientes e independientes.
Esto debido a que el estimador F cambia de 94.08 con la primer variable a 69.6 con la
segunda.
Es por esto que no es ptimo el trabajar con un modelo que incluya las variables desde la
segunda en adelante ya que aunque no es significativo a nivel de la prueba de
significancia de la anova si es significativa en el valor del estadstico F.
Por lo cual sera ptimo el modelar la variable de Ventas de prendas para Mujer, nada
ms utilizando la variable:

Numero de catlogos enviados.

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.
Por lo cual utilizaremos la regresin lineal con el modelo hacia adelante para logar la
inclusin de nada mas esta Variable.
De lo cual obtenemos.

Un Raj el cual puede explicar un 43.8% de la variable principal y un valor de la prueba


Durbin-Watson el cual nos mejora la relacin entre las variables dependientes e
independientes as mismo como la auto correlacin entre los residuos. Este valor seria el
mnimo que se podra obtener en el proceso de imputar ms variables ya que esta es la
que mejor se relaciona con la variable independiente. Para el anlisis de varianzas
obteneos el siguiente valor:

Un modelo con una significancia de 0 lo cual nos muestra una alta explicacin de la
variable dependiente y un valor estadstico F de 76.32 mucho mejor que el esperado
incluso con la integracin de 2 variables apoyando as la decisin de solo trabajar con
una variable en contrast con la integracin de las 5 variables propuestas por pasos
sucesivos. Podemos observar que las grficas de predichos contra residuos, los valores se
encuentran distribuidos a lo largo de la variable dependiente lo cual nos hacen presumir
que tienen un comportamiento casi normal.

Inteligencia de Mercados
Luis Bernal - Diego Daz
Taller 4: Miniproyecto 4 Regresin Lineal Ventas por catlogo.

En esta ocasin los grficos nos sealan una existencia lineal e independiente entre los
residuos pero existe un valor atpico el cual podra influir en la normalidad de la
distribucin de los residuos por lo cual tendremos en cuenta la existencia de este valor
atpico pero confirmaremos si en general los residuos se comportan de manera normal.
Con el fin de confirmar este comportamiento procederemos a realizar de forma resumida
las pruebas de Kolmogorov smikov.

El resultado de esta prueba nos seala


que
definitivamente
no
hay
un
comportamiento normal en los residuales
del modelo de regresin por lo cual se
examinara por inspeccin si la exclusin
del valor atpico puede mejorar el
comportamiento del modelo pero nada
ms se har a manera de experimento
sin incluir los resultados en el presente
documento.

Modelo de Regresin para Ventas de


prendas para Mujer.
El modelo que se debe aplicar para la prediccin.

S-ar putea să vă placă și