Sunteți pe pagina 1din 22

Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial.

IES Sierra de Carrascoy (AMM)

ANEXO: PREVISIÓN DE LA DEMANDA


U.T. 4. Proceso de compras: búsqueda de proveedores
1.1 La previsión de la demanda .................................................................................................................. 2
1.2 Modelos de previsión de demanda ....................................................................................................... 2
1.3 Método ingenuo (naivë) ......................................................................................................................... 3
1.3.1 Utilidad del método ............................................................................................................................. 4
1.3.2 Caso práctico 3. Solución .................................................................................................................... 4
1.4 Método de las medias simples ............................................................................................................... 4
1.5 Método de las medias móviles .............................................................................................................. 4
1.5.1 Utilidad del método ............................................................................................................................. 5
1.5.2 Ventajas de esta técnica de predicción ................................................................................................ 5
1.5.3 Procedimiento de resolución con Excel .............................................................................................. 6
1.5.1 Caso práctico 3. Solución con método de medias móviles .................................................................. 8
1.6 Análisis de Regresión lineal simple y correlación ............................................................................. 10
1.6.1 Correlación ........................................................................................................................................ 11
1.6.2 Contraste de hipótesis o prueba de significación .............................................................................. 12
1.6.3 Procedimiento de resolución con Excel ............................................................................................ 13
1.6.4 Caso práctico 3. Solución. Método: Regresión lineal simple ............................................................ 14
1.7 Actividades adicionales ....................................................................................................................... 21
1.8 Apéndice 1: Algunas funciones estadísticas de Excel ....................................................................... 22
1.9 Apéndice 2: Conceptos previos........................................................................................................... 22

Pág. 1/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
1.1 La previsión de la demanda
Este apartado desarrolla el apartado 4.2.0 de la unidad 4 del libro de texto (dentro del apartado 4.2,
“Proceso de compras”) (véase el fichero de diapositivas facilitado en el Blog habitual).
La previsión de la demanda, como se indicaba en apartado: 2.2.1. Variables que influyen en el
aprovisionamiento, es un elemento a contemplar cuando hablamos de logística. Especialmente cuando
utilizamos la estrategia de “empuje”. Recordamos: los sistemas de arrastrar o pull y de empujar o push,
son dos enfoques de gestión de operaciones, en el primero los artículos se fabricarán o se comprarán en
respuesta a la demanda, en el segundo se fabricarán o se comprarán con base en lo que se planea o
anticipa (Véase U.T. 2, apartado 2.2.2).
Prever la demanda, es la alternativa que se utiliza para determinar la posible cantidad de producto
demandado en un periodo futuro, aunque las herramientas que se indican son susceptibles de ser usadas
para pronosticar el comportamiento de cualquier variable; en el área empresarial –que es nuestro marco
de referencia- serviría para estimar: número de vendedores, volumen de producción, comisiones,
beneficios, etc.
Para la previsión de la demanda existen diversos métodos que se utilizarán en función de lo siguiente:
 El plazo de la previsión de la demanda: corto, medio o largo.
 La disponibilidad de datos históricos fiables (datos de ventas ya realizadas en los periodos
anteriores al que se pretende predecir).
 La exactitud exigida en la previsión, que Prever es tan molesto como conducir un
dependerá del tipo de producto, del
mercado y de la estrategia comercial de automóvil con los ojos vendados y siguiendo
la empresa. En aquellos casos en los que
no se puedan utilizar datos históricos de
las indicaciones de una persona que mira al
ventas, bien porque se trate de un exterior a través del espejo retrovisor.
producto nuevo o bien por la falta de
rigor de los datos, se puede estimar la Anónimo (Kotler)
demanda.
En cualquier caso, y antes de describir los diferentes métodos de previsión, es necesario tener esto en
cuenta:
 Ningún método de previsión es perfecto, pues es imposible determinar los acontecimientos
futuros.
 La exactitud de la previsión depende del rigor y objetividad de los datos. La previsión de la
demanda tiene como objetivo fundamental reducir la incertidumbre y, por tanto, el riesgo en la
toma de decisiones logísticas y comerciales.
 Las herramientas que veremos se usan como complemento a otras formas de estimación. Se
podría utilizar la investigación de mercado, realizando un estudio de campo –una encuesta, por
ejemplo- que permitiera, calcular el número posible de consumidores y lo que podrían consumir
en los mercados de consumo, o bien entre nuestros clientes industriales (se pregunta
directamente a los interesados por la posibilidad de adquirir el producto)., para prever sus
necesidades. Podrían usarse clientes actuales y/o potenciales.
 En muchos casos es más importante identificar los factores que hacen variar la demanda que
cuantificar su posible variación. Los datos obtenidos en las previsiones deben servir como base
para la toma de decisiones estratégicas de la empresa, decisiones que influyen directamente en la
gestión de stocks.

1.2 Modelos de previsión de demanda


Para calcular la previsión de la demanda existen diferentes métodos, entre los que destacan los
siguientes:

Pág. 2/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
Subjetivos (cualitativos): se basan en opiniones y juicios de expertos en la materia. Pueden ser
cuantificados. Se suelen utilizar para el largo plazo o bien para estimar la demanda de nuevos productos
de los que no tenemos datos históricos. La mayor utilidad radica en que son capaces de identificar las
tendencias del mercado, siendo su mayor problema la subjetividad, ya que no se basa en datos
numéricos. Ejemplos: Delphi, encuestas, etc. Más info sobre previsión de demanda en nuevos
productos: aquí.
Objetivos (cuantitativos): las previsiones se realizan a partir de series cronológicas de datos. Se utilizan
cuando los datos de que se dispone sobre el mercado son lo suficientemente fiables. Su mayor utilidad
es la posibilidad de cuantificar con cierta exactitud la demanda futura, o bien determinar las causas que
producen las variaciones. Pueden ser de dos tipos:
o No causales: se realizan previsiones de la demanda futura sin analizar las causas de sus posibles
variaciones. Ej. Medias móviles, ingenuo, medias simples, técnicas de alisado, análisis gráfico,
etc.
o Causales: se explican los factores que más pueden incidir en las variaciones de la demanda
futura. Ej. Análisis de regresión (lineal o no lineal), métodos econométricos, descomposición de
series temporales (estudian la estacionalidad), etc.
La elección de la técnica de previsión más adecuada vendrá dada por un compromiso aceptable entre
el mayor coste que representa la utilización de una técnica de previsión más sofisticada, y, por tanto,
más precisa, y la reducción de costes que implica un menor stock de seguridad.
Para la gestión de stocks los métodos idóneos son los métodos objetivos no causales, principalmente los
métodos ingenuo, de las medias simples y de las medias móviles.
Veremos algunos de los métodos objetivos de previsión indicados: concretamente, los no causales:
método ingenuo, medias simples; medias simples y del grupo de los causales, el de regresión simple.
Haremos uso de la herramienta Excel, para omitir en lo posible la formulación, lo que excede los
objetivos de este módulo.
Nota: En los diferentes métodos, se incorpora la solución para el caso práctico que se incluye en el
apartado Caso práctico 3. Solución, en pág. 13.

1.3 Método ingenuo (naivë)


Este método consiste en aplicar el porcentaje de variación del periodo anterior al periodo futuro, de
forma que se supone que la tendencia de las ventas se mantiene constante en el tiempo.
Es un método muy sencillo de calcular pero poco riguroso. Algunas de sus variantes solo tienen en
cuenta las variaciones del último periodo. Si tomamos P como el volumen de ventas de cada periodo, la
fórmula de cálculo es:
Ingenuo I:

𝑃𝑛 − 𝑃𝑛−1
𝑃𝑛+1 = + 𝑃𝑛
𝑃𝑛−1
Supone que el último incremento relativo se mantiene para el próximo valor.
O sea para calcular Pn+1 se suma la variación (positiva o negativa) relativa (se recomienda usar tanto
por 1) entre los dos últimos valores conocidos.

Ingenuo II. Variación:

Otros autores indican que el método ingenuo consiste en considerar que el próximo año se producirá la
última demanda conocida.
Pn+1= Pn
Ingenuo III. Variación:

Pn+1= Pn+(Pn-Pn-1)

Pág. 3/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
O sea para calcular Pn+1 se suma la variación (positiva o negativa) absoluta producida entre los dos
últimos valores conocidos.

Otros métodos ingenuos: Algunos autores proponen que de adoptar alguna de estas modalidades
anteriores, se recomienda usar la variación media de los valores observados (media simple)

1.3.1 Utilidad del método


La capacidad predictiva de este tipo de modelos es muy limitada por lo que no suelen utilizarse más que
como marco de referencia para evaluar la calidad de métodos más complejos: un método más complejo
que no lograra sustanciales reducciones del error de predicción respecto a cualquiera de los modelos
naivë sería, evidentemente, un mal método (complejidad sin contrapartida).

1.3.2 Caso práctico 3. Solución


Solución para el caso “Rotini” que se indica más abajo: Ingenuo 1. Y9 23,1

Solución para el caso “Rotini” que se indica más abajo: Ingenuo 2. Y9 23,0

Solución para el caso “Rotini” que se indica más abajo Ingenuo 3. Y9 25

1.4 Método de las medias simples


Este método emplea todos los valores de la serie cronológica para calcular su media aritmética como
previsión para el periodo siguiente. De esta forma, se supone que las variaciones de un periodo están
condicionadas por las variaciones que tuvieron lugar en los periodos anteriores.
El problema está en que se otorga la misma importancia a las variaciones producidas en todos los
periodos sin tener en cuenta su proximidad al momento real.
Si tomamos P como el volumen de ventas de cada periodo, la fórmula de cálculo es:
∑𝑛1 𝑃𝑖
𝑃𝑛+1 =
𝑛
En Excel, función PROMEDIO calcula la media simple, como recordarás.
La solución para el caso práctico “Rotini”, que se incluye más adelante es: Media simple Y9 15,4

1.5 Método de las medias móviles


Para resolver el problema de otorgar la misma importancia a todas las variaciones entre periodos sin
tener en cuenta la antigüedad de los datos (modelo de medias simples), se puede aplicar el método de
medias móviles. En este método se toman todos los valores de la serie cronológica de tantos en tantos,
de forma que se indica el rango de la media móvil. Por ejemplo, los valores tomados de tres en tres
indican una media móvil de rango tres.
Con el resultado de las medias obtenidas con los valores según el grado, se hace una nueva serie, y la
previsión se obtiene de esta nueva serie.
El cálculo de las medias móviles indica la tendencia que ha seguido la serie de datos a lo largo del
tiempo, de forma que el resultado responde a la tendencia de toda la serie de datos.
Para aplicar la media móvil a una serie de tiempo, los datos deben seguir una tendencia muy lineal y
tener un patrón rítmico definido de las fluctuaciones (que se repita, por ejemplo, cada tres años).
La fórmula de cálculo para la media móvil (media móvil simple) de rango tres de los tres primeros
valores de una serie es:
𝑀𝑀3 = (𝑃1 + 𝑃2 + 𝑃3)/3 )

Pág. 4/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
El número de valores de datos por incluir en la media móvil es discrecional, depende del carácter de los
datos recopilados. Si los datos son trimestrales, puesto que hay cuatro trimestres en un año, sería
adecuado tener cuatro términos. Si los datos son diarios, como hay siete días en una semana, sería
apropiado tener siete términos o si se estudia la producción de energía eléctrica de varios años; el rango
de la media móvil sea de 12 (12 meses recoge la producción en un año). También se puede emplear el
método de prueba y error, aunque lo habitual es usar el nivel de agrupación con menor error típico
medio.
En una media móvil se orden k, se pierden k-1 observaciones. O sea, para una MM3 se pierden 2 (3-1).

1.5.1 Utilidad del método


Los resultados solo deben ser tomados como mera orientación.
Este método se usa cuando la relación entre variables no se ajusta a ninguna forma o curva conocida.
Por ejemplo, si la producción industrial cae de forma muy relevante en agosto. A la hora de predecir el
valor de tal serie en un mes como septiembre, la inclusión de un mes como agosto en el cálculo de la
media, puede infravalorar el valor de predicción. Por todo ello, es más frecuente utilizar la técnica
conocida como medias móviles, en lugar de las medias simples.

Si la serie temporal es larga; es posible que haya


cambios estructurales, que se diluirían en la predicción
final. Si la serie es corta, no se contemplaría la posible
estacionalidad.
Hay que asegurarse de tener suficientes datos pasados
para hacer un análisis de tendencia significativo. Si los
datos son insuficientes o se dejan de tener en cuenta las
fluctuaciones normales para negocios estacionales, los
resultados estarán distorsionados. Se recomienda tener
datos de al menos dos años, o si se tienen más, mejor.

1.5.2 Ventajas de esta técnica de


predicción
1. Las medias móviles resultan más apropiadas
cuando la aleatoriedad de los datos es elevada y
la autocorrelación – se produce cuando los
valores de un periodo influyen en otro- baja.
2. La media móvil solo tiene memoria de un
período, sólo debe ser utilizada con fines
predictivos a corto plazo.
3. Presenta una progresión tanto más suavizada cuanto mayor sea el número de términos incluidos
en el promedio.
4. La media móvil, puede resultar una buena estimación de la demanda media futura cuando nos
encontramos en una situación estacionaria, es decir, sin tendencia ni estacionalidades.

Desventajas de las medias móviles:


a) La presencia de tendencia marcada o estacionalidad hace muy arriesgado utilizar las medias
móviles para la estimación.
b) Para evitar la estacionalidad, pueden elaborarse medias móviles de orden igual al orden
estacional (técnica de alisado), pero esto, válido a efectos de ajustes del promedio general,
implicará varios sesgos en materia de predicción. Una media móvil de este tipo “filtra” la
estacionalidad y, por tanto, después habrá de nuevo de añadirse a la estimación realizada sobre la
serie filtrada.

Pág. 5/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
1.5.3 Pronóstico
Una vez comprobada el intervalo óptimo de agrupamiento (menor error típico medio), se procedería a
realizar la proyección de la variable en el futuro.
Para ello usaremos las herramientas de Excel (Análisis de datos y gráficos). Se explica en el apartado
correspondiente.

1.5.4 Procedimiento de resolución con Excel


Con Excel, se usa la función PROMEDIO, eligiendo tantos argumentos como valores se computen.
Para automatizar el cálculo, se usa la Herramienta para análisis, media móvil, pudiendo además crear
simultáneamente un gráfico con los valores estimados y los reales.

Para usar algunas herramientas de Excel, instalaremos (si no lo está ya) este paquete, siguiendo el
siguiente procedimiento: Agregar Herramientas para análisis: Botón Office-opciones-complementos-
Ir A-herramientas para análisis.
Para usar la herramienta (exige reinicio de Excel, si se instaló en esta sesión), accede a Datos-Análisis y
elige la opción adecuada, en este caso, Media Móvil.

 Se cumplimenta el cuadro de diálogo de la media móvil de la siente forma:


 En rango de entrada: Se incluyen los valores de la serie que se desea pronosticar.
 Intervalo: el número de valores que se usan para la media móvil.
 Rango de salida: ubicación del bloque de datos.
 Se marca la opción de gráfico y la del error típico.
También se puede incluir el error típico (raíz cuadrada de la suma de las desviaciones al cuadrado).
Este valor se utiliza para comparar los valores pronosticados tomando otro orden (k) de agrupación, de
modo que se elegiría la media móvil con la agrupación de periodos que minimice el error típico medio.
Si analizamos el resultado obtenido, (ver gráfico del caso práctico “Rotini” siguiente) y podemos
hacerlo directamente en el gráfico, observamos como la línea de pronóstico ofrece una línea de ventas
más suavizada, sin fluctuaciones 'salvajes' (como teníamos en los datos reales), lo que a la hora de
predecir modelos nos da cierta estabilidad.
Algunos autores, para centrar las series colocan los resultados de la media móvil, en el centro de los
valores observados, lo que difiere de la solución que muestra el gráfico de Excel. En el caso de valores
K impares no hay que hacer operación previa. En el caso de K par, (p.ej. si es de orden 4, se pierden 3
valores, por lo que el centro sería en la posición 1,5) hay que recalcular las medias de orden 2, con los
valores de la media móvil previa. Así se consigue reducir en 1 el número de medias móviles,
procediendo a centrar estos nuevos valores. Se muestra gráfico “Media móvil. Rotini. Datos
Centrados”, más abajo, con su correspondiente tabla.
Se muestra la representación con los datos pronosticados centrados. Por ser K par -4- se pierden 3
valores, por lo que se recalculan las medias de 2 valores.
Pág. 6/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
X Y MM4 previo MM4 Medias de dos valores 25 Media móvil. Rotini. Datos Centrados
1 8
2 10 11,25 20
3 15 13,25 12,25
4 12 15,25 14,25 15
Ventas
5 16 16,75 16
6 18 19,5 18,125 10 MM4 Centrada
7 21 19,5 19,5
5
8 23
0 10,5
1 2 3 4 5 6 7 8

Pág. 7/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
Alternativa para la representación de los valores pronosticados: Crear un gráfico de líneas (con
marcadores) y posteriormente añadir una línea de tendencia (de media móvil, con el orden deseado) a la
serie de los valores reales. Se observará que coincide la gráfica con los representados mediante el
procedimiento anterior, sólo que no se muestran los valores. Ver ejemplo a continuación:
25 Gráfico de líneas + línea de tendencia Media Móvil (Rotini)

20
Compras en Tm

15

Compras reales
10
1

0
1 2 3 4 5 6 7 8 9
Años

1.5.1 Caso práctico 3. Solución con método de medias móviles


El enunciado se facilita en el apartado, Caso práctico 3. Solución, en pág. 13.

En el caso de que la Sra. Cuadrado hubiera decidido aplicar el método de medias móviles, una vez
definido el nivel (2, 3, 4, etc.) debería sustituir los valores de la variable y por la media de los valores
según el nivel indicado.
Supongamos que define el nivel 4. La nueva serie de valores sería:

E F Manual Con Excel


Media móvil. Rotini
Valor Error
X (año) Y (compras) MM4 Cálculo
pronóst. típico 25
1 8 #N/A #N/A
2 10 #N/A #N/A 20
3 15 #N/A #N/A
15
4 12 = (8+10+15+12)/4= 11,25
Valor

11,25 11,25 #N/A


5 16 = (10+15+12+16)/4= 13,25 10
Real
13,25 13,25 #N/A Pronóstico
6 18 = (15+12+16+18)/4= 15,25 5
15,25 15,25 #N/A
7 21 = (12+16+18+21)/4= 16,75 0
1 2 3 4 5 6 7 8
16,75 16,75 2,90
Punto de datos
8 23 19,5 = (16+18+21+23)/4= 19,5 19,5 3,37
9 Previsión = (16+18+21+23)/4= 19,5
19,5 3,14 Error típ. Medio

Todos los cálculos en Excel se realizan con la función PROMEDIO. La previsión para el año 9 es la
última media móvil, o sea, 19,5. Con este nivel de agrupación el error típico medio es de 3,14. Dado
que la serie es muy corta, no procede comparar este valor con otros niveles de agrupamiento.
Se se hace manualmente (sin herramienta análisis de datos), los valores N/A anteriores a fila 3, se
pueden añadir manualmente con la función adecuada.
Algunos autores recomiendan “corregir” los cálculos de Excel, desplazando hacia abajo una fila, los
valores pronosticados, de modo que en el ejemplo, el valor pronosticado 11,25, debería estar en el año 5
(ver imagen anterior). La razón es que realmente el valor pronosticado para el año 5 es 11,25. No lo
corregiremos, aunque sí tendremos en cuenta este desfase en los pronósticos. De todas formas, para que
se muestre el valor pronosticado, habría que rehacer el gráfico.

Pág. 8/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)

Pág. 9/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
1.6 Análisis de Regresión lineal simple y correlación
El análisis de regresión lineal simple tiene por finalidad predecir y/o estimar los valores de la
variable dependiente o explicada, a partir de la obtención de la función lineal de la variable
independiente o explicativa1. La notación matemática de la ecuación de regresión simple se denota
como sigue:

Y = a + b*X
En donde:
 Y es la variable a predecir;
 a y b son parámetros desconocidos a estimar. a Es la constante, (el punto de corte en el eje Y) y
b es la pendiente de la recta.
Existen diferentes procedimientos para ajustar una función simple, cada uno de los cuales intenta
minimizar una medida diferente del grado de ajuste. La elección preferida ha sido, tradicionalmente, la
recta que hace mínima la suma de los cuadrados de las distancias verticales entre cada punto y la
recta. Esto significa que, de todas las rectas posibles, existe una y sólo una que consigue que las
distancias verticales entre cada punto y la recta sean mínimas (las distancias se elevan al cuadrado
porque, de lo contrario, al ser unas positivas y otras negativas, se anularían unas con otras al sumarlas).
Mediante la regresión simple mínimo cuadrática, se expresa la estructura funcional de la relación
existente entre dos variables, ajustando la nube de puntos dada por los pares de valores de las dos
variables a una curva de la forma mejor posible (minimizando la varianza del error). El ajuste será de la
forma Y=f(x)+e (omitimos otra forma que consiste en ajustar X=f(Y)+e) donde e denota el error
cometido cuya varianza debe ser mínima.

Ilustración 1: Ejemplo de ajuste Y (nota), en función de X (cociente intelectual)

1
En cuanto que formaliza una ecuación matemática que relaciona Y con X, implica, necesariamente, que la variable
explicativa X es causa de la variable explicada Y. Por ello, en cualquier aplicación de esta técnica, se requiere una cuidadosa
elección de las variables de análisis.
Pág. 10/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
Bondad del ajuste: Una vez tenemos la recta de regresión, es necesario saber si el ajuste que ofrece la
recta sobre la nube de puntos es suficientemente bueno. Es decir, se trata de saber si el modelo que se ha
ajustado para relacionar las variables X e Y es un modelo consistente. Para ello usaremos dos
estadísticos, el coeficiente de correlación y el coeficiente de determinación.

1.6.1 Correlación
Se llama correlación al grado de dependencia mutua entre dos variables. El coeficiente de correlación
–R- (es un número adimensional -sin unidades) que intenta medir la intensidad con que dos variables
están relacionadas. Este concepto está directamente relacionado con el concepto de curva de regresión.
Cuando en el análisis de regresión, la curva es una recta, la regresión se llama lineal, y en este caso el
coeficiente de correlación se llama coeficiente de correlación lineal, y mide el grado de asociación lineal
que existe entre las variables. El ajuste será de la forma Y = a + b X + e (recta de regresión de Y sobre
X). El coeficiente de correlación mide la calidad de ese ajuste.
El valor del mismo se encuentra acotado, en términos absolutos, entre 0 y el valor.

El valor 1 nos indica covariación perfecta entre las variables y el valor 0 covariación nula. Valores
intermedios suponen relaciones de distinta intensidad, más estrictas conforme el valor del coeficiente se
aproxima a 1 o a -1 2.
Si tenemos en cuenta el signo del coeficiente, -1 y 1.
Valores positivos y negativos tienen la misma interpretación en cuanto a grado de covariación de las
variables, si bien uno u otro signo indica un tipo distinto en ésta. Así, cuando el valor del coeficiente de
correlación es positivo, indica relación o covariación directa (si una variable aumenta, la otra aumenta)
y, cuando el valor es negativo se da una relación inversa (si una de las dos variables aumenta, la otra
disminuye).
En todo caso, esta técnica de la correlación, aunque informa de la intensidad de la relación entre
variables y, por tanto de si es posible o no aproximar con suficiente precisión el valor de una variable
dado el valor de la otra 3, no permite llevar a cabo la cuantificación exacta de dicho valor. Para poder
determinar numéricamente el valor aproximado a tomar por la variable Y conocido un valor de X,
hemos de acudir al análisis estadístico de la regresión.
Coeficiente de determinación
Una vez que se ha realizado el ajuste por mínimos cuadrados, conviene disponer de algún indicador que
permita medir el grado de ajuste entre el modelo y los datos. En el caso de que se hayan estimado varios
modelos alternativos podría utilizarse medidas de este tipo, a las que se denomina medidas de la bondad del
ajuste, para seleccionar el modelo más adecuado.

La más conocida es el coeficiente de determinación, al que se designa por R2 o R cuadrado


R² es simplemente el cuadrado del coeficiente de correlación de Pearson (R). O lo que es lo mismo,

𝑅 = √𝑅2

2
Este coeficiente, en cuanto medida del grado de intensidad de la relación entre las variables, es una medida de tipo
cualitativo. Es decir, si en un caso por ejemplo el valor es 0,4 y en otro 0,8, no quiere decir que en el segundo la intensidad
de la relación sea el doble que en el primero; sólo informa que en el segundo esta relación es mayor.
3
En las aplicaciones prácticas se recomiendan valores altos de este coeficiente, del orden de 0,9 o más, para decir que existe
un grado adecuado de covariación.

Pág. 11/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
2
Este estadístico (R ) mide la proporción de la variación total en la variable dependiente Y que se
explica, o contabiliza, por la variación en la variable dependiente X. Ej. Si R², es 0,576, es posible decir
que 57,6% de la variación en el número de copiadoras vendidas (variable Y explicada), se explica o
contabiliza, por la variación en el número de llamadas de vendedores (variable X; explicativa).

En general, R² es una medida de la bondad del ajuste por regresión. Si R² se aproxima a la unidad el
ajuste es bueno y si R² se acerca a cero el ajuste es malo. Esta definición e interpretación de R² es válida
para cualquier tipo de ajuste aunque no sea lineal.
En cuanto a relación entre correlación e independencia, se observa
que, si las variables son independientes estarán incorrelacionadas,
ya que R=0 cuando hay independencia. Ahora bien, el recíproco
no es necesariamente cierto, ya que dos variables pueden estar
incorrelacionadas linealmente y ser dependientes, puesto que al
ser R=0, lo único que podemos decir es que la asociación lineal es
nula, pero esas variables pueden depender según otro tipo de
asociación (parabólica, exponencial, logarítmica, etc. En la
ilustración se muestran algunas que usa Excel).

Ejemplo de correlaciones espurias: Conforme disminuye la población de burros, aumenta el número de


grados doctorales otorgados. Se puede deducir que cuando se tienen dos variables con fuerte correlación
es que hay una relación o asociación entre ambas variables, no que un cambio en una ocasiona un
cambio en la otra.

Resumen: coeficientes de correlación y de determinación


En el caso de una relación lineal entre dos variables, tanto el coeficiente de determinación como el
coeficiente de correlación muestral proporcionan medidas de la intensidad de la relación.

El coeficiente de determinación proporciona una medida cuyo valor va desde 0 hasta 1, mientras que el
coeficiente de correlación muestral proporciona una medida cuyo valor va desde –1 hasta +1. El
coeficiente de correlación lineal está restringido a la relación lineal entre dos variables, pero el
coeficiente de determinación puede emplearse para relaciones no lineales y para relaciones en las que
hay dos o más variables independientes (regresión múltiple). Por tanto, el coeficiente de determinación
tiene un rango más amplio de aplicaciones.

1.6.2 Contraste de hipótesis o prueba de significación


El contraste de hipótesis consiste en averiguar si los datos observados en las muestras respaldan las
hipótesis sobre las poblaciones.
Este procedimiento es a menudo considerado como un test global de idoneidad del modelo y se conoce
habitualmente como contraste ómnibus. .
Mediante este contraste se comprueba si, de forma global, el modelo lineal es apropiado para modelizar
los datos.
Generalmente las hipótesis nulas se enuncian bajo el supuesto de que no hay efectos entre las
variables. En nuestro caso, la hipótesis nula será una correlación nula, o sea, que la variable
dependiente e independiente no están correlacionadas.

La hipótesis emitida se designa por H0 y se llama hipótesis nula.

Pág. 12/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.

Usaremos el coeficiente 𝛽. La hipótesis alternativa será lo contrario: que ambas variables están
relacionadas y por lo tanto la variable independiente tiene poder predictivo de la variable dependiente,
en la población.
𝐻0 : 𝛽𝑜 = 0
𝐻1 : 𝛽1 ≠ 0
Estas pruebas de significación se hacen con valores de (nivel de significación) del 0,05 (Nivel de
confianza del 95%), 0,01 (Nivel de confianza del 99%) o del 0,1 (Nivel de confianza del 90%).
Para el contraste de hipótesis se usan varias herramientas algo complejas. Usaremos, para este método
sólo el contraste F (de Fisher-Snedecor), y nos basaremos en los cálculos realizados por Excel. Véase el
apartado, en pág. 13.

1.6.3 Valores pronosticados


Una vez comprobada la relación entre las variables, mediante los estadísticos (coeficientes y contraste
de hipótesis), se procedería a realizar la proyección de la variable en el futuro.
Para ello usaremos las herramientas de Excel (Análisis de datos, funciones y gráficos). Se explica en el
apartado correspondiente.

1.6.4 Procedimiento de resolución con Excel


Pasos para realizar el análisis de regresión:
1. El primer paso sería inspeccionar visualmente la información para ver si existe una relación
lineal entre las variables. Para ello introducimos en Excel la información de la tabla y dibujamos
un diagrama o gráfico de dispersión (o nube de puntos).
2. Mejoramos la presentación del diagrama de
dispersión. En “Herramientas de gráficos- Gráfico de dispersión. Rotini
Presentación”: 25

a. En “Leyenda” seleccionamos “Ninguno” V 20


b. En “Título del gráfico” ponemos un e
n 15
título adecuado. t
c. En “Rótulos del eje” ponemos la a
10

información del eje de abscisas y del eje s 5


de ordenadas 0
1 3 5 7
Años

d. Con el menú contextual del eje: “Dar formato a eje…”, cambiamos la escala del eje
horizontal y ponemos fijo el valor mínimo y máximo de la escala.
3. Análisis econométrico:
A partir de la observación de los puntos, se observa una tendencia general que a medida que aumentan
los años, aumentan las ventas (Y); a este tipo de relación se le conoce como correlación directa o
positiva. Si Y tiende a incrementarse cuando se incrementa X, entonces tendríamos: Y = f (X).
Pero la inspección visual del diagrama de dispersión también sugiere que la relación entre las dos
variables es esencialmente lineal. Por tanto, si la relación f que liga Y con X es lineal, tendríamos la
ecuación de una recta: Y=a+bX. El gráfico ya se encuentra modificado según lo indicado anteriormente:

4
Letra griega alfa.

Pág. 13/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
Mediante la letra a designamos la ordenada en el origen (término constante), y mediante la letra b la
pendiente de la recta; la pendiente b es el cambio de Y (aumento de las ventas) asociado con un cambio
unitario en X (número de año). Sin embargo, en la práctica, la relación determinística anterior es
inadecuada porque hay otros factores que influyen en Y; un modelo empírico necesariamente debe
incorporar este hecho de la siguiente forma: Y = a + b X + e
El término de error, e, es una variable aleatoria que se añade para reflejar, entre otros aspectos, factores
que también explican el rendimiento pero que no los hemos tenido en cuenta en el análisis
La expresión anterior, en donde solo figura una única variable explicativa (X), se le conoce como
modelo de regresión lineal simple.
4. Ajustando una recta a los datos:
Nuestro objetivo es ahora ajustar una recta a la nube de puntos, buscando tanto la ordenada en el origen
a como la pendiente b (los parámetros del modelo). Ahora bien, en la práctica podrían ajustarse
infinidad de rectas; ¿cuál es la mejor? Excel nos va a buscar la mejor recta, llamada recta de regresión
mínimo-cuadrática Y= â+𝑏̂X. El gorro encima de a y b indican valores concretos que toman los
parámetros una vez estimados.5 Ver caso resuelto a continuación.

1.6.5 Caso práctico 3. Solución. Método: Regresión lineal simple


A continuación se muestra la resolución del caso práctico 3 mediante el análisis de regresión lineal
simple:

5
(Sabias que: estos caracteres, “con gorro” se obtienen, en Word, seleccionando el carácter, y desde el editor de ecuaciones,
añadiendo el énfasis)

Pág. 14/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)

Para los cálculos,


usaremos las funciones
estadísticas de Excel,
en lugar de las
fórmulas estadísticas
que se muestran, a
título ilustrativo.
También se usarán las
Herramientas para
análisis, para el análisis
de la regresión lineal

OBSERVACIÓN: En un sentido
estrictamente técnico, no se
considera que las compras de
cereales estén relacionadas
con el tiempo, sino que el
tiempo se usa como sustituto
de variables con las que está
relacionada la cifra de compras,
pero tales variables no se
conocen o son difíciles de
medir.

Pág. 15/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)

El valor del coeficiente de correlación lineal se encuentra entre -1 y 1. Si es igual a 1 la correlación es


perfecta y positiva, y si es -1 también sería perfecta, pero de carácter inverso.
Para su obtención recurriremos a la hoja de cálculo. Dentro de las funciones estadísticas nos
encontramos con «=COEF.DE.CORREL»; solo tenemos que incluir en la serie 1 los valores
correspondientes a x, y en la serie 2 los valores de Y. La fórmula nos devolverá el valor 0,9635, una
correlación alta, aunque al ser inferior a 1 se pone de manifiesto la presencia de alguna otra variable no
contemplada que influye también en la demanda. El coeficiente de correlación es válido sólo para el
análisis de la regresión simple.

Pág. 16/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
6
En las opciones del gráfico, (formato de línea de tendencia , con el menú contextual) también se permite
la obtención del coeficiente de determinación (R2), sin necesidad de usar la función.

El coeficiente de correlación es la raíz cuadrada de R2.


En el gráfico se muestra la “línea de tendencia” (lineal simple en este caso). También se ha incorporado
la media móvil.
Dispersión ventas. Rotini. Medias móviles y Línea de tendencia
simple.
y = 2,0595x + 6,1071
25 R² = 0,9285

20

venta s

15 MM3
Ventas

Tendenci a l i nea l

10

0
1 2 3 4 5 6 7 8 9
Año

El coeficiente de determinación con valor 0,9285 nos indica que existe una alta correlación entre las
variables Compras y año de la compra.
Este estadístico se puede obtener, a través de la opción correspondiente del gráfico de dispersión, o bien
utilizar la función de Excel, COEFICIENTE.R2.
En el caso práctico “Rotini S.A.”: Nota: En las fórmulas de Excel: A5:A12 (son los años y B5:B12, son
las compras observadas), o sea; X e Y respectivamente.
En este caso nos mide el % de la variación de las compras (el 92,8%) que está explicado por el año de
compra. El ajuste entre valores reales y proyectados, es bueno.
Estadísticos
Raíz de Coef. de Determinación (R2) Función COEF.DE.CORREL (R )

Fórmula 1 =COEFICIENTE.R2(A5:A12;B5:B12) =COEF.DE.CORREL(B5:B12;A5:A12)


Fórmula 2 =RAIZ(COEFICIENTE.R2(A5:A12;B5:B12))
Resultado 0,928462851 0,963567772
Se puede obtener a través del gráfico de
Observaciones En fórmula 1: Da igual el orden de las matrices
dispersión, con la línea de tendencia

6
Si se agrega una media móvil a un gráfico XY (Dispersión), la media móvil se basará en el orden de los valores
del eje X trazados en el gráfico. Para obtener el resultado deseado, puede que sea necesario ordenar los valores
del eje X antes de agregar una media móvil.
Pág. 17/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)

Interpretación desarrollada de de resultados (estadísticos:


Según el Coef. de Correlación: (-1/1) 0,9635, indica una correlación alta,
aunque al ser inferior a 1 se pone de manifiesto la presencia de alguna otra
variable no contempla da que influye ta mbién en la demanda. El coeficiente
de correlación es válido sólo para el a nálisis de la regresión simple, como es
nuestro caso. Recuerda, la correlación puede ser positiva o negativa.

Según el Coef. de determ inación: (0/1). 0,9285. En este caso nos mide el
% de la variación de las compras (el 92,8%) que está explicado por el año de
compra. El ajuste entre valores reales y proyectados, es bueno.

En un sentido estrictamente téc nico, no se considera que las compras de


cereales estén relacionadas con el tiempo, sino que el tiempo se usa
como sustitu to de variables con las que está relacionada la cifra de
compras, pero tales variables no se conocen o son difíciles de medir.

1.6.5.1 Proyección de los datos


Para mostrar los valores estimados en una tabla de Excel, se puede hacer de dos formas:
1) Usando la función pronóstico para obtener los valores concretos. También pueden calcularse uno
o varios valores, con la función TENDENCIA. En el
ejemplo:=TENDENCIA(COMPRAS_1_8;AÑOS). El valor previsto para el año 9 es 24,6 Tm.
de cereales. Para otro valor distinto al siguiente; en el argumento “nueva matriz” se selecciona
los valores de X para los que se desea el pronóstico. Compras_1_8 y AÑOS son nombres de
rangos.
Para los valores observados, la herramienta Análisis de datos, también calcula los valores pronosticados.
X (año) Y (compras) Con F(PRONOSTICO) ACLARACIONES PROYECCIÓN DE DATOS:
• Años: Es un nombre de Excel: (argumento X
1 8 8,2 conocido )
2 10 10,2 • Compras_1_8 : Es un nombre de Excel: (argumento
3 15 12,3 Y conocido )
4 12 14,3 • Sintaxis Año 9 :
5 16 16,4 =PRONOSTICO(A11;COMPRAS_1_8;AÑOS). Tambien
puede hacerse con la función =TENDENCIA(CO
6 18 18,5
MPRAS_1_8;AÑOS;A11).
7 21 20,5 • Los años 9 y 10 pueden ser estimados sin poseer
8 23 22,6 valores observados.
9 24,6
10 26,7

Pág. 18/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)

2) Pueden representarse gráficamente fácilmente los valores proyectados


También, al crear la recta de regresión (línea de tendencia), se pueden extrapolar (hacia delante o hacia
atrás, si procede) los periodos deseados.
Mira en la ilustración inferior la proyección de 2 periodos. Se modificó la escala del eje X para que
incluyera los + 2 periodos.
De esta forma no se reflejan los valores, sólo se muestran en el gráfico.
Para agregar la línea, elige la serie en el gráfico, menú contextual, línea de tendencia y rellena como en
la imagen.

Rotini. Línea de tendencia simple con 2 valores pronosticados


30

25

20
Ventas

15

ventas
10

Proyecta +2
5

0
1 2 3 4 5 6 7 8 9 10
Año

Pág. 19/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
1.6.5.2 Contraste de hipótesis y resumen de datos
Usando la herramienta Excel: Datos- Grupo Análisis-Análisis de datos-Regresión se obtiene:
Resumen
El contraste de hipótesis es un procedimiento consiste en averiguar si los datos observados en las
Estadísticas de la muestras respaldanlas hipótesis sobre las poblaciones. Uno de ellos es el contraste F.
regresión El contraste F nos indica que, con el 5% de significación (), la variable año es significativa en la
Coeficiente de
estimación de la variable compras.
correlación
múltiple 0,96356777 El Valor crítico de F < que el nivel de signficación. (0,00012 < 0,05), Se rechaza la hipótesis nula y se
Coeficiente de aceptala alternativa (nivelde significación en tanto por uno.).
determinación R^2 0,92846285 O lo que es lo mismo: o<),
R^2 ajustado 0,91653999
Indica la medida de variabilidad de la variable dependiente que no es explicada por la recta de regresión. En general,
Error típico
1,51251394 cuanto mejor es el ajuste, más pequeño es este error
Observaciones 8

ANÁLISIS DE
VARIANZA (ANOVA)
Grados de Valor crítico
Suma de cuadrados Promedio de los cuadrados F
libertad de F
Regresión 1 178,1488095 178,1488095 77,8725065 0,00011761
Residuos 6 13,72619048 2,287698413
Total 7 191,875

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%
Intercepción 6,107 1,178541366 5,181950363 0,002050449 3,22335603 8,99092969 3,223356
Variable X 1 2,060 0,233385968 8,824540017 0,000117613 1,48844892 2,6305987 1,4884489

Análisis de los residuales Resultados de datos de probabilidad

Pronóstico
Observación para Y Residuos Residuos estándares Percentil Y
1 8,2 -0,167 -0,119 6,25 8
2 10,2 -0,226 -0,162 18,75 10
3 12,3 2,714 1,938 31,25 12
4 14,3 -2,345 -1,675 43,75 15
5 16,4 -0,405 -0,289 56,25 16

Análisis de datos Contraste de hipótesis (Resumen, superior):


• Nivel de significación= 1-Nivel de confianza. Por defecto se calcula al 5%, aunque puede
indicarse otro (p.ej. 0,01).
• Observamos el valor crítico de F y lo comparamos con el nivel de significación.
• Hipótesis nula Ho: o= 0: Por simplificación, para el análisis que nos ocupa, la hipótesis nula
será que no existe correlación entre las variables estudiadas.
• Hipótesis alternativa: Ha:10. Las variables están relacionadas
• Se obtienen los parámetros de la recta: Los coeficientes de intersección -a- y la pendiente -b.
• En "Estadísticas de regresión" también se pueden observar los coeficientes de correlación y
determinación.
• También se muestran los valores pronosticados para Y.
• Obviamos el resto de valores.

Pág. 20/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
1.7 Actividades adicionales
ACTIVIDAD ADICIONAL 1 Rodstar S.L.
Respecto a los datos que se detallan: las ventas realizadas por Años Ventas en
Vendedor
10 vendedores de Rodstar S.L., con la experiencia en la experiencia u.m. (miles)
empresa, que se indica, SE PIDE: 1 1 80
1) Indica cuál es la variable dependiente y la 2 3 97
independiente. 3 4 92
2) Halla la recta de regresión. 4 4 102
5 6 103
3) Elabora un diagrama de dispersión con estos datos.
6 8 111
4) Representa la ecuación de regresión lineal simple 7 10 119
estimada que puede emplearse para predecir las ventas 8 10 123
anuales. 9 11 117
5) Usa la ecuación de regresión estimada para pronosticar 10 13 136
las ventas anuales de un vendedor de 9 años de experiencia.
6) Calcula los coeficientes de correlación y de determinación. Comenta su significado.
7) Comenta la bondad del ajuste, con un grado de significación del 5%.

ACTIVIDAD ADICIONAL 2 Kentucky

Kentucky S.A. presenta los siguientes datos históricos de producción del PRODUCCIÓN
MESES
producto XX, en miles de unidades físicas, en los últimos 22 meses. (m . uu. ff.)
1 593
SE PIDE: 2 570
1. Pronosticar la producción para el mes 23, usando el modelo de medias 3 486
móviles simples, tomando 3 periodos. 4 854
2. Elaborar un gráfico con la tendencia de los valores pronosticados según 5 797
6 362
el apartado anterior, de forma que se muestre el valor pronosticado.
7 594
3. Con el mismo método, probar con agrupaciones de de 4 y 5 periodos y
8 271
elegir el orden de agrupamiento más adecuado, razonando la respuesta. 9 450
4. Elabora el gráfico con los valores reales y los pronosticados, con los 3 10 254
niveles de agrupamiento. 11 433
5. Comprueba si existe correlación simple entre las variables facilitadas, 12 529
realizando los análisis gráficos y estadísticos pertinentes. Explica los 13 994
resultados. 14 319
15 610
16 748
17 832
18 193
19 720
20 415
21 536
22 850

Pág. 21/22
Ampliación U.T. 4. Apartado: Previsión de la demanda Gestión Logística y Comercial. IES Sierra de Carrascoy (AMM)
1.8 Apéndice 1: Algunas funciones estadísticas de Excel
FUNCIÓN UTILIDAD
PENDIENTE Calcula el valor b, de la recta de regresión lineal. No la usaremos.
Calcula el valor a, de la recta anterior. Punto de intersección con el eje
INTERSECCION.EJE
Y. No la usaremos.
COEF.DE.CORREL Coeficiente de correlación
Devuelve valores que resultan de una tendencia lineal, calculada con
TENDENCIA
el método de mínimos cuadrados.
Calcula las estadísticas de una línea utilizando el método de los
ESTIMACION.LINEAL "mínimos cuadrados" para calcular la línea recta que mejor se ajuste a
los datos.
Esta función calcula o prevé un valor futuro utilizando los valores
existentes. El valor previsto es un valor del eje Y para un valor del eje
X dado. Los valores conocidos son valores de x e y existentes, y el
PRONOSTICO
nuevo valor se calcula utilizando una regresión lineal. Esta función se
puede utilizar para prever las ventas futuras, las necesidades de
inventario y las tendencias de los consumidores.
Devuelve el cuadrado del coeficiente de correlación mediante los
COEFICIENTE.R2
puntos de datos de conocido y y conocido x.
Otras AQUÍ, entre otros.

1.9 Apéndice 2: Conceptos previos

 Población es el conjunto de todos los elementos que son objeto del estudio estadístico.
 Muestra es un subconjunto, extraído de la población (mediante técnicas de muestreo), cuyo
estudio sirve para inferir características de toda la población.
 Estadístico: En estadística un estadístico (muestral) es una medida cuantitativa, derivada de un
conjunto de datos de una muestra, con el objetivo de estimar o inferir características de una
población o modelo estadístico.
 Individuo es cada uno de los elementos que forman la población o la muestra. Si hablamos de
valores, equivaldría a un dato individual, a un valor observado.
 Tendencia: Se puede definir como un cambio a largo plazo que se produce en relación al nivel
medio, o el cambio a largo plazo de la media. La tendencia se identifica con un movimiento
suave de la serie a largo plazo.
 Efecto Estacional: Muchas series temporales presentan cierta periodicidad o dicho de otro
modo, variación de cierto periodo (anual, mensual...). Por ejemplo, el paro laboral aumenta en
general en invierno y disminuye en verano. Estos tipos de efectos son fáciles de entender y se
pueden medir explícitamente o incluso se pueden eliminar del conjunto de los datos,
desestacionalizando la serie original.
 Varianza: En teoría de probabilidad, la varianza (que suele representarse como σ2) de una
variable aleatoria es una medida de dispersión definida como la media aritmética del cuadrado de
la desviación de dicha variable respecto a su media. (Wikipedia). La letra es sigma (alfabeto
griego).
 Nivel o intervalo de confianza: En estadística, la probabilidad que asociamos con una
estimación de intervalo se conoce como el nivel de confianza. Esta probabilidad nos indica
cuánta confianza tenemos en que la estimación del intervalo de confianza incluya al parámetro
de la población. Una probabilidad más alta significa más confianza.
 Nivel de significación: Para simplificar, es el valor complementario del nivel de confianza. O
sea, si el nivel de confianza es del 95% (0,95), el nivel de significación será el 0,05 (el valor
complementario se calcula como: 1-0,95).

Pág. 22/22

S-ar putea să vă placă și