6 Análisis de entradas: especificaciones de parámetros y distribuciones del modelo
Existen muchos detalles que debe especificar por completo con la finalidad de definir un modelo de simulación que funcione. Probablemente piense primero en los aspectos lógicos del modelo, como qué entidades y recursos son, cómo entran las entidades y quizá cómo dejan el modelo, los recursos que se requieren, los caminos que siguen, etc. Estas clases de actividades podrían llamarse modelación estructural puesto que preparan la lógica fundamental de cómo quiere que se vea y qué haga el modelo. 4.6.1 Entradas deterministas contra aleatorias Un tema fundamental en la modelación es si va a modelar una cantidad de entradas como una cantidad determinista (no aleatoria), o si va a modelar como variable aleatoria siguiendo alguna distribución de probabilidad. A veces está claro que algo debería ser determinista, como el número de operadores de revisión, aunque puede ser que quiera variar los valores de ejecución a ejecución para ver qué efecto tienen en el desempeño. Pero a veces no hay tal claridad y sólo se podría considerar como un consejo de lo que se deba hacer para que parezca más realista y válido posible. En temas anteriores se vio el “análisis sensitivo” para medir qué tan importante es una entrada en particular para su resultado, lo que podría indicar qué tanto necesita preocuparse por si debe modelarlo como determinista o aleatorio Puede que sea la mejor opción desestimar la aleatoriedad de las entradas, ya que esto parece ser más sencillo y tiene ventaja de que los resultados del modelo no son aleatorios. Sin embargo, esto puede ser bastante peligroso desde el punto de vista de la validez del modelo, porque con frecuencia es la aleatoriedad en sí misma la que conduce a un comportamiento importante del sistema que con certeza uno debería captar en el modelo de simulación. 4.6.2 Recopilación de datos Uno de los pasos bastantes claros en la planeación de un proyecto de simulación debería ser identificar qué datos necesita para apoyar el modelo. Encontrar los datos y prepararlos para usarlos en su modelo puede adquirir mucho tiempo, ser costoso y con frecuencia, frustrante; y la disponibilidad y calidad de los datos pueden influir en el enfoque que tome de la modelación y en nivel de detalle que capte en el modelo. Existen muchos tipos de datos que es necesario recopilar. La mayoría de los modelos requieren una buena dosis de información que incluya demoras en el tiempo: tiempos entre llegadas, tiempos de proceso, tiempos de recorrido, programas de trabajo del operador, etc. En muchos casos también necesitará estimar probabilidades, tales como el porcentaje producido de una operación, las proporciones de cada tipo de cliente o la probabilidad de que un cliente tenga un teléfono de tonos. Si se modela un sistema en donde el movimiento físico de las entidades entre estaciones será representado en el modelo, también se requerirán los parámetros de operación y el bosquejo físico del sistema de manejo de material. Si el sistema que se modela existe (o es similar a un sistema real en algún otro lado), se puede pensar que el trabajo es más fácil, puesto que debería haber muchos datos disponibles. Sin embargo, lo que probablemente encontrará es que los datos que obtenga no serán los que necesite. En cualquier caso, conforme se decide qué y cuántos datos recopilar, es importante mantener en mente las siguientes pistas de ayuda.
Análisis de sensibilidad: El análisis de sensibilidad puede usarse incluso muy
temprano en un proyecto, para evaluar el impacto de los cambios de los datos en los resultados del modelo. Hacer corresponder el detalle del modelo con la calidad de los datos: Un beneficio de entender pronto la calidad de los datos de entrada es que esto puede ayudar a decidir qué tanto detalle incorporar en la lógica del modelo. Costo: Debido a que puede ser caro recopilar y preparar datos para usarlos en un modelo, puede decidir usar estimados peores para algunos datos. Basura que entra, basura que sale: Si no se ingresan datos adecuados concernientes a elementos críticos del modelo, no se podrá dar un gran voto de confianza en la confiabilidad de las conclusiones del modelo. 4.6.3 Uso de datos Si se tienen datos históricos (por ejemplo, un registro de interrupciones y tiempos de reparación para una máquina), o si se sabe qué parte del sistema trabajará (por ejemplo, programas de operadores planeados), hay que seguir enfrentando decisiones que conciernen cómo incorporar los datos en el modelo. La elección fundamental está en si se pueden usar los datos directamente o si hay que ajustar una distribución de probabilidad a los datos existentes. La decisión de qué acercamiento se puede orientar con base tanto en temas teóricos como en consideraciones prácticas. Arena tiene herramientas incluidas para cuidar de las mecánicas de usar los datos históricos en el modelo a desarrollar. Ajuste de distribuciones de entradas vía el analizador de datos de entrada (Input Analizer) Con los datos previamente obtenidos se puede seleccionar la distribución por si misma con Input Analyzer. Se estima los parámetros de distribución. Las distribuciones se pueden diferenciar en dos tipos
Teóricas: Generan muestras con base a la formulación matemática
Empíricas: Dividen los datos reales en grupos y calculan la proporción de los valores en cada grupo. Las distribuciones se dividen: continuas y discretas.
Continuas: se usan para representar duraciones de tiempo en un módulo.
Discretas: se usan para describir el número de eventos que ocurre en un intervalo de tiempo o variar en tamaño de lotes. Entre más observaciones (multimodal) exista en el estudio, mejor análisis de distribución se obtendrá. Está diseñada para ajustar distribuciones para datos observados, proporcionar estimados de sus parámetros, y medir que tan bien se ajustan los datos. Se requieren cuatro pasos para usar el Analizador de datos de entrada para ajustar una distribución de probabilidad a los datos para usarlos como una entrada en el modelo: 1. Crear un archivo de texto que contenga los valores de los datos, 2. Ajustar una o más distribuciones a los datos. 3. Seleccionar qué distribución quiere usar. 4. Copiar la expresión generada por el Analizador de datos de entrada en el campo apropiado en el modelo de Arena. Para abrir el Analizador:
Herramientas > Analizador de datos de entrada
Archivo > Nuevo o el botón nuevo (Página blanca). Archivo > Archivo de datos > Usar existente. Se puede utilizar una distribución teórica en automático ajustando todas las distribuciones aplicables. Se puede utilizar una distribución empírica ajustando manualmente. Las otras dos medidas de ajustes de distribución a los datos son las pruebas de hipótesis de bondad de ajuste Chi Cuadrada y Kolmogorov Smirnov. Sin datos Cuando no hay datos por cualquier razón, el usuario dependerá de algunas suposiciones o adivinanzas arbitrarias (datos adecuados). Se puede tomar en cuenta algún tipo de sensibilidad de los resultados para las entradas adecuadas. Si los datos representan una demora de tiempo se usará una distribución de probabilidad para captar la variabilidad como su incertidumbre. Se selecciona la distribución y después necesitará proporcionar los parámetros apropiados en base a los estimados y a la evaluación de la variabilidad en el proceso. Si los tiempos varian de forma independiente, su estimación de la media no es tan grande y hay mucha variabilidad en ellos (se recomienda una distribución exponencial). Si los tiempos representan una actividad donde hay un tiempo “más parecido” con alguna variación de ellos, se necesita una distribución que pueda capturar los procesos con grados de variabilidad chicos y grandes, con parámetros fáciles de entender (Distribución triangular).
Procesos de llegada no estacionarios
Representa de forma válida el comportamiento del sistema. Modelo de probabilidad especifico -> Proceso Poisson no estacionario -> Refleja patrones de llegada de tiempo variable- Hay que estimar la función de razón de los datos -> en este caso el método “Constante por segmentos”. Arena debe seguir el patrón establecido al generar las llegadas al respectivo modelo. Datos de entrada multivariados y correlacionados No todas las variables aleatorias son generadas independientes entre ellas. Si el modelo lo ignora puede generar un modelo no válido y el resultado con sesgo. Algunos métodos ven las variables aleatorias asociadas como un vector aleatorio que tiene una unión de distribución multivariada que ajustan valores de la cual generan.