Sunteți pe pagina 1din 9

TÉCNICAS DE VALIDACIÓN DE MODELOS DE SIMULACIÓN

Ablan et all (2011) desarrollaron una librería aplicable en el programa estadístico R


para validación de modelos de simulación. Estos autores, en un artículo publicado en
la Revista Ciencia e Ingeniería, Edición Especial: “Jornada de Modelado y Simulación”
pp. 117-126, realizan una breve descripción de cada una de las técnicas con las que
desarrollaron la mencionada librería, las cuales son clasificadas como técnicas de
validación de modelos de simulación. A continuación se describen estas técnicas.

1.13.1 Error cuadrático medio

Tedeschi (citado por Ablan et al 2011) el cuadrado medio del error (MSE, por sus
siglas en ingles mean square error) consiste de las diferencias entre los valores
observados Y1, Y2,…,Yi,…,Yn y las predicciones del modelo X1,X2,…,Xi,…,Xn,
respectivamente.

La Ec. (1) muestra el cálculo de esta medida

𝑛
1
𝐶𝑀𝐸𝑅𝑅𝑂𝑅 = ∑(𝑋𝑖 − 𝑌𝑖)2
𝑛
𝑖=1

Cuando cada par de datos (Xi, Yi) es mutuamente independiente y el modelo es


independiente, el estimado del MSE es una medida contable de exactitud del modelo.
Si los parámetros del modelo fueron ajustados a los datos observados, el MSE
subestimara el verdadero valor de la medida porque el modelo tendera a reproducirlos
datos reales.
Con frecuencia se utiliza la raíz cuadrada media del error, mostrada en la Ec. (2), la
cual provee una medida del error en las mismas unidades que la variable bajo
consideración. Igualmente existe otra medida que puede ser más conveniente, esta es
el porcentaje de la raíz del cuadrado medio del error.

1.13.2 Error absoluto medio

Otra técnica que puede utilizarse, similar al MSE es el error absoluto medio (MAE, por
sus siglas en ingles mean absolute error), reflejado en la Ec. (2).

𝑛
1
𝐸𝑀𝐴 = ∑ |𝑋𝑖 − 𝑌𝑖|
𝑛
𝑖=1

MAE mide el error linealmente. Al igual que para el error cuadrático medio, una
medida ponderada del error pudiera ser útil, por lo cual se propone el porcentaje del
error absoluto medio (MAPE), como se den en la Ec. (3), que provee una medida
adimensional robusta Mayer & Butler (citado por Ablan et al, 2011).

𝑛
1 100
𝑃𝐸𝐴𝑀 = ∑|𝑋𝑖 − 𝑌𝑖| 𝑥
𝑛 𝑌̅
𝑖=1

La relación RMSE=MAE puede usarse como un indicador de valores aberrantes o


extremos. Si esta tasa es mayor a 1 señala la posible existencia de uno o más de estos
valores en el conjunto de datos.

1.13.3 Índice de acuerdo


El índice de acuerdo de Willmott, “d”, refleja el grado en el cual las observaciones son
estimadas en forma correcta por el modelo. No es una medida de correlación como tal
sino una medida del grado en el cual las predicciones del modelo están libres de errores.

𝑛
∑𝑖=1(𝑋𝑖 − 𝑌𝑖)2
𝑑 =1− 𝑛
∑𝑖=1(|𝑋𝑖 − 𝑌̅ | + |Yi − 𝑌̅|)2

Se utiliza con el fin de evitar problemas asociados con r y R2. Varía entre 0 (completa
discordancia entre el valor estimado por el modelo y el valor observado) y 1 (un ajuste
perfecto). Es un estadístico adimensional y su valor debe ser evaluado en base al
fenómeno estudiado, la medición de exactitud y el modelo elaborado. Se hace
significativo luego de su uso repetido en distintos problemas.

1.14 PROGRAMA ESTADÍSTICO “R”.

El programa estadístico R se emplea para el manejo del análisis de los datos,


visualización de reportes gráficos y desarrollo de Análisis de Varianza. Es un conjunto
integrado de servicios de software para la manipulación de datos, cálculo y gráfico.

Este programa tiene la capacidad de manipular y modificar datos y funciones, así como
de realizar gráficos de alta calidad. Es un programa que es de código abierto cuya
versión para Windows se obtiene del portal Web http://cran.r-
project.org/bin/windows/base/ (Venables y Smith, 2009).

Zambrano (2009), comenta que las grandes empresas de software en estadística


(llámese SAS, SPSS, Stata, Infostat, entre otras) se han venido aliando a este sencillo
programa para utilizar ciertas metodologías que este conjunto de paquetes puede
realizar. Ahora bien Holland, (S/F) citado por Zambrano, (2009), plantea siete razones
para usar este software:
 R es usado por la mayoría de los estadísticos académicos.
 R es independiente de la plataforma (sea linux, windows, MacOS).
 R dispone de muchos recursos de ayudas.
 R hace los mejores gráficos.
 La interfaz de líneas de comandos es mejor para la enseñanza.
 R es un lenguaje de programación completo, no sólo una aplicación en
estadística; y el sistema de distribución en línea está al alcance del usuario.

Igualmente Uriarte (2003), menciona que el programa R dispone de las siguientes


características:

 Almacenamiento y manipulación efectiva de datos.


 Una amplia, coherente e integrada colección de herramientas para análisis de
datos.
 Posibilidades gráficas para análisis de datos, que funcionan directamente sobre
pantalla o impresora, y un lenguaje de programación bien desarrollado, simple
y efectivo, que incluye, ciclos, funciones recursivas y posibilidad de entradas y
salidas. (debe destacarse que muchas de las funciones suministradas con el
sistema están escritas en el lenguaje R).
 El término “entorno” lo caracteriza como un sistema completamente diseñado
y coherente, antes que como una agregación incremental de herramientas muy
específicas e inflexibles, como ocurre frecuentemente con otros programas de
análisis de datos (Venables y Smith, 2009).

R es en gran parte un vehículo para el desarrollo de nuevos métodos de análisis


interactivo de datos. Como tal es muy dinámico y las diferentes versiones no siempre
son totalmente compatibles con las anteriores. Algunos usuarios prefieren los cambios
debido a los nuevos métodos y tecnología que los acompañan, a otros sin embargo les
molesta ya que algún código anterior deja de funcionar.
Aunque R puede entenderse como un lenguaje de programación, los programas escritos
en R deben considerarse esencialmente efímeros (Venables y Smith, 2009).

La cuantificación de los niveles de significancia están comprendidos entre cero (0) y


uno (1); dichos niveles se refieren al rango de aceptabilidad de la hipótesis, bien sea
nula o alternativa, en contraste con el valor alfa (α) utilizado en el diseño experimental,
siendo el más común 0,05 o 95% en el intervalo de confianza. Versani (2005), describe
el nivel de significancia arrojado como una respuesta del programa estadístico R para
una prueba de anava o un análisis de regresión, tal como se muestra en la Tabla 1.

Tabla 1. Nivel de significancia para rangos p-values.

Rango p-valué Estrellas de significancia Descripción común


0 *** Extremadamente significativa
0.001 ** Altamente significativa
0.01 * Estadísticamente significativa
0.05 . Pudiera ser significativa
0.1 No significativa

Verzami, (2005).

BIBLIOGRAFÍA CONSULTADA

Ablan, M. et al (2011). Una librería en R para validación de modelos de simulación.


Revista Ciencia e Ingeniería. Edición especial: Jornada de Modelado y
Simulación. Pp.117-126.
Aronoff, Stan (1989). Geographic Information Systems. A management perspective.
Otawa-Canadá. 294 p.

Baca, s. (2005). Regresion y correlacion [Documento en línea]. Dsiponible en:


http://m.monografias.com/trabajos30/regresion-correlacion/regresion-
correlacion.shtml. [Consultado: Febrero, 2013].

CEA. (2010). Sistemas de Información Geográfica, tipos y aplicaciones empresariales


[Documento en línea].Disponible: http://sig.cea.es/inicio [Consulta: 2012,
Diciembre 10].

Chuvieco, E. (2000). Fundamentos de Teledetección Espacial (3a.ed.). edit. RIALP,


S.A, Madrid.

Crawley, M. (2007). The R Book. John Wiley and Sons, Ltd. England.

Domínguez, A. (2010). Instrumentos para la medición de variables dasometrícas


[Revista
enlínea].Disponible:http://www.csisif.es/andalucia/modules/mod_ense/revista/
pdf/Numero_28/ALFREDO_DOMINGUEZ_ESCRIBANO_02.pdf [Consulta:
2013, Enero 10].

Giraldo, J. (2005) Historia de los SIG [Documento en línea].Disponible:


http://juliangiraldo.wordpress.com/sig/historiasig/[Consulta: 2012, noviembre
21]

Iturrate, E. (1998). Curso básico de teledetección con EVI [Documento en línea].


Disponible:
http://www.innovanet.com.ar/gis/TELEDETE/TELEDETE/portada.htm
[Consulta: 2012, noviembre 21]

Kuehl, H. (2001). Diseño de experimento. México Internacional Thomson Edición,


S.A.

Lahura, E. (2003). El coeficiente de correlación y correlaciones espúeras. [Documento


en línea]. Dsiponible en: http://www.pucp.edu.pe/economia/pdf/DDD218.pdf
.[Consultado: Febrero, 2013].

Luzanía, M. (2005). ¿Qué son los sistemas de información geográfica? [Revista en


línea].
Disponible:http://www.uv.mx/cienciahombre/revistae/vol18num3/articulos/inf
ormacion%20geografica/index.htm [Consulta: 2012, noviembre 21]
Malleux, J. (1982). Inventarios forestales en bosques tropicales. Lima, Per.
Universidad Nacional Agraria.

Mendenhall, W. (1997). Probabilidad y Estadísticas. Cuarta Edición. Prentice Hall.


México.

Muñoz, V. (2010). Inventario de densidad y actividad de poda en plantaciones de pino


caribe (pinuscaribaeavar. Hondurensis, establecidas por MPPAT-PROFORCA.
Trabajo de grado Tecnología en Industria Forestal. Universidad Experimental
de Guayana, Bolívar, Venezuela.

Murray, S. (1970). Estadística. Primera Edición. McGraw-Hill. México, pág. 45-69.

Orozco, L. (2002). Inventarios forestales para bosques latifoliados en América Central.


Centro agropecuario tropical de investigación y enseñanza, CATIE. Turrialba,
Costa Rica.

Parra, A. (2008a), Sistemas de Información Geográfica-Nivel 1. Universidad de los


Andes, Instituto de Fotogrametría, Mérida, Venezuela.

Parra, Alexander (2009): Curso de Sistemas de Información Geográfica II. Universidad


de Los Andes. Facultad de Ingeniería. Instituto de Fotogrametría. Mérida.
Venezuela.

Peña, D. (2002). Análisis de datos multivariantes. 1ra. Edición, McGraw-Hill. Madrid,


pág. 104.

Peña, J. (2009). Sistemas de información geográfica aplicados a la gestión del territorio.


Tercera edición. San Vicente - España.

Perencsik, A., Woo, S., Booth, B., Croser, S., Clark, J. y MacDonald, A. (2005),
ArcGis9: Building a Geodatabase, ESRI Inc., California, EEUU

Pérez, C. & Muñoz, A. (2006). Teledetección: Nociones y Principios. Tercera edición.


Universidad de Salamanca- España.

Qu, J. (2006). Earthsciencesatelliteremotesensing: Data, ComputionalProcessing and


Tools. Vol II. TsinghuaUniversityPress, Beijing - China.

Rojas, F. & Ortiz E. (1991). Pino caribe (Pinus caribaea) Especie de árbol de uso
múltiple en América Central. Centro agropecuario tropical de investigación y
enseñanza, CATIE.
Royero, O. (1993). Compensación de las mediciones GPS efectuadas en el perfil
andino venezolano. Trabajo de grado. Universidad del Zulia. Maracaibo-
Venezuela. Pág. 51.

Schowengerdt, R. (2007). Remotesensing: models and methodsforimageprocessing.


Tercera edición. San Diego, California - Estados Unidos.

Sedano et all (2009). Correlación lineal y análisis de regresión. [Documento en línea].


Dsiponible en: http://www.uoc.edu. [Consultado: Febrero, 2013].

Segado, F. (1996). Principios de teledetección. Murcia, España: Universidad de


Murcia.

SIGIS, (2012). Sistema de información geográfica. En soluciones integrales GIS


[Documento en línea].Disponible:
http://www.sigis.com.ve/index.php?option=com_content&view=article&id=9
5%3Asistema-de-informacion-geografica&catid=58%3Aconceptos-
basicos&Itemid=63 [Consulta: 2012, noviembre 21]

Stell, R. y Torrie, J. (1985). Bioestadística; Principios y Procedimientos. 2da. Edición,


McGraw-Hill. México, pág. 179.

Ugalde, L. (1996). Resultado de 10 años de Investigación Silvicultural. Centro


agropecuario tropical de investigación y enseñanza, CATIE. Turrialba, Costa
Rica.

Uriarte, R. (2003). Introducción al uso y programación del sistema estadístico R.


[Documento en línea]. Disponible en: http://cran.r-
project.org/doc/contrib/curso-R.Diaz-Uriarte.pdf. [Consulta: 2013, Enero 10]

Venables, w y Smith, d. (2009). Un Ambiente de Programación de Análisis de Datos y


gráficos. [Documento en línea]. Disponible en: http://www.r-project.org/.
[Consulta: 2013, Enero 10].

Vilchez, J. (2000). Introducción a los sistemas de información geoespacial. Primera


edición. Venezuela.

Wikipedia. (2012). Análisis de varianza [Documento en línea].Disponible:


http://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza [Consulta:
2013, Enero 10].
Zarzosa, N. (2002). Sistemas de información geográfica: prácticas con ArcView.
Primera edición. Universidad Politécnica de Catalunya - España.

Zeiler, M. (2001), Exploring ArcObjects, Vol 1. Applications and Cartography, ESRI


Inc. California, EEUU.

S-ar putea să vă placă și