Sunteți pe pagina 1din 32

Contenido

4.1 Lista de estimadores a obtener de la simulacin...........................................................................2


4.1.1 Instrumentos de medicin ..................................................................................................2
4.1.2 Medios de registro de datos .............................................................................................2
4.2. Identificacin del estimador determinante (estimador lder) del tamao de la simulacin. .......4
4.3 Muestras preliminares de los proyectos aprobados en 3.4...........................................................6
4.4 Caractersticas estadsticas del estimador lider .............................................................................6
4.4.1 Establecimiento de la precisin ..................................................................................................8
4.4.2 Clculo del nmero mnimo de observaciones necesarias ..................................................... 10
Mtodo Estadstico............................................................................................................. 10
4.4.3 Intervalos de confianza ............................................................................................................ 16
4.3.5 Muestras grandes: Prueba de Karl-Pearson para ajuste de una distribucin de probabilidades
hipottica, discreta o contina con (hoja de clculo o con paquete de estadstico). ...................... 18
4.5.4 Otras Pruebas (Anderson-Darling), Prueba G .......................................................................... 21
El estadstico de Anderson-Darling ............................................................................................... 21
Qu es el estadstico de Anderson-Darling? ....................................................................... 21
Prueba G o prueba del logaritmo de la razn de Verosimilitudes ................................................ 23
Formula ......................................................................................................................................... 23
Funcin de verosimilitud para distribuciones continuas .............................................................. 24
4.6 Simulacin de los comportamientos aleatorios de los proyectos y su verificacin. ................. 26
Sistemas, modelos y simulacin ................................................................................................... 26
Tipos de sistemas .......................................................................................................................... 27
Sistemas estticos y sistemas dinmicos .................................................................................. 28
Sistemas deterministas y sistemas estocsticos. ...................................................................... 28
Sistemas continuos y sistemas discretos .................................................................................. 28
Tipos de modelos .......................................................................................................................... 28
Necesidad de la simulacin........................................................................................................... 29
Verificacin. .............................................................................................................................. 30
Ventajas de la simulacin ............................................................................................................. 30
Bibliografa ........................................................................................................................................ 32
4.1 Lista de estimadores a obtener de la simulacin

Definiremos algunas propriedades de los estimadores.

1) Parametro. Verdadero valor de una caracterstica de interes, denominado por , que


raramente es conocido.

2) Estimativa. Valor numerico obtenido por el estimador, denominado de en una


m uestra.

3) Vies y no vies. Un estimador es no in-sesgado si: E() = , onde el vies es dado por:
vies() = E( ) = E()

Cuadrado medio del error (ECM). Es dado por:

ECM () = E( )2 = V () + (vies

1) Un estimador es consistente si: plim() = ; y lim ECM () = 0

2) Las leyes de los grandes numeros explican por que el promedio o media de una muestra
al azar de una poblacion de gran tamano tendera a estar cerca de la media de la
poblacion completa.

4.1.1 Instrumentos de medicin

El anlisis de la literatura existente arroja un resultado de 17 instrumentos de medida de las


actitudes y la ansiedad hacia la estadstica. Exceptuando dos instrumentos elaborados a partir
de escalas bipolares, a la manera del diferencial semntico de Osgood (Birenbaum y Eylath,
1994; Green, 1993), todos los instrumentos revisados son escalas tipo Likert. En lo que sigue
vamos a describir brevemente estos cuestionarios, poniendo un mayor nfasis en aquellos que
han sido usados ms frecuentemente.

4.1.2 Medios de registro de datos

La eleccin del mtodo depende de la estrategia de recopilacin de datos, el tipo de variable, la


precisin necesaria, el punto de recopilacin y la formacin del encuestador. Las vnculos entre
una variable, su origen y los mtodos prcticos para su recopilacin. Pueden ayudar a escoger
mtodos apropiados. Los principales mtodos de recopilacin de datos son:

Registros: los registros y licencias son particularmente valiosos para los censos
completos, pero se limitan a variables que cambian lentamente, como el nmero de
embarcaciones pesqueras y sus caractersticas.
Cuestionarios: formularios que los encuestados devuelven cumplimentados. Un mtodo
poco costoso que resulta til cuando los ndices de alfabetizacin son altos y los
encuestados colaboran.
Entrevistas: formularios que se cumplimentan a lo largo de una entrevista con el
encuestado. Ms caros que los cuestionarios, pero mejores para preguntas ms
complejas, y cuando se dan unos ndices de alfabetizacin bajos o se encuentra menos
colaboracin.
Observaciones directas: la realizacin de mediciones directas es el mtodo ms preciso
para todas las variables, como las capturas, pero a menudo resulta caro. Muchos
mtodos, como los programas de observacin, se limitan a la pesca industrial.
Presentacin de informes: la principal alternativa a la realizacin de mediciones directas
consiste en pedir a los pescadores y a terceros que presenten informes de sus
actividades. La preparacin de informes presupone la alfabetizacin y requiere espritu
de colaboracin, pero ello puede reforzarse mediante una obligacin legal y mediciones
directas.

Las tcnicas de recogida de la informacin no son un fin en si mismo, sino que dependen de:

a- El tipo de investigacin que se est haciendo.

b- El tipo de anlisis de datos que vamos a utilizar posteriormente.

c- El problema que queramos estudiar.

d- Los objetivos que pretendamos alcanzar con la investigacin.

Algunas tcnicas se pueden utilizar en distintos diseos, por ejemplo la entrevista se puede
utilizar en: investigacin accin, en estudios de caso, en investigacin etnogrfica, etc.
4.2. Identificacin del estimador determinante (estimador lder) del
tamao de la simulacin.

Por definicin, el valor de una variable cambia conforme avanza la simulacin, aunque se le
debe dar un valor inicial. Cabe recordar que el valor de un parmetro permanece constante; sin
embargo, puede cambiar conforme se estudian diferentes alternativas en otras simulaciones.

Determinacin de condiciones iniciales La determinacin de condiciones iniciales para las


variables es una decisin tctica importante en la simulacin.

Lo anterior se debe a que el modelo se sesga por una serie de valores iniciales hasta que el
modelo llega a un estado estable.

Para manejar este problema, los analistas han seguido varios planteamientos como

1) Descartar los datos generados durante las primeras partes de la ejecucin,


2) Seleccionar las condiciones iniciales que reducen la duracin del periodo de
calentamiento o
3) Seleccionar las condiciones iniciales que eliminan el sesgo. Sin embargo, para emplear
cualquiera de estas alternativas, el analista debe tener una idea del margen de datos de
salida esperado. Por lo tanto, en cierto sentido, el analista sesga los resultados. Por otro
lado, una de las nicas caractersticas de la simulacin es que permite la crtica en el
diseo y anlisis de la simulacin; por lo que si el analista tiene cierta informacin que
alberga un problema, se debe incluir.

Determinacin de duracin de la ejecucin La duracin de la ejecucin de simulacin (duracin


de la ejecucin o tiempo de ejecucin) depende del propsito de la simulacin.

Quizs el planteamiento ms comn sea continuar la simulacin hasta lograr un equilibrio. En


el ejemplo del mercado de pescado, significara que las ventas simuladas de pescado
corresponden a sus frecuencias relativas histricas. Otro planteamiento es ejecutar la
simulacin durante un periodo establecido como 1 mes, 1 ao o una dcada y ver si las
condiciones al final del periodo son razonables. Un tercer planteamiento es establecer la
duracin de la ejecucin de modo que se obtenga una muestra suficientemente grande para
efectos de pruebas de hiptesis estadstica. Esta alternativa se considera en la siguiente
seccin.
Desde luego que las conclusiones que se pueden obtener de una simulacin dependen del
grado en que el modelo refleja el sistema real, aunque tambin depende del diseo de la
simulacin en un sentido estadstico.

De hecho, muchos analistas consideran la simulacin como una forma de prueba de hiptesis
donde cada ejecucin de simulacin ofrece uno o ms datos de muestra que son susceptibles
al anlisis formal a travs de los mtodos estadsticos inferenciales. Los procedimientos
estadsticos que normalmente se usan en la evaluacin de resultados de simulacin incluyen el
anlisis de varianza, anlisis de regresin y pruebas t.

En la mayora de las situaciones, el anlisis tiene ms informacin disponible con la cual


comparar los resultados de simulacin: datos operativos antiguos del sistema real, datos
operativos del desempeo de sistemas semejantes y la percepcin del analista de la operacin
del sistema real. Sin embargo, se debe admitir que la informacin obtenida de estas fuentes
probablemente no sea suficiente para validar las conclusiones derivadas de la simulacin. Por
lo tanto, la nica prueba real de una simulacin es qu tan bien se desempea el sistema real
despus de haber implantado los resultados del estudio.

Un requerimiento lgico para un estimador es que su precisin mejore al aumentar el tamao


muestral. Es decir, que esperaremos obtener mejores estimaciones cuanto mayor sea el
nmero de individuos.

Si se cumple dicho requerimiento, diremos que un estimador es consistente. Desde un punto


de vista ms riguroso diremos que un estimador es consistente si converge en probabilidad al
verdadero valor del parmetro que queremos estimar.

Ejemplo:

Consideremos el caso de la estimacin de la media de una poblacin Normal () y


consideraremos dos estimadores:

Estimador 1: La primera observacin de la muestra (para cualquier tamao muestral).

Estimador 2: La media aritmtica de las observaciones.


Para observar el comportamiento de ambos estimadores utilizaremos el siguiente programa
que genera automticamente diez muestras de diferentes tamaos (n = 2; 10 ; 50; 500)
procedentes de una distribucin Normal de parmetros ( = 0; = 1). Se tratar, por tanto, de
un estudio de simulacin (generamos muestras procedentes de una determinada distribucin)
para comparar el comportamiento de ambos estimadores. Recuerda que el verdadero valor del
parmetro a estimar () es cero y que corresponde a la lnea central en negro:

1) Comparad los valores del estimador 1 (primera observacin) para los diferentes tamaos
muestrales (n = 2; 10; 50; 500).

2) Haced lo mismo con el estimador 2: media aritmtica.

3) Obtened nuevas simulaciones y repetid el estudio anterior.

4) Mejora el resultado de algn estimador al aumentar el tamao de la muestra?

Es evidente que el estimador correspondiente a la primera observacin no mejora al aumentar


el tamao de la muestra. Mientras que la media aritmtica converge hacia el verdadero valor
del parmetro ( = 0) al aumentar el tamao de la muestra.

En resumen: la primera observacin no es un estimador consistente de , mientras que la


media aritmtica s que lo es.

4.3 Muestras preliminares de los proyectos aprobados en 3.4

4.4 Caractersticas estadsticas del estimador lider

Hay una serie de caractersticas deseables en los estimadores para que stos constituyan una
buena aproximacin a los respectivos parmetros. Se trata de rasgos que podran entenderse
como criterios de calidad de los estimadores.

1. Carencia de sesgo. Se dice que un estimador es insesgado si el valor esperado de su


distribucin de probabilidad es igual al parmetro. Es decir, si es igual a la media de
los valores calculados en cada una de las muestras aleatorias posibles del mismo
tamao. Si el estadstico es utilizado como estimador del parmetro , ese estimador
carece de sesgo cuando
E() =

Por ejemplo, la media [D] es un estimador insesgado de , puesto que se cumple, tal y como
vimos en el captulo anterior al estudiar la distribucin muestral del estadstico media, que

E( [D]) =

En el caso de la varianza, suelen manejarse habitualmente dos estimadores:

[D] o bien, [D]. Para cada uno de ellos, el valor esperado resulta ser:

[D]

El segundo de los estimadores posee la caracterstica de ser un estimador insesgado de 2,


razn por la que suele emplearse con ms frecuencia que el primero a la hora de estimar el
parmetro varianza poblacional.

Cuando E() , decimos que el estimador sesgado tiene un sesgo positivo si E() > , o que
tiene un sesgo negativo si E() < . Un estimador sesgado tender a ofrecer sistemticamente
valores que se alejan en un sentido u otro del parmetro, aunque la muestra sea elegida
aleatoriamente.

Consistencia. Un estimador es consistente si, adems de carecer de sesgo, se aproxima


cada vez ms al valor del parmetro a medida que aumenta el tamao de la muestra. Si el
tamao n se hace indefinidamente grande, los valores de se concentran cada vez ms en
torno al valor del parmetro, hasta que con un tamao

2. muestral infinito obtenemos una varianza del estimador nula. Por tanto, un estimador es
consistente si cuando n tiende a infinito se cumple

E() = ; var() = 0

La media es un estimador consistente del parmetro , puesto que se verifican las condiciones
anteriores. Es decir.

[D]

Tambin se comprueba que los dos estimadores de la varianza, presentados en el apartado


anterior, resultan ser estimadores consistentes de 2.
3. Eficiencia. La eficiencia de un estimador est vinculada a su varianza muestral. As, para
un mismo parmetro , se dice que el estimador 1 es ms eficiente que el estimador
2 si se cumple

var(1) < var(2)

Por tanto, si un estadstico es ms eficiente que otro, significa que vara menos de unas
muestras a otras. Se demuestra que la media es un estimador del parmetro ms eficiente
que la mediana. Del mismo modo, la varianza Sn-12 es un estimador de 2 ms eficiente que
Sn2.

4. Suficiencia. Un estimador es suficiente cuando en su clculo se emplea toda la


informacin de la muestra. Por ejemplo, al calcular el estimador [D] del correspondiente
parmetro poblacional, utilizamos la frmula:

[D]

para cuyo clculo se tienen en cuenta todas las puntuaciones Xi. Otro tanto ocurre con los
estimadores Sn-12 y Sn2 de la varianza. Todos ellos pueden ser considerados estimadores
suficientes de los respectivos parmetros.

4.4.1 Establecimiento de la precisin

Sea H un intervalo cualquiera definido sobre la recta real. Definiremos ahora una variable
ficticia, XH , de la siguiente forma:

De manera que cada observacin de Xt Ileva asociada una observacin -con valor o 1- de la
variable XNr . La funcin de densidad terica -desconocida- de Xt asigna una probabilidad pH
al intervalo H. Esto significa que:
Producir T replicaciones del vector y, implica disponer de una muestra de T observaciones" de
la variable real X. Esta muestra lleva asociada, a su vez, una muestra de tamao T de la
variable Xy .Esta variable sigue una distribucin binaria de parmetro pH , as que la suma de
las T observaciones de XH , ZH = XH^ +. ,.+ X y T , sigue una distribucin binomial b(pH ,^. Es
oportuno aqu hacer una adaptacin al presente contexto del concepto de estimacin precisa
de Finster{ 1987) Definicin 1. ,ZH /T es una estimacin precisa de pN con nivel de imprecisin
A y confianza 1-a (can 0< cx < 1), si

EI conjunta de precisin [-A, A] es el conjunto de errores de simulacin aceptables. En lo que


sigue a continuacin se intentar determinar cul es el nmero de replicaciones mnimo para
obtener una estimacin de pH can nivel de imprecisin fijo A y confianza 1-a. EI teorema de
Moivre (ver por ejemplo Fz. de Trocniz 1993) prueba que la sucesin b(pH ,1), b(pH ,2),.
..,b(pH , 7^, es asintticamente normal N{T pH ,T p^ [1- pH ]) de manera que si T pH > 1 S se
suele tomar como vlida la siguiente aproximacin a la distribucin de ZH :

entonces, para la frecuencia binomial, ZH IT, se tiene :

Si t^ es el cuantil aJ2 correspondiente a la cola derecha de la distribucin N(0,1),


4.4.2 Clculo del nmero mnimo de observaciones necesarias

El tamao de la muestra o clculo de nmero de observaciones es un proceso vital en la etapa


de cronometraje, dado que de este depende en gran medida el nivel de confianza del estudio
de tiempos. Este proceso tiene como objetivo determinar el valor del promedio representativo
para cada elemento.

Los mtodos ms utilizados para determinar el nmero de observaciones son:

Mtodo estadstico
Mtodo tradicional
Mtodo Estadstico
MTODO ESTADSTICO
El mtodo estadstico requiere que se efecten cierto nmero de observaciones preliminares
(n'), para luego poder aplicar la siguiente frmula:

NIVEL DE CONFIANZA DEL 95,45% Y UN MRGEN DE ERROR DE 5%

Siendo:

n = Tamao de la muestra que deseamos calcular (nmero de observaciones)


n' = Nmero de observaciones del estudio preliminar
= Suma de los valores
x = Valor de las observaciones.
40 = Constante para un nivel de confianza de 94,45%

Ejemplo

Se realizan 5 observaciones preliminares, los valores de los respectivos tiempos transcurridos


en centsimas de minuto son: 8, 7, 8, 8, 7. Ahora pasaremos a calcular los cuadrados que nos
pide la frmula:
8 64

7 49

8 64

8 64

7 49

x = 38 x = 290
8
7
8
8
7
N' = 5

Sustituyendo estos valores en la frmula anterior tendremos el valor de n:

Dado que el nmero de observaciones preliminares (5) es inferior al requerido (7), debe
aumentarse el tamao de las observaciones preliminares, luego recalcular n. Puede ser que en
reclculo se determine que la cantidad de 7 observaciones sean suficientes.

Este mtodo consiste en seguir el siguiente procedimiento sistemtico:

1) Realizar una muestra tomando 10 lecturas s los ciclos son <= 2 minutos y 5
lecturas s los ciclos son > 2 minutos, esto debido a que hay ms confiabilidad
en tiempos ms grandes, que en tiempos muy pequeos donde la probabilidad
de error puede aumentar.

2) Calcular el rango o intervalo de los tiempos de ciclo, es decir, restar del tiempo
mayor el tiempo menor de la muestra:

R (Rango) = Xmax - Xmin


1) Calcular la media aritmtica o promedio:

Siendo:

x = Sumatoria de los tiempos de muestra


n = Nmero de ciclos tomados

Hallar el cociente entre rango y la media:

2) Buscar ese cociente en la siguiente tabla, en la columna (R/X), se ubica el valor


correspondiente al nmero de muestras realizadas (5 o 10) y ah se encuentra el
nmero de observaciones a realizar para obtener un nivel de confianza del 95% y un
nivel de precisin de 5%.
3) Bus car ese cociente en la siguiente tabla, en la columna (R/X), se ubica el valor
correspondiente al nmero de muestras realizadas (5 o 10) y ah se encuentra el
nmero de observaciones a realizar para obtener un nivel de confianza del 95% y un
nivel de precisin de 5%.
Ejemplo

Tomando como base los tiempos contemplados en el ejemplo del mtodo estadstico,
abordaremos el clculo del nmero de observaciones segn el mtodo tradicional.

En primer lugar como el ciclo es inferior a los 2 minutos, se realizan 5 muestras adicionales (6,
8, 8, 7, 8) para cumplir con las 10 muestras para ciclos <= 2 minutos. Las observaciones son
las siguientes:

8
7
8
8
7
6
8
8
7
8

x = 75

8
7
8
8
7

Se calcula el rango:

R (Rango) = 8 - 6 = 2

Ahora se calcula la media aritmtica:

Ahora calculamos el cociente entre el rango y la media:

Ahora buscamos ese cociente en la tabla y buscamos su interseccin con la columna de 10


observaciones:
Tenemos entonces que el nmero de observaciones a realizar para tener un nivel de
Confianza del 95% segn el mtodo tradicional es: 11

Al adicionar los 5 tiempos y utilizar el mtodo estadstico tenemos un nmero de observaciones


igual a: 12.8 aproximadamente 13.

Por lo cual podemos concluir que ambos mtodos arrojan resultados muy parecidos y que la
eleccin del mtodo se deja a criterio del especialista.

4.4.3 Intervalos de confianza

Un intervalo de confianza es un rango de valores, derivado de los estadsticos de la muestra,


que posiblemente incluya el valor de un parmetro de poblacin desconocido. Debido a su
naturaleza aleatoria, es poco probable que dos muestras de una poblacin en particular
generen intervalos de confianza idnticos. Sin embargo, si usted repitiera muchas veces su
muestra, un determinado porcentaje de los intervalos de confianza resultantes incluira el
parmetro de poblacin desconocido.

En este caso, la lnea negra horizontal representa el valor fijo de la media desconocida de la
poblacin, . Los intervalos de confianza azules verticales que se sobreponen a la lnea
horizontal contienen el valor de la media de la poblacin. El intervalo de confianza rojo que est
completamente por debajo de la lnea horizontal no lo contiene. Un intervalo de confianza de
95% indica que 19 de 20 muestras (95%) de la misma poblacin generarn intervalos de
confianza que contendrn el parmetro de poblacin.

Utilice el intervalo de confianza para evaluar la estimacin del parmetro de poblacin. Por
ejemplo, un fabricante desea saber si la longitud media de los lpices que produce es diferente
de la longitud objetivo. El fabricante toma una muestra aleatoria de lpices y determina que la
longitud media de la muestra es 52 milmetros y el intervalo de confianza de 95% es (50,54).
Por lo tanto, usted puede estar 95% seguro de que la longitud media de todos los lpices se
encuentra entre 50 y 54 milmetros.

El intervalo de confianza se determina calculando una estimacin de punto y luego


determinando su margen de error.

Estimacin de punto

Este valor individual estima un parmetro de poblacin usando los datos de su muestra.

Margen de error
Cuando usted utiliza estadsticos para estimar un valor, es importante recordar que sin importar
lo bien que est diseado su estudio, su estimacin est sujeta a error de muestreo aleatorio.
El margen de error cuantifica este error e indica la precisin de su estimacin.

Usted probablemente ya entiende el margen de error, porque est relacionado con los
resultados de las encuestas. Por ejemplo, una encuesta poltica podra indicar que el nivel de
popularidad de un candidato es de 55% con un margen de error de 5%. Esto significa que el
nivel de popularidad real es +/- 5% y, por lo tanto, se ubica entre 50% y 60%.

Para un intervalo de confianza bilateral, el margen de error es la distancia desde el estadstico


estimado hasta el valor de cada intervalo de confianza. Cuando un intervalo de confianza es
simtrico, el margen de error es la mitad del ancho del intervalo de confianza. Por ejemplo, la
longitud media estimada de un rbol de levas es 600 mm y el intervalo de confianza oscila
entre 599 y 601. El margen de error es 1.

Mientras mayor sea el margen de error, ms ancho ser el intervalo y menos seguro podr
estar usted del valor de la estimacin de punto.

4.3.5 Muestras grandes: Prueba de Karl-Pearson para ajuste de una


distribucin de probabilidades hipottica, discreta o contina con
(hoja de clculo o con paquete de estadstico).

El estudio de Monte Carlo para determinar la validez del empleo de la prueba del error estndar
de ajuste como criterio de seleccin en el anlisis de frecuencias. Dicho estadstico se compar
con los estadsticos de prueba de Kolmogorov-Smirnov, Cramer-Von Mises y Anderson-Darling.
Las distribuciones elegidas para el propsito de comparar estos estadsticos fueron la gamma,
Weibull, Gumbel, log-normal y log-logstica. Los resultados obtenidos recomiendan el uso de
muestras con tamao de por lo menos de ms de n=50 para tener un buen desempeo de las
pruebas de Anderson-Darling y error estndar de ajuste. El empleo de las pruebas de
Kolmogorov-Smirnov y Cramer-Von Mises o pruebas Karl-Pearson es del todo recomendable
en hidrologa, ya que para obtener un desempeo aceptable se necesitan muestras ms
grandes de las que normalmente se tienen en esta disciplina.

El anlisis de frecuencias de eventos hidrolgicos extremos para estimar la probabilidad de


ocurrencia de dichos eventos. A menudo, el periodo de retorno del evento de diseo de una
obra hidrulica excede el periodo de las observaciones y deben hacerse extrapolaciones a
partir de los valores registrados. Una forma de extrapolar los datos histricos consiste en
emplear el mtodo grfico, que requiere de un analista experimentado y presenta la desventaja
de la subjetividad. Una tcnica ms objetiva es encontrar la distribucin de probabilidad terica
que se ajuste mejor a los datos medidos y usar esta funcin para la extrapolacin.

Algunas de las distribuciones de probabilidad usadas en hidrologa son normal, log-normal,


gamma, Gumbel, Weibull, Pearson tipo III y log-Pearson tipo III (Aksoy, 2000; Aparicio-Mijares,
2005). Un problema importante en el anlisis de frecuencias es la seleccin de una distribucin
de probabilidad apropiada para los datos observados. Este problema no es exclusivo de la
hidrologa, tambin se observa en otras reas, como la confiabilidad y ciencias actuariales.
Quesenberry y Kent (1982) desarrollaron un criterio de seleccin de distribuciones basado en
estadsticos invariantes bajo transformaciones de escala.

Demostraron la efectividad de su criterio a partir de un estudio de Monte Carlo para distinguir


entre las distribuciones exponencial, gamma, Weibull y log-normal. Generalmente, la seleccin
de modelos se basa en pruebas de bondad de ajuste, que incluyen mtodos grficos y
estadsticos, siendo preferibles los mtodos estadsticos por su objetividad (Shin, Jung, Jeong,
& Heo, 2011). Entre los mtodos estadsticos con mayor aplicacin en la hidrologa se
encuentran las pruebas de chi-cuadrado (c2) y del error estndar de ajuste (EEA) (Ganancias-
Martnez, 2009).

Otros mtodos usados a menudo son los de funcin de distribucin emprica (FDE), que
incluyen las pruebas de Kolmogorov-Smirnov (KS), Cramer-Von Mises (CVM) y Anderson-
Darling (AD) (p. ej., Laio, 2004; Suhaila & Jemain, 2007; Dan'azumi, Shamsudin, & Aris, 2010;
Shin et al., 2011; Atroosh & Moustafa, 2012). Sin embargo, las pruebas estadsticas de bondad
de ajuste tienen poco poder para rechazar distribuciones equivocadas (Mitosek, Strupczewski,
& Singh, 2002), por lo que en muchos casos, ms de una distribucin puede ser aceptada por
una prueba especfica (Laio, Baldasarre, & Montanari, 2009).

En este caso, el concepto de criterio de seleccin de modelos representa una alternativa a las
pruebas de bondad de ajuste. Pueden definirse diversos criterios de seleccin en funcin de los
estadsticos de bondad de ajuste antes mencionados. Otros criterios de seleccin se basan en
la funcin de verosimilitud, como el criterio de informacin de Akaike (CIA) y el criterio de
informacin Bayesiano (CIB) (Laio et al., 2009). Balasooriya, Low y Wong (2005) evaluaron la
efectividad de los criterios de Akaike, y de Quesenberry y Kent. Encontraron que si bien ambos
criterios tuvieron un buen desempeo, el segundo fue ligeramente mejor; sin embargo, la
dificultad computacional de este criterio hace preferible el empleo del CIA. Los criterios de
seleccin de modelos probabilsticos han recibido poca atencin en la literatura hidrolgica.

Mitosek et al. (2002) consideraron las distribuciones Weibull, gamma, Gumbel y log-normal
como modelos alternativos para la distribucin de caudales pico anuales, y evaluaron estas
distribuciones usando tres ndices: la desviacin absoluta media, la media cuadrtica y la
funcin de verosimilitud normalizada. Tras realizar un estudio de Monte Carlo, concluyeron que
la funcin de verosimilitud normalizada representaba el mejor criterio de seleccin. El Adlouni,
Bobe y Ouarda (2008) utilizaron tcnicas grficas para seleccionar la clase de distribuciones
que proporciona el mejor ajuste a un conjunto de datos. Utilizaron el criterio de clasificacin de
Werner y Upper (2002), quienes dividieron las distribuciones en: a) estables; b) con cola tipo
Parteo; c) regularmente variantes; d) sub-exponenciales; e) con momentos exponenciales
inexistentes.

Estos autores propusieron el empleo de mtodos grficos para determinar la clase de la


distribucin y despus utilizar criterios como el CIA, CIB o AD para seleccionar la distribucin
de mejor ajuste. Por su parte, Laio et al. (2009) hicieron un anlisis del desempeo de tres
criterios de seleccin de modelos: CIA, CIB y AD, aplicados para identificar el mejor modelo
probabilstico de un ajuste de datos hidrolgicos extremos.

El anlisis numrico para comparar los desempeos de diferentes criterios de seleccin de


modelos probabilsticos. Los criterios considerados fueron las pruebas de error estndar de
ajuste (EEA), Cramer-Von Mises (CVM), Kolmogorov-Smirnov (KS), Anderson-Darling (AD) y
Karl-Pearsoon (KP). El anlisis se llev a cabo por medio de una serie de experimentos de
Monte Carlo, que constaron de los siguientes pasos: a) se eligieron las siguientes
distribuciones de probabilidad madre: Gumbel, Weibull, gamma, log-normal y log-logstica, las
funciones de densidad de probabilidad (fdp) de las primeras cuatro distribuciones se pueden
consultar en el texto de Haan (1994), la de la distribucin log-logstica, en Dey y Kundu (2009);
b) se generaron 80 000 muestras aleatorias de tamao n de las distribuciones madre, los
tamaos de muestra considerados fueron n = 30, 50, 80 y 100; c) las distribuciones de inters
se ajustaron a los datos generados, los parmetros se estimaron por el mtodo de mxima
verosimilitud; d) para cada una de las distribuciones se calcularon los estadsticos de AD, CVM,
KS y EEA; e) para cada uno de los criterios se seleccion la distribucin para la cual se obtuvo
el valor ms pequeo, si la distribucin seleccionada era igual a la distribucin madre, se
consider que el criterio tuvo xito.

Estas simulaciones muestran que los criterios de seleccin ayudan a escoger la mejor
distribucin para un anlisis de frecuencias. Se encontr que de los criterios empleados, el
mejor fue AD, seguido por el EEA. Tambin se observ que es difcil discriminar entre dos
distribuciones parecidas. Tambin se encontr que el porcentaje de seleccin correcta (PSC)
de los criterios de seleccin depende del tamao de la muestra n y de la distribucin que
siguen los datos generados.

En general, el criterio de AD resulta con mejores estimaciones para T = 100, aun cuando no
escoge la distribucin correcta. Tambin se observ que tiende a producir estimaciones ms
pequeas que los dems criterios considerados, y que en la mayora de los casos subestima el
valor xT. Para T = 10 no hay grandes diferencias entre los criterios. A partir de los resultados
obtenidos, se recomiendan muestras con tamao de por lo menos n = 50 para tener un buen
desempeo de las pruebas de AD y EEA. El empleo de las pruebas de KS y CVM no se
recomienda a menos que se tengan muestras grandes.

4.5.4 Otras Pruebas (Anderson-Darling), Prueba G

El estadstico de Anderson-Darling

Qu es el estadstico de Anderson-Darling?

El estadstico Anderson-Darling mide qu tan bien siguen los datos una distribucin especfica.
Para un conjunto de datos y distribucin en particular, mientras mejor se ajuste la distribucin a
los datos, menor ser este estadstico. Por ejemplo, usted puede utilizar el estadstico de
Anderson-Darling para determinar si los datos satisfacen el supuesto de normalidad para una
prueba t.

Las hiptesis para la prueba de Anderson-Darling son:

H0: Los datos siguen una distribucin especificada

H1: Los datos no siguen una distribucin especificada


Utilice el valor p correspondiente (si est disponible) para probar si los datos provienen de la
distribucin elegida. Si el valor p es menor que un nivel de significancia elegido (por lo general
0.05 o 0.10), entonces rechace la hiptesis nula de que los datos provienen de esa distribucin.
Minitab no siempre muestra un valor p para la prueba de Anderson-Darling, porque este no
existe matemticamente para ciertos casos.

Tambin puede utilizar el estadstico de Anderson-Darling para comparar el ajuste de varias


distribuciones con el fin de determinar cul es la mejor. Sin embargo, para concluir que una
distribucin es la mejor, el estadstico de Anderson-Darling debe ser sustancialmente menor
que los dems.

La prueba de Anderson-Darling es usada para probar si una muestra viene de una distribucin
especifica. Esta prueba es una modificacin de la prueba de Kolmogorov- Smirnov donde se le
da ms peso a las colas de la distribucin que la prueba de Kolmogorov-Smirnov.

En estadstica, la prueba de Anderson-Darling es una prueba no paramtrica sobre si los datos


de una muestra provienen de una distribucin especfica. La frmula para el estadstico
determina si los datos (observar que los datos se deben ordenar) vienen de una distribucin
con funcin acumulativa F.

Donde:

n es el nmero de datos

f(x): es la funcin de distribucin de probabilidad terica

FS(X): es la funcin de distribucin emprica.

Para definir la regla de rechazo para esta prueba es necesario, tambin, obtener el estadstico
ajustado para luego compararlo con los valores crticos de la tabla de Anderson- Darling.
Prueba G o prueba del logaritmo de la razn de Verosimilitudes

En estadstica, la funcin de verosimilitud (o, simplemente, verosimilitud) es una funcin de los


parmetros de un modelo estadstico que permite realizar inferencias acerca de su valor a partir de
un conjunto de observaciones.

No debe confundirse con el trmino probabilidad: sta permite, a partir de una serie de parmetros
conocidos, realizar predicciones acerca de los valores que toma una variable aleatoria.

Formula

En cierto sentido, la verosimilitud es una versin inversa de la probabilidad condicional. Conocido un


parmetro B, la probabilidad condicional de A es P(A|B), pero si se conoce A, pueden realizarse
inferencias sobre el valor de B gracias al teorema de Bayes, segn el cual

La funcin de verosimilitud, L( b |A), definida como

desempea el mismo papel bajo un enfoque no bayesiano. De hecho, lo relevante no es el valor en


s de L( b |A) sino la razn de verosimilitudes.

Esta permite comparar cuanto ms verosmil es el parmetro que el a la hora


de explicar el evento A. De ah que en ocasiones se entienda que la funcin de verosimilitud, ms
que una funcin en s, sea la clase de funciones
Donde: es una constante de proporcionalidad.

La funcin de verosimilitud, abundando en los razonamientos anteriores, abre la va para dos


tcnicas muy habituales en inferencia estadstica: las de la mxima verosimilitud y la del test de la
razn de verosimilitudes.

Funcin de verosimilitud para distribuciones continuas

En los casos anteriores, los eventos considerados tenan una probabilidad p estrictamente mayor
que cero. Pero cuando la nocin de verosimilitud se extiende a variables aleatorias con una funcin
de densidad f sobre, por ejemplo, el eje real, la probabilidad de un evento cualquiera es nula.

4.5. Muestras definitivas


4.5.1. Estadsticas descriptivas

4.5.2. Muestra pequeas: prueba de kolmogorov-Smirnov para ajuste de una


distribucin de probabilidades continua hipottica (en hoja de clculo o con
paquete estadstico)

Desarrollada en la dcada de los treinta del siglo XX, esta prueba permite al igual
que la prueba Chi-cuadrada determinar la distribucin de probabilidad de una serie
de datos. Una limitante de la prueba de Kolmogorov-Smirnov estriba en que solamente
se puede aplicar al anlisis de variables continuas. El procedimiento general de la
prueba es:

1. Obtener al menos 30 datos de la variable aleatoria a analizar.


2. Calcular la media y la varianza de los datos.
3. Crear un histograma de m= vn intervalos, y obtener la frecuencia observada en
cada intervalo 0.
4. Calcular la probabilidad observada en cada intervalo PO =0 / n , esto es, dividir
la frecuencia observada O. entre el nmero total de datos, n.
5. Acumular las probabilidades PO.para obtener la probabilidad observada hasta el
i-simo intervalo, POAr
6. Establecer de manera explcita la hiptesis nula, para esto se propone una
distribucin de probabilidad que se ajuste a la forma del histograma.
7. Calcular la probabilidad esperada acumulada para cada intervalo, PEA, a partir
de la funcin de probabilidad propuesta.
8. Calcular el estadstico de prueba.

c = mx |PEA - PA, \ i = 1,2,3,..., k,..., m

9. Definir el nivel de significancia de la prueba a, y determinar el valor crtico de la


prueba, Da n (consulte la tabla de valores crticos de la prueba de Kolmogorov-
Smirnoven la seccin de apndices).

10. Comparar el estadstico de prueba con el valor crtico. Si el estadstico de prueba


es menor que el valor crtico no se puede rechazar la hiptesis nula.

4.5.3. Muestras grandes: prueba de Karl- Pearson para ajuste de una


distribucin de probabilidades hipottica, discreta o continua (en hoja de
clculo o con paquete estadstico)
El estudio de Monte Carlo para determinar la validez del empleo de la prueba del error
estndar de ajuste como criterio de seleccin en el anlisis de frecuencias. Dicho
estadstico se compar con los estadsticos de prueba de Kolmogorov-Smirnov,
Cramer-Von Mises y Anderson-Darling. Las distribuciones elegidas para el propsito de
comparar estos estadsticos fueron la gamma, Weibull, Gumbel, log-normal y log-
logstica. Los resultados obtenidos recomiendan el uso de muestras con tamao de por
lo menos de ms de n=50 para tener un buen desempeo de las pruebas de
Anderson-Darling y error estndar de ajuste. El empleo de las pruebas de Kolmogorov-
Smirnov y Cramer-Von Mises o pruebas Karl-Pearson es del todo recomendable en
hidrologa, ya que para obtener un desempeo aceptable se necesitan muestras ms
grandes de las que normalmente se tienen en esta disciplina.

El anlisis de frecuencias de eventos hidrolgicos extremos para estimar la


probabilidad de ocurrencia de dichos eventos. A menudo, el periodo de retorno del
evento de diseo de una obra hidrulica excede el periodo de las observaciones y
deben hacerse extrapolaciones a partir de los valores registrados. Una forma de
extrapolar los datos histricos consiste en emplear el mtodo grfico, que requiere de
un analista experimentado y presenta la desventaja de la subjetividad. Una tcnica ms
objetiva es encontrar la distribucin de probabilidad terica que se ajuste mejor a los
datos medidos y usar esta funcin para la extrapolacin.

Algunas de las distribuciones de probabilidad usadas en hidrologa son normal, log-


normal, gamma, Gumbel, Weibull, Pearson tipo III y log-Pearson tipo III (Aksoy, 2000;
Aparicio-Mijares, 2005). Un problema importante en el anlisis de frecuencias es la
seleccin de una distribucin de probabilidad apropiada para los datos observados.
Este problema no es exclusivo de la hidrologa, tambin se observa en otras reas,
como la confiabilidad y ciencias actuariales. Quesenberry y Kent (1982) desarrollaron
un criterio de seleccin de distribuciones basado en estadsticos invariantes bajo
transformaciones de escala.

4.6 Simulacin de los comportamientos aleatorios de los proyectos


y su verificacin.

Simular el funcionamiento de distintos tipos de instalaciones o procesos. A la instalacin o


proceso que se pretende estudiar se le denomina sistema y para poderlo analizar se realiza
una serie de supuestos sobre su funcionamiento. Estos supuestos, que normalmente se
expresan mediante relaciones matemticas o relaciones lgicas, constituyen un modelo del
sistema. Este modelo se utiliza para comprender y prever el comportamiento del sistema real.

Si las relaciones matemticas o lgicas que comprende el modelo son sencillas, entonces ser
posible utilizar un procedimiento analtico para obtener una solucin o respuesta exacta sobre
las caractersticas de inters del sistema analizado. No obstante, si las relaciones son
complejas, puede ocurrir que no se pueda evaluar analticamente el problema. En este caso,
ser necesario acudir a la simulacin del sistema, evaluando numricamente el modelo y
analizando los datos obtenidos para estimar las caractersticas de dicho sistema.

Sistemas, modelos y simulacin


Un sistema se puede definir como un conjunto de elementos unidos por relaciones de
interaccin o interdependencia. En el mbito de los sistemas productivos estos elementos
normalmente tienen un objetivo comn.

Los elementos que forman parte del sistema vienen condicionados por el objetivo del estudio
que se pretende realizar, ya que un sistema definido para un estudio determinado puede ser
una parte de un sistema ms amplio definido para otro estudio particular. Por ejemplo, si se
quiere determinar cul es el nmero ms adecuado de operarios y mquinas en la seccin de
mecanizado de una empresa que tiene una determinada cartera de pedidos, estos elementos
sern los que formen parte del sistema a analizar, mientras que, si lo que se desea es estudiar
la capacidad productiva de la empresa, los elementos mencionados anteriormente slo sern
una parte del sistema. A ellos habr que aadir montaje, embalaje, almacenaje, etc.

Se pueden realizar las siguientes definiciones:

Atributo: propiedad de un elemento del sistema.

Actividad: todo proceso que provoque un cambio en el sistema.

El estado del sistema en un instante de tiempo determinado se puede definir como la


descripcin de todos los elementos, atributos y actividades en dicho instante. Por ejemplo, el
estado de una oficina bancaria en un instante se podra definir mediante el nmero de cajeros
en l, el nmero de clientes, el instante de llegada de cada cliente y el tipo de operacin que
desea realizar cada uno. Este conjunto constituira las variables de estado del sistema.

Tipos de sistemas

Evidentemente, las caractersticas del sistema real que se desea estudiar van a condicionar el
tipo de simulacin que se va a desarrollar. Por lo tanto, conviene hacer una clasificacin de los
sistemas de acuerdo con los aspectos que van a condicionar su anlisis posterior. As, es til
realizar una clasificacin de los sistemas atendiendo a tres aspectos fundamentales:
Sistemas estticos y sistemas dinmicos. Un sistema se considera esttico cuando sus
variables de estado no cambian a lo largo del tiempo, es decir, cuando el tiempo no juega
ningn papel en sus propiedades. Por el contrario, en un sistema dinmico los valores que
toman todas o algunas de sus variables de accin evolucionan a lo largo del tiempo.

Sistemas deterministas y sistemas estocsticos. Si un sistema no tiene ningn componente de


carcter estocstico (es decir, aleatorio) se considera determinista. En este caso, el
comportamiento del sistema est determinado una vez que se hayan definido las condiciones
iniciales y las relaciones que existen entre sus componentes.

Por el contrario, un sistema no determinista o estocstico tiene algn elemento que se


comporta de forma aleatoria, de forma que no est predeterminado comportamiento en funcin
de las condiciones iniciales y de las relaciones entre sus componentes. En este caso, el
sistema slo se podr estudiar en trminos probabilistas, consiguiendo, en el mejor de los
casos, conocer sus respuestas posibles con sus probabilidades asociadas.

Sistemas continuos y sistemas discretos. En un sistema continuo las variables de estado


cambian de forma continua a lo largo del tiempo, mientras que en uno discreto cambian
instantneamente de valor en ciertos instantes de tiempo. En un sistema de una cierta
complejidad puede ocurrir que existan simultneamente variables de estado continuas y
discretas. En este caso, dependiendo de la predominancia de una y otras y del objetivo del
estudio que se pretende realizar, se considerar el sistema como perteneciente a uno de los
dos tipos.

Tipos de modelos

Para estudiar un sistema, la forma ms inmediata sera experimentar sobre l. Sin embargo,
esto puede ser desaconsejable, e incluso imposible, por diversos motivos:

Puede ocurrir que el sistema no exista y lo que se pretenda sea su diseo.


Puede ser imposible experimentar con el sistema real porque no se dispone de ningn
control sobre dicho sistema; por ejemplo, si se desea estudiar un sistema financiero,
burstil,...

Puede ser econmicamente inviable la experimentacin sobre el sistema real.

La experimentacin sobre el sistema real puede conllevar unos plazos de tiempo muy
dilatados. Es el caso, por ejemplo, de ciertos sistemas sociales o biolgicos.

En cualquiera de los casos anteriores se hace necesaria la construccin de un modelo del


sistema que refleje con la fidelidad adecuada las caractersticas destacadas del sistema a
analizar y la experimentacin sobre dicho modelo. Si se realiza correctamente la
construccin del modelo y el diseo de los experimentos, los resultados obtenidos
permitirn inferir cul sera el comportamiento del sistema a analizar en determinadas
condiciones.

Necesidad de la simulacin

Ya se ha indicado anteriormente que se recurre a la simulacin cuando el modelo matemtico


que representa el sistema a estudiar es excesivamente complejo o resulta inabordable por no
estar desarrollados mtodos analticos para su resolucin. La fuente de complejidad puede
tener bsicamente dos causas:

En los sistemas continuos es frecuente que unas variables de estado representen la tasa o
velocidad de cambio de otras variables de estado. La formulacin matemtica de estos
modelos lleva a la aparicin de ecuaciones diferenciales que indican las relaciones
anteriormente mencionadas. Si el sistema tiene una cierta complejidad, puede ocurrir que
las ecuaciones diferenciales sean no lineales y, por lo tanto, de difcil o imposible resolucin
analtica.

En los sistemas discretos pueden aparecer fenmenos aleatorios que slo se pueden
representar en trminos probabilistas. En este caso, la formulacin matemtica del modelo
contiene relaciones en las que aparecen funciones de distribucin o de densidad de
probabilidad, que dificultan o impiden su resolucin analtica.
Como ya se ha indicado, la catalogacin de un sistema como continuo o discreto depende del
objetivo del estudio y de las variables de estado predominantes. Esto quiere decir que un
mismo sistema puede tener ciertas variables de estado continuas y otras discretas. Por lo
tanto, no es infrecuente encontrar modelos en los que coexisten ecuaciones diferenciales
complejas con variables aleatorias, lo que, evidentemente, complica an ms la resolucin
analtica.

Verificacin. El modelo anterior se debe validar mediante la ejecucin de una serie de


experimentos piloto, en los que los resultados obtenidos coincidan con los previsibles ante
determinadas condiciones iniciales. Por otra parte, si el sistema modelado es similar a alguno
ya existente, se puede contrastar el funcionamiento del modelo con el del sistema real.

Ventajas de la simulacin

Ya se ha comentado previamente que la simulacin es una tcnica cada vez ms utilizada en el


estudio de sistemas complejos. Entre los argumentos a favor de la utilizacin de la simulacin
se encuentran los siguientes:

La mayora de los sistemas complejos reales con elementos estocsticos no se pueden


describir con suficiente precisin mediante un modelo matemtico que se pueda resolver
analticamente. Por lo tanto, con frecuencia la simulacin es el nico mtodo posible de estudio
de dichos sistemas.

La simulacin permite estimar el comportamiento de un sistema existente bajo un conjunto


previsto de condiciones operativas.

Mediante la simulacin se pueden comparar diseos alternativos (o polticas de operacin


alternativas para un determinado diseo) para especificar cul es el que cumple de forma ms
adecuada con los objetivos formulados.
En la simulacin se puede tener un control mucho mejor sobre las condiciones del
experimento que si se realizase sobre el propio sistema.

La simulacin permite estudiar un sistema cuya evolucin es muy dilatada en el tiempo (por
ejemplo, un sistema econmico) en un periodo de tiempo reducido. Alternativamente,
tambin permite estudiar de forma detallada la evolucin de un sistema en un corto periodo
de tiempo.

Conclusin

El proceso de validacin de un modelo de simulacin siempre est sujeto al


experimento frente al que se vaya a realizar el estudio. Por lo que no se puede
asegurar estrictamente si el modelo es vlido o no, habr que sealar siempre el
experimento frente al que es vlido o no. Sirve por lo tanto como una gua en el diseo
de experimentos. Para realizar la validacin de cualquier modelo de simulacin, no es
necesario ser un experto del sistema que el modelo represente, bastara con tener
ciertos conocimientos estadsticos y estar apoyado por en el sistema.
Bibliografa
http://ocwus.us.es/metodos-de-investigacion-y-diagnostico-en-educacion/analisis-de-datos-en-
la-investigacion-educativa/Bloque_II/page_40.htm/

http://revistas.utp.edu.co/index.php/revistaciencia/article/view/3137

http://www.iol.etsii.upm.es/arch/simulacion.pdf

file:///C:/Users/El%20Kostra/Downloads/693-388-140_10.pdf

https://www.ingenieriaindustrialonline.com/herramientas-para-el-ingeniero-industrial/estudio-de-
tiempos/c%C3%A1lculo-del-n%C3%BAmero-de-observaciones/

http://www.didacticaambiental.com/revista/numero10/6.-.pdf
http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-
graphs/introductory-concepts/confidence-interval/confidence-interval/
http://campus.fi.uba.ar/course/view.php?id=187
http://www.iol.etsii.upm.es/arch/simulacion.pdf
http://www.redalyc.org/pdf/302/30235208.pdf
http://www.simulacion.com/trabajos-pdf5/prueba-chi-cuadrada-estadistica/prueba-chi-cuadrada-
estadistica.shtml
http://simulacionunilibre.blogspot.mx/p/prueba-anderson-darling.html
http://www.econ.unicen.edu.ar/attachments/1051_TecnicasIISimulacion.pdf
http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/monte_carlo/monte_carlo.htm?iframe=true&width=95
%&height=95%
http://www.scielo.org.mx/scielo.php?pid=S2007-24222014000500012&script=sci_arttext&tlng=en
http://dspace.ucbscz.edu.bo/dspace/bitstream/123456789/4345/3/1368.pdf

S-ar putea să vă placă și