Sunteți pe pagina 1din 13

1 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES

CONTINUAS
1.1 DISTRIBUCION NORMAL
La distribucin normal es una distribucin simtrica en forma de campana, tambin conocida
como Campana de Gauss. Aunque muchas veces no se ajusta a los datos hidrolgicos tiene
amplia aplicacin por ejemplo a los datos transformados que siguen la distribucin normal.
1.1.1 Funcin de densidad:
La funcin de densidad est dada por
< <

x x f
x
2
2
) (
2
1
exp
2
1
) (


Los dos parmetros de la distribucin son la media y desviacin estndar para los cuales
x (media) y s (desviacin estndar) son derivados de los datos.
1.1.2 Estimacin de parmetros:

n
i
i
x
n
x
1
1
2
1
1
2
) (
1
1

'

n
i
i
x x
n
s
1.1.3 Factor de frecuencia:
1. Si se trabaja con los X sin transformar el K se calcula como

T
T
x
K
este factor es el mismo de la variable normal estndar ) 1 (
1
1
Tr T
F K

1.1.4 Limites de confianza:
e Tr
S t X
) 1 (
t
1
donde es el nivel de probabilidad ) 1 (
t
es el cuantil de la distribucin normal
estandarizada para una probabilidad acumulada de 1- y S
e
es el error estndar
1.2 DISTRIBUCION LOGNORMAL DE DOS PARAMETROS
Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se
distribuye normalmente.
Esta distribucin es muy usada para el calculo de valores extremos por ejemplo Qmax,
Qmnimos, Pmax, Pmnima (excelentes resultados en Antioquia). Tiene la ventaja que X>0
y que la transformacin Log tiende a reducir la asimetra positiva ya que al sacar logaritmos
se reducen en mayor proporcin los datos mayores que los menores.
Limitaciones: tiene solamente dos parmetros, y requiere que los logaritmos de la variables
estn centrados en la media
1.2.1 Funcin de densidad:
0 exp
2
1
) (
2
) (
2
1
>

x
x
x f
y
y
y


y = ln x
donde,
y
: media de los logaritmos de la poblacin (parmetro escalar), estimado
y

y
: Desviacin estndar de los logaritmos de la poblacin, estimado s
y
.
1.2.2 Estimacin de parmetros:

n
i
i
x
n
y
1
) ln(
1
2
1
2
1
) ) (ln(
1
1

'

n
i
i y
y x
n
s
1.2.3 Factor de frecuencia:
Puede trabajarse en el campo original y en el campo transformado.
2. Campo transformado : Si se trabaja en el campo transformado se trabaja con la media y la
desviacin estndar de los logaritmos, as:
2
Ln(X
Tr
) = x
Tr
+KS
y
de donde,
XT
r
= e
ln (x
Tr
)
con K con variable normal estandarizada para el Tr dado, x
y
media de los logaritmos y S
y
es
la desviacin estndar de los logaritmos.
3. Campo original : Si se trabaja con los X sin transformar el K se calcula como
Cv
Cv
Cv Ln K Exp
Kt
T
1
2
) 1 ln(
)) 1 ( ( *
2
2
1
2

'

,
_

+
+

K es la variable normal estandarizada para el Tr dado,


x
s
Cv es el coeficiente de
variacin, x media de los datos originales y s desviacin estndar de los datos originales.
1.2.4 Limites de confianza:
En el campo transformado.
T Tr
S t X Ln
) 1 (
) (

t
2
1
2
2
1
) (

,
_

+
T
y
e
K
n
S
S

en donde, n numero de datos, Se error estndar, K


T
variable normal estandarizada.
EJEMPLO: En un ro se tienen 30 aos de registros de Qmximos instantneos anuales con
x= 15 m
3
/s, S = 5 m
3
/s (media y desviacin estndar para los datos originales). x
y
=2.655, s
y
= 0.324 (media y desviacin estndar de los datos transformados). Encontrar el caudal para
un periodo de retorno de 100 aos y los limites de confianza para un = 5%. Calcular la
probabilidad de que un caudal de 42.5 m
3
/s no sea igualado o excedido P(Q 4.25).
Solucin:
n=30
x= 15 m
3
/s x
y
=2.655
s = 5 m
3
/s s
y
= 0.324
En el campo original
3
Kt
Exp K Ln Cv
Cv
Cv

+
+

_
,

'

*( ( ))
ln( )
1
1
2
1
2
1
2
2
x
s
Cv = 5/15 = 0.33
K = F
-1
(1-1/Tr) = F
-1
(1-1/100) = F
-1
(0.99)
de la tabla de la normal se obtiene KT=2.33
33 . 0
1
2
) 33 . 0 1 ln(
)) 33 . 0 1 ( ( * 33 . 2
2
2
1
2

'

,
_

+
+

Ln Exp
K
T
K
T
= 3.06
QTr = 15 + 5 * 3.028
QTr = 30.14 m
3
/s
En el campo transformado se tiene que:
LnQ
Tr100
= 2.655 + 2.33*0.324
LnQ
Tr100
= 3.40992
Q
Tr100
= Exp (3.40992)
Q
Tr100
= 30.26 m
3
/s
Limites de confianza
Ln (QTr) t t
(1-)
Se
2
1
2
2
1
) (

,
_

+
T
y
e
K
n
S
S

_
,
1
2 33
2
2
1
2
.
= 1.93
4
Se

193 0 324
30
011
. .
.
t
(1-)
= t
(0.95)
= 1.645 (Ledo de la tabla de la normal)
Ln(30.28) t (1.645 ) (0.11)
3.41 t 0.18095
[3.22905 3.59095]
[e
3.22905
e
3.59095
]
[25.26 36.29] Intervalos de confianza para Q
Tr100
b) Calcular la probabilidad de que un caudal de 45 m
3
/s no se igualado o excedido P(Q
4.25).
Ln(42.5) = 3.75
t = (3.75 - 2.655)/0.324
F(3.38) = 0.9996 Ledo de la tabla de la normal
P(Q 4.25) = 99.9%
1.3 DISTRIBUCION GUMBEL O EXTREMA TIPO I
Una familia importante de distribuciones usadas en el anlisis de frecuencia hidrolgico es la
distribucin general de valores extremos, la cual ha sido ampliamente utilizada para
representar el comportamiento de crecientes y sequas (mximos y mnimos).
1.3.1 Funcin de densidad:
1
]
1

,
_

) (
exp
) (
exp
1
) (
x x
x f
En donde y son los parmetros de la distribucin.
1
]
1

,
_

) (
exp exp ) ( ) (
x
dx x f x F
5
1.3.2 Estimacin de parmetros

5772 . 0
6

x
s
donde
s y x
son la media y la desviacin estndar estimadas con la muestra.
1.3.3 Factor de frecuencia:

'

1
]
1

,
_

+
1
ln ln 5772 . 0
6
r
r
T
T
T
K

Donde Tr es el periodo de retorno. Para la distribucin Gumbel se tiene que el caudal para
un perodo de retorno de 2.33 aos es igual a la media de los caudales mximos.
1.3.4 Limites de confianza
Xt t t
(1-)
Se
n
s
Se

2
1
2
] 1 . 1 1396 . 1 1 [
T T
K K + +
K
T
es el factor de frecuencia y t
(1-)
es la variable normal estandarizada para una probabilidad
de no excedencia de 1-.
EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 aos de periodo de retorno y
los intervalos de confianza. x= 15 m
3
/s, s = 5 m
3
/s
Q
Tr100
= x + K
T
s
{ } )] 99 ln( 100 ln[ln 577 . 0
6
+

T
K
K
T
= 3.14
6
Q
Tr100
= 15 + 3.14*5
Q
Tr100
= 30.7 m
3
/s
Intervalos de confianza
t
(1-)
= t
(0.95)
= 1.645 (Ledo de la tabla de la normal)
+ + [ . ( . ) . ( . ) ] 1 11396 314 11 314
2
1
2
= 3.93
Se
Se m s

( . ) ( )
. /
393 5
30
358
3
Xt t t
(1-)
Se
30.7 m
3
/s t (1.64) (3.58)
[24.83 m
3
/s 36.58 m
3
/s] Intervalo de confianza para QTr100
1.4 DISTRIBUCION GAMA DE TRES PARAMETROS O PEARSON
TIPO 3
Esta distribucin ha sido una de las mas utilizadas en hidrologa. Como la mayora de las
variables hidrolgicas son sesgadas, la funcin Gamma se utiliza para ajustar la distribucin
de frecuencia de variables tales como crecientes mximas anuales, Caudales mnimos,
Volmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volmenes
de lluvia de corta duracin. La funcin de distribucin Gamma tiene dos o tres parmetros.
1.4.1 Funcin de densidad:
( )

,
_

,
_

0
1
0

exp
1
) (
x x x x
x f
donde,
x
0
x < para > 0
< x x
0
para < 0
7
y son los parmetros de escala y forma, respectivamente , y x
0
es el parmetro de
localizacin.
1.4.2 Estimacin de parmetros:

;
2
;
2

0
2

,
_

x x
Cs
s
Cs
Cs es el coeficiente de asimetra,
s y x
son la media y la desviacin estndar de la
muestra respectivamente.
1.4.3 Factor de frecuencia:
5 4 3
2
2
3 2
6 3
1
6 6
) 1 (
6
) 6 (
3
1
6
) 1 (

,
_

,
_

,
_

,
_

+ +
Cs Cs
z
Cs
z
Cs
z z
Cs
z z K
donde z es la variable normal estandarizada
Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.
1.4.4 Intervalos de confianza:
Xt t t
(1-)
Se
Se
S
n


Donde S es la desviacin estndar de la muestra, n es el nmero de datos y se encuentra
tabulado en funcin de Cs y Tr.
EJEMPLO: Se tiene una estacin con 30 aos de registros de caudales mximos
instantneos con Media de 4144 pie
3
/s y desviacin estndar de 3311 pie
3
/s. Si el coeficiente
de asimetra de los caudales es de 1.981 pie
3
/s cual es caudal para un periodo de retorno de
100 aos y su intervalo de confianza.
QTr100 = X+ SK
K es F(1.981, 100) de tablas se obtiene K=3.595 (1.9,100) = 3.553
(2.0,100) = 3.605
QTr100 = 4144+ (3.595) (3311)
8
QTr100 = 16050 pie
3
/s
Intervalos de confianza
Xt t t
(1-)
Se
Se
S
n


= F(1.981,100) de tablas se obtiene =8.4922 (1.9,100) = 8.2196
(2.0,100) = 8.5562
Se
( ) ( . ) 3311 8 4922
30
Se = 5133.56 pie
3
/s
t
(1-)
= t
(0.95)
= 1.645 (Ledo de la tabla de la normal)
16050 t (5133.56) (1.645)
[7605.29 pie
3
/s 24494.71pie
3
/s] Intervalos de confianza para QTr100
1.5 DISTRIBUCION LOG GAMMA O LOGPEARSON DE 3
PARAMETROS
Si los logaritmos Y de una variable aleatoria X se ajustan a una distribucin Pearson tipo III,
se dice que la variable aleatoria X se ajusta a una distribucin Log Pearson Tipo III. Esta
distribucin es ampliamente usada en el mundo para el anlisis de frecuencia de Caudales
mximos. Esta se trabaja igual que para la Pearson Tipo III pero con X
y
y S
y
como la media
y desviacin estndar de los logaritmos de la variable original X.
1.5.1 Funcin de densidad:
( )

,
_

,
_

0
1
0
) ln(
exp
) ln( 1
) (
y x y x
x
x f
donde,
y
0
y < para > 0
< y y
0
para < 0
9
y son los parmetros de escala y forma, respectivamente , y y
0
es el parmetro de
localizacin.
1.5.2 Estimacin de parmetros:

;
2
;
2

0
2

,
_

y y
x x
Cs
s
Cs
Cs es el coeficiente de asimetra, , y y
s y x
son la media y la desviacin estndar de los
logaritmos de la muestra respectivamente.
1.5.3 Factor de frecuencia:
y y Tr
s K x Y + ) ln(

5 4 3
2
2
3 2
6 3
1
6 6
) 1 (
6
) 6 (
3
1
6
) 1 (

,
_

,
_

,
_

,
_

+ +
Cs Cs
z
Cs
z
Cs
z z
Cs
z z K
donde z es la variable normal estandarizada
Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.
1.5.4 Intervalos de confianza:
Xt t t
(1-)
Se
Se
S
n
y


Donde S
y
es la desviacin estndar de los logaritmos de la muestra, n es el nmero de datos
y se encuentra tabulado en funcin de Cs y Tr.
2 AJUSTE DE DISTRIBUCIONES
Para la modelacin de caudales mximos se utilizan, entre otras, las distribuciones Log -
Normal, Gumbel y Log-Gumbel principalmente. Para seleccionar la distribucin de
probabilidades de la serie histrica se deben tener en cuenta algunas consideraciones.
10
Cuando en la serie histrica se observan outliers
1
es necesario verificar la
sensibilidad del ajuste debido a la presencia de estos, (Ashkar, et al. 1994)
Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-Pearson se
requiere transformar la variable al campo logartmico para modelarla, con lo que se
disminuye la varianza muestral, pero tambin se filtran las variaciones reales de los
datos.
Las distribuciones de dos parmetros fijan el valor del coeficiente de asimetra, lo
que en algunos casos puede no ser recomendable. La distribucin Log - Normal de
dos parmetros slo es recomendable s el coeficiente de asimetra es cercano a cero.
Las distribuciones Gumbel y Log - Gumbel son recomendables si el coeficiente de
asimetra de los eventos registrados es cercano a 1.13
Para ajustar distribuciones de tres parmetros (Log Normal III, Log Pearson) se
requiere estimar el coeficiente de asimetra de la distribucin; para ello es necesario
disponer de una serie con longitud de registros larga, mayor de 50 aos, (Kite,
1988). Las distribuciones de dos parmetros son usualmente preferidas cuando se
dispone de pocos datos, porque reducen la varianza de la muestra, (Ashkar, et al.
1994).
Para seleccionar la distribucin de probabilidades adecuada se debe tratar de utilizar
informacin adicional del proceso hidrolgico que permita identificar la forma en que
se distribuye la variable. Usualmente es muy difcil determinar las propiedades fsicas
de los procesos hidrolgicos para identificar el tipo de distribucin de probabilidad
que es aplicable.
Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la
distribucin que mejor se ajusta a los caudales mximos y recomiendan seleccionar el
mejor ajuste a criterio del modelador con la prueba de ajuste grfico o basado en el
comportamiento de las pruebas estadsticas de bondad del ajuste (por ejemplo Chi
Cuadrado, Smirnov-Kolmogorov, Cramer-Von Mises) en las que se calcula un
estimador y se compara con un valor tabulado para determinar si el ajuste es
adecuado o no. En la prueba de ajuste grfica se dibujan los valores registrados en la
serie contra la distribucin terica de probabilidades y de manera visual (subjetiva) se
determina si el ajuste es adecuado o no.
Cuando la informacin es adecuada el anlisis de frecuencia es la metodologa ms
recomendable para la evaluacin de eventos extremos, ya que la estimacin depende
solamente de los caudales mximos anuales que han ocurrido en la cuenca y no da cuenta de
los procesos de transformacin de la precipitacin en escorrenta. Obviamente tiene algunas
limitaciones relacionadas con el comportamiento de la serie histrica y con el tamao y
calidad de los datos de la muestra.
1
Aunque no existe una definicin generalmente aceptada, se puede entender como valores extremos, muy
superiores a los dems registrados (Ashkar, et al. 1994).
11
Cuando se presenten cambios o tendencias en la serie histrica se deben utilizar
tcnicas estadsticas que permitan removerlos para poder realizar el anlisis de
frecuencias (Kite, 1988; Mamdouh, 1993; Ashkar, et al. 1994).
La seleccin inadecuada de la distribucin de probabilidades de la serie histrica
arrojar resultados de confiabilidad dudosa, (Ashkar, et al. 1994).
El tamao de la muestra influye directamente en la confiabilidad de los resultados, as
a mayor perodo de retorno del estimativo mayor longitud de registros necesaria para
mejor confiabilidad en los resultados.
El ajuste a distribuciones se puede hacer de dos tcnicas, con el factor de frecuencia como
se refiri en el numeral Error: Reference source not found o hallando la distribucin
emprica de los datos muestrales, por el mtodo de Plotting Position.
2.1 Plotting Position
Trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Se han
propuesto numerosos mtodos empricos. Si n es el total de valores y m es el rango de un
valor en una lista ordenada de mayor a menor (m=1 para el valor mximo) la probabilidad de
excedencia se puede obtener por medio de las siguientes expresiones
California
n
m
P
Weibull
1 +

n
m
P
Hazen
n
m
P
2
1 2

La expresin ms utilizada es la Weibull. Con las anteriores expresiones se halla lo que se


conoce como la distribucin emprica de una muestra, esta luego se puede ajustar a una de
las distribuciones tericas presentadas anteriormente. Los resultados pueden ser dibujados
en el papel de probabilidad; este es diseado para que los datos se ajusten a una lnea recta y
se puedan comparar los datos muestrales con la distribucin terica (lnea recta).
2.2 Pruebas de Ajuste
Para determinar que tan adecuado es el ajuste de los datos a una distribucin de
probabilidades se han propuesto una serie de pruebas estadsticas que determinan si es
adecuado el ajuste. Estos son anlisis estadsticos y como tal se deben entender, es decir, no
se puede ignorar el significado fsico de los ajustes.
12
2.2.1 Prueba Smirnov Kolmogorov
El estadstico Smirnov Kolmogorov D considera la desviacin de la funcin de distribucin
de probabilidades de la muestra P(x) de la funcin de probabilidades terica, escogida Po(x)
tal que
)) ( ) ( max( x Po x P Dn
.
La prueba requiere que el valor Dn calculado con la expresin anterior sea menor que el
valor tabulado Dn para un nivel de probabilidad requerido.
Esta prueba es fcil de realizar y comprende las siguientes etapas:
El estadstico Dn es la mxima diferencia entre la funcin de distribucin acumulada
de la muestra y la funcin de distribucin acumulada terica escogida.
Se fija el nivel de probabilidad , valores de 0.05 y 0.01 son los ms usuales.
El valor crtico D de la prueba debe ser obtenido de tablas en funcin de y n.
Si el valor calculado Dn es mayor que el D, la distribucin escogida se debe
rechazar.
2.2.2 Prueba Chi Cuadrado
Una medida de las discrepancia entre las frecuencias observadas (f
o
) y las frecuencias
calculadas (f
c
) por medio de una distribucin terica esta dada por el estadstico

k
i c
c o
f
f f
1
2
2
) (

en donde

c
o
f f
si el estadstico =0 significa que lae distribuciones terica y emprica ajustan exactamente,
mientras que si el estadstico >0, ellas difieren. La distribucin del estadstico se puede
asimilar a una distribucin Chi-cuadrado con (k-n-1) grados de libertad, donde k es el
nmero de intervalos y n es el nmero de los parmetros de la distribucin terica. La
funcin se encuentra tabulada. Supongase que una hiptesis Ho es aceptar que una
distribucin emprica se ajusta a una distribucin Normal. Si el valor calculado de por la
ecuacin anterior es mayor que algn valor crtico de , con niveles de significancia de
0.05 y 0.01 (el nivel de confianza es 1-) se puede decir que las frecuencias observadas
difieren significativamente de las frecuencias esperadas (o calculadas) y entonces la
hiptesis Ho se rechaza, si ocurre lo contrario entonces se acepta.
13

S-ar putea să vă placă și