Sunteți pe pagina 1din 60

11/02/2014

FACULTAD DE INGENIERIA
PROGRAMA ACADEMICO PROFESIONAL DE
INGENIERIA CIVIL

CURSO:

HIDROLOGIA GENERAL
DOCENTE:
ING CARLOS LUNA LOAYZA

FACULTAD DE INGENIERIA
PROGRAMA ACADEMICO PROFESIONAL DE
INGENIERIA CIVIL

ESTADISTICA EN HIDROLOGIA

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.1 Introduccin
1. Los eventos hidrolgicos no son gobernados por leyes
fsicas, sino por leyes del AZAR. Son fenmenos
ERRATICOS,

COMPLEJOS

de

NATURALEZA

ALEATORIA.
2. El conocimiento de la Hidrologa es bsico para el diseo
en la ingeniera (definicin de condiciones crticas).
3. La definicin del comportamiento hidrolgico requiere:
Anlisis probabilsticos y estadsticos basados en registros
histricos.
4. Hidrologa trata con VARIABLES ALEATORIAS.

5.0 ESTADISTICA EN HIDROLOGIA


5.2 Variables
VARIABLE ALEATORIA (v.a): Variable cuyo comportamiento
no puede predecirse con certidumbre.
Variable Aleatoria Discreta:
Solo puede tomar valores especficos. La ley de probabilidades
asocia medidas de probabilidad a cada posible ocurrencia de
la variable aleatoria.
Variable Aleatoria Continua: Si puede tomar todos los
valores en un rango de ocurrencia. La ley de probabilidades
asocia medidas de probabilidad a rangos de ocurrencia de la
variable aleatoria.

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.2. Variables
La informacin histrica de una variable
representa una MUESTRA de la POBLACIN.

Datos=muestra

1.

ANLISIS

hidrolgica

Poblacin

PROBABILSTICO:

POSIBLES Leyes de Probabilidad


comportamiento de la poblacin.

Anlisis
de
que describan

2. ANLISIS ESTADSTICO: Se hacen inferencias sobre


la variable (Poblacin) usando la MUESTRA

5.0 ESTADISTICA EN HIDROLOGIA


5.3 Distribuciones estadsticas
Puesto que las distribuciones de probabilidad son
idealizaciones de las distribuciones estadsticas, empezaremos
recordando cmo son los parmetros en estas para que nos
sirva de referencia. Puesto que la probabilidad es una
idealizacin de la frecuencia relativa, expresaremos los
parmetros en funcin de ellas.
Distribuciones empricas:
Representan valores observados o posibles de observar, de una
variable (X). Ejemplo Registro de Precipitacin.
Distribuciones tericas:
Provienen de ciertos principios o hiptesis (probabilidades)

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.3 Distribuciones estadsticas
Segn se trate de variables discretas o continuas, se usarn
modelos de distribucin probabilsticos discretos o continuos.
Sern modelos discretos aqullos cuya funcin densidad de
probabilidad y funcin de probabilidad acumulada se
encuentran definidas para determinados valores que puede
tomar la variable.
Las principales distribuciones discretas son:
l. Distribucin binomial
2. Distribucin de Poisson

5.0 ESTADISTICA EN HIDROLOGIA


5.3 Distribuciones estadsticas
Las principales distribuciones continuas son:
1. Distribucin uniforme
2. Distribucin normal
3. Distribucin logartmico-normal
4. Distribucin Gamma
5. Distribuciones de valores extremos
a. Tipo I o tipo exponencial (ley de Gumbel)
b. Tipo II o tipo Cauchy
c. Tipo III o distribuciones truncadas
6. Distribucin Chi cuadrado

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.3 Distribuciones estadsticas
Una vez que el ingeniero, en base a su experiencia, escoge el modelo
probabilstico que va a usar debe proceder a calcular los parmetros
de su modelo y despus revisar si este modelo es consistente con la
realidad. Ambas cosas las hace con los datos observados (registro o
muestra). Para la estimacin de los parmetros hay disponibles dos
mtodos:
Mtodo de los momentos
Mtodo de mxima verosimilitud
Para el estudio de la consistencia dos grupos de mtodos:
Mtodos grficos
Mtodos cuantitativos:
- test Chi cuadrado
- test W ,
- test Student
- test de Kolmogoroff.

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.1 Definicin de parmetros
Los parmetros de una distribucin terica, son variables que
para cada conjunto de datos tienen un valor definido. Una vez
que los parmetros quedan definidos, tambin queda definida la
distribucin terica.
Por lo general, una funcin densidad o una funcin de distribucin
acumulada, pueden escribirse como una funcin de la variable
aleatoria y en general como una funcin de sus parmetros, as
por ejemplo, la funcin densidad de la distribucin normal, de
variable aleatoria X, es:
1 x


1
f ( x) =
e 2
2

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.1 Definicin de parmetros
Los parmetros de una distribucin terica, son variables que para cada
conjunto de datos tienen un valor definido. Una vez que los parmetros
quedan definidos, tambin queda definida la distribucin terica.
Por lo general, una funcin densidad o una funcin de distribucin
acumulada, pueden escribirse como una funcin de la variable aleatoria
y en general como una funcin de sus parmetros, as por ejemplo, la
funcin densidad de la distribucin normal, de variable aleatoria X, es:
1 x


1
f ( x) =
e 2
2

Donde:
= parmetro de localizacin.
= parmetro de escala.

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.1 Definicin de parmetros
Para que la funcin f(x), quede definida, debe calcularse los parmetros
y . Como normalmente, no se conoce la poblacin de la variable
aleatoria, la estimacin de los parmetros, se realiza a partir de una
muestra.
Por ejemplo, si se tiene la muestra: x1, x2, x3, , xn
y si stos se ajustan a una distribucin normal los parmetros y se
estiman a partir de:
n

u = x =

i =1

Donde: u eselestimadorde

n
n

2 = S2 =

( x x)
i =1

S 2eselestimadorde 2

n 1

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.2 Definicin de estimadores
Dada una funcin de distribucin con parmetros , , , ..., se
llaman estimadores a los valores a, b, c,..., obtenidos a partir de
los estadsticos de la muestra, que se supone pertenece a la
poblacin que se pretende caracterizar.
La bondad de estos estimadores est dado por las diferencias ( a), ( - b), ( - c), etc., pero como es fcil intuir, hay infinitas
posibilidades para a, b, c, por lo tanto se consideran como mejores
estimadores aquellos, que se aproximan ms a los valores
poblacionales, y se llaman , , , ...
Los estimadores se clasifican como:
Sesgado si:
E (a ) = + v( )

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.2 Definicin de estimadores
Los estimadores se clasifican como:
Insesgado si:
Donde:
v () = E(a) - es el sesgo
Eficiente si:
El estimador es insesgado y adems:
VAR (a ) = E ( a )

Consistente:
Si el tamao muestral N es largo.
En hidrologa, se requiere principalmente que los estimadores
sean insesgados y eficientes, cuando se requiere extraer la
mxima informacin, desde los datos mustrales.

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.3
Clculo
de
la
probabilidad
emprica
o
experimental
Dado un conjunto de datos
ordenados:
Existen varias frmulas para
calcular la probabilidad de
ocurrencia de los datos
ordenados, los cuales se
muestran en la tabla 4.1.

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.3 Clculo de la probabilidad emprica o experimental
Donde :
P = Probabilidad experimental acumulada o frecuencia
relativa emprica
m = Nmero de orden
n = Nmero de datos
a = Valor comprendido en el intervalo 0 < a < 1, y depende
de n, de acuerdo a la siguiente tabla:
n
a
n
a

10
0.448
60
0.440

20
0.443
70
0.440

30
0.442
80
0.440

40
0.441
90
0.439

50
0.440
100
0.439

De todas estas frmulas empricas, la ms utilizada es la de Weibull.

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
Para determinar los valores numricos de los parmetros de la
distribucin terica, a partir de los datos mustrales, se utilizan
varios mtodos de estimacin, siendo en orden ascendente de
menor a mayor eficiencia, los siguientes:

Grfico
Mnimos Cuadrados
Momentos
Mxima Verosimilitud

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Este mtodo, consiste en plotear los valores de la distribucin
emprica sobre un papel especial, donde la distribucin terica
asignada a priori, se puede representar como una lnea recta, y
de all estimar los parmetros buscados.
As:
El papel de probabilidades normal, representa la distribucin
normal como una lnea recta.
El papel de probabilidades log-normal, representa la
distribucin log-normal como una lnea recta.
El papel de probabilidades Gumbel, representa la distribucin
Gumbel como una lnea recta.
El papel de probabilidades log-Gumbel,

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Por ejemplo, para determinar los estimadores de y , por
medio de una muestra dada correspondiente a una poblacin
normal, hacer lo siguiente:
1. Plotear los valores de la distribucin emprica de la muestra.
2. Dibujar una recta que se aproxime a los puntos, tanto como
sea posible.
3. Calcular el valor correspondiente para una probabilidad del
50%, este valor es x, el cual es un estimador de (figura
siguiente).
4. Calcular el valor para una probabilidad del 84.13%, el mismo
que corresponde a X + S, es decir:
X + S = K2 S = K2 X

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Por ejemplo,

10

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
S es un estimador de .
Otra forma de calcular S, es para una probabilidad del 15.87 %,
el mismo que corresponde a X - S, es decir:
X S = K3 S = X K 3

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Ejemplo 01.
Para la serie de datos de caudales, en m/s, correspondientes a
38 aos:

121.3
144.9
142.4
205.8
114.5
72.5

26.7
92.8
58.8
57.4
79.0
76.9

110.1
95.6
48.8
148.3
67.5
70.0

63.4
76.3
52.3
36.3
88.0

122.4
162.1
97.2
52.5
165.5

64.2 59.6
110.2
40.3
144.7 112.2
109.2 137.1
48.5 32.9

Suponiendo que se ajustan a una distribucin normal, estimar


los parmetros X y S, usando el mtodo grfico.

11

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Solucin 01.
1. Ordenando
los
valores de menor a
mayor y calculando la
probabilidad
acumulada, mediante
el
mtodo
de
Weibull, se obtiene la
tabla 4.1.

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Solucin 01.
2. Ploteando los valores de las columnas (2) y (3) de la tabla
4.1, en papel probabilstico normal, se obtiene la
distribucin emprica que se muestra en la figura 4.2.
3. Trazando una lnea recta de mejor ajuste , de tal manera que
se adapte mejor a los puntos ploteados, de la distribucin
emprica, se obtiene la distribucin terica normal, la misma
que se muestra en la figura 4.2.

12

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Solucin 01.
4. Para calcular la media X , hacer lo siguiente:
En la figura 4.2 ingresar en el eje de probabilidades (eje
X), con el 50 % y trazar una vertical, hasta interceptar a la
lnea de distribucin terica.
Por la interseccin, trazar una lnea horizontal, hasta
cortar al eje de caudales (eje Y).
En el eje de caudales, leer el valor correspondiente de X ,
para este caso se tiene: X = 92 m/s.

13

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Solucin 01.
5. Para calcular la desviacin estndar S, hacer lo siguiente:
En la figura 4.2 ingresar en el eje de probabilidades, con
el 84.13 % y trazar una vertical, hasta interceptar a la
lnea de distribucin terica.
Por la interseccin, trazar una lnea horizontal, hasta
cortar al eje de caudales.
En el eje de caudales, leer el valor correspondiente de X
+ S, para este caso se tiene: X + S = 135 m/s, de donde:
S=135- X
S = 135 - 92 5
S = 34 m/s

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
a.- Grfico
Solucin 01.
5. Para calcular la desviacin estndar S, hacer lo siguiente:
En la figura 4.2 ingresar en el eje de probabilidades, con
el 84.13 % y trazar una vertical, hasta interceptar a la
lnea de distribucin terica.
Por la interseccin, trazar una lnea horizontal, hasta
cortar al eje de caudales.
En el eje de caudales, leer el valor correspondiente de X
+ S, para este caso se tiene: X + S = 135 m/s, de donde:
S= 135- X
S = 135 - 92 5
S = 42.5 m/s

14

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
b.- Mtodo de los mnimos cuadrados
Este mtodo es ms aplicable para la estimacin de los
parmetros de una ecuacin de regresin.
Por ejemplo, dada la recta de regresin lineal:

y = a + bx
Donde a y b son los parmetros.
El error entre el valor observado i y el terico es:

ei = yi a bxi

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
b.- Mtodo de los mnimos cuadrados
y la suma de los cuadrados, de los errores de los valores
observados es:
n

i =1

i =1

S = ei2 = ( yi a bxi )

Esta suma puede minimizase para a y b, esto se consigue


derivando parcialmente S, en funcin de cada estimado a y b, e
igualando a cero, es decir:
n
S
= 2 ( yi a bxi ) = 0
a
i =1

(6.01)

n
S
= 2 xi ( yi a bxi ) = 0
b
i =1

(6.02)

15

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
b.- Mtodo de los mnimos cuadrados
Las ecuaciones (6.01) y (6.02) se denominan ecuaciones
normales, las cuales resueltas dan para ay b:

b=

n xi yi xi yi
n xi2 ( xi )

a = y bx =

(6.03)

y x b
i

(6.04)

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
b.- Mtodo de los mnimos cuadrados
Ejemplo 02
Se cuenta con 13 pares de datos de caudales picos para el ao
2000, en m/s, de las estaciones La Bomba y Asuncin, cuyos
valores se muestran en la tabla 6.2. Considerando que los
caudales de la estacin La Bomba, son las variables
independientes (x), y que los caudales de la estacin Asuncin,
son las variables dependientes (y), y que estas variables se
relacionan con la ecuacin lineal:
y=a+bx
estimar los parmetros a y b, que defina la ecuacin lineal.

16

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
b.- Mtodo de los mnimos cuadrados
La Bomba
Asuncin
Ejemplo 02
(x)

(y)

28
178
90
96
122
50
62
82
117
102
45
60
72

15
142
50
75
88
41
39
75
73
99
28
56
63

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
X
y
b.- Mtodo de los
28
15
mnimos cuadrados
178
142
Solucin 02
90
50
1. Clculo
de
la
96
75
sumatorias:
122
88
Los clculos se
50
41
muestran en la
62
39
tabla 6.03
82
75
2. Estimacin de b:
De la ecuacin
(6.03), se tiene:

117
102
45
60
72
1104

73
99
28
56
63
844

xy
420
25276
4500
7200
10736
2050
2418
6150
8541
10098
1260
3360
4536
86545

X2

784
31684
8100
9216
14884
2500
3844
6724
13689
10404
2025
3600
5184
112638. jumatori

17

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
b.- Mtodo de los
mnimos cuadrados
Solucin 02
Sustituyendo
valores, resulta:

b=
b=

n xi yi xi yi
n xi2 ( xi )

(13)(86545 ) (1104 )(844 )


2
13 (112638) (1104 )

b = 0.7875

3. Estimacin de a:
De la ecuacin
(6.04), se tiene:

a=

La ecuacin es:

y = 1952 + 0.7875 x

y x b
i

n
n
844 1104
a=

( 0.7875) = 1.952
13
13

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
El mtodo de los momentos fue desarrollado por Karl Pearson
en 1902. El principio bsico de la estimacin por este mtodo,
es establecer para cada funcin de distribucin, la relacin entre
los parmetros y los momentos centrales, de tal manera que:

= f1 ( i , i +1 ,...)

= f 2 ( j , j +1 ,...)

(6.05)

= f3 ( k , k +1 ,...)

donde:
, y
Son los parmetros de la funcin de distribucin
i, j y k Son los momentos con respecto a la media, o
momentos centrales de la poblacin

18

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Como los momentos, son estimados a partir de los momentos
de la muestra, como estimadores sesgados o insesgados, el
resultado que se obtiene ser a, b, c, a, b, c, como
estimadores sesgados o insesgados de los parmetros.
Cuando la distribucin de probabilidad, a la que se estiman los
parmetros por este mtodo es simtrica y particularmente si
es normal, se puede demostrar que este es un mtodo muy
eficiente, pero cuando las distribuciones son asimtricas y por lo
tanto sesgadas, como sucede muy a menudo con la mayora de
las variables hidrolgicas, el utilizar este mtodo representa una
prdida de eficiencia en la estimacin.

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Ejemplo 03
Dada la funcin densidad de la distribucin normal:

f ( x) =

1
e
2 2

1 x 1

2 2

para x
Estimar los parmetros 1 y 2, por el mtodo de momentos.

19

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Sabemos que:
1. La media poblacional es igual al 1er momento con respecto
al origen, es decir:

= E ( x ) = 1 =

xf ( x ) dx

(6.06)

2. La varianza es igual a 2 momento con respecto a la


media, es decir:

V ( x ) = = 2 =
2

( x ) f ( x ) dx
2

(6.07)

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Sustituyendo f(x) en (6.06) resulta:

1
e
2 2

1
2 2

1 x 1

2 2

( x) e

dx

1 x 1

2 2

dx

(6.08)

Haciendo

x 1

= y x = 1 + 2 y dx = 2 dy

(6.09)

20

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Lmites: Si x y

Si x + y +
Sustituyendo (6.09) en (6.08), se tiene:

1
(1 + 2 y ) e 2 2dx

2 2

y
22 y2
= 1 2 e 2 dy +
ye dy
2 2
2 2
2

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03

1 2 y2
22 y2
=
e dy + 2 ye dy
2 2
2
2

1 2
22
=
A+
B
2 2
2 2

(6.10)

Calculando A:

A=

y2
2

dy =

ye

y2
2

dy + ye
0

y2
2

dy

(6.11)

21

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Operando y aplicando transformada de Laplace, se tiene:

A = 2 e

1
y2
2

dy

(6.12)

A=

( 1/ 2 + 1)

(1/ 2 )

1/ 2 +1

(1/ 2 )

(1/ 2 )

1/ 2

Pero por propiedad de funcin gamma, se tiene:

(1/ 2 ) =

Sustituyendo:

A = 2

(6.13)

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Clculo de B

B=

ye

1
y2
2

dy =

ye

1
y2
2

dy + ye

1
y2
2

dy

(6.14)

Donde:

f ( y ) = ye

1
y2
2

Pero:

f ( y ) = ( y ) e

1
( y )2
2

= ye

1
( y )2
2

= f ( y)

22

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Dado que: f(-y) = -f(y) , f(y) matemticamente, es una funcin
impar, por lo cual se tiene:
0

ye

1
y2
2

dy = ye

1
y2
2

dy

Luego la ecuacin (6.14) se escribe:

B = ye

1
y2
2

dy + ye

1
y2
2

dy

B=0

(6.15)

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Sustituyendo (6.13) y (6.15) en (6.10), resulta:

1
2

2 +

= 1

2
0
2

Lo que indica que el primer parmetro 1, es igual a la media

1 =

1
N

=X

23

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Sustituyendo f(x) en (6.07), se tiene:

2 = 2 =

(x )

1 x 1


1
2
e
2 2

dx

Como =1

2 = 2 =

1
2 2

1 x 1

2
2 2

( x ) e
1

dx

Haciendo

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Haciendo

x 1

= y x = 1 + 2 y dx = 2 dy

Lmites:

Si x y
Si x + y +
Sustituyendo:

1
=
2 2
2

2
2

ye

1
y2
2

22
2 dy =
2 2

ye
2

1
y2
2

dy

24

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
1
Siendo f ( y) = y 2e 2 y
y f(-y) =f(y) funcin par, por lo cual:
2

Lmites:

f ( y )dy = 2 f ( y )dy
0

Si y = 0 t = 0
Si y t

Se tiene:
1

2 2 1t
= 2 t e 2 dt
2 0
2

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
Aplicando la transformada de Laplace, se tiene:

1
1 1

+
1

2 2 2 2 2
2 = 2 3 = 2 3
2 1 2
2 1 2
2
2

pero 1 = luego :
2

2 =

22

= 22
2
2 1

( 2)

El parmetro 2 es igual a

25

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
c.- Mtodo de los momentos
Solucin 03
2 =

1
xi X
N 1

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
d.- Mtodo de mxima verosimilitud
El mtodo de mxima verosimilitud, fue desarrollado por R.A.
Fisher (1922).
Dada una funcin densidad de probabilidad: f(x; , , ,...)
Donde:
, , ,...son los parmetros que deben ser estimados
Se define la funcin verosimilitud de la muestra, como la
productoria:
N

L = f ( xi , , , ,...)
i =1

L = f ( x1 , , , ,...)i f ( x2 , , , ,...)i...i f ( xN , , , ,...)

siendo N el tamao de la muestra

26

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
d.- Mtodo de mxima verosimilitud
El mtodo de mxima verosimilitud, consiste en estimara , ,
,... a partir de la muestra, de tal manera que L sea mxima.
Esto se obtiene por la diferenciacin parcial de L, con respecto a
cada parmetro e igualando a cero.
Tuesto que f(x) es no negativa, un valor mximo de L ser, en
general positivo. Como el logaritmo natural InL es una funcin
monotmicamente creciente de L, sta tiene un
mximo, precisamente en los puntos en que L tiene un mximo.
Por lo tanto, se puede usar InL en lugar de L, es decir:

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
d.- Mtodo de mxima verosimilitud
N

i =1

x =1

L = f ( xi , a, b, c,...) lnL = ln f ( xi , a, b, c,...)

este artificio, permite transformar una productoria a una


sumatoria, donde:
a, b, c, son estimadores de , , ,...
Entonces el conjunto de ecuaciones de mxima verosimilitud es:
ln L
ln L
ln L
=0;
=0 ;
= 0 ; ...
a
b
c

el mismo que tiene tantas ecuaciones como incgnitas.

27

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
d.- Mtodo de mxima verosimilitud
Las propiedades de los estimadores calculados por el mtodo de
mxima verosimilitud, son:
Usualmente insesgado
Si la eficiencia de estimadores existe para los parmetros ,
, ,... el mtodo puede producirlos.
La solucin de la ecuacin de verosimilitud, proporciona un
estimador que converge al valor poblacional, cuando el
tamao muestral tiende a infinito, por lo que el estimador es
consistente.

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
d.- Mtodo de mxima verosimilitud
Problema 04.
Dada la funcin densidad de la distribucin exponencial:

e x
f ( x) =
0

para x > 0, > 0


en otros casos

Estimar el parmetro , usando el mtodo de mxima


verosimilitud.

28

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.4 Estimacin de parmetros
5.4.4 Mtodos de estimacin de parmetros
d.- Mtodo de mxima verosimilitud
Solucin 04.
La funcin de verosimilitud.
N

L = f ( xi , )
i =1

Siendo f(xi,) = e-xi


Luego:
N

L = e xi
i =1

ln L = ln e xi = ln + ln e xi
i =1

i =1

ln L = ( ln xi )
i =1

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.1 Definicin
Las pruebas de bondad de ajuste, consisten en comprobar grfica y
estadsticamente, si la frecuencia emprica de la serie analizada, se
ajusta a una determinada funcin de probabilidades terica
seleccionada a priori, con los parmetros estimados con base en los
valores mustrales.
Las pruebas estadsticas, tienen por objeto medir la certidumbre que
se obtiene al hacer una hiptesis estadstica sobre una poblacin, es
decir, calificar el hecho de suponer que una variable aleatoria, se
distribuya segn una cierta funcin de probabilidades.
Las pruebas de bondad de ajuste ms utilizadas son:
Ajuste grfico
Ajuste estadstico
Chi cuadrado
Smirnov Kolmogorov

29

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.2 Ajuste grfico
El ajuste grfico se puede realizar de las siguientes formas:
Comparar grficamente el histograma funcin densidad emprica
de la serie de datos, con la funcin densidad terica y decidir
visualmente, si hay o no ajuste de acuerdo a la similitud o
diferencia de ambos

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.2 Ajuste grfico
Comparar grficamente la funcin acumulada de la serie de datos,
con la funcin acumulada terica seleccionada, dibujada en papel
milimtrico (figura 5.2), y decidir visualmente si hay o no ajuste

30

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.2 Ajuste grfico
Se puede tambin comparar grficamente la funcin acumulada de
la serie de datos, con la funcin acumulada terica, ploteada en un
papel probabilstico adecuado (figura 5.3), donde la distribucin
terica seleccionada, se pueda representar como una lnea recta
(por lo general, slo se pueden representar por una lnea recta las
distribuciones de 2 parmetros). As se tienen disponibles los
papeles probabilsticos normal, log-normal, gumbel, etc. El
procedimiento consiste en plotear los valores de la variable
hidrolgica (caudal, precipitacin, temperatura, etc.), versus la
probabilidad emprica en el papel de probabilidad
correspondiente. Si los puntos ploteados se agrupan alrededor de
una lnea recta, que es la representacin de la distribucin terica,
se puede afirmar con cierta certeza que estos datos se ajustan a la
distribucin deseada

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.2 Ajuste grfico

31

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
La prueba Chi-cuadrado se basa en el clculo de frecuencias, tanto de
valores observados, como valores esperados, para un nmero
determinado de intervalos. Esta prueba es comnmente usada, para
verificar la bondad de ajuste de la distribucin emprica a una
distribucin terica conocida, fue propuesta por Karl Pearson en 1900.
La expresin general de la prueba Chi-cuadrado est dada por:
k
( e )
C2 = i i
(5.1)
e
i =1

Donde:
k

= e
i =1

i =1

=N

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Donde:
XC2 = Valor calculado de Chi cuadrado a partir de los datos
i =Nmero de valores observados en el intervalo de clase i
ei = Nmero de valores esperados en el intervalo de clase i
K = Nmero de intervalos de clase
Asignando probabilidades a la ecuacin (5.1) es decir, asignando igual
probabilidad de ocurrencia a cada intervalo de clase, se tiene:
k

( N i NPi )

i =1

NPi

C2 =

(5.2)

Donde:
Ni = Nmero de observaciones que caen dentro de los lmites
de clases ajustadas del intervalo i.
N = Tamao muestral
Pi = Probabilidad igual para todos los intervalos de clases

32

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Pi = 1/ k ei = PN
i

(5.3)
Simplificando la ecuacin (5.2), se obtiene la
computacional desarrollada por Markovic (1965):
C2 =

K
N

N
i =1

2
i

frmula

(5.4)

El valor de % obtenido por la ecuacin (5.4) se compara con el Xt2


de la tabla A.8 del apndice, cuyo valor se determina con:
nivel de significacin:
= 0.05 = 0.01
grados de libertad:
g.l. = k-1-h
Donde:
h = es el nmero de parmetros a estimarse, as:
h = 2, para la distribucin normal
h = 3, para la distribucin log-normal de 3 parmetros

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Criterios de decisin.
El criterio de decisin se fundamenta en la comparacin del valor
calculado de Chi-cuadrado con el valor tabular encontrado, esto es:
Si el Chi-cuadrado calculado es menor o igual que el valor tabular,
es decir:
C2 t2
entonces, se acepta la hiptesis que el ajuste es bueno al nivel de
significacin seleccionado
Si el Chi-cuadrado calculado es mayor que el valor tabular, es decir:
C2 > t2
entonces, el ajuste es malo y se rechaza la hiptesis, siendo
necesario probar con otra distribucin terica.

33

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Ventajas y limitaciones.
1. Es aplicable slo para ajustes a la distribucin normal, puesto que
ha sido desarrollado con base en los datos normales e
independientes.
2. Se realiza en la funcin densidad de datos agrupados en intervalos
de clases.
3. Requiere un conocimiento a priori, de la funcin de distribucin
terica utilizada en el ajuste.
4. En la prctica se usa para cualquier modelo de ajuste, pero
estrictamente es vlido slo para la normal.
5. Es difcil de aplicarlo

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Problema 05.
Dada la serie histrica de caudales medios anuales en rn/s, que
corresponde a un registro de 38 aos:

Realizar la prueba de bondad de ajuste Chi-cuadrado para ver si se


ajustan a una distribucin normal.

34

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.
1. La hiptesis ser:
H0 : frecuencia observada = frecuencia esperada
Ha : frecuencia observada frecuencia esperada
2. Ordenando los datos de menor a mayor, se tiene:

3. Clculo de la frecuencia para datos agrupados


a. Clculo del nmero de intervalos de clase, segn Yevjevich:
NC= 1 + 1.331n(N)
NC= 1 + 1.331n(38) = 5.84 6.00

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.
b. Clculo de la amplitud de cada intervalo
X =

X max X min 205.80 26.50


=
= 35.82
NC 1
6 1

X = 35.82 36
X/2 = 18
c. Clculo de los intervalos de clase, marcas de clase, frecuencia
absoluta observada, frecuencia relativa, los resultados se
muestran en la tabla siguiente:
Donde:
Columna (3): Nmero de valores comprendido en el intervalo de
la columna (1).
Columna (4): Columna (3) entre N = 38
Columna (5): Acumular valores de la columna (4)

35

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.
b. Clculo de la media y desviacin estndar para datos
agrupados, utilizando las columnas (2) y (3)
k

X=

x * f
i

i =1

= 90.17

( x X )
k

S=

i =1

N 1

fi

= 43.03

Donde:
xi = marca de clase
fi = frecuencia relativa

36

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.
4. Clculo de la frecuencia esperada, utilizando la distribucin
terica normal, los resultados se muestran en la tabla 5.2
Donde:
Columna (3): Z = (x-X)/S variable estandarizada de la distribucin
normal para x = lmites de clase, de la columna (2).
Columna (4): rea bajo la curva normal, puede usar la tabla A.1
del apndice.
Columna (5): rea para cada intervalo de clase, se obtiene
restando los valores de la columna (4), si los signos
de Z de la columna (3) son iguales, y sumando los
valores de la columna (4), si los signos de Z son
diferentes.

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.

37

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.
Columna (6): Columna (5)xN = 38, se redondea en forma
adecuada, de tal manera que la suma de las
frecuencias absolutas sea igual a N = 38.
Columna (7): Son los mismos valores de la columna (3) de la
tabla 5.1
5. Clculo de XC2
De la ecuacin (5.1) se tiene:
2
k
( e )
C2 = i i
ei

i =1

Sustituyendo los valores de las columnas (6) y (7) de la tabla 5.2 se


tiene:
C2 =

( 4 5)

(15 10 )
10

( 9 12 )
12

(7 7)
7

( 2 3)
3

(1 1)

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Chi cuadrado (X)
Solucin 05.
C2 = 0.2 + 2.5 + 0.75 + 0 + 0.33 + 0 = 3.78

6. Clculo de Xt2
Grados de libertad

v = k 1 h
v = 6 1 2 = 3

= 0.05 = 5%
Nivel de significacin
De la tabla A.8 del apndice, para v = 3 y = 0.05, se tiene:
t2 = 7.81
7. Criterio de decisin:
Como XC2 =3.78 < Xt2 =7.81 se acepta la hiptesis nula Ho
Por consiguiente los datos se ajustan a la distribucin normal, con un
nivel de significacin del 5% 95% de probabilidad.

38

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
La prueba de ajuste de Smirnov-Kolmogorov, consiste en comparar las
diferencias existentes, entre la probabilidad emprica de los datos de
la muestra y la probabilidad terica, tomando el valor mximo del
valor absoluto, de la diferencia entre el valor observado y el valor de
la recta terica del modelo, es decir:
(5.5)
= mx F ( x) P( x)
Donde:
=

Estadstico de Smirnov-Kolmogorov, cuyo valor es igual a la


diferencia mxima existente entre la probabilidad ajustada
y la probabilidad emprica.
F(x) = Probabilidad de la distribucin terica
P(x) = Probabilidad experimental o emprica de los datos,
denominada tambin frecuencia acumulada.
El estadstico tiene su funcin de distribucin de probabilidades.

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Si o es un valor crtico para un nivel de significacin a, se tiene que:
P mx F ( x) P( x) 0 =
o
P ( 0 ) =

(5.6)

Tambin:
P ( < 0 ) = 1

(5.7)

El procedimiento para efectuar el ajuste, mediante el estadstico de


Smirnov-Kolmogorov, es el siguiente:
1. Calcular la probabilidad emprica o experimental P(x) de los datos,
para esto usar la frmula de Weibull:
P ( x) =

M
N +1

(5.8)

39

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Donde:
P(x) = probabilidad emprica o experimental
M = nmero de orden
N = nmero de datos
2. Calcular la probabilidad terica F(x):
Para el caso de utilizar el procedimiento de los modelos tericos,
usar la ecuacin de la funcin acumulada F(x), o tablas elaboradas
para tal fin.
Si se quiere aplicar el procedimiento grfico, se utiliza un papel
probabilstico especial donde F(x), puede representarse como una
lnea recta, por lo cual, se puede trazar con solo 2 puntos, pero si
se quiere chequear que es una recta, se pueden plotear 3 puntos,
por ejemplo para el caso de una distribucin normal, los puntos:

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Valor
X
X+S
X-S

Probabilidad
%
50
80.13
15.87

Representados en un papel de probabilidad normal, forman una


recta.
3. Calcular las diferencias P(x) - F(x), para todos los valores de x
4. Seleccionar la mxima diferencia:
= mx F ( x) P ( x)

5. Calcular el valor crtico del estadstico A, es decir A o, para un a - 0.05


y N igual al nmero de datos. Los valores de A o, se muestran en la
tabla 5.3

40

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
6. Comparar el valor del estadstico
, con el valor crtico o de la
tabla 5.3, con los siguientes
criterios de decisin deducidos
de la ecuacin (5.6):
Si
< o => el ajuste es bueno,
al nivel de significacin
seleccionado.
> o => el ajuste no es
bueno,
al
nivel
de
significacin
seleccionado,
siendo necesario probar con
otra distribucin

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Ventajas y limitaciones
1. No requiere un conocimiento a priori de la funcin de distribucin
terica.
2. Es aplicable a distribuciones de datos no agrupados, es decir, no se
requiere hacer intervalos de clase.
3. Es aplicable a cualquier distribucin terica.
4. Se aplica en la funcin de distribucin acumulada y no en la funcin
de densidad.
5. Comparndola con la prueba Chi-cuadrado, no se requiere que la
frecuencia absoluta de cada clase, sea igual o mayor que 5.
6. No es una prueba exacta, sino una prueba aproximada.

41

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Problema 06
Para los mismos datos del ejemplo 5.1, realizar la prueba de bondad
de ajuste Smirnov-Kolmogorov, para ver si se ajustan a una
distribucin normal, usando:

El clculo de los valores de F(x) para todos los valores de x (donde x


representa el caudal).
Usando el procedimiento grfico.

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Solucin 06
1. Clculo de P(x):
Ordenando los datos de caudales en forma creciente y calculando la
probabilidad emprica P(x), usando la frmula de Weibull:
P ( x) =

M
N +1

se obtienen las columnas (2) y (3) de la tabla 5.4.


2. Clculo de X y S, de los datos no agrupados
X=

S=

1
xi = 92.32
n

1
X X
n 1

= 42.80

42

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Solucin 06
3. Clculo de la variable estandarizada Z:
Usando la ecuacin:
Z=

XX
S

se obtiene la columna (4) de la tabla 5.4.


4. Clculo de F(Z) = F(X):
Usando la tabla A.2 del apndice, se obtiene la columna (5) de la tabla
5.4. Para valores positivos de Z, los valores se obtienen en forma
directa. Para valores negativos de Z, los resultados se obtienen de:
1 - valor tabla A.2
5. Clculo de = |F(z)-P(x)|
A partir de las columnas (3) y (5) de la tabla 5.4, se obtiene los =
|F(z) - P(x)|, la misma que se muestra en la columna (6).

43

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Solucin 06
6. Clculo del = mx:
De la tabla 5.4, se observa que:
= max F ( z ) P ( x) = 0.1089

7. Clculo de o crtico:
De la tabla 5.3, para = 0.05 se tiene:
0 =

1.36 1.36
=
= 0.22
n
38

8. Criterio de decisin
Como:

= 0.189 < 0 = 0.22

Se concluye que los datos de caudales se ajustan a la distribucin


normal, con un nivel de significacin del 5% o una probabilidad del
95%.

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Solucin 06
Procedimiento grfico
1. Grfico de P(X) y F(Z) en papel de probabilidad normal.
1.1. Grfico de distribucin emprica P(X):
Plotear en un papel de probabilidad normal los valores de las
columnas (2) y (3) de la tabla 5.4.
1.2. Grfico de la distribucin terica F(Z) = F(X):
1.3. Con los procesos 1.1. y 1.2 se obtiene la figura 5.4

Valor de caudal
(m3/s)
X = 92.32
X +S =135.12
X - S = 49.52

Probabilidad
%

50
84.13
15.87

44

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Solucin 06

5.0 ESTADISTICA EN HIDROLOGIA


5.5 Pruebas de bondad de ajuste
5.5.3 Prueba Smirnov - Kolmogorov
Solucin 06
Procedimiento grfico
2. Clculo de = max |F(z)-P(x)|
Observando la figura 5.4, se tiene:
=0.10
3. Clculo de 0
De la tabla 5.3, para = 0.05 y n = 38, se obtiene:
0 =

1.36 1.36
=
= 0.22
n
38

2. Criterio de decisin:
Como:
= 0.10 < 0 = 0.22
Se concluye que los datos de caudales se ajustan a una distribucin
normal, con un nivel de significacin del 5%, o una probabilidad del
95%.

45

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.1 Introduccin
El hidrlogo generalmente tendr disponible un registro de datos
hidrometeorolgico (precipitacin, caudales, evapotranspiracin,
temperaturas, etc.), a travs de su conocimiento del problema fsico,
escoger un modelo probabilstico a usar, que represente en forma
satisfactoria el comportamiento de la variable.
Para utilizar estos modelos probabilsticos, se deben calcular sus
parmetros y realizar la prueba de bondad de ajuste, un esquema de
este proceso se muestra en la figura 6.1.
Si el ajuste es bueno, se puede utilizar la distribucin elegida, una vez
encontrada la ley de distribucin que rige a las variables Aleatorias,
adems, se podr predecir con determinada probabilidad, la
ocurrencia de una determinada magnitud, de un fenmeno
hidrometeorolgico. Tambin se podr determinar la magnitud de un
fenmeno para un determinado periodo de retorno

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.1 Introduccin
Las
distribuciones
tericas
comnmente
utilizadas
en
Hidrologa, son entre otras:
Distribucin normal
Distribucin log-normal de 2
3 parmetros
Distribucin gamma de 2 3
parmetros
Distribucin log-Pearson tipo III
Distribucin Gumbel
Distribucin log-Gumbel

46

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Periodo de retorno (T)
Se define el perodo de retorno T, como el intervalo promedio de
tiempo en aos, dentro del cual un evento de magnitud x puede ser
igualado o excedido, por lo menos una vez en promedio. As, si un
evento igual o mayor a x, ocurre una vez en T aos, su probabilidad de
ocurrencia P, es igual 1 en T casos, es decir:
P ( X x) =
T=

1
T

(5.9)

1
P ( X x)

Donde:
P(X>x) = Probabilidad de ocurrencia de un evento >x
T=
Perodo de retorno

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Periodo de retorno (T)
La definicin anterior, permite indicar que la probabilidad de que x no
ocurra en cualquier ao; es decir, la probabilidad de ocurrencia de un
evento < x, se expresa como:
P ( X < x ) = 1* P ( X x )

De donde:
1
T

(5.10)

1
1 P ( X < x)

(5.11)

P ( X < x) = 1
T=

Donde:
T=
Perodo de retorno
P(X x) = Probabilidad de excedencia
P(X < x) = Probabilidad de no excedencia

47

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Periodo de retorno (T)
En la tabla 6.1, se muestran los perodos de retorno recomendados,
para el clculo de caudales de diseo de estructuras menores.

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
1. Funcin densidad
Se dice que una variable aleatoria X, tiene una distribucin normal, si
su funcin densidad, es:
1 x X 2
1
f ( x) =
EXP

2 S
2 S
1 x X


1
2
f ( x) =
e
2 S

Para

(5.12)

(5.13)

< x >

Donde:
f(x) = funcin densidad normal de la variable x
x = variable independiente

48

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
1. Funcin densidad
Donde:
X = parmetro de localizacin, igual a la media aritmtica de x
S = parmetro de escala, igual a la desviacin estndar de x
EXP = funcin exponencial con base e, de los logaritmos
neperianos.
Cuando la variable aleatoria X, se distribuye normalmente con media
= X y varianza ( = S), se denota de la siguiente forma:
X N ( X , S )

El grfico de la funcin densidad de la distribucin normal se muestra


en la figura 6.2, y es como se observa en la figura, una funcin
continua y simtrica con respecto a X .

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
1. Funcin densidad

Si

Z=

x X
S

(5.14)

49

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
1. Funcin densidad
La funcin densidad de Z, se llama funcin densidad de la
distribucin normal estndar y tiene la siguiente expresin:
f (Z ) =

Z 2
1
EXP
2
2

(5.15)

1 Z2
e
2
para < Z <
f (Z ) =

(5.16)

Los valores de f(x) o f(Z), pueden ser fcilmente evaluados para un


valor dado de x o de Z por las ecuaciones (5.13) (5.16),
respectivamente.
El grfico de la funcin densidad de la distribucin normal estndar,
se muestra en la figura 6.3.

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
1. Funcin densidad

Una caracterstica fundamental de la distribucin normal estndar es


que tiene z = 0 y z = 1, es decir:

Z N (0,1)

50

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
2. Funcin de distribucin acumulada (FDA).
La funcin de distribucin acumulada de la distribucin normal, es la
integral de las ecuaciones (5.12) (5.13):
1
f ( x) =
2 S
1
f ( x) =
2 S

1 x X 2
EXP 2 S dx

1 x X

2 S

(5.17)

dx

(5.18)

O su equivalente al integrar las ecuaciones (5.15) o (5.16)


F (Z ) =

1
2

1
f (Z ) =
2

Z 2
EXP
2 dZ
Z

Z2
2

dZ

(5.19)

(5.20)

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
2. Funcin de distribucin acumulada (FDA).
Donde F(x) es la funcin de distribucin acumulada de la distribucin
para la variable original X, segn la ecuacin (5.17), o tambin para la
variable estandarizada Z, segn la ecuacin (5.19), es decir F(X) =
F(Z).
Esta funcin de distribucin, tiene las siguientes propiedades:
F () = 0
F ( X ) = 0.5
F (+) = 1

51

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
3. Clculo de la funcin de distribucin acumulada.
Existen tablas, por ejemplo las tablas A.l y A.2 del apndice, que
permiten calcular F(Z).
Para realizar clculos computacionales de F(Z), se utilizan funciones
de aproximacin, dentro de las cuales se pueden mencionar:
a) Abramowitz y Stegun (1965),
han dado varias aproximaciones para la F.D.A. de la variable normal
estandarizada Z. Una aproximacin polinomial con un error menor
que 10-5 es:
F ( Z ) f ( Z )( 0.4361836t 0.1201676t + 0.9372980t )

(5.21)

donde:
F(Z) = es la funcin de distribucin acumulada
f(Z) = es la funcin densidad de la variable estandarizada
t = es definido para Z > 0, como:

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
3. Clculo de la funcin de distribucin acumulada.
t=

1
1 + 0.33267 Z

(5.22)

b) Masting (1955)
Ha dado una aproximacin polinomial que ha sido utilizado por la
IBM (1968). Esta aproximacin con un error menor que 7.5x10-8, es:
F ( Z ) 1 f ( Z ) ( b1t b2t 2 + b3t 3 + b4t 4 + b5t 5 )

(5.23)

Donde:
t es definido para Z 0, como:
t=

1
1 + 0.2316419 Z

(5.24)

52

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
3. Clculo de la funcin de distribucin acumulada.
Siendo las constantes:
b1 = 0.319381530
b2 = 0.356563782
b3 = 1.781477937
b4 = 1.821255978
b5 = 1.330274429

En las aproximaciones (5.21) y (5.23), si Z< 0, la F.D.A. se calcula


como:

1 F (Z )

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
4. Estimacin de los parmetros.
Para estimar los parmetros de la distribucin terica se pueden usar
el mtodo de momentos el mtodo de mxima verosimilitud:
Cabe mencionar que la distribucin normal, es la nica funcin de
distribucin, que produce los mismos resultados de los parmetros,
estimados por el mtodo de momentos y mxima verosimilitud, los
parmetros obtenidos son los siguientes:
X ==

1
N

x
i =1

(5.25)

Donde:

1 N
S = =
xi X
N 1 i =1

X = Es el estimado de la media, llamado tambin parmetro de posicin


S = Es el estimado insesgado de la desviacin estndar o parmetro de
escala

53

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
5. Aplicaciones en Hidrologa.
La distribucin normal tiene gran utilidad en hidrologa, siendo
algunas de sus principales aplicaciones:
En el ajuste de distribuciones empricas de variables hidrolgicas
de intervalos de tiempo grandes, tales como variables medias
anuales, mensuales, estacionales, etc., que pueden ser caudales,
precipitacin, entre otros.
Anlisis de los errores aleatorios en las observaciones o
mediciones hidrolgicas.
Como referencia para comparar varias distribuciones tericas de
ajuste en una distribucin emprica.
Para hacer procesos de inferencia estadstica.
Para generacin de datos por el mtodo de Monte Carlos. El
inconveniente en la generacin de datos, es que se obtienen
valores negativos, lo cual fsicamente no es justificado.

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
6. Ajuste.
El ajuste puede realizarse grficamente utilizando papel
probabilstico normal analticamente, mediante los estadsticos Chicuadrado Smirnov-Kolmogorov.

54

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Ejemplo 07
Dada la serie histrica de caudales medios anuales, en m/s, que
corresponde a un registro de 50 aos para el ro Santa (Per):.

95.05
105.21
108.75
123.00
132.49
146.08
158.48
177.00
193.78
212.48

98.13
105.81
110.77
123.22
134.10
153.64
162.29
182.53
193.88
217.52

100.18
106.40
114.31
124.31
136.22
153.97
164.35
183.11
197.58
239.07

101.66
107.43
116.69
127.82
144.22
154.80
169.18
183.49
207.78
256.62

101.76
107.62
119.52
128.15
145.79
156.80
169.64
184.98
208.18
266.54

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Ejemplo 07
Calcular:
1. Averiguar si se ajustan a una distribucin normal
2. Si se ajusta a una distribucin normal, calcular:
2.1. P(Q< 180m/s)
2.2. P (Q > 100 m/s)
2.3. P (50 m/s < Q < 200 m/s)
2.4. El perodo de retorno para un caudal de 210 m/s
2.5. El caudal para un perodo de retorno de 50 aos

55

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Solucin 07
1. Ajuste a la distribucin normal:
1.1 Clculo de los parmetros:
Q=
S=

1
N

Q
i =1

= 152.2476 m / s

1 N
Qi Q
N 1 i =1

= 43.6124

1.2. Ajuste
a) Utilizando la aplicacin Cestadis, se tiene:
= max F ( x ) P ( x ) = 0.1019
0 = 0.1923 para = 0.05

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Solucin 07
b) Criterio de decisin:
= 0.1019 < 0 = 0.1923
Como:
Se concluye, que los datos se ajustan a la distribucin normal, con un
nivel de significacin del 0.05, o una probabilidad del 95%.
2. Clculo de probabilidades:
2.1 Clculo de:
P(Q 180) = F(Q = 180)
Clculo de Z, para Q =180:
Z =

Q Q 180 152.2476
=
= 0.6363
S
43.6124

F (Q = 180) = F ( Z = 0.6363) = 0.7377

Valor interpolado

P ( Q 180) = 0.7377 = 73.77%

56

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Solucin 07
2.2 Clculo de P (Q 100 m/s) :
F (Q 100) = 1 P (Q < 100)
F (Q 100) = 1 F (Q = 100)

(5.26)

Clculo de Z para Q = 100


Z =

100 152.2476
= 1.1980 1.20
43.6124

F (Q = 100) = F ( Z = 1.20) = 1 0.8849

(tabla A.2)

Sustituyendo en (5.26), se tiene:


F (Q 100) = 1 (1 0.8849)
P (Q 100) = 0.8849 = 88.49%

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Solucin 07
2.3 P(50 Q 200) = F (200) - F(50):
Si Q = 200
200 152.2476
Z =

Si Q = 50

Z =

43.614

= 1.095

50 152.2476
= 2.345
43.614

F (Q = 200) = F ( Z = 1.095) = 0.8632


F (Q = 50) = F ( Z = 2.345) = 0.0095

Luego

Valor interpolado

F (200) F (50) = 0.8632 0.0095 = 0.8537

P (50 Q 200) = 0.8537

57

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Solucin 07
2.4 Perodo de retorno para un caudal de 210 m/s:
De la ecuacin (5.11), se tiene
T =

Pero:

1
1 P (Q 210)

(5.27)

P ( Q 210 ) = F ( Q = 210 )

Si Q= 210
Z =

210 152.2476
= 1.3242
43.6124

P ( Q = 210 ) = F ( Z = 1.32 ) = 0.9066

Sustituyendo en (5.27), se tiene:


T =

1
= 10.7 aos
1 0.9066

Esto significa que cada 10 aos el caudal 210 m/s ser igualado o
excedido

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.2 Distribucin normal o Gaussiana
Solucin 07
2.5 Caudal para un perodo de retorno de 50 aos
De la ecuacin (5.10), se tiene:
P (Q q ) = 1

Pero

Pero

1
1
= 1
T
50

P ( Q q ) = 0.98 Z = 2.055

Valor interpolado

Q Q
Q = Q + SZ
S
Q = 152.2476 + 43.6124* 2.055
Q = 241.87 m / s
Z=

El Q para un perodo de retorno de 50 aos es 241.87 m/s

58

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.3 Distribucin log normal
Las distribuciones logartmicas ms conocidas en hidrologa son la
log-normal, log-Pearson tipo III y log-Gumbel.
Por ejemplo, si la variable aleatoria X, tiene una distribucin lognormal, esto significa que Y = InX, tiene una distribucin normal.
Anlogamente, si X es una variable aleatoria log-Pearson tipo III, Y =
InX, es una variable aleatoria Pearson tipo III.
Tambin, si la variable aleatoria X, tiene una distribucin log-Gumbel,
Y = InX, es una variable aleatoria Gumbel.
Es posible una generalizacin, en el caso que se introduzca un lmite
inferior x0, en cuyo caso el InX, anteriores, es sustituido por ln(X - x0).
En este captulo, se estudian las distribuciones log-normal. Hay una
distribucin log-normal de 2 parmetros y otra de 3 parmetros, en
la de 3 parmetros, el tercer parmetro es el lmite inferior x0,
denominado parmetro de posicin.

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.3 Distribucin log normal
a.- Distribucin log normal de 2 parmetros.
La variable aleatoria X, es positiva y el lmite inferior x0 no aparece.
La variable aleatoria: Y = InX, es normalmente distribuida con media
y y varianza y
Se usan estos parmetros para especificar que la distribucin es
logartmica, puesto que tambin puede usarse la media y la varianza
de X.
a.1 Funcin Densidad.
Se dice que una variable aleatoria X, tiene una distribucin lognormal de 2 parmetros, si su funcin densidad es:
1 ln ( x ) y


1
2
f ( x) =
e
x 2 y

(5.28)

59

11/02/2014

5.0 ESTADISTICA EN HIDROLOGIA


5.6 Distribuciones tericas
5.6.3 Distribucin log normal
a.- Distribucin log normal de 2 parmetros.
a.1 Funcin Densidad.
para
0< x<

x log N ( y , y2 )

Donde y y varianza y, son la media y desviacin estndar de los


logaritmos naturales de x, es decir de Inx, y representan
respectivamente, el parmetro de escala y el parmetro de forma de
la distribucin.

60

S-ar putea să vă placă și