Sunteți pe pagina 1din 27

6.1.

OBJETIVOS

6.3.1. OBJETIVO GENERAL:

Realizar el anlisis estadstico de los datos de los caudales mximos instantneos

anuales de las estaciones de Recreta, Pachacoto y Querococha.

Realizar el anlisis probabilstico para el tiempo de retorno, en base a los caudales

mximos instantneos anuales de las estaciones de Recreta, Pachacoto y

Querococha.

6.3.2. OBJETIVOS SECUNDARIO:

Determinar la funcin que represente mejor a los datos de las estaciones.

Realizar la tabla de frecuencias, histograma, polgono de frecuencias, ojiva, etc.

6.2. JUSTIFICACION
Como futuros ingenieros Agricolas es de mucha importancia el diseo de diversas
estructuras hidrulicas y determinar un modelo probabilstico el cual se ajuste a los
datos obtenidos de las estaciones en estudio, con el estudio estadstico y
probabilstico lograremos predecir la ocurrencia de acuerdo a una magnitud o
fenmeno que ocurre, con la cual podremos calcular los caudales de diseos para

Pg. 1
las diversas estructuras hidrulicas que vayamos a construir, como son el caso, de
represas, diseo de canales ,etc.

6.3. MARCO TEORICO

6.3.1. LA ESTADISTICA APLICADA A LA HIDROLOGIA

6.1.1. CONCEPTO GENERALES


La estadstica se constituye entonces en una herramienta indispensable
para efectuar este tratamiento, a fin de obtener la mxima utilidad en las
aplicaciones prcticas a partir de los registros de diverso tipo de que se
dispone (en especial caudales y precipitaciones).

Son numerosas las definiciones de Estadstica, no correspondiendo aqu


presentar su nmina ni elegir una que resulte idnea. S en cambio,
conviene distinguir dos ramas que han evolucionado en forma separada:

6.1.1.1. Estadstica Descriptiva

Es la que intenta obtener toda la informacin posible de los datos


recogidos, mediante su adecuado ordenamiento. Son resultados de ella
las clasificaciones de datos en forma de tablas, procesamiento y archivo
mediante software, etc.

6.1.1.2. Estadstica Matemtica

Pg. 2
Basndose en comparaciones del fenmeno con modelos probabilsticos
tericos, a fin de obtener una informacin que no resulta evidente con
el simple ordenamiento de los datos. En este campo se ha desarrollado
una teora matemtica, a veces muy compleja, basada en la Teora de
Probabilidades

6.1.2. CONCEPTOS BSICOS DE ESTADSTICA


La estadstica est compuesta por mtodos cientficos mediante los cuales
podemos recolectar, organizar, resumir, presentar y analizar datos relativos
a un conjunto de individuos u observaciones que nos permiten extraer
conclusiones vlidas y efectuar decisiones lgicas basadas en dichos
anlisis.

6.1.1.1. POBLACIN O UNIVERSO:

Es la fuente de observacin o de los datos, por ejemplo el nmero de


datos de la poblacin formada por las descargas mximas anuales de la
estacin de Llanganuco es infinito, porque se considera a las Descargas
mximas Instantneas Anuales desde el Primer Suceso de la Descarga
Mxima instantnea anual en esta estacin de aforo.

6.1.1.2. MUESTRA:

Es el conjunto de Observaciones o datos que se obtienen de una fuente


de la poblacin. El nmero de datos de una muestra.

6.1.3. OBTENCIN DE DATOS.

Pg. 3
ESTACION HIDROLOGICA
Para nuestro trabajo, de estudio de la hidrologa, se obtienen los datos
mustrales, a travs de una estacin hidrologa de Quillcay, Chancos y
Llanganuco.

6.1.4. PRESENTACIN DE DATOS


Terminada la etapa de recoleccin, se cuenta con una masa de datos
individuales, sin agrupacin alguna y carentes en un primer momento de
significacin estadstica.

La etapa siguiente es la clasificacin y agrupacin de los datos recogidos


referentes a cada variable objeto de estudio. La clasificacin comprende
dos operaciones fundamentales.
6.3.2. HERRAMIENTAS DE LA ESTADISTICA

6.1.1. HISTOGRAMA Y POLIGONOS DE FRECUENCIA


Si se tiene una muestra cuyas observaciones se pueden representarse como un
histograma de frecuencias. Todo el rango disponible de la variable aleatoria se
divide en intervalos discretos; se cuenta el nmero de observaciones que cae en
cada intervalo, y el resultado se dibuja en un diagrama de barras como el mostrado
en la Figura 4.1.1, que representa la precipitacin promedio anual en una estacin.

Pg. 4
Ilustracin 1 Histograma de Frecuencias

Un polgono de frecuencias, es un grfico de lnea trazado sobre las marcas de clase.


Puede obtenerse uniendo los puntos medios de los techos de los rectngulos en el
histograma.

6.1.2. RANGO

Es una medida de distancia y representa la diferencia entre el mayor y el menor de


los valores de los datos observados, es decir:

R xmax. xmin.

Donde:

xmax.
: Valor mximo de los datos recolectados.

xmin.
: Valor mnimo de los datos recolectados.
Pg. 5
La amplitud o rango es una manera conveniente de escribir la dispersin, pero, no
da medida alguna de la dispersin entre los datos con respecto al valor central.

6.1.3. MEDIA
Dada la muestra compuesta de n datos: X1, X2, X3,Xn ; la media se define como la
suma algebraica de ellas, dividida entre el nmero de datos. Cuando se calcula la
media para una poblacin, esta se denota por . Y cuando se trata de una muestra

x
por .

x1 x2 ... xn xx
i 1 i

n n

Dnde:

: Media Muestral.
x

Xi: valor i-simo de la muestra.

n: nmero de datos de la muestra o poblacin.

Pg. 6
6.1.4. MEDIANA
Es un nico valor de un conjunto de datos que mide al elemento central de ellos, es
el ms cercano a la mitad. La mitad de los elementos quedan por encima de ese
punto, y la otra mitad por debajo de l.

Es decir: Si X1, X2, X3,Xn son datos ordenados en forma creciente o decreciente.

La mediana es el dato situado en el centro, es decir:

Para n impar.

Med x(n 1/2)

Para n par.

Med (n/2) x(n/ 2 1)

6.1.5. MODA

Es aquel valor que se repite con mayor frecuentemente en un conjunto de datos,


se denota por Mo.

6.1.6. VARIANZA

6.1.1.1. VARIANZA POBLACIONAL (2)

Pg. 7
La varianza poblacional, se define como la suma de cuadrados de las desviaciones

de los datos con respecto a la media, dividida entre el nmero total de datos, es

decir:

2
xi

2 i 1

6.1.1.2. VARIANZA MUESTRAL (s2)

Se obtiene dividiendo la suma de cuadrados de las observaciones de los datos

con respecto a la media, entre el nmero total de datos menos uno, es decir:

2
xi x

S2 i 1

n 1

Pg. 8
6.1.7. COEFICIENTE DE CORRELACION
El coeficiente de correlacin nos permite medir el grado de asociacin de dos

variables linealmente asociadas y varia de 1 < < 1 . Para el caso de una muestra

est dada por:

r xy xy nxy

SxSy nSxSy

Dnde:

6.1.8. COEFICIENTE DE VARIACION


El efecto de dispersin con relacin a la media puede ser medido por la dispersin
relativa. Si la dispersin absoluta corresponde a la desviacin estndar, la
dispersin relativa es denominada coeficiente de variacin v:

Pg. 9
El coeficiente de variacin deja de ser til cuando la media es prxima de cero. Su
frmula est representada por:

Sx
C. V.(x ) = 100%
x

6.1.9. COEFICIENTE DE MOMENTO DE ASIMETRIA O SESGO


Es el grado de desvo o alejamiento del eje de simetra de una distribucin. La
asimetra de una muestra se mide mediante el coeficiente de asimetra.

2 3
=
( 1) ( 2) 3

6.1.10. COEFICIENTE DE CURTOSIS


Para el clculo del coeficiente de curtosis, se emplea el cuarto momento con
respecto a la media.

3 4
=
( 1) ( 2) ( 3) 4

6.1.11. DESVIACION ESTANDAR MUESTRAL


La desviacin estndar, se define como la raz cuadrada de la varianza, es decir:

n
2
xi x
S S2 i 1

n 1

Pg. 10
6.3.3. DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGIA

6.1.1. CONCEPTOS BSICOS

6.1.1.1. Concepto de probabilidad.

La probabilidad de un evento dado es igual al cociente entre el nmero de


sucesos favorables m y el nmero de sucesos totales, n:


( = ) =

La teora de la probabilidad se basa en los siguientes axiomas:

La probabilidad de ocurrencia de un evento, Pi, siempre tiene un valor


entre 0 y 1, y La probabilidad de un evento cierto es 1:

Si X1 y X2 son eventos independientes y mutuamente excluyentes,


entonces:

Los axiomas anteriores permiten la definicin de conceptos


importantes. Por ejemplo, si dos eventos X1 y X2 no son mutuamente

Pg. 11
excluyentes, la probabilidad de que ocurra X1 u ocurra X2 est dada
as:

La probabilidad de que dos eventos independientes ocurran de


manera simultnea es el producto de las probabilidades individuales
as:

La P(X 1 X 2) es llamada la probabilidad de interseccin y se lee


la probabilidad de X1 y X2.

La probabilidad de que ocurra un evento X1 dado que ha ocurrido X2


se llama probabilidad condicional y se denota as:

6.1.2. ANALISIS DE FRECUENCIA

El anlisis de frecuencia es una herramienta utilizada para, predecir el


comportamiento futuro de los caudales en un sitio de inters, a partir de la
informacin histrica de caudales. Es un mtodo basado en procedimientos
estadsticos que permite calcular la magnitud del caudal asociado a un perodo de
retorno. Su confiabilidad depende de la longitud y calidad de la serie histrica.

Pg. 12
Para determinar la magnitud de eventos extremos cuando la distribucin de
probabilidades no es una funcin fcilmente invertibles se requiere conocer la
variacin de la variable respecto a la media. Chow en 1951 propuso determinar
esta variacin a partir de un factor de frecuencia KT que puede ser expresado:

XT KT

Y se puede estimar a partir de los datos:

s
XT x KT

Para una distribucin dada, puede determinarse una relacin entre K y el perodo
de retorno Tr. Esta relacin puede expresarse en trminos matemticos o por
medio del uso de una tabla.

6.1.3. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS

La mayora de las variables hidrolgicas son variables aleatorias continuas.


Enseguida se describen brevemente las distribuciones de probabilidades ms
usadas en anlisis de frecuencia de estas variables.

6.1.1.1. DISTRIBUCION NORMAL

Pg. 13
La distribucin Normal es una distribucin simtrica en forma de campana,
conocida tambin como Campana de Gauss. Es fundamental en el dominio de la
estadstica y la probabilidad. Una razn es que el teorema del lmite central
establece que para varias condiciones muy generales, la distribucin de la suma
de un gran nmero de variables aleatorias puede aproximarse a la Normal, sin
importar a qu distribucin pertenezcan ellas mismas. Muchos procesos fsicos
pueden conceptualizarse como la suma de procesos individuales. Por otra parte,
muchos procesos de inferencia estadstica se basan en suposiciones de que la
variable aleatoria se distribuye normalmente.

Es por ello que la Normal encuentre tantas aplicaciones en hidrologa: en pruebas


de hiptesis, intervalos de confianza, etc.

Una variable aleatoria X se distribuye de acuerdo con una distribucin de


probabilidades Normal si su FDP est dada como:

1 1 2
( )
( ) = 2
2

Los parmetros de la distribucin son dos:

La media:

La desviacin estndar:

2 = 2

Si se hace la siguiente transformacin:

Pg. 14
La funcin densidad acumula de la distribucin normal ser:

Tambin se puede obtener de la siguiente manera:

= 1/2 ((1 + 0.196854|| + 0.115194||2 + 0.000344||3 + 0.019527||4)4)


Teniendo en cuenta que:

() = , para z < 0

() = 1 , para z > 0

Para calcular los valores ajustados a la distribucin normal (x):

= +

Esta distribucin tiene una forma de campana simtrica, como se muestra en


la Figura, por lo tanto la media, la moda y la mediana son iguales.

Ilustracin 2 Distribucin Normal La

distribucin normal se usa para:

Pg. 15
Comparar distribuciones: las propiedades de una muestra de
variables no normales pueden compararse con las de variables
normales.

Aproximar la distribucin de probabilidades de errores aleatorios.

Muchos estadsticos pueden ser normalmente distribuidos, como,


por ejemplo, la media de la mayora de las variables hidrolgicas.

6.1.1.2. DISTRIBUCION EXPONENCIAL

La funcin densidad del modelo probabilstico exponencial est dada por:

Dnde:

= parmetro de la distribucin exponencial

1. Si la variable aleatoria X se distribuye exponencialmente, entonces esta


distribucin se representa por :
X E ()

2. La funcin de distribucin acumulada est dada por la siguiente ecuacin:

3. Mediante los mtodos de estimacin de parmetros se demuestra que:

Pg. 16
La funcin densidad acumula de la distribucin normal ser:

Distribucin Normal

La funcin de densidad de probabilidad normal se define

como:

Donde

f (x) = funcin densidad normal de la

variable x
X = variable independiente
= parmetro de localizacin, igual a la media aritmtica
de x.
S = parmetro de escala, igual a la desviacin
estndar de x.

Distribucin Log Normal 2 Parmetros

La funcin de distribucin de probabilidad es:

Pg. 17
Donde X y S son los parmetros de la distribucin.

Si la variable x de la ecuacin (2) se reemplaza por una


funcin y=f(x), tal que y=log(x), la funcin puede
normalizarse, transformndose en una ley de
probabilidades denominada log normal, N(Y, Sy). Los
valores originales de la variable aleatoria x, deben ser
transformados a y = log x, de tal manera que:

Donde Y es la media de los datos de la muestra

transformada.

Donde Sy es la desviacin estndar de los datos de la


muestra transformada.

Asimismo; se tiene las siguientes relaciones:

Pg. 18
Donde Cs es el coeficiente de oblicuidad de los datos de la muestra
transformada. (Monsalve, 1999).

Distribucin Log Normal 3 Parmetros


La funcin de densidad
de x es:

Para x
> x0

Donde:

X0: parmetro de posicin

Uy: parmetro de escala o media

Sy: parmetro de forma o varianza

3.7.1.4 Distribucin Gamma 2 Parmetros


La funcin de densidad es:

Vlido para:

0x<
Pg. 19
0<<

0<<

Donde:

: parmetro de forma

: parmetro de escala

3.7.1.5 Distribucin Gamma 3 Parmetros


La funcin de densidad es:

Vlido para: x0 x <

- < x0 <

0<<

0<<

Donde:

x0: origen de la variable x, parmetro


de posicin

: parmetro de forma

: parmetro de escala

Pg. 20
3.7.1.6 Distribucin Log Pearson Tipo III

La funcin de densidad es:

Vlido para: x0 x <

- < x0 <

0<<

0<<

Donde:

x0: parmetro
de posicin

: parmetro
de forma

: parmetro de escala

3.7.1.7 Distribucin Gumbel

La distribucin de Valores Tipo I conocida como


Distribucin Gumbel o Doble Exponencial, tiene como
funcin de distribucin de probabilidades la siguiente
expresin:

Pg. 21
Utilizando el mtodo de momentos, se obtienen las
siguientes relaciones:

Donde:

: Parmetro de concentracin.

: Parmetro de localizacin.

Segn Ven Te Chow, la distribucin puede expresarse de


la siguiente forma:

Donde:
x: Valor con una probabilidad dada.
x: Media de la serie.

k: Factor de frecuencia.
Pg. 22
3.7.1.8 Distribucin Log Gumbel

La variable aleatoria reducida log Gumbel, se define

como:

Con lo cual, la funcin acumulada reducida log Gumbel es:

3.7.2 Pruebas de bondad de ajuste

Las pruebas de bondad de ajuste son pruebas de hiptesis


que se usan para evaluar si un conjunto de datos es una
muestra independiente de la distribucin elegida.

En la teora estadstica, las pruebas de bondad de ajuste

ms conocidas son la 2 y la Kolmogorov Smirnov, las

cuales se describen a continuacin.

a) Prueba 2

Esta prueba fue propuesta por Karl Pearson en 1900, se


aplica para verificar bondad de las distribuciones
normales y log normales.

Pg. 23
Para aplicar la prueba, el primer paso es dividir los datos
en un nmero k de intervalos de clase. Luego se calcula el
parmetro estadstico:

Donde:

i es el nmero observado de eventos en el intervalo i y i


es el nmero esperado de eventos en el mismo intervalo.

i se calcula como:

i = n[F(Si ) F(Ii )] i = 1,2,...,k

Asimismo; F(Si ) es la funcin de distribucin de

probabilidad en el lmite superior del intervalo i, F(Ii ) es

la misma funcin en el lmite inferior y n es el nmero de

eventos.

Una vez calculado el parmetro D para cada funcin de


distribucin considerada, se determina el valor de una
variable aleatoria con distribucin 2 para = k-1-m
grados de libertad y un nivel de significancia , donde m

Pg. 24
es el nmero de parmetros estimados a partir de los
datos.

Para aceptar una funcin de distribucin dada, se debe

cumplir:

D X 21,k1m
2
El valor de 1 ,k1m se obtiene de tablas de la funcin

de distribucin 2.

Cabe recalcar que la prueba del X2, desde un punto de


vista matemtico solo debera usarse para comprobar la
normalidad de las funciones normal y Log normal.

b) Prueba Kolmogorov Smirnov

Mtodo por el cual se comprueba la bondad de ajuste de


las distribuciones, asimismo permite elegir la ms
representativa, es decir la de mejor ajuste.

Esta prueba consiste en comparar el mximo valor


absoluto de la diferencia D entre la funcin de
distribucin de probabilidad observada Fo (xm) y la
estimada F (xm):

D = mx / Fo(xm) F(xm)/

Pg. 25
Con un valor crtico d que depende del nmero de datos y
el nivel de significancia seleccionado (Tabla N 03). Si
D<d, se acepta la hiptesis nula. Esta prueba tiene la
ventaja sobre la prueba de X2 de que compara los datos
con el modelo estadstico sin necesidad de agruparlos. La
funcin de distribucin de probabilidad observada se
calcula como:

Fo(xm) = 1- m / (n+1) (13)

Donde m es el nmero de orden de dato xm en una lista


de mayor a menor y n es el nmero total de datos.
(Aparicio, 1996)

TABLA N 03: Valores crticos d para la prueba Kolmogorov Smirnov

TAMAO DE LA
MUESTRA = 0.10 = 0.05 = 0.01

5 0.51 0.56 0.67


10 0.37 0.41 0.49
15 0.30 0.34 0.40
20 0.26 0.29 0.35
25 0.24 0.26 0.32
30 0.22 0.24 0.29
35 0.20 0.22 0.27
40 0.19 0.21 0.25
Fuente: Aparicio, 1999.

6.3.4. PERIODO DE RETORNO

Pg. 26
El periodo de retorno es el nmero de aos en que en promedio se presenta una variable
hidrolgica extrema (evento extremo) superior o igual a cierto valor. El periodo de retorno
se denomina tambin tiempo de retorno, intervalo de ocurrencia. Y se expresa de la
siguiente manera:

1
=
( )

As mismo se puede relacionar el Periodo de retorno con la funcin de distribucin


acumulada F(x), de la siguiente manera:

Pg. 27

S-ar putea să vă placă și