Analisis Estadistico

ANALISIS ESTADISTICO- ESTACIÓN PLUVIOMETRICA DE LABATECA.
Patricia, Dayana Cordoba,

Departamento de Ingenierías y Arquitectura, Facultad de Ingeniería
Ambiental y Civil, Universidad de Pamplona; Pamplona-Norte de Santander.
Mayo 11 de 2017
1. INTRODUCCIÓN
Para llevar a cabo el análisis estadístico de los datos de precipitaciones máximas

multianuales del año 1956 al 2016 de la estación de Labateca, suministrados
por el IDEAM, fue necesario examinar éstos antes de aplicar cualquiera de los
métodos estadístico, para así completar los datos faltantes a través del método
de media general, Hot Deck y razón de proporciones para una misma estación;
posteriormente se determinó la gráfica de curva masa y el coeficiente
pluviométrico de los datos completos para después aplicar las pruebas no
paramétricas de Chi-cuadrado, Kolmogorov-Smirnov y Arima, para poder
describir la variabilidad y condiciones futuras de las precipitaciones
2. OBJETIVOS
2.1. OBJETIVO GENERAL
 Realizar el análisis estadístico los datos de precipitaciones de la estación
de Labateca suministrados por el IDEAM
2.2. OBJETIVOS ESPECIFICOS
 Solicitar los datos de precipitaciones de la estación de Labateca al
Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM)
 Completar los datos faltantes a través de los métodos de estimación.
 Determinar la variabilidad de las precipitaciones futuras en ésta zona.
 Graficar y analizar las curvas IDF (Intensidad-Duración-Frecuencia).
3. MARCO TEORICO.
ESTACIÓN PLUVIOMETRICA
Es una estación meteorológica dotada de un pluviómetro que permite medir
la cantidad de lluvia caída entre mediciones realizadas consecutivas 1. La
estación pluviométrica de Labateca en el departamento de Norte de
Santander está ubicada a 1560msnm (N 7° 17’ W 72°30')
Media general
Al tener una serie de datos dividida en t grupos, donde:
1
Glosario, IDEAM.
Son el número de elementos de los grupos
Son las medias de los correspondientes grupos.
La media general de la serie de datos se define como:
Hot Deck
Es un método para ajustar conjuntos de datos cuando hay datos faltantes.
Un procedimiento de imputación es definido como un procedimiento que
reemplaza un valor faltante por otro mediante un proceso (exactamente,
como el valor imputado es calculado no es importante a la definición). En
general, el procedimiento Hot Deck es un proceso de duplicación: cuando
un valor es faltante de una muestra, un valor registrado es duplicado para
representar este valor faltante. Así, el término “procedimiento de imputación”
y “procedimiento Hot Deck” no son intercambiables. Por ejemplo, un
procedimiento que imputa el promedio de todos los valores registrados para
cada uno de los valores faltantes es un procedimiento de imputación pero
no es un procedimiento Hot Deck. El adjetivo Hot se refiere a imputar con
valores de la encuesta presente. En cambio el procedimiento “Cold Deck” se
refiere a usar información de otras encuestas anteriores en vez de la
información actual2.
La razón principal para usar el procedimiento Hot Deck es que reduce el
sesgo de no respuesta. Para reducir este sesgo, el procedimiento Hot Deck
por lo general tiene un proceso de clasificación asociada a ella. Todas las
unidades de la muestra están clasificadas en grupos disjuntos así que las
unidades son tan homogéneas como sea posible dentro de cada grupo. Para
cada valor faltante, un valor registrado es imputado el cual está en el mismo
grupo de clasificación. Así la suposición se basa en que dentro de cada
grupo de clasificación las unidades que no responden siguen la misma
distribución como aquellos que responden
Prueba Chi-Cuadrado (x2)

La prueba Chi-Cuadrado fue desarrollada por Karl Pearson (1857-1936) en
1900, y es la prueba de bondad de ajuste más popular aplicada en hidrología
para escoger la distribución o las distribuciones que más se ajustan a
determinada serie de datos de caudales mínimos. Para aplicar la prueba, el
2
http://sisbib.unmsm.edu.pe/bibvirtualdata/monografias/basic/avila_gc/cap3.pdf
primer paso es dividir los datos en un número K de intervalos de clase, de
tal forma que:
Donde K, es el número de intervalos de clase, y n el tamaño de la muestra.
Una vez obtenido el número K, hallamos el rango R de los intervalos
superiores e inferiores para la muestra, así:
La estadística X2 está distribuida asintóticamente como Chi-Cuadrado, con

Km-1 grados de libertad y su ecuación es la siguiente:
Donde Oj es el número observado de eventos en el intervalo de clase j y Ej

es el número esperado de eventos en el mismo intervalo de la distribución
teórica. Si los intervalos de clase son escogidos tales que, cada intervalo
corresponde a una probabilidad igual, entonces Ej = n/k; donde n es el
tamaño de la muestra y k es el número de intervalos de clase. Los intervalos
de clase también pueden ser obtenidos usando el inverso de las funciones
de distribución correspondientes a diferentes valores de probabilidad F,
similar a la estimación de cuartiles de cada distribución; esta estimación se
describe en el siguiente capítulo. Después de aplicar la prueba Chi-
Cuadrado en cada una de las distribuciones, en la tabla de función de
distribución Chi-Cuadrado, se determina el nivel de significación. El valor
más común de α es de 0,05 (5%). Para este nivel de significancia, suelen
aceptarse varias funciones de distribución de probabilidad.
Por otra parte, siempre se debe tener precaución al aplicar la prueba, pues
sus resultados dependen mucho de la selección de los intervalos y del
tamaño de 94 la muestra; y sobre todo si se va a utilizar para descartar
distribuciones y no para compararlas. Por otro lado si algunas estaciones
poseen coeficientes de asimetría negativos o muy grandes los valores de la
prueba suelen dar erróneos.
Kolmogorov Smirnov
La prueba de Kolmogorov-Smirnov para una muestra se considera un
procedimiento de "bondad de ajuste", es decir, permite medir el grado de
concordancia existente entre la distribución de un conjunto de datos y una
distribución teórica específica. Su objetivo es señalar si los datos provienen
de una población que tiene la distribución teórica especificada. Esta prueba
consiste en hallar el máximo valor absoluto de la diferencia D entre la función

de distribución de probabilidad observada Fo (Xm) y la estimada F (Xm).
Luego de obtener el Dmax se multiplica por la raíz cuadrada del tamaño de
la muestra n, para obtener la prueba Kolmogorov-Smirnov (λn) así:
Donde n es el tamaño de la muestra. Los valores críticos de la prueba
Kolmogorov-Smirnov para diferentes niveles de significación se presentan
en tablas.
El valor crítico de (λn) depende del nivel de significación seleccionado. Si el

valor de (λn), es menor que el valor del nivel de significación seleccionado
se acepta la función de distribución evaluada. Esta prueba tiene la ventaja
sobre la Prueba Chi-Cuadrado (X2), que compara los datos con el modelo
estadístico sin necesidad de agruparlos. La función de distribución de
probabilidad observada se calcula de la siguiente manera:
Donde m es el número del orden del dato Xm en una lista de mayor a menor
y n es el número total de datos; la función de distribución de probabilidad
estimada F (Xm), se calcula según las funciones de distribución teóricas que
se utilicen.
Arima
Son modelos paramétricos que tratan de obtener la representación de la
serie en términos de la interrelación temporal de sus elementos. Este tipo de
modelos que caracterizan las series como sumas o diferencias, ponderadas
o no, de variables aleatorias o de las series resultantes, fue propuesto por
Yule y Slutzky en la década de los 20. Fueron la base de los procesos de
medias móviles y autor regresivos que han tenido un desarrollo espectacular
tras la publicación en 1970 del libro de Box-Jenkins sobre modelos ARIMA.
El instrumento fundamental a la hora de analizar las propiedades de una
serie temporal en términos de la interrelación temporal de sus observaciones
es el denominado coeficiente de auto correlación que mide la correlación, es
decir, el grado de asociación lineal que existe entre observaciones
separadas k periodos. Estos coeficientes de auto correlación proporcionan
mucha información sobre como están relacionadas entre sí las distintas
observaciones de una serie temporal, lo que ayudará a construir el modelo
apropiado para los datos.
4. ANALISIS DE DATOS
PONER LAS TABLAS Y LAS GRAFICAS CON
LA TOMA DE DECISIONES QUE SE HIZO EN
CLASE
5. CONCLUSIONES
 A través de los métodos para datos faltantes vistos en clase se consiguió
completar los datos carentes en las tablas de precipitaciones de una
forma confiable y adecuada.
 En el presente informe a través del método de Arima se logró pronosticar
que para el año 2017 la probabilidad de que se presenten precipitaciones
es de un 57,627 %
 Para la selección de funciones de distribución de probabilidad que se
ajustaron más al comportamiento de precipitaciones de la estación de
Labateca, se utilizaron pruebas, que presentan una metodología de
soporte aritmético y proporcionan un criterio más preciso en la selección,
la prueba de bondad de ajuste que obtuvo mejores resultados fue la de
Kolmogorov Smirnov
6. BIBLIOGRAFIA
 IDEAM (Instituto de Hidrología, Meteorología y Estudios Ambientales)
http://www.ideam.gov.co/
 Modelo Arima http://www.estadistica.net/ECONOMETRIA/SERIES-
TEMPORALES/modelo-arima.pdf
 Modelo Kolmogorov Smirnov, Chi Cuadrado
http://repository.unimilitar.edu.co/bitstream/10654/11999/1/ANALISIS%20T
ENDENCIAL%20DE%20LA%20VARIACION%20CLIMATICA.pdf

Analisis Estadistico

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Analisis Estadistico

Încărcat de

Drepturi de autor:

Formate disponibile

ANALISIS ESTADISTICO- ESTACIÓN PLUVIOMETRICA DE LABATECA.

Patricia, Dayana Cordoba,

Para llevar a cabo el análisis estadístico de los datos de precipitaciones máximas

Prueba Chi-Cuadrado (x2)

La estadística X2 está distribuida asintóticamente como Chi-Cuadrado, con

Donde Oj es el número observado de eventos en el intervalo de clase j y Ej

consiste en hallar el máximo valor absoluto de la diferencia D entre la función

El valor crítico de (λn) depende del nivel de significación seleccionado. Si el

S-ar putea să vă placă și