Documente Academic
Documente Profesional
Documente Cultură
ANALIIS DE REGRESION Y CORRELACION Frecuentemente es necesario investigar posibles relaciones (de causalidad o de interdependenca) entre dos o ms variables, tal relacin, en caso de existir deber ser estudiada a travs de los anlisis estadsticos de regresin y correlacin Estos anlisis constituyen una de las herramientas estadsticas ms antiguas usadas en hidrologa. Primeramente fueron utilizadas para estimar datos faltantes y ampliar el registro de corta extensin, de una cierta estacin climatolgica o hidromtrica, en base a la informacin disponible en las estaciones cercanas. Hoy en da, sus aplicaciones incluyen adems, el estudio de las relaciones entre dos o ms variables hidrolgicas y la investigacin de la dependencia entre los eventos sucesivos de una serie cronolgica de datos hidrolgicos.
La diferencia entre regresin y correlacin es bastante clara. La regresin permite obtener la ecuacin matemtica que expresa la variable dependiente (y), cuando otra u otras variables, llamadas independientes (x), se suponen conocidas y por lo tanto, permite calcular valores de 'y' a partir de los de 'x'. En cambio, por medio de la correlacin, se calcula el grado de dependencia o asociacin entre dos o ms variables, representado numricamente por el llamado Coeficiente de Correlacin. Una grfica en la que se indican los valores muestrales dibujados sobre un plano xy, se denomina: Diagrama de Dispersin. En base a tal diagrama se podr detectar si los valores siguen un modelo LINEAL o no NO LINEAL, es decir., si los puntos se aproximan a una lnea recta o a una curva, como se ilustra en la figura siguiente.
La ecuacin matemtica (regresin) de la relacin o modelo lineal entre dos series de valores, se representa por medio de un polinomio de grado uno, en cambio, una relacin no lineal se reproduce matemticamente mediante un polinomio de grado superior.
y = a0 + a1 x y = a0 + a1 x1 + + an xn
El diagrama de dispersin, adems de ayudar a definir el modelo a utilizar (lineal o no lineal), permite detectar los valores (parejas de datos) que se apartan de la NUBE DE PUNTOS y que al ser eliminados del anlisis de regresin, mejoran el ajuste de la recta o curva, de manera que se eleva la correlacin entre las dos variables. El nmero de puntos que se considera permisible eliminar, depende de muchos factores como son: forma de la nube de puntos, nmero de puntos o parejas, naturaleza de los datos, etc.; sin embargo, se puede aceptar en una primera aproximacin que el 10% del nmero total de puntos se pueden eliminar para mejorar el ajuste.
Para evitar el juicio o criterio particular en el ajuste de un modelo de regresin a unos datos, es necesario obtener una definicin rgida de la recta o curva de mejor ajuste. Esto se logra a travs de la tcnica de los Mnimos Cuadrados, la cual indica que de todas las rectas o curvas que representan a una nube de puntos, la que tiene una suma mnima de los cuadrados de las distancias de cada punto a tal recta o curva, es la del mejor ajuste.
Al obtener la ecuacin de la recta de regresin por la tcnica de los mnimos cuadrados, se presentan tres casos, segn como se mida la distancia de cada punto a la recta.
Perpendicular a la recta, se llama ortogonal. Paralelamente al eje de las ordenadas, se llama de y sobre x. Paralelamente a! eje de las abscisas, se llama de x sobre y.
RECTA DE REGRESIN DE y SOBRE x. Dado un conjunto de parejas de valores correspondientes a dos variables x e y, la ecuacin general de la recta que las relaciona sera: y=mx+b
Cuando las distancias de cada punto a la recta de regresin, se miden paralelamente al eje de las ordenadas, la pendiente m de la ecuacin anterior se evala con la formula siguiente:
Donde:
CORRELACION Y COEFICIENTE DE CORRELACION LINEAL Se llama correlacin PERFECTA de dos variables x e y, cuando todos los puntos que representan las parejas de datos caen sobre la recta de regresin.
Si por el contrario, los puntos no estn alineados sino dispersos, la correlacin es NULA. Por otra parte, si la variable y aumenta a medida que x aumenta, x e y presentan correlacin POSITIVA o DIRECTA. Si y disminuye a medida que x aumenta, x e y tienen correlacin NEGATIVA o INVERSA. Los tipos de correlacin se ilustran en la figura siguiente.
COEFICIENTE DE CORRELACION LINEAL El coeficiente de correlacin lineal (rxy) es una medida numrica de la correlacin entre dos variables, el cual se calcula con la frmula siguiente:
El coeficiente de correlacin puede fluctuar de -1 a +1 para la correlacin perfecta, segn sea inversa o directa y adopta un valor de cero para la correlacin nula.
Tomando en cuenta que el valor del coeficiente de correlacin rxy se calcula en base a una muestra relativamente pequea, tal coeficiente es nicamente una estimacin del valor verdadero o poblacional xy y por lo tanto, habr necesidad de investigar si existe la posibilidad de que xy=0, aunque rxy=0.
y se compara con el valor Zc que tiene distribucin normal para un cierto nivel de confianza, comnmente el 95%, por lo cual, Zc = 1.645. Si Z>Zc , no hay posibilidad de que xy sea igual a cero y por lo tanto, rxy es significativo al 5% de nivel de significancia.
Otro criterio para probar el coeficiente de correlacin rxy calculado, consiste en determinar en la tabla siguiente con = n-2 grados de libertad el valor r0 y compararlo con el calculado. Si el valor calculado rxy es mayor que r0, entonces es significativo, no existiendo la posibilidad de que xy sea igual a cero.
INCREMENTO DE LA INFORMACION HIDROLOGICA POR REGRESION Aun cuando la correlacin entre los registros x e y sea alta, conviene investigar hasta que punto es provechoso utilizar el registro amplio para incrementar otro, ya que puede suceder que los valores inferidos discrepen mucho de la realidad El clculo de la llamada Eficiencia Estadstica (E) permite concluir si mejora el valor medio del registro y, y con esto, si conviene hacer la inferencia. Si el valor de E resulta mayor que uno, no mejorar en nada el registro de las y; en cambio, si E es menor que la unidad, convendr hacer la inferencia de los valores faltantes a partir de las x;. La eficiencia estadstica E se calcula con la expresin siguiente:
k = numero de datos del registro y. n = numero de datos del registro x. rxy = coeficiente de correlacin de las k parejas de datos comunes de y e y.
SELECCIN DEL PERIODO DE RETORNO. Consiste en adoptar un perodo de retorno dependiendo del tipo de obra o de la zona que se protege. El riesgo de falla de dicha estructura es revisado para los valores especficos de su vida til, cuya seleccin depende de factores sociales y econmicos.
Perodo de Tipo de estructura Retorno en aos Drenaje de carreteras en las que circulan: 0 a 400 vehculos por da 10 400 a 1700 vehculos por da 10 a 25 1700 a 5000 vehculos por da 25 ms de 5000 vehculos por da 50 Drenajes de aeropuertos 5 Drenajes pluviales 2 a 10 Diques 2 a 50 Zanjas de Drenaje 5 a 50
Fuente: W.Viessman, Knapp, Lewis, Harbough, 1977
Ing. Mg.Sc.Ricardo Apaclla Nalvarte 17
Tipo de rea que ser protegida Zonas urbanas, redes de transporte, plantas industriales Regiones agrcola-industrial Zonas agrcolas Areas forestales y planicies de inundacin
Fuente: Mosonyi y Buck, 1977
Tipo de embalse
Grandes embalses cuya falla causara prdidas de vidas humanas 1. Cortinas de tierra 2. Cortinas de concreto o mampostera Embalses que al fallar no causarian prdidas de vidas humanas. 1. Embalses costosos 2. Embalses moderadamente costosos 3. Embalses pequeos Ing. Mg.Sc.Ricardo Apaclla Nalvarte
Fuente: Schnackenberg, 1949
1000 500
500 100 20 18
El Manual de Hidrologa, Hidrulica y Drenaje de Carreteras recomienda utilizar como valores mximos de riesgo admisible los siguientes valores para diferentes vidas tiles.
19
De acuerdo a la tabla 02, para cumplir con los riesgos de falla y vida til propuestos se obtienen los siguientes valores de periodos de retorno:
Tipo de Obra Puentes y pontones Alcantarilla de paso, badn Alcantarilla de alivio Cuneta Defensa Riberea Subdrenes
20
Los valores buscados se deducen a partir de una ecuacin de regresin lineal entre las magnitudes de los eventos de la serie utilizada y los logaritmos decimales de sus correspondientes perodos de retorno.
PTr A B log Tr
Donde: PTr= Lluvia mxima diaria de perodo de retorno Tr (mm) A,B= parmetros de ajuste de la regresin lineal. Tr= periodo de retorno de la serie anual o de la serie de duracin parcial.
28
L.L.Weiss, sobre la base de un estudio de miles de estaciones ao de datos de lluvia, encontr que:
Los resultados de una anlisis probabilstico llevado a cabo con lluvias mximas anuales tomadas en un nico y fijo intervalo de observacin, para cualquier duracin comprendida entre 1 y 24 horas, al ser incrementado en un 13% conducan a magnitudes ms aproximadas a las obtenidas en el anlisis basado en lluvias mximas verdaderas.
De acuerdo a lo anterior, el valor representativo adoptado para la cuenca deber ser multiplicado por 1.13 para ajustarlo por intervalo fijo y nico de observacin, pues los registros de lluvias mximas diarias, se toman de 8. am de un da a 8 am del da siguiente.
Con tal correccin la lluvia representativa se convierte en la lluvia mxima en 24 horas de determinado perodo de retorno.
Conviene aclarar que los llamados registros de lluvias mximas en 24 horas, que proporciona el SENAMHI tienen una significacin errnea, pues en realidad son registros de lluvias mximas diarias, ya que tales tormentas no tienen una duracin real de 24 horas, sino que nicamente fueron observadas con intervalos de 24 horas
Se considera que los valores puntuales obtenidos con la estacin pluviomtrica son representativos de solo 25 km2 y al tener que abarcar un rea de cuenca mayor deben ser reducidos. Se debe corregir el valor estimado de lluvia mxima en 24 horas y adecuarlo a la magnitud de cuenca en estudio.
32
33
34
35