Documente Academic
Documente Profesional
Documente Cultură
MAYOLO”
MAESTRÌA EN CIENCIAS E INGENIERÌA
MENCIÓN INGENIERÍA DE RECURSOS HIDRÍCOS
EXÀMEN FINAL
P010
NOMBRE
SOTELO SOLÒRZANO IVONNE MARLENY
CURSO
HIDROLOGÍA AMBIENTAL
HUARAZ – PERÚ
2018
CORRELACIÓN Y REGRESIÓN LINEAL
En este tema se presentan el coeficiente de correlación y la regresión lineal simple como las dos técnicas
estadísticas más utilizadas para investigar la relación entre dos variables continuas X e Y. Gráficamente el
diagrama de dispersión o nube de puntos permite obtener información sobre el tipo de relación existente
entre X e Y, además de ayudarnos a detectar posibles valores atípicos o extremos.
Las técnicas de correlación y las de regresión están estrechamente relacionadas, aunque obedecen a
estrategias de análisis un tanto diferentes. Por un lado, el coeficiente de correlación determina el grado
de asociación lineal entre X e Y, sin establecer a priori ninguna direccionalidad en la relación entre ambas
variables. Por el contrario, la regresión lineal simple permite cuantificar el cambio en el nivel medio de la
variable Y conforme cambia la variable X, asumiendo implícitamente que X es la variable explicativa o
independiente e Y es la variable respuesta o dependiente.
1. CORRELACIÓN
La finalidad de la correlación es examinar la dirección y la fuerza de la asociación entre dos variables
cuantitativas. Así conoceremos la intensidad de la relación entre ellas y si, al aumentar el valor de una
variable, aumenta o disminuye el valor de la otra variable. Para valorar la asociación entre dos variables,
la primera aproximación suele hacerse mediante un diagrama de dispersión.
Con la nube de puntos podemos apreciar si existe o no una tendencia entre las dos variables, pero si
queremos cuantificar esta asociación debemos calcular un coeficiente de correlación.
En la figura 1 vemos que r = ±1 es lo mismo que decir que las observaciones de ambas variables están
perfectamente alineadas. El signo de r, es el mismo que el de SXY, por tanto nos indica el crecimiento o
decrecimiento de la recta. La relación lineal es tanto más perfecta cuanto r está cercano a ±1. En la
correlación no se distingue la variable dependiente de la independiente, la correlación de X con respecto
a Y es la misma que la correlación de Y con respecto a X. Aunque la interpretación de la magnitud del
coeficiente de correlación depende del contexto particular de aplicación, en términos generales se
considera que una correlación es baja por debajo de 0,30 en valor absoluto, que existe una asociación
moderada entre 0,30 y 0,70, y alta por encima de 0,70.
Ejercicio de Aplicación
1. Se trabajarà con datos de estaciones reales cercanas: Estaciòn Quirucancha (datos incompletos) y
estaciòn Huancapeti (datos completos), ubicados en la cuenca del rìo Santa. Se realizarà el análisis
de la correlación y regresión lineal simple para completar datos de precipitación de la estación de
Quirucancha en base a la estaciòn Huancapeti.
Para esto se cuenta con datos de precipitación para el mismo periodo (1980 – 1999), tal como se
muestra en la tabla 1.
1980 108.3 67
1981 69.3 116.6
1982 24.3 40.3
1983 22.5 20.7
1984 90.9 94.2
1985 2.6 2.2
1986 35.5 48.6
1987 88.8 57.5
1988 81.2 58.6
1989 32.6 51.5
1990 30.8 50.9
1991 0.54 4.06
1992 34.4 63.9
1993 33.2 36.7
1994 93.24 98.24
1995 124.4 118.5
1996 139.3
1997 7.3
1998 135.07
1999 122.04
Sin dato
Fuente: Duke Energy-Edelnor S.A
Procedimiento:
a. Determinamos la ecuación que mejor relaciona nuestras variables. Como se muestra en el gráfico, es
la recta. Por tanto podemos afirmar que existe una correlación lineal.
b. Vemos que existen datos que están demasiado dispersos. Quitaremos estos para mejorar la relación
entre nuestros datos de precipitación.
La ecuación queda así: y = 0.8046x + 12.769, con un coeficiente de determinación R² = 0.82, y un
coeficiente de correlación de r= 0.9.
Recordemos que:
Si la relación es lineal perfecta, r será 1 ó -1. En nuestro caso es 0.9, lo que significa que existe una
buena correlación entre nuestros datos de precipitación, lo que significa que la ecuación nos ayudará
a obtener valores más cercanos a los reales para la estación de Quirucancha.
c. Con la ecuación obtenida se estimaron los valores de precipitación para la estación Quirucancha en
los años que no existen (1995- 1999).
REFERENCIAS BIBLIOGRÁFICAS
Tarazona, N.E. (2005). Generación de descargas mensuales en subcuencas de la cuenca del río Santa,
utilizando el método de Lutz Scholz. Tesis para optar el título de ingeniero agrícola, UNALM, Lima, Perú.
Miranda, F., y Salinas, J. (2012. Estadística General. Lima, Perú: Universidad Agraria La Molina.