Documente Academic
Documente Profesional
Documente Cultură
Problema N 01:
Dada la informacin del cuadro N 01 (serie de caudales anuales), realice su anlisis de
consistencia para verificar la confiabilidad de la informacin, efectu lo solicitado en los
siguientes pasos:
a) Complementar el dato faltante para el ao 1955 para la estacin A haciendo la correlacin
de datos para los aos comunes.
b) Graficar la serie histrica para las estaciones A y B, y efectuar un anlisis visual e indicar
si se presenta un salto
c) Para estar seguro de que se presenta salto, con los datos mostrados realizar el anlisis de
doble masa.
d) Realizar el anlisis estadstico de saltos y las correcciones de los datos si fuera el caso,
para perodos obtenidos del anlisis de doble masa.
e) Graficar nuevamente la serie una vez corregida, con lneas punteadas.
Solucin:
Parte a): Completar la informacin del registro de la estacin A (ao 1955) en base a la
informacin correspondiente a la estacin B, emplearemos el mtodo de anlisis de regresin
lineal simple.
Para estar seguros sobre la relacin funcional existente entre los valores a relacionar,
calcularemos el coeficiente de correlacin lineal para medir el grado de asociacin correlativa
existente entre las variables dependientes e independientes. La relacin matemtica a
emplear fue deducida por el mtodo de los mnimos cuadrados y est dada por la siguiente
relacin:
=
( 2 ( )2 )( 2 ( )2 )
= 0,3269
A fin de evitar apreciaciones subjetivas, ya determinado el coeficiente de correlacin lineal,
realizamos la prueba de significacin del estadstico r que mide el grado de asociacin
existente entre las variables aleatorias. Cuantificamos su valor con la prueba de Student (T):
Hiptesis de la prueba:
Hp: = 0 (Coeficiente de correlacin poblacional y su valor vara entre -1 y 1.
Ha: 0.
= 0.05 (Nivel de significacin del 5 %)
Criterio de decisin:
Si | | , se acepta la hiptesis planteada (=0), no existe correlacin significativa.
Si | | > , se rechaza la hiptesis planteada (0), es significativo y por lo tanto existe
correlacin entre las variables.
Como los datos presentan una buena correlacin, estimamos los parmetros de la ecuacin
lineal empleando las ecuaciones deducidas por el mtodo de los mnimos cuadrados
siguientes:
2
= =
2 ( )2 2 ( )2
Parte b): Graficamos los histogramas correspondientes a las estaciones A y B para detectar la presencia
de saltos:
35
Caudal Promedio anual (m3/s)
30
25
20
15
10
0
1945
1950
1935
1940
1955
1960
1965
1970
1975
1980
1985
Tiempo (aos)
Estacin A: Observe que la tendencia creciente en la media a partir del ao de 1965, evidencian la
precia de un posible salto en los datos del registro histrico, sobre todo si consideramos los valores
picos de los aos 1967 y 1972. Dicho en otras palabras, la media tiende a crecer notoriamente
distorsionando la informacin por errores sistemticos y/o aleatorios.
70
Caudal Promedio Anual (m3/s)
60
50
40
30
20
10
1965
1980
1935
1940
1945
1950
1955
1960
1970
1975
1985
Tiempo (aos)
Estacin B: Los datos registrados a partir del ao 1 967 observan una tendencia decreciente en su
parmetro de posicin, sumndose un comportamiento muy curioso entre 1 970 y 1 978.
De la informacin de los histogramas, afirmamos que durante los ltimos aos las tendencias
crecientes y decrecientes evidencian anomalas en el registro de informacin. A fin de tener una mejor
apreciacin realizamos un anlisis de doble masa para identificar la presencia de posibles saltos en la
informacin analizada.
Parte c): Realizamos la grfica de doble masa siguiendo los pasos detallados lneas abajo.
Anlisis de doble masa para determinar la estacin confiable: El grfico N 03, se confecciono con la
informacin del cuadro N 03. Se ubic en el eje de las abscisas los datos de la columna (4) y en el eje
de las ordenadas la informacin de las columnas (5) y (6).
Del anlisis grfico indicamos que la estacin A, presenta dos puntos de quiebre nombrados como 1 y
2, identifican informacin que provendran de dos poblaciones distintas; la estacin B, por su parte,
observa quiebre pequeos con una variacin mucho menor en su rango de anlisis. Llevado a cabo el
anlisis del grfico, concluimos que la estacin B tiene informacin de caudales mucho ms confiable
que la informacin de la estacin A.
Anlisis de doble masa para determinar los periodos de estudio: mostrado en el grfico N 04, su
confeccin se realiza con datos del cuadro N 03, los acumulados de la estacin confiable (B) se ubican
en el eje de las abscisas y en el eje de las ordenadas los valores de la estacin dudosa (A). Este grfico
nos servir para detectar los periodos confiables y dudosos y seguidamente someterlos a la evaluacin
estadstica correspondiente.
Del anlisis grfico, apreciamos tres pendientes definidas: la pendiente menor (S1 de color verde),
identifica seis aos con informacin dudosa y son sealados con flechas de color verde, conforman la
primera muestra 1; la pendiente intermedia (S2 de color ladrillo), contiene la mayor cantidad de
registros y por tanto la tomaremos como periodo confiable denotndola como muestra 2; y las rectas
de pendiente mayor (S3 de color rojo), identificadas con flechas de color rojo forman la muestra 3.
Concluyendo, tenemos un total de treinta y tres (33) datos confiables y nueve (09) datos dudosos,
confirmando la presencia de posibles saltos en la informacin de la estacin A, es recomendable llevar
a cabo un anlisis estadstico de la informacin.
n
ni
S 2 ( x)
1
X i X 2 2
S1 ( x)
1
X i X 1 2 n2 1 i n1
n1 1 i 1
Sp
n1 1S12 n2 1S22 = 5.5178
n1 n2 2
Hallando el valor del Tt, se emplea las tablas de Student y establecemos los parmetros siguientes:
GL = n1+n2-2 = 39 2 = 37
Tt = 1.96
= 0.05 (5 % de nivel de significancia).
Criterio de decisin:
Si | | , se acepta la hiptesis planteada (1 = 2), con un 95% de significancia.
Si | | > , se rechaza la hiptesis planteada aceptndose la hiptesis alterna (1 2).
1 n1
S12 ( x) X i X 1 2 12 () = 33.1240
n1 1 i 1
1 n2
S 22 ( x) X i X 2 22 () = 13.3101
2
n2 1 i n1
Obtenemos el valor del estadstico Fc, considerando que 12 () > 22 (), mediante la siguiente
relacin:
S12 ( x)
Fc = 2.4886
S 22 ( x)
Buscamos el Ft tabular de las tablas de Fisher, las condiciones que parametran su valor estn
dadas por:
GLN = n1-1 = 33 1 = 32
GLD = n2-1 = 6 1 = 5 Ft = 4.50
= 0.05 (5 % de nivel de significancia).
Criterio de decisin:
Si 1 () = 2 () (a nivel estadstico)
Del anlisis estadstico llevado a cabo, indicamos que la media y desviacin estndar provienen de una
misma muestra, es decir que a nivel estadstico son iguales.
Realizados los clculos en este segundo comparativo, los resultados obtenidos son detallados en el
cuadro siguiente:
Tamao, media y desviacin estandar de los periodos anlizados
PARAMETRO PRIMER PERIODO SEGUNDO PERIODO
(Periodo confiable) (Periodo dudoso)
Correccin de informacin:
Como se detect la presencia de salto en la media en la muestra 03, procederemos a corregir la
informacin del perodo dudoso en base a la informacin del perodo confiable. Utilizaremos las
siguientes ecuaciones estandarizadas:
Xt X 1
X (' t ) S 2 ( x) X 2 (I) (Ecuacin para corregir el primer periodo)
S1 ( x)
Xt X 2
X (' t ) S1 ( x) X 1 ..(II) (Formula para modificar el segundo periodo)
S 2 ( x)
donde:
X'(t) = valor corregido de la informacin.
X(t) = valor a ser corregido.
20.459 25.36
X ('1951) 4.98 15.17 X ('1951) 11.728
7.08
22.148 25.36
X ('1963) 4.98 15.17 X ('1963) 12.915
7.08
33.480 25.36
X ('1951) 4.98 15.17 X ('1951) 20.879
7.08
Puntualizamos que los datos que se encuentran sombreados con color verde pertenecen a los datos
tomados para el anlisis de consistencia del primer comparativo, mientras que los datos sombreados
de color celeste corresponden a los datos del segundo comparativo.