Sunteți pe pagina 1din 2

Durante el análisis exploratorio de los datos, se encontró que existe evidencia cualitativa de que las dos

series de evaporación tienen una distribución de frecuencias con una forma similar, pero que una estaba
desfasada con respecto a la otra; una evaluación estadística más formal es necesaria para determinar si,
en efecto, dicho desfase es lo suficientemente significativo y por ende podemos confirmar que el
desfase es real, indicándonos así que muy probablemente las series de tiempo difieren.

Como puede verse en la tabla \ref{} existe una diferencia sustancial de media y varianzas entre las
series (0.43 y 0.22 respectivamente), donde tanto la varianza como la media de la primera serie de
evaporaciones (E1) es mayor que la segunda (E2). Se realizarán dos pruebas de significancia, una
paramétrica y una no paramétrica, para evaluar si en efecto las dos medias son diferentes.

Tradicionalmente, se ha considerado seguro afirmar que las diferencias de medias, para datos
atmosféricos, siguen una distribución normal o al menos una distribución t o de Student ((((chapra)))),
en un nivel más estricto sin embargo, ésta suposición solo es cierta si los datos subyacentes a los
estadísticos siguen una distribución normal, o si son lo suficientemente abundantes como para que el
teorema de Límite Central entre en acción; considerando lo anterior y tras una breve inspección de la
figura \ref{} podemos considerar que las distribuciones de frecuencia de E1 y E2 son lo
suficientemente parecidas a una distribución normal como para poder usar de manera segura una
prueba t de Student para la diferencia entre las medias. Los resultados se presentan en el cuadro \ref{},
la hipótesis nula corresponde a afirmar que las medias son idénticas, es decir, un ((((mu sub delta)))) =
0, tomando en consideración el aparente desfase ya mencionado y los resultados presentados en el
cuadro \ref{} que se analizarán más adelante, parece seguro afirmar que es inmensamente poco
probable que la media de E2 sea superior a la media de E1, por lo cual se plantea una hipótesis
alternativa de que la media de E1 sea mayor que la de E2 y se realiza una prueba de una cola. Se realiza
una evaluación de la correlación serial de las series mediante la función equiv_sample_size de
(((NCL))) obteniendo un tamaño de muestra equivalente de 42 (E1) y 47 (E2) datos independientes,
determinando así (con un (((alfa))) = 0.05) que la autocorrelación de lag 1 de ambas series no es nula.
Dada la evidencia en el cuadro \ref{} puede rechazarse de manera contundente la hipótesis nula, con un
((((alfa)))) = 0.001, es decir que la probabilidad de que la media de E1 sea mayor o igual a la media de
E2 tiene una probabilidad del 0.1%, si ésta sigue una distribución de Student.

Aun ante la evidencia presentada, la suposición fundamental de que la diferencia de medias sigue una
distribución de Student se hizo en base a comentarios en la literatura y una inspección cualitativa del
histograma de frecuencias de los datos, es así como se hace conveniente aplicar una prueba no
paramétrica de significancia para la diferencia de medias que permita verificar los resultados de la tabla
\ref{}.

S-ar putea să vă placă și