Sunteți pe pagina 1din 7

Diseño Mecatrónico

Trabajo en clase
Métodos probabilísticos para validación de
hipótesis

Diego Chuquitarco

30/07/2018
Prueba t de Student

En estadística, una prueba t de Student, prueba t de estudiante, o Test-T es


cualquier prueba en la que el estadístico utilizado tiene una distribución t de
Student si la hipótesis nula es cierta. Se aplica cuando la población estudiada
sigue una distribución normal pero el tamaño muestral es demasiado pequeño
como para que el estadístico en el que está basada la inferencia esté
normalmente distribuido, utilizándose una estimación de la desviación típica en
lugar del valor real. Es utilizado en análisis discriminante.

Prueba t para dos muestras independientes

Esta prueba se utiliza solamente cuando:

 los dos tamaños muestrales (esto es, el número, n, de participantes en


cada grupo) son iguales;
 se puede asumir que las dos distribuciones poseen la misma varianza.

Las violaciones a estos presupuestos se discuten más abajo.

El estadístico t a probar si las medias son diferentes se puede calcular como


sigue:

Donde

es la desviación estándar combinada, 1 = grupo uno, 2 = grupo 2. El denominador


de t es el error estándar de la diferencia entre las dos medias.

Por prueba de significancia, los grados de libertad de esta prueba se obtienen


como 2n − 2 donde n es el número de participantes en cada grupo.

Prueba t dependiente para muestras apareadas

Esta prueba se utiliza cuando las muestras son dependientes; esto es, cuando se
trata de una única muestra que ha sido evaluada dos veces (muestras repetidas) o
cuando las dos muestras han sido emparejadas o apareadas. Este es un ejemplo
de un test de diferencia apareada.

Para esta ecuación, la diferencia D entre todos los pares tiene que ser calculada.
Los pares se han formado ya sea con resultados de una persona antes y después
de la evaluación o entre pares de personas emparejadas en grupos de
significancia (por ejemplo, tomados de la misma familia o grupo de edad: véase la
tabla). La media (XD) y la desviación estándar (sD) de tales diferencias se han
utilizado en la ecuación. La constante μ0 es diferente de cero si se desea probar si
la media de las diferencias es significativamente diferente de μ0. Los grados de
libertad utilizados son n − 1.

Ejemplo 1

Ejemplo de muestras Ejemplo de pares


repetidas emparejados
Número Nombre Test Test Par Nombre Edad Test
1 2 1 Juan 35 250
1 Miguel 35% 67% 1 Joana 36 340
2 Melanie 50% 46% 2 Jaimito 22 460
3 Melisa 90% 86% 2 Jesica 21 200
4 Michell 78% 91%

Ejemplo 2

Sea A1 denotando un grupo obtenido tomando 6 muestras aleatorias a partir de un


grupo mayor:

𝐴1 = {30,02; 29,99; 30,11; 29,97; 30,01; 29,99}

y sea A2 denotando un segundo grupo obtenido de manera similar:

𝐴2 = {29,89; 29,93; 29,72; 29,98; 30,02; 29,98}

Estos podrían ser, por ejemplo, los pesos de tornillos elegidos de un montón.
Vamos a llevar a cabo la prueba de hipótesis contando como hipótesis nula de que
la media de las poblaciones de las cuales hemos tomado las muestras son
iguales.

La diferencia entre las dos medias de muestras, cada uno denotado por 𝑋̅𝑖 , la cual
aparece en el numerador en todos los enfoques de dos muestras discutidas
anteriormente, es

̅̅̅1 − 𝑋
𝑋 ̅̅̅2 = 0.095

La desviaciones estándar muestrales para las dos muestras son aproximadamente


0,05 y 0,11 respectivamente. Para muestras tan pequeñas, una prueba de
igualdad entre las varianzas de las dos poblaciones no es muy poderoso. Pero ya
que los tamaños muestrales son iguales, las dos formas de las dos pruebas t se
pueden desarrollar en forma similar en este ejemplo.

Varianzas desiguales

Si se decide continuar con el enfoque para varianzas desiguales (discutido


anteriormente), los resultados son

El resultado de la prueba estadística es aproximadamente 1,959. El valor p para la


prueba de dos colas da un valor aproximado de 0,091 y el valor p para la prueba
de una cola es aproximadamente 0,045.

Varianzas iguales

Si se sigue el enfoque para varianzas iguales (discutido anteriormente), los


resultados son

𝑔𝑙 = 10

Ya que el tamaño de las muestras es igual (ambas tienen 6 elementos), el


resultado de la prueba estadística es nuevamente un valor que se aproxima a
1.959. Debido a que los grados de libertad son diferentes de la prueba para
varianzas desiguales, los valores P difieren ligeramente de los obtenidos un poco
más arriba. Aquí el valor p para la prueba de dos colas es aproximadamente
0,078, y el valor p para una cola es aproximadamente 0,039. Así, si hubiera una
buena razón para creer que las varianzas poblacionales son iguales, los
resultados serían algo más sugerentes de una diferencia en los pesos medios de
las dos poblaciones de tornillos.

Z-test

Una prueba z es una prueba estadística utilizada para determinar si dos medias de
población son diferentes cuando se conocen las varianzas y el tamaño de la
muestra es grande. Se supone que la estadística de prueba tiene una distribución
normal, y se deben conocer los parámetros molestos, como la desviación
estándar, para que se realice una prueba z exacta.

La prueba z también es una prueba de hipótesis en la que la estadística z sigue


una distribución normal. La prueba z se usa mejor para más de 30 muestras
porque, según el teorema del límite central, a medida que el número de muestras
aumenta, las muestras se consideran distribuidas de manera aproximadamente
normal. Al realizar una prueba z, se deben establecer las hipótesis nula y
alternativa, la puntuación alfa yz. A continuación, se debe calcular la estadística de
la prueba y se deben establecer los resultados y la conclusión.

𝑋̿ − 𝜇𝑜
𝑍𝑒𝑥𝑝 = √𝑛
𝜎
Ejemplo 1

Por ejemplo, suponga que un inversor desea probar si el rendimiento diario


promedio de una acción es mayor al 1%. Se calcula una muestra aleatoria simple
de 50 devoluciones y tiene un promedio de 2%. Supongamos que la desviación
estándar de los retornos es 2.50%. Por lo tanto, la hipótesis nula es cuando el
promedio, o media, es igual a 3%. Por el contrario, la hipótesis alternativa es si la
rentabilidad media es superior al 3%. Suponga que se selecciona un alfa de 0.05%
con una prueba de dos colas. En consecuencia, hay 0.025% de las muestras en
cada cola, y el alfa tiene un valor crítico de 1.96 o -1,96. Si el valor de z es mayor
que 1.96 o menor que -1.96, la hipótesis nula es rechazada.

El valor de z se calcula restando el valor de la devolución diaria promedio


seleccionada para la prueba, o 1% en este caso, del promedio observado de las
muestras. Luego, divida el valor resultante por la desviación estándar dividida por
la raíz cuadrada del número de valores observados. Por lo tanto, la estadística de
prueba se calcula que sea 2.83 o (0.02 - 0.01) / (0.025 / (50) ^ (1/2)). El
inversionista rechaza la hipótesis nula ya que z es mayor que 1.96 y concluye que
el rendimiento diario promedio es mayor al 1%.

Ejemplo 2

Supongamos que en una región geográfica particular, la media y la desviación


estándar de las puntuaciones en una prueba de lectura son 100 puntos y 12
puntos, respectivamente. Nuestro interés está en los puntajes de 55 estudiantes
en una escuela en particular que recibieron un puntaje promedio de 96. Podemos
preguntar si este puntaje promedio es significativamente más bajo que el promedio
regional, es decir, si los estudiantes de esta escuela son comparables a un simple
al azar muestra de 55 estudiantes de la región en general, ¿o sus puntajes son
sorprendentemente bajos?

Primero calcule el error estándar de la media:

donde 𝜎 es la desviación estándar de la población.

Luego calcule el puntaje z, que es la distancia desde la media de la muestra a la


media de la población en unidades del error estándar:

En este ejemplo, tratamos la media y la varianza de la población como conocidas,


lo que sería apropiado si todos los estudiantes de la región fueran evaluados.
Cuando se desconocen los parámetros de la población, se debe realizar una
prueba t en su lugar.

El puntaje promedio del aula es 96, que es -2.47 unidades de error estándar de la
media poblacional de 100. Al buscar el puntaje z en una tabla de la distribución
normal estándar, encontramos que la probabilidad de observar un valor normal
estándar por debajo de -2.47 es aproximadamente 0.5 - 0.4932 = 0.0068. Este es
el valor p unilateral para la hipótesis nula de que los 55 estudiantes son
comparables a una muestra aleatoria simple de la población de todos los
examinados. El valor de p de dos lados es aproximadamente 0.014 (dos veces el
valor de p de una sola cara).
Otra forma de decir las cosas es que con la probabilidad 1 - 0.014 = 0.986, una
muestra aleatoria simple de 55 estudiantes tendría un puntaje de prueba promedio
dentro de las 4 unidades de la media poblacional. También podríamos decir que
con una confianza del 98.6% rechazamos la hipótesis nula de que los 55
examinadores son comparables a una muestra aleatoria simple de la población de
examinados.

La prueba Z nos dice que los 55 estudiantes de interés tienen un puntaje de


prueba promedio inusualmente bajo en comparación con la mayoría de las
muestras aleatorias simples de tamaño similar de la población de examinados.
Una deficiencia de este análisis es que no considera si el tamaño del efecto de 4
puntos es significativo. Si en lugar de un aula, consideramos una subregión que
contiene 900 estudiantes cuya puntuación media es 99, se observaría casi el
mismo puntaje zy el valor p. Esto muestra que si el tamaño de la muestra es lo
suficientemente grande, las diferencias muy pequeñas con respecto al valor nulo
pueden ser estadísticamente significativas.

Bibliografía
fluidos.eia.edu.co. 2010. 30 de 07 de 2019
<http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm>.

investicopedia. www.investopedia.com. 2018. 30 de 07 de 2018


<https://www.investopedia.com/terms/z/z-test.asp>.

Ortega. www4.ujaen.es. 2011. 30 de 07 de 2018


<http://www4.ujaen.es/~arortega/descargar/noparametricasSalumnos.pdf>.

ulpgc. www2.ulpgc.es. 2010. 30 de 07 de 2018


<https://www2.ulpgc.es/hege/almacen/download/5/5015/Complemento_3_P
rueba_de_Bondad_de_Ajuste_de_Kolmogorov_Smirnov.pdf>.

S-ar putea să vă placă și