Sunteți pe pagina 1din 4

TEORIA DE PEQUEÑAS MUESTRAS O TEORIA EXACTA DEL MUESTREO

En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la


distribución de donde proviene la muestra tenga un comportamiento normal.
Esta es una condición para utilizar las tres distribuciones que se manejarán en
esta unidad; t de student, X2 ji-cuadrada y Fisher.

A la teoría de pequeñas muestras también se le llama teoría exacta del


muestreo, ya que también la podemos utilizar con muestras aleatorias de
tamaño grande.

En esta unidad se verá un nuevo concepto necesario para poder utilizar a las
tres distribuciones mencionadas. Este concepto es "grados de libertad".

Para definir grados de libertad se hará referencia a la varianza muestral:

Esta fórmula está basada en n-1 grados de libertad (degrees of freedom).


Esta terminología resulta del hecho de que si bien s 2 está basada en n
cantidades ..., éstas suman cero, así que especificar los
valores de cualquier n-1 de las cantidades determina el valor restante. Por
ejemplo, si n = 4 y

; y , entonces automáticamente tenemos


, así que sólo tres de los cuatro valores de están libremente
determinamos 3 grados de libertad.

Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su


simbología
 Propiedades de las distribuciones t

1. Cada curva t tiene forma de campana con centro en 0.


2. Cada curva t, está más dispersa que la curva normal estándar z.

3. A medida que aumenta, la dispersión de la curva t correspondiente


disminuye.

4. A medida que , la secuencia de curvas t se aproxima a la curva


normal estándar, por lo que la curva z recibe a veces el nombre de curva
t con gl =

La distribución de la variable aleatoria t está dada por:

Esta se conoce como la distribución t con grados de libertad.

Sean X1, X2,. . ., Xn variables aleatorias independientes que son todas normales

con media y desviación estándar . Entonces la variable aleatoria


tiene una distribución t con = n-1 grados de libertad.

La distribución de probabilidad de t se publicó por primera vez en 1908 en un


artículo de W. S. Gosset. En esa época, Gosset era empleado de una
cervecería irlandesa que desaprobaba la publicación de investigaciones de sus
empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el
nombre de "Student". En consecuencia, la distribución t normalmente se llama
distribución t de Student, o simplemente distribución t. Para derivar la ecuación
de esta distribución, Gosset supone que las muestras se seleccionan de una
población normal. Aunque esto parecería una suposición muy restrictiva, se
puede mostrar que las poblaciones no normales que poseen distribuciones en
forma casi de campana aún proporcionan valores de t que se aproximan muy
de cerca a la distribución t.

La distribución t difiere de la de Z en que la varianza de t depende del tamaño


de la muestra y siempre es mayor a uno. Únicamente cuando el tamaño de la
muestra tiende a infinito las dos distribuciones serán las mismas.

Se acostumbra representar con el valor t por arriba del cual se encuentra


un área igual a . Como la distribución t es simétrica alrededor de una media

de cero, tenemos ; es decir, el valor t que deja un área de


a la derecha y por tanto un área de a la izquierda, es igual al valor t
negativo que deja un área de en la cola derecha de la distribución. Esto es,
t0.95 = -t0.05, t0.99=-t0.01, etc.

Para encontrar los valores de t se utilizará la tabla de valores críticos de la


distribución t del libro Probabilidad y Estadística para Ingenieros de los autores
Walpole, Myers y Myers.

Ejemplo:

El valor t con = 14 grados de libertad que deja un área de 0.025 a la


izquierda, y por tanto un área de 0.975 a la derecha, es

t0.975=-t0.025 = -2.145

Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es


por esto que se tiene que hacer la resta de . La manera de encontrar el
valor de t es buscar el valor de en el primer renglón de la tabla y luego
buscar los grados de libertad en la primer columna y donde se intercepten y
se obtendrá el valor de t.

Ejemplo:

Encuentre la probabilidad de –t0.025 < t < t0.05.

Solución:

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la
izquierda, encontramos un área total de 1-0.05-0.025 = 0.925.

P (–t0.025 < t < t0.05) = 0.925


TEST DE CHI-CUADRADO

Ante una tabla de contingencia como la anterior pueden planteársenos distintas


cuestiones. En primer lugar, se querrá determinar si existe una relación
estadísticamente significativa entre las variables estudiadas. En segundo lugar,
nos interesará cuantificar dicha relación y estudiar su relevancia clínica.
Esta última cuestión podrá resolverse mediante las denominadas medidas de
asociación o de efecto (riesgo relativo (RR), odds ratio (OR), reducción
absoluta del riesgo (RAR)), que ya han sido abordadas en otros trabajos3,4.
Por otro lado, para responder a la primera pregunta, la metodología de análisis
de las tablas de contingencia dependerá de varios aspectos como son: el
número de categorías de las variables a comparar, del hecho de que las
categorías estén ordenadas o no, del número de grupos independientes de
sujetos que se estén considerando o de la pregunta a la que se desea
responder 5.
Existen diferentes procedimientos estadísticos para el análisis de las tablas de
contingencia como la prueba χ 2, la prueba exacta de fisher, la prueba de
McNemar o la prueba Q de Cochran, entre otras.
En este artículo se expondrá el cálculo e interpretación de la prueba
χ 2 como método estándar de análisis en el caso de grupos
independientes1,2,5,6.
La prueba χ 2 en el contraste de independencia de variables aleatorias
cualitativas.
La prueba χ 2 permite determinar si dos variables cualitativas están o no
asociadas. Si al final del estudio concluimos que las variables no están
relacionadas podremos decir con un determinado nivel de confianza,
previamente fijado, que ambas son independientes.
Para su cómputo es necesario calcular las frecuencias esperadas (aquellas que
deberían haberse observado si la hipótesis de independencia fuese cierta), y
compararlas con las frecuencias observadas en la realidad. De modo general,
para una tabla r x k (r filas y k columnas), se calcula el valor del estadístico χ 2
como sigue:

S-ar putea să vă placă și