Sunteți pe pagina 1din 5

Distribución T-Student

En probabilidad y estadística, la distribución t (de Student) es una distribución


de probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño. Surge,
en la mayoría de los estudios estadísticos prácticos, cuando la desviación típica
de una población se desconoce y debe ser estimada a partir de los datos de
una muestra.
Existen dos versiones de la prueba t-Student: una que supone que las
varianzas poblacionales son iguales y otra versión que no asume esto último.
Para decidir si se puede suponer o no la igualdad de varianza en las dos
poblaciones, se debe realizar previamente la prueba F-Snedecor de
comparación de dos varianzas.
Un poco de historia.
La prueba t-Student fue desarrollada en 1899 por el químico inglés William
Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control de
calidad para las destilerías Guiness en Dublín . Debido a que en la destilería,
su puesto de trabajo no era inicialmente de estadístico y su dedicación debía
estar exclusivamente encaminada a mejorar los costes de producción, publicó
sus hallazgos anónimamente firmando sus artículos con el nombre de
"Student".
La distribución t de Student es la distribución de probabilidad del cociente:

donde
Z tiene una distribución normal de media nula y varianza 1
V tiene una distribución chi-cuadrado con ν grados de libertad
Z y V son independientes

Si μ es una constante no nula, el cociente es una variable aleatoria


que sigue la distribución t de Student no central con parámetro de
no-centralidad μ.

Intervalos de confianza derivados de la distribución t de


Student
El procedimiento para el cálculo del intervalo de confianza basado en
la t de Student consiste en estimar la desviación típica de los datos S
y calcular el error estándar de la media= S/(raíz cuadrada de n),
siendo entonces el intervalo de confianza para la media = x media +-
t (alfa/2) multiplicado por (S/(raíz cuadradada de n)).
Es este resultado el que se utiliza en el test de Student: puesto que la
diferencia de las medias de muestras de dos distribuciones normales
se distribuye también normalmente, la distribución t puede usarse
para examinar si esa diferencia puede razonablemente suponerse
igual a cero.
para efectos prácticos el valor esperado y la varianza son :
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para > 3.

 Las distribuciones “t” de Student, Chi cuadrado


( 2) y F, se derivan de la
distribución Normal y están relacionadas con la teoría del muestreo
pequeño n< 30.

 Son muy importantes pues son la base de metodologías


inferenciales, tales como Intervalos de Confianza y Pruebas de
Hipótesis.

 Las variables “t”, 2 y F surgen de


transformaciones de variables aleatorias en las que están
involucrados estadísticos muestrales, tales como la media y la
variancia. En la práctica, por lo tanto, no podemos decir por Ej.
que el peso, la altura, etc., se distribuyen según t”,
2yF

DISTRIBUCIÓN DE STUDENT O DISTRIBUCIÓN “t”

En muchos casos se seleccionan de una población normal, muestras de


tamaño pequeño n < 30 y x desconocido

El estadístico “t” será

DEFINICIÓN

Una variable con distribución t de Student se define como el cociente entre una
variable normal estandarizada y la raíz cuadrada positiva de una variable 2
dividida por sus grados de libertad.

CARACTERISTICAS

 La distribución se denomina distribución de Student o distribución “t”.

 Es simétrica, con media de 0, y variancia mayor que 1.

 Es más achatada que la normal y adopta diferentes formas, según el


número de grados de libertad.

 La variable t se extiende desde -a +.

 A medida que aumenta los (n -1) grados de libertad la distribución “t” se


aproxima en su forma a una distribución normal.
 El parámetro de la distribución es (n-1) grados de libertad, originando
una distribución diferente para cada tamaño de muestra.

¿Cómo se deduce una distribución de “t”?

 Extraigo K muestras de tamaño n < 30.

 Calculo para cada muestra el valor de “t”.

 Grafique la distribución para cada tamaño muestral

DISTRIBUCIÓN CHI_ CUADRADO

Para muestras extraídas de una población normal con variancia


2, con tamaño n < 30, siendo S2 la variancia de la
muestra entonces el estadístico 2 será

DEFINICIÓN

Una variable Chi cuadrado se define como la suma de n variables normales


estandarizadas elevadas al cuadrado.

CARACTERISTICAS

 Por definición, una variable 2 adopta valores


positivos: 0 " 2 " ".

 La distribución es asimétrica positiva.

 A medida que aumenta el tamaño de la muestra la curva es menos


asimétrica, aproximándose a una curva normal.

 Para cada tamaño muestral, se tendrá una distribución


2 diferente.

 El parámetro que caracteriza a una distribución


2 son sus grados de libertad (n-1), originado
una distribución para cada grado de libertad,

¿Cómo se deduce una distribución 2?

 Extraer K muestras de tamaño n < 30

 Para cada muestra, por ejemplo n = 5, transformamos cada valor de x:


x1, x2, x3, x4 y x5 en Z: z1, z2, z3, z4 y z5, utilizando:

 Para cada muestra calculamos:

 Entonces podríamos escribir , así:


(1)

 Si cambiamos en (1) la media poblacional


por X, resulta:

(2)

 Dado que: , despejando tenemos:

, al reemplazar en (2) llegamos a:

 Finalmente si se calcula para cada una de las K muestras y se grafica en


un eje de coordenadas el 2 se genera una
distribución de 2 con (n-1) grados de
libertad.

DISTRIBUCIÓN F DE FISHER

Considerando dos muestras aleatorias independientes, de tamaño n1 y n2,


extraídas de una población normal, el estadístico F será

DEFINICIÓN

Una variable F se define como el cociente entre dos variables ji-cuadrado


divididas por sus correspondientes grados de libertad.

CARACTERISTICAS

 Una variable con distribución F es siempre positiva por lo tanto su


campo de variación es 0 " F " "

 La distribución de la variable es asimétrica, pero su asimetría


disminuye cuando aumentan los grados de libertad del numerador
y denominador.

 Hay una distribución F por cada par de grados de libertad.

 Parámetros: Grados de libertad asociados al numerador y


denominador.

chi-cuadrado

Si para todo , sigue una distribución normal con media 0 y varianza 1


entonces sigue una distribución chi-cuadrado con grados de
libertad. Esto lo expresamos del siguiente modo: .

Teorema
Sean variables aleatorias independientes normalmente
distribuidas, con media 0 y varianza comun . Entonces, , donde
es una matriz simétrica, sigue una distribución chi-cuadrado de
grados de libertad si y sólo si es una matriz idempotente.

Teorema

Sean variables aleatorias independientes normalmente


distribuidas, con media 0 y varianza común 1. Sean, además y con
y matrices simétricas de dimensión . Entonces y son
independientes si y sólo si .

Distribución F de Fisher-Snedecor

Si y son variables aleatorias independientes que se distribuyen como sendas

chi-cuadrado de y grados de libertad respectivamente, entonces sigue


una distribución F de Fisher de grados de libertad en el numerador y
grados de libertad en el denominador.

Definición de distribución t de Student

Si es una variable aleatoria con distribución normal de media 0 y varianza 1 y


es otra variable aleatoria, independiente de con distribución entonces
sigue una distribución t de Student de grados de libertad.

Relación entre las distribuciones t y F

Como se deduce que si es una variable con una distribución t de


Student de grados de libertad, entonces sigue una distribución F de Fisher
con un grado de libertad en el numerador y en el denominador.

S-ar putea să vă placă și