Sunteți pe pagina 1din 31

DISTRIBUCIÓN

T DE STUDENT
• JENNIFER HERNÁNDEZ
BALAM

• OSMAR ALEXIS LAGUNA


HUERTA

INGENIERÍA EN SISTEMAS
COMPUTACIONALES
Aspectos teóricos
Antecedentes de la investigación

La distribución t de student fue


descubierta por William S. Gosset
en 1908. Gosset era un estadístico
empleado por la compañía de
cerveza Guinness.
Aspectos teóricos
Bases teóricas

En probabilidad y estadística, la distribución -t es una distribución


de probabilidad que surge del problema de estimar la media de una
población normalmente distribuida cuando el tamaño de la muestra
es pequeño

En muchas ocasiones no se conoce s y el número de observaciones


en la muestra es menor de 30.

En estos casos. Se puede utilizar la desviación estándar de la


muestra S como una estimación de s , pero no es posible usar la
distribución Z como estadístico de prueba.
El estadístico de prueba adecuado es la distribución t.
Grados de libertad
Existen varias distribuciones t. Cada una de ellas esta
asociada con los que se denominan “Grados de libertad”
Este se define como el numero de valores que podemos
elegir libremente, o sea, el número de observaciones
a

menos uno

Se encuentran mediante la fórmula:


n–1
Distribución T de Student
Una variable aleatoria se distribuye según el modelo de
probabilidad t o T de Student con k grados de libertad, donde k
es un entero positivo.

Distribución t-student con 10 grados de libertad


Características de la distribución t
de student
1. La distribución T de student, es una distribución continua

2. La distribución t tiene una media de cero,

3. Tiene forma acampanada y simétrica

4. No hay una distribución t, sino una "familia" de distribuciones


t. todas con la misma media cero, pero con su respectiva
desviación estándar, identificada cada una por sus respectivos
grados de libertad.
Es decir, existe una distribución t para una muestra de 20, otra
para una muestra de 22, y así sucesivamente.
Características de la distribución t
de student
5. La distribución t es mas ancha y mas plana en el centro que la
distribución normal estándar como resultado de ello se tiene una mayor
variabilidad en las medias de muestra calculadas a partir de muestras más
pequeñas. Sin embargo, a medida que aumenta el tamaño de la muestra, la
distribución t se aproxima a la distribución normal estándar.
Aplicaciones de la distribución t de
student
 Sus aplicaciones en la inferencia estadística son para estimar y
probar una media y una diferencia de medias (independiente y
pareada).

 Para determinar el intervalo de confianza dentro del cual se


puede estimar la media de una población a partir de muestras
pequeñas (n<30).

 Para probar hipótesis cuando una investigación se basa en


muestreo pequeño.
Cálculo de la distribución T de Student

 Prueba de hipótesis para Medias de t-student

La prueba de hipótesis para medias usando Distribución


t de student se usa cuando se cumplen las siguientes dos
condiciones:
• Es posible calcular la media y la desviación estándar a
partir de la muestra.
• El tamaño de la muestra es menor a 30.

El procedimiento obedece a los 5 pasos esenciales:


Cálculo de la distribución T de Student
Paso 1:
Plantear Hipótesis Nula (Ho) e Hipótesis Alternativa Hi).
• La Hipótesis alternativa plantea matemáticamente lo que
queremos demostrar.
• La Hipótesis nula plantea exactamente lo contrario.

Paso 2:
Determinar nivel de significancia.(Rango de aceptación de
hipótesis alternativa).
α
Se considera:
• 0.05 para proyectos de investigación.
• 0.01 para aseguramiento de calidad.
• 0.10 para encuestas de mercadotecnia y políticas.
Cálculo de la distribución T de Student
Paso 3:
Evidencia muestral.
Se calcula la media y la desviación estándar a partir de la muestra.

x1 + x 2 + x 3... + xn
X=
N

(x1 - X)2 + (x 2 - X)2 +... + (xn - X)2


s=
N
Cálculo de la distribución T de Student
Paso 4:
Se aplica la Distribución t-student para calcular la probabilidad de error
(P) por medio de la fórmula:

X -m
t=
S
n
Grados de libertad = n-1
X = Media (muestra)
μ = Valor a analizar (media de la población)
S= Desviación Estándar (muestra)
n= Tamaño de muestra
Cálculo de la distribución T de Student
Paso 5:
En base a la evidencia disponible se acepta o se rechaza la
hipótesis alternativa.

• Si la probabilidad de error (P) es mayor que el nivel de


significancia:
SE RECHAZA HIPÓTESIS ALTERNATIVA.

• Si la probabilidad de error (P) es menor que el nivel de


significancia:
SE ACEPTA LA HIPÓTESIS ALTERNATIVA
Ejercicio explicativo
Se aplica una prueba de conocimientos teóricos de software a 25
alumnos de ingeniería en sistemas quienes obtienen una
calificación promedio de 62.1 con una desviación estándar de
5.83 Se sabe que el valor correcto de la prueba debe ser mayor
a 60. ¿Existe suficiente evidencia para comprobar que no hay
problemas de conocimiento de software en el grupo seleccionado?

Paso 1:
Hipótesis Alternativa (Hi): (Lo que se quiere comprobar)
El grupo no tiene problemas de conocimiento de sotfware . Valor de
conocimiento de sotfware mayor a 60.

Hipótesis Nula (Ho): (Lo contrario a la hipótesis Alternativa)


El grupo tiene problemas de conocimiento de sotfware. Valor de conocimiento
de sotfware menor a 60.
Ejercicio explicativo
Paso 2:
Determinar nivel de significancia: como es para un
proyecto de investigación, entonces α =0.05

Paso 3:
Evidencia muestral.

X =62.1 y S=5.83
Ejercicio explicativo
Paso 4:
Aplicando la distribución de probabilidad t-student:

X -m 62.1- 60 2.1
t= t= t= =1.8
S 5.83 1.166
n 25
g.l. = n - 1 = 25 - 1 = 24
Ejercicio explicativo
Buscando en la tabla de Distribución de t-student, encuentras el valor
del área:

t = 1.8
gl = 24

Paso 5:
Resultados: P = 0.042 y α =0.05 Siendo P < α
Por lo tanto: Se acepta la Hipótesis Alternativa.
“Existe suficiente evidencia para demostrar que el grupo no tiene
problemas de conocimiento de software”.
Tabla T-Student
Ejercicios
Los alumnos de ingeniería en sistemas computacionales realizan
pruebas con leds. El representante del grupo dice que sus leds
duran 300 días.
Entonces los ing. en electromecánica van a varios supermercados y
compran 15 leds para probar esa afirmación. Los leds de la
muestra duran en promedio 290 días con una desviación estándar
de 50 días.
Entonces, si quieren desmentir al representante de sistemas
necesitan saber cual es la probabilidad de que 15 leds seleccionados
al azar tengan una vida promedio no mayor de 290 días
Ejercicios
Datos: Fórmula: Sustitución:
X = 290
μ = 300 X -m 290 - 300 -10
t= t= = = -0.7746
S = 50 S 50 12.91
n = 15
n 15
Ejercicios
Ejercicios
Suponiendo que las calificaciones de una prueba de los
alumnos de la carrera de Ingeniera de sistemas del
Tecnológico están distribuidas normalmente con una
media de 100. Ahora supongamos que seleccionamos a
20 estudiantes y les hacemos un examen de diagnostico
de sistemas operativos. La desviación estándar de la
muestra es de 15.

Datos: Fórmula: Sustitución:


X = 100 X -m 100 -110 -10
μ = 110 t= t= = = -2.9850
S = 15 S 15 3.35
n = 20 n 20
Ejercicios
Usando estos valores nos da un resultado de probabilidad acumulada de
0.00496.
Esto implica que hay una probabilidad de 0.45% de que el promedio en una
muestra sea mayor de 110.

Resultado gráficamente:
Distribución t
19 grados de libertad
Ejercicios
Los ingenieros en sistemas del Instituto Tecnológico han
desarrollado una aplicación que desarrolla las habilidades de los niños
para poder empezar a hablar a temprana edad.
En su localidad, el promedio de edad, en la cual un niño emite su
primera palabra, es de 13 meses. No se conoce la desviación estándar
poblacional.
Los ingenieros ponen en práctica dicha aplicación a una muestra
aleatoria de 15 niños. Los resultados arrojan que la edad media
muestra en la que se pronuncia la primera palabra es de 11 meses, con
una desviación estándar de 3.34.

1.¿Cuál es la hipótesis alternativa ?


2.¿Cuál es la hipótesis nula?
3.¿Funciona la técnica? Utilice =0,052colas
Ejercicios
Hipótesis alternativa H1: La aplicación afecta la edad en que los niños
comienzan a hablar.

Por lo tanto, la muestra con Xobtenido =11, 0 es una muestra aleatoria, extraída de
una población donde  ≠ 13,0.

Hipótesis Nula H0: La aplicación no afecta la edad en que los niños


comienzan a hablar.

Por lo tanto, la muestra con Xobtenido =11, 0 es una muestra aleatoria , extraída
de una población con  = 13,0.
Ejercicios
Datos: Fórmula: Sustitución:
X = 11
μ = 13 X -m 11  13 2
t= t   2.32
S = 3.34 S 3.34 0.862
n = 15 n 15

tCrítico = 2.14 Si tObtenido  tCrítico

Entonces, se rechaza la Hipótesis Nula; por lo que se acepta la Hipótesis Alterna:


“La técnica afecta la edad en que los niños comienzan a hablar”
Ejercicios
La maestra de química del Instituto Tecnológico de Cancún afirma que el
rendimiento medio de cierto proceso en una planta es 500 gramos por milímetro de
materia. Para verificar esta afirmación toma una muestra de 25 plantas cada mes.
Si el valor de t calculado cae entre –t0.05 y t0.05’ aceptaría su afirmación (con 90% de
confianza). ¿Qué conclusión extraería de una muestra que tiene una media de 518
gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la
distribución de rendimientos es aproximadamente normal.

Solución: de la tabla encontramos que t ± 0.05 para 24 grados de libertad es ±1.711.


Por tanto, la maestra queda satisfecha con esta afirmación si una muestra de 25
plantas rinde un valor t entre –1.711 y 1.711.
Se procede a calcular el valor de t:
Datos: Fórmula: Sustitución:
X = 100 X -m 518 - 500 18
μ = 110 t= t= = = 2.25
S = 15 S 40 8
n = 20 n 25
Ejercicios
Este es un valor muy por arriba de 1.711, por lo que el maestra diría que no es cierta
la afirmación. Sin embargo, si se encuentra la probabilidad de obtener un valor de t
con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02 De aquí es probable que la maestra concluya que el
proceso produce un mejor rendimiento de producto que el que suponía.
Ejercicios propuestos
Imagine que la administradora de una universidad quiere determinar el IQ
promedio de los alumnos de sistemas del ITC. Como es muy costoso hacer una
prueba a todos los alumnos, se extrae una muestra aleatoria de 20 alumnos de la
carrera. Cada alumno recibe un examen diseñado para medir el IQ; los
resultados proporcionan una media muestral de 135 y una desviación estándar
de 8. Construya el intervalo de confianza del 95% para la media poblacional.
a)¿Qué significa que el intervalo de confianza del 95% es igual a cierto rango?.

Un consejo universitario quiere determinar el tiempo promedio de estudio que


dedican los estudiantes de Ingeniería en Sistemas Computacionales, de primer
año, a sus materias. Extrae una muestra aleatoria de 61 alumnos de primer año y
les pregunta cuántas horas a la semana estudian. La media de los datos
resultantes es de 20 horas, y la desviación estándar es de 6,5 horas.
a) Construya un intervalo de confianza del 95% para la media poblacional.
b) Construya un intervalo de confianza del 99% para la media poblacional.
Ejercicios propuestos
El director del Instituto Tecnológico les ha dejado de tarea a Altura (en
los alumnos de Sistemas desarrollar una aplicación que Pulgadas)
demuestre que las alumnas han aumentado su estatura ya que 64
generaciones pasadas han estado bajas de estatura .El sabe
que hace 3 años el promedio de estatura de una alumna en el 66
instituto, fue de 63 pulgadas. No se conoce la desviación 68
estándar. Los alumnos toman una muestra aleatoria de ocho
alumnas y miden sus estaturas. Se obtienen los datos de la 60
siguiente tabla: 62
a) Cuál es la hipótesis nula? 65
b) Cuál es la hipótesis alterna? 66
c) Si utilizamos =0,01 2cola , qué se puede concluir? 63
Ejercicios propuestos
Una profesora, del programa de estudios para la mujer, cree que la
cantidad de cigarrillos fumados por las mujeres se ha incrementado en
años recientes. Un censo, realizado hace dos años con mujeres de una
ciudad vecina, mostró que el número promedio de cigarrillos fumados
diariamente por una mujer era de 5,4, con una desviación estándar de
2,5. Para evaluar esta hipótesis, la profesora determinó el número de
cigarrillos fumados diariamente por una muestra aleatoria de 120
mujeres que viven actualmente en la ciudad donde habita. Los datos
muestran que el número de cigarrillos fumados diariamente por las 120
mujeres tiene una media de 6,1 y una desviación estándar de 2,7.
a)¿Es correcta la hipótesis de la profesora?. Utilice =0.05 2 cola, para
tomar su decisión y la t-Students.

S-ar putea să vă placă și