Sunteți pe pagina 1din 7

INFERENCIA CON DOS MUESTRAS

En prctica es muy comn enfrentarse al problema de hacer comparaciones. As por ejemplo, al


dueo de una empresa le puede interesar saber si el rendimiento de los trabajadores de la jornada
diurna es superior al de los trabajadores de la jornada nocturna, o si se observa alguna diferencia
en el rendimiento atribuible al gnero del trabajador o si el rendimiento de sus empleados ha sido
afectado por el tiempo, ser que son ms eficientes cuando estn recin vinculados?. Como se ve,
es muy fcil pensar en situaciones en las que se deben considerar dos poblaciones.

El tratamiento estadstico al problema de las comparaciones puede hacerse a travs del uso de la
inferencia estadstica (recuerde que esto aplica en el caso de no tener acceso a la informacin a
nivel poblacional) a travs del uso de Intervalos de Confianza o Pruebas de Hiptesis.

Casos a considerar:

Se tienen dos muestras de datos a las cuales se les midi la misma variable:

Caso 1: Estudiar el comportamiento de una variable en dos poblaciones diferentes.

Ejemplo: Comparacin del rendimiento en una asignatura, por ejemplo Clculo I, en dos programas
diferentes, podra ser Matemticas vs Licenciatura en Matemticas.

Caso 2: Estudiar una variable en una poblacin al discriminar por una variable categrica

Ejemplo: Tomar una muestra aleatoria de estudiantes de Clculo I de la UIS para estudiar su
rendimiento, podra tambin estudiarse las diferencias por gnero a partir de esa misma muestra.
Intervalos de Confianza con Muestras Independientes
Supuestos:

- Adems de que las muestras sean independientes, stas deben ser aleatorias (no muestras de
voluntarios u obtenidas por conveniencia)

- La variable en estudio debe distribuirse normalmente en las dos poblaciones consideradas

Entonces se supone que la variable X:

X~N(1 , 12 ) en la Poblacin 1 y para la Poblacin 2 X~N(2 , 22 ).

Notacin:

Parmetro: 1 2 (Diferencia de Medias)

Estimador: 1 2

Tamaos de muestra: 1 2 para cada poblacin respectivamente

12 2
Distribucin del estimador: 1 2 ~ ( 1 2 , 1
+ 2 )
2

Para calcular el intervalo de confianza para la diferencia de dos medias se debe usar la desviacin
estndar de la distribucin del estimador, es decir el error estndar; por esto, a menos que las
varianzas sean conocidas o la muestra sea grande, debemos empezar por probar si es vlido asumir
varianzas poblacionales iguales o no (Prueba de homogeneidad de varianzas). Veamos algunos
ejemplos.

Ejemplo 1: Consumo de energa.


Se desea comparar el consumo de energa de dos sectores de la ciudad. Tomando los datos
provenientes de una muestra de cada uno de los sectores se tiene que en el Sector 1 se ha
observado un consumo promedio de 150 (kWh/mes) en el ltimo trimestre, mientras que en el
Sector 2 el consumo promedio ha sido de 171 (kWh/mes). Segn el comportamiento histrico, la
varianza en el consumo de energa en cada sector es baja y estable en el tiempo en un valor de 12
(kWh/mes) tanto para el Sector 1 y el 2. El tamao de muestra utilizado fue de 35 hogares en el
Sector 1 y 40 hogares en el sector 2.

Calcule e interprete el IC del 99% para la diferencia en el consumo promedio de energa entre el
sector 2 y 1.

CASO 1 : Varianzas conocidas:

Frmula para calcular el IC del 1- %: 1 2

2 2
/2 1 + 2
1 2

Error Estndar: Desviacin


estndar en la distribucin del
estimador.
Solucin al ejemplo 1:

Ejemplo 21. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones
de dos marcas de bombillos, si una muestra de 40 bombillos tomada al azar de la primera marca
mostr una duracin media de 418 horas, y una muestra de 50 bombillos de otra marca di una
duracin media de 402 horas. Las desviaciones estndares de las dos poblaciones son 26 horas y 22
horas, respectivamente.

1
http://www.mitecnologico.com/Main/IntervaloConfianzaParaDiferenciaEntreDosMedias
Caso 2: Muestras grandes 1 2
2

2 2
donde =1 + 2
1 2

Solucin al ejemplo 2:

Nota: El hecho de que ambos lmites sean positivos, y por lo tanto no contengan el valor cero indican que
ambas marcas no tienen la misma duracin media, y sugiere que pueda pensarse que la primera marca de
bombillos tenga una duracin media superior a la segunda.

Ejemplo 3: Mtodos de Estudio.

Se desea comparar el rendimiento obtenido bajo dos mtodos de estudio diferentes. Para tal fin, se
seleccion al azar una muestra de 60 estudiantes de un mismo grado de una institucin educativa.
Treinta de ellos, seleccionados tambin al azar, utilizaron el mtodo tradicional, los otros treinta
utilizaron una nueva estrategia basada en el uso de nuevas tecnologas en el aula. Tras terminar
cierto tiempo usando la estrategia asignada, se aplic una prueba estandarizada a los dos grupos, el
rendimiento observado se resume en la siguiente tabla:

Mtodo Tamao de Muestra Media muestral Desviacin Estndar Muestral


Tradicional 25 1 = 3.4 1 = 0.40

Nuevo 25 2 = 3.67 2 = 0.50


Estimar la verdadera diferencia promedio entre los dos mtodos de estudio usando un IC del 95%.

CASO 3: Muestras pequeas

Se deber escoger entre alguna de estas dos opciones al hacer una prueba F para homogeneidad de
varianzas.

CASO 3.1 Varianzas desconocidas pero iguales

1 1
1 2 .=1+22 +
1 2

Donde : ( )
(1 1)12 + (2 1)22
2 =
1 + 2 2

CASO 3.2: Varianzas desconocidas pero desiguales

12 22
1 2 +
1 2



( + )
. =

( ) ( )
( ) + ( )

Solucin al ejemplo 3:

Prueba F:

12
Hiptesis: 0 : 2 = 1 (Igualdad de varianzas)
2

12
: 2 1 (Varianzas desiguales)
2

Estadstico de Prueba =

Regin de rechazo: La distribucin del estimador es una F, sta distribucin es asimtrica y su


forma depende de dos parmetros a los cuales usualmente se denotan por

v1 = G.L. numerador y v2 = G.L denominador

Ver tabla de la distribucin F en http://www.uam.es/personal_pdi/ciencias/anabz/Prest/Trabajos/tabla-fisher.pdf


Tener en cuenta que al acomodar las varianzas muestrales como se indico, no es posible observar
valores menores que 1, por esto a pesar que la prueba es bilateral se separa toda el rea en la cola
derecha de la distribucin.

Desarrollo y conclusin para la prueba de homogeneidad de varianzas:

Clculo del IC para el ejemplo 3:

Ver ejemplos en:

http://www.itch.edu.mx/academic/industrial/estadistica1/cap03d.html

http://www.unalmed.edu.co/~cescobar/Bioestadistica/bioestadistica.htm#3.4.3.3

Prueba de Diferencia de medias


Estamos bajo el mismo contexto del apartado anterior:

Parmetro: 1 2 (Diferencia de Medias)

Estimador: 1 2

Tamaos de muestra: 1 2 para cada poblacin respectivamente

Distribucin del estimador: 1 2 ~( 1 2 , ? )

Inicialmente hay que determinar qu tipo de prueba se va a implementar: Bilateral, Unilateral a


derecha o a izquierda y luego resolver qu valor se va a usar cmo error estndar en la prueba.
Entonces debemos considerar los siguientes casos:

Caso 1
Estadstico de Prueba de hiptesis para la diferencia de medias, si las muestras se obtienen de
poblaciones con varianzas poblacionales conocidas

Caso 2

Estadstico de Prueba de hiptesis para la diferencia de medias, muestras grandes

Caso 3

3.1 Estadstico de prueba para prueba de hiptesis para la diferencia de medias, muestras
pequeas con varianzas poblacionales desconocidas pero iguales:

Caso 4

Estadstico de prueba para prueba de hiptesis para la diferencia de medias, muestras pequeas
con varianzas poblacionales desconocidas pero iguales:

Tarea:

Leer del captulo 6 la seccin 6.3 del libro de Moore. De los ejercicios realizar del 6-40 al 6-45. Para
el ejercicio 6-45 se tienen los datos, entonces realizarlo primero manualmente y luego usando SPSS
(Analizar-Comparar medias-Prueba T para muestras independiente).

S-ar putea să vă placă și