Documente Academic
Documente Profesional
Documente Cultură
Unidad I
Inferencias acerca de los parámetros de dos poblaciones
1. INTRODUCCIÓN
Con frecuencia un analista buscará obtener conclusiones acerca de los parámetros de dos
poblaciones.
Por ejemplo, un investigador de mercados puede estar interesado en comparar los ingresos
medios de las familias de dos ciudades para determinar en cuál de ellas se instalará una nueva
sucursal de un supermercado.
En otro caso, el administrador de una gran cadena de cines puede estar interesado en comparar
la proporción del ingreso gastada en esparcimiento por las familias de dos ciudades para saber
en cuál de ellas instalará un nuevo cine de la cadena.
Finalmente, el gerente de producción de una fábrica puede estar interesado en comparar, a
partir de sus respectivas varianzas, la variabilidad de dos procesos de producción para quedarse
con aquel que presenta menos variabilidad respecto de cierta variable crítica.
Se podría seguir dando muchos más ejemplos en los cuales el objetivo sea comparar parámetros
de dos poblaciones.
En esta unidad nos ocuparemos de comparar las medias, las proporciones y las varianzas de dos
poblaciones analizando los distintos casos que puedan presentarse.
En unidades posteriores estudiaremos técnicas para comparar las medias, las proporciones y las
varianzas de más de dos poblaciones.
2. INFERENCIAS ACERCA DE LAS MEDIAS DE DOS POBLACIONES
Como se ha dicho más arriba, en ocasiones el interés de un investigador puede estar dirigido a
comparar las medias de dos poblaciones.
Tal comparación se puede hacer a partir de la diferencia 𝜇1 − 𝜇2 donde 𝜇1 es la media de una
de las poblaciones y 𝜇2 es la media de la otra población.
Pueden presentarse los siguientes casos:
Que la diferencia sea mayor a cero. En este caso, la media de la primera población es
mayor que la media de la segunda.
Que la diferencia sea igual a cero. En este caso las medias de las dos poblaciones son
iguales.
Que la diferencia sea negativa. En este caso la media de la segunda población será mayor
que la de la primera.
Cuando buscábamos obtener conclusiones acerca de la media de una sola población, y dado que
en general este parámetro es desconocido, lo hicimos a partir de la media muestral 𝑋̅. Para ello
fue necesario estudiar las propiedades estadísticas de dicha variable. Cuando se trata de obtener
conclusiones acerca de la diferencia 𝜇1 − 𝜇2 , como estos parámetros son en general
desconocidos, lo haremos a partir de una nueva variable aleatoria 𝑋̅1 − 𝑋̅2 , diferencia de medias
muestrales cuyas propiedades estadísticas damos a continuación.
Teorema 1. Suponga que de una población 𝑋1 con media 𝜇1 y varianza 𝜎12 conocida se toman
muestras de tamaño 𝑛1 , y que de otra población 𝑋2 con media 𝜇2 y varianza 𝜎22 también
conocida se toman muestras de tamaño 𝑛2 , si las poblaciones son independientes (no
relacionadas) entonces la variable aleatoria 𝑋̅1 − 𝑋̅2 tiene las siguientes propiedades:
2
𝐸(𝑋̅1 − 𝑋̅2 ) = 𝜇1 − 𝜇2
𝜎12 𝜎22
𝜎(𝑋̅1 −𝑋̅2 ) = √ +
𝑛1 𝑛2
Además, si las poblaciones de las cuales se toman las muestras tienen distribución normal
entonces 𝑋̅1 − 𝑋̅2 también tiene distribución normal de probabilidades.
Por lo tanto, la variable aleatoria
(𝑋̅1 −𝑋̅2 )−(𝜇1 −𝜇2 )
𝑍= ~𝑁(0, 1)
𝜎 2
𝜎 2
√ 1+ 2
𝑛1 𝑛2
Por lo tanto
1 − Pr[(𝑋̅1 − 𝑋̅2 ) ≤ 18] = 1 − Pr(𝑍 ≤ 1,80) = 1 − 0,96407 = 0,03593
El punto b) queda como tarea para el estudiante.
Observación. El teorema anterior sigue siendo válido aún si las poblaciones no tienen
distribución normal paro los tamaños de las muestras son grandes, mayores o iguales a 30. Esto
es una consecuencia del Teorema del Límite Central.
Además, también es posible demostrar que cuando no se conocen las varianzas poblacionales y
son reemplazadas por las varianzas muestrales calculadas para muestras mayores o iguales a 30,
la variable aleatoria
(𝑋̅1 −𝑋̅2 )−(𝜇1 −𝜇2 )
𝑆 2
𝑆 2
√ 1+ 2
𝑛1 𝑛2
Cuando se da esta situación y las poblaciones tienen distribución normal, la diferencia de medias
muestrales se analiza utilizando la distribución t se Student. Damos a continuación una
propiedad que ilustra este caso.
Teorema 2. Suponga que de una población con distribución normal 𝑋1 , media 𝜇1 y varianza 𝜎12
desconocida se toman muestras de tamaño 𝑛1 y que de otra población 𝑋2 también con
distribución normal, media 𝜇2 y varianza 𝜎22 desconocida se toman muestras de tamaño 𝑛2 . Si
las poblaciones son independientes y las varianzas, aunque desconocidas son iguales, es decir
𝜎12 = 𝜎22 = 𝜎, la variable aleatoria
(𝑋̅1 −𝑋̅2 )−(𝜇1 −𝜇2 )
𝑇= 1 1
√𝑆𝑝2 (𝑛 +𝑛 )
1 2
tiene distribución t de Student con 𝑛1 + 𝑛2 − 2 grados de libertad. En esta última expresión, 𝑆12
(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22
y 𝑆22 son las varianzas muestrales y 𝑆𝑝2 = 𝑛1 +𝑛2 −2
.
1 1
𝑠(𝑋̅2 −𝑋̅1 ) = √11,01 (6 + 6) = 1,91
3,04
Por lo tanto 𝑡 = 1,91 = 1,59. Por lo tanto
2
𝑆2 𝑆2
(𝑛1 +𝑛2 )
1 2
tiene distribución t con 𝜐 = 2 2 − 2 grados de libertad.
𝑆2 𝑆2
( 1) ( 2)
𝑛1 𝑛2
+
𝑛1 +1 𝑛2 +1
Es importante aclarar que 𝑇 → 𝑁(0, 1) a medida que los tamaños de las muestras aumentan tal
como lo hemos dicho anteriormente.
Intervalos de confianza para la diferencia 𝝁𝟏 − 𝝁𝟐
Hemos dicho en la introducción que en muchas situaciones prácticas es de interés obtener
estimaciones de la diferencia de las medias de dos poblacionales 𝜇1 − 𝜇2 .
Como se sabe, la estimación puede ser puntual o bien mediante la construcción de un intervalo
de confianza.
A continuación, veremos cómo construir un intervalo de confianza para esta diferencia. Ante
esta situación hay que distinguir por lo menos dos casos:
Cuando las varianzas de las poblaciones son conocidas.
Cuando las varianzas de las poblaciones son desconocidas.
Habrá también que analizar en cada caso la distribución de probabilidad de las poblaciones.
Hemos dicho que cuando tenemos dos poblaciones con distribución normal y varianzas
conocidas, la variable aleatoria
(𝑋̅1 −𝑋̅2 )−(𝜇1 −𝜇2 )
𝑍=
𝜎 2𝜎 2
√ 1+ 2
𝑛1 𝑛2
𝜎2 𝜎2 𝜎2 𝜎2
𝐶 [(𝑥̅1 − 𝑥̅2 ) − 𝑧√𝑛1 + 𝑛2 ≤ (𝜇1 − 𝜇2 ) ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑧√𝑛1 + 𝑛2 ] = 1 − 𝛼
1 2 1 2
O de forma abreviada
𝜎12 𝜎2
(𝑥̅1 − 𝑥̅2 ) ± 𝑧√
𝑛1
+ 𝑛2
2
Usualmente la diferencia de los parámetros se toma en el orden tal que la misma sea positiva.
Observación. Es importante destacar que las dos expresiones anteriores siguen siendo válidas
para estimar la diferencia de medias aun cuando las poblaciones no tengan distribución normal
paro los tamaños de las muestras sean mayores o iguales a 30.
Además, se pueden utilizar las varianzas muestrales para estimar las varianzas poblacionales
cuando se desconocen estos parámetros siempre y cuando las muestras sean grandes. Bajo
estas condiciones, la expresión general para un intervalo de confianza para la diferencia de dos
medias poblacionales es la siguiente:
𝑠2 𝑠2
(𝑥̅1 − 𝑥̅2 ) ± 𝑧√𝑛1 + 𝑛2
1 2
Ejemplo 3. Suponga que se quiera medir la diferencia entre el rendimiento de dos categorías de
empleados en la actividad de seguros. Una categoría está formada por productores con título
superior y otra por productores con título secundario. Se toma una muestra de 45 productores
entre los primeros y la media de las ventas, en miles de pesos fueron de 𝑥̅1 = 32. La media de
una muestra de 60 productores con estudios secundarios fue 𝑥̅2 = 25. Suponga además que las
varianzas poblacionales valen 𝜎12 = 48 para los productores con título superior y 𝜎22 = 56 para
los productores con título secundario.
a) Calcule e interprete un intervalo del 90% para la diferencia entre las medias
poblacionales.
b) De acuerdo con el intervalo hallado, ¿hay evidencias de que las ventas medias de los dos
grupos son iguales?
Solución
Los datos para este ejemplo son los siguientes
Para los productores con título superior 𝑥̅1 = 32 y 𝜎12 = 48. La muestra con la que se calculó la
media muestral es de tamaño 45, es decir 𝑛1 = 45.
Para los productores con título secundario se tomó una muestra de tamaño 𝑛2 = 60 y se obtuvo
a partir de ella 𝑥̅2 = 25 y se sabe que 𝜎22 = 56.
Comenzamos con el punto a)
𝜎2 𝜎2
La expresión general para el intervalo buscado es (𝑥̅1 − 𝑥̅2 ) ± 𝑧√𝑛1 + 𝑛2 .
1 2
De acuerdo con los valores de los límites inferior y superior del intervalo no existen evidencias
para considera 𝜇1 = 𝜇2 pues el intervalo hallado no contiene al caro.
¿Qué forma tiene el intervalo de confianza para la diferencia de medias poblacionales cuando
no se conocen las varianzas poblacionales y las poblaciones tienen distribución normal?
Cuando se da esta situación, las poblaciones de las cuales se toman las muestras tienen
distribución normal y las varianzas poblacionales desconocidas son iguales, hemos dicho que la
(𝑋̅1 −𝑋̅2 )−(𝜇1 −𝜇2 )
variable aleatoria 𝑇 = 1 1
tiene distribución 𝑡 con 𝑛1 + 𝑛2 − 2 grados de libertad.
√𝑆𝑝2 (𝑛 +𝑛 )
1 2
O, de manera abreviada
1 1
(𝑥̅1 − 𝑥̅2 ) ± 𝑡√𝑠𝑝2 ( + )
𝑛1 𝑛2
1 1 1 1
Por lo tanto 𝑠(𝑋̅1 −𝑋̅2 ) = √𝑠𝑝2 (𝑛 + 𝑛 ) = √1,69 (14 + 25) = 0,4339.
1 2
Para el primer test se rechaza la hipótesis nula si 𝐸𝑝 < −𝑧𝑐 o 𝐸𝑝 > 𝑧𝑐 siendo ±𝑧𝑐 los valores
críticos del estadístico de prueba determinados por el nivel de significación del test.
Si el test es unilateral izquierdo, rechazamos la hipótesis nula si 𝐸𝑝 < −𝑧𝑐 siendo – 𝑧𝑐 el valor
crítico del estadístico de prueba definido por 𝛼.
Por último, si la prueba es unilateral derecha, rechazamos la hipótesis nula cuando 𝐸𝑝 > 𝑧𝑐 .
Observación. Se puede utilizar el mismo procedimiento si no se conocen las distribuciones de
las poblaciones y las varianzas poblaciones son desconocidas pero las muestras son mayores a
iguales a 30. En este caso se utilizan las varianzas muestrales como aproximaciones de las
poblacionales. El estadístico de prueba es
(𝑋̅1 −𝑋̅2 )−(𝜇1 −𝜇2 )
𝐸𝑝 =
𝑆 2𝑆 2
√ 1+ 2
𝑛1 𝑛2
Como sabemos 𝐸𝑝 → 𝑁(0, 1). Además, esta aproximación será mejor a medida que aumente el
tamaño de la muestra.
Por último, para que las pruebas tengan validez, las poblaciones deben ser independientes.
Ejemplo 5. El gerente de operaciones de una fábrica de focos desea determinar si existen
diferencias entre la vida promedio de los focos fabricados en dos tipos de máquinas. La
desviación estándar de la máquina I es 110 horas y la de la máquina II es 250 horas. Una muestra
aleatoria de 25 focos obtenidos de la máquina I indica una media muestral de 375 horas y una
muestra similar de 25 focos de la máquina II indica una media muestral de 362 horas. Suponga
que las poblaciones de los tiempos de duración tienen distribución normal. Tome 𝛼 = 0,05.
Solución
Las variables a analizar son las siguientes:
𝑋1 = Duración de los focos producidos por la máquina I.
𝑋2 = Duración de los focos producidos por la máquina II.
Ambas variables tienen distribución normal y además se conocen sus respectivas desviaciones
estándar. En este caso tenemos 𝜎1 = 110 horas y 𝜎2 = 250 horas.
Por otro lado, para una muestra de tamaño 𝑛1 = 25 se tiene que 𝑥̅1 = 375 horas y, para otra
muestra de tamaño 𝑛2 = 25 se calcula 𝑥̅ = 362 horas.
Se busca probar si existen diferencias entre las vidas promedios de los focos producidos por las
dos máquinas.
Luego, las hipótesis a contrastar serán
𝐻0 : 𝜇1 − 𝜇2 = 0
𝐻𝑎 : 𝜇1 − 𝜇2 ≠ 0
(𝑋̅1 −𝑋̅2 )−0
Dadas las condiciones del problema el estadístico de prueba es 𝐸𝑝 = que, como
𝜎 2
𝜎 2
√ 1+ 2
𝑛1 𝑛2
Como resulta que −1,96 < 0,237 < 1,96 no rechazamos la hipótesis nula. En consecuencia, hay
evidencias estadísticas como para afirmar que las vidas medias de los focos producidos por las
dos máquinas son iguales con un nivel de significación de 0,05.
Poblaciones normales, varianzas desconocidas pero iguales
En el punto anterior vimos como probar hipótesis para la diferencia de medias poblacionales en
el caso de que las poblaciones de las cuales se toman las muestras tienen distribución normal y
las varianzas de estas son conocidas.
En realidad, resulta que en la mayoría de los casos estos parámetros no se conocen y hay que
estimarlas.
Cuando esto sucede, siendo las poblaciones normales y las varianzas, aunque desconocidas se
pueden considerar como iguales, el estadístico de prueba para llevar adelante cualquiera de las
pruebas listadas más arriba es
(𝑋̅1 −𝑋̅2 )−(𝜇1 −𝜇2 )
𝐸𝑝 = 1 1
√𝑆𝑝2 (𝑛 +𝑛 )
1 2
Este estadístico, bajo estas condiciones, tiene distribución 𝑡 de Student con 𝑛1 + 𝑛2 − 2 grados
de libertad.
Ejemplo 6. Se llevó a cabo un estudio para evaluar los efectos de hacinamiento sobre el
aprendizaje entre alumnos universitarios. A una muestra aleatoria de 50 alumnos se les enseñó
determinada materia en condiciones de hacinamiento y a otra muestra de 40 alumnos se les
enseñó la misma materia, con los mismos profesores, pero sin hacinamiento. Al terminar el
experimento se suministró a cada alumno una evaluación para determinar el nivel de
conocimientos alcanzado. Se obtuvieron los resultados que se muestran en la tabla 3.
Condiciones Media muestral Varianza muestral
Hacinamiento 70 100
Sin hacinamiento 80 90
Tabla 3
¿Proporcionan los datos evidencia suficiente como para concluir que la enseñanza es más
efectiva sin hacinamiento?
Tome 𝛼 = 0,05. Suponga además que las varianzas de las poblaciones, aunque desconocidas
son iguales.
Solución
Consideremos al primer grupo como el de los estudiantes que aprenden sin hacinamiento y al
segundo grupo de los que aprenden bajo condiciones de hacinamiento. Las hipótesis que
contrastar son las siguientes
𝐻0 : 𝜇1 − 𝜇2 ≤ 0
𝐻𝑎 : 𝜇1 − 𝜇2 > 0
Los cálculos necesarios para la solución son
39×90+49×100
𝑠𝑝 = 50+40−2
= 95,56
Como el nivel de significación de la prueba es de 0,05 y se trata de un test unilateral derecho, el
valor crítico del estadístico de prueba es 𝑡 = 1,6630.
(80−70)−0
El valor calculado del estadístico de prueba es 𝐸𝑝 = 1 1
= 4,83
√95,56( + )
40 50
10
Como el valor calculado del estadístico de prueba es mayor que su valor crítico rechazamos la
hipótesis nula y concluimos que existen evidencias estadísticas como para considerar que los
alumnos que aprenden en condiciones bajo hacinamientos tienen una nota promedio menor
que aquellos que lo hacen son esta condición.
3. COMPARACIONES PAREADAS
Con frecuencia, los datos disponibles para el análisis se obtienen a partir de dos poblaciones que
no son independientes. Un procedimiento comúnmente utilizado que da como resultado dos
muestras que no son independientes es la denominada prueba antes y después. En este caso,
las mediciones se hacen sobre una muestra de los mismos sujetos tanto antes como después de
la introducción de algún fenómeno.
Por ejemplo, se mide la producción de un mismo grupo de operarios antes y después de
adiestrarlos en el uso de una nueva tecnología de producción.
En otro ejemplo, se puede hacer una prueba de aprendizaje de ciertos temas de matemática a
el mismo grupo de estudiantes utilizando dos métodos distintos de enseñanza y comparando
posteriormente las puntuaciones obtenidas.
Claramente los dos grupos de observaciones que resultan de estas clases de experimentos están
relacionados.
Este tipo de experimentos se realizan cuando se quiere controlar por medio de este las
diferencias que pudiese haber entre los individuos a los cuales se aplican el tratamiento.
Los métodos de inferencia que hemos desarrollados con anterioridad no se pueden aplicar
cuando las dos muestras de observaciones están relacionadas. Esto se debe a que aquellos
métodos exigen que las observaciones sean independientes.
Como se recordará, en esa oportunidad el acento estuvo puesto en a diferencia de medias
𝜇1 − 𝜇2 . Las conclusiones se obtuvieron a partir de las propiedades estadísticas de la diferencia
de medias muestrales 𝑋̅1 − 𝑋̅2 .
Cuando las observaciones están relacionadas, es decir, cuando no son independientes, la
atención se centra en la media de las diferencias de las observaciones más que en la diferencia
de las medias.
El modelo teórico que describe este caso pude ser pensado de la siguiente manera. Sea 𝑋1 la
variable aleatoria que representa la primera observación. Suponga que 𝑋1 ~𝑁(𝜇1 , 𝜎 2 ) y sea 𝑋2
la variable aleatoria que representa la segunda observación. Suponga adicionalmente que
𝑋2 ~𝑁(𝜇2 , 𝜎 2 ).
A partir de 𝑋1 y 𝑋2 definimos la variable aleatoria diferencia definida como 𝐷𝑖 = 𝑋𝑖1 − 𝑋𝑖2 con
𝑖 = 1, 2, … , 𝑁 donde 𝑁 es el tamaño de las dos poblaciones de observaciones. Esto se muestra
en la tabla 4.
𝑋1 𝑋2 𝐷𝑖
𝑋11 𝑋12 𝐷1 = 𝑋11 − 𝑋12
𝑋21 𝑋22 𝐷2 = 𝑋21 − 𝑋12
𝑋31 𝑋32 𝐷3 = 𝑋31 − 𝑋32
… … …
𝑋𝑁1 𝑋𝑁2 𝐷𝑁 = 𝑋𝑁1 − 𝑋𝑁2
Tabla 4
La media de las diferencias es
1
𝜇𝐷 = 𝑁 ∑𝑁
𝑖=1 𝐷𝑖
11
Por otro lado, la varianza de la variable aleatoria diferencia 𝐷 se define de la siguiente manera
1
𝜎𝐷2 = 𝑁 ∑𝑁
𝑖=1(𝐷𝑖 − 𝜇𝐷 )
2
que resulta ser la mejor estimación de 𝜎𝐷2 . Por lo tanto, el error estándar estimado de la variable
̅ está dado por 𝑠𝐷̅ = 𝑠𝐷 .
𝐷
√𝑛
Ejemplo 7. Con el fin de medir el efecto de una campaña de ventas, el director de investigaciones
de una cadena de supermercados tomó una muestra de 13 sucursales de la cadena y midió el
volumen de ventas con la campaña de ventas y sin la campaña de ventas. Los datos en la tabla
5 muestran los resultados para un período de una semana.
a) Construya con estos datos un intervalo de confianza del 95%
b) ¿Qué suposiciones hay que hacer para poder construir el intervalo solicitado?
Supermercado Con campaña Sin campaña Diferencia
1 67,2 65,3 1,9
2 59,4 54,7 4,7
3 80,1 81,3 -1,2
4 47,6 39,8 7,8
5 97,8 92,5 5,3
6 38,4 37,9 0,5
7 57,3 52,4 4,9
8 75,8 69,9 5,9
9 94,7 89,0 5,7
10 64,5 58,4 5,9
11 31,7 33,0 -1,3
12 49,3 41,7 7,6
13 54,0 53,6 0,4
Total ... ... 48,1
Tabla 5
Solución
Comenzamos con el punto a)
Algunos datos son los siguientes, 𝑛 = 13 y 1 − 𝛼 = 0,95. Puede verificarse a partir de los datos
que ∑13 2 13
𝑖=1 𝑑𝑖 = 302,05 y que (∑𝑖=1 𝑑𝑖 ) = 2.313,61. Por lo tanto
13 2 𝑛 2
1 1 𝑛 ∑𝑖=1 𝑑𝑖 −(∑𝑖=1 𝑑𝑖 ) 13(302,05)−2.313,61
𝑑̅ = 𝑛 ∑13 2
𝑖=1 𝑑𝑖 = 13 48,1 = 3,7 además 𝑠𝐷 = 𝑛(𝑛−1)
= 13(12)
= 10,34.
Por lo tanto, 𝑠𝐷 = 3,21.
𝑠𝐷 3,21
De acuerdo con los cálculos precedentes 𝑠𝐷̅ = = . Además, dado que el nivel de confianza
√𝑛 √13
para el intervalo es del 95% tendremos que 𝑡 = ±2,1788. Tendremos así el siguiente intervalo
de confianza para 𝜇𝐷 .
𝑆 𝑆
𝐶 (𝑑̅ − 𝑡 𝐷𝑛 ≤ 𝜇𝐷 ≤ 𝑑̅ − 𝑡 𝐷𝑛) = 1 − 𝛼
√ √
3,21 3,21
𝐶 [3,7 − 2,1788 ( ) ≤ 𝜇𝐷 ≤ 3,7 − 2,1788 ( )] = 0,95
√13 √13
Por último, en el tercer caso, por tratarse de una prueba unilateral derecha, rechazamos
la hipótesis nula si 𝐸𝑝 > 𝑡𝑐 donde el valor de 𝑡𝑐 se determina de acuerdo con el nivel de
significancia de la prueba y los grados de libertad correspondientes.
Ejemplo 8. Diez personas realizaron a un test antes y después de recibir cierta instrucción para
realzar cierta tarea específica. Los resultados obtenidos se muestran en la tabla 6. ¿Proporcionan
estos datos evidencia suficiente para decidir que la instrucción fue efectiva? Tome 𝛼 = 0,05.
Solución
De acuerdo con los datos de la tabla precedente tenemos los siguientes cálculos.
La suma de todas las diferencias es ∑10
𝑖=1 𝑑𝑖 = 704 por lo que la media de las diferencias vale
̅
𝑑 = 70,4.
2
Por otro lado, es posible verificar que ∑𝑛𝑖=1 𝑑𝑖2 = 51.174 y que (∑10
𝑖=1 𝑑𝑖 ) = 495.616.
Conclusión
como el valor calculado del estadístico de prueba supera al valor crítico rechazamos la hipótesis
nula. Hay evidencias estadísticas de que la instrucción ha sido efectiva.
15
Además, si los tamaños de las muestras son lo suficientemente grandes, 𝑃̅1 − 𝑃̅2 tiene
distribución aproximadamente normal.
Como consecuencia, la variable aleatoria
(𝑃̅1 −𝑃̅2 )−(𝑝1 −𝑝2 )
𝑍= 𝑝 1 𝑞 1 𝑝2 𝑞 2
~𝑁(0, 1)
√ 𝑛 +
1 𝑛 2
De acuerdo a estos resultados tenemos que 𝑝̅1 − 𝑝̅2 = 0,20 − 0,07 = 0,13. Se pide calcular
Pr[(𝑃̅1 − 𝑃̅2 ) ≥ 0,13].
Tenemos entonces Pr[(𝑃̅1 − 𝑃̅2 ) ≥ 0,13] = 1 − Pr[(𝑃̅1 − 𝑃̅2 ) < 0,13].
Para realizar el cálculo de esta probabilidad hay que estandarizar el valor 13. Para ello
procedemos de la siguiente manera:
16
Por lo tanto, 1 − Pr[(𝑃̅1 − 𝑃̅2 ) < 0,13] = 1 − Pr(𝑍 < 1,95) = 0,0255 como resultado de la
probabilidad buscada.
Inferencias acerca de la diferencia de proporciones de dos poblaciones
Con los conceptos anteriores hemos preparado el camino para realizar inferencias acerca de la
diferencia entre dos proporciones poblacionales 𝑝1 − 𝑝2 .
Como en el caso de la diferencia de medias poblacionales 𝜇1 − 𝜇2 , las inferencias para la
diferencia de dos proporciones poblacionales pueden realizarse a partir de una estimación
puntual, la construcción de intervalos de confianza o de pruebas de hipótesis.
En los dos últimos casos las bases teóricas son las mismas. En primer lugar, veremos cómo
construir intervalos de confianza para la diferencia 𝑝1 − 𝑝2 dejando para más adelante las
pruebas de hipótesis para esta diferencia.
Intervalo de confianza para la diferencia 𝒑𝟏 − 𝒑𝟐
Cuando se trata de realizar inferencias acerca de la diferencia de dos proporciones poblacionales
𝑝1 − 𝑝2 , una estimación puntual para esta diferencia puede hacerse a partir del cálculo de un
valor de la variable 𝑃̅1 − 𝑃̅2 para dos muestras de tamaño 𝑛1 y 𝑛2 tomadas de las poblaciones
estudiadas. Cabe destacar que, si se trata de una estimación puntual, las muestras no necesitan
ser grandes siempre que sean aleatorias e independientes.
Un intervalo de confianza del (1 − 𝛼)100% para la diferencia 𝑝1 − 𝑝2 se construye a partir de
la propiedad que dice que la variable aleatoria
(𝑃̅1 −𝑃̅2 )−(𝑝1 −𝑝2 )
𝑍= 𝑝 1 𝑞 1 𝑝2 𝑞 2
~𝑁(0, 1)
√ 𝑛 +
1 𝑛 2
Donde los valores de Z quedan fijados por el nivel de confianza que se elija.
A partir de esta última expresión, y por un razonamiento semejante al utilizado para una sola
proporción llegamos a la siguiente expresión para el cálculo del intervalo de confianza
𝑝̅1 𝑞̅1 𝑝̅2 𝑞̅2 𝑝̅1 𝑞̅1 𝑝̅2 𝑞̅2
𝐶 [(𝑝̅1 − 𝑝̅2 ) − 𝑧√ 𝑛1
+ 𝑛2
≤ (𝑝1 − 𝑝2 ) ≤ (𝑝̅1 − 𝑝̅2 ) + 𝑧√ 𝑛1
+ 𝑛2
] =1−𝛼
Primer caso: 𝒑𝟏 − 𝒑𝟐 = 𝟎
Cuando analizamos las propiedades estadísticas de la diferencia de la variable aleatoria 𝑃̅1 − 𝑃̅2
vimos que su media o valor esperado es igual a 𝑝1 − 𝑝2 y su error estándar está dado por
𝑝1 𝑞1 𝑝2 𝑞2
√ 𝑛1
+ 𝑛2
. Además, si es posible contar con muestras grandes, la variable 𝑃̅1 − 𝑃̅2 tiene
distribución aproximadamente normal de probabilidad.
En la práctica, las proporciones poblacionales en general son desconocidas (por ello es necesario
realizar inferencias) y por lo tanto deben ser estimadas.
En consecuencia, el error estándar de 𝑃̅1 − 𝑃̅2 también debe ser estimado. La estimación
dependerá del tipo de hipótesis que se quiera probar.
Cuando se supone que 𝑝1 y 𝑝2 son iguales, se combinan los datos de las dos muestras para
obtener una estimación combinada de 𝑝1 = 𝑝2 = 𝑝 o proporción común de las dos poblaciones.
Tenemos así que si 𝑥1 es el número de elementos que presentan la característica que interesa
en la muestra tomada de una de las poblaciones, y si 𝑥2 es el número de elementos que
presentan la misma característica, pero en la segunda muestra tomada de la segunda población,
podemos realizar una estimación combinada de la proporción 𝑝 por medio de
𝑥1 +𝑥2
𝑝̂ =
𝑛1 +𝑛2
Donde 𝑞̂ = 1 − 𝑝̂ .
Lego, para probar la hipótesis nula de que las proporciones poblacionales son iguales el
estadístico de prueba es
(𝑃̅1 −𝑃̅2 )−0 𝑃̅1 −𝑃̅2
𝐸𝑝 = ̂𝑞
𝑝 ̂ 𝑝
̂𝑞̂
= 1 1
√𝑛 +𝑛 √𝑝̂𝑞̂(𝑛 +𝑛 )
1 2 1 2
𝐻0 : 𝑝1 − 𝑝2 = 0
𝐻𝑎 : 𝑝1 − 𝑝2 ≠ 0
El nivel de significación para la prueba es 0,05.
Como se supone que las proporciones poblacionales son iguales hay que calcular una estimación
de la proporción común 𝑝. Como ya se ha dicho, se la estima de la siguiente manera
𝑥 +𝑥 23+32
𝑝̂ = 𝑛1 +𝑛2 = 100+120 = 0,25
1 2
𝑃̅1 −𝑃̅2
Por lo tanto 𝑞̂ = 0,75. El estadístico de prueba tiene la forma 𝐸𝑝 = 1 1
.
√𝑝̂𝑞̂(𝑛 +𝑛 )
1 2
23 32
De acuerdo con los datos del problema, 𝑝̅1 = = 0,23 y por otro lado 𝑝̅2 = = 0,27.
100 120
Como 𝛼 = 0,05 los valores críticos del estadístico de prueba son 𝑧 = ±1,96.
Además, como −1,96 < 0,68 < 1,96 no se rechaza la hipótesis nula. Es decir, los datos
suministran evidencia estadística como para no rechazar la afirmación de que las proporciones
son iguales.
Segundo caso: 𝒑𝟏 − 𝒑𝟐 ≠ 𝟎
En este caso no se combinan los datos de la muestra para realizar una estimación del error
estándar de la variable 𝑃̅1 − 𝑃̅2 . Para probar la hipótesis acerca de la diferencia de las
proporciones poblacionales 𝑝1 − 𝑝2 el estadístico de prueba que se utiliza es
(𝑃̅1 −𝑃̅2 )−𝐷0
𝐸𝑝 = ̅1𝑞
𝑝 ̅1 𝑝
̅ 𝑞̅
~𝑁(0, 1)
√ 𝑛 + 2 2
1 𝑛 2
Es decir, este estadístico tiene distribución normal estándar de manera aproximada para
muestras grandes.
Ejemplo 12. Un especialista en política cree que la proporción de votantes del área A que van a
votar en las próximas elecciones excede en más de 0,05 a la proporción de votantes del área B
que votará en las mismas elecciones. Con el fin de ver si los hechos corroboran esta hipótesis el
analista realiza una encuesta entre los votantes del área A y del área B con los resultados que se
muestran en la tabla 8. Utilice una prueba de hipótesis apropiada para verificar la suposición del
analista.
Área Tamaño de la muestra Nº de personas que votarán
A 150 113
B 160 104
Tabla 8
Solución
113
De acuerdo con la tabla precedente se tiene que 𝑝̅1 = = 0,75 por lo tanto 𝑞̅1 = 0,25.
150
104
Por otro lado 𝑝̅2 = 160 = 0,65 por lo tanto, 𝑞̅2 = 0,35 aproximadamente.
Las hipótesis que contrastar son las siguientes
𝐻0 : 𝑝1 − 𝑝2 ≤ 0,05
𝐻0 : 𝑝1 − 𝑝2 > 0,05
20
Como 𝛼 = 0,05 los valores críticos del estadístico de son 𝑧 = 1,645. Teniendo en cuenta que
0,968 < 1,96 no se rechaza la hipótesis nula.
5. DISTRIBUCIÓN 𝑭 DE FISHER
Hemos analizado hasta aquí como construir intervalos de confianza y llevar delante pruebas de
hipótesis para la diferencia de medias y de proporciones poblacionales.
Es frecuente que un analista se encuentre en la situación en la que se requiera la comparación
de dos varianzas poblacionales, es decir, determinar si la variabilidad de una población de
observaciones difiere de la variabilidad de otra.
Para comparar las varianzas de dos poblaciones y para otros test que analizaremos más
adelante, necesitaremos un nuevo modelo de densidad de probabilidad, la distribución 𝐹 de
Fisher en honor al estadístico que la definió y desarrolló por primera vez.
Como veremos, esta distribución de probabilidad está relacionada con el estadístico 𝑆12 ⁄𝑆22 o
cociente de varianzas muestrales donde 𝑆12 y 𝑆22 son las varianzas muestrales calculadas a partir
de muestras aleatorias tomadas de las dos poblaciones.
Analizaremos cuales son las principales propiedades de la distribución 𝐹, luego veremos cómo
utilizarla para comparar varianzas poblacionales.
Como todo modelo de distribución de probabilidad, la distribución 𝐹 está definida por medio de
una fórmula.
La complejidad matemática de la expresión que define este modelo de distribución de
probabilidad no permite apreciar con claridad las propiedades de esta. Además, nosotros no le
daremos utilidad a la fórmula que define dicha distribución. Lo que si analizaremos son algunas
de sus características o propiedades más utilizadas.
Damos a continuación algunas de las características más importantes de este modelo y
posteriormente veremos cómo se las usa para realizar inferencias.
Si una variable aleatoria continua 𝑋 tiene distribución 𝐹 entonces 𝑥 ≥ 0. Es decir, si una
variable aleatoria tiene distribución 𝐹 de Fisher solo podrá tomar valores no negativos
(cero o positivos).
+∞
Como cualquier función de densidad de probabilidad ∫0 𝑓(𝑥)𝑑𝑥 = 1.
El gráfico de densidad de probabilidad de una variable aleatoria con distribución 𝐹 es
por lo general sesgado a derecha. En la figura 1 se muestra el gráfico de la densidad de
probabilidad de una variable con esta distribución de probabilidad.
𝑏
Pr(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫𝑎 𝑓(𝑥)𝑑𝑥 donde 𝑓(𝑥) es la función de densidad de Fisher.
Interpretamos el área bajo la curva de una distribución 𝐹 como la probabilidad asociada
con el intervalo comprendido entre dos valores específicos de la variable aleatoria.
Se disponen de tablas específicas para el cálculo de estas probabilidades.
21
Como una variable aleatoria con distribución 𝐹 se define a partir de un cociente, esta
distribución tiene asociados grados de libertad para el numerador y para el
denominador que además son sus parámetros.
Figura 1
Vemos a continuación un ejemplo que nos muestre como calcular probabilidades de una
variable que tiene esta densidad de probabilidad.
Ejemplo 13. Suponga una variable aleatoria 𝑋 con distribución 𝐹 de Fisher de 𝜈1 = 15 grados
de libertad para el numerador y 𝜈2 = 20 grados de libertad para el denominador. Hallar el valor
de 𝑋 tal que Pr(𝑋 ≤ 𝑥) = 0,95.
Ahora bien, ¿cómo se relaciona esta distribución de probabilidad con el cociente de varianzas
muestrales? La respuesta la damos en el siguiente teorema que enunciamos sin demostración.
Teorema 4. Sean 𝑆12 y 𝑆22 las varianzas muestrales calculadas a partir de muestras aleatorias
independientes de tamaños 𝑛1 y 𝑛2 tomadas de dos poblaciones distribuidas normalmente con
varianzas 𝜎12 y 𝜎22 respectivamente. Entonces, bajo estas condiciones, la variable aleatoria
𝑆 2 ⁄𝜎 2
𝑋 = 𝑆12 ⁄𝜎12
2 2
Como veremos, en esta situación se procede de una manera diferente a los casos anteriores.
𝑆2
El razonamiento es como sigue. Es posible demostrar que la razón de varianzas muestrales 𝑆12
2
𝜎12
proporciona la mejor estimación puntual del 𝜎22
entre las varianzas de dos poblaciones. Estos
parámetros en general son desconocidos y por ello hay que estimarlos.
Por otro lado, hay muchas situaciones prácticas en las cuales se quiere investigar si las varianzas
de dos poblaciones son iguales o no lo son.
𝜎2 𝑆2
Si son iguales, entonces la razón 𝜎12 será igual a 1. Por lo tanto, la razón 𝑆12 debería tener un valor
2 2
cercano a 1 para no desechar la hipótesis de que 𝜎12 = 𝜎22 .
𝑆12
Por otro lado, si es muy diferente de 1, nos inclinaríamos a poner en tela de juicio la igualdad
𝑆22
de las varianzas poblacionales.
𝑆2
En una situación práctica es muy difícil que el cociente 𝑆12 sea exactamente igual a 1. ¿Qué tan
2
diferente de 1 debe ser este cociente para dudar de la igualdad de las varianzas poblacionales?
Hay dos maneras de responder esta pregunta, mediante la construcción de intervalos de
confianza y mediante las pruebas de hipótesis para la razón de dos varianzas poblacionales,
temas que pasamos a desarrollar a continuación.
Intervalos de confianza para la razón 𝝈𝟐𝟏 ⁄𝝈𝟐𝟐
Podemos construir intervalos de confianza para la razón de varianzas 𝜎12 /𝜎22 de dos poblaciones
con distribución normal utilizando la distribución 𝐹 de Fisher.
Recordemos que si 𝑆12 y 𝑆22 son las varianzas muestrales calculadas a partir de muestras
aleatorias simples de tamaño 𝑛1 y 𝑛2 tomadas de dos poblaciones con distribución normal de
varianzas 𝜎12 y 𝜎22 respectivamente, entonces la razón (𝑆12 ⁄𝜎12 )⁄(𝑆22 ⁄𝜎22 ) tiene distribución F de
Fisher con 𝜐1 = 𝑛1 − 1 y 𝜐2 = 𝑛2 − 1 grados de libertad para el numerador y denominador
respectivamente.
Para construir un intervalo de confianza para la razón 𝜎12 /𝜎22 comenzamos planteando la
siguiente afirmación de probabilidad
𝑆 2 ⁄𝜎 2
Pr (𝐹1 ≤ 𝑆12 ⁄𝜎12 ≤ 𝐹2 ) = 1 − 𝛼
2 2
donde 𝐹1 y 𝐹2 son los valores de la distribución 𝐹 adecuada que tiene a la izquierda y a la derecha
respectivamente 𝛼 ⁄2 porciento del área total bajo la curva de la distribución.
Luego de un trabajo algebraico sencillo dentro del paréntesis podemos escribir la expresión
anterior de la siguiente manera
𝑆12 ⁄𝑆22 𝜎2 𝑆12 ⁄𝑆22
Pr ( 𝐹2
≤ 𝜎12 ≤ 𝐹1
) = 1−𝛼
2
Cuando sustituimos las varianzas muestrales por valores numéricos específicos en la expresión
anterior tendremos construido un intervalo del (1 − 𝛼)100% para la razón de varianzas
poblacionales. Tal expresión es
𝑠12 ⁄𝑠22 𝜎2 𝑠12 ⁄𝑠22
𝐶( 𝐹2
≤ 𝜎12 ≤ 𝐹1
) =1−𝛼
2
1
𝐹1 (𝜐 = 𝐹 (𝜐
1 ,𝜐2 ) 2 2 ,𝜐1 )
Hemos visto que si de dos poblaciones independientes, cada una con distribución normal,
𝑆12
tomamos muestras aleatorias de tamaño 𝑛1 y 𝑛2 , entonces la variable aleatoria 𝑆22
tiene
distribución de probabilidad 𝐹 con 𝜐1 = 𝑛1 − 1 y 𝜐2 = 𝑛2 − 1 grados de libertad para el
numerador y denominador respectivamente.
Este cociente de varianzas muestrales recibe el nombre de razón de varianzas y se simboliza de
la siguiente manera
𝑆2
𝑅𝑉 = 𝑆12
2
La razón de varianzas será utilizada como estadístico de prueba para los test de hipótesis para
el cociente de dos varianzas poblacionales.
Las hipótesis que pueden probarse son las siguientes:
𝐻0 : 𝜎12 ⁄𝜎22 = 1
𝐻𝑎 : 𝜎12 ⁄𝜎22 ≠ 1
En este caso se busca probar si las varianzas poblacionales son iguales. Se trata de una prueba
bilateral con regiones de rechazo en la cola superior e inferior de la distribución de probabilidad
del estadístico de prueba.
Otra posibilidad que pude darse es la siguiente:
𝐻0 : 𝜎12 ⁄𝜎22 ≤ 1
𝐻𝑎 : 𝜎12 ⁄𝜎22 > 1
Esta situación se presenta cuando queremos ver si hay elementos como para concluir que la
varianza de la primera población es mayor que la varianza de la segunda. Se trata de una prueba
unilateral derecha con región de rechazo en la cola superior de la distribución del estadístico de
prueba.
Finalmente puede presentarse la siguiente situación:
𝐻0 : 𝜎12 ⁄𝜎22 ≥ 1
𝐻𝑎 : 𝜎12 ⁄𝜎22 < 1
En este caso se trata de ver si hay elementos suficientes como para concluir que la varianza de
la primera población es menor que la varianza de la segunda población. Se trata de una prueba
unilateral izquierda con región de rechazo en la cola inferior de la distribución de probabilidad
del estadístico de prueba.
Como siempre, los tamaños de la región de rechazo están determinados por el nivel de
significación de la prueba.
Ejemplo 16. Un equipo de profesores administró una evaluación a una muestra aleatoria de
𝑛1 = 25 estudiantes del último año de una facultad y a otra muestra aleatoria independiente
de 𝑛2 = 21 estudiantes del último año de otra facultad. El equipo de profesores quiere saber,
entre otras cosas, si se podría obtener como conclusión que los dos grupos eran diferentes en
cuanto a la variabilidad de los puntajes. Los investigadores encontraron que las varianzas
muestrales eran 𝑠12 = 64 y 𝑠22 = 190. Eligieron llevar adelante una prueba de hipótesis. ¿A qué
conclusión llegarán los profesores a la luz de la información recolectada? Tome 𝛼 = 0,05.
Indique en qué condiciones es confiable la prueba realizada.