Documente Academic
Documente Profesional
Documente Cultură
LA PRUEBA BINOMIAL
Función y racionalización
Existen muchas poblaciones que son concebidas como compuestas de sólo dos clases.
Ejemplos de tales clases son: hombre y mujer; alfabeto y analfabeto; miembro y no
miembro; soltero y casado; internado y ambulatorio. Para tales casos, todas las posibles
observaciones de la población caerán en una de dos categorías discretas. Tal población
generalmente se denomina población binaria o población dicotómica
Supóngase que una población consta de sólo dos categorías o clases.
Entonces, cada observación (X) muestreada de la población puede tomar uno de dos
valores, dependiendo de la categoría muestreada. Podemos denotar los posibles valores
de la variable aleatoria usando cualquier par de valores, pero es conveniente denotar
cada resultado como 1o 0. Asumiremos posteriormente que la probabilidad de
muestrear un objeto de la primera categoría es p y la probabilidad de muestrear un
objeto de la otra categoría es q = l - p. Esto es,
P [X = l] = p y P [X - O] = l - p = q
Por ejemplo, de los registros oficiales podemos conocer que los votantes de cierta
ciudad están divididos por mitades entre los partidos republicano y demócrata. Pero una
muestra aleatoria de los votantes registrados en esa ciudad puede contener 47% de
demócratas y 53% de republicanos, o quizá 56% de demócratas y 44% de republicanos.
Tales diferencias entre los valores de la población y los observados se originan debido a
las fluctuaciones al azar o aleatorias en las observaciones. No debemos sorprendernos
por desviaciones pequeñas de los valores poblacionales; sin embargo, desviaciones
grandes -aunque posibles- son poco probables.
Método
Dónde:
Esto es, la probabilidad de obtener dos o menos seises es la suma de las tres
probabilidades. Si usamos la ecuación para determinar estas probabilidades, tenemos
Media - varianza
En una distribución binomial denotada por B (n, p), donde:
µ =np
La varianza de la variable aleatoria X, al ser ésta de tipo discreto, se calcula como:
ơ=npq
Ejercicio 1
Un agente de seguros vende pólizas a cinco personas de la misma edad y que disfrutan
de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas
condiciones viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos 30
años, vivan:
Ejercicio 2
Un examen consta de 10 preguntas a las que hay que contestar SI o No. Suponiendo que
a las personas que se le aplica no saben contestar a ninguna pregunta y, en
consecuencia, contestan al azar, hallar:
Datos:
Ejercicio 3
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de
los lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura:
b) ¿Y cómo máximo 2?
Ejercicio 4
Un laboratorio afirma que una droga causa efectos secundarios en una proporción de 3
de cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 5
pacientes a los que aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?
c) ¿Cuál es el número medio de pacientes que espera laboratorio que sufran efectos
secundarios si elige 100 pacientes al azar?
Ejercicio 5
Un laboratorio afirma que una droga causa efectos secundarios en una proporción de 3
de cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 5
pacientes a los que aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?
c) Cuál es el número medio de pacientes que espera laboratorio que sufran efectos
secundarios si elige 100 pacientes al azar?
Ejercicio 6
Ejercicio 7
Cada muestra de aire tiene 10% de posibilidades de contener una molécula rara
particular. Suponga que las muestras son independientes con respecto a la presencia de
la molécula rara. Encuentre la probabilidad de que en las siguientes 18 muestras,
exactamente 2 contengan la molécula rara.
Sea X= número de muestras de aire que contiene la molécula rara en las siguientes 18
muestras analizadas. Entonces X es una variable aleatoria binomial con p=0.01 y n=18.
Por lo tanto:
Por lo tanto
Ejercicio 8
Si de seis a siete de la tarde se admite que un número de teléfono de cada cinco está
comunicando, ¿Cuál es la probabilidad de que, cuando se marquen 10 números de
teléfono elegidos al azar, solo comuniquen dos?
Ejercicio 9
Ejercicio 10
Un examen consta de 6 personas con 4 posibles respuestas cada una, de las que son una
de ellas es correctas. Un estudiante que no había preparado la materia responde
completamente al azar marcando una respuesta aleatoriamente. Calcular la probabilidad
de que acierte 4 o más preguntas.
Función
Método
Para aplicar la prueba ji cuadrada, primero debemos presentar los datos (frecuencias) en
una tabla r X k donde los datos en cada columna corresponden a las frecuencias en cada
una de las r categorías de respuesta para cada uno de los k grupos o muestras diferentes.
La hipótesis nula es que las k muestras de frecuencias provienen de la misma población
o de poblaciones idénticas. Esta hipótesis, de que las k poblaciones no difieren entre sí,
puede evaluarse aplicando las ecuaciones
Dónde:
Procedimiento
1. Éstos son los pasos que hay que seguir para la aplicación de la prueba ji
cuadrada para k muestras o grupos independientes:
2. Arregle las frecuencias observadas en una tabla de contingencia r X k, utilizando
las k columnas para las muestras o grupos.
3. Determine la frecuencia esperada según H0 para cada celdilla encontrando el
producto de los totales marginales comunes a la celdilla y dividiendo este
producto entre N. Vale decir, encuentre las frecuencias esperadas E;j = R1 C/N.
(N es la sumatoria de cada uno de los totales marginales y representa el número
total de observaciones independientes. Cuando se "inflan" los valores de N
debido a múltiples observaciones de cada sujeto, esto invalida la prueba.) Si las
frecuencias esperadas son pequeñas, combine categorías tal como se muestra en
la siguiente sección.
4. Calcule X2 utilizando las ecuaciones dadas. Determine los grados de libertad gl
= (r - 1) (k - 1).
5. Determine la significación de la X2 observada.
6. Si se rechaza H0, el valor global de X2 puede ser dividido, utilizando la
ecuación para determinar dónde se encuentran (en la tabla de contingencia
original) las diferencias en la variable medida en los distintos grupos. Cada uno
de los valores de X2 de partición se distribuyen como ji cuadrada con gl = 1,
conforme incrementa el tamaño de N. Después de dividir la tabla, pueden
analizarse los residuos (diferencias entre los valores esperados y los valores
observados) mediante la ecuación.
Si los requisitos no son cubiertos por los datos de acuerdo con la forma en que se
recolectaron y no fue posible contar con una muestra grande, el investigador debe
combinar categorías para incrementar las EiJ en varias celdillas. Sólo después de
combinar categorías y después de que menos del 20 % de las celdillas tengan
frecuencias esperadas menores que cinco, y ninguna celdilla tenga una frecuencia
esperada menor que uno, el investigador puede interpretar útilmente los resultados de la
prueba ji cuadrada. La combinación de las categorías debe hacerse juiciosamente.
Esto es, los resultados de la prueba estadística pueden no ser interpretables si las
categorías han sido combinadas caprichosamente. Las categorías que son combinadas
deben tener alguna propiedad en común o identificación mutua, por si la interpretación
del resultado de la prueba, después de haber combinado los renglones o columnas, tiene
cierta utilidad. El investigador debe ser precavido contra la necesidad de combinar
categorías si se utiliza una muestra suficientemente grande.
La prueba ji cuadrada es insensible a los efectos de orden, Así, cuando se ordenan las
categorías de respuesta o los grupos (o ambos), la prueba ji cuadrada puede no ser la
mejor. Cochran (1 954) ha presentado métodos que fortalecen la prueba ji cuadrada
común cuando H0 es verdadera contra alternativas específicas.
Potencia
Ejercicio 1
¿Es lo mismo tomar somníferos o placebos para dormir bien o mal en este grupo de
enfermos?
1) Planteamiento de hipótesis
3) Estadístico de prueba
2
(𝑂𝑖 − 𝑂𝑒 )2
𝜒 =∑
𝑂𝑒
4) Regla de decisión
𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
Frecuencias esperadas
Grados de libertad = (2 – 1) (2 – 1) = 1 x 1 = 1
6) Decisión
Ejercicio 2
Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de sus
destinos en una ciudad grande forman una distribución normal con una desviación
estándar s=1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral sea mayor que 2.
𝑛 = 17
𝑠2 = 2
𝑔𝑙 = 𝑛 − 1 = 16
Ejercicio 3
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
población normal con varianza σ^2=6, tenga una varianza muestral mayor que 9.1
Primero se procederá a calcular el valor del chi-cuadrado:
n=25
s^2=9.1
gl=n-1=24
Ejercicio 4
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
población normal con varianza σ^2=6, tenga una varianza muestral entre 3.462 y
10.745.
Se calcularán dos valores de chi-cuadrada:
𝑛 = 25 𝑛 = 25
𝑠 2 = 3.462 𝑠 2 = 10.745
𝑔𝑙 = 𝑛 − 1 = 24 𝑔𝑙 = 𝑛 − 1 = 24
(𝑛 − 1). 𝑠 2 (𝑛 − 1). 𝑠 2
𝜒2 = 𝜒2 =
𝜎2 𝜎2
(25 − 1)(3.462) (25 − 1)(10.745)
= =
(6)2 (6)2
= 13.847 = 42.98
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al
buscar el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da
un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se
resta el área de 0.95 menos 0.01 quedando 0. Por lo tanto:
P(3.462 ≤s^2≤ 10.745) = 0.94
Ejercicio 5
1) Planteamiento de hipótesis
3) Estadístico de prueba
(𝑂𝑖 − 𝑂𝑒 )2
𝜒2 = ∑
𝑂𝑒
4) Regla de decisión
𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
Frecuencias esperadas
2
(10 − 20,51)2 (24 − 13,49)2 (282 − 271,49)2 (168 − 178,51)2
𝜒 = + + +
20,51 13,49 271,49 178,51
𝜒 2 = 5,39 + 8,19 + 0,41 + 0,62 = 14,61
Grados de libertad = (2 – 1) (2 – 1) = 1 x 1 = 1
6) Decisión
Ejercicio 6
El parque del barrio se utiliza para llevar a los perros a pasear. Se observa el tamaño de
los perros a distintas horas del día. La siguiente tabla muestra el número de perros
presentes en el parque en tres momentos distintos del pasado domingo, clasificados
según su tamaño.
1) Planteamiento de la hipótesis
Ho: No existe diferencia significativa en el número de perros presentes en un parque
en tres momentos distintos de acuerdo a su tamaño.
Ha: Si existe diferencia significativa en el número de perros presentes en un parque
en tres momentos distintos de acuerdo a su tamaño.
2) Nivel de significación α = 0.05
3) Estadístico de prueba
2
(𝑂𝑖 − 𝑂𝑒 )2
𝜒 =∑
𝑂𝑒
4) Regla de decisión
𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
(9 − 13)2 (18 − 15)2 (21 − 20)2 (11 − 8)2 (6 − 9)2 (13 − 13)2
2
𝜒 = + + + + +
13 15 20 8 9 13
2 2 2
(7 − 6) (8 − 8) (9 − 10)
+ + +
6 8 10
𝜒 2 = 4,33
6) Decisión
Ejercicio 7
En un estudio para determinar la preferencia por determinados sabores de helados en
diferentes regiones del país, se recopilaron los siguientes datos. (Frecuencias
observadas).
Sabor del
Costa Sierra Oriente Total
helado
Vainilla 86 44 70 200
Chocolate 45 30 50 125
Fresa 34 6 10 50
Mora 85 20 20 125
Total 250 100 150 500
1) Planteamiento de la hipótesis
Ho: No existe diferencia significativa en la preferencia por determinados sabores
de helados de acuerdo a las diferentes regiones del país.
Ha: Si existe diferencia significativa en la preferencia por determinados sabores
de helados de acuerdo a las diferentes regiones del país.
3) Estadístico de prueba
2
(𝑂𝑖 − 𝑂𝑒 )2
𝜒 =∑
𝑂𝑒
4) Regla de decisión
𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
Sabor del
Costa Sierra Oriente Total
helado
Vainilla 100 40 60 200
Chocolate 62,5 25 37,5 125
Fresa 25 10 15 50
Mora 62,5 25 37,5 125
Total 250 100 150 500
(86 − 100)2 (44 − 40)2 (70 − 60)2 (45 − 62,5)2 (30 − 25)2
𝜒2 = + + + +
100 40 60 62,5 25
(50 − 37,5)2 (34 − 25)2 (6 − 10)2 (10 − 15)2
+ + + +
3,5 25 10 15
(85 − 62,5)2 (20 − 25)2 (20 − 37,5)2
+ + +
62,5 25 37,5
𝜒 2 = 37,87
6) Decisión
Ejercicio 8
Un centro comercial compró y plantó 720 bulbos de tulipán de cuatro colores. Por
desgracia, no todos florecieron. El centro comercial desea determinar si los fracasos
eran independientes del color antes de comprar más bulbos de tulipán
1) Planteamiento de la hipótesis
Ho: No existe diferencia significativa en los florecimientos de tulipanes de
acuerdo a los diferentes colores que estos poseen.
Ha: Si existe diferencia significativa en los florecimientos de tulipanes de
acuerdo a los diferentes colores que estos poseen.
4) Regla de decisión
𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
6) Decisión
Ejercicio 9
Los aficionados a las carreras de caballos sostienen que en una carrera alrededor de una
pista circular, los caballos tienen ventajas significativas acumuladas al ser colocados en
ciertas posiciones. Cualquier posición del caballo se asigna en la línea de salida. La
posición 1 es la más cercana al carril del interior de la pista; la posición 8 está en el
extremo, más alejada del carril en una carrera de ocho caballos. Podemos probar el
efecto de la posición analizando los resultados de la carrera, proporcionados de acuerdo
con la posición, durante el primer mes de la temporada, en una pista circular en
particular.
1) Formulación de hipótesis.
H0: No existe diferencia en el número esperado con el observado.
Ha: Las frecuencias teóricas no son iguales.
2) Nivel de significancia: α=0.05
3) Estadístico de prueba
(𝑂𝑖 − 𝑂𝑒 )2
𝜒2 = ∑
𝑂𝑒
4) Cálculos
(29 − 18)2 (19 − 18)2 (18 − 18)2 (25 − 18)2 (17 − 18)2
𝜒2 = + + + +
18 18 18 18 18
(10 − 18)2 (15 − 18)2 (11 − 18)2
+ + + = 16.3
18 18 18
Como: 𝑃(𝜒 2 ≥ 16.3), 𝑐𝑜𝑛 𝑔𝑙 = 𝑘 − 1 = 8 − 1 = 7 está entre 0.02<p<0.05, no
podemos rechazar H0 en ese nivel de significación.
Podría parecer que son necesarios más datos antes de que se llegue a cualquier
conclusión definitiva concerniente a 𝐻𝑎
Ejercicio 10
𝛼 = 0.01
𝑔𝑙 = 𝑘 − 1 = 8 − 1 = 7
Formulación de la hipótesis
Procedimiento Rachas
Símbolos
r = número de corridas
2𝑛1 𝑛2
𝝁𝒓 = +1
(𝑛1 + 𝑛2 )
Elección de la distribución
Interpretación de resultados
Ejercicio 1
Suponga que se seleccionan los empleados para un programa de entrenamiento. Si la
selección no depende de si el empleado es de sexo masculino (m) o femenino (f), se
esperaría que el género fuera un evento aleatorio. Sin embargo, si se detecta algún
patrón en el género, se puede asumir que la aleatoriedad está ausente y que la selección
se hizo, por lo menos en parte, con base en el género de un trabajador. Si existe un
número inusualmente grande o inusualmente pequeño de rachas, se sugiere un patrón.
Así, por ejemplo
_____________________________________________
mmm ffffff mmm
_________________________________________
1 2 3
_____________________________________________
Tres rachas existen en esta muestra. Tres hombres, seguidos de seis mujeres y luego tres
hombres. Aparentemente existe ausencia de aleatoriedad. Consideremos ahora que el
orden de selección es
_______________________________________
m f m f m f m f m f m f m f m f
_______________________________________
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
_______________________________________
De nuevo, parece existir un patrón que produce un número inusualmente grande de 16
rachas independientes.
Detección de un patrón. Si se presentan muy pocas o demasiadas rachas, puede estar
ausente la aleatoriedad.
Un conjunto de hipótesis para probar es:
Las selecciones parecen más aleatorias porque no existe patrón evidente. Se nota que n1
= 7 es el número de hombres y n2 = 5 es el número de mujeres.
Ejercicio 2
Se asumen niveles de producción diarios en una mina de carbón seleccionada para un
estudio estadístico, y éstos son, 31, 57, 52, 22, 24, 59, 25, 29, 27, 44, 43, 32, 40, 37, y
60 toneladas. La mediana de 37 puede utilizarse como valor de referencia. Las
observaciones caen o por arriba (A) o por abajo (B) de 37, produciendo 8 rachas de:
___________________________________________________
31 57 52 22 24 59 25 29 27 44 43 32 40 60
___________________________________________________
B A A B B A B B B A A B A A
1 2 3 4 5 6 7 8
___________________________________________________
Con n1=7 para B y n2 = 7 para A, la tabla M revela valores críticos de 3 y 13 rachas.
Debido a que hay 8 rachas, se asume que hay aleatoriedad y no se rechaza la hipótesis
nula.
Ejercicio 3
En un estudio de la dinámica de la agresión en niños pequeños, un investigador observó
pares de niños en una situación de juego controlada.' La mayoría de los 24 niños que
sirvieron como sujetos en el estudio provenían de la misma guardería y, por tanto,
jugaban juntos diariamente. Ya que el observador fue capaz de ingeniarse para observar
sólo dos niños en cualquier día, estaba interesado en que podrían haberse introducido
sesgos en el estudio por discusiones entre aquellos niños que ya habían servido como
sujetos y aquellos que sirvieron posteriormente. Si tales discusiones tenían algún efecto
en el nivel de agresión en las sesiones de juego, este efecto podría mostrarse corno una
carencia de aleatoridad en las puntuaciones de agresión en el orden en que fueron
colectadas. Después de concluido el estudio, la aleatoriedad de la secuencia de
puntuaciones fue probada al convertir la puntuación de agresión de cada niño a un signo
más o un signo menos, dependiendo de si se encontraba por arriba o por abajo de la
mediana del grupo, y aplicando entonces la prueba de una muestra de series para la
secuencia observada de signos "más" y signos "menos".
1. Hipótesis nula. H0: los signos "más" y los signos "menos" ocurren en un orden
aleatorio.
Esto es, la hipótesis nula consiste en que las puntuaciones de agresión ocurren
aleatoriamente a través del experimento por arriba y por debajo de la mediana.
H1: El orden de los signos " más" y " menos" depende de la aleatoriedad.
2. Prueba estadística. Ya que la hipótesis concierne a la aleatoriedad de una
secuencia simple de observaciones, se elige la prueba de una muestra de series.
3. Nivel de significación. Sea a = 0 .05 y N el número de sujetos = 24. Ya que las
puntuaciones estarán caracterizadas como un signo "más" o un signo "menos",
dependiendo de si se encuentran por arriba o por abajo de la puntuación mediana
en el grupo, m = n = 1 2.
4. Distribución muestral. En la tabla F de Anexos se proporcionan los valores
críticos de r de la distribución muestral.
5. Región de rechazo. Puesto que H1 no predice la dirección de la desviación de la
aleatoriedad, se usó una prueba bidireccional. Ya que m = n = 1 2, la referencia
de la tabla F muestra que H0 podría ser rechazada en el nivel 0.05 de
significación, si la r observada es igual o menor que 7 o igual o mayor que 1 9.
6. Decisión. En la tabla 3. 5 se muestran las puntuaciones de agresión para cada
niño en el orden en que fueron obtenidas. La mediana del conjunto de
puntuaciones es 25.5. En la tabla 3.5, todas las puntuaciones que se encuentran
por debajo de la mediana están designadas por un signo "menos"; todas las
puntuaciones que se encuentran por arriba de la mediana están denotadas por un
signo "más". En la columna que muestra los signos + y - , se puede ver
rápidamente que ocurrieron 1 0 series en el conjunto de observaciones, esto es, r
= 10. La referencia de la tabla de Anexos I revela que r = 1 0 para m = n = 1 2,
no se encuentra e n la región de rechazo.
Así, no podemos rechazar la hipótesis de que la serie de observaciones ocurrió
en un orden aleatorio.
Ejercicio 4
1.-En una escuela 12 niños y 12 niñas de 4 años de edad observados durante dos
sesiones de juego de 15 minutos, el juego fue calificado por incidencia y grado de
agresión. Con estos puntajes es posible probar la hipótesis que hay diferencias sexuales
en la cantidad de agresión exhibida.
Niños(h) Niñas(m)
86 55
69 40
72 22
65 58
113 16
65 7
118 9
45 16
141 26
104 36
41 20
50 15
7 9 15 16 16 20 22 26 36 40
m m m m m m m m m m
41 45 50 55 58
h h h h h
65 65 69 72 86 104 113 118 141
h h h h h h h h h
Se colocan los puntajes n1+ n2 en una sola serie ordenada se determina el número de
rachas r=7
HIPÓTESIS
Ho: La incidencia y el grado de agresión son los mismos en los niños de cuatro años de
ambos sexos
Ha: Los niños y niñas de cuatro años de edad muestran diferencias en la incidencia y el
grado de agresión
NIVEL DE SIGNIFICACIÓN
REGLA DE DECISIÓN
La tabla muestra que para los valores de n1=12 y n2=12, una r de 7 es significativa al
nivel de 0.05.
Ejercicio 5
1. Planteamiento de hipótesis
Ho: el orden de hombres y mujeres en la fila es aleatorio.
Ha: el orden de hombres y mujeres en la fila no es aleatorio.
2. Prueba estadística. Se elige la prueba de una muestra de series ya que la
hipótesis concierne a la aleatoriedad en una secuencia de observaciones. Puesto
que el tamaño de la muestra es grande, se usa una prueba para muestras grandes.
3. Estadístico de prueba
α= 0,05
4. Distribución muestral Para muestras grandes, los valores de z cuando H0 es
verdadera, están distribuidos de manera aproximada normalmente con media 0 y
desviación estándar l
5. Cálculos
r= 35
n= 50
2𝑚𝑛
𝜇𝑟 = +1
𝑁
2(30)(20)
𝜇𝑟 = +1
50
𝝁𝒓 = 25
2𝑚𝑛(2𝑚𝑛 − 𝑁)
𝜎𝑟 = √
𝑁 2 (𝑁 − 1)
2(30)(20)(2(30)(20)) − 50)
𝜎𝑟 = √
(50)2 (50 − 1)
𝝈𝒓 = 3,36
𝑟 − 𝜇𝑟
𝑧=
𝜎𝑟
35 − 25
𝑧=
3,36
𝒛 = 2,98
1,96= 2 colas
2,98 Rechazo Ho
6. Decisión
Ya que 2.83 es mayor que el valor crítico de z (1.96), podemos rechazar la hipótesis de
aleatoriedad. Con el 95% de confianza el orden de hombres y mujeres en la fila no es
aleatorio.
LA PRUEBA DE MACNEMAR
Antes/Después - +
- a b
+ c d
Por tanto, b+c es el número total de elementos cuyas respuestas han cambiado, y son los
únicos que intervienen en el contraste. La hipótesis nula es que el ''tratamiento'' no
induce cambios significativos en las respuestas, es decir, los cambios observados en la
muestra se deben al azar, de forma que es igualmente probable un cambio de + a - que
un cambio de - a +. Así pues, si H0 es cierta, de los b+c elementos cuya respuesta ha
cambiado es de esperar que (b+c)/2 hayan pasado de + a -, y (b+c)/2 hayan pasado de -
a +. En otras palabras, si H0 es cierta, la frecuencia esperada en las correspondientes
celdas es (a+b)/2.
k = número de celdas
Para contrastar la significación de los cambios interesan sólo las celdas que recogen
cambios, por tanto el estadístico puede expresarse como
La hipótesis nula, de que ambos tipos de cambio son igualmente probables, se rechaza
si el valor del estadístico se encuentra en la región crítica.
Ejercicio 1
Planteamiento de la hipótesis
Ho: Las diferencias que se observan en las frecuencias de cambio por el lavado
de manos se deben al azar.
Ha: El lavado de manos, como medida preventiva y factor de higiene personal,
presenta cambios significativos de enfermedad diarreica en los empleados que
asisten al comedor de la fábrica en estudio.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Resultado de la contingencia 2 X 2.
Decisión.
En razón de que el valor de X2 calculado tiene una probabilidad menor que 0.05, cae en
el nivel de significancia, por lo tanto, se acepta Ha y se rechaza Ho. Es decir que
El lavado de manos ejerció significativos cambios en la enfermedad diarreica de los
empleados de la fábrica, lo cual significa que la higiene personal deficiente contribuye
de manera notoria en la frecuencia del proceso intestinal, causa del ausentismo.
Ejercicio 2
En un debate televisivo a nivel nacional entre 2 candidatos presidenciales, se toma una
muestra de 100 personas a quienes se les pregunta sobre sus candidatos antes del debate
y 84 resultaron convencidos por el candidato demócrata y 16 al candidato republicano.
Después del debate las mismas 100 personas son vueltas a preguntar acerca de sus
preferencias, y del grupo de personas que favorecieron al demócrata cambian
exactamente ¼ de ellos su manera de pensar y también ¼ de los republicanos.
Ejercicio 3
Se desea saber si los niños que lleguen a una guardería tienen la misma inclinación por
relaciones con otros niños o con un adulto el primer día de clases que un mes después.
Planteamiento de hipótesis
Ho: los niños tienen la misma inclinación de relacionarse con otros niños
Ha: los niños no tienen la misma inclinación de relacionarse con otros niños.
Grados de libertad: como es una tabla de 2x2 tenemos un grado de libertad de 1
Estadístico de prueba: McNemar
Regla de decisión;
Si X2 cal es> que X2tab se rechaza la Ho.
X2 de tablas es mayor que 4.5 con una P<0.025 nos da 5.02 por lo que se rechaza la Ho
por lo tanto los niños muestran una tendencia significativa a cambiar su preferencia por
relacionarse con otros niños conforme pasa el tiempo.
Ejemplo 4
Como ejemplo, que se quiere analizar la asociación entre sexo y opinión sobre el
divorcio (favorable o desfavorable, sí, no) en personas casadas. Se ha llevado a cabo
una encuesta en la que cincuenta parejas han sido entrevistadas a fin de evitar la
influencia de otras variables que nunca se incluyen en el análisis (situación económica,
edad, clase social, etc. .).
Planteamiento de hipótesis
Ho: si existe relación entre sexo y opinión sobre el divorcio en las personas casadas.
Ha: no tienen ninguna relación entre sexo y opinión sobre el divorcio en las personas
casadas.
Regla de decisión:
Si X2 cal es > que X2tab se rechaza la Ho
Calculo:
La prueba de los signos permite contrastar la hipótesis de que las respuestas a dos
''tratamientos'' pertenecen a poblaciones idénticas. Para la utilización de esta prueba se
requiere únicamente que las poblaciones subyacentes sean contínuas y que las
respuestas de cada par asociado estén medidas por lo menos en una escala ordinal.
Para realizar el contraste se hallan los signos (+ o -) de las diferencias no nulas entre las
respuestas de los dos componentes de cada par y se cuenta cuántas son positivas, S+, y
cuántas negativas, S-. Si H0 es cierta, es de esperar que aproximadamente la mitad de
las diferencias sean positivas y la otra mitad negativas.
Ejercicio 1
Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de llantas
regulares con cinturón mejora la economía de combustible. Se equipan 16 automóviles
con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de
conductores, se equipan los mismos autos con llantas regulares con cinturón y se
manejan una vez más por el recorrido de prueba. Se registra el consumo de gasolina, en
kilómetros por litro, de la siguiente manera:
Llantas con
Automóvil Llantas radiales
cinturón
1 4.2 4.1
2 4.7 4.9
3 6.6 6.2
4 7.0 6.9
5 6.7 6.8
6 4.5 4.4
7 5.7 5.7
8 6.0 5.8
9 7.4 6.9
10 4.9 4.9
11 6.1 6.0
12 5.2 4.9
13 5.7 5.3
14 6.9 6.5
15 6.8 7.1
16 4.9 4.8
¿Se puede concluir en el nivel de significancia de 0.05 que los autos equipados con
llantas radiales obtienen mejores economías de combustible que los equipados con
llantas regulares con cinturón?
Planteamiento de hipótesis
Regla de decisión:
Se procede a realizar las diferencias entre de los kilómetros por litro entre llantas
radiales y con cinturón:
1 4.2 4.1 +
2 4.7 4.9 -
3 6.6 6.2 +
4 7.0 6.9 +
5 6.7 6.8 -
6 4.5 4.4 +
7 5.7 5.7 0
8 6.0 5.8 +
9 7.4 6.9 +
10 4.9 4.9 0
11 6.1 6.0 +
12 5.2 4.9 +
13 5.7 5.3 +
14 6.9 6.5 +
15 6.8 7.1 -
16 4.9 4.8 +
Al observar las diferencias se ve que sólo existe una n=14, ya que se descartan los
valores de cero. Se tiene r+ = 11
Decisión
Como 2.14 > 1.645 se rechaza H0 y se concluye con un nivel de significancia de 0.05
las llantas radiales mejoran la economía de combustible.
Ejercicio 2
Un analista de mercado desea medir la efectividad de una campaña promocional del
producto de su empresa. Antes de la campaña, selecciona 12 tiendas minoristas y
registra las ventas del mes. Durante el segundo mes se termina la campaña promocional
y se registran de nuevo las ventas. La Tabla 1.3 muestra los niveles de ventas, junto con
el signo algebraico que resulta cuando las ventas del segundo mes se restan de las del
primer mes.
1 $4200 $4000 +
2 $5700 $6000 -
3 $3800 $3800 0
4 $4900 $4700 +
5 $6300 $6500 -
6 $3600 $3900 -
7 $4800 $4900 -
8 $5800 $5000 -
9 $4700 $4700 0
10 $5100 $5200 -
11 $8300 $7200 +
12 $2700 $3300 -
Se desea probar la hipótesis de que la promoción incrementó las ventas con un nivel de
significancia del 5%. Esta es una prueba de extremo derecho, como se muestra
enseguida:
H0: m p
H1: m > p
Pregunta: ¿Qué haría que se rechazara la hipótesis nula?
1) un número significativamente grande de signos menos
2) un número significativamente pequeño de signos más
Este valor de 0.3770 es la probabilidad de obtener seis o más signos menos (o cuatro o
menos signos más) si la probabilidad de ocurrencia de cualquier signo es de = 0.5. Se
nota que si el número de signos menos fuera inusitadamente grande, se rechazaría la
hipótesis nula. Sin embargo, 6 no es un número grande. La probabilidad de su
ocurrencia es mayor que un de 0.5%, el evento de 6 signos menos no se considera
grande, y la hipótesis nula de que H0: m p no se rechaza, por lo tanto no se puede
considerar que la promoción haya sido exitosa.
Ejercicio 3
Un restaurante italiano cercano a un campus universitario está considerando la
posibilidad de utilizar una nueva receta para hacer la salsa que echa a las pizzas. Se
elige una muestra aleatoria de ocho estudiantes y se pide a cada uno que valore en una
escala de 1 a 10 su opinión sobre la salsa original y sobre la salsa propuesta. La Tabla
15.1 muestra las valoraciones obtenidas en la comparación; los números más altos
indican que gusta más el producto. ¿Indican los datos una tendencia general a preferir la
nueva salsa a la original?
Ejercicio 4
Una empresa que produce baterías, afirma que la vida útil media de las baterías es
mayor a 250. Con un nivel de significancia probar que
+ - - + + - + -
+ - + + - + + -
+ + - + + - + +
𝐻0 : 𝜇 ≤ 250.
𝐻𝑎 : 𝜇 > 250
𝑋 − 𝑁𝑝
𝑍=
√𝑁𝑝𝑞
𝑋 = 15 − 0.5 = 14.5
14.5 − [(24)(0.5)]
𝑍= = 1.02
√(24)(0.5)(0.5)
Se acepta la 𝐻0 .
Al nivel de confianza del 95% se dice la vida útil promedio de las baterías es
menor o igual a 250.
Ejercicio 5
71 67 55 64 82 66 74 58 79 61
78 46 84 83 72 54 78 86 48 52
67 93 70 43 70 73 57 64 60 83
73 40 78 70 64 86 76 62 95 66
+ + - - + 0 + - + -
+ - + + + - + + - -
+ + + - + + - - - +
+ - + + - + + - + 0
𝐻0 : 𝜇 = 66
𝐻𝑎 : 𝜇 ≠ 66
𝑋 − 𝑁𝑝
𝑍=
√𝑁𝑝𝑞
𝑁𝑝 = (38)(0.5) = 19
23 − [(38)(0.5)]
𝑍= = 1.14
√(38)(0.5)(0.5)
Se acepta la 𝐻0 .
Al nivel de confianza del 95% se dice la mediana de las calificaciones de todos los
estudiantes es de 66.
LA PRUEBA DE WILCOXON
Cuando se trata de variables medibles en por lo menos una escala ordinal y pueden
suponerse poblaciones continuas la prueba no paramétrica más potente es la de
Wilcoxon.
La hipótesis nula del contraste postula que las muestras proceden de poblaciones con la
misma distribución de probabilidad; la hipótesis alternativa establece que hay
diferencias respecto a la tendencia central de las poblaciones y puede ser direccional o
no.
El contraste se basa en el comportamiento de las diferencias entre las puntuaciones de
los elementos de cada par asociado, teniendo en cuenta no sólo el signo, sino también la
magnitud de la diferencia.
Ejercicio 1
Se realizó un estudio comparativo en el cual se evaluó la efectividad de dos métodos,
uno tradicional y uno moderno de enseñanza del álgebra. En ese estudio 14 individuos
fueron extraídos al azar de la población de interés y se formaron 7 pares en base a su
coeficiente intelectual. Los miembros de cada par fueron asignados al azar a uno de los
dos métodos de enseñanza, y posteriormente ambos grupos fueron instruidos durante 3
semanas. Todos los estudiantes rindieron el mismo examen al final del período de
instrucción y los resultados obtenidos fueron los siguientes:
Planteamiento de hipótesis
H0; µ= 1.8
H1; µ ≠ 1.8
Se procederá a efectuar las diferencias y a poner rango con signo a los datos.
2.2 0.4 7
0.9 -0.9 10
1.3 -0.5 8
2.0 0.2 3
1.6 -0.2 3
1.8 0 Se anula
2.0 0.2 3
1.2 -0.6 9
1.7 -0.1 1
Regla de decisión
Para una n = 10, después de descartar la medición que es igual a 1.8, la tabla A.16
muestra que la región crítica es w 8.
Cálculos
w+ = 7 + 3 + 3 = 13
w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42
Decisión
Ejercicio 3
Con Sin
problemas problemas
Par
de de
muestra muestra
1 531 509
2 621 540
3 663 688
4 579 502
5 451 424
6 660 683
7 591 568
8 719 748
9 543 530
10 575 524
La prueba de rango con signo también se puede utilizar para probar la hipótesis nula
1- 2 = d0. En este caso las poblaciones no necesitan ser simétricas. Como con la prueba
de signo, se resta d0 de cada diferencia, se clasifican las diferencias ajustadas sin
importar el signo y se aplica el mismo procedimiento.
En este caso d0 = 50, por lo que se procede a calcular las diferencias entre las muestras y
luego restarles el valor de 50. Se representara con 1 y 2 la calificación media de
todos los estudiantes que resuelven el examen en cuestión con y sin problemas de
muestra, respectivamente.
Planteamiento de hipótesis
H0; 1 - 2 = 50
H1; 1 - 2 < 50
Regla de decisión
Cálculos
Con Sin
problemas problemas di –
Par di Rangos
de de d0
muestra muestra
2 621 540 81 31 6
-
3 663 688 -75 9
25
-
6 660 683 -73 8
23
-
8 719 748 -79 10
29
10 575 524 51 1 1
w+ = 6 + 3.5 + 1 = 10.5
Decisión
Como 10.5 < 11 se rechaza H0 y se concluye con un nivel de significancia de 0.05 los
problemas de muestra, en promedio, no aumentan las calificaciones de registro de
graduados en 50 puntos.
Ejercicio 4
Una Escala de Inteligencia, en la que pueden obtenerse valores de 0 a 8, arroja
puntuaciones que se distribuyen normalmente N(4,l). Para confirmarlo, pasamos la
Escala a una muestra de 10 sujetos, obteniendo los resultados que aparecen a
continuación. ¿Podemos decir que estos resultados confirman la distribución normal en
la población?
Puntuaciones: 1 4 6 5 3 2 5 6 4 7
Planteamiento de hipótesis
Estadístico de contraste
El siguiente paso consiste en consultar la tabla de los valores críticos que corresponden
a la prueba de Kolmorogov-Smirnov. Vemos que para n = 10 y a = 0.01, el valor crítico
es 0.48893. Como 0.48893 > 0.1772, aceptamos la H0. Es decir, no existen diferencias
significativas entre la distribución observada y la distribución teórica, y por tanto, la
inteligencia no sigue una distribución normal en la población de la que fue extraía la
muestra de nuestro ejemplo.
Ejercicio 5
Como actúa con dos grupos (A y B), selecciona a 10 sujetos del grupo A y otros 10 del
B, emparejados en rendimiento musical previo, en actitud y en aptitudes musicales.
Decide al azar que en el A aplicará el procedimiento psicológico y en el B el lógico.
Para la evaluación de resultados utiliza un instrumento de medida que sólo denota que
unas diferencias iguales entre los números que no implican diferencias idénticas en las
cuantías de los atributos. Obtiene los siguientes datos (ficticios):
A B
16 4
12 18
22 10
16 14
14 12
10 14
20 10
18 12
10 4
22 12
¿Puede afirmar que hay que diferencias entre los dos grupos? (α = 0.05)
1. Hipótesis:
Para el cálculo del estadístico W, deberemos calcular previamente las diferencias entre
las puntuaciones de los dos grupos. Estas diferencias o distancias quedan recogidas en
la tabla siguiente:
W- = 47
W+ = 8
Por tanto, el estadístico de contraste en este ejemplo es W = 8 (el menor de los valores
obtenidos).
En el caso de que la hipótesis nula sea cierta, esperamos diferencias B-A con signo
positivo, por lo que la suma de rangos positivos W+ tendría un valor alto. Para rechazar
la hipótesis nula tendremos que obtener valores bajos de W+, es decir, la región de
rechazo se encuentra a la izquierda. Esto es, estamos ante un contraste unilateral
izquierdo. Ahora consultamos la tabla de valores críticos para la prueba de Wilcoxon, y
encontramos que para un contraste unilateral y con un nivel de significación de 0.05, el
valor crítico es 8. Por tanto, rechazamos la hipótesis nula y podemos afirmar con una
confianza del 95% que el procedimiento psicológico es más eficaz que el lógico.
Ejercicio 6
Existe considerable evidencia acerca de que los adultos son capaces de utilizar sefiales
visuales en el procesamiento de información auditiva. En una conversación normal, las
personas pueden utilizar los movimientos de los labios en el procesamiento de la charla.
La congruencia entre los movimientos de los labios y los sonidos del habla son
particularmente benéficos en ambientes ruidosos. La investigación ha demostrado que el
procesamiento del habla se deteriora cuando las señales auditivas y visuales no son
congruentes. En los niños, la habilidad para discriminar y localizar la fuente de
estímulos auditivos y visuales complejos se establece alrededor de los seis meses de
edad.
Existen considerables diferencias individuales entre los infantes respecto al tiempo que
pasaron atendiendo al estímulo. Sin embargo, la diferencia en el tiempo que pasaron
viendo en la condición en sincronía y el tiempo que pasaron viendo en la condición
fuera de sincronía podría ser un indicador confiable de la capacidad de discriminar. Si el
niño pasa más tiempo atendiendo al estímulo en la presentación sincrónica. la diferencia
sería positiva; y si el niño pasa más tiempo atendiendo al estímulo en la presentación
asincrónica, la diferencia sería negativa. Si el pequeño es capaz de discriminar, las
diferencias deberían tender hacia una dirección; más aún, cualquier diferencia en
dirección contraria debería ser relativamente pequeña.
𝑯𝟎 : la cantidad de tiempo que pasan los nifios viendo a través de la ventana no depende
del tipo de presentación. En términos de la prueba de Wilcoxon, la suma de los rangos
positivos no difiere de la suma de los rangos negativos.
𝑯𝟏 : la cantidad de tiempo que los nifios pasan viendo depende del tipo de presentación;
la suma de los rangos positivos difiere de la suma de los rangos negativos.
Prueba estadística
Nivel de significancia
Cálculos
Decisión
La tabla H del Apéndice 1 nos muestra que con N = 12 y 𝑇 + = 73, debemos rechazar
la hipótesis nula en α = 0.01 para una prueba bidireccional, puesto que el valor de
tablas es (0.0024) y para una prueba bidireccional se duplica (0.0048). Se rechaza
H0 en favor de H1 y concluimos que los niños son capaces de discriminar entre la
sincronía o asincronía en los movimientos de los labios y los sonidos del habla.
Ejercicio 7
Pareja 1 2 3 4 5 6 7 8 9 10 11 12
Esposa 35 46 29 32 40 43 36 30 56 35 48 29
Esposo 29 32 36 35 46 45 35 18 41 37 40 25
A nivel del 5% ¿existe una misma actitud, en las parejas, frente a los problemas
escolares?
Solución
1. Planteamiento de hipótesis
Decisión
Ejercicio 8
Se diseña un estudio de tiempos y movimientos con el fin docimar la eficiencia de dos
procedimientos para montar cierto mecanismo. Se aparean los obreros con base en los
coeficientes de inteligencia y el número de años de educación. Los miembros e cada par
son asignados en grupos a uno de los procedimientos. El tiempo en segundos para
terminar el montaje es como sigue;
Sabemos que la prueba es bilateral, que n= 13 α= 0,05 y T=16 por ser la suma de los
valores negativos, siendo la más pequeña de las dos columnas.
𝑡𝑡𝛼=0,05 16 = 17
Planteamiento de hipótesis
α= 0.05
Ejercicio 9
Los internos de una prisión federal sirvieron como sujetos en un estudio de toma de
decisiones 5 Primero se midió de manera individual la utilidad de los cigarrillos para los
reclusos (valor subjetivo), ya que los cigarrillos son el objeto más negociado en las
prisiones. Haciendo uso de la función de utilidad de cada sujeto, el investigador intentó
predecir las decisiones que cada hombre haría en un juego donde repetidamente tendría
que escoger entre dos opciones y en las cuales pudiera perder o ganar cigarrillos.
La hipótesis evaluada fue que los investigadores podrían predecir las decisiones de los
sujetos en términos del valor de utilidad, en lugar de suponer que la utilidad de los
cigarrillos es equivalente al valor objetivo de los mismos y, por tanto, predecir la
elección "racional" en términos del valor objetivo. Esta hipótesis fue confirmada.
Sin embargo, como era de esperarse, algunas respuestas no se predijeron con éxito, por
la hipótesis de maximización de la utilidad esperada. Los investigadores habían
conjeturado que tales errores en la predicción se deberían a la probable indiferencia de
los sujetos hacia las dos opciones disponibles. Esto es, un recluso podía encontrar
igualmente atractivas ambas opciones o no parecerle atractiva ninguna y, por tanto, ser
indiferente a la elección entre ambas opciones. Tales elecciones (de indiferencia) son
difíciles de predecir. Pero en tales casos, se razonó que el sujeto vacilaría en plantear
una apuesta y tardaría más en decidir. Es decir, la latencia entre el ofrecimiento de las
opciones y el aceptar alguna de ellas sería mayor. La segunda hipótesis fue que las
latencias o tiempos de respuesta que no se predijeran satisfactoriamente por la
maximización de la utilidad esperada, serían mayores que las elecciones predichas con
éxito.
Planteamiento de hipótesis
H0: no hay diferencia entre las latencias de las decisiones predichas correctamente y las
predichas incorrectamente.
H1: las latencias de las elecciones predichas incorrectamente serán mayores que las
predichas correctamente.
Nivel de significancia
α= 0,01
𝒛 = 3.11
LA PRUEBA DE FISHER
A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos
valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la
estimación intermediante entre la estimación interna
Esta razón F fue creada por Ronald Fisher (1890-1962), matemático británico, cuyas
teorías estadísticas hicieron mucho más precisos los experimentos científicos. Sus
proyectos estadísticos, primero utilizados en biología, rápidamente cobraron
importancia y fueron aplicados a la experimentación agrícola, médica e industrial.
Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la
selección natural en la genética, particularmente en la población humana.
El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que
indicará el valor máximo del valor estadístico de prueba que ocurría si H0 fuera
verdadera, a un nivel de significación seleccionado. Antes de proceder a efectuar este
cálculo, se debe considerar las características de la distribución F
Características de la distribución F
La razón más pequeña es 0. La razón no puede ser negativa, ya que ambos términos de
la razón F están elevados al cuadrado.
Por otra parte, grandes diferencias entre los valores medios de la muestra, acompañadas
de pequeñas variancias muestrales pueden dar como resultado valores extremadamente
grandes de la razón F.
- La forma de cada distribución de muestreo teórico F depende del número de grados de
libertad que estén asociados a ella. Tanto el numerador como el denominador tienen
grados de libertad relacionados.
Ejercicio1
Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de
motores respecto al tiempo en minutos. Los resultados se muestran en la tabla:
Método 1 Método 2
n1 = 31 n2 = 25
s12 = 50 s22 = 24
2 2
Construya un intervalo de confianza del 90% para 1 / 2 .
Solución:
al despejar: .
F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En
este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.
y
2 2
Con un nivel de confianza del 90% se sabe que la relación de varianzas 1 / 2 está
entre 1.07 y 3.93. Esto supondría que la varianza de la población 1 es mayor a la
varianza de la población 2 entre 1.07 y 3.93.
Ejercicio 2
Solución:
al despejar: .
En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.
Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las
desviaciones estándar de la rugosidad de la superficie de los dos procesos sean
diferentes con un nivel de confianza del 90%.
Ejercicio 3
¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso
son menores para el 2? Realice una prueba con un = 0.05.
Solución:
Datos:
Población 1 Población 2
n1 = 25 n2 = 20
= 0.05
Ensayo de hipótesis:
Estadístico de prueba:
Entonces los grados de libertad uno será el tamaño de la muestra de la población uno
menos uno. 1= 25-1 = 24 y 2 = 20-1=19.
Regla de decisión:
Decisión
Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con un = 0.05 que no
existe suficiente evidencia para decir que la varianza del proceso 2 es menor que la del
proceso 1.
Ejercicio 4
Solución:
Datos:
Robo-Fill
sRF = 1.9
nRF = 16
= 0.10
Automat-Fill
sAF = 2.1
nAF = 21
Ensayo de hipótesis:
Estadístico de prueba:
Regla de decisión:
Cálculo:
Decisión
Como 1.22 es menor que 2.20 no se rechaza Ho, y se concluye con un = 0.10 que la
variación de llenado de la máquina Robo-Fill no es menor a la de Automat-Fill, por lo
que se selecciona cualquier máquina.
Ejercicio 5
Las capas de óxido en las obleas semiconductoras son depositadas en una mezcla de
gases para alcanzar el espesor apropiado. La variabilidad del espesor es una
característica crítica de la oblea, y lo deseable para los siguientes pasos de la fabricación
es tener una variabilidad baja. Para ello se estudian dos mezclas diferentes de gases con
la finalidad de determinar con cuál se obtienen mejores resultados en cuanto a la
reducción en la variabilidad del espesor del óxido. Veintiuna obleas son depositadas en
cada gas. Las desviaciones estándar de cada muestra del espesor del óxido son s1 = 1.96
angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que indique una diferencia en las
desviaciones? Utilice =0.05.
Solución:
Datos:
s1= 1.96
n1 = 21
s2 = 2.13
n2= 21
Ensayo de hipótesis:
Estadístico de prueba:
Entonces los grados de libertad uno será el tamaño de la muestra de la población uno
menos uno. 1= 21-1 = 20 y 2 = 21-1=20.
Regla de decisión:
Cálculo:
Decisión
Como 0.85 está entre los dos valores de Ho no se rechaza, y se concluye con un =
0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son
iguales.
LA PRUEBA DE LA MEDIANA
Función
La extensión de la prueba de la mediana determina si k grupos independientes (no
necesariamente del mismo tamaño) se han extraído de la misma población o de
poblaciones distintas, pero con medianas iguales. Esta prueba es útil y apropiada cuando
la variable en estudio ha sido medida en, al menos, escala ordinal. Es particularmente
apropiada cuando, por alguna razón, no ha sido posible observar el valor exacto de las
puntuaciones extremas, es decir, cuando algunos de los datos observados se encuentran
por arriba del punto de corte.
Método
Para aplicar la extensión de la prueba de la mediana, primero debemos determinar el
valor de la mediana para las puntuaciones de las k muestras combinadas, es decir,
encontramos la mediana común para todas las puntuaciones en los k grupos. Después,
debemos reemplazar cada puntuación por un signo de más ( +) si la puntuación es
mayor que la mediana o por un signo de menos ( - ) si éste es más pequeño que la
mediana. (Puede suceder que una o más puntuaciones coincidan con el valor de la
mediana; entonces, se deben dicotomizar las puntuaciones, es decir, se asigna un más (
+) si la puntuación es mayor que la mediana o un menos ( - ) si la puntuación es igual o
menor que la mediana.)
Podemos presentar los conjuntos de puntuaciones resultantes en una tabla de
contingencia de 2 X k, con los números en el cuerpo de la tabla representando las
frecuencias de signos de más ( +) (puntuaciones por arriba de la mediana) y signos de
menos ( - ) (puntuaciones por abajo de la mediana) en cada uno de los k grupos. Un
ejemplo de lo anterior es la siguiente tabla:
Para probar la hipótesis nula de que las k muestras provienen de la misma población con
respecto a las medianas, debemos calcular el valor del estadístico X2 utilizando las
ecuaciones (5. 2) o (5. 2a):
Dónde:
n,J = número de casos observados que fueron categorizados en el i-ésimo renglón de la
j-ésima columna
E,1 = número de casos esperados en el i-ésimo renglón de laj-ésima columna cuando H0
es verdadera
y la doble sumatoria es sobre todos los renglones y columnas de la tabla (es decir,
sumatoria de todas las celdillas). Los valores de X2 resultantes de la aplicación de la
ecuación (5. 2) se distribuyen (para N grande) como ji cuadrada con gl = (r - l) (k - l),
donde r es el número de renglones y k es el número de columnas (grupos) de la tabla de
contingencia. Para la prueba de la mediana r = 2, tenemos que
gl = (r - l (k - l) = (2 - l) (k - l) = k - l
Cuando H0 es verdadera, la probabilidad asociada con la ocurrencia de valores tan
grandes como una X2 observada, se proporciona en la tabla.
Si la X2 observada es igual o mayor que valor de la tabla C para el nivel de
significación previamente determinado y para el valor observado de gl = k - l, entonces
podemos rechazar H0 en ese mismo nivel de significación.
Si es posible dicotomizar las puntuaciones exactamente en la mediana, entonces cada
E,1 es la mitad del total marginal para su columna. Cuando las puntuaciones son
dicotomizadas como aquellas que son mayores e iguales y menores que la mediana, el
método para encontrar las frecuencias esperadas.
Una vez que las puntuaciones se han categorizado como signos de más ( +) y signos de
menos ( - ) respecto a la mediana, y las frecuencias resultantes se han arreglado en una
tabla de contingencia de 2 X k, el procedimiento de cálculo para esta prueba es
exactamente el mismo que para la ji cuadrada para k muestras independientes.
Ejercicio 1
Se decide investigar el coeficiente intelectual de una muestra de 28 jóvenes que
pertenecen a diferentes colegios del país para lo cual se les aplico un test que consta de
50 preguntas para medir su C.I, los resultados se resumen en la siguiente tabla.
COEFICIENTE INTELECTUAL Total
Colegio 1 35 26 27 21 27 38 23 25 n=8
Colegio 2 25 27 45 46 33 26 46 41 n=8
Colegio 3 29 50 43 22 42 47 42 32 n=8
Colegio 4 50 37 34 31 n=4
Si 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
Si 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
FRECUENCIAS OBSERVADAS Y ESPERADAS
Coeficiente
Intelectual Colegio 1 Colegio 2 Colegio 3 Colegio 4 Total
Mayores Me 2 4 4 4 5 4 3 2 14
Menores Me 6 4 4 4 3 4 1 2 14
Total 8 8 8 4 28
𝑟 𝑘
2
𝑛𝑖𝑗 2 22 42 52 32 62 42 32 12
𝜒 = ∑∑ −𝑁 = + + + + + + + − 28
𝐸𝑖𝑗 4 4 4 2 4 4 4 2
𝑖=1 𝑗=1
= 3,5
6) Decisión
Ejercicio 2
Un investigador en educación desea estudiar la influencia del nivel escolar de las
madres sobre el interés en sus hijos en edad escolar. Como medida del nivel de
escolaridad, el investigador utiliza el grado escolar más alto que la madre haya
completado, y como medida del interés en sus hijos se toma como índice el número de
visitas voluntarias que cada madre realiza durante el año escolar. El investigador
obtiene una muestra al azar del 10 por ciento de los 440 niños inscritos en la escuela, de
esta lista se obtienen los nombres de las 44 madres que pertenecen a la muestra.
Demostrar que el número de visitas a la escuela por parte de una madre varía de acuerdo
con el número de años escolares que esa madre completó.
NIVEL ESCOLAR DE LA MADRE FRECUENCIA ABSOLUTA Total
Octavo Grado 4 3 0 7 1 2 0 3 5 1 n = 10
Décimo grado 2 4 1 6 3 0 2 5 1 2 1 n = 11
Preparatoria 2 0 4 3 8 0 5 2 1 7 6 5 1 n = 13
Primeros semestres 9 4 2 3 n=4
Licenciatura 2 4 5 2 n=4
Postgrado 2 6 n=2
5) Cálculos
NIVEL ESCOLAR DE LA MADRE FRECUENCIAS OBSERVADAS Y ESPERADAS
Número de
Visitas Octavo Décimo Primeros
Preparatoria Licenciatura Postgrado Total
Grado grado semestres
Mayores Me 5 5 4 5,5 7 6,5 3 2 2 2 1 1 22
Menores Me 5 5 7 5,5 6 6,5 1 2 2 2 1 1 22
Total 10 11 13 4 4 2 44
𝑟 𝑘
2
𝑛𝑖𝑗 2 52 42 72 32 22 12 52 72
𝜒 = ∑∑ −𝑁 = + + + + + + +
𝐸𝑖𝑗 5 5,5 6,5 2 2 1 5 5,5
𝑖=1 𝑗=1
62 12 22 12
+ + + + − 44 = 1,895
6,5 2 2 1
6) Decisión
Ejercicio 3
Se selecciona al azar ministros de tres religiones: 8 metodistas, 10 católicos y 9
pentecostales y se desea probar si poseen el mismo conocimiento sobre enfermedades
mentales. Los resultados de un test que midió su conocimiento se detalla en la siguiente
tabla.
Metodista 32 30 30 29 26 23 18 19 n=8
Católico 32 32 26 26 22 20 14 16 14 15 n = 10
Pentecostal 28 21 15 15 14 14 9 11 8 n=9
𝑀𝑒 = 𝑋𝑛+1 = 𝑋27+1 = 20
2 2
1) Planteamiento de la hipótesis
5) Cálculos
FRECUENCIAS OBSERVADAS Y ESPERADAS
Conoce sobre
enfermedades
mentales Metodista Católico Pentecostal Total
𝑟 𝑘
2
𝑛𝑖𝑗 2 62 52 22 22 52 72
𝜒 = ∑∑ −𝑁 = + + + + + − 27 = 4,75
𝐸𝑖𝑗 3,9 4,8 4,3 4,1 5,2 4,7
𝑖=1 𝑗=1
6) Decisión
Como 4,75 < 5,99 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 , y se concluye que no existe diferencia
significativa en el grado de conocimiento sobre enfermedades mentales debido a
las diferentes religiones de las personas.
Ejercicio 4
Se realizó un experimento con cuatro variedades de maíz, con la finalidad de
determinar si existen diferencias significativas en cuanto a su rendimiento, las cuatro
variedades fueron asignadas aleatoriamente a 34 parcelas ubicadas en la misma
localidad. El rendimiento en kilogramos fue registrado para cada una de las parcelas,
obteniendo los siguientes datos, se pide demostrar que los rendimientos de las diferentes
parcelas varían debido a las variedades de maíz.
Si 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
Si 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
FRECUENCIAS OBSERVADAS Y ESPERADAS
Rendimientos
Variedad 1 Variedad 2 Variedad 3 Variedad 4 Total
Mayores Me 6 4,2 3 4,7 7 3,3 0 3,8 16
Menores Me 3 4,8 7 5,3 0 3,7 8 4,2 18
Total 9 10 7 8 34
𝑟 𝑘
2
𝑛𝑖𝑗 2
𝜒 = ∑∑ −𝑁
𝐸𝑖𝑗
𝑖=1 𝑗=1
62 32 72 02 32 72 02 82
= + + + + + + + − 34
4,2 4,7 3,3 3,8 4,8 5,3 3,7 4,2
𝑟 𝑘
2
𝑛𝑖𝑗 2
𝜒 = ∑∑ − 𝑁 = 17,54
𝐸𝑖𝑗
𝑖=1 𝑗=1
6) Decisión
Ejercicio 5
6) Decisión
Como 3,94 < 7,81 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 se concluye que no existe diferencia
significativa en el grado de ansiedad de las personas debido a las diferentes
enfermedades que poseen.
LA PRUEBA DE MANN-WHITNEY
Dónde:
U1 y U2 = valores estadísticos de U Mann-Whitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.
Los cálculos tienen que tener en cuenta la presencia de observaciones idénticas a la hora
de ordenarlas. No obstante, si su número es pequeño, se puede ignorar esa circunstancia.
Ejercicio 1
Suponga que una fábrica de cerámicas desea comparar el tiempo que toma a las piezas
de barro enfriarse después de haber “ardido” en el horno mediante dos métodos
diferentes.
Los alfareros queman 12 piezas utilizando el método 1, y 10 utilizando el método 2. El
número de minutos necesarios para que cada pieza se enfríe es el siguiente:
Método1 27 31 28 29 39 40 35 33 32 36 37 43
Método 2 34 24 38 28 30 34 37 42 41 44
24 1
27 2
28 3.5 28 3.5
29 5
30 6
31 7
32 8
33 9
34 10.5
34 10.5
35 12
36 13
37 14.5 37 14.5
38 16
39 17
40 18
41 19
42 20
43 21
44 22
R1=130 R2=123
n1 ( n1 1 )
U 1 n1 n2 R1
2
n (n 1
U 2 n1 n2 1 1 R2
2
12( 12 1 )
U 1 ( 12 )( 10 ) 130 68
2
10 ( 10 1 )
U 2 ( 12 )( 10 ) 123 52
2
U 1 u
Z
u
H 0 : 1 2
H 1 : 1 2
Regla de decisión
Ejercicio 2
Grupo experimental 75 46 52 45 75 62 48 85 63 84
Grupo control 39 49 28 47 35 25 69 34 67 32
Ya en el enunciado del problema, se nos dice que los datos son siguen una distribución
normal por lo que utilizaremos un contraste no paramétrico. Al tratarse de dos muestras
independientes, la prueba más adecuada es la prueba de Mann-Whitney. Las hipótesis
que vamos a contrastar son:
H0: No existen diferencias entre el grupo experimental y el grupo control.
X Rango
25 1
28 2
32 3
34 4
35 5
39 6
45 7*
46 8*
47 9
48 10*
49 11
52 12*
62 13*
63 14*
67 15
69 16
75 17.5*
84 19*
85 20*
[D]
[D]
las dos muestras estén muy entremezcladas, y por tanto el número de rachas, Rexp,
formadas por las categorías
Cuando el valor teórico del número de rachas por debajo del cual se
rechaza H0,
donde
Luego si definimos
se rechaza la hipótesis nula si .