Sunteți pe pagina 1din 77

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS ECONÓMICAS


CARRERA DE ESTADÍSTICA
ESTADÍSTICA NO PARAMÉTRICA
Nombre: Priscila Morales
Séptimo semestre
Aula: 18
Fecha: 2016-04-26

ANÁLISIS DE PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS PARA


PROBAR HIPÓTESIS DE UNA SOLA MUESTRA Y DOS MUESTRAS

LA PRUEBA BINOMIAL

Función y racionalización

Existen muchas poblaciones que son concebidas como compuestas de sólo dos clases.
Ejemplos de tales clases son: hombre y mujer; alfabeto y analfabeto; miembro y no
miembro; soltero y casado; internado y ambulatorio. Para tales casos, todas las posibles
observaciones de la población caerán en una de dos categorías discretas. Tal población
generalmente se denomina población binaria o población dicotómica
Supóngase que una población consta de sólo dos categorías o clases.

Entonces, cada observación (X) muestreada de la población puede tomar uno de dos
valores, dependiendo de la categoría muestreada. Podemos denotar los posibles valores
de la variable aleatoria usando cualquier par de valores, pero es conveniente denotar
cada resultado como 1o 0. Asumiremos posteriormente que la probabilidad de
muestrear un objeto de la primera categoría es p y la probabilidad de muestrear un
objeto de la otra categoría es q = l - p. Esto es,

P [X = l] = p y P [X - O] = l - p = q

También se supone que cada probabilidad es constante, sin considerar el número de


sujetos muestreados u observados.
Aunque el valor de p puede variar de población a población, es un valor fijo para una
determinada población. Sin embargo, aun si conocemos (o suponemos) el valor de p
para alguna población, no podemos esperar que una muestra aleatoria de observaciones
de la población contenga exactamente las proporciones p y l - p para cada una de las dos
categorías.
El muestreo aleatorio generalmente impide que la muestra duplique precisamente los
valores de la población de p y q.

Por ejemplo, de los registros oficiales podemos conocer que los votantes de cierta
ciudad están divididos por mitades entre los partidos republicano y demócrata. Pero una
muestra aleatoria de los votantes registrados en esa ciudad puede contener 47% de
demócratas y 53% de republicanos, o quizá 56% de demócratas y 44% de republicanos.
Tales diferencias entre los valores de la población y los observados se originan debido a
las fluctuaciones al azar o aleatorias en las observaciones. No debemos sorprendernos
por desviaciones pequeñas de los valores poblacionales; sin embargo, desviaciones
grandes -aunque posibles- son poco probables.

La distribución binomial se usa para determinar las probabilidades de los posibles


resultados que podemos observar al muestrear una población binomial.
Si nuestra hipótesis es Ho: p = p0, podemos calcular las probabilidades de varios
resultados cuando suponemos que Ho es cierta. La prueba nos dirá si es razonable creer
que las proporciones (o frecuencias) de las dos categorías en nuestra muestra han sido
extraídas de una población con los valores hipotéticos de p0 y l - p0. Por conveniencia,
al hablar de la distribución binomial, denotamos el resultado X = como "éxito" y el
resultado X = O como "fracaso". Además, en una serie de N observaciones,

Es el número de "éxitos" o el número ele resultados de tipo X = l

Método

En una muestra de tamaño N, la probabilidad de obtener k objetos en una categoría y N-


k objetos en la otra categoría, está dada por

Dónde:

p= la proporción de observaciones esperadas cuando X =l


q= la proporción de observaciones esperadas cuando X =O
Ejemplo, supongamos que un dado es lanzado cinco veces.
¿Cuál es la probabilidad de que exactamente dos de las tiradas muestren un seis? En
este caso, Y es la variable aleatoria (el resultado de los cinco lanzamientos del dado), N
= al número de lanzamientos (5), k = el número observado de seises (2), p = la
proporción esperada de seises (1/6) y q = 5/6 La probabilidad de que exactamente en
dos de los cinco lanzamientos aparezca un seis:
La aplicación de la fórmula al problema nos muestra que la probabilidad de obtener
exactamente dos seises cuando se lanza un dado normal cinco veces es p = 0.16.
Ahora bien, cuando probamos hipótesis, la cuestión no es generalmente " ¿cuál es la
probabilidad de obtener exactamente los valores que fueron observados?", sino que más
bien, por lo regular preguntamos "¿cuál es la probabilidad de obtener valores tan
extremos o más extremos que los valores observados, cuando suponemos que los datos
son generados por un proceso particular?" Para responder a preguntas de este tipo, la
probabilidad deseada e

En otras palabras, sumamos la probabilidad de los resultados observados con la


probabilidad de resultados que son aún más extremos.
Supóngase ahora que queremos conocer la probabilidad de obtener dos o menos seises
cuando se lanza cinco veces un dado normal. Aquí, de nuevo N = 5,
k = 2, p =1/6 y q = 5/6. Ahora la probabilidad de obtener dos o menos seises se denota p
[Y ≤ 2]. La probabilidad de obtener 0 seises es P [Y = 0], la probabilidad de obtener un
seis es P [Y = 1], etc. Usando la ecuación tenemos:

Esto es, la probabilidad de obtener dos o menos seises es la suma de las tres
probabilidades. Si usamos la ecuación para determinar estas probabilidades, tenemos

Hemos determinado que la probabilidad según H0 (la suposición de un dado normal) de


obtener dos o menos seises cuando un dado es lanzado cinco veces, es p= 0.96.

Media - varianza
En una distribución binomial denotada por B (n, p), donde:
µ =np
La varianza de la variable aleatoria X, al ser ésta de tipo discreto, se calcula como:
ơ=npq

Muestras pequeñas y grandes


En el caso de una muestra, cuando se están usando categorías binarias, una hipótesis
común es H0: p = l/2. En la tabla para estas muestras se proporcionan las probabilidades
de una cola asociadas con la ocurrencia de diferentes valores tan extremos como k,
según la hipótesis nula H0: p = 1/2. Se debe tomar a k como la más pequeña de las
frecuencias observadas. Se utiliza esta tabla cuando N< 35 la tabla es más conveniente,
ya que se proporcionan las probabilidades asociadas con la ocurren-cia de diferentes
valores tan pequeños como k para diferentes N.
Cuando se aumenta N la distribución binomial tiende a la distribución normal. Más
precisamente, al incrementarse N la distribución de la variable Y se aproxima a la
distribución normal. La tendencia es rápida cuando p se aproxima a 1 /2, pero es más
lenta cuando p está cercana a O o a 1. Vale decir, mientras más grande sea la disparidad
entre p y q, más grande debe ser N antes de que la aproximación sea cercanamente útil a
la distribución normal. Cuando p está cercana a 1 /2, la aproximación puede ser usada
para una prueba estadística cuando N > 25. Cuando p está cercana a O o a 1, una regla
común es que Npq debe ser más grande que 9 antes de que la prueba estadística basada
en la distribución normal sea suficientemente exacta para ser usada. Dentro de estas
limitaciones, la distribución muestral de Y es aproximadamente normal, con media Np
y varianza Npq y, por tanto, H0 puede ser probada por

Ejercicio 1
Un agente de seguros vende pólizas a cinco personas de la misma edad y que disfrutan
de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas
condiciones viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos 30
años, vivan:

a) Las cinco personas


b) Al menos tres personas
c) Exactamente dos personas

B (5, 2/3) p = 2/3 q = 1/3

a) Las cinco personas

b) Al menos tres personas


c) Exactamente dos personas

Ejercicio 2

Un examen consta de 10 preguntas a las que hay que contestar SI o No. Suponiendo que
a las personas que se le aplica no saben contestar a ninguna pregunta y, en
consecuencia, contestan al azar, hallar:

a) Probabilidad de obtener cinco aciertos


b) Probabilidad de obtener algún acierto
c) Probabilidad de obtener al menos cinco aciertos

Datos:

a) Probabilidad de obtener cinco aciertos

b) Probabilidad de obtener algún acierto


c) Probabilidad de obtener al menos cinco aciertos

Ejercicio 3

La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de
los lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura:

a) ¿Cuál es la probabilidad de que en el grupo hayan leído la novela 2


personas?
b) ¿Y cómo máximo 2?

B (4, 0.2) p = 0.8 q = 0.2

a) ¿Cuál es la probabilidad de que en el grupo hayan leído la novela 2 personas?

b) ¿Y cómo máximo 2?

Ejercicio 4

Un laboratorio afirma que una droga causa efectos secundarios en una proporción de 3
de cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 5
pacientes a los que aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?

a) Ningún paciente tenga efectos secundarios


b) Al menos dos tengan efectos secundarios
c) ¿Cuál es el número medio de pacientes que espera laboratorio que sufran
efectos secundarios si elige 100 pacientes al azar?

B (100, 0.03) p = 0.03 q = 0.97

a) Ningún paciente tenga efectos secundarios


b) Al menos dos tengan efectos secundarios.

c) ¿Cuál es el número medio de pacientes que espera laboratorio que sufran efectos
secundarios si elige 100 pacientes al azar?

Ejercicio 5

Un laboratorio afirma que una droga causa efectos secundarios en una proporción de 3
de cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 5
pacientes a los que aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?

a) Ningún paciente tenga efectos secundarios

B(100, 0.03) p=0.03 q=0.97

b) Al menos dos tengan efectos secundarios

c) Cuál es el número medio de pacientes que espera laboratorio que sufran efectos
secundarios si elige 100 pacientes al azar?

Ejercicio 6

En unas pruebas de alcoholemia se ha observado que el 5% de los conductores


controlados dan positivo en la prueba y que el 10% de los conductores controlados no
llevan puesto el cinturón de seguridad. También se ha observado que las dos
infracciones son independientes. Un guardia de tráfico para cinco conductores al azar.
Si tenemos en cuenta que el número de conductores es suficientemente importante como
para estimar que la proporción de infractores no varía al hacer la selección

a) Determinar la probabilidad de que exactamente tres conductores hayan


cometido alguna de las dos infracciones.
b) Determine la probabilidad de que al menos uno de los conductores
controlados haya cometido alguna de las dos infracciones.

a) Determine la probabilidad de que al menos uno de los conductores controlados


haya cometido alguna de las dos infracciones.

b) Determine la probabilidad de que al menos uno de los conductores controlados


haya cometido alguna de las dos infracciones.

Ejercicio 7

Cada muestra de aire tiene 10% de posibilidades de contener una molécula rara
particular. Suponga que las muestras son independientes con respecto a la presencia de
la molécula rara. Encuentre la probabilidad de que en las siguientes 18 muestras,
exactamente 2 contengan la molécula rara.

Sea X= número de muestras de aire que contiene la molécula rara en las siguientes 18
muestras analizadas. Entonces X es una variable aleatoria binomial con p=0.01 y n=18.
Por lo tanto:

Por lo tanto

Ejercicio 8
Si de seis a siete de la tarde se admite que un número de teléfono de cada cinco está
comunicando, ¿Cuál es la probabilidad de que, cuando se marquen 10 números de
teléfono elegidos al azar, solo comuniquen dos?

Ejercicio 9

La probabilidad de que un hombre acierte en el blanco es 1/4. Si dispara 10 veces ¿cuál


es la probabilidad de que acierte exactamente en tres ocasiones? ¿Cuál es la
probabilidad de que acierte por lo menos en una ocasión?

B (10, 1/4) p = 1/4q = ¾

a) ¿Cuál es la probabilidad de que acierte exactamente en tres ocasiones?

b) ¿Cuál es la probabilidad de que acierte exactamente en tres ocasiones?

Ejercicio 10

Un examen consta de 6 personas con 4 posibles respuestas cada una, de las que son una
de ellas es correctas. Un estudiante que no había preparado la materia responde
completamente al azar marcando una respuesta aleatoriamente. Calcular la probabilidad
de que acierte 4 o más preguntas.

Se trata de una distribución de probabilidad binomial, B(n,p), con n=6,


p=P(acierto)=0,25 y q=P(fallo)=o,75.

Aplicando la formula, en este caso se tiene:


LA PRUEBA CHI-CUADRADO EN UNA MUESTRA

Función

Cuando los datos experimentales consisten en frecuencias en categorías discretas


(nominales o categóricas y, en ocasiones, ordinales), puede utilizarse la prueba ji
cuadrada para evaluar la significación de las diferencias entre k grupos independientes.

La prueba ji cuadrada para k muestras o grupos independientes es una sencilla extensión


de la prueba ji cuadrada para dos muestras independientes, presentada en el capítulo 5.
En general, la prueba es similar tanto para dos como para k muestras o grupos
independientes.

Método

El método de calcular el estadístico de la prueba ji cuadrada para muestras


independientes se describirá brevemente, junto con un ejemplo de su aplicación.

Para aplicar la prueba ji cuadrada, primero debemos presentar los datos (frecuencias) en
una tabla r X k donde los datos en cada columna corresponden a las frecuencias en cada
una de las r categorías de respuesta para cada uno de los k grupos o muestras diferentes.
La hipótesis nula es que las k muestras de frecuencias provienen de la misma población
o de poblaciones idénticas. Esta hipótesis, de que las k poblaciones no difieren entre sí,
puede evaluarse aplicando las ecuaciones

Dónde:

nij = número de casos que se categorizaron (observados) en el i-ésimo renglón de la j-


ésima columna

Eij = número de casos esperados en el i-ésimo renglón de la j-ésima columna cuando Ha


es verdadera

y la doble sumatoria se realiza sobre el total de renglones y columnas de la tabla (es


decir, en la sumatoria intervienen todas y cada una de las celdillas). El lector recordará
que los valores esperados se determinan calculando E, 1 = R,C/N para cada una de las
celdillas de la tabla. Los valores de X2 obtenidos al utilizar las ecuaciones se
distribuyen asintóticamente (conforme N es más grande) como ji cuadrada con gl = (r -
l) (k - l), donde r es el número de renglones y k es el número de columnas (o grupos
independientes) en la tabla de contingencia.
Así, la probabilidad asociada con la ocurrencia de valores tan grandes como una X2
observada nos la proporciona la tabla C del Apéndice l. Si un valor observado de X2 es
igual o mayor que el valor proporcionado por la tabla C del Apéndice para un nivel de
significación particular y para gl = (r - l) (k - l), entonces puede rechazarse Ha en ese
nivel de significación. Como se verá en los ejemplos y en la sección "cuándo utilizar la
prueba ji cuadrada", es importante que los valores esperados (las E,) no sean demasiado
pequeños, a fin de que pueda realizarse una interpretación adecuada del estadístico.

Procedimiento

1. Éstos son los pasos que hay que seguir para la aplicación de la prueba ji
cuadrada para k muestras o grupos independientes:
2. Arregle las frecuencias observadas en una tabla de contingencia r X k, utilizando
las k columnas para las muestras o grupos.
3. Determine la frecuencia esperada según H0 para cada celdilla encontrando el
producto de los totales marginales comunes a la celdilla y dividiendo este
producto entre N. Vale decir, encuentre las frecuencias esperadas E;j = R1 C/N.
(N es la sumatoria de cada uno de los totales marginales y representa el número
total de observaciones independientes. Cuando se "inflan" los valores de N
debido a múltiples observaciones de cada sujeto, esto invalida la prueba.) Si las
frecuencias esperadas son pequeñas, combine categorías tal como se muestra en
la siguiente sección.
4. Calcule X2 utilizando las ecuaciones dadas. Determine los grados de libertad gl
= (r - 1) (k - 1).
5. Determine la significación de la X2 observada.
6. Si se rechaza H0, el valor global de X2 puede ser dividido, utilizando la
ecuación para determinar dónde se encuentran (en la tabla de contingencia
original) las diferencias en la variable medida en los distintos grupos. Cada uno
de los valores de X2 de partición se distribuyen como ji cuadrada con gl = 1,
conforme incrementa el tamaño de N. Después de dividir la tabla, pueden
analizarse los residuos (diferencias entre los valores esperados y los valores
observados) mediante la ecuación.

¿Cuándo utilizar la prueba ji cuadrada?

Para aplicación adecuada de la prueba ji cuadrada se requiere que las frecuencias


esperadas (las Eij) en cada celdilla no sean demasiado pequeñas. Cuando se viola este
requisito, los resultados de la prueba no pueden ser interpretados porque la distribución
de X2 no está bien aproximada a la distribución de la ji cuadrada. Cochran (1954)
recomienda que en pruebas ji cuadrada donde los grados de libertad son mayores que
uno (esto es, que r o k sean mayores que dos), el número de celdillas que presenten
frecuencias esperadas menores que cinco, no debe ser mayor del 20 %y ninguna celdilla
debe presentar frecuencias esperadas menores que uno.

Si los requisitos no son cubiertos por los datos de acuerdo con la forma en que se
recolectaron y no fue posible contar con una muestra grande, el investigador debe
combinar categorías para incrementar las EiJ en varias celdillas. Sólo después de
combinar categorías y después de que menos del 20 % de las celdillas tengan
frecuencias esperadas menores que cinco, y ninguna celdilla tenga una frecuencia
esperada menor que uno, el investigador puede interpretar útilmente los resultados de la
prueba ji cuadrada. La combinación de las categorías debe hacerse juiciosamente.

Esto es, los resultados de la prueba estadística pueden no ser interpretables si las
categorías han sido combinadas caprichosamente. Las categorías que son combinadas
deben tener alguna propiedad en común o identificación mutua, por si la interpretación
del resultado de la prueba, después de haber combinado los renglones o columnas, tiene
cierta utilidad. El investigador debe ser precavido contra la necesidad de combinar
categorías si se utiliza una muestra suficientemente grande.

La prueba ji cuadrada es insensible a los efectos de orden, Así, cuando se ordenan las
categorías de respuesta o los grupos (o ambos), la prueba ji cuadrada puede no ser la
mejor. Cochran (1 954) ha presentado métodos que fortalecen la prueba ji cuadrada
común cuando H0 es verdadera contra alternativas específicas.

Finalmente, debe notarse que la prueba ji cuadrada es aplicada a frecuencias. Así, es


importante utilizar las ecuaciones (5 .2) o (5 .2a) en las frecuencias de los datos. No es
correcto emplear porcentajes o cualquier otra transformación de los datos al aplicar la
prueba.

Potencia

Generalmente no existe una opción clara a la prueba de la ji cuadrada cuando ésta se


utiliza en datos nominales y, por tanto, no es posible calcular un valor exacto de su
potencia. Sin embargo, Cochran (1952) ha mostrado que el límite de la potencia de la
distribución de la prueba ji cuadrada tiende a uno conforme se incrementa el tamaño de
N.

Ejercicio 1

En un grupo de enfermos que se quejaban de que no dormían se les dio somníferos y


placebos. Con los siguientes resultados. Nivel de significación: 0, 05.

Duerme bien Duerme mal Total


Somníferos 44 10 54
Placebos 81 35 116
Total 125 45 170

¿Es lo mismo tomar somníferos o placebos para dormir bien o mal en este grupo de
enfermos?

1) Planteamiento de hipótesis

Ho: No es lo mismo tomar somníferos o placebos para dormir mal o bien


H1: Es lo mismo tomar somníferos o placebos para dormir bien o mal.
2) Nivel de significación: α = 0.05

3) Estadístico de prueba
2
(𝑂𝑖 − 𝑂𝑒 )2
𝜒 =∑
𝑂𝑒
4) Regla de decisión

𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos

Frecuencias esperadas

Duerme bien Duerme mal Total


Somníferos 39,71 14,29 54
Placebos 85,29 30,71 116
Total 125 45 170

(44 − 39,71)2 (10 − 14,29)2 (81 − 85,29)2 (35 − 30,712


𝜒2 = + + +
39,71 14,29 85,29 30,71
𝜒 2 = 0,46 + 0,22 + 1,29 + 0,6 = 2,57

Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)

Grados de libertad = (2 – 1) (2 – 1) = 1 x 1 = 1

– Valor calculado –> 2, 57

– Valor de la tabla –> 3, 84

6) Decisión

Como 2, 57 < 3, 84 aceptamos Ho y rechazamos H1 y concluimos que al 5% del


nivel de significancia la diferencia no es estadísticamente significativa y que se
debe al azar. Es decir, no es lo mismo usar somníferos o placebos para dormir
bien o mal en este grupo de enfermos.

Ejercicio 2
Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de sus
destinos en una ciudad grande forman una distribución normal con una desviación
estándar s=1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral sea mayor que 2.

Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:

𝑛 = 17
𝑠2 = 2
𝑔𝑙 = 𝑛 − 1 = 16

(𝑛 − 1). 𝑠 2 (17 − 1)(2)


𝜒2 = = = 32
𝜎2 (1)2

El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se


encuentra que a este valor le corresponde un área a la derecha de 0.01. En consecuencia,
el valor de la probabilidad es:

𝑃(𝑠 2 > 2) = 0.01

Ejercicio 3
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
población normal con varianza σ^2=6, tenga una varianza muestral mayor que 9.1
Primero se procederá a calcular el valor del chi-cuadrado:
n=25
s^2=9.1
gl=n-1=24

χ^2=((n-1).s^2)/σ^2 =((25-1)(9.1))/〖(6)〗^2 =36.4

Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha


de 0.05. Por lo que:
P(s^2 >9.1) = 0.05

Ejercicio 4
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
población normal con varianza σ^2=6, tenga una varianza muestral entre 3.462 y
10.745.
Se calcularán dos valores de chi-cuadrada:
𝑛 = 25 𝑛 = 25
𝑠 2 = 3.462 𝑠 2 = 10.745
𝑔𝑙 = 𝑛 − 1 = 24 𝑔𝑙 = 𝑛 − 1 = 24

(𝑛 − 1). 𝑠 2 (𝑛 − 1). 𝑠 2
𝜒2 = 𝜒2 =
𝜎2 𝜎2
(25 − 1)(3.462) (25 − 1)(10.745)
= =
(6)2 (6)2
= 13.847 = 42.98

Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al
buscar el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da
un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se
resta el área de 0.95 menos 0.01 quedando 0. Por lo tanto:
P(3.462 ≤s^2≤ 10.745) = 0.94

Ejercicio 5

En un Centro de Salud analizamos las historias de enfermería (292 hombres y 192


mujeres). De ellos tienen úlcera 10 hombres y 24 mujeres y no tienen 282 y 168
respectivamente. Nivel de significación 0, 05.

Hombres Mujeres Total


Si úlcera 10 24 34
No úlcera 282 168 450
Total 292 192 484

1) Planteamiento de hipótesis

Ho: No existe relación entre tener úlcera y el sexo


H1: Sí existe relación entre tener úlcera y el sexo

2) Nivel de significación: α = 0.05

3) Estadístico de prueba
(𝑂𝑖 − 𝑂𝑒 )2
𝜒2 = ∑
𝑂𝑒
4) Regla de decisión

𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos
Frecuencias esperadas

Hombres Mujeres Total


Si úlcera 20,51 13,49 34
No úlcera 271,49 178,51 450
Total 292 192 484

2
(10 − 20,51)2 (24 − 13,49)2 (282 − 271,49)2 (168 − 178,51)2
𝜒 = + + +
20,51 13,49 271,49 178,51
𝜒 2 = 5,39 + 8,19 + 0,41 + 0,62 = 14,61

Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)

Grados de libertad = (2 – 1) (2 – 1) = 1 x 1 = 1

– Valor calculado –> 14, 61

– Valor de la tabla –> 3, 84

6) Decisión

Como 14, 61 > 3, 84 rechazamos Ho y aceptamos H1, y concluimos que la


diferencia es estadísticamente significativa; es decir, que no existe relación
entre tener úlcera y el sexo de la persona.

Ejercicio 6
El parque del barrio se utiliza para llevar a los perros a pasear. Se observa el tamaño de
los perros a distintas horas del día. La siguiente tabla muestra el número de perros
presentes en el parque en tres momentos distintos del pasado domingo, clasificados
según su tamaño.

Domingo Pequeño Mediano Grande Total


Mañana 9 18 21 48
Tarde 11 6 13 30
Noche 7 8 9 24
Total 27 32 43 102

1) Planteamiento de la hipótesis
Ho: No existe diferencia significativa en el número de perros presentes en un parque
en tres momentos distintos de acuerdo a su tamaño.
Ha: Si existe diferencia significativa en el número de perros presentes en un parque
en tres momentos distintos de acuerdo a su tamaño.
2) Nivel de significación α = 0.05

3) Estadístico de prueba
2
(𝑂𝑖 − 𝑂𝑒 )2
𝜒 =∑
𝑂𝑒
4) Regla de decisión

𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos

Domingo Pequeño Mediano Grande Total


Mañana 13 15 20 48
Tarde 8 9 13 30
Noche 6 8 10 24
Total 27 32 43 102

(9 − 13)2 (18 − 15)2 (21 − 20)2 (11 − 8)2 (6 − 9)2 (13 − 13)2
2
𝜒 = + + + + +
13 15 20 8 9 13
2 2 2
(7 − 6) (8 − 8) (9 − 10)
+ + +
6 8 10
𝜒 2 = 4,33

Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)

Grados de libertad = (3 – 1) (3– 1) = 2 x 2 = 4

– Valor calculado –> 4,33

– Valor de la tabla –> 9,49

6) Decisión

Como 4,33 < 9,49 𝑎𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 , y se concluye que no existe diferencia


significativa en el número de perros presentes en un parque en tres momentos
distintos de acuerdo al tamaño que estos poseen.

Ejercicio 7
En un estudio para determinar la preferencia por determinados sabores de helados en
diferentes regiones del país, se recopilaron los siguientes datos. (Frecuencias
observadas).

Sabor del
Costa Sierra Oriente Total
helado
Vainilla 86 44 70 200
Chocolate 45 30 50 125
Fresa 34 6 10 50
Mora 85 20 20 125
Total 250 100 150 500

1) Planteamiento de la hipótesis
Ho: No existe diferencia significativa en la preferencia por determinados sabores
de helados de acuerdo a las diferentes regiones del país.
Ha: Si existe diferencia significativa en la preferencia por determinados sabores
de helados de acuerdo a las diferentes regiones del país.

2) Nivel de significación α = 0.05

3) Estadístico de prueba
2
(𝑂𝑖 − 𝑂𝑒 )2
𝜒 =∑
𝑂𝑒

4) Regla de decisión

𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos

Sabor del
Costa Sierra Oriente Total
helado
Vainilla 100 40 60 200
Chocolate 62,5 25 37,5 125
Fresa 25 10 15 50
Mora 62,5 25 37,5 125
Total 250 100 150 500

(86 − 100)2 (44 − 40)2 (70 − 60)2 (45 − 62,5)2 (30 − 25)2
𝜒2 = + + + +
100 40 60 62,5 25
(50 − 37,5)2 (34 − 25)2 (6 − 10)2 (10 − 15)2
+ + + +
3,5 25 10 15
(85 − 62,5)2 (20 − 25)2 (20 − 37,5)2
+ + +
62,5 25 37,5
𝜒 2 = 37,87

Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)

Grados de libertad = (4 – 1) (3– 1) = 3 x 2 = 6

– Valor calculado –> 37,87


– Valor de la tabla –> 12,59

6) Decisión

Como 37,87 > 12,59 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂 , y se concluye que si existe diferencia


significativa en la preferencia por determinados sabores de helados de acuerdo a
las diferentes regiones del país.

Ejercicio 8
Un centro comercial compró y plantó 720 bulbos de tulipán de cuatro colores. Por
desgracia, no todos florecieron. El centro comercial desea determinar si los fracasos
eran independientes del color antes de comprar más bulbos de tulipán

Tulipanes Blanco Rojo Amarillo Morado Total


Florecieron 176 136 222 114 648
No florecieron 24 24 18 6 72
Total 200 160 240 120 720

1) Planteamiento de la hipótesis
Ho: No existe diferencia significativa en los florecimientos de tulipanes de
acuerdo a los diferentes colores que estos poseen.
Ha: Si existe diferencia significativa en los florecimientos de tulipanes de
acuerdo a los diferentes colores que estos poseen.

2) Nivel de significación α = 0.01


3) Estadístico de prueba
(𝑂𝑖 − 𝑂𝑒 )2
𝜒2 = ∑
𝑂𝑒

4) Regla de decisión

𝑆𝑖 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
𝑆𝑖 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos

Tulipanes Blanco Rojo Amarillo Morado Total


Florecieron 180 144 216 108 648
No florecieron 20 16 24 12 72
Total 200 160 240 120 720
(176 − 180)2 (136 − 144)2 (222 − 216)2 (114 − 108)2 (24 − 20)2
𝜒2 = + + + +
180 144 216 108 20
(24 − 16)2 (18 − 24)2 (6 − 12)2
+ + +
16 24 12
𝜒 2 = 10,33

Grados de libertad = (nº de filas – 1) por (nº de columnas – 1)

Grados de libertad = (2 – 1) (4– 1) = 1 x 3 = 3

– Valor calculado –> 10,33

– Valor de la tabla –> 11,34

6) Decisión

Como 10,33 < 11,34 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 , y se concluye que no existe diferencia


significativa en los florecimientos de tulipanes de acuerdo a los diferentes
colores que estos poseen.

Ejercicio 9
Los aficionados a las carreras de caballos sostienen que en una carrera alrededor de una
pista circular, los caballos tienen ventajas significativas acumuladas al ser colocados en
ciertas posiciones. Cualquier posición del caballo se asigna en la línea de salida. La
posición 1 es la más cercana al carril del interior de la pista; la posición 8 está en el
extremo, más alejada del carril en una carrera de ocho caballos. Podemos probar el
efecto de la posición analizando los resultados de la carrera, proporcionados de acuerdo
con la posición, durante el primer mes de la temporada, en una pista circular en
particular.
1) Formulación de hipótesis.
H0: No existe diferencia en el número esperado con el observado.
Ha: Las frecuencias teóricas no son iguales.
2) Nivel de significancia: α=0.05
3) Estadístico de prueba

(𝑂𝑖 − 𝑂𝑒 )2
𝜒2 = ∑
𝑂𝑒
4) Cálculos

(29 − 18)2 (19 − 18)2 (18 − 18)2 (25 − 18)2 (17 − 18)2
𝜒2 = + + + +
18 18 18 18 18
(10 − 18)2 (15 − 18)2 (11 − 18)2
+ + + = 16.3
18 18 18
Como: 𝑃(𝜒 2 ≥ 16.3), 𝑐𝑜𝑛 𝑔𝑙 = 𝑘 − 1 = 8 − 1 = 7 está entre 0.02<p<0.05, no
podemos rechazar H0 en ese nivel de significación.
Podría parecer que son necesarios más datos antes de que se llegue a cualquier
conclusión definitiva concerniente a 𝐻𝑎

Ejercicio 10

Un investigador aplica una prueba de vocabulario a un grupo de niños de 𝑁 = 103.


Con base en una investigación previa y la teoría que subyace a la prueba, la distribución
de las puntuaciones debería tener una distribución normal. La media de la muestra fue
de 108 y la distribución estándar 12.8. Con el propósito de aplicar la prueba chi
cuadrado de la bondad de ajuste para una muestra, se deben definir las categorías y
determinar las frecuencias esperadas. Escogemos 𝑘 = 10 intervalos para las
frecuencias. Los valores de corte (𝑑𝑒𝑛𝑜𝑡𝑎𝑑𝑜𝑠 𝑋𝑐𝑜𝑟𝑡𝑒 ) corresponderán a los deciles de la
distribución normal con media y desviación estándar proporcionadas por los datos.

El investigador clasificó todas las puntuaciones en categorías y obtuvo las siguientes


frecuencias: 8, 10, 13, 15, 10, 14, 12, 8, 7, 6. La frecuencia esperada en cada categoría
es 𝑁⁄𝑘 = 103/10 = 10.3. El investigador desea probar la hipótesis usando 𝛼 = 0.05. El
valor obtenido de 𝜒 2 es:

𝐻0 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑓𝑢𝑒𝑟𝑜𝑛 𝑡𝑜𝑎𝑚𝑑𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙.


𝐻𝑎 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑛𝑜𝑓𝑢𝑒𝑟𝑜𝑛 𝑡𝑜𝑎𝑚𝑑𝑜𝑠 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙.

𝛼 = 0.01

𝑔𝑙 = 𝑘 − 1 = 8 − 1 = 7

(8−10.3)2 (10−10.3)2 (13−10.3)2 (15−10.3)2 (10−10.3)2


𝜒2 = + + + + +
10.3 10.3 10.3 10.3 10.3
(14−10.3)2 (12−10.3)2 (8−10.3)2 (7−10.3)2 (6−10.3)2
+ + + + = 8.36
10.3 10.3 10.3 10.3 10.3

𝜒𝑡2 : 𝛼 = 0.05; 𝑔𝑙 = 𝑘 − 𝑛𝑝 − 1 = 10 − 2 − 1 = 7 = 14.07

Los datos fueron tomados de una población normal.


LA PRUEBA DE RACHAS DE UNA MUESTRA

Cuando no existe aleatoriedad, muchas de las herramientas estadísticas en las cuales se


confía son de poco uso o de ningún uso. Para comprobar la aleatoriedad se utiliza una
prueba de rachas.
Prueba de rachas. Prueba no paramétrica de aleatoriedad en el proceso de muestreo.
Racha. Una serie continúa de uno o más símbolos.

Formulación de la hipótesis

Ho: Los elementos de la muestra están mezclados aleatoriamente

Ha: Los elementos no están mezclados aleatoriamente

Procedimiento Rachas

1) Se calcula el número n1 de elementos de una clase identificadas por un símbolo y


n2 la cantidad de elementos de la otra.

2) Se ordenan los n = n1 + n2 sucesos en el orden en que ocurrieron.

3) Se cuenta el número r de rachas.

4) Se determina la probabilidad que ocurran r rachas, usando Ho, y se compara con el


nivel de significación α adoptado para aceptar o rechazar la Ho. También se puede
probar con el número de rachas.

Símbolos

n1 = número de ocurrencias tipo 1

n2 = número de ocurrencias tipo 2

r = número de corridas

Media del estadístico

2𝑛1 𝑛2
𝝁𝒓 = +1
(𝑛1 + 𝑛2 )

Cálculo del error estándar


√2𝑛1 𝑛2 (2𝑛1 𝑛2 − 𝑛1 − 𝑛2 )
𝝈𝒓 =
(𝑛1 + 𝑛2 )2 (𝑛1 + 𝑛2 − 1)

Elección de la distribución

La distribución de muestreo de r puede aproximarse mucho mediante la distribución


normal, si n1 o n2 es mayor que 20

Interpretación de resultados

Si el estadístico muestral r cae dentro de la región de aceptación es válida la hipótesis


nula y concluir que los elementos están siendo introducidos en modo aleatorio

Ejercicio 1
Suponga que se seleccionan los empleados para un programa de entrenamiento. Si la
selección no depende de si el empleado es de sexo masculino (m) o femenino (f), se
esperaría que el género fuera un evento aleatorio. Sin embargo, si se detecta algún
patrón en el género, se puede asumir que la aleatoriedad está ausente y que la selección
se hizo, por lo menos en parte, con base en el género de un trabajador. Si existe un
número inusualmente grande o inusualmente pequeño de rachas, se sugiere un patrón.
Así, por ejemplo
_____________________________________________
mmm ffffff mmm
_________________________________________
1 2 3
_____________________________________________
Tres rachas existen en esta muestra. Tres hombres, seguidos de seis mujeres y luego tres
hombres. Aparentemente existe ausencia de aleatoriedad. Consideremos ahora que el
orden de selección es
_______________________________________
m f m f m f m f m f m f m f m f
_______________________________________
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
_______________________________________
De nuevo, parece existir un patrón que produce un número inusualmente grande de 16
rachas independientes.
Detección de un patrón. Si se presentan muy pocas o demasiadas rachas, puede estar
ausente la aleatoriedad.
Un conjunto de hipótesis para probar es:

H0: Existe aleatoriedad en la muestra.


H1: No existe aleatoriedad en la muestra.

Para probar la hipótesis se debe determinar si el número de rachas r es demasiado


grande o demasiado pequeño. Las Tablas de valores críticos de r en la prueba de rachas
muestran el número de rachas si  es 5%. Supongamos ahora que las selecciones
fueron:
__________________________________________
m fff mmm ff mmm
1 2 3 4 5
__________________________________________

Las selecciones parecen más aleatorias porque no existe patrón evidente. Se nota que n1
= 7 es el número de hombres y n2 = 5 es el número de mujeres.

La tabla M1 muestra el número crítico mínimo de rachas para un valor de  de 5%.. Si


el número de rachas es igual o menor que el valor mostrado en la tabla M1, se sugiere
que al nivel del 5% hay muy pocas rachas como para confirmar la hipótesis nula de
aleatoriedad. Debido a que n1 = 7 y n2 = 5, se halla el valor críticamente bajo que es 3.
Debido a que el número de rachas excede este mínimo, entonces no hay un número
significativamente bajo de rachas como para garantizar el rechazo de la hipótesis nula.
La tabla M2 proporciona valores críticamente altos para r. si el número de rachas en una
muestra es igual o mayor que estos valores, se puede concluir que existe un número
extremadamente grande de rachas, lo que sugiere la ausencia de aleatoriedad. Para n1 =
7 y n2 = 5, la tabla M2 revela que el número máximo de rachas es 11. Si el número de
rachas es superior a 11, existen demasiadas como para sustentar la hipótesis de
aleatoriedad. Debido a que el número de rachas es menor que 11, no es
significativamente alto y no se rechaza la hipótesis nula al nivel del 5%.

Ejercicio 2
Se asumen niveles de producción diarios en una mina de carbón seleccionada para un
estudio estadístico, y éstos son, 31, 57, 52, 22, 24, 59, 25, 29, 27, 44, 43, 32, 40, 37, y
60 toneladas. La mediana de 37 puede utilizarse como valor de referencia. Las
observaciones caen o por arriba (A) o por abajo (B) de 37, produciendo 8 rachas de:
___________________________________________________
31 57 52 22 24 59 25 29 27 44 43 32 40 60
___________________________________________________
B A A B B A B B B A A B A A
1 2 3 4 5 6 7 8
___________________________________________________
Con n1=7 para B y n2 = 7 para A, la tabla M revela valores críticos de 3 y 13 rachas.
Debido a que hay 8 rachas, se asume que hay aleatoriedad y no se rechaza la hipótesis
nula.

Ejercicio 3
En un estudio de la dinámica de la agresión en niños pequeños, un investigador observó
pares de niños en una situación de juego controlada.' La mayoría de los 24 niños que
sirvieron como sujetos en el estudio provenían de la misma guardería y, por tanto,
jugaban juntos diariamente. Ya que el observador fue capaz de ingeniarse para observar
sólo dos niños en cualquier día, estaba interesado en que podrían haberse introducido
sesgos en el estudio por discusiones entre aquellos niños que ya habían servido como
sujetos y aquellos que sirvieron posteriormente. Si tales discusiones tenían algún efecto
en el nivel de agresión en las sesiones de juego, este efecto podría mostrarse corno una
carencia de aleatoridad en las puntuaciones de agresión en el orden en que fueron
colectadas. Después de concluido el estudio, la aleatoriedad de la secuencia de
puntuaciones fue probada al convertir la puntuación de agresión de cada niño a un signo
más o un signo menos, dependiendo de si se encontraba por arriba o por abajo de la
mediana del grupo, y aplicando entonces la prueba de una muestra de series para la
secuencia observada de signos "más" y signos "menos".
1. Hipótesis nula. H0: los signos "más" y los signos "menos" ocurren en un orden
aleatorio.
Esto es, la hipótesis nula consiste en que las puntuaciones de agresión ocurren
aleatoriamente a través del experimento por arriba y por debajo de la mediana.
H1: El orden de los signos " más" y " menos" depende de la aleatoriedad.
2. Prueba estadística. Ya que la hipótesis concierne a la aleatoriedad de una
secuencia simple de observaciones, se elige la prueba de una muestra de series.
3. Nivel de significación. Sea a = 0 .05 y N el número de sujetos = 24. Ya que las
puntuaciones estarán caracterizadas como un signo "más" o un signo "menos",
dependiendo de si se encuentran por arriba o por abajo de la puntuación mediana
en el grupo, m = n = 1 2.
4. Distribución muestral. En la tabla F de Anexos se proporcionan los valores
críticos de r de la distribución muestral.
5. Región de rechazo. Puesto que H1 no predice la dirección de la desviación de la
aleatoriedad, se usó una prueba bidireccional. Ya que m = n = 1 2, la referencia
de la tabla F muestra que H0 podría ser rechazada en el nivel 0.05 de
significación, si la r observada es igual o menor que 7 o igual o mayor que 1 9.
6. Decisión. En la tabla 3. 5 se muestran las puntuaciones de agresión para cada
niño en el orden en que fueron obtenidas. La mediana del conjunto de
puntuaciones es 25.5. En la tabla 3.5, todas las puntuaciones que se encuentran
por debajo de la mediana están designadas por un signo "menos"; todas las
puntuaciones que se encuentran por arriba de la mediana están denotadas por un
signo "más". En la columna que muestra los signos + y - , se puede ver
rápidamente que ocurrieron 1 0 series en el conjunto de observaciones, esto es, r
= 10. La referencia de la tabla de Anexos I revela que r = 1 0 para m = n = 1 2,
no se encuentra e n la región de rechazo.
Así, no podemos rechazar la hipótesis de que la serie de observaciones ocurrió
en un orden aleatorio.

Ejercicio 4

1.-En una escuela 12 niños y 12 niñas de 4 años de edad observados durante dos
sesiones de juego de 15 minutos, el juego fue calificado por incidencia y grado de
agresión. Con estos puntajes es posible probar la hipótesis que hay diferencias sexuales
en la cantidad de agresión exhibida.

Niños(h) Niñas(m)
86 55
69 40
72 22
65 58
113 16
65 7
118 9
45 16
141 26
104 36
41 20
50 15
7 9 15 16 16 20 22 26 36 40
m m m m m m m m m m
41 45 50 55 58
h h h h h
65 65 69 72 86 104 113 118 141
h h h h h h h h h
Se colocan los puntajes n1+ n2 en una sola serie ordenada se determina el número de
rachas r=7

HIPÓTESIS

Ho: La incidencia y el grado de agresión son los mismos en los niños de cuatro años de
ambos sexos

Ha: Los niños y niñas de cuatro años de edad muestran diferencias en la incidencia y el
grado de agresión

NIVEL DE SIGNIFICACIÓN

alfa=0.05 n1 = 12 número de niños n2 = 12 número de niñas

REGLA DE DECISIÓN

Si valor observado de r es igual o menor que el valor tabulado de n1 =12 y n2 =12,


Ho se rechaza a un nivel de significación 0.05

La tabla muestra que para los valores de n1=12 y n2=12, una r de 7 es significativa al
nivel de 0.05.

Ya que el valor de r es menor que el tabulado, se puede rechazar la Ho, concluyendo


que los niños y las niñas muestran diferencias en la agresión en la situación de juego
libre.

Ejercicio 5

Ejercicio para muestras grandes.

Un investigador estaba interesado en averiguar si la disposición de hombres y mujeres


en una fila enfrente de la taquilla de un teatro era un arreglo aleatorio. Los datos se
obtuvieron simplemente anotando el sexo de cada una de 50 personas al aproximarse a
la taquilla.
ORDEN DE LAFILA DE LA OFICINA DE UN TEATRO
30 hombres – 20 mujeres

1. Planteamiento de hipótesis
Ho: el orden de hombres y mujeres en la fila es aleatorio.
Ha: el orden de hombres y mujeres en la fila no es aleatorio.
2. Prueba estadística. Se elige la prueba de una muestra de series ya que la
hipótesis concierne a la aleatoriedad en una secuencia de observaciones. Puesto
que el tamaño de la muestra es grande, se usa una prueba para muestras grandes.
3. Estadístico de prueba
α= 0,05
4. Distribución muestral Para muestras grandes, los valores de z cuando H0 es
verdadera, están distribuidos de manera aproximada normalmente con media 0 y
desviación estándar l
5. Cálculos

r= 35

n= 50

2𝑚𝑛
𝜇𝑟 = +1
𝑁
2(30)(20)
𝜇𝑟 = +1
50
𝝁𝒓 = 25

2𝑚𝑛(2𝑚𝑛 − 𝑁)
𝜎𝑟 = √
𝑁 2 (𝑁 − 1)

2(30)(20)(2(30)(20)) − 50)
𝜎𝑟 = √
(50)2 (50 − 1)

𝝈𝒓 = 3,36
𝑟 − 𝜇𝑟
𝑧=
𝜎𝑟

35 − 25
𝑧=
3,36
𝒛 = 2,98

1,96= 2 colas

2,98 Rechazo Ho

6. Decisión

Ya que 2.83 es mayor que el valor crítico de z (1.96), podemos rechazar la hipótesis de
aleatoriedad. Con el 95% de confianza el orden de hombres y mujeres en la fila no es
aleatorio.

LA PRUEBA DE MACNEMAR

La prueba de McNemar se utiliza para decidir si puede o no aceptarse que determinado


''tratamiento'' induce un cambio en la respuesta dicotómica o dicotomizada de los
elementos sometidos al mismo, y es aplicable a los diseños del tipo ''antes-después'' en
los que cada elemento actúa como su propio control.

Los resultados correspondientes a una muestra de n elementos se disponen en una tabla


de frecuencias 2 x 2 para recoger el conjunto de las respuestas de los mismos elementos
antes y después. El aspecto general de dicha tabla, en la que los signos + y - se utilizan
para representar las diferentes respuestas, es el siguiente:

Antes/Después - +
- a b
+ c d

En las celdas de la tabla, a es el número de elementos cuya respuesta es la misma, -; b


es el número de elementos cuya respuesta es - antes del ''tratamiento'' y + después de
éste; c es el número de elementos que han cambiado de + a -; y d es el número de
elementos que mantienen la respuesta +.

Por tanto, b+c es el número total de elementos cuyas respuestas han cambiado, y son los
únicos que intervienen en el contraste. La hipótesis nula es que el ''tratamiento'' no
induce cambios significativos en las respuestas, es decir, los cambios observados en la
muestra se deben al azar, de forma que es igualmente probable un cambio de + a - que
un cambio de - a +. Así pues, si H0 es cierta, de los b+c elementos cuya respuesta ha
cambiado es de esperar que (b+c)/2 hayan pasado de + a -, y (b+c)/2 hayan pasado de -
a +. En otras palabras, si H0 es cierta, la frecuencia esperada en las correspondientes
celdas es (a+b)/2.

La hipótesis alternativa puede ser no direccional, cuando postula que la probabilidad de


un cambio de + a - tiene distinta probabilidad que un cambio de - a +, o direccional,
cuando predice que un cambio de - a + es más (o menos) probable que un cambio de + a
-.

El estadístico de prueba que permite contrastar si existen diferencias significativas entre


las frecuencias esperadas y las observadas es:

Oi= frecuencia observada en la i-ésima celda

Ei = frecuencia esperada en la i-ésima celda si H0 es cierta

k = número de celdas

Para contrastar la significación de los cambios interesan sólo las celdas que recogen
cambios, por tanto el estadístico puede expresarse como

Si H0 es cierta, el estadístico tiene distribución aproximadamente chi-cuadrado con 1


grado de libertad. La aproximación es más precisa si se realiza la corrección de
continuidad de Yates, quedando el estadístico:

La hipótesis nula, de que ambos tipos de cambio son igualmente probables, se rechaza
si el valor del estadístico se encuentra en la región crítica.

Cuando la frecuencia esperada (b+c)/2 es pequeña la aproximación de la distribución


del estadístico de prueba a la chi-cuadrado no es buena y, en tal caso, el SPSS no
calcula el estadístico anterior, sino que realiza la prueba binomial. El contraste se
plantea en este caso de la siguiente forma: supongamos que c<b; en este caso la
hipótesis nula es que c es un valor de una variable X con distribución binomial de
parámetros n=b+c y =0,5. El nivel de significación para una prueba de dos colas es
y se rechazará H0 para niveles de significación iguales o
superiores a éste. Si la hipótesis alternativa es direccional el nivel de significación a
partir del cual se rechazará H0 es la mitad del nivel de significación bilateral.

Ejercicio 1

Un investigador en medicina preventiva observa que los empleados en una fábrica


padecen frecuentemente un cuadro diarreico, motivo de gran ausencia. Todos los
empleados comen en el comedor de la fábrica como goce de una prestación laboral. El
investigador supone que el común denominador de la causa de la diarrea es el sitio de
ingestión de alimentos, es decir, existe una higiene inadecuada en la preparación de la
comida; sin embargo, la higiene personal de los empleados no es suficiente para atribuir
toda la culpa al personal de la cocina. Por lo tanto, elige una muestra al azar de 50
individuos, de los cuales resulta que 34 de ellos presentan un cuadro diarreico frecuente
y 16 no lo padecen. Así, sugiere que, bajo vigilancia, se apliquen medidas de higiene
personal, consistentes en exhaustivo lavado de manos antes de ingerir alimentos, en un
período de dos semanas.

Al finalizar el tratamiento, obtiene los resultados siguientes: de los 34 sujetos con un


cuadro diarreico frecuente, después del tratamiento de lavado de manos, 16 lograron
hacer desaparecer el proceso intestinal y 18 persistieron con evacuaciones diarreicas; a
su vez, el grupo de 16 personas asintomáticas, cuatro de ellas presentaron diarrea a
pesar del lavado de manos y 12 se mantuvieron en las mismas condiciones.

Planteamiento de la hipótesis

 Ho: Las diferencias que se observan en las frecuencias de cambio por el lavado
de manos se deben al azar.
 Ha: El lavado de manos, como medida preventiva y factor de higiene personal,
presenta cambios significativos de enfermedad diarreica en los empleados que
asisten al comedor de la fábrica en estudio.

Nivel de significación.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.

Zona de rechazo

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Resultado de la contingencia 2 X 2.

Aplicación de la prueba estadística.


Cálculo de los grados de libertad: gl = 1.

El estadístico X2 de McNemar se compara con los valores críticos de ji cuadrada. Con


un grado de libertad, se observa que 3.84 corresponde a una probabilidad de 0.05,
mientras que el cálculo corresponde a una probabilidad menor que 0.05.

Decisión.

En razón de que el valor de X2 calculado tiene una probabilidad menor que 0.05, cae en
el nivel de significancia, por lo tanto, se acepta Ha y se rechaza Ho. Es decir que
El lavado de manos ejerció significativos cambios en la enfermedad diarreica de los
empleados de la fábrica, lo cual significa que la higiene personal deficiente contribuye
de manera notoria en la frecuencia del proceso intestinal, causa del ausentismo.

La aplicación de la prueba estadística no cancela la participación de la higiene


defectuosa en la preparación de los alimentos por parte del personal de la cocina, pues
4/16 empleados, que habían estado asintomáticos y bajo exhaustivo lavado de manos
antes de comer, manifestaron diarrea; sin embargo, la prueba estadística revela que la
higiene personal participa de manera más significativa que el defecto en la preparación
de la comida.

Ejercicio 2
En un debate televisivo a nivel nacional entre 2 candidatos presidenciales, se toma una
muestra de 100 personas a quienes se les pregunta sobre sus candidatos antes del debate
y 84 resultaron convencidos por el candidato demócrata y 16 al candidato republicano.
Después del debate las mismas 100 personas son vueltas a preguntar acerca de sus
preferencias, y del grupo de personas que favorecieron al demócrata cambian
exactamente ¼ de ellos su manera de pensar y también ¼ de los republicanos.
Ejercicio 3
Se desea saber si los niños que lleguen a una guardería tienen la misma inclinación por
relaciones con otros niños o con un adulto el primer día de clases que un mes después.
Planteamiento de hipótesis
Ho: los niños tienen la misma inclinación de relacionarse con otros niños
Ha: los niños no tienen la misma inclinación de relacionarse con otros niños.
Grados de libertad: como es una tabla de 2x2 tenemos un grado de libertad de 1
Estadístico de prueba: McNemar

Regla de decisión;
Si X2 cal es> que X2tab se rechaza la Ho.

X2 de tablas es mayor que 4.5 con una P<0.025 nos da 5.02 por lo que se rechaza la Ho
por lo tanto los niños muestran una tendencia significativa a cambiar su preferencia por
relacionarse con otros niños conforme pasa el tiempo.

Ejemplo 4
Como ejemplo, que se quiere analizar la asociación entre sexo y opinión sobre el
divorcio (favorable o desfavorable, sí, no) en personas casadas. Se ha llevado a cabo
una encuesta en la que cincuenta parejas han sido entrevistadas a fin de evitar la
influencia de otras variables que nunca se incluyen en el análisis (situación económica,
edad, clase social, etc. .).
Planteamiento de hipótesis
Ho: si existe relación entre sexo y opinión sobre el divorcio en las personas casadas.
Ha: no tienen ninguna relación entre sexo y opinión sobre el divorcio en las personas
casadas.

Nivel de significación: 0.05


Grados de libertas: como tenemos una tabla de 2x2 el gl es 1
Estadístico de prueba:

Regla de decisión:
Si X2 cal es > que X2tab se rechaza la Ho

Calculo:

6.66>3.84 se rechaza la hipótesis nula


Decisión:
No existe ninguna relación entre el sexo y la opinión sobre el divorcio en las personas
casadas.
PRUEBA DE LOS SIGNOS

Una prueba no paramétrica utilizada comúnmente para tomar decisiones en relación a


diferencias entre poblaciones como contraparte de la distribución t, la cual requiere el
supuesto de normalidad de ambas poblaciones. La prueba de signos es útil cuando no se
cumple este supuesto.
Se supone que se tienen datos antes y después para una muestra y se desean comparar
estos conjuntos de datos correspondientes. Se hace restando las observaciones por pares,
y se anota el signo algebraico resultante. No es importante la magnitud de la diferencia,
sino solo si resulta un signo más o un signo menos.

La prueba de los signos permite contrastar la hipótesis de que las respuestas a dos
''tratamientos'' pertenecen a poblaciones idénticas. Para la utilización de esta prueba se
requiere únicamente que las poblaciones subyacentes sean contínuas y que las
respuestas de cada par asociado estén medidas por lo menos en una escala ordinal.

La hipótesis nula puede expresarse como:

Siendo Xi la respuesta del elemento i-ésimo al primer ''tratamiento'' e Yi la respuesta del


elemento i-ésimo al segundo ''tratamiento''.

La hipótesis alternativa puede ser direccional, cuando postula que X es estocásticamente


mayor (o menor) que Y, o no direccional, cuando no predice la dirección de la
diferencia.

Para realizar el contraste se hallan los signos (+ o -) de las diferencias no nulas entre las
respuestas de los dos componentes de cada par y se cuenta cuántas son positivas, S+, y
cuántas negativas, S-. Si H0 es cierta, es de esperar que aproximadamente la mitad de
las diferencias sean positivas y la otra mitad negativas.

El estadístico de prueba es S= mín [S+, S-].


Si H0 es cierta, S tiene distribución binomial de parámetros n= nº de diferencias nulas y
= 0'5. Si n es grande, la distribución de S puede aproximarse mediante una normal
de parámetros y la decisión dependerá del
valor tipificado de S. Para mejorar la aproximación se realiza una corrección de
continuidad, de forma que el estadístico de prueba es:

Z se distribuye según una normal tipificada.

Cuando el número de diferencias no nulas es pequeño la aproximación de la


distribución de S mediante la normal no es buena y en este caso el SPSS realiza
directamente la prueba binomial, dando el nivel de significación a partir del cual se
rechaza H0 en un contraste de dos colas. Si el contraste se realiza a una cola dicho nivel
de significación se reduce a la mitad.

Ejercicio 1

Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de llantas
regulares con cinturón mejora la economía de combustible. Se equipan 16 automóviles
con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de
conductores, se equipan los mismos autos con llantas regulares con cinturón y se
manejan una vez más por el recorrido de prueba. Se registra el consumo de gasolina, en
kilómetros por litro, de la siguiente manera:

Llantas con
Automóvil Llantas radiales
cinturón

1 4.2 4.1

2 4.7 4.9

3 6.6 6.2

4 7.0 6.9

5 6.7 6.8

6 4.5 4.4

7 5.7 5.7

8 6.0 5.8

9 7.4 6.9

10 4.9 4.9
11 6.1 6.0

12 5.2 4.9

13 5.7 5.3

14 6.9 6.5

15 6.8 7.1

16 4.9 4.8

¿Se puede concluir en el nivel de significancia de 0.05 que los autos equipados con
llantas radiales obtienen mejores economías de combustible que los equipados con
llantas regulares con cinturón?

Planteamiento de hipótesis

H0: Las llantas regulares con cinturón mejoran la economía de combustible


HA: Las llantas radiales mejoran la economía de combustible

Nivel de significancia: α= 0.05

Regla de decisión:

Si zR 1.645 no acepta Ho.

Si zR> 1.645 se rechaza Ho.

Se procede a realizar las diferencias entre de los kilómetros por litro entre llantas
radiales y con cinturón:

Automóvil Llantas radiales Llantas con cinturón d

1 4.2 4.1 +

2 4.7 4.9 -

3 6.6 6.2 +

4 7.0 6.9 +

5 6.7 6.8 -

6 4.5 4.4 +

7 5.7 5.7 0

8 6.0 5.8 +
9 7.4 6.9 +

10 4.9 4.9 0

11 6.1 6.0 +

12 5.2 4.9 +

13 5.7 5.3 +

14 6.9 6.5 +

15 6.8 7.1 -

16 4.9 4.8 +

Al observar las diferencias se ve que sólo existe una n=14, ya que se descartan los
valores de cero. Se tiene r+ = 11

Decisión

Como 2.14 > 1.645 se rechaza H0 y se concluye con un nivel de significancia de 0.05
las llantas radiales mejoran la economía de combustible.

Ejercicio 2
Un analista de mercado desea medir la efectividad de una campaña promocional del
producto de su empresa. Antes de la campaña, selecciona 12 tiendas minoristas y
registra las ventas del mes. Durante el segundo mes se termina la campaña promocional
y se registran de nuevo las ventas. La Tabla 1.3 muestra los niveles de ventas, junto con
el signo algebraico que resulta cuando las ventas del segundo mes se restan de las del
primer mes.

Ventas para doce tiendas minoristas

Tienda Antes Después Signo

1 $4200 $4000 +

2 $5700 $6000 -

3 $3800 $3800 0

4 $4900 $4700 +

5 $6300 $6500 -

6 $3600 $3900 -
7 $4800 $4900 -

8 $5800 $5000 -

9 $4700 $4700 0

10 $5100 $5200 -

11 $8300 $7200 +

12 $2700 $3300 -

Se desea probar la hipótesis de que la promoción incrementó las ventas con un nivel de
significancia del 5%. Esta es una prueba de extremo derecho, como se muestra
enseguida:

H0: m  p
H1: m > p
Pregunta: ¿Qué haría que se rechazara la hipótesis nula?
1) un número significativamente grande de signos menos
2) un número significativamente pequeño de signos más

Número de signos menos = 6


Número de signos más = 4
Los valores que resultan en una diferencia de cero se eliminan.
La Tabla de Distribución Binomial establece que la probabilidad de seis o más signos
menos es:
p( m  6 | n  10 ,  0.5 )  1  P ( X  5 )
 1  0.6230
 0.3770

Este valor de 0.3770 es la probabilidad de obtener seis o más signos menos (o cuatro o
menos signos más) si la probabilidad de ocurrencia de cualquier signo es de  = 0.5. Se
nota que si el número de signos menos fuera inusitadamente grande, se rechazaría la
hipótesis nula. Sin embargo, 6 no es un número grande. La probabilidad de su
ocurrencia es mayor que un  de 0.5%, el evento de 6 signos menos no se considera
grande, y la hipótesis nula de que H0: m  p no se rechaza, por lo tanto no se puede
considerar que la promoción haya sido exitosa.

Ejercicio 3
Un restaurante italiano cercano a un campus universitario está considerando la
posibilidad de utilizar una nueva receta para hacer la salsa que echa a las pizzas. Se
elige una muestra aleatoria de ocho estudiantes y se pide a cada uno que valore en una
escala de 1 a 10 su opinión sobre la salsa original y sobre la salsa propuesta. La Tabla
15.1 muestra las valoraciones obtenidas en la comparación; los números más altos
indican que gusta más el producto. ¿Indican los datos una tendencia general a preferir la
nueva salsa a la original?

Valoración de la salsa de pizza por parte de los estudiantes.

La hipótesis nula de interés es que en la población en general no hay una tendencia


general a preferir un producto al otro. Para evaluar esta hipótesis, comparamos los
números que expresan una preferencia por cada producto, descartando los que valoran
los productos por igual. En este ejemplo, los valores del estudiante G se omite n y el
tamaño efectivo de la muestra se reduce a n = 7. La única información muestral en la
que se basa nuestro contraste es que dos de los siete estudiantes prefieren el producto
original. Por lo tanto, el estadístico del contraste es S = 2.
La hipótesis nula puede concebirse como la hipótesis de que la mediana poblacional de
las diferencias es 0. Si la hipótesis nula fuera verdadera, nuestra secuencia de
diferencias + y - podría concebirse como una muestra aleatoria extraída de una
población en la que las probabilidades de + y - son 0,5 cada una. En ese caso, las
observaciones constituirían una muestra aleatoria extraída de una población binomial en
la que la probabilidad de + es 0,5. Por 10 tanto, si P representa la verdadera proporción
de + que hay en la población (es decir, la verdadera proporción de la población que
prefiere la salsa original), la hipótesis nula es simplemente
Ho: P = 0,5 No hay una tendencia general a preferir uno de los productos al otro
Se utiliza un contraste de una cola para averiguar si existe una tendencia general a
preferir la nueva salsa a la original. La alternativa de interés es que la mayoría de la
población prefiere el nuevo producto. Esta alternativa se expresa de la forma siguiente:
HI:P < 0,5 La mayoría prefiere el nuevo producto (0 menos del 50% prefiere el
producto original)
A continuación, hallamos la probabilidad de observar en la muestra un resultado tan
extremo
0 más que el que se obtendría si la hipótesis nula fuera, en realidad, verdadera.
Este valor es el p-valor del contraste. Si representamos por medio de P(x) la
probabilidad de observar x «éxitos» (+) en n = 7 pruebas binomiales, cada una con una
proba-bilidad de éxito de 0,5, entonces la probabilidad binomial acumulada de observar
dos o menos + puede obtenerse utilizando la formula binomial, una tabla binomial 0 un
programa informático como Microsoft Excel. El p-valor se halla por medio de la
ecuación 15.2:
P-valor = P(x ~ 2) = P(x = 0) + P(x = 1) + P(x = 2) = 0,0078 + 0,0547 + 0,1641 =
0,2266
Con un p-valor tan grande, no podemos rechazar la hipótesis nula y concluimos que los
datos no son suficientes para sugerir que los estudiantes prefieren la nueva salsa.
Asimismo, podríamos haber dicho que si adoptamos la regla de decisión «rechazar Ho
si hay dos 0 menos + en la muestra», entonces la probabilidad de que la hipótesis nula
se rechace cuando en realidad es verdadera es 0,2266. Por 10 tanto, ese contraste tiene
un p-valor de 22,66 por ciento. Dado que el p-valor es el nivel de significación más bajo
al que puede rechazarse la hipótesis nula, en este ejemplo la hipótesis nula puede
rechazarse al 22,66 por ciento 0 más. Es improbable que alguien estuviera dispuesto a
aceptar un nivel de significación tan alto. Una vez más, concluimos que los datos no son
estadísticamente significativos para recomendar un cambio de salsa. Quizá nuestra
decisión se debe a que tenemos un pequeño número de observaciones muestrales.

Ejercicio 4
Una empresa que produce baterías, afirma que la vida útil media de las baterías es
mayor a 250. Con un nivel de significancia probar que

271 230 198 275 282 225 289 219


253 216 262 288 236 291 253 224
269 295 211 252 294 243 272 268

+ - - + + - + -
+ - + + - + + -
+ + - + + - + +

(+) = 15; (−) = 9


𝑁 = 24
𝛼 = 0.05

𝐻0 : 𝜇 ≤ 250.
𝐻𝑎 : 𝜇 > 250

𝑋 − 𝑁𝑝
𝑍=
√𝑁𝑝𝑞

𝑋 = 15 − 0.5 = 14.5

14.5 − [(24)(0.5)]
𝑍= = 1.02
√(24)(0.5)(0.5)

Se acepta la 𝐻0 .

Al nivel de confianza del 95% se dice la vida útil promedio de las baterías es
menor o igual a 250.
Ejercicio 5

Una muestra de 40 calificaciones de un examen se muestra en la siguiente tabla, probar


la hipótesis con el 0.05 de nivel de significancia de que la mediana de las calificaciones
de todos los participantes es 66, resolver utilizando la prueba de signos.

71 67 55 64 82 66 74 58 79 61
78 46 84 83 72 54 78 86 48 52
67 93 70 43 70 73 57 64 60 83
73 40 78 70 64 86 76 62 95 66

+ + - - + 0 + - + -
+ - + + + - + + - -
+ + + - + + - - - +
+ - + + - + + - + 0

(+) = 23; (−) = 15; 𝑐𝑒𝑟𝑜𝑠 = 2


𝑁 = 38
𝛼 = 0.05

𝐻0 : 𝜇 = 66
𝐻𝑎 : 𝜇 ≠ 66

𝑋 − 𝑁𝑝
𝑍=
√𝑁𝑝𝑞

𝑁𝑝 = (38)(0.5) = 19

23 − [(38)(0.5)]
𝑍= = 1.14
√(38)(0.5)(0.5)

Se acepta la 𝐻0 .
Al nivel de confianza del 95% se dice la mediana de las calificaciones de todos los
estudiantes es de 66.

LA PRUEBA DE WILCOXON

Cuando se trata de variables medibles en por lo menos una escala ordinal y pueden
suponerse poblaciones continuas la prueba no paramétrica más potente es la de
Wilcoxon.

La hipótesis nula del contraste postula que las muestras proceden de poblaciones con la
misma distribución de probabilidad; la hipótesis alternativa establece que hay
diferencias respecto a la tendencia central de las poblaciones y puede ser direccional o
no.
El contraste se basa en el comportamiento de las diferencias entre las puntuaciones de
los elementos de cada par asociado, teniendo en cuenta no sólo el signo, sino también la
magnitud de la diferencia.

Sea la diferencia entre las puntuaciones de la pareja i-ésima; si alguna de


estas diferencias es nula la pareja
correspondiente se elimina del análisis, de forma que el tamaño de la muestra es n, el
número de diferencias no nulas. A continuación se asignan rangos desde 1 hasta n
atendiendo únicamente al valor absoluto de las di y se suman los rangos
correspondientes a las diferencias positivas y a las diferencias negativas por separado.
Si la hipótesis nula es cierta, X e Y tienen el mismo valor central y es de esperar que los
rangos se distribuyan aleatoriamente entre las diferencias positivas y negativas y, por
tanto, que ambas sumas de rangos sean aproximadamente iguales. El estadístico de
prueba, T, es la menor de las dos sumas de rangos. Cuando n > 15 la distribución
muestral de T bajo el supuesto de que H0 es cierta se aproxima a una normal de
parámetros:

El estadístico de prueba es el valor Z:

que se distribuye según una normal


tipificada.

Para el nivel de significación deseado se rechazará la hipótesis nula si Z pertenece a la


región crítica localizada en las dos colas o en una cola de la normal tipificada, según la
naturaleza de la hipótesis alternativa.

Ejercicio 1
Se realizó un estudio comparativo en el cual se evaluó la efectividad de dos métodos,
uno tradicional y uno moderno de enseñanza del álgebra. En ese estudio 14 individuos
fueron extraídos al azar de la población de interés y se formaron 7 pares en base a su
coeficiente intelectual. Los miembros de cada par fueron asignados al azar a uno de los
dos métodos de enseñanza, y posteriormente ambos grupos fueron instruidos durante 3
semanas. Todos los estudiantes rindieron el mismo examen al final del período de
instrucción y los resultados obtenidos fueron los siguientes:

Par Moderno Tradicional


1 31 36
2 42 38
3 44 33
4 48 36
5 51 53
6 57 49
7 62 52
Ejercicio 2
Los siguientes datos representan el número de horas que un compensador opera antes de
requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2 y 1.7. Utilice la prueba
de rango con signo para probar la hipótesis en el nivel de significancia de 0.05 que este
compensador particular opera con una media de 1.8 horas antes de requerir una recarga.

Planteamiento de hipótesis

H0; µ= 1.8
H1; µ ≠ 1.8

Se procederá a efectuar las diferencias y a poner rango con signo a los datos.

Dato di = dato - 1.8 Rangos

1.5 -0.3 5.5

2.2 0.4 7

0.9 -0.9 10

1.3 -0.5 8

2.0 0.2 3

1.6 -0.2 3

1.8 0 Se anula

1.5 -0.3 5.5

2.0 0.2 3

1.2 -0.6 9

1.7 -0.1 1

Regla de decisión

Para una n = 10, después de descartar la medición que es igual a 1.8, la tabla A.16
muestra que la región crítica es w 8.

Cálculos

w+ = 7 + 3 + 3 = 13

w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42

por lo que w = 13 (menor entre w+ y w-).

Decisión

Como 13 > 8, no se rechaza H0 y se concluye con un nivel de significancia de 0.05 el


tiempo promedio de operación no es significativamente diferente de 1.8 horas.

Ejercicio 3

Se afirma que un estudiante universitario de último año puede aumentar su calificación


en el área del campo de especialidad del examen de registro de graduados en al menos
50 puntos si de antemano se le proporcionan problemas de muestra. Para probar esta
afirmación, se dividen 20 estudiantes del último año en 10 pares de modo que cada par
tenga casi el mismo promedio de puntos de calidad general en sus primeros años en la
universidad. Los problemas y respuestas de muestra se proporcionan al azar a un
miembro de cada par una semana antes del examen. Se registran las siguientes
calificaciones del examen:

Con Sin
problemas problemas
Par
de de
muestra muestra

1 531 509

2 621 540

3 663 688

4 579 502

5 451 424

6 660 683

7 591 568

8 719 748

9 543 530

10 575 524

Pruebe la hipótesis nula en el nivel de significancia de 0.05 de que los problemas


aumentan las calificaciones en 50 puntos contra la hipótesis alternativa de que el
aumento es menor a 50 puntos.

La prueba de rango con signo también se puede utilizar para probar la hipótesis nula
1- 2 = d0. En este caso las poblaciones no necesitan ser simétricas. Como con la prueba
de signo, se resta d0 de cada diferencia, se clasifican las diferencias ajustadas sin
importar el signo y se aplica el mismo procedimiento.

En este caso d0 = 50, por lo que se procede a calcular las diferencias entre las muestras y
luego restarles el valor de 50. Se representara con 1 y 2 la calificación media de
todos los estudiantes que resuelven el examen en cuestión con y sin problemas de
muestra, respectivamente.

Planteamiento de hipótesis

H0; 1 - 2 = 50
H1; 1 - 2 < 50

Nivel de significancia: α= 0.05

Regla de decisión

Para n=10 la tabla muestra que la región crítica es w+ 11.

Cálculos

Con Sin
problemas problemas di –
Par di Rangos
de de d0
muestra muestra

1 531 509 22 -28 5

2 621 540 81 31 6

-
3 663 688 -75 9
25

4 579 502 77 27 3.5

5 451 424 27 -23 2

-
6 660 683 -73 8
23

7 591 568 23 -27 3.5

-
8 719 748 -79 10
29

9 543 530 13 -37 7

10 575 524 51 1 1

w+ = 6 + 3.5 + 1 = 10.5

Decisión

Como 10.5 < 11 se rechaza H0 y se concluye con un nivel de significancia de 0.05 los
problemas de muestra, en promedio, no aumentan las calificaciones de registro de
graduados en 50 puntos.

Ejercicio 4
Una Escala de Inteligencia, en la que pueden obtenerse valores de 0 a 8, arroja
puntuaciones que se distribuyen normalmente N(4,l). Para confirmarlo, pasamos la
Escala a una muestra de 10 sujetos, obteniendo los resultados que aparecen a
continuación. ¿Podemos decir que estos resultados confirman la distribución normal en
la población?

Puntuaciones: 1 4 6 5 3 2 5 6 4 7

Planteamiento de hipótesis

Hipótesis nula: No existen diferencias entre la distribución observada y la distribución


normal.

H0: F(xi) = S(xi)

Hipótesis alternativa: Hay diferencias entre la distribución observada y la distribución


normal.

H1: F(xi) ≠ S(xi)

Estadístico de contraste

En este caso, el estadístico de contraste es D, definido como la diferencia máxima entre


la distribución de proporciones observada y la teórica. Por tanto, hay que construir las
distribuciones F(xi) y S(xi). Los resultados se presentan en la tabla siguiente, en las que
la primera columna corresponde a las puntuaciones de los sujetos, la siguiente a las
puntuaciones típicas, y seguidamente, los valores de F(xi) y S(xi). La última columna
presenta la distancia entre F(xi) y S(xi).

xi z F(xi) S(xi) /F(xi) - S(xi)/


7 3 0.9986 1.0000 0.0014
6 2 0.9972 0.9000 0.0972
5 1 0.8413 0.7000 0.1413
4 0 0.5000 0.5000 0.0000
3 -1 0.1587 0.3000 0.1413
2 -2 0.0228 0.2000 0.1772
1 -3 0.0014 0.1000 0.0986

Puesto que deseamos comprobar si la población de donde fue extraída la muestra


presenta una distribución normal, para hallar F(xi) lo único que tendríamos que hacer
sería consultar la probabilidad que le corresponde a cada valor de z en una tabla normal.
Los valores de la última columna se calcula del siguiente modo: para hallar la
proporción de valores inferiores o iguales a z = 2, se divide el número de puntuaciones
de X que presentan un valor inferior o igual a 2 entre el número total de puntuaciones,
es decir, 9/10 = 0.9.
Observamos que, a partir de la última columna de la tabla anterior, la diferencia máxima
entre F(xi) y S(xi) es 0.1772, por tanto, D = 0.1772.

El siguiente paso consiste en consultar la tabla de los valores críticos que corresponden
a la prueba de Kolmorogov-Smirnov. Vemos que para n = 10 y a = 0.01, el valor crítico
es 0.48893. Como 0.48893 > 0.1772, aceptamos la H0. Es decir, no existen diferencias
significativas entre la distribución observada y la distribución teórica, y por tanto, la
inteligencia no sigue una distribución normal en la población de la que fue extraía la
muestra de nuestro ejemplo.

Ejercicio 5

Un pedagogo desea probarla hipótesis de que el procedimiento psicológico e inductivo


(trabajar ante ejemplos para, de ahí, elevarse a la teoría musical) es más eficaz que el
lógico (primero la teoría y luego las aplicaciones prácticas).

Como actúa con dos grupos (A y B), selecciona a 10 sujetos del grupo A y otros 10 del
B, emparejados en rendimiento musical previo, en actitud y en aptitudes musicales.
Decide al azar que en el A aplicará el procedimiento psicológico y en el B el lógico.
Para la evaluación de resultados utiliza un instrumento de medida que sólo denota que
unas diferencias iguales entre los números que no implican diferencias idénticas en las
cuantías de los atributos. Obtiene los siguientes datos (ficticios):

A B
16 4
12 18
22 10
16 14
14 12
10 14
20 10
18 12
10 4
22 12

¿Puede afirmar que hay que diferencias entre los dos grupos? (α = 0.05)

1. Hipótesis:

Hipótesis nula: El procedimiento psicológico produce resultados inferiores o iguales al


procedimiento lógico.

Hipótesis alternativa: El procedimiento psicológico produce resultados superiores al


procedimiento lógico.
2. Estadístico de contraste.

Para el cálculo del estadístico W, deberemos calcular previamente las diferencias entre
las puntuaciones de los dos grupos. Estas diferencias o distancias quedan recogidas en
la tabla siguiente:

A B B-A R(B-A) R(+) R(-)


16 4 -12 9.5 9.5
12 18 6 5 5
22 10 -12 9.5 9.5
16 14 -2 1.5 1.5
14 12 -2 1.5 1.5
10 14 4 3 3
20 10 -10 7.5 7.5
18 12 -6 5 5
10 4 -6 5 5
22 12 -10 7.5 7.5

En la tercera columna, aparece el rango de las diferencias con su signo correspondiente.


Y en las dos últimas, los correspondientes rangos, para los que tienen signo positivo y
negativo.

Así, la suma de los rangos positivos y negativos son:

W- = 47

W+ = 8

Por tanto, el estadístico de contraste en este ejemplo es W = 8 (el menor de los valores
obtenidos).

En el caso de que la hipótesis nula sea cierta, esperamos diferencias B-A con signo
positivo, por lo que la suma de rangos positivos W+ tendría un valor alto. Para rechazar
la hipótesis nula tendremos que obtener valores bajos de W+, es decir, la región de
rechazo se encuentra a la izquierda. Esto es, estamos ante un contraste unilateral
izquierdo. Ahora consultamos la tabla de valores críticos para la prueba de Wilcoxon, y
encontramos que para un contraste unilateral y con un nivel de significación de 0.05, el
valor crítico es 8. Por tanto, rechazamos la hipótesis nula y podemos afirmar con una
confianza del 95% que el procedimiento psicológico es más eficaz que el lógico.

Ejercicio 6

Existe considerable evidencia acerca de que los adultos son capaces de utilizar sefiales
visuales en el procesamiento de información auditiva. En una conversación normal, las
personas pueden utilizar los movimientos de los labios en el procesamiento de la charla.
La congruencia entre los movimientos de los labios y los sonidos del habla son
particularmente benéficos en ambientes ruidosos. La investigación ha demostrado que el
procesamiento del habla se deteriora cuando las señales auditivas y visuales no son
congruentes. En los niños, la habilidad para discriminar y localizar la fuente de
estímulos auditivos y visuales complejos se establece alrededor de los seis meses de
edad.

Se diseñó un experimento para determinar si los niños de 10 a 16 semanas de edad se


dan cuenta de la sincronía entre los movimientos de los labios y los sonidos del habla en
una conversación normal.4 Los niños se colocaron en una habitación a prueba de ruido,
que tenía una ventana a través de la cual podían ver a una persona hablando. La persona
hablaba en un micrófono y el sonido era dirigido directamente al cuarto (en sincronía) o
con una demora de 400 milisegundos (fuera de sincronía). En cada condición se midió
el tiempo que el niño miraba la cara de la persona que hablaba. Se argumentó que si el
pequeño es capaz de discriminar ambas condiciones, la cantidad de tiempo de ver a la
persona sería diferente, aunque a priori no se planteó en cuál de las dos condiciones el
tiempo sería mayor (en términos de la poca experiencia en sincronía y lo novedoso que
era fuera de sincronía).

Existen considerables diferencias individuales entre los infantes respecto al tiempo que
pasaron atendiendo al estímulo. Sin embargo, la diferencia en el tiempo que pasaron
viendo en la condición en sincronía y el tiempo que pasaron viendo en la condición
fuera de sincronía podría ser un indicador confiable de la capacidad de discriminar. Si el
niño pasa más tiempo atendiendo al estímulo en la presentación sincrónica. la diferencia
sería positiva; y si el niño pasa más tiempo atendiendo al estímulo en la presentación
asincrónica, la diferencia sería negativa. Si el pequeño es capaz de discriminar, las
diferencias deberían tender hacia una dirección; más aún, cualquier diferencia en
dirección contraria debería ser relativamente pequeña.

Aunque el investigador confía en que las diferencias en el tiempo promedio que se


pasaron mirando indican las diferencias en la atención, no está seguro de que las
puntuaciones sean suficientemente precisas para que sean representadas en una escala
que no sea ordinal. Esto es, sólo puede afirmar que las grandes diferencias reflejan
incrementos en la atención; por ejemplo, una diferencia de 30 indica una mayor
diferencia en atención que una diferencia de 20. Así, aunque la interpretación de las
diferencias en las magnitudes numéricas en el tiempo de mirar no refleja directamente
las diferencias en la atención, el establecer los rangos de las diferencias en el mirar
reflejará el orden de las diferencias en el atender al estímulo.
Planteamiento de hipótesis

𝑯𝟎 : la cantidad de tiempo que pasan los nifios viendo a través de la ventana no depende
del tipo de presentación. En términos de la prueba de Wilcoxon, la suma de los rangos
positivos no difiere de la suma de los rangos negativos.

𝑯𝟏 : la cantidad de tiempo que los nifios pasan viendo depende del tipo de presentación;
la suma de los rangos positivos difiere de la suma de los rangos negativos.

Prueba estadística

Se selecciona la prueba de Wilcoxon porque en el estudio se emplean dos muestras


relacionadas y las diferencias en las puntuaciones pueden ser ordenadas por medio de
rangos.

Nivel de significancia

α= 0.01 y N es el número de pares utilizados (12) menos el número de pares cuyas


diferencias sean di = 0.

Cálculos

La suma de los rangos positivos es 𝑇 + = 10 + 12 + 6 + 3 + 8 + 5 + 11 + 9 + 2 + 7 = 73.

Decisión

La tabla H del Apéndice 1 nos muestra que con N = 12 y 𝑇 + = 73, debemos rechazar
la hipótesis nula en α = 0.01 para una prueba bidireccional, puesto que el valor de
tablas es (0.0024) y para una prueba bidireccional se duplica (0.0048). Se rechaza
H0 en favor de H1 y concluimos que los niños son capaces de discriminar entre la
sincronía o asincronía en los movimientos de los labios y los sonidos del habla.

Ejercicio 7

Para explicar el procedimiento e interpretación de los resultados obtenidos, partimos del


supuesto de una muestra realizada a 12 parejas para estimar su actitud frente al manejo
de sus hijos en los problemas escolares, (un menor puntaje corresponde a una actitud
menos favorable)

Pareja 1 2 3 4 5 6 7 8 9 10 11 12
Esposa 35 46 29 32 40 43 36 30 56 35 48 29
Esposo 29 32 36 35 46 45 35 18 41 37 40 25

A nivel del 5% ¿existe una misma actitud, en las parejas, frente a los problemas
escolares?

Solución

PAREJA ESPOSA ESPOSO Di Rango signo n° di rango


di menos ordenado
frecuente
1 35 29 6 6,5 1 1 1
2 46 32 14 11 2 2 2,5
3 29 36 -7 -8 -8 3 2 2,5
4 32 35 -3 -4 -4 4 3 4
5 40 46 -6 -6,5 -6,5 5 4 5
6 43 45 -2 -2 -2 6 6 6,5
7 36 35 1 1 7 6 6,5
8 30 18 12 10 8 7 8
9 56 41 15 12 9 8 9
10 35 37 -2 -2,5 -2,5 10 12 10
11 48 40 8 9 11 14 11
12 29 25 4 5 12 15 12
T= -23

1. Planteamiento de hipótesis

Ho: La actitud de las parejas, no difiere

Ha: La actitud de las parejas difiere

2. α= 0.05 𝑇0.05 = 14 𝑇𝑐 ˃𝑇𝑡 23˃14

Decisión

Al 95% de confianza se acepta H0 se dice que la actitud de los padres frente al


problema escolar no difiere.

Ejercicio 8
Se diseña un estudio de tiempos y movimientos con el fin docimar la eficiencia de dos
procedimientos para montar cierto mecanismo. Se aparean los obreros con base en los
coeficientes de inteligencia y el número de años de educación. Los miembros e cada par
son asignados en grupos a uno de los procedimientos. El tiempo en segundos para
terminar el montaje es como sigue;

Observemos en las tablas anteriores la más pequeña en la cual aparece di ordenada de


menor a mayor, sin tener en cuenta los signos. La columna rango se calculo teniendo en
1+2
cuenta la columna N°, así parece dos veces el 2, por lo tanto el rango será 1,5 = ;
2
luego el 3(una sola vez) su rango corresponde al número 3, el 4 aparece 6 veces, por lo
4+5+6+7+8+9
tanto su rango es = 6,5; el 10 será 10 y así sucesivamente.
6

Sabemos que la prueba es bilateral, que n= 13 α= 0,05 y T=16 por ser la suma de los
valores negativos, siendo la más pequeña de las dos columnas.

𝑡𝑡𝛼=0,05 16 = 17

Planteamiento de hipótesis

α= 0.05

𝑆í 𝑇𝑐 ≤ 𝑇𝑡 Rechazamos H0 La diferencia no es significativa; no difiere

𝑆í 𝑇𝑐 ˃𝑇𝑡 Aceptamos H0 La diferencia no es significativa


16 ≤ 17 con el 95% de confianza rechazamos la hipótesis nula y decimos que la
diferencia es significativa, es decir que difiere la eficiencia en los dos procesos.

Ejercicio 9

Los internos de una prisión federal sirvieron como sujetos en un estudio de toma de
decisiones 5 Primero se midió de manera individual la utilidad de los cigarrillos para los
reclusos (valor subjetivo), ya que los cigarrillos son el objeto más negociado en las
prisiones. Haciendo uso de la función de utilidad de cada sujeto, el investigador intentó
predecir las decisiones que cada hombre haría en un juego donde repetidamente tendría
que escoger entre dos opciones y en las cuales pudiera perder o ganar cigarrillos.

La hipótesis evaluada fue que los investigadores podrían predecir las decisiones de los
sujetos en términos del valor de utilidad, en lugar de suponer que la utilidad de los
cigarrillos es equivalente al valor objetivo de los mismos y, por tanto, predecir la
elección "racional" en términos del valor objetivo. Esta hipótesis fue confirmada.

Sin embargo, como era de esperarse, algunas respuestas no se predijeron con éxito, por
la hipótesis de maximización de la utilidad esperada. Los investigadores habían
conjeturado que tales errores en la predicción se deberían a la probable indiferencia de
los sujetos hacia las dos opciones disponibles. Esto es, un recluso podía encontrar
igualmente atractivas ambas opciones o no parecerle atractiva ninguna y, por tanto, ser
indiferente a la elección entre ambas opciones. Tales elecciones (de indiferencia) son
difíciles de predecir. Pero en tales casos, se razonó que el sujeto vacilaría en plantear
una apuesta y tardaría más en decidir. Es decir, la latencia entre el ofrecimiento de las
opciones y el aceptar alguna de ellas sería mayor. La segunda hipótesis fue que las
latencias o tiempos de respuesta que no se predijeran satisfactoriamente por la
maximización de la utilidad esperada, serían mayores que las elecciones predichas con
éxito.

Planteamiento de hipótesis

H0: no hay diferencia entre las latencias de las decisiones predichas correctamente y las
predichas incorrectamente.

H1: las latencias de las elecciones predichas incorrectamente serán mayores que las
predichas correctamente.

Nivel de significancia

α= 0,01

N es el número de reclusos que sirvieron como sujetos = 30 (el tamaño de N se puede


reducir si se encuentran empates).
Región de rechazo. Puesto que se predice la dirección, la prueba es unidireccional T+, la
suma de los rangos positivos, será la suma de los rangos de los reclusos cuyas
diferencias se encuentran en la dirección predicha. La región de rechazo consiste en
todos los valores de z (obtenidos de T+), tan extremos como la probabilidad asociada
cuando H0 es verdadera cuyo valor es igual o menor que α= 0.01.

Diferencia en el tiempo promedio entre las decisiones correcta e incorrectamente


predichas de los reclusos

𝑇 + − 𝜇𝑇+ 𝑇 + − 𝑁(𝑁 + 1)/4


𝑧= =
𝜎 𝑇+ √𝑁(𝑁 + 1)(2𝑁 + 1)/24
298 − (26)(27)
𝑧=
√(26)(27)(53)/24

𝒛 = 3.11
LA PRUEBA DE FISHER

A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos
valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la
estimación intermediante entre la estimación interna

Esta razón F fue creada por Ronald Fisher (1890-1962), matemático británico, cuyas
teorías estadísticas hicieron mucho más precisos los experimentos científicos. Sus
proyectos estadísticos, primero utilizados en biología, rápidamente cobraron
importancia y fueron aplicados a la experimentación agrícola, médica e industrial.
Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la
selección natural en la genética, particularmente en la población humana.

El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que
indicará el valor máximo del valor estadístico de prueba que ocurría si H0 fuera
verdadera, a un nivel de significación seleccionado. Antes de proceder a efectuar este
cálculo, se debe considerar las características de la distribución F

Características de la distribución F

- Existe una distribución F diferente para cada combinación de tamaño de muestra y


número de muestras. Por tanto, existe una distribución F que se aplica cuando se toman
cinco muestras de seis observaciones cada una, al igual que una distribución F diferente
para cinco muestras de siete observaciones cada una. A propósito de esto, el número
distribuciones de muestreo diferentes es tan grande que sería poco práctico hacer una
extensa tabulación de distribuciones. Por tanto, como se hizo en el caso de la
distribución t, solamente se tabulan los valores que más comúnmente se utilizan. En el
caso de la distribución F, los valores críticos para los niveles 0,05 y 0,01 generalmente
se proporcionan para determinadas combinaciones de tamaños de muestra y número de
muestras.

La razón más pequeña es 0. La razón no puede ser negativa, ya que ambos términos de
la razón F están elevados al cuadrado.

Por otra parte, grandes diferencias entre los valores medios de la muestra, acompañadas
de pequeñas variancias muestrales pueden dar como resultado valores extremadamente
grandes de la razón F.
- La forma de cada distribución de muestreo teórico F depende del número de grados de
libertad que estén asociados a ella. Tanto el numerador como el denominador tienen
grados de libertad relacionados.

Determinación de los grados de libertad

Los grados de libertad para el numerador y el denominador de la razón F se basan en los


cálculos necesarios para derivar cada estimación de la variancia de la población. La
estimación intermediante de variancia (numerador) comprende la división de la suma de
las diferencias elevadas al cuadrado entre el número de medias (muestras) menos uno, o
bien, k - 1. Así, k - 1 es el número de grados de libertad para el numerador.

En forma semejante, el calcular cada variancia muestral, la suma de las diferencias


elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se
divide entre el número de observaciones de la muestra menos uno, o bien, n - 1. Por
tanto, el promedio de las variancias muestrales se determina dividiendo la suma de las
variancias de la muestra entre el número de muestras, o k. Los grados de libertad para
el denominador son entonces, k(n -l).

Ejercicio1
Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de
motores respecto al tiempo en minutos. Los resultados se muestran en la tabla:
Método 1 Método 2

n1 = 31 n2 = 25

s12 = 50 s22 = 24

2 2
Construya un intervalo de confianza del 90% para 1 / 2 .

Solución:

Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la


siguiente fórmula:

al despejar: .

F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En
este caso los grados de libertad uno valen 30 y los grados de libertad dos 24.
y

Estos resultados los podemos interpretar de la siguiente manera:

2 2
Con un nivel de confianza del 90% se sabe que la relación de varianzas 1 / 2 está
entre 1.07 y 3.93. Esto supondría que la varianza de la población 1 es mayor a la
varianza de la población 2 entre 1.07 y 3.93.

Ejercicio 2

Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de


manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la
rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer
proceso, la cual tiene una desviación estándar s1 = 4.7 micropulgadas, y una muestra
aleatoria de n2=12 partes del segundo proceso, la cual tiene una desviación estándar s2 =
5.1 micropulgadas. Se desea encontrar un intervalo de confianza del 90% para el
2 2
cociente de las dos varianzas 1 / 2 Suponga que los dos procesos son
independientes y que la rugosidad de la superficie está distribuida de manera normal.

Solución:

Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la


siguiente fórmula:

al despejar: .

En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15.

Estos resultados los podemos interpretar de la siguiente manera:

Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las
desviaciones estándar de la rugosidad de la superficie de los dos procesos sean
diferentes con un nivel de confianza del 90%.
Ejercicio 3

La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos,


utilizada para un proceso en particular, depende del tiempo que tarda el proceso. Un
fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño ajuste al proceso
2, con la esperanza de reducir la variabilidad, así como la cantidad media de impurezas
en los productos químicos. Muestras de n1=25 y n2=20 mediciones de dos lotes
produjeron las siguientes medias y varianzas:

¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso
son menores para el 2? Realice una prueba con un = 0.05.

Solución:

Datos:

Población 1 Población 2

n1 = 25 n2 = 20

= 0.05

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor.

Entonces los grados de libertad uno será el tamaño de la muestra de la población uno
menos uno. 1= 25-1 = 24 y 2 = 20-1=19.

Regla de decisión:

Si Fc 2.11 No se rechaza Ho,

Si la Fc > 2.11 se rechaza Ho.


Cálculo:

Decisión

Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con un = 0.05 que no
existe suficiente evidencia para decir que la varianza del proceso 2 es menor que la del
proceso 1.

Ejercicio 4

En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba


dos máquinas. Robo-fill se usa para llenar 16 tarros y da una desviación estándar de 1.9
onzas en el llenado. Con Automat-fill se llenan 21 frascos que dan una desviación
estándar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en función de
la uniformidad de llenado. ¿Cual deberá seleccionar? Use un = 0.10.

Solución:

Datos:

Robo-Fill

sRF = 1.9

nRF = 16

= 0.10

Automat-Fill

sAF = 2.1

nAF = 21

Ensayo de hipótesis:

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor.


Entonces los grados de libertad uno será el tamaño de la muestra de la población uno
menos uno. 1= 21-1 = 20 y 2 = 16-1=15.

Regla de decisión:

Si Fc 2.20 No se rechaza Ho,

Si la Fc > 2.20 se rechaza Ho.

Cálculo:

Decisión

Como 1.22 es menor que 2.20 no se rechaza Ho, y se concluye con un = 0.10 que la
variación de llenado de la máquina Robo-Fill no es menor a la de Automat-Fill, por lo
que se selecciona cualquier máquina.

Ejercicio 5

Las capas de óxido en las obleas semiconductoras son depositadas en una mezcla de
gases para alcanzar el espesor apropiado. La variabilidad del espesor es una
característica crítica de la oblea, y lo deseable para los siguientes pasos de la fabricación
es tener una variabilidad baja. Para ello se estudian dos mezclas diferentes de gases con
la finalidad de determinar con cuál se obtienen mejores resultados en cuanto a la
reducción en la variabilidad del espesor del óxido. Veintiuna obleas son depositadas en
cada gas. Las desviaciones estándar de cada muestra del espesor del óxido son s1 = 1.96
angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que indique una diferencia en las
desviaciones? Utilice =0.05.

Solución:

Datos:

s1= 1.96

n1 = 21

s2 = 2.13

n2= 21

Ensayo de hipótesis:
Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor.

Entonces los grados de libertad uno será el tamaño de la muestra de la población uno
menos uno. 1= 21-1 = 20 y 2 = 21-1=20.

Regla de decisión:

Si 0.406 Fc 2.46 No se rechaza Ho,

Si la Fc < 0.406 ó si Fc > 2.46 se rechaza Ho.

Cálculo:

Decisión

Como 0.85 está entre los dos valores de Ho no se rechaza, y se concluye con un =
0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son
iguales.

LA PRUEBA DE LA MEDIANA
Función
La extensión de la prueba de la mediana determina si k grupos independientes (no
necesariamente del mismo tamaño) se han extraído de la misma población o de
poblaciones distintas, pero con medianas iguales. Esta prueba es útil y apropiada cuando
la variable en estudio ha sido medida en, al menos, escala ordinal. Es particularmente
apropiada cuando, por alguna razón, no ha sido posible observar el valor exacto de las
puntuaciones extremas, es decir, cuando algunos de los datos observados se encuentran
por arriba del punto de corte.

Método
Para aplicar la extensión de la prueba de la mediana, primero debemos determinar el
valor de la mediana para las puntuaciones de las k muestras combinadas, es decir,
encontramos la mediana común para todas las puntuaciones en los k grupos. Después,
debemos reemplazar cada puntuación por un signo de más ( +) si la puntuación es
mayor que la mediana o por un signo de menos ( - ) si éste es más pequeño que la
mediana. (Puede suceder que una o más puntuaciones coincidan con el valor de la
mediana; entonces, se deben dicotomizar las puntuaciones, es decir, se asigna un más (
+) si la puntuación es mayor que la mediana o un menos ( - ) si la puntuación es igual o
menor que la mediana.)
Podemos presentar los conjuntos de puntuaciones resultantes en una tabla de
contingencia de 2 X k, con los números en el cuerpo de la tabla representando las
frecuencias de signos de más ( +) (puntuaciones por arriba de la mediana) y signos de
menos ( - ) (puntuaciones por abajo de la mediana) en cada uno de los k grupos. Un
ejemplo de lo anterior es la siguiente tabla:

Para probar la hipótesis nula de que las k muestras provienen de la misma población con
respecto a las medianas, debemos calcular el valor del estadístico X2 utilizando las
ecuaciones (5. 2) o (5. 2a):

Dónde:
n,J = número de casos observados que fueron categorizados en el i-ésimo renglón de la
j-ésima columna
E,1 = número de casos esperados en el i-ésimo renglón de laj-ésima columna cuando H0
es verdadera
y la doble sumatoria es sobre todos los renglones y columnas de la tabla (es decir,
sumatoria de todas las celdillas). Los valores de X2 resultantes de la aplicación de la
ecuación (5. 2) se distribuyen (para N grande) como ji cuadrada con gl = (r - l) (k - l),
donde r es el número de renglones y k es el número de columnas (grupos) de la tabla de
contingencia. Para la prueba de la mediana r = 2, tenemos que
gl = (r - l (k - l) = (2 - l) (k - l) = k - l
Cuando H0 es verdadera, la probabilidad asociada con la ocurrencia de valores tan
grandes como una X2 observada, se proporciona en la tabla.
Si la X2 observada es igual o mayor que valor de la tabla C para el nivel de
significación previamente determinado y para el valor observado de gl = k - l, entonces
podemos rechazar H0 en ese mismo nivel de significación.
Si es posible dicotomizar las puntuaciones exactamente en la mediana, entonces cada
E,1 es la mitad del total marginal para su columna. Cuando las puntuaciones son
dicotomizadas como aquellas que son mayores e iguales y menores que la mediana, el
método para encontrar las frecuencias esperadas.
Una vez que las puntuaciones se han categorizado como signos de más ( +) y signos de
menos ( - ) respecto a la mediana, y las frecuencias resultantes se han arreglado en una
tabla de contingencia de 2 X k, el procedimiento de cálculo para esta prueba es
exactamente el mismo que para la ji cuadrada para k muestras independientes.

Resumen del Procedimiento


Éstos son los pasos que hay que seguir durante la aplicación de la extensión de la
prueba de la mediana:
1. Determine la mediana común de las puntuaciones de los k grupos.
2. Asigne signos 4e más e+) a todas las puntuaciones que se encuentren por encima de
la mediana y signos de menos e-) a todos aquellas que se encuentren por debajo de la
mediana, por ello, cada uno de los grupos de puntuaciones se dividió en dos categorías
(las anteriores) . Presente las frecuencias resultantes en una tabla de contingencia de 2 X
k.
3. Utilizando los datos de la tabla que se ha formado, calcule el valor de X2 mediante la
ecuación es.2) o es.2a). Determine los grados de libertad gl = k - l.
4. Determine la significación del valor observado de X2 utilizando la tabla C del
Apéndice l. Si la probabilidad asociada dada por los valores tan grandes como la X2
observada es igual o menor que a, rechace H0 en favor de la H1.
Como hemos mencionado, la extensión a la prueba de la mediana es, de hecho, una
prueba ji cuadrada para k muestras o grupos independientes. Si existen varios grupos, el
investigador puede desear dividir la tabla de contingencia para determinar dónde se
encuentran las diferencias.

Ejercicio 1
Se decide investigar el coeficiente intelectual de una muestra de 28 jóvenes que
pertenecen a diferentes colegios del país para lo cual se les aplico un test que consta de
50 preguntas para medir su C.I, los resultados se resumen en la siguiente tabla.
COEFICIENTE INTELECTUAL Total
Colegio 1 35 26 27 21 27 38 23 25 n=8
Colegio 2 25 27 45 46 33 26 46 41 n=8
Colegio 3 29 50 43 22 42 47 42 32 n=8
Colegio 4 50 37 34 31 n=4

( 𝑋𝑛 + 𝑋𝑛+1 ) ( 𝑋14 + 𝑋15 ) 33 + 34


2 2
𝑀𝑒 = = = = 33,5
2 2 2
1) Planteamiento de la hipótesis
Ho: No existe diferencia significativa en los coeficientes intelectuales de los
jóvenes debido al colegio al cual pertenecen.
Ha: Si existe diferencia significativa en los coeficientes intelectuales de los
jóvenes debido al colegio al cual pertenecen.

2) Nivel de significación α = 0.05


𝑛𝑖𝑗 2
3) Estadístico de prueba 𝜒 2 = ∑𝑟𝑖=1 ∑𝑘𝑗=1 −𝑁
𝐸𝑖𝑗
4) Regla de decisión

Si 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
Si 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos
FRECUENCIAS OBSERVADAS Y ESPERADAS
Coeficiente
Intelectual Colegio 1 Colegio 2 Colegio 3 Colegio 4 Total
Mayores Me 2 4 4 4 5 4 3 2 14
Menores Me 6 4 4 4 3 4 1 2 14
Total 8 8 8 4 28

𝑟 𝑘
2
𝑛𝑖𝑗 2 22 42 52 32 62 42 32 12
𝜒 = ∑∑ −𝑁 = + + + + + + + − 28
𝐸𝑖𝑗 4 4 4 2 4 4 4 2
𝑖=1 𝑗=1
= 3,5
6) Decisión

Como 3,5 < 7,8 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 , y se concluye que no existe diferencia


significativa en los coeficientes intelectuales de los jóvenes debido al colegio al
cual pertenecen.

Ejercicio 2
Un investigador en educación desea estudiar la influencia del nivel escolar de las
madres sobre el interés en sus hijos en edad escolar. Como medida del nivel de
escolaridad, el investigador utiliza el grado escolar más alto que la madre haya
completado, y como medida del interés en sus hijos se toma como índice el número de
visitas voluntarias que cada madre realiza durante el año escolar. El investigador
obtiene una muestra al azar del 10 por ciento de los 440 niños inscritos en la escuela, de
esta lista se obtienen los nombres de las 44 madres que pertenecen a la muestra.
Demostrar que el número de visitas a la escuela por parte de una madre varía de acuerdo
con el número de años escolares que esa madre completó.
NIVEL ESCOLAR DE LA MADRE FRECUENCIA ABSOLUTA Total
Octavo Grado 4 3 0 7 1 2 0 3 5 1 n = 10
Décimo grado 2 4 1 6 3 0 2 5 1 2 1 n = 11
Preparatoria 2 0 4 3 8 0 5 2 1 7 6 5 1 n = 13
Primeros semestres 9 4 2 3 n=4
Licenciatura 2 4 5 2 n=4
Postgrado 2 6 n=2

( 𝑋𝑛 + 𝑋𝑛+1 ) ( 𝑋22 + 𝑋23 ) 2 + 3


2 2
𝑀𝑒 = = = = 2,5
2 2 2
1) Planteamiento de la hipótesis

Ho: No existe diferencia significativa en la frecuencia de las visitas a la escuela


entre las madres con diferente nivel de escolaridad.

Ha: Si existe diferencia significativa en la frecuencia de las visitas a la escuela


entre las madres con diferente nivel de escolaridad.

2) Nivel de significación α = 0.05


𝑛𝑖𝑗 2
3) Estadístico de prueba 𝜒 2 = ∑𝑟𝑖=1 ∑𝑘𝑗=1 −𝑁
𝐸𝑖𝑗
4) Regla de decisión
Si 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
Si 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos
NIVEL ESCOLAR DE LA MADRE FRECUENCIAS OBSERVADAS Y ESPERADAS
Número de
Visitas Octavo Décimo Primeros
Preparatoria Licenciatura Postgrado Total
Grado grado semestres
Mayores Me 5 5 4 5,5 7 6,5 3 2 2 2 1 1 22
Menores Me 5 5 7 5,5 6 6,5 1 2 2 2 1 1 22
Total 10 11 13 4 4 2 44

𝑟 𝑘
2
𝑛𝑖𝑗 2 52 42 72 32 22 12 52 72
𝜒 = ∑∑ −𝑁 = + + + + + + +
𝐸𝑖𝑗 5 5,5 6,5 2 2 1 5 5,5
𝑖=1 𝑗=1

62 12 22 12
+ + + + − 44 = 1,895
6,5 2 2 1

6) Decisión

Como 1,89 < 11,07 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 , y se concluye que no existe diferencia


significativa en la frecuencia de las visitas a la escuela entre las madres con
diferente nivel de escolaridad.

Ejercicio 3
Se selecciona al azar ministros de tres religiones: 8 metodistas, 10 católicos y 9
pentecostales y se desea probar si poseen el mismo conocimiento sobre enfermedades
mentales. Los resultados de un test que midió su conocimiento se detalla en la siguiente
tabla.

Religión CONOCIMIENTO SOBRE ENFERMEDADES MENTALES

Metodista 32 30 30 29 26 23 18 19 n=8
Católico 32 32 26 26 22 20 14 16 14 15 n = 10
Pentecostal 28 21 15 15 14 14 9 11 8 n=9

𝑀𝑒 = 𝑋𝑛+1 = 𝑋27+1 = 20
2 2

1) Planteamiento de la hipótesis

Ho: No existe diferencia significativa en el grado de conocimiento sobre


enfermedades mentales debido a las diferentes religiones de las personas.
Ha: Si existe diferencia significativa en el grado de conocimiento sobre
enfermedades mentales debido a las diferentes religiones de las personas.

2) Nivel de significación α = 0.05


𝑛𝑖𝑗 2
3) Estadístico de prueba 𝜒 2 = ∑𝑟𝑖=1 ∑𝑘𝑗=1 −𝑁
𝐸𝑖𝑗
4) Regla de decisión
Si 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
Si 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos
FRECUENCIAS OBSERVADAS Y ESPERADAS
Conoce sobre
enfermedades
mentales Metodista Católico Pentecostal Total

Mayores Me 6 3,9 5 4,8 2 4,3 13


Menores Me 2 4,1 5 5,2 7 4,7 14
Total 8 10 9 27

𝑟 𝑘
2
𝑛𝑖𝑗 2 62 52 22 22 52 72
𝜒 = ∑∑ −𝑁 = + + + + + − 27 = 4,75
𝐸𝑖𝑗 3,9 4,8 4,3 4,1 5,2 4,7
𝑖=1 𝑗=1

6) Decisión
Como 4,75 < 5,99 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 , y se concluye que no existe diferencia
significativa en el grado de conocimiento sobre enfermedades mentales debido a
las diferentes religiones de las personas.

Ejercicio 4
Se realizó un experimento con cuatro variedades de maíz, con la finalidad de
determinar si existen diferencias significativas en cuanto a su rendimiento, las cuatro
variedades fueron asignadas aleatoriamente a 34 parcelas ubicadas en la misma
localidad. El rendimiento en kilogramos fue registrado para cada una de las parcelas,
obteniendo los siguientes datos, se pide demostrar que los rendimientos de las diferentes
parcelas varían debido a las variedades de maíz.

RENDIMIENTOS EN LAS PARCELAS Total


Variedad 1 83 91 94 89 89 96 92 90 91 n=9
Variedad 2 91 90 81 83 83 84 88 91 89 84 n = 10
Variedad 3 101 100 91 93 96 95 94 n=7
Variedad 4 78 82 81 77 79 81 80 81 n=8

( 𝑋𝑛 + 𝑋𝑛+1 ) ( 𝑋17 + 𝑋18 ) 89 + 89


2 2
𝑀𝑒 = = = = 89
2 2 2
1) Planteamiento de la hipótesis

Ho: No existe diferencia significativa en los rendimientos de las parcelas debido


a las diferentes variedades de maíz.

Ha: Si existe diferencia significativa en los rendimientos de las parcelas debido a


las diferentes variedades de maíz.

2) Nivel de significación α = 0.05


𝑛𝑖𝑗 2
3) Estadístico de prueba 𝜒 2 = ∑𝑟𝑖=1 ∑𝑘𝑗=1 −𝑁
𝐸𝑖𝑗
4) Regla de decisión

Si 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂

Si 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂

5) Cálculos
FRECUENCIAS OBSERVADAS Y ESPERADAS
Rendimientos
Variedad 1 Variedad 2 Variedad 3 Variedad 4 Total
Mayores Me 6 4,2 3 4,7 7 3,3 0 3,8 16
Menores Me 3 4,8 7 5,3 0 3,7 8 4,2 18
Total 9 10 7 8 34

𝑟 𝑘
2
𝑛𝑖𝑗 2
𝜒 = ∑∑ −𝑁
𝐸𝑖𝑗
𝑖=1 𝑗=1
62 32 72 02 32 72 02 82
= + + + + + + + − 34
4,2 4,7 3,3 3,8 4,8 5,3 3,7 4,2
𝑟 𝑘
2
𝑛𝑖𝑗 2
𝜒 = ∑∑ − 𝑁 = 17,54
𝐸𝑖𝑗
𝑖=1 𝑗=1

6) Decisión

Como 17,5 > 7,8 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂 , y se concluye que si existe diferencia


significativa en los rendimientos de las parcelas debido a las diferentes
variedades de maíz.

Ejercicio 5

Un grupo de investigadores están interesados en saber si cuatro enfermedades


provocan por término medio el mismo grado de ansiedad. Para ello se toman cuatro
muestras de 6, 7, 5 y 4 personas, pasándole a cada una de ellas un test que mide el
grado de ansiedad del individuo en una escala de 0 a 10.
GRADO DE ANSIEDAD Total
Enfermedad 1 4 3 7 8 6 4 n=6
Enfermedad 2 5 2 4 7 8 2 4 n=7
Enfermedad 3 4 6 7 9 7 n=5
Enfermedad 4 5 7 3 5 n=4

( 𝑋𝑛 + 𝑋𝑛+1 ) ( 𝑋11 + 𝑋12 ) 5 + 5


2 2
𝑀𝑒 = = = =5
2 2 2
1) Planteamiento de la hipótesis

Ho: No existe diferencia significativa en el grado de ansiedad de las personas


debido a las diferentes enfermedades que poseen.

Ha: Si existe diferencia significativa en el grado de ansiedad de las personas


debido a las diferentes enfermedades que poseen.

2) Nivel de significación α = 0.05


𝑛𝑖𝑗 2
3) Estadístico de prueba 𝜒 2 = ∑𝑟𝑖=1 ∑𝑘𝑗=1 −𝑁
𝐸𝑖𝑗
4) Regla de decisión
Si 𝜒 2 𝑐 > 𝜒 2 𝑡 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑂
Si 𝜒 2 𝑐 < 𝜒 2 𝑡 → 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂
5) Cálculos
FRECUENCIAS OBSERVADAS Y ESPERADAS
Grados de
Ansiedad Enfermedad 1 Enfermedad 2 Enfermedad 3 Enfermedad 4 Total
Mayores Me 3 2,7 2 3,2 4 2,3 1 1,8 10
Menores Me 3 3,3 5 3,8 1 2,7 3 2,2 12
Total 6 7 5 4 22
𝑟 𝑘
2
𝑛𝑖𝑗 2 32 22 42 12 32 52 12 32
𝜒 = ∑∑ −𝑁 = + + + + + + + − 22
𝐸𝑖𝑗 2,7 3,2 2,3 1,8 3,3 3,8 2,7 2,2
𝑖=1 𝑗=1
= 3,94

6) Decisión
Como 3,94 < 7,81 𝐴𝑐𝑒𝑝𝑡𝑜 𝐻𝑂 se concluye que no existe diferencia
significativa en el grado de ansiedad de las personas debido a las diferentes
enfermedades que poseen.

LA PRUEBA DE MANN-WHITNEY

En estadística la prueba U de Whitney, también llamada de Mann-Whitney-Wilcoxon,


prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon-Mann-Whitney , es una
prueba no paramétrica con la cual se identifican diferencias entre dos poblaciones
basadas en el análisis de dos muestras independientes, cuyos datos han sido medidos al
menos en una escala de nivel ordinal.
La prueba calcula el llamado estadístico U, cuya distribución para muestras con más de
20 observaciones se aproxima bastante bien a la distribución normal
Pasos para efectuar la prueba
 Para efectuar la prueba, se combinan dos muestras en un arreglo ordenado,
identificando los valores muestrales, de acuerdo con el grupo muestral al que
pertenecen.
 Luego se determinar el tamaño de las muestras (n1 y n2). Si n1 y n2 son menores
que 20, se consideran muestras pequeñas, pero si son mayores que 20, se
consideran muestras grandes.
 En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se
distribuye normalmente.
 Des pues se ordenan los valores de menor a mayor, asignando el rango uno al
valor más pequeño.
 Cuando se encuentran valores iguales (ligas o empates), se le asigna el promedio
de sus rangos.
 Se calculan los valores de U1 y U2, de modo que se elija el más pequeño para
comparar con los críticos de U Mann-Whitney de la tabla de probabilidades
asociadas con valores pequeños como los de U en la prueba de Mann-Whitney
 Luego se designa mediante U a la estadística que se calcula para realizar esta
prueba y el cual se basa en el número de veces que un puntaje de un grupo
antecede a un puntaje de otro grupo, si hay dos grupos.
 Y por último decidir si se acepta o se rechaza la Ho
 no obstante es más fácil basarse en la suma de rangos de cualquiera de las dos
muestras aleatorias mediante las siguientes formulas:

Dónde:
U1 y U2 = valores estadísticos de U Mann-Whitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.

Los cálculos tienen que tener en cuenta la presencia de observaciones idénticas a la hora
de ordenarlas. No obstante, si su número es pequeño, se puede ignorar esa circunstancia.

Se rechaza H0 si p(valor) < 

Ejercicio 1
Suponga que una fábrica de cerámicas desea comparar el tiempo que toma a las piezas
de barro enfriarse después de haber “ardido” en el horno mediante dos métodos
diferentes.
Los alfareros queman 12 piezas utilizando el método 1, y 10 utilizando el método 2. El
número de minutos necesarios para que cada pieza se enfríe es el siguiente:

Método1 27 31 28 29 39 40 35 33 32 36 37 43

Método 2 34 24 38 28 30 34 37 42 41 44

Rangos de tiempos de enfriamiento

Método 1 Rango Método 2 Rango

24 1

27 2

28 3.5 28 3.5

29 5

30 6
31 7

32 8

33 9

34 10.5

34 10.5

35 12

36 13

37 14.5 37 14.5

38 16

39 17

40 18

41 19

42 20

43 21

44 22

R1=130 R2=123

Se calcula el estadístico de Mann-Whitney para cada muestra de la ecuación, así:

n1 ( n1  1 )
U 1  n1 n2    R1
2
n (n  1
U 2  n1 n2  1 1   R2
2
12( 12  1 )
U 1  ( 12 )( 10 )   130  68
2
10 ( 10  1 )
U 2  ( 12 )( 10 )   123  52
2

Se nota que U1+ U2 = n1n2 proporciona un chequeo rápido de su aritmética.


Media y Desviación estándar de la distribución muestral para la Prueba U de Mann-
Whitney
n1n2 ( 12 )( 10 )
u    60
2 2
n n ( n  n2  1 ) ( 12 )( 10 )( 12  10  1 )
u  1 2 1   15.17
12 12

Valor de Z para normalizar la prueba U de Mann-Whitney

U 1  u
Z
u

Prueba de dos extremos: Probar la hipótesis de que los tiempos promedio de


enfriamiento de enfriamiento del método 1 y del método 2 son los mismos

H 0 : 1   2
H 1 : 1   2

Utilizando arbitrariamente U2, se tiene que


52  60
Z  0.053
15.17

Regla de decisión

Si  = 10%, la regla de decisión es “No rechazar si -1.65  Z  1.65. Rechazar si Z < -


1.65 o Z > 1.65”.
Decisión
Como Z = -0.53 se puede concluir al nivel de significancia del 10% que los tiempos
promedio de enfriamiento son los mismos para ambos métodos de cocción.

Ejercicio 2

Para determinar si la asistencia a un curso de ofimática modifica el estilo cognitivo, se


seleccionan dos grupos de 10 alumnos, uno de los cuales siguió el curso (grupo
experimental) mientras que al otro no se le aplicó ningún tratamiento (grupo control).
Tras la realización del curso, mediante una escala adecuada se medió el estilo cognitivo
de-ambos grupos,-variable que-no se distribuye normalmente en la población.
¿Podemos afirmar que los dos grupos son diferentes en cuanto a estilo cognitivo
después de haber finalizado el curso?

Grupo experimental 75 46 52 45 75 62 48 85 63 84
Grupo control 39 49 28 47 35 25 69 34 67 32

Ya en el enunciado del problema, se nos dice que los datos son siguen una distribución
normal por lo que utilizaremos un contraste no paramétrico. Al tratarse de dos muestras
independientes, la prueba más adecuada es la prueba de Mann-Whitney. Las hipótesis
que vamos a contrastar son:
H0: No existen diferencias entre el grupo experimental y el grupo control.

H1: Existen diferencias significativas entre el grupo experimental y el grupo control.

Fijamos un nivel de significación (0.05) y calculamos los estadísticos T y U:

X Rango
25 1
28 2
32 3
34 4
35 5
39 6
45 7*
46 8*
47 9
48 10*
49 11
52 12*
62 13*
63 14*
67 15
69 16
75 17.5*
84 19*
85 20*

La suma de rangos de la primera muestra o estadístico T es 120.5. Y por tanto, U vale:

[D]

[D]

Buscamos en la tabla para la prueba Mann-Whitney, y encontramos que" para tamaños


de 10 sujetos en ambas muestras y T=120.5, la probabilidad asociada es 0.124.
Debemos tener en cuenta que nuestro contraste es bilateral, por lo que la probabilidad
buscada será el doble de la que se recoge en la tabla, esto es, 0.248. Como p>0.05 no
podemos rechazar la hipótesis nula con una confianza del 95%, es decir, los grupos no
son diferentes en estilo cognitivo.
LA PRUEBA DE RACHAS DE WALD-WOLFOWITE

Contraste de rachas de Wald--Wolfowitz

Si combinamos las dos muestras y disponemos el conjunto completo de todas las


observaciones, ordenadas de menor a mayor, cabe esperar que bajo la hipótesis

las dos muestras estén muy entremezcladas, y por tanto el número de rachas, Rexp,
formadas por las categorías

debe ser muy alto.

Cuando el valor teórico del número de rachas por debajo del cual se
rechaza H0,

se busca en la tabla 7 (de Downie) y entonces no se rechaza H0 si y se


rechaza en otro caso.

Aproximación normal del test de Wald--Wolfowitz

Si n1>30 o bien n2>30 se aproxima R por

donde

Luego si definimos
se rechaza la hipótesis nula si .

Si tenemos observaciones repetidas en las dos muestras se fija el criterio de colocar


primero aquellas que pertenecen a la primera muestra.

S-ar putea să vă placă și