Sunteți pe pagina 1din 15

2 LA DISTRIBUCIÓN F.

La distribución de probabilidad que se emplea en este capítulo es la distribución F, la


cual debe su nombre a sir Ronald Fisher, uno de los pioneros de la estadística actual.
Esta distribución de probabilidad sirve como la distribución del estadístico de prueba
en varias situaciones.
Con ella se pone a prueba si dos muestras provienen de poblaciones que tienen
varianzas iguales, y también se aplica cuando se desea comparar varias medias
poblacionales en forma simultánea. La comparación simultánea de varias medias
poblacionales se denomina análisis de la varianza (ANOVA). En las dos situaciones, las
poblaciones deben seguir una distribución normal, y los datos deben ser al menos de
escala de intervalos.
¿Cuáles son las características de la distribución F?
1. Existe una familia de distribuciones F. Cada miembro de la familia se determina
mediante dos parámetros: los grados de libertad del numerador y los grados de
libertad del denominador. La forma de la distribución se ilustra en la siguiente gráfica.
Hay una distribución F de la combinación de 29 grados de libertad del numerador (gl) y
los 28 grados de libertad del denominador. Existe otra distribución F de los 19 grados
en el numerador y los 6 grados de libertad del denominador. La distribución final que
se muestra tiene 6 grados de libertad en el numerador y 6 grados de libertad en el
denominador. Los grados de libertad se describen más adelante en este capítulo.
Observe que la forma de las curvas cambia cuando varían los grados de libertad.

2. La distribución F es continua. Esto significa que se supone un número infinito de


valores entre cero y el infinito positivo.
3. La distribución F no puede ser negativa. El menor valor que F puede tomar es 0.
4. Tiene sesgo positivo. La cola larga de la distribución es hacia el lado derecho. Cuando
el número de grados de libertad aumenta, tanto en el numerador como en el
denominador, la distribución se aproxima a ser normal.
5. Es asintótica. Cuando los valores de X aumentan, la curva F se aproxima al eje X pero
nunca lo toca. Este caso es similar al comportamiento de la distribución de
probabilidad normal.
3 COMPARACIÓN DE DOS VARIANZAS POBLACIONALES. - La primera aplicación de la
distribución F ocurre cuando se pone a prueba la hipótesis de que la varianza de una
población normal es igual a la varianza de otra población normal. En los siguientes
ejemplos se muestra el uso de la prueba:
• Dos máquinas esquiladoras de la marca Bart se calibran para producir barras de acero
con la misma longitud. Por lo tanto, las barras deberán tener la misma longitud media.
Se desea tener la seguridad de que además de la misma longitud media también
tengan una variación similar. El índice de rendimiento medio de los dos tipos de
acciones comunes puede ser el mismo, pero quizá varíe más el índice de rendimiento
de un tipo que el otro. Una muestra de 10 acciones relacionadas con la tecnología y 10
acciones de compañías de servicios presentan el mismo índice de rendimiento medio,
pero es probable que varíen más las acciones vinculadas a la tecnología.
• Un estudio del departamento de marketing de un periódico importante reveló que
los hombres y las mujeres pasan cerca de la misma cantidad de tiempo por día
navegando por la red. Sin embargo, el mismo reporte indica que la variación del tiempo
pasado por día por los hombres casi duplicaba al de las mujeres.
La distribución F también sirve para probar suposiciones de algunas pruebas
estadísticas. Recuerde que en el capítulo anterior se utilizó la prueba t para investigar si
las medias de dos poblaciones independientes eran diferentes. Para emplear esa
prueba, algunas veces se supone que las varianzas de dos poblaciones normales son
iguales. La distribución F proporciona un medio para realizar una prueba considerando
las varianzas de dos poblaciones normales.
Sin importar si se desea determinar si una población varía más que otra o validar una
suposición de una prueba estadística, primero se formula la hipótesis nula. La hipótesis
nula es que la varianza de una población normal, σ 21 es igual a la varianza de otra

población normal, σ 22 La hipótesis alternativa podría ser que las varianzas difieren. En
este caso, las hipótesis nula y alternativa son:
2 2
H 0 :   σ 1=  σ 2

H 1 :   σ 21≠  σ 22

Para realizar la prueba, se selecciona una muestra aleatoria de n 1 observaciones de una


población y una muestra aleatoria de n2 observaciones de la segunda población. El
estadístico de prueba se define como sigue.
ESTADÍSTICO DE PRUEBA PARA COMPARAR DOS VARIANZAS:
S 21
F= 
S 22

Los términos S 21 y S 22 son las varianzas muéstrales respectivas. Si la hipótesis nula es


verdadera, el estadístico de prueba sigue la distribución F con n 1 – 1 y n2 – 1 grados de
libertad. A fin de reducir el tamaño de la tabla de valores críticos, la varianza más
grande de la muestra se coloca en el numerador; de aquí, la razón F que se indica en la
tabla siempre es mayor que 1.00. Así, el valor crítico de la cola derecha es el único que
se requiere. El valor crítico de F de una prueba de dos colas se determina dividiendo el
nivel de significancia entre dos y después se consultan los grados de libertad
apropiados en el apéndice B.4. Un ejemplo servirá de ilustración.
Caso práctico:
Lames Limos ofrece servicio de transporte en limusina del ayuntamiento de Arequipa
Perú, al aeropuerto metropolitano de Arequipa. Sean lames, presidente de la
compañía, considera dos rutas. Una por la carretera 25 y la otra por la autopista I-75.
Lamer desea estudiar el tiempo que tardaría en conducir al aeropuerto por cada una
de las rutas y luego comparar los resultados. Recopiló los siguientes datos muéstrales,
reportados en minutos. Usando el nivel de significancia de 0.10, ¿hay alguna diferencia
entre las variaciones de los tiempos de manejo por las dos rutas?
Carretera 25 Autopista 1-75
52 59
67 60
56 61
45 51
70 56
54 63
64 57
65

Solución:
Los tiempos de manejo medios por las dos rutas son casi iguales. El tiempo medio es
de 58.29 minutos por la carretera 25 y de 59.0 minutos por la autopista I-75. Sin
embargo, al evaluar los tiempos de recorrido, lames también está interesado en la
variación de ellos. El primer paso es calcular las dos varianzas muéstrales. Se empleará
la fórmula (3-11) para determinar la desviación estándar de cada muestra; para
obtener la varianza muestral se eleva al cuadrado la desviación estándar.
Según la medición de la desviación estándar, hay más variación en la carretera 25 que
en la autopista I-75. Esto coincide con su conocimiento de las dos rutas; la ruta por la
carretera 25 tiene más semáforos, en tanto que la autopista I-75 es de acceso limitado.
Sin embargo, la ruta por la autopista I-75 es varias millas más largas. Es importante que
el servicio que ofrece sea tanto puntual como consistente, por lo que decide realizar
una prueba estadística para determinar si en realidad existe una diferencia entre las
variaciones de las dos rutas.
Empleará el procedimiento habitual de la prueba de hipótesis de cinco pasos.
Paso 1: Inicia por formular las hipótesis nula y alternativa. La prueba es de dos colas
debido a que se busca una diferencia entre las variaciones de las dos rutas. No se trata
de demostrar que el tiempo que se emplea varía más por una ruta que por la otra.
2 2
H 0 :   σ 1=  σ 2
2 2
H 1 :   σ 1≠  σ 2

Paso 2: Selecciona el nivel de significancia de 0.10.


Paso 3: El estadístico de prueba apropiado sigue la distribución F.
Paso 4: Obtiene el valor crítico del apéndice B.4, del cual se reproduce una parte como
tabla Puesto que conduce una prueba de dos colas, el nivel de significancia en la tabla
es 0.05, determinado mediante α/2 = 0.10/2 = 0.05. Hay n 1 – 1 = 7 – 1 = 6 grados de
libertad en el numerador, y n 2 – 1 = 8 – 1 = 7 grados de libertad en el denominador.
Para encontrar el valor crítico, recorre en forma horizontal la parte superior de la tabla
F del nivel de significancia 0.05 con 6 grados de libertad en el numerador. Después va
hacia abajo por esa columna hasta el valor crítico opuesto a 7 grados de libertad en el
denominador. El valor crítico es 3.87. Por lo tanto, la regla de decisión es: rechazar la
hipótesis si la razón de las varianzas muéstrales es mayor que 3.87.
Paso 5: Por último debe tomar la razón de las dos varianzas muéstrales, determinar el
valor del estadístico de prueba y tomar una decisión respecto de la hipótesis nula.
Observe que la fórmula se refiere a las varianzas muéstrales, pero se calcularon las
desviaciones estándares de las muestras, las cuales se deben elevar al cuadrado para
determinar las varianzas.
S 21
F= 
S 22
2
( 8.9947 )
F=  =4.23
( 4.3753 )2

La decisión es rechazar la hipótesis nula, debido a que el valor F calculado (4.23) es


mayor que el valor crítico (3.87). Se concluye que hay una diferencia entre las
variaciones de los tiempos de recorrido por las dos rutas.
Como se hizo notar, la práctica habitual es determinar la razón F poniendo la mayor de
las dos varianzas muéstrales en el numerador, lo cual hará que la razón F sea al menos
1.00 y permitirá utilizar siempre la cola derecha de la distribución F para evitar la
necesidad de requerir tablas F más extensas.
Respecto de las pruebas de una cola surge una duda lógica. Por ejemplo, suponga que
en el ejemplo anterior sospecha que la varianza de los tiempos en la carretera 25 es
mayor que la varianza de los tiempos por la autopista I-75. Las hipótesis nula y
alternativa deberán ser de la siguiente forma:
2 2
H 0 :   σ 1≤  σ 2
2 2
H 1:   σ1>   σ 2

El estadístico de prueba se calcula como Observe que se designó población 1 a la que


se sospecha que tiene la varianza mayor. Por lo tanto, S 21 aparece en el numerador. La
razón F será mayor que 1.00, por lo que se puede utilizar la cola superior de la
distribución F. Con estas condiciones, no es necesario dividir el nivel de significancia a
la mitad. Como en el sólo se dan niveles de significancia de 0.05 y 0.10, estamos
restringidos a estos niveles en el caso de pruebas de una cola y con 0.10 y 0.02 en el de
pruebas de dos colas, a menos que se consulte una tabla más completa o se utilice
software estadístico para calcular el estadístico F.
Caso práctico:
Stela Electric Producto, Ing., ensambla componentes eléctricos para teléfonos
celulares. Durante los últimos 10 días, Mark Nagy ha promediado 9 productos
rechazados, con una desviación estándar de 2 rechazos por día. Debite Richmond
promedió 8.5 productos rechazados, con una desviación estándar de 1.5 rechazos
durante el mismo periodo. Con un nivel de significancia de 0.05, ¿podría concluir que
hay más variación en el número de productos rechazados por día de Mark?
Ejercicios:
1. ¿Cuál es el valor crítico F de una muestra de seis observaciones en el numerador y
cuatro en el denominador? Utilice una prueba de dos colas y el nivel de significancia de
0.10.
2. ¿Cuál es el valor crítico F de una muestra de cuatro observaciones en el numerador y
siete en el denominador? Utilice una prueba de una cola y el nivel de significancia de
0.01.
3. Se dan las siguientes hipótesis.
2 2
H 0 :   σ 1=  σ 2

H 1 :   σ 21≠  σ 22

En una muestra aleatoria de ocho observaciones de la primera población resultó una


desviación estándar de 10. En una muestra aleatoria de seis observaciones de la
segunda población resultó una desviación estándar de 7. A un nivel de significancia de
0.02, ¿hay alguna diferencia entre las variaciones de las dos poblaciones?
4. Se dan las siguientes hipótesis.
2 2
H 0 :   σ 1≤  σ 2
2 2
H 1:   σ1>   σ 2

En una muestra aleatoria de cinco observaciones de la primera población resultó una


desviación estándar de 12. Una muestra aleatoria de siete observaciones de la segunda
población reveló una desviación estándar de 7. A un nivel de significancia de 0.01,
¿varía más la primera población?
5. Arbitran Media Resecar, Ing, realiza un estudio sobre los hábitos de escuchar iPod de
hombres y mujeres. Una parte del estudio incluyó el tiempo medio de escucha. Se
descubrió que el tiempo medio de escucha de los hombres era de 35 minutos por día.
La desviación estándar de la muestra de los 10 hombres estudiados fue de 10 minutos
por día. El tiempo medio de escucha de las 12 mujeres estudiadas también fue de 35
minutos, pero la desviación estándar muestral fue de 12 minutos. A un nivel de
significancia de 0.10, ¿puede concluir que hay una diferencia entre las variaciones de
los tiempos de escucha de los hombres y las mujeres?
6. Un corredor de bolsa de Criticar Secretes reportó que la tasa de rendimiento media
de una muestra de 10 acciones de la industria petrolera era de 12.6%, con una
desviación estándar de 3.9%. La tasa de rendimiento media de una muestra de 8
acciones de compañías de servicios fue de 10.9%, con una desviación estándar de
3.5%. A un nivel de significancia de 0.05, ¿puede concluir que varían más las acciones
de la industria petrolera?
4 SUPOSICIONES EN EL ANÁLISIS DE LA VARIANZA (ANOVA)
Otro uso de la distribución F es el análisis de la técnica de la varianza (ANOVA), en la
cual se comparan tres o más medias poblacionales para determinar si pueden ser
iguales. Para emplear ANOVA, se supone lo siguiente:
1. Las poblaciones siguen la distribución normal.
2. Las poblaciones tienen desviaciones estándares iguales
3. Las poblaciones son independientes.
Cuando se cumplen estas condiciones, F se emplea como la distribución del estadístico
de prueba. ¿Por qué es necesario estudiar ANOVA? ¿Por qué no sólo se emplea la
prueba de las diferencias entre medias poblacionales, como se analizó en el capítulo
anterior? Se puede comparar dos medias poblacionales a la vez. La razón más
importante es la acumulación indeseable del error tipo I. Para ampliar la explicación,
suponga cuatro métodos distintos (A, B, C y D) para capacitar personal para ser
bomberos. La asignación de cada uno de los 40 prospectos del grupo de este año es
aleatoria en cada uno de los cuatro métodos. Al final del programa de capacitación, a
los cuatro grupos se les administra una prueba común para medir la comprensión de
las técnicas contra incendios. La pregunta es: ¿existe una diferencia entre las
calificaciones medias del examen de los cuatro grupos? La respuesta a esta pregunta
permitirá comparar los cuatro métodos de capacitación.
Si emplea la distribución t para comparar las cuatro medias poblacionales, tendría que
efectuar seis pruebas t distinta. Es decir, necesitaría comparar las calificaciones medias
de los cuatro métodos como sigue: A contra B, A contra C, A contra D, B contra C, B
contra D y C contra D. Si el nivel de significancia es de 0.05, la probabilidad de una
decisión estadística correcta es de 0.95, calculada de 1 – 0.05. Como se realizaron seis
pruebas separadas (independientes), la probabilidad de que no se tome una decisión
incorrecta debido al error de muestreo en cualquiera de las seis pruebas
independientes es:
P(todas correctas) = (0.95)(0.95)(0.95)(0.95)(0.95)(0.95) = 0.735
Para encontrar la probabilidad de que al menos tenga un error debido al muestreo,
reste este resultado a 1. Por lo tanto, la probabilidad de al menos una decisión
incorrecta debida al muestreo es de 1 – 0.735 = 0.265. En resumen, si realiza seis
pruebas independientes con la distribución t, la posibilidad de rechazar una hipótesis
nula verdadera debido al error de muestreo se incrementa de 0.05 a un nivel
insatisfactorio de 0.265. Es obvio que necesita un mejor método que realizar seis
pruebas t. ANOVA le permite comparar las medias de tratamiento de forma simultánea
y evitar la acumulación del error de tipo I. ANOVA se desarrolló para aplicaciones en
agricultura, y aún se emplean muchos de los términos relacionados con ese contexto.
En particular, con el término tratamiento se identifican las diferentes poblaciones que
se examinan. Por ejemplo, el tratamiento se refiere a cómo se trató una extensión de
terreno con un tipo particular de fertilizante. La siguiente ilustración aclarará el término
tratamiento y mostrará la aplicación de ANOVA.
CASO:
Joyce Pulman es gerente de un centro financiero regional y desea comparar la
productividad, medida por el número de clientes atendidos, de tres empleados.
Selecciona cuatro días en forma aleatoria y registra el número de clientes que atendió
cada empleado. Los resultados son:
WOLFE WHITE KOROSA
55 66 47
54 76 51
59 67 46
56 71 48

¿Hay alguna diferencia en el número medio de clientes atendidos? En la gráfica 1 se


ilustra cómo pueden aparecer las poblaciones si hubiera una diferencia en las medias
del tratamiento. Observe que las poblaciones siguen la distribución normal y la
variación en cada población es la misma. Sin embargo, las medias no son iguales.

GRÁFICA 1 Caso en el que las medias del tratamiento son diferentes


Suponga que las poblaciones son iguales. Es decir, que no hay una diferencia entre las
medias (tratamiento). Esta igualdad, que se muestra en la gráfica 2, indica que las
medias poblacionales son iguales. Observe de nuevo que las poblaciones siguen la
distribución normal, y que la variación en cada una de las poblaciones es la misma.
GRÁFICA 2 Caso en el que las medias del tratamiento son iguales
5 LA PRUEBA ANOVA:
¿Cómo funciona la prueba ANOVA? Recuerde que se desea determinar si varias medias
muéstrales provienen de una sola población o de poblaciones con medias diferentes.
En realidad, estas medias muéstrales se comparan mediante sus varianzas. Para
explicar esto, recuerde que en la anterior lección se enumeraron las suposiciones que
requiere ANOVA. Una de estas suposiciones fue que las desviaciones estándares de las
diversas poblaciones normales tenían que ser las mismas. Se aprovecha este requisito
en la prueba ANOVA. La estrategia es estimar la varianza de la población (desviación
estándar al cuadrado) de dos formas para después determinar la razón de dichas
estimaciones. Si esta razón es aproximadamente 1, entonces por lógica las dos
estimaciones son iguales, y se concluye que las medias poblacionales no son iguales. La
distribución F sirve como un árbitro para indicar en qué instancia la razón de las
varianzas muéstrales es mucho mayor que 1 para haber ocurrido por casualidad.
Consulte el ejemplo del centro financiero en la sección anterior. El gerente desea
determinar si hay una diferencia entre los números medios de clientes atendidos. Para
iniciar, determine la media global de las 12 observaciones. Ésta es de 58, calculada de
(55 + 54 + … + 48) /12. Después, en cada una de las 12 observaciones encuentre la
diferencia entre el valor particular y la media global. Cada una de estas diferencias se
eleva al cuadrado y estos cuadrados se suman. Este término se denomina variación
total.
VARIACIÓN TOTAL Suma de las diferencias entre cada observación y la media global
elevadas al cuadrado.
En nuestro ejemplo, la variación total es de 1 082, determinada por (55 – 58) 2 + (54 –
58)2 + … + (48 – 58)2.
Luego se divide esta variación total en dos componentes: la que se debe a los
tratamientos y la que es aleatoria. Para encontrar estas dos componentes, se
determina la media de cada tratamiento. La primera fuente de variación se debe a los
tratamientos.
VARIACIÓN DE TRATAMIENTO Suma de las diferencias entre la media de cada
tratamiento y la media total o global elevadas al cuadrado.
En el ejemplo, la variación debida a los tratamientos es la suma de las diferencias al
cuadrado entre la media de cada empleado y la media global. Este término es 992. Para
calcularlo, primero se encuentra la media de cada uno de los tres tratamientos. La
media de Wolfe es 56, determinada por (55 + 54 + 59 + 56)/4. Las otras medias son 70
y 48, respectivamente. La suma de los cuadrados debida a los tratamientos es:
(56 – 58)2 + (56 – 58)2 + …….+ (48 – 58)2 = 4(56 – 58)2 + 4(70 – 58)2 + 4(48 – 58)2 = 992
Si existe una variación considerable entre las medias de los tratamientos, es lógico que
este término sea grande. Si las medias son similares, este término será un valor bajo. El
valor más bajo posible es cero. Esto ocurrirá cuando todas las medias de los
tratamientos sean iguales.
A la otra fuente de variación se le conoce como componente aleatoria, o componente
de error.
VARIACIÓN ALEATORIA Suma de las diferencias entre cada observación y su media de
tratamiento elevadas al cuadrado.
En el ejemplo, este término es la suma de las diferencias al cuadrado entre cada valor y
la media de ese empleado en particular. La variación de error es 90.
(55 – 56)2 + (54 – 56)2 + ……+ (48 – 48)2 = 90
El estadístico de prueba, que es la razón de las dos estimaciones de la varianza
poblacional, se determina a partir de la siguiente ecuación:
Estimacon delavrinza poblcinal bsda enlsdiferncias entrlas medi muestral
F=  
Estimacon delavrinza poblcina bsdaen lvaricon detro lamuestra

La primera estimación de la varianza poblacional parte de los tratamientos, es decir, de


la diferencia entre las medias. Éste es 992/2. ¿Por qué se dividió entre 2?, para
encontrar una varianza muestral, se divide entre el número de observaciones menos
uno. En este caso hay tres tratamientos, por lo que se divide entre 2. La primera
estimación de la varianza poblacional es 992/2.
La estimación de la varianza dentro de los tratamientos es la variación aleatoria dividía
entre el número total de observaciones menos el número de tratamiento. Es decir 90/
(12 – 3). De aquí, la segunda estimación de la varianza poblacional es 90/9. En realidad
es una generalización de la fórmula, en la cual se agruparon las varianzas muestrales de
dos poblaciones. El paso final es tomar la razón de estas dos estimaciones.
992
2
992
F=  =49.6
9

Como esta razón es muy distinta a 1, se concluye que las medias de los tratamientos no
son iguales. Hay una diferencia entre los números medios de clientes atendidos por
cada uno de los tres empleados.
A continuación se presenta otro ejemplo, el cual trata de muestras de tamaños
diferentes.
CASO II
Desde hace algún tiempo las aerolíneas han reducido sus servicios, como alimentos y
bocadillos durante sus vuelos, y empezaron a cobrar un precio adicional por algunos de
ellos, como llevar sobrepeso de equipaje, cambios de vuelo de último momento y por
mascotas que viajan en la cabina. Sin embargo, aún están muy preocupadas por el
servicio que ofrecen. Hace poco un grupo de cuatro aerolíneas contrató a Brunner
Marketing Resecar, Ing., para encuestar a sus pasajeros sobre la adquisición de boletos,
abordaje, servicio durante el vuelo, manejo del equipaje, comunicación del piloto, etc.
Hicieron 25 preguntas con diversas respuestas posibles: excelente, bueno, regular o
deficiente. Una respuesta de excelente tiene una calificación de 4, bueno 3, regular 2 y
deficiente 1. Estas respuestas se sumaron, de modo que la calificación final fue una
indicación de la satisfacción con el vuelo. Entre mayor la calificación, mayor el nivel de
satisfacción con el servicio. La calificación mayor posible fue 100. Brunner seleccionó y
estudió al azar pasajeros de las cuatro aerolíneas. A continuación se muestra la
información. ¿Hay alguna diferencia entre los niveles de satisfacción medios con
respecto a las cuatro aerolíneas? Use el nivel de significancia de 0.01.
NORTE WTA POCONO BRANSON
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65

SOLUCION:
Utilice el procedimiento de prueba de hipótesis de cinco pasos.
Paso 1: Formule las hipótesis nula y alternativa. La hipótesis nula es que las
calificaciones medias de las cuatro aerolíneas son iguales.
H 0 :   μ 1=  μ2=  μ3=  μ 4

La hipótesis alternativa es que no todas las calificaciones medias son iguales.


H1: = No todas las calificaciones medias son iguales.
La hipótesis alternativa también se considera como “al menos dos calificaciones medias
no son iguales”.
Si no se rechaza la hipótesis nula, se concluye que no hay una diferencia entre las
calificaciones medias de las cuatro aerolíneas. Si se rechaza H 0, se concluye que hay
una diferencia en al menos un par de calificaciones medias, pero en este punto no se
sabe cuál par o cuántos pares difieren.
Paso 2: Seleccione el nivel de significancia. Seleccionó el nivel de significancia de 0.01.
Paso 3: Determine el estadístico de prueba. El estadístico de prueba sigue la
distribución F.
Paso 4: Formule la regla de decisión. Para determinar la regla de decisión, necesita el
valor crítico. El valor crítico del estadístico F aparece en el tabla F. Los valores críticos
del nivel de significancia 0.05 se encuentran en la primera página, y el nivel de
significancia de 0.01, en la segunda. Para utilizar esta tabla necesita conocer los grados
de libertad del numerador y del denominador. Los grados de libertad del numerador
son iguales al número de tratamientos, designado k, menos 1. Los grados de libertad
del denominador son el número total de observaciones, n, menos el número de
tratamientos. En este ejemplo hay cuatro tratamientos y un total de 22 observaciones.
Grados de libertad del numerador = k – 1 = 4 – 1 = 3
Grados de libertad del denominador = n – k = 22 – 4 = 18
Consulte la tabla F y el nivel de significancia de 0.01. Muévase horizontalmente por la
parte superior de la página a tres grados de libertad del numerador. Después vaya
hacia abajo por esa columna hasta la fila con 18 grados de libertad. El valor en esta
intersección es 5.09. Por lo tanto, la regla de decisión es rechazar H 0 si el valor
calculado de F es mayor que 5.09.
Paso 5: Seleccione la muestra, realice los cálculos y tome una decisión. Es conveniente
resumir los cálculos del estadístico F en una tabla ANOVA. El formato de una tabla
ANOVA es como sigue. En los paquetes de software estadístico también se emplea este
formato.
TABLA ANOVA
Fuente de variación Suma de Cuadrados Grados de Libertad Media Cuadrática F
Tratamientos SST k–1 SST/(k – 1) = MST MST/MSE
Error SSE n-k SSE/(n – k) = MSE
Total SS total n-1

Hay tres valores, o suma de cuadrados, para calcular el estadístico de prueba F. Estos
valores se determinan al obtener SS total y SSE, después SST mediante una resta. El
término SS total es la variación total, SST es la variación debida a los tratamientos, y
SSE es la variación dentro de los tratamientos o el error aleatorio.
En general, el proceso se inicia al determinar SST total: la suma de las diferencias
elevadas al cuadrado entre cada observación y la media global. La fórmula para
determinar SS total es:
S S   T o t al=  ∑ ( X − −X G ) 2

Donde:
X Es cada observación de la muestra.
X G   E s la media global o total.

En seguida se determina SSE o la suma de los errores elevados al cuadrado: la suma de


las diferencias elevadas al cuadrado entre cada observación y su respectiva media de
tratamiento. La fórmula para encontrar SSE es:
S S E=  ∑ ( X− −X c )2

Donde:
−X c Es la media muestral del tratamiento c.

A continuación se presentan los cálculos detallados de SS total y SSE de este ejemplo.


Para determinar los valores de SS total y SSE se comienza por calcular la media global o
total. Hay 22 observaciones y el total es 1 664, por lo cual la media total es 75.64.
1664
−X G=  =75.64
22
Luego se encuentra la desviación de cada observación a la media total: se elevan al
cuadrado estas desviaciones y se suma el resultado de las 22 observaciones. Por
ejemplo, el primer pasajero encuestado tenía una calificación de 94, y la media global o
¿
total es 75.64. Por lo tanto: ( X − −X G ) = 94 – 75.64 = 18.36. En el caso del último

pasajero 65 – 75.64 = - 10.64 los cálculos relativos a los otros pasajeros son:
Después se eleva al cuadrado cada una de estas diferencias y se suman todos los
valores. Así, en el caso del primer pasajero:
2 2 2
( X −  − X G ) =( 94−75.64 ) =   ( 18.36 ) =337.09  

Por último, se suman todas las diferencias elevadas al cuadrado, como se indica en la
fórmula El valor SS total es 1 485.10.

Para calcular el término SSE se encuentra la desviación entre cada observación y su


media de tratamiento. En el ejemplo, la media del primer tratamiento (es decir, los
349
pasajeros en Norte Airlines) es 87.25, determinada mediante −X N =  4 = 87.25 El

subíndice N se refiere a Norte Airlines.


El primer pasajero calificó a Norte con 94, por lo que ( X − − X N )= ( 94−87.25 )=6.75 El
primer pasajero del grupo de TWA respondió con una calificación total de 75, por lo
cual ( X − −X W ) =( 94−78.20 )=−3.2 El detalle de todos los pasajeros es:
Cada uno de estos valores se eleva al cuadrado y después se suman las 22
observaciones. Los valores se muestran en la siguiente tabla.

Por lo tanto, el valor SSE es 594.41. Es decir: ∑ ( X− −X c )2 =594.41  


Por último, se determina SST, la suma de los cuadrados debida a los tratamientos, con
la resta:
SST= SS total – SSE
En este ejemplo:
SST = SS total – SSE = 1,485.10 – 594.41 = 890.69
Para determinar el valor calculado de F, consulte la tabla ANOVA. Los grados de libertad
del numerador y del denominador son los mismos que en el paso 4, donde se
determinó el valor crítico de F. El término media cuadrática es otra expresión de la
estimación de la varianza. La media cuadrática de tratamientos es SST dividido entre
sus grados de libertad.
El resultado es la media cuadrática de tratamientos, y se escribe MST. Calcule el error
medio cuadrático de una manera similar. Para ser precisos, divida SSE entre sus grados
de libertad. Para completar el proceso y obtener F, divida MST entre MSE. Sustituya los
valores particulares de F en una tabla ANOVA y calcule el valor de F, como se muestra a
continuación.

El valor calculado de F es 8.99, mayor que el valor crítico de 5.09, por lo que la
hipótesis nula se rechaza. La conclusión es que no todas las medias poblacionales son
iguales. Las calificaciones medias de las cuatro aerolíneas no son iguales. Es probable
que las calificaciones de los pasajeros se relacionen con una de ellas. En este punto
sólo es posible concluir que hay una diferencia entre las medias del tratamiento. No se
puede determinar cuáles ni cuántos grupos de tratamientos difieren.

S-ar putea să vă placă și