Documente Academic
Documente Profesional
Documente Cultură
Supuesto práctico 3
El Abeto blanco, Abeto del Pirineo, es un árbol de gran belleza por la elegancia de
sus formas y el exquisito perfume balsámico que destilan sus hojas y cortezas.
Destilando hojas y madera se obtiene aceite de trementina muy utilizado en
medicina contra torceduras y contusiones. En estos últimos años se ha observado
que la producción de semillas ha descendido y con objeto de conseguir buenas
producciones se proponen tres tratamientos. Se observa que árboles diferentes
tienen distintas características naturales de reproducción, este efecto de las
diferencias entre los árboles se debe de controlar y este control se realiza
mediante bloques. En el experimento se utilizan 10 abetos, dentro de cada abeto
se seleccionan tres ramas semejantes. Cada rama recibe exactamente uno de los
tres tratamientos que son asignados aleatoriamente. Constituyendo cada árbol un
bloque completo. Los datos obtenidos se presentan en la siguiente tabla donde se
muestra el número de semillas producidas por rama.
El objetivo del estudio es comparar los tres tratamientos, por lo que se trata de un
factor con tres niveles. Sin embargo, al realizar la medición sobre los distintos
abetos, es posible que estos influyan sobre el número se semillas observadas. Por
ello, y al no ser directamente motivo de estudio, los abetos es un factor secundario
que recibe el nombre de bloque.
Pero, previamente hay que comprobar si la presencia del factor bloque (los
abetos) está justificada. Para ello, realizamos el siguiente contraste de hipótesis:
El modelo que hemos propuesto hay que validarlo, para ello hay que comprobar si
se verifican los cuatros supuestos expresados anteriormente.
1. Gráfico de residuos frente a los valores predichos por el modelo . Si este gráfico
no presenta ningún aspecto curvilíneo se admite que el modelo es aditivo. Este gráfico se
puede realizar en SPSS de dos formas:
Seleccionamos Opciones en el cuadro de diálogo de Univariante y marcamos la
casilla Gráfico de los residuos. Se pulsa, Continuar y Aceptar
Interpretamos el gráfico que
aparece en la fila 3 columna 2, es decir aquel gráfico que se representan los
residuos en el eje de ordenadas y los valores pronosticados en el eje de abscisas.
No observamos, en dicho gráfico, ninguna tendencia curvilínea, es decir no
muestra evidencia de interacción entre el factor bloque y los tratamientos.
Gráfico de dispersión de los residuos y las predicciones . Para realizar este
gráfico, se selecciona, en el menú principal, Analizar/Modelo lineal general/
Univariante/Guardar… En la ventana resultante se selecciona Residuos No
tipificados y Valores pronosticados No tipificados. Se pulsa, Continuar y Aceptar. Y en
el Editor de datos se han creado dos nuevas variables RES_1 y PRE_1 que contienen los
residuos del modelo y los valores predichos, respectivamente. Realizamos el gráfico de
dispersión, para ello se selecciona en el menú principal, Gráficos/Cuadros de diálogos
antiguos/Diagramas/Puntos
Hipótesis de normalidad
En primer lugar se deben salvar los residuos (procedimiento realizado
anteriormente) y a continuación realizamos el estudio de la normalidad mediante
el Gráfico probabilístico Normal y el Contraste de Kolmogorov-Smirnov
Gráfico probabilístico Normal: Se selecciona en el menú
principal, Analizar/Estadísticos descriptivos/Gráficos Q-Q. Se introduce en el
campo Variables: la variable que recoge los residuos RES_1. Se pulsa Aceptar
Podemos apreciar en este gráfico que los puntos aparecen próximos a la línea
diagonal. Esta gráfica no muestra una desviación marcada de la normalidad.
Homogeneidad de varianzas
En primer lugar comprobamos la homocedasticidad gráficamente, para ello se
selecciona en el menú principal, Gráficos/Cuadros de diálogos antiguos/Barras de
error… Y en la salida correspondiente seleccionar Simple y pulsar Definir. Se
introduce en el campo Variable: La variable respuesta Número_semillas y en el
campo Eje de categorías: el factor Tratamientos. En Las barras representan se
selecciona Desviación típica, en Multiplicador: 2 (nos interesa que la desviación
típica esté multiplicada por dos). Se pulsa Aceptar
Cada grupo
tiene su promedio (el círculo en cada una de las barras) y dos desviaciones típicas
a la izquierda y dos desviaciones típicas a la derecha del promedio. Observamos
que en el tratamiento3 hay mucha más dispersión que en los otros dos y donde
hay menos dispersión es en el Tratamiento2. Del gráfico no se deduce
directamente si hay homogeneidad en estas varianzas, por lo que recurrimos
analizarlo analíticamente mediante una prueba el test de Levene.
Realizamos el mismo gráfico para el factor bloque, para ello se introduce en el
campo Eje de categorías: el factor Abetos.
Observamos
que en el Abeto 3 parece que hay mayor dispersión pero seguido a muy poca
distancia del los Abetos 1, 4, 5 y 9 y donde hay menos dispersión es en los Abetos
7 y 8. Como en el gráfico anterior, no se deduce directamente si hay
homogeneidad en estas varianzas, por lo que recurrimos analizarlo analíticamente
mediante una prueba el test de Levene.
Para realizar el test de Levene mediante SPSS, Se selecciona, en el menú
principal, Analizar/Comparar medias/ANOVA de un factor. En la salida
correspondiente, se introduce en el campo Lista de dependientes: La variable
respuesta Número_semillas y en el campo Factor: el factor Tratamientos. Se
pulsa Opciones. Se selecciona Pruebas de homogeneidad de las varianzas y Gráfico
de medias. Se pulsa Continuar y Aceptar
El p-valor es 0.244 por lo tanto no se
puede rechazar la hipótesis de homogeneidad de las varianzas y se concluye que
los tres grupos tienen varianzas homogéneas.
Antes de resolver el
contraste de igualdad de medias observemos este gráfico de medias, donde en el
eje de ordenadas figuran las medias del número de semillas y en el eje de
abscisas los tratamientos. En esta gráfica observamos que la mayor concentración
del número de semillas se produce en el Tratamiento3 y el número más bajo se
produce con el Tratamiento1. Para saber entre que parejas de tratamientos estas
diferencias son significativas aplicamos una prueba Post-hoc.
Realizamos el mismo contraste para los bloques, ya que hay que comprobar la
homocedasticidad tanto en los tratamientos como en los bloques. En la
ventana ANOVA de un factor, en la salida correspondiente, se introduce en el
campo Lista de dependientes: Número_semillas y en el campo Factor: Abetos. Se
pulsa Opciones y a continuación se selecciona Pruebas de homogeneidad de las
varianzas. Se pulsa Continuar y Aceptar
Supuesto práctico 4
Se realiza un estudio para comprobar la efectividad en el retraso del crecimiento
de bacterias utilizando cuatro soluciones diferentes para lavar los envases de la
leche. El análisis se realiza en el laboratorio y sólo se pueden realizar seis pruebas
en un mismo día. Como los días son una fuente de variabilidad potencial, el
investigador decide utilizar un diseño aleatorizado por bloques, pero al recopilar
las observaciones durante seis días no ha sido posible aplicar todos los
tratamientos en cada día, sino que sólo se han podido aplicar dos de las cuatro
soluciones cada día. Se decide utilizar un diseño en bloques incompletos
balanceado, donde I = 4 y K = 2. Un posible diseño para estos parámetros lo
proporciona la tabla correspondiente al Diseño 5 del Fichero-Adjunto, con R =
3, J = 6 y λ = 1. La disposición del diseño y las observaciones obtenidas se
muestran en la siguiente tabla.
En el ejemplo:
• N = I R = J K. En efecto, ya que N= 12; I = 4, J = 6; R = 3 y K = 2.
•
Responder a
las siguientes cuestiones:
1. ¿Afecta la temperatura a la densidad del fluído?
2. Determinar qué temperaturas producen modificaciones significativas en la densidad
media del fluido.
3. Estudiar las hipótesis del modelo: Homocedasticidad, independencia y normalidad.
4. Se puede afirmar que las temperaturas de 100 y 125 producen menos densidades de
fluido en promedio que las temperaturas de 150 y 175.
Solución:
El problema planteado se modeliza a través de un diseño unifactorial totalmente
aleatorizado de efectos fijos no-equilibrado.
Se
selecciona Analizar/Modelo lineal general/Univariante. En la salida correspondiente,
se introduce en el campo Variable dependiente: La variable respuesta Densidad del
fluido y en el campo Factores fijos: el factor Temperatura. Pulsando Aceptar se
obtiene la Tabla ANOVA
En la tabla ANOVA el valor del estadístico de contrates de igualdad de medias F =
6.983, deja a su derecha un p-valor = 0.004 inferior a 0.05, por lo que se rechaza la
hipótesis nula de igualdad de medias. Concluyendo que existen diferencias
significativas en la densidad del fluido en función de la modificación de la
temperatura.
2. Determinar qué temperaturas producen modificaciones significativas en la
densidad media del fluido.
Se plantea la pregunta de si la densidad media del fluido es significativamente
diferente para las 4 temperaturas analizadas o sólo para alguna de ellas. Esta
cuestión se resuelve mediante los contrastes de comparaciones múltiples.
Utilizando la prueba de Tukey,se obtienen los siguientes resultados:
La tabla de comparaciones múltiples muestra los intervalos simultáneos
construidos por el método de Tukey para cada posible combinación de
temperaturas. Como se puede observar todos los intervalos de confianza
construidos para las diferencias entre las densidades medias contienen al 0,
excepto el correspondiente a la pareja de temperatura125 y 175. Lo que significa
que todas las densidades medias no pueden considerarse distintas
estadísticamente excepto las densidades medias correspondientes a las
temperaturas de 125 y 175. Así mismo se observa que la significación asociada al
contraste de las densidades medias correspondientes a estas temperaturas es
inferior a 0.05, lo que se traduce en que existe evidencia empírica de que ambas
densidades medias son diferentes significativamente.
Para poder analizar esta tabla más fácilmente la ponemos de la siguiente forma
En esta tabla es más cómodo comparar cualquier pareja de temperaturas para
saber si hay diferencias significativas. Se deduce que sólo se observan diferencias
significativas entre las densidades de los fluidos cuando se ha modificado la
temperatura a 125 y 175 grados (significación inferior a 0.05).
Hipótesis de Homocedasticidad
El primer aspecto que vamos a considerar es el de la homocedasticidad, la
igualdad de varianzas. Para ello, a través del botón Opciones del
menú Analizar/Modelo lineal general/Univariante, pulsando en Pruebas de
homogeneidad se obtiene:
De donde se deduce a partir del valor de la significación, 0.585, que se puede
asumir la igualdad de varianzas entre las densidades registradas para las
diferentes temperaturas.
Gráficamente, representamos las barras de error para la desviación típica
seleccionando en el menú principal Gráficos/Cuadros de diálogo antiguos/Barras de
error
Hipótesis de Normalidad
En primer lugar analizamos la normalidad de las densidades y continuaremos con
el análisis de la normalidad de los residuos. Se selecciona en
SPSS Analizar/Estadísticos descriptivos/Explorar y se obtienen los ajustes de
normalidad
El contraste de Shapiro-Wilk (apropiado dado que el número total de datos es
inferior a 50), muestra p-valores siempre superiores a 0.05, por lo que podemos
concluir que las densidades se distribuyen según una normal para cada
temperatura considerada en el estudio.
Para
realizarlo con SPSS, en Analizar/Comparar medias/Anova de un factor…
pulsamos Contrastes. Introduciendo los correspondientes coeficientes se obtiene la
siguiente salida
Figura
35: Tabla de datos del Ejercicio Propuesto2.doc
¿Qué conclusiones se deducen de este experimento?
Solución:
Los cuatro tipos de plásticos analizados corresponden a una selección aleatoria de 4
conjuntos de observaciones extraídos aleatoriamente del total de diferentes tipos de
plásticos que hay en el mercado, entre los cuales debemos observar si existen o no
diferencias significativas. Nos encontramos por tanto ante un diseño unifactorial
completamente aleatorio con efectos aleatorios .
Dado que trabajamos con el modelo de efectos aleatorios, analizar si las medias
poblacionales son iguales será equivalente a contrastar:
La media cuadrática esperada, así como los cálculos necesarios para la obtención
de las esperanzas de los cuadrados medios del factor y del error vienen dados en
la tabla:
La
varianza total, 4047.091, se descompone en una parte atribuible a la diferencia entre los
plásticos, 2710.993, y otra debida a la variabilidad existente dentro de ellos, 1336.098.
En la varianza total, tiene mayor peso la variación debida al tipo de plástico
empleado en la fabricación de la bolsa (66.98%) que la originada dentro de los
plásticos (33.013%).
Se
pide:
1. Identificar los elementos del estudio (factores, unidades experimentales, variable
respuesta, etc.) y plantear detalladamente el modelo matemático utilizado en el experimento.
2. ¿Son los bloques fuente de variación?
3. Existen diferencias reales entre las distancias medias recorridas por una pelota de golf
en los distintos tipos de césped?
4. Estudiar las interacciones de los factores.
5. Comprobar que se cumplen las hipótesis del modelo.
6. Utilizando el método de Newman-Keuls, ¿qué tipo de cesped ofrece menor resistencia
al recorrido de las pelotas?
Solución:
1. Identificar los elementos del estudio (factores, unidades experimentales, variable
respuesta, etc.) y plantear detalladamente el modelo matemático utilizado en el experimento.
Variable respuesta: Distancia.
Factor: Tipo_Cesped que tiene cuatro niveles. Es un factor de efectos fijos ya que viene
decidido qué niveles concretos se van a utilizar.
Bloque: Bloques que tiene cinco niveles. Es un factor de efectos fijos ya que viene
decidido qué niveles concretos se van a utilizar.
Modelo completo: Los cuatro tratamientos se prueban en cada bloque exactamente una
vez.
Tamaño del experimento: Número total de observaciones (20).
Este experimento se modeliza mediante un diseño en Bloques completos al azar. El
modelo matemático es:
2. ¿Son los bloques fuente de variación?
Para resolver la cuestión planteada. Se selecciona, en el menú
principal, Analizar/Modelo lineal general/ Univariante… En la salida correspondiente,
se introduce en el campo Variable dependiente: La variable respuesta Distancia y
en el campo Factores fijos: el factor Tipo_Cesped y el bloque Bloques. Para indicar
que se trata de un modelo sin interacción entre los tratamientos y los bloques, se
debe pinchar en Modelo e indicar en la salida correspondiente que es un modelo
aditivo.
Por defecto, SPSS tiene marcado un modelo Factorial completo, por lo que hay
que señalar Personalizado. En el modelo que estamos estudiando sólo aparecen
los efectos principales de los dos factores, por lo tanto se selecciona en Tipo:
Efectos principales y se pasan los dos factores, Tipo_Cesped y Bloque, al
campo Modelo: Se pulsa Continuar y Aceptar.
Gráfico de residuos frente a los valores predichos por el modelo. Si este gráfico no
presenta ningún aspecto curvilíneo se admite que el modelo es aditivo.
Seleccionamos Opciones en el cuadro de diálogo de Univariante y marcamos la
casilla Gráfico de los residuos. Se pulsa, Continuar y Aceptar
Interpretamos el
gráfico que aparece en la fila 3 columna 2, es decir aquel gráfico que se
representan los residuos en el eje de ordenadas y los valores pronosticados en el
eje de abscisas. No observamos, en dicho gráfico, ninguna tendencia curvilínea,
es decir no muestra evidencia de interacción entre el factor bloque y los
tratamientos.
Gráfico de perfil.
Es un gráfico de las medias de los tratamientos, para realizarlo se selecciona, en
el menú principal, Analizar/Modelo lineal general/ Univariante/Gráficos… se
introduce en el Eje horizontal: Tipo_Cesped y en Líneas separadas: Bloques. Se
pulsa Añadir, Continuar y Aceptar.
La figura representa el gráfico de las medias de los tratamientos. Cuando no existe
interacción, los segmentos lineales que unen dos medias cualesquiera serán paralelos a
través de los bloques. Es decir, es posible hacer consideraciones generales relativas a los
tratamientos sin tener que especificar el bloque implicado. Podemos deducir, por ejemplo,
que el césped Agrostis Tenuis presenta más resistencia al recorrido de las pelotas que los
otros tipos de céspedes. Cuando estos segmentos no son paralelos se deduce que hay
interacción entre los bloques y tratamientos. Esto significa que debemos tener cuidado
cuando hagamos declaraciones relativas a los tratamientos, porque el bloque implicado es
también importante.
5. Comprobar que se cumplen las hipótesis del modelo
Hipótesis de normalidad
En primer lugar se deben salvar los residuos y a continuación realizamos el
estudio de la normalidad mediante el Gráfico probabilístico Normal y el Contraste de
Kolmogorov-Smirnov.
Gráfico probabilístico Normal: Se selecciona en el menú
principal, Analizar/Estadísticos descriptivos/Gráficos Q-Q. Se introduce en el
campo Variables: la variable que recoge los residuos RES_1. Se pulsa Aceptar
Podemos apreciar en este gráfico que los puntos aparecen próximos a la línea
diagonal. Esta gráfica no muestra una desviación marcada de la normalidad.
Contraste de Kolmogorov-Smirnov: Se selecciona en el menú
principal, Analizar/Pruebas no paramétricas/ Cuadros de diálogos antiguos/K-S de 1
muestra. Se introduce en el campo Lista Contrastar variables: la variable que
recoge los residuos RES_1. Se pulsa Aceptar
El valor del p-
valor, 0.901, es mayor que el nivel de significación 0.05, aceptándose la hipótesis
de normalidad.
Independencia de los residuos
Homogeneidad de varianzas
En primer lugar comprobamos la homocedasticidad gráficamente, para ello se
selecciona en el menú principal, Gráficos/Cuadros de diálogos antiguos/Barras de
error… Y en la salida correspondiente seleccionar Simple y pulsar Definir. Se
introduce en el campo Variable: La variable respuesta Distancia y en el campo Eje
de categorías: el factor Tipo_Cesped. En Las barras representan se
selecciona Desviación típica, en Multiplicador: 2 (nos interesa que la desviación
típica esté multiplicada por dos). Se
pulsa Aceptar
Cada grupo tiene su promedio (el círculo en cada una de las barras), dos
desviaciones típicas a la izquierda y dos desviaciones típicas a la derecha del
promedio. Observamos que en los tipos de césped Agrostis Canina y Paspalum
Vaginatum hay mucha más dispersión que en los otros dos. Del gráfico no se
deduce directamente si hay homogeneidad en las varianzas, por lo que recurrimos
a analizarlo numéricamente mediante una prueba, el test de Levene.
Realizamos el mismo gráfico para el factor bloque, para ello introducimos en el
campo Eje de categorías: el factor Bloques.
Observamos que en el Bloque 2 parece que hay mayor dispersión pero seguido a
muy poca distancia del los Bloques 4, 1 y 5 y donde hay menos dispersión es en
el Bloque 3. Como en el gráfico anterior, no se deduce directamente si hay
homogeneidad en estas varianzas, por lo que recurrimos a analizarlo
numéricamente mediante el test de Levene.
Para realizar el test de Levene mediante SPSS, se selecciona, en el menú
principal, Analizar/Comparar medias/ANOVA de un factor. En la salida
correspondiente, se introduce en el campo Lista de dependientes: La variable
respuesta Distancia y en el campo Factor: el factor Tipo_Cesped. Se
pulsa Opciones. Se selecciona Pruebas de homogeneidad de las varianzas y Gráfico
de medias. Se pulsa Continuar y Aceptar
El p-valor es 0.412 por lo tanto no se puede rechazar la hipótesis de
homogeneidad de las varianzas y se concluye que los tres grupos tienen varianzas
homogéneas.
En el gráfico de medias, donde en el eje de ordenadas figuran las medias de las
distancias recorridas por las pelotas y en el eje de abscisas los tipos de césped.
En esta gráfica observamos que la mayor distancia recorrida se produce en el
tratamiento 4 (Paspalum Vaginatum) y el número más bajo se produce con el
tratamiento1 (Agrostis Tenuis). Para saber entre que parejas de tratamientos estas
diferencias son significativas se realiza una prueba Post-hoc.
Realizamos el mismo contraste para los bloques, ya que hay que comprobar la
homocedasticidad tanto en los tratamientos como en los bloques. En este caso se
introduce en el campo Factor: Bloques.
El p-valor es 0.899 por lo tanto no se puede rechazar la hipótesis de
homogeneidad de las varianzas entre los bloques y se concluye que los diez
grupos tienen varianzas homogéneas.
En esta gráfica observamos que la mayor distancia recorrida se produce en
el Bloque 2 y el número más bajo se produce en el Bloque 3. Para saber entre que
parejas de Bloques estas diferencias son significativas, aplicamos una prueba Post-
hoc.
5. Utilizando el métdodo de Newman-Keuls, ¿qué tipo de cesped ofrece menor
resistencia al recorrido de las pelotas?
A partir de los
resultados obtenidos, se deduce que las distancias medias recorridas por las
pelotas son similares para los céspedes Agrostis Tenuis y Paspalum Notatum por
una parte, también son similares en el Paspalum Notatum y Agrostis Canina, y en
ambos grupos dichas distancias medias difieren significativamente de las
recorridas en el césped Paspalum Vaginatum. Por lo tanto, se pueden establecer
tres agrupaciones con características similares para las distancias medias
recorridas. El tipo de césped que ofrece menor resistencia al recorrido de las
pelotas es el Paspalum Vaginatum, donde las pelotas tienen un recorrido medio
de 3.56 u.d.
Solución:
Para resolver las cuestiones planteadas sobre los tratamientos y los bloques, en el
menú principal se selecciona: Analizar\Modelo lineal
general\Univariante… Introduciendo la información relativa al diseño en la ventana
de análisis: La variable dependiente es la Distancia y el resto de
variables, Tipo_Cesped y Bloques corresponden a los factores fijos del modelo. En
la opción Modelo, hay que indicar al programa que se trata de un modelo sin
interacción entre los tratamientos y los bloques. Además hay que tener en cuenta
que se trata de un diseño en bloques incompletos. En este tipo de diseño los
tratamientos no están en todos los bloques, entonces los bloques y tratamientos
no son ortogonales (como lo son en el diseño de bloques completos al azar), por
lo tanto no es posible realizar una descomposición de la variabilidad del
experimento como en el diseño en bloques completos. Para resolver está
cuestión, SPSS utiliza las Sumas de cuadrados de tipo I.
Para evaluar el efecto de los bloques, la suma de cuadrados de bloques debe ajustarse por
tratamientos, por lo tanto primero se introducen los tratamientos y después los bloques.
De la
tabla ANOVA se deduce que los bloques son una fuente de variación.
Para evaluar el efecto de los tratamientos, la suma de cuadrados de tratamientos debe
ajustarse por bloques, por lo tanto primero se introducen los bloques y después los tratamientos
Se observa en la tabla ANOVA que hay diferencias reales entre las distancias
medias recorridas por una pelota de golf en los distintos tipos de césped ya que el
p-valor es menor que 0.001.
Responder a las
siguientes cuestiones:
1. ¿Se puede afirmar que la productividad media de las cuatro variedades de aguacate es
la misma?
2. ¿Qué supuestos han de verificarse?
3. ¿Se obtiene la misma producción con las cuatro variedades de aguacate? En caso
negativo, analizar mediante el procedimiento de Tukey, con qué variedad de aguacate hay
mayor producción.
Solución:
1. ¿Se puede afirmar que la productividad media de las cuatro variedades de
aguacate es la misma?
El análisis de la productividad de las variedades de aguacate corresponde al
análisis de un factor con 4 niveles. Dado que en el estudio intervienen dos fuentes
de variación: la Disponibilidad de Nitrógeno y la Pendiente, se consideran dos
factores de bloque, cada uno de ellos con 4 niveles.
Variable respuesta: Productividad
Factor: Variedad de aguacate. Es un factor de efectos fijos ya que desde el principio se
establecen los niveles concretos que se van a analizar.
Bloques: Disponibilidad de Nitrógeno y Pendiente, ambos con 4 niveles y ambos de
efectos fijos.
Tamaño del experimento: Número total de observaciones (42) .
Para resolver el contraste planteado, en el menú principal se
selecciona: Analizar\Modelo lineal general\Univariante… Introduciendo la
información relativa al diseño en la ventana de análisis: La variable dependiente es
la Productividad y el resto de
variables, Nitrógeno, Pendiente y Variedad corresponden a los factores fijos del
modelo. En la opción Modelo, hay que indicar al programa que se trata de un
modelo sin interacción entre los tratamientos y los bloques
A la
vista de los p-valores, todos ellos inferiores a 0.05, podemos afirmar que todos los
efectos son significativos. Tanto las variedades de aguacates utilizadas, como la
pendiente del terreno y la disponibilidad de nitrógeno influyen en la productividad
de los aguacates.
2. ¿Qué supuestos han de verificarse?
Los supuestos que han de verificarse en un diseño de cuadrados latinos son
Normalidad, Homocedasticidad e Independencia además del supuesto de
aditividad entre filas, columnas y tratamientos (es decir, que no haya interacciones
entre los mismos).
Hipótesis de normalidad
Gráfico probabilístico Normal: Se selecciona en el menú
principal, Analizar/Estadísticos descriptivos/Gráficos Q-Q. Se introduce en el campo
Variables: la variable que recoge los residuos RES_1. Se pulsa Aceptar
Homogeneidad de varianzas
En primer lugar comprobamos la homocedasticidad gráficamente, para ello se
selecciona en el menú principal, Gráficos/Cuadros de diálogos antiguos/Barras de
error… Y en la salida correspondiente seleccionar Simple y pulsar Definir. Se
introduce en el campo Variable: La variable respuesta Productividad y en el
campo Eje de categorías: el factor Variedad. En Las barras representan se
selecciona Desviación típica, en Multiplicador: 2 (nos interesa que la desviación
típica esté multiplicada por dos). Se pulsa Aceptar
Observamos que en las variedades de aguacates B y C hay mucha más
dispersión que en las otras dos. Del gráfico no se deduce directamente si hay
homogeneidad en estas varianzas, por lo que recurrimos analizarlo
numéricamente mediante una prueba, el test de Levene.
Se debe realizar el mismo gráfico para cada uno de los factores de bloque.
Realizamos el mismo contraste para los bloques, ya que hay que comprobar la
homocedasticidad tanto en los tratamientos como en los bloque
Los p-valores son mayores que 0.05,
por lo tanto no se puede rechazar la hipótesis de homogeneidad de las varianzas.
Aditividad de los factores
Gráfico de residuos frente a los valores predichos por el modelo. Si el gráfico que
aparece en la fila 3 columna 2 no presenta ningún aspecto curvilíneo se admite
que el modelo es aditivo.
Gráfico de perfil. Es un gráfico de las medias de los tratamientos, realizamos los
siguientes gráficos para comprobar la no interacción entre los factores
Cuando
no existe interacción, los segmentos lineales que unen dos medias cualesquiera
serán paralelos a través de los bloques. Es decir, es posible hacer
consideraciones generales relativas a los tratamientos sin tener que especificar el
bloque implicado. Cuando estos segmentos no son paralelos se deduce que hay
interacción entre los bloques y tratamientos. Esto significa que debemos tener
cuidado cuando hagamos declaraciones relativas a los tratamientos, porque el
bloque implicado es también importante.
3. ¿Se obtiene la misma producción con las cuatro variedades de aguacate? En
caso negativo, analizar mediante el procedimiento de Tukey, con qué variedad de
aguacate hay mayor producción.
La tabla de comparaciones
múltiples muestra los intervalos simultáneos construidos por el método de Tukey
para cada posible combinación de variedades de aguacates. Como se puede
observar, todos los intervalos de confianza construidos para las diferencias entre
las producciones medias de las variedades no contienen al 0, excepto el
correspondiente a la pareja de variedades de aguacates A y D. Lo que significa
que todas las producciones medias pueden considerarse distintas
estadísticamente excepto las producciones medias correspondientes a las
variedades A y D. En la tabla de la derecha es más cómodo comparar cualquier
pareja de variedades de aguacates para saber si hay diferencias significativas. Se
deduce que únicamente no se observan diferencias significativas entre las
producciones de las variedades de aguacates A y D (P-valor = 0.429).
En la tabla Subconjuntos
homogéneos asociada al contraste de Tukey se muestra por columnas los subgrupos de
medias iguales. En nuestro estudio sobre las producciones de aguacates se observan que
hay tres subgrupos homogéneos, al primer subgrupo pertenece la Variedad B, al segundo
las variedades A y D y al tercero la Variedad C. Y se observa que la producción media
mayor se obtiene con la Variedad C (827.5 Kg/ parcela) y la menor con la Variedad
B (777.50 Kg/parcela).
Solución:
El análisis de la productividad de las variedades de aguacate corresponde al análisis de un
factor con 4 niveles. Dado que en el estudio intervienen dos fuentes de variación:
la Disponibilidad de Nitrógeno y la Pendiente, se consideran dos factores de bloque, el
primero con 4 niveles y el segundo con tres niveles.
Variable respuesta: Productividad.
Factor: Variedad de aguacate. Es un factor de efectos fijos ya que desde el principio se
establecen los niveles concretos que se van a analizar.
Bloques: Disponibilidad de Nitrógeno y Pendiente, con 4 y 3 niveles, respectivamente y
ambos de efectos fijos.
Tamaño del experimento: Número total de observaciones: 12 .
Para resolver el contraste planteado, en el menú principal se selecciona: Analizar\Modelo
lineal general\Univariante… Introduciendo la información relativa al diseño en la ventana
de análisis: La variable dependiente es la Productividad y el resto de
variables, Nitrógeno, Pendiente y Variedad corresponden a los factores fijos del modelo.
En la opción Modelo, hay que indicar al programa que se trata de un modelo sin
interacción entre los tratamientos y los bloques. Además hay que tener en cuenta que el
diseño en cuadrados de Youden es un diseño en bloques incompletos por lo que hay que
utilizar, para realizarlo mediante SPSS, las Sumas de cuadrados de Tipo I y tener en
cuenta que para analizar un determinado factor hay que introducirlo en último lugar.
Los resultados del ANOVA dependerán del orden en que se introduzcan los factores.
A la
vista del valor de Sig. (0.024), podemos afirmar que en la productividad del aguacate
influyen las distintas variedades utilizadas.
La mayor productividad de
aguacates se obtiene con la Variedad B, con un productividad media de 901.33 Kg/parcela.
Solución:
Solución:
1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático
y explicar los distintos elementos que intervienen.
En este experimento los factores de interés que intervienen son la Semana en la que se
realiza el recuento de diatomeas y el Lugar del río donde se realiza dicho recuento, Son
factores de efectos fijos, el primero tiene cuatro niveles y el segundo tiene dos niveles y
se realizan cuatro réplicas con cada tratamiento. El número de tratamientos es de ocho,
formados a partir de las combinaciones de los niveles de los dos factores. Es un modelo
bifactorial de efectos fijos con interacción, el modelo matemático adecuado para este
experimento es:
1.
1. Estudiar si la semana y el lugar son factores determinantes en el número de
diatomeas halladas en el agua del río. ¿Hay posibilidad que una semana sea más
recomendable en un lugar del río en concreto y no lo sea en el otro lugar?
El único efecto que no es significativo es la interacción de los dos factores, por lo que se
debe modificar el modelo suprimiendo la interacción entre ambos factores y realizar un
estudio del modelo modificado.
3. Estudiar en qué semana se producen menos contaminación en el río, utilizando el
método de Duncan.
4. Estudiar en qué lugar del río se producen menos diatomeas..
Ejercicio Propuesto 9 (Resuelto)
La cotinina es uno de los principales metabolitos de la nicotina. Actualmente se le
considera el mejor indicador de la exposición al humo de tabaco. Se ha realizado un
estudio con distintas marcas de tabaco distinguiendo principalmente entre negro y
rubio para detectar las posibles diferencias en el nivel de nicotina de personas
expuestas al humo de tabaco. Para ello, se han analizado personas de distintas edades
(niños, jóvenes y adultos) y se ha distinguido entre mujeres y hombres. Se han
obtenido los datos de la siguiente tabla sobre el nivel de nicotina en miligramos por
mililitro.
Responder a las siguientes cuestiones:
1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático y
explicar los distintos elementos que intervienen.
2. Contrastar la hipótesis nula de no interacción entre los factores. Adecuar el modelo al
resultado de las interacciones y contrastar los efectos principales.
3. ¿Hay diferencias significativas en el nivel de nicotina en las distintas edades?¿En qué
edad el nivel de nicotina es mayor?
4. ¿El tipo de tabaco es un factor determinante en el nivel de nicotina?
5. Comparar el nivel medio de nicotina entre las mujeres y los hombres. ¿Se detectan
diferencias significativas?
Solución: