Sunteți pe pagina 1din 9

¿Qué es MANOVA (análisis multivariado de la

varianza)?
MANOVA es una prueba que analiza la relación entre varias variables de respuesta
y un conjunto común de predictores al mismo tiempo. Al igual que el ANOVA,
MANOVA exige variables de respuesta continuas y predictores categóricos.
MANOVA tiene algunas ventajas importantes en comparación con la ejecución de
múltiples análisis de ANOVA, una variable de respuesta a la vez.
Aumento en la potencia
Se puede utilizar la estructura de covarianza de los datos entre las variables
de respuesta para probar la igualdad de medias al mismo tiempo. Si las
variables de respuesta están correlacionadas, entonces esta información
adicional puede ayudar a detectar diferencias muy pequeñas, las cuales no
sería posible detectar mediante la ejecución de análisis ANOVA individuales.

Detecta patrones de respuestas multivariadas


El factor puede afectar la relación entre las respuestas en lugar de afectar
una respuesta individual. Los análisis de ANOVA no detectarán estos
patrones multivariados como lo muestran las siguientes figuras.

Controla la tasa de error por familia


La probabilidad de rechazar de manera incorrecta la hipótesis nula aumenta
con cada ANOVA sucesivo. La ejecución de un solo MANOVA para probar
todas las variables de respuesta al mismo tiempo mantiene la tasa de error
por familia igual a su nivel alfa.

Por ejemplo, está estudiando los efectos de diferentes aleaciones (1, 2 y 3)


sobre la dureza y flexibilidad de los productos de construcción de su
compañía. Primero ejecuta dos análisis ANOVA independientes, pero los
resultados no son significativos. Al sorprenderle, crea la gráfica de los datos
sin procesar para ambas variables de respuestas utilizando gráficas de
valores individuales. Estas gráficas permiten confirmar visualmente estos
resultados no significativos en el ANOVA.
Debido a que las variables de respuesta están correlacionadas, usted ejecuta
un análisis MANOVA. En esta oportunidad, los resultados son significativos,
con valores p menores que 0.05. Usted crea una gráfica de dispersión para
comprender mejor los resultados.

La gráfica de valores individuales muestra, desde una perspectiva univariada,


que las aleaciones no afectan de manera significativa ni la dureza, ni la
flexibilidad. Sin embargo, la gráfica de dispersión de los mismos datos
muestra que las diferentes aleaciones cambian la relación entre las dos
variables de respuesta. Es decir, para una puntuación de flexibilidad
especificada, la aleación 3 generalmente tiene una puntuación de dureza
más alta que las aleaciones 1 y 2. MANOVA puede detectar este tipo de
respuestas multivariadas, mientras que ANOVA no puede lograrlo.

NOTA
Por lo general, debería crear la gráfica de los datos antes de realizar
cualquier análisis porque esta gráfica le ayudará a decidir cual enfoque es el
más apropiado.

¿Cuáles pruebas multivariadas están incluidas en


MANOVA?
Minitab realiza de manera automática cuatro pruebas multivariadas para
cada término del modelo y para términos solicitados especialmente:

 Prueba de Wilk
 Prueba de Lawley-Hotelling
 Prueba de Pillai
 Prueba de la raíz más grande de Roy

Todas las cuatro pruebas se basan en dos matrices SSCP (sumas de


cuadrados y productos cruzados):

 Una matriz de H (hipótesis) asociada con cada término, también


denominada sumas de cuadrados entre muestras
 Una matriz de E (error) asociada con el error para la prueba; también
denominada sumas de cuadrados dentro de muestras

Las matrices SSCP se muestran cuando se solicita las matrices de hipótesis.

Se pueden expresar los estadísticos de prueba como H, E o H y E, o como


valores propios de E-1 H.. Se puede solicitar que sean mostrados estos
valores propios. (Si se repiten los valores propios, los vectores propios
correspondientes no son únicos y, en este caso, los vectores propios que
Minitab muestra y los que se encuentran en los libros, o en cualquier otro
software, pudieran no coincidir. Sin embargo, las pruebas de MANOVA, no
siempre son únicas.)
Información de factores para MANOVA general
Más información sobre Minitab 18

La tabla Información de factores muestra los factores en el diseño, el tipo de


factores, el número de niveles y los valores de los niveles.

Los factores son las variables que usted controla en el experimento. Los factores
también se conocen como variables independientes, variables explicativas y
variables predictoras. Los factores solo pueden asumir un número limitado de
valores posibles, conocidos como niveles de los factores. Los factores pueden
tomar valores numéricos o de texto. Los factores numéricos utilizan pocos valores
controlados en el experimento, aunque son posibles muchos valores.

Interpretación
Utilice la tabla Información de factores para comprobar que el análisis se ha
realizado tal como estaba previsto.

En MANOVA general, los factores solamente pueden ser fijos. En general, si el


investigador controla los niveles de un factor, el factor es fijo. Por el contrario, si el
investigador toma una muestra aleatoria de los niveles de un factor de una
población, el factor es aleatorio.

Por ejemplo, un analista de calidad tiene previsto estudiar los factores que podrían
afectar la resistencia del plástico durante el proceso de manufactura. El analista
incluye el Aditivo, la Temperatura y el Operador en el experimento. El aditivo es una
variable categórica que puede ser de tipo A o de tipo B. La Temperatura es una
variable continua pero el analista tiene previsto únicamente incluir tres
configuraciones de temperaturas en el experimento: 100 °C, 150 °C, and 200 °C.
Puesto que el analista controla los niveles de estos dos factores en el experimento,
estos factores son fijos.

Factor Aditivo Temperatura

Nivel A Bajo (100 ºC)

Nivel B Medio (150 ºC)


Factor Aditivo Temperatura

Nivel Alto (200 ºC)

Los factores pueden ser cruzados o anidados. Dos factores están cruzados cuando
cada nivel de un factor ocurre en combinación con cada nivel del otro factor. Dos
factores están anidados cuando los niveles de un factor son similares pero no
idénticos, y cada uno ocurre en combinación con diferentes niveles del otro factor.

Por ejemplo, si un diseño contiene máquina y operador, estos factores están


cruzados si todos los operadores utilizan todas las máquinas. Sin embargo, el
operador está anidado en máquina si cada máquina tiene un conjunto diferente de
operadores.

En la tabla Información de factores, los paréntesis indican los factores anidados. Por
ejemplo, el Operador (máquina) indica que el operador está anidado dentro de la
máquina.

Para obtener más información sobre los factores, vaya a Factores y niveles de
factor, ¿Qué son factores, factores cruzados y factores anidados? y ¿Cuál es la
diferencia entre factores fijos y aleatorios?.

ANÁLISIS MULTIVARIANTE DE LA VARIANZA (MANOVA)

Si el análisis de la varianza univariante pretende contrastar hipótesis


lineales sobre la influencia de los distintos niveles de uno o varios
factores en el comportamiento de una variable (unidimensional), el
análisis multivariante de la varianza (MANOVA) tiene la misma
pretensión, pero considerando un vector (multidimensional) de
variables.

La aplicación paradigmática del análisis de la varianza es determinar si


existen diferencias significativas entre los distintos niveles o grupos de
un factor ( categórico), a través del contraste de igualdad de medias.
Porque es, fundamentalmente, ésta la aplicación que nos interesa, aquí
nos detendremos un poco en ella, para el caso multivariante del
MANOVA, para luego poder extender sus resultados y consideraciones
al análisis factorial discriminante.

Los supuestos del análisis serán los mismos en el caso del MANOVA
que en el del análisis factorial discriminante y, en consecuencia, los
mantendremos ya desde aquí:

a. Consideramos un vector aleatorio Y de dimensión n sobre el cuál


obtenemos g muestras correspondientes a los g niveles, categorías
o grupos considerados.
b. Suponemos que Y sigue, en cada una de las poblaciones de los g
grupos una distribución Normal n-variante con vector de medias
M (i= 1,2,...g),eventualmente distinto para cada grupo y matriz de
covarianzas V, la misma para todas las poblaciones.

Bajo estos supuestos, consideraremos, también, que cada observación n-


dimensional para cada grupo, i, puede expresarse de acuerdo con el
siguiente modelo:

Yi = M + Ai + Ei

Donde: M es el vector de medias general. Ai es un vector n-dimensional


que nos indica el efecto propio del nivel o grupo i-simo. Ei es un vector
aleatorio que nos indica la desviación errática de las observaciones y se
supone que sigue una distribución normal n-dimensional con vector de
medias el vector nulo y matriz de varianzas V, la misma para todos los
grupos (i=1,2,...g)

En estas circunstancias es fácil comprobar cómo el vector Yi tendrá, en


cada grupo, i, una distribución:

Yi  N [ (M + Ai ); V ]

Sobre este modelo nos plantemos contrastar la hipótesis nula de que


todos los vectores A sean nulos:

H0: A1= A2=....=


Ag =0

Esta hipótesis equivale a considerar que no hay diferencias en los


vectores de medias de Y en cada uno de los grupos o que las medias en
cada grupo son las mismas y coinciden el vector M .
Para la realización del contraste, partimos, como en el caso univariante,
de la descomposición de la varianza total; en este caso de la matriz de
varianzas y covarianzas total.

La matriz de varianzas muestrales T puede verse como la suma de otras


dos matrices de varianzas: T = B + W

Donde B es la matriz de varianzas "entre-grupos" (Between-groups) y


W es la matriz de varianza "intra- grupos" (Within-groups).

B expresa las varianzas y covarianzas, considerando los centroides de


los grupos como observaciones.

W, en cambio, expresa la suma para todos los grupos de las varianzas y


covarianzas de las observaciones de cada grupo.

Pues bien, la matriz NB, donde N es el número total de observaciones


muestrales, puede probarse que sigue una distribución de Wishart con
parámetros n, g-1 , V (lo que se expresa como Wn(g-1, V ) ).

La distribución puede considerarse como una generalización de la


distribución  2 de Pearson, que puede definirse de acuerdo con el
siguiente esquema general:

Si tenemos una matriz de n columnas y m filas, Z; donde cada columna


está formada por un vector aleatorio m-dimensional que tiene una
distribución normal m-variante con vector de medias el vector nulo y
matriz de varianzas V, la misma para todas las columnas de la matriz;
entonces la matriz A = Z'Z sigue una distribución de Wishart de
parámetros n, m y V [lo que puede expresarse como: Wn(m,V) ]

Una propiedad importante de esta distribución es que si realizamos un


muestreo aleatorio de tamaño N sobre una población normal
multivariante N [M,V],la matriz formada por el producto del escalar N
y la matriz de varianzas muestral,S, sigue una distribución de Wishart de
parámetros n, N-1, V: NS  Wn (N-1, V )

Es, precisamente, a partir de esta propiedad como puede probarse el


resultado de que :

NB  Wn (g-1,V)

Igualmente puede probarse también que si la hipótesis nula: H0: A1=


A2=....= Ag =0 es cierta, entonces la matriz NW seguirá, también una
distribución de Wishart de parámetros n, N-g, V y será independiente de
la distribución de NB.

Obviamente también, considerando esa misma propiedad, NS (siendo S


la matriz de varianzas totales muestral ) seguirá también una distribución
Wn (N-1,V)

Teniendo en cuenta ésto, el contraste de la hipótesis nula: H 0: A1=


A2=....= Ag =0 se lleva a cabo evaluando el valor del

estadístico  (lambda de Wilks):  = |W| / |T|


Estadístico que sigue una distribución  de Wilks de parámetros n, N-g
,g-1 .

Es, precisamente este estadístico el que nos conducirá a determinar si los


vectores de medias de los grupos son significativamente diferentes o no;
es decir, si la hipótesis nula es rechazable o no:

Para un nivel de significación :

 Aceptaremos la hipótesis nula si


 Rechazaremos la hipótesis nula si 

Siendo  el valo crítico que verifica P () =  en una


distribución  (n, N-g,g-1).

En la práctica el contraste se realiza después de una transformación


previa del estadístico en una F o una 2
https://es.slideshare.net/mialnsc/anlisis-multivariado-de-varianza-manova

S-ar putea să vă placă și