Sunteți pe pagina 1din 9

STATGRAPHICS – Rev.

4/25/2007

Análisis de Componentes de la Varianza

Resumen
El procedimiento de Análisis de Componentes de Varianza está diseñado para estimar la
contribución de múltiples factores a la variabilidad de una variable dependiente Y. Está diseñado
para analizar un experimento anidado en el cual los factores están estructurados en una manera
jerárquica. En tal estudio, las muestras de cada factor son tomadas del interior de las muestras del
factor inmediatamente arriba de él.

Por ejemplo, b conjuntos podrían haber sido tomados de un proceso. Entonces s muestras
podrían ser tomadas de cada conjunto. Finalmente, t pruebas podrían ser realizadas en cada
muestra. El conjunto final de datos tendría un total de n = bst medidas.

Este procedimiento está diseñado para un experimento en el cual los factores están estructurados
en un estricto orden jerárquico y en el cual todos los efectos se asumen como aleatorios. El
procedimiento Modelos Lineales Generales debería ser usado para situaciones más complicadas.

StatFolio de Muestra: varcomp.sgp

Datos de la Muestra:
El archivo pigment.sf6 contiene datos de un experimento descrito por Box, Hunter y Hunter
(1978). En ese experimento, b = 15 conjuntos de pegamento de pigmento fueron seleccionados.
De cada conjunto, s = 2 muestras fueron tomadas y t = 2 pruebas fueron ejecutadas en cada
muestra para medir la humedad contenida. Un total de n = 60 mediciones se encuentran en el
archivo y una parte de éstas se muestra abajo:

Batch Simple Test Moisture


1 1 1 40
1 1 2 39
1 2 1 30
1 2 2 30
2 3 1 26
2 3 2 28
2 4 1 25
2 4 2 26
3 5 1 29
3 5 2 28
3 6 1 14
3 6 2 15

Los conjuntos están numerados del 1 a b = 15. Las muestras están numeradas del 1 al bs = 30,
sin embargo ellas podrían haber sido etiquetadas del 1 a s = 2 dentro de cada conjunto. Las
pruebas están numeradas del 1 a t = 2 dentro de cada muestra, sin embargo éstas podrían haber
sido numeradas del 1 al bst = 60. Cada esquema de numeración proporcionará idénticos
resultados.

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 1


STATGRAPHICS – Rev. 4/25/2007
Captura de Datos
Los datos consisten de una sencilla columna que contiene las mediciones así como múltiples
columnas que indican los niveles de los factores experimentales.

• Variable Dependiente: columna numérica que contiene las observaciones.

• Factores en Orden de Anidamiento: columnas numéricas o no numéricas que contienen los


niveles que identifican cada factor. Los factores deben ser capturados de arriba hacia abajo,
por ejemplo cada factor se asume para ser anidado en el factor que se encuentra
inmediatamente arriba de él en la lista. Este es uno de los pocos procedimientos de
STATGRAPHICS en los que el orden de los factores afecta el análisis.

• Selección: selecciona el subconjunto.

Nota: la prueba del factor final puede omitirse de la lista de factores en el cuadro de diálogo. Si
es así, sus efectos serán incluidos como un término de “Residuo” en la tabla de ANOVA.

Modelo Estadístico
El modelo estadístico relevante para la muestra de datos es

Ybst = μ + ε b + ε s + ε t (1)

donde

μ = media del proceso


εb = desviación de la media de conjunto b de la media del proceso μ
© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 2
STATGRAPHICS – Rev. 4/25/2007

εs = desviación de la media de la muestra s de la media del conjunto b

εt = desviación del cálculo de la prueba t de la media de la muestra s

Las desviaciones se asumen usualmente como muestras aleatorias de distribuciones normales


con desviaciones estándar:

σb = desviación estándar entre los conjuntoss

σs = desviación estándar entre las muestras dentro de los conjuntos

σt = desviación estándar entre los resultados de pruebas dentro de cada muestra

Suponiendo que los diversos componentes del error son independientes, la variabilidad del
proceso general es la suma de la variabilidad explicada por los diversos componentes, por
ejemplo:

σ 2 = σ b2 + σ s2 + σ t2 (2)

Resumen del Análisis


El Resumen del Análisis muestra el número de observaciones n y un análisis de la tabla de
varianza.

Análisis Componentes de la Varianza - moisture


Variable dependiente: moisture
Factores:
batch
sample
test
Número de casos completos: 60

Análisis de Varianza para moisture


Fuente Suma de Cuadrados Gl Cuadrado Medio Comp. Var. Porciento
TOTAL (CORREGIDO) 2108.18 59
Batch 1210.93 14 86.4952 7.12798 19.49
Sample 869.75 15 57.9833 28.5333 78.01
Test 27.5 30 0.916667 0.916667 2.51

La tabla muestra:

• Sumas de Cuadrados: una descomposición de la suma de las desviaciones cuadradas


alrededor de la gran media.

• GL: los grados de libertad asociados con cada suma de cuadrados.

• Cuadrado Medio: las sumas de cuadrados divididos entre sus grados de libertad.

• Componentes de la Varianza: los componentes de la varianza estimada los cuales son las
varianzas estimadas de cada factor dentro del factor donde está anidado. Los componentes de

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 3


STATGRAPHICS – Rev. 4/25/2007
la varianza son estimados al especificar los cuadrados de medias en la tabla de la ANOVA
igual a sus valores esperados y resolviendo las ecuaciones resultantes.

• Porciento: el porcentaje de la varianza total del proceso representada por cada componente.

En los datos de la muestra las estimaciones de los componentes de la varianza son:

σ$b2 = 7.128 σ$s2 =28.53 σ$t2 = 0.9167.

La estimación de la variabilidad total del proceso es

σˆ 2 = σˆ b2 + σˆ s2 + σˆ t2 = 36.63

Note que la variabilidad entre muestras dentro del mismo conjunto representa sobre el 78% de la
variabilidad total indicando un problema con la homogeneidad dentro de los conjuntos.

Diagrama de Puntos
El cuadro Diagrama de Puntos grafica los datos por niveles de un factor seleccionado.

Gráfica de Componentes de Varianza

43

38

33
moisture

28

23

18

13
1 3 5 7 9 11 13 15
2 4 6 8
batch 10 12 14

La gráfica de arriba muestra líneas horizontales en cada una de las 15 medias de conjuntos. Cada
punto representa la media de una muestra dentro de un conjunto.

Opciones de Cuadro

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 4


STATGRAPHICS – Rev. 4/25/2007

• Factor: el factor a ser graficado en el eje horizontal.

Gráfica de Desviación de Componentes


La Gráfica de Desviación de Componentes muestra la desviación de cada observación de la
media de todas las observaciones al mismo nivel de un factor seleccionado:

Gráfica de Desviación de Componentes para moisture

batch 19.49%

sample 78.01%

test 2.51%
-14 -9 -4 1 6 11 16
desviación de la media

Cada sección de la gráfica contiene un punto que corresponde a cada observación. En cada
sección, una media diferente ha sido substraída del valor de los datos.

Sección Superior (conjunto): muestra la desviación de cada observación de la media


general de todas las observaciones.

Sección del Centro (muestra): muestra la desviación de cada observación de la media del
conjunto del cual fue tomado.

Sección Inferior (prueba): muestra la desviación de cada observación de la media de la


muestra de la cual fue tomada.

El efecto es para mostrar de abajo hacia arriba la contribución adicional de cada componente. La
variabilidad en la sección inferior se explica solamente al proceso de prueba. La variabilidad en
la sección del centro incluye la variabilidad de las pruebas y la variabilidad entre muestras dentro
del mismo conjunto. La variabilidad en la sección superior proviene de los tres componentes.

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 5


STATGRAPHICS – Rev. 4/25/2007

En la gráfica de arriba es claro que una cantidad substancial de variabilidad es introducida en el


nivel de las muestras dentro de los conjuntos.

Resumen Estadístico
La tabla del Resumen Estadístico muestra los tamaños muestrales, medias y desviaciones
estándar en cada nivel de los factores. Una parte de la tabla se muestra abajo:

Resumen estadístico para moisture


Desviación
Nivel Recuento Media Estándar
MEDIA GLOBAL 60 26.7833 5.97762
Batch
1 4 34.75 5.5
2 4 26.25 1.25831
3 4 21.5 8.1035
4 4 27.25 3.77492
5 4 18.25 1.5
6 4 28.75 4.42531
7 4 28.0 5.22813
8 4 31.5 2.88675
9 4 29.0 2.3094
10 4 20.0 6.58281
11 4 25.0 1.63299
12 4 30.25 1.5
13 4 24.5 5.8023
14 4 24.25 0.957427
15 4 32.5 6.45497
Muestra
1 2 39.5 0.707107
2 2 30.0 0.0
3 2 27.0 1.41421
4 2 25.5 0.707107
5 2 28.5 0.707107
6 2 14.5 0.707107
7 2 30.5 0.707107
8 2 24.0 0.0

Gráficas de Residuos
Como con todos los modelos estadísticos es una buena práctica examinar los residuos. Los
residuos son iguales a los valores de los datos observados menos los valores predichos por el
modelo estadístico subyacente.

El procedimiento Componentes de Varianza crea 3 gráficas de residuos:

1. versus nivel de factor.


2. versus valor predicho.
3. versus número de fila.

Nota: En los datos muestrales, los factores han sido especificados para cada nivel de error
experimental así que los residuos son todos igual a 0. Si la prueba es removida como un factor,
entonces su efecto será reflejado en un término del residuo. Las gráficas de abajo reflejan eso
como análisis:
© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 6
STATGRAPHICS – Rev. 4/25/2007

Residuos versus Nivel de Factor


Esta gráfica es útil para visualizar cualquier diferencia en la variabilidad en varios niveles de un
factor.

Gráfico de Residuos para moisture

1.5

0.5
residuo

-0.5

-1

-1.5
1 3 5 7 9 11 13 15
2 4 6 8 10 12 14
batch

El residuo promedio en cada nivel es igual a 0.

Paneles de Opciones

• Factor: factor a ser mostrado en el eje horizontal

Residuos versus Predicho


Esta gráfica es útil para detectar cualquier heteroscedasticidad en los datos.

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 7


STATGRAPHICS – Rev. 4/25/2007

Gráfico de Residuos para moisture

1.5

0.5
residuo

-0.5

-1

-1.5
13 18 23 28 33 38 43
moisture predicho

La heteroscedasticidad ocurre cuando la variabilidad de los datos cambia conforme la media


cambia y podría necesitar la transformación de los datos antes de realizar la ANOVA. La
heteroscedasticidad se evidencia usualmente por un patrón en forma de embudo en la gráfica de
los residuos.

Residuos versus Observación


Esta gráfica muestra los residuos versus el número de fila en la hoja de base de datos:

Gráfico de Residuos para moisture

1.5

0.5
residuo

-0.5

-1

-1.5
0 10 20 30 40 50 60
número de fila

Si los datos se ordenan en orden cronológico cualquier patrón en los datos podría indicar una
influencia externa. No se encuentra evidencia de tal patrón en la gráfica de arriba.

Guardar Resultados
Los siguientes resultados pueden ser guardados en la hoja de base de datos:

1. Componentes de Varianza – los componentes de varianza estimada.


2. Residuos – los n residuos.

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 8


STATGRAPHICS – Rev. 4/25/2007

Cálculos
La estimación de los componentes de la varianza sigue el procedimiento descrito en la
documentación Modelos Lineales Generales.

© 2006 por StatPoint, Inc. Análisis de Componentes de la Varianza - 9