Sunteți pe pagina 1din 31

Anlisis de varianza con un factor. Tabla No.

Variable independiente Categoras

X Muestra total Variacin total = SCy

Variacin de la categora dentro de los grupos = SCE

. . .

. . .

Medias de las categoras

Variacin de las categoras entre grupos = SCA

Anlisis de varianza con un factor.


Se entiende fcilmente la razn de descomponer la variacin total de Y, SCy, en SCA y SCE para examinar las diferencias entre las medias de los grupos. En el anlisis de varianza hay varios grupos (por ejemplo, consumidores constantes, regulares, espordicos y no consumidores). Si la hiptesis nula es verdadera y todos los grupos tienen la misma media en la poblacin, es posible estimar cuanto variarn las medias de las muestras por causa de las simples variaciones de muestreo (aleatorias). Si la variacin observada de las medias es ms de las que cabra esperar de la variacin de muestreo, es razonable concluir que esta variabilidad adicional se relaciona con diferencias en las medias de los grupos de la poblacin.

Anlisis de varianza con un factor.


En el anlisis de varianza se estiman dos medidas de variacin: dentro de los grupos (SCE) y entre grupos (SCA). La primera es una medida de cunto varan las observaciones (los valores Y) dentro de los grupos. Se usa para estimar la varianza de un grupo de la poblacin. Sin embargo, como no se sabe si todos los grupos tienen la misma media, no se puede calcular la varianza de todas las observaciones juntas. Las varianzas de los grupos se calculan por separado y se combinan en una varianza promedio o general. Del mismo modo, otra estimacin de la varianza de los valores de Y se obtiene examinando la variacin entre las medias (este proceso es el inverso de determinar la variacin de las medias, dadas las varianzas de la poblacin).

Anlisis de varianza con un factor.

Si la media de la poblacin es la misma en todos los grupos, la variacin de las medias de la muestra y el tamao de los grupos sirven para estimar la varianza de Y. Qu tan razonable sea esta estimacin depende de que la hiptesis nula sea verdadera. Si la hiptesis nula es verdadera y las medias de la poblacin son iguales, es correcta la estimacin de la varianza basada en la variacin entre grupos. Por otro lado, si los grupos tienen medias diferentes en la poblacin, la estimacin de la varianza basada en esta variacin entre grupos ser demasiado grande. As, al comparar las estimaciones de la varianza de Y basadas en las variaciones entre y dentro de los grupos, comprobamos la hiptesis nula. De esta manera, la descomposicin de la variacin total tambin permite medir los efectos de X y Y.

Anlisis de varianza con un factor.


SCy = SCx + Scerror

SCy =
SCx = SCerror =

)
)

= observacin individual = media de la categora j = media de toda la muestra, o gran media = i-sima observacin de la j sima categora.

Anlisis de varianza con un factor.

Medida de los efectos.


Los efectos de X en Y se miden con SCx. Como SCx se relaciona con la variacin de las medias de las categoras de X, su magnitud relativa aumenta con las medias de Y en las categoras de X. Esta magnitud relativa de SCx tambin crece a medida que disminuyen las variaciones de Y en las categoras de Y. La fuerza de los efectos de X en Y se mide como sigue: = = El valor de vara entre 0 y 1. Se asume un valor de 0 cuando son iguales todas las medias de las categoras, lo que indica que X no tiene efecto en Y. El valor de ser 1 si no hay variabilidad dentro de las categoras de X pero s las hay entre unas y otras. As, es una medida de la variacin de Y que se explica con la variable independiente X. Adems de medir los efectos de X en Y, podemos tambin medir su significacin.

Anlisis de varianza con un factor.


Prueba de significacin En un anlisis de varianza de un factor, lo que interesa es probar la hiptesis nula de que las medias de las categoras son iguales en la poblacin. En otras palabras, : = = = De acuerdo con la hiptesis nula, y vienen del mismo origen de variacin. En este caso, la estimacin de la varianza poblacional de Y se basa en la variacin entre categoras, en la variacin dentro de las categoras, o en ambas. Dicho de otra manera, la estimacin de la varianza de la poblacin de Y, = = cuadrado de las medias debido a X =

Anlisis de varianza con un factor.


o bien = = cuadrado de las medias debido a X = La hiptesis nula puede comprobarse con la estadstica F basada en la razn entre estas dos estimaciones: F= =

Esta estadstica sigue la distribucin F con (c 1) y (N- c) grados de libertad (gl). La distribucin F es una distribucin probabilstica de las razones de las varianzas de la muestra. Se caracteriza por grados de libertad para el numerador y grados de libertad para el denominador.

Anlisis de varianza con un factor.


Si la hiptesis nula de las medias iguales de las categoras no se rechaza, entonces la variable independiente no tiene efecto significativo en la variable dependiente. Por otro lado, si se rechaza la hiptesis nula, el efecto de la variable independiente es significativo. En otras palabras, el valor de la media de la variable dependiente ser distinto con diversas categoras de la variable independiente.

Una comparacin de los valores de las medias de las categoras indicar la naturaleza del efecto de la variable independiente.
Los datos de la Tabla No. 1 fueron generados en un experimento en que una importante tienda departamental quera examinar el efecto del nivel de la promocin en la tienda y los cupones de descuento.

Anlisis de varianza con un factor.


La promocin vari en tres niveles: 1) intensa, 2) regular y 3) escasa. Los cupones se manejaron en dos niveles: se distribuy un cupn de 20 dlares de descuento vlido en toda la tienda a los posibles compradores (denotado por 1 en la Tabla No. 1) o bien no se distribuy (denotado por 2). Se cruzaron la promocin en tienda y la entrega de cupones, de lo que result un diseo 3x2 con seis celdas. Se escogieron al azar 30 tiendas y cinco fueron asignadas en forma aleatoria a cada condicin, como se muestra en la Tabla No. 1. La empresa quiere determinar el efecto de la promocin en tiendas (X) sobre las ventas (Y). Con el objeto de ilustrar los clculos hechos a mano, los datos de la Tabla No. 1 se transformaron en la Tabla No.2 para mostrar la tienda ( ) para cada nivel de promocin. La hiptesis nula es que las medias de las categoras son iguales: : = =

Tabla No. 2 Distribucin de cupones, promocin, ventas y calificacin de la clientela.

No. De tienda

Distribuci n de cupones

Promocin en tienda

Venta

Calificacin de la clientela

No. de tienda

Distribuci n de cupones

Promocin en tienda

Venta

Calificacin de la clientela

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 2 2 2 2 2 3 3 3 3 3

10 9 10 8 9 8 8 7 9 6 5 7 6 4 5

9 10 8 4 6 8 4 10 6 9 8 9 6 10 4

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

1 1 1 1 1 2 2 2 2 2 3 3 3 3 3

8 9 7 7 6 4 5 5 6 4 2 3 2 1 2

10 6 8 4 9 6 8 10 4 9 4 6 10 9 8

Anlisis de varianza con un factor.


Para comprobar la hiptesis nula, las sumas de los cuadrados se calculan como sigue: SCy = - ) = (10 6.067) + (9 6.067) + (10 6.067) + (8 6.067) + (9 6.067) + (8 6.067) + (8 6.867) + (7 6.067) + (9 6.067) + (6 6.067) + (5 6.067) + (7 6.067) + (6 6.067) + (4 6.067) + (5 6.067) + (8 6.067) + (9 6.067) + (7 6.067) + (7 6.067) + (6 6.067) + (4 6.067) + (5 6.067) + (5 6.067) + (6 6.067) + (4 6.067) + (2 6.067) + (3 6.067) + (2 6.067) + (1 6.067) + (2 6.067) = (3.933) + (2.933) + (3.933) + (1.933) + (2.933) + (1.933) + (2.933) + (0.933) + (0.933) + (- 0.067) + (1.933) + (1.933) + (0.933) + (2.933) + (0.067) + (-2.067) + (- 1.067) + (- 1.067) + (- 0.067) + (-2.067) + (- 1.067) + (0.933) + (- 0.067) + (-2.067) + (- 1.067) + (- 4.067) + (- 3.067) + (4.067) + (- 5.067) + (- 4.067) = 185.867

Anlisis de varianza con un factor.


SCx = ) = 10(8.3 6.067) + 10(6-2 6.067) + 10(3.7 6.067) = 10(2.233) + 10(0.133) + 10(-2.367) = 106.067
-

SCerror = = (10 8.3) + (9 8.3) + (10 8.3) + (8 8.3) + (9 8.3) + (8 8.3) + (9 8.3) + (7 8.3) + (7 8.3) + (6 8.3) + (8 6.2) + (8 6.2) + (7 6.2) + (9 6.2) + (6 6.2) + (4 6.2) + (5 6.2) + (5 6.2) +(6 6.2) + (4 6.2) + (5 3.7) + (7 3.7) + (6 3.7)+ (4 3.7) + (5 3.7) + (2 3.7) + (3 3.7) + (2 3.7) + (1 3.7) + (2 3.7)=

=(1.7) + (0.7) + (1.7) + (- 0.3) + (0.7) + (- 0.3) + (0.7) + (-1.3) + (-1.3) +(-2.3) + (1.8) + (1.8) + (0.8) + (2.8)+ (- 0.2)+ (- 2.2) + (- 1.2) + (1.2) + (- 0.2) + (- 2.2) + (1.3)+ (3.3) + (2.3) + (0.3) + (1.3) + (-1.7) + (0.7) + (-1.7) + (-2.7) + (-1.7) = 79-80

Tabla No. 3 Efectos en las ventas de la promocin en tiendas

Tienda No.
Mucha 1 2 3 4 5 6 7 8 9 10 Totales por columnas Medias de las categoras: Gran media: 10 9 10 8 9 8 9 7 7 6 83 83/10 = 8.3

Nivel de promocin interna


Regular 8 8 7 9 6 4 5 5 6 4 62 62/10 = 6.2 Poca 5 7 6 4 5 2 3 2 1 2 37 37/10 = 3.7

= 6.067

Anlisis de varianza con un factor.


Se verifica que: SCy = SCx + SCerror 185.867 = 106.067 + 79.80 La fuerza de los efectos de X en Y se mide como sigue: = = = 0.571 En otras palabras, 57.10% de la variacin en las ventas (Y) se explica por la promocin en tiendas (X), lo que indica un efecto moderado Ahora se puede comprobar la hiptesis nula (Ho): F= F= = = 17.944

Anlisis de varianza con un factor.


En la tabla del apndice de estadsticas vemos que para 2 y 27 grados de libertad, el valor crtico de F es 3.35 para = 0.05. Como el valor calculado de F es mayor que el valor crtico, se rechaza la hiptesis nula. Se concluye que las medias de la poblacin para los tres niveles de promocin en tiendas son distintas. Las magnitudes relativas de las tres categoras indican que un nivel mayor de promocin en tiendas trae ventas significativamente mayores.

Premisas del anlisis de varianza


Las principales premisas del anlisis de varianza se resumen como sigue: 1. De ordinario, se supone que son fijas las caractersticas de la variable independiente. Se hacen inferencias slo con las categoras

Anlisis de varianza con un factor.


especficas que se consideran. Esto se denomina modelo de efectos fijos. Tambin se cuenta con otros modelos. En el modelo de efectos aleatorios las categoras o tratamientos se consideran muestras aleatorias de un universo de tratamientos. Se hacen inferencias de otras categoras no consideradas en el anlisis. Un anlisis de efectos mixtos se presenta si algunos tratamientos se consideran fijos y otros aleatorios. 2. El trmino de error tiene una distribucin normal, con media cero y varianza constante. El error no se relaciona con ninguna de las categoras de X. Desviaciones ligeras de esta premisa no daan gravemente la validez del anlisis. Ms an, los datos pueden transformarse para satisfacer la premisa de la normalidad o de las varianzas iguales.

3. Los trminos de error no se correlacionan. Si los trminos de error se correlacionan (es decir, si las observaciones no son independientes), se distorsiona gravemente la razn F.

Anlisis de varianza con n factores.


En la investigacin de mercados a menudo uno se interesa en el efecto simultneo de dos o ms factores. Por ejemplo: Cmo vara la intencin de comprar una marca con los niveles de precios y los niveles de distribucin? Cmo se relacionan los niveles de publicidad (mucha, regular, poca) con los niveles de precios (altos, medios, bajos) para influir en la venta de una marca?

La escolaridad (menos de preparatoria, preparatorio, universidad trunca, ttulo universitario) y la edad (menos de 35, 35 a 55 y ms de 55) influyen en el consumo de una marca?
Cul es el efecto de la familiaridad con una tienda departamental (mucha, regular, poca) y la imagen de esa tienda (positiva, indiferente y negativa) en la preferencia por ella?

Anlisis de varianza con n factores.


Se puede recurrir a un anlisis de varianza con n factores para determinar estos efectos. Una ventaja importante de esta tcnica es que permite al investigador examinar las acciones recprocas entre los factores. Ocurre interaccin cuando los efectos de un factor o variable dependiente dependen del nivel (categora) de los otros factores. El procedimiento para realizar anlisis de varianza con n factores es semejante al anlisis de un factor. Tambin se definen de manera similar las estadsticas del anlisis factorial. Considrese el caso simple de dos factores, y , con las categoras y . En este caso, la variacin total se divide como sigue: SCtotal = SCpor + SCpor O bien = + SCpor interaccin de + + + y + SCE

Anlisis de varianza con n factores.


Un efecto ms grande de se reflejara en una mayor diferencia de medias en los niveles de y una mayor. Lo mismo ocurrira con el efecto de . Cuanto mayor sea la interaccin de y mayor es . Por otro lado, si y son independientes, el valor de cero. se acercar a

La fuerza del efecto conjunto de los dos factores, llamado efecto general o mltiple, se mide la manera siguiente:

=
La significacin del efecto general se verifica con una prueba F as: F=

Anlisis de varianza con n factores.


= =

donde gln = grados de libertad del numerador = (c1 1) + (c2 1) + (c1 1) (c2 1) = c1c2 1 gld = grados de libertad del denominador = N c1c2 CM = cuadrado de la media

Anlisis de varianza con n factores.


Si el efecto general es significativo, el siguiente paso es examinar la significacin del efecto de interaccin. De acuerdo con la hiptesis nula de falta de interaccin, la prueba F apropiada es: F= =

donde gln = (c1 1)(c2 1) gld = N c1c2 Si resulta que el efecto de interaccin es significativo, entonces el efecto de depende del nivel de y viceversa. Como el efecto de un factor no es uniforme, sino que vara con el efecto del otro factor, por lo general no tiene sentido comprobar la significancia de los efectos principales; sin embargo, s lo tiene verificar la significancia de cada efecto principal en cada factor si el efecto de la interaccin no es significativo.

Anlisis de varianza con n factores.


La significacin del efecto principal de cada factor se comprueba de esta manera para : F= =

donde gln = c1 1 gld = N c1c2


En el anlisis precedente se supone que el diseo es ortogonal o equilibrado (el nmero de casos de cada celda es el mismo). Si el tamao de las celdas vara, el tamao se vuelve ms complejo.

Aplicacin ilustrativa del anlisis de varianza con n factores

Volviendo a los de la Tabla No.1, examinemos ahora el efecto del grado de promocin con cupones en las ventas en tienda. En la Tabla No. 4 se presentan los resultados de efectuar en la computadora un ANOVA de 3x2. Para el principal efecto del nivel de promocin, la suma de cuadrados SCxp, grados de libertad y cuadrado de las medias MCxp son los mismos que se determinaron en la Tabla No. .

Tabla No. 4. ANOVA de un factor: efecto en las ventas de la promocin en tiendas

Fuente de variacin

Suma de cuadrados

GL

Cuadrado de las medias 53.033

Razn F 17.944

Probabilidad F

Entre grupos (promocin en tiendas)

106.067

0.000

Dentro de los grupos (error)

79.800

27

2.956

TOTAL MEDIAS DE LAS CELDAS Nivel de la promocin en tiendas

185.867

29

6.409

Conteo

Media

Mucha (1) Regular (2) Poca (3) Total

10 10 10 30

8.300 6.200 3.700 6.067

Aplicacin ilustrativa del anlisis de varianza con n factores

La suma de los cuadrados de la distribucin de cupones SCxc = 53.333 con 1 grado de libertad, lo que da un valor idntico para el cuadrado de la media CMxc. El efecto principal combinado se determina sumando la suma de los cuadrados de los dos efectos principales (SCxp + SC xc = 106.067 + 53.3333 = 159.400) y los grados de libertad (2 + 1 = 3).

Tabla No. 5 Anlisis de varianza de dos factores

Fuente de variacin efectos principales

Suma de cuadrados

Gl

Cuadrado de la media

Sig. de F

Promocin en tiendas

106.067

53.033

54.862

0.000

0.557

Cupones Combinados Interaccin de dos factores

53.333 159.400 3.267

1 3 2

53.333 53.133 1.633

55.172 54.966 1.690

0.000 0.000 0.206

0.280

Modelo Residuo (error) Total

162.667 23.200 185.867

5 24 29

32.533 0.967 6.409

33.655

0.000

Tabla No. 5 Anlisis de varianza de dos factores


Fuente de variacin efectos principales Suma de cuadrados Gl Cuadrado de la media F Sign. De F

Medias de las celdas

CUPONES

CUENTA

MEDIA

Promocin en tiendas

Alta Alta Regular Regular Baja Baja Medias del nivel de los factores

SI No Si No Si No

5 5 5 5 5 5

9.200 7.400 7.600 4.800 5.400 2.000

Promocin

CUPONES

CUENTA

MEDIA

Alta Regular Baja Si No Gran media

10 10 10 15 15 30

8.300 6.200 3.700 7.400 4,733 6.067

Aplicacin ilustrativa del anlisis de varianza con n factores


Para el efecto de la interaccin de promocin y cupones, la suma de los cuadrados SCxpxc = 3.267 con (3 1)(2 1) = 2 grados de libertad, lo que da por resultado un CMxpxc = 3.267/2 = 1.633. Para el efecto general (del modelo), la suma de cuadrados es la adicin de la suma de los cuadrados del principal efecto de la promocin, el principal efecto de los cupones y el efecto de interaccin = 106.067 + 53.333 + 3.267 = 162.667 con 2 + 1 + 2 = 5 grados de libertad, lo que da un cuadrado de las medias de 162.667/5 = 32.533. Pero advierta que ahora la estadstica del error es diferente que en la Tabla No. . Esto obedece al hecho de que tenemos dos factores en lugar de uno. As, SCerror = 23.2 con (30 3x2) 24 grados de libertad que da un CMerror = 23.2/24 = 0.967.

Aplicacin ilustrativa del anlisis de varianza con n factores


La estadstica de prueba para la significancia del efecto general es: F= = 33.655 con 5 y 24 grados de libertad, lo que es significativo en 0.05. La estadstica de prueba para la significancia del efecto de interaccin es F= = 1690 con 2 y 24 grados de libertad, lo que no es significativo en 0.05. Como el efecto de interaccin no es significativo, cabe evaluar la significancia de los efectos principales. La estadstica de prueba de la significacin del efecto principal de la promocin es: F= = 54.862 con 2 y 24 grados de libertad, lo que es significativo en 0.05. La estadstica de la prueba para la significacin del efecto principal de la promocin es:

Aplicacin ilustrativa del anlisis de varianza con n factores

La estadstica de la prueba para la significacin del efecto principal de la promocin es:

F=

= 55.172 con 1 y 24 grados de libertad, lo que es significativo en 0.05. As, ms promocin trae por resultado ms ventas.

La distribucin de cupones para toda la tienda incrementa las ventas. El efecto de cada caso es independiente del otro.

S-ar putea să vă placă și