Sunteți pe pagina 1din 7

Anlisis de datos. Dpto. Metodologa. U.

Pontificia Comillas, 2 de Psicologa

1. LA VARIANZA
CUANTIFICA todo lo que hay de diferente entre los sujetos o las puntuaciones, la variabilidad, dispersin o diferencias individuales. Una varianza GRANDE indica que hay muchas variaciones entre los sujetos, que hay mayores diferencias individuales con respecto a la media. Una varianza PEQUEA nos indica poca variabilidad, diferencias menores entre los sujetos. La varianza tiene una propiedad importante: PODEMOS DESCOMPONERLA

La varianza se puede descomponer en varianzas parciales: A este proceso le llamamos ANLISIS DE VARIANZA y nos permite aislar las fuentes de variacin.

2. QU COMPROBAMOS MEDIANTE EL ANLISIS DE VARIANZA


Con la t de Student comprobamos si existen diferencias estadsticamente significativas entre las medias de dos muestras o grupos de sujetos. Con el ANLISIS DE VARIANZA comprobamos si existen diferencias estadsticamente significativas entre ms de dos grupos (cuando tenemos dos grupos tambin podemos usar ANOVA, pero es ms cmodo utilizar la t de Student). Qu comprobamos? De cada sujeto tenemos dos tipos de informacin: En qu grupo est clasificado, es decir, en qu nivel de la V.I. se encuentra clasificado. Un valor en una variable en la que hemos medido. Esta variable es la V.D.

Lo que nos dice el ANOVA, es si la V.I. tiene que ver o est asociada con la V.D. que hemos medido. Es decir, pone en relacin los dos tipos de informacin que tenemos de cada sujeto. LO QUE DIRECTAMENTE COMPROBAMOS es si entre dos o ms varianzas existen diferencias estadsticamente significativas. LO QUE REALMENTE DESEAMOS COMPROBAR es si hay diferencias entre una serie de medias.

Anlisis de datos. Dpto. Metodologa. U. Pontificia Comillas, 2 de Psicologa

Veamos estos conceptos con dos ejemplos extremos: Caso 1. Imaginemos dos grupos o muestras, con cinco sujetos cada una. Distinta media, misma varianza: A = (1, 2, 3, 4, 5). Ma= 3; S2a = 2. B = (6, 7, 8, 9, 10). Mb = 8; S2b = 2. Unimos ambos grupos, considerando a todos los sujetos como pertenecientes a un nico grupo. C = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10). Mtotal = 5,5. S2c = 8.25 Observamos que existen diferencias entre los sujetos dentro de este gran grupo. ES LA VARIANZA DE ESTE GRAN GRUPO TOTAL LA QUE VAMOS A ANALIZAR O DESCOMPONER

Si observamos las diferencias entre los sujetos de este gran grupo total podemos preguntarnos: De dnde vienen las diferencias en este grupo total formado por las muestras a y b? De que los grupos son distintos, con distinta media? O de que los sujetos dentro de cada grupo son distintos? Veamos que podemos calcular dos varianzas en este gran grupo: Una que expresa la diversidad dentro de los grupos. Entre los sujetos dentro de cada grupo. S2a = S2b = 2. Otra que expresa la diversidad entre la media de los grupos. La diferencia entre los grupos. Sab2 = 6.25

En este caso, los sujetos dentro de cada grupo tienen un grado semejante de homogeneidad o variabilidad. Dentro de cada grupo las diferencias entre los sujetos (las varianzas) son iguales. Lo que sucede es que las medias son distintas. Las medias de los grupos difieren entre s ms que los sujetos entre s dentro de los grupos. Sab2 = 6.25 S2a = S2b = 2. Las medias de cada grupo se apartan ms de la media total que los sujetos de su propia media. CONCLUSIN: Si las medias entre s difieren ms que los sujetos entre s, podemos concluir QUE LAS MEDIAS SON DISTINTAS. Las muestras proceden de poblaciones distintas.
2

Anlisis de datos. Dpto. Metodologa. U. Pontificia Comillas, 2 de Psicologa

Caso 2 Ahora imaginemos que tenemos dos grupos o muestras, de cinco sujetos cada una. A = (1, 2, 3, 4, 5). Ma= 3; S2a = 2. B = (1, 2, 3, 4, 5). Ma= 3; S2a = 2. Los grupos tienen la misma media, no difieren en cuanto a grupos, pero entre los sujetos, dentro de cada grupo, hay diversidad. Las unimos para formar un nico grupo que llamaremos C, el resultado es un grupo total con la misma media y varianza. C = (1, 2, 3, 4, 5, 1, 2, 3, 4, 5). Mtotal = 3. S2c = 2. Nuevamente podemos preguntarnos: DE DNDE VIENEN LAS DIFERENCIAS? ES UNA DIFERENCIA DEBIDA A LA DIVERSIDAD ENTRE LOS GRUPOS O DENTRO DE LOS GRUPOS? En este caso las diferencias no vienen de diferencias entre los grupos, que tienen idntica media (Ma = Mb = 3), sino de que los sujetos dentro de cada grupo son distintos. (S2a = 2, S2b = 2), (S2ba = 0 < S2a = 2 y S2b = 2). La media de los grupos se aparta menos de la media total que los sujetos de su propia media. Ejemplo de los enanos Imaginemos dos grupos, uno de enanos y otro de gigantes. a. Cada grupo tiene su media en altura. La media de los gigantes es mayor que la de los enanos. b. Dentro de cada grupo hay tambin diferencias; no todos los enanos son igualmente bajitos ni todos los gigantes igualmente altos. Pero, cul sera nuestra conclusin si comprobamos que la diferencia entre las medias es ms o menos igual a las diferencias entre los sujetos dentro de los grupos? Pues que no tenemos enanos ni gigantes, por lo que respecta a la altura, podemos considerar que todos pertenecen al mismo grupo, es decir, a la misma poblacin.

3.

LA VARIANZA TOTAL LA VAMOS A DESCOMPONER EN DOS VARIANZAS:


La varianza que indica la variabilidad ENTRE LOS GRUPOS (entre la media de dos grupos).

Anlisis de datos. Dpto. Metodologa. U. Pontificia Comillas, 2 de Psicologa

La varianza que indica la variabilidad DENTRO DE LOS GRUPOS (diferencias entre los sujetos dentro de cada grupo). Estas son las diferencias que consideraremos normales, es decir, la diversidad normal o aleatoria.

CUANDO: La diversidad ENTRE las medias Diversidad DENTRO de los grupos (entre los sujetos dentro de los grupos)

ENTONCES: Entre las medias hay diferencias superiores a lo que podemos encontrar por azar. Las medias son diferentes. Las muestras proceden de poblaciones con distinta media. Esta lgica es el punto de partida del anlisis de varianza, el cual NOS PERMITE COMPARAR LAS MEDIAS DE VARIOS GRUPOS A PARTIR DEL ESTUDIO DE LAS VARIANZAS DE ESOS GRUPOS.

4. QU COMPROBAMOS MEDIANTE EL ANLISIS DE VARIANZA? LA RAZN F


H0 Afirma que todas las muestras proceden de la misma poblacin. No existen diferencias estadsticamente significativas entre las medias de la VD en funcin de la VI; sus diferencias se explican adecuadamente por el error muestral. H1: Lo contrario. Existen diferencias estadsticamente significativas, al menos entre dos medias de la VD en funcin de la VI; sus diferencias se explican por el efecto de mi VI. Para contrastar esta hiptesis necesito: 1. A partir de las puntuaciones individuales con respecto as u media respectiva dentro de cada grupo. Es lo que se llama VARIANZA DENTRO DE LOS GRUPOS; indica lo que difieren los sujetos entre s dentro de cada grupo. 2. A partir de las medias de los grupos, de su variabilidad respecto de la media total. Es lo que se denomina VARIANZA ENTRE LOS GRUPOS. Indica lo que difieren los grupos unos de otros. Estas dos varianzas o medias cuadrticas las obtenemos dividiendo en cada caso las sumas de cuadrados entre los grados de libertad correspondientes. La cuestin se centra en encontrar un mtodo que nos permita comparar estas dos varianzas con el objetivo de determinar cuando la diferencia entre MCE y MCI es lo bastante grande como para pensar que no puede ser atribuida al azar propio del muestreo.
4

Anlisis de datos. Dpto. Metodologa. U. Pontificia Comillas, 2 de Psicologa

Esto es justamente lo que nos permite establecer los distintos modelos de ANOVA a travs de la razn F. En la razn F lo que hacemos es comparar estas dos fuentes de variacin o varianzas dividiendo la una entre la otra. En el ANLISIS DE VARIANZA al calcular la razn F colocamos en el denominador la varianza considerada normal o aleatoria, aunque no sea la ms pequea, y esta varianza aleatoria es la varianza dentro de los grupos (tambin llamada varianza del trmino o error residual). La varianza que colocamos en el numerador es la que nos interesa comparar con la que consideramos normal o aleatoria. En nuestro caso es la varianza entre los grupos.

Nuestro inters est en COMPROBAR SI LA VARIANZA DEL NUMERADOR DIFIERE SIGNIFICATIVAMENTE DE LA VARIANZA DEL DENOMINADOR, que es el trmino de comparacin.

5. POSIBLES VALORES DE F
a. Si la varianza del denominador es mayor que la del numerador: El cociente ser inferior a 1. La diferencia entre las dos varianzas no ser estadsticamente significativa, por lo tanto aceptamos la hiptesis nula. b.Si las dos varianzas son iguales. La razn F ser igual a 1. Tambin aceptamos la hiptesis nula. c.En la medida en que la varianza del numerador sea mayor que la del denominador, el cociente ir aumentando, ir siendo mayor que 1. IMPORTANTE! Si mi F se mayor que 1, no puedo decir sin ms que es estadsticamente significativa, lo nico que s es que la variabilidad ENTRE es mayor que la DENTRO o error, pero no si es significativa. El siguiente paso que tendremos que dar ser consultar las tablas de Snedecor. Los valores de la tabla indican: A partir de qu valor podemos considerar que el cociente entre dos varianzas es lo bastante grande como para pensar que no puede ser atribuido al azar.

Anlisis de datos. Dpto. Metodologa. U. Pontificia Comillas, 2 de Psicologa

6. SI LA RAZN F ES SIGNIFICATIVA:
1. Hay una relacin superior a lo aleatorio (o normal) entre la variable que corresponde al numerador de la razn F y la variable en la que hemos medido a los sujetos. 2. Podemos concluir que los sujetos son distintos en la variable dependiente porque tambin son distintos en la variable independiente que nos ha servido para clasificarlos. NO ESTAMOS IMPLICANDO UNA RELACIN CAUSAL 3.Las diferencias entre la variable medida estn asociadas de hecho a pertenecer a un grupo u otro.

7. UNA

RAZN F SIGNIFICATIVA NO NOS DICE:

1.Entre qu grupos se da esa diferencia (para eso estn los constrastes posteriores). 2. Cul es la magnitud de la diferencia (relevancia prctica de los resultados). Es decir, que si tenemos una F estadsticamente significativa slo sabemos que existen diferencias entre los distintos niveles de la V.I., pero tendr que hacer los anlisis complementarios: Contrastes posteriores. Tamao del efecto.

8.POR QU UTILIZAMOS EL ANLISIS DE VARIANZA EN VEZ DE LA T DE STUDENT?


Cuando tenemos dos muestras y queremos constrastar si existen diferencias estadsticamente significativas entre sus medias usamos t de Student. Cuando tenemos ms de dos grupos usamos el ANLISIS DE VARIANZA. NO PODRAMOS USAR LA T PARA COMPARAR TODOS LOS GRUPOS DE DOS EN DOS? Esto parecera lo ms lgico, pero existen varias razones por las que no se hace as: 1. La razn ms importante y suficiente para no usar la t es uqe, al hacer muchas comparaciones de dos en dos aumenta la probabilidad de uqe alguna diferencia resulte significativa por azar y afirmemos que hay diferencias cuando realmente
6

Anlisis de datos. Dpto. Metodologa. U. Pontificia Comillas, 2 de Psicologa

no las hay. Es decir aumenta la probabilidad de cometer error tipo I, de que rechacemos una hiptesis nula que es verdadera. 2. Una prueba estadstica basada en todos los datos utilizados simultneamente, es ms estable que una prueba o anlisis que parcializa los datos. 3. Ahorro de tiempo.

9.OBSERVACIONES

SOBRE LOS REQUISITOS PREVIOS PARA UTILIZAR EL ANOVA (SUPUESTOS)


Los modelos tericos se asientan en cuatro suposiciones (supuestos): 1. Unidad de intervalo. 2. Observaciones independientes. 3. Homocedasiticidad. Las varianzas de las distintas poblaciones representadas en las muestras no difieren significativamente entre s, es decir, son significativamente iguales. 4. La variable dependiente sigue la distribucin normal (normalidad).