Sunteți pe pagina 1din 60

Estadstica I I

Monica Gerber
Facultad de Sociologa - Universidad de Chile
I nferencia estadstica de la asociacin entre variables
Tablas de contingencia, 14 de mayo 2013
a. Asociacin entre variables
b. Tablas de contingencia y Prueba Chi cuadrado
c. Prueba T para diferencia de medias entre dos grupos
d. ANOVA T para diferencia de medias entre dos o ms grupos
e. Prueba Z para diferencia de proporciones entre dos grupos

Mdulo 4. I nferencia estadstica de la asociacin entre
variables
Asociacin entre variables
mbito de la estadstica bivariada

Existe una asociacin entre dos variables si conocer el valor de una de ellas
nos ayuda a predecir el valor de la otra

Otras formas de referirse a la asociacin entre variables es que dos variables
estn relacionadas o que existe dependencia entre ellas

Esta definicin de asociacin es estadstica o probabilstica, dado que asume
que existe variacin en torno a los valores de las variables y que no es
posible predecir con exactitud





Asociacin entre variables
En algunos casos no se establece ninguna direccionalidad en la asociacin
entre variables

En otros casos, se asume que una de las variables antecede a la otra

Es decir, se hipotetiza una relacin de dependencia, donde una variable es la
causa o variable independendiente y la otra es el efecto o variable
dependiente

Ejemplos:
Existe una asociacin entre el nivel de ingresos de una persona y su nivel
educacional alcanzado?
Existen diferencias significativas en las intenciones de voto en las
elecciones municipales (variable dependiente) segn la posicin poltica de
las personas (variable independiente)?


Asociacin entre variables
I mportante: asociacin entre variables no necesariamente significa que la
relacin es causal

1. Necesidad de considerar relaciones espurias: pueden existir terceras
variables que explican la asociacin encontrada











Nmero de
cigeas
Nmero de
guaguas nacidas
Ruralidad
Asociacin parcial
Asociacin entre variables
I mportante: asociacin entre variables no necesariamente significa que la
relacin es causal

2. Necesidad de considerar direccionalidad: puede ser que la variable que
asumimos era la variable dependiente en realidad sea la variable independiente











Nmero de
cigeas
Nmero de
guaguas nacidas
Ruralidad
Asociacin entre variables
Anlisis Tipo de Anlisis Tipos de variables Ejemplo de Pregunta
Tablas de
contingencia
Asociacin entre dos o
ms variables
nominales/ordinales
2 variables nominales/
ordinales
Existe una asociacin entre el
sexo de una persona y el tipo
deporte que esta practica?
Prueba T
Comparacin de medias
entre dos grupos
1 variable nominal de dos
categoras y 1 variable de
intervalo/razn
Existen diferencias en las
medias de ingreso entre
hombres y mujeres?
ANOVA
Comparacin de medias
entre dos o ms grupos
1 variable nominal/ordinal
de 2 o ms categoras y 1
variable de intervalo/razn
Existen diferencias en las
medias de puntajes en la PSU
entre estudiantes de colegios
privados, subvencionados y
pblicos?
Prueba Z
Comparacin de
proporciones entre dos
grupos
2 variables nominales de
dos categoras de
respuesta
Existen diferencias
significativas en la proporcin
de personas que se sanan de
la polio segn si recibieron una
vacuna o no?
Tablas de contingencia
Tablas de contingencia son utilizadas para describir la asociacin entre dos o
ms variables categricas (nominales/ ordinales)

Es posible utilizar variables de intervalo/ razn recodificadas en grupos

Estas variables pueden tener dos o ms categoras de respuesta

Las tablas de contingencia son simtricas en el sentido de que no distinguen
entre variable independiente y dependiente.

En algunos casos resulta pertinente distinguir entre variables independientes
y dependientes. Cuando esta distincin es relevante, se enfatizar en la
manera de presentar los resultados.




Tablas de contingencia
Ejemplos:
Existe una asociacin entre la ocupacin de las personas y sus
afiliaciones a distintos sistemas de salud?
2 variables nominales: ocupacin (estudia/ trabaja/ jubilado) y sistema
de salud (fonasa/ isapre/ ninguno)

Existe una asociacin entre el signo zodiacal de las personas y sus tipo
de personalidad?
2 variables nominales: signo zodiacal (ej. cncer/ libra) y tipo de
personalidad (ej. obsesivo/ dependiente)







Actividad 1
Plantea 3 preguntas de investigacin que pueden ser contestadas por medio
del anlisis de tablas de contingencia
Define las variables y sus niveles de medicin







Tablas de contingencia
Encuesta CEP 65 (2011), n=1559

Existe una asociacin entre la posicin poltica de las personas y sus
opiniones acerca del lucro en la educacin?

Consideramos una tabla de contingencia dado que queremos observar la
asociacin entre 2 variables nominales:
Posicin poltica
Derecha
Centro
I zquierda
I ndependiente/ ninguna

Opinin sobre el lucro
Modificar la ley y permitir el lucro
Hacer cumplir la ley para que no haya U. con fines de lucro
Dejar las cosas como estn




Tablas de contingencia
Tablas de frecuencia unidimensionales






222 personas se
autodefinen de derecha,
valor que corresponde
al 14.6% de las
respuestas vlidas
185 personas se
autodefinen de centro,
valor que corresponde
al 12.2% de las
respuestas vlidas
Un 10.6% de los
encuestados que dieron
una respuesta vlida
opina que la ley debiera
ser modificada y el
lucro permitido
Un 81.8% de las
opiniones vlidas
afirman que la ley no
debe permitir el lucro
en las Universidades

Tablas de contingencia
Existe una asociacin entre la posicin poltica de las personas y sus
opiniones sobre el lucro en la educacin?
Una tabla de contingencia bidimensional (2 variables) presenta una
variable y sus categoras en las filas y la otra variable y sus categoras en
las columnas
Las celdas de la tabla de contingencia presentan la frecuencia de casos
que tienen una determinada combinacin de categoras de las variables
fila y columna (frecuencia conjunta)
Por ejemplo, 28 personas de derecha y 13 personas de centro opinan
que la ley debe modificarse para permitir el lucro







Tablas de contingencia
La fila y columna titulada Total corresponden a los mrgenes de la
tabla. Estos presentan las frecuencias de las categoras de fila y columna
por separado, sumando las frecuencias de a travs de las categoras
Por ejemplo, 151 personas estn a favor de modificar la ley (28 de
derecha + 13 de centro + 28 de izquierda + 82 independientes)
El valor que aparece en la esquina inferior derecha corresponde al total
de casos (n). En este ejemplo, los datos corresponden a 1401
encuestados







Tablas de contingencia
Frecuentemente es ms til presentar porcentajes en vez de frecuencias
Por ejemplo, es posible obtener el porcentaje con respecto al total de
casos
En este ejemplo, las 28 personas de derecha que opinan que hay que
modificar la ley corresponden al 2% de la muestra (28/ 1401 * 100)







Tablas de contingencia
Otra forma de presentar los resultados es obteniendo porcentajes dentro
de las columnas o filas. Esto permite realizar comparaciones a travs de
categoras
Distribuciones condicionales: distribucin de las respuestas de una
variable manteniendo constante la otra variable en una categora
Por ejemplo, observar la distribucin de respuestas acerca del lucro en
las universidades solamente para aquellas personas que son de derecha






Tablas de contingencia
Esta forma de presentar los resultados es particularmente til si una de
las variables es considerada variable independiente y la otra variable
dependiente
En esos casos, conviene posicionar la variable independiente en las
columnas y obtener el porcentaje dentro de cada columna







Tablas de contingencia
Por ejemplo, en este caso obtuvimos porcentajes dentro de las
columnas. Vemos que el 13.6% de las personas de derecha quieren
permitir el lucro (28/206*100), mientras que solamente 7.9% de las
personas de centro y 8.6% de las personas de izquierda estn a favor del
lucro







Tablas de contingencia
Existe una asociacin entre las variables si la distribucin condicional de
una variable Y segn una variable X es distinta para distintos niveles de
la variable X
Existe una asociacin entre las variables si la distribucin de frecuencias
en las categoras de la variable dependiente (lucro) es distinta para
distintas categoras de la variable independiente (posicin poltica)
Otra forma de describir una asociacin es que conocer la respuesta de
una persona a la variable independiente (posicin poltica) me ayuda a
predecir su respuesta a la variable dependiente (lucro)







Tablas de contingencia
I nterpretacin: Un mayor porcentaje de personas de derecha (13.6%) opinan
que la ley debiera permitir el lucro, comparado con personas de centro (7.9%)
y de izquierda (8.6%). Un mayor porcentaje de personas de izquierda (87.7%)
y de centro (84.1) estn a favor de evitar el lucro en la educacin, comparado
con un menor porcentaje de personas de derecha (70.9%)
Tablas de contingencia e inferencia
Observamos diferencias entre las categoras y asumimos que existe una
asociacin en la muestra

Pero, podemos inferir que existe una asociacin entre ambas variables en
la poblacin?

Buscaremos contestar las siguientes preguntas:

Si en la poblacin no hubiera una asociacin entre actitud hacia el lucro y
posicin poltica, qu tan probable sera obtener una tabla de
contingencia como la que obtuvimos en nuestra muestra?

Es decir, se deben las diferencias entre personas de distinta tendencia
poltica a diferencias reales en la poblacin o a un error de muestreo?

Son las diferencias significativas?



Tablas de contingencia e inferencia
Si en la poblacin no hubiera una asociacin entre actitud hacia el lucro y
posicin poltica, qu tan probable sera obtener una tabla de
contingencia como la que obtuvimos en nuestra muestra?

Hiptesis nula:
En la poblacin no existe una asociacin entre actitud hacia el lucro y
posicin poltica

Hiptesis alternativa:
En la poblacin s existe una asociacin entre actitud hacia el lucro y
posicin poltica

Utilizaremos una prueba de hiptesis para evaluar la probabilidad de
encontrar una tabla de contingencia como la que encontramos si en la
poblacin realmente no existiera una asociacin entre las variables

Prueba Chi Cuadrado


Prueba Chi Cuadrado
Cmo se veran los datos si la hiptesis nula fuera cierta?











En este ejemplo, las distribuciones condicionales son iguales para personas
de distintas posiciones polticas
Las probabilidades de estar en contra del lucro son iguales sin importar si
una persona es de derecha o de izquierda


Prueba Chi Cuadrado
Comparamos los porcentajes que esperamos encontrar si no existe
asociacin:







Con los porcentajes que realmente observamos en la muestra:








Prueba Chi Cuadrado
La prueba chi cuadrado parte de la distincin entre las frecuencias
observadas y las frecuencias esperadas

Las frecuencias observadas (f
o
) son las frecuencias conjuntas observadas
en la muestra

Las frecuencias esperadas (f
e
) son las frecuencias conjuntas que se
observaran si no existiera asociacin entre las variables (si estas fueran
independientes)





Prueba Chi Cuadrado

c
=
totol columno totol ilo
totol mucstro


c Jcrcco lucro =
2 151
141
=22.2


Actividad

c
=
totol columno totol ilo
totol mucstro


Calcula la frecuencia esperada para las siguientes celdas:
Centro/ Dejar las cosas como estn
I zquierda/ Dejar las cosas como estn

Observas diferencias entre las frecuencias esperadas y observadas? Qu te
dicen estas diferencias?

Prueba Chi Cuadrado

Si no existiera asociacin entre posicin poltica y opinin sobre el lucro
esperaramos que 22.2 personas de derecha estuvieran a favor de permitir el
lucro
Sin embargo observamos que 28 personas de derecha estn a favor de
permitir el lucro
Son estos valores significativamente diferentes?

c

Prueba Chi Cuadrado

Las diferencias entre las frecuencias observadas y esperadas muestran el nivel
de acuerdo entre los datos y la hiptesis nula de no asociacin:
Diferencias pequeas entre frecuencias observadas y frecuencias
esperadas: datos son consistentes con la hiptesis nula de no asociacin
Diferencias grandes entre frecuencias observadas y frecuencias
esperadas: datos son inconsistentes con la hiptesis nula de no asociacin
Queremos resumir de alguna forma las desviaciones entre las frecuencias
observadas y esperadas de toda la tabla

c

Prueba Chi Cuadrado

2
=
o c
2
c

Las diferencias entre fo y fe describen la cercana entre lo observado y la
hiptesis de independencia entre variables
El estadstico chi cuadrado se calcula de la siguiente forma:

c

Prueba Chi Cuadrado

2
=
o c
2
c

Celda (actitud, pos. poltica) f
o
f
e
f
o
f
e
(f
o
f
e
)
2
(f
o
f
e
)
2
/ f
e

Derecha, permitir lucro
28 22,20 5,80 33,61 1,51
Derecha, prohibir lucro
146 168,36 -22,36 499,89 2,97
Derecha, dejar todo igual
32 15,44 16,56 274,27 17,76
Centro, permitir lucro
13 17,68 -4,68 21,86 1,24
Centro, prohibir lucro
138 134,03 3,97 15,74 0,12
Centro, dejar todo igual
13 12,29 0,71 0,50 0,04
Izquierda, permitir lucro
28 34,92 -6,92 47,90 1,37
Izquierda, prohibir lucro
284 264,80 19,20 368,77 1,39
Izquierda, dejar todo igual
12 24,28 -12,28 150,86 6,21
Independiente, permitir lucro
82 76,20 5,80 33,63 0,44
Independiente, prohibir lucro
577 577,81 -0,81 0,66 0,00
Independiente, dejar todo igual
48 52,99 -4,99 24,87 0,47
Total:
1401 1401,00 0,00 1472,57

2
=33,53
Prueba Chi Cuadrado
El valor de Chi cuadrado de Pearson calculado por SPSS es igual al
calculado en la tabla anterior
A mayor valor de
2
...
Mayor ser la diferencia entre las frecuencias observadas y las
frecuencias esperadas
Mayor ser la evidencia en contra de la hiptesis nula
Mayor ser la evidencia de la existencia de asociacin entre las
variables en la poblacin
Prueba Chi Cuadrado
En nuestro ejemplo encontramos un valor
2
de 33,53
Es este valor suficientemente grande para rechazar la hiptesis nula?
Si obtuvieramos una y otra muestra de la poblacin, obtendramos
siempre un valor
2
de 33,53?
Cul es la probabilidad de obtener un valor
2
de 33,53 si en la poblacin
no existiera realmente una asociacin?
Si este valor es bajo, concluimos que existe evidencia en contra de la
hiptesis nula de no asociacin


Distribucin muestral de
2

EstoJisticos Jc prucbo Jc
2

Esta es la distribucin muestral
de un estdistico
2
calculado
para 1000 mustras de n=2344
tomadas de una poblacin
donde no hay asociacin entre
las variables
Estos son los estadsticos
2

que obtendramos si sacramos
una y otra y otra muestra y
calculramos el estadstico para
cada una de ellas
El valor de
2
habra sido
diferente si la muestra hubiera
sido distinta
Sin embargo, no todos los
valores
2
son igualmente
probables

Prueba Chi Cuadrado

2
=33,53
EstoJisticos Jc prucbo Jc
2

Esta es la distribucin
muestral del estadstico
2

para un nmero infinito de
muestras de una poblacin
donde no hay asociacin entre
las variables
El valor
2
que obtuvimos es
muy poco probable si en la
poblacin no existieran
realmente diferencias entre
las frecuencias observadas y
esperadas

Prueba Chi Cuadrado
EstoJisticos Jc prucbo Jc
2

Para determinar qu tan probable es obtener el
estadstico
2
que obtuvimos en nuestra muestra,
buscamos la probabilidad asociada al rea bajo la curva
Al igual que la distribucin t, la distribucin de Chi
Cuadrado cambia dependiendo de los grados de libertad
Es ms fcil obtener un
2
alto en tablas con ms grados
de libertad (tablas con ms celdas)
Prueba Chi Cuadrado
Grados de libertad: nmero de celdas en una tabla de contingencia que
tienen libertad para variar dadas las frecuencias marginales
Para tablas de contingencia, grados de libertad: (C-1) * (F-1), donde
C=nmero de categoras columna y F=nmero de categoras fila
En nuestro ejemplo, gl=(3-1)*(4-1)=6
Es decir, cuando ya hemos calculado las frecuencias para 6 celdas, las dems
quedan determinadas por los marginales de la tabla
28
146
13
138
28
284
32 13 12
82
577
48
Tabla de distribucin Chi Cuadrado



Grados de
Libertad

AREAS DE EXTREMOS SUPERIOR ()
0.25 0.10 0.05 0.025 0.01 0.005
1 1.323 2.706 3.841 5.024 6.635 7.879
2 2.773 4.605 5.991 7.378 9.210 10.597
3 4.108 6.251 7.815 9.348 11.345 12.838
4 5.385 7.779 9.488 11.143 13.277 14.860
5 6.626 9.236 11.071 12.833 15.086 16.750
6 7.841 10.645 12.592 14.449 16.812 18.548
7 9.037 12.017 14.067 16.013 18.475 20.278
8 10.219 13.362 15507 17.535 20.090 21.955
9 11.389 14.684 16.919 19.023 21.666 23.589
10 12.549 15.987 18.307 20.483 23.209 25.188
11 13.701 17.275 19.675 21.920 24.725 26.757
12 14.845 18.549 21.026 23.337 26.217 28.299
13 15.984 19.812 22.362 24.736 27.688 29.819
14 17.117 21.064 23.685 26.119 29.141 31.319
15 18.245 22.307 24.996 27.488 30.578 32.801
16 19.369 23.542 26.296 28.845 32.000 34.267
17 20.489 24.769 27.587 30.191 33.409 35.718
18 21.605 25.989 28.869 31.526 34.805 37.156
19 22.718 27.204 30.144 32.852 36.191 38.582
20 23.828 28.412 31.410 34.170 37.566 39.997
21 24.935 29.615 32.671 35.479 38.832 41.401
22 26.039 30.813 33.924 36.781 40.289 42.796
23 27.141 32.007 35.172 38.076 41.638 44.181
24 28.241 33.196 36.415 39.364 42.980 45.559
25 29.339 34.382 37.652 40.646 44.314 46928
26 30.435 35.563 38.885 41.923 45.642 48.290
27 31.528 36.741 40.113 43.194 46.963 49.645
28 32.620 37.916 41.337 44.461 48.278 50.993
29 33.711 39.087 42.557 45.722 49.588 52.336
30 34.800 40.256 43.773 46.979 50.892 53.672

Buscamos el valor crtico
en la tabla de Chi
Cuadrado segn los GL

En nuestro ejemplo
tenemos
gl=(3-1)*(4-1)=6.

El valor crtico para una
prueba chi cuadrado con
6 grados de libertad a un
95% de confianza es de
12,59

Dado que nuestro valor
2

es mayor a 12,59,
rechazamos la hiptesis
nula de no asociacin a
un 95% de confianza
Prueba Chi Cuadrado
SPSS entrega la probabilidad exacta
El valor p de significacin (aqu Sig. asinttica) es la probabilidad, si la hiptesis
nula fuera verdadera en la poblacin, de obtener un valor de la prueba chi
cuadrado que provea igual o mayor evidencia en contra de la hiptesis nula
En palabras sencillas, valores bajos de p proveen evidencia en contra de la
independencia de las variables, es decir, evidencia de asociacin
Convencionalmente, valores de p menores a 0,05 son interpretados como
evidencia de una asociacin significativa
Prueba Chi Cuadrado

2
=33,53
p<0,001
EstoJisticos Jc prucbo Jc
2

Dado que p<0,001, existe una
probabilidad menor al 0,1% de
obtener un estadstico de
prueba igual o mayor a 33,53
de una poblacin en la cul no
existe asociacin entre las
variables
Decisin de rechazo:
Rechazamos la hiptesis nula
si p es menor al nivel de
significacin especificado
Fallamos en rechazar la
hiptesis nula si p es mayor
al nivel de significacin
especificado

Prueba Chi Cuadrado
I nterpretacin: La asociacin entre la posicin poltica y las opiniones sobre
el lucro en la educacin es significativa a un 95% de confianza (p<0,05).

Ojo: p no es nunca igual a 0, por lo que es necesario describirlo como siendo
menor a un nivel convencional (SPSS lo redondea a 0).

Ojo2: I nterpretacin debe hacerse tambin de manera sustancial haciendo
referencia a las variables.
Prueba Chi Cuadrado
Cmo reportamos los resultados?

En nuestro ejemplo, p<0,001
Qu pasa si obtenemos un p=0,10? Sera esto evidencia en contra de la
hiptesis nula?
Una perspectiva: reportar el valor p tal cual y dejar que el lector decida si
existe evidencia en contra de la hiptesis nula
Una segunda perspectiva: decidir un punto de corte de manera anticipada:
nivel de significacin a y tomar la decisin de rechazar H
0
si p < o fallar
en rechazar H
0
si p >
Niveles de significacin convencionales: 0,10; 0,05; 0,01 (o 10%, 5%, 1%)



Prueba Chi Cuadrado
Es importante considerar..
En ciencias sociales frecuentemente se ocupa el 5% de significacin de
manera arbitraria
De esta manera, un p=0,06 significa que no existe asociacin y un p=0,04
significa que s existe asociacin
Pero son realmente tan diferentes?
Por lo tanto, es importante siempre reportar el valor p exacto
A su vez, es importante considerar que el valor p es sensible al tamao de
la muestra: manteniendo todo constante, es ms fcil obtener valores bajos
de p en muestras de tamao grande
I mportancia de reportar resultados de no asociacin: igualmente
interesantes

Prueba Chi Cuadrado
Cul es la naturaleza de la asociacin?
No solamente es interesante dar cuenta de si existen diferencias
significativas
Tambin es importante describir las tendencias
Para esto utilizamos los datos de la muestra e ilustramos la asociacin con
algunos porcentajes ilustrativos. Por ejemplo:
Un mayor porcentaje de personas de derecha (13.6%) opinan que la ley
debiera permitir el lucro, comparado con personas de centro (7.9%) y de
izquierda (8.6%).
Un mayor porcentaje de personas de izquierda (87.7%) y de centro
(84.1) estn a favor de evitar el lucro en la educacin, comparado con
un menor porcentaje de personas de derecha (70.9%)

Actividad 3
Trabaja en parejas
Persona 1: explica a tu compaero/ a qu significan valores altos de
2
Persona 2: explica a tu compaero/ a qu es la distribucin muestral del
estadstico
2
y qu nos dice sobre la asociacin entre variables








Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
Pasos (Ritchey, 2008)

1. Considerar los datos y si se cumplen los supuestos
2. Enunciar pregunta de investigacin
3. Formular hiptesis nula e hiptesis alternativa
4. Describir la distribucin muestral
5. Definir el nivel de significacin y el valor crtico de la prueba
6. Observar los resultados, calcular los efectos de la prueba y el estadstico de
la prueba
7. Tomar la decisin de rechazo
8. I nterpretar los resultados en lenguaje comn






Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
Ejemplo:

Existe una asociacin entre la opinin de las personas hacia las marchas y
su posicin poltica?
CEP 65 (2011), n=1559

Variables:
Posicin poltica
Derecha
Centro
I zquierda
I ndependiente/ Ninguna

Opinin acerca de las marchas:
El gobierno debera autorizar las marchas
El gobierno no debera autoritzar las marchas


Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
Existe una asociacin entre la opinin de las personas hacia las marchas y
su posicin poltica?










55% de las personas de derecha estn a favor de las marchas, porcentaje
que sube al 69,8% entre personas de centro y a 81,4% de personas de
izquierda
En la muestra parece haber una asociacin entre ambas variables, pero
podemos inferir que esta asociacin existe en la poblacin?

Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
1. Considerar los datos y si se cumplen los supuestos
La prueba Chi Cuadrado es til cuando contamos con 2 variables
categricas (nominales u ordinales)
Es una prueba simtrica: no se define una variable como dependiente y
otra como independiente. Sin embargo, puede ser expresada como tal
Puede ser utilizada solamente si la muestra fue seleccionada al azar
El tamao de la muestra debe ser suficientemente grande para poder
obtener un estadstico chi cuadrado
Las frecuencias esperadas deben ser al menos 5 para cada celda (o al
menos, el 20% de las celdas debe ser mayor a 5 y ninguna celda debe
ser igual a 1)



Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
1. Considerar los datos y si se cumplen los supuestos
En nuestro ejemplo:
Las dos variables son categricas (en este caso, nominales)
La muestra fue seleccionada al azar
El tamao de la muestra es suficientemente grande: todas las
frecuencias son mayores a 5




Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
2. Enunciar pregunta de investigacin

Sin especificar direccin:
Existe una asociacin significativa entre la posicin poltica de las
personas y sus opiniones sobre las marchas?

Especificando direccin de causalidad:
Existen diferencias significativas entre personas de distintas posiciones
polticas en sus opiniones sobre las marchas?

En este caso:
Posicin poltica es asumida como una variable independiente
Opinin sobre las marchas es asumida como una variable
dependiente

OJ O: Aunque encontremos diferencias significativas no es posible concluir
que existe una relacin causal, solamente una asociacin estadstica

Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
3. Formular hiptesis nula e hiptesis alternativa

H
0
:
2
= 0 (no existe asociacin entre variables)
H
1
:
2
> 0 (existe asociacin entre variables)

Esta prueba siempre es de una cola


4. Describir la distribucin muestral

Distribucin chi cuadrada con gl = (f-1) * (c-1)

En este caso, distribucin chi cuadrada con gl= (2-1)*(4-1)=3


5. Definir el nivel de significacin y el valor crtico de la prueba

= 0,05 (95% de confianza). Valor crtico: 7,82


Prueba Chi Cuadrado: pasos en la prueba de
hiptesis

6. Observar los resultados, calcular los efectos de la prueba, el
estadstico de la prueba y p

A mano:
Calcular frecuencias esperadas para cada celda (combinacin de
categoras)
Calcular fo-fe, (fo-fe)
2
y

(fo-fe)
2
/ fe
Calcular
2




2
=
o c
2
c

Prueba Chi Cuadrado: pasos en la prueba de
hiptesis

6. Observar los resultados, calcular los efectos de la prueba, el
estadstico de la prueba y p

En SPSS:









El valor
2
= 51,71 y el valor p<0,001
Prueba Chi Cuadrado: pasos en la prueba de
hiptesis
7. Tomar la decisin de rechazo

Dado que
2
= 51,71 es mayor al
2
crtico (7,82), rechazamos la hiptesis nula
de no asociacin a un 95% de confianza


8. I nterpretar los resultados en lenguaje comn

Existe una asociacin significativa entre la posicin poltica de las personas y
sus opiniones sobre las marchas, a un 95% de confianza

Mientras un 81,4% de las personas de izquierda estn a favor de las
marchas, solamente el 69,8% de las personas de centro y el 55% de las
personas de derecha estn a favor de las marchas




Tablas de contingencia de 3 variables
Es posible agregar una tercera variable al anlisis
Las tablas de contingencia de 3 variables sirven para evaluar la existencia de
interacciones
I nteraccin estadstica: cuando el efecto de una variable X sobre otra
variable Y depende del nivel de una tercera variable Z
Por ejemplo:
Las personas de derecha tienden a tener opiniones ms crticas hacia las
marchas que las personas de izquierda
Pero, se observa esta asociacin para personas de todo nivel
educacional?
Estudios han mostrado que personas con mayor nivel educacional
tienden a opinar de manera ms consistente con su posicin poltica
Por lo tanto, uno podra esperar que el efecto de posicin poltica en la
opinin sobre las marchas fuera especialmente marcado entre personas
con alto nivel educacional



Realizamos la interpretacin por separado para cada nivel educacional
Entre personas con 0-3 aos de educacin, las diferencias en el apoyo a las
marchas son bastante bajas (30% de personas de derecha y 37,5% de personas
de izquierda)
En cambio, entre personas con 13 o ms aos de educacin, la diferencia es
mucho ms marcada (55,6% de personas de derecha y 95,5% de personas de
izquierda)

A su vez, observamos
pruebas de Chi cuadrado por
separado para cada nivel
educacional
Observamos que existe una
asociacin significativa entre
posicin poltica y actitud
hacia las marchas entre
personas de todos los niveles
socioeconmicos (p<0,01)
con la excepcin de las
personas que tienen entre 0 y
3 aos de educacin
(p=0,44)
A su vez, observamos que el
valor de Chi cuadrado
aumenta a medida que
aumenta el nivel educacional:
es decir, la asociacin es ms
fuerte para personas con
mayores niveles de educacin
Actividad 4: Cmo interpretas las siguientes tablas?













a. Asociacin entre variables
b. Tablas de contingencia y Prueba Chi cuadrado
c. Prueba T para diferencia de medias entre dos grupos
d. ANOVA T para diferencia de medias entre dos o ms grupos
e. Prueba Z para diferencia de proporciones entre dos grupos

Prximo martes (21/ 05): Feriado
Prximas ayudantas: 27 y 28 de mayo

En 2 semanas ms...

S-ar putea să vă placă și