Sunteți pe pagina 1din 39

Introduccin a la

Estadstica Inferencial
con SPSS
Juan Jos Igartua Perosanz
Universidad de Salamanca
jigartua@usal.es

Contenidos

1.

2.
3.

Conceptos bsicos de Estadstica


Inferencial.
Tablas de contingencia.
Coeficiente de correlacin de Pearson.

Conceptos bsicos de
Estadstica Inferencial

Hiptesis nula y alternativa.


Pruebas de contraste de hiptesis.
Tipos de contraste de hiptesis.
El concepto de significacin estadstica.

Contexto de la investigacin
Teoras y/o
investigaciones previas

Hiptesis de
investigacin

Toma de decisiones bajo


incertidumbre sobre lo adecuadas
que son las explicaciones tericas y
la hiptesis que se deducen de ellas

Hiptesis alternativa (H1)

Diferencia-igualdad entre 2 ms
grupos
Hiptesis estadstica
Asociacin entre 2 ms
variables

Contexto de las pruebas de


contraste de hiptesis
Escepticismo (azar,
casualidad)
Pruebas de contraste
de hiptesis

Hiptesis nula (H0) versus


alternativa (H1)

Reglas de inferencia negativa

Se da por supuesto que la hiptesis


nula es verdadera

Comprobar la validez de la
hiptesis estadstica

Comparar H0 con H1

Estadstico de contraste

Significacin estadstica (p)

Reglas de inferencia negativa


Las pruebas de contraste de hiptesis
tienen una presuncin a favor de la
hiptesis nula (), de forma similar a
como ocurre en los tribunales de
justicia, donde hay una presuncin de
inocencia. Dado que uno es inocente
hasta que se demuestre lo contrario, la
evidencia aportada debe ser muy
consistente para admitir la culpabilidad
(Baxter y Babbie, 2004, p. 278).
Pginas del manual 399-413

Significacin estadstica (p)

El azar explica los resultados?


Probabilidad de equivocarse al rechazar la
hiptesis nula.
Credibilidad de la H0.
Probabilidad de error (error tipo I) al rechazar H0.
Probabilidad de obtener un estadstico de
contraste tan grande como el obtenido si H0 fuera
cierta.
La probabilidad de que las diferencias (o
asociacin entre las variables) pueda explicarse
simplemente por el azar o la casualidad.

Tablas de contingencia

Analizar la relacin entre dos variables con un nivel


de medida nominal u ordinal (cualitativas).
Comprobar si existen diferencias entre dos o ms
grupos (variable columna, cualitativa) en una
variable (fila) cualitativa.
Analizar la fuerza de la relacin entre dos variables
cualitativas.
Se toma como base una tabla de contingencia.
Se calcula el estadstico de contraste Chi o Ji
cuadrado.

Clculo del estadstico de


2
contraste

No existe relacin entre 2 variables


Hiptesis nula

No existen diferencias entre los grupos en la


variable criterio
Existe asociacin entre 2 variables

Hiptesis alternativa

Existen diferencias entre los grupos en la


variable criterio

Frmulas:

Interpretacin
Chi cuadrado:

El nivel de significacin asociado al estadstico representa la


probabilidad de obtener un determinado valor de en el caso
de que las dos variables sean independientes (hiptesis nula).
Cuando el valor obtenido sea menor que 0.05 (p<0.05) se podr
rechazar la hiptesis nula y afirmar que existe una asociacin
significativa entre las variables consideradas.

Calculo de las frecuencias


esperadas y del estadstico de
contraste 2 (ejemplo 1)

Clculo de 2 con SPSS


(ejemplo 1)

Tabla de contingencia VotoPartido Vot al partido poltico en las elecciones? * VioSpot


Vio el spot sobre la campaa del Partido Poltico?

VotoPartido Vot
al partido poltico
en las elecciones?
Total

0 No
1 S

Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada

VioSpot Vio el spot


sobre la campaa del
Partido Poltico?
0 No
1 S
10
10
10,0
10,0
10
10
10,0
10,0
20
20
20,0
20,0

Tabla de
contingencia

Total
20
20,0
20
20,0
40
40,0

Pruebas de chi-cuadrado

Chi
cuadrado

Chi-cuadrado de Pearson
Correccin apor
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
1,000

,000

1,000

,000

1,000

Valor
,000b

,000

gl

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

1,000

,624

1,000

40

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada
es 10,00.

Calculo de las frecuencias


esperadas y del estadstico de
contraste 2 (ejemplo 2)

Clculo de 2 con SPSS


(ejemplo 2)

Tabla de contingencia VotoPartido Vot al partido poltico en las elecciones? * VioSpot


Vio el spot sobre la campaa del Partido Poltico?

VotoPartido Vot
al partido poltico
en las elecciones?
Total

0 No
1 S

Recuento
Frecuencia esperada
Recuento
Frecuencia esperada
Recuento
Frecuencia esperada

VioSpot Vio el spot


sobre la campaa del
Partido Poltico?
0 No
1 S
15
5
10,0
10,0
5
15
10,0
10,0
20
20
20,0
20,0

Total

Tabla de
contingencia

20
20,0
20
20,0
40
40,0

Prue bas de chi-cuadrado

Chi
cuadrado

Chi-cuadrado de Pearson
Correccin apor
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
,002

8,100

,004

10,465

,001

Valor
10,000b

9,750

gl

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

,004

,002

,002

40

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada
es 10,00.

TABLAS DE CONTINGENCIA
(matriz de datos)
AC Latinoamerica
en prensa.sav
Estudio sobre el
tratamiento
informativo de
Latinoamrica en
la prensa
espaola
Metodologa:
Anlisis de
contenido (n=309
noticias)
Pginas del manual 524-525

Construccin de una tabla de


contingencia (paso 1)
Variable fila: VD
(carcter)
Variable columna:
VI (pais)

Men Analizar > Estadsticos descriptivos >Tabla de Contingencia

Construccin de una tabla de


contingencia (paso 2)
Nmero de noticias sobre Chile y que aluden a
acontecimientos de carcter negativo (n=34)
Recuento
pais Pas protagonista de la informacin analizada
caracter Carcter 1 Negativo
(evaluativo) del
2 Neutro o ambiguo
acontecimiento
3 Positivo
principal
Total

1 Chile
34

2 Cuba
22

3 Colombia
26

4 Mxico
14

5 Venezuela
24

6 Brasil
14

Total
134

44

14

17

94

13

19

10

15

10

14

81

91

55

43

46

41

33

309

Nmero de noticias totales sobre Chile,


independientemente del carcter
evaluativo del acontecimiento principal
que se relata (n=91)

Nmero de noticias que informan


de acontecimientos de carcter
negativo, independientemente
del pas protagonista (n=134)

Construccin de una tabla de


contingencia (paso 3)
Porcentajes
columna
Regla de Zeisel
Siempre que la
variable
independiente
aparezca como
variable
columna.

Construccin de una tabla de


contingencia (resultado final)
Se comparan los % entre las columnas.
% de pais Pas protagonista de la informacin analizada
pais Pas protagonista de la informacin analizada
caracter Carcter
(evaluativo) del
acontecimiento
principal
Total

1 Chile
37,4%

2 Cuba
40,0%

3 Colombia
60,5%

4 Mxico
30,4%

5 Venezuela
58,5%

6 Brasil
42,4%

Total
43,4%

2 Neutro o ambiguo

48,4%

25,5%

16,3%

37,0%

17,1%

15,2%

30,4%

3 Positivo

14,3%

34,5%

23,3%

32,6%

24,4%

42,4%

26,2%

100,0%

100,0%

100,0%

100,0%

100,0%

100,0%

100,0%

1 Negativo

El 60.5% de las noticias


sobre Colombia son
negativas, mientras que
slo lo son el 30.4% de las
noticias sobre Mxico.

Es estadsticamente
significativa esta diferencia de
porcentajes o se puede explicar
por el azar?

Obtencin de frecuencias observadas,


esperadas y residuos en una tabla de
contingencia

Se solicitan las
frecuencias
observadas,
esperadas y los
residuos no
tipificados

Tabla de contingencia con informacin


sobre frecuencias observadas,
esperadas y residuos
pais Pas protagonista de la informacin analizada
caracter
1 Negativo
Carcter
(evaluativo) del
acontecimiento
2 Neutro o ambiguo
principal

3 Positivo

1 Chile
34

2 Cuba
22

3 Colombia
26

4 Mxico
14

5 Venezuela
24

Frecuencia esperada

39,5

23,9

18,6

19,9

17,8

Residuo

-5,5

-1,9

7,4

-5,9

6,2

-,3

Recuento

44

14

17

94

Frecuencia esperada

27,7

16,7

13,1

14,0

12,5

10,0

94,0

Residuo

16,3

-2,7

-6,1

3,0

-5,5

-5,0

13

19

10

15

10

14

81

23,9

14,4

11,3

12,1

10,7

8,7

81,0

-10,9

4,6

-1,3

2,9

-,7

5,3

91

55

43

46

41

33

91,0

55,0

43,0

46,0

41,0

Recuento

Recuento
Frecuencia esperada
Residuo

Total

Recuento
Frecuencia esperada

6 Brasil
14

Total
134

14,3 134,0

309

33,0 309,0

Calculo MANUAL del


estadstico de contraste 2

Calculo del estadstico de


contraste 2 con SPSS
Botn
Estadsticos

Obtencin del estadstico de


contraste 2 con SPSS (resultado
La prueba detecta si
final)
existe una asociacin
significativa entre las
variables.
Existe una relacin
estadsticamente
significativa entre el
carcter evaluativo del
acontecimiento
principal abordado en
la noticia y el tipo de
pas protagonista de la
misma [ (10, N=309)
= 36.83, p<.001]

Distribucin 2 de Pearson

Tabla 2

Obtencin de los residuos


tipificados corregidos
Permite saber
cul es el
sentido de la
asociacin o de
las diferencias
entre los grupos:
en este caso, qu
pases de manera
significativa
difieren en el
tratamiento
informativo.

Obtencin de los residuos


tipificados corregidos (resultado
final)
pais Pas protagonista de la informacin analizada

caracter
1 Negativo
Carcter
(evaluativo)
del
acontecimiento
principal
2 Neutro o ambiguo

Recuento

1 Chile
34

2 Cuba
22

3 Colombia
26

4 Mxico
14

5 Venezuela
24

6 Brasil
14

Total
134

% de pais

37,4%

40,0%

60,5%

30,4%

58,5%

42,4%

43,4%

-5,5

-1,9

7,4

-5,9

6,2

-,3

Residuos tipificados

-,9

-,4

1,7

-1,3

1,5

-,1

Residuos corregidos

-1,4

-,6

2,4

-1,9

2,1

-,1

Residuo

Recuento

44

14

17

94

% de pais

48,4%

25,5%

16,3%

37,0%

17,1%

15,2%

30,4%

Residuo

3 Positivo

16,3

-2,7

-6,1

3,0

-5,5

-5,0

Residuos tipificados

3,1

-,7

-1,7

,8

-1,5

-1,6

Residuos corregidos

4,4

-,9

-2,2

1,0

-2,0

-2,0

Recuento

13

19

10

15

10

14

81

% de pais

14,3%

34,5%

23,3%

32,6%

24,4%

42,4%

26,2%

-10,9

4,6

-1,3

2,9

-,7

5,3

Residuos tipificados

-2,2

1,2

-,4

,8

-,2

1,8

Residuos corregidos

-3,1

1,5

-,5

1,1

-,3

2,2

Recuento

91

55

43

46

41

33

309

% de pais

100,0%

100,0%

100,0%

100,0%

100,0%

100,0%

100%

Residuo

Total

Los residuos tipificados corregidos se considerarn estadsticamente


significativos los residuos cuyo valor sea mayor que 1.96 menor que
1.96. El signo del residuo sirve para ver la direccin de la relacin entre
las categoras de las variables implicadas.

Obtencin de estadsticos para


evaluar la fuerza de la
asociacin

Obtencin de estadsticos para


evaluar la fuerza de la
asociacin (resultado final)

Coeficiente de correlacin r de
Pearson

Asociacin lineal entre dos variables (de


intervalo o razn).
Diagrama de dispersin.
Covarianza (=sxy).
Signo y fuerza de la asociacin.
Coeficiente de determinacin (=r2) y varianza
explicada (=r2 x 100).
Ojo! Correlacin no es causacin.

Clculo MANUAL del


coeficiente de correlacin de
Pearson (2)
Signo: forma

de la relacin
(+, -)

Valor numrico:
fuerza o magnitud
de la relacin (-1,
+1)

Clculo MANUAL del


coeficiente de correlacin de
Pearson (1)

Ecuacin de la lnea recta: y = a + bX

COEFICIENTE DE CORRELACIN
DE PEARSON (matriz de datos)
Encuesta TV y
violencia.sav

Estudio sobre
el efecto de
cultivo

Metodologa:
Encuesta
(n=96)

Pginas del manual 508-509

Obtener un diagrama de
dispersin
(paso 1)

Men Grficos > Dispersin/Puntos > Dispersin simple (Botn Definir)

Obtener un diagrama de
dispersin
(paso 2)

Variable X: TV
Variable Y: victim

Obtener un diagrama de
dispersin
(resultado final)
Relacin positiva
entre X e Y
Pero de qu
magnitud es la
relacin?

Clculo del coeficiente de


correlacin de Pearson (paso 1)

Men Analizar > Correlaciones > Bivariadas

Clculo del coeficiente de


correlacin de Pearson (paso 2)

Clculo del coeficiente de


correlacin de Pearson
(resultado final)
Ventana de
resultados

Correlacin entre
consumo de TV y
victimizacin:
r[94]=0.53, p<.001