Sunteți pe pagina 1din 122

ESTADSTICA INFERENCIAL

Facultad de Psicologa

CICLO 14-15
Mtra. Joanna Koral Chvez Lpez

NDICE
INTRODUCCIN ................................................................................................................................... 7
TEORIA DE LA PROBABILIDAD .............................................................................................................. 8
PRUEBA DE HIPTESIS ......................................................................................................................... 9
PROCEDIMIENTO PARA LLEVAR A CABO UNA PRUEBA DE HIPTESIS: ..................................................10
1.- Enunciar la hiptesis nula, la hiptesis de investigacin y definir la direccin de la prueba ( si es de una
cola o de dos colas). ................................................................................................................................. 10
2.- Determinar el nivel de significancia ................................................................................................. 11
3.- Seleccionar el estadstico de prueba y calcular el valor p................................................................... 12
4.- Tomar la decisin de aceptacin o rechazo lo cual implica comparar el valor de p con () .............. 14
5.- Interpretar los resultados obtenidos .................................................................................................. 14
PRUEBAS DE ASOCIACIN...................................................................................................................19
Coeficiente de Correlacin Producto-Momento de Pearson (r)............................................................23
Procedimiento para calcular la r .............................................................................................................. 23
Regla de decisin ..................................................................................................................................... 24
Tabla de varios niveles de significancia del coeficiente de correlacin de Pearson (tabla 1).................. 24
EJEMPLO: s ............................................................................................................................................... 25
SPSS .......................................................................................................................................................... 26
Reporte de resultados de la correlacin Pearson .................................................................................... 27
Coeficiente de Correlacin de Spearman de Rangos Ordenados (rho)...................................................29
Procedimiento: ......................................................................................................................................... 30
Regla de decisin ..................................................................................................................................... 30
Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2) .............. 31
EJEMPLO: .................................................................................................................................................. 32
SPSS .......................................................................................................................................................... 33
Reporte de resultados de la correlacin Spearman ................................................................................. 34
CHI-CUADRADA (X2)............................................................................................................................35
Caractersticas .......................................................................................................................................... 35
Procedimiento para calcular Chi- cuadrada ............................................................................................ 35
Regla de decisin...................................................................................................................................... 36
Grados de libertad.................................................................................................................................... 36
EJEMPLO ................................................................................................................................................... 36
CONCLUSIN ............................................................................................................................................ 37

SPSS .......................................................................................................................................................... 38
REGRESIN LINEAL .............................................................................................................................39
Introduccin ............................................................................................................................................. 39
La recta de regresin ................................................................................................................................ 39
La mejor recta de regresin ..................................................................................................................... 41
Bondad de ajuste...................................................................................................................................... 42
Resumen................................................................................................................................................... 43
EJERCICIOS DE TAREA DE CORRELACIONES ..........................................................................................44
PRUEBAS PARAMTRICAS O DE COMPARACIN .................................................................................47
La prueba t .........................................................................................................................................47
La prueba t de Student relacionada (mismos grupos, muestras dependientes) ....................................50
Cundo utilizarla....................................................................................................................................... 50
Lgica de la prueba .................................................................................................................................. 50
Procedimiento .......................................................................................................................................... 51
Regla de decisin...................................................................................................................................... 51
Como se escriben los resultados de la prueba t para muestras relacionadas ......................................... 51
Tabla de varios niveles de significancia para la prueba t de Student Relacionada (tabla 3) .................. 52
EJEMPLO ................................................................................................................................................... 53
SPSS .......................................................................................................................................................... 53
La prueba t de Student no relacionada (para muestras independientes) ..............................................57
Cundo utilizarla....................................................................................................................................... 57
Lgica de la prueba .................................................................................................................................. 57
Procedimiento .......................................................................................................................................... 58
Regla de decisin...................................................................................................................................... 59
Tabla de varios niveles de significancia para la prueba t de Student No Relacionada (tabla 4) ............. 60
EJEMPLO ................................................................................................................................................... 61
SPSS .......................................................................................................................................................... 62
INTRODUCCIN AL ANLISIS DE LA VARIANZA ....................................................................................66
ANOVA UNIFACTORIAL MUESTRAS INDEPENDIENTES ..........................................................................71
Definicin de varianza. ............................................................................................................................. 71
Uso de ANOVA unifactorial (para muestras independientes). ................................................................ 71
EJEMPLO: .................................................................................................................................................. 72
SPSS .......................................................................................................................................................... 75

Tabla de varios niveles de significancia para valores crticos de F (tabla 4) ........................................... 79


Tabla de varios niveles de significancia para valores crticos de F (tabla 4) continuacin ................... 80
Tabla de varios niveles de significancia para valores crticos de F (tabla 4) continuacin ................... 81
PRUEBAS NO PARAMTRICAS ............................................................................................................89
U de Man-Whitney .............................................................................................................................89
Caractersticas: ......................................................................................................................................... 89
Lgica de la prueba .................................................................................................................................. 89
Procedimiento para calcular U de Man-Whitney ................................................................................... 89
Regla de decisin...................................................................................................................................... 90
Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 5) ....................................... 91
Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 5) continuacin. ................ 92
.................................................................................................................................................................. 92
EJEMPLO ................................................................................................................................................... 93
SPSS .......................................................................................................................................................... 94
Prueba de Rangos de Wilcoxon (W)....................................................................................................98
Caractersticas: ......................................................................................................................................... 98
Lgica de prueba ...................................................................................................................................... 98
Procedimiento para calcular el valor de W .............................................................................................. 98
Regla de decisin...................................................................................................................................... 99
Tabla de varios Niveles de Significancia para Wilcoxon (W) (tabla 6).................................................. 100
EJEMPLO ................................................................................................................................................. 102
Kruskal-Wallis (H) ............................................................................................................................. 107
Caractersticas: ....................................................................................................................................... 107
Lgica de prueba .................................................................................................................................... 107
Procedimiento para calcular el valor H ................................................................................................. 107
Regla de decisin ................................................................................................................................... 108
Tabla de varios Niveles de Significancia para H (tabla 7) ...................................................................... 108
Tabla de vario Niveles de Significancia para H (tabla 7) continuacin .................................................. 108
EJEMPLO ................................................................................................................................................. 109
CONCLUSIN: ......................................................................................................................................... 110
SPSS ........................................................................................................................................................ 111
EJERCICIOS DE TAREA ............................................................................................................................. 113
Prueba de Friedman () ............................................................................................................... 116

Caractersticas: ....................................................................................................................................... 116


Lgica de la prueba ................................................................................................................................ 116
Procedimiento para calcular el valor de ....................................................................................... 116
Regla de decisin.................................................................................................................................... 117
Tabla de varios Niveles de Significancia para Friedman () (tabla 8) .............................................. 117
Tabla de varios Niveles de Significancia para Friedman () (tabla 8) continuacin ...................... 117
EJEMPLO ................................................................................................................................................. 118
SPSS ........................................................................................................................................................ 120
EJERCICIOS DE TAREA ............................................................................................................................. 122
REFERENCIAS ................................................................................................................................... 122

NDICE DE TABLAS
Tabla de varios niveles de significancia del coeficiente de correlacin de Pearson (tabla 1)
Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2)
Tabla de varios niveles de significancia para la prueba t de Student Relacionada (tabla 3)
Tabla de varios niveles de significancia para la prueba t de Student No Relacionada (tabla 4)
Tabla de varios niveles de significancia para valores crticos de F (tabla 5)
Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 6
Tabla de varios Niveles de Significancia para Wilcoxon (W) (tabla 7)
Tabla de varios Niveles de Significancia para H (tabla 8)
Tabla de varios Niveles de Significancia para Friedman ()(tabla 9)
Tabla de varios Niveles de Significancia para CHI-CUADRADA (X2) (tabla 10)

INTRODUCCIN
El estudio de determinadas caractersticas de una poblacin se efecta a travs de diversas muestras
que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita.
Una poblacin finita en la que se efecta muestreo con reposicin puede considerarse infinita
tericamente. Tambin, a efectos prcticos, una poblacin muy grande puede considerarse como
infinita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo
con reposicin.
Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada muestra podemos
calcular un estadstico (media, desviacin tpica, proporcin,...) que variar de una a otra. As
obtenemos una distribucin del estadstico que se llama distribucin muestral.
Las dos medidas fundamentales de esta distribucin son la media y la desviacin tpica (tambin
denominada error tpico).
Hay que hacer notar que si el tamao de la muestra es lo suficientemente grande las distribuciones
muestrales son normales y en esto se basarn todos los resultados que alcancemos.
El objetivo que se proponen las tcnicas del anlisis descriptivo es la presentacin y la descripcin de
los datos de nuestra investigacin de la manera ms significativa y eficaz. El anlisis Inferencial va ms
all de la descripcin de los datos; uno de sus objetivos bsicos es hacer afirmaciones acerca de una, o
varias, caractersticas de la poblacin a partir de los datos provenientes de una muestra. Para
generalizar en una poblacin, de manera vlida, los resultados obtenidos en una muestra es necesario
considerar la forma en la que se distribuyen los datos de la muestra e identificar un modelo estadstico
o probabilstico que corresponda al diseo de investigacin utilizado y a las caractersticas de la variable
de inters (continua o discreta), a fin de establecer si las afirmaciones que hacemos de la poblacin
tiene un sustento vlido o son debidas al azar.
Un modelo estadstico es una distribucin que describe la probabilidad de ocurrencia de las variables
aleatorias, es decir, la probabilidad de que la variable X tome cada uno de los valores posibles x, o
P(X=x); esto es: el grado en el cual los resultados que encontramos en una muestra ocurren en realidad
en la poblacin. A esta correspondencia se le denomina funcin de probabilidad. Las distribuciones de
probabilidad pueden representarse mediante una tabla, una grfica o una frmula.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Pgina

Cuando se realiza una investigacin, rara vez se extrae ms de una muestra de una determinada
poblacin. Esta muestra nica se convierte en la base a partir de la cual realizamos inferencias acerca
de dicha poblacin. Si extraemos numerosas muestras del mismo tamao utilizando el mismo
procedimiento de muestreo al azar, y calculamos un estadstico, por ejemplo la media o una proporcin
para esa muestra, tendramos mltiples ejemplos de dicho estadstico (Newton y Rudestam ,1999). Las

La mayora de los casos prcticos a los que nos enfrentamos en Ciencias Sociales se refiere a variables
aleatorias cuyas funciones de probabilidad se ajustan a los modelos estadsticos o distribucin de
probabilidades. Existen diferentes tipos de distribuciones de probabilidad. Una forma de clasificarlas es
mediante el tipo de variables: discretas (se cuentan) y continuas (se miden). Para las variables
continuas, la distribucin de probabilidades se denomina funcin de densidad, ya que las
probabilidades corresponden a reas bajo la curva.

diferencias entre las medias de las muestras extradas nos daran una idea acerca de qu tan bien est
funcionando el procedimiento de muestreo empleado. Si este proceso se repite una gran cantidad de
veces obtendramos una distribucin de estas muestras, es decir, una distribucin muestral. En
resumen, las distribuciones mustrales se obtienen a partir de extraer muestras del mismo tamao (n)
elegidas al azar en una poblacin determinada. Cada muestra del mismo tamao nos proporciona una
observacin (dato), es decir, el estadstico muestral (x,, P) que sera incluido en dicha distribucin. La
probabilidad de obtener un estadstico determinado como resultado del azar est contemplado en la
distribucin muestral del estadstico considerado, por lo que con dicha distribucin se puede
determinar la probabilidad que corresponde a cada estadstico calculado y con ello evaluar si implica
que el estadstico observado es un resultado esperado por azar o no. Como puede advertirse, a cada
estadstico le corresponde una distribucin muestral: media, diferencia entre medias, proporciones,
diferencias entre proporciones, varianzas, etc.
Una de las distribuciones mustrales ms importantes en Estadstica es la distribucin normal (z), con
mucho, la ms importante de todas las distribuciones de probabilidad. Su grfica produce la ya conocida
curva en forma de campana. Dicha distribucin posee las siguientes caractersticas:
1. Tiene forma de campana.
2. Es asinttica con respecto al eje X.
3. Es simtrica.
4. El rea total bajo la curva es igual a 1.
5. La mayor parte de los valores se concentran al centro de la distribucin, mientras que en los
extremos se localizan el menor nmero de los casos.
La distribucin normal de probabilidad es, de acuerdo con Smith (1970);
una grfica idealizada de ciertas distribuciones de frecuencias comunes para las cuales n es
muy grande. No necesariamente tiene estas proporciones justas, ella puede ser
considerablemente ms alta y delgada, pero siempre ser simtrica y en forma de campana
se llama curva normal de probabilidad porque describe, entre otras cosas, la distribucin ms
probable de ciertos eventos al azar (p.13)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Pgina

TEORIA DE LA PROBABILIDAD
La teora de la probabilidad es la parte de las matemticas que estudia los fenmenos aleatorios Estos
deben contraponerse a los fenmenos determinsticos, los cuales son resultados nicos y/o previsibles
de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua
a 100 grados Celsius a nivel del mar se obtendr vapor. Los fenmenos aleatorios, por el contrario, son
aquellos que se obtienen como resultado de experimentos realizados, otra vez, bajo las mismas
condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por
ejemplo, el lanzamiento de un dado o de una moneda. La teora de probabilidades se ocupa de asignar
un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de
cuantificar dichos resultados y saber si un suceso es ms probable que otro.

Esto quiere decir que cuando la muestra es grande y ha sido elegida al azar, es decir: no seleccionada
propositivamente de acuerdo con ciertos parmetros muy particulares de la investigacin, la
distribucin de los datos tender a ser normal, por tanto, esta aproximacin a la curva normal no
siempre se puede esperar, especialmente cuando la muestra de sujetos es muy pequea.

Muchos fenmenos naturales son aleatorios, pero existen algunos como el lanzamiento de un dado,
donde el fenmeno no se repite en las mismas condiciones, debido a que la caractersticas del material
hace que no exista una simetra del mismo, as las repeticiones no garantizan una probabilidad definida.
En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a
modelos complejos donde no se conocen a priori todos los parmetros que intervienen; sta es una de
las razones por las cuales la estadstica, que busca determinar estos parmetros, no se reduce
inmediatamente a la teora de la probabilidad en s.
El trabajo estadstico se orienta, en gran medida, a la verificacin de nuestra hiptesis de investigacin.
El proceso de comprobacin de una hiptesis tiene como propsito determinar si los efectos
estadsticos observados, calculados para una muestra, son reales en la poblacin o son simplemente
un resultado del error de muestreo. El procedimiento que subyace al proceso de comprobacin de una
hiptesis es la estadstica inferencial. Por medio de ella extraemos conclusiones acerca de una
poblacin con base en los estadsticos obtenidos a partir de una muestra.
Utilizamos la estadstica inferencial con el propsito de validar los datos que hemos obtenido a lo largo
de la investigacin. Nuestro objetivo es llegar a una conclusin con respecto a nuestra hiptesis de
investigacin, lo que nos conducir a llevar a cabo una prueba de hiptesis; as, la hiptesis de
investigacin derivar en una serie de hiptesis estadsticas.
PRUEBA DE HIPTESIS
El propsito de la prueba de hiptesis es ayudar al investigador a tomar una decisin acerca de una
poblacin mediante el examen de una muestra de ella.
A continuacin se presentan conceptos indispensables para comprender la prueba de hiptesis:
Hiptesis: Es una proposicin acerca de una o ms poblaciones. Dicha proposicin se creer cierta si
los datos de la muestra llevan al rechazo de la hiptesis nula.
Hiptesis de investigacin (H1): es la conjetura o suposicin que motiva la investigacin.
Hiptesis nula (H0): se establece de tal forma que pueden ser evaluadas por medio de tcnicas
estadsticas adecuadas. Esta hiptesis se establece con el propsito expreso de ser RECHAZADA. En
consecuencia, el complemento de la conclusin que el investigador desea alcanzar se convierte en el
enunciado de hiptesis nula. En el proceso de prueba, la hiptesis nula se rechaza o no se rechaza. Si la
hiptesis nula no se rechaza, se dir que los datos sobre los cuales se basa la prueba no proporcionan
evidencia suficiente que cause el rechazo. Si el procedimiento de prueba conduce al rechazo, se
concluye que los datos disponibles no son compatibles con la hiptesis nula, pero sirven como apoyo a
alguna otra hiptesis.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Pgina

a) La conclusin a la que se desea o espera llegar como resultado de la prueba generalmente se


usa como hiptesis de investigacin.
b) La hiptesis nula debe contener una proposicin de igualdad, ya sea =, o .
c) La hiptesis nula es la que debe ser COMPROBADA.

En resumen, es posible establecer las siguientes reglas empricas para decidir qu proposicin se utiliza
como hiptesis nula y cul como hiptesis de investigacin.

d) Las hiptesis nula y de investigacin son complementarias. Es decir, las dos contemplan de
manera exhaustiva todos los valores posibles que los parmetros de suposicin pueden asumir.

PROCEDIMIENTO PARA LLEVAR A CABO UNA PRUEBA DE HIPTESIS:


1.- Enunciar la hiptesis nula, la hiptesis de investigacin y definir la direccin de la prueba ( si es
de una cola o de dos colas).
La confirmacin o rechazo de nuestra hiptesis de investigacin parte de enunciar una o varias
hiptesis estadsticas: nula (H0) (aseveracin de que no hay alguna diferencia entre el valor esperado
de la muestra y el valor real de la poblacin) y de investigacin (H1) (aseveracin de que existe
diferencia entre el valor esperado y el real).

Pgina

10

Un aspecto que influye de manera especial en la probabilidad de rechazar o no la hiptesis nula (H0) es
si podemos predecir en qu direccin se ubicar nuestro estadstico muestral en relacin con el
parmetro poblacional. La direccin de la prueba se establece mediante la hiptesis de investigacin
y est determinada por el nmero de colas (una o dos colas) en la curva de distribucin muestral. Para
definir si se trata de una prueba de una o dos colas, es necesario examinar cuidadosamente el objetivo
de investigacin y la hiptesis de investigacin para que a partir de ellos podamos enunciar nuestra
hiptesis de investigacin (H1).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

La tabla siguiente presenta las formas ms usuales de enunciar la hiptesis de investigacin:

FORMAS USUALES DE ENUNCIAR LA HIPTESIS DE INVESTIGACIN


De una cola con direccin
positiva: El contenido de la
pregunta de investigacin
incluye trminos como
mayor
que,
ms,
incremento, ms rpido, etc.
De una cola con direccin
negativa: El contenido de la
pregunta de investigacin
incluye trminos como
menor
que,
menos,
disminucin, ms lento, etc.

Plantear una prueba de


una cola, positiva en la H1
y un signo >

Plantear una prueba de


una cola, negativa en la H1
y un signo <

De dos colas no direccional: Plantear una prueba de


El contenido de la pregunta dos colas, neutral en la H1.
de investigacin no incluye
ninguna declaracin sobre la
direccin del efecto de la
variable o la diferencia entre
grupos, o simplemente
afirma desigualdad.
En el contraste o prueba se utilizan las puntuaciones tipificadas Z.
2.- Determinar el nivel de significancia
Al tomar una decisin sobre rechazar o no la H0 puedes incurrir en los siguientes errores:
Error de tipo I (): Rechazar una hiptesis nula cuando es verdadera.
Error de tipo II (): Aceptar una hiptesis nula cuando es falsa.

Pgina

11

Para controlar el error tipo I se utiliza un nivel de significancia , el cual es el nivel de riesgo que ests
dispuesto a tomar al concluir que la hiptesis nula (H0) es falsa cuando es cierta. La siguiente tabla
muestra los niveles convencionales de significancia que se utilizan tpicamente en la investigacin.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Usos tpicos del nivel de significancia


Probabilidad de rechazar Nivel
de Usos tpicos
la H0 cuando es cierta
significancia
Nivel de riesgo Alto
.10
En investigaciones exploratorias, donde
se conoce poco sobre un tema
Nivel de riesgo Moderado .05 y .01
Niveles convencionales en investigacin
mediante encuestas e instrumentos de
evaluacin psicomtrica y educativa.
Nivel de riesgo Bajo
.01 y .001
Niveles convencionales en investigacin
biolgica, de laboratorio y mdica,
donde un error constituye una
amenaza.
Por su parte el error tipo II se controla aumentando el tamao de la muestra.
3.- Seleccionar el estadstico de prueba y calcular el valor p
Una Prueba estadstica tiene asociado un modelo estadstico (probabilstico), de lo que se infiere que
la prueba elegida para aplicar a nuestros datos debe seguir un conjunto de suposiciones que habremos
de considerar para interpretar de manera correcta sus resultados. Estas suposiciones parten
principalmente de la forma en que se constituy la muestra y del tipo de escalas que se emple en la
definicin operacional de nuestras variables.
Adicionalmente, para seleccionar la prueba ms apropiada para nuestra investigacin, debemos
considerar otros criterios, los cuales se mencionan a continuacin.

Nmero de variables observadas y tipo (dependientes o independientes)


Escala de medicin de las variables: si son variables nominales/ordinales, lo ms apropiado son
pruebas de proporciones, si son de intervalo/razn, lo ms indicado es el clculo de pruebas de
medias, diferencias de medias o anlisis de varianza.
Nmero demuestras con las que estamos trabajando y tipo de muestras (independientes o
relacionadas)
Tamao de la muestra (s)

El valor p es la probabilidad de ocurrencia por azar del estadstico de prueba, de acuerdo a la


distribucin muestral de dicho estadstico.

Pgina

12

En vista de que la eleccin de la prueba estadstica es una de las tareas ms complejas del proceso de
investigacin, checa el rbol de decisin estadsticas para elegir la prueba adecuada para tu
investigacin.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

13
Pgina
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

4.- Tomar la decisin de aceptacin o rechazo lo cual implica comparar el valor de p con ()
Si p<(), se rechaza la H0 y se acepta la H1
al nivel confianza 1- ()
p > (), se rechaza la H1 y se acepta H0
La decisin sobre la aceptacin de una hiptesis estadstica est basada en si hay o no suficiente
evidencia para concluir que la hiptesis nula (H0) es falsa. Si la probabilidad del valor obtenido es
mayor que un nivel de significancia especificado, se acepta la hiptesis nula H0; si la probabilidad es
igual o menor al nivel especificado, se rechaza la hiptesis nula (H0) y se acepta la hiptesis de
investigacin (H1).Cuando se acepta la hiptesis nula se concluye que es cierta, pero cuando los datos
la contradicen fuertemente se concluye que es falsa.
5.- Interpretar los resultados obtenidos
Esto implica analizar si los datos obtenidos son congruentes con los antecedentes sealados en el
marco terico o si los contradicen. Adicionalmente deber revisarse la posibilidad de aumentar el
tamao de la muestra si se considera que la inexistencia de una relacin significativa pueda deberse a
un error de muestreo.
Entonces por todo lo anterior la prueba de hiptesis constituye la columna vertebral de nuestro
proyecto de investigacin: ah es donde reside nuestra tesis central, aquello que queremos comprobar.
El inicio del procedimiento de la prueba de hiptesis es establecer una o ms hiptesis (Downie y Heath,
1973).
La primera que se establece es la hiptesis de la no diferencia o hiptesis nula, por ejemplo entre las
medias de dos poblaciones. Esto tambin puede hacerse planteando que las medias de ambas
poblaciones son iguales, o dicho de otra manera, las muestras estudiadas provienen de la misma
poblacin.
Un siguiente aspecto a considerar es el nivel de significacin () que tiene que ver con la seguridad que
queremos tener de no cometer errores al aceptar o rechazar la hiptesis nula. As en un alfa de 5 (0.05),
tenemos 5 posibilidades por cada 100 veces que se extraiga una muestra de una poblacin, de que la
diferencia o no diferencia encontrada sea incorrecta. Si establecemos un alfa de 1 (0.01), el riesgo de
equivocarnos es de uno en cien, si el alfa es menor: 0.001, el riesgo es de uno en mil y as
sucesivamente.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Pgina

El propsito del contraste de hiptesis es determinar si nuestras suposiciones acerca de la relacin


entre dos o ms variables son correctas. Para ello, requerimos elegir una prueba estadstica que nos
permita realizar dicho contraste, sin embargo es importante considerar el objetivo de nuestra

14

Con mucha frecuencia, nuestros estudios intentan medir el grado de relacin que existe entre dos
variables determinadas. Nos preguntamos, por ejemplo: en qu medida influye el grado de
escolaridad de los padres en el grado de escolaridad alcanzado por los hijos?, o bien, en qu medida
las calificaciones grupales en matemticas estn vinculadas a las calificaciones en ciencias naturales o
al modelo de enseanza del profesor de la asignatura?

investigacin (comparar, encontrar asociaciones, establecer diferencias) para poder determinar qu


prueba estadstica es la adecuada.

Pgina

15

En el proceso de seleccin de la prueba estadstica tenemos dos posibilidades: elegir una prueba
paramtrica o una no paramtrica. Cuando se cumplen determinados criterios (criterios
paramtricos); por ejemplo que los datos se encuentren mnimo en un nivel de medicin intervalar,
que los datos de la muestra hayan sido obtenidos de una poblacin normalmente distribuida, es posible
utilizar una prueba paramtrica. Si los datos no se ajustan a una distribucin normal o si el nivel de
medicin empleado no es por lo menos intervalar, entonces se utilizan pruebas no paramtricas.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Las pruebas de asociacin ms comnmente utilizadas en Ciencias Sociales se describen


continuacin:

El Coeficiente de correlacin es el indicador que nos permite examinar, de manera objetiva, la fuerza
y direccin de la relacin entre variables que presentan un fundamento lgico y coherente para su
asociacin, por lo que sus valores se calculan con una direccin de relacin positiva o negativa,
alejndose o acercndose a la unidad.
Entre las pruebas no paramtricas que permiten identificar la fuerza y direccin de la asociacin entre
variables, se encuentra:
Coeficiente de correlacin de rangos ordenados de Spearman (rho): permite explicar la
direccin (positiva o negativa) de una relacin, as como la proporcin de la variacin en los
rangos de Y, explicada por el conocimiento de los valores del rango de X. Aplica slo para
variable de carcter ORDINAL.
Coeficiente de correlacin de Pearson (r): Permite el dimensionar de la magnitud y direccin
de una relacin entre variables medidas a partir de intervalos. La r de Pearson es un coeficiente
de correlacin que mide la estrechez del ajuste de las coordenadas X, Y, alrededor de la lnea de
regresin. Es apropiada para medir la relacin entre variables de INTERVALO/RAZN U
ORDINAL, A mayor valor absoluto de la r de Pearson, las coordenadas estarn ms cercanas a la
lnea, lo que nos indica una mayor asociacin entre las variable.
Prueba de Chi-cuadrada (X2): permite explicar la direccin (positiva o negativa) de una relacin,
as como la proporcin de la variacin en los rangos de Y, explicada por el conocimiento de los
valores del rango de X. Aplica slo para variable de carcter NOMINAL.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Pgina

Entre las pruebas de comparacin paramtricas se encuentran:


Prueba t de Student para muestras independientes (t): es una prueba de la diferencia entre
medias muestrales para dos grupos o muestras independientes. La variable a partir de la cual se
calcula la media debe ser de INTERVALO/RAZN, que en este tipo de prueba representa a la
variable dependiente. La variable independiente debe ser de tipo NOMINAL/ORDINAL
dicotmica.
Prueba t de Student para muestras relacionadas (t): se utiliza para comprobar la hiptesis de
que las puntuaciones de una variable de INTERVALO/RAZN difieren en el tiempo para los
mismos sujetos. Este tipo de diseo es antes-despus y en l una variable se mide dos veces
para los mismos individuos con algn tipo de intervencin entre la aplicacin de las pruebas.
Anlisis de Varianza para muestras independientes (ANOVA): es una prueba de diferencia de
medias muestrales para tres o ms grupos o muestras independientes. La variable a partir de la
cual se calcula la media (variable dependiente) debe ser de INTERVALO/RAZON, siendo en este
tipo de prueba la variable dependiente. La variable independiente debe ser de tipo
NOMINAL/ORDINAL.

16

La comparacin entre grupos es usualmente empleada en la investigacin social, pues con ello se
comprueba la significancia al evaluar muestras que se incluyen y se excluyen de una situacin
determinada. En el caso de la comparacin de dos grupos se parte de considerar la presencia de un
determinado factor en uno de ellos, mientras que en el otro, ocurre el caso contrario.

Anlisis de Varianza para muestras relacionadas (ANOVA): se utiliza para comprobar la


hiptesis de que las puntuaciones de una variable de INTERVALO/RAZON difieren en el tiempo
para los mismos sujetos. Este tipo de diseo es antes-despus, en el cual una variable se mide
tres o ms veces para los mismos individuos con algn tipo de intervencin (variable
independiente) entre las pruebas.

En ocasiones, los datos o las condiciones de nuestra investigacin no cumplen o no tenemos elementos
para suponer que cubren estas condiciones (el ms comn es el nivel de medida de los datos).
En esos casos tenemos que recurrir a las pruebas no paramtricas que, aun cuando son menos
potentes, no establecen condiciones para los parmetros de la poblacin de la cual se obtuvieron las
muestras.
El principio bsico de las pruebas no paramtricas es el mismo que el de las pruebas paramtricas:
comparar los resultados obtenidos contra lo esperado por azar. Las pruebas no paramtricas ofrecen
algunas ventajas:

Se obtiene probabilidades exactas independientes de la forma de la poblacin de la cual se sac


la muestra.
Si se tienen menos de seis sujetos, no existe otra opcin para procesar los datos.
Existen pruebas no paramtricas apropiadas para observaciones hechas en poblaciones
diferentes.
Son apropiadas para datos medidos a nivel nominal u ordinal.

La prueba a utilizar en cada especfico depende del objetivo de la investigacin, en concordancia con
el objetivo de la prueba estadstica, del nivel de medida de los datos, del nmero de muestras y de si
stas son independientes o relacionadas

Pgina

Cuando se realizan prueba de hiptesis, se calcula la probabilidad de que los resultados obtenidos en
una investigacin puedan ser debidos al azar, en el supuesto de que la hiptesis nula sea cierta. Esta
probabilidad es el grado de significacin estadstica (valores menores a 0.05, como 0.04, 0.01 o 0.002)
o valor de p. Basndose en esta probabilidad, se decidir rechazar o no la hiptesis nula. As, cuanto
menor sea el valor de p, menor ser la probabilidad de que los resultados obtenidos se deban al azar y
mayor evidencia habr en contra de la hiptesis nula. Si dicha probabilidad es menor que un valor de p
fijado previamente (habitualmente se toma p<0.05), la hiptesis nula se rechazar. As, cuando el valor
de p est por debajo de 0.05, se afirmar que el resultado es estadsticamente significativo y ser no
significativo en caso contrario.

17

Resumen de procedimiento estadsticos en relacin con el tipo de


muestra
Tipo de muestra
Procedimiento Estadstico
Dos muestras independientes U de Mann Whitney
Dos muestras relacionadas
Wilcoxon
K muestras independientes
Kruskall Wallis
K muestras relacionadas
Friedman

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

Pgina

18

Sin embargo, es importante no olvidar que estamos tomando la decisin de rechazar una hiptesis con
base en los resultados obtenidos en una muestra. Cuando se extrae una muestra existe la probabilidad
de cometer errores. La probabilidad de cometer un error tipo I, es lo que mide precisamente el grado
de significacin p.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez

PRUEBAS DE ASOCIACIN
La correlacin es la forma numrica en la que la estadstica ha podido evaluar la relacin de dos
variables, es decir, mide la dependencia de una variable con respecto de otra variable independiente.
Para poder entender esta relacin tendremos que analizarlo en forma grfica:
edad

peso

15

60

30

75

18

67

42

80

28

60

19

65

31

92

Si tenemos los datos que se presentan en la tabla y consideramos que


la edad determina
el peso de las personas entonces podremos observar
demanda
la siguiente grfica:
150
1698
100 2045
50 1348
1268
0

47
15
100
120

1000

1500

2000

Donde los puntos representan cada uno de los pares ordenados y la


lnea podra ser una recta que represente la tendencia de los datos, que
en otras palabras podra decirse, que se observa que a mayor edad mayor peso.
La correlacin se puede explicar con la pendiente de esa recta estimada y de esta forma nos podemos
dar cuenta que tambin existe el caso en el que al crecer la variable independiente decrezca la variable
dependiente. En aquellas rectas estimadas cuya pendiente sea cero entonces podremos decir que no
existe correlacin. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra.
En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre
ellas.
As en estadstica podremos calcular la correlacin para datos no agrupados y agrupados.
La correlacin refleja si existe relacin o asociacin entre dos variables, no se habla de causalidad
(causa-efecto) por lo que no hay una variable dependiente y una independiente, aunque puede suceder
que una variable sea antecedente de otra. Un uso muy importante de la correlacin es la determinacin
de la confiabilidad test- retest de los instrumentos de prueba. La confiabilidad test-retest significa
que existe consistencia en los puntajes obtenidos en aplicaciones repetidas de la prueba.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

El coeficiente de correlacin expresa de manera cuantitativa la magnitud y direccin de una relacin y


puede adquirir valores de 1 a 1, incluyendo el cero, 1 r 1.
Sus caractersticas son:

19

Las tcnicas correlacionales nos permiten cuantificar la relacin entre los puntajes obtenidos en las dos
aplicaciones y, de esta manera, medir la confiabilidad test- retest del instrumento. La correlacin sirve
principalmente para averiguar si existe una relacin y para determinar su magnitud (fuerza) y direccin
(si esta es positiva o negativa) de esta.

El signo indica el sentido de la relacin, una correlacin negativa representa una asociacin
inversamente proporcional, es decir, a medida que una variable se incrementa, la otra
disminuye; por otro lado, en una correlacin positiva o directamente proporcional, a medida
que aumenta una, la otra tambin se incrementa.
La magnitud de la relacin est dada por el valor del coeficiente y se interpreta como sigue:
0 hasta 0.299
No hay relacin entre las variables (nula)
0.3 hasta antes de 0.499
La relacin es baja (dbil)
0.5 hasta antes de 0.799
La relacin es moderada
0.8 a 1
hay una correlacin alta (fuerte) entre las variables
La ausencia de asociacin lineal no significa necesariamente que las variables no tengan relacin
entre s. Existen muchas variables con una correlacin de tipo curvilneo y debe ser evaluada de
otra manera.
Una forma grfica de ver la relacin entre variables son las grficas de dispersin o dispersigrama
(grfica de pares de valores X y Y), donde cada punto representa el lugar en que se cruzan las
calificaciones de la primera variable (X) y la segunda variable (Y) para cada participante. Si se traza una
lnea que cruce la mayora de los puntos se puede apreciar el tipo de relacin. Existen varios tipos de
correlacin:
1.- Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra aumenta. La recta
correspondiente a la nube de puntos de la distribucin es una recta creciente.

Pgina

20

2.- Correlacin inversa


La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta
correspondiente a la nube de puntos de la distribucin es una recta decreciente.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

3.- Correlacin nula


La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables. En este caso
se dice que las variables no correlacionan y la nube de puntos tiene una forma redondeada.

Grado de Correlacin
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se
pueden dar tres tipos:

1. Correlacin fuerte: la correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil: la correlacin ser dbil cuanto ms separados estn los puntos de la recta.

Pgina

21

3. Correlacin nula

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Regresin Lineal
La regresin consiste en estimar valores de una variable, conociendo ya antes los valores de otra
variable. Es decir, con la regresin se puede conocer una variable a partir de otra. Ejemplo a partir de
la estatura de una persona se conoce su peso; de la capacidad lingstica su comprensin en el estudio,
de su inteligencia su posibilidad de aprobar un examen, etc.
Las variables son: la PREDICTOR y la PREDICTANDO; la INDEPENDIENTE y la DEPENDIENTE.
Los datos se marcan en una grfica de dispersin uniendo los puntos consecuencia de unir en las
coordenadas los valores de las variables X y Y.

Pgina

22

Las coordenadas se usan tambin para ver qu tipo de regresin es, pues puede ser rectilnea, circular,
elptica, etc. Por medio de la representacin en el eje de coordenadas se obtiene la LINEA DE AJUSTE,
lo cual se logra por medio de la ecuacin de la recta.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Coeficiente de Correlacin Producto-Momento de Pearson (r)


La funcin de la correlacin de Pearson es determinar si existe una relacin lineal entre dos variables
de intervalo y que esta relacin no sea debida al azar (que la relacin sea estadsticamente significativa).
La correlacin producto-momento de Pearson es una prueba de Asociacin, de la cual se obtiene un
valor, mismo que mide el grado de correlacin o relacin entre los puntajes obtenidos en dos variables.
Esta prueba permite estudiar hasta dnde los puntajes altos en una variable tienden a asociarse con
puntajes altos en la otra, y si los puntajes bajos en una tienden a asociarse con puntajes bajos en la
otra. La prueba de Pearson tiene en cuenta los valores reales de los puntajes al calcular el grado de
correlacin entre dos variables. Por eso, en esta prueba si es importante que las dos variables se midan
con la misma escala.
El r refleja el grado de correlacin y lo expresa con un nmero que va desde 1 (correlacin negativa
perfecta) pasa por 0 (no existe correlacin) hasta +1 (correlacin positiva perfecta). Mientras ms
cercano sea el valor observado de r a 1, ms probablemente ser significativo. Para que sea significativo,
el valor observado de Pearson (r) debe ser igual o mayor que los valores crticos indicados en la tabla.
La correlacin de Pearson se calcula mediante la siguiente frmula:
=
( )( )
2
[ 2( ) ][ 2( )2 ]

Dnde:
N = nmero de participantes.
X, Y = calificaciones de las variables a relacionar.
XY = Multiplicar X por Y y sumar.
X y Y= Sumar valores de cada variable.
(X) y (Y) = El total de la suma de cada condicin elevado al cuadrado.
X y b = Elevar cada valor al cuadrado y sumarlos.
Procedimiento para calcular la r
1. Calcular la correlacin de Pearson r, sustituyendo en la frmula:
=

( )( )
2
[ 2( ) ][ 2( )2 ]

Pgina

23

2. Se debe buscar el valor de tabla para la correlacin Pearson, para ello se calculan los grados de
libertad (gl = N 1) y se establece el nivel de significancia para probar la H0.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Regla de decisin
Si el coeficiente obtenido es mayor o igual al coeficiente de tabla se acepta la hiptesis de
investigacin.
Si obtenido crtico se rechaza la H0 y se aceptaH1
Si obtenido< crtico se rechaza la H1 y se aceptaH0

Pgina

24

Tabla de varios niveles de significancia del coeficiente de correlacin de Pearson (tabla 1)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

EJEMPLO: se desea saber si existe relacin entre la autoestima y la depresin en estudiantes de


preparatoria. Para ello, un investigador aplica una escala de depresin (X) en la que los estudiantes con
calificaciones ms altas tienen mayor depresin; tambin utiliza una escala de autoestima (Y) en la que
los puntajes mayores indican mayor autoestima. Los resultados se muestran a continuacin:
Redactar la conclusin con un nivel de significancia = 0.05
H0: no existe relacin entre la depresin y la autoestima en estudiantes de preparatoria.
H1: existe relacin entre la depresin y la autoestima en estudiantes de preparatoria.
Depresin
X
26
24
18
17
18
7
15
20
18
X= 163
(X)2= 26569

Autoestima
Y
8
12
26
29
30
31
19
18
28
Y= 201
(Y)2= 40401

X2

Y2

676
576
324
289
324
49
225
400
324
X2=3187

64
144
676
841
900
961
361
324
784
2=
Y 5055

XY
208
288
468
493
540
217
285
360
504
XY= 3363
N=9

Sustituyendo valores en la formula.


obtenido =

()()()

[() ()][()()]

= -0.761

Obtener r de tabla (tabla 1)


En este caso con 9 participantes: gl = 9 1 = 8, por lo que r de tabla al nivel de significancia de 0.05 es
r crtico =0.6319. Observando el coeficiente obtenido de robtenido=-0.761, ste es mayor al compararlo con
el de tabla (no se debe considerar el signo) por lo que la hiptesis nula se rechaza, entonces: existe una
relacin entre el puntaje de depresin y el de autoestima en estudiantes de preparatoria. Adems esta
relacin es moderada (est en el rango de 0.5 a 0.799) e inversamente proporcional (ya que tiene signo
negativo).

Pgina

25

CONCLUSIN:
Se encontr una relacin estadsticamente significativa, moderada e inversamente proporcional,
entre el puntaje de depresin y el de autoestima en estudiantes de preparatoria (rP = -0.761, p < 0.05)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

SPSS
Vamos a declarar primero las variables en SPSS

La prueba de Pearson en el paquete estadstico SPSS se encuentra en Analizar /


Correlaciones/Bivariadas.

Ahora necesitamos enviar las variables quese deseen correlacionar a la ventana de Variables.

Pgina

26

Despus, seleccionar los Coeficientes de correlacin los cuales pueden ser Pearson dependiendo del
nivel de medicin de las variables.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Dar click en el botn Opciones y


seleccionar Medias y desviaciones
tpicas, dar click en Continuar y despus
en Aceptar.
Los resultados para el ejemplo anterior
seran los siguientes:
En el paquete estadstico siempre se
presenta una matriz de correlacin, en
sta se tienen todas las variables
incluidas en el anlisis en los renglones y
se repiten en las columnas, en el lugar en
que se cruza cada par de variables se
tiene el coeficiente de Pearson y el nivel
de significancia obtenido, adems del
nmero de casos (ver datos en el crculo), como puede verse en la tabla de resultados, esta organizacin
nos presenta informacin redundante (la correlacin entre la pareja de variables siempre se repite dos
veces, se pueden tomar los resultados de cualquiera de las dos).
Regla de decisin para la tabla de resultados en SPSS:
Si el nivel de significancia (Sig. Asintt (bilateral)) es menor o igual a 0.05, se rechaza la hiptesis nula.
Sig. Asintt (bilateral) es a 0.05 se rechaza la hiptesis nula

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Reporte de resultados de la correlacin Pearson


Para esta prueba se puede utilizar una grfica de dispersin poniendo los valores de la primer variable
en X y los de la segunda variable en Y (forma 1), aunque se puede hacer tambin un diagrama ligando
ambas variables con una flecha doble (forma 2). En cualquiera de las dos formas se deben mencionar
el valor de la prueba estadstica y el nivel de significancia con que se est rechazando, o aceptando, la
hiptesis nula. Se puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o
mayor, al valor que hayamos elegido para la prueba de hiptesis. Adems se debe escribir la conclusin
a la que se llega.

27

En el presente ejemplo se tiene una significancia de 0.017, menor a 0.05, por lo que se rechaza la
hiptesis nula, entonces: existe una relacin entre el puntaje de depresin y el de autoestima en
estudiantes de preparatoria. Adems esta relacin es moderada e inversamente proporcional (tiene
signo negativo).
Correlaciones

Pgina

28

CONCLUSIN:
Se encontr relacin estadsticamente significativa, moderada e inversamente proporcional, entre el
puntaje de depresin y el de autoestima en estudiantes de preparatoria (rP = -0.761, p < 0.05).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Coeficiente de Correlacin de Spearman de Rangos Ordenados (rho)


La funcin de la correlacin de Spearman es determinar si existe una relacin lineal entre dos variables
ordinales, y que esta relacin no sea debida al azar (que la relacin sea estadsticamente significativa).
Aunque una de las variables pueda ser de intervalo, de cualquier manera se utiliza esta prueba si una
de las dos est medida a nivel ordinal.
Esta es una prueba de asociacin que mide el grado de correlacin entre los puntajes obtenidos en dos
variables y que indica el nivel de significacin de la correlacin observada. Debe usarse cuando los datos
experimentales se miden en una escala ordinal o cuando los datos no cumplen los otros supuestos
necesarios para las pruebas paramtricas.
Lgica de la prueba
Si se predice que dos variables se correlacionan positivamente, los participantes que obtienen puntajes
bajos en una de ellas tambin deben obtener puntajes bajos en la otra, y los que obtienen puntajes
altos en una de ellas tambin deben obtener puntajes altos en la otra. Sin embargo, si no existe
correlacin, es decir, si los puntajes estn distribuidos al azar, como lo predice la hiptesis nula, los
rangos estarn mezclados puesto que un participante puede haber obtenido un rango alto en una de
las variables y un rango bajo en la otra.
La prueba de Spearman calcula las diferencias entre los rangos para los dos conjuntos de puntajes. Para
calcular el estadstico llamado rho se restan estas diferencias de 1. Es evidente que mientras ms
pequeas sean las diferencias entre los rangos de las dos condiciones, mayor ser el valor de rho, es
decir, ms se acercar a +1.
Para que el valor observado de rho pueda considerarse significativo, debe ser igual o mayor que los
valores crticos que se encuentran en la tabla.
La correlacin de Spearman se calcula mediante la siguiente frmula:
6 2
= 1
( 2 1)

Pgina

29

Dnde:
N = nmero de participantes
d2 = diferencias entre los rangos asignados a las variables elevadas al cuadrado

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Procedimiento:
1. Ordene por rango los puntajes de la variable X, asignando 1 al puntaje ms bajo y as
sucesivamente.

2. Calcule
par de rangos de X y de Y.
3. Eleve al cuadrado cada diferencia entre los rangos de X y Y.
4. Sume las diferencias elevadas al cuadrado para obtener d
5. Cuente el nmero de participantes (N)
6. Encuentre el valor de rho con la siguiente frmula:
6 2
= 1
( 2 1)

la diferencia (d) entre cada

7. Se debe buscar el valor de tabla del coeficiente Spearman en la tabla 2, para ello se utiliza el nmero
de casos (N) y el nivel de significancia elegido para probar la hiptesis nula.

Pgina

30

Regla de decisin
Si el coeficiente Spearman obtenido es mayor o igual al de la tabla se rechaza la hiptesis nula.
Si obtenido crtico se rechaza la H0 y se aceptaH1
Si obtenido< crtico se rechaza la H1 y se aceptaH0

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

31

Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

EJEMPLO: Se desea saber si existe relacin entre la actitud hacia el psiclogo (X) y la actitud hacia la
psicoterapia (Y), en un grupo de padres de familia. La actitud es evaluada como sigue: 1 = muy
desfavorable hasta 7 = muy favorable. Los resultados se muestran a continuacin:
Redactar la conclusin con un nivel de significancia = 0.05
H0: no existe relacin entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en
padres de familia.
H1: existe relacin entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres
de familia.
Actitud hacia el
Psiclogo
X
6
7
5
3
4
2
2
1
2

Actitud hacia
Psicoterapia
Y
7
5
4
2
6
3
3
2
1
N=9

Rango
X

Rango
Y

d2

8
9
7
5
6
3
3
1
3

9
7
6
2.5
8
4.5
4.5
2.5
1

-1
2
1
2.5
-2
-1.5
-1.5
-1.5
2

1
4
1
6.25
4
2.25
2.25
2.25
4
d2= 27

Sustituyendo valores en la formula.


6 (27)

obtenido = 1 9(811) = 0.769


Obtener rho de tabla (tabla 2)
El coeficiente en la tabla de valores crticos de correlacin Spearman, con 9 casos al 0.05 de
significancia, es igual a 0.700, el coeficiente Spearman obtenido (0.769) es mayor al de tabla por lo que
se rechaza la hiptesis nula, entonces: existe relacin lineal entre la actitud hacia el psiclogo y la
actitud hacia la psicoterapia, en padres de familia. Esta relacin es moderada (est en el rango entre
0.5 y 0.8) y directamente proporcional (tiene signo positivo).

Pgina

32

CONCLUSIN:
Se encontr una relacin estadsticamente significativa, moderada y directamente proporcional,
entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia (rho = 0.769,
p = 0.05).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

SPSS
Vamos a declarar primero las variables en spss

La prueba de Spearman en el paquete estadstico SPSS se encuentra en Analizar / Correlaciones /


Bivariadas.
Ahora necesitamos enviar las variables que se deseen
correlacionar a la ventana de Variables.
Despus, seleccionar los Coeficientes de correlacin
de Spearman dependiendo del nivel de medicin de
las variables.

Dar click en Aceptar.


Los resultados para el ejemplo anterior seran los siguientes:
En el paquete estadstico SPSS, siempre se presenta una matriz de correlacin, en sta se tienen todas
las variables incluidas en el anlisis en los renglones y se repiten en las columnas, en el lugar en que se
cruza cada par de variables se tiene el coeficiente de Spearman y el nivel de significancia obtenido,
adems del nmero de casos, esta organizacin presenta informacin redundante ya que las
correlaciones por cada pareja de variables se repiten siempre 2 veces.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

En el presente ejemplo, el nivel de significancia obtenido =0.015 es menor a 0.05, por lo que se rechaza
la hiptesis nula, entonces: existe relacin entre la actitud hacia el psiclogo y la actitud hacia la
psicoterapia, en padres de familia. Adems la correlacin es moderada (est en el rango entre 0.5 y 0.8)
y directamente proporcional (tiene signo positivo).

33

Regla de decisin para la tabla de resultados en SPSS:


Si el nivel de significancia (Sig. Asintt (bilateral)) es menor o igual a 0.05, se rechaza la hiptesis nula.
Sig. Asintt (bilateral) es a 0.05 se rechaza la hiptesis nula

Correlaciones

Reporte de resultados de la correlacin Spearman


Para esta prueba se puede utilizar una grfica de dispersin poniendo los valores de la primer variable
en X y los de la segunda variable en Y, aunque se puede hacer tambin un diagrama ligando ambas
variables con una flecha doble, esta forma es la que se va a usar para ejemplificar los resultados de la
correlacin Spearman. En cualquiera de las dos opciones se deben mencionar el valor de la prueba
estadstica y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis nula. Se
puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor, al valor
que hayamos elegido para la prueba de hiptesis. Adems se debe escribir la conclusin a la que se
llega.

Pgina

34

CONCLUSIN:
Se encontr una relacin estadsticamente significativa, moderada y directamente proporcional,
entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia (rho = 0.769,
p = 0.015) (ver diagrama). Estos datos se utilizarn para hacer la discusin posterior de los resultados
encontrados en el estudio

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

CHI-CUADRADA (X2)
Es una distribucin de probabilidad. La prueba de chi cuadrada compara las frecuencias observadas en
cada una de las celdas de una tabla de contingencia con las frecuencias esperadas (E) para cada una,
para determinar si las diferencias se deben al azar, como lo afirma la hiptesis nula (Ho).
El estadstico X (que se pronuncia chi cuadrada o ji cuadrada) refleja el tamao de las diferencias entre
las frecuencias observadas y esperadas. Hay mayor probabilidad de que el resultado sea significativo a
medida que la diferencia entre las frecuencias observadas y esperadas es mayor, por eso el valor
observado de X debe ser igual o mayor que los valores crticos de la tabla.
Caractersticas
No analiza resultados solo categoras
Las categoras asignadas es la nica medida del comportamiento de los participantes
La prediccin se formula indicando el nmero de participantes que habr en cada categora
Procedimiento para calcular Chi- cuadrada
1. Construir tabla de contingencia
2. Listar las frecuencias observadas (0) de acuerdo a su categora
3. Calcular las frecuencias esperadas (E) para cada categora. Esto consiste en multiplicar los
totales marginales para cada variable entre el nmero total de participantes.
4. Calcular el valor de x2
( )
=

5. Calcular los grados de libertad


C=# de columnas

gl= (c-1)(r-1)

Pgina

35

R=# de filas

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

CONCEPTO Y DEFINICIONES
Tabla de contingencia. Se compone de dos vas o entradas y muestra la relacin contingente entre dos
variables, cuando estas han sido clasificadas en categoras mutuamente excluyentes y cuando los datos
de cada celda son frecuencias.
Regla de decisin
Si el valor obtenido es mayor o igual al valor crtico de tabla se acepta la hiptesis de investigacin.
Si X2 obtenido X2 crtico se rechaza la H0 y se acepta H1
Si X2obtenido < X2 crtico se rechaza la H1 y se acepta H0
Grados de libertad

Es el nmero de datos que pueden variar libremente al calcular dicho estadstico.


EJEMPLO

CUANDO USARLA. Cuando se asignan categoras a los participantes y los datos son nominales. Solo
analiza categoras no resultados.
Hiptesis de investigacin
El investigador predijo que habra un mayor porcentaje de estudiantes de tecnologa. Que adoptaran
hbitos de estudio regular en comparacin con estudiantes de ciencias sociales.
Datos de la muestra
100 participantes. Un grupo de 50 estudiantes de ciencias sociales y otro grupo de 50 estudiantes de
tecnologa. Se envi un cuestionario a todos los estudiantes en el que se les peda que indicaran sus
hbitos de estudio de acuerdo a 3 categoras.
1. Estudio regular
2. Estudio irregular concentrado en das puntuales
3. Combinacin de los 2 hbitos de estudio anterior
H0: No existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares
en comparacin con los estudiantes de ciencias sociales.
H1: Existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares
en comparacin con los estudiantes de ciencias sociales.

Pgina

36

Se observaron 44 respuestas de estudiantes de ciencias sociales y 42 de estudiantes de tecnologa.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Hbitos de estudio
REGULAR
6
1

GPO 1
C.S.
GPO 2
TECNOLOGIA

IRREGULAR
15
2

10

16

COMBINADA
23
3

44

24

42

47

86

23

Frecuencia esperada
C1=E

= 8.19

C2=E=

C3=E=
X2=

= 11.77

C5=E=

=24.05

C6=E=

(.)
.

C4=E=

(.)
.

(.)
.

=7.81

gl= (3-1)(2-1)=(2)(1) gl=2

=11.23
=22.95
(.)

(.)

(.)
.

=3.11

( )

CONSULTAR PROBABILIDADES EN TABLA


Chi cuadrada calculada debe ser mayor que los valores crticos de la tabla.
gl =2 p<0.05
x2crit=5.99
3.11<5.99 aceptamos Ho
No se puede rechazar la hiptesis nula, lo que equivale a decir que la diferencia entre las frecuencias
observables y las frecuencias esperadas no es significativa.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Los datos observados no confirman la hiptesis de investigacin segn la cual habra un nmero mayor
de estudiantes de tecnologa que tendra hbitos de estudio regular en comparacin con los estudiantes
de ciencias sociales.

37

CONCLUSIN
No existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares
en comparacin con los estudiantes de ciencias sociales. (X2=5.99, gl=2, p>0.05)

El hecho de no haber encontrado resultados significantes se debe probablemente al elevado nmero


de estudiantes que indicaron hbitos de estudios elevados.
La prueba JI cuadrada solo puede comparar relaciones generales entre variables. Lo que equivale a
hiptesis bilateral. El motivo de ello es que las relaciones entre las variables se pueden interpretar de
distintas manera.
SPSS
Vamos a declarar primero las variables en spss

Los valores para la variable GRUPOS sera 1= ciencias


sociales y 2= tecnologa y los valores para la variable HAB sera 1=regular, 2=Irregular y 3= combinado.
La prueba de chi-cuadrada en el paquete estadstico SPSS se encuentra en Analizar / estadstico
descriptivos / tabla de contingencia.

En la siguiente ventana pondremos la Variable Dependiente en filas


y la Variable Independiente en columnas.
Posteriormente en la opcin estadsticos seleccionamos la opcin
CHI-Cuadrada continuar y en la opcin casillas habilitamos la opcin
columna y continuar. Y damos clic en aceptar.

anterior

La primera tabla nos muestra la frecuencia esperada y observada para cada categora as como su
porcentaje y el total de participantes. La segunda tabla muestra el valor obtenido de Chi-cuadrada que
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

38

Los resultados para el ejemplo


seran los siguientes:

es igual a 3.107 con un nivel de significancia p= 0.212 lo que significa que se acepta la hiptesis nula H0
ya que el valor de p es mayor a 0.05
Por lo tanto, no existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios
regulares en comparacin con los estudiantes de ciencias sociales. (X2=3.11, gl=2, p>0.05)
Recursos de apoyo para el tema CHI-CUADRADA
http://es.slideshare.net/sevilla_carlos2004/distribucion-de-chi-cuadrado
https://www.youtube.com/watch?v=j3qFzFyey2Y
REGRESIN LINEAL
Introduccin
El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la relacin entre
variables. Se adapta a una amplia variedad de situaciones. En la investigacin social, el anlisis de
regresin se utiliza para predecir un amplio rango de fenmenos, desde medidas econmicas hasta
diferentes aspectos del comportamiento humano. En el contexto de la investigacin de mercados
puede utilizarse para determinar en cul de diferentes medios de comunicacin puede resultar ms
eficaz invertir; o para predecir el nmero de ventas de un determinado producto.
En fsica se utiliza para caracterizar la relacin entre variables o para calibrar medidas. Etc.
Tanto en el caso de dos variables (regresin simple) como en el de ms de dos variables (regresin
mltiple), el anlisis de regresin lineal puede utilizarse para explorar y cuantificar la relacin entre una
variable llamada dependiente o criterio (Y) y una o ms variables llamadas independientes o predictoras
(X1,X2, ...,Xk), as como para desarrollar una ecuacin lineal con fines predictivos. Adems, el anlisis de
regresin lleva asociados una serie de procedimientos de diagnstico (anlisis de los residuos, puntos
de influencia) que informan sobre la estabilidad e idoneidad del anlisis y que proporcionan pistas sobre
cmo perfeccionarlo.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

La recta de regresin
En el tema anterior (sobre correlacin lineal) hemos visto que un diagrama de dispersin ofrece una
idea bastante aproximada sobre el tipo de relacin existente entre dos variables. Pero, adems, un
diagrama de dispersin tambin puede utilizarse como una forma de cuantificar el grado de relacin
lineal existente entre dos variables: basta con observar el grado en el que la nube de puntos se ajusta
a una lnea recta.
Ahora bien, aunque un diagrama de dispersin permite formarse una primera impresin muy rpida
sobre el tipo de relacin existente entre dos variables, utilizarlo como una forma de cuantificar esa

39

Nuestro objetivo es el de proporcionar los fundamentos del anlisis de regresin. Al igual que en los
captulos precedentes, no haremos hincapi en los aspectos ms tcnicos del anlisis, sino que
intentaremos fomentar la compresin de cundo y cmo utilizar el anlisis de regresin lineal, y cmo
interpretar los resultados. Tambin prestaremos atencin a otras cuestiones como el chequeo de los
supuestos del anlisis de regresin y la forma de proceder cuando se incumplen

relacin tiene un serio inconveniente: la relacin entre dos variables no siempre es perfecta o nula; de
hecho, habitualmente no es ni lo uno ni lo otro.
Supongamos que disponemos de un pequeo conjunto de datos con informacin sobre 35 marcas de
cerveza y que estamos interesados en estudiar la relacin entre el grado de alcohol de las cervezas y su
contenido calrico. Un buen punto de partida para formarnos una primera impresin de esa relacin
podra ser la representacin de la nube de puntos, tal como muestra el diagrama de dispersin de la
figura 1
Figura 1 Diagrama de dispersin de porcentaje de alcohol por n de caloras

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Podemos comenzar obteniendo los coeficientes B0 y B1 que definen la recta. El coeficiente b es la


pendiente de la recta: el cambio medio que se produce en el nmero de caloras (Y) por cada unidad de
cambio que se produce en el porcentaje de alcohol (X). El coeficiente a es el punto en el que la recta
corta el eje vertical: el nmero medio de caloras que corresponde a una cerveza con porcentaje de
alcohol cero. Conociendo los valores de estos dos coeficientes, se podra reproducir la recta y describir
con ella la relacin existente entre el contenido de alcohol y el nmero de caloras. Aunque no entremos
todava en detalles de cmo obtener los valores de a y b, s podemos ver cmo es esa recta (figura 2).

40

El eje vertical muestra el nmero de caloras (por cada tercio de litro) y el horizontal el contenido de
alcohol (expresado en porcentaje). A simple vista, parece existir una relacin positiva entre ambas
variables: conforme aumenta el porcentaje de alcohol, tambin aumenta el nmero de caloras. En esta
muestra no hay cervezas que teniendo alto contenido de alcohol tengan pocas caloras y tampoco hay
cervezas que teniendo muchas caloras tengan poco alcohol. La mayor parte de las cervezas de la
muestra se agrupan entre el 4,5 % y el 5 % de alcohol, siendo relativamente pocas las cervezas que
tienen un contenido de alcohol inferior a se. Podramos haber extendido el rango de la muestra
incluyendo cervezas sin alcohol, pero el rango de caloras y alcohol considerados parece bastante
apropiado: no hay, por ejemplo, cervezas con un contenido de alcohol del 50 %, o cervezas sin caloras.
Cmo podramos describir los datos que acabamos de proponer? Podramos decir simplemente que
el aumento del porcentaje de alcohol va acompaado de un aumento en el nmero de caloras; pero
esto, aunque correcto, es poco especfico. Cmo podramos obtener una descripcin ms concreta de
los resultados? Podramos, por ejemplo, listar los datos concretos de que disponemos; pero esto,
aunque preciso, no resulta demasiado informativo.
Podramos hacer algo ms interesante. Por ejemplo, describir la pauta observada en la nube de puntos
mediante una funcin matemtica simple, tal como una lnea recta. A primera vista, una lnea recta
podra ser un buen punto de partida para describir resumidamente la nube de puntos de la figura 1.
Puesto que una lnea recta posee una frmula muy simple
= +

Figura 2 Diagrama de dispersin y recta de regresin (% de alcohol por n de caloras).

Pgina

La mejor recta de regresin


En una situacin ideal (e irreal) en la que todos los puntos de un diagrama de dispersin se encontraran
en una lnea recta, no tendramos que preocuparnos de encontrar la recta que mejor resume los puntos
del diagrama. Simplemente uniendo los puntos entre s obtendramos la recta con mejor ajuste a la
nube de puntos. Pero en una nube de puntos ms realista (como la de las figuras 1 y 2) es posible trazar
muchas rectas diferentes. Obviamente, no todas ellas se ajustarn igualmente bien a la nube de puntos.
Se trata de encontrar la recta capaz de convertirse en el mejor representante del conjunto total de
puntos.
Existen diferentes procedimientos para ajustar una funcin simple, cada uno de los cuales intenta
minimizar una medida diferente del grado de ajuste. La eleccin preferida ha sido, tradicionalmente, la
recta que hace mnima la suma de los cuadrados de las distancias verticales entre cada punto y la recta.
Esto significa que, de todas las rectas posibles, existe una y slo una que consigue que las distancias
verticales entre cada punto y la recta sean mnimas (las distancias se elevan al cuadrado porque, de lo
contrario, al ser unas positivas y otras negativas, se anularan unas con otras al sumarlas).

41

Vemos que, en general, la recta hace un seguimiento bastante bueno de los datos. La frmula de la
recta aparece a la derecha del diagrama. La pendiente de la recta (b) indica que, en promedio, a cada
incremento de una unidad en el porcentaje de alcohol (Xi) le corresponde un incremento de 37,65
caloras (Y). El origen de la recta (a) sugiere que una cerveza sin alcohol (grado de alcohol cero) podra
contener 33,77 caloras. Y esto, obviamente, no parece posible.
Al examinar la nube de puntos vemos que la muestra no contiene cervezas con menos de un 2% de
alcohol. As, aunque el origen de la recta aporta informacin sobre lo que podra ocurrir si extrapolamos
(Aplicar un criterio conocido a otros casos similares para extraer conclusiones o hiptesis) hacia abajo la pauta
observada en los datos hasta llegar a una cerveza con grado de alcohol cero, al hacer esto estaramos
efectuando pronsticos en un rango de valores que va ms all de lo que abarcan los datos disponibles,
y eso es algo extremadamente arriesgado en el contexto del anlisis de regresin.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Bondad de ajuste
Adems de acompaar la recta con su frmula, podra resultar til disponer de alguna indicacin precisa
del grado en el que la recta se ajusta a la nube de puntos. De hecho, la mejor recta posible no tiene por
qu ser buena.
Imaginemos una situacin como la presentada en el diagrama de la figura 3, en el que la recta consigue
un ajuste bastante ms pobre que en el caso de la figura 2. Ahora hemos representado el porcentaje
de alcohol de las cervezas (eje horizontal) y el precio de las mismas (eje vertical). Y no parece existir la
misma pauta de relacin detectada entre las variables de la situacin anterior.
As pues, aunque siempre resulta posible, cualquiera que sea la nube de puntos, para obtener la recta
mnimo-cuadrtica, necesitamos informacin adicional para determinar el grado de fidelidad con que
esa recta describe la pauta de relacin existente en los datos.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Cmo podemos cuantificar ese mejor o peor ajuste de la recta? Hay muchas formas de resumir el
grado en el que una recta se ajusta a una nube de puntos. Podramos utilizar la media de los
residuos, o la media de los residuos en valor absoluto, o las medianas de alguna de esas medidas,
etc.
Una medida de ajuste que ha recibido gran aceptacin en el contexto del anlisis de regresin es el
coeficiente de determinacin R2: el cuadrado del coeficiente de correlacin mltiple. Se trata de
una medida estandarizada que toma valores entre 0 y 1 (0 cuando las variables son independientes
y 1 cuando entre ellas existe relacin perfecta).
Este coeficiente posee una interpretacin muy intuitiva: representa el grado de ganancia que
podemos obtener al predecir una variable basndonos en el conocimiento que tenemos de otra u
otras variables. Si queremos, por ejemplo, pronosticar el nmero de caloras de una cerveza sin el
conocimiento de otras variables, utilizaramos la media del nmero de caloras. Pero si tenemos
informacin sobre otra variable y del grado de relacin entre ambas, es posible mejorar nuestro
pronstico. El valor R2 del diagrama de la figura 2 vale 0,83, lo que indica que si conocemos el
porcentaje de alcohol de una cerveza, podemos mejorar en un 83 % nuestros pronsticos sobre su
nmero de caloras si, en lugar de utilizar como pronstico el nmero medio de caloras, basamos
nuestro pronstico en el porcentaje de alcohol. Comparando este resultado con el correspondiente
al diagrama de la figura 3 (donde R2 vale 0,06) comprenderemos el valor informativo de R2: en este
segundo caso, el conocimiento del contenido de alcohol de una cerveza slo nos permite mejorar
nuestros pronsticos del precio en un 6 %, lo cual nos est indicando, adems de que nuestros
pronsticos no mejoran de forma importante, existe un mal ajuste de la recta a la nube de puntos.

42

Figura 3. Diagrama de dispersin, recta de regresin y ajuste (% de alcohol por precio).

Parece evidente, sin tener todava otro tipo de informacin, que el porcentaje de alcohol de las
cervezas est ms relacionado con el nmero de caloras que con su precio.
Resumen
En este primer apartado introductorio hemos aprendido que el anlisis de regresin lineal es una
tcnica estadstica que permite estudiar la relacin entre una variable dependiente (VD) y una o ms
variables independientes (VI) con el doble propsito de:
1) Averiguar en qu medida la VD puede estar explicada por la(s) VI.
2) Obtener predicciones en la VD a partir de la(s) VI.

Pgina

43

El procedimiento implica, bsicamente, obtener la ecuacin mnimo-cuadrtica que mejor expresa la


relacin entre la VD y la(s) VI y estimar mediante el coeficiente de determinacin la calidad de la
ecuacin de regresin obtenida. Estos dos pasos deben ir acompaados de un chequeo del
cumplimiento de las condiciones o supuestos que garantizan la validez del procedimiento.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

EJERCICIOS DE TAREA DE CORRELACIONES


De los siguientes ejercicios lee y determina qu tipo de variables son y cul es su nivel de medicin, obtn el
Coeficiente de Correlacin de Pearson o Spearman (segn los niveles de medicin de las variables), el Diagrama
de dispersin, redacta las Hiptesis Nula y de Investigacin y las conclusiones en base a los resultados
obtenidos.
1.- Para investigar la relacin entre la ortografa y la habilidad para la lectura, un investigador aplic exmenes
de ortografa y de lectura a un grupo de 20 estudiantes seleccionados aleatoriamente de una gran poblacin de
estudiantes no graduados. Se obtuvieron los siguientes resultados. Utiliza un =0.05.
Estudiante
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T

Puntaje de
ortografa
52
90
63
81
93
51
48
99
85
57
60
77
96
62
28
43
88
72
75
69

Puntaje de
lectura
56
81
75
72
50
45
39
87
59
56
69
78
69
57
35
47
73
76
63
79

2.- Para averiguar la validez de un determinado examen de lectura, los investigadores lo aplicaron a una muestra
de 20 estudiantes cuya habilidad para leer haba sido previamente colocada por rangos por su profesor. El
puntaje del examen y el puntaje que el profesor dio para cada estudiante se enumeran a continuacin: Utiliza
un =0.05.

28
50
92
85
76
69
42
53
80
91
73
74
14
29
86
73
39
80
91
72

Estadstica Inferencial

Puntaje del
profesor
18
17
1
6
5
10
11
12
3
2
4
9
20
19
7
8
16
13
15
14

44

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T

Puntaje lectura

Pgina

Estudiante

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

3.- Se analiza la relacin entre el desempeo del equipo y la nmina de los equipos de beisbol de la liga
Americana. La nmina de los equipos de la Liga Americana se mide en millones de dlares por equipo, mientras
que el desempeo se mide por el nmero de juegos ganados en la temporada, lo que quiere evaluarse es si existe
relacin entre el gasto y el desempeo de los equipos profesionales de beisbol. Los datos se muestran en la
siguiente tabla. Utiliza un =0.05.
Participante
1
2
3
4
5
6
7

X
8
9
8.5
16
12
10
12

y
12
11
6
11
10
8
6.3

4.- Como parte de un estudio sobre el efecto de la presin del grupo sobre el conformismo individual en una situacin que
implica riesgo monetario, dos investigadores administraron la escala F, una medida de autoritarismo (a mayor valor mayor
autoritarismo) y una escala diseada para medir estatus de lucha social a 12 estudiantes. Se deseaba tener informacin
acerca de la correlacin entre las puntuaciones de autoritarismo y aquellas de estatus de lucha social. Las puntuaciones
fueron las siguientes: Utiliza un =0.05.
PARTICIPANTE
A
B
C
D
E
F
G
H
I
J
K
L

X
82
98
87
40
116
113
111
83
85
126
106
117

Y
42
46
39
37
65
88
86
56
62
92
54
81

5.- Un investigador supona que el desempeo de los alumnos de la carrera de medicina en materias
afines y sinrgicas podra ser semejante. Para comprobar lo anterior, aplic dos exmenes a un grupo
de diez alumnos (mientras ms grande sea el valor mejor estudiante es). Al aplicarles un examen de
anatoma y otro de embriologa, el investigador tena la pretensin de averiguar si los estudiantes con
puntuaciones bajas en una materia obtenan puntuaciones bajas en la otra y si quienes obtenan
puntuaciones altas en una materia tambin lograban puntuaciones altas en la otra.
A continuacin se muestran los resultados que consisten en aciertos obtenidos en una y otra materia
y expresados en nmeros enteros. Utiliza un =0.01.

Estadstica Inferencial

Aciertos
embriologa
74
61
69
90
51
79
95
52
77
63

45

1
2
3
4
5
6
7
8
9
10

Aciertos
anatoma
65
72
75
82
50
95
87
53
83
64

Pgina

Alumno

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

6.- Kellogs quiere saber si existe una relacin entre salario y estrs. La siguiente tabla lista el salario para cada
empleado y el estrs (medido en una escala de 1=no hay estrs y 10= muy estresado) de empleos
seleccionados al azar. Parece que el salario se incrementa a medida que se incrementa el estrs? Utiliza un
=0.01.
Empleo
Corredor de bolsa
Zologo
Ingeniero elctrico
Director de escuela
Gerente de hotel
Funcionario bancario
Inspector de seguridad laboral
Economista domstico
Psiclogo
Piloto de aerolnea

salario
2
6
3
5
7
10
9
8
4
1

estrs
2
7
6
4
5
8
9
10
3
1

6.- Cules de las siguientes variables tiene ms probabilidad de mostrar una correlacin claramente
positiva? Cules no tiene ninguna probabilidad de mostrar correlacin?
a) Estatura y nmero de pie
b) Nmero de entradas de cine vendidas y nmero de espectadores.
c) Cantidad de espinacas consumidas y nmero de aciertos en las quinielas de ftbol.
7.- Cules de las siguientes correlaciones tiene probabilidad de ser correlaciones positivas o negativas?
a) Las temperaturas en invierno y el consumo de electricidad.
b) ndices de pluviosidad y cifras de ventas de paraguas.

Pgina

46

8.- Cul de los tres coeficientes de correlacin siguientes expresa las correlaciones ms alta y ms
baja?
+0.5 0
-0.9

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

PRUEBAS PARAMTRICAS O DE COMPARACIN


En estas pruebas se comparan grupos o mediciones e intervienen dos tipos de variables.
Variable dependiente (V.D), es el fenmeno o proceso que se va a medir, sus variaciones dependen de
la variable independiente.
Variable Independiente (V.I), es la variable que identifica los tratamientos empleados para influir sobre
la V.D., esta define los grupos que van a ser comparados.
Las pruebas estadsticas paramtricas, como la de la t de Student o el anlisis de la varianza (ANOVA),
es ms potentes que las no paramtricas y se basan en que se supone una forma determinada de la
distribucin de valores, generalmente la distribucin normal, en la poblacin de la que se obtiene la
muestra experimental.
La estadstica paramtrica necesita cumplir con 4 requisitos para poderse aplicar:
1.- La Variable Dependiente (V. D.) debe distribuirse normalmente o muy similar.
2.- Homocedasticidad u Homogeneidad de varianzas o varianzas iguales: que cuando se
comparan grupos estos tengan la misma disp.
ersin con respecto de la media de la V.D.
3.- Asignacin y seleccin aleatoria de los grupos.
4.- Que la Variable Dependiente (V. D) est medida a nivel Intervalar.
Las pruebas paramtricas t estn diseadas para comprobar diferencias entre dos condiciones, utilizan
datos de Intervalo (se llaman as porque los intervalos entre resultados se consideran iguales,
permitiendo realizar clculos numricos en lugar de limitarse a clasificar los resultados).
Un principio general de las pruebas paramtricas es que la Varianza se calcula elevando los resultados
al cuadrado y sumndolos segn diversas combinaciones. Cuando se usan pruebas paramtricas t el
trmino usual para describir la variabilidad es varianza. La varianza representa un clculo aproximado
de la variabilidad en los resultados. La varianza esperada representa las diferencias entre las dos
condiciones que se espera encontrar en los resultados esto debido al efecto de la Variable
Independiente (V.I) seleccionada por el investigador. La varianza total representa el total de
variabilidad en los resultados que incluye la varianza debida a las diferencias pronosticadas y la varianza
debida a diferencias irrelevantes entre los distintos participantes (todas las variables que afectan a la
actuacin de los participantes).

Algunos ejemplos de este tipo de diseos son:


Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

La prueba t
Cuando se investiga en un nivel explicativo, la forma ms simple de un diseo de investigacin es
cuando se manipula una nica Variable Independiente (VI) aplicando dos tratamientos y se observan
sus efectos en una nica Variable Dependiente (VD). Muchas veces en vez de tener dos tratamientos
se compara un grupo control con una condicin experimental (un tratamiento).

47

Las pruebas paramtricas t verifican si la varianza esperada es lo bastante elevada como para producir
un ratio de varianza elevado en el cual la varianza esperada entre dos condiciones es relativamente alta
en comparacin con la varianza total.

1. Existen diferencias en el rendimiento acadmico entre un grupo de estudiantes que escucha


msica respecto de los que no la escuchan?
2. En los tratamientos para la depresin, en el grupo en el que se utilizan frmacos + terapia es
ms efectivo que en el que nicamente utiliza la terapia?
3. En un tratamiento contra la fobia a las araas (aracnofobia) la ansiedad es diferente si se realiza
una desensibilizacin sistemtica utilizando fotografas de araas o una terapia de implosin
con araas reales?
La prueba t permite responder a estas preguntas.
Existen dos tipos de pruebas t dependiendo de si se utilizaron los mismos o diferentes participantes en
las pruebas.
DISEOS:

Pgina

La prueba t (para muestras relacionadas o dependientes) compara diferencias entre pares de


resultados para los mismos participantes que han sido expuestos a las dos condiciones. La prueba t
(para muestras NO relacionadas o independientes) parte de la base de que no existe fundamento para
comparar los resultados sin ms. El objetivo es investigar si la media de los resultados para el grupo de
participantes al que se aplica una de las condiciones es mayor que la media de los resultados para el
grupo de participantes distintos al que se aplica la otra condicin.

48

Distribucin t de Student

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Consideraciones para usarla


Despus del tratamiento se calculan las medias de los grupos.
Si no hay efecto de la VI se considera que las muestras provienen de la misma poblacin y por
lo tanto se espera que las medias sean iguales o que las diferencias entre ellas se deban al error
de muestreo. En la H0: 1= 2. Por el contrario si existe efecto de la VI, se considera que las
muestras han dejado de formar parte de la misma poblacin por el efecto de la VI y por lo tanto
se rechazara la Ho.
En la prueba t se comparan las diferencias entre las medias muestrales obtenidas en los datos.
Y se utiliza el error tpico como un clculo de la variabilidad entre las medias.
Si existe una gran diferencia en las medias de los grupos es ms probable que la hipotesis de
investigacin sea cierta (y que se rechace la H0).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Notas sobre la prueba t de Student:


Cuando se est investigando la diferencia entre dos promedios (media) de la poblacin, se utiliza
una prueba t. Es decir, que se utiliza cuando deseamos comparar dos medias (las cuales se
deben medir en una escala de intervalo).
Con una prueba t, tenemos una variable independiente y una dependiente.
La variable independiente puede solamente tener dos niveles, si la independiente tuviera ms
de dos niveles, despus utilizaramos un anlisis de la variacin unidireccional (ANOVA).
La prueba estadstica para t de Student es el valor t. Conceptualmente, la t representa el nmero
de unidades estndares que estn separando las medias de los dos grupos.

49

Supuestos de la prueba t
Tanto la prueba t para muestras independientes como la prueba t para muestras relacionadas son
pruebas paramtricas basadas en la distribucin normal. Por lo tanto, se asume:
Los datos deben estar medidos al menos en una escala de intervalo.
Si la distribucin de las muestras se distribuye normalmente. En la pruebat para muestras
relacionadas la distribucin muestral de las diferencias debe ser normal.
En la prueba t para muestras independientes, en la que tenemos dos grupos distintos de personas, se
asume:
Que las varianzas de esas poblaciones son iguales (o muy parecidas), para revisar este supuesto
se lleva a cabo el test de Levene.
Que las puntuaciones son independientes (porque provienen de diferentes personas).

La prueba t de Student relacionada (mismos grupos, muestras dependientes)


Con la prueba t se comparan las medias y las desviaciones estndar de grupo de datos y se determina
si entre esos parmetros las diferencias son estadsticamente significativas o si slo son diferencias
aleatorias.
Consideraciones para su uso
El nivel de medicin, debe ser de intervalo.
El diseo debe ser relacionado.
Cundo utilizarla
La prueba t relacionada se usa para diseos experimentales con dos condiciones cuando se estudia una
variable independiente y cuando los mismos sujetos (o sujetos igualados) se desempean en ambas
condiciones (un diseo relacionado), es decir, cuando las dos condiciones se aplican a los mismos
participantes.
La prueba t relacionada es el equivalente paramtrico de la prueba no paramtrica de Wilcoxon para
diseos relacionados con dos condiciones experimentales.
Lgica de la prueba
El objetivo es comparar las diferencias predichas entre las dos condiciones experimentales con la
variabilidad total de los puntajes. Cuando se tienen los mismos sujetos en ambas condiciones, es
posible comparar los pares de puntajes obtenidos por cada sujeto en cada una de las dos condiciones.
Lo mismo se aplica si hay pares de sujetos igualados respecto a todas las caractersticas relevantes. El
estadstico t representa el tamao de las diferencias entre los puntajes de los sujetos para las dos
condiciones. Para que sea significativo, el valor observado de t tiene que ser igual o mayor que los
valores crticos de t.
Por lo anterior las Hiptesis estadsticas para esta prueba seran:
H1: 1 2
H0: 1 2
H1 = La media de la medicion1 es diferente a la media de la medicin 2
H0 = La media de la medicion1 es igual a la media de la medicin 2
La prueba t para muestras relacionadas es fcil de calcular, con la siguiente ecuacin:

Dnde:
t = valor estadstico de T student.
= Valor promedio o media aritmtica de las diferencias entre los momentos antes y despus.

sD = desviacin estndar de las diferencias entre los momentos antes y despus.


N = Tamao de la muestra.
En esta ecuacin se compara la diferencia promedio entre las muestras ( D ) con la diferencia que se
espera encontrar entre las medias de la poblacin ( D ), tomando en cuenta el error estndar de las
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

50

sD / N

Pgina

diferencias ( s D

/ N ). Si la hiptesis nula es cierta se espera que no hayan diferencias entre la media

de la poblacin es decir D =0.


La media aritmtica de las diferencias se obtiene de la manera siguiente:
=

Dnde:
= es la diferencia de A-B
= Nmero de participantes

La desviacin estndar de las diferencias se logra como sigue:


|2
|
=
1
Dnde:
| = la diferencia de los puntajes y la media de la poblacin.
|
|2 = elevar al cuadrado los puntajes de diferencia de la muestra.
|
|2 = suma de los cuadrados de los puntajes
|
Procedimiento
1. Ordenar los datos en funcin de los momentos antes y despus, y obtener las diferencias entre
ambos.
).
2. Calcular la media aritmtica de las diferencias (
3. Calcular la desviacin estndar de las diferencias ( ).
4. Calcular el valor de t por medio de la ecuacin.
5. Calcular los grados de libertad (gl) gl = N - 1.
6. Comparar el valor de t obtenido con respecto al valor de t crtico considerando los grados de
libertad en la tabla D para dos colas o una cola, a fin de obtener la probabilidad.
7. Toma de decisin: Si el valor de t obtenido es mayor o igual que el crtico de las tablas se rechaza
Ho y se acepta H1.
Regla de decisin
Si la tobtenido t crtico se rechaza Ho y se acepta H1
Si la tobtenido< t crtico se rechaza H1 y se acepta Ho.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

CONCLUSIN:
En promedio, a los participantes a los que se les aplico la vacuna, con la segunda aplicacin
experimentaron de manera significativa una mejora (M =3.7, SE=0.5587) que en la primera
aplicacin (M = 6.4, SE = 0.6699), t (10)=2.8, p < 0.01.

51

Como se escriben los resultados de la prueba t para muestras relacionadas


Existe una forma estndar para informar de las pruebas estadsticas. Usualmente vas a encontrar que
en los artculos de investigacin, se informa de la siguiente manera:

Pgina

52

Tabla de varios niveles de significancia para la prueba t de Student Relacionada (tabla 3)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

EJEMPLO
A un grupo de 10 participantes se les aplic una nueva vacuna contra la gripa y se quera saber cmo
se sentan despus de su aplicacin. Se cree que despus de una segunda aplicacin, al tercer da habra
una mejora en su bienestar subjetivo. = 0.01
Hiptesis estadsticas

Ho:

aplicacion1 aplicacion2

H1:

aplicacion1 aplicacion2

H0 = El bienestar subjetivo de los 10 participantes en la segunda aplicacin es igual a la primera


aplicacin.
H1 = El bienestar subjetivo de los 10 participantes en la segunda aplicacin es mejor a la primera
aplicacin.
A continuacin se presentan los puntajes de cada uno de los sujetos.
SS
1
2
3
4
5
6
7
8
9
10
Suma
Media

A1
10
5
6
3
9
8
7
5
6
5
64
6.4

A2
2
1
7
4
4
5
2
5
3
4
37
3.7

d
8
4
-1
-1
5
3
5
0
3
1
27
2.7

d-
8-2.7=5.3
4-2.7=1.3
-1-2.7=-3.7
-1-2.7=-3.7
5-2.7=2.3
3-2.7=.3
5-2.7=2.3
0-2.7=-2.7
3-2.7=.3
1-2.7=-1.7

)
(d
(5.3)2=28.09
1.09
13.69
13.69
5.29
0.09
5.29
7.29
0.09
2.89
78.1

D
sD / N

SD

d
D
N

d D2
N 1

=78.1/9 = 8.67 =

2.94

sD / N = 2.9458/3.1622=0.9315
Comparar las medias
=

2.7 0
2.7
=
= .
0.9315
0.9315

gl= 10-1 =9 N=10


tobt= 2.898

tcrit= 2.821

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

SPSS
Declare las variables en la vista de variables y en la vista de datos capture la informacin.
Posteriormente vaya al men, analizar, comparar medias, T de student para muestras relacionadas.

53

2.898 2.821 Aceptamos la hiptesis de investigacin en la cual nos dice que existen diferencias entre
la primer aplicacin de la vacuna y la segunda.

Pgina

54

En la siguiente ventana envi las variables a analizar, en el botn opciones indique el nivel de
significancia (intervalo de confianza) click en continuar y aceptar

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Output de la prueba t para medidas relacionadas


La salida produce 3 tablas. SPSS
Output 1 muestra una tabla resumen de los estadsticos para cada uno de las condiciones
experimentales. En cada condicin nos dice cul es la media, el nmero de participantes y la
desviacin tpica de la muestra. En la columna final seala el error estndar, que se calcula con la
desviacin estndar dividida por la raz cuadrada del tamao de la muestra ( SE s /
tanto para la primera aplicacin de la vacuna 2.1187 / 10 2.1187 / 3.1622 0.6699 .

N ) por lo

Output 1:
Estadsticos de muestras relacionadas
Media
Par 1

Desviacin tp.

Error tp. de la
media

aplicacion1

6,4000

10

2,11870

,66999

aplicacion2

3,7000

10

1,76698

,55877

En el output 2 se muestra la correlacin de Pearson entre las dos condiciones. Cuando se utilizan
muestras relacionadas es posible que las condiciones experimentales estn correlacionadas, porque los
datos provienen de los mismos participantes. En este caso no existe una correlacin (r =- 0.142) y no
es significativa porque p > 0.05.
Output 2:
Correlaciones de muestras relacionadas
N
Par 1

aplicacion1 y aplicacion2

Correlacin
10

-,142

Sig.
,695

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

se obtiene la diferencia promedio entre las medias de las de los tratamientos (i.e. D , la puntuacin
promedio es 6.4-3.7 = 2.7). En la tabla se informa de la desviacin tpica de la diferencia entre las
medias (2.9458) y lo ms importante, el error estndar de las diferencias entre la aplicacin de la
s
2.9458
0.93155 ). El estadstico t se calcula dividiendo la media
vacunas para cada condicin ( D
N
10
de las diferencias por el error estndar de las diferencias t = 2.7/0.93155 = 2.898). Este valor de t se
compara con el valor de la distribucin basndose en los grados de libertad y un valor de ). SPSS utiliza
los grados de libertad para calcular la probabilidad exacta del valor de t. Este valor de probabilidad est
en la columna etiquetada con Sig. (bilateral).SPSS seala nicamente la probabilidad bilateral (dos
colas). Si en la investigacin se hiciera una prediccin especfica (por ejemplo, que la ansiedad es mayor
cuando se utiliza una araa real) entonces se debe informar de la probabilidad unilateral (de una sola

55

El output 3 muestra la tabla ms importante: en esta tabla se seala si las diferencias entre las medias
son suficientemente grandes para no ser consideradas un resultado debido al azar. Primero, la tabla

cola) para ello se debe dividir la probabilidad proporcionada por el SPSS entre dos. La probabilidad
bilateral en este caso es muy baja (p < 0.018) lo que significa que existe nicamente un 1.8% de
probabilidad de que un valor de t como el obtenido pueda pasar si la hiptesis nula fuera cierta. En
general se utiliza una p < 0.05 como estadsticamente significativa; por lo tanto, en nuestro caso la p
encontrada es significativa porque es menor que 0.05. El hecho de que el valor de t fuese negativo
quiere decir que en la primera aplicacin de la vacuna el promedio fue menor a la de la segunda
aplicacin.
Por lo tanto se puede concluir que si existen diferencias entre la primera aplicacin de la vacuna y la
segunda, t (10) = 2.898, p < 0.05.

Finalmente, en el output se obtiene el intervalo de confianza del 95% para la diferencia entre las
medias. Imagina que tomamos 100 muestras de una poblacin, entre los dos tratamientos y se calcula
la media ( D ) y un intervalo de confianza para la media. El intervalo de confianza nos dice los lmites
entre los cuales estara la diferencia real entre las medias, lo importante de este resultado es que no
contenga el cero, porque esto quiere decir que es improbable que la diferencia entre las medias sea
cero. Esto es muy importante, si recordamos al iniciar la explicacin sealamos que se considera que
si se obtienen dos pares de muestras de una poblacin se espera que el resultado de la diferencia entre
las muestras sea cero. Este intervalo nos dice que, basados en dos muestras reales, es improbable que
el valor verdadero de las diferencias entre las medias sea cero. Por lo tanto, podemos estar confiados
de que las dos muestras no representan muestras aleatorias de la misma poblacin. Sino que
representan muestras de diferentes poblaciones que han cambiado por la manipulacin experimental.
Cmo se escriben los resultados de la prueba t para muestras relacionadas?
CONCLUSIN:

Pgina

56

En promedio, a los participantes a los que se les aplico la vacuna, con la segunda aplicacin
experimentaron de manera significativa una mejora (M =3.7, SD=1.76) que en la primera
aplicacin (M = 6.4, SD=2.11), t (10)=2.8984, p < 0.05.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

La prueba t de Student no relacionada (para muestras independientes)


Esta prueba es similar a la T de Student para datos relaciones, la principal diferencia es que ahora se
manejan datos no relacionados o muestras independientes.
Con la prueba t para muestras relacionadas podemos buscar diferencias entre pares de puntuaciones,
porque las puntuaciones provienen de los mismos participantes y por lo tanto las diferencias
individuales entre las condiciones se elimina. Por lo tanto, las diferencias en las puntuaciones deberan
reflejar nicamente el efecto de la manipulacin experimental. Sin embargo, cuando diferentes
participantes se encuentran en las diferentes condiciones los pares de puntuaciones pueden diferir no
solamente debido a la manipulacin de la variable, sino tambin porque hay otras fuentes de
varianza (por ejemplo, las diferencias individuales en la motivacin entre los participantes, el nivel de
inteligencia, atencin, etc. ), como no es posible hacer una comparacin para cada participante (como
se hizo en muestras relacionadas) entonces ahora haremos comparaciones basadas en las medias
totales de cada grupo o condicin.
En la prueba t para muestras independientes se busca las diferencias entre grupos. En este caso, si
tomamos varios pares de muestras (de diferentes poblaciones) las diferencias entre las medias de las
muestras se va a desviar de la media de la diferencia ( D 1 2 ) algunas veces una pequea cantidad
y ocasionalmente la diferencia ser grande. Si graficamos la distribucin muestral de las diferencias
entre cada par de medias se obtiene una distribucin normal que nos dice que tanto podemos esperar
que dos muestras difieran y la desviacin estndar seala que tanta variabilidad se puede esperar
nicamente por efecto del azar. Si la desviacin estndar es grande se puede esperar que diferencias
grandes entre las medias de las muestras ocurran por azar; si la desviacin estndar es pequea
entonces nicamente se pueden esperar que ocurran diferencias pequeas entre las muestras por
azar.
Cundo utilizarla
Se usa para diseos en los que se estudia una variable independiente bajos dos condiciones, cuando
hay diferentes participantes en las dos condiciones. La prueba t es la prueba paramtrica equivalente
a la prueba no paramtrica de U de Mann-Whitney.

La prueba t para muestras independientes es fcil de calcular, con la siguiente ecuacin:


Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

57

Lgica de la prueba
El objetivo primordial de la prueba t es comparar la cantidad de variabilidad debida a las diferencias
predichas en puntaje entre los dos grupos con la variabilidad total de los puntajes de los sujetos. Las
diferencias predichas se calculan en trminos de las diferencias entre las medias de los puntajes de los
dos grupos. El valor real de esta diferencia entre las medias se tiene que comparar con la variabilidad
total de los puntajes. Si la variabilidad de los puntajes es pequea, entonces una diferencia ms bien
pequea entre las medias de los grupos puede reflejar una diferencia consistente entre ellos. Sin
embargo, si la variabilidad entre los puntajes es muy grande, esto podra indicar que una proporcin
mayor de esta variabilidad se debe a fluctuaciones en el desempeo de los sujetos, debidas a variables
desconocidas, ms que a la diferencia predicha entre las condiciones experimentales.

1
2

+
1

Dnde:
t = valor estadstico de la prueba de T de Student.

= valor promedio del grupo 1.

= valor promedio del grupo 2.


SD = desviacin estndar.
N1 = tamao de la muestra del grupo 1.
N2 = tamao de la muestra del grupo 2.
Ecuacin para obtener la desviacin estndar ponderada:
1 + 2
=
(1 1) + (2 1)
Dnde:
= desviacin estndar.
SC = suma de cuadrados de cada grupo.
N = tamao de la muestra 1 y 2.
Ecuacin para obtener la Suma de Cuadrados:
= 2

()2

Ecuacin para calcular los grados de libertad:

Como hicimos con la prueba t para muestras relacionadas vamos a comparar el valor de t obtenido
respecto del valor crtico de t de la distribucin con grados de libertad igual a n1 n2 2 , si el valor
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Procedimiento
1. Determinar el promedio o media aritmtica de cada grupo de poblacin.
2. Calcular la suma de cuadrados de cada grupo.
3. Calcular la desviacin estndar (SD) de ambos grupos.
4. Calcular los grados de libertad (gl) gl = (N1 + N2) 2.
5. Obtener la probabilidad del valor t en la tabla D para dos colas o una cola, a fin de obtener la
probabilidad.
6. Toma de decisin: Si el valor de t calculado es mayor o igual que el registrado en las tablas se
rechaza Ho y se acepta H1.

58

= (1 + 2 ) 2

obtenido excede el valor crtico rechazamos la Ho, es decir podemos estar seguros (con una
probabilidad de error del 5%) de que hay un efecto de la variable dependiente. Si se dan cuenta el
estadstico t lo podemos obtener nicamente conociendo la media, la desviacin estndar y el
nmero de participantes de cada grupo.
Regla de decisin

Pgina

59

Si la tobt tcrit se rechaza Ho y se acepta H1


Si la tobt< tcrit se rechaza H1 y se acepta Ho.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

60

Tabla de varios niveles de significancia para la prueba t de Student No Relacionada (tabla 4)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

EJEMPLO
Para el anlisis vamos a utilizar los datos de la ansiedad que provoca la presentacin de araas, ya sea
en foto o real, a personas que padecen aracnofobia. En este caso tenemos 12 participantes a los cuales
se les present una foto de una araa y a otros 12 participantes se les present una araa real. Se midi
la ansiedad en cada grupo. = 0.05
H0=Las diferencias observadas en la ansiedad que provoca una araa ya sea en foto o en real son
iguales. (La ansiedad que provoca una araa ya sea en foto es igual a que fuese real)
H1=La ansiedad que provoca una araa ya sea en foto o en real, son distintas. (La ansiedad que provoca
una araa ya sea en foto es diferente a que fuese real)
Participantes
1
2
3
4
5
6
7
8
9
10
11
12
Suma
Media
cuadrado

Ansiedad
Gpo1 Foto
30
35
45
40
50
35
55
25
30
45
40
50
480
40
230400

900
1225
2025
1600
2500
1225
3025
625
900
2025
1600
2500
20150

= 2

SC1= 20150 (230400/12)= 950

Ansiedad

Gpo2 Real
40
1600
35
1225
50
2500
55
3025
65
4225
55
3025
50
2500
35
1225
30
900
50
2500
60
3600
39
1521
564
27846
47
318096

()2

SC2= 27846 (318096/12)=1338

Estadstica Inferencial

950 + 1338
2288
=
= 10.20
(11 + 11)
22

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

61

1 + 2
=
(1 1) + (2 1)

1
2

+
1

40 47
1

10.2012 +

7
=
= .
4.16

12

= (1 + 2 ) 2
gl= (12+12)-2 =22
Para estos datos con 22 grados de libertad, al nivel de significancia establecido en el valor de 0.05, se
tiene un valor t en tabla de 2.074, el valor de t obtenido es menor al de la tabla (el signo no debe ser
tomado en cuenta) por lo tanto se acepta la H0, entonces: las diferencias observadas en la ansiedad que
provoca una araa ya sea en foto o real son iguales, es decir, no existen diferencias significativas entre
las medias de las dos muestras. En trminos del experimento, se puede inferir que los aracnofbicos
estn igualmente ansiosos si se les presentan fotos y cuando se les presentan araas reales.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Los participantes nos permiten identificar a cada una de las personas que participaron en el estudio y
se define como nominal, en la variable grupo se seala a que condicin pertenece cada uno de los
participantes que se define como nominal, en nuestro caso los participantes que estn en el grupo 0 se
expusieron a una foto de araa y los que tienen un cdigo de 1 fueron expuestos a una araa real, para

62

SPSS

definirlo se debe ir a la columna donde dice valores y presionar del lado derecho y aparecer el cuadro
que se muestra siguiendo la flecha; finalmente, tenemos a la variable dependiente que es ansiedad y
la medida debe ser escala (intervalo).
Una vez que hemos definido las variables vamos a la vista de datos, recuerda que en SPSS cada lnea
representa un participante, por lo tanto, los datos ya no estarn como en la prueba t para muestras
relacionadas. En este caso los datos se colocan de la siguiente forma:

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Cuando se activa el cuadro de dialogo, selecciona la variable dependiente de la lista (dale un click a
Ansiedad) y colcala en donde dice Contrastar variables. Despus es necesario seleccionar grupo y
transferirlo a la parte que dice Variable de agrupacin. Una vez que has seleccionado la variable de
agrupacin debes seleccionar donde dice Definir grupos. SPSS necesita saber cules son los cdigos
numricos que asignaste a tus dos grupos, una vez que hayas seleccionado los grupos (0 y 1) da click en
continuar. Si le das a Opcionesva a aparecer un cuadro de dialogo en el que puedes seleccionar el
intervalo de confianza (por defecto es 95%).

63

La variable grupo seala que participantes tuvieron la foto de una araa (grupo 0) y cuales una araa
real (grupo 1). Para el anlisis debemos ir a:

2.1 Output de la prueba t para muestras independientes


El output de la prueba t para muestras independientes contiene nicamente dos tablas. La primera
tabla (output 1) presenta los estadsticos descriptivos para las dos condiciones. De esta tabla podemos
saber que ambos grupos tenan 12 participantes. El grupo que tena una foto de araa tiene una
ansiedad promedio de 40, con una desviacin estndar de 9.29. El error estndar de ese grupo (o
desviacin estndar de la distribucin muestral) es de 2.68 ( SE 9.293 / 12 9.293 / 3.464 2.68 ). La
tabla tambin seala que el nivel de ansiedad en los participantes a los que se les present una araa
real fue de 47, con una desviacin estndar de 11.03 y un error estndar de 3.18
(
SE 11.029 / 12 11.029 / 3.464 3.18 ).
Output 1:
Estadsticos de grupo

12
12

Media
40.0000
47.0000

Desviacin
tp.
9.29320
11.02889

Error tp. de
la media
2.68272
3.18377

En la segunda tabla (output 2) se presenta los resultados principales de la prueba. La primera columna
contiene los valores del estadstico, es importante notar que a diferencia de la prueba t para muestras
relacionadas, en esta prueba tenemos dos valores de t. En la 1) se han asumido varianzas iguales y en
la 2) No se han asumido varianzas iguales. En el contraste tradicional en la prueba t ambos deben tener
varianzas ms o menos iguales, pero si esto no ocurriera existe un ajuste que se hace a la prueba. Por
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

64

Pgina

Ansiedad

Grupo
foto
real

lo tanto, antes de presentar los resultados es necesario comprobar si las varianzas son o no iguales.
Para ello se utiliza la prueba de Levene para la igualdad de varianzas que se encuentra en las primeras
dos columnas. La prueba de Levene es similar a la prueba t, slo que en vez de probar la Ho: 1= 2,
2

sirve para probar si Ho: 1 2 , es decir si las varianzas son iguales. Por lo tanto, si el test de Levene
es significativo p 0.05 se rechaza la Ho y por lo tanto las varianzas no son iguales. Si por el contrario
p > 0.05 entonces se acepta la Ho y se asume que las varianzas son iguales. Para estos datos, el test
de Levene es no-significativo (porque la p = .386 que es mayor que 0.05). Una vez que hemos
comprobado que las varianzas son iguales debemos ir a la parte donde dice 1) se han asumido varianzas
iguales

Habiendo establecido la homogeneidad de las varianzas, vamos a mirar la prueba t. Primero seala que
la diferencia promedio entre las medias es ( X1 X 2 40 47 7 ) y el error estndar de la
distribucin de las diferencias de las muestras, se calcula utilizando el divisor de la Ecuacin 5:

s12 s22

N1 N 2

9.29 2 11.032

12
12

7.19 10.14 17.33 4.16

El estadstico t se calcula dividiendo la diferencia de la media por el error estndar de la distribucin


muestral de las diferencias ( t 7 / 4.16 1.68 ). El valor de t obtenido se valora respecto del valor t
crtico. Para muestras independientes los grados de libertad se calculan sumando el tamao de las
muestras menos el nmero de muestras ( df N1 N2 2 12 12 2 22 ). SPSS seala el valor
exacto de p que es de .107, que es mayor que 0.05, por lo tanto se acepta Ho.

Pgina

Que no existen diferencias significativas entre las medias de las dos muestras. En trminos del
experimento, se puede inferir que los aracnofbicos estn igualmente ansiosos si se les presentan fotos
y cuando se les presentan araas reales.
En nuestro caso utilizamos una probabilidad bilateral (o de dos colas) es decir no hacemos ninguna
prediccin sobre la direccin del efecto. Sin embargo, a menudo en la investigacin podemos hacer
predicciones especficas, en este caso podemos decir que la ansiedad con la araa real esperaramos
que fuera mayor. En este caso, nosotros usamos una prueba unilateral (o de una cola), de ser as la
probabilidad unilateral se divide entre 2. (i.e. 107/2=.054) La probabilidad unilateral es an mayor que
.05 (pero ahora por un margen muy pequeo y por lo tanto tendremos que seguir con la misma
conclusin, de que no hay diferencias significativas.

65

CONCLUSIN:

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

INTRODUCCIN AL ANLISIS DE LA VARIANZA


Las siglas ANOVA son una abreviatura de anlisis de la varianza en ingls (ANalisys Of VAriance). El
anlisis de la varianza es un elemento bsico de todas las pruebas paramtricas. Una de las Ventajas
especiales del ANOVA es que la varianza total se puede descomponer en varios tipos de varianza. La
varianza total incluye la varianza esperada y la varianza debida a variables irrelevantes. Con ANOVA,
ms que comparar la varianza esperada con la varianza total, es posible descomponer la varianza total
en varios tipos de varianza.
Dos subdivisiones de la varianza total son: la varianza esperada y la varianza de error debida a los
efectos de variables irrelevantes no previstas.
La varianza esperada es la varianza entre condiciones, dado que el investigador ha pronosticado
diferencias entre las condiciones debidas al efecto de una variable independiente seleccionada.
La varianza debida a variables no previstas es la varianza de error, ya que, desde el punto de vista del
investigador, todo aquello que no ha sido pronosticado representa un error.
Lgicamente los investigadores minimizan los errores no pronosticados. Un ejemplo de error no
pronosticado podra ser cuando todas las condiciones experimentales se aplican a los mismos
participantes en el mismo orden, lo que podra sesgar las respuestas de aqullos. El investigador adapta
de manera automtica el orden de aplicacin de las condiciones para eliminar los posibles efectos del
orden en la varianza de error.
Existen tres distintos tipos de varianza en ANOVA. Estos son:
1. Varianza esperada
2. Varianza de error
3. Varianza total
Observe que la varianza esperada y la varianza de error juntas forman la varianza total.
El anlisis de varianza sirve para analizar los datos provenientes de diseos con una o ms variables
independientes o factores (variables categricas nominales u ordinales) y UNA variable dependiente
(variable medida con una escala de intervalo o razn). Los modelos de ANOVA permiten bsicamente
comparar medias.

Pgina

El modelo de un factor sirve para comparar el tratamiento de varios grupos sobre una variable
dependiente. Se trata, por tanto, de una generalizacin de la prueba t para dos muestras
independientes al caso de diseos con ms de dos muestras.
Recuerda:
Estadstica Inferencial

66

Aunque existen muchos y muy diferentes modelos de ANOVA vamos a atender a una
clasificacin muy simple que tiene que ver con el nmero de factores que existen en el diseo de
investigacin. El trmino factor en el contexto del ANOVA es sinnimo de variable independiente. As,
al modelo de ANOVA diseado para analizar los datos obtenidos utilizando un diseo con una variable
independiente se le llama ANOVA de un factor (en ingls one-way ANOVA), si el diseo tiene dos
variables independientes se le llama ANOVA de dos factores (two-way ANOVA). Etc. Cuando hay ms de
un factor se les llama modelos factoriales.

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

A la variable categrica (nominal u ordinal) que define a los grupos que se desea comparar se le llama
independiente o factor y se representa por la VI. A la variable cuantitativa (de intervalo o razn) en la
que se desea comparar el efecto se le llama dependiente y se representa por la VD.
Las hiptesis se plantean de manera similar a la prueba t nicamente que aqu hay ms de dos
tratamientos y la hiptesis nula se rechaza (i.e. se cumple la H1) si se encuentran diferencias en al menos
dos grupos (o tratamientos).
a) Hiptesis estadsticas
Ho: tratamiento _ 1 tratamiento _ 2 tratamiento _ 3 ...
H1:

tratamiento _ 1 tratamiento _ 2 tratamiento _ 3 ..

Existen diferencias en al menos un par de tratamientos


Antes de explicar cmo se realiza un ANOVA, es importante que nos quede claro porque no
simplemente llevamos a cabo varias pruebas t para comparar todas las combinaciones de los grupos en
los que estamos interesados. Vamos a imaginar una situacin en la que queremos comparar tres
condiciones experimentales (o tratamientos), entonces llevamos a cabo tres pruebas por separado: 1)
comparamos tratamiento 1 y 2, 2) tratamiento 2 y 3 y 3) tratamiento 1 y 3. Si para cada uno de esas
pruebas se utiliza un nivel de significacin del 0.05, entonces para cada prueba se comete un 5% de
error de rechazar de manera falsa la Ho (error Tipo I) Por lo tanto la probabilidad de no cometer el error
Tipo I es de 95%. Si se asume que cada test es independiente (por lo tanto, podemos multiplicar las
probabilidades) entonces la probabilidad de no cometer un error Tipo I cuando se realizan las 3 pruebas
3

es de (0.95 ) .95 .95 .95 .857 , entonces la probabilidad de cometer al menos un error Tipo I es
de 1 0.857 .143 o lo que es lo mismo del 14.3%, es decir, hemos incrementado la probabilidad de
0.5% a 14.3% este error que se comete cuando se realizan muchos anlisis con los mismos datos se
n

llama tasa de errores simultneos (o familywise error = 1 (9.95) , donde n es el nmero de test
realizados).
Interpretacin de la F

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Fuentes de Varianza
Los distintos tipos de varianza se suelen llamar tambin fuentes de varianza. Este trmino se usa para
indicar que cada tipo de varianza procede de un tipo distinto de variable. Dichas variables son las
fuentes de la varianza. Las fuentes de varianza en ANOVA se muestran a continuacin:
Fuentes de varianza en ANOVA
Fuentes de varianza
Tipos de varianza
Variables independientes (pronosticadas)
Varianza esperada
Variables irrelevantes ( no pronosticadas)
Varianza de error
Combinacin de variables independientes y variables Varianza total
irrelevantes.

67

Cuando realizamos una prueba t, se analiza la hiptesis que considera que las dos muestras tienen la
misma media. De forma similar, en la ANOVA se analiza si tres o ms medias son iguales. Un ANOVA
produce un estadstico F o razn F, que es similar a una prueba t en el que se compara la razn entre la
cantidad de varianza explicada por el modelo respecto del error.

En ANOVA la varianza esperada entre condiciones se calcula a partir de las diferencias esperadas entre
los resultados de las distintas condiciones.
La varianza total se calcula a partir de las diferencias en los resultados de todos los sujetos que han
participado en el experimento.
La varianza de error se calcula restando a la varianza total la varianza esperada. El fundamento de este
clculo es que la varianza de error es lo que queda despus de haber tenido en cuenta la varianza
esperada.
En ANOVA, las pruebas de significacin se basan en la proporcin entre la varianza entre las condiciones
esperada y la varianza de error.

Pgina

68

Grados de libertad
Hay otro factor importante que debemos tener en cuenta a la hora de calcular varianzas y consultar las
tablas estadsticas. Para ello necesitamos conocer el nmero de grados de libertad (gl). El concepto de
grados de libertad surge de la idea de que las pruebas paramtricas calculan varianzas basadas en la
variabilidad de los resultados, por lo que es fundamental que todos los resultados tengas libertad
para variar. La cuestin es si todos los resultados de un experimento son variables en la misma medida.
El concepto de grados de libertad es bastante difcil de entender. Un ejemplo experimental podra
ayudarnos a comprenderlo.
Suponga que hace un experimento y calcula el total de los resultados. Al copiar los resultados ms
tarde, olvida incluir uno de los resultados de uno de los seis participantes y se queda con los resultados
que se muestran a continuacin:
Resultados usados para calcular
los grados de libertad
Participante Resultados
1
12
2
13
3
10
4
11
5
14
6
Total
75
No tiene por qu alarmarse, pues sabe que con los cinco resultados y el total de los seis resultados
puede calcular el resultado olvidado para el participantes 6.Lo nico que tiene que hacer es restar los
cinco resultados del total igual a 75; el resultado para el participante 6 slo podra haber sido 15. La
consecuencia de esto es que el resultado para ese participante se puede predecir si conocemos los
otros resultados y el total. Es decir, dicho resultado no tiene libertad para variar.
Los grados de libertad tienen en cuenta el hecho de que uno de los resultados no vara porque se puede
predecir a partir de los otros cinco. El trmino grados de libertad se usa para indicar que todos los
dems resultados pueden variar.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Los grados de libertad se calculan restando uno al nmero total de resultados N, (N-1). gl =6-1 = 5
Condiciones para las pruebas paramtricas
Hay tres condiciones fundamentales para las pruebas paramtricas. Estas se aplican a ANOVA y tambin
a las pruebas paramtricas t. Dichas condiciones son:
a) La medicin de los datos (INTERVALAR).
b) La manera en que se distribuyen los totales de los resultados, y
c) Si los resultados estn distribuidos de manera equitativa entre las condiciones experimentales.
La medicin de los datos es bastante fcil de realizar. Dado que ANOVA y las pruebas t son pruebas
paramtricas, que conllevan clculos numricos basados en sumas de cuadrados, la primera condicin
es que los datos deben ser datos de intervalo, con intervalos iguales entre resultados en una escala
numrica continua.
El asunto de la distribucin de los resultados es ms complejo y por ello lo trataremos en detalle en el
apartado siguiente.
Distribucin normal.
Una segunda condicin para la pruebas paramtricas es que los resultados deberan estar distribuidos
segn una distribucin normal. El rasgo fundamental de una distribucin de resultados normal es que
tiende a haber ms resultados intermedios que resultados extremos. Esta es una caracterstica bastante
generalizada de las distribuciones de resultados.
La tercera condicin formal para los datos paramtricos se denomina Homogeneidad de la varianza
palabras que indican uniformidad, esto implica que la variabilidad de los resultados para cada condicin
debera ser aproximadamente la misma.

Pgina

69

Se ha demostrado que, siempre que los nmeros de participantes para cada condicin sean iguales, los
resultados de las pruebas paramtricas son bastante fiables, implicando esto que, si los datos tienen
aproximadamente una distribucin normal y no hay grandes discrepancias entre las varianzas de las
condiciones, las pruebas paramtricas nos darn un anlisis razonablemente exacto de los datos de un
experimento. Esta es una buena razn para asignar siempre el mismo nmero de participantes a cada
condicin experimental.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

ANOVA
(ANalysis Of VAriance)

ANOVA BIFACTORAL (dos factores)

Sirve para experimentos con tres (o ms)


condiciones. Indica que slo hay una
variableIndependiente para analizar.

Se puede comprobar la posibilidad de que se


produzca un efecto diferencial (interacciones) de
una variable independiente sobre otra variable
independiente. Indica que hay dos
variablesIndependientes para analizar.

ANOVA UNIFACTORIAL
MUESTRAS RELACIONADAS

ANOVA BIFACTORIAL
MUESTRAS INDEPENDIENTES

ANOVA BIFACTORIAL
MUESTRAS RELACIONADAS

Los resultados para cada


condicin proceden de
participantes distintos.
Estudia 3 fuentes de varianzas:

Los resultados proceden de los


mismos participantes.
Analiza 4 fuentes de varianza:

Los resultados de 4 condiciones


para las dos variables
independientes proceden de
participantes distintos.
Estudia 5 fuentes de varianza:

Los resultados para las 4


condiciones de las dos variables
proceden de los mismos
participantes.
Analiza 8 fuentes de varianza:

1. Varianza entre las condiciones


de la Variable A.
2. Varianza entre las condiciones
de la Variable B.
3. Varianza derivada de la
interaccin entre A y B.
4. Varianza de error y
5. Varianza total.

1. Varianza entre las condiciones


de la Variable A.
2. Varianza entre las condiciones
de la Variable B.
3. Varianza debida a la
interaccin entre A x B.
4. Varianza entre los resultados
relacionados de cada
participante(S)
5. Varianza total.
6. Interaccin A x S
7. Interaccin B x S
8. Interaccin A x B x S

1.
2.
3.

Varianza entre condiciones


Varianza de error y
Varianza total.

1.
2.
3.
4.

Varianza esperada
Varianza individual
Varianza de error y
Varianza total.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

70

ANOVA UNIFACTORIAL
MUESTRAS INDEPENDIENTES

Pgina

ANOVA UNIFACTORIAL (un factor)

ANOVA UNIFACTORIAL MUESTRAS INDEPENDIENTES


Definicin de varianza.
En ANOVA (para muestras independientes) se pueden calcular tres fuentes de varianza. stas son:
Varianza esperada (debida a las diferencias pronosticadas entre las condiciones)
Varianza de error (debida a variables irrelevantes, incluidas las diferencias entre participantes).
Varianza total (que combina la varianza esperada y la varianza de error).
Uso de ANOVA unifactorial (para muestras independientes).
Cundo usarla
ANOVA unifactorial (para muestras independientes) debe usarse para diseos independientes cuando
se aplican tres (o ms) condiciones a participantes distintos, con una variable independiente y datos de
intervalo.
El anlisis de varianza (ANOVA) de un factor sirve para comparar varios grupos en una variable
cuantitativa. Se trata, por tanto, de una generalizacin de la Prueba T para dos muestras independientes
al caso de diseos con ms de dos muestras.
A la variable categrica (nominal u ordinal) que define los grupos que deseamos comparar la llamamos
independiente o factor y la representamos por VI. A la variable cuantitativa (de intervalo o razn) en la
que deseamos comparar los grupos la llamamos dependiente y la representamos por VD.
Si queremos, por ejemplo, averiguar cul de tres programas distintos de incentivos aumenta de forma
ms eficaz el rendimiento de un determinado colectivo, podemos seleccionar tres muestras aleatorias
de ese colectivo y aplicar a cada una de ellas uno de los tres programas.
Despus, podemos medir el rendimiento de cada grupo y averiguar si existen o no diferencias entre
ellos. Tendremos una VI categrica (el tipo de programa de incentivos) cuyos niveles deseamos
comparar entre s, y una VD cuantitativa (la medida del rendimiento), en la cual queremos comparar
los tres programas. El ANOVA de un factor permite obtener informacin sobre el resultado de esa
comparacin. Es decir, permite concluir si los sujetos sometidos a distintos programas difieren la
medida de rendimiento utilizada.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Si las medias poblacionales son iguales, las medias muestrales sern parecidas, existiendo entre ellas
tan slo diferencias atribuibles al azar. En ese caso, la estimacin (basada en las diferencias entre las
medias) reflejar el mismo grado de variacin que la estimacin (basada en las diferencias entre las

71

La hiptesis que se pone a prueba en el ANOVA de un factor es que las medias poblacionales (las medias
de la VD en cada nivel de la VI) son iguales. Si las medias poblacionales son iguales, eso significa que los
grupos no difieren en la VD y que, en consecuencia, la VI o factor es independiente de la VD.
La estrategia para poner a prueba la hiptesis de igualdad de medias consiste en obtener un estadstico,
llamado F, que refleja el grado de parecido existente entre las medias que se estn comparando. El
numerador del estadstico F es una estimacin de la varianza poblacional basada en la variabilidad
existente entre las medias de cada grupo. El denominador del estadstico F es tambin una estimacin
de la varianza poblacional, pero basada en la variabilidad existente dentro de cada grupo.

puntuaciones individuales) y el cociente F tomar un valor prximo a 1. Si las medias muestrales son
distintas, la estimacin reflejar mayor grado de variacin que la estimacin y el cociente F tomar un
valor mayor que 1. Cuanto ms diferentes sean las medias, mayor ser el valor de F.
Si las poblaciones muestreadas son normales y sus varianzas son iguales, el estadstico F se distribuye
segn el modelo de probabilidad F de Fisher-Snedecor (los grados de libertad del numerador son el
nmero de grupos menos 1; los del denominador, el nmero total de observaciones menos el nmero
de grupos). Si suponemos cierta la hiptesis de igualdad de medias, podemos conocer en todo
momento la probabilidad de obtener un valor como el obtenido o mayor (ver Pardo y San Martn, 1998,
pgs. 248-250).
EJEMPLO:
Se presentaron listas de diez palabras a tres grupos distintos de seis individuos cada uno, para que las
memorizaran. El investigador predijo que la velocidad de presentacin de listas de palabras influira en
los resultados de memorizacin. La velocidad de presentacin de palabras para el Grupo 1 fue menor,
una palabra cada 5 segundos (condicin 1) para el Grupo 2 la velocidad fue intermedia, una palabra
cada 2 segundos (condicin 2) y para el Grupo 3 la velocidad fue mayor, una palabra por segundo
(condicin 3). Los resultados de memorizacin se muestran en la tabla siguiente. =0.01.
Nmero de palabras memorizadas con tres velocidades de presentacin.

Totales (T)

Condicin 1
(velocidad
menor)
8
7
9
5
6
8
43

Condicin 2
(velocidad
intermedia)
7
8
5
4
6
7
37

Condicin 3
(velocidad
mayor)
4
5
3
6
2
4
24

Medias

7.17

6.17

104
Total
general

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

H1: Existen diferencias en al menos un par de condicin.


Instrucciones paso a paso para calcular F ratio unifactorial para muestras independientes.
1.- La varianza entre condiciones SCesperada se calcula sumando los cuadrados de los totales para cada
condicin, dividiendo la suma por n y restndole la constante.
( )
=

= suma de los cuadrados de los totales para cada condicin

72

Hiptesis estadsticas
Ho: condicin_1 condicin_ 2 condicin_ 3

= nmero de participantes en cada condicin


( ) = Cuadrado del total general
= nmero total de resultados
2 = 432 + 372 + 242 = 3794
=6
( )2 = 1042 =10816
= 18

=

= .

2.- La varianza total SCtotal se calcula sumando los cuadrados de todos los resultados y restndole la
constante.

( )
=

= suma de cada uno de los resultados elevados al cuadrado


=664
=

= .

3. La varianza de error SCerror se calcula restando la varianza esperada SCesperada y la varianza total SCtotal.
=
= . . = 31.67
4.- Se calcula los grados de libertad (gl) para cada tipo de varianza.
=
=
=
glesperada = 3 1 = 2
gltotal = 18 1 = 17
glerror = 17 2 = 15
5.- MCesperada yMCerror se calculan dividiendo las sumas de cuadrados (SC) por los gl.

73

Pgina

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

MCesperada =
MCerror =

31.44
= 15.72
2

31.67
= 2.11
15

6.- F ratios se calcula dividiendo MCesperada entre MCerror.


Observe que se indican los gl para F (glesperada= 2, gl error = 15)

Tabla ANOVA unifactorial para muestras independientes


Fuentes de varianza
Sumas
de Grados
de
cuadrados
libertad
Velocidad de
31.44
2
presentacin inter
grupo
Error intragrupo
31.67
15
Total
63.11
17
ratio para

Cuadrados
medios
15.72

F ratio
F2,15
=7.45

2.11

Buscar la significacin de F en la tabla


Se debe encontrar le valor crtico de F en la tabla, para ello se tiene que identificar, entre el cuadrado
medio entre condiciones y el cuadrado medio de error, el cul es el mayor; en las columnas se debe
buscar con los grados de libertad correspondientes al cuadrado medio mayor y en los renglones los
grados de libertad del cuadrado medio menor. Se debe elegir un valor de acuerdo con el nivel de
significancia elegido para la prueba de la Ho. La regla de decisin para anlisis de varianza es:
Si Fobt Fcritica se rechaza la H0 y se aceptaH1
Si Fobt< Fcritica se rechaza la H1 y se aceptaH0
CONCLUSIN:
Se encontr un efecto estadsticamente significativo en la velocidad de presentacin de listas de
palabras sobre los resultados de memorizacin, [F (2,15)=7.45, p < 0.01].

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

Comparaciones posteriores a F
Cuando se ha determinado que existen diferencias significativas entre los grupos, se debe especificar
dnde se encuentran las diferencias, para ello se analizan los grupos por pares, para hacerlo existen
varios mtodos, ms o menos estrictos, diseados para evitar el error tipo I debido al efecto Bonferroni.

74

Es fundamental consultar la tabla F para verificar las diferencias entre las medias en las tres condiciones.
Existen diferencias entre las medias para las tres condiciones (textos presentados a velocidades
distintas). Este hecho confirma la hiptesis de investigacin segn la cual las velocidades de
presentacin de listas de palabras influirn en el nmero de palabras memorizadas, y que a mayor
velocidad (condicin 3) se memorizaran menos palabras.
Observe que ANOVA slo nos dice si hay diferencias generales significativas entre las condiciones
experimentales, lo que es equivalente a una hiptesis bilateral.

El efecto Bonferroni se refiere al hecho de que al hacer las diferentes comparaciones entre los grupos
organizados por parejas, por ejemplo con la prueba t, el efecto acumulativo sobre el nivel de
significancia, del empleo de cada grupo ms de una vez para hacer todas las comparaciones nos hace
rechazar la hiptesis nula cuando esta no debera ser rechazada.
SPSS
Declara la variable de agrupacin y la variable dependiente (con las tres condiciones) y en la vista de
datos capture la informacin correspondiente a cada variable. Posteriormente vaya al men analizar
comparar N, ANOVA de un factor.

En la siguiente ventana envi las variables a analizar, en la lista de dependientes coloque la variable
dependiente y en la opcin factor coloque la variable de agrupacin.

En el botn Post hoc seleccionar BONFERRONI e indicar el nivel de significacin y dar click en
continuar

75

y
en

Pgina

En el botn de opciones seleccionar descriptivos,


prueba de homogeneidad de las varianzas dar click
continuar y por ltimo en aceptar.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

La salida produce 4 tablas.


Output 1 se presentan las estadsticas descriptivas para los grupos.

Output 2 es la prueba de homogeneidad de varianzas entre los grupos, H0: = = , la regla de


decisin es: si el nivel de significancia es menor o igual al 0.05 se rechaza la H0, en este caso el valor
de significancia ( .915) es mayor a 0.05, por lo que no se rechaza H0, entonces: las varianzas de los
grupos son iguales.
Sig.Bilateral <= 0.05 Varianzas no son iguales
Sig.Bilateral > 0.05 Varianzas son iguales

Pgina

76

A continuacin se muestran los resultados de la prueba F (suma de cuadrados, grados de libertad,


cuadrados medios), el valor de F y la significancia que son los datos que se utilizan para la regla de
decisin (ver datos en el crculo), la regla es: si el nivel de significancia es menor o igual al 0.05 se
rechaza la H0.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

La significancia de la prueba F (=0.006) es menor a 0.05 por lo que se rechaza H 0, entonces: el


nmero de palabras recordadas es diferente entre el grupo de la condicin 1, el grupo de la condicin
2 y el grupo de la condicin 3.
Al finalizar se representan los resultados de las comparaciones posteriores, primero la comparacin
del grupo 1 con el grupo 2 y 3, despues el 2 con el 1 y el 3, y al ltimo el 3 con el 1 y 2.
Pruebas post hoc

1 =
2 ,
1 =
3 ,
2 =
3. La regla de decisin para cada
Las hipotesis nulas que se prueban son :
comparacin es : si el nivel de significancia es menor o igual al 0.05 se rechaza la H 0.
Como se puede observar la significancia de la comparacin del grupo 1 (velocidad menor)y el grupo 2
(velocidad intermedia) es de 0.755, del 1 con el 3 (velocidad mayor) es de 0.006 y del grupo 2 y el grupo
3 es de 0.062, siguiendo la regla de decisin, la nica comparacin con diferencias estadsticamente
significativas es la correspondiente al grupo 1 con el grupo 3 entonces: el numero de palabras
recordadas es diferente entre el grupo 1 y 3 y podemos decir que las diferencias en el anlisis de
varianza son debidas a este resultado.

Pgina

77

Reporte de los resultados de la prueba F


Para esta prueba se puede utilizar grfica de barras con las medias de cada grupo, es importante
mencionar los valores de la prueba estadstica, grados de libertad y el nivel de significancia con que se
est rechazando, o aceptando, la hiptesis nula. Se puede poner el valor de probabilidad obtenido o
simplemente decir que es menor , o mayor, al valor que hayamos elegido para la prueba de hipotesis.
Adems se debe escribir la conclusin a la que se llega, por ejemplo:
En lo que respecta a la velocidad de presentacin de listas de palabras, se encontraron diferencias en
el numero de palabras recordadas entre el grupo 1, grupo 2 y el grupo 3 (F= 7.45, gl=2,18; p< 0.01).
Este resultado se debe a que se encontraron diferencias en el numero de palabras recordadas entre
el grupo 1 y 3 (p<0.05), no observndose diferencias en las otras comparaciones.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

78

Cmo puede observarse en la grfica, el grupo 1 tuvo el promedio ms alto (7.17), seguido del grupo2
(6.17) , obteniendo la media ms baja el grupo 3 (4.00).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

79

Tabla de varios niveles de significancia para valores crticos de F (tabla 4)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

80

Tabla de varios niveles de significancia para valores crticos de F (tabla 4) continuacin

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

81

Tabla de varios niveles de significancia para valores crticos de F (tabla 4) continuacin

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Pgina

82

Tabla de varios niveles de significancia para valores crticos de F (tabla 4) continuacin

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

EJERCICIOS DE TAREA
Ejercicio 1.- Supongamos que usted quiere determinar si ciertas situaciones producen distintos niveles
de tensin. Usted sabe que la cantidad de la hormona corticosterona que circula en la sangre es una
buena medida de tensin que presenta una persona. Usted dividi de manera aleatoria a 15 estudiantes
en 3 grupos de 5 individuos cada uno. Se midi el nivel de corticosterona de los alumnos del grupo 1,
inmediatamente despus de que estos regresaron de vacaciones (tensin baja). Se midi el nivel de
corticosterona de los estudiantes del grupo 2, despus que estos asistieron a sus clases durante una
semana (tensin moderada). Por ltimo, se midi el nivel de corticosterona de los alumnos del grupo 3
inmediatamente antes de la semana de los exmenes finales (tensin alta). Todas las mediciones se
llevaron a cabo a la misma hora del da. Usted registro los datos tal como se presentan en la tabla. Los
datos estn expresados en miligramos de corticosterona por cada 100 mililitros de sangre.
Grupo 1,
Vacaciones

Grupo 2,
Clases

X1
2
3
7
2
6

X2
10
8
7
5
10

Grupo 3,
Examen
final
X3
10
13
14
13
15

Pgina

83

a) Cul es la hiptesis de investigacin?


b) Cul es la hiptesis nula?
c) Cul es la conclusin? Utilizando =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Ejercicio 2.- Un psiclogo desea determinar si la capacidad de la memoria inmediata resulta afectada
por falta de sueo. La memoria inmediata se define como la cantidad de material que la persona puede
recordar poco despus de que este se le presenta. Doce estudiantes del curso de introduccin a la
psicologa son elegidos al azar y se les asigna, de manera aleatoria, a dos grupos formados por seis
individuos cada uno. A uno de los grupos se le priva de sueo durante 24 horas anteriores a la
presentacin del material para recordar. Todos los sujetos del grupo anterior duermen el tiempo
normal (de 7a 8 horas). El material consiste en una serie de diapositivas, cada una las cuales contienen
nueve nmeros. Cada diapositiva se les presenta durante un periodo muy breve (50 milisegundos),
despus de lo cual el sujeto debe recordar la mayor cantidad posible de nmeros que acaban de ser
presentados. Los resultados se muestran a continuacin. Los datos representan el porcentaje de
nmeros correctamente recordados.
Sueo normal
Grupo 1
X1
68
73
72
65
70
73

Privado del sueo


Grupo 2
X2
70
62
68
63
69
60

Pgina

84

a) Cul es la hiptesis de investigacin?


b) Cul es la hiptesis nula?
c) Cul es la conclusin? Utilizando =0.01

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Ejercicio 3.- A fin de motivar a los ciudadanos para que ahorren gasolina, el gobierno estudia la idea de
emprender una campaa nacional a favor del ahorro de ese energtico. Sin embargo, antes de
emprenderla a nivel nacional, el gobierno decide realizar un experimento que le permita evaluar la
eficacia de la campaa. Para el experimento, realiza la campaa de ahorro de gasolina en rea
geogrfica pequea, pero representativa. Entonces, 12 familias de esa rea son elegidas al azar y se
mide la cantidad de gasolina que consumieron durante el mes anterior al lanzamiento de la campaa
de publicidad y durante el mes siguiente a la campaa. As se obtienen los siguientes datos:
Campaa

Antes de la
campaa
(Galones/mes)
55
43
51
62
35
48
58
45
48
54
56
32

Despus de la
(Galones/mes)
48
38
53
58
36
42
55
40
49
50
58
25

Pgina

85

a) Cul es la hiptesis de investigacin?


b) Cul es la hiptesis nula?
c) Cul es la conclusin? Utilizando =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Ejercicio 4.- En fecha fue descubierto un neurotransmisor cerebral endgeno llamado galanina. Segn
parece, ste afecta de manera directa el deseo de ingerir alimentos con un alto contenido de grasa.
Mientras ms alta sea la cantidad de este neurotransmisor de origen natural en un individuo, mayor
ser el apetito que este sienta por la comida con alto contenido de grasa. Recientemente, una compaa
farmacutica desarroll una sustancia experimental, que bloquea la galanina sin alterar el apetito por
otros alimentos ms saludables (es decir, con menos grasa). Un neurocientfico de la compaa piensa
que esa sustancia experimental ser muy til para controlar la obesidad. En forma especfica, l cree
que la administracin diaria de este medicamento har que la persona ingiera alimentos con menos
grasa y, por ende, promover la prdida de peso. En estas condiciones, se realiza un experimento, para
el cual se elige de manera aleatoria a 15 mujeres obesas, todas ellas voluntarias, y se les administra el
medicamento experimental durante 6 meses. Se registr el peso inicial y el peso final (despus de 6
meses) de cada persona. Los pesos registrados se presentan en la siguiente tabla.
Peso inicial (libras)

Peso final (libras)

165
143
175
135
148
155
158
140
172
164
178
182
190
169
157

145
137
170
136
141
138
137
125
161
156
165
170
176
154
143

Pgina

86

a) Cul es la hiptesis de investigacin?


b) Cul es la hiptesis nula?
c) Cul es la conclusin? Utilizando =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Ejercicio 5.- Un neurocirujano tiene la idea de que las lesiones producidas en cierta rea del cerebro,
conocida como tlamo, hacen que disminuya la percepcin del dolor. Si est en lo cierto, eso podra ser
importante para el tratamiento de enfermedades terminales acompaadas de dolor intenso. Como
primer intento de poner a prueba esta hiptesis, el investigador realiza un experimento en el cual 16
ratas son divididas, al azar, en dos grupos de 8 especmenes cada uno. A los animales del grupo
experimental se les provoca una pequea lesin en la parte del tlamo que segn el investigador, est
implicada en la percepcin del dolor. A los animales del grupo control se les provoca una lesin
comparable en un rea del cerebro que, segn se cree, no sta relacionada con el dolor. Dos semanas
despus de las operaciones quirrgicas, a cada roedor se le aplica una serie de breves descargas
elctricas en las patas. Esas descargas van creciendo en intensidad: Tienen un nivel de intensidad muy
bajo y ste aumenta hasta que el animal retrocede. De esta manera se determina el umbral del dolor
provocado por las descargas elctricas en cada rata. Al final se obtienen los siguientes datos. Cada dato
representa el nivel ms bajo (en miliamperes) en que se produce el retroceso. Mientras ms alto sea el
nivel de la corriente, tanto ms alto ser el umbral de dolor. Observe que un animal muri durante la
operacin quirrgica y no fue remplazado. Suponga que existen suficientes fundamentos tericos y
experimentales para utilizar una hiptesis con cierta direccin.
Lesiones en el
rea neutral
Grupo control
Grupo 1

Lesiones en el
Tlamo grupo
Experimental
Grupo 2

X1
0.8
0.7
1.2
0.5
0.4
0.9
1.4
1.1

X2
1.9
1.8
1.6
1.2
1.0
0.9
1.7
hiptesis de

Pgina

87

a) Cul es la
investigacin?
b) Cul es la hiptesis nula?
c) Cul es la conclusin? Utilizando =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

Ejercicio 6.- Un profesor quiere encontrar la mejor forma de presentar un importante tema frente al
grupo que tiene a su cargo. Para eso puede escoger una de las 3 opciones siguientes: 1) dar clase, 2)
dar clase y asignar una lectura complementaria o 3) proyectar una pelcula y asignar una lectura
complementaria. El decide hacer un experimento para evaluar las tres opciones. Entonces solicita 27
voluntarios de su grupo y asigna aleatoriamente 9 a cada una de las tres condiciones. Bajo la condicin
1, el de clase a los estudiantes. Bajo la condicin 2, el da la clase y el asigna la lectura complementaria.
Bajo la condicin 3, los alumnos presentan una pelcula acerca del tema y realizan la misma lectura
complementaria que los estudiantes de la condicin 2. Despus se aplica a los alumnos un examen
sobre la materia. Se obtuvieron los siguientes datos (porcentaje de respuestas correctas):

Condicin 1,
Clase

Condicin 2
Clase +
Lectura

Condicin 3
Pelcula
+Lectura,

X1
92
86
87
76
80
87
92
83
84

X2
86
93
97
81
94
89
98
90
91

X3
81
80
72
82
83
89
76
88
83

Pgina

88

a) Cul es la hiptesis de investigacin?


b) Cul es la hiptesis nula?
c) Cul es la conclusin? Utilizando =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Dra. Fabiola Gonzlez Betanzos

PRUEBAS NO PARAMTRICAS
U de Man-Whitney
(Para muestras independientes o grupos no relacionados)
U de Mann-Whitney para muestras independientes se debe usar en diseos
independientes cuando las condiciones se aplican a participantes distintos. Como cada
participante realiza slo una condicin, no es posible comparar los resultados de ambas
condiciones para cada participante, sino verificar diferencias entre las condiciones.
Es una prueba NO paramtrica que analiza el grado de separacin entre las muestras.
Para cualquier anlisis, contamos con dos valores que indican el grado de separacin.
Caractersticas:
Niveles de medicin ordinal.
Para muestras no relacionadas o independientes (grupos diferentes).
Diferencias entre condiciones.
Participantes distintos en cada grupo.
Es para dos grupos solamente, por lo tanto, son dos condiciones.
Lgica de la prueba
Esta prueba compara el orden de los rangos que se obtienen al ordenar las puntuaciones de
ambas muestras asignando el rango 1 a la puntuacin menor y as sucesivamente. Con base en
estos rangos, se obtienen dos valores de U, uno para cada muestra y para la prueba de hiptesis
se toma el ms pequeo.
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la diferencia no se
deba al azar (que la diferencia sea estadsticamente significativa)

Procedimiento para calcular U de Man-Whitney


1.- Ordene por rangos todos los puntajes de ambos grupos como si se tratar, de un solo
conjunto de datos (se juntan los grupos).
Nota: en el caso de que existan valores repetidos, el rango que les corresponde es igual
al promedio de los rangos, es decir: la suma de los lugares asignados de manera
secuencial entre el nmero de veces que se repite cada nmero.

2+3+4+5
= 3.5
4
6 + 7 + 8 + 9 + 10
=8
5
11 + 12
= 11.5
2

Estadstica Inferencial

89

RANGO
1
2
3 3.5
4
5
6
7
8
8
9
10
11
11.5
12
13

Pgina

VALOR
0
1
1
1
1
2
2
2
2
2
3
3
4

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

2.- Cada uno de los rangos se debe colocar en la columna correspondiente, 1 para el
grupo 1 y 2 para el segundo grupo. Una vez asignados los rangos se suma por separado
los totales de los rangos.
3.- Obtenga el total y el promedio de los puntajes de las 2 condiciones.
4.- Calcular en el valor de U y U para cada grupo, sustituyendo en la frmula:
( + 1)
= 1 2 +

2
Dnde:
1 = Nmero de participantes para la condicin 1.
2 = Nmero de participantes para la condicin 2.
= Suma del total de los rangos para la condicin.
( + )

( + )
= +

El valor de Uobtenido ser el valor de U ms bajo que se obtenga.


= +

5.- Se busca el valor de tabla de U en la tabla 5 considerando el tipo de prueba (una cola
o dos colas), el nivel de significancia (=0.05 o =0.025) y utilizando el nmero de casos
de cada grupo (1 2 ).
Para obtener el valor de U crtica, se utiliza el menor de los dos que aparecen (Ej. 13 y 51),
estos valores son los mismos para el tipo de prueba (una cola o dos colas) para cada
nivel de significancia que indica la tabla. Una vez hecho esto, se debe elegir el valor de
U ms bajo y compararlo con el valor de U en la tabla tambin ms bajo.
Regla de decisin
Si el valor obtenido es menor o igual al valor crtico o de tabla se acepta la hiptesis de
investigacin H1 .

Pgina

90

Si obtenido crtica se rechaza la H0 y se acepta H1


Si obtenido > crtica se rechaza la H1 y se acepta H0

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

91

Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 5)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

92

Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 5) continuacin.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJEMPLO
1. Queremos saber cul es el efecto de diferentes tipos de material escrito sobre la
memoria. Tenemos 2 grupos de 6 participantes cada uno. Al grupo A se le pide
que se aprenda de memoria un material sin sentido y al grupo B un material con
sentido. La memoria se medir por el nmero de ideas recordadas predecimos
que los puntajes de recuerdo sern ms altos para la condicin B.
Redactar la conclusin con un nivel de significancia = 0.05
H1: El grupo B con el material con sentido recordar ms que el grupo A.
H0: El grupo B con el material con sentido recordarn igual que el grupo A.
Condicin A
(material
s/sentido)
3
4
2
6
2
5
x = 22 , X= 3.6

Rango A
3
4
1.5
7.5
1.5
5.5
T1=23
= 1 2 +

U = (6)(6) +

6(6+1)

U = (6)(6) +

Rango B
11
9
5.5
12
7.5
10
T2=55

1.5
1.5
3
4
5.5
5.5
7.5
7.5
9
10
11
12

1 (1 + 1)
1
2

23 = 34

2
6(6+1)
2

Condicin B
(material
c/sentido)
9
7
5
10
6
8
x = 45 , X= 7.5

2
2
3
4
5
5
6
6
7
8
9
10

55 = 2

El valor de Uobtenida = 2
Se obtiene el valor de Utabla = 7
Se checa la regla de decisin
Si 2 7 se rechaza la H0 y se acepta H1

Pgina

93

CONCLUSIN:
Se encontraron diferencias estadsticamente significativas entre el grupo que record
el material con sentido y el grupo que record el material sin sentido encontrndose
puntajes ms altos en el grupo que aprendi material con sentido. U = 2(6,6, p <
0.05).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

SPSS
Para realizar el anlisis de datos para la prueba U de Mann-Whitney en
SPSS ocupamos definir dos variables, la variable dependiente (Ej.
Memoria) y otra la variable categrica (Ej. material) una vez declaradas
las variables y capturados los valores para cada una de ellas, nos vamos
al men
Analizar/Pruebas no paramtricas /2 muestras
independientes.

Pgina

94

En la ventana pruebas para dos muestras independientes en el apartado de Lista


contrastar variables
agregamos
la
variable dependiente
(Ej. memoria) y en la
variable
de
agrupacin se agrega
la variable categrica
(Ej. Material) en el
botn de definir
grupos ponemos los
nmeros que le
declaramos en los
valores de la variable
(Ej. 1 y 2).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Despus se selecciona el tipo de prueba U de Mann-Whitney. En el botn de


Opciones seleccionar descriptivos, dar clic en continuar y por ultimo aceptar.
En el visor de resultados obtendrs
un cuadro como el siguiente en el cual
debers identificar el valor de U y el nivel de
error o significancia.
Regla de decisin para la tabla de
resultados en SPSS:
Si el nivel de significancia (Sig. Asintt
(bilateral)) es menor o igual a 0.05, se
rechaza la hiptesis nula.
Sig. Asintt (bilateral) es a 0.05 se rechaza
la hiptesis nula

Pgina

95

CONCLUSIN:
Se encontraron diferencias estadsticamente significativas entre el grupo que record
el material con sentido y el grupo que record el material sin sentido encontrndose
puntajes ms altos en el grupo que aprendi material con sentido. U = 2(6,6, p <
0.05)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJERCICIOS DE TAREA

1.- Un investigador predijo que una serie de palabras presentadas en la parte izquierda
de una pantalla se reconoceran ms rpidamente que si se presentaban en la parte
derecha, debido a la direccin de lectura de izquierda a derecha en espaol. La medida
fue el tiempo necesario para reconocer las palabras. Los resultados son los siguientes:
Redactar la conclusin con un nivel de significancia = 0.05.
H0: La serie de palabras presentadas en la parte izquierda de una pantalla se
reconoceran de igual manera que si se presentaban en la parte derecha.
H1: La serie de palabras presentadas en la parte izquierda de una pantalla se
reconoceran ms rpidamente que si se presentaban en la parte derecha.
Condicin A
Condicin B
Rango
Rango
(presentacin parte
(presentacin parte
A
B
izquierda)
derecha)
9
8
3
5
2
7
6
20
1
11
5
6
x = , X=
T1=
x = , X=
T2=
Nota: un Tx (total de categoras) menor representa un reconocimiento de palabras ms
rpido.

Pgina

96

1. Redacte la hiptesis de investigacin


2. Obtenga el valor de 2 y 2
3. Redacte una conclusin, con un nivel de significancia =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

2.- Alguien le ha dicho a usted que los hombres son ms hbiles para el razonamiento
abstracto que las mujeres. Usted reacciona con escepticismo y decide poner a prueba
esa idea por medio de una hiptesis no direccional. Para eso selecciona al azar a ocho
mujeres de una clase de primer ao de universidad, y lo somete a una prueba de
razonamiento abstracto. Una calificacin ms alta refleja mayor destreza para el
razonamiento abstracto. De esta manera ha obtenido los siguientes datos:
H0: Los hombres y las mujeres tienen diferente nivel de destreza para el razonamiento
abstracto.
H1: Los hombres son ms hbiles para el razonamiento abstracto que las mujeres.
Condicin A
Rango
Condicin B
Rango B
Hombres
A
Mujeres
70
82
86
80
60
50
92
95
84
98
65
85
74
90
94
75
x = , X=
T1=
x = , X=
T2=

Pgina

97

1. Redacte la hiptesis de investigacin


2. Obtenga el valor de 2 y 2
3. Redacte una conclusin, con un nivel de significancia =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Prueba de Rangos de Wilcoxon (W)


(Para muestras relacionadas)
Esta prueba pertenece a las pruebas no paramtricas de comparacin de dos muestras
relacionadas, toma en cuenta la magnitud de los puntajes de diferencia. En los diseos
relacionados los mismos participantes son expuestos a las dos condiciones. Cada
participante genera un par de resultados, uno para cada condicin. Esto permite hacer
una comparacin directa entre los resultados de cada participante bajo las dos
condiciones. Como cada participante tiene un par de resultados, uno para cada
condicin, se le puede calcular las diferencias entre estos pares de resultados.
La finalidad de la prueba Wilcoxon (para muestras relacionadas) es comparar el nmero
de categoras con signo positivo y negativo bajo las dos condiciones. Es posible calcular
las diferencias en los resultados para cada participante. Si slo hubiera diferencias
aleatorias entre las condiciones, como establece la hiptesis nula, las diferencias
positivas y negativas sern aproximadamente iguales
Caractersticas:
Niveles de medicin ordinal.
Para muestras relacionadas.
Mismos participantes o participantes igualados (caractersticas similares)
Dos mediciones (momentos).
Verifica diferencias pronosticadas entre dos condiciones experimentales.
Lgica de prueba
Tiene como objetivo comparar las diferencias entre cada par de puntajes, dando mayor peso a
las diferencias ms grandes, de tal manera que se puede obtener el signo de las diferencias y
ordenarlas en trminos de su tamao absoluto.

Procedimiento para calcular el valor de W


1.- Calcular la diferencia (d) entre cada par de resultados, asignando signos positivos o
negativos. Esto es, reste los resultados de la Condicin 1 (A), a los resultados de la
Condicin 2 (B).
d= (A-B)

Pgina

98

2.- Clasifique las diferencias (d) de menor a mayor. A estas diferencias se les debe asignar
un rango ordenado en el cual no se debe considerar el signo de la diferencia, deber
empezarse con el valor ms pequeo asignndole el valor 1. No deben considerarse las
diferencias iguales a 0 (empates), cuando esto sucede se debe ajustar el nmero de
participantes a: N-1, por cada empate.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Condicin 1
A
3
3
2
2
2
2
1

Condicin 2
B
4
2
1
1
0
2
3

d
-1
1
1
1
2
0
-2

Rango
ordenado
1
2
3
4
5
Empate
6

Rangos
Positivos

Rangos
Negativos
2.5

2.5
2.5
2.5
5.5
0
13

5.5
8

Nota: en el caso de que existan valores repetidos, el rango que les corresponde es igual
al promedio de los rangos, es decir: la suma de los lugares asignados de manera
secuencial entre el nmero de veces que se repite cada nmero.
3.- Aplique el signo de la columna (d) a las columnas rangos positivos y negativos.
Fjese en los signos positivos y negativos en las columnas de rango positivo y negativo.
4.- Calcule la suma de las categoras con signo positivo y signo negativo, por separado.
5.- El total de los rangos positivo o negativo, el menor es Wobtenido.
6.- Calcule el nmero de participantes N (sin contar los que tuvieron empate). N= 7-1
=6
7.- Obtenga W tabla, en tabla 6. Se busca el valor crtico de W en la tabla considerando el
tipo de prueba (una cola o dos colas), el nivel de significancia (=0.05 o =0.025 etc.) y
utilizando N (nmero de participantes).
Regla de decisin
Si el valor obtenido es menor o igual al valor crtico o de tabla se acepta la hiptesis de
investigacin H1.

Pgina

99

Si obtenido crtico se rechaza la H0 y se acepta H1


Si obtenido > W crtico se rechaza la H1 y se acepta H0

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

100

Tabla de varios Niveles de Significancia para Wilcoxon (W) (tabla 6)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

101
Pgina
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJEMPLO
1. Se desea probar si hay diferencias en el nivel de estrs laboral de los trabajadores
de una empresa antes y despus de la implementacin de un programa de
mejoramiento del ambiente laboral; el nivel de estrs se midi en una escala de
0= nada, 1= bajo, 2=medio, 3= alto y 4=muy alto, las calificaciones se muestran a
continuacin:
Participa
ntes

Condicin 1
Antes

Condicin 2
despus

3
3
2
2
2
2
1

4
2
1
1
0
2
3

-1
1
1
1
2
0
-2

1
2
3
4
5
6
7

Rango
ordenad
o
1
2
3
4
5

Rangos
Positivos

Rangos
Negativo
s
2.5

2.5
2.5
2.5
5.5

6
13

5.5
8

Redactar la conclusin con un nivel de significancia = 0.05.


H1= Existen diferencias en el nivel de estrs laboral de los trabajadores de una empresa
antes y despus de la implementacin de un programa de mejoramiento del ambiente
laboral.
H0= No Existen diferencias en el nivel de estrs laboral de los trabajadores de una
empresa antes y despus de la implementacin de un programa de mejoramiento del
ambiente laboral.
El valor de Wobtenido = 8
Se obtiene el valor de Wcrtico= 1
N= 7-1 =6
Se checa la regla de decisin
Si 8 > 1

Pgina

CONCLUSIN:
No Existen diferencias en el nivel de estrs laboral de los trabajadores de una empresa
antes y despus de la implementacin de un programa de mejoramiento del ambiente
laboral. W= 1(6, > 0.05)

102

Se rechaza la H1 y se acepta H0

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

SPSS

Para realizar el anlisis de datos con la prueba de Rangos de


Wilcoxon en SPSS ocupamos definir dos variables, una para
cada condicin, una vez declaradas las variables y capturados
los valores para cada una de ellas, nos vamos al men
Analizar/Pruebas no paramtricas /2 muestras relacionadas.
En la ventana Pruebas para dos muestras relacionadas
coloque las variables al cuadro contrastar pares: en el men
Opciones seleccionar descriptivos, dar clic en continuar y por
ltimo en aceptar.

identificar el valor de W y el nivel de error o significancia.


Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

cuadro como el siguiente


en el cual debers

103

En el visor de
resultados
obtendrs
un

Regla de decisin para la tabla de resultados en SPSS:


Si el nivel de significancia (Sig. Asintt (bilateral)) es menor o igual a 0.05, se rechaza la
hiptesis nula.
Sig. Asintt (bilateral) es a 0.05 se rechaza la H0 aceptamos la H1
Sig. Asintt (bilateral) es > a 0.05 se rechaza la H1 aceptamos la H0
(ejercicio. 0.589 > 0.05).

Pgina

104

CONCLUSIN:
No Existen diferencias en el nivel de estrs laboral de los trabajadores de una empresa
antes y despus de la implementacin de un programa de mejoramiento del ambiente
laboral. W= 1(6, > 0.05)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJERCICIOS DE TAREA

1.- Un destacado grupo ecolgico planea realizar una campaa activa para fomentar la
conservacin de la flora y fauna silvestre en su pas. Como parte de la campaa, piensan
exhibir una pelcula producida con el fin de promover actitudes ms favorables hacia la
conservacin de la vida silvestre. Antes de exhibirla a todo el pblico, los promotores de
la campaa desean evaluar los efectos de la pelcula. Para eso se elige al azar a un grupo
de 10 participantes y se les proporciona un cuestionario que mide la actitud individual
hacia la conservacin de la vida silvestre. A continuacin, se les proyecta la pelcula y
despus de la exhibicin contestan de nuevo el cuestionario de actitudes. ste tiene 50
puntos posibles y cuanto ms alta sea la puntuacin, tanto ms favorable ser la actitud
hacia la conservacin de la vida silvestre. Los resultados se presentan en la siguiente
tabla:
H0=
Participa
ntes
1
2
3
4
5
6
7
8
9
10

Actitud
Antes Despus
40
44
33
40
36
49
34
36
40
39
31
35
30
27
36
42
24
35
20
28

Rango
ordenado

Rangos
Positivos

Rangos
Negativos

Pgina

105

1. Redacte la hiptesis de investigacin


2. Obtenga el valor de y
3. Redacte una conclusin. Utilice un nivel de significancia =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

2.- Un investigador quiere determinar si la dificultad del material que han de aprender afecta el
nivel de ansiedad de los estudiantes universitarios. A cada uno de los miembros de una muestra
aleatoria de 12 alumnos se le asigna ciertas tareas de aprendizaje que se clasifican como fciles
y difciles. Antes que los estudiantes inicien cada tarea, se les presentan algunos ejemplos como
muestra del material que van a aprender. A continuacin, se mide el nivel de ansiedad que
mostraron los alumnos, mediante un cuestionario adecuado. De esta manera, se mide el nivel
de ansiedad antes de cada tarea de aprendizaje. Mientras ms alta sea la clasificacin, mayor
ser el nivel de ansiedad. Los datos se presentan en la siguiente tabla.

H0=
Participa
ntes
1
2
3
4
5
6
7
8
9
10
11
12

Ansiedad
Tareas Tareas
difciles fciles
48
40
33
27
46
34
42
28
40
32
27
24
31
33
42
39
38
31
34
39
38
29
44
34

Rango
ordenado

Rangos
Positivos

Rangos
Negativos

Pgina

106

1. Redacte la hiptesis de investigacin


2. Obtenga el valor de y
3. Redacte una conclusin. Utilice un nivel de significancia =0.05, 2 colas.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Kruskal-Wallis (H)
(Para muestras independientes)
Esta prueba debe usarse para diseos independientes cuando se aplican tres o ms
condiciones a participantes distintos. Como estos participantes son expuestos slo a una
de las condiciones para cada participante, todos los resultados de las tres condiciones
se deben clasificar de manera conjunta.
El objetivo de esta prueba es comprobar diferencias pronosticadas entre 3 o ms
condiciones experimentales a participantes distintos y las variables son ordinales.
Caractersticas:
Niveles de medicin ordinal.
Para 3 o ms grupos diferentes o no relacionado (participantes distintos).
Cuando son diferentes tratamientos o condiciones.
Muestras pequeas.
Lgica de prueba
La prueba compara los rangos obtenidos por cada uno de los grupos analizados, ordenando los
puntajes de la muestra total de menor a mayor. Suma Los rangos obtenidos por cada
submuestra y mediante la comparacin de ellos, haciendo uso de una frmula, obtiene el
estadstico H.

Procedimiento para calcular el valor H


1.- Ordene todos los puntajes de todos los grupos en una sola serie de rangos,
asignndole al puntaje ms bajo el nmero 1 y as sucesivamente.
2.- Obtenga la suma de los puntajes y de los rangos para cada condicin.
3.- Calcular el valor de Hobtenida sustituyendo en la frmula:
12
2
= [
] 3 ( + 1)
( + 1)

= Nmero total de participantes.


= Nmero de participantes en cada grupo.
= Suma de los rangos para cada condicin.
2 = Cuadrado de la suma de los rangos para cada condicin.
4.- Calcule los grados de libertad con la siguiente frmula
gl= C 1
= Nmero de condiciones

Pgina

107

5.- Se busca el valor crtico en la tabla de chi- cuadrada.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Regla de decisin
Si el coeficiente obtenido es mayor o igual al coeficiente de tabla se acepta la hiptesis
de investigacin.
Si obtenido crtico se rechaza la H0 y se acepta H1
Si obtenido < crtico se rechaza la H1 y se acepta H0

Pgina

108

Tabla de varios Niveles de Significancia para H (tabla 7)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

109

Tabla de vario Niveles de Significancia para H (tabla 7) continuacin

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJEMPLO
Un investigador quera averiguar el efecto que tienen distintos tipos de instrumentos en
la solucin de problemas. Al primer grupo se les dieron instrucciones escritas, a un
segundo grupo se les hizo una demostracin de cmo solucionar el problema pero no
se les dieron instrucciones escritas y al tercer grupo se les hizo la demostracin y adems
se les dieron instrucciones escritas.
Posteriormente se les pidi a los tres grupos que solucionaran el problema. Los puntajes
se obtuvieron contando el nmero de equivocaciones en los movimientos. Los puntajes
fueron los siguientes: =0.05
Grupo
1
20
27
19
23
89

Rango
1
3.5
9
1.5
6
20
400

Grupo
2
25
33
35
36
129

Rango 2
7.5
10
11
12
40.5
1640.25

Grupo
3
19
20
25
22
86

Rango 3
1.5
3.5
7.5
5
17.5
306.25

19
19
20
20
22
23
25
25
27
33
35
36

H1= Hay diferencias entre los instrumento que ayudan a la solucin de problemas.
H0= No existen diferencias entre los instrumento que ayudan a la solucin de
problemas.

1
2
3
4
5
6
7
8
9
10
11
12

12
2
= [

] 3 ( + 1)
( + 1)

12
2
= [

] 3 (12 + 1)
12(12 + 1)

= 12
= 1= 4

2 =4

3 = 4

= 1 = 20

2 = 40.5

3 =17.5

2 = 12 = 400 22 = 1640.25
12

[12(13)

400
4

1640.25
4

32 = 306.25

306.25
4

)] 3 (13) = (0.077)(586.63)-3(13) = 45.17

39=6.17

CONCLUSIN:
Existen diferencias entre los instrumentos que ayudan a la solucin de problemas (H=
6.12, gl=2, p<0.05).
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

gl= C-1 = 3-1 =2

110

= 6.17 > = 5.65 rechazamos Ho

SPSS
Para realizar el anlisis de datos para la prueba Kruskal Wallis en SPSS ocupamos definir
dos variables, la variable dependiente (Ej. solucin) y la variable categrica (Ej. Tipo
Instrumento) a la cual se le declara 3 valores, una vez declaradas las variables y
capturados los valores para cada una de ellas. Posteriormente se analizan los datos en
el men /Pruebas no paramtricas /k muestras independientes.

En la ventana
pruebas para
varias muestras
independientes
en el cuadro lista contrastar variables enviar la variable dependiente (Ej. Solucin) y
la variable categrica (Ej. Tipo Instrumento) a la variable de agrupacin, y en el botn
definir grupos se indican el valor mnimo y mximo de las condiciones (Ej.1 y 3).

Pgina

En el visor de resultados obtendrs un cuadro como el siguiente en el cual debers


identificar el valor de H y el nivel de error o significancia.

111

En el tipo de prueba seleccionar H de Kruskal-Wallis. En boton de opciones


seleccionar descriptivos, dar click en continuar y por ltimo en aceptar.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

CONCLUSIN:
Existen diferencias entre los instrumento que ayudan a la solucin de problemas (H=
6.19, gl=2, p<0.05).

112

Regla de decisin para la tabla de resultados en SPSS:


Si el nivel de significancia (Sig. Asintt (bilateral)) es menor o igual a 0.05, se rechaza la
hiptesis nula.
Sig. Asintt (bilateral) es a 0.05 se rechaza la H0 aceptamos la H1
Sig. Asintt (bilateral) es > a 0.05 se rechaza la H1 aceptamos la H0
(ejercicio. 0.045 < 0.05).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

113
Pgina
Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJERCICIOS DE TAREA
En un hospital se desea probar si existen diferencias en el nivel de estrs entre
enfermeras de terapia intensiva Gpo1, enfermeras de cirugas Gpo2, y enfermeras de
urgencias Gpo3; el nivel de estrs se midi en una escala de 0=nada, 1 = bajo, 2=medio,
3=alto y 4=muy alto, las calificaciones se muestran a continuacin:
H0=
Grupo
1
3
2
1
1
0
2
1

Rango
1

Grupo
2
3
3
4
4
2
2
1

Rango
2

Grupo
3
4
3
2
4
3
4

Rango 3

N=
n1=
n2=
n3=

Pgina

114

1. Redacte la hiptesis de investigacin


2. Obtenga el valor de y
3. Redacte una conclusin. Utilice un nivel de significancia =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

2.- Un asesor empresarial est realizando una investigacin en el rea de capacitacin


gerencial. Existen dos estilos gerenciales eficaces: uno est orientado a las personas y el
otro se orienta a las tareas. Los trabajos bien definidos y estticos son ms adecuados
para los gerentes orientados a las personas mientras que los trabajos cambiantes y de
reciente creacin son idneos para los gerentes que tienen una orientacin dirigida a
las tareas. El experimento en cuestin tiene como objetivo investigar qu es mejor:
tratar de capacitar a los gerentes en ambos estilos o acoplar a los gerentes con los
trabajos para los que son apropiados sin capacitarlos en ningn otro estilo. El
experimento implica tres condiciones: Condicin 1, los participantes reciben
capacitacin en los dos estilos gerenciales. Condicin 2, los participante no reciben
capacitacin adicional. Condicin 3, es de control y en ella los participantes no reciben
capacitacin adicional alguna y son asignados a nuevos trabajos. Despus que se han
desempeado durante 6 meses en sus nuevos trabajos cada uno de los oficiales es
calificado de acuerdo a su rendimiento. Los datos se presentan a continuacin:
H0=
Capacitacin

Rango
1

65
84
87
53
70
85
56
63

Sin
capacitacin
90
85
76
87
92
86
93

Rango
2

Control

Rango 3

n1=

55
82
71
60
52
81
73
57
2

N=

n2=
n3=

Pgina

115

1. Redacte la hiptesis de investigacin


2. Obtenga el valor de y
3. Redacte una conclusin. Utilice un nivel de significancia de =0.05

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Prueba de Friedman ( )
(Para muestras relacionados)
Se utiliza con diseos relacionados donde todas las condiciones experimentales se
aplican a los mismos participantes. Se utiliza cuando las tres condiciones se aplican a los
mismos participantes. Cada participante genera tres resultados, uno para cada una de
las tres condiciones. Esto permite hacer una comparacin directa entre los tres
resultados de cada participante con cada una de las tres condiciones. Los resultados
correspondientes a las distintas condiciones estn relacionados. Pero, como hay tres
condiciones, no es posible calcular las diferencias entre dos condiciones, como hacamos
en el caso de la prueba Wilcoxon.
El objetivo es comprobar si el total de categoras es distinto para cada una de las
condiciones. Si existen diferencias aleatorias entre los totales de categoras para las tres
condiciones, como establece la hiptesis nula.
Caractersticas:
Niveles de medicin ordinal.
Para 3 o ms grupos relacionados.
3 o ms condiciones a los mismos participantes.
Lgica de la prueba
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la diferencia no se
deba al azar (que la diferencia sea estadsticamente significativa)

Procedimiento para calcular el valor de


1.- Ordene por rangos los puntajes para cada persona a lo largo de cada fila (de
manera horizontal, asigne 1 al puntaje ms bajo y as sucesivamente si hay valores
iguales se promedian sus lugares)
2.- Sume los totales de los puntajes y los rangos para cada condicin y obtenga el
promedio de cada uno.
3.- Encuentre el valor de con la siguiente frmula:
12

2 = [(+1) 2 ] 3( + 1)
= Nmero de condiciones
= Nmero de personas
= Suma de los rangos para cada condicin
2 = Cuadrados de la suma de los rangos
2 = Suma de los cuadrados de TC
4.- Calcule los grados de libertad con la siguiente frmula
= Numero de condiciones

Pgina

5.- Se busca el valor de tabla 2 en la tabla 7 de Chi- cuadrada.

116

gl= C 1

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Regla de decisin
Si el coeficiente obtenido es mayor o igual al coeficiente de tabla se acepta la hiptesis
de investigacin.
Si 2 obtenido 2 crtico se rechaza la H0 y se acepta H1
Si 2 obtenido < 2 crtico se rechaza la H1 y se acepta H0

Pgina

117

Tabla de varios Niveles de Significancia para Friedman ( ) (tabla 8)

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

Pgina

118

Tabla de varios Niveles de Significancia para Friedman ( ) (tabla 8) continuacin

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJEMPLO
1. Un editor que desea producir una serie de libros para nios, quiere seleccionar
entre tres tipos de ilustraciones la ms atractiva. Se le pide a 8 nios que ordenen
las tres ilustraciones en una escala de cinco puntos que va desde 1= nada buena
hasta 5= sumamente buena. Y se obtuvieron los siguientes puntajes:
H0=
Participantes

C1
Ilustracion1
2
1
3
3
2
1
5
1
18

Rango
C2
Rango
C3
1
Ilustracion2
2
Ilustracion3
1
1
5
3
4
2
1
5
3
3
3
1
5
2.5
5
4
2
5
3
2
5
1
3
2
5
6
1
4
2.5
4
7
3
3
2
2
8
1
4
3
3

11
34
21
28
121
441
Nota: Se asignan rangos a cada participante de manera horizontal

Rango
3
2
2
2.5
1
3
2.5
1
2
16
256

H0 = Los nios no ven diferencias entre las ilustraciones ms atractivas que otras.
H1 = Los nios consideraran unas ilustraciones ms atractivas que otras.
Sustituyendo valores en la formula.
12

12

12

2 = [8(3)(3+1) 818]- 3(8)(3+1) = 24(4) (818) 24(4) = 96 (818) 96 = 0.125(818) -96


= 102.25 96 = 6.25
= Nmero de condiciones
= Nmero de personas
= Numero de rangos para cada condicin
2 = Cuadrados de TC
2 = Suma de los cuadrados de TC

C=3
N=8
T1= 11 T2= 21 T3= 16
T21= 121 T22= 441 T23= 256
2 = 818

2 obtenido= 6.25
Obtener valor de Friedman en tabla (tabla 7)
gl= 3-1 = 2

Pgina

CONCLUSIN:
El investigador predijo que los nios consideraran unas ilustraciones ms atractivas que
otras.
( 2 = 6.25, gl=2, p< 0.05)
Estadstica Inferencial

119

2 tabla =6.75

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

SPSS
Para realizar el anlisis de datos con la prueba de Friedman en SPSS ocupamos definir
tres variables una para cada condicin, una vez declaradas las variables y capturados
los valores para cada una de ellas nos vamos al men Analizar/Pruebas no paramtricas
/k muestras relacionadas.

Pgina

120

En
la
ventana
pruebas para varias
muestras
relacionadas
se
envan todas las
variables a analizar
al cuadro variables
de contraste en el
botn estadsticos seleccionar descriptivos, dar clic en continuar, en tipo de prueba
seleccionar Friedman y por ltimo en aceptar.

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

En el visor de resultados obtendrs un


cuadro como el siguiente en el cual
debers identificar el valor de 2 y el
nivel de error o significancia.
Regla de decisin para SPSS
Si el nivel de significancia (Sig. Asintt (bilateral)) es menor o igual a 0.05, se rechaza la
hiptesis nula.

Pgina

121

Sig. Asintt (bilateral) es a 0.05 se rechaza la H0 aceptamos la H1


Sig. Asintt (bilateral) es > a 0.05 se rechaza la H1 aceptamos la H0
(ejercicio. 0.036 < 0.05).

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

EJERCICIOS DE TAREA
1. Se desea probar que hay diferencias en el nivel de estrs laboral en trabajadores
de una empresa antes y despus de un taller sobre el manejo del estrs. Se midi
en una escala de 0= nada, 1=bajo, 2=medio,3=alto,4=muy alto, las calificaciones
se muestran a continuacin:
H0=
Participantes
1
2
3
4
5
6
7

C1
antes

Rango
1

3
3
2
4
3
3
1

C2
Despus
2
1
1
2
1
0
2

Rango
2

C3
1mes
despus
3
2
1
2
2
1
4

Rango 3

1. Redacte la hiptesis de investigacin


2. Obtenga el valor de 2 obtenido
3. Redacte una conclusin. Utilice un nivel de significancia de =0.05

REFERENCIAS
Wayne,D. (2011) Bioestadstica: Base para el anlisis de las ciencias de la salud. Cuarta edicin
Ed. Limusa.

Pgina

122

http://platea.pntic.mec.es/~anunezca/ayudas/probabilidad/probabilidad.htm

Estadstica Inferencial

Mtra. Joanna Koral Chvez Lpez


Mtra. Mnica Fulgencio Jurez

S-ar putea să vă placă și