Documente Academic
Documente Profesional
Documente Cultură
Facultad de Psicologa
CICLO 14-15
Mtra. Joanna Koral Chvez Lpez
NDICE
INTRODUCCIN ................................................................................................................................... 7
TEORIA DE LA PROBABILIDAD .............................................................................................................. 8
PRUEBA DE HIPTESIS ......................................................................................................................... 9
PROCEDIMIENTO PARA LLEVAR A CABO UNA PRUEBA DE HIPTESIS: ..................................................10
1.- Enunciar la hiptesis nula, la hiptesis de investigacin y definir la direccin de la prueba ( si es de una
cola o de dos colas). ................................................................................................................................. 10
2.- Determinar el nivel de significancia ................................................................................................. 11
3.- Seleccionar el estadstico de prueba y calcular el valor p................................................................... 12
4.- Tomar la decisin de aceptacin o rechazo lo cual implica comparar el valor de p con () .............. 14
5.- Interpretar los resultados obtenidos .................................................................................................. 14
PRUEBAS DE ASOCIACIN...................................................................................................................19
Coeficiente de Correlacin Producto-Momento de Pearson (r)............................................................23
Procedimiento para calcular la r .............................................................................................................. 23
Regla de decisin ..................................................................................................................................... 24
Tabla de varios niveles de significancia del coeficiente de correlacin de Pearson (tabla 1).................. 24
EJEMPLO: s ............................................................................................................................................... 25
SPSS .......................................................................................................................................................... 26
Reporte de resultados de la correlacin Pearson .................................................................................... 27
Coeficiente de Correlacin de Spearman de Rangos Ordenados (rho)...................................................29
Procedimiento: ......................................................................................................................................... 30
Regla de decisin ..................................................................................................................................... 30
Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2) .............. 31
EJEMPLO: .................................................................................................................................................. 32
SPSS .......................................................................................................................................................... 33
Reporte de resultados de la correlacin Spearman ................................................................................. 34
CHI-CUADRADA (X2)............................................................................................................................35
Caractersticas .......................................................................................................................................... 35
Procedimiento para calcular Chi- cuadrada ............................................................................................ 35
Regla de decisin...................................................................................................................................... 36
Grados de libertad.................................................................................................................................... 36
EJEMPLO ................................................................................................................................................... 36
CONCLUSIN ............................................................................................................................................ 37
SPSS .......................................................................................................................................................... 38
REGRESIN LINEAL .............................................................................................................................39
Introduccin ............................................................................................................................................. 39
La recta de regresin ................................................................................................................................ 39
La mejor recta de regresin ..................................................................................................................... 41
Bondad de ajuste...................................................................................................................................... 42
Resumen................................................................................................................................................... 43
EJERCICIOS DE TAREA DE CORRELACIONES ..........................................................................................44
PRUEBAS PARAMTRICAS O DE COMPARACIN .................................................................................47
La prueba t .........................................................................................................................................47
La prueba t de Student relacionada (mismos grupos, muestras dependientes) ....................................50
Cundo utilizarla....................................................................................................................................... 50
Lgica de la prueba .................................................................................................................................. 50
Procedimiento .......................................................................................................................................... 51
Regla de decisin...................................................................................................................................... 51
Como se escriben los resultados de la prueba t para muestras relacionadas ......................................... 51
Tabla de varios niveles de significancia para la prueba t de Student Relacionada (tabla 3) .................. 52
EJEMPLO ................................................................................................................................................... 53
SPSS .......................................................................................................................................................... 53
La prueba t de Student no relacionada (para muestras independientes) ..............................................57
Cundo utilizarla....................................................................................................................................... 57
Lgica de la prueba .................................................................................................................................. 57
Procedimiento .......................................................................................................................................... 58
Regla de decisin...................................................................................................................................... 59
Tabla de varios niveles de significancia para la prueba t de Student No Relacionada (tabla 4) ............. 60
EJEMPLO ................................................................................................................................................... 61
SPSS .......................................................................................................................................................... 62
INTRODUCCIN AL ANLISIS DE LA VARIANZA ....................................................................................66
ANOVA UNIFACTORIAL MUESTRAS INDEPENDIENTES ..........................................................................71
Definicin de varianza. ............................................................................................................................. 71
Uso de ANOVA unifactorial (para muestras independientes). ................................................................ 71
EJEMPLO: .................................................................................................................................................. 72
SPSS .......................................................................................................................................................... 75
NDICE DE TABLAS
Tabla de varios niveles de significancia del coeficiente de correlacin de Pearson (tabla 1)
Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2)
Tabla de varios niveles de significancia para la prueba t de Student Relacionada (tabla 3)
Tabla de varios niveles de significancia para la prueba t de Student No Relacionada (tabla 4)
Tabla de varios niveles de significancia para valores crticos de F (tabla 5)
Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 6
Tabla de varios Niveles de Significancia para Wilcoxon (W) (tabla 7)
Tabla de varios Niveles de Significancia para H (tabla 8)
Tabla de varios Niveles de Significancia para Friedman ()(tabla 9)
Tabla de varios Niveles de Significancia para CHI-CUADRADA (X2) (tabla 10)
INTRODUCCIN
El estudio de determinadas caractersticas de una poblacin se efecta a travs de diversas muestras
que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita.
Una poblacin finita en la que se efecta muestreo con reposicin puede considerarse infinita
tericamente. Tambin, a efectos prcticos, una poblacin muy grande puede considerarse como
infinita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo
con reposicin.
Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada muestra podemos
calcular un estadstico (media, desviacin tpica, proporcin,...) que variar de una a otra. As
obtenemos una distribucin del estadstico que se llama distribucin muestral.
Las dos medidas fundamentales de esta distribucin son la media y la desviacin tpica (tambin
denominada error tpico).
Hay que hacer notar que si el tamao de la muestra es lo suficientemente grande las distribuciones
muestrales son normales y en esto se basarn todos los resultados que alcancemos.
El objetivo que se proponen las tcnicas del anlisis descriptivo es la presentacin y la descripcin de
los datos de nuestra investigacin de la manera ms significativa y eficaz. El anlisis Inferencial va ms
all de la descripcin de los datos; uno de sus objetivos bsicos es hacer afirmaciones acerca de una, o
varias, caractersticas de la poblacin a partir de los datos provenientes de una muestra. Para
generalizar en una poblacin, de manera vlida, los resultados obtenidos en una muestra es necesario
considerar la forma en la que se distribuyen los datos de la muestra e identificar un modelo estadstico
o probabilstico que corresponda al diseo de investigacin utilizado y a las caractersticas de la variable
de inters (continua o discreta), a fin de establecer si las afirmaciones que hacemos de la poblacin
tiene un sustento vlido o son debidas al azar.
Un modelo estadstico es una distribucin que describe la probabilidad de ocurrencia de las variables
aleatorias, es decir, la probabilidad de que la variable X tome cada uno de los valores posibles x, o
P(X=x); esto es: el grado en el cual los resultados que encontramos en una muestra ocurren en realidad
en la poblacin. A esta correspondencia se le denomina funcin de probabilidad. Las distribuciones de
probabilidad pueden representarse mediante una tabla, una grfica o una frmula.
Estadstica Inferencial
Pgina
Cuando se realiza una investigacin, rara vez se extrae ms de una muestra de una determinada
poblacin. Esta muestra nica se convierte en la base a partir de la cual realizamos inferencias acerca
de dicha poblacin. Si extraemos numerosas muestras del mismo tamao utilizando el mismo
procedimiento de muestreo al azar, y calculamos un estadstico, por ejemplo la media o una proporcin
para esa muestra, tendramos mltiples ejemplos de dicho estadstico (Newton y Rudestam ,1999). Las
La mayora de los casos prcticos a los que nos enfrentamos en Ciencias Sociales se refiere a variables
aleatorias cuyas funciones de probabilidad se ajustan a los modelos estadsticos o distribucin de
probabilidades. Existen diferentes tipos de distribuciones de probabilidad. Una forma de clasificarlas es
mediante el tipo de variables: discretas (se cuentan) y continuas (se miden). Para las variables
continuas, la distribucin de probabilidades se denomina funcin de densidad, ya que las
probabilidades corresponden a reas bajo la curva.
diferencias entre las medias de las muestras extradas nos daran una idea acerca de qu tan bien est
funcionando el procedimiento de muestreo empleado. Si este proceso se repite una gran cantidad de
veces obtendramos una distribucin de estas muestras, es decir, una distribucin muestral. En
resumen, las distribuciones mustrales se obtienen a partir de extraer muestras del mismo tamao (n)
elegidas al azar en una poblacin determinada. Cada muestra del mismo tamao nos proporciona una
observacin (dato), es decir, el estadstico muestral (x,, P) que sera incluido en dicha distribucin. La
probabilidad de obtener un estadstico determinado como resultado del azar est contemplado en la
distribucin muestral del estadstico considerado, por lo que con dicha distribucin se puede
determinar la probabilidad que corresponde a cada estadstico calculado y con ello evaluar si implica
que el estadstico observado es un resultado esperado por azar o no. Como puede advertirse, a cada
estadstico le corresponde una distribucin muestral: media, diferencia entre medias, proporciones,
diferencias entre proporciones, varianzas, etc.
Una de las distribuciones mustrales ms importantes en Estadstica es la distribucin normal (z), con
mucho, la ms importante de todas las distribuciones de probabilidad. Su grfica produce la ya conocida
curva en forma de campana. Dicha distribucin posee las siguientes caractersticas:
1. Tiene forma de campana.
2. Es asinttica con respecto al eje X.
3. Es simtrica.
4. El rea total bajo la curva es igual a 1.
5. La mayor parte de los valores se concentran al centro de la distribucin, mientras que en los
extremos se localizan el menor nmero de los casos.
La distribucin normal de probabilidad es, de acuerdo con Smith (1970);
una grfica idealizada de ciertas distribuciones de frecuencias comunes para las cuales n es
muy grande. No necesariamente tiene estas proporciones justas, ella puede ser
considerablemente ms alta y delgada, pero siempre ser simtrica y en forma de campana
se llama curva normal de probabilidad porque describe, entre otras cosas, la distribucin ms
probable de ciertos eventos al azar (p.13)
Estadstica Inferencial
Pgina
TEORIA DE LA PROBABILIDAD
La teora de la probabilidad es la parte de las matemticas que estudia los fenmenos aleatorios Estos
deben contraponerse a los fenmenos determinsticos, los cuales son resultados nicos y/o previsibles
de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua
a 100 grados Celsius a nivel del mar se obtendr vapor. Los fenmenos aleatorios, por el contrario, son
aquellos que se obtienen como resultado de experimentos realizados, otra vez, bajo las mismas
condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por
ejemplo, el lanzamiento de un dado o de una moneda. La teora de probabilidades se ocupa de asignar
un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de
cuantificar dichos resultados y saber si un suceso es ms probable que otro.
Esto quiere decir que cuando la muestra es grande y ha sido elegida al azar, es decir: no seleccionada
propositivamente de acuerdo con ciertos parmetros muy particulares de la investigacin, la
distribucin de los datos tender a ser normal, por tanto, esta aproximacin a la curva normal no
siempre se puede esperar, especialmente cuando la muestra de sujetos es muy pequea.
Muchos fenmenos naturales son aleatorios, pero existen algunos como el lanzamiento de un dado,
donde el fenmeno no se repite en las mismas condiciones, debido a que la caractersticas del material
hace que no exista una simetra del mismo, as las repeticiones no garantizan una probabilidad definida.
En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a
modelos complejos donde no se conocen a priori todos los parmetros que intervienen; sta es una de
las razones por las cuales la estadstica, que busca determinar estos parmetros, no se reduce
inmediatamente a la teora de la probabilidad en s.
El trabajo estadstico se orienta, en gran medida, a la verificacin de nuestra hiptesis de investigacin.
El proceso de comprobacin de una hiptesis tiene como propsito determinar si los efectos
estadsticos observados, calculados para una muestra, son reales en la poblacin o son simplemente
un resultado del error de muestreo. El procedimiento que subyace al proceso de comprobacin de una
hiptesis es la estadstica inferencial. Por medio de ella extraemos conclusiones acerca de una
poblacin con base en los estadsticos obtenidos a partir de una muestra.
Utilizamos la estadstica inferencial con el propsito de validar los datos que hemos obtenido a lo largo
de la investigacin. Nuestro objetivo es llegar a una conclusin con respecto a nuestra hiptesis de
investigacin, lo que nos conducir a llevar a cabo una prueba de hiptesis; as, la hiptesis de
investigacin derivar en una serie de hiptesis estadsticas.
PRUEBA DE HIPTESIS
El propsito de la prueba de hiptesis es ayudar al investigador a tomar una decisin acerca de una
poblacin mediante el examen de una muestra de ella.
A continuacin se presentan conceptos indispensables para comprender la prueba de hiptesis:
Hiptesis: Es una proposicin acerca de una o ms poblaciones. Dicha proposicin se creer cierta si
los datos de la muestra llevan al rechazo de la hiptesis nula.
Hiptesis de investigacin (H1): es la conjetura o suposicin que motiva la investigacin.
Hiptesis nula (H0): se establece de tal forma que pueden ser evaluadas por medio de tcnicas
estadsticas adecuadas. Esta hiptesis se establece con el propsito expreso de ser RECHAZADA. En
consecuencia, el complemento de la conclusin que el investigador desea alcanzar se convierte en el
enunciado de hiptesis nula. En el proceso de prueba, la hiptesis nula se rechaza o no se rechaza. Si la
hiptesis nula no se rechaza, se dir que los datos sobre los cuales se basa la prueba no proporcionan
evidencia suficiente que cause el rechazo. Si el procedimiento de prueba conduce al rechazo, se
concluye que los datos disponibles no son compatibles con la hiptesis nula, pero sirven como apoyo a
alguna otra hiptesis.
Estadstica Inferencial
Pgina
En resumen, es posible establecer las siguientes reglas empricas para decidir qu proposicin se utiliza
como hiptesis nula y cul como hiptesis de investigacin.
d) Las hiptesis nula y de investigacin son complementarias. Es decir, las dos contemplan de
manera exhaustiva todos los valores posibles que los parmetros de suposicin pueden asumir.
Pgina
10
Un aspecto que influye de manera especial en la probabilidad de rechazar o no la hiptesis nula (H0) es
si podemos predecir en qu direccin se ubicar nuestro estadstico muestral en relacin con el
parmetro poblacional. La direccin de la prueba se establece mediante la hiptesis de investigacin
y est determinada por el nmero de colas (una o dos colas) en la curva de distribucin muestral. Para
definir si se trata de una prueba de una o dos colas, es necesario examinar cuidadosamente el objetivo
de investigacin y la hiptesis de investigacin para que a partir de ellos podamos enunciar nuestra
hiptesis de investigacin (H1).
Estadstica Inferencial
Pgina
11
Para controlar el error tipo I se utiliza un nivel de significancia , el cual es el nivel de riesgo que ests
dispuesto a tomar al concluir que la hiptesis nula (H0) es falsa cuando es cierta. La siguiente tabla
muestra los niveles convencionales de significancia que se utilizan tpicamente en la investigacin.
Estadstica Inferencial
Pgina
12
En vista de que la eleccin de la prueba estadstica es una de las tareas ms complejas del proceso de
investigacin, checa el rbol de decisin estadsticas para elegir la prueba adecuada para tu
investigacin.
Estadstica Inferencial
13
Pgina
Estadstica Inferencial
4.- Tomar la decisin de aceptacin o rechazo lo cual implica comparar el valor de p con ()
Si p<(), se rechaza la H0 y se acepta la H1
al nivel confianza 1- ()
p > (), se rechaza la H1 y se acepta H0
La decisin sobre la aceptacin de una hiptesis estadstica est basada en si hay o no suficiente
evidencia para concluir que la hiptesis nula (H0) es falsa. Si la probabilidad del valor obtenido es
mayor que un nivel de significancia especificado, se acepta la hiptesis nula H0; si la probabilidad es
igual o menor al nivel especificado, se rechaza la hiptesis nula (H0) y se acepta la hiptesis de
investigacin (H1).Cuando se acepta la hiptesis nula se concluye que es cierta, pero cuando los datos
la contradicen fuertemente se concluye que es falsa.
5.- Interpretar los resultados obtenidos
Esto implica analizar si los datos obtenidos son congruentes con los antecedentes sealados en el
marco terico o si los contradicen. Adicionalmente deber revisarse la posibilidad de aumentar el
tamao de la muestra si se considera que la inexistencia de una relacin significativa pueda deberse a
un error de muestreo.
Entonces por todo lo anterior la prueba de hiptesis constituye la columna vertebral de nuestro
proyecto de investigacin: ah es donde reside nuestra tesis central, aquello que queremos comprobar.
El inicio del procedimiento de la prueba de hiptesis es establecer una o ms hiptesis (Downie y Heath,
1973).
La primera que se establece es la hiptesis de la no diferencia o hiptesis nula, por ejemplo entre las
medias de dos poblaciones. Esto tambin puede hacerse planteando que las medias de ambas
poblaciones son iguales, o dicho de otra manera, las muestras estudiadas provienen de la misma
poblacin.
Un siguiente aspecto a considerar es el nivel de significacin () que tiene que ver con la seguridad que
queremos tener de no cometer errores al aceptar o rechazar la hiptesis nula. As en un alfa de 5 (0.05),
tenemos 5 posibilidades por cada 100 veces que se extraiga una muestra de una poblacin, de que la
diferencia o no diferencia encontrada sea incorrecta. Si establecemos un alfa de 1 (0.01), el riesgo de
equivocarnos es de uno en cien, si el alfa es menor: 0.001, el riesgo es de uno en mil y as
sucesivamente.
Estadstica Inferencial
Pgina
14
Con mucha frecuencia, nuestros estudios intentan medir el grado de relacin que existe entre dos
variables determinadas. Nos preguntamos, por ejemplo: en qu medida influye el grado de
escolaridad de los padres en el grado de escolaridad alcanzado por los hijos?, o bien, en qu medida
las calificaciones grupales en matemticas estn vinculadas a las calificaciones en ciencias naturales o
al modelo de enseanza del profesor de la asignatura?
Pgina
15
En el proceso de seleccin de la prueba estadstica tenemos dos posibilidades: elegir una prueba
paramtrica o una no paramtrica. Cuando se cumplen determinados criterios (criterios
paramtricos); por ejemplo que los datos se encuentren mnimo en un nivel de medicin intervalar,
que los datos de la muestra hayan sido obtenidos de una poblacin normalmente distribuida, es posible
utilizar una prueba paramtrica. Si los datos no se ajustan a una distribucin normal o si el nivel de
medicin empleado no es por lo menos intervalar, entonces se utilizan pruebas no paramtricas.
Estadstica Inferencial
El Coeficiente de correlacin es el indicador que nos permite examinar, de manera objetiva, la fuerza
y direccin de la relacin entre variables que presentan un fundamento lgico y coherente para su
asociacin, por lo que sus valores se calculan con una direccin de relacin positiva o negativa,
alejndose o acercndose a la unidad.
Entre las pruebas no paramtricas que permiten identificar la fuerza y direccin de la asociacin entre
variables, se encuentra:
Coeficiente de correlacin de rangos ordenados de Spearman (rho): permite explicar la
direccin (positiva o negativa) de una relacin, as como la proporcin de la variacin en los
rangos de Y, explicada por el conocimiento de los valores del rango de X. Aplica slo para
variable de carcter ORDINAL.
Coeficiente de correlacin de Pearson (r): Permite el dimensionar de la magnitud y direccin
de una relacin entre variables medidas a partir de intervalos. La r de Pearson es un coeficiente
de correlacin que mide la estrechez del ajuste de las coordenadas X, Y, alrededor de la lnea de
regresin. Es apropiada para medir la relacin entre variables de INTERVALO/RAZN U
ORDINAL, A mayor valor absoluto de la r de Pearson, las coordenadas estarn ms cercanas a la
lnea, lo que nos indica una mayor asociacin entre las variable.
Prueba de Chi-cuadrada (X2): permite explicar la direccin (positiva o negativa) de una relacin,
as como la proporcin de la variacin en los rangos de Y, explicada por el conocimiento de los
valores del rango de X. Aplica slo para variable de carcter NOMINAL.
Estadstica Inferencial
Pgina
16
La comparacin entre grupos es usualmente empleada en la investigacin social, pues con ello se
comprueba la significancia al evaluar muestras que se incluyen y se excluyen de una situacin
determinada. En el caso de la comparacin de dos grupos se parte de considerar la presencia de un
determinado factor en uno de ellos, mientras que en el otro, ocurre el caso contrario.
En ocasiones, los datos o las condiciones de nuestra investigacin no cumplen o no tenemos elementos
para suponer que cubren estas condiciones (el ms comn es el nivel de medida de los datos).
En esos casos tenemos que recurrir a las pruebas no paramtricas que, aun cuando son menos
potentes, no establecen condiciones para los parmetros de la poblacin de la cual se obtuvieron las
muestras.
El principio bsico de las pruebas no paramtricas es el mismo que el de las pruebas paramtricas:
comparar los resultados obtenidos contra lo esperado por azar. Las pruebas no paramtricas ofrecen
algunas ventajas:
La prueba a utilizar en cada especfico depende del objetivo de la investigacin, en concordancia con
el objetivo de la prueba estadstica, del nivel de medida de los datos, del nmero de muestras y de si
stas son independientes o relacionadas
Pgina
Cuando se realizan prueba de hiptesis, se calcula la probabilidad de que los resultados obtenidos en
una investigacin puedan ser debidos al azar, en el supuesto de que la hiptesis nula sea cierta. Esta
probabilidad es el grado de significacin estadstica (valores menores a 0.05, como 0.04, 0.01 o 0.002)
o valor de p. Basndose en esta probabilidad, se decidir rechazar o no la hiptesis nula. As, cuanto
menor sea el valor de p, menor ser la probabilidad de que los resultados obtenidos se deban al azar y
mayor evidencia habr en contra de la hiptesis nula. Si dicha probabilidad es menor que un valor de p
fijado previamente (habitualmente se toma p<0.05), la hiptesis nula se rechazar. As, cuando el valor
de p est por debajo de 0.05, se afirmar que el resultado es estadsticamente significativo y ser no
significativo en caso contrario.
17
Estadstica Inferencial
Pgina
18
Sin embargo, es importante no olvidar que estamos tomando la decisin de rechazar una hiptesis con
base en los resultados obtenidos en una muestra. Cuando se extrae una muestra existe la probabilidad
de cometer errores. La probabilidad de cometer un error tipo I, es lo que mide precisamente el grado
de significacin p.
Estadstica Inferencial
PRUEBAS DE ASOCIACIN
La correlacin es la forma numrica en la que la estadstica ha podido evaluar la relacin de dos
variables, es decir, mide la dependencia de una variable con respecto de otra variable independiente.
Para poder entender esta relacin tendremos que analizarlo en forma grfica:
edad
peso
15
60
30
75
18
67
42
80
28
60
19
65
31
92
47
15
100
120
1000
1500
2000
Estadstica Inferencial
Pgina
19
Las tcnicas correlacionales nos permiten cuantificar la relacin entre los puntajes obtenidos en las dos
aplicaciones y, de esta manera, medir la confiabilidad test- retest del instrumento. La correlacin sirve
principalmente para averiguar si existe una relacin y para determinar su magnitud (fuerza) y direccin
(si esta es positiva o negativa) de esta.
El signo indica el sentido de la relacin, una correlacin negativa representa una asociacin
inversamente proporcional, es decir, a medida que una variable se incrementa, la otra
disminuye; por otro lado, en una correlacin positiva o directamente proporcional, a medida
que aumenta una, la otra tambin se incrementa.
La magnitud de la relacin est dada por el valor del coeficiente y se interpreta como sigue:
0 hasta 0.299
No hay relacin entre las variables (nula)
0.3 hasta antes de 0.499
La relacin es baja (dbil)
0.5 hasta antes de 0.799
La relacin es moderada
0.8 a 1
hay una correlacin alta (fuerte) entre las variables
La ausencia de asociacin lineal no significa necesariamente que las variables no tengan relacin
entre s. Existen muchas variables con una correlacin de tipo curvilneo y debe ser evaluada de
otra manera.
Una forma grfica de ver la relacin entre variables son las grficas de dispersin o dispersigrama
(grfica de pares de valores X y Y), donde cada punto representa el lugar en que se cruzan las
calificaciones de la primera variable (X) y la segunda variable (Y) para cada participante. Si se traza una
lnea que cruce la mayora de los puntos se puede apreciar el tipo de relacin. Existen varios tipos de
correlacin:
1.- Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra aumenta. La recta
correspondiente a la nube de puntos de la distribucin es una recta creciente.
Pgina
20
Estadstica Inferencial
Grado de Correlacin
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se
pueden dar tres tipos:
1. Correlacin fuerte: la correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.
2. Correlacin dbil: la correlacin ser dbil cuanto ms separados estn los puntos de la recta.
Pgina
21
3. Correlacin nula
Estadstica Inferencial
Regresin Lineal
La regresin consiste en estimar valores de una variable, conociendo ya antes los valores de otra
variable. Es decir, con la regresin se puede conocer una variable a partir de otra. Ejemplo a partir de
la estatura de una persona se conoce su peso; de la capacidad lingstica su comprensin en el estudio,
de su inteligencia su posibilidad de aprobar un examen, etc.
Las variables son: la PREDICTOR y la PREDICTANDO; la INDEPENDIENTE y la DEPENDIENTE.
Los datos se marcan en una grfica de dispersin uniendo los puntos consecuencia de unir en las
coordenadas los valores de las variables X y Y.
Pgina
22
Las coordenadas se usan tambin para ver qu tipo de regresin es, pues puede ser rectilnea, circular,
elptica, etc. Por medio de la representacin en el eje de coordenadas se obtiene la LINEA DE AJUSTE,
lo cual se logra por medio de la ecuacin de la recta.
Estadstica Inferencial
Dnde:
N = nmero de participantes.
X, Y = calificaciones de las variables a relacionar.
XY = Multiplicar X por Y y sumar.
X y Y= Sumar valores de cada variable.
(X) y (Y) = El total de la suma de cada condicin elevado al cuadrado.
X y b = Elevar cada valor al cuadrado y sumarlos.
Procedimiento para calcular la r
1. Calcular la correlacin de Pearson r, sustituyendo en la frmula:
=
( )( )
2
[ 2( ) ][ 2( )2 ]
Pgina
23
2. Se debe buscar el valor de tabla para la correlacin Pearson, para ello se calculan los grados de
libertad (gl = N 1) y se establece el nivel de significancia para probar la H0.
Estadstica Inferencial
Regla de decisin
Si el coeficiente obtenido es mayor o igual al coeficiente de tabla se acepta la hiptesis de
investigacin.
Si obtenido crtico se rechaza la H0 y se aceptaH1
Si obtenido< crtico se rechaza la H1 y se aceptaH0
Pgina
24
Estadstica Inferencial
Autoestima
Y
8
12
26
29
30
31
19
18
28
Y= 201
(Y)2= 40401
X2
Y2
676
576
324
289
324
49
225
400
324
X2=3187
64
144
676
841
900
961
361
324
784
2=
Y 5055
XY
208
288
468
493
540
217
285
360
504
XY= 3363
N=9
()()()
[() ()][()()]
= -0.761
Pgina
25
CONCLUSIN:
Se encontr una relacin estadsticamente significativa, moderada e inversamente proporcional,
entre el puntaje de depresin y el de autoestima en estudiantes de preparatoria (rP = -0.761, p < 0.05)
Estadstica Inferencial
SPSS
Vamos a declarar primero las variables en SPSS
Ahora necesitamos enviar las variables quese deseen correlacionar a la ventana de Variables.
Pgina
26
Despus, seleccionar los Coeficientes de correlacin los cuales pueden ser Pearson dependiendo del
nivel de medicin de las variables.
Estadstica Inferencial
Estadstica Inferencial
Pgina
27
En el presente ejemplo se tiene una significancia de 0.017, menor a 0.05, por lo que se rechaza la
hiptesis nula, entonces: existe una relacin entre el puntaje de depresin y el de autoestima en
estudiantes de preparatoria. Adems esta relacin es moderada e inversamente proporcional (tiene
signo negativo).
Correlaciones
Pgina
28
CONCLUSIN:
Se encontr relacin estadsticamente significativa, moderada e inversamente proporcional, entre el
puntaje de depresin y el de autoestima en estudiantes de preparatoria (rP = -0.761, p < 0.05).
Estadstica Inferencial
Pgina
29
Dnde:
N = nmero de participantes
d2 = diferencias entre los rangos asignados a las variables elevadas al cuadrado
Estadstica Inferencial
Procedimiento:
1. Ordene por rango los puntajes de la variable X, asignando 1 al puntaje ms bajo y as
sucesivamente.
2. Calcule
par de rangos de X y de Y.
3. Eleve al cuadrado cada diferencia entre los rangos de X y Y.
4. Sume las diferencias elevadas al cuadrado para obtener d
5. Cuente el nmero de participantes (N)
6. Encuentre el valor de rho con la siguiente frmula:
6 2
= 1
( 2 1)
7. Se debe buscar el valor de tabla del coeficiente Spearman en la tabla 2, para ello se utiliza el nmero
de casos (N) y el nivel de significancia elegido para probar la hiptesis nula.
Pgina
30
Regla de decisin
Si el coeficiente Spearman obtenido es mayor o igual al de la tabla se rechaza la hiptesis nula.
Si obtenido crtico se rechaza la H0 y se aceptaH1
Si obtenido< crtico se rechaza la H1 y se aceptaH0
Estadstica Inferencial
Pgina
31
Estadstica Inferencial
EJEMPLO: Se desea saber si existe relacin entre la actitud hacia el psiclogo (X) y la actitud hacia la
psicoterapia (Y), en un grupo de padres de familia. La actitud es evaluada como sigue: 1 = muy
desfavorable hasta 7 = muy favorable. Los resultados se muestran a continuacin:
Redactar la conclusin con un nivel de significancia = 0.05
H0: no existe relacin entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en
padres de familia.
H1: existe relacin entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres
de familia.
Actitud hacia el
Psiclogo
X
6
7
5
3
4
2
2
1
2
Actitud hacia
Psicoterapia
Y
7
5
4
2
6
3
3
2
1
N=9
Rango
X
Rango
Y
d2
8
9
7
5
6
3
3
1
3
9
7
6
2.5
8
4.5
4.5
2.5
1
-1
2
1
2.5
-2
-1.5
-1.5
-1.5
2
1
4
1
6.25
4
2.25
2.25
2.25
4
d2= 27
Pgina
32
CONCLUSIN:
Se encontr una relacin estadsticamente significativa, moderada y directamente proporcional,
entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia (rho = 0.769,
p = 0.05).
Estadstica Inferencial
SPSS
Vamos a declarar primero las variables en spss
Estadstica Inferencial
Pgina
En el presente ejemplo, el nivel de significancia obtenido =0.015 es menor a 0.05, por lo que se rechaza
la hiptesis nula, entonces: existe relacin entre la actitud hacia el psiclogo y la actitud hacia la
psicoterapia, en padres de familia. Adems la correlacin es moderada (est en el rango entre 0.5 y 0.8)
y directamente proporcional (tiene signo positivo).
33
Correlaciones
Pgina
34
CONCLUSIN:
Se encontr una relacin estadsticamente significativa, moderada y directamente proporcional,
entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia (rho = 0.769,
p = 0.015) (ver diagrama). Estos datos se utilizarn para hacer la discusin posterior de los resultados
encontrados en el estudio
Estadstica Inferencial
CHI-CUADRADA (X2)
Es una distribucin de probabilidad. La prueba de chi cuadrada compara las frecuencias observadas en
cada una de las celdas de una tabla de contingencia con las frecuencias esperadas (E) para cada una,
para determinar si las diferencias se deben al azar, como lo afirma la hiptesis nula (Ho).
El estadstico X (que se pronuncia chi cuadrada o ji cuadrada) refleja el tamao de las diferencias entre
las frecuencias observadas y esperadas. Hay mayor probabilidad de que el resultado sea significativo a
medida que la diferencia entre las frecuencias observadas y esperadas es mayor, por eso el valor
observado de X debe ser igual o mayor que los valores crticos de la tabla.
Caractersticas
No analiza resultados solo categoras
Las categoras asignadas es la nica medida del comportamiento de los participantes
La prediccin se formula indicando el nmero de participantes que habr en cada categora
Procedimiento para calcular Chi- cuadrada
1. Construir tabla de contingencia
2. Listar las frecuencias observadas (0) de acuerdo a su categora
3. Calcular las frecuencias esperadas (E) para cada categora. Esto consiste en multiplicar los
totales marginales para cada variable entre el nmero total de participantes.
4. Calcular el valor de x2
( )
=
gl= (c-1)(r-1)
Pgina
35
R=# de filas
Estadstica Inferencial
CONCEPTO Y DEFINICIONES
Tabla de contingencia. Se compone de dos vas o entradas y muestra la relacin contingente entre dos
variables, cuando estas han sido clasificadas en categoras mutuamente excluyentes y cuando los datos
de cada celda son frecuencias.
Regla de decisin
Si el valor obtenido es mayor o igual al valor crtico de tabla se acepta la hiptesis de investigacin.
Si X2 obtenido X2 crtico se rechaza la H0 y se acepta H1
Si X2obtenido < X2 crtico se rechaza la H1 y se acepta H0
Grados de libertad
CUANDO USARLA. Cuando se asignan categoras a los participantes y los datos son nominales. Solo
analiza categoras no resultados.
Hiptesis de investigacin
El investigador predijo que habra un mayor porcentaje de estudiantes de tecnologa. Que adoptaran
hbitos de estudio regular en comparacin con estudiantes de ciencias sociales.
Datos de la muestra
100 participantes. Un grupo de 50 estudiantes de ciencias sociales y otro grupo de 50 estudiantes de
tecnologa. Se envi un cuestionario a todos los estudiantes en el que se les peda que indicaran sus
hbitos de estudio de acuerdo a 3 categoras.
1. Estudio regular
2. Estudio irregular concentrado en das puntuales
3. Combinacin de los 2 hbitos de estudio anterior
H0: No existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares
en comparacin con los estudiantes de ciencias sociales.
H1: Existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares
en comparacin con los estudiantes de ciencias sociales.
Pgina
36
Estadstica Inferencial
Hbitos de estudio
REGULAR
6
1
GPO 1
C.S.
GPO 2
TECNOLOGIA
IRREGULAR
15
2
10
16
COMBINADA
23
3
44
24
42
47
86
23
Frecuencia esperada
C1=E
= 8.19
C2=E=
C3=E=
X2=
= 11.77
C5=E=
=24.05
C6=E=
(.)
.
C4=E=
(.)
.
(.)
.
=7.81
=11.23
=22.95
(.)
(.)
(.)
.
=3.11
( )
Estadstica Inferencial
Pgina
Los datos observados no confirman la hiptesis de investigacin segn la cual habra un nmero mayor
de estudiantes de tecnologa que tendra hbitos de estudio regular en comparacin con los estudiantes
de ciencias sociales.
37
CONCLUSIN
No existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares
en comparacin con los estudiantes de ciencias sociales. (X2=5.99, gl=2, p>0.05)
anterior
La primera tabla nos muestra la frecuencia esperada y observada para cada categora as como su
porcentaje y el total de participantes. La segunda tabla muestra el valor obtenido de Chi-cuadrada que
Estadstica Inferencial
Pgina
38
es igual a 3.107 con un nivel de significancia p= 0.212 lo que significa que se acepta la hiptesis nula H0
ya que el valor de p es mayor a 0.05
Por lo tanto, no existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios
regulares en comparacin con los estudiantes de ciencias sociales. (X2=3.11, gl=2, p>0.05)
Recursos de apoyo para el tema CHI-CUADRADA
http://es.slideshare.net/sevilla_carlos2004/distribucion-de-chi-cuadrado
https://www.youtube.com/watch?v=j3qFzFyey2Y
REGRESIN LINEAL
Introduccin
El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la relacin entre
variables. Se adapta a una amplia variedad de situaciones. En la investigacin social, el anlisis de
regresin se utiliza para predecir un amplio rango de fenmenos, desde medidas econmicas hasta
diferentes aspectos del comportamiento humano. En el contexto de la investigacin de mercados
puede utilizarse para determinar en cul de diferentes medios de comunicacin puede resultar ms
eficaz invertir; o para predecir el nmero de ventas de un determinado producto.
En fsica se utiliza para caracterizar la relacin entre variables o para calibrar medidas. Etc.
Tanto en el caso de dos variables (regresin simple) como en el de ms de dos variables (regresin
mltiple), el anlisis de regresin lineal puede utilizarse para explorar y cuantificar la relacin entre una
variable llamada dependiente o criterio (Y) y una o ms variables llamadas independientes o predictoras
(X1,X2, ...,Xk), as como para desarrollar una ecuacin lineal con fines predictivos. Adems, el anlisis de
regresin lleva asociados una serie de procedimientos de diagnstico (anlisis de los residuos, puntos
de influencia) que informan sobre la estabilidad e idoneidad del anlisis y que proporcionan pistas sobre
cmo perfeccionarlo.
Estadstica Inferencial
Pgina
La recta de regresin
En el tema anterior (sobre correlacin lineal) hemos visto que un diagrama de dispersin ofrece una
idea bastante aproximada sobre el tipo de relacin existente entre dos variables. Pero, adems, un
diagrama de dispersin tambin puede utilizarse como una forma de cuantificar el grado de relacin
lineal existente entre dos variables: basta con observar el grado en el que la nube de puntos se ajusta
a una lnea recta.
Ahora bien, aunque un diagrama de dispersin permite formarse una primera impresin muy rpida
sobre el tipo de relacin existente entre dos variables, utilizarlo como una forma de cuantificar esa
39
Nuestro objetivo es el de proporcionar los fundamentos del anlisis de regresin. Al igual que en los
captulos precedentes, no haremos hincapi en los aspectos ms tcnicos del anlisis, sino que
intentaremos fomentar la compresin de cundo y cmo utilizar el anlisis de regresin lineal, y cmo
interpretar los resultados. Tambin prestaremos atencin a otras cuestiones como el chequeo de los
supuestos del anlisis de regresin y la forma de proceder cuando se incumplen
relacin tiene un serio inconveniente: la relacin entre dos variables no siempre es perfecta o nula; de
hecho, habitualmente no es ni lo uno ni lo otro.
Supongamos que disponemos de un pequeo conjunto de datos con informacin sobre 35 marcas de
cerveza y que estamos interesados en estudiar la relacin entre el grado de alcohol de las cervezas y su
contenido calrico. Un buen punto de partida para formarnos una primera impresin de esa relacin
podra ser la representacin de la nube de puntos, tal como muestra el diagrama de dispersin de la
figura 1
Figura 1 Diagrama de dispersin de porcentaje de alcohol por n de caloras
Estadstica Inferencial
Pgina
40
El eje vertical muestra el nmero de caloras (por cada tercio de litro) y el horizontal el contenido de
alcohol (expresado en porcentaje). A simple vista, parece existir una relacin positiva entre ambas
variables: conforme aumenta el porcentaje de alcohol, tambin aumenta el nmero de caloras. En esta
muestra no hay cervezas que teniendo alto contenido de alcohol tengan pocas caloras y tampoco hay
cervezas que teniendo muchas caloras tengan poco alcohol. La mayor parte de las cervezas de la
muestra se agrupan entre el 4,5 % y el 5 % de alcohol, siendo relativamente pocas las cervezas que
tienen un contenido de alcohol inferior a se. Podramos haber extendido el rango de la muestra
incluyendo cervezas sin alcohol, pero el rango de caloras y alcohol considerados parece bastante
apropiado: no hay, por ejemplo, cervezas con un contenido de alcohol del 50 %, o cervezas sin caloras.
Cmo podramos describir los datos que acabamos de proponer? Podramos decir simplemente que
el aumento del porcentaje de alcohol va acompaado de un aumento en el nmero de caloras; pero
esto, aunque correcto, es poco especfico. Cmo podramos obtener una descripcin ms concreta de
los resultados? Podramos, por ejemplo, listar los datos concretos de que disponemos; pero esto,
aunque preciso, no resulta demasiado informativo.
Podramos hacer algo ms interesante. Por ejemplo, describir la pauta observada en la nube de puntos
mediante una funcin matemtica simple, tal como una lnea recta. A primera vista, una lnea recta
podra ser un buen punto de partida para describir resumidamente la nube de puntos de la figura 1.
Puesto que una lnea recta posee una frmula muy simple
= +
Pgina
41
Vemos que, en general, la recta hace un seguimiento bastante bueno de los datos. La frmula de la
recta aparece a la derecha del diagrama. La pendiente de la recta (b) indica que, en promedio, a cada
incremento de una unidad en el porcentaje de alcohol (Xi) le corresponde un incremento de 37,65
caloras (Y). El origen de la recta (a) sugiere que una cerveza sin alcohol (grado de alcohol cero) podra
contener 33,77 caloras. Y esto, obviamente, no parece posible.
Al examinar la nube de puntos vemos que la muestra no contiene cervezas con menos de un 2% de
alcohol. As, aunque el origen de la recta aporta informacin sobre lo que podra ocurrir si extrapolamos
(Aplicar un criterio conocido a otros casos similares para extraer conclusiones o hiptesis) hacia abajo la pauta
observada en los datos hasta llegar a una cerveza con grado de alcohol cero, al hacer esto estaramos
efectuando pronsticos en un rango de valores que va ms all de lo que abarcan los datos disponibles,
y eso es algo extremadamente arriesgado en el contexto del anlisis de regresin.
Estadstica Inferencial
Bondad de ajuste
Adems de acompaar la recta con su frmula, podra resultar til disponer de alguna indicacin precisa
del grado en el que la recta se ajusta a la nube de puntos. De hecho, la mejor recta posible no tiene por
qu ser buena.
Imaginemos una situacin como la presentada en el diagrama de la figura 3, en el que la recta consigue
un ajuste bastante ms pobre que en el caso de la figura 2. Ahora hemos representado el porcentaje
de alcohol de las cervezas (eje horizontal) y el precio de las mismas (eje vertical). Y no parece existir la
misma pauta de relacin detectada entre las variables de la situacin anterior.
As pues, aunque siempre resulta posible, cualquiera que sea la nube de puntos, para obtener la recta
mnimo-cuadrtica, necesitamos informacin adicional para determinar el grado de fidelidad con que
esa recta describe la pauta de relacin existente en los datos.
Estadstica Inferencial
Pgina
Cmo podemos cuantificar ese mejor o peor ajuste de la recta? Hay muchas formas de resumir el
grado en el que una recta se ajusta a una nube de puntos. Podramos utilizar la media de los
residuos, o la media de los residuos en valor absoluto, o las medianas de alguna de esas medidas,
etc.
Una medida de ajuste que ha recibido gran aceptacin en el contexto del anlisis de regresin es el
coeficiente de determinacin R2: el cuadrado del coeficiente de correlacin mltiple. Se trata de
una medida estandarizada que toma valores entre 0 y 1 (0 cuando las variables son independientes
y 1 cuando entre ellas existe relacin perfecta).
Este coeficiente posee una interpretacin muy intuitiva: representa el grado de ganancia que
podemos obtener al predecir una variable basndonos en el conocimiento que tenemos de otra u
otras variables. Si queremos, por ejemplo, pronosticar el nmero de caloras de una cerveza sin el
conocimiento de otras variables, utilizaramos la media del nmero de caloras. Pero si tenemos
informacin sobre otra variable y del grado de relacin entre ambas, es posible mejorar nuestro
pronstico. El valor R2 del diagrama de la figura 2 vale 0,83, lo que indica que si conocemos el
porcentaje de alcohol de una cerveza, podemos mejorar en un 83 % nuestros pronsticos sobre su
nmero de caloras si, en lugar de utilizar como pronstico el nmero medio de caloras, basamos
nuestro pronstico en el porcentaje de alcohol. Comparando este resultado con el correspondiente
al diagrama de la figura 3 (donde R2 vale 0,06) comprenderemos el valor informativo de R2: en este
segundo caso, el conocimiento del contenido de alcohol de una cerveza slo nos permite mejorar
nuestros pronsticos del precio en un 6 %, lo cual nos est indicando, adems de que nuestros
pronsticos no mejoran de forma importante, existe un mal ajuste de la recta a la nube de puntos.
42
Parece evidente, sin tener todava otro tipo de informacin, que el porcentaje de alcohol de las
cervezas est ms relacionado con el nmero de caloras que con su precio.
Resumen
En este primer apartado introductorio hemos aprendido que el anlisis de regresin lineal es una
tcnica estadstica que permite estudiar la relacin entre una variable dependiente (VD) y una o ms
variables independientes (VI) con el doble propsito de:
1) Averiguar en qu medida la VD puede estar explicada por la(s) VI.
2) Obtener predicciones en la VD a partir de la(s) VI.
Pgina
43
Estadstica Inferencial
Puntaje de
ortografa
52
90
63
81
93
51
48
99
85
57
60
77
96
62
28
43
88
72
75
69
Puntaje de
lectura
56
81
75
72
50
45
39
87
59
56
69
78
69
57
35
47
73
76
63
79
2.- Para averiguar la validez de un determinado examen de lectura, los investigadores lo aplicaron a una muestra
de 20 estudiantes cuya habilidad para leer haba sido previamente colocada por rangos por su profesor. El
puntaje del examen y el puntaje que el profesor dio para cada estudiante se enumeran a continuacin: Utiliza
un =0.05.
28
50
92
85
76
69
42
53
80
91
73
74
14
29
86
73
39
80
91
72
Estadstica Inferencial
Puntaje del
profesor
18
17
1
6
5
10
11
12
3
2
4
9
20
19
7
8
16
13
15
14
44
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
Puntaje lectura
Pgina
Estudiante
3.- Se analiza la relacin entre el desempeo del equipo y la nmina de los equipos de beisbol de la liga
Americana. La nmina de los equipos de la Liga Americana se mide en millones de dlares por equipo, mientras
que el desempeo se mide por el nmero de juegos ganados en la temporada, lo que quiere evaluarse es si existe
relacin entre el gasto y el desempeo de los equipos profesionales de beisbol. Los datos se muestran en la
siguiente tabla. Utiliza un =0.05.
Participante
1
2
3
4
5
6
7
X
8
9
8.5
16
12
10
12
y
12
11
6
11
10
8
6.3
4.- Como parte de un estudio sobre el efecto de la presin del grupo sobre el conformismo individual en una situacin que
implica riesgo monetario, dos investigadores administraron la escala F, una medida de autoritarismo (a mayor valor mayor
autoritarismo) y una escala diseada para medir estatus de lucha social a 12 estudiantes. Se deseaba tener informacin
acerca de la correlacin entre las puntuaciones de autoritarismo y aquellas de estatus de lucha social. Las puntuaciones
fueron las siguientes: Utiliza un =0.05.
PARTICIPANTE
A
B
C
D
E
F
G
H
I
J
K
L
X
82
98
87
40
116
113
111
83
85
126
106
117
Y
42
46
39
37
65
88
86
56
62
92
54
81
5.- Un investigador supona que el desempeo de los alumnos de la carrera de medicina en materias
afines y sinrgicas podra ser semejante. Para comprobar lo anterior, aplic dos exmenes a un grupo
de diez alumnos (mientras ms grande sea el valor mejor estudiante es). Al aplicarles un examen de
anatoma y otro de embriologa, el investigador tena la pretensin de averiguar si los estudiantes con
puntuaciones bajas en una materia obtenan puntuaciones bajas en la otra y si quienes obtenan
puntuaciones altas en una materia tambin lograban puntuaciones altas en la otra.
A continuacin se muestran los resultados que consisten en aciertos obtenidos en una y otra materia
y expresados en nmeros enteros. Utiliza un =0.01.
Estadstica Inferencial
Aciertos
embriologa
74
61
69
90
51
79
95
52
77
63
45
1
2
3
4
5
6
7
8
9
10
Aciertos
anatoma
65
72
75
82
50
95
87
53
83
64
Pgina
Alumno
6.- Kellogs quiere saber si existe una relacin entre salario y estrs. La siguiente tabla lista el salario para cada
empleado y el estrs (medido en una escala de 1=no hay estrs y 10= muy estresado) de empleos
seleccionados al azar. Parece que el salario se incrementa a medida que se incrementa el estrs? Utiliza un
=0.01.
Empleo
Corredor de bolsa
Zologo
Ingeniero elctrico
Director de escuela
Gerente de hotel
Funcionario bancario
Inspector de seguridad laboral
Economista domstico
Psiclogo
Piloto de aerolnea
salario
2
6
3
5
7
10
9
8
4
1
estrs
2
7
6
4
5
8
9
10
3
1
6.- Cules de las siguientes variables tiene ms probabilidad de mostrar una correlacin claramente
positiva? Cules no tiene ninguna probabilidad de mostrar correlacin?
a) Estatura y nmero de pie
b) Nmero de entradas de cine vendidas y nmero de espectadores.
c) Cantidad de espinacas consumidas y nmero de aciertos en las quinielas de ftbol.
7.- Cules de las siguientes correlaciones tiene probabilidad de ser correlaciones positivas o negativas?
a) Las temperaturas en invierno y el consumo de electricidad.
b) ndices de pluviosidad y cifras de ventas de paraguas.
Pgina
46
8.- Cul de los tres coeficientes de correlacin siguientes expresa las correlaciones ms alta y ms
baja?
+0.5 0
-0.9
Estadstica Inferencial
Pgina
La prueba t
Cuando se investiga en un nivel explicativo, la forma ms simple de un diseo de investigacin es
cuando se manipula una nica Variable Independiente (VI) aplicando dos tratamientos y se observan
sus efectos en una nica Variable Dependiente (VD). Muchas veces en vez de tener dos tratamientos
se compara un grupo control con una condicin experimental (un tratamiento).
47
Las pruebas paramtricas t verifican si la varianza esperada es lo bastante elevada como para producir
un ratio de varianza elevado en el cual la varianza esperada entre dos condiciones es relativamente alta
en comparacin con la varianza total.
Pgina
48
Distribucin t de Student
Estadstica Inferencial
Estadstica Inferencial
Pgina
49
Supuestos de la prueba t
Tanto la prueba t para muestras independientes como la prueba t para muestras relacionadas son
pruebas paramtricas basadas en la distribucin normal. Por lo tanto, se asume:
Los datos deben estar medidos al menos en una escala de intervalo.
Si la distribucin de las muestras se distribuye normalmente. En la pruebat para muestras
relacionadas la distribucin muestral de las diferencias debe ser normal.
En la prueba t para muestras independientes, en la que tenemos dos grupos distintos de personas, se
asume:
Que las varianzas de esas poblaciones son iguales (o muy parecidas), para revisar este supuesto
se lleva a cabo el test de Levene.
Que las puntuaciones son independientes (porque provienen de diferentes personas).
Dnde:
t = valor estadstico de T student.
= Valor promedio o media aritmtica de las diferencias entre los momentos antes y despus.
50
sD / N
Pgina
diferencias ( s D
Dnde:
= es la diferencia de A-B
= Nmero de participantes
Estadstica Inferencial
Pgina
CONCLUSIN:
En promedio, a los participantes a los que se les aplico la vacuna, con la segunda aplicacin
experimentaron de manera significativa una mejora (M =3.7, SE=0.5587) que en la primera
aplicacin (M = 6.4, SE = 0.6699), t (10)=2.8, p < 0.01.
51
Pgina
52
Estadstica Inferencial
EJEMPLO
A un grupo de 10 participantes se les aplic una nueva vacuna contra la gripa y se quera saber cmo
se sentan despus de su aplicacin. Se cree que despus de una segunda aplicacin, al tercer da habra
una mejora en su bienestar subjetivo. = 0.01
Hiptesis estadsticas
Ho:
aplicacion1 aplicacion2
H1:
aplicacion1 aplicacion2
A1
10
5
6
3
9
8
7
5
6
5
64
6.4
A2
2
1
7
4
4
5
2
5
3
4
37
3.7
d
8
4
-1
-1
5
3
5
0
3
1
27
2.7
d-
8-2.7=5.3
4-2.7=1.3
-1-2.7=-3.7
-1-2.7=-3.7
5-2.7=2.3
3-2.7=.3
5-2.7=2.3
0-2.7=-2.7
3-2.7=.3
1-2.7=-1.7
)
(d
(5.3)2=28.09
1.09
13.69
13.69
5.29
0.09
5.29
7.29
0.09
2.89
78.1
D
sD / N
SD
d
D
N
d D2
N 1
=78.1/9 = 8.67 =
2.94
sD / N = 2.9458/3.1622=0.9315
Comparar las medias
=
2.7 0
2.7
=
= .
0.9315
0.9315
tcrit= 2.821
Estadstica Inferencial
Pgina
SPSS
Declare las variables en la vista de variables y en la vista de datos capture la informacin.
Posteriormente vaya al men, analizar, comparar medias, T de student para muestras relacionadas.
53
2.898 2.821 Aceptamos la hiptesis de investigacin en la cual nos dice que existen diferencias entre
la primer aplicacin de la vacuna y la segunda.
Pgina
54
En la siguiente ventana envi las variables a analizar, en el botn opciones indique el nivel de
significancia (intervalo de confianza) click en continuar y aceptar
Estadstica Inferencial
N ) por lo
Output 1:
Estadsticos de muestras relacionadas
Media
Par 1
Desviacin tp.
Error tp. de la
media
aplicacion1
6,4000
10
2,11870
,66999
aplicacion2
3,7000
10
1,76698
,55877
En el output 2 se muestra la correlacin de Pearson entre las dos condiciones. Cuando se utilizan
muestras relacionadas es posible que las condiciones experimentales estn correlacionadas, porque los
datos provienen de los mismos participantes. En este caso no existe una correlacin (r =- 0.142) y no
es significativa porque p > 0.05.
Output 2:
Correlaciones de muestras relacionadas
N
Par 1
aplicacion1 y aplicacion2
Correlacin
10
-,142
Sig.
,695
Estadstica Inferencial
Pgina
se obtiene la diferencia promedio entre las medias de las de los tratamientos (i.e. D , la puntuacin
promedio es 6.4-3.7 = 2.7). En la tabla se informa de la desviacin tpica de la diferencia entre las
medias (2.9458) y lo ms importante, el error estndar de las diferencias entre la aplicacin de la
s
2.9458
0.93155 ). El estadstico t se calcula dividiendo la media
vacunas para cada condicin ( D
N
10
de las diferencias por el error estndar de las diferencias t = 2.7/0.93155 = 2.898). Este valor de t se
compara con el valor de la distribucin basndose en los grados de libertad y un valor de ). SPSS utiliza
los grados de libertad para calcular la probabilidad exacta del valor de t. Este valor de probabilidad est
en la columna etiquetada con Sig. (bilateral).SPSS seala nicamente la probabilidad bilateral (dos
colas). Si en la investigacin se hiciera una prediccin especfica (por ejemplo, que la ansiedad es mayor
cuando se utiliza una araa real) entonces se debe informar de la probabilidad unilateral (de una sola
55
El output 3 muestra la tabla ms importante: en esta tabla se seala si las diferencias entre las medias
son suficientemente grandes para no ser consideradas un resultado debido al azar. Primero, la tabla
cola) para ello se debe dividir la probabilidad proporcionada por el SPSS entre dos. La probabilidad
bilateral en este caso es muy baja (p < 0.018) lo que significa que existe nicamente un 1.8% de
probabilidad de que un valor de t como el obtenido pueda pasar si la hiptesis nula fuera cierta. En
general se utiliza una p < 0.05 como estadsticamente significativa; por lo tanto, en nuestro caso la p
encontrada es significativa porque es menor que 0.05. El hecho de que el valor de t fuese negativo
quiere decir que en la primera aplicacin de la vacuna el promedio fue menor a la de la segunda
aplicacin.
Por lo tanto se puede concluir que si existen diferencias entre la primera aplicacin de la vacuna y la
segunda, t (10) = 2.898, p < 0.05.
Finalmente, en el output se obtiene el intervalo de confianza del 95% para la diferencia entre las
medias. Imagina que tomamos 100 muestras de una poblacin, entre los dos tratamientos y se calcula
la media ( D ) y un intervalo de confianza para la media. El intervalo de confianza nos dice los lmites
entre los cuales estara la diferencia real entre las medias, lo importante de este resultado es que no
contenga el cero, porque esto quiere decir que es improbable que la diferencia entre las medias sea
cero. Esto es muy importante, si recordamos al iniciar la explicacin sealamos que se considera que
si se obtienen dos pares de muestras de una poblacin se espera que el resultado de la diferencia entre
las muestras sea cero. Este intervalo nos dice que, basados en dos muestras reales, es improbable que
el valor verdadero de las diferencias entre las medias sea cero. Por lo tanto, podemos estar confiados
de que las dos muestras no representan muestras aleatorias de la misma poblacin. Sino que
representan muestras de diferentes poblaciones que han cambiado por la manipulacin experimental.
Cmo se escriben los resultados de la prueba t para muestras relacionadas?
CONCLUSIN:
Pgina
56
En promedio, a los participantes a los que se les aplico la vacuna, con la segunda aplicacin
experimentaron de manera significativa una mejora (M =3.7, SD=1.76) que en la primera
aplicacin (M = 6.4, SD=2.11), t (10)=2.8984, p < 0.05.
Estadstica Inferencial
Pgina
57
Lgica de la prueba
El objetivo primordial de la prueba t es comparar la cantidad de variabilidad debida a las diferencias
predichas en puntaje entre los dos grupos con la variabilidad total de los puntajes de los sujetos. Las
diferencias predichas se calculan en trminos de las diferencias entre las medias de los puntajes de los
dos grupos. El valor real de esta diferencia entre las medias se tiene que comparar con la variabilidad
total de los puntajes. Si la variabilidad de los puntajes es pequea, entonces una diferencia ms bien
pequea entre las medias de los grupos puede reflejar una diferencia consistente entre ellos. Sin
embargo, si la variabilidad entre los puntajes es muy grande, esto podra indicar que una proporcin
mayor de esta variabilidad se debe a fluctuaciones en el desempeo de los sujetos, debidas a variables
desconocidas, ms que a la diferencia predicha entre las condiciones experimentales.
1
2
+
1
Dnde:
t = valor estadstico de la prueba de T de Student.
()2
Como hicimos con la prueba t para muestras relacionadas vamos a comparar el valor de t obtenido
respecto del valor crtico de t de la distribucin con grados de libertad igual a n1 n2 2 , si el valor
Estadstica Inferencial
Pgina
Procedimiento
1. Determinar el promedio o media aritmtica de cada grupo de poblacin.
2. Calcular la suma de cuadrados de cada grupo.
3. Calcular la desviacin estndar (SD) de ambos grupos.
4. Calcular los grados de libertad (gl) gl = (N1 + N2) 2.
5. Obtener la probabilidad del valor t en la tabla D para dos colas o una cola, a fin de obtener la
probabilidad.
6. Toma de decisin: Si el valor de t calculado es mayor o igual que el registrado en las tablas se
rechaza Ho y se acepta H1.
58
= (1 + 2 ) 2
obtenido excede el valor crtico rechazamos la Ho, es decir podemos estar seguros (con una
probabilidad de error del 5%) de que hay un efecto de la variable dependiente. Si se dan cuenta el
estadstico t lo podemos obtener nicamente conociendo la media, la desviacin estndar y el
nmero de participantes de cada grupo.
Regla de decisin
Pgina
59
Estadstica Inferencial
Pgina
60
Estadstica Inferencial
EJEMPLO
Para el anlisis vamos a utilizar los datos de la ansiedad que provoca la presentacin de araas, ya sea
en foto o real, a personas que padecen aracnofobia. En este caso tenemos 12 participantes a los cuales
se les present una foto de una araa y a otros 12 participantes se les present una araa real. Se midi
la ansiedad en cada grupo. = 0.05
H0=Las diferencias observadas en la ansiedad que provoca una araa ya sea en foto o en real son
iguales. (La ansiedad que provoca una araa ya sea en foto es igual a que fuese real)
H1=La ansiedad que provoca una araa ya sea en foto o en real, son distintas. (La ansiedad que provoca
una araa ya sea en foto es diferente a que fuese real)
Participantes
1
2
3
4
5
6
7
8
9
10
11
12
Suma
Media
cuadrado
Ansiedad
Gpo1 Foto
30
35
45
40
50
35
55
25
30
45
40
50
480
40
230400
900
1225
2025
1600
2500
1225
3025
625
900
2025
1600
2500
20150
= 2
Ansiedad
Gpo2 Real
40
1600
35
1225
50
2500
55
3025
65
4225
55
3025
50
2500
35
1225
30
900
50
2500
60
3600
39
1521
564
27846
47
318096
()2
Estadstica Inferencial
950 + 1338
2288
=
= 10.20
(11 + 11)
22
Pgina
61
1 + 2
=
(1 1) + (2 1)
1
2
+
1
40 47
1
10.2012 +
7
=
= .
4.16
12
= (1 + 2 ) 2
gl= (12+12)-2 =22
Para estos datos con 22 grados de libertad, al nivel de significancia establecido en el valor de 0.05, se
tiene un valor t en tabla de 2.074, el valor de t obtenido es menor al de la tabla (el signo no debe ser
tomado en cuenta) por lo tanto se acepta la H0, entonces: las diferencias observadas en la ansiedad que
provoca una araa ya sea en foto o real son iguales, es decir, no existen diferencias significativas entre
las medias de las dos muestras. En trminos del experimento, se puede inferir que los aracnofbicos
estn igualmente ansiosos si se les presentan fotos y cuando se les presentan araas reales.
Estadstica Inferencial
Pgina
Los participantes nos permiten identificar a cada una de las personas que participaron en el estudio y
se define como nominal, en la variable grupo se seala a que condicin pertenece cada uno de los
participantes que se define como nominal, en nuestro caso los participantes que estn en el grupo 0 se
expusieron a una foto de araa y los que tienen un cdigo de 1 fueron expuestos a una araa real, para
62
SPSS
definirlo se debe ir a la columna donde dice valores y presionar del lado derecho y aparecer el cuadro
que se muestra siguiendo la flecha; finalmente, tenemos a la variable dependiente que es ansiedad y
la medida debe ser escala (intervalo).
Una vez que hemos definido las variables vamos a la vista de datos, recuerda que en SPSS cada lnea
representa un participante, por lo tanto, los datos ya no estarn como en la prueba t para muestras
relacionadas. En este caso los datos se colocan de la siguiente forma:
Estadstica Inferencial
Pgina
Cuando se activa el cuadro de dialogo, selecciona la variable dependiente de la lista (dale un click a
Ansiedad) y colcala en donde dice Contrastar variables. Despus es necesario seleccionar grupo y
transferirlo a la parte que dice Variable de agrupacin. Una vez que has seleccionado la variable de
agrupacin debes seleccionar donde dice Definir grupos. SPSS necesita saber cules son los cdigos
numricos que asignaste a tus dos grupos, una vez que hayas seleccionado los grupos (0 y 1) da click en
continuar. Si le das a Opcionesva a aparecer un cuadro de dialogo en el que puedes seleccionar el
intervalo de confianza (por defecto es 95%).
63
La variable grupo seala que participantes tuvieron la foto de una araa (grupo 0) y cuales una araa
real (grupo 1). Para el anlisis debemos ir a:
12
12
Media
40.0000
47.0000
Desviacin
tp.
9.29320
11.02889
Error tp. de
la media
2.68272
3.18377
En la segunda tabla (output 2) se presenta los resultados principales de la prueba. La primera columna
contiene los valores del estadstico, es importante notar que a diferencia de la prueba t para muestras
relacionadas, en esta prueba tenemos dos valores de t. En la 1) se han asumido varianzas iguales y en
la 2) No se han asumido varianzas iguales. En el contraste tradicional en la prueba t ambos deben tener
varianzas ms o menos iguales, pero si esto no ocurriera existe un ajuste que se hace a la prueba. Por
Estadstica Inferencial
64
Pgina
Ansiedad
Grupo
foto
real
lo tanto, antes de presentar los resultados es necesario comprobar si las varianzas son o no iguales.
Para ello se utiliza la prueba de Levene para la igualdad de varianzas que se encuentra en las primeras
dos columnas. La prueba de Levene es similar a la prueba t, slo que en vez de probar la Ho: 1= 2,
2
sirve para probar si Ho: 1 2 , es decir si las varianzas son iguales. Por lo tanto, si el test de Levene
es significativo p 0.05 se rechaza la Ho y por lo tanto las varianzas no son iguales. Si por el contrario
p > 0.05 entonces se acepta la Ho y se asume que las varianzas son iguales. Para estos datos, el test
de Levene es no-significativo (porque la p = .386 que es mayor que 0.05). Una vez que hemos
comprobado que las varianzas son iguales debemos ir a la parte donde dice 1) se han asumido varianzas
iguales
Habiendo establecido la homogeneidad de las varianzas, vamos a mirar la prueba t. Primero seala que
la diferencia promedio entre las medias es ( X1 X 2 40 47 7 ) y el error estndar de la
distribucin de las diferencias de las muestras, se calcula utilizando el divisor de la Ecuacin 5:
s12 s22
N1 N 2
9.29 2 11.032
12
12
Pgina
Que no existen diferencias significativas entre las medias de las dos muestras. En trminos del
experimento, se puede inferir que los aracnofbicos estn igualmente ansiosos si se les presentan fotos
y cuando se les presentan araas reales.
En nuestro caso utilizamos una probabilidad bilateral (o de dos colas) es decir no hacemos ninguna
prediccin sobre la direccin del efecto. Sin embargo, a menudo en la investigacin podemos hacer
predicciones especficas, en este caso podemos decir que la ansiedad con la araa real esperaramos
que fuera mayor. En este caso, nosotros usamos una prueba unilateral (o de una cola), de ser as la
probabilidad unilateral se divide entre 2. (i.e. 107/2=.054) La probabilidad unilateral es an mayor que
.05 (pero ahora por un margen muy pequeo y por lo tanto tendremos que seguir con la misma
conclusin, de que no hay diferencias significativas.
65
CONCLUSIN:
Estadstica Inferencial
Pgina
El modelo de un factor sirve para comparar el tratamiento de varios grupos sobre una variable
dependiente. Se trata, por tanto, de una generalizacin de la prueba t para dos muestras
independientes al caso de diseos con ms de dos muestras.
Recuerda:
Estadstica Inferencial
66
Aunque existen muchos y muy diferentes modelos de ANOVA vamos a atender a una
clasificacin muy simple que tiene que ver con el nmero de factores que existen en el diseo de
investigacin. El trmino factor en el contexto del ANOVA es sinnimo de variable independiente. As,
al modelo de ANOVA diseado para analizar los datos obtenidos utilizando un diseo con una variable
independiente se le llama ANOVA de un factor (en ingls one-way ANOVA), si el diseo tiene dos
variables independientes se le llama ANOVA de dos factores (two-way ANOVA). Etc. Cuando hay ms de
un factor se les llama modelos factoriales.
A la variable categrica (nominal u ordinal) que define a los grupos que se desea comparar se le llama
independiente o factor y se representa por la VI. A la variable cuantitativa (de intervalo o razn) en la
que se desea comparar el efecto se le llama dependiente y se representa por la VD.
Las hiptesis se plantean de manera similar a la prueba t nicamente que aqu hay ms de dos
tratamientos y la hiptesis nula se rechaza (i.e. se cumple la H1) si se encuentran diferencias en al menos
dos grupos (o tratamientos).
a) Hiptesis estadsticas
Ho: tratamiento _ 1 tratamiento _ 2 tratamiento _ 3 ...
H1:
es de (0.95 ) .95 .95 .95 .857 , entonces la probabilidad de cometer al menos un error Tipo I es
de 1 0.857 .143 o lo que es lo mismo del 14.3%, es decir, hemos incrementado la probabilidad de
0.5% a 14.3% este error que se comete cuando se realizan muchos anlisis con los mismos datos se
n
llama tasa de errores simultneos (o familywise error = 1 (9.95) , donde n es el nmero de test
realizados).
Interpretacin de la F
Estadstica Inferencial
Pgina
Fuentes de Varianza
Los distintos tipos de varianza se suelen llamar tambin fuentes de varianza. Este trmino se usa para
indicar que cada tipo de varianza procede de un tipo distinto de variable. Dichas variables son las
fuentes de la varianza. Las fuentes de varianza en ANOVA se muestran a continuacin:
Fuentes de varianza en ANOVA
Fuentes de varianza
Tipos de varianza
Variables independientes (pronosticadas)
Varianza esperada
Variables irrelevantes ( no pronosticadas)
Varianza de error
Combinacin de variables independientes y variables Varianza total
irrelevantes.
67
Cuando realizamos una prueba t, se analiza la hiptesis que considera que las dos muestras tienen la
misma media. De forma similar, en la ANOVA se analiza si tres o ms medias son iguales. Un ANOVA
produce un estadstico F o razn F, que es similar a una prueba t en el que se compara la razn entre la
cantidad de varianza explicada por el modelo respecto del error.
En ANOVA la varianza esperada entre condiciones se calcula a partir de las diferencias esperadas entre
los resultados de las distintas condiciones.
La varianza total se calcula a partir de las diferencias en los resultados de todos los sujetos que han
participado en el experimento.
La varianza de error se calcula restando a la varianza total la varianza esperada. El fundamento de este
clculo es que la varianza de error es lo que queda despus de haber tenido en cuenta la varianza
esperada.
En ANOVA, las pruebas de significacin se basan en la proporcin entre la varianza entre las condiciones
esperada y la varianza de error.
Pgina
68
Grados de libertad
Hay otro factor importante que debemos tener en cuenta a la hora de calcular varianzas y consultar las
tablas estadsticas. Para ello necesitamos conocer el nmero de grados de libertad (gl). El concepto de
grados de libertad surge de la idea de que las pruebas paramtricas calculan varianzas basadas en la
variabilidad de los resultados, por lo que es fundamental que todos los resultados tengas libertad
para variar. La cuestin es si todos los resultados de un experimento son variables en la misma medida.
El concepto de grados de libertad es bastante difcil de entender. Un ejemplo experimental podra
ayudarnos a comprenderlo.
Suponga que hace un experimento y calcula el total de los resultados. Al copiar los resultados ms
tarde, olvida incluir uno de los resultados de uno de los seis participantes y se queda con los resultados
que se muestran a continuacin:
Resultados usados para calcular
los grados de libertad
Participante Resultados
1
12
2
13
3
10
4
11
5
14
6
Total
75
No tiene por qu alarmarse, pues sabe que con los cinco resultados y el total de los seis resultados
puede calcular el resultado olvidado para el participantes 6.Lo nico que tiene que hacer es restar los
cinco resultados del total igual a 75; el resultado para el participante 6 slo podra haber sido 15. La
consecuencia de esto es que el resultado para ese participante se puede predecir si conocemos los
otros resultados y el total. Es decir, dicho resultado no tiene libertad para variar.
Los grados de libertad tienen en cuenta el hecho de que uno de los resultados no vara porque se puede
predecir a partir de los otros cinco. El trmino grados de libertad se usa para indicar que todos los
dems resultados pueden variar.
Estadstica Inferencial
Los grados de libertad se calculan restando uno al nmero total de resultados N, (N-1). gl =6-1 = 5
Condiciones para las pruebas paramtricas
Hay tres condiciones fundamentales para las pruebas paramtricas. Estas se aplican a ANOVA y tambin
a las pruebas paramtricas t. Dichas condiciones son:
a) La medicin de los datos (INTERVALAR).
b) La manera en que se distribuyen los totales de los resultados, y
c) Si los resultados estn distribuidos de manera equitativa entre las condiciones experimentales.
La medicin de los datos es bastante fcil de realizar. Dado que ANOVA y las pruebas t son pruebas
paramtricas, que conllevan clculos numricos basados en sumas de cuadrados, la primera condicin
es que los datos deben ser datos de intervalo, con intervalos iguales entre resultados en una escala
numrica continua.
El asunto de la distribucin de los resultados es ms complejo y por ello lo trataremos en detalle en el
apartado siguiente.
Distribucin normal.
Una segunda condicin para la pruebas paramtricas es que los resultados deberan estar distribuidos
segn una distribucin normal. El rasgo fundamental de una distribucin de resultados normal es que
tiende a haber ms resultados intermedios que resultados extremos. Esta es una caracterstica bastante
generalizada de las distribuciones de resultados.
La tercera condicin formal para los datos paramtricos se denomina Homogeneidad de la varianza
palabras que indican uniformidad, esto implica que la variabilidad de los resultados para cada condicin
debera ser aproximadamente la misma.
Pgina
69
Se ha demostrado que, siempre que los nmeros de participantes para cada condicin sean iguales, los
resultados de las pruebas paramtricas son bastante fiables, implicando esto que, si los datos tienen
aproximadamente una distribucin normal y no hay grandes discrepancias entre las varianzas de las
condiciones, las pruebas paramtricas nos darn un anlisis razonablemente exacto de los datos de un
experimento. Esta es una buena razn para asignar siempre el mismo nmero de participantes a cada
condicin experimental.
Estadstica Inferencial
ANOVA
(ANalysis Of VAriance)
ANOVA UNIFACTORIAL
MUESTRAS RELACIONADAS
ANOVA BIFACTORIAL
MUESTRAS INDEPENDIENTES
ANOVA BIFACTORIAL
MUESTRAS RELACIONADAS
1.
2.
3.
1.
2.
3.
4.
Varianza esperada
Varianza individual
Varianza de error y
Varianza total.
Estadstica Inferencial
70
ANOVA UNIFACTORIAL
MUESTRAS INDEPENDIENTES
Pgina
Estadstica Inferencial
Pgina
Si las medias poblacionales son iguales, las medias muestrales sern parecidas, existiendo entre ellas
tan slo diferencias atribuibles al azar. En ese caso, la estimacin (basada en las diferencias entre las
medias) reflejar el mismo grado de variacin que la estimacin (basada en las diferencias entre las
71
La hiptesis que se pone a prueba en el ANOVA de un factor es que las medias poblacionales (las medias
de la VD en cada nivel de la VI) son iguales. Si las medias poblacionales son iguales, eso significa que los
grupos no difieren en la VD y que, en consecuencia, la VI o factor es independiente de la VD.
La estrategia para poner a prueba la hiptesis de igualdad de medias consiste en obtener un estadstico,
llamado F, que refleja el grado de parecido existente entre las medias que se estn comparando. El
numerador del estadstico F es una estimacin de la varianza poblacional basada en la variabilidad
existente entre las medias de cada grupo. El denominador del estadstico F es tambin una estimacin
de la varianza poblacional, pero basada en la variabilidad existente dentro de cada grupo.
puntuaciones individuales) y el cociente F tomar un valor prximo a 1. Si las medias muestrales son
distintas, la estimacin reflejar mayor grado de variacin que la estimacin y el cociente F tomar un
valor mayor que 1. Cuanto ms diferentes sean las medias, mayor ser el valor de F.
Si las poblaciones muestreadas son normales y sus varianzas son iguales, el estadstico F se distribuye
segn el modelo de probabilidad F de Fisher-Snedecor (los grados de libertad del numerador son el
nmero de grupos menos 1; los del denominador, el nmero total de observaciones menos el nmero
de grupos). Si suponemos cierta la hiptesis de igualdad de medias, podemos conocer en todo
momento la probabilidad de obtener un valor como el obtenido o mayor (ver Pardo y San Martn, 1998,
pgs. 248-250).
EJEMPLO:
Se presentaron listas de diez palabras a tres grupos distintos de seis individuos cada uno, para que las
memorizaran. El investigador predijo que la velocidad de presentacin de listas de palabras influira en
los resultados de memorizacin. La velocidad de presentacin de palabras para el Grupo 1 fue menor,
una palabra cada 5 segundos (condicin 1) para el Grupo 2 la velocidad fue intermedia, una palabra
cada 2 segundos (condicin 2) y para el Grupo 3 la velocidad fue mayor, una palabra por segundo
(condicin 3). Los resultados de memorizacin se muestran en la tabla siguiente. =0.01.
Nmero de palabras memorizadas con tres velocidades de presentacin.
Totales (T)
Condicin 1
(velocidad
menor)
8
7
9
5
6
8
43
Condicin 2
(velocidad
intermedia)
7
8
5
4
6
7
37
Condicin 3
(velocidad
mayor)
4
5
3
6
2
4
24
Medias
7.17
6.17
104
Total
general
Estadstica Inferencial
Pgina
72
Hiptesis estadsticas
Ho: condicin_1 condicin_ 2 condicin_ 3
= .
2.- La varianza total SCtotal se calcula sumando los cuadrados de todos los resultados y restndole la
constante.
( )
=
= .
3. La varianza de error SCerror se calcula restando la varianza esperada SCesperada y la varianza total SCtotal.
=
= . . = 31.67
4.- Se calcula los grados de libertad (gl) para cada tipo de varianza.
=
=
=
glesperada = 3 1 = 2
gltotal = 18 1 = 17
glerror = 17 2 = 15
5.- MCesperada yMCerror se calculan dividiendo las sumas de cuadrados (SC) por los gl.
73
Pgina
Estadstica Inferencial
MCesperada =
MCerror =
31.44
= 15.72
2
31.67
= 2.11
15
Cuadrados
medios
15.72
F ratio
F2,15
=7.45
2.11
Estadstica Inferencial
Pgina
Comparaciones posteriores a F
Cuando se ha determinado que existen diferencias significativas entre los grupos, se debe especificar
dnde se encuentran las diferencias, para ello se analizan los grupos por pares, para hacerlo existen
varios mtodos, ms o menos estrictos, diseados para evitar el error tipo I debido al efecto Bonferroni.
74
Es fundamental consultar la tabla F para verificar las diferencias entre las medias en las tres condiciones.
Existen diferencias entre las medias para las tres condiciones (textos presentados a velocidades
distintas). Este hecho confirma la hiptesis de investigacin segn la cual las velocidades de
presentacin de listas de palabras influirn en el nmero de palabras memorizadas, y que a mayor
velocidad (condicin 3) se memorizaran menos palabras.
Observe que ANOVA slo nos dice si hay diferencias generales significativas entre las condiciones
experimentales, lo que es equivalente a una hiptesis bilateral.
El efecto Bonferroni se refiere al hecho de que al hacer las diferentes comparaciones entre los grupos
organizados por parejas, por ejemplo con la prueba t, el efecto acumulativo sobre el nivel de
significancia, del empleo de cada grupo ms de una vez para hacer todas las comparaciones nos hace
rechazar la hiptesis nula cuando esta no debera ser rechazada.
SPSS
Declara la variable de agrupacin y la variable dependiente (con las tres condiciones) y en la vista de
datos capture la informacin correspondiente a cada variable. Posteriormente vaya al men analizar
comparar N, ANOVA de un factor.
En la siguiente ventana envi las variables a analizar, en la lista de dependientes coloque la variable
dependiente y en la opcin factor coloque la variable de agrupacin.
En el botn Post hoc seleccionar BONFERRONI e indicar el nivel de significacin y dar click en
continuar
75
y
en
Pgina
Estadstica Inferencial
Pgina
76
Estadstica Inferencial
1 =
2 ,
1 =
3 ,
2 =
3. La regla de decisin para cada
Las hipotesis nulas que se prueban son :
comparacin es : si el nivel de significancia es menor o igual al 0.05 se rechaza la H 0.
Como se puede observar la significancia de la comparacin del grupo 1 (velocidad menor)y el grupo 2
(velocidad intermedia) es de 0.755, del 1 con el 3 (velocidad mayor) es de 0.006 y del grupo 2 y el grupo
3 es de 0.062, siguiendo la regla de decisin, la nica comparacin con diferencias estadsticamente
significativas es la correspondiente al grupo 1 con el grupo 3 entonces: el numero de palabras
recordadas es diferente entre el grupo 1 y 3 y podemos decir que las diferencias en el anlisis de
varianza son debidas a este resultado.
Pgina
77
Estadstica Inferencial
Pgina
78
Cmo puede observarse en la grfica, el grupo 1 tuvo el promedio ms alto (7.17), seguido del grupo2
(6.17) , obteniendo la media ms baja el grupo 3 (4.00).
Estadstica Inferencial
Pgina
79
Estadstica Inferencial
Pgina
80
Estadstica Inferencial
Pgina
81
Estadstica Inferencial
Pgina
82
Estadstica Inferencial
EJERCICIOS DE TAREA
Ejercicio 1.- Supongamos que usted quiere determinar si ciertas situaciones producen distintos niveles
de tensin. Usted sabe que la cantidad de la hormona corticosterona que circula en la sangre es una
buena medida de tensin que presenta una persona. Usted dividi de manera aleatoria a 15 estudiantes
en 3 grupos de 5 individuos cada uno. Se midi el nivel de corticosterona de los alumnos del grupo 1,
inmediatamente despus de que estos regresaron de vacaciones (tensin baja). Se midi el nivel de
corticosterona de los estudiantes del grupo 2, despus que estos asistieron a sus clases durante una
semana (tensin moderada). Por ltimo, se midi el nivel de corticosterona de los alumnos del grupo 3
inmediatamente antes de la semana de los exmenes finales (tensin alta). Todas las mediciones se
llevaron a cabo a la misma hora del da. Usted registro los datos tal como se presentan en la tabla. Los
datos estn expresados en miligramos de corticosterona por cada 100 mililitros de sangre.
Grupo 1,
Vacaciones
Grupo 2,
Clases
X1
2
3
7
2
6
X2
10
8
7
5
10
Grupo 3,
Examen
final
X3
10
13
14
13
15
Pgina
83
Estadstica Inferencial
Ejercicio 2.- Un psiclogo desea determinar si la capacidad de la memoria inmediata resulta afectada
por falta de sueo. La memoria inmediata se define como la cantidad de material que la persona puede
recordar poco despus de que este se le presenta. Doce estudiantes del curso de introduccin a la
psicologa son elegidos al azar y se les asigna, de manera aleatoria, a dos grupos formados por seis
individuos cada uno. A uno de los grupos se le priva de sueo durante 24 horas anteriores a la
presentacin del material para recordar. Todos los sujetos del grupo anterior duermen el tiempo
normal (de 7a 8 horas). El material consiste en una serie de diapositivas, cada una las cuales contienen
nueve nmeros. Cada diapositiva se les presenta durante un periodo muy breve (50 milisegundos),
despus de lo cual el sujeto debe recordar la mayor cantidad posible de nmeros que acaban de ser
presentados. Los resultados se muestran a continuacin. Los datos representan el porcentaje de
nmeros correctamente recordados.
Sueo normal
Grupo 1
X1
68
73
72
65
70
73
Pgina
84
Estadstica Inferencial
Ejercicio 3.- A fin de motivar a los ciudadanos para que ahorren gasolina, el gobierno estudia la idea de
emprender una campaa nacional a favor del ahorro de ese energtico. Sin embargo, antes de
emprenderla a nivel nacional, el gobierno decide realizar un experimento que le permita evaluar la
eficacia de la campaa. Para el experimento, realiza la campaa de ahorro de gasolina en rea
geogrfica pequea, pero representativa. Entonces, 12 familias de esa rea son elegidas al azar y se
mide la cantidad de gasolina que consumieron durante el mes anterior al lanzamiento de la campaa
de publicidad y durante el mes siguiente a la campaa. As se obtienen los siguientes datos:
Campaa
Antes de la
campaa
(Galones/mes)
55
43
51
62
35
48
58
45
48
54
56
32
Despus de la
(Galones/mes)
48
38
53
58
36
42
55
40
49
50
58
25
Pgina
85
Estadstica Inferencial
Ejercicio 4.- En fecha fue descubierto un neurotransmisor cerebral endgeno llamado galanina. Segn
parece, ste afecta de manera directa el deseo de ingerir alimentos con un alto contenido de grasa.
Mientras ms alta sea la cantidad de este neurotransmisor de origen natural en un individuo, mayor
ser el apetito que este sienta por la comida con alto contenido de grasa. Recientemente, una compaa
farmacutica desarroll una sustancia experimental, que bloquea la galanina sin alterar el apetito por
otros alimentos ms saludables (es decir, con menos grasa). Un neurocientfico de la compaa piensa
que esa sustancia experimental ser muy til para controlar la obesidad. En forma especfica, l cree
que la administracin diaria de este medicamento har que la persona ingiera alimentos con menos
grasa y, por ende, promover la prdida de peso. En estas condiciones, se realiza un experimento, para
el cual se elige de manera aleatoria a 15 mujeres obesas, todas ellas voluntarias, y se les administra el
medicamento experimental durante 6 meses. Se registr el peso inicial y el peso final (despus de 6
meses) de cada persona. Los pesos registrados se presentan en la siguiente tabla.
Peso inicial (libras)
165
143
175
135
148
155
158
140
172
164
178
182
190
169
157
145
137
170
136
141
138
137
125
161
156
165
170
176
154
143
Pgina
86
Estadstica Inferencial
Ejercicio 5.- Un neurocirujano tiene la idea de que las lesiones producidas en cierta rea del cerebro,
conocida como tlamo, hacen que disminuya la percepcin del dolor. Si est en lo cierto, eso podra ser
importante para el tratamiento de enfermedades terminales acompaadas de dolor intenso. Como
primer intento de poner a prueba esta hiptesis, el investigador realiza un experimento en el cual 16
ratas son divididas, al azar, en dos grupos de 8 especmenes cada uno. A los animales del grupo
experimental se les provoca una pequea lesin en la parte del tlamo que segn el investigador, est
implicada en la percepcin del dolor. A los animales del grupo control se les provoca una lesin
comparable en un rea del cerebro que, segn se cree, no sta relacionada con el dolor. Dos semanas
despus de las operaciones quirrgicas, a cada roedor se le aplica una serie de breves descargas
elctricas en las patas. Esas descargas van creciendo en intensidad: Tienen un nivel de intensidad muy
bajo y ste aumenta hasta que el animal retrocede. De esta manera se determina el umbral del dolor
provocado por las descargas elctricas en cada rata. Al final se obtienen los siguientes datos. Cada dato
representa el nivel ms bajo (en miliamperes) en que se produce el retroceso. Mientras ms alto sea el
nivel de la corriente, tanto ms alto ser el umbral de dolor. Observe que un animal muri durante la
operacin quirrgica y no fue remplazado. Suponga que existen suficientes fundamentos tericos y
experimentales para utilizar una hiptesis con cierta direccin.
Lesiones en el
rea neutral
Grupo control
Grupo 1
Lesiones en el
Tlamo grupo
Experimental
Grupo 2
X1
0.8
0.7
1.2
0.5
0.4
0.9
1.4
1.1
X2
1.9
1.8
1.6
1.2
1.0
0.9
1.7
hiptesis de
Pgina
87
a) Cul es la
investigacin?
b) Cul es la hiptesis nula?
c) Cul es la conclusin? Utilizando =0.05
Estadstica Inferencial
Ejercicio 6.- Un profesor quiere encontrar la mejor forma de presentar un importante tema frente al
grupo que tiene a su cargo. Para eso puede escoger una de las 3 opciones siguientes: 1) dar clase, 2)
dar clase y asignar una lectura complementaria o 3) proyectar una pelcula y asignar una lectura
complementaria. El decide hacer un experimento para evaluar las tres opciones. Entonces solicita 27
voluntarios de su grupo y asigna aleatoriamente 9 a cada una de las tres condiciones. Bajo la condicin
1, el de clase a los estudiantes. Bajo la condicin 2, el da la clase y el asigna la lectura complementaria.
Bajo la condicin 3, los alumnos presentan una pelcula acerca del tema y realizan la misma lectura
complementaria que los estudiantes de la condicin 2. Despus se aplica a los alumnos un examen
sobre la materia. Se obtuvieron los siguientes datos (porcentaje de respuestas correctas):
Condicin 1,
Clase
Condicin 2
Clase +
Lectura
Condicin 3
Pelcula
+Lectura,
X1
92
86
87
76
80
87
92
83
84
X2
86
93
97
81
94
89
98
90
91
X3
81
80
72
82
83
89
76
88
83
Pgina
88
Estadstica Inferencial
PRUEBAS NO PARAMTRICAS
U de Man-Whitney
(Para muestras independientes o grupos no relacionados)
U de Mann-Whitney para muestras independientes se debe usar en diseos
independientes cuando las condiciones se aplican a participantes distintos. Como cada
participante realiza slo una condicin, no es posible comparar los resultados de ambas
condiciones para cada participante, sino verificar diferencias entre las condiciones.
Es una prueba NO paramtrica que analiza el grado de separacin entre las muestras.
Para cualquier anlisis, contamos con dos valores que indican el grado de separacin.
Caractersticas:
Niveles de medicin ordinal.
Para muestras no relacionadas o independientes (grupos diferentes).
Diferencias entre condiciones.
Participantes distintos en cada grupo.
Es para dos grupos solamente, por lo tanto, son dos condiciones.
Lgica de la prueba
Esta prueba compara el orden de los rangos que se obtienen al ordenar las puntuaciones de
ambas muestras asignando el rango 1 a la puntuacin menor y as sucesivamente. Con base en
estos rangos, se obtienen dos valores de U, uno para cada muestra y para la prueba de hiptesis
se toma el ms pequeo.
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la diferencia no se
deba al azar (que la diferencia sea estadsticamente significativa)
2+3+4+5
= 3.5
4
6 + 7 + 8 + 9 + 10
=8
5
11 + 12
= 11.5
2
Estadstica Inferencial
89
RANGO
1
2
3 3.5
4
5
6
7
8
8
9
10
11
11.5
12
13
Pgina
VALOR
0
1
1
1
1
2
2
2
2
2
3
3
4
2.- Cada uno de los rangos se debe colocar en la columna correspondiente, 1 para el
grupo 1 y 2 para el segundo grupo. Una vez asignados los rangos se suma por separado
los totales de los rangos.
3.- Obtenga el total y el promedio de los puntajes de las 2 condiciones.
4.- Calcular en el valor de U y U para cada grupo, sustituyendo en la frmula:
( + 1)
= 1 2 +
2
Dnde:
1 = Nmero de participantes para la condicin 1.
2 = Nmero de participantes para la condicin 2.
= Suma del total de los rangos para la condicin.
( + )
( + )
= +
5.- Se busca el valor de tabla de U en la tabla 5 considerando el tipo de prueba (una cola
o dos colas), el nivel de significancia (=0.05 o =0.025) y utilizando el nmero de casos
de cada grupo (1 2 ).
Para obtener el valor de U crtica, se utiliza el menor de los dos que aparecen (Ej. 13 y 51),
estos valores son los mismos para el tipo de prueba (una cola o dos colas) para cada
nivel de significancia que indica la tabla. Una vez hecho esto, se debe elegir el valor de
U ms bajo y compararlo con el valor de U en la tabla tambin ms bajo.
Regla de decisin
Si el valor obtenido es menor o igual al valor crtico o de tabla se acepta la hiptesis de
investigacin H1 .
Pgina
90
Estadstica Inferencial
Pgina
91
Estadstica Inferencial
Pgina
92
Estadstica Inferencial
EJEMPLO
1. Queremos saber cul es el efecto de diferentes tipos de material escrito sobre la
memoria. Tenemos 2 grupos de 6 participantes cada uno. Al grupo A se le pide
que se aprenda de memoria un material sin sentido y al grupo B un material con
sentido. La memoria se medir por el nmero de ideas recordadas predecimos
que los puntajes de recuerdo sern ms altos para la condicin B.
Redactar la conclusin con un nivel de significancia = 0.05
H1: El grupo B con el material con sentido recordar ms que el grupo A.
H0: El grupo B con el material con sentido recordarn igual que el grupo A.
Condicin A
(material
s/sentido)
3
4
2
6
2
5
x = 22 , X= 3.6
Rango A
3
4
1.5
7.5
1.5
5.5
T1=23
= 1 2 +
U = (6)(6) +
6(6+1)
U = (6)(6) +
Rango B
11
9
5.5
12
7.5
10
T2=55
1.5
1.5
3
4
5.5
5.5
7.5
7.5
9
10
11
12
1 (1 + 1)
1
2
23 = 34
2
6(6+1)
2
Condicin B
(material
c/sentido)
9
7
5
10
6
8
x = 45 , X= 7.5
2
2
3
4
5
5
6
6
7
8
9
10
55 = 2
El valor de Uobtenida = 2
Se obtiene el valor de Utabla = 7
Se checa la regla de decisin
Si 2 7 se rechaza la H0 y se acepta H1
Pgina
93
CONCLUSIN:
Se encontraron diferencias estadsticamente significativas entre el grupo que record
el material con sentido y el grupo que record el material sin sentido encontrndose
puntajes ms altos en el grupo que aprendi material con sentido. U = 2(6,6, p <
0.05).
Estadstica Inferencial
SPSS
Para realizar el anlisis de datos para la prueba U de Mann-Whitney en
SPSS ocupamos definir dos variables, la variable dependiente (Ej.
Memoria) y otra la variable categrica (Ej. material) una vez declaradas
las variables y capturados los valores para cada una de ellas, nos vamos
al men
Analizar/Pruebas no paramtricas /2 muestras
independientes.
Pgina
94
Estadstica Inferencial
Pgina
95
CONCLUSIN:
Se encontraron diferencias estadsticamente significativas entre el grupo que record
el material con sentido y el grupo que record el material sin sentido encontrndose
puntajes ms altos en el grupo que aprendi material con sentido. U = 2(6,6, p <
0.05)
Estadstica Inferencial
EJERCICIOS DE TAREA
1.- Un investigador predijo que una serie de palabras presentadas en la parte izquierda
de una pantalla se reconoceran ms rpidamente que si se presentaban en la parte
derecha, debido a la direccin de lectura de izquierda a derecha en espaol. La medida
fue el tiempo necesario para reconocer las palabras. Los resultados son los siguientes:
Redactar la conclusin con un nivel de significancia = 0.05.
H0: La serie de palabras presentadas en la parte izquierda de una pantalla se
reconoceran de igual manera que si se presentaban en la parte derecha.
H1: La serie de palabras presentadas en la parte izquierda de una pantalla se
reconoceran ms rpidamente que si se presentaban en la parte derecha.
Condicin A
Condicin B
Rango
Rango
(presentacin parte
(presentacin parte
A
B
izquierda)
derecha)
9
8
3
5
2
7
6
20
1
11
5
6
x = , X=
T1=
x = , X=
T2=
Nota: un Tx (total de categoras) menor representa un reconocimiento de palabras ms
rpido.
Pgina
96
Estadstica Inferencial
2.- Alguien le ha dicho a usted que los hombres son ms hbiles para el razonamiento
abstracto que las mujeres. Usted reacciona con escepticismo y decide poner a prueba
esa idea por medio de una hiptesis no direccional. Para eso selecciona al azar a ocho
mujeres de una clase de primer ao de universidad, y lo somete a una prueba de
razonamiento abstracto. Una calificacin ms alta refleja mayor destreza para el
razonamiento abstracto. De esta manera ha obtenido los siguientes datos:
H0: Los hombres y las mujeres tienen diferente nivel de destreza para el razonamiento
abstracto.
H1: Los hombres son ms hbiles para el razonamiento abstracto que las mujeres.
Condicin A
Rango
Condicin B
Rango B
Hombres
A
Mujeres
70
82
86
80
60
50
92
95
84
98
65
85
74
90
94
75
x = , X=
T1=
x = , X=
T2=
Pgina
97
Estadstica Inferencial
Pgina
98
2.- Clasifique las diferencias (d) de menor a mayor. A estas diferencias se les debe asignar
un rango ordenado en el cual no se debe considerar el signo de la diferencia, deber
empezarse con el valor ms pequeo asignndole el valor 1. No deben considerarse las
diferencias iguales a 0 (empates), cuando esto sucede se debe ajustar el nmero de
participantes a: N-1, por cada empate.
Estadstica Inferencial
Condicin 1
A
3
3
2
2
2
2
1
Condicin 2
B
4
2
1
1
0
2
3
d
-1
1
1
1
2
0
-2
Rango
ordenado
1
2
3
4
5
Empate
6
Rangos
Positivos
Rangos
Negativos
2.5
2.5
2.5
2.5
5.5
0
13
5.5
8
Nota: en el caso de que existan valores repetidos, el rango que les corresponde es igual
al promedio de los rangos, es decir: la suma de los lugares asignados de manera
secuencial entre el nmero de veces que se repite cada nmero.
3.- Aplique el signo de la columna (d) a las columnas rangos positivos y negativos.
Fjese en los signos positivos y negativos en las columnas de rango positivo y negativo.
4.- Calcule la suma de las categoras con signo positivo y signo negativo, por separado.
5.- El total de los rangos positivo o negativo, el menor es Wobtenido.
6.- Calcule el nmero de participantes N (sin contar los que tuvieron empate). N= 7-1
=6
7.- Obtenga W tabla, en tabla 6. Se busca el valor crtico de W en la tabla considerando el
tipo de prueba (una cola o dos colas), el nivel de significancia (=0.05 o =0.025 etc.) y
utilizando N (nmero de participantes).
Regla de decisin
Si el valor obtenido es menor o igual al valor crtico o de tabla se acepta la hiptesis de
investigacin H1.
Pgina
99
Estadstica Inferencial
Pgina
100
Estadstica Inferencial
101
Pgina
Estadstica Inferencial
EJEMPLO
1. Se desea probar si hay diferencias en el nivel de estrs laboral de los trabajadores
de una empresa antes y despus de la implementacin de un programa de
mejoramiento del ambiente laboral; el nivel de estrs se midi en una escala de
0= nada, 1= bajo, 2=medio, 3= alto y 4=muy alto, las calificaciones se muestran a
continuacin:
Participa
ntes
Condicin 1
Antes
Condicin 2
despus
3
3
2
2
2
2
1
4
2
1
1
0
2
3
-1
1
1
1
2
0
-2
1
2
3
4
5
6
7
Rango
ordenad
o
1
2
3
4
5
Rangos
Positivos
Rangos
Negativo
s
2.5
2.5
2.5
2.5
5.5
6
13
5.5
8
Pgina
CONCLUSIN:
No Existen diferencias en el nivel de estrs laboral de los trabajadores de una empresa
antes y despus de la implementacin de un programa de mejoramiento del ambiente
laboral. W= 1(6, > 0.05)
102
Se rechaza la H1 y se acepta H0
Estadstica Inferencial
SPSS
Pgina
103
En el visor de
resultados
obtendrs
un
Pgina
104
CONCLUSIN:
No Existen diferencias en el nivel de estrs laboral de los trabajadores de una empresa
antes y despus de la implementacin de un programa de mejoramiento del ambiente
laboral. W= 1(6, > 0.05)
Estadstica Inferencial
EJERCICIOS DE TAREA
1.- Un destacado grupo ecolgico planea realizar una campaa activa para fomentar la
conservacin de la flora y fauna silvestre en su pas. Como parte de la campaa, piensan
exhibir una pelcula producida con el fin de promover actitudes ms favorables hacia la
conservacin de la vida silvestre. Antes de exhibirla a todo el pblico, los promotores de
la campaa desean evaluar los efectos de la pelcula. Para eso se elige al azar a un grupo
de 10 participantes y se les proporciona un cuestionario que mide la actitud individual
hacia la conservacin de la vida silvestre. A continuacin, se les proyecta la pelcula y
despus de la exhibicin contestan de nuevo el cuestionario de actitudes. ste tiene 50
puntos posibles y cuanto ms alta sea la puntuacin, tanto ms favorable ser la actitud
hacia la conservacin de la vida silvestre. Los resultados se presentan en la siguiente
tabla:
H0=
Participa
ntes
1
2
3
4
5
6
7
8
9
10
Actitud
Antes Despus
40
44
33
40
36
49
34
36
40
39
31
35
30
27
36
42
24
35
20
28
Rango
ordenado
Rangos
Positivos
Rangos
Negativos
Pgina
105
Estadstica Inferencial
2.- Un investigador quiere determinar si la dificultad del material que han de aprender afecta el
nivel de ansiedad de los estudiantes universitarios. A cada uno de los miembros de una muestra
aleatoria de 12 alumnos se le asigna ciertas tareas de aprendizaje que se clasifican como fciles
y difciles. Antes que los estudiantes inicien cada tarea, se les presentan algunos ejemplos como
muestra del material que van a aprender. A continuacin, se mide el nivel de ansiedad que
mostraron los alumnos, mediante un cuestionario adecuado. De esta manera, se mide el nivel
de ansiedad antes de cada tarea de aprendizaje. Mientras ms alta sea la clasificacin, mayor
ser el nivel de ansiedad. Los datos se presentan en la siguiente tabla.
H0=
Participa
ntes
1
2
3
4
5
6
7
8
9
10
11
12
Ansiedad
Tareas Tareas
difciles fciles
48
40
33
27
46
34
42
28
40
32
27
24
31
33
42
39
38
31
34
39
38
29
44
34
Rango
ordenado
Rangos
Positivos
Rangos
Negativos
Pgina
106
Estadstica Inferencial
Kruskal-Wallis (H)
(Para muestras independientes)
Esta prueba debe usarse para diseos independientes cuando se aplican tres o ms
condiciones a participantes distintos. Como estos participantes son expuestos slo a una
de las condiciones para cada participante, todos los resultados de las tres condiciones
se deben clasificar de manera conjunta.
El objetivo de esta prueba es comprobar diferencias pronosticadas entre 3 o ms
condiciones experimentales a participantes distintos y las variables son ordinales.
Caractersticas:
Niveles de medicin ordinal.
Para 3 o ms grupos diferentes o no relacionado (participantes distintos).
Cuando son diferentes tratamientos o condiciones.
Muestras pequeas.
Lgica de prueba
La prueba compara los rangos obtenidos por cada uno de los grupos analizados, ordenando los
puntajes de la muestra total de menor a mayor. Suma Los rangos obtenidos por cada
submuestra y mediante la comparacin de ellos, haciendo uso de una frmula, obtiene el
estadstico H.
Pgina
107
Estadstica Inferencial
Regla de decisin
Si el coeficiente obtenido es mayor o igual al coeficiente de tabla se acepta la hiptesis
de investigacin.
Si obtenido crtico se rechaza la H0 y se acepta H1
Si obtenido < crtico se rechaza la H1 y se acepta H0
Pgina
108
Estadstica Inferencial
Pgina
109
Estadstica Inferencial
EJEMPLO
Un investigador quera averiguar el efecto que tienen distintos tipos de instrumentos en
la solucin de problemas. Al primer grupo se les dieron instrucciones escritas, a un
segundo grupo se les hizo una demostracin de cmo solucionar el problema pero no
se les dieron instrucciones escritas y al tercer grupo se les hizo la demostracin y adems
se les dieron instrucciones escritas.
Posteriormente se les pidi a los tres grupos que solucionaran el problema. Los puntajes
se obtuvieron contando el nmero de equivocaciones en los movimientos. Los puntajes
fueron los siguientes: =0.05
Grupo
1
20
27
19
23
89
Rango
1
3.5
9
1.5
6
20
400
Grupo
2
25
33
35
36
129
Rango 2
7.5
10
11
12
40.5
1640.25
Grupo
3
19
20
25
22
86
Rango 3
1.5
3.5
7.5
5
17.5
306.25
19
19
20
20
22
23
25
25
27
33
35
36
H1= Hay diferencias entre los instrumento que ayudan a la solucin de problemas.
H0= No existen diferencias entre los instrumento que ayudan a la solucin de
problemas.
1
2
3
4
5
6
7
8
9
10
11
12
12
2
= [
] 3 ( + 1)
( + 1)
12
2
= [
] 3 (12 + 1)
12(12 + 1)
= 12
= 1= 4
2 =4
3 = 4
= 1 = 20
2 = 40.5
3 =17.5
2 = 12 = 400 22 = 1640.25
12
[12(13)
400
4
1640.25
4
32 = 306.25
306.25
4
39=6.17
CONCLUSIN:
Existen diferencias entre los instrumentos que ayudan a la solucin de problemas (H=
6.12, gl=2, p<0.05).
Estadstica Inferencial
Pgina
110
SPSS
Para realizar el anlisis de datos para la prueba Kruskal Wallis en SPSS ocupamos definir
dos variables, la variable dependiente (Ej. solucin) y la variable categrica (Ej. Tipo
Instrumento) a la cual se le declara 3 valores, una vez declaradas las variables y
capturados los valores para cada una de ellas. Posteriormente se analizan los datos en
el men /Pruebas no paramtricas /k muestras independientes.
En la ventana
pruebas para
varias muestras
independientes
en el cuadro lista contrastar variables enviar la variable dependiente (Ej. Solucin) y
la variable categrica (Ej. Tipo Instrumento) a la variable de agrupacin, y en el botn
definir grupos se indican el valor mnimo y mximo de las condiciones (Ej.1 y 3).
Pgina
111
Estadstica Inferencial
Pgina
CONCLUSIN:
Existen diferencias entre los instrumento que ayudan a la solucin de problemas (H=
6.19, gl=2, p<0.05).
112
Estadstica Inferencial
113
Pgina
Estadstica Inferencial
EJERCICIOS DE TAREA
En un hospital se desea probar si existen diferencias en el nivel de estrs entre
enfermeras de terapia intensiva Gpo1, enfermeras de cirugas Gpo2, y enfermeras de
urgencias Gpo3; el nivel de estrs se midi en una escala de 0=nada, 1 = bajo, 2=medio,
3=alto y 4=muy alto, las calificaciones se muestran a continuacin:
H0=
Grupo
1
3
2
1
1
0
2
1
Rango
1
Grupo
2
3
3
4
4
2
2
1
Rango
2
Grupo
3
4
3
2
4
3
4
Rango 3
N=
n1=
n2=
n3=
Pgina
114
Estadstica Inferencial
Rango
1
65
84
87
53
70
85
56
63
Sin
capacitacin
90
85
76
87
92
86
93
Rango
2
Control
Rango 3
n1=
55
82
71
60
52
81
73
57
2
N=
n2=
n3=
Pgina
115
Estadstica Inferencial
Prueba de Friedman ( )
(Para muestras relacionados)
Se utiliza con diseos relacionados donde todas las condiciones experimentales se
aplican a los mismos participantes. Se utiliza cuando las tres condiciones se aplican a los
mismos participantes. Cada participante genera tres resultados, uno para cada una de
las tres condiciones. Esto permite hacer una comparacin directa entre los tres
resultados de cada participante con cada una de las tres condiciones. Los resultados
correspondientes a las distintas condiciones estn relacionados. Pero, como hay tres
condiciones, no es posible calcular las diferencias entre dos condiciones, como hacamos
en el caso de la prueba Wilcoxon.
El objetivo es comprobar si el total de categoras es distinto para cada una de las
condiciones. Si existen diferencias aleatorias entre los totales de categoras para las tres
condiciones, como establece la hiptesis nula.
Caractersticas:
Niveles de medicin ordinal.
Para 3 o ms grupos relacionados.
3 o ms condiciones a los mismos participantes.
Lgica de la prueba
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la diferencia no se
deba al azar (que la diferencia sea estadsticamente significativa)
2 = [(+1) 2 ] 3( + 1)
= Nmero de condiciones
= Nmero de personas
= Suma de los rangos para cada condicin
2 = Cuadrados de la suma de los rangos
2 = Suma de los cuadrados de TC
4.- Calcule los grados de libertad con la siguiente frmula
= Numero de condiciones
Pgina
116
gl= C 1
Estadstica Inferencial
Regla de decisin
Si el coeficiente obtenido es mayor o igual al coeficiente de tabla se acepta la hiptesis
de investigacin.
Si 2 obtenido 2 crtico se rechaza la H0 y se acepta H1
Si 2 obtenido < 2 crtico se rechaza la H1 y se acepta H0
Pgina
117
Estadstica Inferencial
Pgina
118
Estadstica Inferencial
EJEMPLO
1. Un editor que desea producir una serie de libros para nios, quiere seleccionar
entre tres tipos de ilustraciones la ms atractiva. Se le pide a 8 nios que ordenen
las tres ilustraciones en una escala de cinco puntos que va desde 1= nada buena
hasta 5= sumamente buena. Y se obtuvieron los siguientes puntajes:
H0=
Participantes
C1
Ilustracion1
2
1
3
3
2
1
5
1
18
Rango
C2
Rango
C3
1
Ilustracion2
2
Ilustracion3
1
1
5
3
4
2
1
5
3
3
3
1
5
2.5
5
4
2
5
3
2
5
1
3
2
5
6
1
4
2.5
4
7
3
3
2
2
8
1
4
3
3
11
34
21
28
121
441
Nota: Se asignan rangos a cada participante de manera horizontal
Rango
3
2
2
2.5
1
3
2.5
1
2
16
256
H0 = Los nios no ven diferencias entre las ilustraciones ms atractivas que otras.
H1 = Los nios consideraran unas ilustraciones ms atractivas que otras.
Sustituyendo valores en la formula.
12
12
12
C=3
N=8
T1= 11 T2= 21 T3= 16
T21= 121 T22= 441 T23= 256
2 = 818
2 obtenido= 6.25
Obtener valor de Friedman en tabla (tabla 7)
gl= 3-1 = 2
Pgina
CONCLUSIN:
El investigador predijo que los nios consideraran unas ilustraciones ms atractivas que
otras.
( 2 = 6.25, gl=2, p< 0.05)
Estadstica Inferencial
119
2 tabla =6.75
SPSS
Para realizar el anlisis de datos con la prueba de Friedman en SPSS ocupamos definir
tres variables una para cada condicin, una vez declaradas las variables y capturados
los valores para cada una de ellas nos vamos al men Analizar/Pruebas no paramtricas
/k muestras relacionadas.
Pgina
120
En
la
ventana
pruebas para varias
muestras
relacionadas
se
envan todas las
variables a analizar
al cuadro variables
de contraste en el
botn estadsticos seleccionar descriptivos, dar clic en continuar, en tipo de prueba
seleccionar Friedman y por ltimo en aceptar.
Estadstica Inferencial
Pgina
121
Estadstica Inferencial
EJERCICIOS DE TAREA
1. Se desea probar que hay diferencias en el nivel de estrs laboral en trabajadores
de una empresa antes y despus de un taller sobre el manejo del estrs. Se midi
en una escala de 0= nada, 1=bajo, 2=medio,3=alto,4=muy alto, las calificaciones
se muestran a continuacin:
H0=
Participantes
1
2
3
4
5
6
7
C1
antes
Rango
1
3
3
2
4
3
3
1
C2
Despus
2
1
1
2
1
0
2
Rango
2
C3
1mes
despus
3
2
1
2
2
1
4
Rango 3
REFERENCIAS
Wayne,D. (2011) Bioestadstica: Base para el anlisis de las ciencias de la salud. Cuarta edicin
Ed. Limusa.
Pgina
122
http://platea.pntic.mec.es/~anunezca/ayudas/probabilidad/probabilidad.htm
Estadstica Inferencial