Sunteți pe pagina 1din 57

UNIVERSIDAD PERUANA CAYETANO HEREDIA FACULTAD DE PSICOLOGIA GABINETE DE INSTRUMENTOS PSICOLGICOS

MATERIALES DE INFORMTICA

PHEP v. 1.0 Prueba de hiptesis y estimacin de parmetros


Lic. Andrs Burga Len LIMA, 2003

Derechos Reservados Universidad Peruana Cayetano Heredia Facultad de Psicologa

PRESENTACION DE LA SERIE

El presente programa se ubica dentro de una serie producida por el Gabinete de Instrumentos Psicolgicos de la Facultad de Psicologa de la Universidad Peruana Cayetano Heredia, dirigida a estudiantes y profesionales de la psicologa y diversas especialidades. Esta serie, denominada Materiales de Informtica surge a partir de la experiencia de los docentes de los cursos vinculados a las reas de matemticas, estadstica y psicometra, pues el realizar los clculos de forma manual, si bien fomenta el aprendizaje matemtico, hace ms probable la ocurrencia de errores de clculo, los cuales pueden impactar de forma negativa al proceso de toma de decisiones. Sabemos que una decisin se toma sobre la base de la informacin, y esta informacin debe ser lo ms vlida y confiable posible. En ese sentido, con esta serie de programas, creemos que al reducir la probabilidad del error de clculo, estamos contribuyendo de una forma sustancial a la calidad de la informacin de base cuantitativa sobre la cual se basan muchas de las decisiones profesionales. En nuestro medio, adems en muchos caso no encontramos un software accesible por cuestiones econmicas que cumpla las funciones que desempean los programas de esta serie, que por su sencillez, creemos que presentan una gran utilidad.

La serie hasta el momento cuenta con los siguientes paquetes informticos: TAPF v.1.0, programa para el manejo de notas ETCon v.1.0 Estadsticos para Tablas de Contingencia MCP v. 1.0 Mdulo de Clculos Psicomtricos PHEP v 1.0 Prueba de Hiptesis y Estimacin de Parmetros

Esperemos que esta entrega le resulte til y sea de su agrado. Andrs Burga Len

INDICE
PRIMERA PARTE
1. INTRODUCCIN...........................................................................................9 1.1 QU ES LA ESTADSTICA?................................................................9 1.2 VARIABLES Y CONSTANTES...........................................................10 1.3 TIPOS DE VARIABLES........................................................................11 2. LAS ESCALAS DE MEDICIN..................................................................12 3. LA INFERENCIA ESTADSTICA...............................................................13 3.1 LA DISTRIBUCIN MUESTRAL DE UN ESTADSTICO................14 3.2 EL ERROR TPICO................................................................................15 3.3 ESTIMACION DE PARAMETROS......................................................15 3.3.1 ESTIMACION PUNTUAL Y POR INTERVALOS......................16 3.3.2 ESTIMACIN DE LA MEDIA ARITMTICA ...........................19 3.3.3 ESTIMACIN DE PROPORCIONES...........................................19 3.3.4 ESTIMACIN DE LA VARIANZA..............................................20 3.4 CONTRASTE DE HIPTESIS..............................................................20 3.4.1 HIPOTESIS NULA E HIPTESIS ALTERNA.............................21 3.4.2 DIRECCIONALIDAD DE LAS HIPTESIS................................22 3.4.3 TOMA DE DECISIONES..............................................................23 3.4.4 CONTRASTE DE HIPTESIS SOBRE LA MEDIA....................26
3.4.4.1 UNA SLA MUESTRA....................................................................26 3.4.4.2 DOS MUESTRAS INDEPENDIENTES SUPONIENDO VARIANZAS IGUALES................................................................26 3.4.4.3 DOS MUESTRAS INDEPENDIENTES SUPONIENDO VARIANZAS DISTINTAS............................................................27 3.4.4.4 DOS MUESTRAS RELACIONADAS..............................................28

3.4.5 CONTRASTE DE PROPORCIONES............................................28

3.4.5.1 EL CASO DE UNA MUESTRA........................................................29 3.4.5.2 DOS MUESTRAS INDEPENDIENTES............................................29 3.4.5.3 DOS MUESTRAS RELACIONADAS..............................................29

3.4.6 CONSTASTE DE HIPTESIS SOBRE LA VARIANZA............30


3.4.6.1 DOS MUESTRAS INDEPENDIENTES............................................30 3.4.6.2 DOS GRUPOS RELACIONADOS....................................................31

1. ESTIMACION DE PARAMETROS.............................................................35 1.1 ESTIMACION DE LA MEDIA.............................................................35 1.2 ESTIMACION DE PROPORCIONES...................................................36 1.3 ESTIMACION DE LA VARIANZA......................................................37 2. CONTRASTE DE HIPTESIS.....................................................................38 2.1 CONTRASTE DE MEDIAS...................................................................38 2.1.1 UN SOLO GRUPO.........................................................................38 2.1.2 DOS GRUPOS INDEPENDIENTES SUPONIENDO VARIANZAS HOMOGNEAS..............................................40 2.1.3 DOS GRUPOS INDEPENDIENTES SUPONIENDO VARIANZAS HETEROGENEAS..........................................41 2.1.4 DOS GRUPOS RELACIONADOS................................................43 2.2 CONTRASTE DE PROPORCIONES....................................................44 2.2.1 UN SOLO GRUPO.........................................................................45 2.2.2 DOS GRUPOS INDEPENDIENTES.............................................47 2.2.3 DOS GRUPOS DEPENDIENTES..................................................48 2.3 CONTRASTE DE VARIANZAS...........................................................51 2.3.1 DOS GRUPOS INDEPENDIENTES.............................................51 2.3.2 DOS GRUPOS RELACIONADOS................................................52 3. REFERENCIAS.............................................................................................56

PRESENTACIN DEL PROGRAMA El programa PHEP v. 1.0 ha sido desarrollado con la finalidad de facilitar los procedimientos de clculo propios de la estadstica inferencial, como son la estimacin de parmetros y el contraste de hiptesis. Para el primer caso, hemos considerados la estimacin de medias, de la varianza y de una proporcin. En cuanto al contraste de hiptesis, puede efectuarse para la media, contrastndola con un valor terico, en dos grupos independientes, o en dos grupos dependientes. Se puede adems contrastar hiptesis referidas a proporciones, para el caso de dos grupos independientes, dos grupos dependientes, o un valor terico. Finalmente tenemos la posibilidad de efectuar contrastes de hiptesis referidas a la varianza, tanto para dos grupos independientes, como para dos dependientes. Esperamos que este programa le resulte muy til tanto a los estudiantes como profesionales de la Psicologa y Ciencias Sociales en general. Lic. Andrs Burga Len

1.

INTRODUCCIN

Esta primera parte no pretende ser una revisin terica exhaustiva de todos los aspectos vinculados a la estimacin de parmetros y al contraste de hiptesis. Lo que queremos es dar unos lineamientos generales que sirvan principalmente como soporte de los temas tratados. 1.1 QU ES LA ESTADSTICA?

Al enfrentarnos a esta pregunta, muchos personas legas en la materia, podemos asociar a este trmino las tablas y grficas con datos numricos que aparecen muchas veces en diversos diarios, revistas o en la televisin (Botella, Len y San Martn, 1996). Es decir, el trmino estadstica (o estadstico) es usado para denotar a los datos en s mismos, o nmeros derivados de ellos. Por ejemplo, si decimos que el promedio de notas en Matemticas I es 15.76, este valor constituye una estadstica. Nosotros proponemos que la estadstica es una rama aplicada de las matemticas que se encarga del estudio de los mtodos para recoger, organizar, resumir y analizar datos. Todo esto se realiza para poder extraer conclusiones vlidas y tomar decisiones razonables basadas en los datos numricos. Tambin en importante considerar que la estadstica puede dividirse en dos ramas (Guilford y Fruchter, 1986; Botella, Len y San Martn, 1996):

La estadstica descriptiva que nos sirve, tal y como su nombre lo indica, para describir las caractersticas de un grupo. Se habla aqu de distribuciones de frecuencias, medidas de tendencia central, medidas de variabilidad, medidas de posicin y medidas de asociacin. Y la estadstica inferencial que nos informa del grado de bondad en el cual las mediciones obtenidas en muestras representan a la poblacin. Dentro de este campo se ubica la estimacin de parmetros y el contraste de hiptesis.

1.2

VARIABLES Y CONSTANTES

La estadstica trabaja con variables y constantes, mediante las cuales se realizan las diferentes operaciones matemticas, tanto descriptivas como inferenciales. (Spiegel, 1961; Garret, 1971) Una variable puede ser entendida como algo que vara (Spiegel, 1961; Kerlinger y Lee 2001), es decir, algo que puede obtener diferentes valores. Adems las variables generalmente reciben un nombre mediante el cual se las identifica. Por ejemplo, la variable llamada sexo, puede recibir los valores masculino o femenino. Tambin podemos poner como ejemplo a la variable Nota en lenguaje, que segn nuestro sistema educativo, puede obtener cualquier valor entre 0 y 20. Otro ejemplo de variable puede ser Coeficiente Intelectual, que podra recibir valores como 102, 98, 121, 110, etc. En cambio una constante tiene valores fijos y generalmente se representa por letras (Spiegel, 1961). Por ejemplo, si decimos que en la siguiente ecuacin

10

(llamada ecuacin lineal simple): Y = a + bX

a y b son constantes

con valores 3 y 2 respectivamente; adems X e Y son variables, la ecuacin puede definirse numricamente como: (7) = 3 + 2(2) (11) = 3 + 2(4) (9) = 3 + 2(3), etc. Vemos que los valores de a y b no han cambiado(son constantes) y los valores de X e Y si han cambiado (son variables).

1.3

TIPOS DE VARIABLES

En general podemos diferenciar entre variables continuas y discretas. (Guilford y Fruchter, 1984; Spiegel, 161) Las variables discretas tienen nicamente valores enteros. Es decir, la variable B puede recibir valores como 2, 5, 6, 8, 12. Las variables continuas pueden tener valores decimales. Es decir, la variable A puede recibir valores como 12.33, 5.39, 6.81, 8.34, 12.01. Otra forma de clasificar a las variables est dada por le nmero de categoras, teniendo bsicamente slo dos categoras o ms de dos categoras (Elorza, 1987; Amn, 1993). Se denomina variable politmica a aquella que tiene ms de dos valores. Por ejemplo, los puntajes directos de una prueba de inteligencia, o los niveles socio-econmicos (alto, medio, bajo). Cuando la variable tiene nicamente dos valores nos podemos encontrar frente a dos casos: las variables dicotmicas y las variables dicotomizadas.

11

Una variable dicotmica tiene nicamente dos valores, por ejemplo sexo slo tiene los valores masculino y femenino. La repuesta a una pregunta de opcin mltiple solo tiene acierto o fallo. La variable dicotomizada si bien presente slo dos categoras, es en realizada una variable politmica que a sido recodificada en dos. Por ejemplo, las notas en una curso de matemticas (entre 0 y 20) pueden ser dicotomizadas en aprobados (11 a 20) y desaprobados (0 a 10).

2.

LAS ESCALAS DE MEDICIN

Los datos que se utilizan como resultado de las mediciones en los procedimientos de recoleccin de datos, pertenecen a diversas escalas de medicin. Estas escalas difieren en el tipo de informacin que pueden brindar, as tenemos escalas nominales o categricas, escalas ordinales, escalas de intervalo y escalas de razn. (Amn, 1993; Blalock, 1998; Kerlinger y Lee, 2001) Las escalas nominales son aquellas que nos permiten determinar la presencia o no de un atributo en un objeto y brindan informacin con respecto a la frecuencia con que el atributo se presenta en una coleccin de objetos. Estas escalas no implican ningn tipo de relacin matemticas aparte del conteo. Por ejemplo uno puede ser clasificado segn la variable Religin como Catlico, Protestante, Mormn, Judo, sin que ello implique que una religin e mejor que otra. Las escalas ordinales nos permiten, como su nombre lo indica, ordenar una coleccin de objetos en funcin a la propiedad mayor que o menor que,

12

referidas a la magnitud con que presentan un determinado atributo. Por ejemplo, podemos referirnos a la clase social, que segn un conjunto de indicadores podra categorizarse como Alta, Media y Baja. Las escalas de intervalo permiten medir la magnitud con que se presenta un atributo en una objeto y adems brinda informacin con respecto a la magnitud de la diferencia que presenta un objeto con respecto a los dems que objetos que poseen la misma propiedad en distintas magnitudes. Sin embargo, el establecimiento del punto cero es arbitrario. Es decir, no existe un cero absoluto. Como ejemplo podemos sealar a las escalas de temperatura C y F. Tambin se considera que las puntuaciones directas de la mayora de prueba psicolgicas constituyen escalas de intervalo. Las escalas de razn tienen las mismas propiedades que las escalas de intervalo, pero adems poseen un cero absoluto. Como ejemplo podemos mencionar a los grados Kelvin, que tiene un cero absoluto de temperatura, cuyo equivalente en grados centgrados es 273 grados.

3.

LA INFERENCIA ESTADSTICA

La utilizacin de un mtodo de muestreo apropiado implica que la informacin obtenida en la muestra es un reflejo de la informacin de la poblacin (Calzada, 1996; Martnez, 1997). Podemos utilizar los datos de la muestra para tener una idea de las propiedades de la poblacin, es decir, podemos efectuar inferencias sobre las poblaciones a partir de las muestras. Estas inferencias pueden adoptar mltiples formas, pero las ms usuales son la estimacin de parmetros y el contraste de hiptesis 13

(Pardo y San Martn, 1999). Como lo sealan Guilford y Fruchter (1984), la estadstica inferencial o muestral nos indicar con qu grado de bondad las mediciones obtenidas en muestras aisladas representan a las poblaciones de las cuales se sacaron las muestras.

3.1

LA DISTRIBUCIN MUESTRAL DE UN ESTADSTICO

El trmino distribucin muestral hace referencia a la funcin de probabilidad de un estadstico (Botella y otros, 1996). Se constituye en una distribucin terica que asigna una probabilidad concreta a cada uno de los valores que puede tomar un estadstico en todas las muestras del mismo tamao que es posible extraer de una determinada poblacin (Pardo y San Martn, 1999). El conocimiento de la forma de la distribucin muestral de un estadstico es importante pues a partir de su conocimiento se pueden establecer conclusiones que en nuestro caso constituyen las inferencias estadsticas (Guilford y Fruchter, 1984). Como lo sealan Guilford y Frchter (1984), para comprender mejor el concepto de distribucin muestral de un estadstico, supongamos que se procede a sacar muestras aleatorias y todas de igual tamao de una poblacin, una al mismo tiempo. Adems, el muestreo se efecta con reposicin, es decir, se vuelve a colocar en la poblacin cada elemento que se saque despus de anotar su valor y antes de sacar el elemento siguiente. Si a cada una de esas muestras se le calcula la media aritmtica, se podr trazar una distribucin de frecuencias con esos valores. Esta distribucin es la llamada distribucin muestral, que cuando es lo suficientemente grande tiene una media igual a la media de la poblacin

14

3.2

EL ERROR TPICO

El error tpico o error estndar es la desviacin estndar de una distribucin muestral (Calzada, 1996; Kerlinger y Lee, 2001) es decir, constituye la dispersin del estadstico y la cuanta de esta dispersin nos permite saber hasta dnde se puede esperar que los estadsticos muestrales se aparten de los parmetros en la poblacin. Si se va a utilizar un estadstico como estimacin de su parmetro, toda desviacin del estadstico respecto a su valor en la poblacin puede considerarse como un error de estimacin (Pardo y San Martn, 1999). El error tpico de la distribucin muestral del estadstico nos informa sobre la magnitud de esos errores de estimacin en una situacin de muestreo especfica. Por lo cual se le llama error tpico o error estndar (Guilford y Fruchter, 1984).

3.3

ESTIMACION DE PARAMETROS

La estimacin de parmetros trata de definir cul es el valor de un parmetro a partir del conocimiento de un estadstico en la muestra (Elorza, 1987; Blalock 1999) Un parmetro es un valor numrico que describe una caracterstica de una poblacin y suele representarse mediante los caracteres del alfabeto griego (Spiegel, 1966; Pardo y San Martn, 1999). Los trminos universo y poblacin suelen ser intercambiables en el lenguaje de la estadstica (Blalock, 1998)

15

Un estadstico es un valor numrico que describe una caracterstica en una muestra y se representa mediante caracteres del alfabeto occidental (Spiegel, 1966; Pardo y San Martn, 1999). Aquel estadstico que es utilizado como punto de partida para estimar el valor de su parmetro correspondiente se le conoce como estimador (pardo y San Martn, 1999). A continuacin presentamos una tabla, que nos muestra la manera como se pueden simbolizar algunos estadsticos (muestra) y sus parmetros (poblacin) correspondientes: Indicador Media Aritmtica Varianza Desviacin Estndar Proporcin Correlacin de Pearson Muestra x s2 s p r Poblacin 2

3.3.1

ESTIMACION PUNTUAL Y POR INTERVALOS

La estimacin de parmetros muestra dos vertientes (Blalock, 1998, Pardo y San Martn, 1999). Una de ellas es la ms sencilla y se conoce como estimacin puntual. Consiste en asignar un valor muestral concreto al parmetro poblacional que se desea estimar, es decir, se atribuye al parmetro poblacional el valor tomado por su correspondiente estadstico en una muestra concreta. La otra vertiente es la estimacin por intervalos. Consiste en atribuir al parmetro que se desea estimar no un valor concreto sino un rango de valores entre los que se espera que pueda encontrarse el verdadero valor del parmetro o una probabilidad alta y conocida.

16

Pardo y San Martn (1999), sealan que un estadstico ser considerado como buen estimador de su correspondiente parmetro si posee las siguientes propiedades: 1. Carencia de sesgo: El valor esperado del estadstico coincide con el parmetro que estima. Esto implica que un buen estimador debe ofrecer en promedio estimaciones correctas. 2. Consistencia: Implica que a medida que va aumentando el tamao de la muestra tambin va aumentando la probabilidad de que el estimador coincida con su parmetro. Esto se debe a que cuando el tamao muestral tiende al infinito, el error estndar del estimador es cero. 3. Eficiencia: Indica que el estimador vara menos de una muestra a otra mientras ms eficiente es. Esto quiere decir que, mientras menor es la varianza de un estimador, mayor es su eficiencia, lo cual a su vez impacta de manera positiva en la precisin de las estimaciones realizadas. 4. Suficiencia: Un estimador es suficiente si utiliza toda la informacin muestral relacionada con dicho estimador para inferir el parmetro de la poblacin. Esto quiere decir que la estimacin del parmetro no puede ser mejorada si se consideran otros aspectos de los datos, aparte de aquellos incluidos en la distribucin muestral del estadstico usado como estimador. En trminos generales, en la estimacin por intervalos se trata de obtener dos valores que permitan afirmar que existe una alta probabilidad de que el verdadero valor del parmetro se encuentre entre dichos valores (Garret, 1971; Hays, 1973). Para obtener estos valores se suma y resta una cantidad a un estimador puntual. Dicha cantidad se encuentra relacionada con el error tpico de su distribucin muestral (Guilford y Fruchter, 1984; Elorza, 1987; Pardo y San Martn, 1999). 17

Esta operacin matemtica, nos dar como resultado dos valores, llamados lmites de confianza a los cuales se les denomina lmite inferior y lmite superior. Adems, llamamos intervalo de confianza al rango de valores comprendidos entre los lmites de confianza (Blalock, 1998). El intervalo de confianza lleva asociado un nivel de confianza, el cual representa la probabilidad de que el intervalo construido incluya el verdadero valor del parmetro (Pardo y San Martn, 1999). Se ha convenido hacer una eleccin arbitraria para adoptar dos niveles de confianza especiales (Guilford y Fruchter, 1984). Estos son el nivel del 5% (0.05) y 1% (0.01). Sin embargo, es posible utilizar cualquier nivel de confianza especfico, si se conoce la distribucin muestral del estimador. En resumen, la estrategia general para estimar un parmetro consiste en pensar que el verdadero valor del parmetro no se alejar del estadstico obtenido en ms de una cantidad determinada, relacionada con el error estndar o error tpico (Pardo y San Martn, 1999). De manera resumida Pardo y San martn (1999) nos dicen que el proceso de estimacin por intervalos es el siguiente: 1. Se determina el nivel de riesgo o probabilidad de que el intervalo construido no incluya el verdadero valor del parmetro. A este riesgo se le conoce como nivel alpha. 2. Se busca la puntuacin en la distribucin muestral del estadstico correspondiente a ese nivel de riesgo. 3. Se calcula el error tpico de la distribucin muestral del estadstico. 4. Se calcula el valor del error mximo, es decir, el tamao de la distancia mxima que con una determinada probabilidad esperamos que 18

exista entre el verdadero valor del parmetro estimado y el valor del estadstico utilizado como estimador. 5. Se calcula el lmite superior y el lmite inferior a partir de los cuales se construye el intervalo de confianza.

3.3.2

ESTIMACIN DE LA MEDIA ARITMTICA

Si se est trabajando con una variable que se distribuye normalmente, o si el tamao de la muestra es lo bastante grande, la distribucin muestral de la media aritmtica es normal. El intervalo de confianza puede construirse mediante la siguiente frmula, basada en la distribucin t de Student. Si la muestra es los suficientemente grande, la distribucin tiende a la normalidad (Pardo y San Martn, 1999):

X
3.3.3

/ 2 n 1

Sx n 1

ESTIMACIN DE PROPORCIONES

La distribucin muestral de la proporcin tiende a la normalidad a medida que el tamao de la muestra va aumentando. Los lmites de confianza para la proporcin, en muestras pequeas se pueden obtener a travs de la siguiente ecuacin (Pardo y San Martn, 1999):
2 p+ Z Z 2n

n n+Z2

p (1 p ) Z 2 + 2 n 4n


19

Pardo y San Martn (1999) sealan que si la muestra es bastante grande, puede emplearse la siguiente ecuacin para obtener los lmites de confianza:

p Z / 2
3.3.4

p (1 p ) n

ESTIMACIN DE LA VARIANZA

La varianza tiene una distribucin muestral segn Chi Cuadrado con n 1 grados de libertad.

Li =

2 nS x 2 1 / 2 n 1

Ls =

nS x2 2 / 2 n 1

Si el tamao de la muestra es bastante grande (mayor a 100), la distribucin muestral de la varianza tiende a la normalidad pudiendo construirse un intervalo de confianza con la siguiente frmula (Pardo y San Martn, 1999):

2 2 S x Z / 2 S x

2 n

3.4

CONTRASTE DE HIPTESIS

Gran parte de la labor de la investigacin esta orientada a determinar en que medida las hiptesis planteadas son aceptables (Kerlinger y Lee, 2001). Para 20

realizar una decisin objetiva es necesario utilizar procedimientos que lleven a un criterio objetivo para aceptar o rechazar las hiptesis; es este el papel que desempean las pruebas estadsticas planteadas. Pardo y San Martn (1999) consideran que el contraste de hiptesis puede ser entendido como un mtodo de toma de decisiones pues es un procedimiento que nos permite decidir si una proposicin acerca de una poblacin puede ser mantenida o rechazada sobre la base de la informacin que podemos ver en una muestra. Adems estos autores resumen del proceso de la siguiente manera: 1. El primer paso del contraste de hiptesis consiste en formular estadsticamente la hiptesis cientfica que se desea contrastar, es decir, se supone que una hiptesis cientfica puede ser formulada en trminos de la forma de una o varias distribuciones poblacionales o en trminos del valor de uno o ms parmetros de dichas distribuciones. 2. 3. El segundo paso implica la bsqueda de evidencia emprica relevante para establecer si la hiptesis planteada puede o no ser sostenida. El tercer paso implica establecer una regla de decisin en trminos probabilsticos. Si el resultado muestral observado es, suponiendo correcta nuestra hiptesis muy poco probable, consideraremos que nuestra hiptesis es incompatible con los datos. Por el contrario, si el resultado muestral es probable, suponiendo nuestra hiptesis correcta, consideraremos que nuestra hiptesis es compatible con los datos.

3.4.1

HIPOTESIS NULA E HIPTESIS ALTERNA

21

El contraste de hiptesis se basa en la formulacin de dos hiptesis exhaustivas y mutuamente excluyentes conocidas como: hiptesis nula e hiptesis alterna (Garret, 1971; Everitt, 1999; Kerlinger y Lee, 2001). La hiptesis nula es aquella que se somete a contraste y su nombre hace referencia a que suele afirmar que el valor de los parmetros es el mismo, es decir, la diferencia entre ellos es nula. Por ejemplo, la hiptesis: El nivel de ansiedad del grupo control es igual al nivel de ansiedad del grupo experimental puede formularse en trminos estadsticos como se muestra a continuacin:

H 0 : x1 = x 2
Por el contrario, la hiptesis alterna es la negacin de la hiptesis nula e incluye todo lo que sta excluye. Esta hiptesis es inexacta en el sentido que establece que una variable es distinta, menor o mayor que otra. Siguiendo el ejemplo anterior, la hiptesis alterna puede formularse como: El nivel de ansiedad del grupo control es diferente al nivel de ansiedad del grupo experimental, lo cual se simboliza como:

H 1 : x1 = x 2

3.4.2

DIRECCIONALIDAD DE LAS HIPTESIS

En general, los contrastes de hiptesis pueden plantearse como unilaterales o bilaterales (Garret, 1971; Blalock, 1998; Pardo y San Martn, 1999). Un contraste bilateral no establece direccionalidad en el sentido que no se seala si un grupo contrastado es menor o mayor que otro grupo, sino que simplemente se establece como hiptesis alterna que ambos grupos son 22

diferentes. En esta caso, la hiptesis nula ser descartada tanto si el estadstico a contrastar en el grupo 1 es mayor o menor que en el grupo 2, en trminos de significancia probabilstica. El contraste unilateral contiene una prediccin concreta sobre la direccin en la que se puede producir un resultado muestral incompatible con la proposicin de la hiptesis nula. Esta direccionalidad se expresa en la hiptesis alterna mediante los signos > <. A manera de resumen podemos mostrar la siguiente tabla con las correspondientes hiptesis, tanto nula como alterna para los diferentes tipos de contraste. Tipo de contraste Bilateral Unilateral derecho Unilateral izquierdo Hiptesis nula (H0) 1 = 2 1 2 1 2 Hiptesis alterna (H1) 1 2 1 > 2 1 < 2

3.4.3

TOMA DE DECISIONES

La toma de decisiones en el contexto del contraste de hiptesis implica la aceptacin o rechazo de H0 (Calzada, 1966; Hays, 1973; Blalock, 1998). Una alternativa usual, consiste en trazar regiones crticas o regiones de rechazo, teniendo en cuenta la distribucin muestral del estadstico y el nivel de confianza deseado. Si el valor del estadstico de contraste calculado cae dentro de la regin crtica, se rechaza la hiptesis nula, y se acepta la hiptesis alterna (Garret, 1971; Guilford y Fruchter, 1984; Kerlinger y Lee, 2001).

23

Otra alterativa para la toma de decisiones (aceptacin o rechazo de H0) se basa el valor p que equivale a la probabilidad de obtener un resultado estadstico (valor del estadstico calculado) tan extremo como el observado, siendo la hiptesis nula verdadera (Everitt, 1996) Los diferentes programas informticos para el manejo estadstico arrojan entre sus resultados el valor p asociado a la distribucin muestral del estadstico de contraste, y se suele rechazar H0 cuando su valor es inferior al nivel de significancia previamente establecido. Generalmente, cuando el valor p es menor a 0.05 se rechaza H0, aunque pueden establecerse valores ms conservadores como 0.01 (Everitt, 1996; Kerlinger y Lee, 2001) Es importante considerar que la decisin estadstica, siempre lleva asociada una probabilidad de error (Guirford y Fruchter, 1984). En concreto, podemos sealar que estos errores van a depender de la combinacin de la decisin que tomemos con respecto a la hiptesis nula (aceptarla o rechazarla) y la naturaleza de la hiptesis nula (si realmente es verdadera o es falsa). NATURALEZA Verdadera Falsa Correcto Error tipo 2 1- Error tipo I Correcto 1-

DECISIN Aceptar Rechazar

Es decir, se pueden cometer dos tipos de errores al enfrentarse con la decisin de aceptar o rechazar la hiptesis nula (Guilford y Fruchter, 1984; Pardo y San Martn, 1999; Kerlinger y Lee, 2000): Error tipo I: se descarta la hiptesis nula cuando en realidad es verdadera Error tipo II: aceptar la hiptesis nula cuando en realidad es falsa.

24

La probabilidad de cometer un error tipo uno, est fijada de antemano por el investigador, y como se dijo con anterioridad, suelen fijarse niveles de confianza de 0.05 0.01 (Guilford y Fruchter, 1984). Sin embargo la probabilidad de cometer un error tipo II es un poco ms compleja, pues depende de factores como la verdadera naturaleza de la hiptesis alterna, el tamao del error estndar de la distribucin muestral utilizada para efectuar el contraste, y el nivel de significancia alpha (Pardo y San Martn, 1999).

25

3.4.4

CONTRASTE DE HIPTESIS SOBRE LA MEDIA

Presentamos a continuacin las diversas frmulas que se pueden emplear en el contraste de hiptesis referida a la diferencia de medias. Todas ellas suponen que la variable que se est contrastando tiene una distribucin normal. Es decir, son pruebas paeramtricas.

3.4.4.1

UNA SLA MUESTRA

Si queremos contrastar la media obtenida en una muestra (x) con un valor terico () podemos usar una distribucin t de Student con n-1 grados de libertad:

t=

x sx n 1

3.4.4.2

DOS

MUESTRAS

INDEPENDIENTES

SUPONIENDO

VARIANZAS IGUALES

Para este tipo de contraste, tambin se emplea la distribucin t de Student, con (n1 + n2) - 2 grados de libertad:

t=

x1 x 2
2 ( n1 1) s12 + (n2 1) s 2 n1 + n 2 2

1 1 + n n 2 1

26

3.4.4.3

DOS

MUESTRAS

INDEPENDIENTES

SUPONIENDO

VARIANZAS DISTINTAS

En el caso de suponer o comprobar que las varianzas de los dos grupos a contrastarse son distintas, se puede utilizar tambin una distribucin t de Student, slo que los grados de libertad debern aproximarse con frmulas ms complejas, como mostraremos luego. El contraste t tiene la siguiente frmula:

t=

x1 x 2
2 s12 s 2 + n1 n2

Los grados de libertad pueden aproximarse con diferentes frmulas, pero presentamos la optimizacin de Welch, cuyo resultado debe redondearse al entero ms prximo, a fin de obtener los grados de libertad con los cuales se puede obtener la probabilidad asociada al valor t calculado (Pardo y San Martn, 1999):
2

g.l. =

2 s12 s 2 + n 1 n2 2

2 s12 s2 n 1 + n2 n1 1 n2 1

27

3.4.4.4

DOS MUESTRAS RELACIONADAS

Las muestras relacionadas son tpicas de los diseos antes y despus (conocidos tambin como diseos pre y post test (Kerlinger y Lee, 2001). En esta situacin, tambin se aplica un contraste basado en la distribucin t de Student, que se distribuye con n-2 grados de libertad. Se contraste la media obtenida en el pre test (x1) con la media obtenida en el post test (x2). La frmula se presenta a continuacin:

t=

x1 x2 sD n

En este caso el error estndar que se obtiene est basado en la desviacin estndar de los puntajes diferenciales. El puntaje diferencial (D) se obtiene al restar del puntaje obtenido en el pre test de cada persona, el puntaje obtenido en el post test. Posteriormente se calcula la desviacin estndar insesgada de dichos puntajes diferenciales:

sD =

( D D)
n 1

3.4.5

CONTRASTE DE PROPORCIONES

En esta parte, mostramos las diversas frmulas que se pueden emplear en el contraste de hiptesis referida a las diferencias de proporciones.

28

3.4.5.1

EL CASO DE UNA MUESTRA

Se puede contrastar el valor obtenido en una muestra (p) frente a un valor terico (), segn una distribucin Z:

Z=

p (1 ) n

3.4.5.2

DOS MUESTRAS INDEPENDIENTES

Cuando se quiere contrastar dos proporciones obtenidas en dos muestras independientes, tambin se emplea la distribucin Z:

Z=

p1 p 2 p1 (1 p1 ) p 2 (1 p 2 ) + n1 n2

3.4.5.3

DOS MUESTRAS RELACIONADAS

Para este tipo de contraste no slo se necesita el dato de la proporcin, sino la cantidad de personas que caen dentro de las categoras dicotmicas (1/0) en cada una de las mediciones, de tal manera que se completa una tabla de doble entrada. Es decir, se cruzan las categoras 1/0 de la primera medida, con las categoras 1/0 de la segunda medida, dando origen a una tabla de 2x2.

Despus 29

Pardo y San Martn (1999) sealan que si tenemos dos muestras relacionadas grandes (n > 30), se puede utilizar un contraste basado en la distribucin Chi cuadrado, que se distribuye con n-1 grados de libertad:

Antes

Categora 1 Categora 0

Categora 1 n11 n01

Categora 0 n10 n00

(n10 n01 ) 2 = n10 + n01


2

Los mismos autores indican que para muestras pequeas, se puede usar el estadstico de contraste T que sigue una distribucin binomial, siendo sus parmetros n = n10 + n01 y =0.5

T = n10

3.4.6

CONSTASTE DE HIPTESIS SOBRE LA VARIANZA

Finalmente presentamos las frmulas empleadas en los contrastes de hiptesis sobre la varianza.

3.4.6.1

DOS MUESTRAS INDEPENDIENTES

30

Para el caso de dos muestras independientes, se emplea un contraste segn la distribucin F de Snedecor, con g.l. 1 = ng - 1 y g.l. 2 = np -1. Los subndices g y p hacen referencia al grupo con la varianza ms grande (g) y al grupo con la varianza ms pequea (p). La frmula para realizar el contraste es bastante sencilla:

F=

2 sg

s2 p

3.4.6.2

DOS GRUPOS RELACIONADOS

Cuando se tienen dos muestras relacionadas y se quiere contrastar la diferencia de sus varianzas, se emplea un contraste basado en la distribucin t de Student con n - 2 grados de libertad:

t=

( F 1) n 2 2 F (1 r 2 )

En esta frmula F hace referencia al cociente presentado para el caso de las varianzas independientes, y r se refiere al coeficiente de correlacin entre los puntajes en ambas situaciones (pre y post test, por ejemplo).

31

32

SEGUNDA PARTE USO DEL PROGRAMA PHEP v. 1.0

33

34

1.

ESTIMACION DE PARAMETROS

El programa nos permite construir intervalos de confianza para diversos parmetros de la poblacin (media, varianza y proporcin) a partir del conocimiento de los estadsticos obtenidos en una muestra representativa. 1.1 ESTIMACION DE LA MEDIA

Con estos mdulos, podemos construir intervalos de confianza para la media poblacional, conociendo el valor que tiene esta en una muestra. Por ejemplo, si hemos aplicado una prueba de actitudes hacia la matemtica en una muestra de 200 estudiantes de psicologa, y hemos obtenido una media de 38.34 y una desviacin estndar de 17.57, entre que valores se espera que est la media poblacional, con un 95% de confianza? Para hacerlo introducimos en el mdulo correspondiente los valores referidos a la media, desviacin estndar, tamao de la muestra y finalmente sealamos el nivel de confianza. El programa se ver como se muestra a continuacin.

Ilustracin 1 : Estimacin de la media

35

En el ejemplo anterior, podemos sealar que existe un 95% de probabilidades de que la media de la poblacin se encuentre entre los valores 35.90 y 40.78 1.2 ESTIMACION DE PROPORCIONES

A partir de una proporcin obtenida en una muestra (p) se puede construir un intervalo de confianza para el parmetro en la poblacin (). Supongamos que se desea estimar la proporcin de escolares pertenecientes a colegios particulares que han asistido al servicio psicopedaggico por lo menos una vez de manera voluntaria. Si se determina que en la muestra de 400 alumnos, el 25% cumple con dicha condicin, qu porcentaje de la poblacin se estima al 99% de confianza que ha asistido por lo menos una vez al servicio psicopedaggico por voluntad propia? Para responder a esta pregunta slo debemos introducir los datos referidos al tamao de la muestra (n) y a la proporcin calculada en la muestra (p).

Ilustracin 2: Estimacin de una proporcin

36

Como observamos en la ilustracin 2, se estima con un 99% de confianza, que entre el 19% y el 31% de la poblacin ha asistido por lo menos una vez de manera voluntaria al servicio psicopedaggico de los colegios.

1.3

ESTIMACION DE LA VARIANZA

La estimacin de la varianza en la poblacin ( 2) puede hacerse partiendo del conocimiento de la desviacin estndar (s) en una muestra, construyendo as el intervalo de confianza. Supongamos que hemos aplicado una prueba de comprensin lectora en una muestra de 200 escolares de 1 de secundaria en colegios estatales. Si la desviacin estndar de puntajes fue de 12.34, entre que valores podemos esperar que se encuentre la varianza de la poblacin, con un 95% de confianza? Para responder a esta pregunta slo debemos introducir los datos en las casillas correspondientes y seleccionar en el men desplegable el nivel de confianza que queremos darle al intervalo que vamos a construir. Luego de hacerlo, el programa de forma automtica nos construye el intervalo:

Ilustracin 3: Estimacin de la varianza

37

Como podemos ver en la ilustracin 3, el error estndar para la varianza es igual a 15.23. Esto nos indique que existe un 95% de probabilidades de que la varianza de la poblacin se encuentre entre 122.43 y 182.12.

2.

CONTRASTE DE HIPTESIS

En estos mdulos podemos realizar pruebas de hiptesis, referidas a las diferencias de medias, proporciones y varianza. Es posible efectuar contrastes bilaterales y unilaterales tanto izquierdos como derechos. 2.1 CONTRASTE DE MEDIAS

El contraste de hiptesis para la media, puede realizarse al comparar aquella obtenida en una muestra con un valor terico. Esto se conoce como contraste de un solo grupo. Tambin podemos contrastar las medias obtenidas de dos grupos

independientes suponiendo varianzas iguales (homogneas) o varianzas distintas (heterogneas); o las medias obtenidas en dos grupos dependientes. 2.1.1 UN SOLO GRUPO

Se sabe a partir e investigaciones anteriores, que en la poblacin de chicos entre 12 a 15 aos de zonas urbano marginales, el promedio de rendimiento en una prueba estandarizada de ciencias era de 30 puntos.

38

Luego de 5 aos se vuelve a realizar un muestreo a fin de saber si el rendimiento en ciencias de dicha poblacin ha variado. Para ello se toma una muestra representativa de 500 chicos. Los datos en esa muestra arrojan una media de 27.34 y una desviacin estndar de 9.76. Con estos datos, es posible afirmar que el rendimiento en ciencias de los chicos entre 12 y 15 aos de zonas urbano marginales ha cambiado en los ltimos cinco aos? Para responder esta pregunta slo debemos introducir la informacin correspondiente en las casillas referidas al valor terico en la poblacin (30.00), la media y desviacin estndar obtenidas en la muestra (27.34 y 9.76 respectivamente) junto con el tamao muestral. Adems nuestra hiptesis slo se pregunta si el valor terico ha cambiado en los ltimos aos, no se pregunta si un valor es superior al otro. Por lo tanto nuestra hiptesis es bilateral. As, marcamos la casilla que nos seala H0: Media = Media terica.

Ilustracin 4: Contraste de medias para un slo grupo

De acuerdo a los resultados mostrados en la ilustracin 4, apreciamos un estadstico t de 6.088 que para 499 grados de libertad tiene un valor p < 39

0.001. Es decir, que podemos afirmar que la nueva media en la poblacin, difiere de manera estadsticamente significativa, del valor terico de 30.00.

2.1.2

DOS

GRUPOS

INDEPENDIENTES

SUPONIENDO

VARIANZAS HOMOGNEAS

En otras situaciones queremos comparar las medias obtenidas en dos muestras independientes, a fin de saber si dichas diferencias, tambin representan reales diferencias para dichos grupos al nivel de poblacin. En este tipo de contraste se asume que las varianzas de ambos grupos no difieren al nivel de la poblacin. Luego mostraremos cmo este supuesto tambin puede ser contrastado con una prueba de hiptesis referidas a la varianza. Por ejemplo, un investigador est interesado en saber si existen diferencias entre los niveles intelectuales de nios de 5 de primaria educados en colegios religiosos frente a aquellos educados en colegios laicos. Para ellos toma dos muestras representativas, una de 200 nios de colegios religiosos (grupo 1) y otra de colegios laicos (grupo 2). El grupo 1 presenta una media de 107.23, junto con una desviacin estndar de 14.56, mientras que el grupo 2 tiene una media de 108.12 y una desviacin estndar de 15.32.

40

Para poder contrastar su hiptesis, slo debe introducir los datos de cada grupo en los lugares correspondientes. Adems en su hiptesis slo se pregunta por la existencia de diferencias, as esta ser bilateral: H0: Grupo 1 = Grupo 2.

Ilustracin 5: Contraste de medias, dos grupos independientes y varianzas homogneas

Como apreciamos en la ilustracin 5, se obtuvo un estadstico t de 0.60 que para 398 grados de libertad tiene un valor p = 0.552. Con estos resultados podemos sealar que no existen diferencias estadsticamente significativas entre las medias aritmticas de ambos grupos. En otras palabras, los niveles intelectuales de los nios de quinto de primaria educados en colegios religiosos no son diferentes a las de los educados en colegios laicos.

2.1.3

DOS

GRUPOS

INDEPENDIENTES

SUPONIENDO

VARIANZAS HETEROGENEAS

Tambin podemos efectuar el contraste de medias en dos grupos independientes si suponemos o mejor an, comprobamos que las varianzas de ambos grupos no son equivalentes en la poblacin.

41

Por ejemplo, un psiclogo quiere investigar si la ansiedad ante los exmenes de matemticas en estudiantes de secundaria de colegios particulares (grupo 1) es menor a la de los alumnos de colegios estatales (grupo 2). Toma una muestra representativa de 150 alumnos de cada grupo y les aplica una escala de ansiedad ante los exmenes de matemticas. El grupo 1 presenta una media de 21.34 y una desviacin estndar de 3.54. El grupo dos tiene una media de 23.45 y una desviacin estndar de 8.30. Para responder a la pregunta de investigacin, se deben introducir los datos correspondientes a ambos grupos en sus casillas respectivas como lo vemos en la ilustracin 6. En cuanto a la hiptesis de investigacin, esta es de tipo unilateral, pues se est postulando que la media del grupo 1 es menor que la media del grupo dos. Dicha hiptesis puede ser descartada si la media del grupo 1 es mayor o igual a la media del grupo 2. Por lo tanto, sealamos como hiptesis nula: H0 Grupo 1 Grupo 2, con lo cual tenemos un contraste unilateral izquierdo.

Ilustracin 6: Contraste de medias, dos grupos independientes y varianzas heterogneas

42

Los resultados nos presentan un estadstico t de 2.86, que para 201 grados de libertad, tiene un valor p = 0.002. estos resultados nos llevan a rechazar la hiptesis nula y a aceptar la hiptesis alterna (grupo 1 < grupo 2). Es decir, el nivel de ansiedad frente a los exmenes de matemticas de los alumnos de colegios particulares es inferior en trminos estadsticamente significativos, al nivel de ansiedad frente a los exmenes de matemticas de los alumnos de colegios estatales. 2.1.4 DOS GRUPOS RELACIONADOS

Tambin es posible realizar contraste de dos medias cuando estas provienen de dos grupos relacionados. Este es el caso de los diseos pre y post test, o cuando se trabaja con grupos apareados (o emparejados). Por ejemplo, un psiclogo est interesado en comprobar si un programa para mejorar los niveles de atencin reduce el nmero de errores cometidos por alumnos de 1 y 2 de primaria, en una prueba estandarizada de matemticas. Para ellos toma una muestra de 37 alumnos y les aplica un pre-test. Los resultados de ese pre-test (condicin 1) muestran un promedio de 23.45 errores. Luego de aplicar el programa para la mejora de la atencin, se aplica una forma paralela de la prueba de matemticas y se obtiene una media de 18.34 errores. Indican estos resultados una disminucin significativa en el nmero de errores cometidos? Para responder a esta pregunta necesitamos algo ms de informacin que la usual. Esta informacin se refiere a la desviacin estndar de los puntajes diferenciales. El puntaje diferencial se obtiene al restar del puntaje obtenido en el pre test de cada persona, el puntaje obtenido en el post test. Posteriormente

43

se calcula la desviacin estndar de dichos puntajes diferenciales, a la cual se le denomina desviacin estndar de las diferencias. Supongamos que luego de calcularla su valor resulta ser 8.86. Ya tenemos toda la informacin necesaria, y slo debemos introducirla en las casillas correspondientes. Como el psiclogo est interesado en comprobar si el programa disminuye la cantidad de errores cometidos (media de errores en el grupo 1 > media de errores en el grupo 2), se plantea una hiptesis nula unilateral derecha: media de errores en el grupo 1 media de errores en el grupo 2. Ilustracin 7: Contraste de medias para dos grupos relacionados

Los resultados nos presentan un estadstico t de 3.51, que para 36 grados de libertad, tiene un valor p = 0.001. estos resultados nos llevan a rechazar la hiptesis nula y a aceptar la hiptesis alterna (grupo 1 > grupo 2). Es decir, el nmero de errores cometidos disminuye, en trminos estadsticamente significativos, luego de aplicar el programa de mejora de la capacidad de atencin en los alumnos de 1 y 2 de primaria.

2.2

CONTRASTE DE PROPORCIONES

44

En el caso de la proporcin, podemos realizar contrastes tanto con un valor terico (un solo grupo), como tambin podemos contrastar las proporciones obtenidas en dos grupos independientes o en dos grupos dependientes. 2.2.1 UN SOLO GRUPO

Podemos comprara una proporcin terica con un valor obtenido en una muestra. Adems podemos obtener dos tipos de probabilidades, aquellas asociadas a una distribucin binomial cuando el tamao de la muestra es menor o igual a 25 (Pardo y San Martn, 1999) y las asociadas ala distribucin Z para los dems tamaos muestrales. Por ejemplo, un psiclogo organizacional quiere saber si por lo menos el 51% de los trabajadores de una empresa embotelladora de gaseosas, est satisfecho con el nuevo programa de incentivos. Para ellos aplica una encuesta a una muestra representativa de 200 trabajadores y obtiene una proporcin de 0.47. La hiptesis planteada es unilateral izquierda, pues se quiere saber si el valor de la proporcin en la muestra nos lleva a plantear que el valor en la proporcin es igual o mayor que 0.51.

Ilustracin 8. Contraste de una proporcin con un valor terico

45

Como apreciamos en la ilustracin 8, se obtuvo un valor z de 1.132, que tiene un valor p = 0.129. estos resultados nos llevan aceptar la hiptesis nula. Es decir, se pude pensar que por lo menos el 51% de los trabajadores de la empresa estn satisfechos con el nuevo programa de incentivos. En el caso de tener una muestra pequea, el lugar de realizar un contraste de hiptesis basado en la distribucin Z, se efecta un contraste sobre la base de la distribucin binomial. Por ejemplo si en un saln de 200 personas, se toma una muestra aleatoria simple de 20 personas y se obtiene una proporcin de .25 respuestas correctas a un tem, es posible sealar que dicha proporcin difiere de .33 respuestas correctas al nivel de saln? Igual que en el caso anterior, introducimos los datos en sus respectivas casillas, y sealamos el tipo de hiptesis nula con la cual queremos trabajar. Vamos a trabajar con una hiptesis bilateral, pues nos preguntamos si la proporcin obtenida en la muestra difiere de un valor terico, sin postular la direccin de dicha diferencia.

Ilustracin 9: Contraste sobre una proporcin, muestra pequea

46

En este caso (ilustracin 9), vemos un valor p = 0.617 para una distribucin binomial. Este resultados nos lleva a aceptar la hiptesis nula. Es decir, los resultados obtenidos en la muestra no nos permiten sealar que la proporcin de aciertos al tem en el saln sea diferente a .33. 2.2.2 DOS GRUPOS INDEPENDIENTES

Si queremos contrastar la diferencia de proporciones entre dos muestras independientes, podemos hacerlo mediante este mdulo. Supongamos que se tiene dos muestras una compuesta por 172 personas que han sido catalogadas como altamente introvertidas (grupo 1) segn el NEO-PI R y otra de 223 que son altamente extrovertidas (grupo 2) segn la misma prueba. Se pregunta a ambas muestra si alguna vez han recibido psicoterapia. En el grupo 1 el 24% la ha recibido, y en el grupo 2 el 33%. Se puede afirmar que ambos grupos difieren en la proporcin de personas que han asistido a psicoterapia? Para responder a esa pregunta de investigacin, introducimos los datos en las casillas correspondientes (proporciones y tamaos de cada muestra). Adems sealamos que tipo de hiptesis es. Adems se trata de una hiptesis bilateral, pues no se postula que un grupo sea mayor que otro, slo que ambas proporciones son diferentes.

Ilustracin 10: Contraste de proporciones, muestras independientes

47

En la ilustracin 10 vemos un valor Z de 1.537 que tiene un valor p = 0.124. Estos resultados nos llevan a aceptar la hiptesis nula. Es decir, el grupo de personas altamente introvertidas no difiere del grupo de personas altamente extrovertidas en cuanto a la proporcin que ha recibido psicoterapia alguna vez.

2.2.3

DOS GRUPOS DEPENDIENTES

Se puede efectuar el contraste de hiptesis sobre dos proporciones que provienen de una sola muestra medida en dos momentos diferentes. Para este tipo de contraste no slo se necesita el dato de la proporcin, sino la cantidad de personas que caen dentro de las categoras dicotmicas (1/0) en cada una de las mediciones, de tal manera que se completa una tabla de doble entrada. Es decir, se cruzan las categoras 1/0 de la primera medida, con las categoras 1/0 de la segunda medida, dando origen a una tabla de 2x2. Supongamos que un psiclogo considera que el trastorno depresivo en los nios puede estar asociado a los niveles de melatonina. Para ello toma una muestra aleatoria de 100 nios entre 8 y 10 aos con dicho diagnostico, y efecta una medicin de los niveles de melatonina, dicotomizando los niveles en alto = 1 y bajo = 0 (condicin 1). Los resultados del pre test muestran que 40 de los nios tenan niveles altos, mientras que los otros 60 presentaban niveles bajos.

48

Luego de un tratamiento psicoteraputico, el trastorno remite totalmente en los 100 nios, a los cuales se les vuelven a medir los niveles de melatonina (condicin 2). De los 40 nios que antes presentaban niveles altos, 30 presentan ahora niveles bajos, mientras que de los 60 que antes tenan niveles bajos, 40 presentan ahora niveles altos. Puede sealarse que los niveles de melatonina han cambiado significativamente? Para responder a esta pregunta, slo tenemos que insertar en las casillas correspondientes los datos que completan la tabla de doble entrada, sealando la frecuencia absoluta simple que queda en cada categora, para cada una de las condiciones, tal y como se muestra en la ilustracin 11. Tambin indicamos que estamos frente a una hiptesis de tipo bilateral.

Ilustracin 11: Contraste de proporciones, dos grupos relacionados

Los resultados observados en la ilustracin 11 muestran un valor chi cuadrado de 1.43, que posee una probabilidad de .232. Estos resultados nos llevan a aceptar la hiptesis nula, y sealar que las proporciones de los niveles de melatonina no han variado significativamente. 49

En el caso de muestras pequeas el contraste se basa en las probabilidades de la distribucin binomial, en lugar de usar las probabilidades de una distribucin Chi cuadrado. Por ejemplo, en un grupo de 20 matrimonios que asisten a terapia de pareja, 10 sealaron el un primer momento (con. 1) que su vida sexual era insatisfactoria (1) y las otras 10 sealaron que era satisfactoria (0). Luego de 6 meses de terapia, se volvi a aplicar la misma encuesta a los 20 matrimonios (con. 2). 9 de los 10 que antes sealaron insatisfaccin (1) con su vida sexual, pasaron a sealar ahora que estaban satisfechos con su vida sexual (0), y una de las parejas que antes seal que estaba satisfecha, pas ahora a sealar que estaba insatisfecha. Podemos sealar que la proporcin de matrimonios que se siente insatisfecho con su vida sexual ha disminuido significativamente en estos seis meses de terapia? Nuevamente introducimos los datos en sus lugares respectivos, considerando el pre test (con 1) como filas y el post test (con. 2) en las columnas. El inters principal en este problema est vinculado a la efectividad de la intervencin, en tanto su capacidad para mejorar la vida sexual de las parejas, por eso planteamos con hiptesis nula que la proporcin de matrimonios insatisfechos con su vida sexual es mayor o igual en el post tests al compararla con la proporcin del pre test. Es decir, es una hiptesis unilateral derecha. Ilustracin 12: Contraste de proporciones dependientes, para muestras pequeas

50

Los datos observados en la ilustracin 12 nos arrojan un valor T igual a 9, que tiene una probabilidad binomial asociada de .001. Estos resultados nos llevan a rechazar la hiptesis nula y aceptar la alterna, es decir, podemos sealar que luego de la terapia de pareja, la proporcin de matrimonios satisfechos con su vida sexual ha incrementado significativamente.

2.3

CONTRASTE DE VARIANZAS

En estos mdulos podremos contrastar la presencia de diferencias estadsticamente significativas en las varianzas obtenidas entre dos grupos independientes o dependientes. 2.3.1 DOS GRUPOS INDEPENDIENTES

Esta parte nos permite comprobar si las varianzas obtenidas en dos muestras independientes, tiene varianzas homogneas al nivel de poblacin. Esta informacin puede ser til tanto si queremos estudiar directamente el cambio en la variabilidad como objeto de estudio, o si queremos usar esta informacin para saber si tenemos que aplicar una prueba t de Student para grupos 51

independientes suponiendo varianzas iguales diferentes.

o suponiendo varianzas

U n psiclogo aplic una Escala de Actitudes hacia la Homosexualidad en dos grupos de adolescentes, una de 58 provenientes de colegios religiosos y otro de 52 jvenes de colegios laicos. Desea saber si debe aplicar un contraste de medias entre ambos grupos, pero no sabe si es adecuado suponer varianzas homogneas o heterogneas. Para ello aplica en los datos un contraste de varianzas. Al introducir los datos correspondientes en las casillas de la matriz de Excel, y sealar que se trata de una hiptesis bilateral, vemos los siguientes resultados:

Ilustracin 13: Contraste de varianzas, dos grupos independientes

Se ha obtenido un estadstico F igual a 1.32 que para 51 y 57 grados de libertad tiene una valor p = 0.305. Estos resultados nos llevan a aceptar la hiptesis nula. Es decir, podemos sealar que las varianza de ambos grupos no difieren en trminos estadsticamente significativos. Por lo tanto se puede aplicar una prueba t que asume varianzas homogneas.

2.3.2

DOS GRUPOS RELACIONADOS

52

En esta parte podemos contrastar hiptesis referidas a la diferencia de varianzas que provienen de grupos relacionado, como los diseos pre y post test y los grupos emparejados. Por ejemplo, un psiclogo est interesado en saber si un programa de entrenamiento en solucin de problemas hace ms homogneo el rendimiento de los alumnos de los cursos de estadstica para psiclogos. Para ello toma una muestra representativa de alumnos, les aplica una prueba de competencia estadstica y los somete al programa. La desviacin estndar en el pre test fue de 8.72 y la obtenida en el post test fue 5.19. Adems la correlacin de los puntajes en ambos momentos fue de 0.69. Puede sealarse a partir de dichos datos que el rendimiento de los alumnos en estadstica se hace ms homogneo como consecuencia del programa de entrenamiento en solucin de problemas? Para responder a dicha pregunta slo tenemos que insertar los datos en la seccin correspondiente y sealar el tipo de hiptesis nula que estamos interesados en contrastar. Note que en lugar de introducir los valores de la varianza, estamos introduciendo los valores de la desviacin estndar. El programa la eleva automticamente al cuadrado para efectuar el clculo del estadstico T sobre la base de las varianzas. En este caso queremos probar que la varianza del pos test es menor que la varianza del pre test, por lo tanto nuestra hiptesis nula seala que la varianza del pre tests es menor o igual que la varianza del post test. Es una hiptesis unilateral derecha.

Ilustracin 14: Contraste de varianzas para grupos relacionados. 53

Obtenemos un valor t de 6.62 que para 78 grados de libertad tiene un valor p < 0.001. estos resultados nos llevan a rechazar la hiptesis nula y a aceptar la alterna. Es decir, podemos sealar que luego del entrenamiento en solucin de problemas, el rendimiento de los nios se hace ms homogneo.

54

55

3.

REFERENCIAS

Amn, J. (1993) Estadstica para psiclogos. Madrid: Pirmide. Blalock, H. (1998) Estadstica social. 6ta reimpresin. Mxico: Fondo de Cultura Cconmica. Botella, J. Len, O. y San Martn, R. (1996) Anlisis de Datos en Psicologa I. Madrid: Pirmide. Calzada, J. (1966) Estadstica General con nfasis en Muestreo. Lima: Jurdica. Elorza, H. (1987) Estadstica para Ciencias del Comportamiento. Mxico: Harla. Everitt, B. (1996) Making Sense of Statistics in Psychology. Oxford: Oxford University Press. Garrett, H. (1971) Estadstica en psicologa y Educacin. Buenos Aires: Paids. Guilford, J.P. y Fuchter, B. (1984) Estadstica Aplicada a la Psicologa y la Educacin. Mxico: MCGraw Hill. Hays, W. (1973) Statistics for the Social Science. Londrwes: Holt, Rinehart y Winston. Kerlinger, F. Y Lee, H. (2001) Investigacin del comportamiento. 4 ed. Mxico: McGraw Hill. Martinez, C. (1997) Estadstica y Muestreo. 8 ed. Bogot. Fondo Educativo Interamericano. Pardo, A. y San Martn, R. (1999) Anlisis de datos en Psicologa II. Madrid. Pirmide Spiegel, M. (1961). Theory and problems of statistics. New York: Schaum.

56

57

S-ar putea să vă placă și