Sunteți pe pagina 1din 117

Pasos Previos al Análisis Cuantitativo

SEMANA 1

[ METODOS CUANTITATIVOS DE PSICOLOGÍA]


MÉTODO CUANTITATIVO

ÍNDICE
NÚCLEO TEMÁTICO 1. PASOS PREVIOS AL ANÁLISIS CUANTITATIVO 2
Objetivos 2
Contenidos 2
A manera de introducción: La investigación y el uso de métodos cuantitativos 3
Paso Uno: La idea de investigación 4
Paso Dos: Delimitando los problemas 5
La pregunta de investigación 5
Paso Tres: La construcción del marco teórico 6
¿Cómo puedo buscar la literatura que necesito? 7
Ingreso a la consulta de referencias 7
Paso Cuatro: El alcance de la investigación 9
Paso Cinco: Las Hipótesis 10

PASOS PREVIOS AL ANÁLISIS CUANTITATIVO

Objetivos
• Identificar las distintas maneras de formulación de un problema
• Conocer las formas de elaboración del marco teórico de la investigación cuantitativa
• Conocer los distintos tipos de alcance investigativo
• Identificar las diferentes maneras de formulación de hipótesis
• Conocer los distintos tipos de diseño y sus formulaciones
• Conocer las formas de determinar una muestra.

Contenidos
• Planteamiento del problema cuantitativo
• Desarrollo de la perspectiva teórica
• Definición del alcance de la investigación
• Formulación de hipótesis
• Elección del diseño de investigación
• Selección de la muestra.

2
A MANERA DE INTRODUCCIÓN: LA INVESTIGACIÓN Y EL USO DE
MÉTODOS CUANTITATIVOS

La investigación es el proceso mediante el cual obtenemos nuevos conocimiento de la realidad.


Una actividad que implica el seguimiento de una secuencia ordenada y lógica de pasos o
procedimientos, muy delimitados, para llegar a comprender unos hechos que serán evaluadosa
la luz de ciertas estrategias, definidas con anterioridad, y a los cuales se les atribuirá algún tipo
de relación o de significado.Este proceso de adquisición de conocimiento tendrá como fin el
progreso de las sociedades.

La investigación científica, además, es clara en suponer unos métodos muy particulares para
entender o explicar estos hechos.Estos métodos tienen una historia en la evolución del
conocimiento humano y han tenido un efecto muy importante en el desarrollo de la psicología
como ciencia.

El investigador, en su proceso, debe partir del supuesto de existencia de dos realidades: una
realidad interna o subjetiva, conformada por lascreencias, suposiciones y
experienciasindividuales. Y una realidad externa, objetiva, e independiente de las creencias que
tengamos de ella. Esta segunda realidad supone la verdad de unos hechos en el mundo que son
susceptibles de conocerse, que son posibles de medir, de cuantificar y a los cuales se les
atribuye un valor numérico representativo en relación con sus propiedades.

En este sentido, la investigación científica cuantitativa busca 1. Indagar, a través de


herramientas de medición, estos hechos que son susceptibles de medir, 2.Informar sobre estos,
y 3.Inferir, a partir de lo anterior, elementos de la realidad antes desconocidos.

Dentro del proceso de la investigación cuantitativa, Hernández, Fernández y Baptista (2010),


mencionan unas características para las mismas, como son:

-Planteamiento de un problema de estudio delimitado y concreto


-Un marco teórico del cual se deriva una o varias hipótesis
-Una recolección de datos basadas en la medición
-Un análisis de estos datos numéricos mediante métodos estadísticos.
Podemos decir que el proceso de investigación cuantitativa requiere una serie de pasos
organizados, estos son:

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 3


Gráfico 1. Secuencia de pasos en el proceso de investigación Cuantitativa

Paso 1. Definición Paso 2.


Paso 3. Desarrollo Paso 4. Definición
del tema y de la Planteamiento del
de la perspectiva del alcance de la
idea de problema de
teórica investigación
investigación investigación

Paso 8. Paso 5.
Paso 7. Selección Paso 6. Elección
Recolección de los Establecimiento de
de la muestra del diseño
datos las hipótesis

Paso 9. Análisis de Paso 10. Reporte


los datos de resultados

PASO UNO: LA IDEA DE INVESTIGACIÓN

La investigación parte de una idea concreta, pero no todas las ideas son susceptibles de ser
investigadas. Las ideas que pueden surgirle al investigador deben suponer una comprensión
bastante amplia del estado de conocimiento, lo que supone que cuando se inicia el proceso de
investigación cuantitativa, el investigador conoce el marco sobre el que se sustentan sus ideas.
Este marco, generalmente, es susceptible de ser indagado, justamente porque, luego de esta
revisión, presenta falta o vacíos.

En ese sentido, Hernández, Fernández y Baptista (2010), recomiendan tener en cuenta lo


siguiente antes de adentrarse en el proceso de investigación:

No investigar sobre algún tema que ya se haya estudiado a fondo. Una buena investigación es
aquella que invita a la novedad. Esto no quiere decir que sean necesariamente nuevas pero sí
que aporten elementos novedosos para en el estudio de fenómenos que pueden haber sido
estudiados con anterioridad.

Estructurar más formalmente la idea de investigación, lo que significa que una idea servirá para
la definición de un problema claro de indagación.

Hay que recordar que las buenas ideas deben intrigar, alentar y excitar al investigador de
manera personal. Las ideas también pueden ayudar a la construcción de un marco conceptual
del conocimiento y pueden servir para la solución de problemas. Pero quizá lo más importante

4
sobre las ideas es que estas, cuando son buenas, más que dar respuestas deben generar más
interrogantes.

PASO DOS: DELIMITANDO LOS PROBLEMAS

Las ideas deben conducir a la formulación de problemas claros. En la investigación cuantitativa


esto supone que el investigador delimite su objeto de estudio, es decir, que formule en
términos claros y concisos el problema.
En ese sentido el problema debe contener los siguientes criterios:
Debe expresar una relación entre dos o más conceptos o variables
Debe formularse como pregunta
Debe implicar la posibilidad de realizar una prueba empírica
El planteamiento del problema implica el trazado de unos objetivos claros que en su
formulación deben evitar desviar el proceso de investigación. Estos objetivos deben tener una
viabilidad, es decir, deben ser posibles de llevar a cabo.

La pregunta de investigación

Un problema de investigación supone una justificación o razón de ser del estudio, un propósito
definido. Las investigaciones no se pueden concebir como actos aislados. Generalmente
responden a una necesidad de conocimiento sobre un área que se desconoce.
Hernández, Fernández y Baptistas (2010), mencionan algunos criterios para evaluar la
importancia de una investigación, estos suponen:
Conveniencia. Entender para qué sirve.
Relevancia social. Qué proyección social tiene.
Implicaciones prácticas. Si resuelve algún problema real.
Valor teórico. Aporta al estado de conocimiento.
Utilidad metodológica. Crea un nuevo instrumento para recolectar datos.

Adicional a lo anterior, la comprensión del problema de investigación supone una evaluación de


la factibilidad del estudio, es decir, de su viabilidad o posibilidad de realización. En este sentido
se debe conocer si se dispone de los recursos necesarios realizar el estudio cuantitativo.
Se debe tener presente que el proceso de investigación no siempre conduce a procesos
acabados y definitivos. La investigación podrá estar tentada a modificarse en todo momento en
la medida del avance del conocimiento. Esto es más que conocido en la investigación cualitativa.
Sin embargo, el proceso llega hasta donde el investigador determina que se contemplaron los
elementos mínimos propuestos en el alcance de la investigación. A pesar de ello, es
recomendable mantener la reflexión constante sobre el estado de indagación, preguntarse por
si es necesaria más información y reconocer cuáles son las limitaciones del estudio. Sólo así se
podrá llegar a un punto satisfactorio dentro del proceso investigativo.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 5


Gráfica 2. Pasos del planteamiento del problema

Objetivos

Preguntas

Planteamiento
del problema

Evaluación Justificación

Viabilidad

PASO TRES: LA CONSTRUCCIÓN DEL MARCO TEÓRICO

Como se ha mencionado, la investigación cuantitativa supone un estado de conocimiento de los


hechos que permiten visualizar las carencias de conocimientos que justifican el proceso
investigativo. De ahí que, para la investigación, sea crucial la contextualización conceptual y la
exposición y análisis de las teorías o antecedentes que permitan entender el estado del estudio.
Hernández, Fernández y Baptista (2010) mencionan, como funciones de este desarrollo de la
perspectiva teórica, lo siguiente:

El ayudar a prevenir errores que se han cometido en otras investigaciones


La orientación de cómo habrá de realizarse el estudio
La ampliación del horizonte de estudio
La documentación de la necesidad de realización del estudio
El establecimiento de hipótesis que luego se pondrán a prueba en la realidad
La inspiración para nuevas líneas y áreas de investigación
El proveer un marco de referencia para interpretar los resultados del estudio.
Para iniciar, el investigador debe realizar una revisión de la literatura sobre el tema de
indagación. Esta debe implicar la detección, consulta y obtención de la bibliografía y otros
materiales que sean útiles para los propósitos del estudio. Es importante tener claridad en que
esta búsqueda debe ser selectiva (Hernández, Fernández y Baptista, 2010).

6
¿Cómo puedo buscar la literatura que necesito?

Es de resaltar que en el contexto universitario es común la búsqueda de referencias o textos


que aparecen en páginas web, sin un mayor desarrollo de conceptos o sin revisiones claras de lo
que los autores originales de los conceptos querían emitir a través de sus juicios. Esto plantea
un problema para el estudiante ya que puede, fácilmente, incurrir en plagio al copiar
textualmente citas largas o encontrarse con la dificultad de referenciar la información. En todo
caso, recomiendo que, cuando se haga una búsqueda de literatura para el estudio, el estudiante
acuda a fuentes de consulta directas como las bases de datos institucionales. La institución
cuenta con sistemas de consulta bastante eficientes en ese sentido. Para ello daré algunos
ejemplos de cómo ingresar a la consulta de información desde dichas bases.

Ingreso a la consulta de referencias


El estudiante puede ingresar a través del siguiente enlace a la página de la biblioteca del
Politécnico:

http://poli.edu.co/content/biblioteca-virtual-0

Imagen 1. Página web de la Biblioteca de la Universidad

Tomado de: http://poli.edu.co/content/biblioteca-virtual-0

Allí podrá seleccionar la opción de biblioteca Virtual-Recursos Electrónicos y, en Recursos


electrónicos, el estudiante podrá ingresar a un número de bases de datos importantes donde

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 7


podrá hacer la consulta que se necesita. Muchas de estas bases resultan de utilidad para el
psicólogo, entre ellas, EBSCO, ProQuest, Taylor&Francis y SciELO.

Luego de digitar su usuario y contraseña, el estudiante podrá acceder a la base de datos. SciELO,
por ejemplo, es una de las pocas bases que también permite la búsqueda de textos en español.
El estudiante simplemente digita las palabras clave para la búsqueda y, además, puede filtra la
información a través de artículos completos o de resúmenes.

Imagen 2. Página de ScieELO donde se digita los descriptores de la búsqueda

Tomado de: http://www.scielo.org.co/

Hernández, Fernández y Baptista (2010), sugieren una serie de pasos para la construcción del
marco teórico que inicia con el ordenamiento de la información recopilada. En este sentido, los
autores sugieren el método de mapeo para organizar y edificar el marco teórico, que
simplemente consiste en la elaboración de un mapa conceptual con la información recopilada.

El otro método señalado es el método de índices, que implica la construcción de un sistema de


jerarquía de temas y subtemas que conducen a la señalización de las referencias encontradas.

Gráfico 3. Método de índices

8
Subtema 1.1 Referencia 1

Tema 1

Subtema 1.2 Referencia 2


Tema general

Tema 2 Subtema k.1 Referencia n

PASO CUATRO: EL ALCANCE DE LA INVESTIGACIÓN

Toda investigación, a partir de sus estrategias, tiene unos alcances o puntos a dónde llegar.
Hernández, Fernández y Baptista (2010), definen estos alcances en cuatro tipos:

Gráfico 4. Tipos de alcances en la Investigación cuantitativa

Exploratorios Descriptivos

Correlacionales Explicativo

Los alcances tienen la particularidad de continuarse en secuencia lógica, de tal manera que, el
alcance explicativo supondría que se ha hecho previamente la exploración, descripción y
correlación del fenómeno a explicar.

Las investigaciones con alcances exploratorios examinan un problema de investigación poco


estudiado, del cual se tienen muchas dudas o no se ha abordado antes. Este tipo de
investigaciones analiza fenómenos desconocidos o novedosos.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 9


“Las investigaciones con alcance explicativo buscan responder a las causas de los
eventos y fenómenos
“Este tipo físicos
de estudio y sociales…
sirve Se centran
para familiarizar al en explicar porcon
investigador qué fenómenos
ocurre un
fenómeno y en qué condiciones se manifiesta, o por qué se relacionan dos
relativamente desconocidos y permite obtener información sobre la posibilidad o más
variables”
de llevar a cabo una investigación más completa respecto de un contexto
particular, investigar nuevos problemas, identificar
Hernández, Fernándezconceptos
y Baptista, o2010,
variables
p.84
promisorias, establecer prioridades para investigaciones futuras o sugerir
afirmaciones o postulados… Son comunes en situaciones donde existe poca
información…”

Hernández, Fernández y Baptista, 2010, p.79

Las investigaciones descriptivas, por su parte, buscan especificar propiedades, características y


perfiles de personas, grupos, comunidades, procesos, objetos o cualquier otro fenómeno que se
someta a análisis.Este tipo de estudios sirven para descubrir y prefigurar, además son útiles para
mostrar con precisión los ángulos o dimensiones de un fenómeno, suceso, comunidad, contexto
o situación.

Las investigaciones con alcance correlacional tienen como finalidad conocer la relación o grado
de asociación que existe entre dos o más conceptos, categorías o variables en un contexto
particular. Este tipo de estudios, al evaluar el grado de asociación entre dos o más variables,
miden cada una de ellas y, después, cuantifican y analizan la supuestavinculación. En ese
sentido, este tipo de estudios permite conocer cómo se puede comportar un concepto o una
variable al conocer el comportamiento de otras variables vinculadas.

PASO CINCO: LAS HIPÓTESIS

Las hipótesis se pueden considerar como explicaciones tentativas a un fenómeno investigado.


Son respuestas provisionales a las preguntas de investigación.

10
No todas las investigaciones tienen hipótesis. Particularmente, en la investigación cuantitativa
con alcance exploratorio, no se plantean hipótesis, y no siempre aparecerán en los estudios
descriptivos.

Según Hernández, Fernández y Baptista (2010), las hipótesis tienen ciertas características que
son:

• La hipótesis debe referirse a una situación real, concreta


• Las variables o términos de las hipótesis deben ser comprensibles, precisos y lo más
concretos posibles
• La relación entre variables propuestas por una hipótesis debe ser clara y verosímil.
• Los términos o variables de las hipótesis deben ser observables y medibles, así como la
relación planteada entre ellos
• Las hipótesis deben estar relacionadas con técnicas disponibles para probarlas.

Algunos investigadores clasifican las hipótesis en:


-Hipótesis de investigación
-Hipótesis nula
-Hipótesis alternativa.

Las hipótesis de investigación, a su vez, se clasifican en:

1. Descriptivas
2. De diferencia de grupos
3. Correlaciónales
4. Causales.

Las hipótesis, en sentido general, son las guías de una investigación en el enfoque cuantitativo.
Además, facilitan la descripción o la explicación y nos permiten probar teorías y a su vez generar
teorías nuevas.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 11


Pasos Previos al Análisis Cuantitativo
SEMANA
2

[ MÉTODOS CUANTITATIVOS DE PSICOLOGÍA ]


MÉTODO CUANTITATIVO

ÍNDICE

NÚCLEO TEMÁTICO 1. PASOS PREVIOS AL ANÁLISIS CUANTITATIVO ...............................……..2


Objetivos 2
Contenidos 2
PASO 6: EL DISEÑO DE LA INVESTIGACIÓN 2
PASO 7: LA MUESTRA 6
Tipos de muestra 7
Selección del tamaño de la muestra 7
PASO 8: RECOLECCIÓN DE LA INFORMACIÓN 8
CUESTIONARIO 9

PASOS PREVIOS AL ANÁLISIS CUANTITATIVO


Objetivos
• Conocer los distintos tipos de diseño y sus formulaciones
• Conocer las formas de determinar una muestra.

Contenidos
• Elección del diseño de investigación
• Selección de la muestra y recolección de la información.

PASO SEIS: EL DISEÑO DE LA INVESTIGACIÓN

Una parte central del proceso de la investigación cuantitativa tiene que ver con la definición del
diseño de la investigación.

Se entiende por diseño el plan o estrategia concebida para obtener la información que se
desea.

Los investigadores dividen los diseños de la investigación cuantitativa en: experimentales y en


no experimentales. Los primeros, a su vez, se clasifican en pre-experimentales, cuasi-

2
experimentales y experimentales puros. Los diseños no experimentales se dividirán en diseños
longitudinales y diseños transversales.

Los diseños experimentales traen consigo la lógica de la explicación. En estos diseños el


investigador está interesado por develar las causas de ciertos fenómenos, para ello, tratará de
controlar una situación a través de la manipulación intencional de algunas variables.

En estos casos, el investigador hablará de variables independientes como aquellas que va a


manipular o sobre la cuál va a intervenir y de variables dependientes como aquellas que van a
verse modificadas (posiblemente) por la manipulación. Estos diseños responden a una lógica
causal (causa-efecto) y se inscribirán, por tanto, en los estudios de alcance explicativo, con
hipótesis de investigación causales.

En resumen, en estos diseños se manipulan intencionalmente una o más variables


independiente (supuestamente causas-antecedentes), para analizar las consecuencias que tiene
la manipulación sobre una o más variables dependientes (supuestos efectos-consecuentes).

Según Hernández, Fernández y Baptista (2010), los experimentos tienen unos requisitos, que
son:

-La manipulación intencional de una o más variables independientes


-La medición del efecto que la manipulación de la variable independiente tiene sobre la variable
dependiente
-El control o la validez interna de la situación experimental, generalmente lograda a través de
varios grupos de comparación y de la equivalencia inicial de los grupos a través de la asignación
al azar de sus miembros.

En los diseños experimentales encontramos ciertas divisiones asociadas principalmente a este


grado de control mencionado anteriormente. Es así que la primera división se establece entre
diseños pre-experimentales y diseños experimentales puros.

Los diseños pre-experimentales poseen menor control y validez interna al no poseer grupos de
comparación. Estos tipos de diseños sólo sirven como estudios exploratorios y sus resultados,
en todo caso, deben observarse con precaución.

Existen distintos tipos de diseños pre-experimentales, entre ellos encontramos los estudios de
caso con una sola medición, en donde, en un grupo o muestra, se manipula una variable y se

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 3


mide el efecto de dicha manipulación. Igualmente podemos encontrar estudios con diseño de
pre-prueba pos-prueba con un solo grupo, donde se hace medición antes de la intervención y
después de la misma, pero sólo a un grupo o muestra. En ambos casos los diseños implican sólo
la intervención de un grupo sin tener grupo de contraste o de comparación.

Los experimentos puros, por su parte, poseen un mayor grado de validez interna o control, ya
que conservan las características antes mencionadas: 1. Poseen grupos de comparación y 2.
Existe equivalencia entre los grupos.
Los tipos de diseños experimentales puros más importantes tienen que ver, al igual que los
diseños pre-experimentales, con las pre-pruebas y pos-pruebas, es así que podemos tener
diseños experimentales con pos-prueba únicamente y grupo control y diseños experimentales
con pre-pruebapos-prueba y grupo control. Adicionamos a estos los diseños experimentales
donde se hacen mediciones sucesivas de las variables dependientes. Este tipo de estudios,
llamados diseños experimentales de series cronológicas múltiples, se diferenciaran de los
diseños longitudinales, que veremos más adelante, por la manipulación que caracteriza a los
diseños experimentales.

Además de los diseños experimentales puros y los diseños pre-experimentales, existen también
los diseños cuasi-experimentales. Estos se diferenciarán de los diseños experimentales puros
porque la asignación de los miembros a los grupos no se hace de forma equivalente, sino de
manera intencional, dadas las características de la población objetivo. En ese sentido, este tipo
de diseños no tendría una asignación al azar de los grupos sino que estos estarían conformados
con anterioridad, lo que la teoría llama grupos intactos.

Gráfico 1. Diferencias en Diseños Experimentales

Pre-experimento Experimento puro Cuasi-experimento

Con grupo Con grupo


Sin grupo comparación
comparación comparación

Grupos equivalentes Grupos intactos.

4
Además de los diseños experimentales también encontramos los diseños no experimentales. En
estos se observan los fenómenos tal cual acontecen en su contexto natural para luego ser
analizados. En estos diseños no hay manipulación intencional de las variables independientes.
Algunos investigadores recomiendan este tipo de estudios cuando las variables no pueden o no
deben ser manipuladas, o donde sea difícil su manipulación.

Dentro de los diseños no experimentales tenemos los diseños transversales y los diseños
longitudinales.

En los diseños transversales se recolectan datos en un solo momento. Su propósito es describir


variables y analizar su incidencia e interrelación en un momento dado. Estos, dependiendo de
su alcance, se dividen en Exploratorios, Descriptivos y Correlacionales causales.

En las investigaciones longitudinales el investigador analiza cambios a través del tiempo de


determinadas variables o categorías. Se diferenciarán de los estudios de series cronológicas
porque, al ser parte de los diseños no experimentales, no hay manipulación de las variables o
categorías medidas.

Los diseños longitudinales pueden dividirse, a su vez, en diseños de tendencia, de evolución de


grupos y de panel. Estos tipos de diseños se diferenciaran por las características de los grupos a
los cuales se les hace la medición. Es así que los diseños de tendencia están dirigidos a medir
características poblacionales en distintos momentos. En cambio, los estudios de evolución de
grupos ya no se centrarán en poblaciones sino en sub-poblaciones o grupos específicos y
estarán destinados a evaluar los cambios a lo largo del tiempo de estos grupos. Aquí es
importante señalar que las personas a las que se les hace la medición de las variables en los
distintos momentos no necesariamente son las mismas.

Los diseños de panel, por su parte, se centran en la observación y medición de los cambios de
un grupo específico de personas a lo largo del tiempo. Se diferenciarán del resto de diseños
debido a que los miembros de la muestra resultan ser los mismos en los distintos momentos de
medición.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 5


Gráfico 2. Divisiones de los tipos de Diseño

Diseños Experimentales Pre-experimental

Experimental
Puro
Cuasi-
experimental
Exploratorios
No Transversales
Experimentales Descriptivos

Correlacionales-causales

De tendencia
Longitudinales
De evolución de grupos

De panel

PASO SIETE: LA MUESTRA

Luego de definir el diseño a utilizar, el investigador se verá obligado a seleccionar un conjunto


de miembros de la población objetivo para realizar su estudio. Por obvias razones el
investigador no toma a toda la población para su estudio (debido a la cantidad de personas que
ello representaría), por tal razón el investigador deberá seleccionar a un grupo representativo
de esa población.

Hernández, Fernández y Baptista (2010), sugieren evitar tres errores que suelen presentarse al
seleccionar la muestra, estos son:

-Desestimar o no elegir casos que deberían ser parte de la muestra


-Incluir casos que no deberían estar porque no forman parte de la población
-Seleccionar casos que son verdaderamente inelegibles.
Todo ello supone que un elemento importante a la hora de hacer la selección de la muestra es
la adecuada delimitación del universo o población. Toda investigación requiere que se delimite
claramente cuál es la unidad de análisis de la cual se desea extraer información para la
investigación. Sin una clara delimitación de la población la investigación podría presentar
errores importantes a la hora de llegar a los análisis.
Es de mencionar que para realizar el proceso de selección existen varios tipos de muestra.

6
Tipos de muestra
La literatura refiere dos tipos de muestra: las probabilísticas y las no probabilísticas. En el
primer caso todos los miembros tienen la misma probabilidad de ser elegidos y se obtiene
definiendo las características de la población y el tamaño de la muestra por medio de una
selección aleatoria de las unidades de análisis u objetos de indagación, como individuos,
comunidades o situaciones.

En las muestra no probabilísticas la elección de los elementos no depende de la probabilidad


sino de causas relacionadas con las características de la investigación. Depende, en ese sentido,
del proceso de toma de decisiones (generalmente de las personas con que se cuenta
tentativamente para el estudio).

Para el caso del muestreo probabilístico el investigador puede valerse de herramientas o


paquetes estadísticos que permiten realizar los cálculos con relativa facilidad. En esa línea de
ideas, para realizar la selección de la muestra el investigador 1. Deberá seleccionar el tamaño de
la muestra ajustado al tamaño poblacional usando el mencionado programa y 2. Deberá
seleccionar, de manera aleatoria, los miembros de la muestra de una base o listado de
participantes, de tal suerte que todos los miembros de la población lleguen a tener la misma
posibilidad de ser elegidos.

Selección del tamaño de la muestra


Para la selección del tamaño de la muestrase recomienda al estudiante utilizar programas de
prueba gratuita como STATS®, el cual puede descargar en la siguiente dirección electrónica:
http://www.decisionanalyst.com/download.aspx Consultada el 11 de abril de 2013.
Una versión de este mismo programa se encuentra en este módulo.
El cálculo estadístico de la muestra requiere:

-Un porcentaje de error máximo aceptable (5%)


-Un porcentaje estimado de la muestra (50%)
-Un nivel deseado de confianza (95%).

Estos datos vienen con frecuencia predeterminados por el programa. La información


verdaderamente importante tiene que ver con el tamaño del universo poblacional que,
generalmente en los ejercicios planteados en el contexto Colombiano, provienen de cifras del
DANE. Por ejemplo, si se ingresa en el programa un tamaño del universo de 1000 personas, el
programa calculará, como tamaño de la muestra, 278 personas.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 7


Imagen 3. Plataforma para la determinación del tamaño de una muestra (STATS 2.0)

Fuente. Archivo personal

PASO OCHO: RECOLECCIÓN DE LA INFORMACIÓN

Luego de haber seleccionado la muestra el paso a seguir es seleccionar el mecanismo de


recolección de información. En este punto se debe tener certeza de que el instrumento elegido
es confiable y válido para medir el constructo a indagar.

La literatura reporta distintas formas de medir la confiabilidad y la validez de un instrumento.


Para el caso de la confiabilidad podríamos mencionar dos tipos de ellas. Las formas externas y
las internas.

Las formas externas, hacen referencia al uso de distintos mecanismos diferentes a la prueba en
sí para medir su confiabilidad. Estas las podríamos resumir en: 1. Test-pretest (cuando se aplica
la prueba en un momento y luego, pasado un tiempo prudente, se vuelve a aplicar para medir la
consistencia en las respuestas), 2. De forma alterna o paralela (es decir, cuando se usa una
segunda prueba que mida el mismo constructo y se comparan los resultados de ambas pruebas)
y 3. Entre evaluadores (cuando se comparan los puntajes dados por dos o más evaluadores a
una prueba u observación). En todos los casos, estas formas externas suponen el uso de un
coeficiente de correlación que permite estimar la asociación entre los puntajes comparados, por
ejemplo entre el primer test y el segundo test, o entre la prueba uno y la prueba dos. El

8
supuesto es que, si dos pruebas miden lo mismo, o si la prueba fue aplicada a las mismas
personas, la correlación entre los dos puntajes debe ser muy similar, de lo contrario el
instrumento posee poca consistencia. En la unidad cinco veremos cómo se usan estos
coeficientes y cómo se determinaría la confiabilidad en un instrumento cuando tenemos datos
de este tipo.

Las formas internas de medir la confiabilidad van al instrumento en sí y lo analizan de manera


estadística. Existen distintas formas de esto y las podemos resumir en: 1. División por mitades
(dividir los resultados de una prueba en dos mitades y comparar las mitades para ver
consistencias), 2. Kuder-Richarson y 3. Alfa de Cronbach. Estas dos últimas son propiamente
ecuaciones estadísticas que permiten establecer con certeza la confiabilidad del instrumento.
En la unidad cuatro se describirán la forma de calcular fácilmente la confiabilidad a través del
uso del Alfa de Cronbach, sobre las bases construidas a partir de la información recopilada.

Para el caso de la validez se mencionan tres tipos: la validez de contenido, de constructo y la


validez de criterio. La validez de contenido se verifica a través de pares expertos quienes
revisaran los ítems del instrumento y certificaran que aquellos están midiendo lo que pretenden
medir. La validez de constructo hace referencia al uso de herramientas estadísticas, como el
análisis factorial, que señalarían si el instrumento seleccionado mide de forma correcta el
constructo. La validez de criterio tiene que ver con la validación a través de criterio externo de la
prueba o instrumento.

Volviendo al tema de los instrumentos, es de mencionar que existen distintas formas de estos
que van desde las pruebas hasta el cuestionario. Aquí señalaremos uno de ellos:

Cuestionario
Un cuestionario consiste en un conjunto de preguntas respecto de una o más variables a medir.
Como aspecto importante, este debe responder o ser congruente con el planteamiento del
problema e hipótesis.

Los cuestionarios pueden diseñarse a través de preguntas abiertas o cerradas. Cada una de ellas
tiene sus ventajas y desventajas, sin embargo, para la investigación cuantitativa se sugiere
utilizar cuestionarios de diseño cerrado, preferiblemente con preguntas tipo escala LIKERT que
va desde muy de acuerdo hasta muy en desacuerdo.

Es importante señalar que en todo momento el instrumento debe ir codificado, esto significa
que siempre se le debe atribuir un valor numérico a cada pregunta u opción de respuesta en el

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 9


mismo. Las bases que se construyen con la información recopilada se elaboran con estos
códigos o valores ya que los análisis serán siempre de carácter cuantitativo y no de orden
textual.

Otras formas de recolección de información van desde las observaciones, pasando por las
pruebas estandarizadas e inventarios, hasta el uso de la información recopilada por otros
investigadores. En todo caso, el estudiante deberá seleccionar de forma adecuada el
instrumento que crea conveniente para responder a su problema de investigación. Este
instrumento debe estar acorde con los objetivos del estudio, el alcance, el diseño e, incluso, con
la muestra seleccionada.

Luego de hechas estas explicaciones de los pasos a seguir en el proceso de la investigación


cuantitativa, previos al momento de análisis cuantitativo, entraremos, en la próxima unidad, a
detallar las formas en las cuales el investigador puede describir los datos numéricos que
recopila de su investigación y, si es el alcance, inferir y explicar a partir de estos datos.

10
Análisis Descriptivos y uso
SEMANA 3 Herramientas de Análisisde

[ MÉTODOS CUANTITATIVOS DE PSICOLOGÍA]


MÉTODO CUANTITATIVO

ÍNDICE

NÚCLEO TEMÁTICO 2. ANÁLISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANÁLISIS ....... 2


Objetivos 2
Contenido 2
PASO 8: EL ANÁLISIS 2
Base de datos 3
Niveles de medida 3
El entorno de SPSS 4
Continuando con la base 5
Seleccionar casos 6

ANÁLISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANÁLISIS


Objetivos
• Identificar las formas de uso de las plataformas de análisis de datos numéricos SPSS
• Aprender las formas de elaborar una base de datos.
• Contenido
• Usos de SPSS.

PASO OCHO: EL ANÁLISIS

Hemos visto hasta el momento los pasos que se siguen en una investigación. Partimos de una idea, un
problema y continuamos con la formulación de la investigación, su alcance, la definición de sus hipótesis,
su diseño hasta llegar a la muestra. Ahora continuaremos con el análisis, que corresponde al eje principal
de este MÓDULO. Llegado a este punto el estudiante debe tener en cuenta que el paso a seguir requiere
lo siguiente:

-Una base de datos con la información de análisis


-Saber cuáles son las variables de estudio
-Saber cuál es el nivel de medición de la variable
Conociendo esto, procederemos luego a una comprensión de los tipos de análisis disponibles y a la
elección de algunos de ellos para nuestro estudio. Primero partamos de la elaboración de la base de
datos.

2
Base de datos
Aunque evidente, es importante recordar que los programas de análisis cuantitativo funcionan con
valores numéricos y no con texto. Es así que las bases que se elaboren para tal fin deben responder a
esta característica.

Es común ver en el estudiante que inicia su proceso, cometer el error de digitar en su base palabras
como hombre, mujer, Alto, Bajo, etc., Por ello, el primer paso en este proceso tiene que ver con la
categorización de las variables y la atribución numérica a las categorías de las variables. Así, el estudiante
debe atender a cuál es la variable medida y qué características tiene. Miremos el ejemplo de encabezado
de una prueba que aparece abajo. Allí aparecen los datos personales del paciente. Como se ve, la prueba
indaga por la variable sexo. La misma tiene a su vez dos categorías: hombre y mujer.

EJEMPLO DE ENCABEZADO DE UNA PRUEBA

A estas categorías se le asigna un valor numérico que, si bien, en principio puede ser cualquiera, ya que
estos valores sólo funcionan como etiquetas, generalmente son del tipo 1 y 2. 1: hombre, 2: mujer. En
este punto se recomienda al estudiante evitar el uso del 0 como categoría. El 0 es útil sólo en los casos
en los que la categoría, por sí misma, designe una falta o carencia, por ejemplo, cuando tomamos cierto
tipo de respuestas dicótomas o de dos opciones, como sí y no, En estos caso el sí puede categorizarse
con un 1 y el no con un 0. En el resto de las situaciones se puede evitar estos usos.

NIVELES DE MEDIDA
Existen distintas formas de entender los valores numéricos en una base. En esta unidad utilizaremos la
división establecida por Coolican (2005) entre variables categóricas y variables medida.

Los datos que designan categorías (datos etiqueta) no tienen un valor real en cuanto magnitud, Así, en el
ejemplo anterior, puedo tener una variable que se llame tipo de investigador y atribuir, al primer tipo
(Clínico) el valor de 1, y al segundo (Investigador) el valor de 2.Es claro que con este tipo de dato
numérico no es posible ubicar puntos intermedios.

En las variables medida, por el contrario, los valores numéricos sí tienen un poder o magnitud como
número, ya que son el resultado, generalmente, de la aplicación de una escala (en el caso anterior la
variable Edad es un tipo de variable medida).

Existe un común acuerdo en los tipos de niveles de medida. Estos son: nominal, ordinal, de razón y de
intervalo (Hernández, Fernández y Baptista, 2010, p.214).

En el nivel de medida nominal hay una categorización de la variable y se asignan valores numéricos a
cada categoría. Así, por ejemplo, frente a la variable altura, pueden aparecer categorías como altos y
bajos, a las cuales les atribuyo un valor numérico cualquiera. El estudiante debe tener presente que las
categorías nominales denominan grupos separados.

En el nivel de medida ordinal, además de categorizar, aparece el ordenamiento o posicionamiento de


dichas categorías. Algunos ejemplos de este tipo de nivel frecuentemente los encontramos en variables

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 3


como “estrato socioeconómico”, “nivel educativo” pero, especialmente, en las opciones de pregunta
tipo escala Likert (que va desde me gusta poco a me gusta bastante).

Estos dos tipos de medida hacen parte de lo que se denomina variables discretas. Los valores numéricos
se asocian a la designación de grupos o conjunto de personas o cosas, por lo cual no hay un continuo
entre un valor numérico y otro (no es posible pensar, en una variable dicótoma, como género, un valor
intermedio como 1,5).

Los otros dos tipos de medida, de intervalo y de razón, hacen referencia a unidades o valores numéricos
medibles a través de escalas (de allí su denominación como escalares).

Las variables de intervalo, designan datos agrupados cuyo valor numérico tiene un peso o magnitud
como número. Es común en este tipo de variables que no exista un 0 absoluto.

Las variables de razón son escalas de tipo intervalo que tienen un cero absoluto y, en estas, los valores y
razones de los valores tienen sentido. Este tipo de variables es común en las mediciones de cantidades
físicas.

Todas estas aclaraciones son importantes antes de continuar con nuestra base. Como veremos, una
parte importante del trabajo inicial con SPSS consistirá en hacer una atribución adecuada del nivel de
medida de la variable, ya que de éste dependerá el tipo de análisis concreto que se haga. Continuamos
entonces con el reconocimiento del entorno de SPSS.

EL ENTORNO DE SPSS

SPSS (Statistical Package for the Social Science)funciona con un entorno parecido a otro programa muy
conocido, Excel. Una rejilla o matriz de filas y columnas donde se pueden disponer los datos o valores de
una investigación.
Se pueden descargar versiones de prueba gratuitas por catorce días desde la página del proveedor.
https://www.ibm.com/analytics/es/es/technology/spss/spss-trials.html Consultada el 11 de abril de
2013.

4
Pantallazo tomado de SPSS

En su entorno, SPSS tiene una gran ventaja ya que permite ingresar los datos (vista de datos) y, a su vez,
especificar las características de las variables (vista de variables). En la vista de datos se digitaran los
datos resultado del estudio, y en la de variables las distintas variables que hacen parte de la
investigación. Recomiendo al estudiante que no esté familiarizado con este tipo de programas una
primera visita a algunos tutoriales que están disponibles en la web para que su familiarización con la
plataforma.
http://www.youtube.com/watch?v=q-KLq-USjII
http://www.youtube.com/watch?v=Nht2bkxbD2w
http://www.youtube.com/watch?v=O0FC7Nh2A_4

Es importante, ya sea en el ingreso de los datos como en el importe de ellos desde Excel, la atribución
correcta de las características de los mismos. Es igualmente relevante definir los decimales, las etiquetas,
los valores de etiqueta y, de manera muy especial, como se había mencionado anteriormente, el nivel de
medida de cada variable.

CONTINUANDO CON LA BASE

A continuación he de explicar algunos requisitos básicos para el trabajo con la base a partir de un
ejemplo. Como se podrá dar cuenta el estudiante, las columnas designan los variables y las filas los
casos. Se recomienda dejar una columna como variable de identificación. Muy útil para identificar
cuestionarios si llegase a existir errores que hay que revisar en los formularios.

En éste ejemplo tengo 4 variables (Género, Var1, Var2, Var3) y un dato de ordenamiento (Identificación
– ID).

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 5


Como recordarán, el nivel de medida de la variable género será nominal (porque los números serán
utilizados como etiquetas o denominaciones de valor para el reconocimiento de las personas de ese
grupo). Las otras variables son escalares. Para proceder con el análisis el estudiante puede importar
estos datos del ejemplo desde Excel a SPSS o ingresarlos directamente sobre la plataforma de SPSS:
Por favor digite (o copie y pegue) el ejemplo en una hoja de Excel.
ID GENERO VAR1 VAR2 VAR3
1 1 13 14 30
2 1 18 19 39
3 1 22 23 50
4 1 54 55 21
5 1 23 24 42
6 1 26 27 16
7 1 27 28 50
8 1 24 25 45
9 1 18 19 45
10 2 19 20 29
11 2 25 26 30
12 2 54 55 20
13 2 55 56 49
14 2 26 27 18
15 2 38 39 17
16 2 39 40 33
17 2 27 28 47
18 2 11 12 25
19 2 12 13 43
20 2 24 25 21

Para importar los datos el estudiante deberá seguir una pequeña secuencia en SPSS:

Comando: Archivo/Abrir/Datos
SPSS tratará de buscar los datos, por defecto, en la carpeta [Documentos] e identificará archivos con la
extensión *.sav. Los archivos de Excel tiene la extensión *.xls *.xlsx o *.xlsm. El estudiante deberá
cambiar la búsqueda en “Archivos de tipo”, de archivo de SPSS(*.sav) a Excel. Este paso tiene una ventaja
adicional y es que permite que SPSS importe los datos con los respectivos nombres de las variables.
La otra opción es copiar directamente la base y pegarla en la primera casilla. Sólo se copiaran los datos
numéricos. El estudiante deberá ajustar las variables en la vista de variables.
Este es el primer paso para el trabajo con SPSS.

SELECCIONAR CASOS
Uno de los primeros ejercicios que se puede hacer con una base es la selección de casos específicos para
el análisis sólo de los casos de interés. Para ello, es estudiante debe digitar el siguiente comando:

Comando: Datos/Seleccionar casos…

6
Pantallazo tomado de SPSS

SPSS tiene varias opciones para la selección de casos. Para este ejercicio sólo nos centraremos en la
selección de una categoría de una variable, por ejemplo, en la categoría hombre de la variable Género.
Para ello, en la ventana emergente debe seleccionar la opción [Si se satisface la condición] y oprimir la
pestaña [Si la op…] allí aparecerá el siguiente cuadro de dialogo lógico:

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 7


Pantallazo tomado de SPSS

Se selecciona la variable de la cual se escogerá el caso o categoría y se utiliza el operador lógico para la
selección. Se debe tener presente cuál es el valor numérico que es tiqueta? al caso o categoría antes de
continuar. Para el caso de los hombres estos tienen el valor numérico de 1, por ello, si quisiera sólo
seleccionar a este grupo los comandos que puedo utilizar son:

[Género] < 2
[Género] <=1
[Género] = 1
[Género] ~= 2
Cualquiera de estas opciones lógicas debe permitirnos sólo la selección de la categoría 1 (hombre) de la
variable [Género]. Continuamos y aceptamos

Sabemos que hemos seleccionado casos específicos porque los casos no seleccionados aparecerán
tachados en las filas de la izquierda. Como se ve en el ejemplo:

8
Pantallazo tomado de SPSS

Estos son los comandos básicos para funcionar con SPSS. En la próxima semana se trabajará
propiamente el análisis descriptivo de las variables.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA] 9


Análisis Descriptivos y uso
SEMA
Herramientas de Análisisde
NA 4

[ MÉTODOS CUANTITATIVOS
DE PSICOLOGÍA ]
MÉTODO CUANTITATIVO

ÍNDICE

NÚCLEO TEMÁTICO 2. ANÁLISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANÁLISIS ........ 2


Objetivos 2
Contenido 2
ANÁLISIS DESCRIPTIVOS 2
Medidas de tendencia central 3
Medidas de dispersión 3
Pasos para calcular medidas de tendencia central y dispersión en SPSS 5
Frecuencias y distribuciones 9
Graficación de los datos 11
Distribución normal 19

ANALISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANÁLISIS

Objetivos
-Aprender a analizar descriptivamente los datos numéricos

Contenido
- Distribuciones de frecuencia
- Medidas de tendencia central
- Medidas de variabilidad.

ANÁLISIS DESCRIPTIVOS
La estadística resulta útil para los análisis psicológicos ya que nos permite tanto describir como
inferir a partir de un conjunto de información recopilada. Existen dos tipos de análisis
estadísticos: los descriptivos y los inferenciales. En esta ocasión nos centraremos en los análisis
descriptivos.

Los análisis descriptivos me permiten, como su nombre lo indica, describir un conjunto de


datos. En ese sentido, esta estadística está relacionada con el ordenamiento u organización de
los datos, ya sea a través del informe de porcentajes o, en mayor medida, de la tendencia de los
datos o de la dispersión de los mismos. Comenzaremos con las medidas de tendencia.

2
Medidas de tendencia central
Existen distintas medidas de tendencia. Para este módulo hablaremos de tres de ellas: la media,
la mediana y la moda.

La media, o promedio, o media aritmética, es la medida de proporción que se obtiene al sumar


un conjunto de datos y dividirlos por el número de datos. Es, en ese sentido, el punto
intermedio exacto de todos los valores combinados. Veamos esto con un ejemplo:

Si llego a tener este conjunto de datos:

2, 5, 7, 8, 3, 7,

La media se calculará sumando esos valores 2 + 5 + 7 +8 +3 +7 y dividiéndolos por el número de


datos (n = 6). El resultado en este caso es 5,33.

Así, la fórmula que identifica la media es:


∑𝑥
∆𝑥 =
𝑛
∆x : 5,33

La mediana, informa del valor central de un conjunto de datos. El paso para calcularla depende
de que los datos estén ordenados ascendentemente. Así, en el ejemplo anterior, tendríamos
que ordenar los datos de la siguiente manera:

2, 3, 5, 7, 7, 8.

En este ejemplo no hay un solo dato en la mitad sino dos, el 5 y el 7. Cuando esto sucede
(porque el número de datos es par) se toman estos datos y se calcula su promedio (5 + 7 y se
divide por 2), lo cual da un valor de 6, como dato intermedio entre 5 y 7.

M:6

La moda, es el valor que más se repite, o el dato que tiene una mayor frecuencia de aparición.
En el ejemplo anterior es bastante fácil ver que el dato que más se repite es 7, por tanto, esta
sería la moda para este ejercicio.

m: 7

Medidas de dispersión
Para el investigador no sólo es importante conocer hacia dónde tienden los datos sino también
qué tan dispersos se encuentran unos de otros. Dentro de los tipos de medida de dispersión
encontramos:

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 3


Rango. Se entiende el rango como la distancia entre los valores superior e inferior de un
conjunto de datos. El cálculo se consigue restándole al mayor de los datos el menor, y sumando
1. Así, en el ejemplo anterior, el Rango sería:

R: (8 – 2) + 1 : 5.

Desviación estándar. La mejor forma de entenderla es como un tipo de media. Es el promedio


de las distancia de separación de todos los valores respecto al valor medio de ellos. Su fórmula
es la siguiente:

∑(𝑥𝑖 − ∆𝑥)2
𝑆𝑥 = √
𝑛− 1

Varianza. Ésta es simplemente el cuadrado de la desviación estándar. Su cálculo se realizaría


con la fórmula anterior pero sin utilizar la raíz cuadrada.

Manualmente podemos calcular la desviación estándar y la varianza como sigue:

1. Calcular la media
2. Restar, a cada uno de los valores el valor de la media, para obtener la serie de
desviaciones
3. Calcular el cuadrado de cada resta
4. Sumar estas desviaciones
5. Dividir el resultado entre el número de datos menos 1
6. Calcular la raíz de éste valor.

Miremos estos pasos con el ejemplo anterior:

2, 3, 5, 7, 7, 8

1. Sabemos que la media es 5, 33


2. Restamos a cada dato la media
a. (2 – 5,33) : -3,33
b. (3 – 5,33) : -2,33
c. (5 – 5,33) : - 0,33
d. (7 – 5,33) : 1,67
e. (7 – 5,33) : 1,67
f. (8 – 5,33) : 2,67
3. Calculamos el cuadrado de cada uno de los valores
a. (-3,33)2 : 11,08
b. (-2,33)2 : 5,43

4
c. (-0.33)2 : 0,1
d. (1,67)2 : 2,78
e. (1,67)2 : 2,78
f. (2,67)2 : 7,12
4. Sumamos estos valores : 29,3
5. Dividimos este valor entre (6 – 1) :29,3/5 : 5,85
6. Calculamos la raíz de este valor : 2,42.

Este sería el valor de Sx

Para calcular la varianza simplemente elevamos este valor al cuadrado. S2: (2,42)2 :5,85

Pasos para calcular medidas de tendencia central y dispersión en SPSS


Vamos a seguir el mismo ejemplo utilizado anteriormente.

En nuestra base de SPSS vamos a insertar una variable que se llame ejemplo, desde la vista de
variables. Aquí debemos revisar que el tipo de medida aparezca como [Escalar].

Luego de ello vamos a ir a la vista de datos e incluiremos los valores utilizados en el ejercicio
anterior (2, 3, 5, 7, 7, 8). Debe quedarnos algo como esto:

Fuente. Archivo personal

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 5


Vamos a seguir la siguiente secuencia:

Comando :Analizar/Estadísticos descriptivos/Frecuencias

Fuente. Archivo personal

6
Debe aparecernos un cuadro de diálogo como el que sigue:

Fuente. Archivo personal

Pasamos la variable ejemplo al cuadro que dice [Variables], ya sea arrastrando EJEMPLO o
simplemente seleccionando la variable y oprimiendo la flecha que aparece en la parte central
del cuadro de diálogo.

Luego de esto damos a la opción que dice [Estadísticos…]. Allí aparecerá un cuadro de diálogo
como el que sigue, desde donde nos es posible especificar las tendencias centrales que
queremos, al igual que las medidas de dispersión. Seleccionamos entonces, para este ejercicio,
la Media y la Desviación típica. Damos a [Continuar] y a [Aceptar].

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 7


Fuente. Archivo personal

8
SPSS abrirá una ventana de resultados como la que sigue, en donde informa del valor de la
media y la desviación.

Fuente. Archivo personal

Si comparamos, los valores arrojados por SPSS son exactos a los que arroja el análisis manual de
los datos.

Frecuencias y distribuciones
Es muy probable que, con un conjunto de datos, existan algunos de ellos que se repitan en cada
uno de los casos. La frecuencia hace referencia justamente a estas repeticiones de los valores
en los datos. La distribución es la forma en la cual los datos se encuentran repartidos en una
muestra o población. Generalmente es posible representarla con una curva de distribución o
curva normal (de la cuál hablaremos más adelante).

La distribución de frecuencias es entonces la organización de la frecuencia en un cuadro que me


permite observar el número de veces que se repite cada dato en el conjunto de la investigación.
A continuación veremos los pasos en SPSS para obtener este cuadro de distribución de
frecuencias.

Vamos a volver a la pequeña base que hemos elaborado en SPSS anteriormente con los datos
de la tabla que aparece al inicio de la cartilla (base que tiene una variable de género y 3
variables escalares VAR1, VAR2 y VAR3, y que se encuentra anexa a este módulo).

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 9


SPSS permite que los pasos para el análisis se hagan tanto en la ventana de la base como en la
de resultados. Si recuerdan, cuando realizamos los pasos para el análisis descriptivo de
frecuencia, utilizamos la siguiente cadena de comandos:

Comando: Analizar/Estadísticos descriptivos/Frecuencias

Al hacer esto, verifico que el cuadro de dialogo tenga seleccionada la opción Mostrar tablas de
frecuencias, como aparece abajo.

Fuente. Archivo personal

10
Luego, selecciono las tres variables escalares: VAR1, VAR2 y VAR 3 y las paso al cuadro
[Variables:]. Selecciono el botón que dice [Estadístico…] Debemos recordemos que, al ser
escalares, es posible realizar mediciones de tendencia central y dispersión sin problemas. De
preferencia vamos a tomar la media, la mediana y la moda como medidas de tendencia central,
y de dispersión la desviación típica, la varianza y el rango. Luego de esto damos a [Aceptar].
Debe aparecernos en la ventana de resultados un cuadro como este:

Allí, vemos que los valores 21, 30, 45 y 50 se repiten dos veces en la VAR3. Este cuadro nos
muestra, en las columnas, tanto los valores de frecuencia o repetición de los datos como el
valor de porcentaje, que representa el porcentaje de cada dato respecto del total de datos
(100%).

Graficación de los datos


Una parte importante del proceso descriptivo tiene que ver con la visualización gráfica de los
datos, ya que ello facilita su interpretación y permite clarificarlas características de los mismos.

Podemos resumir estos gráficos en: gráfica de barras, barras agrupadas, gráficas lineales,
histogramas, diagramas de cajas y bigotes y diagramas de dispersión.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 11


Gráfica de barra
Las gráficas de barras son unos de los gráficos más comunes en los trabajos descriptivos.
Permiten representar visualmente los resúmenes de las variables medidas. En el eje “x”
aparecerán los valores categóricos, de forma agrupada, mientras que en el eje “y” la frecuencia
o porcentaje de la variable medida.

Para entender cómo se grafican estos datos vamos a volver a nuestra base anterior en SPSS
(base que tiene una variable de género y 3 variables escalares VAR1, VAR2 y VAR3).

Algunos comandos permiten que, durante el procedimiento de análisis, se tenga la opción de la


presentación grafica de los resultados. Vamos a explicar tanto este como el paso por fuera del
comando de análisis.

En el ejercicio de más arriba utilizamos la siguiente cadena de comandos:

Comando: Analizar/Estadísticos descriptivos/Frecuencias

En esta ocasión vamos a seleccionar el botón que dice [Gráficos…]. Aquí aparecerán tres
opciones: 1. Gráfico de barras, 2. De sectores y3. Histograma (el cual permite la opción de
mostrar curva normal).

Además, este paso permite decidir si trabajar con frecuencias, como valores del gráfico, o con
porcentajes. Generalmente esta decisión depende del estudio y de lo que se quiera mostrar en
él, pero, en muchas ocasiones resulta útil presentar los datos en términos de porcentajes por
cuanto permite comparar una categoría respecto a otra de un total de datos (100%).

Los gráficos de barras, además, permiten observar en detalle la distribución de los datos, por
ello no es recomendable utilizar variables escalares para este tipo de gráficos, ya que este
ejercicio me arrojaría una barra por cada dato, los cuales son generalmente extensos en las
variables escalares, hecho que no aportaría información relevante para el estudio.

Vamos a utilizar para este ejercicio la variable Género del ejemplo anterior. Un aspecto
importante a tener en cuenta es que esta variable es nominal. Así, no pueden realizarse
medidas de dispersión o medidas de tendencia central. Algunos autores sugieren cálculo de
modas como única alternativa para este tipo de nivel de medida. Por ello, si se ha realizado un
análisis previo de estas estadísticas, es importante quitar la selección de las medidas de
tendencia para luego sí continuar con los análisis.

Otro elemento importante para proceder es la atribución de las categorías de las variables. Para
ello hemos de ir a la vista de variables. Si seleccionamos la casilla de valores, aparecerán unos
puntos suspensivos […] le damos a esta opción y aparecerá el siguiente cuadro de diálogo de
etiquetas de valor:

12
Fuente. Archivo personal

En esta parte hay que asignar valores a las categorías. Como mencionaba arriba, la mejor opción
es asignar el valor de 1 a la categoría de hombres y 2 a las mujeres (aunque no hay un orden
preestablecido para esto). Lo importante es que se tenga en cuenta esta categoría cuando se
pasen los datos a la variable o utilizar las categorías preestablecidas cuando se coloquen las
etiquetas. Colocamos en Valor:1 y en Etiqueta: Hombres, y damos a la opción de añadir. Luego
colocamos el valor: 2 y en etiqueta Mujeres y damos añadir y aceptar.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 13


Hecho esto, en nuestros gráficos podemos tener el siguiente gráfico de barras:

Fuente. Archivo personal

Gráficas lineales
Este tipo de gráficas me permite describe el progreso de algún grupo. Me permite mostrar
evoluciones o cambios a lo largo del tiempo. En este caso es común representar, en el eje “x”, el
valor tiempo y, en el eje “y”, los cambios asociados a la variable en ese sentido.

Vamos a continuar con nuestra base para ejemplificar este tipo de gráfico, pero vamos a hacerlo
desde otra opción de SPSS, utilizando el comando siguiente:

Comando: Gráficos/Generador de gráficos

Debe aparecer una pantalla como la siguiente:

14
Fuente. Archivo personal

En la opción [Líneas] que aparece en la imagen en gris, me aparecerán dos cuadros. Selecciono
el primero (por tratarse sólo de un conjunto de datos a visualizar) y arrastro la imagen en el
cuadro que dice arrastre hasta aquí un gráfico…. Luego de eso el programa nos presentará un
cuadro con puntos en el eje “x” y en el eje “y”. Como el eje x indica la medida de tiempo, vamos
a seleccionar, del conjunto de variables, la variable ID, ya que esta es una variable de orden de
secuencia. En el eje “y” estaría la variable de cambio, que para este pequeño ejemplo será la

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 15


VAR1, y damos a la opción de aceptar. Nos debe producir, en la ventana de resultados, una
imagen como la siguiente:

Fuente. Archivo personal

Histograma
El histograma permite visualizar un conjunto de barras agrupadas que representa, cada barra,
los valores por cada categoría. El total de todas las áreas de las columnas representarán a toda
la muestra. Es importante notar que las barras, en el histograma, sólo pueden representar
frecuencias, a diferencia del gráfico de barras en donde era posible representar también
porcentajes.

16
SPSS permite además trazar una curva para el histograma. Esta curva llega a ser importante,
como veremos más adelante, para entender si la distribución de los datos es o no normal.

Fuente. Archivo personal

Un ejemplo de este tipo de grafico quedaría así:

Diagrama de cajas y bigotes


Este tipo de diagrama es útil cuando se quiere representar la distribución de un conjunto de
datos, y los extremos del mismo. Es útil para conocer la distribución de los datos respecto de la
media y para saber si existen datos que se alejan del conjunto. Generalmente estos datos
alejados estarán representados con un signo: ° o con un signo: *. Este tipo de gráficas es muy
utilizado para comparar las medias de dos grupos. Por ejemplo:

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 17


Fuente. Archivo personal

Diagrama de dispersión
Este tipo de grafico permite visualizar, en un plano x-y, los puntos de relación de dos variables
(x1, y1), (x2, y2),…, (xn, yn). Generándose un cuadro de puntos donde es posible ver la tendencia o
dispersión de los datos. Tal gráfico, como veremos más adelante, resulta muy útil para entender
las correlaciones.

18
Fuente. Archivo personal

Distribución normal
Otra forma importante de describir los datos tiene que ver con la distribución normal de los
mismos. Generalmente esta se realiza a través de la curva que vimos al hacer el histograma,
llamada también curva gaussiana. Esta curva representa la distribución y tiene las siguientes
características:

1. Es simétrica alrededor del punto intermedio del eje horizontal


2. El punto en torno al cual es simétrica es el punto en el que caen la media, la mediana y la
moda
3. Las colas de la curva (asíntotas) nunca tocan el eje horizontal.

Si bien, se habla de distribuciones normales, ninguna curva en realidad es perfectamente


simétrica. Si vemos el histograma de más arriba nos daremos cuenta que su distribución tiene
una pequeña tendencia hacia la izquierda. Este tipo de distribución resulta común de encontrar
cuando trabajamos con datos psicológicos.

Ahora bien, existen diferentes formas de dividir esta curva. Estas divisiones tendrán el propósito
de ubicar, en porcentaje y en dispersión, un dato específico.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 19


Una de las formas más comunes para dividir una distribución es utilizar las desviaciones
estándar como referente de un conjunto de datos. Dependiendo de la desviación tendremos
una unidad de separación y un porcentaje correspondiente.

Explicaremos esto con más detalle.

En el ejemplo inicial:

2, 3, 5, 7, 7, 8.

La media tiene un valor de 5,33, y el valor de desviación es de 2,42 (calculados, ambos, más
arriba). Entre la media y el valor de desviación habrán 2,91 unidades (calculado al restar a 5,33
2,42). Estas podrán representar nuestra primera unidad 1 (1: 2,91). Tanto por encima como por
debajo de la media. Es decir que de 2,42 a 5,33 habrá una primera unidad (con un valor de
rango de 2,91). A este tipo de unidad estándar d conversión se le denominará puntuación z.

Puntuaciones z
Así, la puntuación z o puntaje z es la puntuación que representa el valor estándar de conversión
a partir de la desviación, es decir, es el número de desviaciones estándar a las que está una
puntuación de la media. La fórmula para calcularla es la que sigue:
𝑥𝑖 − ∆𝑥
𝑧=
𝑆𝑥
Siendo Sx la desviación estándar.

Como les venía diciendo, esta es útil como medida de identificación o ubicación de unos datos
respecto a un conjunto de datos ya que, a más unidades o puntajes z esté un dato, sabremos
que ese dato estará más alejado de la media.

Con esta información damos por finalizada la Unidad Dos y la presentación de los análisis
descriptivos. En una próxima cartilla hablaremos de los análisis inferenciales y las formas de
proceder con ellos desde SPSS.

20
Análisis Inferenciales:
Las Pruebas Paramétricas
SEMANA
5

[ MÉTODOS CUANTITATIVOS DE PSICOLOGÍA ]


MÉTODO CUANTITATIVO

INDICE
NÚCLEO TEMÁTICO TRES. ANÁLISIS INFERENCIALES: LAS PRUEBAS PARAMÉTRICAS 2
Objetivos 2
Contenido 2
SIGNIFICANCIA Y PRUEBA DE HIPÓTESIS 2
PROBABILIDAD 3
NIVEL DE SIGNIFICANCIA 4
PRUEBAS PARAMÉTRICAS 4
CORRELACIONES 4
LA MEDICIÓN DE LA CORRELACIÓN 5
Gráficas de correlación 6
LÍNEA DE REGRESIÓN 7
COEFICIENTES DE CORRELACIÓN 7
CÁLCULO DE LA CORRELACIÓN CON SPSS 8
INFORME DE RESULTADOS 11

NÚCLEO TEMÁTICO TRES. ANÁLISIS INFERENCIALES: LAS PRUEBAS PARAMÉTRICAS


Objetivos
- Aprender las formas de uso de la estadística inferencial paramétrica
Contenido
- Significancia y prueba de hipótesis
- Correlación de Pearson y regresión lineal

SIGNIFICANCIA Y PRUEBA DE HIPÓTESIS


Como se ha mencionado en unidades anteriores, los métodos cuantitativos que dan
soporte a las indagaciones de la ciencia siguen un método hipotético deductivo. Se basan en
hipótesis, las cuales deben ser puestas a prueba para su aceptación o rechazo.

En la unidad uno hablamos de las hipótesis. Recordemos que estas son suposiciones
de respuesta a la pregunta planteada. Así, la hipótesis nula es la suposición sobre la población
de la cual se extrajo la muestra o muestras y en la cual se espera un comportamiento
homogéneo frente a una variable indagada. Esto supone que dos muestras o frecuencias

2 [ POLITÉCNICO GRANCOLOMBIANO]
tendrían comportamientos similares o parecidos, o que no difieren dos poblaciones de las que
se extrajo muestras diferentes.

H0: f1 : f2

El otro tipo de hipótesis se conoce como hipótesis alternativa. Esta se define simplemente
como todo lo que no es la hipótesis nula. En ese sentido, la hipótesis alternativa supone que la
frecuencia en el primer momento o en un primer grupo es distinta a la frecuencia en un
segundo momento o en un segundo grupo.

H1: f1 ≠ f2

Llamamos prueba de significancia a la elección de una de estas dos opciones: ir con la hipótesis
alterna o ir con la hipótesis nula.

PROBABILIDAD

Para calcular la probabilidad es necesario especificar el suceso y también identificar todos los
demás sucesos en la población de la que proviene. Por ejemplo, si desea conocer la
probabilidad de sacar 1 en un lanzamiento de dado, el suceso en cuestión es obtener un 1 y el
total de los posibles sucesos es 6.

Cantidad de sucesos de interés


Cantidad de sucesos posibles

La probabilidad se denota por medio de una p y se mide en valores decimales en una escala que
va de 0 (no posible) a 1 (debe suceder).

Cuando se trata de probar una diferencia en busca de significancia se dan dos pasos:
1. Se supone una hipótesis nula apropiada (H0)
2. Se calcula la probabilidad de que la diferencia ocurra en H0.

Recordemos que la hipótesis nula siempre es una afirmación sobre una o más poblaciones. Es lo
que sería verdadero con respecto al mundo si el resultado que se obtiene fuera una mera
coincidencia.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 3


Cuando uno calcula la probabilidad de que ocurra el resultado
esperado si la hipótesis nula es verdadera, se procede a inferir
que algo es o no es. Uno se vale de la estadística en la muestra
para inferir algo sobre la población en su conjunto (Coolican,
2005).

NIVEL DE SIGNIFICANCIA
Existe por tanto un nivel de probabilidad de rechazo que se denomina nivel de significancia. La
H0 se rechaza cuando la probabilidad de que ocurra un efecto de dicha hipótesis es igual o
menor que 0,05. Es en torno al nivel de probabilidad de 0,05 (1 de 20, o 5%) que se rechaza la
posibilidad de que algo suceda por simple o mera coincidencia.

PRUEBAS PARAMÉTRICAS
Existen distintos tipos de análisis estadísticos que dependen, en esencia, de tres condiciones:

1. De que las variables sean escalares (de razón o de intervalo, en donde el valor numérico
revela una magnitud),
2. De que la distribución de los datos sea normal y
3. De que la varianza sea homogénea (no hay una amplia dispersión de los datos).
Cuando estas tres condiciones se cumplen podemos proceder con confianza a realizar una
prueba paramétrica. Por oposición, cuando no se cumple alguna de estas tres condiciones, las
pruebas a utilizar son no paramétricas. Vamos a iniciar con una forma de prueba paramétrica
que se denomina coeficiente de correlación de Pearson.

CORRELACIONES
Un tipo de análisis muy común es aquel que trata de establecer la posible relación de cambio
entre variables. Existen dos posibles direcciones de este cambio, produciéndose lo que se
conoce como correlaciones positivas y negativas.

Cuando una variable aumenta y la otra también, se habla de correlaciones positivas. Por
ejemplo, se puede establecer el valor de una relación positiva entre en nivel de inteligencia y el
rendimiento académico en la universidad si se supone que mientras el nivel de inteligencia de
una persona aumenta igualmente el rendimiento académico de esa persona.

4 [ POLITÉCNICO GRANCOLOMBIANO]
Las correlaciones negativas suponen que, mientras una variable aumenta, la otra disminuye. Por
ejemplo, se pueden presumir relaciones negativas entre la edad y la memoria, suponiendo que
la variable memoria disminuye mientras la edad aumenta.

Un paso importante para el trabajo con los análisis, y en particular con las correlaciones es saber
con claridad cómo se miden las variables; para ello el estudiante debe recordar que todos los
análisis cuantitativos suponen una operacionalización de las variables, es decir, una definición
de cómo se mide la variable. También es importante saber que los casos en una correlación
pueden estar pareados, por ejemplo, cuando se comparan dos individuos o el mismo individuo
en dos momentos (en estos casos habrá siempre habrá un par). pero también es factible que los
casos sean unidades más abstractas, como escuelas. En resumen, es importante recordar cuál
es la unidad de análisis que se está trabajando.

LA MEDICIÓN DE LA CORRELACIÓN
Es importante notar que las correlaciones arrojan dos tipos de información. Una referente a la
fuerza de la relación (cuando digo que hay o no relación, midiéndose así la vinculación de dos
variables) y otra referente a lo significativa de esa relación.

Coolican (2005) señala que el cálculo de la correlación es una medida descriptiva mientras que
el cálculo de la significancia de esa relación es una medida inferencial, ya que indica la
probabilidad de encontrar el nivel mencionado de vinculación entre las muestras, si no la hay,
de manera verdadera dentro de la población. Así, la fuerza de la relación entre dos variables es
el grado al cual una variable tiende a variar con la otra.

La escala de esta fuerza va desde -1 (negativa perfecta) hasta +1 (postitiva perfecta). Un valor de
0 indica que no existe relación. En ese sentido es claro que no es posible obtener un valor por
encima de 1 o por debajo de -1. El valor para expresar esta relación se conoce como coeficiente
de correlación y se expresa, generalmente, con una r.

Es importante señalar que correlación negativa no significa que no haya correlación, como a
veces se supone. Correlación negativa sólo significa que dos variables se relacionan de manera
inversa. En este punto cabe señalar que la correlación es una medida de relación gradual entre
variables. Esto significa que la relación de cambio entre dos variables no es de todo y nada.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 5


Gráficas de correlación

Generalmente se utilizan las gráficas de dispersión como medida de correlación. Esto supone un
hecho interesante: a mayor dispersión menor correlación y viceversa. Es decir, cuando los
valores pareados en un diagrama x-y no se encuentran dispersos de manera aleatoria sino que
conforman un patrón consistente, es posible encontrar una señal de una fuerza de relación.

Gráfica de correlación positiva

Gráfica de correlación negativa

6 [ POLITÉCNICO GRANCOLOMBIANO]
LÍNEA DE REGRESIÓN
La línea de regresión es la línea de mejor concordancia o de ajuste entre puntos que
se hallan sobre una gráfica de dispersión. Esta línea permitirá entender la tendencia del
conjunto de datos pareados.

Gráfica de línea de regresión

COEFICIENTES DE CORRELACIÓN

Existen dos coeficientes de correlación que se utilizan con mayor frecuencia: el de correlación
de Pearson y el de Spearman. El primero se utiliza como prueba paramétrica y el segundo como
prueba no paramétrica. En esta unidad trabajaremos sólo con el coeficiente de Pearson.

Al tratarse de una prueba paramétrica se deben recordar los criterios para la misma: 1.
Normalidad, 2. Variabilidad, y 3. Tipo de medida. El coeficiente de correlación se obtiene al
multiplicar las puntuaciones z de cada persona en cuanto a las dos variables que se están
correlacionando y encontrar el promedio de estos resultados. En ese sentido, para calcular la r
de Pearson se sigue la siguiente formula:
∑ 𝑍𝑥𝑍𝑦
𝑟 =
𝑛−1

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 7


Donde Zx es el valor de Z de la variable x; Zy es el valor de Z de la variable y. Aquí se estarían
multiplicando las dos desviaciones expresadas en los valores Z y se sumarían estas
multiplicaciones, promediándose entre los grados de libertad.

Existen otros procedimientos un poco más complejos para calcular el valor de r, basados en las
desviaciones estándar. En esta unidad sólo utilizaremos la ecuación antes mencionada. Vamos a
ilustrar la misma con un ejemplo. Tenemos dos puntuaciones en dos pruebas de lectura y se
desea saber si existe alguna relación entre estas dos pruebas. Llamaremos a la puntuación en la
prueba 1 Px y a la puntuación en la prueba 2 Py.

Px Desviación Zx Py Desviación Zy ZxZy


de la de la
media (d) media (d)
67 10.4 0,87 65 5,7 0,41 0,36
72 15,4 1,29 84 24,7 1,78 2,29
45 -11,6 -0,97 51 -8,3 -0,60 0,58
58 1,4 0,12 56 -3,3 -0,24 -0,03
63 6,4 0,54 67 7,7 0,55 0,3
39 -17,6 -0,148 42 -17,3 -1,24 1,84
52 -4,6 -0,39 50 -9,3 -0,67 0,26

Como podrán calcular fácilmente la media de Px es 56,6.


La desviación estándar o típica (Sx) de Px es 11,9.
Zx se calculará dividiendo el valor de desviación de la media de cada valor (d) sobre la desviación
estándar (Sx). Zx : d/Sx. Un procedimiento similar se utilizará para calcular Zy.
La media de Py es 59,3
La desviación estándar o típica (Sy) de Py es 13,9.
La ∑ de ZxZy será 5,6
Siguiendo la ecuación anterior de r
∑ 𝑍𝑥𝑍𝑦
𝑟 =
𝑛−1
r : 5,6 / 6 : 0,929

CÁLCULO DE LA CORRELACIÓN CON SPSS


Vamos a iniciar creando una base en SPSS con los datos de la variable antes
mencionados (Px y Py). Debemos tener una imagen como esta en la vista de variables.

8 [ POLITÉCNICO GRANCOLOMBIANO]
Fuente. Elaboración propia
Digitamos los datos en las dos columnas en la vista de datos.

Fuente. Elaboración propia

Ahora, vamos a los comandos de Analizar/Correlaciones/Bivariadas…

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 9


Fuente. Elaboración propia

Luego, se pasan las dos variables Px y Py al cuadro de [Variables]. Se debe verificar que el
coeficiente de correlación seleccionado sea el de Pearson. En la pestaña de opciones es
recomendable señalar las medias y desviaciones estándar. Se procede a [Aceptar].

Fuente. Elaboración propia

10 [ POLITÉCNICO GRANCOLOMBIANO]
El análisis debe darnos un resultado como el que sigue:

El cuadro en rojo señala el valor de la fuerza de la correlación. Mire que este valor es idéntico al
conseguido de forma manual. Como recordarán, el valor máximo de correlación (para indicar
una correlación perfecta) es de 1. Aquí, el valor de 0,93 se aproxima a este valor, lo que indica
que hay una alta relación entre los puntajes de las dos pruebas, lo esperado si se considera que
ambas pruebas miden el mismo constructo.

No existe un criterio estándar o único para decir si hay o no correlación. Como mencionaba
anteriormente, la correlación es una medida gradual de relación. Sin embargo, algunos autores
que aplican estos conceptos a la psicología señalan como posible criterio para establecer
correlación cuando el valor de la fuerza de la relación supera los 0,66. Es decir, cualquier valor
por debajo de este se descarta como correlación, y cualquier valor por encima (entre 0,66 y 1)
señala una posible relación entre las variables.

INFORME DE RESULTADOS
Si bien la fuerza de la relación es importante, recordemos que este es sólo un valor descriptivo
del cambio. Es necesario, para el reporte del análisis, considerar el valor de la significancia de la
relación. Recordemos que el valor de la significancia es importante sólo cuando cae en el 5%, es
decir, cuando es menor a 0,05.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 11


En este ejemplo la significancia (p) es igual a 0,002 (aparece encerrada en amarillo). Sólo en
estos casos, cuando la significancia es menor incluso a 0,01, tomamos ya no el 5% como margen
de rechazo de la hipótesis nula sino el 1% como nuevo margen de rechazo. Siguiendo esa línea,
el análisis queda como sigue:

Se encontró que la correlación de Pearson entre las


puntuaciones de la prueba Px y la prueba Py fue
significativa con r=0,93 y p<0,01

Note que el informe del análisis indica una correlación y, además, señala si fue o no significativa.
En el caso de no existir correlación, el informe debe señalarlo. De forma similar se debe indicar
que no hay significancia, generalmente expresado esto como p>0,05.

12 [ POLITÉCNICO GRANCOLOMBIANO]
Análisis Inferenciales:
Las Pruebas Paramétricas
SEMANA
6

[ MÉTODOS CUANTITATIVOS DE PSICOLOGÍA ]


MÉTODO CUANTITATIVO

INDICE

NÚCLEO TEMÁTICO TRES. ANÁLISIS INFERENCIALES: LAS PRUEBAS PARAMÉTRICAS 2


Objetivos de la semana 2
Contenido de la semana 2
PRUEBAS DE DIFERENCIAS ENTRE DOS MUESTRAS 2
PRUEBA DE DIFERENCIA DE MEDIAS PARA MUESTRAS RELACIONADAS 3
Cálculo manual del valor de la t de Student para muestras relacionadas 4
Informe de los resultados de una prueba t de Student para muestras relacionadas 6
Cálculo con SPSS de las diferencias de muestras relacionadas 6
Graficación de las diferencias entre dos muestras relacionadas 9
PRUEBA DE DIFERENCIA DE MEDIAS PARA MUESTRAS INDEPENDIENTES 11
Cálculo manual del valor de la t de Student para muestras independientes 12
Informe de los resultados de una prueba t de Student para muestras independientes 13
Cálculo con SPSS de las diferencias de muestras independientes 13
Graficación de las diferencias entre dos muestras independientes 19
ANOVA: PRUEBA DE DIFERENCIA ENTRE MÁS DE DOS CONDICIONES 22
El Concepto de error en el ANOVA 22
Coeficiente F 22
Cálculo manual del valor del ANOVA 23
Informe de los resultados del ANOVA 25
Cálculo con SPSS de las diferencias de muestras independientes 25

NÚCLEO TEMÁTICO TRES. ANÁLISIS INFERENCIALES: LAS PRUEBAS PARAMÉTRICAS


Objetivos de la semana
- Aprender las formas de uso de la estadística inferencial paramétrica
Contenido de la semana
- Pruebas de diferencia de medias: t relacionadas y t independientes
- Análisis de varianza a un factor: ANOVA

PRUEBAS DE DIFERENCIAS ENTRE DOS MUESTRAS


Hasta el momento hemos comparado dos variables para ver si ellas se hallan relacionadas de
alguna forma. Otro caso muy común en los análisis cuantitativos tiene que ver con la
comparación de dos grupos, muestras, comunidades, poblaciones o personas, particularmente
en la comparación de los promedios de algún puntaje o característica numérica.

2 [ POLITÉCNICO GRANCOLOMBIANO]
Puede resultar interesante saber, por ejemplo, si los resultados de la evaluación aplicada a una
persona en un momento dado, antes de una intervención, difieren significativamente de los
resultados de la misma persona en un momento posterior a la intervención. Si se encuentran
diferencias se puede establecer que la intervención generó un cambio en esa persona.

También puede resultar interesante, por ejemplo, saber si dos grupos de personas, que se
diferencian por alguna variable categórica, como su género, tienen diferencias significativas en
los puntajes frente a una prueba específica, como una de ansiedad o de estrés laboral. En
definitiva, dentro de los análisis, en las investigaciones y en particular en las investigaciones con
alcance descriptivo-comparativo, es común encontrar la posibilidad de comparar, bien a un
mismo sujeto, como en el primer caso, o a diferentes sujetos, como en el segundo. En la
primera situación hablaremos de pruebas para muestras relacionadas y en la segunda, de
pruebas para muestras independientes. Estas pruebas reciben el nombre de pruebas t, y serán
presentadas a continuación.

PRUEBA DE DIFERENCIA DE MEDIAS PARA MUESTRAS RELACIONADAS

Primero, hay que recordar que toda prueba inferencial es, en esencia, una prueba de hipótesis
nula. En ese sentido, la prueba inferencial va calcular la probabilidad de que el resultado ocurra
debido al azar o, por el contrario, por efecto de la variable independiente. La hipótesis nula
informa del estado de la variable cuando, se supone, no hay ningún efecto.

Cuando, además, esperamos que los resultados tomen una dirección específica, por ejemplo,
que las personas mejoren de manera importante después de una intervención, decimos que la
aproximación a la prueba es direccional ya que estamos indicando una posible dirección a
tomar por los datos recabados (que el puntaje del tratamiento 1 sea mayor que el puntaje del
tratamiento 2, o que los hombres tengan una puntuación mayor en ansiedad que las mujeres).
Por el contrario, en los modelos no direccionales se dice que habrá una diferencia entre un
momento y otro, pero no se especifica en qué sentido se da esta diferencia (cuando sólo se
predice que habrá una diferencia entre los puntajes en las intervenciones pero no se supone en
cuál de ellas habrá mayor puntaje).

La hipótesis nula para este caso es que las dos muestras de puntuaciones provienen de
poblaciones con la misma media, y por tanto la falta de diferencia entre estas medias debe
darnos valores cercanos a 0. La hipótesis nula diría que las pequeñas diferencias que pueden

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 3


hallarse se deberán a errores debidos al azar. En ese sentido, las diferencias poblacionales
tienen una media de 0.
H0 : µ d = 0

La hipótesis nula en este caso se vale del promedio de diferencias o media diferencial de los
datos de la muestra comparados por momentos. Algo muy similar a la desviación estándar,
llamada aquí error estándar (ee). Cada muestra, extraída aleatoriamente, según la H0, difiere de
la media de 0 sólo por un error de muestreo. En ese sentido, cada desviación de una muestra de
la media de la población se considera un error. De ello se deduce la siguiente ecuación:

𝑆𝑑
𝑒𝑒 =
√𝑛

Siendo Sd la desviación estándar de las diferencias. Siguiendo esta línea se puede estimar la
proporción entre la media diferencial y el error estándar bajo un valor llamado t
∆𝑑
𝑡=
𝑒𝑒

Siendo ∆d la media diferencial o promedio de las diferencias entre los puntajes muestrales en
un momento y otro. O lo que es lo mismo
∆𝑑√𝑛
𝑡=
𝑆𝑑

Que se deduce de reemplazar ee por el valor correspondiente. Vamos a entender con un


ejemplo esta ecuación.

Cálculo manual del valor de la t de Student para muestras relacionadas

El cálculo de t dependerá del uso de la tabla de valores críticos de t (la cual estará adjunta a este
curso), y ésta sólo es posible de usar si se conoce:

1. El nivel de a apropiado de α (generalmente es de ,05)


2. Si se realiza una prueba a una o dos colas
3. Los grados de libertad (generalmente expresados como n – 1)
Vamos a ver esto con un ejemplo. Tenemos 10 participantes y se quiere estimar si existen
diferencias significativas entre la técnica 1 de intervención y la técnica 2. Se aplica un
cuestionario en cada condición y se obtienen los siguientes puntajes:

4 [ POLITÉCNICO GRANCOLOMBIANO]
Participante P en la técnica 1 P en la técnica 2 Diferencia (d)
1 6 6 0
2 15 10 5
3 13 7 6
4 14 8 6
5 12 8 4
6 16 12 4
7 14 10 4
8 15 10 5
9 18 11 7
10 17 9 8
∆x1 = 14 ∆x2 = 9,1 ∆d = 4,9

Siendo ∆ el promedio para cada condición


1. Se calculan los promedios en cada columna (siendo ∆d la media diferencial o promedio de
las diferencias)
2. Se calcula Sd o desviación de las diferencias utilizando la ecuación de la desviación.

∑(𝑥𝑖 − ∆𝑥)2
𝑆𝑥 = √
𝑛− 1
a. (0 – 4,9)2 + (5 – 4,9) 2 + (6 – 4,9) 2 + (6 – 4,9) 2 + (4 – 4,9) 2 + (4 – 4,9) 2 + (4 – 4,9) 2 + (5 – 4,9) 2 +
(7 – 4,9) 2 + (8 – 4,9) 2 = (24,01) + (0,01) + (1,21) + (1,21) + (0,81) + (0,81) + (0,81) + (0,01) + (4,41)
+ (9,61) = 42,9
b. n – 1 = 9
42,9
c. 𝑆𝑑 = √ = 2,18
9
∆𝑑√𝑛
3. Se utiliza la ecuación 𝑡 =
𝑆𝑑
4,9√10
𝑡= = 15,49/2,18 = 7,1
2,18
4. Se encuentran las grados de libertad (gl = n - 1 = 10 – 1 = 9)
5. Se revisa la tabla de los valores críticos de t y se compara el valor calculado de t con el valor
crítico de la tabla. Según esta, para 9 grados de libertad, con una prueba de dos colas y con un
valor de alfa de 0,05, el valor crítico es de 2,26. El valor hallado por nosotros (7,1) supera este
valor (2,26), por tanto sabemos que la diferencia entre una técnica y otra es estadísticamente
significativa.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 5


Informe de los resultados de una prueba t de Student para muestras relacionadas
El informe de la prueba t relacionada queda como sigue:

El puntaje promedio en la técnica 1 (∆x1 = 14) fue


superior al puntaje promedio en la técnica 2 (∆x2 = 9,1).
La diferencia entre estas medias fue estadísticamente
significativa. t = 7,09, p <0,05, a dos colas.

Cálculo con SPSS de las diferencias de muestras relacionadas


Como podrá suponer, el cálculo del valor de t y su análisis se hace mucho más sencillo
utilizando SPSS. Vamos a seguir el ejemplo anterior para mostrar cómo se realiza dicho cálculo.
Para éste sólo necesitamos las dos columnas correspondientes a los puntajes. Inicie verificando
que el tipo de medida sea escalar.

Fuente. Elaboración propia

6 [ POLITÉCNICO GRANCOLOMBIANO]
Luego, seguimos la siguiente línea de comandos: Analizar/Comparar media/Prueba T para
muestras relacionadas…

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 7


Se seleccionan cada una de las variables a contrastar, como se ve en el ejemplo, y se [Acepta] el
procedimiento.

Fuente. Elaboración propia

Al finalizar, SPSS arrojará un conjunto de tablas como siguen:

En estas tablas se describen los valores medios de cada uno de los puntajes en las distintas
técnicas, pero el valor que nos dice si hay diferencias significativas o no es el que aparece
señalado en rojo (sig = 0,000). Recuerde que si este valor es inferior a 0,05 (5%) podemos decir
que las diferencias son significativas, rechazando así la hipótesis nula (aunque en este caso
particular es inferior, incluso, a 0,01).

8 [ POLITÉCNICO GRANCOLOMBIANO]
Graficación de las diferencias entre dos muestras relacionadas
El procedimiento para graficar dos muestras relacionadas es el siguiente: seguimos
esta línea de comandos: Gráficos/Cuadro de diálogo antiguos/Diagramas de cajas…

Fuente. Elaboración propia

Puede seguirse los mismos comandos desde la ventana de resultados:

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 9


Se abrirá un cuadro de diálogo del cual se debe seleccionar la opción Resúmenes para distintas
variables

Fuente. Elaboración propia

Luego, se definen las dos variables a contrastar:

Fuente. Elaboración propia

10 [ POLITÉCNICO GRANCOLOMBIANO]
Y se da a la opción de [Aceptar] para continuar. SPSS debe arrojar un gráfico como el siguiente:

Este gráfico muestra diferencias importantes entre los puntajes de las personas frente a un
tratamiento y los puntajes de las mismas personas frente a otro tratamiento. Es evidente que el
puntaje frente al primer tratamiento es superior al segundo.

PRUEBA DE DIFERENCIA DE MEDIAS PARA MUESTRAS INDEPENDIENTES


El cálculo de la t independiente es similar al de la t relacionada, sólo que las muestras en los
grupos comparación son distintas, es decir, ya no se trata de pares de puntuaciones de la misma
persona sino puntuaciones de grupos de personas diferentes. Para este caso, la hipótesis nula
informaría de que de las dos poblaciones de las que se ha extraído aleatoriamente dichas
muestras tienen medias iguales.

H 0 : µ 1 = µ2
Siendo µ la media poblacional.

La prueba t independiente sigue de forma muy similar el razonamiento de la prueba t


relacionada, sólo que en este caso los valores no provienen de las desviaciones sino de las
varianzas. La t independiente continúa con la idea de error de muestreo y la aplica al cálculo de
t, siendo este error la parte inferior de la ecuación, y ∆ la media para cada caso.

∆𝑥𝑎 − ∆𝑥𝑏
𝑡=
𝑒𝑒

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 11


La ecuación fina queda como sigue:
∆𝑥𝑎 − ∆𝑥𝑏
𝑡=
2 2
(∑ 𝑥𝑎 ) (∑ 𝑥𝑏 )
(∑ 𝑥𝑎 2 − ) + (∑ 𝑥𝑏 2 − )
𝑛𝑎 𝑛𝑏 𝑛 + 𝑛𝑏
√ [ 𝑎 ]
(𝑛𝑎 + 𝑛𝑏 − 2) 𝑛𝑎 𝑛𝑏
[ ]
C
álculo manual del valor de la t de Student para muestras independientes
Vamos a explicar la ecuación anterior con un ejemplo; aunque en apariencia parezca compleja
es bastante fácil de seguir. A continuación encontrará una base de los puntajes de dos grupos
frente a una prueba de ansiedad. Se desea saber si existen diferencias significativas entre ellos.

P del G1 = xa xa 2 P del G2 = xb xb2


14 196 8 64
11 121 10 100
9 81 9 81
12 144 9 81
8 64
∑ xa = 46 ∑ xa2 = 542 ∑ xb = 44 ∑ xb2 = 390

Luego:
1. Se calcula el valor de (∑ xa)2 = 2116
2. Se calcula el valor de (∑ xb)2 = 1936
3. Se calcula la media del grupo 1: ∆xa = 11,5
4. Se calcula la media del grupo 2: ∆xb = 8,8
5. Se resta el valor de la media del grupo 2 al grupo 1: ∆xa - ∆xb = 2,7 (esto nos da el valor de la
parte superior de la ecuación)
6. Se reemplazan los valores en la ecuación
∆𝑥𝑎 − ∆𝑥𝑏
𝑡=
2 2
2 (∑ 𝑥𝑎 ) 2 (∑ 𝑥𝑏 )
(∑ 𝑥𝑎 − ) + (∑ 𝑥𝑏 − )
𝑛𝑎 𝑛𝑏 𝑛 + 𝑛𝑏
√ [ 𝑎 ]
(𝑛𝑎 + 𝑛𝑏 − 2) 𝑛𝑎 𝑛𝑏
[ ]

12 [ POLITÉCNICO GRANCOLOMBIANO]
2,7
𝑡=
2116 1936
(542 − ) + (390 − )
√[ 4 5 ] [4 + 5 ]
(4 + 5 − 2) 4∗5

2,7
𝑡=
(542 − 529) + (390 − 387,2) 9
√[ ][ ]
7 20
2,7
𝑡=
(13) + (2,8)
√[ ] [0,45]
7
2,7
𝑡=
√[2,25][0,45]
2,7
𝑡=
√1,0125
2,7
𝑡=
1,0062
𝑡 = 2,679
7. Se hallan los grados de libertad (gl = na + nb – 2 = 7)
8. Luego de esto se consulta la tabla de valores críticos. Para 7 gl, con un alfa de 0,05 y con una
prueba a dos colas, el valor crítico de t es de 2,365.
9. Comparamos nuestro resultado con el de la tabla. Al ser mayor el nuestro podemos decir que
la diferencia entre las medias es significativa.

Informe de los resultados de una prueba t de Student para muestras independientes


El informe de la prueba t relacionada queda como sigue:

El puntaje promedio del grupo 1 en la prueba (∆xa =


11,5) fue superior al puntaje promedio del grupo 2
en la misma prueba (∆xb = 8,8). La diferencia entre
estas medias fue estadísticamente significativa. t =
2,7, p <0,05, a dos colas.

Cálculo con SPSS de las diferencias de muestras independientes


Al seguir los mismos parámetros, el cálculo de las diferencias entre muestras independientes se
hace similar al utilizado para muestras relacionadas, pero, a diferencia del anterior, se requiere

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 13


que exista una variable que diferencie los grupos. Esta debe ser de orden categórica (nominal de
preferencia). En muchos casos resulta ser una variable como género. En nuestro ejemplo
anterior simplemente se habló de grupo 1 y 2, sin detallar la característica que los diferenciaba.
Así, tenemos una base con las siguientes categorías:

Fuente. Elaboración propia

Al poseer una variable categórica se requiere estipular los valores de las etiquetas, por ello
vamos a la casilla correspondiente a [Valores] en la fila de la variable nominal (GRUPO) (deben
Fuente. Elaboración propia
aparecer unos puntos suspensivos). Esto nos lleva al siguiente cuadro de diálogo:

Fuente. Elaboración propia

En él asignamos los valores a cada una de las etiquetas, dependiendo de las características de
las variables y de las categorías asignadas a ella. Para nuestro ejemplo asignamos el valor
numérico 1 como etiqueta de la categoría Grupo 1, y el valor numérico 2 como etiqueta de la
categoría Grupo 2. Vamos añadiendo y aceptamos.

14 [ POLITÉCNICO GRANCOLOMBIANO]
Fuente. Elaboración propia

Nuestra vista de datos debe diferenciar los valores de los grupos y los valores de los puntajes de
ansiedad, como sigue:

Fuente. Elaboración propia

Note que, a diferencia de las columnas y valores utilizados para las muestras relacionadas, en
este caso los valores de la variable cuantitativa están en una misma fila. Técnicamente es
posible hacer este mismo procedimiento para muestras relacionadas, colocando, en la variable
grupo, los momentos de tratamiento 1 y 2; pero los resúmenes estarían dados, no para distintas
variables, sino para grupos de casos.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 15


El comando a seguir para el análisis de la diferencia de muestras independientes es el siguiente:
Analizar/Comparar medias/Prueba T para muestras independientes…

Fuente. Elaboración propia

16 [ POLITÉCNICO GRANCOLOMBIANO]
En este caso el programa nos abre un cuadro de diálogo como el que sigue:

Fuente. Elaboración propia

Primero se define la variable de agrupación. Esta debe ser una variable categórica que informe
de los grupos; por tal razón, para este ejemplo, seleccionamos la variable (GRUPO) como
variable de agrupación. El programa, automáticamente, solicita que se [Definan los grupos]

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 17


Se debe usar los valores especificados con anterioridad en los valores de la variable
seleccionada como variable de agrupación que, para nuestro caso, corresponden a los valores 1
y 2 asignados como etiquetas de las categorías Grupo 1 y Grupo 2, y se procede a [Continuar].

Fuente. Elaboración propia

Luego de esto se asigna la variable o variables a contrastar que, para nuestro caso, es el puntaje
de ansiedad, y se procede a [Aceptar]. SPSS debe arrojarnos un cuadro de resultados como el
que sigue:

Aquí es importante notar que la prueba t para muestras independientes arroja un valor de una
prueba adicional que no es otra que la prueba de Levene para la igualdad de varianzas. Esta,
como cualquier prueba inferencial, es una prueba de hipótesis donde la hipótesis nula supone
que se asumen varianzas iguales. Para este caso, si el valor de p de la prueba de Levene es
superior (>) a 0,05, se acepta la hipótesis nula, asumiéndose las varianzas como iguales, y

18 [ POLITÉCNICO GRANCOLOMBIANO]
seleccionando la primera fila de datos. Así, el valor seleccionado para la prueba t de diferencia
de medias es el que aparece abajo señalado en rojo (sig = 0,03)

Note que el valor de t es el mismo al hallado de forma manual. Al igual, la significancia, al ser
menor (<) a 0,05 señala que existen diferencias significativas entre los dos grupos. El informe
del resultado queda idéntico al expresado arriba.

Graficación de las diferencias entre dos muestras independientes


El procedimiento para graficar dos muestras independientes es similar al utilizado para
muestras relacionadas:

Comando: Gráficos/Cuadro de diálogo antiguos/Diagramas de cajas…

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 19


Pero, a diferencia del anterior, se selecciona la opción Resúmenes para grupos de casos

Fuente. Elaboración propia

Luego, se selecciona el eje de [categorías] que va a estar definido por la variable de agrupación y,
posteriormente, la variable a contrastar, la cual siempre será nuestra variable numérica.
Dándonos como resultado un cuadro como el siguiente:

Fuente. Elaboración propia

20 [ POLITÉCNICO GRANCOLOMBIANO]
Luego de ello procedemos a [Aceptar]. SPSS debe arrojarnos un cuadro de resultados y una
imagen como la que sigue:

El gráfico hace evidente la diferencia entre los dos grupos en cuanto a los valores medidos en la
prueba de ansiedad.

Hechas estas explicaciones procedemos a ver otro caso común en los análisis cuantitativos, el
cual tiene que ver con la comparación de más de dos grupos.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 21


ANOVA: PRUEBA DE DIFERENCIA ENTRE MÁS DE DOS CONDICIONES

Hasta el momento hemos visto la comparación de dos muestras, bien de los mismos individuos
o de individuos o grupos distintos. Sin embargo, es común encontrarse con la necesidad de
comparar más de dos muestras. En esto casos al estudiante le será útil aprender sobre el
análisis de varianza o comparaciones a través de la prueba de diferencia entre más de dos
condiciones ANOVA.

En esta unidad hablaremos del análisis de varianza unidireccional o ANOVA a un factor. Al ser
una prueba paramétrica exige los requisitos siempre mencionados para este tipo de pruebas: 1.
Normalidad, 2. Homogeneidad de la varianza y 3. Medidas escalares.

La hipótesis nula en el ANOVA supone que las poblaciones de las que se han obtenido de
manera aleatoria las muestras no difieren entre sí o tienen medias iguales. Para este caso H0 : µ1
= µ2 = µ 3

El análisis de varianza (ANOVA) compara las varianzas entre los grupos con la varianza
intragrupos. Aquí es importante señalar que se trata de evaluar qué tanto varían los valores al
interior de una categoría de una variable y comparar estos valores con las variaciones promedio
de otras categorías de la misma variable. De esta manera puede resultar una baja variación
intragupo y una alta variación entre grupos. Aunque también es de suponer que se pueda hallar
una alta variación al interior de los grupos y poca diferencia entre ellos.

El Concepto de error en el ANOVA

El análisis de varianza parte del supuesto estadístico de que los grupos no tendrán grandes
variaciones a su interior (es decir, los grupos deben mostrar una baja variabilidad intragrupo).
Cuando esto no sucede, es decir, cuando hay una alta variabilidad intragrupo, se habla de error
como una variación indeseable que oscurece el efecto de la variable independiente (Coolican,
2005, p.329). La varianza calculada de este error se conoce como varianza de error y llega a ser
importante para entender los análisis de varianzas.

Coeficiente F
El coeficiente F es el resultado de comparar la varianza entre grupos con la varianza intra grupos.
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑛𝑡𝑟𝑒 𝑔𝑟𝑢𝑝𝑜𝑠
𝐹=
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑖𝑛𝑡𝑟𝑎 𝑔𝑟𝑢𝑝𝑜𝑠

22 [ POLITÉCNICO GRANCOLOMBIANO]
A partir de la hipótesis nula se supone que, si las medias se obtienen de manera aleatoria de la
misma población, el estimado de la varianza poblacional entre grupos debería ser igual al
estimado de la varianza intragurpos, con lo cual el valor de F debería ser idéntico a 1. A partir de
la ecuación de la varianza

∑(𝑥𝑖 − ∆𝑥)2
2
𝑆 =
𝑛− 1

Tenemos las sumatorias de las desviaciones cuadradas o Sc = ∑(𝑥𝑖 − ∆𝑥)2


Ahora bien, también debemos saber que Sc total = Sc entre grupos + Sc intra grupos (o Sc
error). Con esta información partimos hacia el cálculo manual del ANOVA.

Cálculo manual del valor del ANOVA


Vamos a calcular el valor de F con un ejemplo relativamente sencillo. Utilizaremos el mostrado
por Coolican (2005, p.331), para ejemplificarlo aún más. Para calcular el valor de F se tiene en
cuanta la información antes suministrada.

Puntaje a D D2 ∆xa ∆xa - ∆xg (∆xa - ∆xg)2 xi - ∆xa (xi - ∆xa)2


10 3,5 12,25 9 2,5 6,25 1 1
9 2,5 6,25 9 2,5 6,25 0 0
6 -0,5 0,25 9 2,5 6,25 -3 9
11 4,5 20,25 9 2,5 6,25 2 4
∆xa = 9 ∑ = 14
Puntaje b
3 -3,5 12,25 6,75 0,25 0,0625 -3,75 14,0625
5 -1,5 2,25 6,75 0,25 0,0625 -1,75 3,0625
10 3,5 12,25 6,75 0,25 0,0625 3,25 10,5625
9 2,5 6,25 6,75 0,25 0,0625 2,25 5,0625
∆xb = 6,75 ∑ = 32,75
Puntaje c
4 -2,5 6,25 3,75 -2,75 7,5625 0,25 0,0625
2 -4,5 20,25 3,75 2,75 7,5625 -1,75 3,0625
5 -1,5 2,25 3,75 2,75 7,5625 1,25 1,5625
4 -2,5 6,25 3,75 2,75 7,5625 0,25 0,0625
∆xc = 3,75 ∑ = 4,75
∆xg = 6,5
Sc Sc entre Sc intra
Total = grupos = 55,5 grupos =
107 51,5

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 23


Siendo ∆ el promedio
∆xg = el promedio global calculado a partir de las medias grupales
D como la desviación de la puntuación respecto a la media global
∆xa - ∆xg es una medida de la variación entre grupos
xi - ∆xa es una medida de la variación intra grupos
Sc Total se calcula sumando todos los valores de D2
Sc entre grupos se calcula sumando todos los valores de (∆xa - ∆xg)2
Sc intra grupos se calcula sumando todos los valores de (xi - ∆xa)2

Luego, se calcula la varianza de todos los componentes (conocida también como media de la
suma de cuadrados MS), que es simplemente la división de la Sc por los grados de libertad. Hay
que advertir que los grados de libertad varían entre grupos e intra grupos. Los grados de
libertad totales dependen del n total calculado entre todos los grupos que, para este caso será
de 12.
gl Total = n – 1 = 12 – 1 = 11.

Entre grupos los grados de libertad depende de las cantidades de condiciones o de grupos (k)
gl Entre = k – 1 = 3 – 1 = 2.
Intra grupos los grados de libertad se calculan de la siguiente forma
gl Intra = gl Total – gl Entre = 11 – 2 = 9.
Así, aplicando esta pequeña ecuación podemos calcular las medias de las sumas de los
cuadrados.
𝑆𝑐
𝑀𝑆 =
𝑔𝑙
𝑆𝑐(𝑒𝑛𝑡𝑟𝑒)
𝑀𝑆𝑒𝑛𝑡𝑟𝑒 =
𝑔𝑙(𝑒𝑛𝑡𝑟𝑒)
55,5
𝑀𝑆𝑒𝑛𝑡𝑟𝑒 =
2
𝑴𝑺𝒆𝒏𝒕𝒓𝒆 = 𝟐𝟕, 𝟕𝟓
𝑆𝑐(𝑖𝑛𝑡𝑟𝑎)
𝑀𝑆𝑖𝑛𝑡𝑟𝑎 =
𝑔𝑙(𝑖𝑛𝑡𝑟𝑎)
51,5
𝑀𝑆𝑖𝑛𝑡𝑟𝑎 =
9
𝑴𝑺𝒊𝒏𝒕𝒓𝒂 = 𝟓, 𝟕𝟐
El valor de F será igual a
𝑀𝑠 𝑒𝑛𝑡𝑟𝑒
𝐹=
𝑀𝑠 𝑖𝑛𝑡𝑟𝑎
27,75
𝐹=
5,72
𝐹 = 4,85

24 [ POLITÉCNICO GRANCOLOMBIANO]
Este valor de F se compara con la tabla para valores críticos de F con 2 gl entre (numerador) y 9
gl intra (denominador). El valor crítico en la tabla es de 4,26. El valor calculado supera este valor
crítico, con lo cual se sabe que existen diferencias significativas entre los grupos.

Informe de los resultados del ANOVA


El informe del ANOVA queda como sigue:

El puntaje promedio para las técnicas a, b y c fueron,


respectivamente, 9, 6.75 y 3.75. La diferencia entre
estas medias fue estadísticamente significativa. F = 4,85,
p <0,05.

Cálculo con SPSS de las diferencias de muestras independientes


Al tratarse una prueba de comparación de medias, el análisis de varianza unidireccional sigue
pasos similares a los utilizados para la prueba t. Mostremos esto con un ejemplo. Vamos a
introducir los datos del ejercicio anterior en nuestra base de datos, de forma similar a como lo
hicimos con la prueba t para muestras independientes, sólo que en esta ocasión serán tres
grupos y no dos los que se tengan en cuenta. Nuestra base, hechas estas modificaciones, queda
como sigue:

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 25


Procedemos con los siguientes comandos: Analizar/Comparar medias/ANOVA a un factor…

Fuente. Elaboración propia

Nos debe aparecer un cuadro de diálogo como el siguiente:

Fuente. Elaboración propia

26 [ POLITÉCNICO GRANCOLOMBIANO]
Allí seleccionamos como factor la variable categórica o aquella que diferencie los grupos (para
este caso GRUPO). Luego, seleccionamos, en [Lista de dependientes] la variable escalar
[PUNTAJE] y le damos a [Aceptar]. SPSS debe arrojarnos una tabla de resultados como la
siguiente:
ANOVA
Puntaje
Suma de cuadrados gl Media cuadrática F Sig.
Inter-grupos 55,500 2 27,750 4,850 ,037
Intra-grupos 51,500 9 5,722
Total 107,000 11

Allí se pueden ver los valores de los gl inter grupos e intra grupos, al igual que el gl total.
También podemos encontrar el valor de F, el cual es idéntico al encontrado de manera manual.
El valor de la significancia (sig. = 0,037), al ser inferior (<) a 0,05, indica que existen diferencias
significativas entre los grupos. El informe del análisis es el mismo que aparece arriba.

El procedimiento para realizar el gráfico del ANOVA sigue los mismos parámetros y comandos
que el utilizado para la prueba t para muestras independientes, sólo que en lugar de dos grupos
aparecerán tres. Por ello se omite en esta ocasión.

Hasta el momento hemos estado trabajando sobre pruebas que cumplen tres condiciones
importantes: 1. Normalidad, 2. Homogeneidad de varianzas, y 3. Tipo de medida escalar. En la
siguiente unidad vamos a conocer las pruebas que se aplican en los mismos casos de
comparación cuando no se cumple alguno de los criterios mencionados. Estas pruebas recibirán
el nombre de pruebas no paramétricas.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 27


Análisis Inferenciales:
Las Pruebas no Paramétricas
SEMANA 7

[ MÉTODOS CUANTITATIVOS DE PSICOLOGÍA ]


MÉTODO CUANTITATIVO

NÚCLEO TEMÁTICO CUATRO. ANÁLISIS INFERENCIALES: LAS PRUEBAS NO PARAMÉTRICAS ... 2


Objetivos de la semana 2
Contenido de la semana 2
PRUEBAS NO PARAMÉTRICAS 2
PRUEBAS NO PARAMÉTRICAS DE CORRELACIÓN: RHO DE SPEARMAN 3
Cálculo manual del coeficiente de correlación de Spearman 3
Cálculo de la correlación de Spearman con SPSS 4
Informe de los resultados de la prueba de correlación de Spearman 7
TABLAS CRUZADAS Y CHI CUADRADA 8
Análisis de chi cuadrada de una fila 8
Chi cuadrada de 2 x 2 9
Cálculo de la chi cuadrada con SPSS 10
Informe de los resultados de la prueba de chi cuadrada 16

NÚCLEO TEMÁTICO CUATRO. ANÁLISIS INFERENCIALES: LAS PRUEBAS NO PARAMÉTRICAS


Objetivos de la semana
• Aprender las formas de uso de la estadística inferencial
• Contenido de la semana
• Correlación de Spearman
• Tablas cruzadas, Tablas de contingencia y Chi cuadrado

PRUEBAS NO PARAMÉTRICAS
Es posible que el estudiante al incluir datos en su base se haya encontrado con valores
categóricos, tanto ordinales como nominales, y se haya preguntado cómo se puede comparar
este tipo de valores. Pues bien, los datos nominales y ordinales también son susceptibles de
comparación y de búsqueda de relación a través de las denominadas pruebas no paramétricas.
Estas, como veremos más adelante, son un poco más fáciles de calcular manualmente que las
pruebas paramétricas.

Las pruebas no paramétricas se utilizan cuando no se cumple los criterios siempre mencionados
para las pruebas paramétricas: normalidad, homogeneidad y tipo de medida. La primera prueba
no paramétrica a estudiar es la prueba de correlación rho de Spearman. Esta sigue muchos de
los parámetros lógicos de la prueba de correlación de Pearson.

2 [ POLITÉCNICO GRANCOLOMBIANO]
PRUEBAS NO PARAMÉTRICAS DE CORRELACIÓN: RHO DE SPEARMAN

En la semana 5, vimos cómo calcular correlaciones cuando los valores seguían una serie de
condiciones de las pruebas paramétricas. Como se mencionaba anteriormente, es probable que
los datos puedan no resultar válidos para las pruebas escalares. La rho de Spearman es una
medida no paramétrica de correlación que funciona con datos a nivel ordinal. La rho de
Spearman, a diferencia de la prueba de correlación de Pearson, utiliza los rangos de los valores
en cuanto a las dos variables pareadas, más que la puntuación en sí misma. En este sentido, la
rho de Spearman compara la posición de cada persona en cuanto a una variable.

Coolican (2005, p.303) señala que el fundamento del coeficiente de correlación de Spearman es
que las diferencias entre los rangos serán pequeñas cuando exista una elevada correlación
positiva. Esto quiere decir que la diferencia entre el par de rangos de cada persona debería ser
bajo, o incluso de cero, en tanto exista una fuerte correlación.

La fórmula de la correlación de Spearman es la siguiente:

6 ∑ 𝑑2
𝑟ℎ𝑜 = 1 −
𝑛(𝑛2 − 1)

A continuación veremos cómo calcularla manualmente.

Cálculo manual del coeficiente de correlación de Spearman


Tomemos el siguiente ejemplo en el cual existen dos rangos asignados a los puntajes
en dos pruebas distintas. Aquí lo único importante es calcular la diferencia entre estos rangos
(d).
Rango en la prueba Rango en la prueba Diferencia entre d2
1 2 rango (d)
4 5 -1 1
5 2 3 9
7 3 4 16
1 4 -3 9
3 6 -3 9
2 1 1 1
6 7 -1 1

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 3


En este caso, la ∑d2 = 46
Siguiendo la anterior fórmula:

6 𝑥 46
𝑟ℎ𝑜 = 1 −
7(72 − 1)
276
𝑟ℎ𝑜 = 1 −
336
𝑟ℎ𝑜 = 0,179

Ahora bien, se debe comparar este valor con los valores críticos para la rho de Spearman en la
tabla (anexa a este curso). Recuerde que el valor debe ser igual o mayor que el de la tabla para
que tenga significancia. Entonces para n = 7 datos, con un alfa de 0,05 y una prueba a dos colas,
el valor crítico de la tabla es de 0,786. Este valor está muy por encima del por nosotros
conseguido, por tanto no se puede afirmas la significancia de la prueba de correlación.

Cálculo de la correlación de Spearman con SPSS

Ahora veremos cómo calcular el coeficiente de correlación de Spearman utilizando nuestro


paquete de análisis SPSS. Iniciamos este proceso creando nuestra base con los datos del
ejemplo anterior. En nuestra vista de variables debe quedar algo como esto:

Fuente. Elaboración propia

Es importante notar que el nivel de medida para este caso debe ser ordinal, que es lo que
caracteriza al análisis con el coeficiente de correlación de Spearman. La base debe quedarnos,
en sus valores, como sigue:

4 [ POLITÉCNICO GRANCOLOMBIANO]
Fuente. Elaboración propia

El procedimiento es muy similar al utilizado para el cálculo del coeficiente de correlación de


Pearson. Comandos: Analizar/Correlaciones/Bivariadas…

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 5


Luego de ello, se seleccionan las dos variables a comparar y se señala, como coeficiente de
correlación, el coeficiente de Spearman. Es importante que se deseleccione el coeficiente de
Pearson que aparece, por defecto, seleccionado.

Fuente. Elaboración propia

En esta ocasión no damos a opciones. Simplemente vamos a la pestaña de [Aceptar]. El


resultado debe darnos una tabla como la que sigue:

6 [ POLITÉCNICO GRANCOLOMBIANO]
Note que el cuadro debe decir Correlaciones no paramétrica y, al interior del mismo, Rho de
Spearman. También note que el valor de la correlación es el mismo al hallado de manera
manual.

Informe de los resultados de la prueba de correlación de Spearman


De forma similar a lo señalado para el coeficiente de correlación de Pearson, este
coeficiente señala tanto la fuerza de la relación como la significancia.

Para ello hay que atender, de nuevo, a dos cosas. Lo señalado en rojo informa el valor de la
fuerza de la correlación. Recordemos que esta debe aproximarse a uno para decir que hay una
correlación. El mínimo exigido en estos casos es de 0,66. Aquí el valor de la fuerza de la relación
es inferior al valor antes señalado (0,66), por lo tanto sabemos de antemano que no hay
correlación. Lo segundo, señalado en amarillo, informa la significancia. Recordemos que el valor
esperado para decir que una prueba es o no significativa (y por tanto para rechazar la hipótesis
nula) es menor a 0,05 o al 5%. En este caso el valor señalado en amarillo está muy por encima
del 0,05, por lo cual sabemos que esta prueba no es significativa. A partir de lo anterior
podemos ejemplificar el reporte del resultado del cálculo del coeficiente de correlación de
Spearman para la relación de los rangos de dos variables. Recuerde que en este caso no se
encontró correlación y esa no correlación resultó ser no significativa:

Se encontró que la no correlación de Spearman


entre las puntuaciones de la prueba P1 y la prueba
P2 no fue significativa con rho=0,179 y p>0,05

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 7


TABLAS CRUZADAS Y CHI CUADRADA

Hemos visto hasta el momento comparaciones de variables escalares y ordinales. Sin embargo,
es probable que el estudiante se encuentre con la necesidad de comparar datos nominales. Las
tablas de frecuencias ya fueron presentadas con anterioridad en la unidad correspondiente al
análisis descriptivo. Sin embargo, es posible comparar las frecuencias de las categorías en tablas
que comparan los valores de distintas categorías.

Por ejemplo, se podría postular una asociación entre el tiempo de deserción en una carrera y la
pertenencia a un tipo de universidad, sea esta pública o privada, a través de la comparación del
número de estudiantes que desertan de universidades públicas y privadas en distintos
momentos de la carrera. Podemos ejemplificar esto a través de la siguiente tabla de frecuencia,
que resume los valores de las frecuencias para cada comparación.

Deserción Temprana (Primer Deserción tardía (mitad de carrera a


semestre a mitad de carrera) final de carrera)
Pública 100 50
Privada 80 30

Como se observa, este tipo de tablas es muy común en las investigaciones psicológicas. Así, la
chi cuadrada es una herramienta útil para especificar la asociación entre variables que tienen,
ambas, varias categorías, generalmente de orden nominal.

Análisis de chi cuadrada de una fila

La chi cuadrada es la prueba a utilizar cuando se busca la asociación donde las variables
implicadas son categóricas. El diseño utilizado será entre grupos, de modo que cada persona o
caso contado puede ocurrir sólo en una de las casillas de la tabla de frecuencia. La hipótesis nula
en la chi cuadrada diría que la población siempre se distribuye de forma uniforme entre los
distintos casos.

La frecuencia predicha según la hipótesis nula se conoce como frecuencia esperada. Es lo que
uno esperaría que ocurriera con las frecuencias totales si la H0 fuese cierta. Las frecuencias
obtenidas realmente se conocen como frecuencias observadas. En ese sentido la chi-cuadrada

8 [ POLITÉCNICO GRANCOLOMBIANO]
basa su análisis en la comparación de las frecuencias esperadas contra las frecuencias
observadas. La fórmula para calcularla es la siguiente:

2
(𝑜 − 𝑒)2
𝑋 = ∑
𝑒
Chi cuadrada de 2 x 2

Cuando trabajamos con una tabla de contingencia con dos filas y dos columnas, como en el
primer ejemplo, es relativamente facil descubrir si existe una asociación entre el pertenecer a
una universidad pública y privada y el tiempo de deserción.

Deserción Temprana (Primer Deserción tardía (mitad Total


semestre a mitad de carrera) de carrera a final de
carrera)
Pública 100 (a) 50 (b) 150
Privada 80 (c) 30 (d) 110
Total 180 80 260

Para ello vamos a utilizar el cálculo de la chi cuadrada siguiendo la ecuación de las frecuencias
esperadas:
𝐹𝑥𝐶
𝑒=
𝑇

Donde F es el total de la fila correspondiente y C el total de la columna correspondiente. Siendo


T el total obtenido entre filas y columnas.

Primero, se determina las frecuencias esperadas para cada casilla:

e(a) : 150 x 180 / 260 : 103,84


e(b) : 150 x 80 / 260 : 46,15
e(c) : 110 x 180 / 260 : 76,15
e(d) : 110 x 80 / 260 : 33,84

Continuando con la ecuación


(𝑜 − 𝑒)2
𝑋2 = ∑
𝑒

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 9


Se calcula (o – e) para cada casilla, y se eleva este valor al cuadrado:
(a) (100 – 103,84)2 : 14,74
(b) (50 – 46,15)2 : 14,82
(c) (80 – 76,15)2 : 14,82
(d) (30 – 33,84)2 : 14,74
Ahora, se divide cada uno de los valores en las casillas por el valor esperado para la casilla:
(a) 14,74/103,84 : 0,14
(b) 14,82/46,15 : 0.32
(c) 14,82/76,15 : 0,19
(d) 14,74/33,84 : 0,43
Por último se suman estos valores, lo cual nos da el valor total de la chi cuadrada:
x2 = 1,08
Luego de esto, se calculan los grados de libertad siguiendo la ecuación
gl = (F – 1) (C – 1) = (2 – 1)(2 – 1) = 1
Utilizando la tabla para valores críticos de x2, se determina el valor crítico esperado para 1 gl, y
un alfa de 0,05 en una prueba a dos colas. El valor crítico según la tabla es de 3,84. Este valor es
superior al por nosotros encontrado; por lo tanto no se puede rechazar la hipótesis nula, de tal
manera que el resultado aquí encontrado no es significativo.

Cálculo de la chi cuadrada con SPSS

Para ejemplificar el uso del SPSS para el cálculo de la chi cuadrada continuaremos con el
ejercicio anterior. Pero, a diferencia de las formas hasta ahora utilizadas para la elaboración de
la base y debido a que los datos del ejemplo se encuentras agrupados, vamos a utilizar un atajo
que se conoce como ponderación de casos. Para ello se debe ingresar una nueva variable que
tenga por título [TOTAL]. Además, se deben seguir los pasos para la asignación de valores de
etiqueta vistos anteriormente durante la prueba t para muestras independientes.

10 [ POLITÉCNICO GRANCOLOMBIANO]
Fuente. Elaboración propia

Al final, debe quedarnos una imagen como la siguiente:

Fuente. Elaboración propia

En la vista de datos, los valores se designan por los totales de los casos. Así, aparecen valores
para cada opción en cada una de las combinaciones de la categorías, quedando una base como
la que sigue:

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 11


Luego de esto, se procede a ponderar los casos. Para ello debe seguir la siguiente línea de
comandos: Datos/Ponderar casos…

Fuente. Elaboración propia

Luego de seleccionar esta opción, SPSS arroja el siguiente cuadro de diálogo. En el cual se
selecciona la alternativa [Ponderar casos mediante] y se designa la variable [Total]. Aceptándose
la ponderación.

Fuente. Elaboración propia

12 [ POLITÉCNICO GRANCOLOMBIANO]
Teniendo esta base ya ponderada procedemos con los comandos para la chi cuadrada:
Analizar/Estadísticos descriptivos/Tablas de contingencia…

Fuente. Elaboración propia

Opción que nos llevará al siguiente cuadro de diálogo:

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 13


Se eligen las variables para las filas y las columnas. Es recomendable señalar la opción de
[mostrar los gráficos de barras agrupadas], y en [estadísticos] se selecciona la opción chi-
cuadrado, y se [Continúa] con el proceso.

Fuente. Elaboración propia

Es igualmente recomendable, siguiendo la idea presentada anteriormente en el cálculo manual


del estadístico, señalar, en la opción de [Casillas…] el recuento esperado.

Fuente. Elaboración propia

Se procede a [Continuar] y a [Aceptar]. El resultado del análisis de SPSS debe arrojarnos las
siguientes tablas:

14 [ POLITÉCNICO GRANCOLOMBIANO]
En este caso, el valor de la x2 es muy similar al calculado por nosotros de manera manual.

Este mismo procedimiento permite que el programa nos muestre el gráfico correspondiente al
análisis, sin necesidad de pasos adicionales. Como verá, el gráfico de barras agrupadas es una
forma de estimar visualmente, una posible diferencia entre los grupos seleccionados. En el
ejemplo trabajado no se notan mayores diferencias entre los tipos de universidades y el tiempo
de deserción.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 15


Informe de los resultados de la prueba de chi cuadrada

Siguiendo el ejemplo anteriormente descrito, procedemos a realizar el informe de resultados


del análisis de la chi cuadrada:

El análisis de x2 de las diferencias de las frecuencias


entre universidades públicas y privadas, mostró que
entre los tiempos de deserción temprano y tardío,
dichas diferencias no fueron significativas, con
x2=1,094 y p>0,05

La próxima semana continuaremos con las versiones no paramétricas de las pruebas de


diferencia de grupos.

16 [ POLITÉCNICO GRANCOLOMBIANO]
Análisis Inferenciales:
Las Pruebas no Paramétricas
SEMANA 8

[ MÉTODOS CUANTITATIVOS DE PSICOLOGÍA ]


MÉTODO CUANTITATIVO

NÚCLEO TEMÁTICO CUATRO. ANÁLISIS INFERENCIALES: LAS PRUEBAS NO PARAMÉTRICAS .. 2


Objetivos de la semana 2
Contenido de la semana 2
1. PRUEBAS NO PARAMÉTRICAS DE DIFERENCIAS 2
1.1 PRUEBA T DE WILCOXON 2
1.1.1 Cálculo manual de la T de Wilcoxon 3
1.1.2 Informe de los resultados de la prueba de rangos con signos de Wilcoxon 4
1.2 PRUEBA U DE MANN-WHITNEY 7
1.2.1 Cálculo manual de la U de Mann-Whitney 7
1.2.2 Informe de los resultados de la prueba U de Mann-Whitney 8
1.2.3 Cálculo de la prueba U de Mann-Whitney con SPSS 8

NÚCLEO TEMÁTICO CUATRO. ANÁLISIS INFERENCIALES: LAS PRUEBAS NO PARAMÉTRICAS


Objetivos de la semana
- Aprender las formas de uso de la estadística inferencial no paramétrica
Contenido de la semana
- Pruebas de diferencia de rangos: U de Mann-Whitney y Wilcoxon

1. PRUEBAS NO PARAMÉTRICAS DE DIFERENCIAS


Es probable que se haya preguntado si existe la posibilidad de comparar dos grupos
cuyas medidas no sean escalares. Pues bien, existen formas muy similares a las pruebas t para
calcular estas diferencias con este tipo de medidas. Las podemos clasificar en dos tipos: T de
Wilcoxon para muestras relacionadas (también llamada prueba de rangos con signos de
Wilcoxon) y la U de Mann-Whitney para muestras independientes. A continuación veremos las
características y formas de medición de cada una de ellas.

1.1 PRUEBA T DE WILCOXON

Al ser una prueba para muestras relacionadas, la prueba T de Wilcoxon compara los resultados
en un momento de una persona contra los resultados en otro momento de esa misma persona.
Ahora bien, resalto resultados porque realmente esta prueba se basa en los rangos de las
diferencias entre estos puntajes, más que en el resultado en sí. La hipótesis nula para este caso
supone que las dos poblaciones de las que se extrajeron las puntuaciones son idénticas.

2
La prueba busca las diferencias entre dos puntajes medidos en dos momentos y asigna valores,
positivos o negativos, a estos puntajes. Luego selecciona de entre los grupos así conformados,
tanto con signos positivos como con signos negativos, los que menor aparición obtuvieron y
suma estos valores. La prueba no tiene en cuenta los valores de empate. Veamos a través de un
ejemplo esto que acabamos de mencionar.

1.1.1 Cálculo manual de la T de Wilcoxon

Para esta parte vamos a seguir el ejemplo planteado por Coolican (2005, p.247), que muestra la
calificación de 15 estudiantes en dos pruebas distintas:

Estudiante Calificación Calificación Diferencia Rango de


prueba 1 (A) prueba 2 (B) (B – A) diferencia
1 23 33 +10 12
2 14 22 +8 9.5
3 35 38 +3 3
4 26 30 +4 5
5 28 31 +3 3
6 19 17 -2 1
7 42 42 0
8 30 25 -5 6
9 26 34 +8 9.5
10 31 24 -7 8
11 18 21 +3 3
12 25 46 +21 14
13 23 29 +6 7
14 31 40 +9 11
15 30 41 +11 13

El valor del rango de diferencia informa de la posición que desde el puntaje de la diferencia se le
otorga a la persona del total de posibles posiciones. Es así que el menor valor (-2) del conjunto
de datos de diferencia (B – A) tendrá el valor de 1 como rango de diferencia (nótese que no se
toman datos con diferencia de 0) y el valor con la máxima diferencia (+21) tendrá el máximo
rango de diferencia (14). De forma similar a lo realizado con la rho de Spearman, la T de
Wilcoxon ordena los valores a partir de los signos en una jerarquía. Luego, selecciona de entre la
suma de las diferencias positivas y las sumas de las diferencias negativas, las más pequeñas. De

[ METODOS CUANTITATIVOS DE 3
PSICOLOGÍA ]
la tabla anterior, las suma de los rangos más pequeña corresponde a los valores de los signos
negativos (-2, -5 y -7), los valores de los rangos de diferencia correspondientes a estos valores
son: 1, 6 y 8. Así, para calcular la T, basta simplemente con sumar estos valores.

T = 1 + 6 + 8 = 15.

Luego, como en los demás procedimientos manuales, se consulta la tabla de valores críticos
correspondiente para conocer el valor crítico necesario cuando n = 14, alfa es 0,05 y la prueba
es a dos colas. Para este caso, según la tabla, el valor crítico esperado es de 21. A diferencia de
otras ocasiones, el valor de t calculado debe ser equivalente o menor al valor de t crítico para
decir que la diferencia es significativa. En este ejemplo el valor calculado de t es menor, por lo
que se puede rechazar la H0.

1.1.2 Informe de los resultados de la prueba de rangos con signos de Wilcoxon

El informe de la prueba de rangos con signos de Wilcoxon señala los valores de los rangos
encada dirección de los signos. Así, siguiendo el ejemplo anterior, y acorde a lo señalado por
Coolican (2005, p. 248), el informe del análisis quedaría de la siguiente forma:

1.1.3 Cálculo de la T de Wilcoxon con SPSS

Uno de los estudiantes no manifestó preferencia pos ninguno de los


métodos utilizados y este resultado se descartó del análisis. A los 14
estudiantes restantes se les ordenó por rango en función del grado de
preferencia que manifestaron por un método de enseñanza en
comparación con el otro. Se empleó una T de Wilcoxon para evaluar estas
diferencias. Se manifestó una preferencia significativa por el método 2. T
= 15, p<0,05.

Utilizaremos el ejemplo anterior y comenzamos este análisis de manera similar a como lo


hicimos con la prueba t para muestras relacionadas, con la única diferencia que, en vez de
variables escalares, tendremos variables ordinales.

Fuente. Elaboración propia

4
Seleccionamos sólo los valores de la calificación.

Fuente. Elaboración propia

Y seguimos la siguiente secuencia de comando: Analizar/Pruebas no paramétricas/Cuadros de


diálogo antiguos/2 muestras relacionadas…

Fuente. Elaboración propia

[ METODOS CUANTITATIVOS DE 5
PSICOLOGÍA ]
Esta serie de comandos despliega un cuadro de diálogo como el que sigue, en donde debe estar
señalada la prueba deseada [Wilcoxon]

Fuente. Elaboración propia

Luego de esto se seleccionan las variables a contrastar y se procede a [Aceptar]. El resultado de


este procedimiento es una tabla como la que sigue:

6
La prueba, como se había calculado manualmente, es significativa y responde a los rangos
negativos. SPSS también señala el menor valor de la suma de rangos (15), siendo este el valor de
T. El informe del análisis se realiza de la forma descrita arriba.

1.2 PRUEBA U DE MANN-WHITNEY

La prueba de Mann-Whitney, al igual que la de Wicoxon, se basan en el orden del rango; sin
embargo, en la prueba de Mann-Whitney no es necesario una calificación que informe de este
rango. En estos casos lo que se hace es averiguar, por cada persona en un grupo, cuántas
personas en el otro grupo superan la puntuación de esa persona. Según Coolican (2005, p.249)
esto se logra de la siguiente manera:

1. Cada vez que se supera una puntuación por uno en el otro grupo se concede un punto.
2. Cada vez que una puntuación sea igual a una puntuación en el otro grupo se otorga ½
punto.
3.
Con esta información es relativamente sencillo calcular el valor de la U de Mann-Whitney para
un conjunto de datos. La hipótesis nula en la prueba U de Mann-Whitney es que las poblaciones
de las que se han elegido de manera aleatoria las dos muestras son idénticas. Veamos esto con
el ejemplo señalado por Coolican (2005, p. 249).

1.2.1 Cálculo manual de la U de Mann-Whitney

Sigamos el ejemplo planteado por este mismo autor (Coolican, 2005, p. 249).
Empleo de tiempo completo Ningún empleo fuera de casa
Puntuación Puntos Puntuación Puntos
17 9 19 6
32 7 63 0
39 6.5 78 0
27 8 29 4
58 6 39 1.5
25 8 59 0
31 7 77 0
81 0
68 0
51.5 11.5

[ METODOS CUANTITATIVOS DE 7
PSICOLOGÍA ]
Este tipo de pruebas permiten diferenciar entre los casos de cada una de las variables a
contrastar. U será igual al menor de los dos valores totales de la suma de los puntos. Para este
caso, el valor de U sería igual a 11,5. Ahora bien, el paso siguiente es contrastar este valor con
valor crítico el arrojado por la tabla correspondiente. El valor crítico según la tabla para una
prueba a dos colas y un valor de alfa de 0,05 y con n1 = 7 y n2 = 9 es 12. Al ser el valor
encontrado menor que el valor crítico se supone, al igual que con la prueba T de Wilcoxon, que
la diferencia entre estos valores es significativa, rechazándose la H0.

1.2.2 Informe de los resultados de la prueba U de Mann-Whitney

Siendo este el resultado el informe del análisis de la prueba U de Mann-Whitney queda como
sigue:

A cada una de las puntuaciones de estereotipia de los niños se les


concedieron puntos cuando rebasaron o igualaron cada puntuación del
otro grupo. El total de puntos más bajos s tomó como valor U de Mann-
Whitney para n1=7 y n2=9. Los resultados indicaron puntuaciones de
estereotipia más bajas en el caso de los hijos de madres empleadas de
tiempo completo que en el de los otros niños. Esta diferencia fue
significativa. U = 11,5 y p<0,05 con 51,5 puntos para el rango de las
madres empleadas y 11,5 puntos para el grupo de las madres
desempleadas (Coolican, 2005, p.250)

1.2.3 Cálculo de la prueba U de Mann-Whitney con SPSS


Utilizaremos como siempre la base del ejemplo anterior. Al igual que la prueba t para muestras
independientes, se incluye una variable que permita diferenciar los grupos. A esta variable la
llamaremos [Empleo]. Y, de igual forma a lo realizado en la prueba t para muestras
independientes, se designan los valores de etiqueta a las categorías de las variables: 1 para
tiempo completo, 2 para desempleada. La vista de variables quedaría como sigue:

8
Los valores de las variables quedan como sigue:

Fuente. Elaboración propia

Definida la base, seguimos la serie de comandos: Analizar/Pruebas no paramétricas/Cuadros de


diálogo antiguos/2 muestras independientes…

[ METODOS CUANTITATIVOS DE 9
PSICOLOGÍA ]
Esta serie de comandos nos conducen al siguiente cuadro de diálogo.

Fuente. Elaboración propia

10
Aquí hay que verificar que el tipo de prueba seleccionada sea la U de Mann-Whitney.
Adicionalmente se define la variable de agrupación. Esta debe ser una variable categórica, la
cual definirá las categorías que conformaran los grupos. Para este ejemplo la variable es
[EMPLEO]. Recuerde que en este caso debe definir los grupos.

Fuente. Elaboración propia

Por último se selecciona la variable a contrastar. Para este caso será [PUNTUACION], y se
procede a [Aceptar]. Al finalizar este proceso SPSS arroja la siguiente tabla de resultados:

[ METODOS CUANTITATIVOS DE 11
PSICOLOGÍA ]
El programa arroja un valor de U de 11,5, el mismo hallado de la forma manual (señalado en
rojo) y un valor de significancia inferior a 0,05 (señalado en amarillo), con el cual se rechaza la
hipótesis nula. El informe del análisis de estos valores se realiza de la forma señalada arriba.

Con esta última parte terminamos la unidad y el módulo de métodos cuantitativos. Espero que
este haya sido de provecho para el estudiante interesado en profundizar en los análisis
numéricos de los datos producto, tanto de investigaciones como de la actividad clínica.

12

S-ar putea să vă placă și