Sunteți pe pagina 1din 20

Análisis Descriptivos y uso

SEMA
Herramientas de Análisisde
NA 4

[ MÉTODOS CUANTITATIVOS
DE PSICOLOGÍA ]
MÉTODO CUANTITATIVO

ÍNDICE

NÚCLEO TEMÁTICO 2. ANÁLISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANÁLISIS ........ 2


Objetivos 2
Contenido 2
ANÁLISIS DESCRIPTIVOS 2
Medidas de tendencia central 3
Medidas de dispersión 3
Pasos para calcular medidas de tendencia central y dispersión en SPSS 5
Frecuencias y distribuciones 9
Graficación de los datos 11
Distribución normal 19

ANALISIS DESCRIPTIVOS Y USO DE HERRAMIENTAS DE ANÁLISIS

Objetivos
-Aprender a analizar descriptivamente los datos numéricos

Contenido
- Distribuciones de frecuencia
- Medidas de tendencia central
- Medidas de variabilidad.

ANÁLISIS DESCRIPTIVOS
La estadística resulta útil para los análisis psicológicos ya que nos permite tanto describir como
inferir a partir de un conjunto de información recopilada. Existen dos tipos de análisis
estadísticos: los descriptivos y los inferenciales. En esta ocasión nos centraremos en los análisis
descriptivos.

Los análisis descriptivos me permiten, como su nombre lo indica, describir un conjunto de


datos. En ese sentido, esta estadística está relacionada con el ordenamiento u organización de
los datos, ya sea a través del informe de porcentajes o, en mayor medida, de la tendencia de los
datos o de la dispersión de los mismos. Comenzaremos con las medidas de tendencia.

2
Medidas de tendencia central
Existen distintas medidas de tendencia. Para este módulo hablaremos de tres de ellas: la media,
la mediana y la moda.

La media, o promedio, o media aritmética, es la medida de proporción que se obtiene al sumar


un conjunto de datos y dividirlos por el número de datos. Es, en ese sentido, el punto
intermedio exacto de todos los valores combinados. Veamos esto con un ejemplo:

Si llego a tener este conjunto de datos:

2, 5, 7, 8, 3, 7,

La media se calculará sumando esos valores 2 + 5 + 7 +8 +3 +7 y dividiéndolos por el número de


datos (n = 6). El resultado en este caso es 5,33.

Así, la fórmula que identifica la media es:


∑𝑥
∆𝑥 =
𝑛
∆x : 5,33

La mediana, informa del valor central de un conjunto de datos. El paso para calcularla depende
de que los datos estén ordenados ascendentemente. Así, en el ejemplo anterior, tendríamos
que ordenar los datos de la siguiente manera:

2, 3, 5, 7, 7, 8.

En este ejemplo no hay un solo dato en la mitad sino dos, el 5 y el 7. Cuando esto sucede
(porque el número de datos es par) se toman estos datos y se calcula su promedio (5 + 7 y se
divide por 2), lo cual da un valor de 6, como dato intermedio entre 5 y 7.

M:6

La moda, es el valor que más se repite, o el dato que tiene una mayor frecuencia de aparición.
En el ejemplo anterior es bastante fácil ver que el dato que más se repite es 7, por tanto, esta
sería la moda para este ejercicio.

m: 7

Medidas de dispersión
Para el investigador no sólo es importante conocer hacia dónde tienden los datos sino también
qué tan dispersos se encuentran unos de otros. Dentro de los tipos de medida de dispersión
encontramos:

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 3


Rango. Se entiende el rango como la distancia entre los valores superior e inferior de un
conjunto de datos. El cálculo se consigue restándole al mayor de los datos el menor, y sumando
1. Así, en el ejemplo anterior, el Rango sería:

R: (8 – 2) + 1 : 5.

Desviación estándar. La mejor forma de entenderla es como un tipo de media. Es el promedio


de las distancia de separación de todos los valores respecto al valor medio de ellos. Su fórmula
es la siguiente:

∑(𝑥𝑖 − ∆𝑥)2
𝑆𝑥 = √
𝑛− 1

Varianza. Ésta es simplemente el cuadrado de la desviación estándar. Su cálculo se realizaría


con la fórmula anterior pero sin utilizar la raíz cuadrada.

Manualmente podemos calcular la desviación estándar y la varianza como sigue:

1. Calcular la media
2. Restar, a cada uno de los valores el valor de la media, para obtener la serie de
desviaciones
3. Calcular el cuadrado de cada resta
4. Sumar estas desviaciones
5. Dividir el resultado entre el número de datos menos 1
6. Calcular la raíz de éste valor.

Miremos estos pasos con el ejemplo anterior:

2, 3, 5, 7, 7, 8

1. Sabemos que la media es 5, 33


2. Restamos a cada dato la media
a. (2 – 5,33) : -3,33
b. (3 – 5,33) : -2,33
c. (5 – 5,33) : - 0,33
d. (7 – 5,33) : 1,67
e. (7 – 5,33) : 1,67
f. (8 – 5,33) : 2,67
3. Calculamos el cuadrado de cada uno de los valores
a. (-3,33)2 : 11,08
b. (-2,33)2 : 5,43

4
c. (-0.33)2 : 0,1
d. (1,67)2 : 2,78
e. (1,67)2 : 2,78
f. (2,67)2 : 7,12
4. Sumamos estos valores : 29,3
5. Dividimos este valor entre (6 – 1) :29,3/5 : 5,85
6. Calculamos la raíz de este valor : 2,42.

Este sería el valor de Sx

Para calcular la varianza simplemente elevamos este valor al cuadrado. S2: (2,42)2 :5,85

Pasos para calcular medidas de tendencia central y dispersión en SPSS


Vamos a seguir el mismo ejemplo utilizado anteriormente.

En nuestra base de SPSS vamos a insertar una variable que se llame ejemplo, desde la vista de
variables. Aquí debemos revisar que el tipo de medida aparezca como [Escalar].

Luego de ello vamos a ir a la vista de datos e incluiremos los valores utilizados en el ejercicio
anterior (2, 3, 5, 7, 7, 8). Debe quedarnos algo como esto:

Fuente. Archivo personal

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 5


Vamos a seguir la siguiente secuencia:

Comando :Analizar/Estadísticos descriptivos/Frecuencias

Fuente. Archivo personal

6
Debe aparecernos un cuadro de diálogo como el que sigue:

Fuente. Archivo personal

Pasamos la variable ejemplo al cuadro que dice [Variables], ya sea arrastrando EJEMPLO o
simplemente seleccionando la variable y oprimiendo la flecha que aparece en la parte central
del cuadro de diálogo.

Luego de esto damos a la opción que dice [Estadísticos…]. Allí aparecerá un cuadro de diálogo
como el que sigue, desde donde nos es posible especificar las tendencias centrales que
queremos, al igual que las medidas de dispersión. Seleccionamos entonces, para este ejercicio,
la Media y la Desviación típica. Damos a [Continuar] y a [Aceptar].

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 7


Fuente. Archivo personal

8
SPSS abrirá una ventana de resultados como la que sigue, en donde informa del valor de la
media y la desviación.

Fuente. Archivo personal

Si comparamos, los valores arrojados por SPSS son exactos a los que arroja el análisis manual de
los datos.

Frecuencias y distribuciones
Es muy probable que, con un conjunto de datos, existan algunos de ellos que se repitan en cada
uno de los casos. La frecuencia hace referencia justamente a estas repeticiones de los valores
en los datos. La distribución es la forma en la cual los datos se encuentran repartidos en una
muestra o población. Generalmente es posible representarla con una curva de distribución o
curva normal (de la cuál hablaremos más adelante).

La distribución de frecuencias es entonces la organización de la frecuencia en un cuadro que me


permite observar el número de veces que se repite cada dato en el conjunto de la investigación.
A continuación veremos los pasos en SPSS para obtener este cuadro de distribución de
frecuencias.

Vamos a volver a la pequeña base que hemos elaborado en SPSS anteriormente con los datos
de la tabla que aparece al inicio de la cartilla (base que tiene una variable de género y 3
variables escalares VAR1, VAR2 y VAR3, y que se encuentra anexa a este módulo).

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 9


SPSS permite que los pasos para el análisis se hagan tanto en la ventana de la base como en la
de resultados. Si recuerdan, cuando realizamos los pasos para el análisis descriptivo de
frecuencia, utilizamos la siguiente cadena de comandos:

Comando: Analizar/Estadísticos descriptivos/Frecuencias

Al hacer esto, verifico que el cuadro de dialogo tenga seleccionada la opción Mostrar tablas de
frecuencias, como aparece abajo.

Fuente. Archivo personal

10
Luego, selecciono las tres variables escalares: VAR1, VAR2 y VAR 3 y las paso al cuadro
[Variables:]. Selecciono el botón que dice [Estadístico…] Debemos recordemos que, al ser
escalares, es posible realizar mediciones de tendencia central y dispersión sin problemas. De
preferencia vamos a tomar la media, la mediana y la moda como medidas de tendencia central,
y de dispersión la desviación típica, la varianza y el rango. Luego de esto damos a [Aceptar].
Debe aparecernos en la ventana de resultados un cuadro como este:

Allí, vemos que los valores 21, 30, 45 y 50 se repiten dos veces en la VAR3. Este cuadro nos
muestra, en las columnas, tanto los valores de frecuencia o repetición de los datos como el
valor de porcentaje, que representa el porcentaje de cada dato respecto del total de datos
(100%).

Graficación de los datos


Una parte importante del proceso descriptivo tiene que ver con la visualización gráfica de los
datos, ya que ello facilita su interpretación y permite clarificarlas características de los mismos.

Podemos resumir estos gráficos en: gráfica de barras, barras agrupadas, gráficas lineales,
histogramas, diagramas de cajas y bigotes y diagramas de dispersión.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 11


Gráfica de barra
Las gráficas de barras son unos de los gráficos más comunes en los trabajos descriptivos.
Permiten representar visualmente los resúmenes de las variables medidas. En el eje “x”
aparecerán los valores categóricos, de forma agrupada, mientras que en el eje “y” la frecuencia
o porcentaje de la variable medida.

Para entender cómo se grafican estos datos vamos a volver a nuestra base anterior en SPSS
(base que tiene una variable de género y 3 variables escalares VAR1, VAR2 y VAR3).

Algunos comandos permiten que, durante el procedimiento de análisis, se tenga la opción de la


presentación grafica de los resultados. Vamos a explicar tanto este como el paso por fuera del
comando de análisis.

En el ejercicio de más arriba utilizamos la siguiente cadena de comandos:

Comando: Analizar/Estadísticos descriptivos/Frecuencias

En esta ocasión vamos a seleccionar el botón que dice [Gráficos…]. Aquí aparecerán tres
opciones: 1. Gráfico de barras, 2. De sectores y3. Histograma (el cual permite la opción de
mostrar curva normal).

Además, este paso permite decidir si trabajar con frecuencias, como valores del gráfico, o con
porcentajes. Generalmente esta decisión depende del estudio y de lo que se quiera mostrar en
él, pero, en muchas ocasiones resulta útil presentar los datos en términos de porcentajes por
cuanto permite comparar una categoría respecto a otra de un total de datos (100%).

Los gráficos de barras, además, permiten observar en detalle la distribución de los datos, por
ello no es recomendable utilizar variables escalares para este tipo de gráficos, ya que este
ejercicio me arrojaría una barra por cada dato, los cuales son generalmente extensos en las
variables escalares, hecho que no aportaría información relevante para el estudio.

Vamos a utilizar para este ejercicio la variable Género del ejemplo anterior. Un aspecto
importante a tener en cuenta es que esta variable es nominal. Así, no pueden realizarse
medidas de dispersión o medidas de tendencia central. Algunos autores sugieren cálculo de
modas como única alternativa para este tipo de nivel de medida. Por ello, si se ha realizado un
análisis previo de estas estadísticas, es importante quitar la selección de las medidas de
tendencia para luego sí continuar con los análisis.

Otro elemento importante para proceder es la atribución de las categorías de las variables. Para
ello hemos de ir a la vista de variables. Si seleccionamos la casilla de valores, aparecerán unos
puntos suspensivos […] le damos a esta opción y aparecerá el siguiente cuadro de diálogo de
etiquetas de valor:

12
Fuente. Archivo personal

En esta parte hay que asignar valores a las categorías. Como mencionaba arriba, la mejor opción
es asignar el valor de 1 a la categoría de hombres y 2 a las mujeres (aunque no hay un orden
preestablecido para esto). Lo importante es que se tenga en cuenta esta categoría cuando se
pasen los datos a la variable o utilizar las categorías preestablecidas cuando se coloquen las
etiquetas. Colocamos en Valor:1 y en Etiqueta: Hombres, y damos a la opción de añadir. Luego
colocamos el valor: 2 y en etiqueta Mujeres y damos añadir y aceptar.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 13


Hecho esto, en nuestros gráficos podemos tener el siguiente gráfico de barras:

Fuente. Archivo personal

Gráficas lineales
Este tipo de gráficas me permite describe el progreso de algún grupo. Me permite mostrar
evoluciones o cambios a lo largo del tiempo. En este caso es común representar, en el eje “x”, el
valor tiempo y, en el eje “y”, los cambios asociados a la variable en ese sentido.

Vamos a continuar con nuestra base para ejemplificar este tipo de gráfico, pero vamos a hacerlo
desde otra opción de SPSS, utilizando el comando siguiente:

Comando: Gráficos/Generador de gráficos

Debe aparecer una pantalla como la siguiente:

14
Fuente. Archivo personal

En la opción [Líneas] que aparece en la imagen en gris, me aparecerán dos cuadros. Selecciono
el primero (por tratarse sólo de un conjunto de datos a visualizar) y arrastro la imagen en el
cuadro que dice arrastre hasta aquí un gráfico…. Luego de eso el programa nos presentará un
cuadro con puntos en el eje “x” y en el eje “y”. Como el eje x indica la medida de tiempo, vamos
a seleccionar, del conjunto de variables, la variable ID, ya que esta es una variable de orden de
secuencia. En el eje “y” estaría la variable de cambio, que para este pequeño ejemplo será la

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 15


VAR1, y damos a la opción de aceptar. Nos debe producir, en la ventana de resultados, una
imagen como la siguiente:

Fuente. Archivo personal

Histograma
El histograma permite visualizar un conjunto de barras agrupadas que representa, cada barra,
los valores por cada categoría. El total de todas las áreas de las columnas representarán a toda
la muestra. Es importante notar que las barras, en el histograma, sólo pueden representar
frecuencias, a diferencia del gráfico de barras en donde era posible representar también
porcentajes.

16
SPSS permite además trazar una curva para el histograma. Esta curva llega a ser importante,
como veremos más adelante, para entender si la distribución de los datos es o no normal.

Fuente. Archivo personal

Un ejemplo de este tipo de grafico quedaría así:

Diagrama de cajas y bigotes


Este tipo de diagrama es útil cuando se quiere representar la distribución de un conjunto de
datos, y los extremos del mismo. Es útil para conocer la distribución de los datos respecto de la
media y para saber si existen datos que se alejan del conjunto. Generalmente estos datos
alejados estarán representados con un signo: ° o con un signo: *. Este tipo de gráficas es muy
utilizado para comparar las medias de dos grupos. Por ejemplo:

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 17


Fuente. Archivo personal

Diagrama de dispersión
Este tipo de grafico permite visualizar, en un plano x-y, los puntos de relación de dos variables
(x1, y1), (x2, y2),…, (xn, yn). Generándose un cuadro de puntos donde es posible ver la tendencia o
dispersión de los datos. Tal gráfico, como veremos más adelante, resulta muy útil para entender
las correlaciones.

18
Fuente. Archivo personal

Distribución normal
Otra forma importante de describir los datos tiene que ver con la distribución normal de los
mismos. Generalmente esta se realiza a través de la curva que vimos al hacer el histograma,
llamada también curva gaussiana. Esta curva representa la distribución y tiene las siguientes
características:

1. Es simétrica alrededor del punto intermedio del eje horizontal


2. El punto en torno al cual es simétrica es el punto en el que caen la media, la mediana y la
moda
3. Las colas de la curva (asíntotas) nunca tocan el eje horizontal.

Si bien, se habla de distribuciones normales, ninguna curva en realidad es perfectamente


simétrica. Si vemos el histograma de más arriba nos daremos cuenta que su distribución tiene
una pequeña tendencia hacia la izquierda. Este tipo de distribución resulta común de encontrar
cuando trabajamos con datos psicológicos.

Ahora bien, existen diferentes formas de dividir esta curva. Estas divisiones tendrán el propósito
de ubicar, en porcentaje y en dispersión, un dato específico.

[ METODOS CUANTITATIVOS DE PSICOLOGÍA ] 19


Una de las formas más comunes para dividir una distribución es utilizar las desviaciones
estándar como referente de un conjunto de datos. Dependiendo de la desviación tendremos
una unidad de separación y un porcentaje correspondiente.

Explicaremos esto con más detalle.

En el ejemplo inicial:

2, 3, 5, 7, 7, 8.

La media tiene un valor de 5,33, y el valor de desviación es de 2,42 (calculados, ambos, más
arriba). Entre la media y el valor de desviación habrán 2,91 unidades (calculado al restar a 5,33
2,42). Estas podrán representar nuestra primera unidad 1 (1: 2,91). Tanto por encima como por
debajo de la media. Es decir que de 2,42 a 5,33 habrá una primera unidad (con un valor de
rango de 2,91). A este tipo de unidad estándar d conversión se le denominará puntuación z.

Puntuaciones z
Así, la puntuación z o puntaje z es la puntuación que representa el valor estándar de conversión
a partir de la desviación, es decir, es el número de desviaciones estándar a las que está una
puntuación de la media. La fórmula para calcularla es la que sigue:
𝑥𝑖 − ∆𝑥
𝑧=
𝑆𝑥
Siendo Sx la desviación estándar.

Como les venía diciendo, esta es útil como medida de identificación o ubicación de unos datos
respecto a un conjunto de datos ya que, a más unidades o puntajes z esté un dato, sabremos
que ese dato estará más alejado de la media.

Con esta información damos por finalizada la Unidad Dos y la presentación de los análisis
descriptivos. En una próxima cartilla hablaremos de los análisis inferenciales y las formas de
proceder con ellos desde SPSS.

20

S-ar putea să vă placă și