Sunteți pe pagina 1din 20

1|

02.

Psicologa

Experimental

- Estadstica

ESTADSTICA

4.4. Otras transformaciones de las puntuaciones ....... 15


4.5. Interpretacin de puntuaciones directas,
diferenciales y tpicas .................................................. 16

TEMA 1 INTRODUCCIN AL ANLISIS DE DATOS ................. 1


1. CONCEPTO DE ESTADSTICA........................................... 1
2. CONCEPTOS GENERALES ................................................ 1

TEMA 1 INTRODUCCIN AL ANLISIS DE DATOS

3. MEDICIN Y ESCALAS DE MEDIDA ................................. 2

1. CONCEPTO DE ESTADSTICA
Estadstica es la ciencia que recoge, ordena y analiza los
datos de una muestra, extrada de cierta poblacin, y que, a
partir de esa muestra, valindose del clculo de
probabilidades, se encarga de hacer inferencias acerca de la
poblacin. Existen dos clases de estadstica:

3.1. Escala Nominal ....................................................... 2


3.2. Escala Ordinal ......................................................... 2
3.3. Escala de intervalo ................................................. 2
3.4. Escalas de razn ..................................................... 2

1)

Descriptiva: recoleccin, presentacin, descripcin,


anlisis e interpretacin de un conjunto de datos
procedentes de una muestra o de la poblacin total de
forma cuantitativa. Esencialmente, consiste en describir
las caractersticas de una muestra utilizando
estadsticos muestrales.

2)

Inferencial: realizacin de inferencias sobre la


poblacin basndose en datos obtenidos a partir de la
muestra. Para que estas generalizaciones sean vlidas
la muestra deben ser representativa de la poblacin y
la calidad de la informacin debe ser controlada,
adems puesto que las conclusiones as extradas estn
sujetas a errores, se tendr que especificar el riesgo o
probabilidad con que se pueden cometer esos errores.
La inferencia estadstica, es decir, las afirmaciones que
hagamos sobre la poblacin en base al estudio de una
muestra, se hace siempre en trminos probabilsticos.

TEMA 2 ORGANIZACIN DE DATOS ..................................... 4


1. CLASIFICACIN Y NOTACIN DE VARIABLES .................. 4
2. MODALIDADES Y CLASES................................................ 4
3. DISTRIBUCIN DE FRECUENCIAS.................................... 4
3.1. Distribucin de frecuencias en variables
cuantitativas continuas ................................................. 4
4. REPRESENTACIONES GRFICAS ...................................... 5
4.1. Representacin grfica de una variable ................. 5
4.2. Representacin grfica de dos variables ................ 6
5. PROPIEDADES DE LA DISTRIBUCIN DE FRECUENCIAS .. 6
TEMA 3 ESTADSTICA DESCRIPTIVA APLICADA A UNA SOLA
VARIABLE ................................................................................ 8

1.2. Mediana ................................................................. 9

2. CONCEPTOS GENERALES

Caracterstica: cualquier propiedad de objetos o


personas que queremos estudiar (P.e., sexo de una
persona).

1.3. Moda (Mo) ........................................................... 10

Modalidad: distintas formas de presentarse dicha


caracterstica (P.e., hombre y mujer).

Poblacin estadstica: conjunto de los elementos que


comparten una o varias caractersticas.

Entidades estadsticas: cada uno de los elementos que


componen una poblacin.

Muestra: subconjunto representativo de una poblacin.

Muestreo: mtodo
representativas.

Parmetro: es una propiedad descriptiva (una medida)


de una poblacin por lo que est libre de error de
muestreo, caracterstica que no comparte con el
estadstico.

Estadstico: es una propiedad descriptiva (una medida)


de la muestra, no est libre de error en el muestreo.

Estimacin de parmetros: tcnica para estimar el


parmetro poblacional a partir de una muestra (Se usan
letras griegas para los parmetros, y letras maysculas
para los estadsticos).

1. ESTADSTICOS DE TENDENCIA CENTRAL ........................ 8


1.1. Media aritmtica .................................................... 8

1.4. Apuntamiento o curtosis ...................................... 10


1.5. Eleccin de una medida de tendencia central ..... 11
2. ESTADSTICOS DE POSICIN: LOS CUANTILES .............. 11
2.1. Cuartiles ............................................................... 11
2.2. Deciles .................................................................. 11
2.3. Percentiles o Centiles ........................................... 11
3. ESTADSTICOS DE VARIABILIDAD Y DISPERSIN .......... 12
3.1. Desviacin media ................................................. 12
3.2. Varianza o desviacin tpica ................................. 12
3.3. Coeficiente de variacin ....................................... 13
3.4. Amplitud total ...................................................... 14
3.5. Amplitud (o rango) semi-intercuartil.................... 14
4. PUNTUACIONES DIRECTAS, DIFERENCIALES Y TPICAS 15
4.1. Puntuacin Directa ............................................... 15
4.2. Puntuacin Diferencial ......................................... 15
4.3. Puntuacin tpica ................................................. 15

de

extraccin

de

muestras

2|

02.

Psicologa

Experimental

Caracterstica: propiedad de los individuos de una


poblacin (Ej.: el sexo).

Modalidad: cada una de las variantes como se


manifiesta
una
caracterstica
(Para
tratarlas
estadsticamente se le asignan nmeros a las
modalidades de una caracterstica).

Importante saber que, mientras los parmetros poblacionales


tienen valores nicos, aunque sean desconocidos, los
estadsticos por su parte, pueden tener tantos valores
diferentes como muestras se extraigan de la poblacin.
3. MEDICIN Y ESCALAS DE MEDIDA

Medicin: proceso por el cual se asignan nmeros a


objetos o caractersticas segn determinadas reglas.
Regla general: aceptar como vlidas aquellas relaciones
que sean verificables empricamente.

Escala de medida: procedimiento mediante el cual se


relacionan de manera biunvoca un conjunto de
modalidades con un conjunto de nmeros (es decir, a
cada modalidad le corresponde un solo nmero y a cada
nmero una sola modalidad).
Transformacin admisible: hace referencia al problema
de la unicidad de la medida y puede plantearse de la
siguiente forma: las representaciones numricas que
hacemos de las modalidades NO son las nicas posibles.

Atendiendo a las relaciones que puedan verificarse


empricamente entre las modalidades de los objetos o
caractersticas y su complejidad, Steven (1946) clasifica las
escalas en: nominal, ordinal, de intervalos y de razn, se trata
de la clasificacin ms extendida.
3.1. Escala Nominal

Definicin: asignacin arbitraria de nmeros o smbolos


a cada una de las diferentes modalidades de la
caracterstica.

Relacin: Slo se acepta la relacin de igualdaddesigualdad, que indica la pertenencia o no a una


categora determinada. P.e., sexo, grupo sanguneo,
diabetes, etc.

Transformacin: permanece invariante frente a


cualquier variacin en el orden de los datos
(permutacin). As, la transformacin admisible ser
cualquiera que preserve las relaciones de igualdaddesigualdad.

3.2. Escala Ordinal

Definicin: los objetos pueden manifestar una


determinada caracterstica en mayor grado que otros.
En esta escala se asignan nmeros a stos objetos para
ordenar su posicin pero sin indicar la distancia que hay
entre ellas.

Relacin: No slo permite comprobar su igualdad, sino


que siendo distintas, cul de ellos es mayor (orden). P.e.,
nivel acadmico, nivel de dolor, etc.

Transformacin: cualquier transformacin es vlida


siempre que preserve el orden de magnitud, creciente o
decreciente en que los objetos presentan determinada

- Estadstica

caracterstica. P.e., la transformacin isomrfica y la


transformacin montona creciente, que hacen
corresponder a una sucesin ordenada de nmeros otra
sucesin de nmeros ordenados del mismo modo que
los primeros.
3.3. Escala de intervalo

Definicin: se ordenan los objetos segn la magnitud del


atributo que representan y proveen intervalos iguales
entre las unidades de medida. Lo que caracteriza este
tipo de escala es la existencia de una unidad de
medicin comn y constante que permite asignar un
nmero real a todos los pares de objetos del conjunto
ordenado.

Relacin: permiten establecer la igualdad o desigualdad


entre las magnitudes de los objetos medidos. No existe
cero absoluto que indique ausencia total de cantidad de
variable P.e., termmetro, calendario, etc.

Transformacin: es vlida cualquier transformacin de la


forma y=a+bx siempre que b>0 (transformacin lineal).

3.4. Escalas de razn

Definicin: los valores tienen un valor absoluto, no


arbitrario, o valor cero absoluto que s indica ausencia
de una caracterstica.

Relacin: Se admiten relaciones de igualdad-desigualdad


y orden y las operaciones de suma, resta, multiplicacin
y divisin. P.e., longitud, edad, colesterol, etc.

Transformacin: permanece invariable frente a


cualquier transformacin del tipo y=ax siendo a>0
(transformacin
geomtrica)

3|

02.

Psicologa

Experimental

- Estadstica

Escala
Nominal

Relacin
- Igualdad/Desigualdad

Transformacin Admisible
- Cualquiera que preserve la
igualdad/desigualdad (Permutacin)

Ordinal

- Igualdad/Desigualdad
- Orden (mayor o menor que)

- Cualquiera que preserve el orden o


grado de magnitud.

- Igualdad/Desigualdad de diferencias
- Orden
- Suma y resta
- Igualdad/Desigualdad de razones

- Y = a + bx (b>0)

Intervalo

Razn

Orden

Suma, resta, multiplicacin y divisin

Y = ax (a>0)

Ejemplos
- Sexo, raza, estado civil,
carrera elegida,
clasificacin del color del
pelo, diagnstico clnico,
etc.
- Dureza minerales,
prestigio social, ubicacin
ideolgica, estatura,
Likert, modelo escalar de
Guttman.
- Calendario, temperatura,
inteligencia.
- Longitud, masa, tiempo
de reaccin, coste
econmico, etc.

4|

02. Psicologa Experimental


02.01. Estadstica
TEMA 2 ORGANIZACIN DE DATOS

1. CLASIFICACIN Y NOTACIN DE VARIABLES

Variable: representacin numrica de una caracterstica


que presenta ms de una modalidad (valor).

Constante: cuando una caracterstica, en s misma


variable, se manifiesta bajo una nica modalidad (P.e.,
extraversin en un grupo de varones, el sexo se
mantiene constante).

Las variables pueden clasificarse segn la escala o nivel de


medida que se les pueda aplicar; esto es, segn las
operaciones que con los nmeros atribuidos a sus
modalidades se puedan realizar:
(1) Variable cualitativa: caracterstica que solo puede ser
considerada a nivel nominal (p.e., sexo, profesin,
nacionalidad, grupo sanguneo, etc.). Pueden
clasificarse, adems, en funcin del nmero de
categoras que presentan:
a)

Dicotmica: presenta slo dos categoras (p.e.,


sexo).

b)

Politmica: presenta ms de dos categoras (p.e.,


raza).

* En ocasiones se categorizan variables que podran


medirse a un nivel superior; en este caso decimos que
una variable se ha dicotomizado si se han establecido
dos categoras, y politomizada si se han establecido
ms de dos categoras. Un ejemplo sera la variable
peso del roedor de un experimento: aunque podramos
medir exactamente su peso en gramos, puede resultar
til en una investigacin dicotomizar la variable peso
clasificando a las ratas en peso alto y bajo, o
politomizarla, estableciendo tres o ms niveles de peso.
(2) Variable cuasi cuantitativa: caracterstica que puede
ser considerada, como mximo, a nivel ordinal (p.e.,
nivel cultural, clase social, grado acadmico, etc.).
(3) Variable Cuantitativa: caracterstica que puede ser
considerada, al menos, a nivel de intervalo y/o razn
(p.e., peso, altura, edad, inteligencia, fuerza fsica,
nmero de hijos, extroversin, creatividad, etc.).
Pueden clasificarse en funcin de los valores numricos
que pueden asignarse:
a)

Discreta: no es posible una modalidad intermedia


entre dos modalidades (p.e., se pueden tener 2 o
3 hijos, pero no 2,5 hijos).

b)

Continua: caracterstica que admite modalidades


intermedias entre dos cualesquiera (p.e., una
persona puede pesar 60 kg. o 61 kg., pero
tambin 60,3 kg. o 60,8 kg.

2. MODALIDADES Y CLASES
Las variables pueden contener un nmero elevado de
modalidades (p.e., el peso), en cuyo caso es ms prctico
agrupar las modalidades en clases. Cada clase abarcara un
nmero determinado de modalidades; en el ejemplo del
peso, una clase contendra las modalidades de 50 kg. a 59 kg.,
la siguiente de 60 kg. a 69 kg., etc.

Las clases deben ser mutuamente exclusivas, de modo que


ninguna modalidad puede pertenecer a ms de una clase, y
exhaustivas, con el fin de que toda modalidad posible
pertenezca necesariamente a una clase. Para representar
esta exclusividad se utilizan parntesis y corchetes. As, si el
intervalo comienza con un parntesis implica que el dato que
sigue al parntesis no corresponde a ese intervalo, mientras
que si le acompaa un corchete s que lo har. Por ejemplo,
en el intervalo (50-60], el 50 no entrara en este intervalo,
mientras que s lo hara el 60.
3. DISTRIBUCIN DE FRECUENCIAS

Frecuencia absoluta: nmero de observaciones


contenidas dentro de cada clase o categora (ni).

Frecuencia relativa o proporcin (pi): cociente entre la


frecuencia absoluta de cada clase (ni) y el nmero total
de observaciones (n). La suma de todas las proporciones
ser igual a 1. P.e., 1/10=0,1.

Porcentaje (Pi): la proporcin o frecuencia relativa de


cada clase multiplicada por 100. El total del porcentaje
siempre es 100. P.e., 0,1 x 1000=10.

Frecuencia absoluta acumulada (na): nmero de veces


que se repite cada modalidad y cualquiera de las
modalidades inferiores.

Proporcin acumulada o frecuencia relativa acumulada


(pa): cociente entre la frecuencia absoluta acumulada de
cada clase y el total de observaciones. Formalmente: pa
= na/n.

Porcentaje acumulado: valor de la proporcin


acumulada multiplicado por cien. Formalmente: Pa = pa x
100.
* Las frecuencias acumuladas se emplean con las
variables cuasi-cuantitativas (niel ordinal) y con las
cualitativas.

3.1. Distribucin de frecuencias en variables cuantitativas


continuas
Cuando trabajamos con un amplio nmero de observaciones,
ser necesario agrupar las variables en intervalos, que
consiste en formar grupos de valores consecutivos de la
variable, situando cada uno de estos grupos en una fila y
calculando la frecuencia de cada grupo o intervalo de valores
y no de cada valor de la variable.

Intervalo elemental: sinnimo de modalidad; es cada


uno de los grupos de valores que ocupan una fila en una
distribucin de frecuencias. Siempre lleva asociada una
amplitud equivalente a la unidad (media unidad por
debajo y media por encima).

Intervalo compuesto: se compone de varios intervalos


elementales consecutivos.
Ejemplo: Supongamos que tras un examen la nota ms
baja es 2 y la ms alta 10. Podramos definir intervalos
elementales (1, 2, 3,, etc.) o agrupar varios intervalos
elementales para formar un nmero menor de
intervalos compuestos; en este caso cogemos tres:

5|

02. Psicologa Experimental


02.01. Estadstica
o

1.5 4.5 (Comprende los intervalos elementales


2, 3 y 4)

4.5 7.5 (Intervalos elementales 5, 6 y 7)

7.5 10.5 (Intervalos elementales 8, 9 y 10).

Los tres intervalos representados figuran con sus lmites


exactos inferiores y superiores, ahora bien, es posible
nombrarlos de otro modo:
o

24

57

8 10

Intervalo abierto: intervalo que, tericamente, no tiene


lmite inferior o superior. Por ejemplo, si en la variable
edad tuviramos dos sujetos de 98 y 99 aos podramos
optar por establecer el intervalo abierto 76 aos o
ms, en lugar de aadir los tres intervalos
correspondientes 76-85 y 86-95 y 96-105, dos de ellos
con frecuencia nula.

Lmites aparentes, virtuales o informados: son los


valores mayor y menor de cada intervalo, teniendo en
cuenta el nivel de precisin del instrumento de medida.

Lmites exactos o reales: son los valores mximo y


mnimo que tendra cada intervalo si el instrumento de
medida tuviera una precisin exacta (p.e., en el caso del
intervalo representado por 0.57, diremos que el valor
0.565 es el lmite exacto inferior y 0.575 el lmite exacto
superior).

Punto medio del intervalo: es la semisuma (o media


aritmtica) de sus dos lmites exactos (p.e., 1.5 + 4.5/2 =
3).

Amplitud del intervalo: es la diferencia entre el lmite


exacto superior y el lmite exacto inferior (p.e., 4.5-1.5 =
7.5-4.5 = 10.5-7.5 = 3).

Amplitud total: diferencia entre el lmite exacto superior


del intervalo mximo y el lmite exacto inferior del
intervalo mnimo (p.e., 10.5 1.5 = 9).

4. REPRESENTACIONES GRFICAS

Grfico: forma rpida e intuitiva de visualizar un


conjunto de datos o una distribucin de frecuencias.
En toda representacin grfica se encuentra subyacente la
idea de un sistema de coordenadas, consistiendo el ms
habitual en dos lneas perpendiculares. La lnea o eje vertical
se llama ordenada (Y) y la lnea o eje horizontal se denomina
abscisa (X). Ambos ejes dividen al plano en cuatro
cuadrantes, y el punto donde se cruzan ambos ejes se
denomina origen.
4.1. Representacin grfica de una variable
4.1.1. Diagrama de barras

Para VV nominales, ordinales y cuantitativas discretas.


En el eje abscisas se colocan los valores de la variable y en el
de ordenadas, las frecuencias. Sobre cada valor de la variable
se traza un rectngulo o barra perpendicular cuya altura debe

ser igual a la frecuencia, ya sea absoluta o relativa. Es decir,


Se representarn tantas barras como categoras tenga la
variable, de modo que la altura de cada una ser
proporcional a la frecuencia o porcentaje en cada clase.
En VV ordinales y cuantitativas discretas se puede utilizar,
adems, un diagrama de barras acumulativo, que permite
conocer cuntas observaciones se sitan por debajo de un
valor cualquiera. En este caso, sobre el eje de ordenadas se
colocarn los valores de las frecuencias acumuladas (ya sean
relativas o absolutas).
4.1.2. Diagrama de sectores

VV cualitativas y cuasi cuantitativas.


Tambin denominado diagrama de tarta, ciclograma o
quesito. Es una representacin en forma de crculo que se
divide en tantas secciones como categoras o valores
presente la variable. El ngulo total del crculo representa el
nmero total de observaciones, y para determinar el ngulo
de los sectores de cada modalidad se multiplica la frecuencia
relativa (proporcin) por 360, que es el nmero de grados de
una circunferencia. En su representacin, es habitual indicar
el porcentaje obtenido en cada valor de la variable.
4.1.3. Pictograma

VV cualitativas
Expresan las frecuencias de las modalidades de la variable en
forma de dibujo, smbolos, mapas, etc. Se hacen
representando a diferentes escalas un mismo dibujo, de tal
manera que el tamao de cada uno sea proporcional a la
frecuencia de la modalidad que representa. Es un error hacer
la representacin con una escala tal que el permetro del
dibujo sea proporcional a la frecuencia, ya que a frecuencia
doble, correspondera un dibujo de rea cudruple, lo que
dara un efecto visual engaoso. Una solucin prctica es
incluir una referencia indicando la frecuencia a la que
equivale cada smbolo del grfico.
4.1.4. Histograma

VV cuantitativas continuas agrupadas en intervalos.


En el eje de abscisas se colocan los lmites exactos de cada
intervalo o los puntos medios de los intervalos y sobre ellos
se levantan rectngulos cuyas reas sean proporcionales a la
frecuencia correspondiente, absoluta o relativa, segn se
quiera representar una u otra. Tambin se utiliza para la
distribucin de frecuencias acumuladas. Al igual que en el
diagrama de barras, en el histograma normal, cada
rectngulo representa nicamente un valor de la variable,
mientras que en el histograma acumulativo representa ese
valor y los valores inferiores.
4.1.5. Polgono de frecuencias
VV cuantitativas discretas y continuas.
En V discretas, es la figura que resulta de unir los extremos
superiores de las que hubieran sido las barras si se hubiera
hecho un diagrama de barras.
En VV continuas, es lo mismo pero referido a los puntos
medios de las bases superiores de los rectngulos
correspondientes a un hipottico histograma construido con
esos mismos datos. En variables continuas tambin se utiliza
el polgono de frecuencias acumuladas incluyendo en el eje

6|

02. Psicologa Experimental


02.01. Estadstica

de ordenadas las frecuencias acumuladas, ya sean absolutas


o relativas. Para realizarlo, se une, mediante un segmento
rectilneo, el vrtice inferior izquierdo del primer rectngulo
con su vrtice superior derecho; este punto con el vrtice
superior derecho del siguiente rectngulo, y as
sucesivamente.
4.1.6. Diagrama de tallo y hojas

VV cuantitativas discretas y continuas.


Fue ideado por Turkey en el contexto del enfoque
denominado anlisis exploratorio de datos. Aunque no es
exactamente una representacin grfica, sino una
construccin utilizada para la descripcin de variables
cuantitativas, representa la particularidad de permitir
visualizar globalmente la distribucin de frecuencias
manteniendo la individualidad de los datos.
Para su obtencin, se redondean los datos a dos o tres cifras
significativas, tomndose como tallos la prima o dos primeras
cifras de cada dato y como hojas las ltimas cifras del dato. A
continuacin, separados por un punto, se dispondrn los
tallos a la izquierda y las hojas a la derecha del tallo
correspondiente. As, cada tallo, que se representa una sola
vez, define una clase y el nmero de hojas representa la
frecuencia de cada clase. As, los pasos a seguir son:
1)

Se identifican los valores mximo y mnimo observados.

2)

Se toma una decisin acerca del nmero ms


apropiado de tallos distintos (en general, entre 5 y 20).

3)

Se listan todos los tallos en una columna, ordenados de


forma creciente.

4)

Se escribe cada hoja junto al tallo que le corresponda,


ordenadas segn su valor.
Ventajas del diagrama de tallo y hojas:

1)

Permite identificar cada puntuacin individual.

2)

Ofrece simultneamente tanto un listado


puntuaciones como un dibujo de la distribucin.

3)

Es ms fcil de modificar para obtener un dibujo con un


nivel de detalle distinto de la distribucin ya que
contiene los valores de cada observacin.

4)

de

Pueden representarse dos conjuntos de datos


simultneamente en el mismo diagrama, con lo que se
facilita la comparacin.

4.1.7. Diagrama de cajas y bigotes (box and whiskers)

Permite representar la variabilidad observada en un


conjunto de valores.
Tambin denominada diagrama de caja (boxplot), fue
desarrollada por Turkey.
Construccin: se calculan previamente la mediana, los
cuartiles Q1 y Q3 y los valores extremos LI y LS, siendo LI la
menor observacin mayor o igual que [Q1-1.5 (Q3-Q1)] y LS la
mayor observacin menor o igual que [Q3+1.5 (Q3-Q1)]. Las
observaciones que caen fuera del intervalo (LI, LS) se
consideran datos atpicos.

Representacin grfica: se marcan las seales de tal forma


que las distancias entre ellas sean proporcionales a las
distancias entre la puntuacin mxima, la mnima y los tres
cuartiles. Con los tres cuartiles se forma una especie de ficha
de domin (caja), cuya longitud se corresponde con el
recorrido intercuartlico. La mediana puede encontrarse en
cualquier punto dentro de la caja. A los lados se aaden dos
prolongaciones (los bigotes) que se corresponden con 1.5
veces la longitud de la caja. Los valores que se distancian
entre 1.5 y 3 longitudes de caja se denominan outliers (estn
fuera de la representacin). A los valores que se distancian 3
o ms longitudes se les conoce como extremos (extremes).
As, observando este tipo de grficos, podemos determinar la
tendencia central (mediana), la variabilidad de los datos
(longitud de la caja), identificar la posible presencia de
observaciones atpicas (valores extremos y outliers) y valorar
la asietra (segn la posicin de la mediana respecto a la caja:
si la mediana est en la parte superior de la caja, entonces los
datos son asimtricos positivos; si la mediana se aproxima a
la parte superior, diremos que la distribucin es asimtrica
negativa.
4.2. Representacin grfica de dos variables
4.2.1. Diagrama de barras conjunto

Cuando al menos una de las dos VV es cualitativa.


Cuando ambas son cualitativas, previamente conviene
organizar los datos en una tabla de entrada (en la cual se
sitan los valores de una de las variables en las filas y los
valores de la otra variable en las columnas).
En el eje de abscisas se colocan las variables y en el de
ordenadas las frecuencias. Al tratarse de dos variables,
conviene utilizar distinto trazo para cada una de ellas (ya
sean dos barras una junto a la otra o una misma barra
dividida en dos, un trozo para cada VV).
Para utilizar las frecuencias absolutas es conveniente que el
nmero de sujetos sea similar en las dos variables, siendo
preferible en caso contrario utilizar las frecuencias relativas o
porcentajes.
4.2.2. Diagrama de dispersin o nube de puntos

Cuando ambas variables son cuantitativas.


Se sita una de las variables en el eje de abscisas y la otra en
el eje de ordenadas. Para cada par de datos, se localiza la
interseccin de ambas variables y se marca con un punto.
5. PROPIEDADES DE LA DISTRIBUCIN DE FRECUENCIAS
(1) Tendencia central: lugar donde se centra una
distribucin particular en la escala de valores.
(2) Variabilidad: grado de concentracin de las
observaciones en torno al promedio. Una distribucin
de frecuencias es homognea (tiene poca variabilidad) si
los valores de la distribucin estn cercanos al promedio
y es heterognea (tiene mucha variabilidad) si los
valores se dispersan mucho con respecto al promedio.
(3) Asimetra o sesgo: grado en que los datos se reparten
equilibradamente por encima y por debajo de la
tendencia central. Una distribucin ser simtrica
cuando al dividirla en dos a la altura de la media, las dos
mitades se superponen.

7|

02. Psicologa Experimental


02.01. Estadstica
a.

Asimetra
positiva:
cuando
la
mayor
concentracin de puntuaciones se produce en la
parte baja de la escala (tpica de los tests difciles,
donde la mayora de sujetos punta bajo).

b.

Asimetra negativa: cuando la mayor parte de las


puntuaciones se sitan en la parte alta de la
escala (tpica de los tests fciles, donde la
mayora de sujetos punta alto).

8|

02. Psicologa Experimental


02.01. Estadstica

TEMA 3 ESTADSTICA DESCRIPTIVA APLICADA A UNA SOLA


VARIABLE

b)

La media no es el estadstico ms apropiado cuando la


distribucin es muy asimtrica, es decir, cuando existen
una o muy pocas puntuaciones en uno de sus extremos,
ya que es muy sensible a las variaciones de los datos.

1. ESTADSTICOS DE TENDENCIA CENTRAL


Los estadsticos de tendencia central indican cul es la
puntuacin global de un grupo de puntuaciones mediante el
clculo de un valor central que acta como resumen
numrico representativo del conjunto de datos.

1.1.2. Clases de medias


(1) Medias robustas: las que se ven menos afectadas por
los datos atpicos.

1.1. Media aritmtica

Slo con variables cuantitativas.

(2) Media recortada: se excluye el clculo de un porcentaje


de los casos extremos de la distribucin.

Tambin llamada promedio o simplemente media, es el valor


central alrededor del cual estn la mayora de las
observaciones (centro de gravedad de la distribucin).

(3) Media winsorizada: en lugar de excluir un porcentaje de


casos extremos, stos se sustituyen por el valor
inmediatamente superior o inferior a ese porcentaje.

La media aritmtica de una variable X se define como la suma


de todos los valores de la variable divididos por el nmero
total de observaciones.

(4) Media central: es el promedio de la parte central de la


distribucin.

(5) Trimediana (o mediana recortada): ndice ponderado


que utiliza los tres cuartiles para su clculo.

En el caso de que los datos estn agrupados en intervalos, la


media se puede calcular a partir de las frecuencias absolutas
(ni):

El valor de la media variar segn los datos estn agrupados


en intervalos o no. Solo coincidirn ambas medias si el
agrupamiento en intervalos se realiza definiendo intervalos
elementales (intervalos de amplitud unidad).
1.1.1. Propiedades de la media
(1) La suma de las desviaciones (o diferencias) de cada valor
con respecto a su media es igual a cero.
(

)
(

(2) Si a los valores de la variable X les aplicamos la siguiente


transformacin lineal: Yi = bXi + a, la media de los nuevos
+ a, es decir, la media sufrir la
valores Y ser
misma transformacin.
(3) La media es funcin de todas y cada una de las
puntuaciones, por lo que variar solo con que una de
ellas vare.
Limitaciones de la media:
a)

(6) Meda: mediana de las desviaciones absolutas de la


mediana. En el intervalo mediana +/- meda se
encuentra, al menos, el 50% de las observaciones.
(7) Media ponderada: Es una media calculada sobre
puntuaciones a las que el investigador otorga pesos
especficos. En su frmula, en el numerador se suman
las puntuaciones, multiplicadas cada una por su peso
especfico. En el denominador figura la suma de los
pesos de todas las puntuaciones.

o de las proporciones (pi):

donde Xi es el valor que toma la variable u observacin del


sujeto i.

Cuando los datos estn agrupados en intervalos, la


media no se puede calcular si el intervalo mximo no
tiene lmite superior y/o el intervalo mnimo no lo tiene
inferior.

)
(

(8) Medias aritmticas generalizadas: su nombre hace


referencia al hecho de que haciendo alguna
transformacin sobre ellas podramos llegar a la media
aritmtica. Se incluyen:
a)

Media geomtrica: es la raz ensima de n valor. Se


usa con ms frecuencia que la aritmtica en
investigaciones sobre promedios de tiempos o de
razones.

( )(

Si los datos estuvieran


intervalos, la frmula sera:

agrupados
(

en

La media geomtrica es un valor tal que su


logaritmo es igual a la media aritmtica de los
datos, de ah que digamos que la media
geomtrica es una media aritmtica generalizada.

9|

02. Psicologa Experimental


02.01. Estadstica
b)

Media armnica: es un valor tal que su recproco


es igual a la media de los recprocos de los datos,
de ah que sea una media generalizada. Se suele
emplear en clculos en los que la variable pone
en relacin diferentes unidades de medida, como
por ejemplo la velocidad (espacio/tiempo), siendo
estas variables muy comunes en estudios de
psicofsica.

La mediana es una representacin grfica de una distribucin


de frecuencias (Histograma) que divide el rea total en dos
reas de igual superficie. Es importante precisar que la
mediana no tiene por qu coincidir con la media.
1.2.3. Propiedades de la mediana
a) La suma de las diferencias, en valor absoluto, de n
puntuaciones respecto a su mediana es igual o menor
que la suma de sus diferencias en valor absoluto de esas

Se suele emplear en clculos en los que la


variable pone en relacin diferentes unidades de
medida, como por ejemplo la velocidad
(espacio/tiempo), siendo estas variables muy
comunes en estudios de psicofsica.
c)

Media cuadrtica: es la raz cuadrada de la media


aritmtica de los cuadrados de esos n valores. Es
un valor tal que su cuadrado es igual a la media
aritmtica de los cuadrados de los datos, de ah
que digamos que es una media asimtrica
generalizada.

puntuaciones respecto a cualquier otro valor.


b)

Es menos sensible que la media a las variaciones de cada


una de las puntuaciones. En algunos casos puede quedar
invariable, cosa que no sucede con la media.

c)

Puede ser calculada aunque el intervalo mximo no


tenga lmite superior ni el intervalo mnimo tenga lmite
inferior cuando uno de esos intervalos no contenga
dentro de s ms del 50% de los casos.

Es el punto o valor numrico que divide la distribucin de


frecuencias en dos partes iguales ordenadas, conteniendo
cada una el 50% de las observaciones.

d)

La mediana es un punto tal que la vertical levantada


sobre el mismo divide el rea total del histograma en
dos reas con distinta superficie.

Es una buena alternativa a la media para resumir la tendencia


central cuando la distribucin es asimtrica, ya que la
mediana no se ve afectada por los valores extremos que
pueda adoptar la variable debido a que en su clculo no
intervienen todos los valores de la distribucin sino
nicamente los que ocupan las posiciones centrales.

e)

Cuando la distribucin es muy asimtrica, es preferible


como estadstico de tendencia central a la media.

f)

Dados r grupos con sus correspondientes medianas, la


mediana del grupo total es igual o mayor que la mediana
mnima e igual o menor que la mxima.

1.2.1. Clculo de la mediana para pocos datos (no


agrupados en intervalos)
1. Se ordenan las n puntuaciones de menor a mayor.

1.2.4. Media y mediana en distribuciones asimtricas


Si la distribucin es simtrica, media y mediana coincidirn
en el mismo valor.

2.

Una distribucin ser asimtrica positiva cuando la cola de la


distribucin vaya hacia la derecha. En este caso, la mediana
ser menor que la media ya que es ms probable que
encontremos antes el valor que deje por debajo al 50% de la
muestra que el valor medio de la distribucin.

Se suele emplear, por ejemplo, en los clculos


necesarios en el ANOVA.
1.2. Mediana

Para variables cuasi cuantitativas y cuantitativas.

Se observa si el nmero de observaciones n es impar o


par.
-

Si n es impar, la mediana la puntuacin u


observacin que ocupa la posicin central dentro
de ese conjunto de observaciones ya ordenadas.

Si n es par, la mediana es la media aritmtica de los


dos valores centrales de la distribucin.

1.2.2. Clculo de la mediana en datos agrupados en


intervalos
Antes de aplicar la frmula de clculo de la mediana hay que
localizar el intervalo crtico, el cual se corresponde con aqul
intervalo en el que la frecuencia absoluta acumulada na es
igual o superior a n/2. Una vez localizado en intervalo crtico
empleamos la siguiente frmula:

10 |

02. Psicologa Experimental


02.01. Estadstica

Una distribucin ser asimtrica negativa cuando la cola de la


distribucin vaya hacia la izquierda. En este caso ocurrir lo
contrario y nos encontraremos antes el valor medio de la
distribucin que el valor que deja por debajo de s al 50% de
los datos. Es decir, la mediana ser mayor que la media.

(1) La moda a nivel de intervalos o razn (cuantitativa o


cuasi cuantitativa):
a)

Datos no agrupados: es la puntuacin a la que


corresponde la frecuencia mxima, esto es, la
puntuacin que ms se repite (la que tenga
mayor frecuencia absoluta).

b)

Datos agrupados en intervalos: es el punto


medio del intervalo al que corresponde la
frecuencia mxima (intervalo modal).

(2) La moda a nivel ordinal: Es la categora o valor ordinal


al que corresponde la frecuencia mxima.
(3) La moda a nivel nominal (cualitativa): es la modalidad o
categora con la frecuencia mxima.
1.3.1. Propiedades de la moda
1. Es un ndice de clculo sencillo y de fcil interpretacin

1.3.
Moda
(Mo)

P
a
ra variables
cuantitativas.

cualitativas,

cuasi

cuantitativas

La
definic
in de
la
moda
variar
segn
si
la
variable sobre la que se defina se encuentra a un nivel de
medida de intervalos o razn, ordinal o nominal.
Adems, se distingue de la media y la mediana en que no
necesariamente es nica, pues en una distribucin pueden
existir dos o ms modas, segn que a varios valores o
categoras les corresponda una idntica frecuencia mxima.
Si solo existe una moda (es decir, si existe un nico valor con
la
frecue
ncia
mxi
ma),
hablar
emos
de
distrib
uciones unimodales, mientras que si existe ms de una moda
hablaremos de distribuciones multimodales.

2.

De los tres ndices de tendencia central estudiados, la


moda es el nico que, adems de aplicarse a variables
cuantitativas, se puede calcular en variables cualitativas.

3.

Cuando los datos estn agrupados en intervalos y


existen intervalos abiertos, la moda se puede calcular
excepto si el intervalo modal coincide con el intervalo
abierto.

1.4. Apuntamiento o curtosis


La curtosis se refiere al apuntamiento o aplanamiento de la
grfica, lo que tiene su origen en que las frecuencias de la
moda y las de los valores prximos a ella superen en mayor o
menor grado las correspondientes a los restantes valores de
la variable. Por ello, las medidas de apuntamiento o curtosis
tienen significado vlido slo en el caso de distribuciones con
asimetra, tratando de medir la mayor o menor cantidad de
datos que se encuentran prximos a la moda:
-

Si la mayor cantidad de datos agrupados en torno a la


moda (frecuencias altas para valores prximos a la
moda), la grfica ser muy apuntada en esa zona y se
dice que es de tipo leptocrtico.

Si la cantidad de datos prximos a la moda es slo


moderadamente alta con relacin a las dems
frecuencias, entonces se dice que la grfica es de tipo
mesocrtico (p.e., curva normal).

Si la cantidad de datos agrupados en torno a la moda


es slo ligeramente superior al resto de los valores, la
grfica tiende ms al aplanamiento que al
apuntamiento y se dice que es de tipo platicrtico.

Cuando en una distribucin existe mnima variabilidad


significa que los sujetos se mueven todos en un intervalo de
valores muy pequeo, es decir, muchos de los sujetos se
agrupan en torno a la moda (distribucin leptocrtica). Si la
variabilidad es muy grande, los sujetos se distribuyen por un

11 |

02. Psicologa Experimental


02.01. Estadstica

amplio intervalo de valores y el nmero de sujetos en torno a


la moda sera solo ligeramente superior al resto de valores
(distribucin platicrtica).
El grado de apuntamiento de una distribucin estadstica
puede calcularse mediante determinados estadsticos, uno
de los cuales es el coeficiente de apuntamiento de Fisher,
segn el cual:
-

Un valor 0 o muy prximo a 0 implica una


distribucin mesocrtica.

Un valor positivo
leptocrtica.

implica

una

distribucin

Un valor negativo
platicrtica.

implica

una

distribucin

Frmula del coeficiente de apuntamiento de Fisher:

Hoy en da, con el uso de programas informticos


para el anlisis estadstico de los datos, se recomienda,
siempre y cuando sea pertinente, el clculo de los tres
ndices. Cuando las variables son cualitativas nicamente
puede utilizarse la moda. Sin embargo, en el caso de
variables con nivel de medida ordinal, se pueden obtener
tanto la moda como la mediana. Por ltimo, si la variable es
cuantitativa se pueden calcular los tres ndices, lo que implica
que dispondremos de mayor informacin.
Es interesante resaltar que cuando la distribucin de una
variable cuantitativa es simtrica y unimodal, coinciden los
valores de la media, mediana y moda.
2. ESTADSTICOS DE POSICIN: LOS CUANTILES
Las medidas, ndices de posicin o cuantiles informan acerca
de la posicin relativa de un sujeto (o puntuacin
determinada) con respecto a su grupo de referencia dentro
de la distribucin de frecuencias. Es decir, indican la situacin
de una puntuacin con respecto a un grupo, utilizando a ste
como marco de referencia.
Se puede definir tambin como un conjunto de K puntos que
permiten dividir la distribucin en K+1 partes iguales.

1.5. Eleccin de una medida de tendencia central


1. Primera opcin: la media aritmtica porque en ella
estn basadas un gran nmero de estadsticos y tcnicas
estadsticas de gran importancia y de uso frecuente.
nicamente se desaconseja su utilizacin cuando la
distribucin es muy asimtrica con unos pocos valores
extremos que pueden distorsionar su representatividad.
Por ltimo, la media no se puede aplicar:
a.

cuando el nivel de medida de la variable es


nominal u ordinal, y/o

b.
2.

3.

en datos agrupados en los que existen intervalos


abiertos en los extremos de la distribucin.

Segunda opcin: la mediana (cuando la media no se


puede aplicar, o no es recomendable su utilizacin). sta
es ms resistente a los valores extremos que generan
asimetra en la distribucin, se puede obtener en
variables con nivel de medida ordinal, y, adems, se
puede calcular en distribuciones con datos agrupados en
intervalos con intervalos abiertos. Sin embargo, en
ocasiones no se puede obtener la mediana:
a.

cuando el nivel de medida de la variable es


nominal y/o

b.

Cuando con datos agrupados en intervalos, la


mediana se encuentra en el intervalo abierto.

Tercera opcin: la moda (cuando no se puede aplicar la


mediana). Sin embargo, la moda no se puede calcular
cuando la distribucin sea amodal (no tiene moda) o el
intervalo abierto coincide con el intervalo modal.

Los ms conocidos son los cuartiles, deciles y centiles o


percentiles. Todos ellos constituyen una escala ordinal, sin
unidad de medida constante, y, por tanto, no se da igualdad
de diferencia (es decir, la distancia entre el centil 98 y el 99
no es la misma que la distancia entre el 50 y el 51), y en
general las distnacias son mayores en los extremos de la
distribucin que en el centro.
2.1. Cuartiles
Son tres valores de la variable que dividen la distribucin en
cuatro partes de igual frecuencia, cada una de las cuales
supone un 25% del total:
-

Q1: deja por debajo de s al 25% de los sujetos y por


encima al 75%. Se corresponde con el percentil 25 (Q1 =
P25).

Q2: deja por debajo de s al 50% y por encima al otro


50%. Es equivalente al percentil 50 y, por ende, a la
mediana (Q2 = P50 = Md).

Q3: deja por debajo al 75% de los sujetos y por encima


al otro 25%. Se corresponde con el percentil 75 (Q 3 =
P75).

2.2. Deciles
Son nueve valores de la variable que dividen la distribucin
en diez partes iguales de modo que cada parte ser una
dcima o un 10% del total. Se representan por Di, donde i =
1, 2,, 9.
El primer decir, D1, deja por debajo al 10% de los sujetos, D2
al 20%, D3 al 30% y as hasta el D9, que deja por debajo al
90%. As:
D1=P10, D2=P20, D5=P50=Md, D9=P90.
2.3. Percentiles o Centiles
Son los 99 valores de la variable que dividen la distribucin
en 100 partes iguales. El percentil k, denotado por Pk, es un

12 |

02. Psicologa Experimental


02.01. Estadstica

valor de la variable que deja por debajo de s un k% de


sujetos donde k = 1, 2, 99.
El percentil 50, P50, de una distribucin deja por debajo de s
al 50% de los sujetos y por encima al otro 50%, lo que
coincide con la definicin de mediana. De este modo, la
mediana es uno de los 99 posibles percentiles de una
distribucin, en concreto, el P50. Por tanto: Md = Q2 = D5 =
P50.
El percentil ya no es necesariamente un ndice de tendencia
central, pues por ejemplo el percentil 5 se encuentra alejado
de la mediana. Si es, sin embargo, un ndice de posicin, pues
nos indica que proporcin de observaciones se encuentran
por encima y por debajo de una puntuacin dada.
El modo de calcularlo es similar a la frmula de la mediana.
(

calificacin. Si el nmero total de observaciones es 50, el 10%


de observaciones es: (50) (10) / 100 = 5. Si hay que buscar el
intervalo que deje por debajo 5 observaciones, el intervalo
crtico ser [4-6] con na = 9. Aplicando la frmula:
(

P10 corresponde a la calificacin 4.79, la cual deja por debajo


el 10% de las observaciones.
3. ESTADSTICOS DE VARIABILIDAD Y DISPERSIN
La variabilidad o dispersin hace referencia al grado de
variacin que hay en un conjunto de puntuaciones, es decir,
si las puntuaciones se encuentran muy prximas entre s o
muy dispersas. As, es posible encontrar dos grupos con
puntuaciones con idntica media pero con diferente
variabilidad o dispersin. La variabilidad nunca puede ser
negativa, siempre ser .
Se pueden distinguir dos tipos de ndices de variabilidad: los
que miden el grado en el que las puntuaciones se asemejan o
diferencian entre s (amplitud total o rango y amplitud, semiintercuartil) y aquellos en los que la dispersin se mide con
respecto a alguna medida de tendencia central como la
media aritmtica (varianza y desviacin tpica).

Pk = Puntuacin correspondiente al percentil k.


k = Porcentaje de observaciones inferiores a Pk.
Li = Lmite exacto inferior del intervalo crtico.
nd = Frecuencia absoluta acumulada por debajo del intervalo
crtico.
nc = Frecuencia absoluta del intervalo crtico.
I = Amplitud del intervalo crtico.

Intervalo crtico: en el que se encuentra el percentil k. Se


corresponde con aqul en el que la frecuencia acumulada na
es igual o superior a
.

3.1. Desviacin media


Es la media de las diferencias, en valor absoluto (de lo
contrario, el resultado sera 0), de las puntuaciones respecto
a su media aritmtica.
La desviacin media se emplea muy poco en la actualidad,
debido a que es poco manejable matemticamente por el
uso del valor absoluto.

Despejando (para calcular que percentil le corresponde a X


puntuacin):
(

3.2. Varianza o desviacin tpica

Para variables a nivel de intervalos y cuando la


distribucin no es demasiado asimtrica (en caso
contrario es ms apropiado un ndice como la amplitud
semi-intercuartil).

Vemoslo con un ejemplo:


Puntuaciones
X
13-15
10-12
7-9
4-6
1-3

Punto medio
del intervalo
Xi
14
11
8
5
2

Frecuencia
absoluta
ni
10
18
13
7
2
50

Frecuencia
acumulada
na
50
40
22
9
2

Tenemos que calcular el percentil 10 (es decir, aquella


calificacin que deje por debajo el 10% de las observaciones
o el 90% por encima de s). Lo primero que haremos ser
identificar el intervalo crtico, aqul que contenga dicha

En la DM evitbamos que la suma de las diferencias de las


puntuaciones respecto a la media fuera cero utilizando solo
el valor absoluto de dichas diferencias. Otro modo de
obtener otro ndice de dispersin es elevar al cuadrado estas
diferencias, con lo cual se anula el signo de cada diferencia.
As nace la varianza (y tambin la desviacin tpica), conocida
2
por el smbolo S cuando hace referencia a una muestra
2
(estadstico) y como cuando alude a la poblacin
(parmetro).
La varianza, por tanto, se define como el promedio de los
cuadrados de las desviaciones de las puntuaciones con
respecto a la media.

13 |

02. Psicologa Experimental


02.01. Estadstica

De esta frmula se pueden derivar otras expresiones


equivalentes que permiten un clculo ms rpido y sencillo:

3.2.1. Propiedades de la varianza y la desviacin tpica


(1) La varianza y la desviacin tpica nunca son negativas, es
decir, pueden ser iguales o mayores que 0. Son iguales a
cero nicamente si todas las puntuaciones son iguales
entre s, en cuyo caso no habra variabilidad o dispersin
en los datos. En el resto de los casos la varianza y la
desviacin tpica son positivas, siendo sus valores
mayores a medida que aumenta la variabilidad de las
puntuaciones.
(2) El clculo de la varianza y la desviacin tpica, a
diferencia de otros ndices de dispersin, requieren el
uso de todas las puntuaciones observadas en la
distribucin.

Es importante darse cuenta de que, para el clculo de la


varianza, primero se elevan al cuadrado las diferencias y
despus se obtiene el promedio de esas desviaciones al
cuadrado.
Por otra parte, cuando los datos se presentan en tablas de
distribucin de frecuencias agrupados o sin agrupar en
intervalos, la varianza se puede obtener utilizando las dos
expresiones equivalentes siguientes:
-

Distribucin de frecuencias absolutas:

Distribucin de frecuencias relativas:

(3) La varianza y la desviacin tpica miden la variabilidad de


los datos con respecto a la media aritmtica, por lo que
nicamente deben aplicarse si estamos utilizando la
media como medida de tendencia central.
(4) Si a las puntuaciones de la variable X les aplicamos la
siguiente transformacin lineal: Yi = bXi + a, la varianza
2
2
2
de las nuevas puntuaciones y ser SY = b SX y la
desviacin tpica igual a SY = |b|SX. Es decir, si a una
variable X se le suma o resta una constante a, la varianza
y desviacin tpica de la variable original no se ven
afectadas y siguen siendo las mismas. En cambio,
cuando multiplicamos los valores de X por una
constante b, la varianza queda multiplicada por la
constante al cuadrado y la desviacin tpica por el valor
absoluto de dicha constante.
(5) La desviacin tpica viene expresada en las mismas
unidades que los datos. Si tenemos una distribucin
cuyas puntuaciones expresan distancia en metros, la
deviacin tpica nos vendr dada en metros. No as con
la varianza, que vendra expresada en metros
cuadrados.
(6) La varianza total de un grupo de puntuaciones, cuando
se conocen los tamaos, las medias, las varianzas de
varios subgrupos hechos a partir del grupo total,
mutuamente exclusivos y exhaustivos, puede obtenerse
sumando la media (ponderada) de las varianzas y la
varianza (ponderada) de las medias. Es decir:

Como se puede observar, la varianza, al basarse en


diferencias al cuadrado, es un nmero positivo que se
expresa en las unidades de la variable al cuadrado. Con el fin
de lograr una medida de dispersin en las mismas unidades
que la variable y que sea ms fcilmente interpretable, se
calcula la raz cuadrada de la varianza y se obtiene un ndice
que se denomina desviacin tpica:

(7) El porcentaje de puntuaciones que quedan entre la


media +/- k desviaciones tpicas es, como mnimo, el [1
2
(1/k ) 100] de las observaciones. Esta propiedad es
conocida como desigualdad de Tchebychev, ya que
recoge el hecho de que las distancias menores hasta la
media son ms frecuentes que las distancias mayores.
Aplicando la frmula tenemos que, como mnimo, entre
la media +/- de dos desviaciones tpicas se encuentran el
75% de la muestra, y entre tres se encuentra al menos el
88.9% de los datos.
3.3. Coeficiente de variacin
Cuando se trata de comparar la dispersin de dos conjuntos
de datos, los anteriores ndices son problemticos en dos
sentidos:

14 |

02. Psicologa Experimental


02.01. Estadstica

1)

Si comparamos las variabilidades de dos variables


distintas, definidas sobre un grupo de sujetos, sus
respectivas desviaciones tpicas vendrn expresadas
cada una en unidades de medida diferentes (por
ejemplo, peso y altura), con lo cual no ser posible
compararlas.

2)

Otra dificultad surge cuando, aun siendo la misma


variable, los dos conjuntos cuyas variabilidades
queremos comparar poseen medias muy diferentes.
P.e., la desviacin tpica de un grupo de recin nacidos
puede ser de 0,5 kg., mientras que la de un grupo de
nios de primero de educacin primaria pueden estar
en torno a 5 kg. Cul de los dos grupos tiene mayor
variabilidad? No podemos saberlo mediante la
desviacin tpica.

Para soslayar estas dificultades dividimos las desviaciones


tpicas de los grupos que queremos comparar por sus
respectivas medias.
Para paliar este inconveniente es necesario definir un ndice
de variabilidad relativa que no dependa de las unidades de
medida. Un coeficiente que cumple con estos requisitos es el
coeficiente de variacin, que se expresa en porcentajes y
consiste en dividir las desviaciones tpicas de los grupos por
sus respectivas medias:

3.4. Amplitud total


Tambin denominado rango o recorrido de las
observaciones, la amplitud total Ar es la distancia que hay en
la escala numrica entre los valores que representan la
puntuacin mxima y la puntuacin mnima, es decir, la
diferencia entre la puntuacin mxima y la mnima: AT = Xmx
Xmn.
Aunque tambin puede venir expresada como la diferencia
entre la puntuacin mxima y la mnima ms una unidad, en
el caso de que se consideren las puntuaciones como
intervalos elementales. Por ejemplo, dadas las puntuaciones
20, 32, 50, 61, 73, la AT puede ser la diferencia entre la
puntuacin mxima (73) y la mnima (20), esto es, (53);
aunque tambin es vlido considerar las puntuaciones como
intervalos elementales de amplitud una unidad y entonces
calcular la amplitud total restando los lmites exactos: LS LI:
(73,5 19,5 = 54).
En el caso de que las puntuaciones se agrupen en intervalos
(es decir, intervalos compuestos o de ms de una unidad de
amplitud), la amplitud total ser la diferencia entre el punto
medio del intervalo mximo y el punto medio del intervalo
mnimo. Ahora bien, aqu la amplitud total tambin puede
calcularse mediante la diferencia entre el lmite exacto
superior del intervalo mximo y el lmite exacto inferior del
intervalo mnimo.
Una de las caractersticas de la AT como ndice de dispersin
es que si las puntuaciones mxima y mnima permanecen
constantes pero varan las intermedias, la AT no variar pero
s lo har la varianza y la desviacin media.

El coeficiente de variacin est definido para variables con

y es recomendable que su resultado se acompae de


la media y desviacin tpica de la distribucin a partir de las
cuales ha sido calculado.
Es importante resaltar que cuando comparamos dos
conjuntos de puntuaciones obtenidas de la misma variable,
tambin es necesario el coeficiente de variacin para
comparar la dispersin de ambas distribuciones.
nicamente es posible utilizar la desviacin tpica cuando la
media de ambos grupos es la misma, y, en ese caso,
llegaramos a las mismas conclusiones con ambos ndices.
3.3.1. Propiedades del coeficiente de Variacin
(1) Si a cada una de las puntuaciones de un conjunto se le
suma una cantidad positiva, el CV disminuir, pues la DT
se mantendr constante, pero la media aumentar en
esa cantidad. Por tanto, el cociente disminuir ya que la
media constituye su denominador. Por el contrario, si se
lleva a cabo una resta, el CV aumentar.
(2) Si a cada una de las puntuaciones de un conjunto se las
multiplica por una constante positiva, el CV no se
alterar, pues el numerador (DT) y el denominador (la
media) quedarn multiplicados por la misma cantidad.
(3) El CV podra ser tericamente negativo, pues la media
es, en algunos casos, un valor negativo, No obstante, por
definicin, se tomar el valor absoluto, pues ningn
estadstico de dispersin tiene sentido como valor
negativo.

Es un ndice muy sensible a los valores extremos de la


distribucin, por lo que no captura la poca o mucha
dispersin que pueda existir entre los restantes alores.
3.5. Amplitud (o rango) semi-intercuartil

Variables a nivel ordinal como mnimo.


Es un ndice resistente a la asimetra de la distribucin que se
utilizara junto con la mediana, sera la amplitud semiintercuartil, aunque es menos sensible que la DM y la DT a la
variacin de los datos.
Es la mitad de la distancia entre el tercer y el primer cuartil.
Para hallarlo utilizamos el 50% central de los datos y lo
dividimos por la mitad.

Como se puede observar, este ndice no informa de la


variabilidad del conjunto de puntuaciones, sino del 50% de
las mismas comprendidas entre el percentil 25 y el 75 de la
distribucin.
En Psicologa, en concreto, en la construccin de escalas de
actitudes, la amplitud intercuartil (P75-P25), se ha utilizado
profusamente en aquellos procedimientos de seleccin de
tems en los que se tiene en cuenta la valoracin de jueces o
expertos en la materia.

15 |

02. Psicologa Experimental


02.01. Estadstica

4. PUNTUACIONES DIRECTAS, DIFERENCIALES Y TPICAS


4.1. Puntuacin Directa
Es la puntuacin que resulta de aplicar la escala de medida
correspondiente a una variable. Hasta ahora, todos los
ejemplos que hemos presentado se han basado en este tipo
de puntuaciones. En estadstica se representan por letras
latinas maysculas. Una puntuacin expresada en su forma
directa no nos permite conocerla en relacin al resto de las
puntuaciones.

Propiedades de las puntuaciones tpicas:

4.2. Puntuacin Diferencial


. En
Es la puntuacin directa menos la media:
estadstica suele representarse por una letra latina
minscula.

(3) Si multiplicamos las puntuaciones tpicas por una


constante A y sumamos a esos productos otra constante
B, las nuevas puntuaciones tendrn como media B y
como desviacin tpica |A|.

Esta transformacin a puntuaciones diferenciales s que


permite conocer cmo se encuentra una puntuacin respecto
a las dems, pues si la puntuacin diferencial que se obtiene
es positiva, entonces la puntuacin directa que ha originado
la diferencial se encuentra por encima de la media; si por el
contrario es negativa, la puntuacin directa estar por debajo
de la media. Si la puntuacin diferencial fuese cero,
significara que puntuacin directa y media coinciden. As, si
un sujeto obtiene una puntuacin diferencial de 2, significa
que est dos puntos por encima de la media, mientras que si
tiene una puntuacin diferencial de -2, significar que el
sujeto est 2 puntos por debajo.
Propiedades:
(1) Su media es cero: = 0.
(2) La varianza y la desviacin tpica de las puntuaciones
diferenciales es igual a la varianza y a la desviacin
tpica de las puntuaciones directas:
4.3. Puntuacin tpica
Las puntuaciones diferenciales que acabamos de ver tienen
un inconveniente y es que dos puntuaciones diferenciales
idnticas pueden tener un significado muy diferente en
funcin de la media y de la varianza de las distribuciones de
las que proceden. Para eliminar este inconveniente se utilizan
las puntuaciones tpicas. Las puntuaciones tpicas van ms
all y nos permiten no slo comparar las puntuaciones de un
sujeto en dos variables distintas sino tambin comparar dos
sujetos distintos en dos pruebas o variables distintas. Es
decir, las puntuaciones tpicas nos indican cuntas
desviaciones tpicas se separa el sujeto de la media de la
muestra a la que pertenece, por lo que es la calificacin
estndar ms elemental y til. As, una puntuacin tpica de 2
quiere decir que el sujeto se encuentra dos desviaciones
tpicas por encima de la media.
Al proceso de obtener puntuaciones tpicas se llama
tipificacin, por este motivo estas puntuaciones se
denominan tambin tipificadas.
Las puntuaciones tpicas reflejan las relaciones entre las
puntuaciones con independencia de la unidad de medida. Por
este motivo permiten hacer comparaciones entre distintos
grupos e incluso entre distintas variables.
La puntuacin tpica (z) se obtiene dividiendo la puntuacin
diferencial por la desviacin tpica:

(1) Su media es cero: = 0.


(2) Su varianza y su desviacin tpica es igual a 1.

4.4. Otras transformaciones de las puntuaciones


La transformacin a puntuaciones tpicas representa la
transformacin lineal de las puntuaciones ms comn. No
supone una alteracin de la distribucin original de las
puntuaciones, ya que la respeta: si la distribucin original era
normal, permanece as despus de la transformacin; si era
sesgada positiva o negativamente, platicrtica o multimodal,
estas caractersticas tambin se mantienen despus de la
transformacin.
4.4.1. Puntuaciones tpicas derivadas o transformadas
Una vez realizada la transformacin a puntuaciones tpicas,
stas pueden transformarse de nuevo linealmente a una
nueva escala con media y desviacin tpica fijadas por el
usuario del test. Si a un conjunto de puntuaciones tpicas les
aplicamos una transformacin lineal admisible, obtendremos
un segundo tipo de puntuaciones tpicas derivadas o
transformadas. La transformacin aplicada es:

Al tratarse de una transformacin lineal, respeta la


distribucin original en la que estaban las puntuaciones
directas.
El usuario del test puede fijar arbitrariamente la media y la
desviacin tpica deseadas; sin embargo, hay una serie de
escalas lineales derivadas de amplio uso. Por ejemplo, de
este procedimiento se derivan las puntuaciones T como una
transformacin lineal de las puntuaciones tpicas, en la que la
media es 50 y la DT 10. Las puntuaciones de CI, asimismo,
suelen tener una media 100 y una DT de 15 o 16.
4.4.2. Transformaciones no lineales
Estas transformaciones s alteran
distribuciones originales.

la

forma

de

las

Una de estas transformaciones seran los rangos percentiles,


escala muy utilizada para comunicar los resultados de los
tests normativos a los no expertos. Ya que las escalas de
percentiles son una transformacin no lineal de la
distribucin original, no constituyen una escala de intervalos,
lo que implica que en diferentes regiones de la escala de
puntuaciones directas una diferencia de un punto puede
corresponder a diferencias de magnitudes diferentes en la
escala de rangos percentiles, su distribucin es desigual
(sobre todo en los extremos). Por ello no deben realizarse
clculos aritmticos ni estadsticos tales como medias o
comparaciones de grupos con puntuaciones en escala de
rangos percentiles (ni compararlas si se han obtenido en
diferentes pruebas).

16 |

02. Psicologa Experimental


02.01. Estadstica

La segunda transformacin no lineal posible es la


normalizacin. Las distribuciones de puntuaciones directas y
sus transformaciones lineales dependen de ciertas
caractersticas del instrumento de medida empleado y por
ello suele ser conveniente transformar la escala a algn otro
sistema de puntuaciones o de unidades independiente de las
caractersticas del instrumento de medida utilizado y en
cierto sentido igualmente espaciadas: la distribucin normal.
Esta normalizacin es especialmente aconsejable si el rasgo
psicolgico medido se distribuye normalmente en la
poblacin. Las puntuaciones tpicas normalizadas diferirn de
las tpicas lineales ms o menos, segn la desviacin de la
normalidad de la distribucin original. Estas puntuaciones
tpicas normalizadas se basan en los percentiles: a partir del
percentil correspondiente a una puntuacin, se obtiene la
puntuacin z correspondiente en la distribucin normal. Por
ejemplo, si en una determinada distribucin de
puntuaciones, la puntuacin 7 supone un P40 ya que deja por
debajo al 40% de los datos, habr que buscar la puntuacin
tpica normal que se corresponda con una p = 0.40, que es z n
= -0,25.
Basndonos en las puntuaciones tpicas normalizadas,
pueden realizarse nuevas transformaciones lineales fijando
previamente la media y la DT de la escala deseada,
obteniendo as puntuaciones tpicas normalizadas derivadas.
Entre las escalas normalizadas derivadas ms comunes se
encuentra la Escala de eneatipos o estaninos. Los eneatipos o
estaninos son una transformacin lineal de puntuaciones
tpicas normalizadas, con una media % y una DT aproximada
de 2, tal que: Eneatipo = 2 zn+5.
Esta escala solo admite valores enteros entre 1 y 9, y tiene
porcentajes preasignados basados en la distribucin normal,
divididos en intervalos con amplitud correspondiente a
desviacin tpica, excepto los dos extremos que son abiertos.
4.5. Interpretacin de puntuaciones directas, diferenciales y
tpicas
Una persona obtiene una calificacin en examen tipo test de
40 puntos (puntuacin directa). Apenas podemos decir nada
de esta persona en relacin a su grupo de referencia. Ahora
bien, si calculamos la media y restamos a la puntuacin
directa sta ltima, obtenemos una puntuacin diferencial.
Supongamos que la media es 30, entonces la puntuacin
diferencial de ese alumno ser de 10; al ser positiva nos
informa de que nuestro alumno tiene una calificacin que es
superior a la media de sus compaeros. Ahora bien, es muy
superior a la media o slo ligeramente superior? Si la mayora
de sus compaeros se desvan de la media en 10 o ms
puntos (hay una alta variabilidad), el mrito de este alumno
es modesto. Pero si la mayora se sitan en torno a la media
(poca variabilidad), entonces este alumno ha destacado. La
puntuacin tpica nos permite un juicio objetivo sobre cunto
se aparta una puntuacin respecto de la media en relacin al
resto de puntuaciones. Si en el ejemplo la DT fuese (10), la
puntuacin tpica de nuestro alumno sera (10/10=1), lo cual
significa que este alumno se sita respecto a sus compaeros
a una DT (o a una unidad tpica) por encima de la media.
El uso de puntuaciones tpicas tambin tiene otras ventajas.
Supongamos que el anterior examen lo hemos pasado a dos
grupos de alumnos muy distintos. Ambos obtienen medias y
DT muy diferentes entre s, con lo que resultara muy difcil

comparar las puntuaciones de ambos grupos. Un modo de


solucionarlo es expresar las puntuaciones de ambos grupos
en puntuaciones tpicas. En la medida que la media de
puntuaciones tpicas vale cero y la DT de las mismas 1,
tendremos dos distribuciones con idntica media y DT, lo cual
facilitar la comparacin. Por otra parte, la unidad tpica es
un nmero abstracto sin los problemas de unidad de medida
que dificultan la comparacin entre diferentes
caractersticas.
De lo anterior no se debe deducir necesariamente que dos
puntuaciones tpicas, cada una de un grupo distinto,
signifiquen exactamente lo mismo, pues detrs de cada una
de ellas habr puntuaciones directas probablemente distintas
y percentiles diferentes (cada una podr dejar por debajo
distintos porcentajes de sujetos). No obstante, en psicologa
ocurre que la mayora de las caractersticas se distribuyen
normalmente (las representaciones grficas de las
distribuciones de frecuencias se asemejan a la curva normal o
campana de Gauss), de modo que cuando transformamos en
tpicas las puntuaciones de dos grupos, podemos considerar
que, a idnticas puntuaciones tpicas, se corresponden
idnticos porcentajes de observaciones por debajo o por
encima de las mismas.
4.5.1. La curva normal
Si construimos un test de inteligencia y lo aplicamos a una
poblacin de sujetos, lo ms probable es que la distribucin
de las puntuaciones obtenidas en el test por dicha poblacin
adquiera, en su representacin grfica, la forma de la
campana de Gauss o curva normal. Toda distribucin tiene
las siguientes caractersticas bsicas:
(1) Tiene un nico punto mximo, para X = .
(2) Tiene dos puntos de inflexin:
o

X=-

X=+

(3) Se acerca asintticamente al eje de abscisas, esto es, se


acerca ms y ms a ese eje, tanto por la derecha como
por la izquierda, sin llegar a tocarlo en ningn punto
finito.
(4) La distribucin normal se caracteriza por ser simtrica
respecto al eje vertical que pasa por la media. Su
mediana divide su representacin grfica de modo que
una de las reas es reflejo de la otra, como si la
mediana fuese un espejo. En toda distribucin
simtrica la mediana y la media coinciden. En el caso de
la curva normal, la mediana y la media coinciden
adems con la moda por ser sta una distribucin
unimodal.

17 |

02. Psicologa Experimental


02.01. Estadstica

TEMA 4 ESTADSTICA DESCRIPTIVA APLICADA AL ESTUDIO


DE DOS VARIABLES

2
3
4
5

1. INTRODUCCIN
Dos variables estn relacionadas entre s, cuando ciertos
valores de una de las variables se asocian con ciertos valores
de la otra variable.

8
10
12
16
50

4
7
8
10
35

32
70
96
160
382

2. RELACIN LINEAL ENTRE DOS VV CUANTITATIVAS


(Para entender mejor las explicaciones, presentamos el
ejemplo sobre el que se van a realizar las elaboraciones de
este apartado y del apartado de la recta de regresin).
Sea la variable X la puntuacin obtenida en un test de
razonamiento numrico y sea la variable Y la calificacin
obtenida en la asignatura de matemticas.
Nio
1
2
3
4
5

X
4
8
10
12
16

Y
6
4
7
8
10

2.1. Representacin grfica


Para representar 2 VV cuantitativas se emplea el diagrama de
dispersin o nube de puntos.

El signo, positivo o negativo, de la covarianza nos indica si la


relacin lineal entre ambas variables es directa o inversa:
-

Relacin lineal directa: es la que asume que a


valores mayores en una de las VV, corresponden
tambin valores mayores en la otra VV y los valores
menores en una VV se corresponden con los
valores menores en la otra VV. SIGNO POSITIVO
Relacin lineal inversa: es la que asume que a
valores mayores en una de las VV, corresponden
valores menores en la otra VV y viceversa. SIGNO
NEGATIVO

Problema de la covarianza: desconocemos el rango de la


covarianza. En este caso son los valores mximos y mnimos
que pueda tener. Para evitar este problema disponemos del
r
Coeficiente de Correlacin de Pearson, XY.
2.3. Coeficiente de Correlacin de Pearson
Aplicar el coeficiente de correlacin de Pearson exige que las
variables estn medidas al menos en una escala de
intervalos y que se d una relacin lineal entre ellas. Es decir,
que los puntos del diagrama de dispersin se posicionen en la
forma aproximada de una lnea recta.

En general, a medida que aumentan las puntuaciones en el


test (variable X) aumentan tambin las calificaciones en
matemticas (variable Y).
2.2. Covarianza
La covarianza es un primer ndice, que nos permitir estudiar
esa posible relacin entre X e Y. El trmino covarianza hace
referencia a la variacin conjunta de dos variables, y tanto
por su definicin como por su clculo, es un ndice que
cuantifica la variabilidad conjunta de dos variables.
Se designa por Cov (X,Y), o por SXY. Se define as:

Es decir, el coeficiente de correlacin de Pearson es el


cociente entre la covarianza entre X e Y y el producto de la
desviacin tpica de X y la desviacin tpica de Y. Las
desviaciones tpicas de X e Y son, respectivamente, 4 y 2.
Siguiendo con los mismos datos de la tabla del ejemplo 4.3, y
calculadas las desviaciones tpicas de las variables X e Y,
como ya sabemos:

Aplicando la frmula a los datos del ejemplo, elaboramos la


siguiente tabla:
Nio
1

X
4

Y
6

XY
24

Frmula alternativa:

18 |

02. Psicologa Experimental


02.01. Estadstica
Existen 4 situaciones posibles que nos podemos encontrar
cuando analizamos la relacin entre dos variables
cuantitativas:
1)

Coeficiente Positivo: Relacin lineal Directa

2)

Coeficiente Negativo: Relacin lineal Inversa

3)

Coeficiente de valor cercano a 0: no existe correlacin


lineal

4)

Coeficiente de valor cercano a 0: no existe correlacin


lineal pero s existen una relacin CURVILINEA

Propiedades:
1)

2)
3)

1 rXY 1. Es decir, slo toma valores comprendidos


entre 1 y 1. Valdr 0 cuando no exista relacin lineal
entre X e Y.
rXY = 1, si una VV es una transformacin lineal de la
otra.
La transformacin lineal de las variables no modifica el
valor del coeficiente de correlacin, aunque s podra
cambiar su signo. Es decir, si calculamos la correlacin
entre las variables X e Y, el valor de sta ser, en valor
absoluto, el mismo que obtengamos entre la variable
aX+b, donde a y b son constantes.

Caractersticas:
1.
2.

3.

4.

5.

Su valor es independiente de cualquier unidad usada


para medir las variables.
Su valor se altera de forma importante ante la presencia
de un valor extremo, como sucede con la desviacin
tpica. Ante estas situaciones conviene realizar una
transformacin de datos que cambia la escala de
medicin y modera el efecto de valores extremos (como
la transformacin logartmica).
Mide solo la relacin con una lnea recta. Dos variables
pueden tener una relacin curvilnea fuerte, a pesar de
que su correlacin sea pequea. Por tanto cuando
analicemos las relaciones entre dos variables debemos
representarlas grficamente y posteriormente calcular
el coeficiente de correlacin.
No se debe extrapolar ms all del rango de valores
observado de las variables a estudio ya que la relacin
existente entre X e Y puede cambiar fuera de dicho
rango.
La correlacin no implica causalidad. La causalidad es un
juicio de valor que requiere ms informacin que un
simple valor cuantitativo de un coeficiente de
correlacin.

Interpretacin de los resultados:


1)

2)

En 1 lugar hay que tener en cuenta el valor absoluto.


Cuanto mayor es el valor absoluto el coeficiente nos
est indicando que la relacin lineal entre las dos
variables es ms fuerte.
En 2 lugar hay que tener en cuenta el signo del
coeficiente de correlacin de Pearson.
- Signo positivo: indica que a valores mayores de la
VV X tienden a corresponder, en media, valores
mayores de la VV Y, y a valores menores de la
variable X tienden a corresponder, en media,
valores menores de la variable Y. RELACIN
DIRECTA.
- Signo negativo: indica que a valores mayores de la
VV X tiene den a corresponder, en media, valores
menores de la VV Y, y a valores menores de la
variable X tienden a corresponder, en media,
valores mayores de la variable Y. RELACIN
INVERSA.

Esto nos indica una limitacin importante del coeficiente de


correlacin lineal: slo detecta relaciones lineales entre 2
VV. Por tanto, un coeficiente de correlacin lineal cercano a
cero, indica que no existe relacin lineal entre las VV, pero no
excluye la posibilidad de que las variables tengan otras
relaciones entre s de carcter no lineal.
Para analizar los valores de los coeficientes de correlacin de
Pearson que elaboremos, tenemos que tener en cuenta que

19 |

02. Psicologa Experimental


02.01. Estadstica

no tienen una comparacin directa entre resultados de


estudios diferentes. Sabemos que rXY = 1 indica la
correlacin lineal perfecta en cualquier caso, y que rXY = 0
indica la ausencia total de correlacin lineal.
Es menos clara la situacin, cuando nos encontramos con un
valor intermedio cualquiera, por ejemplo, 0,55. No se puede
afirmar que ese valor indica correlacin alta, o baja. Depende
del tipo de datos que estemos analizando. Ser baja si se
trata de dos test similares que estemos aplicando a los
mismos sujetos o si tenemos pocos sujetos. Podra ser muy
alta, si se trata de tests bastante diferenciados entre s, o si
tenemos muchos sujetos. Un nmero grande de sujetos en la
muestra pueden tender a bajar el valor de los coeficientes de
correlacin que se obtienen.
Los resultados de otros investigadores, con variables
similares y muestras equivalentes, son los que nos sirven de
comparacin para evaluar los resultados que obtengamos
con nuestros datos. El coeficiente de correlacin evaluado
por nosotros ser bajo, si los coeficientes de correlacin que
obtienen otros investigadores en circunstancias similares son
mucho ms altos. Y lo mismo se puede afirmar en la direccin
contraria. Si nosotros obtenemos unos coeficientes de
correlacin mucho mayores que los encontrados por otros
investigadores en circunstancias similares, los nuestros sern
muy elevados.

Esta recta pasa por el punto ( ), cuyas coordenadas son


(10,7).
Puntuaciones pronosticadas: puntuaciones, Yi, obtenidas
mediante la recta de regresin.
Error (Ei): diferencia entre la puntuacin real o verdadera, Yi,
y su pronstico, Yi.
Propiedades:
1)
2)
3)

Otro aspecto ms complejo es fundamentar la causalidad en


un coeficiente de correlacin. Cuando existe un coeficiente
de correlacin elevado entre dos variables, no se puede
afirmar que una de las variables es causa de la otra, ya que
hay muchas VV que evolucionan conjuntamente. Es decir, no
se debe confundir la relacin de causalidad con la relacin
entre VV.
2.4. Recta de regresin
Cuando existe una relacin lineal podemos utilizar la
denominada recta de regresin para efectuar pronsticos de
los valores de una VV a partir de la otra VV.
La ecuacin de la recta de regresin permite pronosticar la
puntuacin que alcanzar cada sujeto en una variable Y
conociendo su puntuacin en otra variable X. A la variable Y
se le denomina criterio y a la variable X predictor.
La ecuacin general de una recta es de la forma: Y = a + bX,
donde b es la pendiente y a es la ordenada en el origen.

La media de los errores es 0 (porque el total del error


tambin es 0).
La media de las puntuaciones pronosticadas coincide
con la media de las verdaderas puntuaciones en Y.
La varianza de las puntuaciones en Y es igual a la suma
de la varianza de los pronsticos, ms la varianza de los
errores, que representaremos por

2.5. Coeficiente de determinacin (R2)


Una vez ajustada la recta de regresin a la nube de
observaciones es importante disponer de una medida que
mida la bondad del ajuste realizado y que permita decidir si
el ajuste lineal es suficiente o se deben buscar modelos
alternativos.
Como medida de bondad del ajuste se utiliza el coeficiente de
determinacin, que es el cuadrado del coeficiente de
correlacin de Pearson, y da la proporcin de variacin de la
variable Y que es explicada por la variable X (variable
predictora o explicativa).
Es usual expresar esta medida en tanto por ciento,
multiplicndola por cien. Si la proporcin es igual a 0,
significa que la variable predictora tiene NULA capacidad
predictiva de la variable a predecir (Y). Cuanto mayor sea la
proporcin, mejor ser la prediccin. Si llegara a ser igual a 1
la variable predictora explicara TODA la variacin de Y, y las
predicciones NO tendran error.
Propiedades:
1)
2)
3)
4)

Su valor oscila entre 0 y 1.


Cuando hay una buena correlacin lineal, R2 es muy
cercano a 1.
Cuando no hay correlacin o bien sta no es lineal, R2 es
bajo e incluso cercano a 0.
R2 es igual a la proporcin de la Varianza explicada (s2y)
respeto de la Varianza total (s2y).

3. RELACIN CURVILINEA ENTRE 2 VARIABLES

20 |

02. Psicologa Experimental


02.01. Estadstica

Cuando la relacin entre 2 variables es curvilnea no es


razonable calcular el coeficiente de Pearson, ya que mide la
relacin lineal. Para estos casos se ha de utilizar la razn de
correlacin de Y sobre X (YX). Esta ecuacin solo es
adecuada para el caso de VV cuantitativas que mantengan
una relacin curvilnea.
Propiedades:
1.
2.
3.

4.

YX R .
2
YX es igual o mayor que 0 o menor o igual que 1.
2
2
La diferencia YX rYX mide el grado de alejamiento
mayor o menor que unos datos de la linealidad. Cuanto
mayor sea la diferencia, menos lineales son los datos. O
2
2,
lo que es lo mismo, cuanto ms prximos sean y r la
relacin entre X e Y ser ms lineal.
YX es tomada como positiva.

4. RELACIN ENTRE 2 VV CUALITATIVAS (o nominales)

S-ar putea să vă placă și