Sunteți pe pagina 1din 8

1

UNIVERSIDAD NACIONAL DE PIURA


ESCUELA DE POSTGRADO
UNIDAD: FCULTAD DE CIENCIAS SOCIALES Y EDUCACIÓN
PROGRAMA: DOCTORADO EN CIENCIAS DE LA EDUCACIÓN

TRABAJO ENCARGADO Nº 1

TESIS III: Elaboración y Validación de Instrumentos de Recolección de Datos


Dr. César Haro Díaz

TEMA: CORRELACIÓN.

La relación entre dos variables nos conduce a un nuevo concepto: correlación. Ésta puede ser
representada en diagramas de dispersión e informa acerca de la forma, dirección e intensidad de
la relación entre dos variables.

En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos
variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las
notas de la asignatura Estadística I y las de Matemáticas I. Una primera aproximación al
problema consistiría en dibujar en el plano R 2 un punto por cada alumno: la primera coordenada
de cada punto sería su nota en estadística, mientras que la segunda sería su nota en matemáticas.
Así, obtendríamos una nube de puntos la cual podría indicarnos visualmente la existencia o no
de algún tipo de relación (lineal, parabólica, exponencial, etc.) entre ambas notas. En particular,
nos interesa cuantificar la intensidad de la relación lineal entre dos variables.

La intensidad de la relación se manifiesta en la dispersión de los datos en torno a la línea (recta


de regresión) y suele expresarse mediante valores de coeficientes de correlación que oscilan
entre –1 y 1 pasando por 0. Valores cercanos a 0 denotan ausencia de correlación y, por ende,
independencia, valores cercanos a –1 ó 1 indican una correlación de gran intensidad y, por tanto,
una fuerte relación.

1. El coeficiente de correlación de Pearson.

En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El
coeficiente que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r,
cuyo valor oscila entre –1 y +1.

El coeficiente de correlación de Pearson ( r ), se calcula a partir de las puntuaciones obtenidas en


una muestra en dos variables. Se relacionan las puntuaciones obtenidas de una variable con las
puntuaciones obtenidas de otra variable, en los mismos sujetos.

n n n
n xi y i  ( xi )( y i )
r i 1 i i 1

 n n
2 
n n
2
  i  i    i  yi ) 
 
2 2
n x ( x ) n y (
 i 1 i 1   i 1 i 1 

El coeficiente r de Pearson puede variar de –1.00 a + 1.00 donde:


2

-1.00 = Correlación negativa prefecta.


- 0.90 = Correlación negativa muy fuerte.
- 0.75 = Correlación negativa considerable.
- 0.50 = Correlación negativa media.
- 0.10 = Correlación negativa débil.
0.00 = No existe correlación alguna entre las variables.
+0.10 = Correlación positiva débil.
+0.50 = Correlación positiva media.
+0.75 = Correlación positiva considerable.
+0.90 = Correlación positiva muy fuerte.
+1.00 = Correlación positiva prefecta.

El signo indica la dirección de la correlación (positiva o negativa) y el valor numérico, la


magnitud de la correlación. Si bien, el coeficiente de correlación de Pearson es el coeficiente de
su modalidad más usado, su utilización está sujeta a dos condiciones imprescindible: las dos
variables tienen que estar medidas en un nivel por intervalos o de razón, y además se debe
cumplir el supuesto de normalidad en la distribución de tales valores.

Para el cálculo del coeficiente de correlación r, en si no considera a una variable como


independiente y a otra como dependiente, ya que no evalúa la causalidad. La noción de causa-
efecto (independiente-dependiente) se puede establecer teóricamente.

El diagrama de dispersión. Es un gráfico que permite detectar la existencia de una relación


entre dos variables. Si la tendencia es lineal se puede ajustar una línea recta al diagrama de
dispersión.

• •
• • •
• • • • •
• • • • •
• • •
•• •••
X X X

• Y Y
•••• • • • • ••
• • •• ••• • • •
• • • •• • •
• •• • • • • ••
•• •• ••

• ••
X X X
(d) Curvilínea inversa (e) Lineal inversa con (f) Ninguna relación
más dispersión

Fig. 1. Diagramas de dispersión: Relaciones entre X e Y.


3
En las figuras (a), (b) y (e) los datos visualizan una relación lineal entre las variables X e Y. En
las figuras (c) y (d) los datos visualizan una relación, pero, una relación no lineal, y en la figura
(f) los datos visualizan ninguna relación válida entre las variables.

Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la


correlación tiende a ser lineal directa (mayores valores de X significan mayores valores de Y), y
se aproxima a –1 cuando la correlación tiende a ser lineal inversa. ¡Atención!: si no hay
correlación de ningún tipo entre dos variables aleatorias, entonces tampoco habrá correlación
lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo nos dice que no hay correlación
lineal, pero puede que la haya de otro tipo.

Ejemplo 1. Imaginemos que un licenciado en Psicopedagogía desea averiguar qué relación


existe entre el número de horas de estudio el fin de semana previo a un examen y las
calificaciones obtenidas en el mismo. Para ello examina el caso de diez alumnos que dicen
haber estudiado las siguientes horas habiendo obtenido también las siguientes calificaciones.

Horas de estudio (X) Calificaciones (Y)


2 6
2 6
3 6
4 8
5 10
6 14
7 14
7 14
9 16
10 18

La relación que pueden guardar ambas variables puede determinarse mediante el coeficiente
de correlación de Pearson. Para ello es condición indispensable que ambas variables estén
medidas en escala de intervalo (se cumple dicho supuesto). Por tanto, sólo queda aplicar la
ecuación antes propuesta. Organicemos los datos de la siguiente forma:

X Y X2 Y2 XY
2 6 4 36 12
2 6 4 36 12
3 6 9 36 18
4 8 16 64 32
5 10 25 100 50
6 14 36 196 84
7 14 49 196 98
7 14 49 196 98
9 16 81 256 144
10 18 100 324 180
ƩX =55 ƩY = 112 ƩX2 = 373 2
ƩY = 1440 ƩXY = 728

Sustituyendo cada miembro por su valor tendríamos, en la fórmula:


4
n n n
n xi yi  ( xi )( yi )
10  728   55  112
r i 1 i i 1

 n 2 n
2 
n n
 10  373  (55) 10  1440  (112 ) 
2 2

 n 
 i 1
xi  ( 
i 1
xi )  n 
  i 1
y 2
i  ( 
i 1
yi ) 2 

1120
  0.979
1143 .88

Interpretación del coeficiente obtenido:

1. En primer lugar la correlación obtenida es positiva lo cual indica que mayor número de
horas de estudio mayor calificación en el examen. Era de prever, no obstante, que se
obtuviese tal resultado.
2. El valor obtenido está muy cercano a 1. Ello significa que la relación entre ambas variables
es muy importante y que, por tanto, sería necesario implementar un análisis de regresión
con el objetivo de predecir valores de la variable criterio, en este caso calificación en el
examen.

Nota. Utilizando el software SPSS, siguiendo la secuencia:

Gráficos > Cuadros de diálogos antiguos > Dispersión / Puntos …

 Se obtiene el siguiente grafico de dispersión:

Los visualizan una relación lineal positiva entre las horas de estudios y las calificaciones
obtenidas.

 Hipótesis para comprobar el supuesto de normalidad de ambas variables son


respectivamente:
5

H0: Las horas de estudios se distribuyen como una curva Normal.


H1: Las horas de estudios no se distribuyen como curva normal

H0: Las calificaciones se distribuyen como una curva Normal.


H1: Las calificaciones no se distribuyen como curva normal

Para comprobar el supuesto de normalidad de ambas variables, mediante el SPSS se


sigue la secuencia:

Analizar > Pruebas no paramétricas > Cuadro de diálogos antiguos > K - S de una muestra

Prueba de Kolmogorov-Smirnov para una muestra

Horas_Estudio calificaciones

N 10 10
Media 5.50 11.20
Parámetros normalesa,b
Desviación típica 2.799 4.541
Absoluta .114 .231
Diferencias más extremas Positiva .114 .174
Negativa -.106 -.231
Z de Kolmogorov-Smirnov .361 .731
Sig. asintót. (bilateral) .999 .659

a. La distribución de contraste es la Normal.


b. Se han calculado a partir de los datos.

Dado que los valores de Sig. Asntót (Bilateral ) 0.999 y 0.659 son ambas mayores que
α = 0.05, se acepta que la distribución de las horas de estudios y las calificaciones se
distribuyen como una normal.

Ahora para calcular el coeficiente de Pearson, debemos seguir la secuencia:

Analizar > Correlaciones > Bivariadas > Seleccionar coeficiente de Pearson

Correlaciones

Horas_Estudio calificaciones

Correlación de Pearson 1 .979

Horas_Estudio Sig. (bilateral) .000

N 10 10
Correlación de Pearson .979 1

calificaciones Sig. (bilateral) .000

N 10 10

Correlación de Pearson r = 0.979

Ejercicio 1. A 10 candidatos a ingresar en un programa de doctorado, se les aplica en la


facultad de Psicología una prueba de personalidad (X) y un examen general de conocimiento
(Y), con las siguientes puntuaciones.
6

Candidato A B C D E F G H I J
Personalidad : (X) 2.96 2.46 3.36 3.40 2.43 2.12 2.85 3.12 3.20 2.75
Conocimiento: (Y) 529 506 591 610 474 509 550 600 575 540

a) Construya el diagrama de dispersión.


b) Verificar el supuesto de Normalidad de las variables X e Y.
c) Determinar el coeficiente de correlación (r) de Pearson.
d) Interprete el resultado obtenido en inciso c.

Sugerencia. Utilice el Software SPSS para desarrollar los incisos a), b) y c).

2. El coeficiente de correlación de Rho de Spearman

Hemos visto que en el análisis sobre correlación se utiliza el coeficiente de correlación de


Pearson, para medir la fuerza de la relación entre dos variables. Sin embargo, este método
requiere valores numéricos precisos y el supuesto de normalidad en la distribución de tales
valores. En muchos casos, tal medida numérica no puede ser posible, y puede no existir
confirmación para el supuesto de normalidad. En tales casos, no puede utilizarse el método de
Pearson.

No obstante, se puede todavía clasificar sistemáticamente u ordenar las observaciones. Esta


clasificación ordinal permite medir los grados de correlación entre dos variables utilizando el
coeficiente de correlación de rangos de Spearman. Éste es una medida de la correlación que
existe entre los dos conjuntos de rangos, una medida del grado de asociación entre las variables
que no podríamos calcular de otra manera.

Correlación de rangos de Spearman. Medida de la relación entre dos variables que han sido
clasificadas originalmente de más bajo a más alto (o de más alto a más bajo)
La correlación de Spearman, es una aplicación del coeficiente de correlación de Pearson a “n”
pares de observaciones cuyos valores son números de orden.

Supongamos que se toma una muestra aleatoria (x1, y1),…, (xn , yn) de n pares de observaciones.
Si las xi y las yi se ordenan en sentido ascendente (o en sentido descendentes) y no hay empates,
se calcula la correlación muestral de estos rangos mediante
n
6 d 2
donde: rs  1  i 1

rs = coeficiente de n(n  1) 2

correlación de rangos de Spearman


n = número de observaciones apareadas
d = diferencia entre los rangos para cada pareja de observaciones

El campo de variación del coeficiente de Spearman es el intervalo [-1; 1]. Cuando toma el valor
de -1 representa una correlación inversa perfecta. Si toma el valor de 1 representa una
correlación directa perfecta. Cuando rs = 0 indica que no existe relación o correlación entre las
variables.
Ejemplo 2. El año pasado, Amco Tech, un fabricante microchips para computadora en Estados
Unidos, contrato a siete técnicos en computación. A los técnicos se les practicó un examen
diseñado para medir sus conocimientos básicos. Después de un año de servicio, a su supervisor
se le pidió clasificar el desempeño laboral de cada técnico. Los puntajes del examen y las
clasificaciones del desempeño para los siete empleados aparecen en la siguiente tabla.
7
Datos sobre los técnicos de Amco Tech
Técnico Puntaje en el Clasificación del desempeño
examen
J. Smith 82 4
A. Jones 73 7
D. Boone 60 6
M. Lewis 80 3
G. Clark 67 5
A. Lincoln 94 1
G. Washintong 89 2

El jefe de operaciones desea determinar si existe alguna relación entre los puntajes del examen y
el desempeño laboral.

Vale la pena observar que aunque el puntaje del examen es una medida cuantitativa de los
conocimientos de los técnicos, la clasificación del desempeño es simplemente una medida
ordenada por el supervisor para saber cuáles técnicos se estaban desempeñando laboralmente
bien. Por tanto, el jefe de operaciones decide utilizar la correlación de rangos de Spearman para
determinar si existe alguna relación entre los puntajes del examen y el desempeño laboral. El
jefe de operaciones debe desarrollar la clasificación para los puntajes del examen. Tales
clasificaciones, junto con algunos cálculos necesarios aparecen en la siguiente tabla

Clasificación de los técnicos de Amco Tech

Técnico Puntaje en Clasificación Clasificación por


el examen En la prueba (x) el desempeño (y) d i = xi - yi di2
J. Smith 82 3 4 -1 1
A. Jones 73 5 7 -2 4
D. Boone 60 7 6 1 1
M. Lewis 80 4 3 1 1
G. Clark 67 6 5 1 1
A. Lincoln 94 1 1 0 0
G. Washintong 89 2 2 0 0

rs = 0.857, sugiere una relación fuerte, entre el puntaje del examen del técnico y su clasificación
del desempeño laboral

Mediante el software SPSS, siguiendo la secuencia:


Analizar > Correlaciones > Bivariadas > Seleccionar coeficiente de Spearman
Correlaciones

Puntaje Desempeño
Coeficiente de correlación 1.000 -.857
Puntaje Sig. (bilateral) . .014
N 7 7
Rho de Spearman Coeficiente de correlación -.857 1.000
Desempeño Sig. (bilateral) .014 .
N 7 7

rs = - 0.857
Ejercicio 2. A un grupo de 10 estudiantes de una escuela superior se les aplico una prueba de
conocimientos en matemáticas (x) y una de lógica (y). Se obtuvieron las siguientes
puntuaciones:

Estudiante x y
8
A 84 52
B 75 39
C 98 48
D 70 32
E 75 40
F 80 36
G 83 38
H 75 37
I 84 50
J 90 46

Se pide determinar el grado de semejanza entre las calificaciones obtenidas por los estudiantes
en las pruebas x e y. Es decir se pide determinar e interpretar el coeficiente rs.
Sugerencia. Primero debe comprobar la normalidad de las variables X e Y mediante la prueba de Kolmogorov-
Sminorv. Si se cumple la normalidad, determine el coeficiente de correlación paramétrico r de Pearson. Si en el caso
de que en la prueba de Kolmogorov – Sminorv indica que no se cumple la normalidad, entonces determine el
coeficiente de correlación no paramétrico rs Spearman.

S-ar putea să vă placă și