Sunteți pe pagina 1din 7

COEFICIENTE DE CORRELACIN

Ahora que has aprendido a construir los diagramas de dispersin y a identificar cundo
hay correlacin (positiva y negativa), y cundo no hay, podemos empezar a estudiar
cmo se calcula el Coeficiente de Correlacin de Pearson.
De los diversos coeficientes de correlacin que existen, el ms popular y utilizado es el
Coeficiente de Correlacin de Pearson. Para su aplicacin es indispensable que la
correlacin sea lineal.
El coeficiente de correlacin de Pearson, que se simboliza con la letra minscula r, se
calcula dividiendo la suma de los productos de las desviaciones de cada variante de X
e Y, con respecto a sus medias (suma que se denomina covarianza de X e Y), por el
producto de las desviaciones estndar de ambas variables. En forma prctica, el
coeficiente de correlacin de Pearson es:

i 1

i 1

XY

i 1

i 1

Y
i 1

i 1

i 1

donde N es el nmero de datos.


Por medio de ejemplos, veremos cmo se utiliza esta frmula, para que puedas hacer
interpretaciones de este valor.

Ejemplo: La siguiente tabla muestra los datos registrados en una muestra aleatoria de
10 escuelas para nios superdotados. La razn alumno/maestro es (X) y los
estudiantes que se salen antes de completar el curso es (Y).

X
Y

20
12

18
16

16
10

15
14

14
12

12
10

12
9

10
8

8
7

5
2

Solucin: Se recomienda para hacer el clculo directo del coeficiente r de Pearson,


realizar una tabla como la siguiente:

22

(1)

(2)

(3)

X
20
18
16
15
14
12
12
10
8
5
X = 130

Y = 100

(4)

X2
400
324
256
225
196
144
144
100
64
25

Y
12
16
10
14
12
10
9
8
7
2

Y2
144
256
100
196
144
100
81
64
49
4

Y2 = 1138

X2 = 1878

(5)

XY
240
288
160
210
168
120
108
80
56
10
XY = 144

De la tabla, ves que en las columnas (1) y (2) se han escrito las puntuaciones
originales. En la columna (3) se obtuvieron los cuadrados de las puntuaciones X y en la
columna (4) los cuadrados de las puntuaciones Y. La columna (5) se forma con el
producto de cada X por cada Y, finalmente se suman los valores de las cinco columnas
y se sustituyen en la frmula que ya conoces, obteniendo el siguiente resultado.

N
r

i 1

i 1

XY

i 1

i 1

Y
i 1

i 1

i 1

10 (1440 )  (130 ) (100 )

>10 (1878)  (130) @ >10 (1138)  (100) @


2

14400  13000

(18780  16900 ) (11380  10000 )

1400
(1880 ) (1380 )

1400
2594400
1400
1610.7141

0.869180

23

Ahora interpretaremos este valor. Para ello es necesario conocer las siguientes
caractersticas del coeficiente de correlacin lineal.
 El valor de r es un nmero que satisface la desigualdad 1 d r d 1.

 Cuando la relacin de dos variables es perfectamente positiva, o sea cuando al


variar la primera, la segunda vara en las mismas proporciones y en la misma
direccin, el coeficiente de correlacin es + 1 (unidad positiva).
 Cuando la relacin de dos variables es perfectamente negativa, o sea cuando al
variar la primera, la segunda vara en las mismas proporciones pero en direccin
contraria, el coeficiente de correlacin es 1 (unidad positiva).
 Cuando no existe relacin entre las dos variables, o sea cuando al variar la primera,
las variaciones de la segunda no reflejan dependencia o conexin alguna con las
variaciones de la primera, el coeficiente de correlacin lineal es cero.
Lo anterior significa que, entre 0 y +1 cabe toda una gama de correlaciones positivas,
que sern tanto ms directamente proporcionales, cuanto ms se acerquen a +1.
Similarmente entre 1 y 0 cabe toda una gama de correlaciones negativas, que sern
tanto ms inversamente proporcionales, cuanto ms se acerquen a 1.
Los
coeficientes de correlacin, cuanto ms cerca de cero, indican menor correlacin.
Con todas estas caractersticas, podemos interpretar el resultado que calculamos del
coeficiente r de Pearson. Como r = 0.869180 podemos concluir que la correlacin es
fuerte y positiva.
Con base a las caractersticas del coeficiente de correlacin lineal (r) de Pearson, se
muestra a continuacin una tabla que indica cundo una correlacin lineal es dbil,
fuerte, positiva o negativa.
Tabla

Significado de

Tendencia del agrupamiento con respecto a


la lnea de regresin.
R=0
0 < r << 1,
1 r << 1
0 < r << 1, < 0
1 + r << 1

Correlacin nula
Correlacin baja positiva
Correlacin alta positiva
Correlacin baja negativa
Correlacin alta negativa

Como puedes observar, lo nico tedioso es la tabla, pero sta concentra los resultados
para obtenerlos con cierta facilidad. Te invito a que resuelvas el siguiente ejemplo sin
ver los resultados, salvo te aparezcan dudas, intntalo!
24

Ejemplo: Retomemos los valores utilizados del ejemplo de las visitas realizadas y los
pedidos hechos por diez vendedores de un Departamento de Ventas, lo recuerdas?,
te mostrar la tabla de valores que utilizamos; calcula el coeficiente r de Pearson.

Vendedor
Nmero
1
2
3
4
5
6
7
8
9
10

Visitas realizadas
(X)
245
172
291
124
191
218
101
259
307
142

XY
3283.00
1771.60
4394.10
855.60
1394.30
3095.60
525.20
3056.20
4390.10
781.00

Pedidos en millones (N$)


(Y)
13.4
10.3
15.1
6.9
7.3
14.2
5.2
11.8
14.3
5.5

X2
60025
29584
84681
15376
36481
47524
10201
67081
94249
20164

Y2
179.56
106.09
228.01
47.61
53.29
201.64
27.04
139.24
204.49
30.25

Solucin: Recuerda que para facilitar este clculo, se puede elaborar una tabla para
mostrar los totales, la cual est a continuacin de la tabla de datos, como observas.
La suma de las visitas realizadas es: X = 2050
La suma de los pedidos hechos es:

Y = 104

La suma del producto de (X) por (Y) es: X Y = 23546.70


La suma de los cuadrados de (X) es: X2 = 465366

La suma de los cuadrados de (Y) es: Y2 = 1217.22


Ahora procedemos a sustituir en la frmula del coeficiente de correlacin de Pearson, r:
25

10 (23546.6)  213200

>10 (465366 )  4202500 @ >10 (1217.22)  10816@

0. 9

Si te apoyas en la tabla del significado de r, ves que existe un grado apreciable de


correlacin entre las visitas y los pedidos, y sta resulta ser positiva.
En el clculo de r se omitieron algunos procedimientos para crear la necesidad en ti de
hacerlo completo e ir aclarando posibles dudas que pudieran surgir. Si no lo entendiste
despus de haberlo hecho de nuevo, revisa el primer ejemplo del clculo del coeficiente
de correlacin r de Pearson.
Ejercicios: Calcula el coeficiente de correlacin r de Pearson para los siguientes
problemas.
6) Para poder medir los resultados de un curso de capacitacin realizado con 12
tcnicos de una empresa, se tom un examen terico antes de comenzar el curso y
se realiz una prueba terica-prctica al final del curso. La calificacin mxima de
cada una de dichas pruebas fue de 10 puntos. El grupo estuvo compuesto por 6
tcnicos recientemente ingresados a la empresa (No. 1 al 6) y 6 tcnicos con mayor
antigedad (No. 7 al 12). Los resultados de ambas pruebas fueron:

No.
1
2
3
4
5
6
7
8
9
10
11
12

Prueba Previa
6.0
4.0
3.0
5.0
6.0
4.0
7.0
4.0
6.5
5.5
6.0
5.0

Con estos resultados calcula los coeficientes de correlacin r de:


a) Todo el grupo.
b) El grupo de recin ingresados.
c) El grupo de mayor antigedad.
Qu conclusiones obtienes de los incisos anteriores?
26

Prueba Final
6.5
5.5
7.0
5.0
7.0
6.5
10.0
5.0
9.0
7.0
8.5
6.0

7)

En dos tests, diez alumnos obtuvieron las siguientes puntuaciones:

Alumno
1
2
3
4
5
6
7
8
9
10

Test 1
15
14
10
9
8
8
7
6
4
2

Test 2
12
14
9
10
8
7
8
4
6
4

Cul es el coeficiente de correlacin r de Pearson? Interprtalo.


8)

A veinte estudiantes se les aplica un test de capacidad mental y otro sobre


conocimientos de francs. Se obtuvieron las siguientes puntuaciones.

Capacidad Mental

Francs

54
53
51
50
48
47
47
46
45
45
44
44
44
43
40
38
37
36
34

203
196
202
186
204
184
196
182
170
178
181
175
168
174
162
158
170
144
141

27

Calcula el coeficiente de correlacin r de Pearson e interprtalo.


9)

La siguiente tabla muestra los valores obtenidos en asistencia a juntas tanto para
hombres como para mujeres.
Asistencia a juntas
Hombres (X)

Mujeres (Y)

10
10
9
9
8
7
7
7
6
6
5
5
4
4
3

8
7
7
6
5
6
5
4
4
3
4
3
4
3
2

Cul es el coeficiente de correlacin r de Pearson? Interprtalo.


10) Los siguientes pares de valores representan las dimensiones en cms. de las hojas
del rbol del fresno:
(2,1), (3,2), (2,3), (3,3), (4,3), (3,5), (5,5) y (6,7)
Si se conoce la anchura (X) y la longitud (Y) de las hojas, habr alguna relacin
entre estas dos variables?, y si la hay, sta es fuerte o dbil? Realiza los clculos
adecuados para que contestes estas preguntas.

28

S-ar putea să vă placă și