Documente Academic
Documente Profesional
Documente Cultură
ANLISIS DE CORRELACIN
Dadas dos variables aleatorias cuantitativas, nos interesa cuantificar la intensidad de
la relacin lineal entre las mismas. El parmetro estadstico que nos da tal
cuantificacin es el coeficiente de correlacin lineal de Pearson, denotado por el
smbolo r, este coeficiente en la poblacin se denota por ; los valores que puede
tomar ste parmetro estn comprendidos dentro del siguiente intervalo del campo de
los reales:
1 r 1
El clculo del coeficiente de correlacin lineal se realiza con la siguiente frmula:
x y
n x x n y y
n x i yi
2
i
2
i
129
6
4
2
0
0
10
15
6
4
2
0
0
10
15
Variables no correlacionadas r = 0
10
9
8
7
6
Y 5
4
3
2
1
0
0
10
X
130
15
10
15
Correlacin
negativa
perfecta
Correlacin
negativa
fuerte
-1
Correlacin
negativa
moderada
-0.5
Correlacin
negativa
dbil
Ninguna
correlacin
lineal
Correlacin
positiva
perfecta
Correlacin
positiva
moderada
Correlacin
positiva
dbil
Correlacin
positiva
fuerte
+0.5
Ejemplo:
En la tabla siguiente se muestran los datos de 69 pacientes de los que se conoce su
edad y una medicin de su presin sistlica. Si estamos interesados en estudiar la
variacin en la presin sistlica en funcin de la edad del individuo, primero debemos
verificar grficamente con el diagrama de dispersin y luego calcular el coeficiente de
correlacin.
131
+1
N Tensin Edad
Sistlica
1
114
17
2
134
18
3
124
19
4
128
19
5
116
20
6
120
21
7
138
21
8
130
22
9
139
23
10 125
25
11 132
26
12 130
29
13 140
33
14 144
33
15 110
34
16 148
35
17 124
36
Tensin
Sistlica
136
150
120
144
153
134
152
158
124
128
138
142
160
135
138
142
145
N
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
Edad N
36
38
39
39
40
41
41
41
42
42
42
44
44
45
45
46
47
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
Diagrama de dispersin
80
Presin sistlica
70
60
50
40
30
20
10
0
100
120
140
160
180
200
Edad
Observamos que existe una correlacin positiva, el valor de r nos cuantificar la fuerza
de dicha correlacin.
Calculando r con la frmula:
X Y
i i
X 17 18
Y 114 134
2
I
17 18 ... 70 3183 ;
... 70 2 162303
180 2 1549424
132
69 1549424 10262 2
0.803
H0 : =0
H1 : 0
t = r
n-2
1- r2
133
a Y bX
X i X Yi Y X iYi n X Y
2
2
X i X
X i2 n X
X X Y Y X Y n X Y
X X
X n X
i
i i
2
i
488606 69(46.13)(148.7299
0.984
162303 69(46.13) 2
134
190
180
170
ps
160
150
140
130
120
110
20
30
40
50
60
70
Edad
COEFICIENTE DE DETERMINACION:
Medida que permite evaluar el grado de dispersin de los puntos en torno a la recta de
regresin con la dispersin en torno Y (promedio de los valores de Y). Nos cuantifica
el efecto de la variable independiente sobre la respuesta, su valor est entre 0 y 1. En
el ejemplo la evidencia grfica es suficiente pero es el coeficiente de determinacin
una medida objetiva de la fuerza de la relacin XY.
El clculo lo haremos con la siguiente frmula:
xi
b x i
n
r2
2
yi
Yi Y
yi2 n
2
3183 2
103.353 162303
69
2
r
0.645 64.5 %
10262 2
1549424
69
2
135