Sunteți pe pagina 1din 14

1

UNIDAD 8
Correlacin y Regresin(Prediccin)
1
Uno de los principales objetivos de la ciencia es poder predecir el puntaje de un sujeto en
una variable conociendo el puntaje de ese sujeto en otra variable asociada a la primera.
Cuando la relacin entre dos variables es de naturaleza cuantitativa, la forma de descubrir
y medir el grado de determinacin conjunta entre las dos variables es la correlacin que
se expresa por medio de frmulas.
Conociendo la correlacin entre dos variables se puede predecir el valor ms probable de
un sujeto en una de ellas, conociendo el puntaje de ese sujeto en la otra variable. Por ej.
i se conoce la talla o estatura de un sujeto, se puede predecir cul ser su peso ms
probable ya que se !a comprobado emp"ricamente que existe una correlacin interna
entre estas dos variables.
#a interpretacin del coeficiente de correlacin lineal como medida de la interrelacin
lineal entre dos variables es en esencia una interpretacin puramente matemtica, y
est desprovista de toda connotacin causa $ efecto. %s" por ejemplo, la cantidad de
llamadas telefnicas que se inician en &s. %s. entre las '' y '( de la ma)ana y la
cantidad de !uevos que ponen las gallinas en el campo en dic!o per"odo, tienen una
fuerte correlacin lineal positiva a pesar de que uno de estos !ec!os no tiene ninguna
influencia sobre el otro.
Correlacin

*s el grado de relacin que existe entre dos o ms variables, y constituye uno de los
principales objetos de la estad"stica porque nos permite, dados los valores de una
variable, conocer o predecir los valores de otra variable, sobre la base de la relacin que
tenga con la primera.
*sta relacin cuantitativa existente entre dos variables se puede determinar a trav+s del
"ndice de correlacin, el cual nos brinda tres datos,
1- *xistencia o no de correlacin, los l"mites entre los cuales se mueve la correlacin
son entre $' y -' .puede ser positivo o negativo/. *s positivo a medida que una
variable aumenta la otra tambi+n aumenta, y es negativo cuando una de las
variables aumenta y la otra disminuye.
2- #a direccin de esa correlacin, el mximo es ' porque el aumento o disminucin
se da en la misma proporcin. i la correlacin da 0 entonces no !ay ning1n tipo
de relacin. *xiste una correlacin positiva o negativa perfecta cuando tengo
momentos unitarios2 es decir, cuando ambas variables aumentan o disminuyen no
slo en el mismo sentido sino tambi+n en la misma proporcin, aumenta un
momento de 3 y aumenta un momento de 4. *l valor del momento, de la unidad
se puede establecer2 es decir no es necesario que por ejemplo por ' !ora de
trabajo se remunere ' peso, sino que tambi+n puede ser que por cada !ora de
1
5Cortada de Kohan N! y Carro "! #! .'678/. 9*stad"stica %plicada:. *ditorial Universitaria de &uenos %ires.
&s. %s.
5%ron %. y %ron *. .(00;/. *stad"stica para Psicolog"a. &uenos %ires. Prentice <all y Pearson *ducacin
5=ocumentos de Ctedra
5>>>.edutecne.utn.edu.ar?probabilidad?indice.!tm@inicio
2
trabajo se remunere 7 pesos, la correlacin en este caso sigue siendo positiva y
perfecta. *n psicolog"a las correlaciones perfectas se dan muy poco.
$- #a fuerza o intensidad de la correlacin, las correlaciones pueden ser de tres
clases de acuerdo con la fuerza o intensidad.
a- N%las& si la correlacin tiene un "ndice entre 0 y 0,A entre 0 y $ 0,A. Bo se
puede considerar que !aya correlacin porque es azar.
'- (e)es& si la correlacin se mueve entre 0,A y 0,; entre $0,A y $0,;.
c- *%ertes, cuando se mueve entre 0,; y 0,66 entre $0,; y $0,66.
*stos tres aspectos se dan simultneamente en un mismo valor, que adoptar valores
entre -? 5 '. in embargo, la correlacin no indica una relacin de causa5 efecto. ino que
indica la variacin o covariacin concomitante entre ( variables.
#a correlacin, en 1ltima instancia, nos indica cmo var"a o cambia una caracter"stica
cuando la otra caracter"stica o variable asociada cambia. *s decir, nos indica la
9covariacin: .si dos variables cambian o var"an concomitantemente/
*r+%las&
,i-os de Correlacin! ./e+-los&
Correlacin Per0ecta Positi)a& a cada aumento unitario en una variable le corresponde
un aumento unitario en la otra. rC'
*j,
3, %ptitud !acia la aritm+tica
4, %ptitud !acia la geometr"a
3
4
'
(
A
D
8
;
7
E
6
'0
'
(
A
D
8
;
7
E
6
'0
'
(
A
D
8
;
7
E
6
'0
r C x.y (x - y son Desvos reales) (#1todo largo)
B.sx .s.y
r C B.3.4 $ .3/ .4/ .X- Y refiere a ambas variables /

[B.3
(
$ .3/
(
].[B.4
(
$ .4/
(
] (#1todo 're)e)
3
rC'
Correlacin Positi)a, a cada aumento en una variable le corresponde un aumento en la
otra. rC0.66 a rC0.A'
3 4
'
(
A
D
8
;
7
E
6
'0
'
(
A
D
8
;
7
E
6
'0
(
(
A
8
;
E
E
6
6
'0
rC 0.66 a 0.A'
Correlacin Negati)a -er0ecta, a cada aumento unitario en una variable le corresponde
una disminucin unitaria en la otra. rC5'
3 4
'
(
A
D
8
;
7
E
6
'0
'
(
A
D
8
;
7
E
6
'0
'0
6
E
7
;
8
D
A
(
'
rC 5'
Correlacin Negati)a, a cada aumento en una variable le corresponde una disminucin
en la otra. rC 5 0.66 a $ 0.A'
3 4
'
(
A
D
8
;
7
E
'
(
A
D
8
;
7
E
'0
6
6
7
7
;
8
D
4
6
'0
6
'0
A
'
rC 50.A' a 50.66
Correlacin N%la, a medida que una aumenta la otra aumenta o disminuye
arbitrariamente. FC0.A0 a 0.0', rC50.A0 a $0.0'
3 4
'
(
A
D
8
;
7
E
6
'0
'
(
A
D
8
;
7
E
6
'0
A
7
8
'0
;
6
(
7
A
D
rC -0.0' a -0.A0
rC 50.0' a $0.A0
Correlacin N%la Per0ecta, a medida que una variable aumenta 1nicamente la otra
permanece constante. FC0
3 4
'
(
A
D
8
;
7
E
6
'0
'
(
A
D
8
;
7
E
6
'0
8
8
8
8
8
8
8
8
8
8
rC 0
*n las tres correlaciones perfectas, la unin de puntos en el diagrama forma una l"nea
recta
.c%acin de regresin
Conociendo la correlacin y si esta es alta, se puede -redecir el valor de una de las
variables conociendo el valor de la otra asociada a la primera. 4 esto es lo que se
denomina 9Fegresin:.
5
GPor qu+ a veces la prediccin se denomina regresinH
(
*l t+rmino regresin proviene
del !ec!o de que si transformramos los puntajes de ambas variables correlacionadas en
puntajes I, y la correlacin entre ambas fuera menos que perfecta, la puntuacin I de 4
.variable dependiente/, siendo una fraccin .la fraccin equivale al valor de r/ de la
puntuacin I de 3 .variable independiente/2 como resultado la puntuacin I de 4 se
encontrar"a ms cerca de su media, sufrir"a una regresin o retorno !acia 0.
Joda vez que se confirme un grado de correlacin entre dos variables, se supone la
existencia de una serie de ecuaciones matemticas .recta, parbola, circunferencia, etc./
que determinan la l"nea que mejor se ajusta a la nube de puntos.
*sta recta que se ajusta a una nube de puntos para realizar las predicciones se puede
trazar de dos maneras,
- a simple vista.
- por el m+todo de los #2ni+os C%adrados .que !ace que las predicciones sean ms
precisas/.
*l m+todo de los #2ni+os C%adrados se basa en postular que, en nuestro caso, la recta
que mejor se ajusta a una serie de observaciones es la que !ace m"nima la suma de los
cuadrados de los desv"os de cada observacin con respecto a esa recta. *ste criterio no
define una sola recta, sino dos, seg1n sigamos el sentido del eje 3 o el del eje 4.
*sto 1ltimo implica que la recta de regresin debe cumplir con dos propiedades,
'5 la de los desv"os con respecto a la recta es C0. *sta propiedad la cumplen todas las
rectas que pasan por el punto de interseccin de la media de 3 y la media de 42 porque
tambi+n se cumple en relacin a la x.
(5 la de los desv"os al cuadrado con respecto a la recta sea m"nima. *sta, en cambio, es
privativa o exclusiva de la recta de regresin. #a recta de regresin por el m+todo de los
m"nimos cuadrados, se obtiene a partir de frmulas y de la ecuacin de regresin.
*n nuestro anlisis, evaluaremos el grado de ajuste de un conjunto de observaciones
reales a una recta terica determinada con el m+todo de los K"nimos Cuadrados,
siguiendo el sentido del eje 4.
*r+%la& 34 a5'!6
3& variable dependiente,
6& variable independiente,
a y '& parmetros de la ecuacin.
a& Constante de regresin es la distancia que existe entre el punto de interseccin de
los ejes 6 e 3 y la interseccin de la recta de regresin en el eje 3, sie+-re 7%e el )alor
de la )aria'le 6 sea 4 8
$
! *s decir que a puede ser 5 o 9. *ste es un valor que se suma
al valor predic!o en la variable dependiente para tomar en cuenta las 3 de las
distribuciones.
2
Ler %ron %. y %ron *. .(00;/. *stad"stica para Psicolog"a. &uenos %ires. Prentice <all y Pearson *ducacin,
cap"tulo D.
3
Ler diferencias entre ejemplo ' y ejemplo (
6
4 4
a a
3 3
'& Coe0iciente de regresin es la pendiente de la recta de regresin, y se define como
el incremento de 3 .aumento/ para cada aumento unitario de 6. % medida que aumenta '
aumenta el ngulo que forma la recta de regresin con el eje de las 3
%mbos parmetros .a y b/ pueden calcularse directamente conociendo las 3 y de las
dos variables y el "ndice de correlacin r!
' 4 r ! :
y
:
;
Kedia de la variable 4 media de la variable 3
a 4 3

- ' ! 6
- alvo en el caso de la correlacin perfecta, la prediccin no es exacta.
Diagra+as de Dis-ersin
Joda vez que un grupo de sujetos es medido por dos variables se puede trazar un
diagrama de dispersin en los ejes octogonales, en donde queda graficada la direccin e
intensidad de la correlacin.
*jemplo ',
Lariables =esv"os reales Lariables
X Y X Y X
(
Y
(
X . Y X . Y X
2
Y
2
1 2 -4,80 -3,30 23,04 10,89 15,84 2 1 4
3 2 -2,80 -3,30 7,84 10,89 9,24 6 9 4
3 3 -2,80 -2,30 7,84 5,29 6,44 9 9 9
4 4 -1,80 -1,30 3,24 1,69 2,34 16 16 16
5 5 -0,80 -0,30 0,64 0,09 0,24 25 25 25
7 5 1,20 -0,30 1,44 0,09 -0,36 35 49 25
8 6 2,20 0,70 4,84 0,49 1,54 48 64 36
8 8 2,20 2,70 4,84 7,29 5,94 64 64 64
9 8 3,20 2,70 10,24 7,29 8,64 72 81 64
10 10 4,20 4,70 17,64 22,09 19,74 100 100 100
58,00
53,0
0 0,00 0,00 81,60 66,10 69,60 377 418 347
7
6 C 8,E : ;C (,E;
3 C 8,A : y C (,87

Recta
de regresin
X Y
0 0,37
1 1,22
2 2,07
3 2,92
4 3,77
5 4,62
6 5,47
7 6,32
8 7,17
9 8,02
10 8,87
*jemplo (,
Por ejemplo, supngase que en la tabla que sigue a los valores ; correspondan al
rendimiento de un !ombre como alumno y los valores y correspondan a su posterior
rendimiento como profesional. % un posible empleador del reci+n graduado le interesar"a
muc!o poder predecir el eventual rendimiento del candidato en base a su rendimiento
r C '0 . A77 $ 8E . 8A C 8<=

[ '0 . D'E $ .8E/
(
M . N'0 . AD7 $ (E06M
r 4 ;6,;0
C 8<=
'0 . (,E; . (,87
' C 0,68 . (,87 C 88=
(,E;
a C 8,A 5 0,E8 . 8,E C 8$>

K+todo breve
K+todo largo
8
como alumno. *l coeficiente r solo es incapaz de efectuar dic!a prediccin, ser
necesario usar las t+cnicas de regresin
X
(rendimiento
como
a!mno"
Y
(rendimiento
#ro$esiona"
X Y
X

2
Y
2
%&'()*R
+(
X . Y
X.Y X
2
Y
2
28,00 29,00
-
6,3
7
-
6,3
0
40,5
3
39,6
9 40,11 812 784 841
29,00 29,00
-
5,3
7
-
6,3
0
28,8
0
39,6
9 33,81 841 841 841
30,00 29,00
-
4,3
7
-
6,3
0
19,0
7
39,6
9 27,51 870 900 841
30,00 30,00
-
4,3
7
-
5,3
0
19,0
7
28,0
9 23,14 900 900 900
31,00 30,00
-
3,3
7
-
5,3
0
11,3
3
28,0
9 17,84 930 961 900
32,00 31,00
-
2,3
7
-
4,3
0 5,60
18,4
9 10,18 992
102
4 961
32,00 31,00
-
2,3
7
-
4,3
0 5,60
18,4
9 10,18 992
102
4 961
32,00 31,00
-
2,3
7
-
4,3
0 5,60
18,4
9 10,18 992
102
4 961
32,00 32,00
-
2,3
7
-
3,3
0 5,60
10,8
9 7,81
102
4
102
4 1024
33,00 33,00
-
1,3
7
-
2,3
0 1,87 5,29 3,14
108
9
108
9 1089
33,00 34,00
-
1,3
7
-
1,3
0 1,87 1,69 1,78
112
2
108
9 1156
33,00 34,00
-
1,3
7
-
1,3
0 1,87 1,69 1,78
112
2
108
9 1156
33,00 34,00
-
1,3
7
-
1,3
0 1,87 1,69 1,78
112
2
108
9 1156
34,00 35,00
-
0,3
7
-
0,3
0 0,13 0,09 0,11
119
0
115
6 1225
34,00 36,00
-
0,3
7
0,7
0 0,13 0,49 -0,26
122
4
115
6 1296
34,00 36,00 -
0,3
0,7
0
0,13 0,49 -0,26 122
4
115
6
1296
9
7
34,00 36,00
-
0,3
7
0,7
0 0,13 0,49 -0,26
122
4
115
6 1296
35,00 37,00
0,6
3
1,7
0 0,40 2,89 1,08
129
5
122
5 1369
35,00 37,00
0,6
3
1,7
0 0,40 2,89 1,08
129
5
122
5 1369
36,00 37,00
1,6
3
1,7
0 2,67 2,89 2,78
133
2
129
6 1369
36,00 37,00
1,6
3
1,7
0 2,67 2,89 2,78
133
2
129
6 1369
36,00 38,00
1,6
3
2,7
0 2,67 7,29 4,41
136
8
129
6 1444
36,00 39,00
1,6
3
3,7
0 2,67
13,6
9 6,04
140
4
129
6 1521
37,00 40,00
2,6
3
4,7
0 6,93
22,0
9 12,38
148
0
136
9 1600
37,00 40,00
2,6
3
4,7
0 6,93
22,0
9 12,38
148
0
136
9 1600
38,00 40,00
3,6
3
4,7
0
13,2
0
22,0
9 17,08
152
0
144
4 1600
38,00 40,00
3,6
3
4,7
0
13,2
0
22,0
9 17,08
152
0
144
4 1600
39,00 40,00
4,6
3
4,7
0
21,4
7
22,0
9 21,78
156
0
152
1 1600
41,00 42,00
6,6
3
6,7
0
44,0
0
44,8
9 44,44
172
2
168
1 1764
43,00 42,00
8,6
3
6,7
0
74,5
3
44,8
9 57,84
180
6
184
9 1764
1031,00 1059,00
0,0
0
0,0
0
340,
97
486,
30 389,70
367
84
357
73
378
69
AE6,70 K+todo largo
r 4 C 8<?
A0 . A,A7 . D,0(
' C 0,6; . D,0( C ','D
A,A7
a C A8,A 5 ','D . AD,A7 C 5 A,EE

34 a5 ' ! ;
*jemplo tomando el primer valor de la variable 3 C (8
3 4 -$88 5 11@ ! 2= 4 2@?2
10
*jemplo A,
#a siguiente tabla da en Og. los pesos 3 e 4 de una muestra de '( padres y
sus !ijos varones mayores, ambos a la edad de 'E a)os.
X
( ,adres"
Y
(-i.os" X Y X

2
Y
2
%&'()*R+(
X . Y X.Y X
2
Y
2
62,00
65,00 -4,67 -2,58 21,78 6,67 12,06 4030 3844 4225
63,00
65,00 -3,67 -2,58 13,44 6,67 9,47 4095 3969 4225
64,00
66,00 -2,67 -1,58 7,11 2,51 4,22 4224 4096 4356
65,00
66,00 -1,67 -1,58 2,78 2,51 2,64 4290 4225 4356
66,00
67,00 -0,67 -0,58 0,44 0,34 0,39 4422 4356 4489
67,00
68,00 0,33 0,42 0,11 0,17 0,14 4556 4489 4624
67,00
68,00 0,33 0,42 0,11 0,17 0,14 4556 4489 4624
68,00
68,00 1,33 0,42 1,78 0,17 0,56 4624 4624 4624
68,00
68,00 1,33 0,42 1,78 0,17 0,56 4624 4624 4624
69,00
69,00 2,33 1,42 5,44 2,01 3,31 4761 4761 4761
70,00
70,00 3,33 2,42 11,11 5,84 8,06 4900 4900 4900
X Y
2
5
24,6
2
2
6
25,7
6
2
7 26,9
2
8
28,0
4
2
9
29,1
8
3
0
30,3
2
3
1
31,4
6
3
2 32,6
3
3
33,7
4
3
4
34,8
8
3
5
36,0
2
3
6
37,1
6
3
7 38,3
3
8
39,4
4
3
9
40,5
8
4
0
41,7
2
4
1
42,8
6
4
2 44
4
3
45,1
4
4
4
46,2
8
4
5
47,4
2
4
6
48,5
6
4
7 49,7
4
8
50,8
4
11
71,00 71,00 4,33 3,42 18,78 11,67 14,81 5041 5041 5041
800,00
811,0
0
-
0,04 0,04 84,67 38,92 56,33 54123 53418
5484
9
CA.*ICI.N,. A(*A D. CRANBACC
%lfa es un coeficiente de correlacin al cuadrado que, a grandes rasgos,
mide la !omogeneidad de las preguntas promediando todas las
correlaciones entre todos los "tems para ver que, efectivamente, se
parecen.
u interpretacin ser que, cuanto ms se acerque el "ndice al
extremo ', mejor es la fiabilidad, considerando una fiabilidad respetable
a partir de 0,E0.
Fequiere de una sola aplicacin del instrumento y se basa en la medicin de la
respuesta del sujeto con respecto a los "tems del instrumento.
K& *l n1mero de "tems
X Y
6
2 64,5
63
65,1
6
64
65,8
2
65
66,4
8
66
67,1
4
67 67,8
68
68,4
6
69
69,1
2
70
69,7
8
71
70,4
4
72 71,1
r C 0,6E
' C 0,6E . ',EE C 0,;;
(,77
a C ;7,8E 5 0,;; . ;;,;7 C (A,8E

34 a5 ' ! ;
*jemplo tomando el primer valor de la variable 3 C
;(
4 C (A,8E - 0,;; . ;( C ;D,8

2
2
1
1
T
i
S
S
K
K

12
:i
2
& umatoria de Larianzas de los Ptems
:,
2
& Larianza de la suma de los Ptems
:
Coeficiente de %lfa de Cronbac!
Ite+s I II III :%+a de Ite+s
:%/etos
Ca+-os (1) A 8 8 'A
D+eE (2) 8 D 8 'D
(inares ($) D D 8 'A
Rodas (@) D 8 A '(
:aa)edra (=) ' ( ( 8
,a0%r (?) D A A '0

FARP 1=8 11@ 1@> :,
2
& <1@
(FarianEa de la
Po'lacin) :i
2
& @1<
K&
*l n1mero de
"tems A
:i
2
& umatoria de las Larianzas de los Ptems D,'6
:,
2
& #a Larianza de la suma de los Ptems 6,'D
:
Coeficiente de %lfa de Cronbac!
1= G 8=@ H
= 881
*ntre ms cerca de ' est , ms alto es el grado de confiabilidad
CAN*IABI(IDAD&
5e puede definir como la estabilidad o consistencia de los resultados obtenidos
5*s decir, se refiere al grado en que la aplicacin repetida del instrumento, al
mismo sujeto u objeto, produce iguales resultados
5*jemplo, si un Jest de Pnteligencia *mocional se aplica !oy a un grupo de
profesores y proporciona ciertos datos2 si se aplica un mes despu+s y
proporciona valores diferentes y de manera similar en mediciones subsecuentes,
tal prueba no es confiable
C A N * I A B I ( I D A D

Kuy &aja &aja Fegular %ceptable *levada
8 1

=
1 4 , 9
1 9 , 4
1
1 3
3

13
0Q de confiabilidad en la
'00Q de
confiabi5
medicin .la medicin est lidad en la medi5
contaminada de error/
cin .no !ay
error/
Coe0icientes Deri)ados de r
'5 Coeficiente de %lienacin, R
%s" como la correlacin indica el grado de relacin entre dos variables, la alienacin indica
el grado de independencia entre dos variables y se usa cuando interesa medir ms el
grado de independencia que el de relacin o de interdependencia.
K4 1 9 r
(5 Coeficiente de =eterminacin, .r
(
/
Pndica la proporcin de variacin de la variable 3 que est determinada por la variacin de
la variable 62 el valor num+rico de r
(
siempre es menor que el valor num+rico de r, salvo
cuando la correlacin es perfecta, en que ambas coinciden.
A5 Coeficiente de Bo =eterminacin, .R
(
/
e obtiene elevando al cuadrado el "ndice de alienacin. Pndica la proporcin de variacin
de la variable 3, que no est determinada por la variacin de la variable 6. Karca la
proporcin en donde no !ay causa5efecto en la variacin simultnea de dos variables.
Re7%isitos -ara a-licar 2ndice de correlacin&
a- que las variables sean continuas,
'- que estas variables se distribuyan en forma similar a la curva normal,
c- se aplica en escalas intervalares o m+tricas.
Drado de intensidad de la correlacin&
Para saber el grado de intensidad de la correlacin se siguen las siguientes pautas. e
considera,
rC - 5 0.A0 a 0 .nula correlacin/
rC - 5 0.A' a - 5 0.80 .leve correlacin/
rC - 5 0.8' a - 5 0.70 .moderada correlacin/
rC - 5 0.7' a - 5 0.66 .alta o intensa correlacin/
*n psicolog"a una aplicacin importante de la correlacin es para obtener la confiabilidad
y la validez de los instrumentos psicolgicos de medicin, son dos propiedades
indispensables que deben tener los mismos.
14
Bi'liogra0Ia de cons%lta,
5 Aron A! y Aron .! .(00;/. *stad"stica para Psicolog"a. &uenos %ires. Prentice <all y Pearson
*ducacin. Ca-2t%lo $
5 Cortada de Kohan N! y Corro "! #! .'678/. 9*stad"stica %plicada:. &uenos %ires. *ditorial
Universitaria de &uenos %ires. Ca-2t%lo 8

S-ar putea să vă placă și