Documente Academic
Documente Profesional
Documente Cultură
Covarianza
cov( X , Y ) E[ XY ] x y
Dem.:
cov( X , Y ) E[( X x )(Y y )]
E[ XY xY X y x y ]
E[ XY ] x E[Y ] E[ X ] y x y
E[ XY ] 2x y x y
E[ XY ] x y
Esto, al igual que ocurra con la varianza, nos da una frmula alternativa mucho ms
sencilla para calcular la covarianza.
cov(rX s, tY u)
E[((rX s) rX s )((tY u) tY u )]
E[((rX s) (rE[ X ] s))((tY u) (tE[Y ] u))]
E[(rX s)(tY u)] E[(rX s)(tE[Y ] u] E[(rE[ X ] s)(tY u)] E[(rE[ X ] s)(tE[Y ] u)]
E[rXtY rXu stY su] E[rXtE[Y ] rXu stE[Y ] su] E[rE[ X ]tY rE[ X ]u stY su]
E[rE[ X ]tE[Y ] rE[ X ]u stE[Y ] su]
rtE[ XY ] ruE[ X ] stE[Y ] su rtE[ XE[Y ]] ruE[ X ] stE[ E[Y ]] su
Ntese que la flecha es unidireccional, lo cual nos dice que la recproca de este
teorema no es cierta. Dos variables pueden tener covarianza 0 y an as no ser
independientes.
Cuando dos variables tienen covarianza 0, se dice que estn no correlacionadas (El
por qu de este nombre se explicar un poco ms adelante).
PROPIEDAD: V ( X Y ) V ( X ) V (Y ) 2cov( X , Y )
Por todo lo dicho hasta ahora se puede ver que la covarianza brinda una cierta
informacin sobre la variabilidad de X e Y ; sin embargo, es una informacin muy
escueta y en la mayora de los casos insuficiente, adems de sesgada, por lo que se
suele apelar a otro recurso: el coeficiente de correlacin.
Correlacin
cov( X , Y )
( X ,Y )
x y
ste operador tiene una potencia mucho ms amplia que la covarianza para expresar
la forma en que dos variables aleatorias se relacionan, debido a que, a diferencia de
aquella, el coeficiente de correlacin no depende de la unidad en la que estn medidas
las variables aleatorias. No fue aclarado en la seccin anterior, pero puede
demostrarse fcilmente que el valor de la covarianza, para la misma variable aleatoria,
depende de la unidad en que sta est medida. El coeficiente de correlacin nos salva
de caer en sta ambigedad (a falta de un trmino ms apropiado) y debido a esto
podemos obtener ms informacin de l sobre la fuerza de la relacin entre las dos
variables.
PROPIEDAD: ( X ,Y ) 1
Es decir que los valores del coeficiente de correlacin estn contenidos en el intervalo
[-1,1]. La fuerza de la relacin se mide segn que tan cerca de los extremos del
intervalo se encuentre el valor, y dependiendo de en que extremo est, es el tipo de
relacin que se hallar.
Los casos 1 y 1 son dos casos especiales, en los que se dice que la
correlacin es perfecta porque hay una relacin lineal exacta entre las variables. Para
ser ms precisos, existe una relacin del tipo:
Y aX b
Si a 0 , tenemos que las variables estn relacionadas por medio de una recta con
pendiente positiva, y 1 . Si a 0 , tenemos uqe las grficas estn relacionadas por
medio de una recta con pendiente negativa, y 1.
Sin embargo, la relacin solo tiene la forma de una recta en stos casos particulares.
Normalmente, los puntos que va tomando el vector aleatorio van quedando dispersos
en el plano, y se pueden visualizar mediante diagramas de dispersin. Lo mismo
ocurre, por supuesto, con las ocurrencias reales: nunca obtendremos en ningn
experimento un resultado que sea una recta exacta, aunque si la relacin existe,
podemos conseguir resultados que se le parezcan mucho como consecuencia de la
Ley de los Grandes Nmeros, que se ver en el captulo siguiente. Es importante
recalcar que estos valores no son determinsticos, sino que hablamos siempre de
valores esperados. Siempre existir una probabilidad distinta de cero de encontrar
valores con una distribucin parecida a la segunda grfica, an si el coeficiente de
correlacin indica que se espera que sea parecida a la primera. Manejamos siempre
probabilidades, no relaciones determinsticas.
X4
Y 2 X 3
o Y e
En estos casos en los que la relacin no es lineal, naturalmente podemos calcular la
covarianza y el coeficiente de correlacin (claro, siempre que las integrales puedan
resolverse) pero ste no nos aportar ninguna informacin real sobre la naturaleza de
la relacin. No obstante, y afortunadamente, este tipo de relaciones no son las que se
presentan ms frecuentemente.
Dijimos anteriormente que los pares de valores esperados de las variables linealmente
correlacionadas se van aproximando a una recta. Sin embargo, conocer la existencia
de la correlacin lineal por s sola y su coeficiente no nos dice nada acerca de hacia
que recta tienden los puntos distribuidos en el plano. Para poder hacer un anlisis ms
profundo de la relacin, una vez detectada, se introduce el concepto de regresin
lineal, un tema que trataremos ms adelante.