Documente Academic
Documente Profesional
Documente Cultură
1. Introduccin
En el presente informe se tratara de las relaciones existentes entre dos variables.
Supondremos que sobre cada individuo se miden u observan dos caracteres X e
Y, o equivalentemente, que sobre cada individuo se observa el carcter
x
y
bidimensional (X;Y). Cada observacin vendr dada por un par ( I ; I ),1 i
n, y por tanto ahora los datos observados sern los n pares (
y2
), ...,(
xn
yn
). Denotaremos por
x1
,,
y1
,,
xk
yp
x1
y1
),(
x2
a las k modalidades
a las p modalidades
nijn
i=1 j=1
La frecuencia relativa conjunta del par (xi; yj), que denotaremos fij , es la
proporcin de veces que se observa dicho par, es decir,
nij
jp
fij n , 1 i k, 1
Se tiene que
k
f ij 1
i=1 j=1
ni: =
n ij
j=1
1 i k,
n in
i=1
f
,
f i1
fi j k,
n - j=1 ij 1
i=1
La frecuencia (absoluta) marginal de yj , que denotaremos n:j , es el
nmero de veces que
Y presenta dicha modalidad. Se tiene que
k
n:j -
n ij
j=1
1 i p,
n jn
j=1
f
,
f j 1
fj j p,
n - i=1 ij 1
j=1
Estas frecuencias se representan en una tabla llamada tabla de
frecuencias conjuntas o
tabla de doble entrada como sigue
Distribucin conjunta de (X;Y)
y1
X/Y
x1
x2
.
.
.
xk
y2
yp
.
.
.
.
.
.
.
.
.
4. Representacin grfica
Representacin graficas de tablas de doble entrada
Diagrama de barras agrupadas
5. Distribuciones marginales
Distribucin marginal de X
X ni f i
x1 n1 f1
x2 n2 f2
. . .
. . .
. . .
Xk nk fk
n 1
Distribucin marginal de Y
Y n:j f:j
y1 n:1 f:1
y2 n:2 f:2
.
. .
.
. .
.
. .
yp n:p f:p
n 1
Son distribuciones de un carcter, y por tanto tiene sentido, para cada
una de ellas, calcular las medidas estudiadas anteriormente. As, si X e Y
son variables hablaremos de la media marginal de la variable X, x, la
2
varianza marginal de la variable X, s X , la media marginal de la
variable Y , y, y la varianza marginal de la variable Y ,
s2
Ejemplo
La tabla de frecuencias conjuntas con los datos del ejemplo 1 es
X/Y 2 3 4 5
1 01001
2 03115
3 20002
4 00101
5 00101
2 4 3 1 10
6. Distribuciones condicionales
De los n individuos en el estudio hay n:j con Y = yj . Podemos estar
interesados en estudiar el carcter X en este subconjunto de los datos
originales. A la distribucin de frecuencias del carcter X en este
subconjunto, de_nido por aquellos individuos con Y = yj , se le denomina
distribucin de X condicionada a Y = yj . En esta distribucin X presenta
las modalidades x1, x2,, xk con frecuencias (absolutas) condicionadas
y frecuencias relativas
condicionadas
Se tiene que
Ejemplo
Con los datos del ejemplo 1, la distribucin de frecuencias de X
condicionada a Y= 3 es
Existen p
condicionadas
correspondientes
modalidades de
distribuciones
del carcter X
a las distintas
Y:
Anlogamente
podemos
considerar la
distribucin
de Y
condicionada
a X = xi, que
presenta las
modalidades y1, y2, , yp con frecuencias (absolutas) condicionadas
verificando que
Varianza de Y condicionada a X
8. Covarianza
La covarianza es una medida de dependencia de las dos variables: si la
covarianza es positiva, la relacin entre X e Y es directa, es decir,
cuando X crece, Y tambin tiende a crecer, y viceversa. Si la covarianza
es negativa, la relacin es inversa, o sea, cuando X crece, Y tiende a
decrecer, y viceversa. Si SXY = 0, se dice que las variables X e Y son
incorreladas. La covarianza entre X e Y se define como