Sunteți pe pagina 1din 35

DISTRIBUCIONES CONDICIONALES DE FRECUENCIA

Ejemplo introductorio

En una muestra de 2000 viviendas de la comuna ABC al observar las variables


X: Vivienda con servicio de agua potable
Y: Vivienda con servicio de energía eléctrica
Se ha obtenido que 500 tienen servicio de agua potable, 300 tienen servicio de
energía eléctrica y 120 presentaron servicio de agua potable y servicio de energía
eléctrica
Viviendas con energía eléctrica

Ω Notación conjuntista
X Y n ()  2000
380 120 180 n ( X )  500
n (Y )  300
1320
n ( X  Y )  120
Viviendas con agua potable
1
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Ejemplo introductorio

De la gráfica podemos obtener las siguientes conclusiones:


n(X) 500
f(X)    0.25
n(Ω) 2000
El 25% de las viviendas poseen servicio de agua potable.
n(Y) 300
f(Y)    0.15
n(Ω) 2000
El 15% de las viviendas poseen servicio de energía eléctrica.
n(X  Y) 120
f(X  Y)    0.06
n(Ω) 2000
El 6% de las viviendas analizadas poseen servicios de agua potable y energía
eléctrica.
n(Ω)  n(X) 2000  500
f(X C )    0.75
n(Ω) 2000
El 75% de las viviendas no poseen servicios de agua potable.
2
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Ejemplo introductorio

n(Ω)  n(Y) 2000  300


f(Y C )    0.85
n(Ω) 2000
El 85% de las viviendas no poseen servicio de energía eléctrica.
n(X  Y) 880
f(X  Y)    0.44
n(Ω) 2000
El 44% de las viviendas poseen servicio de agua potable y/o servicio de energía
eléctrica.
n(Ω)  n(X  Y) 2000  680
f(X C  Y C )  f(X  Y)C    0.66
n(Ω) 2000
El 66% de las viviendas analizadas no poseen servicios de agua potable ni de
energía eléctrica.
n(X  Y) 120
f(X/Y)    0.40
n(Y ) 300
Dentro de las viviendas que tienen servicio de energía eléctrica , el 40% poseen
servicios de agua potable.
3
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Ejemplo introductorio
n(Y  X) 120
f(Y/X)    0.24
n(X) 500
Dentro de las viviendas que tienen servicio de agua potable , el 24% poseen
servicios de energía eléctrica.
n(X C  Y) 180
f(X /Y) 
C
  0.60
n(Y) 300
Dentro de las viviendas que tienen servicio de energía eléctrica , el 60% no
poseen servicios de agua potable.
n(X  Y C ) 380
f(X/Y ) 
C
  0.2235
n(Y C ) 1700
Dentro de las viviendas que no tienen servicio de energía eléctrica , el 22.35%
poseen servicios de agua potable.
n(X C  Y C ) n(X  Y)C 1320
f(X /Y ) 
C C
   0.7764
n(Y C ) n(Y C ) 1700
Dentro de las viviendas que no tienen servicio de energía eléctrica , el 77.64%
no poseen servicios de agua potable.
4
5
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Definición de frecuencia condicional
En general la expresión f(A/C ) significa:
Frecuencia condicional de A dado C
n(A  C)
n(A  C) n(Ω ) f(A  C)
f(A/C)   
n(C) n(C) f(C)
n(Ω )
Análogamente; para una distribución conjunta (Xi , Yj) se tiene:
nij
n(X i  Y j ) nij n f ij f ( X i  Yj )
f(X i /Y j )     
n(Y j ) n. j n. j f. j f (Y j )
n
f ij f ( X i  Yj )
f(Y j /X i )  
f i. f (Xi)

 f X / Y j   1.0
m
Propiedades: f(X i /Y j )  0 ij ; i
i 1
6
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Definición
Distribución condicional de X dado Yj
X ,
i f(X i /Y j )  ; i  1,2,3,....m. dado Y j
Habrá tantas distribuciones condicionales de X como valores (clases) tenga la
variable Y
Distribución condicional de Y dado Xi
Y ,
j f(Y j / X i )  ; j  1,2,3,....s. dado X i
Habrá tantas distribuciones condicionales de Y como valores (clases) tenga la
variable X

¿Cómo se define la función empírica de densidad condicional de Y dado X?

f (Y j / X i )
f (Y j /X i ) 
*

CY j

CY j : Ancho del intervalo j de Y

5
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Recordemos la notación para distribución conjunta para X e Y
Y Hay s
Y1 Y2 Yj Ys clases de Y
X
X1 n11 n12 n1j n1s n1.
X2 n21 n22 n2j n2s n2.

Xi ni1 ni2 nij nis ni.

Xm nm1 nm2 nmj nms nm.


n.1 n.2 n.j n.s n

Veamos la notación que se usará para


Hay m las distribuciones condicionales
clases de X
8
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Distribuciones condicionales para la variable X

X f ( X i / Y1 ) f ( X i / Y2 ) f ( X i / Yj ) f ( X i / Ys )

X1 n11 / n.1 n12 / n.2 n1 j / n. j n1s / n.s


X2 n21 / n.1 n22 / n.2 n2 j / n. j n2 s / n.s

Xi ni1 / n.1 ni 2 / n.2 nij / n. j nis / n.s

Xm nm1 / n.1 nm 2 / n.2 nmj / n. j nms / n.s

nij
f ( X i / Yj )  Distribución condicional de X cuando Y= Yj “cómo se
n. j comporta X cuando cuando Y= Yj”

9
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Distribuciones condicionales para la variable y

Y f (Y j / X 1 ) f (Y j / X 2 ) f (Y j / X i ) f (Y j / X m )

Y1 n11 / n1. n21 / n2. ni1 / ni. nm1 / nm.


Y2 n12 / n1. n22 / n2. ni 2 / ni. nm 2 / nm.

Yj n1 j / n1. n2 j / n2. nij / ni. nmj / nm.

Ys n1s / n1. n2 s / n2. nis / ni. nms / nm.

nij
f (Y j / X i )  Distribución condicional de Y cuando X= Xi “cómo se
ni. comporta Y cuando cuando X= Xi”

10
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
Ejemplo:
La siguiente tabla de frecuencias corresponde a 200 fincas en las cuales se han observado
las variables: área cultivada de maíz (X) en Ha y producción anual (Y) en toneladas

Y (0; 25] (25; 60] (60; 180] (180; 250] (250; 350]
X Y1 Y2 Y3 Y4 Y5
(0; 10]
34 30 14 2 0 80
X1
(10; 40]
23 12 20 4 1 60
X2
(40; 90]
13 8 24 4 1 50
X3
(90; 150]
0 0 2 5 3 10
X4

70 50 60 15 5 200

11
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
a) Construir la distribución del área cultivada, para las fincas con producción anual
entre (60; 180], dicha distribución se denota por:
X ,i f(X i /Y j )  ; i  1,2,3,....m. dado Y j

Y (60; 180]
X Y3 X
(0; 10] Área f(Xi /Y3 )
14 cultivada
X1
X1 : (0; 10] 14/60
(10; 40]
20
X2 X2 : (10; 40] 20/60=0,333
(40; 90] X3 :(40; 90] 24/60
24
X3 X4:(90; 150] 2/60
(90; 150] Interpretación
2 1.0
X4 De las fincas que producen entre
60 y 180 Toneladas de maíz al año,
el 33% de ellas tienen un área
60
cultivada entre 10 Ha y 40 Ha

12
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
b) Construir la función empírica de densidad condicional del área cultivada, para las
fincas con producción anual entre 60 Ton y 180 Ton.
Ejemplo
f ( X i / Y3 ) f ( X 1 / Y3 ) 14 / 60
f *(X i /Y3 )  ; i f *(X 1 /Y3 )    14 / 600  0.023
CXi C X1 10
13


X 0 si x  0 ó x  150
C X i Área h(Xi /Y3 ) 
cultivada 14 / 60  0.0233 si x  (0, 10 
10 X1 : (0; 10]  10
14/60  20 / 60
30 X2 : (10; 40] 20/60=0,333 f (X i /Y3 )  
*
 0.011 si x  (10, 40 
 30
50 X3 :(40; 90] 24/60  24 / 60
 50  0.008 si x  (40, 90 
60 X4:(90; 150] 2/60

1.0  2 / 60  0.0006 si x  (90, 150 
 60
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
c) ¿Qué porcentaje de las fincas que producen anualmente entre 60 y 180 Ton,
tienen áreas cultivadas entre 18 Ha y 70 Ha?

0 si x  0 ó x  150
0.0233 si x  (0, 10 

f (X i /Y3 )  0.011
*
si x  (10, 40  18
0.008 si x  (40, 90 
 70
0.0006 si x  (90, 150 

  
10 40 90
18 70

f (18  X  70)/Y3   f *(X 2 /Y3 ).(40  18)  f *(X 3 /Y3 ).(70  40)
 (0.011).(22)  (0.008).(30)
 0.482  48.2%
14
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
d) Calcule e interprete: f ( X 1 Y3 )  ?

14
f ( X 1 Y3 )   0.07
200

De todas las fincas analizadas el 7% tienen un área cultivada entre 0 y 10 Ha y producen al


año entre 60 y 180 Ton
15
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA

f(X 1 /Y3 )  ?

14
f(X 1 /Y3 )   0.233
60
De las fincas que producen anualmente entre 60 y 180 Ton de maíz, el 23.3% de ellas,
tienen un área cultivada entre 0 y 10 hectáreas

16
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA
14
f(Y3 /X 1 )  ?
80

14
f(Y3 /X 1 )   0.175
80
De las fincas con área cultivada de maíz entre 0 y 10 hectáreas, el 17.5% de ellas producen
anualmente entre 60 y 180 Ton de maíz.

17
DISTRIBUCIONES CONDICIONALES DE FRECUENCIA

Regla de la multiplicación:

f ( X i  Yj )
f(X i /Y j )   f ( X i  Y j )  f (Y j ). f ( X i / Y j )
f (Y j )

f ( X i  Yj )
f(Y j /X i )   f ( X i  Y j )  f ( X i ). f (Y j / X i )
f ( X i)

18
MEDI A Y VARIANZA CONDICIONALES PARA LA VARIABLE X
De la tabla bidimensional seleccionamos la columna j de Y y vamos a observar el
comportamiento de la variable X en dicha columna

X Yj X h( X i / Y j ) Media condicional para X


dado un valor de Y
X1 n1j X1 n1 j / n. j m
X2 n2j X2 n2 j / n. j M ( X / Yj )   ( X i ) f ( X i / Yj )
i 1

Xi nij Xi nij / n. j Varianza condicional para X


dado un valor de Y

 
m
  X i  M ( X / Yj )
Xm nmj 2 2
S X f ( X i / Yj )
Xm nmj / n. j Yj i 1
n.j

X 1 (n1 j )  X 2 (n2 j )  ..  X m (nmj )


M ( X / Yj ) 
n. j
19
MEDIA Y VARIANZA CONDICIONALES PARA LA VARIABLE X
m

X 1 (n1 j )  X 2 (n2 j )  ..  X m (nmj )  X (n i ij ) m


M ( X / Yj )   i 1
  ( X i ) f ( X i / Yj )
n. j n. j i 1

 
m
  X i  M ( X / Yj )
2 2
S X f ( X i / Yj )
Yj i 1

Análogamente para la variable Y tenemos que de la tabla bidimensional seleccionamos la


fila i de X y vamos a observar el comportamiento de la variable Y en dicha fila

Y Y1 Y2 Yj Ys

Xi ni1 ni2 nij nis ni.

Formamos la distribución condicional de Y para Xi

20
MEDI A Y VARIANZA CONDICIONALES PARA LA VARIABLE Y

Media condicional para Y dado un valor de X

Y f (Y j / X i ) Y1 (ni1 )  Y2 (ni 2 )  ..  Ys ( nis )


h( X i / Y j ) M (Y / X i ) 
ni.
Y1 ni1 / ni. s

Y2
n1 j / n. j
ni 2 / ni.  Y (n j ij ) s
  (Y j ) f (Y j/ X i )
j 1
n2 j / n. j 
ni. j 1
Yj nij / ni.
nij / n. j Varianza condicional para X dado un valor de Y

 
s
  Y j  M (Y / X i )
2 2
S Y f (Y j / X i )
Ys nis / ni. Xi j 1

21
Ejemplo
Se tomó una muestra de 500 viviendas de la población ABC y entre otras se observaron las
siguientes variables: X: Número de personas que duermen ; Y: Área del dormitorio m2. Los
resultados se muestran en la siguiente tabla bidimensional

Y Y1= Y2= Y3= Y4= Y5= Y6=


X (3, 4] (4, 6] (6, 9] (9, 12] (12, 16] (16, 25]

X1=1 10 4 2 5 3 1 25
X2=2 4 40 20 15 17 4 100
X3=3 3 35 61 10 40 26 175
X4=4 1 18 59 14 34 24 150

X5=5 2 3 8 6 16 15 50

20 100 150 50 110 70 500

a) Estimar el área promedio de dormitorio para las viviendas en que duermen dos personas
y la varianza del área del dormitorio para las viviendas en las que duermen dos personas.
22
Y Y1= Y2= Y3= Y4= Y5= Y6 =
X (3, 4] (4, 6] (6, 9] (9, 12] (12, 16] (16, 25]
Valor de X que
condiciona
Total
X2=2 4 40 20 15 17 4 100

40
h(Y j / X 2 ) f (Y2 / X 2 ) 
Y 100
h( X i / Y j )
Y1=3.5 4 0.04 6
Media condicional
n1 j / n. j M (Y / X 2 )   (Y j ) f (Y j/ X 2 )
Y2=5.0 40 0.40 j 1
de Y dado X2
n2 j / n. j
Y3=7.5 20 0.20  (3.5).(0.04 )  ...  (20 .5).(0.04 )  8.415 m 2
Marcas de clase

Y4=10.5 15 0.15 Las viviendas en que viven dos personas tienen en su


nij / n. j dormitorio un área promedio de 8.415 metros cuadrados.
Y5=14.0 17 0.17
Y6=20.5 4 0.04
Total 100 1.0

23
40
Y f (Y j / X 2 ) f (Y2 / X 2 ) 
100
h( X i / Y j )
Y1=3.5 0.04
n1 j / n. j
 
6 Varianza
Y2=5.0 0.40   Y j  M (Y / X 2 )
2 2
S Y f (Y j / X 2 ) condicional de Y
Marcas de clase

n2 j / n. j X2 j 1
Y3=7.5 0.20 dado X2
 
6
  Y j  8.415 f (Y j / X 2 )
2
Y4=10.5 0.15
nij / n. j j 1
Y5=14.0 0.17
 (3.5  8.415 ) 2 (0.04 )  ...  ( 20 .5  8.415 ) 2 (0.04 )
Y6=20.5 0.04
Total 1.0  17 .6 m 4

24
b) Estimar el número de personas en promedio que duermen en las viviendas cuya área de
dormitorio está entre 4.0 m2 y 6.0 m2 así mismo estime la varianza correspondiente.

Escribimos la distribución condicional implicada en las estimaciones solicitadas

Y2= 40
X f ( X i / Y2 ) f ( X i / Y2 ) 
(4, 6] 100
5
M ( X / Y2 )   ( X i ) f ( X i / Y2 )
X1=1 4 0.04
X2=2 40 0.40 i 1

 (1).(0.04 )  (2).(0.40 )  ....  (5).(0.03)  2.76


X3=3 35 0.35
 
5
X4=4 18 0.18   X i  M ( X / Yj )
2 2
S X f ( X i / Y2 )
Y2 i 1
X5=5 3 0.03 5
   X i  2.76  f ( X i / Y2 )
2

Total 100 1.00 i 1

 (1  2.76 ) 2 .(0.04 )  ....  (5  2.76 ).(0.03)


 0.80 ( personas ) 2

25
c) Estime el promedio y la varianza para el área del dormitorio

Trabajando sobre la marginal tenemos

Y n. j 6
y   (Y j´ ) f. j
Y1=3.5 20 j 1

Y2=5.0 100  (3.5).(0.04)  (5.0).(0.20)  ....  (20.5).(0.14)


 10.39 m 2
Marcas de clase

Y3=7.5 150
Y4=10.5 50

 
Y5=14.0 110 6
S   Y j´  y
2
2
y f .j  27.4 m 2
Y6=20.5 70 j 1

500

26
d) Estime el promedio y la varianza del número de personas que duermen por vivienda

ni. 25
f i.    0,05
X ni. n.. 500
5
X1=1 25
x   ( X i ) f i.
X2=2 100 i 1

 (1).(0.05) (2).(0.20) ....  (5).(0.10)


X3=3 175
 3.2 personas
X4=4 150
5
S   X i  x  f i.
X5=5 50 2 2
x
500 i 1

 (1  3.2)2 .(0.05)  ......  (5  3.2)2 .(0.10)


 1.06 (personas) 2

27
INDEPENDENCIA ESTADÍSTICA ENTRE VARIABLES

Dos variables X e Y son estadísticamente independientes si la distribución de la característica X


es la misma en cualquier subconjunto de elementos definidos para la característica Y. En forma
perfectamente simétrica podrá intercambiarse X por Y
X e Y son estadístic amente independientes si :
f ( X i / Y j )  f ( X i ); i, j

Para cualquier X , se cumple que :
f ( X i / Y1 )  f ( X i / Y2 )  .........  f ( X i / Ys )  f ( X i )
Análogamen te : f (Y j / X i )  f (Y j ); ij

Recordando las distribuciones condicionales:


f ( X i  Yj )
f (Y j / X i )   f ( X i  Y j )  f ( X i ). f (Y j / X i )
f (Xi)
Y si X e Y son estadístic amente independientes entonces :
f ( X i  Y j )  f ( X i ). f (Y j )  f ij  ( f i. ).( f. j ); ij

Independencia entre X e Y quiere decir que la distribución conjunta es el


producto de las marginales
28
INDEPENDENCIA ESTADÍSTICA ENTRE VARIABLES

Ejemplo:
La siguiente tabla de frecuencias muestra la distribución conjunta de las características X e Y

Y
Y1 Y2 Y3 Y4 Total
X
X1 75 90 120 15 300
X2 100 120 160 20 400
X3 75 90 120 15 300
Total 250 300 400 50 1000

Y
Y1 Y2 Y3 Y4 Total
X Distribución conjunta de
X1 0.075 0.09 0.12 0.015 0.3 frecuencias relativas

X2 0.1 0.12 0.16 0.020 0.4


n14 20
X3 0.075 0.09 0.12 0.015 0.3 f14  
n.. 1000
Total 0.25 0.3 0.4 0.05 1

29
INDEPENDENCIA ESTADÍSTICA ENTRE VARIABLES
Ejemplo:
Para que X e Y sean estadísticamente independientes se debe cumplir para todas las
intersecciones ( X i  Y j )

f ij  ( f i. ).( f. j )
(f 1. ).(f .1 )  (0.30).(0.25)  0.075  f 11
(f 1. ).(f .2 )  (0.30).(0.30)  0.090  f 12
(f 1. ).(f .3 )  (0.30).(0.40)  0.120  f 13



(f 3. ).(f .3 )  (0.30).(0.40)  0.120  f 33
(f 3. ).(f .4 )  (0.30).(0.05)  0.015  f 34
Como se verifica la definición para todo i e j, se concluye que las variables X e Y
son estadísticamente independientes

30
INDEPENDENCIA ESTADÍSTICA ENTRE VARIABLES
Ejemplo:
Para que X e Y sean estadísticamente independientes se debe cumplir para todas las
intersecciones ( X i  Y j )

f ij  ( f i. ).( f. j )

0.075  f11  ( f1. ).( f.1 )  (0.3).(0.25)

31
Ejercicio
Para la siguiente distribución conjunta de frecuencias para 40 estudiantes en donde: X:
Número de hermanos , Y: Estatura en m

1) Halle para la variable X, las distribuciones:


f ( X i / Y j ); j  1,2,3,4,5
2) Halle para la variable Y, las distribuciones:
f (Y j / X i ); i  1,2,3,4
3) Halle e interprete
32
Ejercicio
Para la siguiente distribución conjunta de frecuencias para 40 estudiantes en donde: X:
Número de hermanos , Y: Estatura en m

3) Halle e interprete

f ( X 2 / Y3 )  ?
f (Y3 / X 2 )  ?

33
Ejercicio
4) Halle la función empírica
f (Y j / X 2 )
f (Y j / X 2 ) 
*

Ci
CY j Y f (Y j / X 2 )
0 si Y j  1,60 o Y j  1,78

0,04 Y1: (1,60; 1,64] 2/15  2 / 15 si Y  (1,60; 1,64 
0,04 Y2: (1,64; 1,68] 1/15  0,04

0,04 Y3: (1,68; 1,72] 4/15 f * (Y j / X 2 )  

0,04 Y4: (1,72; 1,76] 7/15 

0,04 Y5: (1,76; 1,78] 1/15 
Total 1.0 

5) Usando la función empírica: f * (Y j / X 2 ) halle:


f * (1,66  Y  1,74) / X 2   ?

34
Ejercicio
5) Halle e interprete

f ( X 3  Y4 )  ?
f ( X 2 / Y3 )  ?
f (Y3 / X 2 )  ?
6) halle:

M ( X / Y3 )  i 1 X i f ( X i / Y3 )  ?
5

S X2 / Y3  i 1  X i  M ( X / Y3 ) f ( X i / Y3 )  ?
5 2

7) ¿Hay independencia estadística entre las variables X e Y sí o no y por qué?

35

S-ar putea să vă placă și