Sunteți pe pagina 1din 47

DISTRIBUCIÓN MUESTRAL

 Una distribución muestral es una distribución de


Probabilidad de una estadística muestral calculada a
partir de todas las muestras posibles de tamaño "n"
elegidas al azar de una población determinada.
 Generalmente nos interesa conocer una o más de
los siguientes características de la distribución
muestral.
 1.- Su forma funcional (como aparece en su
representación gráfica).
 2.- Su media.
 3.- Su desviación estándar (error estándar)
Esquema: Distribución muestral
DISTRIBUCIÓN MUESTRAL DE LA MEDIA ( X )

La distribución muestral de X es la distribución probabilística de todos los

valores posibles de X que pueden ocurrir cuando se seleccionan muestras

(de tamaño n) de alguna población original con media  y con varianza 2.

Consideramos 2 casos:
10. SI LA SELECCIÓN SE HACE CON REPOSICIÓN DE UNA POBLACIÓN FINITA O
EQUIVALENTEMENTE SIN REPOSICIÓN DE UNA POBLACIÓN INFINITA
Si X es la media muestral, entonces:

1) E( X )  
2
2) Var ( X ) 
n
3) Para n suficientemente grande, la variable aleatoria. Z  X   N(0,1)
/ n
_ _
Lo que revela que:  x < , además,  x  0 cuando n  

 Para n 30 suficientemente grande, X N (  , 2/n ). Si X es contínua o discontínua

 Si X N (  , 2), entonces X N (  , 2/n ), para n > 2.

 X N (  , 2/n ), si el muestreo es con reemplazo de una población finita de tamaño N, o


sin reemplazo de una población infinita.
2º Si el muestreo es sin reemplazo en una
población finita de tamaño N.

2º. SI EL MUESTREO ES SIN REEMPLAZO EN UNA POBLACIÓN FINITA DE TAMAÑO N.

Entonces X tiene la siguiente distribución:


_
 E( x ) =  ;
 N n
 _ 
x n N 1
El coeficiente  N  n  se denomina factor de corrección para población finita (fcpf).
 N 1 
Cuando N >>n, el fcpf 1. Y debe obviarse en la fórmula anterior.

 2
NOTA: Si n<<N ( Es decir (n/N)<0.1), entonces, V ( X )  ; fcpf, se obvia.
n
 La variable Z  X   es N(0, 1)
Ejemplo. Distribución de media muestral
Consideremos una población hipotética de tamaño N=5. Cuyos valores son: Rx =  2, 4, 6, 8, 10  .
a. Calcular la media y la varianza de la población
b. Determinar la distribución de las medias de muestras de tamaño 2, seleccionadas al
azar con reposición.
c. Determinar la distribución de las medias de muestras de tamaño 2, seleccionadas al
azar sin reposición.
Solución
a. La distribución de probabilidad de esta población (X) finita de tamaño N = 5, es la
distribución uniforme :
Tabla 01
Xi 2 4 6 8 10
P(xi) = P(X=xi) 1/5 1/5 1/5 1/5 1/5
La media y la varianza de la población son respectivamente:
N

N N
xi x i
2  4  6  8  10
   xi f ( xi )   i 1
 6
i 1 i 1 N N 5
N

N x 2
i
2 2  4 2  6 2  8 2  10 2
 2   xi2 f ( xi )   2  i 1
 2   62  8
N 5
b) Muestras seleccionadas con reposición
Se pueden extraer m= Nn =52 = 25 muestras de tamaño dos con reposición.
Las muestras y sus medias correspondientes son las siguientes:
Tabla 02
1ª Unidad Muestral 2ª Unidad Muestral
2 4 6 8 10
2 2.2 2.4 2.6 2.8 2.10
(2) (3) (4) (5) (6)
4 4.2 4.4 4.6 4.8 4.10
(3) (4) (5) (6) (7)
6 6.2 6.4 6.6 6.8 6.10
(4) (5) (6) (7) (8)
8 8.2 8.4 8.6 8.8 8.10
(5) (6) (7) (8) (9)
10 10.2 10.4 10.6 10.8 10.10
(6) (7) (8) (9) (10)
Medias en ( X )
Aquí X tiene una media  = 6 y ² =8
Considerando todas las muestras posibles con reposición:
n
a) m = N = 5² = 25
Cálculo de la media y varianza.
Cálculo de medias X i : Ver tabla 02.
Tabla 01
2 3 4 5 6 7 8 9 10 total
Xi
P(xi) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 25/25

Para esta distribución de X , se tiene:


1 2 1
E ( X )     2( )  3( )  ...  10( )  6
x 25 25 25
 E (X )  
  1 1
V ( X )   ( X i   ) p( X i )  (2  6)
2
 ...  (10  6)  4
x 25 25
Pero el valor de la varianza se puede calcular también mediante:
2 8
 V (X )   4
n 2
2
Constatándose que la fórmula Var ( X )  , es correcta
n
distriucion de medias
media frec.absol
2 1
3 2 Forma funcional empírica
4 3 6
5 4
5
6 5
7 4 4
frec.absoluta

8 3
3
9 2
10 1 2

0
0 2 4 6 8 10 12
valor de la media
DISTRIBUCIÓN MUESTRAL De X CUANDO LA
POBLACIÓN ES NORMAL (σ es conocida)

Si la población madre (Xi ) se distribuye normalmente con media  y varianza


 2 , entonces la distribución de X cualquiera que sea su tamaño es también
normal con:

a) E( X )  
2
b) Var ( X ) 
n
X 
c) La variable aleatoria. Z  N(0,1)
/ n

x x

X X
EJEMPLO: Sea X  N (  = 50,  2 = 80 ) si se extraen todas las muestras posibles de tamaño n = 20, de esta población.
Entonces la distribución muestral de la media X , será: N ( 50, 80/20 = 4 ) . Hallar:
1) P( X > 48)
2) P(48< X < 54)
3) Cuál es el valor de la media arriba del cual se incluye el 20% de valores mas altos?

SOLUCIÓN
EJEMPLO.

Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente en forma
normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una
muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas

SOLUCIÓN
DISTRIBUCIÓN MUESTRAL DE X CUANDO “  ” ES CONOCIDA Y SE 2

DESCONOCE LA DISTRIBUCIÓN DE LA POBLACIÓN


Independientemente de la distribución que tenga la población Original (siempre que tenga una media finita  y

varianza  2 ), la distribución X N (  , 2/n ), cuando n  . y su distribución muestral


tiene:

a) E( X )  

b) Var ( X )  2
n
c) La variable aleatoria. X  N(0,1), para n ≥30
Z 
 / n

NOTA: 1/ no se requiere ninguna suposición acerca de la normalidad de la población original cuando n es


grande (n≥ 30).

SI LA POBLACIÓN ES FINITA DE TAMAÑO (N), EL ERROR ESTÁNDAR DE LA MEDIA ES

 N n
_ 
x n N 1
Ejemplo. La media de la precipitación en una cuenca hidrometeorológica tiene un promedio de
3.5 in. y una desviación estándar de 0.18 in ¿Cuál es la probabilidad de que en una muestra aleatoria
de 100 observaciones tomadas de esa cuenca, la media esté entre 3.53 y 3.56 kg?

Solución

X N(3.5, 0.0324),

X N(3.5, 0.000324 )

Como el error estándar de la media muestral es:  _ = 0.018


x

P( 3.53 ≤ X ≤ 3.56 ) = P (1.67 ≤ Z ≤ 3.33 ) =0.0471


Ejemplo
Un cierto envío de barras de hierro dio las siguientes resistencias a la fractura en una m.a. de tamaño 30 (en kg.):
xi = {1525, 1516, 1542, 1600,1590, 1553, 1530, 1585, 1570, 1545, 1548, 1570, 1595, 1531, 1542, 1555,
1567, 1539, 1541, 1550, 1558,1547,1562, 1570, 1554, 1528,1523, 1530, 1535,1529}
a. Estimar la media y la desviación estándar de la resistencia a la fractura.
b. Construya e interprete un intervalo del 90% de confianza para la R promedio a la Fractura del fierro.
Solución
DISTRIBUCIÓN DE LA MEDIA MUESTRAL CUANDO [2 ES DESCONOCIDA]

Se consideran 3 casos:

1. Si la población madre no es normal y “n” es pequeña.


Este caso no puede resolverse.

2. Si la población no es normal, pero “n” es grande.


Cuando n ≥ 30, x sigue una distribución t-Student con n-1 g.l, es decir:
x - x
------------ t(n-1)
S/n

3. Si la población es normal.
- Si n < 30, x sigue una distribución t- Student , es decir:
x -x
------------ t(n-1)
S/n

- Si n  30, entonces :
x - x
------------ N( 0, 1)
S/n
Ejemplo
La tabla siguiente muestra los datos relativos a la tormenta, las precipitaciones y escorrentía sobre un rio
determinado

Tormenta Precipitación ( escorrentiaa (pulgadas)


pulgadas)
1 1.11 0.52
2 1.17 0.40
3 1.79 0.97
4 5.62 2.92
5 1.13 0.17
6 1.54 0.19
7 3.19 0.76
8 1.73 0.66
9 2.09 0.78
10 2.75 1.24
11 1.20 0.39
12 1.01 0.30
13 1.64 0.70
14 1.57 0.77
15 1.54 0.59
16 2.09 0.95
17 3.54 1.02
18 1.17 0.39
19 1.15 0.23
20 2.57 0.45
21 3.57 1.59
22 5.11 1.74
23 1.52 0.56
24 2.93 1.12
25 1.16 0.64
a. Calcular la media, desviación estándar para la precipitación y escorrentía
b. Determine la distribución muestral de la media para la precipitación y
escorrentía.
c. Calcular la probabilidad que la media muestral de la precipitación sea mayor
que 1.25
Solución
a) Para la precipitación
Media muestral = 53.89/25 = 2.16 in.
Varianza muestral = 1/24 (153.9 – 25(2.16)2) = 1.53
D.E = 1.24 in.
Error estándar de la media = 0.25
Para la Escorrentía
Media muestral = 20.05/25 = 0.80 in.
Varianza muestral = 1/24( 24.68 – 25(0.80)2) = 0.36
D,E = 0.60 in.
Error estándar de la media = 0.60/5 = 0.12
a) Determine la distribución muestral de la media para la precipitación y escorrentía

Para la precipitación:
X

a) E ( X )    2.16

 2 1.53
b) Var ( X )   = 0.36
n 25

c) X N(, 2/n ) = N(2.16, 0.36)


Distribución muestral de una proporción
Distribución muestral de una proporción
La distribución muestral de “p”, o proporción muestral, calculada con base en muestras
aleatorias simples de tamaño “n” sacadas de una población en la que la proporción
poblacional es “P”, está distribuida en forma normal si “n≥ 30”;
a) E ( p)  P
P(1  P)
b) V ( p)  
n
c) Si n es grande, entonces la variable: Z  pP N(0,1)
P(1  P) n

 Si la población es finita de tamaño “N”, la distribución de “p” tendrá:


a) E ( p)  P

P(1  P)  N  n   N  n
b) V ( p )   N  1  ; Donde  N  1  =factor de corrección por población finita.
n
pP
c) Si n/N  0.05, el f.cp.f se obvia y la variable: Z  N(0,1)
P (1  P) n
Ejemplo
BelLabs adquiere componentes para sus teléfonos celulares en lotes de
200 de una firma en Palo Alto. El componente tiene una tasa de defectos
del 10%. Una política establecida recientemente por BelLabs establece
que si el siguiente envío tiene:
a. Más del 12% de defectos, definitivamente buscará un nuevo
proveedor.
b. Entre el 10 y el 12% de defectos, considerará un nuevo proveedor.
c. Entre el 5 y el 10% de defectos, definitivamente no conseguirá un
nuevo proveedor.
d. Menos del 5% de defectos, incrementará sus pedidos.
¿Cuál decisión es más probable que tome BelLabs?

Solución
Debido a que el tamaño de la población N no se suministra, se
asume que BelLabs compra muchos componentes y el tamaño de la
muestra de n = 200 es menor que 0.05N y por tanto el fcpf no se
tiene en cuenta
Ejemplo
En una remesa de vacunas, 30% son defectuosos. Si se extrae una muestra al azar de 500, con
reposición, de esta población. ¿ Cuál es la probabilidad de que la proporción muestral sea menor que 0.3
?.
Solución
Una distribución muestral que es normal la definen completamente su esperanza y su varianza. Aquí la
muestra es suficientemente grande para que la distribución de “p” sea aproximada por la normal.
Para la distribución de “p” con n = 500, tenemos:
E(p) = P = 0.3

P(1  P) = 0.3(1  0.3) = 0.025


p 
n 500
Teniendo en cuenta que: fcc = 1/2n = 1/1000 = 0.001; fcc= factor de corrección por
continuidad, ya que estamos aproximando la binomial mediante la normal.
La probabilidad pedida será:
P(p  0.3 )  P ( Z  (0.3+1/2n –0.3)/0.025) = P( Z  0.05 ) = 0.5199
DISTRIBUCIÓN MUESTRAL DE: [ (n-1)S2 /2]
Sea S2 la varianza de la muestra x1, x2, …, xn. Escogida de una población descrita por
una variable aleatoria X de media  y varianza 2 , entonces
a) E(S2) = 2
b) [(n-1)S2 /2] 2(n-1) , siempre que X N( , 2 )

Ejemplo . De una población X normal N(100 , 4 ) se obtiene una muestra aleatoria de tamaño 15.
a) Calcule la P(1.3316< S2 < 8.3256)
b) Halle el intervalo [a,b] , tal que P(a< S2 < b) = 0.95, P(S2 <a) = 0.025
Solución
P(14*0.3329 < 14 S2/ 2 < 14* 2.0814) = P [ 4.66 < 2(14) < 29.14) =0.99- 0.01 = 0.98
DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE
DE DOS MEDIAS MUESTRALES ( MUESTRAS
INDEPENDIENTES)
DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE DOS
MEDIAS CON VARIANZAS POBLACIONALES CONOCIDAS)
Supongamos que se tienen dos poblaciones con medias y varianzas definidas en los esquemas:

Población 1 Población 2

X1: Media =1 X2 : Media = 2


Varianza =  1 Varianza =  2
2 2

Muestra (n1): x11, x21, x31, . . ., xn1 Muestra (n2): x12, x22, x32, . . ., xn2
Media muestral = X 1 Media muestral = X 2

Entonces, la estadística X 1 - X 2 tiene las siguientes propiedades:


a)  X X  1   2
1 2

 12  22
b)  2
X1  X 2
 
n1 n2
c) Para n1 y n2 suficientemente grandes, la variable aleatoria:
X 1  X 2  ( 1  2 ) N (0,1)
Z
 2
 2


1 2

n1 n2
EJEMPLO: Se han extraído dos muestras aleatorias de tamaño n de dos

máquinas que embolsan automáticamente un mismo producto cuya


característica medible es el peso en gramos. Se sabe que los pesos de
los productos de cada máquina se distribuyen normalmente con
medias respectivas iguales a 120 gramos y con varianzas respectivas
2
iguales a 18 gramos . Encontrar el valor de n de manera que la
probabilidad de que las medias muestrales difieran en menos de 2
gramos se 0.95.
SOLUCIÓN

Sean X1 y X2 las medias de los pesos de las muestras respectivas. Los pesos de las poblaciones se
distribuyen normalmente con medias iguales y varianzas iguales. Entonces, la diferencia de las dos media
 12  22 
muestrales X1 - X2 tiene distribución normal, esto es: N  1  2 ,  
 n1 n2 

12  22 18  18 36
siendo 1 - 2 = 0, y la varianza sería:   
n1 n2 n n

X1  X 2  0
Luego, la variable estándar: Z N(0,1)
36 / n
Se debe hallar el valor de n tal que:

 
P X 1  X 2  2  0.95 , entonces,

 20   n n  n
0.95  P X 1  X 2  2  P  Z    P    Z    2 p ( Z     0.05)
 36 / n   3 3   3 
de donde resulta,

 n n
p( Z   )  0.975,  1.96, n  5.88, n  34.57  35
 3  3
EJEMPLO
Se prueba el rendimiento en km/L de 2 tipos de gasolina,
encontrándose una desviación estándar de 1.23km/L para la
primera gasolina y una desviación estándar de 1.37km/L para
la segunda gasolina; se prueba la primera gasolina en 35
autos y la segunda en 42 autos. ¿Cuál es la probabilidad de
que la primera gasolina de un rendimiento promedio mayor de
0.45km/L que la segunda gasolina?
SOLUCION
 Datos:
 1 = 1.23 Km/Lto
 2 = 1.37 Km/Lto
 n1 = 35 autos
 n2 = 42 autos
S0lución
Continúa solución:
DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE DOS

MEDIAS CON (VARIANZAS POBLACIONALES DESCONOCIDAS)

Supongamos que se tienen dos poblaciones con parámetros definidos como sigue:

Población 1 Población 2

X1: Media =1 X2 : Media = 2


Varianza =  1 (Desconocida) Varianza =  2 (Desconocida)
2 2

Muestra (n1): x11, x21, x31, . . ., xn1 Muestra (n2): x12, x22, x32, . . ., xn2
Media muestral = X 1 Media muestral = X 2
2 2
Varianza muestral = S1 Varianza muestral = S 2
varianzas poblacionales desconocidas
A. MUESTRAS GRANDES: n1, n2 ≥ 30.
En este caso la estadística X -X
1 2, (diferencia de medias muestrales) se distribuye aproximadamente

S12 S 22
Como una normal con 1  2 , y varianza 
n1 n2
. MUESTRAS PEQUEÑAS: n1, n2 < 30.
B.1 Varianzas poblacionales desconocidas pero supuestas iguales: 2 =  12   22
En este caso, la estadística:

( X 1  X 2 )  ( 1   2 ) t(n1+n2 – 2)
Tc 
(n1  1) Sˆ12  (n2  1) Sˆ22  1 1 
  
n1  n2  2  n1 n2 
Tiene distribución t- student con n1+n2-2 grados de libertad.
Ejemplo:
Suponga que dos máquinas A y B, producen
independientemente el mismo tipo de probetas y que el
tiempo que cada una emplea en producirlos se distribuye
normalmente con varianzas respectivas y desconocidas.
Se han tomado dos muestras aleatorias, una de A y otra de
B, obteniéndose los siguientes tiempos en minutos:
Muestra de A: 17, 23, 21, 18, 22, 20, 21, 19
Muestra de B: 13, 16, 14, 12, 15, 14
Determinar la distribución muestral de la diferencia de
medias, asumiendo que las varianzas son desconocidas
pero diferentes.
Calcular la probabilidad de que la media de la primera
máquina sea mayor que la de la segunda máquina
Solución
X ( tiempo producción ) máquina A  N ( μ1,  12 )  n1 = 8
Y ( tiempo producción ) máquina B  N ( μ2,  22 )  n2 = 6
Con α = 0.05 g.l. 1 = n1 – 1 = 7 y 2 = n2 - 1 = 5 ;
2 2
de la muestra: S1 = 4.13 y S 2 = 2.0

(n1 1)Sˆ12  (n2 1)Sˆ22  1 1  7 * 4.13  5 * 2.0  1 1 


 X1  X 2 =    =    = 0.9725
n1  n2  2  n1 n2  12 8 6

P[( 1  2 )>0]= P(( X 1 - X 2 )-( 1  2 )< (( X 1 - X 2 ))


= P[ ( (( X 1 - X 2 )-( 1  2 ))/  X1 X 2 < (( X 1 - X 2 )/  X1  X 2 ]
= P( Z< (( X 1 - X 2 )/  X1  X 2 )= P(Z<(20.125- 14.000)/0.9725)
= P(Z<6.30) = 1.000
Varianzas desconocidas supuestas desiguales

1  2
2 2
B.2. Varianzas poblacionales diferentes:

En este caso, la variable aleatoria:


2
 Sˆ Sˆ 
2 2


1
 
2
( X 1  X 2 )  ( 1  2 ) t g ; donde
 n1 n2 
T g 2
S12 S22 2
 Sˆ12   Sˆ 22 
2

n1 n2    
 n1    n2 
n1  1 n2  1
Si g no es entero se redondea al entero superior más cercano
Ejemplo.
Una empresa fabrica un mismo producto en 2
máquinas. Una muestra aleatoria de 9 productos
de la máquina uno, ha dado los siguientes tiempos
de fabricación en segundos : X1: 12, 28, 10, 25,
24, 19, 22, 33, 17; mientras que una muestra
aleatoria de 8 productos de la máquina dos, X2:
X - X =x
1 2

16, 20, 16, 20, 16, 17, 15, 21.


Asumir que las dos poblaciones son normales con
varianzas diferentes pero desconocidas.
a. Hallar la distribución de probabilidades de
X 1- X 2 =  x

b. Calcular la probabilidad de que la máquina


uno presenta un tiempo promedio mayor que la
máquina dos.
Sean X1 y X2 las v.a que representan los tiempos empleados por las máquinas uno y dos, respectivamente.
De las muestras dadas obtenemos:
a) X1: n1 = 9, x 1 = 21.111, S1 = 7.4237
b) X2: n2 = 8, x 2 = 17.625, S2 = 2.326

X 1- X 2 =  x , tiene:   x = 1 - 2;  x =  [(7.4237)2 /9 + (2.326)2 /8 ] = 2.6


[ x -  ] /  x = T  T ( t- Student con  grados de libertad ); donde.
[(7.4237)2 /9 + (2.326)2 /8 ] 2
 = --------------------------------------------------- - 2 = 10.17  11
[(7.4237 /9)2 /10 + (2.326 /8)2 /9 ]

P[1 > 2 ] = P [1 - 2 > 0 ] = P [( X 1- X 2 - (1 - 2) ) /  x ] > ( X 1- X 2 )/  x 


= P [ Z >(-3.486)/2.6 ] = 0.9099
EJEMPLO. A fin de mejorar el rendimiento, se está utilizando un proceso químico. Por el
momento se está utilizando el catalizador 1, pero un nuevo catalizador 2 es aceptable. Se
realiza un experimento en la planta piloto, empleando para el catalizador 1 n1= 8 ensayos y n2
= 8 para el catalizador 2. Las medias y varianzas muestrales observadas son X 1 = 91.73 ,
S12 = 3.89; X 2 = 93.75 y S22 = 4.02

a) Determinar la distribución muestral de  x


b) Asumiendo que las varianzas poblacionales son desconocidas pero iguales. Presentan los
datos suficiente evidencia para indicar que el uso del catalizador 2 mejora el rendimiento
promedio 
Solución
a)  x = X 1- X 2, tiene una distribución t-Student con (n1+n2 – 2) , es decir:
( X 1  X 2 )  ( 1   2 )
T 
(n1  1) Sˆ12  (n2  1) Sˆ 22  1 1 
  
n1  n2  2  1
n n 2 

( n1  1) ˆ
s 2
 ( n 2  1) ˆ
s 2
 2
  2
Sc 
2 1 2
, se denomina varianza combinada, y estima a  = 1 2
2
n1  n2  2
Sustituyendo datos, se tiene: S c2  3.96 ,  ( x x ) =
1 2
0.995 (error estándar de la  x )
b) Para dar respuesta a la proposición (b), se calcula p(2  1).

p(2  1) = p(1 - 2< 0 ) = p(-(2 - 1)< 0) = p [( X 2- X 1)- (2 - 1) < ( X 2- X 1)]

p [(( X 2- X 1)- (2 - 1))/ Sc< 2.02/0.995] = P( T < 2.03) = 1-p(T>2.03) =1-P0

El cálculo de Po, se hace por interpolación, a partir de tablas:


Valor de “t” 1.761 2.03 2.145
P(T>t) 0.05 Po 0.025

Resultando Po = 0.0325

Finalmente p(2  1) = 1 – Po = 1 – 0.0325 = 0.9675

Sea X 1 la media de una muestra aleatoria de tamaño n1 extraída de una población


normal N(1,12), y sea X 2 la media de otra muestra aleatoria de tamaño n2 extraída de la
población normal N(2,22), independiente de la anterior.
Distribución Muestral de Diferencia de Proporciones
Distribución Muestral de Diferencia de 2 Proporciones

La distribución muestral de p1 – p2, o diferencia entre dos


Proporciones muestrales, calculadas a partir de muestras aleatorias e
independientes de tamaño n1 y n2 extraídas en forma aleatoria de 02
poblaciones con parámetros P1 y P2; tiene como:
 p1  p2 = P1 – P2

p1 (1  p1 ) p2 (1  p2 )
 p1  p2  
n1 n2
Si n1 y n2 son grandes la distribución muestral de p1 - p2 se aproxima
a una distribución normal
EJEMPLO: El Ingeniero de control de calidad de una industria
opina que el 15% de la producción de la línea de producción A y
el 10% de la línea de producción B no cumplen con las
especificaciones normales de dulzura. En una muestra aleatoria
simple de 150 artículos de la línea de producción A se encontró
que 30 tenían ese problema. Una muestra aleatoria simple e
independiente de 100 artículos de la línea de producción B reveló
que 07 estaban fuera del rango normal.

Asumiendo que la evaluación del control de calidad es correcto.


¿ Cuál es la probabilidad de encontrar una diferencia entre las
proporciones muestrales mayor o igual a la que realmente se
Solución.
Como n1 = 150 y n2 = 100 son grandes  P1 - P2  normal
aproximadamente.
 p  p  0.15  0.10  0.05
1 2

(0.15)(0.85) (0.10)(0.90)
 p p    0.04
1 2
150 100
Si el control es correcto, las proporciones muestrales observadas son:
P1 = 30 / 150 = 0.20 P2 = 7 / 100 = 0.07
Deseamos conocer la probabilidad de observar una diferencia mayor o
igual a:
P1 - P2 = 0.20 - 0.07 = 0.13
Para hallar esta probabilidad calculamos:
 ( p1  p 2 )  ( P1  P2 ) 0.13  0.05 
p( p1  p 2  0.13)  p  
  p2  p2 0.04 

 pZ  2.0  0.5  0.4772  0.0228  2.28 %
DISTRIBUCIÓN MUESTRAL DE LA RAZON ( S12/ S22)
Si S12 y S22 son las varianzas de dos muestras aleatorias independientes de tamaños n1 y n2
seleccionadas de dos poblaciones normales N(1, 12 ) y N(2, 22) respectivas, entonces, la variable
aleatoria
S12/ 12
F = --------------
S22 /22
Tiene una distribución F con n1- 1, n2-1 grados de libertad, esto es F = F 1-α, (n1- 1, n2-1).

Observación Si 12 = 22 , entonces F = S12/ S22 se distribuye según F con n1- 1, n2-1 grados de
libertad.

Ejemplo. De poblaciones N(1, 12 ) y N(2, 22) independientes se extraen dos muestras de
tamaños 13 y 21 respectivamente. Halle el valor de k tal que :
a) P(S12 < k S22 ) = 0.99 b) P( S12/ S22 < k)= 0.05

Solución
a) P(S12 < k S22 ) = 0.99, significa que P(F<k ) = 0.99, donde F = S12/ S22  F(12, 20),
entonces K= 3.23
b) P(S12/ S22 <k) = 0.05, implica que P(F<k) = 0.05, donde F = S12/ S22  F(12, 20), entonces
K = 1/ F0.95, 20,12 = ½.54 = 0.394
Ejemplo.
Si dos muestras aleatorias independientes de tamaños n1=7 y n2= 13, se toman de una población
normal, ¿ Cuál es la probabilidad de que la varianza de la primera sea al menos 3 veces más grande que la de
la segunda .
Solución.
En la tabla F hallamos que F0.05 es 3.0 para 1 = 6 y 2 = 12. Por tanto la probabilidad deseada es:
P[S12/ S22  3/1] = P [ F0.05,6,12  3.0 ] = 0.05

Ejemplo. Encuéntrese la probabilidad de F0.95 (correspondiente a la probabilidad de cola izquierda de 0.05) para
1 = 10 y 2 = 20. grados de libertad.
Solución
Usando la identidad:
F(1, 2 ) = 1/ F1-(2, 1 ).
Obtenemos:
F0.05 (10, 20) = 1/ F0.95 (20, 10) = 1/ 2.77 = 0.36

DISTRIBUCIÓN F – SNEDECOR.

Usaremos tablas para calcular probabilidades en la forma: P[ F  F1-(1, 2 ) ] = 1- 

Para valores de 1-  = 0.10, 0.05, 0.025, 0.01, 0.005,

se considera la identidad:

F1-(1, 2 ) = 1 / F(2, 1 ).

S-ar putea să vă placă și