Sunteți pe pagina 1din 53

UNIVERSIDAD DEL ATLNTICO

ESTADISTICA INFERENCIAL

DOCENTE:
MGc. KENNEDY HURTADO IBARRA

BARRANQUILLA COLOMBIA
Referencias:
Llnas, Humberto; Estadstica Inferencial.
Canavos George, Probabilidad y Estadsticas Aplicaciones y Mtodos.
Montgomery Douglas, Probabilidad y Estadstica para Ingeniera.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Introduccin:
En este capitulo, dedicaremos gran parte de nuestra atencin a analizar
problemas que tienen por objeto averiguar algo acerca de las
propiedades de una poblacin a partir de la informacin
proporcionada por una muestra de dicha poblacin. Este es el objetivo
de la estadstica inferencial. La razn principal para observar una
muestra en lugar de la poblacin completa es el hecho de que la
poblacin es grande. Incluso en los casos en que se dispone de
recursos sucientes para analizar la poblacin completa, puede
resultar preferible dedicar esos recursos a un subconjunto pequeo de
la poblacin, con la esperanza que tal concentracin de esfuerzos
produzca medidas ms precisas.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Denicin: El error muestral es la diferencia entre un estadstico de la
muestra y el parmetro correspondiente de la poblacin.
Definicin: El sesgo muestral es la tendencia sistemtica a favorecer la
seleccin de ciertos elementos de una muestra en lugar de otros.

TECNICAS DE MUESTREOS ALEATORIOS

El sesgo muestral puede suprimirse, o minimizarse, usando el principio


de aleatorizacin. Este principio se reere a cualquier proceso de
seleccin de una muestra de la poblacin en el que la seleccin es
imparcial o no est sesgada. Una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria. Los tipos ms comunes de
tcnicas de muestreo aleatorio son:

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


El muestreo aleatorio simple.
El muestreo estraticado.
El muestreo por conglomerados.
El muestreo sistemtico.

Muestreo aleatorio simple.


Denicin: Un procedimiento de muestreo aleatorio simple es
aquel en el que todas las posibles muestras del mismo tamao
tienen la misma probabilidad de ser escogidas. A las muestras
obtenidas por procedimientos de este tipo se las denomina
muestras aleatorias simples.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Muestreo estraticado.
Denicin : Suponga que una poblacin de N individuos puede subdividirse
en K grupos mutuamente excluyentes (disyuntos), llamados estratos. El
muestreo (aleatorio) estratificado es la seleccin de muestras aleatorias
simples independientes de cada uno de los estratos de la poblacin.

Muestreo por conglomerados.


Denicin: Supongamos que una poblacin puede dividirse
convenientemente en unidades relativamente pequeas y geogrficamente
compactas llamadas conglomerado. En el muestreo por conglomerados, se
selecciona de la poblacin una muestra aleatoria simple de conglomerados, y
se contacta con cada individuo de los conglomerados de la muestra, es decir,
se lleva a cabo un censo completo en cada uno de los conglomerados
elegidos.
Muestreo sistemtico

Denicin: El muestreo sistemtico es una tcnica de


muestreo que requiere de una seleccin aleatoria inicial de
observaciones seguida de otra seleccin de observaciones
obtenida usando algn sistema o regla.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Denicin de inferencia estadstica.

Es el proceso de sacar conclusiones de la poblacin basada en la


Informacin de una muestra tomada de ella.

Objetivos de la estimacin:

Estimacin de parmetros.
Intervalos de confianzas.
Pruebas de hiptesis.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Denicin: Distribucin muestral.

La distribucin de un estadstico muestral recibe el nombre de


distribucin muestral, o distribucin en el muestreo y se dene
como la distribucin de probabilidades de los valores que puede
tomar el estadstico a lo largo de todas las posibles muestras con el
mismo numero de observaciones que pueden ser extradas de la
poblacin.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Distribucin muestral de la media

Si sacamos muestras aleatorias de tamaos n de una poblacin con


media y desviacin estndar , entonces la distribucin muestral
tiene las siguientes propiedades.
El promedio de todos los valores posibles de medias mustrales es
igual al parmetro .
= = E(x)
Error estndar de la media muestral.
Es la desviacin estndar de las posibles medias mustrales,

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Si la poblacin original tiene distribucin normal , entonces para cualquier
tamao muestral n la distribucin de la media muestral es tambin normal.
( Teorema de limite central)
X ~ N(, ), entonces, la distribucin de la media muestral ~ N (, / )

Si la poblacin original no es normal, pero n es suficientemente grande la


distribucin de la media es aproximadamente normal

X ~ N(, ), entonces, la distribucin de la media muestral ~ N (, / )

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


El caso para muestras grandes.

Teorema: Sea la media de una muestra aleatoria de tamao n


tomada de una poblacin con media y varianza 2> 0

Supongamos que se cumple alguna de las siguientes condiciones:


a) La poblacin es normal y es 2 conocida (no importa el tamao
de n).

b) La poblacin es normal, 2es desconocida y n 30

c)La forma de la poblacin es desconocida (o no normal), 2


es conocida o desconocida y n 30.

Entonces, la distribucin muestral de la media muestral X es normal


con media y varianza 2.
REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO
Como consecuencia de este teorema, se puede concluir
que la variable aleatoria Z = (X)/
Est distribuida normalmente con media 0 y varianza 1.
Adems,
en los casos en que la varianza sea desconocida y n 30,
reemplazamos la desviacin poblacional por la
desviacin muestral s.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Ejemplo:
Supongamos que el incremento porcentual de los salarios de los
funcionarios de todas las corporaciones medianas se distribuye
siguiendo una normal con media 12,2% y desviacin tpica 3,6%. Se
toma una muestra aleatoria de nueve observaciones de esta poblacin
de incrementos porcentuales de salario. Cul es la probabilidad de que
la media muestral sea mayor del 10%?.
Solucin:
Tenemos que = 12,2, = 3,6 y n = 9.
Nos piden calcular P(X > 10). Como no conocemos el tamao de la
poblacin, supondremos que esta es innita. Entonces, por el teorema,
la media y el error estndar de la distribucin muestral de X son:
= = 12,2 y = / = 3,6/ 9 = 1,2.

P(X > 10) = P([Z > (10) / ] = P[Z > (1012,2)/ 1,2] = P(Z > 1,83) =
1P(Z 1,83)
Ahora, como la poblacin es normal y la varianza poblacional es
conocida, entonces, por el teorema, la distribucin muestral de la
media muestral es normal o, lo que es equivalente, la variable Z tiene
normal estndar .

Por tanto, teniendo que es la funcin de distribucin normal


estndar, entonces, de la tabla normal,
Tenemos que:

P(X > 10) = 1P(Z 1,83) = 1 (1,83) = 10,0336 = 0,9664 97%.

Concluimos, entonces, que la probabilidad de que la media muestral


sea mayor que un 10% es aproximadamente del 97%.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Ejemplo:
Un fabricante declara que la duracin de las bujas que l fabrica sigue
una distribucin normal con una media de 36.000 kilmetros y una
desviacin estndar de 4.000 kilmetros. Para una muestra aleatoria de
diecisis bujas, se obtuvo una duracin media de 34.500 kilmetros. Si la
armacin del fabricante es correcta, cul es la probabilidad de obtener
una media muestral tan pequea como esta o menor?

Solucin:
Tenemos que = 36.000, = 4.000 y n = 16.
Nos piden calcular P( < 34.500).
Como no conocemos el tamao de la poblacin, supondremos que esta
es innita. Entonces, por el teorema, la media y el error estndar de la
distribucin muestral de son:

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


= = 36.000 y
= / =
4.000 / 16 = 1.000.

Entonces:

P(X < 34.500) = P[Z < (34.500 ) / = P[Z < (34.50036.000) /1.000]

= P(Z < 1,5)


Ahora, como la poblacin es normal y la varianza poblacional es conocida,
entonces, por el teorema, la distribucin muestral de la media muestral es
normal o, lo que es equivalente, la variable Z tiene normal estndar.
Por tanto, teniendo que es la funcin de distribucin normal estndar,
entonces, de la tabla normal.
Tenemos que:
P(X < 34.500) = P(Z < 1,5) = (1,5) = 0,0668 6,68%.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Ejemplo:
Los tiempos requeridos para que unos trabajadores terminen cierta labor, se
distribuyen normalmente con media de 30 minutos y una desviacin estndar
de 9 minutos. Si de la planta de trabajadores se toma una muestra aleatoria de
25, encuentre la probabilidad de que la media del tiempo requerido para
concluir la tarea en la muestra, est entre 28 y 33 minutos.
Solucin:
En este ejemplo
= 30, =9 y n = 25.
Nos piden calcular P(28 < < 33).
Como no conocemos el tamao de la poblacin, supondremos que esta es
innita. Entonces, por el teorema, la media y el error estndar de la distribucin
muestral de X son:
= = 30 y = / = 9 / 25 = 1,8

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Por consiguiente, la probabilidad requerida es:

P(28 < < 33) = P[(28 )/ < Z <(33 ) / ]

P[(2830) / 1,8 < Z < (2833) / 1,8]

= P(1,11 < Z < 1,67) = P(Z < 1,67) P(Z < 1,11).

Ahora, como la poblacin es normal y la varianza poblacional es conocida,


entonces, la variable Z tiene normal estndar.
Por tanto, de la tabla normal.
Tenemos que P(28 < X < 33) = P(Z < 1,67) P(Z < 1,11) = (1,67) (1,11) =
0,819 82%.
Por consiguiente, la probabilidad pedida es aproximadamente del 82%.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Distribucin muestral de la media muestral para
muestras pequeas

Teorema:
Si el muestreo se hace en una poblacin normal con varianza desconocida y
si las muestras seleccionadas son de tamao n < 30, entonces, la
distribucin muestral de la media muestral es la t de Student con n1
grados de libertad.
( )
Este teorema implica que la variable aleatoria t =

tiene distribucin t estudent con v= n 1 grados de libertad.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


-
La distribucin t, de la misma manera que la distribucin normal
estndar, tiene forma de campana y tiene media igual a 0, alrededor de la
cual es simtrica. Su varianza, en cambio, es mayor que 1, hecho que
origina que la tpica distribucin t sea menos aguda en el centro y ms
alta en las colas que la distribucin normal estndar.

El rea total bajo la distribucin t es igual a 1. Hay una distribucin t


diferente para cada valor de n 1 (llamado grado de libertad). .

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


-
Ejemplo:
Suponga que de una poblacin normal con media 20 se toma una muestra
de tamao 16. Si la desviacin estndar muestral es 4, encuentre la
probabilidad de que la media muestral sea estrictamente mayor que 21,753.

Solucin:
Tenemos que = 20, s = 4 y n = 16.
Debido a que la poblacin es normal con desconocida y a que n < 30,
entonces, aplicaremos el teorema. Es decir,
la distribucin muestral de la media muestral es la t de Student con v= n1 =
15 grados de libertad.
Entonces: = = 20 y = s / =4/ 16 = 1.
Con esto, encontramos el valor de t para 21,753. Debido a que:

t = ( )/ = (21,75320) /1 = 1,753
y teniendo en cuenta la tabla t de Student con 15 grados de libertad, entonces, la
probabilidad pedida ser.

P( > 21,753) = P(t > 1,753) = 0,05 = 5%.

Ejemplo:
Una muestra aleatoria de seis autos de un determinado modelo
consumen las siguientes cantidades en kilmetros por litro:
18,6 18,4 19,2 20,8 19,4 20,5. Determine la probabilidad de que el
consumo de gasolina medio muestral de los automviles de este
modelo sea menor que 17,6 kilmetros por litro, suponiendo que la
distribucin de la poblacin es normal con media 17.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


-
Tenemos que = 17 y, en este caso, la muestra escogida es de tamao
n = 6.
La media de la muestra es =19.4833 y S = 0.98.
Debido a que la poblacin es normal con varianza desconocida y a que n < 30,
entonces, por el teorema, la distribucin muestral de la media muestral es la t de
Student con n1 = 5 grados de libertad.,
Encontramos que:
= = 17 y =s / = 0,98 / 6 0,4.

Con esto, el valor de t para 17,6 es t =( )/ = (17,617) / 0,4 = 1,5

Con ayuda de la tabla t de Student con 15 grados de libertad, entonces, la


probabilidad pedida ser:

P( 17,6) = P(t 1,5) = 1P(t > 1,5) 10,10 = 0,90.


Distribucin muestral de una proporcin muestral
Sea X el nmero de xitos en una muestra binomial de n observaciones,
donde la probabilidad de xito es p. Entonces, la proporcin de xitos en la
muestra = X/ n recibe el nombre de proporcin muestral.

Teorema:
Sea la proporcin de xitos en una muestra aleatoria de n observaciones.
Sea 0 la proporcin de xitos en la poblacin. Entonces, la distribucin
muestral de la proporcin muestral tiene media p = 0 y varianza 2 dada:
por:
2 =0 (10 ) /n si la poblacin es innita,

(1 )
2 = . 0 0
, si la poblacin es nita, de tamao N y si N no es
1
demasiado grande en comparacin con n.
Teorema:
(Teorema de De Moivre-Laplace) Sea la proporcin de
xitos en una muestra aleatoria de n observaciones. Si
se cumple alguna de las dos condiciones siguientes:
n 30 o
np 5 y n(1p) 5,
Entonces, la distribucin muestral de la proporcin
muestral se puede aproximar con una distribucin
normal.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Ejemplo:
Se toma una muestra de 250 casas de una poblacin de edicios antiguos para
estimar la proporcin de casas de este tipo cuya instalacin elctrica resulta
insegura. Supongamos que, de hecho, el 30% de todos los edicios de esta
poblacin tienen una instalacin insegura. Hallar la probabilidad de que la
proporcin de edicios de la muestra con instalacin insegura est entre 0,25 y
0,35.
Solucin:
Tenemos que p0= 0,30 y n = 250. Por consiguiente, tenemos que:
0,25 p0 0.25p0
P(0,25 < p < 0,35) = < <

0 (1 0 ) 0.30(10.30)
= = = 0.029
250

0,25 0,30 0.350.30


P(0,25 < p < 0,35 = 0.029
<< 0,029
=
= P(1,72 < Z < 1,72) = P(Z < 1,72) P(Z < 1,72).

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Ahora, como n 30, entonces, por el teorema de De Moivre-Laplace , la
variable Z tiene distribucin normal estndar. Por tanto, de la tabla
normal, tenemos que:

P(0,25 < p < 0,35) = P(Z < 1,72) P(Z < 1,72) = (1,72) (1,72) =

0,9573 0,0427 = 0,9146.

Por tanto, la proporcin de casas con instalacin insegura estar dentro de


este rango para, aproximadamente, el 91,5% de las muestras de 250
observaciones de esta poblacin.
Ejemplo: Se desea estudiar una muestra de 20 personas para saber la proporcin de
ellas que tienen ms de 40 aos. Sabiendo que la proporcin en la poblacin es del
40%, cul es la probabilidad de que la proporcin en la muestra sea menor del
50%?
SOLUCIN:
Aqu, n = 20 y p0= 0,4. tenemos que:

0(1 0 ) 0.40(10.40)
= = = 0,1095
20
Por consiguiente, la probabilidad pedida es:
0,5 0 0,5 0,4
P(p < 0,5) =P < = P < = P(Z< 0,91)
0,1095

Ahora, observe que n < 30. Pero, debido a que


np = 8 5
n(1p) = 12 5,
entonces, por el teorema de De Moivre-Laplace, la variable Z tiene
distribucin normal estndar. Con esto y con la tabla normal, tenemos
que:

P(p < 0,5) = P(Z < 0,91) = (0,91) = 0,8186.

Por tanto, la probabilidad de que la proporcin en la muestra sea menor


del 50% es aproximadamente del 82%.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


entonces, por el teorema de De Moivre-Laplace, la variable Z tiene
distribucin normal estndar. Con esto y con la tabla normal, tenemos
que:

P(p < 0,5) = P(Z < 0,91) = (0,91) = 0,8186.

Por tanto, la probabilidad de que la proporcin en la muestra sea menor


del 50% es aproximadamente del 82%.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


-
Distribucin muestral de diferencia de dos
proporciones muestrales.
En muchas situaciones practicas el investigador necesita
hacer inferencias sobre la diferencia entre dos
proporciones poblacionales. A continuacin se dan
algunos ejemplos:
Medicina. Es ms alto el porcentaje de los casos de
cncer pulmonar en una poblacin que fuma que en
otra compuesta por no fumadores?
Administracin. Hay diferencia entre los porcentajes
de hombres y mujeres en posiciones gerenciales?

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


TEOREMA:
Sea 1 la proporcin de xitos observada en una muestra aleatoria de
tamao 1 , procedente de una poblacin con proporcin 1 de xitos, y sea
2 la proporcin de xitos observada en una muestra aleatoria
independiente de tamao 2 , procedente de una poblacin con proporcin
de xitos 2 . Si los tamaos muestrales son grandes, entonces, la
distribucin muestral de 1 2 es la normal con media 01 2 y varianza

1 ( 11 ) 2 ( 1 2 )
+ .
1 2

(12 ) (1 2 )
Esto implica que: z = , tiene distribucin normal

1 (1 2 ) (1 2 )
2
1
+ 2

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


estndar. Adems, esta aproximacin es valida si se cumple alguna de las dos
condiciones siguientes:
1 30 y 2 30.
1 1 5, 1 (11 ) 5, 2 2 5 y 2 (12 ) 5.

Ejemplo:
Los hombres y mujeres adultos radicados en una ciudad grande del norte
de cierto pas dieren en sus opiniones sobre la promulgacin de la pena
de muerte para personas culpables de asesinato. Se cree que el 12% de
los hombres adultos estn a favor de la pena de muerte, mientras que
slo el 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras
aleatorias, una de 150 hombres y otra de 100 mujeres, su opinin sobre
la promulgacin de la pena de muerte para personas culpables de
asesinato, determine la probabilidad de que el porcentaje de hombres a
favor sea al menos 3% mayor que el de mujeres.
Representemos con:
1 el porcentaje de hombres a favor de la pena de muerte
2 el de mujeres.
1 2 = 0,120,10 = 0,02

El error estndar de las diferencias entre las proporciones muestrales es:



1 (11 ) 2(1 p2 ) 0,12 (0 ,88) 0,10(10,90)
12 = + = + = 0,04

1 2 150 100

Entonces, el valor Z para 1 2 = 0,03 esta dado por:


1 2 2 0,03 0,02 0,01
Z= = = = 0,25
1 2 0,04 0,04

Fcilmente, podemos vericar que se cumplen las condiciones que se necesitan para
poder utilizar la aproximacin del teorema. Por tanto, por este teorema, la
probabilidad pedida ser:
P(1 2 0,03) = P(Z 0,25) = 1 P(Z 0,25) = 1 0,5987 = 0,4013.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO - Especializacin


en Estadstica.
Distribucin muestral de diferencia de medias

En muchas situaciones practicas el investigador concentra su


investigacin en dos poblaciones. A menudo se desea sacar
inferencias acerca de la diferencia entre dos medias
poblacionales. El mtodo apropiado para analizar esta
informacin depende del procedimiento empleado al
seleccionar las muestras. Para ello se deben considerar las dos
posibilidades siguientes:
Datos pareados (o muestras dependientes)
Muestras independientes.
Datos pareados (o muestras dependientes)
Teorema:
Supongamos que disponemos de una muestra aleatoria de datos
pareados procedentes de distribuciones con medias 1 y 2 . Sean d y
la media y la desviacin estndar muestral para las n < 30
diferencias di = xi yi. Si se asume que la distribucin de las
diferencias es normal, entonces, la distribucin muestral del D = X Y
es la t de Student con n1 grados de libertad.

Ejemplo: La tabla de abajo recoge los datos de consumo de gasolina


correspondiente a una muestra aleatoria de 8 automviles
norteamericanos de dos modelos diferentes. Se formaron pares con
las dos muestras y cada elemento de un determinado par fue
conducido por la misma ruta y por el mismo piloto.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Xi =(Auto A) 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4
Yi =(Auto B) 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2

(a) Determine la media y la desviacin muestral de las diferencias en el


consumo de gasolina.
(b) Suponiendo que la distribucin de las diferencias poblacionales es normal
con media -0,807, encuentre la probabilidad de que el consumo promedio de
gasolina del auto A sea mayor que el del auto B.

SOLUCIN:
(a) En la siguiente tabla se incluyen las diferencias di entre los datos de la tabla
anterior. Estas diferencias forman una muestra aleatoria procedente de una
poblacin cuya media es AB, la diferencia entre las medias poblacionales
entre dos modelos de autos.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Xi =(Auto A) 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4
Yi =(Auto B) 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2
di -0,2 1,3 2,2 0,1 1,2 0,9 -0,5 1,2

d = 0,775 v = n -1 = 7
2 = 0,816

Por lo que = 0,903

. ) 1 - 2 = -0,807

= 0,27 = = 0,3413

0(0,807)
P(d1>d2) = P > =P(t>2,3645) = 0,025
0,3413

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO-


-
Muestras independientes
Consideremos dos poblaciones con medias 1 , 2 y varianzas 1 y 2,
respectivamente, y supongmos que se seleccionan dos muestra
aleatorias independientes de tamaos 1 , 2 , con medias 1 , 2 y
varianzas 1 y 2 , respectivamente. El objetivo tambin es
determinar la distribucin muestral de 1 2 . Para ello
distinguiremos los siguientes casos:
Primer caso: varianzas poblacionales conocidas o desconocidas y
muestras grandes.
Si las dos poblaciones son normales, entonces, 1 2 tambin es
normal. Por tanto, la variable aleatoria,
1 2 1 2
Z = ,tiene una distribucin normal estndar.
2
1 2
2
+
1 2

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Teorema:
Sean 1 , y 2 , las medias de muestras aleatorias
independientes de tamaos 1 y 2 de poblaciones con
medias 1 , 2 y varianzas 12 y 22 respectivamente.
Supongamos que se cumple alguna de las siguientes
condiciones:
(a) Ambas poblaciones son normales y ambas varianzas
poblaciones 12, 22 son conocidas;
(b) Ambas poblaciones son desconocidas o no normales,
ambas varianzas poblacionales 12 y 22 son conocidas o
desconocidas y 1 30, 2 30.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Ejemplo:
En un estudio para comparar los pesos promedios de nios y nias de
sexto grado en una escuela de instruccin media, se usar una muestra
aleatoria de 20 nios y otra igual de 25 nias. Se sabe que, tanto para
nios y nias, los pesos siguen una distribucin normal. El promedio de
los pesos de todos lo nios de sexto grado de esa escuela es de 100
libras y su desviacin estndar es de 14,142, mientras que el promedio
de los pesos de todas las nias del sexto grado es de 85 libras y su
desviacin estndar es de 12,247. Encuentre la probabilidad de que el
promedio de los pesos de los 20 nios sea al menos 20 libras ms
grande que el de los de las 25 nias.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


Supongamos que 1 representa el promedio de los pesos de 20 nios y
2 , el promedio de los pesos de una muestra de 25 nias. Nos piden
calcular P( 1 2 > 20). Como las dos poblaciones en cuestin son
normales y con varianzas conocidas, entonces, por el teorema, tenemos.

La distribucin muestral de 1 2 es aproximadamente normal.


La media de la distribucin muestral de es igual a 1 2 = 100 -85 = 15.
La varianza de la distribucin muestral de 1 2 es:
12 22 14,1422 12,2472
+ = + = 16
1 2 1 2

Entonces, para determinar P(1 2 > 20), encontramos el valor Z para una
diferencia de 20 libras.
20 15
< = 1,25,
16
P(1 2 > 20) = P(Z 1,25) = 1 P(Z 1,25) = 1 0,8944 = 0,1056.
Por tanto, la probabilidad de que el promedio de los pesos de la muestra
de nios sea al menos 20 libras ms grande que el de la muestra de las
nias es 0,1056.

Segundo caso: varianzas poblacionales desconocidas,


iguales y muestras pequeas.
Considere el caso en que se desconocen 12 y 22 , pero iguales, digamos,
12 = 22. Entonces, la variable aleatoria tiene 1 2 media 1 2 y
varianza:

2 2
+ , Adems, se puede probar que si las dos poblaciones son
1 2
normales, entonces, 1 2 tambin es normal. Por tanto, la variable
aleatoria-
1 2 1 2
t = ,
2 2
1
+
2

1 1 12 + 2 1 22
2
= 1 2 2
; varianza muestral combinada.
Teorema:
Si 12 = 22. son iguales y desconocidas, entonces, la distribucin
muestral de la media tiene media 1 2 y varianza estimada igual a
2 2
+ , siendo 2 es la varianza muestral combinada. Adems, si las
1 2
dos poblaciones en cuestin son normales y los tamaos de las
muestras son pequeos (es suciente considerar que sean
estrictamente menores que 30), entonces, la variable aleatoria

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


1 2 1 2
t = esta distribuida se segn la distribucin t con
2 2
1
+ 2
v=1 2 2 grados de libertad.

Ejemplo:
Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de
respuesta de las ratas a determinado estimulo, se estn comparando en un
experimento de laboratorio. El experimentador supone que las respectivas
poblaciones de los tiempos de respuesta al estimulo no estn distribuidos
normalmente y tienen varianzas iguales. Se administra la droga A a 12 ratas
y la droga B a 13. Cuando se lleva a cabo el experimento, la reduccin
promedio de tiempo de respuesta al estimulo por parte de las ratas que
estn recibiendo la droga A es 30,45 milisegundos con una desviacin tpica
de 5 milisegundos.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Los datos correspondientes a la droga B son 24,9 y 6 milisegundos. Cual es
la probabilidad de que la diferencia entre la reduccin promedio de tiempo
de respuesta al estimulo por parte de las ratas que estn recibiendo la droga
A y la reduccin promedio de tiempo de respuesta al estimulo por parte de
las ratas que estn recibiendo la droga B sea menor o igual a la que se
observo en el experimento? Suponga que no hay diferencia alguna entre las
dos drogas con respecto a la reduccin promedio en tiempos de respuestas y
que las drogas son igualmente efectivas.

SOLUCIN: Como las dos poblaciones en cuestin son normales y los


tamaos de las muestras son pequeas (obsrvese que los tamaos
muestrales son estrictamente menores que 30)

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


La distribucin muestral de es aproximadamente la t de Student
con nA+nB2 = 12 + 132 = 23 grados de libertad.

Debido a que no hay diferencia alguna entre las dos drogas con respecto a
la reduccin promedio en tiempos de respuestas y que las drogas son
igualmente efectivas, entonces, . Por consiguiente, la media de
la distribucin muestral de = 0.

2 1 52 + 1 62
= = 30,74
12 132

entonces, la varianza de la distribucin muestral de es:

2 2 30,74 30,74
+ = + = 4,92
12 13

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO - Especializacin


en Estadstica.
Con base en los datos, el valor t est dado por:

1 2 1 2 5,55 0
t = = = 2,25
2 2 2,22
+
1 2

Por consiguiente ( 5,55) = ( 2,5) = 0,01.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO - Especializacin


en Estadstica.
Tercer caso: varianzas poblacionales desconocidas,
diferentes y muestras pequeas.
En este situacin supondremos que las poblaciones originales estn
distribuidas normalmente, que las varianzas poblacionales son
desconocidas y diferentes y que las muestras son pequeas. En este
caso, se utilizaran las varianzas muestrales 12 12 en vez de las
varianzas poblacionales desconocidas 12 22. , respectivamente
Teorema:
Si 12 22. son diferentes y desconocidas, entonces, la distribucin
muestral de la media tiene media 1 2 y varianza estimada igual a
12 22
+ . Adems, si las dos poblaciones en cuestin son normales y los
1 2
tamaos de las muestras son pequeos (es suciente considerar que
sean estrictamente menores que 30), entonces, la variable aleatoria

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO -


1 2 1 2
t =
2
1 2
2
1
+ 2

esta distribuida segn la distribucin t de Student con:

2 2 2
1+ 2
1 2
V= 2 2 grados de libertad
2
1 2
2
1 2
+
1 1 2 1

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Ejemplo:
Repita el ejemplo anterior, pero ahora suponiendo que las poblaciones
no tienen distribucin normal, que los tamaos muestrales son menores
que 30 (digamos = 12 y = 13) y que las varianzas poblacionales son
diferentes.
2 2 2 2
1+ 2 52 62
1 2 +
12 13
V = 2 2 = 2 2 = 22,78 se aproxima 23
2
1 2
2 52 62
1 2 12 13
+ 1 +
11 12
1 1 2

De nuevo, la media de la distribucin muestral de = 0.


La varianza de la distribucin muestral de es es:

1 2 1 2 5,55 0
t = = = 2,52
2,2
2
1 2
2
1
+ 2

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


Por consiguiente,
P( 5,55) = P(t 2,52) 0,01.

Es decir, la probabilidad de que la diferencia entre la reduccin


promedio de tiempo de respuesta al estimulo por parte de las ratas
que estn recibiendo la droga A y la reduccin promedio de tiempo de
respuesta al estimulo por parte de las ratas que estn recibiendo la
droga B sea menor o igual a la que se observo en el experimento es
aproximadamente del 1%.

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO


GRACIAS

REPUBLICA DE COLOMBIA - UNIVERSIDAD DEL ATLNTICO

S-ar putea să vă placă și