Sunteți pe pagina 1din 50

Captulo 3

INTRODUCCIN
A LA
INFERENCIA ESTADSTICA
El proceso de Inferencia Estadstica permite extraer conclusiones cientficamente
vlidas acerca de la poblacin a partir de los resultados mustrales (obtenidos a
travs de la estadstica descriptiva).

El propsito de la inferencia estadstica es realizar:

- Estimacin de Parmetros
- Contraste de Hiptesis

Estimacin de Parmetros
El mtodo de estimacin de un parmetro puede ser puntual o por intervalo.

Estimacin puntual de
En base al resultado de la muestra particular de tamao n, una estimacin puntual de
X
sera el valor numrico que toma
en dicha muestra.
En nuestro ejemplo, a partir de una muestra de n=50 planchas de acero. Daramos como
X
estimacin del peso medio poblacional o terico,
= 215 Kg.

Inconveniente(s):

La estimacin puntual depende de la muestra particular que se obtenga.


Existe una incertidumbre total, acerca de la proximidad (lejana) del valor puntual a la
media poblacional o terica.
Sin embargo
Conocemos la distribucin de la medias mustrales bajo ciertas condiciones sobre la
poblacin de partida.

DISTRIBUCIN DE LA MEDIA MUESTRAL


a) Si asumimos que X N (, ), conocida
Las (infinitas) medias mustrales obtenidas con muestras de tamao n se distribuyen
segn una distribucin normal (campana de Gauss):

X N ( , X ) Z

Donde:

N (0,1)

es el error tpico o desviacin estndar de la media muestral.

b) Si asumimos que X N (, ), desconocida


Las (infinitas) medias mustrales obtenidas con muestras de tamao n se distribuyen
segn una distribucin t-student con n-1 grados de libertad (gl)

X N ( , sX ) T

Donde:

SX

X
tn 1
sX

es el error tpico o desviacin estndar de la media muestral.

Nota: (Error estndar o Error tpico de la media)

x
Sx

conocida
Tamao de poblacin (N) demasiado grande o
infinita.

S
n

N n
N 1

conocida
Tamao de poblacin (N) conocido o finita.

desconocida, entonces
Tamao de poblacin (N) demasiado grande o
infinita.

Sx

S
n

N n
N 1

desconocida, entonces
Tamao de poblacin (N) conocida o finita.

Estimacin por Intervalo de confianza para

Supongamos que de una poblacin normal con media desconocida


y varianza conocida
2

o desconocida
se extrae una muestra de tamao n, entonces de la distribucin de la
X
media muestral se obtiene que, lleva asociado un error tpico de dicho estadstico de lo
que ha de tenerse en cuenta para valorar la precisin de una estimacin puntual.

Idea
X

Construir intervalos de confianza, basado


parmetro .

, que contenga con alta probabilidad el

Caso I: X N (, ), conocida
El Intervalo de confianza para es:
X Z1 / 2 * X X Z1 / 2 * X

Con un nivel de confianza del

Caso II: X N (, ), desconocida


El intervalo de confianza para es:

X t1 / 2;n1 * S X X t1 / 2;n 1 * S X

Con un nivel de confianza del

Tamao de muestra

Se puede determinar que tan grande debe ser el tamao de la muestra, n, de manera que si

se estima por

, el error de estimacin no sea mayor que un valor dado e. En efecto:

1
2

e2

Z 2 * 2 * N
n

Tamao de poblacin (N) demasiado grande


o infinita.

* 2 e 2 ( N 1)

Si la desviacin estndar (
) es
desconocida, se estima por la desviacin
estndar muestral (S) hallado a partir de una
muestra piloto.
Tamao de poblacin (N) conocida o
finita

Si la desviacin estndar (
) es
desconocida, se estima por la desviacin
estndar muestral (S) hallado a partir de
una muestra piloto.

Ejemplo 1: Una encuesta realizada a 25 empleados de un sector dio como resultados que
el tiempo medio de empleo era de 5,3 aos con una desviacin tpica de 1,2 aos.
a) Estimar, al 90% de confianza, el tiempo medio de empleo para el sector, suponiendo
Normalidad.
b) Si el margen de error hubiera sido de 1 ao qu grado de confianzase tendra?
c) Qu tamao muestral es necesario si se quisiera el margen de error del apartado
primero y el grado de confianza del apartado segundo?

Solucin: a)
Estimar, al 90% de confianza, el tiempo medio de empleo para el sector, suponiendo
Normalidad.

Datos:
X: Tiempo de empleo supuestamente Normal
Tamao de muestra
: n = 25 empleados
X
Tiempo medio de empleo
:
= 5,3 aos
Desviacin tpica muestral
Confianza

: S = 1,2 aos (
desconocido)
1

:
= 0,90
= 0,10

En base a los datos corresponde al CASO II, donde su intervalo es:

X t1 / 2;n 1 * S X X t1 / 2;n 1 * S X

Entonces:
SX

t1 / 2,n 1 t0,95;24 1, 711

= 5,3
Reemplazando en la frmula:
5,3 1,711*0,24
5,3 0,411
4,889

(Buscar tabla)

S
1, 2

0, 24
n
25

5,3 + 1,711*0,24

5,3 + 0,411

5,711

Interpretacin: El tiempo medio de empleo de todos los empleados del sector se estima
en 4,9 a 5,7 aos, con una confianza del 90%.

Solucin:b)
Si el margen de error hubiera sido de 1 ao qu grado de confianza se tendra?

Error de estimacin: e =

z1 / 2 * S X
z1 / 2 *

1=
z1 / 2 4,17

s
n

z1 / 2 *

1=

1, 2
25

(Buscando en la tabla estadstica)

0,99999
0, 00002
2

Por lo tanto el grado de confianza es:

1 0,99998

Solucin: c)
Qu tamao muestral es necesario si se quisiera el margen de error del apartado primero y
el grado de confianza del apartado segundo?
Tamao de muestra con margen de error de 0,411 y
Grado de confianza 0,99998
N=Tamao de poblacin de empleados desconocido de la entidad

Entonces la formula que le corresponde es:

Z2 *S2
1

e2

4, 09 2 *1, 2 2

0, 4112

n 142, 6 143

Ejemplo 2: El nmero de horas diarias que los empleados de cierta entidad bancaria de
mbito nacional trabajan delante del ordenador es una variable aleatoria normal con
varianza 1,5. Se toma una muestra al azar de 10 empleados y se anota el nmero de horas
que cierto da trabajaron con el ordenador:
6 3,4 5,6 6,3 6,4 5,3 5,4 5 5,2 5,5
a) Determina el intervalo de confianza al 95% para el nmero medio de horas diarias que se
trabaja en el ordenador en esa entidad. Explica claramente el resultado comentando que
significa el 95% de confianza.
b) Qu tamao muestral es necesario si se quisiera el margen de error del apartado primero
y el grado de confianza de 90%?

Solucin:a)
Datos:
X: Nmero de horas diarias variable Normal

Varianza poblacion :
= 1,5 conocido
Desviacin estndar
= 1,225
Tamao de muestra : n = 10 empleados
Nmero promedio de horas diarias se halla a partir de los valores numricos registrados de
10

los 10 empleados

Confianza

x
11

= 0,95

6 3, 4 5, 6 ... 5,5
10

= 5,41 horas

= 0,05

En base a los datos corresponde al CASO I, cuyo intervalo es:


X Z1 / 2 * X X Z1 / 2 * X

Z1 / 2 Z 0,975 1,960

= 5,41

5,41 1,96*0,387

(Buscar tabla)

5,41 + 1,96*0,387

1, 225

0,387
n
10

5,41 0,759

5,41 + 0,759

4,651
6,169
Interpretacin: El nmero medio de horas diarias que trabajan delante del ordenador
todos los empleados de cierta entidad bancaria se estima en 4,6 a 6,2horas, con una
confianza del 95%; el cual significa que de 100 muestras de empleados seleccionados de
toda la entidad bancaria, 95 de ellas estiman dicho parmetro.
Solucin:b)
Datos:

Margen de error
Varianza poblacional

: e = 0,759
:

= 1,5

1

Confianza
:
= 0,90
= 0,10
Tamao de la poblacin : N desconocido
En base a los datos corresponde utilizar la formula:
Z 2 * 2
2
1
Z 0,95
*1, 5
1, 6452 *1, 5
2
n

e2
0, 759 2
0, 759 2
n 7, 05 7

Ejercicios Propuestos
Ejercicio 1: La duracin aleatoria de las unidades producidas de un artculo, se
distribuye segn la ley normal, con desviacin tpica igual a seis minutos. Elegidas
al azar cien unidades, resulto ser la duracin media de 14,35 minutos. Elaborar el
intervalo de confianza del 99% para la duracin media de las unidades producidas.
Ejercicio 2: Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de
fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo
que se ha calculado la cuasi desviacin tpica de la muestra que ha resultado ser 6,3
mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del
zumo es normal, estimar el contenido medio de fruta de los zumos tanto
puntualmente como por intervalos al 95% de confianza.
Ejercicio 3: Se desea estimar el nmero medio de libros que los estudiantes de
cierta titulacin adquieren en el ltimo curso de sus estudios. Suponiendo conocida
la dispersin (varianza igual a 36) y siendo Normal el comportamiento de la
variable,

a) qu tamao muestral hace falta para alcanzar un grado de confianza del 95% y
un margen de error no superior a 2 unidades?
b) Cul sera el tamao muestral si queremos reducir el intervalo a la mitad sin
perder fiabilidad?
Ejercicio 4: Queremos ajustar una mquina de refrescos de modo que el promedio
del lquido dispensado quede dentro de cierto rango. La cantidad de lquido vertido
por la mquina sigue una distribucin normal con desviacin estndar 0.15
decilitros. Deseamos que el valor estimado que se vaya a obtener comparado con el
verdadero no sea superior a 0.2 decilitros con una confianza del 95%. De qu
tamao debemos escoger la muestra?
Ejercicio 5: Es necesario estimar entre 10000 establos, el nmero de vacas lecheras por
establo con un error de estimacin de 4 y un nivel de confianza del 95%.Sabemos que la
varianza es 1000. Cuntos establos deben visitarse para satisfacer estos requerimientos?

Intervalo de Confianza para la varianza


La varianza como medida de dispersin es importante dado que nos
ofrece una mejor visin de dispersin de datos. Nuevamente
consideramos que la poblacin sigue una distribucin de probabilidad
normal.
Otro campo del conocimiento donde la varianza se ocupa en gran
medida es en control de calidad; cuando un producto se elabora el rea
de control de calidad busca que los productos est dentro de ciertos
lmites de tolerancia, pero tambin que la variabilidad de un producto
sea lo menor posible.

El Intervalo de confianza para la varianza poblacional (


( n 1) s 2

12 / 2; n 1

Con un nivel de confianza del

) es:

( n 1) s 2

2 / 2;n 1

Ejemplo 1: Se han recogido muestras de aire para estudiar su contaminacin,


obtenindose las siguientes cantidades de impurezas en Kg/m3
2.2; 1.8; 3.1; 2.0; 2.4; 2.0; 2.1; 1.2
Construir un intervalo de confianza al 98% para la desviacin estndar de impurezas
contenidas en el aire.

Solucin:
Datos:
Calculando la cantidad media de impurezas a partir de los valores numricos
10

registrados en las 8 muestras de aire

11

2, 2 1,8 3,1 ... 1, 2


2,1
8

Calculando la varianza muestral obtenido de los valore numricos :


n

S
2

S2

(X
i 1

X )2

n 1

2, 2 2,1

1,8 2,1 ... 1, 2 2,1


2

8 1

= 0,288

Confianza
Entonces el intervalo es:
( n 1) s 2

2
1 / 2; n 1

2, 016
2,016
2
18, 475
1, 239

Por lo tanto:

( n 1) s 2

/ 2; n 1
2

= 0,98

= 0,02

8 1 * 0, 288 2

2
0,99;7

8 1 * 0, 288
2
0,01;7

0,109 2 1, 627

0,330 1, 275

Interpretacin: La variabilidad de impurezas con respecto a su media que contiene el


m3

aire se estima en 0,109 a 1,627 Kg./

, con una confianza del 98%.

Ejercicios Propuestos
Ejercicio 1: Se sabe por experiencia que el tiempo que tarda el servicio de caja de
una empresa prestadora del servicio de agua de una regin para atender a los clientes
que llegan a efectuar el pago mensual del servicio se distribuye normalmente. Se
pide estimar el intervalo de confianza para la desviacin estndar poblacional del

tiempo requerido para atender los pagos que efectan los clientes, con un nivel de
confianza del 95%, si para el efecto se tom una muestra aleatoria de 25 clientes que
arroj una desviacin estndar de 1.8 minutos.
Ejercicio 2: El tiempo que transcurre para los obreros de una gran compaa entre el
momento del ingreso a la planta y el momento en que estn listos para recibir las
orientaciones de su jefe inmediato, se distribuye normalmente. Una muestra de 20
obreros arroja una desviacin estndar de 3.5 minutos. Se pide calcular el intervalo
de confianza del 99% para la desviacin estndar del tiempo transcurrido para todos
los obreros de la compaa.

Intervalo de Confianza para la diferencia de medias (

1 2

Supongamos que se tiene dos poblaciones distribuidas normalmente con medias


1 2
desconocidas
y
, respectivamente. Se puede aplicar una prueba z o t de Student para
comparar las medias de dichas poblaciones basndonos en dos muestras independientes
n1
X1
tomadas de ellas. La primera muestra es de tamao , con media
y la segunda muestra
n2
X2
es de tamao , tiene media
. Donde las varianzas poblacionales pueden ser conocidas
12 22
12 s12 22 s22
( y
) o desconocidas (
y
).

Caso I: Muestras independientes, Varianzas poblacionales conocidas


(

12

22

El intervalo de confianza es:

X 2 Z1 / 2 * X1 X 2 1 2 X 1 X 2 Z1 / 2 * X1 X 2

X1 X 2
Donde:

12 22

n1
n2

Caso IIA: Normal-Muestras independientes, Varianzas poblacionales


desconocidas pero iguales (

12 22

El intervalo de confianza es:

X 2 t1 / 2;v * S X1 X 2 1 2 X 1 X 2 t1 / 2;v * S X1 X 2

v n1 n2 2

Donde:

es el grado de libertad.

n1 1 * s12 n2 1 * s22

S X1 X 2

n1 n2 2

1
1

n1 n2

Caso IIB: Normal-Muestras independientes, Varianzas poblacionales


desconocidas y diferentes (

12 22

El intervalo de confianza es:

X 2 t1 / 2;v * S X1 X 2 1 2 X 1 X 2 t1 / 2;v * S X1 X 2

Donde:

S12

S2
2
n1
n2

2
2
2
S12 S 22

n1

n2
n1 1
n2 1

redondeado entero.

Es el grado de libertad, que toma un valor numrico

S X1 X 2

s12 s22

n1 n2

Ejemplo 1: En el departamento de control de calidad de una empresa, se quiere


determinar si ha habido un descenso significativo de la calidad de su producto entre
las producciones de dos semanas consecutivas a consecuencia de un incidente
ocurrido durante el fin de semana. Deciden tomar una muestra de la produccin de
cada semana, si la calidad de cada artculo se mide en una escala de 100, obtienen
los resultados siguientes:
Semana 1: 93 86 90 90 94 91 92 96
Semana 2: 93 87 97 90 88 87 84 93
Construye un intervalo de confianza para la diferencia de medias al nivel de
95%.Interpreta los resultados obtenidos.

Solucin:
Suponiendo normalidad las producciones de las dos semanas
Cada semana son muestras independientes
Varianzas poblacionales desconocidas (
Ahora

12 22

Cmo saber si las varianzas son iguales o diferentes?


Se realiza la prueba de homogeneidad de varianzas, que consiste en lo siguiente:
Formular las hiptesis
H 0 : 12 22

Hiptesis nula

:
H1 : 12 22

Hiptesis alterna

Fijar nivel de significancia


0, 05

Estadstico de prueba

mx ( s12 , s22 )
F
mn( s12 , s22 )

Semana 1:
Calculo de la media
10

X1

x
11

93 86 90 ... 96
91, 50
8

X 1 91,50

Calculo de la varianza
n

S
2
1

(X
i 1

X )2

n 1

93 91, 50

86 91, 50 ... 96 91, 50


8 1
2

S12 9,143

Semana 2:
Calculo de la media
10

X2

x
11

93 87 97 ... 93
89,88
8

X 2 89,88

Calculo de la varianza
n

S2
2

(X
i 1

X )2

n 1

93 89,88

87 89,88 ... 93 89,88


8 1

Reemplazando en el estadstico de prueba


Fc

s22
17, 839

1, 951
2
s1
9,143

Regiones crticas

2
S 2 17,839

0,200
4,99
ZR/-------------------Zona------------------/--------Zona--------Aceptacin
Rechazo

La zona de aceptacin para un nivel de significacin del 5% est delimitada por 0,200 y
4,990, correspondientes a las probabilidades /2 y (1 - /2) respectivamente.

Decisin
Como

Fc
= 1,951 se ubica en la zona de aceptacin cuyo intervalo es (0,200; 4,99) se
H0

acepta

2
2
: 1 = 2

Luego se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el
cumplimiento del supuesto de homogeneidad de varianzas

Entonces el intervalo de confianza para la diferencia de medias es el CASO


IIA:

X 2 t1 / 2;v * S X1 X 2 1 2 X 1 X 2 t1 / 2;v * S X1 X 2
X1 X 2

Diferencia de medias muestrales

Coeficiente de confianza

Grados de libertad
t1 / 2;n1 n2 2 t0,975;14

= 91,50 89,88 = 1,62

= 0,95
= 0,05

v n1 n2 2

= 8 + 8 2 = 14

= 2,145

S X1 X 2

8 1 *9,143 8 1 *17,839
882

1 1

8 8

S X1 X 2

= 1,8365

Reemplazando en la formula del intervalo se tiene:


1 2

1,62 2,145*1,8365
1 2
-2,319
5,559

1,62 + 2,145*1,8365

Interpretacin: La diferencia promedio de producciones de artculos en las dos semanas se


estima entre -2,319 a 5,559, con una confianza del 95%. Esto significa que la produccin
promedio de artculos entre las dos semanas es igual.

Ejercicios Propuestos
Ejercicio 1: Un profesor de estadstica realiza un idntico cuestionario a dos grupos
de estudiantes de dos universidades diferentes de la misma ciudad. En una muestra
aleatoria de 9 estudiantes de la universidad A, el promedio de notas fue de 7.5 y
desviacin estndar de 0.4. En otra muestra aleatoria de 9 estudiantes de la
universidad B la media de las notas fue de 6.7 y desviacin estndar de 0.6. Calcular
los lmites de confianza del 95% para la diferencia de medias de las notas entre las
dos universidades. Se sabe que la escala de calificacin es de 0 a 10.
Ejercicio 2: Se quiere estimar la diferencia de los promedios de los salarios entre la
industria metalmecnica y la industria de los muebles en una ciudad. Para tal fin se
toma una muestra aleatoria de 200 operarios en la primera industria la cual arroja un
salario promedio de $535000 mensuales y desviacin estndar de $128000, mientras
que una muestra de 120 operarios en la segunda industria arroja un salario promedio
de $492000 y desviacin estndar de $75000. Se pide estimar el intervalo de
confianza para la diferencia de salarios entre las dos industrias con un nivel de
confianza del 90%.
Ejercicio 3: En una compaa se quiere estimar la diferencia de los promedios de
los rendimientos para producir cierta pieza por parte de los obreros en dos turnos
diferentes. Para tal fin el Jefe de produccin de la empresa toma muestras de 32
obreros para el turno 1 y encuentra que la media en la misma es de 20 minutos
mientras que la desviacin estndar es de 2.8 minutos. Por otra parte tom una
muestra de 35 obreros del turno 2 y encuentra que la media de la misma es de 22
minutos mientras que la desviacin estndar es de 1.9 minutos. Se pide calcular el
intervalo de confianza de la diferencia de las medias de los rendimientos en los dos
turnos con un nivel de confianza del 98%.

Ejercicio 4: Para comparar el contenido promedio de aceites de las semillas de dos


variedades de man, se disea un ensayo en el que para cada variedad se obtienen los
contenidos de aceite de 10 bolsas de 1 kg de semillas de man, extradas
aleatoriamente de distintos productores de semillas.
Los resultados del ensayo son los siguientes:
Variedad

s2

1
2

10
10

160,4
165,6

65,3
67,9

Distribucin de la proporcin muestral


Vamos a considerar que tenemos una poblacin de modo que en cada una de ellas
p
estudiamos una v.a. dicotmica (Bernoulli) de parmetro respectivo . De la poblacin
vamos a extraer una muestra de tamao
Entonces,

X xi B n, p
i 1

y la proporcin de xito en la muestra es

x
n

Luego se cumple:

p E ( p ) p
a)

p2 V ( p )
b)

p (1 p )
n

c) Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:
z

p p
N (0,1)
pq
n

Nota: (Error estndar o Error tpico de la proporcin muestral)

pq
n

p y q conocidos
Tamao de poblacin (N) demasiado grande o infinita.

pq N n

n N 1

p y q conocidos
Tamao de poblacin (N) conocido o finita.

S p

pq
n

S p

N n
pq

n N 1

p p

q q

p y q desconocidos, entonces
y
Tamao de poblacin (N) demasiado grande o infinita.
p p

q q

p y q desconocidos, entonces
y
Tamao de poblacin (N) conocida o finita.

Intervalo de Confianza para una Proporcin


En este caso, interesa construir un intervalo de confianza para una proporcin o un
porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensin,
fumadoras, etc.)
Donde, p es el porcentaje de personas u objetos con la caracterstica de inters en la
p

poblacin (o sea, es el parmetro de inters) y

es su estimador puntual muestral.

Luego, procediendo en forma anloga al caso de la media, podemos construir un intervalo


1
de confianza para la proporcin poblacional p, con una confianza de
.

Z1 / 2 * p p p
Z1 / 2 * p
p
Donde:
p

x
n

q 1 p

Ejemplo 1: Una compaa que fabrica pastelillo desea estimar la proporcin de


consumidores que prefieran su marca. Los agentes de la compaa observan a 450

compradores, del nmero total observado 300 compraron los pastelillos. Calcule un
intervalo de confianza del 95% para la venta de la proporcin de compradores que prefieren
la marca de esta compaa.

Solucin:
x: Nmero de consumidores que prefieren los pastelillos.
n = 450 tamao de muestra grande
x = 300 son los que prefieren los pastelillos en la muestra
x 300
p
0, 67
n 450
Es la proporcin puntual muestral que prefieren los pastelillos
q 1 p 1 0, 67 0, 33
Es la proporcin puntual muestral de los que no prefieren los
pastelillos.

Coeficiente de confianza
= 0,95
= 0,05
Z1 / 2 Z 0,975
= 1,96

pq
0, 67 *0,33
p

0, 022
n
450
Reemplazando en el intervalo de confianza se tiene:

Z1 / 2 * p p p
Z1 / 2 * p
p

0,67 1,96 * 0,022


0,63

0,67 + 1,96 * 0,022

0,71

Interpretacin: La proporcin de pastelillos que prefieren la marca de la compaa por


parte de los consumidores se estima entre 0,63 a 0,71, con una confianza del 95%.

Tamao de muestra
Se puede determinar que tan grande debe ser el tamao de la muestra, n, de manera que si p
p
se estima por , el error de estimacin no sea mayor que un valor dado e. En efecto:

Z12 / 2 * pq
n
e2

2
1 / 2

* pq * N
Z12 / 2 * pq e 2 ( N 1)

Tamao de poblacin (N) demasiado


grande o infinita.
p
Si p y q son desconocidas, se estima por
q
y
hallados a partir de una muestra
piloto.
En ltimos de los casos si no se tiene
ninguna informacin de p y q se asume el
mximo riesgo de p = 0,5 y q = 0,5.
Tamao de poblacin (N) conocida o
finita
p
Si p y q son desconocidas, se estima por
q
y
hallados a partir de una muestra
piloto.
En ltimos de los casos si no se tiene
ninguna informacin de p y q se asume el
mximo riesgo de p = 0,5 y q = 0,5.

Ejercicios Propuestos

a)
c)
d)

Ejercicio 1: Una compaa quiere conocer la proporcin de consumidores que


adquieren su producto. Encarga a una empresa un estudio de mercado para obtener
un intervalo de confianza al 99% de su proporcin de clientes a partir de una
muestra de tamao 1000. Los resultados muestral es arrojaron que 740 de los
entrevistados eran clientes de su producto.
Ejercicio 2: En un experimento para determinar la toxicidad de una sustancia se
administra una dosis de esta a cada uno de 300 conejos, y se registra el nmero de
muertos, que resulta ser de 192.
Calcule el estimador de p.
b)
la probabilidad de que un conejo elegido al azar muera a causa de una dosis
de la sustancia.
Calcule la desviacin estndar.
Construya un intervalo de confianza al 98%.

Distribucin de la diferencia de proporciones muestrales

Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas
p1
p2
estudiamos una v.a. dicotmica (Bernoulli) de parmetros respectivos
y
. De cada
n1 n2
poblacin vamos a extraer muestras de tamao
y .
Entonces
n1
x
p1 1
X 1 x1i B n1 , p1
n1
i 1
n2

X 2 x2i B n2 , p2

p 2

i 1

x2
n2

Luego se cumple:

p1 p 2 E ( p1 p 2 ) p1 p2
a)

p2

2
1 p

V ( p1 p 2 )

p1q1 p2 q2

n1
n2

b)
c) Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:
Z

( p1 p 2 ) ( p1 p2 )
p1 p 2

N (0,1)

Intervalo de Confianza para la diferencia de dos proporciones


Si las muestras son suficientemente grandes ocurre que una aproximacin para un intervalo
1
de confianza al nivel
para la diferencia de proporciones de dos poblaciones es:

1 p
2 Z1 / 2 * p1 p 2
p1 p2 p

p p
1

1q1
p
p q
2 2
n1
n2

Dnde:
Ejemplo 1: En un estudio sobre las relaciones prematrimoniales se encontr en la zona A
que, de 200 personas, 124 estaban a favor y en la zona B, de 266 personas, 133 tambin lo

estaban. Estimar la diferencia de proporciones de ambas zonas al 90% de confianza


comentando el resultado.

Solucin:
Zona A
x1
: Nmero de personas que estn a favor de las relaciones prematrimoniales
x1
= 124
n1
= 200
x 124
p1 1
n1 200

q1 1 p1

p1
= 0,62

= 0,38

Zona B
x2
: Nmero de personas que estn a favor de las relaciones prematrimoniales
x2
= 133
n2
= 266
x
133
p 2 2
n2 266

= 0,90

q2 1 p 2

p 2
= 0,50

= 0,50

= 0,10

Z1 / 2 Z 0,95

= 1,645

p p
1

1q1 p
q
p
2 2
n1
n2

0, 62 * 0, 38 0, 50 * 0, 50

200
266

p1 p 2 0, 046

Reemplazando en la formula se tiene:

1 p
2 Z1 / 2 * p1 p 2
p1 p2 p

(0,62 0,50) 1,645 * 0,046


0,044

p1 p2

p1 p2

(0,62 0,50) + 1,645 * 0,046

0,196

Interpretacin: La diferencia de proporciones de personas que estn a favor de las


relaciones prematrimoniales en las dos zonas se estima entre 0,044 a 0,196, con una
confianza del 90%. Esto significa que la proporcin de personas de la zona A son las que
estn mayormente a favor de las relaciones prematrimoniales respecto a la zona B.

Ejercicios Propuestos
Ejercicio 1: Se est considerando cambiar el procedimiento de manufactura de
partes. Se toman muestras del procedimiento actual as como del nuevo para
determinar si este ltimo resulta mejor. Si 75 de 1000 artculos del procedimiento
actual presentaron defectos y lo mismo sucedi con 80 de 2500 partes del nuevo,
determine un intervalo de confianza del 90 % para la verdadera diferencia de
proporciones de partes defectuosas.
Ejercicio 2: Un productor decide cultivar dos variedades de tomate, valencia y
perita. De la variedad valencia planta 230 semillas y de la variedad perita planta 358.
Luego de tres semanas de cultivadas ambas variedades el productor recorre el campo
y registra que cantidad de semillas emergieron para cada variedad. Los resultados
son los siguientes:
Variedad
Cultivadas
Emergieron
Valenciano
230
126
Perita
358
293
a). Que modelo terico de probabilidad considera apropiado si la variable aleatoria
es "numero de plantas que emergieron de una variedad en el total que se cultivo
de la misma"? Cuales son los parmetros para cada una de las variedades?
b). Estime para cada variable la proporcin de emergencia.
c). Construya un intervalo de confianza al 95 % para la probabilidad de emergencia
de las plantas de cada variedad e interprete en trminos del problema
d). Que supuesto fue necesario para que el intervalo anterior sea valido?
e). Si comparamos ambas variedades con el tomate americano que tiene una
probabilidad de emergencia de 0.65, .que puede decir viendo los intervalos de
confianza?
f). Si el productor quiere saber si el tomate valenciano tiene la misma probabilidad
de emergencia que el tomate americano. Cual es el procedimiento a seguir?
Explquelo y concluya con el mismo.

Inferencia basada en pruebas de hiptesis para una y dos


muestras
Hiptesis Estadstica es una afirmacin, conjetura que se hace acerca de un parmetro
poblacional.
Tipos de Hiptesis
Hiptesis nula, es la afirmacin que est establecida y que se espera sea rechazada despus
de aplicar una prueba estadstica y se representa por Ho.
Hiptesis alterna, es la afirmacin que se espera sea aceptada despus de aplicar una
H1
prueba estadstica y se representa por
.

Nivel de significacin, representada por , es la probabilidad de cometer error tipo I, y


por lo general se asume que tiene un valor de 0,05 0,01.
Prueba estadstica o Estadstico de prueba, es una frmula, basada en la distribucin del
estimador puntual del parmetro que aparece en la hiptesis y que va a permitir tomar una
decisin acerca de aceptar o rechazar una hiptesis nula.

Contraste de Hiptesis para la media


Formas de contraste de las hiptesis:
Depende del planteamiento de la hiptesis alterna
Prueba bilateral

H 0 : 0

H1 : 0

Prueba unilateral superior

H 0 : 0

H1 : 0

Fijar nivel de significancia:

= 0,05; 0,01 etc.

Seleccionar el estadstico de prueba:

Caso I: X N (, ), conocida

Prueba unilateral inferior

H 0 : 0

H1 : 0

El estadstico de prueba es:

N (0,1)

Prueba Z- Normal estndar para una muestra.


Usualmente la varianza es desconocida

Caso II: X N (, ), desconocida


El estadstico de prueba es:

X
tn 1
sX

Prueba T- Student para una muestra con n - 1 grados de libertad (gl.)


Regiones Crticas:
Depende de las formas de contraste de las hiptesis.
Contraste Bilateral

-- ZR-- /-------------ZA--------------/--ZR--

Contraste unilateral superior Contraste unilateral inferior

----------------ZA---------------/----ZR----

----ZR-----/-------------ZA----------------

Decisin:
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p


Si el valor numrico de p es superior que el nivel de significancia fijado se acepta
H0
la Hiptesis nula
.

Si el valor numrico de p es inferior que el nivel de significancia fijado se rechaza


H0
la Hiptesis nula
.

Ejemplo 1. Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de


produccin que se considerar aceptable si las lmparas obtenidas por este mtodo dan
lugar a una poblacin normal de duracin media 2400 horas, con una desviacin tpica
igual a 300. Se toma una muestra de 100 lmparas producidas por este mtodo y esta
muestra tiene una duracin media de 2320 horas. Se puede aceptar la hiptesis de validez
del nuevo proceso de fabricacin con un riesgo igual o menor al 5%?

Solucin:
Formulacin de Hiptesis
H o : 2400
H1 : 2400
Nivel de significancia
0, 05
Estadstico de Prueba
Caso I: X N (, ), = 300 conocida

X X

X
n

La poblacin N de la produccin de lmparas es desconocida, as que puede ser que sea


demasiado grande.

2320 2400
300
100

Z 2, 67
Regiones crticas

-- ZR-- /----------------ZA---------------/---ZR--

Z 0,975

Z 0,975

-1,96

1,96

Decisin
En vista que el valor del estadstico de prueba (Z = -2,67) es inferior que el valor tabular (
Zt
H0
= -1,96) ubicndose en la zona de rechazo, entonces se rechaza la hiptesis nula
.
Esto significa que el nuevo proceso de fabricacin no es aceptable.
Ejemplo 2. Un fabricante de aparatos de TV afirma que se necesita a lo sumo 250
microamperes de corriente para alcanzar cierto grado de brillantez con un tipo de televisor
en particular. Una muestra de 20 aparatos de TV produce un promedio muestral de corriente
de 257,3 microemperes. Denotemos por m el verdadero promedio de corriente necesaria
para alcanzar la brillantez deseada con aparatos de este tipo, y supongamos que m es la
media de una poblacin con s = 15. Pruebe al nivel de significacin del 2,5% la hiptesis
nula de que m es a lo sumo 250 microamperes.

Solucin:
Formulacin de Hiptesis
H 0 : 250
H1 : 250
Nivel de significancia
0, 025
Estadstico de Prueba
Caso II: X N (, ),

X
X

s
sX
n

= 15 desconocida

257,3 250
15
20

T 2,176
Regiones crticas

----------------ZA---------------/-----ZR----t0,975;19
2,093

Decisin

T 2,176

Dado que el valor del estadstico de prueba (

) es superior que el valor tabular


H0

(t = 2,093) , entonces se ubica en la zona de rechazo, rechazando la hiptesis nula


demuestra que no se necesita a lo sumo 250 micro amperes, en forma significativa.

. Esto

Ejercicios Propuestos
Ejercicio 1: La tasa actual para producir fusibles de 5 amp en Neary Electric Co. Es 250
por hora. Se compr e instal una mquina nueva que, segn el proveedor, aumentar la
tasa de produccin. Una muestra de 20 horas seleccionadas al azar el mes pasado indica que
la produccin media por hora en la nueva mquina es 256, con desviacin estndar de 6 por
0,05
hora. Con
de nivel de significancia, Puede Neary Electric concluir que la nueva
mquina es ms rpida?
Ejercicio 2: Un fabricante de lmparas elctricas sostiene que la duracin media de las
mismas (horas) es en promedio superior a 1300 h. Se toma una muestra de 17 lmparas
siendo el resultado de la inspeccin el siguiente:
980 1 350 1 020 1 140 1 520 1 390 1 205 1 180 970 1 420 1 850 1 300
1 305 1 040 1 050 1 520 1 320
Verificar el Ho del fabricante con un coeficiente de riesgo del 5% (suponiendo la
distribucin normal).

Ejercicio 3: Una empresa desea concursar para ganar un contrato con el gobierno como
proveedor de concreto; uno de los requisitos es la resistencia a la compresin del concreto a
los 28 das de haberse preparado la mezcla. La empresa ganadora dice que mantiene
excelentes controles de calidad en su concreto y como tal hay una varianza muy baja en
Kg 2f cm 4
resistencias a la compresin, del orden de 16
/
; pero al hacerle en la UNAM unas
Kg 2f cm4
pruebas de resistencia se detecta una varianza mas elevada de 25
/
a) hay evidencia estadstica suficiente para considerar que el proveedor est mintiendo y
Kg 2f cm 4
en realidad la desviacin estndar es DIFERENTE a 16
/
?
b) Redaccin de la prueba de hiptesis, indicando si debe ser prueba de una o dos colas
para responder la pregunta.
Ejercicio 4: Un vendedor de neumticos dice que la vida media de sus neumticos es de
28000 Km. Admitiendo para la desviacin tpica el valor 1348 Km. disear un test de
hiptesis al 99% de confianza, basado en muestras de 40 elementos que permita contrastar
la hiptesis nula de ser = 28000Km usando como hiptesis alternativa < 28000Km
Ejercicio 5: Se pretende disear una prueba de hiptesis con una muestra de 74
automviles para comprobar su capacidad de frenado. Para ello se medir en todos ellos la
distancia de frenado si el automvil parte de una velocidad inicial de 100 Km/h. Se quiere
saber si, tras un frenazo brusco, la distancia media recorrida antes de pararse es de 110
metros. Se supone que la distancia de frenado sigue una distribucin normal con desviacin
tpica conocida = 3 m. Supongamos ahora que hemos realizado efectivamente la prueba a
los 74 automviles y hemos obtenido las siguientes distancias de frenado.
98 102 105 113 123 126
Distancias
15 10 12 8 16 13
Total
Num. de autos
74

Se acepta la hiptesis de que la distancia media de frenado es de 110 m, con un nivel de


significacin = 0.05?
Ejercicio 6: Un fabricante asegura que sus fusibles, con una sobrecarga del 20%, se
fundirn por promedio al cabo de 12.40 min. Una muestra de 20 fusibles se sobrecarga un
20%, obtenindose una media de 10.63 y una cuasi desviacin de 2.48 min. Confirma la
muestra la afirmacin del fabricante para el promedio?

Prueba de hiptesis para la varianza


La varianza como medida de dispersin es importante dado que nos
ofrece una mejor visin de dispersin de datos. Nuevamente

consideramos que la poblacin sigue una distribucin de probabilidad


normal.
Formulacin de las hiptesis
Depende del planteamiento de la hiptesis alterna
Prueba bilateral

H0 :
2

Prueba unilateral derecho

H0 :

2
0

H1 : 2 02

Prueba unilateral inferior

2
0

H 0 : 2 02

H1 : 2 02

H1 : 2 02

Fijar nivel de significancia:

= 0,05; 0,01 etc.

Estadstico de prueba:

Si X N (, ), conocida
El estadstico de prueba es:

(n 1) s 2

2
2

Prueba Chi cuadrado ( ) para una muestra con n-1 grados de libertad (gl.)
Regiones crticas
Depende de las formas de contraste de las hiptesis.
Contraste Bilateral

---ZR--/----------ZA---------/--------ZR----------

Decisin:

Contraste unilateral inferior

----ZR--/-------------------ZA----------------------

Contraste unilateral superior

------------------ZA---------/----------ZR----------

Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.

Ejemplo 1: Un negocio debe pagar horas extra dada la demanda incierta

de su producto, por lo cual en promedio se pagan 50 horas extra a la


semana; el gerente de recursos humanos considera que siempre se ha
tenido una varianza de 25 en las horas extras demandadas. Si se toma
una muestra de 16 semanas se obtiene una varianza muestral de 28,1.
Determine con alfa = 0,10 si la varianza poblacional de las horas extras
demandadas a la semana puede considerarse igual a 25.

Solucin:
Formulacin de hiptesis
H 0 : 2 25

H1 : 2 25
Nivel de significancia

0,10
Estadstico de prueba


2
0

( n 1) s 2

02
= 16,86
Regiones crticas

(16 1) * 28,1
25

----ZR----/---------------ZA------------/-------------ZR------------2
0,05;15

2
0,95;15

7,261

24,996

Decisin

Como que el valor del estadstico de prueba se ubica entre los valores tabulares (7,261
02

= 16,86
24,996), es decir dentro de la zona de aceptacin, entonces se acepta la
H0
hiptesis nula
. Efectivamente se puede concluir con una confianza del 90% que la
varianza poblacional de las horas extras demandadas a la semana es
igual a 25.

Ejercicios propuestos
Ejercicio 1: Un supervisor de control de calidad en una enlatadora sabe que la cantidad
exacta en cada lata vara, pues hay ciertos factores imposibles de controlar que afectan a la
cantidad de llenado. El llenado medio por lata es importante, pero igualmente importante es

la variacin
de la cantidad de llenado. Si
es grande, algunas latas contendrn muy
poco, y otras, demasiado. A fin de estimar la variacin del llenado en la enlatadora, el
supervisor escoge al azar 10 latas y pesa el contenido de cada una, obteniendo el siguiente
pesaje (en onzas):
7,96 7,90 7,98 8,01 7,97 7,96 8,03 8,02 8,04 8,02
Suponga que las agencias reguladoras especifican que la desviacin estndar de la cantidad
de llenado debe ser menor que 0,1 onzas. Esta informacin proporciona pruebas
suficientes de que la desviacin estndar de las mediciones de llenado es menor que 0,1
onzas si el nivel de significacin queda fijado en un 5%?
Ejercicio 2: Se supone que los dimetros de cierta marca de vlvulas estn distribuidos
pu lg adas 2
normalmente con una varianza poblacional de 0,2
, pero se cree que
ltimamente ha aumentado. Se toma una muestra aleatoria de vlvulas a las que se les mide
su dimetro, obtenindose los siguientes resultados en pulgadas: 5,5 5,4 5,4 5,6 5,8
5,4 5,5 5,4 5,6 5,7
Con sta informacin pruebe si lo que se cree es cierto.

Prueba de Hiptesis para la diferencia de medias (

1 2

Supongamos que se tiene dos poblaciones distribuidas normalmente con medias


1 2
desconocidas
y
, respectivamente. Se puede aplicar una prueba z o t de Student para
comparar las medias de dichas poblaciones basndonos en dos muestras independientes
X1
n1
tomadas de ellas. La primera muestra es de tamao , con media
y la segunda muestra
X2
n2
es de tamao , tiene media
. Donde las varianzas poblacionales pueden ser conocidas
2
2
2
1
2
s1 s22
(
y
) o desconocidas ( y ).
Formulacin de las hiptesis para muestras independientes
Depende del planteamiento de la hiptesis alterna
Prueba bilateral
H 0 : 1 2

Prueba unilateral superior


H 0 : 1 2

H1 : 1 2

H1 : 1 2

Fijar el nivel de significancia:

Prueba unilateral inferior


H 0 : 1 2
H1 : 1 2

= 0,05; 0,01 etc.

Estadstico de prueba

Caso I: Muestras independientes, Varianzas poblacionales conocidas (


El estadstico de prueba es:

( X 1 X 2 ) ( 1 2 )
X1 X 2
X

Donde:

1 X2

12
n1

22
n2

N (0,1)

12

22
y

Caso IIA: Normal-Muestras independientes, Varianzas poblacionales iguales (


12 22
) y desconocidas
El estadstico de prueba es:

( X 1 X 2 ) ( 1 2 )
S X1 X 2

tn1 n2 2

v n1 n2 2
Donde:

es el grado de libertad.

n1 1 * s12 n2 1 * s22

S X1 X 2

1 1

n1 n2

n1 n2 2

Caso IIB: Normal-Muestras independientes, Varianzas poblacionales diferentes (


12 22
) y desconocidas
El estadstico de prueba es:

( X 1 X 2 ) ( 1 2 )
S X1 X 2

tv

Donde:

S X1 X 2

S12

s12
s22

n1
n2

S2
2
n1
n2

2
2
2
S12 S 22

n1

n2
n1 1
n2 1

Es el grado de libertad, que toma un valor numrico

redondeado entero.
Usualmente las varianzas son desconocidas

Regiones crticas
Contraste Bilateral

-- ZR-- /-------------ZA--------------/--ZR--

Contraste unilateral superior Contraste unilateral inferior

----------------ZA---------------/----ZR----

----ZR-----/-------------ZA----------------

Decisin:
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p

Si el valor numrico de p es superior que el nivel de significancia fijado se acepta


H0
la Hiptesis nula
.

Si el valor numrico de p es inferior que el nivel de significancia fijado se rechaza


H0
la Hiptesis nula
.
Ejemplo 1: Para comparar el contenido promedio de aceites de las semillas de dos
variedades de man, se plantean las hiptesis H0: 1= 2 vs. H1: 1 2
Se disea un ensayo en el que para cada variedad se obtienen los contenidos de aceite de 10
bolsas de 1 kg de semillas de man, extradas aleatoriamente de distintos productores de

semillas. Usar
= 0,05.
Los resultados del ensayo son los siguientes:
Variedad

s2

1
2

10
10

160,4
165,6

65,3
67,9

Solucin:

Segn los datos corresponden al CASO II: Muestras independientes, varianzas


12 22
poblacionales desconocidas ( ,
). Ahora el problema es;
Cmo saber si las varianzas son iguales o diferentes?
Suponiendo normalidad para las observaciones de las muestras, se realiza la prueba de
homogeneidad de varianzas, que consiste en lo siguiente:
Formulacin de hiptesis

H 0 : 12 22

H1 : 12 22
vs.

Nivel de significancia

= 0,05.
Estadstico de prueba

s12
65, 3

2
s2
67, 9

65, 3
0, 96
67, 9

Regiones crticas
Distribucin F de Snedecor

0.0 0.248

1.5

3.0

4.03

4.5

6.0

-ZR-/--------------------------ZA-------------------------/-----------ZR--------------

Decisin:
La regin de aceptacin para un nivel de significacin del 5% est delimitada por 0,248 y
4,03, correspondientes a las probabilidades /2 y (1 - /2) respectivamente.

Como F = 0,96 est en el intervalo (0,248; 4,03), es decir en la zona de aceptacin, se


H0
2
2
acepta
: 1 = 2 , lo cual significa el cumplimiento del supuesto de homogeneidad de
varianzas.
Entonces aplicaremos CASO IIA: Prueba T para la diferencia de medias con
12 22
varianzas poblacionales (
) y desconocidas
Formulacin de hiptesis
H0: 1= 2

vs.

H1: 1 2

Nivel de significancia

= 0,05.
Estadstico de prueba

X 2 1 2
1
1

n1 n2

S p2

s 2p

S p2

10 1 *65,3 10 1 *67,9 66, 6


10 10 2

160, 4 165, 6 0
1
1
66, 6

10 10

Regiones crticas

1, 42

( n1 1) S12 ( n2 1) S 22
n1 n2 2

Distribucin T de Student

-4.0

-2.7

-2.101

-1.3

0.0

1.3

2.101

2.7

4.0

---------ZR-------/---------------------ZA-------------------/--------ZR---------

Decisin
La regin de aceptacin para un nivel de significacin del 5% est delimitada por -2,101 y
2,101, correspondientes a los probabilidades /2 y (1 - /2) respectivamente y 18 grados de
libertad
Como T = -1,42 est en el intervalo (-2,101; 2,101), es decir en la zona de aceptacin, se
acepta H0: 1= 2
Entonces se concluye que no hay diferencias entre el contenido promedio de aceites de las
semillas de dos variedades de man.

Ejemplo 2. Un constructor est considerando dos lugares alternativos para construir un


centro comercial. Como los ingresos de los hogares de la comunidad son una consideracin
importante en sta seleccin, desea probar que el ingreso promedio de la primera
comunidad excede al promedio de la segunda comunidad en cuando menos $1,5 diarios.
Con la informacin de un censo realizado el ao anterior sabe que la desviacin estndar
del ingreso diario de la primera comunidad es de $1,8 y la de la segunda es de $2,4
Para una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el
ingreso diario promedio es de $35,5 y con una muestra de 40 hogares de la segunda
comunidad el ingreso promedio diario es de $34,6. Pruebe la hiptesis con un nivel de
confianza del 95 por ciento.

Solucin:
Datos
Primera comunidad
1
= $ 1,8
n1
= 30
X1
= $ 35,5
Formulacin de hiptesis
H 0 :1 2 1,5

Segunda comunidad
2
= $ 2,4
n2
= 40
X2
= $ 34,6

H1 : 1 2 1,5
Nivel de significancia

= 0,05
Estadstico de prueba
Segn los datos corresponden al CASO I: Muestras independientes con varianzas
poblacionales conocidas. Entonces:
Z

( X 1 X 2 ) ( 1 2 ) ( X 1 X 2 ) ( 1 2 )

X1 X 2
12 22

n1 n2
(35,5 34, 6) 1,5
1,82 2, 42

30
40

= - 1,195

Regiones crticas

----ZR-----/-------------ZA-----------------

z1
-1,645

Decisin
La regin de aceptacin para un nivel de significacin del 5% est delimitada por -1,645 y

+ , correspondientes a la probabilidad (1 - ).
Como Z = -1,195 est en el intervalo (H0

;-1,645), es decir en la zona de echazo, se rechaza

Entonces se concluye que el ingreso promedio de la primera comunidad no excede al


promedio de la segunda comunidad en cuando menos $1,5 diarios, con un nivel de
confianza del 95%.

Ejercicios propuestos
Ejercicios 1. Un investigador desea averiguar si una industria est contaminando el agua
de un arroyo al cual evacua sus efluentes. A tal fin toma muestras de agua en dos sitios: 1)
aguas arriba del establecimiento y 2) aguas abajo del mismo. Los siguientes son valores de
concentracin de uno de los metales pesados encontrados en cada sitio.
Aguas arriba
8
10
6
4
8
7
8
6

6
5
12
12

9
9
5
9

4
8
6
5

7
11
9
12

5
8
7
8

12
6
10
7

8
12
6
7

7
9
8
10

8
8
6
6

7
10
4
8

12
6
5

5
9
9

6
4
8

9
7
11

Aguas abajo
9
12
9
14
12
13
12
15

8
10
10
11

15
10
12
9

12
13
9
7

10
12
12
12

7
12
7
10

12
15
13
14

10
11
15
7

14
9
10
13

12
9
9
15

13
12
14
10

10
8
10

12
15
10

9
12
13

12
10
12

Cree Ud. que existen diferencias en la concentracin de este metal pesado entre uno y otro
sitio? Evale su respuesta para un = 0,02
Ejercicio 2. Un fabricante que usa dos lneas de produccin 1 y 2 hizo un ligero ajuste a
la lnea 2 con la esperanza de reducir tanto la variabilidad como la cantidad promedio de
impurezas en la sustancia qumica. Muestras aleatorias en cada lnea arrojaron las
siguientes mediciones:
Lnea
n
Promedio
Varianza
1
16
3,2
1,04
2
16
3,0
0,51
Los datos aportan suficiente evidencia para concluir que la cantidad promedio de
impurezas de la lnea 1 es menor que la lnea 2?
Ejercicio 3. Una muestra de 80 alambres de acero producidos por la fbrica A presenta
una resistencia promedio a la ruptura de 1.230 lbs. con una desviacin estndar de 120 lbs
Una muestra de 100 alambres de acero producidos por la fbrica B presenta una resistencia
promedio a la ruptura de 1.110 lbs . con una desviacin estndar de 90 lbs .. Con base en
sta informacin pruebe si la resistencia promedio a la rotura de los alambres de acero de la
marca A es significativamente mayor que la de los alambres de acero de la marca B. Asuma
un nivel de confianza del 99 por ciento.
Ejercicio 4. El jefe de personal de una gran empresa afirma que la diferencia de los
promedios de antigedad entre los obreras y obreros de la compaa es de 3.5 aos. El
presidente de la compaa considera que sta diferencia es superior. Para comprobar dicha
situacin, se toma una muestra aleatoria de 40 obreras cuyo promedio de antigedad es de
12.4 aos con desviacin estndar de 1.5 aos y de un grupo de 45 obreros cuyo promedio
de antigedad es de 8.3 aos con desviacin estndar de 1.7 aos. Comprobar la hiptesis
con un nivel de significacin del 5%.

Caso III: Normal- Muestras dependientes

Los datos se obtienen de muestras que estn relacionadas, es decir, los resultados del primer
grupo no son independientes de los del segundo.
Por ejemplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los
individuos de un grupo experimental antes y despus de la administracin de una droga.
El objetivo es comprobar si la droga produce efectos en el nivel del metabolito
Los pares de observaciones (antes y despus) obtenidas en cada individuo no son
independientes ya que el nivel posterior a la administracin de la droga depende del nivel
inicial.
Ejemplo
ANTES
8,69
7,13
7,79
7,93
7,59
7,86
9,06
9,59

DESPUES
7,24
7,10
7,80
7,95
7,50
7,79
9,00
9,48

DIF
1,45
0,03
-0,01
-0,02
0,09
0,07
0,06
0,11

Formulacin de Hiptesis
Prueba bilateral

Prueba unilateral inferior

H 0 : d = 0

H 0 : d = 0

H1 : d 0

H1 : d 0

Fijar nivel de significancia

= 0,05; 0,01 etc.


Estadstico de prueba

D
d

S d2

~ t n 1

Prueba unilateral superior

H 0 : d = 0

H1 : d 0

D
d

S d2

0, 22 0
1.26
0, 50
8

Regiones crticas

-- ZR-- /-------------ZA--------------/--ZR--

t / 2

t1 / 2

-2,365

2,365

Fijando = 0.05, la regin de aceptacin es el intervalo (t /2= -2,365, t1- /2 = 2,365),


con 7 grados de libertad
Como T = 1,26 es menor que t1- /2= 2,365, se ubica en la zona de aceptacin, por lo

H 0 : d = 0

tanto se acepta
Se concluye que la droga no causo efectos significativos, es decir que no existe diferencias
observadas entre los niveles de metabolitos por uno u otro individuo en forma significativa.

Prueba de hiptesis para la proporcin (de xitos) de una sola poblacin


Vamos a considerar que tenemos una poblacin de modo que en cada una de ellas
p

estudiamos una v.a. dicotmica (Bernoulli) de parmetro respectivo


poblacin vamos a extraer una muestra de tamao
Entonces,

. De la

X xi B n, p
i 1

En este caso, interesa contrastar hiptesis para una proporcin o un porcentaje


poblacional (por ejemplo, el porcentaje de personas con hipertensin, fumadoras,
etc.)
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:

p(1 p)

p N p;

O bien:
z

p p
N (0,1)

pq
n

Donde:
p es la proporcin o el porcentaje de personas u objetos con la caracterstica de
p

inters en la poblacin (o sea, es el parmetro de inters) y


puntual muestral.

es su estimador

Formulacin de Hiptesis
Prueba Bilateral
H 0 : p p0

Prueba unilateral superior


H 0 : p p0

H1 : p p0

H 1 : p p0

Fijar nivel de significancia

= 0,05; 0,01 etc.


Estadstica de prueba
Z

p - p0
p0q 0

Normal ( 0 , 1)

Donde:
q0 1 p0
p : Proporcin muestral de xitos
Regiones crticas

Prueba unilateral inferior


H 0 : p p0
H1 : p p0

Contraste Bilateral

-- ZR-- /-------------ZA--------------/--ZR--

Contraste unilateral superior Contraste unilateral inferior

----------------ZA---------------/----ZR----

----ZR-----/--------------ZA----------------

Decisin
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p

Si el valor numrico de p es superior que el nivel de significancia fijado se acepta


H0
la Hiptesis nula
.

Si el valor numrico de p es inferior que el nivel de significancia fijado se rechaza


H0
la Hiptesis nula
.

Ejemplo 1. En una gran compaa, el 18% o ms de los trabajadores estn de acuerdo


con un proyecto de ley que modifica el cdigo laboral Peruano. La gerencia de la compaa
selecciona una muestra aleatoria de 120 trabajadores, donde el 30% estn de acuerdo con
dicho proyecto de ley. Cual es la conclusin del gerente?

Solucin:
Formulacin de hiptesis
H 0 : p 0,18
H1 : p 0,18
Nivel de significancia

= 1%

Estadstico de prueba
Z

- p0
p
p0 q 0
n

0,30 0,18
0,18*0,82
120

= 3,43

Regiones crticas

------------------ZA--------------/----ZR-----

z1
2,33

Decisin

z1

Fijando = 0.01, la regin de aceptacin es el intervalo (- ;


= 2,33)
z1
Como el estadstico de prueba Z = 3,43 es mayor que
= 2,33, es decir se ubica en la
zona de rechazo, se rechaza H0
El gerente concluye que efectivamente el 18% o ms de los trabajadores estn de acuerdo
con un proyecto de ley que modifica el cdigo laboral Peruano.

Ejercicios propuestos
Ejercicio 1. Se conoce por experiencia que el 14% de la produccin de cierto artculo
resulta defectuosa. Se introducen algunos correctivos en el proceso y luego mediante una
muestra de 360 artculos escogidos aleatoriamente, se encuentra que el 13.33% resultan
defectuosos. Comprobar si los cambios mejoraron la calidad con un nivel de significacin
del 5%.
Ejercicio 2. Un propietario de un gran taller de reparacin de artculos electrodomsticos,
asegura que por lo menos en el 30% de las reparaciones se hacen posteriores reclamos. Uno
de sus empleados piensa que dicha proporcin es mayor y para probarlo toma una muestra
aleatoria de 120 rdenes de reparacin efectuadas anteriormente y encuentra que el 39.17%
de las mismas fueron objeto de reclamos. Quin tiene la razn? Nivel de significacin del
1%.

Ejercicio 3. Una compaa estima que tiene una participacin en el mercado de un 80%
para su producto estrella. Mediante una muestra aleatoria de 400 posibles consumidores se
encuentra que el 75% de los mismos consumen el referido producto. Con un nivel de
significacin del 1%, puede concluirse a travs de los resultados que dicha proporcin es
menor?

Ejercicio 4. Se quiere comprar una maquina troqueladora y se adquirir si la proporcin


de piezas defectuosas producidas por la mquina es 10% o menos. Se examina una muestra
aleatoria de 40 piezas y se encuentra que 7.5% resultaron defectuosas. Con un nivel de
significacin del 5%, puede concluirse que la mquina satisface los requerimientos?

Prueba de hiptesis para la diferencia entre las proporciones de dos


poblaciones
Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas
estudiamos una v.a. dicotmica (Bernoulli) de parmetros respectivos
cada poblacin vamos a extraer muestras de tamao
Entonces

n1

n2

p1

p2

. De

n1

X 1 x1i B n1 , p1
i 1

n2

X 2 x2i B n2 , p2
i 1

Si las muestras son suficientemente grandes ocurre que una aproximacin para la

prueba de hiptesis al nivel de significancia para la diferencia de proporciones


de dos poblaciones es:

Formulacin de Hiptesis
Prueba bilateral
H 0 : p1 p2
H1 : p1 p2

Prueba unilateral inferior


H 0 : p1 p2
H1 : p1 p2

Prueba unilateral superior


H 0 : p1 p2
H1 : p1 p2

Fijar nivel de significacin

= 0,05; 0,01 etc.


Estadstica de prueba
Z

(p 1 - p 2 )-(p1-p 2 )
1

pq

Normal ( 0 , 1)

n
2

1 n 2p
2
n1 p
n1 n 2

Regiones crticas
Contraste Bilateral

-- ZR-- /-------------ZA--------------/--ZR--

Contraste unilateral superior Contraste unilateral inferior

----------------ZA---------------/----ZR----

----ZR-----/--------------ZA----------------

Decisin
Forma Tabular
Si el valor numrico del estadstico de prueba se ubica en la Zona de Aceptacin (ZA) se
H0
acepta la Hiptesis nula
.
Si el valor numrico del estadstico de prueba se ubica en la Zona de Rechazo (ZR) se
H0
rechaza la Hiptesis nula
.
Forma Mtodo p

Si el valor numrico de p es superior que el nivel de significancia fijado se acepta


H0
la Hiptesis nula
.

Si el valor numrico de p es inferior que el nivel de significancia fijado se rechaza


H0
la Hiptesis nula
.

Ejemplo 1. Una firma distribuye dos marcas de detergente. En una encuesta se encuentra
que 56 de 200 amas de casa prefieren el detergente de la marca A y que 29 de 150 amas de
casa prefieren la marca B. Se puede concluir al nivel de significacin del 5% que la marca
A tiene mayor preferencia que la marca B?

Solucin:
Marca A
X1
: Nmero de amas de casa que
prefieren detergente marca A
X1
= 56
n1
= 200
X
56
p1 1
n1 200

Marca B
X2
: Nmero de amas de casa que
prefieren detergente marca B
X2
= 29
n2
= 150
X
29
p 2 2
n2 150

p1

p 2

q1

= 0,28

= 0,72

= 0,19

q2

Formulacin de hiptesis
H 0 : p1 p2
H1 : p1 p2
Nivel de significancia

= 5%
Estadstico de prueba
Z

1 - p
2 )-(p1-p 2 )
(p

pq

(0,280,19) 0
1
1
0,24*0,76

200 150

= 1,96

Calculando

1 n 2 p 2
n1 p
n1 n 2

200 * 0, 28 150 * 0,19


200 150

= 0,81

q
= 0,24

= 0,76

Regiones crticas

----------------ZA---------------/-----ZR----

z1
1,645

Decisin

z1

Fijando = 0.05, la regin de aceptacin es el intervalo (- ;


= 1,645)
z1
Como el estadstico de prueba Z = 1,96 es mayor que
= 1,645, es decir se ubica en la
zona de rechazo, se rechaza H0
Se concluye que efectivamente la marca A tiene mayor preferencia que la marca B con un
nivel de confianza del 95%.

Ejercicios propuestos
Ejercicio 1. Dos mquinas A y B, producen un mismo artculo. La mquina A produce
como trmino medio una proporcin de 14% de artculos defectuosos, mientras que la
mquina B, produce en trmino medio una proporcin de 20% de artculos defectuosos. Si
se obtiene una muestra aleatoria de 200 unidades del artculo que provengan de la mquina
A y una muestra aleatoria de 100 unidades provenientes de la mquina B. Demostrar que la
mquina B tenga una proporcin de defectuosos 8% o ms que A. Se supone que la
poblacin es infinita.
Ejercicio 2. Se seleccion una muestra aleatoria de 100 hombres y 100 mujeres de un
departamento de Colombia; se hall que de los hombres 60 estaban a favor de una ley de
divorcio y de las mujeres 55 estaban a favor de dicha ley. Con base en sta informacin,
pruebe que la proporcin de hombres que favorece sta ley es mayor que la proporcin de
mujeres. Asuma un nivel de confianza del 99 por ciento.
Ejercicio 3. La maqueta del nuevo automvil propuesto se mostr a dos grupos de 150
personas cada uno. Un grupo const de personas entre 18 y 25 aos de edad, y el otro de

personas mayores de 50 aos. El 80% de los integrantes del grupo ms joven aprob el
modelo, mientras que slo el 50% del grupo mayor en edad lo aprueba. Dentro de un 95%
de confiabilidad, puede decirse que ambos grupos tienen opiniones diferentes?
Ejercicio 4. Un profesor de Estadstica desea comparar el porcentaje de aprobados de la
seccin A contra el porcentaje de aprobados de la seccin B. En la seccin A se
tom una muestra de 26 estudiantes, de los cuales 16 haban aprobado, de la seccin B
una muestra de 28 estudiantes revel 25 aprobados. Utilice un 99% de confiabilidad para
comprobar si el porcentaje de aprobados de la seccin B es superior al de la seccin A.

S-ar putea să vă placă și