Sunteți pe pagina 1din 53

b

CAPÍTULO 6

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

La estadística inferencial es la parte de la estadística en la que se hacen


afirmaciones de la población o de sus parámetros en base a la información
obtenida de una muestra o muestras extraídas de dicha población o se
toman decisiones frente la incertidumbre. En este capítulo trataremos los
siguientes temas:
a) Estimación de parámetros.
b) Prueba de hipótesis sobre parámetros.
c) Regresión y correlación lineal simple
d) Prueba de Independencia chi-cuadrado

6.1. ESTIMACIÓN DE PARÁMETROS


Es un proceso de estadística inferencial que tiene por la finalidad aproximar
el valor del parámetro poblacional a partir de los datos tomados de una
muestra.
La estimación de parámetros se realiza a través de la estimación puntual y la
estimación por intervalos.

6.1.1. Estimación puntual: Es la estimación de un parámetro poblacional


hecha en un solo valor o punto de la muestra. Por ejemplo: la media
muestral, la varianza muestral, la desviación estándar muestral, la
proporción muestral, etc.

6.1.2. Estimación por intervalos: Es el rango dentro del cual está el


parámetro desconocido con un nivel de confianza dado. Por lo tanto, se
llama intervalo de confianza.

En base a una muestra aleatoria y la correspondiente estadística θ^ , se trata


de encontrar un intervalo [L1, L2] llamado intervalo de confianza que debe
contener el parámetro θ con una probabilidad dada (1-) llamado nivel de
confianza.

175
Si θ^ es una estadística
f (θ)

1
/2 - /2
x
L1 θ L2
fig. 24

El intervalo [L1, L2] es un intervalo aleatorio ya que sus extremos L 1, L2


llamados límites de confianza son variables cuyos valores varían de una
muestra a otra.

La estimación interválica consiste en calcular L 1 y L2, dada una muestra


aleatoria y un nivel de confianza (1−α ) y decir que se tiene confianza del
100 ( 1−α ) % que el intervalo contiene el valor del parámetro desconocido .

El nivel de confianza (1−α ) es la probabilidad de que al tomar una muestra


aleatoria en una población el parámetro desconocido  se encuentre dentro
de un intervalo de confianza.

Los niveles de confianza más usados son90%, 95% y 99%. Cuanto más alto
es el nivel de confianza, más probable es que el valor del parámetro que se
está estimando quede dentro del intervalo y mientras más estrecho sea el
intervalo más exacto es la estimación.

Por ejemplo: Si 1−α=0.95, se dice que se tiene una confianza del 95% que
el intervalo contenga el valor del parámetro desconocido ; o bien, de 100
intervalos aleatorios que se tomen 95 de las veces contendrá el parámetro y
sólo 5 veces no lo contendrá.

A continuación, estudiaremos la estimación de intervalos de confianza para


la media poblacional, proporción poblacional, diferencia de medias
poblacionales y diferencia de proporciones poblacionales.

176
6.1.2.1. Intervalo de confianza para la media poblacional
P [ L1 ≤ μ ≤ L2 ] =1−α

1
/2 - /2

L1  L2

fig. 25

Se presentan los siguientes casos:

CASO I: Uso de la Estadística Z.


i) Muestra grande (n  30), varianza poblacional conocida 2 y población
normal o no.
σ σ
L1=x−Z 0 σ x =x −Z 0 L2=x + Z0 σ x =x +Z 0
√n √n

ii) Muestra grande (n  30), varianza poblacional desconocida ( σ 2 ≅ s 2) y


población normal o no.
s s
L1=x−Z 0 s x =x−Z 0 L2=x + Z0 s x =x+ Z 0
√n √n

iii) Muestra pequeña (n < 30), varianza poblacional conocida σ 2 y


población normal.
σ σ
L1=x−Z 0 σ x =x −Z 0 L2=x + Z0 σ x =x +Z 0
√n √n

NOTA:
Para muestras grandes (n≥30) y poblaciones no normales se utiliza el
Teorema del Limite Central (TLC) cuando la varianza es conocida σ 2.

Teorema del Limite Central

177
Es un teorema importante de probabilidad y estadística pues afirma que la
distribución de muestreo de la media se aproxima a la distribución normal al
aumentar el tamaño de la muestra.

Este teorema nos indica que, si la muestra es suficientemente grande, por lo


menos 30 (n≥30) independientemente de la forma de la distribución de la
media muestral, seguirá aproximadamente una distribución normal.

Sea x1, x2, x3,…., xn un conjunto de variables aleatorias independientes e


idénticamente distribuidas con media μ y varianza σ 2 ≠ 0. Entonces si el
tamaño de la muestra n es suficientemente grande la media de la muestra
n

∑ x i se aproximará a una distribución normal con media μ x́ =μ y varianza


x́= i=1
n
2 σ2
σ X́ = .
n

CASO II: Uso de la Estadística t


Muestra pequeña (n < 30), varianza poblacional desconocida ( σ 2 ≅ s 2) y
población normal.
s s
L1=x−t 0 s x =x−t 0 L21=x +t 0 s x =x+ t 0
√n √n

Donde: t 0=t 1−α /2 , n−1

OBSERVACIONES:
A) Error Estándar de la Media:
 Si el muestreo es con o sin reposición en una población infinita (o con
sustitución en una población finita de tamaño N), el error estándar de
la media muestral es:
σ 2
i) σ x = →(σ conocida)
√n
s 2
ii) s x = →(σ desconocida)
√n

178
 Si el muestreo es sin reposición en una población finita de tamaño N,
el error estándar de la media muestra es:
σ N −n
i) σ x =
√ n√N −1
→( σ 2 conocida)

s N−n
√ √
ii) s x = →(σ 2 desconocida)
n N −1

N −n
Donde:
√ N −1
es el factor de corrección para población finita.

B) Error de estimación:
Si x estima a , entonces el error de estimación es el valor numérico
| x -|. Ver fig. 26:

error

L1 L2
fig. 26

El valor mínimo del error de estimación es igual a cero, esto ocurre, cuando
x estima exactamente a . El valor numérico máximo del error de estimación
es igual a Z 0 σ x , ya que el intervalo de estimación resulta: |x-|  Z 0 σ X

Ejemplo 106:
Una empresa desea estimar el tiempo medio que necesita una secretaria
para llegar a su casa del trabajo. En una muestra al azar de 40 secretarias
se encuentra que la media es de x= 60 minutos. Suponiendo que la
desviación estándar de la población es de σ =15 minutos y un nivel de
confianza del 95%. Construir un intervalo de confianza para la media
poblacional.

Solución:
 Sea desea estimar µ: Tiempo medio en minutos que emplea una
secretaria para llegar a su casa del trabajo
 Se tiene una muestra de n=40 (n>30), con una media de x =60.
 La varianza es conocida; dado que σ =15 σ 2=225 min .2

179
 Se desconoce la forma de la distribución de la población (Población no
normal)
 Usar la estadística Z - Caso I – i
 Para el nivel de confianza 1−α=0.95, el valor ZO =1.96
 El error estándar de la media muestral x es:
σ 15
σ x= = =2.37
√ n √ 40
 Los límites de confianza para  son:
σ
L1=x−Z 0 =60−1.96 ×2.37
√n
σ
L2=x−Z 0 =60+1.96 × 2.37
√n

σ
L1=x−Z 0 =60−4.65=55.35 minutos
√n
σ
L2=x−Z 0 =60+ 4.65=64.65 minutos
√n

 Se tiene una confianza del 95% que el tiempo medio que emplea una
secretaria para llegar del trabajo a su casa varía entre 55.35 y 64.65
minutos.

Ejemplo 107:
Los ingresos semanales promedio de las personas que trabajan en varias
empresas aparecieron en la revista Gestión en 2018. Esos ingresos para
quienes trabajan en asesoramiento jurídico fueron 5639 dólares. Suponga
que este resultado se basó en una muestra de 250 personas dedicadas al
asesoramiento jurídico, y que la desviación estándar de la muestra fue $50.
Calcule el intervalo de confianza de 95% para la población de ingresos
semanales de personas que trabajan en asesoramiento jurídico.
Solución:
 Sea desea estimar µ: El ingreso medio semanal poblacional en dólares
de las personas que trabajan en asesoramiento jurídico.

 n = 250 (muestra grande n > 30)


con x=$ 5639 y s=$ 50
 La varianza poblacional es desconocida.

180
 Se desconoce la forma de la distribución de la población (Población no
normal).
 Usamos la estadística Z – Caso I – ii
 Para el nivel de confianza 1−α=0.95, el valor ZO =1.96
 El error estándar de la media muestral es:
s 50
sx= = =3.16
√ n √ 250
 Los límites de confianza para  son:
s
L1=x−Z 0 =5639−1.96 × 3.16
√n
s
L2=x + Z0 =5639+1.96 ×3.16
√n

s
L1=x−Z 0 =5639−6.19=5632.81
√n
s
L2=x + Z0 =5639+6.19=5645.19
√n

 Los ingresos para quienes trabajan en varias empresas para los servicios
jurídicos varían entre $5632.81 y $5645.19 con una confianza del 95%.

Ejemplo 108:
El jefe de personal de una empresa selecciona al azar 25 registros de
empleados contratados por hora, obteniendo una media salarial de $ 87.50
por hora. Se sabe que los salarios se distribuyen normalmente. Estime el
salario medio poblacional de los empleados mediante un intervalo del 90%
de confianza, si la desviación estándar poblacional de los salarios es de $ 36
por hora.
Solución:
Se desea estimar µ: Salario medio poblacional en soles de los empleados
contratados.
 n = 25 (muestra pequeña n < 30)
con x=$ 87.50
 La varianza poblacional conocida, dado que σ =36 σ 2=1296 $2
 Los salarios en dólares de los empleados contratados se distribuyen
normalmente. (Población normal)
 Usamos la estadística Z - Caso I – iii
 Para el nivel de confianza 1−α=0.90, el valor ZO =1.645
 El error estándar de la media muestral es:

181
σ 36
σ x́ = = =7.2
√ n √25
 Los límites de confianza para  son:
σ
L1=x−Z 0 =87.50−1.645× 7.2=75.66
√n
σ
L2=x + Z0 =87.50+1.645 ×7.2=99.34
√n

σ
L1=x−Z 0 =87.50−11.84=75.66
√n
σ
L2=x + Z0 =87.50+11.84=99.34
√n

Interpretación:
La media salarial poblacional por hora de los empleados contratados varía
entre $75.66 y $99.34 con una seguridad del 90%.

Ejemplo 109:
De un lote de 2200 calculadoras científicas se probó 81 al azar. La vida
promedio en la muestra fue de 3.2 años con una desviación estándar de 0.9
años. Construye un intervalo de confianza del 95% para la vida media de las
calculadoras científicas.
Solución:
 Se desea estimar µ: Tiempo medio poblacional de vida en años de las
calculadoras científicas.
 N = 2200 (población finita).
 n = 81 (muestra grande n>30) con x = 3.2 años y s = 0.9
años.
 Se desconoce la forma de la distribución de la población (Población no
normal).
 Usamos Z - Caso I – ii
 Para el nivel de confianza 1−α=0.95, el valor ZO =1.96
 El error estándar de la media muestral es:
s N−n 0.9 2200−81
sx=
√n √ N −1
sx=

√ 81 2200−1
=0.098

 Los límites de confianza para  son:


s
L1=x−Z 0 =3.2−1.96 × 0.098=3.0 años
√n

182
s
L2=x + Z0 =3.2+ 1.96× 0.098=3.4 años
√n

 Se tiene una confianza del 95% que el tiempo medio poblacional de vida
media de las calculadoras científicas varía entre 3.0 y 3.4 años.

Ejemplo 110:
Los siguientes datos corresponden a pensiones de alimentos en soles de 15
demandas judiciales: 200, 320, 180, 250, 350, 250, 190, 330, 220, 210, 220,
200, 215, 310, 300. Suponiendo que la población de las pensiones está
distribuida normalmente, construir el intervalo de confianza del 95% para el
promedio poblacional de las pensiones de alimentos de las demandas
judiciales.
Solución:
 Sea desea estimar µ: Pensión promedio poblacional de alimentos en
soles de las demandas judiciales.
 n = 15 (muestra pequeña n < 30)
con x = S/. 249.67 y s = S/.57.02
La media muestral y desviación estándar se obtienen de los datos dados.
 Las pensiones de alimentos en soles se distribuyen
mediante una distribución normal (Población normal).
 Usamos la estadística t - Caso II
 Para un nivel de confianza del 95% el valor de t 0 es:
t 0=t 0.975,14 =2.145
 El error estándar de la media muestral es:
s 57.02
sx= = =14.72
√ n √ 15
 Los límites de confianza para  son:
s
L1=x−t 0 =249.67−2.145 ×14.72
√n
s
L2=x +t 0 =249.67+2.145 ×14.72
√n

s
L1=x−t 0 =249.67−31.57=S /.218.10
√n
s
L2=x +t 0 =249.67+31.57=S /. 281.24
√n

 La pensión promedio poblacional de alimentos de las demandas


judiciales varían entre S/.218.10 y S/.281.24 con una confianza del 95%.

183
Ejemplo 111:
Con el fin de medir el rendimiento de una máquina (N° de unidades
producidas), se toma una muestra y se obtiene los siguientes resultados: 20,
24, 22, 22, 21, 27, 25. Si el rendimiento de la máquina se distribuye
normalmente, calcular un intervalo de confianza del 99% para el rendimiento
medio poblacional.

Solución:
 Se desea estimar: μ: Tiempo medio poblacional de ejecución en
milisegundos de un programa.
 n=7 (muestra pequeña n<30) con x=23 unidades y s=2.45unidades
 Varianza poblacional desconocida ( σ 2 ≅ s 2) se estima a través de la muestra.
 El rendimiento de la máquina se distribuye normalmente (Población
normal).
 Usamos la estadística t – Caso II
 Para el nivel de confianza 1−α=0.99 t O=t 0.995 ,6=3.707
 El error estándar de la media muestral x es:

s 23
sx= = =8.69
√n √ 7

 Usamos la estadística t – Caso II


 Hallando el intervalo de confianza:
s 2.45 s 2.45
L1=x−t 0 =23−3.707 × L2=x +t 0 =23+3.707 ×
√n √7 √n √7
L1=23−3.43=19.57 ≅ 20unidades L2=23+3.43=26.43 ≅ 26 unidades Interpretac
ión:
El rendimiento medio poblacional de la máquina varía entre 20 y 26
unidades con una confianza del 99%.

6.1.2.2. Intervalo de confianza para la proporción poblacional

184
P [ L¿ ≤ P ≤ L2 ]=1−α

1
-
/2 /2

L1 P L2

fig. 27

Para hallar los intervalos de confianza para la proporción poblacional


usaremos la estadística Z para muestras grandes (n  30). Entonces los
límites de confianza serán:
p.q
L1= p−Z 0 × s p= p−Z 0 ×
√ n
p .q
L2= p+ Z 0 × s p= p+ Z 0 ×
√ n

OBSERVACIONES:
A. Error estándar de la proporción
Si el tamaño de la muestra es suficientemente grande (n  30). Si el
muestreo es con o sin sustitución en una población infinita (o con
sustitución en una población finita de tamaño N), el error estándar es:
P(1−P)
σ p=
√ n
que se estima por:

p(1− p)
s p=
√ n

 Si el muestreo es sin sustitución en una población finita de tamaño N


P(1−P) N −n
σ p=
√ n
×
N −1 √ que se estima por:

p(1− p) N −n
s p=
√ n √
N−1

Donde:
N −n
√ N −1
es el factor de corrección para población finita.

185
Ejemplo 112:
Una muestra de 400 menores de 16 años revela que 220 consumen drogas.
Estimar la proporción de menores de 16 años que consumen drogas en toda
la población mediante un intervalo de confianza del 99%.

Solución:
 Observamos que la proporción muestral de menores de 16 años que
consumen drogas es:
220
p= =0.55 ⇒q=0.45
400

 Para un nivel de confianza del 99% el valor de ZO =2.576

 El error estándar de la proporción muestral es:


p .q 0.55 × 0.45
s p=
√ √
n
=
400
=0.02

 Los límites de confianza para P son:


p.q p .q
L1= p−Z 0 ×
√ n
=0.55−2.576 ×0.02L2= p+ Z 0 ×
√ n
=0.55+2.576 × 0.02

p.q p .q
L1= p−Z 0 ×
√ n
=0.55−0.05=0.45L2= p+ Z 0 ×
√n
=0.55+0.05=0.60

 Se tiene una confianza del 99% que entre el 45% y 60% de los jóvenes
menores de 16 años consumen drogas.

Ejemplo 113:
Mediante un muestreo al azar de 49 de 500 compradores en la exposición
de libros sobre Psicopedagogía en la Feria del Pacífico, el gerente de ventas
de la Compañía Editora, encontró que el 80% de estos clientes se
interesaron por el nuevo libro. Establezca un intervalo de confianza del 95%
para la proporción de compradores interesados por dicho libro.

Solución:
 Se desea estimar P: Proporción poblacional de compradores interesado
por un libro de Psicopedagogía.

186
 Observamos que hay una población finita de tamaño N= 500 y una
muestra aleatoria de tamaño n= 49
 Observamos también que la proporción muestral de compradores del
nuevo libro es p=0.80⇒ q=0.20.
 Para un nivel de confianza del 95 % ⇒ Z 0=1.96
 El error estándar de la proporción muestral es:
p .q N−n 0.80 ×0.20 500−49 s =0.05
s p=
√ √
n
×
N−1
s p=
√ 49
×

500−1
p

 Los límites de confianza para P son:


p . q N −n
L1= p−Z 0
√ √
n N−1
=0.80−1.96 ×0.05

p.q N −n
L2= p+ Z 0
√ √
n N −1
=0.80+1.96 × 0.05

p . q N −n
L1= p−Z 0
√ √
n N−1
=0.80−0.01=0.70

p.q N −n
L2= p+ Z 0
√ √
n N −1
=0.80+0.01=0.90

0Interpretación:
El porcentaje de compradores interesados en un libro de Psicopedagogía
varía entre el 70% y el 90% con una seguridad del 95%.

Ejemplo 114:
En una ciudad, nadie es indiferente respecto a una iniciativa propuesta por el
alcalde: cada ciudadano o bien está a favor, o bien en contra de la iniciativa.
Se desea conocer el porcentaje P de las personas que están en contra de la
iniciativa del alcalde. De 60 habitantes adultos elegidos al azar, 20 afirmaron
que estaban en contra (y los 40 restantes a favor). Hallar el intervalo de
confianza al 99% para la proporción real de personas que están en contra de
la iniciativa propuesta por el alcalde.
Solución:
 Se desea estimar P: Proporción real de ciudadanos en contra de la
iniciativa propuesta por el alcalde.
 Observamos que la proporción muestral de ciudadanos en contra de la
iniciativa propuesta por el alcalde es:
20
p= =0.33 ⇒ q=0.67
60
187
 Para un nivel de confianza del 99% el valor de Z 0=2.576
 El error estándar de la proporción muestral es:

p ×q 0.33 ×0.67
s p=
√ n
=
√ 60
=0.06

 Los límites de confianza para P son:


p×q p ×q
L1= p−Z 0 ×
√ n
=0.33−2.576 ×0.06 L2= p+ Z 0 ×
n √
=0.33+2.576 ×0.06

p×q
L1= p−Z 0 ×
√ n
=0.33−0.15=0.18

p ×q
L2= p+ Z 0 ×
√ n
=0.33+0.15=0.48

Interpretación: Se tiene una confianza del 99% que el porcentaje de


personas que están en contra de la iniciativa de la propuesta por el alcalde
varía entre el 18% y 48%.

6.1.2.3. Intervalo de confianza para la diferencia de medias


poblacionales en muestras aleatorias independientes

P [ L1 ≤ μ 1−μ2 ≤ L2 ]=1−α

1
-
/2 /2

L1 μ1 - μ2 L2

fig. 28

Se presentan los siguientes casos:

188
CASO I: Usando la estadística Z.

i) Muestras grandes ¿ y n2 ≥ 30¿ , varianzas poblacionales (σ 12 , σ 22)


conocidas y poblaciones normales o no.

L1=( x 1−x 2 )−Z 0 σ x − x 1 2


y L2=( x 1−x 2 ) + Z 0 σ x −x 1 2

Donde:
σ 12 σ 2 2
σ x −x =
1 2
√ +
n1 n2

ii) Muestras grandes ¿ y n2 ≥ 30¿ , varianzas poblacionales ¿ y σ 22 ≅ s2 ¿


desconocidas y poblaciones normales o no.

L1=( x 1−x 2 )−Z 0 s x −x 1 2


y L2=( x 1−x 2 ) + Z 0 s x −x 1 2

Donde:
s12 s22
sx − x =
1
+
n1 n2 2

iii)Muestras pequeñas ¿ y n2 <30 ¿, varianzas poblacionales (σ 12 , σ 22)
conocidas y poblaciones normales.

L1=( x 1−x 2 )−Z 0 σ x − x 1 2


y L2=( x 1−x 2 ) + Z 0 σ x −x 1 2

Donde:
σ 12 σ 2 2
σ x −x = +
n1 n2
1 2

NOTA: En caso que las poblaciones N 1 y N2 fueran finitas se debe
corregir:
σ 12 N 1 −n1 σ 22 N 2−n2 s12 N 1−n1 s 22 N 2−n2
σ x −x =
n1 1
×
N 1−1
+
n2
× s

N 2−1 x − x
2
= (
n1
× + ×
N 1 −1 n1) N 2−1 ( ) 1 2
√ ( ) ( )
CASO II: Usando la estadística t

189
i) Muestras pequeñas ¿ y n2 <30 ¿, varianzas poblacionales
desconocidas pero iguales σ 12=σ 22 ¿ y σ 22 ≅ s22 ¿ poblaciones
normales.
1 1 1 1
L1=( x 1−x 2 )−t 0 Sc
√ +
n1 n2
y L2=( x 1−x 2 ) +t 0 Sc
√ +
n1 n2

Donde:
1 1
s x − x =Sc
1 2
√ +
n1 n2

Además:
( n1−1) s12 +(n2−1)s12 t =t
Sc=

n 1+ n2−2
0 1−α /2 , n +n −2 1 2

ii) Muestras pequeñas (n1 < 30 y n2 < 30) varianzas poblacionales


desconocidas pero diferentes σ 12 ≠ σ 21 (σ 21 ≅ s21 , σ 22 ≅ s 22) y poblaciones
normales.

s 21 s2 s 21 s2
L1=( x1 - x2 ) - t o
√ n1
+ 2
n2
y L2=( x1 - x2 ) + t o
√ n1
+ 2
n2

Donde:

t o=t 1−α / 2 ,r

2
s 12 s 2 2

r=
[ +
n1 n2
2
] 2
s 12 s22
[ ][ ]
n1
+
n2
n 1−1 n2−1

Dado que rara vez r es un entero se redondea al entero más cercano.

Ejemplo 115:
Se quiere estimar la diferencia entre los promedios de tiempos en minutos
que utilizan dos trabajadores del Poder Judicial para realizar una
determinada tarea suponga que las poblaciones de los dos tiempos son
normales con varianza común. Estime la diferencia entre los dos promedios

190
poblacionales mediante un intervalo de confianza del 95%, si el registro de
16 tiempos de cada trabajador ha dado x 1=38 , s1=6 y x 2=35, s2=4 .
Solución:
 Sea estimar μ1−μ 2: La diferencia promedio poblacional de los tiempos en
minutos que utilizan los trabajadores del Poder Judicial para realizar una
determinada tarea.
 De las muestras dadas obtenemos:
n1 =16 (n1<30), x 1=38 minutos, s1=6 minutos
n2 =16 (n2 <30), x 2=35 minutos, s2=4 minutos
 Las varianzas poblacionales son desconocidas
 Las poblaciones de los dos tiempos son normales con varianza común.
 Haremos uso de la estadística t – Caso I-i
 Las diferencias de medias muestrales son:
x 1−x 2=38−35=3
 El error estándar de la media muestral es:
1 1
s x − x =Sc
1 2
√ + =1.80
n1 n2

Donde:
( n1−1) s12 +(n2−1)s22
Sc=

n 1+ n2−2
Sc=5.10

 Para un nivel de confianza del 95% el valor de t 0 es:


t 0=t 0.975,30=2.042
 Los límites de confianza para la diferencia de medias poblacionales son:

1 1 1 1
L1=( x 1−x 2 )−t 0 Sc
√ +
n1 n2
y L2=( x 1−x 2 ) +t 0 Sc
√ +
n1 n2

L1=3−2.042× 1.80
L1=3−3.68=−068

L2=3+2.042 ×1.80
L2=3+3.68=6.68

 Luego, el intervalo de confianza del 95% para μ1−μ 2 es:


-0.68  μ1−μ 2  6.68. Dado que μ1−μ 2 = 0  al intervalo de confianza [-
0.68, 6.68] podemos concluir que μ1=μ 2; por lo tanto, los tiempos

191
promedios poblacionales que utilizan ambos trabajadores para realizar
una determinada tarea son iguales.

Ejemplo 116:
Con el fin de comparar el rendimiento medio en la cátedra de Derecho
Romano de las Facultades de Derecho de dos universidades una estatal,
otra privada; se tomaron dos muestras aleatorias y se les aplicó un examen
de 100 preguntas. En dicha prueba se obtuvieron los siguientes resultados.

n x s
Universidad Privada 50 85 12
Universidad Estatal 60 71 14

Construir el intervalo de confianza del 95% para la diferencia de las medias


poblacionales.

Solución:
 Se desea estimar μ1−μ 2: La diferencia media poblacional de los
rendimientos en la catedra de Derecho Romano.
 De las muestras dadas obtenemos:
n1 = 50 (n1>30), x 1=85 puntos, s1 = 12 puntos
n2 = 60 (n2>30), x 2=71 puntos, s2 = 14 puntos
 Varianzas poblacionales desconocidas.
 Se desconoce la forma de la distribución de las poblaciones (Poblaciones
no normales).
 Haremos uso de la estadística Z – Caso I-ii
 Las diferencias de medias muestrales son:
x 1−x 2=85−71=14
 El error estándar de la media muestral es:
s 21 s22
sx − x =
1 2

s x − x =√ ¿ ¿¿
√ +
n 1 n2
1 2

s x − x =2.48
1 2

 Para un nivel de confianza del 95 % ⇒ Z 0=1.96


 Los límites de confianza para la diferencia de medias poblacionales son:

L1=( x 1−x 2 )−Z 0 s x −x 1 2


y L2=( x 1−x 2 ) + Z 0 s x −x
1 2

192
L1=14−1.96 ×2.48
L1=14−4.86=9.14

L2=14 +1.96 ×2.48


L2=14 +4.86=18.86

 Luego, el intervalo de confianza del 95% para μ1−μ 2 es:


9.14  μ1−μ 2  18.86. Dado que μ1−μ 2 = 0 ∉ al intervalo de confianza,
lo que quiere decir que los rendimientos medios poblacionales de ambos
grupos son diferentes, en este caso μ1−μ 2>0 . Los alumnos de las
universidades privadas tienen mayor rendimiento medio que los alumnos
de las universidades estatales.

Ejemplo 117:
Para comparar los gastos medios mensuales de los alumnos de 2
universidades particulares se escogen dos muestras aleatorias de 10 y 9
estudiantes respectivamente resultando los siguientes gastos en dólares:
Muestra 1: 400, 410, 420, 380, 390, 410, 400, 405, 405, 400.
Muestra 2: 390, 395, 380, 390, 400, 380, 370, 390, 380.

Mediante un intervalo de confianza del 95% para la diferencia de medias de


los gastos mensuales. ¿Se puede inferir que los gastos promedios son
iguales? ¿Suponga que ambas poblaciones son normales, independientes,
con varianzas desconocidas supuestas iguales?
Solución:
 Se desea estimar μ1−μ 2: La diferencia media poblacional de los
gastos mensuales en dólares de los estudiantes.
 Cálculos realizados con las muestras dadas:
i ni xi si
Muestra 1 10 402 11.11
Muestra 2 9 386.11 9.28

 Las muestras n1= 10 (n1<30) y n2=9 (n2<30)


 Varianzas desconocidas supuestas iguales.
 Poblaciones normales.
 Haremos uso de la estadística t – Caso I - i
 La diferencia de medias muestrales es:
x 1−x 2=¿ 402 – 386.11 = 15.89
 Para un nivel de confianza del 95% t 0=t 1−α /2 , n +n −2=t 0.975,17 =2.11
1 2

193
1 1
 s x − x =Sc
1 2
√ + =4.73
n1 n2

Donde:
( n1−1) s12 +(n2−1)s22
Sc=
√ n 1+ n2−2
=10.29

 Los límites de confianza para la diferencia de medias poblacionales, son:


1 1
L1=( x1 −x2 )−t 0 Sc

L1=15.89−9.98=$ 5.91
√ +
n1 n2
L1=15.89−2.11 ×4.73

1 1 L =15.89+2.11 × 4.73
L2 ( x 1−x 2)+t 0 Sc

L2=15.89+9.98=$ 25.87
√ +
n1 n2
2

Luego el intervalo de confianza del 95% para μ1−μ 2, es:


5.91 μ1−μ 2,  25.87. Dado que μ1−μ 2 = 0  al intervalo de confianza,
quiere decir que los gastos promedios mensuales poblacionales no son
iguales. Por lo tanto μ1−μ 2>0 . El gasto promedio semanal del grupo 1 es
mayor que el gasto medio semanal del grupo 2.

Ejemplo 118:
Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y
mujeres para realizar determinada tarea. Las experiencias anteriores indican
que la distribución de tiempos tanto para hombres como para mujeres es
normal con varianzas diferentes. Una muestra aleatoria de 9 hombres y 8
mujeres han dado los siguientes tiempos en minutos:

Hombres: 13, 27, 10, 25, 24, 19, 21, 32, 16


Mujeres: 16, 21, 16, 21, 16, 17, 16, 20

Mediante un intervalo de confianza del 95% para la verdadera diferencia de


los promedios de tiempo de hombres y mujeres. ¿Se puede concluir que los
hombres emplean mayor tiempo que las mujeres para hacer la tarea?

Solución:
 Se desea estimar μ1−μ 2: La diferencia promedio poblacional de los
tiempos en minutos empleados por los hombres y mujeres
respectivamente.
Cálculos realizados con las muestras dadas:
I n1 xi si

194
Muestra 1 9 20.78 7.03
Muestra 2 8 17.88 2.35

 Las muestras n1= 9 (n1<30) y n2=8 (n2<30)


 Varianzas poblacionales desconocidas pero diferentes.
 Poblaciones normales.
 Haremos uso de la estadística t – Caso II - i
 La diferencia de medias muestrales es:
x 1−x 2 = 20.78 – 17.88 = 2.9

s12 s22
sx − x
1 2
√ + =2.49
n 1 n2

 Hallando los grados de libertad r

2 2
s 12 s 22 s 22

r=
( +
n1 n2 ) ( )
+
n2
=¿ ¿ ¿
2
( s 12 /n1 ) ( s32 /n 2)
n1−1 n2 −1

r =9.97 ≅ 10

 Para un nivel de confianza del 95% 


t o=t 0.975 ,10=2.228

 Los límites de confianza para la verdadera diferencia


de los promedios de tiempo de hombres y mujeres para hacer la
tarea son:
s12 s 22 s 1 2 s 22
L1=( x1 −x2 )−t o
√ +
n1 n2
y L2=( x 1−x 2 ) +t o
√ n1 n2
+

L1=2.9−2.228× 2.49
L1=2.9−5.55=−2.65

L2=2.9+2.228 × 2.49
L2=2.9+5.55=8.45

Luego el intervalo de confianza para 1 - 2 es:

195
-2.65  1 - 2  8.45. Dado que 1 -2 = 0  al intervalo de confianza, lo cual
quiere decir que los tiempos promedios poblacionales de hombres y mujeres
para hacer la tarea son iguales.

6.1.2.5. Intervalo de confianza para diferencia de medias poblacionales


con observaciones pareadas
Un procedimiento comúnmente empleado que da como resultado dos
muestras no independientes es la denominada prueba “antes y después”.
Las mediciones se hacen sobre sujetos tanto antes como después de la
introducción de algún fenómeno. Por ejemplo, si se realiza una prueba sobre
un nuevo método de enseñanza utilizando un grupo de estudiantes las
muestras están formados por los puntajes “antes y después” de un período
de prueba.
También cuando comparamos la media de dos poblaciones puede ocurrir
una diferencia significativa por causa de factores externo no controlados. Por
ejemplo, cuando comparamos dos técnicas de venta A y B puede ocurrir que
uno de los grupos tenga vendedores más experimentados y hábiles que el
otro grupo. Así, la diferencia seria debido a esos factores y no al mérito real
de la técnica de venta. Un modo de controlar que los dos elementos de cada
par sean homogéneos en todos los sentidos, excepto con respecto al factor
que queremos comparar.

Los dos grupos de observaciones que resultan de esta clase de


procedimientos están indudablemente relacionados.

En la práctica cuando queremos hallar un estimador de la diferencia entre


dos medias poblacionales μ D=μ1 −μ2, puede presentarse los siguientes
casos:

CASO I: Uso de Z
2 2
 Cuando n  30, σ D ≅ s D (varianza poblacional de las diferencias es
desconocida) y la población es normal, entonces:

P[ L1 ≤ μD ≤ L2 ]=1−α

Donde:
s2 D s 2D
L1=D−Z 0 y L2=D+ Z 0
√n √n

Además:

196
n
n
∑ Di y s2 D=∑ ¿ ¿ ¿
D= i=1 i=1
n

CASO II: Uso de t.


2 2
 Cuando n < 30, σ D ≅ s D (varianza poblacional de las diferencias es
desconocida) y la población es normal, entonces:
P[ L1 ≤ μD ≤ L2 ]=1−α
Donde:
s 2D s2 D
L1=D−t 0 L =D+t 0
√n 1 √n

Además:
n
n
∑ Di y
2
s D= ∑ ¿ ¿ ¿
D= i=1 i=1
n

t 0=t 1−α /2 , n−1

Ejemplo 119:
Veinte estudiantes de Matemática I de la Facultad de Ingeniería Industrial de
la Universidad de Lima fueron divididas en 10 parejas, teniendo cada
miembro de la pareja aproximadamente el mismo coeficiente de inteligencia:
Uno de cada pareja se selecciona al azar y se asigna a una sección que
utiliza videos: El otro miembro se asigna a una sección que cuenta con
profesor. Al finalizar el ciclo ambos grupos se presentan al mismo examen,
obteniéndose los siguientes resultados:

Pareja Con video Con profesor


Xi Yi
1 15 16
2 12 10
3 17 17
4 11 14
5 18 17
6 15 16
7 16 18
8 13 12
9 14 15
10 10 11

197
Suponiendo que la característica en estudio sea normal, obtener el intervalo
de confianza del 99% para la diferencia real en el promedio de calificaciones
de los dos procedimientos de enseñanza con base a los resultados. ¿se
puede concluir que el procedimiento de enseñanza con profesores mejor que
con el de video.

Solución:
Obteniendo las diferencias de los coeficientes de ambas secciones:
10

i Xi Yi Di ∑ Di2
i=1
1 15 16 -1 0.25
2 12 10 2 6.25
3 17 17 0 0.25
4 11 14 -3 6.25
5 18 17 1 2.25
6 15 16 -1 0.25
7 16 18 -2 2.25
8 13 12 1 2.25
9 14 15 -1 0.25
10 10 11 -1 0.25
10 10

Total ∑ Di =−5 ∑ (Di− D́)2=20.5


i=1 i=1

10
10
∑ Di
D= i=1
10
=−0.5
y s D= √ ∑ ¿¿¿¿
i=1

 Se desea estimar μ D :Diferencia promedio poblacional de las calificaciones


de los dos procedimientos de enseñanza.
 El tamaño de la muestra es n=10 (n<30)
 La varianza poblacional de las diferencias es desconocida.
 Las calificaciones se distribuyen normalmente.
 Además: t 0=t 0.995,9=3.250
Entonces:
s 2D 1.51 s2 1.51
L1=D−t 0 =−0.5−3.250 × L2=D+t 0 D =−0.5+3.250 ×
√ n √ 10 √ n √ 10

s 2D s2 D
L1=D−t 0 =−0.5−1.50=−2.00L2=D+t 0 =−0.5+1.50=1.00
√n √n

198
Por lo tanto μ D ∈[−2.00,1 .00] con una confianza del 99%. Como 0 
[−2.00,1.00], entonces μ x =μ y . Los procedimientos de enseñanza son
iguales.

6.1.2.5. Intervalo de confianza para la diferencia de proporciones


poblacionales
P [ L1 ≤ P 1−P2 ≤ L2 ]=1−α

1
-
/2 /2

L1 P1−P2 L2

fig. 29

Para hallar los intervalos de confianza para la diferencia de proporciones


poblacionales haremos uso de la estadística Z para muestras grandes (n 1
30 y n2 30). Entonces:

L1=( p 1− p2)−Z 0 s p − p L2=( p 1− p2)+ Z 0 s p −p


1 2 1 2

Donde:
p1 q1 p2q2
sp − p =
1 2
√ n1
+
n2

Ejemplo 120:
En los establecimientos penales de Lima ciertos médicos estudiaron dos
tipos de reclusos. Una muestra del tipo I de 300 internos reveló que 50%
eran adictos a las drogas. En otra muestra aleatoria del tipo II de 240

199
internos, el 35% eran adictos a las drogas. Construir un intervalo de
confianza del 99% para la diferencia de las dos proporciones poblacionales.

Solución:
 Se desea estimar P1-P2: Diferencia de proporciones poblacionales de
internos adictos a drogas.
 Las muestras de internos tomadas para cada tipo revelan la siguiente
información:

Tipo I Tipo II
n n1 = 300 n2 = 240
p p1 = 0.50 p2 = 0.35

 Las muestras n1= 300 (n1>30) y n2=240 (n2>30)


 Las diferencias de proporciones muestrales son:
p1 – p2 = 0.50 – 0.35 = 0.15

 El error estándar de las diferencias de proporciones muestrales es:


0.50 ×0.50 0.35× 0.65
s P −P =
1 2
√ 300
+
240
=0.04

 Para un nivel de confianza del 99% Z 0=2.576


 Los límites de confianza para la diferencia de proporciones poblacionales
son:
L1=( p 1− p2)−Z 0 s p − p y L2=( p 1− p2)+ Z 0 s p −p
1 2 1 2

L1=0.15−2.576 ×0.4=0.05
L2=0.15+ 2.576× 0.4=0.25

 Luego, el intervalo de confianza del 99% para P1−P2 es:


0.05< P1−P 2< 0.05

Dado que P1−P2=0  al intervalo de confianza, en este caso P1 > P2. El


porcentaje de reclusos Tipo I con adicción a las drogas es mayor que el
porcentaje de los reclusos de tipo II.
NOTA: En caso que las poblaciones N| y N2 fueran finitas se debe corregir:
p 1 × q1 N 1 −n1 p 2 × q2 N 2 −n2
sp − p =
1 2
√ n1 (
N 1−1
+ )n2 N 2−1( )
200
6.2. PRUEBA DE HIPÓTESIS
En muchos problemas planteados en el campo de la ingeniería, salud,
ciencias, administración, finanzas, etc. Se requiere que se tome una decisión
entre aceptar o rechazar una suposición o conjetura sobre algún parámetro.
El objetivo en esta sección es brindar algunos procedimientos que se usan
para tomar decisiones sobre una población, a partir de los resultados de una
muestra aleatoria seleccionada de esa población. Para llegar a tomar
decisiones estadísticas se debe partir de suposiciones o conjeturas con
respecto a la población en la que estamos interesados. Tales suposiciones
pueden ser verdaderas o no. Una conjetura hecha sobre los parámetros
deberá ser sometida a comprobación experimental con el propósito de saber
si los resultados de una muestra aleatoria extraída de esa población
contradicen o no tal conjetura.
En esta sección estudiaremos prueba de hipótesis para la media
poblacional, proporción poblacional, diferencia de medias poblacionales y
diferencia de proporciones poblacionales.

A fin de entender lo que sigue definiremos algunos términos:


a) Hipótesis: Es una suposición o conjetura, que se formula con el
propósito de ser verificada.

b) Hipótesis estadística: Es un supuesto o alguna afirmación acerca de la


población: forma de la distribución o de sus parámetros. Una hipótesis es
simple cuando especifica completamente la distribución, es decir especifica
su función de probabilidad y los valores de todos sus parámetros, caso
contrario se llama hipótesis compuesta.

c) Hipótesis nula (Ho): Establece que no existe diferencias. En ella se


supone que el parámetro de la población que se está estudiando tiene
determinado valor y se formula con el único propósito de rechazarla.

d) Hipótesis alternativa (H1): Es la hipótesis estadística que suponemos es


verdadera y deseamos establecer, es una hipótesis contraria a la hipótesis
nula. También se le conoce como hipótesis de investigación.

e) Prueba de una hipótesis estadística: Es un procedimiento para decidir


si se acepta o se rechaza una hipótesis estadística.

201
f) Tipos de errores: Al realizar una prueba de hipótesis estadística no
sabemos si en una determinada acción (rechazo o aceptación de la hipótesis
nula) cometemos un error o no.
 Error Tipo I: Consiste en rechazar la hipótesis nula cuando es
verdadera.
 Error Tipo II: Consiste en aceptar la hipótesis nula cuando es falsa.

Si Ho es la hipótesis nula (sometida a prueba) y H 1 es la hipótesis


alternativa, entonces estas hipótesis junto con las dos posibilidades de
decisión podemos esquematizarla en la siguiente tabla:
SITUACIONES POSIBLES
DECISIÓN BASADA EN LA
MUESTRA Ho verdadero Ho falso
1- 
Aceptar Ho Decisión Correcta Error tipo II
 1-
Rechazar Ho Error tipo I Decisión correcta

Es indudable quien toma las decisiones, quiere reducir al máximo las


probabilidades de cometer cualquiera de estos dos tipos de errores, esto no
es fácil, pues las probabilidades de cometer error tipo I y II son inversamente
proporcionales, para cualquier prueba dada. Por lo tanto, cuanto menor es el
riesgo de cometer un error tipo I, tanto mayor es la probabilidad de cometer
un error tipo II y viceversa. Sin embargo, dada la regla de decisión, es
posible reducir ambos tipos de errores en forma simultánea, aumentando el
tamaño de la muestra.

Ilustraremos mediante un ejemplo de un profesor que mejora su metodología


de enseñanza a través de la implementación de un nuevo programa, por lo
cual nos formulamos las siguientes hipótesis:
H0: La implementación de un nuevo programa mejora el rendimiento
académico de los estudiantes.
H1: La implementación del programa no mejora el rendimiento académico de
los estudiantes.

Por lo tanto, de acuerdo a los resultados obtenidos, el profesor puede tomar


la decisión que se muestran a continuación:

DECISIÓN EL PROFESOR PUEDE

202
Haber mejorado su No haber mejorado su
metodología de enseñanza metodología de enseñanza
f(/H
Ho0)verdadero Ho falso
f(/H1)
La implementación del nuevo
programa mejora el rendimiento 1- 
académico de los estudiantes Decisión Correcta Error tipo II
Aceptar Ho
1-
La implementación del nuevo 1-
programa no mejora el  1-
rendimiento académico de los Error tipo I Decisión correcta
estudiantes
Rechazar Ho
R.A. C R.R.

Si de acuerdo a los resultados obtenidos de la muestra la implementación


del nuevo programa mejora el rendimiento académico de los estudiantes
habiendo mejorado el profesor su metodología de enseñanza se está
tomando la decisión correcta. Si la implementación del nuevo programa no
mejora el rendimiento académico de los estudiantes habiendo mejorado el
profesor su metodología de enseñanza se está cometiendo un error, a este
error se le conoce como Error Tipo I. Si la implementación del nuevo
programa mejora el rendimiento académico de los estudiantes no habiendo
mejorado el profesor su metodología de enseñanza se está cometiendo otro
error, a este error se le conoce como Error Tipo II. Si la implementación del
nuevo programa no mejora el rendimiento académico de los estudiantes no
habiendo mejorado el profesor su metodología de enseñanza se está
tomando la decisión correcta.

203
fig. 30

g) Nivel de significación (): Se denomina nivel de significación de una


prueba de hipótesis a la probabilidad de cometer un error tipo I.

 = P [error tipo I] = P [Rechazar Ho / Ho es verdadera]


 = P [error tipo I] = P [Aceptar H1 / H1 es falsa]

NOTA: La probabilidad de cometer un error tipo II se representa por , es


decir:

 = P [error tipo II] = P [Aceptar Ho / Ho falsa]


 = P [error tipo II] = P [Rechazar H1 / H1 es verdadera]

Los niveles de significación más usados son α=0.01, α=0.05 y α=0.10. Cuando
Ho es rechazada en  = 0.05, podemos decir que el resultado es significativo y
cuando Ho es rechazada en  = 0.01, decimos que el resultado es altamente
significativo.

h) Tipos de prueba:
 Prueba de cola izquierda: Si la región de rechazo se localiza a la
izquierda del punto crítico C.

f (/Ho)

1-

0
R.R. C R.A.

204
 Prueba de cola derecha: Si la región de rechazo se encuentra a la
derecha del junto crítico C.

f (/Ho)

1-

0
R.A. C R.R
.
 Prueba de dos colas. Si la región de aceptación es un intervalo
cerrado entre los puntos crítico C1 y C2.

f (/Ho)

1-

/2 /2
0
R.R. C1 R.A. CC22 R.R.

i) Pasos de una prueba de hipótesis:


1. Formulación de la hipótesis nula y alternativa de acuerdo al
problema.
2. Especificación del nivel de significación.
3. Selección de la estadística de prueba.
4. Establecimiento de los criterios de decisión.
5. Realización de cálculos.
6. Toma de decisiones

6.2.1. Prueba de hipótesis para la media poblacional


La media poblacional es un parámetro de decisión muy importante. Es de
interés conocer si una media poblacional ha aumentado, disminuido o ha
permanecido inalterado, o también podemos estar interesados en determinar
si una media poblacional es significativamente mayor o menor que un valor
supuesto.

205
Se presentan los siguientes casos:

CASO I: Uso de la estadística Z.


i) Muestra grande (n ¿ 30), varianza poblacional conocida, población
normal o no.
ii) Muestra grande (n ¿ 30), varianza poblacional desconocida (2 
s2) y población normal o no.
iii) Muestra pequeña (n < 30), varianza poblacional conocida y
población normal.

1. Formulación de hipótesis:
a) Ho:   o b) Ho:   o c) Ho:  = o
H1:  < o H1:  > o H1:   o

2. Nivel de significancia: 

3. Estadística de prueba:
 Para i y iii
x −μ 0
Z= → n(0,1)
σ /√n

 Para ii
x −μ 0
Z= → n(0,1)
s / √n

4. Establecimiento de los criterios de decisión:

 Prueba de cola izquierda

1-

-Z1- 0
R.R. R.A.
R.A.: ZK > - Z1- , se acepta Ho.
R.R.: ZK < - Z1-206
, se rechaza Ho.
 Prueba de cola derecha

1-

0
Z
R.A. R.R.1-

R.A.: Zk < Z1- , se acepta Ho.


 R.R.: Zk > Z1- , se rechaza Ho.
Prueba bilateral

1-

/2 /2
0
-Z1-/2 Z1-/2
R.R. R.A. R.R.

R.A.:-Z1 - /2<Zk < Z1 - /2, se acepta Ho.


R.R.:Zk < - Z1- /2 o Zk > Z1-/2, se rechaza Ho.
5. Realización de cálculos:
Obtención del valor experimental.
 Para i y iii
x−μ0
Z K=
σ /√n

207
 Para ii
x−μ0
Z K=
s / √n

6. Decision:
Se compara el valor experimental con el valor crítico.
Si Zk  R.A., Ho se acepta.
Si Zk  R.R., Ho se rechaza.

NOTA: Si se tiene una población finita de tamaño N se corrige la


estadística de prueba de la siguiente manera:

a) Para i y iii: b) Para ii:

x−μ 0 x−μ 0
Z= Z=
σ N −n s N −n

√ n N−1 √
√ n N−1

CASO II: Uso de la estadística t.


La muestra es pequeña (n< 30), varianza poblacional desconocida
(σ 2 ≃s 2 ) y población normal.

1. Formulación de hipótesis estadística:


a) Ho:   o b) Ho:   o c) Ho:  = o
H1:  < o H1:  > o H1:   o

2. Nivel de significancia: 

3. Estadística de prueba:
x −μ 0
t= →t n−1
s/√n
Donde: (n-1) son los grados de libertad.

4. Establecimiento de los criterios de decisión:


 Prueba de cola izquierda:

208 1-

-t1-
R.A.: tK > - t1- , se acepta Ho.
R.R.: tK < - t1- , se rechaza Ho.

0
R.R. R.A.

 Prueba de cola derecha:

1-

0
t
R.A. R.R.1-
R.A.: t < t1- , se acepta Ho.
R.R.: t > t1- , se rechaza Ho.

 Prueba bilateral :

1-

/2 /2
-t1-α/2 0 t1-α/2

R.R. R.A. R.R.


R.A.: -t1-/2 tKt1-/2, se acepta Ho.
R.A.: tK < -t1-/2 o tK > t1-/2, se rechaza Ho.
5. Realización de cálculos:
x−μ 0
tK=
s/√n

6. Decisión:
Se compara el valor experimental con el valor crítico
Si t k  RA. , aceptamos Ho.
Si t k  R.R. , rechazamos Ho.

209
NOTA: Si se tiene una población finita de tamaño N se corrige la
estadística de prueba. Así:
x−μ 0
tK=
s N −n

√ n N−1

Ejemplo 121:
La Gerencia del banco de Crédito está planeando basar los cargos las
cuentas corrientes en el saldo diario promedio, el gerente de cuentas
preferenciales desea probar la hipótesis de que las cuentas tienen un
promedio de $ 312.00. Selecciona una muestra de 200 cuentas, dando una
media de $ 298.10 con s = $ 97.30 con  = 0.01

Solución: Caso I – ii
1. Formulación de la hipótesis:
H0:  = 312
H1:   312
2. Nivel de significancia:= 0.01
3. Estadística de prueba:
Análisis:
a) n= 200 (n>30) con x́=298.10 y s=97.30
b) Varianza desconocida
c) Se desconoce la forma de distribución de la población.
d) Usamos Estadística Z – Caso I-ii
x −μ 0
Z= → n(0,1)
s / √n
4. Establecimiento de los criterios de decisión:

1-α=0.99

/2=0.05 /2=0.05

-2.576 0 2.57
R.R. R.A. R.R.
6

R.A.: -2.576 ZK 2.576, se acepta Ho


R.R.: ZK < -2.576 o ZK >2.576 , se rechaza Ho

210
5. Realización de cálculos:
x−μ0 298 .10−312. 00
Z K= = =−2 .02
s/ √n 97 . 30/ √ 200

6. Decisión:
-2.02  R.A. entonces aceptamos Ho. Las cuentas tienen en promedio
de $312.00 (μ=312¿.
La diferencia entre el valor de la media muestral y el valor de la media
poblacional es estadísticamente insignificante.

Ejemplo 122:
En una reunión informativa para una oficina corporativa, el gerente del hotel
de turistas de la ciudad de Trujillo, reportó que el número promedio de
habitaciones alquiladas por noche es de por lo menos 212. Es decir  > 212.
El administrador considera que esta cifra puede estar algo sobreestimada.
Una muestra de 150 noches produce una media de 201.3 habitaciones y una
desviación estándar de 45.5 habitaciones. Si estos resultados sugieren que
el gerente ha inflado su reporte, será amonestado severamente. A un nivel
de 1%. ¿Cuál es el destino del gerente?

Solución: Caso I – ii
1. Formulación de la hipótesis:
H0:  > 212
H1 :  < 212
2. Nivel de significancia:  = 0.01
3. Estadística de prueba:
Análisis:
a) n= 150 (n>30) con x́=201.3 y s=45.5
b) Varianza desconocida
c) Se desconoce la forma de distribución de la población.
d) Usamos Estadística Z – Caso I-ii

x −μ 0
Z= → n(0,1)
s / √n

4. Establecimiento de los criterios de decisión:

1-α=0.99

=0.01
211

-2.326
0.01
R.A.: ZK -2.326, se acepta Ho
R.R.: ZK < -2.326, se rechaza Ho

0
R.R. R.A.

5. Realización de cálculos:
x −μ 0 201.3−212
Z k= = =−2.88
s / √ n 45.5/ √ 150

6. Decisión:
Zk = -2.88  R.R., por lo tanto, se rechaza H0 (µ<212). El número
promedio de habitaciones alquilada por noche es menos de 212
habitaciones. La Hipótesis nula no se confirma. Parece que el gerente
se ha excedido al estimar la tasa de ocupación y aparentemente
recibirá amonestación de la oficina principal.

Ejemplo 122:
Una encuesta realizada por la Empresa IPSOS mostró que los estudiantes
de las universidades públicas gastan en promedio más de $ 75.00
mensuales en entrenamiento. Si Ud. puede hallar evidencias para confirmar
esta afirmación, podría utilizarla para solicitar a su casa ayuda monetaria
adicional. De los 100 estudiantes que tomó como muestra, usted halla una
media de $80.23 con una desviación estándar de $45.67. ¿A un nivel de
significancia del 10%, se encuentra justificación para la solicitud?

Solución:
1. Formulación de la hipótesis:
H0:  < 75
H1:  > 75
2. Nivel de significancia:  = 0.10
3. Estadística de prueba:
Análisis:
a) n= 100 (n>30) con x́=80.23 y s=45.67
b) Varianza desconocida
c) Se desconoce la forma de distribución de la población.
d) Usamos Estadística Z – Caso I-ii

212
x−μ 0
ZK = → n(0,1)
s / √n

4. Establecimiento de los criterios de decisión:

1-=0.90

α=0.10
0 1.282
R.A R.R.

R.A.: ZK <1.282, se acepta Ho


5. Realización de cálculos:
R.R.: ZK >1.282, se rechaza Ho
x−μ0 80 .23−75 . 00 80. 23−75. 00
Z K= = = =1. 15
s/ √ n 45 . 67/ √ 100 45 .67 /10
6. Decisión:
ZK = 1.15  R.A., por lo tanto, se acepta H0 (µ≤75). A pesar de su estilo
de vida decadente el estudiante típico no gasta en promedio más de
$75.00. Tendrá que buscar otra forma obtener más dinero de su casa.

Ejemplo 117:
Un distribuidor de bebidas plantea la hipótesis de que las ventas por mes
promedian $ 12,000. Las ventas por mes se distribuyen normalmente y en
diez meses seleccionados como muestra reportan una media de $ 11,277 y
una desviación estándar de $ 3,772. Si se utiliza el valor  del 5%. ¿Qué
puede concluir acerca de la impresión que tiene el distribuidor sobre las
condiciones del negocio?

Solución:
1. Formulación de Hipótesis:
H0:  = 12,000
H1:   12,000
2. Nivel de significancia:  = 0.05
3. Estadística de prueba:
Análisis:
a) n= 10 (n<30) con x́=11,277 y s=3,772
213
b) Varianza desconocida
c) Las ventas por mes de bebidas se distribuyen normalmente.
d) Usamos Estadística t – Caso II

x−μ0
t= → t n −1t → t 9
s/√n
4. Establecimiento de los criterios de decisión:

1-=0.95

=0.025 =0.025

-2.262 0 2.262

R.R. R.A. R.R.


R.A.: tk [-2262, 2.262]; se acepta Ho
R.R.: tk <-2.262 tk > 2.262; se acepta Ho

5. Realización de cálculos:

x−μ 0 11,277−12 , 000 −723


tK= → = =−0 .61
s/ √ n 3 , 772/ √10 1 ,192 . 81

6. Decisión:
Zk = - 0.61  R. A.; por lo tanto, se acepta Ho
Las condiciones del negocio son estables, las ventas por mes no varían.

214
6.2.2. Prueba de hipótesis para la proporción poblacional
A menudo surgen situaciones en las que el muestreo es de proporciones en
vez del valor medio de una población. En tal caso las observaciones son de
naturaleza cualitativa. Cuando analizamos datos cualitativos, nos
interesamos por verificar un supuesto acerca de la proporción de éxitos de la
población (P). Esto implica que se ha propuesto un valor P previamente a la
realización del estudio. El propósito del experimento es obtener evidencia
estadística que apoye o rechace esta hipótesis.
El procedimiento para la prueba de hipótesis para la proporción poblacional
es similar al señalado por la media poblacional.
Se presentan los siguientes casos, en muestras grandes (n  30).

CASO I:
 Población infinita, cualquiera que sea el tipo de muestreo.
 Población finita, si el muestreo es con reemplazamiento.
Pasos de una prueba de Hipótesis para la proporción poblacional es
similar

1. Formulación de hipótesis estadística:


a) Ho: P  P b) Ho: P  Po c) Ho: P = Po
H1: P < Po H 1: P > P o H 1: P  Po

2. Nivel de significancia:  = 0.05 ó  = 0.01

3. Estadística de prueba:

215
p−P0
Z= →n(0,1)
P 0 Q0
√ n

4. Establecimiento de los criterios de decisión:


 Prueba de cola izquierda

1-

-Z1-
R.R. R.A.

R.A.: ZK > - Z1- , se acepta Ho


R.R.: ZK < - Z1- , se rechaza Ho

 Prueba de cola derecha

1-

Z1-

R.A. R.R.
R.A.: Zk < Z1- , se acepta Ho
R.R.: Zk > Z1- , se acepta Ho

 Prueba de dos colas

216
1-
/2 /2
-Z1 - /2 Z1 - /2
R.A.:-Z1 - /2 < Zk < Z1 - /2 , se acepta Ho

R.R.:Zk < - Z1 - /2 ó Zk > Z1 - /2 , se rechaza Ho

R.R. R.A. R.R.

5. Realización de cálculos:
p−P0
Z=
P 0 Q0
√ n

6. Decisión
Si Zk  R.A. se acepta Ho
Si Zk  R.R. se rechaza Ho.

Caso II: Población finita, cuando el muestreo es sin reemplazamiento.


Se siguen todos los pasos del caso I, pero se incorpora el factor de
corrección para población finita, entonces la “Estadística de Prueba” será:
p−P 0
Z= →n ( 0,1)
P 0 Q0 N−n
n√ N−1 ( )
Ejemplo 118:
Una encuesta realizada en 1982 reveló que el 78% de quienes respondieron
consideraron que estaban mejor financieramente que sus padres. Una
encuesta mas reciente (Apoyo, abril 1997) encontró que 370 de las 500
personas quienes respondieron pensaron que sus fortunas financieras eran
mejores que la de sus padres. ¿Esto sugiere un descenso en la proporción
de personas que consideran que están financieramente más estables de lo
que estaban sus padres? Pruebe la hipótesis a un nivel de significancia del
1%.

Solución:
1. Formulación de hipótesis estadística:
Ho : P = 0.78
H1 : P < 0.78

217
2. Nivel de significancia:  = 0.01

3. Estadística de prueba:
p−P0
Z= →n(0,1)
P 0 Q0
√ n

4. Establecimiento de los criterios de decisión:

0.99

R.R.
R.A.
0.01
-2.326

Si Zk -2.326, se acepta Ho
Si Zk < -2.326, se rechaza Ho

5. Realización de cálculos:

370
p= =0 . 74
Donde 500

p−P0 0 . 74−0 .78 −0 . 04


Z= = = =−2
P 0 Q0 0 .78∗0 . 22 0 . 02
√ n √500

6. Decisión:
Zk = - 2  RA; por lo tanto se acepta Ho.
No habido un descenso en la proporción de personas que consideran
que estaban más estables de lo que estaban sus padres.

Ejemplo 119:
Los de un determinado programa de televisión pretender modificar si, por lo
menos, un cuarto de los que tienen televisor no ven el programa
regularmente. Una investigación encomendada a una empresa

218
especializada mostró que, de 400 familias entrevistadas, 80 ven el programa
regularmente. En base a estos datos ¿Cuál debe ser la decisión de los
productores?  = 5%

Solución:
1. Formulación de hipótesis estadística:
Ho: P  0.25
H1: P < 0.25

2. Nivel de significación:  = 0.05

3. Estadística de prueba:

p−P0
Z= →n(0,1)
P 0 Q0
√ n

4. Establecimiento de los criterios de decisión:

1- = 0.95
= 0,05
R.R. -1.645 R.A.

Si Zk - 1.645 aceptamos Ho
Si Zk < -1.645, rechazamos Ho

5. Realización de cálculos:

x 320
p= = =0 .8
n 400

p−P0 0 . 8−0 . 25
Z= = =27 . 5
P0 Q 0 0 .25×0 .75
√ √
n 400

219
X : personas que no ven el programa
X´ : personas que ven el programa

6. Decisión:
Zk = 27,5  R. A.

Por lo tanto, los productos deben cancelar el programa.

Ejemplo 120:
De una lista de 200 clientes de un Banco Comercial se seleccionó una
muestra aleatoria para obtener opinión acerca del servicio. En la muestra se
halló que 215 no tenían quejas del servicio, 25 tienen quejas y 10 no opinan
al respecto. Tradicionalmente el 5% tenían quejas del servicio, sin embargo,
se cree que ahora este porcentaje aumentó. ¿Cuál es la situación actual si
se quiere una probabilidad de 0.05 de cometer error tipo I?

Solución:
1. Formulación de hipótesis estadística:
Ho: P = 0.05
H1 : P > 0.05

2. Nivel de significancia:  = 0.01

3. Estadística de prueba:
p−P
Z= →n(0,1)
p.q N−n
√ √n
×
N−1

4. Establecimiento de los criterios de decisión:

1-=0.95

=0.05
1.645
R.A. R.R.

Si Zk 1.645, se acepta Ho
Si Zk > 1.645, se rechaza Ho

220
5. Realización de cálculos:
x 25
p= = =0. 10
Donde n 250
X : el cliente tiene quejas
X´ : el cliente no tiene quejas
n : 250
Luego:
p−P
Z K=
P . q N −n
√ √ n
×
N −1

0. 10−0 .05
Z K= =2 .78
0 . 10×0 . 90 2000−250
√250
×
2000−1 √
6. Decisión:
Zk = 2.78 > 1.645  RR; por lo tanto aceptamos Ho. El porcentaje de
quejas ha aumentado.

6.2.3. Prueba de Hipótesis para la Diferencia de Medias Poblacionales


Se presenta los siguientes casos:

CASO I: Uso de la Estadística Z


i) Muestras grandes (n1  30, n2  30), varianzas poblacionales
σ 2 y σ 2)
conocidas ( 1 2 y poblaciones normales o no.
ii) Muestras grandes (n1  30, n2  30), varianzas poblacionales
2 σ =σ
2 2 2 ( σ ≃s y σ ≃s )
desconocidas pero iguales 1 2 22 1 1 2 2 y
poblaciones normales o no.
iii) Muestras pequeñas (n1 < 30, n2 < 30), varianzas poblacionales
conocidas y poblaciones normales.

1. Formulación de Hipótesis:
a) H0 = 1  2 b) H0 = 1  2 c) H0 = 1 = 2
H1 = 1 < 2 H1 = 1 > 2 H0 = 1  2

2. Nivel de significancia : 

221
3. Estadística de prueba:
 Para i y iii :
x 1 −x 2
Z= =n( 0,1 )
σ 2 σ 2

√ 1
+ 2
n1 n 2

 Para ii:
x −x
Z = 1 2 =n( 0,1)
s2 s2
√ 1
+ 2
n1 n2

4. Establecimiento de los criterios de decisión:


a. Prueba de cola izquierda:
R.A.: ZK  -Z1-, se acepta Ho.
R.R : ZK < -Z1- , se rechaza Ho.

b. Prueba de cola derecha:


R.A.: ZK  Z1-, se acepta Ho.
R.R : ZK > Z1-, se rechaza Ho.

c. Prueba bilateral:
R.A.: ZK [-Z1-/2, Z1-/2], se acepta Ho.
R.R.: ZK < -Z1-/2 o ZK > Z1-/2, se rechaza Ho.

5. Cálculos:
d. Para i y iii:

x 1−x 2
Z K=
σ σ

√ n1
12
+
n2
22

e. Para ii:

222
x1 −x 2
Z K=
s s

√ 12
n1
+
n2
22

6. Decisión:
Se acepta o se rechaza H0.

Nota: Si las poblaciones son finitas de tamaño N 1 y N2


respectivamente entonces:
x 1−x 2
Z=
σ 1 N 1 −n1 σ 22 N 2−n2
2
a ) o b)
n1 N 1−1 √ +
(
n2 N 2−1 ) ( )
x 1−x 2
Z=
s 12 N 1−n 1 s22 N 2 −n2
√ (
n1 N 1−1
+
) (
n2 N 2−1 )
Ejemplo 121:
En la Facultad de Ciencias Matemáticas de la U.N.M.S.M., se seleccionó
una muestra aleatoria de 20 estudiantes (grupo A) de una población de
estudiantes pertenecientes a familias en que ambos padres trabajan. Se
seleccionó también una muestra aleatoria. de 16 estudiantes (grupo B) entre
aquellos estudiantes que pertenecen a familias en que solamente el padre
trabaja. El análisis de rendimiento académico de los dos grupos dio los
siguientes resultados:

Grupo Promedio Muestral


A 14
B 17

La experiencia muestra que las poblaciones de puntajes para ambos grupos


están distribuidas en forma aproximadamente normal, con varianzas
σ 2=36 σ =20
A y B2 ¿Se puede concluir, con estos datos, que la media
de la población de la que se seleccionó el grupo A es inferior a la media
poblacional de la que se seleccionó el grupo B? Use  = 0.05

Solución: CASO I - i
1. Formulación de Hipótesis

223
H0: A = B
H1: A < B
2. Nivel de significancia:  = 0.05
3 estadística de prueba:
x A−x B
Z=
σ A 2 σ B 2  n(0,1)

4.
√ +
n A nB
Establecimiento de los criterios de decisión:
R.A.: Si Z K ∈ [ −1. 96 , 1 . 96 ] , se acepta H . o

R.R.: Si k Z <−1 .96


o
Z k >1. 96 , se rechaza H .
o

5. Cálculos:
Datos:
nA = 20, nB = 20,
x A =14 , x B =14
σ 2=36 σ 2=20
A , B

μ A −μ B =0

x A −x B 14−17
Z K= = =−1. 72
σ σ 36 20

√ nA
A2
+
nB
A2
√ +
20 16

6. Decisión:
ZK = -1.72  R.A. por lo tanto se acepta H 0, lo que quiere decir que en
la Facultad de Ciencias Matemáticas, los puntajes promedios generales
de rendimiento de los estudiantes que pertenecen a familias en que
ambos padres trabajan son iguales a los de los estudiantes que
pertenecen a familias en que solamente trabaja el padre.

Ejemplo 122:
El director de presupuesto de una empresa deseaba determinar si había
alguna diferencia en las cuentas de gastos de representación de los
ejecutivos de dos departamentos de la Empresa. Se seleccionó una muestra
aleatoria de 30 cuentas de gastos del departamento 1 y 30 cuentas de
gastos del departamento 2. Con los siguientes resultados:

Departamento 1 Departamento 2

224
x 1=S /. 33 , 000 x 2=S /. 27 , 900
s 1 =S /.7 , 200 s 2 =S /. 9 ,000

Al nivel de significancia 0.01 ¿Es más alto el gasto de representación en el


departamento 1?

Solución: CASO I – ii
1. Formulación de Hipótesis:
H0 : 1 = 2
H0 : 1 > 2

2 Nivel de significancia :  = 0.01

3. Estadística de prueba:
x 1−x 2
Z=
s 2 s 2

√ 1
+ 2
n1 n2  n(0,1)

4. Establecimiento de los criterios de Decisión:


R.A. : Si Z K ≤2 . 326 , se acepta Ho .
R.R.: Si Z K >2 .326 , se rechaza H .
o

5. Cálculos:

Datos:

n1 = 30,
x 1=33 ,000 , s = 7,200
1

n2 = 30,
x 2=27 ,900 , s = 9,000
2

x 1 −x 2
Z K=
s s
√ 12
n1
+
22
n2

33000−27900
Z K= =2. 42
(7200 )2 (9000 )2
√ 30
+
30

6. Decisión:

225
ZK = 2.42  R.R. por lo tanto se rechaza H0 los gastos de
representación del departamento 1 son más altos que los gastos de
representación del departamento 2.

CASO II: Uso de la Estadística t:


i) Muestras pequeñas (n1 < 30 y n2 < 30), varianzas poblacionales

desconocidas pero iguales


σ 1 =σ 2 (σ 2≃s
1 1
2
y
σ 2≃s
2 22 ) y

población es normal.
Se siguen los mismos pasos que el Caso I, pero la Estadística de Prueba a
usar es:
x1 −x 2
t= → t n +n −2
( n1 −1 ) s 2 +( n 2−1 ) s 2 1 2

√ 1
n1 +n 2−2
2 1 1
+
n1 n2 ( )
Además el establecimiento de los criterios de decisión estará dado por:

f. Prueba de cola izquierda es:


t ≥−t 1−α , n +n −2
R.A. : k 1 2 , se acepta H0 .
t k <−t 1−α , n
R.R. : 1 +n2−2 , se rechaza Ho .

g. Prueba de cola derecha es:


t k≤t 1−α , n
R.A. : 1 +n2 −2 , se acepta Ho .
t k >t 1−α , n
R.R. : 1 +n2−2 , se rechaza Ho .

h. Prueba de dos colas :


t ∈[ t 1−α / 2 , n +n −2 ]
R.A. : k 1 2 , se acepta Ho .
t k <−t 1−α / 2 , n +n −2 t k >t 1−α / 2 , n +n −2
R.R. : 1 2 o 1 2 , se rechaza Ho.

ii) Muestras pequeñas (n1 < 30 y n2 < 30), varianzas poblacionales

desconocidas pero iguales 1 2 σ ≠σ


1
2
1
2
y
(σ ≃s
22 22 ) y
σ ≃s

poblaciones normales.
Se siguen los mismos pasos que el caso I, pero la estadística de prueba a
usar es:

226
x 1− x2
t=
s s

√ n1
12
+
n2
22

 tr

Donde:
2
s s

r=
[ 12
n1
2
+ 22
n2 ] 2
s s
[ ] [ ]12
n1
+
s2
ns
n1 −1 n2 −2
Dado que r rara vez es un entero, se redondea al entero más cercano.

Además el establecimiento de los criterios de decisión estará dada por:

 Prueba de cola izquierda es:


R.A. : t k ≥−t 1−α , r, se acepta Ho .
R.R. : t k <−t ¿1−α ,r , se rechaza Ho
¿

 Prueba de cola derecha es:


R.A. : t k ≤ t 1−α , r, se acepta Ho .
R.R. : t k >t 1−α , r, se rechaza Ho .

 Prueba de dos colas es:


R.A. : t k ∈[−t 1−α /2 , r , t 1−α /2 , r ], se acepta Ho .
R.R. : t k <−t 1−α /2 , r o t k >t 1−α /2 ,r , se rechaza Ho .

227

S-ar putea să vă placă și