Sunteți pe pagina 1din 10

Estadística Inferencial I

Unidad 5
Tema 5.2
Prueba para la diferencia entre dos proporciones
Inferencias estadísticas para dos proporciones poblacionales, p1- p2

A veces un investigador desea hacer inferencias sobre la diferencia entre dos


proporciones poblacionales. Este tipo de análisis tiene numerosas aplicaciones en
los negocios; por ejemplo, comparar la participación de mercado de un producto
para dos mercados diferentes, estudiar la diferencia entre la proporción de clientes
mujeres en dos regiones geográficas diferentes, o comparar la proporción de
productos defectuosos de un periodo a otro. Al hacer inferencias acerca de la
diferencia entre dos proporciones poblacionales, el estadístico que normalmente
se usa es la diferencia entre proporciones de la muestra 𝑝̂1 − 𝑝̂2 esta estadística
se calcula al tomar muestras aleatorias y determinar 𝑝̂ para cada muestra y una
característica dada para calcular la diferencia de estas proporciones de la
muestra.1

Cuando deseamos probar la hipótesis de que las proporciones de dos poblaciones


no son diferentes, las dos proporciones muéstrales se combinan como base para
determinar el error estándar de la diferencia entre proporciones. La estimación
combinada de la proporción de la población, con base en las proporciones
obtenidas de dos muestras independientes.2

Formula:

̅ 𝟏 + 𝒏𝟐 𝒑
𝒏𝟏 𝒑 ̅𝟐
̂=
𝒑
𝒏𝟏 + 𝒏𝟐

̂𝒒
𝒑 ̂ 𝒑
̂𝒒̂ 𝟏 𝟏
̂ 𝒑̅𝟏 −𝒑̅𝟐 = √ +
𝝈 ̂𝐩̅𝟏−𝐩̅𝟐 = √𝐩
𝐎 𝛔 ̂𝐪̂( + )
𝒏𝟏 𝒏𝟐 𝐧𝟏 𝐧𝟐

1
Estadistica en los negocios. Ken Black. 2005
2
Estadística Aplicada a la Economía. Leonard J. Kazmier. 2008
Prueba de diferencia de dos proporciones

DATOS:

̅𝟏 = Proporción de la muestra 1
𝒑

̅𝟐 = Proporción de la muestra 2
𝒑

𝒏𝟏 = Tamaño de la muestra 1

𝒏𝟐 = Tamaño de la muestra 2

𝒒𝟏 = Proporción muestral de fracaso 1 = 1 − 𝑝̅1

𝒒𝟐 = Proporción muestra de fracaso 2 = 1 − 𝑝̅2

Ejemplo 1:

Suponga que con fines de impuestos, el gobierno de una ciudad ha utilizado dos
métodos para registrar las propiedades. El primero requiere que el dueño de la
propiedad se presente para proporcionar la información; el segundo método
permite que el dueño de la propiedad envie por correo una forma fiscal con la
información requerida. El alcalde de la ciudad piensa que el método que requiere
la presencia de la persona produce menos errores que el otro. Autoriza un estudio
de 50 listas hechas con el primer método y de 75 listas tomadas de los datos
enviados de correo. De modo que 10 % de las formas llenadas ante el
representante fiscal tiene errores; 13% de las formas enviadas por correo tiene
errores. El alcalde desea probar, con un nivel de significancia del 0.15.

Datos:

Los resultados del muestreo pueden reunirse de la siguiente manera:

p̅1 = 0.10

q̅1 = 1 − 0.10 = 0.90

n1 = 50

p̅2 = 0.133
q̅ 2 = 0.867

n2 = 75

∝= 0.15 %

 Paso 1: Establecer hipótesis, tipo de prueba y nivel de significancia.

H0 : p1 = p2 H1 : p1 < p2 ∝= 0.15 %

 Paso 2: Escoja la distribución apropiada y encontrar el valor crítico.

Se utiliza la distribución normal estándar y la tabla 1 del apéndice para


determinar el valor critico de z para 0.35 del área bajo la curva (0.50-0.15).
Este valor, 1.04 es el límite de la regio de aceptación.

Paso 3: Calcule el error estándar y estandarice la estadística de la muestra.

̅ 𝟏 + 𝒏𝟐 𝒑
𝒏𝟏 𝒑 ̅𝟐
̂=
𝒑
𝒏𝟏 + 𝒏𝟐

(𝟓𝟎)(𝟎. 𝟏𝟎) + (𝟕𝟓)(𝟎. 𝟏𝟑𝟑) 𝟓 + 𝟏𝟎


̂=
𝒑 = = 𝟎. 𝟏𝟐
𝟓𝟎 + 𝟕𝟓 𝟏𝟐𝟓

̂𝒒
𝒑 ̂ 𝒑̂𝒒
̂
̂ 𝒑̅𝟏 −𝒑̅𝟐 = √
𝝈 +
𝒏 𝟏 𝒏𝟐
(𝟎.𝟏𝟐)(𝟎.𝟖𝟖) (𝟎.𝟏𝟐)(𝟎.𝟖𝟖) 𝟎.𝟏𝟎𝟓𝟔𝟎 𝟎.𝟏𝟎𝟓𝟔𝟎
̂ 𝒑̅𝟏 −𝒑̅𝟐 = √
𝝈 + = √ + = √𝟎. 𝟎𝟎𝟑𝟓𝟐 = 𝟎. 𝟎𝟓𝟗𝟑3
𝟓𝟎 𝟕𝟓 𝟓𝟎 𝟕𝟓

Paso 4: Bosqueje la distribución y señale el valor de la muestra y el valor crítico.

(𝒑 ̅𝟐 ) − (𝒑𝟏 − 𝒑𝟐 )𝑯𝟎
̅𝟏 − 𝒑
𝒛=
𝝈
̂ 𝒑̅𝟏 −𝒑̅𝟐

(𝟎. 𝟏𝟎 − 𝟎. 𝟏𝟑𝟑) − 𝟎
𝒛= = − 𝟎. 𝟓𝟓𝟔
𝟎. 𝟎𝟓𝟗𝟑

Paso 5: Interprete el resultado.

La diferencia entre las proporciones de las muestra se encuentra muy adentro de


la región de aceptación y el alcalde de la ciudad debe aceptar la hipótesis nula de
que no existe diferencia entre los métodos de recabar información. Así que el
método d de envió por correo es considerablemente menos caro que el otro, el
alcalde deberá pensar en aumentar su uso.

3
Estadística para la administración y economía. Levin .Rubin (2010)
Ejemplo 2:

Dos áreas diferentes de una gran ciudad del este de Estados Unidos se estudian
como sitios para abrir guarderías. De 200 casas encuestadas en una sección, la
proporción de ellas en las que la madre trabaja tiempo completo es 0.52 .En otra
sección, 40% de las 15º casas del estudio tiene madres que trabajan tiempo
completo. Para un nivel de significancia de 0.04 ¿Existe una diferencia significativa
en las proporciones de madres que trabajan de tiempo completo en las dos áreas
de la ciudad?

DATOS:

𝑛1 = 200

𝑝1 = 0.52

𝑛2 = 150

𝑝̅2 = 0.40

Paso 1: Establecer hipótesis, tipo de prueba y nivel de significancia

𝐻0 : 𝑝1 = 𝑝2 𝐻1 : 𝑝1 ≠ 𝑝2 𝛼 = 0.04

Paso 2: Escoger la distribución apropiada y encontrar el valor critico

Los límites de la región de aceptación son z= +


−2.05

Paso 3 Calcular el error estándar y estandarizar el estadístico de la muestra.

𝑛1 𝑝̅1 + 𝑛2 𝑝̅2 200(0.52) + 150(0.40)


𝑝̂ = = = 0.4686
𝑛1 + 𝑛2 200 + 150
̂𝒒
𝒑 ̂ 𝒑̂𝒒
̂
̂ 𝒑̅𝟏 −𝒑̅𝟐 = √
𝝈 +
𝒏 𝟏 𝒏𝟐

1 1 1 1
𝜎̂𝑝̅ 1−𝑝̅ 2 = √𝑝̂ 𝑞̂ ( + ) = √0.4686(0.5314)( + ) = 0.539
𝑛1 𝑛2 200 150

Paso 4 Bosquejar la distribución y señalar el valor de la muestra y el valor critico

Los límites de la región de aceptación son z= +


−2.05, o

𝑝̅1 − 𝑝2 = 0 − 𝑧𝜎̂𝑝1−𝑝2 = + +
−2.05(0.0539) = −0.1105

𝑝 −𝑝2 0.52−0.40
Como el valor observado 𝑧 = 𝜎̂ 1 = = 2.23 > 2.05 (𝑜 𝑝̅1 − 𝑝2 = 0.12 >
̅ 1−𝑝
𝑝 ̅2 0.0539
0.1105),

Paso 5 Interpretar el resultado.

Se rechaza 𝐻0. Las proporciones de madres que trabajan en las dos áreas difieren
de manera significativa.4

Ejemplo 3:

Una cadena de hoteles grandes intenta decidir si debe convertir más de sus
cuartos en habitaciones de no fumar. Él año pasado, en una muestra aleatoria de
400 huéspedes, 166 pidieron cuartos de no fumar. Este año 205 huéspedes en
una muestra de 380 prefirieron que no se fumara en su habitación.
¿Recomendaría que la cadena hotelera convirtiera más habitaciones en lugares
de no fumar? Apoye su recomendación con la hipótesis adecuada a un nivel de
significancia de 0.01.

4
Estadística para la administración y economía. Levin .Rubin (2010)
DATOS:

𝑛1 = 400

𝑝1 = 0.415

𝑛2 = 380

𝑝̅2 = 0.5395

Paso 1: Establecer hipótesis, tipo de prueba y nivel de significancia

𝐻0 : 𝑝1 = 𝑝2 𝐻1 : 𝑝1 ≠ 𝑝2 𝛼 = 0.01

Paso 2: Escoger la distribución apropiada y encontrar el valor critico

El límite inferior de la región de aceptación es z=-2.33

Paso 3 Calcular el error estándar y estandarizar el estadístico de la muestra.

𝑛1 𝑝̅1 + 𝑛2 𝑝̅2 400(0.415) + 380(0.5395)


𝑝̂ = = = 0.4757
𝑛1 + 𝑛2 400 + 380

1 1 1 1
𝜎̂𝑝̅ 1−𝑝̅ 2 = √𝑝̂ 𝑞̂ ( + ) = √0.4757(0.5243)( + ) = 0.0358
𝑛1 𝑛2 400 380

Paso 4 Bosquejar la distribución y señalar el valor de la muestra y el valor critico

El límite inferior de la región de aceptación es z=-2.33, o


𝑝̅1 − 𝑝2 = 0 − 𝑧𝜎̂𝑝1−𝑝2 = −2.33(0.0358) = −0.0834

Como el valor observado


𝑝 −𝑝2 0.415−0.5395
𝑧 = 𝜎̂ 1 = = −3.48 < −2.33 (𝑜 𝑝̅1 − 𝑝2 = −0.1245 < −0.0834),
̅ 1−𝑝
𝑝 ̅2 0.0358

Paso 5 Interpretar el resultado.

Se rechaza𝐻𝑂 .La cadena de hoteles debe convertir más cuartos en habitaciones


de no fumar puesto que hay un incremento significativo en la proporción de
huéspedes que piden estos cuartos respecto al año pasado.5

5
Estadística para la administración y economía. Levin .Rubin (2010)
Bibliografía:

S-ar putea să vă placă și