Sunteți pe pagina 1din 18

UNIVERSIDAD PRIVADA ANTENOR ORREGO

FACULTAD DE INGENIERIA
ESCUELA PROFESIONAL DE INGENIERIA INDUSTRIAL

INTEGRANTES:
Benites Vegas Javier
Castillo Quinde Claudia Sofía
Huertas Sánchez Luis
Lama Rosas Alejandro
Rubio Ancajima Alejandra
Suarez García Yaritza Jahaira

DOCENTE:
Segundo Castillo Asmat

TEMAS:
Intervalo de Confianza para la diferencia de medias poblacionales
dependientes e independientes. Intervalo de confianza para la diferencia de
proporciones.

ASIGNATURA:
Estadística Inferencial

NRC: 2153-2154

PIURA-2018
INTRODUCCION

En el siguiente trabajo realizado se tratará un tema estadístico, para hallar el intervalo


de confianza para la diferencia de medias muéstrales dependientes e independientes y
además el intervalo de confianza para la diferencia de proporciones.
El objetivo de la estimación mediante intervalos de confianza o estimación confidencial
es la determinación de dos valores θ*1 y θ*2, que verifiquen θ* 1 < θ*2 , tales que al
constituirse en intervalo[θ* 1 θ*2]; contengan, con una probabilidad prefijada, el verdadero
valor del parámetro que deseamos estimar.
De forma gráfica un intervalo de confianza se puede representar del siguiente modo:

P [θ*1 ≤ θ ≤ θ*2] = 1 – α, para algún α > 0,


entonces se puede decir que θ*1 y θ*2 determinan
un intervalo que tiene la probabilidad 1 – α de
contener al parámetro poblacional θ

Donde:
1 – α: Recibe el nombre de coeficiente de confianza o nivel de confianza. Es la
probabilidad de que el intervalo de confianza contenga el verdadero valor del
parámetro poblacional θ
α: Es un valor comprendido entre 0 y 1, 0 < α < 1, (usualmente próximo a 0), que
indica el riesgo de que el intervalo de confianza no contenga el valor del
parámetro poblacional a estimar, θ. Por lo que α recibe el nombre de riesgo del
error del intervalo, nivel del error del intervalo o nivel de significación del
intervalo.
θ*1 y θ*2: Son los valores que delimitan el intervalo de confianza y reciben el
nombre de límite superior y límite inferior del intervalo, respectivamente. La
diferencia entre el límite superior y el límite inferior de un intervalo, θ*2 – θ*1 se
conoce como amplitud del intervalo.

Para la construcción de un intervalo de confianza, lo deseable es maximizar el nivel de


confianza asociado al intervalo o equivalentemente minimizar el nivel de significación y
conseguir una amplitud lo más pequeña posible.
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA
DE MEDIAS POBLACIONALES Y PARA LA DIFERENCIA
DE PROPORCIONES.

OBJETIVOS ESPECIFICOS:
Calcular e interpretar intervalos de confianza para la diferencia de medias
dependientes e independientes.
Calcular e interpretar intervalos de confianza para la diferencia de
proporciones.
Aplicar lo aprendido teóricamente en ejercicios basados en nuestra
carrera profesional.

Para calcular el intervalo de confianza para la diferencia de medias poblacionales


se debe saber si las varianzas poblacionales son conocidas o desconocidas, y
en caso de que sean desconocidas, se debe probar si son iguales o diferentes.
Cada uno de estos tres casos se analizara por separado
1. INTERVALO DE CONFIANZA PARA LA DIFERENCIA
DE MEDIAS PARA MUESTRAS INDEPENDIENTES

1.1. INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE


MEDIAS EN POBLACIONALES CON AMBAS VARIANZAS
CONOCIDAS

 Sean X1...Xn1 y Y1…Yn2 dos muestras aleatorias independientes de tamaños


n1 y n2, extraídas de poblaciones normales N(𝜇1 ; 𝜎12 ) y N(𝜇2 ; 𝜎22 ) con
varianzas 𝜎12 y 𝜎22 conocidas y sean las estadísticas muestrales:
𝑛1
∑ 𝑋𝑖 ∑𝑛1 ̅ 2
𝑖=1(𝑋𝑖−𝑋1 )
𝑋̅1 = 𝑖=1 𝑆12 =
𝑛1 𝑛1 −1
𝑛2
∑ 𝑌𝑖 ∑𝑛1 ̅ 2
𝑖=1(𝑌𝑖−𝑋2 )
𝑋̅2 = 𝑖=1 𝑆22 =
𝑛2 𝑛2 −1

En muchas investigaciones, en el análisis inferencial estadístico nos interesa


efectuar comparaciones entre los valores de poblaciones con distribución
normal, para verificar, mediante la información muestral correspondiente, si
puede ocurrir una de las situaciones siguientes:

𝜇1 = 𝜇2 ; 𝜇1 > 𝜇2 ; 𝜇1 < 𝜇2
Para ello, es deseable construir intervalos de confianza para la diferencia de
medias 𝜇1 − 𝜇2

 Si las dos poblaciones no son normales, pero n 1 y n2 son tamaños de


muestras suficientemente grandes (𝑛1 ≥30 y 𝑛2 ≤30), entonces por el
̅1 𝑦 𝑋̅2 es aproximadamente
teorema del límite central, la estadística 𝑋
𝜎2 𝜎2
normal N(𝜇1 − 𝜇2 ; 1 + 2 )
𝑛1 𝑛2

Por consiguiente, en cualquiera de los dos casos, con las varianzas


poblacionales 𝜎12 y 𝜎22 es conocida, entonces:
 Dado el nivel de confianza 1 − 𝛼, en la distribución de Z se ubica el valor de
𝑍𝑜 =𝑍1−𝛼⁄2 de manera que P(−𝑍𝑜 ≤ 𝑍𝑜 )= 1- 𝛼, sustituyendo:

𝑋̅1 − 𝑋̅2 − ( 𝜇1 − 𝜇2 )
𝑍=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2

𝜎12 𝜎22
𝐸𝑇 = √ +
𝑛1 𝑛2
Operando adecuadamente, resulta:

𝑃[(𝑋̅1 − 𝑋̅2 ) − 𝑍𝑜 ∗ 𝐸𝑇 < 𝜇1 − 𝜇2 < (𝑋̅1 − 𝑋̅2 ) + 𝑍𝑜 ∗ 𝐸𝑇]

EJEMPLO N°1:

Una m.a de tamaño 36 se selecciona de una población N(𝜇1;9) donde 𝑋 ̅1 =70.


Otra muestra de tamaño 25 es seleccionada de otra población N(𝜇 2;16), dando
𝑋̅2 =60. Construir el intervalo de confianza para 𝜇1 − 𝜇2 con 96% de
confianza.
Solución: tenemos que

𝜎12 = 9 ; 𝑋̅1 = 70 ; n1= 36 ; 𝜎22 =16 ; 𝑋̅2 =60 ; n2=25


𝛼
Para 𝛾 = 1 − 𝛼 = 0.96 y = 0.02 en la Tabla I se encuentra que Z𝛼/2= 2.054
2

Por lo tanto, el intervalo de confianza del 96% para 𝜇1 − 𝜇2 es:

9 16 9 16
[(70 − 60) − 2.054 ∗ √ + ≤ 𝜇1 − 𝜇2 ≤ (70 − 60) + 2.054 ∗ √ + ]
36 25 36 25

8.06226 ≤ 𝜇1 − 𝜇2 ≤ 11.93774
 El intervalo de confianza resulto entre 8.06226 y 11.93774 con un 96%.
1.2. INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE
MEDIAS EN POBLACIONALES CON AMBAS VARIANZAS
DESCONOCIDAS

 Sean X1...Xn1 y Y1…Yn2 dos muestras aleatorias independientes de tamaños


n1 y n2, extraídas de poblaciones normales o aproximadamente normales
N(𝜇1 ; 𝜎12 ) y N(𝜇2 ; 𝜎22 )con varianzas 𝜎12 y 𝜎22 desconocidas y sean las
estadísticas muestrales:
𝑛1
∑ 𝑋𝑖 ∑𝑛1 ̅ 2
𝑖=1(𝑋𝑖−𝑋1 )
𝑋̅1 = 𝑖=1 𝑆12 =
𝑛1 𝑛1 −1
𝑛2 𝑛1
∑𝑖=1 𝑌𝑖 ∑𝑖=1(𝑌𝑖−𝑋̅2 )2
𝑋̅2 = 𝑆22 =
𝑛2 𝑛2 −1

En el proceso de construir intervalos de confianza para la diferencia de medias


𝜇 1 - 𝜇 2 en poblaciones normales con varianzas desconocidas, se presentan los
siguientes casos:

 CASO N°1: TAMAÑOS MUESTRALES PEQUEÑOS (𝒏𝟏 + 𝒏𝟐 ≤ 𝟑𝟎) Y


VARIANZAS POBLACIONALES DESCONOCIDAS PERO IGUALES

𝝈𝟐𝟏 = 𝝈𝟐𝟐 = 𝝈𝟐
A) Varianzas desconocidas iguales:
• Cuando las varianzas son desconocidas, se debe realizar previamente
una prueba estadística para verificar si éstas son iguales o diferentes.
• Para hacerlo debemos hacer uso de la distribución «T», bien sea
mediante el cálculo de la probabilidad de que la muestra tomada
provenga de dos poblaciones con varianzas iguales, o mediante el uso
de un intervalo de confianza para la relación de dos varianzas.
• El procedimiento a seguir para el cálculo del intervalo de confianza es :
a. El estadístico usado como estimador puntual de la diferencia de medias
μ1 − μ2 será 𝑋̅1 − 𝑋̅2 , que es un estimador suficiente.
b. La variable aleatoria asociada con el estimador será la variable definida
como (se usa t en caso de muestras pequeñas) :

𝑋̅1 − 𝑋̅2 − ( 𝜇1 − 𝜇2 )
𝑡=
2 2
√(𝑛1 − 1)𝑆1 + (𝑛2 − 1)𝑆2 ( 1 + 1 )
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

Cuya distribución es t de Student con (𝑛1 + 𝑛2 − 2) grados de libertad.


Fijando el coeficiente de confianza 𝛾 = 1 − 𝛼 ; (0< 𝛼 < 1), existe los valores
tabulados q1= −𝑡𝛼/2 =−𝑡𝛼/2 (𝑛1 + 𝑛2 − 2) y q2=𝑡𝛼/2 =𝑡𝛼/2 (𝑛1 + 𝑛2 − 2) que
verifican la expresión:
𝑃[𝑞1 < 𝑡 < 𝑞2 ]=𝑃[−𝑡𝛼/2 < 𝑡 < 𝑡𝛼/2 ]=1 − 𝛼

Donde 𝑡𝛼/2=𝑡𝛼/2 (𝑛1 + 𝑛2 − 2) ∶ valor de la abscisa de la distribución t de


Student con (𝑛1 + 𝑛2 − 2) grados de libertad que deja a su derecha un área
que representa una probabilidad igual a 𝛼/2:

Por lo tanto el intervalo de confianza del (1 − 𝛼)100% para 𝜇1 − 𝜇2 es:

2 1 1 2 1 1
̅2 ) − 𝑡𝛼/2 ∗ √𝑆𝑝 (
̅1 − 𝑋
𝑃 [(𝑋 + ) ≤ 𝜇1 − 𝜇2 ≤ (𝑋 ̅2 ) + 𝑡𝛼/2 ∗ √𝑆𝑝 ( + )]
̅1 − 𝑋
𝑛1 𝑛2 𝑛1 𝑛2

(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22


Donde 𝑆𝑝2 = es el estimador insesgado de la varianza
𝑛1 +𝑛2 −2
común 𝜎 2 desconocida.
EJEMPLO:
La siguiente tabla presenta los resultados de dos muestras aleatorias para
comparar el contenido de nicotina de dos marcas de cigarrillos.
Marca A Marca B
𝒏𝒊 10 8
̅𝒊
𝑿 3.1 2.7
𝑺𝒊 0.5 0.7

Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar


de poblaciones normales con varianzas desconocidas e iguales construya un
intervalo de confianza del 95% para la diferencia real de nicotina de las dos
marcas.

Solución: Como las varianzas son iguales, calculamos 𝑆𝑝2 que está dado por:
(9)0.52 +(7)0.72
𝑆𝑝2 = = 0.355 ⟹ 𝑆𝑝 = 0.596
16

El intervalo de confianza del 95% esta dado por (t(0.025,g.I.16)=2.21)

2 1 1 2 1 1
̅2 ) − 𝑡𝛼/2 ∗ √𝑆𝑝 (
̅1 − 𝑋
𝑃 [(𝑋 + ) ≤ 𝜇1 − 𝜇2 ≤ (𝑋 ̅2 ) + 𝑡𝛼/2 ∗ √𝑆𝑝 ( + )]
̅1 − 𝑋
𝑛1 𝑛2 𝑛1 𝑛2

2 1 1 2 1 1
[(3.1 − 2.7) − 2.21 ∗ √0.596 ( + ) ≤ 𝜇1 − 𝜇2 ≤ (3.1 − 2.7) + 2.21 ∗ √0.596 ( + )]
10 8 10 8

0.2 ≤ 𝜇1 − 𝜇2 ≤ 1.0

 CASO N°2: TAMAÑOS MUESTRALES PEQUEÑOS (𝒏𝟏 + 𝒏𝟐 ≤ 𝟑𝟎) Y


VARIANZAS POBLACIONALES DESCONOCIDAS PERO IGUALES

𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐

 El estadístico usado como estimador puntual de la diferencia de medias


𝜇1 − 𝜇2 será 𝑋̅1 − 𝑋̅2 , que es un estimador suficiente.
 La variable aleatoria asociada con el estimador será la variable t definida
como:
𝑋̅1 − 𝑋̅2 − ( 𝜇1 − 𝜇2 )
𝑡=
𝑆12 𝑆22
√( + )
𝑛1 𝑛2

Cuya distribución es t de student con V grados de libertad dado por:

(𝑆12 ⁄𝑛1 + 𝑆22 ⁄𝑛2 )2


𝑉=
[(𝑆12 ⁄𝑛1 )2 ⁄𝑛1 − 1] + [(𝑆22 ⁄𝑛2 )2⁄𝑛2 − 1]

Dado que v rara vez es un número entero, se redondea al entero más cercano.
Fijando el coeficiente de confianza 𝛾 = 1 − 𝛼 ; (0< 𝛼 < 1), existe los valores
tabulados q1= −𝑡𝛼/2 =−𝑡𝛼/2 (𝑉) y q2=𝑡𝛼/2=𝑡𝛼 (𝑉) que verifican la expresión:
2

𝑃[𝑞1 < 𝑡 < 𝑞2 ]=𝑃[−𝑡𝛼⁄2 (𝑉) < 𝑡 < 𝑡𝛼⁄2 (𝑉)]=1 − 𝛼


Por tanto, invirtiendo la cantidad pivotal, el intervalo de confianza de
(1 − 𝛼)100% para 𝜇1 − 𝜇2 es:

𝑆21 𝑆22 𝑆2 𝑆2
̅2 ) − 𝑡𝛼⁄2 (𝑉) ∗ √(
̅1 − 𝑋
𝑃 [(𝑋 + ) < 𝜇1 − 𝜇2 < (𝑋̅1 − 𝑋̅2 ) + 𝑡𝛼⁄2 (𝑉) ∗ √( 1 + 2 )]
𝑛1 𝑛2 𝑛1 𝑛2

NOTA: Si llevamos a cabo un cálculo de intervalo de confianza para diferencia


de medias, suponiendo que las varianzas no son iguales, en el dado caso que
sí lo fueran, perderíamos muy poco, y el intervalo obtenido sería un poco
conservador.
El caso de que supongamos que las varianzas son iguales, siendo que no lo
son, nos produce un error mayor que puede ser considerable por lo que una
sugerencia es usar varianzas diferentes como regla general.

 CASO N°3: TAMAÑOS MUESTRALES PEQUEÑOS (𝒏𝟏 + 𝒏𝟐 > 𝟑𝟎) Y


VARIANZAS POBLACIONALES DESCONOCIDAS

Consideramos como cantidad pivotal a la función

𝑋̅1 − 𝑋̅2 − ( 𝜇1 − 𝜇2 )
𝑍=
𝑆12 𝑆22
√( + )
𝑛1 𝑛2

Cuya distribución es N (0;1). Luego, fijando el coeficiente de confianza 𝛾 = 1 − 𝛼


existen los valores tabulados que verifican la expresión
𝑃[𝑞1 < 𝑍 < 𝑞2 ]=𝑃[−𝑍𝛼/2 < 𝑍 < 𝑍𝛼/2 ]=1 − 𝛼

Por consiguiente, invirtiendo la cantidad pivotal, el intervalo de confianza del


(1 − 𝛼)100% para 𝜇1 − 𝜇2 es :

2 2 2 2
𝑆 𝑆 𝑆 𝑆
̅2 ) − 𝑍𝛼/2 ∗ √( 1 + 2 ) ≤ 𝜇 − 𝜇 ≤ (𝑋
̅1 − 𝑋
𝑃 [(𝑋 ̅2 ) + 𝑍𝛼/2 ∗ √( 1 + 2 )]
̅1 − 𝑋
𝑛1 1
𝑛2 2 𝑛1 𝑛2
EJEMPLO:
Cierto metal se produce, por lo común, mediante un proceso estándar. Se
desarrolla un nuevo proceso en el que se añade una aleación a la producción
del metal. Los fabricantes se encuentran interesados en estimar la verdadera
diferencia entre las tensiones de ruptura de los metales producidos por los dos
procesos. Para cada metal se seleccionan 12 ejemplares y cada uno de éstos
se somete a una tensión hasta que se rompe.
La siguiente tabla muestras las tensiones de ruptura de los ejemplares, en
kilogramos por centímetro cuadrado:
Proceso 446 401 476 421 459 438 481 411 456 427 459 445
estándar
Proceso 462 448 435 465 429 472 453 459 427 468 452 447
nuevo

Si se supone que el muestreo se llevó a cabo sobre dos distribuciones


normales e independientes, obtener los intervalos de confianza estimados del
95% y 99% para la diferencia entre los dos procesos.
Interprete los resultados.
Solucion:
Calculamos los valores que necesitamos
n media S (𝑆12 ⁄𝑛1 + 𝑆22 ⁄𝑛2 )2
12 443.3 24.8 𝑉= = 18
[(𝑆12 ⁄𝑛1 )2 ⁄𝑛1 − 1] + [(𝑆22 ⁄𝑛2 )2 ⁄𝑛2 − 1]
12 451.4 14.9

95% de confianza
𝑡1 = 2.1 ; 𝑡2 = −2.1

2 2 2 2
𝑆 𝑆 𝑆 𝑆
̅2 ) − 𝑡𝛼⁄2 (𝑉) ∗ √( 1 + 2 ) ≤ 𝜇 − 𝜇 ≤ (𝑋
̅1 − 𝑋
[(𝑋 ̅2 ) + 𝑡𝛼⁄2 (𝑉) ∗ √( 1 + 2 )]
̅1 − 𝑋
𝑛1 𝑛2 1 2 𝑛1 𝑛2

14.92 24.82 14.92 24.82


[(451.4 − 443.3) − 2.1 ∗ √( + ) ≤ 𝜇1 − 𝜇2 ≤ (451.4 − 443.3) + 2.1 ∗ √( + )]
12 12 12 12

−25.65 ≤ 𝜇1 − 𝜇2 ≤ 9.49
Y para 99% de confianza
𝑡1 = 2.88 ; 𝑡2 = −2.88

14.92 24.82 14.92 24.82


[(451.4 − 443.3) − 2.88 ∗ √( + ) ≤ 𝜇1 − 𝜇2 ≤ (451.4 − 443.3) + 2.88 ∗ √( + )]
12 12 12 12

−32.16 ≤ 𝜇1 − 𝜇2 ≤ 15.99
2. INTERVALO DE CONFIANZA PARA LA DIFERENCIA
DE MEDIAS PARA MUESTRAS DEPENDIENTES

Sea (𝑋1, 𝑌1), (𝑋2, 𝑌2),…., (𝑋𝑛, 𝑌𝑛 ), una muestra aleatoria de n datos en parejas
escogida de la población (𝑋, 𝑌), donde 𝑋1, 𝑋2,…., 𝑋𝑛 e 𝑌1 , 𝑌2 , ……., 𝑌𝑛 , son
las muestras correlacionadas de X y de T respectivamente.
Se supone que X ~ 𝑁(𝜇1, 𝜎12 ) e Y 𝑁(𝜇2, 𝜎22 ) .

Podemos concebir las n diferencias: 𝐷1 = 𝑋1 - 𝑌1 , 𝐷2 = 𝑋2 - 𝑌2 , …..,


𝐷𝑛 = 𝑋𝑛 - 𝑌𝑛 como una muestra aleatoria seleccionada de una población
de diferencias D= X – Y cuya distribución es normal N(𝜇𝐷 , 𝜎12 ), donde la
media

𝑛
𝛴𝑖=1 𝑑𝑖
𝑑=
𝑛
2
𝜎𝐷
Si 𝜎𝐷2 es conocida, la estadística D tiene distribución normal 𝑁(𝜇𝐷 , ).
𝑛
Consecuentemente su distribución es:

𝐷 −(𝜇1 −𝜇2 )
Z= 𝜎𝐷
√𝑛

Ahora veamos al intervalo de confianza para estimar 𝜇1 − 𝜇2 , usando muestras


relacionadas.
Si d es el promedio de las diferencias muéstrales, obtenida de una muestra
aleatoria de tamaño n, entonces:

Es un intervalo de confianza del (1-a )100% de probabilidad de confianza, para


la diferencia.
𝜇1 − 𝜇2 . Las diferencias muéstrales deben seguir distribución normal de
probabilidad.

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE


PROPORCIONES POBLACIONALES
Sean X1...Xn1 una m.a extraída de poblaciones normales o aproximadamente
normales B(1; 𝑝1 ) y Y1…Yn2 una m.a extraída de poblaciones normales o
aproximadamente normales B(1; 𝑝2 ). Supongamos que ambas poblaciones
son independientes.
Los estimadores máximo verosímiles de los parámetros 𝑝1 𝑦 𝑝2 ; son
respectivamente :
𝑛1
∑ 𝑋𝑖 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 1
̂𝑝1 = 𝑋̅1 = 𝑖=1 =
𝑛1 𝑛1

𝑛1 𝑋
∑𝑖=1 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 2
̂𝑝2 = 𝑋̅2 =
𝑖
=
𝑛2 𝑛2

Sabemos que:
𝐸 = [ ̂𝑝1 − ̂
𝑝2] = 𝐸[ ̂𝑝1] − 𝐸[ ̂𝑝2] = 𝑝1 − 𝑝2
𝑝 𝑞 𝑝 𝑞 𝑝 (1−𝑝1 ) 𝑝 (1−𝑝2 )
𝑝2]=𝑉𝑎𝑟[ ̂𝑝1] + 𝑉𝑎𝑟[ ̂𝑝2]= 1 1 + 2 2= 1
𝑉𝑎𝑟[ ̂𝑝1 − ̂ + 2
𝑛1 𝑛2 𝑛1 𝑛2
Lo que facilita la construcción de la cantidad pivotal como la función
̂𝑝1 − ̂𝑝2 − ( 𝑝1 − 𝑝2 )
𝑍=
̂𝑝1(1 − 𝑝
̂1) ̂𝑝2(1 − 𝑝
̂2)
√( + )
𝑛1 𝑛2

Cuya distribución es N(0;1). En la expresión de la cantidad pivotal se ha


sustituido 𝑉𝑎𝑟[ ̂𝑝1 − ̂𝑝2] por su estimador.
Así, para el coeficiente de confianza establecido 𝛾 = 1 − 𝛼 existen los valores
tabulados 𝑞1 = −𝑍𝛼/2 y 𝑞2 = 𝑍𝛼/2

𝑃[𝑞1 < 𝑍 < 𝑞2 ]=𝑃[−𝑍𝛼/2 ≤ 𝑍 ≤ 𝑍𝛼/2 ]=1 − 𝛼

Por lo tanto, el intervalo de confianza aproximado del (1 − 𝛼)100% para la


diferencia de proporciones verdaderas 𝑝1 − 𝑝2 es

𝑝1(𝑞1) 𝑝2(𝑞2)
𝑝1 − 𝑝2 ≤ (̂𝑝1 − ̂𝑝2) + 𝑍𝛼/2 ∗ √( 𝑝1(𝑞1) 𝑝2(𝑞2)
̂ ̂ ̂ ̂
𝑝1
[(̂ −̂
𝑝2) − 𝑍𝛼 ∗ √( + )≤ + )]
2 𝑛1 𝑛2 𝑛
1 𝑛2

Ejemplo
En la práctica, la evaluación de la calidad de la educación, requiere disponer de
datos que permitan la emisión de juicios de valor basados en la evidencia, por
tanto esos datos deben ser válidos y confiables, además deben ser difundidos a
través de diversos medios. En tal sentido se realizó una encuesta entre docentes
que laboran en universidades estatales y privadas, a fin de conocer la opinión de
los docentes sobre calidad de los datos que recolectan las universidades y su
trascendencia el proceso de la acreditación académica.
Entre varias preguntas que comprende el cuestionario aplicado, una de ellas es:
“¿Los datos que recolecta su universidad garantiza la validez de las
evaluaciones?” Los resultados se muestran en la siguiente tabla:

Se solicita que estime mediante intervalos de confianza la diferencia de


proporciones poblaciones entre universidades estatales y privadas, con un nivel
de significancia del 5%, sobre aquellos docentes que opinan que los datos
recolectados en la universidad que laboran no garantiza la validez de las
evaluaciones.
Solución:
Universidad Estatal: 𝑛1 = 1650
Universidad Pública: 𝑛2 = 970
Por tanto se espera con un 95% de probabilidad de confianza, que la diferencia de
proporciones poblacionales esté comprendida entre 0,0369 (3,69%) y 0,1001 (10,01%).
Como observamos los límites son valores positivos y no cubre el valor cero, por tanto la
proporción poblacional de docentes que laboran en Universidades Estatales y que
responden que los datos recolectados por su Universidad no garantiza la validez de las
evaluaciones es mayor que de los docentes de Universidades Privadas.
Anexos

Ejercicios Propuestos Para la Diferencia de Medias

1. En estudias generales ciencias de la PUCP se han escogido 12 pares de


alumnos (cada par con remordimientos homogéneos) con la finalidad de
comparar dos métodos de enseñanza, resultando un diseño de muestras
correlacionadas. A un alumno de cada par le fue enseñando el curso de
cálculo I por el método tradicional (X) y al otro alumno por el método de
talleres (Y). Estos alumnos dieron una prueba final con los siguientes
resultados:

2. Un artículo publicado dio a conocer los resultados de un análisis del peso de


calcio en cemento estándar y en cemento contaminado con plomo. Los
niveles bajos de calcio indican que el mecanismo de hidratación del cemento
queda bloqueado y esto permite que el agua ataque varias partes de una
estructura de cemento. Al tomar diez muestras de cemento estándar, se
encontró que el peso promedio de calcio es de 90 con una desviación
estándar de 5; los resultados obtenidos con 15 muestras de cemento
contaminado con plomo fueron de 87 en promedio con una desviación
estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido
de manera normal. Encuéntrese un intervalo de confianza del 95% para la
diferencia entre medias de los dos tipos de cementos. Por otra parte,
supóngase que las dos poblaciones normales tienen la misma desviación
estándar.
3. Un consumidor de cierto producto quiere aplicar la técnica de estimación
estadística para decidir si compra la maca A o la marca B del producto. Para
esto va a estimar diferencia entre los tiempos de vida promedio de las dos
marcas del producto. Si dos muestras aleatorias independientes de 10
unidades de cada marca llevados a un laboratorio han dado las medias de
vida útil respectivas de 1230 horas y 1190 horas, ¿es acertada la decisión del
consumidor si decide adquirir la marca A?

a) Aplique el nivel de confianza del 95% y suponga que las dos poblaciones
tienen distribución normal con desviaciones estándar respectivas de 120 y 60
horas.

Ejercicios Propuestos Para La Diferencia De Proporciones

1. El nivel de colesterol es un factor de alto riesgo de enfermedades al


corazón. Para comparar el nivel de colesterol de adultos divididos en dos
grupos A de 25 a 40 años y B más de 40 años, se escogió una muestra
de 200 adultos de A y otra de 250 de B encontrando que 120 y 175
respectivamente tenían niveles de colesterol alto (más de 230 mg/dl).
Aplicando un intervalo de confianza del 955 para verdadera diferencia de
proporciones de colesterol alto,
a) ¿Se puede concluir que el riesgo de sufrir tal enfermedad es la misma
para los dos grupos?

2. En un estudio de daltonismo en hombres y en mujeres se seleccionaron


aleatoriamente y se examinaron 500 hombres y 2100 mujeres. Entre los
hombres, 45 tenían daltonismo. Entre las mujeres, 60 tenían daltonismo.
Construya el intervalo de confianza del 98% para la diferencia entre las
proporciones de daltonismo de hombres y mujeres. ¿Parece haber una
diferencia sustancial?

3. Se desea determinar si un cambio en el proceso de fabricación de cierto


tipo de piezas ha sido efectivo o no. Para esto se toman dos m.a (muestras
aleatorias), una antes y otra después del cambio. Los resultados se
presentan en la tabla. Construir un intervalo de confianza del 90% para
decidir si el cambio tuvo efecto positivo o no.
Conclusiones

 En la diferencia de medias hay que tener en cuenta la muestra si esta es


n>30 se utiliza la distribución normal “Z” y si es n<30 se utiliza la
distribución “t Student”

 Para las diferencias de muestras independientes hay que tener en cuenta


que hay varianzas desconocidas y conocidas, para el desarrollo de los
problemas.

 En la diferencia de muestras dependientes se agrupa por parejas porque


se sabe que son diferentes muestras una muestra X y una Y.

S-ar putea să vă placă și