Clase de Ic Unidad II Epiag

INTRODUCCIÓN
A LA
INFERENCIA ESTADÍSTICA
El proceso de Inferencia Estadística permite extraer conclusiones científicamente

válidas acerca de la población a partir de los resultados muéstrales (obtenidos a
través de la estadística descriptiva).
El propósito de la inferencia estadística es realizar:
- Estimación de Parámetros
- Contraste de Hipótesis
Estimación de Parámetros
El método de estimación de un parámetro puede ser puntual o por intervalo.
Estimación puntual de µ
En base al resultado de la muestra particular de tamaño n, una estimación puntual de µ

sería el valor numérico que toma X en dicha muestra.
En nuestro ejemplo, a partir de una muestra de n=50 envases de nectar. Daríamos como
estimación del contenido medio poblacional o teórico, X = 215 Kg.
Inconveniente(s):
 La estimación puntual depende de la muestra particular que se obtenga.

 Existe una incertidumbre total, acerca de la proximidad (lejanía) del valor puntual a la
media poblacional o teórica.
Sin embargo
Conocemos la distribución de la medias muéstrales bajo ciertas condiciones sobre la

población de partida.
DISTRIBUCIÓN DE LA MEDIA MUESTRAL
a) Si asumimos que X → N (µ, σ), σ → conocida
Las (infinitas) medias muéstrales obtenidas con muestras de tamaño n se distribuyen

según una distribución normal (campana de Gauss):
X 
X  N ( , X )  Z   N (0,1)
X
Donde:  X es el error típico o desviación estándar de la media muestral.
b) Si asumimos que X → N (µ, σ), σ desconocida
Las (infinitas) medias muéstrales obtenidas con muestras de tamaño n se distribuyen

según una distribución t-student con n-1 grados de libertad (gl)
X 
X  N ( , sX )  T   tn 1
sX
Donde: S X es el error típico o desviación estándar de la media muestral.
Nota: (Error estándar o Error típico de la media)
   conocida
x   Tamaño de población (N) demasiado grande o
n infinita.
 N n   conocida
x   Tamaño de población (N) conocido o finita.
n N 1
S   desconocida, entonces   S
Sx   Tamaño de población (N) demasiado grande o
n
infinita.
S N n   desconocida, entonces   S
Sx   Tamaño de población (N) conocida o finita.
n N 1
Estimación por Intervalo de confianza para µ
Supongamos que de una población normal con media desconocida  y varianza conocida
o desconocida  2 se extrae una muestra de tamaño n, entonces de la distribución de la
media muestral X se obtiene que, lleva asociado un error típico de dicho estadístico de lo
que ha de tenerse en cuenta para valorar la precisión de una estimación puntual.
Idea
Construir intervalos de confianza, basado X , que contenga “con alta probabilidad” el

parámetro µ.
Caso I: X → N (µ, σ), σ conocida
El Intervalo de confianza para µ es:
X  Z1 / 2 *  X    X  Z1 / 2 * X
Con un nivel de confianza del 1   .
Caso II: X → N (µ, σ), σ desconocida
El intervalo de confianza para µ es:
X  t1 / 2;n1 * S X    X  t1 / 2;n1 * S X
Tamaño de muestra
Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera que si
 se estima por x , el error de estimación no sea mayor que un valor dado e. En efecto:
 Tamaño de población (N) demasiado grande

Z 2  * 2 o infinita.
1  Si la desviación estándar (  ) es
n 2
desconocida, se estima por la desviación
e2 estándar muestral (S) hallado a partir de una
muestra piloto.
Z 2  * 2 * N  Tamaño de población (N) conocida o finita

1  Si la desviación estándar ( 
) es
n 2
Z 2  * 2  e 2 ( N  1) desconocida, se estima por la desviación

estándar muestral (S) hallado a partir de
1
2 una muestra piloto.
Ejemplo 1
Considerar la variable rendimiento de maíz, cuya distribución es normal con media μ y desviación
estándar σ. Para estimar el rendimiento promedio del maíz bajo el efecto de un herbicida, se toma
una muestra de tamaño 40 y se obtiene un promedio de 60 qq/ha. Se sabe por experiencias
anteriores que la varianza poblacional σ2 es 25 (qq/ha)2.
a) Construir los intervalos de confianza del 95% y 99% para μ.
b) ¿Cómo cambia el intervalo anterior (95%) si el tamaño de la muestra fuese 100 y se obtiene el
mismo promedio?
c) ¿Cómo se modifica el intervalo del 95% calculado en a) si la desviación estándar fuese de 7
qq/ha.?
Ejercicio 2
Una empresa dedicada a la comercialización de semillas desea estimar la altura promedio
de un sorgo forrajero que ha desarrollado. Para ello toma una muestra de 50 plantas y se
calcula la media de la altura, la que resulta ser 130 cm. Se sabe por experiencias anteriores
que la desviación estándar es 22 cm. Construir los intervalos de confianza para µ con una
confianza del 95 % y 99 % respectivamente. Comparar ambos intervalos y concluir.
Ejercicio 3
Se quiere diseñar el tamaño de una muestra para estimar µ en una población normal con
desviación estándar igual a 13. a) ¿Cuál debería ser el tamaño mínimo de la muestra para
asegurar una amplitud de 9 unidades para el intervalo de confianza al 95%? b) ¿Qué sucede
si la confianza cambia al 99%?
Ejercicio 4
El espárrago es una planta perenne cuyo cultivo comercial puede tener una duración de 15
años y su implantación es costosa. Dada la extensión del sistema radicular, la profundidad
del suelo es fundamental, considerándose indispensable contar con un promedio mínimo de
80 cm de sustrato permeable. Se realizan 14 determinaciones de la profundidad del sustrato
permeable (en cm) en puntos tomados al azar en dos campos (A y B). Los resultados fueron
los siguientes:
A: 72 78 86 78 90 104 76 70 83 75 90 81 85 72
B: 78 82 68 68 74 81 85 73 75 89 100 91 82 75
A partir de los intervalos de confianza al 95% determinar si estos campos son aptos para el
cultivo.
Intervalo de Confianza para la varianza
La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión
de dispersión de datos. Nuevamente consideramos que la población sigue una distribución
de probabilidad normal.
Otro campo del conocimiento donde la varianza se ocupa en gran medida es en control de
calidad; cuando un producto se elabora el área de control de calidad busca que los
productos esté dentro de ciertos límites de tolerancia, pero también que la variabilidad de
un producto sea lo menor posible.
El Intervalo de confianza para la varianza poblacional (  2 ) es:
( n  1) s 2 ( n  1) s 2
 2

12 / 2;n 1 2 / 2;n 1
Ejercicio
Un productor decide probar el funcionamiento de su máquina y para ello, luego de cosechar
una parcela, cuenta en 10 unidades de 1 m2 la cantidad de semillas que quedan en el suelo.
Las normas técnicas indican que la desviación estándar del número de semillas caídas por
m2 no debería ser superior a 5. Los resultados, en semillas/m2, fueron:
77 73 82 82 79 81 78 76 76 75
a) Construir un intervalo de confianza para 2 con una confianza del 97,5%.
b) Concluir sobre el funcionamiento de la máquina.
Ejercicio
Una variable aleatoria X tiene media desconocida y desviación típica 25. Una muestra
aleatoria de 50 valores de X tiene como media ¯x = 112. Hallar el intervalo de confianza
del 90% para la media µ de X.
Ejercicio
Una muestra aleatoria de tamaño 10 de la variable poblacional normal X nos da el valor ¯x
= 124 para la media muestral y s2 = 21 para la varianza muestral. Hallar el intervalo de
confianza del 95% para la media µ de X.
Ejercicio
Una muestra aleatoria de 28 valores de una variable aleatoria normal X nos da una
desviación típica muestral s = 6. Hallar el intervalo de confianza del 98% para la desviación
típica σ de X.
Ejercicio
El peso de las sandias de una plantación sigue una distribución normal de media
desconocida y desviación típica 750 g. Hallar el número mínimo de sandias que se han de
elegir para estimar, al 95% de confianza, el peso medio con un error menor que 300 g.
Ejercicio
La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribución
normal X. Se ha observado una muestra de nueve plantas con los siguientes resultados:
0.7 0.8 0.6 0.95 0.65 1 0.9 0.2 0.55
Si aceptamos como valor de σ el valor calculado de la cuasi-desviación típica muestral sˆ,
¿cuál sería el tamaño mínimo de la muestra que habría de ser considerada para que el
intervalo de confianza al 95% para el nivel medio de azufre tenga una longitud inferior a
0.1?
Ejercicio
Se extrajo una muestra aleatoria de 16 plantas para estimar la varianza en la concentración
de cobre en las plantas halladas en el Río Tinto. Se quemaron las plantas, se analizaron sus
cenizas y se obtuvieron los siguientes datos para la concentración de cobre X (medida en
partes por millón): 5, 3, 34, 18, 27, 14, 8, 50, 38, 43, 35, 20, 70, 25, 60, l9. Suponiendo que
X está normalmente distribuida:
a) Calcular el intervalo de confianza al 90% de la desviación típica poblacional.
b) Si el valor máximo obtenido para la estimación de la desviación típica es 32.9, ¿a qué
nivel de confianza se habría calculado el intervalo?
Distribución de la proporción muestral

Vamos a considerar que tenemos una población de modo que en cada una de ellas
estudiamos una v.a. dicotómica (Bernoulli) de parámetro respectivo p . De la población
vamos a extraer una muestra de tamaño n .
Entonces,
n
X   xi  B  n, p 
i 1
x
y la proporción de éxito en la muestra es pˆ 
n
Luego se cumple:
a)  pˆ  E ( pˆ )  p
p(1  p)
b)  p2ˆ  V ( pˆ ) 
n
c) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:
pˆ  p
z  N (0,1)
pq
n
Nota: (Error estándar o Error típico de la proporción muestral)
p y q conocidos
pq
 p̂  Tamaño de población (N) demasiado grande o
n infinita.
p y q conocidos
pq  N  n 
 pˆ    Tamaño de población (N) conocido o finita.
n  N 1 
ˆˆ
pq p y q desconocidos, entonces p  pˆ y q  qˆ
S pˆ  Tamaño de población (N) demasiado grande o
n infinita.
ˆ ˆ  N n
pq p y q desconocidos, entonces p  pˆ y q  qˆ
S pˆ    Tamaño de población (N) conocida o finita.
n  N 1 
Intervalo de Confianza para una Proporción

En este caso, interesa construir un intervalo de confianza para una proporción o un
porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensión,
fumadoras, etc.)
Donde, p es el porcentaje de personas u objetos con la característica de interés en la

población (o sea, es el parámetro de interés) y p̂ es su estimador puntual muestral.
Luego, procediendo en forma análoga al caso de la media, podemos construir un intervalo

de confianza para la proporción poblacional p, con una confianza de 1   .
ˆ  Z1 / 2 *  pˆ  p  p
p ˆ  Z1 / 2 *  pˆ
Donde:
x
pˆ 
n
qˆ  1  pˆ
Ejemplo 1: Una compañía que fabrica pastelillo desea estimar la proporción de

consumidores que prefieran su marca. Los agentes de la compañía observan a 450
compradores, del número total observado 300 compraron los pastelillos. Calcule un
intervalo de confianza del 95% para la venta de la proporción de compradores que prefieren
la marca de esta compañía.
Solución:
x: Número de consumidores que prefieren los pastelillos.
n = 450 tamaño de muestra grande
x = 300 son los que prefieren los pastelillos en la muestra
x 300
pˆ    0, 67 Es la proporción puntual muestral que prefieren los pastelillos
n 450
qˆ  1  pˆ  1  0, 67  0,33 Es la proporción puntual muestral de los que no prefieren los
pastelillos.
Coeficiente de confianza 1   = 0,95   = 0,05
Z1 / 2  Z 0,975 = 1,96
ˆˆ
pq 0,67*0,33
 pˆ    0,022
n 450
Reemplazando en el intervalo de confianza se tiene:

ˆ  Z1 / 2 *  pˆ  p  p
p ˆ  Z1 / 2 *  pˆ
0,67 – 1,96 * 0,022  p  0,67 + 1,96 * 0,022

0,63  p  0,71
Interpretación: La proporción de consumidores que prefieren la marca de la compañía

por parte de los consumidores se estima entre 0,63 a 0,71, con una confianza del 95%.
Ejercicio
En una granja avícola se ha tomado una muestra aleatoria de 200 polluelos de pato, entre
los cuales se han encontrado 120 hembras. Hallar un intervalo de confianza, con un nivel
del 98% para la proporción de hembras entre estos polluelos.
Ejercicio
En una cierta región se llevó a cabo una reforestación con plantas de vivero. Una grave
sequía durante la siguiente estación mató a muchas de estas plantas. Se seleccionó
aleatoriamente una muestra de 1000 de plantas, resultando estar muertas 300 de ellas.
Obtener un intervalo para la proporción de plantas muertas al 90% y al 95% de confianza.
Tamaño de muestra
Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera que si p
se estima por p̂ , el error de estimación no sea mayor que un valor dado e. En efecto:
 Tamaño de población (N) demasiado
grande o infinita.
 Si p y q son desconocidas, se estima por p̂
Z12 / 2 * pq
n y q̂ hallados a partir de una muestra
e2 piloto.
 En últimos de los casos si no se tiene
ninguna información de p y q se asume el
máximo riesgo de p = 0,5 y q = 0,5.
 Tamaño de población (N) conocida o finita
 Si p y q son desconocidas, se estima por p̂
Z12 / 2 * pq * N y q̂ hallados a partir de una muestra
n 2 piloto.
Z1 / 2 * pq  e2 ( N  1)  En últimos de los casos si no se tiene
ninguna información de p y q se asume el
máximo riesgo de p = 0,5 y q = 0,5.
Ejercicio
En una gran zona ganadera se desea estimar la proporción de ovejas que sufren una cierta
enfermedad degenerativa. Calcular el tamaño muestral necesario para estimar esta
proporción con un error menor que 0.03 a un nivel de confianza del 95% sabiendo que, en
una pequeña muestra preliminar, se seleccionaron treinta ovejas, de las cuales dos
resultaron padecer la enfermedad.
Ejercicio
Un productor de semillas desea saber con un error de estimación del 1% el porcentaje de
semillas que germinan. ¿Qué tamaño de muestra debe tomarse al nivel de confianza del
95%?
Ejercicio
Se toma una muestra de 20 espárragos, de los que 15 superan los 25 mm de grosor. a)
Hallar un intervalo de confianza al 99% para la proporción de espárragos de la plantación
que superan los 25 mm de grosor. b) Hallar el número de espárragos que se deberían medir
para estimar dicha proporción con un error menor del 0.05, al mismo nivel de confianza.
Intervalo de Confianza para la diferencia de medias ( 1  2 )

Supongamos que se tiene dos poblaciones distribuidas normalmente con medias
desconocidas 1 y  2 , respectivamente. Se puede aplicar una prueba z o t de Student para
comparar las medias de dichas poblaciones basándonos en dos muestras independientes
tomadas de ellas. La primera muestra es de tamaño n1 , con media X 1 y la segunda muestra
es de tamaño n2 , tiene media X 2 . Donde las varianzas poblacionales pueden ser conocidas
(  12 y  22 ) o desconocidas (  12 ≈ s12 y  22 ≈ s22 ).
Caso I: Muestras independientes, Varianzas poblacionales conocidas
(  12 y  22 )
El intervalo de confianza es:
X 1  X 2   Z1 / 2 *  X1  X 2  1  2   X 1  X 2   Z1 / 2 *  X1  X 2
 12  22
Donde:  X1  X 2  
n1 n2
Caso IIA: Normal-Muestras independientes, Varianzas poblacionales

desconocidas pero iguales (  12   22 )
X 1  X 2   t1 / 2;v * S X1  X 2  1  2   X 1  X 2   t1 / 2;v * S X1  X 2
Donde: v  n1  n2  2 es el grado de libertad.
S X1  X 2 
 n1  1 * s12   n2  1 * s22  1 1 
  
n1  n2  2  n1 n2 
Caso IIB: Normal-Muestras independientes, Varianzas poblacionales

desconocidas y diferentes (  12   22 )
X 1  X 2   t1 / 2;v * S X1  X 2  1  2   X 1  X 2   t1 / 2;v * S X1  X 2
Donde:
2
 S12 S22 
 n 
n2 
  2
1
2 2 Es el grado de libertad, que toma un valor numérico
 S1   S2 
2 2
 n  n 
 1

2
n1  1 n2  1
redondeado entero.
s12 s22
S X1  X 2  
n1 n2
Ejemplo 1: En el departamento de control de calidad de una empresa, se quiere

determinar si ha habido un descenso significativo de la calidad de su producto entre
las producciones de dos semanas consecutivas a consecuencia de un incidente
ocurrido durante el fin de semana. Deciden tomar una muestra de la producción de
cada semana, si la calidad de cada artículo se mide en una escala de 100, obtienen
los resultados siguientes:
Semana 1: 93 86 90 90 94 91 92 96
Semana 2: 93 87 97 90 88 87 84 93
Construye un intervalo de confianza para la diferencia de medias al nivel de
95%.Interpreta los resultados obtenidos.
Solución:
Suponiendo normalidad las producciones de las dos semanas
Cada semana son muestras independientes
Varianzas poblacionales desconocidas (  12 ,  22 )
Ahora
¿Cómo saber si las varianzas son iguales o diferentes?
Se realiza la prueba de homogeneidad de varianzas, que consiste en lo siguiente:
Formular las hipótesis

: H 0 : 1   2
2 2
Hipótesis nula
: H1 :  1   2
2 2
Hipótesis alterna
Fijar nivel de significancia
  0, 05
Estadístico de prueba
máx ( s12 , s22 )
F 
mín( s12 , s22 )
Semana 1:
Calculo de la media
10
x i
93  86  90  ...  96
X1  11
  91,50  X 1  91,50
n 8
Calculo de la varianza
n
(X i  X )2
 93  91,50 
2
  86  91,50   ...   96  91,50 
2 2
S 
2 i 1
  S12  9,143
n 1 8 1
1
Semana 2:
Calculo de la media
10
x i
93  87  97  ...  93
X2  11
  89,88  X 2  89,88
n 8
Calculo de la varianza
n
(X i  X )2
 93  89,88
2
  87  89,88   ...   93  89,88
2 2
S2 2  i 1
  S2 2  17,839
n 1 8 1
Reemplazando en el estadístico de prueba
s22 17,839
Fc  2
  1, 951
s1 9,143
Regiones críticas
0,200 4,99
ZR/-------------------Zona------------------/--------Zona---------
Aceptación Rechazo
La zona de aceptación para un nivel de significación del 5% está delimitada por 0,200 y
4,990, correspondientes a las probabilidades /2 y (1 - /2) respectivamente.
Decisión
Como Fc = 1,951 se ubica en la zona de aceptación cuyo intervalo es (0,200; 4,99) se
acepta H 0 : 12= 22
Luego se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el
cumplimiento del supuesto de homogeneidad de varianzas
Entonces el intervalo de confianza para la diferencia de medias es el CASO

IIA:
X 1  X 2   t1 / 2;v * S X1  X 2  1  2   X 1  X 2   t1 / 2;v * S X1  X 2
Diferencia de medias muestrales : X 1  X 2 = 91,50 – 89,88 = 1,62

Coeficiente de confianza : 1   = 0,95   = 0,05
Grados de libertad : v  n1  n2  2 = 8 + 8 – 2 = 14
t1 / 2;n1  n2  2  t0,975;14 = 2,145
S X1  X 2 
8  1 *9,143  8  1 *17,839  1  1 
 
882 8 8
S X1  X 2 = 1,8365
Reemplazando en la formula del intervalo se tiene:
1,62 – 2,145*1,8365  1  2  1,62 + 2,145*1,8365

-2,319  1  2  5,559
Interpretación: La diferencia promedio de producciones de artículos en las dos semanas se
estima entre -2,319 a 5,559, con una confianza del 95%. Esto significa que la producción
promedio de artículos entre las dos semanas es igual.
Ejercicio
Un agricultor posee dos plantaciones de olivos y prueba en una de ellas un abono que
supuestamente mejora la producción de aceitunas. Meses después toma una muestra de
´arboles de cada plantación y anota los kilos de aceitunas producidos por cada ´árbol,
obteniendo los siguientes resultados:
Parcela 1: 17 16 21 14 18 24 16 14 21 23 13 18
Parcela 2: 18 14 19 11 23 21 10 13 19 24 15 20
Hallar un intervalo de confianza al 99% para la diferencia de las medias de producción,
suponiendo igualdad de varianzas.
Ejercicio
Para comparar los pesos medios en gramos de animales de un año engordados con 2 dietas
diferentes, se toman dos muestras de tamaño 82 y 112, respectivamente. Para la muestra de
animales engordados con la dieta tipo 1 se obtiene una media de 1860 g y una varianza de
200, y para la muestra de animales engordados con la dieta tipo 2, una media de 1800 g y
una varianza de 250. Suponiendo que los pesos de los animales engordados con ambas
dietas se distribuyen normalmente con varianzas iguales, construir un intervalo de
confianza a un nivel del 99% para la diferencia de pesos medios. ¿Podemos pensar que
existe diferencia significativa entre ambas dietas?
Distribución de la diferencia de proporciones muestrales

Vamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas
estudiamos una v.a. dicotómica (Bernoulli) de parámetros respectivos p1 y p2 . De cada
población vamos a extraer muestras de tamaño n1 y n2 .
Entonces
n1
x
X1   x1i  B  n1 , p1  pˆ1  1
i 1 n1
n2
x2
X 2   x2i  B  n2 , p2  pˆ 2 
i 1 n2
Luego se cumple:
a)  pˆ1  pˆ 2  E ( pˆ1  pˆ 2 )  p1  p2
p1q1 p2 q2
b)  p2ˆ ¨1  pˆ ¨2  V ( pˆ1  pˆ 2 )  
n1 n2
c) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:
( pˆ1  pˆ 2 )  ( p1  p2 )
Z  N (0,1)
 pˆ  pˆ
1 2
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren
en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor
de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si
se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión
sobre la promulgación de la pena de muerte, determine la probabilidad de que el
porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Una encuesta del Boston College constó de 320 trabajadores de Michigan que
fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo
durante por lo menos dos años. Supóngase que tuviera que seleccionar otra
muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos
entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de
trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje
obtenido en la encuesta de Boston College, en 5% o más?
Intervalo de Confianza para la diferencia de dos proporciones

Si las muestras son suficientemente grandes ocurre que una aproximación para un intervalo
de confianza al nivel 1   para la diferencia de proporciones de dos poblaciones es:
p1  p2   p ˆ 2   Z1 / 2 * pˆ1  pˆ 2
ˆ1  p
ˆ1qˆ1 p
p ˆ q
Dónde:  pˆ  pˆ   2 2
1 2
n1 n2
Ejemplo 1: En un estudio sobre las relaciones prematrimoniales se encontró en la zona A

que, de 200 personas, 124 estaban a favor y en la zona B, de 266 personas, 133 también lo
estaban. Estimar la diferencia de proporciones de ambas zonas al 90% de confianza
comentando el resultado.
Solución:
Zona A
x1 : Número de personas que están a favor de las relaciones prematrimoniales
x1 = 124
n1 = 200
x 124
pˆ1  1   p̂1 = 0,62 qˆ1  1  pˆ1 = 0,38
n1 200
Zona B
x2 : Número de personas que están a favor de las relaciones prematrimoniales
x2 = 133
n2 = 266
x 133
pˆ 2  2   p̂2 = 0,50 qˆ2  1  pˆ 2 = 0,50
n2 266
1   = 0,90   = 0,10
Z1 / 2  Z 0,95 = 1,645
ˆ1qˆ1 p
p ˆ q 0, 62*0, 38 0, 50*0, 50
 pˆ  pˆ   2 2  
1 2
n1 n2 200 266
 pˆ  pˆ  0, 046
1 2
Reemplazando en la formula se tiene:

p1  p2   p ˆ 2   Z1 / 2 * pˆ1  pˆ 2
ˆ1  p
(0,62 – 0,50) – 1,645 * 0,046  p1  p2  (0,62 – 0,50) + 1,645 * 0,046
0,044  p1  p2  0,196
Interpretación: La diferencia de proporciones de personas que están a favor de las

relaciones prematrimoniales en las dos zonas se estima entre 0,044 a 0,196, con una
confianza del 90%. Esto significa que la proporción de personas de la zona A son las que
están mayormente a favor de las relaciones prematrimoniales respecto a la zona B.

Clase de Ic Unidad II Epiag

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Clase de Ic Unidad II Epiag

Încărcat de

Drepturi de autor:

Formate disponibile

INTRODUCCIÓN

El proceso de Inferencia Estadística permite extraer conclusiones científicamente

El propósito de la inferencia estadística es realizar:

En base al resultado de la muestra particular de tamaño n, una estimación puntual de µ

 La estimación puntual depende de la muestra particular que se obtenga.

Conocemos la distribución de la medias muéstrales bajo ciertas condiciones sobre la

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

a) Si asumimos que X → N (µ, σ), σ → conocida

Las (infinitas) medias muéstrales obtenidas con muestras de tamaño n se distribuyen

Las (infinitas) medias muéstrales obtenidas con muestras de tamaño n se distribuyen

Nota: (Error estándar o Error típico de la media)

Estimación por Intervalo de confianza para µ

Construir intervalos de confianza, basado X , que contenga “con alta probabilidad” el

Caso I: X → N (µ, σ), σ conocida

El Intervalo de confianza para µ es:

Con un nivel de confianza del 1   .

Caso II: X → N (µ, σ), σ desconocida

El intervalo de confianza para µ es:

X  t1 / 2;n1 * S X    X  t1 / 2;n1 * S X

Con un nivel de confianza del 1   .

 Tamaño de población (N) demasiado grande

Z 2  * 2 * N  Tamaño de población (N) conocida o finita

Z 2  * 2  e 2 ( N  1) desconocida, se estima por la desviación

Intervalo de Confianza para la varianza

Con un nivel de confianza del 1   .

Distribución de la proporción muestral

Nota: (Error estándar o Error típico de la proporción muestral)

Intervalo de Confianza para una Proporción

Donde, p es el porcentaje de personas u objetos con la característica de interés en la

Luego, procediendo en forma análoga al caso de la media, podemos construir un intervalo

Ejemplo 1: Una compañía que fabrica pastelillo desea estimar la proporción de

Reemplazando en el intervalo de confianza se tiene:

0,67 – 1,96 * 0,022  p  0,67 + 1,96 * 0,022

Interpretación: La proporción de consumidores que prefieren la marca de la compañía

Intervalo de Confianza para la diferencia de medias ( 1  2 )

El intervalo de confianza es:

Caso IIA: Normal-Muestras independientes, Varianzas poblacionales

El intervalo de confianza es:

X 1  X 2   t1 / 2;v * S X1  X 2  1  2   X 1  X 2   t1 / 2;v * S X1  X 2

Donde: v  n1  n2  2 es el grado de libertad.

Caso IIB: Normal-Muestras independientes, Varianzas poblacionales

El intervalo de confianza es:

X 1  X 2   t1 / 2;v * S X1  X 2  1  2   X 1  X 2   t1 / 2;v * S X1  X 2

Ejemplo 1: En el departamento de control de calidad de una empresa, se quiere

¿Cómo saber si las varianzas son iguales o diferentes?

Se realiza la prueba de homogeneidad de varianzas, que consiste en lo siguiente:

Formular las hipótesis

Fijar nivel de significancia

Reemplazando en el estadístico de prueba

Entonces el intervalo de confianza para la diferencia de medias es el CASO

X 1  X 2   t1 / 2;v * S X1  X 2  1  2   X 1  X 2   t1 / 2;v * S X1  X 2

Diferencia de medias muestrales : X 1  X 2 = 91,50 – 89,88 = 1,62

Reemplazando en la formula del intervalo se tiene:

1,62 – 2,145*1,8365  1  2  1,62 + 2,145*1,8365

Distribución de la diferencia de proporciones muestrales

Intervalo de Confianza para la diferencia de dos proporciones

Ejemplo 1: En un estudio sobre las relaciones prematrimoniales se encontró en la zona A

Z1 / 2  Z 0,95 = 1,645

Reemplazando en la formula se tiene:

Interpretación: La diferencia de proporciones de personas que están a favor de las

S-ar putea să vă placă și

Z 2   2 N  Tamaño de población (N) conocida o finita

1,62 – 2,1451,8365  1  2  1,62 + 2,1451,8365