Documente Academic
Documente Profesional
Documente Cultură
A LA
INFERENCIA ESTADÍSTICA
- Estimación de Parámetros
- Contraste de Hipótesis
Estimación de Parámetros
El método de estimación de un parámetro puede ser puntual o por intervalo.
Estimación puntual de µ
En nuestro ejemplo, a partir de una muestra de n=50 envases de nectar. Daríamos como
estimación del contenido medio poblacional o teórico, X = 215 Kg.
Inconveniente(s):
Sin embargo
X
X N ( , X ) Z N (0,1)
X
Donde: X es el error típico o desviación estándar de la media muestral.
b) Si asumimos que X → N (µ, σ), σ desconocida
conocida
x Tamaño de población (N) demasiado grande o
n infinita.
N n conocida
x Tamaño de población (N) conocido o finita.
n N 1
S desconocida, entonces S
Sx Tamaño de población (N) demasiado grande o
n
infinita.
S N n desconocida, entonces S
Sx Tamaño de población (N) conocida o finita.
n N 1
Supongamos que de una población normal con media desconocida y varianza conocida
o desconocida 2 se extrae una muestra de tamaño n, entonces de la distribución de la
media muestral X se obtiene que, lleva asociado un error típico de dicho estadístico de lo
que ha de tenerse en cuenta para valorar la precisión de una estimación puntual.
Idea
X Z1 / 2 * X X Z1 / 2 * X
Tamaño de muestra
Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera que si
se estima por x , el error de estimación no sea mayor que un valor dado e. En efecto:
Ejercicio 2
Una empresa dedicada a la comercialización de semillas desea estimar la altura promedio
de un sorgo forrajero que ha desarrollado. Para ello toma una muestra de 50 plantas y se
calcula la media de la altura, la que resulta ser 130 cm. Se sabe por experiencias anteriores
que la desviación estándar es 22 cm. Construir los intervalos de confianza para µ con una
confianza del 95 % y 99 % respectivamente. Comparar ambos intervalos y concluir.
Ejercicio 3
Se quiere diseñar el tamaño de una muestra para estimar µ en una población normal con
desviación estándar igual a 13. a) ¿Cuál debería ser el tamaño mínimo de la muestra para
asegurar una amplitud de 9 unidades para el intervalo de confianza al 95%? b) ¿Qué sucede
si la confianza cambia al 99%?
Ejercicio 4
El espárrago es una planta perenne cuyo cultivo comercial puede tener una duración de 15
años y su implantación es costosa. Dada la extensión del sistema radicular, la profundidad
del suelo es fundamental, considerándose indispensable contar con un promedio mínimo de
80 cm de sustrato permeable. Se realizan 14 determinaciones de la profundidad del sustrato
permeable (en cm) en puntos tomados al azar en dos campos (A y B). Los resultados fueron
los siguientes:
A: 72 78 86 78 90 104 76 70 83 75 90 81 85 72
B: 78 82 68 68 74 81 85 73 75 89 100 91 82 75
A partir de los intervalos de confianza al 95% determinar si estos campos son aptos para el
cultivo.
La varianza como medida de dispersión es importante dado que nos ofrece una mejor visión
de dispersión de datos. Nuevamente consideramos que la población sigue una distribución
de probabilidad normal.
Otro campo del conocimiento donde la varianza se ocupa en gran medida es en control de
calidad; cuando un producto se elabora el área de control de calidad busca que los
productos esté dentro de ciertos límites de tolerancia, pero también que la variabilidad de
un producto sea lo menor posible.
El Intervalo de confianza para la varianza poblacional ( 2 ) es:
( n 1) s 2 ( n 1) s 2
2
12 / 2;n 1 2 / 2;n 1
Ejercicio
Un productor decide probar el funcionamiento de su máquina y para ello, luego de cosechar
una parcela, cuenta en 10 unidades de 1 m2 la cantidad de semillas que quedan en el suelo.
Las normas técnicas indican que la desviación estándar del número de semillas caídas por
m2 no debería ser superior a 5. Los resultados, en semillas/m2, fueron:
77 73 82 82 79 81 78 76 76 75
a) Construir un intervalo de confianza para 2 con una confianza del 97,5%.
b) Concluir sobre el funcionamiento de la máquina.
Ejercicio
Una variable aleatoria X tiene media desconocida y desviación típica 25. Una muestra
aleatoria de 50 valores de X tiene como media ¯x = 112. Hallar el intervalo de confianza
del 90% para la media µ de X.
Ejercicio
Una muestra aleatoria de tamaño 10 de la variable poblacional normal X nos da el valor ¯x
= 124 para la media muestral y s2 = 21 para la varianza muestral. Hallar el intervalo de
confianza del 95% para la media µ de X.
Ejercicio
Una muestra aleatoria de 28 valores de una variable aleatoria normal X nos da una
desviación típica muestral s = 6. Hallar el intervalo de confianza del 98% para la desviación
típica σ de X.
Ejercicio
El peso de las sandias de una plantación sigue una distribución normal de media
desconocida y desviación típica 750 g. Hallar el número mínimo de sandias que se han de
elegir para estimar, al 95% de confianza, el peso medio con un error menor que 300 g.
Ejercicio
La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribución
normal X. Se ha observado una muestra de nueve plantas con los siguientes resultados:
0.7 0.8 0.6 0.95 0.65 1 0.9 0.2 0.55
Si aceptamos como valor de σ el valor calculado de la cuasi-desviación típica muestral sˆ,
¿cuál sería el tamaño mínimo de la muestra que habría de ser considerada para que el
intervalo de confianza al 95% para el nivel medio de azufre tenga una longitud inferior a
0.1?
Ejercicio
Se extrajo una muestra aleatoria de 16 plantas para estimar la varianza en la concentración
de cobre en las plantas halladas en el Río Tinto. Se quemaron las plantas, se analizaron sus
cenizas y se obtuvieron los siguientes datos para la concentración de cobre X (medida en
partes por millón): 5, 3, 34, 18, 27, 14, 8, 50, 38, 43, 35, 20, 70, 25, 60, l9. Suponiendo que
X está normalmente distribuida:
a) Calcular el intervalo de confianza al 90% de la desviación típica poblacional.
b) Si el valor máximo obtenido para la estimación de la desviación típica es 32.9, ¿a qué
nivel de confianza se habría calculado el intervalo?
x
y la proporción de éxito en la muestra es pˆ
n
Luego se cumple:
a) pˆ E ( pˆ ) p
p(1 p)
b) p2ˆ V ( pˆ )
n
c) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:
pˆ p
z N (0,1)
pq
n
p y q conocidos
pq
p̂ Tamaño de población (N) demasiado grande o
n infinita.
p y q conocidos
pq N n
pˆ Tamaño de población (N) conocido o finita.
n N 1
ˆˆ
pq p y q desconocidos, entonces p pˆ y q qˆ
S pˆ Tamaño de población (N) demasiado grande o
n infinita.
ˆ ˆ N n
pq p y q desconocidos, entonces p pˆ y q qˆ
S pˆ Tamaño de población (N) conocida o finita.
n N 1
ˆ Z1 / 2 * pˆ p p
p ˆ Z1 / 2 * pˆ
Donde:
x
pˆ
n
qˆ 1 pˆ
Ejercicio
En una granja avícola se ha tomado una muestra aleatoria de 200 polluelos de pato, entre
los cuales se han encontrado 120 hembras. Hallar un intervalo de confianza, con un nivel
del 98% para la proporción de hembras entre estos polluelos.
Ejercicio
En una cierta región se llevó a cabo una reforestación con plantas de vivero. Una grave
sequía durante la siguiente estación mató a muchas de estas plantas. Se seleccionó
aleatoriamente una muestra de 1000 de plantas, resultando estar muertas 300 de ellas.
Obtener un intervalo para la proporción de plantas muertas al 90% y al 95% de confianza.
Tamaño de muestra
Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera que si p
se estima por p̂ , el error de estimación no sea mayor que un valor dado e. En efecto:
Tamaño de población (N) demasiado
grande o infinita.
Si p y q son desconocidas, se estima por p̂
Z12 / 2 * pq
n y q̂ hallados a partir de una muestra
e2 piloto.
En últimos de los casos si no se tiene
ninguna información de p y q se asume el
máximo riesgo de p = 0,5 y q = 0,5.
Tamaño de población (N) conocida o finita
Si p y q son desconocidas, se estima por p̂
Z12 / 2 * pq * N y q̂ hallados a partir de una muestra
n 2 piloto.
Z1 / 2 * pq e2 ( N 1) En últimos de los casos si no se tiene
ninguna información de p y q se asume el
máximo riesgo de p = 0,5 y q = 0,5.
Ejercicio
En una gran zona ganadera se desea estimar la proporción de ovejas que sufren una cierta
enfermedad degenerativa. Calcular el tamaño muestral necesario para estimar esta
proporción con un error menor que 0.03 a un nivel de confianza del 95% sabiendo que, en
una pequeña muestra preliminar, se seleccionaron treinta ovejas, de las cuales dos
resultaron padecer la enfermedad.
Ejercicio
Un productor de semillas desea saber con un error de estimación del 1% el porcentaje de
semillas que germinan. ¿Qué tamaño de muestra debe tomarse al nivel de confianza del
95%?
Ejercicio
Se toma una muestra de 20 espárragos, de los que 15 superan los 25 mm de grosor. a)
Hallar un intervalo de confianza al 99% para la proporción de espárragos de la plantación
que superan los 25 mm de grosor. b) Hallar el número de espárragos que se deberían medir
para estimar dicha proporción con un error menor del 0.05, al mismo nivel de confianza.
X 1 X 2 Z1 / 2 * X1 X 2 1 2 X 1 X 2 Z1 / 2 * X1 X 2
12 22
Donde: X1 X 2
n1 n2
S X1 X 2
n1 1 * s12 n2 1 * s22 1 1
n1 n2 2 n1 n2
Donde:
2
S12 S22
n
n2
2
1
2 2 Es el grado de libertad, que toma un valor numérico
S1 S2
2 2
n n
1
2
n1 1 n2 1
redondeado entero.
s12 s22
S X1 X 2
n1 n2
0, 05
Estadístico de prueba
máx ( s12 , s22 )
F
mín( s12 , s22 )
Semana 1:
Calculo de la media
10
x i
93 86 90 ... 96
X1 11
91,50 X 1 91,50
n 8
Calculo de la varianza
n
(X i X )2
93 91,50
2
86 91,50 ... 96 91,50
2 2
S
2 i 1
S12 9,143
n 1 8 1
1
Semana 2:
Calculo de la media
10
x i
93 87 97 ... 93
X2 11
89,88 X 2 89,88
n 8
Calculo de la varianza
n
(X i X )2
93 89,88
2
87 89,88 ... 93 89,88
2 2
S2 2 i 1
S2 2 17,839
n 1 8 1
s22 17,839
Fc 2
1, 951
s1 9,143
Regiones críticas
0,200 4,99
ZR/-------------------Zona------------------/--------Zona---------
Aceptación Rechazo
La zona de aceptación para un nivel de significación del 5% está delimitada por 0,200 y
4,990, correspondientes a las probabilidades /2 y (1 - /2) respectivamente.
Decisión
Como Fc = 1,951 se ubica en la zona de aceptación cuyo intervalo es (0,200; 4,99) se
acepta H 0 : 12= 22
Luego se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el
cumplimiento del supuesto de homogeneidad de varianzas
S X1 X 2
8 1 *9,143 8 1 *17,839 1 1
882 8 8
S X1 X 2 = 1,8365
Ejercicio
Un agricultor posee dos plantaciones de olivos y prueba en una de ellas un abono que
supuestamente mejora la producción de aceitunas. Meses después toma una muestra de
´arboles de cada plantación y anota los kilos de aceitunas producidos por cada ´árbol,
obteniendo los siguientes resultados:
Parcela 1: 17 16 21 14 18 24 16 14 21 23 13 18
Parcela 2: 18 14 19 11 23 21 10 13 19 24 15 20
Hallar un intervalo de confianza al 99% para la diferencia de las medias de producción,
suponiendo igualdad de varianzas.
Ejercicio
Para comparar los pesos medios en gramos de animales de un año engordados con 2 dietas
diferentes, se toman dos muestras de tamaño 82 y 112, respectivamente. Para la muestra de
animales engordados con la dieta tipo 1 se obtiene una media de 1860 g y una varianza de
200, y para la muestra de animales engordados con la dieta tipo 2, una media de 1800 g y
una varianza de 250. Suponiendo que los pesos de los animales engordados con ambas
dietas se distribuyen normalmente con varianzas iguales, construir un intervalo de
confianza a un nivel del 99% para la diferencia de pesos medios. ¿Podemos pensar que
existe diferencia significativa entre ambas dietas?
Luego se cumple:
a) pˆ1 pˆ 2 E ( pˆ1 pˆ 2 ) p1 p2
p1q1 p2 q2
b) p2ˆ ¨1 pˆ ¨2 V ( pˆ1 pˆ 2 )
n1 n2
c) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que:
( pˆ1 pˆ 2 ) ( p1 p2 )
Z N (0,1)
pˆ pˆ
1 2
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren
en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor
de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si
se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión
sobre la promulgación de la pena de muerte, determine la probabilidad de que el
porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Una encuesta del Boston College constó de 320 trabajadores de Michigan que
fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo
durante por lo menos dos años. Supóngase que tuviera que seleccionar otra
muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos
entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de
trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje
obtenido en la encuesta de Boston College, en 5% o más?
ˆ1qˆ1 p
p ˆ q
Dónde: pˆ pˆ 2 2
1 2
n1 n2
Solución:
Zona A
x1 : Número de personas que están a favor de las relaciones prematrimoniales
x1 = 124
n1 = 200
x 124
pˆ1 1 p̂1 = 0,62 qˆ1 1 pˆ1 = 0,38
n1 200
Zona B
x2 : Número de personas que están a favor de las relaciones prematrimoniales
x2 = 133
n2 = 266
x 133
pˆ 2 2 p̂2 = 0,50 qˆ2 1 pˆ 2 = 0,50
n2 266
1 = 0,90 = 0,10
ˆ1qˆ1 p
p ˆ q 0, 62*0, 38 0, 50*0, 50
pˆ pˆ 2 2
1 2
n1 n2 200 266
pˆ pˆ 0, 046
1 2