Sunteți pe pagina 1din 9

1

Programa para la inmersión a la Educación Superior - PIES

Departamento de Ciencias Básicas


Área: Estadı́stica
Guı́a # 10
Programas: Ingenierı́a de alimentos, Ingenierı́a de Automatización, Ingenierı́a Ambiental
y sanitaria, Ingenierı́a Eléctrica, Ingenierı́a Civil, Ingenierı́a Quı́mica, Administración de
Empresas, Contadurı́a Pública, Urbanismo, Biologı́a, Economı́a, Finanzas y comercio inter-
nacional, Negocios y Relaciones Internacionales, Trabajo Social, Optometrı́a, Veterinaria,
Zootecnia y Administración de Agronegocios.

Elaborado por: Edgar Palacios Segura

Fecha de elaboración: Abril 13 de 2018

Tema: Inferencia Sobre la Media

INTENCIONALIDAD

Habilidades que se pretenden desarrollar.


Construcción de un intervalo de confianza para la media.
Interpretación de intervalos de confianza para la media.
Elaborar una prueba de hipotesis para la media.
Determinar el tamaño de muestra para estimar la media.

DESARROLLO DEL CONCEPTO:

INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL


Al obtener una muestra aleatoria simple de tamaño n de una población con media desco-
nocida µ y desviación estándar conocida σ. Un intervalo de confianza (1 − α) para µ está
dado por:
σ
x̄ ± z α2 √
n
Donde zα/2 es el valor correspondiente a un área acumulada de (1 − α/2) de la distribución
normal estandarizada, es decir es una probabilidad de la cola superior de α/2. (Ver Gráfica)
2

Un nivel de confianza alto significa que nuestro método casi siempre da respuestas correctas.
Un error de estimación pequeño significa que la estimación del parámetro poblacional es
bastante precisa. El error de estimación es
σ
Error de estimación = z α2 √
n
TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA
El tamaño de muestra mı́nimo n para estimar la media poblacional con un nivel de confianza
(1 − α) y un error de estimación deseado e es
 z α σ 2
2
n=
e
PRUEBAS DE HIPÓTESIS (o PRUEBAS DE SIGNIFICANCIA) PARA LA
MEDIA
Para elaborar una prueba de hipótesis, se sigue los siguientes pasos:
1. Plantear las hipótesis.
2. Calcular el estadı́stico de contraste (estadı́stico de prueba).
3. Calcular el V alorP .
4. Conclusión.
PRUEBA Z PARA UNA MEDIA POBLACIONAL Para contrastar la hipótesis
H0 : µ = µ0 con base en una muestra aleatoria simple de tamaño n de una población con
media desconocida µ y desviación estándar σ conocida, se calcula el estadı́stico de prueba
x̄ − µ0
z= σ

n
En términos de una variable aleatoria normal estandarizada Z.
Tipos de pruebas de hipótesis: Dos colas, cola izquierda y cola derecha
3

Las colas en una distribución son las regiones extremas limitadas por los valores crı́ticos.
La determinación de los V alores P y de los valores crı́ticos se ve afectada si una región
crı́tica se encuentra en dos colas, en la cola derecha o en la cola izquierda. Por lo tanto, es
importante determinar de manera correcta si una prueba de hipótesis es de dos colas, de
cola izquierda o de cola derecha.
Para contrastar la hipótesis nula H0 se prueba con una de las siguientes hipótesis alternativas:

PRUEBAS CON UN NIVEL DE SIGNIFICACIÓN DADO


Para contrastar la hipótesis H0 : µ = µ0 con base en una muestra aleatoria simple de tamaño
n de una población con media desconocida µ y desviación estándar σ conocida, se calcula
el estadı́stico de prueba
x̄ − µ0
zc = σ

n
En términos de una variable aleatoria normal estandarizada Z.
Rechazar la hipótesis nula H0 a un nivel de significación α en contra de la alternativa de
una cola.
Ha : µ < µ0 Si zc < z
Ha : µ > µ0 Si zc > z
donde z es el valor crı́tico superior de α obtenido de la distribución normal estandarizada.
Rechazar la hipótesis nula H0 a un nivel de significación α en contra de la alternativa de
dos colas.
Ha : µ 6= µ0 Si zc < |z|
α
donde z es el valor crı́tico superior de obtenido de la distribución normal estandarizada.
2
ERRORES TIPO I Y ERRORES TIPO II
Se tiene dos tipos de errores cuando hacemos una prueba de hipótesis.
Si rechazamos la hipótesis nula H0 cuando la hipótesis nula es correcta, cometemos un error
de tipo I.
Si no rechazamos la hipótesis nula H0 cuando en realidad la hipótesis alterna es correcta,
cometemos un error de tipo II.
4

En la siguiente tabla se muestra cuatro situaciones posibles.


Cuando H0 es cierta, la decisión es correcta si no rechazamos la H0 o se comete un error de
tipo I si rechazamos la H0 .
Cuando Ha es cierta, la decisión es correcta si rechazamos la H0 o se comete un error de
tipo II si no rechazamos la H0 .

H0 Cierta Ha Cierta
Rechazar H0 Error tipo I Decisión Correcta
α
No Rechazar H0 Decisión Correcta Error de Tipo II
β

Cuando realizamos un experimento para evaluar un proceso en el cual no conocemos la des-


viación estándar de la población, no podemos aplicar la distribución normal para construir
un intervalo de confianza.
Distribución t de student
Dada una muestra aleatoria de n observaciones, de media x̄ y desviación estándar muestral
S, extraı́da de una población que sigue una distribución normal con media µ, la variable
aleatoria t sigue una distribución t de student con (n − 1) grados de libertad y viene dada
por

x̄ − µ
t= s

n

La forma de la distribución t de Student es bastante parecida a la de la distribución normal


estándar. Ambas distribuciones tienen una media de cero y las funciones de densidad de las
dos son simétricas en torno a su media.
La distribución t de Student es más variable que la distribución normal estándar es decir
tiene más área en las colas y es más achatada en el centro. Esto se debe a que la distribución
t interviene dos variables aleatorias, la media muestral y la desviación estándar muestral,
mientras que en la distribución normal estándar solo interviene la media muestral.
La forma de la distribución t depende del tamaño de la muestra n. Cuando n aumenta la
variabilidad de t disminuye porque la estimación s de σ se basa cada vez en más información.
Cuando n es inmensamente grande la distribución t de student y la distribución normal
estándar son idénticas. (Ver gráfica)
5

Al obtener una muestra aleatoria simple de tamaño n de una población con media descono-
cida µ y desviación estándar desconocida σ. Un intervalo de confianza (1 − α) para µ está
dado por:
S
x̄ ± tn−1, α2 √
n
Donde tn−1,α/2 es el valor correspondiente a un área acumulada de (1−α/2) de la distribución
t student, es decir es una probabilidad de la cola superior de α/2. con
S
error de estimación = tn−1;α/2 ∗ √
n

EJEMPLOS

Ejemplo 1.
Una muestra aleatoria simple de los pesos de las mujeres, obtenemos los siguientes estadı́sti-
cos muestrales: n = 40 y x̄ = 146,2 libras.Investigaciones de otras fuentes sugieren que la
población de pesos de mujeres tiene una desviación estándar dada por σ = 30,86 libras. a)
Calcule la mejor estimación puntual de la media del peso de todas las mujeres. b)
1. Calcule la mejor estimación puntual de la media del peso de todas las mujeres.
2. Calcule una estimación de un intervalo de confianza del 95 % del peso medio de todas
las mujeres.
Solución
1. La media muestral de 146.2 libras es la mejor estimación puntual del peso medio para
la población de todas las mujeres.
2. El nivel de confianza del 0.95 implica que α = 0,05, entonces zα/2 = 1,96. El margen
de error e se calcula primero de la siguiente manera.
σ 1,96 ∗ 30,86
e = z α2 √ = √ = 9,5636
n 40
. Con x̄ = 146,2, construimos el intervalo de confianza como
146,2 ± 9,5636
6

146,2 − 9,5636 < µ < 146,2 + 9,5636


136,6364 < µ < 155,7636
Significa que hay confianza de 95 % de que el peso medio de todas la mujeres se en-
cuentre entre entre 136.6364 y 155.7636 libras.
Ejemplo 2.
Suponga que queremos estimar la puntuación media del CI de la población de estudiantes de
estadı́stica. ¿Cuántos estudiantes de estadı́stica deben seleccionarse al azar para aplicarles
pruebas de CI, si queremos tener una confianza del 95 % de que la media muestral estará
dentro de 3 puntos de CI de la media poblacional?. Suponga que la desviación estandar es
σ = 15
Solución
Para un intervalo de confianza del 95 %, tenemos α = 0,05, de modo que zα/2 = 1,96. Puesto
que queremos que la media muestral esté dentro de tres puntos de CI de la media poblacional
µ, el margen de error e = 3. Asimismo, α = 15. Obtenemos:
 z α σ 2  1,96 ∗ 15 2
2
n= = = 96,04 ≈ 97
e 3
Ejemplo 3.
Se obtiene una muestra aleatoria simple de 40 velocidades (en mi/h) de automóviles que
viajaban en una sección de la carretera 405 en Los Ángeles. La muestra tiene una media de
68.4 mi/h y una desviación estándar de 5.7 mi/h (según datos de Sigalert). Utilice un nivel
de significancia de 0.05 para someter a prueba la afirmación de que la velocidad media de
todos los automóviles es mayor que la velocidad máxima permitida de 65 mi/h.
Solución
Paso 1. Planteamiento de las Hipótesis
Planteamos la hipótesis nula como la velocidad media máxima permitida de los automóviles
es de 65 mi/h. y la hipótesis alternativa que la velocidad media de los automóviles es mayor
de 65 mi/h.

H0 : µ = 65
Ha : µ > 65
Paso 2. estadistico de prueba
Los estadistico son: x̄ = 68,4 y s = 5,7
El estadistico de prueba es la distribución t student con n − 1 = 40 − 1 = 39 grados de
libertad, suponiendo que la población tiene una distribución normal.
x̄ − µ0 68,5 − 65
tc = s = = 3,773
√ 5,7

n 40
Paso 3. Valor P
El valorP para t = 3,7732 es el área situada a la derecha de 3.773 por debajo de la curva de
7

la distribución t con 9 grados de libertad. Con un programa estadı́stico como R o la tabla t


student, obtenemos el
V alorP = P (T > 3,773) = 0,00027
Como el Valor P es menor que α. se rechaza la hipótesis nula.
Paso 4. Conclusión
Existe suficiente evidencia muestral de que las velocidades de los automóviles en la carretera
405 de los Ángeles es mayor que 65 mi/h.con un nivel de significancia de 0.05
También podemos obtener la misma conclusión si en el paso 3. Usamos el método de nivel de
significación y no el método del Valor P. Calculamos el valor critico para una probabilidad
de α = 0,05 de copla superior. Es decir calculamos el valor de t tal que el área a la derecha
de t sea 0.05. Este valor lo obtenemos de la tabla t student t = 1,6848. y al compararlo con
el nivel de significancia α concluimos que rechazamos la hipótesis nula.

EJERCICIOS PROPUESTOS

1. ¿Qué valor crı́tico t de la tabla t student cumple cada una de las siguientes condiciones?
a) La distribución t student con 5 grados de libertad tiene una probabilidad 0,05 a la
derecha de t.
b) La distribución t student con 21 grados de libertad tiene una probabilidad 0,99 a
la izquierda de t.
2. El estadı́stico t de una muestra de n = 25 observaciones para contrastar la prueba de
dos colas de
H0 : µ = 64
Ha : µ 6= 64
tiene un valor del estadı́stico de prueba t = 1,12.
a) ¿Cuántos grados de libertad tiene t?
b) Sitúa dos valores crı́ticos de t de la tabla t student entre los que se encuentra
t=1.12. ¿Cuáles son las probabilidades del valor P de la cola de la derecha de estos
dos valores?
c) ¿Entre qué dos valores se encuentra el valor P de la prueba? (Ten en cuenta que
Ha tiene dos colas.)
d ) El valor t = 1,12, ¿es estadı́sticamente significativo a un nivel del 10 %? ¿Y a un
nivel del 5 %?
3. ¿Qué tamaño de la muestra se necesita para estimar el conteo medio de glóbulos blancos
(en glóbulos por microlitro) para la población de adultos de Estados Unidos? Suponga
que usted quiere tener una confianza del 99 % de que la media muestral está dentro de
0.2 de la media poblacional. La desviación estándar poblacional es 2.5.
8

4. Alumnos de un curso estadı́stica, seleccionados al azar, participaron en un experimento


con la finalidad de poner a prueba su habilidad para determinar el transcurso de 1
minuto (o 60 segundos). Cuarenta estudiantes produjeron una media muestral de 58.3
segundos. Suponga que σ = 9,5 segundos.
a) Calcule la mejor estimación puntual del tiempo medio de todos los estudiantes de
estadı́stica.
b) Construya un intervalo de confianza del 95 % para la media poblacional de todos
los estudiantes de estadı́stica.
c) Con base en el resultado, ¿es probable que sus estimaciones tengan una media que
se acerque razonablemente a 60 segundos?
5. En una prueba sobre la eficacia del ajo para reducir el colesterol, 47 sujetos fueron
tratados con Garlicin, que es ajo en tabletas. Se midieron niveles de colesterol antes y
después del tratamiento. Los cambios en sus niveles de colesterol de baja densidad (en
mg/dL) tienen una media de 3.2 y una desviación estándar de 18.6 (según datos de
?Effect of Raw Garlic vs Commercial Garlic Supplements on Plasma Lipid Concentra-
tions in Adults With Moderate Hypercholesterolemia?, de Gardner et al., Archives of
Internal Medicine, vol. 167). Construya un intervalo de confianza del 95 % para el cam-
bio neto medio en el colesterol de baja densidad después del tratamiento con Garlicin.
¿Qué sugiere el intervalo de confianza sobre la eficacia del Garlicin en la reducción del
colesterol de baja densidad?
6. Se midió la estatura de una muestra aleatoria simple de las supermodelos Crawford,
Bundchen, Pestova, Christenson, Hume, Moss, Campbell, Schiffer y Taylor. Tienen una
estatura media de 70.0 pulgadas y una desviación estándar de 1.5 pulgadas. Utilice un
nivel de significancia de 0.01 para someter a prueba la afirmación de que las super-
modelos tienen estaturas con una media que es mayor a la media de 63.6 pulgadas de
la población general de mujeres. Considerando que solo contamos con nueve estaturas,
¿realmente podemos concluir que las supermodelos son más altas que la mujer tı́pica?
7. En un análisis para investigar la utilidad de las monedas de un centavo, se registran los
centavos de 100 cheques elegidos al azar. La muestra tiene una media de 23.8 centavos
y una desviación estándar de 32.0 centavos. Si las cantidades desde 0 hasta 99 centavos
son igualmente probables, la media esperada es de 49.5 centavos. Utilice un nivel de
significancia de 0.01 para someter a prueba la afirmación de que la muestra proviene
de una población con una media menor que 49.5 centavos. ¿Qué sugieren los resultados
sobre los centavos de los cheques?

BIBLIOGRAFÍA

1. Moore, David S. The Basic Practice of Statistics. Fifth Edition. New York WH Freeman
and Company (2010).
9

2. Triola Mario F. ESTADISTICA. Decimoprimera Edición. Pearson Educación 2013.


3. Devore Jay l. PROBABILIDAD Y ESTADÍSTICA para ingenierı́a y ciencias. Octava
edición . Cengage Learnig 2010
4. Canavos George C. PROBABILIDAD Y ESTADÍSTICA, Aplicaciones y Métodos. Pri-
mera edición en español, Mc Graw Hill 1987.
5. Levin Richard I. y Rubı́n David S. ESTADÍSTICA para ADMINISTRADORES. Sexta
edición, Prentice Hall.
6. Anderson David R. Sweeney Dennis J. Williams Thomas A. ESTADÍSTICA PARA
ADMINISTRACION Y ECONOMIA. Décima edición, Cengage Learnig.
7. Paul Newold, William L. Carlson y Betty Thorne. Estadı́stica para administración y
economı́a. Sexta edición. Prencice Hall.

S-ar putea să vă placă și