Sunteți pe pagina 1din 8

UNIVERSIDAD NACIONAL DE INGENIERÍA

Facultad de Ingeniería Ambiental


Departamento de Estudios Generales
Periodo Académico 2018-2
AA232 BIOESTADISTICA
SOLUCIONARIO: EXAMEN FINAL – TEMA A
Profesora: CASTAÑEDA SALDAÑA Francisca Beatriz

1. Con el objeto de analizar el rendimiento académico y tomando como variable indicadora del rendimiento
académico al número de créditos aprobados por los estudiantes en el semestre 2017-2, se seleccionó una
muestra de 831 estudiantes de la UNI, para quienes se obtuvo los siguientes resultados.

a) Analice si estos datos son evidencia de que hay


N° de créditos Sexo diferencia entre estudiantes varones y mujeres,
Total
aprobados Femenino Masculino respecto de su distribución según el número de
0-5 20 116 136 créditos aprobados. Formule las hipótesis nula y
6-11 34 95 129 alterna (aplicadas al contexto), realice la prueba
pertinente y proporcione la significancia “p” para su
12-17 62 157 219
conclusión. 3p
18-23 91 191 282 b) Según su criterio personal postule las hipótesis
24-29 20 45 65 nula y alterna al comparar el promedio de créditos
Total 227 604 831 aprobados por estudiantes varones y mujeres.
Asuma  =0.05. Interprete sus resultados. 2p

Solución

a) Como se trata de analizar “si que hay diferencia entre estudiantes varones y mujeres, respecto
de su distribución según el número de créditos aprobados”, realizaremos el análisis con una
prueba de hipótesis aplicando la prueba Chi Cuadrado de homogeneidad.
De lo especificado formulamos las siguientes hipótesis:

H0: No hay diferencia entre estudiantes varones y mujeres respecto de su distribución según
el número de créditos aprobados en el semestre 2017-2

H1: Hay diferencia entre estudiantes varones y mujeres respecto de su distribución según el
número de créditos aprobados en el semestre 2017-2

Obtenemos las frecuencias esperadas para operar el estadístico

N° de créditos Sexo
Total
aprobados Femenino Masculino
0-5 37.20 98.8 136
6-11 35.2 93.8 129
12-17 59.8 159.2 219
18-23 77.0 205.0 282
24-29 17.8 47.2 65
Total 227 604 831

Estadística:

r c n  E ij  2
r c nij
2

X     E  n =14.94
2 ij

i 1 j  1 E ij i  1 j 1 ij
Obtenemos la significancia “p” con la Chi-cuadrado con 4 g.l.

p  P (  (24 )  14.94 )  0.0048  0.01 ; por otro lado el 20.99(4) =13.3

Este resultado nos indica que hay diferencias muy significativas (p < 0.01) entre varones y
mujeres respecto de su distribución de estudiantes según n° de créditos aprobados, tal como
se aprecia en la siguiente tabla de la distribución porcentual de estudiantes según número de
créditos aprobados.

N° de créditos Sexo
Total
aprobados Femenino Masculino
0-5 9% 19% 16%
6-11 15% 16% 16%
12-17 27% 26% 26%
18-23 40% 32% 34%
24-29 9% 7% 8%
Total 100% 100% 100%

El porcentaje de mujeres que aprobó de 18 a 29 créditos (49%) es significativamente mayor al


porcentaje de varones para el mismo rango de créditos aprobados (39%).
Asimismo el porcentaje de mujeres que aprobó menos de 12 créditos (24%) es
significativamente menor al porcentaje de varones (35%)

b) Postularé la hipótesis según mi criterio de que “El rendimiento de los estudiantes no está
relacionado con el sexo, esto es, en promedio tienen el mismo rendimiento”, asumiendo
=0.05

H 0 : F  M ; H1 : F  M
De las muestras obtenemos:

Estadístico Femenino Masculino


promedio 16.01 14.04
S² 43.12 55.31
S 6.57 7.44

Como las muestras son grandes aplicamos la prueba Z

( x 1  x 2 ) ( 16.01  14.04 )
Z   3.71
S12 S 22 43.12 55.31
 
n1 n2 227 604

Para el nivel =0.05, el punto crítico es Z0.975= 1.96, por lo cual el Z calculado se encuentra en la
región de rechazo.

Luego concluimos hay diferencia significativa entre el promedio de créditos aprobados por las
mujeres respecto del promedio de créditos aprobados por los varones (p<0.001)

2. Una empresa textil fabrica cuerdas en las cuales se tiene una tasa de defectos de 0.8 defectos por cada 20 m.
a) Determine la probabilidad de que al inspeccionar 50 m de esta cuerda se encuentre menos de 3 defectos
2p
b) Las cuerdas se comercian en rollos que contienen 200 m. Si un almacén adquiere 20 rollos, Obtenga la
probabilidad de que al inspeccionarlos encuentre 5 rollos con a lo más 3 defectos. 2p
Solución

a) De la información proporcionada deducimos que la variable es


X: Número de defectos cada 20 metros de cuerda
Donde X tiene distribución de Poisson con =0.8 defectos / 20 m

Luego dada la proporcionalidad de la unidad y el promedio, =2 defectos / 50 m


P(En 50 m de cuerda se encuentre menos de 3 defectos) = P(X < 3) = P(X  2) = 0.677

b) Si un rollo = 200 m de cuerda y se adquiere n = 20 rollos


Entonces, encontrar 5 rollos con a los más 3 defectos, es un evento del modelo binomial donde

Y: Número de rollos en los que se encuentra a los más 3 defectos, entre los 20 adquiridos

es binomial con n = 20 p = P(X  3) = 0.042;

siendo X variable de Poisson con =8 defectos / 200 m

Luego calculamos P( Y = 5) = C 520 0.0425 0.95815 =0.001


ésta probabilidad nos indica que es poco probable que esto ocurra, porque siendo p =0.042, lo
esperado es que encontremos el resultado en 1 de los 20 rollos(E(Y)= 0.84).

3. Una empresa fabrica tuercas y tornillos de la misma medida, por lo que tuerca y tornillo se venden como una
sola pieza. La maquinaria de que dispone la empresa hace que el porcentaje de defectos en la fabricación de
tornillos sea del 5%, mientras que esta cantidad asciende al 20% para las tuercas.
a) Si diariamente se fabrican 10000 tornillos, indicar cuál debe ser la producción de tuercas para que el
número esperado de tuercas y tornillos sin defecto coincidan. 2p
b) ¿Qué probabilidad existe de que un determinado día el número de tornillos defectuosos supere en más
de un 10% al valor esperado? 2p
c) Si tenemos previsto poder almacenar diariamente un máximo de A tuercas defectuosas, y sabemos que
dicho máximo es superado en 1.1 % de los días, ¿cuál debería ser el valor de A? 2p

Solución

Se informa que:
Producción de tornillos: 5% defectuosos
Producción de tuercas: 20% defectuosos

a) Fabricación diaria de tornillos; N1 = 10000


Se desea determinar el número de tuercas a producir diariamente N2 tal que
Si X: N° de tornillos sin defectos en la producción diaria
Y: N° de tuercas sin defectos en la producción diaria
E(X) = E(Y)
Siendo X e Y variables binomial, entonces
10000 x 0.95 = N2 x 0.80 = 9500; luego N2= 11875

b) Se pide que si W: N° de tornillos con defectos en la producción diaria

P[W > 1.10*E(W)]= P(W > 550)

Siendo N1=10000 aproximamos W con la Normal con W  500 ;  W  21.79

entonces P(W > 550)  P(Z > (549.5-500)/21.79) = P(Z > 21.27) = 0.0116

c) Se desea determinar la cantidad A de tuercas defectuosas de la producción diaria, tal que sólo
en el 1.1% de los días la producción diaria contenga un número de tuercas defectuosas
superior a A.

Entonces, si D: N° de tuercas defectuosas en la producción diaria


Se pide determinar el percentil D0.989
Como D es binomial n = 11875 y P = 0.20, la aproximamos con la Normal
 D  11875 * 0.20  2375 ;  D  11875 * 0.20 * 0.80  43.59

D0.989  2375
Luego si Z
0.989
  2.30 ; D0.989  2475.26  2476
43.59

4. Se cree que la portada y la naturaleza de la primera pregunta de encuestas por correo influyen en la tasa de
respuesta. Un artículo probó esta teoría al experimentar con diferentes diseños de portadas. Una portada
sencilla, y la otra utilizó la figura de un paracaidista. Los investigadores especularon que la tasa de devolución
sería menor para la portada sencilla.

Portada Número Nº de a) ¿Esta información apoya la hipótesis de los


de envíos devoluciones investigadores? Haga la prueba con un nivel de significancia
Sencilla 207 104 de 0.05, calculando primero un valor p. Interprete. 3p
Paracaidista 213 109 b) Con 95% de confianza estime la tasa de respuesta a las
encuestas por correo. Interprete. 2p

Solución

a) Asumiendo
Ps: Tasa de devolución para portada sencilla
Pp: Tasa de devolución para portada con paracaidista

Formulamos las hipótesis


H0: Ps  Pp
H1: Ps < Pp
y asumimos  = 0.05

Aplicamos la prueba Z para comparación de proporciones

Con la data de la muestra calculamos


ps = 104/207 = 0.502; pp =109/213 = 0.512; p = 213/420 =0.507

( 0.502  0.512 )
Z  0.205
0.507 * 0.493 * ( 1 / 207  1 / 213 )

Como la región de rechazo es a la izquierda, Z < - 1.645 (Z0.95 = 1.645)

La información no apoya la hipótesis de los investigadores, la diferencia encontrada no


alcanza significancia (p > 0.05); aceptamos que la tasa de devolución a la encuesta con
portada sencilla no es menor que la tasa de respuesta a la encuesta con portada llamativa.

b) Se pide obtener el IC 95% para la tasa de respuesta a las encuestas por correo (P)

de la muestra obtenemos n= 420; p = 213/420 =0.507

aplicamos el cálculo de los límites para la estimación de P con muestra grande


p( 1  p )
L  p  Z 1 / 2  0.507  1.96 0.507 * 0.493 / 420  0.507  0.048
n

IC 95% para la tasa de respuesta: Li = 0.459 Ls=0.555

Con 95% de confianza estimamos que en la población investigada la tasa de respuesta a las
encuesta de correo es entre el 45.9% y 55.5%
UNIVERSIDAD NACIONAL DE INGENIERÍA
Facultad de Ingeniería Ambiental
Departamento de Estudios Generales
Periodo Académico 2018-2
AA232 BIOESTADISTICA
SOLUCIONARIO: EXAMEN FINAL – TEMA B
Profesora: CASTAÑEDA SALDAÑA Francisca Beatriz

1. Con el objeto de analizar el rendimiento académico y tomando como variable indicadora del rendimiento
académico al número de créditos aprobados por los estudiantes en el semestre 2017-2, se seleccionó una
muestra de 831 estudiantes de la UNI, para quienes se obtuvo los siguientes resultados.

N° de créditos FACULTAD
Total
aprobados FAUA FIA FIC
0-5 75 46 15 136
6-11 48 42 39 129
12-17 105 63 51 219
18-23 80 73 129 282
24-29 22 21 22 65
Total general 330 245 256 831

a) Analice si estos datos son evidencia de que hay diferencia entre los estudiantes de las tres facultades,
respecto de su distribución según el número de créditos aprobados. Formule las hipótesis nula y alterna
(aplicadas al contexto), realice la prueba pertinente y proporcione la significancia “p” para su conclusión.
3p
b) Obtenga un intervalo de confianza 95% para la diferencia de promedios del número de créditos aprobados
por los estudiantes de la FAUA Y FIC. Interprete su resultado. 2p

Solución

a) Como se trata de analizar “si que hay diferencia entre los estudiantes de las tres facultades,
respecto de su distribución según el número de créditos aprobados”, realizaremos el análisis con
una prueba de hipótesis aplicando la prueba Chi Cuadrado de homogeneidad.
De lo especificado formulamos las siguientes hipótesis:

H0: No hay diferencia respecto de su distribución según el número de créditos aprobados en


el semestre 2017-2 de los estudiantes de las facultades FAUA, FIA y FIC

H1: Hay diferencia respecto de su distribución según el número de créditos aprobados en el


semestre 2017-2 de los estudiantes de las facultades FAUA, FIA y FIC

Obtenemos las frecuencias esperadas para operar el estadístico

N° de créditos FACULTAD
Total
aprobados FAUA FIA FIC
0-5 54.0 40.1 41.9 136
6-11 51.2 38.0 39.7 129
12-17 87.0 64.6 67.5 219
18-23 112.0 83.1 86.9 282
24-29 25.8 19.2 20.0 65
Total general 330 245 256 831
Estadística:

r c n  E ij  2
r c nij
2

X     E  n =66.46
2 ij

i 1 j  1 E ij i  1 j 1 ij

Obtenemos la significancia “p” con la Chi-cuadrado con 4 g.l.

p  P (  (28 )  66.46 )  0.001 ; por otro lado el 20.999(8) =27.9

Este resultado nos indica que hay diferencias altamente significativas (p < 0.001) entre los
estudiantes de las tres facultades, respecto de su distribución de estudiantes según n° de créditos
aprobados, tal como se aprecia en la siguiente tabla de la distribución porcentual de estudiantes
según número de créditos aprobados.

N° de créditos FACULTAD
Total
aprobados FAUA FIA FIC
0-5 23% 19% 6% 16%
6-11 15% 17% 15% 16%
12-17 32% 26% 20% 26%
18-23 24% 30% 50% 34%
24-29 7% 9% 9% 8%
Total general 100% 100% 100% 100%

El porcentaje de estudiantes que aprobó de 18 a 29 créditos fue de 31% para la FAUA y 39%
para la FIA, lo cual es significativamente menor al 59% de la FIC.
Asimismo el porcentaje que aprobó menos de 12 créditos fue de 38% para la FAUA y del 36%
para la FIA, lo cual es significativamente mayor al 21% de la FIC.

b) Se pide obtener el IC 95% para la diferencia de promedios del número de créditos aprobados
por los estudiantes de la FAUA Y FIC

De las muestras obtenemos:

Estadístico FAUA FIA FIC


promedio 13.15 14.03 16.94
S² 54.65 56.29 38.65
S 7.39 7.50 6.22

Luego aplicamos el cálculo de los límites para la estimación de la diferencia de medias de la FAUA
y de la FIC

54.65 38.65
L  ( x 1  x 2 )  Z 1 / 2 S x  x  ( 16.94  13.15 )  1.96   3.79  1.11
1 2
330 256

IC 95% para la diferencia de promedios: Li = 2.7créditos ; Ls = 4.9 créditos

Con 95% de confianza estimamos que en promedio los estudiantes de la FIC en el semestre 2017-
2 han aprobado de 2.7 a 4.9 créditos más que los estudiantes de la FAUA. En conclusión con 95%
de confianza podemos afirmar que los estudiantes de la FIC han tenido mejor rendimiento
académico que los estudiantes de la FAUA.

2. Las llamadas de teléfono en una casa ocurren a una tasa de 2 por hora, ¿cuál es la probabilidad de que:
a) El teléfono timbre al menos una vez en un periodo de una hora. 1p
b) Durante cuánto tiempo puede tomar una ducha, si desea que la probabilidad de no recibir llamada alguna
sea aprox 0.50. 2p
c) Obtenga el percentil 90 del tiempo entre llamadas. Interprete. 2p

Solución

De la información postulamos la variable


X: Número de llamadas por hora que reciben la casa
Donde X tiene distribución de Poisson con =2 llamadas / h

a) Se pide P( X  1 ) = 1 – P(X = 0) = 1 – e-2 = 0.865

b) Se desea determinar el intervalo de tiempo de T horas, tal que P(X = 0) =0.50

Entonces e-2T = 0.50 ; luego T = ln(0.50)/(-2) = 0.347 horas  20minutos y 47 seg.

c) Para obtener el percentil 90 del tiempo entre llamadas, consideramos

T: tiempo transcurrido entre llamadas;


donde T es una variable exponencial con =2

T0.90

P ( T  T0.90 )  2 e dt  1  e  2T  0.90
2t
entonces 0.90

0
Luego T0.90 =ln(0.10)/(-2) = 1.15 horas  1h y 9 minutos

3. Una empresa agrícola produce ajíes en dos campos A y B. Los que produce en el campo A tiene un
peso con distribución Normal con una media de 100gr y desviación estándar de 10 gr, mientras que
los de B tienen un peso con distribución normal con media de 90 gr y desviación estándar de 6 gr.
Se venden en cajones de 50 unidades de las cuales 20 son del campo A y 30 del campo B.
a) Calcule el peso medio y la desviación estándar del peso de los cajones. 2p
b) ¿Cuál es la probabilidad de que un cajón pese más de 4800 gr? 2p
c) Si se elige una muestra de 20 cajones, calcule la probabilidad de que la desviación estándar en la muestra
no exceda de 50 gr. 2p

Solución

Nos informan que:

XA: Peso de los ajíes del campo A ; tiene distribución Normal con A = 100gr y σA = 10 gr

XB: Peso de los ajíes del campo B ; tiene distribución Normal con B = 90gr y σB = 6 gr

a) Los cajones contienen 20 ajíes del campo A y 30 ajíes del campo B, entonces

20 30
XC: Peso de los cajones ; entonces X C   X Ai   X Bi
i 1 i 1
Luego XC tiene distribución Normal con

C = 20(100) + 30(90) = 4700 gr y σ²C = 20(100)+30(36) = 3080 ; σC = 55.50 gr

b) P(XC > 4800) = P(Z > (4800-4700)/55.50) = P(Z > 1.80) = 0.036

Es decir sólo el 3.6% de los cajones pesará más de 4800 gr.

c) Si tenemos una muestra con n= 20 cajones y deseamos P(S 50 gr)


( n 1)S2
Sabemos que X2  es  (2n1 )
 2

Luego P ( S  50 )  P  ( n  1 )S ²  19( 2500 )   P  2  15.42  0.30


 
  2 3080 
( 19 )

4. Una compañía de gas natural afirma que un quinto o más de las casas en Pueblo Libre cuenta con instalación
de gas natural.
a) ¿Tenemos razón en dudar de esta afirmación si, en una muestra aleatoria de 500 casas en este distrito, se
encuentra que 68 cuentan con la instalación? Utilice un nivel de significancia de 0.01. 2p
b) Proporcione una estimación y el error máximo al 95% de confianza para el porcentaje de casas que cuentan
con instalación de gas natural 2p

Solución

a) De lo informado por la Compañía de gas, postulamos las hipótesis

H0: P  0.20
H1: P < 0.20
Para el análisis asumiremos  = 0.01

Donde P: Proporción de casas de Pueblo Libre que cuenta con instalación de gas natural

Aplicamos la prueba Z para comparación de proporciones

Con la data de la muestra calculamos


p = 68/500 =0.136

( 0.136  0.20 )
Z  3.58
0.20 * 0.80 / 500

Como la región de rechazo es a la izquierda, Z < - 2.326 (Z0.99 = 2.326)

La muestra es evidencia suficiente de que el porcentaje de viviendas con instalación de gas


natural es significativamente menor al 20%, lo que sustenta nuestra duda respecto de lo
afirmado por la Compañía de gas natural.

b) Se pide obtener el IC 95% para el porcentaje de casas en Pueblo Libre que cuentan con
instalación de gas natural

Aplicamos el cálculo de los límites para la estimación de P con muestra grande

p( 1  p )
L  p  Z 1  / 2  0.136  1.96 0.136 * 0.864 / 500  0.136  0.03
n

IC 95% para el porcentaje de casas con instalación de gas natural:


Li = 10.6% Ls=16.6%

Con 95% de confianza estimamos que en Pueblo Libre el porcentaje de casas con instalación
de gas natural está entre el 10.6% y el 16.6%

S-ar putea să vă placă și