Sunteți pe pagina 1din 26

DISEÑO EXPERIMENTAL

Ejercicios de entrenamiento para la primera prueba conjunta

En los ejercicios aplicados, cada literal termina con la interpretación de lo realizado sobre la base del
contexto que se presenta; además toda PdH (prueba de hipótesis) debe incluir el CdR (criterio de
rechazo) de forma gráfica y al final de la Decisión se debe poner entre paréntesis el valor-p.

Ejercicio 01
Los siguientes datos, que corresponden a la respuesta experimental 𝑌: % de biorremediación con
cianobacterias de un tipo hidrocarburo alicíclico, se presentan en un DTH (diagrama de tallo y hojas):

a) Elaborar el diagrama de puntos.


b) Efectuar otro diagrama de tallo y hojas creando dos categorías en cada una de las decenas, en las
cuales los dígitos de las unidades del 0 al 4 formen un grupo y los dígitos del 5 al 9 formen el otro.
c) Realizar e interpretar la TdF (tabla de frecuencias) siguiendo estrictamente el método revisado en
clase.
d) Dibujar el histograma de frecuencias relativas y trazar el polígono respectivo.
e) Dibujar el histograma de frecuencias relativas acumulada y trazar la ojiva respectiva.
f) Calcular la media muestral o “promedio” y tanto de los datos del DTH como de los datos
agrupados en la TdF. ¿Por qué son diferentes estos dos valores?
g) Calcular la mediana Med para los datos del DTH y para los datos agrupados en la TdF.
h) Calcular la moda Mo para los datos del DTH y para los datos agrupados en la TdF.
i) Calcular la media geométrica MG para el DTH y para la TdF.
j) Calcular la media armónica MH para el DTH y para la TdF.
k) Calcular la media cuadrática MC (en inglés se escribe RMS o xRMS : root mean square) tanto para
los datos del DTH como para los datos agrupados en la TdF.
l) Calcular el percentil 80, también conocido como fractil 0.8, para el DTH y para la TdF.
m)Calcular la desviación estándar para el DTH y para la TdF.
n) Calcular la varianza y el coeficiente de variación para el DTH y para la TdF.
o) Calcular el coeficiente de asimetría o sesgo para el DTH y para la TdF.
p) Calcular el coeficiente de apuntamiento o curtosis para el DTH y para la TdF.
q) Graficar el diagrama de balanza para el DTH y para la TdF.
r) Elaborar el diagrama de caja para el DTH y para la TdF.
s) Analizar valores inusitados (atípico o extremos) sobre la base de los DTH construidos.

Ejercicio 02
Una mujer fue asaltada por una persona que, en su rápida huida, dejó manchas de sangre sobre el piso.
La víctima no tenía una imagen clara del asaltante, pero estaba completamente segura de que era un
hombre pelirrojo y de estatura superior a 180 cm. Los médicos forenses encontraron que la sangre era
del tipo AB y que contenía evidencia de sífilis. Si la sangre AB se presenta únicamente en el 4% de la
población, el 5% de la población son pelirrojos, no más del 1% de la población padecen sífilis y alrededor
del 10% de los hombres tiene una estatura mayor que 180 cm: Calcular la probabilidad de que el asaltante
posea todas estas características.

Ejercicio 03
A un congreso de biotecnología asisten 100 personas que no hablan más que español e inglés; de ellos,
95 hablan español y 15 hablan inglés. Se definen los eventos:

1
• E = {x|x habla solamente español}.
• I = {x|x habla solamente inglés}.
• EI = {x|x habla tanto español como inglés}.
a) Determinar las cardinalidad de cada uno de los tres eventos anteriores, i.e. hallar el número de
congresistas que hablan solamente español, el número de aquellos que hablan solamente inglés y
el número de congresistas que hablan ambos idiomas.
Se elige a una persona y, posteriormente, a otra para que formen una delegación. Calcular la probabilidad
de que los dos congresistas hablen:
b) Sin intérprete.
c) Solo en español.
d) Solo en inglés.
e) En inglés.
f) En un solo idioma.
g) En los dos idiomas.

Ejercicio 04
El diseño experimental de un nuevo tipo de PM (prueba microbiológica) para la detección de cierta
enfermedad, consiste en aplicar la prueba tanto a un grupo de PS (personas sanas) como a otro de PE
(personas enfermas); se ha obtenido la siguiente TdC (tabla de contingencia), en la que PM+ indica un
resultado positivo de la PM mientras que PM– denota un resultado negativo de la misma:
TDC PE PS
PM+ 92 10
PM– 8 140
Considerar las siguientes definiciones:
• Un f.p. (falso positivo) resulta si PM+ cuando en realidad se tiene una PS.
• Un f.n. (falso negativo) resulta si PM– cuando en realidad se tiene una PE.
• La sensibilidad (s) de la PM es la probabilidad que se tenga una PM+ dado que se la ha realizado
a una PE.
• La especificidad (e) de la PM es la probabilidad que se tenga una PM– dado que se la ha realizado
a una PS.
• El valor predictivo positivo (v.p.p.) es la probabilidad que, dado una PM+, se tenga una PE.
• El valor predictivo negativo (v.p.n.) es la probabilidad que, dado una PM–, se tenga una PS.
• La prevalencia (p) es simplemente la probabilidad de hallar una PE.
Con los datos de la TdC y el empleo de las definiciones y notaciones anteriores, calcular e interpretar
Pr  f . p. , Pr  f .n. , s, e, v.p.p., v.p.n. y p, ¿Cuál de los cálculos anteriores es el de mayor interés para
un investigador, si sabe que la prueba microbiológica es positiva?, ¿por qué?

Ejercicio 05
La prevalencia, p, de nueva enfermedad descubierta en cierta región aislada de la amazonia es del 2%;
la sensibilidad, s, y la especificidad, e, de una prueba diseñada para identificarla son 96% y 94%,
respectivamente.
a) Representar el problema en un DdA (diagrama de árbol) identificando cada una de las seis
probabilidades siguientes (calcularlas previamente, si es necesario):
p, 1  p, s, Pr  f .n.  1  s, e, Pr  f . p.  1  e .
b) Encontrar las cuatro probabilidades conjuntas que se deducen del DDA.
c) Calcular la probabilidad de que al efectuar la prueba se obtenga un resultado positivo.
d) Determinar el v.p.p. (valor predictivo positivo) y el v.p.n. (valor predictivo negativo) de la prueba.
e) Sabiendo que para un lugareño la prueba resultó negativa, ¿cuál es la probabilidad de que
realmente tenga la enfermedad?
f) Sabiendo que para un lugareño la prueba resultó positiva, ¿cuál es la probabilidad de que en
realidad no tenga la enfermedad?

2
Ejercicio 06
La probabilidad de que una persona elegida al azar de entre una población presente el síntoma
característico de una enfermedad es 0.2 y la probabilidad de que una persona elegida aleatoriamente
presente esa enfermedad es 0.25. La probabilidad de elegir a una persona que tenga el síntoma y también
la enfermedad es 0.18. Si una persona elegida al azar de entre dicha población no presenta el síntoma,
¿cuál es la probabilidad de que tenga la enfermedad?

Ejercicio 07
Para el experimento de lanzar un dado y observar el resultado de la cara superior, hallar tres eventos no
vacíos A, B y C que sean independientes.

Ejercicio 08
Pedro y Alejandro lanzan un dardo al blanco. La probabilidad que Pedro acierte es 1/3 y la probabilidad
que atine Alejandro es 1/4. Pedro lanza primero y ambos se van turnando. ¿Cuál es la probabilidad que
Pedro gane antes de que lo haga Alejandro?

Ejercicio 09
Una de cada cien personas tiene la enfermedad E. Se ha desarrollado una prueba para diagnosticarla; la
prueba da positiva en cuatro de cada cinco personas que tienen la enfermedad, pero también en
diecinueve de cada ciento noventa y ocho que están sanas. Si la prueba da positiva en ciento tres
personas, ¿cuántas están realmente enfermas?

Ejercicio 10
Sea “c” una constante y Y una variable aleatoria con función de densidad de probabilidad:
f  y   c 1e  y 2 I y 0  y   c 1e y 2 I y 0  y 
a) Calcular el valor de la constante “c” y graficar la función.
b) Determinar F  y  , la función de distribución acumulada de Y y graficarla.
c) Calcular Pr Y  0.5 1  Y  1 .

Ejercicio 11
El número de unidades formadoras de colonias por milímetro cúbico de agua en un estanque sigue una
distribución de Poisson con media igual a dos. Calcular la probabilidad de que en 50 muestras de un
milímetro cúbico tomadas de agua del estanque, cinco o menos no estén contaminadas.

Ejercicio 12
a) Determinar la función generadora de momentos de una distribución de Poisson Y con parámetro
  0.
ax
Sugerencia:   ea .
x0 x !
b) Utilizar el resultado del literal anterior para calcular la esperanza y la varianza de una distribución
de Poisson.

Ejercicio 13
En un sistema experimental operan conjuntamente los componentes A y B. Sean X y Y la duración, en
cientos de horas, de los componentes A y B, respectivamente. La función de densidad conjunta de
probabilidad está dada por:
f  x, y   cxe  x  y  2 I x 0, y 0  x, y 
a) Calcular el valor de la constante “c”.
b) Obtener la función de distribución conjunta acumulada F  x, y  y con ella calcular
Pr  0  X  1, 0.5  Y  1 .
c) Encontrar la función de densidad marginal de Y.

3
d) Hallar la probabilidad de que el componente B tenga una duración mayor que 100 horas.
e) Calcular Pr  X  1 Y  1 .
f) Determinar si X y Y son o no variables aleatorias independientes.
g) Una manera para medir la eficiencia relativa de los dos componentes del sistema con respecto a la
duración, es el cálculo de la razón Y X . Determinar E Y X  .
h) El costo C (en 1000*$) de reemplazar los dos componentes depende de su duración y está dado
por la ecuación C  50  2 X  4Y . Calcular el costo medio y  C , su desviación estándar.

Ejercicio 14
Una fábrica de biotecnología industrial que elabora partes cuyo diámetro se ajusta a una distribución
normal con media 2 cm y desviación estándar 0.02 cm, ha recibido un pedido de 10 000 unidades. Las
partes van a ser colocados, sin problemas, en orificios cuyo diámetro va desde 1.97 cm a 2.05 cm; así,
se desechan las partes con diámetros menores que 1.97 cm y se retrabajan las partes con diámetros
mayores que 2.05 cm.
a) ¿Cuántas unidades se desechan?
b) ¿Cuántas unidades se retrabajan?
c) ¿Cuál debe ser la media (expresarla con cuatro decimales) para desechar 100 unidades y, en este
caso, cuántas unidades se retrabajan?
d) ¿Cuál debe ser la desviación estándar (expresarla con cuatro decimales) a fin de desechar100
unidades y, en este caso, cuántas unidades se retrabajan?
e) Si no es posible bajar la desviación estándar hasta el valor calculado en el literal anterior, pero se
acepta desechar 150 unidades y retrabajar también 150 unidades, ¿cuáles deben ser las nuevas
media y la desviación estándar del proceso?

Ejercicio 15
Para investigar la eficacia de tres tipos de drogas A, B y C se utiliza un roedor y se observa que la
probabilidad de que se desarrollen antitoxinas son 1/4 para la droga A, 1/8 para la droga B y 1/3 para la
droga C. Dos frascos de laboratorio contienen la droga A, tres la droga B y uno la droga C. Se elige un
frasco al azar, se inyecta al roedor con la droga que contiene y se observa que no se forma antitoxina;
¿qué probabilidad hay de que fuera la droga B?

Ejercicio 16
Un equipo de trabajo establecido por Ministerio del Ambiente y el Ministerio de Coordinación de la
Producción, Empleo y Competitividad, programó visitas a 20 empresas industriales para investigar la
posibilidad de incumplimiento a las normas para el control de la contaminación; sin embargo, los
recortes presupuestarios han reducido drásticamente el tamaño del equipo de trabajo, por lo que
únicamente se podrán investigar tres de ellas. Si se estima que el 25% de las 20 empresas están operando
sin cumplir con las normas, calcular la probabilidad de que:
a) En ninguna de las tres empresas muestreadas se encuentren violaciones a las normas.
b) En las tres empresas industriales investigadas se encuentren violaciones a las normas.
c) Al menos una de las tres empresas esté operando en contravención a las normas para el control de
la contaminación.

Ejercicio 17
En un laboratorio de biotecnología hay tres cajas Petri con la cepa A, dos con la cepa B y cinco con la
cepa C. Las probabilidades de que estas cepas contaminen cierto MdC (medio de cultivo) son 1/3, 2/3 y
1/7, respectivamente. El protocolo de experimentación establece que se utilice, en dicho MdC, la cepa
de una de las cajas Petri escogidas al azar.
a) Calcular la probabilidad de que el MdC se contamine.
b) Si el MdC se ha contaminado, ¿cuál es la probabilidad de que sea debido a la cepa C?
c) Si el MdC se ha contaminado, ¿cuál es la probabilidad de que no sea debido a la cepa C?
d) Si el MdC se ha contaminado, ¿cuál es la probabilidad de que sea debido a las cepas A o C?

4
Ejercicio 18
Una prueba serológica tiene una sensibilidad p i.e. detecta la presencia de anticuerpos contra un
microorganismo con probabilidad p . Dada una muestra de sangre de un paciente con el
microorganismo, se proponen dos protocoles para su aplicación: i) Realizarla una vez; ii) correrla tres
veces con la condición de que detecte los anticuerpos por lo menos dos veces. Determinar los valores
que puede tomar p a fin de que el protocolo ii) sea:
a) Más ventajosa que el protocolo i).
b) Equivalente al protocolo i).
c) Desventajoso respecto al protocolo i).

Ejercicio 19
Se tienen cinco pares de cepas de hongos; cada par corresponde a un hongo distinto a los demás. Si para
un experimento se toman dos cepas al azar, calcular la probabilidad de que correspondan al mismo
hongo.

Ejercicio 20
Se repite cinco veces una prueba bioquímica que puede dar seis resultados igualmente probables: R1,
R2, R3, R4, R5 y R6. ¿Cuál es la probabilidad de que en las cinco pruebas se hayan obtenido los
resultados R1, R2, R3, R4 y R5 en ese mismo orden?

Ejercicio 21
Se realiza una serie de pruebas de detección a los habitantes de un caserío; se estima que la probabilidad
de que la detección sea exitosa es del 20%.
a) ¿Cuál es la probabilidad de que la primera detección exitosa sea la tercera prueba realizada?
b) ¿Cuál es la probabilidad de que la cuarta detección exitosa sea la décima prueba realizada?

Ejercicio 22
Sean X y Y dos V.A.C. con función de densidad de probabilidad conjunta:
f X ,Y  x, y   k 1  xy  I 0 x , y 1, x  2 y  x, y  .
Calcular:
a) El valor de la constante k .
b) f X  x  y fY  y  .
c) E  X  , var  X  y  X .
d) E Y  y var Y  y  Y .
e) fY X  x  y  y Pr Y  3 4 X  1 2  .
f) E  X  Y  .
g) cov  X , Y  y  X ,Y  Cor  X , Y  .

Ejercicio 23
De nueve matraces, cuatro contienen solución “A”, tres contienen solución “B” y el resto solución “C”.
Se selecciona al azar tres matraces y se define X = número de matraces con solución “A” de entre los
tres seleccionados, Y = número de matraces con solución “B” de entre los tres seleccionados y Z =
número de matraces con solución “C” de entre los tres seleccionados. Calcular:
a) f X ,Y  x, y  .
b) f X  x  y fY  y  .
c)  X y Y .
d)  X y  Y .
e) f X Y  y  x  y fY X  x  y  .

5
f) cov  X , Y  y Cor  X , Y  .
g) E  X  Y  y V  X  Y  .
h) Pr  Z  1 Y  1 .

Ejercicio 24
Sean X y X dos V.A.D. (variables aleatorias discretas) dicotómicas cuya función de masa de
probabilidad conjunta viene dada por:
y
1 0
1 p 1 2 p
x
0 1 3 p 1 6 p
a) ¿Qué valores debe tomar p para que f X ,Y  x, y  esté bien definida?
Suponiendo que f X ,Y  x, y  está bien definida, calcular:
b) f X  x  y fY  y  .
c)  X y Y .
d) p para que X y X sean V.A.I.

Ejercicio 25
En el pequeño bosque de Miraflores se han medido (en cm) los diámetros normales “ x ” de 100 árboles
i.e. los diámetros a una altura de 1.30 m del suelo; además se han medido (en m) las alturas “ y ” de estos
mismos árboles. Los resultados obtenidos, después de agrupar a los datos en clases o categorías
especificadas a continuación, son:
Y
[5,7[ [7,9[ [9,11[ [11,13[ [13,15[ [15,17[ [17,19[
[20,30[ 1 1 0 0 0 0 0
[30,40[ 2 10 8 5 0 0 0
X [40,50[ 0 1 14 13 15 1 0
[50,60[ 0 0 3 9 6 5 0
[60,70[ 0 0 0 1 2 2 1
Calcular:
a) Las medias y las desviaciones estándar (también conocidas como desviaciones típicas) de las
distribuciones marginales.
b) La covarianza.
c) La media y la desviación estándar para la distribución de alturas condicionadas a un diámetro
normal de 55 cm.
d) La media y la desviación estándar para la distribución de diámetros normales condicionadas a una
altura de 16 m.
e) La ecuación de la recta de regresión de y sobre x .
f) Los coeficientes de correlación y de determinación de x i y .

Ejercicio 26
Se ha observado que la presencia en el suelo de iones Al3+ es responsable de y , su acidez de cambio,
AcC, que se mide en pH. El aluminio residual x que contribuye a la acidez de cambio se denomina AlC,
aluminio de cambio. En la siguiente tabla se presentan los valores de AlC, en meq/100g: miliequivalente
por cada 100 g de suelo, y de AcC, correspondientes a 15 observaciones tomadas de San Gabriel, cantón
Montúfar, provincia del Carchi:

6
AlC 0.99 0.03 0.03 1.65 1.32 3.52 5.39 0.61 0.50 0.44 3.62 1.43 2.64 2.09 0.61
AcC 1.13 0.26 0.36 2.26 2.50 4.40 6.71 1.87 0.88 3.52 4.51 1.98 3.12 3.54 0.91
a) Hallar la recta de regresión de y sobre x y dar una medida de la calidad del ajuste.
b) Estimar los valores de AcC para 5 meq/100 mg y para 6 meq/100 meq.

Ejercicio 27
La siguiente tabla presenta el ancho, la longitud y el espesor de una muestra de braquiópodos 1 que
fueron sometidos a una exposición radiactiva desde su nacimiento hasta que alcanzaron el estado
adulto; las dimensiones están en mm:
Ancho Longitud Espesor
11.20 9.55 6.80
10.20 9.75 6.45
11.80 10.50 7.40
12.00 10.50 7.50
|12.70 11.00 9.10
12.70 11.75 8.70
12.00 11.35 9.00
12.55 11.00 10.40
13.00 12.50 10.80
12.00 12.25 10.45
12.95 12.00 10.70
13.40 12.20 10.30
13.55 12.30 10.90
14.00 12.40 11.00
13.90 12.65 11.50
14.50 12.70 10.70
14.00 12.60 9.10
14.70 12.50 10.40
14.30 12.85 8.85
14.80 13.30 10.00
15.05 12.10 12.45
15.05 12.05 10.50
16.25 12.70 12.65
14.05 13.40 12.60
13.95 12.70 12.15
15.15 11.90 12.65
16.75 13.45 13.10
15.30 13.00 12.45
16.10 14.50 13.55
16.65 13.95 7.95
a) Realizar el diagrama de dispersión longitud (en el eje x ) versus ancho (en el eje y ).
b) Realizar el diagrama de dispersión longitud (en el eje x ) versus espesor (en el eje y ).
c) Hallar la recta de regresión de y sobre x para el diagrama de dispersión del literal a) y dar una
medida de la calidad del ajuste.
d) Hallar la recta de regresión de y sobre x para el diagrama de dispersión del literal b) y dar una
medida de la calidad del ajuste.
e) Hallar la curva de regresión y  ab x para las variables del literal a) y dar una medida de la calidad
del ajuste; comparar con los resultados obtenidos en el literal c).

1
“Los braquiópodos (Brachiopoda, del griego brakhýs, "corto" y podós, "pie") son un filo de animales marinos pertenecientes
al clado de los lofoforados. Aunque se han descrito más de 16.000 especies fósiles, sólo existen unas 335 especies actuales.”
https://es.wikipedia.org/wiki/Brachiopoda, mayo del 2016.

7
f) Estimar el ancho que tendrá un braquiópodo de 15.00 mm de longitud, tanto con el modelo del
literal c) como con el modelo del literal anterior.
g) Estimar el espesor que tendrá un braquiópodo de 15.00 mm de longitud.

Ejercicio 28
En un estudio de los sedimentos de un estuario a fin de aplicar posteriormente un proceso de
biorremediación, se ha observado que al aumentar la profundidad x (que se mide en m) donde se recoge
el sedimento, disminuye el contenido y en agua resultante de drenar los sedimentos (que se mide en %
de agua del sedimento recogido). Se ha reunido la siguiente información:
x 0.0 0.3 0.5 0.7 1.0 1.3 1.5 1.7 2.0 2.3 2.5 2.7 3.0 3.3 3.5
y 10.0 9.5 9.0 8.5 8.0 7.3 7.0 6.7 6.3 5.8 5.5 5.3 5.0 4.8 4.5
a) Representar los datos en un diagrama de dispersión.
b) Hallar la recta de regresión de y sobre x y dar una medida de la calidad del ajuste.
c) Ajustar una parábola de segundo grado a los datos y dar una medida de la calidad del ajuste.
d) ¿Cuál de los dos ajustes realizados es mejor? Justificar su respuesta.
e) Con el mejor ajuste estimar el % de agua para una profundidad de 2.9 m y para 3.7 m. ¿Cuál de
las dos estimaciones es más fiable?

Ejercicio 29
Un SdC (sistema de control) empleado en biotecnología industrial consta de cinco componentes que
funcionan de manera independiente y cuyas confiabilidades (probabilidades de que funcionen) se
muestran en la figura.

a) ¿Cuál es la probabilidad de que el SdC funcione?


b) Si el SdC funciona, ¿cuál es la probabilidad de que el componente A no funcione?

Ejercicio 30
El 60% de los hombres de 20 años y el 65% de las mujeres de 20 años viven hasta los 70 años. ¿Cuál es
la probabilidad de que un matrimonio que contrajo nupcias cuando los dos tenían 20 años de edad,
celebren sus bodas de oro?

Ejercicio 31
En cierta región la estatura de las mujeres y la de los hombres se consideran distribuciones normales e
independientes con valores medios de 158 cm y 167 cm, respectivamente. Si se supone que las
desviaciones estándar de ambas distribuciones son iguales a 6 cm, ¿cuál es la probabilidad de que en
una pareja formada al azar la mujer mida más que el hombre?

Ejercicio 32
La longitud de los pétalos de una especie de planta tiene una distribución normal con media 5.2 cm y
desviación estándar 1.1 cm.
a) Calcular el percentil 2.5%.
b) Calcular el percentil 97.5%.
c) Determinar el menor intervalo de longitudes los pétalos que encierre al 95% de la población de
plantas de la especie.

Ejercicio 33
En un bosque de pino el número de árboles con plaga por hectárea tiene una distribución de Poisson con
media igual a 10. Los árboles con plaga se fumigan a un costo de $5 por árbol, además, de un costo fijo

8
de $200 por uso de equipo y transporte. Calcular es valor esperado y la desviación estándar de fumigar
10 hectáreas del bosque.

Ejercicio 34
Un biólogo solo está interesado en ejemplares de Aglais urticae, que constituyen el 15% de todas las
mariposas de la zona; calcular la probabilidad de que tenga que cazar ocho mariposas de las que no le
interesan antes de encontrar:
a) Un ejemplar de Aglais urticae.
b) Como máximo dos ejemplares.

Ejercicio 35
Las cantidades de Fe, en mg, para muestras de mineral en dos yacimientos distintos son:
Yacimiento 1 91 90 84 83 88 89 85 89 90 85
Yacimiento 2 89 91 88 92 85 91 93
Empleando PdH al nivel de significación del 5% y suponiendo normalidad en las poblaciones:
a) ¿Se puede aceptar la igualdad de varianzas?
b) ¿Existe diferencia significativa entre la cantidad media de Fe, en mg, de ambos yacimientos?

Ejercicio 36
De 200 personas que no padecían una enfermedad, 120 no tomaban bebidas alcohólicas; de 150
enfermos, 12 no consumían bebidas alcohólicas. ¿Es significativa la diferencia entre las proporciones
observadas? Emplear   0.01 . Además, calcular la potencia de la prueba si la verdadera diferencia
entre las proporciones es del 48%.

Ejercicio 37
Se espera que la adición de sustancias especiales haga disminuir la dureza del agua. Las estimaciones de
la dureza del agua, realizadas antes y después de añadir las sustancias en 40 y 50 muestras, mostraron
valores promedio de 4.0 y 3.8 (en grados de dureza), respectivamente. Suponiendo una varianza en las
mediciones de 0.25, ¿confirman estos resultados el efecto que se desea? Emplear   0.08 .

Ejercicio 38
La fracción media de semillas que germinan de una especie determinada sigue una distribución normal
con desviación estándar de 0.10. Para estimar la media de estos porcentajes se van a muestrear n
semillas.
a) Calcular el menor valor de n para asegurar que el riesgo de cometer un error menor que el 1%
sea, como máximo, del 5%.
b) Determinar el menor valor de n para asegurar con NdC del 95%, que la media muestral obtenida
difiera de la poblacional en menos del 3%.

Ejercicio 39
Se utilizan medidores para rechazar todos los componentes donde cierta dimensión no está dentro de la
especificación   2d . Se sabe que la dimensión se distribuye normalmente con media   1.50 y
desviación estándar 0.1. Calcular el valor de la constante “d” para que las especificaciones cubran el
95% de las mediciones.

Ejercicio 40
En un estudio biomédico con ratas se utiliza una investigación de respuesta a la posología para
determinar el efecto de la misma con un tóxico, en el tiempo de supervivencia del roedor. Para cierta
dosis del tóxico el estudio determina que el tiempo de supervivencia, en semanas, se ajusta a una
distribución gamma de parámetros   5 y   2 .
a) ¿Cuál es la probabilidad de que una rata no sobreviva más de 60 semanas?

9
y 1e  y
x
Sugerencia: El valor de la función gamma incompleta F  x;     dy para x  6 y   5
0
  
es F  6;5   0.715 .
b) Calcular el valor promedio y la desviación estándar del tiempo de supervivencia.

Ejercicio 41
Sea X N   ,  2  , calcular la función generadora de momentos M X  t  y, posteriormente, utilizarla
para calcular los momentos tanto de primer como de segundo orden para la variable aleatoria X; utilizar
estos dos momentos para comprobar que Var  X    2 .

Ejercicio 42
Se sabe que en cierto proceso de fabricación uno de cada 100 artículos, en promedio, está defectuoso.
¿Cuál es la probabilidad de que el cuarto artículo que se inspecciona sea el primero defectuoso que se
encuentra? Calcular la media y la desviación estándar de la variable aleatoria asociada.

Ejercicio 43
Una cadena de tiendas compra cierto tipo de artefactos a un fabricante. El fabricante indica que la tasa
de defectuosos es del 2%.
a) Si el inspector de la cadena elige 20 artefactos al azar de un cargamento, ¿cuál es la probabilidad
de que haya al menos uno defectuoso entre ellos?
b) Calcular el valor promedio de artefactos defectuosos por cada muestra de 20 de ellos escogidos al
azar.
c) Calcular la desviación estándar de artefactos defectuosos por cada muestra de 20 de ellos escogidos
al azar.
d) Si la cadena de tiendas recibe 10 cargamentos en un mes y el inspector prueba al azar 20 artefactos
por cargamento, ¿cuál es la probabilidad de que haya dos cargamentos que contengan al menos un
artefacto defectuoso?

Ejercicio 44
La función de densidad de una variable aleatoria continua X es f  x   axe  x 2 I   x .
a) ¿Cuál es valor de la constante “ a ”?
b) Determinar la función de distribución de X .
c) Calcular Pr  X  2  .
d) Hallar M  t  , la función generadora de momentos de X .
e) Encontrar la media y la varianza de la variable aleatoria mediante el empleo de M  t  .

Ejercicio 45
En cierto lugar y época del año, las probabilidades de día soleado, nublado o lluvioso son del 40%, 35%
y 25%, respectivamente. El 20% de los días soleados presenta vientos fuertes, el 50% de días soleados
tiene vientos moderados y el resto de días soleados viene acompañado de vientos tenues; similarmente,
para los días nublados la presencia de vientos fuertes, moderados y tenues ocurre el 50%, 30% y 20%
de las veces, respectivamente. Finalmente, en los días lluviosos la presencia de vientos fuertes,
moderados y tenues sucede el 30%, 50% y 20% de las veces, respectivamente.
a) Plantear el ejercicio en un diagrama de árbol. Definir los eventos en cuestión.
b) Calcular la probabilidad de tener un día con presencia de vientos fuertes.
c) Dado un día con vientos moderados, ¿cuál es la probabilidad de tener un día lluvioso?

Ejercicio 46
En una parcela hay plantados 80 árboles de la especie A y 40 de la especie B; han sido afectados por un
hongo 64 árboles de la especie A y 32 de la especie B. Si se seleccionan al azar tres árboles de la especie
A y dos de la especie B, calcular la probabilidad de que:

10
a) Los cinco árboles estén afectados.
b) Cuatro de los cinco árboles estén afectados.

Ejercicio 47
Cierta variable de respuesta se comporta de modo normal sobre dos poblaciones. Probar si poseen los
mismos parámetros, sobre la base de la siguiente evidencia muestral y empleando PdH al 5% de
significancia.
Muestra 1: 10, 30, 32, 23, 23, 24, 20, 18, 19, 45.
Muestra 2: 32, 39, 35, 30, 37, 28, 34, 33, 25, 30, 37, 33.
Empleando una PdH al 5% de significación, ¿se puede afirmar que la desviación estándar de la segunda
población es menor que 3?

Ejercicio 48
Se conoce que un 20% de los individuos tratados cónicamente con digoxina sufren una reacción adversa
por causa de ella. A 10 pacientes se les administró durante largo tiempo digoxina junto con otros
medicamentos y de ellos 5 desarrollaron la reacción adversa. ¿Se puede declarar que la asociación entre
la digoxina y los otros medicamentos incrementa el número de reacciones adversas? Emplear un NdS
del 2%.

Ejercicio 49
En una hacienda se recolectaron y analizaron muestras de aire durante el periodo de rociado más intenso
de insecticidas. En la tabla que sigue se registraron los niveles de tión y oxón, en ng/m3, por muestra de
aire. Empleando una PdH adecuada con un NdS del 5%, ¿es la razón media oxón/tión en condiciones
de niebla menor que la razón media oxón/tión en cielo despejado o nublado?
Muestra Fecha Condición Tión Oxón Oxón/Tión
01 Ene. 15 Niebla 38,2 10,3
02 Ene. 17 Niebla 28,6 6,9
03 Ene. 18 Niebla 30,2 6,2
04 Ene. 19 Niebla 23,7 12,4
05 Ene. 20 Niebla 62,3 Valor
06 Ene. 20 Despejado 74,1 45,8
perdido
07 Ene. 21 Niebla 88,2 9,9
08 Ene. 21 Despejado 46,4 27,4
09 Ene. 22 Niebla 135,9 44,8
10 Ene. 23 Niebla 102,9 27,8
11 Ene. 23 Nublado 28,9 6,5
12 Ene. 25 Niebla 46,9 11,2
13 Ene. 25 Despejado 44,3 16,6
Sugerencias: 1) Para aprovechar la información existente, reemplazar “valor perdido” por la media de
las concentraciones de oxón en condiciones de niebla. 2) Completar la tabla. 3) A fin de
elegir la PdH adecuada para la diferencia de medias, se debe establecer si las varianzas
poblacionales son estadísticamente iguales o distintas; hacerlo empleando una PdH.

Ejercicio 50
Se quiere estimar la incidencia de la hipertensión arterial en el embarazo. Determinar a cuántas
embarazadas se tienen que observar para que, con una confianza del 95%, se pueda estimar la incidencia
con un error del 2% y en cada uno de los siguientes casos:
a) Sabiendo que de un sondeo previo se ha observado un 9% de hipertensas.
b) Sin ninguna información previa.

Ejercicio 51
Para comprobar si un tratamiento de ácidos grasos es eficaz en pacientes con eczemas atípicos, se tomó
a un grupo de pacientes con eczemas atípicos por al menos nueve meses y se los sometió durante tres
semanas a un tratamiento ficticio (placebo) y durante las tres siguientes semanas a un tratamiento con

11
ácidos grasos. Tras cada periodo, un médico ajeno al proyecto evaluó la importancia de los eczemas con
una escala de 0 (sin eczemas) a 10 (tamaño máximo de los eczemas). Los datos fueron:
Paciente 1 2 3 4 5 6 7 8 9 10
Placebo 6 8 4 8 5 6 5 6 4 5
Tratamiento 5 6 4 5 3 6 6 2 2 6
Empleando una PdH con un NdS del 1%, ¿es eficaz el tratamiento?

Ejercicio 52
Se van a comparar dos métodos para inocular la cepa de un hongo en cierta variedad de maíz. El
ingeniero en biotecnología quiere determinar cuál de los dos métodos genera mayor porcentaje de
infección. De las 41 mazorcas inoculadas con el método A, 20 se infectaron; de 38 mazorcas inoculadas
con el método B, se infectaron 27. ¿Hay evidencia estadística suficiente para afirmar que el método B
genera una infección mayor que el método A en, al menos 10%? Emplear el NdS estándar.

Ejercicio 53
Se conduce un experimento para determinar si el uso de un fertilizante estándar en combinación con
cierta concentración de micorrizas, aceleran el crecimiento de las plantas. En cada una de 12 localidades,
se estudiaron dos plantas clonadas y sembradas en condiciones similares; a una planta se le aplicó sólo
el fertilizante y a la otra el fertilizante junto con las micorrizas. Después de cuatro semanas, el
crecimiento, en cm, fue el siguiente:
L o c a l i d a d
1 2 3 4 5 6 7 8 9 10 11 12
Sin micorrizas 20 31 16 22 19 32 25 18 20 19 23 30
Con micorrizas 28 40 24 31 28 42 33 26 31 28 33 39
Sobre la base de una PdH al 1% de significancia, ¿apoyan los datos la afirmación de que las micorrizas
aceleran el crecimiento de las plantas en al menos 5 cm?

Ejercicio 54
Por fistulización (comunicación anormal entre un órgano interno y la superficie corporal, o entre dos
órganos internos) se obtuvieron los siguientes pH en muestras de bilis hepática: 7.83, 8.52, 7.32, 7.79,
7.57, 6.58. Considerando que estas medidas provienen de una población con distribución normal:
a) ¿Se puede considerar neutra a la bilis hepática?
b) Si se asume que la desviación estándar poblacional es igual a 0.5, ¿qué decisión se tomaría?
c) ¿Cuál es el menor valor de la desviación estándar poblacional que permite considerar neutra a la
bilis hepática?
d) Determinar e interpretar 1   , la potencia de la prueba de hipótesis del literal a, suponiendo que
el verdadero pH promedio de la bilis hepática es 1  7.40 .
e) Si   0.5 , determinar el tamaño muestral necesario a fin de que la precisión (error de estimación)
del estudio sea igual a 0.15.

Ejercicio 55
Un conjunto de protocolos que se aplican en secuencia a varias técnicas in vitro constan de treinta etapas;
los tiempos t i en cada etapa son V.A.I.I.D. (variables aleatorias independientes e idénticamente
distribuidas) con ley uniformemente en el intervalo de 300 a 700 segundos. Calcular la probabilidad de
que el tiempo total en las treinta etapas esté entre cuatro horas y cuatro horas con treinta minutos.

Ejercicio 56
Una zona de Mindo es el hábitat natural de las especies A, B y C de colibríes. Se presume que la quinta
parte de los colibríes de la zona pertenece a la especie A, la tercera parte a la especie B y el resto a la
especie C. En una muestra aleatoria de colibríes de la zona en consideración se observaron 7, 12 y 15 de
las especies A, B y C, respectivamente. ¿Hay suficiente evidencia estadística para aceptar la hipótesis
propuesta?

12
Ejercicio 57
En la siguiente TdC (tabla de contingencia) se tiene la distribución del factor Rh versus el grupo
sanguíneo que se logró luego del análisis de sangre para una muestra aleatoria de habitantes en la ciudad:
Grupo sanguíneo
O A B AB
Rh+ 357 317 81 39
Factor Rh
Rh- 96 82 29 10
¿Puede aceptarse en dicha ciudad la hipótesis de independencia del factor Rh respecto al grupo
sanguíneo?

Ejercicio 58
Se ha medido la tasa de consumo de oxígeno (TCO) a atletas entrenados por dos métodos distintos: con
un EC (entrenamiento continuo) y con un EI (entrenamiento intermitente). Se han obtenido los siguientes
datos: 50.8, 45.8, 50.2, 48.4, 51.3, 49.4, 55.8, 49.6, 55.1, 46.5, 48.5, 49.0, 51.0, 49.3, 49.0, 51.6 para el
EC; 31.0, 19.5, 32.1, 49.3, 40.9, 14.2, 22.1, 10.6, 36.1, 37.1, 17.2, 35.2 para el EI.
a) Construir un IdC para la TCO promedio de los atletas con EC.
b) Construir un IdC al 90% para la desviación estándar de la TCO de los atletas con EI.
c) Sobre la base de un IdC adecuado al 95%, establecer si la media de la TCO con el EC es mayor
que la TCO promedio con el EI.
d) Responder el literal anterior sobre la base de una PdH.

Ejercicio 59
Se realizó un estudio sobre la tasa de cambio diario de una variable de respuesta en cierta fase
experimental; se tomaron datos correspondientes a 180 días, con los siguientes resultados:
Tasa Frecuencia
De 0.00 a 0.25 20
De 0.25 a 0.50 50
De 0.50 a 0.75 98
De 0.75 a 1.00 12
¿Se puede considerar que dicha tasa de cambio se ajusta a una variable aleatoria con la función de
densidad f x   1.5x 2  x  I 0,1 x  ?

Ejercicio 60
Se divide a una plantación de 386 000 m2 en parcelas de 1 000 m2. Se selecciona una muestra aleatoria
simple de 20 de estas parcelas y se miden las alturas en m de todos los árboles de las parcelas
muestreadas, obteniéndose los resultados que se dan en la tabla anexa. Utilizando un NdC (nivel de
confianza) del 92%, estimar la altura promedio de los árboles en la plantación.
Nº de árboles Altura promedio Nº de árboles Altura promedio
42 6.2 60 6.3
51 5.8 52 6.7
49 6.7 61 5.9
55 4.9 49 6.1
47 5.2 57 6.0
58 6.9 63 4.9
43 4.3 45 5.3
59 5.2 46 6.7
48 5.7 62 6.1
41 6.1 58 7.0

13
Ejercicio 61
Se desea estimar con un NdC del 95% la proporción de animales que pertenecen a cierta especie, para
lo cual y luego de estratificar a la población en tres regiones, se obtiene la siguiente información piloto:
Región 1 Región 2 Región 3
Nº total de animales 240 432 316
Tamaño muestral 50 80 60
Nº de animales de la especie 44 24 30
Costo ($) por muestreo individual 3 1 2
a) Estimar la proporción de animales de la especie en la región 1.
b) Estimar la proporción de animales de la especie en la región 2.
c) Estimar la proporción de animales de la especie en la región 3.
d) Estimar la proporción de animales de la especie en la población.
e) Calcular el tamaño muestral total y los respectivos tamaños muestrales en cada región, a fin de
estimar el parámetro en cuestión con un error máximo del 4% y utilizando la asignación equitativa.
f) Calcular el tamaño muestral total y los respectivos tamaños muestrales en cada región, a fin de
estimar el parámetro en cuestión con un error máximo del 4% y utilizando la asignación
proporcional al tamaño del estrato.
g) Calcular el tamaño muestral total y los respectivos tamaños muestrales en cada región, a fin de
estimar el parámetro en cuestión con un error máximo del 4% y utilizando la asignación de
Neyman.
h) Calcular el tamaño muestral total y los respectivos tamaños muestrales en cada región, a fin de
estimar el parámetro en cuestión con un error máximo del 4% y utilizando la asignación que
considera costos.
i) Determinar el tamaño muestral total y los respectivos tamaños muestrales de cada estrato a fin de
estimar dicho parámetro con un error máximo del 5% y utilizando la asignación que considera
costos.
j) Determinar el tamaño muestral total y los respectivos tamaños muestrales de cada estrato a fin de
estimar dicho parámetro con un error máximo del 10% y utilizando la asignación que considera
costos.

Ejercicio 62
La forma usual para determinar el diámetro de árboles en pie es el DAP, diámetro a la altura del pecho,
también llamado diámetro normal o radial; el DAP es medido a 130 cm respecto al nivel medio del suelo
y sobre la corteza. Por algún tiempo se ha venido aceptando la hipótesis de que la distribución del DAP,
en cm, para los pinos del bosque de Miraflores, sigue una distribución normal. Después de varios años
de cambios climáticos irregulares y expansión del distrito metropolitano de la ciudad, que pueden haber
afectado el crecimiento radial de los pinos, se elige la siguiente muestra aleatoria de los mismos ¿Se
puede admitir que sigue siendo válida la hipótesis sobre la distribución del DAP en los pinos del bosque
de Miraflores?
45.7 41.0 36.8 35.9 43.9 37.3 29.5 35.3 30.9 37.7
34.5 38.0 28.8 26.0 42.8 38.9 33.1 41.7 28.9 38.8
22.2 35.2 31.9 40.2 25.8 32.2 45.6 41.8 43.1 28.5
45.8 39.5 36.0 41.0 35.9 38.9 42.3 38.6 38.6 36.6
36.3 36.9 36.8 36.6 32.4 38.2 36.7 32.6 38.1 40.1
26.8 35.9 30.5 31.7 33.2 33.7 34.4 29.7 24.2 42.6
27.0 39.3 39.0 24.4 29.1 26.4 29.9 36.5 34.8 41.5
29.3 40.2 28.3 30.1 26.1 45.2 30.0 31.9 32.1 32.3
38.9 41.6 37.8 31.7 23.1 33.7 27.3 24.6 48.3 25.8
45.6 40.9 28.7 43.6 33.7 29.1 38.3 42.4 39.2 38.6

14
Ejercicio 63
One important aspect of medical diagnosis is its reproducibility. Suppose that two doctors examine 100
patients for dyspnea in a respiratory-disease clinic and that doctor A diagnosed 15 patients as having
dyspnea, doctor B diagnosed 10 patients as having dyspnea, and both doctor A and doctor B diagnosed
7 patients as having dyspnea. Compute the Kappa statistic and its standard error regarding
reproducibility of the diagnosis of dyspnea in this clinic.

Ejercicio 64
Cierta variable de respuesta se comporta de modo normal sobre dos poblaciones; probar si poseen los
mismos parámetros sobre la base de la siguiente evidencia muestral y mediante intervalos al 95% de
confianza.
Muestra 1: 16.24, 16.20, 15.32, 15.44, 16.52, 16.02, 15.90, 16.24, 16.68, 15.31, 14.67,
14.92, 15.85, 14.66, 13.91, 14.85, 14.09, 13.33, 15.22, 15.94, 14.14, 14.57,
14.19, 13.81, 13.00, 14.33, 15.66, 14.04, 14.59, 15.09.
Muestra 2: 28.81, 17.57, 19.26, 19.88, 20.43, 22.35, 19.79, 24.09, 22.78, 22.02, 17.48,
22.92, 12.46, 16.04, 23.73, 22.48.

Ejercicio 65
Usualmente, la concentración de contaminantes producidos por plantas químicas sigue una distribución
logarítmica normal; probar esta hipótesis es muy importante para poder realizar inferencias respecto al
incumplimiento de normas medioambientales. En cierta planta química se ha tomado muestras de la
concentración de cierto agente contaminante, en partes por millón; ¿qué se puede afirmar sobre la
distribución de probabilidad que siguen estos valores?
47.84 32.89 48.44 12.41 103.31 54.45 35.39 15.03 46.23 167.88
14.48 64.69 12.28 18.60 17.34 82.88 31.83 16.74 131.54 15.44
122.97 2.68 19.85 31.72 136.19 49.42 3.70 4.63 34.85 7.73
92.76 4.92 61.09 215.05 32.45 37.93 47.85 22.59 34.19 6.38
28.76 34.45 8.66 10.97 8.79 142.00 90.10 51.37 28.72 84.27
11.22 42.60 24.96 10.88 45.05 21.90 103.35 11.86 19.94 17.19
28.70 23.17 5.65 69.69 29.60 18.35 18.23 55.58 15.15 13.69
20.16 21.94 135.48 6.78 33.27 26.41 11.56 44.71 9.91 19.47
28.50 5.23 97.21 10.34 72.70 21.99 38.48 35.74 7.01 59.69
19.10 36.82 21.88 17.99 278.22 44.93 14.07 6.75 4.67 4.44
10.52 21.02 23.49 59.73 32.48 5.92 11.81 71.85 42.98 23.53
45.33 17.76 8.07 114.17 5.31 32.27 33.87 209.01 44.55 66.45

Ejercicio 66
En una fábrica de pintura se quiere reducir el tiempo de secado del barniz. Los siguientes datos
corresponden al TdS (tiempo de secado) del barniz, en horas, y a la CdA (cantidad de aditivo) empleado,
en kg, con el que se intenta lograr tal reducción.
CdA 0 1 2 3 4 5 6 7 8 9 10
TdS 14 11 10 8 7.5 9 10 11 13 14 15
a) Con la ayuda de un DdD (diagrama de dispersión) proponer un modelo de regresión a fin de
estimar el TdS del barniz en función de la CdA empleado.
b) Estimar e interpretar los parámetros del modelo propuesto. Dibujar la ecuación de regresión en el
DdD.
c) Realizar la PdH de idoneidad general del modelo.
d) Construir e interpretar el IdC para cada parámetro del modelo.
e) Estimar, tanto puntualmente como por intervalo, el TdS promedio del barniz cuando la CdA
empleado es de 5500 g.

15
Ejercicio 67
De una población normal se extrae una muestra de tamaño n y se determina su varianza s 2 . Calcular
dos números L y U  0  L  U  que encierren a la desviación estándar poblacional  con una alta
probabilidad conocida 1   denominada NdC (nivel de confianza).

Ejercicio 68
La efectividad de un medicamento contra el dolor de cabeza se examina determinando si éste elimina o
no el síntoma. Se administró el medicamento a 225 pacientes voluntarios, de los cuales en 170 causó el
efecto deseado. El medicamento se acepta para su uso general si tiene una efectividad en al menos el
80% de los casos.
a) Sobre la base de un IdC al 98%, ¿se puede recomendar el uso del medicamento?
b) Considerando un tamaño poblacional de 3 000 pacientes y un nivel de confianza del 95%, ¿se
puede recomendar el uso del medicamento?
c) Calcular el tamaño muestral necesario para estimar la proporción poblacional de personal a las
cuales el medicamento es efectivo; emplear un error de muestro del 5%, un nivel de confianza del
96% y considerar un tamaño poblacional de 9 000 pacientes.

Ejercicio 69
En un estudio sobre el empleo de cascos de seguridad para conductores de bicicletas a fin de prevenir
daños craneales en caso de accidentes, se ha reunido una muestra aleatoria de 793 ciclistas que se
lesionaron durante el año anterior; la TdC (tabla de contingencia) que se adjunta resume los resultados.
Lesión en Uso del casco
Total
la cabeza Sí No
Sí 17 218 235
No 130 428 558
Total: 147 646 793
a) ¿Es eficaz el casco para ayudar a prevenir daños craneales?
b) En el caso de TdC (tablas de contingencia) 2  2 como la anterior, el EDP (estadístico de prueba)
es un cuantil de la distribución chi-cuadrado con 2  12  1  1 GdL (grados de libertad);
adicionalmente, se debe considerar que se han empleado observaciones discretas para aproximar
 2r 1c 1 , que es una distribución continua. Dicha aproximación es buena para TdC que asocian
muchos GdL, pero podría ser inadecuada para TdC 2  2 . Así, se usa la siguiente corrección de
Yates por continuidad y aproximación, para el cálculo del EdP:

 nij  fij 0.5


r c 2
 
2
0 
i 1 j 1
fij

Resolver el literal a) empleando la corrección de Yates. ¿Qué efecto tiene esta corrección?

Ejercicio 70
El número de expresiones génicas que se obtuvieron por cada 20 corridas de una técnica PCR
(polymerase chain reaction), se muestra en la tabla siguiente:
3 1 2 0 3 5 3 8 3 2
1 3 1 0 9 13 2 8 2 1
1 0 0 1 8 13 8 0 5 5
1 4 0 1 0 1 10 4 0 1
2 6 6 0 6 4 1 0 2 5
9 5 9 17 8 2 2 2 4 3
8 4 0 2 1 2 6 2 0 6
2 1 6 11 9 3 8 1 0 1
6 8 3 8 8 5 12 5 0 4
3 0 14 4 4 0 3 0 1 1

16
¿Se puede considerar que dicho número Y de expresiones génicas se ajusta a una variable aleatoria con
la función de masa de probabilidad que se da a continuación?
P r(Y  y )   1    ; 0    1, y  0,1, 2,
y

Ejercicio 71
Un ingeniero en biotecnología desea rechazar o no la hipótesis de que, luego de aplicar una técnica
vegetal de cultivo in vitro, el #dEC (número de explantes contaminados) por día sigue una distribución
de Poisson con parámetro igual a tres; para el efecto, reúne esta información:
Día #dEC Día #dEC Día #dEC Día #dEC Día #dEC Día #dEC
1 2 16 4 31 1 46 3 61 8 76 3
2 3 17 3 32 3 47 4 62 3 77 3
3 4 18 4 33 2 48 2 63 1 78 5
4 5 19 3 34 4 49 2 64 3 79 2
5 3 20 3 35 2 50 3 65 1 80 1
6 2 21 3 36 5 51 4 66 0 81 7
7 3 22 4 37 0 52 2 67 3 82 7
8 0 23 3 38 6 53 3 68 2 83 1
9 1 24 5 39 4 54 1 69 1 84 5
10 0 25 3 40 4 55 2 70 3 85 1
11 1 26 2 41 5 56 3 71 5 86 4
12 0 27 4 42 1 57 2 72 4 87 4
13 6 28 4 43 3 58 5 73 1 88 9
14 4 29 3 44 1 59 2 74 1 89 2
15 4 30 5 45 2 60 7 75 6 90 3
Sugerencia: Para determinar en R las frecuencias observadas n i ; i  1, 2, , k se debe almacenar en el
objeto datos los 90 valores de #dEC. A continuación ingresar en la línea de comandos la
expresión table(factor(datos,0:max(datos))). El software R da como resultado dos
filas: en la primera están los valores de la variable aleatoria (#dEC es este caso) y en la
segunda fila se encuentran las n i .

Ejercicio 72
Se piensa que cierto rasgo humano es heredado de acuerdo con la proporción 1:2:1 para el homocigoto
dominante, heterocigoto y homocigoto recesivo, respectivamente. El examen de una muestra aleatoria
simple a 200 individuos proporcionó la siguiente distribución del rasgo: dominante, 43; heterocigoto,
125; recesivo, 32. Se desea saber si los datos proporcionan suficiente evidencia para desechar dudas
sobre la distribución del rasgo.

Ejercicio 73
En un estudio diseñado para determinar la aceptación por parte de los pacientes de un nuevo analgésico,
100 médicos seleccionaron –cada uno– una muestra de 25 pacientes para participar en el estudio. Cada
paciente, después de haber tomado el nuevo analgésico durante un periodo especificado, fue interrogado
para saber si prefería éste o el que había tomado regularmente con anterioridad. Los resultados se
presentan en la siguiente tabla, en donde la columna 1 es la cantidad de pacientes por cada 25 que
prefieren el nuevo calmante, la columna 2 es el número de médicos que reportan esta cantidad y la
columna 3 es el total de pacientes por médico que prefieren el nuevo calmante. Determinar si estos datos
son compatibles con la hipótesis de que se extrajeron de una población que sigue (o se ajusta a) una
variable aleatoria con distribución binomial.
Columna 1 Columna 2 Columna 3
0 5 0
1 6 6
2 8 16
3 10 30

17
Columna 1 Columna 2 Columna 3
4 10 40
5 15 75
6 17 102
7 10 70
8 10 80
9 9 81
10 o más 0 0
Total: 100 500

Ejercicio 74
Se presume que el tiempo de vida, en años, de los individuos de una población de mamíferos sigue una
distribución exponencial de media igual a seis. Verificar tal hipótesis con los siguientes datos:
1.10 1.50 4.52 0.91 1.56 10.24 14.22 20.68 2.16 4.48 0.58 2.10
3.54 7.36 18.25 4.20 8.25 4.93 5.36 1.54 3.28 1.42 19.06 23.92
2.08 5.05 6.27 21.32 2.08 4.84 0.20 6.84 9.87 10.29 0.23 13.30
8.46 16.03 1.52 12.27 8.42 7.34 1.44 15.19 1.23 2.56 4.65 1.84
19.25 3.18 3.60 1.02 1.19 1.97 4.74 5.73 10.63 0.93 6.21 2.39
13.46 7.15 8.46 12.71 20.17 31.67 5.62 6.24 6.84 3.79 8.49 23.94
13.16 6.77 1.73 1.95 10.78 1.60 2.24 13.91 0.28 7.68 2.15 20.23
4.79 2.71 23.72 10.46 5.17 2.20 0.35 33.31 0.97 2.62 5.02 15.48
2.22 1.16 3.01 1.35 16.19 0.08 3.11 3.30 15.30 3.52 0.77 7.35
1.02 22.34 9.75 6.57 18.02 1.23 1.79 10.21 5.72 11.16 8.91 0.36
12.43 4.19 1.94 2.64 0.36 9.30 10.58 0.17 8.33 13.24 4.48 2.69
5.56 1.83 1.40 2.53 2.13 1.19 7.29 3.79 10.28 5.89 3.43 1.55
1.24 2.69 0.24 9.54 17.42 13.86

Ejercicio 75
En un laboratorio de biotecnología vegetal se midió la temperatura, en °C, del lugar en donde se llevó a
cabo un proceso experimental que se replicó 200 veces; la temperatura se midió cada vez que dicho
proceso se llevó a cabo. Los datos se registran en la siguiente tabla:
21 18 22 21 21 16 17 19 21 17 18 21 16 22 21 19 17 23 16 21
20 19 22 19 18 19 22 19 21 20 23 23 17 22 19 16 19 23 19 18
18 22 22 20 19 20 18 18 19 20 22 22 18 19 19 17 19 19 21 16
23 17 23 21 19 21 23 21 20 21 21 18 23 22 23 16 22 23 17 20
18 23 19 19 22 23 23 20 24 17 17 18 22 19 20 19 19 21 21 16
18 19 17 19 19 23 20 20 21 16 21 20 19 23 18 16 23 22 23 18
18 24 18 20 20 22 17 16 20 20 23 17 20 16 21 22 19 16 17 20
22 18 20 21 23 18 22 17 23 21 20 18 21 17 18 21 21 18 19 17
23 20 21 23 18 22 16 23 17 16 17 24 23 20 20 16 18 19 16 20
22 23 21 17 18 20 20 18 17 22 18 23 21 22 19 23 22 19 17 22
¿Se ajusta esta temperatura a una distribución uniforme? Utilizar un NdS de 0.05.

Ejercicio 76
Mediante procesos biotecnológicos, se obtiene al día 0.5 toneladas de tomate en conserva con una
desviación estándar de 30 kg; si las ventas son a $1.00/kg, los costos de elaboración $0.20/kg y los costos
fijos de $9 000:
a) Calcular la probabilidad de que la utilidad en 90 días sea menor que $26 550.
b) Con una probabilidad del 97.50%, ¿cuántos días se tardarán en producir al menos 100 toneladas?

Ejercicio 77
Para la producción por hectárea de la variedad A de maíz, que sigue una distribución normal con media
1 y varianza  2 , se ha tomado la muestra aleatoria X1 , X 2 , , X m . Similarmente, para la producción

18
por hectárea de la variedad B de maíz, que sigue una distribución normal con media  2 y varianza  2 ,
se ha tomado la muestra aleatoria Y1 , Y2 , , Yn . Si las X i y las Y j son independientes y suponiendo que
1 y  2 son desconocidas, calcular el estimador de máxima verosimilitud para la varianza común  2 .

Ejercicio 78
Sea Y1 , Y2 , , Yn una muestra aleatoria obtenida de una distribución normal con media igual a  y
varianza igual a  2 ; calcular los EMV (estimadores de máxima verosimilitud) de  y de  2 .

Ejercicio 79
Sea Y1 , Y2 , , Yn una muestra aleatoria de una distribución uniforme con función de densidad de
probabilidad f  yi    1  para 0  yi   ; i  1, 2, , n . Calcular el EMV de  .

Ejercicio 80
Sea Y1 , Y2 , , Yn una muestra aleatoria de una distribución uniforme con función de densidad de
probabilidad f  y     2  1 I 0,2 1  y  .
1

a) Calcular el EMV de  .
b) Calcular el EMV para la varianza de la distribución de probabilidad subyacente.

Ejercicio 81
Sea Y1 , Y2 , , Yn una muestra aleatoria tomada de una distribución con función de densidad
f  y      1 y I 0,1  y  donde   1 . Calcular el EMV de  .

Ejercicio 82
Probar si la longitud del sépalo de la especie setosa en la BdD (base de datos) iris del software R, se
ajusta a una distribución normal.

Ejercicio 83
Los datos de la tabla son los conteos de frecuencia para 400 observaciones del número de colonias
bacterianas dentro del campo de un microscopio, usando muestras de película de leche ¿Hay suficiente
evidencia para decir que los datos no se ajustan a la distribución de Poisson? Realizar el CdR de la PdH:
i) Mediante el cálculo del QC (cuantil crítico), ii) Graficando la función de densidad de la distribución
chi-cuadrado asociada, junto con la RdR (región de rechazo) y la RdnR (región de no rechazo) de la
hipótesis nula, iii) Calculado el valor-p.

19
Ejercicio 84
Para i  1, 2, , n se tienen los números xi y se define d i  x  , la desviación del número xi respecto a
x  , como di  x   xi  x .
n
a) Si se define SD , la suma de las desviaciones, como SD   di  x  , demostrar que SD  0 cuando
i 1
n
x es x donde x   xi n ; es decir, SD  SD  x  (que se lee “ SD como función de x ”) es tal
i 1

que SD  x   0 .
b) Si di2  x    xi  x  y se define SSD , la suma de los cuadrados de las desviaciones, como
2

n
SSD   di2  x  , demostrar que SSD  SSD  x  tiene un único mínimo que se alcanza cuando x
 i 1
n
es x y que usualmente se denota por SS xx ; es decir, SS xx    xi  x  .
2

i 1

Ejercicio 85
La teoría de Mendel dice que el número de un tipo de chícharos que cae en las clasificaciones redonda
y amarilla, arrugada y amarilla, redonda y verde, y arrugada y verde debe estar en la proporción 9:3:3:1.
Suponga que 100 de estos chícharos revelaron 56, 19, 17 y 8 en las respectivas categorías. ¿Estos datos
son consistentes con el modelo?

Ejercicio 86
El hospital de una universidad realizó un experimento para determinar el grado de alivio que brindan
tres remedios para la tos. Cada medicamento para la tos se trata en 50 estudiantes y se registran los
siguientes datos:

Con un nivel de significancia de 0.05, pruebe la hipótesis de que los tres remedios para la tos son
igualmente efectivos.

Ejercicio 87
Como parte de la caracterización de un policarbonato, un ingeniero en biotecnología va a estudiar la
resistencia a la compresión, en kg cm2 , de ciertas probetas de este material (a menos que se indique lo
contrario, la resolución de cada literal de este ejercicio se debe hacer de forma independiente i.e. sin
utilizar la información dada en los restantes literales):
a) Si se supone que la resistencia de cada probeta se ajusta a una distribución normal con media 30 y
desviación estándar 5, ¿cuál es la probabilidad de que una probeta tenga una resistencia mayor que
34?
b) Si se supone que las resistencias de las probetas son independientes, acumulables, con media 30 y
desviación estándar 5, ¿cuál es la probabilidad de que las resistencias de 25 probetas superen 820?
c) Si se supone que las resistencias de las probetas son independientes, con media 30 y desviación
estándar 5, ¿cuál es la probabilidad de que la resistencia promedio de 30 probetas esté entre 28 y
32?
d) Si se supone que las resistencias de las probetas son independientes y se ajustan a una distribución
normal con media 30 y desviación estándar 5, ¿cuál es la probabilidad de que la resistencia
promedio de 16 probetas esté entre 28 y 33?
e) Sobre la base de las resistencias dadas en la tabla siguiente, calcular intervalos de confianza al
90%, 95% y 98% para la media, la varianza y la desviación estándar.

20
28.21 34.14 33.45 25.84 23.14
32.29 28.07 29.67 26.42 39.53
19.73 25.53 25.66 26.17 32.40
30.36 35.27 41.19 34.51 36.01
28.10 33.40 31.91 28.73 29.65
26.26 30.79 30.62 32.38 26.95
31.12 34.17 31.47 15.64 32.43
33.73 29.98 30.43 22.06 26.76
36.41 26.10 36.82 29.58 26.30
25.43 35.00 27.84 20.85 30.03
¿Se puede afirmar que la resistencia promedio de las probetas es igual a 30? ¿Se puede asegurar
que la desviación estándar de las probetas es igual a 5? ¿Qué pasa con el tamaño de los intervalos
a medida que aumenta el NdC?
f) Sobre la base de las resistencias dadas en la tabla siguiente, calcular intervalos de confianza al
90%, 95% y 98% para la media, la varianza y la desviación estándar.
24.64 22.95 24.62 25.22 26.28
24.48 25.28 25.76 25.08 24.67
25.46 25.07 24.25 25.75 24.09
24.69 25.05 25.81 23.55 24.60
¿Se puede afirmar que la resistencia promedio de las probetas es igual a 30? ¿Se puede asegurar
que la desviación estándar de las probetas es igual a 5?
g) Con los datos del literal e), hallar intervalos de confianza al 93%, 95% y 97.25% para la proporción
de probetas con una resistencia mayor o igual que 30.

Ejercicio 88
Se está estudiando la distribución de los grupos sanguíneos O, A, B, AB en un cantón de la costa y otro
de la amazonia; los resultados obtenidos fueron:
O A B AB
Cantón de la costa 121 120 79 33
Cantón de la amazonia 118 95 121 30
a) ¿Son homogéneos ambos cantones en cuanto a la frecuencia de los grupos sanguíneos?
b) Considerar únicamente al cantón de la costa; un modelo teórico asigna las siguientes
probabilidades a cada uno de los grupos sanguíneos, donde p  q  r  1
O A B AB
r 2
p  2 pr
2
q  2qr
2
2 pq
A partir de los datos de la muestra se ha obtenido pˆ  0.2465 y qˆ  0.1732 . ¿Se ajustan los datos
a dicho modelo teórico?

Ejercicio 89
En un LdB (laboratorio de biotecnología), una máquina que obtiene metabolitos secundarios de las
plantas puede ser regulada para obtener, en promedio,  ml por unidad de tiempo; si este proceso de
obtención se ajusta a una distribución normal:
a) Determinar el valor de  para alcanzar volúmenes menores que 8.00 ml el 1.00% de veces,
suponiendo que   0.30 .
b) ¿Cuál es el valor máximo de  tal que el volumen real obtenido por unidad de tiempo esté a no
más de 1.00 ml de la media, con una probabilidad de al menos 0.95?

21
Ejercicio 90
En el LdB del ejercicio anterior hay dos máquinas tipo A y una máquina tipo B. Los costos mensuales
X por insumos para máquinas tipo A están normalmente distribuidos con media  1 y varianza  2 ; los
costos mensuales Y por insumos para máquinas tipo B también están normalmente distribuidos pero
media  2 y varianza 3 2 Si se dispone de una muestra aleatoria de tamaño n de costos mensuales por
insumos de las máquinas tipo A y de una muestra aleatoria de tamaño m de costos mensuales por
insumos de las máquinas tipo B, deducir un intervalo (al 1   de confianza) para 2  1   2 : el costo
mensual esperado por insumos para el LdB. Considerar que se conoce  2 .

Ejercicio 91
Una población de moscas de la fruta se sometió a tratamiento radiactivo; luego de la tercera generación
se contó, en una muestra de ellas, el número de defectos genéticos por mosca, obteniéndose:
yi 0 1 2 3 4
ni 8 14 30 16 7
Probar, con un nivel de significación del 5%, si el número de defectos genéticos por mosca se ajusta en
este caso a una distribución binomial.

Ejercicio 92
Se realizó un experimento para determinar el grado biorremediación que producen ciertas cianobacterias
en agua de río contaminada con níquel. Cada uno de cuatro tipos de cianobacteria (T1, T2, T3 y T4) se
aplicaron, en concentraciones fijas, a muestras del agua contaminada durante 15 días; se registraron los
siguientes datos:
Tipo de cianobacteria
T1 T2 T3 T4
Baja 4 6 1 14
Tipo de
Media 10 8 2 4
biorremediación
Alta 6 6 17 2
¿Existe dependencia entre los tipos de biorremediación y de cianobacteria? Emplear un NdS del 1%.

Ejercicio 93
Para la respuesta Y : N   ,  , con 
2 2
conocida, se desea contrastar –al nivel de significancia  –
la hipótesis H0 :   0 versus H1 :   0 ; en tal sentido, se ha obtenido por experimentación la muestra
y1 , y2 , , yn . Si el verdadero valor de  es 1   0 :
a) Calcular Pot   1  , la potencia o poder de la prueba de hipótesis como función de  1 .
b) Calcular Pot   1  8  y Pot   1  14  cuando  2  4 ,  0  10 ,   0.05 y n  16 .
c) Deducir una fórmula para el tamaño muestral necesario en función del nivel de significancia  ,
de la potencia 1   , de la varianza  2 y de    1  0 .

Ejercicio 94
La contaminación de los ríos es un problema grave de impacto ambiental desde hace ya varios años, que
influye significativamente sobre los recursos pesqueros. La biorremediación en aguas es una de las tantas
aplicaciones de la ingeniería en biotecnología. Considerar los siguientes eventos:
A = {El río está contaminado}.
B = {Una prueba en una muestra de agua detecta contaminación}.
C = {Se permite la pesca}.

22
Si Pr  A   0.3 , Pr  B A  0.75 ,  
Pr B Ac  0.2 , Pr  C A  B   0.2 ,  
Pr C Ac  B  0.15 ,

   
Pr C A  B c  0.8 , Pr C Ac  B c  0.9 , entonces calcular la probabilidad de que:
a) El río esté contaminado, la prueba detecta contaminación y se permita la pesca, simultáneamente.
b) La prueba no detecta contaminación y se permita la pesca a la vez.
c) Se permita la pesca.
d) El río esté contaminado dado que, a la vez, se permite la pesca y la prueba no detecta
contaminación.

Ejercicio 95
Para una PdH unilateral a cola izquierda con un nivel de significancia   0.05 , el estadístico de prueba
Y tiene las siguientes funciones de distribución F  y  :
y 1 2 3 4 5 6 7
F  y  H0 0.05 0.16 0.39 0.65 0.9 0.95 ?
F  y  H1 0.35 0.45 0.63 0.77 0.85 0.94 ?
a) ¿Qué valores de Y forman la región de rechazo de H 0 ? ¿Qué valores de Y forman la región de
no rechazo de H 0 ?
b) ¿Cuál es la regla de decisión en términos de probabilidad?
c) ¿Cuál es la probabilidad de rechazar H 0 cuando esta es verdadera?
d) ¿Cuál es la probabilidad de no rechazar H 0 cuando esta es falsa?
e) Si Y  2 , ¿qué decisión se tomará sobre H 0 ? ¿Porqué?
f) ¿Cuál es el valor-p correspondiente al literal anterior?
g) ¿Cuál es la potencia Pot de la prueba de hipótesis?
h) ¿A partir de qué nivel de significancia se puede rechazar H 0 ?

Ejercicio 96
Una respuesta aleatoria Y toma valores y con las probabilidades respectivas p  y  siguientes:
y 1 2 3 4 5 6
p  y H0  14 16 ? 16 16 16
p  y H1  2 15 16 15 15 16 ?
Se decide rechazar H 0 si un valor de Y es 3 o 4. Calcular el nivel de significancia  y la potencia Pot
de la prueba de hipótesis.

Ejercicio 97 PdHBin (prueba de hipótesis binomial)


APPLIED BIOTECHNOLOGY CENTRE – ECUADOR cree que puede vender su PG (producto gancho o hook
product, HP) a más del  0 de los potenciales clientes. En una investigación inicial se seleccionaron a n
posibles compradores, y0 de los cuales estaban decididos a adquirir el PG. El EdP (estadístico de prueba)
–que se deduce bajo el supuesto de que H 0 (hipótesis nula) es verdadera– es la VAD (variable aleatoria
discreta) Y0 : Bin  n,  0  que, en este contexto, representa el número de clientes encuestados decididos
a adquirir el PG y cuyo valor observado es y0 , que también se puede denotar por n0* y que en este caso
corresponde a y1 p : el cuantil de orden 1  p del EdP Y0 , donde p es el NdSO (nivel de significancia
observado) o valor-p de la PdH (prueba de hipótesis). Como CdR (criterio de rechazo) y considerando
que la PdHBin del ejercicio es unilateral derecha, se utiliza la siguiente RdD (regla de decisión):

23
 
RdR  y  Y0 : H 0 a favor de H1   y  Y0 : y  VC   y  Y0 : y   y1 , 


RdnR   y  Y0 : H 0    y  Y0 : y  VC   y  Y0 : y  , y1 

Donde:
• RdR (región de rechazo) es el intervalo que contiene a los valores del EdP para los cuales ha
de ser rechazada H 0 a favor de H1 (la hipótesis alternativa) y cuya probabilidad –bajo el
supuesto de que H 0 es verdadera– es  : la probabilidad de cometer un error tipo I; es decir,
Pr  RdR    .
• RdnR (región de no rechazo) es el intervalo de los valores del EdP para los que no ha de ser
rechazada H 0 , siendo en probabilidad el complemento de la RdR.
• VC es el valor crítico de la PdH e igual a y1 , el cuantil de orden 1   de Y0 .
• Si n  100 ,  0  0.25 , y1  32 y y0  38 :
a) Plantear las hipótesis nula y alternativa de esta PdHBin; se debe poner por escrito el significado
de la proporción poblacional  , de acuerdo con el PdI (problema de investigación) subyacente.
 
b) Calcular   Pr  Error tipo I   Pr H 0 a favor de H1 H 0 es V  Pr Y0  y1  .
Rta. 0.06934889.
c) Realizar el CdR (criterio de rechazo) de la PdHBin mediante las cuatro formas estudiadas.
Considerar que, en este caso:
• CdR: Mediante el cálculo del VC.

 y0  VC  H 0 a favor de H1

 y0  VC  H 0

• CdR: Mediante el cálculo del valor-p.



 valor  p    H 0 a favor de H1

 valor  p    H 0 donde valor  p  Pr Y0  y0 

d) Calcular la probabilidad del error tipo II cuando la proporción de clientes que comprarán el PG es
en realidad 1  0.40 ; es decir, ¿qué probabilidad  hay de que el procedimiento de prueba no
rechace H0 :    0 cuando el verdadero valor de  es 0.40? ¿Cuál es la potencia de la PdH?
e) Repetir el literal anterior para 1  0.30 .
f) Repetir el literal d) para 1  0.50 .

Ejercicio 98 Función potencia de una PdHUD con varianza conocida. Tamaño muestral.
a) Para la respuesta Y : N   ,  2  , con  2 conocida, se desea contrastar la hipótesis H0 :   0
versus H1 :   0 , al NdS (nivel de significancia o nivel de significación)  ; en tal sentido, se ha
obtenido por experimentación la muestra y1 , y2 , , yn . Si el verdadero valor de  es 1   0 y
considerando que     1   0 , demostrar que Pot   1  –la potencia o poder de la PdH (prueba
de hipótesis) como función de  1 – es:

Pot   1   Pr Z  z1    n  . 
b) Si  2  4 ,  0  10 ,   0.05 y n  16 , construir en R la gráfica para Pot   1  .
c) Si  2  4 ,  0  10 ,   0.05 y n  36 , construir en R la gráfica para Pot   1  , junto con la
gráfica de la función con los datos del literal anterior. Comentar el efecto del tamaño muestral
sobre la potencia de la PdH.

24
d) Demostrar que el tamaño muestral necesario es, en este caso:
  z1  z1    
2

n  .
  

Ejercicio 99
En una planta de biotecnología industrial se destila aire líquido para producir oxígeno, nitrógeno y argón.
Se piensa que el %dIO (% de impurezas en el oxígeno) se relaciona linealmente con la cantidad de
impurezas en el aire, medida por el CcC (conteo de contaminación) en ppm (partes por millón). Una
muestra de datos de operación de la planta se presenta a continuación:
%dIO CdC en ppm %dIO CdC en ppm
93.3 1.10 93.2 0.83
92.0 1.45 92.9 1.22
92.4 1.36 92.2 1.47
91.7 1.59 91.3 1.81
94.0 1.08 90.1 2.03
94.6 0.75 91.6 1.75
93.6 1.20 91.9 1.68
93.1 0.99 92.5 1.35
a) Ajustar el modelo de regresión lineal a los datos. Interpretar ̂ 0 y ˆ1 .
b) Probar la significación de la regresión.
c) Determinar e interpretar un intervalo de confianza para 1 .
d) Graficar los residuos y comentar la adecuación del modelo.
e) Construir un intervalo de confianza para la estimación el porcentaje de impurezas en el oxígeno
cuando el conteo de contaminación es de 1.4 ppm.

Ejercicio 100
Por experimentación se ha obtenido la muestra  xi , Yi  ; i  1, 2, , n y se ha dibujado el diagrama de
dispersión de las parejas ordenadas  xi , yi  , donde yi –que se consigue con el nivel o valor xi de una
variable no aleatoria X – es la realización en el experimento de la variable aleatoria Yi . Se propone
entonces el modelo de regresión lineal Y   0   1 x   donde  : N  0,   es la variable aleatoria
2

que modeliza el error debido a la relación no determinística entre X y Y .


a) Calcular ̂ 1 y ̂ 0 , los estimadores que se obtienen por el método MCO (mínimos cuadrados
ordinarios) de los parámetros  1 y  0 del modelo, respectivamente.
n
 1 x  xi  x  
b) Demostrar que ˆ0      yi .
i 1  n SS xx 
c) Calcular var  ˆ1  .

d) Calcular cov Y , ˆ 1  .
 
e) Calcular var  ˆ 0  .
 
f) Calcular cov  ˆ 0 , ˆ 1  .
 
 
n
SSE
g) Si SSE   Y i  Yˆi probar que S 2  es un estimador puntual insesgado de  .
2 2

i 1 n 2
h) La estimación por el método de máxima verosimilitud (method of maximun likelihood) del
coeficiente de correlación  es:

25
n

  x  x  y  y 
i i
r i 1
.
n n

 x  x   y  y 
2 2
i i
i 1 i 1

n
Demostrar que r 2  1  SSE S yy , donde SSE    yi  yˆi  .
2

i 1

i) Calcular  1MV , ˆ0MV y ˆ 2


MV , los estimadores que se obtienen por el método de máxima
verosimilitud (method of maximun likelihood) de los parámetros  1 ,  0 y  2 del modelo de
regresión lineal simple, respectivamente.
Sugerencia:
La función de verosimilitud l   0 , 1 ,  2  es la función de densidad conjunta f  y1 , y2 , , yn  ;
debido a la independencia entre las variables aleatorias independientes Yi y puesto que
Yi : N  0  1 xi ,  2  , se tiene que:

l   0 , 1 ,  2    f  yi 
n

i 1

Donde f  yi  es la función de densidad de Yi . El método de máxima verosimilitud consiste en


hallar  1MV , ˆ0MV y ˆ 2MV que maximicen a la función de verosimilitud, lo cual es equivalente a

maximizar la función L   0 , 1 ,  2   ln l   0 , 1 ,  2  . 

26

S-ar putea să vă placă și