Documente Academic
Documente Profesional
Documente Cultură
9 DE FEBRERO DE 1999
1.-Tres imprentas hacen trabajos para una oficina de publicaciones: Los datos que a
continuación se expresan reflejan la experiencia a largo plazo con estas imprentas
Proporción de contratos Proporción de entrega con
Impresor correspondientes retraso de más de un mes
1 .2 .1
2 .3 .4
3 .5 .2
La oficina descubre un trabajo con más de un mes de retraso. Calcular la probabilidad de que el
impresor 3 sea el que tiene el contrato.
SOLUCION:
P(impresor 3/más de un mes de retraso)= P(impresor 3, más de un mes de retras0)/P(más de
1 mes de retraso) = p(mas de un mes de retraso/impresor 3) P(impresor 3)/[P( /1)P(1) +
P( /2)P(2)+P( /3)P(3)] = (0,2x0,5)/(0,1x0,2+0,4x0,3+0,2x0,5)=0,1/0,24=0,416
2.- El servicio postal requiere, en promedio, 2 días para entregar una carta al otro lado de la
ciudad. Se estima que la varianza es de 0,4. Si un ejecutivo desea que el 99% de sus cartas sean
entregadas a tiempo, ¿Con qué anticipación debe ponerlas en el correo?
SOLUCIÓN:
1 1 1
P( X k ) 1 2 0.99 1 2 0.99 0.01 k 2 100 k 10
k k k2
2 0.4 0.632 X 2 6.32
Debe enviarlas con 9 días de antelación.
1
4.- Un fabricante de cierto monitor comercial de televisión garantiza el cinescopio por un
año (8760 h). Los monitores se usan en terminales de aeropuertos para indicar horarios de vuelo
y están en uso continuo. La vida media de los cinescopios es 20000 y sigue una distribución
exponencial. Al fabricante le cuesta 45000 Pts hacer un monitor y le vende en 60000 Pts. Le
cuesta 22000 Pts reemplazar un cinescopio en periodo de garantía. ¿Cuál es la ganancia esperada
del fabricante? Suponemos que el fabricante reemplaza el cinescopio solo una vez.
SOLUCION :
=1/20000
8760 8760
e dt 1 e
t
P (T8760)= 20000
1 0.6453 0,354
0
5.- Un ensamble está compuesto por tres componentes colocados uno junto al otro. La
longitud de cada componente se distribuye normalmente con media 2 cm. y desviación típica 0,2
cm. Las especificaciones requieren que todos los ensambles tengan una longitud entre 5,7 y 6,3
cm. ¿Cuántos ensambles verificarán estos requerimientos?
SOLUCION:
Sean X1, X2, X3 la longitud de los componentes cada uno de ellos con distribución normal
de media 2 y varianza (0,2)2 = 0,04. La suma tiene una distribución normal de media
3x2=6 y varianza 0,04x3= 0,12.
Nos piden P(5,7<X1+X2+X36,3) tipificando la variable
5,7 6 6,3 6
P( Z ) P(0,867 Z 0,867) 2 0,867 1 2 x0,805 1 0,610
0,12 0,12
2
Intervalo -0,156 1,796x0,098 =(-0,332, 0,020)
Hipótesis unilateral es equivalente a H0: A=B
H1: A<B
t0= -0,156/0,107=-1,457 t0,1,11= 1,363
Región crítica t0<-1,363
Rechazamos la hipótesis de que la media del primer tratamiento sea mayor que la
media del segundo al nivel 0,1
p valor: P (t11 < -1,47)=P (t11>1,47) <P (t11>1,363)=0,1 El p valor es menor de 0,1
cosa que ya sabíamos ya que rechazamos la hipótesis a este nivel. También puede verse que
es mayor de 0,05. Su valor exacto es 0,086
Hipótesis bilateral: Región crítica t 0 1,796
Aceptamos la hipótesis nula de que los dos tratamientos tienen la misma media.
P valor: P ( t11 1,475) 2 x0,086 0,172
7.- El porcentaje de impurezas en oxigeno producido mediante un proceso de destilación se
considera relacionado con el porcentaje de hidrocarburo en el condensador principal del
procesador. Se dispone de los datos de un mes de operación, dados a continuación. Se pide:
Ajustar un modelo de regresión
Hacer el contraste de regresión: Hallar la región crítica y el p valor
Intervalo de confianza para la pendiente
Calcular R2
Hacer uso de los datos proporcionados y rellenar los que faltan
¿Qué se desprende del análisis de los residuos?
Pureza hidrocarburo predicción limite inferior limite superior limite inferior limite superior
( %) (%) predicción predicción estimación estimación
86,91 1,02 89,9003 82,0667 97,7339 87,8338 91,9668
89,85 1,11 83,2015 98,7233 89,1914
90,28 1,43 94,7388 86,7868 102,691 92,2611 97,2164
86,34 1,11 90,9624 83,2015 98,7233 89,1914 92,7335
92,58 1,01 89,7823 81,9373 97,6274 87,6728 91,8918
87,33 ,95 89,0743 81,1466 97,0019 86,6758 91,4728
86,29 1,11 90,9624 83,2015 98,7233 89,1914 92,7335
91,86 ,87 88,1302 80,0565 96,2039 85,2858 90,9745
95,61 1,43 94,7388 86,7868 102,691 92,2611 97,2164
89,86 1,02
96,73 1,46 95,0928 87,0879 103,098 92,4502 97,7354
99,42 1,55 96,1549 87,9579 104,352 92,9776 99,3322
98,66 1,55 96,1549 87,9579 104,352 92,9776 99,3322
96,07 1,55 96,1549 87,9579 104,352 92,9776 99,3322
93,65 1,40 94,3847 86,4799 102,29 92,0629 96,7066
87,31 1,15 91,4345 83,6881 99,1808 89,7282 93,1407
95 1,01 89,7823 81,9373 97,6274 87,6728 91,8918
96,85 ,99 89,5463 81,6764 97,4163 87,346 91,7466
85,20 ,95 89,0743 81,1466 97,0019 86,6758 91,4728
90,56 ,98 89,4283 81,5449 97,3117 87,1804 91,6762
Hidrocarburo pureza
n 20 20
Media 1,1825 91,818
Varianza muestral 0,0560513 20,0604
Desviación Standard 0,236752 4,47888
Covarianza 0,661463
3
Análisis de Regresión - Modelo: Y = a + b*X
Variable Dependiente: pureza
Variable Independiente: hidrocarburo
Error Estadístico
Parámetro Estimador Estándar T P-Valor
Ordenada 77,8633 4,19889 18,5438 0,0000
Pendiente 3,48512 3,38612 0,0033
Análisis de la Varianza
Fuente Suma de cuadrados Df Media Cuadrática F-Ratio P-Valor
Modelo 148,313 1 148,313 11,47 0,0033
Residual
Total (Corr.) 381,147
Coeficiente Correlación = 0,623797
R-cuadrado =
Standard Error de estimación. = 3,59656
Plot del modelo ajustado Residual Plot
100 8
97
4
residuos
pureza
94
0
91
88 -4
85 -8
0.87 1.07 1.27 1.47 1.67 88 90 92 94 96 98
hidrocarburo pureza estimada
4
3
2
1
0
-5 -2 1 4 7 10
RESIDUOS
Solución:
4
Cov( X , Y )
ˆ1 11,801
S X2
Modelo de Regresión: pureza = 77,8633 + 11,801x hidrocarburo
20 S X 1 11,801
t 3,38612
SR 3,48
Región crítica: t t18, 0.025 2,101
Rechazamos la hipótesis. Hay relación lineal entre las variables.
P valor: P t18 3,38612 0,0033
5
EXAMEN DE ESTADISTICA 2º de Ingeniería química 9 de septiembre de 1999
6
13 14 15 16 17
2.- Las cuadrillas de mantenimiento llegan al cuarto de herramientas pidiendo cierta parte de
repuesto según una distribución de Poisson de parámetro 2. El cuarto de herramientas dispone de
tres repuestos. Si se presentan más de tres, las cuadrillas deben recorrer una distancia
considerable hasta el almacén central.
En un día cualquiera
a. ¿Cuál es la probabilidad de que tenga que realizarse dicho recorrido?
b. ¿Cuál es la demanda diaria esperada de partes de repuesto?
c. ¿Cuántas partes de repuesto deberán tenerse en el cuarto de herramientas para asegurar el
servicio a todas las cuadrillas un 90% de las veces?
d. ¿Cual es el número esperado de cuadrillas que recibirán servicio diariamente en el cuarto de
herramientas?
Utilizar las tablas
SOLUCION:
a. Probabilidad de realizar el recorrido hasta el almacén = P(X>3) = 1- P(X3) = 1 - 0.857 =
0.143
b. demanda media diaria = E(X)= 2
c. Se busca un número a tal que P( X a ) 0.9 Buscando en las tablas P( X 4) 0.947 .
Con 4 repuestos en el cuarto de herramientas se asegura el servicio el 90% de las veces.
d. Se trata de calcular la distribución de la variable X condicionada por X3 y después calcular
su media.
P(X=0)= 0.135 P(X=0/ X3)=0.135/0.857=0.157
P(X=1)= P(X1)-P(X=0)= (0.406-0.135) = 0.271
P(X=1/ X3)=0.271/0.857=0.316
P(X=2)= P(X2)-P(X1) =(0.676-0.406) =0.270
P(X=2/ X3)=0.270/0.857=0.315
P(X=3)= P(X3)-P(X2)=(0.857-0.676)=0.181
P(X=3/ X3)=0.181/0.857=0.211
número medio de cuadrillas que reciben servicio en el cuarto de herramientas =
P(X=1/ X3)+2P(X=2/ X3)+3P(X=3/ X3)=1.569
7
3.- Un lote de 50 arandelas espaciadoras contiene 30 que son más gruesas que la dimensión
requerida. Se escogen tres arandelas al azar, sin reemplazo
a. Calcular la probabilidad de que las tres arandelas sean más gruesas que la dimensión
requerida
b. Sabiendo que las dos primeras arandelas no son más gruesas de lo requerido, calcular la
probabilidad de que la tercera si lo sea.
c. Calcular la probabilidad de que la tercera arandela sea más gruesa de la dimensión
requerida.
d. Calcular el número mínimo de arandelas que es necesario tomar del lote para que la
probabilidad de que ninguna de ellas sea más gruesa de lo requerido sea menor que 0,1.
e. Calcular el número mínimo de arandelas que es necesario tomar del lote para que la
probabilidad de que una o más de ellas sea más gruesa de lo requerido sea al menos de 0,9.
SOLUCION:
a. n = 50 , m = 30 son más gruesas ; llamamos Ai al suceso la arandela i es más gruesa
30
3 30 x 29 x38
P( A1 A2 A3 ) 0,271
50 50 x 49 x 48
3
30
b. P ( A3 / A1 A 2 ) 0,625
48
P ( A3 ) P( A1 A 2 A3 ) P( A1 A2 A3 ) P( A1 A 2 A3 ) P ( A1 A2 A3 )
c. 20 19 30 20 30 29 30 20 29 30 29 28
x x x x x x x x 0.6
50 49 48 50 49 48 50 49 48 50 49 48
4.- De un proceso químico se toma cada hora una muestra de 20 partes. Lo común es que el
1% de las partes requieran volver a ser procesadas. Sea X el número de partes de una muestra de
20 que necesitan ser reprocesadas. Se sospecha de un problema en el proceso si X es mayor que
su media por tres desviaciones estándar.
a. Calcular la probabilidad de que se sospeche de la existencia de un problema.
b. Si el porcentaje de partes que necesita reprocesarse es de 4%. Calcular la probabilidad de X
sea mayor que 1.
c. Calcular la probabilidad de que X sea mayor que 1 en al menos una de las muestras tomadas
en las próximas 5 horas.
SOLUCION:
8
a. n = 20; p=0,01, la variable X sigue una distribución B (20, 0,01).
E(X) = 20x0,01 = 0,2 = 2 = 20x0,01x0,99 = 0,198; = 0,4449;
X
P( 3) P( X 3 ) P( X 3 ) P( X 1,534) P( X 1,13) P( X 1)
1 P ( X 0) P( X 1) 1 0,9919 20 x0,01x0,9919 1 0,817 0,165 0,018
Si utilizamos aproximaciones nxp=20x0,01=0,2, podemos aproximar X por una variable de
Poisson de parámetro 0,2 ; buscando en las tablas P(X>1) = 1-P(X1) 1-0,982=0,01
b. Si p = 0,04, la variable X sigue una distribución B(20, 0,04)
P(X>1) = 1 – P(X=0) – P(X=1) = 1-0,442-0,368 = 0,19.
Aproximando nxp = 20x0,04 = 0,8 ; aproximamos X por una variable de Poisson de
parámetro 0,8; P(X>1) = 1 - P(X1)1 - 0,808 = 0,192
c. Sean X1, X2, X3, X4, X5 las muestras obtenidas en las 5 horas siguientes. Definimos las
variables Yi =1 si Xi > 1; Yi = 0 en caso contrario para i=1, 2, 3, 4, 5. Sea Y = Y1 +Y2 + Y3 +
Y4 + Y5. Nos piden calcular P (Y 1) . La variable Y sigue una distribución B (5, 0,19).
Por tanto P (Y 1) 1 P(Y 0) 1 0,810 1 0,349 0,65
5
5.- Se utilizan dos máquinas para llenar botellas de plástico con un volumen neto de 16
onzas. Las distribuciones de los volúmenes de llenado pueden suponerse normales con
desviaciones estándar 0,02 y 0,025 onzas. Un miembro del grupo de ingeniería de calidad
sospecha que el volumen de llenado de las dos maquinas es el mismo, sin importar si éste es de
16 onzas o no. Se toma una muestra aleatoria de 10 botellas
Máquina 1 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99
Máquina 2 16,02 15,97 15,96 16,01 15,99 16,03 16,04 16,02 16,01 16
a. Utilizando =0,05. ¿Tiene razón el ingeniero?
b. Calcular el p-valor de la prueba.
c. Calcular la potencia del contraste si la diferencia entre las medias es de 0,095.
d. Suponiendo el tamaño muestral el mismo para las dos muestras, calcular el tamaño de
muestra necesario para asegurar que =0,05 cuando la diferencia de las medias es de 0,08.
SOLUCION:
a. Dadas dos muestras de tamaño 10 de las variables X1N (1, 0.02) y X2N (2, 0,025) se
H 0 : 1 2
trata de realizar el siguiente contraste al nivel = 0,05. Bajo H0 el
H 1 : 1 2
X1 X 2
estadístico Z 0 N (0,1) . La región crítica al nivel 0,05 viene dada por
12 22
n1 n2
Z 0 z 0, 025 ; buscando en las tablas de la normal z0,025= 1,96. Para nuestras muestras el valor
de Z0 es 0,9871 que no cae dentro de la región crítica por tanto acepto la hipótesis nula y el
ingeniero tiene razón.
b. P Z z 0 2(1 z 0 ) 2(1 0,9871) 2 x(1 0,836) 0,338 , como vemos el p-valor
es muy grande lo que nos apoya en nuestra decisión de aceptar la hipótesis nula de igualdad
de medias.
9
P (aceptarH 0 / 1 2 0,095) P( Z 0 1,96 / 1 2 0,095)
P (1,96 Z 0 1,96 / 1 2 0,095)
0,095 X 1 X 2 0,095 0,095
c. P (1,96 1,96 / 1 2 0,095)
12 22 12 22 12 22
n1 n2 n1 n2 n1 n2
P (11,34 Z 7,42) (7,42) (11,34) 0
La potencia viene dada por 1- P (aceptarH 0 / 1 2 0,095) 1
0,08
d. P (aceptarH 0 / 1 2 0,08) 0,05 , d = 2,498 .
12 22
Buscando en las curvas OC encontramos n = 2 ó n = 3. Si n = 2
P (aceptarH 0 / 1 2 0,08)
0,08 X 1 X 2 0,08 0,08
P (1,96 1,96 / 1 2 0,08)
2
2
2
2
12 22
1 2
1 2
2 2 2 2 2 2
P (5,492 Z 1,572) (1,572) 1 (1,572) 0,059
Si n = 3
P (aceptarH 0 / 1 2 0,08)
0,08 X 1 X 2 0,08 0,08
P (1,96 1,96 / 1 2 0,08)
12 22 12 22 12 22
3 3 3 3 3 3
P (6,286 Z 2,366) (2,366) 1 (2,366) 0,01
La respuesta es n = 3.
6.- Una compañía productora de energía eléctrica está interesada en desarrollar un modelo
que relacione la demanda pico por hora (y, en Kw.) con el uso de energía total al mes (x, en
Kwh.). Se dispone de una muestra de 49 clientes que se ha procesado con el paquete Statgraphics
y se han obtenido los siguientes resultados
XKWH YKW
n 49 49
Media 1083,02 3,24204
Varianza 293589,0 5,84703
Desviación típica 541,838 2,41806
Mínimo 292,0 0,17
Máximo 2316,0 9,5
Cov(X,Y)=1020,1
Análisis de Regresión - Modelo: Y = a + b*X
Variable Dependiente: YKW
Variable Independiente: XKWH
Parámetro Estimador Error Standard Estadístico T P-Valor
Intercept -0,521022 0,493678 -1,05539 0,2966
Slope 0,0034746 0,000408497 8,50582 0,0000
10
Análisis de la Varianza
Fuente Suma de cuadrados Df Media cuadrática F-Ratio P-Valor
Modelo 170,134 1 170,134 72,35 0,0000
Residual 110,524 47 2,35157
Total (Corr.) 280,657 48
Coeficiente de Correlación = 0,778587
R-Cuadrado = 60,6197 percent
Error Standard de Estimación = 1,53348
Valores Predichos
95,00% 95,00%
Predicted Prediction Limits Confidence Limits
X Y Lower Upper Lower Upper
292,0 0,493561 -2,68981 3,67693 -0,291802 1,27892
582,0 1,5012 -1,64218 4,64457 0,898078 2,10431
1097,0 3,29061 0,174298 6,40693 2,84975 3,73147
1428,0 4,44071 1,31154 7,56987 3,91669 4,96473
2189,0 7,08488 3,83875 10,331 6,07478 8,09497
Plot of Fitted Model Residual Plot
15 4,9
Studentized residual
12
2,9
9
YKW
0,9
6
3 -1,1
0 -3,1
0 1 2 3 4 0 10 20 30 40 50
(X 1000)
XKWH row number
16
12
8
4
0
-3,1 -2,1 -1,1 -0,1 0,9 1,9 2,9 -3,3 -2,3 -1,3 -0,3 0,7 1,7 2,7
SRESIDUALS SRESIDUALS
11
grados de libertad, bajo la hipótesis nula. Según los datos proporcionados por la salida de la
Sˆ R
regresión 0.000408497 y ˆ1 0.0034746 . El valor del estadístico t también
Sx n
proporcionado es 8,5058152. La región crítica al nivel 0,05 viene dada por T t 0, 025, 47 ,
buscando en las tablas t 0,025, 47 2,021 . El valor de t está dentro de la región crítica y
rechazamos la hipótesis nula y admitimos que existe relación lineal entre las variables. El p-
valor viene dado por la fórmula P( t 47 8,505) 0 .
( ˆ 0 0 ) n
c. El estadístico que se utiliza es que sigue una distribución t con n-2 grados de
2
X
Sˆ R 1 2
SX
libertad. El intervalo de confianza al nivel 0,05 viene dado por
X2 X2
Sˆ R 1 2 Sˆ R 1 2
SX SX
ˆ 0 t 0, 025, 47 0 ˆ 0 t 0,025, 47 . Las salidas nos proporcionan los
n n
X2
Sˆ R 1 2
SX
valores ˆ 0 0,521022 y 0,493686 , sustituyendo obtenemos
n
1,5187 0 0,4767
VE
d. R 2 0,606197 ; VE= Variación explicada por la regresión; VT = variación total
VT
VE (Yi Yˆi ) 2 ; VT (Yi Y ) 2 . El 60% de la variación de nuestros datos está
explicada por la regresión.
e. Intervalo de predicción: Estimamos el valor de la variable dependiente Y para un valor de la
variable independiente X.
Intervalo de estimación: Estimamos el valor de la media de la variable Y para un valor de la
variable X. El intervalo de predicción es más amplio
Intervalo de estimación yˆ t Sˆ / nˆ Intervalo de predicción yˆ t Sˆ 1 nˆ ,
1
h R h h R h
2 2
n
donde nˆ h 2
valor muestral equivalente. Como estos intervalos son al 95%
X X
1 h
SX
= 0,05
f. Residuos. No se observa ninguna anomalía en el plot de los valores ajustados ni en el de los
residuos, sin embargo en el diagrama de cajas se observa cierta asimetría y en el histograma
se aprecia que los valores de los residuos se alejan de lo que cabría esperar para una variable
normal. En el modelo de regresión se observa que el contraste de la ordenada en el origen
tiene un p-valor cercano a 0,3 con lo que aceptaríamos la hipótesis nula de que esta vale 0.
Convendría hacer un nuevo análisis de regresión con esta ordenada igual a 0 y ver si los
resultados son mejores.
12
INGENIERIA QUIMICA: EXAMEN DE ESTADÍSTICA, SEGUNDO CURSO.
16 de febrero de 2000
1.- En un proceso de fabricación industrial se utilizan 10 máquinas. Estas máquinas
funcionan independientemente unas de otras durante un tiempo que sigue una ley exponencial de
media 100 horas. El proceso de fabricación se detiene cuando hay más de 8 máquinas sin funcionar.
(La fabricación sigue si funcionan al menos dos máquinas)
a) Calcular la probabilidad de que una máquina se averíe antes de 98 horas.
b) Calcular la probabilidad de que se detenga el proceso de fabricación antes de 98 horas
c) ¿Cuantas máquinas necesitaríamos para asegurarnos que el proceso de fabricación no se
detendrá antes de 98 horas con una probabilidad mayor que 0,9?
Solución:
Sea X la variable que mide el tiempo de funcionamiento de una máquina cualquiera.
98 1 98
1 100 x
P ( X 98) e dx 1 e 100 0,625
0
100
El proceso de fabricación se detiene si de las 10 máquinas se averían más de 8 antes de 98
horas.
Sea Xi =1 si la máquina i se avería antes de 98 horas. P(Xi=1) = 0,625. El número de
máquinas averiadas es Z i 1 X i . Z tiene una distribución binomial. P (se detenga el
10
proceso) =
10
P ( Z 8) P ( Z 9) P( Z 10) 0,625 0,375 0,625 0,055 0,009 0,0637
9 10
9
Con n=10 la probabilidad de que no se detenga el proceso es 1-0,0637=0,9363; este n nos
asegura el resultado.
Si n=9 P (se detenga el proceso)
9
= P ( Z 9) P( Z 8) 0,625 0,625 0,375 0,015 0,079 0,0193 .
9 8
8
P (no se detenga el proceso) = 1 – 0,0193 = 0,9807
Si n=8, esta probabilidad es
8
= P ( Z 8) P( Z 7) 0,625 0,625 0,375 0,023 0,111 0,135
8 7
7
Por tanto n=9.
2.- Supongamos que tres fábricas A, B y C vierten productos al río Pisuerga en una
proporción 0,3 0,5 0,2. Estos vertidos son tóxicos con probabilidades 0,05 0,01 y 0,1
respectivamente.
a) Calcular la probabilidad de un vertido tóxico al río Pisuerga.
b) Si se detecta un vertido tóxico en el río, calcular la probabilidad de que este provenga de cada
una de las tres fábricas.
c) Si se han detectado en el último año 10 vertidos tóxicos, calcular la probabilidad de que 5 sean
de A 3 de B y 2 de C.
Solución:
Por la regla de la probabilidad total.
P (vertido tóxico) = P (tóxico/A) P(A) + P (tóxico/B) P (B) + P (tóxico/C) P(C) = 0,05x0,3 +
0,01x0,5 + 0,1x0,2= 0,04
Por la regla de Bayes
13
P(A/tóxico)= P (tóxico/A) x P(A)/P (tóxico) = 0,015/0,04 = 0,375;
P (B/tóxico) = 0,005/0,04 = 0,125; P(C/tóxico) = 0,02/0,04 = 0,5.
Si se han detectado 10 vertidos tóxicos
10 5
P (5deA,3deB,2deC ) 0,375 0,125 0,5 0,024
5 3 2
5 3
3.- El diámetro de una arandela tiene una distribución normal de media 0,2 pulgadas. Las
especificaciones requieren que el diámetro está entre 0,14 y 0,26 pulgadas con probabilidad
0,9973.
a) Calcular la desviación estándar.
b) Si se conoce que la varianza es de 0,0016 pulgadas, calcular el valor de las especificaciones.
Solución:
Sea X la variable que mide el diámetro de la arandela P (0,14 < X <0,26) =
0,9973.Tipificamos la variable
4.- Dada una población N (, 2,5). Se realiza el siguiente contraste de hipótesis
H 0 : 50
obteniéndose los siguientes resultados.
H :1 50
a) Rellenar los datos que faltan en la tabla y dar los resultados del contraste.
b) Con los datos proporcionados ¿podrías obtener un intervalo de confianza para la media?
c) Para =0,05 ¿Qué tamaño de muestra nos asegura una potencia de 0.9 para =52?
Solución:
14
Es un contraste de hipótesis sobre la media de una población normal con varianza conocida.
X 0
El estadístico que se utiliza para el contraste es Z 0 . La región de aceptación al
/ n
nivel viene dada por X 0 z / 2 / n .
Para la primera fila de la tabla, z / 2 / n 1,5 de donde deducimos que
z / 2 1,5 n / 1,5 10 / 2,5 1,8973 . Buscando en las tablas, (1,89)=0,97; es decir
/2=0,03. Luego = 0,06. También se puede hacer
48,5 50 X 50 51,5 50
1 P(48,5 X 51,5 / 50) 1 P( / 50)
2,5 / 10 2,5 / 10 2,5 / 10
1 (1,897) (1,897) 1 0,97 1 0,97 0,06
En la segunda fila z / 2 2 n / 2 10 / 2,5 2,529 ; (2,53)=0,99;
= 2 x 0,01=0,02.
En la tercera fila z / 2 1,5 n / 1,5 16 / 2,5 2,4 ; (2,4)=0,99;
=2 x 0,01=0,02.
En la cuarta fila z / 2 2 n / 2 16 / 2,5 3,2 ;
(3,2)=0,99931; =2 x 0,00069=0,00138.
Para calcular el error, este se define como la probabilidad de aceptar la hipótesis
nula para un valor de .
En la primera fila
48,5 52 X 52 51,5 52
P(48,5 X 51,5 / 52) P( / 52)
2,5 / 10 2,5 / 10 2,5 / 10
(0,63) (4,27) 1 (0,63) 1 0,7673 0,2327
48 52
En la segunda fila (0) ( ) 1 / 2 (5,05) 1 / 2
2,5 / 10
En la tercera fila
51,5 52 48,5 52
( ) ( ) (0,8) (5,6) 1 0,7881 0,2119
2,5 / 16 2,5 / 16
52 52 48 52
En la cuarta fila ( ) ( ) 1/ 2
2,5 / 16 2,5 / 16
Para la última columna = 50,5.
En la primera fila
51,5 50,5 48,5 50,5
( ) ( ) (1,264) (2,529) 0,8962 (1 0,9944) 0,89
2,5 / 10 2,5 / 10
En la segunda fila
52 50,5 48 50,5
( ) ( ) (1,897) (3,16) 0,97062 (1 0,9992) 0,969
2,5 / 10 2,5 / 10
51,5 50,5 48,5 50,5
En la tercera fila ( ) ( ) (1,6) (3,2) 0,9452
2,5 / 16 2,5 / 16
52 50,5 48 50,5
En la cuarta fila ( ) ( ) (2,4) (4) 0,9918
2,5 / 16 2,5 / 16
15
Para poder dar un intervalo de confianza para la media, necesitaríamos la media
muestral y esta no se puede calcular con los datos suministrados.
Para = 0,05 z / 2 1,96 , la región de aceptación es X 50 1,96 x 2,5 / n . Si la
potencia es mayor de 0,9, el error es menor de 0,1
50 (4,9 / n ) 52 50 (4,9 / n) 52
( ) ( ) 0,1
2,5 / n 2,5 / n
Calculamos la distancia entre la hipótesis nula y d (52 50) / 2,5 0,8. Buscando
en las gráficas OC n está comprendido entre 15 y 30.
Si n = 15
50 (4,9 / 15 ) 52 50 (4,9 / 15) 52
( ) ( ) (1,138) (5,05) 1 0,87 0,13
2,5 / 15 2,5 / 15
Si n =16
50 (4,9 / 16 ) 52 50 (4,9 / 16) 52
( ) ( ) (1,24) (5,16) 1 0,8925 0,1075
2,5 / 16 2,5 / 16
Si n =17 =(-1,338)= 1- 0,908= 0,0092. Luego n =17.
5.- Se dispone de los siguientes datos que miden el porcentaje de algodón en un material
utilizado para la fabricación de camisas de caballero.
34,2 33,6 33,8 34,7 37,8 32,6 35,8 34,6
33,1 34,7 34,2 33,6 33,1 37,6 36,6 33,6
34,5 35 33,4 32,5 35,4 34,6 37,3 34,1
35,6 35,4 34,7 34,1 34,6 35,9 34,6 34,7
36,3 36,2 34,6 35,1 33,8 34,7 35,5 35,7
35,1 36,8 35,2 36,8 37,1 33,6 32,8 36,8
34,7 35,1 35 37,9 34 32,9 32,1 34,3
33,6 35,3 34,9 36,4 34,1 33,5 34,5 32,7
Estos datos se han procesado con el paquete Statgraphics, y obtenido los siguientes resultados.
variable: Porcentaje de algodón
64 valores desde 32,1 a 37,9
n = 62 Percentiles
Media = 34,7984 1,0% = 32,1
Mediana = 34,7 5,0% = 32,7
Moda = 34,7 10,0% = 33,1
Varianza = 1,86079 25,0% = 33,8
Desviación Standard = 1,36411 50,0% = 34,7
Mínimo 32,1 75,0% = 35,55
Máximo = 37,9 90,0% = 36,8
Rango = entre 32,1 y 37,9 95,0% = 37,3
Primer Cuartil = 33,8 99,0% = 37,9
Tercer Cuartil = 35,55
Rango InterCuartilico = 1,75
Coef. Asimetría = 1,21312
Coef. Apuntamiento = -0,442764
16
Tabla de distribución de frecuencias
-----------------------------------------------------------------------------------------------------------------------
Limite Limite Marca de Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Clase Frecuencia Relativa Acumulada Rel. Acu.
-----------------------------------------------------------------------------------------------------------------------
Menor 32,0 0 0,0000 0 0,0000
1 32 33,0 32,5 6 0,0938 6 0,0938
2 33,0 34,0 33,5 12 0,1875 18 0,2813
3 34,0 35,0 34,5 22 0,3438 40 0,6250
4 35 36,0 35,5 12 0,1875 52 0,8125
5 36,0 37,0 36,5 7 0,1094 59 0,9219
6 37,0 38,0 37,5 5 0,0781 64 1,0000
mayor38,0 0 0,0000 64 1,0000
igual
-----------------------------------------------------------------------------------------------------------------------
Media = 34,7984 Desviación Standard = 1,36411
Diagrama de tallo-hojas: unidad = 0,1 1|2 representa 1,2
1 32|1
6 32|56789
9 33|114
17 33|56666688
24 34|0111223
(14) 34|55666667777779
26 35|001112344
17 35|56789
12 36|234
9 36|6888
5 37|13
3 37|689
Diagrama de cajas Histograma
24
20
Frecuencia
16
12
8
4
0
32 33 34 35 36 37 38
32 33 34 35 36 37 38
Porcentaje de algodón
porcentaje de algodón
Se pide.
a) Rellenar los huecos en los estadísticos resumen y en la tabla de frecuencias. (no hace falta hacer
ningún cálculo)
b) Explicar brevemente las salidas de texto y los gráficos
17
INGENIERIA QUIMICA: EXAMEN DE ESTADISTICA 11 de setiembre de 2000
1.- Para cada una de las siguientes variables, indicar si son cualitativas o cuantitativas
justificando la respuesta. (1 punto)
El resultado de lanzar una moneda al aire.
Cualitativa, dos posibles resultados cara y cruz
El número de calorías de una comida.
Cuantitativa, toma valores numéricos.
El partido votado en las últimas elecciones.
Cualitativa, toma los valores de los partidos presentados.
El tiempo de duración de una película de dibujos animados.
Cuantitativa.
La espera en el aeropuerto para un embarque.
Cuantitativa
La temperatura media a la que una reacción química tiene lugar.
Cuantitativa.
La concentración media de ozono en el aire.
Cuantitativa.
La proporción de desempleados.
Cuantitativa.
La nota media de los exámenes de estadística.
Cuantitativa.
El número de goles en un partido de fútbol.
Cuantitativa, discreta, toma solo valores naturales.
2.- Opina si las siguientes conclusiones son acertadas, justificando tu respuesta. (1 punto)
Un agente de la propiedad observa que el precio medio de las casas del centro de Valladolid
es de 30 millones y por tanto concluye que la mitad de las casa del centro cuestan menos de
30 millones.
Falso, está confundiendo la media con la mediana.
Un viajante calcula que el coste medio de los últimos 5 viajes ha sido de 20.000 pesetas y
concluye que el coste total es de 100.000 pesetas.
Verdadero, ya que coste medio = suma de todos los gastos/5.
El contable de una empresa piensa que se ha confundido ya que ha llegado a la conclusión
de que el 90% de los empleados gana menos que el salario medio.
No se ha confundido, ya que pocos valores muy altos de la variable hacen subir la
media.
Una vendedora de helados concluye que más de la mitad de helados vendidos son de
chocolate porque la moda cuando se elige entre 10 sabores diferentes es el sabor a chocolate.
Falso, está confundiendo moda con mediana, la conclusión sería verdadera si solo
hubiera dos gustos diferentes.
3.- En una factoría se producen piezas que se empaquetan en tres tipos diferentes de cajas
con 15 unidades cada una en proporción 1/2 , 1/3, 1/6. Las cajas de tipo I contienen 3 unidades
defectuosas, las de tipo II , 5 defectuosas y las de tipo III, 6 defectuosas. Se elige una caja al azar y
se extraen 3 unidades resultando una de ellas defectuosa y 2 buenas. ¿Qué tipo de caja tiene mayor
probabilidad de ser la elegida? (1.5 puntos).
Solución:
P (I)=1/2, P (II)=1/3, P (III)=1/6. I ={3D,12B}, II ={5D, 10B}, III ={6D,9B}
18
12 10 9
3. 5. 6.
2 2 2
P (1B,2 D / I ) 0,435, P(1B,2 D / II ) 0,4945, P(1B,2 D / III ) 0,4747,
15 15 15
3 3 3
Por la regla de la probabilidad total P (1D,2B)= 0,435.1/2 + 0,4945.1/3 + 0,4747.
1/6=0,4615.
Por la regla de Bayes P( I / 1D,2B) P(1D,2 B / I ) P( I ) 0,4714
P (1D,2 B)
Análogamente P (II/1D,2B)=0,3571, P (III/1D,2B)=0,0571.
Luego la respuesta es la caja 1.
19
tanto rechazamos la hipótesis nula y llegamos a la conclusión de que existe relación lineal entre
las variables.
El intervalo de confianza para 0 viene dado por la fórmula ˆ0 t0,025,12 var( 0 ). Es decir
–1.967,372,179.259,597, dando como resultado. –2.533,0319 0 -1401,7081.
6.- Se han procesado las notas del examen y de prácticas de la asignatura de Estadística con
el paquete statgraphics, obteniéndose las siguientes salidas. Se pide explicar las salidas producidas
por el ordenador y las conclusiones a las que nos lleva el estudio estadístico. (3 puntos)
Solución:
De las tablas de distribución de frecuencias, se observa que la variable prácticas es más
homogénea, tiene menos variabilidad, los valores están concentrados entre el 5 ,5 y el 7,5,
mientras en las notas de junio están algo mas dispersa en torno a estos valores. También se
ve esta mayor dispersión en los cuartiles y el rango intercuartilico que es mayor en junio.
Mirando a los percentiles de las dos variables se podría decir que la nota de prácticas es más
alta que la de junio.
Frequency Tabulation for junio
Lower Upper Relative Cumulative Cum. Rel.
Class Limit Limit Midpoint Frequency Frequency Frequency Frequency
At or below 2,0 0 0,0000 0 0,0000
1 2,0 3,0 2,5 4 0,0870 4 0,0870
2 3,0 4,0 3,5 8 0,1739 12 0,2609
3 4,0 5,0 4,5 6 0,1304 18 0,3913
4 5,0 6,0 5,5 9 0,1957 27 0,5870
5 6,0 7,0 6,5 9 0,1957 36 0,7826
6 7,0 8,0 7,5 7 0,1522 43 0,9348
7 8,0 9,0 8,5 3 0,0652 46 1,0000
Above 9,0 0 0,0000 46 1,0000
Mean = 5,55217 Standard deviation = 1,70434
20
Data variable: junio Data variable: practicas
46 values ranging from 2,6 to 9,0 46 values ranging from 2,0 to 9,0
Summary Statistics for junio Summary Statistics for practicas
Count = 46 Count = 46
Average = 5,55217 Average = 6,19565
Median = 5,45 Median = 7,0
Variance = 2,90477 Variance = 3,00531
Standard deviation = 1,70434 Standard deviation = 1,73358
Minimum = 2,6 Minimum = 2,0
Maximum = 9,0 Maximum = 9,0
Range = 6,4 Range = 7,0
Lower quartile = 4,0 Lower quartile = 5,0
Upper quartile = 6,9 Upper quartile = 7,0
Interquartile range = 2,9 Interquartile range = 2,0
Stnd. skewness = -0,0150496 Stnd. skewness = -2,35487
Stnd. kurtosis = -1,29393 Stnd. kurtosis = 0,844995
Stem-and-Leaf Display for junio: unit = Stem-and-Leaf Display for practicas: unit
0,1 1|2 represents 1,2 = 0,1 1|2 represents 1,2
3 2|668
5 3|01 3 2|000
10 3|55699 4 3|0
13 4|002 7 4|000
17 4|5578 12 5|00000
23 5|033334 22 6|0000000000
23 5|589 (16) 7|0000000000000000
20 6|033 8 8|00000
17 6|555589 3 9|000
11 7|0123
7 7|568
4 8|033
1 8|
1 9|0
21
95,0% confidence interval for standard deviation: [1,41364; 2,14665]
12
frequency
0
0 2 4 6 8 10 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5
practicas practicas
8
frequency
0
2,6 4,6 6,6 8,6 10,6 2 3 4 5 6 7 8 9
junio junio
Aquí tenemos un histograma y un diagrama de cajas para las dos variables. De los
histogramas no puede decirse que las dos variables sean normales, sobre todo la variable
prácticas. Esto ya se podía haber dicho con el coeficiente de asimetría que toma el valor –
2,35 evidenciando asimetría hacia la izquierda.
En los diagramas de cajas se ve el menor rango intercuartilico de la variable práctica y
también el mayor valor de la media y la mediana de esta variable, así como la falta de
simetría.
22
Comparison of Standard Deviations
Junio prácticas
Standard deviation 1,70434 1,73358
Variance 2,90477 3,00531
Df 45 45
Ratio of Variances = 0,966546
95,0% Confidence Intervals
Standard deviation of junio: [1,41364;2,14665]
Standard deviation of prácticas: [1,4379;2,18349]
23
INGENIERIA QUIMICA: EXAMEN DE ESTADISTICA 10 de febrero de 2001
1.- Para cada uno de los siguientes experimentos, indicar la distribución de la variable
resultante justificando la respuesta. (1 punto)
El resultado del lanzamiento de un dado.
Es una variable discreta que toma los valores 1,2,3,4,5 y 6 con probabilidad 1/6 cada
uno de ellos
Sacar una pieza de un lote y anotar si es buena o defectuosa.
Es una variable de Bernoulli que toma los valores 0 o 1 según que la pieza sea buena
defectuosa con probabilidades 1-p y p siendo p la proporción de piezas defectuosas.
El número de piezas defectuosas al inspeccionar 20 piezas de un lote grande
Es una variable que se puede aproximar por una binomial de parámetros 20 y
p, siendo p la proporción de piezas defectuosas.
La temperatura media nocturna de Valladolid en el mes de julio.
Es una variable continua cuya distribución se podrá aproximar por una normal
2.- En una encuesta se plantea la siguiente pregunta ¿Conoces a algún hombre que vaya a la
compra normalmente? Al procesarla se comprueba que el 90% de los preguntados responde que si,
y por lo tanto se concluye que el 90% de los hombres realiza la compra normalmente. (1punto)
A) Opina si la conclusión es acertada, justificando tu respuesta.
De la pregunta de la encuesta se concluye que el 90% de los encuestados conoce a
algún hombre que vaya a la compra (todos pueden conocer al mismo), por tanto la
conclusión es errónea.
B) Se presenta el resumen de los datos de la siguiente forma
Numero de encuestados = 10000 media = 0.9008
Desviación estándar = 0.298945
¿Es una presentación acertada?
La variable que se está estudiando es una variable cualitativa con respuestas si y no,
por tanto no tiene sentido calcular ni su media ni su desviación estándar. La
presentación de los datos no es acertada.
3.- Tres máquinas fabrican piezas en serie siendo sus producciones horarias de 5000, 6000 y
4000 piezas respectivamente. Las proporciones de defectuosas son 0.05, 0.08 y 0.01; De la
producción de un día se seleccionan dos piezas que resultaron buenas. Calcular la probabilidad de
que ambas procedan de la misma máquina (1 punto).
Se supone que el número de piezas de que disponemos es lo suficientemente grande como
para considerar que la selección de la primera pieza es independiente de la selección de la segunda.
Solución
Sean M1, M2 y M3 las tres máquinas.
P (M1)=5/15; P (M2)=6/15; P (M3)=4/15:
Al extraer dos piezas se pueden dar las siguientes elecciones de máquinas con probabilidad
P (M1, M1)= (5/15) x (5/15); P (M1, M2)= (5/15) x (6/15); P (M1, M3)= (5/15) x (4/15);
P (M2, M1)= (6/15) x (5/15); P (M2, M2)= (6/15) x (6/15); P (M2, M3)= (6/15) x (4/15);
P (M3, M1)= (4/15) x (5/15); P (M3, M2)= (4/15) x (6/15); P (M3, M3)= (4/15) x (4/15);
El resultado de la selección de las piezas depende de la elección de las máquinas.
Denotamos por B pieza buena
P (BB/M1, M1) = 0.95 x0.95; P (BB/M1, M2) = 0.95 x0.92; P (BB/M1, M3) = 0.95 x0.99;
P (BB/M2, M1) = 0.92 x0.95; P (BB/M2, M2) = 0.92 x0.92; P (BB/M2, M3) = 0.92x0.99;
P (BB/M3, M1) = 0.99 x0.95; P (BB/M3, M2) = 0.99 x0.92; P (BB/M3, M3) = 0.99 x0.99;
24
La probabilidad de que las dos piezas extraídas sean buenas viene dada por la suma
P(BB)= P(BB/M1,M1)x P(M1,M1)+ P(BB/M1,M21)x P(M1,M2)+ P(BB/M1,M3)x
P(M1,M3)+P(BB/M2,M1)x P(M2,M1)+ P(BB/M2,M2)x P(M2,M2)+ P(BB/M2,M3)x
P(M2,M3)+P(BB/M3,M1)x P(M3,M1)+ P(BB/M3,M2)x P(M3,M2)+ P(BB/M3,M3)x
P(M3,M3)=0.899966
La probabilidad de que las dos piezas sean de la misma máquina viene dada por
P (M1, M1/BB) +P (M2, M2/BB) +P (M3, M3/BB) =
=(P(BB/M1,M1)x P(M1,M1)+ P(BB/M2,M2)x P(M2,M2)+ P(BB/M2,M2)x
P(M2,M2))/P(BB)=0.33934
4.- Un auditor sospecha que el 25% de las facturas de una empresa son fraudulentas.
Dispone de un millón de facturas para inspeccionar. Calcular el número de facturas que debe
examinar para asegurarse que encontrará al menos una fraudulenta con una probabilidad mayor que
0.99. Justificar la aproximación realizada (1 punto)
Solución:
Si hay un millón de facturas 250.000 son fraudulentas y 750.000 correctas. Al examinar n
facturas, si llamamos X el nº de facturas fraudulentas
750000
n
P( X 1) 1 P( X 0) 1
1000000
n
Aproximamos la distribución de X por una binomial de parámetros n y 0.25
P ( X 0) 0.250 x0.75n 0.01
Tomando logaritmos n log 0.75 log 0.01 como ambos logaritmos son negativos
log 0.01
n 16.0078 . Por lo tanto debe examinar 17 facturas.
log 0.75
5.- Calcular los percentiles 5, 25, 50, 75 y 95 de una distribución BN (20, 0.05), para ello
disponemos de las salidas proporcionadas por el statgraphics (1 punto)
Parameters: Event prob. Successes
Dist. 1 0.05 20
Dist. 2 0.2 5
25
P ( X 338) 0247116 0.00408192 0.25 P ( X 338) 0.748802 0.00408192 0.75
El percentil 50 es 394 ya que
P ( X 394) 049991 0.0046172 0.5 P ( X 394) 0.495473 0.00461729 0.5
El percentil 75 es 455 ya que
P ( X 455) 0.74921 0.00332881 0.75 P ( X 455) 0.247461 0.00332881 0.25
El percentil 95 es 554 ya que
P ( X 554) 0.949908 0.000943347 0.95 P ( X 554) 0.049149 0.000943347 0.05
¿A la vista de los resultados, creéis que hay una relación lineal entre las dos variables
analizadas?
El p-valor para el contraste de hipótesis de la pendiente es 0.57, por lo tanto aceptamos la
hipótesis de que la pendiente es 0 y por tanto no existe relación lineal entre las variables. El
contraste F de regresión también da un p-valor de 0.57 como cabía esperar ya que ambos
contrastes son equivalentes. El coeficiente R2 da un valor muy pequeño, sólo el 0.2% de la
variación de los datos está explicado por la regresión. Definitivamente si existe alguna
relación entre estas dos variables, no es lineal.
26
Después de realizada la regresión se ha hecho un análisis descriptivo de los residuos,
obteniéndose
Summary Statistics for RESIDUALS Percentiles for RESIDUALS
Count = 155
Average = 8.49677E-8 1.0% = -4.97435
Variance = 6.33808 5.0% = -3.43123
Standard deviation = 2.51755 10.0% = -2.87294
Minimum = -4.99106 25.0% = -1.68098
Maximum = 8.62278 50.0% = -0.346094
Range = 13.6138 75.0% = 1.40754
Lower quartile = -1.68098 90.0% = 3.13286
Upper quartile = 1.40754 95.0% = 4.36781
Interquartile range = 3.08852 99.0% = 8.21998
Skewness = 0.780005
Kurtosis = 0.998636)
40
frequency
30
20
10
0 -5 -2 1 4 7 10
-7 -4 -1 2 5 8 11
RESIDUALS
RESIDUALS
27
1 S2 S12
La región de aceptación es 12 4.53 es decir 0.20 4.53 . En nuestro caso
4.90 S 2 S22
S12
1.06 que cae dentro de la región de aceptación, es decir aceptamos igualdad de varianzas.
S 22
b) Calcular la potencia del contraste cuando el cociente de varianzas es 2. Dato
F(2.2659) = 0.862761; F (0.1)=0.003265
S12
S12 12 2 2 2 2
P (2) 1 (2) 1 P (0.20 4.53 / 2) 1 P (0.20 22 12 4.53 22 / 12 2) a
S22 2 2
1 S2 1 2
2
2
12 S12
Si 2
2 sigue una distribución F con 7 y 8 grados de libertad, por tanto
2 2S22
S12
P (2)= 1 P(0.10 2.2659) 1 F (2.2659) F (0.10) 1 0.86271 0.003265 0.140504
2 S22
c) ¿Que tamaño muestral nos asegura una potencia de 0.9 cuando el cociente de
varianzas es de 4?
Una potencia de 0.9 corresponde a un error de segunda clase 0.1 para una distancia entre la
hipótesis nula y la alternativa de 2, buscando en las curvas CO para un nivel 0.05
encontramos un tamaño maestral aproximado de 31 observaciones para las dos muestras
d) Dar un intervalo de confianza para la diferencia de medias
Asumiendo igualdad de varianzas la estimación de la varianza común es
(7x101.17+8 x 4.73)/15=97.735.La desviación estándar es 9.886
Buscando en las tablas t0.025,15 2.131 ; 2.131x9.886(1/7+1/8)=10.9032. El intervalo de
confianza al 95% para la diferencia de medias viene dado por (12.5-10.2)10.9032
1 2 8.6,13.2
e) Están los datos de acuerdo en que se ha reducido el porcentaje de impurezas al
colocar el filtro en al menos un 2%?
H 0 : 1 2 2
Hacemos el contraste Buscando en las tablas t0.05,15 1.753 ;
H1 : 1 2 2
La región de aceptación al nivel 0.05 es T >-1.753 , en nuestro caso
X Y 2 0.3
t 0.05 que está en la región de aceptación luego aceptamos la hipótesis de
1 1 5.116
s
7 8
que se ha reducido el porcentaje de impurezas en al menos un 2%
f) Calcular la potencia del contraste cuando la diferencia de medias es de 0. F
(1,36)=0.898
P (0)=P (Rechazar la hipótesis/1=2)=
X Y 2 X Y 2
P( 1.753 / 1 2 0) P ( 1.753 / 1 2 0)
5.116 5.116 5.116
28
INGENIERIA QUIMICA: EXAMEN DE ESTADISTICA.11 de setiembre de 2001
1.- Para cada uno de los siguientes experimentos, indicar la distribución de la variable
resultante justificando la respuesta. (1 punto)
- El resultado del lanzamiento de una moneda
- Sacar una pieza de un lote grande y anotar si es aceptable o no
- El número de piezas de piezas extraídas de un lote grande hasta sacar la primera
defectuosa, conociendo la proporción de defectuosas
- Las medidas de concentración de ozono en la calle Regalado de Valladolid
2.- Se han procesado unos datos y se han obtenido los resultados (1punto)
Clase Valor Frecuencia Frecuencia Frecuencia Frec.Relativa
Relativa Acumulada Acumulada
1 1.0 4 0.0741 0.0741
2 2.0 0.6111 37 0.6852
3 3.0 9 0.1667 0.8519
4 4.0 5 0.0926 51 0.9444
5 5.0 2 0.0370 53 0.9815
6 6.0 1 0.0185 1.0000
Rellena los huecos, explica que tipo de variable es y dibuja un diagrama de barras o un
histograma según corresponda.
3.- Tres máquinas fabrican piezas en serie siendo sus producciones horarias de 3000, 2000 y
1000 piezas respectivamente. Las proporciones de defectuosas son 0.01, 0.03 y 0.05; De la
producción de un día se selecciona dos piezas que resultan buenas. Calcular la probabilidad de que
ambas procedan de la misma máquina (1 punto).
5.- Calcular los percentiles 5, 25, 50, 75 y 95 de una distribución H (10, 15,35), para ello
disponemos de las salidas proporcionadas por el statgraphics (1 punto)
Distribution: Hypergeometric. Probability Mass (=)
Variable Dist. 1
0 0.0178713
1 0.103104
2 0.240576
3 0.297856
4 0.215689
5 0.094903
6 0.0255116
7 0.00410007
8 0.000372734
9 0.0000170532
10 2.9234E-7
29
6. - En un análisis de regresión se ha obtenido los siguientes resultados
Simple Regresión - Col_2 vs. Col_1
Regresión Análisis - Linear modelo: Y = a + b*X
Dependent variable: Col_2
Independent variable: Col_1
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -0,966824 0,00484523 -199,541 0,0000
Slope 1,54376 0,00307363 502,259 0,0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 1,96613 1 1,96613 252263,91 0,0000
Residual 0,0000623515 8 0,00000779394
Total (Corr.) 1,96619 9
Correlation Coefficient = 0,999984
R-squared = 99,9968 percent
Standard Error of Est. = 0,00279176
Explica las salidas suministradas por el programa. Dar un intervalo de confianza para la
pendiente al 5%. (2 puntos)
30
INGENIERÍA QUÍMICA: EXAMEN DE ESTADÍSTICA 6 DE SETIEMBRE DE 2002
1.-Tres laboratorios hacen análisis para una empresa de medio ambiente: Los datos que a
continuación se expresan reflejan la experiencia a largo plazo con estos laboratorios (2 puntos)
Proporción de análisis Proporción de entrega con
Laboratorio correspondientes retraso de más de un mes
1 .5 .3
2 .3 .4
3 .2 .2
La empresa descubre un análisis con más de un mes de retraso. Calcular la probabilidad de que
cada laboratorio sea el responsable del análisis.
2.- A continuación se presentan datos de viscosidad de un lote de cierto proceso químico.
13,3 14,9 15,8 16,0 14,5 13,7 13,7 14,9 15,3 15,2 15,1 13,6 15,3
14,5 13,4 15,3 14,3 15,3 14,1 14,3 14,8 15,6 14,8 15,6 15,2 15,8
14,3 16,1 14,5 13,3 14,3 13,9 14,6 14,1 16,4 15,2
a. Construir un diagrama de tallo- hojas para los datos de viscosidad. (0.5 punto)
b. Construir una tabla de distribución de frecuencias y dibujar el histograma correspondiente.
(1 punto)
c. Calcular los cuartiles primero, segundo y tercero y construir un diagrama de cajas. (0.5
puntos)
d. Suponiendo que todas las observaciones siguen una distribución normal con una varianza
común desconocida. Calcular un intervalo de confianza para la media al nivel 0.1. (1 punto)
e. Contrastar la siguiente hipótesis al nivel 0.05. (1 punto)
H0: =15 H0: =16
H1: <15 H1: ≠16
f. Calcular la región crítica y el p valor para ambos contrastes. (1 punto)
31
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 31 de Enero de 2003. Primera parte
1.- La tabla adjunta muestra los diámetros en centímetros de una muestra de 24 bolas de
cojinete manufacturados por una fábrica.
1.738 1.729 1.743 1.740 1.736 1.741 1.735 1.731 1.726 1.737 1.728 1.724 1.733 1.742
1.725 1.734 1.732 1.730 1.739 1.738 1.727 1.732 1.746 1.744
a. Calcular media, moda, mediana, rango, máximo, mínimo, desviación estándar, primer
cuartil, segundo cuartil, tercer cuartil, rango intercuartílico, percentil 5 y percentil 95
muestrales (0.5)
b. Hacer una tabla de distribución de frecuencias, un diagrama de tallo-hojas, un histograma y
un diagrama de cajas y comenta los gráficos.(1)
c. Hallar un intervalo de confianza al 95% para la media y otro para la varianza.(1)
d. Para el siguiente contraste de hipótesis
H0 : = 1.725
H1 : > 1.725
Calcular la región crítica, el p-valor (aproximado), la potencia en el punto 1.75. Calcular el
tamaño de muestra necesario para asegurarnos una potencia mayor de 0.99 en el punto 1.73.
(1.5)
e. Para el siguiente contraste de hipótesis
H0 : = 0.005
H1 : .0.005
Calcular la región crítica, el p-valor (aproximado), la potencia en el punto 0.004. Calcular el
tamaño de muestra necesario para asegurarnos una potencia mayor de 0.9 en el punto 0.004.
(1.5)
Solución:
n = 24 media = 1.73458 mediana = 1.7345 Moda = Hay dos 1.732; 1.738
Varianza = 0.0000402536 Desviación estándar = 0.00634457
Mínimo = 1.724 Máximo = 1.746 Rango = 0.022 Valores desde 1.724 a 1.746
Primer cuartil = 1.7295 (dato 6 + dato 7)/2 ordenados de menor a mayor
Tercer cuartil = 1.7395 (dato 18 + dato 19)/2 ordenados de menor a mayor
Rango intercuartílico = 0.01
percentil 5 = 1.725 dato 2 ordenados de menor a mayor
percentil 95 = 1.744 dato 23 ordenados de menor a mayor
Tabla de distribución de frecuencias
32
6
5
frequency
4
3
2
1
0
1.72 1.725 1.73 1.735 1.74 1.745 1.75
histograma
Diagrama de cajas
33
Contraste para la media t23,0.05= 1.714
t0 = 7,776 Región crítica T0 > 1.714. Rechazamos la hipótesis nula
P- valor P (T23 > 7.776) < P (T23 > 3.767) = 0.0005
Potencia
P (1.75)=P (T23 > 1.714/ = 1.75)= P (T23 > -17.286) 1
Tamaño muestral
d = (1.73-1.725)/0.0063 = 0.79
(d) < 0.01 n comprendido entre 30 y 40
Si n =30 t29, 0.05 = 1.699
P (1.73)=P (T29 > 1.699/ = 1.73)= P (T29 > -2.65)
De las tablas P (T29 > 2.75) = 0.005 P (T29 > 2.462) = 0.01
P (T29 > - 2.75) = 0.995 P (T29 > - 2.462) = 0.99
0.99 < P (1.73) < 0.995 luego n=30
2.- Clasifica las siguientes variables como discretas, continuas o categóricas y da su posible
rango. (0.5)
a. Número de acciones vendidas en la bolsa de valores.
b. Temperatura media anual.
c. Vida media de los tubos de TV.
d. Ingresos anuales de un trabajador.
e. Longitud de tornillos producidos por una empresa.
f. Capacidad de un frigorífico.
g. Número de libros en la Biblioteca de la Facultad.
h. Suma de los puntos al lanzar 20 dados.
i. Diámetro de una pieza cilíndrica.
j. Países de Europa.
34
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 31 de Enero de 2003. Segunda parte
1.- Un muestreo de 200 votantes revela la siguiente información referente a tres candidatos
A, B, y C.
28 a favor de A y B;
98 a favor de A o B, pero no de C;
42 a favor de B, pero no A o C;
122 a favor de B o C pero no A;
64 a favor de C pero no A o B;
14 a favor de A y C pero no B.
Se pide número de votantes a favor de los tres candidatos. (0.75)
Solución:
P(ABC) = 8/200.
Número de votantes favorables a los tres candidatos 8
Solución:
Sea Xi =1 si el resultado del lanzamiento del dado i es 4 y 0 en caso contrario.
Xi es una variable de Bernoulli de parámetro p =1/6
120
Sea Y = X
i 1
i . La variable Y sigue una distribución B (200, 1/6) y cuenta el número de
3.- Tres joyeros idénticos tienen cada uno 2 cajones. En el primer joyero los dos cajones
tienen un reloj de oro, en el segundo un reloj de plata y en el tercer joyero un cajón tiene un reloj de
oro y el otro cajón un reloj de plata. Seleccionamos un joyero al azar, abrimos uno de los cajones y
observamos que contiene un reloj de plata.
Encontrar la probabilidad de que en el otro cajón haya un reloj de oro. (1)
Solución:
Sean I, II, y III los tres joyeros.
P (I) = P (II) = P (III) = 1/3
P (oro/I)=1 P (oro/II)=0 P (oro/III)=½ P (plata/I)=0 P (plata /II)=1 P (plata /III)=1/2
Hay que calcular P (III/plata).
Por la fórmula de Bayes
P( plata / III ) P( III )
= =1/3
P( plata / I ) P( I ) P( plata / II ) P( II ) P ( plata / III ) P( III )
35
a. -Calcular P (Z -1.64)
P (-1.96 Z 1.96)
P ( Z > 1)
b. -Hallar z1, z2, z3, z4, z5 en las siguientes ecuaciones:
P (Z > z1) = 0.2266
P (Z < z2) = 0.0314
P (-0.23 < Z < z3) = 0.5722
P (1.15 < Z < z4) = 0.0730
P (-z5 <Z < z5) = 0.9
Solución:
P( Z -1.64) = P( Z 1.64) =0.949 P( -1.96 Z 1.96) =2 P(Z 1.96)-1 = 0.95
P( Z > 1) = 2(1-P(Z 1)) = 0.3172
P (Z > z1) = 0.2266 P (Z z1) = 0.7734 z1 = 0.75
P (Z < z2) = 0.0314 z2 ha de ser negativo P (Z -z2) = 0.9686 - z2= 1.86 z2= -1.86
P (-0.23 < Z < z3) = P (Z < z3) – P (Z < -0.23) = P (Z < z3) – 0.41 =0.5722 . De donde
P (Z < z3) = 0.9822 z3 = 2.10
P (1.15 < Z < z4) = P (Z < z4) – P (Z < 1.15) = P (Z < z4) – 0.87493 = 0.0730. De donde
P (Z < z4) =0.94793 z4 = 1.62
P (-z5 <Z < z5) = 2 P (Z < z5) -1 = 0.9 P (Z < z5) = 0.95 z5 = 1.64
5.- En una muestra de tamaño 100, se ha obtenido una media muestral de 38,283 y una
desviación estándar muestral de 1.25. (0.75)
a. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 2.5?
El 75% al menos por la desigualdad de Chebichev (1- (1/2)2)
b. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 1.5?
Al menos el 30.55% ( 1- (1/1.2)2)
36
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 3 de setiembre de 2003.
Primera parte
1.- La tabla adjunta muestra los diámetros en milímetros de una muestra de 24 bolas de
cojinete manufacturados por una fábrica.
17.38 17.29 17.43 17.40 17.36 17.41 17.35 17.31 17.26 17.37 17.28 17.24
17.33 17.42 17.25 17.34 17.32 17.30 17.39 17.38 17.27 17.32 17.46 17.44
37
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química 3 de setiembre de 2003.
Segunda parte
1.- Un muestreo de 200 votantes revela la siguiente información referente a tres candidatos
A, B, y C.
28 a favor de A y B
98 a favor de A o B, pero no de C
42 a favor de B, pero no A o C
122 a favor de B o C pero no A
64 a favor de C pero no A o B
14 a favor de A y C pero no B
Se pide número de votantes a favor de los tres candidatos. (0.75)
Solución:
P(ABC) = 8/200
Número de votantes favorables a los tres candidatos 8
3.- Tres joyeros idénticos tienen cada uno 3 cajones. En el primer joyero dos cajones tienen
un reloj de oro cada uno, y el otro está vacío, en el segundo, dos cajones tienen un reloj de plata y el
tercer cajón vacío y en el tercer joyero un cajón tiene un reloj de oro otro cajón un reloj de plata y el
otro cajón está vacío. Seleccionamos un joyero al azar, abrimos uno de los cajones y observamos
que contiene un reloj de plata. Encontrar la probabilidad de que al abrir otro cajón encontremos un
reloj de oro. (1)
5.- En una muestra de tamaño 100, se ha obtenido una media muestral de 38,283 y una
desviación estándar muestral de 1.25. (0.75)
c. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 2.5?
d. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 1.5?
38
Examen de Estadística: Segundo de Ingeniería Química: Primera parte 26 de enero de 2004.
1.- Se realiza un experimento para comparar las características de llenado del equipo de
embotellado de dos bodegas diferentes. Para ello se eligen al azar 20 botellas de cada bodega
obteniendo los resultados.
Bodega 1 Bodega 2
755 751 752 753 753 756 754 757 756 755
753 753 754 754 752 756 756 753 754 755
751 753 752 753 753 755 754 754 756 755
752 755 753 750 753 756 756 756 756 756
Suponiendo normalidad e igualdad de varianzas
a) Calcular un intervalo de confianza al 95% para la diferencia de medias (0.5 puntos)
b) ¿Apoyan los datos la afirmación de que ambas bodegas llenan las botellas con el mismo
volumen? Para responder a esta cuestión, plantear el contraste de hipótesis, calcular la
región crítica al nivel 0.05 y el p-valor de la prueba. (1 punto)
c) Calcular la potencia si la diferencia de medias fuera de 10cl. (0.5 puntos)
d) Construir un histograma, un diagrama de tallo-hojas y un diagrama de cajas para cada una
de las dos muestras e interpretar las gráficas. ¿Parece razonable la hipótesis de varianzas
iguales? (1 punto)
e) Contrastar la hipótesis de igualdad de varianzas (1 punto)
f) Con los datos de la bodega 1 contrastar la hipótesis de normalidad es decir
H0: Los datos provienen de una normal
H1: Los datos no provienen de una normal
Calcular el valor del estadístico 2 y el p-valor de la prueba (1punto)
Solución:
a) algunas medidas muestrales
bodega 1 bodega 2
n 20 20
Media 752,75 755,3
Mediana 753 756
Variance 1,56579 1,06316
Desviacion estandard 1,25132 1,0311
Mínimo 750 753
Máximo 755 757
Rango 5 4
Primer cuartil 752 754,5
Tercer cuartil 753 756
Rango intercuartilico 1,0 1,5
Intervalo de confianza para la diferencia de medias asumiendo normalidad y varianzas
iguales y desconocidas
1 1 1 1
( X 1 X 2 ) t Sp 1 2 ( X 1 X 2 ) t Sp
2
, n1 n2 2 n1 n2 2
,n n 2
1 2 n1 n 2
2 ( n 1 1) S 12 ( n 2 1) S 22 = 1,3144
con S p Sp= 1,1465
n1 n 2 2
t0,025,40 = 2,021 t0,025,30 = 2,042 aproximo por el más próximo, la diferencia no es muy
grande
t0.025,38 ≈ t0,025,40 = 2,021
39
Intervalo : -2,55 +/- 0,7326 [-3,283,-1,817] -3,283 ≤ μ1 - μ2 ≤-1,817
b) Test para comparar las medias
Ho: μ1 = μ2
H1: μ1 ≠ μ2
X1 X 2
El estadístico usado para el contraste es T0
1 1
sp
n1 n 2
Región crítica : |T0|>tn1+n2-2,/2 |T0|> 2,021
Para nuestros datos t0 = -7,0334 que cae dentro de la región crítica, es decir rechazamos la
hipótesis de igualdad de medias.
P-valor < 0,001 ya que éste viene expresado
P(|T38| > 7,0334) = 2 x P(T38 > 7,0334) ≈ 2 x P(T40 > 7,0334) < 2 x P(T40 > 3,551) = 2 x
0,0005 = 0,001
Este p-valor tan pequeño nos asegura de nuevo que los datos no están de acuerdo con la
hipòtesis nula de igualdad en el volumen de llenado.
Si miramos al intervalo de confianza calculado para la diferencia de medias, vemos que el 0
no está en este intervalo, lo que es otro punto que refuerza el rechazo de la hipótesis nula.
c) Potencia en el punto 10
P(10) = P(rechazar H0 / μ1-μ2 = 10) = P(|T0| >2,021/ μ1-μ2 = 10) =
X1 X 2 X1 X 2
P( > 2,021 / μ1-μ2 = 10) + P( < -2,021 / μ1-μ2 = 10) =
1 1 1 1
sp sp
n1 n2 n1 n2
X 1 X 2 10 10
P( > 2,021 - / μ1-μ2 = 10) +
0,3625 0,3625
X 1 X 2 10 10
P( < -2,021 - / μ1-μ2 = 10) = P(T38 > -25,56) + P( T38 < -29,60) ≈ 1
0,3625 0,3625
d) Diagramas de tallo-hojas
Bodega 1 Bodega2
1 750|0 1 753|0
3 751|00 5 754|0000
7 752|0000 9 755|0000
(9) 753|000000000 (10) 756|0000000000
4 754|00 1 757|0
2 755|00
Tratamos los datos como contínuos, por eso dibujamos un histograma en vez de un
diagrama de barras ya que las medidas estan dadas en ml.
Los cuartiles para el diagrama de cajas ya estan halladas, vamos a calcular los límites
superior e inferior
Bodega 1 Bodega 2
Q1 – 1,5 x RI = 752 – 1,5 = 750,5 Q1 – 1,5 x RI = 754,5 – 1,5 x 1,5 = 752,25
Q3 + 1,5 x RI = 753 + 1,5 = 754,5 Q3 + 1,5 x RI = 756 + 1,5 x 1,5 = 758,25
LI = 750,5 LS = 754,5 LI = 753 LS = 758
40
Histograma Histograma
10 10
8 8
frecuencia
frecuencia
6 6
4 4
2 2
0 0
749 750 751 752 753 754 755 752 753 754 755 756 757
bodega 1 bodega 2
750 751 752 753 754 755 753 754 755 756 757
bodega 1 bodega 2
6
frecuencia
bodega 1
2
bodega 2 6
10
750 752 754 756 758 749 751 753 755 757
bodega 2
Mirando el histograma, los datos de la bodega 1 parecen más dispersos, tienen mayor
varianza y mayor rango; pero si nos fijamos en el diagrama de cajas, el rango de la bodega 1
es menor ya que la caja es bastante más estrecha y presenta 3 datos extremos que quizá sean
los que aumentan su varianza. Ambas variables presentan asimetría a la izquierda, más
marcada en la bodega 2. Por tanto a la vista de los gráficos la hipótesis de varianzas iguales
debería ser contrastada.
e) Comparación de las Varianzas
H0: σ1 = σ2
H1: σ1 ≠ σ2
Se utiliza el estadístico
S12 que bajo H0 tiene una distribución F (n1-1,n2-1)
F0 2
S2
Región crítica {F0>fn1-1,n2-1,/2 }{F0<fn1-1,n2-1,1-/2}
f0,025, 20, 19 = 2,51 f0,025, 15, 19 = 2,62
f0,975, 19, 20 = 1/2,51= 0,398 f0,975, 19, 15 = 1/2,62=0,38
Región crítica {F0 > 2,51 }{F0 < 0,38}
Para nuestros datos f0 = 1,47 que no cae dentro de la región crítica, es decir acepto la
hipótesis nula de igualdad de varianzas.
f) Para hacer el contraste necesitamos una tabla de distribución de frecuencias con la
frecuencia observada y la frecuencia esperada
41
Si suponemos que el volumen de llenado sigue una distribución normal, estimamos su
media y su desviación típica por los valores muestrales, es decir V→ N( 752,75 , 1,2196)
P(X ≤ 750) = P(Z ≤ (750-752,75)/1,2196) = Φ(-2,25) = 1–0,987 = 0,013
0,013 x 20 = 0,26
P(750 < X ≤ 751)=Φ(-1,43)-Φ(-2,25)=0,077–0,013=0,064 0,064 x 20 = 1,28
P(751 < X ≤ 752)=Φ(-0,61)-Φ(-1,43)=0,271–0,077=0,194 0,194 x 20 = 3,98
P(752 < X ≤ 753)=Φ(0,20)-Φ(-0,61)=0,579–0,271=0,308 0,308 x 20 = 6,16
P(753 < X ≤ 754)=Φ(1,02)-Φ(0,20)=0,846–0,579=0,267 0,267 x 20 = 5,34
P(X > 754)=1-Φ(1,02)=1–0,846=0,154 0,154 x 20 = 3,08
Clase Oi Ei (Oi – Ei)2/Ei
X≤170 1 0,26 2,106
750 < X ≤ 751 2 1,28 0,405
751 < X ≤ 752 4 3,98 0,0001
752 < X ≤ 753 9 6,16 1,309
753 < X ≤ 754 2 5,34 2,089
X > 754 2 3,08 0,378
6,287
20 sigue una distribucion chi- cuadrado con 3 (6-2-1) grados de libertad.
x20 = 6,287
P-valor P(23 > 6,287) 0,05 < p-valor < 0,1
Ya que de las tablas obtenemos P(23 > 7,81) = 0,05 P(23 > 6,25) = 0,1
Aceptariamos la hipótesis al nivel 0,05, aunque el valor del estadístico 20 está próximo a la
región de rechazo.
42
Examen de Estadística: Segundo de Ingeniería Química: Segunda parte 26 de enero de 2004.
1.- Dado que no todos los pasajeros de una aerolínea abordan el vuelo para el que han
reservado, la compañía aérea vende 125 billetes para un vuelo de 100 pasajeros. Si la probabilidad
de que un pasajero no aborde el vuelo es de 0,05 y los pasajeros se comportan de forma
independiente unos de otros. Calcular o aproximar (1punto)
a) P (todos los pasajeros aborden el vuelo)
b) P (un vuelo parta vacío)
c) P (100 < nº de pasajeros ≤ 125)
d) P ( nº de pasajeros ≤ 100)
Solución:
Sea X el nº de pasajeros que abordan el vuelo. X → B (125, 0,95)
- P(X = 125) = (0,95)125 = 0,00164
- P(X = 0) = (0,05)125 = 2,35. 10-63 ≈ 0
- X puede ser aproximada por una distribución normal de media 125x0,95 = 118,75 y
varianza 125x0,95x0,05 = 5,9375; desviación estándar 2,437.
100 118,75 125 118,75
P(100 < X ≤ 125) ≈ P Z = Φ(2,5649)-Φ(-7,695) ≈
2,437 2,437
0,99484
- P(X ≤ 100) ≈ P(Z ≤ -7,695) ≈ 0.
2.- Se lanza un dado n veces. Sea p̂ = (1/n) x( nº de veces que ha salido el 1). (0.75 puntos)
a) Calcula la distribución de p̂ .
1
b) ¿Cuantas veces debemos lanzar el dado para P pˆ 0,05 0.95 ?
6
Solución:
- p̂ es el estimador de una proporción y su distribución puede ser aproximada por una
normal de media 1/6 y varianza nx(1/6)x(5/6)
1
pˆ
1 6 0,05 0,05 0,05
- P p̂ 0,05 = P = P Z =2Φ -1 > 0,95.
6 5 5 5 5
36n 36n 36n 36n
0,05 0,05
Despejando Φ > 0,975 . Buscando en las tablas = 1,96
5 5
36n 36n
Resolviendo n = 213,42 y redondeando obtenemos n = 214
43
E 6
Llamemos E a la variable espesor P(E <6) + P(E>14) = P +
E 14 E
P = P 4 = P ( E 4 ) ≤1/16 = 0,0625. Para la cota
hemos utilizado la desigualdad de Chebychev con k = 4.
4.- Los clientes se encargan de evaluar los diseños preliminares de varios productos. Se sabe
que de los productos con éxito en el mercado el 95% recibió buenas evaluaciones, de los productos
con éxito moderado el 60% recibió buenas evaluaciones y de los productos con escaso éxito el 10%
recibió buena evaluación. Además el 40% de los productos han tenido éxito, el 35% éxito
moderado y el 25% baja aceptación. (1punto)
a) Calcular la probabilidad de que un producto obtenga buena evaluación.
b) Si un nuevo diseño de un producto recibe buena evaluación. ¿Cual es la probabilidad de
que el producto alcance éxito en el mercado?
Solución:
Definimos los sucesos
B – Recibir buena evaluación
E – Producto con éxito.
M – Producto con éxito moderado.
F – Producto con escaso éxito.
Los datos suministrados son: P(E) = 0,4 P(M) = 0,35 P(F) = 0,25
P(B/E) = 0,95 P(B/M) = 0,60 P(B/F) = 0,10
- P(B) = P(B/E) P(E) + P(B/M) P(M) + P(B/F) P(F) = 0,615 Regla de la probabilidad total
- P(E/B) = P(B/E) P(E)/ P(B) = 0,618 Fórmula de Bayes.
44
Examen de Estadística Segundo de Ingeniería Química:
Primera parte 13 de setiembre de 2004.
1.- Dada la siguiente tabla, que es una salida proporcionada por statgraphics. Se pide dar una
explicación de toda la información suministrada por esta tabla. (0.5 punto)
Goodness-of-Fit Tests for Col_9
Chi-Square Test
----------------------------------------------------------------------------
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
----------------------------------------------------------------------------
at or below 162,167 8 8,37 0,02
162,167 167,013 11 8,37 0,82
167,013 170,636 13 8,37 2,55
170,636 173,881 2 8,38 4,85
173,881 177,125 11 8,38 0,82
177,125 180,749 8 8,37 0,02
180,749 185,594 7 8,37 0,23
above 185,594 7 8,37 0,23
----------------------------------------------------------------------------
Chi-Square = 9,53741 with 5 d.f. P-Value = 0,0894551
2.- Para controlar el volumen de llenado de una planta embotelladora se toma una muestra
aleatoria de tamaño 20 obteniendose las siguientes medidas en ml
750 746 747 748 748 748 748 749 749 747 746 747 747 748 748
747 750 748 745 748
Suponiendo normalidad
g) Calcular un intervalo de confianza al 95% para la media (0.5 puntos)
h) ¿Apoyan los datos la afirmación de que el volumen medio de llenado es de 750 ml? Para
responder a esta cuestión, plantear el contraste de hipótesis, calcular la región crítica al nivel
0.05 y el p-valor de la prueba. (1 punto)
i) Calcular la potencia si el volumen medio de llenado fuera de 745ml. (0.5 puntos)
j) Construir un histograma, un diagrama de tallo-hojas y un diagrama de cajas para la muestra
e interpretar las gráficas. ¿Parece razonable la hipótesis de normalidad? (1 punto)
k) Contrastar la hipótesis de varianza 1 frente a la alternativa <1 y calcular la potencia para la
varianza 1,4 (1 punto)
l) Contrastar la hipótesis de normalidad. Calcular el valor del estadístico 2 y el p-valor de la
prueba (0.5 punto)
45
Examen de Estadística.Segundo de Ingeniería Química.
Segunda parte 13 de setiembre de 2004.
1.- El tiempo de duración de un ensamble mecánico en una prueba de vibración tiene una
distribución exponencial con media 400 horas. (1.5 punto)
a) ¿ Cual es la probabilidad de que el ensamble falle en la prueba antes de 100 horas ?
b) Si el ensamble lleva probandose 400 horas sin que haya fallado ¿Cuál es la
probabilidad de que falle en las proximas 100 horas ?
c) Si se prueban 100 ensambles ¿ Cual es la probabilidad de que falle al menos uno de
ellos en menos de 100 horas? ¿Aproxima la probabilidad de que fallen 5 o menos
3.- En una muestra de tamaño 25, se ha obtenido una media muestral de 3,5 y una
desviación estándar muestral de 1.25. (1punto)
e. ¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [1, 6]?
f. ¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [-0,25, 7,25]?
46
Examen de Estadística: Segundo de Ingeniería Química: Primera parte
18 de febrero de 2005.
1.- Se han obtenido los siguientes datos del rendimiento de dos catalizadores
Catalizador I: 91.5 94.18 92.18 95.39 91.79 89.07 94.72 89.21
Catalizador II: 89.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75
a) Hacer un diagrama de tallo-hojas para los datos de cada catalizador (0.5 puntos)
b) Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 de cada catalizador y hacer algún comentario
comparando los rendimientos. (0.5 puntos)
c) Realizar una tabla de distribución de frecuencias y un histograma de los rendimientos de cada
catalizador en la misma gráfica. (0.5 puntos)
d) Hacer los diagramas de cajas de los dos rendimientos en la misma gráfica y comentar los
gráficos. (0.5 puntos)
e) Calcular un intervalo de confianza para el cociente de varianzas
Realizar el contraste H0: σ1 = σ2 mediante el cálculo de la región crítica y el p-valor.
H1: σ1σ2
Calcular la potencia en el punto 0.5 (1 punto)
f) Calcular un intervalo de confianza para la diferencia de medias.
Realizar el contraste H0: 1 = 2 mediante el cálculo de la región crítica y el p-valor.
H1: 1< 2
Calcular la potencia en el punto -0.5 (1 punto)
Solución:
Diagrama de tallo-hojas
Catalizador I Catalizador II
2 89|02 1 89|1
2 90| 3 90|49
4 91|57 4 91|0
4 92|1 4 92|7
3 93| 3 93|2
3 94|17 2 94|
1 95|3 2 95|
2 96|
2 97|01
Percentiles
Catalizador I Catalizador II
Los percentiles del segundo catalizador, están por encima de los percentiles del primero,
indicando que quizá el rendimiento sea mayor; pero la mediana es mayor en el catalizador I. Los
percentiles no son simétricos respecto de la mediana en ninguno de los dos catalizadores, la
asimetría está más marcada en el segundo catalizador.
47
Tabla de distribución de frecuencias
Catalizador I
--------------------------------------------------------------------------------
Límite Límite Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Marca Frecuencia Relativa Acumulada Rel. Acu.
--------------------------------------------------------------------------------
Menor o igual 89,0 0 0,0000 0 0,0000
1 89,0 92,0 90,5 4 0,5000 4 0,5000
2 92,0 95,0 93,5 3 0,3750 7 0,8750
3 95,0 98,0 96,5 1 0,1250 8 1,0000
Mayor 98,0 0 0,0000 8 1,0000
--------------------------------------------------------------------------------
Media = 92,255 Desviación estándar = 2,38502
Catalizador II
--------------------------------------------------------------------------------
Límite Límite Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Marca Frecuencia Relativa Acumulada Rel. Acu.
--------------------------------------------------------------------------------
Menor o igual 89,0 0 0,0000 0 0,0000
1 89,0 92,0 90,5 4 0,5000 4 0,5000
2 92,0 95,0 93,5 2 0,2500 6 0,7500
3 95,0 98,0 96,5 2 0,2500 8 1,0000
Mayor 98,0 0 0,0000 8 1,0000
--------------------------------------------------------------------------------
Media = 92,7325 Desviación estándar = 2,98345
Histograma
catalizador I
4
2
Frecuencia
4
89 91 93 95 97 99
catalizador II
Diagrama de cajas:
Catalizador I Catalizador II
RI= 94.45 – 90.35 = 4.10 RI= 95.125 – 90.70 = 4.425
Q1 – 4.10 x1.5 = 84,2 Q1 – 4.425 x1.5 = 84,06
Q3 + 4.10 x1.5 = 100.65 Q3 + 4.425 x1.5 = 101.76
LI = 89,07 LI = 89,18
LS= 95.39 LS= 97.19
48
Diagrama de cajas
Catalizador I
Catalizador II
89 91 93 95 97 99
Las medianas son similares en los dos catalizadores. Ambos catalizadores presentan asimetría a la
derecha. El catalizador II presenta mayor dispersión y mayor asimetría hacia la derecha.
Cociente de varianzas:
Intervalo de confianza
Catalizador I Catalizador II
------------------------------------------------------------
n 8 8
Media 92,255 92,7325
Mediana 91,985 91,91
Varianza 5,68831 8,90099
Desviación Estándar 2,38502 2,98345
Mínimo 89,07 89,19
Máximo 95,39 97,19
Rango 6,32 8,0
Primer Cuartil 90,355 90,705
Tercer Cuartil 94,45 95,125
Rango Intercuartílico 4,095 4,42
------------------------------------------------------------
Radio de varianzas = 0,639065 f0.025,7,7 = 4.99 f0.975,7,7 = 0.2
Intervalo de confianza [0,127943; 3,19207]
Contraste de hipótesis:
Región crítica {F0< 0.2 } Ụ {F0 >4.99 } f0 = 0.63 no está en la región crítica aceptamos igualdad de
varianzas.
P-valor P(F7,7 >0.63)
De las tablas P(F7,7 >1,7) = 0.25 P(F7,7 >0,58) = 0.75
0.25 < p-valor < 0.75 Apoya nuestra decisión de aceptar la hipótesis nula.
Null hypothesis: sigma1 = sigma2
Alt. hypothesis: sigma1 NE sigma2
F = 0,639065 P-value = 0,569131
Potencia
P(0.5) = P(RC/(σ1/ σ2) = 0.5) = P (F0 < 0.2 /(σ1/ σ2) = 0.5) + P (F0 > 4.99 /(σ1/ σ2) = 0.5) = P(F7,7 <
0.2/0.25) + P(F7,7 > 4.99/0.25) = P(F7,7 < 0.8) +P(F7,7 >19.96)
De las tablas P(F7,7 > 6,99) = 0.01 P(F7,7 > 19,96) < 0.01
P(F7,7 > 1,7) = 0.25 luego P(F7,7 > 1/1,7) = 0,75 P(F7,7 > 0,58) = 0,75
P(F7,7 < 0,58) = 0.25 De donde P(F7,7 < 0.8) > P(F7,7 < 0,58) = 0.25
P(0,5) > 0,25
49
Diferencia de medias: - 0.4775 t14,0.025 = 1,746
Intervalo de confianza asumiendo varianzas iguales S p = 2.67
-0,4775 +/- 2,89639
[-3,37389,2,41889]
Contraste de hipótesis
Región crítica {T0 <-1.746} t0 = - 0.23 no está en la región crítica luego que la primera media es
mayor o igual que la segunda
p-valor P(T14 < -0.23) = P(T14 > 0.23) > P(T14 >0.25) = 0.4
3.- En las siguientes preguntas elige la respuesta justificando la opción elegida (1 punto)
1. Si la probabilidad de error de tipo I de un contraste bilateral es de 0'02, entonces
a) La probabilidad de cometer un error de tipo II es del 0'98.
b) Se rechaza H0 para todo nivel de significación superior a 0'01.
c) Se aceptará H0 el 98% de las veces.
xd) Ninguna de las otras respuestas.
2.- Se denomina “nivel de significación” de un test de hipótesis
xa) A la probabilidad de rechazar H0 cuando H0 es cierto.
b) A la probabilidad de aceptar H0 cuando H0 es cierto.
c) A la probabilidad de rechazar H0 cuando H0 es falso.
d) A la probabilidad de aceptar H0 cuando H0 es falso.
3.- Un test de hipótesis es “estadísticamente significativo” si
a) La hipótesis nula es correcta.
b) La hipótesis nula es incorrecta.
xc) Si el estadístico del contraste cae en la región de aceptación.
d) Ninguna de las otras tres respuestas.
50
4.- En la Figura., se representan los residuos de un modelo de regresión frente al
número de orden. De él se deduce
Residual Plot
Studentized residual
-1
-2
0 10 20 30 40 50 60
row number
a) Que sería mejor hacer un ajuste parabólico.
b) Que los residuos no son normales.
c) Que no se ha tenido en cuenta una variable de clasificación.
xd) Que los datos son heterocedásticos.
5.- Del siguiente contraste se deduce
a) De la aplicación de este contraste no podemos obtener una conclusión
acerca de la hipótesis.
xb) El p-valor del contraste nos dice que podemos rechazar la hipótesis.
c) El resultado del contraste es 42,9108 y se acepta la hipótesis.
d) Ninguna de las otras tres respuestas.
Analysis Summary Data variable: lanzamientos
53 values ranging from 1,0 to 8,0
Fitted geometric distribution: event probability = 0,321212
Goodness-of-Fit Tests for lanzamientos
Chi-Square Test
----------------------------------------------------------------------------
Frecuencia Frecuencia
clase valor observada esperada Chi-Square
---------------------------------------------------------------------------
1 0 0 17,02 17,02
2 1 25 11,56 15,64
3 2 11 7,84 1,27
4 3 11 5,32 6,05
5 4 3 3,61 0,10
6 5 1 2,45 0,86
7 6, 7 1 2,80 1,15
8 >8 1 2,39 0,81
----------------------------------------------------------------------------
Chi-Square = 42,9108 with 6 d.f. P-Value = 1,2148E-7
51
Examen de Estadística: Segundo de Ingeniería Química: Segunda parte
18 de febrero de 2005.
1.- El peso de un caramelo tiene una distribución normal de media 5 gr. Y desviación
estándar 0,25gr. Se empaquetan de 16 en 16 Calcular la media y la desviación estándar del paquete,
así como la probabilidad de que su peso sea mayor de 85 gr. (1punto)
Solución: El peso total es la suma de los pesos de los 16 caramelos
P = X1 + X2 + … + X16 E(P) = 16x5 =80 gr. Var (P)= 16x 0.52 = 1 gr2
La variable peso sigue una distribución normal de media 80 y desviación estándar 1.
P 80 85 80
P (P > 85) = P P( Z 5) 0
1 1
52
P (Y/C) = 10 x 0,1x 0.89 = 0,1342
P (Y) = 0,2316 x 0,.4 + 0,1158 x 0,2,+ 0,134 x 0,4 = 0.1695
3.- En un libro de 400 páginas, el número de erratas de cada página sigue una distribución G
(0.05) Aproximar la probabilidad de que el número total de erratas del libro esté comprendido entre
375 y 410. (1punto)
Solución:
El número total de erratas, N, es la suma de las erratas de cada página
Sea Xi el número de erratas de la página i
E (Xi) = 0,95/0,05 = 19 Var (Xi) = 0,95/(0,05)2 = 380
E (N) = 400x19 = 7600 Var (N) = 400x380 = 152000 Desviación estándar = 389,87
N es la suma de 400 variables independientes e igualmente distribuidas, aplicando el teorema
central del límite
375 7600 410 7600
P (375 N 410) P Z P( Z 18,44) P( Z 18,53) 0
389,87 389,87
4.- La Distribución beta es una distribución de una variable aleatoria X continua. Con los
datos de las siguientes salidas responder a las preguntas (1punto)
P(X<0.1)
P(0.1<X < 0.2)
P(X>0.5)
Mediana de la distribución
Primer cuartil
Tercer cuartil
Inverse CDF
-----------
Distribution: Beta
CDF Dist. 1
0,01 0,0267632
0,1 0,0925953
0,25 0,161163
0,5 0,26445
0,75 0,38948
0,9 0,510316
0,99 0,705686
Cumulative Distribution
-----------------------
Distribution: Beta
Lower Tail Area (<) Probability Density Upper Tail Area (>)
Variable Dist. 1 Dist. 1 Dist. 1
0,1 0,114265 1,9683 0,885735
0,2 0,34464 2,4576 0,65536
0,3 0,579824 2,1609 0,420176
0,4 0,766719 1,5552 0,233281
0,5 0,890624 0,9375 0,109376
Solución
P(X< 0.1) = 0,114265
P (0.1<X < 0.2) = P(X<0.2)-P(X<0.1) = 0,34464 – 0,114265 = 0,230375 por ser la distribución
continua
P(X>0.5) = 0,109376
Mediana de la distribución 0,26445 inversa de la función de distribución en 0,5
Primer cuartil 0,161163 inversa de la función de distribución en 0,25
Tercer cuartil 0,38948 inversa de la función de distribución en 0,75
53
Examen de Estadística: Segundo de Ingeniería Química: Primera parte
13 de setiembre de 2005.
1.- Un ingeniero que trabaja para un fabricante de llantas investiga la duración promedio de
un compuesto nuevo de caucho. Para ello toma una muestra de 16 llantas y las prueba en la
carretera hasta alcanzar el fin de la vida útil de estas. Los datos obtenidos en kms. Son los
siguientes
60613 59836 59554 60252 59784 60221
60311 59040 60545 60257 60000 59997
60947 60135 60220 60523
a) Hacer un diagrama de tallo-hojas para los datos (0.5 puntos)
b) Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 (0.5 puntos)
c) Realizar una tabla de distribución de frecuencias, un histograma, un diagrama de cajas de
la duración y comentar los gráficos (0.5 puntos)
d) Realizar el contraste de normalidad (0.5 puntos)
e) Calcular un intervalo de confianza para la duración media de la llanta.(2 puntos)
Calcular un intervalo de confianza para la varianza.
Al ingeniero le gustaría demostrar que la duración media excede los 60000kms. Proponer y
contrastar la hipótesis adecuada y obtener una conclusión.).
Calcular la potencia en el punto 61000
Si la duración media fuese de 61000 Kms al ingeniero le gustaría detectarla con una
probabilidad de al menos 0.90. ¿Es adecuado el tamaño muestral tomado? En caso negativo
determinar el tamaño muestral
3.- En las siguientes preguntas elige la respuesta justificando la opción elegida (1 punto)
1. Hipótesis estadística
a) Una afirmación sobre la distribución de una población o poblaciones.
b) Estamos dispuestos a aceptarla a no ser que los datos digan locontrario
c) La hipótesis nula es una afirmación sobre la distribución de la muestra.
d) Ninguna de las otras respuestas.
2.- Errores
a) Error de tipo I es la prob. de rechazar Ho cuando es cierta
b) Error de tipo II es la prob. de aceptar Ho cuando es cierta .
c) Potencia es la prob. de rechazar Ho cuando es cierta.
d) Ninguna de las otras respuestas.
3.- Región crítica
a) Si el parámetro estimado cae dentro de la región crítica aceptamos Ho
b) Si el parámetro estimado cae dentro de la región crítica rechazamos Ho
c) La región crítica cambia con la muestra
d) Ninguna de las otras tres respuestas.
54
4.-Distribuciones en el muestreo
a) La distribución de la media muestral es una normal
b) La distribución de la media muestral es una T
c) La distribución de la varianza muestral es una 2
d) Ninguna de las otras tres respuestas.
1.- Un ensamble está compuesto por 5 componentes colocados uno junto al otro. La longitud
de cada componente se distribuye normalmente con media 2 cm. y desviación típica 0.02 cm. Las
especificaciones requieren que todos los ensambles tengan una longitud entre 9.9 y 10.1 cm.
¿Cuántos ensambles verificarán estos requerimientos? (1 punto)
2.- En una factoría se producen piezas que se empaquetan en tres tipos diferentes de cajas
con 20 unidades cada una en proporción 4, 3, 6. Las cajas de tipo I contienen 3 unidades
defectuosas, las de tipo II, 5 defectuosas y las de tipo III, 6 defectuosas. Se elige una caja al azar y
se extraen 3 unidades resultando una de ellas defectuosa y 2 buenas. ¿Qué tipo de caja tiene mayor
probabilidad de ser la elegida? (1punto)
55
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química
10 de febrero de 2006. Primera parte
1.- Se llevó a cabo un estudio para determinar la relación entre el número de años de
experiencia y el salario mensual, en euros, entre los ingenieros químicos de Castilla y
León. Se seleccionó una muestra aleatoria de 17 ingenieros químicos y se obtuvo la siguiente
información
xi 247 yi 29902 xi2 5065 yi2 52330680
x y i i 483750 e 2
i 434772
Con los datos del Problema. Responde verdadero o falso justificando las respuestas
1) 0.5 puntos
a) ̂1 43,22
b) ̂1 1072
c) ̂ 0 43,22
d) ̂ 0 1072
2) 0.25 puntos
a) Como t = 12,56 la variable años de experiencia es significativa
b) Como t = 17,53, tendremos dudas acerca de la influencia de la variable años de
experiencia.
c) Como t = 17,53 la variable años de experiencia es significativa
b) Como t = 12,56, tendremos dudas acerca de la influencia de la variable años de
experiencia.
3) la predicción de salario para un ingeniero químico con diez años de experiencia es 0.25
puntos
a) 1162,2
b) 1504.2
c) 1723.2
d) 1389
4) Responde verdadero o falso justificando 1 punto
a) La variación no explicada es 434772
b) La variación total es 49440272
c) El coeficiente R-cuadrado es 0.99
d) El valor del estadístico F es 2314,5
e) Un I.C. al 95% para la pendiente es (35,89 50,55)
56
2.- Se está estudiando el tiempo transcurrido entre dos intentos de introducir un virus
informático via e-mail en el sistema informático de una empresa. Se han observado los tiempos (en
cientos de horas) desde el comienzo de año para los primeros veinte intentos obteniendo los
resultados expuestos en la tabla adjunta. 1punto
3.- Dos máquinas A y B fabrican la misma pieza, con una producción aceptable del 70% y
80% respectivamente. Del total de la producción el 40\% corresponde a la màquina A y el resto a la
B. Se elige una pieza al azar y resulta no ser aceptable. Calcular la probabilidad de que haya sido
producida por cada una de las dos máquinas. 1 punto
Pureza ( %) 86,91 89,85 90,28 86,34 92,58 87,33 86,29 91,86 95,61 89,86
96,73 99,42 98,66 96,07 93,65 87,31 95 96,85 85,2 90,56
57
EXAMEN DE ESTADÍSTICA: 2º de Ingeniería Química
10 de febrero de 2006. Segunda parte
1.- Sea X una variable con las siguientes características: E(X)=5, E(X2)=29
Determinar una cota inferior de P (2X 8) 0.5 puntos
Si la variable tiene una distribución uniforme en el intervalo (a, b), Hallar P (2X 8) 0.5 p.
HI|14,0
Calcular los cuartiles y percentiles 40 y 60
58
Examen de Estadística: Segundo de Ingeniería Química
15 de setiembre de 2006.
Apellidos Nombre
Entregar con el examen
1.- Un biólogo ha tomado una muestra de tortugas y ha medido su longitud y su anchura
obteniendo los siguientes diagramas de tallo-hojas
longitud: 1|2 representa 12,0 anchura: 1|2 representa 12,0
2 9|34
3 9|6 1 7|4
7 10|1234 2 7|8
9 10|67 8 8|012334
12 11|234 (5) 8|56899
12 11|6779 11 9|001333
8 12|001 5 9|5556
5 12|578 1 10|
2 13|1 1 10|6
1 13|5
Se pide
a) Tamaño muestral
b) Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 (0.5)
c) Realizar una tabla de distribución de frecuencias, un histograma, un diagrama de cajas de la
longitud y comentar los gráficos (1.5)
d) Realizar el contraste de normalidad de la longitud (0.5)
e) Calcular un intervalo de confianza para la longitud media de la longitud.(0.25)
f) Calcular un intervalo de confianza para la varianza. (0.25)
g) Al ingeniero le gustaría demostrar que la longitud media excede los 100 cms.
Proponer y contrastar la hipótesis adecuada y obtener una conclusión.). (0.5)
h) Calcular la potencia en el punto 95 (0.5)
Análisis de regresión
Variable dependiente: longitud
Variable independiente: anchura
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -26,2686 9,83848 -2,66998 0,0140
Slope 1,58162 0,11109 14,2372 0,0000
Análisis de la varianza
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 2879,14 1 2879,14 202,70 0,0000
Residual 312,489 22 14,2041
--------------------------------------------------------------------------------
Total (Corr.) 3191,63 23
Coeficiente correlación = 0,949785
R-cuadrado = 90,2091 percent
R-cuadrado (adjusted for d.f.) = 89,764 percent
Standard Error of Est. = 3,76883
j)Explicar todo lo que aparece en las tablas de regresión y hacer el contraste de la regresión (2)
(Da la vuelta a la hoja)
59
2.- Explica brevemente (2)
1. Hipótesis estadística
2. Error de tipo I
3. Error de tipo II
4. Potencia
5. Región crítica
6. Relación entre región crítica y muestra
7.-Distribución en el muestreo
8. p-valor
9. Muestra
10. Población
11. Estadístico
12. Fórmula de Bayes
13. Fórmula de la probabilidad total
14. Fórmula producto
15. Parámetro poblacional
16. Parámetro muestral
17. Estimador de un parámetro
18. Estadístico utilizado en el contraste de varianzas
19. Relación entre p-valor y muestra
20. Gráficos utilizados en la descripción de datos categóricos.
4.- De un proceso químico se toman cada hora una muestra de 60 partes. Lo común es que el
1% de las partes requieran volver a ser procesadas. Sea X el número de partes de una muestra de
60 que necesitan ser reprocesadas. Se sospecha de un problema en el proceso si X es mayor que
su media por tres desviaciones estándar. (1)
d. Calcular la probabilidad de que se sospeche de la existencia de un problema.
e. Si el porcentaje de partes que necesita reprocesarse es de 5%. Calcular la probabilidad de X
sea mayor que 1.
f. Calcular la probabilidad de que X sea mayor que 1 en al menos una de las muestras tomadas
en las próximas 5 horas.
60
Examen de prácticas: Estadística. Segundo de Ingeniería Química
12 de febrero de 2007
61
3.- Trabajar con la variable altura en el grupo de hombres:
Estimador de la media 179,923 Estimador de la desviación estándar 4,95518
Cotas de confianza para la media y la desviación estándar para = 0,01; 0,05; 0,1
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores
confianza Error
1cm. 2cm. 3cm
90% 42 12 6
95 % 69 19 10
99 % 136 37 18
Explicar los resultados: Las cotas superiores crecen con el nivel de confianza; las cotas interiores
decrecen. A igual confianza, los tamaños muestrales decrecen al aumentar el error. A igual error los
tamaños muestrales crecen al aumentar la confianza
62
Examen de Estadística: Segundo de Ingeniería Química. 12 de febrero de 2007
Los datos siguientes muestran la salida de CD de un generador de viento (y) y la velocidad
del viento(x).
Velocidad viento(mph) Salida deCD Velocidad viento Salida de CD
5 1,582 3,05 0,558
6 1,822 8,15 2,166
3,4 1,057 6,2 1,866
2,7 0,5 2,9 0,653
10 2,236 6,35 1,930
9,7 2,386 4,6 1,562
9,55 2,294 5,8 1,737
7,4 2,088 9,1 2,303
3,6 1,137 10,2 2,31
7,85 2,179 4,1 1,194
8,8 2,112 3,95 1,144
7 1,8 2,45 0,123
5,45 1,501
1.- Calcular el valor de los estadísticos habituales para la variable velocidad del viento,
Media, varianza, desviación estándar, máximo, mínimo, rango, mediana, cuartiles y rango
intercuartílico.(0.5)
n = 25
Media = 6,132
Mediana = 6,0
Varianza = 6,3981
Desviación estándar = 2,52945
Mínimo = 2,45
Máximo = 10,2
Rango = 7,75
Primer cuartil = 3,95
Tercer cuartil = 8,15
Rango intercuartílico = 4,2
2.- (1)
Dibujar un diagrama de tallo-hojas
1|2 representa 1,2
3 2|479
7 3|0469
9 4|16
12 5|048
(3) 6|023
10 7|048
7 8|18
5 9|157
2 10|02
Dibujar un histograma
63
Histogram
6
5
frequency
4
3
2
1
0
0 2 4 6 8 10 12
velocidadv
Tabla de distribución de frecuencias
--------------------------------------------------------------------------------
Límite Limite frecuencia frecuencia frecuencia
Clase Inferior Superior Marca frecuencia relativa acumulada relat. Acu.
--------------------------------------------------------------------------------
Menor o igual 2,4 0 0,0000 0 0,0000
1 2,4 3,7 3,05 6 0,2400 6 0,2400
2 3,7 5,0 4,35 4 0,1600 10 0,4000
3 5,0 6,3 5,65 4 0,1600 14 0,5600
4 6,3 7,6 6,95 3 0,1200 17 0,6800
5 7,6 8,9 8,25 3 0,1200 20 0,8000
6 8,9 10,2 9,55 5 0,2000 25 1,0000
Mayor 10,2 0 0,0000 25 1,0000
--------------------------------------------------------------------------------
Dibujar un diagrama de cajas.
Box-and-Whisker Plot
0 2 4 6 8 10 12
velocidadv
Media = 6,132 Mediana = 6,0 Mínimo = 2,45 Máximo = 10,2
Primer cuartil = 3,95 Tercer cuartil = 8,15 Rango intercuartílico = 4,2
3,95- 1,5x4,2 = -2,35 8,15 + 1,5x4,2=14,45 LS = 10,2 LI= 2,45
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
Del gráfico del histograma se desprende que los datos no se parecen a la distribución
normal, no se aprecia asimetría. En el diagrama de cajas se ve que los datos son bastante
simétricos, la media es casi igual a la mediana y los cuartiles son casi simétricos respecto a
la mediana. No se aprecian datos atípicos.
Contraste de normalidad.Explica la tabla, el gráfico y da el resultado del contraste
(0.5)
64
Plot Probabilistico Normal
99,9
99
acumulada
95
80
50
20
5
1
0,1
0 2 4 6 8 10 12
velocidadv
Goodness-of-Fit Tests for velocidadv
Lower Limit Upper Limit Observed Frequency Expected Frequency Chi-Square
at or below 3,68495 6 4,17 0,81
3,68495 5,04249 4 4,17 0,01
5,04249 6,132 3 4,17 0,33
6,132 7,22151 3 4,17 0,33
7,22151 8,57905 3 4,17 0,33
above 8,57905 6 4,17 0,81
Chi-Square = 2,60011 with 3 d.f. P-Value = 0,457466
3.- (0.75)
Calcula un intervalo de confianza para la media al 95%.
Como la varianza es desconocida el estadístico utilizado es una T con 24 grados de libertad
s
T24,0,025 = 2,064 El intervalo es X t 24, 0, 025 6,132 1,04411 [5,08789;7,17611]
25
Calcula el tamaño muestral necesario para estimar la media con un error de 0,75 mph.
El error cometido viene dado por s t 24,0,025 2,53 2,064 0,75 n = 49
n n
65
4.- (0.75)
Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0: =6 H1: >6
6,132 6
Calculamos el valor del estadístico T X 0 t0 0,26
0
s 2,53
n 25
p-valor P(T24 >0,26)≈ 0,4 ya que P(T24 >0,256)= 0,4. En cualquier caso
0,25<p-valor<0,4
Es decir aceptamos la hipótesis nula de que la media es 6
Región crítica {T0 > 1,711} ya que t24,0,05= 1,711 en términos de la media
muestral X 6,865
Ni t0, ni la media muestral están en la región crítica por lo que aceptamos la hipótesis nula.
Calcula la potencia en el punto 6,5
X 6
P (6,5) P (T0 1,711 / 6,5) P ( 1,711 / 6,5)
s/ n
X 6,5 6,5 6 X 6,5 0,5
P( 1,711 / 6,5) P ( 1,711 / 6,5) P(T24 0,72)
s/ n s/ n s/ n 2,53 / 25
0,1 < P (T24 > 0,72) < 0,25
Por lo tanto 0,1< P (6,5) < 0,25
5.-
De las siguientes tablas del análisis de regresión Rellenar huecos (0.5)
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: salidaCD
Independent variable: velocidadv
Parameter Estimate Error Standard T Statistic P-Value
Intercept 0,130875 0,125989 1,039 [0,2; 0,5]
Slope 0,241149 0,0190492 12,66 0
0,130875/0,125989 = 1,039 P(|T23| > 1,039) = 2x P(T23 > 1,039) 0,2 < p-valor < 0,5
0,241149 / 0,0190492 =12,66 P(|T23| > 12,66) = 2x P(T23 > 12,66) ≈ 0
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 8,92961 1 8,92961 160,254 0
Residual 1,28 23 0,0557
Total (Corr.) 10,2112 24
VNE = VT- VE = 10,2112 – 8,92961 = 1,28
S2R= VNE/(n-2) = 1,28/23 = 0,0557
F = VE/(VNE/n-2) = 8,92961/0,0557=160,254
p-valor = P(F1,23 >160,254) ≈ 0
Calcular R-cuadrado, r, error estándar de la regresión.
R-cuadrado = VE/VT = 8,92961/10,2112 = 0,87449
r = √R-cuadrado = 0,935
SR = √0,0557 = 0,236
66
En el contraste de la pendiente el valor del estadístico es 12,66 y el p-valor 0 por lo que
rechazamos la hipótesis nula de que la pendiente es 0 y por tanto existe relación lineal.
El contraste F tenemos un valor del estadístico de 160,254 y un p-valor 0 por lo que
rechazamos la hipótesis nula de que no hay relación entre las variables
Intervalo de confianza para la pendiente al 95% (0.25)
bˆ t 0, 025, 23 s b 0,2411 2,069 x 0,019 0,21 ; 0,28
Ecuación de la recta de regresión.(0.25)
salidaCD = 0,130875 +0,241149 x velocidadv
Comentar los siguientes gráficos y tablas del análisis de los residuos (0.5)
4,7 99,9
99
percentage
2,7 95
80
0,7 50
20
-1,3 5
1
-3,3 0,1
0 5 10 15 20 25 -0,6 -0,4 -0,2 0 0,2 0,4
row number RESIDUALS
8
frequency
0
-0,6 -0,4 -0,2 0 0,2 0,4
-0,8 -0,5 -0,2 0,1 0,4 0,7
RESIDUALS RESIDUALS
En el plot de los residuos no se aprecia ninguna pauta que nos haga pensar que no son aleatorios.
En el plot Probabilístico normal no parece muy claro que los residuos estén alineados. Haría falta
comprobar la normalidad por otros medios. En el diagrama de cajas se aprecia una asimetría
bastante marcada a la izquierda, lo mismo en el histograma. Por lo que faltaría comprobar que los
residuos son normales mediante el contraste chi cuadrado.
6.- (0.5)
Con ayuda de las tablas calcula
67
P( 2,06 < F10,15 < 3,8) = P( F10,15 < 3,8) - P( F10,15 < 2,06) =
P( F10,15 > 2,06) - P( F10,15 > 3,8) = 0,1 – 0,01 = 0,09
P( 0,263 < F15,10 < 0,485) = P( F15,10 < 0,485) - P(F15,10 < 0,263) =
P( F10,15 >1/0,485) - P(F10,15 >1/ 0,263) = P( F10,15 >2,06) - P(F10,15 >3,8) = 0,09
P( 1,325 < T20 < 2,845) = P(T20 < 2,845)- P(T20 < 1,325) = P(T20 > 1,325) - P(T20 > 2,845)
= 0,1-0,005 = 0,095
P(T20 < z) = 0,025 z es negativo P(T20 > -z) = 0,025 -z = 2,086 z =- 2,086
7.- (0.75)
La irregularidad del corte de productos de papel depende del grado de uso de las cuchillas.
Si las cuchillas son nuevas el 1% de los productos presentan un corte irregular; si las cuchillas
tienen un uso medio, el 3% de los cortes presentan irregularidades; si las cuchillas están
desgastadas, el 10% de los cortes son defectuosos. Si se conoce que de las cuchillas utilizadas en el
proceso de corte, el 10% son nuevas y el 60% tienen un uso medio.
Calcular la proporción de productos con cortes irregulares.
Sea N el suceso, cuchilla nueva; M, cuchilla de uso medio y D, cuchilla desgastada.
Sea I el suceso el corte es irregular.
Por los datos del problema P(N) = 0,1 P(M) = 0,6 P(D) = 0,3 P(I/N) = 0,01 P(I/M) =
0,03 P(I/D) = 0,1; aplicando la fórmula de la probabilidad total
P(I) = P(I/N) P(N) + P(I/M) P(M) + P(I/D) P(D) = 10-3 + 18x10-3 + 3x10-2 = 49x10-3
Proporción de productos con cortes irregulares 4,9 %
8.-
El peso de una zapatilla deportiva tiene una media de 250 g. y una desviación estándar de
5g.(0.75)
Acotar la probabilidad de que el peso esté comprendido entre 235 y 265 g.
Llamamos X a la variable peso de la zapatilla
P ( 235 <X < 265) = P( 235-250 <X-250 < 265-250) = P( -15 <X- < 15) = P(|X-| < 3x5) = P(|X-
| < 3σ) 1- (1/9) =8/9 = 0,88
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de
zapatillas cuyo peso no está comprendido entre los valores anteriores sea menor que10. Tomar
como valor de p la cota calculada anteriormente.
P(X 235) + P(X 265) 0,12
El número de zapatillas con peso fuera del intervalo anterior sigue una distribución B(100; 0,12).
Sea Y esta variable E (Y) = 12 var (Y) = 10,56 var(Y ) 3,25 . Aproximamos por una normal
Y _ 12 10 12
P (Y 10) P ( ) P ( Z 0,85) 1 P ( Z 0,85) 0,198
3,25 3,25
68
Examen de Estadística: Segundo de Ingeniería Química. 6 de setiembre de 2007
Nombre Apellidos
Los datos siguientes muestran el índice de refracción y la densidad de 12 trozos de cristal
Índice de refracción densidad
1,514 2,480
1,515 2,482
1,516 2,481
1,517 2,490
1,518 2,483
1,520 2,505
1,516 2,484
1,517 2,486
1,518 2,495
1,519 2,498
1,522 2,511
1,525 2,520
1.- Calcular el valor de los estadísticos habituales para la variable índice de refracción.
Media, varianza, desviación estándar, máximo, mínimo, rango, mediana, cuartiles y rango
intercuartílico. (0.5)
2.- (1)
Tabla de distribución de frecuencias y dibujar un diagrama de tallo-hojas, un histograma y
un diagrama de cajas para ambas variables
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
Contrastar la normalidad de la variable índice de refracción
3.- (0.75)
Calcula un intervalo de confianza para la media del índice de refracción al 95%.
Calcula el tamaño muestral necesario para estimar la media con un error de 0,05.
4.- (0.75)
Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0: = 1,5 H1: >1,5
Calcula la potencia en el punto 1,4
5.- De las siguientes tablas del análisis de regresión Rellenar huecos (0.5)
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: densidad
Independent variable: indicerefra
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
Intercept -3,68673 -6,2112 0,0001
Slope 4,07069 10,4111 0,0000
Analysis of Variance
69
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 0,00173852 1 0,00173852 0,0000
Residual 10 - - -
Total (Corr.) 0,00189892
Correlation Coefficient =
R-squared =
Standard Error of Est. =
Contraste de la regresión (los dos) (0.5)
Intervalo de confianza para la pendiente al 95% (0.25)
Ecuación de la recta de regresión.(0.25)
Comentar los siguientes gráficos y tablas del análisis de los residuos (0.5)
Residual Plot Normal Probability Plot
Studentized residual
4,1 99,9
99
percentage
2,1 95
80
0,1 50
20
5
-1,9
1
0,1
-3,9
-10 -7 -4 -1 2 5
0 2 4 6 8 10 12 (X 0,001)
RESIDUALS
row number
6
frequency
0
-10 -7 -4 -1 2 5 -11 -7 -3 1 5
(X 0,001) (X 0,001)
RESIDUALS RESIDUALS
70
si las cuchillas tienen un uso medio, el 5% de los cortes presentan irregularidades; si las
cuchillas están desgastadas, el 20% de los cortes son defectuosos. Si se conoce que de las
cuchillas utilizadas en el proceso de corte, el 10% son nuevas y el 60% tienen un uso medio.
Calcular la proporción de productos con cortes irregulares.
8.- El peso de una zapatilla deportiva tiene una media de 220 g. y una desviación estándar de
10g.(0.75)
Acotar la probabilidad de que el peso esté comprendido entre 205 y 235 g.
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de
zapatillas cuyo peso no está comprendido entre los valores anteriores sea menor que10.
Tomar como valor de p la cota calculada anteriormente.
71
Examen de prácticas: Estadística. Segundo de Ingeniería Química
6 de setiembre de 2007
90 %
95 %
99 %
Tamaños muestrales necesarios para cometer un error de 0,1 para los mismos.
Contrastar la hipótesis de que las proporciones son iguales
p-valor = Z0 = Región crítica
Resultado
Tamaños muestrales para detectar una diferencia de proporciones de 0,2 con una potencia de 0,9 ---
-
72
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores
confianza Error
90%
95 %
99 %
Explicar los resultados:
73
Control 1: Segundo de Ingeniería Química
31 de octubre de 2007
Apellidos Nombre
Entregar con el examen
1.- Un biólogo ha tomado una muestra de tortugas y ha medido su longitud obteniendo el
siguiente diagrama de tallo-hojas
2.- En una muestra de tamaño 100, se ha obtenido una media muestral de 38,283 y una
desviación estándar muestral de 1.25.
g. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 2.5?
h. ¿Qué porcentaje de observaciones cae dentro del rango 38,283 1.5?
74
Control 2: 2º curso de Ingeniería Química
19 de diciembre de 2007
1.- La siguiente sentencia fue mantenida por un “experto” en estadística. “Si se extrajera
una muestra de tamaño 64 de una población normal con media µ, se podría asegurar con una
confianza del 95% que µ estaría dentro del intervalo X 1,96s / 8 ”. ¿Es correcta esta afirmación?
Determinar el tamaño muestral necesario para cometer un error de 5ºC en ambos casos
3.- Define:
Variable aleatoria:
Función de densidad
Función de probabilidad
Estadístico
Estimador
0,3
densidad
0,2
0,1
0
-4 -3 -2 -1 0 1 2 3 4
x
75
Examen de estadística: Prácticas 11 de febrero de 2008
Media muestral = 3,14 Mediana muestral = 3,32 primer cuartil muestral = 1,73
Tercer cuartil muestral=4,49 Percentil 1 muestral =-1,78 percentil 5 muestral = -0,30
Percentil 95 muestral =6,58 percentil 99 muestral = 7,35
confianza Error
0,5 0,4 0,3
90% 28 43 75
95 % 46 70 123
99 % 90 139 244
Continúa a la vuelta
76
3.- Contrasta la normalidad de la variable simulada X (0.5p)
Nº de clases 8
Valor chi-cuadrado 3,36
Grados de libertad 5
p-valor 0,64
Conclusión Aceptamos normalidad de los datos
{S12/S22>1,531 }{S12/S22<0,66}
Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 1,5: 250, 200
77
Examen de estadística: 2º curso de ingeniería química.
11 de febrero de 2008
Nombre Apellidos
1.- Los siguientes datos corresponden al número de trabajadores en la industria en la
Comunidad de Castilla y León durante el periodo 1993-2006 (1p)
1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
133.96 133.74 135.34 135.09 132.20 138.49 140.59 141.00 140.56 144.36 146.58 147.4 151.62 151.85
0 1 7 1 5 3 3 5 1 1 0 47 0 9
Calcular
Media 140.918 varianza 43.671.485 máximo151.859 mínimo132.205 rango 19.654
Mediana 140.577 meda 5744,5 Primer cuartil 135.091 tercer cuartil 146.580
rango intercuartilico 11.489 percentil10 133.741
Dibujar un diagrama de cajas
Q1= 135.091
Q2 = 140.577
Q3 = 146.580
Media 140.919
LI = min. = 132.205
LS = Máx. = 152.859
2.- Un fabricante de pilas alcalinas sabe que la duración de las mismas se distribuye según
una ley normal de varianza 3600 horas. Para estimar la media toma una muestra de su producción y
un nivel de confianza del 95% obteniendo el intervalo (372,6 392,2).(1p)
Calcular la media estimada y el tamaño muestral utilizado.
El intervalo es X Z 0,o 25 La media estimada es el centro del intervalo X 382,4 y Z 0,o 25 9,8
n n
z0,025 = 1,96 σ =60 y n = 144
Calcular el error de estimación para un tamaño muestral de 200 pilas y una confianza del
90%.
El error es
X Z 0.05 z0,05 = 1,64 E = 6,96
n
3.- Las cuasivarianzas muestrales de dos muestras de tamaños 51 y 101 de dos poblaciones
normales independientes son 70,2 y 76,8. (1.5p)
Demostrar que puede admitirse que las varianzas poblacionales son iguales al nivel 10%
H0: 12 = 22 El estadístico F S12 Bajo H0 se distribuye como una F50,100
0
S 22
H1: 12 22 f50,100,0,05 = 1,48 f100,50, 0,05 = 1,52 f50,100, 0,95 = 0,66
RA 0,66< F0 <1,48 f0 = 0,91 por tanto acepto H0
Calcular la potencia de la prueba en el punto 1,5
P(0,66< F0 <1,48/12/22=1,5) = P(0,66< S12 <1,48/(12/22)=1,5) =
S 22
S /
2 2
P(0,66 (22/12) < 1 1 <1,48 (22/12) /(12/22)=1,5) = P(0,44< F50,100 < 0,98)
S / 2
2
2
2
78
4.-Se ha realizado un análisis de regresión tomando como variable dependiente millas por
galón y variable independiente caballos de potencia del vehículo. Se ha obtenido(1.5p)
Dependent variable: mpg
Independent variable: horsepower
Standard T
Parameter Estimate Error Statistic P-Value
Intercept 49,8706 1,403 35,5426 0,0000
Slope -0,237707 0,0152283 -15,61 0,0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 5030,95 1 5030,95 243,66 0,0000
Residual 148 20,6475
Total (Corr.) 8086,77 149
5.- Una empresa compra cierto tipo de pieza que es suministrada por 3 proveedores: el 45%
de las piezas son compradas al primer proveedor resultando defectuoso el 1%, el segundo
proveedor suministra 30% de las piezas y de ellas es defectuoso el 2%. Las restantes piezas
provienen del tercer proveedor, siendo defectuoso el 3% de las mismas.
En un control de recepción de artículos se selecciona una pieza al azar y es defectuosa. Calcular la
probabilidad de que la haya suministrado el segundo proveedor.(1p)
P(1) = 0,45 P(2) = 0,3 P(3) = 0,25 P(D/1)= 0,01 P(D/2)= 0,02 P(D/3)= 0,03
P(2/D)= P(D/2)xP(2)/P(D) = 0.33
P(D) = P(D/1)xP(1)+ P(D/2)xP(2) +P(D/3)xP(3) =0,018
79
7.- Elige la respuesta correcta (1p)
1. Sean X1 y X2 dos variables aleatorias independientes B(5, 0.4). La varianza de Y = (X1 + X2)es
(a) 1.2
(b) 0.6
(c) Ninguna de las otras dos
2. Si dos sucesos son incompatibles, son independientes
(a) Si, claro.
(b) No
(c) Si la intersección es el conjunto vacío.
3. Si lanzamos 3 monedas al aire, ¿cual es la probabilidad de que las 3 sean caras o las 3 sean
cruces?
(a) 1/4
(b) 1/8
(c) 1/2
4. Para estimar la media de una población normal, la media muestral es
(a) Un estimador insesgado pero no consistente.
(b) Un estimador insesgado y consistente.
(c) Un estimador insesgado, consistente y con error cuadrático medio nulo.
5. Un intervalo de confianza al 90% para estimar θ es
(a) Un intervalo que contiene al 90% de los posibles valores de θ.
(b) Un intervalo aleatorio que contiene a θ para el 90% de las muestras aleatorias
extraídas de la población.
6. En una muestra aleatoria simple
(a) las observaciones son independientes
(b) todos los elementos de la población son iguales
(c) los valores de una muestra particular son variables aleatorias
7. La distribución en el muestreo de la media muestral
(a) es una distribución normal siempre
(b) es una distribución normal si las observaciones son independientes
(c) de forma general, sigue aproximadamente una distribución normal
8. La probabilidad de error de tipo II de un contraste de hipótesis
(a) es igual a 1-P(error tipo I)
(b) siempre es mayor o igual que la probabilidad de error de tipo I
(c) es 1-Potencia del test
9. El intervalo de confianza para la desviación típica de una población normal
(a) no es simétrico porque los datos son siempre mayores o iguales que cero
(b) no es simétrico porque la distribución normal es mayor o igual que cero
(c) no es simétrico porque la distribución χ2 es no negativa
10. Si aumentamos el valor del nivel de confianza, la longitud del intervalo de confianza seria:
(a) mayor
(b) menor
(c) podría ser mayor o menor, dependiendo del valor desconocido del parámetro
80
Examen de estadística: Prácticas 9 de septiembre de 2008
Nombre Apellidos
confianza Error
3 2
90%
95 %
99 %
81
3.- Contrasta la normalidad de la variable simulada X (0.5p)
Nº de clases
Valor chi-cuadrado
Grados de libertad
p-valor
Conclusión
82
Examen de estadística: 2º curso de ingeniería química.
9 de septiembre de 2008
Nombre Apellidos
1.- Los siguientes datos representan los días de baja por enfermedad en un grupo de 50
trabajadores (1p)
2 2 0 0 5 8 3 4 1 0 0 7 1 7 1 5 4 0 4 1 8 9 7 0 0
1 7 2 5 5 4 3 3 0 0 2 5 1 3 0 1 0 2 4 5 0 5 7 5 1
- Calcular
Media varianza máximo mínimo Mediana
Meda Primer cuartil tercer cuartil rango intercuartilico percentil10
- Presentar los datos en forma de tabla de distribución de frecuencias
- Dibujar un diagrama de cajas y un diagrama de barras
- Calcular el número de trabajadores que han estado de baja al menos 1 día
2.- Las longitudes de un tipo de cojinete de bolas se distribuyen normalmente con una
desviación típica de 0,5 mm.(1p)
¿Qué tamaño de muestra se necesita si se pretende que el estimador de la media difiera de la
media poblacional en ±0,1 mm. con una confianza del 95%?
¿Qué error de estimación se comete para un tamaño muestral de 100 y una confianza del
99%?
3.- Una compañía debe decidir entre dos suministradores de lámparas. La dirección ha
decidido hacer el pedido al suministrador A, a menos que se pueda probar que la vida media de las
lámparas del suministrador B es mayor. Para ello se prueban 31 lámparas de A y 31 lámparas de B,
obteniéndose los siguientes resultados. (1.5 p)
A 121 76 88 103 96 89 100 112 105 101 92 98 87 75 111 118
121 96 93 82 105 78 84 96 103 119 85 84 90 110 105
Analysis of Variance
83
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 1,14214E8 1,14214E8 0,0000
Residual 5,95138E7 207 287506,0
Total (Corr.)
Correlation Coefficient = 0,810821
R-squared = percent
R-squared (adjusted for d.f.) = 65,5776 percent
Standard Error of Est. =
Mean absolute error = 476,173
Durbin-Watson statistic = 0,0554521 (P=0,0000)
Lag 1 residual autocorrelation = 0,97107
5.- Un proceso químico utiliza un catalizador con las siguientes características (1p)
P(catalizador funcione más de 1000horas)= 0,8
P(catalizador funcione más de 2000horas)= 0,4
P(catalizador funcione más de 3000horas)= 0,1
Sabiendo que un catalizador ha estado funcionando 1000horas encontrar las probabilidades
condicionadas
P( tiempo total de funcionamiento exceda las 2000horas)
P( continúe funcionando más de 2000horas)
6.- Sea X una v.a. binomial con E(X)=6 Var(X) = 2,4 (0.5p). Calcular
P(X>2)
P(X≤9)
P(X=12)
84
Control 1: Segundo de Ingeniería Química 12 de noviembre de 2008
Apellidos Nombre
Entregar con el examen
1.- El siguiente gráfico de tallo-hojas refleja las presiones sanguíneas diastólicas de una
muestra de personas
presión: 1|2 representa 12,0
3 5|468
11 6|01223455
(10) 7|0122455678
9 8|678999
3 9|358
Se pide
a) Tamaño muestral 30 media 74,13 desviación estándar 12,65 mediana 73
cuartil 1 63 cuartil 3 87 rango intercuartílico 24
mínimo 54 máximo 98
b) Calcular los percentiles
5 56 15 61 25 63 50 73 75 83 85 89 95 95
c) Realizar un diagrama de cajas de la longitud y comentar el gráfico.
Q1 – 1,5xRI = 27 Q3 + 1,5xRI = 123 LI = 54 LS = 98
54 58 62 66 70 74 78 82 86 90 94 98
3.-Sea X una variable de Poisson con parámetro 4. Calcular usando las tablas
P(X=1) = 0,0733
P(X=2) = 0,1465
P(X>2) = 1 – P(X = 0) – P(X = 1) – P(X = 2) = 1 – 0,0183- 0,0733- 0,1415 = 0,7619
85
Control 2 : 2º curso de Ingeniería Química
17 de diciembre de 2008
1.- La siguiente sentencia fue mantenida por un “experto” en estadística. “Si se extrajera
una muestra de tamaño 25 de una población normal con media µ, se podría asegurar con una
confianza del 95% que µ estaría dentro del intervalo X 0,392s ”. ¿Es correcta esta afirmación?
El intervalo viene dado por X t 0, 025, 24 s / 25
t0,025,24 = 2,064 t0,025,24 /5= 0,41
La afirmación es falsa
2.- Para estimar el contenido medio de nicotina en una marca de cigarrillos, se toma una
muestra aleatoria de tamaño 44 y se miden sus contenidos de nicotina, obteniendo una media
muestral de 1,74 mg. Por experimentos anteriores se considera que la desviación estándar es 0,7
mg.
Calcular un intervalo de confianza al 95% y 99% para µ
z0,025 = 1,96 z0,005= 2,57
α= 0,05 1,53≤µ≤1,95 α= 0,01 1,47≤µ≤2,01
Calcular el error cometido en ambos casos.
α= 0,05 error = 0,21mg. α= 0,01 error = 0,27mg.
Determinar el tamaño muestral necesario para cometer un error de 0,15mg. en ambos casos
α= 0,05 z0,025 σ/√n = 0,15 α= 0,01 z0,00 5 σ/√n = 0,15
n= 84 n=144
3.- Define:
Estadístico Variable aleatoria función de la muestra
Estimador Valor del estadístico para una muestra concreta
Variable estandarizada Variable obtenida de una dada cuando la restamos la media y la
dividimos por la desviación estándar. Tiene media 0 y varianza 1
Media muestral Estadístico o estimador que resulta al sumar las variables que componen
la muestra y dividirla por el nº de observaciones. En general se utiliza para estimar la
media poblacional
¿Qué estadístico se utiliza para hallar un intervalo de confianza para la varianza?
Se utiliza la varianza muestral que en el muestreo se distribuye según una ley chi cuadrado
4:- En la siguiente función de densidad de una distribución t pon el valor del área de la
región comprendida entre la gráfica, el eje de las x y las líneas verticales
86
distribución de Student con 11 grados de libertad
0,4 D. F.
11
0,3
densidad
0,2
0,1
0
-3,5 0 3,5
-1,796 -0,876 0,697 1,796
x
-1,363 1,088
De las tablas
t0, 25,11 = 0,697
t0,2,11 =0,876
t0,15,11 = 1,088
t0,1,11 =1,363
t0,05,11 = 1,796
P ( T < -1,796 ) =0,05
P (-1,796 < T < -1,363 ) = 0,1- 0,05= 0,05
P ( - 1,363 < T < -0,876 ) = 0,2-0,1= 0,1
P (-0,876< T < 0 ) =0,5 – 0,2 =0,3
P ( 0 < T < 0,697 ) =0,75 – 0,5 =0,25
P ( 0,697 < T < 1,088 ) =0,85 – 0,75 =0,1
P ( 1,088 < T < 1,796 ) =0,95 – 0,85 =0,1
P ( T > 1,1,796 ) =0,05
87
Examen de estadística: 2º curso de ingeniería química. 9 de febrero de 2009
Nombre Apellidos
1.- Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería
de plástico. Para ello se toman dos muestras aleatorias anotando las temperaturas de deflexión
observadas.
Tipo I 20 19 19 18 20 21 20 18 19 18 17 17 19 21 20
6 3 2 8 7 0 5 5 4 7 9 8 4 3 5
Tipo II 17 17 19 19 18 18 20 20 18 20 19 20 18 19 19
7 6 8 7 5 8 6 0 9 1 7 3 0 2 3
(5) 19|23778 5
7 19|778 4
3
4 20|0136 2
1
0 170 180 190 200 210
170 180 190 200 210
88
Supongamos que si la temperatura de deflexión promedio para la tubería de tipo 2 es
mayor que la de la tubería de tipo 1 en 5ºF, entonces sería importante detectarlo con una
probabilidad de al menos 0,9. ¿Resulta adecuada la selección del tamaño de las muestras?
(0,5)
X X2
P(-5)= P(RC/ μ1 - μ2 = -5) = P(T0<-1,701/ μ1 - μ2 = -5)= P( 1 -1,701/μ1 - μ2 = -5)=
1 1
s
15 15
X X 2 (5) 5
P( 1 -1,701+ /μ1 - μ2 = -5=P(T28<-0,39)<0,25
1 1 1 1
s s
15 15 15 15
No es adecuado el tamaño muestral
Calcula in intervalo de confianza para la media de la temperatura de deflexión para la
tubería de tipo 1. (0,5)
X 1 t 0,025,14 s1 / 15 t0,025,14 = 2,145 X 1 6,24 189,49 μ1 201,97
¿Error de estimación cometido? (0,25)
6,24
¿Qué tamaño de muestra se necesita si se pretende que el estimador de la media difiera
de la media poblacional en ±0,5 ºF? con una confianza del 95%? (0,25)
t 0,025,14 s1 / n = 0,5 n=2337,55 n= 2338
2.- Supongamos que tres fábricas A, B y C vierten productos al río Pisuerga en una
proporción 0,4 0,3 0,3. Estos vertidos son tóxicos con probabilidades 0,01 0,05 y 0,1
respectivamente. (0,75)
Calcular la probabilidad de un vertido tóxico al río Pisuerga.
P(tóxico) = P(tóxico/A)P(A)+ P(tóxico/B)P(B)+ P(tóxico/C)P(C) = 4.10-3+15.10-3+30.10-3 =
49.10-3
Si se detecta un vertido tóxico en el río, calcular la probabilidad de que este provenga
de cada una de las tres fábricas.
P(A/tóxico)=P(tóxico/A)P(A)/P(tóxico) = 4/49
P(B/tóxico)=P(tóxico/B)P(B)/P(tóxico) = 15/49
P(C/tóxico)=P(tóxico/C)P(C)/P(tóxico) = 30/49
Si se han detectado en el último año 10 vertidos tóxicos, calcular la probabilidad de que
5 sean de A 3 de B y 2 de C.
10 5
P= [ P(A/tóxico])5 [P(B/tóxico)]3 [P(C/tóxico])2=9,8.10-5
5 3
3.- Un proceso químico utiliza un catalizador. El tiempo de duración del catalizador es una
v.a. N (500,250) (0,75p).
Calcular P (catalizador funcione más de 500horas)
P(X>500)= P(Z>0)= 0,5
P (catalizador funcione más de 1000horas)=
P(X>1000)=P(Z>2)= 0,0228
P (catalizador funcione más de 1000horas/ha durado más de 500)=
P(X>1000/X>500) = P(X>1000)/P(X>500) = 0,0456
89
P (2,54 < F10, 15 < 3,8)=
P (F10, 15 < 3,8)- P (F10, 15 < 2,54)= 0,99-0,95 = 0,04
P (0,26 < F15, 10 < 0.39) =
P (F15, 10 < 0.39) - P (F15, 10 < 0,26 ) = P (F10, 15 >1/ 0.39) - P (F10, 15 >1/ 0,26 )=0,04
P (1,77 < T13 < 3,85)=
P (T13 < 3,85) -P (T13 < 1,77)=p 0.045 p0,0495
P (Z < x) = 0,95
X= 1,64
P (215 < y) = 0,05
Y = 7,26
P (T30 < z) = 0,25
P (T30 >- z) = 0,25 -z = 0,683 z = -0,683
R
f ( x)dx 1
10. Función de probabilidad Para v.a. discretas conjunto de valores que toma la variable
con su probabilidad (x, Px) xRango(X)
11. Espacio muestral Conjunto de todos los posibles resultados de un experimento
12. Sucesos independientes La ocurrencia de uno de ellos, no influye en la ocurrencia del
otro P(AB) = P(A) P(B) P(A/B)=P(A) P(B/A)=P(B)
13. fórmula de Bayes = Ai Ai mutuamente excluyente con P(Ai) >0 y sea B el
resultado de un experimento con P(B)>0. La probabilidad a posteriori de los sucesos Ai viene dada
P( B / Ai ) P( Ai )
por la fórmula P( Ai / B)
P( B / Ai ) P( Ai )
i
90
Examen de Prácticas de Estadística: 9 de febrero de 2009
Nombre Apellidos
Con los errores propuestos, calcular tamaño muestral necesario para un intervalo y las confianzas
dadas. Comentar resultados
confianza Error
0,05 0,08 0,12
90% 418 165 75
95 % 594 234 105
99 % 1021 403 181
91
3.- Simular 150 valores de una distribución de Erlang de parámetros 4 de forma y 3,5 de
escala Variable Y (0.5p)
Contrastar la hipótesis de que las varianzas de las variables X e Y son iguales.
S12 S12
p-valor = 0,07 f0 = 1,3 Región crítica { 2 1,33 }{ 2 0,76 }
S2 S2
Resultado: Aceptamos igualdad de varianzas
Calcular la potencia en el punto 2
S12 12 S12 12
P( 2 1,33 / 2 2 ) + P( 2 0,76 / 2 2 )=P(F299,149 >0,665) + P(F299,149 < 0,38)=0,998
S2 2 S2 2
Calcular de forma aproximada tamaños muestrales para alcanzar una potencia de 0.85 en el punto
1,5: 350, 175
Intervalo de confianza para la diferencia de medias al 95% -0,12 μ1- μ2 0,12
12
Intervalo de Confianza para el cociente de varianzas al 95% 0,98 1,71
22
92
Examen de Estadística: Segundo de Ingeniería Química. 9 de setiembre de 2009
Nombre Apellidos
Los datos siguientes muestran el índice de refracción y la densidad de 12 trozos de cristal
Índice de refracción densidad
1,514 2,480
1,515 2,482
1,516 2,481
1,517 2,490
1,518 2,483
1,520 2,505
1,516 2,484
1,517 2,486
1,518 2,495
1,519 2,498
1,522 2,511
1,525 2,520
1.- Calcular el valor de los estadísticos habituales para la variable índice de refracción.
Media , varianza, desviación estándar, máximo, mínimo, rango, mediana, cuartiles y rango inter
(0.5)
2.- (0.75)
Tabla de distribución de frecuencias y dibujar un diagrama de tallo-hojas, un histograma y
un diagrama de cajas para ambas variables
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
3.- (0.75)
Calcula un intervalo de confianza para la media del índice de refracción al 95%.
Calcula el tamaño muestral necesario para estimar la media con un error de 0,05.
4.- (0.75)
Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0: = 1 H1: >1
Calcula la potencia en el punto 1,4
5.- De las siguientes tablas del análisis de regresión Rellenar huecos (0.5)
Regression Analysis - Linear model: Y = a + b*X
Dependent variable: densidad
Independent variable: indicerefra
Standard T
Parameter Estimate Error Statistic P-Value
Intercept -3,68673 -6,2112 0,0001
Slope 4,07069 10,4111 0,0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 0,00173852 1 0,00173852
0,0000
Residual 10
Total (Corr.) 0,00189892
Correlation Coefficient =
R-squared =
Standard Error of Est. =
Ecuación de la recta de regresión y Contraste de la regresión (los dos) (0.5)
Intervalo de confianza para la pendiente al 95% (0.25)
Comentar los siguientes gráficos y tablas del análisis de los residuos (0.5)
93
Residual Plot Normal Probability Plot
Studentized residual
4,1 99,9
99
percentage
2,1 95
80
0,1 50
20
5
-1,9
1
0,1
-3,9
-10 -7 -4 -1 2 5
0 2 4 6 8 10 12 (X 0,001)
RESIDUALS
row number
frequency
4
0
-10 -7 -4 -1 2 5 -11 -7 -3 1 5
(X 0,001) (X 0,001)
RESIDUALS RESIDUALS
Goodness-of-Fit Tests for RESIDUALS
Chi-Square Test
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chi-Square
at or below -0,00321376 2 2,40 0,07
-0,00321376 -0,000967417 2 2,40 0,07
-0,000967417 0,000967419 1 2,40 0,82
0,000967419 0,00321376 5 2,40 2,82
above 0,00321376 2 2,40 0,07
Chi-Square = 3,83342 with 2 d.f. P-Value = 0,14709
6.- (0.5) Con ayuda de las tablas calcula
P( 2,54 < F10,15 < 3,8)
P( 0.26 < F15,10 < 0.39)
P( 1,77 < T13 < 3,85)
P(Z < x ) = 0,95
P( 215 < y ) = 0,05
P(T30 < z) = 0,25
7.- (0.75) La irregularidad del corte de productos de papel depende del grado de uso de
las cuchillas. Si las cuchillas son nuevas el 0,05% de los productos presentan un corte irregular; si
las cuchillas tienen un uso medio, el 0.5% de los cortes presentan irregularidades; si las cuchillas
están desgastadas, el 2% de los cortes son defectuosos. Si se conoce que de las cuchillas utilizadas
en el proceso de corte, el 10% son nuevas y el 60% tienen un uso medio. Calcular la proporción de
productos con cortes irregulares.
8.- El peso de una barra de aluminio tiene una media de 220 g. y una desviación
estándar de 10g.(0.75)
Acotar la probabilidad de que el peso esté comprendido entre 205 y 235 g.
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de zapatillas
cuyo peso no está comprendido entre los valores anteriores sea menor que 10. Tomar como valor de
p la cota calculada anteriormente.
94
Examen de prácticas: Estadística. Segundo de Ingeniería Química
9 de setiembre de 2009
Apellidos Nombre
1.- Distribución binomial: n = 150 p = 0.01
Media = Mediana = primer cuartil = tercer cuartil =
Percentil 1 = percentil 5 = percentil 95 = percentil 99
Simular 200 valores de una distribución binomial con n = 150 p=0.01
Comentar el diagrama de cajas observado
Rellenar el siguiente cuadro para las clases 3 y 6
Clase Valor Frecuencia Frecuencia Probabilidad F. distribucion
2 1
3 2
4 3
5 4
6 5
Media = Desviación estándar= Media poblacional= Desviación estándar
pob.=
90 %
95 %
99 %
Contrastar la hipótesis de que las proporciones son iguales
p-valor = Z0 = Región crítica
Resultado
Tamaños muestrales para detectar una diferencia de proporciones de 0,2 con una potencia de 0,9 ---
-
95
Fijar tres errores de acuerdo al valor de la media y calcular tamaño muestral necesario para la cota
superior y los niveles de significación anteriores
confianza Error
90%
95 %
99 %
Explicar los resultados:
El contraste para la ordenada en el origen tiene un p-valor de --- por tanto -- rechazamos la
hipótesis nula y -- admitimos que ésta es distinta de 0.
Región crítica para este contraste ………………………………
El contraste F de regresión tiene un p valor de --- por tanto -- rechazamos la hipótesis nula y
--- admitimos que existe relación lineal entre las variables.
Región crítica para este contraste…………………………..
96
Apellidos Nombre
Examen de Estadística: 2º curso de Ingeniería Química. 9 de febrero de 2010
1.- Se han obtenido los siguientes datos del rendimiento de dos catalizadores
Catalizador I: 91.5 94.18 92.18 95.39 91.79 89.07 94.72 89.21
Catalizador II: 89.19 90.95 90.46 93.21 97.19 97.04 91.07 92.75
Hacer un diagrama de tallo-hojas para los datos de cada catalizador (0.25 puntos)
Catalizador I Catalizador II
2 8|99 1 8|9
4 9|11 4 9|001
4 9|2 4 9|23
3 94|445 2 9|
2 9|77
Calcular los percentiles 5, 15, 25, 50, 75, 85 y 95 de cada catalizador y hacer algún comentario
comparando los rendimientos. (0.25 puntos)
Catalizador I Catalizador II
5,0% = 89,07 dato 1 5,0% = 89,19
15,0% = 89,21 dato 2 15,0% = 90,46
25,0% = 90,355 (dato2+dato3)/2 25,0% = 90,705
50,0% = 91,985 (dato4+dato5)/2 50,0% = 91,91
75,0% = 94,45 (dato6+dato7)/2 75,0% = 95,125
85,0% = 94,72 dato 7 85,0% = 97,04
95,0% = 95,39 dato 8 95,0% = 97,19
Los percentiles del segundo catalizador, están por encima de los percentiles del primero, indicando
que quizá el rendimiento sea mayor; pero la mediana es mayor en el catalizador I. Los percentiles
no son simétricos respecto de la mediana en ninguno de los dos catalizadores, la asimetría está más
marcada en el segundo catalizador.
Realizar una tabla de distribución de frecuencias y un histograma de los rendimientos de cada
catalizador en la misma gráfica. (0.25 puntos)
Catalizador I
Límite Límite Frecuencia Frec Frec Frec
Clase Inferior Superior Marca Relativa Acu Rel. Acu.
Menor o igual 89,0 0 0,0 0 0,0000
1 89,0 92,0 90,5 4 0,5 4 0,5000
2 92,0 95,0 93,5 3 0,375 7 0,8750
3 95,0 98,0 96,5 1 0,125 8 1,0000
Mayor 98,0 0 0,0 8 1,0000
Catalizador II
Límite Límite Frecuencia Frec Frec Frec
Clase Inferior Superior Marca Relativa Acu Rel. Acu.
Menor o igual 89,0 0 0,0000 0 0,0000
1 89,0 92,0 90,5 4 0,5000 4 0,5000
2 92,0 95,0 93,5 2 0,2500 6 0,7500
3 95,0 98,0 96,5 2 0,2500 8 1,0000
Mayor 98,0 0 0,0000 8 1,0000
97
Hacer los diagramas de cajas de los dos rendimientos en la misma gráfica y comentar los
gráficos. (0.25 puntos)
Catalizador I Catalizador II
RI= 94.45 – 90.35 = 4.10 RI= 95.125 – 90.70 = 4.425
Q1 – 4.10 x1.5 = 84,2 Q1 – 4.425 x1.5 = 84,06
Q3 + 4.10 x1.5 = 100.65 Q3 + 4.425 x1.5 = 101.76
LI = 89,07 LI = 89,18
LS= 95.39 LS= 97.19
Diagrama de cajas
Catalizador I
Catalizador II
89 91 93 95 97 99
Las medianas son similares en los dos catalizadores. Ambos catalizadores presentan asimetría a la
derecha. El catalizador II presenta mayor dispersión y mayor asimetría hacia la derecha.
Calcular un intervalo de confianza para el cociente de varianzas (0.25)
Catalizador I Catalizador II
n 8 8
Media 92,255 92,7325
Varianza 5,68831 8,90099
Desviación Estándar 2,38502 2,98345
Radio de varianzas = 0,639065 f0.025,7,7 = 4.99 f0.975,7,7 = 0.2
Intervalo de confianza [0,127943; 3,19207]
Contrastar H0: σ1 = σ2 mediante el cálculo de la región crítica y el p-valor. (0.25)
H1: σ1σ2
Región crítica {F0< 0.2 } Ụ {F0 >4.99 } f0 = 0.63 no está en la región crítica ,aceptamos igualdad
de varianzas.
P-valor P(F7,7 >0.63)
De las tablas P(F7,7 >3,79) = 0.05 por tanto P(F7,7 > 0,26) = 0.95
0.05 < p-valor < 0.95 Apoya nuestra decisión de aceptar la hipótesis nula.
Calcular la potencia en el punto 0.5 (0.25)
P(0.5) = P(RC/(σ1/ σ2) = 0.5) = P (F0 < 0.2 /(σ1/ σ2) = 0.5) + P (F0 > 4.99 /(σ1/ σ2) = 0.5) = P(F7,7 <
0.2/0.25) + P(F7,7 > 4.99/0.25) = P(F7,7 < 0.8) +P(F7,7 >19.96)
De las tablas P(F7,7 > 6,99) = 0.01 por tanto P(F7,7 > 19,96) < 0.01
P(F7,7 > 3,79) = 0.05 luego P(F7,7 > 0,26) = 0,95
P(F7,7 < 0,26) = 0.05 De donde P(F7,7 < 0.8) > P(F7,7 < 0,26) = 0.05
P(0,5) > 0,05
98
Calcular un intervalo de confianza para la diferencia de medias. (0.25)
Diferencia de medias: - 0.4775 t14,0.025 = 1,746
Intervalo de confianza asumiendo varianzas iguales S p = 2.67
-0,4775 +/- 2,89639 [-3,37389,2,41889]
Contrastar H0: 1 = 2 mediante el cálculo de la región crítica y el p-valor.(0.25)
H1: 1< 2
Región crítica {T0 <-1.746} t0 = - 0.23 no está en la región crítica luego aceptamos que la primera
media es mayor o igual que la segunda
p-valor P(T14 < -0.23) = P(T14 > 0.23) > P(T14 >0.25) = 0.4
Calcular la potencia en el punto -0.5 (0.25)
Potencia (-0.5) = P(T0 < -1,746/μ1 – μ2 = -0.5) = P(T14 < -1.746 + 0.5/1.89) =
P(T14 < -1.48) = P(T14 > 1.48)
P(T14 > 1.34) = 0.1
P(T14 >.1.76) = 0.05
0.05 < P(-0.5) < 0.1
2.- Dado que no todos los pasajeros de una aerolínea abordan el vuelo para el que han reservado, la
compañía aérea vende 200 billetes para un vuelo de 160 pasajeros. Si la probabilidad de que un
pasajero no aborde el vuelo es de 0,05 y los pasajeros se comportan de forma independiente unos de
otros. Calcular o aproximar (0.5)
P (todos los pasajeros aborden el vuelo)
Sea X el nº de pasajeros que abordan el vuelo. X → B (200, 0,95)
- P(X = 200) = (0,95)200 = 3,5.10-5
P (un vuelo parta vacío)
- P(X = 0) = (0,05)200 = 6. 10-261 ≈ 0
P (100 < nº de pasajeros ≤ 125)
- X puede ser aproximada por una distribución normal de media 200x0,95 = 190 y varianza
200x0,95x0,05 = 9,5; desviación estándar 3,08
100 190 125 190
P(100 < X ≤ 125) ≈ P Z = Φ(-21)-Φ(-29) ≈ 0
3,08 3,08
P ( nº de pasajeros ≤ 160)
- P(X ≤ 160) ≈ P(Z ≤ -9,74) ≈ 0.
99
(a) Un intervalo que contiene al 90% de los posibles valores de θ.
(b) Un intervalo aleatorio que contiene a θ para el 90% de las muestras aleatorias extraídas
de la población.
6. En una muestra aleatoria simple
(a) las observaciones son independientes
(b) todos los elementos de la población son iguales
(c) los valores de una muestra particular son variables aleatorias
7. La distribución en el muestreo de la media muestral
(a) es una distribución normal siempre
(b) es una distribución normal si las observaciones son independientes
(c) de forma general, sigue aproximadamente una distribución normal
8. La probabilidad de error de tipo II de un contraste de hipótesis
(a) es igual a 1-P (error tipo I)
(b) siempre es mayor o igual que la probabilidad de error de tipo I
(c) es 1-Potencia del test
9. El intervalo de confianza para la desviación típica de una población normal
(a) no es simétrico porque los datos son siempre mayores o iguales que cero
(b) no es simétrico porque la distribución normal es mayor o igual que cero
(c) no es simétrico porque la distribución χ2 es no negativa
10. Si aumentamos el valor del nivel de confianza, la longitud del intervalo de confianza seria:
(a) mayor
(b) menor
(c) podría ser mayor o menor, dependiendo del valor desconocido del parámetro
100
20
P(H/C) = 0.13 x 0.817 = 0.0257
3
0.0719 x0.4
P(A/H) = = 0.704
0.0719 x0.4 0.00899 x0.2 0.0257 x0.4
5.- Resolver las ecuaciones (0.5 puntos)
a) P(25 ≤ x) = 0,95 P(25 > x) = 0,05 x = 11,07
2
b) P(12,549 ≤ 10 ≤ y) = 0,20
P(12,549 ≤ 210 ≤ y) = P(210 ≤ y) - P(210 ≤ 12,549) = 0,20
P(210 >15,99) = 0,1 P(210 > 9,34 ) =0,5 0,5 < P(210 ≤ 12,549) < 0,9
0,7 < P(210 ≤ y) < 1 P(210 > y) < 0,3 y > 15,99
c) P(T15 ≤ z) = 0,01
P(T15 ≤ z) = 0,01 z ha de ser negativo P(T15 > -z ) = 0,01 -z = 2,602 z = -2,602
d) P(T8 > t) = 0.9
P(T8 > t) = 0.9 t ha de ser negativo P(T8 > -t ) = 0,1 -t = 1,397 t = -1,398
e) P( 1,476 ≤ T5 ≤ u) = 0,075
P( 1,476 ≤ T5 ≤ u) = P(T5 ≤ u) - P(T5 ≤ 1,476) = 0,075
P(T5 > 1,476) = 0,1 P(T5 ≤ u) = 0,975 P(T5 > u) =0,025 u= 2,57
f) P( F10,20 ≤ 2,42) = v
P( F10,20 > 2,77) = 0,025 P( F10,20 > 2,35) = 0,05 0,025 < P( F10,20 > 2,42) < 0,05
0,95 ≤ P( F10,20 ≤ 2,42) ≤ 0,975
6.- En una muestra de tamaño 25, se ha obtenido una media muestral de 3,5 y una desviación
estándar muestral de 1.25. (0.5)
¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [1, 6]?
El 75%
¿Qué porcentaje mínimo de observaciones cae dentro del intervalo [-0,25, 7,25]?
El 88%
101
Apellidos Nombre
Examen de prácticas: 2º de ingeniería química, 2 de febrero de 2010
102
4.- Datos correspondientes a la variable venir a clase
Realiza una tabulación cruzada de esta variable con el sexo
Estimador de la proporción de chicas que vienen andando ---------------- 0,45
Estimador de la proporción de chicos que vienen andando ---------------- 0,63
Intervalos de confianza bilaterales para la diferencia de proporciones = 0,01; 0,05; 0,1
Tamaños muestrales necesarios para cometer un error de 0,1 para los mismos .
Tamaños muestrales para detectar una diferencia de proporciones de 0,2 con una potencia de 0,9 ---
- 181 ; 104
confianza Error
0,5 2 5
90% 580 38 8
95 % 953 62 12
99 % 1905 123 23
Explicar los resultados: Las cotas superiores crecen con el nivel de confianza mientras que las
cotas inferiores decrecen.
El tamaño muestral crece con el nivel de confianza y decrece con el error.
103
Examen de Estadística: Segundo de Ingeniería Química. 22 de julio de 2010
Nombre Apellidos
Los datos siguientes muestran el índice de refracción y la densidad de 12 trozos de cristal
Índice de refracción densidad
1,514 2,480
1,515 2,482
1,516 2,481
1,517 2,490
1,518 2,483
1,520 2,505
1,516 2,484
1,517 2,486
1,518 2,495
1,519 2,498
1,522 2,511
1,525 2,520
1.- Calcular el valor de los estadísticos habituales para la variable índice de refracción.
Media, varianza, desviación estándar, máximo, mínimo, rango, mediana, meda, cuarteles,
rango intercuartílico, percentil 1, percentil 95 (0.5)
2.- (1) Tabla de distribución de frecuencias y dibujar un diagrama de tallo-hojas, un
histograma y un diagrama de cajas para ambas variables.
Comentar gráficos obtenidos, simetría, datos atípicos, normalidad.
3.- (0.75) Calcula un intervalo de confianza para la media del índice de refracción al 95%.
Calcula el tamaño muestral necesario para estimar la media con un error de 0,05.
4.- (1)Realiza el siguiente contraste: Región crítica, p-valor y resultado del contraste.
H0: = 1 H1: >1 Calcula la potencia en el punto 1,4
5.- (0.5) Con ayuda de las tablas calcula
P( 2,54 < F10,15 < 3,8)
P( 0.26 < F15,10 < 0.39)
P( 1,77 < T13 < 3,85)
P(Z < x ) = 0,95
P( 215 < y ) = 0,05
P(T30 < z) = 0,25
6.- (1) La irregularidad del corte de productos de papel depende del grado de uso de las
cuchillas. Si las cuchillas son nuevas el 0, 5% de los productos presentan un corte irregular; si las
cuchillas tienen un uso medio, el 1% de los cortes presentan irregularidades; si las cuchillas están
desgastadas, el 2% de los cortes son defectuosos. Si se conoce que de las cuchillas utilizadas en el
proceso de corte, el 10% son nuevas y el 60% tienen un uso medio. Calcular la proporción de
productos con cortes irregulares.
7.- El peso de una barra de aluminio tiene una media de 22 g. y una desviación estándar
de 1g.(1,25)
Acotar la probabilidad de que el peso esté comprendido entre 20,5 y 23,5 g.
Se toma una muestra de tamaño 100. Aproximar la probabilidad de que el número de barras cuyo
peso no está comprendido entre los valores anteriores sea menor que 10. Tomar como valor de p la
cota calculada anteriormente.
Responder a las mismas preguntas suponiendo que la distribución es normal
104
Apellidos Nombre
Examen de prácticas: 2º de ingeniería química, 22 de julio de 2010
1.- Distribución gamma con parámetros: forma =10 ; escala =3
Media Mediana primer cuartil tercer cuartil
Percentil 1 percentil 5 percentil 95 percentil 99
Simular 300 valores de una distribución gamma (10,3)
Rellenar el siguiente cuadro para las clases 3 , 6 y 8
Dibujar el diagrama de cajas observado
Clase Limite inferior Limite sup marca Frecuencia Frec Rel Frec Acumu Probabilidad
Menor o igual 0,8
1 0,8 1,4
2 1,4 2,0
3 2,0 2,6
4 2,6 3,2
5 3,2 3,8
6 3,8 4,4
7 4,4 5,0
8 5,0 5,6
9 5,6 6,2
10 6,2 6,8
mayor 6,8
Media = Desviación estándar= Media poblacional= Desviación estándar poblacional
2.- Simular 300 valores de una distribución de bernoulli de parametro 0,1
Simular 300 valores de una distribución binomial de parámetros 3 y 0,1
Realiza una tabulación de la variable binomial.
Rellena
Clase Valor Frecuenci Frecuencia Frecuencia Probabilidad
a Relativa acumulada
1 0
2 1
3 2
4 3
Haz una tabulación cruzada de la variable bernoulli con la variable binomial
Proporción de ceros de la variable de bernoulli para un valor 2 de la variable binomial-----
Proporción del valor 2 de la variable binomial para un valor 1 de la variable de bernoulli --- (1)
Proporción del valor 2 de la variable binomial para un valor 0 de la variable de bernoulli --- (2)
Intervalo de confianza para la diferencia de proporciones (1) y (2)
Nivel de confianza Intervalo Tamaños muestrales
90 %
95 %
99 %
Contrastar la hipótesis de que las proporciones son iguales
p-valor = z0 = Región crítica Resultado
Tamaños muestrales para detectar una diferencia de proporciones de 0,05 con una potencia de 0,9 –
3.- Trabajar con la variable gamma
Contrastar la hipótesis de que las varianzas son iguales en los dos grupos determinados por la
variable de bernoulli
105
p-valor = f0 = Región crítica Resultado:
Calcular tamaños muestrales para alcanzar una potencia de 0.85 en el punto 2:
Calcular la potencia en el punto 2
4.- Trabajar con la variable gamma con el valor 1 en la variable de bernoulli
Estimador de la media Estimador de la desviación estándar
Cotas de confianza para la media y la desviación estándar para = 0,01; 0,05; 0,1
confianza Para la media Para la desviación estándar
Superior inferior Superior inferior
90%
95 %
99 %
Fijar tres errores 0,05; 0,1 y 0,5 y calcular tamaño muestral necesario para la media y los niveles de
significación anteriores. Explicar los resultados:
confianza Error
90%
95 %
99 %
5.- En el siguiente analisis de regresion contestar
Dependent variable: notafinal
Independent variable: mediacontroles
Coefficients
Least Squares Standard T
Parameter Estimate Error Statistic P-Value
Intercept 1,47237 0,525664 2,80097 0,0069
Slope 0,607833 0,081726 7,43741 0,0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 128,468 1 128,468 55,32 0,0000
Residual 137,026 59 2,32247
Total (Corr.) 265,493 60
Correlation Coefficient = 0,695617 R-squared = 48,3883 percent
R-squared (adjusted for d.f.) = 47,5135 percent Standard Error of Est. = 1,52396
Mean absolute error = 1,23661 Durbin-Watson statistic = 2,27636 (P=0,8615)
Lag 1 residual autocorrelation = -0,173633
El contraste de regresión tiene un p valor de --- ¿Rechazamos la hipótesis nula? ---
¿Admitimos que existe relación lineal entre las variables?--
El contraste para la ordenada en el origen tiene un p-valor de --
¿Aceptamos la hipótesis nula ? --- ¿Decimos que es significativamente distinta de 0? ---
Región crítica para este contraste -------
El contraste F de regresión tiene un p valor de ---
¿Rechazamos la hipótesis nula? --- ¿Admitimos que existe relación lineal entre las variables.?----
Región crítica para este contraste ----
Variabilidad de los datos queda recogida por el modelo---
¿Es adecuado el modelo de regresión?----
VE = VNE = Error estándar de la regresión =
106