Sunteți pe pagina 1din 23

Tema 3 Inferencia estad stica

3.1. Ejercicios

1. En cada uno de los siguientes casos, determina qu e equipo consideras que ha utilizado un m etodo m as adecuado desde el punto de vista de la ecacia estad stica de las conclusiones obtenidas a partir de dichos datos. Razona el porqu e de tu respuesta. a ) Para analizar si las piezas producidas por una empresa ten an la longitud adecuada, el equipo A toma y mide una muestra de 10 piezas elegidas al azar entre la producci on de dicha empresa y el equipo B toma y mide una muestra de 100 piezas elegidas tambi en al azar de su producci on. b ) Para analizar el consumo energ etico por minuto en una empresa, el equipo A anota el consumo en 60 instantes de tiempo elegidos de forma aleatoria entre los 6720 minutos de producci on semanal y el equipo B elige un minuto al azar dentro de esa semana y anota su consumo, as como el de los 59 minutos posteriores. c ) Para analizar la opini on de los espa noles sobre una nueva ley del gobierno, el equipo A pregunta a 500 personas elegidas al azar en Madrid y el equipo B pregunta a 500 personas elegidas tambi en al azar dentro del territorio espa nol. 2. Para estimar el porcentaje de producci on disconforme en una empresa, se toma una muestra aleatoria de 300 piezas de la producci on de un d a cualquiera. Dichas piezas son analizadas en detalle en el departamento de control de calidad, que determina si son o no conformes. Se obtiene que 294 de ellas son conformes y el resto disconformes. Cu al ser a la forma habitual de estimar puntualmente el porcentaje de disconformes en la producci on de esta empresa? Invalidan los datos anteriores la siguiente armaci on: Dentro del total de la producci on, el porcentaje real de disconformes es del 1 %? 3. Algunas plantas de electricidad est an situadas cerca de r os u oc eanos con objeto de que el agua disponible pueda utilizarse para enfriar los condensadores. Sup on que, como parte de un estudio sobre impacto ambiental, una compa n a de electricidad desea estimar la temperatura media del agua que descarga de su planta. Encuentra el tama no muestral 35

36

TEMA 3. INFERENCIA ESTAD ISTICA m nimo necesario para poder estimar la verdadera temperatura media con un error de estimaci on menor o igual de 0 5o C y un nivel de conanza mayor o igual que 095, sabiendo que la desviaci on t pica poblacional es: a ) Como mucho de 2o C ( 2). b ) Como mucho de 1o C ( 1). 4. Un instituto de opini on p ublica quiere hacer una encuesta para conocer la proporci on de individuos de una poblaci on que est an a favor de una decisi on del gobierno. a ) A cu anta gente debe preguntar si, al aproximar la proporci on en la poblaci on (p) mediante la proporci on en la muestra ( p), se quiere cometer un error de estimaci on menor del 1 % y tener una conanza de, al menos, el 95 %? b ) A cu anta gente debe preguntar si se quiere cometer un error de estimaci on menor del 20 % y tener una conanza de, al menos, el 90 %? c ) A cu anta gente debe preguntar si se quiere cometer un error de estimaci on menor del 1 % y tener una conanza de, al menos, el 99 %? 5. Para estudiar el di ametro de las piezas producidas en una f abrica se ha considerado una muestra aleatoria de 10 piezas, cuyos di ametros han sido: 25, 26, 20, 21, 23, 22, 21, 25, 24, 26. Dicho di ametro puede suponerse que sigue una distribuci on normal. a ) Teniendo en cuenta que el intervalo de conanza para la media de una variable normal con desviaci on t pica no conocida al 95 % de conanza a partir de una muestra de s s n = 10 datos es x 2 26 , x + 2 26 , obt en un intervalo de conanza al 95 % n n para el di ametro medio poblacional. b ) Si estas piezas conllevan un largo proceso de producci on, que s olo permite analizar una pieza al d a y otro equipo de inspecci on se incorpora dos d as tarde, no dispondr a de los datos de las dos primeras piezas. Para paliar este problema, toma datos durante dos d as m as, obteniendo que los di ametros de las dos nuevas piezas son 21 y 27, cu al ser a el intervalo de conanza al 95 % obtenido por este otro equipo? coincide con el anterior? c ) Teniendo en cuenta que un intervalo de conanza para la varianza de una variable normal al 95 % de conanza a partir de una muestra de n = 10 datos es (n1)s2 (n1)s2 , 27 y considerando de nuevo los datos recogidos por el primer equipo, 19 obt en un intervalo de conanza al 95 % para la varianza del di ametro poblacional. d ) C omo ser a la amplitud del intervalo para la varianza al 90 %, mayor o menor que la del intervalo anterior? 6. Un hormig on de micros lice, reforzado con bra de acero y mezclado en h umedo (llamado shotcrete), ya se est a comercializando. A n de investigar la resistencia a la ruptura del nuevo producto, se consider o una muestra aleatoria de cincuenta trozos de shotcrete.

3.1. EJERCICIOS

37

Dichos trozos fueron sometidos a una comprensi on de 9000 psi hasta que fallaron, obteni endose a partir de dichos datos, que el tiempo medio de vida es 40 3 d as al 95 % de conanza. Determina, de forma justicada, si pueden o no ser verdaderas las siguientes armaciones: a ) El tiempo medio de vida del shotcrete est a entre 37 y 43 d as. b ) Con esos mismos datos se obtiene que el tiempo medio de vida es 40 2 d as al 99 % de conanza. c ) A partir de otra muestra aleatoria de 50 trozos de shotcrete se ha obtenido que el tiempo medio de vida es de 33 3 d as al 95 % de conanza. 7. Se han tomado datos para analizar la proporci on de anomal as en la producci on diaria de una empresa. Dichos datos han sido introducidos en R y con ellos se han obtenido los siguientes intervalos de conanza para dicha proporci on a los niveles 95 % y 99 %:

Por problemas de impresi on no se puede ver el nivel de conanza asociado a cada intervalo. Cu al es el intervalo al 95 % y cu al el intervalo al 99 %? 8. Responde razonadamente a las siguientes cuestiones: a ) Si el p-valor asociado a un contraste es 0 000, se rechaza la hip otesis nula? y si es 0 436? b ) Si realizado el contraste H0 : la distribuci on es normal H1 : la distribuci on no es normal el p-valor asociado al mismo es 0 212, qu e se concluye sobre la distribuci on? c ) Si se realiza el contraste H0 : la longitud media es de 15cm. H1 : la longitud media es distinta de 15cm. con 200 datos de dos l neas de producci on diferentes (100 de cada una), resultando en la primera un p-valor de 0 001 y en la segunda de 0 043. Qu e se concluye para cada una de las l neas de producci on sobre la longitud media del producto al nivel de signicaci on = 5 %? En cu al de las dos las conclusiones son m as ables? 9. Contesta razonadamente a las siguientes cuestiones:

38

TEMA 3. INFERENCIA ESTAD ISTICA a ) Cu al es la hip otesis nula en el test de normalidad de Shapiro-Wilk? b ) Si, realizado un test de normalidad de Shapiro-Wilk, el p-valor asociado al mismo es 0 256, se puede admitir la normalidad de los datos? c ) Si, realizado un test de normalidad de Shapiro-Wilk, el p-valor asociado al mismo es 0 002, qu e se concluye sobre la distribuci on?

10. Estamos interesados en contrastar si la resistencia promedio es menor o igual de 3 frente a la alternativa de que es mayor. Se realiza un test de normalidad de Shapiro-Wilk a los datos y se obtiene un p-valor 0 006. a ) Qu e test podr amos utilizar para estudiar la resistencia promedio? b ) Qui en es la hip otesis nula en este test?, y la alternativa? c ) Si el p-valor que se obtiene es 0000, qu e se concluye sobre la resistencia promedio? 11. Estamos interesados en contrastar si la resistencia promedio es menor o igual de 3 frente a la alternativa de que es mayor. Se realiza un test de normalidad de Shapiro-Wilk a los datos y se obtiene un p-valor 0 756. a ) Qu e test podr amos utilizar? b ) Si utilizamos el test t, cu al es la hip otesis nula en este test?, y la alternativa? c ) Si el p-valor que se obtiene es 0000, qu e se concluye sobre la resistencia promedio? 12. Un fabricante de parabrisas arma que el porcentaje de su producci on que no presenta ning un defecto es de al menos el 70 %. Cierto cliente duda de la armaci on. Qu e hip otesis debe plantear para contrastar que el fabricante tiene raz on frente a la alternativa de que no la tiene? Para realizar este contraste analiza 120 parabrisas, de los cuales 80 no presentan ning un defecto y el p-valor es 0 213, qu e se puede concluir? 13. En una empresa quieren decidir entre si el porcentaje de d as que cierta m aquina est a operativa es mayor o igual del 80 % o la alternativa de que es inferior al 80 %. Cu ales ser an las hip otesis a contrastar? Para ello se observa la m aquina durante 100 d as (muestra 1) y se obtiene que 72 de ellos estuvo operativa. Otro equipo t ecnico observa la misma m aquina durante otros 100 d as (muestra 2) y obtiene que 67 d as estuvo operativa. Para ambas muestras se obtuvieron los siguientes resultados mediante el R: SALIDA 1: data: rbind(.Table), null probability 0.8 X-squared = 10.5625, df = 1, p-value = 0.000577 alternative hypothesis: true p is less than 0.8 SALIDA 2: data: rbind(.Table), null probability 0.8 X-squared = 4, df = 1, p-value = 0.02275 alternative hypothesis: true p is less than 0.8

3.1. EJERCICIOS

39

Cu al de las dos salidas se corresponde con la primera muestra y cu al con la segunda? Qu e se concluye en cada uno de los dos casos? En cu al de ellos tenemos m as conanza en nuestra conclusi on? 14. El a no anterior el porcentaje de piezas defectuosas en una empresa fue del 1 %. Este a no se cree que debido a ciertas restricciones presupuestarias, la calidad de la producci on ha decrecido y dicho porcentaje ha aumentado. Para analizar esto se han considerado 200 piezas de las producci on del a no actual, obteni endose que s olo 3 de ellas eran defectuosas. Cu ales ser an las hip otesis a plantear para contrastar que el porcentajede defectuosas se ha mantenido frente a la alternativa de que ha aumentado? Si se obtiene que el p-valor para el contraste anterior es 0 239, qu e se puede concluir en funci on de dicho p-valor? 15. Si queremos analizar si el porcentaje de defectuosos es diferente en la m aquina 1 que en la 2 y se han tomado 200 datos en la primera m aquina y 150 en la segunda, cu ales ser an las hip otesis a contrastar? Qu e se concluye si el p-valor es 0 000? 16. Una empresa sospecha que el porcentaje de entregas que le hace a tiempo el proveedor 1 es superior al del proveedor 2. qu e hip otesis se deben plantear para contrastar que lo que sospecha la empresa no es cierto frente a la alternativa de que lo es? Si despu es de analizar 300 de las entregas de 1 y 200 de 2, se obtiene un p-valor de 0 145, qu e se puede concluir? 17. Para comprobar que el porcentaje de graduados que encuentran trabajo en menos de 6 meses tras nalizar sus estudios es superior en la Escuela de Ingenier a A que en la B, se encuest o a 120 y 130 graduados en A y B respectivamente. Qu e hip otesis se deben plantear? Tras analizar los datos se obtiene la siguiente salida de R:

2-sample test for equality of proportions without continuity correction data: .Table X-squared = 0.5379, df = 1, p-value = 0.2316 alternative hypothesis: greater 95 percent confidence interval: -0.04748483 1.00000000 sample estimates: prop 1 prop 2 0.8000000 0.7615385 A qu e conclusiones se puede llegar? 18. Si queremos analizar si la varianza de la temperatura de salida es menor o igual en la m aquina 1 que en la 2 frente a la alternativa de que es mayor (suponiendo normalidad), cu ales ser an las hip otesis a contrastar? Qu e se concluye si el p-valor es 0 003?

40

TEMA 3. INFERENCIA ESTAD ISTICA

19. Para comparar la temperatura promedio de salida de los productos producidos en dos m aquinas distintas se toman datos para 250 de estos productos en cada m aquina y se contrasta si ambos promedios son iguales frente a la alternativa de que son distintos. a ) Suponiendo normalidad y varianzas iguales, qu e test ser a el adecuado para comparar la temperatura promedio en ambas m aquinas? b ) Si el p-valor asociado a dicho test es 0 234, qu e se concluye? c ) Qu e test se utilizar a si los datos muestrales no procediesen de sendas distribuciones/poblaciones normales? d ) Qu e se concluir a si el p-valor asociado a dicho test fuese 0 234? 20. Para comparar dos m etodos de reparaci on de grietas en parabrisas, se estudia la resistencia que ofrece el cristal una vez reparado. a ) Tras aplicar el test de normalidad de Shapiro-Wilk a la muestra de parabrisas reparados con el primer m etodo se obtuvo un p-valor de 0 18. Para la muestra correspondiente al segundo m etodo el p-valor fue 0 097. Qu e se puede concluir en cada caso sobre la distribuci on? b ) Para comparar las varianzas, qu e contraste aplicar as? c ) El p-valor asociado al test de igualdad de varianzas fue 0 105, se puede asumir que las varianzas son iguales? d ) Por u ltimo, para estudiar si la resistencia media con el primer m etodo es superior, qu e hip otesis plantear as? Si se aplicaron dos contrastes de comparaci on de medias y se obtuvo la siguiente tabla, qu e se concluye sobre la resistencia media? Test t para muestras independientes... p-valor ... suponiendo varianzas iguales 0 064 ... sin suponer varianzas iguales 0 041 21. Se compara el di ametro de las perforaciones de dos troqueladoras. Ante las salidas de R que se muestran a continuaci on y suponiendo normalidad, a qu e conclusi on se llega sobre si el di ametro medio con la segunda troqueladora es mayor?
F test to compare two variances data: diametro by troqueladora F = 0.5129, num df = 39, denom df = 49, p-value = 0.03315 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2836436 0.9469357 sample estimates: ratio of variances 0.5128867

3.1. EJERCICIOS

41

Two Sample t-test (Test t para muestras independientes-varianzas iguales) data: diametro by troqueladora t = -3.1086, df = 88, p-value = 0.001266 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf -0.895603 sample estimates: mean in group 1 mean in group 2 6.375 8.300

Welch Two Sample t-test (Test t para muestras indep.-no varianzas iguales) data: diametro by troqueladora t = -3.2232, df = 87.027, p-value = 0.0008925 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf -0.9320655 sample estimates: mean in group 1 mean in group 2 6.375 8.300

22. Se comparan dos procesos de galvanizado. Para determinar si el primer proceso es mejor (el tiempo que tarda en producirse corrosi on es superior, en promedio) se analizaron 20 piezas sometidas al primer proceso y 25 sometidas al segundo. a ) Despu es de aplicar el test de Shapiro-Wilk a las dos muestras se obtuvo un p-valor de 0 248 para la primera y de 0 0014 para la segunda. Qu e se puede concluir sobre la distribuci on en cada caso? b ) Qu e test se debe utilizar entonces para comparar el tiempo promedio hasta la corrosi on? c ) Si al aplicar el test del apartado anterior para contrastar si el tiempo que tarda en producirse corrosi on es menor o igual, en promedio, en el primer proceso que en el segundo, frente a la alternativa de que es mayor, se obtiene un p-valor de 0 002, qu e se concluye? d ) Si en el test de Shapiro-Wilk los p-valores obtenidos hubiesen sido 0 091 y 0 329, qu e test aplicar as para comparar los tiempos promedio? (Sup on que las varianzas son diferentes). e ) Y para este contraste, cu ales ser an las hip otesis a plantear? Cu al ser a la conclusi on si el p-valor obtenido fuese 0 0871? 23. Para comparar la temperatura de un producto antes y despu es de entrar en la fase de recubrimiento se toman datos para 250 de estos productos.

42

TEMA 3. INFERENCIA ESTAD ISTICA a ) Suponiendo normalidad, qu e test ser a el adecuado para comparar la temperatura promedio antes y despu es? b ) Si el p-valor asociado a dicho test es 0 234, qu e se concluye? c ) Qu e habr a que hacer si no se pudiese suponer la normalidad? d ) Qu e se concluir a si el p-valor asociado a dicho test fuese 0 234?

24. Para estudiar si el di ametro promedio de cierta pieza a 0 grados es signicativamente inferior que a 100 grados, se tomaron 20 unidades que se sometieron a las dos temperaturas anotando el di ametro en cada caso. a ) Suponiendo normalidad, qu e test aplicar as para comparar el di ametro promedio a las dos temperaturas? b ) Cu ales ser an las hip otesis para contrastar que el di ametro a 0 grados es superior o igual, en promedio, que el di ametro a 100 grados fretne a la alternativa de que es inferior? c ) Si el p-valor obtenido fuese 0 0381, qu e se concluir a? d ) Sup on ahora que no hay normalidad, qu e test habr a que aplicar para comparar los di ametros promedio? e ) Si con este u ltimo test se obtuviese un p-valor de 0 00012, qu e se concluir a? 25. Para comprobar si cierto rozamiento desgasta los tornillos de unas h elices, se anot o el di ametro de la cabeza de 200 tornillos antes y despu es de ser sometidos al rozamiento. a ) Si se puede asumir normalidad, qu e test aplicar as para estudiar si hay desgaste en promedio? y cu ales ser an las hip otesis nula y alternativa para contrastar que no se ha producido desgaste frente a la alternativa de que s se ha producido? b ) Si para ese test se obtiene un p-valor de 0 415, qu e se concluye? c ) Si del test de Shapiro-Wilk se concluye que los datos no proceden de una poblaci on normal, qu e test aplicar as?

3.2.

Preguntas de opci on m ultiple (test)

1. Para una muestra aleatoria de tama no 100, se ha obtenido una media muestral x = 25 y una desviaci on t pica muestral s = 6. A partir de estos datos se ha obtenido que el intervalo de conanza de la media poblacional al 94 % es aproximadamente: a ) (44 33, 90 32) b ) (123 32, 123 33) c ) (85 95, 104 05) d ) (23 86, 26 14)

MULTIPLE 3.2. PREGUNTAS DE OPCION (TEST)

43

2. Para una muestra aleatoria de tama no 200, se ha obtenido que un intervalo de conanza para la media poblacional al 95 % es (11 3, 12 7). Entonces podr a darse el caso de que, con esos mismos datos, obtuvi esemos que: a ) (11 1, 12 9) es un intervalo de conanza de la media poblacional al 90 %, pero no a un nivel superior. b ) (11 4, 12 6) es un intervalo de conanza de la media poblacional al 99 %, pero no a un nivel superior. c ) (11 2, 12 8) es un intervalo de conanza de la media poblacional al 85 %, pero no a un nivel superior. d ) Las opciones a), b) y c) son todas falsas. 3. Si se desea obtener un intervalo de conanza para la media poblacional y se preja el nivel de conanza, al aumentar el tama no de la muestra, suponiendo que la desviaci on t pica muestral no cambia, se espera que la amplitud del intervalo: a ) Aumente b ) Se mantenga constante c ) Disminuya d ) Se multiplique por dos 4. Si se desea obtener un intervalo de conanza para la media de una distribuci on normal y se dispone de una muestra aleatoria de tama no n = 100, suponiendo que la desviaci on t pica muestral no cambia, al aumentar el nivel de conanza la amplitud del intervalo: a ) Aumenta b ) Se mantiene constante c ) Disminuye d ) Se divide entre dos 5. En una empresa saben que el tiempo, en horas, perdido por accidente laboral sigue una distribuci on normal N (, 2), siendo desconocida. El m nimo tama no muestral para estimar con un error de estimaci on menor o igual que 1 y un nivel de conanza del 95 % es: a ) n = 16 b ) n = 30 c) n = 8 d ) n = 100

44

TEMA 3. INFERENCIA ESTAD ISTICA 6. Un instituto de opini on p ublica quiere hacer una encuesta para estimar la proporci on de individuos que se maniestan dispuestos a comprar un nuevo producto. El n umero de personas a las que se debe de preguntar si se quiere cometer un error menor de 01 con una probabilidad de al menos 099 es suciente con que sea: a ) Menor de 50 b ) Menor de 75 c ) Menor de 100 d ) Mayor de 165 7. El p-valor o nivel cr tico de un contraste: a ) Se ja por el investigador b ) Viene dado por los resultados de la muestra c ) Cuanto mayor es, mayor es la conanza en H0 d ) Siempre tiene que ser mayor que el nivel de signicaci on 8. La distribuci on del volumen de llenado (en gr.) de unas botellas de detergente l quido es aproximadamente normal. Para dicho proceso, se toma una muestra aleatoria de 20 botellas. De acuerdo con estos datos, si se contrasta la hip otesis nula H0 : 2 (el proceso est a estable) frente a la alternativa H1 : > 2 (hay que revisar el proceso), se obtiene un p-valor igual a 3 87 106 , por lo tanto, a ) Se rechazar a H0 al nivel de signicaci on = 0 05 b ) Se rechazar a H0 al nivel de signicaci on = 0 01 c ) No se rechazar a H0 al nivel de signicaci on = 0 1 d ) No se rechazar a H0 al nivel de signicaci on = 0 2 9. A partir de una muestra aleatoria de tama no n = 30 se pretende contrastar si la distribuci on es normal. Se aplica el test de Shapiro-Wilk y se obtiene un p-valor que nos permite concluir con el rechazo de la hip otesis de normalidad al nivel de signicaci on 0 05. Con estos datos se puede asegurar el rechazo de la hip otesis de que la distribuci on de la variable es normal al nivel de signicaci on: a ) 002 b ) 001 c ) 01 d ) 02

MULTIPLE 3.2. PREGUNTAS DE OPCION (TEST)

45

10. Para contrastar si la media de una poblaci on normal es mayor de 25, es decir, para realizar el contraste H0 : 25 frente a H1 : > 25, se toma una muestra de tama no 121 y se obtiene una varianza muestral s2 = 144 y una media muestral x = 28. Con estos datos, se obtiene que el p-valor asociado al contraste anterior es 0 006, lo que nos permite armar, al nivel = 0 10, que: a ) Se rechaza H0 b ) No se rechaza H0 c ) No se puede saber d ) A ese nivel se rechaza H0 , pero al nivel 0 9 no 11. A partir de una muestra aleatoria de tama no 20, se estudia si el tiempo promedio que cierto proceso industrial tarda en completarse es inferior a 4 horas. Sabiendo que dicho tiempo no sigue distribuci on normal, qu e test aplicar as para estudiar si el promedio es inferior a las 4 horas? a ) Tanto el test t, como el test de Wilcoxon para una muestra b ) Depende del resultado del test de Levene c ) Test t para una muestra d ) Test de Wilcoxon para una muestra 12. Se estudia la temperatura que alcanzan ciertas m aquinas durante su funcionamiento. Los datos resultantes de observar 40 m aquinas, se analizan con R y se obtienen las salidas: Shapiro-Wilk normality test data: Tempe$temperatura W = 0.9695, p-value = 0.3464 One Sample t-test data: Tempe$temperatura t = 0.7998, df = 39, p-value = 0.2143 alternative hypothesis: true mean is greater than 90 95 percent confidence interval: 87.50982 Inf sample estimates: mean of x 92.25 Qu e hip otesis se plantean en el One Sample t-test?

46 a ) H0 : 90 frente a H1 : > 90 b ) H0 : 90 frente a H1 : < 90 c ) H0 : = 90 frente a H1 : = 90 d ) No se puede saber

TEMA 3. INFERENCIA ESTAD ISTICA

13. En el problema anterior, qu e se puede concluir sobre la temperatura promedio que alcanzan las m aquinas? a ) Puesto que la muestra no procede de una poblaci on normal, no podemos concluir nada a partir del One Sample t-test b ) Que la temperatura media alcanzada es superior a 90 grados c ) No hay evidencias para armar que la temperatura media alcanzada es superior a 90 grados d ) Las opciones a), b) y c) son todas falsas 14. Se analiza la resistencia de cierto tipo de acero y tras aplicar el test de Shapiro-Wilk, se asume que hay normalidad. Entonces, qu e test se puede aplicar para estudiar la resistencia promedio? a ) S olo el test de Wilcoxon para una muestra b ) S olo el test t para una muestra c ) Se pueden aplicar ambos d ) No se puede utilizar ninguno 15. En el problema anterior, si se quiere analizar si la resistencia promedio es superior a 4 (H0 : 4 frente a H1 : > 4) y se obtiene un p-valor asociado igual a 0 002, se concluye que: a ) No se rechaza que la resistencia media sea menor o igual que 4 al nivel de signicaci on 0 05 b ) Se rechaza que la resistencia media sea menor o igual que 4 al nivel de signicaci on 0 05 c ) No se rechaza que la resistencia media sea menor o igual que 4 al nivel de signicaci on 01 d ) No se rechaza que la resistencia media sea menor o igual que 4 al nivel de signicaci on 0 08 16. Para estudiar si el porcentaje de piezas defectuosas obtenidas en cierto proceso es menor o igual del 5 % frente a la alternativa de que es mayor... a ) Se debe aplicar primero el test de Shapiro-Wilk para estudiar la normalidad

MULTIPLE 3.2. PREGUNTAS DE OPCION (TEST) b ) Se puede aplicar un test de la proporci on para una muestra c ) Se plantea como hip otesis nula H0 : p 0 05 frente a H1 : p > 0 05 d ) Se plantea como hip otesis nula H0 : p 0 05 frente a H1 : p < 0 05

47

17. Al estudiar si el porcentaje de piezas defectuosas obtenidas en cierto proceso supera el 5 %, se obtiene un p-valor de 0 001305, qu e se puede concluir? a ) Que el porcentaje de piezas defectuosas supera el 10 % b ) Que el porcentaje de piezas defectuosas supera el 5 % c ) Que el porcentaje de piezas defectuosas no supera el 10 % d ) Que el porcentaje de piezas defectuosas no supera el 5 % 18. La compa n a de telefon a A quiere demostrar que el porcentaje de clientes satisfechos con su compa n a pA es superior que el porcentaje de satisfechos con la compa n a B, pB . Qu e hip otesis debe plantear para contrastar que la compa n a no tiene raz on frente a la alternativa de que la tiene? a ) H0 : pA pB frente a H1 : pA > pB b ) H0 : pA pB frente a H1 : pA < pB c ) H0 : pA = pB frente a H1 : pA = pB d ) H0 : pA = pB frente a H1 : pA = pB 19. En el problema anterior, si el p-valor obtenido es 0 073, se puede concluir que... a ) Al nivel de signicaci on 0 01 el porcentaje de satisfechos con A es superior. b ) Al nivel de signicaci on 0 05 el porcentaje de satisfechos con A es superior. c ) Al nivel de signicaci on 0 1 el porcentaje de satisfechos con A es superior. d ) Al nivel de signicaci on 0 1 el porcentaje de satisfechos con A no es superior. 20. Se compara si en promedio dos talleres de una empresa son igualmente productivos. Analizadas las producciones del primer taller en 20 semanas elegidas al azar y la del segundo en 30 semanas tambi en elegidas al azar y suponiendo normalidad, qu e test se debe aplicar antes de hacer la comparaci on de promedios? a ) Un test t para datos relacionados b ) Un test de Wilcoxon para muestras pareadas c ) Un test de Wilcoxon para dos muestras d ) Un test F para dos varianzas 21. En el problema anterior, tras comprobar que las varianzas son diferentes, se aplic o un test t para muestras independientes (Welch Two Sample t-test) obteni endose un p-valor de 0 022, qu e se puede concluir?

48

TEMA 3. INFERENCIA ESTAD ISTICA a ) Al nivel de signicaci on 0 01, que la producci on media es igual. b ) Al nivel de signicaci on 0 05, que la producci on media es igual. c ) Al nivel de signicaci on 0 1 que la producci on media es diferente. d ) Al nivel de signicaci on 0 005 que la producci on media es diferente.

22. Se compara la duraci on promedio de las bombillas de dos marcas. Tras aplicar el test de Shapiro-Wilk y comprobar que hay normalidad, se aplica el test F y se concluye que las varianzas son iguales. Entonces se aplica el test t para datos relacionados, obteni endose la salida de R siguiente: Paired t-test data: bombillas$antes and bombillas$despues t = -4.1969, df = 18, p-value = 0.000542 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -7.818885 -2.602168 sample estimates: mean of the differences -5.210526 qu e se puede concluir? a ) Al nivel de signicaci on 0 01, la duraci on media es igual b ) Al nivel de signicaci on 0 05, la duraci on media es igual c ) Al nivel de signicaci on 0 1 la duraci on media es diferente d ) No se puede concluir nada, porque las muestras son independientes y este test no servir a 23. Se compara la duraci on promedio de las bombillas de dos marcas. Tras aplicar sendos tests que permiten asumir las hip otesis de normalidad y varianzas iguales, se aplica el test t para muestras independientes, obteni endose la salida de R siguiente Two Sample t-test data: duracion by marca t = -0.912, df = 18, p-value = 0.3738 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -148.66678 58.66678 sample estimates: mean in group 1 mean in group 2 1179 1224

MULTIPLE 3.2. PREGUNTAS DE OPCION (TEST) Con qu e hip otesis se corresponde esta salida? a ) H0 : 1 > 2 frente a H1 : 1 2 b ) H0 : 1 2 frente a H1 : 1 > 2 c ) H0 : 1 2 frente a H1 : 1 < 2 d ) H0 : 1 = 2 frente a H1 : 1 = 2 24. En el problema anterior, qu e se puede concluir? a ) Al nivel de signicaci on 0 01, la duraci on media es igual. b ) Al nivel de signicaci on 0 05, la duraci on media es igual. c ) Al nivel de signicaci on 0 1 la duraci on media es diferente. d ) Al nivel de signicaci on 0 005 la duraci on media es diferente.

49

25. Para saber si el alcance de los dispositivos bluetooth fabricados por A es, en promedio, superior al de los fabricados por B, se observ o el alcance de 15 unidades de cada fabricante. Se comprob o que no hab a normalidad y se aplic o una prueba de Wilcoxon para dos muestras. Se obtuvo un p-valor de 0 067. Entonces al nivel de signicaci on 0 05 se puede decir que... a ) Hay diferencias signicativas para decir que el alcance para la marca A es, en promedio, mayor. b ) No hay evidencias signicativas para decir que el alcance para la marca A sea, en promedio, mayor. c ) Hay evidencias signicativas para decir que el alcance para la marca A es, en promedio, menor. d ) Hay evidencias signicativas para decir que el alcance para la marca B es, en promedio, menor. 26. Se comparan los dispositivos bluetooth fabricados por A y B, si ambos alcances siguen distribuci on normal, para estudiar la igualdad de las varianzas, aplicar as... a ) Un test t para muestras independientes. b ) Un test t para muestras pareadas. c ) Un test F para dos varianzas. d ) Un test de Levene. 27. Cuando se aplica un test F para comparar varianzas como paso previo en un test t de igualdad de medias para muestras independientes, las hip otesis a contrastar son: a ) H0 : 1 = 2 frente a H1 : 1 = 2
2 2 2 2 b ) H0 : 1 2 frente a H1 : 1 > 2

50 c ) H0 : 2 2 frente a H1 : 2 < 2
2 2 2 2 = 2 frente a H1 : 1 = 2 d ) H0 : 1

TEMA 3. INFERENCIA ESTAD ISTICA

28. Se quiere saber si la insonorizaci on mediante cierto m etodo de locales nocturnos hace que disminuya signicativamente el ruido promedio (en dB) recibido por los vecinos. Para ello se obtienen datos de 300 locales antes y despu es de la insonorizaci on. Al comprobar que hay normalidad, se aplica un test t para datos relacionados con hip otesis nula H0 : A D e hip otesis alternativa H1 : A > D , donde A representa el ruido medio antes de la insonorizaci on y D el ruido medio despu es. Para dicho test se obtiene un p-valor de 0 0000045. Qu e se puede concluir a partir de ese p-valor? a ) Que no hay diferencias signicativas antes y despu es de la insonorizaci on. b ) Que no se puede armar que el nivel promedio de dB recibido por los vecinos ha descendido. c ) Que el nivel promedio de dB recibido por los vecinos ha aumentado. d ) Que el nivel promedio de dB recibido por los vecinos ha descendido. 29. Para estudiar si cierto producto qu mico var a, en promedio, su densidad antes y despu es de ser transportado en avi on, se toman 15 muestras y se determinan sus densidades antes y despu es de un viaje en avi on. Tras comprobar que no hay normalidad, se aplica un test de Wilcoxon para muestras pareadas, obteni endose como p-valor 0 294. Qu e se puede concluir? a ) Que no hay evidencias signicativas de que la densidad, en promedio, sea distinta antes y despu es de ser transportado. b ) Que la densidad es diferente antes y despu es de ser transportado el producto, en promedio. c ) Que el transporte por avi on no provoca cambios signicativos en la densidad, en promedio. d ) Que la densidad disminuye signicativamente tras el transporte en avi on, en promedio. 30. Al aplicar un test de Wilcoxon para muestras pareadas para estudiar si la temperatura de cierto recipiente se mantiene frente a la alternativa de que desciende signicativamente de un momento de la producci on al siguiente, en promedio, se obtuvo un p-valor de 0 0273. Qu e se puede concluir? a ) Al nivel de signicaci on 0 05 se puede decir que la temperatura aumenta signicativamente del primer momento al segundo, en promedio. b ) Al nivel de signicaci on 0 05 se puede decir que la temperatura disminuye signicativamente del primer momento al segundo, en promedio. c ) Al nivel de signicaci on 0 01 se puede decir que la temperatura disminuye signicativamente del primer momento al segundo, en promedio.

3.3. SOLUCIONES DE LOS EJERCICIOS

51

d ) Al nivel de signicaci on 0 08 se puede decir que la temperatura disminuye signicativamente del primer momento al segundo, en promedio.

3.3.
1.

Soluciones de los ejercicios


a) B b) A c) B

2. 2 %. No la invalidan, puesto que no tenemos ninguna garant a de que la estimaci on coincida con el verdadero valor poblacional. 3. Estamos trabajando con una variable aleatoria X de media y desviaci on t pica , para la que se desea encontrar el tama no muestral m nimo n de forma que una muestra aleatoria de dicho tama no verique que |X n | = 0 5, con un nivel de conanza del 95 %. As pues, comenzaremos suponiendo que n 30 y aplicando el Teorema del L mite Central, con lo que tenemos que n 1 96
2

= 1 96

05

= 15 3664 2 .

Vamos a ir viendo qu e condiciones nos da esto para n, seg un los distintos valores de considerados en el ejercicio. a ) Si = 2, entonces hemos obtenido que la restricci on impuesta es cierta siempre que n 15 3664 2 = 15 3664(2)2 = 61 4656, con lo cual el tama no muestral es de 62. b ) Si = 1, en este caso tenemos que n 15 3664 2 = 15 3664(1)2 = 15 3664. Como adem as hemos empezado suponiendo que n 30, obtenemos que es necesario que n = 30 para que se cumplan ambas condiciones. 4. a ) n = 9604. b ) n = 30. c ) Queremos estimar la proporci on p de personas que est an a favor en la poblaci on. La forma de estimar (aproximar) este valor desconocido es tomando una muestra aleatoria simple de tama no n de la poblaci on y calculando la proporci on de personas a favor en dicha muestra ( p). Evidentemente, queremos que esta aproximaci on sea buena, en este caso, con un error menor del 1 %, es decir, buscamos el tama no muestral para que |p p| < = 0 01. Ahora bien, como p es desconocido, es imposible saber para qu e valores de n se verica que |p p| < 0 01, y lo m as que podemos asegurar es que esto se vericar a con una probabilidad alta, en este caso, 0 99. As pues, buscamos el m nimo valor de n que verica que n 2 576 1 2(0 01)
2

= 16589 4,

52

TEMA 3. INFERENCIA ESTAD ISTICA con lo cual el m nimo tama no muestral para tener las garant as del enunciado es de 16590 personas. 5.
...+26 a ) Para dicha muestra sabemos que x = 25+26+ = 23 3 y que 10 2 2 2 10 25 +26 +...+26 2 2 9 (23 3) = 4 9. s = 9 Aplicando la f ormula gen erica dada en el enunciado se tiene que el intervalo de conanza para con nivel de conanza del 95 % es

s s x 2 26 , x + 2 26 , 10 10 y en este ejercicio, puesto que x = 23 3 y s = 4 9 = 2 214, tenemos que el intervalo de conanza buscado es 2 214 2 214 23 3 2 2622 , 23 3 + 2 2622 10 10 = (21 718, 24 882).

b ) El segundo equipo consta de la siguiente muestra: 20, 21, 23, 22, 21, 25, 24, 26, 21, 27, con lo que la media y la varianza muestrales son ahora: x= 20 + 21 + . . . + 27 202 + 212 + . . . + 272 10 = 23 y s2 = (23)2 = 5 78. 10 9 9

As pues, de forma an aloga al apartado anterior, se obtiene el intervalo 5 78 5 78 23 2 26 , 23 + 2 26 = (21 282, 24 718), 10 10 que ser a el intervalo de conanza al 95 % obtenido por este otro equipo. No coincide con el otro equipo, puesto que cada muestra nos da lugar a un intervalo de conanza diferente. c ) Seg un los datos proporcionados en el enunciado podemos concluir que el intervalo s2 9s2 de conanza para 2 con nivel de conanza 95 % es 919 , 2 7 , es decir, el intervalo de conanza buscado, al nivel 95 %, es 949 949 , 19 27 = (2 321, 16 333).

d ) Ser a menor, puesto que si podemos tener menos conanza, con los mismos datos, nos podemos permitir dar un intervalo con menor amplitud. 6. a ) Falso, tenemos una conanza del 95 %, no del 100 %. Nunca podremos estar seguros al 100 % de que el verdadero valor est a entre los extremos del intervalo.

3.3. SOLUCIONES DE LOS EJERCICIOS

53

b ) Falso, con esos mismos datos, si el nivel de conanza aumenta, entonces la amplitud del intervalo tambi en, con lo cual el intervalo resultante tendr a que contener al (37, 43) y evidentemente el intervalo (38, 42) no lo contiene. c ) Verdadero, podr a darse este caso, puesto que seg un lo visto en el apartado a), no estamos nunca seguros de que incluya al verdadero valor, con lo que pueden darse, con distintos datos, intervalos disjuntos. 7. El primero es al 99 % al ser el de m as amplitud de los dos y el segundo es al 95 %. 8. a ) S se rechaza la hip otesis nula, porque ser a menor que , para cualquier valor habitual de (habitualmente [0 01, 0 1]). En el segundo caso no se rechazar a, porque es mayor que . b ) Que no hay evidencias en contra de suponer la normalidad de la distribuci on, puesto que el p-valor es alto y nos llevar a a no rechazar la hip otesis nula H0 . c ) En ambas l neas se concluir a que la longitud es distinta de 15cm., puesto que los p-valores asociados son en ambos casos menores que = 0 05. Supuestos ambos experimentos en igualdad de condiciones, son m as ables las conclusiones para la primera l nea de producci on, puesto que el p-valor es m as peque no, con lo que se rechazar a la hip otesis nula para m as valores de (para todos los valores de entre 0001 y 0043 se rechazar a para la primera l nea, pero no para la segunda). 9. a ) La hip otesis nula H0 es que la distribuci on de la variable en estudio es normal. b ) Los datos no aportan evidencias en contra de suponer la normalidad, con lo cual en caso de que sea necesaria, s se podr a admitir la normalidad. c ) Que no sigue una distribuci on normal. 10. a ) Puesto que se rechaza la normalidad, un test adecuado para este contraste es el de Wilcoxon para una muestra. b ) La hip otesis nula es H0 : M e 3 y la alternativa H1 : M e > 3. c ) La conclusi on ser a, al rechazar H0 , que la mediana es mayor que 3. 11. a ) Tanto el test t como el test de Wilcoxon para una muestra, puesto que podemos suponer la normalidad, pero usamos el test t por ser en general m as potente. b ) La hip otesis nula H0 es que la media es menor o igual que 3 (H0 : 3) y la alternativa H1 que la media es mayor que 3 (H1 : > 3). c ) Que es mayor que 3, puesto que se rechaza la hip otesis nula. 12. Las hip otesis a contrastar son H0 : p 0 7 frente a la alternativa H1 : p < 0 7. Seg un el p-valor obtenido, no se rechazar a H0 , es decir, se llegar a a la conclusi on de que no hay nada que indique que el porcentaje es menor del 70 %, es decir, no hay nada que indique que la armaci on del fabricante sea falsa.

54

TEMA 3. INFERENCIA ESTAD ISTICA

13. La hip otesis nula ser a H0 : p 0 8 y la alternativa H1 : p < 0 8 y con ambas muestras se rechaza la hip otesis nula al nivel = 0 05. Como para la primera muestra la proporci on 72 67 muestral de d as operativos es p 1 = 100 = 0 72 y para la segunda es p 2 = 100 = 0 67, es evidente que el rechazo es m as fuerte en el segundo caso, es decir, el p-valor es menor, con lo cual la SALIDA 1 se corresponde con la muestra 2 y la SALIDA 2 con la muestra 1. Como ya hemos comentado, en ambos casos a partir del p-valor obtenido se rechaza H0 , por tanto, se puede armar que el porcentaje de d as que la m aquina est a operativa es inferior al 80 %. Al ser el p-valor menor, con el mismo tama no muestral, estamos m as seguros de nuestra conclusi on en el caso de la muestra 2 que en el caso de la muestra 1. 14. Como hip otesis nula, H0 : p 0 01 y como alternativa, H1 : p > 0 01. Con ese p-valor no hay evidencias para decir que el porcentaje de defectuosos sea mayor del del a no anterior (1 %). 15. Las hip otesis a contrastar son H0 : p1 = p2 frente a la alternativa H1 : p1 = p2 . Seg un este p-valor, se rechaza H0 , con lo que se concluye que la m aquina 1 produce un porcentaje de defectuosos signicativamente diferente al que produce la m aquina 2. 16. La hip otesis nula es H0 : p1 p2 frente a la alternativa H1 : p1 > p2 . El p-valor es alto, por tanto no se rechaza H0 : no se puede armar que el porcentaje de entregas que hace a tiempo el proveedor 1 sea superior. 17. Las hip otesis a contrastar ser an H0 : pA pB frente a H1 : pA > pB , donde pA es la proporci on de graduados que encuentran trabajo en la Escuela A y pB el mismo porcentaje para B. A partir del p-valor obtenido (0 2316), no se rechaza H0 , es decir, no se puede armar que el porcentaje de graduados que encuentran trabajo en menos de 6 meses sea superior en la Escuela A que en la Escuela B.
2 2 2 2 18. Se contrastar a la hip otesis nula H0 : 1 2 frente a la alternativa H1 : 1 > 2 . Si el p-valor es 0 003, se rechaza H0 puesto que es menor que los valores habituales del nivel de signicaci on, con lo que se concluye que la varianza de la temperatura de salida es mayor en la m aquina 1 que en la 2.

19.

a ) El test t para muestras independientes (Two Sample t test). b ) Que no hay diferencias entre la temperatura media de las dos m aquinas. c ) El test de Wilcoxon para dos muestras. d ) De nuevo que no hay diferencias signicativas entre la temperatura de dos m aquinas, en promedio.

3.3. SOLUCIONES DE LOS EJERCICIOS 20.

55

a ) En ambos casos el p-valor es mayor que el nivel de signicaci on m as habitual ( = 0 05), entonces no se rechazar a la hip otesis nula: podemos suponer que ambas resistencias siguen distribuci on normal. b ) Puesto que se puede asumir que ambas muestras proceden de poblaciones normales, el test F para dos varianzas. La hip otesis nula de este test es que las varianzas son 2 2 2 = iguales (H0 : 1 = 2 ) y la alternativa, que las varianzas son diferentes (H1 : 1 2 ). 2 c ) Como el p-valor es superior a los niveles de signicaci on m as habituales, no se rechaza H0 , es decir, se puede asumir que las varianzas son iguales. d ) Como hip otesis nula, H0 : 1 2 ; como alternativa, H1 : 1 > 2 . Puesto que las varianzas son iguales, el p-valor que debemos considerar es 0 064. Entonces no se rechaza H0 . Esto signica que no hay nada que indique que la resistencia media es superior con el m etodo 1.

21. El objetivo de este estudio es comparar los di ametros medios, concretamente se quiere contrastar si H0 : 1 2 frente a H1 : 1 < 2 . Pero para comparar las medias, tenemos que saber si las varianzas son iguales o no. La primera salida que se muestra es un test F para dos varianzas. Como hay normalidad, es correcto utilizar este test para contrastar H0 : 1 = 2 frente a H1 : 1 = 2 y a partir del p-valor obtenido, 0 03315, se rechaza H0 , es decir, se puede armar que las varianzas son diferentes. Entonces, el test correcto para comparar los di ametros medios es el test t para muestras independientes suponiendo varianzas diferentes (Welch Two Sample t-test), que es la tercera salida. Adem as en ese caso pone alternative hypothesis: true difference in mean is less than 0 es decir, H1 : 1 2 < 0, que se corresponde con nuestro estudio. Finalmente, con ese p-valor, 0 0008925, se rechaza H0 . Se puede armar que el di ametro medio es mayor en la segunda troqueladora. 22. a ) En la primera muestra el p-valor es 0 248, entonces se puede suponer que el tiempo hasta la corrosi on sigue distribuci on normal para las piezas sometidas al primer proceso. El p-valor de la segunda es demasiado peque no, entonces no se puede asumir que la segunda muestra procede de una poblaci on normal. b ) Como no hay normalidad, el test de Wilcoxon para dos muestras. c ) El p-valor 0 002 es inferior a los niveles de signicaci on habituales. Por tanto, hay evidencias para armar que el tiempo es superior con el primer proceso, en promedio. d ) Con esos p-valores, se puede asumir que las dos muestras proceden de poblaciones normales. Como las varianzas son diferentes, el test t para muestras independientes suponiendo varianzas diferentes (Welch Two Sample t-test).

56

TEMA 3. INFERENCIA ESTAD ISTICA e ) Las hip otesis a plantear ser an H0 : 1 2 frente a H1 : 1 > 2 donde i es el tiempo medio hasta la corrosi on con el proceso i. Con ese p-valor no habr a evidencias para armar que el tiempo medio de corrosi on es superior con el primer proceso.

23.

a ) El test t para datos relacionados (Paired t test). b ) Que no hay diferencias signicativas entre la temperatura promedio antes y despu es de la fase de recubrimiento. c ) Aplicar el test de Wilcoxon para muestras pareadas. d ) Que no hay nada en contra de suponer que los dos promedios son iguales.

24.

a ) Un test t para datos relacionados (Paired t test). b ) Se plantear a H0 : 1 2 frente a H1 : 1 < 2 donde 1 es el di ametro medio a 0 grados y 2 el di ametro medio a 100 grados. c ) Puesto que es menor que el nivel de signicaci on habitual ( = 0 05), se rechaza H0 , es decir, hay evidencias para armar que el di ametro medio es inferior a 0 grados que a 100 grados. d ) Si no hay normalidad, se utilizar a el test de Wilcoxon para muestras pareadas. e ) A partir de ese p-valor se concluye que hay evidencias a favor de que el di ametro, en promedio, aumenta de estar la pieza a 0 grados a estar a 100 grados.

25.

a ) El test t para datos relacionados. Las hip otesis ser an, en este caso, H0 : 1 2 frente a H1 : 1 > 2 donde 1 es el di ametro medio antes del rozamiento y 2 el di ametro medio despu es. b ) Que no hay evidencias para armar que el di ametro medio se reduce con el rozamiento. c ) El test de Wilcoxon para muestras pareadas.

MULTIPLE 3.4. SOLUCIONES DE LAS PREGUNTAS DE OPCION (TEST)

57

3.4.

Soluciones de las preguntas de opci on m ultiple (test)


1. d) 2. d) 3. c) 4. a) 5. a) 6. d) 7. b) y c) 8. a) y b) 9. c) y d) 11. d) 12. a) 13. c) 14. c) 15. b) 16. b) y c) 17. b) 18. a) 19. c) 20. d) 21. a) y c) 22. d) 23. d) 24. a) y b) 25. b) 26. c) 27. d) 28. d) 29. a) y c) 30. b) y d)

10. a)

S-ar putea să vă placă și