Sunteți pe pagina 1din 9

UNIVERSIDAD

EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

Distribución Normal
1. Las calificaciones de un examen estándar de ingreso a una Universidad están
normalmente distribuidas con media de 78 y varianza de 36.
a. Cuál es la probabilidad de que una persona que presente dicho examen alcance
calificaciones superiores a 72 (Rta: 0,1587 )
b. Suponga que los estudiantes que alcanzan el 10% más alto de esta distribución
reciben una calificación de A. Cuál es la calificación mínima que el estudiante
debe recibir para ganar la calificación de A. (Rta: 85,68)

2. Varios test de inteligencia dieron una puntuación que sigue una ley normal con media
100 y desviación típica 15.
a. Determinar el porcentaje de población que obtendría un coeficiente entre 95 y
110. (Rta: 37,81%)
b. ¿Qué intervalo centrado en 100 contiene al 95% de la población? (Rta: (70,6-
129,4))
c. En una población de 2500 individuos ¿cuántos individuos se esperan que tengan
un coeficiente superior a 125? (Rta: 119 individuos)

3. La empresa Toby Truck determina que, en una base anual, la distancia recorrida por
camión se distribuye normalmente con una media de 50.000 km y una desviación
estándar de 12.000 km.
a. Qué proporción de camiones se espera que recorra entre 34.000 y 50.000 km en
el año. (Rta. 40,88%)
b. Qué porcentaje de camiones espera que recorran por debajo de 30.000 km en el
año. ( Rta. 4.78%)
c. Cuantas millas habrán sido recorrídas por al menos el 80% de los camiones.
(Rta. 39.900 km)

4. Un análisis estadístico de las llamadas de larga distancia realizadas desde la oficina de


una corporación indica que la duración de esas llamadas se distribuye normalmente con
una media de 240 segundos y una desviación estándar de 40 segundos
a. Cuál es la probabilidad de que una llamada ayuda durado menos de 180
segundos.? (Rta. 0.0668)
b. Cuál es la probabilidad de que una llamada específica haya durado entre 180 y
300 segundos? (Rta. 0.8664)
c. Cuál es la probabilidad que la llamada hayan durado más de dos 260 segundos?
(Rta. 0.3085)
d. Cuál es la duración de una llamada en particular si sólo el 1% de todas las
llamadas son más cortas (Rta. 146,95 minutos)

5. Un productor de jugo de naranja compra todas sus naranjas de un gran cultivador. La


cantidad de jugo exprimido de cada una de esas naranjas se distribuye
aproximadamente de forma normal con una media de 4.7 onzas y una desviación
estándar de 0.4 onzas.
a. Cuál es la probabilidad de que una naranja elegida aleatoriamente contenga
entre 4.7 y 5.0 onzas. (Rta. 0,2734)
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

b. Cuál es la probabilidad de que una naranja elegida aleatoriamente contenga más
de 5.5 onzas. (Rta. 0.0228)
c. El 77% de las naranjas contendrán por lo menos cuántas onzas de jugo (Rta. 5
onzas)

Teorema del Límite Central


6. El tiempo en que el cajero de un banco atiende a un cliente es una variable aleatoria con
media µ=3.2 minutos y una desviación estándar σ=1.6 minutos. Si se observa una
muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio con
el cajero sea:
a. como lo máximo 2.7 minutos.
b. más de 3.5 minutos.
c. al menos 3.2 minutos, pero menos de 3.4 minutos.

7. Hay 40 estudiantes en un curso de estadística básica. Con base en los años de


experiencia el profesor sabe que el tiempo para calificar un examen seleccionado al azar
es una variable aleatoria con valor esperado de 6 minutos y desviación estándar de 6
minutos.
a. Si los tiempos para calificar son independientes y el profesor empieza a calificar
a las 6:50 pm y lo hace en forma continua. Cual es la probabilidad de que
termine de calificar antes de que empiecen las noticias de las 11:00 pm por TV?
b. Si la sección deportiva empieza a las 11:10 pm. Cual es la probabilidad de que
se pierda parte de esa sección, si espera hasta terminar para encender el
televisor?

Distribución binomial aproximada usando la normal


8. En una encuesta de 1002 individuos, 701 dijeron que habían votado en una elección
presidencial reciente (según datos del ICR Research Group). Los registros de votos
indican que el 61% de los votantes potenciales realmente votaron. Dado que el 61% de
los votantes potenciales realmente votaron, calcule la probabilidad de que entre 1002
votantes potenciales seleccionados al azar, al menos 701 hayan votado realmente.
¿Qué sugiere el resultado? 


9. El cobro por los anuncios en un programa de televisión se basa en el número de


televidentes, el cual se mide por medio del índice de audiencia. El índice de audiencia es
un porcentaje de la población de 110 millones de hogares con televisor. El programa de
televisión 60 Minutes de la CBS recientemente tuvo una audiencia del 7.8%, lo que
indica que el 7.8% de los hogares estaban sintonizando ese programa. Un anunciante
realiza una encuesta independiente de 100 hogares y descubre que sólo 4 de ellos
estaban sintonizando 60 Minutes. Suponiendo que la audiencia de 7.8 es correcta,
calcule la probabilidad de encuestar de manera aleatoria 100 hogares y encontrar que 4
o menos están sintonizando 60 Minutes. ¿El resultado sugiere que la audiencia de 7.8%
es demasiado alta? ¿El anunciante tiene bases para reclamar un reembolso
argumentando que el tamaño de la audiencia se exageró?
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

10. Experimento de hibridación de Mendel. Cuando Mendel realizó sus famosos


experimentos de hibridación, utilizó plantas de guisantes con vainas verdes y vainas
amarillas. Uno de los experimentos implicó una cruza de guisantes, de manera que se
esperaba que el 25% (o 145) de los 580 vástagos de guisantes tuvieran vainas
amarillas. En vez de ob- tener 145 plantas de guisantes con vainas amarillas, obtuvo
152. Suponiendo que el por- centaje del 25% de Mendel es correcto, estime la
probabilidad de obtener al menos 152 plantas de guisantes con vainas amarillas entre
los 580 vástagos de guisantes. ¿Existe una fuerte evidencia que sugiera que la
probabilidad del 25% de Mendel es incorrecta? 


Intervalos de Confianza
Para la media con σ conocido
11. Una empresa de material eléctrico fabrica bombillas de luz que tienen una duración
aproximadamente normal, con una desviación estándar de 40 horas. Si una muestra de
30 bombillas tiene una duración promedio de 780 horas, encuentre un intervalo de
confianza de 96% para la media de la población de todas las bombillas que produce esta
empresa.

12. El gerente de una tienda de artículos para pintar quiere estimar la cantidad real de
pintura contenida en lata de un galón compradas a un proveedor conocido a nivel
Nacional. Se sabe, a partir de las especificaciones del fabricante, que la desviación
estándar de la cantidad de pintura es igual a 0.02 galones. Se selecciona una muestra
aleatoria 50 latas y la media muestral de la cantidad de pintura contenida en una lata es
de 0.995 por galón. Construya una estimación del intervalo de confianza del 99% de la
media poblacional de la cantidad de pintura contenida en las latas de un galón.

13. El dueño de un restaurante que sirve comida rápida desea establecer un intervalo para
la cantidad promedio de dinero que gastan sus clientes. En un estudio realizado
previamente se obtuvo que la desviación estándar poblacional era de $7.200. Se tomó
una muestra de 60 clientes y se obtuvo que la cantidad gastada en promedio fue de
$25.800. Construya un intervalo de confianza con un nivel de confianza del 90% para la
cantidad de dinero gastado por los clientes en dicho restaurante.

Para la media con σ desconocido (Se conoce S)


14. Las estaturas de una muestra aleatoria de 50 estudiantes hombres de una universidad
muestra una media de 174.5 cm y una desviación estándar de 6.9 cm. Construya un
intervalo de confianza con un nivel de confianza el 98% para la estatura media de todos
los estudiantes de la universidad.
15. Una empresa aseguradora vende un seguro de vida, cuyo proceso de aprobación
consiste en suscribir, lo que incluye revisar la solicitud, realizar un control del centro de
formación médica, realizar posibles peticiones para información médica adicional y
exámenes médicos, y una fase de compilación de la póliza, donde las páginas de la
póliza se generan y se envían para su entrega. Para la empresa, la capacidad de
entrega oportuna de las pólizas aprobadas a los clientes es esencial para la rentabilidad
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

de este servicio. Se seleccionó una muestra aleatoria 27 pólizas aprobadas durante el
periodo de un mes ,el tiempo promedio de procesamiento de dichas pólizas fue de 43,9
días y la desviación estándar muestral fue de 25.3 dias. Construya una estimación del
intervalo de confianza del 95% de la media del tiempo de procesamiento.

16. En un laboratorio clínico se está desarrollando un proyecto para reducir el tiempo de


procesamiento de las pruebas. Después de incorporar cambios al proceso, el equipo de
mejoramiento de calidad recolectó una muestra de 50 tiempos de procesamiento. En
esta muestra, la media del tiempo de procesamiento fue de 32 horas con una desviación
estándar muestral de 9 horas. Construya un intervalo de confianza con un nivel de
confianza del 92% para la media poblacional del tiempo de procesamiento de las
pruebas.

Para la proporcion poblacional π


17. Millones de estadounidenses organiza sus planes de viaje en Internet. En una encuesta
reciente, se reportó que el 77% de los encuestados compra boletos de avión en Internet.
Suponga que la encuesta se basó en mil sujetos que respondieron. Construya una
estimación del intervalo de confianza del 95% para la proporción poblacional de
estadounidenses que compra boletos de avión en Internet.

18. Una empresa telefónica desea estimar la proporción de hogares en los que se
contrataría una línea telefónica adicional. Se seleccionó una muestra aleatoria de 500
hogares. Los resultados indican que a un costo reducido, 135 de los hogares
contratarían una línea telefónica adicional. Construya un intervalo con un nivel de
confianza del 90% para la proporción poblacional de hogares que contratarían una línea
telefónica adicional

19. El departamento de recursos humanos de una empresa de cosméticos realizó una


encuesta entre las mujeres trabajadoras. De 1000 mujeres encuestadas, El 55%
pensaba que las empresas deberían reservar los puestos durante seis meses o menos
para aquellas con permiso de maternidad. Construya un intervalo de confianza del 95%
para la proporción de mujeres que creen que las empresas deberían reservar los
puestos durante seis meses o menos para aquellas con permiso de maternidad.

Determinación del tamaño de la muestra para estudios sobre la media µ


20. Se planea llevar a cabo una encuesta para determinar el tiempo medio que ven
televisión los ejecutivos corporativos. Una encuesta piloto indicó que el tiempo medio por
semana es de 12 horas, con una desviación estándar de tres horas. Se desea calcular el
tiempo medio que ven televisión con un margen de error de un cuarto de hora. Utilizando
un nivel de confianza del 95%,

a. Determine el tamaño de la muestra de ejecutivos que debe entrevistarse.


b. Suponga que los ejecutivos de una gran compañía son 700. ¿Cuántos ejecutivos
deberían encuestarse para hacer el estudio?
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

21. Un procesador de zanahorias corta las hojas, lava las zanahorias y las inserta en un
paquete. En una caja se guardan 20 paquetes para enviarse. Para controlar el peso de
las cajas se revisaron unas cuantas. El peso medio fue de 20.4 libras libras y la
desviación estándar de 0.5 libras. ¿Cuántas cajas debe tener la muestra para conseguir
con un nivel de confianza del 90%, que la media de la muestra no difiera de la media de
la población en más de 0.2 libras?

Determinación del tamaño de la muestra para estudios sobre la proporción π


22. Suponga que el presidente de Estados Unidos desea un cálculo de la proporción de la
población que apoya su actual política relacionada con la revisión del sistema de
seguridad social. El presidente quiere que el cálculo tenga un margen de error de
máximo 4% de la proporción real. Suponga un nivel de confianza del 92%.determine el
tamaño de la muestra suponiendo que la proporción que apoya la actual política es de
0.6
De qué tamaño debe ser la muestra si no hubiera disponible ningún estimador de la
proporción que apoya la actual política?

23. Las encuestas anteriores revelan que 30% de los turistas que van a Las Vegas a jugar
durante el fin de semana gasta más de 1000 dólares. La gerencia desea actualizar este
porcentaje. El nuevo estudio utilizará un nivel de confianza del 90%. El margen de error
será de máximo 1% de la proporción de la población.
a. ¿Cuál es el tamaño necesario de la muestra?
b. La gerencia indicó que el tamaño de la muestra determinado es demasiado
grande. ¿Qué se puede hacer para reducir la muestra? con base en su
sugerencia, vuelva a calcular el tamaño de la muestra.
c. Si el estudio se centrará solamente en un hotel que recibe 500 huéspedes cada
fin de semana. Calcule nuevamente el tamaño de la muestra.

Pruebas de Hipótesis
Para la media con σ conocido
24. Un fabricante de chocolates utilizan máquinas para empacar los dulces conforme pasan
por una línea de llenado. A pesar de que los paquetes están etiquetados con un
contenido de 8 onzas, la empresa quiere que tengan 8.17 onzas, de tal manera que
virtualmente ninguno los paquetes tenga menos de ocho onzas. De forma periódica se
selecciona una muestra de 50 paquetes y si se encuentran evidencia de que la cantidad
media suministrada es distinta de 8.17, se detiene el proceso de empacado. Suponga
que la cantidad media abastecida en una muestra particular de 50 paquetes es de 8.159
onzas. La desviación estándar poblacional es de 0.05. Existe evidencia de que la
cantidad media poblacional es diferente de 8.17 utilice un nivel de significancia de 0.05.

25. El Gerente de producción de una fábrica de telas necesita determinar si una máquina
recién adquirida está produciendo cierto tipo específico de tela de acuerdo con las
especificaciones de la empresa, las cuales señalan que debe tener una resistencia a la
ruptura de 70 libras y una desviación estándar de 3.5 libras. Una muestra 49 pedazos de
tela reveló una resistencia muestral media a la ruptura de 69.1 libras. Existe evidencia
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

de que la máquina no está cumpliendo con las especificaciones del fabricante en cuanto
la resistencia media a la ruptura. Utilice un nivel de significancia de 0.01.

26. La división de inspectores del departamento de pesos y medidas está interesada en


determinar si en las botellas de 2 litros procesadas en la planta embotelladora local,
perteneciente a una reconocida empresa, se ha colocado la cantidad apropiada de
bebida gaseosa. La embotelladora informó a la división de inspectores que la desviación
estándar de las botellas de 2 litros es de 0.05. Una muestra aleatoria conformada por
100 botellas de 2 litros, tomada de la planta embotelladora, señala una media muestral
de 1.99 litros. Con un nivel de significancia 0.05, ¿existe evidencia que la cantidad
medianas botellas es distinta de 2 litros?

Para la media con σ desconocido


27. En un artículo del USA Today (19 de junio de 2002) se afirmó que la media de una visita
típica al supermercado es de 22 minutos. Suponiendo que se pretende probar dicha
afirmación, usted selecciona una muestra de 50 compradores en el supermercado local.
El tiempo de compras medio para la muestra de 50 compradores fue de 25.36 minutos,
con una desviación estándar muestral de 7.24 minutos. Utilizando un nivel de
significancia de 0.10 ¿existen evidencias de que el tiempo de compras medio del
supermercado local es distinto al valor de 22 minutos que se afirma?

28. Una máquina expendedora de gaseosas fue diseñada para descargar en promedio siete
onzas de líquido por vaso. En una prueba de la máquina, 10 vasos de líquido se sacaron
de la maquina y se midieron. La media y la desviación estándar de las 10 mediciones
fueron 7.1 onzas y 0.12 onzas respectivamente. Utilizando un nivel de significancia de
0.10 ¿Estos datos presentan suficiente evidencia para indicar que la descarga media
difiere de siete onzas?

29. Las políticas de una sucursal bancaria especifican que sus cajeros automáticos deben
contener efectivo suficiente para satisfacer a los clientes que hacen retiros durante todo
el fin de semana. La aceptación del cliente depende de que tales servicios satisfagan
sus necesidades. En esta sucursal la cantidad media poblacional de dinero retirado el
cajero automático por transacción durante el fin de semana es de $160.000. Suponga
que en una muestra de 36 transacciones, se descubre que la cantidad media muestral
de dinero retirado es de $172.000, con una desviación estándar de $30.000. Utilizando
un nivel de significancia 0.05, ¿existen evidencias para creer que la cantidad media
poblacional retirada es mayor a $160.000?.

Para la proporción
30. Uno de los principales desafíos que enfrentan los comercializadores por Internet es su
capacidad para convertir a los visitantes en compradores. Esto se mide mediante la tasa
de conversión, que es el porcentaje de visitantes que compra algo al visitar el sitio. Un
artículo reciente informó que la tasa de conversión de una famosa empresa fue del
10.1%. Se seleccionó una muestra aleatoria 200 visitantes a este sitio de los cuales 24
visitantes realizaron una compra. Elaborar una prueba de hipótesis con un nivel de
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

significancia 0.05 y responder si existe evidencia de un aumento en la tasa de
conversión de dicha página.

31. Actualmente, las mujeres profesionales están renunciando a la maternidad, ante las
limitantes de tiempo que implica su desarrollo profesional. Aún así, muchas mujeres
todavía encuentran la manera de ascender en la escala corporativa y dedicar tiempo
para tener hijos. Una encuesta realizada a 187 mujeres profesionales asistentes a un
evento, reveló que 133 tenía por lo menos 1 hijo. Suponga que el grupo de 187 mujeres
es una muestra de una población compuesta por todas las mujeres ejecutivas exitosas.
Con un nivel de significancia 0.05, es posible afirmar que más de la mitad todas las
mujeres ejecutivas exitosas tienen hijos?

32. Si la producción diaria de una máquina en una fábrica produce más de un 10% de
artículos defectuosos, es necesario reparar la máquina. Se tomó una muestra aleatoria
de 120 piezas de la producción del día, la cual contiene 18 piezas defectuosas.
Utilizando un nivel de significancia de 0.01 determine si la máquina debe entrar a
proceso de reparación.

Pruebas de Hipótesis Chi Cuadrado – Prueba de Independencia

33. Un estudio de la cantidad de violencia en televisión en lo que respecta a la edad del


televidente dio los resultados que se muestran en la siguiente tabla, para 81 personas.
Cada una de las personas del estudio fue clasificada, de acuerdo con los hábitos de ver
televisión de la persona, como que ve poca violencia o mucha violencia. Con un nivel de
significancia de 0.05 determine si ver violencia depende o no de la edad del televidente.
Edad
Ve 16-34 35-54 55 y más
Poca Violencia 8 12 21
Mucha Violencia 18 15 7

34. En una universidad se está estudiando la implementación de una nueva política de


estacionamientos dentro de la universidad. Se llevó a cabo una encuesta dentro de los
estudiantes, profesores y personal administrativo con respecto a si estaban a favor o si
se oponían a dicha política. Los resultados se presentan en la siguiente tabla. Probar
con un nivel de significancia del 0.025 si la actitud ante la nueva política es
independiente de la condición de estudiante profesor o empleado de la administración.
Condición
Opinión Estudiante Profesor Administración
A favor 252 107 43
Se opone 139 81 40

35. De acuerdo con un estudio llevado a cabo, la mayoría de las personas piensan que son
buenos conductores. Los datos de la tabla siguiente muestran las opiniones según el
género. Pruebe con un nivel de significancia de 0.05 si la opinión de sí mismo como
conductor es independiente del género.
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

Opinión de si mismo como conductor
Género Excelente Bueno Regular
Hombre 43 48 9
Mujer 44 53 3

Regresión Lineal

36. El propietario de una empresa de mudanzas en la ciudad generalmente pide al


subgerente más experimentado que prediga el número total de horas de trabajo para
realizar una mudanza. Éste enfoque ha probado ya su utilidad, pero el dueño quiere
desarrollar un método más preciso para predecir las horas de trabajo usando la cantidad
de pies cúbicos por mudanza. En un esfuerzo preliminar para desarrollar un método más
preciso, se han recolectado datos de 36 mudanzas en las que el origen y el destino se
encontraban dentro de la ciudad, y el tiempo de viaje era una parte insignificante de las
horas trabajadas. En la siguiente tabla se presentan los datos.
Horas Pies Horas Pies Horas Pies
24 545 19,5 344 37 757
13,5 400 18 360 32 600
26,25 562 28 750 34 796
25 540 27 650 25 577
9 220 21 415 31 500
20 344 15 275 24 695
22 569 25 557 40 1054
11,25 340 45 1028 27 486
50 900 29 793 18 442
12 285 21 523 62,5 1249
38,75 865 22 564 53,75 995
40 831 16,5 312 79,5 1397
Para que puedan desarrollar este punto en Excel los datos se incluyen también en el archivo
MOVING.XLS.
a. Construya un diagrama de dispersión, ¿que se puede afirmar?
b. Suponiendo una relación lineal, utilice utilice el método de los mínimos
cuadrados para encontrar los coeficientes de la regresión b0 y b1
c. Interprete el significado de la pendiente b1 en este problema.
d. Prediga la media de horas de trabajo para una mudanza de 500 pies cúbicos

37. Una gran casa de envíos por correo considera que existe una relación lineal entre el
peso el correo que recibe y el número de ordenes que debe llenar. Desea investigar la
relación para predecir el número de órdenes con base en el peso del correo. Desde una
perspectiva operacional, conocer el número de ordenes ayudará a la planeación del
proceso de llenar órdenes. Se seleccionó una muestra 25 embarques de correo dentro
de un rango de 200 a 700 libras. Los resultados son los siguientes.
Peso (en No. De Peso (en No. De Peso (en No. De
libras) Ordenes libras) Ordenes libras) Ordenes
216 6,1 365 9,2 572 17,1
283 9,1 384 10,6 506 15
237 7,2 404 12,5 528 16,2
203 7,5 426 12,9 501 15,8
UNIVERSIDAD EAFIT

ANALISIS DE DATOS
TALLER PREPARACION PARCIAL FINAL

259 6,9 482 14,5 628 19
374 11,5 432 13,6 677 19,4
342 10,3 409 12,8 602 19,1
301 9,5 553 16,5 630 18
652 20,2

Para que puedan desarrollar este punto en Excel los datos se incluyen también en el archivo
MAIL.XLS.
a. Construya un diagrama de dispersión, ¿que se puede afirmar?
b. Suponiendo una relación lineal, utilice utilice el método de los mínimos
cuadrados para encontrar los coeficientes de la regresión b0 y b1
c. Interprete el significado de la pendiente b1 en este problema.
d. Prediga la media del número de órdenes si el peso del correo es de 500 libras

38. Al propietario de una cadena de tiendas de helados le gustaría estudiar el efecto de la


temperatura atmosférica en las ventas durante la temporada de verano. Se seleccionó
una muestra de 21 días consecutivos los datos se presentan a continuación.
Para que puedan desarrollar este punto en Excel los datos se incluyen también en el archivo
ICECREAM.XLS.
a. Construya un diagrama de dispersión, ¿que se puede afirmar?
b. Suponiendo una relación lineal, utilice utilice el método de los mínimos
cuadrados para encontrar los coeficientes de la regresión b0 y b1
c. Interprete el significado de la pendiente b1 en este problema.
d. Prediga las ventas para un día en que la temperatura sea de 83ºF
Temperatura Ventas Temperatura Ventas Temperatura Ventas
63 1,52 88 2,9 92 3,17
70 1,68 90 3,14 87 2,83
73 1,8 91 3,06 84 2,58
75 2,05 92 3,24 88 2,86
80 2,36 75 1,92 80 2,26
82 2,25 98 3,4 82 2,14
85 2,68 100 3,28 76 1,98

S-ar putea să vă placă și