Documente Academic
Documente Profesional
Documente Cultură
CONTENIDOS
PRACTICO 1. DISTRIBUCIONES EN EL
MUESTREO
Consideraciones generales
Las medidas de posicin y dispersin calculadas a partir de una poblacin se denominan
parmetros y son valores nicos, constantes, es decir que no cambian a menos que la
poblacin lo haga.
Los mismos estadsticos, pero calculados a partir de una muestra (de tamao n),
dependen de ella, por lo tanto varan al cambiar la muestra. Reciben el nombre de
estimadores y son variables aleatorias.
La distribucin en el muestreo resulta ser entonces la ley de distribucin de dichas
variables que hemos denominado estimadores. Nos interesar por lo tanto obtener adems
su valor esperado y su variancia.
En esta primera parte nos referiremos en particular a la media muestral y a la proporcin
muestral; en ambos casos demostraremos que su distribucin tiende a la distribucin
normal cuando n .
Se indica a continuacin la forma de caracterizar las medidas poblacionales y las
correspondientes muestrales:
Medida
Parmetro Estimador
media aritmtica
x
s2
variancia
2
s
desvo estndar
p
proporcin
p
Problemas resueltos:
Distribucin normal (Revisin del uso de tablas):
La produccin diaria de una fbrica es una variable normalmente distribuida con promedio
igual a 54 kilogramos y desvo estndar igual a 7 kilogramos.
a) Calcular la probabilidad de que la produccin de un da resulte inferior a 65
kilogramos.
b) Cul es la probabilidad de que maana se produzcan ms de 47 kilogramos?
c) En qu porcentaje de los das se produce entre 50 kilogramos y 60 kilogramos?
d) En qu porcentaje de los das la produccin supera los 20 kilogramos?
e) Cul es la produccin no superada en el 30% de los das?
f) Cul es la produccin slo superada en la cuarta parte de los das?
g) El encargado de produccin eleva un informe al dueo de la fbrica
comprometindose a producir diariamente determinada cantidad de kilogramos
como mnimo. En cunto debe fijar dicha cantidad mnima para que la
probabilidad de cumplir con el compromiso resulte igual a 0,95?
Solucin:
65 54
= PN ( z < 1,57 ) = F (1,57) = 0,94179
7
47 54
= PN ( z > 1) = 1 F (1)
7
a) PN ( x < 65 / = 54 ; = 7) = PN z <
b) PN ( x > 47 / = 54 ; = 7) = PN z <
= 1 0,15866 = 0,84134
60 54
50 54
z
= PN (0,57 z 0,86)
7
7
c) PN (50 x 60 / = 54 ; = 7) = PN
d) PN ( x > 20 / = 54 ; = 7) = PN z <
20 54
= PN ( z > 4,86) = 1 F (4,86) = 1 0 = 1
7
Respuesta: 100%
e) F ( z ) = 0,30
z = 0,524
f) F ( z ) = 1 0,25 = 0,75
z = 0,674
g) F ( z ) = 1 0,95 = 0,05
z = 1,645
x = 84
x = 18
a) n = 9 estudiantes
x = 84
x =
18
18
18
=6
3
18
=9
2
90 84
PN x 90 = PN z
= PN ( z 1) = F (1) = 0,84134
6
b) n = 4 estudiantes
x = 84
z = 1,645
x =
p = 0,36
p =
pq
=
n
0,36 0,64
= 0,03
256
0,40 0,36
b) n = 400
p = 0,64
p =
pq
0,64 0,36
=
= 0,024
n
400
p 0 =
244
= 0,61
400
0,61 0,64
PN ( p 0,61) = PN z
= PN ( z 1,25) = F (1,25) = 0,10565
0,024
Ejercitacin:
a) 0,86214
f) 78,23 %
b) 0,37828
c) 0,54
d) 1
g) US$ 4.248 h) US$ 5.363
i) US$ 5.452
Problema 3: Una multinacional llev a cabo un relevamiento de los sueldos anuales de sus
gerentes generales en los 14 pases donde opera. Los resultados (en miles de US$) fueron:
125
100
79
82
62
109
158
102
55
120
105
91
88
104
a) Calcule el promedio y el desvo estndar de los sueldos anuales de todos los gerentes
(son poblacionales o muestrales?)
b) Extraiga una muestra aleatoria de 5 sueldos y calcule su promedio y su desvo
estndar (son poblacionales o muestrales?). Si tomara otra muestra de 5 sueldos,
tambin al azar, se mantendran el promedio y el desvo? Cmo se comporta
entonces x ?
c) Indique qu error se est cometiendo si se estima la media poblacional basndose en
alguna de las medias calculada en el tem anterior.
RESPUESTAS:
c) error muestral
a) 0,38292
b) 0,86638
c) 0,98758
d) 1
0,0548 (aproximadamente 5 %)
Problema 6: Se extrae una muestra al azar de 16 elementos de una poblacin normal con
desvo estndar igual a 6. Calcular la probabilidad de que el promedio de dicha muestra
difiera del promedio poblacional en 2 unidades como mximo.
RESPUESTA:
0,81648
Problema 7: Sabiendo que una fbrica de repuestos produce con un 13% de defectuosos,
contestar:
a) Si se toma una muestra de 200 repuestos, cul es la probabilidad de que la
proporcin de repuestos defectuosos en la muestra resulte mayor a 0,10?
b) Recalcular la probabilidad pedida en el punto anterior para una muestra de 500
repuestos.
RESPUESTAS:
a) 0,89617
b) 0,97725
a) 0,00135
b) 0,99379
Problema 9: En una universidad donde el 32 % de los alumnos son mujeres, se tomar una
muestra de 240 alumnos. Calcular la probabilidad de que el porcentaje de mujeres en dicha
muestra difiera en ms de 3 puntos del porcentaje de mujeres en la universidad.
RESPUESTA:
0,31732
Revisin conceptual
Responda las siguientes preguntas:
a) Cul es la diferencia entre parmetro y estimador?
b) Qu es un estimador insesgado? De algn ejemplo.
c) Cul es la diferencia entre una estimacin eficiente y una ineficiente?
d) Qu estadstico usara para estimar la media poblacional? La media de la muestra
o la mediana? Por qu?
e) Un contador selecciona una muestra aleatoria de 100 cuentas bancarias y resulta
que promediadas dan un saldo de 725,80$. El contador afirma que ese ser el saldo
de TODAS las cuentas del banco ya que el promedio muestral es un estimador
X
i =1
Problemas resueltos:
Intervalo de confianza para el promedio con variancia poblacional conocida:
Un fabricante de lquido acondicionador para el cabello, que comercializa su produccin a
travs de una gran cantidad de negocios minoristas de su zona, alarmado por la ostensible
baja de las ventas debida a la profunda recesin econmica, decide cambiar la presentacin
de su producto, sustituyendo el envase tradicional por otro de menor costo que le permitir
reducir el precio de venta. Para evaluar los efectos del cambio efectuado, visita 49
minoristas y verifica que durante la semana anterior vendieron en total 1.323 litros de
acondicionador. Suponiendo que la variancia de las ventas semanales por minorista, que
antes del cambio de presentacin era igual a 156,25 litros2, no ha variado:
a) Construir un intervalo de confianza del 95% para estimar el nuevo promedio
semanal de ventas por minorista.
b) Si, basndose en la misma muestra, se efectuara una estimacin de dicho promedio
con un error de muestreo igual a 1,50 litros cul sera el nivel de confianza de la
misma?
c) Cuntos minoristas ms habra que incluir en la muestra para lograr que el error
de muestreo de la estimacin no supere los 1,50 litros y que el NC siga siendo igual
a 95%?
Solucin:
x = 1.323
n = 49
a) Datos:
2 = 156,25
NC = 95%
x=
x = 1.323 = 27
n
49
= 0,05 = 0,025
2
2
= 156,25 = 12,5
= 1 NC = 1 0,95 = 0,05
1 = 1 0,025 = 0,975
z1 = z0,975 = 1,96
2
2
12
,
5
12
,
5
Lmite inf erior = LI = x + z
= 27 + (1,96)
= 27 1.96
= 27 3,5 = 23,50
7
2
n
49
Lmite superior = LS = x + z1
= 27 + 1,9612,5
= 27 + 1,9612,5 = 27 + 3,5 = 30,50
7
2
n
49
z = z0,025 = 1,96
2
En resumen:
xE
E = z1
donde :
27 3,5
Respuesta :
b) Datos:
n = 49
E = z1
2
0,8 = 1
Respuesta:
c) Datos:
NC = 0,95
= 12,5
E = 1,50
1,50 = z 1
12,5
49
= 1,96 12,5
49
= 3,5
[23,50 ; 30,50 ]
= 1 0,8 = 0,2
2
NC = ?
z 1 =
2
1,50 7
= 0,84
12,5
= 2 0,2 = 0,4
F (0,84) = 0,80
NC = 1 = 1 0,4 = 0,6
= 12,5
z1 = 1,96
NC = 95%
n= ?
entonces :
2
z1
1,96 12,5
2
=
n=
= 266,78
1,5
E
E = 1,50 =
1,96 12,5
n
Respuesta:
n = 267
267 49 = 218
x=
n=6
(x x )
=
= 5%
n 1
S = 100 = 10
NC = 1 0,05 = 0,95
= 0,05
2 = 0,025
1 2 = 1 0,025 = 0,975
= grados de libertad = GL = n 1 = 6 1 = 5
xE
E = t v;1 2 S
= t 5;0,975 10
= 2,571.10
2,4495
= 10,5
125 10,5
b) Datos:
E=4
NC = 95%
n=?
= n 1 = 6 1 = 5
t 5 ; 0 , 975 = 2 ,571
t ;1 2 S
n =
E
2 ,571 10
=
= 41 ,3
4
= n 1 = 42 1 = 41
t 41 ; 0 , 975 = 2 , 020
t ;1 2 S
n =
E
2 , 020 10
=
= 25 ,5
4
= n 1 = 26 1 = 25
t 25 ; 0 , 975 = 2 , 060
t ;1 2 S
n =
E
2 ,060 10
=
= 26 ,5
4
= n 1 = 27 1 = 26
t 41 ; 0 , 975 = 2 , 056
t ;1 2 S
n =
E
2 , 056 10
=
= 26 , 4
4
n1 = 42
n1 = 26
n1 = 27
n1 = 27
11
p =
n = 125
= 2%
r = 79
r 79
=
= 0,632
n 125
q = 1 p = 1 0,632 = 0,368
1 2 = 1 0,01 = 0,99
p q
0,632 0,368
= z 0,99
= 2,326 0,043 = 0,10
n
125
E = z1 2
p E = 0,632 0,10
p = 0,632
b) Datos:
= 2%
E(anterior) = 0,10
n=?
n=
z 12 2 p q
E2
2,326 2 0,232576
=
= 349 ,5279
0,0036
n = 350
c) Datos:
NC = 92%
E = 0,03
n=?
Al carecerse de datos acerca de la proporcin, se considerar: p = q = 0,50
= 1 NC = 1 0,92 = 0,08
NC = 0,92
n=
z 12
p q
E2
2 = 0,04
1, 751 2 0 , 25
= 851 , 6669
0 ,0009
1 2 = 1 0,04 = 0,96
n = 852
12
n = 12
v = n 1 = 12 1 = 11
S = 32
= 1 NC = 1 0,95 = 0,05
Lmite Superior = LS =
NC = 95%
1 2 = 0,975
v2;1 2
S 2 ( n 1)
2; 2
32 2 11 11.264
=
= 513,8686
21,92
21,92
32 2 11 11.264
=
= 2.948,6911
3,82
3,82
2 = 0,025
[513,8686 ; 2.948,6911]
2.948,6911 = 54,30
[22,67 ; 54,30]
Respuesta: Se estima con una confianza del 95% que el desvo estndar de la longitud de
todo el lote est comprendido entre 22,67 mm y 54,30 mm.
Ejercitacin:
Problema 1: En una ciudad del interior del pas en la que habitan 100.000 familias se tom
una muestra al azar de 285 familias con la finalidad de analizar el ingreso mensual
familiar y se obtuvo una media de $2131. Suponga que el desvo estndar de los ingresos
asciende a $1772.
a) Indique cul es la unidad de observacin, la variable aleatoria en estudio, la
poblacin de referencia y la muestra. $2131 es el valor de un estimador o de un
parmetro? Y $1772? Justifique su respuesta.
b) Estimar el ingreso promedio mensual familiar con una confianza del 90 %. Los
resultados se aplican a las familias encuestadas, a todas las familias de la ciudad o
a todas las familias del interior?
c) Repetir la estimacin pero utilizando una confianza del 99%.
13
14
a) 6 mediciones
b) [89.6C ; 94.4C]
a) 29 latas/h
c) [24.88 ; 33.12
Problema 5: A fin de mejorar la programacin de turnos con pacientes, cierto centro mdico
desea estimar el tiempo que pasan los mdicos de cabecera con cada paciente en el
consultorio. Con tal fin se toma una muestra aleatoria de 20 citas, con las siguientes
duraciones de consulta (en min):
15
18
32
28
10
14
19
25
12
16
12
13
20
17
20
Estadstica descriptiva
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza(90,0%)
c) 55 citas ms
15,25
1,65
14,5
5
7,38
54,41
0,06
0,64
27
5
32
305
20
2,85
Problema 6: El contador de una firma comercial elige al azar 10 de las facturas emitidas en
el da de ayer y encuentra los siguientes montos en pesos:
142 38 76 24 187 95 129 82 63 74
a) Estimar el monto promedio de las facturas emitidas ayer, con = 0.10, bajo el
supuesto (poco realista) que el monto de las facturas se comporta normalmente.
b) Determinar el tamao de muestra necesario para efectuar la estimacin con un
error de muestreo igual a $15 manteniendo el mismo nivel de confianza.
c) Estime el monto promedio mximo de las facturas emitidas ayer, con = 0.10. Por
qu no coincide con el lmite superior del intervalo construido en el punto a)?
d) Explique el procedimiento que debi seguirse para extraer la muestra.
RESPUESTAS:
a) [62,37 ; 119,63]
b) 32 facturas c) $ 112.60
d) muestreo aleatorio
16
Cant.
Consumo
(litros)
Encuestados
0-0,2
12
0,2-0,4
11
0,4-0,6
8
0,6-0,8
5
0,8-1,2
4
a) Estime puntualmente el consumo semanal promedio de alcohol de los adolescentes
de dicha localidad y su desvo estndar.
b) Estime mediante un intervalo de confianza del 95% el consumo semanal promedio
de alcohol.
c) A cuntos adolescentes ms se debera encuestar si se desea efectuar la estimacin
con un error muestral de 0.06 litros?
d) El consumo semanal de alcohol no parece distribuirse normalmente. Sin embargo,
la utilizacin de intervalos de confianza basados en la distribucin normal est
justificada en este estudio. Por qu?
e) En realidad, los 40 adolescentes que integraron la muestra fueron seleccionados en
forma aleatoria entre los alumnos de un colegio secundario de la localidad. Qu
cambia de sus conclusiones anteriores?
RESPUESTAS:
Problema 9: Una universidad privada, con 11000 alumnos, desarrolla polticas activas para
desalentar el consumo de tabaco. Al inicio del ciclo lectivo se implement una encuesta a
fin de determinar la incidencia actual del tabaquismo entre su alumnado. Para ello fueron
seleccionados 500 alumnos al azar, de los cuales 140 se declararon fumadores.
17
18
a) 0.111
c) [0.078 ; 0.144]
d) 3785 usuarios
Problema 12: Una consultora lleva a cabo un sondeo a fin de estimar la intencin de voto de
cierto partido poltico a dos semanas de las elecciones. El ltimo sondeo arroj un 29% de
intencin de voto, pero los analistas quieren confirmar si este porcentaje se mantiene.
a) Cuntos votantes debern ser encuestados si se desea estimar el porcentaje de
votantes de dicho partido en 2% con un riesgo del 1%?
b) Suponga que la consultora tiene presupuesto para 800 encuestas. Cul ser el
error muestral resultante si se mantiene el nivel de confianza? Y cul ser el nivel
de confianza si lo que se desea es mantener el error muestral?
c) Cul de los dos intervalos anteriores es ms preciso? Y cul es ms exacto?
RESPUESTAS:
a) 3416 votantes
b) EM = 4.13% ; NC = 0.7887
19
Problema 13: Como parte de la poltica de satisfaccin total del cliente, una empresa
automotriz desea conocer el nivel de aceptacin del modelo Theo que sali al mercado hace
6 meses y ya vendi 7300 unidades. Para ello, contacta a 523 compradores de dicho modelo
(elegidos en forma aleatoria entre todos los compradores) y los somete a un cuestionario,
que entre otras cosas, indaga lo siguiente:
Muy satisfecho
Medianamente satisfecho
SI
Insatisfecho
NO
Muy
Medianamente
satisfecho
Satisfecho
291
Insatisfecho
159
73
NO
385
a) Estime con un nivel de confianza del 90% el porcentaje de todos los compradores
que estn satisfechos con el producto.
b) Estime con la misma confianza el porcentaje de todos los compradores que sufrieron
algn desperfecto con el vehculo.
c) En otra investigacin se enva un cuestionario con respuesta postal paga a los 7300
compradores del modelo y se reciben 500 respuestas. Qu opina de la calidad de
esta muestra? Es comparable a la obtenida anteriormente? Determine el tipo de
muestreo utilizado en cada caso.
RESPUESTAS:
a) [83.55 ; 88.53]
b) [23.22 ; 29.56]
c) Se trata de un muestreo no probabilstico, por conveniencia. En cambio, el muestreo
anterior era probabilstico y se trat de un muestreo simple al azar.
Problema 14: Para controlar la precisin de una mquina que corta piezas pequeas de
acero se toma una muestra de 35 piezas y al analizar la longitud de las mismas se
encuentra una variancia de 64 milmetros2. Estimar con una confianza del 99 % el desvo
estndar de las longitudes de toda la produccin, suponiendo que la longitud de las piezas
se distribuye normalmente.
RESPUESTA:
Se estima que el desvo estndar de toda la produccin est
comprendido entre 6,08 mm y 11,48 mm.
Problema 15: Se desea invertir en una empresa y se sabe que las utilidades mensuales
provenientes de dicha concesin se distribuyen en forma aproximadamente normal. Sin
20
embargo, interesa la variabilidad de las utilidades, que es una medida del riesgo que se
asume en el negocio. Se decide efectuar una estimacin del desvo estndar mximo de las
utilidades y para ello se extrae una muestra de 12 meses tomados al azar, obtenindose un
desvo estndar de U$S 14000. Efecte la estimacin solicitada con una confianza del 95%.
RESPUESTA:
U$S 21709
Problema 16: Un inspector tom una muestra de 5 latas de gaseosas, verific el contenido
en litros de las mismas y encontr: 0,48 0,51 0,45 0,43 0,52 litros
a) Estimar puntualmente el correspondiente desvo estndar poblacional.
b) Estimar el desvo estndar poblacional con NC = 90 %.
c) Qu supuestos deben asumirse?
RESPUESTA:
a) 0.038 litros
b) [0,025 ; 0,090 litros].
c) la variable contenido de las latas de gaseosa sigue una distribucin
normal y la muestra es aleatoria.
Revisin conceptual
Responda las siguientes preguntas, justificando las respuestas:
a) Si se aumenta el tamao de la muestra el error muestral aumenta o disminuye?
b) Si aumenta la variabilidad de la poblacin el error muestral aumenta o disminuye?
Qu se podra hacer al respecto?
c) Si aumenta el riesgo de la estimacin el error muestral aumenta o disminuye?
21
0,04
= 0,48 + z 0,90 0,04
= 0,48 + 1,282
= 0,48 + 0,02564 = 0,50564
n
4
2
Condicin de rechazo : Si x > x c se rechaza la hiptesis nula.
( CR : Si x > 0,50564 se rechaza H 0 )
Re gla de decisin : RD : Si se rechaza H 0 , no se aprueba la evaluacin.
22
x=
= ?
= PN ( x 0,50564 / 1 = 0,525 ; x =
= PN z
= 0,04
= 0,02 )
0,50564 0,5250
= PN ( z 0,97 ) = F (0,97) = 0,16602
0,02
d) 1= 0,525
= 0,05
1 = 0,95
0= 0,48
= 0,10
1 = 0,90
2
(z1 + z1 )
(z 0,90 + z 0,95 ) 0,04
(1,282 + 1,645) 0.04
n=
=
=
= 6,77
0 1
0,045
0,48 0,525
n=7
0 = 1,32
n = 16
x = 1,315
S = 0,02
= 0,10
23
= n 1 = 16 1 = 15
x c1 = 0 tv ; S
x c 2 = 0 + tv ; S
= 1 2 = 1 0,10 2 = 0,95
= 1.32 1,753
0,02
= 1,32 0,008765 = 1,311235
16
= 1,32 + 1,753
0,02
= 1,32 + 0,008765 = 1,328765
16
CR : Si x < 1,311235 o
tv ; = t15;0, 95 = 1,753
d) Estimar, con una confianza del 90%, el porcentaje de operarios satisfechos con el
actual servicio de comedor en toda la fbrica.
Solucin:
a) Datos: La concesin se renovar si ms del 70% (p0 = 0,7) de los operarios
estn satisfechos con el servicio actual (se renueva si: p > 0,70).
z 1
n=
p 0 q 0 + z 1
p1 p 0
0,83 0,70
2
1,645 0, 21 + 1,036 0,1411
0,7538 + 0,38916
n=
=
= 77 ,3
0,13
0,13
p c = p0 + z
n = 78
p 0 q0
0,70 0,30
= 0,70 + z 0,95
= 0,70 + 1,645 0,0519 = 0,70 + 0,085 = 0,785
n
78
p 1 q1
0,75 0, 25
0,785 0,75
n
78
0,049
c)
Datos:
n = 78
p = 0,82
d)
Datos:
n = 78
q = 1 p = 1 0,82 = 0,18
E = z1 2
p = 0,82
NC = 90%
= 1 NC = 1 0,90 = 0,10
p q
0,82 0,18
= z 0,95
= 1,645 0,0435 = 0,07
n
78
1 2 = 1 0,05 = 0,95
p E = 0,82 0,07
0 = 73
n = 12
S = 32
= 5%
Para lograr su objetivo el nuevo sistema debe redundar en una reduccin significativa de la
variabilidad del tiempo de espera y atencin. (Es decir, que se considerar que logr su
objetivo si 2 < 732).
26
= = 0,05
2
2
2
crt
. = ; = 11;0 , 05 = 4,57
2
2
2
CR : Si calc
< crt
se rechaza la hiptesis nula ).
. se rechaza H 0 . ( Si calc . < 4,57
S 2 (n 1)
32 2 (12 1) 1.024 11
=
= 2,1137
732
5.329
2
2
Conclusin : Como calc
. < crt . ( 2,1137 < 4,57), se rechaza H 0 . Por lo tanto se considera
Ejercitacin:
Problema 1: El dueo de una casa de comidas rpidas con entrega domiciliaria, decide
controlar el rendimiento de sus empleados y se comunica telefnicamente con 14 clientes
para verificar el tiempo de entrega de los pedidos y encuentra un promedio de 32 minutos.
El encargado le haba asegurado que en promedio de entrega de pedidos era de media hora
como mximo. Sabiendo que el tiempo de entrega se distribuye normalmente con desvo
estndar igual a 8 minutos, y utilizando = 10 %,
a) Considera usted que la afirmacin del encargado es incorrecta?
b) Cmo explicara el significado del valor de ?
RESPUESTAS:
a) No hay pruebas de que la afirmacin del encargado sea incorrecta (32 es < a 32.74
min)
b) La mxima probabilidad de considerar incorrecta la afirmacin del encargado,
cuando en realidad es correcta, es igual a 0,10.
Problema 2: Una importante firma dedicada a la comercializacin de artculos mdicos
compra mensualmente grandes partidas de jeringas descartables a un proveedor local que
las entrega en cajas. Cada partida contiene 3000 cajas y se ha pactado que el contenido
promedio de la partida debe ser de 120 jeringas/caja. Para evitar la compra de cajas con
contenido inferior al pactado, se efecta un control de recepcin revisando una muestra de
42 cajas elegidas al azar. Suponga que el desvo estndar es igual a 6 jeringas y que la
probabilidad de rechazar equivocadamente una partida se fija en 5%.
a) Establecer la condicin de rechazo y la regla de decisin.
27
costo un poco ms alto, pero le asegura que la calidad de su trabajo es muy superior, es
decir que trabajan con un promedio de errores por hoja significativamente menor. Con el
fin de tomar una decisin al respecto, la empresa encarga al segundo centro la confeccin
de 50 pginas y al revisarlas se verifica un total de 85 errores. Considere que el desvo
estndar no vara y fije en 0,05 la probabilidad de decidir equivocadamente el cambio de
centro.
a) Establecer la condicin de rechazo y la regla de decisin.
b) Qu decisin se tomar acerca del cambio de centro? Qu tipo de error se puede
estar cometiendo? Con qu probabilidad?
RESPUESTAS:
a) CR: Si x < 1,66 errores por pgina se rechaza H0. RD: Si se rechaza H0 se cambia de
centro.
b) Se continuar con el centro actual (1.7 no es menor que 1.66). Se puede estar cometiendo
un error de tipo II, con probabilidad desconocida.
Problema 5: En una fbrica se producen pilas cuya vida til promedio es de 78 horas con
una variancia igual a 49 horas2. Un ingeniero propone al dueo de la fbrica la adopcin de
un nuevo mtodo de produccin cuya implementacin resultara bastante costosa, pero si
se comprobara que la duracin de las pilas realmente se incrementa, el dueo estara
dispuesto a adoptarlo. La comprobacin consisti en tomar una muestra de 28 pilas
fabricadas con el nuevo mtodo, y al hacerlo se observ una duracin promedio de 82 horas.
a) Con un nivel de significacin del 2 % aconsejara cambiar el mtodo de produccin?
b) Qu tipo de error se puede estar cometiendo? Con qu probabilidad mxima?
c) Indique lo supuestos requeridos para la validez de la prueba.
d) Estime la duracin promedio de las pilas fabricadas con el nuevo mtodo con una
confianza del 95%.
RESPUESTA:
a) S, porque el promedio de la muestra es mayor a 80,72 hs.
b) Se puede estar cometiendo un error de tipo I, es decir cambiar de mtodo de produccin
cuando en realidad la duracin de las pilas no aument.
c) La variable debe seguir una distribucin normal y la muestra debe ser tomada al azar.
d) [79.4 ; 84.6 hs]
Problema 7: La frmula del latex utilizado para guantes de uso en ciruga es exclusividad
de cada fabricante. Uno de los fabricantes estudia la posibilidad de cambiar la frmula
actual por otra ms costosa, siempre que pueda asegurar que el promedio de duracin sea
superior al de la frmula actual, que es de 110 das. Se fija en un 5% la probabilidad de
cambiar equivocadamente la frmula actual por la nueva frmula y en un 10 %
probabilidad de no cambiar la frmula cuando el promedio de duracin con la nueva
frmula es de 126 das. Por otro lado, el desvo estndar del tiempo de duracin es de 25
das y se piensa que no se modificar con la nueva frmula.
a) Indique las hiptesis apropiadas a esta situacin, el tamao de muestra necesario,
la condicin de rechazo y la regla de decisin.
b) Calcule la probabilidad de efectuar el cambio si el promedio de duracin con la
nueva frmula es de 122 das.
c) Si en la muestra se obtuvo una duracin promedio de 130 das, qu decisin se
debera tomar?
d) Estime con una confianza del 90% el promedio mximo de duracin de los nuevos
guantes.
RESPUESTAS:
a) n = 21 guantes; CR: Si x > 119 das se rechaza Ho. RD: Si se rechaza Ho se cambia
a la frmula ms costosa.
b) 0.71048
c) Se debera cambiar a la frmula ms costosa.
d) 137 das
Problema 8: Una fbrica dedicada a la produccin en serie de cierto tipo de pieza tiene un
tiempo de manufactura que se distribuye normalmente con un promedio de 6,2 minutos y
un desvo estndar de 0,7 minutos. Se considera la posibilidad de incorporar una nueva
mquina recientemente lanzada al mercado ya que se piensa que se pueden disminuir los
tiempos de produccin. Teniendo en cuenta el costo de la nueva mquina, solo se la
adquirir si se tiene una razonable seguridad de que con ella se lograr una disminucin
del tiempo medio actual. Si dicho parmetro es igual al actual se fija en 5% la probabilidad
de comprar la nueva mquina. En cambio, si es inferior en un 10% se desea que dicha
probabilidad valga 99%.
a) Indique que cantidad de ensayos deberan efectuarse con la nueva mquina y qu
resultado debera observarse para decir comprarla.
b) Calcule la probabilidad de comprar la nueva mquina cuando el tiempo medio de
produccin es un 5% inferior al actual.
c) Si en la muestra se obtuvo un promedio de 5 minutos, qu decidira Ud?
30
85,25
84,11
17,38
302,06
60,41
45
55
100
25
Problema 10: Una compaa cerealera de transportes desea investigar si el costo medio de
mantenimiento de los camiones es inferior a $ 2500 mensuales cuando se utiliza un aceite
especial ms caro que el actual. Se experiment el aceite especial con 30 camiones durante
un mes, obtenindose un costo medio de $ 2420 con un desvo estndar de $ 645. Se
establece en un 5% la probabilidad de cometer error de tipo I.
31
Problema 11: La ley 26.687 sancionada en 2011 regula la publicidad, promocin y consumo
de productos elaborados con tabaco. Entre otros considerandos, establece un mximo de
once miligramos (11 mg) de alquitrn por cigarrillo, en promedio, debido a sus
comprobados efectos nocivos sobre la salud. El Ministerio de Salud controla una nueva
marca de cigarrillos, para lo cual mide el contenido de alquitrn, con los siguientes
resultados (en mg por cigarrillo):
11,3 13,3 13,1 12,3 12,5 12,0 11,8 11,0 12,4 12,2 12,7 11,1
10,8 12,6 10,2 9,7 10,8 10,9 11,2 12,3 14,3 11,8 10,5 11,1
a) Utilizando un nivel de significacin del 1%, existe evidencia de que la nueva marca
supera los niveles mximos permitidos de alquitrn en sus cigarrillos?
b) Estime con una confianza del 90 % el contenido medio de alquitrn de la nueva
marca de cigarrillos.
c) Cuntos cigarrillos ms debern analizarse si se desea disminuir el error muestral
en un 25%?
RESPUESTAS:
32
Problema 13: Una empresa que se dedica a la fabricacin de insecticidas en aerosol, recibe
reclamos en el 10% de sus unidades debido a fallas en el sistema de spray. Se est
considerando cambiar el sistema de aerosol actual por otro ms costoso pero ms efectivo.
A fin de tomar una decisin, se fabrican 500 unidades con el nuevo sistema, encontrndose
fallas en 38 de ellas.
a) Con un riesgo del 5% de tomar una decisin incorrecta, aconsejara cambiar al
sistema ms costoso?
b) Calcule la probabilidad de aconsejar el cambio al sistema ms costoso si con l se
lograse un 7% de unidades defectuosas. Cmo se denomina esta probabilidad? Es
una decisin correcta?
c) Cuntas unidades ms deberan haber sido fabricadas y probadas si se desea que
la probabilidad calculada en el punto anterior valga 0.9?
d) Interprete y en trminos del problema.
RESPUESTAS:
b) 1- = 0.757
c) 248 unidades ms
d) es la mxima probabilidad de decidir cambiar al sistema ms costoso cuando ste en
realidad no es ms efectivo. es la probabilidad de decidir no cambiar al sistema ms
costoso cuando ste en realidad es ms efectivo que el sistema actual.
Problema 14: Una poblacin infantil se dice que es susceptible de recibir una campaa de
educacin e higiene si su porcentaje de nios con dientes cariados es superior al 15%. En
una poblacin con 12.637 nios, un analista evala si debe efectuarse la campaa, siendo
que de 387 nios elegidos al azar, 65 tenan algn diente cariado.
a) Utilice = 0.1 y determine qu debera concluir el analista. Qu error puede estar
cometiendo con la decisin tomada?
b) El analista se pregunta si, en caso de que el porcentaje de nios con caries en la
poblacin fuese grande, de 20% por ejemplo, qu probabilidad tendra de detectarlo
con esta prueba.
RESPUESTA:
a) No se aconseja iniciar la campaa ya que no existen evidencias de que el porcentaje
de nios con caries sea superior al 15% (0.168 no es mayor que 0.173). Dado que no
se rechaz Ho, el analista puede estar cometiendo un error de tipo II.
b) 1- = 0,9047
33
Problema 16: Una nueva serie de TV en horario central debe demostrar que capta ms del
20 % de la audiencia despus de su perodo inicial de 4 semanas para decir que tuvo xito.
Despus de un mes del lanzamiento de una nueva serie, de una muestra aleatoria de 400
hogares, contactados telefnicamente, se encontr que 104 estaban vindola.
a) Utilizando un nivel de significacin del 10 % y con la informacin de la muestra,
puede Ud. concluir que la serie tuvo xito?
b) Cul es la probabilidad, con una muestra de 400 hogares, de concluir que la serie
no tuvo xito si en realidad el 24 % de los hogares viese la serie?
c) Si se desea que la probabilidad de decir que la serie tuvo xito cuando el 24 % de las
familias ven la serie valga 95%, cuantas familias ms deberan incluirse en la
muestra?
RESPUESTAS:
b) 0.251
c) 523 familias
ms
Problema 17: En cierto establecimiento avcola, los huevos son lavados previo a su
envasado en cajas de cartn. Durante este procedimiento las prdidas estimadas por rotura
son del 13 %. Con el fin de mejorar el rendimiento, se decide implementar un nuevo proceso
de lavado, levemente ms costoso, fijndose en un 5 % la probabilidad de tomar una
decisin equivocada. Por otro lado se desea una probabilidad del 70% de implementar el
nuevo proceso de lavado si con l se reduce el porcentaje de rotura al 10%.
a) Calcule el tamao de muestra adecuado y la cantidad de huevos rotos que se deben
encontrar como mximo en dicha muestra para implementar el nuevo proceso.
b) Cul es la probabilidad de no implementar el nuevo sistema si con el nuevo mtodo
se logra reducir el porcentaje de rotura en 2 puntos?
34
Problema 18: Una empresa manufacturera que cuenta con un gran plantel de operarios
distribuidos en tres turnos de trabajo ha contratado los servicios de un experto en
relaciones laborales quien, como parte de su asesoramiento, recomienda que los operarios
escuchen msica mientras trabajan, generando as condiciones laborales ms agradables.
Esta reforma redundar, segn su opinin, en un aumento de la productividad. El dueo de
la empresa decide implementar esta reforma si le demuestran que ms de la mitad de los
operarios est de acuerdo. El asesor propone entonces, tomar una muestra de operarios y
consultar su opinin acerca de escuchar msica mientras trabajan.
a) Determinar el tamao de la muestra necesario para que la probabilidad de decidir
equivocadamente la implementacin de la reforma propuesta por el asesor valga
0,05 y que la probabilidad de no implementarla, cuando en realidad el 62 % de los
operarios est de acuerdo, resulte igual a 0,10.
b) Calcular la probabilidad de detectar, mediante este test, la conveniencia de
implementar dicha reforma si el 55% de los operarios estuviera de acuerdo con la
misma.
c) Una vez tomada la muestra, se encontr que 87 operarios se manifestaron de
acuerdo con la reforma propuesta. Aconsejara usted implementarla?
d) Estimar con NC = 90 % el porcentaje de operarios de la empresa que est de
acuerdo con escuchar msica mientras trabajan.
RESPUESTAS: a) n = 145 operarios
[53,3% ; 66,7%]
d)
Problema 19: Una empresa de productos alimenticios ha lanzado una campaa publicitaria
sobre una mayonesa cuya penetracin en el mercado era del 15 %. Se desea realizar un
relevamiento a fin de determinar si la campaa ha sido efectiva, en cuyo caso se realizar
una campaa similar para otro de los productos de la empresa. Si no se ha conseguido el
resultado deseado, se establece en un 5% la probabilidad de tomar una decisin errnea y
en cambio un aumento en la penetracin de 3 puntos se considera un resultado
razonablemente bueno, en cuyo caso la probabilidad de realizar la nueva campaa se
establece en un 90%.
a) Indicar el tamao de muestra necesario.
b) Qu cantidad de personas debern como mnimo contestar afirmativamente para
que se comience la nueva campaa?
35
a) n = 1296
b) 216 personas
c) 0.362
Problema 21: Los profesores de primer ao de cierta universidad han advertido que existe
gran disparidad en el nivel de conocimientos matemticos de los alumnos recin
ingresados, disparidad que qued evidenciada en el hecho de que el desvo estndar de las
notas que dichos alumnos obtuvieron en una prueba calificada de cero a cien, result igual
a 32. Con el objeto de subsanar este inconveniente, las dos primeras semanas de clase se
dedicaron al dictado de un curso de nivelacin intensivo. Al finalizar el mismo se
seleccionaron al azar 18 alumnos y se les tom una prueba similar a la anterior,
observndose que el desvo estndar de las notas obtenidas fue igual a 26. Considera
usted que el curso de nivelacin dio resultado? (Usar = 0,10)
RESPUESTA:
No, porque al no rechazar Ho, no puede afirmarse que la variabilidad
de las notas haya disminuido.
Problema 22: Se supone que las latas de cierta conserva de tomates contienen 170 grs. Sin
embargo, existe cierta variacin entre las latas ya que las mquinas envasadoras no son
absolutamente precisas. La distribucin de contenido de conserva de una mquina
envasadora es aproximadamente normal con un desvo de 10 grs, que se considera excesivo.
Se desea reemplazar la mquina actual por otra solo si se tiene razonable evidencia de un
mejor desempeo en relacin a la homogeneidad de la dosificacin. Se planea efectuar una
prueba piloto con 30 latas, fijndose en un 5% la probabilidad de concluir errneamente
que la nueva mquina tiene mejor desempeo en cuanto a su variabilidad.
a) Establezca el juego de hiptesis adecuado, la regla de decisin y la condicin de
rechazo.
b) Si en la muestra se obtuvo un desvo de 8.5 grs, qu conclusin debera sacarse?
c) En base a su respuesta anterior, qu error podra estar cometiendo?
RESPUESTAS:
36
Revisin conceptual
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta
a) El nivel de significacin de una prueba de hiptesis mide la probabilidad de que Ho
sea falsa
b) Si no se rechaza Ho significa que Ho es verdadera
c) Cuando se rechaza Ho es porque una muestra aleatoria no es coherente con la
hiptesis nula
d) Las hiptesis se plantean sobre los estimadores
e) El error de tipo II consiste en aceptar que un tratamiento ineficaz produce efectos
tiles.
f) es la potencia del ensayo
37
EJERCICIOS INTEGRADORES
Problema 1: La consultora Z llev a cabo un estudio sobre reinsercin laboral en directivos
de empresas, para lo cual se bas en 60 casos de gerentes recientemente reincorporados a
la actividad laboral. Con respecto al medio por el cual consiguieron su nuevo trabajo, 18 lo
hicieron mediante avisos publicados, 6 mediante presentacin espontnea a empresas o
consultoras y el resto mediante contactos.
a) Con una confianza del 95%, estime qu porcentaje de los gerentes lograron su nuevo
trabajo mediante contactos.
b) Qu cantidad adicional de gerentes debera encuestarse si se desea reducir el error
muestral anterior a la mitad?
c) Con respecto al tiempo que tardaron los 60 gerentes en obtener empleo los datos
fueron:
Tiempo (meses) 0-2 2-4 4-6 6-8 8-10 10-12
cant.gerentes
25
6
15
8
3
3
En las actuales condiciones del mercado laboral, cunto estima que tardan, en
promedio, en reinsertarse los gerentes? Trabaje con una confianza del 95%.
Problema 2: En cierto establecimiento avcola se ha detectado ltimamente que los pollitos
recin nacidos son de bajo peso (34 g en promedio), lo que redunda en mayores tasas de
mortalidad. Se sospecha que la causa de este problema reside en una temperatura
demasiado elevada en las incubadoras, por lo que se disminuye la temperatura en las
mismas. Luego de tres semanas de aplicada la modificacin se eligieron al azar 70 pollitos
recin nacidos y se les registr el peso, con los siguientes resultados:
Peso (g)
Cant. pollitos
30-32
8
32-34
16
34-36
25
36-38
18
38-40
3
a) Hay evidencia de una mejora en el peso de pollitos? Asuma un riesgo del 5%.
b) Estime, en las nuevas condiciones de incubacin y con una confianza del 95%, el
peso promedio de los pollitos recin nacidos y su variabilidad.
c) Cuntos pollitos ms deberan pesarse si se quiere reducir el error muestral de la
estimacin efectuada en el punto anterior en un 20%?
d) Estime, en las nuevas condiciones de incubacin y con una confianza del 95%, el
porcentaje de pollitos recin nacidos con un peso de por lo menos 36g.
RESPUESTA:
a) Estime con un 95% de confianza el tiempo medio de conexin diario a Internet de los
usuarios particulares de dicha empresa y su desvo estndar.
b) Estime con un 10% de riesgo el porcentaje de mujeres usuarias de Internet de dicha
empresa.
c) En base a la informacin precedente, la empresa proveedora de Internet desea
aumentar la participacin de las mujeres en la red, por lo que lanza una intensa
campaa publicitaria en ese sentido. A los 3 meses de iniciada la campaa una
muestra aleatoria de 150 usuarios particulares determin que 51 de ellos eran
mujeres. Con un riesgo del 5%, considera que el porcentaje de mujeres en la red es
superior al 30%?
d) Determine el tamao de muestra necesario para que la probabilidad de detectar que
el porcentaje de mujeres usuarias de Internet aument al 35% sea de 0.8.
RESPUESTAS:
b) [17.7 ; 30.6%]
39
a) [20253015 ; 27678985]
b) No se rechaza Ho
c) No se rechaza Ho
41
Problemas resueltos:
Comparacin de dos medias poblacionales con variancias desconocidas y
supuestamente iguales
Una sucursal bancaria recibe numerosas quejas de sus clientes debido al excesivo tiempo
de espera en los cajeros automticos (definido como el tiempo que transcurre desde que el
cliente se incorpora a la fila hasta que inicia la operacin). Se registra entonces durante
una semana el tiempo de espera de 50 clientes elegidos al azar, obtenindose un promedio
de 12 min con un desvo estndar de 5 min. Estos resultados son considerados excesivos,
por lo que se implementa un proceso de mejora que incluye personal de orientacin al
cliente. Al cabo de dos meses de implementado el proceso se toma una nueva muestra de 60
42
clientes, obtenindose esta vez un tiempo de demora promedio de 10 min con un desvo de 4
min. Analice la informacin y decida si la implementacin del proceso fue efectiva, con un
riesgo del 5%.
Solucin:
El proceso de mejora ser considerado efectivo si el tiempo promedio de demora de los
clientes una vez implementado dicho proceso (2) es inferior al tiempo de demora antes de
la implementacin del mismo (1). Es decir:
H 0 ) 1 2 1 2 0 (el proceso no fue efectivo)
H 1 ) 1 > 2 1 2 > 0 (el proceso si fue efectivo)
Datos:
n1 = 50
x1 = 12 min
x 2 = 10 min
n2 = 60
s1 = 5 min
s2 = 4 min
= 0,05
Como las varianzas poblacionales son desconocidas, primero debe probarse si son iguales o
no.
Comparacin de dos varianzas
H 0 ) 21 = 2 2
H1 ) 21 2 2
CR: Si Fcalc < Fcrt1 o si Fcalc > Fcrt2 se rechaza la hiptesis nula
RD: Si se rechaza Ho se concluye que las varianzas son distintas
siendo
Fcalc =
S12
S 22
52
42
= 1,56
Conclusin: Como Fcalc (que result igual a 1,56) no es menor que Fcrt1 (0,40576) ni es
mayor a Fcrt2 (2,464) no se rechaza Ho. En consecuencia se infiere que las varianzas de las
dos poblaciones (tiempo de demora antes y despus de la implementacin del proceso de
mejora)no difieren significativamente.
Volvamos a la comparacin de las dos medias poblacionales con varianzas poblacionales
desconocidas, y en base al resultado de la prueba de hiptesis anterior, supuestamente
iguales. Las hiptesis eran:
H 0 ) 1 2 1 2 0 (el proceso no fue efectivo)
H 1 ) 1 > 2 1 2 > 0 (el proceso si fue efectivo)
43
siendo
t calc =
(x1 x 2 ) D0
Sa
1
1
+
n1 n 2
(12 - 10) - 0
1
1
4,48
+
50 60
= 2,33
Conclusin: Como tcalc (que result igual a 2,33) es mayor que tcrt (1,6591) se rechaza Ho.
En consecuencia se infiere que el tiempo de demora medio de todos los clientes despus de la
implementacin del proceso de mejora es menor al tiempo de demora antes de la
implementacin del mismo y por lo tanto el proceso puede considerarse efectivo, siendo
aconsejable su implementacin en otras sucursales.
A favor
En contra
No sabe/No contesta
Mujeres
112
110
44
Hombres
110
84
30
Datos:
n1 = 222 p 1 =
112
= 0,5045 n2= 194
222
p 2 =
110
= 0,5670
194
Z calc =
Z calc =
( p 1 p 2 ) D0
donde
1
1
p (1 p ) +
n
n
2
1
( p 1 p 2 ) D0
1
1
p (1 p ) +
n1 n 2
p =
r1 + r2
112 + 110 222
=
=
= 0,5337
n1 + n 2 222 + 194 416
(0,5045 0,5670) 0
1
1
0,5337(1 0,5337)(
+
)
194 222
= 1,27
Conclusin: Como zcalc (que result igual a 1,27) no es menor que zcrt (-1,96) no se rechaza
Ho. En consecuencia no existen evidencias para afirmar que la proporcin de hombres en la
poblacin a favor de la medida es superior a la de las mujeres y por lo tanto no se confirma
la sospecha del socilogo.
Ejercitacin:
Problema 1: El ingeniero a cargo de una planta de envasado de detergente desea saber si
existen diferencias en el volumen de llenado de los envases de detergente en dos tipos de
mquinas. Los desvos estndar del volumen de llenado son 0.03 y 0.05 litros
respectivamente. Una muestra aleatoria de 15 envases llenados por la mquina 1 indic un
contenido promedio de 1.03 litros y una muestra similar de 20 envases de la mquina 2
indic un contenido promedio de 0.98 litros. Con una significacin del 5%, existen
diferencias entre los dos tipos de mquinas en el volumen promedio de llenado?
RESPUESTA:
45
Problema 4: Los siguientes datos representan los rditos anuales efectivos, en porcentaje,
sobre cuentas de mercado de dinero de una muestra de 10 bancos comerciales de la ciudad
capital de la provincia ms importante del pas y 10 cuentas de bancos de ahorro de la
misma ciudad:
BANCOS
REDITO
Comerciales 2,25 2,32 2,02 1,92 2,02 1,82 2,10 2,38 2,30 2,28
De Ahorro
2,43 2,53 2,38 2,50 3,00 2,50 2,55 3,20 2,50 2,02
a) Con un nivel de significacin del 5% pruebe si hay igualdad de variancias
poblacionales.
b) Existe evidencia de una diferencia en los rditos efectivos anuales sobre las
cuentas de mercado de dinero de los dos tipos de bancos? Utilice un nivel de
significacin del 5%.
c) Qu supuestos consider para efectuar los tests de a) y de b)?
RESPUESTA:
a) No hay evidencias de desigualdad de varianzas (Fcalc=0.33 no es
menor que Fcrt1 = 0.248)
b) S (tcalc = -3.49 < tcrt1 = - 2.10)
c) Se supone que ambas muestras son independientes y obtenidas al azar, que las
poblaciones de las cuales se extrajeron siguen una distribucin normal y que los desvos
estndar de las dos poblaciones son iguales (homocedasticidad).
46
Problema 6: Se desea comparar los niveles de contaminacin sonora de dos reas de una
ciudad. Para ello, en cada uno de las reas se eligen puntos al azar y se determina la
intensidad sonora en la va pblica. Los resultados (en decibeles) fueron:
rea Norte
70.1
70.4
75.8
67.5
68.4
73.6
76.9
75.7
71.4
70.3
71.1
74.4
70.2
74.3
rea Sur
74.1
75.4
76.2
79.9
70.5
70.1
74.9
75.3
70.3
70.7
Con = 0.05 podra afirmar si existen diferencias en los niveles de contaminacin sonora
de las dos reas? Asuma que la intensidad sonora sigue una distribucin normal (Por qu
47
es necesario efectuar tal suposicin? Si fuese el intendente de la ciudad, cul de las dos
reas considerara como prioritaria por mayor contaminacin acstica? Fundamente su
respuesta.
En Excel: Herramientas > Anlisis de datos > Prueba F para varianzas de dos muestras
Prueba F para varianzas de dos muestras
CIUDAD1
Media
71,833
Varianza
9,259
Observaciones
12
Grados de libertad
11
F
1,0560
P(F<=f) una cola
0,4568
Valor crtico para F (una cola) 2,6346
CIUDAD2
73,386
8,767
14
13
En Excel: Herramientas > Anlisis de datos > Prueba t para dos muestras suponiendo
varianzas iguales
Prueba t para dos muestras suponiendo varianzas iguales
CIUDAD1
Media
71,833
Varianza
9,259
Observaciones
12
Varianza agrupada
8,9927
Diferencia hipottica de las medias 0
Grados de libertad
24
Estadstico t
-1,3159
P(T<=t) una cola
0,1003
Valor crtico de t (una cola)
1,7109
P(T<=t) dos colas
0,2006
Valor crtico de t (dos colas)
2,0639
CIUDAD2
73,386
8,768
14
48
10.5
16.4
12.2
14.8
9.3
17.8
12.5
8.3
% aceite
11.1 10.5
11.9 15.5
11.4
13.4
9.6
16.0
12.6
15.8
13.4
18.2
Carolea
14,81
8,741
10
9
49
Carolea
14,81
8,741
10
Problema 10: BJ y Asociados estn probando dos comerciales para una compaa
productora de jugos. Ambos comerciales se mostraron a 12 individuos, a quienes se pidi
que los calificaran en una escala de 1 a 100. Los resultados fueron:
Individuo
Aviso 1
Aviso 2
1
95
87
2
59
65
3
73
80
4
65
73
5
32
45
6
45
39
7
60
57
8
83
81
9
27
33
10
50
40
11
63
66
12
95
93
Utilice un nivel de significacin del 10 % para la prueba que determina si los panelistas
apreciaron ms alguno de los dos avisos. A qu conclusin debera llegar la empresa BJ y
Asociados? Compare sus resultados con la salida generada con Excel.
Prueba t para medias de dos muestras emparejadas
AVISO1
Media
62,25
Varianza
483,6591
Observaciones
12
Coeficiente de correlacin de Pearson
0,9453
Diferencia hipottica de las medias
0
Grados de libertad
11
Estadstico t
-0,48207
P(T<=t) una cola
0,31960
Valor crtico de t (una cola)
1,36343
P(T<=t) dos colas
0,63920
Valor crtico de t (dos colas)
1,79589
AVISO2
63,25
415,1136
12
50
Vendedor
RL
MP
BA
FF
EG
PF
Antes
320
290
421
510
210
402
Despus
340
295
475
510
228
500
Problema 13: Una importante compaa alimenticia que fabrica hamburguesas adquiere la
materia prima a dos proveedores. El contenido promedio de grasa de ambos proveedores es
el mismo, pero se sospecha que la variabilidad en el contenido graso puede diferir. El
desvo estndar del contenido graso en una muestra de 18 lotes adquiridos al proveedor 1
fue de 8.9%, mientras que una muestra aleatoria de 15 lotes de la compaa 2 arroj un
desvo estndar de 5.1%. Existe evidencia suficiente para concluir que la variabilidad de
las dos poblaciones es diferente? Utilice =0.05.
RESPUESTA:
Problema 14: Como parte de una investigacin socioeconmica iniciada en dos ciudades se
considera necesario comparar sus tasas de desocupacin, ya que histricamente los niveles
de desocupacin de ambas ciudades han sido similares. Se seleccionan al azar 550
residentes pertenecientes a la PEA (Poblacin econmicamente activa) en la primera
ciudad y 750 en la segunda, observndose 495 y 660 ocupados, respectivamente. Realice la
prueba usando un nivel de significacin del 5%. Interprete el resultado obtenido y comente
qu error podr estar cometiendo.
RESPUESTA: No hay evidencias de que las tasas de desocupacin de ambas ciudades
difieran significativamente (-1.13 no es menor que 1.96). Se podra estar cometiendo un
error de tipo II.
Problema 15: Se va a efectuar una encuesta en dos zonas distintas para determinar la
proporcin de unidades habitacionales ocupadas por familias de altos ingresos. Una
muestra aleatoria de 300 unidades habitacionales en la zona A revel que 120 estaban
ocupadas por familias de altos ingresos, mientras que en la zona B sobre una muestra de
600 unidades se encontr que 150 pertenecan a familias de altos ingresos.
a) Con un nivel de significacin del 5 %, podra Ud. probar si el porcentaje ocupado
por familias de altos ingresos en la zona A es superior al de la zona B?
b) Estime con una confianza del 95 % la diferencia entre las proporciones de ambas
zonas.
RESPUESTAS:
b) [0.085 ; 0.215]
52
Problema 17: Se llev a cabo una investigacin a fin de determinar si el hbito de fumar
provocaba diferencias en la aceptabilidad de la sucralosa, un nuevo edulcorante muy
estable. Para ello, un panel compuesto por 50 individuos fumadores y 50 no fumadores
prob jugo endulzado con sucralosa. Doce de los no fumadores y 5 de los fumadores
manifestaron un resabio desagradable luego de la prueba. Considera que existen
diferencias significativas en la aceptacin de la sucralosa por los dos grupos? De ser as, de
qu forma incide la condicin de fumador? Utilice = 0.1.
RESPUESTA:
S (1.86 > 1.645). El hbito de fumar incrementa la aceptabilidad de la
sucralosa, ya que el porcentaje de individuos que lo encuentran desagradable es
estadsticamente superior entre los no fumadores.
Revisin conceptual
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta
Se realiza un estudio para saber si dos tratamientos de quimioterapia presentan
diferencias en cuanto al tiempo de supervivencia de los pacientes. No se encontr diferencia
estadsticamente significativa. Cul de las siguientes razones podran ser causantes del
resultado?
a) Los tratamientos ofrecen tiempos de supervivencia muy diferentes.
b) El nivel de significacin es demasiado alto.
c) Las muestras son demasiado grandes.
d) Las muestras son demasiado pequeas.
e) Nada de lo anterior.
53
Problemas resueltos:
Prueba de Bondad de ajuste
El Gerente de Personal de cierta empresa est preocupado por el ausentismo. Desea saber
si el mismo est distribuido uniformemente durante los 5 das laborales. Para ello extrajo
una muestra al azar de 120 ausencias, obteniendo los siguientes resultados:
Das
lunes martes mircoles
Cant. ausentes 35
18
21
jueves
17
viernes
29
lunes
35
24
martes
18
24
mircoles
21
24
jueves
17
24
viernes
29
24
54
(OBS i ESPi )2
ESPi
2
calc
Conclusin: Como 2calc > 2crt, se rechaza Ho y el gerente debera concluir que existen
evidencias para afirmar que el ausentismo no est distribuido uniformemente.
Tablas de Contingencia: Prueba de Independencia
Una marca de cervezas decidi efectuar un estudio de mercado a fin de identificar las
preferencias de sus consumidores. De un total de 200 personas encuestadas, 110
manifestaron preferir la cerveza rubia y 60 la cerveza sin alcohol, mientras que el resto
prefiri la negra. De aquellos que prefirieron la cerveza rubia, el 40% son mujeres,
mientras que de los que prefieren la cerveza sin alcohol, 19 son hombres. Finalmente, 23
encuestados son hombres que prefieren la cerveza negra. Con un riesgo del 5%,
presentaron los 3 tipos de cerveza igual preferencia en ambos sexos?
Solucin:
Las hiptesis a testear son:
Ho) la preferencia por cierto tipo de cerveza es independiente del sexo del consumidor
H1) la preferencia por cierto tipo de cerveza depende del sexo del consumidor
Al igual que en la situacin anterior se deben comparar las frecuencias observadas en el
muestreo con las frecuencias que se esperara observar si la hiptesis nula fuera cierta, es
decir si los dos criterios de clasificacin de los datos (tipo de cerveza preferida y sexo)
fueran independientes. La tabla de contingencia con las frecuencias observadas (OBS) en el
muestreo es:
Cerveza preferida
Rubia
Sin alcohol Negra
Totales
Mujeres
44
41
7
92
Hombres
66
19
23
108
Totales
110
60
30
200
55
Para construir la tabla de contingencia con las frecuencias esperadas (ESP) suponiendo
independencia se procede de la siguiente manera. La proporcin de consumidores que
prefieren la cerveza rubia, sin importar el sexo de los mismos, es de 110/200, es decir 0.55
(55%). Si los dos sexos tienen idnticas preferencias se esperara que el 55% de las mujeres
y el 55% de los hombres prefieran la cerveza rubia, es decir 50,6 mujeres (el 55% de 92) y
59,4 hombres (el 55% de 108). Efectuando el mismo razonamiento con los otros tipos de
cerveza es posible construir la siguiente tabla de frecuencias esperadas:
Mujeres
Hombres
Totales
Cerveza preferida
Rubia
Sin alcohol
50.6
27.6
59.4
32.4
110
60
Negra
13.8
16.2
30
Totales
92
108
200
(OBS i ESPi )2
ESPi
donde
Conclusin: Como 2calc > 2crt, se rechaza Ho y se concluye que la preferencia por la cerveza
depende del sexo del consumidor.
Ejercitacin:
Problema 1: Las estadsticas indican que en una universidad privada el 60% de los
inscriptos se anotan en la facultad de Cs. Econmicas, el 15% en la de Abogaca y el resto
en la de Ingeniera. Antes del inicio del ciclo lectivo y a fin de planificar la distribucin de
docentes y cursos, las autoridades estn interesadas en determinar si se mantienen las
proporciones histricas de inscripcin en las distintas facultades. Hasta la fecha registran
un total de 1200 inscripciones, de las cuales 760 corresponden a la facultad de Cs.
Econmicas, 200 a la de Abogaca y el resto a Ingeniera. Con un riesgo del 1% considera
56
que en el presente ciclo lectivo se detectan cambios con respecto a las proporciones
histricas?
RESPUESTA:
Existen evidencias de que existen cambios en la proporciones
histricas de inscriptos en las distintas facultades (16.44 > 9.21).
Problema 2: El listado generado por computadora del gerente de una tienda contiene a
todos los empleados de venta e indica que el 70% son empleados de tiempo completo, el 20%
son empleados de medio tiempo y el 10% estn suspendidos temporariamente o se
encuentran con licencia. Una muestra aleatoria de 50 empleados del listado indica que 40
son empleados de tiempo completo, 6 son de medio tiempo y 4 estn suspendidos o con
licencia. Determine si esta muestra es representativa de la poblacin con un riesgo del
10%.
RESPUESTA:
Puede considerarse que la muestra es representativa, ya que no
existen evidencias de que la proporcin de cada tipo de empleado difiera de las
proporciones poblacionales (2.51 no es mayor a 4.605)
Problema 3 Se desea probar con un nivel de significacin del 5 % si un dado est cargado.
Para ello se realizan 90 tiradas y se obtiene la siguiente informacin:
cara del dado
cantidad de veces que sali
1
10
2
16
3
20
4
15
5
17
6
12
RESPUESTA: De las tiradas no surgen evidencias para decir que el dado est cargado
(4.27 < 11.07).
57
RESPUESTA: a) La preferencia por el mensaje depende del nivel socioeconmico (45,34 >
13.277)
b) S, ya que se encontraron evidencias de que la preferencia por el mensaje depende
del nivel socioeconmico. Para el nivel socioeconmico bajo recomendara el mensaje
C, para el alto, el A, mientras que para el medio, es indistinto.
c) Se supone que las respuestas son independientes entre s. Adems todas las
frecuencias esperadas deben ser de por lo menos 5, por lo que en determinadas
ocasiones puede ser necesario combinar dos o ms categoras.
Problema 5: Resuelva el problema 14 del prctico 4 utilizando una prueba de chi cuadrado.
Compare los resultados con los obtenidos aplicando una comparacin de proporciones.
RESPUESTA: Como calc (1,28) no es > a crit (3,841), se concluye que el nivel de
ocupacin no depende de la ciudad. Los resultados de una prueba de independencia de 2x2
son equivalentes a los de una comparacin de dos proporciones (z2 = 2).
Problema 6: Una fbrica de equipos de refrigeracin selecciona la produccin de un da
cualquiera y efecta un control total de los equipos producidos. Se observa que en el turno
maana se fabricaron 119 equipos de los cuales 16 estaban fallados; en el turno tarde se
fabricaron 252 equipos, siendo 24 defectuosos; finalmente en el turno noche, de 93 equipos
fabricados, 18 estaban fallados.
a) Existen diferencias al 10% en el desempeo de los turnos?
b) Cul de los 3 turnos considera que tiene peor desempeo? Justifique.
RESPUESTAS:
Secundario
completo o ms
125
359
166
a) Plantee las hiptesis que considere apropiadas, en trminos del problema. Concluya,
con un riesgo del 1%.
58
Cantidad de circuitos
12
39
105
135
118
99
49
10
59
F(LS)
P(intervalo)
ESP
<6
6-6,5
6,5-7
7-7,5
7,5-8
8-8,5
8,5-9
9-9,5
9,5-10
10
Total
0,00470
0,02570
0,09702
0,25806
0,50000
0,74194
0,00470
0,02101
0,07132
0,16103
0,24194
0,24194
2,66
11,91
40,44
91,31
137,18
137,18
0,97430
0,99530
1,00000
0,07132
0,02101
0,00470
1
40,44
11,91
2,66
567
0
12
39
105
135
118
99
49
10
0
567
Corriente OBS
ESP
OBS-ESP
<6
6-6,5
6,5-7
7-7,5
7,5-8
8-8,5
8,5-9
9-9,5
9,5-10
10
Total
2,66
11,91
40,44
91,31
137,18
137,18
-2,66
-0.09
-1,44
13,69
-2,18
-19,18
40,44
11,91
2,66
567
8,56
-1,91
-2,66
0
12
39
105
135
118
99
49
10
0
567
(OBS-ESP)2
ESP
2,66
0,00
0,05
2,05
0,03
2,68
1,81
0,31
2,66
12,91
RESPUESTA: No hay razones para suponer que la distribucin no ajusta a una normal
(12,91 no es mayor que 14.067).
60
Y=
X
100
Obtener esta relacin es menos evidente cuando lo que medimos sobre el mismo grupo de
personas es
X = altura medida en centmetros
Y = peso en kilogramos
La razn es que no es cierto que conocida la altura Xi de un individuo, podamos determinar
de modo exacto su peso Yi (por ej. dos personas que miden 1,70 m pueden tener pesos de
60 y 65 kilos). Sin embargo, alguna relacin entre ellas debe existir, pues parece mucho
ms probable que un individuo de 2 m pese ms que otro que mida 1,20 m. Es ms, nos
puede parecer ms o menos aproximada una relacin entre ambas variables como la
siguiente:
Y = X 110 error
61
A la deduccin, a partir de una serie de datos, de este tipo de relaciones entre variables, es
lo que denominamos regresin. Mediante las tcnicas de regresin expresamos una
variable Y como funcin de otra variable X
Y = f (X)
Esto es lo que denominamos relacin funcional. El criterio para construir el modelo, tal
como citamos anteriormente, es que la diferencia entre el valor real de Y y el valor terico
o estimado de Y a partir de dicha relacin ( Y ) sea pequea. Dicha diferencia se conoce
como error o residuo:
ei = Y - Y
El objetivo ser buscar la funcin (tambin denominada modelo de regresin) Y = f (X) que
lo minimice.
Regresin lineal
La forma de la funcin f en principio podra ser cualquiera, lineal o no lineal, pero por el
momento nos vamos a limitar al caso de la regresin lineal. Con este tipo de regresiones
nos conformamos con encontrar relaciones funcionales de tipo lineal, es decir que el modelo
que utilizaremos, conocido como modelo de regresin lineal, es:
Y=+x+
donde y son los parmetros del modelo, siendo la ordenada al origen y el coeficiente
de regresin de Y sobre X o pendiente de la recta. La letra corresponde al trmino del
error, y es la variable aleatoria que explica la variabilidad en Y que no se puede explicar
con la relacin lineal entre X e Y.
Obsrvese que la relacin anterior explica cosas como que si X vara en 1 unidad, Y vara la
cantidad . Es decir que mide la variacin de Y por incremento unitario de X, mientras
que indica el valor de Y cuando X=0. Por lo tanto:
Si >0, cuando X aumenta, Y tambin lo hace.
Si <0, cuando X aumenta, Y disminuye.
Si =0, cuando X aumenta o disminuye, Y no se ve afectada (Y no depende de X)
En consecuencia, en el caso de las variables peso y altura lo lgico sera encontrar que >0.
Desafortunadamente, los parmetros y son usualmente desconocidos, por lo que es
necesario estimarlos a partir de una muestra. Sus estimadores, a y b, permiten expresar la
ecuacin estimada de regresin:
y = a + bx
con el menor error posible entre Y e Y, es decir que el modelo supone que la media o valor
esperado de es cero.
62
(y
y i ) 2 = ei
y se hallan los estimadores a y b que hagan mnima dicha sumatoria. Este mtodo se
conoce como el mtodo de los cuadrados mnimos.
Mediante una serie de procedimientos matemticos se llega a la expresin:
a = y bx
b = Sxy / Sxx
siendo S xy =
xy n x y
S xx = x 2 n x
63
1
13
122
2
1
83
3
11
117
4
4
92
5
6
115
6
3
97
7
10
110
8
8
111
9
4
114
10
10
123
Aqu lo que interesa es determinar si las ventas estn relacionadas con la experiencia de
los vendedores y eventualmente hallar un modelo que permita predecir las ventas anuales
(Y, variable dependiente o explicada) en funcin de los aos de experiencia de los
vendedores (X, variable independiente o explicativa).
Con los datos de la muestra el primer paso consiste en graficar el diagrama de dispersin
para ver si la variable respuesta Y depende o no, en cierto grado, de la variable
independiente X y si la relacin entre ellas puede ser razonablemente expresada por una
ecuacin lineal.
Diagrama de dispersin
Ventas anuales
(en miles de $)
150
125
100
75
50
25
0
0
10
15
experiencia (aos)
Vendedor
1
2
3
4
5
6
7
8
9
10
Total
n = 10
x = aos
de experiencia
13
1
11
4
6
3
10
8
4
10
70
x = x / n = 70/10 = 7
y=
ventas anuales
122
83
117
92
115
97
110
111
114
123
1084
x.y
x2
y2
1586
83
1287
368
690
291
1100
888
456
1230
7979
169
1
121
16
36
9
100
64
16
100
632
14884
6889
13689
8464
13225
9409
12100
12321
12996
15129
119106
y = y / n = 1084/10 = 108.4
64
S xx = x 2 n x = 632 10 x 72 = 142
2
2
y/x
=s =
2
e
(y
i =1
y )
n2
y
=
2
i
a y i b xy
n2
S yy (b 2 S xx )
n2
Una forma de evaluar el buen ajuste al modelo lineal es comparar la dispersin de los
puntos alrededor de la recta, que como ya se explic constituye la varianza residual s2e, con
la dispersin de los puntos alrededor de la media o varianza total s2 y.
65
(y
s2 y =
y)2
n 1
Si el modelo lineal es bueno, es de esperar que la variacin residual sea mucho menor que
la variacin total. Por ello se define el coeficiente de determinacin de la regresin de Y
sobre X, R2, como
R2 =1
s2e
s2 y
Syy = y 2 n y
R2
es
R =
S xy2
S xx S yy
siendo
Sb =
S e2
S xx
Otra forma de expresar la condicin de rechazo es: t calc> t crt, donde t crt = t n-2; 1-/2
Si se rechaza Ho, se puede afirmar que existen evidencias suficientes de una dependencia
lineal de Y sobre X, con un nivel de significacin de .
Volviendo al ejemplo de las ventas anuales en funcin de la antigedad de los empleados,
se desea determinar si el modelo lineal es vlido. En primer lugar se calcula el coeficiente
de determinacin R2:
R2 =
S xy2
S xx S yy
3912
= 0.67
142 x1600.4
Es decir que el 67% de la variabilidad de las ventas anuales est explicada linealmente por
la antigedad de los vendedores. Por lo tanto puede decirse, como primera aproximacin,
que el modelo lineal es vlido, ya que queda solo un 33% de variabilidad en las ventas que
se debe a otras causas, distintas de la antigedad.
La forma estadsticamente correcta de evaluar el modelo lineal es a travs de la prueba de
hiptesis para :
Ho: = 0 las ventas no dependen de la antigedad del vendedor
H1: 0 las ventas s dependen de la antigedad del vendedor
CR: t calc < t crt 1 o t calc > t crt 2, donde t crt 1 = t n-2; /2 y t crt 2 = t n-2; 1-/2
Otra forma: t calc> t crt, donde t crt = t n-2; 1-/2
En el ejemplo, para calcular tcalc es necesario calcular s2e y entonces sb.
s =
2
e
S yy (b 2 S xx )
n2
Sb =
S e2
65,42
=
= 0,679
S xx
142
t calc =
b 2.574 0
=
= 4.06
Sb
0.679
67
y t GLerror ;1 S e
2
x x
1
+ 0
n
S XX
x x
1
1+ + 0
n
S XX
y t GLerror ;1 S e
2
Ejemplo:
a) Use la ecuacin estimada de regresin para predecir puntualmente las ventas
anuales de un vendedor con 9 aos de experiencia.
Como se calcul anteriormente, la estimacin puntual de las ventas es:
y = a + bx = 89,122 + 2,754 x 9 = 113,908 miles de $
b) Estime las ventas promedio anuales de todos los vendedores con 9 aos de
experiencia, con un nivel de confianza del 95%.
Dado que se desea estimar el valor promedio de Y, corresponde un intervalo de confianza
del 95% para el promedio de Y:
y EM
donde EM = t 8,0.975 S e
1 x0 x
+
n
S XX
1 (9 7) 2
= 2.306 65.42
+
= 6.687
10
142
68
reemplazando: 113,908 6,687 = [107,221 ; 120,595]; con lo que resulta que las ventas
anuales promedio para todos los vendedores con 9 aos de experiencia se encuentran entre
107,221 y 120,595 miles de $ con una confianza del 95%.
c) Pedro Urdemales cumplir el ao prximo 9 aos en las ventas. Pronostique las
ventas que se esperan de l, con un nivel de confianza del 95%.
En este caso se trata de una estimacin para un valor individual de Y, por lo que
corresponde un intervalo de prediccin.
donde
y EM
EM = t 8,0.975 S e
x x
1
1+ + 0
n
S XX
= 2,306 65.42 1 +
1 (9 7 ) 2
+
= 19,809
10
142
reemplazando: 113,908 18,809 = [94,100 ; 133,717]; con lo que resulta que las ventas
anuales estimadas para Pedro Urdemales, un vendedor con 9 aos de experiencia, se
encuentran entre 94,100 y 133,717 miles de $ con una confianza del 95%.
d) Estime el incremento en las ventas anuales por cada ao adicional de experiencia,
con un nivel de confianza del 95%.
En este caso corresponde un intervalo de confianza para el coeficiente de regresin:
b t ;1 S b
2
reemplazando: 2,754 2,306 x 0,679 = [1,188 ; 4,320]; con lo que resulta que las ventas
anuales se incrementarn entre 1,188 y 4,320 miles de $ por cada ao adicional de
experiencia en ventas, con una confianza del 95%.
En Excel: Herramientas > Anlisis de datos > Regresin
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
Coeficientes
Error tpico
89,125
2,754
5,398
0,679
Intercepcin
Aos de experiencia
0,8202
0,6727
0,6318
8,0915
10
Superior
95%
101,573
4,319
1,83E-07
0,004
76,677
1,188
Anlisis de correlacin
Este modelo se aplica cuando ambas variables X e Y son aleatorias y el objetivo es
determinar el grado de relacin lineal entre dichas variables en estudio; y se dir si las
69
r=
S xy
S xx S yy
r=
S xy
S xx S yy
= R 2 = 0.82
Es decir que existe un buen grado de asociacin lineal entre ambas variables, siendo dicha
asociacin directa (al aumentar una variable, la otra tambin lo hace).
Ejercitacin:
Problema 1: Para analizar la incidencia del cansancio sobre la eficiencia en el trabajo se
tom una muestra de 10 empleados, se los hizo trabajar distinta cantidad de horas, luego
se les entreg un texto de varias carillas para tipear y finalmente se verific la cantidad de
errores cometidos por cada uno de ellos, obtenindose los siguientes datos:
Empleado
Horas trabajadas
Errores cometidos
1
2
4
2
2
6
3
3
7
4
3
7
5
4
8
6
4
10
7
5
9
8
5
13
9
6
11
10
6
15
Datos tiles: Sxx = 20; Syy = 100, Sxy = 40; Se2 = 2.5
a) Hallar la recta de mnimos cuadrados.
b) Calcular la variancia de la estimacin.
c) Con un nivel de significacin del 10%, presentan los datos suficiente evidencia
sobre la existencia de una relacin lineal entre estas dos variables?
d) Hallar un intervalo de confianza del 90% para el coeficiente de regresin.
70
RESPUESTAS:
a) y = 1 + 2x b) S e2 = 2,50
Coeficientes
Error tpico
1
2
1,500
0,354
Intercepcin
Horas trabajadas
0,894
0,8
0,775
1,581
10
0,524
0,000
-2,459
1,185
Superior
95%
4,459
2,815
x = 110
= 1882,73
y = 3530
= 271268
x y = 2569
a)
r = -0,864
b) [49,32 ; 93,14]
Volumen de produccin
(unidades)
400
450
550
600
700
750
Costo total
($)
5250
5184
5401
5892
6398
6840
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
Intercepcin
Volumen de produccin
Datos tiles:
Coeficientes
Error tpico
3114,880
4,718
427,370
0,726
Sxx = 93750
0,956
0,913
0,892
222,380
6
Syy =2284287,5
7,288
6,495
0,002
0,003
Sxy =442275
1928,310
2,701
Superior
95%
4301,450
6,734
Se =222,380
a) Use estos datos para estimar una ecuacin de regresin con la que se pueda predecir
el costo total para determinado volumen de produccin.
b) Interprete el significado de las componentes de la recta, en funcin del problema.
c) Calcule el coeficiente de determinacin. Qu porcentaje de la variacin en el costo
total puede explicar el volumen de produccin?
d) El programa de produccin de la empresa indica que el mes prximo se van a
producir 500 unidades. Cul ser el costo total estimado para esta operacin?
e) Estime con una confianza del 90% el parmetro del punto anterior.
f) Es correcto estimar el costo total cuando se producen 1000 unidades? Discuta.
RESPUESTAS: a) y = 3114,88 + 4,718x
b) Si no se producen unidades, el costo total de manufactura ser de 3114,88 $ (costo fijo),
mientras que por cada unidad adicional fabricada, el costo total se incrementar en 4,72$
(costo variable).
c) 0.9134; 91.34%
d) 5474 $
e) [4949 ; 5999 $]
f) Es incorrecto extrapolar.
72
la cantidad de das que faltan los empleados por ao y la distancia (en km) de su hogar a su
trabajo. Se eligi una muestra de 10 empleados y se reunieron los siguientes datos:
Empleado
Distancia a la fbrica
Ausencias anuales
1
2
5
2
6
2
3
10
6
4
14
8
5
1
2
6
18
8
7
3
4
8
7
3
9
14
7
10
12
5
Ausencias
10
15
20
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
Intercepcin
Variable X 1
Coeficientes
2,2354
0,3178
Error
Tpico
0,8240
0,0801
Estadstic
ot
2,7130
3,9689
0,8144
0,6632
0,6211
1,39165
10
Probabilidad
0,0265
0,0041
Inferior
95%
0,3353
0,1331
Superior
95%
4,1354
0,5024
que faltar 2,24 veces por ao, mientras que por cada km que se aleje su domicilio de la
fbrica, faltar a su trabajo 0,32 das.
b) El modelo lineal es vlido, los datos le dan la razn al Lic. Gmez (tcalc =3,97>tcrt =2,31)
c) [2,598 ; 5,05]
Problema 5: El tiempo que los nios permanecen sentados en la mesa durante la comida,
puede ayudar a predecir cunto comen? Se efectu una investigacin efectuada sobre 20
73
nios de tres aos, que fueron observados durante varios meses en el jardn de infantes.
Se registr el tiempo medio en el que cada nio permaneci en la mesa durante la comida,
as como la cantidad media de caloras ingeridas, calculadas a partir de una detallada
observacin de lo que el nio comi cada da.
Tiempo 21,4 30,8 37,7 33,5 32,8 39,5 22,8 34,1 33,9 43,8
Caloras 472 498 465 456 423 437 508 431 479 454
Tiempo 43,1 20,2 31,3 28,6 32,9 30,6 35,1 33 43,7 42,4
Caloras 410 504 437 489 436 480 439 444 408 450
Se aplic un modelo de regresin con los siguientes resultados:
Coeficiente de correlacin
Coef. de determinacin
Error tpico (Se, Sy/x)
-0,70
0,49
22,03
Ordenada al origen
Pendiente
Sxx=23447,06
a) Escriba la ecuacin de la recta estimada por mnimos cuadrados para predecir las
caloras consumidas a partir de los tiempos en la mesa. Interprete los coeficientes.
Describa brevemente lo que muestran los datos sobre el comportamiento de los
chicos.
b) Determine si la regresin es significativa, con = 0,05. Interprete R2 en trminos
del problema.
c) Calcule un intervalo de confianza del 95% para la verdadera pendiente de la recta
de regresin.
d) Estime las caloras que espera ingieran nios de tres aos que permanecen media
hora en la mesa. Podra usar la ecuacin para predecir la ingesta de nios que
permanecen 10 min en la mesa?
RESPUESTAS:
a) CALORAS = 556,67 3,00 TIEMPO. La ordenada no tiene interpretacin, ya que
ningn nio permaneci 0 min en la mesa, y por lo tanto constituye una
extrapolacin. Pendiente: Por cada minuto en la mesa, los nios ingieren, en
promedio, 3 caloras menos.
b) S, ya que tcalc (-4,13) < tcrt (-2,10). R2: el 49% de la variabilidad en la cantidad de
caloras consumidas se explica linealmente por los tiempos en la mesa.
c) [-4,525; -1,475]
d) 433,33 caloras; no es correcto efectuar la otra estimacin ya que no se cuenta con
datos en ese rango de tiempo.
74
80
33.9
76
29.9
74
31.4
73
25.8
72
24.2
70
19.7
69
21.3
a) y = -69,972+1,315x
=5.43>2.015)
c) 27,35%
d) 10.79%. Es un valor absurdo, ya que se extrapol.
Puntaje
2 vez
7
4
6
9
5
7
5
7
75
Problema 8: Los siguientes datos fueron extrados del Anuario estadstico de Amrica
Latina y el Caribe 2006 editado por la Comisin Econmica para Amrica Latina y el
Caribe (CEPAL) (http://www.eclac.org). Corresponden a el porcentaje de poblacin urbana,
es decir residente en localidades de al menos 2500 habitantes, el % de analfabetismo en
individuos mayores de 15 aos y la tasa global de fecundidad, que mide el promedio de
hijos por mujer, para los pases de Latinoamrica, ao 2006.
Pas
Argentina
Bolivia
Brasil
Chile
Colombia
Costa Rica
Cuba
Ecuador
El Salvador
Guatemala
Hait
Honduras
Mxico
Nicaragua
Panam
Paraguay
Per
Rep. Dominicana
Uruguay
Venezuela
% poblacin
urbana
91,8
64,2
83,4
86,6
76,6
62,6
76,1
62,8
57,8
50,0
41,8
47,9
76,5
56,9
65,8
58,4
72,6
65,6
91,9
92,8
%
Analfabetismo
2,8
11,7
11,1
3,5
7,1
3,8
2,7
7,0
18,9
28,2
45,2
22,0
7,4
31,9
7,0
5,6
8,4
14,5
2,0
6,0
Fecundidad
2,4
4,0
2,3
2,0
2,6
2,3
1,6
2,8
2,9
4,6
4,0
3,7
2,5
3,3
2,7
3,8
2,9
2,7
2,3
2,7
4
FECUNDIDAD
50
45
40
35
30
25
20
15
10
5
0
FECUNDIDAD
% ANALFABETISMO
Estudiar la asociacin entre las tres variables. Interpretar el valor de los coeficientes
utilizando los grficos de dispersin y los coeficientes de correlacin generados en Excel.
3
2
20
40
60
80
% POBLACION URBANA
r = -0.748
100
2
1
10
20
30
% ANALFABETISMO
r = 0.689
40
50
20
40
60
80
% POBLACION URBANA
r = -0.735
Revisin conceptual
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta
76
100
77
kilmetros
recorridos
100
50
100
100
50
80
75
65
90
90
cantidad de
entregas
4
3
4
2
2
2
3
4
3
2
tiempo de
viaje (hs)
9,3
4,8
8,9
6,5
4,2
6,2
7,4
6
7,6
6,1
Coeficientes
Intercepcin
Variable X 1
Variable X 2
-0,8687
0,0611
0,9234
Error tpico
0,9515
0,0099
0,2211
0,3916
0,0005
0,0042
-3,1188
0,0378
0,4006
78
d) Estime con un nivel de riesgo del 10 % entre que valores se encuentra el coeficiente
que relaciona el tiempo recorrido con la cantidad de entregas.
e) En general cuando se trabaja con un anlisis de regresin mltiple encontraremos
que las variables que consideramos independientes, estn relacionadas entre ellas.
Si tomamos las dos variables independientes de este problema (kilmetros
recorridos y cantidad de entregas), calculando el grado de relacin entre ellas
obtendramos que r = 0,28, lo que nos dice hay un pobre grado de relacin entre
ellas. El trmino multicolinealidad indica correlacin entre las variables
independientes.
RESPUESTAS: a) y = -0,8687 + 0,0611x1 + 0,9234x2 ; b) Por cada km recorrido, el tiempo
de viaje aumenta 0,0611 hs; por cada entrega efectuada, el tiempo de viaje aumenta 0,9234
hs; c) 1 0 ya que tcalc =6,1824 es mayor que tcrt = t7, 0.975 = 2,3646; 2 0 ya que tcalc =
4,1763 es mayor que tcrt = t7, 0.975 = 2,3646; R2 ajustado = 0,8763 que es notablemente
superior al R2 ajustado anterior de 0,622 y Se = 0.5731 que es sensiblemente inferior a Se
anterior de 1.002, por lo que se concluye que la incorporacin de la nueva variable
explicativa fue correcta; d) IC para 2: [0,50 ; 1,34]
Problema 2: El propietario de una empresa de video cable desea estimar el ingreso semanal
neto en funcin de los gastos de publicidad. Los datos histricos de una muestra de 8
semanas son los siguientes:
Ingresos netos
semanales
(en miles de pesos)
Anuncios en TV
Anuncios en peridicos
96
90
95
92
95
94
94
94
5
2
4
2,5
3
3,5
2,5
3
1,5
2
1,5
2,5
3,3
2,3
4,2
2,5
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
Intercepcin
Variable X 1
Variable X 2
Coeficientes
83,230
2,290
1,301
Error tpico
1,574
0,304
0,321
0,9587
0,9190
0,8866
0,6426
8
Problema 3: Un analista desea estudiar si el consumo elctrico familiar mensual (en kWh)
se vincula con la superficie de la vivienda (en m2) y con la cantidad de integrantes del
hogar. Se realizaron 40 observaciones en Capital y se obtuvieron los siguientes resultados:
Estadsticas de la regresin
Coeficiente de correlacin
mltiple
Coeficiente de determinacin
R^2
R^2 ajustado
Error tpico
Observaciones
Intercepcin
29
1,23
0,83
0,79
0,11
40
Superficie
Integrantes
0,52
1,25
0,09
0,17
80
EJERCICIOS INTEGRADORES
Problema 1: Una de las claves del xito en una empresa es que los trabajadores estn
alineados con la poltica de la misma. Se realiz un estudio para indagar si existe una
vinculacin entre el apoyo por parte de los empleados a las decisiones tomadas por la
empresa con su participacin en la toma de decisiones. Se entrevist a 200 trabajadores,
clasificndolos segn su acuerdo con las decisiones tomadas por la empresa y su
participacin o no en esas decisiones:
Toma de decisiones
Aprueban las decisiones
No aprueban las decisiones
Participa
73
27
No participa
51
49
Problema 2: Una empresa que produce galletitas desea controlar el funcionamiento de una
mquina empaquetadora que, en condiciones normales, opera con un peso medio de los
paquetes de 250g. Se tom una muestra de 20 paquetes obtenindose un peso medio de 280
g. y una desviacin estndar de 15 g., establecindose en un 1% la probabilidad mxima de
detener y revisar innecesariamente la mquina. Luego de evaluar los resultados de la
muestra se decide detener la mquina y revisarla.
a) Considera Ud. que la decisin tomada es correcta? Justifique la respuesta.
b) Estime con 99% de confianza el peso medio de los paquetes.
c) Cmo disminuira el error de la estimacin anterior en un 30%?
81
d) En una segunda mquina que tambin produce las galletitas en esa empresa se
tom una muestra de 20 paquetes obtenindose un peso medio de 255 g. y una
desviacin estndar de 12 g. Con un nivel de significacin del 1% podra concluir
que existe una diferencia significativa en los pesos promedio de las dos mquinas?
RESPUESTAS:
a) S, ya que x (280g) > xcrt (259,596).
b) [270,404 ; 289,596]
c) Podra incrementarse el tamao de la muestra a 31 paquetes, es decir incorporando
11 paquetes ms a los 20 paquetes iniciales.
d) Como tcalc (5,821) > tcrit2 (2,712), existe diferencia en los pesos promedio de los
paquetes fabricados por ambas mquinas.
Problema 3: En la sucursal de un banco se toma una muestra de 250 operaciones y se
observa que en ellas hubo 15 reclamos.
a) Estime el porcentaje de reclamos en la sucursal con un nivel riesgo de 0,05.
b) Calcule el nivel de confianza que podra asignar a una estimacin I.C. = (0,035;
0,085), realizada sobre la base de la muestra mencionada.
c) En otra sucursal que se supone que es ms eficiente que la anterior, sobre una
muestra de 300 operaciones se observa que hubo 15 reclamos. Se confirma la
sospecha? Asuma un riesgo del 5%.
RESPUESTAS:
a) [3,53 ; 8,47%]
b) 0,95254
c) Como Zcalc (0,54) no es mayor a Zcrit (1,645), no rechazo H0. Por lo tanto no hay
evidencias de que la segunda sucursal sea ms eficiente que la primera.
Problema 4: Una empresa de copiado est probando dos plotters, marcas XEROX y HP. Se
hicieron 50 copias de prueba de 15 tiradas cada una con ambos plotters. Con el Xerox ha
obtenido un rendimiento medio de 3,2 ppm (ppm: pginas tamao A3 por minuto) con un
desvo de 0,6 ppm mientras que con el HP ha obtenido un rendimiento medio de 2,8 ppm
con un desvo de 0,4 ppm. Los rendimientos, se ha probado, se distribuyen normalmente y
no se ha demostrado previamente si la variabilidad en el rendimiento de ambas mquinas
es igual o no.
a) Verifique al 5% si es que existen diferencias significativas de rendimiento entre
ambas marcas.
b) De existir diferencias qu marca de plotter recomendara? Estime con una
confianza del 95% cunto ms veloz es en promedio la marca que recomendada con
respecto a la otra.
c) Estime la velocidad promedio de la marca recomendada con una confianza del 95%.
RESPUESTAS:
a) Las varianzas en el rendimiento no difieren, ya que Fm (2,25) no es mayor que
Fcrit2 (2,98), por lo que se efecta una prueba t para varianzas iguales. Se concluye
82
Promedio
23
40
25
Desvo
2
5
4
De los socios que asisten a las clases de los dos profesores de natacin se eligieron al azar 8
y se les pidi que calificaran de 1 a 10 las clases de ambos profesores. Se obtuvo:
Socio
Prof Julio
Prof. Martn
1 2 3
4 5 6 7 8
9 8 10 8 7 9 5 8
7 5 7
9 8 6 6 8
En cuanto a la relacin entre la cantidad de socios nuevos por mes y el valor de la cuota (en
pesos) de 9 meses se tiene el siguiente registro:
Mes
1
2
3
4
5
6
7
8
9
Socios 100 90 70 75 70 60 58 55 40
Cuota 40 45 50 50 60 80 85 85 100
Para todas las preguntas usar riesgo 10%.
a) Determine si la eleccin de un deporte depende del gnero.
b) Pruebe si la proporcin de mujeres que practica tenis es menor que la de varones.
c) Estime la diferencia entre el porcentaje de mujeres y varones que practican tenis.
d) Verifique si la edad promedio de las personas que practican tenis es mayor que la de
las personas que hacen natacin
e) Estime la diferencia media de las edades de los socios que practican tenis y
natacin.
f) Pruebe si los socios prefieren la clase de natacin del profesor A.
g) Determine un modelo lineal que relacione la cantidad de socios nuevos con el valor
de la cuota e interprete el coeficiente de regresin.
h) Valide el modelo.
i) Estime la cantidad media de socios nuevos que se espera tener para una cuota de
90$.
j) Estime la variacin en la cantidad de socios por cada peso que aumenta la cuota.
83
Estadsticas de la regresin
Coeficiente de determinacin
R^2
Error tpico
Observaciones
Intercepcin
Variable X 1
Coeficientes
122,838
-0,811
Sxx=3738.9
0,9062
6,0289
9
Error tpico
6,821
0,0986
= 66.11
Estadstico t
18,01
84