Sunteți pe pagina 1din 85

ESTADSTICA II

GUIA DE TRABAJOS PRACTICOS

Departamento de Matemtica y Mtodos Cuantitativos


01/08/2012

CONTENIDOS

PRACTICO 1. DISTRIBUCIONES EN EL MUESTREO ....................................................... 2


PRACTICO 2. INTERVALOS DE CONFIANZA PARA UNA POBLACIN ......................... 9
PRACTICO 3. PRUEBAS DE HIPTESIS PARA UNA POBLACIN ............................... 22
EJERCICIOS INTEGRADORES .......................................................................................... 38
PRACTICO 4. INFERENCIA PARA DOS POBLACIONES ................................................ 42
PRACTICO 5. PRUEBAS CHI-CUADRADO ........................................................................ 54
PRACTICO 6. ANALISIS DE REGRESION Y DE CORRELACION LINEAL SIMPLE .... 61
PRACTICO 7. REGRESION LINEAL MULTIPLE .............................................................. 78
EJERCICIOS INTEGRADORES .......................................................................................... 81

PRACTICO 1. DISTRIBUCIONES EN EL
MUESTREO
Consideraciones generales
Las medidas de posicin y dispersin calculadas a partir de una poblacin se denominan
parmetros y son valores nicos, constantes, es decir que no cambian a menos que la
poblacin lo haga.
Los mismos estadsticos, pero calculados a partir de una muestra (de tamao n),
dependen de ella, por lo tanto varan al cambiar la muestra. Reciben el nombre de
estimadores y son variables aleatorias.
La distribucin en el muestreo resulta ser entonces la ley de distribucin de dichas
variables que hemos denominado estimadores. Nos interesar por lo tanto obtener adems
su valor esperado y su variancia.
En esta primera parte nos referiremos en particular a la media muestral y a la proporcin
muestral; en ambos casos demostraremos que su distribucin tiende a la distribucin
normal cuando n .
Se indica a continuacin la forma de caracterizar las medidas poblacionales y las
correspondientes muestrales:
Medida
Parmetro Estimador
media aritmtica

x
s2
variancia
2
s
desvo estndar

p
proporcin
p

Problemas resueltos:
Distribucin normal (Revisin del uso de tablas):
La produccin diaria de una fbrica es una variable normalmente distribuida con promedio
igual a 54 kilogramos y desvo estndar igual a 7 kilogramos.
a) Calcular la probabilidad de que la produccin de un da resulte inferior a 65
kilogramos.
b) Cul es la probabilidad de que maana se produzcan ms de 47 kilogramos?
c) En qu porcentaje de los das se produce entre 50 kilogramos y 60 kilogramos?
d) En qu porcentaje de los das la produccin supera los 20 kilogramos?
e) Cul es la produccin no superada en el 30% de los das?
f) Cul es la produccin slo superada en la cuarta parte de los das?
g) El encargado de produccin eleva un informe al dueo de la fbrica
comprometindose a producir diariamente determinada cantidad de kilogramos
como mnimo. En cunto debe fijar dicha cantidad mnima para que la
probabilidad de cumplir con el compromiso resulte igual a 0,95?

Solucin:

65 54
= PN ( z < 1,57 ) = F (1,57) = 0,94179
7

47 54
= PN ( z > 1) = 1 F (1)
7

a) PN ( x < 65 / = 54 ; = 7) = PN z <

b) PN ( x > 47 / = 54 ; = 7) = PN z <

= 1 0,15866 = 0,84134

60 54
50 54
z
= PN (0,57 z 0,86)
7
7

c) PN (50 x 60 / = 54 ; = 7) = PN

= F(0,86) F (-0,57) = 0,80511 0,28434 = 0,52077


Respuesta: 52%

d) PN ( x > 20 / = 54 ; = 7) = PN z <

20 54
= PN ( z > 4,86) = 1 F (4,86) = 1 0 = 1
7

Respuesta: 100%
e) F ( z ) = 0,30

z = 0,524

x = z + = 0,524 7 + 54 = 50,332 kgs

f) F ( z ) = 1 0,25 = 0,75

z = 0,674

g) F ( z ) = 1 0,95 = 0,05

z = 1,645

x = z + = 0,674 7 + 54 = 58,718 kgs


x = z + = 1,645 7 + 54 = 42,485 kgs.

Distribucin de la media muestral (con variancia poblacional conocida):


Una profesora de estadstica ha determinado que el tiempo necesario para que los
estudiantes concluyan un examen final se distribuye normalmente con media igual a 84
minutos y desvo estndar igual a 18 minutos.
Si se toma una muestra de 9 estudiantes, cul es la probabilidad de que el tiempo
promedio de finalizacin de sus respectivos exmenes no exceda los 90 minutos?
Si se extrajeran muestras de 4 estudiantes para calcular el tiempo promedio de finalizacin
de los exmenes, cul sera el tiempo promedio slo superado en el 5% de dichas
muestras?
Solucin:
Datos:

x : tiempo en minutos por examen

x = 84

x = 18

a) n = 9 estudiantes

x = 84

x : tiempo promedio de la muestra

x =

18

18

18
=6
3

18
=9
2

90 84

PN x 90 = PN z
= PN ( z 1) = F (1) = 0,84134
6

b) n = 4 estudiantes

x = 84

x : tiempo promedio de la muestra


F ( z ) = 1 0,05 = 0,95

z = 1,645

x =

x = 1,645 9 + 84 = 98,805 min utos

Respuesta: 98,8 minutos


Distribucin de la proporcin muestral:
En una localidad, donde el 36% de las mujeres casadas trabaja fuera de su hogar, se
entrevistarn 256 mujeres casadas seleccionndolas al azar.
a) Calcular la probabilidad de que ms del 40% de las entrevistadas trabaje fuera de
su hogar.
b) Si se entrevistaran 400 mujeres casadas, cul sera la probabilidad de encontrar a
lo sumo 244 que no trabajen fuera de su hogar?
Solucin:
a) n = 256

p = 0,36 (proporcin de mujeres casadas que trabajan)


q = 1 p = 1 0,36 = 0,64

p : proporcin de mujeres que trabajan en la muestra

p = 0,36

p =

pq
=
n

0,36 0,64
= 0,03
256

0,40 0,36

PN ( p > 0,40) = PN z >


= PN ( z > 1,33) = 1 F (1,33) = 1 0,90824 = 0,09176
0,03

b) n = 400

p = 0,64 (proporcin de mujeres casadas que no trabajan)


q = 1 p = 1 0,64 = 0,36

p : proporcin de mujeres que no trabajan en la muestra

p = 0,64

p =

pq
0,64 0,36
=
= 0,024
n
400

p 0 =

244
= 0,61
400

0,61 0,64

PN ( p 0,61) = PN z
= PN ( z 1,25) = F (1,25) = 0,10565
0,024

Ejercitacin:

Problema 1: Sabiendo que los montos abonados mensualmente en concepto de comisiones


por ventas en la firma Norte S. A. se distribuyen normalmente con un promedio igual a
US$ 4.700 y un desvo estndar igual a US$ 640, contestar:
a) Cul es la probabilidad de que en un mes se abone como mximo US$ 5.400 en
concepto de comisiones por ventas?
b) Cul es la probabilidad de que en un mes se abone como mnimo US$ 4.900 en
concepto de comisiones por ventas?
c) Cul es la probabilidad de que en un mes se abone entre US$ 4.000 y US$ 5.000 en
concepto de comisiones por ventas?
d) Cul es la probabilidad de que en un mes se abone a lo sumo US$ 8.000 en
concepto de comisiones por ventas?
e) En qu porcentaje de los meses el monto abonado en concepto de comisiones por
ventas supera los US$ 1.000?
f) En qu porcentaje de los meses el monto abonado en concepto de comisiones por
ventas queda comprendido entre US$ 4.200 y US$ 7.500?
g) Cul es el monto no superado en el 24 % de los meses?
h) Cul es el monto slo superado en el 15 % de los meses?
i) Qu monto se debe reservar para pagar las comisiones por ventas del mes prximo,
si se desea que la probabilidad de que dicha reserva resulte suficiente sea igual a
0,88?
RESPUESTAS:
e) 100 %

a) 0,86214
f) 78,23 %

b) 0,37828
c) 0,54
d) 1
g) US$ 4.248 h) US$ 5.363
i) US$ 5.452

Problema 2: Cierta empresa de radiotaxis ha calculado un gasto de mantenimiento


promedio por cada unidad de 1250 $ por mes, con un desvo estndar de 650 $. En una
muestra de 50 vehculos de la empresa,
a) Indique el promedio, variancia y distribucin de la variable gasto promedio de
mantenimiento mensual por unidad para la muestra de 50 taxis.
b) Calcule la probabilidad de que en un mes la empresa gaste en promedio en
mantenimiento ms de 1300 $ por unidad.
c) Calcule la probabilidad de que la empresa gaste a lo sumo 1100 $ promedio
mensuales en mantenimiento por unidad.
d) Calcule cunto se gastar en promedio como mnimo en el 40% de los meses.
e) Complete las siguientes frases:
1. En el 40% de los meses el gasto promedio de mantenimiento es de a la sumo
.. $.
2. En promedio en el 80% de los meses se gasta en mantenimiento de la flotilla
como mnimo . $ por unidad
3. En el ..% de los meses se gasta en el mantenimiento de la flotilla ms de
140$ promedio por unidad.
RESPUESTAS:
c) 0.0514

a) $ 1250, $2 8450, normal


b) 0.2932
d) $ 1273.3 e1)$ 1226.7; e2) $ 1172.6; e3) 5.14%

Problema 3: Una multinacional llev a cabo un relevamiento de los sueldos anuales de sus
gerentes generales en los 14 pases donde opera. Los resultados (en miles de US$) fueron:
125
100

79

82

62

109

158

102

55

120

105

91

88

104

a) Calcule el promedio y el desvo estndar de los sueldos anuales de todos los gerentes
(son poblacionales o muestrales?)
b) Extraiga una muestra aleatoria de 5 sueldos y calcule su promedio y su desvo
estndar (son poblacionales o muestrales?). Si tomara otra muestra de 5 sueldos,
tambin al azar, se mantendran el promedio y el desvo? Cmo se comporta
entonces x ?
c) Indique qu error se est cometiendo si se estima la media poblacional basndose en
alguna de las medias calculada en el tem anterior.
RESPUESTAS:
c) error muestral

a) = US$ 98571 ; = US$ 25278

b) x es una variable aleatoria

Problema 4: El peso de paquetes de caf envasados automticamente tiene distribucin


normal con un promedio de 500 gramos y un desvo tpico de 12 gramos.
a) Se selecciona un paquete al azar. Calcular la probabilidad de que dicho paquete
pese entre 494 gramos y 506 gramos.
b) Se extrae una muestra al azar de 9 paquetes. Calcular la probabilidad de que el
peso promedio de dicha muestra quede comprendido entre 494 gramos y 506
gramos.
c) Se extrae una muestra al azar de 25 paquetes. Calcular la probabilidad de que el
peso promedio de dicha muestra quede comprendido entre 494 gramos y 506
gramos.
d) Se extrae una muestra al azar de 100 paquetes. Calcular la probabilidad de que el
peso promedio de dicha muestra quede comprendido entre 494 gramos y 506
gramos.
e) Represente grficamente la distribucin de probabilidades de la media muestral en
cada uno de los puntos anteriores. Cambia la forma, el centro o la dispersin de la
variable?
RESPUESTAS:

a) 0,38292

b) 0,86638

c) 0,98758

d) 1

Problema 5: Calcular la probabilidad de que la longitud media de una muestra de 50 piezas


de precisin supere los 5,34 mm, sabiendo que la longitud de dichas piezas se distribuye
normalmente con promedio igual a 5 mm y variancia igual a 2,25 mm2.
RESPUESTA:

0,0548 (aproximadamente 5 %)

Problema 6: Se extrae una muestra al azar de 16 elementos de una poblacin normal con
desvo estndar igual a 6. Calcular la probabilidad de que el promedio de dicha muestra
difiera del promedio poblacional en 2 unidades como mximo.
RESPUESTA:

0,81648

Problema 7: Sabiendo que una fbrica de repuestos produce con un 13% de defectuosos,
contestar:
a) Si se toma una muestra de 200 repuestos, cul es la probabilidad de que la
proporcin de repuestos defectuosos en la muestra resulte mayor a 0,10?
b) Recalcular la probabilidad pedida en el punto anterior para una muestra de 500
repuestos.
RESPUESTAS:

a) 0,89617

b) 0,97725

Problema 8: En un sindicato donde el 20 % de los afiliados tiene menos de 25 aos de edad,


se seleccionan al azar 400 afiliados para efectuar una encuesta acerca de la aplicacin de
las normas de seguridad en sus respectivos lugares de trabajo. Calcular:
a) La probabilidad de que la proporcin de afiliados menores de 25 aos seleccionados
para la encuesta resulte inferior a 0,14.
b) La probabilidad de que el porcentaje de encuestados con 25 aos de edad como
mnimo resulte inferior al 85 %.
RESPUESTAS:

a) 0,00135

b) 0,99379

Problema 9: En una universidad donde el 32 % de los alumnos son mujeres, se tomar una
muestra de 240 alumnos. Calcular la probabilidad de que el porcentaje de mujeres en dicha
muestra difiera en ms de 3 puntos del porcentaje de mujeres en la universidad.
RESPUESTA:

0,31732

Revisin conceptual
Responda las siguientes preguntas:
a) Cul es la diferencia entre parmetro y estimador?
b) Qu es un estimador insesgado? De algn ejemplo.
c) Cul es la diferencia entre una estimacin eficiente y una ineficiente?
d) Qu estadstico usara para estimar la media poblacional? La media de la muestra
o la mediana? Por qu?
e) Un contador selecciona una muestra aleatoria de 100 cuentas bancarias y resulta
que promediadas dan un saldo de 725,80$. El contador afirma que ese ser el saldo
de TODAS las cuentas del banco ya que el promedio muestral es un estimador

insesgado de la media de una poblacin. El contador crea saber estadstica pero...


en esto estaba equivocado, por qu?
f) La figura de la derecha muestra la distribucin de
probabilidades de la variable X = largo del fruto (en mm) de
cierta especie leguminosa. Para una muestra de n = 5 frutos
n

elegidos al azar se define la variable aleatoria X =

X
i =1

Indique cul de las siguientes afirmaciones con respecto a la


distribucin de probabilidades de X es verdadera, justificando
sus dichos:
1. La distribucin de probabilidades no es normal ya que el
tamao de la muestra no es lo suficientemente grande
2. Tiene una esperanza igual a 0
3. Tiene una varianza 5 veces menor
4. La forma de la distribucin es ms aplanada que la de la
figura

PRACTICO 2. INTERVALOS DE CONFIANZA PARA


UNA POBLACIN
Consideraciones generales:
La inferencia estadstica utiliza la informacin que proporciona la muestra a travs de sus
estimadores para concluir sobre los parmetros de la poblacin (de la cual se extrajo la
muestra).
La Inferencia Estadstica est formada por dos grandes captulos: la estimacin y el ensayo
o prueba de hiptesis.
En primer lugar nos referiremos a la media muestral, estimador de la media poblacional,
bajo el supuesto de que se conoce la variancia poblacional.
En segundo lugar trabajaremos en inferencia para el promedio poblacional, desconociendo
la variancia poblacional e introduciendo la distribucin t de Student.
En tercer lugar nos referiremos a la inferencia sobre la proporcin poblacional para
muestras grandes.
Por ltimo veremos inferencia sobre la variancia poblacional e introduciremos la
distribucin chi cuadrado.
En todos estos casos trabajaremos con una muestra aleatoria que ser obtenida de la
poblacin que se desea estudiar.

Problemas resueltos:
Intervalo de confianza para el promedio con variancia poblacional conocida:
Un fabricante de lquido acondicionador para el cabello, que comercializa su produccin a
travs de una gran cantidad de negocios minoristas de su zona, alarmado por la ostensible
baja de las ventas debida a la profunda recesin econmica, decide cambiar la presentacin
de su producto, sustituyendo el envase tradicional por otro de menor costo que le permitir
reducir el precio de venta. Para evaluar los efectos del cambio efectuado, visita 49
minoristas y verifica que durante la semana anterior vendieron en total 1.323 litros de
acondicionador. Suponiendo que la variancia de las ventas semanales por minorista, que
antes del cambio de presentacin era igual a 156,25 litros2, no ha variado:
a) Construir un intervalo de confianza del 95% para estimar el nuevo promedio
semanal de ventas por minorista.
b) Si, basndose en la misma muestra, se efectuara una estimacin de dicho promedio
con un error de muestreo igual a 1,50 litros cul sera el nivel de confianza de la
misma?
c) Cuntos minoristas ms habra que incluir en la muestra para lograr que el error
de muestreo de la estimacin no supere los 1,50 litros y que el NC siga siendo igual
a 95%?

Solucin:

x = 1.323

n = 49

a) Datos:

2 = 156,25

NC = 95%

Intervalo de confianza: P{Lmite Inferior Lmite Superior } = 1

x=

x = 1.323 = 27

n
49
= 0,05 = 0,025
2
2

= 156,25 = 12,5

= 1 NC = 1 0,95 = 0,05

1 = 1 0,025 = 0,975
z1 = z0,975 = 1,96
2
2
12
,
5
12
,
5
Lmite inf erior = LI = x + z
= 27 + (1,96)
= 27 1.96
= 27 3,5 = 23,50
7
2
n
49
Lmite superior = LS = x + z1
= 27 + 1,9612,5
= 27 + 1,9612,5 = 27 + 3,5 = 30,50
7
2
n
49
z = z0,025 = 1,96
2

En resumen:

xE

E = z1

donde :

27 3,5

Respuesta :
b) Datos:

n = 49

E = z1
2

0,8 = 1

Respuesta:
c) Datos:

NC = 0,95

= 12,5

E = 1,50

1,50 = z 1

12,5

49

= 1,96 12,5

49

= 3,5

[23,50 ; 30,50 ]

= 1 0,8 = 0,2
2

NC = ?

z 1 =
2

1,50 7
= 0,84
12,5

= 2 0,2 = 0,4

F (0,84) = 0,80

NC = 1 = 1 0,4 = 0,6

El nivel de confianza sera igual a 60%


E = 1,50

= 12,5

z1 = 1,96

NC = 95%

n= ?

entonces :

2
z1
1,96 12,5
2
=
n=
= 266,78
1,5
E

E = 1,50 =

1,96 12,5
n

Respuesta:

n = 267

267 49 = 218

Habra que incluir 218 minoristas ms.

Intervalo de confianza para el promedio con variancia poblacional desconocida:


Para estimar el coeficiente intelectual (CI) promedio de los alumnos de una universidad se
toma una prueba a una muestra de 6 estudiantes obtenindose los siguientes resultados:
128 117 125 136 110 134
Suponiendo que los CI siguen una distribucin normal:
10

a) Efectuar la estimacin con un riesgo del 5%.


b) Cul debe ser el tamao de muestra para que, manteniendo el mismo nivel de
confianza, el error de muestreo de la estimacin anterior sea igual a 4?
Solucin:
a) Datos:

x=

n=6

x = 128 + 117 + 125 + 136 + 110 + 134 = 750 = 125


n

(x x )
=

= 5%

x: 128 117 125 136 110 134

(128 125) 2 + LL + (134 125) 2 9 + 64 + 0 + 121 + 225 + 81 500


=
=
=
= 100
6 1
5
5

n 1
S = 100 = 10
NC = 1 0,05 = 0,95

= 0,05

2 = 0,025

1 2 = 1 0,025 = 0,975

= grados de libertad = GL = n 1 = 6 1 = 5
xE

E = t v;1 2 S

= t 5;0,975 10

= 2,571.10

2,4495

= 10,5

125 10,5

Respuesta: [125 10,5 ; 125 + 10,5] = [114,50 ; 135,50]

b) Datos:

E=4

NC = 95%

n=?

= n 1 = 6 1 = 5

t 5 ; 0 , 975 = 2 ,571

t ;1 2 S
n =
E

2 ,571 10
=
= 41 ,3
4

= n 1 = 42 1 = 41

t 41 ; 0 , 975 = 2 , 020

t ;1 2 S
n =
E

2 , 020 10
=
= 25 ,5
4

= n 1 = 26 1 = 25

t 25 ; 0 , 975 = 2 , 060

t ;1 2 S
n =
E

2 ,060 10
=
= 26 ,5
4

= n 1 = 27 1 = 26

t 41 ; 0 , 975 = 2 , 056

t ;1 2 S
n =
E

2 , 056 10
=
= 26 , 4
4

n1 = 42

n1 = 26

n1 = 27

n1 = 27

Respuesta: El tamao de la muestra debera ser igual a 27 alumnos.

Intervalo de confianza para la proporcin:


En un importante supermercado, que cuenta con varias sucursales en distintos puntos del
pas, se est estudiando la incidencia de las tarjetas de dbito como medio de pago. A tal
efecto, se ha analizado una muestra de 125 compras efectuadas durante el ltimo fin de
semana en el local ubicado en Constitucin, observndose que 79 fueron abonadas con
tarjetas de dbito y el resto con otros medios de pago.
a) Estimar la proporcin de compras que se abonan con tarjetas de dbito en la
sucursal Constitucin. (Utilizar = 2%).

11

b) Determinar el tamao de muestra necesario para reducir en un 40% el error de


muestreo de la estimacin anterior.
c) Cuntas compras deberan analizarse en la sucursal Mar del Plata para estimar la
proporcin en estudio con un error de muestreo que no supere el 3% y una confianza
del 92%? Cabe aclarar que se carece de datos previos acerca de la incidencia del
pago con tarjetas de dbito en esta sucursal.
Solucin:
a) Datos:

p =

n = 125

= 2%

r = 79

r 79
=
= 0,632
n 125

q = 1 p = 1 0,632 = 0,368

1 2 = 1 0,01 = 0,99

p q
0,632 0,368
= z 0,99
= 2,326 0,043 = 0,10
n
125

E = z1 2

p E = 0,632 0,10

Respuesta: [0,532 ; 0,732]

p = 0,632

b) Datos:

= 2%

E(anterior) = 0,10

n=?

Reducir el error anterior en un 40%: nuevo error = E = 0,10.0,6 = 0,06

n=

z 12 2 p q
E2

z 02,99 0,632 0,368


0,06 2

2,326 2 0,232576
=
= 349 ,5279
0,0036

n = 350

Respuesta: El tamao de muestra necesario es igual a 350 compras.

c) Datos:
NC = 92%
E = 0,03
n=?
Al carecerse de datos acerca de la proporcin, se considerar: p = q = 0,50

= 1 NC = 1 0,92 = 0,08

NC = 0,92

n=

z 12

p q

E2

z 02, 96 0 ,50 0 ,50


0 , 03 2

2 = 0,04

1, 751 2 0 , 25
= 851 , 6669
0 ,0009

1 2 = 1 0,04 = 0,96

n = 852

Respuesta: Deberan analizarse 852 compras.

Intervalo de confianza para la variancia

12

Se desea estimar el desvo estndar de la longitud de un lote de piezas fabricadas. Es


razonable suponer que la longitud de la pieza se distribuye normalmente. Una muestra de
12 piezas del lote produjo un desvo estndar de 32 mm. Basndose en estos datos,
construir un intervalo de confianza del 95% para el desvo estndar.
Solucin:
Datos:

n = 12

v = n 1 = 12 1 = 11

S = 32

= 1 NC = 1 0,95 = 0,05

v2; 2 = 112 ;0,025 = 3,82


Lmite Inferior = LI =

Lmite Superior = LS =

NC = 95%

1 2 = 0,975

2;1 2 = 112 ;0,975 = 21,92


S 2 (n 1)

v2;1 2
S 2 ( n 1)

2; 2

32 2 11 11.264
=
= 513,8686
21,92
21,92

32 2 11 11.264
=
= 2.948,6911
3,82
3,82

Intervalo de confianza para estimar la variancia :


513,8686 = 22,67

2 = 0,025

[513,8686 ; 2.948,6911]

2.948,6911 = 54,30

Intervalo de confianza para estimar el desvo estandar :

[22,67 ; 54,30]

Respuesta: Se estima con una confianza del 95% que el desvo estndar de la longitud de
todo el lote est comprendido entre 22,67 mm y 54,30 mm.

Ejercitacin:
Problema 1: En una ciudad del interior del pas en la que habitan 100.000 familias se tom
una muestra al azar de 285 familias con la finalidad de analizar el ingreso mensual
familiar y se obtuvo una media de $2131. Suponga que el desvo estndar de los ingresos
asciende a $1772.
a) Indique cul es la unidad de observacin, la variable aleatoria en estudio, la
poblacin de referencia y la muestra. $2131 es el valor de un estimador o de un
parmetro? Y $1772? Justifique su respuesta.
b) Estimar el ingreso promedio mensual familiar con una confianza del 90 %. Los
resultados se aplican a las familias encuestadas, a todas las familias de la ciudad o
a todas las familias del interior?
c) Repetir la estimacin pero utilizando una confianza del 99%.

13

d) Calcule la amplitud de ambos intervalos. Es razonable que el segundo intervalo


tenga una amplitud mayor que el primero?
e) Cuntas familias ms se debera incluir en la muestra para reducir el error de
muestreo de la estimacin del punto b) en un 20 %?
f) Indique los supuestos para la validez de las estimaciones efectuadas.
g) Indique cul es el estimador utilizado y cul es su esperanza, desvo estndar y
distribucin de probabilidades.
RESPUESTAS:
a) la unidad de observacin es cada familia, la variable aleatoria en estudio es el
ingreso mensual, la poblacin de referencia est constituida por las familias de la
ciudad del interior del pas y la muestra est formada por 285 familias. $2131 es el
valor de un estimador ya que se calcul sobre la muestra y $ 1772 es el valor de un
parmetro, ya que al ser un dato histrico, se asume que se calcul sobre una gran
cantidad de datos.
b) Se estima que el ingreso promedio mensual familiar est comprendido entre $1958
y $2303.
c) [$ 1860 ; $ 2401]
d) $ 345y $ 541
e) Se deberan incluir 159 familias ms en la muestra.
f) muestreo aleatorio, distribucin normal de la media, desvo poblacional conocido
g) El estimador es x , su esperanza es , su desvo estndar (tambin llamado error
estndar) es / n y distribucin de probabilidades es normal ya que el tamao de
muestra es grande.

Problema 2: El dueo de un comercio minorista desea estimar el tiempo promedio que


demanda la atencin de cada cliente, y sabe por estudios anteriores que dicho tiempo se
distribuye normalmente con desvo estndar igual a 4,215 minutos. A tal efecto, registr la
cantidad de minutos que le insumi la atencin de seis clientes elegidos al azar y obtuvo los
siguientes datos:
15 12 8 23 15 11
a) Efectuar la estimacin requerida con un nivel de riesgo igual al 2 %.
b) Cuntos clientes ms se debera observar para reducir el error de muestreo
anterior en 1 minuto?
c) Basndose en la muestra original el comerciante estim que el tiempo promedio de
atencin por cliente oscila entre 12,142 minutos y 15,858 minutos. Cul es el nivel
de confianza de esta estimacin?
RESPUESTAS: a) [10; 18 min] b) 5 clientes ms c) NC = 72 %

Problema 3: Como parte de su control de calidad, la Qumica Erovne mide la temperatura,


en C, durante el ciclo de fabricacin de un producto. Se sabe por registros histricos que
la temperatura en dicho paso se distribuye normalmente con una variancia de 9C2.

14

a) Si se desea estimar la temperatura media de un ciclo de fabricacin con una


confianza del 95% y un mximo error muestral de 2.5C, cuntas mediciones
debern efectuarse?
b) Efectuadas las mediciones indicadas en a) se obtuvo una temperatura promedio de
92 C. Efecte la estimacin solicitada.
RESPUESTAS:

a) 6 mediciones

b) [89.6C ; 94.4C]

Problema 4: Las anchoas en filetes se envasan a mano en cierta empresa, a fin de


garantizar una presentacin ptima del producto. Interesa obtener una estimacin de la
velocidad de llenado de las latas por los operarios, para lo cual se registr la cantidad de
latas completadas por cada operario por hora. Los resultados fueron:
Velocidad (latas/hora) Cantidad de operarios
10-20
3
20-30
11
30-40
9
40-50
2
Dado que esta estimacin se efecta peridicamente en la empresa, se conoce el desvo
estndar de la velocidad de llenado, que es de 8 latas/hora.
a) Estime puntualmente la velocidad promedio de llenado manual de latas.
b) Estime la velocidad promedio de llenado manual de latas con una confianza del
90%.
c) Idem anterior, pero con una confianza del 99%. Cmo afecta el aumento del nivel
de confianza al error de estimacin del intervalo de confianza?
RESPUESTAS:
latas/h]

a) 29 latas/h

b) [26.37 ; 31.63 latas/h]

c) [24.88 ; 33.12

Problema 5: A fin de mejorar la programacin de turnos con pacientes, cierto centro mdico
desea estimar el tiempo que pasan los mdicos de cabecera con cada paciente en el
consultorio. Con tal fin se toma una muestra aleatoria de 20 citas, con las siguientes
duraciones de consulta (en min):
15

18

32

28

10

14

19

25

12

16

12

13

20

17

20

a) Estime puntualmente el tiempo promedio de cada consulta y su desvo estndar.


b) Estime el tiempo promedio de cada consulta con una confianza del 90%.
c) Cuntas observaciones ms se deberan obtener para reducir el error muestral del
punto b) a la mitad?
d) Compare sus resultados con la salida de Excel generada en Herramientas > Anlisis
de datos > Estadstica descriptiva. Para activar la opcin Anlisis de datos del men
Herramientas, seleccionar: Herramientas > Complementos > Herramientas para
anlisis
15

e) Indique cul es el estimador utilizado y cul es su esperanza, desvo estndar y


distribucin de probabilidades.
RESPUESTAS:

a) 15.25 y 7.38 min b) [12.4 min; 18.1 min]

Estadstica descriptiva
Media
Error tpico
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Curtosis
Coeficiente de asimetra
Rango
Mnimo
Mximo
Suma
Cuenta
Nivel de confianza(90,0%)

c) 55 citas ms

15,25
1,65
14,5
5
7,38
54,41
0,06
0,64
27
5
32
305
20
2,85

Problema 6: El contador de una firma comercial elige al azar 10 de las facturas emitidas en
el da de ayer y encuentra los siguientes montos en pesos:
142 38 76 24 187 95 129 82 63 74
a) Estimar el monto promedio de las facturas emitidas ayer, con = 0.10, bajo el
supuesto (poco realista) que el monto de las facturas se comporta normalmente.
b) Determinar el tamao de muestra necesario para efectuar la estimacin con un
error de muestreo igual a $15 manteniendo el mismo nivel de confianza.
c) Estime el monto promedio mximo de las facturas emitidas ayer, con = 0.10. Por
qu no coincide con el lmite superior del intervalo construido en el punto a)?
d) Explique el procedimiento que debi seguirse para extraer la muestra.
RESPUESTAS:

a) [62,37 ; 119,63]

b) 32 facturas c) $ 112.60

d) muestreo aleatorio

Problema 7: El consumo de bebidas alcohlicas por adolescentes constituye un problema


creciente. Una comisin integrada por profesionales de la salud en cierta localidad del
conurbano est interesada en conocer el nivel de consumo de alcohol en dicho grupo de
riesgo. Para ello llevaron a cabo una encuesta annima en 40 adolescentes elegidos al azar,
a los cuales se interrog sobre la cantidad y tipo de bebida que aproximadamente
consuman por semana. Los resultados, convertidos en litros netos de alcohol etlico,
fueron:

16

Cant.
Consumo
(litros)
Encuestados
0-0,2
12
0,2-0,4
11
0,4-0,6
8
0,6-0,8
5
0,8-1,2
4
a) Estime puntualmente el consumo semanal promedio de alcohol de los adolescentes
de dicha localidad y su desvo estndar.
b) Estime mediante un intervalo de confianza del 95% el consumo semanal promedio
de alcohol.
c) A cuntos adolescentes ms se debera encuestar si se desea efectuar la estimacin
con un error muestral de 0.06 litros?
d) El consumo semanal de alcohol no parece distribuirse normalmente. Sin embargo,
la utilizacin de intervalos de confianza basados en la distribucin normal est
justificada en este estudio. Por qu?
e) En realidad, los 40 adolescentes que integraron la muestra fueron seleccionados en
forma aleatoria entre los alumnos de un colegio secundario de la localidad. Qu
cambia de sus conclusiones anteriores?
RESPUESTAS:

a) 0.4 y 0.285 litros


b) [0.31 ; 0.49 litros] c) 50 ms
d) Por el teorema central del lmite
e) la poblacin sobre la que se efecta la inferencia

Problema 8: La Direccin General de Estadsticas y Censos de la Ciudad de Buenos Aires


informa peridicamente los resultados de la Encuesta Permanente de Hogares (EPH). Se
trata de un operativo por muestreo que involucra un nmero importante de viviendas
particulares distribuidas en el territorio de la Ciudad y est principalmente orientada a
medir los niveles de ocupacin y de ingresos de la poblacin econmicamente activa. En el
informe correspondiente a 2010 se indica que el ingreso medio per cpita familiar mensual
de la poblacin en hogares en la Ciudad de Buenos Aires es de $ 2943. Una nota al pie
indica: excluye la poblacin que no declara ingresos y a la poblacin sin ingresos. Adems se
informa un error de estimacin de 441 $, con un nivel de confianza del 95%.
a) El valor $ 2943 es un estimador o un parmetro? Por qu?
b) Cul considera que es la poblacin de este estudio? Sospecha de la existencia de
sesgo?
c) Calcule el intervalo de confianza para la media poblacional e interprete el resultado.
d) Explique a alguien que no sepa estadstica lo que significa nivel de confianza del
95%.

Problema 9: Una universidad privada, con 11000 alumnos, desarrolla polticas activas para
desalentar el consumo de tabaco. Al inicio del ciclo lectivo se implement una encuesta a
fin de determinar la incidencia actual del tabaquismo entre su alumnado. Para ello fueron
seleccionados 500 alumnos al azar, de los cuales 140 se declararon fumadores.
17

a) Indique cul es la unidad de observacin, la variable aleatoria en estudio, la


poblacin de referencia y la muestra.
b) Estime con una confianza del 90% la proporcin de fumadores entre los alumnos de
la universidad. Concluya.
c) Los resultados del punto anterior se aplican a los 500 alumnos seleccionados, a
todos los alumnos de dicha universidad o a todos los alumnos universitarios?
d) Si se desea que el error de muestreo de la estimacin no supere el 2 % y que el nivel
de confianza de la misma se mantenga igual al 90%, cuntos alumnos ms
deberan consultarse?
e) Con la misma muestra otro investigador estim que el porcentaje de fumadores de
la universidad estaba comprendido entre 26 % y 30 %. Cul fue el NC de esta
estimacin?
f) En otra universidad se desea realizar una investigacin similar y obtener una
estimacin del porcentaje de alumnos fumadores con las mismas caractersticas
planteadas en el punto anterior, pero no se cuenta con ningn dato previo acerca del
valor de dicho porcentaje. Cuntos estudiantes se debera consultar?
g) Indique cul es el estimador utilizado y cul es su esperanza, desvo estndar y
distribucin de probabilidades.
RESPUESTAS:
a) la unidad de observacin es cada estudiante, la variable aleatoria en estudio es
condicin del alumno (fumador/no fumador), la poblacin de referencia son los 11000
alumnos de la universidad y la muestra son los 500 alumnos encuestados.
b) [ 0,247 ; 0,313 ]
c) a todos los alumnos de esa universidad
d) 864 alumnos ms
e) NC = 68 %
f) n = 1692 alumnos
g) El estimador es p , su esperanza es p, su desvo estndar (tambin llamado error
estndar) es p(1 p) / n y distribucin de probabilidades es normal ya que el
tamao de muestra es grande, pn > 5 y (1-p)n > 5

Problema 10: El comercio electrnico o e-commerce consiste en la distribucin, compra,


venta, marketing y suministro de informacin de productos o servicios a travs de Internet.
En nuestro pas se encuentra en fuerte expansin, relacionado con la fuerte penetracin de
Internet. Una consultora llev a cabo una encuesta entre 352 usuarios de Internet mayores
de 30 aos residentes en la ciudad de Buenos Aires y comprob que slo 39 de ellos
efectuaron alguna compra por ese medio en el ltimo ao.
a) Estime puntualmente la proporcin de todos los usuarios de Internet mayores de 30
aos residentes en la ciudad de Buenos Aires que efectan compras por ese medio.
b) Explquele a alguien que no sabe estadstica por qu no podemos sencillamente
decir que el porcentaje de usuarios de Internet mayores de 30 aos residentes en la
ciudad de Buenos Aires que efectan compras online es del 11,1%.

18

c) Estime la proporcin de todos los usuarios de Internet mayores de 30 aos


residentes en la ciudad de Buenos Aires que efectan compras online, con una
confianza del 95%.
d) Cuntos usuarios deberan ser encuestados si se quiere tener un error muestral
mximo del 1%?
RESPUESTAS:

a) 0.111

c) [0.078 ; 0.144]

d) 3785 usuarios

Problema 11: Para una investigacin de mercado, se desea estimar el porcentaje de


actuales compradores de cierto yogurt que compraran una presentacin del mismo
producto pero de mayor contenido.
a) Si se desea estimar el porcentaje de futuros compradores en 10% con un riesgo del
5%, cuntos consumidores debern ser encuestados?
b) Efectuada la encuesta, 56 clientes respondieron que compraran la nueva
presentacin. Cul sera el intervalo de confianza resultante?
c) Por qu se utiliz p = 0.5 al no contarse con una estimacin previa? Asigne
distintos valores a p y calcule el tamao de muestra resultante. Qu observa?
d) Indique los supuestos necesarios para la validez de los clculos efectuados.
RESPUESTAS:
a) 97 consumidores
b) [0.479 ; 0.676]
c) el tamao de muestra alcanza un mximo cuando p = 1-p = 0.5
d) La muestra debe ser aleatoria. Se supone que la variable r = cantidad de compradores
que adquirirn la nueva presentacin sigue una distribucin binomial. Para que la
aproximacin a la distribucin normal que se utiliza en la resolucin del problema sea
vlida se requiere un tamao de muestra lo suficientemente grande y que pn > 5 y (1-p)n >
5.

Problema 12: Una consultora lleva a cabo un sondeo a fin de estimar la intencin de voto de
cierto partido poltico a dos semanas de las elecciones. El ltimo sondeo arroj un 29% de
intencin de voto, pero los analistas quieren confirmar si este porcentaje se mantiene.
a) Cuntos votantes debern ser encuestados si se desea estimar el porcentaje de
votantes de dicho partido en 2% con un riesgo del 1%?
b) Suponga que la consultora tiene presupuesto para 800 encuestas. Cul ser el
error muestral resultante si se mantiene el nivel de confianza? Y cul ser el nivel
de confianza si lo que se desea es mantener el error muestral?
c) Cul de los dos intervalos anteriores es ms preciso? Y cul es ms exacto?
RESPUESTAS:

a) 3416 votantes

b) EM = 4.13% ; NC = 0.7887

c) Es ms preciso el de menor EM y ms exacto el de mayor NC.

19

Problema 13: Como parte de la poltica de satisfaccin total del cliente, una empresa
automotriz desea conocer el nivel de aceptacin del modelo Theo que sali al mercado hace
6 meses y ya vendi 7300 unidades. Para ello, contacta a 523 compradores de dicho modelo
(elegidos en forma aleatoria entre todos los compradores) y los somete a un cuestionario,
que entre otras cosas, indaga lo siguiente:

Est satisfecho con su compra?

Ha tenido algn desperfecto con su vehculo?

Muy satisfecho

Medianamente satisfecho
SI

Insatisfecho

NO

Luego del procesamiento de las respuestas se obtuvo el siguiente resumen:


Est
satisfecho
con su
compra?
Cant.
respuestas

Muy
Medianamente
satisfecho
Satisfecho
291

Insatisfecho

159

Ha tenido algn desperfecto con su vehculo? SI


Cant. respuestas
138

73
NO
385

a) Estime con un nivel de confianza del 90% el porcentaje de todos los compradores
que estn satisfechos con el producto.
b) Estime con la misma confianza el porcentaje de todos los compradores que sufrieron
algn desperfecto con el vehculo.
c) En otra investigacin se enva un cuestionario con respuesta postal paga a los 7300
compradores del modelo y se reciben 500 respuestas. Qu opina de la calidad de
esta muestra? Es comparable a la obtenida anteriormente? Determine el tipo de
muestreo utilizado en cada caso.
RESPUESTAS:
a) [83.55 ; 88.53]
b) [23.22 ; 29.56]
c) Se trata de un muestreo no probabilstico, por conveniencia. En cambio, el muestreo
anterior era probabilstico y se trat de un muestreo simple al azar.

Problema 14: Para controlar la precisin de una mquina que corta piezas pequeas de
acero se toma una muestra de 35 piezas y al analizar la longitud de las mismas se
encuentra una variancia de 64 milmetros2. Estimar con una confianza del 99 % el desvo
estndar de las longitudes de toda la produccin, suponiendo que la longitud de las piezas
se distribuye normalmente.
RESPUESTA:
Se estima que el desvo estndar de toda la produccin est
comprendido entre 6,08 mm y 11,48 mm.
Problema 15: Se desea invertir en una empresa y se sabe que las utilidades mensuales
provenientes de dicha concesin se distribuyen en forma aproximadamente normal. Sin

20

embargo, interesa la variabilidad de las utilidades, que es una medida del riesgo que se
asume en el negocio. Se decide efectuar una estimacin del desvo estndar mximo de las
utilidades y para ello se extrae una muestra de 12 meses tomados al azar, obtenindose un
desvo estndar de U$S 14000. Efecte la estimacin solicitada con una confianza del 95%.
RESPUESTA:

U$S 21709

Problema 16: Un inspector tom una muestra de 5 latas de gaseosas, verific el contenido
en litros de las mismas y encontr: 0,48 0,51 0,45 0,43 0,52 litros
a) Estimar puntualmente el correspondiente desvo estndar poblacional.
b) Estimar el desvo estndar poblacional con NC = 90 %.
c) Qu supuestos deben asumirse?
RESPUESTA:
a) 0.038 litros
b) [0,025 ; 0,090 litros].
c) la variable contenido de las latas de gaseosa sigue una distribucin
normal y la muestra es aleatoria.

Revisin conceptual
Responda las siguientes preguntas, justificando las respuestas:
a) Si se aumenta el tamao de la muestra el error muestral aumenta o disminuye?
b) Si aumenta la variabilidad de la poblacin el error muestral aumenta o disminuye?
Qu se podra hacer al respecto?
c) Si aumenta el riesgo de la estimacin el error muestral aumenta o disminuye?

Se estim el contenido de conservantes en cierto lote de pan lactal, obtenindose un


intervalo de confianza del 95% de 0.25-0.35 (mg/100g)
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta:
a) El 95% de las muestras posee entre 0.25 y 0.35 mg/100g
b) El promedio del lote est entre 0.25 y 0.35 mg/100g
c) El promedio de la marca est entre 0.25 y 0.35 mg/100g
d) Si se aumenta la confianza el intervalo de confianza se achica (es ms preciso)
e) Si se quiere achicar el intervalo de confianza se debe aumentar el tamao de la
muestra

21

PRACTICO 3. PRUEBAS DE HIPTESIS PARA UNA


POBLACIN
Problemas resueltos:
Prueba de hiptesis para el promedio con variancia poblacional conocida:
Los aspirantes a ingresar como conductores a una importante lnea de autobuses deben
someterse a una serie de controles entre los que se cuenta una evaluacin de los reflejos,
que consiste en presentar sorpresivamente 4 obstculos al aspirante mientras maneja y
medir el tiempo que tarda en reaccionar ante los mismos. La empresa considera que el
tiempo de reaccin promedio ante un obstculo imprevisto no debe superar los 0,48
segundos. Se sabe que el tiempo de reaccin se distribuye normalmente con un desvo
estndar de 0,04 segundos, y la decisin de dar por aprobada o considerar desaprobada la
evaluacin se toma con un nivel de significacin del 10%.
a) Indicar las hiptesis adecuadas, la condicin de rechazo y la regla de decisin.
b) Un aspirante registr los siguientes tiempos de reaccin en segundos: 0,48 0,52
0,59 0,46. Se dar por aprobada esta evaluacin? Por qu?
c) Calcular la probabilidad de aprobar a un aspirante cuyo verdadero tiempo de
reaccin promedio es igual a 0,525 segundos.
d) Cuntos obstculos ms debera incluirse en la evaluacin para que la probabilidad
calculada en el punto anterior valga 0,05?
Solucin:
a) Datos: n = 4
= 0,04 segundos
0 = 0,48 segundos
= 10%
Para aprobar, el promedio no debe superar los 0,48 seg. ( 0,48)
H 0 ) 0,48 ( se aprueba la evaluacin)
H 1 ) > 0,48 (no se aprueba la evaluacin)
x c = 0 + z1

0,04
= 0,48 + z 0,90 0,04
= 0,48 + 1,282
= 0,48 + 0,02564 = 0,50564
n
4
2
Condicin de rechazo : Si x > x c se rechaza la hiptesis nula.
( CR : Si x > 0,50564 se rechaza H 0 )
Re gla de decisin : RD : Si se rechaza H 0 , no se aprueba la evaluacin.

b) x: 0,48 0,52 0,59 0,46

22

x=

x = 0,48 + 0,52 + 0,59 + 0,46 = 2,05 = 0,5125


n

Conclusin : Como x > x c (0,5125 > 0,50564) se rechaza H 0 , por lo tanto,


el aspirante no ser aprobado.
c) 1= 0,525

= ?

P(aprobar si = 0,525) = P(No rechazar H0 siendo falsa) =

= PN ( x 0,50564 / 1 = 0,525 ; x =

= PN z

= 0,04

= 0,02 )

0,50564 0,5250
= PN ( z 0,97 ) = F (0,97) = 0,16602
0,02

Respuesta: La probabilidad de aprobar con =0,525 segundos es igual a 0,166

d) 1= 0,525

= 0,05

1 = 0,95

0= 0,48

= 0,10

1 = 0,90

2
(z1 + z1 )
(z 0,90 + z 0,95 ) 0,04
(1,282 + 1,645) 0.04
n=
=
=
= 6,77
0 1
0,045

0,48 0,525

n=7

Respuesta: Se deberan incluir 3 obstculos ms.


Prueba de hiptesis para el promedio con variancia poblacional desconocida:
El dimetro interior de los cilindros producidos por una mquina se distribuye
normalmente y su promedio debe resultar igual a 1,32 cm. Para controlar la calidad de la
produccin y detenerla en caso de detectar que los cilindros no cumplen la especificacin
requerida, se revisa una muestra de 16 cilindros que arroja un dimetro promedio de 1,315
cm. y un desvo estndar igual a 0,02 cm. Ante estos resultados, y fijando en 0,10 la
probabilidad de detener equivocadamente la produccin, continuara usted el proceso
productivo o lo detendra?
Solucin:
Datos:

0 = 1,32

n = 16

x = 1,315

S = 0,02

= 0,10

Se detiene la produccin si no se cumple la especificacin de que el dimetro promedio


resulte igual a 1,32 cm. (Es decir, se detiene si: 1,32).

23

H 0 ) = 1,32 ( no se detiene el proceso productivo)


H 1 ) 1,32 ( se detiene el proceso productivo)

= n 1 = 16 1 = 15
x c1 = 0 tv ; S

x c 2 = 0 + tv ; S

= 1 2 = 1 0,10 2 = 0,95

= 1.32 1,753

0,02
= 1,32 0,008765 = 1,311235
16

= 1,32 + 1,753

0,02
= 1,32 + 0,008765 = 1,328765
16

CR : Si x < 1,311235 o

tv ; = t15;0, 95 = 1,753

x > 1,328765 se rechaza H 0 .

RD : Si se rechaza H 0 , entonces se det iene el proceso productivo.


Conclusin :
Como x ( que result igual a 1,315) no es menor a x c1 (1,311235) ni es mayor a x c 2 (1,328765)
no se rechaza la hiptesis nula. En consecuenc ia, no se detendr el proceso productivo.
Respuesta: Continuara el proceso productivo.

Prueba de hiptesis para la proporcin:


Como parte de una poltica orientada a mejorar las condiciones de trabajo, una fbrica de
grandes dimensiones instal el ao pasado un comedor para sus operarios y otorg la
explotacin del mismo en forma transitoria, por el lapso de un ao, a una conocida empresa
del rubro. Una vez transcurrido dicho perodo se encuestar a un grupo de operarios
elegidos al azar para conocer la opinin del personal acerca de la calidad del servicio
recibido, y se decidir renovar la concesin de la explotacin del comedor a la misma
empresa en caso de detectar que ms del 70% de los operarios se muestra satisfecho con
dicho servicio. En caso contrario, se tomar la decisin de cambiar el concesionario.
a) Determinar la cantidad de operarios que sern consultados y la regla de decisin
que se adoptar, sabiendo que se desea que valga 0,05 la probabilidad de decidir
equivocadamente la renovacin de la concesin; y que se ha fijado en 0,15 la
probabilidad de decidir el cambio de concesionario en caso de que el verdadero
porcentaje de operarios satisfechos con el servicio de comedor ascendiera al 83%.
b) Adoptando esta regla de decisin, cul es la probabilidad de renovar la concesin si
las tres cuartas partes del personal est satisfecho con el servicio de comedor
brindado por el actual concesionario?
c) Cumplido el ao de plazo, se toma la muestra prevista y se comprueba que el 82%
de los operarios consultados expres su satisfaccin con el actual concesionario del
comedor. Qu decisin se adoptar?
24

d) Estimar, con una confianza del 90%, el porcentaje de operarios satisfechos con el
actual servicio de comedor en toda la fbrica.
Solucin:
a) Datos: La concesin se renovar si ms del 70% (p0 = 0,7) de los operarios
estn satisfechos con el servicio actual (se renueva si: p > 0,70).

H 0 ) p 0,70 (no se renueva la concesin)


H 1 ) p > 0,70 ( se renueva la concesin)
P (decidir la renovacin de la concesin equivocadamente) = 0,05
P (Rechazar H0 / H0 es cierta) = 0,05 =
1 = 0,95
P (decidir el cambio de concesionario si en realidad p1 = 0,83 ) = 0,15
P (No se rechaza H0 / H0 es falsa) = 0,15 =
1 = 0,85

z 1
n=

p 0 q 0 + z 1
p1 p 0

z 0 , 95 0,70 0,30 + z 0 ,85 0,83 0,17


p1 q1
=

0,83 0,70

2
1,645 0, 21 + 1,036 0,1411
0,7538 + 0,38916
n=
=
= 77 ,3
0,13
0,13

p c = p0 + z

n = 78

p 0 q0
0,70 0,30
= 0,70 + z 0,95
= 0,70 + 1,645 0,0519 = 0,70 + 0,085 = 0,785
n
78

CR : Si p > 0,785 se rechaza la hiptesis nula.


RD : Si se rechaza H 0 , se renueva la concesin.
Respuesta: Se consultarn 78 operarios y se renovar la concesin si el porcentaje de
operarios satisfechos en esta muestra resulta mayor a 78,5 % (es decir, si como mnimo 62
de los consultados se muestran satisfechos).
b) P (renovar la concesin si las partes de los operarios estn satisfechos)
P (Rechazar H0 / p1 = 0,75) = P (Rechazar H0 / H0 es falsa) = 1

p 1 q1
0,75 0, 25
0,785 0,75

PN p > 0,785 / = p 1 = 0,75 ; =


=
= 0,049 = PN z >

n
78
0,049

PN ( z > 0,71) = 1 F ( 0,71) = 1 0,76115 = 0, 23885


Respuesta: La probabilidad pedida es igual a 0,23885
25

c)

Datos:

n = 78

p = 0,82

Respuesta : Como p result mayor que p c ( 0,82 > 0,785 ), se rechaza H 0 .


Por lo tanto, se adoptar la decisin de renovar la concesin del comedor.

d)

Datos:

n = 78

q = 1 p = 1 0,82 = 0,18

E = z1 2

p = 0,82

NC = 90%

= 1 NC = 1 0,90 = 0,10

p q
0,82 0,18
= z 0,95
= 1,645 0,0435 = 0,07
n
78

1 2 = 1 0,05 = 0,95

p E = 0,82 0,07

Respuesta: Se estima que el porcentaje de operarios satisfechos con el servicio, en toda la


fbrica, est comprendido entre 75% y 89%.

Prueba de hiptesis para la variancia:


El gerente de una importante empresa de servicios desea mejorar la atencin a los clientes
en lo que respecta al tiempo que les insume completar los distintos trmites que deben
efectuar, pues si bien el promedio de dicho tiempo es relativamente bajo, su variabilidad es
muy alta, tornando imprevisible la cantidad de minutos que demandarn. Un asesor,
consultado al respecto, aconseja la implementacin de un sistema de turnos rotativos y
capacitacin del personal que, en su opinin, redundar en una reduccin significativa de
la variabilidad del tiempo de espera y atencin que se distribuye normalmente, y cuyo
desvo estndar en la actualidad es igual a 73 minutos.
Despus de aplicar durante dos meses el sistema propuesto por el asesor, se selecciona una
muestra de 12 trmites que arroja un tiempo promedio de 40 minutos y un desvo estndar
de 32 minutos. Se puede considerar que el nuevo sistema logr su objetivo? (Utilizar =
5%).
Solucin:
Datos:

0 = 73

n = 12

S = 32

= 5%

Para lograr su objetivo el nuevo sistema debe redundar en una reduccin significativa de la
variabilidad del tiempo de espera y atencin. (Es decir, que se considerar que logr su
objetivo si 2 < 732).

26

H 0 ) 2 732 ( el nuevo sistema no logr su objetivo)


H 1 ) 2 < 732 ( el nuevo sistema logr su objetivo)
v = n 1 = 12 1 = 11

= = 0,05

2
2
2
crt
. = ; = 11;0 , 05 = 4,57

2
2
2
CR : Si calc
< crt
se rechaza la hiptesis nula ).
. se rechaza H 0 . ( Si calc . < 4,57

RD : Si se rechaza H 0 , se considera que el nuevo sistema logr su objetivo.


2
calc
. =

S 2 (n 1)

32 2 (12 1) 1.024 11
=
= 2,1137
732
5.329

2
2
Conclusin : Como calc
. < crt . ( 2,1137 < 4,57), se rechaza H 0 . Por lo tanto se considera

que el nuevo sistema logr su objetivo.

Ejercitacin:
Problema 1: El dueo de una casa de comidas rpidas con entrega domiciliaria, decide
controlar el rendimiento de sus empleados y se comunica telefnicamente con 14 clientes
para verificar el tiempo de entrega de los pedidos y encuentra un promedio de 32 minutos.
El encargado le haba asegurado que en promedio de entrega de pedidos era de media hora
como mximo. Sabiendo que el tiempo de entrega se distribuye normalmente con desvo
estndar igual a 8 minutos, y utilizando = 10 %,
a) Considera usted que la afirmacin del encargado es incorrecta?
b) Cmo explicara el significado del valor de ?
RESPUESTAS:
a) No hay pruebas de que la afirmacin del encargado sea incorrecta (32 es < a 32.74
min)
b) La mxima probabilidad de considerar incorrecta la afirmacin del encargado,
cuando en realidad es correcta, es igual a 0,10.
Problema 2: Una importante firma dedicada a la comercializacin de artculos mdicos
compra mensualmente grandes partidas de jeringas descartables a un proveedor local que
las entrega en cajas. Cada partida contiene 3000 cajas y se ha pactado que el contenido
promedio de la partida debe ser de 120 jeringas/caja. Para evitar la compra de cajas con
contenido inferior al pactado, se efecta un control de recepcin revisando una muestra de
42 cajas elegidas al azar. Suponga que el desvo estndar es igual a 6 jeringas y que la
probabilidad de rechazar equivocadamente una partida se fija en 5%.
a) Establecer la condicin de rechazo y la regla de decisin.

27

b) Se recibe una partida de la que se extraen al azar 42 cajas, siendo el contenido


promedio de las mismas de 117 jeringas. Qu decisin se tomar acerca de la
compra de esta partida?
c) Indicar cul es el riesgo del comprador y cul el del vendedor.
d) Calcular la probabilidad de rechazar el pedido cuando la partida tenga un promedio
de 118 jeringas por caja.
e) Qu cantidad de cajas debern ser revisadas si se desea que la probabilidad
calculada en d) valga 0.9?
f) Discuta cmo se modificara la regin de rechazo y la potencia de la prueba si: 1)
aumenta la variabilidad en el contenido de jeringas por caja; 2) aumenta la
cantidad de cajas revisadas en el control; 3) aumenta el riesgo que est dispuesto a
cometer el proveedor; 4) se recibe un lote muy malo.
RESPUESTAS: a) CR: Si x < 118,5 se rechaza H0. RD: Si se rechaza H0 no se compra la
partida.
b) Se rechaza la partida.
c) Riesgo del comprador: comprar una partida a pesar de que su contenido promedio es
menor a 120 jeringas; la probabilidad de que esto ocurra es . Riesgo del proveedor:
que le rechacen una partida a pesar de que su contenido promedio es de 120 jeringas o
ms; la mxima probabilidad de que esto ocurra es .
d) 0.697
e) 78 cajas

Problema 3: En un laboratorio se controla peridicamente la calidad de los productos


elaborados examinando muestras al azar de la produccin y deteniendo el proceso de
elaboracin en caso de detectar alguna anomala. A tal efecto se ha analizado una muestra
de 20 comprimidos cuyo contenido promedio de calcio result igual a 247 mg. Por otro lado
se sabe que el contenido promedio de calcio por comprimido debe ser igual a 250 mg y que
el desvo estndar es de 2 mg.
a) Debera detenerse el proceso de elaboracin de estos comprimidos? (utilizar un
nivel de significacin del 1 %).
b) En qu consisten el error de tipo I y de tipo II en este problema?
c) Cul es la probabilidad de detener el proceso cuando el contenido promedio de los
comprimidos se incrementa en un 1%?
d) Qu pasara con los valores crticos si se aumentase el tamao de la muestra?
RESPUESTAS: a) S, debera detenerse el proceso de elaboracin porque el contenido
promedio de calcio es inferior a 248.84 mg.
b) Error de tipo I: detener el proceso cuando este funciona correctamente; Error de tipo II:
no detener el proceso cuando este funciona mal.
c) 0.9987

Problema 4: Una pequea empresa disminuye sus gastos administrativos encargando la


confeccin de su documentacin a un centro de tipeo que trabaja con un promedio de 1,8
errores por pgina con un desvo igual a 0,6. Otro centro similar le ofrece sus servicios a un
28

costo un poco ms alto, pero le asegura que la calidad de su trabajo es muy superior, es
decir que trabajan con un promedio de errores por hoja significativamente menor. Con el
fin de tomar una decisin al respecto, la empresa encarga al segundo centro la confeccin
de 50 pginas y al revisarlas se verifica un total de 85 errores. Considere que el desvo
estndar no vara y fije en 0,05 la probabilidad de decidir equivocadamente el cambio de
centro.
a) Establecer la condicin de rechazo y la regla de decisin.
b) Qu decisin se tomar acerca del cambio de centro? Qu tipo de error se puede
estar cometiendo? Con qu probabilidad?
RESPUESTAS:
a) CR: Si x < 1,66 errores por pgina se rechaza H0. RD: Si se rechaza H0 se cambia de
centro.
b) Se continuar con el centro actual (1.7 no es menor que 1.66). Se puede estar cometiendo
un error de tipo II, con probabilidad desconocida.

Problema 5: En una fbrica se producen pilas cuya vida til promedio es de 78 horas con
una variancia igual a 49 horas2. Un ingeniero propone al dueo de la fbrica la adopcin de
un nuevo mtodo de produccin cuya implementacin resultara bastante costosa, pero si
se comprobara que la duracin de las pilas realmente se incrementa, el dueo estara
dispuesto a adoptarlo. La comprobacin consisti en tomar una muestra de 28 pilas
fabricadas con el nuevo mtodo, y al hacerlo se observ una duracin promedio de 82 horas.
a) Con un nivel de significacin del 2 % aconsejara cambiar el mtodo de produccin?
b) Qu tipo de error se puede estar cometiendo? Con qu probabilidad mxima?
c) Indique lo supuestos requeridos para la validez de la prueba.
d) Estime la duracin promedio de las pilas fabricadas con el nuevo mtodo con una
confianza del 95%.
RESPUESTA:
a) S, porque el promedio de la muestra es mayor a 80,72 hs.
b) Se puede estar cometiendo un error de tipo I, es decir cambiar de mtodo de produccin
cuando en realidad la duracin de las pilas no aument.
c) La variable debe seguir una distribucin normal y la muestra debe ser tomada al azar.
d) [79.4 ; 84.6 hs]

Problema 6: El dimetro promedio de ciertas piezas producidas automticamente debe ser


igual a 3 mm para que el proceso de produccin se considere bajo control. El ingeniero
industrial a cargo de la produccin desea establecer un control rutinario consistente en la
extraccin de una muestra cada hora y si se detectara que el proceso de produccin no est
bajo control, detenerlo y revisar. El ingeniero establece que la probabilidad de detener
innecesariamente la produccin debe ser igual a 0,05 y que la probabilidad de detectar que
el proceso est fuera de control cuando el dimetro promedio sea de 3,5 mm debe ser igual
a 0,90. Por registros histricos se conoce que el desvo estndar de los dimetros analizados
es igual a 0,84 mm.
a) Determinar el tamao de la muestra.
29

b) Si se implementa el control y una de las muestras arroja un dimetro promedio de


2,89 mm. detendra usted el proceso de produccin? Por qu?
RESPUESTAS:
a) n = 30 piezas
b) No, porque el promedio de la muestra est comprendido entre 2,7 mm y 3,3 mm.

Problema 7: La frmula del latex utilizado para guantes de uso en ciruga es exclusividad
de cada fabricante. Uno de los fabricantes estudia la posibilidad de cambiar la frmula
actual por otra ms costosa, siempre que pueda asegurar que el promedio de duracin sea
superior al de la frmula actual, que es de 110 das. Se fija en un 5% la probabilidad de
cambiar equivocadamente la frmula actual por la nueva frmula y en un 10 %
probabilidad de no cambiar la frmula cuando el promedio de duracin con la nueva
frmula es de 126 das. Por otro lado, el desvo estndar del tiempo de duracin es de 25
das y se piensa que no se modificar con la nueva frmula.
a) Indique las hiptesis apropiadas a esta situacin, el tamao de muestra necesario,
la condicin de rechazo y la regla de decisin.
b) Calcule la probabilidad de efectuar el cambio si el promedio de duracin con la
nueva frmula es de 122 das.
c) Si en la muestra se obtuvo una duracin promedio de 130 das, qu decisin se
debera tomar?
d) Estime con una confianza del 90% el promedio mximo de duracin de los nuevos
guantes.
RESPUESTAS:
a) n = 21 guantes; CR: Si x > 119 das se rechaza Ho. RD: Si se rechaza Ho se cambia
a la frmula ms costosa.
b) 0.71048
c) Se debera cambiar a la frmula ms costosa.
d) 137 das

Problema 8: Una fbrica dedicada a la produccin en serie de cierto tipo de pieza tiene un
tiempo de manufactura que se distribuye normalmente con un promedio de 6,2 minutos y
un desvo estndar de 0,7 minutos. Se considera la posibilidad de incorporar una nueva
mquina recientemente lanzada al mercado ya que se piensa que se pueden disminuir los
tiempos de produccin. Teniendo en cuenta el costo de la nueva mquina, solo se la
adquirir si se tiene una razonable seguridad de que con ella se lograr una disminucin
del tiempo medio actual. Si dicho parmetro es igual al actual se fija en 5% la probabilidad
de comprar la nueva mquina. En cambio, si es inferior en un 10% se desea que dicha
probabilidad valga 99%.
a) Indique que cantidad de ensayos deberan efectuarse con la nueva mquina y qu
resultado debera observarse para decir comprarla.
b) Calcule la probabilidad de comprar la nueva mquina cuando el tiempo medio de
produccin es un 5% inferior al actual.
c) Si en la muestra se obtuvo un promedio de 5 minutos, qu decidira Ud?

30

RESPUESTAS: a) Deberan efectuarse 21 ensayos y si el tiempo promedio de produccin de


los mismos es inferior a 5.95 min, se aconsejar su compra.
b) 0.65
c) Aconsejara la compra de la nueva mquina.

Problema 9: La evaluacin sensorial constituye una de las herramientas fundamentales del


proceso de aseguramiento de la calidad de los alimentos. Se lleva a cabo un trabajo que
tiene como finalidad medir la aceptabilidad de una nueva formulacin de pasta de
aceituna, utilizando consumidores habituales de este producto. Para ello, se efecta una
prueba de sabor con la nueva formulacin, en la que una muestra de consumidores valora
el agrado general en una escala estructurada de 0 a 100 (desagrado-agrado). Se decide que
slo si se encuentran pruebas de que los consumidores de pasta de aceituna valorarn la
nueva formulacin con un puntaje superior a 80 puntos en promedio, sta ser
comercializada. Participaron de la experiencia 25 consumidores. Los resultados obtenidos
luego del procesamiento de las respuestas en Excel fueron:
Estadstica descriptiva
Media
Mediana
Desviacin estndar
Varianza de la muestra
Error tpico
Rango
Mnimo
Mximo
Cuenta

85,25
84,11
17,38
302,06
60,41
45
55
100
25

a) Qu decisin debera tomarse con estos resultados con respecto a la


comercializacin de la nueva formulacin? Se fij el nivel de significacin en 5%.
b) El gerente de ventas afirma que el producto debe ser comercializado, ya que el
puntaje promedio obtenido fue superior a 80. Qu le respondera Ud?
RESPUESTAS: a) no se aconseja la comercializacin de la nueva formulacin (85,25 no es
mayor a 85,95).
b) El requerimiento para lanzar el producto hace referencia a un promedio poblacional,
mientras que el puntaje promedio al que hace referencia el gerente es muestral.
Como sabemos, ste ltimo es variable y por lo tanto, no es comparable al promedio
poblacional.

Problema 10: Una compaa cerealera de transportes desea investigar si el costo medio de
mantenimiento de los camiones es inferior a $ 2500 mensuales cuando se utiliza un aceite
especial ms caro que el actual. Se experiment el aceite especial con 30 camiones durante
un mes, obtenindose un costo medio de $ 2420 con un desvo estndar de $ 645. Se
establece en un 5% la probabilidad de cometer error de tipo I.
31

a) Recomendara Ud. el cambio?


b) Interprete y en trminos del problema. Cul de los dos podra estar cometiendo
segn su respuesta al punto anterior?
c) Indique si se cumplen los supuestos de la prueba estadstica efectuada.
RESPUESTAS: a) No, porque el costo medio con el nuevo aceite no es inferior a 2300$
b) = mxima probabilidad de afirmar que el nuevo aceite disminuy el costo medio de
mantenimiento de los camiones cuando en realidad no lo hizo. = probabilidad de
afirmar que el nuevo aceite no disminuy el costo medio de mantenimiento de los
camiones cuando en realidad s lo hizo.
c) Los 30 camiones deben haber sido elegidos al azar entre el plantel de camiones de la
compaa. Adems, la variable costo mensual debe ajustar a una distribucin
normal, lo cual es poco probable. Sin embargo, como el tamao de la muestra es
relativamente grande, por el teorema central del lmite podemos asumir una
distribucin aproximadamente normal para la media muestral.

Problema 11: La ley 26.687 sancionada en 2011 regula la publicidad, promocin y consumo
de productos elaborados con tabaco. Entre otros considerandos, establece un mximo de
once miligramos (11 mg) de alquitrn por cigarrillo, en promedio, debido a sus
comprobados efectos nocivos sobre la salud. El Ministerio de Salud controla una nueva
marca de cigarrillos, para lo cual mide el contenido de alquitrn, con los siguientes
resultados (en mg por cigarrillo):
11,3 13,3 13,1 12,3 12,5 12,0 11,8 11,0 12,4 12,2 12,7 11,1
10,8 12,6 10,2 9,7 10,8 10,9 11,2 12,3 14,3 11,8 10,5 11,1
a) Utilizando un nivel de significacin del 1%, existe evidencia de que la nueva marca
supera los niveles mximos permitidos de alquitrn en sus cigarrillos?
b) Estime con una confianza del 90 % el contenido medio de alquitrn de la nueva
marca de cigarrillos.
c) Cuntos cigarrillos ms debern analizarse si se desea disminuir el error muestral
en un 25%?
RESPUESTAS:

a) S existen evidencias porque 11,73 es superior a 11,55 mg.


b) [11,37; 12,13 mg]
c) 16 cigarrillos ms

Problema 12: El dengue se transmite por un mosquito presente en aguas estancadas. Se


lleva a cabo un estudio sanitario en varias localidades del GBA y se declarar emergencia
sanitaria si en ms del 40% de los depsitos de agua en lugares pblicos estn presentes
larvas de dicho mosquito. Se toman 300 muestras de agua al azar de dichas localidades,
observndose que 165 estn libres del mosquito. Se establece en un 10% el riesgo de
declarar errneamente la emergencia sanitaria.

32

a) Considera que existen suficientes evidencias como para declarar la emergencia


sanitaria?
b) Estime el porcentaje de cuerpos de agua contaminados en dichas localidades con
una confianza del 90%.
RESPUESTAS:
43.6%

a) S, porque el porcentaje de muestras contaminadas es superior al


b) [40.3 ; 49.7%]

Problema 13: Una empresa que se dedica a la fabricacin de insecticidas en aerosol, recibe
reclamos en el 10% de sus unidades debido a fallas en el sistema de spray. Se est
considerando cambiar el sistema de aerosol actual por otro ms costoso pero ms efectivo.
A fin de tomar una decisin, se fabrican 500 unidades con el nuevo sistema, encontrndose
fallas en 38 de ellas.
a) Con un riesgo del 5% de tomar una decisin incorrecta, aconsejara cambiar al
sistema ms costoso?
b) Calcule la probabilidad de aconsejar el cambio al sistema ms costoso si con l se
lograse un 7% de unidades defectuosas. Cmo se denomina esta probabilidad? Es
una decisin correcta?
c) Cuntas unidades ms deberan haber sido fabricadas y probadas si se desea que
la probabilidad calculada en el punto anterior valga 0.9?
d) Interprete y en trminos del problema.
RESPUESTAS:

a) S, porque p es inferior a 0.078

b) 1- = 0.757
c) 248 unidades ms
d) es la mxima probabilidad de decidir cambiar al sistema ms costoso cuando ste en
realidad no es ms efectivo. es la probabilidad de decidir no cambiar al sistema ms
costoso cuando ste en realidad es ms efectivo que el sistema actual.

Problema 14: Una poblacin infantil se dice que es susceptible de recibir una campaa de
educacin e higiene si su porcentaje de nios con dientes cariados es superior al 15%. En
una poblacin con 12.637 nios, un analista evala si debe efectuarse la campaa, siendo
que de 387 nios elegidos al azar, 65 tenan algn diente cariado.
a) Utilice = 0.1 y determine qu debera concluir el analista. Qu error puede estar
cometiendo con la decisin tomada?
b) El analista se pregunta si, en caso de que el porcentaje de nios con caries en la
poblacin fuese grande, de 20% por ejemplo, qu probabilidad tendra de detectarlo
con esta prueba.
RESPUESTA:
a) No se aconseja iniciar la campaa ya que no existen evidencias de que el porcentaje
de nios con caries sea superior al 15% (0.168 no es mayor que 0.173). Dado que no
se rechaz Ho, el analista puede estar cometiendo un error de tipo II.
b) 1- = 0,9047
33

Problema 15: En un control efectuado en una fbrica de mermeladas, se extrae una


muestra al azar de 120 envases de un lote y se observa que 14 presentan un incorrecto
pegado de las etiquetas. Las especificaciones de calidad admiten como mximo un 9% de
envases incorrectamente etiquetados por lote y se fija en un 10% la probabilidad concluir
errneamente que se supera dicho valor.
a) Con la informacin de la muestra qu podra concluir? Qu error podra estar
cometiendo?
b) Cul es la probabilidad de no detectar que en el lote el porcentaje de envases
incorrectamente etiquetados es del 13%? Cules son las consecuencias de cometer
este error?
c) Cuntos envases deberan revisarse si se desea que la probabilidad calculada en el
punto anterior valga la mitad?
RESPUESTAS:
a) Se concluye que no existen evidencias para asegurar que el
porcentaje de envases incorrectamente sellados est por encima del mximo admitido
(0.117 < 0.124). Se podra estar cometiendo un error tipo II.
b) 0.416; producir productos fuera de la especificacin
c) 257 envases

Problema 16: Una nueva serie de TV en horario central debe demostrar que capta ms del
20 % de la audiencia despus de su perodo inicial de 4 semanas para decir que tuvo xito.
Despus de un mes del lanzamiento de una nueva serie, de una muestra aleatoria de 400
hogares, contactados telefnicamente, se encontr que 104 estaban vindola.
a) Utilizando un nivel de significacin del 10 % y con la informacin de la muestra,
puede Ud. concluir que la serie tuvo xito?
b) Cul es la probabilidad, con una muestra de 400 hogares, de concluir que la serie
no tuvo xito si en realidad el 24 % de los hogares viese la serie?
c) Si se desea que la probabilidad de decir que la serie tuvo xito cuando el 24 % de las
familias ven la serie valga 95%, cuantas familias ms deberan incluirse en la
muestra?
RESPUESTAS:

a) S, porque p es superior a 0.226

b) 0.251

c) 523 familias

ms

Problema 17: En cierto establecimiento avcola, los huevos son lavados previo a su
envasado en cajas de cartn. Durante este procedimiento las prdidas estimadas por rotura
son del 13 %. Con el fin de mejorar el rendimiento, se decide implementar un nuevo proceso
de lavado, levemente ms costoso, fijndose en un 5 % la probabilidad de tomar una
decisin equivocada. Por otro lado se desea una probabilidad del 70% de implementar el
nuevo proceso de lavado si con l se reduce el porcentaje de rotura al 10%.
a) Calcule el tamao de muestra adecuado y la cantidad de huevos rotos que se deben
encontrar como mximo en dicha muestra para implementar el nuevo proceso.
b) Cul es la probabilidad de no implementar el nuevo sistema si con el nuevo mtodo
se logra reducir el porcentaje de rotura en 2 puntos?
34

c) Si en la muestra se observ que 50 huevos resultaron rotos, recomendara la


implementacin del nuevo sistema?
d) Estime el porcentaje de huevos sanos con el nuevo sistema con una confianza del
90%.
RESPUESTAS:
a) Se debern revisar 561 huevos y a lo sumo 61 de los mismos
debern estar rotos para implementar el nuevo mtodo de lavado.
b) 0.60
c) S (0.089 < 0.107)
d) [89.1 ; 93.1%]

Problema 18: Una empresa manufacturera que cuenta con un gran plantel de operarios
distribuidos en tres turnos de trabajo ha contratado los servicios de un experto en
relaciones laborales quien, como parte de su asesoramiento, recomienda que los operarios
escuchen msica mientras trabajan, generando as condiciones laborales ms agradables.
Esta reforma redundar, segn su opinin, en un aumento de la productividad. El dueo de
la empresa decide implementar esta reforma si le demuestran que ms de la mitad de los
operarios est de acuerdo. El asesor propone entonces, tomar una muestra de operarios y
consultar su opinin acerca de escuchar msica mientras trabajan.
a) Determinar el tamao de la muestra necesario para que la probabilidad de decidir
equivocadamente la implementacin de la reforma propuesta por el asesor valga
0,05 y que la probabilidad de no implementarla, cuando en realidad el 62 % de los
operarios est de acuerdo, resulte igual a 0,10.
b) Calcular la probabilidad de detectar, mediante este test, la conveniencia de
implementar dicha reforma si el 55% de los operarios estuviera de acuerdo con la
misma.
c) Una vez tomada la muestra, se encontr que 87 operarios se manifestaron de
acuerdo con la reforma propuesta. Aconsejara usted implementarla?
d) Estimar con NC = 90 % el porcentaje de operarios de la empresa que est de
acuerdo con escuchar msica mientras trabajan.
RESPUESTAS: a) n = 145 operarios
[53,3% ; 66,7%]

b) 0,33 c) S (porque 0,60 > 0,5683)

d)

Problema 19: Una empresa de productos alimenticios ha lanzado una campaa publicitaria
sobre una mayonesa cuya penetracin en el mercado era del 15 %. Se desea realizar un
relevamiento a fin de determinar si la campaa ha sido efectiva, en cuyo caso se realizar
una campaa similar para otro de los productos de la empresa. Si no se ha conseguido el
resultado deseado, se establece en un 5% la probabilidad de tomar una decisin errnea y
en cambio un aumento en la penetracin de 3 puntos se considera un resultado
razonablemente bueno, en cuyo caso la probabilidad de realizar la nueva campaa se
establece en un 90%.
a) Indicar el tamao de muestra necesario.
b) Qu cantidad de personas debern como mnimo contestar afirmativamente para
que se comience la nueva campaa?

35

c) Calcular la probabilidad de no realizar otra campaa cuando con esta se ha obtenido


un aumento de 2 puntos.
RESPUESTAS:

a) n = 1296

b) 216 personas

c) 0.362

Problema 20: En una fbrica de bebidas refrescantes que comercializa su produccin en


botellas que contienen en promedio 65 caloras con un desvo estndar de 4 caloras, se est
analizando la posibilidad de reformar el proceso de elaboracin para disminuir los costos,
siempre que esta reforma no aumente la variabilidad del contenido de caloras por botella.
Se toma una muestra de 30 botellas elaboradas con el nuevo proceso y se observa que la
variancia del contenido de caloras resulta igual a 18,24. Con un nivel de significacin del 5
%, qu decisin recomendara? Por qu?
RESPUESTA:
Recomendara reformar el proceso de elaboracin, ya que al no
rechazar Ho, no puede afirmarse que la variabilidad haya aumentado.

Problema 21: Los profesores de primer ao de cierta universidad han advertido que existe
gran disparidad en el nivel de conocimientos matemticos de los alumnos recin
ingresados, disparidad que qued evidenciada en el hecho de que el desvo estndar de las
notas que dichos alumnos obtuvieron en una prueba calificada de cero a cien, result igual
a 32. Con el objeto de subsanar este inconveniente, las dos primeras semanas de clase se
dedicaron al dictado de un curso de nivelacin intensivo. Al finalizar el mismo se
seleccionaron al azar 18 alumnos y se les tom una prueba similar a la anterior,
observndose que el desvo estndar de las notas obtenidas fue igual a 26. Considera
usted que el curso de nivelacin dio resultado? (Usar = 0,10)
RESPUESTA:
No, porque al no rechazar Ho, no puede afirmarse que la variabilidad
de las notas haya disminuido.

Problema 22: Se supone que las latas de cierta conserva de tomates contienen 170 grs. Sin
embargo, existe cierta variacin entre las latas ya que las mquinas envasadoras no son
absolutamente precisas. La distribucin de contenido de conserva de una mquina
envasadora es aproximadamente normal con un desvo de 10 grs, que se considera excesivo.
Se desea reemplazar la mquina actual por otra solo si se tiene razonable evidencia de un
mejor desempeo en relacin a la homogeneidad de la dosificacin. Se planea efectuar una
prueba piloto con 30 latas, fijndose en un 5% la probabilidad de concluir errneamente
que la nueva mquina tiene mejor desempeo en cuanto a su variabilidad.
a) Establezca el juego de hiptesis adecuado, la regla de decisin y la condicin de
rechazo.
b) Si en la muestra se obtuvo un desvo de 8.5 grs, qu conclusin debera sacarse?
c) En base a su respuesta anterior, qu error podra estar cometiendo?
RESPUESTAS:

a) CR: si 2 calc es menor a 17.71, se rechaza Ho

36

b) Como 2 calc es 20.95, no se rechaza Ho y se concluye que no existen evidencias


para afirmar que la variabilidad del contenido de las latas disminuy.
c) Error tipo II: suponer que la variabilidad con la nueva mquina no es menor
cuando en realidad s lo es.

Problema 23: Para un trabajo de microbiologa se requieren placas para preparaciones


microscpicas que tengan un espesor uniforme. La firma Placa ofrece unas placas que
segn ellos tienen un desvo de a lo sumo 0,1 m. A fin de corroborarlo, se toma una
muestra de 20 placas obtenindose una variancia de 0.0169 m2. Asumiendo un riesgo del
5%, dudara en la afirmacin de la empresa?
RESPUESTA:
Como 2 calc = 32.11 es mayor a 2 crt = 30.144, se rechaza Ho y se
concluye que existen evidencias para afirmar que la empresa est mintiendo.

Revisin conceptual
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta
a) El nivel de significacin de una prueba de hiptesis mide la probabilidad de que Ho
sea falsa
b) Si no se rechaza Ho significa que Ho es verdadera
c) Cuando se rechaza Ho es porque una muestra aleatoria no es coherente con la
hiptesis nula
d) Las hiptesis se plantean sobre los estimadores
e) El error de tipo II consiste en aceptar que un tratamiento ineficaz produce efectos
tiles.
f) es la potencia del ensayo

37

EJERCICIOS INTEGRADORES
Problema 1: La consultora Z llev a cabo un estudio sobre reinsercin laboral en directivos
de empresas, para lo cual se bas en 60 casos de gerentes recientemente reincorporados a
la actividad laboral. Con respecto al medio por el cual consiguieron su nuevo trabajo, 18 lo
hicieron mediante avisos publicados, 6 mediante presentacin espontnea a empresas o
consultoras y el resto mediante contactos.
a) Con una confianza del 95%, estime qu porcentaje de los gerentes lograron su nuevo
trabajo mediante contactos.
b) Qu cantidad adicional de gerentes debera encuestarse si se desea reducir el error
muestral anterior a la mitad?
c) Con respecto al tiempo que tardaron los 60 gerentes en obtener empleo los datos
fueron:
Tiempo (meses) 0-2 2-4 4-6 6-8 8-10 10-12
cant.gerentes
25
6
15
8
3
3
En las actuales condiciones del mercado laboral, cunto estima que tardan, en
promedio, en reinsertarse los gerentes? Trabaje con una confianza del 95%.
Problema 2: En cierto establecimiento avcola se ha detectado ltimamente que los pollitos
recin nacidos son de bajo peso (34 g en promedio), lo que redunda en mayores tasas de
mortalidad. Se sospecha que la causa de este problema reside en una temperatura
demasiado elevada en las incubadoras, por lo que se disminuye la temperatura en las
mismas. Luego de tres semanas de aplicada la modificacin se eligieron al azar 70 pollitos
recin nacidos y se les registr el peso, con los siguientes resultados:
Peso (g)
Cant. pollitos

30-32
8

32-34
16

34-36
25

36-38
18

38-40
3

a) Hay evidencia de una mejora en el peso de pollitos? Asuma un riesgo del 5%.
b) Estime, en las nuevas condiciones de incubacin y con una confianza del 95%, el
peso promedio de los pollitos recin nacidos y su variabilidad.
c) Cuntos pollitos ms deberan pesarse si se quiere reducir el error muestral de la
estimacin efectuada en el punto anterior en un 20%?
d) Estime, en las nuevas condiciones de incubacin y con una confianza del 95%, el
porcentaje de pollitos recin nacidos con un peso de por lo menos 36g.
RESPUESTA:

a) S (34.77 > 34.42)


b) [ 34.27 ; 35.27 g]
c) 40 pollitos ms
d) [19.3 ; 40.7%]

Problema 3: El departamento de investigacin de mercados de una empresa de proveedora


de Internet desea conocer los hbitos de sus abonados. Con tal fin, seleccion una muestra
aleatoria de 120 usuarios particulares (no empresas) y obtuvo los siguientes datos:
38

tiempo medio de conexin a Internet / da: 2.8 hs con un desvo de 1.8 hs


solo 29 de los usuarios fueron mujeres

a) Estime con un 95% de confianza el tiempo medio de conexin diario a Internet de los
usuarios particulares de dicha empresa y su desvo estndar.
b) Estime con un 10% de riesgo el porcentaje de mujeres usuarias de Internet de dicha
empresa.
c) En base a la informacin precedente, la empresa proveedora de Internet desea
aumentar la participacin de las mujeres en la red, por lo que lanza una intensa
campaa publicitaria en ese sentido. A los 3 meses de iniciada la campaa una
muestra aleatoria de 150 usuarios particulares determin que 51 de ellos eran
mujeres. Con un riesgo del 5%, considera que el porcentaje de mujeres en la red es
superior al 30%?
d) Determine el tamao de muestra necesario para que la probabilidad de detectar que
el porcentaje de mujeres usuarias de Internet aument al 35% sea de 0.8.
RESPUESTAS:

a) [2.48 ; 3.13 hs] y [1.59 ; 2.05 hs]


c) No (0.34 no es mayor a 0.362)

b) [17.7 ; 30.6%]

Problema 4: La ganancia porcentual promedio para un proyecto de inversin no es la nica


preocupacin para un administrador de inversiones, quien debe preocuparse por una gran
variabilidad en las ganancias ya que una prdida podra sacarlo del negocio. Un promotor
de inversiones proyecta alcanzar una ganancia promedio de ms del 12% con un desvo del
5%. Una muestra de 25 proyectos produjo una media del 12.5% con un desvo estndar del
3.6%.
a) El promotor desea estar seguro de que el desvo es menor al 5% con un nivel de
significacin del 10%. Qu podra Ud. decir al respecto?
b) Estime el desvo estndar mximo que el promotor puede esperar con un riesgo del
10%.
c) Con un riesgo del 10%, considera que el promotor logr la ganancia promedio
esperada?
RESPUESTAS:
15.659)

a) Existen evidencias de que el desvo es inferior al 5% (12.442 <


b) 4.46%

c) No (12.5 no es mayor a 12.95)

Problema 5: El gobierno est pensando en crear un mejor sistema de financiamiento a las


exportaciones en determinados rubros. Para ello debe estimar el monto exportado por
empresa para las ubicadas en tales rubros. Una muestra aleatoria de empresas proporcion
los siguientes datos:

39

Monto exportado N de empresas


(en millones de $)
0-10
3
10-20
6
20-30
11
30-40
9
a) Estimar el monto de exportaciones por empresa para el nivel de confianza de 0.95.
b) Si se sabe que anteriormente el monto exportado era de 27 millones de pesos puede
afirmarse que se ha modificado? Realice la prueba con un nivel de significacin del
2%.
c) Si el desvo estndar del monto exportado era de 10 millones de pesos, construya la
regla de decisin que le permita probar si tambin el desvo se ha modificado.
Utilice = 2%.
d) Con qu supuestos trabaj?
RESPUESTAS:

a) [20253015 ; 27678985]
b) No se rechaza Ho
c) No se rechaza Ho

Problema 6: Se desea realizar una campaa publicitaria con el fin de presentar en el


mercado un nuevo producto de la empresa. El lanzamiento sera viable si se puede
evidenciar un aumento significativo en los gastos mensuales promedio de las personas
para productos de este tipo y si el porcentaje de compradores potenciales para el producto
supera al 45%. Actualmente los gastos mensuales de las personas en productos similares
(que tienen una distribucin normal, por qu?) poseen un promedio de 350$ con un desvo
estndar 40$. Para decidir por la conveniencia o no del lanzamiento de la campaa se
tomaron datos de una encuesta realizada sobre 200 personas, en una empresa del mismo
ramo con la oferta de un producto similar, y se observ que 97 personas estaran dispuestas
a comprar dicho producto y que el gasto promedio mensual en productos similares era de
383$ con un desvo estndar de 45$. Si se asume una probabilidad del 10% de decidir
lanzar la campaa cuando no es aconsejable:
a) Considera que el desvo estndar se mantendr, asumiendo un riesgo del 10%?
b) Qu decisin tomara? Justifique estadsticamente dicha decisin.
c) Realice una explicacin clara y sencilla de cul fue el procedimiento empleado en el
anlisis del punto anterior, qu temas de los expuestos en clase se utilizaron y cmo
los combin.
d) Por qu posee una distribucin normal la variable en estudio? Es necesario que
sea normal para realizar los procedimientos que usted utiliz?
RESPUESTAS:
a) El desvo no se mantiene (251,85 > 232,91).
b) Decidira no lanzar ya que si bien se prueba que el promedio es mayor a lo esperado (383
> 354.09) no puede probarse que la proporcin supere al 45% (0.485 < 0.495)
Problema 7: Se desea disear una encuesta en la ciudad de Formosa a fin de determinar el
porcentaje de hogares con necesidades bsicas insatisfechas.
40

a) Indique el tipo de muestreo que considera ms apropiado para llevar a cabo el


estudio. Justifique su eleccin.
b) Si se desea efectuar la estimacin slo en la zona residencial de la ciudad de
Formosa, cambiara la respuesta dada en el punto anterior? Fundamente su
respuesta.
c) Determine el tamao de la muestra para efectuar la estimacin del punto b,
sabiendo que se desea un error de estimacin de 5%, con una confianza del 95%.
Indique las unidades del valor obtenido.
RESPUESTAS:
a) Muestreo estratificado
b) Muestreo aleatorio simple o muestreo sistemtico
c) 385 hogares

41

PRACTICO 4. INFERENCIA PARA DOS


POBLACIONES
Consideraciones generales:
En numerosas situaciones, un profesional puede encontrarse ante el problema de tener que
tomar una decisin en base a la comparacin de dos mtodos de trabajo o entre dos
productos, para elegir el que resulte mejor; o bien slo determinar si existe una diferencia
significativa entre los mismos. En todas estas situaciones deber tomar decisiones teniendo
como informacin slo los resultados de las muestras obtenidas. Bajo estas circunstancias
deber utilizar las tcnicas estadsticas para comparar las poblaciones de las cuales se
extrajeron las muestras, utilizando conceptos ya introducidos como ensayos de hiptesis y
estimacin por intervalos de confianza.
Los casos que se vern son los ms comunes, relacionados con dos muestras independientes o no -, siempre bajo el supuesto de que las muestras deben provenir de
poblaciones normales.
Se desarrollarn los siguientes casos:
1. Comparacin de dos variancias poblacionales, utilizando la distribucin F de
Snedecor.
2. Comparacin de dos medias poblacionales, utilizando la distribucin normal o t
a. Muestras independientes:
i. Variancias conocidas
ii. variancias desconocidas e iguales
iii. variancias desconocidas y distintas
b. Muestras dependientes o pareadas
3. Comparacin de dos proporciones poblacionales para muestras grandes, utilizando
la distribucin normal

Problemas resueltos:
Comparacin de dos medias poblacionales con variancias desconocidas y
supuestamente iguales
Una sucursal bancaria recibe numerosas quejas de sus clientes debido al excesivo tiempo
de espera en los cajeros automticos (definido como el tiempo que transcurre desde que el
cliente se incorpora a la fila hasta que inicia la operacin). Se registra entonces durante
una semana el tiempo de espera de 50 clientes elegidos al azar, obtenindose un promedio
de 12 min con un desvo estndar de 5 min. Estos resultados son considerados excesivos,
por lo que se implementa un proceso de mejora que incluye personal de orientacin al
cliente. Al cabo de dos meses de implementado el proceso se toma una nueva muestra de 60
42

clientes, obtenindose esta vez un tiempo de demora promedio de 10 min con un desvo de 4
min. Analice la informacin y decida si la implementacin del proceso fue efectiva, con un
riesgo del 5%.
Solucin:
El proceso de mejora ser considerado efectivo si el tiempo promedio de demora de los
clientes una vez implementado dicho proceso (2) es inferior al tiempo de demora antes de
la implementacin del mismo (1). Es decir:
H 0 ) 1 2 1 2 0 (el proceso no fue efectivo)
H 1 ) 1 > 2 1 2 > 0 (el proceso si fue efectivo)

Datos:

n1 = 50

x1 = 12 min
x 2 = 10 min

n2 = 60

s1 = 5 min
s2 = 4 min

= 0,05

Como las varianzas poblacionales son desconocidas, primero debe probarse si son iguales o
no.
Comparacin de dos varianzas
H 0 ) 21 = 2 2

(las varianzas de las dos poblaciones son iguales)

H1 ) 21 2 2

(las varianzas de las dos poblaciones son distintas)

CR: Si Fcalc < Fcrt1 o si Fcalc > Fcrt2 se rechaza la hiptesis nula
RD: Si se rechaza Ho se concluye que las varianzas son distintas
siendo
Fcalc =

S12
S 22

Fcrt 1 = F 1; 2; / 2 = F49;59; 0.025 0,40576


=

52
42

Fcrt 2 = F 1; 2;1 / 2 = F49;59; 0.975 2,464

= 1,56

Conclusin: Como Fcalc (que result igual a 1,56) no es menor que Fcrt1 (0,40576) ni es
mayor a Fcrt2 (2,464) no se rechaza Ho. En consecuencia se infiere que las varianzas de las
dos poblaciones (tiempo de demora antes y despus de la implementacin del proceso de
mejora)no difieren significativamente.
Volvamos a la comparacin de las dos medias poblacionales con varianzas poblacionales
desconocidas, y en base al resultado de la prueba de hiptesis anterior, supuestamente
iguales. Las hiptesis eran:
H 0 ) 1 2 1 2 0 (el proceso no fue efectivo)
H 1 ) 1 > 2 1 2 > 0 (el proceso si fue efectivo)

CR: Si tcalc > tcrt se rechaza la hiptesis nula


RD: Si se rechaza Ho se concluye que el proceso fue efectivo

43

siendo

t crt = t 1+ 2 2;1 = t108;0.95 = 1,6591

Para obtener el tcalc debe calcularse previamente la varianza amalgamada s2a:


S a2 =

S12 (n1 1) + S 22 (n 2 1) 5 2 .49 + 4 2 .59


=
= 20,08
n1 + n 2 2
50 + 60 - 2

t calc =

(x1 x 2 ) D0
Sa

1
1
+
n1 n 2

(12 - 10) - 0
1
1
4,48
+
50 60

siendo S a = S a2 = 20,08 = 4,48

= 2,33

Conclusin: Como tcalc (que result igual a 2,33) es mayor que tcrt (1,6591) se rechaza Ho.
En consecuencia se infiere que el tiempo de demora medio de todos los clientes despus de la
implementacin del proceso de mejora es menor al tiempo de demora antes de la
implementacin del mismo y por lo tanto el proceso puede considerarse efectivo, siendo
aconsejable su implementacin en otras sucursales.

Comparacin de dos proporciones poblacionales para muestras grandes


Una consultora est llevando a cabo una encuesta telefnica acerca de la opinin de la
poblacin sobre una medida tomada recientemente por el gobierno nacional. Un socilogo
sospecha que el porcentaje de hombres que estn a favor de la medida es superior al de las
mujeres. Los resultados obtenidos en base a 490 encuestas telefnicas fueron:

A favor
En contra
No sabe/No contesta

Mujeres
112
110
44

Hombres
110
84
30

Se confirma la sospecha del socilogo? Utilice = 0.01.


Solucin:
El socilogo afirma que la proporcin de mujeres en la poblacin a favor de la medida (p1)
es inferior a la de los hombres (p2). Es decir:
H 0 ) p1 p 2 p1 p 2 0 (no se confirma la sospecha del socilogo)
H 1 ) p1 < p 2 p1 p 2 < 0 (si se confirma la sospecha del socilogo)

Datos:

n1 = 222 p 1 =

112
= 0,5045 n2= 194
222

p 2 =

110
= 0,5670
194

CR: Si zcalc < zcrt se rechaza la hiptesis nula


RD: Si se rechaza Ho se concluye que la proporcin de hombres en la poblacin a favor de la
medida es superior a la de las mujeres y por lo tanto se confirma la sospecha del socilogo.
Zcrt = z = z0.05 = -1.96
44

Z calc =

Z calc =

( p 1 p 2 ) D0

donde

1
1

p (1 p ) +
n
n
2
1

( p 1 p 2 ) D0
1
1

p (1 p ) +
n1 n 2

p =

r1 + r2
112 + 110 222
=
=
= 0,5337
n1 + n 2 222 + 194 416

(0,5045 0,5670) 0
1
1
0,5337(1 0,5337)(
+
)
194 222

= 1,27

Conclusin: Como zcalc (que result igual a 1,27) no es menor que zcrt (-1,96) no se rechaza
Ho. En consecuencia no existen evidencias para afirmar que la proporcin de hombres en la
poblacin a favor de la medida es superior a la de las mujeres y por lo tanto no se confirma
la sospecha del socilogo.

Ejercitacin:
Problema 1: El ingeniero a cargo de una planta de envasado de detergente desea saber si
existen diferencias en el volumen de llenado de los envases de detergente en dos tipos de
mquinas. Los desvos estndar del volumen de llenado son 0.03 y 0.05 litros
respectivamente. Una muestra aleatoria de 15 envases llenados por la mquina 1 indic un
contenido promedio de 1.03 litros y una muestra similar de 20 envases de la mquina 2
indic un contenido promedio de 0.98 litros. Con una significacin del 5%, existen
diferencias entre los dos tipos de mquinas en el volumen promedio de llenado?
RESPUESTA:

S (zcalc = 3.68 > 1.96)

Problema 2: Una compaa de transporte utiliza habitualmente neumticos marca P.


Recientemente han salido al mercado neumticos de otra marca, que denominaremos M,
que ofrecen una mayor duracin aunque a un mayor costo. La compaa debe renovar
constantemente sus neumticos, pero antes de decidir la compra lleva a cabo una prueba
donde se toman 12 de cada marca y se evala su rendimiento. Los neumticos se utilizan
hasta su desgaste. Se obtienen los siguientes resultados:
marca P : promedio de 36000 km
marca M : promedio de 38000 km
Por datos suministrados por las empresas se conoce el desvo estndar de la duracin de los
neumticos, que es de 5000 km para la marca P y de 5800 km para la marca M. Con un
nivel de significacin del 10%, aconsejara a la compaa comprar la marca M?
RESPUESTA: No existen evidencias para aconsejar una marca sobre la otra por su
rendimiento (zcalc = -0.905 no es menor que 1.282), por lo tanto se aconseja seguir con la
marca P, de menor costo.

45

Problema 3: Algunas empresas incurren en gastos considerables para entrenar nuevos


empleados. Existe un costo directo debido al programa de entrenamiento y un costo
indirecto debido a que los empleados en entrenamiento deben alcanzar un cierto grado de
eficiencia para contribuir significativamente al proceso de manufactura. Es por ello que se
buscan programas que lleven a los empleados a un grado de eficiencia mxima en el
menor tiempo posible. Cierta operacin requiere de un entrenamiento de un mes para que
el empleado alcance el grado deseado. Se ha sugerido un nuevo mtodo que se desea
comparar con el actual. Para ello se seleccionaron 20 empleados que se dividieron en dos
grupos iguales. Un grupo fue entrenado con el mtodo en uso (A) y el otro con el nuevo (B).
Al cabo de un mes se obtuvieron los siguientes tiempos de operacin (en min):
Mtodo en uso 32 37 35 28 41 44 35 31 34 38
Mtodo nuevo 35 31 29 25 34 40 27 32 31 33
a) Presentan estos datos evidencia suficiente de que el nuevo mtodo disminuye los
tiempos de operacin? Utilice un nivel de significacin del 5 %.
b) Se sugiere estimar la diferencia entre ambos procesos dado el gasto y el riesgo
asociado, con un nivel de confianza del 90 %.
RESPUESTAS:

a) S (1.89 > 1.73)

b) [0.31 ; 7.28 min]

Problema 4: Los siguientes datos representan los rditos anuales efectivos, en porcentaje,
sobre cuentas de mercado de dinero de una muestra de 10 bancos comerciales de la ciudad
capital de la provincia ms importante del pas y 10 cuentas de bancos de ahorro de la
misma ciudad:
BANCOS
REDITO
Comerciales 2,25 2,32 2,02 1,92 2,02 1,82 2,10 2,38 2,30 2,28
De Ahorro
2,43 2,53 2,38 2,50 3,00 2,50 2,55 3,20 2,50 2,02
a) Con un nivel de significacin del 5% pruebe si hay igualdad de variancias
poblacionales.
b) Existe evidencia de una diferencia en los rditos efectivos anuales sobre las
cuentas de mercado de dinero de los dos tipos de bancos? Utilice un nivel de
significacin del 5%.
c) Qu supuestos consider para efectuar los tests de a) y de b)?
RESPUESTA:
a) No hay evidencias de desigualdad de varianzas (Fcalc=0.33 no es
menor que Fcrt1 = 0.248)
b) S (tcalc = -3.49 < tcrt1 = - 2.10)
c) Se supone que ambas muestras son independientes y obtenidas al azar, que las
poblaciones de las cuales se extrajeron siguen una distribucin normal y que los desvos
estndar de las dos poblaciones son iguales (homocedasticidad).

46

Problema 5: Una empresa de investigacin de mercado proporciona a un fabricante de


electrodomsticos estimaciones sobre las ventas de sus productos al por menor a partir de
muestreos en negocios minoristas. El gerente de marketing tiende a fijarse en la
estimacin y a ignorar el error de sta. Este mes, una muestra aleatoria simple de 75
negocios da una media de ventas de 52 unidades para cierto electrodomstico, con un
desvo estndar de 13 unidades. Durante el mismo mes del ao anterior, otra muestra
aleatoria simple de 53 negocios da una media de ventas de 49 unidades con un desvo
estndar de 11 unidades. Un aumento de 49 a 52 unidades representa un incremento del
6%. El gerente de marketing est contento porque las ventas han aumentado un 6%.
a) Efecte la prueba de hiptesis tendiente a determinar si las ventas promedio de este
mes difieren significativamente de las del mismo mes del ao anterior, con un nivel
de significacin del 5%. Asuma igualdad de varianzas.
b) Construya un intervalo de confianza del 95% para la diferencia entre el nmero
medio de unidades vendidas este ao y el ao pasado en todos los negocios
minoristas. Asuma igualdad de varianzas.
c) Compare los resultados de los dos tems anteriores. Explique con un lenguaje que el
gerente pueda entender, por qu no estamos seguros de que las ventas hayan subido
un 6% y que incluso podran haber bajado.
(extrado de Moore, 2000)
RESPUESTAS: a) No hay evidencias (tcalc = 1,37 no es mayor tcrt2 = 1,98) b) (-1.21; 7.21)

Problema 6: Se desea comparar los niveles de contaminacin sonora de dos reas de una
ciudad. Para ello, en cada uno de las reas se eligen puntos al azar y se determina la
intensidad sonora en la va pblica. Los resultados (en decibeles) fueron:

rea Norte
70.1
70.4
75.8
67.5
68.4
73.6
76.9
75.7
71.4
70.3
71.1
74.4
70.2
74.3

rea Sur
74.1
75.4
76.2
79.9
70.5
70.1
74.9
75.3
70.3
70.7

Con = 0.05 podra afirmar si existen diferencias en los niveles de contaminacin sonora
de las dos reas? Asuma que la intensidad sonora sigue una distribucin normal (Por qu

47

es necesario efectuar tal suposicin? Si fuese el intendente de la ciudad, cul de las dos
reas considerara como prioritaria por mayor contaminacin acstica? Fundamente su
respuesta.
En Excel: Herramientas > Anlisis de datos > Prueba F para varianzas de dos muestras
Prueba F para varianzas de dos muestras
CIUDAD1
Media
71,833
Varianza
9,259
Observaciones
12
Grados de libertad
11
F
1,0560
P(F<=f) una cola
0,4568
Valor crtico para F (una cola) 2,6346

CIUDAD2
73,386
8,767
14
13

En Excel: Herramientas > Anlisis de datos > Prueba t para dos muestras suponiendo
varianzas iguales
Prueba t para dos muestras suponiendo varianzas iguales
CIUDAD1
Media
71,833
Varianza
9,259
Observaciones
12
Varianza agrupada
8,9927
Diferencia hipottica de las medias 0
Grados de libertad
24
Estadstico t
-1,3159
P(T<=t) una cola
0,1003
Valor crtico de t (una cola)
1,7109
P(T<=t) dos colas
0,2006
Valor crtico de t (dos colas)
2,0639

CIUDAD2
73,386
8,768
14

Problema 7: Como consecuencia de los resultados que se muestran en el problema 10 del


Prctico 2, los responsables del rea de salud de dicha localidad decidieron lanzar una
campaa de prevencin de adicciones. Luego de tres meses de campaa, una muestra de 50
adolescentes elegidos al azar arroj un promedio de 0.38 lts de alcohol consumidos
semanalmente con un desvo de 0.24 lts.
a) Considera, con un riesgo del 5%, que la campaa ha sido efectiva?
b) Qu error puede estar cometiendo como resultado de la prueba efectuada en el
punto anterior? Indique en qu consiste, en trminos del problema.
RESPUESTAS: a) No (tcalc = 0.36 no es mayor que 1.6624)
b) Como no se rechaz Ho se puede estar cometiendo un error de tipo II.

48

Problema 8: La densidad de la cerveza es una cualidad importante para mantener la


calidad de la misma. Puede verse afectada por el tiempo de fermentacin, variaciones en
los ingredientes o diferencias en el equipo de fermentacin. Un fabricante con dos lneas de
produccin a hecho ligeros cambios en la lnea 2, buscando reducir la variabilidad en la
densidad de la cerveza producida. Se tomaron 23 muestras de cerveza de ambas lneas de
produccin y se determin la densidad de la misma, obtenindose los siguientes
resultados:
promedio de la lnea 1 = 3,2
desvo estndar 1 = 1,04
promedio de la lnea 2 = 3,0
desvo estndar 2 = 0,69
a) Determine para ambas lneas el coeficiente de variabilidad. Qu podra Ud.
concluir?
b) Con los datos obtenidos, existe evidencia para indicar una variabilidad menor en la
lnea 2 asumiendo un riesgo de equivocarse del 5%?
c) Las modificaciones efectuadas, alteraron la densidad promedio de la cerveza?
Asuma un riesgo del 5%.
RESPUESTAS:

a) CV1 = 32.5%, CV2 = 23%


b) S (Fcalc = 2.27)
c) No (tcalc = 0.77 no es mayor que t38, 0.975 = 2.024)

Problema 9: En un estudio efectuado a fin de caracterizar la produccin de aceite de oliva


en la provincia de Catamarca, se estudiaron dos de las variedades ms difundidas de
aceitunas. Muestras de distintos ejemplares elegidos al azar fueron secadas en estufa y se
les determin el contenido porcentual en aceite, con los siguientes resultados:
Variedad
Arauco
Carolea

10.5
16.4

12.2
14.8

9.3
17.8

12.5
8.3

% aceite
11.1 10.5
11.9 15.5

11.4
13.4

9.6
16.0

12.6
15.8

13.4
18.2

Las diferencias observadas se deben al azar? Es decir, existen diferencias significativas


en el contenido porcentual de aceite de ambas variedades? De ser as, cul de ellas
recomendara por su mayor rendimiento promedio? Asuma un riesgo del 5%. Compare sus
resultados con la salida generada en Excel.
Prueba F para varianzas de dos muestras
Arauco
Media
11,31
Varianza
1,841
Observaciones
10
Grados de libertad
9
F
0,210616
P(F<=f) una cola
0,01484
Valor crtico para F (una cola) 0,314575

Carolea
14,81
8,741
10
9

49

Prueba t para dos muestras suponiendo varianzas desiguales


Arauco
Media
11,31
Varianza
1,841
Observaciones
10
Diferencia hipottica de las medias 0
Grados de libertad
13
Estadstico t
-3,4024
P(T<=t) una cola
0,0024
Valor crtico de t (una cola)
1,7709
P(T<=t) dos colas
0,0047
Valor crtico de t (dos colas)
2,1604

Carolea
14,81
8,741
10

Problema 10: BJ y Asociados estn probando dos comerciales para una compaa
productora de jugos. Ambos comerciales se mostraron a 12 individuos, a quienes se pidi
que los calificaran en una escala de 1 a 100. Los resultados fueron:
Individuo
Aviso 1
Aviso 2

1
95
87

2
59
65

3
73
80

4
65
73

5
32
45

6
45
39

7
60
57

8
83
81

9
27
33

10
50
40

11
63
66

12
95
93

Utilice un nivel de significacin del 10 % para la prueba que determina si los panelistas
apreciaron ms alguno de los dos avisos. A qu conclusin debera llegar la empresa BJ y
Asociados? Compare sus resultados con la salida generada con Excel.
Prueba t para medias de dos muestras emparejadas
AVISO1
Media
62,25
Varianza
483,6591
Observaciones
12
Coeficiente de correlacin de Pearson
0,9453
Diferencia hipottica de las medias
0
Grados de libertad
11
Estadstico t
-0,48207
P(T<=t) una cola
0,31960
Valor crtico de t (una cola)
1,36343
P(T<=t) dos colas
0,63920
Valor crtico de t (dos colas)
1,79589

AVISO2
63,25
415,1136
12

Problema 11: La gerencia de ventas de una cadena de muebleras dise un plan de


incentivos para los vendedores. A fin de evaluar este plan innovador, seleccionaron 6
agentes de ventas aleatoriamente y registraron las ventas promedio diarias antes y
despus del plan (en pesos).

50

Vendedor
RL
MP
BA
FF
EG
PF

Antes
320
290
421
510
210
402

Despus
340
295
475
510
228
500

a) Hubo un incremento significativo en las ventas promedio semanal de los


vendedores debido al plan innovador de incentivos? Utilice un nivel de significacin
del 0,05.
d) Explique en qu consiste el error tipo I y el error tipo II en trminos del problema.
Cul de los dos podra estar cometiendo segn su conclusin en el punto anterior?
Cules seran las consecuencias de cometer ese error?
RESPUESTA:
a) S (-2.14 < -2.02)
b) Error tipo I: concluir que las ventas semanales de los vendedores aumentaron, es
decir que el plan de incentivos fue efectivo, cuando en realidad no fue as. Error tipo
II: concluir que las ventas semanales de los vendedores no aumentaron, es decir que
el plan de incentivos no fue efectivo, cuando en realidad s lo fue. En este caso se
podra estar cometiendo un error tipo I, con una probabilidad mxima de 0,05.

Problema 12: El dueo de una inmobiliaria desea comprobar la eficacia de un nuevo


empleado en la tasacin de propiedades. Selecciona 8 propiedades cualquiera y enva por
separado al nuevo empleado y a un empleado con probada experiencia en el oficio a
tasarlas. Los resultados (en miles de US$) fueron:
Propiedad
1
2
3
4
5
6
7
8
Vendedor nuevo
25 42 150 100 78 29 62 95
experimentado 24 45 131 98
65 30 58 86
Cules son las conclusiones de la prueba? Asuma =0.10.
RESPUESTA:
Se concluye que existen evidencias para afirmar que las tasaciones del
vendedor nuevo son mayores a las del experimentado (2.06 > 1.8946).

Problema 13: Una importante compaa alimenticia que fabrica hamburguesas adquiere la
materia prima a dos proveedores. El contenido promedio de grasa de ambos proveedores es
el mismo, pero se sospecha que la variabilidad en el contenido graso puede diferir. El
desvo estndar del contenido graso en una muestra de 18 lotes adquiridos al proveedor 1
fue de 8.9%, mientras que una muestra aleatoria de 15 lotes de la compaa 2 arroj un
desvo estndar de 5.1%. Existe evidencia suficiente para concluir que la variabilidad de
las dos poblaciones es diferente? Utilice =0.05.
RESPUESTA:

S (Fcalc = 3.04 > 2.90)


51

Problema 14: Como parte de una investigacin socioeconmica iniciada en dos ciudades se
considera necesario comparar sus tasas de desocupacin, ya que histricamente los niveles
de desocupacin de ambas ciudades han sido similares. Se seleccionan al azar 550
residentes pertenecientes a la PEA (Poblacin econmicamente activa) en la primera
ciudad y 750 en la segunda, observndose 495 y 660 ocupados, respectivamente. Realice la
prueba usando un nivel de significacin del 5%. Interprete el resultado obtenido y comente
qu error podr estar cometiendo.
RESPUESTA: No hay evidencias de que las tasas de desocupacin de ambas ciudades
difieran significativamente (-1.13 no es menor que 1.96). Se podra estar cometiendo un
error de tipo II.

Problema 15: Se va a efectuar una encuesta en dos zonas distintas para determinar la
proporcin de unidades habitacionales ocupadas por familias de altos ingresos. Una
muestra aleatoria de 300 unidades habitacionales en la zona A revel que 120 estaban
ocupadas por familias de altos ingresos, mientras que en la zona B sobre una muestra de
600 unidades se encontr que 150 pertenecan a familias de altos ingresos.
a) Con un nivel de significacin del 5 %, podra Ud. probar si el porcentaje ocupado
por familias de altos ingresos en la zona A es superior al de la zona B?
b) Estime con una confianza del 95 % la diferencia entre las proporciones de ambas
zonas.
RESPUESTAS:

a) S (4.63 > 1.645)

b) [0.085 ; 0.215]

Problema 16: Un coordinador del PAMI desea comprobar la efectividad de la ltima


vacunacin contra la gripe en los mayores de 60 aos. Con tal fin solicita a los mdicos de
cabecera que interroguen a sus pacientes con respecto a si se vacunaron o no contra la
gripe el invierno pasado y si se engriparon o no durante el mismo perodo. La muestra
indic que de 400 adultos mayores de 60 aos vacunados, 92 se haban engripado, en tanto
que de 250 que no se vacunaron, 80 se haban engripado.
a) Con un nivel de significacin del 1%, podra Ud. concluir que la vacuna contra la
gripe es efectiva? Qu error se podra estar cometiendo?
b) Estime el porcentaje de afiliados al PAMI mayores de 60 aos vacunados con una
confianza del 95%.
RESPUESTAS: a) S (-2.53 < -2.326). Como se rechaz Ho se podra estar cometiendo un
error de tipo I, es decir afirmar que la vacuna fue efectiva cuando en realidad
no lo fue.
b) El porcentaje de afiliados mayores de 60 aos vacunados se encuentra
entre el 57.8 y el 65.3% con una confianza del 95%.

52

Problema 17: Se llev a cabo una investigacin a fin de determinar si el hbito de fumar
provocaba diferencias en la aceptabilidad de la sucralosa, un nuevo edulcorante muy
estable. Para ello, un panel compuesto por 50 individuos fumadores y 50 no fumadores
prob jugo endulzado con sucralosa. Doce de los no fumadores y 5 de los fumadores
manifestaron un resabio desagradable luego de la prueba. Considera que existen
diferencias significativas en la aceptacin de la sucralosa por los dos grupos? De ser as, de
qu forma incide la condicin de fumador? Utilice = 0.1.
RESPUESTA:
S (1.86 > 1.645). El hbito de fumar incrementa la aceptabilidad de la
sucralosa, ya que el porcentaje de individuos que lo encuentran desagradable es
estadsticamente superior entre los no fumadores.

Revisin conceptual
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta
Se realiza un estudio para saber si dos tratamientos de quimioterapia presentan
diferencias en cuanto al tiempo de supervivencia de los pacientes. No se encontr diferencia
estadsticamente significativa. Cul de las siguientes razones podran ser causantes del
resultado?
a) Los tratamientos ofrecen tiempos de supervivencia muy diferentes.
b) El nivel de significacin es demasiado alto.
c) Las muestras son demasiado grandes.
d) Las muestras son demasiado pequeas.
e) Nada de lo anterior.

53

PRACTICO 5. PRUEBAS CHI-CUADRADO


Consideraciones generales:
En los temas anteriores se determin que la aplicacin de determinados conceptos de la
inferencia estadstica quedaba supeditada al cumplimiento de ciertos supuestos. Uno de
ellos se refiere a la ley de distribucin de la poblacin de la que extrae la muestra. La
forma de determinar si la poblacin responde a determinada ley de distribucin terica es
la prueba de bondad de ajuste.
En algunos otros estudios es necesario trabajar con variables cualitativas; en estos casos se
utilizan las pruebas de independencia entre atributos.

Problemas resueltos:
Prueba de Bondad de ajuste
El Gerente de Personal de cierta empresa est preocupado por el ausentismo. Desea saber
si el mismo est distribuido uniformemente durante los 5 das laborales. Para ello extrajo
una muestra al azar de 120 ausencias, obteniendo los siguientes resultados:
Das
lunes martes mircoles
Cant. ausentes 35
18
21

jueves
17

viernes
29

Con esta informacin, qu concluira el Gerente de Personal? Utilice un nivel de


significacin del 5%.
Solucin:
Se trata de probar si existe un buen ajuste a una proporcin dada; en este caso el gerente
desea probar si es igualmente probable faltar cualquier da de la semana. Es decir:
Ho) el ausentismo est distribuido uniformemente en los 5 das laborables; o bien:
P(faltar un lunes) = P(faltar un martes) = . = P(faltar cualquier da)
H1) el ausentismo no est distribuido uniformemente; o bien:
P(faltar algn da de la semana) P(faltar)
Para decidir se deben comparar las frecuencias observadas en el muestreo con las
frecuencias que se esperara observar si la hiptesis nula fuera cierta. Si as fuera, las 120
ausencias estaran distribudas homogneamente, con una probabilidad de 0.2 de faltar un
da dado de la semana, es decir que se esperaran 24 ausencias en cada da laborable:

Frecuencias observadas (OBS)


Frecuencias esperadas (ESP)

lunes
35
24

martes
18
24

mircoles
21
24

jueves
17
24

viernes
29
24

54

El estadstico de prueba compara las frecuencias observadas con las esperadas:


2
calc
=

(OBS i ESPi )2
ESPi

CR: Si 2calc > 2crt, se rechaza Ho


RD: Si se rechaza Ho se concluye que existen evidencias de que el ausentismo no est
distribuido uniformemente.
2
= k21 m;1
donde
Siendo crit
k = cantidad de categoras, en este caso 5 (los das laborables)
m = cantidad de parmetros estimados, en este caso ninguno
2
Por lo tanto crit
= 42;0.95 = 9.488

2
calc

(35 24) 2 (18 24) 2


=
+
+ ..... = 10
24
24

Conclusin: Como 2calc > 2crt, se rechaza Ho y el gerente debera concluir que existen
evidencias para afirmar que el ausentismo no est distribuido uniformemente.
Tablas de Contingencia: Prueba de Independencia
Una marca de cervezas decidi efectuar un estudio de mercado a fin de identificar las
preferencias de sus consumidores. De un total de 200 personas encuestadas, 110
manifestaron preferir la cerveza rubia y 60 la cerveza sin alcohol, mientras que el resto
prefiri la negra. De aquellos que prefirieron la cerveza rubia, el 40% son mujeres,
mientras que de los que prefieren la cerveza sin alcohol, 19 son hombres. Finalmente, 23
encuestados son hombres que prefieren la cerveza negra. Con un riesgo del 5%,
presentaron los 3 tipos de cerveza igual preferencia en ambos sexos?
Solucin:
Las hiptesis a testear son:
Ho) la preferencia por cierto tipo de cerveza es independiente del sexo del consumidor
H1) la preferencia por cierto tipo de cerveza depende del sexo del consumidor
Al igual que en la situacin anterior se deben comparar las frecuencias observadas en el
muestreo con las frecuencias que se esperara observar si la hiptesis nula fuera cierta, es
decir si los dos criterios de clasificacin de los datos (tipo de cerveza preferida y sexo)
fueran independientes. La tabla de contingencia con las frecuencias observadas (OBS) en el
muestreo es:
Cerveza preferida
Rubia
Sin alcohol Negra
Totales
Mujeres
44
41
7
92
Hombres
66
19
23
108
Totales
110
60
30
200

55

Para construir la tabla de contingencia con las frecuencias esperadas (ESP) suponiendo
independencia se procede de la siguiente manera. La proporcin de consumidores que
prefieren la cerveza rubia, sin importar el sexo de los mismos, es de 110/200, es decir 0.55
(55%). Si los dos sexos tienen idnticas preferencias se esperara que el 55% de las mujeres
y el 55% de los hombres prefieran la cerveza rubia, es decir 50,6 mujeres (el 55% de 92) y
59,4 hombres (el 55% de 108). Efectuando el mismo razonamiento con los otros tipos de
cerveza es posible construir la siguiente tabla de frecuencias esperadas:

Mujeres
Hombres
Totales

Cerveza preferida
Rubia
Sin alcohol
50.6
27.6
59.4
32.4
110
60

Negra
13.8
16.2
30

Totales
92
108
200

Obsrvese que los totales no se modificaron. El estadstico de prueba compara las


frecuencias observadas con las esperadas:
2
calc
=

(OBS i ESPi )2
ESPi

CR: Si 2calc > 2crt, se rechaza Ho


RD: Si se rechaza Ho se concluye que existen evidencias de que la preferencia por cierto tipo
de cerveza depende del sexo del consumidor
2
Siendo crit
= (2F 1)(C 1);1

donde

F = cantidad de filas, en este caso 2


C = cantidad de columnas, en este caso 3
2
= 22;0.95 = 5.991
Por lo tanto crit
2
y calc
=

(44 50.6) 2 (66 59.4) 2


+
+ ..... = 19.85
50.6
59.4

Conclusin: Como 2calc > 2crt, se rechaza Ho y se concluye que la preferencia por la cerveza
depende del sexo del consumidor.

Ejercitacin:
Problema 1: Las estadsticas indican que en una universidad privada el 60% de los
inscriptos se anotan en la facultad de Cs. Econmicas, el 15% en la de Abogaca y el resto
en la de Ingeniera. Antes del inicio del ciclo lectivo y a fin de planificar la distribucin de
docentes y cursos, las autoridades estn interesadas en determinar si se mantienen las
proporciones histricas de inscripcin en las distintas facultades. Hasta la fecha registran
un total de 1200 inscripciones, de las cuales 760 corresponden a la facultad de Cs.
Econmicas, 200 a la de Abogaca y el resto a Ingeniera. Con un riesgo del 1% considera

56

que en el presente ciclo lectivo se detectan cambios con respecto a las proporciones
histricas?
RESPUESTA:
Existen evidencias de que existen cambios en la proporciones
histricas de inscriptos en las distintas facultades (16.44 > 9.21).

Problema 2: El listado generado por computadora del gerente de una tienda contiene a
todos los empleados de venta e indica que el 70% son empleados de tiempo completo, el 20%
son empleados de medio tiempo y el 10% estn suspendidos temporariamente o se
encuentran con licencia. Una muestra aleatoria de 50 empleados del listado indica que 40
son empleados de tiempo completo, 6 son de medio tiempo y 4 estn suspendidos o con
licencia. Determine si esta muestra es representativa de la poblacin con un riesgo del
10%.
RESPUESTA:
Puede considerarse que la muestra es representativa, ya que no
existen evidencias de que la proporcin de cada tipo de empleado difiera de las
proporciones poblacionales (2.51 no es mayor a 4.605)

Problema 3 Se desea probar con un nivel de significacin del 5 % si un dado est cargado.
Para ello se realizan 90 tiradas y se obtiene la siguiente informacin:
cara del dado
cantidad de veces que sali

1
10

2
16

3
20

4
15

5
17

6
12

RESPUESTA: De las tiradas no surgen evidencias para decir que el dado est cargado
(4.27 < 11.07).

Problema 4: La agencia publicitaria Atlntico investiga la relacin entre el tipo preferido


de mensaje para una campaa contra el SIDA y el nivel socioeconmico para una muestra
de jvenes de ambos sexos. La cantidad de individuos de cada nivel socioeconmico que
prefirieron cada uno de los mensajes fue:
Mensaje preferido
A
B
C
Bajo
25 40 70
Medio 29 30 31
Alto
45 20 10
a) Pruebe si el nivel socioeconmico se relaciona con la preferencia de los mensajes.
Utilice un nivel de significacin del 1%.
b) Recomendara utilizar distintos mensajes segn el nivel socioeconmico de los
jvenes a los que va dirigido? Fundamente su respuesta.
c) Indique los supuestos de la prueba.

57

RESPUESTA: a) La preferencia por el mensaje depende del nivel socioeconmico (45,34 >
13.277)
b) S, ya que se encontraron evidencias de que la preferencia por el mensaje depende
del nivel socioeconmico. Para el nivel socioeconmico bajo recomendara el mensaje
C, para el alto, el A, mientras que para el medio, es indistinto.
c) Se supone que las respuestas son independientes entre s. Adems todas las
frecuencias esperadas deben ser de por lo menos 5, por lo que en determinadas
ocasiones puede ser necesario combinar dos o ms categoras.

Problema 5: Resuelva el problema 14 del prctico 4 utilizando una prueba de chi cuadrado.
Compare los resultados con los obtenidos aplicando una comparacin de proporciones.
RESPUESTA: Como calc (1,28) no es > a crit (3,841), se concluye que el nivel de
ocupacin no depende de la ciudad. Los resultados de una prueba de independencia de 2x2
son equivalentes a los de una comparacin de dos proporciones (z2 = 2).
Problema 6: Una fbrica de equipos de refrigeracin selecciona la produccin de un da
cualquiera y efecta un control total de los equipos producidos. Se observa que en el turno
maana se fabricaron 119 equipos de los cuales 16 estaban fallados; en el turno tarde se
fabricaron 252 equipos, siendo 24 defectuosos; finalmente en el turno noche, de 93 equipos
fabricados, 18 estaban fallados.
a) Existen diferencias al 10% en el desempeo de los turnos?
b) Cul de los 3 turnos considera que tiene peor desempeo? Justifique.
RESPUESTAS:

a) S (6.13 > 4.605)


b) el turno noche, con un 19,35% de equipos defectuosos.

Problema 7: La confianza ciudadana es un signo de democracia sana y un requisito


indispensable para lograr mayor gobernabilidad en una sociedad. Si en una sociedad hay
confianza ciudadana en sus representantes, los miembros de esa sociedad querrn cumplir
con sus obligaciones y ser partcipes activos en la esfera de la vida pblica. El Observatorio
de la Deuda Social Argentina efecta encuestas en ciudadanos de 18 aos o ms de todo el
pas con respecto a la confianza en las instituciones pblicas. A continuacin se muestran
los resultados obtenidos a partir de 2000 encuestas con respecto al grado de confianza en el
Congreso segn nivel educativo.
Confianza en el
Secundario
Congreso Nacional incompleto o menos
Alta confianza
186
Poca confianza
682
Ninguna confianza
482

Secundario
completo o ms
125
359
166

a) Plantee las hiptesis que considere apropiadas, en trminos del problema. Concluya,
con un riesgo del 1%.

58

b) De existir diferencias, podra decir en qu nivel educativo existe mayor confianza


en el Congreso? Justifique su respuesta.
RESPUESTA: a) El grado de confianza en el congreso est asociado al nivel de estudios
(24.25 > 9.21); b) Los individuos con mayor nivel educativo muestran mayor confianza. Por
ejemplo, el 19% de ellos manifiesta alta confianza contra un 13,7% del otro grupo

Problema 8: El gerente de planta de una fbrica de transmisores desea utilizar un


programa de simulacin por computadora para modelar el movimiento de materiales
dentro de la planta. Est interesado en mejorar la eficiencia del proceso productivo, debido
a la rpida expansin de la competencia extranjera. Una suposicin clave del programa es
que la llegada de productos terminados que salen de la cadena de montaje sigue una
distribucin de Poisson. Como el gerente no sabe si esta suposicin es vlida, elige una
muestra aleatoria de horas de trabajo en la fbrica y registra la cantidad de productos
terminados por hora:
Cantidad de productos
Frecuencia
terminados por hora
0
6
1
15
2
27
3
21
4
14
5
10
6
7
Utilice una prueba de bondad de ajuste para investigar la suposicin con un riesgo del 10%.
RESPUESTA: No hay razones para suponer que la distribucin no ajusta a Poisson (1.12 <
9.236).
Problema 9: Una corporacin fabrica monitores y desea determinar si la distribucin
normal se puede usar para describir el flujo de corriente de los microcircuitos, lo que
permitir mejorar el control de calidad. El tcnico a cargo selecciona una muestra aleatoria
de microcircuitos y registra el flujo de corriente. Con esa informacin construye una
distribucin de frecuencias y usa una probabilidad de cometer un error de tipo I de 0.05 en
la prueba para determinar si el flujo de corriente sigue una distribucin normal.
Flujo de corriente (mA)
6.00 a menos de 6.50
6.50
"
7.00
7.00
"
7.50
7.50
"
8.00
8.00
"
8.50
8.50
"
9.00
9.00
"
9.50
9.50
"
10.00

Cantidad de circuitos
12
39
105
135
118
99
49
10

59

a) Establezca la hiptesis nula y alternativa y la regla de decisin.


b) Pruebe si el flujo de corriente de los microcircuitos sigue una distribucin normal.
Utilice la informacin suministrada a continuacin, completando donde sea
necesario.
Datos tiles: x = 8; s = 0.77; n = 567
Corriente OBS

F(LS)

P(intervalo)

ESP

<6
6-6,5
6,5-7
7-7,5
7,5-8
8-8,5
8,5-9
9-9,5
9,5-10
10
Total

0,00470
0,02570
0,09702
0,25806
0,50000
0,74194

0,00470
0,02101
0,07132
0,16103
0,24194
0,24194

2,66
11,91
40,44
91,31
137,18
137,18

0,97430
0,99530
1,00000

0,07132
0,02101
0,00470
1

40,44
11,91
2,66
567

0
12
39
105
135
118
99
49
10
0
567

Corriente OBS

ESP

OBS-ESP

<6
6-6,5
6,5-7
7-7,5
7,5-8
8-8,5
8,5-9
9-9,5
9,5-10
10
Total

2,66
11,91
40,44
91,31
137,18
137,18

-2,66
-0.09
-1,44
13,69
-2,18
-19,18

40,44
11,91
2,66
567

8,56
-1,91
-2,66

0
12
39
105
135
118
99
49
10
0
567

(OBS-ESP)2
ESP
2,66
0,00
0,05
2,05
0,03
2,68
1,81
0,31
2,66
12,91

RESPUESTA: No hay razones para suponer que la distribucin no ajusta a una normal
(12,91 no es mayor que 14.067).

60

PRACTICO 6. ANALISIS DE REGRESION Y DE


CORRELACION LINEAL SIMPLE
Consideraciones generales:
En este caso se analizan situaciones que involucran al menos dos variables y el objetivo es
estudiar la relacin entre ellas. Se estudiarn dos anlisis: el de regresin y el de
correlacin.
El anlisis de regresin estudia la dependencia de una variable, la variable dependiente o
de respuesta, en una o ms variables, las variables independientes o explicativas. Se
utiliza con propsitos de estimacin o prediccin. La variable dependiente debe ser
aleatoria, en cambio la independiente puede serlo o no. Se estudiar el ajuste a un modelo
de regresin lineal simple, que utiliza una nica variable independiente, y mltiple, que
utiliza ms de una variable independiente para predecir la variable dependiente.
El anlisis de correlacin, en cambio, se utiliza para medir la fuerza de asociacin entre dos
variables aleatorias.
Regresin
Las tcnicas de regresin permiten hacer predicciones sobre los valores de cierta variable Y
(dependiente o explicada), a partir de los de otra X (independiente o explicativa), entre las
que intuimos que existe una relacin. Para ilustrarlo supongamos que sobre un grupo de
personas observamos los valores que toman las variables
X = altura medida en centmetros
Y = altura medida en metros
No es necesario hacer grandes esfuerzos para intuir que la relacin que hay entre ambas
es:

Y=

X
100

Obtener esta relacin es menos evidente cuando lo que medimos sobre el mismo grupo de
personas es
X = altura medida en centmetros
Y = peso en kilogramos
La razn es que no es cierto que conocida la altura Xi de un individuo, podamos determinar
de modo exacto su peso Yi (por ej. dos personas que miden 1,70 m pueden tener pesos de
60 y 65 kilos). Sin embargo, alguna relacin entre ellas debe existir, pues parece mucho
ms probable que un individuo de 2 m pese ms que otro que mida 1,20 m. Es ms, nos
puede parecer ms o menos aproximada una relacin entre ambas variables como la
siguiente:
Y = X 110 error

61

A la deduccin, a partir de una serie de datos, de este tipo de relaciones entre variables, es
lo que denominamos regresin. Mediante las tcnicas de regresin expresamos una
variable Y como funcin de otra variable X

Y = f (X)
Esto es lo que denominamos relacin funcional. El criterio para construir el modelo, tal
como citamos anteriormente, es que la diferencia entre el valor real de Y y el valor terico
o estimado de Y a partir de dicha relacin ( Y ) sea pequea. Dicha diferencia se conoce
como error o residuo:
ei = Y - Y
El objetivo ser buscar la funcin (tambin denominada modelo de regresin) Y = f (X) que
lo minimice.
Regresin lineal
La forma de la funcin f en principio podra ser cualquiera, lineal o no lineal, pero por el
momento nos vamos a limitar al caso de la regresin lineal. Con este tipo de regresiones
nos conformamos con encontrar relaciones funcionales de tipo lineal, es decir que el modelo
que utilizaremos, conocido como modelo de regresin lineal, es:
Y=+x+
donde y son los parmetros del modelo, siendo la ordenada al origen y el coeficiente
de regresin de Y sobre X o pendiente de la recta. La letra corresponde al trmino del
error, y es la variable aleatoria que explica la variabilidad en Y que no se puede explicar
con la relacin lineal entre X e Y.
Obsrvese que la relacin anterior explica cosas como que si X vara en 1 unidad, Y vara la
cantidad . Es decir que mide la variacin de Y por incremento unitario de X, mientras
que indica el valor de Y cuando X=0. Por lo tanto:
Si >0, cuando X aumenta, Y tambin lo hace.
Si <0, cuando X aumenta, Y disminuye.
Si =0, cuando X aumenta o disminuye, Y no se ve afectada (Y no depende de X)
En consecuencia, en el caso de las variables peso y altura lo lgico sera encontrar que >0.
Desafortunadamente, los parmetros y son usualmente desconocidos, por lo que es
necesario estimarlos a partir de una muestra. Sus estimadores, a y b, permiten expresar la
ecuacin estimada de regresin:
y = a + bx

con el menor error posible entre Y e Y, es decir que el modelo supone que la media o valor
esperado de es cero.

62

Figura 1: Diferentes nubes de puntos y modelos de regresin para ellas.

El problema que se plantea es entonces el de cmo estimar las constantes y a partir de


un conjunto de n observaciones de forma que se minimice el error. El error que
qu se comete al
aproximar Y mediante Y se mide calculando la suma de las diferencias entre los valores
reales y los estimados (residuos) elevadas al cuadrado (para que sean positivas y no se
compensen los errores):

(y

y i ) 2 = ei

y se hallan los estimadores a y b que hagan mnima dicha sumatoria. Este mtodo se
conoce como el mtodo de los cuadrados mnimos.
Mediante una serie de procedimientos matemticos se llega a la expresin:

a = y bx

b = Sxy / Sxx
siendo S xy =

xy n x y

S xx = x 2 n x

Supuestos del modelo de regresin lineal


La variable independiente X se supone medida sin error. Es decir se supone fija; sus
distintos valores estn fijados de antemano.
Los valores esperados de la variable aleatoria Y para cada valor de la variable X
estn alineados, es decir: (Y/X) = + X.
Supuesto de normalidad: Para cada valor de la variable X la subpoblacin de la
variable Y sigue una distribucin normal; las subpoblaciones son independientes.
Supuesto de homocedacia: Las varianzas de las subpoblaciones son iguales.
Estos supuestos pueden reunirse en uno solo diciendo que en el modelo Y = + x +
los i son variables aleatorias independientes con distribucin normal, media = 0
y varianza
Ejemplo
Un gerente de ventas sostiene que la experiencia es fundamental a la hora de concretar
una operacin. A fin de darle mayor crdito a su aseveracin, selecciona un grupo de diez

63

vendedores de su empresa con distintos aos de experiencia en el rubro y estudia los


reportes de ventas anuales (en miles de $) de los mismos:
Vendedor
Aos de experiencia
Ventas anuales

1
13
122

2
1
83

3
11
117

4
4
92

5
6
115

6
3
97

7
10
110

8
8
111

9
4
114

10
10
123

Aqu lo que interesa es determinar si las ventas estn relacionadas con la experiencia de
los vendedores y eventualmente hallar un modelo que permita predecir las ventas anuales
(Y, variable dependiente o explicada) en funcin de los aos de experiencia de los
vendedores (X, variable independiente o explicativa).
Con los datos de la muestra el primer paso consiste en graficar el diagrama de dispersin
para ver si la variable respuesta Y depende o no, en cierto grado, de la variable
independiente X y si la relacin entre ellas puede ser razonablemente expresada por una
ecuacin lineal.
Diagrama de dispersin

Ventas anuales
(en miles de $)

150
125
100
75
50
25
0
0

10

15

experiencia (aos)

El segundo paso consiste en hallar la ecuacin de regresin aplicando el mtodo de los


cuadrados mnimos. Para ello es necesario efectuar una serie de clculos:

Vendedor
1
2
3
4
5
6
7
8
9
10
Total
n = 10

x = aos
de experiencia
13
1
11
4
6
3
10
8
4
10
70

x = x / n = 70/10 = 7

y=
ventas anuales
122
83
117
92
115
97
110
111
114
123
1084

x.y

x2

y2

1586
83
1287
368
690
291
1100
888
456
1230
7979

169
1
121
16
36
9
100
64
16
100
632

14884
6889
13689
8464
13225
9409
12100
12321
12996
15129
119106

y = y / n = 1084/10 = 108.4

64

S xx = x 2 n x = 632 10 x 72 = 142
2

S yy = y 2 n y = 1191062 10 x 108.42 = 1600.4


2

S xy = xy n x y = 7979 10 x 72 x 108.42 = 391


Lo que se busca es la ecuacin de la recta, y = a + bx , que mejor aproxima a la nube de
puntos. Los coeficientes de esta recta son:
b = Sxy / Sxx = 391 / 142 = 2,754

a = y b x = 108,4 2,754 x 7 = 89,122


As, la ecuacin de regresin lineal resulta ser: Y = 89,122 + 2.754 X. Es decir que por cada
ao adicional de experiencia, un vendedor incrementa sus ventas anuales en 2,754 miles de
$, es decir 2754 $. Por otro lado, se estima que un vendedor sin experiencia reportar
ventas anuales por 89122 $.
Por tanto, para un vendedor con 9 aos de experiencia (X=9), el modelo lineal predice unas
ventas anuales de:
y = a + bx = 89,122 + 2,754 x 9 = 113,91 miles de $
En este punto hay que preguntarse si realmente esta prediccin puede considerarse fiable.
Para dar una respuesta, es necesario estudiar la bondad de ajuste al modelo lineal.
Evaluacin de la recta de regresin: Bondad de ajuste al modelo
Una vez que se ha obtenido la ecuacin de regresin estimada, sta debe ser evaluada para
detectar si describe adecuadamente la relacin funcional entre las variables y si puede ser
utilizada de manera efectiva con fines de estimacin y prediccin.
Para ello se requiere conocer la variabilidad o dispersin de los puntos alrededor de la
recta, es decir la varianza poblacional del modelo 2 y/x. Teniendo en mente que dicha
varianza mide las diferencias entre el valor real de Y y el terico, obtenido mediante la
ecuacin de regresin, resulta obvio que cuanto mayor sea esta varianza, peor resultar el
ajuste al modelo lineal propuesto (ver Fig.2).
El estimador puntual de 2 y/x es: s2 y/x = (yi - y i )2 / (n 2)
Recordemos que la diferencia entre el valor observado de Y y el valor estimado a partir de
la recta, para cada observacin, constituye el residuo ei, y representa el error que se comete
al usar Y para estimar Y. Por dicha razn esta varianza se conoce tambin como varianza
residual (s2e). Los grados de libertad son n-2 dado que se estimaron dos parmetros
poblacionales, y .
Existen numerosas formas de calcularla:
n

2
y/x

=s =
2
e

(y
i =1

y )

n2

y
=

2
i

a y i b xy
n2

S yy (b 2 S xx )
n2

Una forma de evaluar el buen ajuste al modelo lineal es comparar la dispersin de los
puntos alrededor de la recta, que como ya se explic constituye la varianza residual s2e, con
la dispersin de los puntos alrededor de la media o varianza total s2 y.

65

La varianza total est dada por:

(y

s2 y =

y)2

n 1

Si el modelo lineal es bueno, es de esperar que la variacin residual sea mucho menor que
la variacin total. Por ello se define el coeficiente de determinacin de la regresin de Y
sobre X, R2, como

R2 =1

s2e
s2 y

y mide la proporcin de la variacin total que est explicado por la regresin de Y en X. En


otras palabras mide la proximidad del ajuste de la ecuacin de regresin de la muestra a
los valores observados de Y.
El coeficiente de determinacin toma valores entre 0 y 1, es decir 0 R2 1. Se ve que
cuando los residuos son pequeos, la s2e es pequea. Esto lleva a un cociente s2e / s2y
pequeo y por lo tanto a un R2 grande.
Si s2e = 0  R2 = 1
Si s2e = s2y  R2= 0
En la Fig 2 se pueden apreciar las distintas situaciones de la recta de regresin segn el
valor de R2 (buen ajuste al modelo lineal implica R2 cercano a 1; mal ajuste al modelo lineal
implica R2 cercano a 0.

La frmula que se utiliza para el clculo de

Syy = y 2 n y

R2

es

R =

S xy2

S xx S yy

siendo

Un valor de R cercano a 1 indica que la regresin ha tenido en consideracin una gran


proporcin de la variabilidad total en los valores observados de Y, y por lo tanto la ecuacin
de regresin parece aceptable. Cuando R es cercano a 0, lo cual indica una falla de la
regresin para explicar una proporcin de la variacin total en los valores observados de Y,
tiende a arrojar dudas sobre la utilidad de tal ecuacin. En general, se considera que el
modelo de regresin lineal es vlido si el R2 es de por lo menos 0.5. Sin embargo no se pasa
al juicio final sin antes realizar alguna prueba estadstica. Esta prueba se realiza por
medio de una prueba de hiptesis para el coeficiente de regresin . Las hiptesis que se
plantean son:
Ho: = 0  es decir que Y no depende linealmente de X; el modelo lineal no es vlido
H1: 0  es decir que Y s depende linealmente de X; el modelo lineal es vlido
b es el estimador insesgado de , es decir que E(b) = , mientras que el desvo estndar
estimado de b (Sb) es:

Sb =

S e2
S xx

y la distribucin que se utiliza (dado que se desconoce el desvo poblacional) es la de


Student, con n-2 grados de libertad.
b
Volviendo a la prueba de hiptesis, el estadstico de prueba es: t calc =
Sb

siendo la condicin de rechazo: t calc < t crt 1 o t calc > t crt 2,


donde t crt 1 = t n-2; /2 y t crt 2 = t n-2; 1-/2
66

Otra forma de expresar la condicin de rechazo es: t calc> t crt, donde t crt = t n-2; 1-/2
Si se rechaza Ho, se puede afirmar que existen evidencias suficientes de una dependencia
lineal de Y sobre X, con un nivel de significacin de .
Volviendo al ejemplo de las ventas anuales en funcin de la antigedad de los empleados,
se desea determinar si el modelo lineal es vlido. En primer lugar se calcula el coeficiente
de determinacin R2:

R2 =

S xy2
S xx S yy

3912
= 0.67
142 x1600.4

Es decir que el 67% de la variabilidad de las ventas anuales est explicada linealmente por
la antigedad de los vendedores. Por lo tanto puede decirse, como primera aproximacin,
que el modelo lineal es vlido, ya que queda solo un 33% de variabilidad en las ventas que
se debe a otras causas, distintas de la antigedad.
La forma estadsticamente correcta de evaluar el modelo lineal es a travs de la prueba de
hiptesis para :
Ho: = 0  las ventas no dependen de la antigedad del vendedor
H1: 0  las ventas s dependen de la antigedad del vendedor
CR: t calc < t crt 1 o t calc > t crt 2, donde t crt 1 = t n-2; /2 y t crt 2 = t n-2; 1-/2
Otra forma: t calc> t crt, donde t crt = t n-2; 1-/2
En el ejemplo, para calcular tcalc es necesario calcular s2e y entonces sb.

s =
2
e

S yy (b 2 S xx )
n2

1600.4 (2,754 2 x142)


=
= 65,42
8

Sb =

S e2
65,42
=
= 0,679
S xx
142

t calc =

b 2.574 0
=
= 4.06
Sb
0.679

siendo t crt = t 8; 0.975 = 2.306 (asumiendo = 0.05)


Por lo tanto se rechaza Ho y se puede afirmar, con un riesgo del 5%, que las ventas anuales
dependen linealmente de los aos de experiencia del vendedor; el modelo lineal es vlido.
Usos de la ecuacin de regresin
Si se demostr que el modelo de regresin lineal es vlido, eso significa que la ecuacin de
regresin puede utilizarse para estimaciones y predicciones:

Estimacin puntual: la ecuacin de la recta se aplica para calcular el valor de y para


un dado valor de x.

67

Estimacin por intervalos de confianza para la media de y: se establecen los lmites


entre los cuales se estima que se encontrar con un cierto nivel de confianza el valor
medio de y o E(y) para un determinado valor de x.
Estimacin por intervalos de prediccin: se establecen los lmites entre los cuales se
estima que se encontrar con un cierto nivel de confianza un valor individual de y
para un determinado valor de x.
Estimacin del coeficiente de regresin: se establecen los lmites entre los cuales se
estima que se encontrar con un cierto nivel de confianza el coeficiente de regresin
().

Intervalo de confianza para el valor medio de Y:

y t GLerror ;1 S e
2

x x
1
+ 0
n
S XX

Intervalo de prediccin para un valor individual de Y:

x x
1
1+ + 0
n
S XX

y t GLerror ;1 S e
2

Para un determinado valor de x el intervalo de prediccin ser ms grande que el de


confianza, debido a la mayor incertidumbre.
Intervalo de confianza para el coeficiente de regresin:
b t ;1 S b
2

Ejemplo:
a) Use la ecuacin estimada de regresin para predecir puntualmente las ventas
anuales de un vendedor con 9 aos de experiencia.
Como se calcul anteriormente, la estimacin puntual de las ventas es:
y = a + bx = 89,122 + 2,754 x 9 = 113,908 miles de $
b) Estime las ventas promedio anuales de todos los vendedores con 9 aos de
experiencia, con un nivel de confianza del 95%.
Dado que se desea estimar el valor promedio de Y, corresponde un intervalo de confianza
del 95% para el promedio de Y:

y EM

donde EM = t 8,0.975 S e

1 x0 x
+
n
S XX

1 (9 7) 2
= 2.306 65.42
+
= 6.687
10
142

68

reemplazando: 113,908 6,687 = [107,221 ; 120,595]; con lo que resulta que las ventas
anuales promedio para todos los vendedores con 9 aos de experiencia se encuentran entre
107,221 y 120,595 miles de $ con una confianza del 95%.
c) Pedro Urdemales cumplir el ao prximo 9 aos en las ventas. Pronostique las
ventas que se esperan de l, con un nivel de confianza del 95%.
En este caso se trata de una estimacin para un valor individual de Y, por lo que
corresponde un intervalo de prediccin.
donde
y EM

EM = t 8,0.975 S e

x x
1
1+ + 0
n
S XX

= 2,306 65.42 1 +

1 (9 7 ) 2
+
= 19,809
10
142

reemplazando: 113,908 18,809 = [94,100 ; 133,717]; con lo que resulta que las ventas
anuales estimadas para Pedro Urdemales, un vendedor con 9 aos de experiencia, se
encuentran entre 94,100 y 133,717 miles de $ con una confianza del 95%.
d) Estime el incremento en las ventas anuales por cada ao adicional de experiencia,
con un nivel de confianza del 95%.
En este caso corresponde un intervalo de confianza para el coeficiente de regresin:
b t ;1 S b
2

reemplazando: 2,754 2,306 x 0,679 = [1,188 ; 4,320]; con lo que resulta que las ventas
anuales se incrementarn entre 1,188 y 4,320 miles de $ por cada ao adicional de
experiencia en ventas, con una confianza del 95%.
En Excel: Herramientas > Anlisis de datos > Regresin
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Coeficientes

Error tpico

89,125
2,754

5,398
0,679

Intercepcin
Aos de experiencia

0,8202
0,6727
0,6318
8,0915
10
Superior
95%
101,573
4,319

Estadstico t Probabilidad Inferior 95%


16,511
4,055

1,83E-07
0,004

76,677
1,188

Anlisis de correlacin
Este modelo se aplica cuando ambas variables X e Y son aleatorias y el objetivo es
determinar el grado de relacin lineal entre dichas variables en estudio; y se dir si las
69

variables estn o no linealmente correlacionadas. El parmetro que mide tal relacin es el


coeficiente de correlacin (), que se define como:
xy
=
2 x 2 y
donde xy es la covarianza de X e Y (una medida de la variabilidad conjunta de ambas
variables); X es la varianza de X y y es la varianza de Y.
El coeficiente de correlacin toma valores entre -1 y 1, es decir 1 1
= 1 si y solo si las variables X e Y estn linealmente relacionadas en
forma perfecta, es decir vale y = a bx, con lo cual en realidad se est
midiendo el grado de relacin lineal.
= 0 indica que X e Y no estn correlacionadas; luego la variables
independientes nunca estn asociadas. (Recordar que = 0 es porque cov(x,
y) =0).
El estimador puntual de es r, el coeficiente de correlacin muestral, y se calcula como:

r=

S xy
S xx S yy

En el ejemplo, el coeficiente de correlacin vale:

r=

S xy
S xx S yy

= R 2 = 0.82

Es decir que existe un buen grado de asociacin lineal entre ambas variables, siendo dicha
asociacin directa (al aumentar una variable, la otra tambin lo hace).

Ejercitacin:
Problema 1: Para analizar la incidencia del cansancio sobre la eficiencia en el trabajo se
tom una muestra de 10 empleados, se los hizo trabajar distinta cantidad de horas, luego
se les entreg un texto de varias carillas para tipear y finalmente se verific la cantidad de
errores cometidos por cada uno de ellos, obtenindose los siguientes datos:
Empleado
Horas trabajadas
Errores cometidos

1
2
4

2
2
6

3
3
7

4
3
7

5
4
8

6
4
10

7
5
9

8
5
13

9
6
11

10
6
15

Datos tiles: Sxx = 20; Syy = 100, Sxy = 40; Se2 = 2.5
a) Hallar la recta de mnimos cuadrados.
b) Calcular la variancia de la estimacin.
c) Con un nivel de significacin del 10%, presentan los datos suficiente evidencia
sobre la existencia de una relacin lineal entre estas dos variables?
d) Hallar un intervalo de confianza del 90% para el coeficiente de regresin.

70

e) Estimar con un 90% de confianza la cantidad promedio de errores que cometer un


empleado que ha trabajado tres horas y media.
f) Hallar un intervalo de prediccin del 90% para la cantidad de errores que cometer
un empleado que ha trabajado 3,5 horas.
g) Calcular el coeficiente de determinacin e interpretar su resultado.
h) Indique los supuestos necesarios para la validez de los clculos efectuados.
i) Compare los resultados obtenidos con la salida generada en Excel.

RESPUESTAS:

a) y = 1 + 2x b) S e2 = 2,50

c) S. (porque 5,66 > 1,86) d) [1,34 ; 2,66]


e) Entre 7 y 9 errores.
f) Entre 5 y 11 errores.
2
g) R = 0,80 (el 80% de la variacin total en la cantidad de errores
queda explicada por la cantidad de horas trabajadas).
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Coeficientes

Error tpico

1
2

1,500
0,354

Intercepcin
Horas trabajadas

0,894
0,8
0,775
1,581
10

Estadstico t Probabilidad Inferior 95%


0,667
5,657

0,524
0,000

-2,459
1,185

Superior
95%
4,459
2,815

Problema 2: Se est analizando la demanda de cierta gaseosa en la localidad A, y a tal


efecto se ha tomado una muestra de 50 negocios minoristas que tienen dicho producto a la
venta, registrando el precio al que ofrecen el litro (x) y la cantidad de litros demandada
durante la semana anterior (y). Los resultados obtenidos se muestran a continuacin:

x = 110

= 1882,73

y = 3530

= 271268

x y = 2569

a) Determinar mediante un coeficiente adecuado el grado de relacin lineal entre el


precio y la cantidad demandada.
b) Estimar con un 95% de confianza la cantidad de litros de esta gaseosa que vender
semanalmente un negocio que la ofrezca a $2 el litro.
RESPUESTAS:

a)

r = -0,864

b) [49,32 ; 93,14]

Problema 3: Una aplicacin importante del anlisis de regresin en contabilidad es para


estimar costos. Al reunir datos sobre volumen y costo y aplicar el mtodo de mnimos
cuadrados para determinar la ecuacin de regresin donde se relacionan estas variables,
un contador puede estimar el costo asociado con determinada operacin de manufactura.
Se obtuvo la siguiente muestra de volmenes de produccin y costo total para una
operacin de manufactura.
71

Volumen de produccin
(unidades)
400
450
550
600
700
750

Costo total
($)
5250
5184
5401
5892
6398
6840

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Intercepcin
Volumen de produccin

Datos tiles:

Coeficientes

Error tpico

3114,880
4,718

427,370
0,726

Sxx = 93750

0,956
0,913
0,892
222,380
6

Estadstico t Probabilidad Inferior 95%

Syy =2284287,5

7,288
6,495

0,002
0,003

Sxy =442275

1928,310
2,701

Superior
95%
4301,450
6,734

Se =222,380

a) Use estos datos para estimar una ecuacin de regresin con la que se pueda predecir
el costo total para determinado volumen de produccin.
b) Interprete el significado de las componentes de la recta, en funcin del problema.
c) Calcule el coeficiente de determinacin. Qu porcentaje de la variacin en el costo
total puede explicar el volumen de produccin?
d) El programa de produccin de la empresa indica que el mes prximo se van a
producir 500 unidades. Cul ser el costo total estimado para esta operacin?
e) Estime con una confianza del 90% el parmetro del punto anterior.
f) Es correcto estimar el costo total cuando se producen 1000 unidades? Discuta.
RESPUESTAS: a) y = 3114,88 + 4,718x
b) Si no se producen unidades, el costo total de manufactura ser de 3114,88 $ (costo fijo),
mientras que por cada unidad adicional fabricada, el costo total se incrementar en 4,72$
(costo variable).
c) 0.9134; 91.34%
d) 5474 $
e) [4949 ; 5999 $]
f) Es incorrecto extrapolar.

Problema 4: Dos directivos de una fbrica discuten acerca de la importancia de contratar


operarios que vivan en las cercanas. El licenciado Gmez alude a los menores costos de
transporte, menor tiempo de viaje y menores dificultades para concurrir en caso de
problemas con los transportes. El licenciado Lavalle asegura que el domicilio del empleado
no afecta los intereses de la compaa. Para dirimir la cuestin investigan la relacin entre

72

la cantidad de das que faltan los empleados por ao y la distancia (en km) de su hogar a su
trabajo. Se eligi una muestra de 10 empleados y se reunieron los siguientes datos:
Empleado
Distancia a la fbrica
Ausencias anuales

1
2
5

2
6
2

3
10
6

4
14
8

5
1
2

6
18
8

7
3
4

8
7
3

9
14
7

10
12
5

Ausencias

La siguiente es la salida generada con Excel:


9
8
7
6
5
4
3
2
1
0
0

10

15

20

Distancia a la fbrica (km)

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Intercepcin
Variable X 1

Coeficientes
2,2354
0,3178

Error
Tpico
0,8240
0,0801

Estadstic
ot
2,7130
3,9689

0,8144
0,6632
0,6211
1,39165
10
Probabilidad
0,0265
0,0041

Inferior
95%
0,3353
0,1331

Superior
95%
4,1354
0,5024

Datos tiles: Sxx = 302.1; Syy = 46, Sxy = 96; Se = 1,392


a) Calcule e interprete la recta de mnimos cuadrados en funcin de las variables del
problema.
b) A un nivel de significacin del 5%, cul de los dos directivos tiene razn?
c) Utilice la ecuacin estimada de regresin para estimar con una confianza del 95%
la cantidad esperada de das de ausencia anuales para empleados que viven a 5 km
de la fbrica.
RESPUESTAS:

a) y = 2,24 + 0,32. Si un empleado vive a 0 km de la fbrica, se estima

que faltar 2,24 veces por ao, mientras que por cada km que se aleje su domicilio de la
fbrica, faltar a su trabajo 0,32 das.
b) El modelo lineal es vlido, los datos le dan la razn al Lic. Gmez (tcalc =3,97>tcrt =2,31)
c) [2,598 ; 5,05]

Problema 5: El tiempo que los nios permanecen sentados en la mesa durante la comida,
puede ayudar a predecir cunto comen? Se efectu una investigacin efectuada sobre 20

73

nios de tres aos, que fueron observados durante varios meses en el jardn de infantes.
Se registr el tiempo medio en el que cada nio permaneci en la mesa durante la comida,
as como la cantidad media de caloras ingeridas, calculadas a partir de una detallada
observacin de lo que el nio comi cada da.
Tiempo 21,4 30,8 37,7 33,5 32,8 39,5 22,8 34,1 33,9 43,8
Caloras 472 498 465 456 423 437 508 431 479 454
Tiempo 43,1 20,2 31,3 28,6 32,9 30,6 35,1 33 43,7 42,4
Caloras 410 504 437 489 436 480 439 444 408 450
Se aplic un modelo de regresin con los siguientes resultados:
Coeficiente de correlacin
Coef. de determinacin
Error tpico (Se, Sy/x)

-0,70
0,49
22,03

Ordenada al origen
Pendiente

Coeficientes Error tpico


556,67
24,85
-3,00
0,73 (Sb)

Sxx=23447,06
a) Escriba la ecuacin de la recta estimada por mnimos cuadrados para predecir las
caloras consumidas a partir de los tiempos en la mesa. Interprete los coeficientes.
Describa brevemente lo que muestran los datos sobre el comportamiento de los
chicos.
b) Determine si la regresin es significativa, con = 0,05. Interprete R2 en trminos
del problema.
c) Calcule un intervalo de confianza del 95% para la verdadera pendiente de la recta
de regresin.
d) Estime las caloras que espera ingieran nios de tres aos que permanecen media
hora en la mesa. Podra usar la ecuacin para predecir la ingesta de nios que
permanecen 10 min en la mesa?
RESPUESTAS:
a) CALORAS = 556,67 3,00 TIEMPO. La ordenada no tiene interpretacin, ya que
ningn nio permaneci 0 min en la mesa, y por lo tanto constituye una
extrapolacin. Pendiente: Por cada minuto en la mesa, los nios ingieren, en
promedio, 3 caloras menos.
b) S, ya que tcalc (-4,13) < tcrt (-2,10). R2: el 49% de la variabilidad en la cantidad de
caloras consumidas se explica linealmente por los tiempos en la mesa.
c) [-4,525; -1,475]
d) 433,33 caloras; no es correcto efectuar la otra estimacin ya que no se cuenta con
datos en ese rango de tiempo.

74

Problema 6: Se realiz un ensayo a fin de encontrar una relacin entre el porcentaje de


rotura de granos de arroz durante el proceso de pelado respecto a las distintas
temperaturas a las que se someti el grano en el proceso de secado. Se obtuvieron los
siguientes resultados:
Temperatura (C)
% rotura

80
33.9

76
29.9

74
31.4

73
25.8

72
24.2

70
19.7

69
21.3

Datos tiles: y = 186,2


y2 = 5122,24
x = 514
x2 = 37826
xy = 13782,5 Sxx = 83.71
Syy = 169.32 Sxy = 110.1 Se = 2.214
a) Calcule, interprete y grafique la recta en funcin de las variables del problema.
b) Determine con un 10% de riesgo la significacin de la regresin. Qu implica?
c) Cul sera el porcentaje de granos de arroz rotos si la temperatura de secado a la
que son sometidos es de 74C? Por qu no coincide exactamente con el valor
obtenido durante el ensayo?
d) Cul sera el porcentaje de granos de arroz rotos si la temperatura de secado a la
que son sometidos es de 45C? Qu opina del resultado?
RESPUESTAS:

a) y = -69,972+1,315x

b) El modelo lineal es vlido (tcalc

=5.43>2.015)
c) 27,35%
d) 10.79%. Es un valor absurdo, ya que se extrapol.

Problema 7: Si un test es confiable se espera que arroje puntuaciones ms o menos


similares cuando es evaluado en un mismo individuo, siempre y cuando el individuo no
haya cambiado. Se midi la confiabilidad de una prueba para evaluar el razonamiento
lgico. A tal efecto 8 adultos fueron sometidos a la prueba en dos oportunidades, separadas
entre s por 2 meses como mnimo. Los resultados fueron:
Individuo Puntaje
1 vez
1
9
2
4
3
7
4
8
5
7
6
6
7
5
8
8

Puntaje
2 vez
7
4
6
9
5
7
5
7

a) Dibuje un diagrama de dispersin para estos datos. Parece plausible la existencia


de una relacin lineal entre ellos?
b) Calcule el coeficiente de correlacin y estudie su significacin al 10%. Qu
concluira con respecto a la prueba evaluada?
RESPUESTA:

b) r = 0.7308; tcalc = 2.62; Se concluye que la prueba es confiable.

75

Problema 8: Los siguientes datos fueron extrados del Anuario estadstico de Amrica
Latina y el Caribe 2006 editado por la Comisin Econmica para Amrica Latina y el
Caribe (CEPAL) (http://www.eclac.org). Corresponden a el porcentaje de poblacin urbana,
es decir residente en localidades de al menos 2500 habitantes, el % de analfabetismo en
individuos mayores de 15 aos y la tasa global de fecundidad, que mide el promedio de
hijos por mujer, para los pases de Latinoamrica, ao 2006.
Pas
Argentina
Bolivia
Brasil
Chile
Colombia
Costa Rica
Cuba
Ecuador
El Salvador
Guatemala
Hait
Honduras
Mxico
Nicaragua
Panam
Paraguay
Per
Rep. Dominicana
Uruguay
Venezuela

% poblacin
urbana
91,8
64,2
83,4
86,6
76,6
62,6
76,1
62,8
57,8
50,0
41,8
47,9
76,5
56,9
65,8
58,4
72,6
65,6
91,9
92,8

%
Analfabetismo
2,8
11,7
11,1
3,5
7,1
3,8
2,7
7,0
18,9
28,2
45,2
22,0
7,4
31,9
7,0
5,6
8,4
14,5
2,0
6,0

Fecundidad
2,4
4,0
2,3
2,0
2,6
2,3
1,6
2,8
2,9
4,6
4,0
3,7
2,5
3,3
2,7
3,8
2,9
2,7
2,3
2,7

4
FECUNDIDAD

50
45
40
35
30
25
20
15
10
5
0

FECUNDIDAD

% ANALFABETISMO

Estudiar la asociacin entre las tres variables. Interpretar el valor de los coeficientes
utilizando los grficos de dispersin y los coeficientes de correlacin generados en Excel.

3
2

20

40

60

80

% POBLACION URBANA

r = -0.748

100

2
1

10

20

30

% ANALFABETISMO

r = 0.689

40

50

20

40

60

80

% POBLACION URBANA

r = -0.735

Revisin conceptual
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta

76

100

a) Si al calcular el coeficiente de correlacin de dos variables X e Y, se tiene r=-0.20


ocurre que:
b) La pendiente de la recta de regresin es pequea.
c) La pendiente de la recta de regresin es grande.
d) X e Y estn poco relacionadas, aunque cuando X decrece, Y tiene tendencia a crecer.
e) El modelo lineal de regresin explica el 20% de la variabilidad de una variable
cualquiera en funcin de la otra.
f) El modelo lineal de regresin explica el 80% de la variabilidad de una variable
cualquiera en funcin de la otra.
Se observa que al disminuir el consumo de comida rpida, disminuye el nivel de colesterol
en sangre. Se usa un modelo de regresin entre ambas que ofrece una bondad de ajuste del
36%. Entonces:
a) El 36% de las predicciones del modelo son correctas.
b) El 36% del nivel de colesterol se explica por el consumo de comida rpida
c) r= +0.60
d) r= +0.36
e) r= -0.60
f) r= -0.36

77

PRACTICO 7. REGRESION LINEAL MULTIPLE


Problema 1: En una compaa de transportes que cubre la zona Sur del pas se realiz un
primer estudio, utilizando regresin simple y relacionando el tiempo total del viaje en
funcin de la cantidad de kilmetros recorridos. Se encontr que exista una buena relacin
y que el modelo utilizado tena un coeficiente de determinacin del 66,4%. A pesar de que
los resultados se consideran buenos, algunos sostienen que agregar una nueva variable
podra mejorar el modelo y es por ello que se procedi a agregar la variable explicativa x2 =
cantidad de entregas realizadas.
Recorrido
1
2
3
4
5
6
7
8
9
10

kilmetros
recorridos
100
50
100
100
50
80
75
65
90
90

cantidad de
entregas
4
3
4
2
2
2
3
4
3
2

tiempo de
viaje (hs)
9,3
4,8
8,9
6,5
4,2
6,2
7,4
6
7,6
6,1

Estadsticas de la regresin - Modelo inicial


Coeficiente de correlacin mltiple
0,8149
Coeficiente de determinacin R^2
0,6641
R^2 ajustado
0,6221
Error tpico
1,0018
Observaciones
10
Estadsticas de la regresin - Nuevo modelo
Coeficiente de correlacin mltiple
0,9507
Coeficiente de determinacin R^2
0,9038
R^2 ajustado
0,8763
Error tpico
0,5731
Observaciones
10

Coeficientes
Intercepcin
Variable X 1
Variable X 2

-0,8687
0,0611
0,9234

Error tpico
0,9515
0,0099
0,2211

Estadstico t Probabilidad Inferior 95%


-0,9129
6,1824
4,1763

0,3916
0,0005
0,0042

-3,1188
0,0378
0,4006

a) Indique el modelo correspondiente a este nuevo estudio y obtenga la ecuacin


estimada de regresin
b) Qu significado tiene cada coeficiente en funcin de las variables estudiadas?
c) Podra Ud. comprobar mediante alguna herramienta estadstica de que el modelo
mejor? De qu manera?

78

d) Estime con un nivel de riesgo del 10 % entre que valores se encuentra el coeficiente
que relaciona el tiempo recorrido con la cantidad de entregas.
e) En general cuando se trabaja con un anlisis de regresin mltiple encontraremos
que las variables que consideramos independientes, estn relacionadas entre ellas.
Si tomamos las dos variables independientes de este problema (kilmetros
recorridos y cantidad de entregas), calculando el grado de relacin entre ellas
obtendramos que r = 0,28, lo que nos dice hay un pobre grado de relacin entre
ellas. El trmino multicolinealidad indica correlacin entre las variables
independientes.
RESPUESTAS: a) y = -0,8687 + 0,0611x1 + 0,9234x2 ; b) Por cada km recorrido, el tiempo
de viaje aumenta 0,0611 hs; por cada entrega efectuada, el tiempo de viaje aumenta 0,9234
hs; c) 1 0 ya que tcalc =6,1824 es mayor que tcrt = t7, 0.975 = 2,3646; 2 0 ya que tcalc =
4,1763 es mayor que tcrt = t7, 0.975 = 2,3646; R2 ajustado = 0,8763 que es notablemente
superior al R2 ajustado anterior de 0,622 y Se = 0.5731 que es sensiblemente inferior a Se
anterior de 1.002, por lo que se concluye que la incorporacin de la nueva variable
explicativa fue correcta; d) IC para 2: [0,50 ; 1,34]

Problema 2: El propietario de una empresa de video cable desea estimar el ingreso semanal
neto en funcin de los gastos de publicidad. Los datos histricos de una muestra de 8
semanas son los siguientes:
Ingresos netos
semanales
(en miles de pesos)

Anuncios en TV

Anuncios en peridicos

(en miles de pesos)

(en miles de pesos)

96
90
95
92
95
94
94
94

5
2
4
2,5
3
3,5
2,5
3

1,5
2
1,5
2,5
3,3
2,3
4,2
2,5

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

Intercepcin
Variable X 1
Variable X 2

Coeficientes
83,230
2,290
1,301

Error tpico
1,574
0,304
0,321

0,9587
0,9190
0,8866
0,6426
8

Estadstico t Probabilidad Inferior 95% Superior 95%


52,882
4,57E-08
79,184
87,276
7,532
6,53E-04
1,509
3,072
4,057
9,76E-03
0,477
2,125

a) Determine los estimadores de los coeficientes de regresin e interprete en funcin


del estudio que se est realizando.
79

b) Estime el promedio de ingresos si se gastan $ 5.000 en anuncios de TV y $ 1.500 en


anuncios periodsticos.
c) Podra Ud decir que porcentaje de la variabilidad en los ingresos netos semanales
queda explicada por el modelo propuesto?
d) Ensaye la hiptesis de que alguno de los coeficientes de regresin no es igual a cero,
con un nivel de significacin del 5%. En caso de no rechazar la hiptesis nula, qu
concluira Ud?
e) Estime con una confianza del 95% los parmetros del punto anterior.
f) Calcule el grado de relacin entre las variables independientes. Qu podra Ud.
concluir?
RESPUESTAS: a) b0= 83,23; b1 = 2,29; b2 = 1,30. Si no se invierte en publicidad en TV ni en
peridicos, los ingresos netos semanales son de 83230 $; por cada mil pesos que se
invierten en anuncios en TV, los ingresos netos semanales se incrementan en 2290 $; por
cada mil pesos que se invierten en anuncios en peridicos, los ingresos netos semanales se
incrementan en 1301 $; b) 96632 $; c) 88,66%; d) 1 0 ya que tcalc =7,532 es mayor que tcrt
= t5, 0.975 = 2,5706; 2 0 ya que tcalc = 4,057 es mayor que tcrt = t7, 0.975 = 2,5706; e) IC para 1:
[1,51 ; 3,07]; IC para 2: [0,48 ; 2,13]; f) r = -0,56, es decir que la inversin en publicidad en
TV no est fuertemente relacionada con la inversin en peridicos.

Problema 3: Un analista desea estudiar si el consumo elctrico familiar mensual (en kWh)

se vincula con la superficie de la vivienda (en m2) y con la cantidad de integrantes del
hogar. Se realizaron 40 observaciones en Capital y se obtuvieron los siguientes resultados:
Estadsticas de la regresin
Coeficiente de correlacin
mltiple
Coeficiente de determinacin
R^2
R^2 ajustado
Error tpico
Observaciones

Coeficientes Error tpico


0,91

Intercepcin

29

1,23

0,83
0,79
0,11
40

Superficie
Integrantes

0,52
1,25

0,09
0,17

a) Escriba la ecuacin estimada del modelo, interpretando en trminos del problema


todos sus elementos.
b) Plantee las pruebas de hiptesis correspondientes, en parmetros y en trminos del
problema. Concluya fijando = 0,05. Se debe eliminar alguna variable del modelo?
Justifique.
c) Interprete el coeficiente de determinacin. Qu mide porcentualmente? Por qu no
vale uno en este caso?

80

EJERCICIOS INTEGRADORES
Problema 1: Una de las claves del xito en una empresa es que los trabajadores estn
alineados con la poltica de la misma. Se realiz un estudio para indagar si existe una
vinculacin entre el apoyo por parte de los empleados a las decisiones tomadas por la
empresa con su participacin en la toma de decisiones. Se entrevist a 200 trabajadores,
clasificndolos segn su acuerdo con las decisiones tomadas por la empresa y su
participacin o no en esas decisiones:
Toma de decisiones
Aprueban las decisiones
No aprueban las decisiones

Participa
73
27

No participa
51
49

a) Proporcionan los datos evidencia suficiente para indicar que la aprobacin o no de


decisiones de la empresa depende de si los trabajadores participan en la toma de
decisiones? Utilice un riesgo de 0,05.
b) De los que participan, se cree que ms del 25% no aprueban las decisiones, en cuyo
caso la empresa debera comunicar las razones de tales decisiones en forma ms
detallada. Se comprueba la sospecha? Qu recomendara con un 10% de riesgo de
equivocarse?
RESPUESTAS:
a) Como calc (10,272) > crt (3,841), se concluye con un riesgo de 0.05 de que
existen evidencias de que la aprobacin depende de la participacin en la toma de
decisiones. Obsrvese que el 73% de los que participan aprueban las decisiones
contra solo un 51% en el caso de los que no participan, sugiriendo las ventajas de
incluir a los empleados en la toma de decisiones. Alternativamente podra haberse
resuelto el ejercicio mediante una comparacin de 2 p, siendo p1 = proporcin de
empleados que aprueban las decisiones dentro de los que participan en la toma de
las mismas (prueba unilateral derecha)
b) Como p calc (0,27) < p crt (0,306), no rechazo Ho. Por lo tanto no se recomienda
comunicar las decisiones en forma ms detallada.

Problema 2: Una empresa que produce galletitas desea controlar el funcionamiento de una
mquina empaquetadora que, en condiciones normales, opera con un peso medio de los
paquetes de 250g. Se tom una muestra de 20 paquetes obtenindose un peso medio de 280
g. y una desviacin estndar de 15 g., establecindose en un 1% la probabilidad mxima de
detener y revisar innecesariamente la mquina. Luego de evaluar los resultados de la
muestra se decide detener la mquina y revisarla.
a) Considera Ud. que la decisin tomada es correcta? Justifique la respuesta.
b) Estime con 99% de confianza el peso medio de los paquetes.
c) Cmo disminuira el error de la estimacin anterior en un 30%?

81

d) En una segunda mquina que tambin produce las galletitas en esa empresa se
tom una muestra de 20 paquetes obtenindose un peso medio de 255 g. y una
desviacin estndar de 12 g. Con un nivel de significacin del 1% podra concluir
que existe una diferencia significativa en los pesos promedio de las dos mquinas?
RESPUESTAS:
a) S, ya que x (280g) > xcrt (259,596).
b) [270,404 ; 289,596]
c) Podra incrementarse el tamao de la muestra a 31 paquetes, es decir incorporando
11 paquetes ms a los 20 paquetes iniciales.
d) Como tcalc (5,821) > tcrit2 (2,712), existe diferencia en los pesos promedio de los
paquetes fabricados por ambas mquinas.
Problema 3: En la sucursal de un banco se toma una muestra de 250 operaciones y se
observa que en ellas hubo 15 reclamos.
a) Estime el porcentaje de reclamos en la sucursal con un nivel riesgo de 0,05.
b) Calcule el nivel de confianza que podra asignar a una estimacin I.C. = (0,035;
0,085), realizada sobre la base de la muestra mencionada.
c) En otra sucursal que se supone que es ms eficiente que la anterior, sobre una
muestra de 300 operaciones se observa que hubo 15 reclamos. Se confirma la
sospecha? Asuma un riesgo del 5%.
RESPUESTAS:
a) [3,53 ; 8,47%]
b) 0,95254
c) Como Zcalc (0,54) no es mayor a Zcrit (1,645), no rechazo H0. Por lo tanto no hay
evidencias de que la segunda sucursal sea ms eficiente que la primera.

Problema 4: Una empresa de copiado est probando dos plotters, marcas XEROX y HP. Se
hicieron 50 copias de prueba de 15 tiradas cada una con ambos plotters. Con el Xerox ha
obtenido un rendimiento medio de 3,2 ppm (ppm: pginas tamao A3 por minuto) con un
desvo de 0,6 ppm mientras que con el HP ha obtenido un rendimiento medio de 2,8 ppm
con un desvo de 0,4 ppm. Los rendimientos, se ha probado, se distribuyen normalmente y
no se ha demostrado previamente si la variabilidad en el rendimiento de ambas mquinas
es igual o no.
a) Verifique al 5% si es que existen diferencias significativas de rendimiento entre
ambas marcas.
b) De existir diferencias qu marca de plotter recomendara? Estime con una
confianza del 95% cunto ms veloz es en promedio la marca que recomendada con
respecto a la otra.
c) Estime la velocidad promedio de la marca recomendada con una confianza del 95%.
RESPUESTAS:
a) Las varianzas en el rendimiento no difieren, ya que Fm (2,25) no es mayor que
Fcrit2 (2,98), por lo que se efecta una prueba t para varianzas iguales. Se concluye

82

que existen diferencias significativas de rendimiento entre ambas marcas, con un


riesgo del 5% (2,15 > 2,05).
b) Recomendara la marca Xerox, ya que su rendimiento promedio en la prueba fue
mayor. Con una confianza del 95% se estima que el plotter marca Xerox produce en
promedio entre 0.02 y 0.78 ppm ms que el de marca HP.
c) Se estima que el rendimiento promedio del plotter marca Xerox se encuentra entre
2,89 y 3.53 ppm con una confianza del 95%.

Problema 6: Un club cuenta con la siguiente informacin obtenida de una muestra de


socios:
Cantidad de socios por deporte
Voley Tenis Natacin
Varn 45
125
30
Mujer 100
150
50

Edades por deporte


Cantidad
Voley
15
Tenis
25
Natacin 20

Promedio
23
40
25

Desvo
2
5
4

De los socios que asisten a las clases de los dos profesores de natacin se eligieron al azar 8
y se les pidi que calificaran de 1 a 10 las clases de ambos profesores. Se obtuvo:
Socio
Prof Julio
Prof. Martn

1 2 3
4 5 6 7 8
9 8 10 8 7 9 5 8
7 5 7
9 8 6 6 8

En cuanto a la relacin entre la cantidad de socios nuevos por mes y el valor de la cuota (en
pesos) de 9 meses se tiene el siguiente registro:
Mes
1
2
3
4
5
6
7
8
9
Socios 100 90 70 75 70 60 58 55 40
Cuota 40 45 50 50 60 80 85 85 100
Para todas las preguntas usar riesgo 10%.
a) Determine si la eleccin de un deporte depende del gnero.
b) Pruebe si la proporcin de mujeres que practica tenis es menor que la de varones.
c) Estime la diferencia entre el porcentaje de mujeres y varones que practican tenis.
d) Verifique si la edad promedio de las personas que practican tenis es mayor que la de
las personas que hacen natacin
e) Estime la diferencia media de las edades de los socios que practican tenis y
natacin.
f) Pruebe si los socios prefieren la clase de natacin del profesor A.
g) Determine un modelo lineal que relacione la cantidad de socios nuevos con el valor
de la cuota e interprete el coeficiente de regresin.
h) Valide el modelo.
i) Estime la cantidad media de socios nuevos que se espera tener para una cuota de
90$.
j) Estime la variacin en la cantidad de socios por cada peso que aumenta la cuota.

83

Estadsticas de la regresin
Coeficiente de determinacin
R^2
Error tpico
Observaciones

Intercepcin
Variable X 1

Coeficientes
122,838
-0,811

Sxx=3738.9
0,9062
6,0289
9
Error tpico
6,821
0,0986

 = 66.11

Estadstico t
18,01

84

S-ar putea să vă placă și